Büyük Veri & Veri Mühendisliği
32 saat - 8 Hafta / 4saat x 2 gün Pazartesi 19:00:00 - 23:00:00

Büyük Veri & Veri Mühendisliği

💎 Büyük Veri & Veri Mühendisliği Masterclass: Verinin Gücünü Keşfet ve Yönet!

✨ Veri Evreninin Mimarı Olun: Kapsamlı Bir Dönüşüm

Bu Masterclass, sizi sadece bir kullanıcı değil, Büyük Veri Mimarileri tasarlayan, kuran ve yöneten bir uzman konumuna taşımak üzere tasarlandı. En karmaşık veri setleriyle çalışırken, Hadoop, Spark ve Kafka gibi sektörün zorunlu araçlarını derinlemesine öğrenerek kariyerinizde sıçrama yapacaksınız.


🚀 Neden Bu Masterclass En Detaylı ve Kapsamlı Eğitimdir?

Bu eğitimde teoriye ek olarak, şirketlerin günlük operasyonlarında karşılaştığı gerçek zamanlı zorlukları çözmeye odaklanıyoruz. Her modül, endüstri standardı pratikleri ve performans optimizasyon tekniklerini içerir.

  • Derinlemesine Teknoloji Daldırması: Temelleri öğrenmekle kalmayacak, her bir aracın (Hadoop, Spark, Kafka) mimarisini, konfigürasyonunu ve hata ayıklama yöntemlerini öğreneceksiniz.
  • Tamamen Proje Odaklı: Eğitim boyunca, basit bir veri akışından karmaşık bir Veri Gölü (Data Lake) oluşturmaya kadar uzanan birden fazla kapsamlı endüstriyel proje tamamlayacaksınız.
  • Optimizasyon ve Performans: Büyük veri sistemlerinde hızın ne kadar kritik olduğunu biliyoruz. Spark optimizasyon teknikleri, Kafka partition (bölümleme) stratejileri ve HDFS ayarları gibi ileri düzey performans konularını ele alacağız.
  • ETL'den ELT'ye Geçiş: Geleneksel ETL (Extract, Transform, Load) süreçlerinden, bulut tabanlı modern mimarilerin benimsediği ELT (Extract, Load, Transform) yaklaşımlarına geçişi pratik uygulamalarla deneyimleyeceksiniz.

🎯 Eğitim Hedefleri

  • Büyük veri ekosisteminde tam kapsamlı veri mühendisliği becerileri kazanmak
  • Hadoop, Spark ve Kafka gibi araçlarla yüksek hacimli veri işleme yeteneği geliştirmek
  • ETL ve ELT süreçlerini tasarlayıp veri boru hatları (pipelines) oluşturmak
  • Veri gölü (Data Lake) ve veri ambarı (Data Warehouse) mimarilerini anlamak ve uygulamak
  • Bulut servisleri ve NoSQL sistemleri ile ölçeklenebilir veri çözümleri inşa etmek

🛠️ Kapsamlı Modül Detayları: Neler Öğreneceksiniz?

Modül 1: Büyük Veriye Giriş ve Temel Depolama (Hadoop & HDFS)

  • Büyük Veri Kavramları: 4V (Volume, Velocity, Variety, Veracity) ve Veri Mühendisliğinin Rolü.
  • Hadoop Mimarisi: NameNode, DataNode, YARN ve MapReduce'un çalışma prensipleri.
  • HDFS Ustalığı: Dağıtık dosya sisteminde dosya okuma/yazma, replikasyon faktörü ve veri dayanıklılığı.
  • Pratik: Basit bir Hadoop kümesi üzerinde veri depolama ve temel komutlar.

Modül 2: Hızlı Veri İşleme: Apache Spark (Batch İşleme)

  • Spark Mimarisi: Driver, Executor, Cluster Manager ve RDD/DataFrame/Dataset kavramları.
  • PySpark/Scala ile Programlama: Veri manipülasyonu için Spark API'lerinin derinlemesine kullanımı.
  • Batch ETL İşlemleri: Karmaşık veri dönüşümlerini (Join, Aggregate, Filter) yüksek performansla gerçekleştirme.
  • Optimizasyon: Veri eğriliği (data skew) ile mücadele, Caching ve Partitioning stratejileri.

Modül 3: Gerçek Zamanlı Akış Mimarisi: Apache Kafka

  • Kafka Temelleri: Broker'lar, Topic'ler, Producer'lar, Consumer'lar ve Partitioning.
  • Yüksek Performanslı Mesajlaşma: Gecikme süresi (latency) ve güvenilirlik ayarları.
  • Kafka Connect ve Streams: Harici sistemlerle entegrasyon ve hafif veri işleme (in-stream processing) teknikleri.
  • Pratik: Bir web sitesi log akışını simüle etme ve bunu Kafka üzerinden gerçek zamanlı olarak tüketme.

Modül 4: Veri Boru Hatları (Pipelines) ve ETL Süreçleri

  • Veri Ambarı (Data Warehouse) ve Veri Gölü (Data Lake): Mimarilerin karşılaştırılması ve ne zaman hangisini kullanmalı.
  • Modern Veri Boru Hattı Oluşturma: Kafka'dan Spark'a veri akışı ve nihai depolama (örneğin, Parquet/Delta formatında HDFS veya S3'e).
  • Veri Kalitesi ve Şema Yönetimi: Verinin temizliğini sağlama, şema evrimi ve veri geçerliliği kontrolü.
  • Orkestrasyon (Örn: Apache Airflow): Karmaşık iş akışlarını otomatikleştirme, zamanlama ve izleme.

Modül 5: İleri Düzey Konular ve Bulut Entegrasyonu

  • Bulut Büyük Veri Servisleri: AWS EMR/Glue, Azure Synapse veya Google Cloud Dataflow/Dataproc servislerine giriş (seçmeli modül).
  • NoSQL Veritabanları: Cassandra veya MongoDB ile entegrasyon ve büyük ölçekli depolama senaryoları.
  • Güvenlik ve Yönetim: Büyük veri ortamlarında veri şifreleme, erişim kontrolü ve yetkilendirme.
  • Kapanış Projesi: Başlangıçtan sona kadar, gerçek zamanlı ve toplu işleme yeteneklerine sahip tam işlevli bir Veri Boru Hattı oluşturma.

📈 Kazanımlar

  • Dağıtık veri işleme sistemlerinde uygulamalı deneyim kazanma
  • Spark ile yüksek performanslı veri dönüşümleri ve optimizasyon becerisi
  • Kafka ile gerçek zamanlı veri akışlarını tasarlayıp yönetebilme
  • Veri kalitesi, şema yönetimi ve veri güvenliği konusunda endüstri standardı uygulamalar yapabilme
  • Başlangıçtan sona kadar uçtan uca veri boru hattı projeleri geliştirebilme

10 Öğrenci
15.000 ₺
Hemen Satın Al
İletişim

Bahçivan Mah., Numune Sok., No: 8, Tuğci İş Merkezi, Kat: 4, Daire: 11, İpekyolu/Van

+90 501 565 64 65

academycodehub0@gmail.com

Bülten

Yeni kurslar ve eğitim programlarımızdan haberdar olmak için bültenimize abone olun. En güncel içerikler ve özel fırsatlar size e-posta ile ulaşsın.

Iyzico Ödeme Altyapısı

© academycodehub.com. Tüm Hakları Saklıdır.