Wprowadzenie
Przedstawienie celów, zakresu i planu szkolenia, omówienie podstawowych pojęć i koncepcji związanych z inżynierią danych, lakehouse i platformą Microsoft Fabric.
Moduł 1:
Architektura Lakehouse - omówienie zalet i wyzwań architektury lakehouse, porównanie z innymi podejściami do zarządzania danymi, przedstawienie głównych składników i zasad projektowania lakehouse.
Moduł 2:
Platforma Microsoft Fabric - omówienie celu, funkcjonalności i architektury platformy Microsoft Fabric, zapoznanie z jej głównymi usługami i komponentami, takimi jak Dataflows Gen2, Data Factory, Azure Synapse Analytics, Azure Databricks i Delta Lake.
Moduł 3:
Przetwarzanie danych z Apache Spark - omówienie możliwości i zalet Apache Spark jako silnika do przetwarzania danych w sposób rozproszony i skalowalny, zapoznanie z podstawowymi elementami i operacjami na danych w Spark, takimi jak RDD, DataFrame, Dataset, transformacje i akcje.
Moduł 4:
Zarządzanie danymi z Delta Lake - omówienie celu i funkcjonalności Delta Lake jako systemu do przechowywania i zarządzania danymi w formacie tablicowym, zapoznanie z głównymi cechami i zaletami Delta Lake, takimi jak schemat ewolucyjny, transakcyjność, wersjonowanie i optymalizacja danych.
Moduł 5:
Ingestia danych z Dataflows Gen2 - omówienie celu i funkcjonalności Dataflows Gen2 jako usługi do tworzenia i uruchamiania potoków danych w chmurze, zapoznanie z podstawowymi elementami i krokami tworzenia Dataflows Gen2, takimi jak źródła danych, transformacje danych, mapowania schematów i docelowe magazyny danych.
Moduł 6:
Orkiestracja danych z Data Factory - omówienie celu i funkcjonalności Data Factory jako usługi do tworzenia i zarządzania potokami danych w chmurze, zapoznanie z podstawowymi elementami i krokami tworzenia Data Factory, takimi jak połączenia danych, aktywności danych, potoki danych i wyzwalacze.
Moduł 7:
Analityka end-to-end z Azure Synapse Analytics - omówienie celu i funkcjonalności Azure Synapse Analytics jako usługi do tworzenia rozwiązań analitycznych w chmurze, zapoznanie z głównymi elementami i możliwościami Azure Synapse Analytics, takimi jak dedykowane pulle SQL, serwery bezpośredniego dostępu do plików (ADFS), workspaces Synapse Studio i Apache Spark dla Synapse.
Podsumowanie.
Podsumowanie głównych tematów i wniosków szkolenia, omówienie scenariuszy użycia lakehouse i platformy Microsoft Fabric w praktyce, przedstawienie źródeł dodatkowych informacji i materiałów.