• DP-203: Data Engineering on Microsoft Azure [203T00-A] (EN)

  • Group Training

    Terwijl Azure Data Engineers leren om gegevens te integreren en te transformeren om gestructureerde analyseoplossingen te bouwen!

    Training code
    CGADP203CE
    Gesproken taal
    Engels
    Taal materiaal
    Engels
    Dagdelen
    8
    Kosten
    €2.250,00
    excl. BTW Geen extra kosten.

    Boek nu DP-203: Data Engineering on Microsoft Azure [203T00-A] (EN)

    In groepstrainingen gebruiken we verschillende werkvormen en doe je kennis, inzicht en inspiratie op. Bekijk ook de Gesproken taal en Taal materiaal aan de linkerkant van de pagina voor informatie over de taal.

    • 12-3-2024
      Online Virtual
      €2.250,00
      €2.250,00
    • 27-8-2024
      Online Virtual
      €2.250,00
      €2.250,00
    DP-203: Data Engineering on Microsoft Azure [203T00-A] (EN)
    10
    10.0
    0
    2 reviews
     

    Wat is DP-203: Data Engineering on Microsoft Azure [203T00-A]

    In deze training leert de student over de data-engineeringpatronen en -praktijken die betrekking hebben op het werken met batch- en realtime analytische oplossingen met behulp van Azure-dataplatformtechnologieën. Studenten zullen beginnen met het begrijpen van de belangrijkste reken- en opslagtechnologieën die worden gebruikt om een analytische oplossing bouwen. Ze zullen vervolgens onderzoeken hoe ze een analytische serverlaag kunnen ontwerpen en zich concentreren op overwegingen voor data-engineering bij het werken met bronbestanden. De studenten zullen leren hoe ze interactief data kunnen verkennen die zijn opgeslagen in bestanden in een datameer. Ze zullen de verschillende opnametechnieken die kunnen worden gebruikt om gegevens te laden met behulp van de Apache Spark-mogelijkheid die te vinden is in Azure Synapse Analytics of Azure Databricks, of hoe u gegevens kunt opnemen met behulp van Azure Data Factory- of Azure Synapse-pijplijnen.
    De studenten leren ook de verschillende manieren waarop ze de gegevens kunnen transformeren met behulp van dezelfde technologieën die worden gebruikt om gegevens op te nemen. De student zal tijd besteden aan de training om te leren hoe de prestaties van een analytisch systeem kunnen worden gecontroleerd en geanalyseerd, zodat ze de prestaties van het laden van gegevens of queries die tegen de systemen worden verzonden, kunnen optimaliseren. Ze zullen het belang begrijpen van het implementeren van beveiliging om ervoor te zorgen dat de gegevens in rust of tijdens verzending worden beschermd. De student laat vervolgens zien hoe de gegevens in een analytisch systeem kunnen worden gebruikt om dashboards te maken of voorspellende modellen te bouwen in Azure Synapse Analytics.
    Deze training maakt gebruik van MOC (Microsoft Official Courseware) en wordt gegeven door een ervaren MCT (Microsoft Certified Trainer).
    Zie onderstaande modules voor meer informatie:
    Module 1: Verken reken- en opslagopties voor workloads voor data engineering
    Deze module biedt een overzicht van de opties voor reken- en opslagtechnologie van Azure die beschikbaar zijn voor data-engineers die analytische workloads bouwen. Deze module leert manieren om het datameer te structureren en om de bestanden te optimaliseren voor verkenning, streaming en batch-workloads. De student zal leren hoe het datameer kan worden georganiseerd in niveaus van gegevensverfijning terwijl ze bestanden transformeren door middel van batch- en streamverwerking. Vervolgens leren ze hoe ze indexen kunnen maken op hun datasets, zoals CSV-, JSON- en Parquet-bestanden, en deze kunnen gebruiken voor mogelijke versnelling van query's en workloads.
    Lessen

    • Inleiding tot Azure Synapse Analytics
    • Beschrijf Azure Databricks
    • Inleiding tot Azure Data Lake-opslag
    • Beschrijf de architectuur van het Delta Lake
    • Werk met datastromen met behulp van Azure Stream Analytics

    Module 2: Ontwerp en implementeer de dienende laag
    Deze module leert hoe u datastores ontwerpt en implementeert in een modern datawarehouse om analytische workloads te optimaliseren. De student leert hoe hij een multidimensionaal schema kan ontwerpen om feit- en dimensiegegevens op te slaan. Vervolgens leert de student hoe hij langzaam veranderende dimensies kan vullen door het incrementeel laden van gegevens vanuit Azure Data Factory.
    Lessen

    • Ontwerp een multidimensionaal schema om analytische workloads te optimaliseren
    • Codevrije transformatie op schaal met Azure Data Factory
    • Vul langzaam veranderende dimensies in Azure Synapse Analytics-pijplijnen

    Module 3: Overwegingen voor data engineering voor bronbestanden
    In deze module worden overwegingen op het gebied van data-engineering onderzocht die veel voorkomen bij het laden van gegevens in een moderne datawarehouse-analyse vanuit bestanden die zijn opgeslagen in een Azure Data Lake, en wordt inzicht gegeven in de beveiligingsoverwegingen die gepaard gaan met het opslaan van bestanden die zijn opgeslagen in het data lake.
    Lessen

    • Ontwerp een modern datawarehouse met behulp van Azure Synapse Analytics
    • Beveilig een datawarehouse in Azure Synapse Analytics

    Module 4: voer interactieve query's uit met behulp van Azure Synapse Analytics serverloze SQL-pools
    In deze module leren studenten hoe ze kunnen werken met bestanden die zijn opgeslagen in het datameer en externe bestandsbronnen, door middel van T-SQL-instructies die worden uitgevoerd door een serverloze SQL-pool in Azure Synapse Analytics. Studenten zullen Parquet-bestanden opvragen die zijn opgeslagen in een datameer, evenals CSV-bestanden die zijn opgeslagen in een externe datastore. Vervolgens zullen ze Azure Active Directory-beveiligingsgroepen maken en toegang tot bestanden in het datameer afdwingen via Role-Based Access Control (RBAC) en Access Control Lists (ACL's).
    Lessen

    • Ontdek de mogelijkheden van Azure Synapse serverloze SQL-pools
    • Query gegevens in het meer met behulp van Azure Synapse serverloze SQL-pools
    • Maak metagegevensobjecten in Azure Synapse serverloze SQL-pools
    • Beveilig gegevens en beheer gebruikers in Azure Synapse serverloze SQL-pools

    Module 5: Verken, transformeer en laad gegevens in het datawarehouse met Apache Spark
    Deze module leert hoe u gegevens die zijn opgeslagen in een datameer kunt verkennen, de gegevens kunt transformeren en gegevens kunt laden in een relationele gegevensopslag. De student zal Parquet- en JSON-bestanden verkennen en technieken gebruiken om JSON-bestanden met hiërarchische structuren op te vragen en te transformeren. Vervolgens gebruikt de student Apache Spark om gegevens in het datawarehouse te laden en Parquet-gegevens in het datameer samen te voegen met gegevens in de speciale SQL-pool.
    Lessen

    • Begrijp big data-engineering met Apache Spark in Azure Synapse Analytics
    • Gegevens opnemen met Apache Spark-notebooks in Azure Synapse Analytics
    • Transformeer gegevens met DataFrames in Apache Spark Pools in Azure Synapse Analytics
    • Integreer SQL- en Apache Spark-pools in Azure Synapse Analytics

    Module 6: Gegevensverkenning en -transformatie in Azure Databricks
    Deze module leert hoe u verschillende Apache Spark DataFrame-methoden kunt gebruiken om gegevens in Azure Databricks te verkennen en te transformeren. De student leert hoe hij standaard DataFrame-methoden moet toepassen om gegevens te verkennen en te transformeren. Ze zullen ook leren hoe ze meer geavanceerde taken kunnen uitvoeren, zoals het verwijderen van dubbele gegevens, het manipuleren van datum- / tijdwaarden, het hernoemen van kolommen en het samenvoegen van gegevens.
    Lessen

    • Beschrijf Azure Databricks
    • Lees en schrijf gegevens in Azure Databricks
    • Werk met DataFrames in Azure Databricks
    • Werk met geavanceerde DataFrames-methoden in Azure Databricks

    Module 7: Gegevens opnemen en laden in het datawarehouse
    Deze module leert studenten hoe ze gegevens in het datawarehouse kunnen opnemen via T-SQL-scripts en Synapse Analytics-integratiepijplijnen. De student zal leren hoe gegevens in de speciale SQL-pools van Synapse kunnen worden geladen met PolyBase en COPY met behulp van T-SQL. De student leert ook hoe werkbelastingbeheer samen met een kopieeractiviteit in een Azure Synapse-pijplijn kan worden gebruikt voor gegevensopname op petabyte-schaal.
    Lessen

    • Gebruik best practices voor het laden van gegevens in Azure Synapse Analytics
    • Opname op petabyteschaal met Azure Data Factory

    Module 8: gegevens transformeren met Azure Data Factory of Azure Synapse-pijplijnen
    Deze module leert studenten hoe ze pijplijnen voor gegevensintegratie kunnen bouwen om uit meerdere gegevensbronnen op te nemen, gegevens kunnen transformeren met behulp van kaartgegevensstromen en gegevensverplaatsing kunnen uitvoeren naar een of meer gegevensverzamelingen.
    Lessen

    • Gegevensintegratie met Azure Data Factory of Azure Synapse Pipelines
    • Codevrije transformatie op schaal met Azure Data Factory of Azure Synapse Pipelines

    Module 9: orkestreren van gegevensverplaatsing en -transformatie in Azure Synapse-pijplijnen
    In deze module leert u hoe u gekoppelde services maakt en gegevensverplaatsing en -transformatie orkestreert met behulp van notebooks in Azure Synapse Pipelines.
    Lessen

    • Orkestreer gegevensverplaatsing en -transformatie in Azure Data Factory

    Module 10: Optimaliseer de queryprestaties met speciale SQL-pools in Azure Synapse
    In deze module leren studenten strategieën om gegevensopslag en -verwerking te optimaliseren bij het gebruik van speciale SQL-pools in Azure Synapse Analytics. De student zal weten hoe ontwikkelaarfuncties, zoals vensters en HyperLogLog-functies, moeten worden gebruikt, best practices voor het laden van gegevens moet worden gebruikt en de prestaties van query's moet worden geoptimaliseerd en verbeterd.
    Lessen

    • Optimaliseer de queryprestaties van het datawarehouse in Azure Synapse Analytics
    • Begrijp de functies van datawarehouse-ontwikkelaars van Azure Synapse Analytics

    Module 11: Analyseer en optimaliseer datawarehouse-opslag
    In deze module leren studenten hoe ze de gegevensopslag van de Azure Synapse speciale SQL-pools kunnen analyseren en optimaliseren. De student kent technieken om het gebruik van tabelruimte en opslaggegevens in kolomopslag te begrijpen. Vervolgens zal de student weten hoe hij opslagvereisten kan vergelijken tussen identieke tabellen die verschillende datatypes gebruiken. Ten slotte zal de student de impact observeren die gematerialiseerde weergaven hebben wanneer deze worden uitgevoerd in plaats van complexe zoekopdrachten en leren hoe uitgebreide logboekregistratie kan worden vermeden door verwijderingsbewerkingen te optimaliseren.
    Lessen

    • Analyseer en optimaliseer datawarehouse-opslag in Azure Synapse Analytics

    Module 12: ondersteuning voor hybride transactionele analytische verwerking (HTAP) met Azure Synapse Link
    In deze module leren studenten hoe Azure Synapse Link naadloze connectiviteit van een Azure Cosmos DB-account met een Synapse-werkruimte mogelijk maakt. De student zal begrijpen hoe Synapse-link kan worden ingeschakeld en geconfigureerd, en vervolgens hoe de analytische opslag van Azure Cosmos DB kan worden opgevraagd met Apache Spark en SQL serverless.
    Lessen

    • Ontwerp hybride transactionele en analytische verwerking met behulp van Azure Synapse Analytics
    • Configureer Azure Synapse Link met Azure Cosmos DB
    • Query uitvoeren op Azure Cosmos DB met Apache Spark-pools
    • Query uitvoeren op Azure Cosmos DB met serverloze SQL-pools

    Module 13: End-to-end-beveiliging met Azure Synapse Analytics
    In deze module leren studenten hoe ze een Synapse Analytics-werkruimte en de ondersteunende infrastructuur kunnen beveiligen. De student zal de SQL Active Directory Admin observeren, IP-firewallregels beheren, geheimen beheren met Azure Key Vault en toegang krijgen tot die geheimen via een aan Key Vault gekoppelde service en pijplijnactiviteiten. De student zal begrijpen hoe beveiliging op kolomniveau, beveiliging op rijniveau en dynamische gegevensmaskering kan worden geïmplementeerd bij het gebruik van speciale SQL-pools.
    Lessen

    • Beveilig een datawarehouse in Azure Synapse Analytics
    • Configureer en beheer geheimen in Azure Key Vault
    • Implementeer nalevingscontroles voor gevoelige gegevens

    Module 14: Real-time streamverwerking met Stream Analytics
    In deze module leren studenten hoe ze streaming data kunnen verwerken met Azure Stream Analytics. De student neemt voertuigtelemetriegegevens op in Event Hubs en verwerkt die gegevens vervolgens in realtime met behulp van verschillende vensterfuncties in Azure Stream Analytics. Ze sturen de gegevens naar Azure Synapse Analytics. Ten slotte leert de student hoe de Stream Analytics-taak kan worden geschaald om de doorvoer te verhogen.
    Lessen

    • Schakel betrouwbare berichten uit voor Big Data-toepassingen met behulp van Azure Event Hubs
    • Werk met datastromen met behulp van Azure Stream Analytics
    • Neem datastromen op met Azure Stream Analytics

    Module 15: Maak een oplossing voor streamverwerking met Event Hubs en Azure Databricks
    In deze module leren studenten hoe ze streaminggegevens op schaal kunnen opnemen en verwerken met Event Hubs en Spark Structured Streaming in Azure Databricks. De student leert de belangrijkste kenmerken en toepassingen van gestructureerde streaming. De student implementeert schuifvensters om over brokken gegevens te aggregeren en past watermerken toe om verouderde gegevens te verwijderen. Ten slotte maakt de student verbinding met Event Hubs om streams te lezen en te schrijven.
    Lessen

    • Verwerk streaminggegevens met gestructureerde streaming van Azure Databricks

    Module 16: maak rapporten met behulp van Power BI-integratie met Azure Synpase Analytics
    In deze module leert de student hoe hij Power BI kan integreren met zijn Synapse-werkruimte om rapporten op te bouwen in Power BI. De student maakt een nieuwe gegevensbron en Power BI-rapport aan in Synapse Studio. Vervolgens leert de student hoe hij de queryprestaties kan verbeteren met gematerialiseerde weergaven en caching van resultatensets. Ten slotte zal de student het datameer verkennen met serverloze SQL-pools en visualisaties maken tegen die gegevens in Power BI.
    Lessen

    • Maak rapporten met Power BI met behulp van de integratie met Azure Synapse Analytics

    Module 17: Voer geïntegreerde machine learning-processen uit in Azure Synapse Analytics
    Deze module verkent de geïntegreerde, end-to-end Azure Machine Learning- en Azure Cognitive Services-ervaring in Azure Synapse Analytics. U leert hoe u een Azure Synapse Analytics-werkruimte verbindt met een Azure Machine Learning-werkruimte met behulp van een gekoppelde service en vervolgens een geautomatiseerd ML-experiment activeert dat gegevens uit een Spark-tabel gebruikt. U leert ook hoe u getrainde modellen van Azure Machine Learning of Azure Cognitive Services kunt gebruiken om gegevens in een SQL-pooltabel te verrijken en vervolgens voorspellingsresultaten kunt presenteren met behulp van Power BI.
    Lessen

    • Gebruik het geïntegreerde machine learning-proces in Azure Synapse Analytics
     
     

    Voor wie is DP-203: Data Engineering on Microsoft Azure [203T00-A]

    De primaire doelgroep voor deze training zijn dataprofessionals, data-architecten en business intelligence-professionals die willen leren over data engineering en het bouwen van analytische oplossingen met behulp van dataplatformtechnologieën die bestaan op Microsoft Azure. Het secundaire publiek voor deze training data-analisten en datawetenschappers die werken met analytische oplossingen gebouwd op Microsoft Azure.
    Ook ontvang je een examenvoucher. Meld u vandaag nog aan!

    Voorvereisten

    Succesvolle studenten beginnen deze training met kennis van cloud computing en kerngegevensconcepten en professionele ervaring met gegevensoplossingen.
    Specifiek invullen:

    • AZ-900 - Azure Fundamentals
    • DP-900 - Microsoft Azure Data Fundamentals

    Doelstellingen

    Na het afronden van deze training kun je de volgende activiteiten uitvoeren:
    Verken reken- en opslagopties voor workloads voor data engineering in Azure

    • Ontwerp en implementeer de serverlaag
    • Begrijp overwegingen op het gebied van data-engineering
    • Voer interactieve queries uit met behulp van serverloze SQL-pools
    • Verken, transformeer en laad gegevens in het datawarehouse met Apache Spark
    • Voer gegevensverkenning en -transformatie uit in Azure Databricks
    • Gegevens opnemen en laden in het datawarehouse
    • Transformeer gegevens met Azure Data Factory of Azure Synapse Pipelines
    • Integreer gegevens uit notebooks met Azure Data Factory of Azure Synapse Pipelines
    • Optimaliseer de queryprestaties met speciale SQL-pools in Azure Synapse
    • Analyseer en optimaliseer datawarehouse-opslag
    • Ondersteuning van Hybrid Transactional Analytical Processing (HTAP) met Azure Synapse Link
    • Voer end-to-end-beveiliging uit met Azure Synapse Analytics
    • Voer realtime streamverwerking uit met Stream Analytics
    • Creëer een stroomverwerkingsoplossing met Event Hubs en Azure Databricks
    • Bouw rapporten met behulp van Power BI-integratie met Azure Synpase Analytics
    • Voer geïntegreerde machine learning-processen uit in Azure Synapse Analytics

    Examen informatie

    • Duur examen:120
    • % extra tijd indien niet in moedertaal: -
    • Aantal examenvragen: 40-60
    • Minimaal aantal goed te beantwoorden: Variable
    • Examen stijl: Multiple Choice
    • Open Boek: Nee
     
    Incompany

    Terwijl Azure Data Engineers leren om gegevens te integreren en te transformeren om gestructureerde analyseoplossingen te bouwen!

    Training code
    CGADP203CE
    Gesproken taal
    Engels
    Taal materiaal
    Engels
    Dagdelen
    8
    Kosten
    €2.250,00
    excl. BTW Geen extra kosten.

    Een Incompany training biedt verschillende voordelen:

    - Je bepaalt zelf de locatie
    - Je beleeft de training met je collega’s, daardoor sluit deze altijd aan op jouw praktijk
    - De trainer kan in uitleg, voorbeelden en opdrachten aansluiten bij jouw organisatie
    - In overleg kan de training aangepast worden aan organisatie specifieke vragen

    Vraag nu meer informatie of een offerte aan.

    DP-203: Data Engineering on Microsoft Azure [203T00-A] (EN)
    10
    10.0
    0
    2 reviews
     

    Wat is DP-203: Data Engineering on Microsoft Azure [203T00-A]

    In deze training leert de student over de data-engineeringpatronen en -praktijken die betrekking hebben op het werken met batch- en realtime analytische oplossingen met behulp van Azure-dataplatformtechnologieën. Studenten zullen beginnen met het begrijpen van de belangrijkste reken- en opslagtechnologieën die worden gebruikt om een analytische oplossing bouwen. Ze zullen vervolgens onderzoeken hoe ze een analytische serverlaag kunnen ontwerpen en zich concentreren op overwegingen voor data-engineering bij het werken met bronbestanden. De studenten zullen leren hoe ze interactief data kunnen verkennen die zijn opgeslagen in bestanden in een datameer. Ze zullen de verschillende opnametechnieken die kunnen worden gebruikt om gegevens te laden met behulp van de Apache Spark-mogelijkheid die te vinden is in Azure Synapse Analytics of Azure Databricks, of hoe u gegevens kunt opnemen met behulp van Azure Data Factory- of Azure Synapse-pijplijnen.
    De studenten leren ook de verschillende manieren waarop ze de gegevens kunnen transformeren met behulp van dezelfde technologieën die worden gebruikt om gegevens op te nemen. De student zal tijd besteden aan de training om te leren hoe de prestaties van een analytisch systeem kunnen worden gecontroleerd en geanalyseerd, zodat ze de prestaties van het laden van gegevens of queries die tegen de systemen worden verzonden, kunnen optimaliseren. Ze zullen het belang begrijpen van het implementeren van beveiliging om ervoor te zorgen dat de gegevens in rust of tijdens verzending worden beschermd. De student laat vervolgens zien hoe de gegevens in een analytisch systeem kunnen worden gebruikt om dashboards te maken of voorspellende modellen te bouwen in Azure Synapse Analytics.
    Deze training maakt gebruik van MOC (Microsoft Official Courseware) en wordt gegeven door een ervaren MCT (Microsoft Certified Trainer).
    Zie onderstaande modules voor meer informatie:
    Module 1: Verken reken- en opslagopties voor workloads voor data engineering
    Deze module biedt een overzicht van de opties voor reken- en opslagtechnologie van Azure die beschikbaar zijn voor data-engineers die analytische workloads bouwen. Deze module leert manieren om het datameer te structureren en om de bestanden te optimaliseren voor verkenning, streaming en batch-workloads. De student zal leren hoe het datameer kan worden georganiseerd in niveaus van gegevensverfijning terwijl ze bestanden transformeren door middel van batch- en streamverwerking. Vervolgens leren ze hoe ze indexen kunnen maken op hun datasets, zoals CSV-, JSON- en Parquet-bestanden, en deze kunnen gebruiken voor mogelijke versnelling van query's en workloads.
    Lessen

    • Inleiding tot Azure Synapse Analytics
    • Beschrijf Azure Databricks
    • Inleiding tot Azure Data Lake-opslag
    • Beschrijf de architectuur van het Delta Lake
    • Werk met datastromen met behulp van Azure Stream Analytics

    Module 2: Ontwerp en implementeer de dienende laag
    Deze module leert hoe u datastores ontwerpt en implementeert in een modern datawarehouse om analytische workloads te optimaliseren. De student leert hoe hij een multidimensionaal schema kan ontwerpen om feit- en dimensiegegevens op te slaan. Vervolgens leert de student hoe hij langzaam veranderende dimensies kan vullen door het incrementeel laden van gegevens vanuit Azure Data Factory.
    Lessen

    • Ontwerp een multidimensionaal schema om analytische workloads te optimaliseren
    • Codevrije transformatie op schaal met Azure Data Factory
    • Vul langzaam veranderende dimensies in Azure Synapse Analytics-pijplijnen

    Module 3: Overwegingen voor data engineering voor bronbestanden
    In deze module worden overwegingen op het gebied van data-engineering onderzocht die veel voorkomen bij het laden van gegevens in een moderne datawarehouse-analyse vanuit bestanden die zijn opgeslagen in een Azure Data Lake, en wordt inzicht gegeven in de beveiligingsoverwegingen die gepaard gaan met het opslaan van bestanden die zijn opgeslagen in het data lake.
    Lessen

    • Ontwerp een modern datawarehouse met behulp van Azure Synapse Analytics
    • Beveilig een datawarehouse in Azure Synapse Analytics

    Module 4: voer interactieve query's uit met behulp van Azure Synapse Analytics serverloze SQL-pools
    In deze module leren studenten hoe ze kunnen werken met bestanden die zijn opgeslagen in het datameer en externe bestandsbronnen, door middel van T-SQL-instructies die worden uitgevoerd door een serverloze SQL-pool in Azure Synapse Analytics. Studenten zullen Parquet-bestanden opvragen die zijn opgeslagen in een datameer, evenals CSV-bestanden die zijn opgeslagen in een externe datastore. Vervolgens zullen ze Azure Active Directory-beveiligingsgroepen maken en toegang tot bestanden in het datameer afdwingen via Role-Based Access Control (RBAC) en Access Control Lists (ACL's).
    Lessen

    • Ontdek de mogelijkheden van Azure Synapse serverloze SQL-pools
    • Query gegevens in het meer met behulp van Azure Synapse serverloze SQL-pools
    • Maak metagegevensobjecten in Azure Synapse serverloze SQL-pools
    • Beveilig gegevens en beheer gebruikers in Azure Synapse serverloze SQL-pools

    Module 5: Verken, transformeer en laad gegevens in het datawarehouse met Apache Spark
    Deze module leert hoe u gegevens die zijn opgeslagen in een datameer kunt verkennen, de gegevens kunt transformeren en gegevens kunt laden in een relationele gegevensopslag. De student zal Parquet- en JSON-bestanden verkennen en technieken gebruiken om JSON-bestanden met hiërarchische structuren op te vragen en te transformeren. Vervolgens gebruikt de student Apache Spark om gegevens in het datawarehouse te laden en Parquet-gegevens in het datameer samen te voegen met gegevens in de speciale SQL-pool.
    Lessen

    • Begrijp big data-engineering met Apache Spark in Azure Synapse Analytics
    • Gegevens opnemen met Apache Spark-notebooks in Azure Synapse Analytics
    • Transformeer gegevens met DataFrames in Apache Spark Pools in Azure Synapse Analytics
    • Integreer SQL- en Apache Spark-pools in Azure Synapse Analytics

    Module 6: Gegevensverkenning en -transformatie in Azure Databricks
    Deze module leert hoe u verschillende Apache Spark DataFrame-methoden kunt gebruiken om gegevens in Azure Databricks te verkennen en te transformeren. De student leert hoe hij standaard DataFrame-methoden moet toepassen om gegevens te verkennen en te transformeren. Ze zullen ook leren hoe ze meer geavanceerde taken kunnen uitvoeren, zoals het verwijderen van dubbele gegevens, het manipuleren van datum- / tijdwaarden, het hernoemen van kolommen en het samenvoegen van gegevens.
    Lessen

    • Beschrijf Azure Databricks
    • Lees en schrijf gegevens in Azure Databricks
    • Werk met DataFrames in Azure Databricks
    • Werk met geavanceerde DataFrames-methoden in Azure Databricks

    Module 7: Gegevens opnemen en laden in het datawarehouse
    Deze module leert studenten hoe ze gegevens in het datawarehouse kunnen opnemen via T-SQL-scripts en Synapse Analytics-integratiepijplijnen. De student zal leren hoe gegevens in de speciale SQL-pools van Synapse kunnen worden geladen met PolyBase en COPY met behulp van T-SQL. De student leert ook hoe werkbelastingbeheer samen met een kopieeractiviteit in een Azure Synapse-pijplijn kan worden gebruikt voor gegevensopname op petabyte-schaal.
    Lessen

    • Gebruik best practices voor het laden van gegevens in Azure Synapse Analytics
    • Opname op petabyteschaal met Azure Data Factory

    Module 8: gegevens transformeren met Azure Data Factory of Azure Synapse-pijplijnen
    Deze module leert studenten hoe ze pijplijnen voor gegevensintegratie kunnen bouwen om uit meerdere gegevensbronnen op te nemen, gegevens kunnen transformeren met behulp van kaartgegevensstromen en gegevensverplaatsing kunnen uitvoeren naar een of meer gegevensverzamelingen.
    Lessen

    • Gegevensintegratie met Azure Data Factory of Azure Synapse Pipelines
    • Codevrije transformatie op schaal met Azure Data Factory of Azure Synapse Pipelines

    Module 9: orkestreren van gegevensverplaatsing en -transformatie in Azure Synapse-pijplijnen
    In deze module leert u hoe u gekoppelde services maakt en gegevensverplaatsing en -transformatie orkestreert met behulp van notebooks in Azure Synapse Pipelines.
    Lessen

    • Orkestreer gegevensverplaatsing en -transformatie in Azure Data Factory

    Module 10: Optimaliseer de queryprestaties met speciale SQL-pools in Azure Synapse
    In deze module leren studenten strategieën om gegevensopslag en -verwerking te optimaliseren bij het gebruik van speciale SQL-pools in Azure Synapse Analytics. De student zal weten hoe ontwikkelaarfuncties, zoals vensters en HyperLogLog-functies, moeten worden gebruikt, best practices voor het laden van gegevens moet worden gebruikt en de prestaties van query's moet worden geoptimaliseerd en verbeterd.
    Lessen

    • Optimaliseer de queryprestaties van het datawarehouse in Azure Synapse Analytics
    • Begrijp de functies van datawarehouse-ontwikkelaars van Azure Synapse Analytics

    Module 11: Analyseer en optimaliseer datawarehouse-opslag
    In deze module leren studenten hoe ze de gegevensopslag van de Azure Synapse speciale SQL-pools kunnen analyseren en optimaliseren. De student kent technieken om het gebruik van tabelruimte en opslaggegevens in kolomopslag te begrijpen. Vervolgens zal de student weten hoe hij opslagvereisten kan vergelijken tussen identieke tabellen die verschillende datatypes gebruiken. Ten slotte zal de student de impact observeren die gematerialiseerde weergaven hebben wanneer deze worden uitgevoerd in plaats van complexe zoekopdrachten en leren hoe uitgebreide logboekregistratie kan worden vermeden door verwijderingsbewerkingen te optimaliseren.
    Lessen

    • Analyseer en optimaliseer datawarehouse-opslag in Azure Synapse Analytics

    Module 12: ondersteuning voor hybride transactionele analytische verwerking (HTAP) met Azure Synapse Link
    In deze module leren studenten hoe Azure Synapse Link naadloze connectiviteit van een Azure Cosmos DB-account met een Synapse-werkruimte mogelijk maakt. De student zal begrijpen hoe Synapse-link kan worden ingeschakeld en geconfigureerd, en vervolgens hoe de analytische opslag van Azure Cosmos DB kan worden opgevraagd met Apache Spark en SQL serverless.
    Lessen

    • Ontwerp hybride transactionele en analytische verwerking met behulp van Azure Synapse Analytics
    • Configureer Azure Synapse Link met Azure Cosmos DB
    • Query uitvoeren op Azure Cosmos DB met Apache Spark-pools
    • Query uitvoeren op Azure Cosmos DB met serverloze SQL-pools

    Module 13: End-to-end-beveiliging met Azure Synapse Analytics
    In deze module leren studenten hoe ze een Synapse Analytics-werkruimte en de ondersteunende infrastructuur kunnen beveiligen. De student zal de SQL Active Directory Admin observeren, IP-firewallregels beheren, geheimen beheren met Azure Key Vault en toegang krijgen tot die geheimen via een aan Key Vault gekoppelde service en pijplijnactiviteiten. De student zal begrijpen hoe beveiliging op kolomniveau, beveiliging op rijniveau en dynamische gegevensmaskering kan worden geïmplementeerd bij het gebruik van speciale SQL-pools.
    Lessen

    • Beveilig een datawarehouse in Azure Synapse Analytics
    • Configureer en beheer geheimen in Azure Key Vault
    • Implementeer nalevingscontroles voor gevoelige gegevens

    Module 14: Real-time streamverwerking met Stream Analytics
    In deze module leren studenten hoe ze streaming data kunnen verwerken met Azure Stream Analytics. De student neemt voertuigtelemetriegegevens op in Event Hubs en verwerkt die gegevens vervolgens in realtime met behulp van verschillende vensterfuncties in Azure Stream Analytics. Ze sturen de gegevens naar Azure Synapse Analytics. Ten slotte leert de student hoe de Stream Analytics-taak kan worden geschaald om de doorvoer te verhogen.
    Lessen

    • Schakel betrouwbare berichten uit voor Big Data-toepassingen met behulp van Azure Event Hubs
    • Werk met datastromen met behulp van Azure Stream Analytics
    • Neem datastromen op met Azure Stream Analytics

    Module 15: Maak een oplossing voor streamverwerking met Event Hubs en Azure Databricks
    In deze module leren studenten hoe ze streaminggegevens op schaal kunnen opnemen en verwerken met Event Hubs en Spark Structured Streaming in Azure Databricks. De student leert de belangrijkste kenmerken en toepassingen van gestructureerde streaming. De student implementeert schuifvensters om over brokken gegevens te aggregeren en past watermerken toe om verouderde gegevens te verwijderen. Ten slotte maakt de student verbinding met Event Hubs om streams te lezen en te schrijven.
    Lessen

    • Verwerk streaminggegevens met gestructureerde streaming van Azure Databricks

    Module 16: maak rapporten met behulp van Power BI-integratie met Azure Synpase Analytics
    In deze module leert de student hoe hij Power BI kan integreren met zijn Synapse-werkruimte om rapporten op te bouwen in Power BI. De student maakt een nieuwe gegevensbron en Power BI-rapport aan in Synapse Studio. Vervolgens leert de student hoe hij de queryprestaties kan verbeteren met gematerialiseerde weergaven en caching van resultatensets. Ten slotte zal de student het datameer verkennen met serverloze SQL-pools en visualisaties maken tegen die gegevens in Power BI.
    Lessen

    • Maak rapporten met Power BI met behulp van de integratie met Azure Synapse Analytics

    Module 17: Voer geïntegreerde machine learning-processen uit in Azure Synapse Analytics
    Deze module verkent de geïntegreerde, end-to-end Azure Machine Learning- en Azure Cognitive Services-ervaring in Azure Synapse Analytics. U leert hoe u een Azure Synapse Analytics-werkruimte verbindt met een Azure Machine Learning-werkruimte met behulp van een gekoppelde service en vervolgens een geautomatiseerd ML-experiment activeert dat gegevens uit een Spark-tabel gebruikt. U leert ook hoe u getrainde modellen van Azure Machine Learning of Azure Cognitive Services kunt gebruiken om gegevens in een SQL-pooltabel te verrijken en vervolgens voorspellingsresultaten kunt presenteren met behulp van Power BI.
    Lessen

    • Gebruik het geïntegreerde machine learning-proces in Azure Synapse Analytics
     
     

    Voor wie is DP-203: Data Engineering on Microsoft Azure [203T00-A]

    De primaire doelgroep voor deze training zijn dataprofessionals, data-architecten en business intelligence-professionals die willen leren over data engineering en het bouwen van analytische oplossingen met behulp van dataplatformtechnologieën die bestaan op Microsoft Azure. Het secundaire publiek voor deze training data-analisten en datawetenschappers die werken met analytische oplossingen gebouwd op Microsoft Azure.
    Ook ontvang je een examenvoucher. Meld u vandaag nog aan!

    Voorvereisten

    Succesvolle studenten beginnen deze training met kennis van cloud computing en kerngegevensconcepten en professionele ervaring met gegevensoplossingen.
    Specifiek invullen:

    • AZ-900 - Azure Fundamentals
    • DP-900 - Microsoft Azure Data Fundamentals

    Doelstellingen

    Na het afronden van deze training kun je de volgende activiteiten uitvoeren:
    Verken reken- en opslagopties voor workloads voor data engineering in Azure

    • Ontwerp en implementeer de serverlaag
    • Begrijp overwegingen op het gebied van data-engineering
    • Voer interactieve queries uit met behulp van serverloze SQL-pools
    • Verken, transformeer en laad gegevens in het datawarehouse met Apache Spark
    • Voer gegevensverkenning en -transformatie uit in Azure Databricks
    • Gegevens opnemen en laden in het datawarehouse
    • Transformeer gegevens met Azure Data Factory of Azure Synapse Pipelines
    • Integreer gegevens uit notebooks met Azure Data Factory of Azure Synapse Pipelines
    • Optimaliseer de queryprestaties met speciale SQL-pools in Azure Synapse
    • Analyseer en optimaliseer datawarehouse-opslag
    • Ondersteuning van Hybrid Transactional Analytical Processing (HTAP) met Azure Synapse Link
    • Voer end-to-end-beveiliging uit met Azure Synapse Analytics
    • Voer realtime streamverwerking uit met Stream Analytics
    • Creëer een stroomverwerkingsoplossing met Event Hubs en Azure Databricks
    • Bouw rapporten met behulp van Power BI-integratie met Azure Synpase Analytics
    • Voer geïntegreerde machine learning-processen uit in Azure Synapse Analytics

    Examen informatie

    • Duur examen:120
    • % extra tijd indien niet in moedertaal: -
    • Aantal examenvragen: 40-60
    • Minimaal aantal goed te beantwoorden: Variable
    • Examen stijl: Multiple Choice
    • Open Boek: Nee
     
  • Gerelateerd

    Vakgebied
    Data
     
  • e-CF competenties bij deze training

     

    Bij Capgemini Academy geloven wij in transparantie en overzicht in het opleidingslandschap. Daarom kan je hieronder zien aan welke e-CF competentie deze training of certificering bijdraagt. Kijk voor meer informatie over hoe jij het e-Competence Framework kan gebruiken op deze pagina. Wil je weten hoe je het e-CF binnen jouw organisatie kan toepassen, lees dan meer op deze pagina.

     

    e-Competence Level12345
    A.5.Architecture Design     
    A.6.Application Design     
    B.2.Component Integration     
    B.6.ICT System Engineering