• Source Data Integration

    < Terug naar vorige pagina
    Training code
    CGASDAINCD
    Gesproken taal
    Nederlands
    Taal materiaal
    Engels
    Dagdelen
    2
    Kosten
    €204,68
    excl. BTW Geen extra kosten.

    Klik op onderstaande button om je in te schrijven voor deze training

    • 21-5-2025
      Online Virtual
      €204,68
      €204,68
    • 20-10-2025
      Utrecht
      €204,68
      €204,68
    Training code
    CGASDAINCD
    Gesproken taal
    Nederlands
    Taal materiaal
    Engels
    Dagdelen
    2
    Kosten
    €204,68
    excl. BTW Geen extra kosten.

    Klik op onderstaande button om je in te schrijven voor deze training

    • 21-5-2025
      Online Virtual
      €204,68
      €204,68
    • 20-10-2025
      Utrecht
      €204,68
      €204,68
  • Data wordt vastgelegd in verschillende bronsystemen. Het verzamelen en kopieren van brondata heet bronontsluiting, oftewel data ontsluiting. Essentieel voor bedrijven om juiste beslissingen te nemen.
     
    Aan het einde van de training ben je in staat om:
    • Te bepalen wanneer een nieuwe bron geïntegreerd moet worden.
    • Verschillende aanlevertechnieken en aanlevermethoden van brondata te begrijpen.
    • Te begrijpen wat ETL is.
    • Te weten hoe de volledigheid en juistheid van brongegevens te kunnen garanderen.
     
    In de huidige datarijke omgeving is het voor bedrijven van cruciaal belang om inzichten uit data te halen om weloverwogen beslissingen te kunnen nemen. Gegevens met betrekking tot de bedrijfsvoering worden vastgelegd in verschillende bronsystemen. Door data uit deze verschillende bronsystemen te verzamelen en te koppelen kunnen we waardevolle inzichten verkrijgen. Hoe meer data we verzamelen, hoe meer inzichten we eruit kunnen halen. Dit proces van het verzamelen en kopiëren van brongegevens staat bekend als Source Data Integration.
    In deze training leer je over:
    • Het proces om te bepalen of nieuwe gegevensbronnen moeten worden ontsloten of uitgebreid op basis van de informatiebehoeften van klanten.
    • Verschillende technieken voor gegevenslevering, waaronder bestandslevering, webgebaseerde levering via een API, export van databasetabellen, directe gegevensextractie uit een brontabel en Change Data Capture (CDC).
    • De techniek waarmee data kunnen worden verwerkt en opgeslagen in bijvoorbeeld een datawarehouse. Je maakt kennis met Extract, Transform en Load (ETL).
    • Verschillende methoden voor gegevenslevering, waaronder volledige, incrementele, stapelbare en event based leveringsmethoden.
    • Het opbouwen van de historie van brondata in een datawarehouse en het afleiden van “deltas” of nieuwe en gewijzigde brondata op basis van de aanlevermethode.
    • De afspraken die gemaakt moeten worden met de bron over de aan te leveren gegevens, de formaten, aanlevertechniek, wijze, frequentie en tijdstippen. Je leert over interfaces, metadata en Service Level Agreements (SLA).
    • Bepalen van de kwaliteit van de datalevering en waarom dit belangrijk is.
    • De voordelen van het standaardiseren en hergebruiken van ETL-taken en hoe deze generiek en op metadata gebaseerd kunnen worden gemaakt.
    Tijdens de training staat de toepassing van wat je leert centraal en word je uitgedaagd om in praktijkgevallen met de gegeven theorie aan de slag te gaan. De training wordt gegeven door mensen die in de praktijk binnen Data Engineering werken en weten waar het over gaat. Die praktijkkennis willen ze graag overbrengen.
  • Target Audience
    • Data Engineers: Professionals die de data-infrastructuur ontwerpen, bouwen en beheren. Zij ontwikkelen de architectuur die helpt bij het analyseren en verwerken van data op de manier waarop de organisatie deze nodig heeft.
    • Data-analisten: ze manipuleren grote datasets en gebruiken deze om trends te identificeren en betekenisvolle conclusies te trekken ter onderbouwing van strategische zakelijke beslissingen.
    • Business Intelligence Professionals: zij gebruiken gegevens om markt- en bedrijfstrends te helpen achterhalen door gegevens te analyseren om een duidelijker beeld te krijgen van waar het bedrijf staat.
    • Data Science Managers: professionals die toezicht houden op het data science-team en het traject van ruwe data naar bruikbare inzichten begeleiden.
    • IT-managers: zij zijn verantwoordelijk voor het coördineren, plannen en leiden van computergerelateerde activiteiten in een organisatie.
    Er zijn geen specifieke vereisten om aan deze training te kunnen deelnemen.
    Bij deze training is het gebruik van een laptop vereist.