In de architectuur van het BI Data Lake is gekozen voor een flexible structuur: Source area (SRC), een centrale BI Data Lake met Business area (BUS) en 1 of meer Target areas (TRG).

‘Powerpack with Python’ genereert deze software en bevat een aantal onderdelen:

  • Standards & Guidelines – Powerpack; detail beschrijving van de flexiblele architectuur en implementatie van alle ETL- en database-components.
  • Roadmaps – Powerpack; de uit te voeren stappen ofwel ‘kookboek’ voor het implementeren van een BI project met ‘Powerpack’
    Reference Guide – Powerpack; details van de door ‘Powerpack’ gebruikte productivity boosters.
  • Productivity boosters; Python componenten voor het automatisch genereren van ETL- and database-objecten conform Standards & Guidelines
  • ETL- en database Code templates; ‘Powerpack’ gebruikt geoptimaliseerde code templates. Deze templates voeren specifieke taken binnen het ETL-proces uit.
  • Database en file Configuration templates; ‘Powerpack’ maakt gebruik van generieke ini-files om de source database en files te configureren. Standaard zijn ini-files beschikbaar voor alerlei database-types (PostgreSQL, Snowflake, Oracle, Mysql, SQLServer etc.) en source file-types (CSV, JSON and XML).

De BI Data Lake areas worden gebruikt om de diverse Source areas (SRC) op te slaan op een uniform database platform op een flexibele manier.

In de BI Data Lake kun je kiezen welke architectuur je wilt gebruiken in jouw organisatie.

  • 1 area; Staging-area om de data uit de diverse Source areas op een uniform platform op te slaan.
  • 2 areas; Staging-area en een History-area voor opslag van de data met historie.
  • 3 areas; Staging-area, History-area en een Business-area  voor opslag met jouw business specifieke transformaties.