Website laden..

Datakwaliteit is een zeer belangrijk onderdeel binnen een BI project. Daarom hanteert ‘Powerpack for PostgreSQL & Python’ geïntegreerde, uniforme data van zeer hoge kwaliteit.

Powerpack for PostgreSQL & Python’ genereert niet alleen de ETL- en databases software,
Het bewaakt ook de datakwaliteit tijdens het laden van de data in het History- en Business-area van de BI Data Lake.
Voor dit doel zijn generatoren voor datakwaliteit ingebouwd in ‘Powerpack for PostgreSQL & Python':
    • Staging-area Datafirewall;
    • Business-area Check Unknown;
    • Dimensional Check Unknown;

Data Quality

De Datafirewall, gegenereerd door ‘Powerpack for PostgreSQL & Python' zorgt ervoor dat de geleverde data wordt gecontroleerd in de Staging-area voordat deze historisch worden opgeslagen in het BI Data Lake.

In de Business- en Target-area (Dimensionaal) worden verwijzingen tussen de tabellen gemaakt.
De gegenereerde ETL creëert een verwijzing voor deze databasereferenties zonder verlies van gegevens. Als een relatie (foreign key) echter niet kan worden gelegd, wordt deze gekoppeld aan een ‘Unknown’- of ‘Empty’-master.
Dit zijn inconsistenties die de kwaliteit van het project beïnvloeden.

‘Powerpack’ geeft helder inzicht in de inconsistenties zodat deze direct duidelijk zijn.

[pagina] - ppk-pgp-tools