Die Substitution von Datensätzen bezeichnet das Ersetzen von Daten mit anderen Daten, die den gleichen oder zumindest einen ähnlichen Zweck erfüllen. Wenn bestimmte Daten nicht zugänglich sind oder aus anderen Gründen nicht für den vorgesehen Zweck verarbeitet werden dürfen, kann dies eine Strategie sein, um die entstandene Lücke zwischen verfügbaren und benötigten Daten zu schließen. Der Schlüssel liegt darin, solche Daten zu identifizieren, die die ursprünglich vorgesehenen zielführend ersetzen können.
Ziel des Moduls
Dieses Modul zeigt dir, wie du durch die Substitution von Datensätzen neue Informationen gewinnen kannst. Indem fehlende oder unvollständige Daten durch vorhandene, thematisch passende Datensätze ersetzt werden, lassen sich wertvolle Erkenntnisse ableiten.
Vorarbeit
- Für dieses Modul ist keine Vorarbeit erforderlich.
Material
- Für dieses Modul steht kein gesondertes Material zur Verfügung.
Arbeitsschritte
- Ausgangssituation erkennen Warum musst du auf andere Datensätze zugreifen? Die Antwort darauf findest du vermutlich im Data Governance Entscheidungsbaum. Denn genau die Frage, die dich dazu führt, auf alternative Datenquellen zurückzugreifen, formuliert das zugrundeliegende Problem. Folgende Szenarien sind möglich:
- Der Datensatz existiert nicht und kann weder durch dich, noch durch Dritte, erhoben werden.
- Der gewählte Datensatz enthält nicht die erforderlichen Informationen. Diese lassen sich auch nicht durch Verarbeitung gewinnen.
- Datensatz substuieren
‣
‣
‣