Ob du Daten selbst erheben solltest, hängt davon ab, was du mit den Daten erreichen willst und in welchem Kontext sie verwendet werden sollen. Dieses Modul unterstützt dich dabei, einzuschätzen, ob eine eigene Datenerhebung sinnvoll und angemessen ist.
Ziel des Moduls
In vielen Fällen stehen die Daten, die für eine bestimmte Fragestellung benötigt werden, nicht bereits vollständig zur Verfügung. Das bedeutet, dass man sich zunächst einen Überblick verschaffen muss, ob und in welchem Umfang relevante Informationen überhaupt existieren. Wenn bereits Daten vorhanden sind – sei es aus öffentlich zugänglichen Quellen, von Unternehmen, Behörden oder anderen Institutionen – ist es in der Regel deutlich weniger aufwendig, diese zu nutzen, als neue Daten selbst zu erheben. Dies gilt auch dann, wenn die Daten von Dritten verwaltet werden, denn der Aufwand für die Datenerhebung, -aufbereitung und -analyse kann erheblich sein.
Allerdings gibt es auch Situationen, in denen eine eigene Datenerhebung sinnvoll oder sogar notwendig ist. Das ist vor allem dann der Fall, wenn sehr spezifische Informationen benötigt werden, die in bestehenden Datenquellen nicht enthalten sind, oder wenn besonders aktuelle Daten erforderlich sind, etwa bei schnelllebigen Themen oder kurzfristigen Entwicklungen.
Ob es wirklich notwendig und sinnvoll ist, Daten selbst zu erheben, hängt jedoch immer von der konkreten Zielstellung und dem jeweiligen Kontext ab, in dem die Daten verwendet werden sollen. Dabei spielen unter anderem der zeitliche und finanzielle Aufwand, die Verfügbarkeit anderer Datenquellen sowie die gewünschte Genauigkeit und Aussagekraft der Daten eine wichtige Rolle. In diesem Modul erfährst du, wie du die Entscheidung darüber sinnvoll abwägen kannst.
Ob eine eigene Datenerhebung sinnvoll ist, hängt von deinem Ziel, dem Kontext und dem Aufwand ab.
Vorarbeit
- Du solltest mindestens einen konkreten Datensatz definiert haben, den du für die folgende Abwägung heranziehen kannst.
- Dir sollte die
Datensatz-Matrix vorliegen, um gewählte Lösungen zu notieren.
- Du solltest dein Prozessmodell ausgefüllt vorliegen haben, aus dem du ableiten kannst, wer mit den Daten arbeiten wird.
Material
- Für dieses Modul steht kein gesondertes Material zur Verfügung.
Arbeitsschritte
- Kläre die Anforderungen an die Daten mit den Fachabteilungen: Um sinnvoll abwägen zu können, ob du die Daten überhaupt selbst erheben kannst und solltest, musst du zunächst die Anforderungen an die jeweiligen Daten für dein Vorhaben kennen. Dazu zählen insbesondere Anforderungen an Datenqualität, Formate und Standards. Die Fachabteilungen verfügen in der Regel über das notwendige Wissen über diese Anforderungen in deinem Verarbeitungskontext und können dir weiterhelfen. Die entsprechenden Ansprechpartner kannst du aus deinem Prozessmodell resp. den Organigrammen der Institutionen ableiten. Frage sie und erstellt gemeinsame eine Liste mit den Anforderungen!
- Identifiziere eine passende Erhebungsmethode: Welche Erhebungsmethode sinnvoll ist, hängt davon ab, welche Daten du benötigst und welche Anforderungen diese Daten erfüllen müssen. Je nach Methode kann der Aufwand für die Erhebung sehr unterschiedlich ausfallen – von geringem Zeitaufwand bis hin zu komplexeren, ressourcenintensiven Verfahren. Die Wahl der Methode hat dementsprechend Auswirkungen auf deinen Prozess, den du dann um weitere Arbeitsschritte und Zwischenergebnisse erweitern musst.
Zur Unterstützung haben wir hier eine Übersicht mit verschiedenen Erhebungsmethoden und potenziellen Datenquellen zusammengestellt. Wähle daraus die Methode aus, die am besten zu deinem Anwendungsfall passt.
Dokumentiere deine Auswahl anschließend in der
Datensatz-Matrix als eine der möglichen Data Governance-Lösungen.
- Wäge die Vor- und Nachteile ab: Grundsätzlich gilt, dass die Wiederverwendung bereits vorhandener Daten in der Regel mit deutlich weniger Aufwand verbunden ist als die Erhebung neuer Daten. Das trifft auch dann zu, wenn die vorhandenen Daten nicht aus deiner eigenen Institution stammen, sondern zunächst bei anderen Stellen oder externen Partnern beschafft werden müssen. Neue Daten solltest du also nur dann erheben, wenn die benötigten Daten nirgendwo anders verfügbar sind oder vorhandene Daten die fachlichen Anforderungen nicht erfüllen (z. B. weil sie ungenau, technisch unbrauchbar oder veraltet sind). Ob sich die Erhebung neuer Daten in deinem konkreten Fall lohnt, hängt von verschiedenen Faktoren ab – etwa vom Aufwand, den verfügbaren Ressourcen, der Qualität vorhandener Daten und dem Nutzen der neuen Informationen. Nutze die bereitgestellte Übersicht mit Vor- und Nachteilen verschiedener Methoden und wäge gut ab, ob eine eigene Datenerhebung für deinen Anwendungsfall tatsächlich sinnvoll ist.
- Lösung in der Datensatz Matrix notieren Sobald du dich für eine geeignete Methode zur Datenerhebung entschieden hast und die Vor- und Nachteile entsprechend abgewogen hast, dokumentiere deine Entscheidung in der Datensatz-Matrix. Trage die gewählte Erhebungsmethodik als Lösung unter dem Problemfeld „Datensatz existiert nicht“ ein. Auf diese Weise behältst du den Überblick darüber, wie du an die benötigten Daten kommst, und kannst deine Planung später gezielt fortführen oder mit anderen Beteiligten abstimmen.
Grundsätzlich bringt die Wiederverwendung existierender Daten weniger Aufwand mit sich.