Dr. Christoph Koch und Dr. Thilo Edinger (DATEV eG)
Die steigende Zahl datengetriebener Use Cases in Analytics und KI verschärft ein bekanntes Dilemma: Datenqualität ist selten ein isoliertes „Datenproblem“, sondern entsteht - oder scheitert - entlang einer End‑to‑End‑Kette aus fachlichem Ownership, klarer Semantik, expliziten Vereinbarungen, Governance‑Leitplanken und deren technischer Durchsetzung. Klassische, nachgelagerte Qualitätsprüfungen greifen dabei zu kurz, da sie zentrale Ursachen semantischer Inkonsistenzen nicht adressieren.
DATEV begegnet diesem Spannungsfeld mit einem Zielbild, in dem Datenprodukte als klar definierte und vertraglich geregelte Einheiten verstanden werden - explizit mit Semantik als Schlüsselelement. Ein unternehmensweit konsistenter Semantic Layer verknüpft fachliche Begriffe systematisch mit konkreten Datenpunkten und schafft damit die Voraussetzung, Qualitätsanforderungen, Compliance‑Regeln und Wiederverwendung nicht nachträglich abzusichern, sondern „by design“ skalierbar zu machen.
Der Vortrag zeigt, wie DATEV Data Governance im Sinne eines föderativen Ansatzes über Standards, Rollen und Prozesse für Datenprodukte und Semantik etabliert. Er erläutert, wie Semantik in Datenprodukten über Ontologie‑Bindings, Validierungsregeln und Data Contracts genutzt wird, um Qualität explizit zu definieren sowie mess‑ und prüfbar zu machen, und wie eine automatisierte Governance‑Schicht aus Policies und Metriken als technisches Rückgrat dient, um Datenqualitäts‑Vereinbarungen sowohl in Deploy‑ als auch in Runtime‑Phasen systematisch durchzusetzen.