Stellungnahme des KI Bundesverbandes zur Lancierung des Dateninstitutes 

Berlin, 04.11.2022

Mit der Lancierung des Dateninstituts unternimmt die Bundesregierung einen wichtigen Schritt, Innovationen im Daten-Ökosystem zu fördern und aktuell bestehende Hemmnisse abzubauen. Der Bundesverband Künstliche Intelligenz BVKI e.V. erwartet vom Dateninstitut, dass die Verfügbarkeit von Daten, beispielsweise durch die Etablierung eines zentralen Datenmarktplatzes, vereinfacht und insbesondere für Startups eine Beratungsstelle im Umgang mit Rechtsverordnungen zur Datennutzung und -teilung aufgebaut wird.

1) Welches Ziel soll das Dateninstitut verfolgen? 

Im aktuellen Ökosystem sind bereits reichlich Daten vorhanden, sie werden aber weder zentral gesammelt und zugänglich gemacht, noch wird eine Datennutzungskooperation zwischen Unternehmen aktiv incentiviert. Dies führt dazu, dass ein Großteil aller verfügbaren Daten nicht genutzt wird, beziehungsweise nicht verwendet werden kann. Wir sind daher überzeugt, dass das Dateninstitut an diesem Punkt einen signifikanten Beitrag leisten kann, sowohl in Bezug auf die Visibilisierung von verfügbaren Daten als auch zur Standardisierung. Ein mögliches Ziel des Dateninstitutes kann somit die Verfügbarmachung eines zentralen Datenkatalogs aus der öffentlichen Verwaltung, Forschung sowie der Privatwirtschaft sein. 

Ein weiteres mögliches Ziel des Dateninstitutes sollte die Einnahme einer Vorreiterrolle in Europa sein, für große KI-Sprachmodelle (z.B. OpenGPT-X) die Erstellung von Lerndatensätze einerseits zu fördern, aber auch gebündelt zur Verfügung zu stellen. Während Lerndatensätze in Englisch aktuell den Standard darstellen, sind wir überzeugt, dass mit der Initiierung von zielgerichteten Initiativen deutsche Datensätze gefördert werden können und zumindest für das heimische KI-Ökosystem neue Standards etabliert werden können. 

2) Welches sind die drängendsten Probleme, zu deren Lösung das Dateninstitut beitragen könnte? 

Die aktuell größten Herausforderungen in den Bereichen Datennutzung und Datenteilung lassen sich in drei Bereiche kategorisieren: Visibilität der Verfügbarkeit, Standardisierung der Daten und Rechtsunsicherheiten. 

Wir sind der festen Überzeugung, dass das Dateninstitut in allen drei Kategorien Fortschritte bewirken kann. Erstens kann mit dem Aufbau eines zentralen Datenkatalogs die Visibilität von Daten stark erhöht werden sowie eine zentrale Anlaufstelle für die Forschung und Startups geschaffen werden. Ein solcher Schritt wirkt sich effizienzsteigernd für Startups aus, zudem kann das Risiko einer mehrfachen Datenerhebung minimiert werden.

Ein solcher Datenkatalog etabliert auch eine spannende Idee mit Blick auf eine mögliche Taxonomie, ähnlich einer ISO Zertifizierung. Einen weiteren Beitrag kann das Dateninstitut hinsichtlich der Standardisierung von Daten und Schnittstellen leisten. Als ein mögliches drittes Ziel für das Dateninstitut sehen wir den Aufbau einer zentralen Beratungsstelle für Startups zum Umgang mit Richtlinien, Prozessen oder der Einhaltung der Datenschutz-Grundverordnung (DSGVO) hinsichtlich Datennutzung, -teilung und -sammlung. Als Orientierungsbeispiel bietet sich hier beispielsweise die Empfehlungen rund um den IT-Grundschutz durch das BSI an. 

3) Welche Zielgruppen sollte das Dateninstitut ansprechen? 

Das Dateninstitut sollte primär zwei Zielgruppen ansprechen: die öffentliche Verwaltung sowie das Startup-Ökosystem. 

Bezogen auf die öffentliche Verwaltung kann das Dateninstitut eine Vermittlungsrolle einnehmen, insbesondere in Bereichen, in welchen Behörden aufgrund geltender Richtlinien, beispielsweise aufgrund des Onlinezugangs gesetzes (OZG), keine Daten untereinander teilen dürfen. Nicht nur kann das Dateninstitut hier zwischenbehördlich wirken, wir sehen auch das Potential für die Aufbereitung von Daten aus der öffentlichen Verwaltung für die allgemeine Nutzung. Weiter kann das Dateninstitut mit Empfehlungen die Transparenz fördern, wir denken hier beispielsweise an die Forschungsförderung. 

Eine zweite Zielgruppe des Dateninstitutes sollten klar Startups darstellen. Mit der Schaffung eines zentralen Datenkataloges wie auch einer zentralen Anlauf und Beratungsstelle können Wertschöpfungspotenzial realisiert und Kompetenzen gebündelt werden. 

4) Welche Aufgaben soll es erfüllen? Und welche explizit nicht? 

Zentraler Datenkatalog: 

Für Startups aber auch für die Forschung ist der Zugang zu Daten von enormer Bedeutung. Durch die Schaffung einer zentralen Sammelstelle können Prozesse signifikant vereinfacht werden. Das Dateninstitut kann hier die Aufgabe eines Brokers übernehmen, eine Rolle, die mit Blick auf die Kommerzialisierung von Daten von zentraler Bedeutung sein kann. 

Bereitstellung von sensiblen Daten: 

Gerade für die Verfügbarmachung von sensiblen Daten, wie beispielsweise aus dem Gesundheitssektor, bieten sich naheliegend staatliche Behörden an. Während aktuell Kliniken individuell Daten sammeln und bereinigen müssen, kann das Dateninstitut hier die Aufgabe einer zentralen Sammelstelle übernehmen, in welcher Daten für die breite Öffentlichkeit aufbereitet werden. 

Zentrale Beratungsstelle: 

Bis die rechtlichen Unsicherheiten, insbesondere für Startups in Bezug auf Datennutzung und -teilung, geklärt sind, besteht der Bedarf zur Beratung und Unterstützung im Umgang mit der DSGVO. Wir sind überzeugt, dass das Dateninstitut, beispielsweise orientiert an den Dienstleistungen und Empfehlungen des BSI zum Thema IT-Grundschutz, eine unterstützende Rolle einnehmen kann, um die Innovationskraft deutscher KI-Startups weiter zu stärken. 

5) Wie kann das Dateninstitut diese Aufgaben bestmöglich erfüllen? 

Um die zuvor formulierten möglichen Aufgaben bestmöglich erfüllen zu können, muss das Dateninstitut zwingend eine zentrale Rolle einnehmen, praxisrelevante Standards setzen und innovative Initiativen fördern können. Wir empfehlen dem Dateninstitut daher, in einem ersten Schritt relevante Use Cases zu formulieren. Weiter sind wir der Überzeugung, dass die Arbeit des Dateninstitutes und deren formulierte Leitlinien sowohl für unter- wie auch übergeordnete Behörden Anwendung finden müssen. Nur so kann eine Standardisierung der Daten und Schnittstellen im Bereich der öffentlichen Verwaltung stattfinden. 

6) Gibt es Aspekte, die bei Organisation und Aufbau des Dateninstitutes besonders wichtig sind? 

Für den Aufbau des Dateninstitutes appellieren wir an den Grundsatz “form follows function”, womit wir das Ziel zum Ausdruck bringen möchten, dass in einem ersten Schritt die konkreten Ziele des Dateninstitutes formuliert werden sollen, und der organisatorische Aufbau anschliessend die Erreichung jener Ziele unterstützt. Wir erwarten, dass das Dateninstitut nicht die Rolle einer Regulierungsbehörde einnimmt, sondern vielmehr als innovationsfördernder Akteur im deutschen Daten-Ökosystem agiert und bestehende Hindernisse abbaut. Wir erwarten daher, dass sich sowohl die Ziele aber auch der Aufbau des Dateninstitutes an den Forderungen der Praxis orientieren.