Praxishandbuch Data Act
1. Aufl. 2025
Besitzen Sie diesen Inhalt bereits,
melden Sie sich an.
oder schalten Sie Ihr Produkt zur digitalen Nutzung frei.
S. 1639. Haftung für (Trainings-)Daten
Sind Sachverhalte vorstellbar, in denen Daten bei einem Dritten einen Schaden verursachen? Wenn ja, wer haftet?
Inwieweit sind die neuen EU-Regeln zur KI-Haftung für Trainingsdaten relevant?
Können auch Datenlieferanten entlang der KI-Wertschöpfungskette davon betroffen sein?
Daten sind nicht nur eine Informationsquelle. Sie können auch Schäden verursachen. In erster Linie wird im Zusammenhang mit Daten eine vertragliche Haftung relevant sein, zB aus einer Schlechterfüllung vertraglicher Pflichten heraus, wenn ein Datenlieferant Daten nicht in der vereinbarten Qualität zur Verfügung stellt. Im KI-Kontext ist auch die außervertragliche Haftung von KI-Anbietern gegenüber geschädigten Dritten zu beachten. Über Regressansprüche des KI-Anbieters kann sich dies mittelbar auch auf Datenlieferanten auswirken. Die aktualisierte Produkthaftungsrichtlinie sieht Erleichterungen für Geschädigte bei der Durchsetzung von Schadenersatzansprüchen vor. Mit ihr besteht eine Produkthaftung auf für Software, darunter KI-Systeme. Über Trainingsdaten kann sie daher auch datenrechtlich von Bedeutung sein.
9.1. Einleitung
Da Daten ein Wirtschaftsgut sind, stellt sich auch bei ihnen die Frage, unter welchen Umständen für sie gehaftet werden muss. Bereits an anderer Stelle behandelt wurde, dass sich aus einer unzureichenden Datenqualität vertragliche Ansprüche ergeben können. Weisen die vertraglich geschuldeten Daten nicht die vereinbarte Datenqualität auf, erhält der Gläubiger ein mangelhaftes Produkt und kann daraus gegebenenfalls Gewährleistungsansprüche ableiten.
Davon zu unterscheiden ist die außervertragliche schadenersatzrechtliche Haftung und die Frage, ob bzw unter welchen Umständen Daten eine solche auslösen können. Als Beispiel können KI-Trainingsdaten herangezogen werden. Diese sind maßgeblich für die von einem KI-System produzierten Ergebnisse. Das betrifft nicht nur deren Inhalt und die Qualität, zB die Genauigkeit von Vorhersagen, sondern auch die Vermeidung von Bias und anderen schädigenden Inhalten. In den Trainingsdaten angelegte Defizite können auf das KI-System durchschlagen und die Ursache für fehlerhaften Output, der seinerseits wieder zu einem Schaden führt, sein („garbage in, garbage out“).
Ein KI-System zur Analyse medizinischer Befunde wurde auf Grundlage nicht ausreichend repräsentativer - und nicht Art-10-AI-Act-konformer - Trainingsdaten entwickelt. Es wurden überwiegend Daten männlicher Patienten für das Training herangezogen. Bei Erkrankungen, die bei Frauen anders verlaufen oder andere Symptome aufweisen, liefert S. 164das als Diagnose-Tool eingesetzte KI-System daher keine zuverlässigen Ergebnisse. Infolgedessen könnten bei Frauen Fehldiagnosen gestellt oder Krankheiten nicht rechtzeitig erkannt werden, was bei den betroffenen Patientinnen gesundheitliche Schäden zur Folge hat.
Ein KI-System, das in autonomen Fahrzeugen zum Einsatz kommt, wurde mit Daten, die aus fast ausschließlich ländlichen Verkehrsbedingungen stammen, trainiert, während städtische Verhältnisse kaum berücksichtigt wurden. Deswegen macht es im Fahrbetrieb (reihenweise) Fehleinschätzungen. Die Fahrzeuge erkennen aufgrund der unzureichenden Trainingsdaten Hindernisse nicht (rechtzeitig) und verursachen Unfälle.
Die Beispiele zeigen, dass Daten, gerade im KI-Kontext, ein Schädigungspotenzial zukommen kann. Unzweifelhaft sind Daten nicht die einzig mögliche Schadensursache bei KI-Systemen. Zwischen der Auswahl oder der Lieferung der Daten und dem schädigenden Ereignis wird es im Entwicklungsprozess noch verschiedenste Zwischenschritte geben, bei denen ebenfalls - losgelöst von den Daten - ein schadenverursachendes Verhalten bzw eine solche Unterlassung gesetzt worden sein könnte.
Der Lebenszyklus von KI-Systemen besteht aus verschiedenen Phasen der Entwicklung und des Einsatzes. Dabei wird eine Vielzahl an Akteuren tätig. Vergleichsweise selten wird die Wertschöpfungskette aus nur zwei Akteuren - dem Unternehmen, dass das KI-System entwickelt hat und dem anderen Unternehmen, das dieses System einsetzt - bestehen. Der Regelfall wird komplexer sein und mehrere Akteure umfassen.
Zulieferer von Hardware-Komponenten: Sie stellen die notwendigen Hardware-Komponenten und die Infrastruktur zur Verfügung, die für den Aufbau und das Training von KI-Modellen erforderlich sind. Dazu gehören beispielsweise Hardware GPUs oder Cloud-Computing-Ressourcen.
Zulieferer von Trainingsdaten: Sie stellen die für das KI-Training notwendigen Datensätze zur Verfügung. Die Daten müssen nicht jedenfalls bereits in „trainingsreifem“ Zustand geliefert werden. Möglich ist auch, dass diese vom Anbieter erst für das Training aufbereitet (zB gereinigt, gekennzeichnet) werden müssen.
Anbieter (Provider): Entwickelt das KI-Modell. Die Entwicklung umfasst in der Regel insbesondere die Programmierung, das Training des Modells mit Daten (inkl der kontinuierlichen Weiterentwicklung).
Betreiber (Deployer): Nutzt das vom Anbieter entwickelte KI-System eigenverantwortlich und professionell.
S. 165Diese Rollenaufteilung verdeutlicht die arbeitsteilige Struktur bei der Entwicklung von KI-Systemen, die auch haftungsrechtlich relevant sein kann. Ist aufgrund des Einsatzes eines KI-Systems ein Schaden entstanden, ist es häufig schwierig, den (oder die) Auslöser zu identifizieren. Es kann unklar sein, welche Verantwortung die einzelnen Akteure tragen und in welcher Weise sie zum Schaden beigetragen haben. Wie die obigen Beispiele zeigen, kommen auch Daten als mögliche Ursache in Frage. Unter welchen Umständen Datenlieferanten für unzureichender Trainingsdaten schadenersatzpflichtig werden können, ist daher eine auch datenrechtlich relevante Fragestellung. Es ist zwischen der vertraglichen und der deliktischen Haftung zu unterscheiden.
9.2. Vertragshaftung
Aus dem Blickwinkel der Vertragshaftung betrachtet bereitet die Beantwortung dieser Frage keine neuartigen Schwierigkeiten. Auch für Daten kann (entlang der Vertragskette) gehaftet werden, wenn diese nicht die notwendigen bzw vertraglich vereinbarten Eigenschaften aufweisen. Dies sei anhand der obigen Beispiele erklärt:
Als Anspruchsteller kommen hier insbesondere die fehldiagnostizierten Patient:innen bzw durch Verkehrsunfälle Geschädigte wie auch ein Krankenhaus, welches das KI-System vom Anbieter lizenziert und für die Diagnose eingesetzt hat und aufgrund des Vorfalls seinerseits Schadenersatz leisten musste, in Frage. Schadenauslösend in den Beispielfällen waren die zum Training der jeweiligen KI-Anwendung eingesetzten Daten. Stellt sich dies etwa in einem Gerichtsverfahren gegen den KI-Anbieter heraus und muss dieser die Anspruchsteller entschädigen, könnte er, wenn er die Daten selbst zugekauft hat, Regressansprüche dem Datenlieferanten gegenüber haben. In den Beispielen etwa dann, wenn
KI-Anbieter und Datenlieferant zB eine bestimmte Datenqualität, eine Tauglichkeit für das beabsichtigte KI-Training oder eine Konformität der Daten mit den Vorgaben des Art 10 AIA vereinbart haben,
diese Anforderungen vom Lieferanten nicht erfüllt wurden,
die KI-Anwendung deshalb nicht ordnungsgemäß funktionierte, und
es daher zu Schäden durch Unfälle bzw Fehldiagnosen gekommen ist.
In diesem Szenario gibt es für (Trainings-)Daten keine grundsätzlichen Unterschiede im Vergleich zu anderen Wirtschaftsgütern.
9.3. Außervertragliche Haftung
Vergleichsweise komplizierter fällt die Antwort im Bereich der außervertraglichen Haftung aus:
S. 166Dass Geschädigte gestützt auf eine deliktische Haftung versuchen, unmittelbar den Datenlieferanten zu belangen, erscheint nicht praxisnah. Die Trainingsdaten werden für Geschädigte auf den ersten Blick nicht oft als Schadenursache erkennbar sein. Zudem wird es in der Regel naheliegender und erfolgversprechender sein, sich an den jeweiligen „Vormann“ in der Vertragskette zu wenden. Das wird in erster Linie der Nutzer der KI-Anwendung sein, zu dem womöglich, wie im Beispiel zwischen den geschädigten Patient:innen und dem Krankenhaus, sogar ein Vertragsverhältnis besteht. Vorstellbar ist aber auch der KI-Anbieter. Mit diesem werden Geschädigte zwar keinen Vertrag haben, doch könnte er, insbesondere wenn umfangreiche vertragliche Haftungsausschlüsse den Nutzer schützen, ein mögliches Ziel darstellen. In diesem Verhältnis zwischen Geschädigten und dem Anbieter spielt die aktualisierte Produkthaftungs-Richtlinie eine Rolle.
9.3.1. Produkthaftung
Die aktualisierte Produkthaftungs-Richtlinie ist am in Kraft getreten. Sie ist innerhalb von 2 Jahren von den Mitgliedstaaten in nationales Recht umzusetzen. Die ursprünglich aus 1985 stammende Produkthaftungsrichtlinie, die in Österreich durch das Produkthaftungsgesetz (PHG) umgesetzt ist, wurde damit überarbeitet und modernisiert. Die Produkthaftungs-RL regelt die verschuldensunabhängige Haftung von Produktherstellern. Sie normiert allgemeine Regeln betreffend die Haftung für Produkte, stellt aber keine eigenen KI-spezifischen Haftungstatbestände auf.
Die Produkthaftungs-RL deckte vor ihrer Aktualisierung insbesondere keine digitalen (unkörperlichen) Produkte ab. Diese waren nicht vom der Produktbegriff erfasst. Dieser war auf bewegliche, körperliche Sachen beschränkt. Somit stand die Produkthaftung bei KI-Schäden bisher nicht als Anspruchsgrundlage zur Verfügung. Dies hat sich mit der Überarbeitung der RL geändert: Die Einschränkung auf eine Körperlichkeit von Produkten fällt weg, sodass auch digitale Produkte in ihren Anwendungsbereich fallen. Die Produktdefinition umfasst ausdrücklich auch Software, somit auch KI-Systeme (siehe Art 3 Z 1 AIA sowie Kap 7.). Damit wird die Produkthaftung zukünftig eine mögliche Anspruchsgrundlage für von KI-Systemen geschädigte Personen darstellen.
Ein wichtiger Regelungsgegenstand der aktualisierten Produkthaftungs-RL sind weiters Mechanismen, um bestimmte Schwierigkeiten, mit denen Geschädigte im KI-Kontext typischerweise bei der Durchsetzung von Schadenersatzansprüchen konfrontiert sein können, zu beseitigen. Das gilt vor allem für die Beweislastverteilung:
Geschädigte sind als Kläger für das Bestehen ihres Anspruchs beweispflichtig. Sie müssten nachweisen, dass das KI-System fehlerhaft ist und ein ursächlicher Zusammenhang zwischen dieser Fehlerhaftigkeit und dem eingetretenen Schaden S. 167besteht. Ein Produkt ist fehlerhaft, wenn es nicht die Sicherheit bietet, die die breite Öffentlichkeit unter Berücksichtigung aller Umstände erwarten darf. Um das in einem Gerichtsverfahren unter Beweis stellen zu können, benötigen Geschädigte Informationen, die ihnen nicht selten fehlen werden. KI-Systeme sind komplex und oft undurchsichtig (Black-Box-Effekt). Ihre Entscheidungsprozesse können selbst für die Entwickler nicht restlos nachvollziehbar sein. Das gilt umso mehr für - in die Entwicklung nicht eingebundene - Geschädigte. Diese werden über die innere Funktionsweise oder den Entwicklungsprozess eines KI-Systems in aller Regel keine Kenntnisse haben. Das gilt auch für das hohe Maß an Fachwissen, das der Nachweis einer Fehlerhaftigkeit erfordern wird, zB wenn sich Geschädigte darauf stützen wollen, dass bei der Entwicklung geeignete Sicherheitsmaßnahmen nicht ergriffen wurden. Dieses Informationsdefizit erschwert die Erbringung der notwendigen Beweise, um einen Schadenersatzanspruch durchsetzen zu können. Regelmäßig werden Geschädigte nicht lückenlos darstellen können, dass nicht auch ein fehlerfreies bzw sorgfaltsgemäß entwickeltes KI-System dasselbe schädigende Ergebnis erzielt hätte.
Dieses Problem versucht die Produkthaftungs-RL durch die Einführung
einer Offenlegungspflicht für bestimmte Beweismittel sowie
von Vermutungsregelungen für die Fehlerhaftigkeit und für die Kausalität zwischen Schaden und Fehlerhaftigkeit
zu entschärfen.
Gerichte können dem beklagten KI-Anbieter auf Antrag eines Geschädigten, der seinen (behaupteten) Schadenersatzanspruch ausreichend plausibilisiert hat, die Offenlegung von Beweismitteln auferlegen, soweit dies erforderlich und verhältnismäßig ist, wobei insbesondere Geschäftsgeheimnisse (zB des KI-Anbieters) zu schützen sind. Kommt der KI-Anbieter einem solchen gerichtlichen Auftrag zur Offenlegung nicht nach, wird von der Fehlerhaftigkeit des KI-Produkts ausgegangen (Beweislastumkehr bei der Fehlerhaftigkeit des Produkts). Zu einer solchen kommt es weiters dann, wenn der Geschädigte nachweist,
dass das KI-Produkt verpflichtenden Sicherheitsanforderungen gemäß Unionsrecht (besonders relevant in diesem Zusammenhang ist der AI Act) oder nationalem Recht nicht entspricht, welche der Verhinderung der Risiken bzw des entstandenen Schadens dienen, oder
dass der Schaden durch eine offensichtliche Fehlfunktion des Produkts bei normalem Gebrauch oder unter normalen Umständen entstanden ist.
Ist der entstandene Schaden seiner Art nach zudem typischerweise auf den betreffenden Fehler zurückzuführen, wird auch (widerlegbar) ein KausalzusammenS. 168hang zwischen der Fehlerhaftigkeit und dem Schaden vermutet, sodass auch diesbezüglich eine Beweislastumkehr stattfindet.
Während für die Produkthaftung die Fehlerhaftigkeit des KI-Systems der maßgebliche Anknüpfungspunkt ist, ist dies bei der deliktischen Verschuldenshaftung die schuldhaft begangene Sorgfaltspflichtverletzung des Anbieters oder Nutzers. Geschädigte müssen den Beweis für das Vorliegen (i) eines Schadens, (ii) einer rechtswidrigen Handlung, (ii) der Kausalität zwischen Schaden und Rechtswidrigkeit sowie für (iv) ein Verschulden (iS einer subjektiven Vorwerfbarkeit) des Beklagten erbringen.
Für den Bereich der deliktischen Verschuldenshaftung wird es - seit sich die Europäische Kommission dafür entschieden hat, den vorliegenden Entwurf der Richtlinie über KI-Haftung nicht weiterzuverfolgen - keine KI-spezifischen Haftungsregelungen geben. Es gibt für Geschädigte daher auch keine mit der Produkthaftungs-RL vergleichbaren Hilfestellungen in puncto Offenlegung von Beweismitteln und Beweislast. Die schadenersatzrechtliche Aufarbeitung wird nach den nationalen Regeln der einzelnen Mitgliedstaaten zu erfolgen haben.
9.3.2. Auswirkungen der Produkthaftungs-RL für Datenlieferanten
Die prozessuale Ausgangslage von Geschädigten, um Ersatz für KI-verursachte Schäden zu erhalten, wird deutlich verbessert. Sie müssen zwar trotzdem nachweisen, dass die für das konkrete KI-System eingesetzten Trainingsdaten unzureichend waren. Um an die dafür benötigten Informationen zu gelangen, können sie aber bei Gericht den Antrag stellen, dass dem KI-Anbieter die Offenlegung bestimmter Beweismittel aufgetragen wird. Gelingt mit über diesen Umweg erlangtem Beweismaterial zB der Nachweis, dass das KI-System mit Daten trainiert wurde, die die Vorgaben des Art 10 AI Act nicht erfüllen, liegt eine Fehlerhaftigkeit des KI-Systems vor. Davon ausgehend kann - wenn der entstandene Schaden seiner Art nach typischerweise auf den betreffenden Fehler zurückzuführen ist - die Kausalitätsvermutung greifen und gesetzlich vermutet werden, dass das KI-System deshalb das schädigende Ergebnis (zB Fehldiagnose) generiert hat. Diese sodann eingetretenen Vermutungen müsste dann der KI-Anbieter widerlegen.
Das kann wiederum Konsequenzen für Trainingsdaten und deren Lieferanten haben, weil sich deren Haftungsrisiko dadurch mittelbar erhöht. Unterstellt man nämlich, dass KI-Anbieter infolge der Neuregelung der Produkthaftung eher in eine Haftung geraten als bisher, könnten Trainingsdatenlieferanten häufiger Regressansprüchen seitens der von ihnen belieferten KI-Anbieter ausgesetzt sein, wenn diese behaupten, dass die Daten den Schaden (mit)verursacht haben.