Ist KI-DokumentenextraktionDSGVO-konform? Ein Leitfaden für EU-Unternehmen

Wenn Ihr Dokumentenextraktionstool Rechnungen mit Namen, Adressen oder Bankdaten von EU-Bürgern verarbeitet, verarbeiten Sie personenbezogene Daten im Sinne der DSGVO – unabhängig davon, ob Ihr Unternehmen in Berlin oder Boston sitzt. Hier erfahren Sie, was Artikel 4 Abs. 2, Artikel 28 und Artikel 17 fordern und wie Sie prüfen, ob Ihr Tool-Anbieter konform ist.

Schluss mit Abtippen — lassen Sie KI Ihre Dokumente lesen
Bild oder PDF hochladen — strukturierte Daten in 10 Sekunden
Jetzt testen
Keine Anmeldung · Keine Kreditkarte · Ergebnis in 10 Sekunden
Geschäftsleute schütteln sich die Hände als Symbol für eine DSGVO-konforme Datenverarbeitungsvereinbarung zwischen einem Unternehmen und seinem KI-Dokumentenextraktionsanbieter

Kernerkenntnisse

  1. Sie denken, die DSGVO-Konformität von Dokumentenextraktionstools sei eine Checkliste – Datenschutzerklärung überfliegen, „wir sind DSGVO-konform“ bestätigen lassen, weitermachen.
  2. Doch Artikel 4 Abs. 2 macht jeden Dokumentenupload zu einem Verarbeitungsvorgang, sobald eine Rechnung den Namen oder die Bankdaten einer natürlichen Person enthält. Artikel 5 Abs. 1 lit. b verbietet Ihrem Anbieter, KI auf Ihren Dokumenten zu trainieren, ohne ausdrückliche Einwilligung – eine Klausel, die in den meisten SaaS-AGB fehlt.
  3. Ihre Rolle wechselt von „Finde ein Tool, das funktioniert“ zu „Finde einen Anbieter mit flüchtiger Verarbeitung, ohne Modelltraining und mit einer Auftragsverarbeitungsvereinbarung (AVV) für die Dokumentenextraktion.“ Diese drei Fragen, die Sie vor dem Upload stellen, klären die Compliance-Frage, bevor ein einziges Dokument verarbeitet wird.

Was die DSGVO für die Dokumentenverarbeitung vorschreibt

Die Datenschutz-Grundverordnung (Verordnung (EU) 2016/679) erwähnt „Dokumentenextraktion" nicht namentlich. Sechs Artikel regeln jedoch direkt, wie Sie ein Extraktionstool zur Verarbeitung von Rechnungen, Gehaltsabrechnungen oder Verträgen mit personenbezogenen Daten einsetzen dürfen. Jeder schafft eine spezifische Verpflichtung – für Sie als Verantwortlichen und für den Tool-Anbieter als Auftragsverarbeiter.

Artikel 4 Absatz 2: Das Hochladen eines Dokuments ist „Verarbeitung"

Die Verordnung definiert Verarbeitung weit: „jeden mit oder ohne Hilfe automatisierter Verfahren ausgeführten Vorgang oder jede solche Vorgangsreihe im Zusammenhang mit personenbezogenen Daten wie das Erheben, das Erfassen, die Organisation, das Ordnen, die Speicherung, die Anpassung oder Veränderung, das Auslesen, das Abfragen, die Verwendung, die Offenlegung durch Übermittlung, Verbreitung oder eine andere Form der Bereitstellung, den Abgleich oder die Verknüpfung, die Einschränkung, das Löschen oder die Vernichtung" (Artikel 4 Absatz 2 DSGVO). Wenn Ihr Extraktionstool jemals eine Rechnung berührt, die einen Namen, eine Adresse, eine Kontonummer oder eine Steuer-ID einer natürlichen Person enthält, verarbeiten Sie personenbezogene Daten gemäß Artikel 4 Absatz 2. Gleiches gilt für Gehaltsabrechnungen (Mitarbeitername + Gehalt), Verträge (Unterzeichnername + ID) und Krankenakten. Die Weite dieser Definition ist beabsichtigt – Hochladen, Übertragen, Speichern und Löschen sind alles Verarbeitungsvorgänge.

Artikel 5 Absatz 1 Buchstabe b: Zweckbindung – Nur Extraktion, kein Training

Artikel 5 Absatz 1 Buchstabe b legt fest, dass personenbezogene Daten „für festgelegte, eindeutige und legitime Zwecke erhoben und nicht in einer mit diesen Zwecken nicht zu vereinbarenden Weise weiterverarbeitet werden" dürfen. Bei der Dokumentenextraktion ist dies die Bestimmung, die konforme von nicht konformen Tools trennt. Der Zweck des Hochladens eines Dokuments in ein Extraktionstool ist die Extraktion strukturierter Daten – dieser Zweck ist legitim. Nutzt der Anbieter Ihr hochgeladenes Dokument jedoch zum Training seiner KI-Modelle, stellt dies eine „Weiterverarbeitung" gemäß Artikel 5 Absatz 1 Buchstabe b dar. Sofern Sie nicht ausdrücklich in die Trainingsnutzung eingewilligt haben, ist diese mit dem ursprünglichen Zweck unvereinbar. Ein Tool, das Dokumente transient verarbeitet – sie liest, extrahierte Daten zurückgibt und die Originale verwirft – erfüllt die Zweckbindung auf natürliche Weise. Ein Tool, das Dokumente zur Modellverbesserung aufbewahrt, schafft ein Risiko nach Artikel 5 Absatz 1 Buchstabe b.

Artikel 28: Sie benötigen einen Auftragsverarbeitungsvertrag

Artikel 28 Absatz 3 verlangt, dass die Verarbeitung „durch einen Vertrag oder ein anderes Rechtsinstrument nach dem Unionsrecht oder dem Recht der Mitgliedstaaten geregelt ist, das den Auftragsverarbeiter in Bezug auf den Verantwortlichen bindet“. Dies ist Ihr Auftragsverarbeitungsvertrag (AVV). Gemäß Artikel 28 Absatz 3 Buchstaben a–h muss der AVV acht Mindestbestimmungen enthalten: Der Auftragsverarbeiter handelt nur nach dokumentierter Weisung (a); das Personal ist zur Vertraulichkeit verpflichtet (b); der Auftragsverarbeiter ergreift die Sicherheitsmaßnahmen nach Artikel 32 (c); Unterauftragsverarbeiter bedürfen einer Genehmigung (d); der Auftragsverarbeiter unterstützt Sie bei der Erfüllung von Betroffenenrechten (e); der Auftragsverarbeiter unterstützt bei Sicherheits- und Verletzungspflichten (f); der Auftragsverarbeiter löscht oder gibt Daten bei Vertragsende zurück (g); und der Auftragsverarbeiter ermöglicht Prüfungen (h). Wenn Ihr Extraktionsanbieter keinen AVV mit diesen acht Elementen vorlegen kann, stellt dies allein schon eine Compliance-Lücke dar, aufgrund derer Sie sich für einen anderen Anbieter entscheiden sollten.

Artikel 17: Recht auf Löschung

Artikel 17 Absatz 1 gewährt betroffenen Personen das Recht, die Löschung ihrer personenbezogenen Daten „unverzüglich“ zu verlangen, sofern bestimmte Gründe vorliegen – einschließlich des Falls, dass die Daten „für die Zwecke, für die sie erhoben oder auf sonstige Weise verarbeitet wurden, nicht mehr notwendig sind“ (Artikel 17 Absatz 1 Buchstabe a). Für die Dokumentenextraktion bedeutet dies: Sobald Sie die benötigten Daten extrahiert haben, sollten das Originaldokument und alle Kopien nach einem festgelegten Zeitplan gelöscht werden. Artikel 17 Absatz 3 Buchstabe b sieht eine Ausnahme vor, wenn die Verarbeitung zur Erfüllung einer rechtlichen Verpflichtung erforderlich ist – wenn Ihre Rechtsordnung die Aufbewahrung von Rechnungskopien für Steuerprüfungen vorschreibt, ist diese Aufbewahrung zulässig, jedoch nur für die gesetzliche Dauer und nur, wenn die Daten nicht über das gesetzlich Erforderliche hinaus weiterverarbeitet werden. Ihr Extraktionstool sollte eine dokumentierte Löschrichtlinie bieten. Best Practice ist die standardmäßige Nullspeicherung: Dokumente werden flüchtig verarbeitet, Originale werden innerhalb von Minuten bis Stunden, nicht Tagen, aus der Infrastruktur des Anbieters gelöscht.

Artikel 32: Sicherheit der Verarbeitung

Artikel 32 Absatz 1 verlangt „geeignete technische und organisatorische Maßnahmen, um ein dem Risiko angemessenes Schutzniveau zu gewährleisten“. Für die Extraktion umfasst diese Grundlage Verschlüsselung während der Übertragung (TLS 1.2+), Verschlüsselung im Ruhezustand, Zugriffskontrollen und unabhängig geprüfte Zertifizierungen (SOC 2 Typ II, ISO 27001).


Datenaufbewahrungsort und internationale Übermittlungen

Wenn Ihr Extraktionstool Dokumente auf Servern außerhalb des Europäischen Wirtschaftsraums verarbeitet, gilt Kapitel V (Artikel 44–49). Gemäß Artikel 45 Absatz 1 dürfen Daten in ein Drittland übermittelt werden, für das die Europäische Kommission einen Angemessenheitsbeschluss erlassen hat. Der EU-US Data Privacy Framework (DPF), angenommen durch den Durchführungsbeschluss der Kommission 2023/1795 vom 10. Juli 2023, ist der aktuelle Angemessenheitsbeschluss für US-amerikanische Organisationen, die sich selbst zertifizieren. Am 3. September 2025 wies das EU-Gericht eine rechtliche Anfechtung des DPF ab und bestätigte dessen Gültigkeit. Wenn Ihr Anbieter Daten in den USA verarbeitet und über eine DPF-Zertifizierung verfügt, erfüllt dies Artikel 45.

Für Übermittlungen in Länder ohne Angemessenheitsbeschluss sieht Artikel 46 Absatz 2 Buchstabe c Standardvertragsklauseln (SCCs) vor – vorab genehmigte Vertragsbedingungen gemäß dem Durchführungsbeschluss der Kommission 2021/914 (4. Juni 2021). Das Schrems-II-Urteil (EuGH, Rechtssache C-311/18, 16. Juli 2020) stellte jedoch klar, dass die bloße Unterzeichnung von SCCs nicht ausreicht. Sie müssen zudem eine Übermittlungsfolgenabschätzung (TIA) durchführen, die bewertet, ob der rechtliche Rahmen des Ziellandes die Schutzmaßnahmen der SCCs beeinträchtigt, und gegebenenfalls zusätzliche Maßnahmen ergreifen. Wenn Ihr Anbieter Daten außerhalb des EWR verarbeitet, fragen Sie: Wo stehen Ihre Server? Auf welchen Übermittlungsmechanismus stützen Sie sich? Können Sie eine TIA vorlegen? Bietet er Hosting in der EU/im EWR an, ist die Frage des Datenaufbewahrungsorts geklärt – keine internationale Übermittlung, keine SCCs nötig, keine TIA erforderlich.

Artikel 5 Absatz 1 Buchstabe e ergänzt die Speicherbegrenzung: Personenbezogene Daten dürfen „nicht länger, als es für die Zwecke, für die sie verarbeitet werden, erforderlich ist“, aufbewahrt werden. Nach Abschluss der Extraktion sollte die Aufbewahrung einem dokumentierten Zeitplan folgen, der an gesetzliche Fristen gebunden ist – nicht einer unbegrenzten Speicherung auf den Servern des Anbieters.

Dieser Artikel behandelt die Verordnung selbst – was jeder Artikel von Ihnen und Ihrem Anbieter verlangt. Eine begleitende Anleitung zur Prüfung Ihrer internen Extraktions-Workflows auf diese Anforderungen finden Sie im Artikel zum Batch I-2 GDPR-Sicherheitsaudit. Beide ergänzen sich: Das Verständnis der rechtlichen Verpflichtungen kommt vor der Prüfung Ihrer Compliance.


Praktische Compliance-Checkliste: 7 Schritte zur Prüfung Ihres Extraktionstools

Jeder Schritt unten bezieht sich auf bestimmte DSGVO-Artikel, sodass Sie die Einhaltung mit genauen gesetzlichen Verweisen dokumentieren können.

1

Daten in Ihren Dokumenten klassifizieren

Ermitteln Sie, welche Felder in Ihren Dokumenten personenbezogene Daten gemäß Artikel 4 Abs. 1 sind. Namen, Adressen, Kontonummern, Steuer-IDs, Mitarbeiter-IDs und Unterschriften fallen darunter. Enthalten Ihre Dokumente solche Daten, gilt die DSGVO für die Verarbeitung.

2

Sicherstellen, dass der Anbieter Ihre Daten nicht zum Training nutzt

Gemäß Artikel 5 Abs. 1 lit. b ist das Training von KI-Modellen mit Ihren hochgeladenen Dokumenten eine „Weiterverarbeitung", die mit dem Extraktionszweck unvereinbar ist – es sei denn, Sie haben ausdrücklich eingewilligt. Holen Sie eine schriftliche Zusicherung ein, dass Ihre Daten nicht zum Training verwendet werden – vorzugsweise in der AVV.

3

AVV mit allen acht Bestimmungen aus Artikel 28 Abs. 3 abschließen

Nicht verhandelbar. Prüfen Sie, ob die AVV das Szenario der Dokumentenverarbeitung abdeckt (nicht nur generische SaaS-Dienste) und die Bestimmungen (a) bis (h) gemäß Artikel 28 Abs. 3 enthält. Kann der Anbieter keine AVV vorlegen, ist Ihre Compliance-Lücke bereits zu groß, um fortzufahren.

4

Serverstandort und Übermittlungsmechanismus bestätigen

Hosting im EWR = kein Übermittlungsproblem. Hosting in den USA = DPF-Zertifizierung auf der offiziellen Liste prüfen. Jeder andere Drittstaat = SCCs plus dokumentierte TIA gemäß Artikel 45–46 verlangen.

5

Sicherheitszertifikate prüfen

Gemäß Artikel 32 Abs. 1: Verschlüsselung während der Übertragung (TLS 1.2+), Verschlüsselung im Ruhezustand und unabhängig geprüfte Zertifikate (SOC 2 Typ II, ISO 27001) prüfen. Dokumentieren Sie, welche Zertifikate Ihr Anbieter besitzt und wann die letzte Prüfung stattfand.

6

Aufbewahrungs- und Löschfristen festlegen

Gemäß Artikel 5 Abs. 1 lit. e und Artikel 17 Abs. 1 lit. a: Legen Sie fest, wie lange der Anbieter Uploads speichert (Minuten bis Stunden, nicht Monate) und wie lange Sie extrahierte Daten aufbewahren (gesetzliche Fristen einhalten, dann löschen oder anonymisieren).

7

Löschverfahren dokumentieren

Fordert eine betroffene Person die Löschung gemäß Art. 17 Abs. 1, müssen Sie Dokumente mit ihren Daten in Ihrem Extraktionsverlauf identifizieren, diese Datensätze löschen oder anonymisieren und die Erledigung innerhalb der Ein-Monats-Frist nach Art. 12 Abs. 3 bestätigen. Bei einem Anbieterwechsel muss der alte Anbieter Ihre Dokumente gemäß Art. 28 Abs. 3 Buchst. g löschen.


Wie KI-Dokumentenextraktion in einen konformen Workflow passt

KI-Dokumentenextraktion ist weder inhärent konform noch nicht konform – es hängt davon ab, wie das Tool architektonisch aufgebaut ist und welche Zusagen der Anbieter macht.

Datenminimierung durch Design

Artikel 5(1)(c) verlangt, dass Daten „dem Zweck angemessen, erheblich sowie auf das für die Zwecke der Verarbeitung notwendige Maß beschränkt" sind. Die benutzerdefinierte Spaltenextraktion – bei der Sie genau festlegen, welche Felder extrahiert werden sollen (Rechnungsnummer, Datum, Gesamtbetrag, Lieferantenname) und die KI nur diese extrahiert – entspricht diesem Prinzip. Felder, die Sie nie anfordern, werden nie verarbeitet und daher nie gespeichert. Dies ist das Gegenteil des Ansatzes „alles extrahieren und später filtern", der unnötige Datenexposition schafft.

Flüchtige Verarbeitung

Tools, die für die flüchtige Verarbeitung konzipiert sind – Dokumente werden hochgeladen, KI liest sie, Daten werden zurückgegeben, Originale werden innerhalb von Minuten gelöscht – erfüllen gleichzeitig Artikel 5(1)(b) (Zweckbindung), Artikel 5(1)(e) (Speicherbegrenzung) und Artikel 17 (Recht auf Löschung). Wenn Sie Tools evaluieren, ist die Anbieterarchitektur nicht nur eine technische Entscheidung; es ist eine Compliance-Entscheidung mit regulatorischen Auswirkungen.

Anbieterauswahl als Compliance-Entscheidung

Zwei verwandte Vorschriften überschneiden sich mit Ihrem Extraktionsworkflow. E-Rechnungsvorschriften erfordern strukturierte XML-Formate – Ihr Extraktionstool muss mit diesen koexistieren, sie nicht ersetzen. Für einen gestaffelten Bereitschaftsplan siehe den Leitfaden zur E-Rechnungs-Compliance. Gesetzliche Aufbewahrungsfristen legen fest, wie lange Sie extrahierte Daten aufbewahren müssen – siehe den Leitfaden zu Dokumentenaufbewahrungspflichten. Diese drei Vorschriften – Datenschutz, E-Rechnungsvorschriften und Aufbewahrungsrecht – bilden das Compliance-Dreieck für die Dokumentenverarbeitung im Jahr 2026.


Häufig gestellte Fragen

Gilt die DSGVO auch für mein Kleinunternehmen mit weniger als 10 Mitarbeitern?

Ja. Die DSGVO sieht keine Ausnahme für Kleinunternehmen vor. Artikel 3 Absatz 1 gilt für jede Verarbeitung im Rahmen einer EU-Niederlassung, unabhängig von der Größe. Artikel 30 Absatz 5 befreit Unternehmen mit weniger als 250 Mitarbeitern von der Pflicht zur Führung vollständiger Verarbeitungsverzeichnisse, aber alle wesentlichen Pflichten – Artikel 4 Begriffsbestimmungen, Artikel 5 Grundsätze, Artikel 28 Auftragsverarbeitung, Artikel 17 Löschungsrechte, Artikel 32 Sicherheit – gelten für jedes Unternehmen, das personenbezogene Daten verarbeitet.

Meine Rechnungen enthalten nur Firmendaten, keine personenbezogenen Daten. Gilt die DSGVO trotzdem?

Wahrscheinlich ja. Eine Rechnung eines Einzelunternehmers enthält Name und Adresse der Person – personenbezogene Daten gemäß Artikel 4 Absatz 1. Eine Rechnung einer GmbH, die den Namen oder die direkte E-Mail-Adresse einer Kontaktperson enthält, enthält ebenfalls personenbezogene Daten. Eine Gehaltsabrechnung mit Name und Gehalt eines Mitarbeiters ist per Definition personenbezogen. Selbst ein Bestellformular mit der Unterschrift eines Genehmigers fällt darunter. In der Praxis sind nur sehr wenige Geschäftsdokumente völlig frei von personenbezogenen Daten. Taucht irgendwo ein Mensch auf – als Lieferantenkontakt, Mitarbeiter, Genehmiger, Unterzeichner – gilt die DSGVO.

Kann ich die DSGVO umgehen, indem ich Dokumente vor der Extraktion anonymisiere?

Erwägungsgrund 26 stellt klar, dass die Datenschutzgrundsätze nicht für wirklich anonyme Informationen gelten. Der Anonymisierungsschritt selbst – das Schwärzen von Namen, das Maskieren von Adressen – ist jedoch eine Verarbeitung gemäß Artikel 4 Absatz 2, und die DSGVO knüpft an diesen Schritt an. Anonymisierung ist eine valide Strategie zur Risikominderung, beseitigt aber nicht die Pflichten, die sie schafft. Die meisten Unternehmen halten es für praktikabler, einen konformen Anbieter zu nutzen, als eine eigene Anonymisierungspipeline aufzubauen.

Was passiert mit meinen Daten, wenn ich den Anbieter wechsle?

Gemäß Artikel 28 Absatz 3 Buchstabe g muss Ihr aktueller Anbieter alle personenbezogenen Daten bei Vertragsende löschen oder zurückgeben. Fordern Sie einen dokumentierten Export und eine Löschbestätigung an. Artikel 17 Absatz 1 unterstützt Ihr Recht auf Löschung aller nach dem Übergang noch gespeicherten Daten. Bewahren Sie die Bestätigung für Ihre Compliance-Unterlagen auf.

Muss mein Auftragsverarbeiter ein Audit zulassen?

Artikel 28 Absatz 3 Buchstabe h verlangt, dass der Auftragsverarbeiter „Audits ermöglicht und zu ihnen beiträgt". In der Praxis erlauben nur wenige SaaS-Anbieter Vor-Ort-Audits für Standardtarife. Die meisten stellen SOC-2-Typ-II-Berichte oder ISO-27001-Zertifikate als Ersatz zur Verfügung. Prüfen Sie, ob die Auditdokumentation Ihres Anbieters Ihre spezifischen Verarbeitungsszenarien abdeckt – das erfüllt in der Regel die Anforderung aus Artikel 28 Absatz 3 Buchstabe h.

DSGVO-Konformität bei der Dokumentenextraktion dreht sich nicht darum, ob KI konform sein kann – sondern darum, ob Ihr Anbieter die richtigen vertraglichen, sicherheitstechnischen und architektonischen Schutzmaßnahmen getroffen hat. Artikel 4 Abs. 2 macht jeden Dokumentenupload zu einem Verarbeitungsvorgang. Artikel 28 verlangt eine AVV mit acht spezifischen Bestimmungen. Artikel 5 Abs. 1 lit. b verbietet Modelltraining ohne Rechtsgrundlage. Artikel 17 gewährt betroffenen Personen Löschrechte. Und Kapitel V regelt grenzüberschreitende Übermittlungen. Jeder dieser Punkte ist vor der Anmeldung überprüfbar. Die Compliance-Frage ist beantwortet, bevor Sie ein einziges Dokument verarbeiten – nicht danach.

DSGVO-Konformität prüfen

Kostenlos testen, ohne Anmeldung. Dokumente werden flüchtig verarbeitet und nicht gespeichert.

📮 contact email: [email protected]