Französische DokumentenextraktionGünstige Optionen für TPE und PME

Frankreich steht drei Monate vor der größten Änderung seiner Rechnungsinfrastruktur seit einer Generation. Ab dem 1. September 2026 müssen alle mehrwertsteuerpflichtigen Unternehmen elektronische Rechnungen über eine zugelassene Plattform (PA) oder das öffentliche Rechnungsportal (PPF) empfangen können. Die Reform – verankert in Artikel 91 des Finanzgesetzes 2024 – wird bis September 2027 von allen Unternehmen die Ausstellung elektronischer Rechnungen verlangen. Doch die Diskussion über die Verpflichtung drehte sich fast ausschließlich um Compliance: welche PA wählen, wie das Factur-X-Format aussieht, wie man sich mit Chorus Pro verbindet. Was nicht thematisiert wurde, ist das Extraktionsproblem, das einen Schritt vor der Compliance liegt: Wie französische Unternehmen Daten aus den bereits vorhandenen Dokumenten gewinnen.

Preisvergleichstabelle zur Datenextraktion aus französischen Dokumenten mit Kosten pro Dokument für verschiedene Tools

Wichtige Erkenntnisse

  1. „OCR inklusive“ in französischer Buchhaltungssoftware für 14€/Monat bedeutet Belege – die Lieferscheine und Lieferantenangebote, die die Hälfte Ihres Dokumentenstapels ausmachen, bleiben auf Ihrem Schreibtisch liegen.
  2. Die Tools, die die gesamte französische Dokumentenmischung verarbeiten, beginnen bei 499€/Monat – das 60-fache des Preises für dieselbe KI-Klasse, die denselben „Montant TTC“ von derselben Rechnung liest.
  3. ImageToTable.ai für 8,30€/Monat liest jeden französischen Dokumententyp mit denselben Spaltendefinitionen – weil semantische KI „Rechnungsnummer“ anhand der Bedeutung findet, nicht anhand der Vorlagenposition.

Das französische Belegproblem geht tiefer als die E-Rechnung

Ein französisches TPE oder PME erhält nicht nur eine Belegart. Es bekommt Rechnungen (factures) von 15 bis 40 Lieferanten, jede in einem anderen Layout. Es erstellt Angebote (devis) für Kunden und wandelt die angenommenen in Rechnungen um. Es erhält Lieferscheine (bons de livraison) von Métro, Réseau Pro oder Point.P – Dokumente, die bestätigen, was geliefert wurde, aber oft kein Standardformat, keinen Lieferantennamen im Kopf und kein Feld haben, das Sie als Belegtyp erkennen würden. Es bekommt Lieferantenangebote (devis fournisseurs) für Großbestellungen, Kontoauszüge (relevés bancaires) von Crédit Agricole oder BNP Paribas mit eigenen PDF-Layouts, Spesenbelege der Mitarbeiter (notes de frais) und Bestellungen (bons de commande).

Keiner dieser Belege fällt unter die E-Rechnungspflicht, außer der Rechnung selbst. Und bei der Rechnung regelt die Pflicht nur das Übertragungsformat – nicht die Datenextraktion. Eine Factur-X-Rechnung, die über eine PA eingeht, ist konform. Die 13 Pflichtfelder gemäß Artikel 242 nonies A des Anhangs II zum CGI sind vorhanden. Aber bis jemand diese Felder in eine Tabelle oder einen Buchungssatz extrahiert, leben die Daten im Dokument, nicht in Ihren Büchern. Der Extraktionsschritt ist der Engpass, den die Pflicht nie lösen sollte.

Jedes französische Unternehmen verarbeitet mindestens fünf Belegarten zusätzlich zur Rechnung. Die E-Rechnungspflicht standardisiert eine davon – das Übertragungsformat für die Rechnung. Die anderen vier bleiben unstrukturiert, nicht standardisiert und nicht extrahiert. Das ist das Belegproblem, das keine PA löst.

Die französische Buchhaltungssoftware-Landschaft: Was die OCR tatsächlich abdeckt

Frankreich hat einen der wettbewerbsintensivsten Buchhaltungssoftware-Märkte Europas. Fast jedes Produkt enthält eine Form von OCR. Die Frage ist nicht, ob OCR existiert, sondern was sie tatsächlich extrahiert und zu welcher Preisstufe.

ToolMonatspreis (HT)OCR für RechnungenOCR für andere DokumenteMulti-Lieferanten-HandlingExport in Buchhaltung
Pennylane Basique€14Basis, StandardlayoutsNur BelegeEingeschränkt; bei nicht standardisierten Formaten nachlassendNativ
Pennylane Premium€79Fortschrittlich, automatisierte Erfassung mit RegelnBelege, einige LieferscheineGut nach Einrichtung der RegelnNativ + EDI
Indy€12–25Belegorientiert; einfache RechnungBelege, KilometerständeFür Freiberufler-Volumen ausgelegtExport
TiimeKostenlos–€25Automatische Buchhaltung mit BasisextraktionKontoauszügeNur einfache, wiederkehrende LayoutsTeilweise
EBP€15–60Vorlagenbasierte OCR in höheren StufenEingeschränktVorlagenpflege für jeden LieferantenExport
Sage / Cegid€30–100+Vollständige OCR-ModuleEinige Bestell-/Lieferscheinmodule vorhandenFür Unternehmens-AP ausgelegt, nicht für TPE-VielfaltNativ

Das Muster ist eindeutig: Die OCR, die mehrere Dokumenttypen und Lieferantenlayouts verarbeitet, befindet sich in der €60+-Stufe. Darunter gibt es nur Belegscan und einfache Rechnungserkennung. Und selbst in der höchsten Stufe ist die OCR auf die Dokumente ausgelegt, die das Buchhaltungsmodul erwartet — Rechnungen und Belege — nicht auf die gesamte Dokumentenvielfalt, die ein französisches Unternehmen tatsächlich handhabt. Ein Lieferschein von Point.P oder ein Lieferantenangebot von Frans Bonhomme liegt völlig außerhalb des OCR-Trainings der Buchhaltungssoftware.

Eigenständige Dokumentenextraktionstools in Frankreich

Unabhängig von Buchhaltungssuiten hat sich eine zweite Kategorie von Tools etabliert: spezialisierte Extraktionsprodukte, die Dokumente lesen und Daten ausgeben, ohne Ihre Buchhaltung ersetzen zu wollen. Diese Tools arbeiten dokumentenübergreifend, da sie sich nicht darum kümmern, was nach der Extraktion mit den Daten passiert. Der Kompromiss: weniger buchhaltungsspezifische Funktionen, aber ein Bruchteil der Kosten und keine Plattformbindung.

ToolMonatliche KostenEnthaltene SeitenAbgedeckte DokumententypenFranzösische Sprache / FormatZielgruppe
ImageToTable.ai Basic$9 (≈ €8,30)150 SeitenAlle: Rechnungen, Lieferscheine, Angebote, Quittungen, Kontoauszüge, BestellungenSemantische KI liest französische Felder in jedem Layout; versteht TVA-Aufteilungen, SIREN-Nummern, DatumsformateKleinstunternehmen mit 20-100 Belegen/Monat
ImageToTable.ai Pro$19 (≈ €17,50)400 SeitenAlle; plus berechnete Spalten (z. B. TVA-Berechnung aus Netto)Gleich; Regelformat für komplexe französische LogikKleinst-/KMU mit 50-300 Belegen/Monat
ImageToTable.ai Max$59 (≈ €54)1.500 SeitenAlle; plus Team-Freigabe, priorisierte VerarbeitungGleichKMU mit 200-1.000+ Belegen/Monat
Dext€24+Variiert je nach PlanRechnungen, Quittungen, KontoauszügeGute Erkennung französischer Quittungen und Rechnungen; Lieferantenregeln lernen mit der ZeitKleinst-/KMU mit vielen Belegen
Parseur$39+ (≈ €36)VariiertRechnungen, E-Mails, PDFs; vorlagenbasiert + GPT-ParsingFranzösische Vorlagenbibliothek verfügbar; GPT-basierte Extraktion verarbeitet französische FelderKMU, die E-Mail-zu-Daten-Automatisierung wünschen
Google Document AIPay-per-Use~$0,08–0,65/SeiteRechnungen, Quittungen, Formulare, PässeFranzösisches Sprachmodell verfügbar; Seitenpreise summieren sich schnellEntwickler, integrierte Workflows
Nanonets$499+5.000+ SeitenRechnungen, Quittungen, Bestellungen und benutzerdefinierte ModelleFranzösisches Modelltraining erfordert Beispieldokumente; Unternehmensqualität zum UnternehmenspreisKMU/Mittelstand mit 1.000+ Belegen/Monat und eigenem Kreditorenpersonal

Die Lücke zwischen ImageToTable.ai mit €8,30/Monat und Nanonets mit €499+/Monat ist der Bereich, in dem sich die meisten französischen Kleinst- und KMU bewegen. Die €490 Differenz erkauft Unternehmensfunktionen – ERP-Schnittstellen, Genehmigungsworkflows, dedizierten Support – die ein Unternehmen mit 100 Belegen pro Monat nicht braucht. Was es nicht erkauft, ist eine wesentlich bessere Extraktion bei französischen Dokumentformaten. Eine semantische KI liest „Montant TTC" auf einer französischen Rechnung bei €8,30 genauso wie bei €499. Für einen vollständigen Überblick über diese Preisstufen auf dem globalen Markt siehe den 2026 AI Document Extraction Pricing Hub.

Preis pro Dokument bei typischen monatlichen Volumen

Monatliche Abopreise sind irreführend, da die Anzahl der enthaltenen Seiten zwischen den Tools stark variiert. Ein 24€/Monat-Plan mit 100 Seiten und ein 17,50€/Monat-Plan mit 400 Seiten haben völlig unterschiedliche Kosten pro Dokument. Hier sehen Sie, was jedes Tool bei drei typischen französischen Geschäftsvolumen tatsächlich pro Dokument kostet.

Tool (Plan)50 Dok./Monat200 Dok./Monat500 Dok./Monat
ImageToTable.ai Basic0,17€/Dok.150-Seiten-Limit überschrittenN/V
ImageToTable.ai Pro0,35€/Dok.0,09€/Dok.400-Seiten-Limit überschritten
ImageToTable.ai Max1,08€/Dok.0,27€/Dok.0,11€/Dok.
Dext (24€-Plan, ~150 Seiten)0,48€/Dok.Seitenlimit überschrittenN/V
Parseur (39$-Plan, ~300 Dok.)0,72€/Dok.0,18€/Dok.Plan überschritten
Google Document AI3–33€13–130€33–325€
Nanonets10,00€/Dok.2,50€/Dok.1,00€/Dok.

Bei 200 Dokumenten pro Monat — einem typischen Volumen für eine PME mit 30 Mitarbeitern, ein kleines Buchhaltungsbüro oder eine wachsende TPE im Logistiksektor — liefert ImageToTable.ai Pro die Extraktion für 0,09€ pro Dokument. Dexts Einstiegsplan erreicht dieses Volumen nicht ohne Upgrade. Parseurs Kosten pro Dokument sind doppelt so hoch. Google Document AIs unberechenbare Preisgestaltung pro Seite erschwert die Budgetplanung für nicht-technische Nutzer. Und Nanonets kostet bei diesem Volumen 28x mehr pro Dokument bei vergleichbarer, nicht überlegener Extraktionsqualität.

Das wirtschaftliche Muster wiederholt sich über alle Volumenstufen hinweg: Die Tools mit transparenten Preisen und festen Seitenkontingenten liefern vorhersehbare Kosten pro Dokument für die Volumen, die französische TPE und PME tatsächlich verarbeiten. Die Tools, die „Verkauf kontaktieren" sagen oder pro Seite abrechnen, sind für Unternehmensbeschaffungsprozesse ausgelegt, bei denen Vorhersagbarkeit weniger zählt als Funktionen. Eine detaillierte Aufschlüsselung der Budget- vs. Enterprise-Preise im Extraktionsmarkt finden Sie im Ranking der günstigsten KI-Dokumentextraktions-Tools.

Französische Belegarten, die vorlagenbasierte Tools überfordern

Jedes Land hat Dokumenteigenheiten, die generische OCR-Tools, die auf US- oder UK-Layouts trainiert sind, falsch lesen. Frankreich hat mehr als die meisten.

Factur-X-Hybridrechnungen. Eine Factur-X-Datei ist ein PDF mit eingebettetem XML. Vorlagenbasierte OCR liest die visuelle PDF-Ebene und übersieht die strukturierte XML-Ebene völlig. Semantische Extraktion liest die visuelle Ebene, ist aber nicht darauf angewiesen – die KI verarbeitet, was sie sieht, nicht, was die Vorlage erwartet. Eine Factur-X-Rechnung eines Großkunden und ein flaches PDF eines lokalen Handwerkers landen ohne Konfiguration in denselben Spaltendefinitionen.

Rechnungen mit mehreren Mehrwertsteuersätzen. Französische Rechnungen teilen Positionen regelmäßig auf einer Seite auf drei MWSt-Sätze auf. Den Normalsatz (20 %, taux normal), den Zwischensatz (10 %, für Restaurants, Transport und bestimmte Renovierungsarbeiten) und den ermäßigten Satz (5,5 %, für Lebensmittel, Energie und Bücher). Vorlagen-OCR, die eine einzelne Spalte „Steuer“ ausgibt, kann nicht unterscheiden, welcher Betrag zu welchem Satz gehört – die CA3-MWSt-Erklärung verlangt jedoch jeden Satz in einer eigenen Zeile. Semantische Extraktion mit benannten Spalten („MWSt 20 %“, „MWSt 10 %“, „MWSt 5,5 %“) teilt die Beträge auf, indem sie die Satzbezeichnung neben jeder Position liest.

Lieferscheine ohne Standardkopfzeilen. Französische Lieferscheine von Baustoffhändlern (négociants en matériaux) wie Point.P und Chausson Matériaux lassen den Lieferantennamen oft aus der Kopfzeile weg und setzen ihn in einen kleinen Fußblock. Die Dokumentbezeichnung – „BON DE LIVRAISON“ – kann in Großbuchstaben, mittig auf der Seite, in einer Schriftart stehen, auf die die Vorlage nicht trainiert wurde. Eine Vorlage, die den Lieferantennamen in der Kopfzeile sucht, findet nichts. Semantische Extraktion liest den Seiteninhalt und lokalisiert den Lieferantennamen, wo immer er steht. Dies ist kein theoretischer Grenzfall – es ist das Standardformat eines der größten Baustoffhändler Frankreichs.

Handschriftliche Anmerkungen auf Angeboten. Ein französischer Handwerker sendet einem Kunden einen Kostenvoranschlag (devis), der Kunde schreibt „OK für 1500 €“ an den Rand und unterschreibt, und der Kostenvoranschlag wird zum Quasi-Vertrag. Die handschriftliche Notiz enthält den vereinbarten Preis, steht aber außerhalb der getippten Felder. Semantische Extraktion liest Handschrift – einschließlich der in der französischen Geschäftskorrespondenz üblichen Schreibschrift – und extrahiert sie zusammen mit den getippten Daten. Vorlagen-OCR überspringt den Rand völlig.

Für die TPE und PME, die diese Dokumente verarbeiten, ist das Problem „scheitert an französischen Formaten“ keine einmalige Einrichtungskosten. Es ist eine wiederkehrende Reibung, die sich mit jedem neuen Lieferanten, jeder neuen Belegart und jedem nicht standardgemäßen Format verstärkt. Dies ist der strukturelle Grund, warum semantische Extraktion bei der französischen Dokumentenmischung gewinnt: Sie muss nicht im Voraus wissen, wie das Dokument aussieht, um zu extrahieren, was das Dokument enthält.

JPG/PNG/PDF KI-Extraktion

Dateien werden sicher verarbeitet und nicht gespeichert. Testen Sie jeden Dokumententyp – ohne vorgegebene Grenzen für die Extraktion.

Für rechnungsbezogene Entscheidungen: Der Facture-Deep-Dive

Dieser Artikel behandelt den französischen Markt für Dokumentenextraktion über alle Dokumententypen hinweg. Wenn Ihr Hauptanliegen speziell die Rechnungsextraktion ist – der Facture-Workflow, TVA-Aufteilung, SIREN-Prüfung und die Kostenrechnung bei 20, 50 oder 120 Factures pro Monat – haben wir eine eigene Analyse: Budget-Rechnungsextraktion für französische TPE vor dem 2026-Mandat. Dieser Artikel geht detailliert auf die Preistabelle der Buchhaltungssoftware, die Pflichtfelder einer Rechnung und das Kostenmodell pro Rechnung ein – mit dem gleichen Detaillierungsgrad, aber fokussiert auf das Problem der Rechnungsextraktion.

Die Kernaussage ist in beiden Artikeln dieselbe: Der französische Markt für Dokumentenextraktion bietet Tools in jeder Preisklasse, aber die Tools, die die französische Dokumentenvielfalt bei TPE- und PME-Volumina tatsächlich bewältigen, sind genau die, die dafür bepreist sind. Ein Extraktionstool für 8,30 €/Monat und eine Enterprise-Plattform für 499 €/Monat lesen dieselbe französische Rechnung mit derselben KI-Klasse. Die 490 € Differenz finanzieren einen Enterprise-Vertriebszyklus, keine bessere Extraktion. Für die vergleichende Analyse des deutschen Marktes für Dokumentenextraktion siehe die Übersicht zur KMU-Dokumentenextraktion in Deutschland – dieselbe strukturelle Lücke zeigt sich mit anderen Softwarenamen und anderen Steuercodes.

FAQ

Können diese Tools Dokumente verarbeiten, die vollständig auf Französisch sind?

Ja. Semantische Extraktionstools wie ImageToTable.ai verarbeiten französischsprachige Dokumente nativ – die KI liest den französischen Text auf der Seite und ordnet ihn den von Ihnen definierten Spaltennamen zu. Feldnamen wie "Numéro Facture", "Montant TTC", "Date d'Échéance" und "Taux de TVA" werden nach Bedeutung gelesen und zugeordnet, nicht durch englischsprachiges Keyword-Training. Vorlagenbasierte Tools, die hauptsächlich mit englischsprachigen Rechnungslayouts trainiert wurden, erkennen möglicherweise gängige französische Begriffe, liefern aber bei weniger gebräuchlichen Feldnamen oder regionalen Formaten schlechtere Ergebnisse. Für beste Ergebnisse bei französischen Dokumenten testen Sie das Tool mit Ihrem eigenen Dokumentenmix, bevor Sie sich festlegen.

Was ist mit Dokumenten von der PPF oder einer PA?

Dokumente, die über die PPF (Portail Public de Facturation) oder eine PA (Plateforme Agréée) eingehen, liegen bereits in strukturiertem elektronischem Format vor – typischerweise Factur-X, UBL oder CII. Diese Formate enthalten maschinenlesbare Daten und erfordern keine Extraktion im herkömmlichen Sinne. Viele französische Unternehmen werden jedoch weiterhin PDF-Rechnungen von kleineren Lieferanten erhalten, die noch nicht zur Ausstellung von E-Rechnungen verpflichtet sind (die Frist 2027 für Kleinstunternehmen bedeutet, dass einige Lieferanten erst im letzten Moment umstellen). Die Extraktionsebene verarbeitet die PDFs und gescannten Dokumente, die den unstrukturierten Teil Ihres Dokumentenmixes ausmachen. Die strukturierten Rechnungen umgehen die Extraktion vollständig.

Kann ich diese Tools mit meiner bestehenden französischen Buchhaltungssoftware nutzen?

Ja. Jedes eigenständige Extraktionstool exportiert nach Excel (XLSX) oder CSV, was jede französische Buchhaltungssoftware – Pennylane, EBP, Sage, Cegid, Tiime, Indy – importieren kann. Sie definieren die Spalten einmal, das Tool extrahiert die Daten in diese Spalten, und die resultierende Tabelle wird in einem Schritt in Ihre Buchhaltungssoftware importiert. Der Workflow erfordert keine API-Integration oder Plattformmigration. Ihr bestehender Stack bleibt erhalten.

Welches Dokumentenvolumen rechtfertigt ein kostenpflichtiges Extraktionstool?

Der Break-even-Punkt hängt davon ab, wer die manuelle Eingabe vornimmt und welche Kosten anfallen. Bei 40 €/Stunde (typischer interner Assistentensatz in einem französischen Kleinstunternehmen) und 5 Minuten manueller Eingabe pro Dokument amortisiert sich das Basic-Abo für 8,30 €/Monat bereits ab etwa 8 Dokumenten pro Monat. Das Pro-Abo für 17,50 €/Monat amortisiert sich ab rund 13 Dokumenten. Wenn Ihr Buchhalter die Eingabe zu 60–70 €/Stunde übernimmt, sinkt die Gewinnschwelle auf 5–7 Dokumente. Unterhalb dieser Mengen ist die manuelle Eingabe günstiger als das Tool. Darüber hinaus spart das Tool jeden Monat bares Geld. Eine detaillierte Break-even-Berechnung für typische Rechnungsmengen französischer Kleinstunternehmen finden Sie im rechnungsspezifischen Leitfaden.

Sind diese Tools für französische Unternehmen DSGVO-konform?

ImageToTable.ai verarbeitet Dokumente im Arbeitsspeicher und speichert sie nach der Extraktion nicht. Da keine Dokumente gespeichert werden, besteht kein Risiko der Speicherung personenbezogener Daten im Sinne der DSGVO. Bei Tools, die Dokumente für Modelltraining oder Archivierung speichern, prüfen Sie bitte die Datenverarbeitungsvereinbarung des Anbieters und ob die Server in der EU stehen. Französische Unternehmen unter der Aufsicht der CNIL sollten sicherstellen, dass jedes von ihnen genutzte Extraktionstool die DSGVO-Anforderungen an die Datenverarbeitung erfüllt, insbesondere wenn die Dokumente personenbezogene Daten wie Kundennamen, Adressen oder SIREN-Nummern enthalten.

Der Markt für französische Dokumentenextraktion im Jahr 2026 ist gespalten zwischen Tools, die für TPE-Volumen bepreist sind, und Tools, die für Unternehmensbeschaffungszyklen ausgelegt sind. Der Qualitätsunterschied bei der Extraktion zwischen den beiden Stufen ist marginal. Der Kostenunterschied beträgt das 10- bis 50-fache. Bevor die E-Rechnungspflicht die Art und Weise, wie jedes französische Unternehmen Dokumente sendet und empfängt, neu gestaltet, ist das Extraktionsproblem, das bereits in Ihrem Posteingang liegt, zu einem Preis lösbar, der dem von Ihnen tatsächlich verarbeiteten Volumen entspricht.

📮 contact email: [email protected]