Kamera zu Tabelle mit einem Fingertipp
Der komplette Workflow
Das Foto, das du gerade von einem Beleg gemacht hast, bleibt stecken. Es lebt in deiner Handy-Galerie. Deine Tabelle lebt auf einem Computer. Dazwischen liegen sechs Schritte, die du nie wolltest – und die Hälfte davon verursacht Fehler, nicht Komfort. Hier ist der Workflow, der diese sechs Schritte auf einen reduziert.
Wichtige Erkenntnisse
- Ein Foto in Tabellendaten zu verwandeln, erfordert derzeit sechs Schritte – und bei zehn Dokumenten sind das sechzig Übergabepunkte, an denen Daten leise verloren gehen.
- Diese Kette existiert nicht, weil die Technologie es erfordert, sondern weil jedes Werkzeug darin – Kamera, E-Mail, OCR, Excel – für seine eigene Aufgabe gebaut wurde, ohne zu wissen, was das nächste Werkzeug braucht.
- Verkürze die Kette: Mach ein Foto, benenne deine Spalten, lade die Tabelle herunter. Die fünf mittleren Schritte verschwinden, wenn eine KI das Dokument liest und die Ausgabe schreibt.
Die Sechs-Schritte-Kette, die es nicht geben sollte
Die meisten Menschen verwandeln Papierdokumente noch genauso in Tabellendaten wie vor einem Jahrzehnt. Hier ist die Kette Schritt für Schritt:
Multiplizieren Sie diese Kette nun mit der Anzahl der Dokumente, die Sie pro Woche verarbeiten. Zehn Belege? Sechzig Schritte. Dreißig Rechnungen? Einhundertachtzig Schritte. Jeder Schritt ist klein. Zusammen ergeben sie einen beträchtlichen Teil Ihres Arbeitstages, der nichts mit Ihrer eigentlichen Aufgabe zu tun hat.
Die Kosten liegen nicht in einem einzelnen Schritt. Sie liegen in den Wechselkosten dazwischen – dem mentalen Kontextwechsel von Telefon zu E-Mail zu Desktop zu OCR zu Tabellenkalkulation, an jedem Punkt zersplittert Ihre Aufmerksamkeit und der Nachmittag verrinnt.
Wo jede Verbindung versagt
Für sich genommen wirkt keiner der sechs Schritte fehlerhaft. Doch jeder bringt eine spezifische Fehlerquelle mit sich, die sich verstärkt:
| Schritt | Was Sie tun | Was schiefgeht |
|---|---|---|
| Foto → Übertragung | Foto per E-Mail an sich selbst senden | Manche E-Mail-Programme komprimieren Bilder. Angekommen ist eine niedrigere Auflösung als aufgenommen – und unscharfe Dokumente liefern schlechtere OCR-Ergebnisse. |
| Übertragung → Download | E-Mail öffnen, Anhang herunterladen | Sie haben jetzt zwei Kopien: eine auf dem Handy, eine auf dem Rechner. Wenn Sie das Foto später neu aufnehmen, beginnt der Kreislauf von vorn. |
| Download → OCR | In einem Extraktionstool öffnen | Herkömmliche OCR gibt sämtlichen Text auf der Seite als einen Block aus. Sie wollen nicht „Geschäftsname: 7-Eleven, Adresse: Musterstraße 1, Kassierer: #4521“ – Sie wollen den Gesamtbetrag und das Datum. OCR kennt den Unterschied nicht. |
| OCR → Kopieren-Einfügen | Ergebnisse in Excel kopieren | Excel formatiert beim Einfügen automatisch um. Ein Datum wie „03/04“ wird vielleicht zum 4. März. Eine Belegnummer wie „001234“ wird zu „1234“. Ein negativer Betrag verliert sein Minuszeichen. Jede Änderung ist eine stille Verfälschung – Sie merken es erst beim Prüfen. |
| Kopieren-Einfügen → Bereinigen | Korrigieren und formatieren | Sie machen jetzt Dateneingabe mit Umwegen. Die Zeit, die Sie durch OCR gespart haben, geht für die Nachbearbeitung drauf. |
Diese Fehler haben eine gemeinsame Ursache: Jedes Werkzeug in der Kette wurde für seine eigene Aufgabe entwickelt, nicht dafür, ein Foto in eine Tabelle zu verwandeln. Die Kamera macht Fotos. E-Mail übermittelt Nachrichten. OCR liest Text. Keines weiß, was das nächste Werkzeug braucht. Jede Übergabe ist eine Nahtstelle, an der Daten verloren gehen.
Deshalb sind Reddit-Threads voll von Nutzern, die Excels Funktion „Daten aus Bild“ aufgegeben haben, weil sie endlos hängt oder in ihrer Office-Version nicht verfügbar ist. Die Funktion existiert, aber wenn Sie sich darauf verlassen, sind Sie nur einen Microsoft-Serverausfall davon entfernt, gar keinen Workflow mehr zu haben – und selbst wenn sie funktioniert, verarbeitet sie nur starre Tabellen, nicht die freien Dokumente, mit denen die meisten Menschen tatsächlich arbeiten.
Ein Tipp: Vom Foto zur Tabelle
Der alternative Weg ist einfacher – nicht weil er eine bessere Version derselben Kette wäre, sondern weil er die Kette komplett auflöst. So sieht der neue Workflow aus:
Foto machen
Einfach mit der Handykamera abfotografieren. Keine Spezial-App, kein bestimmter Winkel. Nur ein klares Bild des Dokuments.
Spalten benennen
Browser öffnen, Foto hochladen und die gewünschten Spaltennamen eingeben – „Datum", „Betrag", „Anbieter".
Tabelle herunterladen
KI extrahiert passende Daten in eine strukturierte Excel- oder CSV-Datei. Ein Klick zum Download. Sofort einsatzbereit.
Das war's. Das Foto verlässt nie Ihr Handy – keine E-Mail, kein Kabel, kein Cloud-Ordner als Zwischenstation. Der Upload erfolgt direkt über den Browser. Das Ergebnis ist bereits eine Tabelle, kein Textblock, der manuell aufbereitet werden muss.
Der Zeitgewinn ist messbar. Ein einzelnes Dokument manuell erfassen – jedes Feld lesen, in die richtige Zelle tippen, auf Tippfehler prüfen – dauert bei einer typischen Quittung oder einem Formular durchschnittlich etwa 3 Minuten. Der Drei-Schritte-Weg vom Foto zur Tabelle erfordert 5 bis 10 Sekunden Ihrer Aufmerksamkeit, abgesehen von den wenigen Sekunden, die die KI im Hintergrund rechnet. Bei 10 Belegen sind das 30 Minuten gegenüber weniger als einer Minute Ihrer Zeit.
Du bestimmst die Ausgabe. Die KI liest das Dokument.
Was den neuen Workflow ermöglicht, ist ein grundlegender Wandel in der Extraktionslogik. Herkömmliche OCR erfasst alles auf der Seite und gibt es als Textwüste aus – aus der du dann die ein oder zwei Felder mühsam heraussuchen musst, die dich wirklich interessieren. Der Kernmechanismus hier ist ein anderer: Benutzerdefinierte Spaltenextraktion.
So funktioniert's: Statt dass das Tool entscheidet, was extrahiert wird, sagst du es ihm. Du gibst die gewünschten Spaltennamen ein – „Belegsumme", „Transaktionsdatum", „Lieferantenname" – und die KI findet die passenden Daten in jedem Dokument, indem sie versteht, was jedes Feld bedeutet, nicht wo es steht. Eine „Summe" auf einem Beleg kann rechts unten fett gedruckt sein; auf einem anderen in der Seitenmitte neben einer Beschriftung. Die Position spielt keine Rolle. Die Bedeutung schon.
Das ist der Unterschied zwischen positionsbasierter Extraktion (ein Feld mit einem Rahmen markieren und hoffen, dass das nächste Dokument es an derselben Stelle hat) und intentionsbasierter Extraktion (der KI sagen, wonach du suchst, und sie findet es, egal wo es auftaucht). Keine Vorlagen, die gewartet werden müssen. Keine lieferantenspezifische Konfiguration. Wenn ein Lieferant morgen sein Beleglayout ändert, bricht nichts zusammen – denn das Layout war nie Teil der Gleichung.
Das bedeutet auch, dass das Tool Dokumente verarbeitet, mit denen herkömmliche OCR und Tabellenerfassungs-Apps überfordert sind. Ein handgeschriebener Notizzettel mit einem Betrag in der Ecke. Ein Screenshot einer Online-Bestellbestätigung. Ein Formular, dessen Felder verstreut auf der Seite liegen statt in einem Raster. Die KI liest das Dokument wie ein Mensch – durch inhaltliches Verständnis, nicht durch Pixelzählen.
Ein Rundgang: Vom Foto zur Excel-Tabelle in unter einer Minute
So sieht die tatsächliche Oberfläche aus – vom Öffnen der Seite bis zum Herunterladen deiner Tabelle.
Dateien werden sicher verarbeitet und nicht gespeichert.
Du landest auf der Seite. Keine Anmeldung nötig. Der Upload-Bereich ist in der Mitte – tippe darauf, um ein Foto aus deiner Galerie auszuwählen oder direkt mit der Kamera aufzunehmen. Die Datei wird in Sekunden hochgeladen.
Unter dem Upload-Bereich befindet sich die Spalteneingabe. Hier gibst du ein, was du brauchst: „Datum", „Betrag", „Lieferant". Jeder Spaltenname wird zu einer Spaltenüberschrift in deiner finalen Tabelle. Du kannst beliebig viele Spalten hinzufügen. Wenn du dir unsicher bist, was extrahiert werden soll, kann das Tool das Dokument lesen und automatisch Spaltennamen vorschlagen.
Sobald Sie Ihre Spalten benannt haben, tippen Sie auf den Verarbeitungsbutton. Die KI liest Ihr Dokument, findet die Werte, die zu jedem Spaltennamen passen, und setzt das Ergebnis zusammen. Wenige Sekunden später sehen Sie eine Tabelle auf dem Bildschirm – jede Zeile ist ein Dokument, jede Spalte eines der von Ihnen angefragten Felder. Tippen Sie auf „Herunterladen“, und Sie erhalten eine sofort nutzbare Excel-Datei.
Kein Schritt dieses Prozesses erfordert einen Desktop-Computer. Kein Schritt erfordert die Installation einer App. Alles geschieht im Browser Ihres Telefons, in einer einzigen Sitzung, ohne dass Daten zurückbleiben.
Jedes Dokument. Jedes Format. Jede Situation.
Der Workflow ist nicht an einen bestimmten Dokumenttyp gebunden. Da die KI Dokumente semantisch liest – Inhalte versteht, statt einer Vorlage zu folgen – funktioniert sie mit Formaten, die im alten Ansatz jeweils ein eigenes Werkzeug erfordern würden:
Quittungen
Restaurantrechnungen, Tankstellenbelege, Online-Bestellbestätigungen. Ein Handwerker, der 20 Quittungen von verschiedenen Baumärkten und Lieferanten verarbeitet, kann sie alle in eine einzige Tabelle packen – jede Quittung mit eigenem Layout, alle gleich verarbeitet.
Handschriftliche Formulare
Prüflisten, Anwesenheitslisten, Feldberichte auf Durchschlagpapier. Handschrift, mit der herkömmliche OCR kämpft, wird extrahierbar, weil die KI das Dokument ganzheitlich liest – mit visuellem Kontext, nicht nur Zeichenerkennung.
Ausweise & Screenshots
Ein Foto des Führerscheins. Ein Screenshot einer Zahlungsbestätigung. Ein LinkedIn-Profil als Bild. Jedes Bild, das Daten enthält, die Sie in strukturierter Form benötigen.
Gescannte Dokumente & PDFs
Mehrseitige PDFs, gescannte Verträge, altes Schriftgut vom Flachbettscanner. Der Workflow behandelt sie genauso wie Fotos – kein Unterschied in der Verarbeitung.
Für Szenarien, in denen mehrere Personen Dokumente für eine einzige Tabelle einreichen müssen – Spesenabrechnungen von Teammitgliedern, Stundenzettel von Außendienstmitarbeitern, Rechnungen von Lieferanten – gibt es eine zusätzliche Ebene: einen Sammellink. Er generiert eine einfache URL, die Sie teilen können. Empfänger öffnen sie, geben einen kurzen Verifizierungscode ein und laden ihre Dokumente direkt hoch. Die Dateien landen automatisch in Ihrer Verarbeitungswarteschlange. Sie müssen nie ein Konto erstellen. Der vollständige Workflow ist in unserem Leitfaden zur Felddatenerfassung mit Foto-zu-Excel beschrieben.
FAQ
Wie genau ist die Extraktion aus einem Handyfoto?
Bei gedrucktem Text auf einem einigermaßen klaren Foto – gerade aufgenommen bei gutem Licht – liegt die Genauigkeit bei bis zu 99 %. Handschrift ist weniger genau, typischerweise zwischen 85 und 92 %, und hängt stark von der Leserlichkeit ab. Ein Foto aus einem steilen Winkel, bei schlechtem Licht oder mit starken Schatten verringert die Genauigkeit. Die besten Ergebnisse erzielen Sie, wenn Sie Ihr Handy direkt über das Dokument halten und für gleichmäßiges Licht sorgen. Keine spezielle Ausrüstung nötig – nur eine ruhige Hand.
Muss ich eine spezielle App installieren?
Nein. Der gesamte Arbeitsablauf läuft im Browser Ihres Handys – Chrome, Safari, Firefox, jeder moderne Browser funktioniert. Es gibt keine App zum Herunterladen und keine Software, die Sie auf Ihrem Desktop installieren müssen. Dies ist einer der Hauptunterschiede zu Tools wie Excel „Daten aus Bild", die die Microsoft 365 Mobile App und ein kostenpflichtiges Abonnement erfordern.
Was ist, wenn mein Dokument kein Tabellenlayout hat?
Genau darum geht es. Die meisten Dokumentextraktionstools, einschließlich Excels integrierter Bild-zu-Tabelle-Funktion, sind für Daten ausgelegt, die bereits in Zeilen und Spalten angeordnet sind – gedruckte Tabellen, Preislisten, strukturierte Raster. Die benutzerdefinierte Spaltenextraktion funktioniert bei Freiformdokumenten: einer Quittung, bei der die Summe in der Ecke und das Datum oben steht, einem Formular, bei dem Felder über die Seite verstreut sind. Die KI liest das Dokument semantisch, nicht geometrisch.
Wie viele Dokumente kann ich auf einmal verarbeiten?
Sie können mehrere Dateien in einem einzigen Batch hochladen und verarbeiten – 10 Quittungen, 30 Rechnungen, 50 Formulare – und erhalten eine zusammengeführte Excel-Datei mit einer Zeile pro Dokument. Dies ist der Batch-Verarbeitungsmodus. Kostenlose Gast-Uploads haben tägliche und dateibasierte Obergrenzen; registrierte Benutzer haben je nach Tarif höhere Limits.
Was passiert mit meinen Dokumenten nach der Verarbeitung?
Hochgeladene Dateien werden verarbeitet und anschließend automatisch vom Server gelöscht. Das Tool speichert oder behält Ihre Dokumente nicht. Die Ausgabetabelle gehört Ihnen zum Herunterladen und Behalten – nichts bleibt danach auf dem Server zurück.
Funktioniert das auch für Dokumente in anderen Sprachen als Englisch?
Ja. Die KI liest Dokumente in mehreren Sprachen, darunter Japanisch, Deutsch, Französisch, Spanisch, Portugiesisch und Koreanisch. Spaltennamen sollten in der Sprache verfasst sein, die Sie abgleichen möchten – wenn Ihr Dokument auf Deutsch ist und Sie nach „Rechnungsbetrag" suchen, benennen Sie diese Spalte auf Deutsch.
Kann ich das auch nutzen, um Daten aus einem Screenshot statt einem Foto zu extrahieren?
Ja. Screenshots funktionieren genauso wie Fotos – ein Screenshot einer Webseite, eines auf Ihrem Bildschirm geöffneten PDFs oder einer App-Bestätigungsseite kann im selben Arbeitsablauf hochgeladen und verarbeitet werden. Das Tool unterscheidet nicht zwischen einem Kamerafoto und einer Bildschirmaufnahme.
Die sechsstufige Kette von der Kamera zur Tabelle ist keine Anforderung der Technologie – sie ist eine Anforderung einer Toolchain, in der keine zwei Tools miteinander kommunizieren. Wenn dieselbe KI, die das Dokument liest, auch die Tabelle schreibt, verschwinden diese fünf Zwischenschritte. Übrig bleibt: zeigen, benennen, herunterladen.
Das Foto, das gerade in Ihrer Galerie liegt – der Beleg, das Formular, der Screenshot, den Sie später bearbeiten wollten – genau dort beginnt die sechsstufige Kette. Probieren Sie stattdessen die Drei-Schritte-Version. Sie wissen innerhalb einer Minute, ob sie für Ihre Dokumente funktioniert.