Radiologie- & Entlassungsberichte extrahieren
für klinische Audits

Die meisten Krankenhaus-KIS können einen Radiologie- oder Entlassungsbericht in unter zehn Sekunden als PDF exportieren. Was sie nicht können – und was fast kein klinisches Informationssystem kann – ist, die darin enthaltenen Daten als strukturierte Felder zu exportieren. Untersuchungsart, ICD-10-Code, Befundtext, Entlassungsmedikation: alles auf der Seite vorhanden, für Menschen lesbar, aber ohne manuelles Öffnen und Abtippen nicht als diskrete Datenpunkte extrahierbar. Diese Lücke – zwischen „Die Daten existieren" und „Die Daten sind nutzbar" – ist der Grund, warum klinische Registerabstraktion, Qualitätsaudits und Forschungsdatenerfassung hunderte Stunden verschlingen, die in keinem Budgetposten vorgesehen sind.

Schluss mit Abtippen — lassen Sie KI Ihre Dokumente lesen

Bild oder PDF hochladen — strukturierte Daten in 10 Sekunden

Jetzt testen →

Keine Anmeldung · Keine Kreditkarte · Ergebnis in 10 Sekunden

Strukturierte klinische Daten aus Radiologie- und Entlassungsberichten in eine Excel-Tabelle extrahieren

Wichtige Erkenntnisse

Ein einzelner Fall aus einem klinischen Register erfordert 20 bis 30 Minuten manuelle Datenextraktion aus der Patientenakte – und fast die gesamte Zeit wird damit verbracht, Felder wie Untersuchungsart und ICD-10-Diagnosecode neu einzutippen, die bereits im PDF sichtbar sind.
EHRs (elektronische Patientenakten) exportieren radiologische und Entlassungsberichte als narrative PDFs, die Menschen lesen, aber keine Krankenhausdatenbank abfragen kann – die Daten sind digital, aber in Prosa eingeschlossen, und keine noch so hohe Tippgeschwindigkeit schließt diese strukturelle Lücke.
Definieren Sie einmal zehn Spaltennamen – Untersuchungsart, Befund, Entlassungsmedikation – laden Sie hunderte PDFs hoch, und ImageToTable.ai befüllt eine Tabelle, indem es nach Bedeutung statt nach Seitenposition liest und so aus einer 30-minütigen Transkription einen 30-sekündigen Prüfscan macht.

Zwei Dokumenttypen, ein Extraktionsproblem

Radiologieberichte und Entlassungsbriefe stehen an entgegengesetzten Enden eines Krankenhausaufenthalts – der eine hält einen diagnostischen Moment fest, der andere fasst den gesamten Aufenthalt zusammen – doch sie teilen dasselbe Problem der Datenzugänglichkeit. Beide werden als narrative Dokumente erstellt. Beide enthalten Felder, die klinische Register, Forschungsdatenbanken und Qualitätsaudits als strukturierte Werte benötigen. Und in den meisten Krankenhaussystemen verlassen beide die KIS als PDFs, ohne dass diese Struktur erhalten bleibt.

Ein Radiologiebericht folgt einer bemerkenswert konsistenten internen Architektur. Der Practice Parameter for Communication of Diagnostic Imaging Findings des American College of Radiology (ACR) definiert fünf Standardabschnitte: klinische Indikation (warum die Untersuchung angeordnet wurde), Technik (Modalität, Kontrastmittel, Bildgebungsparameter), Vergleich (mit Voraufnahmen), Befund (die detaillierte Beschreibung des Beobachteten) und Beurteilung (die prägnante diagnostische Schlussfolgerung). Das Breast Imaging Reporting and Data System (BI-RADS) – weithin als Goldstandard der strukturierten Befundung angesehen – zeigt, was passiert, wenn jeder dieser Abschnitte auf diskrete, abfragbare Felder abgebildet wird. Doch BI-RADS ist die Ausnahme. Die meisten Radiologieberichte sind Freitextdiktate, die diese Abschnitte inkonsistent oder gar nicht verwenden, sodass die Daten in Prosa gefangen bleiben.

Ein Entlassungsbericht folgt einer anderen, aber ebenso vorhersehbaren Vorlage. Die Joint Commission schreibt mit Standard RC.02.04.01 sechs Kernbestandteile vor: Grund des Krankenhausaufenthalts, wesentliche Befunde, durchgeführte Eingriffe und Behandlungen, Zustand des Patienten bei Entlassung, Entlassungsmedikation und Nachsorgeanweisungen. Die Centers for Medicare & Medicaid Services fügen unter der Bedingung der Teilnahme an der Entlassungsplanung eigene Anforderungen hinzu. Jedes akkreditierte Krankenhaus erstellt Entlassungsberichte, die diese Elemente enthalten. Das Format – welche Felder beschriftet sind, welche im Freitext eingebettet sind, ob Diagnosen mit ICD-Codes oder in Klartext erscheinen – variiert jedoch stark zwischen Krankenhäusern und sogar zwischen Abteilungen desselben Krankenhauses.

Beide Dokumenttypen folgen einer bekannten Struktur. Keiner der beiden Typen stellt diese Struktur als extrahierbare Daten bereit. Das Ergebnis ist ein Arbeitsablauf, bei dem klinische Datenerfasser, Studienkoordinatoren und Qualitätsverbesserungsspezialisten ihre Zeit damit verbringen, PDFs zu lesen und Werte in Tabellen zu kopieren – eine Arbeit, die nichts mit klinischem Urteilsvermögen zu tun hat, sondern alles mit einer Formatlücke, die die EHR-Branche nicht geschlossen hat.

Was aus einem Radiologiebericht extrahiert werden sollte

Ein Radiologiebericht enthält mehr Text, als die meisten annehmen. Ein typisches CT-Thorax mit Kontrastmittel erzeugt einen Bericht über mehrere Absätze, aber die Felder, die Sie tatsächlich für ein Register oder Audit benötigen, passen in etwa zehn Spalten. Der Rest – der Name des durchführenden Technologen, die Strahlendosisdetails, der Diktatzeitstempel – sind Kontextinformationen, die das PDF behalten kann.

Die zehn Felder, die sich zu extrahieren lohnen, und warum jedes wichtig ist:

Feld	Was es erfasst	Warum extrahieren
Untersuchungsart	CT, MRT, Röntgen, Ultraschall, Nuklearmedizin	Register-Einschlusskriterien filtern oft nach Modalität
Körperregion	Thorax, Gehirn, Abdomen, Extremität, Wirbelsäule	Organisiert Kohorte nach anatomischer Region für Subgruppenanalyse
Klinische Indikation	Grund der Untersuchung (z. B. „Ausschluss Lungenembolie“)	Bestätigt Übereinstimmung der Studie mit Register-Einschlusskriterien
Technik	Kontrastmittelgabe, Schichtdicke, spezifische Sequenzen	Standardisierung der Technik über Fälle hinweg für vergleichende Analysen
Befunde	Vollständiger Bericht – die detaillierten Beobachtungen des Radiologen	Primärquelle für klinische Ereignisbeurteilung und NLP-Analyse
Beurteilung	Prägnante diagnostische Zusammenfassung (1–4 Zeilen)	Schnellster Weg zur Fallklassifikation; oft der einzige gelesene Abschnitt
Radiologe	Name des Befundenden	Interrater-Reliabilitäts-Tracking, arztbezogene Qualitätssicherung
Überweiser	Anfordernder Kliniker	Analyse von Überweisungsmustern, abteilungsbezogene Nutzungskennzahlen
Untersuchungsdatum	Zeitpunkt der Bildgebung	Zeitliche Verankerung für alle Verlaufsanalysen
Befunddatum	Zeitpunkt der Befundfreigabe	Kennzahlen zur Bearbeitungszeit; Analyse des Intervalls Befund–Maßnahme

Das Feld „Befund“ verdient besondere Aufmerksamkeit. Mit 200–500 Wörtern in einem typischen Bericht ist es zu lang, um es neu zu tippen, und zu informationsdicht, um es zu ignorieren. Es ist das Feld, in dem sowohl „Konsolidierung im rechten Unterlappen“ als auch „kein Hinweis auf Lungenembolie“ vorkommen – gegensätzliche Schlussfolgerungen, die ein checkboxbasiertes Abstraktionsformular auf ein einziges „abnormal“-Flag reduzieren würde, wodurch die Spezifität verloren ginge, die die Daten für die Forschung nützlich macht. Die Extraktion des vollständigen Fließtexts bewahrt diese Granularität. Filtern und Kodieren kann später erfolgen; was in der Extraktionsphase zählt, ist, dass nichts vorzeitig zusammengefasst wird.

Was aus einem Entlassungsbrief extrahiert werden sollte

Während radiologische Befunde strukturierte Erzählungen sind, sind Entlassungsbriefe semi-strukturierte Hybride – eine Mischung aus diskreten Feldern (Aufnahmedatum, Entlassungsdatum) und Freitextabschnitten (Krankenhausverlauf, Entlassungsanweisungen). Diese Hybridnatur macht die manuelle Abstraktion so zeitaufwendig. Die diskreten Felder sind leicht zu finden, aber mühsam einzutippen. Die Freitextabschnitte erfordern Leseverständnis, um die spezifischen Werte zu lokalisieren – eine Diagnose, die in Absatz drei versteckt ist, eine Medikamentenänderung, die in Absatz fünf beschrieben wird.

Die zehn Felder, die für die Registerabstraktion, Forschung und Prüfung relevant sind:

Feld	Was es erfasst	Warum es extrahieren
Patienten-MRN	Krankenaktennummer	Eindeutige Patienten-ID für Deduplizierung und Längsschnittverfolgung
Aufnahmedatum	Datum der Krankenhausaufnahme	Indexereignis-Datum für die Register-Zeitnull-Berechnung
Entlassungsdatum	Datum der Krankenhausentlassung	Endpunkt für Berechnungen von Aufenthaltsdauer und Wiederaufnahmefenster
Aufenthaltsdauer	Entlassungsdatum − Aufnahmedatum in Tagen	Kernqualitätskennzahl; kann aus den beiden obigen Daten berechnet werden
Primärer ICD-10-Code	Hauptdiagnose (z. B. I21.4 für NSTEMI)	Primäres Einschluss-/Ausschlusskriterium für die meisten Register
Sekundäre ICD-10-Codes	Komorbiditäten und Nebendiagnosen	Risikoadjustierung, Komorbiditäts-Scoring (Charlson, Elixhauser)
CPT-Prozedurencodes	Während des Aufenthalts durchgeführte Prozeduren	Aufnahme in prozedurenbasierte Register, Kostenanalyse
Entlassungsmedikation	Wirkstoff, Dosis, Häufigkeit, Dauer	Kernqualitätsindikator für AMI-, Herzinsuffizienz- und Schlaganfallregister
Nachsorgetermine	Geplante Nachsorge mit Fachrichtung, Datum, Ort	Qualitätsmetrik für Versorgungsübergänge; Risikofaktor für Wiederaufnahme
Entlassender Arzt	Behandelnder Arzt bei Entlassung	Leistungserbringer-Zuordnung für Qualitätsberichte

Entlassungsmedikamente sind durchgängig das am schwierigsten manuell zu abstrahierende Feld – nicht weil die Informationen schwer zu finden sind, sondern weil sie vier Unterfelder (Wirkstoff, Dosis, Häufigkeit, Dauer) enthalten, die oft in einem einzigen Textabsatz erscheinen. Ein Medikationsabgleichsabschnitt könnte "Metoprololsuccinat 50 mg p.o. täglich, zu Hause fortsetzen" in einer Zeile und "Apixaban 5 mg p.o. 2x tägl. für 30 Tage, dann 2,5 mg 2x tägl. danach" in der nächsten auflisten. Der Abstraktor muss jede Zeile in Komponentenfelder parsen, bevor er sie in das Register eingibt – was effektiv Dateneingabe und Datennormalisierung gleichzeitig bedeutet.

Schluss mit Abtippen — lassen Sie KI Ihre Dokumente lesen

Bild oder PDF hochladen — strukturierte Daten in 10 Sekunden

Jetzt testen →

Keine Anmeldung · Keine Kreditkarte · Ergebnis in 10 Sekunden

Schritt für Schritt: Vom PDF-Export zur strukturierten Tabelle

Der Workflow, der die manuelle Abstraktion ersetzt, besteht aus vier Phasen. Keine erfordert Programmierung, IT-Bereitstellung oder EHR-Integration. Die Eingabe ist ein Satz von PDFs, die aus dem Krankenhausinformationssystem exportiert wurden. Die Ausgabe ist eine Excel-Tabelle mit einer Zeile pro Dokument und einer Spalte pro Feld.

Berichte aus dem KIS als PDFs exportieren

Die meisten Krankenhaus-KIS – Epic, Cerner, Meditech – bieten eine Export-zu-PDF-Option für Radiologieberichte und Entlassungsbriefe. Wählen Sie die Fälle aus, die Sie für Ihr Audit oder Register benötigen, exportieren Sie sie und sammeln Sie die PDFs in einem Ordner. Ein Registerabstraktionsprojekt kann 50 bis 500 Berichte umfassen. Ein Forschungsprojekt eines Assistenzarztes vielleicht 30. Der Extraktionsworkflow verarbeitet beide Größenordnungen auf die gleiche Weise.

Definieren Sie die benötigten Spalten

Dies ist der Kern des Prozesses – und der Schritt, der die semantische Extraktion von der vorlagenbasierten OCR unterscheidet. Statt Rechtecke um jedes Feld auf einer Beispielseite zu zeichnen, geben Sie die Spaltennamen ein, die für Ihr Projekt relevant sind. Für ein Radiologie-Audit könnten das sein: Untersuchungsdatum, Untersuchungsart, Körperregion, Befund. Für eine entlassungsbasierte Registerabstraktion: Patienten-ID, Aufnahmedatum, Entlassdatum, Primäre ICD-10, CPT-Prozeduren, Entlassmedikation. Die KI liest jedes hochgeladene Dokument, versteht semantisch, was jede Feldbezeichnung bedeutet, und findet den entsprechenden Wert – unabhängig davon, wo er auf der Seite steht oder wie er formuliert ist. Sie können die Spaltennamen auch leer lassen und die KI den Dokumentinhalt automatisch erkennen lassen – nützlich für eine erste Durchsicht, wenn Sie noch nicht sicher sind, welche Felder in allen Berichten durchgängig verfügbar sind.

Hochladen und von der KI extrahieren lassen

Laden Sie alle PDFs in einem Batch hoch – 20 Radiologieberichte, 50 Entlassungsbriefe oder eine Mischung aus beidem. Jedes Dokument wird unabhängig verarbeitet. Die KI ordnet die gefundenen Werte den von Ihnen definierten Spalten zu. Ein Bericht aus Krankenhaus A, der die Untersuchungsart als "CT Thorax mit KM" bezeichnet, und ein Bericht aus Krankenhaus B, der sie "Computertomographie – Thorax" nennt, landen beide in derselben Spalte "Untersuchungsart" – weil die KI versteht, dass es sich um dasselbe Konzept handelt, nicht weil sie denselben Textstring erkennen. Das Ergebnis ist eine einzige Tabelle mit einheitlichen Spalten über alle Quelldokumente hinweg.

Kritische Felder prüfen, dann exportieren

Keine Extraktions-Pipeline – automatisiert oder manuell – sollte bei klinischen Daten auf eine Verifikationsrunde verzichten. Der Prüfaufwand ist jedoch weit geringer als eine vollständige manuelle Abstraktion. Statt jedes Feld zu lesen und jeden Wert einzutippen, scannen Sie die Tabelle gegen die Original-PDFs und stichprobenartig: Ist der primäre ICD-10-Code korrekt? Sind die Entlassungsdaten richtig? Wirken die Medikationslisten vollständig? Die Verifikation dauert typischerweise 30 bis 60 Sekunden pro Fall – im Vergleich zu den 20 bis 30 Minuten, die eine vollständige manuelle Chart-Abstraktion erfordert. Die KI übernimmt die Transkription; Ihre Rolle wechselt von der Dateneingabe zur Qualitätssicherung.

Ein erwähnenswertes Verhalten der Tabelle: Wenn Sie eine Mischung aus Radiologieberichten und Entlassungsbriefen im selben Batch hochladen, repräsentiert jede Zeile in der Ausgabe ein Dokument. Ein Radiologiebericht enthält Werte in Spalten wie "Untersuchungsart" und "Beurteilung", aber leere Zellen unter "Entlassungsmedikation" und "Nachsorgetermine". Ein Entlassungsbrief zeigt das Gegenteil. Dies ist korrektes Verhalten – die Tabelle ist eine Vereinigung aller von Ihnen definierten Spalten, und jedes Dokument füllt die für seinen Typ relevanten Spalten. Für Projekte, die beide Dokumenttypen benötigen, wird die einzelne Tabelle automatisch zu einer Master-Datentabelle, in der Sie nach Dokumenttyp filtern können, um nur Radiologie- oder nur Entlassungsdatensätze zu isolieren.

Vier klinische Anwendungsfälle, bei denen Extraktion das Tippen ersetzt

Der oben beschriebene Workflow ist nicht theoretisch. Er deckt direkt die häufigsten Szenarien ab, in denen klinische Datenerfasser Stunden damit verbringen, Daten aus narrativen Berichten in strukturierte Datenbanken zu übertragen.

Klinische Registerabstraktion (STS, GWTG, NCDR)

Die Nationale Datenbank der Society of Thoracic Surgeons (STS), das NCDR des American College of Cardiology (einschließlich der Module CathPCI, Chest Pain-MI und AFib) sowie das Programm Get With The Guidelines (GWTG) der American Heart Association erfordern alle diskrete Datenelemente, die aus Patientenakten abstrahiert werden. Ein einzelner CathPCI-Fall kann über 150 Datenpunkte erfordern. Ein einzelner GWTG-Schlaganfall-Fall kann über 80 erfordern. Diese Datenpunkte sind über Aufnahmebefunde, Eingriffsberichte, Entlassungsbriefe und Bildgebungsbefunde verstreut – und die Aufgabe des Abstrakteurs besteht darin, jeden einzelnen in einem PDF zu finden und in die Datenerfassungsoberfläche des Registers einzutippen.

Die Extraktion eliminiert den Abstraktionsworkflow nicht – einige Registerfelder erfordern klinisches Urteilsvermögen, das nur ein geschulter Abstrakteur liefern kann. Sie eliminiert jedoch den Transkriptionsschritt für die Felder, die wörtlich in radiologischen und Entlassungsberichten erscheinen: Untersuchungsdaten, ICD-10-Codes, Verfahrensnamen, Medikamentenlisten. Der Abstrakteur beginnt mit einer vorausgefüllten Tabelle mit diesen Werten und fügt dann die urteilsabhängigen Felder hinzu. Der Unterschied zwischen der Extraktion von 80 Feldern von Grund auf und der Extraktion von 30 Feldern, nachdem 50 automatisch ausgefüllt wurden, ist der Unterschied zwischen einem Durchsatz von 3 Fällen pro Tag und 8.

Qualitätsverbesserungs-Audits

Qualitätsabteilungen von Krankenhäusern ziehen routinemäßig Patientenakten für gezielte Audits heran – etwa zur Einhaltung der Tür-Ballon-Zeit, zu Medikamentenabgleichsraten bei Entlassung oder zu Anwendungskriterien für bildgebende Verfahren. Jedes Audit beginnt mit einer Fallliste und endet mit einer Tabelle; dazwischen liegt die manuelle Aktenprüfung. Bei einem Audit von 100 radiologischen Befunden, das prüft, ob die klinische Indikation vor der Kontrastmittelgabe dokumentiert wurde, verwandelt das Extrahieren des Felds „Klinische Indikation“ aus jedem PDF in eine einzelne Spalte einen halben Tag Lesezeit in fünf Minuten Scan einer Tabellenspalte.

Das Royal College of Radiologists unterhält eine Bibliothek mit über 100 radiologischen Auditvorlagen, die jeweils festlegen, welche Datenpunkte erhoben werden müssen. Die meisten dieser Elemente – Untersuchungsart, Wartezeit, Befundbearbeitungszeit, Einhaltung von Befundstandards – liegen in radiologischen Befunden als diskrete Felder vor. Werden sie vor Beginn der Auditanalyse in eine Tabelle extrahiert, verkürzt sich die Datenerhebungsphase eines Auditzyklus, die RCR-Vorlagen typischerweise auf mehrere Wochen Teilzeitarbeit veranschlagen, erheblich.

Fallidentifikation für klinische Forschung

Ein Studienkoordinator, der eine Kohorte für eine retrospektive Studie aufbaut, muss Entlassungsbriefe auf spezifische Einschlusskriterien prüfen: eine Hauptdiagnose einer akut dekompensierten Herzinsuffizienz, eine Aufenthaltsdauer von mehr als 48 Stunden und eine Entlassungsmedikation, die einen Betablocker enthält. Bei manueller Prüfung bedeutet dies, jede PDF zu öffnen, die relevanten Felder zu suchen und für jedes Kriterium eine Ja/Nein-Entscheidung zu notieren. Mit einer Extraktion liegen die ICD-10-Codes, die Aufenthaltsdauer und die Medikamentenliste bereits in einer Tabelle vor – der Koordinator prüft durch Sortieren und Filtern, nicht durch Lesen.

Der Effizienzgewinn betrifft nicht nur die Zeit, sondern auch die Vollständigkeit. Eine manuelle Durchsicht von 200 Patientenakten übersieht zwangsläufig Fälle, in denen das Qualifikationskriterium anders formuliert ist als erwartet – „CHF-Exazerbation" statt „akut dekompensierte Herzinsuffizienz" oder „Metoprolol" unter „Hausmedikation" statt unter „Entlassungsmedikation". Eine KI, die das gesamte Dokument semantisch liest, erfasst diese Varianten, indem sie deren Bedeutung versteht, nicht indem sie Zeichenketten abgleicht. Die gescreente Kohorte ist größer und vollständiger – zwei Eigenschaften, die direkt die statistische Aussagekraft der resultierenden Studie verbessern.

Vorbereitung der Mortalitätsprüfung

Krankenhaus-Mortalitätsprüfungskomitees – von den meisten Akkreditierungsstellen gefordert und zunehmend durch landesweite Qualitätsvorschriften vorgeschrieben – müssen jeden stationären Todesfall überprüfen. Jede Prüfung erfordert eine Zusammenfassung des Entlassungsberichts: Aufnahmedatum, Hauptdiagnose, während des Aufenthalts durchgeführte Eingriffe, Entlassungsart (in diesem Fall Tod) sowie dokumentierte Komplikationen oder unerwartete Ereignisse. Die Erstellung dieser Zusammenfassungen für eine monatliche Mortalitätsprüfungssitzung mit 20 bis 50 Fällen bedeutet, dass ein Qualitätsspezialist Tage damit verbringt, dieselben Felder aus demselben Dokumenttyp zu extrahieren – Fall für Fall.

Die Extraktion der Entlassungsberichtsfelder in eine Tabelle – eine Zeile pro Verstorbenem, eine Spalte pro erforderlichem Prüfungselement – erzeugt eine Übersichtstabelle, die vor der Sitzung an die Komiteemitglieder verteilt werden kann. Die Vorbereitungszeit des Qualitätsspezialisten verlagert sich von der Datenzusammenstellung zur Falltriage: welche Fälle eine tiefergehende Analyse benötigen, welche Muster zeigen, die eine Untersuchung lohnen, und welche einem vorhersehbaren klinischen Verlauf folgen.

Was KI-Extraktion mit klinischen Texten kann und was nicht

Grenzen klar zu benennen ist im klinischen Kontext keine Schwäche – es unterscheidet ein verlässliches Werkzeug von einem, das zu viel verspricht. Hier liegt die Trennlinie.

Es extrahiert, was geschrieben steht, nicht, was impliziert wird. Wenn ein Entlassungsbericht besagt: "Patient nachts hypotensiv, sprach auf Flüssigkeit an," extrahiert die KI diesen Satz als Krankenhausverlaufstext. Sie schließt nicht auf eine hypotensive Episode mit bestimmter Schwere oder Dauer. Die klinische Interpretation – die Beurteilung, ob dieser Vorfall für ein Register als Komplikation gilt – bleibt dem Abstraktor überlassen. Die KI liefert das Rohmaterial; der Abstraktor die klinische Bewertung.

Handschriftliche Anmerkungen auf Ausdrucken verringern die Genauigkeit. Ein sauberes, direkt aus dem KIS generiertes PDF liefert zuverlässige Extraktion. Ein gescannter Ausdruck – besonders mit handschriftlichen Randnotizen, Faxartefakten oder mehrfachen Kopierdurchläufen – kann die Genauigkeit in der Nähe beschädigter Stellen beeinträchtigen. Wenn Ihr Workflow das Drucken, Kommentieren und erneute Scannen von Berichten umfasst, extrahiert die KI den gedruckten Text zuverlässig, handschriftliche Notizen jedoch mit variabler Genauigkeit je nach Lesbarkeit.

Verschachtelte Strukturfelder können die semantische Zuordnung erschweren. Wenn eine Entlassungsmedikationsliste als unstrukturierter Absatz (statt als Tabelle) formatiert ist, kann die KI „Metoprolol 50 mg täglich, Lisinopril 10 mg täglich, Apixaban 5 mg BID“ in drei Medikamenteneinträge parsen. Ist sie hingegen als dichte Tabelle mit verbundenen Zellen, inkonsistenten Abständen und Fortsetzung über Seitenumbrüche formatiert – wie in manchen älteren Krankenhausberichten –, sinkt die Genauigkeit bei der Zuordnung von Unterfeldern (Wirkstoff vs. Dosis vs. Frequenz). In solchen Fällen kann es praktikabler sein, den vollständigen Medikationstext als ein einziges Feld zu extrahieren und nach der Extraktion manuell zu unterteilen, anstatt zu erwarten, dass die KI eine fehlerhafte Tabelle perfekt parst.

Die HIPAA-Compliance hängt von Ihrer Handhabung ab, nicht vom Tool. Der Extraktionsprozess verarbeitet Dateien im Arbeitsspeicher und speichert sie nach der Sitzung nicht. Das Hochladen von Patientendaten in ein cloudbasiertes Tool erfordert jedoch eine Business Associate Agreement (BAA), wenn die Daten geschützte Gesundheitsinformationen enthalten. Das Tool verarbeitet Daten über verschlüsselte Verbindungen, aber die Verantwortung für die HIPAA-Compliance in Ihrem spezifischen institutionellen Kontext – einschließlich der Frage, ob eine BAA erforderlich ist und ob Ihre IRB oder Datenschutzabteilung den Workflow genehmigt – liegt bei Ihnen.

FAQ

Funktioniert das mit gescannten Papierberichten oder nur mit nativen PDFs?

Beides. Native PDFs, die direkt aus einem EHR erstellt wurden, liefern die zuverlässigsten Ergebnisse, da der Text maschinell erzeugt wurde. Gescannte Papierberichte – einschließlich solcher, die gedruckt, kommentiert und erneut gescannt wurden – werden durch direktes Auslesen des Textbildes verarbeitet, ohne separaten OCR-Vorverarbeitungsschritt. Die Genauigkeit bei gescannten Berichten hängt von der Scanqualität ab: Ein sauberer 300-DPI-Scan eines gedruckten Berichts liefert nahezu gleich gute Ergebnisse wie ein natives PDF. Eine Faxkopie einer Kopie mit schiefer Ausrichtung und starker Schattenbildung hat eine geringere Genauigkeit, insbesondere bei kleinem Text wie Medikamentendosierungen.

Was ist, wenn mein Krankenhaus andere Abschnittsüberschriften verwendet als hier beschrieben?

Die Extraktion gleicht Abschnittsüberschriften nicht exakt ab. Wenn in den radiologischen Befunden Ihres Krankenhauses der Abschnitt „Beurteilung“ als „Schlussfolgerung“ oder „Bewertung“ bezeichnet wird – oder wenn die Entlassungszusammenfassung den Krankenhausverlauf als „Zusammenfassung des Aufenthalts“ benennt – erkennt die KI diese als semantische Äquivalente. Die von Ihnen definierten Spaltennamen dienen als kanonische Bezeichnungen, und die KI übernimmt die Zuordnung unabhängig von der jeweiligen Terminologie jedes Berichts. So können Sie jederzeit einen Bericht aus einem neuen Krankenhaus oder einer neuen Abteilung hinzufügen, ohne etwas neu konfigurieren zu müssen.

Kann derselbe Batch sowohl Radiologieberichte als auch Entlassungsbriefe enthalten?

Ja. Wenn Sie Spalten definieren, die Felder beider Dokumenttypen enthalten – z. B. Untersuchungsart, Befund, Aufnahmedatum und Entlassungsmedikation –, füllt jeder Radiologiebericht die radiologiespezifischen Spalten (die entlassungsspezifischen Spalten bleiben leer), und jeder Entlassungsbrief füllt die entlassungsspezifischen Spalten (die radiologiespezifischen Spalten bleiben leer). Die Ausgabetabelle enthält alle Zeilen mit allen Spalten. Sie können nach Dokumenttyp oder danach filtern, ob eine bestimmte Spalte gefüllt ist, um Ihre reinen Radiologie- oder Entlassungsdatensätze zu isolieren.

Wie gehe ich mit Entlassmedikamenten um, die als Freitext und nicht in einer Tabelle aufgeführt sind?

Wenn die Medikamentenliste als fortlaufender Text und nicht als strukturierte Tabelle formatiert ist, definieren Sie Ihre Spalte als "Entlassmedikamente" (den vollständigen Text), anstatt zu versuchen, Unterfelder (Wirkstoff, Dosis, Frequenz) in einem Durchgang zu extrahieren. Die KI erfasst den vollständigen Medikamententextblock. Sie können ihn dann entweder manuell in Excel unterteilen oder einen zweiten Extraktionsdurchlauf nur für den Medikamententext durchführen, um ihn in strukturierte Unterfelder zu parsen. Wenn Sie mit dem vollständigen Text als Spalte beginnen, erhalten Sie sowohl die Geschwindigkeit der automatisierten Extraktion für den Gesamtfall als auch die Flexibilität, unstrukturierte Medikamentenlisten zu verarbeiten, ohne die KI zu Parsing-Entscheidungen zu zwingen, die besser von einem menschlichen Prüfer getroffen werden.

Ist das für ein kleines Forschungsprojekt geeignet oder nur für große Registerarbeiten?

Der Workflow skaliert nach unten genauso natürlich wie nach oben. Ein Assistenzarzt, der eine retrospektive Studie mit 30 Patienten durchführt, profitiert von der Extraktion genauso wie ein Registererfasser, der 300 Fälle bearbeitet – die Zeitersparnis pro Fall steigt linear. Tatsächlich kann die Extraktion für kleine Forschungsprojekte noch wertvoller sein, da diese meist kein Budget für dediziertes Erfassungspersonal haben. Der Assistenzarzt, der nach dem klinischen Dienst eine 30-Fälle-Datenbank aufbauen muss, kann sich 20 Stunden manuelle Dateneingabe am wenigsten leisten – und profitiert am meisten davon, diese 20 Stunden auf 2 zu reduzieren.

Radiologie- & Entlassungsberichte extrahierenfür klinische Audits