Comment extraire les données des comptes rendus de radiologie et des résumés de sortie
pour les audits cliniques

La plupart des DPI hospitaliers peuvent exporter un compte rendu de radiologie ou un résumé de sortie au format PDF en moins de dix secondes. Ce qu'ils ne peuvent pas faire — ce qu'aucun système d'information clinique ne peut faire — c'est exporter les données contenues dans ce rapport sous forme de champs structurés. Le type d'examen, le code ICD-10, le paragraphe de conclusion, la liste des médicaments de sortie : tout est présent sur la page, tout est lisible par un humain, mais rien n'est extractible en tant que points de données discrets sans que quelqu'un ouvre le PDF et tape les informations. Cet écart — entre « les données existent » et « les données sont exploitables » — est l'endroit où l'abstraction des registres cliniques, les audits qualité et la collecte de données de recherche absorbent des centaines d'heures qu'aucune ligne budgétaire ne prend en compte.

Arrêtez la saisie manuelle — laissez l'IA lire vos documents

Image ou PDF — données structurées en 10 secondes

Essayer maintenant →

Sans inscription · Sans carte bancaire · Résultat en 10 secondes

Extraction de données cliniques structurées à partir de comptes rendus de radiologie et de résumés de sortie vers un tableur Excel

Points clés

Un cas de registre clinique nécessite 20 à 30 minutes d'extraction manuelle — et presque tout ce temps est passé à ressaisir des champs comme le type d'examen et le code ICD-10 (diagnostic) déjà visibles sur le PDF.
Les DSE (dossiers de santé électroniques) exportent les comptes rendus de radiologie et de sortie sous forme de PDF narratifs lisibles par l'humain mais non interrogeables par une base de données hospitalière — les données sont numériques mais verrouillées dans un texte, et aucune vitesse de frappe ne comble ce fossé structurel.
Définissez dix noms de colonnes une fois — Type d'examen, Impression, Médicaments de sortie — importez des centaines de PDF, et ImageToTable.ai remplit un tableur en lisant le sens plutôt que la position sur la page, transformant une transcription de 30 minutes en une vérification de 30 secondes.

Deux types de documents, un même problème d'extraction

Les comptes rendus de radiologie et les résumés de sortie se situent aux deux extrémités du séjour hospitalier d'un patient — l'un capture un moment diagnostique, l'autre résume l'ensemble de l'admission — mais ils partagent le même problème d'accessibilité aux données. Tous deux sont générés sous forme de documents narratifs. Tous deux contiennent des champs dont les registres cliniques, les bases de recherche et les audits qualité ont besoin sous forme de valeurs structurées. Et dans la plupart des systèmes hospitaliers, tous deux quittent le DSE sous forme de PDF sans que cette structure soit conservée.

Un compte rendu de radiologie suit une architecture interne remarquablement cohérente. Le paramètre de pratique de l'American College of Radiology (ACR) pour la communication des résultats d'imagerie diagnostique définit cinq sections standard : indication clinique (pourquoi l'examen a été demandé), technique (modalité, produit de contraste, paramètres d'imagerie), comparaison (avec les examens antérieurs), constatations (le récit détaillé de ce que le radiologue a observé) et impression (la conclusion diagnostique concise). Le Breast Imaging Reporting and Data System (BI-RADS) — largement considéré comme la référence en matière de compte rendu structuré — montre ce qui se produit lorsque chacune de ces sections correspond à des champs discrets et interrogeables. Mais BI-RADS est l'exception. La plupart des comptes rendus de radiologie sont des dictées en texte libre qui utilisent ces sections de manière incohérente, voire pas du tout, laissant les données enfermées dans la prose.

Un compte rendu de sortie suit un modèle différent mais tout aussi prévisible. La norme RC.02.04.01 de The Joint Commission impose six éléments essentiels : motif d'hospitalisation, résultats significatifs, actes et traitements effectués, état du patient à la sortie, médicaments de sortie et instructions de suivi. Les Centers for Medicare & Medicaid Services ajoutent leurs propres exigences dans le cadre de la Condition de Participation pour la planification de la sortie. Tout hôpital accrédité produit des comptes rendus de sortie contenant ces éléments. Mais le format — quels champs sont étiquetés, lesquels sont intégrés en texte libre, si les diagnostics apparaissent avec des codes CIM ou en langage simple — varie considérablement d'un hôpital à l'autre, et même entre services d'un même hôpital.

Les deux types de documents suivent une structure connue. Aucun des deux ne fournit cette structure sous forme de données extractibles. Le résultat est un flux de travail où les extracteurs de données cliniques, les coordinateurs de recherche et les spécialistes de l'amélioration de la qualité passent leur temps à lire des PDF et à recopier des valeurs dans des tableurs — un travail qui n'a rien à voir avec le jugement clinique et tout à voir avec un écart de format que l'industrie du DSE n'a pas comblé.

Que faut-il extraire d'un compte rendu radiologique

Un compte rendu radiologique contient plus de texte qu'on ne l'imagine. Un scanner thoracique avec injection standard génère un rapport de plusieurs paragraphes, mais les champs réellement nécessaires pour un registre ou un audit tiennent en une dizaine de colonnes. Le reste — nom du manipulateur, détails de dose d'irradiation, horodatage de la dictée — est une information contextuelle que le PDF peut conserver.

Les dix champs à extraire, et pourquoi chacun est important :

Champ	Ce qu'il contient	Pourquoi l'extraire
Type d'examen	Scanner, IRM, Radiographie, Échographie, Médecine nucléaire	Les critères d'inclusion du registre filtrent souvent par modalité
Partie du corps	Thorax, Cerveau, Abdomen, Membre, Rachis	Organise la cohorte par région anatomique pour l'analyse en sous-groupes
Indication clinique	Raison de l'examen (ex. « éliminer une EP »)	Vérifie que l'examen correspond aux critères d'inclusion du registre
Technique	Utilisation de produit de contraste, épaisseur de coupe, séquences spécifiques	Standardisation de la technique entre les cas pour l'analyse comparative
Résultats	Compte rendu complet — les observations détaillées du radiologue	Source principale pour la validation des événements cliniques et l'analyse en TALN
Impression	Conclusion diagnostique concise (1-4 lignes)	Voie la plus rapide vers la classification du cas ; souvent la seule section lue par un auditeur
Radiologue	Nom du médecin interprète	Suivi de la fiabilité inter-évaluateurs, AQ au niveau du médecin
Médecin prescripteur	Clinicien demandeur	Analyse des schémas d'orientation, métriques d'utilisation par service
Date d'examen	Date de réalisation de l'imagerie	Ancrage temporel pour toutes les analyses chronologiques
Date du compte rendu	Date de finalisation du compte rendu	Métriques de délai d'exécution ; analyse de l'intervalle compte rendu-action

Le champ Résultats mérite une attention particulière. Avec 200 à 500 mots dans un rapport typique, il est trop long pour être retapé et trop dense en informations pour être ignoré. C'est le champ où coexistent « condensation du lobe inférieur droit » et « absence d'embolie pulmonaire » — des conclusions opposées qu'un formulaire d'abstraction par cases à cocher réduirait à un simple indicateur « anormal », perdant la spécificité qui rend les données utiles à la recherche. Extraire le texte intégral préserve cette granularité. Le filtrage et le codage viendront plus tard ; ce qui importe à l'étape d'extraction, c'est de ne rien écraser prématurément.

Que retenir d'un compte rendu de sortie

Là où les comptes rendus de radiologie sont des récits structurés, les comptes rendus de sortie sont des hybrides semi-structurés — un mélange de champs discrets (date d'admission, date de sortie) et de sections en texte libre (évolution hospitalière, instructions de sortie). Cette nature hybride est précisément ce qui rend l'abstraction manuelle si chronophage. Les champs discrets sont faciles à trouver mais fastidieux à saisir. Les sections en texte libre nécessitent une compréhension de lecture pour localiser les valeurs spécifiques — un diagnostic enfoui au troisième paragraphe, un changement de médicament décrit au cinquième.

Les dix champs importants pour l'abstraction des registres, la recherche et l'audit :

Champ	Ce qu'il capture	Pourquoi l'extraire
IPP Patient	Numéro de dossier médical	Identifiant unique patient pour déduplication et suivi longitudinal
Date d'admission	Date d'admission à l'hôpital	Date de l'événement index pour le calcul du temps zéro du registre
Date de sortie	Date de sortie de l'hôpital	Point final pour le calcul de la durée de séjour et de la fenêtre de réadmission
Durée de séjour	Date de sortie − Date d'admission en jours	Indicateur qualité central ; peut être calculé à partir des deux dates ci-dessus
Code ICD-10 principal	Diagnostic principal (ex. I21.4 pour NSTEMI)	Critère principal d'inclusion/exclusion pour la plupart des registres
Codes ICD-10 secondaires	Comorbidités et diagnostics secondaires	Ajustement du risque, score de comorbidité (Charlson, Elixhauser)
Codes de procédure CPT	Procédures réalisées pendant l'hospitalisation	Inclusion dans un registre basé sur les procédures, analyse des coûts
Médicaments de sortie	Nom du médicament, dose, fréquence, durée	Indicateur de qualité essentiel pour les registres d'IDM, d'insuffisance cardiaque et d'AVC
Rendez-vous de suivi	Rendez-vous de suivi programmé avec spécialité, date, lieu	Métrique de qualité de transition des soins ; facteur de risque de réadmission
Médecin traitant de sortie	Médecin traitant à la sortie	Attribution au niveau du prestataire pour le rapport de qualité

Les médicaments de sortie sont systématiquement le champ le plus difficile à abstraire manuellement — non pas parce que l'information est difficile à trouver, mais parce qu'elle contient quatre sous-champs (médicament, dose, fréquence, durée) qui apparaissent souvent dans un seul paragraphe de texte. Une section de réconciliation médicamenteuse peut lister « Metoprolol succinate 50 mg PO par jour, continuer à domicile » sur une ligne et « Apixaban 5 mg PO deux fois par jour x 30 jours, puis 2,5 mg deux fois par jour ensuite » sur la suivante. L'abstraction doit analyser chaque ligne en champs composants avant de les saisir dans le registre — effectuant ainsi simultanément la saisie et la normalisation des données.

Arrêtez la saisie manuelle — laissez l'IA lire vos documents

Image ou PDF — données structurées en 10 secondes

Essayer maintenant →

Sans inscription · Sans carte bancaire · Résultat en 10 secondes

Étape par étape : de l'export PDF au tableau structuré

Le flux de travail qui remplace l'extraction manuelle comporte quatre étapes. Aucune ne nécessite de codage, de déploiement informatique ou d'intégration au DSI. L'entrée est un ensemble de PDF exportés du système d'information hospitalier. La sortie est un tableur Excel avec une ligne par document et une colonne par champ.

Exporter les rapports du DPI en PDF

La plupart des DPI hospitaliers — Epic, Cerner, Meditech — proposent une option d'export PDF pour les comptes rendus de radiologie et les résumés de sortie. Sélectionnez les cas nécessaires pour votre audit ou registre, exportez-les et rassemblez les PDF dans un seul dossier. Un projet d'abstraction de registre peut impliquer 50 à 500 rapports. Un projet de recherche d'interne peut en impliquer 30. Le flux d'extraction traite les deux échelles de la même manière.

Définissez les colonnes nécessaires

C'est le cœur du processus — et l'étape qui distingue l'extraction sémantique de l'OCR basée sur des modèles. Au lieu de dessiner des rectangles autour de chaque champ sur un exemple de page, vous saisissez les noms des colonnes qui comptent pour votre projet. Pour un audit de radiologie, cela pourrait être : Date d'examen, Type d'examen, Partie du corps, Impression. Pour une abstraction de registre basée sur les comptes rendus de sortie : NIP, Date d'admission, Date de sortie, CIM-10 principale, Actes CCAM, Médicaments de sortie. L'IA lit chaque document téléchargé, comprend la signification sémantique de chaque libellé de champ, et localise la valeur correspondante, peu importe où elle apparaît sur la page ou comment elle est formulée. Vous pouvez aussi laisser les noms de colonnes vides et laisser l'IA détecter automatiquement le contenu du document — utile pour un premier balayage lorsque vous n'êtes pas encore sûr des champs disponibles de manière cohérente dans tous les rapports.

Importer et laisser l'IA extraire

Importez tous les PDF en un seul lot — 20 comptes rendus de radiologie, 50 résumés de sortie, ou un mélange des deux. Chaque document est traité indépendamment. L'IA associe les valeurs trouvées aux colonnes que vous avez définies. Un rapport de l'Hôpital A qui nomme le type d'examen « Scanner thoracique avec injection » et un rapport de l'Hôpital B qui le nomme « Tomodensitométrie — Thorax » remplissent tous deux la même colonne « Type d'examen », car l'IA comprend qu'il s'agit du même concept, et non parce qu'ils correspondent à la même chaîne de caractères. Le résultat est un tableur unique avec des colonnes cohérentes pour tous les documents sources.

Vérifiez les champs critiques, puis exportez

Aucun pipeline d'extraction — automatisé ou manuel — ne devrait ignorer une étape de vérification pour les données cliniques. La charge de vérification est cependant bien plus légère qu'une abstraction manuelle complète. Au lieu de lire chaque champ et de saisir chaque valeur, vous parcourez le tableur en regardant les PDF originaux et vous vérifiez ponctuellement : le code ICD-10 principal est-il correct ? Les dates de sortie sont-elles exactes ? Les listes de médicaments semblent-elles complètes ? La vérification prend généralement 30 à 60 secondes par dossier, contre 20 à 30 minutes pour une abstraction manuelle complète. L'IA gère la transcription ; votre rôle passe de la saisie de données à l'assurance qualité.

Un comportement du tableur à noter : lorsque vous importez un mélange de comptes rendus de radiologie et de comptes rendus de sortie dans le même lot, chaque ligne de la sortie représente un document. Un compte rendu de radiologie aura des valeurs dans des colonnes comme « Type d'examen » et « Impression », mais des cellules vides sous « Médicaments de sortie » et « Rendez-vous de suivi ». Un compte rendu de sortie montrera l'inverse. Ce comportement est correct — le tableur est une union de toutes les colonnes que vous avez définies, et chaque document remplit les colonnes pertinentes pour son type. Pour les projets nécessitant les deux types de documents, le tableur unique devient naturellement une table de données maître où vous pouvez filtrer par type de document pour isoler les enregistrements de radiologie ou de sortie uniquement.

Quatre cas cliniques où l'extraction remplace la saisie

Le flux de travail décrit ci-dessus n'est pas théorique. Il correspond directement aux scénarios les plus courants où les extracteurs de données cliniques passent des heures à transférer des données de rapports narratifs vers des bases de données structurées.

Abstraction de registres cliniques (STS, GWTG, NCDR)

La National Database de la Society of Thoracic Surgeons (STS), le NCDR de l'American College of Cardiology (incluant les modules CathPCI, Chest Pain-MI et AFib), et le programme Get With The Guidelines (GWTG) de l'American Heart Association exigent tous des éléments de données discrets extraits des dossiers patients. Un seul cas CathPCI peut nécessiter plus de 150 points de données. Un seul cas GWTG-AVC peut en nécessiter plus de 80. Ces points sont dispersés dans les notes d'admission, les comptes rendus d'intervention, les résumés de sortie et les rapports d'imagerie — le travail de l'abstractionniste consiste à trouver chacun d'eux dans un PDF et à le saisir dans l'interface de collecte de données du registre.

L'extraction ne supprime pas le flux de travail d'abstraction — certains champs du registre nécessitent un jugement clinique que seul un abstractionniste formé peut apporter. Mais elle élimine l'étape de transcription pour les champs qui apparaissent textuellement dans les rapports de radiologie et de sortie : dates d'examen, codes CIM-10, noms d'interventions, listes de médicaments. L'abstractionniste commence avec un tableur pré-rempli contenant ces valeurs, puis ajoute les champs nécessitant un jugement. La différence entre extraire 80 champs de zéro et en extraire 30 après que 50 aient été automatiquement renseignés, c'est la différence entre un débit de 3 cas par jour et 8.

Audits d'amélioration de la qualité

Les services qualité des hôpitaux extraient régulièrement des dossiers pour des audits ciblés — conformité au délai porte-ballon, taux de conciliation médicamenteuse à la sortie, critères d'utilisation appropriée pour l'imagerie avancée. Chaque audit commence par une liste de cas et se termine par un tableur, avec une revue manuelle des dossiers entre les deux. Pour un audit de 100 comptes rendus radiologiques vérifiant si l'indication clinique était documentée avant l'administration du produit de contraste, extraire le champ « Indication clinique » de chaque PDF dans une seule colonne transforme une demi-journée de lecture en cinq minutes de balayage d'une colonne de tableur.

Le Royal College of Radiologists tient à jour une bibliothèque de plus de 100 modèles d'audit radiologique, chacun spécifiant les éléments de données à collecter. La plupart de ces éléments — type d'examen, délai d'attente, délai de compte rendu, conformité aux normes de compte rendu — existent en tant que champs distincts dans les comptes rendus radiologiques. Les extraire dans un tableur avant de commencer l'analyse d'audit réduit la phase de collecte de données d'un cycle d'audit que les modèles du RCR estiment généralement à plusieurs semaines de travail à temps partiel.

Identification des cas pour la recherche clinique

Un coordinateur de recherche constituant une cohorte pour une étude rétrospective doit examiner les comptes rendus de sortie selon des critères d'inclusion spécifiques : un diagnostic principal d'insuffisance cardiaque aiguë décompensée, une durée de séjour supérieure à 48 heures, et une liste de médicaments de sortie incluant un bêta-bloquant. En révision manuelle, cela implique d'ouvrir chaque PDF, de le lire pour trouver les champs pertinents, et d'enregistrer une décision oui/non pour chaque critère. Avec l'extraction, les codes CIM-10, la durée de séjour et la liste des médicaments sont déjà dans un tableur — le coordinateur examine en triant et filtrant, sans avoir à lire.

Le gain d'efficacité ne concerne pas seulement le temps ; il porte aussi sur l'exhaustivité. Un examen manuel de 200 dossiers manque inévitablement des cas où le critère de qualification est formulé différemment que prévu — « exacerbation d'ICC » au lieu d'« insuffisance cardiaque aiguë décompensée », ou « métoprolol » listé sous « médicaments habituels » plutôt que « médicaments de sortie ». Une IA qui lit l'intégralité du document de manière sémantique détecte ces variantes en comprenant leur sens, sans se baser sur une correspondance textuelle. La cohorte examinée est plus large et plus complète — deux attributs qui améliorent directement la puissance statistique de l'étude résultante.

Préparation à la revue de mortalité

Les comités de revue de mortalité hospitalière — exigés par la plupart des organismes d'accréditation et de plus en plus imposés par les réglementations qualité des États — doivent examiner chaque décès hospitalier. Chaque revue nécessite un résumé de cas tiré du compte rendu de sortie : date d'admission, diagnostic principal, actes réalisés pendant l'hospitalisation, devenir à la sortie (décès dans ce cas), et toute complication ou événement inattendu documenté. Rassembler ces résumés pour une réunion mensuelle de revue de mortalité portant sur 20 à 50 cas signifie qu'un spécialiste qualité passe des jours à extraire les mêmes champs du même type de document, cas après cas.

Extraire les champs du compte rendu de sortie dans un tableur — une ligne par défunt, une colonne par élément de revue requis — produit un tableau récapitulatif pouvant être distribué aux membres du comité avant la réunion. Le temps de préparation du spécialiste qualité passe de l'assemblage des données au tri des cas : quels cas nécessitent une analyse approfondie, lesquels montrent des schémas méritant investigation, lesquels suivent une trajectoire clinique prévisible.

Ce que l'extraction IA peut et ne peut pas faire avec les textes cliniques

Être précis sur les limites n'est pas une faiblesse en contexte clinique — c'est ce qui distingue un outil fiable d'un outil qui promet trop. Voici où se situe la frontière.

Elle extrait ce qui est écrit, pas ce qui est sous-entendu. Si un compte rendu de sortie indique « patient hypotendu la nuit, a répondu aux liquides », l'IA extrait cette phrase comme texte du séjour hospitalier. Elle n'en déduit pas que le patient a eu un épisode hypotensif avec une sévérité ou une durée spécifique. L'inférence clinique — le jugement que cet épisode constitue une complication à des fins de registre — reste du ressort de l'abstractionniste. L'IA fournit la matière première ; l'abstractionniste fournit l'interprétation clinique.

Les annotations manuscrites sur les rapports imprimés réduisent la précision. Un PDF net et directement généré par un DSE produit une extraction fiable. Un tirage scanné — surtout avec des notes manuscrites dans les marges, des artefacts de fax ou plusieurs générations de photocopies — peut dégrader la précision du texte près des zones endommagées. Si votre flux de travail implique d'imprimer des rapports, de les annoter et de les scanner à nouveau, l'extraction capturera le texte imprimé de manière fiable, mais les annotations manuscrites avec une précision variable selon leur lisibilité.

Les champs structurés profondément imbriqués peuvent perturber le mappage sémantique. Si une liste de médicaments de sortie est formatée en paragraphe non structuré (plutôt qu'en tableau), l'IA peut analyser « Metoprolol 50 mg par jour, Lisinopril 10 mg par jour, Apixaban 5 mg deux fois par jour » en trois entrées médicamenteuses. Si elle est formatée en tableau dense avec cellules fusionnées, espacement irrégulier et sauts de page — comme certains anciens formats de rapports hospitaliers — la précision du mappage des sous-champs (médicament vs dose vs fréquence) diminue. Dans ces cas, extraire le texte complet du médicament en un seul champ et le subdiviser manuellement après extraction peut être plus pratique que d'attendre de l'IA qu'elle analyse parfaitement un tableau mal formé.

La conformité HIPAA dépend de votre gestion, pas de l'outil. Le processus d'extraction traite les fichiers en mémoire et ne les stocke pas après la session. Mais télécharger des données patients vers tout outil cloud nécessite un contrat d'associé commercial (BAA) si les données contiennent des informations de santé protégées. L'outil traite les données via des connexions chiffrées, mais la responsabilité de la conformité HIPAA dans votre contexte institutionnel spécifique — y compris si un BAA est requis et si votre IRB ou service de confidentialité approuve le flux de travail — vous incombe.

FAQ

Fonctionne-t-il avec des rapports papier scannés, ou seulement avec des PDF natifs ?

Les deux. Les PDF natifs générés directement depuis un DME produisent les résultats les plus fiables car le texte est d'origine numérique. Les rapports papier scannés — y compris ceux qui ont été imprimés, annotés et re-scannés — sont traités en lisant directement l'image du texte, sans étape préalable de ROC. La précision sur les rapports scannés dépend de la qualité du scan : un scan propre à 300 DPI d'un rapport imprimé offre des performances quasi équivalentes à un PDF natif. Une copie faxée d'une copie avec un alignement de travers et des ombres prononcées aura une précision moindre, notamment sur les textes en petits caractères comme les posologies médicamenteuses.

Et si mon hôpital utilise des titres de sections différents de ceux décrits ici ?

L'extraction ne fait pas correspondre les titres de sections par chaîne exacte. Si les rapports de radiologie de votre hôpital intitulent la section d'impression « Conclusion » ou « Évaluation » — ou si le résumé de sortie appelle le séjour hospitalier « Résumé du séjour » — l'IA reconnaît ces termes comme équivalents sémantiques. Les noms de colonnes que vous définissez servent d'étiquettes de référence, et l'IA gère la correspondance à partir de la terminologie utilisée par chaque rapport. Cela signifie que vous pouvez ajouter un rapport d'un nouvel hôpital ou d'un nouveau service à tout moment sans rien reconfigurer.

Un même lot peut-il contenir à la fois des comptes rendus de radiologie et des résumés de sortie ?

Oui. Lorsque vous définissez des colonnes incluant des champs des deux types de documents — par exemple, Type d'examen, Impression, Date d'admission et Médicaments de sortie — chaque compte rendu de radiologie remplit les colonnes spécifiques à la radiologie (laissant vides les colonnes spécifiques à la sortie), et chaque résumé de sortie remplit les colonnes spécifiques à la sortie (laissant vides les colonnes spécifiques à la radiologie). Le tableur de sortie contient toutes les lignes avec toutes les colonnes, et vous pouvez filtrer par type de document ou selon qu'une colonne particulière est remplie pour isoler vos enregistrements de radiologie ou de sortie.

Comment gérer les médicaments de sortie listés en texte libre plutôt que dans un tableau ?

Si la liste des médicaments est formatée en texte continu plutôt qu'en tableau structuré, définissez votre colonne comme « Médicaments de sortie » (le texte complet) plutôt que d'essayer d'extraire les sous-champs (médicament, dose, fréquence) en une seule passe. L'IA capturera le bloc de texte complet des médicaments. Vous pouvez ensuite soit le subdiviser manuellement dans Excel, soit effectuer une seconde passe d'extraction uniquement sur le texte des médicaments pour l'analyser en sous-champs structurés. Commencer par le texte complet comme colonne vous offre à la fois la rapidité de l'extraction automatisée pour le cas global et la flexibilité nécessaire pour traiter les listes de médicaments non structurées, sans forcer l'IA à prendre des décisions d'analyse qui sont mieux laissées à un relecteur humain.

Convient-il à un petit projet de recherche ou uniquement à un travail de registre à grande échelle ?

Le flux de travail s'adapte aussi naturellement à la baisse qu'à la hausse. Un interne menant une étude rétrospective sur 30 patients bénéficie de l'extraction exactement de la même manière qu'un extracteur de registre traitant 300 cas — les gains de temps par cas s'accumulent linéairement. En fait, l'extraction peut être plus précieuse pour les petits projets de recherche, car ceux-ci n'ont généralement pas de budget pour du personnel d'extraction dédié. L'interne qui doit constituer une base de données de 30 cas après ses tâches cliniques est la personne la moins capable d'absorber 20 heures de saisie manuelle — et celle qui bénéficie le plus de transformer ces 20 heures en 2.

Comment extraire les données des comptes rendus de radiologie et des résumés de sortiepour les audits cliniques