なぜ臨床データはデジタル化されているのにいまだに手作業で抽出されているのか

米国の病院では、臨床文書は事実上すべてペーパーレス化されている。放射線レポートはPACS内でPDFとして生成され、退院サマリーはEHRに入力され、手術記録は口述・転記・アップロードされる。しかし、同じ建物のどこかで、登録看護師がコンピュータの前に座り、同じレポートを一行ずつ読み、臨床レジストリの入力フォームに手作業でデータをフィールドごとに入力している。今週すでに同じ患者のカルテから3回目の作業だ。文書はデジタル化されている。しかしデータ抽出はされていない。

EHR画面と医療レポートを用いた、医療現場における臨床文書とデータ入力のワークフロー

重要ポイント

  1. CABG(冠動脈バイパス術)患者1人につき、1つの心臓レジストリに200以上の手動データポイントが発生する。しかも、同じ患者のカルテは通常5つの異なるレジストリに登録され、それぞれが同一の原資料から独立した抽出作業を必要とする。
  2. 問題は臨床文書が紙であることではない(米国の病院の90%以上はEHR=電子カルテを導入している)。問題は、それらの記録がナラティブ形式のPDFとして出力され、そのフィールドは人間には見えても、すべての病院データベースには見えないことにある。
  3. 臨床データ抽出の現場では、何千人もの看護師や医療情報専門家が毎日同じレポートを異なるレジストリに打ち直している。これはテクノロジースタックの一時的なギャップではなく、テクノロジースタックそのものとなっており、その隠れた年間コストは数十億ドルに上る。

臨床文書化の二つの並行世界

臨床文書は、互いにほとんど連携しない二つの情報エコシステムに存在します。一つ目は構造化データ:チェックボックス、ドロップダウンメニュー、ラジオボタン。診断を分類するICD-10コード。処置を説明するCPTコード。データベースのフィールドに収まる検査値—ヘモグロビン12.3 g/dL、クレアチニン0.9 mg/dL。これはEHRが管理するために作られた世界です。検索可能で、クエリ可能で、レポート作成が可能です。しかし、量と臨床的な豊かさの点では、プールの浅い部分に過ぎません。

二つ目の世界は非構造化データ:医師が実際に診たもの、考えたこと、行ったことを説明する際に生成するナラティブ散文です。「右上葉に1.2 cmのスピキュレーションを伴う結節があり、胸膜陥入を伴う—CTガイド下生検を推奨」と記述する放射線科レポート。12日間の入院を、初発症状から合併症、退院後指示まで詳述する退院サマリー。どの血管に、どのグラフトで、どのような条件下でバイパスを行ったかを800語の外科的詳細で記述する手術記録。3回のシフトにわたる医師の評価の変化を捉える経過記録。

この二つ目の世界—ナラティブの世界—には、医療記録内の臨床的に意味のあるデータの推定80%が含まれています。そこには、意思決定の背後にある推論、診断コードが平坦化するニュアンス、検査値を単なる数字ではなく実用的にする文脈が含まれています。そして、デフォルトでは、病院のすべてのレポートツール、分析プラットフォーム、自動化ワークフローから見えなくなっています。

構造化された世界は「何が起こったか」を簡潔に答えます。非構造化の世界は「なぜ起こったか、それが何を意味するか、次に何が起こるべきか」に答えます。問題は、機械が最初のものしか読めないことです。

なぜEHRはこの問題を解決しなかったのか

2009年のHITECH法により米国病院のEHR導入率が9%から90%超に急増して以来、根強い前提がある。電子カルテがあればデータアクセスの問題は解決されるはずだ、と。臨床情報がデジタル化されれば機械可読になり、機械可読になれば検索可能になり、検索可能になれば手動抽出は不要になる。

しかし、この前提は最初の段階で崩れる。EHRは臨床知識システムではない。請求処理に最適化されたトランザクションデータベースであり、患者診療のデジタル化の主目的が保険請求の生成だった時代に構築された。Epic、Cerner、Meditech、Allscriptsといった主要EHRプラットフォームに共通する中核的な設計判断は、臨床記録を構造化フィールドではなく非構造化添付ファイルとして保存することだ。病院のPACSで生成された放射線レポートは患者記録に添付される。自由記述欄に入力された退院サマリーはテキストブロブとして保存される。手術記録はPDFとしてアップロードされる。

EHRはこれらの文書を保存する。しかし解析はしない。内容のインデックスも作成しない。「右上葉に1.2cmのスピキュレーション結節」という表現を、クエリで取得可能な構造化データ要素にマッピングすることもない。データベースの観点から見れば、放射線レポートも退院サマリーも手術記録も、1998年の紙カルテのスキャンコピーと同じカテゴリに分類される。デジタル化されていても構造化されておらず、保存されていても検索できない。

2025年に『Journal of Medical Internet Research』に掲載された研究では、180万人の患者を対象に、構造化コードと自由記述テキスト間の情報重複を調査。その結果、ICDコード、処置コード、検査値などの構造化データだけでは、臨床像のごく一部しか捉えられないことが判明しました。自由記述テキストには「患者ケアのニュアンスを捉えた詳細な記述」が含まれていました。EHRの構造化フィールドは患者がCABG(冠動脈バイパス術)を受けたことを示すだけですが、手術記録にはCABGがどのように行われたかが記載されています。これは、質の測定、リスク調整、臨床研究において極めて重要な情報です。

これは特定のEHRベンダーの失敗ではありません。EHRが本来設計された目的の結果です。EHRは請求や規制報告のための構造化データを取得するために作られました。物語から意味を抽出するために作られたわけではありません。臨床データの80%が自由記述テキストにあるという事実は、バグではなく、医療従事者が複雑な情報を伝達する人間らしい方法、つまりドロップダウンではなく文章でケアを記録する自然な結果なのです。

EHRは臨床文書をデジタル化しますが、構造化はしません。Epic内に保存された放射線科の報告書からデータを抽出するには、マニラフォルダ内のタイプされた報告書から抽出するのと同じ認知的労力が必要です。つまり、関連情報を読み取り、解釈し、別のシステムに転記する作業です。媒体は変わりましたが、手作業は変わっていません。

誰も語らない抽象化労働力

EHRが臨床記録を検索不可能な塊として保存するため、病院は専任の専門職階級を雇用している。彼らの仕事は、それらの記録を読み、特定のデータ項目を手動で他のシステムに入力することだ。彼らは臨床データアブストラクターと呼ばれ、米国医療における最大の隠れた人件費の一つを代表している。

臨床データアブストラクターは、通常、正看護師(RN)、登録医療情報技術者(RHIT)、または認定腫瘍登録士(CTR)である。つまり、患者のカルテをレビューし、品質報告、臨床レジストリ、研究、規制遵守のために主要なデータ要素を抽出する、資格を持つ臨床医または医療情報専門家である。この作業には臨床知識が必要である。外科レジストリを抽象化するには手術解剖学の理解が不可欠であり、心臓レジストリを抽象化するには血行動態データの解釈が必要である。最大手の臨床抽象化アウトソーシング企業の一つであるAmerican Data Networkは、アブストラクターの核心的な業務を、「臨床記録、検査結果、画像レポート、投薬」をレビューし、「それらの詳細を構造化フィールドに変換すること」と説明している。

この労働力の規模を正確に測定することは困難である。なぜなら、抽象化は標準化された職種名ではなく、品質部門、レジストリチーム、臨床研究ユニットの中に埋め込まれているからだ。しかし、その経済性は病院レベルで見える。2018年にマサチューセッツ総合病院のレジストリ運営チームが発表した資料では、単一の学術医療センターにおける11の外科専門学会レジストリの人員コストが内訳として示されている。

レジストリ必要FTE数患者数/年年間人件費
STS-心臓(成人心臓外科)正看護師3FTE + PSC 0.51,300約25万~30万ドル
ACS-NSQIP(外科品質)正看護師1.5FTE + 分析担当 + 管理者1,800約12万~18万ドル
ACS-NTDBおよびACS-TQIP(外傷)スタッフ3.5FTE + 管理者0.32,500約25万~35万ドル
STS-胸部正看護師1FTE + 管理者1,000約8万~12万ドル
SRTR(固形臓器移植)正看護師7.0~10.0FTE + 管理者1.5750約50万~70万ドル

出典:マサチューセッツ総合病院、CMSSプレゼンテーション(2018年)。報告されたFTE範囲に基づく推定値。

これは1病院における5つのレジストリで、年間人件費は約120万~170万ドルに上る。しかもこれらはMGHがFTEデータを公開したレジストリにすぎない。ほとんどの大学病院は8~15のレジストリに参加している。米国胸部外科学会National Databaseだけでも全米の成人心臓手術の95%をカバーし、CABG1件につき術前リスク因子、術中詳細、退院後30日間の転帰にわたる200以上のデータ要素の抽出が必要となる。米国心臓病学会が運営するNCDRネットワークには、心臓カテーテル検査、ICD植込み、弁膜症治療などをカバーする6つのレジストリに2,400以上の病院が参加している。

2024年夏にCarta Healthcareが米国病院の臨床データアブストラクターを対象に実施した調査によると、回答者の50%が業務時間の半分以上を手動データ入力と抽出に費やしていることが判明しました。この調査では「臨床医はレジストリを品質・プロセス改善に不可欠と捉える一方、手動データ抽出という負担の大きい作業が彼らを限界に追いやっているという厄介なパラドックス」が指摘されています。自動化については、45%が自動化ツールにより組織の抽出作業が迅速化されると考え、30%がデータ品質の向上、20%がコスト削減に寄与すると回答しました。自動化への需要は、理論上は自動化に脅かされる立場にあるアブストラクター自身から生じています。実際には、抽出すべきデータ量は労働力の対応能力を上回るペースで増加しています。

Redditでは、より率直な意見が見られます。ある臨床研究専門家は「レジストリに患者データを入力しようと何時間も費やしたが、このレジストリには(すべて遅延状態の)約100人の患者がいることが判明した」と投稿しました。別のr/clinicalresearchのスレッドでは、単純に「データ入力や患者記録の情報確認に通常どれくらい時間を費やしているか?」と問いかけています。これは、業務に深く根付いたワークフローの問題を示す質問であり、誰も基準となる答えを持っていません。なぜなら、その答えは「ほぼ一日中」だからです。

規模を外挿すると、その経済的影響が明らかになります。年収75,000ドルの臨床データアブストラクターが、レポートを読み、特定の値を探し、別のシステムに入力する作業に時間の50%を費やす場合、実質的な転記作業に年間約37,500ドルの人件費がかかります。単一の複数レジストリ対応大学病院でアブストラクターが10~20人(フルタイム換算)いると仮定すると、病院あたり年間375,000~750,000ドルになります。NCDR参加病院だけで2,400施設あるため、手動によるレジストリアブストラクションの総コストは、訓練を受けた臨床専門家が患者対応業務ではなくデータ転記を行う機会費用を考慮する前でも、控えめに見積もって年間数十億ドルに上ります。

臨床データアブストラクターは、EHRとレジストリの間で人間が構造化を行う層です。 彼らの仕事が存在するのは、どちらも臨床データを保持するEHRとレジストリという2つのシステムが、人が一方を読んでもう一方に入力することなしにはデータを交換できないからです。アブストラクション業務は、テクノロジースタックにおける一時的なギャップではありません。それこそがテクノロジースタックそのものなのです。

一人の患者、一つのカルテ、五つのレジストリ——そして五回の個別データ入力

抽象化作業の経済性は、他業界にはない臨床レジストリの構造的特徴によって増幅されます。複数のレジストリが同じ原資料からデータを抽出するが、互いにデータを共有しないという点です。

冠動脈バイパス移植術を受ける患者を考えてみましょう。米国胸部外科学会(STS)成人心臓外科データベースでは、この患者に対して200以上のデータ要素が必要です:術前リスク因子(糖尿病の有無、駆出率、既往のPCI)、術中詳細(グラフト数、大動脈遮断時間、内胸動脈使用の有無)、および30日転帰(死亡、脳卒中、深部胸骨創感染、腎不全、長期人工呼吸)。

同じ患者のカルテには同一の手術記録が含まれています。しかし、この患者はNCDR CathPCIレジストリにも抽象化される可能性があります——術前カテーテル検査を受けたためです——そしてそのレジストリには独自のデータ辞書とフィールド定義があります。手術に経カテーテル弁治療が含まれていた場合、STS/ACC TVTレジストリがさらに別の変数セットを追加します。合併症で再手術が必要になった場合、ACS NSQIP外科品質レジストリが適用される可能性があります。病院が心血管疾患患者向けのGet With The Guidelines(GWTG)プログラムに参加している場合、それが5番目のレジストリとなり、独自の抽象化要件があります。

5つのレジストリすべてが同じ原資料を参照している。同じ放射線科レポート、同じ手術記録、同じ退院サマリー、同じ検査値。そして米国のほぼすべての病院で、5つの異なるデータ抽出ワークフロー(多くの場合、異なる抽出担当者に分割され、時には同一人物が同じ作業を5回繰り返す)が、重複するデータ項目を手作業で5つの別々のレジストリ提出プラットフォームに抽出している。

MGHのデータはこれを可視化している。単一の病院が11の外科レジストリを管理しており、人員要件は0.5 FTE(年間500件以下の小規模レジストリ)から10 FTE(年間750件の移植レジストリ)に及ぶ。変数の定義は、同じ臨床概念であってもレジストリ間で異なることが多い。あるレジストリでは「術後腎不全」をあるクレアチニン閾値で定義し、別のレジストリでは異なる閾値や時間枠で定義する。1症例あたりの抽出時間は、レジストリの複雑さと患者の経過に応じて15分から4時間の範囲である。

これはHL7 FHIRで解決できる技術的な相互運用性の問題ではない。FHIRはシステム間のデータ転送を標準化できる。つまり、システムAがシステムBに検査値を送信する際に、両システムが伝送形式に合意することを保証する。しかしFHIRにできないことは、叙述的な段落を構造化フィールドに変換することである。「1.2 cmのスピキュレーションを伴う結節」と記載された放射線科レポートを読み取り、「最大径の腫瘍サイズ」というレジストリフィールドに入力することはできない。散文から構造化データへの変換には、依然として人間の読者、または意味抽出が可能なAIシステムが必要である。相互運用性の標準は伝送の問題を解決した。構造化の問題は解決していない。

一人の患者の診療記録が、五つ以上のレジストリにデータを提供することがある。各レジストリは同じ原資料から独自の抽象化作業を要求する。この重複作業は誤差の範囲ではない。各レジストリが独自のデータ辞書、フィールド定義、提出プロトコルを持つ独立したデータ収集サイロとして構築されたシステムの構造的特徴である。

皮肉な話:デジタル化は済んでいる、ただ構造化されていないだけ

医療ITの世界では、「デジタル化」つまり紙のカルテをコンピュータに取り込むことが課題だという見方が根強くあります。この見方は、ほとんどの病院が紙のカルテを使い、HITECH法もまだ始まっていなかった2005年当時なら筋が通っていました。しかし今では通用しません。米国の病院の90%以上がEHRを導入しています。放射線科は10年以上前からフィルムレス化が進み、レポートの作成から署名、配信までPACSからEHRへのデジタルワークフローで完結しています。退院サマリーはカセットテープに口述筆記ではなく、キーボードで入力されます。手術記録はEHRのテンプレートモジュールに入力されます。最も重要な臨床文書、つまり最も豊富な臨床情報を含む記述は、すでにデジタル化されているのです。

ボトルネックはデジタル化ではありません。ボトルネックは構造化です。

そして構造化のボトルネックには、具体的で測定可能な形があります。それは、「この患者はCABGを受けた」というEHRが報告できる構造化された事実と、STSレジストリがそのCABGの実施方法について要求する200の個別データポイントとの間のギャップです。その200のデータポイントはすべて、どこかの臨床文書に存在しています。術前の駆出率は心エコーレポートに、グラフト数は手術記録に、術後の人工呼吸器装着時間はICUフローシートに、30日死亡率は退院後のフォローアップ電話の自由記述メモに記載されています。情報はカルテの中にあります。ただ、機械が読み取れる形式になっていないだけです。

このことは、自動化に関する議論全体を捉え直します。問題は「臨床文書をデジタル化できるか?」ではありません。その船はもう出航しました。問題は「すでにデジタル化された臨床記述から、人を増やして読み取り・入力させることなく、構造化データを抽出できるか?」です。

この違いが重要なのは、問題に対処するために適した技術の種類が変わるからです。テンプレートベースのOCR——ページ上のフィールドが「どこにあるか」を読み取る方式——は、固定レイアウトの文書、すなわち定型化された帳票、印刷された表、構造化された請求書向けに設計されました。しかし、手術記録には固定レイアウトがありません。それは外科医が執筆する、毎回異なる経過をたどる可能性のある処置を説明する、物語形式の段落です。物語にテンプレートは適用できません。理解することしかできないのです。

ここで、現在の世代のAI抽出ツール——テンプレートOCRではなく視覚言語モデル(VLM)に基づくもの——が議論に登場します。VLMは駆出率がページのどこに書かれているかを知る必要はありません。必要なのは、駆出率とは何か——つまりパーセンテージ値であり、通常「EF 45%」や「LVEF 40-45%と推定」と表現されること——を理解し、それが物語中のどこに現れても見つけ出すことです。これは意味抽出であり、座標ベースの抽出ではありません。臨床概念が異なる表現の物語全体で一貫した意味的特徴を持つこと、そして言語を理解するよう訓練されたモデルが、循環器専門医が「EF 40%」と書こうが「左室収縮機能中等度低下、推定EF 40-45%」と書こうが、「駆出率」を見つけ出せるという原理に基づいています。

臨床データ抽出における中核的な非効率性は、文書が紙であることではありません。文書が散文——豊かで、ニュアンスに富み、臨床的に価値のある散文——として存在する一方で、そのデータを必要とするシステムが構造化されたフィールドを要求することにあります。 デジタル化の問題は解決済みです。構造化の問題こそ、何十億もの人件費が費やされている領域なのです。

臨床データの構造化の本当の意味

ボトルネックがデジタル化ではなく構造化にあるなら、解決策はより高性能なスキャナーやより速いタイピストではない。必要なのは、人間の抽象化担当者が読むように臨床記述を読み解くシステム、すなわち各文の意味を理解し、どの概念がどのレジストリフィールドに対応するかを特定し、人間が検証可能な構造化データを生成するシステムである。

これは、ほとんどの文書自動化ツールが本来想定していたタスクとは根本的に異なる。請求書や発注書を処理する従来の文書抽出ツールは、フォームのレイアウトを学習することで動作する。「請求書番号」は右上、「合計」は最終ページの下部にある、というように記憶する。同じベンダーから新しい請求書が届けば、同じ座標を読み取って同じフィールドを抽出する。異なるベンダーが異なる形式の請求書を送ってくれば、新しいテンプレートが必要になる。

臨床記述は、このアプローチを二つの点で無効にする。第一に、固定レイアウトが存在しない。A病院の退院サマリーとB病院の退院サマリーは、どちらも記述文書だが、情報の整理方法、使用する見出し、臨床概念を表現する語彙が異なる。第二に、そしてより根本的には、データ自体が位置に依存しない。手術記録の特定のボックスに「クロスクランプ時間47分」と書かれているわけではない。それは段落の中に埋め込まれ、他の手術詳細に囲まれ、外科医の好みの散文スタイルで書かれている。

セマンティック抽出は、位置ではなく意味に基づいて動作することでこの問題を解決します。VLMは文書全体を読み取り、どのような臨床概念が存在するかを理解し、各概念に対応する値を抽出します。概念がページ上のどこに現れるか、著者がどのような表現を使ったか、文書がタイプされたPDF、スキャンされたレポート、EHRインターフェースのスクリーンショットのいずれであるかは問いません。抽出器は新しい病院の文書形式ごとに再トレーニングする必要はありません。なぜなら、形式を学習しているのではなく、概念を認識しているからです。

実際のワークフローは「AIがアブストラクターを置き換える」ではありません。「AIが読み取り工程を担当し、アブストラクターが検証工程を担当する」です。AIは手術記録、退院サマリー、心エコー報告書、フォローアップノートから、STS心臓外科レジストリの200以上のフィールドを自動入力します。アブストラクター(心臓外科経験のある看護師)は、入力されたフィールドをレビューし、抽出エラーを修正し、曖昧なケースに臨床的判断を適用し、検証済みのエントリーを提出します。アブストラクターの時間は、データを見つける(Carta調査によると勤務時間の50%以上を占める、80ページのEHR文書をスクロールする作業)から、データを検証する(臨床専門知識を必要とし自動化できない作業)へと移行します。

CABG患者の抄録作成が現在45〜90分かかり、複数のEHRモジュールにわたる術前・術中・術後の文書化を要する場合、初期データ抽出を担う意味抽出ツールにより、抄録担当者の1件あたりの作業時間を半減以上に削減できます。計算は単純です。時給40ドルのRN抄録担当者が年間1,300件のCABG症例(MGHがSTS心臓レジストリに報告した件数)を処理し、AI支援による抽出で1件あたり30分を節約できれば、年間650時間のRN労働が回収され、約26,000ドルの人件費が転記業務から検証・品質改善業務へと振り向けられます。5つのレジストリ、2,400の病院にわたれば、その総和は誤差の範囲では済みません。

よくある質問

なぜEHRは臨床文書をデフォルトで構造化しないのですか?

構造化データ入力(ドロップダウン、チェックボックス、制約付き語彙)は、臨床医の思考やコミュニケーションの方法と根本的に相容れないからです。チェックボックスでは「胸痛:あり」を記録できても、「患者は約2週間前から発症、労作時に悪化し安静で軽快する、左肩に放散する間欠的な胸骨下の圧迫感を訴え、頻度は増加傾向」という表現はできません。チェックボックスは請求コードを記録しますが、ナラティブは臨床的思考を記録します。臨床医に構造化フィールドのみでの文書作成を強制すれば、機械が読めても他の臨床医が活用できないデータが生まれます。このトレードオフは現実のものであり、医療界は正しくも、機械に優しい文書よりも臨床的に有用な文書を選択しています。

一般的な病院はいくつの臨床レジストリに参加していますか?

地域病院は通常3~5のレジストリに参加しています。代表的なものとして、脳卒中(GWTG)、心臓カテーテル治療(NCDR CathPCI)、外科治療の質(ACS NSQIP)が挙げられます。大規模な大学病院は通常10~15のレジストリに参加しており、心臓外科(STS)、外傷(TQIP)、移植(SRTR)、腫瘍(NCDB)、および複数の専門サブレジストリにわたります。マサチューセッツ総合病院(MGH)の公開データでは11のレジストリをカバーしており、多くの大学病院はこれを上回ります。各レジストリにはデータ抽出のための専任スタッフ(FTE)が必要であり、レジストリ間でデータが共有されないため、FTEはさらに増加します。

手動抽出が必要な臨床文書の種類は?

最も抽出作業が発生する文書は、放射線レポート、退院サマリー、手術記録、経過記録、病理レポートです。これらは記述が多く、臨床的に最も豊富な情報が含まれています。検査値、投薬指示、バイタルサインは構造化データであり、EHRから直接エクスポートできます。手作業は、構造化フィールドでは捉えきれない臨床的推論やニュアンスを含む自由記述文書に圧倒的に集中します。

AIはレジストリ利用に十分な精度で放射線科レポートを実際に読めるのか?

視覚言語モデルは、放射線科の記述から腫瘍の寸法、左右差、画像診断モダリティ、フォローアップ推奨などの個別データポイントを、抽象化担当者が検証するための一次ツールとして活用できる精度で抽出できる。ただし、放射線科レポートには曖昧さ(断定を避ける所見、「約」と修飾された測定値)が含まれ、人間の解釈が必要なため、臨床レビューの代替にはならない。適切なアーキテクチャはAI支援型抽象化、すなわちモデルがフィールドを入力し、抽象化担当者が検証する方式である。これはCarta調査で抽象化担当者が望んだモデル、つまり臨床的判断を代替せずに手作業での検索時間を削減するツールと同じである。

デジタル化と構造化の違いとは?

デジタル化とは、紙のカルテをスキャンする、EHRからPDFを生成する、PACSに画像を保存するなど、文書を物理的な形態から電子形態に変換することです。文書はファイルになります。構造化とは、その文書の内容を、読み物形式の散文から、個別に検索可能なデータフィールドに変換することです。例えば、手術記録の段落から「クロスクランプ時間:47分」を抽出し、「cross_clamp_time_minutes」というデータベースフィールドに値「47」を入力することです。デジタル化は人間が読めるファイルを作り、構造化は機械が使えるデータを作ります。臨床文書における問題は、デジタル化は進んだものの、構造化がそれに続かなかったことです。そのため、病院では今も人手でこの作業を行っています。

臨床文書化の構造的真実: EHRは臨床データをデジタル化したが、構造化はしなかった。レジストリは構造化データを求めるが、それを記述から抽出できない。この相容れない二つのシステムの間には、何千人もの看護師や医療情報専門家が座し、一件の報告書、一つのフィールド、一つのレジストリごとに手作業でギャップを埋めている。彼らはしばしば同じ文書を読み、同じデータポイントを、五つの異なるシステムのために五回の別々のセッションで抽出している。そのコストは、単に抽象化担当者の給与だけではない。患者ケアからデータ転記へと転用される臨床の才能。病院が負担できず、したがってスキップするレジストリ参加——それにより品質のギャップは測定されないままだ。データが散文として存在し、それを構造化する予算を持つ者がいないために、問われることのない研究課題。AI抽出はこの問題のすべての層を解決するわけではない——臨床的判断、レジストリフィールド定義、支払者固有のルールは依然として人間の領域である。AIが解決するのは、そもそも人間が担うべきではなかった層、すなわち段落を読んで答えをボックスに入力するという層である。

📮 contact email: [email protected]