患者情報取込

AI患者情報フォーム→Excel変換 — 紙のフォームから病歴、同意チェックボックス、保険情報、基本情報を抽出

患者情報フォームの手動転記は、複数ページのパケット1件につき4~6分かかります(1ページ目:基本情報、2ページ目:病歴チェックボックス、3ページ目:保険詳細、4ページ目:同意書)。本ツールは各セクションをラベル付きExcel列に抽出し、1ページあたり5~10秒で完了します。

暗号化処理 · 変換後自動データ削除

PDF・スキャンフォーム
XLSX/CSV
チェックボックス・署名

患者問診票から抽出できる情報

必要な列名を入力するだけで、AIが各問診票の意味を理解し、「糖尿病の家族歴」横のチェックボックス、スキャンされた保険証画像に埋もれた会員番号、同意書ページの署名欄などから値を自動抽出します。

患者名(名)
患者名(姓)
生年月日
電話番号
保険会社
保険証番号
緊急連絡先
病歴(チェックボックス)
現在の服薬
アレルギー
かかりつけ医
同意書(はい/いいえ)

本ツールはカスタム列抽出を採用しています。出力スプレッドシートの列名(「保険証会員番号」「病歴—糖尿病」「アレルギー」など)を指定すると、AIは固定テンプレートや座標ではなく、フィールドラベルの意味を理解して各フォームの該当値を特定します。そのため、異なるクリニックが独自のレイアウトで作成した問診票でも、同じ列名セットが機能します。チェックボックスは症状ごとに「はい/いいえ」で読み取られ、「高血圧」にチェックがあれば「はい」、「喘息」が空白なら「いいえ」として、それぞれ独立した列に記録されます。また、推論列も定義可能です。例えば「年齢区分(選択肢:小児/成人/高齢者)」という列を作成すれば、AIが生年月日から患者の年齢を計算し、該当する区分を自動分類します。フォーム上に明示的な年齢フィールドがなくても対応できます。

テンプレート抽出が患者情報入力フォームで機能しない理由と、本ツールの違い

患者情報入力フォームは単一の表形式文書ではありません。複数ページにわたるパケットであり、人口統計情報は1ページ目、チェックボックスが多数の病歴質問票はさらに2ページ、保険情報は別のシート(多くの場合スキャンされたカード画像)、法的同意書と署名は最終ページにあります。従来のOCRやテンプレートベースのツールはこれらを適切に処理できません。チェックボックスのグリッドは行ベースのOCRを混乱させ、複数ページ構造はページ単位のテンプレートを破綻させ、「家族のがん歴」などの自然言語ラベルは下流システムが期待する標準コード(FHIR/SNOMED)と一致しません。

01

問診票は独立したチェックボックスのグリッドだが、テンプレートベースのOCRはテキスト行として読み取り、Yes/Noの状態を認識しない。 一般的なシステムレビュー欄には、「糖尿病 ☐、高血圧 ☐、喘息 ☐、心疾患 ☐」のように、それぞれにチェックボックスが付いた15~20の症状が並ぶ。座標でフォーム項目を読み取るテンプレートツールは、ラベルテキスト(「糖尿病」)を取得できても、チェックボックスはテキストではないため、その状態を完全にスキップする。チェックボックス検出を試みるツールでも、すべての症状を「糖尿病 高血圧 喘息 心疾患」という単一のテキストブロックにまとめてしまい、どの症状がYesでどの症状がNoだったかが失われる。結果として、誰かが各フォームを目視で確認し、どのボックスにチェックが入っていたかを手動で記録しなければならない。

02

1ページ目に患者名、3ページ目に病歴——テンプレートツールは各ページを別々の文書として扱う。 患者受付書類は通常4~6ページ。1ページ目は基本情報、2ページ目は病歴(その1)、3ページ目は病歴(その2)と服薬リスト、4ページ目は保険情報、5ページ目は同意書と署名。各ページを独立して処理するテンプレート型ツールでは、データが断片的に抽出される——患者名はある出力行に、病歴のチェックボックスは別の行に、互いの関連性なく配置される。どの病歴がどの患者に属するかを突き合わせるには、抽出後の手作業によるクロスリファレンスが必要となる。

03

各クリニックが独自の問診票をデザインしており、あるクリニックのレイアウトに合わせたテンプレートは、別のクリニックでは役に立たない。 全国統一フォーマットの請求書(UB-04、CMS-1500)とは異なり、患者問診票はクリニックごとに異なる。ある医院では「保険者番号」を右上に配置するが、別の医院では保険証のコピーの横、ページ中央に配置する。カイロプラクターの問診票には「過去の脊椎手術」の項目がある一方、皮膚科医の問診票には「皮膚がんの既往歴」を尋ねる欄がある——同じフォーム構造でも、病歴のチェックボックスはまったく異なる。テンプレートツールでは、クリニックごとに異なるレイアウトに対応する抽出設定を個別に作成・維持する必要がある。クリニックが問診票を更新し、病歴質問の順序を変更したり、新しい同意セクションを追加したりすると、テンプレートは機能しなくなり、再構築が必要になる。

01

既往歴の各項目に個別の列を定義 — AIはラベルとチェックボックスの状態を両方読み取ります。 列名は「既往歴 — 糖尿病」「既往歴 — 高血圧」「既往歴 — 喘息」のように、質問票の項目ごとに1列ずつ設定します。AIは各チェックボックスを文脈ごとに読み取り、「糖尿病」の横にチェックがあれば糖尿病の列に「はい」、喘息の横にチェックがなければ喘息の列に「いいえ」と記録します。各項目が独自の「はい/いいえ」値を持つ個別の列になるため、テキストが一塊になったりチェック状態が失われることはありません。異なる既往歴質問票を持つ診療所でも同様の考え方が適用でき、各診療所の特定の項目に合わせて列を定義すれば、AIはあらゆるレイアウトに対応します。

02

AIが複数ページの文書を1つの患者記録として読み取り、1ページ目の基本情報と3ページ目のチェックボックスを同じ出力行に紐付けます。 すべてのセクションにまたがるカラムを定義します。「患者名」「生年月日」「保険会員番号」「病歴—糖尿病」「同意書署名済み」など。AIは全ページをまとめて読み取り、1ページ目の基本情報ヘッダーから患者名を抽出し、3ページ目の糖尿病チェックボックスを認識して、両方を出力の同じ行に配置します。各完了した問診票は、フォームが何ページにわたっていても、スプレッドシートに1行として出力されます。これこそがマルチページフォーム処理の理想です:1フォーム、1行、全フィールド。

03

1つの列定義が、どのクリニックの問診票でも機能します。レイアウト、ページ数、質問内容に関係なく。AIはフィールドラベルの意味を理解して値を特定するため、画面上の位置に依存しません。「患者名」「生年月日」「保険者番号」「既往歴—糖尿病」といった同じ列名で、4ページの皮膚科問診票、6ページの理学療法問診票、2ページのカイロプラクティック問診票から正しくデータを抽出し、すべて同じバッチで処理できます。クリニックがフォームを更新してCOVID-19ワクチン接種の質問を追加したり、保険セクションを別のページに移動しても、AIは新しいレイアウトを以前と同じように読み取ります。クリニックごとのテンプレート設定、フォーム変更時の再設定、メンテナンスの手間は一切不要。これがテンプレートベースの抽出(フォームレイアウトごとに1つのテンプレート、永久に)と、セマンティック抽出(1セットの列名、あらゆるフォームレイアウト)の違いです。

患者情報入力パケットの束を一度にデジタル化する方法

アップロード — 届いたそのままのパケットを、理想ではなく

30人の新患から受付パケットを受け取ります。クリニックの患者ポータルが生成したきれいなデジタルPDFもあれば、フロントでスキャンされた紙の書式(200dpi、少し傾きあり)、保険証が保険ページにコピーされたもの、2件は患者が医療歴を黒ではなく青ペンで記入したものもあります。ページ数もさまざまで、皮膚科は4ページ、理学療法は6ページに詳細な機能評価が付き、カイロプラクティックは2ページで痛みの部位図に特化しています。30件すべてのパケットを1つのバッチとしてアップロードしてください。診療所、形式、ページ数による事前仕分けは不要です。コレクションリンク(来院前に患者に送信する共有可能なURL)を使用すれば、患者が記入済みの書式を直接処理キューにアップロードするため、来院時にはすでにデジタル化された状態で届きます。

カラムを定義 — 患者データベースに必要な項目

出力スプレッドシートの列名を入力してください:患者名(名)患者名(姓)生年月日電話番号保険会社保険会員番号病歴 — 糖尿病病歴 — 高血圧現在の服薬アレルギー同意書署名。チェックボックス項目では、AIが各条件ラベルと対応するチェックボックスを読み取り、皮膚科フォームの2ページ目にある「糖尿病 ☑」と理学療法フォームの3ページ目にある「糖尿病 ☑」を見つけ、同じ列に「はい」と記録します。同意署名欄では、AIが署名欄に署名があるかどうかを検出し、署名があれば「はい」、空白なら「いいえ」と記録します。計算列を定義することもできます。たとえば、転倒リスクスコアという列を作成し、転倒リスクに関するチェックボックス質問群の「はい」の数をカウントするよう指示すれば、リスク評価を別途Excelで行うのではなく、抽出時に計算できます。

出力 — 患者1行、全ページの全項目をラベル付き列に

Excelファイルをダウンロード。各行は1件の完了した患者受付パケットを表します。1ページ目の患者名、3ページ目の糖尿病チェックボックス、5ページ目の同意署名がすべて同じ行に集約。病歴列は各疾患に対して「はい」「いいえ」を表示 — 「病歴 — 糖尿病 = はい」でフィルタすれば糖尿病患者リストが即座に生成。保険会員番号列で紙の書類をめくることなく電子的に資格確認が可能。受付フォームが皮膚科4ページと理学療法6ページにまたがっても、それぞれが正確に1行を生成 — 患者1人、記録1件、全項目を網羅。XLSX、CSV、JSONでエクスポート可能。

最適な使用シーンと結果確認が必要なケース

主要な診療管理プラットフォームの標準的な印刷患者受付票や、スキャン品質の良い紙の書類では高い抽出精度を発揮します。大量処理の前に、いくつかの書類条件と適用範囲の境界を理解しておくことをお勧めします。

安定して処理可能

診療管理プラットフォームからデジタル生成された問診票。Athenahealth、eClinicalWorks、Kareo、Practice Fusion、その他のEHR/診療管理システムで生成されたPDFを高精度で抽出。これらのネイティブデジタル文書は、チェックボックスグリッド、入力済みテキストフィールド、一貫したラベルと値のレイアウトが鮮明にレンダリングされています。

病状ラベルが印刷された病歴チェックボックスグリッド。AIが各チェックボックスのラベル(例:「糖尿病」「高血圧」)とチェック状態を読み取り、病状ごとにYes/Noを別々の列に出力します。これは、チェックボックスが四角、丸いラジオボタン、またはチェックマークボックスのいずれであっても機能します。AIはマークの有無を識別し、形状は無視します。

複数ページの問診票を1つの患者記録として処理。5ページの問診票を1つのマルチページPDFとしてアップロードすると、AIが全ページをまとめて読み取り、1ページ目の患者名、3ページ目の病歴チェックボックス、5ページ目の同意署名をすべて同じ出力行にリンクします。

スキャン画像からの保険証データ抽出。保険証が専用画像としてアップロードされた場合でも、インテーク用紙の保険ページにコピーされた場合でも、AIが保険会社名、会員番号、グループ番号、Rx BIN/PCN(存在する場合)を抽出します。主要保険会社(Blue Cross、UnitedHealthcare、Aetna、Cigna)の標準的な保険証レイアウトからは、最も高い精度で抽出できます。

要確認のケース

本機能は問診票からデータを抽出するものであり、EHR/EMRシステムとの連携やICD-10/SNOMEDコードの検証は行いません。 紙の問診票からフォームフィールドやチェックボックスの状態を読み取り、構造化されたExcelデータを出力します。Epic、Cerner、その他のEHRシステムとHL7/FHIR APIを介して接続することはなく、「E11.9」が有効なICD-10コードであるかの検証や、「がんの家族歴」のような自然言語のフォームラベルを標準化されたSNOMED CTコードにマッピングすることも行いません。出力はEHRにインポート可能なスプレッドシートです。フォームラベルからEHRコードへのマッピングはお客様の責任となります。

紙の問診票に手書きされた病歴は、チェックボックスの精度を低下させます。 患者が欄外に追加の症状を手書きした場合(「2019年に甲状腺手術も受けた」など)や、チェックマークが極めて薄くスキャンでほとんど認識できない場合、AIは見逃したり、筆記体を誤解釈する可能性があります。標準的な印刷されたチェックボックスグリッドに明確なマークがある場合の精度は高いですが、注釈が多い、またはマークが薄い紙の問診票については、最初の数行の出力にある「病歴」列を確認し、見逃された手書きの注釈があれば再入力してください。

チェックボックスのグリッド線が背景に溶け込んだ、かすれたコピーの問診票。 3世代目のコピーなど、チェックボックスのグリッド線が用紙の背景とほとんど見分けがつかない場合、AIがチェック欄に記入があるのか、グリッド印刷の裏抜けなのかを誤認識する可能性があります。問診票がかすれていたり、何度もコピーされたものの場合は、データを患者データベースにインポートする前に、出力の「はい/いいえ」の値が原本と一致しているかを目視で確認してください。

患者が用紙自体に記入せず、「別紙参照」と書いた問診票。 患者が「現在の服薬」欄に「別紙リスト参照」と記入し、別途手書きのリストをホチキス止めしている場合、AIは「別紙リスト参照」というテキストを抽出しますが、添付書類を参照してその内容を統合することはありません。添付書類は、問診票と一緒に別の画像としてアップロードし、そのデータ用の列名を指定した場合にのみ処理されます。正確な結果を得るには、服薬リストの添付書類をバッチの一部としてアップロードするか、患者にすべての項目を直接用紙に記入するよう依頼してください。

よくある質問

糖尿病、高血圧、喘息などの病歴チェックボックス(はい/いいえ)を読み取れますか?

はい。病歴質問票の各項目に個別の列を定義します(例:「病歴—糖尿病」「病歴—高血圧」「病歴—喘息」)。AIは各チェックボックスを文脈に沿って読み取り、ボックス横のラベル(例:「糖尿病」)と、チェック、丸印、空白のいずれかを識別し、正しい列に「はい」または「いいえ」を記録します。これは、ラベルテキストは読み取ってもチェックボックスの状態を無視し、「糖尿病」を文字列として抽出するだけで患者が実際に罹患しているかが分からない座標ベースのOCRとは根本的に異なります。AIはラベルとマークの両方を読み取ります。「高血圧」横のチェックは「はい」、「喘息」横の空白は「いいえ」です。四角ではなく丸を使用するフォームや、患者によってチェックマークと線の引き方が異なる場合でも、AIは特定のチェックボックスのスタイルに関係なくマーキングパターンを識別します。グラフィックの形状だけでなく、視覚的な意味を読み取るからです。

複数ページの入力フォームで、患者名が1ページ目、病歴が3ページ目にある場合、どのように処理されますか?

AIは複数ページの文書全体を1つのレコードとして読み取ります。「患者名(名)」「患者名(姓)」「病歴—糖尿病」などの列を定義すると、AIは1ページ目(通常は基本情報ヘッダー部分)の名前フィールドと、3ページ目(病歴質問票セクション内)の糖尿病チェックボックスを特定し、両方を同じ出力行に配置します。これは列定義がページに依存しないためです。AIは各フィールドの意味を理解して文書全体から値を検索するので、特定のページの特定の位置にあることを前提としません。皮膚科の5ページの書類、理学療法の6ページの書類、カイロプラクティックの2ページの書類を同じバッチでアップロードしても、各フィールドがどのページにあっても、すべてのフィールドが入力された1つの出力行が生成されます。これが、単一ページのテンプレート抽出(各ページを独立した文書として扱う)と、複数ページの意味的抽出(書類全体を1つの患者レコードとして扱う)の決定的な違いです。

チェックボックスの回答からリスクスコアを自動計算するために、Computed Columnsは使えますか?

はい。 Computed Columnsを使用すると、AIが抽出時に実行する計算を定義できるため、出力にはチェックボックスの生の回答だけでなく、計算結果も一度に含めることができます。転倒リスクスコアを計算するには、転倒リスクスコア(「はい」の回答をカウント:転倒歴、歩行不安定性、めまい、多剤服用 — 出力:合計/4)のような列を定義します。AIは各チェックボックスを読み取り、指定した条件の「はい」の回答をカウントし、数値スコアを転倒リスクスコア列に直接出力します。Excelでの別途数式ステップは不要です。これは、PHQ-9うつ病スクリーニング合計、心血管リスク因子数、アレルギー重症度スコアリングなど、あらゆる計算パターンで機能します。医療用紙のチェックボックスグループは、個々の「はい/いいえ」の回答を合成結果に変換するComputed Columnにデータを渡すことができます。Computed Columnsは、列名(単純なカウントや合計の場合)またはルール形式(複数ステップの導出の場合)で直接定義でき、ログインユーザーが利用できます。

処理中の患者データは安全ですか?HIPAA対象の問診票に使用できますか?

アップロードされたすべての書類はTLS 1.3暗号化接続で送信され、抽出セッション中にメモリ上で処理されます。変換完了後、ファイルは自動的に削除されます。サーバーに保存されたり、モデル学習に使用されたり、アクティブな処理セッション以外の目的で保持されることはありません。本ツールはEHR/EMRシステムと連携しないため、抽出中に患者データがシステム間を移動することはありません。ただし、ImageToTable.aiはHIPAAの対象事業者ではなく、現在ビジネスアソシエイト契約(BAA)を提供していません。貴院がHIPAAの対象であり、PHIに触れる第三者サービスにBAAの署名が必要な場合、これはコンプライアンス要件に対して評価すべき制限事項です。直接的なPHI識別子を含まない問診票を使用する場合(またはアップロード前に匿名化する場合)、本ツールは実用的なデジタル化の手段を提供します。これは、裏付けの取れないコンプライアンス主張を行うのではなく、現在の範囲について透明性を保つ領域です。BAAレベルのHIPAAコンプライアンスが必要なユースケースでは、患者識別情報をアップロードする前に、本ツールが貴組織の要件を満たすことをご確認ください。

クリニックごとに入力フォームのレイアウトがまったく異なる場合、個別のテンプレートが必要ですか?

個別のテンプレートは不要です。AIはフィールドラベルの意味(「保険証加入者ID」「生年月日」「アレルギー」など)を理解して値を特定するため、画面上の位置ではなく、1つの列名セットでまったく異なるレイアウトの入力フォームから同じデータ型を抽出できます。皮膚科クリニックでは「保険証加入者ID」が右上のヘッダーブロックに、理学療法クリニックではスキャンされた保険証の横の中段に、カイロプラクティッククリニックでは1ページ目の下部「請求情報」セクションの下に配置されていても、AIは3つのレイアウトすべてでラベルのコンテキストを読み取って値を特定するため、クリニックごとの設定は不要です。クリニックが入力フォームを更新し、保険セクションを別のページに移動したり、COVID-19ワクチン接種歴セクションを追加したりしても、データがフォーム上のどこかに存在すれば、同じ列名が引き続き機能します。これは、テンプレートベースの抽出(フォームレイアウトごとの固定座標)とセマンティック抽出(レイアウトを問わずフィールドの意味を理解)の本質的な違いです。定義した列がフォームに存在しない場合(例:あるクリニックの入力フォームに「アレルギー」セクションがない場合)、該当セルは出力で空白になります。これは正しい動作です。データがない場合は抽出されないということです。

関連記事:フォームデータをExcelに抽出する方法(手入力不要) — AIの列定義を活用して、あらゆる紙フォーム(アンケート、申込書、受付票)を構造化Excelに変換する完全ガイド。OCRを超えて:AIが手書きフォーム、チェックボックス、調査記号を読み取る仕組み — ビジョンAIがチェックマークと汚れを区別し、各回答を正しいフィールドにマッピングする技術解説。紙フォームのデータ収集が管理者の想定以上にコストを要する理由 — 医療現場に特に大きな負担となる人件費、エラー、保管、コンプライアンスの隠れたコスト。一般的な医療機関では年間26,600ドルに上る実態。

📮 contact email: [email protected]