ドキュメント抽出のコスト比較:1ページあたり vs 月額料金
実際に支払う金額
AIドキュメント抽出の1ページあたりの広告価格は、0.015ドル(AWS Textractの基本OCR)から0.50ドル以上(Nanonetsのエンタープライズ抽出)までありますが、これらの数字は異なるものを比較しています。AWS Textractの「ページ」は物理的なシートです。Docparserの「ページ」は最大5ページ分をカバーするクレジットです。Google Document AIの「ページ」は、使用するプロセッサと、専門の請求書パーサーか汎用フォームパーサーかによって異なります。価格ページの数字は、実際に支払う金額ではありません。
重要ポイント
- 3ページの請求書の場合、ある抽出ツールでは0.045ドル、別のツールでは0.39ドルかかります。広告の1ページあたりの料金はほぼ同じですが、各ツールが「ページ」をまったく異なる単位として定義しています。
- 月1,000件のドキュメントの場合、ツール間の実際のコスト差は約11倍になります。そして、価格ページには、積み重なるAPI機能、期限切れの許容量、実効レートを2倍にするインフラストラクチャのオーバーヘッドなど、その差を生む隠れたコストは一切表示されていません。
- ツールを比較する前に、実際の月間ボリュームでモデル化してください。画像ごとの料金プランでは、ファイルが1ページでも10ページでも同じ0.06ドルが請求されます。つまり、ページ数が増えればコストも増えるという前提が崩れ、複数ページのドキュメントワークフローにおける計算が根本的に変わります。
「ページ」定義の落とし穴
ドキュメント抽出の価格設定で最も誤解を招く数字は、1ページあたりの料金です。間違っているからではなく、その単位がツールごとに異なるからです。
3ページの請求書がその問題を完璧に示しています。AWS TextractのAnalyzeDocument APIでは、その請求書の料金は$0.015 × 3 = $0.045(基本フォームの場合)です。DocparserのStarterプラン(月額$39で100クレジット)では、1クレジットで最大5物理ページをカバーするため、同じ3ページの請求書は1クレジット、つまりエントリープラン料金で約$0.39です。ImageToTable.aiでは、1クレジットはアップロードされたファイル内のページ数に関係なく1画像に相当するため、3ページのPDFアップロードは1クレジット、Basicプランで$0.06です。Google Document AIのInvoice Parserでは、10ページごとに$0.10を支払います。ドキュメントが1ページでも10ページでも、最初の10ページは$0.10です。
あなたは「ページ」の4つの異なる定義(物理シート、処理クレジット、ドキュメント単位の料金、階層型処理ブロック)を比較し、結果の数値を同等として扱っています。しかし、それらは同等ではありません。
| ツール | 「ページ」の意味 | 3ページ請求書のコスト | 1ページ領収書のコスト | 10ページ契約書のコスト |
|---|---|---|---|---|
| AWS Textract(フォーム+表) | 物理ページ | $0.195 | $0.065 | $0.65 |
| Google Document AI(フォームパーサー) | 物理ページ | $0.09 | $0.03 | $0.30 |
| Google Document AI(請求書パーサー) | 10ページ処理ブロック | $0.10 | $0.10 | $0.10 |
| Docparser(1クレジット=最大5ページ) | ドキュメントクレジット | 1クレジット(約$0.39) | 1クレジット(約$0.39) | 2クレジット(約$0.78) |
| Parseur | 物理ページ | 3ページ(約$0.39) | 1ページ(約$0.39) | 10ページ(約$0.99) |
| ImageToTable.ai(1クレジット=1画像) | アップロードファイル | 1クレジット($0.06) | 1クレジット($0.06) | 1クレジット($0.06) |
同じ3ページの請求書でも、ツールが使用する「ページ」の定義によって、$0.045(AWS基本OCR)から$0.39(Docparserエントリープラン)までのコストがかかります。最安値と最高値の比率は約9倍ですが、宣伝されている1ページあたりの料金はすべて$0.015〜$0.06の同じ範囲内です。実際のコストを左右するのは、料金の差ではなく、定義の差なのです。
ページ単位API課金の実際の仕組み
ページ単位API課金は、クラウドインフラ事業者が採用するモデルです。処理したページごとに料金が発生し、利用量に応じて単価が下がる段階制を採用しています。単価は予測可能ですが、月額費用は利用量に上限がないため予測が困難です。
AWS Textractは物理ページ単位で課金し、機能の組み合わせによって料金が変わります。基本のテキスト検出は1,000ページあたり1.50ドル(1ページあたり0.0015ドル)。フォームとテーブル抽出を追加すると、月間100万ページまでは1,000ページあたり65ドル(1ページあたり0.065ドル)になります。フォーム、テーブル、カスタムクエリを組み合わせると、1,000ページあたり80ドル(1ページあたり0.08ドル)に達します。このモデルは加算方式で、同じページにDetectDocumentTextとAnalyzeDocumentを適用すると、両方の処理に対して課金されます。
Google Document AIも同様のページ単位モデルですが、プロセッサごとに料金が設定されています。Form Parserは月間100万ページまで1,000ページあたり30ドル(1ページあたり0.03ドル)。専門プロセッサは異なる単位を使用し、Invoice Parserは10ページごとに0.10ドル(実質1ページあたり0.01ドル)、Bank Statement Parserは文書の長さに関わらず1文書あたり0.75ドルです。Googleのモデルでは、同じ長さの文書でも、処理するプロセッサによって料金が異なる場合があります。
APIのページ単位課金の魅力はシンプルで、使った分だけ支払う点です。月額最低料金も契約期間もなく、未使用クレジットが期限切れになることもありません。その代わり、ページ単価は非常に高い利用量(AWSの段階割引では月間100万ページ以上)に達するまで実質的に下がらず、APIパイプラインの統合と保守にかかるインフラコスト(開発者の時間、文書ステージング用のストレージ、APIバージョン更新に伴う継続的なメンテナンス)は料金ページには表示されません。
APIベースのツールとテンプレート不要の代替手段の詳細な比較については、トレーニング不要の文書抽出ツールガイドをご覧ください。
サブスクリプションとクレジット制の料金体系の仕組み
サブスクリプション料金は、ページ数・ドキュメント数・クレジット数といった処理単位を月額料金にまとめたものです。表示価格は1ページあたりの単価より高く見えますが、上位プランになるほど実質的な1単位あたりのコストは下がります。
Docparserはクレジット制を採用しており、1クレジットで1ドキュメント内の最大5ページ(物理ページ)を処理できます。Starterプランは月額39ドルで100クレジットです。1ページの請求書は1クレジット(0.39ドル)、5ページの発注書も1クレジット(0.39ドル)、6ページの契約書は2クレジット(0.78ドル)かかります。このクレジットモデルは、ドキュメントのページ数が多いほど1物理ページあたりのコストが下がるため有利ですが、1ページのレシートと5ページの契約書が同じ1クレジットになるため、非常に短いドキュメントには不利です。
Parseurはサブスクリプション内でシンプルな1ページ単位の料金を採用しています。エントリープランは月額39ドルで100ページ、Proプランは月額99ドルで1,000ページ(1ページあたり0.10ドル)、Scaleプランは月額399ドルで10,000ページ(1ページあたり0.04ドル)です。各ページは物理ページであり、まとめ処理はありません。3ページの請求書は割り当ての3ページを消費します。このモデルはシンプルですが、複数ページのドキュメントには割高です。
ImageToTable.aiは画像(アップロードファイル)単位のクレジットモデルを採用しています。1クレジットで、アップロードされた1つの画像またはPDFを、そのページ数に関わらず処理します。Basicプランは月額9ドルで150クレジット(1クレジットあたり0.06ドル)、Proプランは月額29ドルで500クレジット(同0.058ドル)、Maxプランは月額59ドルで1,500クレジット(同0.039ドル)です。従量課金オプションもあり、1クレジットあたり0.06ドルで有効期限はありません。1ページのドキュメントと複数ページのドキュメントを混在して処理するユーザーにとっては、複数ページのドキュメントに追加料金がかからないため、画像単位のモデルは一貫してページ単位のモデルより低コストです。
APIの1ページ単位の料金とサブスクリプション料金の本質的な構造の違いは、表示価格ではなく、変動リスクを誰が負うかです。1ページ単位のAPI料金は、処理量の変動をそのまま請求額に反映します。サブスクリプション料金は、最大額をプランの割り当て量に抑え、超過した場合に追加料金が発生します。どちらが有利かは、月ごとの処理量がどれだけ安定しているかに完全に依存します。
実際のコスト比較:月100件、500件、1,000件のドキュメント
ページ単価と月額料金を公平に比較するには、同じワークロードを両方のモデルで計算する必要があります。以下は、3つの一般的なドキュメント量における実際の月額コストです(1ドキュメントあたり平均2.5ページ、請求書や発注書、銀行取引明細書の標準的な範囲を想定)。
| ツール | 料金モデル | 100件(250ページ) | 500件(1,250ページ) | 1,000件(2,500ページ) |
|---|---|---|---|---|
| AWS Textract(フォーム+表) | ページ単位API | $16.25 | $81.25 | $162.50 |
| Google Doc AI(フォームパーサー) | ページ単位API | $7.50 | $37.50 | $75.00 |
| Google Doc AI(請求書パーサー) | ブロック単位API | $2.50 | $12.50 | $25.00 |
| Docparser Business | サブスクリプション(100クレジット) | $159.00* | $318.00* | $636.00* |
| Parseur Pro | サブスクリプション(1,000ページ) | $99.00** | $99.00 | $198.00** |
| ImageToTable.ai Max | サブスクリプション(1,500クレジット) | $59.00 | $59.00 | $59.00 |
| ImageToTable.ai PAYG | プリペイドクレジット | $6.00 | $30.00 | $60.00 |
* Docparser:1ドキュメントあたり平均2.5ページの場合、100件=100クレジット(Starterプラン、最大500物理ページまで対応、ただし含まれるのは100クレジットのみ)。250物理ページでは上位プランへのアップグレードが必要。** Parseur:Proプランは1,000ページを含む — 500件で1,250ページになると超過料金が発生。
この表から、ページ単価だけではわからないパターンが明らかになります。単価よりもモデルの形状が重要です。Google Document AIのInvoice Parserは実効レート$0.01/ページで一見最も安く見えますが、それは請求書処理の場合のみ。銀行取引明細書の抽出に切り替えると、レートは$0.75/ドキュメントに跳ね上がります。Docparserの$0.39/クレジットは、1クレジットで最大5物理ページを処理できるため、他社のページ単価と単純比較できません。ImageToTable.aiのイメージ単位クレジットでは、1,000件のマルチページドキュメントのバッチも、1,000件のシングルページレシートと同じ$59で処理可能。一方、ページ単位モデルでは同じバッチが2.5倍のコストになります。
月1,000ドキュメントの場合、この表で最も安いオプションと最も高いオプションの差は約11倍。どのページ単価の広告を見ても、この事実はわかりませんでした。
損益分岐点分析:各モデルが有利になるのはどのような場合か?
適切な価格モデルは、ドキュメントのボリューム、ドキュメントの長さ、ボリュームの安定性という3つの変数によって決まります。各モデルタイプの損益分岐点は以下の通りです。
従量課金APIが有利な場合:ボリュームが少なく予測不可能な場合 — 月間150ページ未満で、月ごとの変動が大きい場合。このレベルでは、サブスクリプションの未使用枠は直接的な損失となります。AWS TextractやGoogle Document AIの基本OCRでは、100ページの単一ページ文書で1文書あたり0.05~0.22ドルと低コストですが、意味のある抽出機能を備えた最も安いサブスクリプションプランは月額9ドルからです。サブスクリプションとの損益分岐点は、月額料金と従量課金コストが収束する月間150~200ページあたりです。それ以下では、使用しない容量に対して支払っていることになります。
画像単位クレジットプラン(ImageToTable.aiなど)が有利な場合:ドキュメントが複数ページで、ボリュームが中程度の場合。従量課金モデルはページが増えるごとにコストがかかりますが、画像単位モデルは10ページの契約書も1ページの請求書も同じ扱いです。請求書、契約書、発注書、銀行取引明細書など、短い文書と長い文書が混在する組織では、画像単位クレジットプランはどの従量課金モデルよりも一貫して低い実効レートを実現します。複数ページ文書における従量課金APIとの損益分岐点は、最初の複数ページアップロード時点で発生します。3ページの請求書はImageToTableでは0.06ドルですが、AWS Textractのフォームモデルでは0.195ドルです。
サブスクリプション価格が有利な場合:ボリュームが多く安定している場合 — 毎月500ページ以上を確実に処理する場合。このレベルでは、単価は最低水準に下がり、未使用枠のリスクは無視できます。重要な条件は安定性です。月間のボリューム変動が30%を超える場合、ピーク時のボリュームに合わせたサブスクリプションでは、閑散月に過剰に支払うことになります。また、1,000ページ以上の高容量プランは、同時処理や優先キューアクセスが必要なユーザーにとって、より優れた単価経済性を提供します。これらの機能は、従量課金APIモデルの基本料金には通常含まれていません。
従量課金クレジット(有効期限なし)が有利な場合:ボリュームは中程度だが予測不可能な場合、またはボリュームがバースト的に集中する場合。月初めの1週間で400件の書類を処理し、残りの3週間はほとんど処理しない簿記担当者は、サブスクリプション枠のほとんどを無駄にしてしまいます。有効期限のないプリペイドクレジットは、このようなパターンに自然に対応します。クレジットを定額で購入し、書類が届いたときに使用します。単価は最良のサブスクリプションティアよりわずかに高いですが(ImageToTableで0.06ドル対0.039ドル)、処理を1ヶ月でも休むと年間総コストは低くなります。
損益分岐点のまとめ:月間約150ページ未満では、従量課金または従量課金APIの方が安価です。150~500ページでは差が縮まり、適切な選択はドキュメントの長さとボリュームの安定性に依存します。500ページ以上で安定したボリュームがある場合、サブスクリプション価格が最も低い単価を実現します。単価は見出しに過ぎません。ボリュームの形状こそが決定要因です。
より広範なドキュメント抽出価格設定の状況 — 追加のボリューム層における詳細な1文書あたりのコスト表を含む — については、完全な2026年価格設定の内訳をご覧ください。
各料金モデルに潜む落とし穴
「1ページ単位か月額か」という選択の裏には、料金表に載っていないコストが存在します。導入から3ヶ月後に驚かないためにも、これらを理解することが不可欠です。
1ページ単位APIの落とし穴:
- 機能ごとの積み上げコスト。 AWS Textractは機能の組み合わせごとに個別に課金されます。1ページあたりのフォーム抽出は$0.05。テーブル抽出を追加すると合計$0.065。さらにクエリを追加すると$0.08になります。広告されている基本レートが、実際の抽出ワークロードで支払うレートになることは決してありません。
- インフラのオーバーヘッド。 API料金は推論コストのみをカバーします。ドキュメントストレージ(S3、Cloud Storage)、オーケストレーション用のコンピューティング(Lambda、Cloud Functions)、そして統合パイプラインの構築・保守にかかる開発者時間は別途支払う必要があります。中程度のボリュームでは、これらのコストで実質的な1ページあたりのレートが2倍になる可能性があります。
- 最低コミットメント。 Google Document AIの専門パーサーは10ページ単位で$0.10課金されますが、1ページだけ処理しても$0.10支払うことになります。未使用の9ページ分は繰り越されません。
サブスクリプションの落とし穴:
- 期限切れになる割り当て。 月500ページのサブスクリプションで300ページしか処理しなかった場合、未使用の200ページは請求サイクルの終了時に消滅します。年間で見ると、利用率60%の場合、処理しなかった840ページ分の料金を支払ったことになります。
- 超過料金。 プランの割り当てを超えると、多くの場合、プラン自体の実効単価の2~5倍の超過料金が発生します。月100クレジットで$39(1クレジット$0.39)のプランが、超過クレジット1つにつき$0.50以上を請求する可能性があります。これは、繁忙月のコストを不釣り合いに高くします。
- ティアの固定化。 上位のサブスクリプションティアに移行すると、月額料金は通常2倍または3倍になります。より高い割り当てが時々必要だが、普段は低いティアで運用している場合、中間の月は過剰に支払うか、ピーク月に超過料金のリスクを負うことになります。
クレジット・1画像単位の落とし穴:
- バンドルクレジットの有効期限。 一部のツールは30日、60日、または90日で期限切れになるクレジットパックを販売しています。これは実質的に月額サブスクリプションと同じですが、予測可能な割り当てがありません。
- 「1ドキュメント」と「1ページ」の曖昧さ。 クレジットが「1ドキュメント」をカバーする場合でも、ツール側のドキュメント定義がユーザー側と異なる(例:50ページのPDFを複数回の課金対象に分割するツールがある)と、予期せぬコストが発生する可能性があります。契約前に、実際に使用する最長のドキュメントで必ずテストしてください。
ドキュメント抽出におけるテンプレートベースのアプローチと学習不要のアプローチの詳細な比較(セットアップコストと抽出精度の両方に影響します)については、無料・低コストのドキュメント抽出ツールガイドをご覧ください。
よくある質問
書類抽出の実際の1ページあたりのコストを計算するには?
月額総コスト(サブスクリプション料金やAPI費用、インフラ費用を含む)を処理した物理ページ数で割ります。サブスクリプションツールの場合は、プランの割り当て量を実際に使用したページ数で割ります。例えば、100クレジットに39ドル支払っていても、60ページしか処理しなければ、実際の1ページあたりのコストは0.39ドルではなく0.65ドルです。従量課金のAPIツールの場合は、月間ボリュームに按分した開発者コストとインフラコストの見積もりを加算してください。
複数ページの書類では、1ページあたり課金と1書類あたり課金のどちらが安い?
複数ページの書類の場合、1書類あたり課金(または1画像あたり課金)の方がほぼ常に安価です。10ページの契約書の場合、1画像あたりモデルでは0.06ドルですが、APIツールによっては1ページあたりモデルでは0.30~0.65ドルになります。書類が長くなるほど、その差は大きくなります。1ページの書類の場合、1ページあたり課金と1書類あたり課金の差は通常ごくわずかです。
請求書抽出では、従量課金APIツールはサブスクリプションツールより高くなる?
ボリュームと書類の構造に完全に依存します。月50件の請求書(約125物理ページ)を処理する簿記担当者の場合、Google Document AIのInvoice Parserのような従量課金APIツールは月額約1.25ドルで、どのサブスクリプションよりもはるかに安価です。月1,000件の請求書(2,500ページ以上)を処理する会計事務所の場合、ImageToTable.ai Max(月59ドル)やParseur Pro(月99ドル)のようなサブスクリプションプランの方が、従量課金レートよりも低コストになります。この分岐点はツールによって異なりますが、通常は月200~500物理ページの間です。
書類抽出の料金で注意すべき隠れたコストは?
一般的に隠れている4つのコストがあります。(1) APIベースのツールにおけるインフラとエンジニアリングの間接費(ストレージ、コンピューティング、統合メンテナンス)。(2) 基本プランの単価の2~5倍になる超過料金。(3) 機能の積み重ね(同じページに適用する抽出機能ごとに個別に課金するAPIツール)。(4) クレジットの有効期限切れ(各請求サイクルで割り当て量をすべて処理しない場合、実質的に1ページあたりのコストが上昇します)。
月額契約なしでドキュメント抽出ツールを使えますか?
はい。月額契約不要で、従量課金制やプリペイドクレジットを提供するツールがいくつかあります。ImageToTable.aiは、有効期限なしのクレジット(1クレジット0.06ドル)と、アカウントやクレジットカード不要の無料ゲストモードを提供しています。AWS TextractやGoogle Document AIは、最低月額料金なしで1ページあたりの課金です。Parseurは月20ページの無料枠を提供しています。これらのオプションは、低ボリュームまたは不定期なドキュメント処理に最適です。
ドキュメント抽出の価格にはAIが含まれていますか?それとも単なるOCRですか?
ツールとプランによります。AWS Textractの基本の1ページあたりの料金($0.0015/ページ)は、生のOCR(テキスト検出のみ)をカバーしており、フィールド抽出や意味理解は含まれません。請求書番号、期日、明細項目などを特定する構造化抽出は、AIモデルを使用するため、かなり高額になります。同様に、ImageToTable.aiのようなサブスクリプションツールは、標準のクレジット単価の一部として、視覚言語モデルを使用した意味抽出を提供しており、別途AI追加料金はかかりません。価格を比較する際は、その料金がOCR出力のみをカバーするのか、AIによる完全なフィールド抽出を含むのかを必ず確認してください。その能力の差は大きく、価格差もそれを反映しています。
お客様のドキュメント構成は、価格ページで使用されたサンプルとは一致しません。実際のドキュメントで計算してみてください。変数が変わるたびに答えは変わります。