COI 데이터 추출이란?ACORD 양식을 구조화된 데이터로 변환

COI(보험 증명서) 데이터 추출은 스캔 또는 PDF COI 양식에서 증권번호, 피보험자명, 보상 유형, 한도, 효력일 및 만료일, 추가 피보험자 상태 등 주요 보험 필드를 자동으로 읽어 규정 준수 추적을 위한 구조화된 데이터로 출력하는 프로세스입니다. 사람이 각 ACORD 25 증명서를 열고 보험사 이름과 보상 한도를 수동으로 하나씩 스프레드시트 셀에 입력하는 대신, 추출 소프트웨어가 읽기와 데이터 입력을 몇 초 만에 수행합니다.

수작업 입력은 그만 — AI가 대신 읽어드립니다
이미지나 PDF를 업로드하세요 — 10초 만에 정형 데이터로
지금 체험하기
회원가입 불필요 · 카드 불필요 · 10초 내 결과
보험 증명서 데이터 추출 — ACORD COI 양식을 규정 준수 추적을 위한 구조화된 스프레드시트 데이터로 변환

핵심 요약

  1. 대부분의 COI 추출 도구는 각 필드가 있어야 할 위치에 상자를 그리고, 다음 대행사의 양식이 0.5인치만 어긋나도 조용히 잘못된 텍스트를 읽어들입니다.
  2. 단 한 하청업체 COI의 보상 한도 하나를 잘못 입력하면 수백만 달러의 책임 공백이 발생합니다. 템플릿 기반 도구는 대행사가 양식 레이아웃을 변경할 때마다 이런 오류를 만들어냅니다.
  3. 의미를 기준으로 필드를 읽는 추출 방식은 설정 없이 모든 대행사 형식을 처리합니다. 진정한 변화는 속도 향상이 아니라, 전사 오류가 더 이상 규정 준수 방정식의 일부가 되지 않는다는 점입니다.

COI 데이터 추출의 실제 의미

COI 데이터 추출은 증명서를 스캔하거나 OCR을 실행하는 것과 다릅니다. 스캔은 양식의 이미지를 제공합니다. OCR은 이미지를 읽을 수 있는 텍스트, 즉 구분되지 않은 문자 덩어리로 변환합니다. 추출은 더 나아가 어떤 텍스트가 증권 번호인지, 어떤 것이 일반 책임 총 한도인지, 어떤 것이 만료일인지 식별하고 각 값을 스프레드시트의 레이블이 지정된 열에 배치합니다. 출력은 텍스트 파일이 아닙니다. 구조화되고 필터링 및 정렬 가능한 데이터입니다.

이 데이터의 표준 매체는 미국 상업 보험 시장에서 가장 널리 사용되는 COI 양식인 ACORD 25 — "책임 보험 증명서"입니다. 협력 운영 연구 개발 협회(ACORD)가 개발한 이 한 페이지 양식은 100페이지가 넘는 증권의 보장 세부 정보를 표준화된 그리드로 압축합니다. 그러나 추출과 관련하여 중요한 점은 거의 모든 보험 대리점이 표준 ACORD 레이아웃을 수정한다는 것입니다. 일부는 자체 머리글과 바닥글을 추가합니다. 일부는 보장 섹션을 재배열합니다. 일부는 필드 위치를 이동시키는 전자 입력을 사용합니다. 일부는 여전히 약간 정렬이 어긋난 상태로 스캔되는 타자기로 작성된 종이 양식을 발행합니다. 양식은 이름만 표준화되어 있습니다.

ACORD 25 COI에서 일반적으로 추출되는 필드는 세 그룹으로 나뉩니다:

증권 식별

  • 명시된 피보험자
  • 증권 번호
  • 보험사
  • NAIC 번호
  • 생산자 / 대리점

보장 및 한도

  • 일반 책임 (1회 사고당 / 총액)
  • 자동차 책임
  • 근로자 재해 보상
  • 포괄 / 초과 책임
  • 전문가 책임 (해당 시)

날짜 및 당사자

  • 증권 개시일
  • 증권 만료일
  • 증명서 보유자
  • 추가 피보험자
  • 업무 설명

보장 한도 행을 올바르게 처리하는 것이 추출과 OCR을 구분하는 지점입니다. 일반 책임 섹션만 해도 최대 5개의 하위 한도(1회 사고당, 임차 건물 손해, 의료 비용, 인적 및 광고 침해, 일반 총액)가 있으며, 종종 대행사마다 열 정렬이 달라질 수 있는 컴팩트한 그리드로 표시됩니다. 위치가 아닌 의미를 읽는 도구는 한 대행사에서 "EACH OCCURRENCE"로, 다른 대행사에서 "PER OCC"로 레이블이 지정되어 있어도 "$1,000,000"을 1회 사고당 한도로 식별할 수 있습니다.

COI 데이터 추출 vs COI 추적 소프트웨어 vs 수동 검토

이 세 용어는 건설 컴플라이언스 논의에서 혼용되지만, 동일한 문제의 서로 다른 계층을 가리킵니다. 이를 혼동하면 필요하지 않은 문제를 해결하는 플랫폼을 구매하거나, 실제 필요한 부분을 놓칠 수 있습니다.

수동 COI 검토는 기본 단계입니다. 누군가 각 PDF 증명서를 열고, 피보험자 이름, 보험 증권 번호, 보상 한도, 만료일을 읽어 추적 스프레드시트에 입력합니다. 대부분의 중소 규모 GC가 이렇게 합니다. 스프레드시트는 컴플라이언스 기록 역할을 하며, 만료일별 정렬, 프로젝트별 필터링, 공백 수동 표시를 수행합니다. 데이터 입력은 증명서당 5-10분이 소요됩니다. 하청업체 40곳 기준으로 갱신 주기당 3-7시간, 200곳 기준으로는 끝나지 않는 풀타임 업무가 됩니다.

COI 데이터 추출은 데이터 입력 단계만 자동화합니다. 갱신 알림을 보내지 않고, 벤더 포털을 유지하지 않으며, 추출된 한도를 계약 요구 사항과 비교하지 않습니다. 증명서를 읽고 구조화된 데이터를 출력할 뿐입니다. 데이터를 어디에 보내고 어떻게 처리할지는 여전히 사용자가 결정합니다. 이미 스프레드시트 기반 컴플라이언스 프로세스가 작동하는 GC에게 추출은 워크플로 변경 없이 병목 현상을 제거합니다.

COI 추적 소프트웨어 — myCOI(illumend로 리브랜딩), TrustLayer, bcs, Jones 같은 플랫폼 — 은 전체 컴플라이언스 워크플로를 자동화합니다. 하청업체에 자동 갱신 요청, 직접 업로드를 위한 벤더 포털, 프로젝트 요구 사항 대비 보장 공백 플래그 지정, 감사 준비 보고서, Procore 또는 CMiC와의 통합 등이 포함됩니다. 이 플랫폼은 월 200-500달러부터 시작하며, 하청업체 COI 컴플라이언스가 부서 수준 기능인 조직을 위해 설계되었습니다. 추출 단계는 그 안의 한 구성 요소일 뿐이며, 필요할 수도 아닐 수도 있는 워크플로 관리와 함께 번들로 제공됩니다.

이 구분이 중요한 이유는 30곳의 하청업체를 관리하는 GC와 300곳을 관리하는 전국 단위 계약자의 문제가 다르기 때문입니다. 30곳의 경우 병목은 데이터 입력입니다. 30개의 ACORD 양식을 오기 없이 읽는 것입니다. 300곳의 경우 병목은 워크플로입니다. 시스템 없이 수백 개의 만료일을 추적하며 갱신을 쫓는 것입니다. 추출은 전자를 해결하고, 추적 플랫폼은 후자를 해결합니다. 자신의 규모에 맞는 계층을 이해하는 것이 중요한 결정입니다.

COI 데이터 추출 작동 방식

현대적인 COI 데이터 추출을 가능하게 하는 메커니즘은 10년 전 문서 처리 방식과 근본적으로 다릅니다. 이 차이를 이해하면 보험 증서 추출 정확도가 신뢰할 수 없던 수준에서 지난 3년 동안 실무에 바로 쓸 수 있는 수준으로 향상된 이유를 알 수 있습니다.

위치 기반 (템플릿 OCR)

페이지에서 "증권 번호"가 있어야 할 위치 주변에 경계 상자를 그리고 그 안에 있는 텍스트를 추출합니다. 다음 대행사의 ACORD 25에서 필드 위치가 0.5인치만 달라져도(글꼴, 여백, 소프트웨어 차이) 상자는 잘못된 텍스트를 잡거나 아무것도 잡지 못합니다. 형식이 바뀔 때마다 새 템플릿이 필요합니다.

의미 기반 (AI 추출)

전체 페이지를 읽고 각 정보가 의미하는 바를 이해합니다. "GEN'L AGGREGATE LIMIT"와 "GENERAL AGGREGATE"가 약어, 글꼴, 위치와 관계없이 동일한 것을 가리킨다는 것을 압니다. 증권 식별자의 패턴을 인식하여 증권 번호를 찾습니다(고정 좌표를 찾는 것이 아닙니다). 하나의 설정으로 모든 대행사 버전의 ACORD 양식에서 작동합니다.

위치 기반에서 의미 기반 추출로의 전환 덕분에 설정 변경 없이도 여러 보험 대행사의 COI를 동시에 처리할 수 있습니다. 텍사스 대행사는 증서 보유자 블록을 왼쪽 하단에 10pt 글꼴로 배치할 수 있습니다. 캘리포니아 대행사는 중앙 하단에 8pt로 배치할 수 있습니다. 템플릿 기반 도구는 두 개의 개별 템플릿이 필요하며, 어느 한 대행사가 양식 소프트웨어를 변경하면 두 템플릿 모두 작동하지 않습니다. 의미 기반 추출은 좌표를 보지 않기 때문에 설정 없이 둘 다 처리합니다. "증서 보유자"라는 필드와 그 옆에 있는 이름을 찾습니다.

기반 기술과 관계없이 추출 워크플로우 자체는 간단합니다:

1

COI 업로드

증서의 PDF 또는 스캔 이미지를 업로드합니다. 표준 ACORD 25 양식과 대부분의 보험사 발행 증서가 지원됩니다.

2

추출할 항목 정의

필요한 열 이름을 입력합니다(예: "증권 번호", "GL 사고당 한도", "만료일"). AI는 위치가 아닌 의미를 기준으로 각 값을 찾기 위해 문서를 읽습니다. 이것이 사용자 정의 열 추출입니다: 출력 열을 정의하면 AI가 양식의 어디에 있든 일치하는 데이터를 찾습니다.

3

검토 및 내보내기

추출된 필드가 구조화된 테이블에 나타납니다. 특히 추가 피보험자 문구와 보상 한도 값을 확인한 후 Excel, CSV 또는 Google Sheets로 직접 내보냅니다.

JPG/PNG/PDF AI 추출

파일은 안전하게 처리되며 저장되지 않습니다.

AI는 증서 양식에 인쇄된 필드를 읽습니다. 증서 뒤에 있는 전체 보험 약관을 읽지 않으며, 추가 피보험자 승인(CG 20 10 대 CG 20 37 등)이 계약 요건을 충족하는지 해석하지 않습니다. 추출은 증서에 적힌 내용을 알려줍니다. 규정 준수 전문가가 그 내용이 기준에 부합하는지 판단합니다.

COI 데이터 추출이 필요한 경우

COI 추출이 항상 필요한 것은 아닙니다. 연간 3건의 증서를 받는 회사라면 수동 입력이 도구 설정보다 빠릅니다. 그러나 COI 처리의 양과 빈도가 높아 추출이 관리 가능한 프로세스와 규정 준수 리스크를 가르는 특정 시나리오가 있습니다.

종합건설업체 하도급업체 규정 준수

가장 일반적인 사용 사례입니다. 여러 현장 프로젝트에서 40~80개의 하도급업체를 관리하는 중견 종합건설업체는 COI를 수시로 접수합니다. 새 하도급업체가 현장에 투입되거나, 기존 업체가 프로젝트 중간에 보험을 갱신하거나, 클레임 발생 후 보장 내용이 변경되는 경우입니다. 각 증명서에서 동일한 항목을 추출하여 동일한 프로젝트 요구 사항과 비교해야 합니다. 수동 검토 시 건당 5~10분이 소요되며, 데이터 입력만으로 갱신 주기당 3~7시간이 소모됩니다. 추출 기능을 사용하면 증명서당 1분 미만으로 단축됩니다. 여기서 중요한 것은 시간 절약이 아니라, 보장 한도 값의 입력 오류를 없애는 것입니다. 하도급업체 COI의 종합 한도를 잘못 입력하면 수백만 달러의 책임 공백이 발생하며, 이는 클레임이 거부될 때까지 아무도 알아차리지 못합니다.

공급업체 및 납품업체 온보딩

대규모 부동산 관리 회사, 의료 네트워크, 제조 시설은 매년 수백 개의 공급업체를 온보딩하며, 각 업체는 현장 출입 전에 보험 증명을 제출해야 합니다. COI는 온보딩 시즌에 폭주하고 연중 소량으로 꾸준히 접수됩니다. 이 규모의 수동 검토는 백로그를 발생시켜 공급업체가 규정 준수 승인을 받기까지 며칠을 기다리게 합니다. 추출 기능은 데이터 입력 단계를 몇 초로 단축하여 검토자가 입력 작업 대신 추가 피보험자 문구의 정확성이나 보장 한도가 계약 조건과 일치하는지와 같은 판단에 시간을 집중할 수 있게 합니다.

부동산 관리 임차인 COI

상업용 부동산 관리자는 임대 조건으로 모든 임차인에게 COI 제출을 요구합니다. 50개 임차인이 있는 단일 오피스 빌딩의 경우 50개의 증명서를 추적해야 하며, 각각 다른 갱신일이 있습니다. 추출 작업은 반복적이며 연중 계속됩니다. 동일한 항목, 다른 갱신일, 다른 보험사 이름입니다. 임차인 COI를 처리하는 행정 직원은 보험 전문가가 아닙니다. 추출 기능은 데이터 입력 부담을 없애 직원들이 보는 내용을 입력하는 대신 문제가 있는 부분을 식별하는 데 집중할 수 있게 합니다.

연간 보험 감사

내부 감사든 외부 감사든, 연간 보험 컴플라이언스 감사는 파일에 있는 모든 활성 COI에서 구조화된 데이터를 추출해야 합니다. COI가 검색 가능한 인덱스 없이 공유 드라이브에 PDF로 저장되어 있다면, 감사는 모든 파일을 다시 열고 모든 필드를 다시 읽어야 함을 의미합니다. 1년 내내 COI 데이터를 스프레드시트나 데이터베이스로 추출해 왔다면, 감사 준비가 된 기록이 이미 존재합니다 — 만료일 기준 정렬, 프로젝트별 필터링, 한 번의 클릭으로 내보내기가 가능합니다. 건설 분야 COI 미준수 비용은 컴플라이언스를 입증하는 데 필요한 데이터가 받은 편지함과 네트워크 폴더에 흩어져 있을 때 더욱 커집니다.

COI 데이터 추출 도구에서 찾아야 할 사항

모든 추출 도구가 ACORD 증명서를 잘 처리하는 것은 아닙니다. 조밀한 보장 범위 그리드, 대행사 서식의 다양성, 데이터의 컴플라이언스 중요성 때문에 특정 기능이 필요합니다 — 지원 형식 목록에 "COI"가 체크된 일반 문서 추출 제품으로는 충분하지 않습니다.

템플릿 없는 필드 인식. 이것은 필수 조건입니다. 도구가 각 보험 대행사 버전의 ACORD 25에 대해 영역을 그리거나 템플릿을 생성하도록 요구한다면, 통과하세요. 핵심은 각 대행사가 양식을 어떻게 배치하는지 알 필요가 없어야 한다는 것입니다. 필드 위치가 아닌 필드 의미로 읽는 의미론적 추출 엔진이 첫날부터 작동하는 도구와 지속적인 유지보수가 필요한 도구를 구분합니다. AI 문서 추출은 페이지 내 위치와 관계없이 증권 번호가 어떻게 생겼는지 이해하는 메커니즘으로, 이를 가능하게 합니다.

일괄 처리. 단일 COI는 1분 작업입니다. 분기별 갱신 후 40개 하청업체의 50개 COI는 추출의 진가가 발휘되는 때입니다. 도구는 여러 증명서를 한 번에 업로드하고 추출된 데이터를 단일 스프레드시트로 병합할 수 있어야 합니다 — COI당 한 행, 지정한 모든 필드에 대한 열.

보장 범위 표 처리. ACORD 25의 일반 배상 책임 섹션은 단일 값이 아닙니다 — 각 사고, 건물 손해, 의료비, 개인 상해, 총 한도 등 하위 한도의 그리드입니다. "$1,000,000"을 추출하면서 어떤 하위 한도에 속하는지 표시하지 않는 추출 도구는 사용할 수 없는 데이터를 생성합니다. 도구는 각 한도 유형과 그 금액 간의 관계를 보존해야 합니다.

스프레드시트 기본 출력. 추출된 COI 데이터는 컴플라이언스 추적이 이루어지는 곳인 스프레드시트에 저장됩니다. Excel로 내보내거나 애드온을 통한 Google Sheets 직접 삽입은 마찰과 오류 가능성을 추가하는 중간 내보내기-가져오기 단계를 제거합니다.

비표준 증명서 처리. 모든 COI가 주요 보험사의 깔끔한 ACORD 25 PDF인 것은 아닙니다. 소규모 대행사는 자체 레터헤드로 증명서를 발행합니다. 하청업체는 현장 사무실에서 촬영한 종이 증명서 사진을 제출하기도 합니다. 추출 도구는 이러한 예외 사례 — PDF, 이미지, 비ACORD 레이아웃 — 를 각 형식에 대해 다른 워크플로우 없이 처리해야 합니다.

자주 묻는 질문

COI 추출과 COI 추적의 차이는 무엇인가요?

COI 추출은 데이터 입력 단계로, 증명서에서 필드를 읽어 구조화된 데이터로 출력합니다. COI 추적은 전체 규정 준수 워크플로우로, 자동 갱신 알림, 보장 공백 감지, 공급업체 포털, 감사 보고를 포함합니다. 추출은 "이 증명서에 무엇이 적혀 있나?"라는 질문에 답하고, 추적은 "이 프로젝트의 모든 하청업체가 현재 규정을 준수하고 있나?"라는 질문에 답합니다. 대부분의 추적 플랫폼은 추출 기능을 포함하지만, 추출 도구는 워크플로우 관리를 포함하지 않습니다. 현재 스프레드시트 프로세스가 잘 작동하고 PDF에서 데이터를 입력하는 것만이 병목이라면, 추출만으로도 문제가 해결됩니다.

COI 추출은 손으로 작성된 증명서에도 작동하나요?

손글씨 품질에 따라 다릅니다. 최신 AI 추출은 ACORD 양식의 명확하게 인쇄된 손글씨를 유용한 정확도로 읽을 수 있습니다. 특히 증권 번호나 금액과 같은 숫자 필드는 서술형 텍스트보다 더 주의 깊게 작성되는 경향이 있어 정확도가 높습니다. 심하게 필기체로 쓰여지거나 희미한 손글씨 증명서는 정확도가 낮아 수동 검토가 필요할 수 있습니다. 가장 좋은 방법은 실제 문서로 테스트하는 것입니다. 샘플을 업로드하고 추출된 필드를 원본과 비교해 보세요. 일관되게 손글씨 증명서를 제출하는 하청업체의 경우, 보험 대리점에 디지털 발행된 교체본을 요청하는 것이 더 신뢰할 수 있는 방법입니다.

COI 추출이 보장 한도가 내 요구 사항을 충족하는지 감지할 수 있나요?

아니요. 추출은 증명서에 명시된 내용을 읽고 출력할 뿐입니다. 추출된 값을 계약상의 최소 보장 한도와 비교하지 않습니다. "이 하청업체의 50만 달러 일반 배상 책임 한도가 우리의 100만 달러 요구 사항을 충족하는가?"라는 비교는 규정 준수 판단이지 추출 작업이 아닙니다. 일부 COI 추적 플랫폼은 이 비교를 자동화합니다. 독립형 추출 도구는 데이터를 제공하고, 규칙은 사용자가 적용합니다.

ACORD 25 양식이란 무엇이며 추출에 왜 중요한가요?

ACORD 25("배상 책임 증명서")는 미국 상업 보험 업계에서 사용되는 표준 COI 양식입니다. 1970년대부터 보험 업계를 위한 비영리 표준 기관인 ACORD(협동 운영 연구 개발 협회)가 개발했습니다. 이 양식이 추출에 중요한 이유는 명명된 피보험자, 증권 번호, 보장 유형 및 한도, 효력/만료일, 증명서 보유자, 추가 피보험자 등 모든 추출 도구가 대상으로 하는 표준화된 필드 구조를 제공하기 때문입니다. 그러나 개별 대행사가 레이아웃을 수정하기 때문에 템플릿 기반 추출은 실패하고 의미 기반 추출이 필요합니다.

COI 데이터 추출의 정확도는 얼마나 되나요?

깨끗하고 디지털로 생성된 ACORD 25 PDF의 경우, 최신 AI 추출 기술은 정형화된 필드(증권 번호, 금액, 날짜, 명명된 개체)에서 95~99%의 정확도를 달성합니다. 사진으로 촬영된 종이 증명서(기울어짐, 조명, 해상도), 수기 작성 양식, 비표준 레이아웃에서는 정확도가 떨어집니다. 모든 증명서에서 100% 정확도를 보장하는 추출 도구는 없으므로, 규정 준수 결정에 활용하기 전에 출력 결과를 검토해야 합니다. 핵심 가치는 '검토 불필요'가 아니라, 5~10분의 수동 입력을 10~20초의 검토로 대체하는 데 있습니다.

여러 보험사의 증명서에서 COI 데이터를 한 번에 추출할 수 있나요?

네, 가능합니다. 바로 이 점에서 의미 기반 추출이 템플릿 기반 도구보다 뛰어납니다. 의미 기반 추출은 고정된 위치가 아닌 필드의 의미를 기준으로 읽기 때문에, 서로 다른 5개 보험사의 COI를 한 번에 업로드하여 모든 증명서에서 동일한 필드를 추출할 수 있습니다. AI는 한 보험사 양식의 오른쪽 상단에 있든, 다른 보험사 양식의 왼쪽 중간에 있든 '증권 번호'를 찾아냅니다. 하도급업체 COI 일괄 추적은 여러 보험사의 증명서를 함께 처리할 수 있을 때 실용화됩니다.

COI 추출과 OCR은 같은 것인가요?

아닙니다. OCR(광학 문자 인식)은 텍스트 이미지를 기계가 읽을 수 있는 문자로 변환합니다. 즉, "이 페이지에 어떤 문자가 있는가?"라는 질문에는 답하지만, "이 문자열 중 어느 것이 증권 번호인가?"라는 질문에는 답하지 못합니다. COI 추출은 OCR 이후의 단계로, 어떤 텍스트가 어떤 보험 필드에 해당하는지 식별하고 출력 결과를 레이블이 지정된 열로 구조화합니다. OCR은 구분되지 않은 텍스트 덩어리를 제공합니다. 추출은 규정 준수에 바로 사용할 수 있는 스프레드시트를 제공합니다. ACORD 25에 OCR 도구를 사용하면 양식의 모든 단어가 하나의 블록으로 출력됩니다. 추출 도구를 사용하면 '증권 번호' 열, 'GL 총 누적 한도' 열, '만료일' 열이 각각 정확히 하나의 값만 포함하는 테이블이 생성됩니다.

📮 contact email: [email protected]