이제 모든 문서에서 데이터를설정 없이 추출할 수 있습니다

불가능해 보이지만, 이미 현실입니다. 파일을 업로드하고, 원하는 열 이름을 입력하면 표가 반환됩니다. 다른 단계는 없습니다. 구축할 템플릿도, 업로드할 학습 샘플도, 제대로 설정했는지 확인할 구성 화면도 없습니다. IT 팀과 2주 온보딩이 필요하다고 생각했던 작업이 이제 누구나 지금 바로 할 수 있는 세 단계 작업이 되었습니다.

수작업 입력은 그만 — AI가 대신 읽어드립니다
이미지나 PDF를 업로드하세요 — 10초 만에 정형 데이터로
지금 체험하기
회원가입 불필요 · 카드 불필요 · 10초 내 결과
설정 없는 문서 데이터 추출 — 템플릿, 교육 불필요

핵심 요약

  1. 10년 동안 추출 도구는 템플릿, 학습 샘플, 설정을 요구하여 송장 40장을 처리할 시간이 없는 회계사와 같은 가장 필요한 사람들을 배제했습니다.
  2. 공급업체 송장 서식이 20가지라면 20개의 템플릿을 구축해야 하고, 공급업체가 송장 번호 위치를 변경할 때마다 20개의 템플릿을 다시 구축해야 합니다.
  3. 시각적 AI는 '송장 번호'가 어디에 있는지가 아니라 무엇을 의미하는지 이해하여 문서를 읽으므로, 새로운 공급업체 형식도 첫 시도에 정확하게 추출됩니다. 업로드, 열 이름 지정, 결과 확인만 하면 됩니다.

당신이 알고 있는 세상

문서에서 데이터를 추출해야 하는 대부분의 사람들은 기술적 배경이 없습니다. 그저 스프레드시트와 PDF 더미만 있을 뿐입니다.

문서에서 엑셀로 데이터를 수동으로 입력하는 것을 피하려고 시도해 본 적이 있다면, 아마 정확히 세 가지 옵션을 마주쳤을 것입니다. 그리고 그 세 가지 모두, 마치 다른 사람을 위해 만들어진 도구라는 느낌이 들 정도로 실망스러운 방식으로 여러분을 실망시켰을 겁니다.

첫 번째 옵션: 엑셀의 "사진에서 데이터 가져오기". 오피스에 내장되어 있어 완벽해 보입니다. 인쇄된 표의 사진을 찍으면 엑셀이 읽어냅니다. 끝. 하지만 실제로는 통화 기호를 별도 셀로 분리하고, 열 데이터를 예측 불가능하게 병합하며, 손글씨에는 어려움을 겪습니다. 결국 출력 결과를 수정하는 데 타자치는 시간만큼이나 시간을 소비하게 됩니다. 게다가 사진에서만 작동합니다. PDF, 스캔본, 스크린샷은 안 됩니다. 멋진 데모일 뿐, 실무 도구는 아닙니다.

두 번째 옵션: 전통적인 OCR. PDF를 OCR 엔진에 넣으면 텍스트가 나옵니다. 좋습니다. 이제 원시 텍스트가 생겼습니다. 하지만 여전히 30줄의 출력 결과 어딘가에 묻혀 있는 송장 번호를 찾아 추출하고, 형식을 지정하고, 올바른 열에 넣어야 합니다. OCR은 문자를 읽습니다. 송장 번호가 무엇인지는 이해하지 못합니다. "텍스트 인식"과 "데이터 사용 가능" 사이의 간극은 여러분의 시간으로 메워야 하는 간극입니다.

세 번째 옵션: 템플릿 기반 추출 도구. 대부분의 "문서 추출" 소프트웨어가 실제로 내부적으로 작동하는 방식입니다. 샘플 문서 몇 개를 업로드하고, 원하는 필드 주위에 사각형을 그리고, 템플릿을 저장하면 도구가 동일한 형식의 향후 문서에 적용합니다. 이 방법은 작동합니다. 공급업체가 송장 레이아웃을 변경하기 전까지는요. 그러면 사각형이 빈 공간을 가리키게 되고 처음부터 다시 시작해야 합니다. 형식당 하나의 템플릿. 공급업체가 20곳이면? 템플릿 20개. 형식이 바뀔 때마다? 템플릿을 다시 만드세요. 도구가 작업에서 여러분을 구해주지 않았습니다. 단지 작업의 형태만 바꿨을 뿐입니다.

이 세 가지 경로는 모두 동일한 가정을 공유합니다: 문서에서 구조화된 데이터를 얻는 것은 본질적으로 프로젝트라는 것입니다. 설정하고, 구성하고, 테스트하고, 유지 관리해야 하는 무언가. 작동시키는 데 아침 시간이 걸리는 무언가. 또는 IT 티켓. 또는 "빠른 온보딩"을 안내하는 영업 담당자와의 통화가 3주가 걸리는 무언가.

그 가정은 한때 사실이었습니다. 더 이상은 아닙니다.

변경된 사항

이제 설정 없이 데이터를 추출할 수 있는 이유는 추출 도구가 빨라졌기 때문이 아닙니다. AI가 문서를 읽는 법을 배웠기 때문입니다. 문자 하나하나가 아니라, 여러분처럼 페이지가 전달하는 내용을 이해하는 방식으로 말이죠.

기존 OCR은 위치 기반으로 작동합니다. 왼쪽에서 오른쪽, 위에서 아래로 스캔하며 어두운 모양을 찾아 글자로 매핑합니다. "Invoice #"와 "123 Main Street"의 차이가 숫자가 있고 단어가 있다는 것 외에는 알지 못합니다. 레이아웃이 변경되어 공급업체가 송장 번호를 오른쪽 상단에서 왼쪽 상단으로 옮기면, 위치 기반 추출은 좌표를 기준으로 했기 때문에 의미를 찾지 못해 작동이 중단됩니다.

비주얼 대규모 모델(VLM)이 이를 바꿨습니다. VLM은 전체 페이지를 한 번에 받아들입니다. 레이아웃, 글꼴, 로고, 표, 필기까지 모두 포함하여 문서로 이해합니다. "INV-2026-00472"가 "Invoice Number"라는 레이블 옆에 있는 것을 보고, 페이지의 어디에 있든 이 둘이 함께 속한다는 것을 압니다. 어디를 봐야 하는지 알려줄 필요가 없습니다. 여러분이 하는 것과 같은 방식으로, 읽고 있는 내용을 이해함으로써 스스로 파악합니다.

이것이 위치 기반 추출에서 의미 기반 추출로의 전환입니다. 영역을 정의하지 않습니다. 원하는 것, 즉 "Invoice Number", "Due Date", "Total"을 정의하면 AI가 페이지 어디에서든 각 값을 의미를 이해하여 찾아냅니다. 이것이 형식 변경이 더 이상 문제가 되지 않는 이유입니다. 공급업체별 템플릿이 필요 없는 이유입니다. 그리고 설정이 여러 단계의 구성 과정에서 아무것도 필요하지 않게 된 이유입니다.

템플릿 없는 추출이 내부적으로 어떻게 작동하는지에 대한 전체 기술적 이야기(Gen 1 OCR부터 Gen 2 ML, Gen 3 VLM까지)를 알고 싶다면, 여기에 자세히 작성했습니다: 템플릿 없는 AI 문서 추출. 하지만 지금 중요한 것은 이것입니다: 설정을 완전히 건너뛸 수 있는 기술이 존재한다는 것입니다. 미래의 약속이 아닙니다. 이미 실제 운영 중입니다.

수작업 입력은 그만 — AI가 대신 읽어드립니다
이미지나 PDF를 업로드하세요 — 10초 만에 정형 데이터로
지금 체험하기
회원가입 불필요 · 카드 불필요 · 10초 내 결과

실제 사용 시 어떤 일이 일어나나요

세 단계. 전체 작업 흐름입니다. 시작하기 전에 40분짜리 튜토리얼을 볼 필요가 없습니다. 지금 바로 할 수 있습니다.

1단계 — 파일을 업로드하세요. PDF를 끌어오거나, 사진을 놓거나, 스크린샷을 붙여넣으세요. 선명한 디지털 청구서, 점심시간에 건네받은 구겨진 영수증, 2018년에 스캔한 계약서, 또는 손으로 쓴 표의 휴대폰 사진일 수 있습니다. 형식은 중요하지 않습니다. 레이아웃도 중요하지 않습니다.

2단계 — 원하는 열 이름을 입력하세요. 이것이 다른 모든 도구와 다른 점입니다. 필드 주위에 상자를 그리지 않습니다. 구문 분석 규칙을 작성하지 않습니다. 찾고 있는 것을 입력하기만 하면 됩니다: "청구서 번호", "공급업체", "마감일", "합계". 입력한 열 이름이 출력 테이블의 헤더가 됩니다. 출력을 정의합니다. AI가 입력을 처리합니다.

3단계 — 테이블을 받으세요. 한 번의 클릭으로. AI가 문서를 읽고, 필드가 의미하는 바를 이해하여 각 값을 찾아 스프레드시트를 채웁니다. Excel, CSV, JSON 또는 Google Sheets로 내보내세요. 끝입니다.

그게 전부입니다. 설정 마법사가 없습니다. 50개의 샘플에 레이블을 지정하고 모델이 학습할 때까지 기다리는 교육 단계가 없습니다. "담당 계정 관리자가 24시간 이내에 연락하여 온보딩 일정을 잡을 것입니다"라는 말도 없습니다. 업로드. 열 이름 지정. 데이터 받기.

JPG/PNG/PDF AI 추출

파일은 안전하게 처리되며 저장되지 않습니다.

하지 않아도 되는 일

새로운 접근 방식을 이해하는 가장 확실한 방법은 무엇이 사라지는지 나열하는 것입니다. 다음은 여러분이 하지 않아도 되는 일과, 예전에는 이러한 단계들이 얼마나 많은 비용을 요구했는지 보여줍니다.

1
필드 주위에 상자를 그리지 마세요. 영역 기반 OCR 도구는 문서의 각 데이터 포인트 위에 직사각형을 그리도록 합니다 — 여기에 송장 번호, 저기에 날짜, 아래에 합계. 문서 형식당 하나의 템플릿입니다. 다른 레이아웃을 가진 새 공급업체가 있다면? 다시 직사각형을 그려야 합니다. 의미 기반 추출은 이를 완전히 제거합니다. AI가 문서를 읽고 좌표가 아닌 의미로 데이터를 찾습니다.
2
학습 샘플을 업로드하지 마세요. 일부 AI 추출 플랫폼은 형식을 안정적으로 처리하기 전에 10개, 50개, 심지어 200개의 레이블이 지정된 문서를 요구합니다. 이는 결과를 보기도 전에 몇 시간 또는 며칠이 소요되는 선행 투자입니다. 설정이 필요 없는 추출은 문서를 즉시 이해하는 사전 훈련된 시각 모델을 사용합니다. 첫 번째 파일이 첫 번째 결과입니다.
3
정규식이나 구문 분석 규칙을 작성하지 마세요. 날짜 패턴을 정의할 필요가 없습니다. 금액 추출 로직을 작성할 필요가 없습니다. 정규식이 "Apr"은 일치시키지만 "April"은 일치시키지 못하는 이유를 디버깅할 필요가 없습니다. 열 이름으로 "날짜"를 입력하기만 하면 됩니다. AI는 날짜가 무엇인지 이해하고 어떤 형식, 어떤 위치에서든 찾아냅니다.
4
IT 티켓을 제출하지 마세요. 서버 프로비저닝이 필요 없습니다. API 키 구성이 필요 없습니다. SDK 설치가 필요 없습니다. "저희 엔지니어링 팀이 통합 일정을 평가할 것입니다"라는 말도 필요 없습니다. 브라우저 탭을 열고, 파일을 끌어다 놓고, 결과를 얻으세요. 이것이 전체 배포 계획입니다.
5
형식이 변경될 때 모든 것을 다시 하지 마세요. 공급업체가 송장 합계를 오른쪽 아래에서 상단 중앙으로 옮겼습니다. 템플릿 기반 도구는 이제 빈 셀을 추출합니다. 설정이 필요 없는 AI 추출은 신경 쓰지 않습니다 — 문서를 읽고 의미로 "합계"를 찾습니다. 형식은 바뀌었지만 출력은 바뀌지 않았습니다.

이런 분들을 위해 만들었습니다

개발자가 아니고, IT 관리자가 아니고, 교육 예산과 3개월 평가 기간이 없는 분이라면 — 바로 이런 분들을 위해 만들었습니다.

매주 월요일 아침 40장의 공급업체 청구서를 받아 하나하나 ERP에 수동으로 입력하는 회계사. 구겨진 영수증에서 비용 데이터를 추출해야 하지만 OCR 소프트웨어를 배울 시간이 없는 소상공인. PDF로 계약서를 받아 날짜, 요율, 고객명을 복사-붙여넣기 20분 없이 추출하고 싶은 프리랜서.

문서 추출이 가장 필요한 사람들은 종종 문서 추출 시스템을 구축할 여력이 가장 없는 사람들입니다. 그 역설이 기존 시장을 정의했습니다. 새로운 시장은 그 역설을 해소합니다 — 설정할 것이 아무것도 없기 때문입니다.

첫 번째 시도

진짜 장벽은 심리적인 것입니다. "나에게 너무 기술적인 것 같아." "먼저 사용법을 배워야 할 것 같아." "다음 주에 시간 날 때 해야지."

그 장벽을 허무는 방법은 간단합니다. 계정이 필요 없습니다. 위의 데모를 열고, 파일을 넣고, 세 개의 열 이름을 입력하면 — 이 문단을 읽는 시간 안에 표를 얻을 수 있습니다. 회원가입 없음. 약정 없음. 숨겨진 신용카드 입력란이 있는 "무료 체험 시작"도 없습니다.

핵심은 말로 설득하는 것이 아닙니다. 핵심은 그 자체가 너무 간단해서 한 번 시도해보는 것이 왜 시도해야 하는지에 대한 글을 읽는 것보다 더 빠르다는 점입니다. 문서 추출을 시도해보기를 망설인 적이 있고 설정 자체가 프로젝트가 될 거라고 생각했다면 — 그 생각은 3년 전에는 맞았습니다. 지금은 아닙니다.

AI 데이터 입력이 실제로 무엇이고 문서 자동화의 큰 그림에 어떻게 들어맞는지 더 폭넓게 알아보려면 가이드를 참조하세요: AI 데이터 입력이란?

파일 하나. 10초. 이것이 여러분의 문서에 이 기능이 작동하는지 알아보는 데 필요한 전부입니다. 나머지는 직접 시도해보고 타이핑할 오후를 절약했다는 것을 깨닫는 것뿐입니다.

자주 묻는 질문

정말 훈련이 전혀 필요하지 않나요?

네. AI 모델은 수백 가지 형식의 수백만 개 문서로 사전 훈련되어 있습니다. 송장, 영수증, 계약서, 양식이 어떻게 생겼는지 기본적으로 이해하고 있습니다. 샘플을 업로드하거나 필드에 레이블을 지정할 필요 없이 원하는 열 이름만 알려주면 됩니다. 첫 번째 문서부터 바로 결과를 얻을 수 있습니다.

어떤 문서 유형에서 작동하나요?

송장, 영수증, 구매 주문서, 은행 거래 명세서, 계약서, 포장 명세서, 납품서, 근무 시간표, 보험 카드, 검사 보고서 등 원하는 데이터 포인트의 이름을 지정할 수 있는 모든 문서에서 작동합니다. 또한 스크린샷, 휴대폰 사진, 스캔 문서도 처리합니다. 사람이 읽을 수 있다면 AI도 일반적으로 추출할 수 있습니다.

손글씨도 처리할 수 있나요?

네 — 인쇄체 손글씨, 필기체, 혼합된 필기체 문서 모두 지원됩니다. 정확도는 손글씨 가독성에 따라 달라지지만(다른 사람의 필체를 읽을 수 있는 능력이 얼마나 깔끔한지에 달려 있는 것과 같습니다), 모델은 손글씨 문서로 훈련되어 기존 OCR보다 훨씬 더 잘 처리합니다.

한 번에 50개의 문서를 처리해야 하면 어떻게 하나요?

일괄 처리가 내장되어 있습니다. 50개 파일을 한 번에 업로드하고, 열 이름을 한 번만 입력하면 모든 결과가 포함된 하나의 통합 스프레드시트를 얻을 수 있습니다. 각 문서가 하나의 행이 됩니다. 파일마다 열 설정을 반복할 필요가 없습니다.

이것이 OCR과 같은 것인가요?

아닙니다. OCR은 이미지를 텍스트로 변환합니다 — 문자를 읽습니다. 이것은 문서를 구조화된 데이터로 변환합니다 — 내용을 이해합니다. OCR은 페이지에 "INV-2026-00472"라고 적혀 있다고 알려줄 수 있습니다. 이것은 "INV-2026-00472"가 송장 번호임을 알려주고, 올바른 열에 넣고, 20개의 다른 공급업체와 20개의 다른 레이아웃을 가진 50개의 송장에 대해 한 번에 모두 수행할 수 있습니다. OCR은 문서 추출의 구성 요소입니다. 같은 것이 아닙니다.

추출 결과가 잘못되면 어떻게 하나요?

결과가 원본 문서 옆에 인라인으로 표시되므로 빠르게 훑어보고 확인할 수 있습니다. 일괄 처리의 경우 모든 필드를 확인하는 대신 몇 개의 행만 표본 검사하면 됩니다. 구조화된 문서에 대한 AI의 정확도는 날짜와 금액과 같은 표준 필드의 경우 전체 행 검토가 일반적으로 필요하지 않을 정도로 높습니다.

📮 contact email: [email protected]