부가세 신고서를 엑셀로 변환 — 제출 전 박스 간 산술 검증까지 한 번에
세금 신고서는 박스 간 상호 참조가 발생하는 유일한 문서 유형입니다. 예를 들어, 박스 3 = 박스 1 − 박스 2, C항 합계 = 1~8행의 합계입니다. 기존 OCR은 각 박스의 숫자를 개별적으로 추출하지만, 추출된 박스 3이 실제로 박스 1에서 박스 2를 뺀 값과 일치하는지 확인하지 않습니다. Computed Columns는 각 박스를 독립적으로 추출한 후 산술적 일관성을 검증하여, 데이터가 회계 시스템에 입력되기 전에 불일치를 표시합니다. 이는 OCR이 잘못 읽은 박스 1 − 박스 2 값의 차이로 인한 오타를 막는 최후의 방어선입니다.
암호화 처리 · 변환 후 자동 데이터 삭제
부가세 신고서에서 추출할 수 있는 항목
필요한 열 이름을 입력하세요. AI는 각 박스 라벨의 의미를 이해하여 HMRC VAT100의 Box 1~Box 9 번호 체계나 완전히 다른 박스 레이아웃을 가진 EU 신고서 등 모든 세금 양식에서 해당 값을 찾아냅니다. 템플릿 설정 없이 모든 세무 당국 양식의 과세 기간, 등록 번호, 모든 박스 값 및 보조 합계를 읽어옵니다.
이 도구는 사용자 정의 열 추출 방식을 사용합니다. 원하는 열 이름(예: "박스 1(부가세 출력)", "박스 2(부가세 입력)", "부가세 등록 번호")을 입력하면, AI가 고정된 템플릿이나 좌표를 기준으로 하지 않고 각 박스 레이블의 의미를 이해하여 각 양식에서 일치하는 값을 찾아냅니다. 따라서 동일한 열 이름 세트로 HMRC VAT100, 독일 Umsatzsteuervoranmeldung, 프랑스 CA3, 네덜란드 BTW aangifte 등 서로 다른 박스 번호와 레이아웃을 가진 양식에서도 동시에 작동합니다. 또한 계산된 열을 정의할 수 있습니다. 예를 들어 "순 부가세 검증(박스 1 − 박스 2)"이라는 열을 만들면, AI가 추출된 박스 3의 값이 박스 1에서 박스 2를 뺀 값과 일치하는지 계산하여 차이가 있는 행에 플래그를 표시합니다. 이러한 교차 검증은 추출 과정 중에 이루어지므로, 스프레드시트에 불일치 항목이 이미 강조 표시된 상태로 도착하며, 이후 조정 과정에서 발견할 필요가 없습니다.
세금 양식은 구조 자체에 산술이 내장되어 있습니다 — 기존 OCR은 이를 무시합니다
송장과 영수증에는 독립적인 값이 있습니다. 예를 들어 송장 합계는 페이지의 다른 값과 일치할 필요가 없습니다. 하지만 세금 양식은 다릅니다. Box 3은 Box 1에서 Box 2를 뺀 값으로 정의됩니다. C항목 합계는 1~8행의 합입니다. 이러한 산술 관계는 단순한 형식이 아니라 신고서의 법적 정의의 일부입니다. 기존 OCR은 각 박스를 개별적으로 읽고 숫자가 합산되는지 확인하지 않습니다. Reddit의 한 회계사는 검토 중 발견한 전사 오류가 소프트웨어가 산술을 검증했다면 잡혔을 것이라고 설명합니다. 하지만 그렇지 않아서 오류가 고객의 신고서에 도달했습니다.
기존 OCR은 각 입력란을 독립적으로 읽습니다. Box 1, Box 2, Box 3은 그저 페이지에 있는 세 개의 개별 숫자일 뿐입니다. 필드 간 교차 검증이 없습니다. OCR이 Box 1을 £45,230 대신 £45,280으로 잘못 읽으면, £45,280이 그대로 스프레드시트에 입력됩니다. Box 3도 추출되지만, 시스템은 '추출된 Box 3 값이 실제로 Box 1에서 Box 2를 뺀 값과 일치하는가?'라고 질문할 방법이 없습니다. £50의 오류는 조용히 회계 시스템에 유입되고, 감사나 HMRC 기록과의 불일치가 발견되기 전까지 아무도 알아채지 못합니다. 분기당 30건의 고객 신고서를 처리하는 회계사는 데이터 입력 외에도 양식당 20개 이상의 산술 관계를 수동으로 확인해야 하며, 이는 분기당 600건의 검증 작업에 해당합니다.
한 자릿수 인식 오류가 회계 시스템 전체에 연쇄적인 하위 오류를 발생시킵니다. Box 1이 £50만큼 잘못 입력됩니다. 회계 소프트웨어는 추출과 가져오기 사이에 검증 단계가 없기 때문에 이를 그대로 수용합니다. 원장의 분기별 VAT 부채는 제출한 신고서와 더 이상 일치하지 않습니다. 몇 주 후 HMRC 명세서나 분기 검토 시점에 조정을 시도할 때쯤이면, 불일치의 원인을 찾기 위해 여러 시스템을 거슬러 올라가야 합니다. 오류를 찾는 비용이 오류 자체의 비용보다 더 크며, 신고 마감일은 계속 다가옵니다.
다중 입력란 간의 종속 관계가 문제를 더욱 악화시킵니다. 대부분의 신고서에는 수십 개의 이러한 관계가 있습니다. 단순히 Box 3 = Box 1 − Box 2만 있는 것이 아닙니다. Box 5(순 VAT)는 요약 섹션과 세부 섹션에서 일치해야 합니다. 총 출력액은 개별 출력 라인의 합계와 같아야 합니다. 섹션 합계는 해당 행의 합계와 같아야 합니다. HMRC VAT100 양식에는 서로 관계가 있는 9개의 입력란이 있으며, 독일 Umsatzsteuervoranmeldung(부가세 신고서) 전체에는 상호 연결된 수십 개의 산술 제약 조건이 있는 60개 이상의 필드가 있습니다. 모든 신고 기간마다 모든 고객 신고서에 대해 이 모든 것을 수동으로 교차 확인하는 것은 규모에 관계없이 불가능합니다. 따라서 대부분의 회계 법인은 이 단계를 건너뛰고 추출 결과를 신뢰합니다. 바로 이 신뢰가 나중에 조정 문제를 발생시키는 원인입니다.
사용자 정의 열 추출은 각 박스를 독립적으로 읽고, 계산 열이 산술을 검증합니다. 박스 1, 박스 2, 인쇄된 박스 3에 대한 열을 정의합니다. 그런 다음 "박스 3 확인(박스 1 − 박스 2)"이라는 계산 열을 정의합니다. AI가 양식에서 박스 1과 박스 2를 추출하고 차이를 계산한 후, 추출한 인쇄된 박스 3과 비교합니다. 인쇄된 박스 3이 박스 1 − 박스 2와 일치하면 계산 열은 "OK"를 출력합니다. 일치하지 않으면(박스 1, 박스 2, 박스 3 중 하나가 잘못 읽힌 경우) 계산 열은 불일치 값을 출력합니다. 0이 아닌 불일치가 있는 모든 행은 데이터가 회계 시스템에 입력되기 전에 검토 대상으로 표시됩니다.
박스 1의 £50 오독은 추출 중 불일치가 포착되어 회계 시스템에 도달하지 않습니다. 박스 1이 £45,280으로 추출되었지만 실제 값이 £45,230인 경우, 계산 열이 박스 1 − 박스 2를 계산한 결과가 인쇄된 박스 3과 일치하지 않습니다. 불일치 열이 즉시 차이를 표시합니다. 해당 행을 검토하고 숫자 오류를 발견하여 수정하면 수정된 값이 원장으로 전달됩니다. 오류는 추출 단계에서 포착되며, 몇 주 후 조정 중에 발견되지 않습니다. 분기당 30건의 고객 신고서에서 계산 열이 모든 산술 검사를 자동으로 수행합니다. 플래그가 지정된 행만 검토하면 되며, 600개의 모든 관계를 검토할 필요가 없습니다.
여러 계산 열이 양식의 모든 산술 관계를 동시에 검증합니다. 한 번의 추출로 모든 검사가 실행됩니다. "섹션 C 합계 확인(1-8행 합계 vs 인쇄된 합계)", "박스 5 교차 확인(요약 박스 5 vs 세부 섹션 박스 5)", "총 출력 확인(개별 출력 행 합계 vs 인쇄된 합계)"에 대한 계산 열을 정의합니다. AI는 계속 시트가 포함된 여러 페이지 양식을 포함하여 전체 신고서의 모든 박스 값을 추출하고, 동일한 추출 과정에서 모든 산술 검증을 실행합니다. 다운로드된 Excel 파일에는 모든 데이터가 추출되고 모든 불일치가 이미 표시되어 도착합니다. 플래그가 지정된 행만 검토하고 나머지는 확신을 가지고 가져옵니다. 이것이 신고까지 살아남을 수 있는 전사 오류에 대한 최후의 방어선입니다.
한 번의 패스로 산술 검증과 함께 분기 분량의 VAT 신고서를 추출하는 방법
업로드 — 받은 신고서를 그대로, 어떤 형식이든
디지털로 제출된 HMRC VAT100 PDF(Q4분기), 우편으로 제출하는 고객의 스캔된 종이 신고서(Box 5에 구겨진 자국이 있는 약간 기울어진 스캔), 계속 시트가 포함된 여러 페이지 분량의 독일 Umsatzsteuervoranmeldung, 자회사의 프랑스 CA3 등 다양한 신고서를 한 번에 업로드하세요. 형식도 다양합니다 — 깨끗한 디지털 PDF, 아티팩트가 있는 스캔 종이, 페이지를 넘나드는 합계가 있는 여러 페이지 문서. 관할권별로 미리 분류하거나 여러 페이지 신고서를 개별 파일로 나눌 필요가 없습니다. AI가 모든 양식을 단일 배치로 처리합니다. 신고서와 함께 지원 일정이나 추가 신고서를 받은 경우에도 함께 업로드하세요 — 이 도구는 동일한 배치 내에서 혼합 문서 유형을 처리합니다.
열 정의 — 회계 시스템에 필요한 항목과 산술 검증 추가
출력 스프레드시트의 열 이름을 입력하세요: VAT 기간 시작일, VAT 기간 종료일, VAT 등록 번호, Box 1 (매출 VAT), Box 2 (매입 VAT), Box 3 (순 납부 VAT), Box 4 (VAT 제외 매출), Box 5 (VAT 제외 매입). 그런 다음 검증 열을 추가하세요: Box 3 검증 (Box 1 − Box 2; 0이 아닌 경우 차이 출력), 페이지 간 합계 확인 (세부 섹션 합계 vs 요약 합계). 독일 여러 페이지 신고서의 경우 AI가 모든 계속 시트를 읽고 값을 집계합니다. 프랑스 CA3의 경우 AI가 프랑스어 필드 레이블을 읽고 사용자가 정의한 영어 열 이름에 매핑합니다 — 동일한 열 정의, 국가별 템플릿 설정 불필요. 구겨진 자국이 있는 스캔 종이 신고서의 경우 AI가 구겨진 부분 주변을 읽고 값을 추출합니다. 그런 다음 계산된 열이 Box 3이 Box 1 − Box 2와 일치하는지 확인하여, 구겨진 자국으로 인해 오독이 발생한 경우 해당 행에 플래그를 지정합니다.
출력 — 하나의 스프레드시트, 산술 검증 완료, 플래그된 행만 검토 필요
각 행이 하나의 VAT 신고서를 나타내는 Excel 파일을 다운로드하세요. 상자 값은 상자 번호가 열 데이터로 보존되어 추출됩니다 — 상자 1, 상자 2, 상자 3, 상자 4, 상자 5, 기간 및 등록 번호와 함께. 계산된 열이 이미 실행되었습니다: 인쇄된 상자 3과 계산된 상자 1 − 상자 2의 차이를 보여주는 열이 있습니다. 배치의 4개 신고서 중 3개는 불일치 열에 "0"을 표시합니다 — 해당 행은 검증되었으며 가져오기 준비가 완료되었습니다. 접힌 부분이 있는 스캔된 신고서가 오독을 일으킨 경우, 불일치 열에 0이 아닌 값이 표시됩니다 — 해당 행을 검토하고, 추출된 숫자를 원본 양식과 비교한 후, 숫자를 수정하면 전체 배치가 감사 준비 완료됩니다. XLSX, CSV 또는 JSON으로 내보내어 Xero, QuickBooks, Sage 또는 회계 시스템에 직접 가져오세요 — 추출 경계에서 산술 오류가 생존하지 않았다는 확신을 가지고.
VAT 신고서 추출이 가장 효과적인 경우 — 그리고 확인해야 할 사항
VAT 신고서 추출은 구조화된 정부 양식에 대해 매우 신뢰할 수 있습니다. 대량 처리를 시작하기 전에 몇 가지 조건을 이해하는 것이 좋습니다. 특히 박스 값 정확도에 영향을 미치는 조건은 잘못 읽은 박스 값이 산술 교차 검증에 영향을 미치기 때문입니다.
안정적인 추출
표준 박스 레이아웃의 정부 발행 세금 양식 — 박스 번호를 필드 레이블로 포함하여 거의 완벽한 정확도로 추출합니다.
동일한 레이아웃이지만 국가별 박스 번호가 다른 양식 — 동일한 열 정의가 여러 국가에서 작동합니다.
디지털 제출 PDF(HMRC VAT100, MTD 호환 신고서, EU 전자 신고 PDF) — 깨끗한 원본에서 깨끗한 추출 결과를 얻습니다.
계속 시트가 포함된 여러 페이지 신고서 — 모든 페이지가 추출됩니다. 계산 열을 사용하여 세부 섹션을 합산하고 요약 페이지와 비교하여 페이지 간 합계를 확인하세요.
다음 사례 확인 필요
인쇄된 세금 양식에 수기로 수정한 경우 — 정확도는 필기 가독성에 따라 달라집니다. 작성자가 입력된 값을 지우고 작은 상자에 수기로 수정한 경우, AI는 보이는 수정된 숫자를 읽습니다. 계산 열을 사용하여 해당 신고서에 플래그를 지정하고, 제출 전에 수정된 값을 보조 일정과 대조 확인하세요.
수정 신고서 또는 정정 신고서에서 원본 값과 수정 값이 동일한 양식에 모두 표시되는 경우 — 두 값이 모두 보이면 AI가 두 숫자 세트를 모두 추출할 수 있습니다. 수정 값에 대해 명확한 열 이름을 정의하고, 보존 의무에 따라 원본 값과 교차 확인하세요.
영국/EU 외 지역의 비표준 양식(예: 특정 주 판매세 신고서, 지방 자치 단체 세금 신고서) — 상자 번호가 다르거나 숫자가 아닌 레이블을 사용할 수 있습니다. AI는 레이블이 있는 값을 계속 추출할 수 있지만, 추출 프롬프트의 열 이름은 양식의 실제 레이블과 일치해야 합니다. 먼저 단일 테스트 양식을 실행하여 필드 매핑을 확인하세요.
이 도구는 상자에서 숫자를 추출하지만 세금 계산이나 납세 의무를 결정하지는 않습니다. 양식에 있는 내용을 읽을 뿐입니다. 계산 열은 추출된 숫자가 내부적으로 일관성이 있는지 확인하지만, 세법에 따라 VAT 납세 의무를 재계산하지는 않습니다. 산술 확인은 양식이 올바르게 읽혔는지 확인하는 것이지, 양식 자체가 올바르게 작성되었는지 확인하는 것이 아닙니다.
자주 묻는 질문
계산 열을 이용한 부가세 신고서 산술 검증은 어떻게 작동하며, 왜 중요한가요?
세무 신고서는 필드 간 상호 참조가 정의상 존재하는 유일한 문서 유형입니다. 예를 들어, Box 3은 Box 1에서 Box 2를 뺀 값입니다. 기존 OCR은 각 Box 값을 독립적으로 추출하며, 추출된 숫자들이 이러한 관계를 만족하는지 확인할 메커니즘이 없습니다. 계산 열(Computed Columns)이 이 문제를 해결합니다. "Box 3 확인 (Box 1 − Box 2)"와 같은 열을 정의하면 AI가 추출된 Box 1과 Box 2에서 예상 순 부가세를 계산한 후, 함께 추출된 인쇄된 Box 3 값과 비교합니다. 차이가 있으면 해당 열에 불일치 내용이 출력되어, 회계 시스템에 입력되기 전에 검토 대상으로 표시됩니다. 양식의 모든 산술 관계를 동시에 검증하기 위해 여러 계산 열을 정의할 수 있습니다. 출력 스프레드시트에는 이미 식별된 불일치 사항이 포함되어 있으므로, 모든 신고서의 모든 산술 관계를 수동으로 확인할 필요 없이 표시된 행만 검토하면 됩니다.
영국 외 다른 국가의 부가세 신고서 양식에서도 작동하나요?
네, 가능합니다. AI는 영국 HMRC VAT100, 독일 Umsatzsteuervoranmeldung, 프랑스 CA3, 네덜란드 BTW aangifte, 인도 GSTR-3B 등 여러 국가의 표준 부가세/판매세 신고서 형식을 처리합니다. 각 국가마다 Box 번호와 레이블이 다르지만, AI는 고정된 템플릿을 일치시키는 대신 각 양식의 구조를 상황에 맞게 읽습니다. "Box 1 (매출 부가세)", "Box 2 (매입 부가세)", "부가세 등록 번호"와 같은 동일한 열 이름이 여러 양식에서 작동하는 이유는 AI가 각 Box 레이블의 의미를 문맥상 이해하기 때문입니다. 레이블이 특이한 덜 일반적인 지역 양식의 경우, 먼저 테스트 양식 하나를 실행하여 열 이름이 해당 양식의 특정 레이블에 올바르게 매핑되는지 확인하는 것이 좋습니다. 계산 열 산술 검사는 관할권에 관계없이 작동합니다. Box 3 = Box 1 − Box 2는 어느 국가에서나 동일한 수학이기 때문입니다.
여러 고객 또는 과세 기간의 VAT 신고서를 한 번에 일괄 처리할 수 있나요?
네, 가능합니다. 여러 고객, 여러 분기, 또는 여러 관할 구역의 VAT 신고서를 단일 배치로 업로드할 수 있습니다. AI가 각 양식을 개별적으로 처리하고 모든 결과를 하나의 Excel 스프레드시트로 컴파일합니다. 각 행은 하나의 신고서에 해당하며, VAT 기간 시작일, 종료일, 등록 번호가 추출되어 고객 또는 분기별로 필터링할 수 있습니다. 계산된 열 산술 검사는 모든 행에 대해 독립적으로 실행되므로 배치 내 각 신고서가 자체 검증을 받습니다. 이는 신고 시즌에 여러 고객을 관리하는 회계 법인에 이상적입니다. 모든 신고서를 한 번에 업로드하고, 플래그가 지정된 행만 검토한 후, 고객별로 검증된 데이터를 내보내면 됩니다. 반복 처리를 위해 수집 링크 기능을 사용하면 고객이 계정 없이도 자신의 신고서를 귀하의 처리 대기열에 업로드할 수 있으므로, 이메일 첨부 파일이나 파일 전송 없이 일괄 처리할 준비가 된 신고서가 도착합니다.
스캔한 종이 신고서의 추출 정확도는 디지털 PDF와 비교하여 어떤가요?
표준 상자 레이아웃의 200dpi 이상으로 깔끔하게 스캔된 종이 신고서의 경우 추출 정확도는 디지털 PDF와 비슷합니다. 정확도의 한계는 AI의 판독 능력이 아닌 스캔 품질에 의해 결정됩니다. 평평하고 조명이 균일하며 깨끗하게 인쇄된 신고서를 스캔하면 상자 번호, 값, 보충 필드 모두 안정적으로 추출됩니다. 기울어지거나, 페이지 주름이나 그림자가 있거나, 여러 번 복사된(인쇄 → 팩스 → 스캔) 스캔의 경우 물리적 결함에 가까운 값의 정확도가 낮아질 수 있습니다. 바로 이 지점에서 계산된 열 검증이 가치를 발휘합니다. Box 5의 주름으로 인해 오독이 발생하더라도, 세 값 중 하나라도 잘못 읽히면 추출된 Box 3이 Box 1 − Box 2와 일치하지 않기 때문에 산술 검사가 이를 포착합니다. 우편으로 도착하는 종이 신고서의 경우, 추출 신뢰도를 최대화하기 위해 휴대폰 사진보다는 평판 스캐너에서 200dpi 이상으로 스캔할 것을 권장합니다.
처리 중 세금 데이터는 안전한가요?
모든 파일 전송은 TLS 1.3 암호화를 사용합니다. 문서는 격리된 세션에서 처리되며 24시간 이내에 서버에서 자동 삭제됩니다. 세금 데이터는 AI 모델 학습이나 개선에 절대 사용되지 않으며, 오직 귀하의 데이터로만 남습니다. 특정 데이터 보관 또는 보존 요구사항이 있는 회계 법인의 경우, 처리는 데이터 지속성을 최소화하도록 설계되었습니다: 업로드, 추출, 다운로드 후 원본 문서는 삭제됩니다. 추출된 스프레드시트는 사용자 기기에만 저장되며, 처리 기간 이후에는 추출된 데이터를 보관하지 않습니다.