손글씨 장부를 AI로엑셀로 변환하는 방법

r/Bookkeeping 게시글에서 한 사용자가 75세 상사로부터 물려받은 수기 장부 시스템을 설명했습니다. 모든 영수증, 모든 거래를 장부에 손으로 기록하고, 사무실은 "여전히 1980년대처럼 운영"되고 있었습니다. 문제는 디지털화할지 말지가 아니라, 어떻게 할지였습니다. 이 글은 수기 장부 한 묶음을 하나의 정리된 엑셀 스프레드시트로 바꾸는 워크플로우를 소개합니다. 6,000행을 다시 입력할 필요 없이 말이죠.

AI 추출 도구로 엑셀로 변환 중인 손글씨 장부

핵심 요약

  1. 200페이지 분량의 수기 장부를 엑셀에 수동으로 다시 입력하는 데는 16~26시간이 걸립니다. 그리고 그 시간은 6,000개 개별 항목 중 단 한 개의 차변 또는 잔액도 잘못 읽지 않는다는 가정 하에 나온 것입니다.
  2. 템플릿 기반 OCR은 손으로 그린 장부 열에서 실패합니다. 그리드 선이 페이지마다 몇 밀리미터씩 이동하여 템플릿이 기반으로 한 모든 고정 좌표 가정을 조용히 깨뜨리기 때문입니다.
  3. 일곱 개의 의미론적 열을 한 번 정의하면 ImageToTable.ai가 각 페이지를 5~10초 안에 읽습니다. 종이 위의 위치를 측정하는 것이 아니라, 맥락에서 차변이 어떻게 보이는지 이해함으로써 말이죠.

시작하기 전에: 준비물과 예상 사항

세 가지가 필요합니다. 지금까지 기록해 온 실제 장부, 이미지를 촬영할 수단(스마트폰도 괜찮고 평판 스캐너가 더 좋습니다), 그리고 각 페이지에서 추출할 필드 목록인 컬럼 템플릿(1단계에서 정의합니다).

스캔 품질은 추출 정확도에 영향을 미치는 가장 큰 통제 가능 요소입니다. Sparkco 2025 OCR 벤치마크에 따르면 300 DPI가 필기 인식의 신뢰성을 가르는 기준점입니다. 200 DPI 미만에서는 픽셀 밀도가 부족해 AI가 유사한 문자를 구분하기 어렵습니다. 손으로 쓴 '3'과 '8'은 모델이 거의 동일하게 인식합니다. 휴대폰을 사용한다면, 원근 보정과 명암비 향상 기능이 있는 전용 스캔 앱(Adobe Scan, Microsoft Lens 등)이 기본 카메라 앱보다 더 나은 결과를 제공합니다. 이 앱들은 키스톤 왜곡과 불균일한 조명을 보정하여 추출 정확도를 10~15% 포인트 저하시키는 두 가지 문제를 해결해 줍니다.

제본되지 않은 장부 페이지(낱장)는 평평하게 한 장씩 스캔하세요. 제본된 장부는 책을 평평하게 펼쳐 각 두 페이지를 따로 촬영하세요. AI는 각 페이지를 독립적으로 처리합니다. 제본이 빡빡하고 책등 근처의 텍스트가 왜곡된 경우, 조심스럽게 페이지를 분리하거나 곡면을 처리할 수 있는 북 스캐너 사용을 고려하세요. 약간 휜 페이지는 구조 수준 정확도가 5~8% 포인트 저하됩니다. AI가 책등을 따라 휘어진 텍스트를 보정해야 하기 때문입니다. 장부가 오래되어 페이지 분리가 손상을 초래할 경우, 곡면을 그대로 받아들이고 검증 단계에서 페이지당 1~2분의 추가 수동 교정 시간을 감안하세요.

소요 시간 예상: 200페이지 분량의 장부(필기 명확, 손으로 그린 컬럼 일관, 300 DPI 스캔 기준)의 경우, 캡처(촬영/스캔)에 20~30분, AI 처리에 15~20분, 검토/검증에 30~45분이 소요됩니다. 전체 장부 기준 총 약 1~1.5시간으로, 수동 입력 16~26시간과 비교됩니다. 전체 비용 및 시간 비교는 OCR과 수동 데이터 입력 비교를 참조하세요.

1단계: 열 정의하기 — 가장 중요한 5분

정의하는 추출 열은 단순한 레이블이 아닙니다. AI가 무엇을 찾고, 찾은 내용을 어떻게 해석할지에 대한 지침입니다. 잘 명명된 열은 AI에 의미론적 대상을 제공합니다. "세 번째 열에 있는 것이 무엇이든 찾아라" 대신 "이 행에서 차변 금액을 찾아라"와 같이 말이죠. 잘 설계된 열 템플릿과 일반적인 템플릿 간의 정확도 차이는 필드 수준에서 5~10% 포인트입니다. 전체 워크플로우에서 가장 효율이 높은 5분이라고 할 수 있습니다.

손으로 그린 열이 있는 표준 수기 원장의 경우 다음 7개 필드를 정의하세요.

열 이름AI가 찾는 대상명명 팁
날짜짧은 날짜 문자열, 일반적으로 YY/MM/DD 또는 MM/DD 형식형식 지정: 일관성을 위해 "날짜 (YYYY/MM/DD)"
계정 코드숫자 또는 영숫자 코드, 일반적으로 3-6자리원장이 중국어 科目编码(계정 코드)를 사용하는 경우 "계정 코드 (科目编码)"로 명명
계정명텍스트 — 중국어(应收账款), 영어 또는 약어 가능"계정명"이 단순히 "계정"보다 명확함
적요자유 텍스트 — 각 항목의 摘要/비고이 열은 간단하게 유지; 긴 프롬프트는 필드 경계를 혼란스럽게 함
차변 금액차변(왼쪽) 열 영역의 숫자 값"차변"이 아닌 "차변 금액" 사용 — "금액"이라는 단어가 숫자임을 알림
대변 금액대변(오른쪽) 열 영역의 숫자 값동일한 논리: "대변"보다 "대변 금액"
잔액누적 잔액, 일반적으로 가장 오른쪽 열원장에 소계가 있는 경우 "기말 잔액 (누계)"

원장 페이지 자체에는 나타나지 않지만 정의 중에 추가할 가치가 있는 세 가지 추가 열:

잔액 확인 — 계산 열. 규칙을 이전 잔액 + 차변 금액 - 대변 금액으로 설정합니다. AI는 추출 중 각 행의 예상 잔액을 계산하여 추출된 잔액과 비교합니다. 두 숫자가 일치하지 않는 행은 플래그가 지정됩니다. 이는 문자 수준 및 필드 수준 검사를 통과하는 오류를 잡아내기 때문에 워크플로우에서 가장 효과적인 단일 검증 단계입니다. 차변 1,350을 1,530으로 잘못 읽은 경우 문자 검사는 통과하지만(둘 다 그럴듯한 숫자임) 잔액 확인은 실패합니다. 계산 열이 처음이라면, 추출 중에 실행되는 계산을 정의하여 출력에 원시 추출 값과 검증된 산술 결과가 모두 포함되도록 합니다. 이것이 네 가지 정확도 차원에서 어떻게 작동하는지에 대한 자세한 내용은 정확도 가이드를 참조하세요.

계정 분류 — 추론 열입니다. 계정 분류(옵션: 자산/부채/자본/수익/비용) 규칙을 설정하세요. AI가 계정명과 설명을 읽고 다섯 가지 표준 계정과목 분류 중 하나로 항목을 분류합니다. 원장 자체에는 '분류' 열이 없어도 말이죠. 이렇게 하면 수동 코딩 없이 GAAP에 부합하는 재무제표 그룹화가 가능합니다. 추론 열은 AI가 문서에 명시되지 않은 정보를 도출하게 합니다. 이 경우 '应收账款'(매출채권) 항목을 자산으로 추론하는 식입니다.

페이지 번호 — 원장 페이지에 번호가 매겨져 있다면 직접 추출 열입니다. 이는 감사 추적 역할을 합니다. 47행에 불일치가 발생하면 페이지 번호가 어떤 물리적 페이지를 확인해야 하는지 알려줍니다.

JPG/PNG/PDF AI 추출

파일은 안전하게 처리되며 저장되지 않습니다.

2단계: 업로드 및 처리 — 원장 전체 처리하기

열 정의가 완료되면 모든 원장 페이지 이미지를 한 번에 업로드하세요. 이 도구는 각 페이지를 독립적으로 처리합니다. 깔끔한 자 눈금선이 있는 3페이지와 자유분방한 필체의 22페이지 모두 동일한 로직(픽셀 좌표가 아닌 구조적 구성 요소(날짜 → 설명 → 차변 → 대변 → 잔액)로 각 분개 식별)으로 분석됩니다.

일괄 vs 단일 페이지 전략. 원장 형식이 일관된 경우(같은 사람이 매달 같은 순서로 같은 열을 작성) 전체 책을 한 번에 업로드하세요. AI는 사용자가 정의한 열 템플릿을 배치의 모든 페이지에 적용하고, 출력은 페이지 순서대로 행이 정렬된 단일 Excel 스프레드시트로 모든 항목을 컴파일합니다. 원장 형식이 중간에 변경되는 경우(열 너비, 필체가 다르거나 새로운 회계 담당자가 인수한 경우) 형식 변경 지점에서 배치를 분할하고 새 형식에 대한 두 번째 열 템플릿을 정의하세요. 처리 시간은 페이지 수에 거의 선형적으로 비례합니다. 200페이지는 AI 처리에 약 15~20분이 소요됩니다.

혼합 품질 페이지. 수개월 또는 수년에 걸쳐 수집된 원장은 다양성을 보입니다. 3페이지의 선명한 오전 기입, 67페이지의 마감 직전 성급한 기입, 112페이지의 커피 자국, 180페이지의 희미한 볼펜 글씨. AI는 균일한 품질을 필요로 하지 않습니다. 각 페이지를 독립적으로 처리하지만, 품질이 낮은 페이지에서 검증 부담이 더 클 것으로 예상해야 합니다. 모든 것을 한 배치로 처리한 다음 행별로 출력을 정렬하면 검증 중에 가장 나쁜 페이지를 먼저 점검할 수 있습니다.

추출 중 도구의 역할: 기본 OCR이 텍스트 이미지를 평범한 단락으로 변환하는 것과 달리, 사용자 정의 열 추출은 사용자가 정의한 열 이름을 의미 검색 대상으로 사용합니다. "차변 금액"은 AI가 각 행의 차변 열 영역에서 숫자 값을 찾도록 지시합니다. "계정명"은 원장 계정 레이블 역할을 하는 텍스트(중국어 또는 영어 가능)를 찾도록 지시합니다. 이러한 의미론적 접근 방식이 동일한 열 템플릿이 다양한 시각적 레이아웃의 페이지에서 작동하는 이유입니다. AI는 문서의 정확한 픽셀 레이아웃이 아닌 의미를 읽습니다. 전체 메커니즘은 템플릿 없는 추출 가이드에서 설명합니다.

3단계: 검토 및 확인 — 실제 작업 흐름이 있는 곳

출력 결과는 원장 항목당 한 행씩 있는 Excel 스프레드시트입니다. 맹신하지 마세요. 확인은 추출 후 별도 단계가 아니라 추출 작업 흐름의 일부이며, 1단계의 열 정의가 이 확인의 효율성을 결정합니다.

첫 번째 패스: 잔액 확인 열을 스캔합니다. 1단계에서 잔액 확인을 위한 계산 열을 정의했다면 잔액 확인 열을 기준으로 출력을 정렬하세요. 계산된 잔액이 추출된 잔액과 일치하지 않는 모든 행은 차변, 대변, 잔액 중 하나 이상이 잘못 읽힌 행입니다. 이는 알고리즘으로 이미 감지된 오류를 포함하므로 확인 우선순위가 가장 높은 행입니다. 필드 수준 정확도 90%인 200페이지 원장에서는 총 6,000개 중 5~15개의 플래그 행이 예상됩니다.

두 번째 패스: 대표 샘플을 점검합니다. 페이지의 10%를 무작위로 선택하세요 — 각 월의 시작(새 필체), 중간(일상 항목), 끝(피로 항목)에서 페이지를 고릅니다. 선택한 각 페이지에 대해 추출된 데이터를 원본 원장 페이지와 비교하세요. 페이지당 수정이 필요한 필드 수를 세세요. 30행 페이지당 수정률이 2~3개 필드라면 추출 품질이 좋은 것입니다 — 나머지 페이지도 비슷한 정확도일 가능성이 높습니다. 페이지당 8~10개 필드라면 개선된 스캔(더 높은 DPI, 더 나은 조명, 대비 향상)과 정제된 열 템플릿으로 해당 페이지를 다시 처리하세요.

세 번째 패스: 구조적 오류를 확인합니다. 추출된 출력의 행 수를 세고 예상 행 수와 비교하세요. 47페이지에 손으로 쓴 행이 30개인데 추출 결과가 31개 또는 29개라면 행 경계 오류가 발생한 것입니다 — AI가 한 행을 둘로 나누거나 두 행을 하나로 합친 것입니다. 이러한 구조적 오류는 행 수가 일치하지 않아 발견하기 쉽지만 스프레드시트에서 수동 수정이 필요합니다. 연속된 행의 빈 필드나 중복 날짜는 구조적 경계 문제의 2차 신호입니다.

예상되는 오류 유형과 분류 방법에 대한 더 깊은 이해를 위해 손글씨 문서 추출 실패 모드 가이드는 오류를 8가지 예측 가능한 패턴으로 분류합니다 — 특정 오류가 어떤 패턴에 속하는지 알면 수정 방법이 스캔, 열 이름 지정 또는 문서 자체 중 어디에 있는지 알 수 있습니다.

4단계: 내보내기 및 연동 — 엑셀에서 회계 시스템으로

검증된 출력물을 XLSX로 다운로드하세요. 스프레드시트에는 원장 항목당 한 행이 있으며, 열은 1단계 템플릿(날짜, 계정 코드, 계정명, 설명, 차변 금액, 대변 금액, 잔액, 잔액 확인(검증 플래그), 계정 분류(추론 열 사용 시), 페이지 번호)과 일치합니다.

회계 소프트웨어로 가져오기. 대부분의 회계 플랫폼(QuickBooks, Xero, Wave, 중국 시장 도구인 用友(Yonyou) 또는 金蝶(Kingdee))은 분개 및 총계정원장 거래에 대해 CSV 또는 XLSX 가져오기를 지원합니다. 추출된 열을 소프트웨어의 가져오기 필드에 매핑하세요: 날짜 → 거래일, 계정 코드 → GL 계정 번호, 차변 금액 및 대변 금액 → 각 금액 필드, 설명 → 거래 메모. 계정 분류 열(추론 열 사용 시)은 계정과목표 그룹화를 채울 수 있습니다.

매월 템플릿 재사용. 원장 형식에 맞는 열 템플릿을 정의한 후 저장하세요. 다음 달에는 새 페이지를 촬영하고, 일괄 업로드한 후 동일한 템플릿을 재사용합니다. 열 정의는 원장 형식이 변경되지 않으므로 바뀌지 않습니다 — 부기 담당자는 매달 동일한 그리드를 그리고 동일한 열에 기록합니다. 설정 비용은 일회성 투자이며, 이후 달은 업로드 → 처리 → 검토 → 내보내기 과정만 거치면 됩니다.

중국어-영어 혼합 원장 처리

원장에서 계정명과 설명(科目名称, 摘要)에 중국어를 사용하지만 금액에는 서양 숫자를 사용하는 경우, 1단계의 열 정의가 혼합 문자를 고려해야 합니다. 방법은 다음과 같습니다:

이중 언어 열을 명확하게 명명하세요. "Account Name (科目名称)"은 AI가 해당 필드에서 중국어 텍스트를 예상하도록 알려줍니다. "Debit Amount"와 "Credit Amount"는 AI가 이미 숫자 값을 예상하므로 영어로 유지합니다. 핵심은 열당 예상 콘텐츠 유형을 알리는 것입니다 — 텍스트 열은 원장의 실제 콘텐츠와 일치하는 중국어 레이블을, 숫자 열은 대상 출력 언어로 유지합니다.

혼합 문자 셀을 분할하지 마세요. 단일 셀에 중국어와 영어가 모두 포함된 경우(예: "付款 to ABC Corp"와 같은 설명), AI는 두 문자를 동일한 필드로 추출합니다. 추출 단계에서 이를 다른 열로 분리하는 것은 셀 내 문자 경계가 모호하기 때문에 신뢰할 수 없습니다. 대신 하나의 필드로 추출한 후 엑셀에서 텍스트 나누기 또는 수식을 사용하여 분할하세요.

검증은 동일합니다. 잔액 확인 계산 열은 문자 종류와 관계없이 동일하게 작동합니다 — 산술은 계정명이 어떤 언어인지 신경 쓰지 않습니다. 계정 분류 추론 열은 중국어 계정명(应收账款 → 자산)과 영어 계정명(Accounts Receivable → 자산)을 모두 이해합니다.

여러 지점 또는 부서에서 원장 페이지 수집하기

원장이 서로 다른 지점, 매장 카운터, 현장 사무소 등 여러 위치에서 각각 다른 담당자가 관리하는 경우, 처리를 위해 페이지를 먼저 수집해야 합니다. 수집 링크 기능을 사용하면 각 지점에서 소프트웨어를 설치하거나 계정을 만들 필요 없이 이 작업을 처리할 수 있습니다.

링크를 생성하여 각 지점 관리자와 공유하면, 담당자는 로그인 없이 브라우저를 통해 직접 원장 페이지 사진을 업로드합니다. 업로드된 파일은 처리 대기열에 들어가며, 모든 지점이 페이지를 제출한 후 일괄 추출을 실행합니다. 짧은 인증 코드를 통해 익명 업로드를 방지합니다. 이 기능은 여러 지점의 원장 항목을 단일 재무 보고서로 통합해야 하는 월말 또는 분기말 주기에 특히 유용합니다.

자주 묻는 질문

원장 페이지가 다양한 각도와 조명 조건에서 촬영된 경우 어떻게 하나요?

AI는 템플릿 기반 OCR보다 변형을 더 잘 처리하지만, 극단적인 변형은 정확도를 떨어뜨립니다. 최상의 결과를 얻으려면 모든 페이지를 동일한 조건(동일한 조명, 평평한 표면, 대략 수직 각도, 플래시 사용 안 함(플래시는 잉크를 씻어내는 핫스팟을 생성함))에서 촬영하세요. 다른 사람이 다른 조건에서 다른 페이지를 촬영한 경우, 조명이 가장 나쁜 페이지에서 정확도가 5~10% 포인트 추가로 떨어질 수 있습니다. 간단한 지침("원장을 평평하게 놓고, 플래시를 끄고, 휴대폰을 페이지 바로 위에 들고, 전체 페이지가 프레임 안에 들어오도록 하세요.")으로 촬영 과정을 표준화하세요.

한 번에 몇 장의 원장 페이지를 처리할 수 있나요?

배치당 최대 200~300페이지가 실용적입니다. 그 이상이면 검토 단계가 병목 현상이 됩니다. 페이지당 30초의 확인 시간을 기준으로 500페이지는 4시간 이상의 검토 시간이 필요합니다. 더 큰 원장의 경우 약 한 달 분량(30~60페이지) 또는 한 권의 장부(150~200페이지)로 나누어 처리하세요. 배치로 처리하면 열 템플릿 문제를 조기에 발견하고 수정할 수도 있습니다. 처음 50페이지에서 반복되는 오류 패턴이 발견되면 나머지 150페이지를 처리하기 전에 템플릿을 조정할 수 있습니다.

AI가 세로쓰기 중국어(위에서 아래로 쓰는 방식)를 처리할 수 있나요?

대부분의 수기 장부는 중국어에서도 가로쓰기(왼쪽에서 오른쪽)를 사용합니다. 장부의 열 구조 자체가 본질적으로 가로이기 때문입니다. 장부가 전통적인 세로쓰기 중국어로 작성된 경우 인식 정확도가 크게 떨어집니다. AI의 표 구조 이해는 가로 행 레이아웃에 최적화되어 있기 때문입니다. 세로쓰기 장부의 경우 업로드 전에 페이지 이미지를 90도 회전시켜 텍스트가 AI에 가로로 보이게 해보세요. 결과는 필체 품질에 따라 다릅니다.

처리 후 내 장부 데이터는 어떻게 되나요? 저장되나요?

파일은 처리된 후 삭제됩니다. 저장되거나 학습에 사용되지 않습니다. 추출된 Excel 출력만 유일하게 보관되는 데이터이며, 다운로드 후 사용자 기기에 저장됩니다.

인쇄된 열 제목이 있지만 항목은 손으로 작성된 장부의 경우 다르게 처리해야 하나요?

아니요. 이는 이상적인 경우입니다. 인쇄된 열 제목은 AI에 명확한 필드 레이블을 제공하여, 손으로 그리거나 제목이 없는 경우보다 구조 수준 정확도가 3~5% 포인트 향상됩니다. AI는 인쇄된 제목 텍스트를 읽고 열 할당을 검증합니다. 열 위에 "날짜"가 인쇄되어 있고 해당 열 영역에 짧은 날짜 형식 문자열이 있으면 할당이 확인됩니다. 수기 전용 장부(격자와 항목 모두 손으로 작성)도 의미론적 필드 매칭으로 올바르게 처리되지만, 인쇄된 제목이 없으면 하나의 검증 신호가 사라집니다.

📮 contact email: [email protected]