W-2 및 1099 세금 양식 데이터 추출:
회계 법인을 위한 완벽 가이드
중견 회계 법인은 매년 1월 중순부터 3월 15일까지 약 400개의 W-2와 600개의 1099 양식을 처리합니다. 양식당 2분(박스 내용 확인, 사본과 수치 대조, 세금 신고서에 입력)이 소요되며, 이는 6주 동안 순수하게 데이터를 옮겨 적는 데만 33시간이 걸리는 셈입니다. 입력 오류는 몇 달 후 IRS CP2000 통지로 이어지며, 각 건당 15~30분의 청구 불가능한 해결 시간이 발생합니다. 세금 양식 데이터 추출은 검토자가 양식을 직접 확인하는 과정을 대체하지 않으면서 데이터 입력 단계를 없애줍니다. 이 가이드에서는 W-2와 고객이 제출하는 모든 1099 변형 양식에 대해 이 프로세스를 설정하는 정확한 방법을 설명합니다.
W-2와 1099 추출을 하나의 워크플로우로 처리해야 하는 이유
대부분의 회계 법인에서 W-2와 1099는 같은 배치로 도착합니다. 고객이 2월 초에 두 양식이 섞인 폴더를 가져오는 식이죠. 하지만 대부분의 추출 도구와 워크플로우는 이를 별개의 문제로 취급합니다.
W-2와 1099는 통합 추출 파이프라인에 적합한 세 가지 구조적 유사점을 공유합니다:
- 동일한 신고 마감일. W-2와 1099-NEC 모두 1월 31일까지 수취인에게 제공되고 같은 날짜까지 IRS에 제출되어야 합니다. 두 양식이 동시에 도착하며 처리 기간도 동일합니다.
- IRS 표준화된 박스 번호. 모든 W-2는 동일한 박스 번호를 사용합니다(박스 1은 항상 임금, 박스 2는 항상 연방 소득세 원천징수액). 각 1099 변형 양식은 고유한 지정 레이아웃이 있지만, 각 변형 내에서 박스 번호는 일관됩니다.
- 동일한 최종 목적지. 추출된 데이터는 동일한 세금 신고서로 이동합니다. W-2 데이터는 근로소득 항목을 채우고, 1099 데이터는 기타 소득 항목을 채웁니다. 이는 별도의 워크플로우가 아니라 동일한 신고서에 대한 입력값입니다.
차이점은 필드 세트입니다. W-2는 20개 이상의 박스에 걸쳐 고용주 측 임금 및 원천징수 데이터를 보고합니다. 1099-NEC는 지급인 측 비직원 보상을 소수의 박스에 보고합니다. 두 양식 유형은 지급인/수취인 식별 필드만 공유하며, 나머지는 모두 다른 스키마를 사용합니다. 통합 워크플로우는 동일한 업로드 배치에서 두 스키마를 모두 처리할 수 있어야 합니다.
AI 기반 문서 추출은 고정 템플릿에 의존하지 않기 때문에 이를 가능하게 합니다. 사용자 정의 열 추출을 사용하면 원하는 열을 정의하고(W-2의 경우 "박스 1 임금", 1099-NEC의 경우 "비직원 보상"), AI가 배치 내 모든 양식에서 각 값을 의미론적 의미로 찾습니다. 동일한 업로드 폴더에 ADP의 W-2와 Upwork의 1099-NEC가 포함될 수 있으며, 각 양식은 올바른 필드 세트에 매핑됩니다.
추출 원칙: 출력 스키마를 정의합니다. AI가 문서를 읽고 열을 채웁니다. 동일한 열 정의가 모든 고용주의 W-2 레이아웃에서 작동합니다. AI가 픽셀 위치가 아닌 박스 번호를 읽기 때문입니다.
수동 세금 양식 데이터 입력의 실제 비용
모든 회계 법인은 수동 데이터 입력이 비용이 많이 든다는 것을 알고 있습니다. 그러나 실제 비용은 1분기에 더욱 가중되는 네 가지 계층으로 구성됩니다.
물량 압축. 고용주는 1월 31일까지 직원에게 W-2를, 같은 날짜까지 계약자에게 1099-NEC를 제공해야 합니다. 즉, 모든 양식이 4~6주 기간 내에 도착합니다. 1,000건의 정보 보고서를 처리하는 법인은 이 작업을 분산할 수 없습니다. 모든 작업이 2월 1일부터 3월 15일 사이에 집중됩니다. 이 피크를 감당하는 데 필요한 인력은 비용이 많이 듭니다. 계절 데이터 입력 직원, 초과 근무 수당, 또는 자문 업무에서 선임 직원을 빼내 숫자를 입력하게 하는 비용이 발생합니다.
전사 오류 비용. IRS는 모든 정보 보고서를 납세자가 제출한 신고서와 상호 참조합니다. EIN 전치, Box 12 코드 오독, 잘못된 금액 등 불일치가 발생하면 CP2000 통지가 발송됩니다. 각 통지마다 법인은 15~30분의 청구 불가능한 해결 시간(원본 문서 찾기, 수치 비교, 답변 준비)을 소비합니다. 1,000개 양식에서 2%의 오류율은 20건의 통지와 약 5~10시간의 청구 가능 시간 손실을 발생시킵니다. 법인은 자체 데이터 입력 실수를 수정하는 데 대해 고객에게 청구할 수 없기 때문에 이 비용을 부담합니다.
1분기 시간의 기회 비용. 일반적인 CPA 청구 요율이 시간당 $150~$400인 경우, W-2 전사에 33시간을 사용하면 자문 업무, 복잡한 신고서 또는 세금 계획에서 $5,000~$13,000의 수익 손실이 발생합니다. 세금 시즌은 업무 용량이 가장 제한되는 때입니다. 입력에 소비하는 모든 시간은 법인이 프리미엄으로 청구할 수 있는 업무에 사용하지 못하는 시간입니다.
연도 간 조정 지연. 고객은 수정 신고 또는 전년도 신고를 위해 여러 해의 W-2를 가져옵니다. 전년도 양식은 약간 다른 레이아웃을 사용할 수 있지만(IRS는 최근 몇 년 동안 Box 12 보고를 조정했습니다), 데이터는 고용주의 원본 제출에서 IRS가 보유한 파일과 일치해야 합니다. 전년도 데이터를 다시 입력하면 전사 작업과 오류 위험이 두 배로 늘어납니다.
이 네 가지 비용은 W-2 및 1099 데이터 입력을 세무 업무에서 ROI가 가장 높은 자동화 대상 중 하나로 만듭니다. 작업이 지적으로 요구되기 때문이 아니라(정반대입니다), 물량이 예측 가능하고, 마감일이 고정되어 있으며, 오류 결과가 구체적이기 때문입니다.
OCR 및 AI 추출이 회계 워크플로에 어떻게 통합되는지에 대한 더 넓은 시각은 회계 팀을 위한 문서 데이터 추출 가이드를 참조하세요.
추출해야 할 모든 W-2 항목
W-2 양식은 각 직원의 임금과 원천징수 세금을 보고합니다. IRS는 모든 W-2가 고정된 상자 번호 체계를 따르도록 규정합니다. 일반적인 세금 신고 워크플로에서 중요한 모든 항목은 다음과 같습니다.
| 상자 | 항목 | 1040 매핑 |
|---|---|---|
| b | 고용주 EIN | IRS 매칭; 정확히 9자리여야 함 |
| c | 고용주 이름 및 주소 | 신고 식별; 주 제출 |
| e | 직원 이름 | SSN 기록과 일치해야 함 |
| f | 직원 주소 | 신고서 사전 입력 |
| 1 | 임금, 팁, 기타 보상 | Form 1040 1번째 줄 |
| 2 | 연방 소득세 원천징수액 | Form 1040 25a번째 줄 |
| 3 | 사회보장 임금 | Schedule 2 11번째 줄 |
| 4 | 사회보장세 원천징수액 | Schedule 2 11번째 줄 |
| 5 | 메디케어 임금 및 팁 | 추가 메디케어 세금 기준 |
| 6 | 메디케어세 원천징수액 | Schedule 2 12번째 줄 |
| 7 | 사회보장 팁 | SS 임금 한도에 영향 |
| 8 | 배분된 팁 | Form 4137 |
| 10 | 부양가족 돌봄 혜택 | Form 2441 |
| 11 | 비적격 플랜 | 과세 소득일 수 있음 |
| 12a–12d | 코드 및 금액 (D = 401k, E = 403b, G = 457b, C = 단체 생명보험 등) | 각 코드는 세금 처리가 다름 |
| 13 | 법정 직원 / 퇴직 플랜 / 제3자 병가 수당 | 체크박스 상태 |
| 14 | 기타 (노동조합 회비, 교육 지원 등) | 고용주별 상이 |
| 15 | 주 고용주 ID | 주 제출 식별 |
| 16 | 주 임금 | 주 신고 소득 |
| 17 | 주 소득세 | 주 신고 원천징수 |
| 18–20 | 지방 임금, 지방세, 지역명 | 지방 신고 (해당 시) |
대부분의 신고서에서 반드시 추출해야 하는 항목은 상자 1, 2, 3, 4, 5, 6, 12(코드 및 금액), 15, 16, 17, 그리고 직원/고용주 식별 정보(b, c, e)입니다. 세금 준비를 위해 추출 결과에는 과세 연도를 열로 포함하여 여러 연도 배치가 올바르게 식별되도록 해야 합니다.
상자 12 코드는 특별한 주의가 필요합니다. 코드 D(401k 이연)와 코드 C(5만 달러 초과 단체 정기 생명보험)는 일부 고용주의 인쇄 레이아웃에서 시각적으로 유사하지만 세금 처리가 완전히 다릅니다. 추출 시스템은 문자 코드를 정확히 읽고 올바른 금액과 연결해야 합니다. 코드를 잘못 읽으면 초기 검토를 통과하지만 몇 달 후 IRS 통지를 촉발하는 오류 유형입니다.
모든 1099 종류와 주요 입력란
1099 계열에는 최소 6가지 일반적인 양식 유형이 있습니다. 각 양식은 서로 다른 상자 번호 체계를 사용합니다. 통합 추출 워크플로는 올바른 필드 매핑을 적용하기 전에 각 양식을 분류해야 합니다.
| 양식 | 목적 | 추출할 주요 필드 |
|---|---|---|
| 1099-NEC | 비직원 보상 | Box 1a (비직원 보상), Box 4 (연방 원천징수세), Box 5–7 (주/지방세). 2026년 변경: OBBBA에 따라 Box 1이 1a(보상), 1b(현금 팁), 1c(TTOC 코드), 1d(초과근무 보상)로 분할됩니다. |
| 1099-MISC | 잡소득 | Box 1 (임대료), Box 2 (로열티), Box 3 (기타 소득), Box 4 (연방세), Box 6 (의료비), Box 8 (대체 지급), Box 10 (작물 보험) |
| 1099-INT | 이자 소득 | Box 1 (이자 $10 이상), Box 2 (조기 인출 패널티), Box 3 (면세 이자) |
| 1099-DIV | 배당금 | Box 1a (일반 배당금), Box 1b (적격 배당금), Box 2a (자본 이득 분배) |
| 1099-B | 브로커 거래 수익 | Box 1a (단기 손익), Box 2a (장기 손익), Box 3 (IRS에 보고된 비용 기준) |
| 1099-K | 카드/제3자 거래 | Box 1a (총 카드 지급액), Box 1b (총 TPN 지급액), Box 2 (가맹점 코드) |
2026년 OBBBA로 인한 1099-NEC 변경 사항은 특별히 주의해야 합니다. One Big Beautiful Bill Act는 현금 팁과 초과근무 보상을 위한 전용 보고란을 도입했습니다. 1099-NEC의 Box 1은 Box 1a(비직원 보상, 주요 금액), Box 1b(별도 명시된 현금 팁), Box 1c(재무부 팁 직종 코드), Box 1d(초과근무 보상)로 확장되었습니다. 2026년 이전에 구축된 모든 추출 워크플로는 업데이트되어야 합니다. 도구가 여전히 모든 것을 "Box 1"에 매핑한다면 새로운 하위 상자를 놓치고 잠재적으로 잘못된 금액을 보고하게 됩니다.
Fidelity, Schwab, Vanguard의 통합 브로커 명세서는 복잡성을 가중시킵니다. 단일 다중 페이지 문서에는 1099-INT, 1099-DIV, 1099-B 및 1099-MISC 데이터가 결합되어 있을 수 있습니다. 추출 시스템은 각 양식 유형이 시작되는 위치를 식별하고 데이터를 별도의 레코드로 분할해야 합니다. 그렇지 않으면 전체 통합 명세서가 하나의 거대한 1099로 처리되어 내용의 대부분에 잘못된 상자 매핑이 적용됩니다.
과제: 동일한 서식, 다른 실행 방식
IRS 서식은 규정에 따라 표준화되어 있지만, 실제 실행 과정에서는 수동 데이터 입력 워크플로우가 조용히 흡수하고 자동화된 시스템이 명시적으로 처리해야 하는 다섯 가지 문제가 발생합니다.
고용주 인쇄 변형. 대규모 고용주는 ADP, Paychex, QuickBooks Payroll, Gusto를 사용합니다. 각각 IRS 지정 레이아웃으로 W-2를 인쇄하지만 글꼴, 상자 테두리 두께 및 정렬이 다릅니다. 사본 A(IRS 사본)는 특정 필드를 복사본에서 보이지 않게 만드는 적색 드롭아웃 잉크를 사용합니다. 사본 B(직원 사본)는 단일 시트이거나 뒷면에 주 데이터가 있는 결합 양식일 수 있습니다. 일부 고용주는 천공된 카드 용지에 인쇄하고, 다른 고용주는 일반 용지를 사용합니다. 상자 번호는 동일하지만 모든 급여 제공업체마다 시각적 표현이 다릅니다. 픽셀 좌표에 의존하는 추출 도구는 실패합니다. 상자 레이블을 읽는 의미론적 시스템은 모든 경우에 작동합니다.
1099 자동 분류. 50개의 1099 배치에는 35개의 NEC, 10개의 MISC, 3개의 INT, 2개의 DIV가 포함될 수 있습니다. 추출 전에 각각을 양식 유형별로 분류해야 합니다. 1099-MISC 상자 3("기타 소득")은 1099-INT 상자 3("면세 이자")과 완전히 다른 의미입니다. 추출 시스템은 왼쪽 상단 모서리에 있는 양식 제목을 읽어 처리 중인 1099 변형을 확인한 다음 해당 변형에 대한 올바른 상자 매핑을 적용해야 합니다.
다중 주 W-2. 여러 주에서 근무한 직원은 각 주에 대해 반복되는 상자 15~17의 여러 주 행을 갖습니다. AI는 각 주의 고용주 ID, 임금 및 세금을 단일 레코드로 그룹화하고 주 A의 임금과 주 B의 원천징수 세금을 혼합하지 않아야 합니다. 소득세가 없는 플로리다, 텍사스, 네바다, 워싱턴, 사우스다코타, 와이오밍, 알래스카, 뉴햄프셔, 테네시 주의 직원의 경우 주 필드는 비어 있어야 하며 시스템이 누락된 데이터로 플래그를 지정하지 않아야 합니다.
수기 수정. 소규모 고용주는 가끔 W-2의 인쇄된 값을 취소선으로 지우고 수정된 숫자를 손으로 씁니다. 이는 고용주가 막판에 급여 조정을 했을 때 상자 1(임금)에서 가장 일반적입니다. AI는 기계 인쇄보다 낮은 정확도로 필기를 읽습니다. 수기 숫자 수정의 경우 70~85%의 정확도를 예상하세요. 이러한 양식은 수동 확인이 필요합니다.
낮은 스캔 품질. 150 DPI 이하로 스캔되거나 휴대폰 카메라로 비스듬히 촬영된 양식은 상자 레이블이 저하됩니다. 상자 1과 상자 2의 차이를 모든 시스템이 구분하기 어려워집니다. 안정적인 추출을 위한 임계값은 스캔의 경우 최소 200 DPI, 스마트폰 촬영의 경우 초점이 맞고 정면에서 찍은 사진입니다.
W-2와 1099를 한 번에 처리하는 방법
다음은 CPA 회계법인이나 세무사가 AI 기반 추출을 통해 W-2와 1099가 섞인 문서를 일괄 처리하는 6단계 워크플로입니다. 이 워크플로는 W-2 추출 도구나 1099-to-Excel 변환기와 같은 의미론적 추출 도구를 사용한다고 가정하지만, 단계 자체는 모든 의미론적 추출 플랫폼에 적용됩니다.
과세 연도, 직원 이름, 주민등록번호, 고용주 EIN, 고용주 이름, Box 1 임금, Box 2 연방세, Box 3 사회보장 임금, Box 4 사회보장세, Box 5 메디케어 임금, Box 6 메디케어 세금, Box 12 코드, Box 12 금액, Box 13 체크박스, 주, 주 ID, 주 임금, 주 세금. 1099-NEC의 경우: 과세 연도, 수취인 이름, 수취인 TIN, 지급인 이름, 지급인 EIN, Box 1a 비직원 보수, Box 1b 현금 팁, Box 4 원천징수 연방세, 주, 주 세금. 사용자 정의 열 추출을 사용하면 이러한 열 이름을 출력 헤더로 입력하면 AI가 의미론적 이해를 통해 각 양식에서 해당 값을 찾습니다. 동일한 열 정의가 ADP, Paychex 및 Gusto의 W-2에서 수정 없이 작동합니다.- 주민등록번호 및 EIN — 원본 양식과 모든 문자를 대조 확인하세요. 숫자 하나만 잘못 입력되어도 IRS 매칭에 사용할 수 없는 데이터가 됩니다.
- Box 12 코드 — 문자 코드가 금액과 일치하는지 확인하세요. 코드 D(401k)와 코드 C(단체 생명 보험)는 일부 글꼴에서 비슷해 보입니다.
- 복수 주 행 — A주의 임금이 B주의 세금 원천징수와 짝지어지지 않았는지 확인하세요.
- 1099-NEC Box 1a — 새로운 OBBBA 하위 상자로 인해 비직원 보수가 1a에 있고 1b(팁) 또는 1d(초과 근무)로 빠지지 않았는지 확인하세요.
문서 데이터 추출이 더 넓은 회계 워크플로에 어떻게 통합되는지 자세히 알아보려면 회계 문서 전체를 다루는 가이드를 참조하세요.
세무 소프트웨어로 내보내기: 필드 매핑
마지막 단계는 추출 워크플로의 가치를 완전히 실현하거나 무너뜨리는 지점입니다. 모든 세무 소프트웨어가 CSV 가져오기를 동일하게 처리하지는 않습니다. 다음은 미국에서 가장 많이 사용되는 5가지 세무 신고 플랫폼의 구체적인 가져오기 요구 사항입니다.
Drake Tax
Drake는 가져오기 센터를 통해 CSV로 W-2 및 1099 데이터 가져오기를 지원합니다. 가져오기 시 Drake 내부 필드 이름과 일치하는 특정 열 헤더가 필요합니다. W-2의 경우 주요 매핑에는 고용주 EIN에 EMPEIN, 임금에 BOX1, 연방 원천징수세에 BOX2가 포함됩니다. 1099-NEC의 경우 비직원 보상에 PAYERNAME, PAYEREIN, NECBOX1이 필요합니다. 이러한 헤더로 추출 결과를 내보내면 Drake가 각 고객의 양식을 자동으로 채웁니다. Drake는 또한 스프레드시트 셀에서 양식 입력 화면으로 직접 복사하여 붙여넣는 것을 지원하므로 CSV 가져오기에서 형식 오류가 발생할 경우 대체 방법으로 사용할 수 있습니다.
UltraTax CS (Thomson Reuters)
UltraTax CS는 CSV 파일을 위한 데이터 가져오기 유틸리티를 제공합니다. 가져오기 시 각 행에 고객 ID를 포함해야 하며, UltraTax는 ID를 일치시켜 데이터를 올바른 고객 신고서로 라우팅합니다. W-2의 경우 시스템은 열 헤더(W2_BOX1, W2_BOX2 등)를 일치시켜 W-2 화면 필드에 매핑합니다. UltraTax는 또한 독점 매핑 템플릿을 사용한 Excel 기반 가져오기를 지원하는데, 이는 더 유연하지만 세금 시즌이 시작되기 전에 설정이 필요합니다. Thomson Reuters는 UltraTax CS 도움말 시스템의 "데이터 가져오기"에서 정확한 필드 이름 규칙에 대한 문서를 제공합니다.
ProSeries (Intuit)
ProSeries는 스프레드시트에서 가져오기 기능을 통해 CSV로 W-2 및 1099 가져오기를 지원합니다. 열 머리글은 ProSeries 필드 이름과 일치해야 하며, Intuit는 ProSeries 지원 포털에서 다운로드 가능한 매핑 템플릿(필수 머리글이 포함된 .CSV)을 제공합니다. 1099의 경우 가져오기 시 FormType 열(예: "1099-NEC")이 필요하므로 시스템이 채울 양식을 알 수 있습니다. 추출 결과에는 여러 1099 변형이 포함된 배치에 대해 이 분류 열이 포함되어야 합니다.
Lacerte (Intuit)
Lacerte의 가져오기 워크플로는 자체 스프레드시트 템플릿 가져오기를 사용합니다. Lacerte는 클라이언트 ID 열을 포함하여 하나의 가져오기 파일로 여러 클라이언트를 가져올 수 있습니다. W-2의 경우 각 행에는 클라이언트 ID, 양식 데이터 및 과세 연도가 포함되어야 합니다. 1099의 경우 추출 결과는 클라이언트당 양식 유형별로 한 행씩 구성되어야 합니다. W-2, 1099-NEC 및 1099-INT가 있는 클라이언트는 내보내기 파일에서 세 개의 행을 차지하며, 각 행은 동일한 클라이언트 ID와 적절한 양식 유형 식별자로 태그가 지정됩니다.
ATX 및 TaxSlayer Pro
ATX와 TaxSlayer Pro는 모두 필드 매핑이 포함된 CSV 가져오기를 지원합니다. ATX는 ATX 가져오기 관리자를 사용하며, 단계별 매핑 마법사를 안내합니다. TaxSlayer Pro는 ProForm을 사용하며, 특정 열 명명 규칙을 요구합니다. 두 시스템 모두 추출 결과는 숫자 금액(달러 기호나 쉼표 없음)과 텍스트 형식의 SSN/EIN(선행 0 유지)이 포함된 일반 CSV로 내보내야 합니다.
모든 세무 소프트웨어에 적용되는 서식 규칙: SSN 및 EIN을 숫자가 아닌 텍스트 문자열로 내보내십시오. SSN의 선행 0(예: "012-34-5678")은 열이 숫자 형식으로 지정된 경우 자동으로 제거됩니다. 달러 금액은 통화 기호나 쉼표 구분 기호 없이 일반 숫자로 내보내십시오. IRS 양식 데이터는 모두 숫자입니다. 불필요한 서식은 모든 주요 세무 신고 시스템에서 가져오기 오류를 발생시킵니다.
보안 및 규정 준수: 추출 도구 선택 시 확인할 사항
세금 양식에는 사회보장번호(SSN), 고용주식별번호(EIN), 임금 데이터 등 기업이 취급하는 가장 민감한 개인 정보가 포함됩니다. 모든 추출 도구가 이러한 데이터를 책임감 있게 처리하도록 설계된 것은 아닙니다.
메모리 내 처리. 도구는 문서를 메모리에서 처리해야 하며, 추출 완료 후 업로드된 파일을 디스크에 저장하지 않아야 합니다. 데이터 보존에 대한 명시적인 정책을 확인하세요. 일부 도구는 모델 학습을 위해 업로드된 파일을 보관하는데, 이는 SSN이 포함된 세금 문서에는 적합하지 않습니다.
전송 중 및 저장 데이터 암호화. 업로드는 반드시 HTTPS를 사용해야 합니다. 저장되는 모든 데이터(임시 데이터 포함)는 암호화되어야 합니다. 대부분의 평판 좋은 추출 도구는 이를 제공하지만, 클라이언트 데이터를 업로드하기 전에 반드시 확인하세요.
데이터 학습 금지. 도구의 서비스 약관에 업로드된 문서가 AI 모델 학습이나 개선에 사용되지 않는다고 명시되어 있는지 확인하세요. 이는 일반 소비자용 OCR 도구에서 흔히 볼 수 있는 기본 설정으로, 세금 문서에는 적합하지 않습니다.
접근 제어. 도구가 다중 사용자 접근을 지원하는 경우, 사용자가 자신의 업로드만 볼 수 있는지 확인하세요. 모든 사용자가 모든 업로드 양식을 볼 수 있는 공유 도구는 규정 준수 위험입니다.
데이터 삭제. 도구는 업로드된 문서와 추출된 데이터를 보존 기간(예: 24시간) 후 자동으로 또는 요청 시 영구 삭제할 수 있는 기능을 제공해야 합니다. 일부 기업은 세금 신고서 제출 후 데이터를 삭제해야 하는 문서 보존 정책을 가지고 있습니다.
자주 묻는 질문
W-2 Box 1(임금)의 정확도는 어느 정도인가요?
200 DPI 이상으로 스캔한 깨끗하고 인쇄된 W-2의 경우 Box 1 정확도는 일반적으로 93~98%입니다. 가장 흔한 오류는 소수점 구분자를 잘못 읽는 것입니다. 특히 임금 금액의 인쇄된 소수점이 숫자에 가까운 양식에서 발생합니다. 동일한 필드에서 손글씨 양식의 정확도는 70~85%로 떨어집니다. 해결책은 AI의 100% 정확도를 기대하는 것이 아니라, 위험이 높은 필드에 대해 양식당 15~30초의 검증 시간을 할당하는 것입니다. 이는 처음부터 수동 입력하는 것보다 여전히 80%의 시간을 절약해 줍니다.
W-2 및 1099 추출에 계절적 정확도 문제가 있나요?
아니요 — AI 모델은 연중 일관된 성능을 유지합니다. 계절적 요인은 물량입니다. 세금 시즌 외에는 월 50건의 W-2를 처리하던 회사가 1월부터 3월까지는 월 500건을 처리합니다. 검증 병목 현상은 기술적 문제가 아닌 인적 문제입니다. 세금 시즌이 시작되기 전에 추출 워크플로를 구축하고, 12월에 20개 양식으로 시험 배치를 처리하여 1월 홍수 이전에 양식 유형 문제를 발견하세요.
AI가 필기로 작성된 W-2 수정 사항을 추출할 수 있나요?
부분적으로 가능합니다. AI는 인쇄체보다 필기체 인식 정확도가 낮아 필기 숫자 수정의 경우 70~85%의 정확도를 보입니다. 소규모 고용주는 인쇄된 임금 금액을 취소선으로 지우고 수정된 금액을 손으로 쓰는 경우가 있습니다. 이러한 양식은 수동 검증이 필요합니다. 일부 추출 도구는 AI가 필기를 감지한 필드를 플래그 지정하여 어떤 양식에 추가 주의가 필요한지 쉽게 식별할 수 있게 해줍니다.
다중 주 W-2는 어떻게 처리하나요?
출력에 주, 주 ID, 주 임금, 주 세금을 열로 포함하세요. 세 개의 주에서 근무한 직원은 W-2에 세 세트의 주 데이터가 있습니다. AI는 각 주의 데이터를 별도의 레코드로 그룹화해야 하며, 주 A의 임금과 주 B의 세금을 혼합해서는 안 됩니다. 추출 후 주 약어를 임금 금액과 비교하여 주 행이 올바르게 그룹화되었는지 확인하세요. 소득세가 없는 주(플로리다, 텍사스, 네바다 및 기타 7개 주)에 거주하는 직원의 경우 주 필드는 비어 있어야 하며, 누락된 데이터로 플래그를 지정하지 마세요.
통합 중개 1099는 어떻게 처리하나요?
대형 중개사의 통합 1099는 여러 1099 양식 유형을 단일 다중 페이지 문서에 결합합니다. AI 추출 도구의 세분화 능력은 다양합니다. 일괄 처리에 앞서 단일 통합 명세서로 추출 도구를 테스트하세요. 도구가 전체 문서를 (INT/DIV/B/MISC 구성 요소로 세분화하지 않고) 하나의 1099로 처리하는 경우, 각 양식 유형을 별도로 처리하거나 통합 명세서에 다른 도구를 사용해야 합니다.
모든 1099 변형을 한 번에 처리할 수 있나요?
네, 추출 도구가 양식 제목을 읽어 각 양식을 자동으로 분류한다면 가능합니다. 출력에는 "양식 유형" 열이 포함되어 분류를 확인할 수 있어야 합니다. 일부 도구는 기본적으로 이를 지원하며, 다른 도구는 업로드 전에 1099를 변형별로 정렬해야 합니다. 자동 분류는 항상 확인하세요. 1099-MISC가 1099-NEC로 잘못 분류되면 모든 필드의 상자 매핑이 잘못됩니다.
추출 기능이 이전 연도 W-2를 처리할 수 있나요?
네 — AI는 받은 연도의 양식을 읽습니다. 추출 출력에 "과세 연도" 열을 포함하세요. 이전 연도 W-2는 Box 12 형식이나 글꼴 선택이 약간 다를 수 있지만, 상자 번호 체계는 연도에 관계없이 일관됩니다. IRS는 2020년과 2023년에 양식 간격에 영향을 주는 사소한 레이아웃 조정을 했지만 상자 번호에는 영향을 미치지 않았습니다.
AI 추출이 실제로 얼마나 시간을 절약해 주나요?
100개의 W-2를 처리하는 세무 전문가의 경우: 수동 입력은 양식당 2~3분으로 총 200~300분(3.3~5시간)이 소요됩니다. AI 추출은 양식당 5~10초에 검증 15~30초를 더해 총 약 35~50분이 소요됩니다. 이는 80~85%의 시간 절감입니다. 1,000개의 양식을 처리하는 회사는 세무 시즌당 약 25~35시간을 절약할 수 있으며, 이 시간을 세무 계획, 복잡한 신고 또는 고문 업무에 재투자할 수 있습니다.
OBBBA에 따라 2026년 1099-NEC에 어떤 변화가 있나요?
One Big Beautiful Bill Act는 1099-NEC의 Box 1을 4개의 하위 상자로 분할했습니다: Box 1a(비직원 보수), Box 1b(현금 팁), Box 1c(재무부 팁 직종 코드), Box 1d(초과 근무 보수). 이러한 변경 사항은 2026 과세 연도(2027년 신고)부터 적용됩니다. 2026년 이전에 구축된 추출 워크플로우가 있다면 이러한 새로운 하위 상자를 포함하도록 열 정의를 업데이트하세요. 총 비직원 보수는 Box 1a에 유지되며, Box 1b와 1d는 별도의 소득 금액이 아닌 추가 세분화 항목입니다.
주민등록번호가 포함된 세금 신고서를 업로드해도 안전한가요?
도구의 데이터 처리 방식에 따라 다릅니다. 파일을 장기 저장 없이 메모리에서만 처리하고, HTTPS를 사용하여 업로드하며, 문서를 모델 학습에 사용하지 않는다고 명시하는 도구만 사용하세요. 가능하다면 SOC 2 또는 ISO 27001 인증 여부를 확인하세요. 대부분의 회계 법인에서 명확한 데이터 보존 정책을 가진 평판 좋은 AI 추출 도구는 직원 간에 주민등록번호가 포함된 스프레드시트를 이메일로 전송하는 것(현재 많은 법인이 사용하는 방식)보다 더 안전합니다.
관련 가이드
이 글은 회계 전문가를 위한 재무 문서 추출 시리즈의 일부입니다:
- OCR이란 무엇인가? 광학 문자 인식 완벽 가이드 — 문서 데이터 추출에 대한 기본 허브 글
- 회계를 위한 OCR: 재무 팀을 위한 실용 가이드 — OCR 및 AI 추출이 회계 워크플로우에 통합되는 방식
- 회계사를 위한 문서 데이터 추출: 완벽 가이드 — 회계 문서의 전체 범위와 추출 전략