50개 홀레리트, 하나의
급여 요약
상파울루의 한 회계 법인은 30개 고객사의 급여를 처리하며 매달 약 1,200개의 홀레리트를 다룹니다. 각각 다른 고용주, 다른 급여 시스템, 다른 PDF 레이아웃에서 생성됩니다. 병목 현상은 추출 기술이 아닙니다. 50번째 홀레리트를 추출한 후 모든 직원의 INSS 합계가 고용주의 DARF(연방 수입 징수 문서) 송금 금액과 일치하지 않는다는 것을 깨달았을 때 발생합니다. 어떤 행이 잘못되었는지 전혀 알 수 없습니다.
핵심 요점
- 월 40시간 이상 홀레리트를 수동 입력하는 것은 단순히 느린 것만이 아닙니다. 1~3%의 수동 입력 오류율에서 1,200개 행 배치는 통계적으로 12~36개의 잘못된 INSS 또는 IRRF 값을 보장하며, 이는 전 직원의 변호사가 발견할 때까지 알아채지 못합니다.
- CLT 제467조는 퇴직 시 발견된 모든 미지급 금액을 두 배로 늘리며, 각 수정되지 않은 오류는 데이터를 한 행씩 입력할 때 모든 직원의 공제액을 한눈에 볼 수 없기 때문에 조용히 누적됩니다.
- ImageToTable.ai는 모든 급여 시스템의 50~1,200개 홀레리트를 한 번의 일괄 업로드, 하나의 정의된 열 세트, 하나의 통합 스프레드시트로 변환합니다. 그런 다음 단일 열 정렬로 모든 직원의 모든 공제 이상 징후를 식별하여 40시간의 데이터 입력 작업을 15분 감사로 전환합니다.
한 번에 한 장씩 급여명세서를 추출하는 방식이 확장되지 않는 이유
브라질 급여명세서(홀레리치/콘트라체키) 한 장을 엑셀로 추출하면 직원 한 명의 데이터 문의는 해결됩니다. 하지만 회사 전체의 INSS 부채 총액, FGTS 예치금 합계, 급여 구간별 평균 IRRF 원천징수액 등 전체적인 답변이 필요해지는 순간, 단일 파일 추출은 더 이상 업무 흐름이 아닌 느린 데이터 조정 프로젝트가 됩니다.
단일 브라질 급여명세서를 INSS 및 IRRF와 함께 엑셀로 추출하는 방법에 대한 가이드를 이미 읽으셨다면 기본 사항을 아실 것입니다: 열 이름을 정의하고, 홀레리치 PDF를 업로드하면 AI가 화면 위치가 아닌 레이블의 의미를 이해하여 각 필드를 추출합니다. 이는 한 장의 급여명세서에는 효과적입니다. 하지만 12개 회사의 50개 홀레리치가 있을 때, 한 번에 한 장씩 처리하는 방식으로는 해결할 수 없는 세 가지 구조적 문제가 발생합니다.
첫째, 다양한 형식의 불일치 문제입니다. 30개 고객사를 대상으로 하는 급여 아웃소싱 업체는 동일한 형식의 PDF 30개를 받지 않습니다. TOTVS RM은 한 가지 레이아웃으로 홀레리치를 생성하고, ADP Brazil은 다른 방식, Senior Sistemas는 또 다른 방식을 사용합니다. 소규모 사업체 고객은 인쇄된 급여명세서를 스마트폰으로 찍은 사진을 보낼 수도 있습니다. 감열지에 희미한 잉크로 기계 판독 가능한 데이터 계층이 없습니다. 한 번에 한 장씩 처리하는 방식에서는 각 형식에 수동으로 적응합니다. 일괄 처리 방식에서는 도구가 재구성 없이 모든 형식을 동시에 처리해야 합니다. 고정 좌표를 일치시키는 대신 레이블의 의미를 이해하여 "INSS"를 찾는 의미론적 추출이 바로 일괄 처리와 문제의 일괄 처리(배칭)를 구분하는 차이점입니다.
둘째, 조정 부담이 기하급수적으로 늘어납니다. 단일 홀레리치에는 INSS, IRRF, FGTS의 세 가지 법정 공제와 교통바우처(vale-transporte), 노동조합비 등 선택 공제가 있습니다. 한 장의 급여명세서 공제 내역을 공식 세율표와 대조하는 데는 몇 초면 충분합니다. 1,200장의 홀레리치라면 동일한 확인 작업이 풀타임 업무가 됩니다. 더 심각한 문제는, 고용주의 월별 DARF 및 GFIP(FGTS 납부 및 사회보장 정보 안내서 — 곧 Decreto nº 8.373/2014에 따라 eSocial을 통해 DCTFWeb으로 완전히 대체 예정)가 모든 직원의 INSS/IRRF/FGTS 총액을 집계하여 보고한다는 점입니다. 추출된 일괄 합계가 고용주의 집계 신고와 일치하지 않으면, 어떤 특정 직원 행에 오류가 있는지 식별해야 합니다. 1,200개 행에서 그 검색은 빠르지도 않고 청구 가능한 작업도 아닙니다.
셋째, 규정 준수 위험이 더해지는 것이 아니라 증폭됩니다. CLT 제467조에 따라, 고용주가 임금 공제액을 과소 송금한 경우(예: 잘못된 INSS 또는 IRRF 금액 보고) 그 차액이 퇴직 시 발견되면 직원은 과소 지급된 금액의 두 배를 받을 자격이 있습니다. 한 직원, 한 달의 경우 재정적 노출은 고통스럽지만 범위가 제한됩니다. 12개월 동안 50명의 직원이라면, 단일 시스템적 오류(예: 하나의 구간만큼 IRRF 공제를 과소 계산하는 급여 소프트웨어 설정 오류)가 600개 데이터 포인트에 걸쳐 누적됩니다. 일괄 처리 방식은 단순히 추출 속도를 높이는 것 이상의 의미를 갖습니다. 모든 600개 값을 Receita Federal의 누진세율표와 한 번에 감사하여 시스템적 오류가 시스템적 부채로 이어지기 전에 포착할 수 있는 단일 통합 데이터 세트를 제공합니다.
배치 워크플로우 — 50개의 홀레리트 입력, 하나의 급여 시트 출력
배치 워크플로우는 입력 다양성과 출력 일관성 간의 관계를 역전시킵니다. 50개의 홀레리트가 8개의 서로 다른 급여 시스템에서 8개의 서로 다른 PDF 레이아웃으로 제공된다는 점을 받아들이고, 모든 행이 정확히 동일한 열 구조를 따르는 하나의 스프레드시트를 생성합니다.
이를 가능하게 하는 메커니즘은 사용자 정의 열 추출입니다. 각 문서의 각 필드 주위에 경계 상자를 그려야 하는 템플릿 기반 OCR과 달리, 사용자 정의 열 추출은 의미론적으로 작동합니다. "총 급여", "INSS 기여금", "원천징수 IRRF", "FGTS 예치금", "순 급여"와 같이 원하는 필드 이름을 입력하면 AI가 레이블의 의미를 이해하여 각 문서에서 해당 값을 찾습니다. 필드에 "INSS Contribuição"이라고 레이블이 지정된 TOTVS 홀레리트와 "Previdência INSS"라고 레이블이 지정된 ADP 홀레리트는 AI가 좌표가 아닌 의미를 읽기 때문에 동일한 출력 열로 확인됩니다.
실제 배치 워크플로우가 실행되는 방식은 다음과 같습니다.
파일은 안전하게 처리되며 저장되지 않습니다.
일괄 처리는 파일명을 신경 쓰지 않습니다. 수동 엑셀 작업에서는 데이터 출처를 추적하기 위해 "Holerite_Joao_Maio.pdf" 같은 파일명을 사용하지만, 일괄 처리는 원본 파일명을 출력에 그대로 보존합니다. 급여 시스템이 내보낸 파일명 그대로 업로드하면, 출력 스프레드시트의 "원본 파일" 열이 모든 행의 출처를 추적해 줍니다.
일괄 처리 검증 — 추출된 합계를 DARF, GFIP, eSocial과 대조
스프레드시트가 생성되었습니다. 1,200행. 30개 고객사에 걸친 50명의 직원. 이제 CNPJ로 필터링하고, 총급여 구간별로 정렬하며, 기준월별 INSS 공제액을 피벗할 수 있습니다. 하지만 데이터를 신뢰하기 전에 한 가지 질문에 답해야 합니다: AI가 추출한 합계가 고용주가 신고한 금액과 일치합니까?
매월 브라질 고용주는 총 급여를 기준으로 세 가지 통합 세금을 납부합니다:
- DARF Previdenciário — 다음 달 20일까지 납부하는 전체 직원의 통합 INSS 납부액입니다. DARF의 총 INSS 금액은 일괄 출력의 각 직원 INSS 공제액 합계에 고용주의 20% INSS 기여금(사용자 분담금)을 더한 값과 일치해야 합니다. 사용자 분담금은 고용주 회계 기록에는 나타나지만 개별 급여명세서에는 표시되지 않습니다.
- GFIP 및 현재 DCTFWeb을 통한 FGTS — 각 직원 총급여의 8%를 고용주가 적립하며, Lei nº 8.036/1990에 따라 다음 달 7일까지 Caixa Econômica Federal에 납부합니다. GFIP/DCTFWeb의 FGTS 총액은 일괄 출력의 각 직원 FGTS 금액 합계와 일치해야 합니다. FGTS는 누진 구간 없이 고정 8%이므로 항상 일치해야 합니다.
- DARF를 통한 IRRF — 전체 직원에게서 원천징수된 총 소득세입니다. 이는 가장 대조가 까다로운 항목입니다. 각 직원의 IRRF는 누진적으로 계산되며, 부양가족 1인당 월 R$189.59의 공제가 적용되고, Lei nº 15.191/2025에 따라 면제 한도가 R$2,259.20에서 R$2,428.80으로 인상되면서 2025년 중간에 구간이 변경되었습니다.
데이터가 Excel에 들어오면 조정 단계 자체는 빠릅니다. 각 공제 열 하단에 SUM 열을 추가하세요. INSS 합계를 DARF INSS 값과 비교하세요. FGTS 합계를 GFIP 값과 비교하세요. 숫자가 일치한다면(추출이 정확하고 고용주의 급여가 올바르게 구성되었다는 가정 하에) eSocial 교차 제출에 사용할 수 있는 검증된 데이터셋이 완성됩니다.
숫자가 일치하지 않을 때, 통합 스프레드시트는 수학 문제가 아닌 조사 도구가 됩니다. 직원별로 필터링하고, 순 급여 내림차순으로 정렬하며, 개별 IRRF 값을 Receita Federal의 누진세표와 비교하세요. 1,200행짜리 스프레드시트에서 15분 감사는, 그렇지 않았다면 개별 홀레리트 PDF를 열고 수동으로 공제를 다시 확인하는 데 몇 시간이 걸렸을 작업을 대체합니다.
대규모 CLT 467 패널티 — 배치에서 한 자리 숫자 실수가 어떻게 증폭되는가
브라질 노동법은 고용주가 발견한 급여 오류와 직원 변호사가 발견한 오류를 구분하지 않습니다. 공제가 잘못되었을 때(급여 소프트웨어 버그, 구간 오분류, 수동 데이터 입력 오류 등 원인에 관계없이) 책임 시계는 오류가 발생한 순간부터 시작되며, 이를 발견한 순간이 아닙니다.
CLT 제467조는 특정 메커니즘을 만듭니다: 해고 시 고용주가 전액(과거 미지급분에 대한 수정 금액 포함)을 지급하지 못하면, 직원은 차액의 두 배를 받을 자격이 생깁니다. 한 명의 HR 분석가가 월 50개의 홀레리트를 수동으로 입력하는 환경에서 오류율은 보험수학적으로 확실합니다. 급여 맥락에서 수동 데이터 입력에 대한 연구는 일반적으로 1%에서 3%의 오류율을 보입니다. 즉, 1,200개의 홀레리트 배치에서 12~36개 행에 최소 하나의 잘못된 값이 포함되어 있습니다.
배치 처리 접근 방식이 다른 점은 오류를 완전히 제거한다는 것이 아닙니다(어떤 추출 방법도 가능한 모든 문서 품질에서 100% 정확도를 달성하지는 못합니다). 달라지는 것은 오류를 언제 발견하고 몇 개를 한 번에 발견하느냐입니다.
수동 워크플로우에서는 각 홀레리트가 독립적인 검증 단위입니다. 값을 입력하고, 급여명세서를 보고, 다음 것으로 넘어갑니다. 행 간 무결성 검사가 없습니다. 동일한 급여 구간에 있는 14명의 직원에게 영향을 미치는 INSS 구간 오분류는 수동 흐름에서 14개의 독립적인 실수처럼 보이며, 몇 달 동안 발견되지 않을 수 있습니다.
배치 워크플로우에서는 통합 출력 덕분에 행 전체에서 이상 징후를 볼 수 있습니다. INSS 기여금 열을 내림차순으로 정렬하세요. 총 급여가 같은 직원은 동일한 INSS 공제(누진 구간 계산 조정 후)가 있어야 합니다. R$3,000 구간의 직원 14명 중 12명이 약 R$219(처음 두 구간을 누진 적용)의 올바른 INSS를 보이고 2명이 R$240을 보인다면, 조사가 필요한 두 행을 식별한 것입니다. 14번의 개별 확인이 아닌, 단 한 번의 정렬 작업으로 말이죠.
수동 배치 급여의 실제 비용은 데이터 입력에 소비하는 40시간이 아닙니다. 모든 직원의 공제를 나란히 볼 수 있는 단일 뷰가 없었기 때문에 발견되지 않은 오류로 인한 복리 책임입니다. 배치 추출은 급여 검증을 문서별 작업에서 열별 감사로 전환합니다. 이것이 배치 처리를 더 빠를 뿐만 아니라 더 안전하게 만드는 운영상의 차이점입니다.
월말 마감에 대한 일괄 처리의 변화
다수의 고객을 담당하는 회계 법인(escritório de contabilidade)의 월말 급여 마감은 예측 가능한 순서를 따릅니다: 각 고객의 급여 시스템에서 홀레리트 PDF 수령 → 주요 필드를 회계 소프트웨어에 수동 입력 또는 내보내기 → DARF/GFIP 집계와 총액 대사 → eSocial S-1299 월별 마감 이벤트 제출 → 고객 보고서 생성. 일괄 추출은 중간 두 단계를 며칠 걸리는 데이터 입력 과정에서 단일 추출 및 검증 세션으로 압축합니다.
변화는 단지 속도만이 아닙니다. 30개 고객의 급여 데이터가 PDF 내부가 아닌 구조화된 형식으로 존재할 때 가능해지는 것이 핵심입니다. "어느 고객이 직원당 평균 INSS 부담이 가장 높은가" 또는 "Q1과 Q2 사이에 어떤 급여 구간에서 IRRF 원천징수가 가장 크게 증가했는가" 같은 질문에 답하기 위해 수백 개의 개별 홀레리트를 다시 읽는 대신 스프레드시트를 필터링하면 됩니다.
급여 명세서와 공급업체 인보이스를 모두 처리하는 회사(동일 고객의 급여와 미지급금을 담당하는 회계 법인에서 흔히 발생)의 경우, 동일한 일괄 접근 방식이 문서 유형 전반에 적용됩니다. 브라질 NF-e 인보이스 데이터 일괄 추출의 메커니즘은 동일한 원리로 작동합니다: 열을 한 번 정의하고, 모든 것을 업로드하고, 하나의 스프레드시트를 받습니다. 입력이 홀레리트, DANFE 또는 NF-e XML이든 출력 형식은 동일합니다.
대부분의 급여 팀이 데이터를 더 빠르게 추출하기 위해 일괄 처리로 전환하는 것은 아닙니다. 수동으로 입력된 급여 데이터는 감사가 이루어지지 않는다는 사실을 깨닫기 때문에 전환합니다. 시간이 없기 때문입니다. 일괄 추출은 감사를 예외가 아닌 기본값으로 만듭니다. 숫자를 확인하는 데 필요한 데이터가 이미 숫자 자체와 동일한 스프레드시트에 있기 때문입니다.
FAQ
한 번에 몇 개의 홀레리트를 처리할 수 있나요?
배치당 파일 수에 엄격한 제한은 없습니다. 도구는 단일 대기열에서 순차적으로 처리합니다. 30개 이상의 고객을 담당하는 회계 법인의 경우, 특정 월의 모든 홀레리트(1,200개 파일이라도)를 한 번에 업로드할 수 있습니다. 출력은 모든 것을 하나의 Excel 파일로 병합하며, CNPJ 또는 회사명으로 필터링하여 고객을 구분할 수 있습니다. 매우 큰 배치의 경우, 기술적 업로드 제한이 아닌 요금제의 월별 파일 할당량이 제약 조건입니다.
서로 다른 고용주가 "INSS"와 "Previdência"처럼 서로 다른 필드명을 사용하면 어떻게 되나요?
AI는 의미 기반으로 추출합니다. 즉, PDF에 정확히 어떤 라벨 텍스트가 있든 "INSS 기여금"이라는 개념과 연결된 값을 찾아냅니다. TOTVS 급여명세서에서 "INSS Contribuição"로 표시된 항목, ADP에서 "Previdência INSS"를 사용한 항목, Senior에서 "Desconto INSS"라고 적힌 항목 모두 AI가 라벨의 의미를 이해하기 때문에 동일한 출력 열로 매핑됩니다. 이것이 템플릿 OCR에 비해 갖는 근본적인 장점입니다. 즉, 열을 한 번만 정의하면 모든 소스 형식이 동일한 구조로 변환됩니다.
일괄 처리 중 Computed Columns를 사용하여 INSS와 IRRF를 검증할 수 있나요?
네. 누진 구간 공식을 사용하여 추출된 총 급여에서 예상 INSS를 계산하는 computed column을 정의할 수 있습니다. 예를 들어, "INSS Expected (Progressive Calc)"라는 이름의 열에 총 급여 값에 4개의 INSS 구간을 적용하는 계산 규칙을 설정하면 예상 공제액이 생성됩니다. 이를 추출된 "INSS Contribution" 열과 비교하여 두 값이 다른 행은 검토 대상으로 표시됩니다. 출력 스프레드시트를 벗어나지 않고도 일괄 감사가 내장되어 있는 것입니다.
일괄 출력에 원본 파일 이름이 포함되어 각 행을 원본 PDF로 추적할 수 있나요?
네. 출력의 모든 행에는 해당 행을 생성한 업로드된 문서를 식별하는 "Source File" 열이 포함됩니다. 이는 규정 준수 워크플로에 필수적입니다. 감사관이 특정 직원의 특정 월 급여명세서를 요청하면, PDF 폴더를 뒤지는 대신 스프레드시트를 필터링하여 원본 파일을 즉시 찾을 수 있습니다.
50개의 급여명세서 중 하나가 제대로 추출되지 않으면 어떻게 되나요?
일괄 처리는 계속 진행됩니다. 하나의 파일 오류가 나머지 처리를 중단시키지 않습니다. 처리 후, 문제가 있는 파일을 확인할 수 있습니다(일반적으로 AI가 극심한 이미지 품질 문제로 인해 필드를 찾지 못한 경우 표시됨). 그런 다음 해당 파일만 더 작은 후속 배치로 다시 업로드하면 됩니다. 대부분의 브라질 급여 PDF는 급여 소프트웨어로 컴퓨터 생성되어 깔끔하고 구조화된 레이아웃을 가지므로, 배치 간 추출 신뢰도는 지속적으로 높습니다.
이것이 TOTVS나 ADP 같은 급여 소프트웨어를 대체하나요?
아닙니다. 급여 소프트웨어는 공제액을 계산하고, 홀레리트를 생성하며, eSocial 제출 파일을 만듭니다. 배치 추출은 워크플로에서 급여 소프트웨어 이후에 위치합니다 — 급여 시스템이 이미 생성한 PDF를 가져와 분석, 고객사 간 통합, 규정 준수 확인을 위해 구조화된 데이터로 다시 변환합니다. 급여 엔진을 대체하는 것이 아니라, "홀레리트 PDF를 보유한 상태"와 "직원, 월, 고객사별 급여 데이터를 분석할 수 있는 상태" 사이의 격차를 메웁니다.
단순 내보내기가 아닌, 감사(Audit)
50개의 홀레리트를 수동으로 Excel에 입력하면 스프레드시트가 생성됩니다. 50개의 홀레리트를 배치 추출해도 스프레드시트가 생성됩니다. 차이는 파일 형식이 아닙니다 — 한 스프레드시트는 신중하게 입력했기에 정확하길 바라는 값들을 담고 있고, 다른 스프레드시트는 동일한 열 덕분에 한 화면에서 직원 간 감사를 통해 검증할 수 있는 값들을 담고 있다는 점입니다.
브라질 급여는 INSS에 대해 4단계 누진세율, IRRF에 대해 5단계, 고정 FGTS 요율, 그리고 사용자 부담 20% INSS 기여금을 포함하여 단일 고정 급여세가 있는 국가에 비해 조정 범위가 3배나 넓습니다. 이러한 복잡성을 홀레리트 하나씩 처리하는 것은 직원이 5명일 때는 변명이 될 수 있습니다. 50명이면 지속 불가능합니다. 1,200명이면 위험합니다 — CLT 제467조에 따라 미적발 오류의 비용은 미지급 금액의 두 배이며, 그렇게 많은 배치에서는 수동 데이터 입력의 기본 상태가 미적발이기 때문입니다.
단일 홀레리트 기본 사항 — INSS 누진세율, 급여 구간별 IRRF 원천징수, FGTS 메커니즘, 단계별 추출 흐름 — 에 대해서는 브라질 급여명세서 데이터를 Excel로 추출하는 가이드부터 시작하세요. 그런 다음 전체 급여에 걸쳐 동일한 프로세스를 한 번에 하나의 배치로 실행할 준비가 되면 이곳으로 돌아오십시오.