급여명세서 데이터 추출
완벽 가이드
모기지 인수자가 브로커로부터 받은 42페이지 분량의 PDF를 엽니다. 세금 신고서와 은행 명세서 사이 어딘가 27페이지쯤에 ADP의 급여명세서가 있습니다. 31페이지에는 Gusto의 것이, 35페이지에는 본 적 없는 급여 제공업체의 것이 있습니다 — 각각 다른 레이아웃, 다른 라벨, 다른 열 위치입니다. 세 가지 모두 동일한 데이터(직원 이름, 총급여, 순급여, YTD 합계, 공제액)를 포함하지만, 이 데이터를 하나의 비교 행으로 추출하려면 세 개의 문서를 열고, 세 개의 다른 템플릿을 읽고, 세 개의 스프레드시트 셀에 값을 입력해야 합니다. 이번 달에 120건의 신청을 처리한다고 가정해 보세요. 급여명세서 데이터 추출이 필요한 이유는 이 곱셈 문제가 현실이고, 대규모 수동 입력은 오류가 규정 준수 책임으로 이어지는 지점이기 때문입니다.
핵심 요약
- 한 달에 120건의 신청을 처리하는 모기지 인수자는 27페이지의 ADP, 31페이지의 Gusto, 35페이지의 처음 보는 제공업체의 급여명세서를 열어야 합니다 — 세 가지 호환되지 않는 레이아웃, 세 번의 데이터 입력 작업, 하나의 대출 결정.
- 템플릿 기반 추출은 급여명세서에 실패합니다. 미국 시장을 지배하는 6개 급여 제공업체가 근본적으로 호환되지 않는 레이아웃을 사용하기 때문이며, 신청자의 고용주가 어떤 제공업체를 선택했는지 통제할 수 없기 때문입니다.
- 템플릿 없는 추출은 하나의 열 정의로 6개 제공업체의 형식을 모두 읽습니다. "총급여"와 "YTD 총급여"를 별도의 열로 분리하면 YTD 수치는 내장된 사기 방지 기능이 됩니다: 기간 총급여 × 급여 기간 수가 YTD 합계와 일치하지 않으면 검토를 위해 어떤 급여명세서를 꺼내야 하는지 정확히 알 수 있습니다.
급여명세서 데이터 추출이 중요한 이유
급여명세서 추출은 그 자체가 목적인 경우가 드물다. 거의 항상 후속 업무 흐름의 한 단계이며, 그 업무 흐름이 좋은 추출이 실제로 제공해야 할 것을 결정한다. 세 가지 업무 흐름이 수요를 정의할 만큼 자주 반복된다.
소득 확인. 주택담보대출 기관, 임대 부동산 관리자, 자동차 대출 담당자는 모두 신청자가 주장하는 만큼의 소득을 벌고 있는지 확인해야 한다. 단일 신청서에는 여러 고용주의 급여 명세서가 포함될 수 있으며, 최근에 이직한 경우 이전 직장의 명세서도 포함될 수 있다. 대출 기관은 모든 출처에 걸친 순급여, 총급여, 급여 지급 주기, 연간 누계 총액을 단일 비교 화면에서 신속하게 확인해야 하며, 이는 인수 심사 파이프라인을 지연시키지 않을 만큼 빨라야 한다. 인수 심사자가 주당 30~40건의 신청서를 처리할 때, 급여명세서 한 장당 수동 입력에 2분만 소요되어도 주당 몇 시간의 병목 현상이 발생한다.
세금 교차 검증. 연말 W-2 양식을 분기별 급여 명세서 기록과 조정하는 급여 감사관은 Box 1 임금, Box 2 연방 소득세 원천징수액, Box 3 사회보장 임금, Box 5 메디케어 임금이 모두 이를 구성한 개별 급여 기간 데이터와 일치하는지 확인해야 한다. W-2는 12~26개의 개별 급여 명세서를 요약한 것이다. 감사관이 불일치를 발견했을 때, 이를 추적하려면 영향을 받는 모든 직원의 모든 급여 명세서를 열어봐야 하며, 수동으로 수행할 경우 중견 기업의 경우 감사관의 일주일 전체를 소모할 수 있다. 급여명세서 추출은 이를 법의학적 문서 사냥에서 스프레드시트 조정으로 전환시킨다. 모든 급여 명세서를 행으로 추출하고, 열을 합산하며, W-2와 비교하고, 불일치를 몇 초 만에 표시한다.
다중 직원 급여 감사. 직원 급여와 함께 계약자 청구서를 관리하는 인사팀, 또는 50개의 소기업 고객을 처리하는 아웃소싱 급여 제공업체는 급여 기간, 직원, 급여 시스템 전반에 걸쳐 보상 데이터를 통합해야 한다. 한 직원이 현재 직장에서는 ADP, 부업에서는 Gusto, 이전 고용주에서는 Paychex의 급여 명세서를 가지고 있을 수 있다. 총 보상을 감사하거나 고용 이력을 확인해야 한다면, 이 세 개의 PDF는 세 가지 다른 데이터 입력 작업이다. 추출은 이들을 하나의 열 집합을 가진 하나의 테이블로 축소한다. 이 기술이 무엇이며 급여 소프트웨어와 어떻게 다른지 더 자세히 알아보려면 급여명세서 데이터 추출이 실제로 무엇인지에 대한 가이드를 참조하라.
급여명세서 추출의 독특한 과제
급여명세서는 송장이나 영수증과 마찬가지로 형식 다양성, 일관되지 않은 라벨링, 스캔 품질 변동 등의 문제를 공유하지만, 다른 문서 유형에서는 거의 발생하지 않는 세 가지 고유한 문제가 있습니다.
급여 제공업체 간 극심한 형식 다양성
한 공급업체의 송장이 다른 공급업체의 송장과 다르게 보일 수 있습니다. 이것은 하나의 과제입니다. 하지만 수천 개의 공급업체가 송장을 발행하기 때문에 개별 형식이 전체 문서 풀에서 차지하는 비중은 미미합니다. 급여명세서는 그 반대입니다. 미국에서 발행되는 대부분의 급여명세서는 6대 주요 급여 제공업체가 생성하며, 각 업체는 데이터를 다르게 배치합니다. ADP는 분류된 공제 상자가 있는 다단 레이아웃을 사용합니다. Gusto는 색상이 있는 섹션 헤더가 있는 깔끔한 단일 열 디자인을 사용합니다. Paychex는 수입, 세금, 공제를 별도의 가로 밴드로 나눕니다. QuickBooks Payroll은 YTD 합계를 사이드바에 배치합니다. Workday와 Dayforce는 각각 고유한 독점 레이아웃 규칙을 가지고 있습니다. 그 결과는 무작위 형식의 긴 꼬리가 아니라, 각각 내부적으로는 일관되지만 서로 호환되지 않는 6개의 뚜렷한 레이아웃 계열 집합입니다.
ADP 급여명세서에 적용되는 템플릿 기반 추출 방식은 Gusto 급여명세서에서는 작동하지 않습니다. QuickBooks Payroll에서 작동하는 방식은 Paychex에서는 실패합니다. 급여명세서 추출은 제공업체별 설정 없이 모든 형식에서 작동해야 합니다. 추출을 수행하는 사람이 직원 회사가 어떤 제공업체를 사용하는지 통제하는 경우가 거의 없기 때문입니다.
연간 누계(YTD) 누적 필드
대부분의 문서 유형은 문서별 값을 추출합니다. 이 송장의 총액, 이 영수증의 날짜, 이 발주서의 공급업체 등입니다. 급여명세서는 두 번째 계층을 추가합니다. 즉, 문서별 값이 아닌 연간 누계 누적 수치입니다. 6월 15일 마감 급여 기간의 급여명세서에는 이번 기간 총급여 $3,200와 YTD 총급여 $38,400가 표시될 수 있습니다. $38,400는 1월 1일부터 6월 15일까지 모든 급여 기간의 총급여 합계입니다. 두 숫자는 동일한 문서에 나타나며, 일반적으로 서로 가까이 위치하며, 별도로 추출해야 합니다.
YTD 추출을 정확히 하는 것은 세 가지 이유로 중요합니다. 첫째, 소득 확인 워크플로는 YTD 수치를 사용하여 기간별 급여가 연간 총액과 일치하는지 확인합니다. "이번 기간 총급여 × 지금까지의 급여 기간 수"와 "YTD 총급여" 간의 불일치는 대출 기관이 특별히 확인하는 사기 지표입니다. 둘째, W-2 양식에 대한 세금 조정에는 YTD 데이터가 필요합니다. W-2는 기간별 세부 정보가 아닌 연간 총액을 보고하기 때문입니다. 셋째, 동일한 직원의 여러 급여명세서를 1년 동안 처리할 때 12월 급여명세서의 YTD 필드는 내장된 검증 체크포인트 역할을 합니다. 모든 기간별 총급여 값의 합계는 12월 YTD 총급여 수치와 같아야 합니다. 그렇지 않은 경우 추출 오류가 발생했거나 배치에서 급여명세서가 누락된 것입니다.
공제 vs 고용주 부담금 — 반대 방향의 항목
급여명세서 특유의 까다로운 문제로, 일반 추출 도구가 가장 많이 실수하는 부분입니다. 모든 급여명세서에는 임금 외 금액이 두 가지 범주로 나뉘며, 이들은 서로 반대 방향으로 작용합니다:
- 공제는 직원의 총급여에서 차감되어 실수령액을 산출하는 금액입니다. 연방 소득세, 주세, 사회보장세(6.2%), 메디케어(1.45%), 401(k) 직원 부담금, 건강보험료 분담금 등이 이에 해당하며, 직원의 실수령액을 줄입니다. 이는 직원이 벌었지만 세무 당국이나 복리후생 제공자에게 지급되므로 받지 못하는 돈입니다.
- 고용주 부담금은 고용주가 직원의 총급여 위에 추가로 지급하는 금액입니다. 고용주의 401(k) 매칭 기여금, 고용주 부담 건강보험료, 고용주 부담 사회보장세(6.2%) 및 메디케어(1.45%) 등이 이에 해당하며, 직원의 급여 라인을 거치지 않고 고용주가 부담하는 비용입니다. 투명성을 위해 급여명세서에 표시되지만 실수령액 계산에는 포함되지 않습니다.
급여명세서에서 "401(k)"를 읽은 일반 추출 도구는 이것이 직원 공제인지 고용주 매칭인지 결정해야 합니다. 둘 다 "401(k)" 또는 "퇴직금"으로 표시되면서 금액이 다를 수 있습니다. 사람이 급여명세서를 읽으면 어떤 금액이 총급여에서 차감되고 어떤 금액이 고용주 부담금으로 별도 기재되는지 이해합니다. AI 추출 시스템도 동일한 맥락 이해가 필요합니다. 즉, 라벨뿐만 아니라 문서 구조 내 필드 위치를 읽어 각 값을 올바른 열에 할당해야 합니다.
다중 급여 기간 통합
소득 확인의 기준은 급여명세서 한 장이 아닙니다. 2~3개월 연속 급여명세서, 때로는 그 이상입니다. 주택 담보 대출 심사자가 신청자를 검토할 때는 한 장의 급여명세서가 좋아 보이는 것만이 아니라 급여 기간 전체에 걸쳐 소득이 안정적인지 확인해야 합니다. 즉, 신청자당 4~6장의 급여명세서(격주 급여 기준)를 추출하고, 각각의 기간별 및 연간 누계 값을 단일 비교표로 통합해야 합니다.
수동 통합은 각 급여명세서 PDF를 열고, 필요한 6~7개 필드를 찾아 스프레드시트 행에 입력하고, 이를 반복하는 것을 의미합니다. 신청자 30명에 각각 5장의 급여명세서라면 총 150개 문서, 즉 900~1,050개의 개별 데이터 포인트를 필사해야 합니다. 셀 중 하나라도 숫자를 잘못 입력하면 연간 누계 교차 검증이 깨지거나 총급여에서 공제를 뺀 계산과 일치하지 않는 실수령액이 발생합니다. 일괄 추출은 특정 신청자의 모든 급여명세서 또는 모든 신청자의 모든 급여명세서를 한 번에 처리하여, 각 행이 하나의 급여명세서이고 직원 이름이나 신청자 ID로 필터링할 수 있는 단일 스프레드시트를 생성함으로써 이 문제를 해결합니다.
수동 방식 vs AI 기반 추출
급여명세서 데이터를 스프레드시트로 옮기는 방법은 세 가지가 있으며, 완전 수동에서 완전 자동까지 스펙트럼을 이루며 각 단계마다 신뢰도가 크게 다릅니다.
| 방식 | 작동 원리 | 속도 (1건당) | 서식 다양성 대응 | 연누계 필드 처리 |
|---|---|---|---|---|
| 수동 입력 | PDF 열고 각 필드 읽어 셀에 하나씩 입력 | ~3분 | 가능 (사람이 적응) | 가능 (사람이 이해) |
| 템플릿 / 영역 OCR | 공급사별 레이아웃에 좌표 영역 지정; 각 영역 텍스트를 OCR로 읽음 | ~10-15초 | 불가 — 새 레이아웃에서 작동 안 함 | 불가 — 텍스트만 추출, 기간 vs 연누계 구분 못 함 |
| AI 의미 기반 추출 | 시각 AI가 위치가 아닌 의미를 이해하며 문서를 읽음 | ~5-10초 | 가능 — 레이아웃 무관 | 가능 — 필드 문맥으로 구분 |
템플릿 기반 OCR은 레거시 문서 처리 도구에서 사용하는 방식으로, 문서 이미지에 사각형 영역을 그리고 각 영역에서 OCR을 실행합니다. ADP 급여명세서 템플릿에 "순급여" 영역을 좌표 (420, 680, 520, 700)로 정의하면 시스템은 그 사각형 안의 텍스트를 읽습니다. 그런데 Gusto에서 온 급여명세서는 순급여 위치가 완전히 다르므로, 해당 영역은 빈 공간이나 전혀 다른 필드를 읽게 됩니다. 6대 주요 급여 공급사가 각각 다른 레이아웃을 사용하므로 템플릿 시스템은 최소 6개 템플릿이 필요하고, 새 형식이 나올 때마다 일곱 번째를 만들어야 합니다. 이는 자동화가 아니라 디지털화된 수동 설정입니다.
AI 의미 기반 추출은 다르게 작동합니다. 데이터가 페이지의 어디에 있는지 정의하는 대신, "직원 이름", "총급여", "순급여", "연누계 연방세" 등 필요한 열 이름을 입력하여 무엇을 원하는지 정의합니다. AI가 문서 전체를 읽고, 급여명세서 구조 내 문맥에 따라 각 레이블 값의 의미를 이해한 후, 값이 어디에 있든 해당 열에 자동으로 채웁니다. 이것이 위치 기반 추출에서 의미 기반 추출로의 근본적인 전환이며, 여러 급여 공급사에 걸쳐 공급사별 설정 없이 급여명세서 처리를 가능하게 합니다.
효율성 차이는 측정 가능합니다. 미국 급여 협회 연구에 따르면 수동 프로세스에 의존하는 기업의 수동 급여 오류율은 총 급여의 1~8%입니다. 급여명세서 1건당 수동 입력 3분 대 AI 추출 5~10초로, 200건 처리 시 10시간에서 약 20~30분으로 단축되어 18배 개선됩니다.
파일은 안전하게 처리되며 저장되지 않습니다.
추출할 주요 급여명세서 항목
추출 항목은 업무 흐름에 따라 달라집니다. 소득 확인 업무에는 6개 항목이면 충분할 수 있고, 급여 감사에는 20개가 필요할 수 있습니다. 아래는 가장 일반적인 후속 작업을 포괄하는 항목 그룹으로, 각 항목의 의미와 프로세스에서의 활용 위치를 기준으로 구성했습니다.
직원 및 고용주
- 직원 이름 및 ID
- 고용주 이름
- 급여 기간 시작일 및 종료일
- 급여 지급일
- 급여 지급 주기 (주급/격주급/월 2회/월급)
수입
- 총 급여 (해당 기간)
- 기본 급여 / 정규 시간 및 시급
- 초과 근무 시간 및 수당
- 상여금 / 수수료
- 수당 (교통비, 주거비, 식비)
공제 (직원 급여에서)
- 연방 소득세
- 주 및 지방세
- 사회보장세 (6.2%)
- 메디케어 (1.45%)
- 401(k) / 퇴직 연금
- 건강/치과/안과 보험료
- 압류 / 기타
연누계 및 고용주 부담금
- 연누계 총 급여
- 연누계 연방/주/지방세
- 연누계 사회보장세 및 메디케어
- 연누계 401(k) / 퇴직 연금
- 순 급여 (해당 기간)
- 연누계 순 급여
- 고용주 401(k) 매칭 / 건강 보험 부담금
추출할 열을 정의할 때 두 가지를 염두에 두세요. 첫째, 기간 값과 YTD 값을 별도의 열로 분리하세요. "총 급여"와 "YTD 총 급여"는 하나가 아닌 두 개의 열이어야 합니다. 이는 각각 다른 다운스트림 목적(기간 분석 대 연말 정산)을 제공하기 때문입니다. 둘째, 직원 공제액과 고용주 기여금을 분리하세요. 두 금액을 혼동하는 단일 "401(k)" 열 대신 "401(k) 직원"과 "401(k) 고용주"를 별도의 열로 만드세요. AI는 각각 따로 요청하면 구분할 수 있습니다. 단일 "401(k)" 열을 요청하면 문서에서 먼저 발견하는 금액에 따라 둘 중 하나를 반환할 수 있습니다.
급여명세서 일괄 처리 작동 방식
일괄 처리는 급여명세서 추출을 대규모로 실용적으로 만드는 요소입니다. 한 번에 하나의 급여명세서를 추출하는 대신, 특정 배치(이번 주 모든 지원자, 이번 분기 모든 직원, 이번 과세 연도 모든 계약자)의 모든 급여명세서를 업로드하면 시스템이 함께 처리하여 급여명세서당 한 행씩 있는 단일 스프레드시트를 생성합니다.
워크플로는 일관된 패턴을 따릅니다. 문서(PDF, JPG, PNG 또는 모든 급여 제공업체의 스크린샷)를 업로드하고, 추출하려는 열 이름을 정의한 다음, AI가 각 문서를 읽고 일치하는 행을 채우도록 합니다. 출력은 각 행이 하나의 급여명세서를 나타내고, 각 열이 하나의 추출된 필드를 나타내는 하나의 Excel 파일이며, 데이터를 즉시 필터링, 정렬 및 피벗할 수 있습니다. 수동 기록, 문서 간 복사-붙여넣기, 급여 기간마다 스프레드시트 수식 재구축이 필요 없습니다.
급여명세서 일괄 처리는 세 가지 시나리오에서 가장 중요합니다. 모기지 또는 임대 신청을 대량으로 처리할 때, 모든 지원자 급여명세서를 한 번에 업로드하고 지원자 ID 열이 있는 하나의 스프레드시트를 받으세요. 지원자별로 필터링하여 YTD 진행 상황이 표시된 모든 급여명세서를 연속된 행으로 확인할 수 있습니다. 분기별 또는 연말 급여 정산을 처리할 때, 전체 분기 급여명세서를 업로드하고 YTD 열이 내장된 검증을 제공하도록 하세요. 모든 기간 총 급여 값의 합계는 최종 YTD 총 급여 수치와 일치해야 합니다. 다중 직원 HR 감사를 처리할 때, 직원 및 급여 기간별로 급여명세서를 업로드하여 단일 PDF도 열지 않고 통합 보상 보기를 구축하세요.
여러 사람(지원자, 직원, 계약자)으로부터 급여명세서를 수집해야 하는 팀의 경우, 수집 링크가 접수 측면을 간소화합니다. 공유 가능한 링크를 생성하여 급여명세서를 제출해야 하는 각 사람에게 보내면, 해당 링크를 통해 직접 문서를 업로드합니다. 파일은 자동으로 처리 대기열에 들어갑니다. 이메일 첨부 파일을 쫓거나, 받은 편지함에서 추출 도구로 PDF를 전달하거나, 지원자에게 자격 증명이 없는 시스템에 로그인하도록 요청할 필요가 없습니다. 업로드하는 사람은 링크와 확인 코드만 있으면 됩니다.
추출된 데이터 내보내기 및 활용
추출 결과의 가치는 지원하는 형식과 데이터의 정확성에 달려 있습니다. 세 가지 내보내기 형식이 가장 일반적인 활용처를 지원합니다.
- Excel (XLSX) — 대부분의 급여 및 인사 워크플로에 적합합니다. 추출된 데이터는 적절한 열 제목, 표준화된 날짜 형식, 숫자(텍스트 아님)로 서식 지정된 숫자 필드가 포함된 스프레드시트로 제공됩니다. 즉, 직원별 필터링, 월별 총 급여 합계, 보상 분석을 위한 피벗 테이블 작성 등을 바로 시작할 수 있습니다. 문자열로 저장된 날짜 필드나 텍스트로 저장된 통화 값을 사후 정리할 필요가 없습니다.
- CSV — 추출된 데이터를 급여 소프트웨어, 회계 시스템 또는 맞춤형 데이터베이스로 가져올 때 유용합니다. 대부분의 급여 플랫폼과 ERP 시스템은 대량 데이터 입력을 위해 CSV 가져오기를 지원하며, 깔끔한 CSV 추출 덕분에 가져오기 전에 스프레드시트를 수동으로 서식 지정하는 중간 단계를 생략할 수 있습니다.
- JSON — 맞춤형 애플리케이션, API 또는 자동화된 검증 파이프라인과의 통합에 사용됩니다. 추출된 급여 명세서 데이터를 신청서 양식과 프로그래밍 방식으로 비교 확인하는 소득 검증 워크플로를 구축하는 경우 JSON 출력을 해당 로직에 직접 연결할 수 있습니다.
Google Sheets 사용자를 위해 Google Sheets 사이드바 애드온을 통해 활성 스프레드시트로 직접 추출할 수 있습니다. Sheets 내에서 급여 명세서 파일을 업로드하고, 열을 정의한 후, 앱을 전환하지 않고 추출된 행을 시트에 추가할 수 있습니다. 이는 급여 조정이나 소득 검증 추적을 위해 Google Sheets를 주로 사용하며 내보내기-재가져오기 과정을 피하려는 팀에게 유용합니다.
급여 명세서 추출 방식 선택
모든 추출 도구가 급여 명세서를 잘 처리하는 것은 아니며, 급여 명세서에 중요한 기능은 인보이스에 중요한 기능과 다릅니다. 평가해야 할 기준은 다음과 같습니다.
템플릿 불필요. 이는 급여 명세서 추출에서 가장 중요한 기준입니다. 도구가 급여 제공업체별로 템플릿을 작성해야 한다면(영역 정의, 샘플 학습, 레이아웃 규칙 구성) 설정에 시간을 더 많이 쓰게 됩니다. 제공업체마다 급여 명세서 레이아웃이 근본적으로 다르기 때문입니다. 템플릿이 필요 없는 도구는 제공업체별 구성 없이 모든 급여 명세서 형식을 읽습니다. "순 급여"가 ADP 급여 명세서의 오른쪽 하단에 있든 Gusto 급여 명세서의 중간에 있든 동일한 의미임을 이해합니다.
맞춤형 열 정의. 추출하려는 필드를 이름으로 정확히 정의할 수 있어야 합니다. 고정된 필드 집합(예: 항상 "총 급여"와 "순 급여"만 추출)을 추출하는 도구는 사용자의 요구사항을 제한합니다. 소득 검증 워크플로에는 "연도 누계 총 급여", "급여 지급 주기", "고용주 이름"이 필요할 수 있습니다. 급여 감사에는 "초과 근무 시간", "401(k) 직원 공제액", "압류"가 필요할 수 있습니다. 도구는 미리 구성된 내용이 아닌 사용자가 요청한 내용을 추출해야 합니다.
일괄 처리. 단일 문서 추출은 일회성 확인에 유용합니다. 일괄 추출(50장 또는 200장의 급여 명세서를 업로드하여 하나의 병합된 출력물을 얻는 것)이 실제 워크플로에서 도구를 사용 가능하게 만듭니다. 모기지 신청이나 분기별 급여 조정을 처리하는 경우 일괄 처리는 선택 사항이 아닙니다. 이는 도구를 계속 사용할지 첫 주 후에 포기할지를 결정짓는 요소입니다.
YTD 항목 정확도. 도구를 확정하기 전에 반드시 테스트하세요. 기간 총급여가 $3,200이고 YTD 총급여가 $38,400인 급여명세서를 업로드하여, 도구가 두 값을 올바른 열에 추출하는지 확인하십시오. YTD 값을 기간 총급여 열에 넣거나 그 반대의 경우, 도구가 기간 필드와 누적 필드의 의미적 차이를 이해하지 못하는 것이므로, 조정 결과를 신뢰할 수 없습니다.
공제와 기여금 구분. "401(k) 직원 공제"(급여에서 공제)와 "401(k) 고용주 매칭"(별도의 고용주 기여금)이 모두 표시된 급여명세서를 업로드하세요. 도구가 두 항목을 혼동하지 않고 별도의 열로 추출하는지 확인하십시오. 그렇지 않으면 보상 분석에서 직원과 고용주의 자금이 같은 항목에 섞이게 되어, 총 보상 비용을 계산하는 모든 워크플로에 중대한 오류가 발생합니다.
자주 묻는 질문
급여명세서 추출 기능이 모든 급여 제공업체의 급여명세서를 처리할 수 있나요?
네, 템플릿 기반 OCR이 아닌 의미론적 AI 추출을 사용하는 도구라면 가능합니다. 의미론적 추출은 미리 정의된 레이아웃을 매칭하는 것이 아니라 필드의 의미를 이해하여 읽기 때문에 ADP, Gusto, Paychex, QuickBooks Payroll, Workday, Dayforce 및 소규모 지역 제공업체에서도 작동합니다. 도구가 특정 제공업체의 형식을 미리 '본' 적이 없어도 됩니다. 문서를 읽고 급여명세서 구조에서 각 필드의 역할에 따라 위치를 찾습니다.
YTD 필드 추출의 정확도는 어느 정도인가요?
YTD 추출 정확도는 AI가 문맥을 통해 기간별 필드와 누적 필드를 구분하는 능력에 달려 있습니다. 주요 제공업체의 명확한 디지털 급여명세서의 경우 YTD 추출은 일반적으로 95-99%의 정확도를 보입니다. YTD와 기간 필드가 유사한 레이블로 가깝게 표시된 스캔 또는 사진 촬영된 급여명세서의 경우, 특히 스캔 해상도가 낮거나 문서가 기울어져 있으면 정확도가 떨어질 수 있습니다. 모기지 인수와 같은 중요한 워크플로우의 경우, 추출된 데이터에 의존하기 전에 YTD 값을 기간별 계산(기간 총액 × 현재까지의 급여 기간 수 ≈ YTD 총액)과 대조하여 내장된 검증 단계로 확인하는 것이 좋습니다.
이 도구는 급여명세서의 필기 메모를 처리할 수 있나요?
AI 추출은 인쇄된 텍스트, 필기체 및 혼합 콘텐츠 문서를 읽을 수 있습니다. 급여명세서에 필기로 수정하거나 메모(관리자 이니셜, 필기로 작성된 조정 금액)가 있는 경우 AI가 이를 추출하려고 시도합니다. 그러나 필기체 정확도는 인쇄된 텍스트 정확도보다 낮으며, 특히 필기체나 작은 메모의 경우 더욱 그렇습니다. 급여명세서 워크플로우에서 필기 수정이 일반적인 경우 해당 필드를 수동으로 검토하거나 필기가 포함된 것으로 플래그가 지정된 문서에 대한 확인 단계를 설정하세요.
일괄 추출 시 여러 급여 기간의 데이터가 하나의 스프레드시트로 병합되나요?
네. 여러 급여 기간에 걸친 급여명세서(한 직원의 1년치 또는 여러 직원의 다른 기간)를 업로드하면 도구가 모든 문서를 함께 처리하여 하나의 스프레드시트를 출력합니다. 각 행은 고유한 급여 기간 날짜가 있는 하나의 급여명세서이므로 수동으로 통합할 필요 없이 직원, 날짜 범위 또는 급여 빈도별로 필터링, 정렬 및 그룹화할 수 있습니다.
이 도구로 급여명세서의 진위 여부를 확인하거나 위조를 탐지할 수 있나요?
AI 추출 도구는 위조 탐지 시스템이 아닙니다. 그러나 일관된 추출을 통해 자체 점검을 수행할 수 있습니다: 연간 누계 금액과 기간별 계산 비교, 순 급여가 총 급여에서 공제액을 뺀 금액과 일치하는지 확인, 급여 지급 주기가 기간 날짜와 일치하는지 확인 등이 가능합니다. 이러한 수학적 검사에서 불일치가 발견되면 추출 오류나 문서 조작 가능성을 시사하므로 조사가 필요합니다. 일부 전문 급여명세서 검증 도구는 전용 위조 탐지 기능을 제공하지만, 일반 목적 추출 도구는 데이터를 읽을 뿐 문서를 인증하지는 않습니다.
급여명세서 추출 시 지원되는 파일 형식은 무엇인가요?
대부분의 AI 추출 도구는 PDF(디지털 및 스캔), JPG, PNG, WebP, 스크린샷을 지원합니다. 핵심 차이는 텍스트가 선택 가능한 형태로 내장된 디지털 PDF와 문서가 종이 사진인 스캔/이미지 PDF 간에 있습니다. AI 추출은 둘 다 처리하지만, 이미지 기반 PDF는 AI가 먼저 OCR을 수행해야 하므로 텍스트가 이미 기계 판독 가능한 디지털 PDF에 비해 정확도가 약간 낮아질 수 있습니다.
다국어 급여명세서 추출은 어떻게 처리되나요?
프랑스어 fiche de paie, 독일어 Gehaltsabrechnung, 일본어 給与明細 등 여러 국가의 급여명세서를 처리하는 경우, AI 의미 추출은 필드 레이블이 아닌 필드 의미를 읽기 때문에 처리할 수 있습니다. "Net Pay", "Net à payer", "Nettoverdienst", "差引支給額"은 모두 동일한 의미이며, 다국어 AI 모델은 이를 동일한 의미 필드로 인식합니다. 다만, 모델의 학습 데이터가 적은 언어나 레이아웃의 경우 추출 정확도가 다소 낮을 수 있습니다. 대량 다국어 처리를 위해서는 프로덕션 워크플로에 적용하기 전에 샘플 배치로 테스트하는 것이 좋습니다.
추출한 데이터를 급여 또는 회계 시스템에 직접 입력할 수 있나요?
추출 도구는 급여 소프트웨어에 직접 통합되지 않고 Excel, CSV 또는 JSON 형식으로 데이터를 출력합니다. 대부분의 급여 시스템(ADP, Gusto, Paychex, QuickBooks)과 회계 플랫폼은 CSV 가져오기를 지원하므로, 일반적인 워크플로는 급여명세서 데이터를 CSV로 추출한 후 대상 시스템으로 CSV를 가져오는 것입니다. 이는 기본 통합에 비해 한 단계가 더 필요하지만, 수동 입력보다는 훨씬 빠릅니다. 일부 도구는 직접 데이터 파이프라인이 필요한 경우 맞춤형 통합을 위한 API 액세스를 제공합니다.
다른 사람의 급여명세서를 수집할 때 수집 링크는 어떻게 작동하나요?
수집 링크는 계정에서 생성하는 공유 가능한 URL입니다. 주택담보대출 신청자, 직원, 계약자 등 급여명세서를 제출해야 하는 사람에게 이 링크를 보내면 됩니다. 링크를 연 사람은 사용자가 설정한 인증 코드를 입력한 후 간단한 웹 페이지를 통해 직접 문서를 업로드합니다. 파일은 사용자의 처리 대기열에 표시됩니다. 업로더는 계정을 만들거나 로그인할 필요가 없습니다. 이 기능은 주택담보대출 중개인이 신청자로부터 급여명세서를 수집하거나, 인사팀이 신규 직원의 이전 직장 급여명세서를 모으거나, 회계사가 고객의 분기별 문서를 수집할 때 특히 유용합니다.