학생 등록 양식 데이터를 엑셀로 추출하는 방법

매년 8월이면 종이가 쏟아집니다. 5,000명 규모의 중간급 K-12 학군은 매년 약 20%의 학생에 해당하는 등록 서류를 받습니다. 직접 방문 등록한 가정, 여름 등록 행사에서 서류를 제출한 가정, 온라인 포털을 지원하지 않는 언어를 사용하는 가정이 그 대상입니다. 각 서류는 15~25페이지에 달합니다. 학생 인적사항, 학부모 연락처, 비상 연락처, 건강 상태, 예방접종 기록, 통학 버스 신청, 사진 촬영 동의, 기술 기기 사용 동의서, 생활 안내서 확인서 등이 포함됩니다. 여기에 1,000명의 학생을 곱하면 사무실의 계산은 단순해집니다. 수천 페이지의 서류, 각 필드를 사람이 읽고, 필적을 해독하고, 체크박스를 확인한 뒤 PowerSchool, Infinite Campus, Skyward에 일일이 입력해야 합니다.

병목 현상은 데이터가 존재하지 않기 때문이 아닙니다. 데이터가 다양한 형식의 수십 가지 필드로 종이 위에 존재하기 때문이며, SIS는 이를 구조화된 행으로 필요로 합니다. 이 가이드는 그 격차를 해소하는 실용적인 워크플로를 다룹니다. 양식을 스캔하고, 출력 열을 한 번 정의한 후, 시맨틱 AI가 모든 필드 유형을 추출하여 SIS 가져오기에 바로 사용할 수 있는 스프레드시트로 만들어 드립니다.

종이 등록 양식은 사라지지 않습니다 — 그 이유는 다음과 같습니다

온라인 등록 포털이 존재합니다. PowerSchool Enrollment는 3,500개 이상의 학군에 배포되어 모바일 친화적인 양식, 조건부 로직, 형제자매 사전 입력, SIS 직접 동기화를 제공합니다. Infinite Campus Online Registration은 "데이터 입력 없음 — 승인을 위해 클릭만 하세요"를 약속합니다. 업체의 주장은 일관됩니다: 종이를 없애면 데이터 입력 문제도 사라진다는 것입니다.

이 주장은 실제 등록 현장이 어떻게 작동하는지 간과합니다. 모든 학군에서 상당수의 가족이 종이 양식을 작성하며, 그 이유는 일시적이지 않고 구조적입니다.

언어 장벽. PowerSchool Enrollment는 여러 언어를 지원하지만, 포털 탐색부터 양식 작성, 문서 업로드에 이르는 전체 등록 워크플로우는 모든 가족이 갖추고 있지 않은 디지털 리터러시와 영어 능숙도를 전제로 합니다. 가정에서 영어 외 언어를 사용하는 가족이 15% 이상인 학군에서는 이중 언어를 구사하는 교무실 직원의 도움을 받아 작성하는 종이 양식이 여전히 가장 접근하기 쉬운 방법입니다.

대면 등록 행사. 체육관에 테이블과 빈 서류 더미를 놓고 가족들이 서서 양식을 작성하는 "등록의 날"은 매년 8월 수백 개 학군에서 여전히 진행됩니다. 기기가 없거나, 인터넷 연결이 없거나, 여름에 학군으로 이사 와서 온라인 포털이 아직 따라잡지 못한 가족에게 종이는 보편적인 대체 수단입니다.

디지털 접근 격차. 국립교육통계센터에 따르면, 2023년 가을 미국 공립 K-12 학교에 약 4,950만 명의 학생이 등록되었습니다. 학령기 자녀가 있는 가구 중 약 5~8%는 안정적인 가정용 광대역 인터넷에 접속할 수 없습니다. 등록 마감일을 맞추는 유일한 방법이 학군 사무실에서 종이 서류를 작성하는 것이라면, 가족들은 그렇게 합니다.

재학생 업데이트. 온라인 포털은 신입생 등록을 잘 처리합니다. 하지만 모든 재학생 가족이 매년 완료해야 하는 업데이트 양식(업데이트된 비상 연락처, 새로운 의료 정보, 사진 및 미디어 공개 재동의)은 덜 원활하게 처리합니다. 많은 학군이 이를 종이 서류로 우편 발송하는데, 그 이유는 SIS 포털의 재학생 워크플로우가 불편하거나, 많은 가족이 만들지 않은 학부모 계정이 필요하거나, 소규모 학군에서 여전히 사용 중인 구형 SIS 버전에는 아예 존재하지 않기 때문입니다.

결과: 온라인 등록에 투자한 학군조차도 매년 8월에 종이 양식을 처리합니다. 문제는 "종이를 어떻게 없앨까"가 아니라 "종이가 도착했을 때 데이터를 어떻게 효율적으로 추출할까"입니다.

K-12 입학 서류 안에는 무엇이 들어 있을까 — 각 항목이 서로 다른 추출 과제인 이유

학생 입학 서류 한 벌은 단순한 데이터 추출 문제가 아닙니다. 각기 다른 필드 형식을 가진 열두 가지 추출 문제가 한 페이지에 섞여 있으며, 이 서류들은 붐비는 체육관에서 손으로 작성하도록 설계되었습니다. 필드 유형을 이해하고 각각이 기존 OCR을 무너뜨리는 이유를 아는 것이, 제대로 작동하는 추출 워크플로를 구축하기 위한 전제 조건입니다.

항목	일반 필드	필드 형식	OCR 난이도
학생 인적사항	성명, 생년월일, 성별, 입학 학년, 주소	인쇄 또는 필기 텍스트 상자	보통 — 생년월일과 주소 필기 입력이 자주 실패 지점
보호자 1 및 2	성명, 관계, 전화번호, 이메일, 직장명, 직장 전화번호	인쇄/필기 텍스트, 여러 줄 블록	보통 — 한 양식에 여러 연락처가 있어 필드 연결 필요
비상 연락처	성명, 관계, 기본 전화번호, 대체 전화번호 (2-3명)	필기 텍스트, 종종 약어 사용	높음 — 약칭 관계 표기와 필기 전화번호가 문자 단위 OCR 혼란
의료 정보	알레르기, 복용 약물, 만성 질환, 담당 의사 성명/전화번호, 선호 병원	서술형 필기 블록	높음 — 일관된 용어 없는 자유 텍스트 의료 상태
예방접종 기록	백신 종류, 접종일, 제공 기관 (별도 주 양식 스캔본인 경우多)	주 발급 양식의 구조화된 표	높음 — 작은 표 텍스트, 복사본을 다시 스캔한 경우 있음
교통편	버스/자가용/도보 선택, 버스 노선 번호, 오전/오후 일정	체크박스 + 인쇄된 노선 번호	보통 — 체크박스 감지 + 여러 열 간 필드 연결
급식 프로그램	무료/할인 자격 신청, 가구 소득, 사례 번호	체크박스 + 필기 소득 필드	높음 — 작은 필드에 기재된 민감 재정 데이터
기기 사용 동의서	학생명, 보호자명, 날짜, 보호자 서명	인쇄 텍스트 + 필기 서명란	낮음 — 주로 체크박스와 서명, 추출할 구조화 데이터 최소
사진/미디어 사용 동의서	동의/거부 체크박스, 학생명, 보호자 서명, 날짜	체크박스 + 서명	낮음 — 이진 동의, 추출 부담 적음
생활수첩 확인서	학생명, 학년, 보호자명, 서명, 날짜	인쇄 + 서명	낮음 — 확인만, 구조화 데이터 없음
가정 내 언어 조사	가정 내 주요 사용 언어, 추가 언어, 보호자 선호 언어	필기 입력 + 체크박스 선택	보통 — 언어명은 짧은 필드지만 종종 필기

입학 서류가 기존 OCR에 특히 까다로운 이유는 한 페이지에 다양한 필드 유형이 섞여 있기 때문입니다. 한 장에 인쇄된 텍스트(양식 자체 레이블), 블록체 필기 답변, 필기체 답변, 체크된 박스, 동그라미 친 옵션, 서명이 몇 인치 안에 함께 있습니다. 기존 OCR은 문자를 읽습니다. "비상 연락처 전화번호"란에 적힌 전화번호가 보호자의 것이 아니라 비상 연락처의 것임을 이해하지 못하며, 이 차이는 데이터가 각각 별도 데이터베이스 필드를 가진 SIS에 입력될 때 중요합니다.

의미 기반 AI 추출은 각 필드가 말하는 내용뿐 아니라 의미하는 바를 이해함으로써 이 격차를 해소합니다. "비상연락처 1 — 전화번호"라는 열을 정의하면, AI는 양식의 비상연락처 섹션에서 전화번호를 찾아 첫 번째 연락처와 연결하며, 두 섹션 위에 있는 학부모 직장 전화번호와 혼동하지 않습니다. 이것이 문자 인식과 문서 이해의 근본적인 차이이며, 등록 양식이 대부분의 문서 유형보다 의미 기반 접근 방식에서 더 큰 이점을 얻는 이유입니다. FERPA가 학생 데이터가 AI 처리 파이프라인에 진입하는 순간을 어떻게 규율하는지 자세히 알아보려면 입학 문서 추출을 위한 FERPA 준수 가이드를 참조하세요.

종이 묶음에서 SIS 준비 스프레드시트까지: 3단계 워크플로

핵심 워크플로는 교무실 직원이 IT 지원 없이도 실행할 수 있을 정도로 간단합니다. 가장 많은 고민이 필요한 부분은 열 설정입니다. 이를 제대로 설정하면 추출이 자동으로 실행됩니다.

1단계: 입학 패킷 스캔

각 학생의 패킷에 있는 모든 페이지를 학생당 하나의 다중 페이지 PDF로 스캔합니다. 스캐너를 300 DPI 그레이스케일로 설정하세요. 컬러는 대부분의 등록 양식 레이아웃에서 의미 있는 정확도 향상 없이 파일 크기만 증가시키지만, 흑백은 체크박스와 얼룩을 구분하는 미묘한 대비를 잃게 합니다.

파일 명명 규칙이 중요합니다. 각 파일 이름을 [학년]_[성]_[이름].pdf 형식으로 지정하세요. 이 명명 패턴은 두 가지 목적을 제공합니다. 각 파일에 고유 식별자를 제공하고, 모든 PDF를 열지 않고도 추출된 데이터를 출처 문서와 대조하여 점검할 수 있게 합니다.

양식이 학생당 하나의 묶음으로 미리 스테이플되어 도착하는 경우, 각 학생의 세트를 하나의 문서로 스캔합니다. 학군이 양식 유형별로 구성하는 경우(모든 의료 양식은 함께, 모든 교통 양식은 함께), 다른 워크플로가 필요하지만, 패킷이 양식 유형이 아닌 학생별로 구성되는 K-12 등록에서는 이러한 패턴이 드뭅니다.

2단계: 출력할 열 정의하기

이 단계에서 추출 도구의 동작 방식을 설정합니다. 코드나 템플릿이 아니라, 최종 스프레드시트에 포함할 필드를 정확히 나열하기만 하면 됩니다. 입력한 열 이름은 AI에 대한 지침이자 출력 테이블의 헤더가 됩니다.

K-12 입학 신청서의 경우, 실용적인 열 구성은 다음과 같습니다:

K-12 입학 신청서 권장 열 구성

학생 성
학생 이름
학생 생년월일
입학 학년
집 주소
집 도시
집 주
집 우편번호
보호자 1 성명
보호자 1 관계
보호자 1 대표 전화번호
보호자 1 이메일
보호자 2 성명
보호자 2 관계
보호자 2 대표 전화번호
비상연락처 1 이름
비상연락처 1 관계
비상연락처 1 전화번호
비상연락처 2 이름
비상연락처 2 관계
비상연락처 2 전화번호
질환/알레르기
주치의 이름
주치의 전화번호
통학 방법 (버스 / 자가용 / 도보)
버스 노선 번호 (해당 시)
사진/미디어 동의 (예 / 아니오)
정보기기 사용 동의서 서명 (예 / 아니오)
생활수칙 확인서 서명 (예 / 아니오)

입학 신청서 열 설계 시 몇 가지 참고 사항:

성과 이름을 분리하세요. SIS 플랫폼은 학생 이름을 별도 필드에 저장합니다. 처음부터 분리해서 추출하면 엑셀에서 수동으로 나누는 단계를 피할 수 있습니다. 하이픈으로 연결된 성, 이름 필드에 적힌 중간 이름, 또는 서양식 성-이름 순서를 따르지 않는 문화권의 이름 규칙에서도 문제없이 작동합니다.

이진 필드에는 추론 열을 사용하세요. 사진 촬영 동의, 정보기기 사용 동의서, 생활수칙 확인서와 같은 동의 체크박스의 경우, 괄호 안에 옵션을 포함하여 열을 정의하세요: 사진/미디어 동의 (예 / 아니오). AI가 신청서의 체크박스 상태를 읽고 "예" 또는 "아니오"를 출력합니다. 체크박스 좌표를 추출하거나 픽셀 단위로 감지할 필요가 없습니다. AI는 픽셀이 아닌 서식의 의미를 읽습니다.

SIS 필드 이름을 힌트로 포함하세요. 학군에서 PowerSchool을 사용하는 경우, 버스 통학 관련 필드는 드롭다운에서 "통학 방법"인 경우가 많습니다. 열 이름을 통학 방법 (버스 / 자가용 / 도보)로 지정하면 AI에 의미적 대상과 유효 옵션을 모두 제공합니다. 또한 출력 엑셀의 열 헤더가 SIS 가져오기 템플릿의 필드 레이블과 일치하므로 업로드 시 매핑 단계를 하나 줄일 수 있습니다.

모든 문서 유형에서 추출 열을 정의하는 자세한 방법은 학생 성적 증명서 데이터를 엑셀로 추출하는 가이드를 참조하세요. 여기에는 입학 신청서에도 동일하게 적용되는 열 설계 패턴이 설명되어 있습니다.

3단계: 처리 및 SIS로 내보내기

스캔한 PDF를 한 번에 모두 업로드하세요. 도구가 모든 파일을 사용자가 정의한 열 기준에 따라 처리하여 학생 이름, 연락처 정보, 의료 정보, 동의 상태 등을 추출한 후, 각 행이 한 명의 학생인 단일 스프레드시트로 결과를 병합합니다.

SIS 가져오기에 중요한 출력 형식은 Excel(.xlsx)이며, PowerSchool, Infinite Campus, Skyward에서 모두 기본적으로 지원합니다. SIS에서 특정 열 순서의 CSV가 필요하다면 CSV로 내보낸 후 도구 인터페이스에서 열 순서를 다시 정렬한 다음 다운로드하세요.

처음 다섯 행을 원본 PDF와 대조 확인하세요. 특히 비상 연락처 전화번호에 주의하세요. 비상 연락처 필드에서 숫자 하나가 잘못 입력되면 전체 등록 워크플로에서 가장 큰 위험을 초래하는 오류입니다. 도구에서 각 파일을 학생 식별자로 명명할 수 있다면, 출력의 파일 이름 열을 통해 모든 행의 원본 문서를 한 번에 참조할 수 있습니다.

손글씨, 체크박스, 서명: 기존 OCR을 무너뜨리는 세 가지 양식 요소

대부분의 OCR 도구는 깨끗한 흰색 배경의 인쇄된 텍스트를 위해 만들어졌습니다. K-12 등록 양식은 클립보드를 든 학부모가 체육관에 서서 작성합니다. 손글씨는 일관되지 않고, 체크박스는 때로 체크되고, 때로 동그라미 치거나 완전히 채워지며, 모든 페이지에는 추출 가능한 데이터 값이 없지만 도구가 쓰레기를 출력하지 않도록 해야 하는 서명이 하나 이상 있습니다.

손글씨 필드. 등록 양식에서 손글씨 비율이 가장 높은 필드(학부모 전화번호, 비상 연락처 이름, 의료 상태)는 오류의 영향이 가장 큰 필드이기도 합니다. 학부모 전화번호가 잘못 입력되면 학교는 비상 시 가족에게 연락할 수 없습니다. 알레르기 표기를 잘못 읽으면 의학적 영향이 있습니다.

Semantic AI는 문자 수준 OCR과 다르게 손글씨를 처리합니다. 각 글자 모양을 독립적으로 식별하여 단어로 조합하는 방식(모호한 초기 고리로 인해 "Amy" 손글씨에서 "Emily"를 생성하는 접근 방식) 대신, AI는 전체 필드의 시각적 맥락을 읽습니다. "비상 연락처 이름" 섹션의 손글씨 텍스트 블록을 보고 이 블록이 사람 이름을 생성해야 하며, 주변 인쇄된 필드 레이블을 의미적 앵커로 사용하여 불명확한 손글씨를 명확히 합니다.

이러한 맥락적 읽기가 고립된 텍스트 블록에서 70%의 손글씨 정확도와 명확한 의미적 맥락이 있는 양식 필드에서 95%+의 차이를 만듭니다. AI 추출의 정확도 요소에 대한 자세한 내용은 OCR 정확도 향상을 위한 실용 가이드를 참조하세요.

체크박스. 등록 양식에는 5~15개의 체크박스(교통 수단 선택, 급식 프로그램 자격, 사진 동의, 기술 동의, 핸드북 승인)가 있습니다. 기존 OCR은 체크박스를 완전히 무시하거나 스프레드시트에서 의미 없는 "☐" 문자를 생성합니다.

Semantic AI는 레이블이 있는 옵션에 대한 위치를 이해하여 체크박스를 이진 상태로 읽습니다. 양식에 "교통: ☐ 버스 ☐ 승용차 동승 ☐ 도보"라고 표시되고 하나의 상자가 표시되면, AI는 표시된 상자에 해당하는 레이블을 식별하고 체크박스 문자가 아닌 레이블 텍스트("버스")를 출력합니다.

서명. 모든 등록 패킷에는 기술 동의서, 미디어 공개 동의서, 핸드북 승인서에 학부모 서명이 있습니다. 서명은 추출 가능한 데이터가 없습니다. 학부모 이름은 인쇄된 이름 필드에서 추출해야 하며, 필기체 낙서에서 추출해서는 안 됩니다. 그러나 기존 OCR은 서명 줄에서 종종 왜곡된 문자열을 생성합니다.

실용적인 해결책: 서명란 대신 학적 정보 섹션에서 보호자 이름을 추출하도록 열을 정의하세요. 양식 서명 여부를 확인해야 한다면 보호자 서명 있음 (예 / 아니오) 같은 이진 열을 정의하세요. AI는 서명을 읽지 않고도 존재 여부를 감지할 수 있습니다. 이렇게 하면 추출 노이즈 없이 감사 추적을 확보할 수 있습니다.

한 학년 전체 입학 신청서를 한 번에 일괄 처리하기

진정한 효율성 향상은 입학 신청서 하나를 더 빨리 추출하는 것이 아니라, 입학 신청서 100개를 추출하여 하나의 스프레드시트를 얻는 데 있습니다.

전통적인 데이터 입력 워크플로에서는 각 서류를 개별적으로 처리합니다: PowerSchool을 열고, 새 학생 기록을 생성하고, 학적 정보 필드를 입력하고, 보호자 연락처를 입력하고, 비상 연락처를 입력하고, 의료 정보를 입력하고, 동의란을 체크하고, 저장한 후 다음 서류로 넘어갑니다. 각 서류당 20분씩 — 각 줄의 정확성을 확인하고, 손글씨 필드를 교차 참조하고, 불가피한 오타를 수정하면서 — 1,000개의 서류는 333인시(직원 작업 시간)입니다.

일괄 추출은 이 방식을 뒤집습니다. 서류 처리는 한 번만 하면 됩니다 — 모든 서류를 스캔하고 — 추출은 하나의 작업으로 모든 서류에 대해 실행됩니다. 출력은 1,000개의 행이 있는 하나의 스프레드시트이며, 각 행은 완전한 학생 입학 기록입니다. 직원 시간은 데이터 입력에서 데이터 검토로 전환됩니다: 스프레드시트를 열고, 비상 연락처 필드를 점검하고, 의료 플래그를 확인하고, SIS로 가져오기 전에 사람의 검토가 필요한 행에 플래그를 지정합니다.

이 워크플로는 입학처에서 대규모 성적 증명서를 처리하는 방식과 유사합니다. 교육 맥락에서 일괄 처리가 어떻게 작동하는지에 대한 전체적인 그림을 보려면 성적 증명서를 입학 데이터베이스로 일괄 처리하는 가이드를 참조하세요 — 파이프라인 아키텍처는 동일하며, 데이터가 과정 성적 대신 입학 데이터라는 점만 다릅니다.

모든 서류 스캔. 학생당 하나의 여러 페이지 PDF로, 일관된 이름으로 저장합니다. 200명 학년의 경우, 문서 스캐너로 오후 하나면 충분합니다 — 일주일 내내 타이핑할 필요가 없습니다.

열을 한 번 정의. 위의 28개 필드 열 세트는 표준 K-12 입학 서류의 모든 필드 유형을 포함합니다. 추출 도구에 템플릿으로 저장하여 다음 해 등록 시즌에 설정 작업이 전혀 필요 없도록 하세요.

업로드 및 처리. 200개의 PDF를 모두 선택하고 일괄 작업을 시작합니다. 처리 시간은 문서 수에 비례하지만 문서당 페이지 수에는 비례하지 않습니다 — 20페이지짜리 서류도 한 페이지짜리 양식과 동일한 패스로 처리됩니다.

검토, 재입력 금지. 출력 스프레드시트를 엽니다. 행의 5%를 점검합니다. 이상값을 수정합니다 — 모든 필드가 아닙니다. .xlsx로 내보내고 표준 가져오기 도구를 사용하여 PowerSchool, Infinite Campus 또는 Skyward로 가져옵니다.

자주 묻는 질문

영어 이외의 언어로 작성된 양식에서도 작동하나요?

네, 단 중요한 전제가 있습니다. AI는 스페인어를 포함한 대부분의 주요 언어로 된 필기체와 인쇄체 텍스트를 읽을 수 있습니다. 스페인어는 미국 K-12 입학 양식에서 영어 다음으로 가장 흔한 비영어권 언어입니다. 하지만 SIS에서 영어 필드 레이블을 요구하는 경우, 사용자가 정의하는 열 이름은 영어여야 합니다. AI는 스페인어 필기 텍스트를 추출하여 해당 영어 열에 배치합니다. 예를 들어 양식의 "Nombre del Estudiante"는 스프레드시트에서 "Student First Name"이 됩니다.

여러 언어로 입학 양식을 제공하는 학군의 경우, SIS가 요구하는 언어로 열을 한 번만 정의하면 각 가정이 어떤 언어 버전의 양식을 작성했든 추출이 정상 작동합니다.

학생에게 정의한 두 개의 비상연락처 열보다 더 많은 비상연락처가 있으면 어떻게 하나요?

양식에 포함된 최대 비상연락처 수만큼 열을 정의하세요. 대부분의 서류에 비상연락처가 두 명이지만 일부에 세 명이 있다면, 각각에 대해 이름, 관계, 전화번호 등 세 세트의 비상연락처 열을 정의하십시오. AI는 비상연락처가 두 명뿐인 서류의 경우 세 번째 연락처 필드를 비워둡니다. 배치를 다시 처리하거나 분할할 필요가 없습니다.

입학 양식의 필기체 추출 정확도는 어느 정도인가요?

입학 양식의 인쇄체 텍스트(양식 자체의 레이블, 작성 가능한 PDF에 입력된 필드)는 99%에 가까운 정확도를 보입니다. 필기체 필드는 필체의 명확성에 따라 달라지지만, 명확한 필드 경계가 있는 구조화된 양식(예: 입학 서류)에서는 필기체 추출이 일반적으로 90%를 초과합니다. 오류가 가장 발생하기 쉬운 필드는 구분 기호 없이 작성된 전화번호("5551234567" 대 "555-123-4567")와 좁은 필체로 작성된 약어 의학 용어입니다. 바로 이러한 필드들이 현장 확인 시 우선순위를 두어야 할 대상입니다.

이 도구는 필기체 필드에 대해 100% 정확도를 보장하지 않으며, 어떤 추출 시스템도 이를 보장할 수 없습니다. 가장 중요한 필드(비상연락처 및 의료 정보)를 포착하도록 검토 워크플로를 설계하고, 핸드북 승인 날짜와 같은 중요도가 낮은 필드는 건별 확인보다는 샘플링에 가까운 검토율을 허용하십시오.

등록 패킷에 스테이플로 고정된 주 예방접종 양식에서 데이터를 추출할 수 있나요?

네, 스캔에 포함시키면 가능합니다. 주 예방접종 양식은 구조화된 표입니다 — 행에 백신 이름, 열에 날짜 — AI가 이를 서술형 텍스트가 아닌 표로 읽습니다. 주에서 학교 입학을 위해 요구하는 특정 백신(DTaP, 폴리오, MMR, B형 간염, 수두)에 대한 열을 정의하면 추출 기능이 해당 셀에서 날짜를 가져옵니다. SIS가 예방접종 데이터를 별도 모듈에 저장하는 경우, 예방접종 열을 별도 CSV로 내보내 해당 모듈로 가져오세요.

FERPA는 이 워크플로우에 어떻게 적용되나요?

학생 등록 양식을 타사 추출 도구에 업로드하는 것은 FERPA(34 CFR § 99.30)에 따라 교육 기록에서 개인 식별 정보를 공개하는 행위에 해당합니다. 양식을 처리하기 전에, 추출 제공업체가 데이터 소유권, 재공개 제한, 계약 종료 시 삭제, 침해 통지 및 감사 권리를 포함한 기관 계약에 서명하고, 학생 문서가 제공업체의 AI 모델 학습에 절대 사용되지 않는지 확인하세요. 전체 규정 준수 프레임워크는 학생 데이터 추출을 위한 FERPA 규정 준수 가이드를 참조하세요.

등록 양식 추출의 목표는 사람의 검토를 없애는 것이 아닙니다. 사람의 역할을 데이터 입력 작업자(손글씨를 읽고 문자 하나하나 입력)에서 데이터 검토자(AI의 출력이 오류가 실제 결과에 영향을 미치는 필드에서 원본 문서와 일치하는지 확인)로 전환하는 것입니다. 천 개의 등록 패킷에서 이러한 전환은 몇 주간의 타이핑을 하루나 이틀의 검증으로 바꿔줍니다.

올해 등록 양식으로 워크플로우를 테스트하세요. SIS 필드와 일치하는 열 세트를 정의하세요. 10개의 패킷 배치를 처리하고 출력물을 점검하세요. 정확도가 유지된다면 — 명확한 필드 레이블이 있는 구조화된 양식에서는 일반적으로 그렇습니다 — 내년과 그 이후 매년 8월 워크플로우가 준비된 것입니다.

학생 등록 양식 데이터를 엑셀로 추출하는 방법
— 학군 학생 정보 시스템용

핵심 요약

종이 등록 양식은 사라지지 않습니다 — 그 이유는 다음과 같습니다

K-12 입학 서류 안에는 무엇이 들어 있을까 — 각 항목이 서로 다른 추출 과제인 이유

종이 묶음에서 SIS 준비 스프레드시트까지: 3단계 워크플로

1단계: 입학 패킷 스캔

2단계: 출력할 열 정의하기

3단계: 처리 및 SIS로 내보내기

손글씨, 체크박스, 서명: 기존 OCR을 무너뜨리는 세 가지 양식 요소

한 학년 전체 입학 신청서를 한 번에 일괄 처리하기

자주 묻는 질문

영어 이외의 언어로 작성된 양식에서도 작동하나요?

학생에게 정의한 두 개의 비상연락처 열보다 더 많은 비상연락처가 있으면 어떻게 하나요?

입학 양식의 필기체 추출 정확도는 어느 정도인가요?

등록 패킷에 스테이플로 고정된 주 예방접종 양식에서 데이터를 추출할 수 있나요?

FERPA는 이 워크플로우에 어떻게 적용되나요?

학생 등록 양식 데이터를 엑셀로 추출하는 방법— 학군 학생 정보 시스템용

핵심 요약

종이 등록 양식은 사라지지 않습니다 — 그 이유는 다음과 같습니다

K-12 입학 서류 안에는 무엇이 들어 있을까 — 각 항목이 서로 다른 추출 과제인 이유

종이 묶음에서 SIS 준비 스프레드시트까지: 3단계 워크플로

1단계: 입학 패킷 스캔

2단계: 출력할 열 정의하기

3단계: 처리 및 SIS로 내보내기

손글씨, 체크박스, 서명: 기존 OCR을 무너뜨리는 세 가지 양식 요소

한 학년 전체 입학 신청서를 한 번에 일괄 처리하기

자주 묻는 질문

영어 이외의 언어로 작성된 양식에서도 작동하나요?

학생에게 정의한 두 개의 비상연락처 열보다 더 많은 비상연락처가 있으면 어떻게 하나요?

입학 양식의 필기체 추출 정확도는 어느 정도인가요?

등록 패킷에 스테이플로 고정된 주 예방접종 양식에서 데이터를 추출할 수 있나요?

FERPA는 이 워크플로우에 어떻게 적용되나요?

학생 등록 양식 데이터를 엑셀로 추출하는 방법
— 학군 학생 정보 시스템용