Comment extraire les données d’un relevé de notes
vers Excel — Guide des admissions étape par étape
Les données de l’enquête AACRAO confirment ce que tout directeur des admissions sait : saisir manuellement un seul relevé de notes du secondaire dans un système d’information étudiant prend 20 minutes ou plus. Pour une université de taille moyenne traitant 15 000 candidatures par cycle, cela représente 5 000 heures de personnel — soit environ trois employés à temps plein qui ne font que lire des PDF et taper. Pourtant, la difficulté profonde n’est pas le volume. C’est que chaque relevé raconte la même histoire — cours, notes, crédits, moyenne — dans un langage visuel différent, issu d’un système académique différent, utilisant souvent une échelle de notation qui ne correspond pas à la vôtre. Le goulot d’étranglement n’est pas la vitesse de saisie. C’est l’écart sémantique entre la façon dont un relevé présente l’information et la façon dont votre SIS doit la recevoir.
Points clés à retenir
- Quinze mille candidatures par cycle consomment 5 000 heures de personnel à ressaisir des notes qui existent déjà sur la page, l’équivalent de trois employés à temps plein ne faisant rien d’autre.
- La ROC lit les caractères « B+ » sur un relevé mais ne peut pas vous dire que cette note signifie 3,3 dans un lycée et 87 dans un autre, et aucune équipe d’admission ne peut créer et maintenir des modèles d’analyse pour les 2 000+ établissements d’envoi.
- Définissez une fois vos colonnes de sortie souhaitées et laissez l’IA sémantique comprendre le sens académique de chaque relevé, remplissant votre feuille de calcul quel que soit l’établissement parmi les 2 000+ qui a envoyé le document.
Ce qui rend les relevés de notes différents des autres documents
La plupart des défis d'extraction de documents partagent une forme commune : trouver le numéro de facture, trouver la date, trouver le total — des champs qui apparaissent une fois par page. Les relevés de notes brisent ce schéma de trois manières, expliquant pourquoi les outils OCR génériques peinent et pourquoi les approches basées sur des modèles s'effondrent face à la variété des formats.
Listes de cours multi-lignes. Un relevé de notes n'est pas un formulaire avec des champs uniques. C'est un tableau — parfois sur plusieurs pages — où chaque ligne représente un cours avec son nom, sa note, ses crédits et son semestre. Un relevé de notes du secondaire sur quatre ans contient 28 à 32 lignes de cours. Celui d'un étudiant transféré peut dépasser 60 lignes provenant de plusieurs établissements antérieurs. Extraire les bonnes données de la bonne ligne est un défi structurel pour lequel l'OCR pixel par pixel n'a jamais été conçu.
Échelles de notation variables. Les établissements rapportent les performances sur au moins quatre échelles courantes : 4.0 non pondéré, 5.0 pondéré (AP/IB obtient +1.0, Honors obtient +0.5), pourcentage sur 100, et lettres seules sans équivalents numériques. Un « B+ » signifie 3,3 sur une échelle de 4.0 dans un lycée, 87–89 % dans un autre, et une valeur complètement différente sur une échelle de 4.3 (utilisée par Stanford et plusieurs autres). Les relevés internationaux ajoutent des fourchettes de pourcentage, des systèmes basés sur le rang et des scores d'examens nationaux qui ne correspondent pas clairement à une échelle américaine. Lire simplement les caractères « B+ » sur une page ne vous donne rien d'utile — vous devez savoir ce que cette note signifie dans le cadre de l'établissement évaluateur.
Variations des systèmes de crédits et désignations de cours. Les crédits semestriels, les crédits trimestriels (où 5 heures trimestrielles = 3,33 heures semestrielles selon la conversion standard ÷1,5), les unités trimestrielles et les unités Carnegie coexistent tous dans le même bassin de candidats. Au-delà du nombre de crédits, les désignations de niveau de cours ont une signification importante pour les admissions : Advanced Placement, International Baccalaureate, double inscription, honors, crédits de transfert d'un établissement antérieur, cours de rattrapage. Chaque désignation affecte la façon dont le cours doit être pondéré dans le calcul de la GPA et s'il satisfait aux prérequis. Un outil d'extraction de relevés qui vous donne « 4,0 crédits » sans vous dire qu'il s'agit de « 4,0 crédits trimestriels de calcul AP » vous a fourni des données trompeuses.
C'est pourquoi l'American Association of Collegiate Registrars and Admissions Officers (AACRAO) — représentant plus de 18 000 professionnels dans environ 2 300 établissements — a investi des décennies dans la normalisation des pratiques relatives aux relevés de notes via son Academic Record and Transcript Guide. Et c'est pourquoi l'Electronic Transcript Exchange (ETX) du National Student Clearinghouse connecte désormais près de 2 000 établissements pour un échange gratuit et sécurisé de relevés de notes aux formats PDF, XML et EDI. L'infrastructure de transmission électronique des relevés existe. L'écart restant est de transformer le document transmis en données structurées que votre SIS peut consommer — sans qu'un membre du personnel ne saisisse chaque champ manuellement.
L'OCR traditionnel lit les caractères. L'extraction sémantique basée sur l'IA — l'approche que nous couvrons dans ce guide — lit le sens académique. Elle comprend que « AP Calc BC » sur un relevé et « Calculus BC (Advanced Placement) » sur un autre sont la même catégorie de cours. Elle peut distinguer une note de cours d'un chiffre de GPA cumulatif sur la même page. Et elle peut le faire sans que vous ayez à créer et maintenir un modèle d'analyse pour chaque établissement émetteur. Pour en savoir plus sur la distinction technologique sous-jacente, consultez notre guide sur ce que l'OCR comprend réellement — et ne comprend pas.
Étape 1 : Préparez vos relevés de notes pour l’extraction
Ce que vous fournissez à l’outil d’extraction détermine ce que vous en retirez. Trois décisions de préparation améliorent sensiblement la qualité du résultat.
Résolution de numérisation. Si vous traitez des relevés papier reçus par courrier, numérisez à 300 DPI minimum. L’Université d’État de San Diego, qui traite plus de 31 000 relevés universitaires par an (82 % via EDI, 18 % via OCR sur papier), standardise à 300 DPI en niveaux de gris. La numérisation en noir et blanc perd le contraste subtil qui distingue un intitulé de cours d’une colonne de notes dans des mises en page denses. La numérisation couleur préserve un maximum d’informations mais augmente la taille des fichiers sans gain significatif de précision pour la plupart des formats de relevés.
Redressement et orientation des pages. Les relevés sont presque toujours en orientation portrait, mais les pages numérisées arrivent souvent légèrement inclinées. Même une inclinaison de 2 degrés peut faire mal interpréter les alignements de colonnes par l’OCR traditionnel — elle confond la note qui appartient à tel cours. Si votre logiciel de numérisation propose le redressement automatique, activez-le. Pour les PDF déjà numérisés, la plupart des outils d’extraction gèrent la rotation en interne, mais si vous remarquez des erreurs systématiques dans un lot, vérifiez la rotation des PDF sources avant de chercher un problème dans la logique d’extraction.
Organisation par lots. Regroupez les relevés par priorité de traitement avant de les télécharger. Si vous évaluez des transferts de crédits, traitez les relevés nécessitant une révision d’équivalence séparément des dossiers d’admission simples de première année — le flux de révision diffère. Nommez vos fichiers de manière cohérente : [Nom]_[Prénom]_[Établissement].pdf. Cette convention vous permet de recouper les données extraites avec le fichier source lors de la validation sans ouvrir chaque fichier.
Si votre bureau reçoit principalement des relevés via le National Student Clearinghouse ETX ou Parchment, vous recevez déjà des PDF numériques — passez l’étape de numérisation et procédez directement à l’extraction. Pour en savoir plus sur l’optimisation de la qualité d’image avant extraction, consultez notre guide pratique pour améliorer la précision de l’OCR.
Étape 2 : Définissez vos colonnes d'extraction
C'est ici que l'extraction sémantique se démarque des outils basés sur des modèles — et c'est l'étape qui détermine si vous obtenez des données exploitables ou un fouillis. Avec un modèle, vous traceriez des rectangles autour des champs sur un échantillon de relevé de notes de chaque établissement émetteur. Avec plus de 2 000 lycées et 4 000 universités rien qu'aux États-Unis, cette approche ne passe pas à l'échelle.
L'extraction sémantique fonctionne différemment. Au lieu d'indiquer à l'outil où chercher, vous lui dites quoi chercher — en nommant les colonnes qui deviendront les en-têtes de votre feuille de calcul de sortie. L'IA lit chaque relevé, comprend le sens académique du texte qu'elle trouve et associe les valeurs aux colonnes que vous avez définies. C'est ce qu'ImageToTable.ai appelle l'Extraction par colonnes personnalisées : vous définissez le schéma de sortie une fois, et l'outil l'applique à tous les relevés de votre lot, quelles que soient les différences de format.
Voici un schéma de colonnes couvrant les données essentielles dont la plupart des services d'admission ont besoin :
| Nom de la colonne | Ce qu'elle extrait | Remarques |
|---|---|---|
Nom de l'étudiant | Nom complet tel qu'imprimé sur le relevé | À recouper avec le dossier de candidature pour vérification |
Nom de l'établissement | Lycée ou université émetteur | Utilisé pour l'analyse des établissements d'origine et le contexte de la moyenne |
Nom du cours | Titre complet du cours | Ex. « AP English Literature & Composition » |
Note | Note littérale ou numérique telle qu'indiquée | Extraire la valeur brute ; la conversion est traitée à l'étape 3 |
Crédits | Heures de crédit ou unités obtenues | Noter le type de système de crédits (semestre/trimestre/Carnegie) |
Période | Semestre, trimestre ou année | Ex. « Automne 2024 », « Printemps 2025 » |
Moyenne | Moyenne cumulative telle que rapportée | L'échelle varie ; préciser si pondérée ou non |
Niveau du cours | Régulier, Honneurs, AP, IB, Double inscription, Transfert | Utiliser une colonne inférée avec une liste d'options |
La dernière colonne — Niveau du cours — n'est pas un champ qui apparaît explicitement sur la plupart des relevés. Elle nécessite que l'IA infère la classification à partir du contexte : « AP » dans le nom du cours, une colonne distincte « Honneurs », ou une mention de double inscription. C'est une colonne inférée — l'IA lit le document et déduit la catégorie de chaque cours en fonction des indices présents, même si le relevé n'imprime jamais les mots « AP » ou « Honneurs » dans un champ dédié. Vous spécifiez la logique d'inférence en incluant des options dans la définition de la colonne : Niveau du cours (options : Régulier, Honneurs, AP, IB, Double inscription, Transfert, Remédiation).
Pour l'évaluation des transferts de crédits, ajoutez ces colonnes pour capturer les détails pertinents à l'articulation :
| Nom de la colonne | Objectif |
|---|---|
Code du cours | Préfixe du département + numéro (ex. « MATH 2413 ») pour la recherche d'équivalence |
Type de crédit | Semestre / Trimestre / Carnegie — détermine la formule de conversion |
Établissement d'origine | Si le crédit a été obtenu ailleurs et transféré, le nom de l'établissement d'origine |
Les noms de colonnes que vous tapez sont les en-têtes de votre fichier Excel final. Vous définissez le format de sortie — l'IA détermine comment le remplir à partir du relevé de notes présent dans le lot.
Étape 3 : Gérer les échelles de GPA et la conversion des crédits
Extraire les notes brutes et les valeurs de crédits n'est que la moitié du travail. Rendre ces valeurs comparables entre candidats nécessite une conversion — et c'est là que la plupart des processus manuels introduisent des erreurs qui se propagent silencieusement dans le pipeline d'admission.
Conversion crédits trimestriels en semestriels. La norme approuvée par l'AACRAO, adoptée par des établissements comme Norwich University et Excelsior University, est : crédits trimestriels ÷ 1,5 = crédits semestriels. Un cours de 5 crédits trimestriels équivaut à 3,33 crédits semestriels. Cette conversion est cruciale car elle affecte directement l'éligibilité du candidat aux seuils minimaux de crédits pour l'admission par transfert, les prérequis et l'aide financière. Si votre SIS attend des crédits semestriels et que vous importez des crédits trimestriels sans conversion, chaque total de crédits ultérieur dans le système sera erroné.
Avec une Colonne calculée, vous pouvez automatiser cette conversion lors de l'extraction. Définissez une colonne appelée Crédits semestriels (si Type de crédit = Trimestre alors Crédits ÷ 1,5 sinon Crédits) — l'IA lit le type de crédit, applique la formule et produit la valeur convertie directement dans votre feuille de calcul. Aucune formule Excel post-extraction nécessaire. Cette même approche gère d'autres conversions de systèmes de crédits : crédits trimestriels ÷ 1,17, unités Carnegie × multiplicateurs variables selon la politique de votre établissement.
Normalisation de l'échelle de GPA. Le défi est qu'un GPA pondéré de 3,8 provenant d'une école qui accorde 5,0 pour les cours AP n'est pas la même réussite qu'un GPA non pondéré de 3,8 d'une école utilisant une échelle stricte de 4,0. Pour comparer équitablement les candidats, vous avez besoin à la fois du GPA brut tel que rapporté et d'informations contextuelles sur l'échelle.
Extrayez ces trois champs pour chaque relevé de notes :
GPA (tel que rapporté)— le nombre imprimé sur le relevéÉchelle GPA— utilisez une colonne inférée :Échelle GPA (options : 4,0 Non pondéré, 5,0 Pondéré, 4,3, 100 points, Autre)Max Échelle GPA— le maximum possible sur cette échelle (4,0, 5,0, 4,3, 100)
Avec ces trois valeurs dans votre feuille de calcul, votre équipe d'admission peut normaliser entre les échelles en utilisant la formule de votre établissement plutôt que de se fier à une conversion en boîte noire. Une approche courante : diviser le GPA rapporté par le maximum de l'échelle pour obtenir un score en pourcentage du maximum (ex. 3,6/4,0 = 0,90, 4,2/5,0 = 0,84), ce qui permet une comparaison inter-échelles sans perdre les données d'origine.
Gestion des crédits de transfert et de la double inscription. Lorsqu'un relevé de notes montre des cours de plusieurs établissements — courant pour les étudiants transférés et les candidats en double inscription — l'extraction doit préserver la provenance de chaque cours. Définissez une colonne pour Établissement (par cours) afin de capturer l'école d'origine pour chaque ligne. Si le relevé liste « Columbus State Community College » à côté d'un sous-ensemble de cours, l'IA peut associer ces lignes à cet établissement et remplir la colonne en conséquence, même lorsque la mise en page varie entre les relevés.
Pour un aperçu de la manière dont l'extraction par IA s'applique à l'ensemble des documents éducatifs — y compris les formulaires d'inscription, les lettres d'aide financière et les scores de tests standardisés — consultez notre guide complet sur l'extraction OCR et IA pour l'éducation.
Étape 4 : Vérifier, valider et exporter vers Excel
Aucun outil d’extraction — même basé sur l’IA — n’atteint 100 % de précision sur 100 % des relevés de notes. La clé est de concevoir un processus de vérification qui repère la petite fraction de champs nécessitant une intervention humaine, sans obliger le personnel à tout relire. C’est la différence entre une automatisation qui renforce votre équipe et une automatisation qui crée une nouvelle forme de travail chronophage.
Vérification basée sur la confiance. Certaines plateformes d’extraction signalent les champs à faible confiance — valeurs pour lesquelles l’IA n’est pas certaine d’une note, d’un nom de cours ou d’un nombre de crédits — pour validation humaine. Au lieu de vérifier chaque ligne extraite, le personnel se concentre uniquement sur les éléments signalés. Avec une précision de 95 à 99 % au niveau des champs, cela signifie vérifier environ 1 à 5 champs par relevé au lieu de 30+. Un cycle de 15 000 candidatures passe de 450 000 champs à vérifier manuellement à peut-être 22 500 champs signalés — encore du travail, mais un travail mesuré en heures plutôt qu’en semaines.
Validation croisée. Avant d’importer les données extraites dans votre SIS, effectuez deux vérifications rapides :
- Vérification du nombre de lignes : Le nombre de lignes de cours extraites correspond-il au nombre de cours visibles sur le relevé ? Si un relevé de quatre ans avec 32 cours n’a produit que 28 lignes, quelque chose a été oublié — généralement un cours chevauchant un saut de page ou un élément de mise en page inhabituel.
- Vérification de la moyenne : Si la moyenne extraite est de 2,1 mais que toutes les notes sont A ou B, soit le champ de moyenne a été mal lu, soit le relevé utilise une échelle que vous n’avez pas prise en compte.
Export groupé vers Excel. Lorsque vous traitez plusieurs relevés en un seul lot, l’outil fusionne toutes les données extraites dans un seul tableur — une ligne par cours, avec des colonnes correspondant au schéma défini à l’étape 2. Le résultat est prêt pour une importation directe dans Ellucian Banner, PeopleSoft Campus Solutions, Workday Student ou tout SIS acceptant les téléchargements CSV ou Excel. Chaque ligne est rattachable à son relevé source via la colonne du nom de fichier, afin qu’en cas de question lors de l’audit des diplômes ou de l’évaluation des crédits, le personnel puisse retrouver le PDF original en quelques secondes.
Cette capacité de fusion par lot transforme le traitement des relevés de notes d’une tâche par document en un pipeline. Traitez 50 relevés en un seul téléchargement, obtenez un tableur avec chaque cours en ligne, et alimentez directement le système que votre registraire utilise déjà.
Conformité FERPA dans l'extraction des relevés de notes
La loi sur les droits éducatifs et la vie privée des familles (FERPA, 20 U.S.C. § 1232g ; 34 CFR Part 99) exige des établissements d'enseignement qu'ils utilisent des « méthodes raisonnables » pour contrôler l'accès aux dossiers scolaires des étudiants et authentifier l'identité des destinataires des informations divulguées. Un relevé de notes est un dossier scolaire. Toute personne qui y accède lors du traitement constitue un point d'accès qui doit être contrôlé et documenté.
Où la saisie manuelle crée une exposition FERPA. Avant qu'une seule note n'atteigne votre SIS via un flux manuel, le PDF du relevé passe généralement par : un lecteur réseau partagé (accessible à toute personne disposant des autorisations de dossier), une boîte de réception (potentiellement transférée, sauvegardée automatiquement ou mise en cache sur plusieurs appareils), et le bureau ou le dossier de téléchargement d'un membre du personnel. À chaque transfert, le document existe en dehors d'un système qui enregistre qui y a accédé et quand. En cas d'audit suite à une plainte FERPA, l'établissement doit démontrer une chaîne de contrôle — et un journal de correction dans un tableur ne constitue pas un journal d'accès. Alors que l'application fédérale de la FERPA s'est intensifiée, le ministère de l'Éducation exigeant des établissements qu'ils certifient leur conformité et démontrent des protections proactives des données, l'écart entre « nous avons toujours fait ainsi » et une gouvernance démontrable s'est réduit.
Comment l'extraction automatisée réduit la surface d'exposition. Lorsque les données des relevés transitent par un outil d'extraction qui traite les fichiers directement — sans sauvegardes intermédiaires sur des lecteurs partagés, sans pièces jointes, sans téléchargement sur des postes individuels — le nombre de points d'accès non contrôlés diminue. Le relevé passe du téléchargement à la sortie structurée. Le personnel examine les champs de données extraits plutôt que de manipuler le PDF complet du dossier étudiant. Et comme le processus d'extraction est côté serveur avec un traitement crypté des données, les événements d'accès pertinents pour la FERPA deviennent : l'authentification du téléchargeur, le traitement de l'extraction et l'accès du réviseur — tous pouvant être journalisés.
Cela n'élimine pas les obligations FERPA — cela transforme le flux de conformité de « suivre chaque intervention humaine » à « contrôler et journaliser les points d'accès système ». Pour la plupart des services d'admission, cette dernière approche est plus facile à documenter, plus facile à auditer et plus difficile à enfreindre accidentellement.
Questions fréquentes
L'extraction par IA fonctionne-t-elle sur les relevés de notes manuscrits ?
Partiellement. Les données imprimées — noms de cours, crédits, établissements, moyennes — sont extraites avec une grande précision (95 % et plus). Les annotations manuscrites — note d'un conseiller en marge, correction entourée à la main — sont plus difficiles. Les modèles de vision-langage modernes lisent l'écriture manuscrite avec une précision correcte sur des scans clairs et bien éclairés, mais l'écriture cursive, les traits de crayon légers ou les annotations qui se confondent avec le texte imprimé donnent des résultats moins fiables. Pour les relevés comportant beaucoup de contenu manuscrit, prévoyez un temps de relecture supplémentaire pour les champs signalés.
Qu'en est-il des relevés internationaux avec des écritures non latines ?
Les relevés en langues utilisant l'alphabet latin (anglais, espagnol, français, allemand, portugais) sont traités de manière fiable. Ceux en écritures non latines (chinois, japonais, coréen, arabe, cyrillique) peuvent être lus par les modèles de vision-langage qui prennent en charge ces jeux de caractères, mais la précision varie selon la complexité de l'écriture et la qualité du document. Les systèmes de notes et de crédits des établissements non américains ajoutent une complexité supplémentaire — un système de notation français sur 20 (où 16/20 est excellent) ne se convertit pas en une échelle américaine de 4.0 par une simple division. Dans ces cas, extrayez les valeurs brutes et gérez la conversion via le processus d'évaluation des diplômes internationaux de votre établissement.
Puis-je extraire des données de relevés non officiels ou de captures d'écran de portail étudiant ?
Oui — l'IA lit tout contenu visuel présent, que le document porte ou non un sceau officiel. Cependant, pour les décisions d'admission, vous aurez besoin du relevé officiel pour vérification. Un flux de travail pratique : utilisez les relevés non officiels ou les captures d'écran pour une évaluation préliminaire (tri, estimation initiale de la moyenne, identification des candidats pour un examen accéléré), puis traitez les relevés officiels via le même pipeline d'extraction pour la saisie finale dans le SIS. Veillez simplement à séparer les lots officiels et non officiels afin que les données extraites ne soient jamais confondues.
En quoi cela se compare-t-il à Parchment Data Automation ou Softdocs ITP ?
Parchment Receive Premium + Data Automation et Softdocs Intelligent Transcript Processing sont conçus pour le traitement institutionnel de relevés de notes à grand volume avec intégration directe SIS/CRM. Ils sont le bon choix pour les universités traitant plus de 10 000 candidatures par cycle, avec un support informatique dédié et un budget pour des contrats d'entreprise. L'approche décrite dans ce guide — utiliser un outil d'extraction IA léger et sans modèle — répond à un cas d'usage différent : les petits bureaux d'admission, l'évaluation des transferts dans les community colleges, les admissions en master au sein d'un département, ou tout scénario où une plateforme d'entreprise est excessive par rapport au volume et au budget. Les deux approches résolvent le même problème de saisie manuelle des données ; elles diffèrent par l'échelle, la profondeur d'intégration et la structure de coûts.
Cela fonctionne-t-il avec des PDF protégés par des restrictions de sécurité ou un mot de passe ?
Non. Les PDF protégés par mot de passe ou par DRM doivent être déverrouillés avant l'extraction. La plupart des relevés de notes électroniques officiels provenant de services comme Parchment et National Student Clearinghouse arrivent sous forme de PDF standard non protégés. Si vous rencontrez un PDF verrouillé, contactez le bureau du registraire de l'établissement émetteur — ils peuvent fournir une version sans restriction ou une méthode de livraison alternative.
Quel est le taux de précision réel de l'extraction des relevés de notes ?
La précision au niveau des champs pour les données de relevés de notes imprimés — noms de cours, notes, crédits, noms d'établissements, dates, GPA — se situe généralement entre 95 % et 99 %, selon la qualité de numérisation, la complexité de la mise en page et la présence d'éléments de formatage inhabituels (listes de cours sur plusieurs colonnes, conceptions à pages divisées, filigranes sur le texte). L'Université du Texas à Austin, après avoir adopté l'extraction automatisée des données de relevés de notes, a rapporté une précision supérieure à 95 % avec une réduction de 70 % du temps de traitement du personnel. Les 1 à 5 % de champs restants — impliquant généralement des abréviations inhabituelles, des mises en page très compressées ou du texte imprimé près des bordures du document — sont ce que le processus de révision basé sur la confiance est conçu pour détecter. Cet outil ne remplace pas le jugement humain ; c'est un outil qui réduit la surface où le jugement humain est nécessaire.