Comment gère-t-il la case à cocher « Même adresse postale ? □ Oui » — évite-t-il l'extraction en double ou extrait-il la même adresse deux fois ?

Lorsque vous définissez des colonnes pour l'adresse postale et l'adresse physique, l'IA lit l'état de la case à cocher et applique la logique que vous spécifiez. Définissez une colonne déduite avec une règle comme « Adresse physique (si Même adresse postale = Oui, copier l'adresse postale ; si Non, extraire de la section Adresse physique) » — l'IA vérifie la case, suit la logique conditionnelle et remplit la colonne correcte sans duplication ni donnée manquante. Si la case est cochée, la colonne d'adresse physique est remplie à partir des champs d'adresse postale. Sinon, l'IA extrait l'adresse physique écrite séparément. C'est le type de logique inter-champs que les outils basés sur des modèles — qui extraient chaque champ de formulaire indépendamment — ne peuvent pas gérer.

Puis-je extraire les dates d'expérience professionnelle de manière cohérente lorsque les candidats les écrivent dans des formats différents — « 2019-2022 » vs « Jan 2019 - Mars 2022 » vs « 01/2019 » ?

L'IA normalise les dates lors de l'extraction en comprenant la plage de dates de manière sémantique plutôt qu'en faisant correspondre un format spécifique. Que le candidat écrive « 2019-2022 », « Jan 2019 – Mar 2022 », « 01/2019 – 03/2022 » ou « 2019 à aujourd'hui », l'IA lit l'expression complète et produit des valeurs de date standardisées dans votre format cible. Cela fonctionne pour toutes les entrées d'expérience professionnelle sur le même formulaire — même lorsque le même candidat utilise des conventions de date différentes pour différents employeurs — car l'IA comprend le sens temporel, pas seulement la correspondance de motifs. Pour une colonne définie comme « Dates d'emploi (De–À) », la sortie est normalisée selon votre format préféré.

Extraction de formulaires de candidature

Convertisseur IA de formulaires de candidature en Excel — Extraire Nom du candidat, parcours professionnel, formation et champs signés des candidatures papier et PDF

La transcription manuelle d'une candidature papier prend 4 à 6 minutes par formulaire de 4 pages — données démographiques page 1, parcours professionnel manuscrit de 15+ ans page 2, formation collée depuis un CV page 3, déclaration signée page 4. Cet outil extrait chaque section dans des colonnes Excel étiquetées en 5 à 10 secondes par page.

Connexion

Traitement chiffré · Suppression automatique des données après conversion

PDF & formulaires scannés

XLSX/CSV

Écriture manuscrite + imprimée

Cases à cocher

Ce que vous pouvez extraire des formulaires de candidature

Saisissez les noms de colonnes dont vous avez besoin — l'IA trouve ces valeurs sur chaque candidature en comprenant la signification de chaque champ, qu'il s'agisse d'un nom d'employeur manuscrit dans un tableau d'expérience serré, d'un extrait de CV collé dans la section formation, ou d'une case à cocher à côté de « Autorisé à travailler aux États-Unis ».

Prénom du candidat

Nom du candidat

Adresse e-mail

Numéro de téléphone

Poste visé

Date de disponibilité

Expérience — Employeur

Expérience — Titre du poste

Expérience — Dates (De–À)

Formation — Diplôme le plus élevé

Formation — Établissement

Autorisé à travailler (Oui/Non)

Références — Nom

Signature présente (Oui/Non)

Adresse postale

L'outil utilise l'Extraction de colonnes personnalisées : vous définissez les noms de colonnes de votre feuille de calcul — « Expérience — Employeur », « Formation — Diplôme », « Autorisé à travailler » — et l'IA localise chaque valeur sur le formulaire en comprenant sémantiquement le libellé du champ, et non sa position sur la page. Ainsi, un même jeu de noms de colonnes extrait les données de candidatures de différents employeurs, même si chaque entreprise conçoit son propre formulaire avec des champs à des emplacements différents. Vous pouvez également définir une Colonne déduite — par exemple, une colonne nommée « Années d'expérience » avec une règle pour calculer la durée totale de travail à partir des dates d'emploi extraites — et l'IA calcule le résultat lors de l'extraction, sans que le candidat ait besoin d'avoir inscrit le total sur le formulaire.

Pourquoi les candidatures sont le document multi-format ultime — et ce qui change ici

Un formulaire de candidature semble simple. Nom, adresse, expérience professionnelle, études, signature. Mais la difficulté ne réside pas dans un champ en particulier — c'est que chaque section du même formulaire de 4 pages utilise un mode de saisie différent. La section du haut est imprimée. Le tableau des expériences est rempli à la main, avec des dates s'étalant sur plus de 15 ans et au moins deux conventions de formatage différentes. La section études peut contenir une photocopie de diplôme ou un extrait de CV collé sur la page. La déclaration en bas comporte une signature manuscrite. Et il y a des champs qui renvoient à d'autres champs — « Identique à l'adresse postale ? □ Oui » — ce qui oblige la logique d'extraction à prendre des décisions, pas seulement à capturer des valeurs. Chacun de ces éléments est un problème de reconnaissance distinct. Les outils OCR et les modèles traditionnels n'en résolvent aucun correctement individuellement — et lorsque les six apparaissent sur le même formulaire, en séquence, le taux d'échec se cumule.

La section « Expérience professionnelle » en page 2 est presque toujours manuscrite — et les dates d'emploi utilisent des notations incohérentes, même chez un même candidat. Un candidat indique ses trois derniers emplois avec des dates comme « 2019-2022 » pour un employeur, « Jan 2022 – Mars 2024 » pour un autre, et « 06/2024 à aujourd'hui » pour le poste actuel. Un OCR classique lit ces trois chaînes de caractères sans comprendre qu'elles désignent toutes une « durée d'emploi ». Les outils basés sur des modèles, qui attendent un format de date cohérent — MM/AAAA à MM/AAAA — ignorent les saisies dès que le format dévie. Résultat : quelqu'un doit ouvrir chaque formulaire et ressaisir manuellement les dates dans un format uniforme, ce qui est l'étape la plus lente de tout le processus de saisie des candidatures.

Les champs se réfèrent les uns aux autres — « Identique à l'adresse postale ? ☐ Oui » — et l'extraction classique ne peut pas suivre cette logique. Un formulaire type demande une adresse postale et une adresse physique, avec une case à cocher « Identique à l'adresse postale ». Si cochée, la section adresse physique reste vide — l'extraire comme vide laisse penser que le candidat n'a pas d'adresse physique, ce qui est faux. Si décochée, la section adresse physique contient une adresse différente — extraire uniquement l'adresse postale ignore cette autre localisation. Les outils classiques extraient chaque champ indépendamment et produisent soit un vide, soit un doublon, sans savoir que la case à cocher détermine le cas. La personne qui vérifie le tableaux doit alors contrôler chaque formulaire manuellement pour valider la logique d'adresse.

Chaque employeur conçoit son propre formulaire de candidature — et un modèle conçu pour la mise en page d'une entreprise produit des résultats inexploitables pour une autre. Une entreprise place « Poste recherché » dans l'en-tête en haut à droite. Une autre le met au milieu de la page sous une sous-section « Intérêt pour le poste ». Le formulaire d'une chaîne de vente au détail inclut une section sur les disponibilités (cases à cocher matin/après-midi/soir) ; celui d'un entrepôt demande une certification pour chariot élévateur ; celui d'un bureau n'a pas de section sur les horaires. Les outils basés sur des modèles exigent une configuration d'extraction distincte pour chaque mise en page de formulaire. Si les RH traitent les candidatures pour cinq postes différents — chacun avec un formulaire différent — cela fait cinq modèles à maintenir. Quand une entreprise met à jour son formulaire, le modèle ne fonctionne plus. Voilà pourquoi les équipes RH qui traitent des formulaires papier d'origines diverses — candidatures spontanées, forums de l'emploi, plusieurs sites — reviennent à la saisie manuelle : les modèles ne passent pas à l'échelle face à la variété des formulaires.

L'IA lit les dates d'historique professionnel par leur sens, pas par leur format — normalisant "2019-2022", "Janv. 2022 – Mars 2024" et "06/2024 à aujourd'hui" en colonnes cohérentes. Définissez vos colonnes de dates — "Date de début d'emploi", "Date de fin d'emploi" — et l'IA comprend que les trois formats écrits décrivent le même type d'information. Elle convertit "2019-2022" en début 2019, fin 2022. Elle convertit "Janv. 2022 – Mars 2024" en début 01/2022, fin 03/2024. Elle convertit "06/2024 à aujourd'hui" en début 06/2024, fin Aujourd'hui. Cela s'applique à chaque entrée d'historique professionnel sur chaque formulaire du lot — même lorsque le même candidat utilise trois formats de dates différents pour trois employeurs différents sur la même candidature. L'IA comprend le sens temporel, pas la correspondance de motifs, donc l'incohérence de format devient un non-problème.

Une colonne inférée gère les champs conditionnels — "si 'Identique à l'adresse postale' est coché, remplir l'adresse physique depuis l'adresse postale ; sinon, l'extraire du formulaire." Définissez une colonne nommée "Adresse physique" avec une règle inférée : lire la case à cocher, suivre la logique. Lorsque la case est cochée, l'IA copie la valeur de l'adresse postale dans la colonne d'adresse physique — pas de sortie vide, pas d'extraction en double. Lorsque la case n'est pas cochée, l'IA lit l'adresse physique saisie séparément dans le formulaire. C'est la différence entre l'extraction au niveau du champ (chaque case traitée indépendamment, sans conscience inter-champs) et la compréhension au niveau du document (l'IA lit le formulaire de manière holistique et applique la logique que le formulaire lui-même définit). La même approche fonctionne pour tout champ conditionnel : "Avez-vous un permis de conduire ? □ Oui → alors extraire le numéro de permis" — l'IA suit la chaîne.

Une seule définition de colonne fonctionne pour tous les formulaires de candidature, quel que soit l'employeur — indépendamment de la mise en page, du nombre de pages ou des sections incluses. Parce que l'IA localise les valeurs en comprenant la signification des libellés de champs plutôt que leur position sur la page, les mêmes noms de colonnes — « Prénom du candidat », « Poste recherché », « Historique professionnel — Employeur », « Autorisation de travailler » — extraient correctement les données d'un formulaire de bureau de 4 pages, d'un formulaire de vente au détail de 2 pages avec cases à cocher de disponibilité, et d'un formulaire d'entrepôt de 3 pages avec champs de certification, le tout dans le même lot. Lorsqu'un employeur met à jour son formulaire — déplace la section éducation vers une autre page, ajoute une question sur la préférence de télétravail — l'IA lit la nouvelle mise en page de la même manière qu'elle lisait l'ancienne. Pas de configuration par employeur, pas de reconfiguration lors des changements de formulaires, pas de frais de maintenance. C'est la différence entre l'extraction basée sur des modèles (un modèle par mise en page de formulaire, mis à jour à chaque changement) et l'extraction sémantique (un ensemble de noms de colonnes, n'importe quelle mise en page de formulaire soumise par le candidat).

Comment une pile de candidatures papier devient un tableur de candidats triable

Importez — les candidatures telles qu'elles arrivent, pas comme vous les souhaiteriez

Vous recevez 40 candidatures : 15 au format PDF téléchargé depuis votre page carrières, 12 formulaires papier scannés (200 dpi, légèrement inclinés), 8 collectés lors d'un salon de l'emploi sur le formulaire officiel de votre entreprise, et 5 remplis à domicile et scannés par les candidats avec leur téléphone. Les sections expérience professionnelle sont manuscrites sur les formulaires papier, tapées sur les PDF. Les sections formation incluent des copies de diplômes jointes à deux formulaires. Importez les 40 en un seul lot. Pas de tri préalable par format, pas de séparation entre manuscrit et tapé, pas de retrait des pièces jointes avant traitement. Si les candidatures arrivent en continu (visites spontanées, cooptation, recrutement campus), utilisez un Lien de collecte : partagez une URL unique où chaque candidat ouvre la page, saisit un code de vérification et dépose son formulaire directement dans votre file de traitement. Aucune création de compte nécessaire de leur côté.

Définissez les colonnes — ce dont vous avez besoin pour votre base candidats

Saisissez les noms des colonnes de votre tableur de sortie : Prénom du candidat, Nom du candidat, Adresse e-mail, Numéro de téléphone, Poste visé, Date de disponibilité, Expérience — Employeur 1, Expérience — Titre 1, Expérience — Dates 1, Formation — Diplôme, Formation — Établissement, Autorisé à travailler, Signature présente. Pour les cases à cocher, l'IA lit la marque à côté de « Autorisé à travailler aux États-Unis » — que ce soit une coche, une croix, un cercle ou un carré rempli — et enregistre Oui ou Non. Pour le champ signature, elle détecte si la ligne de signature sur la page de déclaration contient une signature ou est vierge. Si vous avez besoin que l'adresse physique suive la logique de la case « Même adresse postale ? », définissez une colonne déduite — Adresse physique (si Même adresse postale = Oui, copier l'adresse postale ; si Non, extraire de la section Adresse physique) — et l'IA applique la logique conditionnelle lors de l'extraction.

Sortie — une ligne par candidat, chaque champ de chaque page dans des colonnes étiquetées

Téléchargez un fichier Excel où chaque ligne correspond à une candidature complète. Le nom du candidat de la page 1, les dates manuscrites d'expérience professionnelle de la page 2, les informations de formation copiées-collées de la page 3 et la présence de signature de la page 4 se retrouvent sur la même ligne. Les colonnes de dates d'expérience affichent des valeurs normalisées, quel que soit le format saisi par le candidat — « 2019-2022 », « janv. 2019 - mars 2022 » et « 01/2019-03/2022 » sont tous convertis dans votre format cible. La colonne Autorisation de travail affiche des valeurs Oui/Non cohérentes dans tous les formulaires, filtrables en un clic. Signature présente vous permet d'identifier instantanément les candidatures non signées nécessitant un suivi avant traitement. La colonne Adresse physique reflète la logique des cases à cocher — recopiée depuis l'adresse postale si cochée, extraite indépendamment sinon. Exportez en XLSX, CSV ou JSON, prêt à être importé dans votre ATS ou votre tableur de suivi des candidats.

Quand ça fonctionne le mieux — et quand vérifier les résultats

La précision d'extraction est élevée pour les formulaires de candidature standard imprimés ou manuscrits lisibles — y compris les PDF scannés à 200 dpi ou plus. Quelques conditions de document et limites architecturales méritent d'être comprises avant de traiter un lot important.

Traitement fiable

Formats mixtes — texte imprimé, historique manuscrit, sections de CV collées et champs tapés — sur un même formulaire. L'IA traite tous les formats en une seule passe. Les données démographiques imprimées, les emplois manuscrits, les champs PDF tapés des candidatures numériques et les diplômes photocopiés sont tous affectés à leurs colonnes de sortie respectives. C'est le cas d'usage le plus fort de l'outil : le formulaire arrive dans le format choisi par le candidat.

Cases à cocher — Autorisation de travail, Permis de conduire, disponibilités — lues comme Oui/Non par case. L'IA identifie si chaque case est cochée, marquée d'une croix, entourée ou laissée vide et enregistre l'état dans la bonne colonne. Fonctionne pour les styles de coche, les carrés remplis et les sélections entourées — car l'IA lit la marque visuelle, pas un motif graphique spécifique.

Dossiers de candidature multipages traités comme un seul enregistrement. Téléchargez une candidature de 4 pages en un seul PDF multipage. L'IA lit toutes les pages ensemble, reliant le nom de la page 1 à l'historique professionnel de la page 2, aux études de la page 3 et à la signature de la page 4 — le tout sur une seule ligne de sortie. Chaque candidature produit exactement une ligne, quel que soit le nombre de pages.

Vérifiez ces cas

Cet outil extrait les données des formulaires de candidature — il ne s'intègre pas aux ATS ni ne valide les offres d'emploi. Il lit les champs du formulaire et produit un fichier Excel/CSV structuré. Il ne se connecte pas à Workday, Greenhouse, Lever, BambooHR ni à aucun ATS via API, et ne fait pas correspondre les données des candidats à une fiche de poste spécifique. Le résultat est un tableur que vous importez manuellement dans votre ATS.

Lorsqu'un candidat écrit « voir CV ci-joint » dans la section expérience au lieu de la remplir. L'IA extrait le texte littéral « voir CV ci-joint » dans la colonne du nom de l'employeur — elle ne suit pas la référence, ne localise pas le CV joint et n'en fusionne pas le contenu. Si un lot de candidatures contient des formulaires où les candidats ont refusé de remplir la grille d'expérience et ont écrit « voir ci-joint », ces cellules contiendront cette chaîne de texte. Pour obtenir les données d'expérience de ces candidats, importez le CV joint comme fichier séparé et définissez des colonnes spécifiques au CV, ou demandez aux candidats de remplir directement les champs d'expérience.

Écriture manuscrite très cursive — en particulier dans les blocs de description de l'expérience. L'écriture en lettres capitales s'extrait avec une grande précision. L'écriture cursive dans les paragraphes de description des tâches (où les candidats rédigent librement un résumé de leurs responsabilités) peut donner une précision moindre, surtout si l'écriture est légère ou serrée. Pour les champs critiques comme le nom de l'employeur, le titre du poste et les dates — généralement écrits en capitales — la précision reste élevée. Pour les paragraphes descriptifs en cursive, vérifiez les premières lignes de sortie et corrigez si nécessaire.

Photocopies de troisième génération délavées où les étiquettes du formulaire et les lignes des cases à cocher se confondent avec l'arrière-plan. Lorsqu'un formulaire a été photocopié plusieurs fois — la copie bureau d'un scan d'une photocopie — les lignes des cases à cocher peuvent être à peine distinctes du fond du papier, et les petites coches (un léger coup de crayon) peuvent être indiscernables des traces de la grille. Si le formulaire semble visiblement délavé, vérifiez que les valeurs Oui/Non des cases à cocher dans la sortie correspondent à l'original avant d'importer dans votre base de données candidats.

Questions fréquentes

Peut-il lire à la fois la section « Formation » imprimée ET les entrées manuscrites de l'historique professionnel sur un même formulaire de candidature ?

Oui. L'IA lit l'intégralité du formulaire comme un seul document — elle reconnaît le texte imprimé de la section Formation (souvent tapé ou collé depuis un CV) et le texte manuscrit de la section Expérience professionnelle (rempli à la main) en un seul passage. Chaque valeur est mappée à sa colonne de sortie correspondante, quelle que soit la manière dont le candidat a choisi de remplir cette section. C'est la différence fondamentale entre l'extraction sémantique par IA — qui lit en comprenant la signification de chaque champ — et l'OCR traditionnel, qui applique un mode de reconnaissance uniforme et peine lorsque le formulaire alterne entre contenu imprimé, manuscrit et collé sur différentes sections d'une même page. L'IA ne choisit pas entre « mode manuscrit » et « mode imprimé » — elle lit le contenu visuel et le comprend dans le contexte du libellé du champ auquel il correspond, de sorte que le format de la réponse n'affecte pas la logique d'extraction.

Comment gère-t-il la case à cocher « Même adresse postale ? □ Oui » — évite-t-il une extraction en double ?

Lorsque vous définissez des colonnes pour l'Adresse postale et l'Adresse physique, l'IA lit la case à cocher et applique la logique que vous spécifiez. Définissez une Colonne déduite — Colonnes déduites vous permettent de décrire une règle de raisonnement que l'IA suit lors de l'extraction, par exemple « si la case A est cochée, remplir la colonne B à partir de la colonne C ; si elle n'est pas cochée, extraire la valeur du formulaire ». Pour une colonne nommée « Adresse physique », la règle serait : si « Même adresse postale » est Oui, sortir la valeur de l'Adresse postale ; si Non, extraire du bloc Adresse physique sur le formulaire. L'IA évalue la condition, suit la logique et produit le résultat correct — pas de cellules vides là où une adresse devrait figurer, pas d'adresses en double là où elles n'étaient pas prévues. C'est le genre de logique inter-champs que les outils basés sur des modèles — qui extraient chaque champ du formulaire comme un point de données indépendant — ne peuvent pas exprimer, car la case à cocher n'a de sens que lue en relation avec les deux champs d'adresse qu'elle contrôle.

Puis-je extraire les dates d'emploi de manière cohérente quand les candidats utilisent des formats différents — « 2019-2022 » vs « janv. 2019 - mars 2022 » vs « 01/2019 » ?

Oui. L'IA normalise les dates en interprétant sémantiquement la plage de dates complète, sans se baser sur un format spécifique. Que le candidat écrive « 2019-2022 », « janv. 2019 – mars 2022 », « 01/2019 – 03/2022 » ou « 2019 à aujourd'hui », l'IA lit l'expression comme une durée d'emploi et produit des valeurs standardisées dans votre format cible. Cela fonctionne pour chaque entrée d'historique professionnel sur chaque formulaire du lot, même si un même candidat écrit les dates de son premier employeur « 2016-2019 », celles du second « juin 2019 à février 2022 » et celles de son employeur actuel « 03/2022 – Présent ». Chacune est convertie en dates de début et de fin cohérentes dans le résultat. C'est essentiel car l'incohérence des dates dans la section emploi est la tâche de correction de données la plus chronophage en traitement manuel des candidatures — et c'est la première chose qui échoue avec les outils basés sur des modèles qui attendent un format précis par champ.

Que faire si un candidat écrit « voir CV ci-joint » au lieu de remplir la section emploi ?

L'IA extrait le texte littéral « voir CV ci-joint » dans les colonnes correspondantes de l'historique professionnel — Nom de l'employeur, Titre du poste, Dates. Elle ne suit pas la référence, ne localise pas le CV joint et n'en fusionne pas le contenu dans les cellules. Dans un lot où certains candidats ont rempli intégralement la section emploi et d'autres ont écrit « voir CV ci-joint », le tableur de sortie contiendra un mélange de données réelles et de références textuelles — ce qui est honnête : l'outil rapporte ce qui figure sur le formulaire, sans deviner. Pour traiter les CV joints et obtenir les données réelles, téléchargez chaque CV comme fichier séparé avec le formulaire de candidature et définissez des colonnes d'extraction spécifiques au CV. Sinon, demandez aux candidats de remplir tous les champs directement sur le formulaire. Cette transparence sur ce que l'outil peut ou ne peut pas fusionner est importante — prétendre le contraire produirait des résultats trompeurs lorsque de vraies candidatures arrivent avec « voir CV ci-joint » dans la grille emploi.

Puis-je configurer un lien de collecte pour que les candidats téléversent leurs formulaires au lieu d'apporter du papier ?

Oui. Générez un lien de collecte — une URL partageable — et envoyez-le aux candidats (par e-mail, code QR lors d'un salon de l'emploi, lien sur votre page carrières). Le candidat ouvre le lien, saisit un code de vérification court et téléverse son formulaire de candidature rempli au format PDF ou image. Les fichiers arrivent directement dans la file de traitement de votre compte — aucune création de compte nécessaire pour le candidat. Cela fonctionne pour tout scénario où vous recevez normalement des formulaires papier : candidats se présentant à l'accueil (donnez-leur le lien sur une carte imprimée), stands lors de salons de l'emploi (affichez le code QR sur la table), recrutement sur les campus (incluez le lien dans votre e-mail de prospection) et candidats recommandés (partagez le lien directement). Lorsque le formulaire arrive numériquement — plutôt que sur papier que quelqu'un doit d'abord numériser — vous pouvez le traiter immédiatement. Combinez un lien de collecte avec la configuration d'extraction de colonnes personnalisées décrite ci-dessus, et l'ensemble des candidatures d'un événement de recrutement peut être numérisé et structuré avant même que le dernier candidat n'ait soumis son formulaire.

Pour aller plus loin : Comment passer des formulaires d'intégration papier à une base de données employés — l'étape naturelle après le traitement des candidatures : extraire en masse les données des nouveaux employés (W-4, I-9, formulaires de dépôt direct) vers Excel. Traiter 50+ formulaires d'intégration en une seule base de données avec l'extraction par lots — l'histoire du passage à l'échelle en RH : comment traiter l'ensemble des documents d'une promotion de nouveaux employés en un seul lot, formulaire par formulaire. Le guide complet pour extraire n'importe quel formulaire papier vers Excel structuré sans ressaisie — le guide complet de l'extraction de formulaires par IA : enquêtes, candidatures, formulaires d'admission et questionnaires.