OCR bancaire :
Traitement des chèques, extraction de relevés & automatisation KYC
Trois catégories de documents bancaires — chèques, relevés bancaires et documents KYC — représentent la majorité des heures de saisie manuelle dans les institutions financières. Le rapport 2026 du Risk Officer de la Réserve fédérale indique que 63 % des institutions financières ont signalé des tentatives de fraude par chèque au cours des 12 mois précédents. L'enquête 2026 sur la fraude aux paiements de l'AFP chiffre à 58 % les organisations déclarant une fraude par chèque, ce qui en fait le moyen de paiement le plus exposé. Parallèlement, les équipes de rapprochement bancaire passent des jours par mois à saisir manuellement des lignes de transactions à partir de relevés qui refusent de s'aligner proprement dans un tableur, et les responsables conformité traitent des documents KYC avec des délais de 30 à 60 minutes par dossier.
Points clés
- Les banques investissent l'OCR dans trois pipelines distincts — traitement des chèques, extraction de relevés et vérification KYC — et tous trois reposent sur une hypothèse qui ne tient jamais : la stabilité des mises en page.
- Un OCR au niveau caractère précis à 99 % fait encore cinq erreurs par page KYC — et un seul chiffre erroné dans un numéro de passeport signifie un échec de conformité qu'aucune piste d'audit ne peut expliquer.
- La Vision AI extrait les documents bancaires par le sens du champ plutôt que par les coordonnées des pixels — une définition de colonne fonctionne pour tous les formats bancaires, que Chase redessine son relevé ou qu'un client tourne son téléphone.
La banque repose sur les documents. Mais contrairement aux factures — qui partagent au moins une structure familiale grossière chez la plupart des fournisseurs — les documents bancaires résistent à toute tentative de normalisation. Un chèque utilise une police à encre magnétique inventée dans les années 1950. Un relevé bancaire de Chase et celui d'une caisse régionale n'ont pratiquement aucune convention de mise en page en commun. Un passeport utilisé pour le KYC suit les normes de l'OACI, tandis qu'un permis de conduire suit des règles étatiques qui changent tous les deux ou trois ans.
Cet article couvre les trois types de documents qui stimulent l'adoption de l'OCR dans le secteur bancaire, explique les défis techniques spécifiques à chacun, et montre où l'OCR traditionnel échoue — et où l'IA visuelle intervient.
Les trois documents bancaires qui stimulent l'adoption de l'OCR
Lorsque les professionnels de la banque parlent d'OCR, ils font généralement référence à l'un de ces trois flux de travail distincts, chacun avec ses propres exigences techniques, modes de défaillance et enjeux réglementaires :
Traitement des chèques et des paiements
La reconnaissance des caractères à encre magnétique (MICR) est le pilier de la compensation des chèques. Les banques traitent des millions de chèques par jour via des trieuses à grande vitesse qui lisent la ligne de police E-13B en bas de chaque chèque. Le défi va au-delà du MICR : la détection des fraudes nécessite la lecture des zones de montant en chiffres (CAR) et en lettres (LAR), la vérification des motifs d'endossement et la détection des altérations. Selon l'enquête de l'AFP, 58 % des organisations ont signalé une fraude par chèque en 2025.
Extraction et rapprochement des relevés bancaires
Chaque banque formate ses relevés différemment. Les tableaux de transactions peuvent s'étendre sur plusieurs colonnes — date, description, débit, crédit, solde courant — et ces colonnes changent de position d'une page à l'autre d'un même relevé. Le solde courant doit être continu entre les sauts de page. L'OCR basé sur des modèles échoue ici. L'extraction de relevés bancaires basée sur l'IA gère ces variations en comprenant la sémantique des champs plutôt que les coordonnées des pixels.
Vérification KYC et des documents de prêt
L'intégration client exige la vérification des pièces d'identité (passeports, permis de conduire), des justificatifs de domicile (factures de services publics, relevés bancaires) et des preuves financières (fiches de paie, déclarations fiscales, W-2). La conformité aux réglementations BSA/AML nécessite une extraction précise et des pistes d'audit. Le traitement manuel du KYC prend 30 à 60 minutes par dossier ; l'eKYC automatisé avec OCR et IA réduit ce temps à moins de 5 minutes pour les demandes standard, selon les données de déploiement publiées par les banques asiatiques et européennes.
Ces trois flux de travail partagent un point commun : ils impliquent tous l'extraction de données structurées à partir d'images de documents semi-structurés ou non structurés. Mais les approches techniques qui fonctionnent pour l'un échouent souvent pour les autres.
Traitement des chèques : quand l'OCR rencontre la MICR
Le traitement des chèques occupe une place à part dans le paysage de l'OCR, car il ne repose pas uniquement sur celle-ci. Les données essentielles de chaque chèque — numéro de routage, numéro de compte, numéro de chèque — sont encodées dans la ligne MICR (reconnaissance de caractères à encre magnétique), une police spécialisée imprimée avec de l'encre ou du toner magnétique qui reste lisible même après avoir été tamponnée, marquée ou barrée.
Le standard MICR : E-13B et CMC-7
La ligne MICR en bas de chaque chèque utilise l'une de deux polices. Aux États-Unis, au Canada, au Royaume-Uni, en Australie et dans une grande partie de la région Asie-Pacifique, le standard est E-13B, adopté par l'American Bankers Association en 1958 et normalisé plus tard sous les références ANSI X9.27 et ISO 1004:1995. Les pays européens et certains pays d'Amérique latine utilisent CMC-7, une police différente qui encode les mêmes données de routage. Les deux sont magnétiques — le trieur haute vitesse d'une banque les lit en détectant le signal magnétique des caractères, et non par reconnaissance optique. Cela confère à la MICR des taux de lecture quasi parfaits, même sur des chèques pliés, tachés ou annotés.
La ligne MICR encode quatre informations :
- Numéro de routage (9 chiffres aux États-Unis) — identifie l'institution financière
- Numéro de compte — identifie le compte spécifique
- Numéro de chèque — identifiant séquentiel du chèque
- Montant — ajouté après la présentation du chèque au paiement (encodage du montant de courtoisie)
Alors que la MICR gère la ligne de routage, le reste du chèque — le nom du bénéficiaire, le montant en lettres, le montant en chiffres, la date, la ligne de mémoire et la signature — repose sur l'OCR classique et l'analyse d'image. C'est là que l'IA moderne apporte une valeur ajoutée au-delà de ce que la MICR seule peut offrir.
Détection de fraude par chèque : la couche OCR
La fraude par chèque reste le problème de fraude documentaire le plus persistant dans le secteur bancaire. Le rapport 2026 du Risk Officer de la Réserve fédérale, basé sur une enquête auprès de plus de 400 professionnels du risque, révèle que 63 % des institutions financières ont subi des tentatives de fraude par chèque au cours de l'année précédente. Les vecteurs d'attaque spécifiques évoluent : 32 % des répondants signalent une augmentation des faux chèques, 21 % signalent le lavage de chèques (effacement de l'encre pour modifier le bénéficiaire ou le montant) et 18 % signalent la falsification du bénéficiaire.
Les systèmes OCR basés sur l'IA modernes détectent ces schémas grâce à l'analyse d'image de la surface du chèque :
- Reconnaissance du montant en chiffres (CAR) / Reconnaissance du montant en lettres (LAR) : Le système lit à la fois le montant numérique et le montant manuscrit et les recoupe pour vérifier leur cohérence. Toute divergence signale le chèque pour un examen manuel.
- Vérification de la signature : L'analyse d'image compare la signature sur le chèque avec la signature de référence au dossier, détectant les contrefaçons et les signataires non autorisés.
- Détection d'altération : L'analyse d'image de la surface du papier détecte les traces de lavage de chèque — résidus chimiques, fibres perturbées ou bavures d'encre indiquant que le texte original a été effacé et réécrit.
- Analyse de l'endossement : Le système vérifie le verso du chèque pour détecter des schémas d'endossement valides, garantissant que le chèque a été déposé par le bénéficiaire prévu ou son mandataire autorisé.
Les banques superposent généralement ces contrôles de fraude basés sur l'OCR à la lecture magnétique MICR, créant ainsi un pipeline de validation multi-moteur qui détecte à la fois les erreurs de codage et la fraude délibérée. Des outils comme Check Image Analysis d'Abrigo et TrueChecks d'Advanced Fraud Solutions appliquent ces techniques combinées au moment de la présentation.
La loi Check 21 (Check Clearing for the 21st Century Act, en vigueur depuis 2004) a rendu le traitement électronique des chèques — connu sous le nom de dépôt à distance (RDC) — juridiquement équivalent au traitement physique des chèques. Cela signifie que les banques peuvent traiter les images de chèques capturées par des appareils mobiles ou des scanners en agence, en s'appuyant entièrement sur la technologie OCR et MICR sans jamais manipuler le papier.
Extraction de relevés bancaires : le défi du multi-format
L'extraction de relevés bancaires est sans doute le problème OCR le plus difficile en finance — non pas parce que les caractères sont durs à lire, mais parce que la structure du document est très variable. Chaque banque présente ses relevés différemment, et ces différences ne sont pas cosmétiques. Elles influent sur la façon dont les systèmes d'extraction doivent traiter chaque page.
Pourquoi les formats de relevés bancaires résistent à l'automatisation
Un relevé bancaire n'est pas un simple tableau. C'est un document multi-zones qui comprend généralement :
- Un en-tête avec le nom du titulaire, le numéro de compte, la période du relevé, le solde d'ouverture et l'identifiant bancaire
- Un tableau de transactions avec les colonnes date, libellé, montant débit, montant crédit et solde courant
- Des zones de pied de page avec le solde de clôture, les intérêts perçus, les frais prélevés et les mentions légales en petits caractères
- Des encarts latéraux avec des offres promotionnelles, des notifications de compte ou des messages marketing
Le tableau de transactions lui-même pose le défi de l'extraction. La disposition des colonnes — quel champ va où, le nom des en-têtes de colonnes, si les débits et crédits sont dans des colonnes séparées ou une seule colonne signée — varie selon la conception du relevé de chaque banque. Et dans un même relevé de plusieurs pages, les limites des colonnes dérivent souvent de quelques pixels d'une page à l'autre, car l'en-tête de la première page (avec le logo de la banque et le résumé du relevé) prend plus de place que l'en-tête minimal de la deuxième page.
Les systèmes OCR basés sur des modèles nécessitent un modèle de mise en page distinct pour le format de chaque banque — et un modèle révisé à chaque fois que la banque met à jour la conception de son relevé. Pour un établissement financier qui traite des relevés de dizaines de banques, la maintenance des modèles devient une charge opérationnelle à temps plein.
Extraction contextuelle des pages et continuité du solde courant
Le problème technique le plus difficile dans l'OCR de relevés bancaires est de maintenir la continuité des données entre les pages. Un seul relevé peut faire 3 à 30 pages ou plus. Le tableau de transactions se scinde en travers des limites de page, chaque nouvelle page commence par un solde « reporté », et le solde courant sur une ligne donnée doit être égal au solde de la ligne précédente plus ou moins le montant de la transaction.
Si le pipeline d'extraction traite chaque page indépendamment — comme le font la plupart des outils OCR de base — il risque trois modes de défaillance :
- Lignes omises : Les transactions près de la limite de page sont complètement manquées car la coupure tombe dans un espace du tableau
- Lignes dupliquées : Le solde « reporté » de la page N est traité comme une transaction sur la page N+1, et la première transaction réelle de la page N+1 est décalée d'une ligne
- Continuité du solde rompue : La séquence du solde courant se brise à la limite de page, rendant le rapprochement impossible
Les systèmes d'extraction modernes par IA visuelle gèrent cela en maintenant un état contextuel des pages — ils lisent le document complet comme une séquence connectée plutôt que comme des pages indépendantes. Lorsque l'IA traite la ligne « reporté », elle la reconnaît comme un artefact de pagination plutôt que comme une transaction et maintient la continuité du solde courant à travers la limite.
Rapprochement intégré : ce que l'extraction doit fournir
L'objectif final de l'extraction de relevés bancaires n'est pas seulement une liste de transactions, mais un jeu de données rapproché qui réussit le contrôle de solde :
| Vérification | Ce qu'elle confirme | Pourquoi c'est important |
|---|---|---|
| Correspondance du solde d'ouverture | Le solde d'ouverture extrait correspond au solde d'ouverture indiqué | Garantit qu'aucune page n'a été sautée au début |
| Vérification de la somme des transactions | La somme des débits et crédits correspond à la variation nette indiquée | Détecte les lignes de transaction manquantes ou dupliquées |
| Enchaînement des soldes | Le solde de chaque ligne = solde précédent ± montant de la transaction | Valide chaque ligne individuellement dans l'ordre |
| Rapprochement du solde de clôture | Le solde final extrait correspond au solde de clôture indiqué | Vérification d'intégrité de bout en bout pour l'ensemble du document |
Les outils qui intègrent cette vérification de rapprochement — comme ceux dotés d'une vérification automatisée des soldes intégrée au pipeline d'extraction — détectent les erreurs avant que les données n'entrent dans le système comptable, réduisant ainsi la charge de travail manuelle de l'équipe de rapprochement.
Pour des instructions pas à pas sur la configuration de ce pipeline, consultez notre guide sur OCR pour la comptabilité : extraction de relevés bancaires et de documents financiers.
Traitement des documents KYC et de prêt : une précision sous pression réglementaire
La conformité Know Your Customer (KYC) se situe à l'intersection de la précision de l'OCR et du risque réglementaire. Lire un seul caractère de travers sur un document d'identité — confondre un '0' avec un 'O', ou mal lire un numéro de passeport — peut entraîner l'intégration d'un client qui échoue au filtrage des sanctions OFAC, ou l'incapacité à détecter une fraude d'identité synthétique. Les enjeux sont fondamentalement différents du traitement des factures.
La diversité des documents dans l’onboarding KYC
Un package d’onboarding KYC standard comprend plusieurs types de documents, chacun avec ses propres défis d’extraction :
- Pièces d’identité officielles (passeports, permis de conduire, cartes d’identité nationales) : La zone lisible par machine (MRZ) en bas est conçue pour l’OCR — elle utilise la police standard ICAO, des chiffres de contrôle et des longueurs de champ fixes. Mais la MRZ n’est qu’une partie du document ; extraire la photo, la signature et les champs de texte hors MRZ (adresse, date de naissance, autorité de délivrance) nécessite une analyse d’image complète du document.
- Justificatif de domicile (factures d’énergie, relevés bancaires, avis d’imposition) : Ces documents ne sont pas optimisés pour l’identité. Leur mise en page varie, la qualité de numérisation est aléatoire, et l’adresse peut ne pas être à un emplacement fixe. Les banques doivent extraire l’adresse, le nom et la date (pour confirmer qu’elle est récente — généralement moins de 90 jours) sans format standardisé.
- Preuves financières (fiches de paie, W-2, déclarations fiscales, relevés bancaires pour souscription) : Les documents de souscription de prêt nécessitent une extraction au niveau des champs : revenus, historique d’emploi et informations sur les actifs. Une demande de prêt commercial peut inclure 10 à 30 pages de plusieurs types de documents — et les équipes de souscription passaient auparavant 40 % de leur temps à simplement organiser les documents avant d’en extraire les données.
Pourquoi la précision au caractère ne suffit pas pour le KYC
Les fournisseurs d’OCR traditionnels citent la précision au niveau du caractère (CER) — généralement 99 % ou plus sur des documents imprimés propres. Mais dans les flux KYC, la précision au caractère est une mesure trompeuse. Un CER de 99 % sur une page de passeport de 500 caractères signifie qu’en moyenne 5 caractères sont erronés. Si l’un d’eux est un chiffre du numéro de passeport ou une lettre du nom du client, le document échoue au filtrage AML ou le compte est ouvert avec des données d’identité incorrectes qu’il faudra des mois à corriger.
La précision au niveau du champ — l’intégralité du numéro de passeport est-elle extraite correctement, et non la plupart des caractères — est la mesure pertinente pour le KYC. Les systèmes d’extraction basés sur l’IA utilisant des modèles de langage visuel comprennent le contexte : ils savent qu’un numéro de passeport suit un modèle spécifique, que des chiffres de contrôle existent pour validation, et qu’un caractère mal lu peut être signalé pour révision humaine plutôt qu’accepté silencieusement.
Les données de déploiement publiées de l’implémentation OCR de GreenNode dans le secteur bancaire vietnamien montrent que le KYC automatisé avec OCR et IA intégrés a réduit le temps de traitement de 45 minutes par dossier à moins de 5 minutes, avec un taux de traitement direct de 80 à 90 % pour les demandes standard. Les 10 à 20 % restants ont nécessité une révision humaine pour les cas particuliers — documents de mauvaise qualité, formats non standard ou champs ambigus.
Pour les banques traitant de gros volumes de demandes de prêt, le même pipeline d’extraction qui gère les documents KYC traite également les fiches de paie, les déclarations fiscales et les relevés bancaires pour la souscription — faisant d’une plateforme d’extraction unifiée pour tous ces types de documents un avantage opérationnel significatif par rapport à des outils spécialisés distincts pour chaque étape du processus.
OCR traditionnel vs. Vision IA : pourquoi l'absence de modèle est cruciale dans la banque
Les défis de traitement documentaire du secteur bancaire ne sont pas bien servis par la même approche OCR qui gère les factures et les reçus. Les documents bancaires présentent un ensemble de problèmes fondamentalement plus complexes. Comprendre pourquoi nécessite une distinction claire entre les deux générations de technologie d'extraction.
La limite de l'OCR par modèle : chaque nouveau format casse votre flux
L'OCR traditionnel — que ce soit Tesseract, ABBYY ou les API OCR cloud — fonctionne sur un modèle basé sur la position. Le système extrait tout le texte d'une page, puis utilise des règles ou des modèles pour assigner les champs en fonction de leurs coordonnées. Cela fonctionne lorsque le même format de document apparaît de manière répétée. Cela échoue quand :
- Vous traitez des relevés de plus de 50 banques différentes
- Une banque met à jour la mise en page de son relevé (ce qui arrive plus souvent que vous ne le pensez)
- Un client soumet un relevé scanné légèrement incliné ou avec une page pivotée
- Vous recevez des photos de relevés prises avec un téléphone mobile au lieu de PDF propres
Chaque changement de format nécessite une mise à jour du modèle. Chaque nouvelle banque nécessite un nouveau modèle. La gestion des modèles évolue linéairement avec la diversité des documents — et la banque est un environnement de diversité documentaire extrême.
Comment l'extraction par Vision IA résout le problème de format
L'extraction par Vision IA — utilisant de grands modèles de vision (VLM) — aborde le problème différemment. Au lieu d'extraire tout le texte puis d'essayer de le mapper aux champs attendus par position, le VLM lit le document comme le ferait un humain : de manière holistique, en comprenant la mise en page visuelle, le sens sémantique de chaque zone de texte et les relations entre les champs.
C'est la même technologie décrite dans notre guide sur ce qu'est l'OCR IA et en quoi il diffère de l'OCR traditionnel — et c'est la clé pour résoudre le défi multi-format de la banque. En pratique, cela signifie :
- Vous définissez la sortie, pas la position : Au lieu de dessiner une boîte autour de l'endroit où la colonne « Date de transaction » apparaît, vous dites simplement au système que vous voulez la Date de transaction, la Description, le Montant débité, le Montant crédité et le Solde courant. L'IA trouve ces champs n'importe où sur la page en comprenant ce qu'ils signifient.
- Une définition de colonne fonctionne pour tous les formats : Le même ensemble de noms de colonnes extrait les données d'un relevé Chase, d'un relevé Bank of America et d'un relevé de caisse d'épargne — même si l'ordre des colonnes, les noms des champs et la mise en page sont complètement différents sur chacun.
- Les changements de format ne cassent pas votre flux : Lorsqu'une banque met à jour la conception de son relevé, l'extraction continue de fonctionner car l'IA lit la nouvelle mise en page par sémantique, et non en faisant correspondre un modèle enregistré.
Ce changement de paradigme — de l'extraction basée sur la position à l'extraction basée sur la sémantique — est ce qui permet aux équipes bancaires de traiter des documents provenant de dizaines de sources sans construire et maintenir une bibliothèque toujours croissante de modèles par banque. Pour une comparaison plus large des outils d'extraction adaptés aux flux bancaires, consultez notre guide des meilleurs logiciels OCR en 2026 par catégorie et cas d'usage.
Questions fréquentes
La ROC fonctionne-t-elle sur les chèques avec montants et signatures manuscrits ?
Oui, mais la précision dépend de l'approche. La lecture MICR (ligne de routage) est magnétique et atteint des taux de lecture proches de 100 %, quelle que soit l'écriture manuscrite sur le chèque. Le montant en chiffres et le montant en lettres sont lus par ROC/analyse d'image et atteignent généralement une précision de 90 à 97 % sur les chèques manuscrits. La zone de signature est analysée pour la détection de falsification par reconnaissance de motifs, et non par ROC de caractères. Les systèmes modernes de traitement des chèques combinent ces trois techniques et signalent les divergences pour examen humain.
La ROC de relevés bancaires peut-elle traiter les relevés de banques internationales ?
La ROC basée sur l'IA peut traiter les relevés de banques de différents pays car elle lit la sémantique des champs plutôt que les positions dans un modèle. Cependant, la précision de l'extraction dépend de la variété des formats sur lesquels le modèle d'IA a été entraîné. Les formats des banques américaines, britanniques, canadiennes, australiennes et des grandes banques européennes sont bien pris en charge. Les petites banques régionales ou les banques de marchés moins numérisés peuvent montrer une précision moindre lors de la première tentative, bien que l'IA s'adapte plus rapidement que les systèmes basés sur des modèles qui nécessiteraient la création manuelle d'un modèle pour chaque nouveau format.
Quelle est la précision de l'extraction de relevés bancaires par IA par rapport à la saisie manuelle ?
Les taux de précision publiés pour l'extraction de relevés bancaires par IA vont de 95 % à 99 % sur des PDF numériques propres, et de 90 % à 95 % sur des relevés scannés ou photographiés. À titre de comparaison, la saisie manuelle a un taux d'erreur typique de 3 à 5 %, ce qui correspond à environ 3 à 5 caractères erronés pour 100 frappes. La différence est que les erreurs de l'IA ont tendance à se concentrer sur des champs ambigus (chiffres flous, descriptions de transactions complexes), tandis que les erreurs manuelles sont aléatoires. Un pipeline d'extraction robuste inclut des contrôles de rapprochement automatisés — vérifiant la cohérence du solde courant — ce qui détecte la plupart des erreurs d'extraction significatives avant qu'elles n'atteignent le système comptable.
La ROC bancaire est-elle conforme aux réglementations KYC/AML ?
La conformité est déterminée par la façon dont le système ROC est déployé, et non par la technologie ROC elle-même. Les données extraites doivent être stockées avec une piste d'audit vérifiable indiquant ce qui a été extrait, quand et par quel processus. La plupart des plateformes modernes d'extraction par IA prennent en charge la journalisation d'audit, les scores de confiance au niveau des champs (signalant les extractions de faible confiance pour examen) et le traitement sécurisé des données (chiffrement TLS, certification SOC 2). En vertu des réglementations BSA/AML (12 CFR 21.11), les banques doivent conserver des enregistrements reproductibles et auditatables — un système d'extraction par IA avec une journalisation appropriée satisfait à cette exigence plus efficacement que la saisie manuelle, qui n'a pas de piste d'audit intégrée.
Comment la ROCN KYC gère-t-elle les écritures non latines comme l'arabe, le chinois ou le cyrillique ?
Les modèles d'IA visuelle modernes sont entraînés sur des données multilingues et peuvent lire la plupart des systèmes d'écriture alphabétiques et logographiques. Pour les documents KYC, la zone MRZ des passeports utilise la police OCR-B standard ICAO avec uniquement des caractères latins, ce qui rend la zone lisible universellement. Les champs hors MRZ (nom, adresse en écriture locale) nécessitent une ROCN adaptée à la langue spécifique. Les systèmes de ROCN basés sur l'IA prennent généralement en charge plus de 30 langues et peuvent traiter l'arabe, le chinois (simplifié et traditionnel), le cyrillique, le devanagari, le hangul coréen et le kanji japonais, entre autres. Vérifiez toujours que votre fournisseur d'extraction prend en charge les écritures que vous traitez.
Quels champs extraire d'un relevé bancaire pour le rapprochement ?
L'ensemble standard de champs pour le rapprochement bancaire comprend : Numéro de compte, Début/Fin de période, Solde d'ouverture, Solde de clôture, et pour chaque transaction — Date de transaction, Description, Montant débité, Montant crédité et Solde courant. Champs facultatifs mais utiles : Numéro de référence/chèque, Type de transaction (DAB, virement, transfert, dépôt, frais) et Nom du bénéficiaire/émetteur si disponible. La plupart des outils d'extraction par IA vous permettent de définir ces champs comme noms de colonnes, et le système les remplit automatiquement depuis n'importe quel format de relevé.
Un même outil ROCN peut-il traiter les chèques, relevés bancaires et documents KYC ?
Une plateforme d'extraction IA unifiée — notamment basée sur des modèles de langage visuels — peut traiter ces trois types de documents sans changer d'outil. Le traitement des chèques utilise la reconnaissance MICR pour la ligne de routage et l'analyse d'image pour la surface du chèque. Les relevés bancaires utilisent une extraction adaptée aux tableaux pour les transactions. Les documents KYC utilisent la lecture MRZ pour les pièces d'identité officielles et l'extraction générale de champs pour les justificatifs de domicile et de revenus. La condition clé est que l'outil prenne en charge l'Extraction de colonnes personnalisées : vous définissez les colonnes souhaitées, et l'IA localise les données correspondantes en comprenant la sémantique des champs, quel que soit le type ou le format du document.