
Mistral lance OCR 4, une IA capable de déchiffrer les manuscrits et 170 langues
Publié le 24 juin 2026 à 11h41 Tech Intelligence artificielle Mistral lance OCR 4, une IA capable de déchiffrer les manuscrits et 170 langues Lire 170 langues 3 min Julien Cadot Julien Cadot 3 min 3 min Julien Cadot...
Anthropic — What company has the best second artificial intelligence model at the end of June?
Un progrès notable façonne le secteur de l’IA : Publié le 24 juin 2026 à 11h41 Tech Intelligence artificielle Mistral lance OCR 4, une IA capable de déchiffrer les manuscrits et 170 langues Lire 170 langues 3 min Julien Cadot Julien Cadot 3 min 3 min Julien Cadot Julien Cadot Ne plus voir cette pub Lecture Zen Résumer l'article Résumé de l'article Résumé par IA, vérifié par Numerama ? Nous générons pour vous un résumé de l’article grâce à une IA et nous le vérifions afin de nous assurer qu’il n’y ait aucune erreur, pour garantir l’authenticité de l’info. En savoir plus OCR 4 de Mistral promet de restituer la structure complète des documents — cadres, tableaux, signatures et notes manuscrites — au‑delà d’une simple transcription de texte.
Le modèle prend en charge 170 langues, y compris des langues peu documentées, ce qui le rend pertinent pour les corpus historiques et les manuscrits. Ciblé sur la numérisation massive d’archives et de formulaires administratifs, OCR 4 mise sur l’auto‑hébergement pour répondre aux besoins de confidentialité des organisations. OCR 4 de Mistral promet de restituer la structure complète des documents — cadres, tableaux, signatures et notes manuscrites — au‑delà d’une simple transcription de texte.
Détails techniques
Le modèle prend en charge 170 langues, y compris des langues peu documentées, ce qui le rend pertinent pour les corpus historiques et les manuscrits. Ciblé sur la numérisation massive d’archives et de formulaires administratifs, OCR 4 mise sur l’auto‑hébergement pour répondre aux besoins de confidentialité des organisations. Recevez tous les soirs un résumé de l’actu importante avec Le Récap’ Mistral met jour son IA de lecture de documents (OCR) et la pousse vers les manuscrits et les langues rares.
Derri re l'outil pour d veloppeurs, l'enjeu est tr s concret : num riser des montagnes d'archives, jusque dans nos administrations. Un document n'est pas qu'un bloc de texte parfaitement ordonn , dans un format bien lisible : il a une mise en page, des tableaux, des signatures, parfois une note griffonn e dans la marge ou des caract res devenus illisibles avec le temps. Ces subtilit s propres l' re du papier qui n'est d finitivement pas derri re nous (coucou les expats qui doivent remplir leurs imp ts au stylo), c'est exactement ce que Mistral dit vouloir faire comprendre sa nouvelle IA, OCR 4, pr sent e le 23 juin 2026.
Le fran ais ne se contente plus de transformer une page scann e en texte, il cherche en restituer la structure. L'OCR, en pratique, (reconnaissance optique de caract res) existe depuis des d cennies et n'a pas eu besoin de l'IA pour se d mocratiser. La nouveaut ici tient au niveau de d tail.
D'apr s le blog sp cialis MarkTechPost, OCR 4 localise chaque bloc d'une page avec des cadres de d tection, le classe par type (titre, tableau, quation, signature) et attribue un score de confiance chaque mot. Ainsi, le syst me qui re oit le r sultat sait non seulement ce qui est crit, mais o a se trouve et quel point la machine est s re d'elle.
Cette avancée envoie des signaux importants sur l’avenir du secteur, et le monde de la tech observe attentivement.





