OCR reconnaît, convertit, modifie et imprime pour vous vos documents papiers et électroniques (magazines, journaux, faxes et fichiers PDF, images…) en conservant parfaitement la mise en page d’origine.
Il peut être utilisé pour les applications suivantes :
• Applications d'archivage et de traitement de documents,
• Systèmes de contrôle et de vérification,
• Systèmes de conversion de documents,
• Applications de traitements de faxes,
• Application de traitement de formulaires (structurés ou non
structurés),
• Application de création de gestion de contenu,
• Systèmes de publication Web,
• Application d'archivage intranet,
• Solutions Media clipping,
• Systèmes de lecture ou de "voice-playback".
OCR offre la haute précision requise par les applications de gestion de documents d'aujourd'hui. OCR enregistre les résultats de l’OCR aux formats Word, Excel, PDF, RTF, HTML (pour la publication sur le web) et exporte maintenant vers Word 2003 XML, PowerPoint 2000 et XP.
Les Langues reconnues par l'OCR d'OCR (Reconnaissance machine) :
• 177 langues avec caractères latins, cyrilliques et grecs.
• 34 langues naturelles avec dictionnaires ; anglais, français, allemand, allemand (nouvelle orthographe), italien, espagnole, portugais, portugais (brésilien), néerlandais, néerlandais (belge), suédois, norvégien (bokmal), norvégien, (nynorsk), danois, finlandais, russe, estonien, letton, lithuanien, polonais, tchèque, slovaque, hongrois, bulgare, roumain, croate, grec, turc, ukrainien, arménien (est), arménien (grabar), arménien (ouest), tatar, catalan
• 4 langues artificielles : espéranto, ido, interlingua, occitan ;
• 6 langages de programmation : Basic, C/C++, COBOL, Fortran, Java,
Pascal;
• Polices spéciales pour I industrie et les banques : OCR-A, OCR-B, et
MICR (E13B);
• Formules chimiques simples ;
• Chinois traditionnel, chinois simplifié ;
• Japonais.
Langues ICR (Reconnaissance manuscrite)
• 15 langues avec caractères latins : tchèque, néerlandais, néerlandais
(belge), anglais, finlandais, français, allemand, allemand (nouvelle orthographe), italien, lithuanien, roumain, polonais, slovaque, espagnole, turc ;
• 3 langues avec caractères cyrilliques : bulgare, russe, ukrainien ; toutes disponibles à la demande.
Environnements de développement :
• Microsoft Visual C++ 4.x et supérieur,
• Microsoft Visual Basic 5.0 et supérieur ;
• Microsoft Visual Studio.NET (VB.NET et C#);
• Borland Delphi 5.0 et supérieur ;
• Tout autre outil de développement qui prend en charge les objets COM et Active X correctement.
Formats d'exportation de texte :
• RTF;
• PDF (image seulement, texte et image, texte par-dessus l'image et texte
sous l'image) ;
• TXT(8-bit, Unicode),
• HTML(8-bit, Unicode) ;
• XLS ;
• CSV (8-bit, Unicode) ;
• DBF ;
• PPT.
Formats d'importation des images :
• BMP: noir et blanc, niveaux de gris, couleurs ;
• PCX, DCX: noir et blanc, niveaux de gris, couleurs ;
• JPEG: niveaux de gris, couleurs ;
• JPEG 2000: niveaux de gris, couleurs ;
• PNG: noir et blanc, niveaux de gris, couleurs ;
• TIFF: noir et blanc - non comprimé, CCITT3, CCITT3Fax, CCITT4, Packbits; niveaux de gris non comprimé, Packbits, JPEG; couleurs - non comprimé et JPEG; multi-page
• PDF.
Types de codes barres :
• Check Code 39;
• Check Intercalé 25;
• Code 1 28;
• Code 39;
• EAN 13;
• EAN 8;
• Intercalé 25,
• CODABAR (sans somme);
• UCCCode128;
• Code 2 de 5 (Industriel, IATA, Matrice),
• Code 93;
• UPC-A;
• UPC-E;
• Postnet;
• 2D: PDF 41 7.
OCR possède un ensemble d'outils sophistiqués comme : des algorithmes de pré traitement de l'image, des classificateurs de reconnaissance, des modèles et des analyses de documents multi-niveaux (MDA).
Les analyses MDA de données déterminent les meilleurs résultats possibles en pesant et vérifiant les hypothèses proposées.
L'analyse MDA combine une variété de classificateurs -ou de moteurs de reconnaissance - pour analyser les données à des niveaux multiples - page, tableau, cellule, paragraphe, image, ligne, mot, caractère, en analysant non seulement un objet spécifique mais aussi le contexte dans lequel il apparaît.
, gestion electronique document, , indexation documents, traitement document, traitement documents, archivage documents, numerisation documents, traitement texte, traitement textuel, traitement document, traitement documents, traitement image, traitement images