OCR (reconnaissance optique de caractères) est le processus par lequel le type écrite, imprimée ou manuscrite est convertie en forme lisible par machine. Ici, nous devons saisir les fichiers numérisés dans le format de fichier PDF pour la conversion. Le processus OCR a commencé en 1950 qui a modifié à plusieurs reprises et a obtenu la structure du style actuel. Il est principalement utilisé dans les forces armées des États-Unis d'Amérique. Ce que nous pouvons dire invention importante dans le domaine des technologies de l'information.
À l'heure actuelle aussi OCR est un défi sujet de recherche avec beaucoup d'applications commerciales. OCR peut être utilisé dans des applications commerciales comme la recherche du livre et de l'indexation, la conversion de documents et aussi pour la reconnaissance de l'adresse postale.
Analyse structurale et pattern matching est la voie initiale ou primaire pris pour traitement OCR. Dans ces images de différentes formes peuvent être facilement convertis en un format lisible par la machine facilement.
Dans le stade de début de l'invention OCR n'a été utilisé que pour la police spécifique uniquement. Mais maintenant, il peut reconnaître les caractères de toutes les polices disponibles dans la langue. Aussi quelques-uns de disponibles aujourd'hui le célèbre logiciel OCR comprennent ocrad, ABBYY Fine Reader, Tesseract aussi Brainware. Parmi ceux-ci ABBYY et Tesseract sont légèrement différent des autres. Ces deux peuvent offrir un soutien multi-langue. Principal avantage, nous pouvons voir ici est sa compatibilité pour convertir facilement des fichiers PDF.
La plupart des logiciels OCR sont autorisés et peut donner une sortie PDF dans un format de document texte standard. En outre, ils acceptent différents types de formats d'image qui sont courantes de nos jours tels que JPEG, GIF et TIFF. La plupart du ROC disponibles aujourd'hui est spécialement conçu pour certaines langues spécifiques. Ce que nous pouvons dire adaptée à des fins spéciales seulement.
En outre, certains de sortie de l'offre de logiciels OCR fichiers prêts à télécharger immédiatement, sans attendre plus de temps ou de soumettre adresse e-mail et pour attendre des données converties.