Other numérisées de nettoyage comprennent:
Ceux-ci et d'autres outils de nettoyage peut être automatisé en spécifiant minimum et /ou tailles maximales des éléments à être enlevés.
Tâches principales de traitement d'image
Dans le cas de documents de texte, l'imagerie documentaire produit des images que les humains peuvent lire, mais machines ne peuvent pas. Pour rendre ces documents interrogeables en utilisant les mots tapés, les caractères de texte sur les images doivent être convertis en une conversion des format.This lisibles par machine est faite en utilisant des technologies telles que l'OCR (Optical Character Recognition) et ICR (reconnaissance intelligente de caractères).
Même les caractères imprimés à la main peuvent être reconnus dans une certaine mesure par ces technologies.This type de conversion est également nécessaire dans le but de rendre les images de documents editable.Once les images de documents texte ont été faites lisible par machine, la prochaine, document type processus d'imagerie est de les indexer. L'indexation rend les documents consultables. L'indexation de texte rend consultable par n'importe quel mot dans l'indexation document.
Full texte prend beaucoup d'espace de stockage et une alternative est à l'index par les balises meta et descriptions. Les tags sont des mots qui caractérisent le contenu du document. Descriptions donnent de brefs résumés du traitement contenu.Procédé les images de documents peut aller encore plus loin. Basé sur les spécifications programmées, les documents peuvent être classés et stockés en bref, le document de traitement d'image de repositori