est l'outil d'imagerie de documents primaires. Il est un dispositif qui convertit les images en papier, texte imprimé, l'écriture ou même un objet comme un ornement en une image numérique.
Un scanner lit couleur rouge-vert-bleu (RVB) des données et ces données sont ensuite traitées avec l'algorithme de le scanner pour faire des ajustements pour les différentes conditions d'exposition. La qualité d'image dépend de la profondeur de couleur, la résolution, et la gamme de densité, ainsi que la qualité de l'algorithme. La poursuite des recherches a affiné l'algorithme dans la mesure où les images peuvent désormais être mieux que les originaux.
OCR
ou reconnaissance optique de caractères est une technologie pour convertir des images de documents de texte en texte lisible par machine. Même si un degré élevé de précision a été réalisé dans la reconnaissance imprimés ou dactylographiés texte, la capacité à reconnaître les différents types d'écriture est toujours examen imperfect.A humaine est habituellement nécessaire pour assurer 100 pour cent de précision des systèmes de document.Computer convertis stocker les numérisée des images de documents, convertis en texte lisible par machine, dans leurs dépôts.
Mais comment peut-aucun de ces documents particuliers récupérer rapidement? Lorsque le nombre de documents est quelques-uns, ce ne serait pas un tel problème. Toutefois, lorsque ce nombre se heurte à des milliers, voire des millions, de trouver un document particulier ne fait devenir un problem.It est ici que indexation
est dans l'image. Les données d'index attachés aux documents permettent requêtes de style recherche-moteur à effectuer pour trouver des documents spécifiques parmi la masse de l'indexation documents.
Search moteur stockée peut être aussi simple que indexation de texte intégral - où chaque mot dans un document est indexé mot-clé ou une étiquette --ou indexation où seuls quelques étiquettes attachées au document sont indexés. Ces balises sont sélectionnés pour identifier correctement le contenu de l'indexation document.Tag suppose que tous les tags pertinents seront attachés à chaque document.
Si cela est pas le cas, le document ne pourrait pas être trouvé, même lorsqu'elles sont pertinentes pour