*   >> Lecture Éducation Articles >> tech >> Internet

Comment Google fonctionne?

e l'index, Google continue recrawls pages Web fréquemment populaires évolue à un rythme à peu près proportionnelle à la fréquence les pages changent. De telles analyses maintenir un courant d'indice et sont connus comme les analyses frais. Pages de journaux sont téléchargés quotidiennement, des pages avec des cotations boursières sont téléchargés beaucoup plus fréquemment. Bien sûr, les analyses frais reviennent moins de pages que le crawl profonde.

La combinaison des deux types d'analyses Google permet à la fois à faire une utilisation efficace de ses ressources et de garder son indice raisonnablement actuelle. 2. Indexer Googlebot de Google donne l'indexeur le texte complet des pages qu'il trouve. Ces pages sont stockées dans la base de données de l'index Google. Cet indice est triée par ordre alphabétique terme de recherche, avec chaque entrée d'index mémoriser une liste de documents dans lesquels le terme apparaît et l'emplacement dans le texte où il se produit.

Cette structure de données permet l'accès rapide à des documents qui contiennent des termes de requête de l'utilisateur. Pour améliorer les performances de recherche, Google ignore (ne) de l'index des mots communs appelés mots vides (comme le, est, sur, ou, de, comment, pourquoi, ainsi que certains chiffres et lettres simples). Mots d'arrêt sont si fréquents qu'ils font peu pour affiner une recherche, et donc ils peuvent en toute sécurité être jetés.

L'indexeur ignore également certains signes de ponctuation et les espaces multiples, ainsi que la conversion de toutes les lettres en minuscules, pour améliorer les performances de Google. 3. Processeur de requêtes de Google Le processeur de requêtes a plusieurs parties, y compris la (zone de recherche) de l'interface utilisateur, le «moteur» qui évalue les requêtes et les associe aux documents pertinents, et les résultats formateur. PageRank est le système de Google pour le classement des pages web.

Une page avec un PageRank plus élevé est considéré comme plus important et est plus susceptible d'être énumérés ci-dessus une page avec un PageRank plus faible. Google considère plus d'une centaine de facteurs dans le calcul d'un PageRank et de déterminer quels sont les documents les plus pertinents pour une requête, y compris la popularité de la page, la position et la taille des termes de recherche dans la page, et la proximité des termes de recherche à l'autre sur la page.

Google applique également des techniques d'apprentissage automatique pour amé

Page   <<  [1] [2] [3] [4] >>
Copyright © 2008 - 2016 Lecture Éducation Articles,https://lecture.nmjjxx.com All rights reserved.