Outils

Moteur de recherche, comment ça marche ?

Aussi appelé search engine en anglais, les moteurs de recherche sont des applications qui permettent d’effectuer des recherches sur le web.

Aussi appelé search engine en anglais, les moteurs de recherche sont des applications qui permettent d’effectuer des recherches sur le web. Les résultats des recherches apparaissent en fonction de mots-clés utilisés par l’utilisateur.

Cet outil parcourt un grand nombre de ressources telles que des sites internet, des articles, des images ou des vidéos afin d’apporter une réponse aux requêtes des utilisateurs. Tous les moteurs de recherche ne se valent pas puisque certains possèdent moins de ressources et de volume d’informations que d’autres. Les réponses apportées varient donc beaucoup d’un moteur de recherche à un autre.

Les métamoteurs de recherche

Il existe également des métamoteurs de recherches qui sont des sites web qui permettent de de fusionner les résultats de plusieurs moteurs de recherche. Ils permettent ainsi d’obtenir des résultats plus nombreux en une seule recherche. 


Le fonctionnement d'un moteur de recherche

Lorsqu’une recherche sur le web est effectuée, le moteur de recherche fonctionne d’une façon spécifique afin d’apporter la réponse la plus pertinente possible.

Les crawlers

D’abord, un moteur de recherche se sert de robots appelés des crawlers qui ont pour mission de parcourir internet afin de récolter un maximum de données pour ensuite les stocker dans des bases de données afin d’être traitées. Pour cela, ces crawlers parcourent le contenu des pages web page par page en récupérant les données html incluses dans celles-ci mais aussi en suivant tous les hyperliens trouvés sur ces pages.

Indexation

À l’issu de cette étape, toutes les informations récupérées sont ensuite stockées dans l’index du robot pour passer à la phase d’indexation. L’objectif étant d’organiser les données récoltées.

Le système d’indexation extrait principalement des données textuelles en récupérant des mots-clés considérés comme significatifs et recense leur position dans un texte ou une page. Il permet de connaître le nombre d’apparition d’un mot dans une page comparé à d’autres pages. Plus un mot significatif apparaît sur une page, plus elle a de chance d’être bien classée dans les résultats de recherche.

Néanmoins, l’ajout abusif de mots-clés afin d’améliorer sans classement est pénalisé par Google par exemple. Aussi, les index possèdent des mots non significatifs nommées « mots vides » ainsi que des « skip words » qui désigent des mots régulièrement utilisés mais non indexés car leur usage est très commun. C’est le cas de petits mots comme « le » ou « la » par exemple.

Tri des données

Cependant, sur le web, des millions de pages possèdent souvent les mots-clés recherchés. Ils doivent donc aussi être trier pour fournir une réponse pertinente et un algorithme est chargé de ce tri. Pour cela, plusieurs critères sont utilisés même s’ils peuvent changer d’un moteur de recherche à un autre :

-     La pertinence : les mots-clés sont triés en fonction de leur nombre d’apparition mais aussi de leur position dans le site web (titre, url, corps du texte etc.). Chaque mot est associé à un poids qui témoigne de son importance. Les champs lexicaux proches des mots-clés sont aussi étudiés.

-     La popularité : De nombreux moteurs de recherche considèrent que l’information contenu dans un site populaire est pertinente. Ainsi, si un site web obtient une bonne note en étant beaucoup cité via des liens sur le web, sa popularité augmente. La logique est la même avec le nombre de clic sur un site, plus un site enregistre de visite, plus sa popularité augmente car son contenu est considéré comme de qualité.

Il existe aussi pour certains moteurs de recherche des critères alternatifs tels que la position géographique de l’utilisateur ou son historique de recherches.

Les algorithmes utilisés sont donc mis à jour et affinés très régulièrement pour améliorer la pertinence des résultats car le web évolue très rapidement.


 Google et ses alternatives

Il existe de nombreux moteurs de recherche, néanmoins Google est le moteur de recherche le plus utilisé dans le monde. Ce dernier tente d’améliorer les résultats de ses recherches de façon très régulière.

Dernièrement l’ajout de la fonction temps réel permet d’intégrer les résultats de recherche des réseaux sociaux mais aussi des blogs grâce à des mises à jour instantanées. En effet, avant, plusieurs minutes à plusieurs heures pouvaient être nécessaires pour que de nouvelles pages soient indexées. Cependant, ceci ne signifie pas pour autant que Google est le meilleur moteur de recherche.

Ils en existent des plus ou moins récents qui fonctionnent de façon différente afin de répondre à de nouveaux besoins exprimés par les utilisateurs. Un marché des moteurs de recherche alternatifs à google est donc apparu.

Par exemple, de nombreux utilisateurs expriment leur inquiétude quant à l’utilisation de leurs données personnelles. En effet certains moteurs de recherche tracent les utilisateurs en collectant des adresses ip, des cookies, des historiques de recherches etc. C’est pour cette raison que l’américain DuckDuckGo ou le moteur de recherche français Qwant se sont développés. Ils permettent de surfer sur le web en protégeant sa vie privée puisqu’ils ne stockent pas d’information personnelle.

Un autre moteur de recherche assez populaire est Ecosia. Ce moteur de recherche propose une alternative écologique en reversant 80% de ses bénéfices à des programmes de reforestation. Il propose ainsi la plantation d’arbres à travers le monde générée par les recherches effectuées.


 Conclusion

Finalement, les moteurs de recherche actuels peuvent faire penser à des systèmes de questions / réponses instantanés mais leur mise en place demande un travail lourd avec le développement de robots et d’algorithmes permettant de rendre les réponses les plus pertinentes possibles. Même si Google reste le plus utilisé, la liste de moteurs de recherche alternatifs à Google s’agrandit de jour en jour car de nouveaux besoins ou de nouvelles envies des utilisateurs apparaissent.

Latest Articles

View All

Hotjar, découvrez comment naviguent vos visiteurs ?

Vous souhaitez optimiser votre site internet et améliorer votre expérience utilisateur, ça tombe bien, de nombreux outils d'analyse sont aujourd'hui accessibles sur le marché au plus grand nombre (Crazy egg, realeye.io, ).

March 5, 2021

Boîte à outils digitale: Les indispensables

Voici enfin notre listes des meilleurs outils qui vous permettrons d'améliorer vos process, d'augmenter vos revenus, de générer plus de leads, de créer vos landing page et j'en passe.

March 5, 2021

SEO, un canal d’acquisition de leads fortement sous-estimé

Le canal d’acquisition est le biais par lequel un client ou un prospect est entré en contact avec votre marque, votre produit.

March 5, 2021