Vous avez un projet digital ? : 0262 78 03 01
  •  | 
Qu'est-ce que le fichier Robots.txt ?

Quand faut-il éviter d'utiliser Robots.txt ?

Robots.txt n'est pas l'outil à utiliser dans toutes les situations. Dans certaines circonstances, vous devez éviter de l'utiliser. Vous avez peut-être entendu dire que les pages dupliquées peuvent être corrigées avec un fichier robots.txt, mais cette affirmation est largement dépassée. Vous devriez plutôt utiliser une balise canonique.

Cela vous permettra de conserver la page dupliquée et de préserver l'équité des liens. Si une page Web n'est plus utilisée, vous ne devriez pas utiliser robots.txt pour remédier à la situation. Utilisez plutôt une redirection 301 afin d'envoyer vos utilisateurs vers la bonne page Web.

Si un site Web ne souhaite pas que sa page apparaisse dans les SERP mais veut préserver son capital de liens, optez pour une balise noindex au lieu d'un fichier robots.txt.

Illustration représentant un robot
contacter l'équipe Fairview Communication

Qu'est-ce que le fichier Robots.txt ?

Le fichier robots.txt est un document texte utilisé pour donner des directives aux robots et araignées des moteurs de recherche sur la manière d'explorer et d'indexer les pages après la création de site Web. Pourquoi le fichier Robots.txt est-il important ? Le fichier Robots.txt est un outil important à utiliser pour un site internet et il a plusieurs fonctions différentes.

Il s'agit d'un moyen efficace de contrôler le budget d'exploration (crawl budget). En empêchant l'exploration de certaines sections créés lors du développement d'un site Web, les robots de Google peuvent diriger leurs efforts vers des sections plus importantes de votre site web à la réunion. Il est également important d'utiliser le fichier robots.txt afin d'empêcher l'indexation des pages de résultats de recherche internes ou d'autres pages que vous ne souhaitez pas voir apparaître dans les SERP, comme les pages de connexion.

Le fichier robots.txt est également utile si vous devez masquer des pages réalisées lors de la conception d'un site web en cours de construction afin que votre public ne les voie pas avant qu'elles ne soient prêtes.

À quoi devez-vous faire attention ?

Si le fichier robots.txt est un outil utile, il présente néanmoins des inconvénients. S'il permet aux webmasters à la réunion ou ailleurs d'empêcher l'exploration de certaines pages, il n'empêche pas nécessairement les URL d'apparaître dans les SERP.

Pour cela, vous devez utiliser une balise noindex. L'utilisation d'un fichier robots.txt par un développeur sur une page Web empêche également la propagation de l'équité des liens sur cette page. En outre, si la sécurité d'un site Web n'est pas à la hauteur, les attaquants peuvent utiliser le fichier robots.txt pour découvrir des données privées.

Il y a quelques autres éléments que vous devez prendre en considération lorsque vous choisissez d'utiliser robots.txt. Faites très attention lorsque un informaticien apportez des modifications à robots.txt, une petite erreur peut avoir un impact important et rendre certaines sections de votre site inindexables. N'utilisez pas robots.txt pour bloquer les données sensibles dans les SERPs car elles peuvent toujours être indexées, utilisez plutôt une balise noindex. Veillez à placer le fichier robots.txt sur les bonnes sections choisies lors de la construction du site Web.

Vous ne voulez pas bloquer l'indexation de pages essentielles. Veillez à ajouter l'emplacement de votre sitemap dans le fichier robots.txt. Pour vous assurer que votre fichier robots.txt est accessible, placez-le dans le répertoire racine de votre site Web.