09mar 2008
Évitez les URL multiples et le contenu dupliqué
16:12 - Par Thierry Geindre - Référencement - aucun commentaire
L'un des points nuisant au référencement est le contenu dupliqué ou duplicate content dans le jargon. En effet, plusieurs pages ayant le même contenu sur un même site pénalisent le référencement de ce site. Malheureusement, on trouve très souvent sur un seule site plusieurs URL permettant d'accéder à la page d'accueil. Comme http://www.lesite.com/, http://lesite.com/ ou encore http://www.lesite.come/index.php etc. Nous allons voir comment régler ce problème.
Plusieurs solutions sont disponibles pour régler ce problème mais toujours du côté du serveur. Nous allons voir le cas d'apache.
Il est généralement possible de personnaliser le fonctionnement d'Apache pour un répertoire en particulier en plaçant un fichier .htaccess dans ce répertoire. Il suffira alors d'indiquer dans ce fichier de rediriger le visiteur vers la bonne URL lorsque celle qu'il utilise ne nous satisfait pas.
Pour cela, il faudra d'abord déterminer l'URL que l'on souhaite utiliser. On choisira www.le-site.com, c'est à dire l'URL contenant le www car c'est la forme la plus connu et la plus employée.
Nous allons donc créer un fichier nommé .htaccess. Pour ce faire, il suffit d'ouvrir un éditeur de fichiers texte et d'enregistrer le fichier créé sous ce nom. A noter que sous Windows, il n'est pas possible de créer des fichiers portant ce nom. Vous pourrez le renommer une fois présent sur votre FTP ou exploiter la commande rename qui autorise ce genre de nom. Placez dans ce fichiers les lignes suivantes :
# Activation du moteur de réécriture d'URL
RewriteEngine On
# On insère une condition de réécriture
# Si le nom de serveur indiqué ne commence
# pas par www
RewriteCond %{SERVER_NAME} !^www
# Nous allons rediriger le visiteur vers le site avec
# les www
RewriteRule ^(.*)$ http://www.le-site.comg/$1 [R=301,L]
Avec ces lignes, n'importe quelle page à laquelle un client accède via un nom de serveur sans les www sera automatiquement redirigé vers la même page mais avec le bon nom de serveur. D'autre part, vous aurez peut être remarqué que l'erreur 301 est renvoyée au client. Elle signifie Has moved permanently, et indique aux clients, les moteurs de recherche en particulier, que la page demandée a définitivement été déplacé vers la nouvelle adresse indiquée.
aucun commentaire
Fil des commentaires de ce billet