Vous n'êtes pas identifié.

Annonces

Les pages de ce Forum sont exploitables par les Navigateurs FireFox, Google Chrome, Opera, Safari, Konqueror, Netscape & MSIE.

#1 [↑] [↓]19/02/2007 00:14:23

Crazy
Super Admin azimuté
Crazy
Lieu: Terre - Système solaire
Date d'inscription: 10/04/2006
Messages: 5712
Site web

Eviter le Duplicate Canonique

Suite à un Post de Jan, sur "Autre Forum", je vous donne ici les recettes à mettre en oeuvre dans vos .htaccess.
Elles vous éviteront les désagréments du Duplicate Canonique (sur les URLs avec ou sans le www.)

Si :
http://www.crazy.concours-seo.fr/ est valide
Idem pour
http://www.global-pink-hat-warming.org.uk/
Et pour
http://beast-number.net/

L'usage veut que l'on écrive :
www.domaine.tld[.sur-tld]
Ou
sous-domaine.domaine.tld[.sur-tld]

Cela dit, les URLs avec www. devant un sous-domaine sont tout a fait valides
Et les Moteurs savent très bien les associer à l'URL sans le www. devant.

Autre URL valide : http://google.fr/ (duplicate ?)
Idem pour : http://cigiema.fr/ (il y a duplicate !)

Cas du Domaine
Pour que cela soit bien sûr, mettre dans le .htaccess de la racine (remplacer domaine.tld par votre site) :

Code :

#
RewriteCond %{HTTP_HOST} ^domaine.tld$
RewriteRule ^.*$ http://www.domaine.tld%{REQUEST_URI} [R=301]
#

Cas du Sous-Domaine
Il convient de faire exactement l'inverse pour un sous-domaine
(à mettre dans le .htaccess du répertoire dans lequel sont les fichiers du sous-domaine) :

Code :

#
RewriteCond %{HTTP_HOST} ^www.ssd.domaine.tld$
RewriteRule ^.*$ http://ssd.domaine.tld%{REQUEST_URI} [R=301]
#

smile
Alain AKA Arma

PS : ne pas oublier le "RewriteEngine On" avant ! big_smile

PPS : tld = Top Level Domain (com, fr, org, net, info, biz, be, us, pl, etc.), ssd = Sous-Domaine


Je suis Bon (avec un grand C) et Immortel... Jusqu'à preuve du contraire ! - I never die...
Chocoku - Sorcier Glouton - Tiger l'Osmose
MSnBetter ThanGoogle - Black Hattitude

I remember and I feel free! - I am the Bleeder of the Lambs!

Hors ligne

 

#2 [↑] [↓]19/02/2007 01:53:00

SinusCom
Membre Plus
SinusCom
Lieu: #include <maison.h>
Date d'inscription: 14/02/2007
Messages: 230
Site web

Re: Eviter le Duplicate Canonique

Merci smile

Quelque chose a ne pas negliger


Le BloG | Advertisius
Actu[EN] | Entraide webmasters
Ad augusta per angusta

Hors ligne

 

#3 [↑] [↓]19/02/2007 02:16:35

rgo74
Ami des Alpages
rgo74
Lieu: Toute la Haute Savoie
Date d'inscription: 17/05/2006
Messages: 911
Site web

Re: Eviter le Duplicate Canonique

Alors si je vous ai bien suivi --> Moi je mets tous en www, parceque je savais pas pour les sous domaines et que je me dis que ces www sont rentrés dans les moeurs et que l'internaute tape -www.nomdedomaine.tld !
+ --> http://www.google.fr/webmasters/ et là je dis à Google suite à ses propositions **=

Si les URL www.la-haute-savoie.com et la-haute-savoie.com pointent vers le même site, vous pouvez nous indiquer ici une méthode d'affichage des URL dans notre index.

**Afficher les URL de la manière suivante : www.la-haute-savoie.com (valable pour les URL de types www.la-haute-savoie.com et la-haute-savoie.com)

Afficher les URL de la manière suivante : la-haute-savoie.com (valable pour les URL de types www.la-haute-savoie.com et la-haute-savoie.com)

Ne pas établir d'association

Remarque : Une fois vos préférences spécifiées, il peut s'écouler un certain temps avant que ces modifications apparaissent dans notre index. Nous ne garantissons pas l'affichage de vos URL au format que vous avez sélectionné, mais nous tiendrons compte de ce choix pour améliorer notre service d'indexation.

A suivre... P****n je viens de m'apercevoir que -http://la-haute-savoie.com n'est pas configuré wacko


Hors ligne

 

#4 [↑] [↓]19/02/2007 07:46:38

Crazy
Super Admin azimuté
Crazy
Lieu: Terre - Système solaire
Date d'inscription: 10/04/2006
Messages: 5712
Site web

Re: Eviter le Duplicate Canonique

C'est aussi bien !
Cela evite ce genre de PB...
Laisse donc en www.
wink
Alain AKA Arma


Je suis Bon (avec un grand C) et Immortel... Jusqu'à preuve du contraire ! - I never die...
Chocoku - Sorcier Glouton - Tiger l'Osmose
MSnBetter ThanGoogle - Black Hattitude

I remember and I feel free! - I am the Bleeder of the Lambs!

Hors ligne

 

#5 [↑] [↓]19/02/2007 16:30:30

pagetronic
Big Boss Ajax
pagetronic
Lieu: skynet.mars
Date d'inscription: 19/04/2006
Messages: 374
Site web

Re: Eviter le Duplicate Canonique

Je préfere ca bleh

Code :

RewriteCond %{HTTP_HOST} !^www.site.tld$ 
RewriteRule ^(.*) http://www.site.tld/$1 [QSA,L,R=301]

Ca évite souvent des problemes...
http://xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx … foot.info/
Mais chez ovh les sous ndd sont limité à 10 donc vous l'avez pas le problème wink

PS : http://seosphere.com/ quand je te dis wink ...

Dernière modification par pagetronic (19/02/2007 16:31:00)



Hors ligne

 

#6 [↑] [↓]22/02/2007 16:06:55

SinusCom
Membre Plus
SinusCom
Lieu: #include <maison.h>
Date d'inscription: 14/02/2007
Messages: 230
Site web

Re: Eviter le Duplicate Canonique

Si certains préférent les www y'en a d'autres qui n'aiment pas donc je profite pour vous donner ces 2 lignes qui forcent la suppression des www wink

Code :

# Rewrite www.domain.com to domain.com
RewriteCond %{HTTP_HOST} ^www\.(.*)
RewriteRule ^(.*) http://%1/$1 [R,L]

Le BloG | Advertisius
Actu[EN] | Entraide webmasters
Ad augusta per angusta

Hors ligne

 

#7 [↑] [↓]22/02/2007 17:15:28

Dievochka
Щефка
Dievochka
Lieu: entre orteils et cheveux
Date d'inscription: 31/08/2006
Messages: 1124
Site web

Re: Eviter le Duplicate Canonique

Dans les outils webmaster de Google il existe une option "domaine favori"
Explications données à ce sujet par Google :

Qu'est-ce qu'un domaine favori ?

Votre domaine favori (parfois également qualifié de domaine canonique) est celui qui doit servir à l'indexation des pages de votre site. Les liens pointant vers votre site peuvent utiliser l'un des deux formats, avec ou sans www (http://www.exemple.com et http://exemple.com par exemple). Le domaine favori correspond à la version que vous souhaitez voir apparaître dans les résultats de recherche associés à votre site.

Le fait de définir votre nom de domaine favori peut nous aider à déterminer plus précisément le classement PageRank de votre site.

Comment définir votre domaine favori ?
Que se passe-t-il une fois que votre domaine favori est sélectionné ?
Comment effacer la sélection du domaine favori ?

Les sujets suivants peuvent aussi vous intéresser...
Pourquoi mon site est-il associé à deux adresses sur Google : http://site.com et http://www.site.com ?
Que se passe-t-il une fois que mon domaine favori est sélectionné ?
Pour quelle raison n'avez-vous pas pu traiter ma vérification
?

[
Et lorsqu'on a défini le domaine favori, on a cette information :

Le nom de domaine favori www.monsite.com a été défini le xx févr. 2007.

Une fois vos préférences spécifiées, il peut s'écouler un certain temps avant que ces modifications apparaissent dans notre index. Nous ne garantissons pas l'affichage de vos URL au format que vous avez sélectionné, mais nous tiendrons compte de ce choix pour améliorer notre service d'indexation.


Hors ligne

 

#8 [↑] [↓]25/02/2007 08:54:35

Crazy
Super Admin azimuté
Crazy
Lieu: Terre - Système solaire
Date d'inscription: 10/04/2006
Messages: 5712
Site web

Re: Eviter le Duplicate Canonique

fragmobil a écrit :

Code :

-> http://forum.cigiema.fr/p9296-19-02-2007.html#p9296
RewriteCond %{HTTP_HOST} ^site.tld$ 
RewriteRule ^(.*) http://www.site.tld/$1 [QSA,L,R=301]

QSA -> ajout des parametres a l'url dans certains cas c'est totalement destructeur surtout si le site fonctionne comme ca :
Toto.html -> index.php?page=toto
C'est egalement tres dangereux car dans certains cas ca permet d'ouvrir une porte a l'injection de code via les url.

'qsappend|QSA' (query string append)
This flag forces the rewrite engine to append a query string part of the substitution string to the existing string, instead of replacing it. Use this when you want to add more data to the query string via a rewrite rule.
ICI -> http://httpd.apache.org/docs/2.2/mod/mod_rewrite.html

Syntax : Selon la doc d'apache le L apparait toujours en dernier.
Il semble meme logique en terme de lecture.
La lecture des log (du rewrite) permet egalement de detecter que le "L" est une entité a part.

Ces deux considerations sont des toc de developpeur liés a une utilisation intensive des produits open-source et des erreurs commises suite a des interpretations rapides de la doc...
Les deux methodes fonctionnent mais je tiens a votre attention qu'elle fonctionnent differemment et donc produisent des resultats differents...

Perso je conseille ma methode, ceci ne veux pas dire que l'autre ne fonctionne pas.
Il faut plutot lire : Quand on a pas envie de debugger des truc quand on change de hosting ou de version d'apache, on fait simple et reutilisable immediatement.

Code :

# ----------------------------
# force tout vers www. ... 
# ---------------------------
RewriteEngine On
RewriteCond %{HTTP_HOST} !www\.xxxxxxxxx\.xxx [NC]
RewriteRule ^.*$ http://www.xxxxxxxxx.xxx%{REQUEST_URI} [R=301,L]

Je resume :
Dans ce cas On veux simplement qu'un client http soit redirigé en 301 si on a un lien vers www.xxx.xxx

La seconde methode, ainsi que la methode propose par gg sur la page suivante pose deux problemes :

-1- Le client peux prendre des pages "non www" elle sont "atteignable"
-2- Comment google desindexera une page si par erreur il y a un lien sur la page qui creerait un doublon...

En conclusion car on est presque en accord

Crasy : Alors, pour eviter le DUPLICATE (avec www et sans www) il vaut mieux les mettre toujous.

On parle bien d'action humaine, donc l'erreur est possible ceci elimine la proposition de google lue sur l'autre page !
Si on a des machines qui reproduisent a l'infini ce que nous leur demandons (l'inteligence artificielle humaine wink)
Autant qu'elles corrigent aussi les erreurs humaine du meme coup ...

Voila un gros troll mais il etait utile a mon avis...
Je peux meme estimer le temp que je gagne en utilisant ma methode, pour en avoir perdu il y a quelques temps...

++
Fragmobil
PS : crasy n'hesite pas a deplacer le post vers l'autre thread ou je pense qu'il serait plus a sa place dans le cas d'un classement plus pointu du savoir... Mais c'est toi l'admin !

Pour qe Google (et autres bots) désindexe(nt) une page :

Code :

Redirect gone /domaine.tld/page_a_desindexer.ext

[Vous devez être identifié pour voir le texte caché.]
wink
Alain AKA Arma

Code :

RewriteEngine On
RewriteCond %{HTTP_HOST} ^domaine\.tld$
RewriteRule ^.*$ http://www.domaine.tld%{REQUEST_URI} [R=301]

Je suis Bon (avec un grand C) et Immortel... Jusqu'à preuve du contraire ! - I never die...
Chocoku - Sorcier Glouton - Tiger l'Osmose
MSnBetter ThanGoogle - Black Hattitude

I remember and I feel free! - I am the Bleeder of the Lambs!

Hors ligne

 

#9 [↑] [↓]25/02/2007 11:09:51

Crazy
Super Admin azimuté
Crazy
Lieu: Terre - Système solaire
Date d'inscription: 10/04/2006
Messages: 5712
Site web

Re: Eviter le Duplicate Canonique

Maintenant, le PB est de rediriger aussi http://www.domaine.tld/index.ext vers http://www.comaine.tld/ !
Afin d'eviter le duplicate sur la page d'accueil...
J'ai essayé diverses manips, sans succès...

Par exemple :

Code :

RewriteCond %{REQUEST_URI} ^\/(index|accueil|home|main)\.(htm|html|php|asp)$ 
RewriteRule ^.*$ http://www.cigiema.fr/ [R=301,L]

Ou

Code :

RewriteCond %{REQUEST_URI} (index|accueil|home|main)\.(htm|html|php|asp)$ 
RewriteRule ^(.*)$ http://www.cigiema.fr [R=301,L]

(ou mix des deux --> 8 possibilités [4 pour la deuxième ligne])
Ne fonctionnent pas ! (boucle infinie - Mais pas d'ERR) wacko
Ah ah ah...
whistling
Alain AKA Arma


Je suis Bon (avec un grand C) et Immortel... Jusqu'à preuve du contraire ! - I never die...
Chocoku - Sorcier Glouton - Tiger l'Osmose
MSnBetter ThanGoogle - Black Hattitude

I remember and I feel free! - I am the Bleeder of the Lambs!

Hors ligne

 

#10 [↑] [↓]25/02/2007 12:35:49

Crazy
Super Admin azimuté
Crazy
Lieu: Terre - Système solaire
Date d'inscription: 10/04/2006
Messages: 5712
Site web

Re: Eviter le Duplicate Canonique

pagetronic a écrit :

Je préfere ca bleh

Code :

RewriteCond %{HTTP_HOST} !^www.site.tld$ 
RewriteRule ^(.*) http://www.site.tld/$1 [QSA,L,R=301]

Ca évite souvent des problemes...
http://xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx … foot.info/

Aucun PB avec mon code ==> ERR 404 !
wink
Alain AKA Arma

NB : Ne pas mettre le ",L" si autre rewrite derrière !


Je suis Bon (avec un grand C) et Immortel... Jusqu'à preuve du contraire ! - I never die...
Chocoku - Sorcier Glouton - Tiger l'Osmose
MSnBetter ThanGoogle - Black Hattitude

I remember and I feel free! - I am the Bleeder of the Lambs!

Hors ligne

 

#11 [↑] [↓]26/03/2007 12:38:01

Crazy
Super Admin azimuté
Crazy
Lieu: Terre - Système solaire
Date d'inscription: 10/04/2006
Messages: 5712
Site web

Re: Eviter le Duplicate Canonique

En ce qui concerne les pages d'index (si en PHP), la démarche est différente :
(visible par les Membres uniquement)
[Vous devez être identifié pour voir le texte caché.]
wink
Alain AKA Arma

PS :
Exemple pour http://forum.cigiema.fr/index.php

HTTP/1.1 301 Moved Permanently
Date: Tue, 27 Mar 2007 09:47:00 GMT
Server: Apache
Cache-Control: post-check=0, pre-check=0
Pragma: no-cache
X-Powered-By: PHP/4.4.4
Vary: Host
Location: http://forum.cigiema.fr/
Last-Modified: Tue, 27 Mar 2007 09:47:00 GMT
Connection: close
Content-Type: text/html

Code :

<?php
error_reporting(E_ERROR | E_PARSE); // mettre des slashes en debut de ligne pour debugger...

if ($_SERVER['REQUEST_URI'] == '/index.php')
{
header("Status: 301 Moved Permanently", false, 301);
header("Location: http://".$_SERVER['SERVER_NAME']."/");
}
.../...

Je suis Bon (avec un grand C) et Immortel... Jusqu'à preuve du contraire ! - I never die...
Chocoku - Sorcier Glouton - Tiger l'Osmose
MSnBetter ThanGoogle - Black Hattitude

I remember and I feel free! - I am the Bleeder of the Lambs!

Hors ligne

 

Pied de page des forums

Powered by PunBB modified
© Copyright 2002–2005, Rickard Andersson
© Interface & Functional Add-ons Copyright 2006-2007, by Crazy


RSS Forum CIGIEMA

© 2006-2012 / A. G.
CiGi€M@®, 1997-2012
IDDN Reproduction totale ou partielle strictement interdite