IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Tutorial Référencement naturel sur moteurs (Google...)


précédentsommairesuivant

II. Le référencement passif

II-A. Architecture et accessibilité technique

II-A-1. Votre site, s'il existe, est-il visible par Google ?

3 outils simples vous permettent de faire une vérification :
  • Dans la barre d'outil Google : "site:www.lesiteAtester.com" => Google affiche toutes les pages indexées.
    • Si vous n'avez rien : problème !
    • Si vous n'avez QUE la page d'accueil : des choses sont à revoir dans la gestion de vos liens.
    • Le Page Rank (via la barre Google) de vos pages est à 0 : problème manifeste de référencement (ou le site est jeune)
  • L'autre outil vous notifie les défauts techniques dont certains déplaisent à Google :
    • W3C : http://validator.w3.org/
    • Outre la disponibilité d'un site lisible par tous, Google lira sans blocage technique basique vos pages. Ce qui ne signifie pas qu'il les indexera ou arrivera à suivre vos liens. Simplement, il n'y aura pas de blocage technique.
  • Lynx : ce navigateur pour mal voyant et aveugle vous montre le site tel qu'il est pour un bot Google. Si il manque des liens, vous le verrez ! Rappel : plus le texte et les liens sont hauts dans une page, plus ils sont pris en compte par Google. Il ya une légère priorité de haut en bas.

II-A-2. Un peu de technique HTML, XHTML et CSS2 - Le minimum nécessaire

Il existe de nombreux cours gratuits sur HTML, CSS etc. ainsi que des ouvrages payants.

CSS version 2 représente une grande amélioration sans aucun inconvénient. Faisons un rapide tour de cet aspect technique qui facilitera la tâche clef de cette étape : disposer d'un site lisible par Google.

Voici quelques raisons d'utiliser les feuilles de style CSS pour gérer la mise en forme de vos pages HTML
  • Compatibilité avec les versions antérieures des principaux navigateurs.
  • Compatibilité assurée avec les navigateurs de nouvelles générations et leurs futures versions.
  • Compatibilité avec les normes et recommandations du W3C.
  • facilité des mises à jour du site.
  • Permet de séparer le fond et la forme du site ce qui facilite la maintenance (plus rapide, plus facile, moins de bogue)
    • La gestion de l'affichage est confiée à la (aux) feuille(s) de style
      • Spécialiser les feuilles de style permet d'assouplir et de simplifier la maintenance du site, cela facilite la ré utilisation de feuilles de styles pour d'autres sites WEB également.
    • Les données sont dans les pages HTML gérées par la (les) feuille(s) de style
  • Facilite la relecture du code.
  • Diminution des coûts de développement et de maintenance du site au final après l'investissement initial.
  • Limiter voire supprimer les erreurs et maladresses techniques sur le référencement.

II-A-3. La liste des interdits et les problèmes

II-A-3-a. Le robot Google doit pouvoir suivre les liens cliqués

Sinon, aucun travail de référencement ne pourra donner de résultat.

Pour permettre un accès technique aisé aux robots logiciels de Google (et des autres moteurs concurrents) voici quelques conseils clefs :

II-A-3-b. Pas de site entièrement en Flash

Vous pouvez bien sur agrémenter votre site d'exposés et autres outils d'aide à la vente développés en flash, mais il est très déconseillé de réaliser toute le site en flash.

Google, pour différentes raisons, n'indexe pas correctement le flash et pour certaines raisons non techniques mais conceptuelle, cette situation n'est pas près de changer.

II-A-3-c. Pas de frames si possible

Une frame, c'est-à-dire une partie de la page HTML, est vue comme une page indépendante. Cela perturbe (négativement) le référencement. Les performances actuelles des réseaux publics, dopés par ADSL, permettent de se passer de cette optimisation (l'usage des frames).

II-A-3-d. Pas de pages dynamiques ou alors attention à ce que l'on fait
Une page dynamique est une page HTML dont les contenus textes et visuels sont issus en temps réel d'une base de données
  • Exemple : Combien y a-t-il de places pour la séance de tel film tel jour, telle heure, tel ciné ?
  • Le logiciel de réservation de place de cinéma en ligne affiche la page HTML de réponse vide (le logo, le cadre, le nom du ciné, heure de la séance, adresse etc.) puis va chercher l'information en temps réel et l'affiche au bon endroit dans la page qui sera lue par l'internaute cinéphile.

Une page contenant des animations, certes dynamiques, n'est pas concernée.

Google sait identifier les liens qui renvoient des pages dynamiques
  • Toute référence de page (URL) ayant plus de 2 caractères variables liés à la gestion d'une page dynamique est plutôt ignorée.
    • Le robot de Google évalue ainsi la quantité. Si elle est faible (2 digit maximum pour coder les différentes pages de résultats, alors il accepte de référencer plus ou moins bien ces pages, une par une, en fonction du PR de la page "mère"
    • La profondeur de son accès dans ces pages dynamiques est fonction du PR de la page mère. Si le PR est élevé il ira assez profondément. Sinon, il évitera plus ou moins ces pages dynamiques.
  • Si le nombre de pages dynamiques est trop élevé selon ses critères (à partir de 3 digit variables par URL de page et selon le PR de la page "mère"), alors il ignore le lien et n'indexe rien.
    • C'est volontaire ! Sinon toute société ayant 50.000 articles en base de données avec un site à faible PR verrait 50000 pages indexées encombrant inutilement (au sens Google du terme) l'index du moteur.
  • Si le lien cliqué par le robot Google aboutit à un formulaire à remplir pour disposer de l'information, alors le robot Google est bloqué.
Google est perturbé ou bloqué par la gestion des cookies, des session ID
  • Par définition, le robot ne saisit aucune donnée, ne possède pas d'espace où stocker un cookie ou un jeton de session.
  • Même si Google désormais passe ce type de blocage plus ou moins bien, se faire référencer avec des QSA (ex : "…?article=12sid=12eadb1258") est très négatif pour le site car un click depuis l'index Google entraîne aussitôt un 404 et les accumulations de 404 ne sont pas appréciées par Google pour différentes bonnes raisons
  • Recommandation : bloquer à Google les zones où un SID est nécessaire et si vous désirez faire indexer ces pages, alors laisser un "passe" invité où aucun SID ou autre n'est géré. L'invité n'aura bien sûr le droit à aucun formulaire.

Google ne sait pas simuler une souris sur des liens : les liens cachés en Javascript sont illisibles pour lui. Ainsi que les listes déroulantes, les cases à cocher et autres techniques d'interfaces interactives en Javascript.

Sauf sur les pages de 10 résultats maximum, Google limite à 2 pages le résultat d'une recherche d'un site. Si une requête d'internaute correspond à plus de 2 pages de votre site, les 2 plus adéquates selon Google seront présentées et les autres seront regroupées sous une appellation du style :
[ Autres résultats, domaine http://www.wineandco.com/ ]

Image non disponible

Si la page de résultats est à 10 maximum, alors une seule citation du site est faite.

II-A-4. Contourner les interdits techniques

II-A-4-a. Il faut contourner les interdictions ou les contraintes
  • Le marketing de votre site peut exiger de disposer de Flash, de boîtes à cocher, de gestion de cookie, d'un catalogue en ligne etc. : toutes technologies déconseillées pour un bon référencement.
  • Il faut alors contourner ces interdits ou contraintes techniques.
II-A-4-b. Le Flash
II-A-4-b-i. Objet entièrement en Flash

Faire un site entièrement en Flash exige un budget important. Une telle dépense doit être justifiée par un avantage compétitif important.

Les deux principales justifications d'un tel usage de flash sont :
  • Image de marque luxe, haut de gamme à présenter absolument
  • Besoin d'une ergonomie exceptionnelle

Si vous disposez d'un tel budget, alors pour un budget modique en comparaison, vous pouvez faire développer un site WEB HTML répondant à vos besoins marketing et disposant de multiples liens vers le site Flash non référencé.

Autre cas : votre site, HTML, doit présenter des animations, des jeux, des schémas animés etc. pour illustrer vos propos et explications.

Doublez-les d'une page HTML dotée de liens pointant vers des pages contenant uniquement ces animations.

II-A-4-b-ii. Menu principal en Flash

Les menus Flash sont plus agréables et plus ergonomiques.

Doubler le menu Flash par une barre de menu classique en bas de page

Si toute la page contient un objet Flash, doubler le menu en bas et y ajouter un texte référençable.

II-A-4-b-iii. Pourquoi tant de problèmes avec Flash alors que PDF est indexé par Google

Probablement à cause des algorithmes de Google qui ne sont pas adaptés à la complexité de Flash.

En Flash, des textes peuvent êtres vectorisés, bitmap, avec des politiques de mise en page (titre1, 2 etc.) tellement différentes qu'il est difficile d'identifier pour Google les bons mots clefs. Cela rompt avec sa stratégie très évoluée d'indexation et d'évaluation des textes, donc il ne fait pas.

II-A-4-b-iv. Insérer un objet Flash dans une page HTML

Voici un exemple de code à mettre dans une page HTML, page qui sera référençable mais pas le Flash bien sûr.

 
Sélectionnez
<object id="numanuma" width="320" height="240">
    <param name="movie" value="fichier.swf"/>
    <param name="quality" value="high"/>
    <param name="bgcolor" value="#006633"/>
    <embed src="numanuma.swf"
        quality="high" bgcolor="#000000" width="320" height="240" type="application/x-shockwave-flash" 
        pluginspage="http://www.macromedia.com/shockwave/download/index.cgi?P1_Prod_Version=ShockwaveFlash">
    </embed>
</object>
II-A-4-c. Les pages dynamiques : Ré écriture d'URL

La méthode consiste à ré écrire l'URL des pages dynamiques. En effet, les pages écrites avec des ?, des &, des .php etc. ne sont pas toujours bien indexées par Google pour différentes raisons (déjà abordées précédemment)

Plusieurs possibilités existent pour que le bot Google indexe ces pages. Le principe est le suivant :

Pour être accessibles aux Google bot votre catalogue doit disposer, dynamiquement ou autre, d'un accès en "râteau" : une arborescence permet d'accéder à chaque article de votre catalogue, directement ou via des pages intermédiaires :

Tête de catalogue listant en liens toutes les rubriques :
  • Vins de France
    • vins de Champagne
    • Vins de Bourgogne
  • Vins du Chili
  • Vins de Californie etc.

Cela donnerait quelque chose du genre : 75cl.com/page_vin_3_7_11.html où 3 représenterait le code pays, 7 pour la région, 11 pour le château.

D'un côté on a donc une arborescence de liens que Google peut suivre, d'un autre côté ces liens pointent vers des pages statiques fabriquées depuis le contenu de la base de données.

Cette approche a une limite théoriquement peu gênante : la mise à jour des pages statiques conçues depuis un contenu dynamique en base de données. Si l'information est modifiée en base de données, tant que la page statique publiant cette donnée dynamique n'a pas été reconstruite, l'information publiée sera erronée.

Pour un catalogue de produits ayant une mise à jour chaque nuit, ce n'est pas gênant. On met à jour les pages statiques chaque nuit.

Mais si cette page indique un délai de livraison fonction de stock, alors il peut y avoir problème. Le site afficherait par moment des délais de livraison faux.

Pour pallier cet inconvénient, deux pistes complémentaires :
  • Si un délai est modifié, alors toutes les pages statiques concernées sont régénérées avec la nouvelle information et elles remplacent les anciennes pages sur le site.
  • Aucune information sur le délai n'est affichée dans une page statique construite de puis des informations dynamique. "Délai" est désigné via un lien qui pointe vers une vraie page dynamique calculée en temps réel par exemple. Peu importe que cette page affichant le délai ne soit pas indexable par Google..
La ré écriture d'URL offre au passage quelques avantages non négligeables :
  • Accéder à une page statique pré calculée est beaucoup plus rapide que de faire mouliner un moteur de base de données. Les temps de réponse sont meilleurs
  • la ré écriture peut cacher la technologie utilisée (.asp, .cfm, .php3) qui sont autant d'informations clefs pour un pirate en ligne.
  • Les variables en ligne sont résumées à des nombres séparés par des "_". Il est là aussi plus difficile à un pirate de comprendre l'architecture du programme et donc de tenter de le hacker.

Comment ?

Plusieurs approches existent :
  • Serveurs http Apache et langage PHP : paramétrage de Apache et il y a du travail d'administration à faire. Consulter la documentation Apache sur le module "mod_rewrite" et aussi "RewriteRule". (dans le .htaccess)
  • Serveurs IIS / langage ASP de Microsoft : il existe des filtres payants via ISAPI.
  • Serveurs IIS / technologie .NET : utiliser la fonction RewriteURL() et autres qui gèrent la ré écriture d'URL.
  • Approche "maison" : écrire vous-même les scripts PHP, Java ou autres qui transforment vos pages dynamiques en pages statiques. Les avantages et inconvénients sont les suivants :
    • Vous pouvez enrichir la ré écriture d'URL avec d'autres fonctionnalités. Ex : génération de critère off pages adéquats pour Google totalement automatisée.
      • Écriture automatisée et normée du nom de fichier HTML, du Title de la page, des meta Keyword, description, de certains titres en balises H, de certains ALT de visuels de la charte graphique, de title de liens etc.
    • Vous pouvez utiliser les technologies de votre choix : Java J2E, CFM etc.

En fonction de vos budgets, de vos contraintes informatiques et de vos besoins, vous avez plusieurs pistes.

Si vous êtes en hébergement mutualisé, il y a risque de conflit avec votre hébergeur qui peut refuser les réglages Apache dont vous avez besoin. Il vous faudra changer d'hébergement ou passer à un hébergement dédié.

Le choix du séparateur : Google considère que le tiret (signe moins) "-" est un séparateur de mots.

Je recommanderai donc quelque chose du style :

http://www.75cl.com/ventes-vins-champagne-dom-perignon-12_7_17.htm : des tirets pour séparer les mots, des soulignés "_" pour séparer les nombres.

La ré écriture d'URL vous permet de gérer des noms au lieu de nombres (facilite la pertinence) ou de mixer les deux. Google retiendra surtout les noms séparés correctement.

II-A-4-d. La gestion des sessions

Cette technique est utilisée pour contrôler finement l'accès à des informations.

Par définition, si vos données sont confidentielles, elles n'ont pas à être accessibles à Google.

Exemple : tant qu'un internaute surfe sur les produits de votre catalogue en ligne sans acheter, nul besoin de gérer sa session. A partir du moment où il rentre dans une phase d'achat, via le dépôt d'articles en panier, alors seulement à ce moment le site déclenche la gestion de session.

Cela permet à Google d'indexer les pages du catalogue ou en laissant la possibilité au site de gérer en mode session les zones critiques de la phase d'achat et de paiement

Ma recommandation :
  • Si possible essayer de séparer complètement la partie publique de la partie sensible.
  • Ne pas changer le contenu de fond selon la session. Google semble disposer ou disposera d'une politique de vérification des contenus et il sanctionnera le cloaking réel (cf. Trusted Rank qui remplacera ou a peut être déjà remplacé Page Rank).
II-A-4-e. La gestion de session par cookie

Identifier l'internaute revenant sur votre site est un atout intéressant. Cela vous procure des informations marketing intéressantes, cela vous permet de donner un confort d'utilisation à vos internautes. Mais Google ne se prête pas à cela.

La piste la plus intéressante pour contourner ce problème est de gérer les cookies à la "demande". Si votre internaute est un humain, vous le suivez via un cookie. Si vous l'identifiez comme un robot, ou un humain refusant les cookies pas de gestion des cookies. Attention, ne changez pas le contenu de la page en fonction de l'un ou de l'autre : ce serait du cloaking sanctionné par Google.

Cette approche doit être réalisée uniquement sur des pages sans importance financière. En effet, un pirate peut se faire passer pour un robot, ne pas être soumis à la gestion de session du type cookie et donc accéder à ce qu'il veut sans contrôle.

Les phases d'achat, de paiement et autres procédures critiques doivent être protégées systématiquement. De toute façon, ces pages ne sont pas intéressantes à référencer.

II-A-5. Une source, multi sources

II-A-5-a. Les sources
Image non disponible
Une SOURCE selon Google correspond à deux grands domaines :
  • Des sites : http://www.wineandco.com/, http://www.wineandco.org/ seraient 2 sources différentes
  • Des sous domaines : http://chili.75cl.com / http://champagne.75cl.com sont 2 sources différentes

Mieux, le mot clef Chili étant inclus dans le nom du sous domaine, Google prend un peu mieux en compte une telle source.

ATTENTION : il ne faut pas abuser du système et éviter absolument les erreurs suivantes :
  • 2 noms de domaines différents pointent vers le même site. Google le détectera inévitablement et un de ces 2 noms de domaines sera black listé (donc perte d'investissement pour votre site)
  • Trop de sous domaines avec très peu d'informations par sous domaine : idem, sanction inévitable de Google. Il black liste.
  • Des sous domaines pointent vers les mêmes informations : même sanction.
  • Pas assez de contenu dans un sous domaine. Il aura du mal à peser en PR et cela nuira donc au positionnement et à l'efficacité de cette source "trop légère"

La bonne méthode : gérer honnêtement les sous domaines en leur affectant des contenus réels et correspondant à leurs noms. Ex : tout sur les vins du Chili pour le sous domaine http://chili.75cl.com

II-A-5-b. Avantages & inconvénients
Un site peut être divisé en plusieurs sites, par ex une URL par pays, par langue :
  • http://www.captor.fr/
  • http://www.captor.be/
  • http://www.captor.de/
  • etc.

Un site peut être divisé en sous domaines. Ex : http://www.75cl.com, http://chili.75cl.com, etc.

Cela revient au même.

Les avantages du multi sources :
  • Chaque source a des liens vers les autres : cela produit du backlink ! Très précieux comme nous l'abordons plus avant dans le présent document. Néanmoins, ce type d'échange entre sources est moins bien poussé qu'un réel backlink d'un site étranger vers une des pages du site.
Les inconvénients du multi sources :
  • Chaque source doit être référencée : cela coûte du temps et du budget. Les efforts sont donc dispersés. Cela peut déclencher un mauvais positionnement tant que les backlinks ne montent pas en puissance.
  • Chaque source doit réellement être autonome : index.html, .htaccess, canoniser la page d'accueil, un réel contenu en qualité et en quantité etc. : encore du temps à y consacrer.

Un site unique, permet de concentrer tous les efforts sur un seul nom de domaine. Cela se traduit par une montée en positionnement plus rapide au début avec un budget temps et argent moindre. Durant le passage du temps, la gestion des backlinks va primer dans le positionnement à accessibilité identique. Le multi domaines alors l'emportera en positionnement.

II-B. Architecture et accessibilité sémantique

II-B-1. Préambule

L'architecture sémantique est un des points les moins abordés dans les publications spécialisées.

C'est une des clefs du référencement passif et en plus il a un impact sur la qualité de la gestion des backlinks.

Dans ce chapitre nous allons voir :
  • Comment identifier et vérifier les bons mots clefs
  • Comment traquer les oublis possibles en expressions clefs
  • Comment combiner les mots clefs en mettant en place une architecture sémantique
  • Constituer un ensemble de pages socles destinées à être retenues par Google, pages appuyées par un ensemble de pages "terreau" destinées à pousser ces pages socles en avant vers Google.

II-B-2. Identifier les bons mots clefs (français)

Il est nécessaire de sélectionner les mots clefs liés au métier du site, du produit etc. C'est le point de départ.

Les mots clefs peuvent être composés. Exemple : "Airbus A340" en les mettant entre guillemets

L'étape n°2 consiste à vérifier la pertinence de ces mots clefs en étudiant les enchères sur les moteurs.

Yahoo ! et Google mettent 2 interfaces intéressantes pour réaliser cette étude :

En utilisant ces deux outils (il y en a d'autres mais ceux-ci sont les deux plus intéressants et ils sont complémentaires) on peut se faire une idée du trafic sur des mots ou expressions clefs.

Google offre en plus une recherche par synonymes et vous permet de rechercher d'autres mots clefs saisis dans des situations proches. La plupart des réponses de Google sont hors sujet mais très régulièrement, une expression clef "oubliée" sort de cette liste !

Exemple : lors d'une recherche de mots clefs pour un fabricant de système robotisé, le webmestre avait carrément oublié les mots clefs de son métier : électronique robotique et informatique robotique !

Bref, cette liste est à étudier de près systématiquement.

Les expressions clefs ainsi identifiées pourront à leur tour être auditées via ces outils.

On a alors une liste d'expressions clefs.

Il peut être nécessaire de les vérifier ? Comment ? Deux pistes :
  • Prendre un compte Google Adword avec peu d'argent dessus et tester. On a alors accès à des outils Google beaucoup plus fins et précis que ceux de l'aide générique. On peut avoir une mesure au mot clef près saisi au lieu de vagues barres verticales et colorées en estimation de trafic !
  • Analyser les logs du site en place. Il contient une rubrique : les mots clefs saisis sur tel moteur de recherche a orienté un internaute sur votre site. À étudier de près, on y fait des trouvailles intéressantes et... oubliées du propriétaire du site !

Google fait la différence entre singulier et pluriel, féminin et singulier : Vin est différent de Vins mais Vin = vin = VIN. La casse n'est pas interprétée. Fenêtre = FENETRE : les accents ne sont pas interprétés.

Fenêtre est équivalent plus ou moins à FENETRE : selon les outils Google, les accents ne sont pas interprétés (ou le sont faiblement). Un site sera en rang 4 sur une requête avec les bons accents correctement positionnés et rang 2 sans accent par exemple. Les écarts de rang sont faibles. Google, comme bien d'autres outils, semble éliminer la problématique de traitements des accents en n'en tenant que faiblement compte. Nous avons constaté le même comportement dans Adwords. Il est logique que Google harmonise le traitement des caractères accentués car ils ne sont pas disponibles aisément sur un clavier portugais, anglais etc.

Cette approche des moteurs et de Google renforce le besoin de créer un solide socle afin :
  • De pourvoir disposer de multiples variantes autour de peu de mots orientés métier : Vin, vins, vente, ventes, achat, achats, vignoble, vignobles, chardonnay, pinot noir, château, châteaux etc.
  • De pouvoir tester différentes expressions clefs : "vente de vins" ou "achat de vins" - quelle est la combinaisons la plus utilisée pour chercher un site de vente de vins en ligne par des internautes amateurs ?
  • D'exploiter au mieux la combinatoire de mots clefs. Si les deux expressions ramènent chacune un trafic intéressant et différents, il faut donc architecturer son site de manière à disposer de ces 2 expressions clefs.

Exercice : les bons mots clefs pour un site de services dans les travaux du bâtiment, des maisons etc.

II-B-2-a. Un outil intéressant : les mots clefs retenus par Google sur une page donnée

Rappel : sur Google, la commande "site:http://www.votresite.com" permet de vérifier l'accessibilité technique des pages à étudier. Inutile de travailler votre page si Google ne peut la lire !

Saisir les expressions clefs d'une page visée jusqu'à l'obtenir en résultat chez Google :
  • Truc & astuce : au besoin saisir dans Google 3, 5, 10 mots de votre page, mots que vous estimez clef.
  • Exemple : "Développez Vos Ventes" donne en sept. 2006 : http://www.developpezvosventes.com/ en rang 1
Image non disponible

Vous obtenez alors quelque chose comme :

Image non disponible

Pour savoir ce que Google a retenu dans le corps de page, cliquez sur en cache et après sur texte mis en cache Tous les mots clefs seront surlignés en jaune ou en vert etc.

Surprise : j'ai saisi "developpez" et Développez n'est pas mis en sur lignage. Conclusion, Google a évolué et désormais il prend en compte les accents !!! il ne m'a trouvé que sur vos ventes ?? non. Les backlinks (nous verrons plus loin ce que c'est) poussent nombre de mots clefs "developpez" (sans accent), Google a identifié de nombreuses racines proches : développement développez (avec accent) et il en tient compte.

Ce type d'outil permet de vérifier la qualité de ses mots dans la page (fréquence, densité), leurs réelles présences (chasse aux oublis)

II-B-3. Identifier les bons mots clefs (autres langues)

C'est le même principe. Mais les adresses des outils Google, Yahoo et autres sont différentes.

Voici une liste - attention, les sociétés changent l'URL régulièrement pour différentes raisons.

http://searchmarketing.yahoo.fr/fr_FR/rc/srch/oyr.php# nouvelle page d'accueil overture depuis mars 2006.

Overture
Espotting

II-B-4. Combinatoire et choix des mots clefs

Une analyse permet donc de disposer des différentes listes de mots clefs nécessaires.

Exemple sur http://www.75cl.com/ : des mots clefs sont plus intéressants pour la home page que pour une page sur un champagne. Vente ou achat est intéressant pour les pages en haut d'arborescence. Le mot Champagne et les mots Epernay, France, bulle / bulles sont plus intéressants comme mots clef sur une page d'un champagne.

Plusieurs dizaines de mots clefs sont potentiellement intéressants pour le groupe de pages consacré au Champagne. Il faut les lister et réaliser les rédactionnels des différentes pages pour les grouper, les factoriser, tous si possible 3 à 3, à raison de 3 mots clefs poussés en exergue par page HTML. Remarques :

  • Plus il y a de pages, plus c'est facile. Une photo d'une bouteille devra disposer d'un zoom en page HTML avec un peu de texte et bien sur les mots clefs adéquats : balises alt et title, textes adéquats, liens nommés vers la page zoomant la bouteille, nom du fichier photo (évitez : dv000235.jpg et préférez plutôt : bouteille-champagne-dom-perignon-epernay-France.jpg)
  • Factoriser : Exemple d'URL mappant un répertoire : "vin-france/champagne/nom domaine - epernay.html"

II-B-5. "Forcer" Google sur vos mots clefs et non l'inverse

En fonction du contenu, Google fixe les mots clef de la page.

Comment influencer Google pour que ce soit VOS mots clefs décidés par vous qui soient retenus :
  • Afin d'avoir la maîtrise de votre combinatoire de mots clefs
  • Afin de choisir VOS mots clefs et être meilleur en positionnement que vos concurrents par exemple.
En les gérant au mieux grâce à la répartition sémantique : Un mot clef stratégique devrait être présent dans une page :
  • Title de lapage
  • Description
  • Balise H
  • ALT de visuel
  • P : paragraphe
  • Title de lien
  • Dans les textes, des backlinks pointant vers la page

II-B-6. Augmenter le trafic grâce à la combinatoire

La combinatoire de ces mots vous permettra de "pêcher" plus d'internautes saisissant des combinaisons non prévues de mots clefs.

Exemple :

La page tête de rubrique 75cl.com/vin-France/Champagnes.html donne accès à toutes les pages liées au champagne. Chacune a un lien partant de cette page. Nulle part ailleurs on ne parle de Champagne SAUF :

  • Pour indiquer qu'il y a du champagne sur le site et ce texte est associé à un backlink vers la page champagnes.html ou une des pages de cette rubrique.
  • En saupoudrant un mot par ci par là pour bien conforter Google que la thématique des pages de ce site traite bien du champagne.

Voici un exemple complet :

Thème : les vins du Chili, vente de vins. L'objectif est de couvrir tous les mots clefs centraux, Vin, vins, achat, achats ventes, vente etc. avec les mots clef propre aux vins du Chili : Chili, chilien, chiliens, Amérique du sud,

===== sur http://chili.75cl.com/ Un extrait de ce site daté de avril 2005 ====

Edito

Nous sommes aujourd´hui fier de partager avec vous notre passion pour les vins du Chili.

Un internaute témoigne sur Tarapaca

Il a dégusté le Viña Tarapaca 1995, Reservado, et nous fait part de son enthousiasme.

Le climat et le vignoble chilien

Des conditions bénies... Le Chili est situé sur la côte ouest de l´Amérique du sud, s´étirant sur plus de 5000 kilomètres du nord au sud, mais seulement entre 90 et 400 kms de d´ est en ouest.

Les cultures de la vigne sont comprises entre les latitudes 27°5 et 39°5. La situation géographique procure des conditions favorables au développement de ces cultures.

Dans le menu de gauche nous trouvons :

====

Les grandes maisons du Chili
  • Cousino Macul
  • ViñaTarapaca
  • Viña Undurraga
  • Viña Francisco de Aguirre
  • Viña San Pedro
  • Viña Concha y Toro
Connaître le vignoble chilien
  • Présentation générale du vignoble
  • Tableau récapitulatif des vallées
  • Descriptif des grandes vallées
  • Comparaison des vignobles chiliens et argentins
  • Petrus a fait des emules !
  • In vino fatalitas
  • Connaitre le Pisco !
Les cépages :
  • Les cépages rouges

    • Cabernet-Sauvignon
    • Merlot
    • Cabernet-Franc
    • Carménère
  • Les cépages blancs

    • Sauvignon
    • Chardonnay

Conditions de vente | Articles de presse | Vente de vins - Vin - Recettes de cuisine | Qui sommes-nous ? | Galaxie de sites

====

Pour résumer : cette page est sémantiquement formidable : tous les mots clefs ont été abordés en texte, en liens. Des liens vers des pages spécialisés vont permettre de répéter tout ou partie des mots clefs de cette page avec d'autres mots clefs.

II-B-7. Densité, occurence, racine, thème... Une approche par l'exemple

II-B-7-a. Les textes sont analysés par Google sous différents angles

La densité des mots, des mots clefs. Combien de fois sur un nombre de mots donnés, tel mot clef revient.

Le nombre d'occurrences brut d'un mot donné dans la page.

II-B-7-b. Écrire un texte, 100 mots environ, prenant en compte des mots clefs stratégiques

Proximité

Répéter plusieurs fois les 2 ou 3 mots clefs stratégiques que VOUS voulez :
  • Ex 1 : Mots clefs : casque et combat : Notre gamme de casques protège les sportifs pour tous leurs entraînements en arts martiaux et en sport de combat. Le casque ADIDAS est bien positionné pour les sports de combat type Boxe Thaï, combat où les coups portés entre combattants sont plus particulièrement violents. Le casque NIKE est adapté aux combattants en arts martiaux où les coups portés entre combattants sont moins portés La tête, crâne et visage, sont bien protégés.. Casque ADIDAS à 57 € / Casque NIKE à 47 €, tours de tête enfants à adulte.
  • Ex 2 : pour une agence de styliste concevant ou prévoyant les évolutions de la mode : http://www.space-maker.com/
    • Cahiers des tendances : nos cahiers des tendances permettent à nos clients de consulter les tendances de la mode homme - femme pour les prochaines années. Ces cahiers sont publiés par Space Maker et son équipe de stylistes.
    • C'est un peu lourd comme rédactionnel mais : sur ce paragraphe seul, on a 3 fois "tendances" et "cahiers" ; plus que tout autre mot - Google est clairement guidé vers ces 2 mots clefs.
Différentes déclinaisons de chacun de ces 2 mots clefs et des mots connexes :
  • Casque, casques
    • Tête (un casque va sur une tête)
    • Un visage et un crâne sont protégés par un casque
  • Combat, Combats
    • Combattants
    • Casque et combattant,
    • Coups violents (donc protections, protège)

II-B-8. Le poids des noms de sources, de fichiers HTML

Prenons l'exemple de http://www.DeveloppezVosVentes.com/

Une recherche sur Développez Ventes donne ce site en rang 5 de la page 1 (12/2005)

Google isole dans les noms de domaines les mots clefs accolés les uns aux autres.

La page d'accueil contient un texte utilisant plusieurs fois Développez et ventes

De même les noms de fichiers html appuient le référencement. Faites des tests sur les mots clef "Antilles" et "croisières" et vous verrez que nombre de pages utilisant ces mots clefs comme noms de fichier et leurs rangs dans la page de résultats.

Extrait ci après (12/2005): on remarquera que la plupart des sites cités ont croisières et Antilles dans le chemin d'accès donnant l'URL de la page HTML

Image non disponible

II-B-9. Les autres critères

II-B-9-a. Les critères importants

Nous venons de voir que l'URL (les mots la composant) et le nom de fichier sont très importants dans le référencement.

Au sein de la page HTML, les critères suivants sont clefs :
  • Title : limiter à moins de 10 mots
  • Description : limiter à moins de 20 mots si possible. Mais dépassement possible si mots clefs en début.
  • Présence de Hx reprenant des mots clefs abordés dans Title et Description
  • Présence de fichiers images ayant des noms et balises ALT / TITLE contenant des mots clefs abordés dans Title et Description
  • Présence dans le texte des mots clefs abordés dans Title et Description si possible appuyé par quelques balises <strong>.
II-B-9-b. Les critères moins importants

Gestion des balises Hx qui utilisent au mieux les mots clefs

Utilisation des balises STRONG et EM sur des mots clefs dans le texte.

Construire des images : plutôt que de mettre un tableau contenant des références, des dates de disponibilités et des sommes en euros, faites en une image JPEG et insérer la dans la page.

  • Du texte inutile et polluant la page et noyant les mots clef est ainsi retiré.
  • La densité des mots clefs augmente

Balises ALT et TITLE des visuels et autres objets. Les renseigner avec des mots clefs.

II-B-9-c. Les critères surprenants

La position dans chaque page de chaque mot ou lien ou balise (title et alt d'un visuel) . Plus le mot clef est placé vers le haut, mieux il est pris en compte.

Les noms des fichiers des visuels : table-jardin-blanche.jpg est nettement plus efficace que img00678.jpg directement issu de votre appareil photo numérique.

II-B-9-d. Plan du site

Il est important car il permet au référenceur d'en profiter pour réguler les flux de liens et mieux gérer ainsi les PR des pages du site. Il peut ainsi forcer sur des pages socles en jonglant avec des liens en dur ou en javascript. (cf plus loin les exercices sur les transferts théoriques de PR).

II-B-9-e. Localisation géographique du serveur
  • Un site en .fr peut être hébergé n'importe où dans le monde. Il restera considéré comme "pages France" par Google.
  • Un site en français et en .com hébergé en France sera considéré comme "pages France"
  • Un site en français et en .com hébergé HORS de France sera considéré comme "pages francophones - langue française"

Attention, certains hébergeurs "français" ne sont pas en France - exemple en 2007 : 1 & 1 ce qui perturbe profondément le référencement et donc le trafic du site !

II-B-9-f. Google writing

Le rédactionnel pèse dans le référencement. N'oublions pas que nous avons à faire avec des robots. Avantages pour Google - grande puissance de traitement, faible coût d'exploitation. Inconvénient majeur : on peut tenter de le rouler (un peu) pour mieux arriver à ses fins.

Une page doit traiter d'un seul sujet - il faut acquérir la discipline pour éclater en arborescence une problématique traitée à raison de un sujet par page.

Les phrases doivent être correctes en syntaxe, grammaire et orthographe. Le spam de mot est aisément découvert par Google. Inutile de le tenter. Mais mettre en page en insistant un peu sur les mots clefs aide (la mise en exergue via les balises adéquates). Il suffit de mettre un peu plus de titres dans la page, de reprendre les mots clefs même si le lecteur humain trouve la mise en page un peu surprenante par moment.

Quelques astuces :

Image non disponible
Image non disponible

L'intérêt du site ici est de s'adresser simultanément à Google et aux humains surfant sur la page.

"SPECIAL ETUDIANT" est une image qui contient un texte séduisant pour les humains mais guère intéressant en référencement sur Google.

Ce visuel peut recevoir un texte en ALT et en TITLE qui sera pas ou peu lu par les internautes mais lu par Google qui ne sait pas lire un texte dans un visuel :

Plein de mots clefs intéressants :
Sélectionnez
alt="logement, appartement, chambre pour étudiants en location, co-location et à louer"

Sous ce visuel SPECIAL ETUDIANT, on pourrait mettre en bleu entre balise h2 "étudiant, trouve ton logement à louer". On remarquera que j'ai mis étudiant au singulier volontairement. Et re mots clefs mais sans saouler le lecteur.

Facilement serait à la ligne et dans dans le même style visuel mais avec des balises span + style. En effet, aucun intérêt à pousser en exergue vers Google le mot "facilement" mais intérêt à le maintenir visuellement fort pour le lecteur humain.

Le texte "Location, co-location etc." doit être mis entre balise <p>

II-B-9-g. Les claques DHTML

Cette technique permet de mettre dans une page des textes qui apparaissent uniquement sur événement mais ces textes, quand la technique est en css permet de les avoir lissibles par Google, toujours, rarement par les humains ce qui présente quelques intérêts.

II-B-9-h. Augmenter le socle du référencement => Création de trafic qualifié et ciblé

En étudiant les statistiques de votre site et la gestion des mots clef sur le net, vous déterminerez de nouveaux mots clefs, moins usités mais néanmoins utilisés qui pourraient vous conduire en première place sur certaines requêtes.

Voici un exemple simple :

Vous êtes un jeune cabinet comptable. Le mot comptable est relativement disputé. Le mot Essonne aussi. Mais la combinaison Comptable - Essonne - 91 sur une même page est peu utilisée par les experts comptables de l'Essonne. En accentuant sur différentes pages du site cette combinaison de trois mots, vous arriverez en tête de page de résultats sur un internaute recherchant un expert comptable dans l'Essonne.

Puis vous ajoutez de nouveaux mots clefs sur ces pages : Expert, commissaire aux comptes, normes IFRS etc.

Puis vous ajoutez de nouvelles pages avec les nouveaux mots clefs : commissaire aux comptes, normes IFRS etc.

Des pages Rank se transfèrent très vite.

Une recherche sur "IFRS 91" vous liste en tête de cette nouvelle combinaison peu usitée... pour le moment.

II-B-9-i. Mettez votre site à jour

Nouveaux liens entrants ou sortant, nouveau textes etc. un site maintenu est mieux noté par Google

II-B-9-j. Un JPEG à mettre en zoom

Cela consomme du temps mais si vous en avez, créez une page HTML qui contient le zoom de la photo et profitez-en pour mettre un peu de texte et des Meta et autres critères. Le nombre de pages d'un site influe sur son positionnement indirectement (plus de BL internes, plus de terreau etc.)

II-B-9-k. Gérer les pages trop longues en texte

Vous avez une page de plusieurs centaines de mots. Scindez-la en plusieurs pages via une navigation locale. Ce sera l'occasion pour vous de créer des liens nommés internes au site pour expliciter leur navigation... et pousser des mots clefs via des BL internes (cf. chapitre référencement actif).

Une page doit faire un minimum de 300 mots significatifs. A partir de 700 à 1200 mots, il est temps de songer à scinder la page en plusieurs pages reliées par la navigation.

II-B-10. Les mots clefs utilisés par vos concurrents... Ou par vous-même !

Étudier la concurrence fait partie du travail du référenceur. Selon les moments, il y a plus ou moins de méthodes.

  • Utiliser les outils de Google (ou d'autres !) sur les sites de vos concurrents
    Image non disponible
    • L'outil d'aide Google pour identifier des mots clefs (générateur de mots clefs)
    • https://adwords.google.fr/select/KeywordToolExternal?defaultView=2
    • L'onglet "Mots clefs concernant le site" propose de lister les mots clefs en rapport avec une page d'un site WEB
      • Google analyse la page et liste les mots clefs pertinents de cette page selon lui
  • Limite du système : attention, nombre de sites sont à côté du sujet de l'entreprise. En clair, le site ne reflète pas l'entreprise. C'est très bien pour vous, un concurrent incompétent sur Internet favorise vos propres affaires. Il va de soi qu'il ne faut donc pas tenir compte des résultats de tels outils pour concevoir votre propre stratégie de référencement et positionnement.
  • On peut aussi étudier le site et ses meta, textes, title pour évaluer les mots clefs réellement poussés et ceux qui seraient... nécessaires à cette entreprise et à son site.

II-C. htaccess et canoniser un point d'entrée

Google doit avoir un seul point d'entrée sur le site :
  • http://www.lesite.com/ : c'est l'idéal. Choisir autre chose, c'est possible, mais cela demande un niveau expert pour bien comprendre ce qu'il se passe et pourquoi et comment faire !!
  • Et non pas http://www.lesite.com/index.html
  • Et non pas http://www.lesite.com/accueil.html et autres du même genre.

Cela permet de concentrer sur un seul point d'entrée les propriétés (positives) liées au référencement. Sinon, le PR va être étalé, les définitions vont rentrer en conflit, bref, de la dispersion, ennemie du bon référencement, surtout quand le site est en compétition féroce sur des mots clefs.

La gestion adéquate du fichier .htaccess permet cette optimisation.

Certains hébergeurs ne supportent pas ou mal le canonical : OVH par exemple.

II-D. Héritage, refonte de site, migration

II-D-1. Protéger ses investissements

Google attache un PR et des propriétés à chaque page qu'il indexe. Une page est identifiée par un code unique sur la planète WEB : son URL. Il ne peut en exister 2 identiques !

Que se passe-t-il si vous changez l'URL de votre page ?
  • Car vous changez la page de répertoire pour des raisons d'administration de fichier (passer de la racine vers Fra les pages en français, vers ENG les pages en anglais etc.)
  • Car vous changez le nom du fichier : de "page154.html" vous la renommez "table-de-jardin-blanche.html"
  • Car vous changez le nom de domaine

=> Vous perdez tout. En clair, vous jetez des mois de travail, d'ancienneté, d'investissement à la poubelle.

Comment limiter la perte ? En gérant un héritage. Il faut faire comprendre à Google que la page a déménagé.

Plusieurs techniques peuvent permettre un tel héritage.

II-D-2. .htaccess

L'utilisation du fichier .htaccess indique à Google et aux autres les redirections 301 (définitive) ou 302 (provisoire). La page "page154.html" est alors mappé par le serveur Apache vers la page "table-de-jardin-blanche.html"

  • Tout internaute appelant cette page sera redirigé en temps réel vers la nouvelle adresse.
  • Google "interprète" .htaccess en analysant les headers http et en tiendra compte lors de la prochaine Google Dance ou de son équivalent en fil du temps.
Cette ligne dans un fichier .htaccess redirige l'internaute de index.html vers accueil.php :
Sélectionnez
Redirect 301 /index.html    /accueil.php

II-D-3. Liens en dur

Vous laissez la page en ligne et vous mettez un lien en dur vers la nouvelle avec un texte explicatif.

ATTENTION, multiples pièges et astuces :
  • Duplicate content n°1 : le texte d'accompagnement est le même pour toutes les pages ainsi re-routées et vous avez vidé le contenu des pages anciennes : les nouvelles pages seront en black liste ! Donc texte très court et très changeant.
    • Faisable que sur quelques pages, après forte consommation de temps homme !
  • Duplicate content n°2 : malin comme un singe, vous laissez les textes dans les anciennes pages. Oui mais vous avez copié ces textes dans les nouvelles ! Elles seront mises en black liste !! Perdu !
  • Les pages anciennes et nouvelles sont dans le même site. Faites un .htaccess. Plus simple et plus sur.
  • Les pages sont dans deux noms de domaines différents : pour avoir du backlinks "externe" cela peut valoir le coup de garder les anciennes pages (ou une partie de celles-ci) et de personnaliser page par page un lien nommé (cf. le chapitre consacré à ce sujet important) vers la page correspondante.

II-D-4. Redirection en HTML

Cette méthode, plus simple mais bien moins propre et efficace que .htaccess, utilise les documents HTML eux-mêmes, pour indiquer leur déplacement.

Cette méthode ne devrait être utilisée que lorsque les redirections http via .htaccess sont impossibles.

  • http://ancienne.adresse.fr/dossier1/page1.html vers http://nouvelle.adresse.fr/dossier2/page2.html
page1.html
Sélectionnez
<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />
    <meta http-equiv="refresh" content="0; url=http://nouvelle.adresse.fr/dossier2/page2.html" />
    <title>Redirection</title>
    <meta name="robots" content="noindex,follow" />
</head>
<body>
    <p><a href="http://nouvelle.adresse.fr/dossier2/page2.html">Redirection</a></p>
</body>
</html>

II-E. Illustrations des calculs de PR (Page Ranking)

II-E-1. Quel intérêt à comprendre puis à mettre en œuvre les calculs de PR ?

Nous avons vu dans ce document comment le PR est géré (approximativement) par Google.

Nous avons vu qu'il est intéressant d'architecturer le site en sémantique :
  • En pages de socle destinées à devenir des pages à sortir sur Google
  • En pages "terreau" destinées à pousser les pages socles en évidence

Il est de l'intérêt du site de pousser les pages socles par du transfert de PR depuis les pages "terreau & engrais"

II-E-2. Prenons le Web dans un cas théorique : deux pages existent - A pointe vers B et B pointe vers A

Image non disponible

Donc, C(A) = 1 et C(B) = 1

Le PR est inconnu. Une 1ère itération avec une valeur de départ de 1 donne :

PR(A) = (1 - d) + d(PR(B)/1) Ã’ PR(A) = 0.15 + 0.85 * 1 = 1

PR(B) = (1 - d) + d(PR(A)/1) Ã’ PR(B) = 0.15 + 0.85 * 1 = 1

Le PR converge vers 1.

Prenons une valeur de départ différente : 0

Première itération

PR(A) = 0.15 + 0.85 * 0 = 0.15

PR(B) = 0.15 + 0.85 * 0.15 = 0.2775

Deuxième itération

PR(A) = 0.15 + 0.85 * 0.2775 = 0.385875

PR(B) = 0.15 + 0.85 * 0.385875 = 0.47799375

Troisième itération

PR(A) = 0.15 + 0.85 * 0.47799375 = 0.5562946875

PR(B) = 0.15 + 0.85 * 0.5562946875 = 0.622850484375

Nous remarquons que les valeurs augmentent à chaque itération. Google a précisé que le PR moyen de toutes les pages du WEB doit être égal à 1. Nous constatons que dans notre exemple, nos deux pages constituant le WEB mondial voient leurs PR moyens converger vers 1.

Prenons une valeur de départ différente : 2 (nous aurons ainsi testé 1, moins que 1, plus que 1)

Première itération

PR(A) = 0.15 + 0.85 * 2 = 1.85

PR(B) = 0.15 + 0.85 * 1.85 = 1.7225

Deuxième itération

PR(A) = 0.15 + 0.85 * 1.7225 = 1.614125

PR(B) = 0.15 + 0.85 * 1.614125 = 1.52200625

Troisième itération

PR(A) = 0.15 + 0.85 * 1.52200625 = 1.4437053125

PR(B) = 0.15 + 0.85 * 1.4437053125 = 1.377149515625

Les PR de nos 2 pages constituant le WEB mondial convergent vers 1. Cela fonctionne. La moyenne normalisée des pages du WEB tend vers un dans notre exemple, comme indiqué par Google.

II-E-3. L'efficacité de la formule pour accélérer les calculs de PR d'une page

Le facteur d'amortissement permet de diminuer le nombre d'itérations nécessaires. S'il est trop élevé, cela exige beaucoup d'itérations pour permettre la convergence. Cela consomme trop de ressources.

Si le facteur est trop bas, la convergence approche le résultat escompté. C'est insatisfaisant.

Refaites l'exemple ci-dessus pour appréhender cela en remplaçant le coefficient 0,85 par 0,2 puis par 0,95.

La valeur 0,85 est la valeur idéale pour effectuer cette mission.

II-E-4. Un exemple avec plus de pages

Image non disponible

EX1 : Nous avons un site cas d'école : Une home qui pointe vers 3 pages secondaire d'informations, une page d'info B qui pointe vers une photo incluse dans une page HTML plutôt que un fichier JPEG.

La home reste à une valeur mini, peu intéressante pour nous. B, C, D monte un peu. La photo récupère le PR le plus élevé du site, ce qui est peu intéressant pour nous.

EX2 : Les pages B, C, D pointent vers la page A : nous ajoutons une navigation sommaire à EX1.

Les PR augmentent. Bien. Mais la home augmente peu. Car elle favorise les pages de niveau inférieur. La photo possède un PR supérieur à la home. Sans lien de retour vers la home, cela implique qu'un internaute pourrait arriver sur cette page sans possibilité aisée de remonter sur la home du site (ou sur une autre page du site). Pas terrible.

EX3 : Ajoutons un lien de la photo (page E) vers la home pour pallier le défaut constaté en EX2.

Le PR augmente fortement. Bien. Le focus de notre référencement en PR est la home page. Cela peut être intéressant si la stratégie globale du site consiste à disposer des messages marketing clef sur la home page et à vouloir attirer un maximum d'internautes vers la home.

EX4 : Déplaçons le lien de la photo (page E) vers une autre page info du site, la page B, d'où est issu le lien vers la photo.

La home reste la page en PR le plus élevé et une page de rubrique est favorisée aux dépens des autres

Premier commentaire : On peut faire monter le PR d'un site pour obtenir un PR moyen de un. On peut, grâce à la gestion des liens internes, influencer sur la répartition du PR pour favoriser la ou certaines pages clefs du site. A mots clef équivalent, les pages à PR élevées seront favorisées.

EX5 : Mettons en place une vraie navigation. La home pointe vers les têtes de rubriques B, C, D. Chaque tête de rubrique pointe vers la home et vers les têtes de rubrique autres. B pointe vers C et D, C vers B et D, D vers B et C.

La page photo améliore le socle de référencement du site (une page en plus harmonisée au thème de son groupe de page avec textes, mots clefs etc.) mais elle étale le PR sur les pages autres que la home (sauf à lui coller un lien de elle vers home).

Second commentaire : Une gestion fine des pages de photo (ou autre) permet de distribuer le PR à sa convenance tout en augmentant le socle.

Page EX1 EX2 EX3 EX4 EX5
A 0.15 0.18 2.20 1,79 1,04
B 0.19 0.48 0.77 1,23 1,42
C 0.19 0.48 0.77 0,66 1,04
D 0.19 0.48 0.77 0,66 1,04
E 0.31 0.36 0.45 0,62 0,45

II-E-5. Confirmation

En juin 2007, Google via son blog officiel (Matt Cutts) confirme que le transfert de PR est toujours présent dans ses algorithmes.

II-E-6. Ce que nous venons de voir est partiellement faux - Le test

Le Page Rank est beaucoup plus complexe que ce que nous venons de voir (qui est simplement incomplet et non pas faux).

Voici un témoignage issu du web :

Lors de la modification du code source de son forum, Dan, le webmestre de Webmaster Hub expose un contexte unique pour mieux comprendre Google.

Le nouveau programme informatique du forum de Webmaster Hub mis en place le 15 mai 2004 entraîne une génération massive et soudaine de 30000 à 40000 liens sortants depuis Webmaster Hub.

Étudier l'évolution du Page Rank de ce forum et site lors des prochaines Google dance, permettra de mieux comprendre la fuite du Page Rank exposé dans les équations vues ci-dessus.

12.6.1.1 Mise à jour suite à la Google dance du 31 mai 2004

Webmaster Hub est passé de PR6 à... PR7. D'autres pages du site montent à PR6 ou PR5. l'arrivée brutale de backlinks n'a donc pas fait diminuer son PR, au contraire.

12.6.1.2 A suivre...

Les liens sont la base du web. Les premiers résultats de ce test montrent que les liens sortants massifs n'ont pas eu d'effet négatif sur le PR, au contraire.

Des liens sortants faits judicieusement auraient un effet positif sur le positionnement dans Google, élément beaucoup plus important pour un site que le PageRank de ses pages.

De même, des liens sortants maladroits ont un effet négatif sur le site. Les équations vues plus haut ne sont pas fausses. Simplement elles changent selon l'importance et le poids du site.

Je ne recommanderai pas à un jeune site de se doter de milliers de liens sortants !

Autre contre exemple : les annuaires de liens. Ils ont de forts PR et pourtant des milliers de liens en sortent !


précédentsommairesuivant

Copyright © 2007 Gilles GRÉGOIRE. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.