12.05.2006

Débuter en référencement ( N°2 Structure des pages )

Structure des pages


Dans le HEADER

Doctype & Charset


Dans les normes du HTML et du XHTML, un DOCTYPE informe le validateur de la version de (X)HTML que utilisée, et doit apparaitre en première position dans chaque page web. Les DOCTYPEs sont des composants primordiaux pour les pages conformes aux normes, ils sont essentiels pour que les documents web s'affichent et fonctionnent correctement dans des navigateurs conformes aux normes. Ex :

De même il est important de définir le charset (encodage) de la page (iso-8859-1, utf-8 etc.).Ex :
Titre La balise Elle doit être constituée d'une ou deux phrases courtes contenant une dizaine de mots (environ 80 caractères) pour être optimale.Il faut y mettre un maximum de mots-clés (en évitant les répétitions) en plaçant, si possible, les mots-clés les plus importants en début (le plus à gauche possible).Il est donc préférable de mettre :que : étant donné que le terme "Ecole d'Ingénieurs" est plus important que "ECE".Cependant, nous ne devons pas oublier que le texte doit être accrocheur pour l'internaute ; si le titre est uniquement constitué de mots-clés, l'utilisateur sera plus tenté par un site situé en dessous dans les résultats avec une phrase claire et explicite.Il est aussi important de mettre un titre différent sur chacune des pages du site afin d'élargir l'impact de cette optimisation.Le titre de la page d'accueil doit être particulièrement bien étudié car c'est en général la page qui apparaît le plus souvent dans les résultats.
Meta Description La balise est aussi très important, bien que certains moteurs de recherche ne lui donne que peu de valeur.Cette balise sert à donner une description de la page. Il est préférable d'y écrire une ou plusieurs phrases correctement construites qu'une série de mots-clés, tout en plaçant les mots-clés les plus important le plus à gauche possible.Ex : C'est souvent la description affichée par les moteurs de recherche en dessous du titre sur les pages de résultat.Il est conseillé de ne pas dépasser les 30 mots (200 caractères) et d'y placer un maximum de mots-clés tout en gardant des phrases syntaxiquement correctes, sur une seule ligne si possible.

Meta Keywords

La balise est ignorée par de nombreux moteurs de recherche (Yahoo la prend encore en compte), mais ne doit pas non plus être négligée étant donné que certains moteurs l'utilisent encore.Certains annuaires Web proposent de récupérer le contenu de cette balise; ils se basent sur ce contenu pour fournir les résultats de leurs moteurs internes. Il peut donc être utile de l'utiliser sur la page d’accueil uniquementElle doit contenir une liste de mots-clés séparés par des espaces ou des virgules. Il faut penser à mettre tous le champ lexical du site, en ajoutant les mots au pluriel, les groupes de mots, voir même, les fautes d'orthographes.Il est tout de même conseillé de ne pas dépasser les 1000 caractères.Il est préférable que ces mots soient sur une seule ligne.Ex :

Dans le BODY

Le contenu de la page est l'aspect le plus important.
Il ne faut jamais oublier que le site est fait pour l'internaute, et non pas pour les moteurs de recherche.
C'est le principal défaut de nombreux webmasters.
Il faut trouver le juste milieu entre l'optimisation de la page et sa lisibilité.
Une page remplie de mots-clés dans de liens et remplies de titres de type h1 h2, ... ne sera pas appréciée par un internaute et il ne risque pas de revenir dessus.

Titres

(Hx)Les balises de titres ( h1, h2, ..., ) ont récemment perdu de leur importance, mais restent tout de même utiles.Il faut faire des titres en concordance avec la structure de la page (ne pas mettre trois balises h1 à la suite), et ne pas oublier que ces balises sont faites pour afficher un titre à un paragraphe ou à une page.L'occurrence des mots-clés dans le texte de ces balises reste un facteur non négligeable.Il est possible de mettre une image dans une balise titre.Dans ce cas, le moteur verra ce qui est affiché dans la balise ALT (cf. paragraphe suivant).

Images
Les images sont aussi lues par les moteurs grâce à la balise ALT qui affiche un texte alternatif.Ce texte s'affichera à la place de l'image si elle n'est plus disponible. Il est lisible par les moteurs de recherche et permet aux aveugle d'en avoir une idée.Il est préférable que la balise ALT de l'image contienne des mots-clés, mais elle doit tout de même décrire l'image.Le nom de l'image est aussi lu par les moteurs, c'est pourquoi il est nécessaire de bien le choisir.Il est préférable de nommer son image "logo-ecole-ingenieur.jpg" que "logo.jpg" par exemple.

Liens Internes

Les liens internes sont les liens pointant vers d'autres pages du même site.Il faut essayer de respecter le format suivant :L'ECE est l'école d'ingénieurs qui crée la différenceLe texte affiché doit contenir des mots-clés et décrire la page vers laquelle il pointe. Le champ title est une option mais n' pas apporté de preuves officielles quand à son impact sur le référencement.Il faut éviter au maximum les URL à rallonges avec des paramètres du type: www.ece.fr/index.php?id=45&page=hdjqhdjkqdhqjkqs?lang=frIl est dans ce cas fortement conseillé d'utiliser l'URL rewriting afin d'obtenir des noms de page plus explicite du type : www.ece.fr/ecole-centrale-electronique.php.Utiliser pour cela le tiret (-) et non pas l'underscore (_) comme séparateur de mot (cf. chapitre sur le nom des pages).Il est très important de bien lier toutes les pages du site afin d'éviter les pages orphelines (aucun moyen d'y accéder par un lien). Il ne faut pas oublier que le PR est redistribué entre les pages via les liens. Il peut donc être très intéressant de lier une page "profonde" (3 ou 4ème niveau de la page d'accueil) directement sur la page d'accueil afin de redistribuer plus de PR aux pages plus profondes.Les moteurs de recherche ne lisent pas (encore?) le Javascript, il ne faut donc pas utiliser ce langage pour faire des liens vers vos pages internes.

Liens Externes

Les liens externes (liens d'autres sites pointant vers le votre) apportent une augmentation du PageRank (cf. article sur le PageRank) et donc un meilleur classement dans les résultats de Google.Afin d'optimiser la qualité de ces liens et donc d'augmenter le PR, il faut que le site qui pointe vers le votre ait un PR élevé.De plus il est très apprécié que ce même site soit dans la même thématique (même sujet) que votre site ; Google associe des mots-clés à chaque site indexé, s'il trouve des termes communs entre les sites pointant vers le votre et le votre, ce lien aura plus de poids quant à votre classement.Enfin, le nombre de liens présents sur le site "partenaire" joue un rôle important. Plus le site comporte de liens, plus la diffusion de son PR sur ces liens sera diluée.En conclusion, il est préférable d'obtenir un lien à partir d'un site traitant d'école d'ingénieurs ayant un PR4 et 5 liens externes, qu'un site à PR7 traitant de cuisine albanaise comportant 30 liens externes.Plus le nombre de liens pointant vers un site est élevé, plus son PR est élevé, et donc mieux il sera classé.Il faut aussi vérifier que le webmasters du site partenaire n'ait pas rajouté l'attribut rel="nofollow" dans le lien, car dans ce cas, les moteurs de recherche ne le prendront pas en compte, de même avec un lien en Javascript (non lu par les moteurs).Il est conseillé d'éviter les fermes de liens (link farming), c'est-à-dire les pages remplies de 50 liens à la suite. Ces pages sont très "mal vues" par les moteurs de recherche et n'apporte que peu (ou pas) de PR, et de visiteurs.Les mots clés présent sur le lien jouent un rôle primordial quant au référencement. C'est pourquoi il est important d'y placer des mots-clés et de les faire varier sur les sites partenaires afin d'étendre les possibilités de résultats.Utiliser ce format de lien pour les partenaires : L'ECE est l'école d'ingénieurs qui crée la différenceou dans le cas d'une bannière : L'ECE est l'école d'ingénieurs qui crée la différenceLes échanges de liens entre sites sont facilement détectables par les moteurs. Si le site A pointe vers les site B C D E F que ces sites ont tous un lien vers le site A, il y a de forte chance que certains moteurs se "rendent compte" du partenariat et ne feront donc pas bénéficier le site A d'un meilleur classement.Il est donc préférable d'utiliser des techniques de partenariats a plusieurs.Par exemple le site A fait un lien vers le site B ; le site B fera un lien vers un troisième site C qui lui fera un lien vers le site A. Cette méthode est pour l'instant difficilement détectable et permet de garder la valeur des liens.Il ne faut cependant pas oublier que la principale cible n'est pas le moteur de recherche, mais l'internaute. Un lien situé au milieu d'une page, dans un contexte approprié sera beaucoup plus visité qu'un lien en pied de page ou sur un page partenaire.

Contenu

Le point le plus important à retenir, c'est qu'un site mis à jour régulièrement attirera plus souvent les visiteurs, ainsi que les moteurs.Un site sans contenu n'a que peu d'intérêt, que ce soit pour un moteur de recherche ou pour un internaute.A l'inverse, une page trop chargée fait diminué le poids des mots-clés. De plus elle fera fuir les visiteurs souvent très pressés.En général il ne faut pas concevoir de page trop longue : il est conseillé de ne pas dépasser les 50 Ko sur la pages d'accueil et 80 Ko pour les autres pages.Il existe quelques balises (X)HTML qui permettent de mettre en évidence du texte.La balise em sert à mettre légèrement en valeur un texte. Les navigateurs l'affichent en italic.La balise strong sert à mettre en avant un texte important. Les navigateurs l'affichent en gras.Ces balises donnent un peu plus d'important aux mots contenus dedans aux yeux des moteurs de recherche qui savent les interpréter.Cependant, il est (pour l'instant) inutile de mettre du texte en avant à l'aide des feuilles de style css (ex : texte en gras rouge et avec police de 26px) car les moteurs ne lisent pas les feuilles CSS.Le nombre de mots-clés dans une page joue un rôle important. Il vaut mieux que la densité (le rapport entre le nombre de mots dans la page et le nombre de mots-clés) ne doit pas dépasser les 10% (certains disent 20%), mais ce qui compte le plus c'est que le texte reste cohérent pour les visiteurs. Il ne faut pas perdre de vu que le site est fait pour être lu par des internautes et non pas par un moteur.Cependant, il ne faut pas se soucier de cette densité, elle reste un critère parmi d'autres. A condition de maîtriser les multiples autres critères, une densité de quelques % suffit amplement pour être éligible en mot-clé par les moteurs.N'oublions pas que les moteurs de recherche ne lisent ni le Flash ni Javascript, il est donc préférable d'éviter de mettre du texte, des liens ou des redirections à l'aide de Javascript ou de faire un site 100% en Flash. Il vaut mieux utiliser Flash pour quelques animations isolées, mais surtout pas pour le menu principal, sinon les moteurs ne parcoureront jamais la totalité du site. De même il est préférable d'éviter les frames, elles ne sont pas lues par les moteurs.

En ce qui concerne l'AJAX, il est à utiliser avec parcimonie également. En effet, le contenu de la page étant modifié après son chargement, il n'y a aucune garantie que les moteurs seront en mesure de s'adapter. Pour l'instant, ils n'interprètent pas du tout le langage Javascript, ce qui leur occulte la totalité du contenu affiché au moyen d'AJAX.

Il est donc judicieux d'appliquer à l'utilisation d'AJAX des règles similaires à celles adoptées pour Flash : ne l'utiliser que pour ce qui est le plus utile, pour améliorer l'expérience utilisateur. Il faut donc éviter de charger du contenu au moyen d'AJAX car les bots seront incapables de le référencer.Il faut de même éviter les pages vides ou en construction : si le moteur indexe une page en construction (ou vide) , il ne risque pas de repasser de si tôt, or une indexation lente empêche la prise en compte des mises à jour du site par les moteurs.Au sujet de la structuration il est préférable d'écrire d'entrée le sujet principal d'une phrase ou d'un paragraphe (on parle de "front-loading"). Cette recommandation est avant tout ergonomique, mais elle influence le référencement, en forçant à rédiger un contenu dense en mots-clés. Si on l'applique à une page, cette recommandation est d'autant plus intéressante, puisque elle force à placer les mots-clés en tout début du texte, ce qui est bénéfique au référencement, les moteurs favorisant le contenu placé haut dans le code. Il est donc important d'introduire le contenu, que ce soit au niveau de la page entière ou de ses sous-parties.

1 commentaire:

Anonyme a dit…

belle analyse. on peut savoir pourquoi c'est le site www.ece.fr qui est pris en exemple ?