Créer un fichier sitemap sur PC


Sur ce blog, le sujet du sitemap de sa création à son utilisation a été abordé plusieurs fois. Le sitemap est en effet un des leviers important dans l’optimisation du référencement pour un grand nombre de moteur de recherche: MSN, Yahoo et bien évidemment Google. En effet, nul besoin de publier un sitemap différent selon les moteurs, les "crawlers" de ces derniers sont en mesure de "gober" la même information au même format à savoir du XML comme indiqué ci-dessous dans l’échantillon.
Il nous restait à sélectionner sur Windows un logiciel, gratuit de préférence, susceptible de faire le boulot.
Pour mémoire, quelques uns de ces articles :

SEO Warrior

SEO Warrior

Un ensemble de cas, de bonnes pratiques et de techniques pour que votre site soit enfin trouvable... On découvre aussi que le SEO n'est pas une science exacte.

Genre(s) : , , , , , ,
Auteur(s) :
Edition(s) :

Les critéres de choix du logiciel

Ces logiciels existent en nombre, nous en avons néanmoins sélectionné un qui nous a semblé performant et simple à l’usage, il se nomme SiteMap Generator.

L’écran “Google Sitemap / XML” de SiteMap Generator

Les raisons en sont simples : Il est gratuit; Il remplit bien la fonction basique qui lui est demandé c’est à dire générer un sitemap sans être bridé dans le nombre d’url entrés; Il possède aussi quelques autres fonctionnalités supplémentaires intéressantes, ce qui ne gâte rien. En vrac, le logiciel offre les fonctionnalités suivantes :

  1. HTML Map, cette fonctionnalité génère un fichier HTML avec tous les liens de votre site.
  2. CSV, cette fonctionnalité génère un fichier csv de l’ensemble des pages de votre site.
  3. Failed URL, cette fonctionnalité génère une liste des adresses incorrectes figurant sur votre site.
  4. Outbounds Links, cette fonctionnalité génère liste des liens sortants depuis votre site.
  5. Robots.txt, cette fonctionnalité vous permet d’afficher le fichier robots.txt de votre site si il existe.’

L’écran principal de SiteMap Generator

Un désavantage de taille toutefois, le logiciel traque bien toutes les URLs mais ne complètent pas totalement tous les nœuds xml inclut dans le noeud <url> </url>. Il manque en effet <lastmod> </lastmod>, <changefreq> </changefreq>, <priority> </priority>. A sa décharge, ces nœuds sont optionnels, seul <loc> </loc> est obligatoire.

Un petit tour rapide des nœuds XML inclus dans <url> </url>

<loc>http://social.hecube.net/</loc>
Ce nœud est obligatoire. Il s’agit de l’URL de la page. Elle commence toujours par http et se termine par un slash si le serveur web le nécessite. Elle ne peut contenir plus de 2048 caractères.

<lastmod>2009-04-11</lastmod>
Ce nœud est optionnel. La dernière date de modification du fichier sitemap. Le format de la date est écrit à l’anglo-saxonne YYYY-MM-DD.

<changefreq>hourly</changefreq>
Ce nœud est optionnel. C’est une information d’ordre général concernant la fréquence de changement de la page.
Les valeurs sont les suivantes :

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

La valeur "always" est utilisé pour une page qui est changé dès que 'on y accède. Inversement "never" est utilisée pour indiquer que les pages sont archivées.

Pour plus d’explication, voici celles données en anglais par “gros G” sur la définition des nœuds.
https://www.google.com/webmasters/tools/docs/en/protocol.html#xmlTagDefinitions

Un échantillon dument complète du fichier sitemap en xml

Rien ne vous interdit de faire figurer des commentaires au sein du fichier pour insérer des explications et rendre le fichier plus lisible par un être humain cette fois-ci et non un crawler :):)

	<?xml version="1.0" encoding="UTF-8"?>
	<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
	xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
	http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
	<url>
		<loc>http://social.hecube.net/</loc>
	        <lastmod>2009-04-11</lastmod>
		    <changefreq>hourly</changefreq>
	        <priority>1.0</priority>
	</url>
	<!-- la page d'accueil du blog change tous les jours enfin on essaye -->
	<url>
		<loc>http://social.hecube.net/blog</loc>
	        <lastmod>2009-04-11</lastmod>
	        <changefreq>daily</changefreq>
		      <priority>1.0</priority>
	</url>
	<url>
		<loc>http://social.hecube.net/groups</loc>
	        <lastmod>2009-04-11</lastmod>
	        <changefreq>daily</changefreq>
		      <priority>1.0</priority>
	</url>
	<url>
		<loc>http://social.hecube.net/about/</loc>
	        <lastmod>2009-04-11</lastmod>
	        <changefreq>weekly</changefreq>
	        <priority>0.5</priority>
	</url>
	<!-- to be continued... &agrave; suivre -->

Pour aller plus loin

Tout ce que vous voulez savoir sur les Sitemaps sans jamais…etc.

Le site officiel de SiteMap Generator, il faut se rendre dans la secion de download. Le logiciel est gratuit.