sitemapDefinitia universal acceptata, a unui site map (harta a site-ului) este aceea de model vizual ierahizat al unui site web. Hartile unui site ajuta vizitatorii sa navigheze printr-un web site care are mai mult decat o singura pagina prin indicarea diagramei intregului continut al site-ului dupa modelul cuprinsului unei carti. In cadrul acestui sistem, fiecare sectiune a site map-ului reprezinta un link direct spre pagina corespunzatoare din cadrul site-ului.

Din punctul de vedere al optimizarii pentru motoarele de cautare, realizarea unui site map este deosebit de utila in special atunci cand este vorba despre site-uri cu un numar mare de pagini, despre cele dinamice insa nu numai. Motoarele de cautare, fara exceptie, utilizeaza programe (spider) pentru a cauta si indexa site-urile noi. O data gasit site-ul, aceste programe urmeaza link-urile pentru a aduna informatii despre el si despre continutul sau. Prin utilizarea unui site map, motoarele de cautare vor reusi sa indexeze mai repede, mai bine si mai complet site-ul d-voastra. Trebuie mentionat ca acesti spideri viziteaza site-urile cu o oarecare regularitate pentru a vedea modificarile de continut care li se aduc. (Cu cat mai des robotii motoarelor de cautare considera ca trebuie sa revina la un site, cu atat acesta va fi mai bine cotat). De asemenea, pentru Google si Yahoo cel putin, utilizarea de site map este una dintre modalitatile prin care se poate face submission. Cu toate acestea, vechile metode de indexare nu au fost abandonate, respectivul protocol avand exculsiv scopul de a oferi informatii suplimentare motorului de cautare.

Importanta acestul subiect se modifica atunci cand vorbim despre site-uri cu caracter dinamic care, trebuie spus, sunt mai greu indexate. In acest caz particular, site map-ul este singura modalitate de a va asigura de o indexare completa, de faptul ca motoarele de cautare vor fi la curent cu modificarile aduse.

Exista doua tipuri principale de site map:

  • cel cerut de motoarele de cautare, care implementeaza fiecare propriul protocol de sitemap (Google, Yahoo)
  • cel oferit de webmaster, cu utilizari distincte insa avand aproximativ acelasi scop.

Google sitemaps

Site map-urile general acceptate de catre Google pentru a ajuta la procesul de indexare al paginilor sunt realizate in format XML. Acest tip de protocol de realizare a site map-urilor consta din tag-uri XML:

  • trebuie sa inceapa si sa se incheie cu tag-ul urlset
  • trebuie sa contina tag-ul url pentru fiecare URL in parte ca tag parinte XML
  • trebuie sa contina un tag loc ca si child entry pentru fiecare url tag parinte.
  • optional, pot fi adaugate tag-urile lastmod, changefreq, priority

Exemplu:

 <?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   <url>
      <loc>http://www.exemplu.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://www.example.com/catalog?item=12&desc=vacanta_hawaii</loc>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.exemplu.com/catalog?item=73&desc=vacanta_noua_zeelanda</loc>
      <lastmod>2004-12-23</lastmod>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.exemplu.com/catalog?item=74&desc=vacanta_newfoundland</loc>
      <lastmod>2004-12-23T18:00:15+00:00</lastmod>
      <priority>0.3</priority>
   </url>
   <url>
      <loc>http://www.exemplu.com/catalog?item=83&desc=vacanta_sua</loc>
      <lastmod>2004-11-23</lastmod>
   </url>
</urlset>
 

Explicitarea tag-urilor:

  • urlset – incadreaza fisierul si face referire la standardul de protocol current (este obligatoriu)
  • url – Parent tag pentru fiecare URL (obligatoriu)
  • loc – URl-ul paginii. Trebuie sa inceapa cu un protocol (http) si sa se incheie cu un slash (/) (obligatoriu)
  • lastmod – ultima data la care a fost modificat, ar trebuie sa fie data oficiala W3C (optional)
  • changefreq – frecventa cu care se va schimba site map-ul. Reprezinta un indicator pentru spiderii motoarelor de cautare privind la frecventa cu care trebuie sa revina la un anume site. Cu toate acestea nu este garantat ca ea va fi respectata. (optional)
  • priority – prioritatea acestui URL in raport cu alte URL-uri ale aceluiasi site. Valori valide sunt intre 0.0 si 1.0. Valoarea stabilita prin default este de 0.5. Trebuie spus ca aceasta mentiune nu influenteaza pozitia URL-ului in SERP ci foloseste doar la stabilirea importantei fiecarei pagini in parte din cadrul unui site. (optional).

Se recomanda de asemenea folosirea de cod in locul anumitor caractere speciale dupa cum urmeaza:

  • & – &amp;
  • ‘ – &apos;
  • ” – &quot;
  • > – &qt;
  • < – &lt;.

In cazul site-urilor cu mai mult de 50000 de pagini, datorita restrictiilor impuse de Google, trebuie realizate harti multiple. Este acceptata si arhivarea acestora in format .gz insa, dezarhivate nu trebuie sa depaseasca 10 MB fiecare. Aceste multiple sitemaps vor fi stocate intr-un fisier numit Sitemap index. Formatul unui asemenea fisier, XML, nu difera cu mult de cel al unui site map cerut de Google iar tag-urile utilizate sunt :loc, lastmod, sitemap, sitemapindex.

Exemplu:

<?xml version="1.0" encoding="UTF-8"?>
   <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
   <sitemap>
      <loc>http://www.exemplu.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.exemplu.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
   </sitemapindex>

Yahoo site maps

Urmand acelasi principiu ca si Google, motorul de cautare Yahoo pune si el la dispozitie o modalitate de indexare prin site map submission. Spre deosebire insa de Google, Yahoo accepta si harti de tip RSS de forma:

<rss version="2.0">
 	-<channel>
		<title>Site Map www.exemplu.com</title>
		<link>www.exemplu.com</link>
		<description>Site map pentru www.exemplu.com</description>
		<lastBuildDate>Mon, 22 May 2006 07:01:46 +0000</lastBuildDate>
		<generator>SiteMap XML www.exemplu.com</generator>
	      <item>
		<title>Exemplu de site map rss</title>
		<link>http://www.exemplu.com/</link>
		<description>Exemplu- Descrierea exemplului.</description>
	      </item>
	</channel>
</rss>

Tipuri de site maps oferite de webmasteri
Pentru o mai usoara navigare in cadrul unui site, webmasterul poate (si este indicat sa o faca) pune la dispozitia vizitatorilor un cuprins al site-ului respective. Dupa cum am afirmat si mai sus, acesta trebuie sa contina link-uri valide pentru fiecare sectiune in parte si, optional, un scurt text descriptiv cu privire la functiile acesteia. Daca sectiunile sunt la randul lor divizate, este indicat ca subdiviziunile sa fie plasate astfel incat relationarea sa fie corect reprezentata. In aceasta categorie intra si site map-urile de tip HTML si cele de tip TEXT. Site map-urile de tip HTML ofera link-uri vizibile vizitatorilor, descriptive si care pot fi indexate de o categorie de motoare de cautare. Site map-urile de tip TEXT reprezinta un format alternativ care este recunoscut doar de anumite motoare de cautare. Vom exemplifica prin modele fiecare tip in parte.