Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Una mappa per Google

Google Sitemap, farsi trovare dal motore di ricerca inserendo una mappa XML nel sito
Google Sitemap, farsi trovare dal motore di ricerca inserendo una mappa XML nel sito
Link copiato negli appunti

Ciascun webmaster ha a cuore la visibilità del proprio sito. A tale scopo la principale opzione è la presenza tra i risultati dei motori di ricerca, in particolare tra quelli di Google.

Segnalando l'URL principale del sito, le sue pagine verranno visitate dallo spider che alimenta il database del motore di ricerca ed indicizzate secondo specifici criteri. Ma siamo sicuri che lo spider analizzi tutte le pagine del sito? Ogni quanto tempo torna a visitarlo per acquisire eventuali aggiornamenti? Che criteri utilizza per stabilire quali sono le pagine più importanti del sito?

Le modalità classiche per interagire con gli spider dei motori di ricerca sono costituite dal file robots.txt, che elenca le pagine che si vuole escludere dall'indicizzazione, e dsl meta tag HTML robots per consentire o inibire l'indicizzazione della pagina corrente e dei suoi link (Es.: <meta name="robots" content="noindex, nofollow").

Dallo scorso anno Google ha lanciato un meccanismo per fornire indicazioni al proprio spider basato sulle cosiddette Sitemap (mappa del sito).

La mappa di un sito

La mappa di un sito non è altro che un elenco di link del sito contenente alcune informazioni utili allo spider per pianificare l'indicizzazione del sito stesso. È possibile, ad esempio, indicare la frequenza di aggiornamento e la rilevanza di una pagina all'interno del sito. Sfruttando queste informazioni lo spider conosce quali pagine del sito indicizzare, con che frequenza e che importanza attribuire a ciascuna pagina.

Ma la mappa non serve soltanto allo spider. Essa serve anche al webmaster per sottoporre pagine che altrimenti non verrebbero indicizzate perché non sono accessibili allo spider. Si pensi a pagine visualizzate soltanto come risultato di una ricerca o a pagine accessibili solo da una home page basata interamente su Flash. Con una mappa possiamo indicare allo spider di Google le pagine che vogliamo siano indicizzate anche se non direttamente accessibili.

Creiamo una mappa

Come è fatta una mappa per Google? Abbiamo due possibilità:

  • una semplice lista di URL inseriti in un file di testo
  • un file XML basato su un apposito linguaggio

La prima soluzione è estremamente semplice, ma non fornisce altre informazioni allo spider se non quali pagine visitare. La soluzione basata su XML, invece, consente di specificare, oltre alla lista di URL, anche la frequenza di aggiornamento e la priorità delle pagine all'interno del sito. Consideriamo il seguente esempio di mappa XML:

Listato 1. Esempio di mappa XML

<?xml version="1.0" encoding="UTF-8"?>
  <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   <url>
    <loc>http://www.dominio.it/</loc>
    <lastmod>2006-05-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.7</priority>
   </url>
   <url>
    <loc>http://www.dominio.it/news.html</loc>
    <lastmod>2005-05-01</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.5</priority>
   </url>
</urlset>

In esso vengono specificati due URL tramite il tag <url>. Per ciascuno di essi viene specificata la data dell'ultima modifica (<lastmod>), la frequenza di aggiornamento (<changefreq>) e la priorità della pagina (<priority>). Quest'ultima informazione non contribuisce ad aumentare il Page Rank della pagina, ma indica semplicemente che importanza ha la pagina rispetto alle altre all'interno del sito e può avere valori che vanno da 0.1 a 1.0.

La sintassi della versione XML è estremamente semplice. Segnaliamo che i tag <lastmod>, <changefreq> e <priority> sono opzionali e che una mappa XML che non utilizza i tag opzionali corrisponde esattamente ad una mappa testuale in forma di elenco di URL.

La mappa delle mappe

La definizione del formato delle mappe di Google pone alcune limitazioni. Una mappa, infatti, non può contenere più di 50.000 link e non può superare i 10 MB di dimensione. Queste limitazioni, in realtà, sono abbastanza ragionevoli per la maggior parte dei siti web.

Per siti di grandi dimensioni è possibile utilizzare più mappe, fino ad un massimo di 1.000. In questo caso è necessario utilizzare un file indice che contiene un elenco di riferimenti alle mappe del sito.

Listato 2. Esempio di indice di mappe

<?xml version="1.0" encoding="UTF-8"?>
  <sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
   <sitemap>
    <loc>http://www.dominio.it/sitemap1.xml</loc>
    <lastmod>2006-05-01</lastmod>
   </sitemap>
   <sitemap>
    <loc>http://www.example.com/sitemap2.xml</loc>
    <lastmod>2006-05-01</lastmod>
   </sitemap>
  </sitemapindex>

In esso sono segnalate due mappe (<sitemap>) e per ciascuna è indicata la posizione e la data di ultima modifica. È possibile utilizzare più mappe per un sito anche soltanto per una questione di organizzazione delle pagine. Ad esempio, ciascuna mappa può corrispondere ad un'area del sito.

Pubblicazione della mappa

La mappa di un sito e l'eventuale indice di mappe possono essere pubblicati in qualsiasi punto del sito. Occorre però tener presente che una mappa pubblicata, ad esempio, all'indirizzo http://www.dominio.it/esempio/mappa.xml può contenere soltanto URL che iniziano per http://www.dominio.it/esempio. La presenza di URL che puntano altrove non verranno considerati validi. Per evitare eventuali errori, pertanto, è opportuno pubblicare la mappa sulla root del sito.

Una volta pubblicata la mappa, occorre notificare la sua presenza a Google accedendo all'apposita area riservata. La notifica richiede una semplice procedura di verifica dell'autenticità dell'autore del sito, spiegata abbastanza chiaramente all'interno dell'area.

Strumenti per le mappe

Come abbiamo avuto modo di vedere, la creazione di una mappa è abbastanza semplice. Anche chi non ha molta dimestichezza con XML non dovrebbe avere grosse difficoltà a creare una mappa per il proprio sito, grazie anche alla semplicità del linguaggio. Tuttavia, la creazione manuale di una mappa anche solo di alcune decine di URL può richiedere diverso tempo e può essere soggetta ad errori.

Prima di pubblicare la mappa e segnalarla a Google è possibile effettuare una validazione rispetto allo schema del linguaggio XML. Google pubblica lo XML Schema per le mappe all'indirizzo http://www.google.com/schemas/sitemap/0.84/sitemap.xsd e per gli indici all'indirizzo http://www.google.com/schemas/sitemap/0.84/siteindex.xsd. Per la validazione è possibile utilizzare qualsiasi parser validante. L'utilizzo di strumenti per la generazione automatica di mappe si rivela utile sia per generarle in pochi secondi sia per mantenerle aggiornate.

Lo stesso Google mette a disposizione un programma open source, Sitemap Generator, per la generazione di mappe in maniera automatica. Fornendo alcune indicazioni di base, come l'URL principale o una lista di cartelle o di link, il programma genera la mappa completa di data di ultima modifica. Fornendo anche i log del web server, Sitemap Generator è in grado persino di dedurre la priorità da assegnare a ciascun URL. Il lato negativo di questo programma è che richiede di essere eseguito direttamente sul web server. Esistono comunque strumenti sviluppati da terze parti che offrono potenzialità analoghe a Sitemap Generator. Tra gli altri segnaliamo Gsitemap, un programma per Windows molto intuitivo e semplice da utilizzare.

Conclusioni

Come abbiamo visto, la creazione di mappe per agevolare l'indicizzazione del sito da parte dello spider di Google non è poi così complicata. Occorre però tenere presenti alcune considerazioni:

  • l'uso delle mappe si affianca ma non sostituisce il meccanismo di indicizzazione standard
  • al momento soltanto Google supporta le mappe
  • la presenza di una mappa per un sito o l'indicazione delle priorità non consente di ottenere un migliore posizionamento nei risultati

In sostanza, la creazione di mappe non stravolge il posizionamento del vostro sito nei risultati di Google. I vantaggi reali che al momento si possono ottenere consistono nella possibile indicizzazione di pagine non direttamente raggiungibili ed nel traffico generato dallo spider proporzionale alla frequenza di aggiornamento delle pagine.

Ti consigliamo anche