La canonicalizzazione degli URL, e quindi delle pagine, è un ambito che trova spesso incomprensioni nella SEO. Inizialmente si comprende a cosa serve (più o meno) ma poi implementarlo nella pratica può creare delle problematiche.
Una corretta implementazione è fondamentale in quanto l’impatto negativo dovuto ad errori tecnico potrebbe rivelarsi quasi fatale per la SEO del tuo sito web.
Affidarsi a troppi automatismi o plugin spesso non è la scelta migliore, perciò cerchiamo di andare affondo alla questione, in questo articolo vedremo una panoramica completa di cos’è, come funziona e come si implementa un tag canonical.
Cos’è un URL canonico?
Partiamo dal principio, anzitutto cos’è un URL canonico? Dalla documentazione ufficiale di Google troviamo questa definizione così riassunta:
Un URL canonico è l'URL della pagina che Google ritiene più rappresentativo tra un insieme di pagine duplicate sul tuo sito.
Facciamo un esempio:
Se abbiamo una pagina del nostro sito che potrebbe essere mostrata con due indirizzi diversi è necessario comunicare attraverso a Google quale URL ritengo principale. Vedremo poi come fare ad inserire il tag.
-
iltuositoweb.it/categoria/nome-categoria
-
iltuositoweb.it/categoria?search=nome-categoria
Entrambe gli URL mettiamo che mostrino i soliti identici contenuti, questo significa che sono pagine duplicate, bene in questo caso è necessario specificare che il primo URL è canonical, ovvero principale.
Chiaro il concetto? Un errore molto comune che purtroppo capita è quello di non impostare gli URL canonici per la versione www o no www del dominio. Ricordatevi che se il sito viene richiamato da browser sia con la versione www che senza www, oltre ad essere un problema tecnico che va immediatamente risolto, per il Google sono due pagine diverse, idem per gli URL http e https.
Attenzione che se continuiamo a leggere la guida di Google troviamo scritto:
Tieni presente che le pagine non devono necessariamente essere identiche; modifiche di lieve entità nell'ordine o nei filtri delle pagine con gli elenchi non rendono la pagina unica
Quindi le pagine non devono essere necessariamente identiche, ma anche se ci sono lieve modifiche. Ma perché Google è così fiscale? A cosa gli serve il Canonical URL? Ci arriviamo, non avere fretta.
L’ultimo punto su cui voglio porre la tua attenzione è questo:
La pagina canonica può trovarsi su un dominio diverso da quello della pagina duplicata.
Capisci quindi che non si tratta solo di installare un plugin? Ok andiamo avanti.
Sicuro di non avere contenuti duplicati?
Questa domanda può sembrare un po’ strana, ma in realtà non lo è! Il fatto che tu sia certo di non aver creato pagine duplicate non significa che non ne hai, specialmente se utilizzi un CMS. Si tratta principalmente di un discorso tecnico e specialmente nella gestione dei permalink dinamici (ricordati che ogni pagina viene creata dinamicamente in PHP), pertanto spesso può capitare che con diverse tipologie di URL vengano mostrate le solite pagine, eccone un piccolo esempio:
https://www.sitoweb.com/category/product-a/
https://www.sitoweb.com/product-a/
https://sito.com/product-a/
http://www.sito.com/product-a/
http://sito.com/product-a/
https://m.sito.com/product-a/
https://www.sito.com/product-a
https://www.sito.com/product-A/
Sappi che ognuna di questi URL, per il motore di ricerca, sono pagine diverse e quindi 8 pagine duplicate.
Un altro errore comune, e che forse avrai avuto modo di trovarlo a giro per il web, è questo:
https://www.sitoweb.com/
https://www.sitoweb.com/index.php
Vedi com’è facile che si verifichino contenuti duplicati senza che ce ne accorgiamo? Proprio per questo una buona gestione degli URL canonici ci aiutano a superare questo ostacolo.
Come si implementa il tag canonical?
L’utilizzo della regola “canonical” è abbastanza semplice da implementare. Per farlo è necessario inserire all’interno dei tag <head></head> la seguente stringa:
<link rel="canonical" href="https://urldellapaginacanonica" />
Quindi non ti resta che mettere in pratica questo semplice passaggio, attenzione però perché la difficoltà della gestione dei canonical è principalmente di natura strategica.
Esistono anche altre alternative per inserire l’istruzione degli URL canonici:
-
Impostare una risposta all'intestazione HTTP rel=canonical
-
All’interno della sitemap (tuttavia, mentre tutte le pagine elencate in una sitemap del sito sono suggerite come canoniche; Google deciderà quali pagine (se presenti) sono duplicate).
-
Usare un redirect 301
Detto questo, sebbene questi siano tutte modalità consigliate da Google, non tutti sono adatti per l'uso in ogni situazione.
Solo per essere consapevole, l'impostazione di URL canonici non è un requisito e, nei casi in cui non ne specifichi uno, Google utilizzerà altri segnali per identificare la pagina che ritiene sia la versione migliore.
Tuttavia, si consiglia di utilizzare la cannibalizzazione in modo efficace, per assicurarsi di essere in grado di controllare il modo in cui il sito appare sui motori di ricerca e per prevenire problemi che sorgono a causa di contenuti duplicati.
Nota: per quanto riguarda le pagine AMP è necessario seguire una guida specifica, per maggiori dettagli visita la guida ufficiale.
Linee guida generali e consigli pratici
Sebbene esistono delle linee guida per l'implementazione corretta del tag canonical, Google ha rilasciato anche delle linee guida generali per evitare errori. Vediamoli velocemente insieme:
-
Non utilizzare istruzioni nel file robots.txt per canonicalizzare gli URL;
-
Non utilizzare lo strumento per la rimozione degli URL;
-
Non specificare URL diversi come canonici per una stessa pagina;
-
Non utilizzare l’attributo noindex per impedire la selezione di una pagina canonica;
-
Utilizza preferibilmente il certificato HTTPS a HTTP per gli URL canonici;
-
Utilizza solo un tag canonical per pagina;
-
Utilizza l'URL completo;
Seguendo queste linee guida potrai evitare la maggior parte delle problematiche dovute alla gestione dei tag canonici.
Perché è importante il tag rel=”canonical”?
Ok, abbiamo capito cos’è il canonical, come gestirlo, come inserire il tag, ma perché è così importante?
Quando Googlebot indicizza un sito web prova a determinare quali sono i contenuti principali di una pagina e di indicizzare nella maniera più coerente e corretta in base poi alle ricerche degli utenti.
Se una o più pagine hanno i soliti contenuti (o molti simili) succede che Google deve scegliere lui quale delle pagine è più completa e quindi “principale” (canonica), capisci bene che essendo un algoritmo può sbagliare ed indicizzare una pagina anziché un’altra e quindi creare un bel casino.
Sappi anche che le pagine canoniche vengono sottoposte a scansione con maggiore regolarità rispetto alle pagine duplicate, questo perché Google cerca di ridurre il carico il più possibile (crawl budget).
Una corretta gestione del tag canonical quindi ti permette di avere pieno polso sulle pagine da indicizzare, quindi che aspetti, corri subito a sistemare i tag del tuo sito!