Conosci la cache di Google, il tool SEO che non ti aspetti
Sono in molti a ignorare la cache di Google, ma le informazioni che trasmette andrebbero lette ed analizzate da chiunque si occupi di SEO.
Questo post ha l'obiettivo di fornire una panoramica su questa funzione del motore di ricerca di Google in ottica SEO.
Ma cos'è la cache di Google?
La cache non è altro che la copia di una pagina web indicizzata dal motore di ricerca di Mountain View. Si tratta cioè del codice html che il bot di Google (Googlebot) realizza quando accede ad ogni singola pagina web.
E' possibile visualizzare la cache di ogni pagina indicizzata del nostro sito cercando in Google la singola pagina, e poi nei risultati andando a cliccare la freccetta rivolta verso il basso, presente accanto alla URL e nel menu che si apre cliccando su “Copia Cache”.
Avremo così la visualizzazione della nostra pagina, vista dagli occhi del Googlebot.
Ecco 4 funzionalità SEO che la Cache di Google ci offre per migliorare il posizionamento della nostra azienda nei motori di ricerca.
#1 Verifica dell'architettura del sito attraverso la cache di Google
Ogni pagina “cachata”, oltre al codice html della stessa, presenta anche una data (con relativo orario), che è riferita all'ultima volta che Google ha aggiornato la singola pagina nel proprio DB. Questa operazione si rende importante per capire se l' architettura del nostro sito aziendale è ottimale oppure no.
È ormai noto che Google ha problemi di indicizzazione dal 4° livello in giù. Più livelli esistono e maggiore deve essere l’operazione di link building interno per generare una link equity (equa distribuzione dei link internial sito).
Quando le pagine più periferiche (2° - 3° - 4° livello) vengono aggiornate raramente, c'è sicuramente qualcosa che non funziona nell'architettura del nostro sito: lo spider di Google potrebbe avere problemi a navigare il sito o non riuscire a navigarlo tutto.
Va anche precisato che l'aggiornamento da parte di Google di ogni singola pagina è direttamente proporzionale al “ PageRank” del sito. Quindi a Page Rank alti corrispondono aggiornamenti frequenti delle singole pagine in cache.
#2 Con la cache di Google puoi controllare l'accessibilità del sito
Spesso chi programma un sito pensa unicamente in funzione dell'utente. Ecco quindi che la visualizzazione dei prodotti di un ecommerce potrebbe essere molto diversa tra robot e utente.
Nell'istantanea sottostante si nota dalla cache di una pagina di un famoso brand di scarpe di lusso che la stessa visualizza per Google 12 modelli. L'utente invece con il sistema di caricamento tramite javascript ne potrà visualizzare 91 in quella stessa pagina! La pagina quindi priva Google della possibilità di indicizzare ben 79 modelli di scarpe.
Il problema viene poi parzialmente ovviato dalla sitemap del sito e dalla navigazione tra prodotti simili. Ma l'errore SEO risulta estremamente evidente grazie proprio alla cache di Google.
In un altro caso studio affrontato di recente, c'era un sito che di colpo ha visto perdere il traffico legato alle schede dei propri rivenditori. Le pagine dei rivenditori non erano sparite, ma non producevano più traffico.
Anche in questo caso la visualizzazione della cache ha mostrato come Google non riuscisse a caricare la pagina iniziale dei rivenditori a causa di una serie di javascript che favorivano lato utente il caricamento dei rivenditori in modo progressivo.
Di fatto le pagine dei rivenditori erano rimaste orfane di link entranti e, pur non essendo sparite dagli indici di Google, avevano perso importanza e quindi il traffico da loro prodotto era in netta caduta. La Search Console di Google, per altro, non segnalava l'impossibilità di caricare la pagina.
#3 Stabilire il PageRank Istantaneo
Il 12 Gennaio 2007 Aaron Wall, fondatore di SEO Book, pubblicava un articolo molto interessante dal titolo “Cache Date as the New Google PageRank” (La data della cache come nuovo PageRank di Google).
Nel post Aaron sottolineava come il non frequente aggiornamento nella visualizzazione del PageRank avesse portato la data della cache di Google ad essere la migliore misura dell'autorevolezza di una particolare pagina o di un sito. La considerazione di Aaron era semplice: le pagine che Google visita frequentemente, spendendo risorse significative per aggiornarle, sono le risorse che Google considera come importanti.
Volendo suffragare lo studio di Aaron Wall, nel 2015 ho creato un piccolo test monitorando 30 siti e rilevando la data della cache di Google per la loro Home Page (10 rilevazioni in orari diversi per una settimana).
Nel test ho evitato di considerare siti di news perchè in quel caso l'aggiornamento della cache è sempre nell'ordine di qualche ora.
I valori presi in considerazione sono stati:
- il PageRank dichiarato da Google (moltiplicato per 10 al fine di essere in una scala da 1 a 100),
- la Page Authority e il Domain Authority rilevati da Moz,
- l'indice della frequenza “inversa”, determinato sottraendo a 100 la media delle rilevazioni della data di cache espressa in ore (quante ore sono trascorse dalla creazione dell'ultima cache di Google).
Il grafico è il risultato di questo test.
Non si nota una correlazione diretta tra la frequenza “inversa” di aggiornamento della cache di Google e il PageRank, né con la Domain Authority e il Page Authority. Per il 12° sito però si nota che a fronte di un PageRank 6, sia la frequenza di cache, che la Page Authority, e la Domain Authority sono sotto la media.
Se al prossimo aggiornamento pubblico del PageRank, questo si sarà abbassato, la teoria risulterà rafforzata.
I siti presi in esame andavano da PageRank 3 fino a PageRank 8.
Ebbene nelle rilevazioni emerge però una media:
- Le home page dei siti con PageRank 7 vengono aggiornati in media ogni 18 ore.
- Le home page dei siti con PageRank 5 vengono aggiornati in media ogni 21 ore.
- Le home page dei siti con PageRank 4 vengono aggiornati in media ogni 26 ore.
- Le home page dei siti con PageRank 3 vengono aggiornati in media ogni 34 ore.
La quantità di siti esaminati con PageRank 6 e 8 non consentiva invece di estrarre valori.
Per ottenere risultati più interessanti bisognerebbe campionare almeno 100 siti con lo stesso PageRank e monitorarli nel corso di un anno. Quello che è possibile comunque fare è di rilevare sistematicamente la data di cache del sito della nostra azienda e quella dei nostri competitor.
Se la frequenza di rilevazione del nostro sito è migliore di quella dei nostri competitor, la nostra attività SEO presto o tardi darà i risultati sperati.
#4 Verifica del contenuto del sito
Entrando nella cache di Google, in alto abbiamo la possibilità di visualizzare la pagina a livello testuale (Text-only version o “Versione solo testo”). Cliccando tale link si otterrà la visualizzazione testuale del sito.
È bene verificare che Google sia in grado di visualizzare i testi presenti nella nostra pagina. Se un testo non dovesse essere visibile, bisognerà valutare ciò che impedisce al bot di visualizzare tale testo. Nella versione solo testo sarà anche opportuno verificare che Google legga correttamente i link presenti nella pagina. Va detto chiaramente che se il nostro sito aziendale ha animazioni in flash o fa uso di javascript per generare link è probabile che Google non riesca (ancora) a visualizzare tali link.
Una volta contati i link presenti nella cache di Google, potete andare a verificare che la Pagina effettiva non abbia un numero maggiore di link. Se così non fosse, significa che Google non è in grado di leggere i link.
Infine è opportuno assicurarsi che la singola pagina abbia almeno 400 parole testuali (escludendo quelle “linkate”) per avere una pagina ottimizzata.
Ecco tutti gli aspetti SEO che si possono analizzare attraverso la cache di Google.
In questo articolo ho indicato le 4 funzionalità SEO che ci vengono offerte dalla cache di Google per migliorare il posizionamento della nostra azienda in Google, a voi la possibilità di scoprirne altre.
Ricordate!
La SEO è fatta di tentativi, è passione per la sperimentazione e ricerca continua di nuovi insights da sfruttare per posizionare il nostro sito nel migliore dei modi possibili.
Buona SEO a tutti.
Conoscevi quest'uso della cache di Google?
Testa le sue funzionalità e fammi sapere che risultati ottieni.
Credits ( cache Google): Shutterstock