La gestione dei contenuti scaduti è un problema che annovera tutti i SEO, anche chi non si occupa direttamente di e-commerce o siti di annunci.
Cosa sono esattamente gli expired content?
Con questo termine ci si riferisce a contenuti che sono per loro natura rilevanti solo per un determinato periodo di tempo, come ad esempio schede prodotto, pagine di offerte, eventi, promozioni e concorsi.
Succede spesso che i webmaster non si occupino di questa attività, e i problemi che ne derivano sono, tra gli altri:
- l’eliminazione di pagine senza un’attenta analisi delle possibili conseguenze, sia dal punto di vista dell’ indicizzazione che del posizionamento,
- la duplicazione di contenuti già esistenti,
- la conservazione di informazioni non aggiornate che inficiano la qualità complessiva del sito,
- il mantenimento di pagine obsolete che sovraccaricano il crawl budget e i tempi di caricamento.
Sostanzialmente le modalità di gestione degli expired content sono tre: eliminare la pagina attribuendole uno status code 404, reindirizzare la pagina, oppure mantenere il contenuto sul sito.
Queste tre soluzioni presentano vantaggi e svantaggi: approfondiamole insieme.
Contenuti scaduti: status code 404, 410 o redirect 301?
Generalmente, quando il contenuto non ha più senso di esistere viene eliminato dal sito, generando un errore 404, noto anche come “Page not found” o "Pagina non trovata". Nonostante Google, nel 2011, abbia affermato che gli errori 404 non influiscono negativamente sul rendimento del sito nelle SERP, secondo la mia opinione, è fondamentale gestirli, in quanto rendono più difficoltosa la ricerca degli utenti (che potrebbero essere indotti ad abbandonare il sito) e causano uno spreco di risorse destinate alla scansione.
Quando mi trovo a gestire siti di grosse dimensioni, in particolare e-commerce, all’interno della Search Console riscontro una marea di errori 404, che si sono accumulati nel tempo. Per verificare che effettivamente questi 404 non vadano ad impattare sulla “salute del sito” li analizzo uno ad uno e solo successivamente decido se è il caso di effettuare un reindirizzamento, o di fornire un codice di stato HTTP 410 Gone (nel tentativo di accelerare l’eliminazione della risorsa dai risultati di ricerca).
Per determinare ciò, è necessario porsi delle domande, che possono essere utili durante la valutazione: le URL si posizionano? Ricevono ancora traffico? Offrono all’utente informazioni utili ed aggiornate?
Al fine di migliorare l'esperienza dell'utente, ad ogni modo, consiglio di implementare una pagina 404 personalizzata, da utilizzare al posto di quella standard. Questa pagina dovrà essere fedele allo stile del sito, dovrà contenere un messaggio chiaro ed accattivante, oltre ad uno o più link utili che permettano il proseguimento della navigazione o un form di contatto che favorisca la conversione. Ecco un esempio:
La pagina 404 personalizzata di Lavazza, non solo regala un sorriso all’utente, facendogli dimenticare che è atterrato su una pagina inesistente, ma lo mette in condizione di tornare ad esplorare il sito.
Una volta capiti gli svantaggi nella gestione degli expired content con uno status code 404, bisogna valutare quale potrebbe essere una modalità alternativa. Come fare? Sicuramente si potrebbe utilizzare un tool che sia capace di verificare il posizionamento delle pagine e i backlink ricevuti, come SEMrush.
Dopo aver inserito il dominio oggetto di analisi nella piattaforma, si dovrebbe selezionare lo strumento Ricerca organica e successivamente cliccare sulla voce “Pagine”.
Questo report mostra tutte le URL del sito, indicando i dati sulla percentuale di traffico che genera la suddetta pagina, la quantità di parole chiave posizionate in Google e i backlink che puntano alla risorsa.
Successivamente verificherei traffico e conversioni acquisite da queste pagine, mediante Google Analytics. Dopo aver selezionato “Comportamento” > “Contenuto del sito” > “Pagine di destinazione”, imposterei il segmento su "Traffico organico" e selezionerei un confronto tra due intervalli di date che mi permettano di verificare l’andamento del traffico della pagina prima e dopo che il contenuto sia “scaduto”.
Nel caso valga la pena salvaguardare il posizionamento e l’autorevolezza acquisiti nel tempo dalla pagina suggerirei di reindirizzarla verso il contenuto più affine e pertinente possibile.
Il redirect 301, infatti, è un reindirizzamento permanente che trasferisce 90% - 99% di link juice alla pagina di destinazione.
Questa scelta permetterebbe anche di mantenere una continuità nella navigazione dell'utente e di salvaguardare il budget di scansione. Ma attenzione! È necessario trasferire l’utente su una pagina che sia davvero utile e pertinente. In caso contrario, il rischio che si corre, secondo John Mueller, è che il redirect venga ignorato e trattato come un soft 404:
Nel caso non trovi una valida alternativa per il reindirizzamento, e non valga la pena mantenere il contenuto sul sito, sempre meglio mantenere un 404, o ancora meglio, trasformare lo status in 410.
Un altro caso in cui probabilmente non aggiungerei un reindirizzamento 301 è quando il sito ha un elevato turnover di prodotti che vengono regolarmente sostituiti da nuove versioni. L'aggiunta di un reindirizzamento per ogni nuova versione del prodotto causerebbe, nel giro di poco tempo, una serie di redirect chains e tempi di caricamento lunghissimi. In un mondo ideale bisognerebbe gestire questa situazione in fase di pubblicazione del sito, riducendo le possibilità di dover cambiare l’indirizzo quando un nuovo prodotto diviene disponibile.
Per approfondire leggi il post: SEO e redirect: come, quali e quando usarli.
Expired content: soluzioni per mantenere il contenuto sul sito
A volte le pagine con contenuti scaduti sono comunque ricche di informazioni utili per gli utenti del sito, di conseguenza potrebbe valere la pena mantenerle. Lato SEO, infatti, è molto più facile ri-posizionare un vecchio contenuto piuttosto che crearne uno da zero. Vediamo insieme alcuni esempi pratici:
Prodotto di un e-commerce esaurito che verrà rifornito a breve
La pagina, ovviamente, deve rimanere sul sito, ma la non disponibilità del prodotto deve essere comunicata a Google nel miglior modo possibile, sia per far fronte all’alto tasso di frequenza di rimbalzo, che per migliorare l'esperienza complessiva dell'utente. Si potrebbe, ad esempio, pensare di inserire una call to action che inviti l’utente a lasciare la propria mail per ricevere una notifica quando il prodotto sarà nuovamente disponibile, come fa Zalando:
Prodotto stagionale, come nel caso dei prodotti di moda (es. costumi da bagno)
La pagina dovrebbe essere lasciata sul sito e riproposta due o tre mesi prima del periodo di picco delle ricerche. Perché? Queste schede prodotto potrebbero aver acquisito un buon posizionamento ed una notevole quantità di link equity nel tempo. Se non si desidera mostrare la pagina durante la bassa stagione si potrebbe pensare, oltre ad eliminarla dal menu e dalla sitemap.xml, di aggiungere un meta tag noindex. Di conseguenza, gli utenti non sarebbero più in grado di accedere a quel link dai risultati di ricerca, ma solo tramite collegamenti diretti.
Sostituzione con una nuova linea di prodotto
Anche in questo caso, se la vecchia pagina è ben posizionata e genera traffico, si potrebbe pensare di mantenere il contenuto e di aggiungere una call to action che raccomandi il contenuto correlato. Mi è capitato di utilizzare questo “escamotage” con un cliente che vende prodotti di bellezza, dove mi è stato esplicitamente richiesto di mantenere anche la vecchia linea, per consentire di esaurire le scorte del magazzino (sotto, un'immagine di esempio). Ma, attenzione! Il rischio di questa scelta è che si vadano a creare contenuti duplicati che, se non gestiti correttamente, potrebbero risultare poco favorevoli per il posizionamento del sito.
Annuncio scaduto, come nel caso di un’offerta di lavoro, un prodotto in offerta, oppure una casa in vendita
Gestendo diversi clienti appartenenti all’ambito immobiliare, ho imparato che gli annunci, dopo la loro data di scadenza, continuano a portare tantissimo traffico, perché le persone sono curiose di sapere cosa è stato venduto. Pertanto, in questo caso, almeno inizialmente, suggerirei di mantenere i contenuti sul sito, specificando che il prodotto è stato venduto e inserendo una call to action efficace, che inviti l’utente a consultare i prodotti simili ed un form di contatto per contattare l’agenzia. Questa soluzione è particolarmente indicata anche per gli eCommerce che vendono pochi prodotti, unici nel loro genere. Presterei solo attenzione che Google non consideri questa pagina come un soft 404. A detta di John Mueller, infatti:
What is happening here is that our algorithms are looking at these pages and they’re seeing that there’s maybe a banner on this page saying ‘This product is no longer available and they assume that that applies to the page’ […] That’s sometimes not really avoidable. If you’re really replacing one product with another it might make sense to just redirect [the page]
Contenuto temporaneo che si ripete periodicamente nel tempo (es. eventi ricorrenti)
Immaginiamo di voler riproporre un evento che ha avuto la sua prima edizione l'anno precedente. In questo caso non è necessario creare un nuovo contenuto ad hoc che racconti l’evento, tutto ciò che devi fare è aggiornare la pagina e riproporla sui social network! Un solo consiglio: non inserire l’anno o la data nell'URL, ma solo il nome dell’evento, ad esempio www.example.com/it/black-friday. Ciò consentirà alla popolarità dell'URL di crescere man mano che aumenta la popolarità dell'evento. Se, invece, un sito è prettamente dedicato ad un evento che si ripete nel corso degli anni, dovresti mantenere le informazioni sulle edizioni passate, perchè le persone potrebbero essere curiose di rivedere temi e sessioni, per capire se è il caso di partecipare. Ecco ad esempio il sito di Web Marketing Festival:
Articoli o post di notizie
Un’attività fondamentale della SEO, spesso dimenticata, consiste nell’ aggiornamento o nella potatura di vecchi post del blog, fornendo informazioni aggiornate e di qualità, al fine di migliorare il posizionamento e aumentare le visite. Generalmente tengo monitorati i risultati dei miei post, sia dal punto di vista del traffico organico, che del posizionamento, e quando vedo che iniziano a subire un’oscillazione negativa, cerco di capire cosa potrei migliorare per rendere la notizia di nuovo pertinente, affidabile e interessante.
Recentemente, infatti, è tornato alla ribalta il concetto di E-A-T (una sigla che sta per Expertise, Authoritativeness e Trustworthiness): bisogna fornire agli utenti contenuti di qualità elevata, prodotti da autori che siano autorevoli nel proprio campo.
Per approfondire leggi il post: Come evitare di essere colpito dall’aggiornamento Google E.A.T.
Successivamente procedo con una revisione delle ottimizzazioni del contenuto lato SEO. Per farlo, cerco di capire se le parole chiave continuano a mantenere una buona posizione, ma soprattutto se rispettano l’intento di ricerca dell’utente (in quanto, in seguito agli aggiornamenti dell’algoritmo, esso potrebbe anche cambiare). Lo strumento che utilizzo principalmente (oltre alla Search Console) è ancora SEMrush: inserisco il dominio del mio blog e clicco su Ricerca organica. Oltre ad uno sguardo generale sui dati, mi concentro sui cambiamenti di posizione, in particolare sulle chiavi “perse” nell’ultimo mese.
Infine, cerco di ottimizzare il contenuto in ottica di fruizione mobile e vocal search; il modo in cui gli utenti ricercano le informazioni su Internet, infatti, sta prepotentemente cambiando, grazie agli assistenti vocali sviluppati negli ultimi anni. L’amministratore delegato di Google Sundar Pichai, a tal proposito, ha recentemente affermato che già oggi un quinto delle ricerche sul motore di ricerca è costituito da query vocali. Perché aspettare?
Per approfondire leggi il post: Voice First e Ricerca vocale: come cambiano i contenuti?
È possibile gestire automaticamente gli expired content?
La risposta è sì! Al momento della creazione della pagina è possibile impostare una data di scadenza del contenuto utilizzando il meta tag unavailable_after. L’uso di questo tag è particolarmente consigliato su siti e e-commerce di grandi dimensioni, dove diventa difficile gestire manualmente tutte le pagine.
Ad esempio, se hai un contenuto promozionale che desideri rimuovere dai risultati di ricerca l’01/12/2019 alle ore 18.30 basterà inserire questa stringa di codice nell’head della pagina:
<META NAME="GOOGLEBOT" CONTENT="unavailable_after: 01-Dec-2019 18:30:00 EST">
Una volta che Google eseguirà la scansione della pagina e vedrà questo meta tag, impiegherà circa un giorno per far sparire la pagina. Per impostare una data di scadenza sui post e sulle pagine esistono anche appositi plugin, come ad esempio Post Expirator, Post Expiration Date (per WordPress), ma anche Traceability and expiration date (per Prestashop). L’uso di Post Expirator è semplicissimo: dopo aver installato e attivato il plugin apparirà un metabox all’interno della pagina, dove sarà possibile selezionare la data di scadenza e la tipologia di gestione del post. Esistono diverse opzioni tra cui scegliere: eliminarlo definitivamente, trasformarlo in bozza, oppure cambiarne la categoria.
Conclusioni
Qual è il giusto approccio per i contenuti scaduti? Si potrebbe dire che non c’è una risposta assoluta in merito alla gestione degli expired content: tutto dipende dalla tipologia di sito e dalla rilevanza dei suoi contenuti. Ci sono anche casi in cui è necessario optare per una scelta specifica, ed altri in cui si potrebbe pensare di effettuare una combinazione delle diverse modalità di gestione. Ad esempio, come consigliato da John Mueller in un hangout del 2017, si potrebbe pensare di lasciare la pagina online per un determinato periodo di tempo, al fine di catturare tutte quelle persone che possono essere ancora interessate al contenuto, per poi passare ad un redirect 301 verso una pagina più pertinente o ad uno status code 410, quando i risultati iniziano a non essere più rilevanti rispetto all’impatto negativo che potrebbe avere la scansione di queste pagine sul crawl budget.
E voi, gestite gli expired content? Se sì, come?
Lasciate, come sempre, un commento qui sotto.