Come districare l'architettura di un sito Web con oltre 500.000 pagine

Nick Brown

ago 02, 201912 min di lettura
Come districare l'architettura di un sito Web con oltre 500.000

Il sito Web di un'azienda è per molti versi come un negozio o un ufficio digitale. È dove i clienti, o potenziali tali, interagiscono con l'azienda. È il luogo in cui effettuano il primo contatto e alla fine acquistano i prodotti o i servizi dell'azienda. Un sito commerciale, proprio come un ufficio o un negozio, dovrebbe essere attraente e accogliere nel migliore dei modi i visitatori.

Un sito Web deve essere facile da navigare e consentire a chi vi entra di trovare rapidamente ciò che desidera.

In effetti, è ancora più importante per un sito avere una struttura semplice. Ciò è dovuto all'impatto negativo che una scarsa architettura del sito può avere sulla SEO. Se i bot di Google e i crawler dei motori di ricerca non riescono a capire come navigare all’interno di un sito, possono causare grossi problemi.

Sfortunatamente, è fin troppo facile che l'architettura di un sito diventi confusa e disordinata, anche se il proprietario o webmaster del sito ha iniziato con le migliori intenzioni. Le operazioni quotidiane di un'azienda spesso ostacolano la migliore pratica della struttura di un sito Web.

La nostra esperienza con il sito Web di un cliente

Una content strategy ad hoc può portare ad aggiungere pagine e nuovi elementi a un sito senza pensare all'architettura complessiva. Il turnover del personale può portare persone senza alcuna comprensione della struttura generale del sito a occuparsi improvvisamente della sua manutenzione. Il risultato finale è spesso un sito con un'architettura sgraziata e inefficiente.

Questa è esattamente la situazione che abbiamo dovuto affrontare con un nostro cliente. Nel tempo, il suo sito era cresciuto fino a contenere oltre 500.000 pagine. Il gran numero di pagine e il modo in cui sono state aggiunte al sito hanno creato alcuni seri problemi SEO. Ci siamo trovati di fronte alla sfida di districare l'architettura del sito di quello che era un sito Web gigantesco.

Anche il sito più grande e più confuso può essere messo in ordine. Ciò di cui hai bisogno è una solida strategia e la volontà di farlo. Condivideremo la nostra esperienza di lavoro con un cliente il cui nome è stato reso anonimo. In questo modo, speriamo di darti alcuni suggerimenti su come affrontare le tue sfide SEO strutturali.

L'analisi

Come esperto esterno che arriva per consigliare o risolvere i problemi SEO tecnici di un sito, il primo passo è comprendere la portata del progetto. Una volta apprezzato il quadro completo, puoi iniziare a sviluppare una strategia. Anche quando lavori per migliorare il tuo sito, ricorda che analizzarlo come entità globale è sempre un buon punto di partenza.

Per saper quali problemi seo strutturali ha un sito devi fare un'audit

Con siti più piccoli, è possibile rivedere manualmente l'architettura del sito e individuare i problemi. Man mano che un sito diventa più grande, questa operazione diventa sempre più difficile. Una volta raggiunto un sito con oltre 500.000 pagine, non è più possibile. Potresti dedicare ogni ora di ogni giorno per settimane al processo e non scalfire ancora la superficie. È qui che entrano in gioco gli strumenti tecnici SEO.

Oggi esiste una vasta gamma di strumenti SEO tecnici, tra cui i tool di Google Analytics. Alcuni sono gratuiti, altri a pagamento e alcuni hanno versioni sia gratuite che a pagamento. Gli strumenti possono aiutarti a fare qualsiasi cosa, dal controllo della velocità della pagina al test di errori di implementazione dei dati strutturati.

La scansione del sito Web con SEMrush

Il SEMrush Bot è un modo efficiente per eseguire il tipo di crawling profondo necessario per affrontare un enorme progetto tecnico SEO. Questa scansione approfondita ti consente di identificare sia i problemi SEO tecnici di base che quelli più avanzati che affliggono qualsiasi sito.

Alcuni dei problemi di base che si possono diagnosticare:

  • errori negli url

  • mancanza di titoli di pagine

  • mancanza di metadati

  • codici di risposta errati

  • errori nei canonical

Inoltre, una scansione approfondita con SEMrush può aiutarti con alcune attività più avanzate:

  • individuare problemi con l'impaginazione

  • valutare l’ internal linking

  • visualizzare e diagnosticare altri problemi che hanno a che vedere con l'architettura del sito

Quando abbiamo eseguito la scansione approfondita del sito del cliente, abbiamo riscontrato diversi problemi gravi. Identificare questi problemi ci ha aiutato a sviluppare la nostra strategia generale per districare l'architettura del sito. Di seguito una panoramica di alcuni dei problemi che abbiamo scoperto.

Problema 1: Distanza dalla homepage

Uno dei problemi più evidenti evidenziati dal crawling approfondito era la distanza di alcune pagine dalla homepage. Abbiamo riscontrato che sul sito erano presenti contenuti che si trovavano a 15 pagine di distanza dalla home.

Di norma, dovresti cercare di assicurarti che i tuoi contenuti non superino mai i tre clic dalla tua home page.

Il motivo della "regola dei tre clic" è duplice; ha senso sia per i visitatori del tuo sito web che per scopi SEO. Dalla parte dei visitatori, è improbabile che chi arriva sul sito sia disposto a fare clic su 15 pagine per trovare il contenuto di cui ha bisogno. Se un utente non trova rapidamente quello che sta cercando, rimbalzerà dal tuo sito e cercherà altrove.

Limitare la distanza in clic ha senso anche dal punto di vista SEO. La distanza di una pagina dalla home page di un sito viene presa in considerazione dagli algoritmi dei motori di ricerca. Più è lontana, meno importante è considerata una pagina. Inoltre, è improbabile che le pagine lontane dalla home page possano trarre molti benefici dalla grande autorità del link della home.

Scansione del sito con il bot di SEMrush e GoogleBot

Problema 2: Solo il 10% deIle pagine sono indicizzate

Da Google Search Console, abbiamo scoperto che solo il 10% delle pagine veniva indicizzato. Nell'ambito della nostra analisi tecnica SEO, abbiamo anche esaminato i file di log del sito, che ha rivelato molti altri problemi.

Una pagina non indicizzata sostanzialmente "non è letta" da Google e da altri motori di ricerca. Non c'è nulla che tu possa fare per una pagina, dal punto di vista SEO, se i motori di ricerca non la trovano e "leggono". Non si classificherà per nessuna query di ricerca ed è inutile per la SEO.

Analisi delle pagine di un sito che sono state indicizzate

La nostra scansione approfondita ha rivelato che un enorme 90% delle pagine del sito rientrava in quella categoria. Il sito aveva più di 500.000 pagine, che equivalgono a circa 450.000 con poco o nessun valore SEO. Come abbiamo detto, è stato un grosso problema.

Problema 3: Struttura dell’URL non chiara 

Attraverso l'audit del sito, fu evidente anche che il contenuto mancava di una struttura URL chiara. Le pagine che avrebbero dovuto trovarsi sullo stesso livello del sito non avevano un URL che lo riflettesse. A Google venivano inviati segnali confusi su come il contenuto era classificato; questo è un problema che devi sempre considerare quando costruisci il tuo blog o sito web.

Il modo migliore per spiegare questo problema è con un esempio. Supponi di avere un sito che include una gran varietà di prodotti. I tuoi URL dovrebbero scorrere logicamente dal dominio alla categoria, alla sottocategoria e finalmente al prodotto. Un esempio potrebbe essere "sito Web / categoria / sottocategoria / prodotto". Tutte le pagine dei prodotti dovrebbero quindi avere una struttura URL coerente.

I problemi sorgono se alcuni dei prodotti hanno una struttura URL diversa, ad esempio, se un prodotto ha un URL come "sito Web / prodotto". Tale prodotto si trova infatti su un livello diverso nel sito rispetto al resto. Ciò crea confusione sia per i motori di ricerca che per gli utenti.

Oltre ai problemi con la struttura dell'URL, un altro fattore che doveva essere affrontato era il numero di collegamenti trovati su una pagina; questo era, in parte, un problema a livello di sito. Ad esempio, il menu aveva oltre 400 collegamenti. Il footer (menu a piè di pagina) ne conteneva 42. Questo numero di link è di molto superiore a quello che una persona probabilmente utilizzerà. Era chiaro che una grande parte di questi collegamenti non veniva utilizzata a sufficienza per rendere utile incorporarli nel menu o nel footer.

Attraverso la scansione del sito abbiamo anche identificato diverse pagine, inclusa la homepage, con oltre 100 collegamenti.

Più link ha una pagina, incluso il menu, meno PageRank interno passa ciascuno di questi collegamenti. È anche indicativo di una struttura del sito confusa.

Nel complesso, era chiaro che ci fossero problemi seri con la strategia di internal linking implementata dal sito. Questa strategia ha influito sul modo in cui Google ha indicizzato il sito, oltre a provocare un'esperienza utente negativa ai visitatori del sito.

Problemi aggiuntivi

Attraverso l'audit del sito, sono stati identificati numerosi altri problemi. Alcuni non influirebbero sull'architettura del sito Web, ma se risolti migliorerebbero il posizionamento organico. Di seguito una panoramica di alcuni dei fattori chiave su cui abbiamo dovuto agire:

  • Robot text file: sul sito erano stati utilizzati migliaia di tag. Alla maggior parte di essi erano associati solo alcuni contenuti. Inoltre, vi era l'opportunità di ottimizzare il crawl budget negando ai bot l'accesso al sito; questo aveva il potenziale per aumentare la velocità della pagina.
  • Miglioramento dei metadati: alcuni metadati potevano essere rivisti e migliorati per aumentare le percentuali di clic organici.
  • Tempo di caricamento della pagina: c'era l'opportunità di migliorare il tempo di caricamento delle pagine. Ancora una volta, questo è un fattore di ranking per Google.
  • Pagine “reliquie” del dominio: a seguito dell'analisi del server log, abbiamo identificato una serie di pagine del dominio che erano ormai obsolete, e sulle quali si stava concentrando molta attività di Google Bot; questo era tutt'altro che l’ideale. La presenza di attività poteva significare che quelle pagine scadute apparivano ancora nei risultati di ricerca.

La soluzione

Le analisi e le ricerche svolte hanno definito lo scopo del progetto che ci aspettava, indicandoci i problemi che dovevano essere risolti. Ciò ci ha permesso di sviluppare una strategia per lavorare passo dopo passo su questi problemi. 

Di seguito una panoramica di cinque delle aree chiave su cui ci siamo concentrati per migliorare la struttura del sito Web. L'elenco esclude altre attività che abbiamo completato, come l'aggiornamento di meta description e contenuti nelle pagine principali, che costituiscono una parte fondamentale dell'audit di un sito Web.

Step 1: Redirect e altre modifiche

Il primo compito in cui affondare i denti era il reindirizzamento delle pagine scadute. Siamo partiti da quelle su cui si concentrava la maggior parte dell'attività di Google Bot. Ci siamo assicurati che le pagine fossero reindirizzate al contenuto più pertinente. A volte ciò significava una pagina che aveva sostituito l'originale. In altre occasioni, significava la homepage.

Questa strategia ci ha dato una rapida vittoria con cui iniziare. Ci ha assicurato che tutto il traffico derivante dai domini scaduti non si incontrasse con una pagina rotta. Un altro semplice accorgimento che abbiamo avuto all'inizio è stato il layout della pagina PR; ciò ha rimosso la confusione di Google sul fatto che fosse effettivamente la pagina di archivio del sito. Ciò ha portato a un immediato miglioramento dell'indicizzazione dei contenuti.

Inoltre, il sito aveva migliaia di tag. Non volevamo che i tag con contenuti limitati venissero visualizzati nei risultati di ricerca poiché fornivano una user experience scadente alle persone che accedevano al sito. Per questo motivo, abbiamo deindicizzato quelle pagine.

Oltre al compito di reindirizzare le pagine scadute, abbiamo anche lavorato sul miglioramento della struttura dei menu. Come accennato in precedenza, il sito Web aveva oltre 400 collegamenti nel menu; questo era molto più del necessario per i visitatori del sito. Inoltre, era quattro volte più del numero di link raccomandati su una pagina. 

Dopo aver capito che il numero di collegamenti nel menu era un problema che doveva essere affrontato, dovevamo scegliere quali link rimuovere. La nostra soluzione era prima di tutto analizzare su quali di essi le persone facevano clic, per capire quali erano più utili per i lettori. Abbiamo usato una combinazione di Google Analytics e mappe di calore per generare i dati che abbiamo poi analizzato. 

Una volta identificati i collegamenti più utili, abbiamo cominciato a definire le pagine di categoria e sottocategoria che sapevamo essere necessarie nel menu. Il nostro approccio in tal senso è stato quello di creare una struttura del sito in cui tutto il contenuto fosse entro tre clic dalla homepage.

Step 3: Clustering e ristrutturazione

Dopo le prime rapide vittorie, era tempo di passare al lavoro più ampio: rimodellare l'architettura del sito.

Dovevamo risolvere il problema della distanza in clic e dare al sito una struttura più logica. In questo modo, sarebbe stato più facilmente navigabile sia per i crawler che per gli utenti reali.

Un primo passaggio era quello di  clusterizzare o raggruppare i contenuti. Ciò significava riunire le pagine correlate tra loro e collegarle a una pagina di "pilastro". Quella pagina sarebbe stata entro un paio di clic dalla home page del sito, quindi una vasta gamma di pagine correlate sarebbe stata raggiunta in tre clic. I cluster di contenuti come questo rendono molto più semplice per i visitatori e i crawler la gestione dei contenuti di un sito.

I cluster sono stati il modo in cui abbiamo iniziato a organizzare il vasto numero di pagine. Per quanto riguarda la struttura generale, ci siamo concentrati sull'idea di creare una piramide di contenuti. Tale piramide è il gold standard accettato per la struttura di un sito. La home page si trova in cima alla piramide, le pagine delle categorie sono sotto e le sottocategorie a un ulteriore livello più in basso. Le singole pagine compongono quindi l'ampia base della piramide.

Una volta che i cluster di contenuti e la piramide hanno preso forma, anche il problema dei collegamenti è stato facilmente risolto. Avere una struttura definita ha reso molto più semplice l'interconnessione delle pagine. Non c'erano più pagine con centinaia di collegamenti eccessivi.

Step 4: Migliorare la struttura degli URL

La nostra ristrutturazione della struttura del sito ha reso un gioco da ragazzi migliorare la struttura degli URL. La piramide dei contenuti assicurava che gli URL del sito potevano raggiungere il flusso logico menzionato in precedenza. Le pagine non si trovavano più su diversi livelli del sito ma su una base ad hoc.

Gli URL della miriade di pagine del sito sono stati allineati con una struttura definita che ha rimosso i messaggi confusi inviati a Google. Il motore di ricerca poteva ora comprendere molto più facilmente – e quindi indicizzare – i contenuti del sito.

Step 5: Aggiunta di dimensioni alle immagini

La dimensione del file di un' immagine è un problema significativo per molti siti quando si tratta della velocità della pagina. Le immagini sono spesso formattate in modo errato. Aggiungendo dimensioni alle immagini, è possibile migliorare in modo significativo il tempo di caricamento della pagina, assicurandosi che un'immagine correttamente dimensionata e formattata venga visualizzata per la prima volta.

Aggiungendo le dimensioni alle immagini, siamo passati sulle pagine delle categorie da un eccesso di oltre 25 MB a ben più accettabili 2-4 MB per pagina. Ciò ha aumentato significativamente la velocità della pagina e l'esperienza dell'utente, riducendo allo stesso tempo lo sforzo sul server.

Risultati

L'impatto del nostro lavoro sul sito del cliente è stato evidente.

I miglioramenti nella struttura del sito hanno avuto un profondo e rapido effetto sull'indicizzazione. Di conseguenza, c’è stato un effetto altrettanto piacevole sul traffico del sito.

Nei primi tre mesi, la percentuale di pagine indicizzate da Google era passata dal 10% al 93%. Inoltre, anche la percentuale di URL approvati era migliorata.

Non sorprende che 350.000 pagine improvvisamente indicizzate abbiano portato ad un aumento del traffico sul sito. Il volume di visitatori è aumentato del 27% nei primi tre mesi e del 120% dopo 9 mesi.

L'audit finale del sito a conclusione del progetto

Conclusione

I passi esatti che abbiamo adottato per migliorare l'architettura del sito del nostro cliente potrebbero non funzionare per il tuo sito. Ciò che funzionerà, tuttavia, è la strategia generale che abbiamo applicato. È una strategia in grado di fornire risultati impressionanti anche per i siti più grandi e confusi.

Per iniziare, devi essere scrupoloso nella ricerca e analisi del progetto in questione. Ciò che troverai dovrà definire l'ambito del tuo lavoro. Avrai quindi una tabella di marcia per i tuoi miglioramenti. Se proseguirai con il lavoro secondo tale tabella di marcia, sicuramente vedrai i risultati attesi.

Che cosa ne pensi di questa strategia per districare l'architettura di un sito web enorme?

C'è forse qualche altra azione che avresti implementato al nostro posto?

Dimmelo nei commenti.

Condividi
Author Photo
Nick Brown is the co-founder of Accelerate Agency, an SEO agency based in Bristol. He has over 12 years experience in digital marketing and works with large companies advising them on SEO, CRO, and content marketing.