Cosa significa TF-IDF e come sfruttarlo in ottica SEO

Gaetano Romeo

apr 22, 20207 min di lettura
Cosa significa TF-IDF e come sfruttarlo in ottica SEO

È possibile che tu abbia sentito parlare del termine TF-IDF, ma nessuno potrebbe biasimarti se non hai ancora iniziato a prestare attenzione a tale concetto.

Infatti nella SEO molti concetti vengono etichettati come “mode” che vanno e vengono, e alcune delle più interessanti finiscono per attrarre maggiore attenzione in seguito, ti risulta?

Attenzione però che il concetto di TF-IDF è qualcosa di leggermente diverso.

Partiamo subito con il dire che non si tratta di manipolare i motori di ricerca:

TF-IDF è un metodo per analizzare gli argomenti nei contenuti online ed è basato sugli stessi principi dei motori di ricerca. Si tratta di un metodo oggettivo per misurare e migliorare i contenuti, per questo motivo ha un potenziale straordinario lato SEO.

Che cos'è TF-IDF?

Quindi cosa significa la sigla TF-IDF? È un acronimo? Un'equazione? Qualcosa che si mangia?

Ti anticipo che si tratta di due di queste cose, prova a indovinare qual è la definizione che non c’entra nulla :)

Letteralmente, TF-IDF significa Term Frequency (TF, Frequenza Termini) - Inverse Document Frequency (IDF, Frequenza inversa del documento).

come calcolare tf-idf

TF-IDF è un'equazione che combina queste due misurazioni: la misurazione della frequenza con cui un termine viene usato su una pagina (TF) e la misurazione della frequenza con cui tale termine appare in tutte le pagine di una raccolta (IDF).

Questa formula matematica assegna un punteggio (tf-idf score), o peso, per l'importanza di un termine in una pagina. 

L'equazione TF-IDF ha una storia molto lunga nel mondo accademico, in cui i ricercatori in campi diversi come la linguistica e l'architettura dell'informazione l'hanno usata come possibilità per analizzare enormi biblioteche di documenti in breve tempo. Viene anche usato dai programmi di recupero delle informazioni (inclusi tutti i motori di ricerca) per ordinare e giudicare in modo efficiente la pertinenza di milioni di risultati.

Con TF-IDF i motori di ricerca attribuiscono un valore matematico al linguaggio umano, in modo da comprenderlo e classificarlo.

C'è una differenza importante tra ciò che vuoi fare tu e ciò che il motore di ricerca vuole fare con queste stesse informazioni. Il motore di ricerca vuole prendere in considerazione una raccolta composta da tutti i risultati sul Web (total number of documents) per capire a chi dare un ranking migliore, tu ambisci ad avere il ranking migliore.

Come calcolare TF-IDF

definire il valore seo di tf-idf

Devi trasformarti un po' in un matematico per ottenere entrambe le misurazioni coinvolte, ovvero TF e IDF, ma prometto che non sarà difficile. A seconda dell'applicazione, le equazioni per TF-IDF possono diventare molto più complicate degli esempi che ti mostrerò di seguito. Semplificato o meno, in genere credo sia sempre meglio non trovare brutte sorprese proprio mentre stai ottimizzando un sito web.

Queste equazioni ti aiuteranno a capire come funziona TF-IDF, ma sono gli strumenti che ti presenterò alla fine del post che ti sveleranno il vero potenziale di questo valore.

Come trovare il valore TF

Trovi Frequenza dei termini calcolando il numero di volte in cui un termine appare su una pagina. Quindi, collega quel numero all'equazione seguente:

Frequenza termine = (conteggio dei termini non elaborato) / (conteggio delle parole totali del documento)

Da solo, il punteggio TF può dirti se stai usando una parola poco o troppo spesso, ma è davvero utile solo se confrontato con l'altro punteggio.

Come trovare il valore IDF

Calcola la Frequenza inversa dei documenti dividendo il numero di documenti in cui appare il termine per il numero totale di documenti nella raccolta scelta, in questo modo:

Frequenza inversa documento (termine) = log (numero di documenti / (documenti contenenti parole chiave)

Con il punteggio IDF, ora puoi misurare l'importanza di una frase per una pagina, non solo il suo numero di utilizzi. Questo è importante perché ti fa entrare nel mindset di chi un algoritmo lo elabora.

Perché TF-IDF è importante per la SEO?

la formula di tf-idf può essere presente nell'algoritmo di google

L'obiettivo finale di essere in grado di calcolare questa equazione è quello di poter dare un punteggio di pertinenza ai tuoi contenuti. Usando gli strumenti TF-IDF ora disponibili, puoi confrontare i tuoi punteggi con quelli delle pagine con le migliori posizioni per qualsiasi termine.

Puoi, quasi, comprendere come Google legge e posiziona un sito in base alle query di ricerca. 

Giusto però precisare che non sappiamo se Google stia usi TF-IDF nel suo algoritmo e, se lo sta facendo, si tratta di una sua formula mutata o no? Detto questo, alcuni studi suggeriscono che sia molto probabile che Google stia usando tale concetto. L'analisi TF-IDF consente di ottimizzare l'equilibrio dei termini nei contenuti in base a ciò che viene già premiato dall'algoritmo.

Torna la Keywords density?

No. Nessuno amava i giorni in cui regnava la keywords density, parliamoci chiaro. Tuttavia, TF-IDF potrebbe segnare un ritorno al primato di frasi e parole chiave come marcatore importante, solo in un modo molto diverso. Il fatto è che Google non ha mai fatto affidamento sulla densità delle parole chiave come misura di valore. Sembrava proprio che lo facessero le persone che non capivano come funzionasse davvero l'algoritmo.

Invece, le strategie di keywords density sono state un primo tentativo di capire come Google usasse TF-IDF per l'indicizzazione e il richiamo. La gente creava parole chiave, quindi sono usciti update e filtri per combattere questa pratica (ciao Panda). Quindi, in un certo senso, la keywords density è tornata. È scappata di casa da adolescente scontrosa ed è tornata da adulto maturo con una laurea in scienze.

La keywords density era una tattica precoce e limitata che incoraggiava soprattutto le cattive abitudini. Essere in grado di misurare l'uso dei termini con TF-IDF ti darà un'idea sulle keyword, almeno nella misura in cui i risultati migliori le stanno usando.

TF-IDF rivela ciò che è considerato naturale, in modo molto preciso.

Come usare di TF-IDF per migliorare la ricerca di parole chiave

TF-IDF fa un passo avanti rispetto alla keywords density nel modo in cui ti apre a intuizioni su intere famiglie di keyword su un sito web. Ad esempio, immagina di aver già completato la ricerca di parole chiave per ottimizzare una pagina per "avvocato penalista Milano". La maggior parte degli strumenti di ricerca per parole chiave sputeranno parole chiave come "avvocato penalista a Milano", "avvocato penalista Lombardia", ecc.

Usando gli strumenti TF-IDF che sto per elencarti, sarai anche in grado di trovare termini non SEO correlati che compaiono nelle pagine meglio posizionate di Google, parole che non avresti mai trovato con la normale ricerca di parole chiave. Termini come "legale", "esperto", "diritti" e "pratica".

Come implementare TF-IDF

Questo metodo si adatta bene al processo di sviluppo dei contenuti di quasi tutti i SEO. Serve a saperne di più prima di iniziare a creare contenuti e quindi permette di scoprire dove e come perfezionarli. Dopo aver scelto uno strumento, è solo una procedura dettagliata per ottenere maggiori informazioni sulla scelta di ogni parola chiave. Se non hai ancora scelto uno strumento TF-IDF, puoi provare uno di quelli che ho usato io. Li trovi elencati alla fine di questo paragrafo.

E ora la procedura per usare TF-IDF: 

1. Scrivi un contenuto

Scrivi i contenuti secondo i più alti standard che conosci o fai riferimento a un contenuto che stai ottimizzando per un cliente. Crea un elenco di argomenti di una, due o tre parole che vuoi trattare e portalo allo strumento TF-IDF che hai scelto. Il tuo obiettivo qui è indirizzare le parole chiave e gli URL dei principali domini che le puntano per rivelare quali argomenti ti mancano e quali argomenti non stai trattando in modo approfondito.

Per approfondire leggi il post: Come scrivere contenuti di qualità per il web

2. Usa uno strumento TF-IDF

Ogni strumento funziona in modo diverso, come potrai vedere, di seguito. Tracciano anche informazioni diverse, ma quelle più utili sono orientate ad aiutarti a capire come i tuoi concorrenti stanno avendo successo con il loro uso delle parole chiave. Sfrutta tutte le funzionalità dello strumento che hai scelto per scoprire i termini associati ai primi 10-20 URL di primo livello e quindi raccogli i punteggi di ogni altro termine che stanno usando.

3. Ottimizza il tuo contenuto

Ora che hai un'idea completa degli argomenti trattati da ciascuno dei tuoi concorrenti e una comprensione della frequenza con cui queste parole vengono usate, puoi sfruttare tali informazioni per perfezionare il tuo contenuto.

Rivedi il testo e cerca modi naturali per presentare argomenti che non hai ancora trattato. Il tuo obiettivo deve essere quello di ripristinare connessioni naturali dove mancano.

4. Pubblica

Pubblica i contenuti aggiornati con gli approfondimenti che hai raccolto dalle tue ricerche. Da qui, puoi continuare ad analizzarlo e valutare qualsiasi cambiamento nei ranghi.

Tool utili (TF-IDF calculator)

Come promesso ecco l'elenco dei tool che possono tornare utili:

  1. Surfer's True Density
  2. Link Assistant's Website Auditor
  3. Text Tools.

Conclusioni

Spero che questo articolo abbia chiarito le cose riguardo all'analisi utile, ma spesso fraintesa, di TF-IDF per ottimizzare i contenuti in ottica SEO. Non solo hai imparato quanta matematica c’è dietro ai search engines, ma anche come si applica alla SEO creando rilevanza nei tuoi articoli. Hai visto gli strumenti più popolari sul mercato.

Hai altre domande su come usare TF-IDF per migliorare i tuoi posizionamenti?

Sono a tua disposizione per risolvere i dubbi sull'argomento.

Condividi
Author Photo
Chief Operating Officer Bruce Clay Europe Gaetano Romeo è una figura di spicco del marketing digitale e della consulenza aziendale. Grazie alla sua vasta esperienza e competenza nel settore, si è guadagnato una reputazione di alto livello come esperto del digitale. Contributor di Search Engine Land, docente IED, Ninja, direttore della collana Digital Generation del gruppo Maggioli e brand ambassador di Whitepress Europa. Oggi è Chief Operating Officer di Bruce Clay Europe.