Ricerca vocale: l'evoluzione nella SEO moderna

Marco Maltraversi

mag 18, 20207 min di lettura
Ricerca vocale: l'evoluzione nella SEO moderna

L’utilizzo della voce come parametro biometrico è stato oggetto di molti studi negli ultimi anni, anche se attualmente è esploso grazie a diversi supporto tecnologici: comandi vocali, sistemi operativi, siti web e applicazioni, dispositivi mobili che consentono di svolgere azioni, come trovare informazioni, senza digitare alcunché.

La volontà di eseguire le operazioni che facciamo tutti i giorni in maniera più semplice e immediata, la necessità di rendere possibili molte azioni a persone che non hanno la possibilità di interagire in maniera tradizionale, e l’aumento di interesse verso nuove e più affidabili misure di sicurezza, rendono questa nuova realtà di grande interesse. 

Le basi del riconoscimento vocale

Molto spesso si parla di Voice Search all'interno dell'ecosistema Google senza aver ben chiaro il funzionamento dei meccanismi basilari che permettono di interpretare il linguaggio umano.

Si parla sempre di più di machine learning. Come è noto, tali tecniche prevedono fondamentalmente due fasi esecutive:

  • la fase di training, in cui il sistema apprende e sceglie quali decisioni implementare sulla base di alcuni dati e input di esempio; 
  • una fase di testing, il cui l'automa deve prendere delle decisioni su dati e informazioni a lui sconosciuti.

Nel nostro caso l’input è dato da un file audio:

  1. Nella fase di training uno o più file sono dati in input al sistema, in modo che questo possa generare un modello che rappresenti il più fedelmente possibile le caratteristiche vocali di un determinato individuo. Per fare questo è necessaria una fase di estrazione di feature che servono a rappresentare quelle particolarità che caratterizzano la voce di una persona. Una volta estratte lefeature, è possibile effettuare il training del sistema per generare un modello che riconosce un determinato parlatore.
  2. Per la fase di testing, invece, l’input è rappresentato solamente da un file audio, per il quale vengono estratte le feature per essere poi confrontate con i vari modelli conosciuti in una fase che viene detta matching. Durante questa fase vengono prodotti degli score, che rappresentano la probabilità che un determinato modello sia quello corretto.

Questi score sono poi utilizzati per prendere la decisione finale: nel caso di identificazione viene solitamente fornito in output il modello che ha ottenuto lo score più alto, mentre per la verifica la decisione è più delicata perché si basa su una soglia che può essere determinata durante la fase di training.

In questo contesto entrano in gioco quindi anche i Mel-Frequency Cepstral Coefficients (MFCC) e i Linear Prediction Coefficients (LPC) per l'identificazione delle feature di basso livello e i Modelli di Markov Nascosti (HMM) e Modelli a Misture Gaussiane (GMM) utilizzati nelle fasi di traning.

Tutto questo è utile per capire come qualcosa che a noi sembra banale richieda calcoli, elaborazioni e fasi di apprendimento che non sono assolutamente scontati e banali.

Quando poi il tutto viene spostato nell'ambito della visibilità online, non avendo visione dei modelli che regolano tali processi, ci possiamo basare solamente sui dati a nostra disposizione e su alcuni brevetti rilasciati in ambito di riconoscimento vocale, machine learning e interpretazione del linguaggio naturale.

Riconoscimento vocale: i primi brevetti

Risalgono al lontano 2006. Sì, avete capito bene: 2006, in cui vi è un primo tentativo per decidere quali sono le parole più probabili che comprendono una query vocale e come interpretarle.

primo tentativo di interpretazione di una ricerca vocale

Nascono quindi i problemi di fonetica e timbro per capire il suono ricevuto, l'interpretazione della lingua e del linguaggio naturale, l'acustica, i toni che possono essere pronunciati in modo differente da un individuo e il dizionario della lingua e dei modelli vocali. Un ecosistema molto complesso che negli anni si è perfezionato sempre di più.

A conventional automated system includes a speech recognition engine that recognizes the caller’s speech input. The automated system includes a search engine that searches a database for the phone number of the specific business requested by the caller. If the speech recognition engine cannot recognize the caller’s speech input, the recognition engine may ask the caller to repeat the input, ask the caller disambiguating questions, or transfer the call to a human operato

— Goolge I/O 2018

Il sistema Duplex, che riprende un vecchio servizio di assistenza GOOG-411 (è stato il primo servizio di riconoscimento vocale di Google), ha contribuito a fornire una base per servizi più ambiziosi ora disponibili su smartphone, come la ricerca vocale e le Azioni vocali. Ad oggi esistono diversi brevetti che ci possono aiutare a capire quale sia il modello e la roadmap di Google verso il perfezionamento dei servizi di assistenza vocale e apprendimento automatico:

In un altro interessante post è possibile capire meglio quale sia l'obbiettivo di Google nell'utilizzo delle ricerche vocali e soprattutto nella loro interpretazione.

La ricerca vocale è entrata nell'uso quotidiano, cerchiamo di capire come sfruttarla ai fini della visibilità organica!

Come identificare le ricerche vocali conversazionali?

Il 70% delle ricerche fatti ai vari assistenti vocali vengono espresse nel linguaggio naturale e non come espressione di singole keyword.

È inutile sottolineare ancora l'esistenza di diverse tipologie di query - informazionali, conversazionali, transazionali, ecc - dal mio punto di vista l'esperienza utente sta diventando sempre più interattiva e in una stessa sessione di ricerca il comportamento dell'utente potrebbe variare.

In tutto questo gli assistenti vocali possono produrre risultati che hanno necessità di un supporto (ad esempio) video per dare la migliore esperienza utente.

risultato vocale fornito dall'assistente vocale di google

Google, e non solo, ha iniziato a commercializzare prodotti dotati di uno schermo per visualizzare contenuti non solo audio ma anche video.

primi display intelligenti con l'Assistente Google

Come possiamo intercettare i bisogni dei nostri utenti?

Prima di tutto è fondamentale comprende il nostro pubblico, cosa cerca, quali sono i suoi bisogni e le aspettative di ricerca.

Grazie al TOPIC Research di SEMrush posso farmi un'idea di cosa cercano le persone e capire se sono in target con quello che sto offrendo.

il topic research di SEMrush

In questo modo posso espandere i miei interessi e verificare i bisogni reali degli utenti e capire se vi siano delle query a coda lunga da intercettare.

Inoltre ti consiglio di impostare il filtro sugli snippet per capire le query in cui sono presenti i risultati 0 e capire come eventuali competitor abbiano raggiunto tale posizione.

risultati nelle serp feature

Per approfondire leggi: Topic Research, il tool che ti dà idee per i contenuti.

Sempre nell'ambito della ricerca è importante capire anche come i tuoi possibili utenti o clienti cercano la tua attività o keyword ad essa collegate.

Se sei un ristorante di Milano, come un possibile utente ti cercherà?

Gli utenti potrebbero non limitarsi a cercare "ristorante milano" ma, ad esempio, fare una ricerca del tipo "Miglior ristorante a milano di pesce vicino alla stazione centrale". Capiamo bene che il concetto di keyword è riduttivo, va quindi capito il bisogno dell'utente per fornire risposte a domande che potrebbero essere articolate e complesse. Bisogna soddisfare il bisogno specifico dell'utente in quel preciso momento!

Quali sono i principali suggerimenti per fare in modo che il nostro sito web sia in grado di rispondere a query vocali?

Per sfruttare la Voice Search esistono diversi passaggi che possiamo sviluppare.

Capire come un utente possa fare determinate ricerche non è banale né semplice. Iniziamo a capire come un nostro servizio o prodotto possa essere cercato, ma soprattutto come un utente lo possa ricercare anche vocalmente.

Dobbiamo espandere il concetto di query e coprire un ampio spettro di bisogni degli utenti, in modo tale da intercettarli e coccolare poi i potenziali clienti sul nostro sito web.

Esistono diversi strumenti che ci aiutano in questa fase, ad esempio AlsoAsked. Come puoi vedere dall'immagine, ti aiuta a capire cosa cercano le persone in modo da utilizzare eventuali FAQ o testi pensati ad hoc per intercettare nuovi clienti.

come scoprire gli intenti degli utenti per la ricerca vocale

Oppure puoi sfruttare il filtro Domande di Keyword Magic tool di SEMrush:

come trovare le keyword per la ricerca vocale

Per approfondire leggi: Trova le parole chiave giuste con Keyword Magic Tool

40.7% dei risultati vocali arriva dai Featured Snippet.

Puoi ben capire che iniziare ad ottimizzare i Featured Snippet sia un primo passo per intercettare nuovi possibili clienti, ok... ma come fare? Sicuramente ti consiglio di leggere questo approfondimento, in cui vengono illustrati gli step per cercare di ottenere la Posizione 0.

Il contenuto che andrai a sviluppare dovrebbe essere ben strutturato, di facile lettura, in https, mobile friendly, e in grado di rispondere in modo preciso e puntuale all'intento dell'utente.

Ok Google

Ti consiglio inoltre di prendere in considerazione anche i criteri utilizzati da Google Assistant per valutare la qualità dei risultati, come mostrato in questa immagine.

come risponde google alle ricerche vocali

Puoi sfruttare inoltre Schema.org per inserire microdati specifici e FAQ per facilitare a Google l'interpretazione dei tuoi testi e dei tuoi contenuti. 

Google potrebbe sfruttare i tuoi dati strutturati per generare un'action... motivo in più per utilizzarli in modo appropriato!

ricerche vocali e uso di dati strutturati

Integra nella tua strategia il tag speakable per aiutare Google a leggere solo le parti di testo che tu decidi, anche se in fase di test (beta) è sicuramente una funzionalità da tenere a mente.

Tra le varia attività che posso consigliarti c'è quella di integrare una strategia Voice con Google My Business e YouTube, in base al tuo business. In questo modo avrai la possibilità di intercettare un pubblico più ampio e dare risposte precise e puntuali in base alle ricerche (ricordati che esiste un signore che si chiama Google Discover e un altro di nome Google Assistant che sono parte integrante dell'ecosistema Google!)

Youtube video thumbnail

La Voice Search è un'opportunità da sfruttare e da integrare nella tua strategia di visibilità online. Ogni aspetto va curato nei minimi dettagli e l'utente va posto sempre al centro delle scelte che si andranno a fare!

Conclusioni e spunti sulla Ricerca vocale:

La Voice Search è molto più che semplice ricerca vocale: con Assistant Google si sta spingendo oltre. Perciò ti consiglio di prenderti cura di ogni piccolo aspetto nello sviluppo della tua strategia di visibilità online:

  1. Ottimizza bene i tuoi contenuti
  2. Struttura le pagine in modo organizzato 
  3. Sfrutta schema.org 
  4. Sfrutta Video e Podcast dove necessario
  5. Integra le Google Action
  6. Non dimenticarti mai dei bisogni dei tuoi utenti :)

Biografia: Matteo Bressan: Analisi vocale per il riconoscimento dell’identità del parlatore. J. Benesty, M. Sondhi, and Y. Huang, Springer Handbook of Speech Processing. Springer Berlin Heidelberg, 2008, DeepSEO.

E tu come stai sfruttando la Voice search sul tuo sito Web?

Raccontamelo nei commenti.

Condividi
Condividi
Author Photo
Marco Maltraversi, organizzatore dell’ evento MBSummit, è Founder e CEO di YourDigitalWeb, Web Agency. Ingegnere informatico e autore del libro “SEO e SEM Guida Avanzata al Web Marketing“ e del libro “SEO AUDIT AVANZATO“, opera nel web da oltre 15 anni con passione, tecnica e curiosità. Docente del Master in Web Communication in Social Media Marketing e del Master in Marketing Management del Sole24Ore, docente IUSVE, è uno dei SEO italiani più attivi. Skills: Search Engine Optimization, Search Engine Marketing, Web Marketing Strategy, Web Tools, Engineering Development. MARKETING BUSINESS SUMMIT 2020 https://www.mbsummit.it CORSO SEO ONLINE - DEEPSEO https://www.deepseo.it