Nuova tecnologia in casa Google: sarà in grado di abbinare viso e voce

Scopriamo insieme di cosa si tratta!

Come funziona questa nuova tecnologia

Google sta lanciando una nuova tecnologia all’avanguardia, che promette di registrare la voce di chiunque, associandola al volto della persona. Il riconoscimento dovrebbe funzionare anche in presenza di più individui che parlano simultaneamente, isolando un suono dall’altro e associandolo ai diversi volti.

Tutto ciò sarebbe possibile per mezzo dell’utilizzo combinato di machine learning e machine vision, le prime calibrate per acquisire i dialoghi e le altre per collegarli al viso giusto. Il programma ideato da Google riuscirebbe a leggere il labiale di quelli che si trovano all’interno della stanza, registrando l’intera conversazione e separando le parole pronunciate dall’una o dall’altra persona, il tutto in tempo reale. Tramite alcuni algoritmi ogni viso viene controllato e identificato: ogni volta che quella determinata persona parla o semplicemente pronuncia qualche parola ne viene analizzato l’audio, connesso al viso e generato un profilo che poi viene catalogato dalla macchina, archiviandone l’identità.

Ciò permette al sistema di riconoscere ovunque quella voce, anche se mischiata ad altre cento, abbinandola alla persona giusta. Questo innovativo sistema è stato già registrato come proprietà intellettuale alla World Intellectual Property Organization, salvandone il brevetto dalle altre aziende interessate sul mercato.

Tutti i vantaggi del suo impiego nella vita quotidiana

Questa tecnologia innovativa che promette di abbinare il viso alla voce potrebbe cambiare il nostro modo di vivere. Diverse sono le applicazioni in cui potrà essere utilizzata, promettendo di facilitare la vita quotidiana. Innanzitutto potrebbe essere impiegata per autenticare gli utenti che accedono ad un sito web, al proprio conto bancario oppure semplicemente allo smartphone o al computer, aumentando la protezione e la sicurezza.

In secondo luogo potrebbe servire per creare in automatico i sottotitoli di film o video: non sarà più necessario che qualcuno li trascriva, ma il programma riuscirà a riconoscere le voci e le parole in automatico, associandole all’attore giusto. Può essere impiegato anche per facilitare la vita dei non udenti, che potranno visualizzare sullo schermo i dialoghi di coloro con cui interagiscono, in maniera simultanea.

Infine, potrebbe essere utilizzato nel campo della sicurezza, sia pubblica che privata. In particolare sarà impiegato nell’ambito della sorveglianza, dove potrebbe servire per riconoscere le parole sussurrate, oppure associare la voce ad un volto specifico, anche in condizioni di scarsa visibilità o in scene notturne riprese da telecamere esterne.

Staff Envision

2 Agosto 2018

Perché utilizzare i CMS headless: flessibilità e innovazione nella gestione dei contenuti

I CMS headless stanno cambiano il modo in cui le aziende gestiscono e distribuiscono i contenuti digitali. A differenza dei tradizionali sistemi di...

Matteo Bleve

5 Luglio 2025

Regola dell’80/20: come aumentare il lifetime value cliente e far crescere il business

La regola dell’80/20 – meglio nota come principio di Pareto – insegna che l’80 % dei risultati dipende dal 20 % delle cause. Applicata al marketing...

Matteo Milo

30 Giugno 2025

Chi è Labubu? Il pupazzo POP MART che ha conquistato TikTok e le star del K-Pop

I Labubu sono i pupazzi virali del momento: dalle code chilometriche davanti agli store POP MART fino ai video che spopolano su TikTok, questi piccoli...

Alessia Nuzzo

26 Giugno 2025

Nuova tecnologia in casa Google: sarà in grado di abbinare viso e voce

Come funziona questa nuova tecnologia

Tutti i vantaggi del suo impiego nella vita quotidiana

SIAMO DIVERSIPERCHÉ?

Perché utilizzare i CMS headless: flessibilità e innovazione nella gestione dei contenuti

Regola dell’80/20: come aumentare il lifetime value cliente e far crescere il business

Chi è Labubu? Il pupazzo POP MART che ha conquistato TikTok e le star del K-Pop

TI É PIACIUTOIL NOSTRO ARTICOLO?

SIAMO DIVERSI
PERCHÉ?

TI É PIACIUTO
IL NOSTRO ARTICOLO?