lyrebird

Lyrebird, l’AI in grado di riprodurre qualunque voce

Dal Canada arriva un algoritmo per la sintetizzazione vocale che imita la voce di qualunque persona (famosa e comune) ascoltando appena 1 minuto di audio

Share With:

L’intelligenza artificiale già oggi permette di fare cose straordinarie come confermano gli esperimenti di Google in questo campo. Le AI possono essere utili anche per quanto riguarda la riproduzione vocale e lo dimostra l’algoritmo realizzato dall’azienda canadese Lyrebird, che prende il nome da un uccello canoro che imita i suoni che ascolta con un elevato grado di accuratezza. La tecnologia sviluppata da questa startup è in grado di copiare qualunque voce partendo da un campione audio della durata di appena 1 minuto. Per fare un raffronto con tecnologie simili, Project VoCo di Adobe necessita di ascoltare almeno 20 minuti di sonoro prima di poter riprodurre una voce.

L’algoritmo di Lyrebird è già riuscito a imitare la voce di personaggi famosi come Barack Obama, Hillary Clinton e Donald Trump con un discreto livello di accuratezza e può anche variarne il tono infondendogli emozioni come rabbia, comprensione e stress.

Grazie alla sua capacità di creare migliaia di frasi in meno di mezzo secondo questa tecnologia si apre a vari utilizzi come la lettura di audio book con voci di personaggi famosi, connettere diversi tipi di device, fornire una voce sintetica alle persone con disabilità nel linguaggio o per il doppiaggio di film d’animazione e videogame.

Un simile sintetizzatore vocale apre però un dilemma dal punto di vista etico in quanto lascia ampio spazio ad un suo utilizzo sconsiderato. Ad esempio, sarebbe possibile imitare la voce dei politici per creare falsi allarmismi o vere e proprie crisi internazionali. Un giorno potremmo sentire un falso Donald Trump che annuncia di aver bombardato la Corea del Nord con armi nucleari. L’algoritmo sarebbe anche potenzialmente in grado di aggirare i sistemi di autenticazione che sfruttano l’analisi vocale. Lyrebird ha quindi inserito all’interno del suo sito un codice etico per l’utilizzo delle sue API e farà in modo di renderle disponibili a tutti per far sì che si diffonda la consapevolezza che anche le voci, così come le foto, possono essere falsificate. L’azienda infatti non ha ancora voluto dare un prezzo al suo algoritmo. “La situazione è comparabile a quella di Photoshop. – ha sottolineato Alexandre de Brébisson di Lyrebird a The Verge – Le persone sono consapevoli che le foto possono essere ritoccate. Io penso che in futuro anche le registrazioni audio modificate diventeranno sempre più riconoscibili“.

Lyrebird ha inoltre confermato che già oltre 6.000 persone hanno chiesto accesso alle sue API e che sta lavorando per implementare il suo algoritmo includendo il supporto ad altre lingue come il francese. “La tecnologia è in divenire. Se non saremo noi sarà qualcun’altro a realizzarla“, ha concluso Brébisson.

Non è stato inserito nessun commento.

Accedi


Nome utente
Crea un nuovo account!
Password
Hai dimenticato la password?

Registrati


Nome utente
Email
Password
Conferma la Password
Sesso
Indirizzo
Citta
Provincia
Professione
Telefono
Desidero ricevere la newsletter
Accetto le condizioni di utilizzo del servizio
Ai sensi degli articoli 1341 e 1342 del codice civile italiano si accettano espressamente i seguenti articoli del Contratto: 1. (automatica accettazione della più recente versione del Contratto); 7. (diritti di privativa); 8. (manleva); 9. (modifiche e cancellazioni); 10 (limitazione di responsabilità); 12. (legge applicabile e foro competente)
Autorizzo al trattamento dei miei dati personali come descritto nell'articolo 8
Autorizzo la cessione dei miei dati personali a terzi/partner
Hai già un account? Esegui la login

password dimenticata?


Nome utente o Email
Twitter Auto Publish Powered By : XYZScripts.com