Intelligenza Artificiale

Spotify “clonerà” le voci dei podcaster e le tradurrà in altre lingue

E se i podcaster potessero premere un interruttore e parlare istantaneamente in un’altra lingua?

Questa è la premessa alla base della nuova funzione di traduzione vocale alimentata dall’intelligenza artificiale di Spotify, che riproduce i podcast in altre lingue utilizzando la voce del podcaster stesso.

Uno strumento di traduzione avanzata

L’azienda di Spotify, il colosso svedese dello streaming audio, ha stretto una partnership con una manciata di podcaster per tradurre i loro episodi dall’inglese in spagnolo con un nuovo strumento, chiamato Whisper di OpenAI. Ovviamente non si vuole fermare allo spagnolo, quindi ha in programma di lanciare anche le traduzioni in francese e tedesco nelle prossime settimane.

E chissà, presto si spingerà anche oltre i confini delle lingue inglesi ed europee.

I podcaster inclusi nel progetto di Spotify

Il gruppo iniziale di episodi sarà composto da alcuni grandi nomi del podcasting occidentale, tra cui Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett.

Questi sono tutti podcaster di successo che hanno scelto di concentrarsi su argomenti diversi. Dax Shepard intervista celebrità, Monica Padman intervista imprenditori, Lex Fridman intervista scienziati e filosofi, Bill Simmons parla di basket e cultura pop, e Steven Bartlett intervista imprenditori. Tutti e cinque sono noti per le loro interviste approfondite e interessanti, e hanno contribuito a rendere i podcast uno dei formati di intrattenimento più popolari al mondo.

Le potenzialità di Whisper di OpenAI

La spina dorsale della funzione di traduzione è lo strumento di trascrizione vocale Whisper di OpenAI, che può sia trascrivere il parlato inglese, che tradurre altre lingue, sempre in inglese.

Ma lo strumento di Spotify va oltre la traduzione speech-to-text – una possibilità ormai applicata che la tecnologia e il progresso conoscono già da tempo – : la funzione traduce un podcast in una lingua diversa e lo riproduce in una versione sintetizzata della voce del podcaster stesso.

Grazie alla corrispondenza con la voce del creatore, Voice Translation offre agli ascoltatori di tutto il mondo la possibilità di scoprire e lasciarsi ispirare da nuovi podcaster in un modo più autentico che mai“, ha dichiarato in un comunicato Ziad Sultan, vicepresidente di Spotify per la personalizzazione.

Foto | Pexels @AndrewNeel – Cryptohack.it

C’è sempre lo zampino di OpenAI

È probabile che dietro la replica vocale di questa nuova funzione ci sia la stessa OpenAI.

L’azienda di intelligenza artificiale ha fatto alcuni annunci questa mattina, tra cui il lancio di uno strumento in grado di creare “un audio simile a quello umano partendo da un testo e da pochi secondi di parlato campione”.

Tuttavia, al riguardo OpenAI afferma che sta intenzionalmente limitando la diffusione di questo strumento per motivi di sicurezza e privacy.

Saranno necessari i debiti permessi

Questo è probabilmente uno dei motivi per cui Spotify afferma che la tecnologia di traduzione viene testata solo con un “gruppo selezionato” di podcaster. Proprio perché ci si aspetta che ci vogliano i permessi ufficiali delle voci stesse, affinché queste possano essere “automatizzate” anche in altre lingue.

L’azienda, ad oggi, non ha precisato in che misura intende rendere disponibile lo strumento o quando prevederne l’espansione. Tuttavia, questo è ciò che possiamo aspettarci in uno dei prossimi aggiornamenti, insieme al dibattito che questi stessi scateneranno.

Matilde Brizzi

Recent Posts

Contenuti sensibili, YouTube testa le miniature sfocate

La novità si applica a video che, pur rispettando le linee guida della community, trattano…

16 ore ago

OpenAI sospende l’aggiornamento di ChatGPT: ecco il motivo

OpenAI ha ritirato l'ultimo aggiornamento di Gpt-4o di ChatGpt, a seguito di critiche sui social.…

2 giorni ago

ChatGPT si apre anche allo shopping, sfida sempre più aperta con Google

ChatGPT si evolve, offrendo un nuovo supporto per lo shopping: consente di trovare articoli e prodotti…

3 giorni ago

ChatGPT, migliorato il modello GPT-4o: ma non a tutti gli utenti le novità sono piaciute

OpenAI ha lanciato aggiornamenti per il modello GPT-4o, migliorando intelligenza e personalità. Tuttavia, gli utenti…

4 giorni ago

Quello di Nintendo Switch 2 potrebbe essere il più grande lancio nella storia dei videogiochi: lo dicono gli analisti

In Giappone, il paese d'origine di Nintendo, l'azienda ha già ricevuto oltre 2,2 milioni di…

7 giorni ago

Threads, Meta porta la pubblicità nell’app in oltre 30 Paesi

Meta annuncia l'espansione della pubblicità su Threads, l'app progettata per competere con X. Con oltre…

1 settimana ago