Fino ad ora, l’apprezzato sistema di conversazione con Intelligenza Artificiale noto come ChatGPT, sviluppato da un team di esperti presso OpenAI, ha principalmente fornito risposte sotto forma di testo. Tuttavia, a partire dal mese di settembre dell’anno 2023, si è verificato un significativo sviluppo: ora è possibile porre domande a ChatGPT utilizzando la voce anziché solo la scrittura. Questo ha aperto nuove possibilità di interazione con il sistema, rendendolo accessibile anche a coloro che preferiscono o necessitano di comunicare oralmente anziché tramite testo.
Fino a poco tempo fa, la possibilità di ricevere risposte vocali da parte di ChatGPT non era ancora stata implementata. Questo significa che, sebbene fosse possibile interagire vocalmente con il sistema per porre domande, le risposte erano ancora limitate alla forma scritta. Questo ha creato una sorta di disparità nell’esperienza utente, poiché l’interazione vocale non era completamente bilanciata dalla possibilità di ricevere risposte vocali.
Tuttavia, OpenAI ha recentemente colmato questa lacuna introducendo una nuova funzionalità multimodale per ChatGPT. Questa innovazione consente agli utenti di ricevere risposte anche sotto forma di audio, rendendo l’esperienza di conversazione ancora più dinamica e coinvolgente. L’integrazione di questa funzionalità multimodale è stata accolta con entusiasmo dagli utenti, poiché offre numerosi vantaggi pratici. Ad esempio, questa nuova funzionalità può essere estremamente utile quando si utilizza ChatGPT mentre si svolge un’altra attività, consentendo agli utenti di ricevere risposte in audio senza dover guardare uno schermo o interagire con esso. Inoltre, questa caratteristica può essere particolarmente vantaggiosa per le persone con disabilità visive, consentendo loro di utilizzare il sistema senza dover fare affidamento esclusivamente sulla lettura dello schermo.
È interessante notare che questa innovazione da parte di OpenAI segue un trend più ampio nell’ambito dell’Intelligenza Artificiale. Anche altri attori nel settore, come Anthropic, hanno introdotto funzionalità multimodali nei loro modelli di Intelligenza Artificiale, consentendo agli utenti di interagire con i sistemi attraverso più di un mezzo. Questo significa che ora è possibile “conversare” con ChatGPT, porre domande utilizzando comandi vocali e ricevere risposte sia sotto forma di testo che di audio, aprendo nuove possibilità di interazione e utilizzo del sistema.
Come funziona ChatGPT “Leggi ad alta voce”
L’ultimo strumento innovativo prodotto da OpenAI, con il nome di “Read Aloud”, è finalmente disponibile sia sulla piattaforma web di ChatGPT che sulle sue app dedicate per dispositivi iOS e Android. Questo strumento rivoluzionario è stato progettato per essere compatibile sia con la versione avanzata GPT-4 che con la precedente GPT-3.5, garantendo un’esperienza ottimale a tutti gli utenti. Una delle caratteristiche più interessanti di questa nuova funzionalità è la sua somiglianza con un navigatore GPS, che permette agli utenti di scegliere tra una vasta gamma di voci, sia maschili che femminili, per la lettura del testo.
Al momento del lancio, “Leggi ad alta voce” è già disponibile in ben 37 lingue diverse, anche se l’azienda ha assicurato che ne saranno aggiunte altre in futuro, ampliando ulteriormente le opzioni linguistiche a disposizione degli utenti. Una delle peculiarità più apprezzate di ChatGPT è la sua capacità di riconoscere automaticamente la lingua in cui è stato scritto il testo, rendendo così l’esperienza di utilizzo ancora più fluida e intuitiva. Questo significa che è possibile ascoltare la lettura di frasi scritte in diverse lingue senza alcuna complicazione aggiuntiva.
Oltre alle funzionalità di base, le app mobili di ChatGPT offrono ulteriori vantaggi agli utenti. Per esempio, è possibile interrompere la riproduzione del testo in qualsiasi momento premendo il pulsante dedicato al lettore “Leggi ad alta voce”. Inoltre, è possibile “riavvolgere” la lettura per ricominciare dall’inizio, garantendo così un controllo completo sull’esperienza di ascolto.