
Il mondo dell’intelligenza artificiale è in costante evoluzione, e OpenAI non è da meno con il lancio del suo ultimo modello linguistico, GPT-4o, una versione avanzata del precedente GPT-4 Turbo. Questa nuova iterazione non si limita solo a migliorare, ma estende significativamente le sue capacità includendo non solo testo e immagini, ma anche l’audio.
OpenAI presenta GPT-4o: cosa è e di cosa è capace
GPT-4o è descritto come una versione “omni” (da qui il “o” nel nome), poiché integra più modalità di interazione: testo, visione e, ora, voce. Questo modello offre una risposta in tempo reale alle domande degli utenti, permettendo loro di interrompere il sistema mentre risponde e persino di cambiare la domanda in corso d’opera. Inoltre, può riconoscere le emozioni nella voce dell’utente e rispondere in modo appropriato, variando lo stile emotivo delle risposte, fino a includere risposte cantate.
Potrebbe interessarti anche: Cosa sono i modelli linguistici nell’Intelligenza Artificiale?
Oltre alle interazioni vocali, GPT-4o potenzia notevolmente le capacità visive di ChatGPT. Ad esempio, può ora rispondere rapidamente a domande relative a fotografie o schermate, identificando dettagli come il brand di una maglietta o il contenuto di un codice software visualizzato. Immaginate di poter fotografare un menu in una lingua straniera e ricevere immediatamente la traduzione: questo è solo uno degli scenari futuri possibili con GPT-4o.
Il nuovo modello di OpenAI GPT-4o offre supporto migliorato per oltre 50 lingue, garantendo una performance doppia rispetto al precedente GPT-4 Turbo e a metà del prezzo, con limiti di utilizzo più elevati. Ciò si traduce in un’esperienza utente più fluida e accessibile, espandendo le potenzialità di utilizzo in vari contesti internazionali.
Disponibilità e uscita
GPT-4o è ora disponibile gratuitamente per gli utenti della versione free di ChatGPT e per i sottoscrittori dei piani premium, con limiti di messaggi quintuplicati. Queste modifiche sono accompagnate da un rinnovato layout dell’interfaccia utente, più intuitivo e conversazionale, e da una versione desktop per macOS, che presto sarà seguita da una versione per Windows. Inoltre, l’accesso alle funzionalità precedentemente a pagamento, come la capacità di “ricordare” le preferenze dell’utente, è ora esteso a tutti gli utenti.