T'interessano le OFFERTE? Risparmia con i nostri coupon su WHATSAPP o TELEGRAM!

ChatGPT è ora un assistente che può vedere, ascoltare e parlare

ChatGPT, sviluppato da OpenAI, sta introducendo nuove capacità che permettono di interagire attraverso voce e immagini, offrendo un’interfaccia intuitiva e più modi per integrare ChatGPT nella vita quotidiana. In un recente annuncio sul proprio sito web, OpenAI ha deciso di svelare in anticipo queste nuove funzionalità. Allo stesso modo ha anche sottolineato i benefici che apportano e le sfide che presentano nel crescente mercato dell’AI.

ChatGPT: interazione vocale

Con la nuova funzionalità vocale, gli utenti possono avere conversazioni interattive con ChatGPT. Questo permette di utilizzare l’assistente anche in movimento, aumentando le potenzialità del chatbot. Ad esempio, un utente potrebbe chiedere a ChatGPT di raccontare una storia per bambini mentre è in viaggio, rendendolo più piacevole.

comandi vocali chatgpt
Una storia creata dal chatbot

Oppure, durante una cena tra amici, potrebbe emergere un dibattito su un argomento specifico; in questo caso, gli utenti possono utilizzare il bot per ottenere informazioni accurate e risolvere il dibattito in modo costruttivo.

La tecnologia vocale di ChatGPT utilizza un avanzato modello di text-to-speech. In collaborazione con attori vocali professionisti, questo modello è in grado di generare audio umanoide partendo da testo e brevi campioni vocali, rendendo l’interazione con ChatGPT ancora più naturale e intuitiva. Inoltre, grazie a Whisper, un sistema di riconoscimento vocale open-source sviluppato da OpenAI, le parole parlate vengono trascritte in testo con grande precisione, permettendo al chatbot di comprendere e rispondere in modo efficace alle richieste degli utenti.

ChatGPT: interazione visiva

Come sopra, il modello di intelligenza artificiale ora può analizzare una o più immagini, permettendo agli utenti di risolvere problemi, pianificare pasti o analizzare grafici complessi. Ad esempio, un utente potrebbe inviare una foto del contenuto del proprio frigorifero. Il chatbot andrebbe dunque ad analizzare gli alimenti presenti e suggerire ricette basate su questi ingredienti, fornendo anche istruzioni passo passo per la preparazione.

comandi per immagini chatgpt

Leggi anche: GPT-4: Gemini sarà il rivale di casa Google. Ecco le differenze

Inoltre, se l’utente ha bisogno di focalizzarsi su un particolare elemento nell’immagine, l’app mobile di ChatGPT include uno strumento di disegno che permette di evidenziare specifiche aree dell’immagine, rendendo la comunicazione e l’analisi ancora più precise e personalizzate.

La comprensione delle immagini è alimentata dai modelli multimodali GPT-3.5 e GPT-4. Questi modelli avanzati applicano le loro competenze linguistiche a una vasta gamma di immagini, come fotografie, screenshot e documenti che contengono sia testo che immagini, permettendo a ChatGPT di comprendere e interpretare il contesto visuale in modo accurato e dettagliato.

Vale la pena ricordare che da poco OpenAI ha integrato non solo Canva ma anche DALL-E 3 in ChatGPT, ovvero il modello generativo di immagini.

Quando e per chi sarà disponibile

Nelle prossime due settimane OpenAI implementererà voce e immagini in ChatGPT per gli utenti con abbonamento Plus ed Enterprise. 

La funzione che permette l’interazione vocale sarà disponibile su iOS e Android ma non sulla versione web, ovvero quella che viene utilizzata dalla maggior parte delle persone.

La funzione che permette invece l’interazione visiva sarà disponibile su tutte la piattaforme, dunque Android, iOS e web.

Fonte | OpenAI

Gianluca Cobucci
Gianluca Cobucci

Appassionato di codice, lingue e linguaggi, interfacce uomo-macchina. Tutto ciò che è evoluzione tecnologia è di mio interesse. Cerco di divulgare la mia passione con la massima chiarezza, affidandomi a fonti certe e non "al primo che passa".

Sottoscrivi
Notificami
guest

0 Commenti
Inline Feedbacks
View all comments
XiaomiToday.it
Logo