OpenAI ir pievienojusi ChatGPT runas un attēlu atpazīšanu, kā arī teksta ierunāšanas funkciju (Video)

ASV mākslīgā intelekta pētniecības laboratorija OpenAI ir paziņojusi par būtisku ChatGPT tērzēšanas robota ChatGPT atjauninājumu, kas veic meklēšanu, izmantojot attēlus, runas atpazīšanu un teksta ierunāšanu.
Runas atpazīšana ļauj uzdot čatbotam jautājumu, izmantojot balsi. Šim nolūkam ChatGPT izmanto atvērtā pirmkoda modeli Whisper, ko izstrādājusi OpenAI.
Par teksta pārvēršanu runā atbild jaunais modelis, kas, kā apgalvo uzņēmums, spēj radīt “cilvēkam līdzīgu balsi” no tikai dažu sekunžu runas paraugiem. Pašlaik ir pieejami pieci balss varianti.
Attēlu meklēšana ļauj nosūtīt interesējošo objektu ChatGPT. Tērzēšanas robots mēģinās saprast pieprasījumu un attiecīgi atbildēs.
Varat arī izmantot lietotnē esošo zīmēšanas rīku, lai norādītu uz konkrētu attēla daļu.
OpenAI apzinās jauno funkciju potenciālos riskus. Uzņēmums neļauj ChatGPT apstrādāt cilvēku fotogrāfijas vai atbildēt uz jautājumiem par tiem.
Jaunās funkcijas būs pieejamas ChatGPT Plus Enterprise abonentiem divu nedēļu laikā. Vēlāk uzņēmums nodrošinās piekļuvi tām visiem lietotājiem.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Avots: Openai