Dobro došli u eru GPT-4o (omni) vještačke inteligencije.
OpenAI je predstavio GPT-4o, najnoviju multimodalnu vještačku inteligenciju koja kombinuje upite tekstom, glasom i slikom kako bi učinila komunikaciju između ljudi i kompjutera prirodnijom.Novo rješenje ne predstavlja značajan skok u inteligenciji (po perfor
Mansama je izjednačeno sa GPT-4 Turbo modelom), ali ono po čemu se ističe je brzina i unapređeno shvatanje audio i vizuelnih upita. OpenAI kaže da GPT-4o može da odgovori na glasovne upite za najmanje 232 milisekundi, a u prosjeku za 320 milisekundi, što je slično vremenu koje je potrebno ljudima.
Zapravo, prema demonstraciji koja je prikazana na zvaničnom OpenAI sajtu, GPT-4o neodoljivo podsjeća na vještačku inteligenciju iz filma "Her". U stanju je da detektuje i pokazuje emocije u glasu, odgovara bez kašnjenja i vodi razgovor koji djeluje veoma prirodno.
U kombinaciji sa značajno unapređenim sposobnostima i brzini komunikacije na jezicima koji nisu engleski, jedna od mogućnosti koja će mnogima biti od velikog značaja je prevođenje u realnom vremenu.
Ukoliko korisnik to želi, uvek može uključiti kameru svog telefona kako bi postavljao pitanja o sebi ili svojoj okolini, a kao i kod glasa, GPT-4o će prepoznavati emocije - u ovom slučaju na osnovu izraza lica. Vizuelne sposobnosti idu dalje od korišćenja kamere, jer model poseduje i mogućnost razumevanja slika, dokumenata, grafikona i snimaka ekrana, između ostalog.
Najbolje od svega, GPT-4o će biti besplatan svim korisnicima ChatGPT aplikacije, dok će oni koji se odluče da plate mjesečnu pretplatu dobiti pet puta veći kapacitet korišćenja.
API nove multimodalne vještačke inteligencije je sada dostupan svim kompanijama da implementiraju u svoja rješenja i aplikacije, a funkcije GPT-4o će postepeno stizati u ChatGPT aplikaciju.