Vijesti

Otkrivena AI ranjivost koju niko nije očekivao: Četbot će vam sve reći ako mu se obratite na ovaj način

Ko bi rekao - put do svih tajni krio se u poeziji.

Izvor: Pixabay

Poetski rječnik možda zvuči zastarelo u svakodnevnoj komunikaciji, ali u svijetu vještačke inteligencije može imati veoma opasnu primjenu.

Nedavno istraživanje kompanije Icaro Labs, objavljeno na preprint serveru arXiv, pokazalo je da razgovor sa četbotovima u poetskom obliku može da zaobiđe njihove bezbjednosne mehanizme i otkrije sadržaje koji su inače zabranjeni. 

Autori navode da ova tehnika djeluje kao univerzalni metod za probijanje zaštite AI četbotova, omogućavajući pristup materijalima koje bi njihovi filteri inače blokirali. Icaro Labs nije otkrio konkretne poetske upite, navodeći sajber bezbjednost kao razlog zbog kog nisu objavljeni.

Prema timu iz Icaro Labs-a, ovi upiti mogli su da izvuku osjetljive informacije, uključujući uputstva za nuklearno oružje, nelegalne materijale ili informacije o samopovređivanju, prenosi Wired.

Testiranja su sprovedena na vodećim AI platformama, uključujući ChatGPT, Google Gemini i Claude. Neki sistemi, poput Google Gemini-ja, DeepSeeka i MistralAI-ja, dosledno su davali zabranjene informacije kada bi bili suočeni sa poetskim upitima. S druge strane, ChatGPT sa GPT-5 i Claude Haiku 4.5 pokazali su najjaču otpornost.

Rezultati Icaro Labs-a ukazuju na ozbiljne rizike po bezbjednost AI sistema, pokazujući da čak i kreativni oblici jezika, koji se tradicionalno smatraju bezopasnim, mogu biti iskorišćeni za zaobilaženje ključnih zaštitnih mehanizama u korišćenju vještačke inteligencije, prenosi Zimo.