BOTANIC

AI počeo da dešifruje kod života: Novi model predviđa funkcije gena i skrivenu logiku DNK

Novi AI model treniran na DNK sekvencama predviđa funkcije gena i njihove veze, otkrivajući dublju logiku biologije.

Izvor: YouTube / Sci- Inspi / SmartLife

Vještačka inteligencija je već transformisala način na koji obrađujemo tekst, slike, video i muziku, ali biologija se nameće kao sledeća velika granica. Umjesto na rečenicama, istraživači sada treniraju modele na DNK i RNK nizovima, tretirajući genetske sekvence kao informacione sisteme koji se mogu analizirati u ogromnim razmerama.

Ovaj zaokret dolazi u trenutku kada količina genomskih podataka raste brže nego što tradicionalni statistički alati mogu da isprate. Tehnologija sekvenciranja postala je drastično jeftinija, ostavljajući naučnike sa ogromnom količinom podataka koje umiju da pročitaju, ali još uvijek ne uspjevaju da protumače na pravi način.

Upravo tu na scenu stupa kompanija Living Models sa svojom porodicom BOTANIC modela. Oni koriste transformer arhitekturu - istu tehnologiju koja pokreće ChatGPT - ali sa potpuno drugačijim ciljem. Umjesto predviđanja sledeće riječi u rečenici, ovi sistemi uče "gramatiku" biologije.

"Svako živo biće na Zemlji radi na istom programskom jeziku: DNK kodira RNK, koji kodira proteine, koji kodiraju fenotip. Mi ne gradimo još jedan četbot. Gradimo model koji može da čita i tumači taj kod, što je beskonačno korisnije od predviđanja sledeće riječi u rečenici", izjavio je Bertran Gakijer, potpredsjednik za biologiju u kompaniji Living Models.

Izbor biljaka kao polazne tačke, umjesto ljudske medicine, je strateški potez. Podaci o biljnim genomima su javni i oslobođeni strogih pravila o privatnosti, što omogućava modelima da uče nevjerovatnom brzinom bez pravnih prepreka.

Takođe, regulatorni proces u poljoprivredi je daleko brži. Dok su u medicini potrebne decenije za klinička ispitivanja, u agrokulturi se rezultati predviđanja otpornosti na sušu mogu provjeriti na terenu za samo jednu sezonu.

Ovo je ključno jer se čovečanstvo suočava sa hitnim problemom - predviđa se da ćemo do 2050. godine morati da nahranimo deset milijardi ljudi u klimi koja se nezaustavljivo menja. Tradicionalno ukrštanje sorti traje i do 12 godina, što je presporo za uslove koji nas čekaju.

BOTANIC funkcioniše kao "motor za hipoteze" koji dramatično skraćuje ovaj proces. On ne donosi odluke samostalno, već istraživačima nudi listu kandidata koji imaju najveće šanse da prežive ekstremne vreline ili nedostatak vode.

"Pitanje nije da li DNK ima 'namjeru' na način na koji ljudski jezik ima. Nema je. Ali ima strukturu - regulatornu gramatiku, konzervirane motive, epistatičke interakcije između udaljenih genomskih regiona - i ta struktura se može naučiti iz samih podataka o sekvencama", navodi se u viziji kompanije.

Dosadašnji alati su se oslanjali na korelacije - znali su da određeni marker ide uz određenu osobinu, ali nisu znali zašto. Kada bi se uslovi u okruženju promijenili, te statističke asocijacije bi se srušile. AI modeli to menjaju jer uče dubinske biološke veze koje važe čak i u nepredviđenim situacijama, piše TechRadar.

Kompanija je namjerno objavila BOTANIC kao modele otvorenih parametara (Open Weights). Njihova logika je jasna: model je samo trenutni snimak znanja, dok je prava vrijednost u protoku podataka i povratnim informacijama koje dobijaju kroz partnerstva sa velikim proizvođačima sjemena.

Budućnost koju Living Models gradi nije ograničena samo na biljke. Ime kompanije je odabrano svjesno - njihova arhitektura je primenljiva na sve žive sisteme, od gljivica do ljudskih mikrobioma. Biljke su samo tamo gde je hitnost najveća, a strukturalne prednosti za AI istraživanje najuočljivije.