Greške u zaokruživanju

KAKO JE EXCEL UNIŠTIO NAUČNA ISTRAŽIVANJA: Automatske ispravke mogu biti loše koliko su i dobre

Autor Gordana Bojanić Izvor mondo.rs

Jedna od najmoćnijih aplikacija ikada napravljenih ipak nije toliko savršena.

DNK lanac
Izvor: SmartLife / Unsplash / Brano

Automatske ispravke ili prediktivno pisanje su one reči koje vam iskaču kada na telefonu nešto kuckate kako biste ubrzali proces ili manje grešili. Međutim, kao što smo svi iskusili, koliko ove ispravke umeju da budu dobre, ponekad umeju da nas dovedu u nezgodnu situaciju.

Tastature, Excel, brojke i slova

Pored tastatura na pametnim telefonima, Microsoft Excel, jedna od najpopularnijih alatki modernog doba, ako ne i najbolji softver ikada napravljen takođe ima modul za automatsko ispravljanje (Autocorrect). Ono što treba da znate je da je Excel jedan od omiljenih programa za naučnike koji mnogo rade sa brojevima i tabelama.

Prema istraživanju koje je nedavno sprovedeno na preko 10.000 objavljenih istraživanja u oblasti genetike u periodu od 2014. do 2020. godine, preko 30% tabela je sadržalo bar jedan pogrešno napisan naziv gena. Kako se ovo istraživanje nadovezuje na jedno iz 2016. Koje je pokazalo da je taj procenat iznosio 20% jasno je da automatske ispravke napreduju, ali ne u dobrom smeru.

Brojevi u tabeli
Izvor: Smartlife / Unsplash / Mika Baumeister

Vreme je da naučnici prestanu da koriste Excel

Excel automatski primenjuje prediktivni tekst kako bi pogodio koji tip podataka korisnik želi da unese. Primera radi, ukoliko unosite broj telefona koji počinje sa nulom, on će automatski to polje definisati kao numeričku vrednost i ukloniti nulu. Ukoliko ukucate “=20/5” dobićete “4”, ali ukoliko ukucate “20/5” dobićete "20. maj" (ukoliko vam je Excel podešen na naš region).

Kada su naučni podaci u pitanju, prosto otvaranje tabele u Excel aplikaciji sa automatskim opcijama aktiviranim već zvuči pogrešno. Kako većina naučnika nema vremena da se bavi trivijalnim stvarima kao što su podešavanje formatiranja i automatskih ispravki u Excel-u, velika je šansa da će im posle biti žao.

Još 2004. godine primećen je problem da Excel konvertuje nazive 20 ljudskih gena i proteina u datume, a nekoliko godina kasnije primećena je ova greška u podacima koji su objavljeni u jednom od najznačajnijih naučnih časopisa na svetu. Grešaka je bilo svuda.

Najveći problem su bili geni koji su se označavali sa MARCH1 i SEPT1 i slično, pa ih je Konzorcijum za nazive ljudskih gena (da, ta organizacija zaista postoji) preimenovala problematične gene u MARCHF1 i SEPTIN1 i slično.

Iako oko 30 problematičnih gena ne deluje toliko zabrinjavajuće u odnosu na ljudski genom (skup svih gena čoveka) koji broji 44.000 gena, ove greške mogu dovesti do multipliciranja ukoliko se pogrešni podaci koriste kao osnova ili za upoređivanje sa nekim novim podacima.

Podaci iz tabele
Izvor: SmartLife / Pexels / Lukas

Finansijska katastrofa

U 2012. godini JP Morgan je objavio da su izgubili više od 6 milijardi dolara zbog glupih grešaka u formulama koje su korišćene u tabelama. Analiza hiljada tabela Enron korporacije pre bankrota pokazala je da je čak četvrtina tabela koje je ova kompanija koja se bavila energetikom imala jednu ili više ključnih grešaka.

Čuveni ekonomisti

Čuveni članak čiji su autori ekonomisti sa Harvarda, Karmen Reinhart i Kenet Rogof često je korišćen da opravda strogoću davanja otkaza nakon svetske ekonomske krize sadržao je ključnu grešku u Excel tabeli koja je izostavila pet od dvadeset zemalja u procesu kreiranja modela.

Engleski COVID-19 problem

Prošle godine je greška u tabeli Javnog zdravstva Engleske dovela da se izgubilo preko 15.000 pozitivnih rezultata COVID-19 testiranja. Ovo je dovelo do ugrožavanja procesa praćenja infekcije do izvora, što je jedan od ključnih metoda u borbi sa svakim virusom. Da stvar bude gora, ovo se dogodilo u jeku epidemije kada je broj pozitivnih skakao na dnevnom nivou.

covid-19
Izvor: SmartLife / CDC

U zdravstvu je normalno da bude oko 5% grešaka u Excel tabelama, dok je zasebna studija pokazala da 11 od 12 tabela sadrže bitne greške u sebi.

Postoje bolji alati

Tabele su veoma korisne i svestrane, ali imaju svoja ograničenja. Ozbiljna poslovanja su se polako udaljila od tabela, posebno kada je u pitanju računovodstvo, i niko u IT-ju više ne koristi tabele kada imaju mnogo sofisticiraniji i pouzdaniji tip baza podataka kao što je SQL.

Nažalost, Excel je i dalje veoma popularan kod naučnika, posebno za deljenje podataka online sa svojim kolegama. Međutim sa velikim brojem podataka raste i mogućnost greške, jer ograničenja Excel-a dolaze do izražaja.

Kako da koristite Excel
Izvor: YouTube / Tech Insider

Skriptovani računarski jezici kao što su Python i R su superiorni u poređenju sa radom sa tabelama i nude napredne analitičke tehnike, koje kad se savladaju omogućavaju znatne uštede u kalkulacijama i obradi podataka. Excel je i dalje savršen alat za unos podataka na malom nivou i lagane analize, jer je ova aplikacija napravljena za većinu korisnika i njihove ne previše zahtevne poslove.

Tagovi