Milan Gnjatović


HOME RESEARCH PUBLICATIONS STUDENTS MEDIA BIO CV CONTACT

„Virusne” ideje veštačke inteligencije

Milan Gnjatović
(Ovaj tekst je objavljen u magazinu Planeta br. 102, oktobar-novembar-decembar 2021., pod nazivom „'Virusne' ideje“.)

Svet nauke takođe ima svoje epidemije, koje se, za razliku od epidemija zaraznih bolesti, odvijaju u senci društvenih događanja. Naučne epidemije su uzrokovane nekontrolisanim prihvatanjem „virusnih” ideja.

Oblast veštačke inteligencije zaražena je već nekoliko decenija idejom da se ljudska inteligencija suštinski zasniva na statističkim sposobnostima. U publikaciji iz 1996. Stiven Abni (Steven Abney) ukazao je na dramatični porast popularnosti statističkih metoda u oblasti računarske lingvistike: praktično nepoznate metode postale su u periodu od deset godina fundamentalni alati računarske lingvistike. Abni ističe, ne bez izvesnog zadovoljstva, da svako ko ne ume ubedljivo da upotrebljava terminologiju karakterističnu za statističke metode rizikuje da ga pomešaju s kuhinjskim pomoćnim osobljem na banketu Udruženja za računarsku lingvistiku.

U međuvremenu, ideja o univerzalnoj primeni statističkih metoda zarazila je (skoro) čitavu oblast veštačke inteligencije. „Mašinsko učenje” predstavlja jednu od terminoloških odrednica koje se ovih godina dogmatski koriste u naučnoj i kvazinaučnoj korespondenciji. Ovaj izraz odnosi se na primenu automatizovanih statističkih metoda u pokušaju da se empirijski dođe do pravila i struktura za računarsko modelovanje neke ljudske kognitivne sposobnosti, poput analize slike ili razumevanja jezika. Međutim, način na koji se mašinsko učenje uobičajeno praktikuje može se opisati kao zloupotreba statističkih metoda. Ono što je posebno štetno u ovoj praksi jeste prećutno usvojena pretpostavka da programer ne mora suštinski da razume kognitivnu sposobnost koju računarski modeluje, pa čak ni statističku metodu koju primenjuje, jer je postupak tzv. mašinskog učenja automatizovan i izvršava ga program. Primarni zadatak programera je da program „nahrani” dovoljnim brojem primera kojima su pridruženi očekivani rezultati obrade, što se naziva „nadgledanim mašinskim učenjem”, iako nesrećno podseća na vic o psu i njegovom ljudskom saputniku na letu u svemir.

Instant lekari

Razmatranje terminološkog rečnika za naučne bankete moglo bi da ostane u domenu zabave ili bizarnosti da ne postoji namera da se algoritmi mašinskog učenja primene za simuliranje kritičnih kognitivnih zadataka, poput postavljanja medicinskih dijagnoza.

Istraživači na univerzitetu Stenford razvili su 2017. program zasnovan na mašinskom učenju koji dijagnostifikuje pneumoniju na osnovu rendgenskih snimaka pluća. Razvoj ovog programa trajao je samo jedan mesec, a na testu u Stenfordskoj bolnici pokazalo se da program postavlja dijagnoze preciznije od ljudskih radiologa.

Ovaj rezultat je propraćen trijumfalnim naslovom u časopisu „IEEE Spektrum” koji eksplicitno naglašava da je stenfordskim istraživačima bio potreban “samo jedan mesec da pobede radiologe”. Tekla Peri (Tekla Perry), autorka članka u Spektrumu, nije krila oduševljenje. Opisala je epizodu iz privatnog života, u kojoj su radiolozi u Stenfordskoj bolnici propustili da dijagnostifikuju pneumoniju njenom sinu, a tekst je zaključila izjavom da će zahtevati „konsultovanje” programa sledeći put kad sina bude dovodila u urgentnu službu Stenfordske bolnice.

Dve godine nakon objavljivanja ovog članka izbila je globalna epidemija bolesti KOVID-19, izazvana humanim koronavirusom koji izaziva promene u plućima čije su radiološke manifestacije karakteristične za pneumoniju. Ono što bi moglo da predstavlja iznenađenje za one koji veruju medijskim refleksijama razvoja veštačke inteligencije jeste da se stenfordski program za automatizovano dijagnostifikovanje pneumonije ne primenjuje u kliničkoj praksi. Profesor Endru Eng (Andrew Ng), vođa stenfordskog tima koji je razvio ovaj program i suosnivač istraživačkog tima „Gugl Brejn” (engl. Google Brain) pružio je sledeće objašnjenje u vezi s tim:

“Mi koji se bavimo mašinskim učenjem stvarno smo dobri u postizanju uspeha na podacima za testiranje, ali razvoj sistema nažalost zahteva više od toga”.

U svom odgovoru, Eng je ukazao na činjenicu da je program obučen i testiran na specifičnim podacima iz Stenfordske bolnice. U drugim bolnicama, u kojima se primenjuju drugačije mašine ili drugačiji protokoli snimanja, isti program dao bi znatno lošije rezultate. Na kraju je istakao da je jaz između istraživačkih rezultata i njihove praktične primene u realnom okruženju karakterističan za celu oblast veštačke inteligencije, a ne samo za njen deo koji se odnosi na zdravstvenu zaštitu.

Lažne pobede

U stvari, Eng je samo formulisao ono što odavno znaju svi koji razumeju statističke metode mašinskog učenja (iako postoji tendencija da se ovakvi uvidi zanemare u situacijama kad je to marketinški ili finansijski opravdano). Statistički modeli mašinskog učenja sadrže veliki broj međusobno nezavisnih parametara čije se vrednosti automatski izračunavaju tako da izlaz iz sistema što približnije odgovara očekivanim rezultatima. Kvalitet ovakvih sistema primarno zavisi od kvaliteta podataka na kojima se vrši njihovo obučavanje. Međutim, kad usvojite pretpostavku da dijagnostifikovanje pneumonije ne zahteva specifična medicinska znanja, nije teško poverovati da programeri mogu da “pobede radiologe za mesec dana”.

Peri je prenela Engovo objašnjenje u istom časopisu u kome je dve godine pre toga nekritički hvalila program. Senzacionalistički naslov članka sugeriše da Endru Eng pruža „rendgenski“ uvid u medijsku pomamu za veštačkom inteligencijom. Čitaoce nije obavestila da li je revidirala svoj stav o “konsultovanju” programa u vezi s zdravstvenim stanjem svog sina.

Međutim, zaključak se sam nameće. Ako se sticajem okolnosti zadesite na naučnom banketu, ubacite povremeno u svoj govor neku od očekivanih fraza, ali držite „socijalnu distancu“ da ne biste morali praktično da proverite svoju veru u mašinsko učenje.

gnjatovic.info