Duboko učenje i plitko razumevanje
Milan Gnjatović
(Ovaj tekst je objavljen u magazinu Planeta br. 92, septembar-oktobar 2019., pod nazivom „Posle 7,5 miliona godina razmišljanja“.)
Revolucija moderne veštačke inteligencije je, u stvari, kontrarevolucija. A njena prva pobeda je ostvarena u domenu jezika.
Dru Mekdermot (Drew McDermott), istraživač na Masačusetskom institutu za tehnologiju, publikovao je 1976. rad u kojem je opisao i kritikovao jednu slabost kojoj su naučnici u oblasti veštačke inteligencije podložni. Dodeljivanje zvučnog naziva nekoj funkcionalnosti softvera stvara iluziju – čak i kod samog autora softvera, ili pogotovo kod njega – da posmatrana funkcionalnost zaista predstavlja ono što njeno ime nagoveštava. Mekdermot je ispravno uočio da je ovakvo „neuredno razmišljanje” pogubno za naučnu disciplinu. Naziv publikacije bio je indikativan: “Veštačka inteligencija sreće prirodnu glupost”. Vreme je pokazalo da se oblast razvila upravo u smeru na koji je Mekdermot upozoravao.
Jezička kontrarevolucija
Veštačka inteligencija je preuzela koncepte i metode iz statistike, od kojih se neki koriste već decenijama, dodelila im nove, zvučnije nazive, a potom počela da ih prikazuje kao sopstvene rezultate. Na novojeziku veštačke inteligencije, „promenljive” su postale „obeležja”, „procenjivanje” je postalo „učenje”, „opservacije” su postale „šabloni”, „parametri” su postali „težine”, „regresiona analiza” je postala „nadzirano učenje”, itd. Intenzivna i sasvim nekritička upotreba novih termina, širokog značenja i bez precizne definicije, vremenom je kod naučnika koji ne vladaju znanjima iz statistike stvorila iluziju da se radi o fundamentalnim kognitivnim procesima, a ne primenjenim statističkim metodama. Jer, dok izraz „nelinearni regresioni model” može da zvuči suvoparno matematički, a „fleksibilni nelinearni dinamički sistem” previše inženjerski, prijemčljiva sintagma „neuralna mreža” deluje intuitivno i nedvosmisleno asocira na mozak i ljudsku inteligenciju. Sasvim dosledno pravilima uspostavljenog novojezika, skup tehnika baziranih na tzv. neuralnim mrežama naziva se „dubokim učenjem“.
Osvajanje jezika je omogućilo korenite promene u naučnoj praksi. Komuniciranje naučnih koncepata je prebačeno na nivo metafora, što je bio osnovni preduslov za obnavljanje naučnog verovanja u proklamovane ciljeve veštačke inteligencije. Danas je intenzitet upotrebe (i zloupotrebe) tzv. neuralnih mreža dostigao nivo dosade. One se smatraju univerzalnim alatom veštačke inteligencije, a stepen poverenja koji im se poklanja je skoro dogmatski. Studenti informatike se već po inerciji uče da tzv. neuralne mreže predstavljaju model biološkog nervnog sistema i inteligencije.
Teško je reći šta više zabrinjava: oni koji tvrde da se ljudska inteligencija može statistički modelovati, ili oni koji takve tvrdnje nekritički prihvataju. Ali činjenica je da softvere zasnovane na tzv. neuralnim mrežama primenjuje heterogena grupa istraživača, koja pored informatičara uključuje i inženjere, biologe, psihologe, medicinare i mnoge druge. I da većina njih ne razume statističke modele koji se nalaze u osnovi softvera – a da neki nisu ni svesni da se radi o statističkim modelima, već im pripisuju mistične osobine inteligencije.
Opisivanje slona
Postoji i široko rasprostranjena naučna racionalizacija za ovu praksu. Tzv. neuralne mreže mogu da modeluju proizvoljnu matematičku funkciju, što se neprimereno, ali sasvim u skladu s opštim trendom, naziva „teoremom univerzalne aproksimacije“. Njihova „univerzalnost“ se zasniva na velikom broju međusobno nezavisnih parametara čije se vrednosti podešavaju tako da izlaz iz sistema odgovara što približnije očekivanim rezultatima. Iz toga se dalje izvodi zaključak da su tzv. neuralne mreže univerzalni alat, primenljiv za predstavljanje širokog opsega fenomena, uključujući i inteligenciju. Iako naizgled intuitivan, ovaj praktični pristup za procenjivanje validnosti računarskih sistema nije opravdan. Da bismo to ilustrovali, korisno je osvrnuti se na jednu anegdotu.
Friman Dajson (Freeman Dyson), mladi profesor teorijske fizike na Univerzitetu Kornel, posetio je 1953. Enrika Fermija (Enrico Fermi), jednog od vodećih fizičara svog vremena. Dajson je već nekoliko godina sa svojom istraživačkom grupom radio na teorijskom modelu raspadanja mezona. Rezultati koje je generisao njihov model slagali su se sa eksperimentalnim merenjima koje je sproveo Fermi, i Dajson je ponosno zakazao sastanak da bi predočio ovo poklapanje. Međutim, Fermi nije bio impresioniran. „Koliko proizvoljnih parametara ste koristili u svom izračunavanju?“, pitao je. „Četiri“, odgovorio je Dajson. „Sećam se da je moj prijatelj Džoni fon Nojman imao običaj da kaže da sa četiri parametra može da opiše slona, a sa pet može da ga natera da vrti surlu“, bio je Fermijev komentar.
Poruka je bila jasna. Korišćenjem dovoljno međusobno nezavisnih parametara može se naizgled opisati proizvoljni fenomen. Ali to što model generiše očekivane rezultate ne znači obavezno da je ispravan. Bila je to važna lekcija za Dajsona. Svesni metodološkog propusta koji su učinili, on i članovi njegove grupe su publikovali rezultate svog istraživanja, da višegodišnji trud ne bi bio sasvim uzaludan, a potom su se razišli, sledeći nove smerove istraživanja. Pedeset godina kasnije, Dajson je opisao ovu anegdotu, napisavši da je zahvalan Fermiju što ga je spasio od daljeg besplodnog istraživanja.
Pa ipak, oblast veštačke inteligencije propustila je ovu metodološku lekciju. Tzv. neuralne mreže sadrže od nekoliko desetina do nekoliko desetina hiljada međusobno nezavisnih parametara. I to (skoro) nikom ne smeta.
„Duboka misao“
Ovde se nameće jedna referenca na „Autostoperski vodič kroz galaksiju“. U ovoj naučnofantastičnoj komediji, superiorna vrsta kreira superračunar, koji naziva „dubokom misli“, i traži mu odgovor na konačno pitanje o „životu, Univerzumu i svemu“. Nakon sedam i po miliona godina „razmišljanja“, računar daje odgovor – broj 42. Nakon očiglednog razočaranja ovim odgovorom, „duboka misao“ dodaje: „Mislim da je problem, da budem potpuno iskrena sa vama, to što nikad niste stvarno znali šta je pitanje“.
|