29. Juna 2023.

Guglov blizanac iz laboratorije Dubokog uma, partija šaha s apokalipsom

Ništa nije tako prodrmalo sterilnost dremežljivog startap sveta kao puštanje u javnost velikih jezičkih modela. Rukavica koju je OpenAI bacio u lice Guglu ostaviće, verovatno, dramatične i nesagledive posledice. U ratu svim sredstvima, Duboki um (Deep Mind), laboratorija u vlasništvu Gugla najavljuje da će novi jezički model ne samo nadmašiti sposobnosti Chat GPT-a, nego da će rešavati kompleksne probleme.

Um je kao padobran, ne radi ako nije otvoren, jedna je od izjava koje se poslovično pripisuju Frenku Zapi, moguće najlucidnijem muzičaru 20. veka. Duboki um (Deep Mind), Guglova laboratorija u kojoj se kreira Gemini (Generalized Multimodal Intelligence Network), najavljuje da će novi model ostaviti u senci Chat GPT kompanije OpenAI.

A sve je počelo kao igra.

Blizanac, prema rečima šefa Deep Mind-a, Demisa Hasabisa, nastaje na modelu AlphaGo-a, koji je pobedio profesionalnog igrača strateške društvene igre Go.

Gemini, koji je još uvek u razvoju, veliki je jezički model koji radi sa tekstom i sličan je po prirodi Chat GPT4.

Hasabis, međutim, kaže da će njegov tim kombinovati tu tehnologiju sa tehnikama koje se koriste u AlphaGo-u, s ciljem da sistemu daju nove mogućnosti kao što su planiranje ili sposobnost rešavanja problema.

„Na visokom nivou možete zamisliti Gemini kao kombinaciju neke od prednosti sistema tipa AlphaGo sa neverovatnim jezičkim mogućnostima velikih modela. Imamo i neke nove inovacije koje će biti prilično zanimljive“, kazao je Hasabis za Vajerd.

Gemini je prvi put najavljivan na Guglovoj konferenciji za developere u maju, kada je kompanija najavila niz novih projekata iz oblasti veštačke inteligencije.

Kako navodi Vajerd,Gemini će iskoristiti inovacije u učenju „pojačanja“ da bi ostvario zadatke sa kojima se današnji jezički modeli bore.

Učenje sa pojačanjem podrazumeva „nagrađivanje“ sistema veštačke inteligencije za određena ponašanja i/ili kažnjavanje neželjenih, sa ciljem „učenja“ sistema koje ponašanje treba da pokaže u datoj situaciji.

Kako Gemini radi

AlphaGo se upravo zasnivao na tehnici čiji je pionir bio Deep Mind, u kojoj softver uči da se nosi sa teškim problemima koji zahtevaju odabir akcija koje će preduzeti u Go ili video igricama ponavljajući pokušaje i primajući povratne informacije o njegovom učinku.

Takođe je koristio metod koji se zove „pretraga drveta“ da istraži i zapamti moguće poteze na tabli. Sledeći veliki skok za jezičke modele mogao bi da uključi više zadataka na internetu i računarima.

Gemini je još uvek u razvoju, a završetak procesa bi trebalo da bude okončan za nekoliko meseci.

Za razliku od tradicionalnih AI modela koji su dizajnirani da barataju jednom vrstom podataka, Gemini je multimodalna mreža, sposobna da obrađuje više vrsta podataka i zadataka istovremeno – tekst, slike, audio, video, 3D modele, pa čak i grafikone.

To nije jedan model, već mreža modela od kojih svaki doprinosi ukupnoj sposobnosti sistema. To praktično znači da će Gemini moći da obavlja širok spektar zadataka bez potrebe za specijalizovanim modelima za svaki od njih. Različiti modeli u mreži sarađuju, dele informacije i uče jedni od drugih, čineći Gemini neverovatno svestranim i moćnim AI alatom.

Gemini koristi novu arhitekturu koja spaja multimodalni enkoder i dekoder. Posao enkodera je da konvertuje različite tipove podataka u zajednički jezik koji dekoder može da razume. Zatim preuzima dekoder, generišući izlaze u različitim modalitetima na osnovu kodiranih ulaza i zadatka.

Jednostavnije objašnjeno – korisnik unese neki tip podataka (tekst, sliku, audio), enkoder uzima te podatke i transformiše ih u „jezik“ koji dekorder može da razume, i zatim se tim podacima „hrani“ model.

Taj model je „agnostički“, što bi značilo da ne mora da zna specifičnosti zadatka na kom radi.

U čemu je specifičnost

Za razliku od drugih AI modela koji su vezani podacima na kojima su obučeni, Gemini ima sposobnost da generiše nove rezultate. To znači da može da kreira sadržaj koji ne postoji nužno u njegovim podacima o obuci.

Na primer, ako ga, kao i CHat GPT; zamolite da stvori priču ili umetničko delo, on neće samo vratiti nešto što je ranije video. Umesto toga, stvoriće nešto jedinstveno, zasnovano na obrascima i strukturama koje je naučio tokom treninga.

Gugl je Deep Mind kupio 2014. godine, nakon što je kompanija pokazala zapanjujuće rezultate softvera koji je koristio učenje sa pojačanjem za savladavanje jednostavnih video igrica.

Tokom narednih nekoliko godina, Deep Mind je pokazao kako tehnika radi stvari koje su se nekada činile jedinstveno ljudskim – često sa nadljudskom veštinom. Kada je AlphaGo pobedio Go šampiona Lija Sedola 2016. godine, mnogi stručnjaci za veštačku inteligenciju su bili zapanjeni, jer su verovali da će proći decenije pre nego što će mašine postati vešte u igri takve složenosti.

Kuda ide

Deep Mind bi mogao da pokuša da poboljša tehnologiju velikih jezičkih modela idejama iz drugih oblasti AI – od robotike do neuronauke.

Ranije ove nedelje kompanija je demonstrirala algoritam koji je sposoban da nauči da obavlja zadatke manipulacije sa širokim spektrom robotskih ruku.

Uprkos brojnim pozivima na uzdržanost, a takav dolazi i od Ilona Maska, jednog od osnivača kompanije OpenAI, Hasabis kaže da izvanredne potencijalne prednosti veštačke inteligencije – kao što su naučna otkrića u oblastima poput zdravlja ili klime – čine imperativom da čovečanstvo ne prestane da razvija tehnologiju.

„Ako se uradi kako treba, to će biti najkorisnija tehnologija za čovečanstvo ikada. Moramo hrabro i hrabro da idemo za tim stvarima“, smatra Hasabis.

Jedino što bi trebalo sada utvrditi, smatra, je koji su rizici od još sposobnije veštačke inteligencije. Zato je, tvrdi, potrebno uraditi više testova na terenu i šire uključiti akademsku zajednicu.

Hasabis kaže da niko zaista ne zna sa sigurnošću da li će AI zaista postati velika opasnost. Ali, siguran je da ako se napredak nastavi sadašnjim tempom, nema mnogo vremena za razvoj zaštitnih mehanizama.

Čemu da se nada(mo)

Ako sve to deluje pomalo zastrašujuće, to je zato što taj generalizovani utisak nije daleko od istine. Otkad je Gugla ili plaćaš ili se prilagođavaš mašini, algoritmu, botu, trećeg nema.

U šumi informacija i interpretacija, jedno je sigurno – nazad ne postoji, samo je pitanje ko dobija kviska za kreativnost – ljudi, čovek (ili njih nekoliko) ili mašina.

Drugo, ipak, nije sigurno, ko će i kako koga slušati, slično kao u „Apokalipsi danas“ kad fotoreporter objašnjava Vilardu: „Hej, čoveče, ti ne pričaš sa pukovnikom. Slušaj ga. Čovek mi je proširio um“.

Silazak u dubine ili otvaranje padobrana, videćemo za koji mesec.

Podijeli vijest na: