Odprete svoje najljubše socialno omrežje. Prva objava je posnetek umetno generirane pesmi Taylor Swift. Druga objava je umetno ustvarjena fotografija Putina, ki uživa v McDonald’sovem hamburgerju. V tretji objavi vaša kolegica s posebnim filtrom preizkuša, ali ji bolj pristajajo oblačila v hladnih ali toplih tonih. Pri četrti objavi se pojavi dvom …

Umetna inteligenca, kakor v zadnjem letu ali dveh kar vsepovprek poimenujemo številne zmožnosti hitro spreminjajoče se digitalne tehnologije, je v našem vsakdanu prisotna bolj kot bi si to predstavljali … Toda številni algoritmi in zmogljivosti, ki se skrivajo v njenem zaledju, so v računalniškem svetu prisotni že dolgo.

Z njimi se tako ukvarjajo tudi na Fakulteti za elektrotehniko, računalništvo in informatiko Univerze v Mariboru, kjer v Laboratoriju za sistemsko in operacijsko opremo na Inštitutu za računalništvo dr. Božidar Potočnik že vrsto let prireja posebno konferenco.

Konferenca ROSUS, za katero stojijo besede Računalniška obdelava slik in njena uporaba v Sloveniji, bo letos že 18. zapored, s strokovno konferenco pa želijo, kot pove dr. Potočnik, vsako leto pokazati vsaj delček tega, s čimer so se v preteklem letu v slovenskem prostoru na področju obdelave digitalnih slik ukvarjali.

Kaj pa digitalna obdelava slik sploh je?

»Pod izrazom digitalna obdelava slik običajno razumemo računalniške algoritme s katerimi bodisi avtomatsko detektiramo, lokaliziramo, analiziramo (npr. merimo) in prepoznavamo osebe in/ali predmete, ali pa gre za postopke avtomatskega spreminjanja vsebine slike,« pojasnjuje dr. Potočnik in dodaja:

»Seveda s tem ne mislim na uporabo orodij tipa Photoshop za ročno urejanje/analiziranje slik, ampak predvsem na razvoj in implementacijo zapletenih algoritmov, namenjenih avtomatski obdelavi in analizi slike. Če smo davnega leta 2006, ko smo začeli s serijo teh konferenc, algoritme še lahko strogo ločili med strokovnimi področji, danes tega več ne moremo.«

Kot pove mariborski raziskovalec, so današnji moderni algoritmi kombinacija raznovrstnih znanj s področij obdelave slik, računalniškega vida, nevronskih mrež, globokega učenja, razpoznavanja vzorcev in matematike.

»V javnosti se je močno zasidral izraz umetna inteligenca (pogosto z angleško kratico AI), ki nekako zaobjema prej navedena strokovna področja,« izpostavi ob tem in doda:

»Prišlo nam je v navado, da rečemo, da smo s pomočjo umetne inteligence naredili to in to. Če smo iskreni, se definicija umetne inteligence in umetne inteligentnosti v strokovnih krogih zelo razlikuje od širokega pojmovanja umetne inteligence v javnosti, ki meji že skoraj na nekaj magičnega. A o tem morebiti kdaj drugič.«

Pogled v zaledje »umetne inteligence« tudi na domačih tleh

Dr. Božidar Potočnik tako pove, da bo letos konferenca ROSUS usmerjena v dve pomembni smeri: »Spoznali bomo pravne okvire za uporabo umetne inteligence na področju aplikacij računalniškega vida. Pri razvoju modernih algoritmov potrebujemo ogromno količino podatkov in takoj se tukaj pojavi vprašanje, ali te podatke sploh smemo uporabljati. Smo dobili privolitev uporabnikov? Naj kot zanimivost omenim, da se v ZDA že nakazuje tožba časopisa The New York Times proti konzorciju podjetij, ki razvijajo model ChatGPT. Ta model naj bi bil naučen tudi s pomočjo več milijonov časopisnih člankov, za uporabo katerih konzorcij ni imel izrecnega dovoljenja.«

Nadaljuje: »S precej sorodnim problemom se srečamo tudi pri uporabi rezultatov oziroma izhodov modernih algoritmov. Kdo sme uporabljati rezultate? Se upošteva varstvo osebnih podatkov? Kdo je lastnik avtorskih pravic? Na takšne in podobne dileme bo skušal odgovoriti ROSUS 2024,« ter doda še:

»Poleg tega pa bomo na konferenci videli množico najraznovrstnejših, v Sloveniji razvitih aplikacij računalniškega vida. Še posebej zanimivi in aktualni sta rešitvi, ki prikazujeta, kako umetno tvoriti fotorealistične slike podvodnega sveta in fotorealistične globoko ponarejene (angl. deep fake) videoposnetke.«

Deepfake označuje multimedijske materiale (tj. sliko, zvočni posnetek in/ali video posnetek), ki so bili digitalno obdelani, da bi prepričljivo zamenjali največkrat podobo osebe s podobo druge osebe.

Mariborski raziskovalci s številnimi pomembnimi doprinosi

Generiranje fotografij in videoposnetkov s pomočjo algoritmov, uporaba računalniškega vida, prepoznavanj obrazov in objektov … Vse to so teme, ki jih s sodobnimi aplikacijami in platformami laiki pobližje spoznavamo šele zadnja leta, raziskovalci pa to pri svojem delu uporabljate že dolgo. A »deepfake« papeža v ekstravagantni modni opravi in umetno generiran posnetek povsem realističnih pasjih mladičkov, ki s smrčka otresajo sneg sta le vrh ledene gore oziroma »stranski produkt« vsega, kar se na tem področju dogaja …

S čim se na področju UI in prej omenjenih tem ukvarja dr. Potočnik, s čim laboratorij na Fakulteti za elektrotehniko, računalništvo in informatiko, v okviru katerega deluje in raziskuje, in katere projekte ter dosežke lahko izpostavijo?

»V zadnjih letih so naše raziskave prvenstveno usmerjene v razvoj inteligentnih rešitev za področje biomedicine. Kot prvo naj izpostavim področje ginekologije. V sodelovanju z UKC Maribor smo v svetovnem merilu vzpostavili prvo javno dostopno zbirko 3D ultrazvočnih posnetkov jajčnikov z jajčnimi mešički, vključno z označbami ekspertov. Ta zbirka omogoča razvoj in nepristransko testiranje novih inteligentnih algoritmov za detektiranje jajčnih mešičkov v ultrazvočnih volumnih. Dva zelo napredna računalniška algoritma smo razvili tudi v našem laboratoriju,« pojasni dr. Potočnik, ki nato opiše raziskovalno in komercialno zelo odmevno raziskavo njihovega laboratorija, s katero so se podali na področje ortodontskega zdravljenja.

»Morebiti ste jo celo že uporabljali. Po naročilu industrijskega partnerja smo razvili zelo zapleten inteligentni postopek, ki na rentgenskem posnetku glave pacienta avtomatsko določi položaj 72 ključnih točk. Do nedavnega so ortodonti večino točk morali postavljati ročno, kar je bilo zelo mučno in časovno izredno zahtevno,« razlaga in doda:

»Naša rešitev pa določi točke popolnoma avtomatizirano in to v nekaj trenutkih. Razvoj algoritma je pomenil velik raziskovalni izziv. V primerjavi z drugimi sorodnimi rešitvami v svetovnem merilu je naš algoritem daleč najbolj natančen in edini, ki je zmožen določiti položaj 72 točk. Naj omenim, da zgolj natančno detektirane karakteristične točke omogočajo ortodontu, da kvalitetno načrtuje zdravljenje in posege.«

Pa trenutno? »Trenutno se ukvarjamo z razvojem rešitve za avtomatsko prepoznavanje tipa tkiva iz histopatoloških mikroskopskih slik.« pove dr. Božidar Potočnik: »Povedano bolj po domače: če boste imeli gastroenterološki pregled debelega črevesa, bo naš algoritem na osnovi mikroskopskih slik tkiva, specialista takoj opozoril, ali gre za normalno tkivo oziroma za potencialno nevarno tkivo.«

UI – nova ali ne tako nova?

»Čuda« umetne inteligence, ki smo jim vsakdanji uporabniki spleta priča danes, za raziskovalce s področja računalniškega vida, med katerimi so tudi dr. Potočnik in njegovi kolegi, niso nova. Kje vse pa smo lahko laiki tovrstne sodobne rešitve vede ali nevede uporabljali v preteklosti?

»Če poseževa malo v ne tako davno zgodovino. Zelo uporabni so bili programčki za OCR (angl. Optical Character Recognition), s katerimi smo lahko prebrali tekst iz slike,« spomni dr. Potočnik ter omeni še aplikacije za prepoznavanje osebe na osnovi obraza, ki se uporabljajo za kontrolo dostopa; aplikacije za prepoznavanje številke registrske tablice avtomobila za vstop in izstop iz parkirišča ter avtomatsko obračunavanje cestnine na avtocesti; prepoznavanje prometnih znakov in podobno.

Za to, da poznate svoj podton kože, se zahvalite računalniškemu vidu

Če so bile vse omenjene možnosti uporabe za vsakdanje uporabnike precej revolucionarne, pa jih danes uporabljamo že na skoraj vsakem koraku. Kot ugotovimo, je računalniški vid prisoten bolj kot bi pričakovali.

Najdemo ga v Tik Tok filtrih, ki prepoznavajo podton vaše kože in povedo, ali vam bolj pristaja zlat ali srebrn nakit; »pametna ogledala«, ki v trgovinah z ličili analizirajo obraz in predlagajo odtenek pudra; sodobne trgovine z oblačili, kjer je mogoče oblačilo preizkusiti kar v ogledalu …

Dr. Potočnik potrdi, da gre pri večini od teh za računalniški vid, a dodaja: »Večina teh aplikacij ne uporablja generativne AI, ki ustvari popolnoma novo urejeno sliko. Metode, ki ste jih omenili, delujejo večinoma na klasičnem principu: najprej se algoritemsko detektira relevanten del scene (npr. usta, oči, obrvi, telo ipd.), zatem se ta del slike ustrezno spremeni (npr. doda ogrlica, nova barva ali novo oblačilo), na koncu pa se spremenjen del slike zlepi z originalno sliko.«

Kako vedeti, ali je fotografija pristna?

Po še sveži medijski drami, ki se je zgodila ob tem, ko so uporabniki socialnih omrežjih na nedavni fotografiji princese Catherine in njenih otrok zaznali umetno spremenjene elemente, se pojavi vprašanje, kako prepoznati umetne posege v slike in kako realistično je lahko generiranje slik s pomočjo umetne inteligence.

»Strokovnjaki takšne posege zelo hitro prepoznamo in tudi rezultat ni najbolj fotorealistično prepričljiv, saj v sliki opazimo močne prehode med posamezni deli slike ter mnogo šuma,« pojasnjuje dr. Potočnik in dodaja:

»Popolnoma druga zgodba pa je urejanje slik s pomočjo generativne AI, kjer dobimo fotorealistično prepričljive rezultate. Na spletu najdemo kopico orodij za generiranje/urejanje slik, kot na primer Image Creator, DALL-E, ImageFX, Picsart itn., katerih funkcionalnost je ob prosti uporabi žal močno omejena.«

Tako nam dr. Potočnik tudi sam pokaže primer umetno generirane fotografije »samega sebe«, ki jo je Bingov AI Image Creator ustvaril po ključnih besedah: »Scientist for computer vision and deep learning. Sitting in his cabinet. In-front of computer.«

[[image_1_article_64212]]

Umetno generirane fotografije – nov problem ali priložnost?

Umetno generirane fotografije in videoposnetki pa niso le sodobna past uporabnikov spleta, ampak skrivajo potencial za precej napredno uporabo ...

»Če se dotakneva tega, za kakšen namen uporabiti umetno generirane/urejene slike in videoposnetke, pa razen zabave in zlorabe odgovor ni viden na prvi pogled,« razlaga dr. Potočnik:

»Velik potencial se kaže na področju digitalnih dvojčkov. Digitalni dvojček je karseda verodostojen računalniški model realnega sveta. V ozadju je ideja, da s pomočjo digitalnega dvojčka preizkusimo raznovrstne scenarije, ter med množico ponujenih rešitev izberemo najperspektivnejšo.«

Ob tem nadaljuje: »Nekaj podobnega lahko delamo s pomočjo umetne inteligence tvorjenih slik. Na primer, virtualno pomerjamo oblačila (očala, pokrivala itn.); virtualno spreminjamo pričesko; virtualno umestimo novo hišo v sosesko; virtualno preverimo, kako bi izgledala čeljust po ortodontski operaciji. Možnosti se odpirajo kar same.«

»Umetno generiranje fotorealističnih slik se v raziskovalni srenji danes najbolj množično uporablja za tvorjenje ogromne količine podatkov. Moramo se zavedati, da umetna inteligenca za učenje globokih modelov potrebuje izjemne količine raznovrstnih podatkov,« še dodaja dr. Potočnik in pove, da je pridobivanje podatkov časovno zelo potratno, ob tem pa predstavlja tudi velik finančni zalogaj. Prav v takih primerih je umetno kreiranje podatkov izjemna rešitev, katere delček bo predstavljen tudi na letošnji konferenci ROSUS 2024.

Zabava le ena plat, potenciali pa veliko večji

Po vprašanju, kako prepoznati pristnost, pa sledi nekoliko bolj relevantno vprašanje. Kako lahko strojni oziroma računalniški vid pomagata pri reševanju sodobnih družbeni izzivov, kot so varnost, zdravstvo, okolje …?

»Naj na začetku samo pojasnim, da izraz strojni vid nakazuje, da gre za rešitve, namenjene za industrijsko okolje, vse ostalo pa se okarakterizira kot računalniški vid,« pojasni dr. Potočnik: »V svoji najgloblji ideji želi računalniški vid posnemati človeški vidni sistem skupaj s človekovo inteligenco in presojo.«

»V določenih vidikih računalniški vid seveda prekaša človeka, še posebej če govorimo o opravljanju ponavljajočih se nalog, koncentracije in hitrosti obdelave,« še pojasnjuje mariborski raziskovalec in dodaja: »Sam sem mnenja, da naj bodo algoritmi računalniškega vida v pomoč in razbremenitev človeku, nikakor pa ne njegova zamenjava, saj določene situacije lahko pravilno presodi in oceni le človek.«

Kje in kako torej? »Računalniški vid lahko uporabimo povsod, kjer se trenutno uporablja človeški vid in človekova presoja. Z morebiti nekoliko preveliko samozavestjo trdim, da smo raziskovalci zmožni razviti rešitve za večino problemov. Hkrati s tem pa se takoj pojavi vprašanje o finančni upravičenosti in vzdržnosti razvoja in uporabe računalniškega vida,« še razmišlja dr. Potočnik in sklene:

»Premnoga podjetja in javne službe prav zaradi finančnega vložka vztrajajo pri starem (ročnem) načinu dela. Treba se je seveda zavedati, da za aplikacije računalniškega vida potrebujemo naprave za zajem slik (npr. kamere, fotoaparate) in relativno zmogljive računalniške sisteme.«

Kaj pa … posledice?

Naravno in več kot nujno sledi vprašanje etičnih vidikov in posledic. Kako lahko, če sploh, preprečimo, da bi se ta tehnologija uporabljala za zlonamerne namene?

»Nekaj bo o tem govorila tudi letošnja konferenca ROSUS 2024,« pove dr. Potočnik in doda, da je uporaba umetne inteligence in računalniškega vida do določene mere že pravno regulirana v Evropi in zahodnem svetu.

»Po mojem mnenju bomo priča enakemu trendu kot na drugih področjih,« razmišlja dr. Potočnik: »Zlonamerne uporabe ne bomo nikoli uspeli preprečiti. Pomembna bo torej preventiva v obliki osveščanja uporabnikov, ter do neke mere kurativa, s pomočjo katere bomo lahko odkrivali globoke ponaredke. Na avtomatskem odkrivanju ponaredkov trenutno potekajo izredno intenzivne raziskave in razvoj.«

Ob koncu se tako poraja vprašanje, katero mora biti najpomembnejše vprašanje, ki ga je potrebno v zvezi z umetno inteligenco razrešiti v naslednjem desetletju …

Dr. Potočnik razmišlja: »Raziskovalci smo pri svojem delu morebiti malo preveč naivni. Zanima nas zgolj reševanje določenega problema, ne razmišljamo pa o tem, kako bi/bo nekdo zlorabil naše znanje. Razprave odločevalcev bi morale iti v smer »Umetna inteligenca v službi ljudi in ne na njihovo škodo,« ter sklene:

»V ZDA so na področju računalniških in informacijskih tehnologij v procesu uvajanja zelo rigoroznih varnostnih mehanizmov kot je »Ničelno zaupanje« in »Zaupaj, a verificiraj«, a po mojem mnenju, tudi s tem ne bomo prišli problemu do dna.«