Generativna AI in avtorske pravice: Prvi sodni primer v Evropi

Okrožno sodišče v Hamburgu (nem. Landgericht Hamburg) je dne 27. 9. 2024 odločilo v zadevi Kneschke proti LAION e.V (zadeva LAION). Kneschke, ki je po poklicu fotograf, je vložil tožbo zoper nepridobitno organizacijo LAION, ker je ta v svojo podatkovno bazo »LAION-5B«, namenjeno učenju modelov umetne inteligence (UI), vključila eno izmed njegovih fotografij. Kneschke je menil, da to pomeni nezakonito rabo njegovega avtorskega dela oziroma poseg v njegove avtorske pravice na tem delu.

Uvod

Hamburško sodišče je odločilo, da LAION ni kršil avtorskih pravic Kneschkeja, saj je bila uporaba njegove fotografije dovoljena na podlagi izjeme za besedilno in podatkovno rudarjenje (angl. Text and Data Mining, TDM) za namene znanstvenega raziskovanja, kot jo ureja nemški avtorsko-pravni zakon. Določba, ki ureja to izjemo, je bila v nemški Zakon o avtorski in sorodnih pravicah (nem. Urheberrechtsgesetz, UrhG) vnešena v skladu z določbami 3. člena Direktive 2019/790 o avtorski in sorodnih pravicah na enotnem digitalnem trgu (t. i. CDSM direktiva).

To je prvi primer sodne presoje pravne podlage za besedilno in podatkovno rudarjenje, ki jo je Evropska unija (EU) uvedla z CDSM direktivo. Predstavlja pravno podlago za zbiranje velepodatkov za modele UI in lahko predstavlja tudi pravno podlago za učenje modelov UI. Poleg pozitivnega izida za LAION, ta primer predstavlja zanimiv mejnik za vse, ki jih zanima transparentnost podatkovnih baz (angl. data sets).

Sodba nedvomno potrjuje, da se izjemi za besedilno in podatkovno rudarjenje, uvedeni z CDSM direktivo leta 2019, nanašata tudi na uporabo avtorsko-pravno varovanih del v zvezi z generativnimi modeli UI. Primer je izpostavil pomembno vlogo, ki jo imajo lahko nepridobitne organizacije pri omogočanju javnega dostopa do podatkovnih baz, saj je LAION-u priznal status raziskovalne organizacije. To je bistvenega pomena za zagotavljanje transparentnosti podatkov, ki se uporabljajo pri učenju in gradnji modelov UI.

Dejansko stanje

Fotograf Kneschke je vložil tožbo proti nemški nepridobitni organizaciji LAION zaradi nedovoljene uporabe njegove fotografije. Organizacija LAION upravlja podatkovno bazo »LAION-5B«, ki je dostopna na spletu in je namenjena učenju UI. Sporne fotografije sicer same po sebi niso vsebovane v omenjeni podatkovni bazi, saj ta vsebuje le besedne opise fotografij (angl. metadata) in hiperpovezave do spletnih mest, kjer so bile fotografije dostopne v času izdelave podatkovne baze.

Kneschke tako ni mogel tožiti organizacije LAION na podlagi trditve, da je LAION njegove fotografije brez soglasja dajal na voljo javnosti, saj podatkovna baza »LAION-5B« dejansko ne vsebuje nobenih datotek s fotografijami. Namesto tega je Kneschke trdil, da je LAION izdelal reprodukcije njegovih fotografij, kar naj bi se zgodilo v okviru postopka uporabe modela UI. Namen tega postopka je bil preveriti pravilnost opisa fotografij, pri čemer je LAION omenjene fotografije in njim pripadajoče opise zbral z interneta. Model UI je bil tako uporabljen za preverjanje skladnosti opisov z vsebino, kar naj bi zagotovilo, da opisi natančno odražajo motive prikazane na fotografijah. Z drugimi besedami, LAION ni zgolj zbiral fotografij, temveč je aktivno – z uporabo modela UI – preverjal, ali so priloženi opisi teh fotografij pravilni.

Odločitev sodišča

Sodišče je odločilo, da je reproduciranje v okviru izdelave podatkovne baze predstavljalo dejanje besedilnega in podatkovnega rudarjenja, zaradi česar spada pod eno od zakonskih izjem, ki urejajo tovrstna dejanja. Sodišče je prav tako ugotovilo, da LAION kot nepridobitna organizacija, katere cilj je spodbujanje znanstvenega razumevanja UI, spada v okvir izjeme za besedilno in podatkovno rudarjenje za namene znanstvenega raziskovanja kot jo opredeljuje 3. člen CDSM direktive (v nemški pravi red implementiran s 60.d členom UrhG). Pri tej presoji je sodišče zavrnilo argument, da LAION ne izpolnjuje standardov neodvisnosti od komercialnih subjektov (v konkretnem primeru od družbe Stability.ai).

Sodišče je organizaciji LAION priznalo pravno varstvo v okviru izjeme za besedilno in podatkovno rudarjenje za namene znanstvenega raziskovanja iz 3. člena CDSM direktive, saj je presodilo, da delovanje LAION-a pomembno prispeva k znanstvenim raziskavam. LAION ni tipična raziskovalna organizacija, kot so to na primer univerze, temveč je nepridobitna organizacija, katere poslanstvo je izboljševanje znanstvenega, in s tem javnega, razumevanja podatkovnih baz, ki se lahko uporabljajo za učenje modelov UI. Podatkovne baze predstavljajo ključni element v sicer večinoma netransparentnem postopku učenja modelov UI. Zato je, po mnenju teorije, odločitev sodišča, da LAION-a šteje za »raziskovalno organizacijo« v smislu 3. člena CDSM direktive in mu na podlagi tega odobri pravno varstvo, dobrodošla (Keller, 2024 in Guadamuz, 2024).

Nerešena vprašanja

V zadevi LAION je odločitev razmeroma ozka, saj zajema le vprašanje uporabe besedilnega in podatkovnega rudarjenja za izdelavo podatkovne baze, ne pa tudi nadaljnjega postopka učenja modela UI na podlagi te podatkovne baze. V zvezi s tem bo v prihodnosti zanimivo spremljati nove sodne odločitve, ki se bodo razlikovale od jurisdikcije do jurisdikcije, saj so države članice drugače implementirale CDSM direktivo (Keller, 2024).

Sodišče se je posredno ukvarjalo tudi z možnostjo uporabe 44.b člena UrhG, ki ureja besedilno in podatkovno rudarjenje za komercialne namene (implementacija 4. člena CDSM direktive). Ta izjema predstavlja pravno podlago za zakonito uporabo avtorskih del pri učenju modelov UI v komercialne namene, razen za dela, v zvezi s katerimi so si imetniki pravic izrecno in na ustrezen način pridržali uporabo oziroma izbrali t. i. »opt-out«. Nemški zakon zahteva, da mora biti ta pridržek »strojno berljiv« in čeprav je sodišče o tem posredno razpravljalo, na konkretno odločitev ni imelo vpliva, bo pa to vprašanje lahko odločilno v prihodnje.

Hamburško sodišče je odločalo le o zakonitosti uporabe avtorskih del na podlagi izjeme za besedilno in podatkovno rudarjenje za izdelavo podatkovne baze (angl. data set), ni pa odločalo o ustreznosti te izjeme v zvezi z nadaljnjim postopkom učenja modela UI (Rosati, 2024). Sodišče je sicer v obiter dicta navedlo, da določbe Akta o umetni inteligenci (AI akt) vključujejo tudi učenje modelov UI, pri čemer AI akt izrecno napotuje na branje 4. člena CDSM direktive (glej: uvodna izjava 105 in člen 53(1)(c) AI akta), zato vsaj v doktrini ne bi smelo biti več dvomov v to, ali izjema iz 4. člena CDSM direktive zajema tudi učenje modelov UI, saj je iz besedila AI akta in sodbe LAION, jasno razvidno, da ga (Guadamuz, 2024).

Sklep

Zdi se, da je Kneschke tožil napačen subjekt. Namesto da bi tožbo naslovil na organizacijo LAION, bi jo moral nasloviti na družbo Stability.ai (ali na kateri koli drug komercialni subjekt, ki uporablja podatkovne baze za učenje svojih modelov UI).

Sodba je relevantna tudi za Slovenijo, ki je v Zakon o avtorski in sorodnih pravicah (ZASP) implementirala relevantne določbe CDSM direktive. V omenjenem zakonu, 57.b člen ZASP predstavlja izjemo za besedilno in podatkovno rudarjenje za znanstvenoraziskovalne namene, 57.a člen ZASP, pa za vse druge namene, vključno s komercialnimi.

Slovenski izjemi določata, da je za namene besedilnega in podatkovnega rudarjenja prosto reproduciranje del, do katerih se zakonito dostopa. Poleg tega omogočata digitalizacijo analognih vsebin in oddaljen dostop do analognih vsebin, vendar samo za namene besedilnega in podatkovnega rudarjenja (TDM). V primeru izjeme za TDM za znanstveno raziskovanje (57.b člen ZASP), je dovoljeno tudi deljenje in dajanje na voljo javnosti izsledkov TDM. Imetniki pravic morajo zagotoviti, da lahko upravičenci obeh izjem učinkovito izvajajo TDM. Če jim to ni zagotovljeno, morajo imetniki pravic ukrepati v 72 urah, sicer so lahko kaznovani (Bogataj Jančič, 2023).

Pomanjkljivost slovenske implementacije je, da je slovenski zakonodajalec pojem zakonitega dostopa definiral ožje kot evropski zakonodajalec. Zakonit dostop v skladu z ZASP zajema dostop na podlagi prostih in odprtih licenc, pogodb ali drugih pravnih podlag. Med slednje sodijo zlasti vsebinske omejitve avtorske pravice in določbe posebnih zakonov (na primer Zakona o obveznem izvodu publikacij). Čeprav je v uvodni izjavi 14 CDSM direktive izrecno določeno, da »zakonit dostop« vključuje tudi dostop do vsebin, ki so prosto (angl. freely) dostopne na spletu, slovenska implementacija tega ne zajema (vsaj ne izrecno).

Kljub temu je povsem možno, da bi sodišče v primeru dejanskega spora ZASP razlagalo širše in, upoštevaje uvodno izjavo 14 Direktive CDSM, ugotovilo, da zakonit dostop vključuje tudi dostop do vsebin, ki so prosto dostopne na spletu (oziroma bi sodišče vsaj moralo to razlagati tako). Zainteresiran raziskovalec je dne 30. junija 2024 na Evropsko komisijo naslovil to problematiko. Evropska komisija se ni odločila sprožiti tožbe proti Sloveniji zaradi nepravilnega prenosa CDSM direktive z obrazložitvijo, da slovenska implementacija sicer resda ne omenja vsebin, ki so prosto dostopne na spletu, kot dela pojma zakonitega dostopa, vendar jih tudi izrecno ne izključuje. Zato se lahko šteje, da je bila CDSM direktiva v ZASP prenešena v skladu z njenim namenom, kot izhaja iz uvodnih izjav.

Posledično je mogoče sklepati, da se relevantni določbi ZASP razlagata v duhu uvodne izjave 14 Direktive CDSM, kar lahko pomeni (oziroma bi moralo pomeniti), da zakonit dostop v skladu z ZASP vključuje tudi dostop do vsebin, ki so prosto dostopne na spletu.

Članek Marka Bauerja in dr. Maje Bogataj Jančič, LL.M., LL.M., z naslovom »Generativna UI in avtorske pravice«, je bil dne 7. 11. 2024 objavljen v reviji Pravna praksa, leto 43, št. 42–43/2024, str. 12–13.