Nové pravidlá EÚ pre umelú inteligenciu spôsobujú boj o transparentnosť dát.
Nové zákony o používaní umelej inteligencie (AI) v Európskej únii prinútia firmy byť otvorenejšie o dátach, ktoré používajú na trénovanie svojich systémov. To odhalí jedno z najstráženejších tajomstiev v tomto odvetví. Od chvíle, keď Microsoft podporil OpenAI a táto firma predstavila ChatGPT verejnosti, sa zvýšil záujem a investície do generatívnej AI. Táto technológia dokáže rýchlo vytvárať texty, obrázky a zvuk.
Ale ako toto odvetvie rastie, ľudia sa pýtajú, ako firmy získavajú dáta na trénovanie svojich modelov. Niektorí sa obávajú, že používanie bestsellerov a hollywoodskych filmov bez povolenia autorov môže porušovať autorské práva. Nový zákon bude zavádzaný postupne počas nasledujúcich dvoch rokov. To dáva regulátorom čas na zavedenie nových pravidiel, zatiaľ čo spoločnosti sa budú musieť prispôsobiť novým povinnostiam. Ale ako presne budú tieto pravidlá fungovať, ešte nie je jasné.
Jedna z častí zákona hovorí, že firmy, ktoré používajú všeobecné AI modely, ako je ChatGPT, budú musieť poskytnúť „podrobné zhrnutia“ obsahu, ktorý použili na trénovanie. Novozriadený úrad plánuje v roku 2025 vydať šablónu, ktorú budú firmy nasledovať. Vývojári ale nechcú prezradiť, na čom trénovali svoje modely, pretože to považujú za obchodné tajomstvo. „Bolo by to ako sen vidieť dáta mojich konkurentov, a rovnako pre nich vidieť naše,“ povedal Matthieu Riouf, šéf firmy Photoroom. „Je to ako varenie,“ dodal. „Existuje tajná časť receptu, ktorú najlepší kuchári neprezradia.“
Ako podrobné budú tieto správy o transparentnosti, bude mať veľký vplyv na menšie startupy aj veľké technologické firmy ako Google a Meta, ktoré stavajú svoju budúcnosť na tejto technológii. Za posledný rok čelili viaceré známe technologické firmy, vrátane Google, OpenAI a Stability AI, žalobám od tvorcov, ktorí tvrdia, že ich obsah bol nesprávne použitý na trénovanie modelov.
Aj keď americký prezident Joe Biden vydal niekoľko nariadení zameraných na bezpečnostné riziká, otázky týkajúce sa autorských práv ešte neboli úplne vyriešené. Výzvy, aby technologické firmy platili držiteľom práv za dáta, získali podporu v Kongrese.
Technologické firmy uzavreli množstvo dohôd o licencovaní obsahu s médiami a webstránkami. Napríklad OpenAI uzavrela dohody s Financial Times a The Atlantic, zatiaľ čo Google uzavrel dohody s NewsCorp a sociálnou sieťou Reddit. Napriek týmto krokom čelila OpenAI kritike, keď jej technická riaditeľka Mira Murati odmietla odpovedať na otázku, či boli YouTube videá použité na trénovanie ich video-generujúceho nástroja Sora.
Minulý mesiac čelila OpenAI ďalšej kritike, keď v ukážke najnovšej verzie ChatGPT použila generovaný hlas umelou inteligenciou, ktorý bol „strašidelne podobný“ hlasu herečky Scarlett Johansson. Thomas Wolf, spoluzakladateľ startupu Hugging Face, povedal, že podporuje väčšiu transparentnosť, ale tento názor nezdieľa celé odvetvie. „Je ťažké povedať, ako to dopadne. Ešte je veľa vecí, ktoré treba rozhodnúť,“ povedal.
Starší zákonodarcovia v Európe sú rozdelení. Dragos Tudorache, jeden z tvorcov zákona v Európskom parlamente, povedal, že spoločnosti by mali byť nútené zverejniť svoje dátové súbory. „Musí to byť dostatočne podrobné, aby Scarlett Johansson, Beyonce alebo ktokoľvek iný vedel, či ich práca, piesne, hlas, umenie alebo veda boli použité na trénovanie algoritmu,“ povedal.
Úradník Komisie uvádza: „Zákon uznáva potrebu zabezpečiť rovnováhu medzi legitímnou potrebou chrániť obchodné tajomstvá a potrebou umožniť stranám s legitímnymi záujmami, vrátane držiteľov autorských práv, uplatňovať svoje práva podľa práva Únie.“
Francúzska vláda sa pod vedením prezidenta Emmanuela Macrona postavila proti zavádzaniu pravidiel, ktoré by mohli ohroziť konkurencieschopnosť európskych startupov. Na konferencii Viva Technology v Paríži v máji francúzsky minister financií Bruno Le Maire povedal, že chce, aby Európa bola svetovým lídrom v AI, a nie len spotrebiteľom amerických a čínskych produktov.