Tento týždeň zverejnili Sam Altman, generálny riaditeľ OpenAI, a Arianna Huffington, zakladateľka a generálna riaditeľka zdravotníckej spoločnosti Thrive Global článok v Time vychvaľovanie Prospieva AI, startup podporovaný Thrive and OpenAI’s Startup Fund. Článok naznačuje, že AI by mohla mať obrovský pozitívny vplyv na verejné zdravie tým, že by ľudí prehovorila k zdravšiemu správaniu.
Altman a Huffington píšu, že Thrive AI pracuje na „plne integrovanom osobnom trénerovi AI, ktorý vám ponúka štuchnutia a odporúčania v reálnom čase, ktoré sú pre vás jedinečné, čo vám umožní prijať opatrenia na zlepšenie vášho zdravia“.
Ich vízia pozitívne ovplyvňuje to, čo sa môže ukázať ako jedna z najostrejších dvojitých hrán AI. Modely AI sú už zbehlé v presviedčaní ľudí a nevieme, o koľko by sa mohli stať výkonnejšími, keď napredujú a získavajú prístup k viac osobným údajom.
Aleksander Madry, profesor sabbaticalu z Massachusettského technologického inštitútu, vedie tím na OpenAI s názvom Pripravenosť, ktorý pracuje práve na tomto probléme.
„Jedným z prúdov práce v pripravenosti je presviedčanie,“ povedal Madry pre WIRED v májovom rozhovore. „V podstate premýšľať, do akej miery môžete použiť tieto modely ako spôsob, ako presvedčiť ľudí.“
Madry hovorí, že k vstupu do OpenAI ho priviedol pozoruhodný potenciál jazykových modelov a pretože riziká, ktoré predstavujú, boli sotva preskúmané. „Doslova neexistuje takmer žiadna veda,“ hovorí. „To bol impulz pre úsilie o pripravenosť.“
Presvedčivosť je kľúčovým prvkom v programoch ako ChatGPT a jednou zo zložiek, vďaka ktorým sú takéto chatboty tak presvedčivé. Jazykové modely sú trénované v ľudskom písaní a dialógu, ktorý obsahuje nespočetné množstvo rétorických a nátlakových trikov a techník. Modely sú tiež zvyčajne jemne vyladené, aby sa mýlili vo vyjadreniach, ktoré používatelia považujú za presvedčivejšie.
Výskum prepustený v apríli od Anthropic, konkurenta založeného exulantmi OpenAI, naznačuje, že jazykové modely sa stali lepšími v presviedčaní ľudí, keďže narástli do veľkosti a sofistikovanosti. Tento výskum zahŕňal poskytnutie vyhlásenia dobrovoľníkom a následné zistenie, ako argument vygenerovaný AI zmení ich názor naň.
Práca OpenAI sa rozširuje na analýzu AI v rozhovore s používateľmi – niečo, čo môže odomknúť väčšiu presvedčivosť. Madry hovorí, že práca sa vykonáva na súhlasných dobrovoľníkoch a odmieta prezradiť doterajšie zistenia. Ale hovorí, že presvedčovacia sila jazykových modelov siaha hlboko do seba. „Ako ľudia máme takú ‚slabosť‘, že ak s nami niečo komunikuje prirodzeným jazykom (myslíme na to, ako keby), je to človek,“ hovorí v narážke na antropomorfizmus, vďaka ktorému môžu chatboty pôsobiť živšie a presvedčivejšie.
Článok Time tvrdí, že potenciálne zdravotné prínosy presvedčivej AI si budú vyžadovať silné právne záruky, pretože modelky môžu mať prístup k toľkým osobným informáciám. „Tvorcovia politiky musia vytvoriť regulačné prostredie, ktoré podporuje inovácie AI a zároveň chráni súkromie,“ píšu Altman a Huffington.
Toto nie je všetko, čo budú musieť politici zvážiť. Môže byť tiež kľúčové zvážiť, ako by sa mohli zneužiť čoraz presvedčivejšie algoritmy. Algoritmy AI by mohli zvýšiť rezonanciu dezinformácií alebo vytvoriť obzvlášť presvedčivé phishingové podvody. Môžu byť tiež použité na reklamu produktov.
Madry hovorí, že kľúčovou otázkou, ktorú ešte musí preskúmať OpenAI alebo iní, je, o koľko presvedčivejšie alebo donucovanejšie programy AI, ktoré interagujú s používateľmi počas dlhých časových období, môžu byť. Už niekoľko spoločností ponúka chatbotov, ktorí hrajú rolu romantických partnerov a iných postáv. AI priateľky sú čoraz populárnejšie – niektoré sú dokonca navrhnuté kričať na teba– ale ako návykové a presvedčivé tieto roboty sú, je do značnej miery neznáme.
Vzrušenie a humbuk, ktorý vyvolal ChatGPT po jeho vydaní v novembri 2022, videli, že OpenAI, externí výskumníci a mnohí tvorcovia politiky sa zamerali na hypotetickejšiu otázku, či by sa AI mohla jedného dňa obrátiť proti svojim tvorcom.
Madry hovorí, že to riskuje ignorovanie jemnejších nebezpečenstiev, ktoré predstavujú algoritmy so strieborným jazykom. „Obávam sa, že sa zamerajú na nesprávne otázky,“ hovorí Madry o doterajšej práci politikov. „Že v určitom zmysle každý hovorí: ‚Ach áno, riešime to, pretože o tom hovoríme,‘ aj keď v skutočnosti nehovoríme o správnej veci.“