Tím vedcov práve našiel niečo, čo mení mnohé z toho, čo sme si mysleli, že vieme o schopnostiach AI. Vaše modely nielen spracovávajú informácie, ale rozvíjajú sofistikované schopnosti, ktoré presahujú rámec ich tréningu. A aby sme tieto schopnosti odomkli, musíme zmeniť spôsob, akým s nimi hovoríme.
Koncepčná vesmírna revolúcia
Pamätáte si, keď sme si mysleli, že AI sa len zhoduje so vzormi? Nový výskum teraz otvorila čiernu skrinku učenia AI zmapovaním niečoho, čo nazývajú „priestor konceptov“. Predstavte si učenie AI ako viacrozmernú mapu, kde každá súradnica predstavuje iný koncept – veci ako farba, tvar alebo veľkosť. Pri sledovaní toho, ako sa modely AI počas tréningu pohybujú v tomto priestore, vedci zistili niečo neočakávané: systémy AI sa nielen učia naspamäť, ale vytvárajú sofistikované chápanie konceptov rôznymi rýchlosťami.
„Charakterizáciou dynamiky učenia v tomto priestore identifikujeme, ako je rýchlosť, akou sa koncept učí, riadená vlastnosťami údajov,“ poznamenáva výskumný tím. Inými slovami, niektoré koncepty klikajú rýchlejšie ako iné v závislosti od toho, ako silne vynikajú v tréningových údajoch.
Tu je dôvod, prečo je to také zaujímavé: keď sa modely AI naučia tieto koncepty, neukladajú ich len ako izolované časti informácií. V skutočnosti rozvíjajú schopnosť kombinovať ich spôsobom, ktorý sme ich nikdy výslovne neučili. Je to, ako keby si vytvárali vlastnú kreatívnu súpravu nástrojov – len sme im nedávali správne pokyny, aby ju používali.
Zamyslite sa nad tým, čo to znamená pre projekty AI. Modely, s ktorými pracujete, už môžu pochopiť zložité kombinácie konceptov, ktoré ste ešte neobjavili. Otázkou nie je, či dokážu viac – ide o to, ako ich prinútiť, aby vám ukázali, čoho sú skutočne schopní.
Odomknutie skrytých síl
Tu sú veci fascinujúce. Výskumníci navrhli elegantný experiment, ktorý má odhaliť niečo zásadné o tom, ako sa modely AI učia. Ich nastavenie bolo zdanlivo jednoduché: trénovali model AI len na troch typoch obrázkov:
- Veľké červené kruhy
- Veľké modré kruhy
- Malé červené kruhy
Potom prišiel kľúčový test: mohol model vytvoriť malý modrý kruh? Nebolo to len o nakreslení nového tvaru – išlo o to, či model skutočne porozumel a skombinoval dva rôzne koncepty (veľkosť a farbu) tak, ako to nikdy predtým nevidel.
To, čo objavili, mení spôsob, akým uvažujeme o schopnostiach AI. Keď použili normálne výzvy, aby požiadali o „malý modrý kruh“, model sa snažil. Model však v skutočnosti mohol robiť malé modré kruhy – len sme sa nepýtali na správnu cestu.
Vedci objavili dve techniky, ktoré to dokázali:
- „Latentný zásah“ – Je to ako nájsť zadné vrátka do mozgu modelky. Namiesto používania bežných výziev priamo upravili interné signály, ktoré predstavujú „modré“ a „malé“. Predstavte si, že máte oddelené ciferníky pre farbu a veľkosť – zistili, že otáčaním týchto ciferníkov špecifickým spôsobom môže model zrazu produkovať to, čo sa predtým zdalo nemožné.
- “Príliš náročné” – Namiesto toho, aby jednoducho požadovali „modrú“, dostali mimoriadne špecifické hodnoty farieb. Je to ako rozdiel medzi slovami „urob to modré“ a „urob to presne s týmto odtieňom modrej: RGB (0,3, 0,3, 0,7).“ Táto extra presnosť pomohla modelu získať prístup k schopnostiam, ktoré boli za normálnych podmienok skryté.
Obe techniky začali fungovať presne v rovnakom bode tréningu modelu – približne 6000 tréningových krokov. Medzitým bežné výzvy buď úplne zlyhali, alebo potrebovali na fungovanie viac ako 8 000 krokov. A to nebola náhoda – stalo sa to konzistentne vo viacerých testoch.
To nám hovorí niečo hlboké: modely AI rozvíjajú schopnosti v dvoch odlišných fázach. Najprv sa skutočne naučia, ako vnútorne kombinovať koncepty – to je to, čo sa deje okolo kroku 6 000. Ale je tu druhá fáza, v ktorej sa učia, ako spojiť tieto vnútorné schopnosti s naším bežným spôsobom žiadania vecí. Je to ako keby model plynule ovládal nový jazyk skôr, ako sa naučil, ako nám tento jazyk preložiť.
Dôsledky sú významné. Keď si myslíme, že model niečo nedokáže, môžeme sa mýliť – môže mať schopnosť, ale chýba mu spojenie medzi našimi výzvami a jeho schopnosťami. Neplatí to len pre jednoduché tvary a farby – môže to platiť aj pre zložitejšie schopnosti vo väčších systémoch AI.
Keď výskumníci testovali tieto nápady na údajoch z reálneho sveta pomocou Dátový súbor tváre CelebAnašli rovnaké vzory. Snažili sa prinútiť model, aby vytvoril obrázky „žien s klobúkmi“ – niečo, čo na tréningu nevideli. Pravidelné výzvy zlyhali, ale pomocou latentných zásahov sa ukázalo, že model mohol skutočne vytvoriť tieto obrázky. Schopnosť tu bola – len nebola dostupná bežnými prostriedkami.
The Key Takeaway
Musíme prehodnotiť, ako hodnotíme schopnosti AI. To, že model nemusí byť schopný robiť niečo so štandardnými výzvami, neznamená, že to nemôže robiť vôbec. Rozdiel medzi tým, čo modely AI dokážu, a tým, čo ich môžeme prinútiť, môže byť menší, než sme si mysleli – musíme sa len zlepšiť v pýtaní sa.
Tento objav nie je len teoretický – zásadne mení spôsob, akým by sme mali uvažovať o systémoch AI. Keď sa zdá, že model zápasí s úlohou, možno sa budeme musieť spýtať, či mu skutočne chýba schopnosť, alebo či k nemu jednoducho nepristupujeme správne. Pre vývojárov, výskumníkov aj používateľov to znamená byť kreatívni v tom, ako interagujeme s AI – niekedy potrebná schopnosť už existuje, len čakáme na správny kľúč na jej odomknutie.