OpenAI vydalo svoje nové modely o1 vo štvrtok, čo dáva používateľom ChatGPT prvú šancu vyskúšať si modely AI, ktoré sa pozastavia nad „premýšľaním“, kým odpovedia. V súvislosti s týmito modelmi s kódovým označením „jahoda“ v rámci OpenAI sa vytvoril veľký humbuk. Ale spĺňa jahoda humbuk?
Tak nejako.
V porovnaní s GPT-4o sa modely o1 cítia ako jeden krok vpred a dva vzad. ChatGPT o1 vyniká v uvažovaní a odpovedaní na zložité otázky, ale používanie modelu je zhruba štyrikrát drahšie ako GPT-4o. Najnovšiemu modelu OpenAI chýbajú nástroje, multimodálne možnosti a rýchlosť, vďaka ktorým je GPT-4o taký pôsobivý. V skutočnosti OpenAI dokonca pripúšťa, že „GPT-4o je stále najlepšou voľbou pre väčšinu výziev“ na svojej stránke pomocníka a na inom mieste poznamenáva, že GPT o1 má problémy s jednoduchšími úlohami.
„Je to pôsobivé, ale myslím si, že zlepšenie nie je veľmi významné,“ povedal Ravid Shwartz Ziv, profesor NYU, ktorý študuje modely AI. „Je to lepšie v určitých problémoch, ale nemáte toto plošné zlepšenie.“
Zo všetkých týchto dôvodov je dôležité používať značku GPT o1 iba na otázky, s ktorými je skutočne navrhnutá: na tie veľké. Aby bolo jasné, väčšina ľudí dnes nepoužíva generatívnu AI na zodpovedanie takýchto otázok, najmä preto, že dnešné modely AI v tom nie sú príliš dobré. O1 je však váhavým krokom týmto smerom.
Premýšľanie cez veľké myšlienky
ChatGPT o1 je jedinečný, pretože pred odpovedaním „premýšľa“, rozdeľuje veľké problémy na malé kroky a pokúša sa identifikovať, kedy je jeden z týchto krokov správny alebo nesprávny. Toto „viacstupňové uvažovanie“ nie je úplne nové (výskumníci ho navrhovali už roky a You.com používa ho na zložité otázky), ale donedávna to nebolo praktické.
„V komunite AI je veľa vzrušenia,“ povedal v rozhovore generálny riaditeľ Workera a Stanfordský profesor Kian Katanforoosh, ktorý vyučuje hodiny strojového učenia. „Ak dokážete natrénovať algoritmus posilňovania učenia spárovaný s niektorými technikami jazykového modelu, ktoré má OpenAI, môžete technicky vytvoriť myslenie krok za krokom a umožniť modelu AI ísť späť od veľkých nápadov, ktoré sa snažíte prepracovať. .“
ChatGPT o1 je tiež jedinečne drahý. Vo väčšine modelov platíte za vstupné a výstupné tokeny. ChatGPT o1 však pridáva skrytý proces (malé kroky, do ktorých model láme veľké problémy), ktorý pridáva veľké množstvo výpočtov, ktoré nikdy úplne nevidíte. OpenAI skrýva niektoré detaily tohto procesu, aby si zachovala svoju konkurenčnú výhodu. To znamená, že za to stále dostanete poplatok vo forme „uvažovacích tokenov“. To ešte viac zdôrazňuje, prečo musíte byť opatrní pri používaní ChatGPT o1, aby vám za otázku, kde sa nachádza hlavné mesto Nevada, neúčtovali veľa tokenov.
Myšlienka modelu AI, ktorý vám pomôže „odstúpiť od veľkých nápadov“, je však silná. V praxi je na tom model celkom dobre.
V jednom príklade som požiadal ChatGPT o1 preview, aby pomohol mojej rodine naplánovať Deň vďakyvzdania, úlohu, ktorá by mohla ťažiť z trocha nezaujatej logiky a uvažovania. Konkrétne som chcel pomôcť zistiť, či by dve rúry postačovali na varenie večere na Deň vďakyvzdania pre 11 ľudí, a chcel som sa porozprávať, či by sme mali zvážiť prenájom Airbnb, aby sme získali prístup k tretej rúre.
Po 12 sekundách „premýšľania“ mi ChatGPT napísal 750+ slovnú odpoveď, ktorá mi nakoniec povedala, že dve pece by mali stačiť s dôkladnou stratégiou a mojej rodine umožnia ušetriť na nákladoch a tráviť spolu viac času. Ale na každom kroku mi to rozbilo svoje myslenie a vysvetlilo, ako zohľadňuje všetky tieto vonkajšie faktory, vrátane nákladov, času stráveného rodinou a manažmentu pece.
ChatGPT o1 mi povedal, ako uprednostniť priestor pece v dome, ktorý organizuje podujatie, čo bolo šikovné. Zvláštne to navrhovalo, aby som zvážil prenájom prenosnej rúry na tento deň. To znamená, že tento model fungoval oveľa lepšie ako GPT-4o, čo si vyžadovalo viacero následných otázok o tom, aké konkrétne jedlá som priniesol, a potom mi dal rady, ktoré som považoval za menej užitočné.
Pýtať sa na večeru na Deň vďakyvzdania sa môže zdať hlúpe, ale mohli by ste vidieť, ako by vám tento nástroj pomohol vyriešiť zložité úlohy.
Požiadal som tiež ChatGPT o1, aby mi pomohol naplánovať náročný deň v práci, kde som potreboval cestovať medzi letiskom, viacerými osobnými stretnutiami na rôznych miestach a mojou kanceláriou. Dalo mi to veľmi podrobný plán, ale možno to bolo trochu veľa. Niekedy môžu byť všetky pridané kroky trochu ohromujúce.
Na jednoduchšiu otázku, ChatGPT o1 robí príliš veľa – nevie, kedy prestať premýšľať. Spýtal som sa, kde môžete nájsť cédrové stromy v Amerike, a prinieslo odpoveď viac ako 800 slov, v ktorej sú načrtnuté všetky variácie cédrového stromu v krajine vrátane ich vedeckého názvu. Z nejakého dôvodu to dokonca muselo niekedy konzultovať zásady OpenAI. GPT-4o odpovedal na túto otázku oveľa lepšie a dodal mi asi tri vety vysvetľujúce, že stromy nájdete po celej krajine.
Temperamentné očakávania
V niektorých ohľadoch Strawberry nikdy nenaplnila humbuk. Správy o modeloch uvažovania OpenAI pochádzajú z novembra 2023, presne v čase, keď všetci hľadali odpoveď na otázku, prečo predstavenstvo OpenAI zosadilo Sama Altmana. To rozprúdilo fámy vo svete AI a niektorých nechalo špekulovať, že Strawberry bola forma AGI, osvietenej verzie AI, ktorú chce OpenAI nakoniec vytvoriť.
Altman potvrdené o1 nie je AGI na vyjasnenie akýchkoľvek pochybností, nie že by ste boli po použití veci zmätení. Generálny riaditeľ tiež znížil očakávania týkajúce sa tohto spustenia, tweetovanie že „o1 je stále chybný, stále obmedzený a stále vyzerá pôsobivejšie pri prvom použití, ako keď s ním strávite viac času.“
Zvyšok sveta AI sa zmieruje s menej vzrušujúcim spustením, ako sa očakávalo.
„Ten humbuk sa vymkol kontrole OpenAI,“ povedal Rohan Pandey, výskumný inžinier zo startupu ReWorkd AI, ktorý vytvára webové škrabky s modelmi OpenAI.
Dúfa, že schopnosť uvažovania o1 je dostatočne dobrá na to, aby vyriešila úzky súbor komplikovaných problémov, kde GPT-4 zaostáva. Je pravdepodobné, že väčšina ľudí v tomto odvetví si prezerá ChatGPT o1, ale nie ako revolučný krok vpred, ktorý GPT-4 predstavoval pre toto odvetvie.
„Každý čaká na skokovú zmenu funkcií pre schopnosti a nie je jasné, či to znamená. Myslím, že je to také jednoduché,“ povedal v rozhovore generálny riaditeľ Brightwave Mike Conover, ktorý predtým spoluvytváral model AI spoločnosti Databricks Dolly.
Aká je tu hodnota?
Základné princípy použité na vytvorenie o1 siahajú roky späť. Spoločnosť Google použila podobné techniky v roku 2016 na vytvorenie AlphaGo, prvého systému umelej inteligencie, ktorý porazil svetového šampióna v stolových hrách, zdôrazňuje Andy Harrison, bývalý zamestnanec spoločnosti Google a generálny riaditeľ investičnej spoločnosti S32. AlphaGo trénoval tak, že hral proti sebe nespočetne veľakrát, v podstate samoukom, kým nedosiahol nadľudské schopnosti.
Poznamenáva, že to vyvoláva starodávnu diskusiu vo svete AI.
„Camp one si myslí, že prostredníctvom tohto agentského procesu môžete automatizovať pracovné postupy. Druhý tábor si myslí, že ak by ste mali všeobecnú inteligenciu a uvažovanie, nepotrebovali by ste pracovný postup a ako človek by AI len urobila úsudok,“ povedal Harrison v rozhovore.
Harrison hovorí, že je v prvom tábore a druhý tábor vyžaduje, aby ste dôverovali AI, aby ste urobili správne rozhodnutie. Nemyslí si, že sme tam ešte.
Iní však považujú o1 za menej rozhodovateľa a skôr za nástroj na spochybnenie vášho myslenia pri veľkých rozhodnutiach.
Katanforoosh, generálny riaditeľ spoločnosti Workera, opísal príklad, keď sa chystal pohovoriť s dátovým vedcom, aby pracoval v jeho spoločnosti. Povie ChatGPT o1, že má len 30 minút a chce ohodnotiť určitý počet zručností. Môže pracovať spätne s modelom AI, aby pochopil, či o tom uvažuje správne, a ChatGPT o1 pochopí časové obmedzenia a podobne.
Otázkou je, či tento užitočný nástroj stojí za vysokú cenu. Keďže modely AI sú stále lacnejšie, o1 je jedným z prvých modelov AI po dlhej dobe, ktoré sme videli zdražieť.