Home Umela inteligencia Prvé dojmy z OpenAI o1: AI navrhnutá tak, aby nad ňou premýšľala

Prvé dojmy z OpenAI o1: AI navrhnutá tak, aby nad ňou premýšľala

by
First impressions of ChatGPT o1: An AI designed to overthink it

OpenAI vydalo svoje nové modely o1 vo štvrtok, čo dáva používateľom ChatGPT prvú šancu vyskúšať si modely AI, ktoré sa pozastavia nad „premýšľaním“, kým odpovedia. V súvislosti s týmito modelmi s kódovým označením „Strawberry“ v rámci OpenAI sa vytvoril veľký humbuk. Ale spĺňa Strawberry humbuk?

Tak nejako.

V porovnaní s GPT-4o sa modely o1 cítia ako jeden krok vpred a dva vzad. OpenAI o1 vyniká v uvažovaní a odpovedaní na zložité otázky, ale používanie modelu je zhruba štyrikrát drahšie ako GPT-4o. Najnovšiemu modelu OpenAI chýbajú nástroje, multimodálne možnosti a rýchlosť, vďaka ktorým je GPT-4o taký pôsobivý. V skutočnosti OpenAI dokonca pripúšťa, že „GPT-4o je stále najlepšou voľbou pre väčšinu výziev“ na svojej stránke pomocníka a na inom mieste poznamenáva, že o1 bojuje s jednoduchšími úlohami.

„Je to pôsobivé, ale myslím si, že zlepšenie nie je veľmi významné,“ povedal Ravid Shwartz Ziv, profesor NYU, ktorý študuje modely AI. „Je to lepšie v určitých problémoch, ale nemáte toto plošné zlepšenie.“

Zo všetkých týchto dôvodov je dôležité používať o1 iba na otázky, s ktorými je skutočne navrhnutý: na tie veľké. Aby bolo jasné, väčšina ľudí dnes nepoužíva generatívnu AI na zodpovedanie takýchto otázok, najmä preto, že dnešné modely AI v tom nie sú príliš dobré. O1 je však váhavým krokom týmto smerom.

Premýšľanie cez veľké myšlienky

OpenAI o1 je jedinečný, pretože „premýšľa“ pred odpoveďou, rozdeľuje veľké problémy na malé kroky a pokúša sa identifikovať, kedy je jeden z týchto krokov správny alebo nesprávny. Toto „viacstupňové uvažovanie“ nie je úplne nové (výskumníci ho navrhovali už roky a You.com používa na zložité otázky), ale donedávna to nebolo praktické.

„V komunite AI je veľa vzrušenia,“ povedal v rozhovore generálny riaditeľ spoločnosti Workera a vedľajší lektor Stanfordu Kian Katanforoosh, ktorý vyučuje hodiny strojového učenia. „Ak dokážete natrénovať algoritmus učenia posilňovania v spojení s niektorými technikami jazykového modelu, ktoré má OpenAI, môžete technicky vytvoriť myslenie krok za krokom a umožniť modelu umelej inteligencie prejsť späť od veľkých nápadov, ktoré sa snažíte prepracovať. “

OpenAI o1 je tiež jedinečne drahý. Vo väčšine modelov platíte za vstupné a výstupné tokeny. O1 však pridáva skrytý proces (malé kroky, do ktorých model láme veľké problémy), ktorý pridáva veľké množstvo výpočtov, ktoré nikdy úplne nevidíte. OpenAI skrýva niektoré detaily tohto procesu, aby si zachovala svoju konkurenčnú výhodu. To znamená, že za to stále dostanete poplatok vo forme „uvažovacích tokenov“. To ešte viac zdôrazňuje, prečo musíte byť opatrní pri používaní OpenAI o1, aby vám za to, že sa pýtate, kde je hlavné mesto Nevada, neúčtovali veľa tokenov.

Myšlienka modelu AI, ktorý vám pomôže „odstúpiť od veľkých nápadov“, je však silná. V praxi je na tom model celkom dobre.

V jednom príklade som požiadal ChatGPT o1 preview, aby pomohol mojej rodine naplánovať Deň vďakyvzdania, úlohu, ktorá by mohla ťažiť z trocha nezaujatej logiky a uvažovania. Konkrétne som chcel pomôcť zistiť, či by dve rúry postačovali na varenie večere na Deň vďakyvzdania pre 11 ľudí, a chcel som sa porozprávať, či by sme mali zvážiť prenájom Airbnb, aby sme získali prístup k tretej rúre.

(Maxwell Zeff/OpenAI)
(Maxwell Zeff/OpenAI)

Po 12 sekundách „premýšľania“ mi ChatGPT napísal 750+ slovnú odpoveď, ktorá mi nakoniec povedala, že dve pece by mali stačiť s dôkladnou stratégiou a mojej rodine umožnia ušetriť na nákladoch a tráviť spolu viac času. Ale na každom kroku mi to rozbilo jeho myslenie a vysvetlilo, ako zohľadňuje všetky tieto vonkajšie faktory, vrátane nákladov, času stráveného s rodinou a riadenia pece.

ChatGPT o1 preview mi povedal, ako uprednostniť priestor pece v dome, ktorý organizuje podujatie, čo bolo šikovné. Zvláštne to navrhovalo, aby som zvážil prenájom prenosnej rúry na tento deň. To znamená, že model fungoval oveľa lepšie ako GPT-4o, čo si vyžadovalo viacero doplňujúcich otázok o tom, aké konkrétne jedlá som priniesol, a potom mi dal strohé rady, ktoré som považoval za menej užitočné.

Pýtať sa na večeru na Deň vďakyvzdania sa môže zdať hlúpe, ale mohli by ste vidieť, ako by vám tento nástroj pomohol vyriešiť zložité úlohy.

Tiež som požiadal o1, aby mi pomohol naplánovať náročný deň v práci, kde som potreboval cestovať medzi letiskom, viacerými osobnými stretnutiami na rôznych miestach a mojou kanceláriou. Dalo mi to veľmi podrobný plán, ale možno to bolo trochu veľa. Niekedy môžu byť všetky pridané kroky trochu ohromujúce.

Na jednoduchšiu otázku, o1 robí príliš veľa – nevie, kedy prestať premýšľať. Spýtal som sa, kde môžete nájsť cédrové stromy v Amerike, a prinieslo odpoveď viac ako 800 slov, v ktorej sú načrtnuté všetky variácie cédrového stromu v krajine vrátane ich vedeckého názvu. Z nejakého dôvodu to dokonca muselo niekedy konzultovať zásady OpenAI. GPT-4o odpovedal na túto otázku oveľa lepšie a dodal mi asi tri vety vysvetľujúce, že stromy nájdete po celej krajine.

Temperamentné očakávania

V niektorých ohľadoch Strawberry nikdy nenaplnila humbuk. Správy o modeloch uvažovania OpenAI pochádzajú z novembra 2023, presne v čase, keď všetci hľadali odpoveď na otázku, prečo predstavenstvo OpenAI zosadilo Sama Altmana. To rozprúdilo fámy vo svete AI a niektorých nechalo špekulovať, že Strawberry bola forma AGI, osvietenej verzie AI, ktorú chce OpenAI nakoniec vytvoriť.

Altman potvrdené o1 nie je AGI na vyjasnenie akýchkoľvek pochybností, nie že by ste boli po použití veci zmätení. Generálny riaditeľ tiež znížil očakávania týkajúce sa tohto spustenia, tweetovanie že „o1 je stále chybný, stále obmedzený a stále vyzerá pôsobivejšie pri prvom použití, ako keď s ním strávite viac času.“

Zvyšok sveta AI sa zmieruje s menej vzrušujúcim spustením, ako sa očakávalo.

„Ten humbuk sa vymkol kontrole OpenAI,“ povedal Rohan Pandey, výskumný inžinier zo startupu ReWorkd AI, ktorý vytvára webové škrabky s modelmi OpenAI.

Dúfa, že schopnosť uvažovania o1 je dostatočne dobrá na to, aby vyriešila úzky súbor komplikovaných problémov, kde GPT-4 zaostáva. To je pravdepodobne spôsob, akým väčšina ľudí v tomto odvetví vníma o1, ale nie ako revolučný krok vpred, ktorý GPT-4 predstavoval pre toto odvetvie.

„Každý čaká na skokovú zmenu funkcií pre schopnosti a nie je jasné, či to znamená. Myslím, že je to také jednoduché,“ povedal v rozhovore generálny riaditeľ Brightwave Mike Conover, ktorý predtým spoluvytváral model AI spoločnosti Databricks Dolly.

Aká je tu hodnota?

Základné princípy použité na vytvorenie o1 siahajú roky späť. Google použil podobné techniky v roku 2016 na vytvorenie AlphaGo, prvého systému umelej inteligencie, ktorý porazil svetového šampióna v stolovej hre Go, podotýka Andy Harrison, bývalý zamestnanec spoločnosti Google a generálny riaditeľ investičnej spoločnosti S32. AlphaGo trénoval tak, že hral proti sebe nespočetne veľakrát, v podstate samoukom, kým nedosiahol nadľudské schopnosti.

Poznamenáva, že to vyvoláva starodávnu diskusiu vo svete AI.

„Camp one si myslí, že prostredníctvom tohto agentského procesu môžete automatizovať pracovné postupy. Druhý tábor si myslí, že ak by ste mali všeobecnú inteligenciu a uvažovanie, nepotrebovali by ste pracovný postup a AI by ako človek len urobila úsudok,“ povedal Harrison v rozhovore.

Harrison hovorí, že je v tábore jedna a že tábor dva vyžaduje, aby ste dôverovali AI, aby ste urobili správne rozhodnutie. Nemyslí si, že sme tam ešte.

Iní však považujú o1 za menej rozhodovateľa a skôr za nástroj na spochybnenie vášho myslenia pri veľkých rozhodnutiach.

Katanforoosh, generálny riaditeľ spoločnosti Workera, opísal príklad, keď sa chystal pohovoriť s dátovým vedcom, aby pracoval v jeho spoločnosti. Hovorí OpenAI o1, že má len 30 minút a chce ohodnotiť určitý počet zručností. Môže pracovať spätne s modelom AI, aby pochopil, či o tom uvažuje správne, a o1 pochopí časové obmedzenia a podobne.

Otázkou je, či tento užitočný nástroj stojí za vysokú cenu. Keďže modely AI sú stále lacnejšie, o1 je jedným z prvých modelov AI po dlhej dobe, ktoré sme videli zdražieť.

Source Link

Related Posts

Leave a Comment