OpenAI rival Antropický vydáva nový výkonný generatívny model AI s názvom Claude 3.5 Sonnet. Ale je to skôr postupný krok ako monumentálny skok vpred.
Claude 3.5 Sonnet dokáže analyzovať text aj obrázky, ako aj generovať text a je to zatiaľ najvýkonnejší model od Anthropic – aspoň na papieri. V niekoľkých benchmarkoch AI pre čítanie, kódovanie, matematiku a videnie prekonáva Claude 3.5 Sonnet model, ktorý nahrádza, Claude 3 Sonnet, a poráža predchádzajúci vlajkový model Anthropic Claude 3 Opus.
Benchmarks nie sú nevyhnutne najužitočnejším meradlom pokroku AI, čiastočne preto, že mnohí z nich testujú ezoterické okrajové prípady, ktoré nie sú použiteľné pre priemerného človeka, ako je odpovedanie na otázky týkajúce sa zdravotných skúšok. Ale za čo to stojí, Claude 3.5 Sonnet len tak ledva najlepšie konkurenčné popredné modely, vrátane nedávno spusteného OpenAI GPT-4ona niektorých benchmarkoch ho Anthropic testoval.
Spolu s novým modelom Anthropic vydáva to, čo nazýva Artifacts, pracovný priestor, kde môžu používatelia upravovať a pridávať do obsahu – napr. kód a dokumenty – generovaný modelmi Anthropic. Artifacts, ktoré sú v súčasnosti v ukážke, získajú v blízkej budúcnosti nové funkcie, ako napríklad spôsoby spolupráce s väčšími tímami a ukladanie báz znalostí, hovorí Anthropic.
Zamerajte sa na efektivitu
Claude 3.5 Sonnet je o niečo výkonnejší ako Claude 3 Opus a Anthropic hovorí, že model okrem konceptov lepšie chápe jemné a zložité inštrukcie. ako humor. (AI je notoricky nevtipné, hoci.) Ale čo je možno dôležitejšie pre vývojárov vytvárajúcich aplikácie s Claudom, ktoré vyžadujú rýchle reakcie (napr. chatboty zákazníckych služieb), 3.5 Sonnet je rýchlejší. Je to približne dvojnásobok rýchlosti 3 Opus, tvrdí Anthropic.
Vízia – analýza fotografií – je jednou z oblastí, kde sa Claude 3.5 Sonnet výrazne zlepšuje oproti 3 Opus, podľa Anthropic. 3.5 Sonnet dokáže presnejšie interpretovať tabuľky a grafy a prepisovať text z „nedokonalých“ obrázkov, ako sú obrázky s deformáciami a vizuálnymi artefaktmi.
Michael Gerstenhaber, produktový vedúci v Anthropic, hovorí, že vylepšenia sú výsledkom architektonických vylepšení a nových tréningových údajov vrátane údajov generovaných AI. Ktoré údaje konkrétne? Gerstenhaber neprezradil, ale naznačil, že Claude 3.5 Sonnet čerpá veľkú časť svojej sily z týchto tréningových sérií.
„Pre (podniky) je dôležité, či im umelá inteligencia pomáha napĺňať ich obchodné potreby alebo nie, nie to, či je umelá inteligencia konkurencieschopná v benchmarku,“ povedal Gerstenhaber pre TechCrunch. „A z tohto pohľadu verím, že Claude 3.5 Sonnet bude o krok pred čímkoľvek iným, čo máme k dispozícii – a tiež pred čímkoľvek iným v tomto odvetví.“
Utajovanie údajov o tréningu môže byť spôsobené súťažnými dôvodmi. Môže to však byť aj ochrana Antropickej pred právnymi výzvami – najmä výzvami, ktoré sa jej týkajú férové použitie. Súdy ešte musia rozhodnúť, či predajcovia ako Anthropic a jeho konkurenti, ako OpenAI, Google, Amazon a tak ďalej, majú právo trénovať na verejných údajoch, vrátane údajov chránených autorskými právami, bez kompenzácie alebo pripisovania tvorcom týchto údajov.
Takže všetko, čo vieme, je, že Claude 3.5 Sonnet bol trénovaný na množstve textu a obrázkov, ako predchádzajúce modely Anthropic, plus spätná väzba od ľudských testerov, aby sa pokúsili „zosúladiť“ model so zámermi používateľov, dúfajme, že zabránili tomu, aby vytryskoval toxické alebo iné látky. problematický text.
Čo ešte vieme? No, kontextové okno Claude 3.5 Sonnet – množstvo textu, ktoré model dokáže analyzovať pred vygenerovaním nového textu – je 200 000 tokenov, rovnako ako 3 Sonnet. Tokeny sú rozdelené bity nespracovaných údajov, ako sú slabiky „fan“, „tas“ a „tic“ v slove „fantastický“; 200 000 tokenov zodpovedá približne 150 000 slovám.
A vieme, že Claude 3.5 Sonnet je k dispozícii už dnes. Bezplatní používatelia webového klienta Anthropic a aplikácie Claude iOS k nemu majú bezplatný prístup; predplatiteľov platených programov Anthropic Claude Pro a Tím Claude získať 5x vyššie limity sadzieb. 3.5 Sonnet je tiež aktívny na rozhraní API Anthropic a spravovaných platformách, ako je Amazon Bedrock a Vertex AI Google Cloud.
„Claude 3.5 Sonnet je skutočne skokovou zmenou v inteligencii bez obetovania rýchlosti a pripravuje nás na budúce vydania v rámci celej rodiny modelov Claude,“ povedal Gerstenhaber.
Claude 3.5 Sonnet poháňa aj artefakty, ktoré sa vo webovom klientovi Claude objavia vo vyhradenom okne, keď používateľ požiada model o generovanie obsahu, ako sú úryvky kódu, textové dokumenty alebo návrhy webových stránok. Gerstenhaber vysvetľuje: „Artefakty sú výstupom modelu, ktorý odsúva generovaný obsah na stranu a umožňuje vám ako používateľovi tento obsah opakovať. Povedzme, že chcete vygenerovať kód – artefakt sa vloží do používateľského rozhrania a potom sa môžete porozprávať s Claudom a opakovať dokument, aby ste ho vylepšili, aby ste mohli spustiť kód.“
Väčší obraz
Aký je teda význam Claude 3.5 Sonnet v širšom kontexte Anthropic – a v tomto prípade ekosystému AI?
Claude 3.5 Sonnet ukazuje, že prírastkový pokrok je rozsah toho, čo môžeme práve teraz očakávať na modelovej fronte, s výnimkou veľkého prielomu vo výskume. V posledných mesiacoch sme boli svedkami vydania vlajkových lodí od spoločnosti Google (Gemini 1.5 Pro) a OpenAI (GPT-4o), ktoré posúvajú ihlu okrajovo, pokiaľ ide o benchmark a kvalitatívny výkon. Ale nenastal ani skok, ktorý by sa vyrovnal skoku z GPT-3 do GPT-4 v pomerne dlhom čase, kvôli rigidite dnešných modelových architektúr a obrovskému výpočtovému výkonu, ktorý potrebujú na trénovanie.
Ako predajcovia generatívnej AI obracajú svoju pozornosť na spravovanie údajov a udeľovanie licencií namiesto sľubných nových škálovateľných architektúr existujú náznaky investorov stávajú sa ostražití dlhšej, ako sa očakávalo, cesty k ROI pre generatívnu AI. Antropický je trochu naočkovaný z tohto tlaku, ktorý je v závideniahodnej pozícii Amazonky (a v menšej miere Google) poistenie proti OpenAI. Očakáva sa však, že tržby spoločnosti dosiahnu tesne pod 1 miliardu dolárov do konca roka 2024 je a zlomok OpenAI – a som si istý, že podporovatelia Anthropic nenechajú na túto skutočnosť zabudnúť.
Napriek rastúcej zákazníckej základni, ktorá zahŕňa domáce značky, ako sú Bridgewater, Brave, Slack a DuckDuckGo, Anthropic stále nemá určitý podnikový úspech. Je zrejmé, že to bola OpenAI – nie Antropická – s ktorou Spoločnosť PwC nedávno uzavrela partnerstvo na ďalší predaj generatívnych ponúk AI podniku.
Takže Anthropic používa strategický a dobre zabehnutý prístup k presadzovaniu, investuje čas na vývoj do produktov, ako je Claude 3.5 Sonnet, aby poskytoval o niečo lepší výkon za ceny komodít. 3.5 Sonnet má rovnakú cenu ako 3 Sonnet: 3 USD za milión tokenov vložených do modelu a 15 USD za milión tokenov generovaných modelom.
Gerstenhaber o tom hovoril v našom rozhovore. „Keď vytvárate aplikáciu, koncový používateľ by nemal vedieť, ktorý model sa používa alebo ako inžinier optimalizoval pre svoje skúsenosti,“ povedal, „ale technik by mohol mať k dispozícii nástroje na optimalizáciu pre túto skúsenosť. pozdĺž vektorov, ktoré je potrebné optimalizovať, a náklady sú určite jedným z nich.“
Sonet Claude 3.5 nerieši problém halucinácií. Takmer určite robí chyby. Ale môže to byť dosť atraktívne na to, aby prinútilo vývojárov a podniky prejsť na platformu Anthropic. A na konci dňa je to to, na čom záleží pre Anthropic.
K tomu istému cieľu spoločnosť Anthropic zdvojnásobila nástroje, ako sú jej experimentálne riadenie AIktorý umožňuje vývojárom „riadiť“ interné funkcie jeho modelov; integrácií, aby jeho modely mohli vykonávať akcie v rámci aplikácií; a vytvorené nástroje na vrchu svojich modelov, ako je už spomínaná skúsenosť Artifacts. Je tiež najatý spoluzakladateľ Instagramu ako vedúci produktu. A jeho rozšírila dostupnosť svojich produktov, najnovšie priviedla Claude do Európy a založila pobočky v Londýne a Dubline.
Zdá sa, že spoločnosť Antropic dospela k myšlienke, že vybudovanie ekosystému okolo modelov – nielen modelov v izolácii – je kľúčom k udržaniu zákazníkov, keďže sa medzera v schopnostiach medzi modelmi zužuje.
Gerstenhaber však trval na tom, že väčšie a lepšie modely – ako Claude 3.5 Opus – sú na obzore, s funkciami, ako je vyhľadávanie na webe a schopnosť zapamätať si preferencie.
„Nevidel som hlboké učenie ešte narazilo na stenu, a nechám to na výskumníkov, aby o stene špekulovali, ale myslím si, že je trochu priskoro robiť o tom závery, najmä ak sa pozriete na tempo inovácií,“ povedal. „Existuje veľmi rýchly vývoj a veľmi rýchle inovácie a nemám dôvod veriť, že sa to spomalí.“
Uvidíme.