Keďže generatívna AI sa dotýka rastúceho počtu odvetví, spoločnosti vyrábajúce čipy na spustenie modelov z toho majú obrovský prospech. Najmä Nvidia, ktorá velí an odhadnutý 70 % až 95 % trhu s čipmi AI má obrovský vplyv. Cloud poskytovatelia z Meta do Microsoft míňajú miliardy dolárov na GPU Nvidia, obávajú sa, že zaostávajú v generatívnej AI.
Predajcovia generatívnej AI nie sú spokojní so súčasným stavom z pochopiteľných dôvodov. Veľká časť ich úspechu závisí od rozmarov dominantných výrobcov čipov. A tak spolu s oportunistickými VC hľadajú sľubných nováčikov, ktorí by mohli vyzvať držiteľov čipov AI.
Leptané patrí medzi mnoho, mnoho alternatívnych čipových spoločností, ktoré súperia o miesto pri stole – ale patrí aj medzi najzaujímavejšie. Iba dva roky starý Etched bol založený dvojicou ľudí, ktorí odpadli z Harvardu, Gavinom Ubertim (ex-OctoML a ex-Xnor.ai) a Chris Zhu, ktorí sa spolu s Robertom Wachenom a bývalým CTO Cypress Semiconductor Markom Rossom snažili vytvoriť čip, ktorý by dokázal jednu vec: spúšťať modely AI.
To nie je nič neobvyklé. Veľa startupov a technologických gigantov vyvíjalo – alebo vyvíja – čipy, ktoré výhradne spúšťajú modely AI, známe aj ako inferencovacie čipy. Meta má MIAAmazon má Gravitácia a Záver a tak ďalej. Ale Etchedove žetóny sú jedinečné v tom, že prevádzkujú iba jeden typ modelu: transformátory.
Transformátor navrhnutý tímom výskumníkov Google v roku 2017 sa stal dominantnou generatívnou modelovou architektúrou AI.
Transformátory podporujú model generovania videa OpenAI Sora. Sú základom modelov generujúcich text, ako je model Anthropic Claude a Google Blíženci. A poháňajú generátory umenia, ako napr najnovšia verzia Stable Diffusion.
„V roku 2022 sme sa stavili, že transformátory ovládnu svet,“ povedal Uberti, generálny riaditeľ spoločnosti Etched, v rozhovore pre TechCrunch. „Vo vývoji AI sme narazili na bod, v ktorom sú špecializované čipy, ktoré môžu fungovať lepšie ako univerzálne GPU, nevyhnutné – a svetoví technickí rozhodovatelia to vedia.“
Etchedov čip, nazývaný Sohu, je ASIC (integrovaný obvod špecifický pre aplikáciu) – čip prispôsobený konkrétnej aplikácii, v tomto prípade prevádzkujúcim transformátory. Vyrobené s použitím 4nm proces TSMCSohu môže poskytnúť dramaticky lepší výkon odvodenia ako GPU a iné univerzálne čipy AI, pričom spotrebuje menej energie, tvrdí Uberti.
„Sohu je rádovo rýchlejší a lacnejší ako dokonca aj ďalšia generácia GPU Blackwell GB200 od Nvidie, keď používa transformátory textu, obrázkov a videa,“ povedal Uberti. „Jeden server Sohu nahradí 160 GPU H100… Sohu bude cenovo dostupnejšou, efektívnejšou a ekologickejšou voľbou pre obchodných lídrov, ktorí potrebujú špecializované čipy.“
Ako to všetko Sohu dosiahne? Niekoľkými spôsobmi, ale najzreteľnejším – a intuitívnym – je zjednodušené odvodzovanie hardvéru a softvéru. Pretože Sohu nepoužíva netransformátorové modely, tím Etched bol schopný zbaviť sa hardvérových komponentov, ktoré nie sú relevantné pre transformátory, a zároveň znížiť réžiu softvéru, ktorá sa tradične používa na nasadenie a spustenie netransformátorov.
Etched prichádza na scénu v inflexnom bode v pretekoch o generatívnu infraštruktúru AI. Okrem nákladových nákladov sú dnes GPU a ďalšie hardvérové komponenty potrebné na prevádzku modelov vo veľkom meradle nebezpečne náročné na energiu.
Goldman Sachs predpovedá že AI je pripravená do roku 2030 zvýšiť dopyt po elektrickej energii v dátových centrách o 160 %, čo prispeje k výraznému zvýšeniu emisií skleníkových plynov. Výskumníci z UC Riverside medzitým odhadnúť že globálne používanie AI by mohlo spôsobiť, že dátové centrá budú do roku 2027 vysať 1,1 bilióna až 1,7 bilióna galónov sladkej vody, ovplyvňujúce miestne zdroje. (Mnoho dátových centier používa vodu na chladenie serverov.)
Uberti optimisticky – alebo bombasticky, v závislosti od toho, ako to interpretujete – predstavuje Sohu ako riešenie problému spotreby v tomto odvetví.
„Naši budúci zákazníci si skrátka nebudú môcť dovoliť neprepnúť na Sohu,“ povedal Uberti. „Spoločnosti sú ochotné staviť na Etched, pretože rýchlosť a náklady sú pre produkty AI, ktoré sa snažia vytvoriť, nevyhnutné.“
Môže však Etched – za predpokladu, že spoločnosť splní svoj cieľ priniesť Sohu na masový trh v najbližších mesiacoch – uspieť, keď ju bude nasledovať toľko ďalších?
Zatiaľ čo Etched v súčasnosti nemá priameho konkurenta, AI čipový startup Perceive nedávno náhľad procesora s hardvérovou akceleráciou pre transformátory. Grok tiež veľa investovala do optimalizácie špecifických pre transformátor pre svoje ASIC.
Odhliadnuc od konkurencie, čo ak jedného dňa transformátory upadnú do nemilosti? Uberti hovorí, že v takom prípade Etched urobí to, čo je zrejmé: navrhne nový čip. Dosť spravodlivé. Ale to je dosť drastický výpadok, ak vezmeme do úvahy, ako dlho trvá, kým sa Sohu uskutoční.
Žiadna z týchto obáv neodradila investorov od nalievania obrovského množstva peňazí do Etched.
Spoločnosť Etched dnes oznámila, že uzavrela kolo financovania série A vo výške 120 miliónov dolárov, ktoré spoločne viedli Primary Venture Partners a Positive Sum Ventures. Celková suma Etched sa zvýšila na 125,36 milióna dolárov a do kola sa zapojili anjelskí priaznivci v ťažkej váhe vrátane Petra Thiela (Uberti, Zhu a Wachen sú absolventi Thiel Fellowship), generálneho riaditeľa GitHubu Thomasa Dohmkeho, Cruise (a Bot Company) spoluzakladateľ Kyle Vogt a spoluzakladateľ Quora Charlie Cheever.
Títo investori sa pravdepodobne domnievajú, že Etched má primeranú šancu úspešne rozšíriť svoje podnikanie v oblasti predaja serverov. A možno áno – Uberti tvrdí, že nemenovaní zákazníci si doteraz vyhradili „desiatky miliónov dolárov“ v hardvéri. Blížiace sa spustenie Sohu Developer Cloud, ktoré zákazníkom umožní prezerať si Sohu prostredníctvom online interaktívneho ihriska, by malo podporiť ďalší predaj, navrhol Uberti.
Zdá sa však, že je ešte priskoro povedať, či to bude stačiť na to, aby to Etched a jeho 35-členný tím posunulo do budúcnosti, ktorú si spoluzakladatelia spoločnosti predstavujú. Segment čipov AI môže byť v tých najlepších časoch neúprosný – pozrite si významné zlyhania začínajúcich s čipmi AI, ako sú napr. mýtický a Graphcorea s tým súvisiace prepad finančných prostriedkov pre podniky s čipmi AI v roku 2023.
Uberti však robí silnú pozíciu v predaji: „Generovanie videa, audio a audio modality, robotika a ďalšie budúce prípady použitia AI budú možné len s rýchlejším čipom, akým je Sohu. Celá budúcnosť technológie AI bude formovaná tým, či sa infraštruktúra dá škálovať.“