Home Umela inteligencia Zuckerberg hovorí, že Meta bude potrebovať 10x viac výpočtového výkonu na trénovanie Llama 4 ako Llama 3

Zuckerberg hovorí, že Meta bude potrebovať 10x viac výpočtového výkonu na trénovanie Llama 4 ako Llama 3

by
Meta vydáva svoj doteraz najväčší „otvorený“ model AI

Spoločnosť Meta, ktorá vyvíja jeden z najväčších základných open-source veľkých jazykových modelov, Llama, verí, že v budúcnosti bude potrebovať výrazne viac výpočtového výkonu na trénovanie modelov.

Mark Zuckerberg na utorkovej výzve spoločnosti Meta o zisku za druhý štvrťrok povedal, že na trénovanie Llama 4 bude spoločnosť potrebovať 10x viac výpočtov, ako bolo potrebné na trénovanie Llama 3. Stále však chce, aby Meta vybudovala kapacitu na trénovanie modelov a nezaostávala za svojimi konkurentmi. .

„Množstvo výpočtovej techniky potrebnej na trénovanie Llama 4 bude pravdepodobne takmer 10-krát väčšie ako to, čo sme použili na trénovanie Llama 3, a budúce modely budú ďalej rásť,“ povedal Zuckerberg.

„Je ťažké predpovedať, ako to bude smerovať do budúcnosti o niekoľko generácií. Ale v tomto bode by som radšej riskoval budovanie kapacity skôr, ako bude potrebné, ako príliš neskoro, vzhľadom na dlhé dodacie lehoty na vytváranie nových inferenčných projektov.“

Meta uvoľnená Llama 3 s 80 miliardami parametrov v apríli. Spoločnosť minulý týždeň vydala inovovanú verziu modelu, tzv Llama 3.1 405B, ktorá mala 405 miliárd parametrovčo z neho robí najväčší model s otvoreným zdrojom od spoločnosti Meta.

Finančná riaditeľka spoločnosti Meta, Susan Li, tiež uviedla, že spoločnosť uvažuje o rôznych projektoch dátových centier a budovaní kapacity na trénovanie budúcich modelov AI. Povedala, že Meta očakáva, že táto investícia zvýši kapitálové výdavky v roku 2025.

Školenie veľkých jazykových modelov môže byť nákladná záležitosť. Kapitálové výdavky spoločnosti Meta vzrástli v 2. štvrťroku 2024 takmer o 33 % na 8,5 miliardy USD zo 6,4 miliardy USD o rok skôr, a to vďaka investíciám do serverov, dátových centier a sieťovej infraštruktúry.

Podľa správy z InformácieOpenAI minie 3 miliardy dolárov na školiace modely a ďalšie 4 miliardy dolárov na prenájom serverov so zľavou od spoločnosti Microsoft.

„Pri rozširovaní kapacity generatívnej umelej inteligencie na zlepšenie našich základných modelov budeme pokračovať v budovaní našej infraštruktúry spôsobom, ktorý nám v priebehu času poskytne flexibilitu v tom, ako ju budeme používať. To nám umožní nasmerovať školiacu kapacitu na odvodenie umelej inteligencie alebo na našu základnú prácu v oblasti hodnotenia a odporúčaní, keď očakávame, že by to bolo hodnotnejšie,“ povedal Li počas hovoru.

Meta počas hovoru hovorila aj o svojom spotrebiteľskom zameraní Používa Meta AI a povedal, že India je najväčším trhom jej chatbotov. Li však poznamenal, že spoločnosť neočakáva, že produkty Gen AI prispejú k výnosom významným spôsobom.

Source Link

Related Posts

Leave a Comment