Home Umela inteligencia Mistral’s Large 2 je odpoveďou na najnovšie modely Meta a OpenAI

Mistral’s Large 2 je odpoveďou na najnovšie modely Meta a OpenAI

by
Mistral logo on laptop screen

Pri hraničných modeloch AI, keď prší, leje. Mistral vydal v stredu nový vlajkový model, Large 2, o ktorom tvrdí, že je na rovnakej úrovni ako najnovšie špičkové modely od OpenAI a Meta z hľadiska generovania kódu, matematiky a uvažovania.

The vydanie Mistral Large 2 padá len jeden deň po tom, čo Meta upustila od svojho najnovšieho a najlepšieho modelu s otvoreným zdrojom, Volajte 3.1 405b. Mistral hovorí, že Large 2 zvyšuje latku výkonu a nákladov pri otvorených modeloch a podporuje to niekoľkými benchmarkmi.

Zdá sa, že Large 2 predbehne Llamu 3.1 405B v generovaní kódu a matematickom výkone a robí to s menej ako tretinou parametrov: 123 miliárd, aby som bol presný.

V tlačovej správe Mistral hovorí, že jednou z kľúčových oblastí, na ktoré sa počas tréningu zameral, bolo minimalizovať problémy s halucináciami modelu. Spoločnosť tvrdí, že Large 2 bola vyškolená tak, aby bola vo svojich odpovediach náročnejšia a uznala, keď niečo nevie, namiesto toho, aby si vymyslela niečo, čo sa zdá byť pravdepodobné.

Nedávno založený startup AI v Paríži získal 640 miliónov dolárov v kole financovania série B, ktoré vedie General Catalyst, v ocenení 6 miliárd dolárov. Hoci Mistral je jedným z novších účastníkov v priestore umelej inteligencie, rýchlo dodáva modely AI na špičke alebo blízko nej.

Je však dôležité poznamenať, že modely Mistral sú, ako väčšina ostatných, nie open source v tradičnom zmysle – na akúkoľvek komerčnú aplikáciu modelu je potrebná platená licencia. A hoci je otvorenejší ako napríklad GPT-4o, len málokto na svete má odborné znalosti a infraštruktúru na implementáciu takého veľkého modelu. (To platí dvojnásobne pre 405 miliárd parametrov Llama, samozrejme.)

Niečo, čo chýbalo v Mistral Large 2 a tiež chýbalo vo včerajšom vydaní Meta Llama 3.1, sú multimodálne schopnosti. OpenAI je ďaleko pred konkurenciou, pokiaľ ide o multimodálne systémy AI, ktoré sú schopné súčasne spracovať obraz a text, čo je funkcia, ktorú niektoré začínajúce podniky čoraz viac využívajú. hľadá stavať s.

Model má okno so 128 000 tokenmi, čo znamená, že Large 2 dokáže prijať veľa údajov v jednej výzve (128 000 tokenov sa rovná približne 300 stranovej knihe). Nový model Mistralu obsahuje aj vylepšenú viacjazyčnú podporu. Large 2 rozumie angličtine, francúzštine, nemčine, španielčine, taliančine, portugalčine, arabčine, hindčine, ruštine, čínštine, japončine a kórejčine spolu s 80 kódovacími jazykmi. Mistral tvrdí, že Large 2 tiež poskytuje výstižnejšie odpovede ako popredné modely AI, ktoré majú tendenciu bľabotať.

Mistral Large 2 je k dispozícii na použitie v službách Google Vertex AI, Amazon Bedrock, Azure AI Studio a IBM watsonx.ai. Môžete tiež použiť nový model na Mistral’s le Plateforme pod názvom „mistral-large-2407“ a vyskúšať ho zadarmo na konkurentovi startupu ChatGPT, le Chat.

Source Link

Related Posts

Leave a Comment