Máte spoločnosť Sezame vydal základný model, ktorý poháňa Maya, pôsobivo realistický hlasový asistent.
Model, ktorý má veľkosť 1 miliardy parametrov („parametre“ odkazujúce na jednotlivé komponenty modelu), je pod licenciou Apache 2.0, čo znamená, že sa dá komerčne používať s niekoľkými obmedzeniami. Model, ktorý sa nazýva CSM-1B Popis Sesame na platforme AI Dev, ktorá objíma tvár.
RVQ sa vzťahuje na „zvyškovú kvantizáciu vektorov“, techniku kódovania zvuku do diskrétnych tokenov nazývaných kódy. Používa sa RVQ V mnohých nedávnych AI zvukových technológiáchvrátane spoločnosti Soundstream spoločnosti Google a Meta’s Encodec.
CSM-1B používa model z Rodina lamy meta ako jeho chrbtica spárovala s komponentom zvuku „dekodér“. Sesame hovorí doladený variant CSM Powers Maya, hovorí.
„Model otvorene položený tu je model základnej generácie,“ píše Sesame v CSM-1B’s Objatie a Girub úložiská. „Je schopný produkovať rôzne hlasy, ale nebol doladený žiadnym konkrétnym hlasom (…), model má určitú kapacitu pre neanglicky jazyky v dôsledku kontaminácie údajov v údajoch o výcviku, ale pravdepodobne sa mu to nedarí.“
Nie je jasné, čo dáta sezame používa na školenie CSM-1B. Spoločnosť nepovedala.
Je potrebné poznamenať, že model nemá skutočné záruky, o ktorých by sa dalo hovoriť. Sesame má čestný systém a iba nalieha na vývojárov a používateľov, aby tento model nepoužívali na napodobňovanie hlasu človeka bez ich súhlasu, vytvorenie zavádzajúceho obsahu, ako sú falošné správy, alebo sa zapojili do „škodlivých“ alebo „škodlivých“ aktivít.
Skúsil som demo Na objímanie tváre a klonovanie môjho hlasu trvalo menej ako minútu. Odtiaľ bolo ľahké vyvolať reč s túžbou môjho srdca, a to aj na kontroverzné témy, ako sú voľby a ruská propaganda.
Spotrebiteľské správy nedávno varovali, že mnoho populárnych nástrojov na klonovanie hlasu poháňaných AI na trhu Nemáte „zmysluplné“ záruky predchádzať podvodom alebo zneužívaniu.
Sesame, spoluzakladaný spolutvorcom Oculus Brendan Iribe, sa koncom februára stal vírusom pre pomocnú techniku, ktorá sa blíži k zúčtovaniu územia Uncanny Valley. Maya a Sesame, ďalší asistent, míle, nadýchne a hovorte s neschopnosťou a môžu byť prerušené pri hovorení, Rovnako ako hlasový hlasový režim.
Spoločnosť Sesame zvýšila nezverejnené množstvo kapitálu od Andreessen Horowitz, Spark Capital a Matrix Partners. Okrem budovania hlasového asistenta techniky spoločnosť tvrdí, že prototypuje okuliare AI „navrhnuté na nosenie celý deň“, ktoré budú vybavené svojimi vlastnými modelmi.