Google našiel nový spôsob, ako ukázať, čo dokáže jeho model Gemini AI, s pomocou robota.
Bol to robot z divízie Everybody Robots spoločnosti Google vypnúť minulý rok. Ale očividne sú roboti stále nablízku, takže Google na jedného z nich nasadil žltého motýlika a potom pomocou Gemini naučil robota, ako reagovať na príkazy a pohybovať sa v kancelárskom priestore DeepMind.
Na dosiahnutie tohto cieľa používa spoločnosť Google modely jazyka videnia VLM, ktoré sú trénované na obrázkoch a videách spolu s textom, čo im umožňuje odpovedať na otázky a vykonávať úlohy, ktoré si vyžadujú vnímanie.
Napríklad v jednom videu zamestnanec Googlu požiada robota, aby ho zobral niekam kresliť veci. Robot povie, že potrebuje minútu na premýšľanie, potom odvedie zamestnanca k bielej tabuli. V inom videu je robotovi povedané, aby nasledoval pokyny na tabuli, kde mapa ukazuje smer, ako sa dostať do oblasti nazývanej Modrá oblasť. Robot nasleduje pokyny do oblasti testovania robotiky a potom oznámi: „Úspešne som postupoval podľa pokynov na tabuli.“
Kliknutím na tlačidlo Prehrať uvidíte robota v akcii a potom nám dajte vedieť, čo si myslíte v komentároch!