Home Umela inteligencia Čínsky generátor textu na video Kling vydal konkurenčnú spoločnosť Sora

Čínsky generátor textu na video Kling vydal konkurenčnú spoločnosť Sora

by
Čínsky generátor textu na video Kling vydal konkurenčnú spoločnosť Sora

Čínska technologická spoločnosť Kuaishou Technology vydala generátor textu na video (T2V) s názvom Kling, ktorý by mohol konkurovať Sora od OpenAI.

Vo februári nás OpenAI ohromila Sora demo videá to nás všetkých prinútilo zúfalo hľadať tlačidlo „zaregistrovať sa“. O štyri mesiace neskôr a stále čakáme na prepustenie Sory bez toho, aby sme povedali, kedy by sa to mohlo stať.

Kuaishou so sídlom v Pekingu vyvíja platformy na zdieľanie obsahu, o ktorých hovorí, že „výroba, distribúcia a konzumácia obsahu je rýchla a jednoduchá“. Platforma spoločnosti pre krátke videá, tiež nazývaná Kuaishou, je na druhom mieste za TikTok z hľadiska priemerného denného počtu aktívnych používateľov.

Vytváranie obsahu pre jeho platformy by bolo oveľa jednoduchšie, keby sa nemuselo spoliehať na obsah vytvorený ľuďmi. To môže byť určitá motivácia za vývojom jeho nástroja T2V.

Kling premení textové výzvy na časovo a priestorovo súvislé videá, ktoré vyzerajú skvele. Kuaishou hovorí Kling dokáže generovať videá s dĺžkou až 2 minúty v rozlíšení 1080p a 30 snímkach za sekundu.

To je o minútu dlhšie, ako podľa OpenAI dokáže vyprodukovať Sora. Ďalším veľkým rozdielom je, že Kling bol prepustený na verejnosť, zatiaľ čo Sora je stále pod pokrievkou. Ak ste v Číne alebo máte čínske mobilné číslo a sieť VPN, môžete požiadať o vyskúšanie aplikácie.

Rovnako ako Sora, aj Kling používa architektúru difúzneho transformátora. Má tiež výkonnú technológiu 3D rekonštrukcie tváre a tela, ktorá dokáže použiť obraz celého tela ako výzvu na vytvorenie videa s plynulými pohybmi končatín.

Ak si pamätáte trochu desivé video Willa Smitha, ktorý jedol špagety z prvých dní videa generovaného AI, potom oceníte, aké úžasné je toto video vytvorené Klingom.

Väčšina pôsobivých ukážkových videí, kde je veľa pohybu, sú krátke klipy. Dlhšie videá sú scénickejšie s menej dynamickými prvkami, čo môže naznačovať niektoré obmedzenia tohto nástroja.

Tento klip meniacej sa scény zobrazený z pohľadu okna vlaku je dosť pôsobivý.

Vizuálne prvky, s ktorými AI historicky zápasila, sú veci ako prsty, zuby alebo prirodzené pohyby úst. Tu je pôsobivý klip, ktorý ukazuje, že Kling to má veľmi prirodzene vyzerajúce.

Beta verzia hry Kling je v niektorých ohľadoch komentárom k východu a západu prístupu k AI. Zatiaľ čo Západ diskutuje o bezpečnosti AI, súkromí a nebezpečenstvách dezinformácií, Čína prudko napreduje vo vývoji. A to aj napriek americkým sankciám, ktoré sa to snažia spomaliť.

Zatiaľ čo sa OpenAI snaží prísť na to, ako urobiť Soru „bezpečnou“ alebo politicky korektnou, možno sa budeme musieť pozrieť do Číny, aby nám poskytla slušný nástroj T2V, ak neexistuje nástroj vyrobený v USA.



Source Link

Related Posts

Leave a Comment