Platformy na označovanie a anotáciu nemusia pritiahnuť pozornosť tak, ako to robia honosné nové generatívne modely AI. Ale sú nevyhnutné. Údaje, na ktorých sa trénuje veľa modelov, musia byť označené, inak by modely neboli schopné tieto údaje počas tréningového procesu interpretovať.
Anotácia je rozsiahly podnik, ktorý si vyžaduje tisíce až milióny anotácií pre väčšie a sofistikovanejšie používané súbory údajov. S cieľom uľahčiť bremeno založili Eric Landau a Ulrik Hansen Encordktorú označujú ako platformu „vývoja dát“ pre spoločnosti spravujúce a pripravujúce svoje dáta pre modely AI.
Teraz má spoločnosť vo svojej pokladnici ďalších 30 miliónov dolárov vďaka kolu série B, ktoré vedie Next47. Keď sa vojnová truhla Encordu dostane na 50 miliónov dolárov, nový kapitál sa v priebehu nasledujúcich šiestich mesiacov použije na zdvojnásobenie veľkosti produktov, inžinierskych a AI výskumných tímov Encordu a rozšírenie kancelárií spoločnosti v San Franciscu, povedal Landau pre TechCrunch.
„Do konca roka očakávame, že náš tím sa rozrastie na 100 zamestnancov zo súčasných 70,“ dodal. „Teraz máme dvojité ústredie v Londýne a San Franciscu s členmi tímu po celom svete.“
Landau prvýkrát začal pracovať s veľkými dátovými systémami na výskume časticovej fyziky ako vysokoškolský študent na Stanforde. Hansen pracoval na globálnych trhoch v JP Morgan, kde sa zaoberal derivátmi rozvíjajúcich sa trhov.
Hansen hovorí, že zárodok nápadu pre Encord prišiel, keď pracoval na dátovo náročných projektoch AI počas magisterského programu počítačovej vedy na Imperial College London. Hansen, frustrovaný časovou náročnosťou spracovania a označovania údajov, sa stretol s Landauom, ktorého poznal z podnikateľskej scény v Londýne, o spôsoboch, ako by mohli spoločne vyriešiť problém s údajmi.
„Kombináciou Hansenových odborných znalostí v oblasti vývoja softvéru s mojimi poznatkami z kvantitatívneho výskumu po automatizáciu vývoja dát sme spustili prvú iteráciu produktu Encord počas Y Combinator na jar 2021,“ povedal Landau pre TechCrunch. „Platforma Encord vybavuje podniky nástrojmi na prípravu údajov pre AI a na posúdenie toho, ako efektívne tieto údaje podporujú ich modely.“
S veľkosťou trhu anotácií a označovania údajov odhadnutý aby do roku 2027 vzrástol na 3,6 miliardy dolárov, Encord je jedným z mnohých predajcov, ktorí súťažia o zmluvy. Okrem slona v miestnosti – AI váhy — existujú startupy ako Datasaurktorá umožňuje zákazníkom vytvárať modely automaticky zo sád štítkov; Heartexktorá buduje platformu na „vývoj“ údajov s otvoreným zdrojom; a poskytovateľ nástrojov na anotáciu údajov Dataloop.
Encord sa odlišuje, hovorí Landau, všestrannosťou svojej platformy.
Pomocou Encordu môžu tímy skúmať a vizualizovať množiny údajov – vrátane množín obrázkov, videí a hlasových údajov – stiahnuté zo súkromného a verejného cloudového úložiska a porovnávať výkon rôznych modelov trénovaných na rovnakých súboroch. Platforma sa pokúša odhaliť problémy s presnosťou modelu a navrhnúť ďalšie tréningové údaje, ktoré by mohli pomôcť tieto problémy napraviť.
„Na rozdiel od čiastkových riešení, ktoré riešia iba špecifické časti vášho dátového zásobníka, vám Encord umožňuje konsolidovať všetky vaše dátové toky na jednej platforme,“ povedal Landau. „Prostredníctvom tejto konsolidácie spoločnosti získavajú sledovateľnosť, ktorá vrhá svetlo na často neprehľadnú „čiernu skrinku“ AI a pomáha pochopiť, prečo model robí konkrétne rozhodnutia.“

Zdá sa, že stratégia Encordu zatiaľ funguje dobre. Spoločnosť má 120 zákazníkov, vrátane Philipsu, rušného startupu AI Synthesia a poskytovateľov zdravotnej starostlivosti Cedars-Sinai a Northwell Health, ako aj zmluvy s nemenovanými vojenskými a vládnymi agentúrami. Landau tvrdí, že Encord za posledný rok zvýšil príjmy 4x a že do roku 2025 by mohol byť pozitívny cash-flow, ak by nepokračoval v raste počtu zamestnancov.
„Cítime opak spomalenia,“ povedal Landau. „Uvedomujeme si však širšie podmienky na trhu a zaujali sme konzervatívny prístup k nasadzovaniu kapitálu.“
Ďalšími účastníkmi nového kola financovania boli Y Combinator, CRV a Crane Venture Partners.
Oprava: Tento príbeh predtým nesprávne uviedol sériu zvýšeného kola. Bolo to kolo série B.