Home Umela inteligencia Umelá inteligencia Reliant na čistenie papiera preberá úmorné údaje vedy

Umelá inteligencia Reliant na čistenie papiera preberá úmorné údaje vedy

by
Reliant’s paper-scouring AI takes on science’s data drudgery

Modely AI sa ukázali ako schopné mnohých vecí, ale aké úlohy od nich vlastne chceme? Prednostne drina – a tej je veľa vo výskume a na akademickej pôde. Spoľahlivý dúfa, že sa bude špecializovať na časovo náročnú extrakciu dát, ktorá je v súčasnosti špecialitou unavených absolventov a stážistov.

„Najlepšia vec, ktorú môžete s AI urobiť, je zlepšiť ľudské skúsenosti: obmedziť podradnú prácu a nechať ľudí robiť veci, ktoré sú pre nich dôležité,“ povedal generálny riaditeľ Karl Moritz. Vo výskumnom svete, kde on a spoluzakladatelia Marc Bellemare a Richard Schlegel roky pracovali, je prehľad literatúry jedným z najbežnejších príkladov tejto „podradnej práce“.

Každý článok cituje predchádzajúce a súvisiace práce, ale nájsť tieto zdroje v mori vedy nie je ľahké. A niektoré, napríklad systematické prehľady, citujú alebo používajú údaje z tisícok.

Na jedno štúdiumMoritz pripomenul: „Autori sa museli pozrieť na 3 500 vedeckých publikácií a mnohé z nich nakoniec neboli relevantné. Je to veľa času stráveného extrakciou malého množstva užitočných informácií – zdalo sa mi to ako niečo, čo by mala AI skutočne automatizovať.“

Vedeli, že moderné jazykové modely to dokážu: jeden experiment dal ChatGPT na úlohu a zistil, že dokáže extrahovať dáta s chybovosťou 11 %. Rovnako ako mnoho vecí, ktoré LLM dokážu, je to pôsobivé, ale nič také, čo ľudia skutočne potrebujú.

Poďakovanie za obrázok: Spoľahlivá AI

„To jednoducho nestačí,“ povedal Moritz. „Pre tieto vedomostné úlohy, akokoľvek môžu byť podradné, je veľmi dôležité, aby ste nerobili chyby.“

Základný produkt spoločnosti Reliant, Tabular, je čiastočne založený na LLM (LLaMa 3.1), ale rozšírený o ďalšie proprietárne techniky je podstatne efektívnejší. Na extrakcii z niekoľkých tisícov štúdií vyššie povedali, že to urobilo rovnakú úlohu s nulovými chybami.

To znamená: vysypete doň tisíc dokumentov, poviete, že chcete toto, tamto a ďalšie údaje z nich, a Reliant sa nimi prehrabne a nájde tieto informácie – či už sú dokonale označené a štruktúrované, alebo (oveľa pravdepodobnejšie) nie je. Potom zobrazí všetky tieto údaje a všetky analýzy, ktoré ste chceli urobiť, do pekného používateľského rozhrania, aby ste sa mohli ponoriť do jednotlivých prípadov.

„Naši používatelia musia byť schopní pracovať so všetkými údajmi naraz a my vytvárame funkcie, ktoré im umožnia upravovať údaje, ktoré tam sú, alebo prejsť z údajov do literatúry; Našu úlohu vidíme v tom, že pomáhame používateľom nájsť miesto, kde majú venovať svoju pozornosť,“ povedal Moritz.

Táto na mieru šitá a efektívna aplikácia AI – nie je taká okatá ako a digitálny priateľ ale takmer určite oveľa životaschopnejšia – mohla by urýchliť vedu v mnohých vysoko technických oblastiach. Investori vzali na vedomie, že financujú počiatočné kolo vo výške 11,3 milióna dolárov; Tola Capital a Inovia Capital viedli kolo, zúčastnil sa aj anjel Mike Volpi.

Ako každá aplikácia AI, aj technológia Reliant je veľmi náročná na výpočtovú techniku, a preto si spoločnosť radšej kúpila vlastný hardvér, než aby si ho prenajala a la carte od jedného z veľkých poskytovateľov. Vlastný hardvér ponúka riziko aj odmenu: musíte prinútiť tieto drahé stroje, aby sa samy zaplatili, ale máte šancu vyriešiť problémový priestor pomocou špeciálneho výpočtového systému.

„Jedna vec, ktorú sme zistili, je, že je veľmi náročné dať dobrú odpoveď, ak máte na túto odpoveď obmedzený čas,“ vysvetlil Moritz – napríklad, ak vedec požiada systém, aby vykonal novú extrakciu alebo analýzu sto papierov. Dá sa to urobiť rýchlo alebo dobre, ale nie oboje – pokiaľ nepredpovedajú, čo používatelia možno opýtajte sa a zistite odpoveď alebo niečo podobné vopred.

„Ide o to, že veľa ľudí má rovnaké otázky, takže ako východiskový bod môžeme nájsť odpovede skôr, ako sa spýtajú,“ povedal Bellemare, vedúci vedecký pracovník startupu. „Môžeme destilovať 100 strán textu do niečoho iného, ​​čo nemusí byť presne to, čo chcete, ale je pre nás jednoduchšie pracovať.“

Premýšľajte o tom takto: ak by ste chceli vytiahnuť význam z tisícky románov, počkali by ste, kým sa niekto spýta na mená postáv, aby si ich prešiel a chytil ich? Alebo by ste túto prácu urobili v predstihu (spolu s vecami, ako sú miesta, dátumy, vzťahy atď.) s vedomím, že budú pravdepodobne potrebné údaje? Určite to druhé – ak by ste mali výpočtovú rezervu.

Táto predextrakcia tiež dáva modelom čas na vyriešenie nevyhnutných nejednoznačností a predpokladov, ktoré sa nachádzajú v rôznych vedeckých oblastiach. Keď jedna metrika „indikuje“ inú, nemusí to znamenať to isté vo farmaceutikách ako v patológii alebo klinických štúdiách. Nielen to, ale jazykové modely majú tendenciu poskytovať rôzne výstupy v závislosti od toho, ako sa im kladú určité otázky. Úlohou spoločnosti Reliant teda bolo premeniť nejednoznačnosť na istotu – „a to je niečo, čo môžete urobiť, iba ak ste ochotní investovať do konkrétnej vedy alebo oblasti,“ poznamenal Moritz.

Ako spoločnosť sa spoločnosť Reliant v prvom rade zameriava na to, aby zistila, že táto technológia sa môže zaplatiť sama za seba predtým, ako sa pokúsi o niečo ambicióznejšie. „Aby ste dosiahli zaujímavý pokrok, musíte mať veľkú víziu, ale musíte začať aj s niečím konkrétnym,“ povedal Moritz. „Z pohľadu prežitia startupov sa zameriavame na ziskové spoločnosti, pretože nám dávajú peniaze na zaplatenie našich GPU. Nepredávame to zákazníkom so stratou.“

Dalo by sa očakávať, že firma pocíti teplo od spoločností ako OpenAI a Anthropic, ktoré nalievajú peniaze do spracovania štruktúrovanejších úloh, ako je správa databáz a kódovanie, alebo od implementačných partnerov, ako sú Cohere a Scale. Bellemare bol však optimistický: „Stavíme to na základoch – každé zlepšenie v našom technickom balíku je pre nás skvelé. LLM je jedným z možno ôsmich veľkých modelov strojového učenia – ostatné sú pre nás plne majetkom, vytvorené od nuly na základe vlastníctva údajov pre nás.“

Transformácia biotechnologického a výskumného priemyslu na priemysel poháňaný umelou inteligenciou je určite len na začiatku a v nasledujúcich rokoch môže byť pomerne mozaikou. Zdá sa však, že Reliant našiel silnú základňu, z ktorej môže začať.

„Ak chcete 95-percentné riešenie a len raz za čas sa veľmi ospravedlníte jednému zo svojich zákazníkov, skvelé,“ povedal Moritz. „Sme pre tam, kde na presnosti a zapamätaní skutočne záleží a kde na chybách naozaj záleží. A úprimne, je toho dosť, zvyšok radi prenecháme iným.“

Source Link

Related Posts

Leave a Comment