Carl Rost je myšlienkou za nástrojmi na vyhľadávanie patentov poháňanými AI v spoločnosti Patsnap.
PatSnap stojí v popredí inovačnej inteligencie a využíva silu AI a strojového učenia na preosievanie miliárd súborov údajov, čo umožňuje inovátorom vytvárať dôležité prepojenia. Ich špičková technológia LLM, prispôsobená pre odborníkov z oblasti výskumu, vývoja a IP, bez námahy prechádza miliardami strán patentov denne. Asistent AI spoločnosti PatSnap sa zapája do konverzačných odpovedí na nové otázky a dokáže určiť konkrétne odpovede v rámci rozsiahlych textov. Napríklad dokáže presne určiť, či je konkrétny typ widgetu už patentovaný.
Môžete poskytnúť prehľad o tom, ako Patsnapov asistent AI funguje a aké sú jeho primárne funkcie?
Samozrejme! Je to asistent AI s názvom Hiro, ktorý vám umožňuje klásť otázky týkajúce sa konkrétneho patentu alebo dokonca sady výsledkov alebo celej našej databázy! Bol vyškolený tak, aby porozumel inováciám a otázkam súvisiacim s patentmi a reagoval spôsobom, ktorý uspokojí odborníkov na technické predmety a profesionálov v oblasti duševného vlastníctva. Nedávnym pokrokom je, že Hiro vám môže dokonca pomôcť vyriešiť technické problémy a navrhnúť nové smery pre nové vynálezy aplikovaním vynálezcovských princípov na technické riešenia a problémy, ktoré sa našli v našej databáze patentov a literatúry. Hiro funguje trochu inak v závislosti od toho, či ho používate v našich produktoch pre výskum a vývoj alebo pre profesionálov v oblasti IP.
Myslím, že to, čo robí Hiro jedinečným, je to, že je poháňané patentovaným LLM spoločnosti Patsnap, odpovede tiež odkazujú na odkazy a zdroje z knižnice Patsnap s 200 miliónmi patentov, 190 miliónov kusov literatúry, 254 miliónov chemických štruktúr, 879 miliónov biologických sekvencií a 2 miliardami spravodajských článkov. .
Aké problémy rieši táto aplikácia pre podniky?
Veľkí inovátori by mali tráviť čas inováciami, nie určovaním novosti produktov alebo predbežným prieskumom trhu. Patentové údaje sú jedným z našich najbohatších zdrojov technických informácií a súperia s údajmi z časopisov, najmä v určitých technologických oblastiach. Pre výskum a vývoj bol čas potrebný na nájdenie a preskúmanie tohto typu údajov masívnym blokátorom na jeho využitie, ale nástroje ako Hiro môžu po prvýkrát skutočne demokratizovať tento typ informácií.
Pre právnikov je bežné tráviť hodiny, dni, týždne behaním podľa doterajšieho stavu techniky a slobodou pri vyhľadávaní. S nástrojmi AI to možno urobiť rýchlejšie a s väčšou presnosťou, čím sa uvoľní šírka pásma pre strategickejšiu prácu.
Existujúce nástroje AI sú jednou z dvoch vecí: sú príliš zovšeobecnené, a preto nie sú vhodné pre oblasť duševného vlastníctva, alebo sú to čierne skrinky bez transparentnosti zdrojov, ktoré znižujú dôveru a bránia rozhodovaniu. S Hiro sa spätne prepájame so zdrojmi a zabezpečujeme plnú viditeľnosť vo všetkých fázach vývojového procesu.
Akým hlavným výzvam čelil váš tím pri vývoji funkcií AI pre Patsnap a ako ste ich prekonali?
Vieme, že jednotlivci, ktorí vytvárajú nové vynálezy, ich chcú chrániť, takže bezpečnosť bola pri stavbe Hiro prvoradá. Keďže model, ktorý poháňa Hiro, je lokálny a je zabudovaný do našej aplikácie, žiadne údaje neprenechávajú prostredie tretím stranám, ktorým je ťažké dôverovať. Naši konkurenti nevykonali základy a použili modely tretích strán, ktoré neobstoja pri kontrole. Keď hovoríme, že netrénujeme modely na základe údajov o zákazníkoch, vieme, že je to pravda, a môžeme našim zákazníkom ukázať, že a čo robíme namiesto toho. Na rozdiel od toho, riešenia našich konkurentov vás vystavujú riziku prostredníctvom tretích strán, ktoré majú menej ako hviezdnu povesť, pokiaľ ide o transparentnosť a zaobchádzanie s údajmi.
Mohli by ste upresniť, ako Hiro odpovedá na konkrétne otázky týkajúce sa noviniek a aký to má vplyv na pracovné postupy výskumu a vývoja a IP?
S Hiro môžu používatelia klásť otázky ako „Aké aspekty tohto vynálezu ho robia novým?“ alebo „Ako môže tento patent obstáť v rôznych právnych systémoch?“ alebo dokonca „ako postaviť nositeľný jetpack“ a získať odpovede, ktoré hovoria o každom kroku procesu vynálezu. V porovnaní so všeobecnými modelmi má Hiro skutočne to, čo robí patent výnimočným. Používatelia nemusia byť patentovými expertmi, aby pochopili, čo je alebo nie je nové v rámci ich vynálezu, a v priebehu niekoľkých sekúnd môžu pochopiť, ktorú časť ich produktu alebo nástroja je potrebné chrániť.
Ako Hiro narába s obrovským množstvom údajov z patentov a nepatentovej literatúry, aby poskytol presné a relevantné odpovede?
Absolvovali sme rozsiahle školenie o tomto súbore údajov a ohodnotili sme odpovede s odborníkmi. Potom sme umelú inteligenciu trénovali na základe odpovedí odborníkov, mali sme výstup miery AI a nechali sme odborníkov, aby to preskúmali. Celkovo sme týmto spôsobom ohodnotili milióny údajových bodov, aby sme zaistili, že odpovede majú zmysel pre technických expertov a patentových profesionálov.
Ako Hiro využíva veľké jazykové modely (LLM) na zvýšenie efektívnosti patentového vyhľadávania a analýzy IP? Aké typy údajov boli použité na trénovanie vlastného LLM spoločnosti Patsnap a ako zabezpečujete jeho presnosť a spoľahlivosť?
Patsnap vytvoril LLM špecifický pre dané odvetvie, aby poháňal Hiro. LLM bol vyškolený na patentových záznamoch, akademických dokumentoch a iných údajoch o inováciách, čo mu pomáha pochopiť a prerozprávať informácie spôsobom, ktorý je pre profesionálov užitočnejší ako všeobecné modely. Na zabezpečenie presnosti a spoľahlivosti sme použili prísne metódy predbežného spracovania údajov vrátane filtrovania údajov nízkej kvality, deduplikácie a prepisovania. Tiež sme syntetizovali nové údaje kombináciou rôznych zdrojov, aby sme zlepšili pochopenie modelu IP špecifických nuancií. Dohliadali sme na dolaďovanie a posilňovanie učenia z ľudskej spätnej väzby, aby sme neustále zlepšovali jeho výkon.
PatentGPT bol dôkladne testovaný a prekonal GPT-4 v úlohách špecifických pre IP, čím preukázal vynikajúce schopnosti pri navrhovaní, klasifikácii, sumarizácii a zdôvodňovaní v rámci patentovej domény.
Vlastný LLM je transparentný, spája zdroje a referencie a nie je trénovaný na údaje o zákazníkoch. Je to jediný hráč v odvetví, ktorý používa interne vyladenú LLM v odvetví, ktoré sa obzvlášť spolieha na súkromie a dôvernosť údajov.
Ako sa patentovaný LLM spoločnosti Patsnap porovnáva s inými univerzálnymi LLM, ako je GPT-4, pokiaľ ide o výkon a presnosť úloh súvisiacich s IP?
Patentovaný LLM spoločnosti Patsnap prekonáva GPT-4, pokiaľ ide o otázky týkajúce sa duševného vlastníctva. Pomocou skúšky USPTO Patent Bar Exam si PatsnapGPT-1.0 počínal na úrovni IP experta, zatiaľ čo všeobecné LLM nedosiahli hranicu pre patentových právnikov, ktorí sa podrobili skúške.
PatsnapGPT skutočne vyniká, keď sa pozriete na to, ako funguje v benchmarkoch špecifických pre IP. Hiro má na skúške USPTO Patent Bar trvale vyššie skóre ako všeobecné modely, ako je GPT-4. Všeobecné LLM neprešli 70-bodovým limitom na skúške, zatiaľ čo PatsnapGPT 1.0 skóroval na úrovni IP experta. To ukazuje, že má lepšie znalosti o základoch IP. Okrem toho v PatentBench, ktorý je komplexným benchmarkom pre IP úlohy, PatentGPT exceloval v niekoľkých oblastiach. Produkoval presnejšie a relevantnejšie texty na písanie patentov, dosahoval vyššie skóre pri klasifikácii patentov podľa systému Medzinárodného patentového triedenia a jeho súhrny technických účinkov, problémov, metód a abstraktov hodnotiteľmi sústavne hodnotili vyššie. Vykazuje tiež vyššiu rýchlosť a nižšie využitie pamäte v porovnaní s GPT-4 pre dlhé patentové dokumenty.
Ako si predstavujete úlohu AI vyvíjajúcej sa v oblasti duševného vlastníctva a výskumu a vývoja v nasledujúcom desaťročí?
Vidím, že AI bude v nasledujúcom desaťročí zohrávať čoraz ústrednejšiu úlohu v oblasti duševného vlastníctva, výskumu a vývoja. Po prvé, AI výrazne zvýši efektivitu a presnosť patentových rešerší a analýz. Pokročilé modely umelej inteligencie, ako je PatentGPT, sa stanú ešte lepšími pri porozumení a kategorizácii zložitých technických dokumentov, navrhovaní vysokokvalitných patentových špecifikácií a identifikácii potenciálnych porušení alebo prekrývania existujúcich patentov. To ušetrí obrovské množstvo času a zníži priestor pre ľudské chyby.
Okrem toho AI spôsobí revolúciu v tom, ako spracovávame a interpretujeme obrovské množstvo údajov IP. Vďaka schopnosti rýchlo spracovať a analyzovať veľké súbory údajov dokáže AI odhaliť trendy a poznatky, ktoré by inak mohli zostať nepovšimnuté. To môže viesť k lepšiemu rozhodovaniu a stratégii v správe duševného vlastníctva a výskume a vývoji, ako je identifikácia nových technológií, potenciálnych oblastí pre inovácie a strategických partnerstiev.
V oblasti výskumu a vývoja bude umelá inteligencia podporovať inovácie tým, že bude pomáhať pri procese objavovania. Algoritmy strojového učenia môžu analyzovať predchádzajúci výskum, predpovedať výsledky a dokonca navrhovať nové smery skúmania, čím sa zrýchľuje tempo objavovania a vývoja. Umelá inteligencia môže tiež simulovať experimenty a modelovať zložité systémy, čím sa znižuje potreba nákladných a časovo náročných fyzikálnych skúšok.
Keďže technológia AI sa neustále vyvíja, jej integrácia do IP a výskumu a vývoja zvýši kreativitu, efektivitu a strategické plánovanie.
Ďakujeme za skvelý rozhovor, čitatelia, ktorí sa chcú dozvedieť viac, by mali navštíviť PatSnap.