Rozpoznávanie hlasu sa integruje takmer do všetkých aspektov moderného života, ale zostáva tu veľká medzera: osoby hovoriace menšinovými jazykmi a osoby s hrubým prízvukom alebo poruchami reči, ako je koktanie, sú zvyčajne menej schopné používať nástroje na rozpoznávanie reči, ktoré ovládajú aplikácie, prepisujú alebo automatizovať úlohy, okrem iných funkcií.
Tobi Olatunjizakladateľ a generálny riaditeľ startupu s klinickým rozpoznávaním reči Intron Health, chce túto priepasť preklenúť. Tvrdí, že Intron je najväčšia africká klinická databáza s algoritmom vyškoleným na 3,5 miliónoch zvukových klipov (16 000 hodín) od viac ako 18 000 prispievateľov, najmä zdravotníckych pracovníkov, zastupujúcich 29 krajín a 288 akcentov. Olatunji hovorí, že čerpanie väčšiny svojich prispievateľov zo sektora zdravotnej starostlivosti zaisťuje, že medicínske výrazy sú vyslovované a správne zachytené pre jeho cieľové trhy.
„Pretože sme už trénovali na mnohých afrických prízvukoch, je veľmi pravdepodobné, že základný výkon ich prístupu bude oveľa lepší ako u akejkoľvek inej služby, ktorú používajú,“ povedal a dodal, že údaje z Ghany, Ugandy a Južnej Afriky pribúdajú. a že startup je presvedčený o nasadení modelu tam.
Olatunjiho záujem o zdravotnícke technológie pramení z dvoch prameňov jeho skúseností. Najprv absolvoval školenie a prax ako lekár v Nigérii, kde z prvej ruky videl neefektívnosť systémov na tomto trhu, vrátane toho, koľko papierovania bolo potrebné vyplniť a aké ťažké bolo to všetko sledovať.
„Keď som bol pred pár rokmi lekárom v Nigérii, dokonca aj počas lekárskej fakulty a dokonca aj teraz, ľahko sa rozčúlim, keď robím opakujúcu sa úlohu, ktorá si nezasluhuje ľudské úsilie,“ povedal. „Jedným príkladom je, že sme museli napísať meno pacienta na každú laboratórnu objednávku, ktorú robíte. A niečo, čo je jednoduché, povedzme, že vidím pacientov a potrebujú dostať nejaké recepty, potrebujú nejaké laboratóriá. Každú objednávku im musím ručne vypisovať. Je pre mňa frustrujúce, že musím stále dokola opakovať meno pacienta na každom formulári, vek, dátum a tak ďalej… Stále sa pýtam, ako môžeme veci robiť lepšie? Ako môžeme lekárom uľahčiť život? Môžeme niektoré úlohy odobrať a presunúť ich do iného systému, aby lekár mohol tráviť čas robením vecí, ktoré sú veľmi cenné?“
Tieto otázky ho posunuli do ďalšej fázy jeho života. Olatunji sa presťahoval do USA, aby najskôr absolvoval magisterský titul v lekárskej informatike na Univerzite v San Franciscu a potom ďalší v odbore počítačová veda na Georgia Tech.
Potom si prerezal zuby v niekoľkých technologických spoločnostiach. Ako vedec a výskumník v oblasti klinického programovania prirodzeného jazyka (NLP) v spoločnosti Enlitic, spoločnosti v oblasti San Francisco Bay Area, vytvoril modely na automatizáciu extrakcie informácií z rádiologických textových správ. Pôsobil aj v službe Amazon Web Services ako vedec strojového učenia. V spoločnostiach Enlitic aj Amazon sa zameral na spracovanie prirodzeného jazyka pre zdravotníctvo, pričom formoval systémy, ktoré umožňujú lepší chod nemocníc.
Počas týchto skúseností začal vytvárať myšlienky o tom, ako by sa to, čo sa vyvíjalo a používalo v USA, dalo použiť na zlepšenie zdravotnej starostlivosti v Nigérii a na iných podobných trhoch.
Pôvodným cieľom Intron Health, ktorý bol spustený v roku 2020, bola digitalizácia nemocničných operácií v Afrike prostredníctvom systému elektronických zdravotných záznamov (EMR). Ale prijatie bolo náročné: ukázalo sa, že lekári uprednostňujú písanie pred písaním, povedal Olatunji.
To ho viedlo k tomu, aby preskúmal, ako zlepšiť tento základnejší problém: ako zabezpečiť, aby zadávanie základných údajov fyzikov, písanie, fungovalo lepšie. Najprv sa spoločnosť zamerala na riešenia tretích strán na automatizáciu úloh, ako je písanie poznámok a vkladanie existujúcich technológií reči do textu do jeho programu EMR.
Vyskytlo sa však veľa problémov z dôvodu neustáleho nesprávneho prepisu. Olatunjimu bolo jasné, že hrubé africké akcenty a výslovnosť komplikovaných lekárskych výrazov a mien znemožňujú prijatie existujúcich cudzích transkripčných nástrojov.
Toto znamenalo genézu technológie rozpoznávania reči Intron Health, ktorá dokáže rozpoznať africké akcenty a môže byť tiež integrovaná do existujúcich EMR. Tento nástroj bol doteraz prijatý v 30 nemocniciach na piatich trhoch vrátane Kene a Nigérie.
Okamžite sa dostavili pozitívne výsledky. V jednom prípade, povedal Olatunji, Intron Health pomohol skrátiť čakaciu dobu na rádiologické výsledky v jednej z najväčších západoafrických nemocníc zo 48 hodín na 20 minút. Takáto efektívnosť je kritická pri poskytovaní zdravotnej starostlivosti, najmä v Afrike, kde pomer lekárov a pacientov zostáva jedným z najnižších na svete.
„Nemocnice už minuli tak veľa na vybavenie a technológie… Je dôležité zabezpečiť, aby tieto technológie aplikovali. Sme schopní poskytnúť hodnotu, ktorá im pomôže zlepšiť prijatie systému EMR,“ povedal.
Pri pohľade do budúcnosti začína startup skúmať nové hranice rastu podporené kolom predbežného štartu v hodnote 1,6 milióna USD, na čele ktorého stojí Microtraction s účasťou Plug and Play Ventures, Jaza Rift Ventures, Octopus Ventures, Africa Health Ventures, OpenseedVC, Pi Campus, Alumni Angel, Baker Bridge Capital a niekoľkých anjelských investorov.
Pokiaľ ide o technológiu, Intron Health pracuje na dokonalom potlačení hluku, ako aj na zabezpečení toho, aby platforma fungovala dobre aj pri nízkych šírkach pásma. Okrem toho umožňuje prepis konverzácií viacerými hovorcami a integruje možnosti prevodu textu na reč.
Plán, hovorí Olatunji, je pridať spravodajské systémy alebo nástroje na podporu rozhodovania pre úlohy, ako sú predpisovanie alebo laboratórne testy. Tieto nástroje, ako dodáva, môžu pomôcť znížiť chyby lekárov a zabezpečiť adekvátnu starostlivosť o pacienta okrem urýchlenia ich práce.
Intron Health patrí medzi rastúci počet generatívnych AI startupov v medicínskom priestore, vrátane Microsoft DAX Express, ktoré redukujú administratívne úlohy pre lekárov generovaním poznámok v priebehu niekoľkých sekúnd. Vznik a prijatie týchto technológií prichádza v čase, keď sa predpokladá, že globálny trh s rozpoznávaním reči a hlasu bude do roku 2032 ocenený na 84,97 miliardy USD, po CAGR 23,7 % od roku 2024, podľa odhadov. Fortune Business Insights.
Okrem budovania hlasových technológií hrá Intron kľúčovú úlohu aj vo výskume reči v Afrike, keďže nedávno spolupracoval s Google Research, nadáciou Bill & Melinda Gates Foundation a Digital Square v PATH s cieľom vyhodnotiť populárne veľké jazykové modely (LLM), ako je GPT od OpenAI. -4o, Google’s Gemini a Anthropic’s Claude v 15 krajinách s cieľom identifikovať silné a slabé stránky a riziká zaujatosti alebo poškodenia v LLM. To všetko v snahe zabezpečiť, aby boli pre africké kliniky a nemocnice k dispozícii kultúrne ladené modely.