Home Umela inteligencia Model AI simuluje 500 miliónov rokov evolúcie na vytvorenie nového fluorescenčného proteínu

Model AI simuluje 500 miliónov rokov evolúcie na vytvorenie nového fluorescenčného proteínu

by
Ai protein

Vedci vyvinuli systém AI schopný simulovať stovky miliónov rokov evolúcie proteínov, čím vytvorili nový fluorescenčný proteín, ktorý sa nepodobá žiadnemu v prírode.

Výskumný tím vedený Alexandrom Rivesom v EvolutionaryScale vytvoril veľký jazykový model (LLM) s názvom ESM3 na spracovanie a generovanie informácií o proteínových sekvenciách, štruktúrach a funkciách.

Školením na údajoch z miliárd prírodných proteínov sa ESM3 naučil predpovedať, ako by sa proteíny mohli vyvíjať a meniť v priebehu času.

„ESM3 je vznikajúci simulátor, ktorý sa naučil pri riešení úlohy predikcie tokenov na dátach generovaných evolúciou,“ vysvetľujú výskumníci štúdium.

„Bola teória, že neurónové siete objavujú základnú štruktúru údajov, ktoré sú natrénované na predpovedanie. Týmto spôsobom by vyriešenie úlohy predikcie tokenu vyžadovalo, aby sa model naučil hlbokú štruktúru, ktorá určuje, ktoré kroky môže evolúcia podniknúť, teda základnú biológiu proteínov.“

Na testovanie modelu tím vyzval ESM3, aby navrhol úplne nový zelený fluorescenčný proteín (GFP) – typ proteínu zodpovedného za bioluminiscenciu u určitých morských živočíchov a široko používaný v biotechnologickom výskume.

Proteín generovaný AI, nazývaný esmGFP, zdieľa iba 58% svojej sekvencie s najpodobnejšími známymi fluorescenčnými proteínmi.

Je pozoruhodné, že esmGFP vykazuje jas porovnateľný s prirodzene sa vyskytujúcimi GFP a zachováva charakteristickú súdkovitú štruktúru nevyhnutnú pre fluorescenciu.

Výskumníci odhadujú, že produkcia proteínu tak vzdialeného od známych GFP by trvala viac ako 500 miliónov rokov prirodzeného vývoja.

Viac o štúdiu

Proces generovania esmGFP zahŕňal niekoľko kľúčových krokov:

  1. Údaje: Výskumníci trénovali ESM3 na približne 2,78 miliardách prírodných proteínov zozbieraných z databáz sekvencií a štruktúr. To zahŕňalo údaje z UniRef, MGnify, JGI a ďalších zdrojov.
  2. Architektúra: ESM3 používa architektúru založenú na transformátore s určitými úpravami, vrátane mechanizmu „geometrickej pozornosti“ na spracovanie 3D proteínových štruktúr.
  3. Nabádanie: Výskumníci poskytli ESM3 minimálne štrukturálne informácie zo šablóny GFP (fluorescenčný proteín).
  4. generácie: ESM3 použil túto výzvu na vytvorenie nových proteínových sekvencií a štruktúr prostredníctvom iteračného procesu.
  5. Filtrovanie: Tisíce návrhov kandidátov boli výpočtovo vyhodnotené a filtrované, aby sa našli najsilnejší kandidáti.
  6. Experimentálne testovanie: Najsľubnejšie návrhy boli syntetizované a testované v laboratóriu na fluorescenčnú aktivitu.
  7. Spresnenie: Po identifikácii slabého, ale vzdialeného variantu GFP výskumníci použili ESM3 na ďalšiu optimalizáciu dizajnu, čím sa nakoniec vytvoril jasnejší fluorescenčný proteín.

Dôsledky tohto výskumu presahujú rámec vytvorenia jediného nového proteínu.

ESM3 demonštruje schopnosť skúmať priestory dizajnu proteínov ďaleko od toho, čo vytvorila prirodzená evolúcia, čím sa otvárajú nové cesty na vytváranie proteínov s požadovanými funkciami alebo vlastnosťami.

Dr. Tiffany Taylorová, profesorka mikrobiálnej ekológie a evolúcie na Univerzite v Bath, ktorá sa na štúdii nezúčastnila, povedal LiveScience: „Práve teraz nám stále chýba základné pochopenie toho, ako sa proteíny, najmä tie, ktoré sú vo vede nové, správajú, keď sú zavedené do živého systému, ale toto je skvelý nový krok, ktorý nám umožňuje pristupovať k syntetickej biológii novým spôsobom. “

„Modelovanie umelej inteligencie ako ESM3 umožní objavenie nových proteínov, ktoré by obmedzenia prirodzeného výberu nikdy neumožnili, čím sa vytvoria inovácie v proteínovom inžinierstve, ktoré evolúcia nedokáže,“ dodal Dr. Taylor.

Generatívny proteínový dizajn

Vedci tvrdia, že ESM3 nie je len získavanie alebo rekombinácia existujúcich informácií o proteínoch.

Namiesto toho sa zdá, že rozvinul pochopenie základných princípov, ktorými sa riadi štruktúra a funkcia proteínov, čo mu umožňuje vytvárať skutočne nové návrhy.

Výskum a dizajn proteínov poháňaný umelou inteligenciou dosiahol vrchol horúčky DeepMindAlphaFold 3 predpovedať, ako sa proteíny skladajú s neuveriteľnou presnosťou.

Ukázali sa aj proteíny navrhnuté AI vynikajúca pevnosť väzbyčo ukazuje, že majú praktické využitie.

Avšak, ako pri každej rýchlo sa rozvíjajúcej technológii, ktorá nejakým spôsobom zasahuje do biológie, aj tu existujú riziká.

Po prvé, ak by proteíny navrhnuté AI unikli do životného prostredia, mohli by potenciálne interagovať s prírodnými ekosystémami, dokonca by mohli konkurovať prírodným proteínom alebo narušiť existujúce biologické procesy.

Po druhé, mohli by vyvolať neočakávané interakcie v rámci živých organizmov, potenciálne dokonca vytvárať škodlivé biologické látky alebo toxíny.

Vedci nedávno vyzvali etické mantinely pre dizajn AI proteínov, aby sa zabránilo riskantným výsledkom v tejto vzrušujúcej, aj keď nepredvídateľnej oblasti.

Source Link

Related Posts

Leave a Comment