Napisał: Serce Metawersu

EvolutionaryScale, najnowocześniejsze laboratorium badawcze w dziedzinie sztucznej inteligencji w biologii, ogłosiło niedawno, że otrzymało finansowanie w ramach rundy zalążkowej o wartości ponad 142 mln dolarów i wypuściło przełomowy model sztucznej inteligencji ESM3. Jakie unikalne pomysły ma ta roczna firma w obszarze AI life sciences? Jakie przełomy technologiczne kryje w sobie nowy model dużych białek?

Tydzień temu, kiedy Meta była w pełnym rozkwicie na torze Vincent Video, zespół białkowy EvolutionaryScale, który został przez nią rozwiązany, otrzymał ponad 142 miliony dolarów finansowania w ramach rundy zalążkowej. Kwotę tego finansowania można w całości uznać za absurdalnie wysoką dziedzina biotechnologii.

W sierpniu ubiegłego roku Meta oficjalnie ogłosiła, że ​​jej zespół Meta-FAIR zajmujący się składaniem białek został rozwiązany. Ten czysto „nauka + AI” projekt nie pozwoli Meta na szybkie osiągnięcie zysków, a decyzja Meta o skupieniu się na komercjalizacji AI wydaje się rozsądna.

Jednak ten niedoceniany zespół faktycznie uderzył Metę w twarz w ciągu zaledwie jednego roku. Ich najnowszy ESM3 jest uważany za przełomowy model generatywnej sztucznej inteligencji w dziedzinie biologii, otwierający nowe możliwości programowania biologicznego.

01. 1-minutowy przegląd projektu

1. Nazwa projektu: EvolutionaryScale

2. Data założenia: lipiec 2023

3. Wprowadzenie produktu:

Opracowanie wielkojęzykowego modelu do tworzenia nowych białek i innych układów biologicznych – ESM, obecnie iterowany do ESM-3.

4. Zespół założycielski:

  • Główny naukowiec: Alexander Rives (doktorat informatyki, New York University, były naukowiec zajmujący się sztuczną inteligencją Facebooka)

  • Tom Sercu

  • Sala Candido

5. Sytuacja finansowa:

Zakończono zalążkową rundę finansowania w wysokości do 142 mln USD w dniu 25 czerwca 2024 r. Rundę poprowadzili Nat Friedman, Daniel Gross i Lux Capital, przy udziale Amazon, NVentures (ramię venture capital Nvidii) i aniołów biznesu.

02. Dążenie do pracy zespołowej i spójnych koncepcji

Postępy w sztucznej inteligencji stworzyły bezprecedensowe możliwości badań z zakresu nauk biologicznych, w tym projektowania funkcjonalnych biomolekuł, zwłaszcza białek. Zastosowanie sztucznej inteligencji do projektowania białek może nie tylko poprawić wydajność i wskaźnik powodzenia projektowania białek, ale także pomóc ludzkości stawić czoła niektórym wyzwaniom, przed którymi stoi, poprzez szybkie reagowanie na epidemie chorób zakaźnych.

Alexander Rives i inni dostrzegli lukę w projektowaniu białek i postanowili opracować duże modele oparte na głębokim uczeniu się, promując w ten sposób projektowanie białek na poziomie przemysłowym w „erę w pełni automatycznego inteligentnego generowania”.

W ten sposób powstała EvolutionaryScale. Jest to najnowocześniejsze laboratorium badawcze AI skupiające się na naukach biologicznych i zaangażowane w wprowadzanie wielkoskalowych modeli językowych w czołówce biologii.

Co ciekawe, wszystkich ośmiu członków zespołu założycielskiego firmy pochodziło z działu FAIR (Fundamental Artificial Intelligence Research) firmy Meta. Pomimo frustracji światowej klasy giganta mediów społecznościowych, główni członkowie pierwotnego zespołu nie poddali się. Zamiast tego szybko weszli na nowe pole bitwy i zaczęli opracowywać model nowej generacji w oparciu o wyniki pierwotnego zespołu.

Duże modele EvolutionaryScale wspierają badania i rozwój w takich dziedzinach, jak nauki o zdrowiu i środowisku, stale badając skalowalność biologii i napędzając przełomowe badania naukowe. Jednym z najbardziej znaczących wyników jest przełom w technologii zwijania białek. Modele ESM pozwoliły odkryć struktury setek milionów białek metagenomicznych, pomagając naukowcom na całym świecie symulować i rozumieć białka.

Celem EvolutionaryScale jest kierowanie rozwojem technologii sztucznej inteligencji w dziedzinie projektowania białek poprzez otwarte i bezpieczne metody badawcze.

Na tej podstawie firma, jako sygnatariusz, poprowadziła ponad 160 globalnych interesariuszy ze środowisk akademickich, rządowych i sektora prywatnego do wspólnego rozwijania tej technologii i zapewnienia jej bezpieczeństwa i niezawodności, realizując w ten sposób wizję korzyści dla zdrowia ludzkiego i społeczeństwa.

To właśnie poczucie odpowiedzialności za kierowanie zaawansowaną technologią sztucznej inteligencji w świecie biologicznym sprawia, że ​​Alexander Rives i jego zespół nigdy się nie zatrzymują.

Wcześniej firma EvolutionaryScale wypuściła model dużego języka ESM1, który jest uważany za pierwszy model języka transformatora dla białek i został zbudowany przez zespół założycieli EvolutionaryScale podczas pracy w dziale FAIR firmy Meta. ESM2, ulepszony model ESM1, ma 15 milionów parametrów i działa lepiej niż starszy model ESM1b (który ma 650 milionów parametrów).

W zeszłym tygodniu firma EvolutionaryScale wypuściła swój najnowszy model sztucznej inteligencji ESM3, co stanowi ogromny krok w kierunku przyszłości biologii. Dzięki mocy tego modelu możliwe jest przyspieszenie odkryć o szerokim zastosowaniu, sprzyjając tworzeniu białek, które pomagają wychwytywać węgiel w celu opracowania nowych metod leczenia raka.

03.Pionier w zastosowaniu AI w biologii

ESM3 to generatywny model sztucznej inteligencji, którego główną funkcją jest generowanie nowych białek. Model wykorzystuje technologię głębokiego uczenia się do trenowania przy użyciu dużej ilości danych dotyczących białek w celu poznania związku między sekwencją, strukturą i funkcją białek.

ESM3 został przeszkolony przy użyciu ponad 1 biliona teraflopów mocy obliczeniowej, co stanowi największą znaną skalę obliczeniową w biologii. Został przeszkolony na zbiorze danych obejmującym 2,78 miliarda białek pochodzących z naturalnej różnorodności Ziemi, co pozwoliło mu jednocześnie wnioskować o sekwencji, strukturze i funkcji białek.

Główny przepływ pracy w ESM3 można uprościć w czterech następujących krokach:

  • Gromadzenie i przetwarzanie danych: EvolutionaryScale najpierw gromadzi dużą ilość danych biologicznych z różnych źródeł, w tym sekwencje genów, struktury białek, adnotacje funkcjonalne itp. Dane zostaną oczyszczone, ustandaryzowane i sformatowane w celu ułatwienia późniejszej analizy i zastosowania.

  • Trenowanie modeli: korzystając z algorytmów głębokiego uczenia się i dużej ilości zasobów obliczeniowych, EvolutionaryScale przeszkoli przetworzone dane, aby zbudować duży model językowy, który będzie w stanie zrozumieć i przewidzieć prawa biologiczne. Modele te są nie tylko bardzo dokładne, ale także radzą sobie ze złożonymi problemami biologicznymi.

  • Generuj nowe białka: dzięki interaktywnym podpowiedziom ESM3 jest w stanie wygenerować nowe białka, których ewolucja w przyrodzie zajęłaby setki milionów lat.

  • Walidacja naukowa: Wytworzone nowe białka zostaną poddane walidacji w drodze eksperymentów naukowych w celu określenia ich funkcji i potencjalnych zastosowań.

Obecnie jednym z najbardziej przekonujących przypadków zastosowania ESM3 jest wytwarzanie nowego białka zielonej fluorescencji (GFP).

GFP to jedno z najpiękniejszych i najbardziej unikalnych białek występujących w przyrodzie, odpowiedzialne za blask meduz i żywe, fluorescencyjne kolory koralowców. ESM3 stworzył to nowe białko fluorescencyjne w procesie myślowym obejmującym 500 milionów lat ewolucji. Proces ten w naturalnej ewolucji zająłby ponad 500 milionów lat, ale ESM3 umożliwił ten skok obliczeniowy.

Wydanie ESM3 zrewolucjonizowało także dziedziny odkrywania leków i biologii syntetycznej.

Jeśli chodzi o odkrywanie leków, ESM3 może generować nowe białka o określonej aktywności biologicznej, dostarczając więcej cząsteczek kandydatów do badań przesiewowych i optymalizacji leków. Jednocześnie ESM3 może również przewidywać i optymalizować mechanizm interakcji między lekami a celami, zapewniając bardziej naukowe podstawy do projektowania i opracowywania leków.

Jeśli chodzi o biologię syntetyczną, ESM3 jest w stanie wygenerować systemy biologiczne o określonych funkcjach, zapewniając nowe rozwiązania w takich obszarach, jak bioprodukcja i bioenergia. Na przykład ESM3 może wygenerować układ enzymatyczny, który skutecznie przekształca dwutlenek węgla w materię organiczną, zapewniając nowe podejście do wychwytywania i wykorzystania dwutlenku węgla.

Model ESM3 opracowany przez firmę EvolutionaryScale stanowi nowy kamień milowy w dziedzinie sztucznej inteligencji w biologii. Oczekuje się, że dzięki swoim potężnym możliwościom generacyjnym i współpracy z liderami branży ESM3 przyspieszy odkrywanie nowych białek i projektowanie systemów biologicznych, wnosząc rewolucyjny wpływ na przyszły rozwój leków, materiałoznawstwo i naukę o środowisku.

04. Podróż innowacji w dziedzinie biologii

Biologia syntetyczna: życie w programowaniu

Biologia syntetyczna jest ważnym kierunkiem przyszłego rozwoju EvolutionaryScale. Projektując i syntetyzując nowe obwody genetyczne i ścieżki biologiczne, naukowcy mogą tworzyć organizmy o określonych funkcjach.

  • Obwody genetyczne są podobne do obwodów elektronicznych, ale kontrolują procesy biologiczne w komórkach.

Obwody genowe umożliwiają precyzyjną kontrolę ekspresji specyficznych genów w komórkach. Na przykład obwód genetyczny można zaprojektować tak, aby włączał lub wyłączał ekspresję określonego genu, gdy komórka wykryje określony sygnał, taki jak określona substancja chemiczna lub zmiana środowiska.

  • Szlaki biologii syntetycznej obejmują połączenie wielu enzymów i szlaków metabolicznych wykorzystywanych do wytwarzania cennych związków.

Dzięki analizie i projektowaniu AI naukowcy mogą tworzyć nowe szlaki metaboliczne, które umożliwiają organizmom syntezę związków, których nie można wytworzyć w sposób naturalny. Na przykład mikroorganizmy mogą wytwarzać półprodukty farmaceutyczne, biopaliwa lub chemikalia przemysłowe poprzez przeprojektowanie swoich szlaków metabolicznych.

  • Fabryka komórek to system biologiczny wykorzystujący inżynierię genetyczną do modyfikowania mikroorganizmów w celu wydajnego wytwarzania docelowych produktów w warunkach przemysłowych.

Dzięki projektowaniu wspomaganemu przez sztuczną inteligencję naukowcy mogą modyfikować genomy mikroorganizmów, tak aby mogły one wykazywać doskonałą wydajność produkcyjną w określonych warunkach. Na przykład edytując geny drożdży lub bakterii, naukowcy mogą zwiększyć skuteczność tych mikroorganizmów w wytwarzaniu antybiotyków, enzymów lub innych produktów biologicznych.

Jeśli technologia ta będzie mogła się dalej rozwijać, nie tylko będzie sprzyjać nowatorskiemu rozwojowi badań naukowych, ale także przyniesie ważne perspektywy aplikacyjne w takich dziedzinach, jak medycyna, ochrona środowiska i rolnictwo.

Medycyna spersonalizowana oparta na danych

EvolutionaryScale promuje rozwój medycyny spersonalizowanej poprzez sztuczną inteligencję i technologię analizy dużych zbiorów danych, aby zapewnić pacjentom bardziej precyzyjne i wydajne usługi medyczne.

Medycyna spersonalizowana opiera się na unikalnych informacjach biologicznych i danych klinicznych każdego pacjenta, aby dostosować najodpowiedniejszy plan leczenia. Jednym z kluczowych obszarów jest analiza genomowa. Dzięki kompleksowemu sekwencjonowaniu i analizie genomu pacjenta naukowcy mogą zidentyfikować warianty genetyczne powiązane z chorobą.

EvolutionaryScale wykorzystuje technologię sztucznej inteligencji do szybkiej i dokładnej analizy dużych ilości danych genomicznych w celu odkrycia potencjalnych czynników ryzyka choroby.

Ta metoda może pomóc lekarzom zdiagnozować chorobę we wczesnym stadium i podjąć działania zapobiegawcze. Na przykład, analizując mutacje genów BRCA1 i BRCA2 u pacjentek z rakiem piersi, można przewidzieć ryzyko ich wystąpienia, co pozwala na wczesne badania przesiewowe i interwencję.

Dziś EvolutionaryScale stoi na czele integracji biologii i sztucznej inteligencji, zajmującej się programowaniem i optymalizacją systemów biologicznych poprzez ciągłe innowacje i badania. W przyszłości można osiągnąć więcej przełomów technologicznych, tworząc mądrzejszą i zdrowszą przyszłość dla ludzkości.