Escrito por: Coração do Metaverso
EvolutionaryScale, um laboratório de pesquisa de inteligência artificial de ponta em biologia, anunciou recentemente que recebeu mais de US$ 142 milhões em financiamento inicial e lançou o modelo de IA ESM3. Que ideias únicas esta empresa com um ano de existência tem no campo das ciências da vida de IA? Que tipo de avanços tecnológicos o novo modelo de grandes proteínas traz?
Há uma semana, quando Meta estava em pleno andamento na faixa Vincent Video, a equipe de proteínas EvolutionaryScale, que foi dissolvida por ele, recebeu mais de US$ 142 milhões em financiamento da rodada inicial. Esse valor de financiamento pode ser considerado ridiculamente alto em todo o mundo. campo da biotecnologia.
Em agosto do ano passado, a Meta anunciou oficialmente que sua equipe de dobramento de proteínas Meta-FAIR foi dissolvida. Este projeto puramente “ciência + IA” não permitirá que a Meta obtenha lucros rapidamente, e a decisão da Meta de se concentrar na comercialização de IA parece razoável.
No entanto, essa equipe subestimada realmente deu um tapa na cara de Meta em apenas um ano. Seu mais recente ESM3 é considerado um modelo de IA generativa de referência no campo da biologia, abrindo novas possibilidades para a programação biológica.
01. Visão geral do projeto em 1 minuto
1. Nome do projeto: EvolutionaryScale
2. Data de constituição: julho de 2023
3. Introdução do produto:
Desenvolvimento de um grande modelo de linguagem para a criação de novas proteínas e outros sistemas biológicos - ESM, atualmente iterado para ESM-3.
4. Equipe fundadora:
Cientista Chefe: Alexander Rives (PhD em Ciência da Computação, Universidade de Nova York, ex-cientista de IA do Facebook)
Tom Sercu
Sal Candido
5. Situação de financiamento:
Concluiu uma rodada inicial de financiamento de até US$ 142 milhões em 25 de junho de 2024. A rodada foi liderada por Nat Friedman e Daniel Gross e Lux Capital, com participação da Amazon, NVentures (braço de capital de risco da Nvidia) e investidores anjos.
02. A busca pelo trabalho em equipe e conceitos consistentes
Os avanços na inteligência artificial criaram oportunidades sem precedentes para a investigação em biociências, incluindo a concepção de biomoléculas funcionais, especialmente proteínas. A aplicação da inteligência artificial ao design de proteínas pode não só melhorar a eficiência e a taxa de sucesso do design de proteínas, mas também ajudar a humanidade a resolver alguns dos desafios que enfrenta, respondendo rapidamente a surtos de doenças infecciosas.
Alexander Rives e outros viram a lacuna no design de proteínas e decidiram desenvolver grandes modelos baseados em aprendizagem profunda, promovendo assim o design de proteínas em nível industrial para a “era da geração inteligente totalmente automática”.

Assim, EvolutionaryScale surgiu. É um laboratório de pesquisa de IA de ponta com foco no campo das ciências biológicas e está empenhado em lançar modelos de linguagem em larga escala na vanguarda da biologia.
Curiosamente, todos os oito membros da equipe fundadora da empresa vieram do departamento FAIR (Pesquisa Fundamental de Inteligência Artificial) da Meta. Apesar de frustrados com o gigante da mídia social de classe mundial, os membros principais da equipe inicial não desistiram. Em vez disso, eles rapidamente entraram no novo campo de batalha e começaram a desenvolver o modelo da próxima geração com base nos resultados da equipe original.

Os grandes modelos da EvolutionaryScale apoiam a pesquisa e o desenvolvimento em áreas como saúde e ciências ambientais, explorando constantemente a escalabilidade da biologia e impulsionando pesquisas científicas inovadoras. Um dos resultados mais significativos é o avanço na tecnologia de dobramento de proteínas que revelou as estruturas de centenas de milhões de proteínas metagenômicas, ajudando cientistas de todo o mundo a simular e compreender proteínas.
EvolutionaryScale visa orientar o desenvolvimento de tecnologia de inteligência artificial na área de design de proteínas através de métodos de pesquisa abertos e seguros.
Nesta base, a empresa, como signatária, liderou mais de 160 partes interessadas globais da academia, do governo e do setor privado para desenvolverem conjuntamente esta tecnologia e garantir que seja segura e confiável, alcançando assim a visão de beneficiar a saúde humana e a sociedade.
É precisamente por causa do sentido de responsabilidade de liderar a tecnologia avançada de IA no mundo biológico que Alexander Rives e a sua equipa nunca param.
Anteriormente, a EvolutionaryScale lançou o modelo de linguagem em grande escala ESM1, que é considerado o primeiro modelo de linguagem transformadora para proteínas e foi construído pela equipe fundadora da EvolutionaryScale enquanto trabalhava no departamento FAIR da Meta. O ESM2, um modelo atualizado do ESM1, possui 15 milhões de parâmetros e tem desempenho melhor que o modelo antigo ESM1b (que possui 650 milhões de parâmetros).
Na semana passada, a EvolutionaryScale lançou seu mais recente modelo de IA ESM3, um grande passo em direção ao futuro da biologia. Com o poder desse modelo, é possível acelerar descobertas com aplicações generalizadas, favorecendo a criação de proteínas que auxiliam na captura de carbono para o desenvolvimento de novos tratamentos contra o câncer.
03.Pioneiro na aplicação de IA em biologia
ESM3 é um modelo generativo de IA cuja principal função é gerar novas proteínas. O modelo usa tecnologia de aprendizagem profunda para treinar usando uma grande quantidade de dados de proteínas para aprender a relação entre sequência, estrutura e função da proteína.

O ESM3 foi treinado usando mais de 1 trilhão de teraflops de poder computacional, a maior escala computacional conhecida em biologia. Ele foi treinado em um conjunto de dados de 2,78 bilhões de proteínas da diversidade natural da Terra, permitindo-lhe raciocinar simultaneamente sobre a sequência, estrutura e função das proteínas.
O fluxo de trabalho principal do ESM3 pode ser simplificado nas quatro etapas a seguir:
Coleta e processamento de dados: EvolutionaryScale primeiro coleta uma grande quantidade de dados biológicos de várias fontes, incluindo sequências genéticas, estruturas proteicas, anotações funcionais, etc. Os dados serão limpos, padronizados e formatados para facilitar posterior análise e aplicação.
Treinamento de modelo: Usando algoritmos de aprendizado profundo e uma grande quantidade de recursos computacionais, EvolutionaryScale treinará os dados processados para construir um grande modelo de linguagem que possa compreender e prever leis biológicas. Esses modelos não são apenas altamente precisos, mas também capazes de lidar com problemas biológicos complexos.
Gerar novas proteínas: Através de comandos interativos, o ESM3 é capaz de gerar novas proteínas que levariam centenas de milhões de anos para evoluir na natureza.
Validação científica: As novas proteínas geradas serão validadas através de experimentos científicos para determinar suas funções e aplicações potenciais.
Atualmente, um dos casos de uso mais atraentes do ESM3 é a geração de uma nova proteína fluorescente verde (GFP).
GFP é uma das proteínas mais belas e únicas da natureza, responsável pelo brilho das águas-vivas e pelas cores fluorescentes vivas dos corais. O ESM3 criou esta nova proteína fluorescente através de um processo de pensamento que abrange 500 milhões de anos de evolução. Este processo teria levado mais de 500 milhões de anos na evolução natural, mas o ESM3 tornou este salto computacionalmente possível.
O lançamento do ESM3 também revolucionou os campos da descoberta de medicamentos e da biologia sintética.
Em termos de descoberta de medicamentos, o ESM3 pode gerar novas proteínas com atividades biológicas específicas, fornecendo mais moléculas candidatas para triagem e otimização de medicamentos. Ao mesmo tempo, o ESM3 também pode prever e optimizar o mecanismo de interacção entre medicamentos e alvos, proporcionando uma base mais científica para a concepção e desenvolvimento de medicamentos.

Em termos de biologia sintética, o ESM3 é capaz de gerar sistemas biológicos com funções específicas, proporcionando novas soluções em áreas como biofabricação e bioenergia. Por exemplo, o ESM3 pode gerar um sistema enzimático que converte eficientemente o dióxido de carbono em matéria orgânica, proporcionando uma nova abordagem à captura e utilização de carbono.
O modelo ESM3 da EvolutionaryScale representa um novo marco na IA em biologia. Através das suas poderosas capacidades de geração e da colaboração com líderes da indústria, espera-se que o ESM3 acelere a descoberta de novas proteínas e o design de sistemas biológicos, trazendo um impacto revolucionário ao futuro desenvolvimento de medicamentos, ciência de materiais e ciência ambiental.
04. Jornada de inovação na área de biologia
Biologia Sintética: Programando a Vida
A biologia sintética é uma direção importante para o desenvolvimento futuro da EvolutionaryScale. Ao projetar e sintetizar novos circuitos genéticos e vias biológicas, os cientistas podem criar organismos com funções específicas.
Os circuitos genéticos são semelhantes aos circuitos eletrônicos, mas controlam os processos biológicos nas células.
Os circuitos genéticos permitem o controle preciso da expressão genética específica dentro das células. Por exemplo, um circuito genético pode ser projetado para ativar ou desativar a expressão de um gene específico quando a célula detecta um sinal específico, como uma determinada substância química ou uma mudança ambiental.
As vias da biologia sintética envolvem a combinação de múltiplas enzimas e vias metabólicas para a produção de compostos valiosos.
Através da análise e design de IA, os cientistas podem criar novas vias metabólicas que permitem aos organismos sintetizar compostos que não podem ser produzidos naturalmente. Por exemplo, os microrganismos podem produzir intermediários farmacêuticos, biocombustíveis ou produtos químicos industriais, redesenhando as suas vias metabólicas.
A fábrica de células é um sistema biológico que utiliza engenharia genética para modificar microorganismos para produzir produtos alvo com eficiência em condições industriais.
Através do design assistido por IA, os cientistas podem modificar os genomas dos microrganismos para exibirem um excelente desempenho de produção sob condições específicas. Por exemplo, ao editar os genes de leveduras ou bactérias, os cientistas podem tornar estes microrganismos eficientes na produção de antibióticos, enzimas ou outros produtos biológicos.

Se esta tecnologia puder continuar a desenvolver-se, não só promoverá o desenvolvimento de ponta da investigação científica, mas também trará importantes perspectivas de aplicação em domínios como a medicina, a protecção ambiental e a agricultura.
Medicina personalizada baseada em dados
A EvolutionaryScale está promovendo o avanço da medicina personalizada por meio de IA e tecnologia de análise de big data para fornecer aos pacientes serviços médicos mais precisos e eficientes.
A medicina personalizada baseia-se nas informações biológicas e nos dados clínicos exclusivos de cada paciente para definir o plano de tratamento mais adequado. Uma área chave é a análise genômica. Ao sequenciar e analisar de forma abrangente o genoma de um paciente, os cientistas podem identificar variantes genéticas associadas à doença.
EvolutionaryScale usa tecnologia de IA para analisar com rapidez e precisão grandes quantidades de dados genômicos para descobrir possíveis fatores de risco de doenças.
Este método pode ajudar os médicos a diagnosticar a doença em seus estágios iniciais e a tomar medidas preventivas. Por exemplo, ao analisar as mutações genéticas BRCA1 e BRCA2 em pacientes com cancro da mama, o seu risco pode ser previsto, permitindo o rastreio e intervenção precoces.
Hoje, a EvolutionaryScale está na vanguarda da integração da biologia e da inteligência artificial, dedicada à programação e otimização de sistemas biológicos através da inovação e exploração contínuas. Mais avanços tecnológicos poderão ser alcançados no futuro, criando um futuro mais inteligente e saudável para a humanidade.
