Escrito por: Corazón del Metaverso

EvolutionaryScale, un laboratorio de investigación de inteligencia artificial de vanguardia en biología, anunció recientemente que recibió más de 142 millones de dólares en financiación de ronda inicial y lanzó el emblemático modelo de IA ESM3. ¿Qué ideas únicas tiene esta empresa de un año en el campo de las ciencias biológicas de la IA? ¿Qué tipo de avances tecnológicos tiene el nuevo modelo de proteínas grandes?

Hace una semana, cuando Meta estaba en pleno apogeo en la pista de Vincent Video, el equipo de proteínas EvolutionaryScale, que fue disuelto por él, recibió más de $ 142 millones en financiamiento de ronda inicial. Se puede decir que esta cantidad de financiamiento es ridículamente alta en total. campo de la biotecnología.

En agosto del año pasado, Meta anunció oficialmente que su equipo de plegamiento de proteínas Meta-FAIR se disolvió. Este proyecto puramente de "ciencia + IA" no permitirá que Meta obtenga ganancias rápidamente, y la decisión de Meta de centrarse en la comercialización de IA parece razonable.

Sin embargo, este equipo subestimado en realidad abofeteó a Meta en solo un año. Su último ESM3 se considera un modelo de IA generativa histórico en el campo de la biología, que abre nuevas posibilidades para la programación biológica.

01. Resumen del proyecto de 1 minuto

1. Nombre del proyecto: EvolutionaryScale

2. Fecha de constitución: julio de 2023

3. Introducción del producto:

Desarrollar un modelo de lenguaje grande para crear nuevas proteínas y otros sistemas biológicos: ESM, actualmente iterado a ESM-3.

4. Equipo fundador:

  • Científico jefe: Alexander Rives (Doctor en Ciencias de la Computación, Universidad de Nueva York, ex científico de inteligencia artificial de Facebook)

  • Tom Sercu

  • Sal Cándido

5. Situación de financiación:

Completó una ronda inicial de financiación de hasta 142 millones de dólares el 25 de junio de 2024. La ronda fue liderada por Nat Friedman y Daniel Gross y Lux Capital, con la participación de Amazon, NVentures (la rama de capital riesgo de Nvidia) e inversores ángeles.

02. La búsqueda del trabajo en equipo y de conceptos consistentes

Los avances en inteligencia artificial han creado oportunidades sin precedentes para la investigación en biociencias, incluido el diseño de biomoléculas funcionales, especialmente proteínas. La aplicación de la inteligencia artificial al diseño de proteínas no solo puede mejorar la eficiencia y la tasa de éxito del diseño de proteínas, sino también ayudar a la humanidad a resolver algunos de los desafíos que enfrenta al responder rápidamente a los brotes de enfermedades infecciosas.

Alexander Rives y otros vieron la brecha en el diseño de proteínas y decidieron desarrollar grandes modelos basados ​​en el aprendizaje profundo, promoviendo así el diseño de proteínas a nivel industrial en la "era de la generación inteligente totalmente automática".

Así nació EvolutionaryScale. Es un laboratorio de investigación de inteligencia artificial de vanguardia que se centra en el campo de las ciencias biológicas y está comprometido a lanzar modelos de lenguaje a gran escala a la vanguardia de la biología.

Curiosamente, los ocho miembros del equipo fundador de la empresa procedían del departamento FAIR (Investigación Fundamental de Inteligencia Artificial) de Meta. A pesar de estar frustrados por el gigante de las redes sociales de clase mundial, los miembros principales del equipo inicial no se dieron por vencidos, sino que rápidamente ingresaron al nuevo campo de batalla y comenzaron a desarrollar el modelo de próxima generación basado en los resultados del equipo original.

Los grandes modelos de EvolutionaryScale respaldan la investigación y el desarrollo en campos como las ciencias ambientales y de la salud, explorando constantemente la escalabilidad de la biología e impulsando investigaciones científicas innovadoras. Uno de los resultados más significativos es el avance en la tecnología de plegamiento de proteínas. Los modelos ESM han revelado las estructuras de cientos de millones de proteínas metagenómicas, ayudando a científicos de todo el mundo a simular y comprender las proteínas.

EvolutionaryScale tiene como objetivo guiar el desarrollo de la tecnología de inteligencia artificial en el campo del diseño de proteínas a través de métodos de investigación abiertos y seguros.

Sobre esta base, la empresa, como signataria, ha liderado a más de 160 partes interesadas globales del mundo académico, gubernamental y del sector privado para desarrollar conjuntamente esta tecnología y garantizar que sea segura y confiable, logrando así la visión de beneficiar la salud humana y la sociedad.

Precisamente por el sentido de responsabilidad de liderar la tecnología avanzada de IA en el mundo biológico, Alexander Rives y su equipo nunca se detienen.

Anteriormente, EvolutionaryScale lanzó el modelo de lenguaje a gran escala ESM1, que se considera el primer modelo de lenguaje transformador para proteínas y fue construido por el equipo fundador de EvolutionaryScale mientras trabajaba en el departamento FAIR de Meta. ESM2, un modelo actualizado de ESM1, tiene 15 millones de parámetros y funciona mejor que el modelo anterior ESM1b (que tiene 650 millones de parámetros).

La semana pasada, EvolutionaryScale lanzó su último modelo de IA ESM3, un gran paso hacia el futuro de la biología. Con el poder de este modelo, es posible acelerar descubrimientos con aplicaciones generalizadas, favoreciendo la creación de proteínas que ayuden a capturar carbono para desarrollar nuevos tratamientos contra el cáncer.

03.Pionero en la aplicación de la IA en biología

ESM3 es un modelo de IA generativa cuya función principal es generar nuevas proteínas. El modelo utiliza tecnología de aprendizaje profundo para entrenar utilizando una gran cantidad de datos de proteínas para aprender la relación entre la secuencia, estructura y función de las proteínas.

ESM3 se entrenó utilizando más de 1 billón de teraflops de potencia informática, la escala computacional más grande conocida en biología. Fue entrenado con un conjunto de datos de 2,78 mil millones de proteínas de la diversidad natural de la Tierra, lo que le permitió razonar simultáneamente sobre la secuencia, estructura y función de las proteínas.

El flujo de trabajo principal de ESM3 se puede simplificar en los siguientes cuatro pasos:

  • Recopilación y procesamiento de datos: EvolutionaryScale primero recopila una gran cantidad de datos biológicos de diversas fuentes, incluidas secuencias de genes, estructuras de proteínas, anotaciones funcionales, etc. Los datos serán limpiados, estandarizados y formateados para facilitar su posterior análisis y aplicación.

  • Entrenamiento de modelos: utilizando algoritmos de aprendizaje profundo y una gran cantidad de recursos informáticos, EvolutionaryScale entrenará los datos procesados ​​para construir un modelo de lenguaje grande que pueda comprender y predecir leyes biológicas. Estos modelos no sólo son muy precisos, sino que también son capaces de manejar problemas biológicos complejos.

  • Generar nuevas proteínas: a través de indicaciones interactivas, ESM3 puede generar nuevas proteínas que habrían tardado cientos de millones de años en evolucionar en la naturaleza.

  • Validación científica: Las nuevas proteínas generadas serán validadas mediante experimentos científicos para determinar sus funciones y posibles aplicaciones.

Actualmente, uno de los casos de uso más convincentes de ESM3 es la generación de una nueva proteína verde fluorescente (GFP).

La GFP es una de las proteínas más bellas y únicas de la naturaleza, responsable del brillo de las medusas y de los vívidos colores fluorescentes de los corales. ESM3 creó esta nueva proteína fluorescente mediante un proceso de pensamiento que abarca 500 millones de años de evolución. Este proceso habría tardado más de 500 millones de años en evolución natural, pero ESM3 hizo posible este salto computacionalmente.

El lanzamiento de ESM3 también ha revolucionado los campos del descubrimiento de fármacos y la biología sintética.

En términos de descubrimiento de fármacos, ESM3 puede generar nuevas proteínas con actividades biológicas específicas, proporcionando más moléculas candidatas para la detección y optimización de fármacos. Al mismo tiempo, ESM3 también puede predecir y optimizar el mecanismo de interacción entre fármacos y objetivos, proporcionando una base más científica para el diseño y desarrollo de fármacos.

En términos de biología sintética, ESM3 es capaz de generar sistemas biológicos con funciones específicas, aportando nuevas soluciones en áreas como la biofabricación y la bioenergía. Por ejemplo, ESM3 puede generar un sistema enzimático que convierte eficientemente el dióxido de carbono en materia orgánica, proporcionando un nuevo enfoque para la captura y utilización del carbono.

El modelo ESM3 de EvolutionaryScale representa un nuevo hito en la IA en biología. A través de sus potentes capacidades de generación y la colaboración con líderes de la industria, se espera que ESM3 acelere el descubrimiento de nuevas proteínas y el diseño de sistemas biológicos, aportando un impacto revolucionario al futuro desarrollo de fármacos, ciencia de materiales y ciencia ambiental.

04. Viaje de innovación en el campo de la biología.

Biología sintética: programación de la vida

La biología sintética es una dirección importante para el desarrollo futuro de EvolutionaryScale. Al diseñar y sintetizar nuevos circuitos genéticos y vías biológicas, los científicos pueden crear organismos con funciones específicas.

  • Los circuitos genéticos son similares a los circuitos electrónicos, pero controlan los procesos biológicos en las células.

Los circuitos genéticos permiten un control preciso de la expresión genética específica dentro de las células. Por ejemplo, se puede diseñar un circuito genético para activar o desactivar la expresión de un gen específico cuando la célula detecta una señal específica, como una determinada sustancia química o un cambio ambiental.

  • Las vías de la biología sintética implican la combinación de múltiples enzimas y vías metabólicas para la producción de compuestos valiosos.

Mediante el análisis y el diseño de la IA, los científicos pueden crear nuevas vías metabólicas que permitan a los organismos sintetizar compuestos que no se pueden producir de forma natural. Por ejemplo, los microorganismos pueden producir productos intermedios farmacéuticos, biocombustibles o productos químicos industriales rediseñando sus rutas metabólicas.

  • La fábrica de células es un sistema biológico que utiliza la ingeniería genética para modificar microorganismos para producir de manera eficiente productos objetivo en condiciones industriales.

Mediante el diseño asistido por IA, los científicos pueden modificar los genomas de los microorganismos para que puedan exhibir un rendimiento de producción excelente en condiciones específicas. Por ejemplo, al editar los genes de levaduras o bacterias, los científicos pueden hacer que estos microorganismos sean eficientes en la producción de antibióticos, enzimas u otros productos biológicos.

Si esta tecnología puede continuar desarrollándose, no sólo promoverá el desarrollo de vanguardia de la investigación científica, sino que también brindará importantes perspectivas de aplicación en campos como la medicina, la protección del medio ambiente y la agricultura.

Medicina personalizada basada en datos

EvolutionaryScale está promoviendo el avance de la medicina personalizada a través de la inteligencia artificial y la tecnología de análisis de big data para brindar a los pacientes servicios médicos más precisos y eficientes.

La medicina personalizada se basa en la información biológica y los datos clínicos únicos de cada paciente para diseñar el plan de tratamiento más adecuado. Un área clave es el análisis genómico. Al secuenciar y analizar exhaustivamente el genoma de un paciente, los científicos pueden identificar variantes genéticas asociadas con la enfermedad.

EvolutionaryScale utiliza tecnología de inteligencia artificial para analizar de forma rápida y precisa grandes cantidades de datos genómicos para descubrir posibles factores de riesgo de enfermedades.

Este enfoque puede ayudar a los médicos a diagnosticar la enfermedad en sus primeras etapas y tomar medidas preventivas. Por ejemplo, al analizar las mutaciones de los genes BRCA1 y BRCA2 en pacientes con cáncer de mama, se puede predecir su riesgo, lo que permite realizar una detección e intervención tempranas.

Hoy en día, EvolutionaryScale está a la vanguardia de la integración de la biología y la inteligencia artificial, dedicándose a programar y optimizar sistemas biológicos a través de la innovación y la exploración continuas. Es posible que en el futuro se logren más avances tecnológicos, creando un futuro más inteligente y saludable para la humanidad.