El "¿Qué pasaría si?" de la Evolución: 500 millones de años de evolución simulados por una IA
- Kteishe Villanueva
- 13 jul
- 8 Min. de lectura
Si eres un lector frecuente de nuestro blog, sabrás, gracias a los diferentes artículos en el área de IA, lo que se puede hacer con la inteligencia artificial, ya sea en el arte, en la música, en la educación e incluso en el día a día, los avances que está teniendo y cómo esto está repercutiendo en el público, pero ¿sabemos el uso que se le puede dar a la inteligencia artificial en el área de la ciencia y cómo nos afecta a nosotros?

La mezcla de ciencia y tecnología es algo que se ha implementado por completo en nuestra sociedad; no es sorprendente escuchar noticias sobre nuevos dispositivos que mezclan en sí mismos tecnología y ciencia a la vez, es algo que forma parte de la cotidianidad de nuestras vidas desde hace siglos. Sin embargo, hay un leve desconocimiento sobre los resultados que se podrían obtener al mezclar ciencia, tecnología y, en especial, inteligencia artificial.
Con un poco (mucho) de investigación, he venido a traerles un poco de la IA en la ciencia, específicamente en la biología y en cómo esta ayudó a crear un pequeño paradigma de “¿what if?” o “¿qué pasaría si...?” de la evolución misma. Este será nuestro primer artículo de varios adentrándonos a lo que haría o hace la inteligencia en la ciencia y cómo estas dos áreas se mezclan homogéneamente entre sí.
Si pudiéramos rebobinar la evolución, ¿qué hubiera pasado?
¿Qué hubiera pasado si la evolución hubiera tomado otro rumbo? ¿Se habría creado un mundo alterno al que conocemos o todo hubiera sucedido igual? ¿Habría cambiado todo a la mínima alteración biológica o más bien se hubiera acelerado el proceso evolutivo? ¿Hubiéramos llegado a existir los humanos o seguirían existiendo los dinosaurios y las plantas prehistóricas?
El biólogo evolutivo Stephen Jay Gould planteó este experimento mental en su libro “La vida maravillosa” (1989): “Vuelve a reproducir la cinta un millón de veces… y dudo que algo como el Homo sapiens pudiese evolucionar de nuevo”, escribía dando a entender que estaba a favor del argumento de que si se pudiera rebobinar al principio de la evolución terrestre, probablemente esta hubiera tomado un camino completamente diferente en el que los humanos no existiríamos.
La tesis de Gould inició un amplio debate desde entonces, con opiniones a favor del determinismo:
“Teoría que supone que el desarrollo de los fenómenos naturales está necesariamente determinado por las condiciones iniciales”. (RAE, 2025)
o con opiniones a favor de la contingencia:
“Posibilidad de que algo suceda o no suceda”. (RAE, 2025).
El autor de ciencia ficción Ray Bradbury expresaba algo parecido en su cuento “El ruido del trueno” (1952), donde se narra como un viajero en el tiempo cambiaba el rumbo del futuro al pisar una mariposa en la época de los dinosaurios, misma idea que expresa Gould:
“Altera cualquier acontecimiento temprano, incluso de forma muy leve y sin aparente importancia entonces, y la evolución fluye a un canal totalmente distinto”.
¿Quién iba a imaginar que unas décadas después una startup de IA creada por un grupo de antiguos investigadores de Meta crearía un modelo generativo de lenguaje que no genera texto sino proteínas y que este mismo modelo terminaría creando una GFP que simularía 500 millones de años de evolución, ¿verdad?
El lenguaje de las proteínas: Evolutionary Scale y su sistema ESM3
En Nueva York, un grupo de antiguos investigadores de Meta —la compañía matriz de redes sociales como Facebook, Instagram y WhatsApp— fundó EvolutionaryScale, una startup de IA enfocada a la biología, y crearon el sistema ESM3 (EvolutionaryScale Model 3), un modelo generativo de lenguaje; el tipo de plataforma al que pertenece el famoso ChatGPT, pero a diferencia de este, ESM3 no genera textos, sino que genera proteínas, “maravillosas moléculas dinámicas con funciones increíbles”, como menciona la propia compañía.
ESM3 se alimenta de datos de secuencia, estructura y función de proteínas existentes en la naturaleza de la Tierra para aprender el lenguaje biológico de estas moléculas y crear otras nuevas. Sus creadores lo han entrenado con 771.000 millones de paquetes de datos creados a partir de 3.150 millones de secuencias, 236 millones de estructuras y 539 millones de rasgos funcionales, sumando un total de más de un billón de teraflops y 98B parámetros, el mayor poder de computación jamás utilizado en biología, según la propia compañía.
¿Cómo es que este modelo genera proteínas?
La compañía explica cómo, para que el ESM3 fuera capaz de razonar la secuencia, estructura y función de las proteínas, se tuvo que transformar la estructura y la función tridimensionales en alfabetos discretos y construir una forma de escribir cada estructura tridimensional como una secuencia de letras.

Esto permite al ESM3 entrenar a gran escala y desbloquear capacidades generativas emergentes; el objetivo del entrenamiento de ESM3 es sencillo: extraer, tokenizar y enmascarar parcialmente la secuencia, estructura y función de cada proteína.
Así, ESM3 deberá predecir las posiciones enmascaradas utilizando el objetivo de modelado del lenguaje enmascarado inspirado en los modelos de procesamiento del lenguaje natural. Para llevar a cabo esta tarea, ESM3 debe aprender a comprender en profundidad la conexión entre secuencia, estructura y función a través de datos a escala evolutiva —a escala de miles de millones de proteínas y miles de millones de parámetros— así ESM3 aprende a simular la evolución.
Gracias a este modelo generativo, ahora la biología es también programable dado que ESM3 puede seguir instrucciones para generar nuevas proteínas. Los científicos pueden interactuar con el sistema y guiarlo para que genere un sinfín de aplicaciones. Un ejemplo que da la compañía es que se puede pedir al modelo que combine estructura, secuencia y función para proponer un andamiaje potencial para el sitio activo de la PETasa, una enzima que degrada el tereftalato de polietileno (PET), un objetivo de interés para los ingenieros de proteínas para descomponer los residuos plásticos.
Simulando 500 millones de años de la evolución hecho en un laboratorio
La GFP o Green Fluorescent Protein, según sus siglas en inglés, es parte de la familia de proteínas fluorescentes que existen naturalmente en la Tierra; estas son las encargadas de los colores brillantes de las medusas, corales, anémonas y otros organismos y microorganismos. También son una herramienta importante para la biotecnología moderna y su descubrimiento condujo al otorgamiento de un Premio Nobel.
La fluorescencia de esta proteína se debe a un cromóforo fluorescente; en este caso, el cromóforo representa la parte de la molécula encargada de la absorción de longitudes de onda del rango visible, lo que influye en la longitud de onda reflejada y, de esta forma, en el color del elemento.
En otras palabras, este es un componente molecular que absorbe un único fotón de un color a una longitud de onda corta, captura parte de su energía y libera el resto como un nuevo fotón con un color diferente y una longitud de onda más larga.
Los científicos han descubierto muchas variantes de GFP en la naturaleza y han creado versiones de esta proteína natural en el laboratorio. La primera variante artificial fue encontrada por un montón de mutaciones que aumentaban el brillo o cambiaban el color, pero aun con técnicas más recientes de laboratorio y machine learning, la mayor parte de las variaciones de las GFP funcionales no han surgido de la ingeniería de proteínas, sino de la exploración del mundo natural.
Se entrenó a ESM3 para crear una nueva GFP a partir de la estructura de unos pocos residuos del núcleo de la GFP natural; generar una de casualidad sería casi imposible tomando en cuenta que las posibilidades eran más que el número de átomos del universo visibles.
La compañía menciona sobre su primer experimento:
“Probamos 96 generaciones y encontramos varias proteínas fluorescentes, entre ellas una que distaba mucho de cualquier proteína de la naturaleza. Esta proteína, situada en el pocillo B8 de nuestra placa experimental, era 50 veces menos brillante que las GFP naturales y su cromóforo maduraba en el transcurso de una semana, en lugar de en menos de un día, pero presentaba una señal de función en una porción inexplorada del espacio de secuencias. Continuando la cadena de pensamiento a partir de la secuencia de B8, generamos otro conjunto de 96 proteínas. Las probamos y encontramos varias proteínas que tienen un brillo similar al de las GFP naturales, incluida la más brillante del pocillo C10, a la que llamamos esmGFP”.

La proteína que no fue y que cambio la ruta de la evolución
esmGFP, la proteína fluorescente que solo se parece en un 58% a la más similar y un 42% de semejanza con otras GFP, porcentaje que, según los investigadores, equivale a simular 500 millones de años de evolución. Así, la IA ha abierto un panorama donde se nos brinda una nueva ruta que la naturaleza pudo haber emprendido hace 500 millones de años, pero que, por razones desconocidas, ignoró deliberadamente.
Los resultados de este experimento pueden representar una confirmación de la contingencia defendida por Gould, al igual que pueden representar un brillante ejemplo de la existencia de muchas y diversas maneras en que la evolución podría haber procedido, pero que no lo hizo porque quizás la historia necesaria para que esto sucediera no ocurrió, lo que advierte que existe un leve porcentaje de determinismo en la naturaleza aun con todos los caminos genuinos que pudieron (o que aún pueden) ocurrir.
Esto no significa que la IA acaba de resolver el problema del rebobinado, pero sí que significa que ayudará a entender qué es contingente, qué no y por qué; nos está proporcionando maneras de averiguar el mar de posibilidades biológicas que pueden existir, existieron o, si queremos dejar de ver el pasado y mirar hacia adelante, lo que incluso puede llegar a existir en un futuro, ya sea cercano o lejano.
Sin duda, este descubrimiento nos abre una puerta en donde una vez más la inteligencia artificial se vuelve una herramienta fundamental para la investigación científica y nos acerca más a un futuro en el que la IA nos brinda apoyo para hacer nuevos descubrimientos científicos que cambien nuestra comprensión sobre la ciencia en general, como dicen Rives y sus colaboradores:
“Creemos en un futuro en el que la IA pueda ayudarnos a comprender los complejos sistemas de la vida al nivel más básico, hacer nuevos descubrimientos científicos que cambien nuestra comprensión de la biología, ayudarnos a encontrar curas para las enfermedades y construir un mundo más sostenible”.
Espero que la lectura de este artículo haya sido de tu agrado y que, después de leerlo, te mantengas interesado/a en aprender sobre el tema. Yo aspiro a seguir escribiendo sobre esto para seguir divulgando los descubrimientos que surgen en el ámbito científico con apoyo de la inteligencia artificial.
¡Hasta pronto, querido lector!

Fuentes:
Yanes. J. (2025). “Una empresa de IA genera en el laboratorio 500 millones de años de evolución hasta dar con una proteína fluorescente artificial”. El País. Una empresa de IA genera en el laboratorio 500 millones de años de evolución hasta dar con una proteína fluorescente artificial | Salud y bienestar | EL PAÍS
“Simulating 500 million years of evolution with a language model”. (2025). Science. Simulating 500 million years of evolution with a language model | Science
“ESM3: Simulating 500 million years of evolution with a language model”. (2024). EvolutionaryScale. Evolutionary Scale · ESM3: Simulating 500 million years of evolution with a language model
Academia Lab. (2025). Proteína fluorescente verde. Enciclopedia. Revisado el 13 de julio del 2025. https://academia-lab.com/enciclopedia/proteina-fluorescente-verde/
Real Academia Española. (s.f.). Determinismo. En Diccionario de la lengua española (23.ª ed.). determinismo | Definición | Diccionario de la lengua española | RAE - ASALE
Real Academia Española. (s.f.). Contingencia. En Diccionario de la lengua española (23.ª ed.). contingencia | Definición | Diccionario de la lengua española | RAE - ASALE
Chacón. J. (2022). “Cromóforos”. Lifeder: https://www.lifeder.com/cromoforos/
Martínez-Suarez. P. (2025). “Unos ingenieros han simulado 500 millones de años de evolución con una IA. Ahora tenemos una proteína fluorescente”. Xataca. https://www.xataka.com/robotica-e-ia/unos-ingenieros-han-simulado-500-millones-anos-evolucion-ia-ahora-tenemos-proteina-fluorescente