En el Laboratorio Nacional de Argonne, a aproximadamente 30 millas del centro de Chicago, los científicos intentan comprender el origen y la evolución del universo, crear baterías de mayor duración y desarrollar medicamentos para el cáncer de precisión.
Todos estos problemas diferentes tienen una cosa en común: son difíciles debido a su gran escala. En el descubrimiento de drogas, se estima que podría haber más moléculas potenciales similares a las drogas que átomos en el sistema solar. La búsqueda de un espacio tan vasto de posibilidades dentro de las escalas de tiempo humano requiere un cálculo potente y rápido. Hasta hace poco, eso no estaba disponible, lo que hacía que la tarea fuera prácticamente insondable.
Pero en los últimos años, la IA ha cambiado el juego. Los algoritmos de aprendizaje profundo son excelentes para encontrar rápidamente patrones en una gran cantidad de datos, lo que ha acelerado los procesos clave en el descubrimiento científico. Ahora, junto con estas mejoras de software, una revolución de hardware también está en el horizonte.
Ayer Argonne Anunciado que ha comenzado a probar una nueva computadora de la startup Cerebras que promete acelerar el entrenamiento de algoritmos de aprendizaje profundo por órdenes de magnitud. La computadora, que alberga el chip más grande del mundo, es parte de una nueva generación de hardware especializado en inteligencia artificial que solo ahora se está utilizando.
"Estamos interesados en acelerar las aplicaciones de IA que tenemos para problemas científicos", dice Rick Stevens, director de laboratorio asociado de Argonne para informática, medio ambiente y ciencias de la vida. "Tenemos grandes cantidades de datos y grandes modelos, y estamos interesados en impulsar su rendimiento".
Actualmente, los chips más comunes utilizados en el aprendizaje profundo se conocen como unidades de procesamiento gráfico o GPU. Las GPU son excelentes procesadores paralelos. Antes de su adopción por el mundo de la IA, eran ampliamente utilizados para juegos y producción gráfica. Por coincidencia, las mismas características que les permiten renderizar píxeles rápidamente también son las que los convierten en la opción preferida para el aprendizaje profundo.
Pero fundamentalmente, las GPU son de uso general; Si bien han impulsado con éxito la revolución de IA de esta década, sus diseños no están optimizados para la tarea. Estas ineficiencias limitan la velocidad a la que los chips pueden ejecutar algoritmos de aprendizaje profundo y hacen que absorban enormes cantidades de energía en el proceso.
En respuesta, las compañías han corrido para diseñar nuevas arquitecturas de chips que sean especialmente adecuadas para la IA. Bien hecho, tales chips tienen el potencial de entrenar modelos de aprendizaje profundo hasta 1,000 veces más rápido que las GPU, con mucha menos energía. Cerebras se encuentra entre la larga lista de compañías que desde entonces han aprovechado la oportunidad. Otros incluyen startups como Graphcore, SambaNova y Groq, y operadores tradicionales como Intel y Nvidia.
Un nuevo chip de IA exitoso tendrá que cumplir varios criterios, dice Stevens. Como mínimo, debe ser 10 o 100 veces más rápido que los procesadores de uso general cuando se trabaja con los modelos de IA del laboratorio. Muchos de los chips especializados están optimizados para aplicaciones comerciales de aprendizaje profundo, como la visión por computadora y el lenguaje, pero pueden no funcionar tan bien cuando se manejan los tipos de datos comunes en la investigación científica. "Tenemos muchos conjuntos de datos de dimensiones superiores", dice Stevens, conjuntos que entrelazan fuentes de datos dispares masivas y que son mucho más complejos de procesar que una foto bidimensional.
El chip también debe ser confiable y fácil de usar. "Tenemos a miles de personas haciendo aprendizaje profundo en el laboratorio, y no todos somos programadores ninjas", dice Stevens. "¿Pueden las personas usar el chip sin tener que pasar tiempo aprendiendo algo nuevo en el lado de la codificación?"
Hasta ahora, la computadora de Cerebras ha marcado todas las casillas. Gracias a su tamaño de chip, es más grande que un iPad y tiene 1,2 billones de transistores para hacer cálculos, no es necesario conectar varios procesadores más pequeños, lo que puede ralentizar el entrenamiento del modelo. En las pruebas, ya ha reducido el tiempo de entrenamiento de las modelos de semanas a horas. "Queremos poder entrenar estos modelos lo suficientemente rápido para que el científico que está haciendo el entrenamiento aún recuerde cuál era la pregunta cuando comenzaron", dice Stevens.
Inicialmente, Argonne ha estado probando la computadora en su investigación de drogas contra el cáncer. El objetivo es desarrollar un modelo de aprendizaje profundo que pueda predecir cómo un tumor podría responder a un medicamento o una combinación de medicamentos. El modelo se puede utilizar de dos maneras: para desarrollar nuevos candidatos a fármacos que podrían tener los efectos deseados en un tumor específico, o para predecir los efectos de un único candidato a fármaco en muchos tipos diferentes de tumores.
Stevens espera que el sistema de Cerebras acelere drásticamente tanto el desarrollo como el despliegue del modelo de medicamento contra el cáncer, lo que podría implicar capacitar al modelo cientos de miles de veces y luego ejecutarlo miles de millones más para hacer predicciones sobre cada candidato a medicamento.
También espera que impulse la investigación del laboratorio en otros temas, como los materiales de la batería y las lesiones cerebrales traumáticas. El primer trabajo implicaría desarrollar un modelo de IA para predecir las propiedades de millones de combinaciones moleculares para encontrar alternativas a la química de iones de litio. Esto último implicaría desarrollar un modelo para predecir las mejores opciones de tratamiento. Es una tarea sorprendentemente difícil porque requiere el procesamiento de muchos tipos de datos [imágenes del cerebro, biomarcadores, texto] muy rápidamente.
En última instancia, Stevens está entusiasmado con el potencial que la combinación de avances de software y hardware de inteligencia artificial traerá a la exploración científica. "Va a cambiar drásticamente la forma en que ocurre la simulación científica", dice.
Para recibir más historias como esta directamente en su bandeja de entrada, Regístrate para nuestro boletín de IA nominado por Webby The Algorithm. Es gratis.