Cerebras Systems es una empresa estadounidense de inteligencia artificial con oficinas en Silicon Valley, San Diego, Toronto y Tokio [1] . Cerebras construye sistemas informáticos para aplicaciones complejas de IA que requieren un aprendizaje profundo [2] .
Cerebras fue fundada en 2015 por Andrew Feldman, Gary Lauterbach, Michael James, Sean Lee y Jean-Philippe Fricker [3] . Estos cinco fundadores trabajaron juntos en SeaMicro, que fue fundada en 2007 por Feldman y Lauterbach y luego fue vendida a AMD en 2012 por $334 millones [4] [5] .
En mayo de 2016, Cerebras recibió $ 27 millones en fondos de la Serie A liderados por Benchmark Foundation Capital y Eclipse Ventures [6] [3] . En diciembre de 2016, la financiación de la Serie B fue proporcionada por Coatu Management Llc, y en enero de 2017, la financiación de la Serie C fue proporcionada por VY Capital [3] . En noviembre de 2018, Cerebras cerró su ronda Serie D con $88 millones, convirtiendo a la empresa en un unicornio Los inversores en esta ronda incluyeron Altimeter, VY Capital, Coatue, Foundation Capital, Benchmark y Eclipse [7] [8] .
El 19 de agosto de 2019, Cerebras anunció su Wafer-Scale Engine (WSE) [9] [10] [11] . En noviembre de 2019, Cerebras cerró la ronda de la Serie E con más de 270 millones de dólares a una valoración de 2400 millones de dólares [12] .
En 2020, la empresa anunció la apertura de una oficina en Japón y una asociación con Tokyo Electron Devices.
En abril de 2021, Cerebras anunció CS-2 basado en Wafer Scale Engine Two (WSE-2) que tiene 850 000 núcleos [1] . En agosto de 2021, la empresa anunció su tecnología de escalado de computación neuronal, que puede gestionar una red neuronal con más de 120 billones de conexiones [13] .
El motor de escala de obleas de Cerebras (WSE) es un único procesador integrado a escala de obleas de silicio que incluye recursos informáticos, memoria y estructura de interconexión [14] . WSE-1 es la base de Cerebras CS-1, la computadora de inteligencia artificial de primera generación de Cerebras. Este dispositivo montado en bastidor de 19 pulgadas está diseñado para entrenar IA y admitir la computación operativa basada en redes neuronales en centros de datos [10] . El CS-1 incluye una CPU WSE con 400 000 núcleos de procesador, así como doce conexiones de 100 Gigabit Ethernet para transmisión y transferencia de datos [10] [15] . WSE-1 incluye 1,2 billones de transistores, 400 000 núcleos de procesamiento y 18 gigabytes de RAM [9] [10] [11] .
En abril de 2021, Cerebras anunció el sistema de inteligencia artificial CS-2 basado en el motor de escala de oblea de segunda generación (WSE-2) fabricado en el proceso de 7 nm de TSMC [1] . El complejo informático mide 26 pulgadas de alto y cabe en un tercio de un rack de centro de datos estándar [16] . El procesador Cerebras WSE-2 tiene 850.000 núcleos, 2,6 billones de transistores se colocan en la placa del procesador. WSE-2, en comparación con la versión anterior, amplió la cantidad de SRAM en el chip a 40 gigabytes, el ancho de banda de la memoria a 20 petabytes por segundo y el ancho de banda total de la fábrica de conexiones a 220 petabits por segundo.
En agosto de 2021, la empresa anunció su solución de escalado de neurocomputación, que combina múltiples circuitos integrados (comúnmente denominados "chips") en una red neuronal con múltiples conexiones. Esto permite que un solo sistema admita modelos de IA con más de 120 billones de parámetros. Esta solución incluye cuatro innovaciones: Cerebras Weight Streaming, una nueva arquitectura de ejecución de software; Cerebras MemoryX, tecnología de expansión de memoria; Cerebras SwarmX, un tejido de comunicaciones optimizado por IA; y Selectable Sparity, una tecnología para la recolección dinámica de partículas dispersas.
Según se informa, las tecnologías de Cerebras son utilizadas por clientes en los sectores farmacéutico y de ciencias de la vida.
En 2020, GlaxoSmithKline (GSK) comenzó a utilizar el sistema de inteligencia artificial Cerebras CS-1 en su centro de inteligencia artificial de Londres para el modelado de redes neuronales a fin de acelerar la investigación genética y genómica y reducir el tiempo que lleva descubrir fármacos. El equipo de investigación de GSK pudo aumentar la complejidad de los modelos de codificador que podían generar mientras reducían el tiempo de capacitación. Otros clientes de la industria farmacéutica incluyen a AstraZeneca , que pudo reducir el tiempo de capacitación de dos semanas en un clúster de GPU a dos días con Cerebras CS-1.
El Laboratorio Nacional de Argonne ha estado utilizando CS-1 desde 2020 en la investigación de COVID-19 y el cáncer según la base de datos de tratamiento del cáncer más grande del mundo. Una serie de modelos ejecutados en CS-1 para predecir la respuesta de los medicamentos contra el cáncer a los tumores lograron aceleraciones cientos de veces más rápidas en CS-1 que el rendimiento de referencia de la GPU .
La supercomputadora Lassen del Laboratorio Nacional Lawrence Livermore ha utilizado el CS-1 para tareas de modelado físico clasificadas y no clasificadas.
En agosto de 2021, Cerebras anunció una asociación con la empresa de plataformas de biotecnología Peptilogics para desarrollar soluciones de inteligencia artificial para acelerar el ciclo de desarrollo de terapias de péptidos.