Christofari (hasta 2021 - " Christofari ") - Christofari (2019), Christofari Neo (2021) supercomputadoras de Sberbank basadas en equipos Nvidia . El objetivo principal es entrenar redes neuronales , también se utiliza para investigación y cálculos comerciales [1] . Llevan el nombre de Nikolay Christofari , el primer cliente de Sberbank, que abrió una libreta de ahorros en él [2] . Incluido en la clasificación Top 500 .
Sberbank presentó supercomputadoras junto con su subsidiaria SberCloud [3] [4] . En diciembre de 2019, Sberbank y SberCloud lanzaron la supercomputadora Christofari en operación comercial [5] . Un año después, el poder de Christofari formó la base de la plataforma en la nube ML Space , diseñada para trabajar con modelos de aprendizaje automático , que Sberbank y SberCloud anunciaron en diciembre de 2020 [6] .
Una supercomputadora Christofari Neo más poderosa fue presentada en la conferencia internacional AI Journey en noviembre de 2021 por el CTO y vicepresidente ejecutivo de Sberbank, David Rafalovsky [4] . En 2022, el iniciador de la creación de las supercomputadoras abandonó el grupo de empresas Sber [7] .
Las supercomputadoras están diseñadas para organizaciones de investigación, comerciales y gubernamentales que operan en varios sectores de la economía. Su objetivo principal es trabajar con algoritmos de IA, entrenar redes neuronales e inferencia de varios modelos [8] .
Sber utiliza Christofari para tareas internas (reconoce el habla y genera la voz de un contestador automático en un centro de llamadas [9] ) y un servicio para reconocer imágenes de tomografía computarizada de los pulmones [10] . Y los equipos de SberDevices y Sber AI fueron los primeros en obtener acceso a Christofari Neo y desarrollaron el primer servicio basado en la red neuronal DALL-E, que crea imágenes bajo demanda en ruso [11] .
El poder de las supercomputadoras también se brinda a otras organizaciones al conectar los servicios de la plataforma en la nube SberCloud ML Space [12] .
Se basa en nodos Nvidia DGX-2 , equipados con aceleradores gráficos Tesla V100 [13] [14] , para la interconexión se utiliza una red Infiniband basada en equipos Mellanox . El rendimiento efectivo es de unos 6,7 petaflops , lo que convertía al sistema (en el momento de su puesta en servicio el 8 de noviembre de 2019) en el 40º del mundo, el séptimo de Europa y el primero de Rusia en cuanto a potencia [15] (indicadores del anterior Líder ruso - el Lomonosov -2 "- más del doble). Se destaca como la primera supercomputadora del mundo de una institución financiera, disponible para uso de terceros. También es la primera supercomputadora certificada en Rusia para trabajar con datos personales [16] .
Para la interconexión se utilizaron switches Mellanox de 36 puertos , soportando hasta cuatro conexiones InfiniBand EDR a una velocidad de 100 Gb/s [18] .
Casi toda la pila de aprendizaje automático utilizada se basa en el sistema operativo Ubuntu como plataforma base y, por lo tanto, se usa una versión de servidor especializada de Ubuntu 18.04 LTS compatible con Nvidia, que incluye controladores para aceleradores de gráficos, una pila de software de red, herramientas necesarias para el servicio. y diagnóstico de la máquina. También se incluye el software patentado de Nvidia CUDA Toolkit, cuDNN, NCCL y Docker Engine Utility para GPU de Nvidia (toda la pila de aprendizaje automático central se ejecuta en contenedores ).
Está ubicado en el centro de procesamiento de datos de Sberbank en el centro de innovación "Skolkovo" . Ocupa una sala de máquinas [19] , fue construido en menos de un año [20] .
La supercomputadora también se basa en tecnologías Nvidia y está equipada con GPU Nvidia A100 con 80 GB de memoria [23] . Para la interconexión se utiliza una red de conmutación Infiniband de alta velocidad, que proporciona tasas de intercambio de datos de hasta 1600 Gb/s por nodo de cómputo y retrasos mínimos. El rendimiento efectivo es de 11,95 petaflops [24] [25] .