Nvidia acaba de anunciar RTX Spark: su tecnología de servidor de IA que llega a los consumidores con una CPU Grace (20 núcleos), una GPU Blackwell (6144 núcleos CUDA) y LPDDR5X de 128 GB. Ahora, aquí está el próximo desarrollo para servidores, y quizás algún día también para dispositivos de consumo.
La nueva CPU Vera es la mitad de la CPU de la plataforma Vera Rubin; la otra es la GPU Rubin. Vera promete una velocidad promedio 1,8 veces superior a la de las “CPU x86 líderes” (Nvidia no las nombra explícitamente).
Vera es enorme: tiene 88 núcleos Olympus (basados en el conjunto de instrucciones ARM) con Spatial Multithreading para 176 subprocesos por zócalo. Este procesador se puede combinar con hasta 1,5 TB de RAM LPDDR5X, que puede ofrecer un ancho de banda de 1,2 TB/s, lo cual es fundamental para la inferencia de IA.
Vera se puede utilizar como CPU independiente para cargas de trabajo de agentes de IA, aprendizaje por refuerzo, procesamiento de datos y análisis. Nvidia incluso ha diseñado el Vera CPU Rack, que tiene capacidad para 256 CPU para 22.528 núcleos y 45.056 subprocesos (vaya).
Alternativamente, Vera puede ser una CPU host utilizada junto con una GPU Rubin. Por ejemplo, la NVIDIA Vera Rubin NVL72 tiene 36 CPU Vera y 72 GPU Rubin. La CPU y la GPU pueden comunicarse entre sí a 1,8 TB/s mediante la interconexión Nvidia NVLink-C2C.
Nvidia ya ha conseguido clientes importantes: Anthropic (Claude), OpenAI (ChatGPT) y SpaceXAI (Grok) utilizarán CPU Vera, al igual que hiperescaladores como ByteDance, CoreWeave y Oracle Cloud Infrastructure.
Además, Dell, HP, Lenovo y Supermicro construirán sistemas de CPU Vera independientes. También: Asus, Compal, Foxconn, Gigabyte, Pegatron, Quanta Cloud Technology, Wistron y Wiwynn. Incluso la Bolsa de Nueva York está interesada: la NYSE procesó 1,1 billón pedido por día, por lo que están trabajando con Redpanda y HP para construir una nueva infraestructura.
Fuente



