Cuando NVIDIA dio a conocer en marzo de este año su chip B200 para aplicaciones de inteligencia artificial (IA) era evidente que tenía entre manos una auténtica bestia. Sus características son de las que quitan el hipo: 208.000 millones de transistores, arquitectura Blackwell de última generación, 20 petaFLOPS máximos de rendimiento en operaciones FP4 si está acompañado de refrigeración líquida, puede trabajar codo con codo con un mapa de memoria de hasta 192 GB de VRAM y alcanza un ancho de banda de 8 TB/s.
Es evidente que con estas especificaciones el Departamento de Comercio de EEUU liderado por Gina Raimondo no va a permitir a NVIDIA vender esta GPU en China. En cualquier caso, esa es harina de otro costal. Presumiblemente la compañía de Jensen Huang comenzará la producción a gran escala del chip B200 durante el cuarto trimestre de 2024, por lo que las primeras entregas de esta GPU se llevarán a cabo antes de que finalice este año. No obstante, la producción de este chip no ha sido en absoluto pan comido para NVIDIA.
La fabricación ha sido complicada, pero al final el rendimiento encaja (según NVIDIA)
Las primeras unidades del chip B200 han tardado en llegar. NVIDIA ha confesado que el rendimiento de sus procesos de fabricación era inferior al esperado, lo que ha obligado a sus ingenieros a rediseñar algunas capas del chip con el propósito de subsanar un problema que podría demorar la entrega de las primeras unidades. "Nos vimos obligados a introducir un cambio en la máscara de la GPU Blackwell para mejorar el rendimiento de la producción", ha admitido NVIDIA en un comunicado.
"Nos vimos obligados a introducir un cambio en la máscara de la GPU Blackwell para mejorar el rendimiento de la producción"
Sea como sea parece que los cambios introducidos por los técnicos de la compañía en la máscara han funcionado. Como hemos visto unas líneas más arriba, la fabricación a gran escala de este chip arrancará durante el cuarto trimestre de este año. Y para ir abriendo boca NVIDIA ha publicado en su blog los primeros índices de rendimiento del chip B200. Sabíamos que iba a ser muy potente, y sí, estos primeros números reflejan que cuando llegue será sin lugar a dudas la GPU para IA más capaz del mercado. Es evidente que lo más prudente es que aceptemos los números de NVIDIA con cierto escepticismo, pero nos sirven para hacernos una idea aproximada de la capacidad de este chip.
Según los primeros resultados en MLPerf 4.1 el chip B200 multiplica por cuatro el rendimiento de su predecesora, la GPU H100 implementada sobre la microarquitectura Hopper. De ser así esta diferencia de rendimiento es una barbaridad. Además, el chip B200, de nuevo según NVIDIA, entrega 10.755 tókenes por segundo en una prueba de inferencia y 11.264 tókenes por segundo en un test de referencia offline. Podéis consultar todos los resultados en el artículo que ha publicado NVIDIA. Es evidente que la GPU B200 va a ser el chip para IA a batir, pero podemos estar seguros de que AMD, Huawei y otras compañías no tardarán en responder. Estaremos atentos.
Imagen | NVIDIA
Más información | NVIDIA
En Xataka | Huawei quiere devorar a NVIDIA en el mercado chino. Para lograrlo trabaja en una nueva GPU para IA
via Robótica e IA - Xataka https://ift.tt/Y8qhiDp
No hay comentarios:
Publicar un comentario