NVIDIA lidera el mercado de las GPU para inteligencia artificial (IA) con una cuota de mercado aproximada del 80%, pero no es en absoluto la única empresa que tiene en su porfolio chips de vanguardia para IA. La compañía californiana Cerebras posee, de hecho, los procesadores para este escenario de uso más complejos que existen. Su chip WSE-2, por ejemplo, aglutina nada menos que 2,6 billones de transistores contabilizados en la escala numérica larga y 850.000 núcleos optimizados para IA.
Cerebras entrega a sus clientes estos procesadores integrados en una plataforma para IA conocida como CS-2, y precisamente uno de ellos es la compañía de Emiratos Árabes G42. Esta última está construyendo seis superordenadores para IA capaces de superar la barrera de la exaescala que aglutinan una gran cantidad de sistemas CS-2. Y según la CIA algunas de estas máquinas irán a parar a las grandes tecnológicas chinas. No obstante, esto no es todo. Y es que Cerebras acaba de dar a conocer un procesador para IA aún más potente que su WSE-2.
El procesador WSE-3 es tan potente como 62 GPU H100 de NVIDIA
Cerebras ya tiene listo su procesador WSE-3 (Wafer Scale Engine 3), un producto que, como podemos intuir, está llamado a suceder al también ambicioso WSE-2. Ambos procesadores se fabrican a partir de una oblea completa de silicio, como podemos ver en la imagen de portada de este artículo, lo que permite a Cerebras integrar muchos más bloques funcionales y núcleos en la lógica que una GPU convencional como las que fabrican NVIDIA, AMD o Huawei. Las cifras de este procesador son de las que quitan el hipo.
El procesador WSE-3 aglutina 4 billones de transistores, integra 900.000 núcleos optimizados para IA y tiene una potencia de cálculo de 125 petaflops
Y es que aglutina 4 billones de transistores (billones de los nuestros, no de los anglosajones, en escala numérica larga); tiene una superficie de 46.225 mm², integra nada menos que 900.000 núcleos optimizados para IA y tiene una potencia de cálculo, según Cerebras, de 125 petaflops. Lo dicho; es indiscutiblemente una auténtica bestia.
Otro dato interesante: este procesador se lo está fabricando a Cerebras TSMC utilizando su tecnología de integración de 5 nm. Este fabricante de semiconductores taiwanés tiene nodos más avanzados, pero posiblemente no están optimizados para producir procesadores del tamaño de una oblea.
Según Cerebras su procesador WSE-3 es el doble de potente que el WSE-2. De hecho, de acuerdo con las especificaciones que ha publicado rinde como 62 GPU H100 de NVIDIA trabajando al unísono, y no debemos pasar por alto que este procesador de la compañía liderada por Jensen Huang es el más potente que tiene hasta que se produzca el lanzamiento de la GPU H200.
Sea como sea Cerebras entrega sus procesadores WSE-3 integrados en un superordenador conocido como CS-3 que es capaz de entrenar grandes modelos de IA con hasta 24 billones de parámetros. El mapa de memoria externa de este superordenador oscila entre 1,5 TB y 1,2 PB, un espacio de almacenamiento descomunal que permite almacenar modelos de lenguaje masivos en un único espacio lógico.
Imagen | Cerebras
Más información | Cerebras
via Robótica e IA - Xataka https://ift.tt/wvykXKf
No hay comentarios:
Publicar un comentario