El campo de la inteligencia artificial (IA) está experimentando un cambio radical y actores importantes como Nvidia, Intel y Google están compitiendo para estar a la vanguardia de esta revolución.
Los recientes puntos de referencia de MLPerf Training 3.1 han brindado una breve mirada a la intensa competencia entre estos gigantes tecnológicos, mostrando ganancias sin precedentes en la capacitación de modelos de lenguaje grande (LLM). En el primer trimestre de 2023, Nvidia, Intel y Google dieron a conocer su red neuronal de IA. Sistemas para tareas de aprendizaje profundo. Al final del año, el informe muestra que las empresas han administrado pruebas para demostrar sus niveles de logro.
Los puntos de referencia MLPerf se han convertido recientemente en un campo de batalla para demostrar los avances en la formación de LLM. Anteriormente dominada por las predicciones de la Ley de Moore, la industria de la IA ahora está escalando hardware y software a un ritmo que supera las proyecciones tradicionales.
Muchos expertos afirman que la Ley de Moore está desapareciendo poco a poco, por lo que es probable que los nuevos descubrimientos de Nvidia, Intel y Google resulten útiles.
El dominio de la supercomputadora EOS de Nvidia
Nvidia, un fiel defensor del panorama de la IA, presentó recientemente su supercomputadora EOS, una maravilla tecnológica con 10.752 GPU conectadas a través de Nvidia Quantum-2 InfiniBand. En los puntos de referencia MLPerf Training 3.1, Nvidia logró una asombrosa mejora de 2,8 veces en la velocidad de entrenamiento LLM para su modelo GPT-3 desde junio.
Las tareas incluyeron resumen, traducción, clasificación y generación de contenido nuevo, como código de computadora, textos de marketing, poesía y más.
Las alucinantes especificaciones del sistema EOS, que incluyen más de 40 exaflops de procesamiento de IA, subrayan el compromiso de Nvidia de superar los límites de la IA.
El gran avance del acelerador Gaudi 2 de Intel
Intel logró avances significativos con su acelerador Habana Gaudi 2, aprovechando una combinación de técnicas, incluido el uso de tipos de datos de punto flotante de 8 bits (FP8).
Los resultados hablan por sí solos: se observa un notable aumento del rendimiento de la velocidad de entrenamiento del 103 % con respecto a los puntos de referencia MLPerf de junio. El enfoque estratégico de Intel en las métricas de relación precio-rendimiento lo posiciona como un competidor formidable en el panorama del entrenamiento de IA.
“Proyectamos una ganancia del 90 por ciento con la implementación del FP8”, dijo Eitan Medina, director de operaciones de los laboratorios Habana de Intel. “Entregamos más de lo prometido: una reducción del 103 por ciento en el tiempo de entrenamiento para un grupo de 384 aceleradores”.
TPU v5e de Google Cloud y capacidades de escalabilidad
Asimismo, Google, con su Cloud TPU v5e, ha entrado en la competición mostrando sus capacidades de escalado. Utilizando FP8 para un rendimiento de entrenamiento óptimo, Google destacó su tecnología de escalado multislice, que permite un escalado impresionante de hasta 1.024 nodos con 4.096 chips TPU v5e.
El compromiso de Google con la escalabilidad eficiente lo posiciona actualmente como un actor clave en la carrera por el dominio de la IA, ya que la empresa nunca deja de optimizar su software. La intensa competencia entre Nvidia, Intel y Google en el campo de la capacitación en IA está cambiando el futuro de la inteligencia artificial. A medida que amplían los límites de la capacitación LLM, estos gigantes tecnológicos no solo están superando las predicciones de la Ley de Moore, sino que también están impulsando la industria hacia territorios inexplorados. Los resultados de esta competencia, sin duda, influirán en la trayectoria del desarrollo de la IA y allanarán el camino para avances transformadores en el campo.
El informe comparativo de entrenamiento de MLPerf revela que Nvidia, Intel y Google compiten por el dominio de la IA generativa apareció primero en Metaverse Post.
