Il campo dell'intelligenza artificiale (IA) sta attraversando un cambiamento epocale e i principali attori come Nvidia, Intel e Google stanno gareggiando per essere in prima linea in questa rivoluzione.
I recenti benchmark MLPerf Training 3.1 hanno fornito una breve panoramica dell'intensa competizione tra questi giganti della tecnologia, evidenziando guadagni senza precedenti nella formazione di modelli linguistici di grandi dimensioni (LLM). Nel primo trimestre del 2023, Nvidia, Intel e Google hanno presentato i loro sistemi di reti neurali AI per attività di apprendimento profondo. Entro la fine dell'anno, il rapporto mostra che le aziende hanno somministrato test per dimostrare i loro livelli di conseguimento.
I benchmark MLPerf sono recentemente diventati un campo di battaglia per dimostrare i progressi nell'addestramento LLM. In precedenza dominati dalle previsioni della legge di Moore, l'industria dell'IA sta ora scalando hardware e software a un ritmo che supera le proiezioni tradizionali.
Un certo numero di esperti afferma che la legge di Moore sta lentamente venendo meno, quindi nuove scoperte da parte di Nvidia, Intel e Google sono probabilmente attese con interesse.
Dominio del supercomputer EOS di Nvidia
Nvidia, un pilastro nel panorama dell'IA, ha recentemente svelato il suo supercomputer EOS, una meraviglia tecnologica con 10.752 GPU collegate tramite Nvidia Quantum-2 InfiniBand. Nei benchmark di addestramento MLPerf 3.1, Nvidia ha raggiunto un miglioramento straordinario di 2,8 volte nella velocità di addestramento LLM per il suo modello GPT-3 da giugno.
I compiti includevano sintesi, traduzione, classificazione e generazione di nuovi contenuti come codice informatico, testi di marketing, poesia e altro.
Le specifiche sbalorditive del sistema EOS, inclusi oltre 40 exaflops di calcolo AI, sottolineano l'impegno di Nvidia nel superare i confini dell'IA.
Scoperta dell'acceleratore Gaudi 2 di Intel
Intel ha fatto progressi significativi con il suo acceleratore Habana Gaudi 2, sfruttando una combinazione di tecniche, inclusa l'uso di tipi di dati a virgola mobile a 8 bit (FP8).
I risultati parlano da soli, con un notevole aumento delle prestazioni di velocità di addestramento del 103% rispetto ai benchmark MLPerf di giugno. Il focus strategico di Intel su metriche di prezzo-prestazioni la posiziona come un concorrente formidabile nel panorama dell'addestramento dell'IA.
“Abbiamo previsto un guadagno del 90 percento passando a FP8”, ha dichiarato Eitan Medina, direttore operativo dei laboratori Habana di Intel. “Abbiamo consegnato più di quanto promesso: una riduzione del 103 percento nel tempo di addestramento per un cluster di 384 acceleratori.”
Le capacità di scalabilità e Cloud TPU v5e di Google
Allo stesso modo, Google con il suo Cloud TPU v5e, è entrato in competizione mostrando le sue capacità di scalabilità. Utilizzando FP8 per prestazioni ottimali di addestramento, Google ha evidenziato la sua tecnologia di scalabilità multislice, che consente una scalabilità impressionante fino a 1.024 nodi con 4.096 chip TPU v5e.
L'impegno di Google per una scalabilità efficiente la posiziona attualmente come un attore chiave nella corsa per il dominio dell'IA, poiché l'azienda non smette mai di ottimizzare il suo software. La intensa concorrenza tra Nvidia, Intel e Google nell'arena dell'addestramento dell'IA sta rimodellando il futuro dell'intelligenza artificiale. Mentre spingono i confini dell'addestramento LLM, questi colossi tecnologici non solo superano le previsioni della legge di Moore, ma stanno anche spingendo l'industria in territori inesplorati. I risultati di questa competizione influenzeranno senza dubbio la traiettoria dello sviluppo dell'IA e apriranno la strada a progressi trasformativi nel campo.
Il rapporto sul benchmark di addestramento MLPerf rivela che Nvidia, Intel e Google stanno correndo per il dominio dell'IA generativa è apparso per la prima volta su Metaverse Post.
