In apertura della GTC 2020 NVIDIA, attraverso il suo fondatore e CEO Jensen Huang, ha annunciato la GPU per data center di nuova generazione denominata A100.
Questo chip, come sottolinea il gigante californiano della computer graphics, è il primo processore grafico basato sull'architettura grafica di nuova generazione denominata Ampere.
Rispetto alle soluzioni appartenenti alla generazione precedente, basate sull'architettura Turing, il nuovo A100 promette un boot prestazionale quantificabile fino a 20 volte. Più in generale, in accordo a NVIDIA, l'architettura Ampere rappresenta un salto in termini di performance mai registrato con le precedenti otto generazioni.
L'analisi dei dati, l'elaborazione scientifica, la grafica su cloud, oltre alle applicazioni orientate all'AI e all'inferenza, sono alcuni tra i principali campi di applicazione della GPU A100.
Che è stata già scelta da un ampio set di player di primo piano, tra cui Alibaba Cloud, Amazon Web Services (AWS), Atos, Baidu Cloud, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Google Cloud, H3C, Hewlett Packard Enterprise (HPE), Inspur, Lenovo, Microsoft Azure, Oracle, Quanta/QCT, Supermicro e Tencent Cloud.
Il processore grafico Ampere A100 contiene oltre 54 miliardi di transistor (ed in quanto tale è il più grande processore realizzato con il nodo a 7nm), include i tensor core di terza generazione, supporta la funzionalità Multi-instance GPU (MIG) e la tecnologia di interconnessione tra GPU denominata NVIDIA NVLink di terza generazione.
E' interessante notare che la tecnologia MIG, se abbinata a software compatibile, consente di "suddividere" la GPU in più GPU meno potenti (fino a 7), ciascuna delle quali può essere utilizzata per uno specifico task computazionale. L'effetto netto è l'ottimizzazione dell'utilizzo delle risorse.
[Risorse correlate]