HWSETUP.IT | Mobile Edition | News | NVIDIA dettaglia l'architettura grafica per GPU di nuova generazione Volta

NVIDIA dettaglia l'architettura grafica per GPU di nuova generazione Volta

11.05.2017 - NVIDIA dettaglia l'architettura grafica per GPU di nuova generazione Volta

Alla GPU Technology Conference (GTC) 2017 NVIDIA ha annunciato l'architettura per GPU di nuova generazione denominata Volta, destinata a sostituire progressivamente gli attuali prodotti Pascal sia in ambito enterprise che consumer. Più in dettaglio, NVIDIA ha mostrato una board in formato SXM2 che implementa l'acceleratore Tesla V100 ed è equipaggiata con la GPU Volta GV100.

La GPU GV100 è fabbricata con un processo a 12nm ed è parte di un modulo multi-chip; il die della GPU, che integra 21.1 milioni di transistor, ha un'area pari a 815mm². La GPU è circondata da quattro stack di memoria HBM2 a 1GHz che scambiano dati con il processore grafico attraverso un bus a 4096-bit e rendono disponibile una capacità complessiva pari a 16GB.

In accordo a NVIDIA, l'architettura Volta prevede, rispetto alla precedente Pascal, il ricorso a unità Streaming Multiprocessor (SM) rivisitate in maniera considerevole. Ogni blocco SM, infatti, include sia core CUDA FP32 che core CUDA FP64 (anche se questi ultimi potrebbero non essere presenti nelle implementazioni per il mercato consumer, ovvero nelle GPU per le GeForce next gen). Ogni core CUDA FP64 è in grado di eseguire anche operazioni a 32-bit, 16-bit e 8-bit.

La versione completa della GPU Volta GV100 destinata al mercato enterprise, e in particolare agli ambiti del deep-learning e delle reti neurali, integra 80 SM, 320 TMU, 5120 core CUDA FP32 e 2560 core CUDA FP64. Il valore massimo della frequenza di clock del core grafico con GPU Boost è pari a 1455MHz.

In accordo a NVIDIA, inoltre, la board Tesla V100 offre prestazioni nettamente superiori, ovvero fino al 50% sia in ambito FP32 che FP64, a quelle ottenibili con la board Tesla P100, che utilizza invece una architettura realizzata in accordo all'architettura grafica Pascal. In termini di valori di picco i throughput misurati con Tesla V100 sono pari rispettivamente a 15 TFLOP/s e a 7.5 TFLOP/s negli ambiti FP32 e FP64.

Collegamenti

News successiva

Pagina precedente

Pagina successiva

Versione per desktop di HWSetup.it