Durante uma apresentação na GPU Technology Conference (GTC) 2017, o fundador e CEO da NVIDIA, Jensen Huang, revelou oficialmente a poderosa nova arquitetura computacional da empresa. Chamada Volta, a novidade foi empregada em um poderoso processador gráfico anunciado na ocasião, o Tesla V100.
A companhia promete que a nova GPU será capaz de trazer níveis inéditos de velocidade e escalabilidade para servidores utilizados no treinamento e aplicação de inteligências artificiais. Além disso, o equipamento também consegue acelerar consideravelmente as cargas de trabalhos HPC e de gráficos.
Superando a Lei de Moore
A Volta é a sétima geração de arquiteturas de GPUs da NVIDIA e chega trazendo 21 bilhões de transistores, além de nada menos do que 5.120 núcleos CUDA. Esses números conseguem fazer a placa alcançar nada menos do que 7,5 TFLOPs em 64 Floating Points e 15 TFLOPs em 32. Na prática, a empresa diz que isso significa que a novidade consegue entregar o equivalente ao desempenho de 100 CPUs com relação a deep learning.
Especificações da nova GPU Tesla V100, com a arquitetura Volta
A nova arquitetura consegue atingir um pico de TFLOPs cinco vezes maior do que a geração anterior, a Pascal, e quinze vezes superior à de 2 anos atrás, a Maxwell. Esse aumento de performance é mais do que o quádruplo do que seria possível de acordo com a Lei de Moore. Isso é possível em parte graças à integração dos núcleos CUDA com outra tecnologia da NVIDIA, os Tensor Cores.
No total, a Tesla V100 vem equipada com 640 núcleos Tensor, que foram desenvolvidos especificamente para acelerar o trabalho com dados relacionados a IA. Somando-se a isso, a GPU conta com 16 GB de DRAM HMB2, capazes de trabalhar com velocidades de até 900 GB por segundo, e também utiliza a tecnologia NVLink para acelerar o fluxo de informações entre as GPUs e até entre elas e a CPU.
Processo complexo e caro
A Tesla V100 foi produzida com o processo FinFET de 12 nm e teve um custo de desenvolvimento de US$ 3 bilhões
Durante a conferência, Huang falou sobre como a Lei de Moore simplesmente não permitia que os avanços tecnológicos da área de processamento seguisse no mesmo passo acelerado que tinham antigamente. Agora, com o processamento via GPUs, o executivo da NVIDIA diz que a empresa é capaz de oferecer o poder de que precisamos hoje para levar adiante a chamada “era do aprendizado das máquinas”.
“O deep learning tem uma demanda insaciável por capacidade de processamento. Milhares de engenheiros da NVIDIA passaram 3 anos trabalhando na Volta para atender essa necessidade, permitindo à indústria atingir o potencial da inteligência artificial de mudar nossas vidas”, concluiu Huang.
Produzida com o processo de 12 nm FinFET e com um investimento de pesquisa e desenvolvimento de US$ 3 bilhões, a Tesla V100 é definida como o projeto mais complexo já assumido pela companhia. A nova placa tem previsão de lançamento já no terceiro trimestre de 2017.
Categorias