(Fonte da imagem: Divulgação/AMD)
Há mais de sete anos a AMD elaborou uma estratégia de mercado arriscada. A companhia acreditava que as GPUs teriam cada vez mais importância no mundo da computação e, por isso, ela adquiriu a fabricante de chips gráficos ATI.
Logo que a fusão foi concluída, a AMD anunciou que o novo e mais ambicioso projeto seria o Fusion, um processador que traria uma poderosa GPU integrada. O chip foi prometido para 2008, mas problemas na arquitetura adiaram o lançamento apenas para 2011.
Apesar de poderoso, o primeiro “Fusion”, agora chamado de APU (de Accelerated Processing Unit), chegou trazendo muitas vantagens em relação aos processadores mais antigos da empresa. A segunda geração, Trinity, chegou em 2012 e veio trazendo uma série de melhorias no projeto original. O Richland — que é uma versão melhorada do Trinity — veio em seguida e continuou a expansão.
Agora, a terceira geração de APUs finalmente chega ao mercado: o Kaveri não é apenas um upgrade na arquitetura. O modelo é o primeiro processador a entregar a promessa inicial da AMD — feita ainda em 2006 — de trazer uma arquitetura completamente heterogênea para os computadores.
Especificações técnicas
Nova arquitetura: do que é feito o Kaveri?
O Kaveri é a terceira geração de processadores da AMD a utilizar a arquitetura Bulldozer batizada agora como Steamroller. Nesse processador, a AMD decidiu trabalhar com um processo de construção diferente, saindo dos 32 nm para 28 nm. Apesar de agora a frequência ser mais baixa, a densidade de transistores no interior do modelo quase dobrou: são 2,41 bilhões no novo modelo contra 1,3 bilhão no anterior (Richland)
A maioria desses transistores passou a incorporar a GPU, que ocupa a maior parte do interior do chip. A arquitetura da GPU, inclusive, agora é a Hawaii, a mesma das placas de vídeo Radeon R9 290X — as mais poderosas da fabricante atualmente. Com isso, o Kaveri passa a ser completamente compatível com a arquitetura GCN, com a adição de suporte ao HSA.
(Fonte da imagem: Divulgação/AMD)
Chamar os processadores atuais de dual-core, quad-core ou eight-core está ficando um pouco difícil, principalmente porque cada empresa utiliza o seu próprio critério. A AMD, por exemplo, unificou os componentes através do HSA e criou o que está chamando de Compute Core ou Núcleo de Computação. Esses núcleos podem ser de três tipos diferentes:
- Cada thread em uma CPU é um Núcleo de Computação;
- Cada Unidade de Computação no IGP é um Núcleo de Computação;
- Número total de Núcleos de Computação = CPU + IGP.
Grosso modo é possível dizer que o novo processador da AMD possui 12 Núcleos de Computação, ou seja, 8 Unidades de Computação GCN e mais 4 núcleos “tradicionais” Steamroller (8 GPU + 4 CPU = 12 NC).
A grande novidade introduzida pela AMD no Kaveri é o HSA – Heterogeneous Systems Architecture. Esse projeto vem sendo desenvolvido pela AMD desde que a empresa adquiriu a ATI e seus chips gráficos, e só agora é que tudo saiu do papel.
Arquitetura heterogênea? Mas o que isso significa?
O mundo da computação está passando por mudanças. O grande número de aplicações e dispositivos eletrônicos exige processadores cada vez mais poderosos e que consumam menos energia para funcionar. Esse tipo de desafio exige que os fabricantes desenvolvam continuamente arquiteturas mais eficientes.
O processador central (CPU) é o responsável por realizar uma série de tarefas diversas ao mesmo tempo, e ele faz isso com bastante eficiência. Apesar disso, com o passar do tempo as máquinas receberam novos tipos de processadores, estes com propósitos bem mais específicos que as tradicionais CPUs.
Um exemplo disso são as GPUs, presentes nas placas de vídeo. Esses chips dedicados foram criados para tirar dos ombros da CPU o processamento dos gráficos. O que acontece é que as GPUs acabaram ficando extremamente poderosas e eficientes em tarefas mais específicas, como a computação paralela, atividade que elas executam com ótima eficiência energética.
(Fonte da imagem: Divulgação/AMD)
Entretanto, esse sistema possui um problema básico: CPUs e GPUs foram feitas para trabalhar de forma separada e independente uma do outra, e colocar ambas para trabalhar no mesmo processo nem sempre é eficiente, principalmente porque quando a GPU executa uma tarefa, ela precisa enviar o resultado para a CPU (criando uma cópia na RAM) ou vice-versa. E esse tipo de atividade requer tempo, algo que acaba sacrificando desempenho dos processadores, e até tornando esse ganho em desempenho redundante em alguns casos.
E é importante notar que simplesmente colocar a GPU no mesmo encapsulamento da CPU não resolve esses problemas, pois isso só muda os componentes de lugar fisicamente. Para que o processamento dos dados seja eficiente é preciso criar um sistema também mais eficiente.
Para ilustrar bem essa situação, imagine dois trabalhadores em uma mesma empresa. Ambos trabalham juntos, mas cada um possui um escritório separado do outro. Sempre que um deles termina um relatório, ele precisa tirar uma cópia e levar até o seu colega para que este o analise.
HSAIL – HSA Intermediate Language (linguagem intermediária HSA)
E é justamente nesse ponto que entra a tecnologia HSA. A nova arquitetura propõe uma nova forma de integração entre CPU e GPU. O que ela faz é permitir que os dois processadores possam compartilhar os mesmos endereçamentos de memória, deixando que os processos utilizem o componente mais eficiente para a tarefa em questão. Esse tipo de sincronização de dados é a mesma utilizada por processadores de vários núcleos.
Com isso, elimina-se a necessidade de a GPU processar um dado e precisar reenviar o processo para a CPU, ou vice-versa. Vamos imaginar novamente aqueles dois trabalhadores, só que desta vez vamos visualizar ambos sentados na mesma sala, compartilhando a mesma mesa de trabalho, sendo que agora cada um deles pode ter acesso ao trabalho do outro quase que instantaneamente — não é mais preciso copiar o conteúdo para o outro. Desse modo, tudo não parece muito mais eficiente?
Mas para que esse sistema seja aproveitado é preciso que os softwares sejam escritos para esse tipo de hardware, e a ideia é fazer com que o software seja escrito para trabalhar com o HSA e não apenas com o hardware da AMD, o que seria ruim para os desenvolvedores.
É aí que entra a fundação HSA. Formada por diversas empresas, ela tem por objetivo desenvolver um padrão de mercado para que todos os sistemas sejam compatíveis entre si. Fazem parte dessa iniciativa empresas como AMD, ARM, Imagination Technologies, MediaTek, Texas Instruments, Samsung Electronics e Qualcomm.
(Fonte da imagem: Reprodução/HSA Foundation)
O objetivo principal da HSA é permitir que sejam integrados diversos tipos de elementos de computação (como CPUs e GPUs) de um modo que sejam eliminados os “gargalos” de comunicação entre os componentes. E isso acontece através do HSAIL, ou linguagem intermediária HSA.
O HSAIL é uma linguagem de tradução de baixo nível que fica entre o software e o hardware. Desse modo, tudo o que os desenvolvedores de softwares precisam fazer é escrever os aplicativos para o HSA, que ele se encarrega de dividir os processos adequadamente entre os componentes.
A ideia por trás disso é que o fardo de criar softwares otimizados para algum hardware específico saia das costas dos desenvolvedores e torne tudo muito mais eficiente.
Mas reprogramar tudo para trabalhar com o HSA — para que seja possível tirar proveito do hardware — pode significar um trabalho extra para os desenvolvedores. Para tentar amenizar essa situação, a AMD conseguiu adaptar o C++ e o OpenCL para o sistema, fazendo com que grande parte dos softwares possam aproveitar o recurso.
Novas ferramentas: TrueAudio e Mantle
A escolha da AMD em implementar a arquitetura Hawaii no interior da Kaveri rendeu alguns benefícios importantes ao processador. Um deles é o TrueAudio, um novo sistema de processamento de som desenvolvido pela AMD.
Segundo a empresa, os games atuais precisam de uma boa quantidade de processamento dedicado apenas para o áudio. Para garantir o realismo de uma cena de ação, por exemplo, o processador precisa dar conta de gerenciar explosões, tiros e demais efeitos sonoros na direção do jogador.
(Fonte da imagem: Divulgação/AMD)
Com uma parte do processador dedicada exclusivamente para esse tipo de cálculo, os núcleos principais ficam livres para processar informações mais importantes.
Além disso, a opção por incluir a arquitetura GCN no processador também garantiu a compatibilidade com o Mantle, a nova API de baixo nível criada pela AMD que, segundo a empresa, pode garantir uma melhora de até 45% em relação ao DirectX 11.
Para saber mais sobre o Mantle, clique aqui e aqui.
Máquinas utilizadas durante os testes
Intel
- Placa-Mãe: ASUS Z87-Plus;
- Memória: AMD Radeon Memory Gamer Series 2.133 MHz;
- SSD Samsung 256 GB Samsung 840 PRO Series.
AMD
- Placa-Mãe: ASUS AX88-Pro;
- Memória: AMD Radeon Memory Gamer Series 2.133 MHz;
- SSD Samsung 256 GB Samsung 840 PRO Series.
Jogos
Batman: Arkham Origins
Batman: Arkham Origins utiliza uma versão modificada da Unreal Engine 3 e DirectX 11 aliado a diversos efeitos especiais para garantir o visual. O game também aproveita o PhysX da NVIDIA para trazer recursos de física mais realistas.
Battlefield 4
Battlefield 4 utiliza a nova engine Frostbite 3 para trazer efeitos especiais e ambientes maiores e mais detalhados, incluindo muitas partículas, texturas de alta resolução e tessellation. Tudo isso através do DirectX 11.
BioShock Infinite
O terceiro BioShock utiliza uma versão altamente modificada da Unreal Engine 3 e foi refeito completamente do zero para garantir uma ótima experiência visual. O mundo do jogo é grande e repleto de efeitos visuais.
GRID 2
GRID 2 utiliza a engine EGO 3.0, desenvolvida pela Codemasters e presente em diversos games de corrida da desenvolvedora. O jogo apresenta efeitos visuais impressionantes, incluindo batidas, efeitos de fumaça luz e sombras.
Total War: Rome 2
Total War: Rome 2 é um game de estratégia que coloca centenas de personagens simultaneamente no mesmo campo de batalha: cenários enormes e repletos de detalhes como rios, pedras e vegetação precisam de uma máquina potente para serem renderizados com perfeição.
Tomb Raider
O reboot da série chegou com diversas novidades em relação aos games anteriores da série. O mundo aberto possui muitos lugares para serem explorados, e o título trabalha com texturas em alta definição e o recurso TressFX, que garante à protagonista do jogo cabelos incrivelmente detalhados.
Processamento gráfico
3DMark
O 3D Mark é, talvez, o mais conhecido software de benchmark do mercado. No mundo todo, pessoas utilizam esse software para medir o desempenho de suas máquinas. A versão que utilizamos é dividida em três categorias, e cada uma delas apresenta um nível de complexidade diferente.
Luxmark 2.0
O Luxmark pertence à suíte gráfica LuxRender. O que esse teste faz é simular uma série de efeitos de Ray tracing através da linguagem OpenCL.
CompuBench CL
Compubench é um software que utiliza o OpenCL para processar diversos algoritmos diferentes. Como a ferramenta é bastante completa, é possível testar tanto processadores quanto placas de vídeo.
Computacional
x264 HD Benchmark
O que esse aplicativo faz é testar a capacidade do computador em converter filmes em 1080p. No final, ele gera um relatório mostrando o desempenho do processador testado.
TrueCrypt
TrueCrypt é um aplicativo de criptografia de código aberto. A velocidade com que ele processa os dados é diretamente proporcional ao poder da CPU. Em nossos testes, utilizamos um buffer de 50 e encriptação AES.
Bitcoin
A moeda virtual que já tomou conta do mundo pode ser minerada por todos que possuem uma máquina com um hardware relativamente forte. Nós utilizamos um aplicativo que simula a mineração de Bitcoins para testar a capacidade dos processadores.
Resultados
A AMD prometeu jogos com qualidade média e resolução Full HD rodando na casa dos 30 FPS, e conseguimos comprovar tudo isso na prática. Comparando com os chips Intel Core i7 4770K e Core i5 4430 — ambos com o chip integrado Intel HD Graphics 4600 —, podemos notar um desempenho absolutamente superior do chip da AMD, superando os concorrentes em mais de 100% em alguns dos testes realizados.
Comparando as tarefas de computação pura da CPU, contudo, percebemos que o chip ainda perde um pouco em desempenho frente aos rivais da Intel. Entretanto, fica claro que em aplicativos otimizados para a arquitetura heterogênea essa diferença é muito maior para o lado da AMD, que tem uma arquitetura incrivelmente poderosa nas mãos. Isso pode ser comprovado através dos testes com o OpenCL.
Vale a pena?
Não existem dúvidas de que o HSA realmente é um passo importante na evolução dos microprocessadores. O ganho de desempenho obtido com a arquitetura é algo que não pode ser ignorado, e se a AMD conseguir — ao lado dos outros membros da fundação HSA — emplacar o modelo, a Intel precisará correr para alcançar a concorrente.
O Kaveri também apresenta resultados surpreendentes em termos de capacidade de renderização de vídeo. Para jogos, a CPU mostra-se incrivelmente capaz, e se você não faz questão de ter gráficos sempre com os detalhes no máximo, vai conseguir jogar sem precisar de uma GPU externa. Como CPU tradicional, o processador não impressionou, ficando atrás dos concorrentes da Intel em quase todas as categorias testadas, mostrando que a vantagem só existe quando os núcleos gráficos são utilizados.
O Mantle ainda não mostrou a que veio, mas tudo bem, ele ainda se encontra em estágio beta e não é suportado por muitos aplicativos. Contudo, percebemos que ele pode ser um grande diferencial no futuro, principalmente em chips gráficos menos potentes.
(Fonte da imagem: Acessoria/AMD)
Certamente o HSA será excelente para os games e terá um futuro brilhante pela frente, mas isso ainda precisa de algum tempo para acontecer. Softwares precisam ser escritos para tirarem proveito desse sistema, e isso pode demorar um pouco.
O Kaveri realmente é uma arquitetura que veio com força para brigar, e ela tem tudo para dar certo: um incrível potencial de desempenho e um preço incrivelmente competitivo. O modelo que testamos, o A10-7850K, pode ser encontrado no mercado americano por US$ 185 (cerca de R$ 442), praticamente o mesmo preço do core i5-4430 e, principalmente, mais barato que o i7-4770, que sai em média US$ 300 (cerca de R$ 716) na terra do Tio Sam.
Será que finalmente a AMD vai voltar a brigar pelo primeiro lugar no mercado de processadores?
Este produto foi cedido para análise pela AMD.
Categorias