Quando a Nvidia lançou as GeForce RTX em 2018, seu material publicitário focava quase que exclusivamente na tecnologia de Ray Tracing (RT), a começar pela marca RTX. Com isso, o DLSS recebeu um tratamento superficial, quase como se fosse apenas um extra.
Comercialmente, a escolha foi acertada por ser um diferencial facilmente perceptível e mais simples de explicar. No entanto, utilizar o Ray Tracing sem o Deep Learning Super Sampling (DLSS) é, até hoje, uma experiência quase sempre desastrosa, em especial após o lançamento da versão 3.0.
O que é o DLSS 3.0?
Mais que o RT, as tecnologias de super resolução se tornaram cruciais para jogos modernos. Ainda que a maioria não tenha aderida à versão mais recente da Nvidia, muito disso se dá pela forma como o DLSS 3.0 se diferencia das implementações anteriores.
Até as GeForce RTX 3000, a tecnologia de super resolução trabalhava em duas grandes etapas. Para rodar um jogo em UHD, a resolução era inicialmente reduzida, geralmente para FullHD (1080p). Feito isto, os núcleos Tensor utilizavam algorítimos de previsão de píxeis e vetores de movimento para reconstruir a imagem em resoluções maiores.
Por acontecer em núcleos dedicados, esse redimensionamento desafoga GPU e CPU durante a renderização de imagens, dando ao sistema mais recursos para trabalhar em outras funções. Até aqui, este é o mesmo processo realizado pelas tecnologias FidelityFX (AMD) e XeSS (Intel Arc).
Tecnologia de super resolução até o DLSS 2 (atualmente na versão 2.5)Fonte: Nvidia
Já as novas GeForce RTX 4000 apresentaram os núcleos Tensor de 4ª geração. Graças aos novos componentes atualizados, o novo Deep Learning Super Sampling conta com funções mais robustas que, literalmente, criam quadros, em vez de simplesmente realizar upscale de imagens.
Como funciona o DLSS 3.0?
O DLSS 3.0 adiciona duas ferramentas a seu algoritmo: o Acelerador Óptico de Fluxo e a geração de múltiplos quadros a partir de um único. O processo inicial é o mesmo do software anterior, com a diferença de que a geração de novos quadros não se dá a partir das imagens reduzidas, mas sim das redimensionadas em até 4K.
Diagrama de operação do DLSS 3.0 combina super resolução com novos algorítmos previsãoFonte: Nvidia
Uma vez criados os frames, o acelerador de fluxo compara dois deles em sequência, capturando detalhes de cada píxel, diferenciando dados como partículas, reflexos, sombras, iluminação, além de apenas direção e velocidade. Munido dessas informações, o algoritmo prevê exatamente onde cada píxel estará nos próximos frames.
Acelerador Óptico de Fluxo das GeForce RTX 4000Fonte: Nvidia
Ao aplicar os resultados obtidos nessas etapas ao motor de geração de múltiplos quadros, os núcleos Tensor das placas RTX 4000 conseguem criar até 7 novos frames a partir de cada quadro já redimensionado, sem utilizar outros recursos do sistema.
Segundo a Nvidia, o incremento de desempenho é até quatro vezes superior ao de renderizações sem o DLSS, e pelo menos duas vezes se comparado à versão 2.5.
Novo marco a ser batido
O suporte a RT ainda é o foco de boa parte da publicidade de placas de vídeo modernas, sejam elas GeForce, Radeon ou as Arc, estreantes da Intel. Contudo, a principal vantagem da Nvidia sobre a concorrência está no DLSS 3.0.
O ganho de desempenho graças essa ferramenta criou um novo ponto de inflexão a todo o setor de GPUs, e não apenas as voltadas para jogos. Essas inovações já estão sendo aplicadas a produção e edição de vídeos, uma vez que conseguem operar auxiliando os encoders NVENC AV1.
A compatibilidade com novos codecs também permite sua utilização para melhorar o streaming de vídeos. Os navegadores Chrome e Edge já começaram a implementar essa funcionalidade para reproduzir em 4K vídeos antigos, em sua maioria ainda limitados a 480p (SD).
Como isso ocorre exclusivamente em um pós-processamento ao nível de hardware, a banda utilizada para carregar os vídeos é consideravelmente menor do que a reprodução nativa em 4K. O resultado é um streaming com carregamento mais rápido, transmissão mais fluida, e consumo reduzido de dados.
Super resolução aplicada fora dos jogosFonte: Nvidia
A Intel entrou agora no mercado de GPUs, e a tecnologia XeSS de aceleração via IA ainda está dando seus primeiros passos. A AMD, por sua vez, lançou a arquitetura RDNA 3 com as placas Radeon RX 7000. Entretanto, a julgar pelos benchmarks, o foco da geração foi mais em processamento bruto do que na tecnologia FidelityFX.
Dessa forma, o DLSS 3.0 se tornou o principal ponto a ser batido pelas competidoras, e deu à Nvidia ao menos uma geração de vantagem em termos de potencial de escalonamento.
Tudo isso compensa o preço atual?
Atualmente, as GeForce RTX 4070 Ti mais baratas estão custando a partir de R$ 6 mil, dependendo do revendedor — ignorando o mercado cinza e sites de importação direta. Sendo assim, por enquanto não compensa, mas não por conta da tecnologia.
Placas compatíveis com DLSS 3 ainda são muito carasFonte: Kabum / Reprodução
A Nvidia quase sempre é uma das primeiras a apresentar novas tecnologias no setor de placas de vídeo. Além disso, existe o histórico na indústria dos primeiros modelos de cada empresa chegarem com preços muito elevados.
Apesar de questionável, a prática se justifica por mirar em consumidores entusiastas, com orçamentos mais generosos, e para maximizar lucros nos primeiros meses pós-lançamento, quando os estoques costumam ser reduzidos.
Conforme os line-up vão se expandindo, o preço de praticamente todas as placas da geração vão sendo reajustados. Tanto por isso, é esperado os modelos já disponíveis fiquem mais baratos ao longo do ano.
Por fim, vale ressaltar que as GeForce xx60 quase sempre trazem as inovações da geração, com diferença de frequências e contagem de núcleos. O esperado é que isso se repita com as RTX 4060 para desktop — ainda sem data oficial —, fazendo delas a melhor porta de entrada para o novo divisor de águas das GPUs.