AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA

1 min de leitura
Imagem de: AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA
Imagem: AMD
Conteúdo oferecido por

Por muito tempo focada no mercado de hardware, a AMD vem mudando seus rumos e anunciou seu primeiro pequeno modelo de linguagem (SLM). Chamado de AMD-135M, a tecnologia foi criada para o corpo empresarial com o intuito de otimizar tarefas específicas.

Para realizar a otimização de tarefas, o AMD-135M utiliza uma técnica chamada de decodificação especulativa. Essa técnica realiza palpites sobre solicitações de tokens futuros enquanto gera os tokens atuais na linha de processamento, tornando todo o processo mais lógico.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Segundo a companhia, o 135M foi treinado do zero com 670 bilhões de tokens de dados. Esse processo levou cerca de seis dias utilizando quatro aceleradores de IA Instinct MI250, e a AMD ainda refinou o modelo com 20 bilhões de tokens focados em codificação.

Mesmo com foco em IA, produção de processadores na AMD continua forte.Mesmo com foco em IA, produção de processadores na AMD continua forte.Fonte:  AMD 

Mudança de postura

Vale reiterar que a primeira SLM da AMD possui variantes: a AMD-Llama-135M e a AMD-Llama-135M-Code. Como o nome sugere, esses modelos de linguagem são baseados na família Llama e foram criados para atender as necessidades dos clientes da companhia que precisavam de novos modelos pré-treinados.

O lançamento do modelo também mostra a mudança completa de postura da AMD. Recentemente, a companhia liderada por Lisa Su confirmou que centrará seus esforços no desenvolvimento de soluções para inteligência artificial, e dará menos foco para as placas de vídeo gamer.

Isso não significa que o time vermelho acabará com a fabricação de GPUs, mas a tendência é que a AMD rivalize ainda mais com a Nvidia no que diz respeito a softwares e outras tecnologias.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.