O novo modelo QwQ-32B da Alibaba reduz requisitos de computação e alcança DeepSeek-R1

Leandro Lopes
3 Min de Leitura
O novo modelo QwQ-32B da Alibaba reduz requisitos de computação e alcança DeepSeek-R1

A equipe Qwen, ligada à gigante chinesa de e-commerce Alibaba, lançou o modelo QwQ-32B. Com 32 bilhões de parâmetros, este modelo foi desenvolvido para resolver problemas complexos usando aprendizado por reforço.

O QwQ-32B está disponível sob licença Apache 2.0, permitindo seu uso tanto comercial quanto acadêmico. Empresas podem utilizá-lo em produtos e serviços, enquanto usuários individuais têm acesso ao modelo através do Qwen Chat.

Evolução do modelo QwQ

Introduzido pela Alibaba em novembro de 2024, o QwQ, abreviação de Qwen-with-Questions, foi projetado para concorrer com o modelo o1-preview da OpenAI. Desde sua versão inicial, o QwQ se destacou em benchmarks matemáticos e tarefas científicas, embora tenha enfrentado desafios em programação e questões de mistura de idiomas.

Com o avanço dos modelos focados em raciocínio, como o DeepSeek-R1, a Alibaba aprimorou o QwQ-32B, estendendo seu comprimento de contexto para 131.000 tokens. Isso permite lidar com entradas maiores e mais complexas.

Leia mais sobre como a IA está transformando o mercado no artigo sobre Manus, o novo sistema de IA da China.

Treinamento e desempenho do modelo

O QwQ-32B utiliza uma abordagem de treinamento em múltiplas etapas, focando em:

  1. Matemática e programação: Verificação de precisão nas respostas geradas.
  2. Capacidades gerais: Melhoria de alinhamento humano e raciocínio em geral.

O modelo foi comparado a alternativas maiores, como DeepSeek-R1, demonstrando eficiência superior com menor consumo de recursos. Ele requer apenas 24 GB de vRAM em GPUs, enquanto o DeepSeek-R1 demanda mais de 1500 GB.

Saiba mais sobre o impacto do DeepSeek e como ele mudou o setor no artigo DeepSeek: Impacto e Inovação na Inteligência Artificial.

Aplicações empresariais

Para líderes empresariais, o QwQ-32B oferece insights contextuais e estruturados, tornando-o útil para análise de dados, planejamento estratégico e automação inteligente. Sua licença aberta permite personalização sem restrições, sendo uma opção flexível para várias indústrias.

Empresas que buscam alternativas eficientes ao DeepSeek-R1 podem encontrar no QwQ-32B uma solução promissora. Explore mais no artigo OpenAI Responde à Concorrência do DeepSeek.

Próximos passos da equipe Qwen

A equipe Qwen pretende expandir o uso de aprendizado por reforço, integrando agentes capazes de raciocínio de longo prazo e desenvolvendo modelos ainda mais avançados para alcançar inteligência artificial geral (AGI).

Compartilhe