A equipe Qwen, ligada à gigante chinesa de e-commerce Alibaba, lançou o modelo QwQ-32B. Com 32 bilhões de parâmetros, este modelo foi desenvolvido para resolver problemas complexos usando aprendizado por reforço.
O QwQ-32B está disponível sob licença Apache 2.0, permitindo seu uso tanto comercial quanto acadêmico. Empresas podem utilizá-lo em produtos e serviços, enquanto usuários individuais têm acesso ao modelo através do Qwen Chat.
Evolução do modelo QwQ
Introduzido pela Alibaba em novembro de 2024, o QwQ, abreviação de Qwen-with-Questions, foi projetado para concorrer com o modelo o1-preview da OpenAI. Desde sua versão inicial, o QwQ se destacou em benchmarks matemáticos e tarefas científicas, embora tenha enfrentado desafios em programação e questões de mistura de idiomas.
Com o avanço dos modelos focados em raciocínio, como o DeepSeek-R1, a Alibaba aprimorou o QwQ-32B, estendendo seu comprimento de contexto para 131.000 tokens. Isso permite lidar com entradas maiores e mais complexas.
Leia mais sobre como a IA está transformando o mercado no artigo sobre Manus, o novo sistema de IA da China.
Treinamento e desempenho do modelo
O QwQ-32B utiliza uma abordagem de treinamento em múltiplas etapas, focando em:
- Matemática e programação: Verificação de precisão nas respostas geradas.
- Capacidades gerais: Melhoria de alinhamento humano e raciocínio em geral.
O modelo foi comparado a alternativas maiores, como DeepSeek-R1, demonstrando eficiência superior com menor consumo de recursos. Ele requer apenas 24 GB de vRAM em GPUs, enquanto o DeepSeek-R1 demanda mais de 1500 GB.
Saiba mais sobre o impacto do DeepSeek e como ele mudou o setor no artigo DeepSeek: Impacto e Inovação na Inteligência Artificial.
Aplicações empresariais
Para líderes empresariais, o QwQ-32B oferece insights contextuais e estruturados, tornando-o útil para análise de dados, planejamento estratégico e automação inteligente. Sua licença aberta permite personalização sem restrições, sendo uma opção flexível para várias indústrias.
Empresas que buscam alternativas eficientes ao DeepSeek-R1 podem encontrar no QwQ-32B uma solução promissora. Explore mais no artigo OpenAI Responde à Concorrência do DeepSeek.
Próximos passos da equipe Qwen
A equipe Qwen pretende expandir o uso de aprendizado por reforço, integrando agentes capazes de raciocínio de longo prazo e desenvolvendo modelos ainda mais avançados para alcançar inteligência artificial geral (AGI).