朋友们,AI圈又双叒叕放大招啦!这次是阿里云的通义千问团队,他们开源了一个超级厉害的大模型——QwQ-32B!这可不是闹着玩的,QwQ-32B在多个测试中表现惊艳,甚至在某些方面超越了DeepSeek-R1!是不是听起来就很心动?别急,咱们这就来一探究竟!

一、QwQ-32B:不止是“能打”!

QwQ

QwQ-32B的实力可不是吹出来的,人家可是在一系列严格的基准测试中“过五关斩六将”的!下面咱们就来细数一下它的“战绩”:

  1. 数学、编程,样样精通!

    • 在AIME24(数学能力测试)和LiveCodeBench(代码能力测试)中,QwQ-32B的表现与DeepSeek-R1不相上下,远超o1-mini和同尺寸的其他模型。
    • 这意味着啥?意味着QwQ-32B不仅能帮你解数学题,还能帮你写代码!是不是感觉自己的“学渣”属性和“码农”生涯都有救了?
  2. 通用能力,更上一层楼!
    通用能力,更上一层楼!

    • 在LiveBench、IFEval和BFCL等测试中,QwQ-32B的得分甚至超过了DeepSeek-R1!
    • LiveBench是啥?那可是Meta首席科学家杨立昆领衔的“最难LLMs测评榜”!
    • IFEval是啥?那是谷歌等提出的指令遵循能力测试!
    • BFCL是啥?那是加州大学伯克利分校等提出的评估调用函数或工具方面的测试!
    • QwQ-32B能在这三大测试中脱颖而出,足以证明它在通用能力方面的强大实力!
  3. 强化学习,持续进化!

    • QwQ-32B的训练过程可不简单,它在冷启动的基础上,针对数学、编程和通用能力进行了两轮大规模强化学习。
    • 与其他模型不同的是,QwQ-32B在数学和编程任务的强化学习中,直接使用了“答案正确性”和“代码执行成功”作为反馈,而不是传统的奖励模型。
    • 这种方法的好处是啥?那就是训练效果更直接、更有效!
    • 而在通用能力的强化学习中,QwQ-32B则使用了通用奖励模型和基于规则的验证器进行训练。
    • 这种“双管齐下”的训练方式,让QwQ-32B在保持数学和编程能力的同时,进一步提升了通用能力。
  4. Agent能力,如虎添翼

    • QwQ-32B 模型还集成了与智能体 Agent 相关的能力,可以在使用工具时进行批判性思考,并根据环境反馈调整推理过程。
    • 这简直是如虎添翼,让模型不仅仅是生成文本,更像是一个能够思考和解决问题的“智能体”。

二、开源福利,人人可用!

这么强大的模型,是不是已经让你跃跃欲试了?别担心,QwQ-32B已经开源啦!

这意味着什么?意味着你可以免费下载、使用QwQ-32B,甚至可以根据自己的需求进行修改和定制!

三、代码示例,直接开跑!

为了方便大家快速上手,通义千问团队还贴心地提供了API调用示例代码:

from openai import OpenAI
import os

# 初始化OpenAI客户端
client = OpenAI(
    # 如果环境变量未配置,请替换为您的API密钥:api_key="sk-xxx"
    # 如何获取API密钥:https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

reasoning_content = ""
content = ""

is_answering = False

completion = client.chat.completions.create(
    model="qwq-32b",
    messages=[
        {"role": "user", "content": "9.9和9.11哪个更大?"}
    ],
    stream=True,
    # 取消注释以下行以在最后一个块中返回令牌使用情况
    # stream_options={
    #     "include_usage": True
    # }
)

print("\n" + "=" * 20 + "推理内容" + "=" * 20 + "\n")

for chunk in completion:
    # 如果chunk.choices为空,则打印使用情况
    if not chunk.choices:
        print("\nUsage:")
        print(chunk.usage)
    else:
        delta = chunk.choices[0].delta
        # 打印推理内容
        if hasattr(delta, 'reasoning_content') and delta.reasoning_content is not None:
            print(delta.reasoning_content, end='', flush=True)
            reasoning_content += delta.reasoning_content
        else:
            if delta.content != "" and is_answering is False:
                print("\n" + "=" * 20 + "内容" + "=" * 20 + "\n")
                is_answering = True
            # 打印内容
            print(delta.content, end='', flush=True)
            content += delta.content

这段代码可以直接复制粘贴到你的Python环境中运行,是不是超级方便?

四、结语

QwQ-32B的开源,无疑为AI社区注入了一剂强心针。它不仅展示了通义千问团队在技术上的深厚积累,也为广大的AI开发者和爱好者提供了一个强大的工具。如果你也对AI感兴趣,不妨下载QwQ-32B体验一下,相信它会给你带来惊喜!

还在到处找AI工具?ChatTools 已为你备好!GPT-4o、Claude 3、Gemini、Midjourney等热门模型,一键畅玩!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐