分享
Qwen-3部署与调用详解(上)
输入“/”快速插入内容
Qwen-3部署与调用详解(上)
课程说明:
•
体验课内容节选自
《2025大模型Agent智能体开发实战》(5月班)
完整版付费课程
体验课时间有限,若想深度学习大模型技术,欢迎大家报名由我主讲的
《2025大模型Agent智能体开发实战》(5月班)
68%
32%
此外,公开课全套学习资料,已上传至网盘
(
https://pan.baidu.com/s/1wtLsh6h3RhTfCBFgWa5BYQ
提取码: r8rq )
需要更系统深入学习大模型可扫码⬆️添加助教咨询喔~
一、Qwen3系列模型介绍
1. Qwen3 模型简介
2025年4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3,其中旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能,性能全面超越Deepseek-R1、豆包1.5pro 等国内领先模型,并登顶全球最强开源模型。
Qwen3原生支持MCP协议,并具备强大的工具调用(function calling)能力,并且集成封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,大大降低编码复杂性,Qwen3 的工具调用能力,支持实现高效的手机及电脑Agent操作等任务。
2. Qwen3 模型特性
最新版本Qwen3有以下特点:
•
全尺寸稠密与混合专家模型:0.6B, 1.7B, 4B, 8B, 14B, 32B and 30B-A3B, 235B-A22B
•
支持在
思考模式
(用于复杂逻辑推理、数学和编码)和 非思考模式 (用于高效通用对话)之间
无缝切换
,确保在各种场景下的最佳性能。
•
显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
•
卓越的人类偏好对齐,在创意写作、角色扮演、多轮对话和指令跟随方面表现出色,提供更自然、更吸引人和更具沉浸感的对话体验。
•
擅长智能体能力,可以在思考和非思考模式下精确集成外部工具,在复杂的基于代理的任务中在开源模型中表现领先。
•
支持 100 多种语言和方言,具有强大的多语言理解、推理、指令跟随和生成能力。
同时Qwen3系列模型的核心亮点具备多种思考模式:
•
思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
•
非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如,复杂的问题可以通过扩展推理步骤来解决,而简单的问题则可以直接快速作答,无需延迟。至关重要的是,这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。如上文所述,Qwen3 展现出可扩展且平滑的性能提升,这与分配的计算推理预算直接相关。这样的设计让用户能够更轻松地为不同任务配置特定的预算,在成本效益和推理质量之间实现更优的平衡。