Qwen-3部署与调用详解（上）

课程说明：

•

体验课内容节选自《2025大模型Agent智能体开发实战》(5月班)完整版付费课程

体验课时间有限，若想深度学习大模型技术，欢迎大家报名由我主讲的《2025大模型Agent智能体开发实战》(5月班)

common.docs_name - LarkCCM_Docs_Menu_Image

68%

32%

此外，公开课全套学习资料，已上传至网盘

（https://pan.baidu.com/s/1wtLsh6h3RhTfCBFgWa5BYQ 提取码: r8rq ）

需要更系统深入学习大模型可扫码⬆️添加助教咨询喔～

一、Qwen3系列模型介绍

1. Qwen3 模型简介

  2025年4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3，其中旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出极具竞争力的结果。此外，小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能，性能全面超越Deepseek-R1、豆包1.5pro 等国内领先模型，并登顶全球最强开源模型。​

  Qwen3原生支持MCP协议，并具备强大的工具调用（function calling）能力，并且集成封装了工具调用模板和工具调用解析器的Qwen-Agent 框架，大大降低编码复杂性，Qwen3 的工具调用能力，支持实现高效的手机及电脑Agent操作等任务。​

2. Qwen3 模型特性

最新版本Qwen3有以下特点：

•
全尺寸稠密与混合专家模型：0.6B, 1.7B, 4B, 8B, 14B, 32B and 30B-A3B, 235B-A22B​

•
支持在思考模式（用于复杂逻辑推理、数学和编码）和 非思考模式 （用于高效通用对话）之间无缝切换，确保在各种场景下的最佳性能。​

•
显著增强的推理能力，在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ（在思考模式下）和 Qwen2.5 指令模型（在非思考模式下）。​

•
卓越的人类偏好对齐，在创意写作、角色扮演、多轮对话和指令跟随方面表现出色，提供更自然、更吸引人和更具沉浸感的对话体验。​

•
擅长智能体能力，可以在思考和非思考模式下精确集成外部工具，在复杂的基于代理的任务中在开源模型中表现领先。​

•
支持 100 多种语言和方言，具有强大的多语言理解、推理、指令跟随和生成能力。​

同时Qwen3系列模型的核心亮点具备多种思考模式：

•
思考模式：在这种模式下，模型会逐步推理，经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。​

•
非思考模式：在此模式中，模型提供快速、近乎即时的响应，适用于那些对速度要求高于深度的简单问题。​

  这种灵活性使用户能够根据具体任务控制模型进行“思考”的程度。例如，复杂的问题可以通过扩展推理步骤来解决，而简单的问题则可以直接快速作答，无需延迟。至关重要的是，这两种模式的结合大大增强了模型实现稳定且高效的“思考预算”控制能力。如上文所述，Qwen3 展现出可扩展且平滑的性能提升，这与分配的计算推理预算直接相关。这样的设计让用户能够更轻松地为不同任务配置特定的预算，在成本效益和推理质量之间实现更优的平衡。​

Qwen-3部署与调用详解（上）​

Qwen-3部署与调用详解（上）