分享
Qwen3(README)
输入“/”快速插入内容
Qwen3(README)
用户6676
用户6676
2025年7月25日修改
模型介绍
4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3 (简称千问3),性能全面超越R1、OpenAI-o1等领先模型,
并登顶全球最强开源模型
。
千问3是
国内首个“混合推理模型”
,对简单需求可低算力“秒回”答案,对复杂问题可像科学家一样“深度思考”,智能水平大幅提升的同时也更省算力,旗舰版千问3模型仅需4张H20就能实现本地部署,同等性能部署成本大幅度降低。
此次阿里通义共开源8款不同尺寸的千问3模型,均采用宽松型Apache2.0协议开源。千问3支持119种语言,提供多种Agent功能并兼容MCP协议,所有人都可免费在魔搭社区下载模型和商用,也可在通义APP上直接体验千问3;此外,还可通过阿里云百炼调用API服务,阿里AI旗舰应用夸克也即将接入千问3。
41%
59%
📌
Qwen3模型家族
:
本次开源的千问3系列共包含8个不同尺寸的模型:
•
6款Dense模型:0.6B、1.7B、4B、8B、14B、32B
•
2款MoE模型:Qwen3-30B-A3B和
旗舰版 Qwen3-235B-A22B,参数仅为同等性能模型的三分之一
旗舰版 Qwen3-235B-A22B:
总参数量 235B,激活参数仅 22B。
Qwen3-30B-A3B:
总参数量 30B,激活参数仅 3B,整体性能堪比Qwen2.5-32B,实现10倍以上性能杠杆提升,适用于消费级别显卡部署
Qwen3-0.6B:
小尺寸适合在手机等端侧部署
Qwen3性能表现
每款千问3模型均斩获
同尺寸开源模型SOTA
(最佳性能),可适配不同行业、场景和应用需求。
Qwen3-235B-A22B创下所有国产模型及全球开源模型的性能新高,
在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。
工具调用与Agent支持
千问3为即将到来的智能体Agent和大模型应用爆发提供了多样选择。在专门评估模型Agent能力的BFCL评测中,千问3刷新开源模型纪录
同时,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,将大大降低编码复杂性,Qwen3 的工具调用能力,支持实现高效的手机及电脑Agent操作等任务。(
https://github.com/QwenLM/Qwen-Agent
)
快速阅览
我们团队在文档不同的位置进行了详细的介绍,您可以点击进入并查看具体的技术文档。
☑️
实际
评测
⭐️
Qwen3系列模型配置硬件参考自查表(课件)
⭐️
Qwen-3深度解析!仅需1/3硬件成本,性能超越DeepSeek-R1!(课件)
◦
Qwen-3深度解析!硬件配置、原生MCP功能介绍、模型选择详解!(视频)
⭐️
Qwen3 Coder模型API调用指南
⭐️
Qwen3 Coder编程【提示词模板】
◦
Qwen3 Code使用指南与性能评测!Qwen3 Coder模型性能解读,Qwen3 Code编程智能体上手实测!(视频)
☑️
部署调用
⭐️
Qwen-3部署与调用详解丨模型详解、transformer原生库调用流程、Qwen3-14B模型接入Ollama(课件)
⭐️
Qwen-3部署与调用详解丨Qwen3模型接入vLLM、OpenWeb-UI,借助llama.cpp运行Qwen3模型(课件)