Phi-4 14B（README）

模型介绍

Phi-4 是微软研究院于 2024 年 12 月发布的开源大型语言模型（LLM），旨在推动小型语言模型（SLM）在复杂推理任务中的性能边界，参数规模为 140 亿。​

Phi-4 通过创新的数据生成和后训练策略，在性能上超越了其教师模型（如 GPT-4o），同时保持较小的规模和较低的计算需求。其默认上下文长度为 4096 个Tokens，适合处理中等长度的输入。​

模型	架构类型	参数规模	上下文长度	分词器
Phi-4	Decoder-only Transformer	140 亿	4096	tiktoken

这种设计使其在保持推理能力的同时，降低了内存和算力需求。​

它是 Phi 系列的最新成员，专注于复杂推理任务，在 STEM（科学、技术、工程、数学）相关任务中表现出色，尤其是在数学竞赛问题和编码基准测试中。​

Phi-4 是小型语言模型领域的重大进步，通过高质量合成数据和创新后训练技术，在推理任务中实现了卓越性能。其 140 亿参数的规模和开源特性使其成为开发人员构建高效 AI 应用的理想选择。​

📌

关键引用：

•

•

•

快速阅览

我们团队在文档不同的位置进行了详细的介绍，您可以点击进入并查看具体的技术文档。​

☑️ 部署调用

◦

❤️ 赋范社区交流群

海量硬核独家技术干货内容+无门槛技术交流~

上图扫码👆即刻入群！

📍 社群技术交流氛围浓厚，不定期开设硬核干货&前沿技术公开课噢~​

Phi-4 14B（README）​