模型 | 上下文窗口 | 定价(每百万令牌) | MMLU 得分 | GPQA 得分 | GSM8K 准确率 | 主要用例 |
Claude 3 Haiku | 200,000 | 低 | ~70.0% | ~42.0% | 78.0% | 实时聊天,数据提取 |
Claude 3 Sonnet | 200,000 | 中 | ~76.0% | ~48.0% | 85.0% | 内容创建,复杂数据分析 |
Claude 3 Opus | 200,000 | 高 | ~79.0% | 51.0% | 89.0% | 研究,战略规划 |
Claude 3.5 Sonnet | 200,000 | 输入 3 美元,输出 15 美元 | 82.4% | 54.6% | - | 复杂任务,多模态理解 |