模型能力对比(2026-04)
| 维度 | Claude Sonnet 4.5 | GPT-5 |
|---|---|---|
| 上下文窗口 | 200K tokens | 400K tokens(Pro 128K) |
| 编码基准 SWE-bench Verified | 约 62% | 约 58% |
| 数学基准 AIME 2024 | 约 88% | 约 92% |
| 多模态 | 图像理解 + PDF + Computer Use | 图像、语音、视频理解 + DALL-E 绘画 |
| 结构化输出 | 优秀(tool use、JSON mode 稳定) | 优秀(function calling 生态广) |
| 性格 | 更谨慎、更长的解释、更诚实承认不确定性 | 更积极、响应更短、语气更活泼 |
数据来源:Anthropic 与 OpenAI 官方技术报告及第三方 benchmark(Artificial Analysis、LMSYS Arena,2026 年 3 月更新)。 实际任务表现常常比 benchmark 数字反转,以下场景的对比基于真实用户反馈与作者实测。
写代码:Claude 优势明显
Claude Sonnet 4.5 在代码任务上有三个结构性优势:
- 拒绝幻觉:Claude 不知道的 API 会明确说"我不确定",ChatGPT 倾向于编一个
- 长对话不崩:200K 上下文的实际利用率比 GPT-5 好,20-30 轮复杂编程对话仍保持状态一致
- Claude Code:原生 CLI 工具,
claude命令行能读写文件、执行 shell、使用 git,工作流远强于 ChatGPT 的 Codex CLI
从 2024 年起,大量硅谷独立开发者和头部公司工程师把 Claude 作为主力编程工具,而 ChatGPT 逐渐退为"通用聊天 + 创意生成"的位置。
写作:各有胜场
Claude 风格:中文输出克制、克服"AI 味"做得更好,文章有真人质感,适合长文、脚本、严肃文档。GPT-5 风格:情感更丰富,广告文案、社媒短文、口播稿更有节奏。 如果你做自媒体,两个都订是合理的。如果二选一,公众号长文偏 Claude,小红书短文偏 GPT-5。
多模态与创意生成
- 图像生成:ChatGPT 内置 DALL-E 3 / GPT-Image;Claude 不做图像生成,只做理解
- 语音对话:ChatGPT 的 Advanced Voice Mode 很强;Claude 没有语音
- 视频:ChatGPT 有 Sora 生态接入;Claude 无
- 图像理解:两家都很强,Claude 在 OCR + 表格理解略优
产品功能对比
| 功能 | Claude | ChatGPT |
|---|---|---|
| 可交互组件 | Artifacts(React/HTML 实时预览) | Canvas(文本/代码编辑器) |
| 自定义 GPT / 角色 | Projects(项目级系统提示 + 知识库) | Custom GPTs(丰富生态 + Store) |
| 深度研究 | Research(多步检索合成) | Deep Research(更长时间,更详细) |
| 计算机操控 | Computer Use(原生操作桌面) | Operator(基于浏览器) |
| 知识库 / 文件 | Projects 内上传 | Custom GPT + My GPTs |
| 终端 CLI | Claude Code(业内最强) | Codex CLI(相对简陋) |
| API Playground | Anthropic Console + Workbench | OpenAI Playground |
订阅价格
| 档位 | Claude | ChatGPT |
|---|---|---|
| 免费 | 有限用量 + Haiku / Sonnet 降级 | 有限 GPT-5 用量 + 免费搜索 |
| 入门付费 | Pro $20/月(ClaudeMax ¥210) | Plus $20/月 |
| 重度档 | Max 5x $100/月(ClaudeMax ¥980) | Pro $200/月 |
| 团队 | Team $30/seat | Team $30/seat |
| 企业 | Enterprise 定制 | Enterprise 定制 |
中国用户可用性
这是很多人最关心的维度。
ChatGPT
- 账号注册:需要海外手机号,但接受部分亚洲国家号段(菲律宾、马来、印尼)
- 支付:WildCard、Nobepay 等虚拟卡成功率较高
- 代购渠道:几十家,价格战激烈,¥120-180/月
- 访问:需科学上网,但 IP 容忍度较宽
Claude
- 账号注册:Anthropic 对中国手机号严格拒绝
- 支付:Stripe 风控更严,虚拟卡封号率高于 ChatGPT
- 代购渠道:少,主流方案是 Team 席位代付(如 ClaudeMax)
- 访问:需稳定美区 IP,claude.ai 对机房 IP 识别更严
结论:如果你在大陆且不想折腾,ChatGPT 有更多便宜渠道;但 Claude 通过 Team 席位代购的稳定性反而更高 (因为平台用的是真实美区 Team 账户)。价格溢价约 30-40%,换安全性。
怎么选
只能订一个:做编程、长文研究首选 Claude;做创意、语音、图像首选 ChatGPT。预算充足:两家同时订,合计 ¥360-400/月,覆盖 99% 的 AI 使用需求。
