顾佳凯的网络日志 | 让Claude再次伟大!

让Claude再次伟大!

2025-08-06

#claude

2512 words

6 min read

人工智能实验室中的黑马¹—Anthropic在今天凌晨发布了Claude Opus 4.1。

近期用Claude Opus 4辅助写论文某一部分片段时，给我的感触是文字水平有下降的趋势。同样的Prompt（让LLM完善的那一部分，写作思路、写作要点等均预先填充），AI Studio中的Gemini 2.5 Pro产出的段落逻辑清晰，我拿过来自己再润色润色就能直接用了，而Claude Opus 4产出的文字多为列表式的呈述，能直接拿来用润色的文字变少了。

当然也有可能是我Prompt不到位的缘故，目前辅助我论文写作的LLM，第一时间想到的依旧是Claude Opus和Gemini 2.5 Pro。

今天发布的模型页面²有这样一段有关内容创作的表述：

虽不能低估Claude Opus系列写作的水平。但Anthropic一直强化Claude系列模型编码、Agent方面的能力，着实让人有些担心其文字功底倒退的可能性。

Claude 4系列模型的训练截止日期：2025年3月。

这一点是我5月份的Claude 4博客中所忽略的。虽然截止日期并不能说明啥，让模型用一些框架写业务代码时，依旧采用框架SDK过时的知识，如Gemini的Python SDK，Claude 4系列模型依旧采用被废弃的SDK。

截止日期应该是目前所有模型中最新的了，之前我还误以为Gemini 2.5 Pro的知识截止日期最新（2025年1月）。

Claude 4系列模型不开搜索都知道2025年1月份美国加州发生了山火的新闻。

目前很多LLM供应商都注重后训练，预训练甚至都已经放弃了，毕竟有了web搜索工具，模型可以实时获取最新的资讯。欣赏Anthropic预训练和后训练两手抓。

Claude Opus 4.1模型卡片³都是有关安全的内容。个人目前以及未来都不会认为LLM将对人类造成任何威胁。虽然目前的模型看起来很智能，但其实也就那样。

Claude Code在2025年6月份左右开始流行，成为了程序员等群体青睐的工具，目前的热度肯定是盖过Augment、Cursor这类产品的。

我也在7月份尝试了用该工具Vibe Coding，Claude Code使用体验确实不错，能直接操作Jupyter Notebook让我开了眼（也试过Google Colab中终端安装Claude Code，Claude Code无法操作其中的Jupyter Notebook对应的单元格）。

国产廉价的GPU平台是AutoDL，无卡模式开机每小时1毛钱，有些时候需长时间运行的脚本，我就放上面跑，脚本出现Bug，直接终端中安装Claude Code，紧接着就可以开始愉快地辅助我代码了。Claude Code官方没提供GUI，采用终端的形式确实更通用。虽然也有开源的Claude Code配套GUI项目。

当然能在国内的机器上这样恣意妄为操作是因为用的Claude Code中转站，自己的号不会在Claude不支持地区登陆，

我目前用的Claude Code中转站也不稳定，几乎每天号池都会出现被Anthropic扬号的情况，目前暂时也只能用Claude Sonnet 4模型。

Claude Code和网页端共享额度，这是其流行的一大原因。如果仅仅支持API用Claude Code，谁用谁破产。开了Max套餐，直接Opus模型启动，确实很爽。可惜Pro会员只能在Claude Code中用Sonnet模型。

用Claude Code、Claude Web端有些时候觉得达到限额了，才允许自己放松，不由得感觉有些心累。一个人高强度用Pro会员，一天最多用3轮，全部拉满，生活也太疲惫了。

Claude Sonnet 4的代码能力我不敢恭维太多，之前遇到一个代码Bug，Vibe Coding用Sonnet 4越改越错。纯浪费我时间，自己不理解代码逻辑，无法实现指哪打哪，当时最后换Gemini Cli，Gemini 2.5 Pro一遍过。如果哪天Gemini Cli能和Gemini网页版会员共享额度，绝对会迎来增长，暂时依旧处于被低估的状态。

目前唯一还存在这么狠的使用限制也只有Anthropic的Claude模型。Pro用户如果用Claude Opus模型对话内容较长，没一会就会达到限额。

GPT-5本周发布（美国时间周四，北京时间周五），但个人认为依旧无法撼动Claude模型在编码、Agent方面的实力，GPT系列模型强在哪？最全能、搜索、文生图、ChatGPT Agent。

不知道这次OpenAI的基准测试敢不敢放Gemini 2.5 Pro、Grok 4、Claude Opus 4.1的对比图，就算放了，编码、Agent方面领先Claude，我也不会信。

最近我开始习惯用英文和海外各大模型进行对话。一开始我以为用英文写提示词会较为浪费时间，但实操后发现并不会浪费太多时间，英文的表达用常见词即可，一时想不起来的英文短语直接用Google Translate翻译补充。就算我的英文提示中有拼写错误，只要不离谱，AI基本上都能理解意思。

Claude模型最让人难蚌的是：You're absolutely right!

执笔于此，时间已经过了晚上8点，我也该洗漱准备休息。最后附上个人有关Claude后续发布的预测：

官方博客⁴中有这样一句话：

We plan to release substantially larger improvements to our models 
in the coming weeks.

in the coming weeks中文译文：未来几周。

Claude Opus 4.1给出的最有可能发布时间区间为2025年的8月20日～2025年的9月3日。

Claude Opus 4.1给出最有可能发布的版本是Claude Opus 5，其次的可能是新的定价层级，或者是更长上下文的产品。

个人觉得其猜测有一定的道理。在GPT-5发布后，用更大改进的模型去摧毁OpenAI引起为傲的产品，有利于进一步扩大Claude模型的市场。

新的定价层次也有一定的可能性，在8月底，Claude Max套餐会施加每周额度限制，以防止狂热粉丝用Claude Code 24小时自动化操作。要想无限制使用Claude Opus模型，引入新的套餐层级，月付更多的美刀，如1000刀或者2000刀。

更长的上下文长度也是可能的，200K的上下文，企业500K的上下文，至今还没达到Gemini的1M上下文窗口，延伸到更大的上下文长度，如1M或者2M，有利于与GPT-5、Gemini模型竞争。但其实长上下文或多或少还是有弊端的，就算抗衰减能力再强，也很难完全把握住上下文窗口中的海量文本。

文档信息

版权声明：自由转载-非商用-非衍生-保持署名（创意共享4.0许可证）

← 上一篇：Manus体验

下一篇：Claude Max尝鲜 →

让Claude再次伟大!

文档信息

Emoji Reaction