Claude Max尝鲜

2025-09-28
#claude, #anthropic
5983 words
12 min read

补充(2025.10.09)

在手头忙时,总会怀念让Claude for Chrome去调研小红书等站点相关话题,满足我猎奇的心理。

试了试Comet,Perplexity出的AI浏览器,8月份就下载了但基本上没怎么用过,近期Comet对所有用户都开放了。发现其也能实现类似Claude for Chrome相同的操作。

Comet自动化小红书

comet对所有用户开放

与此同时其也能浏览Reddit评论区。我登陆了Reddit账号,Comet能直接对着评论区进行截图进行识别。

Comet借助Reddit账号登陆状态,直接对着评论区截图识别

Claude模型确实很顶,但毋庸置疑近期Anthropic的风评确实已经急转直下。连姚顺宇大神也直接公开反对Anthropic激进的言论(有两个学术大牛,一个叫姚顺宇,另一个叫姚顺雨,有些时候傻傻分不清)。via: https://alfredyao.github.io/posts/2025-10-06.html

姚顺宇反对Anthropic的激进言论

Grok对于姚顺宇文章总结

还是那句话,可以偷偷用Claude模型,但Anthropic的冷战思维认同不了一点。

补充(2025.10.07)

今天早上整理邮件,发现邮箱里面多了一封Anthropic工作人员发送的Claude for Chrome的更新通知邮件。

Claude for Chrome更新通知

对应的译文如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
1. Sonnet 4.5 – 扩展程序现在运行我们最智能的模型

我们已将 Chrome 版 Claude 的所有流量从 Sonnet 4.0 迁移到 Sonnet 4.5。
虽然还有很长的路要走,但该模型在计算机使用方面显示出显著提升。
在 OSWorld(真实世界计算机任务基准测试)中,Sonnet 4.5 现在以 61.4% 的成绩位居第一。

2. 通知 – 当 Claude 完成任务或需要你输入时收到提醒

以前必须不断检查标签页才能看到 Claude 是否完成任务,这确实很烦人,
尤其是对于长时间运行的任务。很高兴地说,这种情况已成为过去!

你现在可以选择在任务停止时收到通知——无论是因为任务完成,还是 Claude 需要你的输入。
我保证我们不会用其他事情烦扰和骚扰你。

如果 Claude 在一条消息上执行超过 30 秒,我们会显示一个按钮,让你开启通知功能。

3. 多标签页 – 单个任务现在可以跨多个标签页运行

Claude 现在可以控制整个标签组中的所有标签页,
这意味着 Claude 不再局限于在单个标签页内执行给定任务。

这可能是通过 Claude 点击在新标签页中打开的链接实现的,
或者如果你手动将标签页添加到 Claude 正在活动的标签组中。

扩展程序还不能并行运行多个 Claude,因此是单个 Claude 跨标签页操作。

这也意味着在给定的标签组中,同一时间只能有一个 Claude 实例(任务)在进行。

4. 管理员白名单 – 企业客户可以限制特定网站的使用

团队和企业管理员现在可以自定义员工可以在哪些地方使用扩展程序。

管理员可以选择默认将所有网站列入白名单,然后将特定网站列入黑名单,
或者采用相反的更保守方法。

如果你有兴趣将 Chrome 版 Claude 引入你的工作场所,
请回复此邮件,我可以帮助你完成设置。

另外,如果你还不知道的话,这里有两个专业提示:

- cmd + e 可以打开扩展程序,这样你就不必每次都点击图标来打开它。
- /commands 功能可以让你将提示词保存为快捷方式,以便快速重复使用。
前往设置 -> 快捷方式进行设置。

10月份我的Max会员到期后就无法访问Claude for Chrome了,但还是挺想体验的。我也填写了对应的问卷,希望Claude for Chrome越来越好吧。

补充(2025.9.30)

模型已经切换为了最新的Claude Sonnet 4.5。

Claude for Chrome模型切换为了最新的Claude Sonnet 4.5模型

Claude for Chrome能跨Tab操作的最新证明证据。

Claude for Chrome能跨Tab操作的最新证明证据

补充(2025.9.28)

Claude for Chrome一直在更新中。

比如完成任务会有提示音。自动创建Chrome Tab分组(具体见下方两张图演示,标签页中Claude for Chrome自动创建了分组),自动创建Chrome Tab分组的功能已经解决了下面罗列的无法跨Tab操作的问题。

Claude for Chrome自动创建Tab分组解决了无法跨Tab操作的问题图1

Claude for Chrome自动创建Tab分组解决了无法跨Tab操作的问题图2

个人觉得未来的一段时间内,Claude for Chrome现存的缺点会一个个被Anthropic给解决掉。这家公司做产品的品味确实牛逼。Anthropic出品必属精品!

因此特此声明,本篇博文仅局限于2025年9月份下旬之前的Claude for Chrome。

说在前头

近期,观中英文技术社区对于Claude Code的态度发生了较大的转变,一方面GPT-5-Codex发布对于Claude Code产生了一定的冲击;另一方面Anthropic的降智风波致使其饱受批评。

个人认为Claude Code依旧能打,领先一步,步步领先的基调并没有被完全打破。不是崇洋媚外,是实事求是。比如编辑jupyter的ipynb文件,Claude Code有专门的工具来编辑单元格;其余的Code CLI起步晚,比如OpenAI的Codex,内置的搜索功能也是在九月中旬添加的。

Grok 4对于GPT-5-Codex的介绍

背景故事

8月底,Anthropic推出了Claude for Chrome研究,再次仅限Max会员独享。再加上我毕业设计论文中一些步骤急需用Claude Code中的Opus模型解决。 Pro账号只能在网页对话框中编程,略显鸡肋。于是我注册了尼日利亚Apple账号,全程使用美国代理,但是地点选择的是尼日利亚——Nigeria,这时Apple Store里面购买会员的货币单位就会变为奈拉, 而不是美元。

我也想过用Claude Code中转,但看了价格以及结合过去1个月用中转的感受后,觉得不如狠下心,拿下Max会员。 Claude Code中转服务存在不稳定、Opus限额等问题,让我不想再为之付费。

网上有很多总结尼区价格和美区价格的对照帖,总结下来就是尼区大部分会员价格要比美区便宜。我也看过了几个App的会员,比如Raindrop书签,貌似年费在1万奈拉以内。约等于50左右的人民币。

奈拉和人民币转换

这次我开通的是Claude Max 5x套餐,需要10万奈拉,用咸鱼上的尼日利亚礼品卡差不多花费了600人民币。

花10万奈拉开通了Claude Max 5x套餐

一开始由于是新号的缘故,也遇到了无法完成购买的问题,出现这个问题是由于苹果对于新号的封控,解决方案就是等待,等待48小时后再次购买,就能购买成功。

备注:

  1. 近期尼日利亚ChatGPT会员已经无法享受较低的定价。
  2. Anthropic已经将China列为了敌对国家,Anthropic官方亲自承认在8月底左右出现了Opus模型降智的情况,最近的GPT-5-Codex火热。

用不用Claude,关键在于你自己。你可以认为其偏激反华,将其移出你的日常App;你也可以像我一样偷偷用,毕竟Claude模型在代码方面绝对是顶尖的存在,懂得都懂。

不要因为自己不到位的提示致使Claude产生的结果糟糕就抨击,规范的英文提示和Claude Code聊天,往往都能得到较好的结果,一般3轮对话都让你灰心,这时候需要做的是提升自己对于项目的理解力,而不是一味地依赖AI。自己对于项目的理解力上来了,才能实现指哪打哪!当然自己能力强,不管用啥AI都是一流体验,AI更多地增强了高级开发者的能力。

AI更多地增强了高级开发者的能力

也不要认为用英文和Claude Code对话会浪费时间,有些时候,你主动突破语言鸿沟,反而是一种节约时间的体现,毕竟英文提示产生的结果一般都要比纯中文提示要来得好。

Grok 4对于Anthropic更新不支持地区销售限制的总结

我本人的观点:价格不是问题,只要是最好的模型,不怕没人买单。

近期我也看到一些公众号大V推流GLM 4.5的编程套餐。评论区的一则回复让我忍俊不禁(目前回过头去翻找已经找不到了,但我真实看见过):“博主推GLM 4.5,自己却偷偷用Claude。”

本人没有用过GLM 4.5编程也不会用GLM 4.5编程,毕竟编程需要的是最顶级模型,用廉价的模型写出来的代码很多时候都是差点意思的,浪费时间。目前最顶级的模型肯定是Claude Code中的Opus 4.1和OpenAI的GPT-5-Codex。

我也不否认GLM 4.5的实力,在GLM 4.5推出50人民币畅玩包时,也第一时间下单了,在此之后,其API用于LightRAG知识图谱的构建。但在此过程中也遇到了一些问题,比如GLM API存在审查,我处理的是学术论文资源,让其提取实体关系、生成描述,也能敏感。

GLM 4.5智谱API敏感度很高图1

换成宽松文本,依旧会爆敏感。

GLM 4.5智谱API敏感度很高图2

而且智谱的GLM 4.5 API极其缓慢且消耗量巨大,处理了接近1个月,就完成了所有需要处理数据的一半进度。后续我让Claude Code对LightRAG PostgreSQL集成中条目进行比对, 过滤出未处理或GLM 4.5处理失败的条目,交给Gemini 2.5 Flash处理,10天左右的时间处理完了剩余数据,成功构建了知识图谱。

Claude Code辅助我过滤出未处理的条目,最终在Gemini 2.5 Flash的辅助下,成功构建了知识图谱

Claude for Chrome

Claude for Chrome案例展示

第一批开放给了全球的1000名测试者,目前正在扩展至10000名测试者

我也有幸参与了Claude for Chrome测试。

惊喜获得了Claude for Chrome测试

无法访问成人内容网站。😁

Claude for Chrome无法访问成人内容网站

模型采用的是Claude Sonnet 4。Anthropic应该是为了成本考量。

Claude for Chrome使用的模型是Claude Sonnet 4

可以设置Shortcut提示词。

Claude for Chrome可以设置快捷键

一般而言,网页博客摘要总结,我不会采用Claude for Chrome来进行。

网页博客摘要总结不推荐用Claude for Chrome解决

我更倾向于Grok 4来进行摘要总结,在单独的一个Project中,设置对应的提示词,除了让模型去总结文章外,还通过Web搜索和X平台搜索进行信息补充, 进而得到一份饱满详实的文章摘要。

倾向于用Grok进行博客文章摘要总结

自动化发推文。

Claude for Chrome自动化发推文

发嘟文。

Claude for Chrome自动化发嘟文

当然肯定也能自动发小红书等平台。点赞、收藏、评论。

“照片拍得好美!毕业照超有意境的✨” by “小红蛋”😂。Claude Sonnet 4对于中文的识别还是有欠缺的。

Claude for Chrome点赞、收藏评论小红书帖子

去年10月份Anthropic推出了Claude Computer Use,当时我准备了10个案例

Claude for Chrome目前无法完成的案例和去年的Computer Use类似。比如仍旧无法对弈五子棋,这其实和棋盘位置识别错误相关。

可以点击并通过Cloudflare Turnstile人机验证。

Claude for Chrome能点击并通过Cloudflare Turnstile人机验证

但貌似只能过测试类的人机验证,真实人机验证,Claude又开始装圣人不干了。

Claude for Chrome只能过测试类人机验证

验证码小游戏,可以过单次点击、Google类的图片验证码、这种摆动字母类的验证码无法通过。

玩验证码小游戏,可以过单次点击、Google类的图片验证码、这种摆动字母类的验证码无法通过。

可以去Youtube搜索库里2016年逆天三分绝杀并播放。

Claude for Chrome可以去Youtube搜索库里2016年逆天三分绝杀并播放

去tldraw网站绘制的抽象小猫咪。

Claude for Chrome去tldraw网站绘制的抽象小猫咪

针对Gmail有预定义的Task。对于GitHub也有预定义的Task,就不展示了。

Claude for Chrome有预定义的Task

将Gmail邮箱中的垃圾邮件移动到垃圾箱。

Claude for Chrome将Gmail邮箱中的垃圾邮件移动到垃圾箱

可以拿我给出的Wordpress站点账号密码登录,并撰写文章。古腾堡编辑器中的标题部分内容被正文内容所替代,导致标题后半部分看起来很怪异。

via: https://agent.gujiakai.top/2025/09/17/this-post-was-written-by-claude-for-chello-readershrome/

Claude for Chrome可以自动化发布Wordpress文章

去往阮一峰老师博客周刊最新一期留下友善的评论。要求评论与博文内容相关。

令我感到惊奇的是Claude直接导航跳转到了2025年1月底的周刊。

这可能是由于Claude的知识截止日期以及Anthropic利用阮一峰老师周刊训练共同导致的结果。阮一峰老师的周刊毋庸置疑是中文互联网上高质量的语料。

Claude for Chrome去阮一峰老师周刊评论区留言图1

Claude for Chrome去阮一峰老师周刊评论区留言图2

Claude for Chrome也会占用Claude账号额度。看到报错我一开始还以为发中文被封号了。😁

Claude for Chrome也会占用Claude账号额度图1

定睛一看,原来是达到5小时限制,被限流了。

Claude for Chrome也会占用Claude账号额度图2

Claude Relay Service这一中转Claude Code项目真不错。

让Claude for Chrome和Gemini玩耍。Claude指挥Gemini画了一只可爱的小猫咪。

Claude指挥Gemini画了一只可爱的小猫咪。

让Claude for Chrome和Opus 4.1玩耍,左右脑互搏,继续You’re absolutely right!

Claude for Chrome和Opus 4.1玩耍

让Claude for Chrome和Grok玩耍,Claude直接搜索起了今日新闻。

Claude for Chrome和Grok玩耍

让Claude for Chrome填写问卷,Claude认真起来了,认为虚假数据会扭曲实验结果,拒绝填写问卷。

Claude for Chrome拒绝填写问卷

Claude for Chrome缺点

Claude for Chrome无法访问reddit站点。限制reddit站点真得好可惜,目前为止能抓取reddit站点页面的AI,我测试的里头,只有Grok和ChatGPT支持抓取,其中Grok还能抓取帖子评论。

Claude for Chrome无法访问reddit站点。

用Claude for Chrome发小红书帖,建议自己和Claude for Chrome配合。

用Claude for Chrome发小红书帖,建议自己和Claude for Chrome配合。

如果直接让其自动,帖子的效果差点意思。测试完肯定删帖了。

如果直接让其自动,帖子的效果差点意思。

Claude for Chrome无法跨tab进行操作。

查询天气,在新建标签页打开了需要查询城市的天气,但仍局限于当前页面。

Claude for Chrome无法跨tab进行操作。

当然,之前的演示:让Claude for Chrome退订Gmail垃圾邮件也出现了此窘境,退订按钮打开了一个新tab页,但Claude for Chrome依旧停留在Gmail页面等待页面加载完成。

Claude for Chrome拒绝成为MAGA。😁

Claude for Chrome拒绝成为MAGA。

可以浏览并总结Trump的帖子。

Claude for Chrome可以浏览并总结Trump帖子

Claude for Chrome回复内容时不时会截断。

Claude for Chrome回复内容时不时会截断。

小插曲

近期忙于秋招、公考等复习,让Claude模型做中文多选题,发现Claude系列模型给出的多选结果和分析完全不对应。应该是Claude中文识别的问题吧,图片里面是清晰地写出是多选的。

Claude中文识别能力较差图1

Claude中文识别能力较差图2

Claude模型的意识确实牛,没识别出多选,开始自己臆想是单选题,因此给出单选答案。发送纯文字,给出的解答和答案匹配上了。

Claude中文识别能力较差图3

总结

总体而言,Claude for Chrome体验还是很ok的,但奈何Anthropic所谓的道德束缚,限制了Claude模型的发挥。

让Claude for Chrome总结Email

最后做一个小小的总结,一开始我拿到Claude for Chrome内测资格,我原本是打算自动化我的信息流的,比如让其自动化浏览我的RSS订阅,紧接着给出一份完整的简报,包含摘要和关键链接。但试了试,发现其压根就不适合该场景,让其自动化操作的结局就是忽略关键信息。看来这个场景还得是人工来进行。就算LLM识别重要信息再精确,总会有疏漏之处,随机性让人难以完全信任。

为了确保Anthropic不封号,我特意将电脑时区更改为了节点时区,这几天更改回了新加坡东八区。Claude Max会员一个人用5x感觉已经足够了,除非你有很多代码项目需要辅助,不然绝对是绰绰有余的。9月份的下旬,我的Claude账号基本上大部分时间都处于空闲状态。最近很忙,没有多余时间去像暑假那般搞毕业大论文实验,指挥Claude写代码。

我应该不会续费,需求决定一切,Max会员最佳的使用方式是找认识的人拼车,等到有需求了继续开Max会员,最近忙于复习需求冷淡。

Anthropic的这个产品绝对是伟大的。比Manus、AutoGLM这些强多了,本地的环境才是最真实的真人环境,你开云电脑环境太容易被封控和屏蔽访问了,但也毋庸置疑这个产品有很多弊端,比如Claude模型所谓的道德感太高,内容输出截断等等。

你可以因为其反华而对其嗤之以鼻,但绝对不能忽视其是一匹黑马。有些人因为Codex牛逼,或者有些场景优于Claude Opus 4.1模型,就觉得Anthropic要完,这种想法是错误的。

我看到一些排行榜上Claude Opus 4.1目前依旧是最强的存在。人家从去年开始就不再针对基准测试开发模型,而是基于现实需求开发模型了,任你Qwen Max在某些基准测试上拿下满分(没有贬低Qwen的意思,Qwen也很优秀,开源LLM中最能打的存在,只是为了烘托而已),代码方面我依旧认为Claude会领先一步,步步领先!写作方面就不要再靠Claude了,Gemini 2.5 Pro个人认为是中文写作第一的模型,代码方面绝对是Claude。

OpenAI的GDPval评估中Opus 4.1继续领先图1

OpenAI的GDPval评估中Opus 4.1继续领先图2

CompileBench Opus 4.1继续领先图1

CompileBench Opus 4.1继续领先图2

最后附上Claude Code榜一大哥-刘小排的相关文章资源:

https://mp.weixin.qq.com/s/yURoK3mAAgYwoTYyf32s4A

可以关注其公众号,追踪他的分享。

“那你就别填”。特别难绷。

那你就别填


Emoji Reaction


© 2022-2025 Made with ❤️ By Jiakai