Claude Sonnet 4.5短评
背景
东八区2025年9月30日凌晨,Claude Sonnet 4.5降临!我的观点:领先一步就是步步领先。Anthropic有绝对的自信,直接宣称:
- 世界上最好的编码模型(过去这一年多的时间,从3.5 Sonnet到4.5 Sonnet一直是)
- 构建智能体(Agent)最强的基座模型
- 使用电脑的最佳模型
三个最
字彻底宣告了其的伟大!
短评
Claude for Chrome目前已经对所有加入waitlist的Max会员开放。其中的Sonnet模型也已经切换到了最新的4.5模型。
官方Claude Sonnet 4.5模型博客中包含多条客户评价部分,如果我手动一个个点击查看势必是一件非常麻烦费时的事情,于是乎,我让Claude for Chrome帮助我挨个点击,给出这么多客户对于Claude Sonnet 4.5模型的总体评价。
客户评价直接让VS Code中的Claude Code扩展来进行翻译。
Claude Code扩展从原本的启动Claude Code快捷键变更为了丰富的对话窗口,还能查看过去的对话历史。其余AI编辑器的市场份额绝对会被进一步蚕食。
在账户设置中新增了用量限制的显示,透明化的操作也在提醒用户,尽可能编辑好自己的提示词,而不是一味依赖于多轮对话。
训练截止日期来到了2025年7月份,可靠的知识截止日期依旧保持2025年1月份。暂时让其编写python脚本调用gemini api,还是用的已经过时的gemini python sdk。再过1年,这些AI能否学习到最新的gemini python sdk?让我们拭目以待。
谄媚减少了,暂时没有看到You're absolutely right.
回复。
Imagine with Claude
实时生成软件有点意思。里面Claude的上下文窗口为100K。只对Max用户开放5天。
左侧有三个便签,其中一个便签上写着"Constraints breed creativity",翻译为中文是“约束孕育创造力”, 个人认为是“自由孕育创造力”,条条框框反而会禁锢思想,使得创造力慢慢消逝。为此我向Claude提出了质疑。
Claude的回复中文译文如下:
我选择了完全自由。紧接着我输入了Claude专属音乐,它创建了一个音乐播放器UI窗口。
打开垃圾箱,里面有3个文件,其中一个是假期图片。
都是在模拟UI,桌面上的图标除了垃圾箱能打开外,其余的图标就是个摆设。代码执行也是假的,全是Claude用代码模拟出来的UI。
Keep Thinking是Anthropic的最新宣传片。观看链接: https://www.youtube.com/watch?v=FDNkDBNR7AM
让Claude想象Trump版的美国队长。
Claude想象的骑自行车的鹈鹕。
在Claude for Chrome的辅助下和世界分享我的发现。丝滑的流程、丝滑的体验。
Claude Pro
Pro用户也拿到了代码执行和文件创建功能,记得去Chat Features中启用。
编译、运行代码如下图所示。此外还能创建文件,如幻灯片等。
总结
这次发布是Pro用户的大胜利。Claude Code中的Opus模型不给Pro用户用,这次Pro用户也能在Claude Code中享受最强大的模型。
个人认为Sonnet 4.5发布并不意味着Opus 4.1就一无是处了。贵总有贵的道理。Opus模型更大,虽然在一部分基准测试中落后于Sonnet 4.5,但毋庸置疑基准测试并不代表实际体验。实际体验中,没准Opus 4.1在某些场景下会更优。
补充资源
尽可能多地关注英文测评,因为Anthropic会提前给一部分知名用户内测,中文测评很多都是水文,有些时候我也会怀疑自己是不是也在制造垃圾?
文档信息
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享4.0许可证)