
《科创板日报》2月18日讯(裁剪 宋子乔) 北京时辰2月18日凌晨,Anthropic悄然发布了其新一代中型模子Claude Sonnet 4.6。这款被官方称为“史上最强Sonnet”的模子,在多项基准测试中接近Opus水平,但价钱仅为后者的五分之一。

Anthropic半月两发新模子
此时距离Anthropic的旗舰模子Claude Opus 4.6发布不到半个月,Claude Opus 4.6于2026年2月5日幽闲发布。
Claude Sonnet 4.6不错被视为智能体(Agent)的期望基础模子。它的瞎想见识和中枢才调升级,恰是为了复古复杂的智能体任务。据先容,其在野神思使用才和谐智能体野心方面发扬尤为杰出,不错实施需要多个法子的野神思操作,举例填写网页表单,然后跨多个浏览器标签页联结信息。Anthropic称:“在操作野神思方面,该模子虽然仍过期于最老练的东说念主类。但尽管如斯,其越过速率已经惊东说念主。”不外,该模子在抗拒提醒词注入流毒(Prompt Injection Attacks)等安全挟制方面发扬更好,这类流毒是指通过坏心指示操控AI模子。
Anthropic展望,到2029年将向亚马逊、谷歌和微软支付至少800亿好意思元,以在其云工作器上开动Claude AI。
性能跃升 靠拢“旗舰级”
Sonnet 4.6在编程、野神思操作、长高下文推理、智能体野心等任务惩办上有了跨越式擢升。Anthropic公布的基准测试披露,该模子在多项关键目的上已接近以致超越其2月6日刚发布的旗舰模子Opus 4.6。
在Agent金融分析和办公任务(GDPVal-AA)两项测评中,Sonnet 4.6的得分分别达到63.3%和1633 Elo,双双卓越Opus 4.6的60.1%和1606 Elo。在评估真实寰宇软件工程才调的SWE-bench测试中,其发扬雷同靠拢Opus水平。
模子保留了100万token的超大高下文窗口(测试版),这意味着它不错一次性惩办整部《三体》trilogy级别的代码库或数百页的盘问论文。更迫切的是,Anthropic强调Sonnet 4.6不详“有用地在扫数高下文中进行推理”,这对于需要长久野心的复杂任务至关迫切。
在野神思使用才调方面,Sonnet 4.6在OSWorld基准测试中获得了72.5分,较一年前的28.0分完了质的飞跃。早期用户反馈披露,它在惩办复杂电子表格、填写多法子网页表单以及跨浏览器标签协同操作等任务时,已展现出接近东说念主类水平的才调。
利用场景:从代码重构到企业办公
Sonnet 4.6的升级径直转机为平淡的利用场景落地。在编程鸿沟,一位开荒者在应对平台X上分享了他的惊艳体验:Sonnet 4.6仅用一次API调用就重构了扫数代码库——实施了25次器具调用,新增3000多行代码,创建了12个全新文献,将单体利用见效模块化。
在企业级利用中,Box公司首席工夫官Ben Kus说明:“Sonnet 4.6在深度推理和复杂Agent任务上发扬出了显耀越过,在重度推理Q&A任务上比Sonnet 4.5擢升了15个百分点。”金融科技公司Hebbia也解释称,其里面基准测试的谜底匹配率出现大幅跃升。
{jz:field.toptypename/}值得负责的是,Sonnet 4.6展现出了一种近乎“策略想考”的才调。在Vending-Bench Arena模拟贸易运营的评测中,真钱投注该模子发展出了一套独到策略:前期重金投资才调建筑,终末阶段马上转向盈利,最终收益远超竞争敌手。
Anthropic的“性价比之作”
Claude Sonnet 4.6赓续了Sonnet系列的经济订价策略:每百万token输入3好意思元、输出15好意思元,与Sonnet 4.5握平。由于性能径直靠拢Opus级别,对于免费和Pro订阅用户,它已成为claude.ai和Claude Cowork的默许模子。
AWS已第一时辰布告Sonnet 4.6在Amazon Bedrock上架,称其为“Anthropic的最强野神思使用模子”。
市集担忧,Anthropic这种以低成本提供高性能模子的作念法,正在加快AI融入真实使命流,并可能重构企业软件的订价花式,这种情怀在短时辰内转为惊惶与担忧:AI是否会颠覆或是径直取代SaaS乃至软件行业。
在与Opus 4.5的对比测试里,用户有59%的时辰更偏好Sonnet 4.6。开荒者大量觉得,Sonnet 4.6在修改代码前能更有用地读取高下文,整合分享逻辑而非浅易复制,何况“过度工程化更少、幻觉更少、多法子任求实施更稳”。一位开荒者直言:“Claude Sonnet 4.6以更低的成本完了了接近Opus的智能水平,这对预算有限的团队意旨超卓。”
不外,也有部分用户觉得Sonnet 4.6未达到预期,指出其在编程方面并未全面超越Opus 4.5,更像是“Cowork功能的升级”。
对于Anthropic
Anthropic由前OpenAI盘问副总裁达里奥·阿莫迪兄妹于2021年创立,中枢团队曾参与GPT-2和GPT-3的早期研发。因对OpenAI的发展标的存在不对,他们下野创办了这家勉力于AI安全与盘问的公司。
凭借首创东说念主团队的光鲜配景,该公司融资步调迅猛,自竖立以来累计融资额已超300亿好意思元。2026年2月,公司刚完成300亿好意思元G轮融资,投后估值飙升至3800亿好意思元,使其成为全球估值第二高的AI独角兽,仅次于OpenAI。本轮融资参与方包括光速创投(Lightspeed Venture Partners)、门洛风险投资(Menlo Ventures)、摩根士丹利投资(Morgan Stanley Investment)、NX1老本(NX1 Capital)及卡塔尔投资局(Qatar Investment Authority)。
Anthropic最中枢的家具是Claude系列大谈话模子,按照才调梯队诀别为三个层级:
Claude Opus系列:旗舰级模子,代表刻下最高智能水平。Claude Sonnet系列:性能与成本的均衡之选,亦然人人用户斗争最多的模子。Claude Haiku系列:轻量级模子,主打快速反应和低成本,适用于及时交互场景。
基于上述模子,Anthropic开荒了AI编程助手Claude Code和办公场景智能体Claude Cowork。Anthropic的年化营收在2025年年底卓越90亿好意思元,其中,Claude Code的年化收入已达25亿好意思元。