投注pp Anthropic半月两发新模子 “史上最强Sonnet”剑指智能体订价仅为旗舰五分之一

正规投注平台官方网站

热点资讯

棋牌投注

发布日期：2026-02-19 09:45 点击次数：90

投注pp Anthropic半月两发新模子 “史上最强Sonnet”剑指智能体订价仅为旗舰五分之一

《科创板日报》2月18日讯（裁剪宋子乔）北京时辰2月18日凌晨，Anthropic悄然发布了其新一代中型模子Claude Sonnet 4.6。这款被官方称为“史上最强Sonnet”的模子，在多项基准测试中接近Opus水平，但价钱仅为后者的五分之一。

Anthropic半月两发新模子

此时距离Anthropic的旗舰模子Claude Opus 4.6发布不到半个月，Claude Opus 4.6于2026年2月5日幽闲发布。

Claude Sonnet 4.6不错被视为智能体（Agent）的期望基础模子。它的瞎想见识和中枢才调升级，恰是为了复古复杂的智能体任务。据先容，其在野神思使用才和谐智能体野心方面发扬尤为杰出，不错实施需要多个法子的野神思操作，举例填写网页表单，然后跨多个浏览器标签页联结信息。Anthropic称：“在操作野神思方面，该模子虽然仍过期于最老练的东说念主类。但尽管如斯，其越过速率已经惊东说念主。”不外，该模子在抗拒提醒词注入流毒（Prompt Injection Attacks）等安全挟制方面发扬更好，这类流毒是指通过坏心指示操控AI模子。

Anthropic展望，到2029年将向亚马逊、谷歌和微软支付至少800亿好意思元，以在其云工作器上开动Claude AI。

性能跃升靠拢“旗舰级”

Sonnet 4.6在编程、野神思操作、长高下文推理、智能体野心等任务惩办上有了跨越式擢升。Anthropic公布的基准测试披露，该模子在多项关键目的上已接近以致超越其2月6日刚发布的旗舰模子Opus 4.6。

在Agent金融分析和办公任务（GDPVal-AA）两项测评中，Sonnet 4.6的得分分别达到63.3%和1633 Elo，双双卓越Opus 4.6的60.1%和1606 Elo。在评估真实寰宇软件工程才调的SWE-bench测试中，其发扬雷同靠拢Opus水平。

模子保留了100万token的超大高下文窗口（测试版），这意味着它不错一次性惩办整部《三体》trilogy级别的代码库或数百页的盘问论文。更迫切的是，Anthropic强调Sonnet 4.6不详“有用地在扫数高下文中进行推理”，这对于需要长久野心的复杂任务至关迫切。

在野神思使用才调方面，Sonnet 4.6在OSWorld基准测试中获得了72.5分，较一年前的28.0分完了质的飞跃。早期用户反馈披露，它在惩办复杂电子表格、填写多法子网页表单以及跨浏览器标签协同操作等任务时，已展现出接近东说念主类水平的才调。

利用场景：从代码重构到企业办公

Sonnet 4.6的升级径直转机为平淡的利用场景落地。在编程鸿沟，一位开荒者在应对平台X上分享了他的惊艳体验：Sonnet 4.6仅用一次API调用就重构了扫数代码库——实施了25次器具调用，新增3000多行代码，创建了12个全新文献，将单体利用见效模块化。

在企业级利用中，Box公司首席工夫官Ben Kus说明：“Sonnet 4.6在深度推理和复杂Agent任务上发扬出了显耀越过，在重度推理Q&A任务上比Sonnet 4.5擢升了15个百分点。”金融科技公司Hebbia也解释称，其里面基准测试的谜底匹配率出现大幅跃升。

{jz:field.toptypename/}

值得负责的是，Sonnet 4.6展现出了一种近乎“策略想考”的才调。在Vending-Bench Arena模拟贸易运营的评测中，真钱投注该模子发展出了一套独到策略：前期重金投资才调建筑，终末阶段马上转向盈利，最终收益远超竞争敌手。

Anthropic的“性价比之作”

Claude Sonnet 4.6赓续了Sonnet系列的经济订价策略：每百万token输入3好意思元、输出15好意思元，与Sonnet 4.5握平。由于性能径直靠拢Opus级别，对于免费和Pro订阅用户，它已成为claude.ai和Claude Cowork的默许模子。

AWS已第一时辰布告Sonnet 4.6在Amazon Bedrock上架，称其为“Anthropic的最强野神思使用模子”。

市集担忧，Anthropic这种以低成本提供高性能模子的作念法，正在加快AI融入真实使命流，并可能重构企业软件的订价花式，这种情怀在短时辰内转为惊惶与担忧：AI是否会颠覆或是径直取代SaaS乃至软件行业。

在与Opus 4.5的对比测试里，用户有59%的时辰更偏好Sonnet 4.6。开荒者大量觉得，Sonnet 4.6在修改代码前能更有用地读取高下文，整合分享逻辑而非浅易复制，何况“过度工程化更少、幻觉更少、多法子任求实施更稳”。一位开荒者直言：“Claude Sonnet 4.6以更低的成本完了了接近Opus的智能水平，这对预算有限的团队意旨超卓。”

不外，也有部分用户觉得Sonnet 4.6未达到预期，指出其在编程方面并未全面超越Opus 4.5，更像是“Cowork功能的升级”。

对于Anthropic

Anthropic由前OpenAI盘问副总裁达里奥·阿莫迪兄妹于2021年创立，中枢团队曾参与GPT-2和GPT-3的早期研发。因对OpenAI的发展标的存在不对，他们下野创办了这家勉力于AI安全与盘问的公司。

凭借首创东说念主团队的光鲜配景，该公司融资步调迅猛，自竖立以来累计融资额已超300亿好意思元。2026年2月，公司刚完成300亿好意思元G轮融资，投后估值飙升至3800亿好意思元，使其成为全球估值第二高的AI独角兽，仅次于OpenAI。本轮融资参与方包括光速创投（Lightspeed Venture Partners）、门洛风险投资（Menlo Ventures）、摩根士丹利投资（Morgan Stanley Investment）、NX1老本（NX1 Capital）及卡塔尔投资局（Qatar Investment Authority）。

Anthropic最中枢的家具是Claude系列大谈话模子，按照才调梯队诀别为三个层级：

Claude Opus系列：旗舰级模子，代表刻下最高智能水平。Claude Sonnet系列：性能与成本的均衡之选，亦然人人用户斗争最多的模子。Claude Haiku系列：轻量级模子，主打快速反应和低成本，适用于及时交互场景。

基于上述模子，Anthropic开荒了AI编程助手Claude Code和办公场景智能体Claude Cowork。Anthropic的年化营收在2025年年底卓越90亿好意思元，其中，Claude Code的年化收入已达25亿好意思元。

上一篇：真钱投注平台高通将向印度东谈主工智能计谋基金投资不逾越1.5亿好意思元
下一篇：真钱投注平台 1942年陈独秀病逝，临终前顶住太太：你可从速再醮，但有一事别作念