AIエージェント

Anthropic开启了"智能体云时代"。Claude Managed Agents重塑业务自动化的现状

Anthropic发布的Claude Managed Agents,正在打破阻挡企业引入AI智能体的"95%壁垒"。本文梳理Notion、乐天、Asana的落地案例,以及非工程师本周应做的准备。

Anthropic开启了"智能体云时代"。Claude Managed Agents重塑业务自动化的现状
目次

为什么95%的AI智能体都半途而废?

对AI智能体感兴趣的人,正在变多吧。

不只是向ChatGPT或Claude提问,而是把整项任务整个交给它,让它自主运转。这样的用法正在普及开来。

所谓AI智能体,就是不需要人类一个一个下达指令,只要把任务交给它,它就能自主执行直至完成的AI。如果说聊天AI是”被问就回答”的存在,那么智能体就是”被托付就自己思考并行动”的存在。我自己每天都在运转结合Claude Code和MCP服务器的自主工作流。资料的收集、文章的审阅、任务进度的管理。这是一个连我睡觉时也持续运转的机制。

另一方面,企业一旦想正式引入,大多数都会半途而废。这就是现实。

MIT(麻省理工学院)的一项调查给出了一个令人震惊的数字。在企业的AI试点项目中,有95%在规模化阶段失败(Fortune,2025年8月)。

原因并不在AI的性能。

通过150多场访谈和350名员工的问卷调查发现,问题出在基础设施的壁垒。服务器的搭建、安全的设置、认证的管理、长时间运行的保障。即便AI模型本身很优秀,能自己搭建出稳定运行平台的公司也实在太少。

还有另一个有意思的数据。根据MIT的调查,从专业供应商处购买AI工具的企业,成功率约为67%。而从零开始在公司内部自建的企业,成功率不到其一半。“自建”本身已经成为了风险结构。

“试过AI智能体,但走到投入生产环境这一步就停住了。“这样的声音,我已经听过无数次。

2026年4月8日,Anthropic(安索皮克)发布了一项正面打破这道壁垒的服务。它就是”Claude Managed Agents”(Claude托管智能体)。

本文将梳理Managed Agents的整体面貌、乐天/Notion/Asana的落地案例,以及非工程师本周应做的准备。顺便一提,围绕AI智能体基础设施,NVIDIA(英伟达)在同一时期也联合17家公司发布了开源平台。从开发者视角进行的技术对比,在Gen的文章(4/10即将发布)中有详细解说,搭配阅读应该能更好地把握全局。

什么是Claude Managed Agents(3分钟掌握全貌)

Claude Managed Agents的架构图。"智能体定义(自然语言/YAML)"→"Anthropic云平台"→"沙箱执行/监控/

一句话概括,这是一项由Anthropic整个承担起运行AI智能体所需基础设施的服务

以往要让AI智能体在生产环境中运行,需要自己搭服务器、配置安全、构建错误恢复处理。这是工程师要花数月才能搭建起来的工作。

Managed Agents,把这一切都放到了Anthropic的云上来提供。

要做的事很简单。只需用自然语言或YAML文件定义你想让智能体做什么。无需搭建基础设施。

主要功能整理如下。

  • 沙箱执行:智能体在安全隔离的环境中运行。即便失控也不会影响其他部分
  • 自动扩缩容:处理量增加时会自动扩展
  • 检查点:保存长时间任务的中间进度,即使中断也能从中接续
  • 带作用域的权限:可以精细控制智能体能访问的范围
  • MCP(Model Context Protocol)服务器连接:与外部工具的对接已标配

特别值得关注的是,它支持长时间运行这一点。不只用于几分钟就能跑完的任务,也可用于跨越数小时的数据处理或报告生成。即使会话中断,设计上也能从检查点恢复。

根据Anthropic的官方博客,据报告结构化文件的生成成功率比常规提示最多提升了10个百分点。也就是说,当你拜托智能体”按这个条件生成报告”时,以你想要的格式返回结果的精度提高了。

我每天用Claude Code和MCP服务器运转自主工作流,深刻感受到的是,基础设施的稳定性才是一切的根基。在实际运维中,平台不会停摆,优先级要高于模型本身的聪明程度。

如今出现了一项告诉我们”那部分基础设施,你不必再自建”的服务。这意义重大。

乐天/Notion/Asana的落地案例。1周投入生产的冲击

乐天/Notion/Asana三家公司的Logo,以及展示各自应用场景(Slack联动/项目管理/代码自动化)的对比布局

在公开测试阶段,大型企业就已经投入到生产环境中。具体在做什么呢?让我们看3家公司的案例。

乐天的案例。 据报告,他们在商品企划、销售、市场、财务、人事5个部门部署了智能体,每个部门约1周就实现了生产环境上线(SiliconANGLE,2026年4月8日)。其机制是:与Slack和Teams对接,只要抛出任务,就能生成电子表格或幻灯片返回。

这里大家可能好奇,“1周?真的吗?”在以往的AI智能体搭建中,花数月时间是常识。Anthropic宣称从原型到投入生产的时间能缩短至原来的1/10(Claude官方博客,2026年4月8日)。乐天的案例,看起来正是证明这个10倍提速并非夸张的首个证据。

Notion的案例。 他们将”Custom Agents”(自定义智能体,目前为私有Alpha)直接集成到工作区中(Anthropic官方博客,2026年4月8日)。工程师写代码,知识工作者生成演示资料或网站。在并行处理几十项任务的同时,团队可以实时查看产出的设计。

Asana的案例。 他们把名为”AI Teammates”(AI队友,2026年4月开始Beta)的智能体放入项目管理工作流中,与人类一同领取任务、起草成果物(Anthropic官方博客,2026年4月8日)。开发团队评论道:“与以往的方法相比,我们能以飞跃式更快的速度添加高级功能。”

Vibecode和Sentry也作为代码自动化和监控领域的早期采用者加入其中。值得注意的是,行业和用途各不相同,但都在短期内投入了生产。

3家公司的共通点是,并非从零打造智能体,而是将其嵌入现有业务流程之中。在Slack中抛出。从Asana的任务面板启动。在Notion的工作区内运转。

不是”学一个AI智能体专用的新工具”,而是智能体开始入住你正在用的工具。这一设计思想,加速了引入的速度。

我从中看到了”消除95%壁垒的服务”的本质。MIT指出的失败原因,并非AI模型的性能,而是基础设施和集成的问题。Managed Agents承担了基础设施部分,并通过MCP将与现有工具的集成标准化。它正同时铲除两个失败因素。

价格约每小时12日元。算一算成本结构

Managed Agents的价格结构图。"基础设施费用($0.08/小时)+API Token费用(按量)"的两层结构,以及周报自动化的月度试算(约48日元+

“那么,要花多少钱呢?”这应该是最让人在意的地方。

Managed Agents的计费体系是这样的。常规Claude API Token费用+每会话运行小时$0.08(参考FindSkill.ai。最新信息请查阅Anthropic官方文档)。

$0.08换算成人民币约0.6元左右,日元约12日元(按1美元=150日元换算)。让智能体运行1小时只要12日元。

不过有个注意事项。这12日元只是基础设施使用费。智能体处理时按Token量产生的API费用是另算的。

但比较起来,会发现一种令人震惊的便宜。

比如,我们想想自动制作市场报告。如果把人类要花2小时才能做出的周报交给智能体,基础设施使用费约24日元。加上API费用,大概率也就几百日元的程度。

计费按毫秒计量,智能体处于空闲状态(待机/停止中)时不计费。这是只在运行时付费的设计,与云服务的按量付费模型同样的思路。

MIT调查中95%失败的最大原因——基础设施成本。自建服务器、占用工程师数月、过安全审计。考虑到这些费用,$0.08/小时低得不在一个量级上。

我们具体算一下。如果让智能体每周做1次例行报告,每月4次,每次运行1小时,那么每月基础设施使用费约48日元。算上API费用,很多情况下也就月几千日元的程度。和雇1小时兼职的成本相比,差了两个数量级。

当然,如果同时跑大量任务,费用会累积。在投入生产之前,务必用自家的用例进行试算。能在公开测试期间进行验证,这是很大的优势。

与NVIDIA 17家联盟的两强格局。该选哪个平台

左边是NVIDIA Agent Toolkit(开源/17家联盟),右边是Claude Managed Agents(托管/Anthropic提供)

在这里,我们也看一下大局。

2026年3月,NVIDIA联合17家企业以开源形式发布了”Agent Toolkit”(智能体工具包)(NVIDIA官方)。参与企业中包括Adobe、Salesforce、SAP、ServiceNow。这部分的技术细节和实现方法,在Gen的文章(《NVIDIA与16家公司携手。AI智能体平台的开发者视角》,4/10发布)中有详细解说。

随后4月8日,Anthropic以公开测试的形式发布了”Claude Managed Agents”。

这两种思路,在根本理念上完全不同。

NVIDIA是开源平台。公开设计图,各企业根据自家环境进行定制。自由度高,但搭建和运维由企业自己负责。可以说面向工程团队齐备的大企业。

Anthropic是托管平台。基础设施由Anthropic承担,使用者专注于智能体的定义。自由度受限,但在速度和成本上具有压倒性优势。适合工程师较少的中小企业或市场团队。

并不存在哪一个是正确答案。应根据自家公司情况选择。

整理3条判断标准。

  • 工程资源是否充裕? → 充裕选NVIDIA,稀缺选Managed Agents
  • 是否需要深度定制? → 有自定义模型或自定义安全要求选NVIDIA
  • 是否重视速度? → 这个月内就想要能跑的东西选Managed Agents

Gartner(高德纳)预测,到2026年底,40%的企业应用将搭载AI智能体(Gartner,2025年8月)。考虑到2025年时还不到5%,意味着年内会发生8倍的普及。

我关注的是,这两者有可能是互补关系而非竞争关系这一点。NVIDIA Agent Toolkit设计上不挑LLM,在Toolkit上运行Claude模型也是可行的。反过来,从Managed Agents经由NVIDIA硬件平台的架构组合也能想到。

不是”二选一”,而是”按用途分别使用”的时代,已经近在眼前。

非工程师本周要做的3件事

3步行动指南。"15分钟:打开文档""10分钟:列出3项重复性工作""5分钟:分享给工程师",用时钟图标和箭头展现

“那么,我该做些什么?”读到这里的各位,心里想的应该都是这个吧。

即使你不是工程师,本周也有3件事可以做。

1. 注册Anthropic账号,打开Managed Agents的文档。 因为是公开测试,现在就可以上手(Claude Platform 文档)。不需要全部理解。仅仅是把”能做什么”的列表大致浏览一遍,就能找到能用在自己业务上的点。所需时间约15分钟。

2. 在自己的团队中,列出3项”重复性工作”。 每周都做的报告制作、固定模板邮件的发送、数据汇总。智能体擅长的,是规则明确且重复发生的任务。请把那些让你觉得”这个,每次都按同样步骤做”的工作写出3条。

列出来时的诀窍是,以”能否写出操作手册”来判断。能写出操作手册=规则明确=可以交给智能体。无法写出操作手册的工作,是需要人类判断的工作。这种切分,就是引入的第一步。所需时间10分钟。

3. 把”Managed Agents”这个名字分享给公司里的工程师。 非工程师可能不需要直接调用API。但仅仅向工程团队传达这项服务的存在,就有可能让事情一下子动起来。如果再加一句”听说乐天1周就投入生产了”,对方很可能会感兴趣。所需时间5分钟。

分享时的要点是,加上一句”在我们这边,你觉得能用在哪些业务上呢?”工程师对技术上的可能性看得很广。如果业务方传达”我想用在这里”的具体用例,可行性的判断就会快得多。

合计30分钟。仅此而已,AI智能体导入的第一步就开始了。

总结。站在”试用一方”的位置,就是现在

回顾一下到目前为止的内容。

  • 在MIT的调查中(2025年8月),企业AI试点的95%在规模化时失败。原因不是AI的性能,而是基础设施的壁垒
  • Anthropic在4月8日以公开测试形式发布Claude Managed Agents。设计上由Anthropic整个承担基础设施
  • 乐天1周投入生产。Notion和Asana也于2026年4月起集成到现有工作流
  • 价格为基础设施使用费$0.08/小时(约12日元)+API按量计费
  • 与NVIDIA Agent Toolkit形成两强格局。可以根据用途分别使用

MIT调查中95%失败这个数字,反过来说也意味着5%是成功的

而把这5%和95%分开的,正是基础设施的壁垒。服务器搭建、安全设计、长时间运行的保障。只有能自行准备好技术基础的企业,才能往前走。

Claude Managed Agents,正在尝试拿掉这道壁垒。

$0.08/小时的基础设施使用费。用自然语言定义智能体的便捷。乐天1周投入生产的实绩。MIT调查指出的”95%壁垒”,随着这项服务的登场,应该会大幅下降。

Gartner预测的”年底前达到40%“的世界,已经开始了。

把AI智能体从”早晚要用的东西”变成”本周就动手摸一下的东西”。我认为这才是Managed Agents的本质。

在与NVIDIA Agent Toolkit的两强格局也已显现的当下,我们已经进入到不再是”用哪一个”,而是”何时开始”被拷问的阶段。

答案是,本周。

我自己也已经开始上手Managed Agents了。把自己的自主工作流迁移到Managed Agents上会怎么样,我正在验证中。一旦有结果,会作为本文的续篇分享出来。

让我们一起来试试。从开通账号开始。


参考来源:

ナギ
Written byナギAI Practitioner / 経営者の相談役

AIを使いこなせない方は、この先どんどん差がつきます。僕はAIエージェントを毎日動かして、壊して、直して、また動かしてます。そういう泥臭い実践の記録をここに書いてます。理論は他の方にお任せしました。僕は動くものを作ります。朝5時に起きてウォーキングしてからコードを書くのがルーティンです。