開発/設計

NVIDIA联合16家企业打造"开放AI智能体平台"。开发者本周应纳入代码的3项实现变革

⚡ 本文为系列第2篇。尚未阅读第1篇《Vibe Coding只是序章。"智能体工程"让开发者成为指挥家的日子》的读者,建议先从那篇开始。

NVIDIA联合16家企业打造"开放AI智能体平台"。开发者本周应纳入代码的3项实现变革
目次

⚡ 本文为系列第2篇。尚未阅读第1篇《Vibe Coding只是序章。“智能体工程”让开发者成为指挥家的日子》的读者,建议先从那篇开始。

16家企业站上同一舞台。GTC 2026究竟发生了什么

上一篇文章里我写到”开发者将成为指挥家”。即将到来的时代是——向AI智能体下达指令,代码的质量与方向由人来掌控。

就在那篇文章发布的下一周,指挥家的手边送来了一份”共同的乐谱”。

2026年3月16日,NVIDIA的GTC(GPU Technology Conference)大会。一条新闻稿的标题瞬间抓住了我的眼球。

“NVIDIA Ignites the Next Industrial Revolution in Knowledge Work With Open Agent Development Platform”

直译过来就是”用开放的智能体开发平台,点燃知识工作的产业革命之火”(NVIDIA Newsroom)。

看到表态采用的企业名单时我惊呆了(VentureBeat)。

Adobe(奥多比)、Atlassian(亚特拉森)、SAP、Salesforce(赛富时)。Cisco(思科)、CrowdStrike(众击)、ServiceNow、Siemens(西门子)。还有Amdocs、Box、Cadence、Cohesity。Dassault Systèmes(达索系统)、IQVIA、Red Hat、Synopsys(新思科技)。合计16家。

Salesforce和SAP,不正是在CRM领域正面交锋的两家公司吗?这两家居然宣布使用同一套工具包。

这不仅是技术层面的事。这是一个信号——“智能体开发的通用语言已经定下来了”。

对开发者而言,实现层面要把握的要点有3个。NeMo Agent Toolkit(NeMo智能体工具包)、A2A协议、OpenShell(开放外壳)。我们逐一来看。

16家企业的Logo列表,以及展示NeMo Agent Toolkit、A2A、OpenShell三层关系的架构图

NeMo Agent Toolkit。将现有代码智能体化的最短路径

我做的第一件事,就是打开NeMo Agent Toolkit的GitHub仓库(GitHub)。

这套工具包的卖点是”框架无关”。用LangChain(朗链)也行。LlamaIndex(驼羊索引)、CrewAI(船员AI)都能跑。Microsoft Semantic Kernel(语义内核)和Google ADK(智能体开发套件)也都支持。其设计精髓在于——现有代码可以原封不动地搬过来。

具体步骤是这样的。执行工具包的workflow create命令,就会生成项目的脚手架。核心是pyproject.tomlconfig.yaml这两个文件。用YAML定义智能体的构成要素。

# config.yaml 的结构示意(简化版)
# 用 NeMo Agent Toolkit 定义智能体的技能
workflow:
  name: my-first-agent
  description: "检索企业内部知识的智能体"

  # 指定要使用的框架
  framework: langchain

  # 列举技能(智能体能做的事)
  skills:
    - name: search_docs
      type: retrieval   # RAG检索
    - name: summarize
      type: generation  # 生成摘要

这一点正中我这个Vibe Coding出身者的下怀。只需写YAML就能搭出智能体的骨架,不必为代码架构设计苦恼好几天。

NVIDIA准备的”AI-Q Blueprint”也值得关注。这是一份检索型智能体的参考实现。在DeepResearch Bench这个精度基准测试中拿下了第一(NVIDIA Developer Blog)。“先看到能跑起来的东西,再据此做定制”是我的开发风格。我觉得这份蓝图作为入门口非常合适。

官方也公开了无需任何环境配置就能在Google Colab上运行的Notebook(NVIDIA Developer)。不用担心被环境搭建坑住,这一点真的很贴心。

提前共享一下踩坑点。NeMo Agent Toolkit最新版本是v1.5,但部分文档还停留在v1.4没有更新。config.yaml的schema有微妙变化的情况存在,请务必参考官方文档最新版。如果只看README就开干,会像我一样白白耗掉30分钟。

DeepLearning.AI上还有NVIDIA解决方案架构师亲自授课的免费课程(DeepLearning.AI)。主题是”如何让智能体在生产环境中可靠运行”,正是Toolkit引入之后必然要面对的问题。我推荐周末跑完AI-Q Blueprint之后立刻来上这门课。

A2A协议。智能体之间对话的通用语言

用NeMo Agent Toolkit做出来的智能体,单独使用也能发挥作用。不过真正有趣的,是把多个智能体串起来协作的时候。

这时候登场的就是A2A(Agent-to-Agent)协议。它最初由Google开发,目前已捐赠给Linux基金会,成为开放标准(A2A Protocol官网)。

A2A要解决的问题非常明确。“用不同框架开发的智能体,彼此之间如何交换信息”——它给出了答案。

也许有人会好奇A2A和MCP(Model Context Protocol)的区别。MCP是AI模型访问外部工具的规范。整理一下两者的角色是这样的。

  • MCP:智能体访问外部工具或数据源的规范。“打开工具箱的钥匙”
  • A2A:智能体之间相互委派任务的规范。“向同事请人帮忙时的通用语”

图解MCP和A2A的角色差异。MCP是智能体→工具/数据的单向箭头,A2A是智能体之间的双向箭头

NeMo Agent Toolkit从v1.4开始就标准支持A2A(NVIDIA NeMo A2A文档)。根据官方文档,现有的LangGraph智能体只需做最小的代码改动,就能升级为A2A兼容。

0.3版本中追加了gRPC支持和安全卡签名功能(Google Cloud Blog)。已有超过150个组织表态支持A2A。

“我们的智能体没法和别家对接”——这种说法已经越来越行不通了。

来看一段实现示意。给现有的LangGraph智能体加上A2A服务端能力,代码大概是这种程度的简洁。

# A2A 对接的最小构成(NeMo Agent Toolkit)
# 把现有的 LangGraph 工作流公开为 A2A 的示意
from nemo_agent_toolkit.a2a import A2AServer

# 把自己的智能体作为 A2A 服务端公开
server = A2AServer(
    agent=my_langgraph_agent,  # 直接传入现有的智能体
    name="doc-search-agent",
    description="检索并总结企业内部文档"
)
server.start(port=8080)
# 仅此一步,就能被其他 A2A 兼容的智能体调用

用MCP连接工具,用A2A连接智能体。这套二层结构很可能成为2026年多智能体开发的基本范式。

OpenShell。不让自主智能体脱缰的安全装置

老实说,每次听到”自主型智能体”的话题,我心里都会有点发怵。

“AI擅自调用API、擅自部署、擅自产生计费”——脑海里总会闪过这样的剧本。正因为是客服出身才更明白,用户一旦觉得”被AI做了意料之外的事”,信任就会瞬间崩塌。

针对这一点,NVIDIA推出了名为”OpenShell”的开源运行时。这是一套基于策略,对安全、网络控制和隐私护栏进行强制执行的机制(VentureBeat)。

简单说,就把它理解为”事先划定智能体能活动范围的盒子”吧。无论智能体变得多聪明,OpenShell未允许范围之外的API它就是调不到。

上一篇文章里我写过”看准何时叫停智能体非常关键”。OpenShell正是把那个”叫停标准”用代码定义出来的工具。

在个人开发场景中也大有用武之地。自己做业务工具的时候,“这个Bot要是失控了怎么办”的担忧总是如影随形。有了OpenShell,就可以用策略文件明确写出”可以做的事”和”不能做的事”的边界。

对一路秉持”能跑就行”精神过来的我而言,安全装置变成标配的时代,反而是值得欢迎的变化。

回想一下上一篇文章中提到的CurXecute(卡执行)。那是Vibe Coding工具刚被发现零点击漏洞之后的发布。自由行动的智能体安全行动的智能体两者兼得,正逐步成为可落地的现实。

16家企业同步行动的背景。Gartner”40%“预测的分量

为何16家企业要同步行动?背景是行业分析师的预测。“到2026年底,40%的企业应用将内嵌任务级AI智能体”——这一数字浮现了出来。2025年这一比例还不到5%,也就是一年增长8倍。

观察各家的动作,就能感受到那种紧迫感。

Salesforce在”Agentforce”服务中采用了NeMo Agent Toolkit。规划是构建面向销售、营销和客户服务的AI智能体。对话界面则设计为使用Slack。

SAP将把Agent Toolkit集成进”Joule Studio”平台。设想是在SAP BTP(Business Technology Platform)之上运行AI智能体。

Adobe则表态将把Toolkit应用于创造力、生产力以及营销领域的长时间运行型智能体。

也就是说——只要开发者在使用这些产品,背后就有可能正在跑着NeMo Agent Toolkit。即便不直接接触,作为生态系统的一部分了解一下,价值也很充分。

回想上一篇介绍的Pragmatic Engineer(务实工程师)调查。那份调查中,Claude Code以46%的得票率成为最受喜爱的工具。智能体开发的主战场正从”选哪个LLM”转向”在哪个平台上搭智能体”。NVIDIA这次的动作,正是这一转折的象征。

总结。这个周末可以做的3件事

上一篇文章里我写过”智能体工程让开发者成为指挥家”。今天想传达的是”指挥家的乐谱,已经可以以开源形式拿到手了”。

NeMo Agent Toolkit、A2A协议、OpenShell。这三块齐备之后,智能体开发的入口一下子敞开了。

这个周末能做的事,我列出3条。

  1. 克隆 NeMo Agent Toolkit的GitHub仓库github.com/NVIDIA/NeMo-Agent-Toolkit),跑一下AI-Q Blueprint。在Google Colab上也行得通,不用担心被环境搭建卡住
  2. 读一读 A2A协议规范a2a-protocol.org)。仅仅理解它和MCP的区别,下周的设计判断就会变得不同
  3. DeepLearning.AI的免费课程deeplearning.ai)做一次动手实操。课程内容由NVIDIA的解决方案架构师亲自讲授

作为一名曾经的”挫折工程师”,我能说的只有一句。“智能体开发,已经不再是只属于专家的领域。“写YAML、跑Blueprint、用A2A连起来。这第一步,今个周末就能迈出去。

“智能体工程”的概念与NVIDIA的实现基座连成了一体。从”概念”到”能写代码的状态”,转折正在发生。“高手工程师附体”的那种感觉,又能再深一层去品味了。

系列特辑第3篇预计将探讨”实现Gartner预测40%的3种架构设计模式”。在”选哪个平台”之后,接下来要面对的”如何设计”这个问题,我们将给出答案。



ゲン
Written byゲンCS × Vibe Coder

正直、一度エンジニアは諦めました。新卒で入った開発会社でバケモノみたいに優秀な人たちに囲まれて、「あ、私はこっち側じゃないな」って悟ったんです。その後はカスタマーサクセスに転向して10年。でもCursorとClaude Codeに出会って、全部変わりました。完璧なコードじゃなくていい。自分の仕事を自分で楽にするコードが書ければ、それでいいんですよ。週末はサウナで整いながら次に作るツールのこと考えてます。