行业资讯

Agent集体进化!腾讯谷歌们加码,AI打工东说念主要晋升了?

发布日期:2026-06-01 15:27    点击次数:115

Agent集体进化!腾讯谷歌们加码,AI打工东说念主要晋升了?

最近我的 X 首页有点奇怪,对于 Agent 的帖子彰着变多了,但和昔日那种「某某模子评测」不同样,全球好像不再相貌这个模子答题答得有多好,更介怀一件更现实的事,哪个 Agent 能帮我把手头这件事作念完?

在刚刚完毕的 5 月,「异事」多了起来。5月20日,推出了叫「马维斯」(Marvis)的东西,官方定位是「操作系统层级 AI 助手」,Windows、macOS、安卓三端同步上线,内置 6 个 7×24 小时在线的专项 Agent,每个讲求一块:文献、浏览器、诳骗、搜索、筹算机操控,装机即用。第二天,OpenAI 在 5 月 21 日晓谕 ChatGPT 以 add-in 格式接进 Microsoft PowerPoint,免用度户和 Business 订阅者皆能用,在 PowerPoint 里开个侧边栏,用当然言语生成或修改 PPT。

而在统一周,Google 在 I/O 2026 上推出了 Gemini Spark,一个不错 24 小时抓续跑的个东说念主 Agent,运行在 Google Cloud 专属杜撰机上,能读你的邮件、改你的文档、通过 Chrome 操作网页,你以致不需要盯着它,这些活皆颖异完。

(图源:雷科技制图)

这就不难知晓为何风向转得如斯之快了,在一大堆 AI 器具的轰炸之下,无数平淡东说念主照旧不那么介怀一个新的大模子能答对几许数学题,反倒是对 Agent 颖异什么活更有益思意思。

把 Agent 变「牛马」,AI 要给打工东说念主打工?

先说 ChatGPT for PowerPoint,加了 add-in 之后,PowerPoint 右边会出现一个 ChatGPT 侧边栏,告诉它「作念一份面向投资东说念主的居品演示,从上周 Outlook 里找形式发达」,它会拉数据、生成内容、排好版,全程不离开 PowerPoint。能连 Gmail、Outlook、SharePoint,也即是说它在尝试「帮你整合信息」,不仅仅「帮你生成」。

施行用下来,生成一份结构齐备的初稿速率快,开会前临时要一份 PPT 的场景基本够用。OpenAI 我方也坦诚,复杂的模板处理和字体排版暂时还不救济。雷科技此前也挑升针对这个插件作念了能干的体验讲述,感意思意思的一又友不错点击查阅。

(图源:雷科技制图)

说实在的,像这类 AI 器具插件,并不荒原,实质上它们如故在一个专项的场景里提供匡助,以致当前还皆不太熟悉。但腾讯推出的马维斯不同样,它是一个网状式 Agent 智能体书册,一个主 Agent 在上头统筹任务,底下休养 File、Computer、App、Browser、Search 这些专项 Agent 并行施行,把系统、文献、诳骗、算力、跨端收敛皆纳进统一个中间层。你告诉它「帮我找上周 PM 发给我的阿谁 Agent 架构图 PPT,文献名忘了,保存在桌面」,它会扫文献内容、作念语义知晓,而不是在文献夹里按要道词搜索。

(图源:雷科技制图)

施行上手试了几个场景,比如最开动咱们让它拉个复盘会需要准备的材料。马维斯的回复先作念会前准备表,再给 90 分钟议程,规矩合适施行责任流,还把会前手脚拆成了可分派的任务:运营拉踪迹质地数据、居品汇总客户响应、销售整理卖点问题,每项皆有讲求东说念主和预期产出。它很机灵的点在于,会把「卖点不了了」翻译成「整理客户原话和具体场景」,这很实用。

再比如把一份 Word 筹议简报和一张 Excel 明细表同期上传,让它找销售额、毛利、地区排行,以及有莫得彰着极度。它调用了 File Agent,把两份文献跨表串联起来,给出了销售额 2,357,512、毛利 836,257、华南地区最高,还把叠加客户电话、空讲求东说念主、零数目售后单、极度大单这几类问题皆列出来了。

虽然,恭候时刻比较长如故不太能苛刻的。通俗的开场问答简略要 30 秒,不是瞬时;文献分析的话,从提交到最终恶果简略 6 分钟,况且中间进程的颗粒度不够细,你能看到 File Agent 在处理,但不知说念它读到那处、还要多久。对于「我手上有材料、开会前念念快速扫一遍」的场景,6 分钟如故不错承袭的。

(图源:雷科技制图)

不外呢,马维斯最近能奏效出圈,我觉得如故和他的联想关联。在侧边栏咱们不错看到一个叫「办公室」的页面,大开是一个白色 3D 办公室场景,Marvis、App Agent、Browser Agent 像几个职工坐在各自的工位上,右侧展示本日任务完成数、Token 耗尽和进行中的任务。它宅心思的动画,正在播放+日韩+无码直不雅地把 Agent 与 Agent 之间是怎样勾搭、怎样分派任务的进程展现出来,比较起无聊乏味的器具,「AI 牛马」的形象太深化东说念主心了。

岂论深度怎样,从在 PowerPoint 里帮你一键出稿,到在整台电脑上帮你调文献、开会议、扫极度,它们皆指向统一个标的:AI 正在从一个回复问题的器具,酿成一个坐在工位上处理杂活的共事,分离仅仅这个共事是干杂活,如故干专精的活。

腾讯OpenAI谷歌们拼尽全力图夺「AI 工位」

这一轮抢位置的热度,很猛进程上是 OpenClaw 烧起来的。

OpenClaw 的前身叫 Clawdbot,奥地利独处成就者 Peter Steinberger 在 2025 年 11 月作念出来的,开源、不错跑在土产货。起初莫得几许东说念主防范,直到 2026 年 1 月几个视频传开,比如「AI 自主买车」「30 分钟完成代码迁徙」,成就者圈子一下子炸了。Clawdbot 两次因商标问题更名,最终命名 OpenClaw,从第一个版块到 GitHub Stars 破 25 万,只用了简略 60 天,速率比 React 十年积贮的还快。首创东说念主随后在 2 月加入了 OpenAI,不时作念 Agent 标的。

OpenClaw 之是以能爆,不仅仅因为它簇新,而是它第一次让平淡用户真实感受到「AI 在帮我干活」是什么嗅觉,而不是「AI 在帮我回复问题」。它能读土产货文献、操作诳骗、调用浏览器、施行多步伐任务,靠一套叫 ClawHub 的技巧注册表把 LLM 和真实器具连起来。这套架构阐明了一件事,那即是把 AI 酿成一个真的在电脑上干活的脚色,这件事工夫上是不错作念到的,况且用户隆盛用。

(图源:雷科技制图)

OpenAI 最开动推出 Codex 的时候,它还仅仅一个比较单纯的 AI 代码器具,给成就者写代码、修 bug、提 PR 用的。但从 2025 年 5 月到当前,Codex 偷偷酿成了另一个东西——它能操作电脑、运行内置浏览器、处理图片、跨器具施行任务,还加入了「Goal Mode」,也即是你说一个办法和奏效表率,让它我方抓续跑,知说念任务完成。

这个变化不是 OpenAI 一开动就谈论好的居品门道,一个充足颖异的 Agent,惟有在某一个场景里阐明了我方,就会当然地往相邻任务推广。编程之后是代码调试,调试之后是形式责罚,形式责罚之后是操作浏览器、处理文献、知晓凹凸文等等。

这亦然为什么腾讯要从操作系统层级切入,Google 要把 Gemini Spark 作念成 24 小时不休线的抓续 Agent,微软要在 PowerPoint 里鼓励 Agent Mode,而不是不时升级阿谁照旧够用的聊天窗口。Gemini Spark 内置了对 Gmail、Google Docs、Sheets、Slides 的原生调用权限,实质上,他们皆在抢一个位置——「AI 工位」。

(图源:雷科技制图)

「AI 工位」最中枢的压根不是一台装了 AI 软件的电脑,也不是桌面上多出来的一个聊天框。更准确地说,AI 工位是一种新的责任关系,当东说念主把办法、材料、权限和验收表率交出去,AI 就在文献、诳骗、浏览器、系统和云行状之间休养手脚,东说念主从施行者酿成责罚者、审核者和终末拍板的东说念主。虽然,这其实即是把 AI 当「牛马」用。

AI 办公加快迭代,平淡东说念主成最大受益者

AI 工位对平淡东说念主的意旨,不是让每个东说念主片刻领有一个魁岸上的智能办公室,而是把「我躬行操作软件」酿成「我分派一件责任」。东说念主不再需要记着材料放在哪个文献夹、哪个诳骗讲求哪一步、输出要复制到那处,而是把办法说了了,让 AI 去找、去读、去整理、去调用器具,终末把恶果交追究,就像你在用马维斯的时候,你不错看到哪个 Agent 被你调用,哪个 Agent 又去「摸鱼」了。

这亦然为什么它会比单点器具更适合平淡东说念主,也更是大厂们念念要掠夺的进口。一个 PPT 插件再好,实质上如故帮你作念一份 PPT;一个确凿熟悉的 AI 工位,除了完成这份 PPT,还会趁便帮你准备好陈述的其他需求。这即是插件和 AI 工位的分离。

(图源:雷科技制图)

虽然,当前来说,平淡东说念主会起初感受到AI 工位的反作用,比如 AI 要替你干活,就必须看见更多文献、拿到更多权限、知晓更多凹凸文,昔日你把一句话丢给聊天机器东说念主,错了大不了重问,当前把一串任务交给 Agent,错的可能是文献、数据、日程、格式,以致是一次对外发送。是以 AI 工位确凿晋升之前,用户需要学会的不是更复杂的指示词,而是更了了地界说办法、收敛鸿沟、查验恶果。

但至少,AI 工位把咱们从「打工的牛马」中自若出来,这即是它爆火的中枢原因。