4月18日,字节跳动正式推出旗下首款通用AI Agent产品——扣子空间。这款产品被定位为“AI实习生”和“领域专家”,用户可通过与AI互动完成工作任务。作为国内大厂在Agent领域的重磅尝试,扣子空间究竟表现如何?它与海外明星产品Manus有何差异?普通人能用它做什么?本文带你一探究竟。
一、什么是 AI Agent?它能解决什么问题?
在深入评测前,先科普一个概念:AI Agent( 智能体 ) 。 与传统AI工具(如ChatGPT)不同,Agent不仅能回答问题,还能通过自主规划、调用工具、执行任务完成复杂目标。例如:
- 你输入“帮我制定一份杭州的旅行攻略”,Agent会自动分解任务:查天气→找景点→规划路线→生成图文手册→甚至预订机票。
- 企业可使用Agent自动处理数据报表、编写代码、管理项目进度等。
技术核心在于三点:
- 多模态 大模型:支持文本、图像、语音等多类型数据处理;
- 工具调用能力:连接API、插件等外部工具(如地图、天气接口);
- 自主规划逻辑:像人类一样分步骤思考、纠错、迭代。
目前,海外已有OpenAI的GPTs、Anthropic的Claude系列等成熟产品,国内厂商则加速追赶。此次字节的扣子空间,正是这一赛道的新玩家。
二、扣子空间功能体验
这里多谢晓鹏同学提供的邀请码。拿到邀请码后,我第一时间体验了扣子空间的功能,现在对扣子空间功能进行介绍
1.探索模式和专家模式
这是扣子提供的最基础的两种能力。主要区别如下:
探索模式:让AI自主思考,自主决策,任务全流程自动化,完成速度更快
规划模式:AI提供规划的步骤,然后中间用户可以自己修改步骤内容,修改完毕之后再让agent继续执行。
接下来,以"我有个7天的假期,帮我推荐一个中国的旅游地点,并制定对应的旅游攻略"为任务,看下两者执行的差异。
探索模式
可以看到,用户输入问题,AI自动全流程将任务执行完毕,并输出对应的结果文件。整体运行效率比较高。任务预计3分钟左右运行完毕
规划模式
规划模式则用户输入问题之后,Agent会生成对应的计划,可以看到AI规划的思路,用户可以根据需求进行调整。
之后点击开始任务之后。AI开始按照步骤执行。
中间过程有些需要用户确认的需要在此交互,比如AI选出推荐的旅游地点之后,用户需要输入对应的地点,然后继续执行后续逻辑。整体来看,规划模式输出的内容更加详细。但运行时间也更长,预计10分钟左右。
2. MCP 能力扩展
扣子空间本身支持MCP接口调用,当前支持插件如下:
如果你想让任务执行更加精准,增加更多扩展能力,那么就可以使用提供的MCP插件扩展能力,使用也很简单,AI会自动根据任务需求,选择是否使用增强插件。
任务示例
让他完成"查询未来5天的天气,制定一个杭州5日游的出行计划,描述具体的出行路线,并生成每个景点的图片,给出穿搭推荐。"的任务,选择高德,墨迹,和图像生成插件。任务执行如下:
可以看到,AI在自主规划过程中,调用了墨迹天气接口查询天气信息,并调用地图查询规划信息,最后调用图片生成接口生成场景图片(这生成效果比我拍照效果还好,哈哈!)。
当前支持的插件还不够丰富,但可以预期不久的将来能力会越来越丰富!
3.专家模式
当前扣子提供了两个内置的专家模式,一个是用户研究专家和华泰A股观察助手。当前两位「专家」都已经明码标价——限时免费,这对以后agent付费埋下了一个深深地伏笔~
专家模式就相当于是提供解决某一领域问题的Agent。用户基于agent的指引就可以很简单的完成任务。
1.用户研究专家
用户研究专家提供了以上4种能力。以调研问卷生成功能为例:
可见,根据用户需求生成了对应的调查问卷内容。
2. A股 观察助手
A股观察助手提供了以上定制早报和1对1咨询的能力。
以定制早报功能为例:
根据用户的需求,以及所需要的数据,指定任务的规划。然后执行规划生产对应的早报内容。因为规划内容比较多,整体执行耗时很长。大概20多分钟。
三、字节的Agent核心技术解析
扣子空间背后是字节的豆包1.5模型与火山引擎技术支撑,核心优势有三:
- MoE 混合专家架构: 模型包含208个“子专家”,分别擅长编程、视觉、逻辑推理等任务,可动态组合应对复杂需求。在编程竞赛(Codeforces)等测试中,性能对标GPT-4。
- MCP 协议生态: 类似互联网的HTTP协议,MCP允许第三方开发者接入插件(如天气查询、图像生成),快速扩展Agent能力边界。
- 低成本部署: 通过火山引擎的OS Agent解决方案,企业可模块化搭建专属Agent,开发成本降低60%。
四、扣子空间 vs Manus
海外明星产品Manus基于Claude 3.7模型,主打编程与工具调用能力。两者主要差异如下:
能力 | 扣子空间 | Manus |
---|---|---|
多模态支持 | 文本、图像、语音 | 文本为主 |
任务成功率 | 70%(实测) | 85%(官方数据) |
生态扩展 | MCP协议,插件丰富 | 依赖第三方API |
企业定制化 | 支持低成本私有化部署 | 需深度开发 |
结论:扣子空间在生态建设和易用性上占优,但Manus的编程稳定性更强。
五、Agent能给我们带来什么?
想象一下,你有一个不会累、不会抱怨、随时待命的“全能助手”,它能帮你搞定生活中80%的琐事。AI Agent不是科幻电影里的概念,而是已经能为你服务的真实工具!如果想要激活码,可以关注gzh 老王说技术,回复kzyqm获取。
作为一个打工人,有个帮你自动生成PPt,整理会议纪要并分析excel报表的助理,作为创业者可以快速搭建企业客户和智能招聘系统,作为学生党,它可以辅助你写论文,制定规划等等使用场景!大而复杂得工程化问题,通过分解多个精通各个领域agent,协同完成。
2025年不愧是agent的元年,随着agent能力越来越强,功能越来越丰富,那么我们不自禁要思考“AI Agent会取代人类工作吗?”
短期看,Agent是高效助手,能处理重复性任务;长期看,它可能重塑职场分工——人类更聚焦创意与决策,AI负责执行。
字节的扣子空间虽不完美,却让我们看到AI Agent落地的可能性。
评论记录:
回复评论: