首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

字节首款AI Agent「扣子空间」实测:比Manus强在哪?

  • 25-04-21 19:33
  • 3943
  • 14176
juejin.cn

4月18日,字节跳动正式推出旗下首款通用AI Agent产品——扣子空间。这款产品被定位为“AI实习生”和“领域专家”,用户可通过与AI互动完成工作任务。作为国内大厂在Agent领域的重磅尝试,扣子空间究竟表现如何?它与海外明星产品Manus有何差异?普通人能用它做什么?本文带你一探究竟。


一、什么是 AI Agent?它能解决什么问题?

在深入评测前,先科普一个概念:AI Agent( 智能体 ) 。 与传统AI工具(如ChatGPT)不同,Agent不仅能回答问题,还能通过自主规划、调用工具、执行任务完成复杂目标。例如:

  • 你输入“帮我制定一份杭州的旅行攻略”,Agent会自动分解任务:查天气→找景点→规划路线→生成图文手册→甚至预订机票。
  • 企业可使用Agent自动处理数据报表、编写代码、管理项目进度等。

技术核心在于三点:

  1. 多模态 大模型:支持文本、图像、语音等多类型数据处理;
  2. 工具调用能力:连接API、插件等外部工具(如地图、天气接口);
  3. 自主规划逻辑:像人类一样分步骤思考、纠错、迭代。

目前,海外已有OpenAI的GPTs、Anthropic的Claude系列等成熟产品,国内厂商则加速追赶。此次字节的扣子空间,正是这一赛道的新玩家。


二、扣子空间功能体验

这里多谢晓鹏同学提供的邀请码。拿到邀请码后,我第一时间体验了扣子空间的功能,现在对扣子空间功能进行介绍

1.探索模式和专家模式

这是扣子提供的最基础的两种能力。主要区别如下:

探索模式:让AI自主思考,自主决策,任务全流程自动化,完成速度更快

规划模式:AI提供规划的步骤,然后中间用户可以自己修改步骤内容,修改完毕之后再让agent继续执行。

接下来,以"我有个7天的假期,帮我推荐一个中国的旅游地点,并制定对应的旅游攻略"为任务,看下两者执行的差异。

探索模式

可以看到,用户输入问题,AI自动全流程将任务执行完毕,并输出对应的结果文件。整体运行效率比较高。任务预计3分钟左右运行完毕

规划模式

规划模式则用户输入问题之后,Agent会生成对应的计划,可以看到AI规划的思路,用户可以根据需求进行调整。

之后点击开始任务之后。AI开始按照步骤执行。

中间过程有些需要用户确认的需要在此交互,比如AI选出推荐的旅游地点之后,用户需要输入对应的地点,然后继续执行后续逻辑。整体来看,规划模式输出的内容更加详细。但运行时间也更长,预计10分钟左右。

2. MCP 能力扩展

扣子空间本身支持MCP接口调用,当前支持插件如下:

如果你想让任务执行更加精准,增加更多扩展能力,那么就可以使用提供的MCP插件扩展能力,使用也很简单,AI会自动根据任务需求,选择是否使用增强插件。

任务示例

让他完成"查询未来5天的天气,制定一个杭州5日游的出行计划,描述具体的出行路线,并生成每个景点的图片,给出穿搭推荐。"的任务,选择高德,墨迹,和图像生成插件。任务执行如下:

可以看到,AI在自主规划过程中,调用了墨迹天气接口查询天气信息,并调用地图查询规划信息,最后调用图片生成接口生成场景图片(这生成效果比我拍照效果还好,哈哈!)。

当前支持的插件还不够丰富,但可以预期不久的将来能力会越来越丰富!

3.专家模式

当前扣子提供了两个内置的专家模式,一个是用户研究专家和华泰A股观察助手。当前两位「专家」都已经明码标价——限时免费,这对以后agent付费埋下了一个深深地伏笔~

专家模式就相当于是提供解决某一领域问题的Agent。用户基于agent的指引就可以很简单的完成任务。

1.用户研究专家

用户研究专家提供了以上4种能力。以调研问卷生成功能为例:

可见,根据用户需求生成了对应的调查问卷内容。

2. A股 观察助手

A股观察助手提供了以上定制早报和1对1咨询的能力。

以定制早报功能为例:

根据用户的需求,以及所需要的数据,指定任务的规划。然后执行规划生产对应的早报内容。因为规划内容比较多,整体执行耗时很长。大概20多分钟。


三、字节的Agent核心技术解析

扣子空间背后是字节的豆包1.5模型与火山引擎技术支撑,核心优势有三:

  1. MoE 混合专家架构: 模型包含208个“子专家”,分别擅长编程、视觉、逻辑推理等任务,可动态组合应对复杂需求。在编程竞赛(Codeforces)等测试中,性能对标GPT-4。
  2. MCP 协议生态: 类似互联网的HTTP协议,MCP允许第三方开发者接入插件(如天气查询、图像生成),快速扩展Agent能力边界。
  3. 低成本部署: 通过火山引擎的OS Agent解决方案,企业可模块化搭建专属Agent,开发成本降低60%。

四、扣子空间 vs Manus

海外明星产品Manus基于Claude 3.7模型,主打编程与工具调用能力。两者主要差异如下:

能力扣子空间Manus
多模态支持文本、图像、语音文本为主
任务成功率70%(实测)85%(官方数据)
生态扩展MCP协议,插件丰富依赖第三方API
企业定制化支持低成本私有化部署需深度开发

结论:扣子空间在生态建设和易用性上占优,但Manus的编程稳定性更强。


五、Agent能给我们带来什么?

想象一下,你有一个不会累、不会抱怨、随时待命的“全能助手”,它能帮你搞定生活中80%的琐事。AI Agent不是科幻电影里的概念,而是已经能为你服务的真实工具!如果想要激活码,可以关注gzh 老王说技术,回复kzyqm获取。

作为一个打工人,有个帮你自动生成PPt,整理会议纪要并分析excel报表的助理,作为创业者可以快速搭建企业客户和智能招聘系统,作为学生党,它可以辅助你写论文,制定规划等等使用场景!大而复杂得工程化问题,通过分解多个精通各个领域agent,协同完成。

2025年不愧是agent的元年,随着agent能力越来越强,功能越来越丰富,那么我们不自禁要思考“AI Agent会取代人类工作吗?”

短期看,Agent是高效助手,能处理重复性任务;长期看,它可能重塑职场分工——人类更聚焦创意与决策,AI负责执行。

字节的扣子空间虽不完美,却让我们看到AI Agent落地的可能性。

注:本文转载自juejin.cn的王老狮的文章"https://juejin.cn/post/7495025763788570636"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2491) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

109
人工智能
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top