
最近的 Agent 赛谈kaiyun中国官方网站,又让东谈主雀跃起来了。
在近期 Manus 发布 1.5、OpenAI 发布 ChatGPT Atlas 后,昨晚,Flowith 也发布了其全新的 Agent 家具「Flowith OS」,并在硅星东谈主会客厅举办了一场线下公测行动。

行动刚扫尾,社群就活跃起来:有东谈主让 OS 翻开豆瓣给热点电影打分,有东谈主则干脆让它接受了我方的小红书账号,已毕了内容的全自动发布。

来自社群实测
用户的关心不难交融——当行业还在商议那些能写讲述、编小游戏的"高等用具"时,一个能"看懂"用户屏幕、并"登程点"履行任务的 Agent 终于出现了。
但更引起咱们看管的,是 Flowith 给这个家具的定名:FlowithOS。
尽管现在它以一个寂寥的浏览器形态存在,但 Flowith 将其定位为全球首个为 Agent 原生蓄意的操作系统(Agentic Workspace)——不再是网页或插件,而是一个需要下载到你电脑上的寂寥运用。
通俗来说,当你用当然话语下达一个教唆后,它就能通过"代码 + 视觉"的边幅交融你的屏幕,并自主念念考和操作。它的 " 手 " 既能跳跃多个网页完成点击、剪辑、发送,也能通过调用末端翻开你腹地的软件,举例 Claude code。这也意味着 AI 操控电脑将不错不单局限于云霄捏造环境,也不再是随时恭候东谈主类接受的半自动家具,而是着实由 Agent 进行"端到端"的自主履行。
这种蓄意念念路,在当下的 Agent 家具中显得非常激进。
从最近的 Manus 1.5 到 GPT Atlas,一个领会的趋势是:各人都在争相为 AI 安上"动作",鼓舞它向"步履派"进化。但比拟之下,FlowithOS 更绝对地把我方作念成一个"给 Agent 使用的操作系统"。
现在看来,这种激进也带来了推行的效果。在 Online-Mind2Web 的跑分中,Flowith OS 照旧特殊了 Altas。

咱们也第一时辰测试了 FlowithOS,并和他们聊了聊,试图搞了了:为什么在这个时辰点,用这么一种边幅入局?以及,OS 和其他 Agent、AI 浏览器家具,有什么不相似?
FlowithOS 中枢功能:履行、履行,如故履行
FlowithOS 想作念的,是绝对让 Agent 接办任务的全经由,作念跨平台、高自主性、可交互性的复杂使命。
它为智能体构建了一个能够陆续进化的步履空间,其中枢亮点包括:
一是跳跃界限的任务录用: 它让 Agent 的步履不再局限于单一网页或运用。通过无穷措施的险阻文交融,Agent 能够串联起完整的端到端使命流,径直替你写稿、替你发布,将你的想法转化为真实遵循。
二是网页交融才气:基于自研的"代码 + 视觉"双模态交融框架。该框架在 Web Agent 测试(Mind2Web)中登顶全球榜单,跑分特殊了 OpenAI 最新发布的 ChatGPT Atlas,这也意味着 OS 领有更强的念念考才气、网页交融力与操作精度。
三是自主进化、自主履行: FlowithOS 不是用完即走的用具,而是一个能寂寥"上班"的数字职工,能够胜任高频往来监控、社媒账号运营等需要陆续优化的动态任务。
固然,抛开"操作系统"和"自主进化"这些高简略念,FlowithOS 的推行是通过自动化的降本增效。它在真实场景下的任务见遵循有多高,它为用户检朴的时辰,是否多于花在学习、设立和拯救失败任务上的时辰 ...... 咱们围绕这些问题伸开了实测。
1. 基础交互与任务履行
翻开 FlowithOS,领先是一个颇有蓄意感的简陋界面,中心是一个输入框。你不错在框中聘用 Google 进行搜索,把它当成一个野蛮的浏览器来用;或者,你不错聘用 Run Task,径直参预 Agent 模式。
同期,界面右下角的圆形按钮,也提供了一个快捷进口,让你随时叫醒 Agent 发布任务。

为了裁减使用门槛,FlowithOS 的输入框还具备自动补全和优化 Prompt 的功能,匡助用户更领会、更高效地发布任务教唆。

一朝你提倡任务,Agent 会在界面右侧及时展示它的"念念考过程"——分析任务、拆解措施、履步履作。同期,它会在左侧的标签页(Tab)中我方翻开新的页面,进行跨页面的搜索、信息整合与操作。
在 OS 履行的过程中,你不错随时点击 Pause 或双击页面暂停、进行接受,也不错随时以对话的形式,输入新的 prompt 调养 AI 接下来的程度。
理阐述再多,不如径直上场景。
上周,Flowith 市集崇拜东谈主拐子就在内测中尝试了让 OS 接受我方的小红书账号,自主创作并发布了一个帖子" Ask anything ",同期把酬谢辩驳的权限也皆备交给了 Agent。

尽管这个 Agent 时而会冒出一些略显"中二"的赛博东谈主机酬谢,但时而又会有让东谈主目前一亮的辩驳。最经典的莫过于底下这条,当有东谈主问及"能不成眨眼间给我打两千块",Agent 在辩驳区径直 @了 CEO Derek,肯求通达转账权限,彰着是"学习"到了东谈主类天下的组织架构。
咱们也用一个真实任务测试了它的才气。布景是,咱们在杭州举办了一场微型的 IROS 会后派对,需要邀请小红书上对此感风趣的 IROS 参会用户。这是一个尽头繁琐、近似性极高的任务,完好契合了 AI 批量履行的场景。
按捺是,当我将我方的账号 Earth 权限交给了 OS 后,它作念到了 ...... 一部分。

在这个过程中,咱们尝试了两版 Prompt:
• 通俗版 Prompt:
你是 硅星东谈主 的 AI 助手,在小红书上头搜索 2025 IROS 磋磨帖子,按时间线确保是本年的,并辩驳帖子,邀请他来参加咱们在 23 号组织的 After party,不错看硅星东谈主 pro 主页了解行动笃定,口吻开畅真谛真谛小数。
因为只给出了迂缓教唆。在履行过程中,OS 的见遵循梗概在 30% 傍边。它偶尔会"神游",比如刷着帖子摸鱼;偶尔会"犯综合",翻开了帖子但找不到辩驳按钮;无意输入了文本却莫得点击发布,就我方判定任务见效了。
不外,因为并非云电脑捏造要津,用户也不错参与 AI 合作,比如,在 AI 找不到输入框的时候,咱们滑动鼠标点开输入框,让 AI 学习这通盘径。
• 正式版 Prompt ( 由 Claude + 东谈主工优化 ) : 提供了尽头领会的措施和轮换。此次,OS 的见遵循飙升至接近 100%。由于它的辩驳速率实在太快,而咱们的派对席位有限,我不得不火速休止了它"狂热"。
[ 布景 ] 你是我的 AI 助手,你的任务是在小红书平台上推行一场行将举行的行动。
[ 主意 ]
平台 : 小红书
行动 : 23 号的 IROS After Party
主意用户 : ( A ) 发布了对于" 2025 IROS "帖子的博主 ( B ) 每一个酬谢了这些帖子的用户。
[ 中枢案牍形式 ] " 你好,我是硅星东谈主 PRO 的 AI 助手,咱们在 23 号包场组织了一个 After party,有风趣参加吗,不错看硅星东谈主 PRO 的小红书主页了解行动笃定 [ 具体邀请可修改,模拟一个诚笃有梗的东谈主,而不是一个冰冷的机器 ] 。"
[ 履行经由 ( 自动化轮回 ) ]
1、登录 : 登录小红书账号。
2、搜索 : 使用搜索枢纽词列表 : [ "2025 IROS", "IROS 杭州 ", "IROS 2025 杭州 ", " 智能机器东谈主大会 杭州 " ] 。
3、筛选搜索按捺:按"最新发布"排序,确保帖子是近期的。
遍历帖子 ( 轮回 ) :
对于搜索按捺中的每一个磋磨帖子,履行以下操作:
4、操作 A:辩驳博主 ( OP )
翻开该帖子。
定位到主辩驳输入框。
输入 [ 案牍 ] 。
点击"发送"。
5、操作 B:辩驳总计酬谢者
在面前帖子下,翻开辩驳区,并确保加载总计辩驳和酬谢(可能需要模拟"点击稽察更多酬谢")。
遍历(For-Each Loop)辩驳区中的每一条辩驳(无论是一级辩驳如故二级酬谢):
If 该条辩驳的作家 不是 你我方:
点击该条辩驳的"酬谢"按钮。
在 @对方的输入框中,输入 [ 案牍 ] ,案牍按照形式,可调养。
完成总计酬谢的遍历后,复返搜索按捺列表,翻开下一个帖子,近似措施 4。
这个任务场景具有极强的移动性。任何需要批量磋磨他东谈主、进行近似性网页操作的场景,表面上都不错交给 OS 来完成。
但现阶段,你仍然要以实足的耐烦盯着 OS 不要拿你的账号鼎力妄为,并哑忍永劫辰的、有失败概率的任务过程。
除了这些严肃的使命,Flowith 还与咱们共享了一个极具文娱性的案例:让 OS 帮你打德州扑克,而况还赢钱了。
这岁首,一个好的 Agent 竟然不错我方出去赢利养家了。现在这个 Prompt 照旧被收录在 OS 的官方示范案例中,用户不错径直点击初始。只是咱们很有趣,如若你的 OS 在牌桌上际遇了别东谈主的 OS,到底谁能笑到临了?

固然,除了文娱和批量任务,由于 Flowith 主站原来就擅长的深度筹议范围,在沿用了 Neo 时候架构 + 真实的履行环境后,OS 也能够阅读更多的内容、更好地交融图文信息、进行跨页面浏览,从而给出转变式的讲述了。
2. Skills:千里淀可复用的"肌肉挂牵"
除了基础的家具逻辑,OS 还上线了一个枢纽功能:Skills。这与 Claude 有相似之处,更侧重于履行旅途的千里淀。

当一个 Agent 第一次见效完成某个复杂任务时,比如"在小红书上筛选特定立场的商品并加入购物车",它不错将这个任务的最优履行旅途纪录下来,酿成一个可复用的" Skill "。由此,下次当你或其他东谈主需要履行类似任务时,Agent 就不错径直调用这个已警告证过的"肌肉挂牵"。
更进一步,FlowithOS 团队会将用户高频使用、响应雅致的任务经由,通过检修固化为程序的 Skills,让所灵验户的 Agent 在异日履行该任务时都具备极高的见遵循。
在现在的 Skill 库中,OS 照旧不错翻开你的 Claude Code 页面来编写代码,也不错翻开你的 terminal 进行操作了。同期,你也不错将我方调养好的 Skill 上传,异日或可进行社区化的共享和传播。
3. Memory 和 Knowledge Base:让 Agent 更懂你
除了 Skills,Memory(挂牵)系统和 Knowledge Base(学问库)是让 Agent 变得"专属"的另外两大复旧。
Memory 系统会记着你造访过的网页、履行过的任务以及个东谈主偏好。这与传统浏览器的历史纪录不足为法,其纪录的颗粒度要雅致得多。这为 Agent 提供了丰富的个性化险阻文,使其方案和步履都更靠近你的民风。
而 Knowledge Base 则从 Flowith 主站蔓延而来,允许你上传文档、相接等费力,构建属于我方的学问库。Agent 在履行任务时,会优先从这个学问库中寻找谜底和布景信息,让它更懂你的使命范围和特定需求。
还牢记上文提到的 OS 接受"拐子"小红书账号的案例吗?Agent 之是以知谈要 @Dereck 来肯求权限,恰是因为它从学问库中知谈了谁是崇拜东谈主。
一言以蔽之,在屡次实测中,咱们发现 FlowithOS 对不同类型网页的适配程度存在一定相反。在 Twitter、小红书、微博等结构相对程序化的应对媒体平台上,它能相瞄准确地识别帖子内容、交融辩驳语境、以至把抓平台的"网感"来生成适合的酬谢。
可是,在淘宝、京东这类电商网站上,面临多重下拉菜单、动态加载的商品列表以及复杂的促销弹窗时,它偶尔会出现定位不准或操作失败的情况,对商品进行比价、对图文商品相接进行整理,发达还不及。
Flowith 对此讲解谈,"咱们在此处对 Agent 使用了 periodic online reinforcement learning,跟着用户更多使用,总计 OS 会变得愈加机灵。"
"家具现在仍处于公测阶段,总计功能均免费绽放,公测时间的中枢主意是采集用户在真实场景下的响应和 Agent 的发达数据。这些贵重的数据,将径直用于后续的 Agent 迭代和功能优化。"
FlowithOS 是一个 Browser Agent,更是一个给 Agent 使用的操作系统
从实测按捺来看,FlowithOS 在家具形态和底层逻辑上,与市面上其他主流的 Agent 家具迥然相异。要交融它的私有性,咱们必须先明确它与另外两个代表性家具 Manus 1.5 和 Atlas 的永别。
比拟之下,更侧重于编程才气的 Manus 1.5 ,中枢念念路更像是在家具里面构建一个闭环的、苍劲的才气集。举例,它强调通过"内置"用具(tool)和配套架构,让用户不错径直在家具内"一句话构建运用",将完成复杂任务所需的中枢才气集成到本身。
而 Atlas 领先是一个浏览器,Agent 在其中是一个中枢但可选的"模式",与旧例浏览功能并存,它的重心在于从用户使用场景切入,为用户提供一个更完整的生态链路,为 Agent 提供一个更方便的初始载体。
而 FlowithOS 将我方界说为操作系统,其浏览器界面只是是这个系统为 Agent 提供的"图形界面"。与 Manus 的"内置集成"念念路相背,FlowithOS 的中枢是调理和编排外部生态的才气。
举例,在处治编程任务时,它并非我方构建一套编程用具,而是通过调用 Claude Code 等外部功能和生态来已毕。
当咱们把 FlowithOS 放弃在更宏不雅的 AI 家具图景中进行注目时,会发现它所作念的事情既有相反又有共鸣。
共鸣在于,无论是 OpenAI 的 Atlas、Manus 的 1.5,如故种种 AI 编程助手,都在不谋而合地从"交融和生成"向"履行和自主"进化。AI 不再雀跃于作为一个学问问答或内容创作的用具,它必须参预东谈主类的使命流,径直操作运用、完成任务,才气开释下一阶段的坐褥力价值。浏览器,作为蚁合东谈主与互联网业绩的最主要进口,当然成为了这场进化的中枢战场。
其相反则在于,它可能是现在市面上第一个明确将我方界说为" Agent 操作系统",而这决定了家具的进化旅途。FlowithOS 的功能、交互蓄意,都是从" Agent 何如更好地履行"这个第一性旨趣登程,而非"东谈主类何如更方便地使用"。
正如拐子所说:"用户是否使用咱们的 OS 作为浏览器其实无所谓kaiyun中国官方网站,因为这个浏览器推行上是给 Agent 作念操作系统用的,咱们更但愿用户翻开 OS 是让 Agent 不错有更高权限的环境自主使命。"
