人工智能助手获计算机控制权限引关注 安全机制与功能边界成焦点

一、问题:从“会对话”走向“能动手”,通用助手面临落地瓶颈 近年来,智能助手文本生成、检索问答、代码编写诸上进步明显,但进入真实工作流后仍常卡在“最后一公里”:用户需要在不同软件、网页与本地文件之间来回切换,不少操作缺乏统一接口可调用,导致助手“能给建议却难以代办”。在这种情况下,让助手具备对屏幕进行操作的能力,被视为行业从信息提供者走向任务执行者的一条关键路径。 二、原因:工具集成不足与复杂工作流需求,推动“屏幕级控制”方案 据介绍,Anthropic此次推出的“计算机使用”功能,核心逻辑是“能集成就走集成,集成不了就接管屏幕”。助手接到任务后,会先判断能否通过现有连接器调用日历、协作沟通等工具完成指令;若缺少合适的连接方式,则以屏幕为媒介进行导航与操作,模拟人类在电脑上的点击、滚动、打开文件、使用浏览器和运行开发工具等步骤。 该功能还与移动端任务分发工具Dispatch配合:用户可在手机端下达指令,由助手在电脑端执行。“远程派单+电脑执行”的组合,瞄准的是跨场景、跨设备的碎片化办公需求。 三、影响:对开发与办公效率或有提升,但稳定性、速度与边界仍待验证 从应用层看,这类能力对开发者的吸引力更直接。企业称,助手可在集成开发环境中修改代码、提交拉取请求、运行测试等,将部分重复操作交由系统处理,把人力从流程性工作中发出来。对一般办公用户而言,如果能在网页操作、资料整理、表格录入、信息归档等任务中稳定运行,也可能减少重复点击和跨应用切换的成本。 不过,研究预览版也暴露出一些限制:其一,平台覆盖有限,目前仅支持Mac,Windows和Linux用户暂无法使用;其二,执行效率与准确率受“屏幕操作”机制影响,复杂任务可能需要多次尝试,且通常慢于直接调用应用接口;其三,系统仍处早期阶段,企业也承认可能出现失误,仍需依赖用户反馈持续迭代。 四、对策:权限优先与风险提示并行,安全治理成为产品成败关键 在“让助手触达电脑”的模式下,安全风险被放大:一旦系统获得对浏览器、文件与应用的操作权,风险不再只是回答错误,还可能涉及账户权限、数据泄露,甚至被诱导执行危险操作。 为此,企业提出以“权限优先”为基本框架:助手接触新应用前需请求授权,用户可随时中止操作。同时表示将持续加强防护,重点应对提示注入等常见攻击,并对其他潜在漏洞进行扫描。企业还建议在研究预览期间避免让系统接触敏感数据,以降低测试阶段的不确定性风险。 从行业视角看,这也指向同类产品的共同难题:在提升可用性的同时,建立可审计、可撤销、可分级的权限体系,并通过沙箱隔离、操作日志、风险提示与异常拦截等机制,把“能做什么、何时做、做到哪一步”纳入治理范围。 五、前景:计算机操作能力将加速竞争,但“可信执行”决定长期走向 业内普遍认为,计算机控制能力是智能体走向规模化应用的关键一环。包括多家国际科技企业在内的竞争者也在推进可安全操作电脑的系统,竞争焦点正从模型“会不会说”转向系统“能不能稳、敢不敢放、出了事能否追溯”。 未来一段时间,这类产品可能沿三条路径演进:一是从“屏幕操作”逐步过渡到更多“接口直连”,提升速度与可靠性;二是强化跨平台能力,覆盖更多操作系统与常用软件生态;三是把安全从“提示与授权”更推进到工程化体系,例如默认最小权限、分级审批、可回滚与可审计。对企业用户而言,是否具备合规可控的部署形态、能否与既有身份管理和数据治理体系对接,将成为是否采用的重要考量。

从屏幕到系统、从建议到执行,智能体能力正在打开新的效率空间。但越接近“可操作权限”,越要求技术与治理同步迭代。如何在提升生产力的同时守住安全边界,将成为此类产品能否真正进入主流工作场景的关键。