微软给Copilot Cowork加速了智能体的脚步,来把复杂的工作流自动搞定。这家公司正在向着让AI像人一样工作的梦想前进,这些智能体不光会聊天,还能干些更难的活儿。今天他们宣布推出了Copilot Cowork,这是Microsoft 365里的新工具,能搞定以前必须有人盯着才能完成的那种“长期多步骤任务”。微软的工作AI首席营销官Jared Spataro在博客里写了这事。他说这个新功能是通过Frontier项目搞出来的,让企业能在大功能正式上线前先试一把。Copilot这个工具微软已经做了好些年了,不过以前它主要就帮着干活儿的人总结邮件、写文章。而Copilot Cowork是专为把任务交给AI干而设计的,人们不用自己一步一步去弄那些复杂的活计,只要说出想要的结果就行了。Spataro说用户只要告诉它想干啥,它立马就能规划方案并动手去执行。它会在各种Microsoft 365的软件和文件之间来回推理着干活。不过人眼还是得盯着它。在干活的过程中,人类能看着它的进度走没跑偏,一旦发现不对劲儿就能进去“矫正”它一下。这个系统靠Work IQ框架来教Copilot熟悉组织的数据环境,同时也保证遵守安全规定。Spataro说Copilot Cowork的核心理念就是提高效率,让人不用在不同软件间来回跳。哪怕是像做月度预算审查这种简单的活儿,也得在Excel、Outlook、Teams还有SharePoint这些平台之间来回切换找数据,还得跟同事商量完再把东西编成报告。Copilot Cowork把这些麻烦全给省了。它当起了“调度员”,搞定日常简报、管日历这些事都不需要你特意点每个步骤。Capital Group Companies Inc.的高级副总裁Barton Warner觉得这个东西不光是生成答案或者内容的工具。“它是把步骤连起来、协调任务、盯着工作流去执行的,”他解释道。 Copilot Cowork最牛的地方之一是用了多种模型的方式一起干活儿,把OpenAI集团的GPT模型还有Anthropic的Claude都整合进来了。这个公司新弄出来的“研究员”智能体就能看出来这种做法有多厉害。现在这个智能体通过新的“批评”层把这两个AI模型都利用上了。它干活的模式是让GPT先草拟个回应,然后Claude就去检查准确性和引述对不对。Spataro说这种搭配让研究员智能体在DRACO那个测试基准里的得分提了13.8%。还可以倒着来,让Claude先写回应,GPT再去做事实核查。之后用户可以用新的“模型委员会”功能去比较这俩模型的结果,看看哪里一样、哪里不一样、哪里又搞出了独特的东西。这感觉就像是让好几个研究员在一个项目上一起工作一样。 微软这么搞就是想建一个更皮实的系统。以前那种老系统有时候会瞎想(幻觉),现在通过让不同的模型扮演不同的角色——一个写回复、一个去批评——来减少这种情况。 有了这样能让人交叉核对不同AI干活儿的办法,企业以后用AI自动化的规模就能做得更大了。 Q&A A1:普通Copilot主要是让AI帮忙写东西或者总结啥的,而Copilot Cowork是为了把任务交给它去干的。它能搞定那种长时间跑多步的活儿,你只要告诉它想做成啥样就行。 A2:它用了多种模型一起干活儿。一个写稿子另一个去检查对不对和事实准不准。还有就是人得看着它走的路正不正。 A3:现在这个功能是通过Frontier项目开放给企业试用的。它是基于Work IQ框架的设计,能去学习组织数据的具体环境和规矩。