微软给copilot cowork 加速了智能体的脚步，来把复杂的工作流自动搞定。

微软给Copilot Cowork加速了智能体的脚步，来把复杂的工作流自动搞定。这家公司正在向着让AI像人一样工作的梦想前进，这些智能体不光会聊天，还能干些更难的活儿。今天他们宣布推出了Copilot Cowork，这是Microsoft 365里的新工具，能搞定以前必须有人盯着才能完成的那种“长期多步骤任务”。微软的工作AI首席营销官Jared Spataro在博客里写了这事。他说这个新功能是通过Frontier项目搞出来的，让企业能在大功能正式上线前先试一把。Copilot这个工具微软已经做了好些年了，不过以前它主要就帮着干活儿的人总结邮件、写文章。而Copilot Cowork是专为把任务交给AI干而设计的，人们不用自己一步一步去弄那些复杂的活计，只要说出想要的结果就行了。Spataro说用户只要告诉它想干啥，它立马就能规划方案并动手去执行。它会在各种Microsoft 365的软件和文件之间来回推理着干活。不过人眼还是得盯着它。在干活的过程中，人类能看着它的进度走没跑偏，一旦发现不对劲儿就能进去“矫正”它一下。这个系统靠Work IQ框架来教Copilot熟悉组织的数据环境，同时也保证遵守安全规定。Spataro说Copilot Cowork的核心理念就是提高效率，让人不用在不同软件间来回跳。哪怕是像做月度预算审查这种简单的活儿，也得在Excel、Outlook、Teams还有SharePoint这些平台之间来回切换找数据，还得跟同事商量完再把东西编成报告。Copilot Cowork把这些麻烦全给省了。它当起了“调度员”，搞定日常简报、管日历这些事都不需要你特意点每个步骤。Capital Group Companies Inc.的高级副总裁Barton Warner觉得这个东西不光是生成答案或者内容的工具。“它是把步骤连起来、协调任务、盯着工作流去执行的，”他解释道。 Copilot Cowork最牛的地方之一是用了多种模型的方式一起干活儿，把OpenAI集团的GPT模型还有Anthropic的Claude都整合进来了。这个公司新弄出来的“研究员”智能体就能看出来这种做法有多厉害。现在这个智能体通过新的“批评”层把这两个AI模型都利用上了。它干活的模式是让GPT先草拟个回应，然后Claude就去检查准确性和引述对不对。Spataro说这种搭配让研究员智能体在DRACO那个测试基准里的得分提了13.8%。还可以倒着来，让Claude先写回应，GPT再去做事实核查。之后用户可以用新的“模型委员会”功能去比较这俩模型的结果，看看哪里一样、哪里不一样、哪里又搞出了独特的东西。这感觉就像是让好几个研究员在一个项目上一起工作一样。微软这么搞就是想建一个更皮实的系统。以前那种老系统有时候会瞎想（幻觉），现在通过让不同的模型扮演不同的角色——一个写回复、一个去批评——来减少这种情况。有了这样能让人交叉核对不同AI干活儿的办法，企业以后用AI自动化的规模就能做得更大了。 Q&A A1：普通Copilot主要是让AI帮忙写东西或者总结啥的，而Copilot Cowork是为了把任务交给它去干的。它能搞定那种长时间跑多步的活儿，你只要告诉它想做成啥样就行。 A2：它用了多种模型一起干活儿。一个写稿子另一个去检查对不对和事实准不准。还有就是人得看着它走的路正不正。 A3：现在这个功能是通过Frontier项目开放给企业试用的。它是基于Work IQ框架的设计，能去学习组织数据的具体环境和规矩。