钉钉这次可是给大家带来了一个大大的惊喜!他们的AI系统DeepResearch在国际权威评测里拿下了第二名的好成绩,总分48.49分,这可是把像OpenAI、Claude这些国际大牌都给比下去了。更厉害的是,这个系统不光在bench上赢了,还在咱们中国的制造业和供应链里实实在在地干活呢! 你能想象吗?复杂的表格、多阶段的推理,还有多模态的数据生成,Dingtalk-DeepResearch都能轻松搞定。它把分析表格、生成报告这些专业活儿整合到了一个系统里,就像是把一群各有所长的专家聚在一起干活一样。系统里的三层架构特别牛,不管是多重嵌套的表格还是合并的单元格,它都能自动解析成清楚明白的分析报告。 为了让AI越用越聪明,Dingtalk-DeepResearch还设计了一种在线学习机制。这就好比员工通过反复练习提升技能一样,系统会自动从历史操作里总结经验,慢慢适应不同公司的业务习惯。比如你改了报告格式好几次,系统会记得你的喜好,以后就按你喜欢的样子来做报告啦。这种个性化的能力还能沉淀下来分享给全公司用呢。 为了保证质量,系统里还内置了一个叫DingAutoEvaluator的评估器。它会像质检员一样仔细检查每一份报告的数据准不准、逻辑顺不顺。一旦发现问题就立马反馈回去优化模型,形成了一个从生成到优化的完美闭环。 现在Dingtalk-DeepResearch已经在很多真实场景里稳定发挥了。在供应链那边它能帮采购策略出谋划策;在制造业它能把设备运行数据变成好看的图表来做故障预测。所有功能都通过了国际测试验证过了。 最后听听CTO朱鸿是怎么说的:“这个系统结合了自适应优化和多模态推理,就是为了处理那些复杂又多变的真实业务任务。”他还提到这项技术正加速应用在搜索、表格、工作流还有Agent平台上,“就是要把最前沿的AI技术实实在在地给企业用上,给大家创造真正的价值。”