ucsd拿aibuildai在openai mle-bench 里面拿了第一名,证明了用多智能体协作来搞复杂

加州大学圣地亚哥分校(UCSD)的团队拿出了一款叫AIBuildAI的智能体,结果在OpenAI搞的MLE-Bench这个测试里拿了第一。这个比赛有75个任务,涵盖了图像分类、目标检测、自然语言处理这些领域,让系统从原始数据里造出能提交的模型。AIBuildAI表现挺猛,拿到了63.1%的获奖率,比别的方法都好。它把模型设计、代码写、训练、调参数这些活儿全自动化了。以前搞AI开发特别费劲,工程师得一遍遍试错,现在有了这个智能体,开发者只要用大白话把任务描述一下,它就能自动完成设计和训练。 这款系统是Ruiyi Zhang、Peijia Qin、Qi Cao、Li Zhang这些博士生,还有Pengtao Xie副教授一起搞出来的。他们是照着真的AI团队干活儿的流程想的点子,目的就是解决开发高性能模型时那种时间和人工成本的问题。为了让流程变得顺畅,AIBuildAI把整个开发过程拆成了多个智能体一块干。有个管理智能体负责统筹协调,设计、编码还有调优的智能体各管一摊事儿。 这种设计有三大好处:第一个是并行效率高,智能体能在单独的地方同时探索不同的解决方案;第二个是操作可复现性强,所有实验记录都存硬盘上方便查;第三个是安全可靠。UCSD拿AIBuildAI在OpenAI MLE-Bench里面拿了第一名,证明了用多智能体协作来搞复杂工程自动化是靠谱的。这给咱们未来造更聪明的自动AI系统打下了底子。