ucsd拿aibuildai在openai mle-bench 里面拿了第一名，证明了用多智能体协作来搞复杂

加州大学圣地亚哥分校（UCSD）的团队拿出了一款叫AIBuildAI的智能体，结果在OpenAI搞的MLE-Bench这个测试里拿了第一。这个比赛有75个任务，涵盖了图像分类、目标检测、自然语言处理这些领域，让系统从原始数据里造出能提交的模型。AIBuildAI表现挺猛，拿到了63.1%的获奖率，比别的方法都好。它把模型设计、代码写、训练、调参数这些活儿全自动化了。以前搞AI开发特别费劲，工程师得一遍遍试错，现在有了这个智能体，开发者只要用大白话把任务描述一下，它就能自动完成设计和训练。这款系统是Ruiyi Zhang、Peijia Qin、Qi Cao、Li Zhang这些博士生，还有Pengtao Xie副教授一起搞出来的。他们是照着真的AI团队干活儿的流程想的点子，目的就是解决开发高性能模型时那种时间和人工成本的问题。为了让流程变得顺畅，AIBuildAI把整个开发过程拆成了多个智能体一块干。有个管理智能体负责统筹协调，设计、编码还有调优的智能体各管一摊事儿。这种设计有三大好处：第一个是并行效率高，智能体能在单独的地方同时探索不同的解决方案；第二个是操作可复现性强，所有实验记录都存硬盘上方便查；第三个是安全可靠。UCSD拿AIBuildAI在OpenAI MLE-Bench里面拿了第一名，证明了用多智能体协作来搞复杂工程自动化是靠谱的。这给咱们未来造更聪明的自动AI系统打下了底子。