科研团队推出个性化视觉问答基准 AI应用向精准化迈进

（问题）近年来，视觉问答等多模态技术进展很快，智能系统已能“看图识物、对话解题”，并逐步进入看房导购、生活助理、公共服务咨询等场景；但在实际使用中，一个矛盾越来越突出：同一张图片、同一类问题，不同年龄、不同生活阶段用户的关注点往往不同，而现有系统常给出相对固定的模板化回答，难以做到“因人而答”。以住房图片为例，年轻人更在意通勤与网络条件——中年群体更关注学区与配套——老年群体则更看重楼层、无障碍与医疗可达性。缺少对用户差异的识别，容易出现“回答正确却不够有用”的情况。

当前，人工智能正从追求通用能力走向更强调“贴心”的服务能力。北京邮电大学团队推出的MDI-Benchmark不仅补上了个性化视觉问答评估的空白，也向AI研究社区提示：衡量进步的标准——不应只看模型能否答对——更要看它能否理解不同人、适应不同需求并提供可用的帮助。这项工作提醒我们，真正的智能不在于处理数据有多快，而在于能否准确把握人群差异并给出恰当回应。随着该基准的推广应用，未来的AI系统有望更懂用户、更可靠地融入生活与工作场景，成为更有效的辅助工具。