度理工学院研发 AI 训练新法，小模型实现 "智商跃迁"

印度大学语言学教授阅读：150 2025-10-05 12:50:40 评论：0

　　印度理工学院焦特布尔分校(IIT Jodhpur)计算机科学与工程系近日发布一项颠覆性 AI 研究成果，其开发的 "模型对等对齐器"(Model Parity Aligner, MPA)训练法，突破传统小模型依赖人工标注数据的技术瓶颈 —— 通过让小参数模型与大模型建立动态反馈机制，无需人工干预即可实现性能逼近。这项发表于 2025 年 9 月《人工智能研究期刊》(JAIR)的研究，创新性采用 "大模型出题 - 差异识别 - 精准训练" 三步法：先由千亿参数大模型生成涵盖多场景的复杂任务题，再通过算法捕捉小模型解题时的误差差异，最后针对差异点进行定向训练，成功解决 AI 领域资源消耗与性能平衡的核心矛盾。

　　在 TextVQA(图像文字问答)、ChartQA(图表理解)、DocVQA(文档问答)及 VQA-v2(视觉问答)四项权威测试中，经 MPA 训练的 20 亿参数模型表现尤为突出：图表理解准确率从传统训练法的 12% 跃升至 27.2%，文字场景问答能力提升 4.7 个百分点，文档信息提取速度加快 3 倍。研究团队负责人 Anand Mishra 教授团队还通过对照实验发现，20 亿 - 30 亿参数区间的中等模型受益最显著，平均性能提升幅度达 6.8 个百分点，这一结论印证了教育领域 "最近发展区" 理论在 AI 训练中的适用性 —— 当小模型与大模型的能力差距处于合理范围时，定向训练效率最高。

　　该成果已引起谷歌 DeepMind、微软印度研究院等机构关注，目前 IIT 焦特布尔分校已与谷歌 DeepMind 签署合作备忘录，计划联合开发低成本医疗影像诊断系统。"在印度农村地区，一台搭载传统 AI 模型的诊断设备需 100 万卢比以上，而 MPA 训练的小模型可在普通服务器上运行，设备成本能降至 30 万卢比以内。"Anand Mishra 教授解释道，目前团队已完成胸部 X 光片肺结核初筛模型的初步测试，准确率达 89%，预计 2026 年进入临床试点阶段，首批将覆盖拉贾斯坦邦 5 个偏远地区的社区医院。

开封要闻

本文印度大学中文网首发，如需转载本文章，还请您保留本站链接！网址：https://www.in.kongzi.edu.pl/post/3296.html