度理工学院研发 AI 训练新法,小模型实现 "智商跃迁"

印度大学语言学教授 阅读:7 2025-10-05 12:50:40 评论:0

  印度理工学院焦特布尔分校(IIT Jodhpur)计算机科学与工程系近日发布一项颠覆性 AI 研究成果,其开发的 "模型对等对齐器"(Model Parity Aligner, MPA)训练法,突破传统小模型依赖人工标注数据的技术瓶颈 —— 通过让小参数模型与大模型建立动态反馈机制,无需人工干预即可实现性能逼近。这项发表于 2025 年 9 月《人工智能研究期刊》(JAIR)的研究,创新性采用 "大模型出题 - 差异识别 - 精准训练" 三步法:先由千亿参数大模型生成涵盖多场景的复杂任务题,再通过算法捕捉小模型解题时的误差差异,最后针对差异点进行定向训练,成功解决 AI 领域资源消耗与性能平衡的核心矛盾。

  在 TextVQA(图像文字问答)、ChartQA(图表理解)、DocVQA(文档问答)及 VQA-v2(视觉问答)四项权威测试中,经 MPA 训练的 20 亿参数模型表现尤为突出:图表理解准确率从传统训练法的 12% 跃升至 27.2%,文字场景问答能力提升 4.7 个百分点,文档信息提取速度加快 3 倍。研究团队负责人 Anand Mishra 教授团队还通过对照实验发现,20 亿 - 30 亿参数区间的中等模型受益最显著,平均性能提升幅度达 6.8 个百分点,这一结论印证了教育领域 "最近发展区" 理论在 AI 训练中的适用性 —— 当小模型与大模型的能力差距处于合理范围时,定向训练效率最高。

  该成果已引起谷歌 DeepMind、微软印度研究院等机构关注,目前 IIT 焦特布尔分校已与谷歌 DeepMind 签署合作备忘录,计划联合开发低成本医疗影像诊断系统。"在印度农村地区,一台搭载传统 AI 模型的诊断设备需 100 万卢比以上,而 MPA 训练的小模型可在普通服务器上运行,设备成本能降至 30 万卢比以内。"Anand Mishra 教授解释道,目前团队已完成胸部 X 光片肺结核初筛模型的初步测试,准确率达 89%,预计 2026 年进入临床试点阶段,首批将覆盖拉贾斯坦邦 5 个偏远地区的社区医院。


开封要闻

本文 印度大学中文网 首发,如需转载本文章,还请您保留本站链接!网址:https://www.in.kongzi.edu.pl/post/3296.html

搜索
排行榜
标签列表
    关注我们

    印度留学,印度大学排名,德里大学,尼赫鲁大学,印度奖学金,印度高校申请,印度课程介绍