学术活动

当前位置: 首页 > 学术活动 > 正文

智能制造与电气工程学院在机器学习领域顶级国际会议ICML发表最新研究成果

内容来源: 日期: 2026-05-19 09:28 浏览次数:

本网讯(通讯员 杨仕伟近日,南阳师范学院智能制造与电气工程学院教师、智能防爆装备河南省协同创新中心电气信息团队完成的论文“Softplus Attention with Re-weighting Boosts Length Extrapolation in Large Language Models”被第43届国际机器学习大会(ICML 2026)正式接收。ICML是国际人工智能与机器学习领域最具影响力的顶级学术会议之一,在基础模型、深度学习、统计学习、强化学习等方向具有广泛学术影响力。该论文由南阳师范学院、英国伦敦国王学院和卢森堡大学等单位合作完成,南阳师范学院为第一完成单位,我校高博博士为第一和通讯作者。

本次接收的论文致力于解决Softmax自注意力机制处理超长文本时性能下降和关键信息抓取不准问题。论文提出了一种新的注意力计算方法LSSAR,旨在提升模型处理长文本和复杂信息的能力。实验结果表明,该方法在长度外推、长文本理解、信息检索等任务中的表现显著优于Softmax自注意力机制。值得注意的是,其在物理规律学习任务中展现出独特优势:在仅有1.09亿参数的模型上,采用LSSAR方法后可从行星运动数据中复现出牛顿引力规律的核心结构,而采用传统Softmax自注意力机制的万亿参数模型在同类任务上仍未取得同样效果。以上结果表明,人工智能模型的能力提升不仅取决于参数规模,也取决于底层方法设计。

该研究得到河南省自然科学基金项目、南阳师范学院博士专项项目和智能防爆装备河南省协同创新中心的资助,并获得英国科研与创新署在Isambard-AI高性能计算平台上的支持。