当今时代,人工智能正加速向开放、动态的复杂开放场景落地应用,因此提升机器学习模型的鲁棒性已成为跨越基础理论研究与高可靠实际应用鸿沟的重要研究。然而,开放场景数据往往集中广泛交织的特征噪声与标签噪声,导致机器学习模型性能显著下降。
针对这一挑战,西北工业大学光电与智能研究院聂飞平教授团队创新性地提出了双几何间隔Boosting集成学习框架,系统性地突破了双重噪声带来的难题:一是通过设计特征级决策平面间隔(Decision Plane Margin, DPM)优化理论,最大化特征空间中类间分类边界的区分度,有效克服了特征噪声引起的拟合不稳定性难题;二是设计样本级超球面间隔(Hyper-Sphere Margin, HSM)技术,精确衡量样本级别的标签预测置信度,在训练过程中有效识别并过滤掉潜在的噪声样本,从而纠正了错误监督导致的模型过拟合问题。该项研究成果以《Dual Geometry Margin Optimization for Coupled-Noisy Robust Ensemble Learning》为题,被人工智能与模式识别领域顶级国际期刊 IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEE-TPAMI)正式录用。

该研究中,DGMB框架能够对复杂数据中的有效特征与干扰信息进行自适应的识别与过滤,突破了传统集成学习方法难以同时准确刻画并处理特征与标签双重混合噪声的局限,显著增强了模型在极端环境下的抗干扰能动性。不同类型的真实世界噪声数据集实验统一表明,该框架在严苛条件下均能维持极高的分类精度,全面超越了包括XGBoost、LightGBM及多种先进深度集成网络在内的现有鲁棒集成方法。通过对双几何间隔(DPM与HSM)优化演化过程的可视化与分布特征分析,实现了对复杂噪声环境下集成决策边界演化与样本预测置信度规律的统一度量和精准验证。该研究成果不仅对提升鲁棒机器学习基础理论具有重要的科学意义,也为新一代高可靠智能系统设计提供了新的理论方法,从而大幅提升智能系统在不确定开放环境下的效能。
论文作者为西北工业大学光电与智能研究院王政副教授和博士研究生何冠雄,通讯作者为聂飞平教授。
(文:何冠雄,审核:赵斌)

搜索
英文
联系我们
首页 