近日,西北工业大学黄庆华教授与合作者在Nature Communications上发表最新研究成果,提出HeteroSync Learning(HSL)框架。该框架像一位“智能翻译官”,在不共享原始数据的前提下,通过“公共锚点任务”实现不同来源医学影像数据的“深层表征对齐”,极大提升了分布式学习的效能与公平性。

在医疗AI尤其是影像分析中,不同医院间的数据差异就像各地不同的“方言”,设备参数不同导致特征分布偏移、病种分布不一引发标签分布偏移、数据量悬殊造成长尾偏态。这种呈现高度“非独立同分布”特性的“数据异质性”问题,导致AI模型在跨机构协作时往往“水土不服”,成为制约AI规模化落地的关键瓶颈。传统方法如FedAvg、FedProx等难以在此类复杂环境中保持稳定,而直接数据共享又面临隐私合规风险。
针对上述问题,HSL框架引入“共享锚点任务(Shared Anchor Task, SAT)”作为沟通桥梁,让不同节点在保持数据本地化的前提下实现协同训练。具体而言,HSL选用公开数据集作为与隐私无关的“标准教材”均匀分发至各参与方,建立对齐的“基准参照系”;同时设计基于多门控混合专家网络的辅助学习架构,让AI并行学习本地私有任务和公共锚点任务,并通过“温度调节”技术进行动态梯度校正,增强两者间的正向知识流动。HSL的设计思想借鉴了古人“三人行”的智慧:SAT为“善者”,异质性数据为“不善者”,跨中心辅助学习即为“择善而从”的过程。
研究结果显示,HSL不仅在多种极端模拟场景下实验表现卓越,机制清晰可见,而且在真实临床场景下性能媲美集中式学习,泛化能力突出。HSL的提出,是分布式医学AI从“简单参数聚合”走向“深层表征对齐”的重要一步。它不仅是一项技术突破,更为构建公平、普惠的医疗AI协作网络提供了新路径。
西北工业大学光电与智能研究院黄庆华教授与中山大学附属第一医院匡铭教授、王伟教授为论文的共同通讯作者。
文章链接:https://www.nature.com/articles/s41467-025-64459-y。
(文:邵茵琪,审核:赵斌)

搜索
英文
联系我们
首页 