教育教学
您当前所在位置是: 首页 >> 人才培养 >> 教育教学 >> 正文
西北工业大学光电与智能研究院博士开题答辩(佘超银)

一、开题答辩题目:通用多模态超声大模型研究及其在血管具身智能中的应用

二、开题答辩人:佘超银

三、开题答辩时间:2026年6月15日10:00

四、开题答辩地点:友谊校区毅字楼2楼228会议室

五、开题内容简介:

本研究针对恶性肿瘤、心血管疾病高发带来的公共卫生压力,聚焦超声医学智能化诊疗技术瓶颈,开展通用多模态超声大模型及血管具身智能应用研究。超声凭借无辐射、实时、低成本等优势临床应用广泛,但传统检查高度依赖医师经验,存在标准化、可重复性差的问题。当前超声AI存在明显短板:现有模型多为单模态、单任务设计,不符合临床综合诊疗逻辑;通用多模态大模型难以适配超声特有噪声与异构数据,存在语义对齐偏差、输出幻觉等问题;超声扫查机器人泛化能力弱,存在感知与决策解耦问题,无法实现扫查、分析、诊断全流程闭环,制约技术落地。

针对以上痛点,本研究融合多模态大模型、具身智能与医学影像分析技术,围绕“数据构建—模型研发—智能体设计—临床落地”全链条开展系统研究,旨在搭建超声专属智能诊疗闭环系统,摆脱人工经验依赖,推动超声诊疗标准化、智能化、自主化升级。研究包含四大核心模块:一是构建超声多模态高质量数据集,创新幻觉抑制理论与全流程数据质控体系,解决超声优质语料稀缺、模型幻觉突出的源头问题;二是研发超声专用多模态大模型(US-MLLM),通过双路径混合专家架构与参数高效微调策略,攻克模态失配、灾难性遗忘等难题,实现通用诊疗与个体适配的双重能力;三是搭建主动推理式超声智能体(US-Agent),构建四层智能架构,融合临床思维链与强化学习,解决系统逻辑割裂、可解释性差的问题,赋予模型迭代优化的元认知能力;四是依托颈动脉超声典型场景,集成前述技术实现机器人自主扫查、智能分析、报告生成全流程自动化,并通过多中心实验验证系统的临床适配性与稳定性。

本研究融合多种前沿AI技术,形成完整技术实施方案。理论层面,创新提出超声数据幻觉抑制理论与双路径协同决策机制,填补超声多模态大模型与具身智能融合领域学术空白,推动医学AI从感知智能向临床认知智能跨越;技术层面,攻克模态失配、黑盒决策、感知决策解耦等核心瓶颈,打造可解释、可迭代、易落地的超声智能系统;应用层面,可统一超声检查诊断标准、均衡优质医疗资源,为基层医疗普及、大规模疾病筛查提供核心技术支撑。

六、开题答辩人简介:

佘超银,男,学号2024101561,光电与智能研究院,导师黄庆华教授,主要研究方向为医学智能与系统方向。