一、开题答辩题目:面向复杂遥感场景解译的视觉问答方法研究
二、开题答辩人:柏海琛
三、开题答辩时间:2026年5月18日11:00
四、开题答辩地点:友谊校区裕隆创新大厦3A-黄大年茶思屋
五、开题报告简介:
面向数字中国与智慧城市建设中的复杂遥感场景智能解译需求,本课题拟围绕遥感视觉问答由感知识别向语义理解、协同推理和开放应用拓展过程中的关键问题开展研究。现有研究已推动遥感智能解译从地物识别向场景理解和视觉语言交互方向拓展,但在真实复杂遥感场景下,仍受到地物结构复杂、目标尺度差异显著、空间关系多样、语义分布稀疏及跨域分布偏移等因素影响,导致模型在复杂遥感场景中的高层次语义理解、跨尺度信息组织、开放式交互可靠表达与真实场景跨域泛化能力仍显不足。针对上述问题,本课题拟沿着“复杂语义理解—大幅场景建模—开放可靠表达—跨域泛化适配”的递进主线展开研究:首先研究面向复杂语义理解的层次化视觉文本协同推理方法,提升模型对问题意图、视觉证据与语义关系的联合理解能力;进一步研究面向大幅复杂影像的跨尺度联合建模方法,实现全局场景结构与局部细粒度信息的协同表征;在此基础上,研究面向开放语义表达的证据驱动可靠生成方法,增强回答内容与视觉事实、问题语义之间的一致性;最后研究面向域迁移差异的视觉文本协同泛化适配方法,提高模型在跨区域、跨场景和跨数据集条件下的应用稳定性。通过上述研究,拟构建面向复杂遥感场景解译的视觉问答方法体系,为遥感智能解译中的高层次语义理解、自然语言交互与实际场景应用提供方法支撑。
六、开题答辩人简介:

柏海琛,男,学号2024101565,光电与智能研究院,导师苗宗成教授,主要研究方向为遥感图像智能解译。

搜索
英文
联系我们
首页 