西北工业大学光电与智能研究院博士开题答辩(杨志刚)
一、开题答辩题目:遥感影像视觉-语言模型关键方法研究
二、开题答辩人:杨志刚
三、开题答辩时间:2025年4月11日16:30-17:30
四、开题答辩地点:友谊校区毅字楼3楼324会议室
五、开题内容简介:
遥感多模态语义理解旨在通过融合视觉与语言认知机理,实现从海量遥感数据中快速提取语义信息,为环境监测、灾害预警等应用提供数据与决策支持。尽管我国高分专项和国外研究机构已布局遥感图像智能解译研究,但现有技术仍面临空间认知维度独特、跨模态尺度差异大、领域知识融合困难三重挑战,导致遥感大数据向决策知识的转化效率低下。因此如何构建兼具多粒度解析、跨模态关联和动态推理能力的语义理解框架,成为提升遥感数据利用效率的关键突破点。本研究致力于建立图像级-像素级-语义级协同解译体系,通过构建跨模态检索、指向型分割、语义生成与智能问答等视觉-语言数据集并开展任务研究,突破视觉-语言协同表征、细粒度目标解译、时空语义推理等核心技术,实现遥感信息从像素到知识的跨越式理解。
六、开题答辩人简介:
杨志刚,男,学号2023101367,光电与智能研究院,导师王琦教授,主要研究方向为视觉-语言多模态理解。