原文载于:https://news.nwpu.edu.cn/info/1002/60141.htm
时间:2018年12月6日
西工大新闻网12月6日电 深海中的鱼,常常以左右两侧的同伴为观察标志,相互之间保持适当的距离,形成“鱼群效应”;草原上的羊群,也往往根据头羊的行为调整自己的奔跑轨迹,形成“群体”。群组由个体间的信息传递构成,与单独的个体相比,群组包含了更为丰富的信息,从宏观层面反映了个体间的联系,因此一直被社会学、心理学、自然科学领域的专家学者广泛研究(如图1所示)。群组效应不仅存在于自然界,也存在于我们的日常生活中。当人们进入超市、集会地点等拥挤场景时,会不自觉地产生从众心理,形成多种多样的群组。在人工智能、光学影像分析、机器视觉等领域,“群组检测”是一个极具重要意义的研究课题:通过对监控视频中人群行为进行分析,将运动模式不同的群组检测出来,有助于从语义层面理解行人的运动模式,及时发现场景中潜在的危险因素,对加强公共安全保障具有重要价值。
图1 群组行为示例
然而,在实际人群场景中,群组的检测非常困难。首先,由于人群的密集性,行人个体间存在严重的遮挡,极大程度上限制了个体提取的准确性;其次,传统的群组检测方法通常依赖于个体的运动方向等特征,但由于个体的不稳定性,使得提取的特征往往过于局部化,难以反映个体的行为模式;此外,人群的多样性也为群组的检测带来一定挑战,很难找到一组适用于各种场景的实验参数。
图2 基于特征融合的无参数群组检测方法框架
针对上述难题,西北工业大学校人才特区——光学影像分析与学习中心(OPTIMAL)的科研团队提出了一种基于特征融合的无参数群组检测方法,该研究成果以“Detecting Coherent Groups in Crowd Scenes by Multiview Clustering”为题被人工智能领域重要期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI)录用。
这篇长文(regular paper)也是我校在IEEE T-PAMI上发表的、所有作者均唯一署名为西北工业大学的第一篇文章。参见:Qi Wang, Mulin Chen, Feiping Nie, and Xuelong Li, “Detecting Coherent Groups in Crowd Scenes by Multiview Clustering,”IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), DOI: 10.1109/TPAMI.2018.2875002, 2018.
该工作把运动特征点作为研究对象,将群组检测问题建模为图优化问题,使用多视角聚类方法对个体局部特征和结构上下文信息进行融合,实现无参数的群组检测(如图2所示)。实验结果表明,多种特征的融合有效减少了个体特征局部化的问题,而无参数的特性使得该方法适用于复杂多样的人群场景(如图3所示)。
图3 群组检测实验结果
IEEE T-PAMI是人工智能、机器学习、模式识别、数据挖掘、图像处理、机器视觉等多个领域的重要国际期刊,其2017-2018年度影响因子为9.455,属于中科院一区期刊,2018谷歌学术影响力排名的期刊(计算机视觉和模式识别领域)中位列第一,CCF人工智能领域A类推荐期刊中影响因子排名第一。随着国内人工智能等领域的飞速发展,近三年中,每年在IEEE T-PAMI上刊登的约185篇论文中已经有约10篇左右是由大陆科研单位独立发表,其中部分是长文。