研究方向
应用背景
与单幅图像相比,视频数据包含更丰富的信息。如何使计算机(或机器人)能够自动有效地分析、处理和理解大量的视频信息已经成为当今计算机视觉领域中的一个重要课题。由于视频分析所产生的成果具有巨大的经济市场和广泛的应用前景,因此在这方面的研究已经引起国内外的高度重视和积极参与。然而,视频数据中经常包含错误的野点(如错误的特征以及错误的特征匹配等),这种情况下必须使用鲁棒统计学的理论和方法来减少野点的影响。鲁棒视觉分析的研究针对多结构数据的鲁棒模型拟合方法和理论,而且还将把鲁棒方法引入到视频分析中的应用,主要包括移动摄像机下的多体运动分割和目标跟踪这两个非常重要和具有挑战性的实际任务。
研究内容
拟从三个方面开展研究,包括有效指导样本抽样、自适应估计内点噪声尺度和鲁棒估计多结构数目以及每个结构的模型参数。具体研究内容如下:
有效指导样本抽样:传统的鲁棒拟合方法需要进行大量的随机抽样才能抽到一个有效的最小数据子集以估计正确的模型参数。这样做不仅非常耗时,效率也很低。拟研究如何有效地进行样本抽样以快速抽到“干净”的最小数据子集;研究如何设计一个有效的同源概率函数以判断不同数据是否来自于同一结构的可能性;并在其基础上研究如何用概率统计的方法和近邻信息来指导加速抽样有效的最小数据子集。
自适应内点噪声尺度估计:内点噪声尺度的估计对于鲁棒拟合方法来说非常重要,其估计的精确度直接关系到 一些拟合方法的效能。然而,当处理多结构数据时,要自适应地估计内点噪声尺度并非易事,现有的方法还存在不少的问题。因此,鲁棒自适应地估计多结构数据中每个结构的内点噪声尺度也是鲁棒拟合中的一个关键问题。将研究如何在数据包含大量噪声和多结构的情况下自适应地估计内点噪声尺度;研究如何设计新的目标函数以提高内地噪声尺度估计算法的鲁棒性和精确度;研究如何在内点噪声不遵循高斯分布或类高斯分布的情况下,鲁棒地估计内点噪声尺度。
多结构数目鲁棒估计及个体结构模型参数学习:很多的鲁棒拟合 方法在实际任务中取得的结果并不好,有些甚至于完全失败。这里的原因包括这些方法 本身的鲁棒性不高。另外,实际任务中的数据经常包含大量的离群数据和噪声(如错误 的匹配、分割误差、相机本身引起的噪声等),有些困难的数据还包含多结构等。拟研究有效稳健的模型假设评价标准;研究如何设计一个新的相似性函数以可靠地测量数据之间的相关性;如何通过聚类算法把属于不同结构的数据分割开,以及评价不同聚类算法的有效性;同时,研究如何设计一个模型选择标准以进行精确的多结构数目的估计;并研究其它鲁棒拟合方法(如基于超图的模型拟合方法、基于能量函数的模型拟合方法等)以拓展鲁棒模型拟合理论的发展。
友情链接
福建省科学技术厅
厦门市科学技术局
厦门大学