智能视频监控系统动态目标检测与识别算法综述论文_袁国华

上海信业智能科技股份有限公司 201203

摘要：随着摄像头安装数量的日益增多，以及智慧城市和公共安全需求的日益增长，采用人工的视频监控方式。已经远远不能满足需要，因此智能视频监控技术应运而生并迅速成为一个研究热点。智能视频监控技术是一个跨领域的研究方向，它的研究内容丰富，应用领域广泛多样。文中对智能视频监控技术的发展历史、研究现状以及典型算法的现状给了比较全面的综述。首先从底层、中层、高层对智能视频监控技术进行分类，分别对目标检测、目标跟踪、分类识别以及行为分析算法进行归纳总结；然后对典型算法的优缺点进行分析，给出了典型算法在现有研究。数据库上的性能对比，并对待解决问题和难点进行了总结；最后对智能视频监控技术在物联网背景下存在的挑战。以及未来发展趋势进行了探讨。

关键词：智能视频监控；智慧城市；公共安全；物联网

智能视频监控系统具有非接触、精度高、实时性好等优点，已经广泛应用于人类科技、军事、生产和生活的各个领域，如铁路和高速公路的交通监控，银行、超市、百货公司和停车场的公共场所监控，球类比赛中球员的人体行为远程监控以及用于武器试验现场的实时安全监控。目前，国外发达国家在智能监控研究方面开展得较早，特别是在军事、航空航天等高新技术应用的前沿领域取得了显著成果，而国内相关单位也在国外的基础上开展了相关的研究工作，但这些产品由于涉及到保密问题，用于武器试验方面的研究少有报道。在本系统中，用户的需求是能够实现监控现场目标降落安全功能，同时可以将目标降落过程中的状态参数信息显示在监控画面上，判断目标的飞行参数是否会对降落安全构成威胁，若识别后的参数信息对降落安全构成威胁，则及时反馈给飞行人员及时对飞行目标状态进行调整，保证飞行目标降落以及飞行人员安全。为满足此要求，笔者设计了一种基于运动目标识别技术的智能视频监控系统。

1.系统组成

该系统基于视频采集前端-服务器端-行为理解及决策模型。整个系统包括：视频采集前端，由若干摄像机组成；负责视频处理和分析的服务器端；行为理解和决策，如图1所示。其中视频采集前端包括摄像机阵列和数据传输装置，服务器端主要由运动目标处理模块和运动目标识别模块组成。

图1智能视频监控系统框图

1.1视频采集前端

摄像机是获取飞行目标降落状态的主要前端设备，它以CCD图像传感器为核心部件，还包括同步信号电路、视频信号处理电路以及电源部分，输出信号为按标准规定的视频信号。除基本参数外，摄像机需具备附带功能，包括软触发、延时曝光、白平衡和抗闪烁等。视频采集前端合理分布在降落场地的外围测点，每个测点由一台摄像机和镜头组成，如有特殊需要，应考虑安装云台。它们把采集到的视频信号通过各摄像机的以太网接口传输到服务主机PC，对视频信号进行压缩解码和进一步处理。在系统中，摄像机采用固定的方位和角度，确保清晰地捕捉现场画面。视频采集部分是整个系统的信号输入部分。

1.2服务器端

服务器端采集到的视频数据非常复杂，对于反映飞行目标的数据信息来说，不能直接提取出来，必须进行视频处理，进而才能实现目标识别的功能，主要包括视频编解码模块、视频处理模块和窗口界面模块。其中视频编解码模块采用MPEG-4视频压缩技术标准，对视频采集前端传送的视频信号进行压缩编码，并以视频文件的形式存储在硬盘上；视频解码模块负责实时解码和视频播放；视频处理模块是对视场内的运动物体进行自动检测和识别，判断当前目标状态是否会对飞行目标降落安全构成威胁，从而做出决策；窗口界面模块提供降落过程画面的实时显示，同时提供人机交互接口，如切换通道、启动停止录像、视频回放和系统设置等。

2.智能视频监控算法

2.1智能视频监控算法框架

智能视频监控研究的主要内容就是如何从原始的视频数据中提取出符合人类认知的语义理解，即希望计算机能和人一样自动分析理解视频数据。比如，判断场景中有哪些感兴趣目标，历史运动轨迹，从事什么行为，以及目标之间的关系等。

（1）底层。主要是从视频图像采集终端获取图像序列，对感兴趣目标进行检测和跟踪，以便对目标进行后续处理分析，主要解决目标在哪里的问题。本文中目标检测部分可分为目标建模和背景建模。目标跟踪是为了获得运动目标的活动时间、位置、运动方向、运动速度、大小、表观（颜色、形状、纹理）等，可分为单场景目标跟踪和跨场景目标跟踪。（２）中层。主要是在底层的基础上提取运动目标的各种信息并进行相关判断。这部分内容包括目标识别。目标识别是为了对目标进行分类进而识别目标的身份，可分为目标分类和个体识别。中层的分析为底层处理到高层行为理解搭建了一座桥梁，填补了底层与高层之间的语义间隔。主要是为了解决目标是什么的问题。（３）高层。高层处理完成对目标的行为进行分析和理解。高层的语义蕴含着特定的语义场景，往往和具体的应用紧密相关。行为分析可以分为姿态识别、行为识别和事件分析，主要为了解决目标在干什么的问题。总而言之，智能视频监控研究的主要目的就是要让计算机回答感兴趣目标在哪里，是什么，在干什么，甚至预测感兴趣目标下一步的行为。以下本文将分别介绍相关层次。

2.2目标检测

目标检测是从视频或者图像中提取出运动前景或感兴趣目标，也就是确定当前时刻目标在当前帧的位置，所占大小。因此目标检测在智能视频监控算法中处于基础地位，目标检测性能的好坏直接影响了后续目标跟踪等算法、目标分类与识别的性能。根据处理的数据对象的不同，目标检测可以分为基于背景建模的运动目标检测方法和基于目标建模的检测方法。基于背景建模的方法要求感兴趣目标是保持运动的，并且背景是保持不变的。当背景发生变化的时候，基于背景建模的方法会将变化背景误检为运动前景，而在运动目标静止一段时间后，也会被归为背景。因此该方法难以用于背景变化的场景，如手持摄像机或车载摄像机拍摄时。该方法一般可以达到实时性的要求，因此在采用固定摄像机的应用中广泛使用。基于目标建模的前景提取方法不受应用场景的限制，不但可以对固定摄像机拍摄的视频进行感兴趣目标的检测，也可以处理单帧静态图像或移动摄像机拍摄的视频。该方法由于扫描的窗口数目巨多，检测速度较慢，一般很难实时，因此在要求实时性的实际系统中难以应用，两者之间的比较如表1所示。

表1目标检测方法分类

2.3目标跟踪

根据应用场景的不同，可以将目标跟踪算法分为单场景目标跟踪和多场景目标跟踪两类。单场景目标跟踪包括单目标和多目标跟踪，多场景目标跟踪可以分为重叠场景和非重叠场景目标跟踪。例如在单场景中，同一目标在连续两帧的空间位置是很接近的；在重叠场景目标跟踪中，目标经过重叠场景从一个场景进入另一个场景，可以利用连续的空间关系确定进入新场景的目标身份；在非重叠场景目标跟踪中，由于场景之间盲区的存在，不同场景对相同目标的观测在时间空间上都会存在很大差异。

结论

通过读取从摄像头所捕获的视频图像序列，基于运动识别的智能监控系统可以实时清晰地检测并识别出运动目标，同时精确地显示出运动目标在靶面上的位置，使获得的目标参数信息更加准确，也为指导决策提供了重要依据。现已采用了模拟飞行目标降落视频进行实验，下一步，将针对飞行目标的实际降落视频作进一步的研究分析。

参考文献

[1]万卫兵，霍宏，赵宇明.智能视频监控中目标检测与识别[M].上海：上海交通大学出版社，2009.

[2]宋波涛.智能视频监控系统的设计与实现[D].吉林：吉林大学硕士学位论文，2009.

[3]周继光.基于DSP的空中目标跟踪系统[D].重庆：重庆大学硕士论文，2007

论文作者:袁国华

论文发表刊物:《建筑学研究前沿》2018年第28期

论文发表时间:2018/12/28

标签：目标论文; 场景论文; 智能论文; 视频论文; 视频监控论文; 摄像机论文; 算法论文; 《建筑学研究前沿》2018年第28期论文;

智能视频监控系统动态目标检测与识别算法综述论文_袁国华

猜你喜欢