技术领域
[0001] 本发明涉及多媒体技术领域,特别涉及一种监控方法及监控系统。
相关背景技术
[0002] 传统的监控方式以视频监控为主。部署视频监控设备后,执法人员可以通过查找监控图像来识别嫌疑人。
[0003] 然而,在监控设备附近可能发生异常事件,例如聚众集会、踩踏事件、急救事件等等。传统的监控方式并不能准确、高效的实现对于异常事件的监控。第一,在传统的监控方式中,当执法人员在调用视频监控识别嫌疑人时,若嫌疑人走出了监控画面,则会需要人工筛查多个监控区域、较长时段的图像来再次捕捉嫌疑人画面。由于监控视频的视角、画面局限,往往不能够得到与案件相关的全部人员。由于摄像头的部署地点、视角和视距限制,存在监控盲区较大,在一定的空间内全方位无缝的部署摄像头会增加大量成本,难以普及应用。第二,传统的监控方法十分依赖于人工识别,从而大大降低了识别效率,且人工的大量参与会带来很多主观因素,降低识别的准确度。第三,受天气原因的影响,监控数据的清晰度也会受到影响,这就为识别全部嫌疑人带来了困难,可能会造成遗漏的情况。
[0004] 如何准确、高效地实现对于异常事件的监控,从而确定异常事件参与人员,是亟待解决的技术问题。
具体实施方式
[0028] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0029] 下面结合图1描述本发明一个实施例的监控系统。
[0030] 图1示出本发明监控系统的一个实施例的结构示意图。如图1所示,本实施例中的监控系统10包括:无线网络设备102、音频采集设备104以及关联设备106。其中,无线网络设备102能够采集连接至监控区域无线网络设备的终端的媒体访问控制MAC地址;音频采集设备104能够采集监控区域的音频信息。关联设备106用于:根据音频信息判断监控区域内是否发生异常事件,并将MAC地址与音频信息相关联;调取监控区域内发生异常事件时的音频信息所关联的MAC地址,并通过所关联的MAC地址确定异常事件的参与人员。
[0031] 本实施例中的监控系统10的工作流程如下:
[0032] (一)无线网络设备102采集连接至监控区域无线网络设备的终端的MAC地址。
[0033] 例如,在监控区域部署若干WIFI设备。终端连接至WIFI设备后,WIFI设备能够采集到终端的MAC地址。无线网络设备102实时的将采集到的每个MAC地址及其采集时间发送给关联设备106。
[0034] (二)音频采集设备104采集监控区域的音频信息。
[0035] 例如,在监控区域部署音频采集设备。音频采集设备能够实时采集监控区域的音频信息,并实时的将采集到的音量信息及其采集时间发送给关联设备106。
[0036] (三)关联设备106根据音频信息判断监控区域内是否发生异常事件,并将MAC地址与音频信息相关联。
[0037] (a)将MAC地址与音频信息相关联。
[0038] 将MAC地址与音频信息相关联的过程中,关联设备106需要将相同时间采集的MAC地址和音频信息相关联。因此,关联设备106首先同步音频采集设备104与无线网络设备102的系统时间,然后对接收到的MAC地址和音频信息进行合轨存储。合轨存储时,可将MAC地址、音频信息存储在音频文件或音频文件的索引文件中。
[0039] (b)根据音频信息判断监控区域内是否发生异常事件。
[0040] 判断监控区域内是否发生异常事件的依据可以有多种。一种实现方式是,判断音频的音量是否大于预设音量值。若大于预设音量值,则确定监控区域内发生异常事件。
[0041] 例如,基于多场合现场模拟测试可知:安静场所声音强度在30分贝以下,人们正常交谈的声音强度在30-55分贝,街道及公共场所的声音强度在55-75分贝,嘈杂、热闹喧哗的声音强度约在80-90分贝,尖叫、欢呼、求救等,声音强度一般在90分贝以上。图3示出个人求救音频样本的声音强度分布示意图,图4示出正常街道音频样本的声音强度分布示意图,图5示出欢呼音频样本的声音强度分布示意图,图6示出在监控现场检测到的音频信息。根据图3、图4以及图5所示的声音强度分布情况,可以对图6中的音频信息进行分析,从而得到监控区域发生欢呼、呐喊的情况。
[0042] 另一种实现方式是,获取异常事件所对应样本音频信息的样本频率特征,然后将音频信息的频率特征与样本频率特征相比对。若音频信息的频率特征与样本频率特征相近,则确定监控区域内发生异常事件。。
[0043] 例如,采用频域分析算法对采集到的音频进行一定的特征分析,判断分析得到的特征与预设的聚众集会音频特征是否匹配,或者将分析得到的特征输入训练好的模型,分析得到的特征与预设的聚众集会音频特征匹配,或者模型输出的结果为发生集会,则说明发生聚众集会。预设聚众集会音频特征时,可采用历史上采集的若干个聚众集会的音频作为样本,根据这些样本预设聚众集会音频特征。训练模型时,也可采用历史上采集的若干个聚众集会的音频作为训练样本进行训练。
[0044] 需要说明的是,上述步骤(a)(b)的顺序是可以根据实际需要进行调整。例如,可以先将MAC地址与音频信息相关联,然后根据音频信息判断监控区域内是否发生异常事件。还可以先根据音频信息判断监控区域内是否发生异常事件,如果确定监控区域内是否发生异常事件,则将MAC地址与音频信息相关联。即,将监控区域内发生异常事件作为将MAC地址与音频信息相关联的触发条件。
[0045] (四)调取监控区域内发生异常事件时的音频信息所关联的MAC地址,并通过所关联的MAC地址确定异常事件的参与人员。
[0046] 例如,对于某个视频图像中出现的可能出现聚众集会的情况,可调取相应的音量信息,如果音量大于预设阈值,则说明有可能发生了集会等异常事件,此时可调取相应的MAC地址,通过聚众集会参与人员的终端MAC地址确定集会参与人员的手机号码,从而确定集会参与人员的身份。
[0047] 上述实施例利用监控音频判断是否发生异常事件,并利用监控音频和MAC地址探测数据的关联关系,确定监控中嫌疑人携带的电子设备的MAC地址,进而通过搜寻定位MAC地址等方式来定位联系人,从而能够准确、高效地实现对于异常事件的监控,确定异常事件参与人员。此外,上述实施例还具有以下优势:第一,克服了传统监控方式监控视频的视角、画面的局限,能够得到与案件相关的全部人员。第二,降低了监控成本,便于普及应用。第三,监控过程更加自动化,摆脱对于人工识别的以来,大幅提高了识别效率,避免人工识别中主观因素造成的影响,提高了识别的准确度。第四,降低因天气原因的影响,减少因天气原因导致监控画面清晰度低所造成遗漏的情况。
[0048] 下面结合图2描述本发明另一个实施例的监控系统。
[0049] 图2示出本发明监控系统的另一个实施例的结构示意图。如图2所示,在图1所示实施例的基础上,本实施例中的监控系统20还包括视频采集设备208,视频采集设备208能够采集监控区域附近的视频图像。关联设备106还用于:根据音频信息判断监控区域内是否发生异常事件,并将视频图像与音频信息相关联;调取监控区域内发生异常事件时的音频信息所关联的视频图像,并通过所关联的视频图像确定异常事件的参与人员的图像信息。
[0050] 本实施例中,音频采集设备104可以为视频采集设备208中集成的音频采集器。视频采集设备208采集监控区域附近的视频图像后,关联设备106可以将无线网络设备102采集到的MAC地址、视频采集设备208监控到的视频图像以及音频采集设备104采集到的音频信息均合轨存储。具体合轨存储时,针对视频采集设备208监控到的一帧视频图像,可将无线网络设备102采集到的MAC地址、音频采集设备104采集到的音频信息按照采集时间、采集时间与监控时间相同或相近的原则,将MAC地址和音频信息合轨存储到视频图像的索引文件中。也可将MAC地址和音频信息存储到视频图像对应的音频文件或其他文件。只要MAC地址的采集时间、音频信息的采集时间与视频图像的监控时间相同,就将三者合轨存储。
[0051] 当通过音频信息确定发生聚众集会等异常事件后,可通过与该音频信息合轨存储的视频图像,确定异常事件参与人员的图像信息。例如,异常事件参与人员的穿着打扮、异常事件参与人员的数量、异常事件参与人员的来源和去向等等,便于案情还原和调查取证。
[0052] 例如,在实际应用场景中,可以将声音强度数据与视频图像、MAC地址结合进行建模。应用模型可以包括:(一)通过视频图像识别现场人数,再通过声音强度判断现场是聚众性活动还是个人性质的求救事件;(二)在视频扇区未能覆盖的区域,结合Mac数据识别现场人数,再通过声音强度识别现场是聚众性还是个人性活动;(三)通过声音强度变化规律,判别现场属于哪种特性的活动。在数据管理平台,事先设定多场景(例如聚众闹事、演唱会、游行、个人求救等)的声音强度样例数据,建立贝叶斯判别模型(Bayesian Discriminant)或人工神经网络(Artificial Neural Network)、支持向量机(Support Vector Machine)等数据挖掘模型,实时分析及判断现场发生的情况,发现异常情况时及发出预警信号。
[0053] 下面结合图7描述本发明一个实施例的监控方法。
[0054] 图7示出本发明监控方法的一个实施例的流程示意图。如图7所示,本实施例中的监控方法包括:
[0055] 步骤S702,采集连接至监控区域无线网络设备的终端的媒体访问控制MAC地址。
[0056] 例如,在监控区域部署若干WIFI设备。终端连接至WIFI设备后,WIFI设备能够采集到终端的MAC地址。无线网络设备实时的将采集到的每个MAC地址及其采集时间发送给关联设备。
[0057] 步骤S704,采集监控区域的音频信息。
[0058] 例如,在监控区域部署音频采集设备。音频采集设备能够实时采集监控区域的音频信息,并实时的将采集到的音量信息及其采集时间发送给关联设备。
[0059] 步骤S706,根据音频信息判断监控区域内是否发生异常事件,并将MAC地址与音频信息相关联。
[0060] (a)将MAC地址与音频信息相关联。
[0061] 将MAC地址与音频信息相关联的过程中,需要将相同时间采集的MAC地址和音频信息相关联。因此,首先同步音频采集设备与无线网络设备的系统时间,然后对接收到的MAC地址和音频信息进行合轨存储。合轨存储时,可将MAC地址、音频信息存储在音频文件或音频文件的索引文件中。
[0062] (b)根据音频信息判断监控区域内是否发生异常事件。
[0063] 判断监控区域内是否发生异常事件的依据可以有多种。一种实现方式是,判断音频的音量是否大于预设音量值。若大于预设音量值,则确定监控区域内发生异常事件。
[0064] 例如,基于多场合现场模拟测试可知:安静场所声音强度在30分贝以下,人们正常交谈的声音强度在30-55分贝,街道及公共场所的声音强度在55-75分贝,嘈杂、热闹喧哗的声音强度约在80-90分贝,尖叫、欢呼、求救等,声音强度一般在90分贝以上。根据图3、图4以及图5所示的声音强度分布情况,可以对图6中的音频信息进行分析,从而得到监控区域发生欢呼、呐喊的情况。
[0065] 另一种实现方式是,获取异常事件所对应样本音频信息的样本频率特征,然后将音频信息的频率特征与样本频率特征相比对。若音频信息的频率特征与样本频率特征相近,则确定监控区域内发生异常事件。。
[0066] 例如,采用频域分析算法对采集到的音频进行一定的特征分析,判断分析得到的特征与预设的聚众集会音频特征是否匹配,或者将分析得到的特征输入训练好的模型,分析得到的特征与预设的聚众集会音频特征匹配,或者模型输出的结果为发生集会,则说明发生聚众集会。预设聚众集会音频特征时,可采用历史上采集的若干个聚众集会的音频作为样本,根据这些样本预设聚众集会音频特征。训练模型时,也可采用历史上采集的若干个聚众集会的音频作为训练样本进行训练。
[0067] 需要说明的是,上述步骤(a)(b)的顺序是可以根据实际需要进行调整。例如,可以先将MAC地址与音频信息相关联,然后根据音频信息判断监控区域内是否发生异常事件。还可以先根据音频信息判断监控区域内是否发生异常事件,如果确定监控区域内是否发生异常事件,则将MAC地址与音频信息相关联。即,将监控区域内发生异常事件作为将MAC地址与音频信息相关联的触发条件。
[0068] 步骤S708,调取监控区域内发生异常事件时的音频信息所关联的MAC地址,并通过所关联的MAC地址确定异常事件的参与人员。
[0069] 例如,对于某个视频图像中出现的可能出现聚众集会的情况,可调取相应的音量信息,如果音量大于预设阈值,则说明有可能发生了集会等异常事件,此时可调取相应的MAC地址,通过聚众集会参与人员的终端MAC地址确定集会参与人员的手机号码,从而确定集会参与人员的身份。
[0070] 上述实施例利用监控音频判断是否发生异常事件,并利用监控音频和MAC地址探测数据的关联关系,确定监控中嫌疑人携带的电子设备的MAC地址,进而通过搜寻定位MAC地址等方式来定位联系人,从而能够准确、高效地实现对于异常事件的监控,确定异常事件参与人员。此外,上述实施例还具有以下优势:第一,克服了传统监控方式监控视频的视角、画面的局限,能够得到与案件相关的全部人员。第二,降低了监控成本,便于普及应用。第三,监控过程更加自动化,摆脱对于人工识别的以来,大幅提高了识别效率,避免人工识别中主观因素造成的影响,提高了识别的准确度。第四,降低因天气原因的影响,减少因天气原因导致监控画面清晰度低所造成遗漏的情况。
[0071] 在一个实施例中,将相同时间采集的MAC地址和音频信息相关联。
[0072] 在一个实施例中,该方法还包括:
[0073] 步骤S705,采集监控区域附近的视频图像。
[0074] 例如,在监控区域部署视频采集设备。视频采集设备能够实时采集监控区域的音频信息,并实时的将采集到的视频图像及其采集时间发送给关联设备。
[0075] 步骤S707,根据音频信息判断监控区域内是否发生异常事件,并将视频图像与音频信息相关联。
[0076] 采集监控区域附近的视频图像后,可以将采集到的MAC地址、到的视频图像以及采集到的音频信息均合轨存储。
[0077] 步骤S709,调取监控区域内发生异常事件时的音频信息所关联的视频图像,并通过所关联的视频图像确定异常事件的参与人员的图像信息。
[0078] 当通过音频信息确定发生聚众集会等异常事件后,可通过与该音频信息合轨存储的视频图像,确定异常事件参与人员的图像信息。例如,异常事件参与人员的穿着打扮、异常事件参与人员的数量、异常事件参与人员的来源和去向等等,便于案情还原和调查取证。
[0079] 在一个实施例中,将相同时间采集的视频图像和音频信息相关联。
[0080] 具体合轨存储时,针对监控到的一帧视频图像,可将采集到的MAC地址、采集到的音频信息按照采集时间、采集时间与监控时间相同或相近的原则,将MAC地址和音频信息合轨存储到视频图像的索引文件中。也可将MAC地址和音频信息存储到视频图像对应的音频文件或其他文件。只要MAC地址的采集时间、音频信息的采集时间与视频图像的监控时间相同,就将三者合轨存储。
[0081] 在一个实施例中,根据音频信息判断监控区域内是否发生异常事件包括:判断音频的音量是否大于预设音量值;若大于预设音量值,则确定监控区域内发生异常事件。
[0082] 在一个实施例中,根据音频信息判断监控区域内是否发生异常事件包括:获取异常事件所对应样本音频信息的样本频率特征;将音频信息的频率特征与样本频率特征相比对;若音频信息的频率特征与样本频率特征相近,则确定监控区域内发生异常事件。。
[0083] 例如,在实际应用场景中,可以将声音强度数据与视频图像、MAC地址结合进行建模。应用模型可以包括:(一)通过视频图像识别现场人数,再通过声音强度判断现场是聚众性活动还是个人性质的求救事件;(二)在视频扇区未能覆盖的区域,结合Mac数据识别现场人数,再通过声音强度识别现场是聚众性还是个人性活动;(三)通过声音强度变化规律,判别现场属于哪种特性的活动。在数据管理平台,事先设定多场景(例如聚众闹事、演唱会、游行、个人求救等)的声音强度样例数据,建立贝叶斯判别模型(Bayesian Discriminant)或人工神经网络(Artificial Neural Network)、支持向量机(Support Vector Machine)等数据挖掘模型,实时分析及判断现场发生的情况,发现异常情况时及发出预警信号。
[0084] 本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0085] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。