CN110569720B - 一种基于音视频处理系统的音视频智能识别处理方法 - Google Patents

一种基于音视频处理系统的音视频智能识别处理方法 Download PDF

Info

Publication number
CN110569720B
CN110569720B CN201910702777.5A CN201910702777A CN110569720B CN 110569720 B CN110569720 B CN 110569720B CN 201910702777 A CN201910702777 A CN 201910702777A CN 110569720 B CN110569720 B CN 110569720B
Authority
CN
China
Prior art keywords
data
voice
layer
audio
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910702777.5A
Other languages
English (en)
Other versions
CN110569720A (zh
Inventor
张梦婷
马韵洁
罗晶晶
黄翔
翟佩璇
李欣
柴泾哲
吴彦衡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Create Electronics Co ltd
Original Assignee
Sun Create Electronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Create Electronics Co ltd filed Critical Sun Create Electronics Co ltd
Priority to CN201910702777.5A priority Critical patent/CN110569720B/zh
Publication of CN110569720A publication Critical patent/CN110569720A/zh
Application granted granted Critical
Publication of CN110569720B publication Critical patent/CN110569720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Abstract

本发明涉及一种基于音视频处理系统的音视频智能识别处理方法,包括如下步骤:通过采集层的摄像机和拾音器设备分别实时获取音频数据和视频数据,并通过传输层传输至存储层保存;通过解析层上的人脸识别算法对视频数据提取得到的人脸特征数据存储至存储层中;通过解析层上的语音识别算法对语音数据提取得到的语音特征数据存储至存储层中;服务层获取人脸特征数据、语音特征数据以及对应的设备关联数据,通过服务层中的挖掘算法构建多维关联分析模型;应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析。本发明能够对音频数据和视频数据进行融合处理,得到人、语音、图像的关联信息,为公安系统的工作提供了依据。

Description

一种基于音视频处理系统的音视频智能识别处理方法
技术领域
本发明属于音视频处理技术领域,具体地讲涉及一种基于音视频处理系统的音视频智能识别处理方法。
背景技术
近几年,随着平安城市建设的推进和反恐进程的加快,音视频监控应用越来越广泛,已经成为平安城市的重要组成部分。在今后的平安城市建设中,街道、商业区、重点部位等公共场所都会安置、部署视频摄像头和音频拾音器同步音视频监控,其能够实时有效的捕捉和拍摄犯罪分子的作案过程,提供犯罪分子的面部肖像,采集重要语音信息。
对获取到的前端音频数据和视频数据进行深入挖掘,帮助公安机关对犯罪活动及时采取行动并为后期办案提供有力证据,这对预防和打击违法犯罪行动有着重要的意义,可以在很大程度上提高公安系统的工作效率和工作质量,保障了公共安全。因此,提出一种对音频数据和视频数据进行识别处理的方法很有必要。
发明内容
根据现有技术中存在的问题,本发明提供了一种基于音视频处理系统的音视频智能识别处理方法,其能够对音频数据和视频数据进行融合处理,得到人、语音、图像的关联信息,为公安系统的工作提供了依据。
本发明采用以下技术方案:
一种基于音视频处理系统的音视频智能识别处理方法,所述音视频处理系统包括采集层、传输层、存储层、解析层、服务层和应用层;所述采集层的输出端连接传输层的输入端,传输层的输出端连接存储层的输入端,存储层与解析层双向通信连接,解析层的输出端连接服务层的输入端,服务层的输出端连接应用层的输入端;所述基于音视频处理系统的音视频智能识别处理方法包括如下步骤:
S1,通过采集层的摄像机和拾音器设备分别实时获取音频数据和视频数据,并通过传输层将音频数据、视频数据以及对应的设备关联数据传输至存储层保存;
S2,解析层由存储层获取音频数据和视频数据,通过解析层上的人脸识别算法对视频数据进行人脸特征数据提取,提取得到的人脸特征数据存储至存储层中;通过解析层上的语音识别算法对语音数据进行语音特征数据提取,提取得到的语音特征数据存储至存储层中;
S3,服务层获取存储层中的人脸特征数据、语音特征数据以及对应的设备关联数据,通过服务层中的挖掘算法构建多维关联分析模型;
S4,应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析。
优选的,步骤S1中,所述传输层采用基于GPON网络的P2MP组网方式,并部署有接入交换机;所述采集层的摄像机和拾音器设备经由GPON网络光纤与接入交换机联通,且接入交换机分别与存储层中的存储服务器、解析层中的解析服务器联通,实现将获取到的音频数据和视频数据进行实时传输和实时保存;所述设备关联信息包括摄像机设备编号、拾音器设备编号、音频数据采集时间和视频数据采集时间。
进一步优选的,所述存储层中的存储服务器包括结构化存储模块和非结构化存储模块;由摄像机和拾音器设备分别实时获取到的音频数据和视频数据均存储在非结构化存储模块中,步骤S2中提取得到的人脸特征数据和语音特征数据对应存储在结构化存储模块中的人脸库和语音库。
更进一步优选的,步骤S2中,对视频数据进行人脸特征数据提取包括如下步骤:
S21,解析层中的解析服务器获取非结构化存储模块中的视频数据,解析服务器对视频中的人脸图像进行采集,并将采集到的含有人脸图像的人脸图片进行灰度矫正、噪声过滤的预处理,得到处理后的人脸图片;通过人脸识别算法准确标定出处理后的人脸图片中人脸图像的位置和大小,进而输出处理后的人脸图片以及处理后的人脸图片中人脸图像的位置和大小数据;
S22,基于处理后的人脸图片、人脸图像的位置和大小数据信息,通过人脸识别算法对人脸图像中的眼睛、鼻子、嘴、下巴进行特征提取,获得人脸特征数据。
更进一步优选的,步骤S2中,对语音数据进行语音特征数据提取包括如下步骤:
S211,解析层中的解析服务器获取非结构化存储模块中的语音数据,并对语音数据进行滤波、预加重、分帧、加窗的预处理,得到处理后的语音数据;
S212,通过语音识别算法对处理后的语音数据按帧进行特征提取,获得帧特征矢量,连续音频片段经过特征提取后得到一个矢量矩阵,即语音特征数据。
更进一步优选的,步骤S3中,服务层获取结构化存储模块中的人脸特征数据、语音特征数据以及对应的设备关联数据,通过分类、回归、聚类、交叉检验、降维的挖掘算法,基于人脸图像、语音数据、摄像机设备编号、拾音器设备编号、音频数据采集时间和视频数据采集时间构建多维关联分析模型,进而判别人物关系;所述多维关联分析模型包括如下部分:
同一个人,即将结构化存储模块中的两个人脸特征数据进行相似度比较,当相似度大于设定阈值时,则表示为同一个人,当相似度小于设定阈值时,表示非同一个人;
语音归属人,即将结构化存储模块中的两个语音特征数据对应的矢量矩阵进行相似度计算,相似度用两个矢量矩阵之间的距离表示,距离越小,相似度越高;当相似度大于设定阈值时,则语音匹配通过,两个对应语音数据归属一个人,当相似度小于设定阈值时,表示语音匹配不通过,两个对应语音数据不归属一个人;
同行人,即两个人在同一摄像机设备中,同时出现的次数超过设置阈值时,则认定为同行人,否则,认定为非同行人;
人、语音同行,基于多维数据碰撞的同行分析,基于语音归属人和同行人关系,分析判断出不在一处的摄像机设备和拾音器设备对应采集到的人、语音同行关系。
更进一步优选的,所述结构化存储模块中还包括对比图片数据库和对比语音数据库;所述对比图片数据库中保存有各类人员图片,所述对比语音数据库中保存有枪声、爆炸声、哭声、尖叫声的语音片段。
更进一步优选的,步骤S4中,应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析的具体过程如下:
多维度检索:用户通过摄像机设备编号、拾音器设备编号、音频数据采集时间、视频数据采集时间、人脸特征数据的属性、语音特征数据的关键字进行单个或者多个条件检索;
布控告警:用户将一段异常声音片段作为目标对象单独上传至对比语音数据库,或将一张人脸图片作为目标对象单独上传至对比图片数据库,并设置好相应的相似度阈值,基于步骤S3,当相似度超过设定阈值时,在应用层给出红色告警提示;
关联分析:基于步骤3中多维关联分析模型判别得到的人物关系,用户输入人员的一张人脸图片或一段语音片段,即可查询到与该人员或语音片段关联的同行人图片、同行语音片段。
本发明的优点和有益效果在于:
1)本发明的音视频智能识别处理方法是在视频监控的同时引入音频作为对视频的补充,解决了视频监控中存在的“死角”现象,并且分别采集人的语音数据和人像图片数据,经过提取后进而保存至语音库和人脸库,通过将目标对象与语音库或人脸库做比对,对音频数据和视频数据进行融合处理,得到人、语音、图像的关联信息,为公安系统的工作提供了依据,提高了公安系统的工作效率和工作质量。
本发明由采集层的摄像机和拾音器设备采集并提取得到的人脸特征数据和语音特征数据对应存储在结构化存储模块中的人脸库和语音库,且结构化存储模块中还包括对比图片数据库和对比语音数据库;人脸库和语音库内部的人脸特征数据、语音特征数据之间可以进行对比,也可将人脸库和语音库内部的人脸特征数据、语音特征数据,与对比图片数据库和对比语音数据库中的数据进行对比,实现了对特定对象的动态跟踪和过往踪迹的探寻。
附图说明
图1为本发明的音视频智能识别处理方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,音视频处理系统包括采集层、传输层、存储层、解析层、服务层和应用层;所述采集层的输出端连接传输层的输入端,传输层的输出端连接存储层的输入端,存储层与解析层双向通信连接,解析层的输出端连接服务层的输入端,服务层的输出端连接应用层的输入端。
一种基于音视频处理系统的音视频智能识别处理方法包括如下步骤:
1、通过采集层的摄像机和拾音器设备分别实时获取音频数据和视频数据,并通过传输层将音频数据、视频数据以及对应的设备关联数据传输至存储层保存;
具体的,所述传输层采用基于GPON网络的P2MP组网方式,并部署有接入交换机;所述采集层的摄像机和拾音器设备经由GPON网络光纤与接入交换机联通,且接入交换机分别与存储层中的存储服务器、解析层中的解析服务器联通,实现将获取到的音频数据和视频数据进行实时传输和实时保存;所述设备关联信息包括摄像机设备编号、拾音器设备编号、音频数据采集时间和视频数据采集时间
所述存储层中的存储服务器包括结构化存储模块和非结构化存储模块;由摄像机和拾音器设备分别实时获取到的音频数据和视频数据均存储在非结构化存储模块中。
2、解析层由存储层获取音频数据和视频数据,通过解析层上的人脸识别算法对视频数据进行人脸特征数据提取,提取得到的人脸特征数据存储至存储层中;通过解析层上的语音识别算法对语音数据进行语音特征数据提取,提取得到的语音特征数据存储至存储层中;
具体的,提取得到的人脸特征数据和语音特征数据对应存储在结构化存储模块中的人脸库和语音库;
具体的,对视频数据进行人脸特征数据提取包括如下步骤:
1)解析层中的解析服务器获取非结构化存储模块中的视频数据,解析服务器对视频中的人脸图像进行采集,并将采集到的含有人脸图像的人脸图片进行灰度矫正、噪声过滤的预处理,得到处理后的人脸图片;通过人脸识别算法准确标定出处理后的人脸图片中人脸图像的位置和大小,进而输出处理后的人脸图片以及处理后的人脸图片中人脸图像的位置和大小数据;
2)基于处理后的人脸图片、人脸图像的位置和大小数据信息,通过人脸识别算法对人脸图像中的眼睛、鼻子、嘴、下巴进行特征提取,获得人脸特征数据;
具体的,对语音数据进行语音特征数据提取包括如下步骤:
1)解析层中的解析服务器获取非结构化存储模块中的语音数据,并对语音数据进行滤波、预加重、分帧、加窗的预处理,得到处理后的语音数据;
2)通过语音识别算法对处理后的语音数据按帧进行特征提取,获得帧特征矢量,连续音频片段经过特征提取后得到一个矢量矩阵,即语音特征数据。
3、服务层获取存储层中的人脸特征数据、语音特征数据以及对应的设备关联数据,通过服务层中的挖掘算法构建多维关联分析模型;
具体的,服务层获取结构化存储模块中的人脸特征数据、语音特征数据以及对应的设备关联数据,通过分类、回归、聚类、交叉检验、降维的挖掘算法,基于人脸图像、语音数据、摄像机设备编号、拾音器设备编号、音频数据采集时间和视频数据采集时间构建多维关联分析模型,进而判别人物关系;所述多维关联分析模型包括如下部分:
同一个人,即将结构化存储模块中的两个人脸特征数据进行相似度比较,当相似度大于设定阈值时,则表示为同一个人,当相似度小于设定阈值时,表示非同一个人;
语音归属人,即将结构化存储模块中的两个语音特征数据对应的矢量矩阵进行相似度计算,相似度用两个矢量矩阵之间的距离表示,距离越小,相似度越高;当相似度大于设定阈值时,则语音匹配通过,两个对应语音数据归属一个人,当相似度小于设定阈值时,表示语音匹配不通过,两个对应语音数据不归属一个人;
同行人,即两个人在同一摄像机设备中,同时出现的次数超过设置阈值时,则认定为同行人,否则,认定为非同行人;
人、语音同行,基于多维数据碰撞的同行分析,基于语音归属人和同行人关系,分析判断出不在一处的摄像机设备和拾音器设备对应采集到的人、语音同行关系。
具体的,所述结构化存储模块中还包括对比图片数据库和对比语音数据库;所述对比图片数据库中保存有各类人员图片,所述对比语音数据库中保存有枪声、爆炸声、哭声、尖叫声的语音片段。
4、应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析。
具体的,应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析的具体过程如下:
多维度检索:用户通过摄像机设备编号、拾音器设备编号、音频数据采集时间、视频数据采集时间、人脸特征数据的属性、语音特征数据的关键字进行单个或者多个条件检索;
布控告警:用户将一段异常声音片段作为目标对象单独上传至对比语音数据库,或将一张人脸图片作为目标对象单独上传至对比图片数据库,并设置好相应的相似度阈值,当相似度超过设定阈值时,在应用层给出红色告警提示;
关联分析:基于多维关联分析模型判别得到的人物关系,用户输入人员的一张人脸图片或一段语音片段,即可查询到与该人员或语音片段关联的同行人图片、同行语音片段。
目前的视频监控主要是根据人像图片进行追踪和踪迹探寻,局限性比较大。而本发明的方法是在视频监控的同时引入音频作为对视频的补充,解决了视频监控中存在的“死角”现象,并且分别采集人的语音数据和人像图片数据,经过提取后进而保存至语音库和人脸库,通过将目标对象与语音库或人脸库做比对,对音频数据和视频数据进行融合处理,得到人、语音、图像的关联信息,为公安系统的工作提供了依据,提高了公安系统的工作效率和工作质量。
同时,提取得到的人脸特征数据和语音特征数据对应存储在结构化存储模块中的人脸库和语音库,且结构化存储模块中还包括对比图片数据库和对比语音数据库;通过人脸库、语音库、对比图片数据库和对比语音数据库之间进行对比,实现对特定对象的动态跟踪和过往踪迹探寻。
综上所述,本发明提供了一种基于音视频处理系统的音视频智能识别处理方法,其能够对音频数据和视频数据进行融合处理,得到人、语音、图像的关联信息,为公安系统的工作提供了依据。

Claims (1)

1.一种基于音视频处理系统的音视频智能识别处理方法,其特征在于,所述音视频处理系统包括采集层、传输层、存储层、解析层、服务层和应用层;所述采集层的输出端连接传输层的输入端,传输层的输出端连接存储层的输入端,存储层与解析层双向通信连接,解析层的输出端连接服务层的输入端,服务层的输出端连接应用层的输入端;所述基于音视频处理系统的音视频智能识别处理方法包括如下步骤:
S1,通过采集层的摄像机和拾音器设备分别实时获取音频数据和视频数据,并通过传输层将音频数据、视频数据以及对应的设备关联数据传输至存储层保存;
S2,解析层由存储层获取音频数据和视频数据,通过解析层上的人脸识别算法对视频数据进行人脸特征数据提取,提取得到的人脸特征数据存储至存储层中;通过解析层上的语音识别算法对语音数据进行语音特征数据提取,提取得到的语音特征数据存储至存储层中;
S3,服务层获取存储层中的人脸特征数据、语音特征数据以及对应的设备关联数据,通过服务层中的挖掘算法构建多维关联分析模型;
S4,应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析;
步骤S1中,所述传输层采用基于GPON网络的P2MP组网方式,并部署有接入交换机;所述采集层的摄像机和拾音器设备经由GPON网络光纤与接入交换机联通,且接入交换机分别与存储层中的存储服务器、解析层中的解析服务器联通,实现将获取到的音频数据和视频数据进行实时传输和实时保存;所述设备关联数据 包括摄像机设备编号、拾音器设备编号、音频数据采集时间和视频数据采集时间;
所述存储层中的存储服务器包括结构化存储模块和非结构化存储模块;由摄像机和拾音器设备分别实时获取到的音频数据和视频数据均存储在非结构化存储模块中,步骤S2中提取得到的人脸特征数据和语音特征数据对应存储在结构化存储模块中的人脸库和语音库;
步骤S2中,对视频数据进行人脸特征数据提取包括如下步骤:
S21,解析层中的解析服务器获取非结构化存储模块中的视频数据,解析服务器对视频中的人脸图像进行采集,并将采集到的含有人脸图像的人脸图片进行灰度矫正、噪声过滤的预处理,得到处理后的人脸图片;通过人脸识别算法准确标定出处理后的人脸图片中人脸图像的位置和大小,进而输出处理后的人脸图片以及处理后的人脸图片中人脸图像的位置和大小数据;
S22,基于处理后的人脸图片、人脸图像的位置和大小数据信息,通过人脸识别算法对人脸图像中的眼睛、鼻子、嘴、下巴进行特征提取,获得人脸特征数据;
步骤S2中,对语音数据进行语音特征数据提取包括如下步骤:
S211,解析层中的解析服务器获取非结构化存储模块中的语音数据,并对语音数据进行滤波、预加重、分帧、加窗的预处理,得到处理后的语音数据;
S212,通过语音识别算法对处理后的语音数据按帧进行特征提取,获得帧特征矢量,连续音频片段经过特征提取后得到一个矢量矩阵,即语音特征数据;
步骤S3中,服务层获取结构化存储模块中的人脸特征数据、语音特征数据以及对应的设备关联数据,通过分类、回归、聚类、交叉检验、降维的挖掘算法,基于人脸图像、语音数据、摄像机设备编号、拾音器设备编号、音频数据采集时间和视频数据采集时间构建多维关联分析模型,进而判别人物关系;所述多维关联分析模型包括如下部分:
同一个人,即将结构化存储模块中的两个人脸特征数据进行相似度比较,当相似度大于设定阈值时,则表示为同一个人,当相似度小于设定阈值时,表示非同一个人;
语音归属人,即将结构化存储模块中的两个语音特征数据对应的矢量矩阵进行相似度计算,相似度用两个矢量矩阵之间的距离表示,距离越小,相似度越高;当相似度大于设定阈值时,则语音匹配通过,两个对应语音数据归属一个人,当相似度小于设定阈值时,表示语音匹配不通过,两个对应语音数据不归属一个人;
同行人,即两个人在同一摄像机设备中,同时出现的次数超过设置阈值时,则认定为同行人,否则,认定为非同行人;
人、语音同行,基于多维数据碰撞的同行分析,基于语音归属人和同行人关系,分析判断出不在一处的摄像机设备和拾音器设备对应采集到的人、语音同行关系;
所述结构化存储模块中还包括对比图片数据库和对比语音数据库;所述对比图片数据库中保存有各类人员图片,所述对比语音数据库中保存有枪声、爆炸声、哭声、尖叫声的语音片段;
步骤S4中,应用层通过多维关联分析模型面向用户进行多维度检索、异常预警、关联分析的具体过程如下:
多维度检索:用户通过摄像机设备编号、拾音器设备编号、音频数据采集时间、视频数据采集时间、人脸特征数据的属性、语音特征数据的关键字进行单个或者多个条件检索;
布控告警:用户将一段异常声音片段作为目标对象单独上传至对比语音数据库,或将一张人脸图片作为目标对象单独上传至对比图片数据库,并设置好相应的相似度阈值,基于步骤S3,当相似度超过设定阈值时,在应用层给出红色告警提示;
关联分析:基于步骤3中多维关联分析模型判别得到的人物关系,用户输入人员的一张人脸图片或一段语音片段,即可查询到与该人员或语音片段关联的同行人图片、同行语音片段。
CN201910702777.5A 2019-07-31 2019-07-31 一种基于音视频处理系统的音视频智能识别处理方法 Active CN110569720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910702777.5A CN110569720B (zh) 2019-07-31 2019-07-31 一种基于音视频处理系统的音视频智能识别处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910702777.5A CN110569720B (zh) 2019-07-31 2019-07-31 一种基于音视频处理系统的音视频智能识别处理方法

Publications (2)

Publication Number Publication Date
CN110569720A CN110569720A (zh) 2019-12-13
CN110569720B true CN110569720B (zh) 2022-06-07

Family

ID=68773397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910702777.5A Active CN110569720B (zh) 2019-07-31 2019-07-31 一种基于音视频处理系统的音视频智能识别处理方法

Country Status (1)

Country Link
CN (1) CN110569720B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385527B (zh) * 2018-12-28 2021-09-14 成都云天励飞技术有限公司 同行判定方法及相关产品
CN111460907B (zh) * 2020-03-05 2023-06-20 浙江大华技术股份有限公司 一种恶意行为识别方法、系统及存储介质
CN111401218B (zh) * 2020-03-12 2023-05-26 上海虹点智能科技有限公司 一种智慧城市监控方法及系统
CN111491135A (zh) * 2020-04-16 2020-08-04 广东电网有限责任公司电力调度控制中心 评标监控系统和评标监控方法
CN111787285A (zh) * 2020-07-20 2020-10-16 南京暴走团电子商务有限公司 一种基于商务软件平台的可视化监控系统
CN111885359A (zh) * 2020-07-28 2020-11-03 中冶赛迪重庆信息技术有限公司 一种基于机器视觉的轧线智能监控系统及方法
CN111860915A (zh) * 2020-07-31 2020-10-30 贵州东冠科技有限公司 基于监狱管理的亲情帮扶系统
CN112153477B (zh) * 2020-09-23 2022-04-26 合肥庐州管家家政服务集团有限公司 一种基于视频的服务方法及系统
CN112188171A (zh) * 2020-09-30 2021-01-05 重庆天智慧启科技有限公司 一种客户到访关系判断系统及方法
CN114172871A (zh) * 2021-12-13 2022-03-11 以萨技术股份有限公司 一种基于视频违法检测的数据处理系统、方法及存储介质
CN115309938B (zh) * 2022-10-09 2024-04-12 浙江汇信科技有限公司 一种监管、执法大数据数据分析挖掘的方法和系统
CN116192815B (zh) * 2023-04-27 2023-08-01 工福(北京)科技发展有限公司 一种工会会员在线直播与语音互动职代会管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960172A (zh) * 2016-01-08 2017-07-18 中兴通讯股份有限公司 人员识别处理方法、装置及系统
CN107016322A (zh) * 2016-01-28 2017-08-04 浙江宇视科技有限公司 一种尾随人员分析的方法及装置
CN109447048A (zh) * 2018-12-25 2019-03-08 苏州闪驰数控系统集成有限公司 一种人工智能预警系统
CN109639700A (zh) * 2018-12-25 2019-04-16 深圳市天彦通信股份有限公司 身份识别方法、装置、设备、云端服务器及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10446143B2 (en) * 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN108899050B (zh) * 2018-06-14 2020-10-02 南京云思创智信息科技有限公司 基于多模态情绪识别系统的语音信号分析子系统
CN109033440A (zh) * 2018-08-15 2018-12-18 武汉烽火众智数字技术有限责任公司 一种视频侦查多维轨迹分析方法
CN109308731B (zh) * 2018-08-24 2023-04-25 浙江大学 级联卷积lstm的语音驱动唇形同步人脸视频合成算法
CN109376639B (zh) * 2018-10-16 2021-12-17 上海弘目智能科技有限公司 基于人像识别的伴随人员预警系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960172A (zh) * 2016-01-08 2017-07-18 中兴通讯股份有限公司 人员识别处理方法、装置及系统
CN107016322A (zh) * 2016-01-28 2017-08-04 浙江宇视科技有限公司 一种尾随人员分析的方法及装置
CN109447048A (zh) * 2018-12-25 2019-03-08 苏州闪驰数控系统集成有限公司 一种人工智能预警系统
CN109639700A (zh) * 2018-12-25 2019-04-16 深圳市天彦通信股份有限公司 身份识别方法、装置、设备、云端服务器及存储介质

Also Published As

Publication number Publication date
CN110569720A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110569720B (zh) 一种基于音视频处理系统的音视频智能识别处理方法
CN112149638B (zh) 基于多模态生物特征的人员身份识别系统构建及使用方法
CN106355154B (zh) 一种监控视频中检测频繁过人的方法
CN103714631B (zh) 基于人脸识别的atm取款机智能监控系统
CN108364374A (zh) 基于深度学习的人脸门禁控制装置及方法
CN108200405A (zh) 一种基于人脸识别的视频监控系统
CN110728166A (zh) 一种利用人脸识别确认行踪智能监控集成系统
CN110852306A (zh) 一种基于人工智能的安全监控系统
CN111862413A (zh) 实现抗疫情非接触多维身份快速识别的方法及其系统
CN110941993A (zh) 基于人脸识别的动态人员分类与存储方法
CN112634561A (zh) 基于图像识别的安全报警方法和系统
CN112989950A (zh) 一种面向多模态特征语义关联特征的暴力视频识别系统
CN112183219A (zh) 一种基于人脸识别的公共安全视频监测方法及系统
KR20200059643A (ko) 영상 분석 기반의 금융자동화기기 보안 시스템 및 그 방법
CN116682162A (zh) 一种基于实时视频流的机器人人员检测算法
CN110245648A (zh) 基于人像识别的智慧单警系统
CN109977891A (zh) 一种基于神经网络的目标检测与识别方法
CN112804492B (zh) 一种电子猫眼的通信提示方法及装置
CN112200145A (zh) 一种公共安全的远程识别方法
CN210573821U (zh) 基于人像识别的智慧单警系统
CN113591619A (zh) 一种基于录像视频的人脸识别核验装置及其核验方法
CN112215064A (zh) 一种用于公共安全防范的人脸识别方法及系统
CN112738471A (zh) 基于物联网和人工智能的安防监控数据处理方法及云通信服务器
KR20150031059A (ko) 패턴 인식 기술에 의한 범죄 예방 폐쇄 회로 티비 장치 개선
Jawad et al. Targeted face recognition and alarm generation for security surveillance using single shot multibox detector (SSD)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant