CN105303794A - 一种可通过声纹识别进行报警综合处置管理系统 - Google Patents
一种可通过声纹识别进行报警综合处置管理系统 Download PDFInfo
- Publication number
- CN105303794A CN105303794A CN201510859779.7A CN201510859779A CN105303794A CN 105303794 A CN105303794 A CN 105303794A CN 201510859779 A CN201510859779 A CN 201510859779A CN 105303794 A CN105303794 A CN 105303794A
- Authority
- CN
- China
- Prior art keywords
- voice
- module
- dictionary
- scene
- management system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 abstract 3
- 230000006870 function Effects 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000000916 dilatatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000003034 coal gas Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B25/00—Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems
- G08B25/01—Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems characterised by the transmission medium
- G08B25/012—Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems characterised by the transmission medium using recorded signals, e.g. speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- General Physics & Mathematics (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开一种可通过声纹识别进行报警综合处置管理系统,该系统包括:词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;相似度比较模块,适于将输入语音信号的特征矢量依次与词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;语音识别引擎模块,适于根据语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统的目标信息。本发明能快速找到各个子系统中的目标信息如视频、报警地点等进行描述、辨认、检索和快速执行,从而能将各个子系统有机整合在一起。
Description
技术领域
本发明属于报警综合处置管理领域,具体涉及一种可通过声纹识别进行报警综合处置管理系统。
背景技术
报警系统包括防盗报警系统和智能安防报警系统等多种类型;具体地,所述防盗报警系统的设备一般包括前端探测器和报警控制器,其中,报警控制器是一台主机如电脑的主机一样,用来控制包括有线/无线信号的处理,系统本身故障的检测,电源部分,信号输入,信号输出,内置拨号器等这几个方面,一个防盗报警系统中报警控制器是必不可少的。前端探测器包括有门磁开关、玻璃破碎探测器、红外探测器、红外/微波双鉴器和紧急呼救按钮。
所述智能安防报警系统是同家庭的各种传感器、功能键、探测器和执行器共同构成家庭的安防体系,是家庭安防体系的"大脑"。报警功能包括防火、防盗、煤气泄露报警及紧急求助等功能,报警系统采用先进智能型控制网络技术,由微机管理控制,实现对匪情、盗窃、火灾、煤气、紧急求助等意外事故的自动报警。
但是,本发明的发明人经过研究发现,在现有的各种报警系统中,存储的与报警相关的报警数量较多,当收到报警提示信息时,需要通过手工查看视频录像等来了解案件原由,即需要人工手动操作来处置报警,因而效率低下;同时,报警系统中的各个子系统如视频、地图、处置预案、附近工作人员及现场防护设备等各自运行,不能快速将各个子系统快速响应整合在一起,容易导致延误处置。
发明内容
针对现有技术存在的技术问题,本发明提供一种可通过声纹识别进行报警综合处置管理系统,该系统能快速找到视频、报警地点等进行描述、辨认、检索和快速执行,从而能将各个子系统有机整合在一起。
为了实现上述目的,本发明采用如下技术方案:
一种可通过声纹识别进行报警综合处置管理系统,该系统包括:
词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;
相似度比较模块,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;
语音识别引擎模块,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统中的目标信息。
本发明提供的可通过声纹识别进行报警综合处置管理系统,通过相似度比较,在模版数据库中找出与输入人体语音波纹信号相似度最高的语音识别结果即相应的文本,并根据语音识别结果即相应的文本获得词解码序列,即将相应的文本转换成机器执行代码或命令进行执行查找,代替传统的通过人工手动操作来进行检索查找,因而能快速找到各个子系统中的目标信息如目标视频、录像视频、报警地点等,工作效率高,智能化程度高,定位速度快,所以能更快满足用户对各个子系统中的目标信息如目标视频、录像视频、报警地点等进行描述、辨认、检索、快速执行如拖拉播放的需要,从而能够将各个子系统中的多个信息整合在一起进行整合分析。
进一步,所述词典场景语音模块中的模版包括监控系统术语模版和人体语音加词典模版。
进一步,所述语音识别引擎模块中搜索所依据的是对公式中的声学模型打分和语言模型打分。
附图说明
图1是本发明提供的可通过声纹识别进行报警综合处置管理系统原理示意图。
图中,1、词典场景语音模块;2、相似度比较模块;3、语音识别引擎模块。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
请参考图1所示,本发明公开一种可通过声纹识别进行报警综合处置管理系统,该系统包括:
词典场景语音模块1,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;
相似度比较模块2,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;
语音识别引擎模块3,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统中的目标信息。
本发明提供的可通过声纹识别进行报警综合处置管理系统,通过相似度比较,在模版数据库中找出与输入人体语音波纹信号相似度最高的语音识别结果即相应的文本,并根据语音识别结果即相应的文本获得词解码序列,即将相应的文本转换成机器执行代码或命令进行执行查找,代替传统的通过人工手动操作来进行检索查找,因而能快速找到各个子系统中的目标信息如目标视频、录像视频、报警地点等,工作效率高,智能化程度高,定位速度快,所以能更快满足用户对各个子系统中的目标信息如目标视频、录像视频、报警地点等进行描述、辨认、检索、快速执行如拖拉播放的需要,从而能够将各个子系统中的多个信息整合在一起进行整合分析。
作为具体实施例,所述词典场景语音模块1中的模版包括监控系统术语模版和人体语音加词典模版,所述监控系统术语模版中包括例如网络摄像机(IPC)、网络硬盘录像机(NVR)、出入口控制管理系统等术语;所述人体语音加词典模版中包括例如"XX支行XX网点加钞间视频"等人体语音,即将语音智能识别分成两种识别库进行综合分析并转换成系统可执行语言,由此可以提高语音识别的全面性和准确性。
作为具体实施例,所述相似度比较模块2适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;即所述相似度比较模块2处于识别学习阶段,对输入的人体语音波纹信号进行语言综合分析和语音库比对综合分析,得到与输入人体语音波纹信号相似度最高的相应文本。
作为具体实施例,所述语音识别引擎模块3中预设有词模型序列,当得到相似度最高的语音识别结果后,可根据该相似度最高的语音识别结果在所述语音识别引擎模块3中进行寻找,以找到一个能够准确描述语音输入信号的词模型序列,并将该词模型序列作为所述语音输入信号的词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统的目标信息如目标视频、录像视频、报警地点等。其中,通过语音识别引擎模块3搜索所依据的是对公式中的声学模型打分和语言模型打分,具体为:1、声韵调是适合汉语的音位系统;2、声学模型所运用的语音特征要首先区分发音方法进而区分发音部位;3、在音节层面上就要利用语言模型。其主要是利用市面上成熟的语音识别引擎模块进行检索,通过所述语音识别引擎模块,可以将得到的相应文本转换成机器执行代码或命令进行执行查找,代替了传统的通过人工手动操作来进行检索查找等操作,因而能够快速查找和调用报警管理系统中的各个子系统如视频、地图、处置预案、附近工作人员以及现场防护设备等,能够快速将各个子系统快速响应整合在一起,工作效率高,智能化程度高。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构,直接或间接运用在其他相关的技术领域,均同理在本发明的专利保护范围之内。
Claims (3)
1.一种可通过声纹识别进行报警综合处置管理系统,其特征在于,该系统包括:
词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;
相似度比较模块,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;
语音识别引擎模块,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子系统中的目标信息。
2.根据权利要求1所述的可通过声纹识别进行报警综合处置管理系统,其特征在于,所述词典场景语音模块中的模版包括监控系统术语模版和人体语音加词典模版。
3.根据权利要求1所述的可通过声纹识别进行报警综合处置管理系统,其特征在于,所述语音识别引擎模块中搜索所依据的是对公式中的声学模型打分和语言模型打分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510859779.7A CN105303794A (zh) | 2015-11-30 | 2015-11-30 | 一种可通过声纹识别进行报警综合处置管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510859779.7A CN105303794A (zh) | 2015-11-30 | 2015-11-30 | 一种可通过声纹识别进行报警综合处置管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105303794A true CN105303794A (zh) | 2016-02-03 |
Family
ID=55200995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510859779.7A Pending CN105303794A (zh) | 2015-11-30 | 2015-11-30 | 一种可通过声纹识别进行报警综合处置管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105303794A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107945471A (zh) * | 2017-11-23 | 2018-04-20 | 郑州庭淼软件科技有限公司 | 一种基于语境语义分析技术的智能求助系统 |
CN109243468A (zh) * | 2018-11-14 | 2019-01-18 | 北京羽扇智信息科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
CN110010134A (zh) * | 2019-04-17 | 2019-07-12 | 伍劲松 | 一种基于语音识别的安防系统 |
CN110782625A (zh) * | 2018-12-17 | 2020-02-11 | 北京嘀嘀无限科技发展有限公司 | 乘车安全报警方法、装置、电子设备及存储介质 |
CN110832409A (zh) * | 2017-07-13 | 2020-02-21 | 三菱电机大楼技术服务株式会社 | 楼宇管理系统以及楼宇管理装置 |
CN110838305A (zh) * | 2019-11-15 | 2020-02-25 | 中国汽车工程研究院股份有限公司 | 基于声音识别的智能车辆adas预警测试方法和系统 |
CN112489656A (zh) * | 2020-11-30 | 2021-03-12 | 珠海格力电器股份有限公司 | 一种报警方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158947A (zh) * | 2006-09-22 | 2008-04-09 | 株式会社东芝 | 机器翻译的方法和装置 |
CN101179802A (zh) * | 2007-11-23 | 2008-05-14 | 深圳华为通信技术有限公司 | 通信设备、网络设备以及报警方法 |
CN102411833A (zh) * | 2011-08-02 | 2012-04-11 | 杭州威威网络科技有限公司 | 基于音频识别的联网报警装置 |
US20120249328A1 (en) * | 2009-10-10 | 2012-10-04 | Dianyuan Xiong | Cross Monitoring Method and System Based on Voiceprint Recognition and Location Tracking |
CN103150876A (zh) * | 2013-02-04 | 2013-06-12 | 长春凤凰惠邦科技有限责任公司 | 一种语音报警定位方法 |
CN104392721A (zh) * | 2014-11-28 | 2015-03-04 | 东莞中国科学院云计算产业技术创新与育成中心 | 基于语音识别的智能应急指挥系统及其语音识别方法 |
CN104462262A (zh) * | 2014-11-21 | 2015-03-25 | 北京奇虎科技有限公司 | 一种实现语音搜索的方法、装置和浏览器客户端 |
CN105096940A (zh) * | 2015-06-30 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 用于进行语音识别的方法和装置 |
-
2015
- 2015-11-30 CN CN201510859779.7A patent/CN105303794A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158947A (zh) * | 2006-09-22 | 2008-04-09 | 株式会社东芝 | 机器翻译的方法和装置 |
CN101179802A (zh) * | 2007-11-23 | 2008-05-14 | 深圳华为通信技术有限公司 | 通信设备、网络设备以及报警方法 |
US20120249328A1 (en) * | 2009-10-10 | 2012-10-04 | Dianyuan Xiong | Cross Monitoring Method and System Based on Voiceprint Recognition and Location Tracking |
CN102411833A (zh) * | 2011-08-02 | 2012-04-11 | 杭州威威网络科技有限公司 | 基于音频识别的联网报警装置 |
CN103150876A (zh) * | 2013-02-04 | 2013-06-12 | 长春凤凰惠邦科技有限责任公司 | 一种语音报警定位方法 |
CN104462262A (zh) * | 2014-11-21 | 2015-03-25 | 北京奇虎科技有限公司 | 一种实现语音搜索的方法、装置和浏览器客户端 |
CN104392721A (zh) * | 2014-11-28 | 2015-03-04 | 东莞中国科学院云计算产业技术创新与育成中心 | 基于语音识别的智能应急指挥系统及其语音识别方法 |
CN105096940A (zh) * | 2015-06-30 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 用于进行语音识别的方法和装置 |
Non-Patent Citations (1)
Title |
---|
杜卫卫: ""英语翻译器语音识别系统设计及其应用"", 《电子测试》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110832409A (zh) * | 2017-07-13 | 2020-02-21 | 三菱电机大楼技术服务株式会社 | 楼宇管理系统以及楼宇管理装置 |
CN110832409B (zh) * | 2017-07-13 | 2024-01-30 | 三菱电机楼宇解决方案株式会社 | 楼宇管理系统以及楼宇管理装置 |
CN107945471A (zh) * | 2017-11-23 | 2018-04-20 | 郑州庭淼软件科技有限公司 | 一种基于语境语义分析技术的智能求助系统 |
CN109243468A (zh) * | 2018-11-14 | 2019-01-18 | 北京羽扇智信息科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
CN110782625A (zh) * | 2018-12-17 | 2020-02-11 | 北京嘀嘀无限科技发展有限公司 | 乘车安全报警方法、装置、电子设备及存储介质 |
CN110010134A (zh) * | 2019-04-17 | 2019-07-12 | 伍劲松 | 一种基于语音识别的安防系统 |
CN110838305A (zh) * | 2019-11-15 | 2020-02-25 | 中国汽车工程研究院股份有限公司 | 基于声音识别的智能车辆adas预警测试方法和系统 |
CN110838305B (zh) * | 2019-11-15 | 2022-03-18 | 中国汽车工程研究院股份有限公司 | 基于声音识别的智能车辆adas预警测试方法和系统 |
CN112489656A (zh) * | 2020-11-30 | 2021-03-12 | 珠海格力电器股份有限公司 | 一种报警方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105303794A (zh) | 一种可通过声纹识别进行报警综合处置管理系统 | |
CN108399923B (zh) | 多人发言中发言人识别方法以及装置 | |
Ntalampiras et al. | On acoustic surveillance of hazardous situations | |
Manocha et al. | Content-based representations of audio using siamese neural networks | |
CN103198838A (zh) | 一种用于嵌入式系统的异常声音监控方法和监控装置 | |
JP2022545342A (ja) | オーディオシーン認識のためのシーケンスモデル | |
CN110689906A (zh) | 一种基于语音处理技术的执法检测方法及系统 | |
CN111581348A (zh) | 一种基于知识图谱的查询分析系统 | |
Gandhe et al. | Using web text to improve keyword spotting in speech | |
Bai et al. | High-resolution attention network with acoustic segment model for acoustic scene classification | |
CN105338327A (zh) | 一种可通过语音识别的视频监控联网系统 | |
US20200143823A1 (en) | Methods and devices for obtaining an event designation based on audio data | |
CN206553008U (zh) | 一种语音识别紧急求助系统 | |
Lecouteux et al. | Combined low level and high level features for out-of-vocabulary word detection | |
Ramabhadran et al. | Fast decoding for open vocabulary spoken term detection | |
Chen et al. | Variable-Span out-of-vocabulary named entity detection. | |
CN114627581A (zh) | 一种智能门锁的胁迫指纹联动报警方法及系统 | |
Wang et al. | The DKU-Duke-Lenovo system description for the third DIHARD speech diarization challenge | |
Chandra et al. | Keyword spotting: an audio mining technique in speech processing–a survey | |
Pálfy et al. | Pattern search in dysfluent speech | |
Zhu et al. | Sensitive keyword spotting for voice alarm systems | |
Norouzian et al. | Facilitating open vocabulary spoken term detection using a multiple pass hybrid search algorithm | |
CN113506584B (zh) | 数据处理方法以及设备 | |
CN107945471A (zh) | 一种基于语境语义分析技术的智能求助系统 | |
Guo et al. | An algorithm for spoken keyword spotting via subsequence DTW |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160203 |