CN110634506A - 一种语音数据的处理方法及装置 - Google Patents
一种语音数据的处理方法及装置 Download PDFInfo
- Publication number
- CN110634506A CN110634506A CN201910894826.XA CN201910894826A CN110634506A CN 110634506 A CN110634506 A CN 110634506A CN 201910894826 A CN201910894826 A CN 201910894826A CN 110634506 A CN110634506 A CN 110634506A
- Authority
- CN
- China
- Prior art keywords
- voice
- voice data
- processed
- noise reduction
- analysis result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title description 11
- 230000002159 abnormal effect Effects 0.000 claims abstract description 57
- 230000009467 reduction Effects 0.000 claims abstract description 49
- 238000004458 analytical method Methods 0.000 claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 47
- 230000007613 environmental effect Effects 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims description 21
- 210000000056 organ Anatomy 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 8
- 238000012544 monitoring process Methods 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010039740 Screaming Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B7/00—Signalling systems according to more than one of groups G08B3/00 - G08B6/00; Personal calling systems according to more than one of groups G08B3/00 - G08B6/00
- G08B7/06—Signalling systems according to more than one of groups G08B3/00 - G08B6/00; Personal calling systems according to more than one of groups G08B3/00 - G08B6/00 using electric transmission, e.g. involving audible and visible signalling through the use of sound and light sources
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Alarm Systems (AREA)
Abstract
本申请公开了一种语音数据处理方法,对待处理语音数据进行处理时,首先确定待处理语音数据对应的环境信息,而后确定与环境信息对应的降噪模板,然后,利用确定的降噪模板对待处理语音数据进行降噪处理。最后,对进行降噪处理后得到的语音数据进行分析,得到指示待处理语音数据中是否存在异常语音的分析结果。由此可见,利用本申请实施例提供的方案,在对待处理语音数据进行分析之前,由与待处理语音数据对应的环境信息对应的降噪模板对待处理语音数据进行了降噪处理,去除待处理语音数据中的环境噪声带来的影响,从而使得对待处理语音数据进行分析的效果更好。进一步地,可以更加准确的确定出待处理语音数据中是否存在异常语音。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种语音数据处理方法及装置。
背景技术
随着科学技术的发展,出现了一些音频采集设备,音频采集设备可以用于采集一定范围内的音频。目前,为了保证用户的人身以及财产安全,在一些涉及公共安全的区域例如小区、花园等都可以安装音频采集设备,用于采集对应的音频数据。通过对音频数据进行分析,来确定是否存在异常情况,例如,确定用户是否由于突发疾病而呼救,又如,确定用户是否遭遇打劫而需要帮助等等。
但是,目前对音频数据进行分析的效果不好,并不能准备地分析出音频数据所携带的语义信息,进一步地,导致无法准确的判断出是否存在异常情况。
发明内容
本申请所要解决的技术问题是目前对音频数据进行分析的效果不好,并不能准备地分析出音频数据所携带的语义信息,进一步地,导致无法准确的判断出是否存在异常情况,提供一种语音数据的处理方法及装置。
第一方面,本申请实施例提供了一种语音数据处理方法,所述方法包括:
获取待处理语音数据,并确定所述待处理语音数据对应的环境信息;
基于所述环境信息确定对应的降噪模板;
利用所确定的所述降噪模板对所述待处理语音数据进行降噪处理;
对进行所述降噪处理后得到的语音数据进行分析,得到分析结果;所述分析结果,用于指示所述待处理语音数据中是否存在异常语音。
可选的,所述方法还包括:
获取语音采集设备采集的多种环境信息对应的噪声;
基于所述多种环境信息对应的噪声,分别生成与所述多种环境信息中每一种环境信息分别对应的噪声模板。
可选的,所述方法还包括:
若所述分析结果指示所述待处理语音数据中存在异常语音,则控制预警装置进行预警。
可选的,所述预警装置,包括以下任意一项或者组合:
警示灯、警铃、喇叭、蜂鸣器和发光二极管。
可选的,所述方法还包括:
若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息,并控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音。
可选的,所述方法还包括:
若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
获取目标区域内图像采集设备采集的图像;所述目标区域内的图像采集设备的图像拍摄范围,包括所述语音采集设备的位置;
控制终端设备显示所述图像。
第二方面,本申请实施例提供了一种语音数据处理装置,所述装置包括:
第一获取单元,用于获取待处理语音数据;
第一确定单元,用于确定所述待处理语音数据对应的环境信息;
第二确定单元,用于基于所述环境信息确定对应的降噪模板;
降噪处理单元,用于利用所确定的所述降噪模板对所述待处理语音数据进行降噪处理;
语音分析单元,用于对进行所述降噪处理后得到的语音数据进行分析,得到分析结果;所述分析结果,用于指示所述待处理语音数据中是否存在异常语音。
可选的,所述装置还包括:
第二获取单元,用于获取语音采集设备采集的多种环境信息对应的噪声;
模板生成单元,用于基于所述多种环境信息对应的噪声,分别生成与所述多种环境信息中每一种环境信息分别对应的噪声模板。
可选的,所述装置还包括:
预警单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则控制预警装置进行预警。
可选的,所述预警装置,包括以下任意一项或者组合:
警示灯、警铃、喇叭、蜂鸣器和发光二极管。
可选的,所述装置还包括:
第三确定单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
第一控制单元,用于控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音。
可选的,所述装置还包括:
第四确定单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
第三获取单元,用于获取目标区域内图像采集设备采集的图像;所述目标区域内的图像采集设备的图像拍摄范围,包括所述语音采集设备的位置;
第二控制单元,用于控制终端设备显示所述图像。
与现有技术相比,本申请实施例具有以下优点:
本申请实施例提供了一种语音数据处理方法,考虑到在实际应用中,语音采集设备在采集语音数据时,除了可以采集到用户的语音数据之外,还可能采集到环境中的噪声。而对语音数据进行分析,大多是对用户的语音数据进行分析,从而确定是否存在异常。因此,环境中的噪声会对用户的语音数据进行分析带来一定的干扰,从而使得对语音数据进行分析处理的效果不好。而且环境不同,对应的噪声也可能不同。
鉴于此,在本申请实施例中,对待处理语音数据进行处理时,首先确定待处理语音数据对应的环境信息,而后确定与所述环境信息对应的降噪模板,然后,利用所述确定的降噪模板对待处理语音数据进行降噪处理,即去除所述待处理语音数据中的环境噪声。最后,对进行降噪处理后得到的语音数据进行分析,得到指示所述待处理语音数据中是否存在异常语音的分析结果。由此可见,利用本申请实施例提供的方案,在对待处理语音数据进行分析之前,由与所述待处理语音数据对应的环境信息对应的降噪模板对所述待处理语音数据进行了降噪处理,去除所述待处理语音数据中的环境噪声带来的影响,从而使得对待处理语音数据进行分析的效果更好。进一步地,可以更加准确的确定出待处理语音数据中是否存在异常语音。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一个应用场景示意图;
图2为本申请实施例提供的一种语音数据处理方法的流程示意图;
图3为本申请实施例提供的一种语音数据处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的发明人经过研究发现,语音采集设备在采集语音数据时,除了可以采集到用户的语音数据之外,还可能采集到环境中的噪声。而对语音数据进行分析,大多是对用户的语音数据进行分析,从而确定是否存在异常。因此,环境中的噪声会对用户的语音数据进行分析带来一定的干扰,从而使得对语音数据进行分析处理的效果不好。本申请的发明人还发现,环境不同,对应的噪声也可能不同。例如,对于大风天气和暴雨天气,其对应的噪声是不同的。
鉴于此,本申请实施例提供了一种语音数据处理方法,对待处理语音数据进行处理时,首先确定待处理语音数据对应的环境信息,而后确定与所述环境信息对应的降噪模板,然后,利用所述确定的降噪模板对待处理语音数据进行降噪处理,即去除所述待处理语音数据中的环境噪声。最后,对进行降噪处理后得到的语音数据进行分析,得到指示所述待处理语音数据中是否存在异常语音的分析结果。由于在本申请实施例中,在对待处理语音数据进行分析之前,由与所述待处理语音数据对应的环境信息对应的降噪模板对所述待处理语音数据进行了降噪处理,去除所述待处理语音数据中的环境噪声带来的影响,从而使得对待处理语音数据进行分析的效果更好。进一步地,可以更加准确的确定出待处理语音数据中是否存在异常语音。
下面结合附图,详细说明本申请的各种非限制性实施方式。
示例性方法
为方便理解,首先对本申请实施例的应用场景进行简单介绍。
参见图1,该图为本申请实施例提供的一个应用场景示意图。
在图1所示的应用场景中,包括服务器101和语音采集设备102。其中,服务器101和语音采集设备102例如可以通过网络或者数据总线建立连接。语音采集设备102可以采集语音数据,而后利用网络或者数据总线将采集的语音数据发送给所述服务器101。
需要说明的是,所述语音采集设备102例如可以为位于涉及公共安全的区域例如小区、花园等的语音采集设备。虽然图1仅示出了一个语音采集设备102,但是图1只是为了方便理解而示出,其并不构成对本申请实施例的限定,在实际应用中,所述语音采集设备102的数量可以有多个。
需要说明的是,前述服务器101和语音采集设备102可以为独立的两个设备,服务器101和语音采集设备102也可以集成在一个设备上,例如,当服务器101和语音采集设备102集成在一个设备上时,服务器101可以体现为具备数据处理功能的处理器。本申请实施例不具体限定所述服务器101和语音采集设备102所集成的设备的外在体现形式,所集成的设备例如可以为机器人,又如可以为具备处理器的麦克风等等。
以下结合图2介绍本申请实施例提供的语音数据处理方法,参见图2,该图为本申请实施例提供的一种语音数据处理方法的流程示意图。
本申请实施例提供的语音数据处理方法,可以由服务器执行,该服务器可以为图1所示的服务器101。本申请实施例不具体限定所述服务器,所述服务可以为专门用于执行本申请实施例提供的语音数据处理方法的服务器,所述服务器也可以为还具备其它数据处理功能的服务器。
在本实施例中,所述语音数据处理方法例如可以通过以下步骤S101-S104实现。
S101:获取待处理语音数据,并确定所述待处理语音数据对应的环境信息。
在本申请实施例中,所述待处理语音数据为语音采集设备采集的语音数据。在本申请实施例中,服务器可以获取某一个语音采集设备采集的语音数据,并将该一个语音采集设备采集的语音数据确定为所述待处理语音数据。所述服务器也可以获取多个语音采集设备采集的语音数据,例如采集某一区域范围内的多个语音采集设备采集的语音数据,并将该多个语音采集设备采集的语音数据确定为所述待处理语音数据,本申请实施例不做具体限定。
在本申请实施例中,确定待处理语音数据之后,可以对所述待处理语音数据进行处理,例如对所述待处理语音数据的频谱进行分析,确定所述待处理语音数据对应的环境信息。
本申请实施例不具体限定所述环境信息,所述环境信息包括描述存在环境噪声的环境的信息。本申请实施例不具有限定所述存在环境噪声的环境,所述存在噪声的环境,可以由用户根据实际情况自定义。例如,所述存在环境噪声的环境,可以为大风环境、暴雨环境、临近公路环境、以及复合噪声环境(例如大风且暴雨)等等,此处不一一列举说明。
S102:基于所述环境信息确定对应的降噪模板。
在本申请实施例中,考虑到在实际应用中,环境不同,对应的噪声也可能不一样。故而在本申请实施例中,可以预先建立环境信息与噪声模板之间的映射关系,当确定所述待处理语音数据对应的环境信息之后,可以根据所述预先建立的环境信息与噪声模板之间的映射关系,确定与所述待处理语音数据的环境信息对应的降噪模板。从而由与所述待处理语音数据对应的环境信息对应的降噪模板,对所述待处理语音数据进行降噪处理。
S103:利用所确定的降噪模板对所述待处理语音数据进行降噪处理。
S104:对进行降噪处理后得到的语音数据进行分析,得到分析结果;所述分析结果,用于指示所述待处理语音数据中是否存在异常语音。
确定与所述待处理语音数据对应的环境信息对应的降噪模板之后,可以利用所确定的降噪模板对所述待处理语音数据进行降噪处理,以过滤掉所述待处理语音数据中的环境噪声。
可以理解的是,由于降噪处理后得到的语音数据中去掉了环境噪声,因此,对进行降噪处理后得到的语音数据进行分析,所得到的分析结果会更加准确。
需要说明的是,本申请实施例中提及的分析结果,指的是所述待处理语音数据中是否存在异常语音。本申请实施例不具体限定所述异常语音,所述异常语音例如可以包括呼救声(例如“救命”、“我需要帮助”等等),打砸声(物体与地面或者墙壁之间强烈的撞击声)等等。
本申请实施例不具体限定对进行降噪处理后得到的语音数据进行分析的具体实现方式,作为一种示例,可以预先训练机器学习模型,该机器学习模型可以识别特殊词汇,例如呼救词汇以及其它词汇等等。得到降噪处理后得到的语音数据之后,可以将所述语音数据转换成文字,将转换得到的文字输入预先得到机器学习模型中,从而得到所述分析结果。
本申请实施例不具体限定所述机器学习模型,所述机器学习模型,例如可以为卷积神经网络(Convolutional Neural Networks,CNN)模型,所述机器学习模型,又如可以为深度神经网络(Deep Neural Networks,DNN)模型,所述机器学习模型,还可以为循环神经网络(Recurrent Neural Network,RNN)模型。
通过以上描述可知,由于在本申请实施例中,在对待处理语音数据进行分析之前,由与所述待处理语音数据对应的环境信息对应的降噪模板对所述待处理语音数据进行了降噪处理,去除所述待处理语音数据中的环境噪声带来的影响,从而使得对待处理语音数据进行分析的效果更好。进一步地,可以更加准确的确定出待处理语音数据中是否存在异常语音。
如前文,在本申请实施例中,可以预先建立环境信息与噪声模板之间的映射关系,以下介绍建立环境信息与噪声模板之间的映射关系的具体实现方式。
具体地,可以采集多种环境信息对应的噪声,具体地,可以将语音采集设备置于与所述多种环境信息对应的环境中,并控制用户在所述环境中保持安静状态,即保证语音采集设备采集的语音均为环境噪声,而后利用所述语音采集设备采集对应的环境噪声。服务器可以获取语音采集设备采集的所述多种环境信息分别对应的噪声。而后,服务器基于所述环境信息对应的噪声,分别生成与所述多种环境信息中每一种环境信息分辨对应的噪声模板。
为了保护用户的人身以及财产安全,在本申请实施例的一种实现方式中,若前述S104中分析得到的分析结果,指示所述待处理语音数据中存在异常语音,则所述服务器可以控制预警装置进行预警。在本申请实施例中,该预警装置可以为涉及公共安全的区域例如小区内安装的预警装置,该预警装置也可以为监控室的预警装置,该预警装置还可以为巡逻人员(例如安保人员)所携带的预警装置。
本申请实施例不具体限定所述预警装置,所述预警装置例如可以为警示灯、警铃、喇叭、蜂鸣器和发光二极管等等。当所述预警装置为警示灯时,前述提及的控制预警装置进行预警,例如可以为控制警示灯闪烁或者控制警示灯常亮。当所述预警装置为警铃时,前述提及的控制预警装置进行预警,例如可以为控制警铃发出警报声。当所述预警装置为喇叭时,前述提及的控制预警装置进行预警,例如可以为控制喇叭发生警报声。当所述预警装置为蜂鸣器时,前述提及的控制预警装置进行预警,例如可以为控制蜂鸣器发出蜂鸣声。当所述预警装置为发光二极管时,前述提及的控制预警装置进行预警,例如可以为控制发光二极管发光。此处提及的发光二极管,可以为高亮度二极管。
可以理解的是,在实际应用中,控制预警装置预警之后,巡逻人员和/或监控室的工作人员可以确定涉及公共安全的区域内出现了异常情况,从而便于巡逻人员和/或监控室的工作人员前去查看,从而解决相应的安全隐患。
在本申请实施例的又一种实现方式中,为了更加便于巡逻人员和/或监控室的工作人员前去查看,当前述S104中分析得到的分析结果,指示所述待处理语音数据中存在异常语音时,服务器还可以确定采集所述待处理语音数据的语音采集设备的位置信息,并控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音。
需要说明的是,语音采集设备将自身采集的语音数据上报给服务器时,除了上报语音数据之外,还可以将语音采集设备自身的标识对应上报。而在安装所述语音采集设备时,可以记录语音采集设备的标识与语音采集设备的安装位置(即语音采集设备的位置信息)之间的对应关系。故而在本申请实施例中,可以获取采集所述待处理语音数据的语音采集设备的标识,而后根据采集所述待处理语音数据的语音采集设备的标识,确定采集所述待处理语音数据的语音采集设备的位置信息。
需要说明的是,本申请实施例不具体限定所述语音提示装置,所述语音提示装置例如可以为喇叭等可以播放语音的装置。在本申请实施例中,所述语音提示装置,可以为涉及公共安全的区域例如小区内安装的语音提示装置,该语音提示装置也可以为监控室的语音提示装置,该语音提示装置还可以为巡逻人员(安保人员)所携带的语音提示装置。
关于“控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音”现举例说明,服务器确定采集所述待处理语音数据的语音采集设备位于一号楼二层楼道,则服务器控制涉及公共安全的区域内安装的语音提示装置例如喇叭发出语音提示“一号楼二层楼道出现异常”,以便于巡逻人员、监控室的工作人员以及涉及公共安全的区域的居民等用户前去查看。当然,服务器也可以控制巡逻人员携带的语音提示装置发出语音提示“一号楼二层楼道出现异常”,以便于巡逻人员前去查看。服务器还可以控制监控室内的语音提示装置发出语音提示“一号楼二层楼道出现异常”,以便于监控室的工作人员前去查看。
在本申请实施例的一种实现方式中,考虑到在实际应用中,涉及公共安全的区域内不仅安装有语音采集设备,还安装有图像采集设备(例如摄像头)。图像采集设备也可以与服务器建立网络连接,从而将采集的图像通过网络发送给服务器。在本申请实施例中,当前述S104中分析得到的分析结果,指示所述待处理语音数据中存在异常语音时,为了使得监控室内的监控人员能够迅速知晓具体发生了何种异常情况,从而采取相应的应对措施。例如当发生打架斗殴事件时,迅速报警;当用户突发疾病时,迅速拨打急救电话等等。
需要说明的是,前述服务器、语音采集设备以及图像采集设备可以为独立的三个设备,服务器、语音采集设备和图像采集设备这三个设备中的任意两个或者全部也可以集成在一个设备上。当服务器、语音采集设备和图像采集设备集成在一个设备上时,服务器可以体现为具备数据处理功能的处理器。本申请实施例不具体限定所述服务器、语音采集设备以及图像采集设备这三个设备中的任意两个或者全部所集成的设备的外在体现形式,所集成的设备例如可以为机器人,又如可以为具备处理器的人工智能(ArtificialIntelligence,AI)摄像头等等。
在本申请实施例中,服务器可以确定采集所述待处理语音数据的语音采集设备的位置信息,即确定发生异常情况的位置。而后,确定该发生异常情况的位置附近的图像采集设备采集的图像。
具体地,可以确定目标区域内图像采集设备采集的图像,其中,目标区域内的图像采集设备的图像拍摄范围,包括所述语音采集设备的位置。换言之,所述目标区域,可以认为是发生异常情况的位置所在的区域。获取目标区域内图像采集设备采集的图像之后,可以控制终端设备显示所述图像。这样一来,监控室的工作人员即可根据终端设备显示的图像,确定具体发生了何种异常情况,从而迅速采集相应的应对措施。
在本申请实施例的一种实现方式中,服务器确定目标区域内图像采集设备采集的图像之后,还可以进一步对采集的图像进行分析处理,并结合对图像进行分析处理的结果和对待处理语音数据进行分析的结果,确定是否发生了危险事件。例如,若对采集的图像进行分析处理的结果指示发生了例如发生打架斗殴事件等,而且对待处理语音数据进行分析的结果,确定存在例如尖叫声等异常语音时,服务器还可以自动报警,具体地,服务器在报警时,可以携带发生该危险事件的地址,以便于警察能够快速到达现场对该危险事件进行处理。其中,发生危险事件的地址,例如可以根据前述图像采集设备的位置确定,当然,发生危险事件的地址,也可以根据前述采集待处理语音数据的语音采集设备的位置确定,此处不做限定。
需要说明的是,此处提及的对采集的图像进行分析,例如可以首先提取所述图像中的人物图像,而后,对所述人物图像中的人物的手势、动作、形态、所持物品(例如危险器械)等等进行分析,从而确定是否存在打架斗殴刺杀等暴力冲突、发出求助手势(例如规律性挥动手臂、特定的手势或者特定的姿势等)、人群异常聚集(一定区域内人群超过预设人数上限)、发生尾随事件、入侵行为事件、追逐打闹事件、人员倒地、出现危险人员以及失踪人员等异常事件。
其中,危险人员可以通过预先建立的危险人员库确定,即将图像设备采集的图像中的人物与危险人员库中的人员进行匹配,从而确定是否出现危险人员。相应的,失踪人员可以通过预先建立的失踪人员库确定,即将图像设备采集的图像中的人物与失踪人员库中的人员进行匹配,从而确定是否出现失踪人员。当然,本申请实施例不具体限定所述异常事件,该异常事件除了可以是前述提及的斗殴事件等之外,还可以是其它事件,此处不一一列举说明。
需要说明的是,在本申请实施例中,当对采集的图像进行分析处理的结果指示发生了例如发生斗殴事件、抢劫事件等异常事件时,在本申请实施例中,还可以识别出图像中的人物,并提取其他包含该人物的图像(例如其它图像采集设备采集的包含该人物的图像),进一步地,可以结合部分或者全部包含该人物的图像,对该人物行为例如运动轨迹进行分析,以辅助警方做相应的处理。例如,对采集图像进行分析处理的结果指示发生了斗殴事件,则可以获取整个涉及公共安全的区域例如整个小区内所有图像采集设备采集的包括斗殴人员的图像,并根据各个图像的拍摄时间以及各个图像采集设备的位置,得到斗殴人员在各个图像的拍摄时间所处的位置,从而得到斗殴人员的行动轨迹。
需要说明的是,在本申请实施例中,若对采集图像进行分析处理的结果指示发生了异常事件,则服务器还可以响应事件触发条件,生成控制信号从而引导一个或者多个语音采集设备例如麦克风,按照预先确定的算法计算出检测发生异常事件附近的语音所需的工作频率范围。并控制语音采集设备例如麦克风的工作频率在计算得到的工作频率范围内。
另外,在本申请实施例中,若对语音采集装置采集的语音数据进行分析,确定存在异常语音。则服务器还可以响应异常语音触发条件,生成控制信号从而引导一个或多个图像采集设备,按照预先确定的算法计算出检测存在异常语音附近的图像所需的图像采集范围。并控制图像采集设备通过转动、多设备联动等方式调整图像采集的方向和范围。
需要说明的是,此处提及的调整调整图像采集的方向和范围,包括控制图像采集设备发生物理移动、控制图像采集的类型、以及控制图像采集的模式、以及设置图像的对比度等等。
其中,物理移动包括前后左右平移、或者上下左右多角度转动;图像采集的类型包括:采集全景图像、采集缩放图像、或者采集旋转图像等等;图像采集的模式,包括白天模式、夜晚模式、晴天模式以及雨天模式等等。
另外,图像采集设备在采集图像时,还可以根据外部环境进行模式切换:例如,可以根据对比度、亮度、采集范围、镜头特使功能等方面进行调整,生成白天、夜晚、晴天、雨天等模式。模式设置包含但不限于物理参数、图像参数、几何特征、运动特征、表情特征、肢体特征、行为特征等关键要素。
示例性设备
基于以上实施例提供的语音数据处理方法,本申请实施例还提供了一种语音数据处理装置,以下结合附图介绍该装置。
参见图3,该图为本申请实施例提供的一种语音数据处理装置的结构示意图。
图3所示的语音处理装置300,例如可以具体包括:第一获取单元301、第一确定单元302、第二确定单元303、降噪处理单元304和语音处理单元305。
第一获取单元301,用于获取待处理语音数据;
第一确定单元302,用于确定所述待处理语音数据对应的环境信息;
第二确定单元303,用于基于所述环境信息确定对应的降噪模板;
降噪处理单元304,用于利用所确定的所述降噪模板对所述待处理语音数据进行降噪处理;
语音分析单元305,用于对进行所述降噪处理后得到的语音数据进行分析,得到分析结果;所述分析结果,用于指示所述待处理语音数据中是否存在异常语音。
可选的,所述装置300还包括:
第二获取单元,用于获取语音采集设备采集的多种环境信息对应的噪声;
模板生成单元,用于基于所述多种环境信息对应的噪声,分别生成与所述多种环境信息中每一种环境信息分别对应的噪声模板。
可选的,所述装置300还包括:
预警单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则控制预警装置进行预警。
可选的,所述预警装置,包括以下任意一项或者组合:
警示灯、警铃、喇叭、蜂鸣器和发光二极管。
可选的,所述装置300还包括:
第三确定单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
第一控制单元,用于控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音。
可选的,所述装置300还包括:
第四确定单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
第三获取单元,用于获取目标区域内图像采集设备采集的图像;所述目标区域内的图像采集设备的图像拍摄范围,包括所述语音采集设备的位置;
第二控制单元,用于控制终端设备显示所述图像。
由于所述装置300是与以上方法实施例提供的方法对应的装置,所述装置300的各个单元的具体实现,均与以上方法实施例为同一构思,因此,关于所述装置300的各个单元的具体实现,可以参考以上方法实施例的描述部分,此处不再赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种语音数据处理方法,其特征在于,所述方法包括:
获取待处理语音数据,并确定所述待处理语音数据对应的环境信息;
基于所述环境信息确定对应的降噪模板;
利用所确定的所述降噪模板对所述待处理语音数据进行降噪处理;
对进行所述降噪处理后得到的语音数据进行分析,得到分析结果;所述分析结果,用于指示所述待处理语音数据中是否存在异常语音。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取语音采集设备采集的多种环境信息对应的噪声;
基于所述多种环境信息对应的噪声,分别生成与所述多种环境信息中每一种环境信息分别对应的噪声模板。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述分析结果指示所述待处理语音数据中存在异常语音,则控制预警装置进行预警。
4.根据权利要求3所述的方法,其特征在于,所述预警装置,包括以下任意一项或者组合:
警示灯、警铃、喇叭、蜂鸣器和发光二极管。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息,并控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
获取目标区域内图像采集设备采集的图像;所述目标区域内的图像采集设备的图像拍摄范围,包括所述语音采集设备的位置;
控制终端设备显示所述图像。
7.一种语音数据处理装置,其特征在于,所述装置包括:
第一获取单元,用于获取待处理语音数据;
第一确定单元,用于确定所述待处理语音数据对应的环境信息;
第二确定单元,用于基于所述环境信息确定对应的降噪模板;
降噪处理单元,用于利用所确定的所述降噪模板对所述待处理语音数据进行降噪处理;
语音分析单元,用于对进行所述降噪处理后得到的语音数据进行分析,得到分析结果;所述分析结果,用于指示所述待处理语音数据中是否存在异常语音。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取单元,用于获取语音采集设备采集的多种环境信息对应的噪声;
模板生成单元,用于基于所述多种环境信息对应的噪声,分别生成与所述多种环境信息中每一种环境信息分别对应的噪声模板。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
预警单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则控制预警装置进行预警。
10.根据权利要求9所述的装置,其特征在于,所述预警装置,包括以下任意一项或者组合:
警示灯、警铃、喇叭、蜂鸣器和发光二极管。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第三确定单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
第一控制单元,用于控制语音提示装置播放携带所述语音采集设备的位置信息的提示语音。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第四确定单元,用于若所述分析结果指示所述待处理语音数据中存在异常语音,则确定采集所述待处理语音数据的语音采集设备的位置信息;
第三获取单元,用于获取目标区域内图像采集设备采集的图像;所述目标区域内的图像采集设备的图像拍摄范围,包括所述语音采集设备的位置;
第二控制单元,用于控制终端设备显示所述图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910894826.XA CN110634506A (zh) | 2019-09-20 | 2019-09-20 | 一种语音数据的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910894826.XA CN110634506A (zh) | 2019-09-20 | 2019-09-20 | 一种语音数据的处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110634506A true CN110634506A (zh) | 2019-12-31 |
Family
ID=68972100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910894826.XA Pending CN110634506A (zh) | 2019-09-20 | 2019-09-20 | 一种语音数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110634506A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383653A (zh) * | 2020-03-18 | 2020-07-07 | 北京海益同展信息科技有限公司 | 语音处理方法及装置、存储介质、机器人 |
CN111432305A (zh) * | 2020-03-27 | 2020-07-17 | 歌尔科技有限公司 | 一种耳机告警方法、装置及无线耳机 |
CN111599364A (zh) * | 2020-04-03 | 2020-08-28 | 厦门快商通科技股份有限公司 | 语音识别降噪方法、系统、移动终端及存储介质 |
CN113205799A (zh) * | 2021-03-24 | 2021-08-03 | 合肥佳讯科技有限公司 | 一种基于声音识别的告警处理方法 |
CN113947855A (zh) * | 2021-09-18 | 2022-01-18 | 中标慧安信息技术股份有限公司 | 一种基于语音识别的智能楼宇人员安全报警系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008250059A (ja) * | 2007-03-30 | 2008-10-16 | Advanced Telecommunication Research Institute International | 音声認識装置、音声認識システムおよび音声認識方法 |
KR20140077773A (ko) * | 2012-12-14 | 2014-06-24 | 한국전자통신연구원 | 사용자 위치정보를 활용한 음성 인식 장치 및 방법 |
CN104036786A (zh) * | 2014-06-25 | 2014-09-10 | 青岛海信信芯科技有限公司 | 一种语音降噪的方法及装置 |
US20150379989A1 (en) * | 2014-06-26 | 2015-12-31 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
KR20170136251A (ko) * | 2016-06-01 | 2017-12-11 | 박병한 | 무동작 인식 경보 시스템 및 그 방법 |
CN208029012U (zh) * | 2018-04-04 | 2018-10-30 | 武汉市技领科技有限公司 | 一种识别装置及监控设备 |
CN109584008A (zh) * | 2018-11-27 | 2019-04-05 | 重庆理工大学 | 基于语音识别的网约车异常驾驶环境监督系统及方法 |
US20190259378A1 (en) * | 2018-02-20 | 2019-08-22 | Krishna Khadloya | Audio type detection |
-
2019
- 2019-09-20 CN CN201910894826.XA patent/CN110634506A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008250059A (ja) * | 2007-03-30 | 2008-10-16 | Advanced Telecommunication Research Institute International | 音声認識装置、音声認識システムおよび音声認識方法 |
KR20140077773A (ko) * | 2012-12-14 | 2014-06-24 | 한국전자통신연구원 | 사용자 위치정보를 활용한 음성 인식 장치 및 방법 |
CN104036786A (zh) * | 2014-06-25 | 2014-09-10 | 青岛海信信芯科技有限公司 | 一种语音降噪的方法及装置 |
US20150379989A1 (en) * | 2014-06-26 | 2015-12-31 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
KR20170136251A (ko) * | 2016-06-01 | 2017-12-11 | 박병한 | 무동작 인식 경보 시스템 및 그 방법 |
US20190259378A1 (en) * | 2018-02-20 | 2019-08-22 | Krishna Khadloya | Audio type detection |
CN208029012U (zh) * | 2018-04-04 | 2018-10-30 | 武汉市技领科技有限公司 | 一种识别装置及监控设备 |
CN109584008A (zh) * | 2018-11-27 | 2019-04-05 | 重庆理工大学 | 基于语音识别的网约车异常驾驶环境监督系统及方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383653A (zh) * | 2020-03-18 | 2020-07-07 | 北京海益同展信息科技有限公司 | 语音处理方法及装置、存储介质、机器人 |
CN111432305A (zh) * | 2020-03-27 | 2020-07-17 | 歌尔科技有限公司 | 一种耳机告警方法、装置及无线耳机 |
CN111599364A (zh) * | 2020-04-03 | 2020-08-28 | 厦门快商通科技股份有限公司 | 语音识别降噪方法、系统、移动终端及存储介质 |
CN113205799A (zh) * | 2021-03-24 | 2021-08-03 | 合肥佳讯科技有限公司 | 一种基于声音识别的告警处理方法 |
CN113947855A (zh) * | 2021-09-18 | 2022-01-18 | 中标慧安信息技术股份有限公司 | 一种基于语音识别的智能楼宇人员安全报警系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110634506A (zh) | 一种语音数据的处理方法及装置 | |
CN109300471B (zh) | 融合声音采集识别的场区智能视频监控方法、装置及系统 | |
JP5043940B2 (ja) | ビデオおよびオーディオ認識を組み合わせたビデオ監視システムおよび方法 | |
US20060227237A1 (en) | Video surveillance system and method with combined video and audio recognition | |
CN108615321A (zh) | 基于雷达侦测及视频图像行为分析的安防预警系统及方法 | |
CN107911653A (zh) | 驻所智能视频监控模组、系统、方法以及存储介质 | |
CN107888887A (zh) | 一种监测燃气管道第三方破坏的视频监控预警方法及系统 | |
KR102509570B1 (ko) | 영상들과 전기 신호들을 학습하는 인공지능을 이용한 제어 장치와 이를 포함하는 침입 경계 시스템 | |
KR101687296B1 (ko) | 음향 및 행동 패턴 인식 기반의 하이브리드 패턴 분석이 가능한 객체 추적 시스템 및 객체 추적 방법 | |
KR101384781B1 (ko) | 이상 음원 탐지 장치 및 방법 | |
CN111223261A (zh) | 一种复合智能生产安防系统及其安防方法 | |
KR20180093596A (ko) | 비명인식 기반 안전감지센서 | |
KR102472369B1 (ko) | 긴급도움 요청 음원을 통한 객체 추적시스템 및 추적방법 | |
US11689810B2 (en) | Adaptable incident surveillance system | |
CN108965789B (zh) | 一种无人机监测方法及音视频联动装置 | |
CN113630543B (zh) | 一种坠物砸人事件监测方法、装置、电子设备及监控系统 | |
CN116129490A (zh) | 一种用于复杂环境行为识别的监控装置及监控方法 | |
KR101615824B1 (ko) | 위급상황 cctv 모니터링 시스템 | |
KR102513372B1 (ko) | 음향과 영상을 연계한 하이브리드형 객체 연속 추적시스템 및 제어방법 | |
KR101509223B1 (ko) | 모니터링 자동 포착기능이 구비된 보안 시스템 및 그 보안 처리방법 | |
CN110659603A (zh) | 一种数据处理方法及装置 | |
JP4175180B2 (ja) | 監視通報システム | |
KR100902275B1 (ko) | 지능형 보안방범을 위한 폐쇄회로티브이 시스템 및 그 방법 | |
CN111985309A (zh) | 告警方法、摄像器件及存储装置 | |
JP2004192459A (ja) | 異常事象検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200727 Address after: No.214, 05 / F, 101, No.4 building, No.59 yard, chemical engineering road, Chaoyang District, Beijing 100020 Applicant after: Beijing family intelligent technology Co.,Ltd. Address before: Room 710, No.63, Dongsanhuan Middle Road, Chaoyang District, Beijing 100023 Applicant before: Beijing Dog Intelligent Robot Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191231 |
|
RJ01 | Rejection of invention patent application after publication |