CN113539262B - 一种用于电动门语音控制的声音增强及收录方法和系统 - Google Patents
一种用于电动门语音控制的声音增强及收录方法和系统 Download PDFInfo
- Publication number
- CN113539262B CN113539262B CN202110778240.4A CN202110778240A CN113539262B CN 113539262 B CN113539262 B CN 113539262B CN 202110778240 A CN202110778240 A CN 202110778240A CN 113539262 B CN113539262 B CN 113539262B
- Authority
- CN
- China
- Prior art keywords
- voice
- environment
- type
- sound
- enhancement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 190
- 230000002708 enhancing effect Effects 0.000 claims abstract description 9
- 230000008859 change Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 description 17
- 238000012216 screening Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- E—FIXED CONSTRUCTIONS
- E05—LOCKS; KEYS; WINDOW OR DOOR FITTINGS; SAFES
- E05F—DEVICES FOR MOVING WINGS INTO OPEN OR CLOSED POSITION; CHECKS FOR WINGS; WING FITTINGS NOT OTHERWISE PROVIDED FOR, CONCERNED WITH THE FUNCTIONING OF THE WING
- E05F15/00—Power-operated mechanisms for wings
- E05F15/70—Power-operated mechanisms for wings with automatic actuation
- E05F15/77—Power-operated mechanisms for wings with automatic actuation using wireless control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Power-Operated Mechanisms For Wings (AREA)
Abstract
本发明提出了一种用于电动门语音控制的声音增强及收录方法和系统,所述方法包括:实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。所述系统包括与所述方法步骤对应的模块。
Description
技术领域
本发明所述一种用于电动门语音控制的声音增强及收录方法和系统,属于电动门技术领域。
背景技术
电动门是一种能抵抗各种冲击波或重物冲撞的门,一般采用钢质材料制作。电动门会采用电动装置带动防护门左右拉动移动来实现防护门的关与闭。随着电子技术的不断发展,语音控制逐渐应用到电动门的运行控制当中,但是,由于电动门常用于大型工厂的室外大门的门禁管理工作中,常导致电动门所处环境噪音较大,在语音控制过程中,由于噪声的干扰,常导致语音识别误差率较大的问题发生。
发明内容
本发明提供了一种用于电动门语音控制的声音增强及收录方法和系统,用以解决语音识别过程中,语音指令识别误差率较大的问题:
一种用于电动门语音控制的声音增强及收录方法,所述方法包括:
实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;
根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;
利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。
进一步地,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类,包括:
实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;其中,所述声音类型包括雨声、鸣笛声、风声、人声噪声和物体搬运噪声等;
将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
进一步地,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类,还包括:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板数量超过两个时,按照模板选取规则确定所述声音类型模板的数量。
进一步地,所述模板选取规则如下:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板的数量超过两个时,判断所述声音类型与所述声音样本库中的声音类型模板的声音相似度是否超过第二相似度阈值;其中,第二相似度阈值高于第一相似度阈值;
如果超过所述第一相似度阈值的声音类型模板均未超过第二相似度阈值,则在超过第一相似度阈值的声音类型模板中提取声音相似度最高的两个声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;
如果超过所述第一相似度阈值的声音类型模板均中有部分或全部声音类型模板超过第二相似度阈值,则将所有超过超过第二相似度阈值的声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;并按照声音相似度由高到低的顺序依次将环境种类进行排序,获得环境种类队列。
进一步地,利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令,包括:
当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;
当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理,包括:
步骤1、按照环境种类队列中各环境种类的顺序,依次利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理,依次获得多个语音增强处理结果;将所述多个语音增强处理结果中的信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类;
步骤2、在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理;
步骤3、当所述环境种类的确定情况发生变化,产生新的环境种类队列时,判断所述信噪比最高的语音处理结果对应的环境种类是否在所述新的环境种类队列中,如果不在,则重复步骤1和步骤2的内容,否则,则执行步骤4;
步骤4、将所述新的环境种类队列与原环境种类队列中的环境种类进行比较,获取所述新的环境种类变化中的新增环境种类;利用新增环境种类对应的语音增强参数和所述信噪比最高的语音处理结果对应的环境种类的语音增强参数分别对所述声音信息进行处理,并获得对应的语音增强处理结果;并将所述语音增强结果进行信噪比比较处理,将信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类,在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理。
一种用于电动门语音控制的声音增强及收录系统,所述系统包括:
收录判断模块,用于实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;
增强参数获取模块,用于根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;
增强处理模块,用于利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。
进一步地,所述收录判断模块包括:
收录解析模块,用于实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;其中,所述声音类型包括雨声、鸣笛声、风声、人声噪声和物体搬运噪声等;
对比模块,用于将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;
环境种类确定模块一,用于当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
进一步地,所述收录判断模块还包括:
环境种类确定模块二,当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板数量超过两个时,按照模板选取规则确定所述声音类型模板的数量。
进一步地,所述模板选取规则如下:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板的数量超过两个时,判断所述声音类型与所述声音样本库中的声音类型模板的声音相似度是否超过第二相似度阈值;其中,第二相似度阈值高于第一相似度阈值;
如果超过所述第一相似度阈值的声音类型模板均未超过第二相似度阈值,则在超过第一相似度阈值的声音类型模板中提取声音相似度最高的两个声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;
如果超过所述第一相似度阈值的声音类型模板均中有部分或全部声音类型模板超过第二相似度阈值,则将所有超过超过第二相似度阈值的声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;并按照声音相似度由高到低的顺序依次将环境种类进行排序,获得环境种类队列。
进一步地,所述增强处理模块包括:
处理模块一,用于当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;
处理模块二,用于当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理;所述处理模块二的运行过程包括:
步骤1、按照环境种类队列中各环境种类的顺序,依次利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理,依次获得多个语音增强处理结果;将所述多个语音增强处理结果中的信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类;
步骤2、在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理;
步骤3、当所述环境种类的确定情况发生变化,产生新的环境种类队列时,判断所述信噪比最高的语音处理结果对应的环境种类是否在所述新的环境种类队列中,如果不在,则重复步骤1和步骤2的内容,否则,则执行步骤4;
步骤4、将所述新的环境种类队列与原环境种类队列中的环境种类进行比较,获取所述新的环境种类变化中的新增环境种类;利用新增环境种类对应的语音增强参数和所述信噪比最高的语音处理结果对应的环境种类的语音增强参数分别对所述声音信息进行处理,并获得对应的语音增强处理结果;并将所述语音增强结果进行信噪比比较处理,将信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类,在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理。
本发明有益效果:
本发明提出了一种用于电动门语音控制的声音增强及收录方法和系统,能够通过声音识别筛选出电动门所处的环境种类,根据环境种类进行对应的语音增强参数设置,能够有效提高语音增强处理效果,提高语音识别准确率。同时,通过本发明提出的多种环境种类中的语音增强处理方式,能够在电动门周围环境复杂恶劣的环境中(例如,既有暴风雨又有车辆和人员噪声)的情况下,筛选出处理效果最好的环境种类对应的语音增强参数,进而有效提高语音增强处理效果,降低语音信息中的噪音含量,提高语音指令识别的准确性。
附图说明
图1为本发明所述方法的流程图;
图2为本发明所述系统的系统框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提出了一种用于电动门语音控制的声音增强及收录方法,如图1所示,所述方法包括:
S1、实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;
S2、根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;
S3、利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。
上述技术方案的工作原理为:首先,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;然后,根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;最后,利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。
上述技术方案的效果为:本实施例提出了一种用于电动门语音控制的声音增强及收录方法,能够通过声音识别筛选出电动门所处的环境种类,根据环境种类进行对应的语音增强参数设置,能够有效提高语音增强处理效果,提高语音识别准确率。
本发明的一个实施例,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类,包括:
S101、实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;其中,所述声音类型包括雨声、鸣笛声、风声、人声噪声和物体搬运噪声等;
S102、将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;
S103、当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
上述技术方案的工作原理为:首先,实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;其中,所述声音类型包括雨声、鸣笛声、风声、人声噪声和物体搬运噪声等;然后,将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;最后,当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
上述技术方案的效果为:通过声音特征与声音样本库中的声音类型模板之间的相似度比较能够有效提高声环境种类筛选的准确性,进而能够有效提高后续语音增强参数选择的准确性,有效提高语音增强处理效果。
本发明的一个实施例,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类,还包括:
S104、当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板数量超过两个时,按照模板选取规则确定所述声音类型模板的数量。
其中,所述模板选取规则如下:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板的数量超过两个时,判断所述声音类型与所述声音样本库中的声音类型模板的声音相似度是否超过第二相似度阈值;其中,第二相似度阈值高于第一相似度阈值;
如果超过所述第一相似度阈值的声音类型模板均未超过第二相似度阈值,则在超过第一相似度阈值的声音类型模板中提取声音相似度最高的两个声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;
如果超过所述第一相似度阈值的声音类型模板均中有部分或全部声音类型模板超过第二相似度阈值,则将所有超过超过第二相似度阈值的声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;并按照声音相似度由高到低的顺序依次将环境种类进行排序,获得环境种类队列。
上述技术方案的效果为:通过上述方式,能够在通过对比确定多种环境种类的情况下,利用第二相似度阈值进一步对环境种类进行有效筛选,缩小环境种类范围,提高语音增强处理参数的选择范围,进而提高环境种类筛选的精确性。防止多种噪音存在的情况下,确定的环境种类数量过多,导致无法对声音信息进行精确处理,从而降低语音增强处理效果的问题发生。
本发明的一个实施例,利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令,包括:
S301、当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;
S302、当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理,具体包括:
步骤1、按照环境种类队列中各环境种类的顺序,依次利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理,依次获得多个语音增强处理结果;将所述多个语音增强处理结果中的信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类;
步骤2、在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理;
步骤3、当所述环境种类的确定情况发生变化,产生新的环境种类队列时,判断所述信噪比最高的语音处理结果对应的环境种类是否在所述新的环境种类队列中,如果不在,则重复步骤1和步骤2的内容,否则,则执行步骤4;
步骤4、将所述新的环境种类队列与原环境种类队列中的环境种类进行比较,获取所述新的环境种类变化中的新增环境种类;利用新增环境种类对应的语音增强参数和所述信噪比最高的语音处理结果对应的环境种类的语音增强参数分别对所述声音信息进行处理,并获得对应的语音增强处理结果;并将所述语音增强结果进行信噪比比较处理,将信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类,在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理。
上述技术方案的效果为:通过上述方式进行语音增强处理能够在选择多种环境种类的情况下,有效提高语音增强处理效率,防止语音增强处理效率较低导致语音增强处理延时,进而导致语音指令识别速度过慢造成电动门运行响应延时的问题发生。同时,通过上述方式能够在环境种类发生变化的情况下,进一步提升语音增强处理效率,防止新增环境种类造成的语音增强处理时间过长,进一步造成语音指令识别延时的问题发生。有效提高了后续语音指令识别和电动门运行控制的及时性和控制处理效率。
本发明实施例提出了一种用于电动门语音控制的声音增强及收录系统,如图2所示,所述系统包括:
收录判断模块,用于实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;
增强参数获取模块,用于根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;
增强处理模块,用于利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。
上述技术方案的工作原理为:首先,通过收录判断模块实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;然后,利用增强参数获取模块根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;最后,通过增强处理模块利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令。
上述技术方案的效果为:本实施例提出了一种用于电动门语音控制的声音增强及收录系统,能够通过声音识别筛选出电动门所处的环境种类,根据环境种类进行对应的语音增强参数设置,能够有效提高语音增强处理效果,提高语音识别准确率。
本发明的一个实施例,所述收录判断模块包括:
收录解析模块,用于实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;其中,所述声音类型包括雨声、鸣笛声、风声、人声噪声和物体搬运噪声等;
对比模块,用于将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;
环境种类确定模块一,用于当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
上述技术方案的工作原理为:首先,通过收录解析模块实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;其中,所述声音类型包括雨声、鸣笛声、风声、人声噪声和物体搬运噪声等;然后,采用对比模块将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;最后,通过环境种类确定模块一在当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
上述技术方案的效果为:通过声音特征与声音样本库中的声音类型模板之间的相似度比较能够有效提高声环境种类筛选的准确性,进而能够有效提高后续语音增强参数选择的准确性,有效提高语音增强处理效果。
本发明的一个实施例,所述收录判断模块还包括:
环境种类确定模块二,当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板数量超过两个时,按照模板选取规则确定所述声音类型模板的数量。
其中,所述模板选取规则如下:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板的数量超过两个时,判断所述声音类型与所述声音样本库中的声音类型模板的声音相似度是否超过第二相似度阈值;其中,第二相似度阈值高于第一相似度阈值;
如果超过所述第一相似度阈值的声音类型模板均未超过第二相似度阈值,则在超过第一相似度阈值的声音类型模板中提取声音相似度最高的两个声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;
如果超过所述第一相似度阈值的声音类型模板均中有部分或全部声音类型模板超过第二相似度阈值,则将所有超过超过第二相似度阈值的声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;并按照声音相似度由高到低的顺序依次将环境种类进行排序,获得环境种类队列。
上述技术方案的效果为:通过上述方式,能够在通过对比确定多种环境种类的情况下,利用第二相似度阈值进一步对环境种类进行有效筛选,缩小环境种类范围,提高语音增强处理参数的选择范围,进而提高环境种类筛选的精确性。防止多种噪音存在的情况下,确定的环境种类数量过多,导致无法对声音信息进行精确处理,从而降低语音增强处理效果的问题发生。
本发明的一个实施例,所述增强处理模块包括:
处理模块一,用于当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;
处理模块二,用于当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理;所述处理模块二的运行过程包括:
步骤1、按照环境种类队列中各环境种类的顺序,依次利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理,依次获得多个语音增强处理结果;将所述多个语音增强处理结果中的信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类;
步骤2、在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理;
步骤3、当所述环境种类的确定情况发生变化,产生新的环境种类队列时,判断所述信噪比最高的语音处理结果对应的环境种类是否在所述新的环境种类队列中,如果不在,则重复步骤1和步骤2的内容,否则,则执行步骤4;
步骤4、将所述新的环境种类队列与原环境种类队列中的环境种类进行比较,获取所述新的环境种类变化中的新增环境种类;利用新增环境种类对应的语音增强参数和所述信噪比最高的语音处理结果对应的环境种类的语音增强参数分别对所述声音信息进行处理,并获得对应的语音增强处理结果;并将所述语音增强结果进行信噪比比较处理,将信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类,在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理。
上述技术方案的工作原理为:首先,利用处理模块一在当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;然后,采用处理模块二在当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理。
上述技术方案的效果为:通过上述方式进行语音增强处理能够在选择多种环境种类的情况下,有效提高语音增强处理效率,防止语音增强处理效率较低导致语音增强处理延时,进而导致语音指令识别速度过慢造成电动门运行响应延时的问题发生。同时,通过上述方式能够在环境种类发生变化的情况下,进一步提升语音增强处理效率,防止新增环境种类造成的语音增强处理时间过长,进一步造成语音指令识别延时的问题发生。有效提高了后续语音指令识别和电动门运行控制的及时性和控制处理效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种用于电动门语音控制的声音增强及收录方法,其特征在于,所述方法包括:
实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;
根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;
利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令;
其中,利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令,包括:
当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;
当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理,包括:
步骤1、按照环境种类队列中各环境种类的顺序,依次利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理,依次获得多个语音增强处理结果;将所述多个语音增强处理结果中的信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类;
步骤2、在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理;
步骤3、当所述环境种类的确定情况发生变化,产生新的环境种类队列时,判断所述信噪比最高的语音处理结果对应的环境种类是否在所述新的环境种类队列中,如果不在,则重复步骤1和步骤2的内容,否则,则执行步骤4;
步骤4、将所述新的环境种类队列与原环境种类队列中的环境种类进行比较,获取所述新的环境种类变化中的新增环境种类;利用新增环境种类对应的语音增强参数和所述信噪比最高的语音处理结果对应的环境种类的语音增强参数分别对所述声音信息进行处理,并获得对应的语音增强处理结果;并将所述语音增强结果进行信噪比比较处理,将信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类,在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理。
2.根据权利要求1所述方法,其特征在于,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类,包括:
实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;
将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
3.根据权利要求2所述方法,其特征在于,实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类,还包括:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板数量超过两个时,按照模板选取规则确定所述声音类型模板的数量。
4.根据权利要求3所述方法,其特征在于,所述模板选取规则如下:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板的数量超过两个时,判断所述声音类型与所述声音样本库中的声音类型模板的声音相似度是否超过第二相似度阈值;其中,第二相似度阈值高于第一相似度阈值;
如果超过所述第一相似度阈值的声音类型模板均未超过第二相似度阈值,则在超过第一相似度阈值的声音类型模板中提取声音相似度最高的两个声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;
如果超过所述第一相似度阈值的声音类型模板均中有部分或全部声音类型模板超过第二相似度阈值,则将所有超过超过第二相似度阈值的声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;并按照声音相似度由高到低的顺序依次将环境种类进行排序,获得环境种类队列。
5.一种用于电动门语音控制的声音增强及收录系统,其特征在于,所述系统包括:
收录判断模块,用于实时收录所述电动门周围环境中的声音,通过声音判断当前所述电动门所处环境情况,确定当前所述电动门所处的环境种类;
增强参数获取模块,用于根据所述环境种类在预先构建的语音增强参数库中选择与所述环境种类对应的语音增强参数,获取处理当前语音的语音增强参数;其中,所述语音增强参数库中包括用于增强不同环境的语音的语音增强参数;
增强处理模块,用于利用所述处理当前语音的语音增强参数对收录到的声音信息进行语音增强处理,获取语音信息中的语音控制指令;
其中,所述增强处理模块包括:
处理模块一,用于当确定的环境种类的数量为一个时,利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理;
处理模块二,用于当确定的环境种类的数量为多个时,按照多种环境种类语音处理模式对所述声音信息进行语音增强处理;所述处理模块二的运行过程包括:
步骤1、按照环境种类队列中各环境种类的顺序,依次利用所述环境种类对应的语音增强参数对所述声音信息进行语音增强处理,依次获得多个语音增强处理结果;将所述多个语音增强处理结果中的信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类;
步骤2、在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理;
步骤3、当所述环境种类的确定情况发生变化,产生新的环境种类队列时,判断所述信噪比最高的语音处理结果对应的环境种类是否在所述新的环境种类队列中,如果不在,则重复步骤1和步骤2的内容,否则,则执行步骤4;
步骤4、将所述新的环境种类队列与原环境种类队列中的环境种类进行比较,获取所述新的环境种类变化中的新增环境种类;利用新增环境种类对应的语音增强参数和所述信噪比最高的语音处理结果对应的环境种类的语音增强参数分别对所述声音信息进行处理,并获得对应的语音增强处理结果;并将所述语音增强结果进行信噪比比较处理,将信噪比最高的语音处理结果作为目标语音处理结果进行输出,并记录所述信噪比最高的语音处理结果对应的环境种类,在所述环境种类的确定没有变化的时间段内,将所述信噪比最高的语音处理结果对应的环境种类的语音增强参数对收录到的声音信息进行语音增强处理。
6.根据权利要求5所述系统,其特征在于,所述收录判断模块包括:
收录解析模块,用于实时收录所述电动门周围环境中的声音,将所述电动门周围环境中的声音进行解析,提取所述电动门周围环境的声音中所包含的声音类型;
对比模块,用于将提取到的所述声音类型与声音样本库中的声音类型模板进行声音相似度比对,其中,每个声音类型模型对应一种环境种类;
环境种类确定模块一,用于当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值时,确定似度超过预先设定的第一相似度阈值的声音类型模板对应的环境种类为当前所述电动门所处的环境种类。
7.根据权利要求6所述系统,其特征在于,所述收录判断模块还包括:
环境种类确定模块二,当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板数量超过两个时,按照模板选取规则确定所述声音类型模板的数量。
8.根据权利要求7所述系统,其特征在于,所述模板选取规则如下:
当所述声音类型与所述声音样本库中的声音类型模板的声音相似度超过预先设定的第一相似度阈值的声音类型模板的数量超过两个时,判断所述声音类型与所述声音样本库中的声音类型模板的声音相似度是否超过第二相似度阈值;其中,第二相似度阈值高于第一相似度阈值;
如果超过所述第一相似度阈值的声音类型模板均未超过第二相似度阈值,则在超过第一相似度阈值的声音类型模板中提取声音相似度最高的两个声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;
如果超过所述第一相似度阈值的声音类型模板均中有部分或全部声音类型模板超过第二相似度阈值,则将所有超过超过第二相似度阈值的声音类型模板对应的环境种类作为当前所述电动门所处的环境种类;并按照声音相似度由高到低的顺序依次将环境种类进行排序,获得环境种类队列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110778240.4A CN113539262B (zh) | 2021-07-09 | 2021-07-09 | 一种用于电动门语音控制的声音增强及收录方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110778240.4A CN113539262B (zh) | 2021-07-09 | 2021-07-09 | 一种用于电动门语音控制的声音增强及收录方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113539262A CN113539262A (zh) | 2021-10-22 |
CN113539262B true CN113539262B (zh) | 2023-08-22 |
Family
ID=78127268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110778240.4A Active CN113539262B (zh) | 2021-07-09 | 2021-07-09 | 一种用于电动门语音控制的声音增强及收录方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113539262B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114202673A (zh) * | 2021-12-13 | 2022-03-18 | 深圳壹账通智能科技有限公司 | 证件分类模型的训练方法、证件分类方法、装置和介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009046658A1 (fr) * | 2007-09-30 | 2009-04-16 | Huawei Technologies Co., Ltd. | Procédé et appareil de détermination du type d'un signal audio non-bruit |
CN102945074A (zh) * | 2011-10-12 | 2013-02-27 | 微软公司 | 根据所捕捉的语音和音频内容来填充列表和任务 |
CN109949803A (zh) * | 2019-02-11 | 2019-06-28 | 特斯联(北京)科技有限公司 | 基于语义指令智能识别的建筑服务设施控制方法及系统 |
CN111583946A (zh) * | 2020-04-30 | 2020-08-25 | 厦门快商通科技股份有限公司 | 一种语音信号增强方法和装置以及设备 |
CN112151052A (zh) * | 2020-10-26 | 2020-12-29 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
CN112614504A (zh) * | 2020-12-22 | 2021-04-06 | 平安科技(深圳)有限公司 | 单声道语音降噪方法、系统、设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706482B2 (en) * | 2006-05-11 | 2014-04-22 | Nth Data Processing L.L.C. | Voice coder with multiple-microphone system and strategic microphone placement to deter obstruction for a digital communication device |
-
2021
- 2021-07-09 CN CN202110778240.4A patent/CN113539262B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009046658A1 (fr) * | 2007-09-30 | 2009-04-16 | Huawei Technologies Co., Ltd. | Procédé et appareil de détermination du type d'un signal audio non-bruit |
CN102945074A (zh) * | 2011-10-12 | 2013-02-27 | 微软公司 | 根据所捕捉的语音和音频内容来填充列表和任务 |
CN109949803A (zh) * | 2019-02-11 | 2019-06-28 | 特斯联(北京)科技有限公司 | 基于语义指令智能识别的建筑服务设施控制方法及系统 |
CN111583946A (zh) * | 2020-04-30 | 2020-08-25 | 厦门快商通科技股份有限公司 | 一种语音信号增强方法和装置以及设备 |
CN112151052A (zh) * | 2020-10-26 | 2020-12-29 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
CN112614504A (zh) * | 2020-12-22 | 2021-04-06 | 平安科技(深圳)有限公司 | 单声道语音降噪方法、系统、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113539262A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111783558A (zh) | 一种卫星导航干扰信号类型智能识别方法及系统 | |
CN109034046B (zh) | 一种基于声学检测的电能表内异物自动识别方法 | |
US11830521B2 (en) | Voice activity detection method and system based on joint deep neural network | |
CN103811003A (zh) | 一种语音识别方法以及电子设备 | |
EP2702585B1 (en) | Frame based audio signal classification | |
CN103632666A (zh) | 语音识别方法、语音识别设备和电子设备 | |
CN110648691B (zh) | 基于语音的能量值的情绪识别方法、装置和系统 | |
CN1271593C (zh) | 一种语音信号检测方法 | |
CN109087667B (zh) | 语音流利度识别方法、装置、计算机设备及可读存储介质 | |
WO2021041146A1 (en) | Audio scene recognition using time series analysis | |
CN110890102A (zh) | 一种基于rnn声纹识别的发动机缺陷检测算法 | |
US20020059065A1 (en) | Speech processing system | |
CN113539262B (zh) | 一种用于电动门语音控制的声音增强及收录方法和系统 | |
CN113240016A (zh) | 一种基于深度学习的滚动轴承故障诊断方法 | |
CN1949364A (zh) | 检测输入语音信号可识别度的系统与方法 | |
CN116206612A (zh) | 鸟类声音识别方法、模型训练方法、装置、电子设备 | |
US11776532B2 (en) | Audio processing apparatus and method for audio scene classification | |
CN116741159A (zh) | 音频分类及模型的训练方法、装置、电子设备和存储介质 | |
CN109346099B (zh) | 一种基于语音识别的迭代去噪方法和芯片 | |
Górriz et al. | Generalized LRT-based voice activity detector | |
CN114171057A (zh) | 基于声纹的变压器事件检测方法及系统 | |
CN109410928B (zh) | 一种基于语音识别的去噪方法和芯片 | |
CN111368778B (zh) | 一种基于智能优化算法的微弱信号噪声剥离方法 | |
CN111667836B (zh) | 基于深度学习的文本无关多标号说话人识别方法 | |
CN103390404A (zh) | 信息处理装置、信息处理方法和信息处理程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |