CN108847221B - 语音识别方法、装置、存储介质及电子设备 - Google Patents
语音识别方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN108847221B CN108847221B CN201810631988.XA CN201810631988A CN108847221B CN 108847221 B CN108847221 B CN 108847221B CN 201810631988 A CN201810631988 A CN 201810631988A CN 108847221 B CN108847221 B CN 108847221B
- Authority
- CN
- China
- Prior art keywords
- information
- environmental noise
- voice
- audio
- electronic equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000007613 environmental effect Effects 0.000 claims abstract description 203
- 238000012549 training Methods 0.000 claims description 38
- 238000001914 filtration Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0261—Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level
- H04W52/0274—Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof
- H04W52/028—Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof switching on or off only a part of the equipment circuit blocks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Artificial Intelligence (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例提供一种语音识别方法、装置、存储介质及电子设备,所述语音识别方法包括:通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;根据所述环境噪声信息获取环境噪声值;根据所述环境噪声值对滤波电路进行控制;通过语音识别电路对所述语音信息进行识别。所述语音识别方法中,电子设备可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
Description
技术领域
本申请涉及语音识别技术领域,特别涉及一种语音识别方法、装置、存储介质及电子设备。
背景技术
随着电子技术的快速发展,诸如智能手机等电子设备的功能越来越丰富。例如,用户可以通过语音对电子设备进行控制,以执行电子设备的各种功能应用。
当电子设备开启语音识别功能时,电子设备需要持续采集音频信息,并对音频信息进行处理和语音识别,从而导致电子设备的功耗较大。
发明内容
本申请实施例提供一种语音识别方法、装置、存储介质及电子设备,可以降低电子设备的功耗。
本申请实施例提供一种语音识别方法,应用于电子设备,所述电子设备包括音频采集电路、滤波电路以及语音识别电路,所述语音识别方法包括:
通过所述音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
根据所述环境噪声信息获取环境噪声值;
根据所述环境噪声值对所述滤波电路进行控制;
通过所述语音识别电路对所述语音信息进行识别。
本申请实施例还提供一种语音识别装置,应用于电子设备,所述电子设备包括音频采集电路、滤波电路以及语音识别电路,所述语音识别装置包括:
音频采集模块,用于通过所述音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
噪声值获取模块,用于根据所述环境噪声信息获取环境噪声值;
控制模块,用于根据所述环境噪声值对所述滤波电路进行控制;
语音识别模块,用于通过所述语音识别电路对所述语音信息进行识别。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述语音识别方法。
本申请实施例还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行上述语音识别方法。
本申请实施例还提供一种电子设备,所述电子设备包括音频采集电路、滤波电路、语音识别电路以及处理器,所述音频采集电路、滤波电路、语音识别电路均与所述处理器电性连接,其中:
所述音频采集电路用于采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
所述处理器用于根据所述环境噪声信息获取环境噪声值;
所述滤波电路用于对所述环境噪声信息进行滤波处理;
所述语音识别电路用于对所述语音信息进行识别。
本申请实施例提供的语音识别方法,包括:通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;根据所述环境噪声信息获取环境噪声值;根据所述环境噪声值对滤波电路进行控制;通过语音识别电路对所述语音信息进行识别。所述语音识别方法中,电子设备可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为用户对电子设备进行语音控制的示意图。
图2为本申请实施例提供的语音识别方法的流程示意图。
图3为本申请实施例提供的语音识别方法的另一流程示意图。
图4为本申请实施例提供的语音识别方法的又一流程示意图。
图5为本申请实施例提供的语音识别方法的再一流程示意图。
图6为本申请实施例提供的语音识别装置的结构示意图。
图7为本申请实施例提供的语音识别装置的另一结构示意图。
图8为本申请实施例提供的语音识别装置的又一结构示意图。
图9为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
本申请的说明书和权利要求书以及上述附图中的术语“第一”、“第二”、“第三”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应当理解,这样描述的对象在适当情况下可以互换。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤的过程、方法或包含了一系列模块或单元的装置、电子设备、系统不必限于清楚地列出的那些步骤或模块或单元,还可以包括没有清楚地列出的步骤或模块或单元,也可以包括对于这些过程、方法、装置、电子设备或系统固有的其它步骤或模块或单元。
参考图1,图1为用户对电子设备进行语音控制的示意图。其中,用户输出一段语音,电子设备采集用户的语音信息。随后,电子设备将采集到的语音信息与电子设备中存储的语音识别模型进行比较。当语音信息与语音识别模型吻合时,电子设备从语音信息中识别出控制指令。随后,电子设备执行与所述控制指令对应的操作,例如亮屏、开启应用、退出应用、锁屏等操作,从而实现用户对电子设备的语音控制。
本申请实施例提供一种语音识别方法,所述语音识别方法可以应用于电子设备中。所述电子设备包括音频采集电路、滤波电路以及语音识别电路。其中,所述音频采集电路、滤波电路以及语音识别电路可以设置在电子设备的电路板上。
所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
如图2所示,所述语音识别方法,可以包括以下步骤:
110,通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息。
当电子设备开启语音识别功能后,电子设备可以通过音频采集电路采集音频信息。其中,所述音频信息包括用户的语音信息。用户的语音信息即为用户通过语音输出的控制指令。例如,用户的语音信息可以包括“点亮屏幕”、“开启微信”、“退出淘宝”、“锁屏”等等控制指令。
可以理解的,当用户输出语音时,也即用户在说话时,周围环境中可能还存在其它的声音,例如其它人的说话声、汽车鸣笛声、手机铃声等。因此,音频采集电路采集到的音频信息中还包括环境噪声信息。所述环境噪声信息即为环境中存在的其它声音。
120,根据所述环境噪声信息获取环境噪声值。
电子设备采集到音频信息后,可以根据所述音频信息中的环境噪声信息获取环境噪声值。
由于用户说话时的声音频率与环境中的噪声频率是不同的,也即所述语音信息的频率与所述环境噪声信息的频率是不同的,因此电子设备可以通过滤波电路从采集到的音频信息中分离出环境噪声信息,也即滤除用户的语音信息。随后,电子设备可以对分离出的环境噪声信息进行分析,以获取环境噪声值。
其中,所述环境噪声值表示环境噪声的大小。所述环境噪声值可以为数值,例如60dB。
需要说明的是,电子设备开启语音识别功能后,需要以较高频率持续采集音频信息。例如,音频采集电路需要每50ms(毫秒)即采集一次音频信息。而环境噪声值是不需要持续获取的,可以以较大的周期间隔获取环境噪声值。例如,可以每3min(分钟)获取一次环境噪声值。从而,电子设备采集音频信息的频率可以高于获取环境噪声值的频率。
130,根据所述环境噪声值对滤波电路进行控制。
电子设备获取到环境噪声值后,即可根据所述环境噪声值对滤波电路进行控制。其中,所述滤波电路用于对电子设备采集到的所述音频信息进行滤波处理。
电子设备对所述滤波电路进行控制时,可以控制所述滤波电路对所述音频信息进行滤波处理,以滤除所述音频信息中的环境噪声信息。电子设备还可以控制关闭所述滤波电路,也即不通过所述滤波电路对所述音频信息进行滤波处理。
需要说明的是,滤除环境噪声信息的所述滤波电路与上述获取环境噪声值时的滤波电路是不同的。上述获取环境噪声值时的滤波电路滤除的是用户的语音信息。因此,两者的滤波频率是不同的。
140,通过语音识别电路对所述语音信息进行识别。
随后,电子设备可以通过语音识别电路对所述语音信息进行识别。当识别成功时,可以从所述语音信息中提取出控制指令,并执行与所述控制指令对应的操作,以实现用户通过语音对电子设备进行控制。
本申请实施例中,电子设备可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
在一些实施例中,如图3所示,步骤130、根据所述环境噪声值对滤波电路进行控制,包括以下步骤:
131,判断所述环境噪声值是否大于预设环境噪声阈值;
132,若所述环境噪声值大于所述预设环境噪声阈值,则控制所述滤波电路对所述环境噪声信息进行滤波处理;
133,若所述环境噪声值不大于所述预设环境噪声阈值,则控制关闭所述滤波电路。
其中,电子设备中可以预先设置预设环境噪声阈值。所述预设环境噪声阈值表示环境噪声较大与环境噪声较小之间的分界点,也即是否需要对采集到的音频信息进行滤波处理的分界点。例如,所述预设环境噪声阈值可以为50dB。
电子设备获取到环境噪声值后,可以将所述环境噪声值与所述预设环境噪声阈值进行比较,以判断所述环境噪声值是否大于预设环境噪声阈值。
若所述环境噪声值大于所述预设环境噪声阈值,则表示环境噪声较大,从而环境噪声对电子设备进行语音识别时的影响较大,因此需要对采集到的音频信息进行滤波处理。从而,电子设备控制所述滤波电路对采集到的音频信息中的环境噪声信息进行滤波处理。
例如,环境噪声值为60dB,则环境噪声值大于所述预设环境噪声阈值50dB。此时电子设备控制所述滤波电路对采集到的音频信息中的环境噪声信息进行滤波处理。
若所述环境噪声值不大于所述预设环境噪声阈值,则表示环境噪声较小,从而环境噪声对电子设备进行语音识别时的影响较小,此时可以忽略环境噪声的影响。从而,电子设备控制关闭所述滤波电路,以节省功耗。
在一些实施例中,如图4所示,步骤110、通过音频采集电路采集音频信息之前,还包括以下步骤:
151,通过音频采集电路采集用户的训练语音信息,所述训练语音信息包括预设关键词;
152,提取所述训练语音信息中的特征参数,所述特征参数包括线性预测系数、美尔倒谱系数;
153,对所述特征参数进行训练,以得到语音识别模型。
电子设备可以在用户首次开启或重新设置语音识别功能时,采集用户的训练语音信息。其中,所述训练语音信息包括预设关键词。例如,电子设备可以在显示屏上显示预设关键词,例如“小欧小欧”等,并引导用户多次朗读所述预设关键词或包含所述预设关键词的语句。在用户朗读所述预设关键词或包含所述预设关键词的语句时,电子设备通过音频采集电路采集用户的语音信息。此时用户的语音信息即为训练语音信息。
随后,电子设备提取所述训练语音信息中的特征参数,并对所述训练语音信息中提取到的特征参数进行训练,以得到语音识别模型。其中,所述特征参数可以包括线性预测系数、美尔倒谱系数。所述语音识别模型用于在电子设备进行语音识别时,与用户的语音信息进行匹配。
在一些实施例中,如图4所示,步骤140、通过语音识别电路对所述语音信息进行识别,包括以下步骤:
141,通过语音识别电路对所述语音信息与所述语音识别模型进行匹配;
142,若所述语音信息与所述语音识别模型匹配成功,则从所述语音信息中获取语音控制指令。
其中,电子设备可以通过语音识别电路对所述语音信息与所述语音识别模型进行匹配,以确认当前用户是否具有对电子设备进行语音控制的权限。
若所述语音信息与所述语音识别模型匹配成功,则表示当前用户具有电子设备的语音控制权限。随后,电子设备从所述语音信息中获取语音控制指令,例如“开启微信”等,并执行与所述语音控制指令对应的操作。
在一些实施例中,如图5所示,步骤120、根据所述环境噪声信息获取环境噪声值之前,还包括以下步骤:
161,获取电子设备当前所处的地理位置信息;
162,根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内;
若所述电子设备当前所处的位置类型为室内,则根据所述环境噪声信息获取环境噪声值。
电子设备在采集到音频信息后,可以获取当前所处的地理位置信息。所述地理位置信息可以包括当前的地理位置坐标或者地理位置区域。
随后,电子设备根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内。
其中,当电子设备所处的位置类型为室外时,可以认为用户当前处于较嘈杂的环境中,也即当前的环境噪声较大。从而,电子设备无需通过采集到的音频信息来获取环境噪声值,而可以直接控制滤波电路对采集到的音频信息进行滤波处理。
其中,当电子设备所处的位置类型为室内时,电子设备可以根据采集到的音频信息中的环境噪声信息获取环境噪声值,以进一步判断当前环境噪声是否较大,从而可以判断出是否需要对采集到的音频信息进行滤波处理。
具体实施时,本申请不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
由上可知,本申请实施例提供的语音识别方法,包括:通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;根据所述环境噪声信息获取环境噪声值;根据所述环境噪声值对滤波电路进行控制;通过语音识别电路对所述语音信息进行识别。所述语音识别方法中,电子设备可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
本申请实施例还提供一种语音识别装置,所述语音识别装置可以集成在电子设备中。所述电子设备包括音频采集电路、滤波电路以及语音识别电路。其中,所述音频采集电路、滤波电路以及语音识别电路可以设置在电子设备的电路板上。
如图6所示,语音识别装置200可以包括:音频采集模块201、噪声值获取模块202、控制模块203、语音识别模块204。
音频采集模块201,用于通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息。
当电子设备开启语音识别功能后,音频采集模块201可以通过音频采集电路采集音频信息。其中,所述音频信息包括用户的语音信息。用户的语音信息即为用户通过语音输出的控制指令。例如,用户的语音信息可以包括“点亮屏幕”、“开启微信”、“退出淘宝”、“锁屏”等等控制指令。
可以理解的,当用户输出语音时,也即用户在说话时,周围环境中可能还存在其它的声音,例如其它人的说话声、汽车鸣笛声、手机铃声等。因此,音频采集模块201采集到的音频信息中还包括环境噪声信息。所述环境噪声信息即为环境中存在的其它声音。
噪声值获取模块202,用于根据所述环境噪声信息获取环境噪声值。
音频采集模块201采集到音频信息后,噪声值获取模块202可以根据所述音频信息中的环境噪声信息获取环境噪声值。
由于用户说话时的声音频率与环境中的噪声频率是不同的,也即所述语音信息的频率与所述环境噪声信息的频率是不同的,因此噪声值获取模块202可以通过滤波电路从采集到的音频信息中分离出环境噪声信息,也即滤除用户的语音信息。随后,噪声值获取模块202可以对分离出的环境噪声信息进行分析,以获取环境噪声值。
其中,所述环境噪声值表示环境噪声的大小。所述环境噪声值可以为数值,例如60dB。
需要说明的是,电子设备开启语音识别功能后,需要以较高频率持续采集音频信息。例如,音频采集电路需要每50ms(毫秒)即采集一次音频信息。而环境噪声值是不需要持续获取的,可以以较大的周期间隔获取环境噪声值。例如,可以每3min(分钟)获取一次环境噪声值。从而,音频采集模块201采集音频信息的频率可以高于噪声值获取模块202获取环境噪声值的频率。
控制模块203,用于根据所述环境噪声值对滤波电路进行控制。
噪声值获取模块202获取到环境噪声值后,控制模块203即可根据所述环境噪声值对滤波电路进行控制。其中,所述滤波电路用于对音频采集模块201采集到的所述音频信息进行滤波处理。
控制模块203对所述滤波电路进行控制时,可以控制所述滤波电路对所述音频信息进行滤波处理,以滤除所述音频信息中的环境噪声信息。控制模块203还可以控制关闭所述滤波电路,也即不通过所述滤波电路对所述音频信息进行滤波处理。
需要说明的是,滤除环境噪声信息的所述滤波电路与上述获取环境噪声值时的滤波电路是不同的。上述获取环境噪声值时的滤波电路滤除的是用户的语音信息。因此,两者的滤波频率是不同的。
语音识别模块204,用于通过语音识别电路对所述语音信息进行识别。
随后,语音识别模块204可以通过语音识别电路对所述语音信息进行识别。当识别成功时,可以从所述语音信息中提取出控制指令,并执行与所述控制指令对应的操作,以实现用户通过语音对电子设备进行控制。
本申请实施例中,控制模块203可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
在一些实施例中,控制模块203用于执行以下步骤:
判断所述环境噪声值是否大于预设环境噪声阈值;
若所述环境噪声值大于所述预设环境噪声阈值,则控制所述滤波电路对所述环境噪声信息进行滤波处理;
若所述环境噪声值不大于所述预设环境噪声阈值,则控制关闭所述滤波电路。
其中,电子设备中可以预先设置预设环境噪声阈值。所述预设环境噪声阈值表示环境噪声较大与环境噪声较小之间的分界点,也即是否需要对采集到的音频信息进行滤波处理的分界点。例如,所述预设环境噪声阈值可以为50dB。
噪声值获取模块202获取到环境噪声值后,控制模块203可以将所述环境噪声值与所述预设环境噪声阈值进行比较,以判断所述环境噪声值是否大于预设环境噪声阈值。
若所述环境噪声值大于所述预设环境噪声阈值,则表示环境噪声较大,从而环境噪声对电子设备进行语音识别时的影响较大,因此需要对采集到的音频信息进行滤波处理。从而,控制模块203控制所述滤波电路对采集到的音频信息中的环境噪声信息进行滤波处理。
例如,环境噪声值为60dB,则环境噪声值大于所述预设环境噪声阈值50dB。此时控制模块203控制所述滤波电路对采集到的音频信息中的环境噪声信息进行滤波处理。
若所述环境噪声值不大于所述预设环境噪声阈值,则表示环境噪声较小,从而环境噪声对电子设备进行语音识别时的影响较小,此时可以忽略环境噪声的影响。从而,控制模块203控制关闭所述滤波电路,以节省功耗。
在一些实施例中,如图7所示,语音识别装置200还包括训练模块205。所述训练模块205用于执行以下步骤:
通过音频采集电路采集用户的训练语音信息,所述训练语音信息包括预设关键词;
提取所述训练语音信息中的特征参数,所述特征参数包括线性预测系数、美尔倒谱系数;
对所述特征参数进行训练,以得到语音识别模型。
训练模块205可以在用户首次开启或重新设置语音识别功能时,采集用户的训练语音信息。其中,所述训练语音信息包括预设关键词。例如,电子设备可以在显示屏上显示预设关键词,例如“小欧小欧”等,并引导用户多次朗读所述预设关键词或包含所述预设关键词的语句。在用户朗读所述预设关键词或包含所述预设关键词的语句时,训练模块205通过音频采集电路采集用户的语音信息。此时用户的语音信息即为训练语音信息。
随后,训练模块205提取所述训练语音信息中的特征参数,并对所述训练语音信息中提取到的特征参数进行训练,以得到语音识别模型。其中,所述特征参数可以包括线性预测系数、美尔倒谱系数。所述语音识别模型用于在电子设备进行语音识别时,与用户的语音信息进行匹配。
在一些实施例中,语音识别模块204用于执行以下步骤:
通过语音识别电路对所述语音信息与所述语音识别模型进行匹配;
若所述语音信息与所述语音识别模型匹配成功,则从所述语音信息中获取语音控制指令。
其中,语音识别模块204可以通过语音识别电路对所述语音信息与所述语音识别模型进行匹配,以确认当前用户是否具有对电子设备进行语音控制的权限。
若所述语音信息与所述语音识别模型匹配成功,则表示当前用户具有电子设备的语音控制权限。随后,语音识别模块204从所述语音信息中获取语音控制指令,例如“开启微信”等,并执行与所述语音控制指令对应的操作。
在一些实施例中,如图8所示,语音识别装置200还包括位置获取模块206,所述位置获取模块206用于执行以下步骤:
获取电子设备当前所处的地理位置信息;
根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内;
若所述电子设备当前所处的位置类型为室内,则噪声值获取模块202根据所述环境噪声信息获取环境噪声值。
音频采集模块201在采集到音频信息后,位置获取模块206可以获取电子设备当前所处的地理位置信息。所述地理位置信息可以包括当前的地理位置坐标或者地理位置区域。
随后,位置获取模块206根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内。
其中,当电子设备所处的位置类型为室外时,可以认为用户当前处于较嘈杂的环境中,也即当前的环境噪声较大。从而,无需通过采集到的音频信息来获取环境噪声值,控制模块203可以直接控制滤波电路对采集到的音频信息进行滤波处理。
其中,当电子设备所处的位置类型为室内时,噪声获取模块202可以根据采集到的音频信息中的环境噪声信息获取环境噪声值,以进一步判断当前环境噪声是否较大,从而可以判断出是否需要对采集到的音频信息进行滤波处理。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现。
由上可知,本申请实施例提供的语音识别装置200中,音频采集模块201通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;噪声值获取模块202根据所述环境噪声信息获取环境噪声值;控制模块203根据所述环境噪声值对滤波电路进行控制;语音识别模块204通过语音识别电路对所述语音信息进行识别。所述语音识别装置可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
本申请实施例还提供一种电子设备。所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
如图9所示,电子设备300包括处理器301、存储器302、音频采集电路303、滤波电路304以及语音识别电路305。其中,处理器301与存储器302、音频采集电路303、滤波电路304以及语音识别电路305电性连接。
处理器301是电子设备300的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器302内的计算机程序,以及调用存储在存储器302内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备300中的处理器301会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器302中,并由处理器301来运行存储在存储器302中的计算机程序,从而实现各种功能:
通过所述音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
根据所述环境噪声信息获取环境噪声值;
根据所述环境噪声值对所述滤波电路进行控制;
通过所述语音识别电路对所述语音信息进行识别。
在一些实施例中,根据所述环境噪声值对所述滤波电路进行控制时,处理器301执行以下步骤:
判断所述环境噪声值是否大于预设环境噪声阈值;
若所述环境噪声值大于所述预设环境噪声阈值,则控制所述滤波电路对所述环境噪声信息进行滤波处理;
若所述环境噪声值不大于所述预设环境噪声阈值,则控制关闭所述滤波电路。
在一些实施例中,通过所述音频采集电路采集音频信息之前,处理器301还执行以下步骤:
通过所述音频采集电路采集用户的训练语音信息,所述训练语音信息包括预设关键词;
提取所述训练语音信息中的特征参数,所述特征参数包括线性预测系数、美尔倒谱系数;
对所述特征参数进行训练,以得到语音识别模型。
在一些实施例中,通过所述语音识别电路对所述语音信息进行识别时,处理器301执行以下步骤:
通过所述语音识别电路对所述语音信息与所述语音识别模型进行匹配;
若所述语音信息与所述语音识别模型匹配成功,则从所述语音信息中获取语音控制指令。
在一些实施例中,根据所述环境噪声信息获取环境噪声值之前,处理器301还执行以下步骤:
获取所述电子设备当前所处的地理位置信息;
根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内;
若所述电子设备当前所处的位置类型为室内,则根据所述环境噪声信息获取环境噪声值。
存储器302可用于存储计算机程序和数据。存储器302存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器301通过调用存储在存储器302的计算机程序,从而执行各种功能应用以及数据处理。
音频采集电路303可用于在电子设备进行语音识别时,采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息。
此外,所述音频采集电路303还可用于在电子设备进行语音识别模型训练时,采集用户的训练语音信息。
滤波电路304可用于对音频采集电路303采集到的音频信息进行滤波,以对所述音频信息中的环境噪声进行滤波处理。
语音识别电路305可用于对所述音频信息中的语音信息进行识别,以实现用户对电子设备进行语音控制。
尽管图9中未示出,电子设备300还可以包括显示屏、射频电路、摄像头、蓝牙模块等,在此不予赘述。
由上可知,本申请实施例提供了一种电子设备,所述电子设备执行以下步骤:通过音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;根据所述环境噪声信息获取环境噪声值;根据所述环境噪声值对滤波电路进行控制;通过语音识别电路对所述语音信息进行识别。所述电子设备可以根据环境噪声值对滤波电路进行控制,可以根据实际环境情况通过滤波电路对采集到的音频信息进行滤波或者关闭滤波电路,从而既可以保证对语音信息进行识别的准确率,又可以降低电子设备的功耗。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的语音识别方法。
需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述存储介质可以包括但不限于:只读存储器(ROM,Read OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本申请实施例所提供的语音识别方法、装置、存储介质及电子设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (8)
1.一种语音识别方法,应用于电子设备,其特征在于,所述电子设备包括音频采集电路、滤波电路以及语音识别电路,所述语音识别方法包括:
通过所述音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
获取所述电子设备当前所处的地理位置信息,根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内,若所述电子设备所处的位置类型为室外时,直接控制滤除环境噪声信息的滤波电路对采集到的音频信息进行滤波处理,
若所述电子设备当前所处的位置类型为室内,通过电子设备中获取环境噪声值时的滤波电路从音频信息中滤除用户的语音信息,分离出环境噪声信息,对分离出的环境噪声信息进行分析,获取环境噪声值,其中所述音频采集电路采集音频信息的频率高于获取环境噪声值的频率,滤除环境噪声信息的滤波电路与电子设备中获取环境噪声值时的滤波电路的滤波频率不同;
判断所述环境噪声值是否大于预设环境噪声阈值,若所述环境噪声值大于所述预设环境噪声阈值,则控制所述滤除环境噪声信息的滤波电路对所述环境噪声信息进行滤波处理,若所述环境噪声值不大于所述预设环境噪声阈值,则控制关闭所述滤除环境噪声信息的滤波电路;
通过所述语音识别电路对所述语音信息进行识别。
2.根据权利要求1所述的语音识别方法,其特征在于,所述通过所述音频采集电路采集音频信息的步骤前,还包括:
通过所述音频采集电路采集用户的训练语音信息,所述训练语音信息包括预设关键词;
提取所述训练语音信息中的特征参数,所述特征参数包括线性预测系数、美尔倒谱系数;
对所述特征参数进行训练,以得到语音识别模型。
3.根据权利要求2所述的语音识别方法,其特征在于,所述通过所述语音识别电路对所述语音信息进行识别的步骤包括:
通过所述语音识别电路对所述语音信息与所述语音识别模型进行匹配;
若所述语音信息与所述语音识别模型匹配成功,则从所述语音信息中获取语音控制指令。
4.一种语音识别装置,应用于电子设备,其特征在于,所述电子设备包括音频采集电路、滤波电路以及语音识别电路,所述语音识别装置包括:
音频采集模块,用于通过所述音频采集电路采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
噪声值获取模块,用于获取所述电子设备当前所处的地理位置信息,根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内,若所述电子设备所处的位置类型为室外时,直接控制滤除环境噪声信息的滤波电路对采集到的音频信息进行滤波处理,若所述电子设备当前所处的位置类型为室内,通过电子设备中获取环境噪声值时的滤波电路从音频信息中滤除用户的语音信息,分离出环境噪声信息,对分离出的环境噪声信息进行分析,获取环境噪声值,其中所述音频采集电路采集音频信息的频率高于获取环境噪声值的频率,滤除环境噪声信息的滤波电路与电子设备中获取环境噪声值时的滤波电路的滤波频率不同;
控制模块,用于判断所述环境噪声值是否大于预设环境噪声阈值,若所述环境噪声值大于所述预设环境噪声阈值,则控制所述滤除环境噪声信息的滤波电路对所述环境噪声信息进行滤波处理,若所述环境噪声值不大于所述预设环境噪声阈值,则控制关闭所述滤除环境噪声信息的滤波电路;
语音识别模块,用于通过所述语音识别电路对所述语音信息进行识别。
5.根据权利要求4所述的语音识别装置,其特征在于,还包括训练模块,所述训练模块用于:
通过所述音频采集电路采集用户的训练语音信息,所述训练语音信息包括预设关键词;
提取所述训练语音信息中的特征参数,所述特征参数包括线性预测系数、美尔倒谱系数;
对所述特征参数进行训练,以得到语音识别模型。
6.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行权利要求1至3任一项所述的语音识别方法。
7.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行权利要求1至3任一项所述的语音识别方法。
8.一种电子设备,其特征在于,所述电子设备包括音频采集电路、滤波电路、语音识别电路以及处理器,所述音频采集电路、滤波电路、语音识别电路均与所述处理器电性连接,其中:
所述音频采集电路用于采集音频信息,所述音频信息包括用户的语音信息以及环境噪声信息;
所述处理器用于获取所述电子设备当前所处的地理位置信息,根据所述地理位置信息确定所述电子设备当前所处的位置类型,所述位置类型包括室外和室内,若所述电子设备所处的位置类型为室外时,直接控制滤除环境噪声信息的滤波电路对采集到的音频信息进行滤波处理,若所述电子设备当前所处的位置类型为室内,通过电子设备中获取环境噪声值时的滤波电路从音频信息中滤除用户的语音信息,分离出环境噪声信息,对分离出的环境噪声信息进行分析,获取环境噪声值,其中所述音频采集电路采集音频信息的频率高于获取环境噪声值的频率,判断所述环境噪声值是否大于预设环境噪声阈值,若所述环境噪声值大于所述预设环境噪声阈值,则控制所述滤除环境噪声信息的滤波电路对所述环境噪声信息进行滤波处理,若所述环境噪声值不大于所述预设环境噪声阈值,则控制关闭所述滤除环境噪声信息的滤波电路;
所述滤除环境噪声信息的滤波电路用于对所述环境噪声信息进行滤波处理;
所述语音识别电路用于对所述语音信息进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810631988.XA CN108847221B (zh) | 2018-06-19 | 2018-06-19 | 语音识别方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810631988.XA CN108847221B (zh) | 2018-06-19 | 2018-06-19 | 语音识别方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108847221A CN108847221A (zh) | 2018-11-20 |
CN108847221B true CN108847221B (zh) | 2021-06-15 |
Family
ID=64202894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810631988.XA Expired - Fee Related CN108847221B (zh) | 2018-06-19 | 2018-06-19 | 语音识别方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108847221B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113301208A (zh) * | 2019-01-03 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 语音指令的过滤方法和装置 |
CN110265007B (zh) * | 2019-05-11 | 2020-07-24 | 出门问问信息科技有限公司 | 语音助手系统的控制方法、控制装置及蓝牙耳机 |
CN110164425A (zh) * | 2019-05-29 | 2019-08-23 | 北京声智科技有限公司 | 一种降噪方法、装置及可实现降噪的设备 |
CN110197663B (zh) * | 2019-06-30 | 2022-05-31 | 联想(北京)有限公司 | 一种控制方法、装置及电子设备 |
CN110880322B (zh) * | 2019-11-29 | 2022-05-27 | 中核第四研究设计工程有限公司 | 监控设备的控制方法及声控装置 |
CN112700771A (zh) * | 2020-12-02 | 2021-04-23 | 珠海格力电器股份有限公司 | 空调、立体声控识别方法、计算机设备、存储介质及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105931647A (zh) * | 2016-04-05 | 2016-09-07 | 广东欧珀移动通信有限公司 | 噪声抑制的方法及装置 |
CN107481718A (zh) * | 2017-09-20 | 2017-12-15 | 广东欧珀移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN108109613A (zh) * | 2017-12-12 | 2018-06-01 | 苏州思必驰信息科技有限公司 | 用于智能对话语音平台的音频训练和识别方法及电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0723413A (ja) * | 1993-06-29 | 1995-01-24 | Canon Inc | 撮像装置 |
CN1968305A (zh) * | 2005-11-17 | 2007-05-23 | 上海空波通讯科技有限公司 | 用于语音增强系统的噪声检测及预判处理器 |
JP5686754B2 (ja) * | 2012-02-23 | 2015-03-18 | 日立アプライアンス株式会社 | 空気調和機 |
CN103716438B (zh) * | 2012-09-28 | 2016-09-07 | 联想移动通信科技有限公司 | 降噪方法,装置及移动终端 |
-
2018
- 2018-06-19 CN CN201810631988.XA patent/CN108847221B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105931647A (zh) * | 2016-04-05 | 2016-09-07 | 广东欧珀移动通信有限公司 | 噪声抑制的方法及装置 |
CN107481718A (zh) * | 2017-09-20 | 2017-12-15 | 广东欧珀移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN108109613A (zh) * | 2017-12-12 | 2018-06-01 | 苏州思必驰信息科技有限公司 | 用于智能对话语音平台的音频训练和识别方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108847221A (zh) | 2018-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108847221B (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN102779509B (zh) | 语音处理设备和语音处理方法 | |
CN110246512A (zh) | 声音分离方法、装置及计算机可读存储介质 | |
CN108847222B (zh) | 语音识别模型生成方法、装置、存储介质及电子设备 | |
CN108363706A (zh) | 人机对话交互的方法和装置、用于人机对话交互的装置 | |
CN108010526B (zh) | 语音处理方法及装置 | |
WO2022033556A1 (zh) | 电子设备及其语音识别方法和介质 | |
CN110364156A (zh) | 语音交互方法、系统、终端及可读存储介质 | |
CN110473552A (zh) | 语音识别认证方法及系统 | |
CN110858479B (zh) | 语音识别模型更新方法、装置、存储介质及电子设备 | |
CN110827824B (zh) | 语音处理方法、装置、存储介质及电子设备 | |
CN105741841B (zh) | 语音控制方法及电子设备 | |
CN109003607B (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN111081275B (zh) | 基于声音分析的终端处理方法、装置、存储介质及终端 | |
CN110910876A (zh) | 物品声寻装置及控制方法、语音控制设置方法和系统 | |
CN111966321A (zh) | 音量调节方法、ar设备及存储介质 | |
CN111369992A (zh) | 指令执行方法、装置、存储介质及电子设备 | |
CN115035887A (zh) | 语音信号的处理方法、装置、设备及介质 | |
CN113225624A (zh) | 一种语音识别耗时确定方法和装置 | |
CN105551504B (zh) | 一种基于哭声触发智能移动终端功能应用的方法及装置 | |
CN109271480B (zh) | 一种语音搜题方法及电子设备 | |
CN109064720B (zh) | 位置提示方法、装置、存储介质及电子设备 | |
CN107154996B (zh) | 来电拦截方法、装置、存储介质及终端 | |
CN112882394B (zh) | 设备控制方法、控制装置及可读存储介质 | |
CN115579012A (zh) | 语音识别方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210615 |