CN110619874B - 语音控制方法、装置、计算机设备和存储介质 - Google Patents
语音控制方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110619874B CN110619874B CN201910817873.4A CN201910817873A CN110619874B CN 110619874 B CN110619874 B CN 110619874B CN 201910817873 A CN201910817873 A CN 201910817873A CN 110619874 B CN110619874 B CN 110619874B
- Authority
- CN
- China
- Prior art keywords
- control instruction
- preset
- voice
- voice data
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000004590 computer program Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 15
- 230000003993 interaction Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000001816 cooling Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000009835 boiling Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006996 mental state Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000007791 dehumidification Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请涉及一种语音控制方法、装置、计算机设备和存储介质。所述方法包括:接收语音数据,识别语音数据中的控制指令;判断控制指令是否与预设控制指令匹配;当控制指令与预设控制指令匹配时,提取语音数据的语音特征;当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。通过对用户的语音数据进行指令识别,并提取识别出的控制指令的语音数据的语音特征,通过语音特征判断是否需要采用快速制动模式执行控制指令,根据语音特征确定是否需要快速制动,更符合用户的需求,从而提升用户体验。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音控制方法、装置、计算机设备和存储介质。
背景技术
随着人工智能相关技术的日益成熟,越来越多的智能设备进入用户的生活中,人与机器的交互日渐平常。交互过程中使用频率最高的一般为语音交互,这种交互方式可以解放人的双手,从而受到用户的喜爱,如语音输入,语音对话。现在越来越多的智能设备提供语音纠错的功能,让用户可以使用语音对智能设备中的显示内容进行修改,进一步解放了人的双手,大大提高了用户体验。但是现有的语音交互过程中,在对用户发出的语音操作指令进行直接响应时,无法对用户的心态进行判断,故无法满足用户需求。
发明内容
为了解决上述技术问题,本申请提供了一种语音控制方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种语音控制方法,包括:
接收语音数据,识别语音数据中的控制指令;
判断控制指令是否与预设控制指令匹配;
当控制指令与预设控制指令匹配时,提取语音数据的语音特征;
当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
第二方面,本申请提供了一种语音控制装置,包括:
控制指令识别模块,语音接收语音数据,识别语音数据中的控制指令;
指令判断模块,用于判断控制指令是否与预设控制指令匹配;
语音特征提取模块,用于当控制指令与预设控制指令匹配时,提取语音数据的语音特征;
快速制动模块,用于当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收语音数据,识别语音数据中的控制指令;
判断控制指令是否与预设控制指令匹配;
当控制指令与预设控制指令匹配时,提取语音数据的语音特征;
当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收语音数据,识别语音数据中的控制指令;
判断控制指令是否与预设控制指令匹配;
当控制指令与预设控制指令匹配时,提取语音数据的语音特征;
当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
上述语音控制方法、装置、计算机设备和存储介质,所述方法包括:接收语音数据,识别语音数据中的控制指令;判断控制指令是否与预设控制指令匹配;当控制指令与预设控制指令匹配时,提取语音数据的语音特征;当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。通过对用户的语音数据进行指令识别,并提取识别出的控制指令的语音数据的语音特征,通过语音特征判断是否需要采用快速制动模式执行控制指令,根据语音特征确定是否需要快速制动,更符合用户的需求,从而提升用户体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中语音控制方法的流程示意图;
图2为另一个实施例中语音控制方法的流程示意图;
图3为一个实施例中语音控制装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,在一个实施例中,提供了一种语音控制方法。该语音控制方法用于控制设备,其中设备可以为常见的智能家电,其中智能家电包括但不限于智能空调、智能电池炉或智能热水器等等。本实施例主要以该方法应用于空调来举例说明。参照图1,该语音控制方法具体包括如下步骤:
步骤S201,接收语音数据,识别语音数据中的控制指令。
具体地,设备接收用户发出的语音数据。控制指令是用于控制设备的指令,控制指令包括但不限于启动指令、设备运行模式的调节指令等等。如空调的制冷、制热、出风、除湿等等指令,热水器开启指令、烧水强度,电池炉的开关指令、温度调节指令等等。语音数据中的控制指令,是指用户发出的语音数据中识别到的控制指令。
在一个实施例中,接收语音数据之后,还包括:提取语音数据中的语言特征,判断语言特征是否与预设语言特征匹配,当语言特征与预设语言特征匹配时,进入识别语音数据中的控制指令。
具体地,语言特征是用于描述用户的语种类型的特征,语种为常用的语种类型,具体包含哪些语种可以自定义设置,如常用语言为中文、英文和粤语,则设置中文、英文和粤语的语言特征作为预设语言特征,若包含的语种为日文、韩文、俄文等等,则设置各个语种对应的语言特征作为预设语言特征。提取语音数据中的语言特征,判断语言特征是否与预先存储的预设语言特征匹配,若匹配,则识别语音数据中的控制指令。
在一个实施例中,当语言特征与预设语言特征不匹配时,判断是否识别出语音数据中的第一文字信息,当识别出第一文字信息时,生成第一文字信息对应的第一控制指令,将第一控制指令作为控制指令,进入判断控制指令是否与预设控制指令匹配。
具体地,当语言特征与预设语言特征不匹配时,表示未存储对应的预设语音特征。如对于说的普通话不标准或存在相似发音的语种中的语音数据中还是可以识别出部分字符,将识别出的字符作为第一文字信息,通过识别出的第一文字信息生成对应的第一控制指令,将第一控制指令作为控制指令,进入步骤S202。对应无法识别语种的语音数据采用模糊匹配的方法进行字符识。
步骤S202,判断控制指令是否与预设控制指令匹配。
具体地,预设控制指令是指预先设置的控制指令,预设控制指令包括第一预设控制指令和第二预设控制指令中的至少一种。第一预设控制指令是预先配置的原始控制指令,第二预设控制指令是根据用户的历史语音数据识别的控制指令。判断识别得到的控制指令是否与预设控制指令匹配时,可以通过文字匹配和语音匹配两种方式中的至少一种方式进行匹配,具体的匹配方式可以根据需求确定。
在一个实施例中,获取历史语音数据,识别出历史语音数据中的历史控制指令,计算历史控制指令与第一预设控制指令的相似度,当相似度大于预设相似度,且历史控制指令与预设控制指令不相同时,将历史控制指令作为第二预设控制指令。
具体地,历史语音数据是指用户之前发出的语音数据,识别出历史语音数据中包含的控制指令作为历史控制指令。历史控制指令与第一预设指令的相似度可以通过常见的语音相似度和/或文字相似度计算方法进行计算。预设相似度是预先设置的用于判断指令之间是否相似的临界值,当历史控制指令与第一预设控制指令之间的相似度大于预设相似度时,表示两个控制指令为相同的控制指令,判断历史控制指令与预设控制指令是否相同,若相同,则不保存历史控制指令,若不相同,则保存历史控制指令作为第二预设控制指令。
步骤S203,当控制指令与预设控制指令匹配时,提取语音数据的语音特征。
步骤S204,当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
具体地,控制指令与预设控制指令匹配是指两个指令之间的相似度大于或等于指令相似度。指令间的相似度可以采用自定义的相似度算法计算,可以采用常规的语音相似度和/或文字相似度计算方法计算。语音特征是用于描述语音数据的语调、语速等等的特征,其中语调和语速特征可以用于判断用户的状态。提取语音数据中的语调特征,提取语音数据中的语速特征,由语调特征和语速特征组成语音特征。当语调和语速满足预设的语调和语速条件时,即语音特征与预设特征匹配,用户希望设备可以采用快速制动模式执行控制指令,如空调的快速降温、升温,热水器的快速烧水等等。
在一个实施例中,当语音特征与预设特征不匹配时,采用正常制动模式执行控制指令。
具体地,正常制动模式是指采用正常的制动方式执行调节。快速制动模式比正常制动模式的制动速度快,如调节温度到预设温度,正常制动模式的调节时长比快速制动模式的调节时长要长。
在一个实施例中,接收语音数据,识别语音数据中的控制指令之前,还包括:当在预设时间段内接收到多个历史语音数据时,识别各个历史语音数据中用于调节设备的调节参数,按照时间顺序拟合各个调节参数,得到拟合曲线,当拟合曲线的斜率位于预设斜率区间范围时,提取各个历史语音数据的语音特征,将语音特征作为预设语音特征。
具体地,预设时间段内是预先设置的时间区间,时间区间可以自定义,如定义为1分钟、2分钟或3分钟等等。多个历史语音数据是指用户发出的多次用于调节设备的语音数据,识别各个历史语音数据中的调节参数,以空调为例,如制热27℃中的27℃、升高1℃、降低2℃等等,通过对不同时刻的语音数据中提取的温度数据进行拟合,得到的拟合曲线,曲线拟合的方法可以采用常规的离散数据拟合方法,如拟合方法可以采用最小二乘法拟合算法、2次曲线拟合算法等等。计算拟合曲线的斜率,斜率可以用于衡量曲线的倾斜度,当倾斜度较大,说明用户的调节参数的范围较大,表示用户对于之前调节的结果不满意,期望快速达到满意的结果,即表达了用户的急切心理,提取用户较为急切期望达到目的时的语音数据对应的语音特征,保存急切状态对应的语音特征,并将急切状态对应的语音特征作为预设语音特征。通过用户的历史操作行为中的调节参数判断用户的心理状态,保存急切心态对应的语音特征,以历史的急切心态作为标准,对后续接收到的语音数据的心态进行判断,当与历史的急切心态匹配,表示当前用户期望快速的达到目的。
在一个实施例中,当历史控制指令与第一预设控制指令的相似度大于预设相似度时,判断历史语音数据的历史文字信息是否与预设文字信息匹配,当历史文字信息与预设文字信息匹配时,提取历史语音数据的历史语调特征,将历史语调特征作为预设特征,保存预设特征与快速调节模式的对应关系。
具体地,历史控制指令与第一预设控制指令的相似度大于预设相似度时,表示历史控制指令与第一预设控制指令匹配,即用户的历史指令为有效指令,提取历史语音数据的历史文字信息,判断历史文字信息是否与预设文字信息匹配,预设文字信息是用于表述用户急切的心理的描述词,如快速、加快等等可以表示用户的急切心态。当历史控制指令中包含用于表述用户急切的心理的描述词时,提取历史语音数据的历史语调特征,将历史语调特征作为预设特征。
在一个实施例中,预设特征包括通过包含急切心态的语音数据中提取的语音特征,和根据用户多次发送的语音数据中的调节参数确定急切心态的语音特征。
上述语音控制方法,接收语音数据,识别语音数据中的控制指令;判断控制指令是否与预设控制指令匹配;当控制指令与预设控制指令匹配时,提取语音数据的语音特征;当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。通过对用户的语音数据进行指令识别,并提取识别出的控制指令的语音数据的语音特征,通过语音特征判断是否需要采用快速制动模式执行控制指令,根据语音特征确定是否需要快速制动,更符合用户的需求,从而提升用户体验。
如图2所示,在一个具体的实施例中,空调的控制方法,包括:
步骤S301,接收用户的语音数据。
步骤S302,提取语音数据中的语言特征。语言特征是用于对语音的语种进行分类的特征,不同的语种对应的语言特征不同。根据语言特征可以确定用户发出的语音数据为哪个语种,语种包括但不限于中文、日文、韩文、英文和俄文等等常用语种。
步骤S303,判断语言特征是否与预设语言特征匹配。通过对提取到的语音数据中的语言特征和预存的预设语言特征进行匹配,当不匹配时,进入步骤S304,当匹配时,进入步骤S307。
步骤S304,判断语音数据中是否识别出第一文字信息。第一文字信息是指未能识别出对应的语音数据的语种时,但是可以通过对识别语音数据进行文字识别,当识别出语音数据中包含的字符时,将识别的字符作为第一文字信息,进入步骤S305,当未识别出语音数据中包含的字符时,进入步骤S301
步骤S305,生成第一文字信息对应的第一控制指令,将第一控制指令作为控制指令,进入步骤S307。
步骤S306,识别语音数据中的控制指令。控制指令包括启动指令、制冷、制热指令等等,其中制冷和制热指令包括对应的温度、风速等等参数。
步骤S307,判断控制指令是否与第一预设控制指令匹配。当与第一预设控制指令匹配时,进入步骤S309,当与第一预设指令不匹配时,进入步骤S308。
步骤S308,判断控制指令是否与第二预设控制指令匹配。当与第二预设控制指令匹配时,进入步骤S309,当与第一预设指令不匹配时,进入步骤S301。
步骤S309,提取语音数据的语音特征。语音特征包括语调和语速等。
步骤S310,判断语音特征是否与预设特征匹配。通过语音特征和预设特征的匹配确定是否需要采用快速制动模式。当需要采用快速制动模式进入步骤S312,反之进入步骤S311。
步骤S311,采用正常制动模式执行控制指令。
步骤S312,采用快速制动模式执行控制指令。快速制动模式是指快速达到室内所有温度,对周围环境采用较快的速度进行降温或升温。
步骤S313,保存语音特征和快速制动模式执行控制指令的对应关系。
步骤S314,根据控制指令更新第二预设控制指令,根据语音特征更新预设特征。即控制指令添加至步骤S308中的第二预设控制指令,将语音特征添加至步骤S310中的预设特征中,当接收到用户的下一次语音数据时,识别出下一次语音数据中的下一次控制指令后,对下一次控制指令与第二控制指令匹配时,第二控制指令中包含添加的控制指令,提取下一次语音特征后,在对下一次语音特征与预设特征进行匹配时,预设特征中包含添加进来的语音特征。
根据用户发出语音操作指令的语言、语速和语调的不同,可以自动进行在线升级以及纠正,确保操作者能够一次短时间操控空调,并且根据用户指令的语速和预调判断操作者的状态进行相应的操作,提高空调语音交互体验,节省语音操作时间。
语音控制系统中设置有多种语种数据库,当接收用户的语音数据后,根据接收到的语音指令,对用户发出的语音操作指令在语种数据库中进行比对识别匹配。同时根据用户的语言、语速、语调,判断用户此时是否急需使用空调,空调进入不同的模式,记忆用户当前的状态并升级简化语音操作指令,最终是空调提升语音交互并且使空调更加智能。
图1或2为一个实施例中语音控制方法的流程示意图。应该理解的是,虽然图1或2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1或2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种语音控制装置200,包括:
控制指令识别模块201,语音接收语音数据,识别语音数据中的控制指令。
指令判断模块202,用于判断控制指令是否与预设控制指令匹配。
指令判断模块203,用于当控制指令与预设控制指令匹配时,提取语音数据的语音特征。
快速制动模块204,用于当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
在一个实施例中,上述语音控制装置,还包括:
正常制动模块204,用于当语音特征与预设特征不匹配时,采用正常制动模式执行控制指令。
在一个实施例中,上述语音控制装置,还包括:
语言特征提取模块,用于提取语音数据中的语言特征。
语言判断模块,用于判断语言特征是否与预设语言特征匹配;
控制指令识别模块还用于当语言特征与所述预设语言特征匹配时,进入识别语音数据中的控制指令。
在一个实施例中,上述语音控制装置,还包括:
文字信息识别模块,用于当语言特征与预设语言特征不匹配时,判断是否识别出语音数据中的第一文字信息;
指令生成模块,当识别出第一文字信息时,生成第一文字信息对应的第一控制指令;
指令判断模块还用于将第一控制指令作为控制指令,进入判断控制指令是否与预设控制指令匹配。
在一个实施例中,上述语音控制装置,还包括:
历史指令识别模块,用于获取历史语音数据,识别出历史语音数据中的历史控制指令。
相似度计算模块,用于计算历史控制指令与第一预设控制指令的相似度,其中预设控制指令包括第一预设控制指令和第二预设控制指令。
预设指令更新模块,用于当相似度大于预设相似度,且历史控制指令与预设控制指令不相同时,将历史控制指令作为第二预设控制指令。
在一个实施例中,上述语音控制装置,还包括:
历史文字匹配模块,用于当相似度大于预设相似度时,判断历史语音数据的历史文字信息是否与预设文字信息匹配。
预设特征生成模块,用于当历史文字信息与预设文字信息匹配时,提取历史语音数据的历史语调特征,将历史语调特征作为预设特征。
对应关系存储模块,用于保存预设特征与快速调节模式的对应关系。
在一个实施例中,语音特征提取模块具体用于提取语音数据中的语调特征,提取语音数据中的语速特征,由语调特征和语速特征组成语音特征。
在一个实施例中,上述语音控制装置,还包括:
参数识别模块,用于当在预设时间段内接收到多个历史语音数据时,识别各个历史语音数据中用于调节设备的调节参数。
曲线拟合模块,用于按照时间顺序拟合各个调节参数,得到拟合曲线。
预设语音特征生成模块,用于当拟合曲线的斜率位于预设斜率区间范围时,提取各个历史语音数据的语音特征,将语音特征作为预设语音特征。
图4示出了一个实施例中计算机设备的内部结构图。如图4所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现语音控制方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行语音控制方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的语音控制装置可以实现为一种计算机程序的形式,计算机程序可在如图4所示的计算机设备上运行。计算机设备的存储器中可存储组成该语音控制装置的各个程序模块,比如,图3所示的控制指令识别模块201、指令判断模块202、语音特征提取模块203和快速制动模块204。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的语音控制方法中的步骤。
例如,图4所示的计算机设备可以通过如图3所示的语音控制装置中的控制指令识别模块201,语音接收语音数据,识别语音数据中的控制指令。计算机设备可以通过指令判断模块202执行判断控制指令是否与预设控制指令匹配。计算机设备可以通过语音特征提取模块203执行当控制指令与预设控制指令匹配时,提取语音数据的语音特征。计算机设备可以通过快速制动模块204执行当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:接收语音数据,识别语音数据中的控制指令;判断控制指令是否与预设控制指令匹配;当控制指令与预设控制指令匹配时,提取语音数据的语音特征;当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当语音特征与预设特征不匹配时,采用正常制动模式执行控制指令。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:提取语音数据中的语言特征;判断语言特征是否与预设语言特征匹配;当语言特征与预设语言特征匹配时,进入识别语音数据中的控制指令。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当语言特征与预设语言特征不匹配时,判断是否识别出语音数据中的第一文字信息;当识别出第一文字信息时,生成第一文字信息对应的第一控制指令;将第一控制指令作为控制指令,进入判断控制指令是否与预设控制指令匹配。
在一个实施例中,预设控制指令包括第一预设控制指令和第二预设控制指令,处理器执行计算机程序时还实现以下步骤:获取历史语音数据,识别出历史语音数据中的历史控制指令;计算历史控制指令与第一预设控制指令的相似度;当相似度大于预设相似度,且历史控制指令与预设控制指令不相同时,将历史控制指令作为第二预设控制指令。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当相似度大于预设相似度时,判断历史语音数据的历史文字信息是否与预设文字信息匹配;当历史文字信息与预设文字信息匹配时,提取历史语音数据的历史语调特征,将历史语调特征作为预设特征;保存预设特征与快速调节模式的对应关系。
在一个实施例中,提取语音数据的语音特征,包括:提取语音数据中的语调特征;提取语音数据中的语速特征,由语调特征和语速特征组成语音特征。
在一个实施例中,接收语音数据,识别语音数据中的控制指令之前,处理器执行计算机程序时还实现以下步骤:当在预设时间段内接收到多个历史语音数据时,识别各个历史语音数据中用于调节设备的调节参数;按照时间顺序拟合各个调节参数,得到拟合曲线;当拟合曲线的斜率位于预设斜率区间范围时,提取各个历史语音数据的语音特征,将语音特征作为预设语音特征。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收语音数据,识别语音数据中的控制指令;判断控制指令是否与预设控制指令匹配;当控制指令与预设控制指令匹配时,提取语音数据的语音特征;当语音特征与预设特征匹配时,采用快速制动模式执行控制指令。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当语音特征与预设特征不匹配时,采用正常制动模式执行控制指令。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:提取语音数据中的语言特征;判断语言特征是否与预设语言特征匹配;当语言特征与预设语言特征匹配时,进入识别语音数据中的控制指令。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当语言特征与预设语言特征不匹配时,判断是否识别出语音数据中的第一文字信息;当识别出第一文字信息时,生成第一文字信息对应的第一控制指令;将第一控制指令作为控制指令,进入判断控制指令是否与预设控制指令匹配。
在一个实施例中,预设控制指令包括第一预设控制指令和第二预设控制指令,计算机程序被处理器执行时还实现以下步骤:获取历史语音数据,识别出历史语音数据中的历史控制指令;计算历史控制指令与第一预设控制指令的相似度;当相似度大于预设相似度,且历史控制指令与预设控制指令不相同时,将历史控制指令作为第二预设控制指令。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当相似度大于预设相似度时,判断历史语音数据的历史文字信息是否与预设文字信息匹配;当历史文字信息与预设文字信息匹配时,提取历史语音数据的历史语调特征,将历史语调特征作为预设特征;保存预设特征与快速调节模式的对应关系。
在一个实施例中,提取语音数据的语音特征,包括:提取语音数据中的语调特征;提取语音数据中的语速特征,由语调特征和语速特征组成语音特征。
在一个实施例中,接收语音数据,识别语音数据中的控制指令之前,计算机程序被处理器执行时还实现以下步骤:当在预设时间段内接收到多个历史语音数据时,识别各个历史语音数据中用于调节设备的调节参数;按照时间顺序拟合各个调节参数,得到拟合曲线;当拟合曲线的斜率位于预设斜率区间范围时,提取各个历史语音数据的语音特征,将语音特征作为预设语音特征。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种语音控制方法,其特征在于,所述方法包括:
接收语音数据,识别所述语音数据中的控制指令;
其中,在所述识别所述语音数据中的控制指令之前,还包括:
提取所述语音数据中的语言特征,
判断所述语言特征是否与预设语言特征匹配,
当所述语言特征与所述预设语言特征匹配时,进入所述识别所述语音数据中的控制指令的步骤,
当所述语言特征与所述预设语言特征不匹配时,判断是否识别出所述语音数据中的第一文字信息,
当识别出所述第一文字信息时,生成所述第一文字信息对应的第一控制指令,将所述第一控制指令作为所述控制指令;
判断所述控制指令是否与预设控制指令匹配,所述设控制指令包括第一预设控制指令和第二预设控制指令,所述第一预设控制指令是预先配置的原始控制指令,所述第二预设控制指令是根据用户的历史语音数据识别的控制指令;
当所述控制指令与所述预设控制指令匹配时,提取所述语音数据的语音特征;
其中,提取所述语音数据的语音特征包括:提取所述语音数据中的语调特征,提取所述语音数据中的语速特征,由所述语调特征和所述语速特征组成所述语音特征;
当所述语音特征与预设特征匹配时,采用快速制动模式执行所述控制指令。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述语音特征与所述预设特征不匹配时,采用正常制动模式执行所述控制指令。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取历史语音数据,识别出所述历史语音数据中的历史控制指令;
计算所述历史控制指令与所述第一预设控制指令的相似度;
当所述相似度大于预设相似度,且所述历史控制指令与所述第一预设控制指令不相同时,将所述历史控制指令作为所述第二预设控制指令。
4.根据权利要求3所述的方法,其特征在于,所述相似度为文字相似度,所述方法还包括:
当所述相似度大于预设相似度时,判断所述历史语音数据的历史文字信息是否与预设文字信息匹配;
当所述历史文字信息与所述预设文字信息匹配时,提取所述历史语音数据的历史语调特征,将所述历史语调特征作为所述预设特征;
保存所述预设特征与所述快速制动模式的对应关系。
5.一种语音控制装置,其特征在于,所述装置包括:
控制指令识别模块,语音接收语音数据,识别所述语音数据中的控制指令;
语言特征提取模块,用于提取所述语音数据中的语言特征;
语言判断模块,用于判断所述语言特征是否与预设语言特征匹配;
所述控制指令识别模块还用于当所述语言特征与所述预设语言特征匹配时,执行所述识别所述语音数据中的控制指令;
文字信息识别模块,用于当所述语言特征与所述预设语言特征不匹配时,判断是否识别出所述语音数据中的第一文字信息;
指令生成模块,当识别出所述第一文字信息时,生成所述第一文字信息对应的第一控制指令,将第一控制指令作为控制指令;
指令判断模块,用于判断所述控制指令是否与预设控制指令匹配,所述设控制指令包括第一预设控制指令和第二预设控制指令中的至少一种,所述第一预设控制指令是预先配置的原始控制指令,所述第二预设控制指令是根据用户的历史语音数据识别的控制指令;
语音特征提取模块,用于当所述控制指令与所述预设控制指令匹配时,提取所述语音数据的语音特征,其中,提取所述语音数据的语音特征包括:提取所述语音数据中的语调特征,提取所述语音数据中的语速特征,由所述语调特征和所述语速特征组成所述语音特征;
快速制动模块,用于当所述语音特征与预设特征匹配时,采用快速制动模式执行所述控制指令。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910817873.4A CN110619874B (zh) | 2019-08-30 | 2019-08-30 | 语音控制方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910817873.4A CN110619874B (zh) | 2019-08-30 | 2019-08-30 | 语音控制方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110619874A CN110619874A (zh) | 2019-12-27 |
CN110619874B true CN110619874B (zh) | 2020-10-23 |
Family
ID=68922880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910817873.4A Active CN110619874B (zh) | 2019-08-30 | 2019-08-30 | 语音控制方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110619874B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111369993B (zh) * | 2020-03-03 | 2023-06-20 | 珠海格力电器股份有限公司 | 控制方法、装置、电子设备及存储介质 |
CN112373446A (zh) * | 2020-06-29 | 2021-02-19 | 东风汽车集团有限公司 | 一种基于无人驾驶车的声控安全辅助系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514024A (zh) * | 2013-10-24 | 2014-01-15 | 深圳中微电科技有限公司 | 一种电器的快速启动ui系统及快速启动方法 |
CN104516318A (zh) * | 2013-09-26 | 2015-04-15 | 上海澜腾智能科技有限公司 | 一种智能家居系统中电器快捷式控制方法和装置 |
CN109358530A (zh) * | 2018-10-16 | 2019-02-19 | 珠海格力电器股份有限公司 | 控制装置和家用电器 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9195649B2 (en) * | 2012-12-21 | 2015-11-24 | The Nielsen Company (Us), Llc | Audio processing techniques for semantic audio recognition and report generation |
US9734819B2 (en) * | 2013-02-21 | 2017-08-15 | Google Technology Holdings LLC | Recognizing accented speech |
CN106325112B (zh) * | 2015-06-25 | 2020-03-24 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN106952645B (zh) * | 2017-03-24 | 2020-11-17 | 广东美的制冷设备有限公司 | 语音指令的识别方法、语音指令的识别装置和空调器 |
US10810995B2 (en) * | 2017-04-27 | 2020-10-20 | Marchex, Inc. | Automatic speech recognition (ASR) model training |
CN107092214A (zh) * | 2017-06-08 | 2017-08-25 | 广东天际电器股份有限公司 | 一种厨房家电的控制装置及方法 |
CN109419345B (zh) * | 2017-08-25 | 2023-11-28 | 广东美的生活电器制造有限公司 | 液体加热方法及装置、液体加热器、存储介质 |
CN107544272B (zh) * | 2017-09-18 | 2021-01-08 | 广东美的制冷设备有限公司 | 终端控制方法、装置及存储介质 |
CN109724215A (zh) * | 2018-06-27 | 2019-05-07 | 平安科技(深圳)有限公司 | 空调控制方法、空调控制装置、空调设备及存储介质 |
CN109036425B (zh) * | 2018-09-10 | 2019-12-24 | 百度在线网络技术(北京)有限公司 | 用于操作智能终端的方法和装置 |
CN109949808A (zh) * | 2019-03-15 | 2019-06-28 | 上海华镇电子科技有限公司 | 兼容普通话和方言的语音识别家电控制系统和方法 |
-
2019
- 2019-08-30 CN CN201910817873.4A patent/CN110619874B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104516318A (zh) * | 2013-09-26 | 2015-04-15 | 上海澜腾智能科技有限公司 | 一种智能家居系统中电器快捷式控制方法和装置 |
CN103514024A (zh) * | 2013-10-24 | 2014-01-15 | 深圳中微电科技有限公司 | 一种电器的快速启动ui系统及快速启动方法 |
CN109358530A (zh) * | 2018-10-16 | 2019-02-19 | 珠海格力电器股份有限公司 | 控制装置和家用电器 |
Also Published As
Publication number | Publication date |
---|---|
CN110619874A (zh) | 2019-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619874B (zh) | 语音控制方法、装置、计算机设备和存储介质 | |
CN106571140B (zh) | 一种基于语音语义的电器智能控制方法及系统 | |
CN110689881B (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
CN111583926B (zh) | 基于烹饪设备的连续语音交互方法、装置和烹饪设备 | |
CN111081217B (zh) | 一种语音唤醒方法、装置、电子设备及存储介质 | |
CN110706696A (zh) | 一种语音控制方法及装置 | |
CN106445924A (zh) | 一种基于语义服务器控制智能设备的方法及系统 | |
CN112151034B (zh) | 设备的语音控制方法、装置、电子设备及存储介质 | |
CN107544272A (zh) | 终端控制方法、装置及存储介质 | |
CN110970022B (zh) | 一种终端控制方法、装置、设备以及可读介质 | |
CN111710337A (zh) | 语音数据的处理方法、装置、计算机可读介质及电子设备 | |
CN115599901A (zh) | 基于语义提示的机器问答方法、装置、设备及存储介质 | |
CN110726254A (zh) | 热水器出水控制方法、装置、设备及热水器系统 | |
CN110953721A (zh) | 热水器的控制方法及装置、热水器 | |
CN112601128B (zh) | 基于语音的电视密码输入处理方法、装置、设备及介质 | |
CN114639379A (zh) | 智能电器的交互方法、装置、计算机设备及介质 | |
CN116110112B (zh) | 基于人脸识别的智能开关的自适应调节方法以及装置 | |
CN115881126B (zh) | 基于语音识别的开关控制方法、装置和开关设备 | |
JP2003185221A (ja) | 空調調整システム及び空調調整方法 | |
CN110556101A (zh) | 语音控制方法、装置、计算机设备和存储介质 | |
CN111128138A (zh) | 语音唤醒方法、装置、计算机设备和存储介质 | |
CN113701353A (zh) | 热水器控制方法、电子装置、热水器及可读存储介质 | |
CN114373458A (zh) | 智能家居设备控制方法、装置、计算机设备和存储介质 | |
CN110764423A (zh) | 家电设备的控制方法及装置、家电设备 | |
CN110689886B (zh) | 设备控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |