CN110970022B - 一种终端控制方法、装置、设备以及可读介质 - Google Patents
一种终端控制方法、装置、设备以及可读介质 Download PDFInfo
- Publication number
- CN110970022B CN110970022B CN201910974836.4A CN201910974836A CN110970022B CN 110970022 B CN110970022 B CN 110970022B CN 201910974836 A CN201910974836 A CN 201910974836A CN 110970022 B CN110970022 B CN 110970022B
- Authority
- CN
- China
- Prior art keywords
- fuzzy
- vocabulary
- intention
- control
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012795 verification Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 230000001276 controlling effect Effects 0.000 description 4
- 235000020965 cold beverage Nutrition 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请涉及一种终端控制方法、装置、设备以及可读介质,本申请通过采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;检测所述语音信息中是否包含预设的模糊控制关键词;若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;根据所述用户的控制意图生成控制指令,达到控制终端的目的,通过将语音信息与模糊意识别列表比对的方式,从包含模糊词汇的语音信息中,识别出用户控制意图,增加识别语音信息范围,提升用户体验。
Description
技术领域
本申请涉及模糊意图识别技术领域,尤其涉及一种终端控制方法、装置、设备以及可读介质。
背景技术
近几年智能家电普及,人们对于家电的要求也不仅仅停留在是实用性上,用户希望家电能够更加智能,能够阅读用户的控制意图。现有技术中智能家电可以通过识别用户话语的控制意图达到调控设备的目的,智能家电的识别用户话语的控制意图多是基于单词捕捉的方式,例如:用户说出“调整温度至16°”或“增加1°”等没有歧义的语句时,智能空调才可以捕捉“调整”、“温度16°”、“1°”以及“增加”等关键词,并查找与关键词对应的控制指令,实现对温度进行精准调整,但是,当用户说:“太热了”或者“太冷了”时,用户没有说明精确的控制意图,语句中包含形容词、副词或者其他词性的模糊概念的词汇,智能空调就无法识别用户的控制意图。
目前,智能家电只能识别说明精确控制意图的关键词,无法根据模糊概念词汇的语句确定用户控制意图。
发明内容
为了解决上述智能家电只能识别说明精确控制意图的关键词,无法根据模糊概念词汇的语句确定用户控制意图的技术问题,本申请提供了一种终端控制方法、装置、设备以及可读介质。
第一方面,本申请提供了一种终端控制方法,所述方法包括:
采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;
检测所述语音信息中是否包含预设的模糊控制关键词;
若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;
根据所述用户的控制意图生成控制指令,以用于终端控制。
可选地,所述模糊意图识别列表的建立过程,包括:
获取参考模糊词汇和与所述参考模糊词汇对应的主要控制意图信息;
将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中。
可选地,将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中的步骤之后,还包括:
获取参考词汇集合和与所述参考词汇集合对应的辅助控制意图信息,所述参考词汇集合包含若干个词性相同的参考词汇;
将所述参考词汇集合和所述辅助控制意图信息存储至模糊意图识别列表中。
可选地,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图的步骤,包括:
按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合;
确定所述目标词汇是否与所述参考模糊词汇匹配;
若所述目标词汇集合中有目标词汇与所述参考模糊词汇匹配,则获取与所述参考模糊词汇对应的主要控制意图信息;
确定所述目标词汇集合中有目标词汇是否位于所述参考词汇集合中;
若所述目标词汇集合中有目标词汇不位于所述参考词汇集合中,则将主要控制意图信息确定为控制意图。
可选地,所述终端控制方法还包括:
若所述目标词汇集合中有目标词汇位于所述参考词汇集合中,则获取与所述参考词汇集合对应的辅助控制意图信息;
根据所述主要控制意图信息和辅助控制意图信息确定所述用户的控制意图。
可选地,所述终端控制方法还包括:
若所述目标词汇集合中有目标词汇与所述参考模糊词汇不匹配,则重新执行采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤。
可选地,按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合的步骤之后,还包括:
验证相邻目标词汇之间是否具有关联性;
若所述相邻目标词汇之间具备关联性,确定验证通过;
执行确定所述目标词汇是否与所述参考模糊词汇匹配的步骤;
若验证未通过,重新执行采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤,直至验证通过,执行确定所述目标词汇是否与所述参考模糊词汇匹配的步骤
第二方面,本申请提供了一种终端控制装置,包括:
采集模块,用于采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;
检测模块,用于检测所述语音信息中是否包含预设的模糊控制关键词;
确定模块,用于若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;
生成模块,用于根据所述用户的控制意图生成控制指令,以用于终端控制。
第三方面,本申请提供了一种终端控制设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面任一项所述的方法的步骤。
第四方面,本申请提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行第一方面任一所述方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请通过采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;检测所述语音信息中是否包含预设的模糊控制关键词;若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;根据所述用户的控制意图生成控制指令,达到控制终端的目的,通过将语音信息与模糊意识别列表比对的方式,从包含模糊词汇的语音信息中,识别出用户控制意图,增加识别语音信息范围,提升用户体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种终端控制方法的流程图;
图2为本申请实施例提供的模糊意图识别列表建立过程的流程图;
图3为本申请实施例提供的步骤S103的流程图;
图4为本申请实施例提供的一种终端控制装置结构示意图。
图标:
01-采集模块;02-检测模块;03-确定模块;04-生成模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先本发明实施例提供了一种终端控制方法,如图1所示,所述方法包括:
步骤S101,采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;
在本发明实施例中,终端可以是用户家中的智能空调、智能电视等设备,终端通过采集预设检测区域内用户发出的语音信号,并对语音信号进行识别得到语音信息,语音信息包括用户口述的文字信息,通过对用户发出的语音信号进行识别得到语音信息,再对语音信息进行分析,检测用户是否有控制终端的意图,从而实现终端智能化调节。
步骤S102,检测所述语音信息中是否包含预设的模糊控制关键词;
在本发明实施例中,在智能空调识别用户语音的控制领域中,模糊控制关键词可以是“冷”或者“热”,当检测到语音信息中包含模糊控制关键词时,说明用户可能正在阐述包含控制意图的话语,例如:“太热了”或者“有点冷”等等,通过捕捉预设的模糊控制关键词,实现捕捉可能包含有控制意图的语音信息,从而进行分析,能够在用户主动控制终端调节之前,实现终端的自动化控制。
步骤S103,若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;
目前的智能终端识别用户话语的控制意图多是基于单词捕捉的方式,因此智能终端只能够识别包含控制关键词的语音信息,例如:用户说出“调整温度至16°”或“增加1°”等没有歧义的语句时,智能空调才可以捕捉“调整”、“温度16°”、“1°”以及“增加”等控制关键词,并查找与关键词对应的控制指令,实现对温度进行精准调整,但是,当用户说:“太热了”或者“太冷了”时,用户没有说明精确的控制意图,语句中包含形容词、副词或者其他词性的模糊概念的词汇,智能空调就无法识别用户的控制意图。
基于此,在本发明实施例中,模糊意图识别列表中包括模糊意识关键词和与模糊意识关键词对应的用户的控制意图,通过捕捉语音信息中的模糊意图关键词,从模糊意图识别列表中获取与模糊意识关键词对应的用户的控制意图,从而实现从包含模糊词汇的语音信息中,识别出用户控制意图,增加识别语音信息范围,提升用户体验。
步骤S104,根据所述用户的控制意图生成控制指令,以用于终端控制;
在本发明实施例中,通过从模糊意图识别列表中获取用户的控制意图,根据用户的控制意图生成对应的控制指令,可以实现自动控制终端根据用户表达的控制意图自动化调节,本发明实施例通过采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;检测所述语音信息中是否包含预设的模糊控制关键词;若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;根据所述用户的控制意图生成控制指令,达到控制终端的目的,通过将语音信息与模糊意识别列表比对的方式,从包含模糊词汇的语音信息中,识别出用户控制意图,增加识别语音信息范围,提升用户体验。
在本发明提供的又一实施例中,所述模糊意图识别列表的建立过程,如图2所示,包括:
步骤S201,获取参考模糊词汇和与所述参考模糊词汇对应的主要控制意图信息;
在本发明实施例中,参考模糊词汇的设定是模糊意图识别过程中的关键,例如实现智能空调识别包含模糊词汇的语音信息时,当检测到语音信息中包含“冷”或者“热”等参考模糊关键词时,代表用户对于当前的温度不适应,向更改温度,所以在捕捉预设的模糊关键词后,利用模糊意图识别列表确定主要控制意图信息,例如:捕捉到语音信息中包含“冷”,代表用户的主要控制意图信息为有意图调高温度,或者调高温度2°。
步骤S202,将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中。
在本发明实施例中,建立了参考模糊词汇与主要控制意图信息的对应关系,并存储至模糊意图识别列表中,以达到在捕捉到模糊词汇后,若模糊词汇与参考模糊词汇匹配,则获取与参考模糊词汇对应的主要意图控制信息。
进一步的,步骤S202,将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中之后,还包括:
步骤S203,获取参考词汇集合和与所述参考词汇集合对应的辅助控制意图信息,所述参考词汇集合包含若干个词性相同的参考词汇;
在本发明实施例中,参考词汇集合中包含了相同词性的参考词汇,如副词、形容词以及语气助词等,在捕捉到模糊控制关键词后,但靠模糊控制关键词可以获得对应的主要控制意图信息,但是不能准确的代表用户的控制意图,例如:参考词汇集合中可以包含若干个副词词性的词汇,如“太”、“真”等等词汇,当用户表达“太热”时,想表达比“热”更高一层的感受,因此建立参考词汇集合可以更加精确的分析用户的控制意图,另外参考词汇集合可以同时建立多个,例如在建立副词词汇集合的基础上,再建立语气助词词汇集合,包含“啊”、“了”等等词汇,能够更加精准的结合语义分析出用户的控制意图。
步骤S204,将所述参考词汇集合和所述辅助控制意图信息存储至模糊意图识别列表中。
在本发明实施例中,通过将所述参考词汇集合和所述辅助控制意图信息存储至模糊意图识别列表中,实现结合语义进一步分析语音信息中用户的控制意图的目的,另外还可以通过建立多个相同词性的参考词汇集合,能够更加精确的从语音信息中分析出用户的控制意图。
在本发明实施例中,步骤S103中,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图,如图3所示,包括:
步骤S301,按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合;
在本发明实施例中,可以依据预设的词性分类规则对语音信息进行分词处理,例如预设的词性分类规则可以包括检测语音信息中的副词、检测语音信息中的形容词、检测语音信息中的语气助词等,提取出目标词汇,得到目标词汇集合,目标词汇集合中包含至少一个目标词汇,例如按照预设的词性分类规则设置为检测语音信息中的形容词,且预设的模糊控制词汇也设置为形容词,所以目标词汇集合中至少包含一个目标词汇,以便能够扩大语义识别范围。
进一步的,步骤S301,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合之后,还包括:
验证相邻目标词汇之间是否具有关联性;
若所述相邻目标词汇之间具备关联性,确定验证通过;
在本发明实施例中,对相邻目标词汇之间的关联性进行验证,为了保证能够结合实际场景的语义,准确分析用户的控制意图,例如:接收到语音信息为“太阳很晒,今天有点热了”,使用按照预设的词性分类规则,对所述语音信息进行分词处理,得到目标词汇“太”和“热”,若不对相邻目标词汇进行关联性分析,则会根据目标词汇“太”和“热”以及模糊意图识别列表确定用户的控制意图,但实际上用户并不是很热,因此,只有相邻目标词汇之间具备关联性时,确定验证通过,并执行步骤S302,确定所述目标词汇是否与所述参考模糊词汇匹配的步骤;
若验证未通过,重新执行步骤步骤S101,采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤,直至验证通过,执行步骤S302,确定所述目标词汇是否与所述参考模糊词汇匹配的步骤,
步骤S302,确定所述目标词汇是否与所述参考模糊词汇匹配;
步骤S303,若所述目标词汇集合中有目标词汇与所述参考模糊词汇匹配,则获取与所述参考模糊词汇对应的主要控制意图信息;
在本发明实施例中,首先需要确定目标词汇是否与参考摸户词汇匹配,具体设置匹配率的阈值可以依据实际情况而定,若设置的匹配率较高,则可以更加精准的确定主要控制意图信息,但会降低识别通过率,若设置的匹配率较低,可以提高识别通过率,能够识别更多目标词汇,例如参考模糊词汇为“想喝冰水”,目标词汇为“冷饮”,降低匹配率可以识别更多与参考模糊词汇语义相近的词汇,但是也会降低输出主要控制意图信息的准确率,具体匹配阈值设计可以依据实际情况而定,本发明对此不作具体限定。
在本发明实施例中,若所述目标词汇集合中有目标词汇与所述参考模糊词汇不匹配,则重新执行步骤S101,采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤。
步骤S304,确定所述目标词汇集合中有目标词汇是否位于所述参考词汇集合中;
步骤S305,若所述目标词汇集合中有目标词汇不位于所述参考词汇集合中,则将主要控制意图信息确定为控制意图。
在本发明实施例中,在确定述目标词汇集合中有目标词汇与所述参考模糊词汇匹配之后,再确定所述目标词汇集合中有目标词汇是否位于所述参考词汇集合中,若目标词汇集合中只包含与参考模糊词汇匹配的目标词汇,则将主要控制意图信息确定为控制意图。
在另一种实施方式中,步骤S306,若所述目标词汇集合中有目标词汇位于所述参考词汇集合中,则获取与所述参考词汇集合对应的辅助控制意图信息;
步骤S307,根据所述主要控制意图信息和辅助控制意图信息确定所述用户的控制意图。
在本发明实施例中,若目标词汇集合中存在目标词汇位于参考词汇集合中,获取与参考词汇集合对应的辅助控制意图信息,例如:目标词汇为“热”,与参考模糊词汇匹配,并获取到与该参考模糊词汇对应的主要控制意图信息为降低空调2°,目标词汇集合中有另一个目标词汇为“太”,并位于参考词汇集合中,则获取与参考词汇集合对应的辅助控制意图信息,并根据根据所述主要控制意图信息和辅助控制意图信息确定所述用户的控制意图,最后输出的用户的控制意图可以是降低空调4°,通过将目标词汇与参考模糊词汇匹配,能够确定主要控制意图信息,再通过目标词汇与参考词汇集合中的参考词汇匹配,能够确定辅助控制意图信息,进而分析语音信息中的语义,输出的用户的控制意图精确度更高,提升用的体验。
在本发明的又一实施例中,还提供了一种终端控制装置,如图4所示,包括:
采集模块01,用于采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;
检测模块02,用于检测所述语音信息中是否包含预设的模糊控制关键词;
确定模块03,用于若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;
生成模块04,用于根据所述用户的控制意图生成控制指令,以用于终端控制。
在本发明实施例中所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明的又一实施例中,还提供了一种终端控制设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中任一项所述的终端控制方法的步骤。
在本发明的又一实施例中,还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述实施例中任一所述方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (6)
1.一种终端控制方法,其特征在于,所述方法包括:
采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;
检测所述语音信息中是否包含预设的模糊控制关键词;
若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;
根据所述用户的控制意图生成控制指令,以用于终端控制;
其中,所述模糊意图识别列表的建立过程,包括:
获取参考模糊词汇和与所述参考模糊词汇对应的主要控制意图信息;
将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中;
其中,将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中的步骤之后,还包括:
获取参考词汇集合和与所述参考词汇集合对应的辅助控制意图信息,所述参考词汇集合包含若干个词性相同的参考词汇;
将所述参考词汇集合和所述辅助控制意图信息存储至模糊意图识别列表中;
其中,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图的步骤,包括:
按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合;
确定所述目标词汇是否与所述参考模糊词汇匹配;
若所述目标词汇集合中有目标词汇与所述参考模糊词汇匹配,则获取与所述参考模糊词汇对应的主要控制意图信息;
确定所述目标词汇集合中有目标词汇是否位于所述参考词汇集合中;
若所述目标词汇集合中有目标词汇不位于所述参考词汇集合中,则将主要控制意图信息确定为控制意图;
其中,按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合的步骤之后,还包括:
验证相邻目标词汇之间是否具有关联性;
若所述相邻目标词汇之间具备关联性,确定验证通过;
执行确定所述目标词汇是否与所述参考模糊词汇匹配的步骤;
若验证未通过,重新执行采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤,直至验证通过,执行确定所述目标词汇是否与所述参考模糊词汇匹配的步骤。
2.根据权利要求1所述的终端控制方法,其特征在于,还包括:
若所述目标词汇集合中有目标词汇位于所述参考词汇集合中,则获取与所述参考词汇集合对应的辅助控制意图信息;
根据所述主要控制意图信息和辅助控制意图信息确定所述用户的控制意图。
3.根据权利要求1所述的终端控制方法,其特征在于,还包括:
若所述目标词汇集合中有目标词汇与所述参考模糊词汇不匹配,则重新执行采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤。
4.一种终端控制装置,其特征在于,包括:
采集模块,用于采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息;
检测模块,用于检测所述语音信息中是否包含预设的模糊控制关键词;
确定模块,用于若所述语音信息中包含所述预设的模糊控制关键词,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图;
生成模块,用于根据所述用户的控制意图生成控制指令,以用于终端控制;
其中,所述模糊意图识别列表的建立过程,包括:
获取参考模糊词汇和与所述参考模糊词汇对应的主要控制意图信息;
将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中;
其中,将所述参考模糊词汇和所述主要控制意图信息存储至模糊意图识别列表中的步骤之后,还包括:
获取参考词汇集合和与所述参考词汇集合对应的辅助控制意图信息,所述参考词汇集合包含若干个词性相同的参考词汇;
将所述参考词汇集合和所述辅助控制意图信息存储至模糊意图识别列表中;
其中,根据所述模糊控制关键词和模糊意图识别列表确定用户的控制意图的步骤,包括:
按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合;
确定所述目标词汇是否与所述参考模糊词汇匹配;
若所述目标词汇集合中有目标词汇与所述参考模糊词汇匹配,则获取与所述参考模糊词汇对应的主要控制意图信息;
确定所述目标词汇集合中有目标词汇是否位于所述参考词汇集合中;
若所述目标词汇集合中有目标词汇不位于所述参考词汇集合中,则将主要控制意图信息确定为控制意图;
其中,按照预设的词性分类规则,对所述语音信息进行分词处理,得到包含至少一个目标词汇的目标词汇集合的步骤之后,还包括:
验证相邻目标词汇之间是否具有关联性;
若所述相邻目标词汇之间具备关联性,确定验证通过;
执行确定所述目标词汇是否与所述参考模糊词汇匹配的步骤;
若验证未通过,重新执行采集用户发出的语音信号,并对所述语音信号进行语音识别得到语音信息的步骤,直至验证通过,执行确定所述目标词汇是否与所述参考模糊词汇匹配的步骤。
5.一种终端控制设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至3任一项所述的方法的步骤。
6.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至3任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910974836.4A CN110970022B (zh) | 2019-10-14 | 2019-10-14 | 一种终端控制方法、装置、设备以及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910974836.4A CN110970022B (zh) | 2019-10-14 | 2019-10-14 | 一种终端控制方法、装置、设备以及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110970022A CN110970022A (zh) | 2020-04-07 |
CN110970022B true CN110970022B (zh) | 2022-06-10 |
Family
ID=70029685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910974836.4A Active CN110970022B (zh) | 2019-10-14 | 2019-10-14 | 一种终端控制方法、装置、设备以及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110970022B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112489657A (zh) * | 2020-12-04 | 2021-03-12 | 宁夏新航信息科技有限公司 | 一种数据分析系统与数据分析方法 |
CN113031649B (zh) * | 2021-02-26 | 2022-11-11 | 苏州臻迪智能科技有限公司 | 无人机控制方法、装置和控制设备 |
CN115268324A (zh) * | 2022-07-25 | 2022-11-01 | 青岛海尔科技有限公司 | 指令的修正方法及装置、存储介质及电子装置 |
CN117273013B (zh) * | 2023-11-21 | 2024-01-26 | 中国人民公安大学 | 一种笔录电子数据处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108369808A (zh) * | 2015-11-10 | 2018-08-03 | 三星电子株式会社 | 电子设备和用于控制该电子设备的方法 |
CN108376543A (zh) * | 2018-02-11 | 2018-08-07 | 深圳创维-Rgb电子有限公司 | 一种电器设备的控制方法、装置、设备和存储介质 |
CN110197662A (zh) * | 2019-05-31 | 2019-09-03 | 努比亚技术有限公司 | 语音控制方法、可穿戴设备及计算机可读存储介质 |
CN110286601A (zh) * | 2019-07-01 | 2019-09-27 | 珠海格力电器股份有限公司 | 控制智能家居设备的方法、装置、控制设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102334119B (zh) * | 2009-02-26 | 2014-05-21 | 国立大学法人丰桥技术科学大学 | 声音检索装置及声音检索方法 |
-
2019
- 2019-10-14 CN CN201910974836.4A patent/CN110970022B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108369808A (zh) * | 2015-11-10 | 2018-08-03 | 三星电子株式会社 | 电子设备和用于控制该电子设备的方法 |
CN108376543A (zh) * | 2018-02-11 | 2018-08-07 | 深圳创维-Rgb电子有限公司 | 一种电器设备的控制方法、装置、设备和存储介质 |
CN110197662A (zh) * | 2019-05-31 | 2019-09-03 | 努比亚技术有限公司 | 语音控制方法、可穿戴设备及计算机可读存储介质 |
CN110286601A (zh) * | 2019-07-01 | 2019-09-27 | 珠海格力电器股份有限公司 | 控制智能家居设备的方法、装置、控制设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110970022A (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110970022B (zh) | 一种终端控制方法、装置、设备以及可读介质 | |
US10013977B2 (en) | Smart home control method based on emotion recognition and the system thereof | |
US10037758B2 (en) | Device and method for understanding user intent | |
JP7143916B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
US20110144999A1 (en) | Dialogue system and dialogue method thereof | |
WO2003050799A9 (en) | Method and system for non-intrusive speaker verification using behavior models | |
CN105632487B (zh) | 一种语音识别方法和装置 | |
CN111081217B (zh) | 一种语音唤醒方法、装置、电子设备及存储介质 | |
JP2008233345A (ja) | インタフェース装置及びインタフェース処理方法 | |
CN111326140B (zh) | 语音识别结果判别方法、纠正方法、装置、设备及存储介质 | |
KR20080086791A (ko) | 음성 기반 감정 인식 시스템 | |
US20140180688A1 (en) | Speech recognition device and speech recognition method, data base for speech recognition device and constructing method of database for speech recognition device | |
US10916249B2 (en) | Method of processing a speech signal for speaker recognition and electronic apparatus implementing same | |
CN111477231B (zh) | 人机交互方法、装置和存储介质 | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 | |
WO2023184942A1 (zh) | 语音交互方法、装置及电器 | |
CN113157876A (zh) | 信息反馈方法、装置、终端和存储介质 | |
JP6616182B2 (ja) | 話者認識装置、判別値生成方法及びプログラム | |
CN115104151A (zh) | 一种离线语音识别方法和装置、电子设备和可读存储介质 | |
CN110930988A (zh) | 一种音素评分的确定方法及系统 | |
JPWO2009113505A1 (ja) | 映像分割装置、方法及びプログラム | |
CN116415591A (zh) | 基于用户意图识别的设备控制方法及装置 | |
CN115132170A (zh) | 语种分类方法、装置及计算机可读存储介质 | |
CN109712607B (zh) | 一种处理方法、装置及电子设备 | |
CN109710735B (zh) | 基于多社交渠道的朗读内容推荐方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |