CN109671427B - 一种语音控制方法、装置、存储介质及空调 - Google Patents
一种语音控制方法、装置、存储介质及空调 Download PDFInfo
- Publication number
- CN109671427B CN109671427B CN201811505077.9A CN201811505077A CN109671427B CN 109671427 B CN109671427 B CN 109671427B CN 201811505077 A CN201811505077 A CN 201811505077A CN 109671427 B CN109671427 B CN 109671427B
- Authority
- CN
- China
- Prior art keywords
- current
- voice instruction
- supplementary
- voice
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 230000000694 effects Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 25
- 230000006870 function Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 18
- 230000000717 retained effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000013589 supplement Substances 0.000 description 5
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 4
- 239000010931 gold Substances 0.000 description 4
- 229910052737 gold Inorganic materials 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 235000005135 Micromeria juliana Nutrition 0.000 description 1
- 241000246354 Satureja Species 0.000 description 1
- 235000007315 Satureja hortensis Nutrition 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/30—Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/50—Control or safety arrangements characterised by user interfaces or communication
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/62—Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
- F24F11/63—Electronic processing
- F24F11/64—Electronic processing using pre-stored data
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/70—Control systems characterised by their outputs; Constructional details thereof
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/88—Electrical aspects, e.g. circuits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语音控制方法、装置、存储介质及空调,该方法包括:在待控设备执行当前语音指令后的设定时长内,获取补充语音指令;根据所述当前语音指令和所述补充语音指令重新确定新语义关键词;按所述新语义关键词执行所述当前语音指令和所述补充语音指令。本发明的方案,可以解决现在的设备如果播放结果不是用户想的则需要用户重新把整条命令都说一遍而存在使用不方便的问题,达到提升使用便捷性的效果。
Description
技术领域
本发明属于语音控制技术领域,具体涉及一种语音控制方法、装置、存储介质及空调,尤其涉及一种基于上一条命令和结果进行语音查询命令补充逻辑处理的方法、装置、存储介质及空调。
背景技术
语音技术已经由一门很年轻的计算机技术发展成了一门非常流行,也越来越成熟的技术。
未来的计算机的发展趋势是人工智能,让计算机能听、能说,是未来人机交互的重要发展方向,其中语音成为未来最被看好的人机交互方式,而且语音比其他的交互方式有更多的优势。
能说能听在智能音响或智能家电有了很好的体现,用户可以通过语音命令设备播放音乐,如使用语音命令:播放《沉默是金》,《沉默是金》有很多明星都唱过,如张国荣、张学友等,每个版本都不一样;假如我觉得听张国荣的《沉默是金》更有味道,但由于我刚说的是播放沉默是金并没有说播放谁的,不同的服务器可能响应结果不一样。
现在的设备如果播放结果不是我想的,我得重新把整条命令都说一遍,如播放张国荣的《沉默是金》,显得非常不友好。
发明内容
本发明的目的在于,针对上述缺陷,提供一种语音控制方法、装置、存储介质及空调,以解决现有技术中现在的设备如果播放结果不是用户想的则需要用户重新把整条命令都说一遍,存在使用不方便的问题,达到提升使用便捷性的效果。
本发明提供一种语音控制方法,包括:在待控设备执行当前语音指令后的设定时长内,获取补充语音指令;根据所述当前语音指令和所述补充语音指令重新确定新语义关键词;按所述新语义关键词执行所述当前语音指令和所述补充语音指令。
可选地,根据所述当前语音指令和所述补充语音指令重新确定新语义关键词,包括:在所述当前语音指令的基础上对所述补充语音指令进行二次查询,得到所需的新语义关键词;或者,将所述当前语音指令和所述补充语音指令进行合并解析,得到所需的新语义关键词。
可选地,其中,在所述当前语音指令的基础上对所述补充语音指令进行二次查询,包括:获取所述当前语音指令的当前语义关键词的当前搜索结果,并对所述补充语音指令进行语义解析得到补充语音关键词;在所述当前搜索结果中搜索所述补充语义关键词,得到所需的新语义关键词;或者,将所述当前语音指令和所述补充语音指令进行合并解析,包括:将所述当前语音指令和所述补充语音指令合并为新语音指令;对所述新语音指令进行语义解析得到所述新语义关键词。
可选地,还包括:获取当前语音指令;确定所述当前语音指令的当前语义关键词并存储;按所述当前语义关键词执行所述当前语音指令。
可选地,确定所述当前语音指令的当前语义关键词,包括:对所述当前语音指令进行语义解析,得到所述当前语音指令的当前语义关键词;以及,存储所述当前语义关键词的当前搜索结果。
可选地,还包括:获取用户对当前语音指令的执行情况的反馈结果;确定所述反馈结果是否属于设定的满意结果范围;若所述反馈结果不属于所述满意结果范围,才在待控设备执行当前语音指令后的设定时长内对补充语音指令进行获取;或者,若所述反馈结果属于所述满意结果范围,则不对补充语音指令进行获取,或者,存储对当前语音指令的执行情况,以在下次获取所述当前语音指令时直接按当前语义关键词执行所述当前语音指令。
与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:获取单元,用于在待控设备执行当前语音指令后的设定时长内,获取补充语音指令;控制单元,用于根据所述当前语音指令和所述补充语音指令重新确定新语义关键词;所述控制单元,还用于按所述新语义关键词执行所述当前语音指令和所述补充语音指令。
可选地,所述控制单元根据所述当前语音指令和所述补充语音指令重新确定新语义关键词,包括:在所述当前语音指令的基础上对所述补充语音指令进行二次查询,得到所需的新语义关键词;或者,将所述当前语音指令和所述补充语音指令进行合并解析,得到所需的新语义关键词。
可选地,其中,所述控制单元在所述当前语音指令的基础上对所述补充语音指令进行二次查询,包括:获取所述当前语音指令的当前语义关键词的当前搜索结果,并对所述补充语音指令进行语义解析得到补充语音关键词;在所述当前搜索结果中搜索所述补充语义关键词,得到所需的新语义关键词;或者,所述控制单元将所述当前语音指令和所述补充语音指令进行合并解析,包括:将所述当前语音指令和所述补充语音指令合并为新语音指令;对所述新语音指令进行语义解析得到所述新语义关键词。
可选地,还包括:所述获取单元,还用于获取当前语音指令;所述控制单元,还用于确定所述当前语音指令的当前语义关键词并存储;所述控制单元,还用于按所述当前语义关键词执行所述当前语音指令。
可选地,所述控制单元确定所述当前语音指令的当前语义关键词,包括:对所述当前语音指令进行语义解析,得到所述当前语音指令的当前语义关键词;以及,存储所述当前语义关键词的当前搜索结果。
可选地,还包括:所述获取单元,还用于获取用户对当前语音指令的执行情况的反馈结果;所述控制单元,还用于确定所述反馈结果是否属于设定的满意结果范围;所述控制单元,还用于若所述反馈结果不属于所述满意结果范围,才在待控设备执行当前语音指令后的设定时长内对补充语音指令进行获取;或者,所述控制单元,还用于若所述反馈结果属于所述满意结果范围,则不对补充语音指令进行获取,或者,存储对当前语音指令的执行情况,以在下次获取所述当前语音指令时直接按当前语义关键词执行所述当前语音指令。
与上述装置相匹配,本发明再一方面提供一种空调,包括:以上所述的语音控制装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。
与上述方法相匹配,本发明再一方面提供一种空调,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。
本发明的方案,通过保留上次查询结果进行二次查询执行,可以提高查询效率,提升用户使用便捷性。
进一步,本发明的方案,通过保留上次查询结果进行二次查询执行,可以减少语音多余词汇的输入,提升用户使用便捷性,提高用户体验。
进一步,本发明的方案,通过保留上一次命令,本次命令在上次的执行结果下执行,可以减少语音多余词汇的输入,提高用户体验。
进一步,本发明的方案,通过上一次命令与本次命令的执行并操作,可以提高处理效率,提升用户体验。
进一步,本发明的方案,通过在第一次查找的结果里进行第二次查找,第二次查找的范围必然更小,可以提高查询效率,提升用户使用的便捷性。
由此,本发明的方案,通过保留上次查询结果进行二次查询执行,解决现有技术中现在的设备如果播放结果不是用户想的则需要用户重新把整条命令都说一遍,存在使用不方便的问题,从而,克服现有技术中使用不方便、处理效率低和用户体验差的缺陷,实现使用方便、处理效率高和用户体验好的有益效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的语音控制方法的一实施例的流程示意图;
图2为本发明的方法中在所述当前语音指令的基础上对所述补充语音指令进行二次查询的一实施例的流程示意图;
图3为本发明的方法中将所述当前语音指令和所述补充语音指令进行合并解析的一实施例的流程示意图;
图4为本发明的方法中获取并执行当前语音指令的一实施例的流程示意图;
图5为本发明的方法中确定所述当前语音指令的当前语义关键词的一实施例的流程示意图;
图6为本发明的方法中获取用户对当前语音指令的执行情况的反馈结果的一实施例的流程示意图;
图7为本发明的语音控制装置的一实施例的结构示意图;
图8为本发明的空调的一实施例的语音执行流程示意图;
图9为本发明的空调的一实施例的音执行模块框图。
结合附图,本发明实施例中附图标记如下:
102-获取单元;104-控制单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以包括:步骤S110至步骤S130。
在步骤S110处,在待控设备执行当前语音指令后的设定时长内,获取补充语音指令。
在步骤S120处,根据所述当前语音指令和所述补充语音指令重新确定新语义关键词。
例如:可保留上一条查询结果进行下一条信息查询补充逻辑处理,如可以在第一次查找的结果里进行第二次查找,第二次查找的范围必然更小。
可选地,步骤S120中根据所述当前语音指令和所述补充语音指令重新确定新语义关键词,可以包括以下任一种确定情形。
第一种确定情形:在所述当前语音指令的基础上对所述补充语音指令进行二次查询,得到所需的新语义关键词。
更可选地,可以图2所示本发明的方法中在所述当前语音指令的基础上对所述补充语音指令进行二次查询的一实施例流程示意图,进一步说明在所述当前语音指令的基础上对所述补充语音指令进行二次查询的具体过程,可以包括:步骤S210和步骤S220。
步骤S210,获取所述当前语音指令的当前语义关键词的当前搜索结果,并对所述补充语音指令进行语义解析得到补充语音关键词。
步骤S220,在所述当前搜索结果中搜索所述补充语义关键词,得到所需的新语义关键词。
例如:保留上一次命令,本次命令在上次的执行结果下执行。
由此,通过在当前语音指令的当前语义关键词的当前搜索结果的基础上搜索补充语音指令的补充语义关键词,搜索范围小,搜索效率高,且精准性好。
第二种确定情形:将所述当前语音指令和所述补充语音指令进行合并解析,得到所需的新语义关键词。
由此,通过多种方式基于当前语音指令和补充语音指令重新确定得到新语义关键词,使得对新语义关键词的确定方式灵活且便捷,有利于提升确定效率和确定的精准性。
更可选地,可以结合图3所示本发明的方法中将所述当前语音指令和所述补充语音指令进行合并解析的一实施例流程示意图,进一步说明将所述当前语音指令和所述补充语音指令进行合并解析的具体过程,可以包括:步骤S310和步骤S320。
步骤S310,将所述当前语音指令和所述补充语音指令合并为新语音指令。
步骤S320,对所述新语音指令进行语义解析得到所述新语义关键词。
例如:保留第一条命令,第二条命令与第一条命令经过并操作进行重新检索,两条命令通过语法命令进行合并为一条命令进行查找。
由此,通过将当前语音指令和补充语音指令合并为新语音指令后基于该新语音指令进行语义解析,免去了用户重新发送当前语音指令,提升了用户使用的便捷性。
在步骤S130处,按所述新语义关键词执行所述当前语音指令和所述补充语音指令。
例如:如图9所示,语音采集设置在本地智能设备,采集语音信号;智能设备把采集到的语音信号上传到服务器,由服务器语义解释模块进行语义解释;服务器把解释出来的语义储存在语义解释命令存储单元,并转发到执行命令模块进行处理;服务器执行完语音命令后,把执行结果存储在执行结果单元;执行结果单元把结果按照顺序(搜索结果是一个链表,链表是有顺序的)通过网络输出到智能设备,由智能设备进行结果播放。
其中,步骤S110至步骤S130中的一个步骤或多个步骤,可以在待控设备侧处理,也可以在服务器侧处理,也可以部分在待控设备侧处理、部分在服务器侧处理。
由此,通过针对在待控设备执行当前语音指令后的设定时长内接收到的补充语音指令,结合当前语音指令重新确定新语义关键词,进而按该新语义关键词执行当前语音指令和补充语音指令,免去了用户在发送补充语音指令时需要一并再发送当前语音指令,提升了用户使用的便捷性。
在一个可选实施方式中,还可以包括:获取并执行当前语音指令的过程。
下面结合图4所示本发明的方法中获取并执行当前语音指令的一实施例流程示意图,进一步说明获取并执行当前语音指令的具体过程,可以包括:步骤S410至步骤S430。
步骤S410,在获取补充语音指令之前,获取当前语音指令。
步骤S420,确定所述当前语音指令的当前语义关键词并存储。
可选地,可以结合图5所示本发明的方法中确定所述当前语音指令的当前语义关键词的一实施例流程示意图,进一步说明步骤S420中确定所述当前语音指令的当前语义关键词的具体过程,可以包括:步骤S510和步骤S520。
步骤S510,对所述当前语音指令进行语义解析,得到所述当前语音指令的当前语义关键词。以及,
步骤S520,存储所述当前语义关键词的当前搜索结果。例如:将所述当前语义关键词的当前搜索结果存储在设定的语义解释命令存储模块中。
例如:如图9所示,存储语义解释命令模块,把语义解释模块每次语义解释的语义保存起来,以便在规定的时间内进行下一条命令的承接。保留上次查询结果进行二次查询执行,提高查询效率。
例如:如图9所示,执行结果模块,把执行命令模块执行命令的结果存储在执行结果,以便二次查找时直接从执行结果里查询。保留上次查询结果进行二次查询执行,可以减少语音多余词汇的输入,提高用户体验。
由此,通过对当前语音指令进行语义解析得到其当前语义关键词,并存储该当前语义关键词的当前搜索结果以便在需要二次查询时直接以该当前搜索结果为新的搜索范围,大大缩小搜索范围,提高搜索效率。
步骤S430,按所述当前语义关键词执行所述当前语音指令。
由此,通过获取并执行当前语音指令,可以方便用户确定待控设备对当前语音指令的执行情况是否符合自身需求,进而在不符合自身需求的情况下只发送补充语音指令即可,免去了需要再重新发送包含当前语音指令和补充语音指令的新语音指令,大大提升了用户使用的便捷性和使用体验。
在一个可选实施方式中,还可以包括:获取用户对当前语音指令的执行情况的反馈结果的过程。
下面结合图6所示本发明的方法中获取用户对当前语音指令的执行情况的反馈结果的一实施例流程示意图,进一步说明获取用户对当前语音指令的执行情况的反馈结果的具体过程,可以包括:步骤S610至步骤S640。
步骤S610,在按当前语义关键词执行当前语音指令之后,获取用户对当前语音指令的执行情况的反馈结果。
步骤S620,确定所述反馈结果是否属于设定的满意结果范围。
步骤S630,若所述反馈结果不属于所述满意结果范围,才在待控设备执行当前语音指令后的设定时长内对补充语音指令进行获取。
或者,步骤S640,若所述反馈结果属于所述满意结果范围,则不对补充语音指令进行获取,或者,存储对当前语音指令的执行情况,以在下次获取所述当前语音指令时直接按当前语义关键词执行所述当前语音指令。
由此,通过根据用户对当前语音指令的执行情况的反馈结果,在用户不满意该执行情况时确定继续接收补充语音指令,在用户满意该执行情况时直接存储该最满意的执行情况,可以满足用户的多种需求,使用便捷性好、人性化好。
经大量的试验验证,采用本实施例的技术方案,通过保留上次查询结果进行二次查询执行,可以提高查询效率,提升用户使用便捷性。
根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图7所示本发明的装置的一实施例的结构示意图。该语音控制装置可以包括:获取单元102和控制单元104。
在一个可选例子中,获取单元102,可以用于在待控设备执行当前语音指令后的设定时长内,获取补充语音指令。该获取单元102的具体功能及处理参见步骤S110。
在一个可选例子中,控制单元104,可以用于根据所述当前语音指令和所述补充语音指令重新确定新语义关键词。该控制单元104的具体功能及处理参见步骤S120。
例如:可保留上一条查询结果进行下一条信息查询补充逻辑处理,如可以在第一次查找的结果里进行第二次查找,第二次查找的范围必然更小。
可选地,所述控制单元104根据所述当前语音指令和所述补充语音指令重新确定新语义关键词,可以包括以下任一种确定情形。
第一种确定情形:所述控制单元104,具体还可以用于在所述当前语音指令的基础上对所述补充语音指令进行二次查询,得到所需的新语义关键词。
可选地,所述控制单元104在所述当前语音指令的基础上对所述补充语音指令进行二次查询,可以包括:
所述控制单元104,具体还可以用于获取所述当前语音指令的当前语义关键词的当前搜索结果,并对所述补充语音指令进行语义解析得到补充语音关键词。该控制单元104的具体功能及处理还参见步骤S210。
所述控制单元104,具体还可以用于在所述当前搜索结果中搜索所述补充语义关键词,得到所需的新语义关键词。该控制单元104的具体功能及处理还参见步骤S220。
例如:保留上一次命令,本次命令在上次的执行结果下执行。
由此,通过在当前语音指令的当前语义关键词的当前搜索结果的基础上搜索补充语音指令的补充语义关键词,搜索范围小,搜索效率高,且精准性好。
第二种确定情形:所述控制单元104,具体还可以用于将所述当前语音指令和所述补充语音指令进行合并解析,得到所需的新语义关键词。
由此,通过多种方式基于当前语音指令和补充语音指令重新确定得到新语义关键词,使得对新语义关键词的确定方式灵活且便捷,有利于提升确定效率和确定的精准性。
可选地,所述控制单元104将所述当前语音指令和所述补充语音指令进行合并解析,可以包括:
所述控制单元104,具体还可以用于将所述当前语音指令和所述补充语音指令合并为新语音指令。该控制单元104的具体功能及处理还参见步骤S310。
所述控制单元104,具体还可以用于对所述新语音指令进行语义解析得到所述新语义关键词。该控制单元104的具体功能及处理还参见步骤S320。
例如:保留第一条命令,第二条命令与第一条命令经过并操作进行重新检索,两条命令通过语法命令进行合并为一条命令进行查找。
由此,通过将当前语音指令和补充语音指令合并为新语音指令后基于该新语音指令进行语义解析,免去了用户重新发送当前语音指令,提升了用户使用的便捷性。
在一个可选例子中,所述控制单元104,还可以用于按所述新语义关键词执行所述当前语音指令和所述补充语音指令。该控制单元104的具体功能及处理还参见步骤S130。
例如:如图9所示,语音采集设置在本地智能设备,采集语音信号;智能设备把采集到的语音信号上传到服务器,由服务器语义解释模块进行语义解释;服务器把解释出来的语义储存在语义解释命令存储单元,并转发到执行命令模块进行处理;服务器执行完语音命令后,把执行结果存储在执行结果单元;执行结果单元把结果按照顺序(搜索结果是一个链表,链表是有顺序的)通过网络输出到智能设备,由智能设备进行结果播放。
其中,获取单元102和控制单元104处理的步骤S110至步骤S130中的一个步骤或多个步骤,可以在待控设备侧处理,也可以在服务器侧处理,也可以部分在待控设备侧处理、部分在服务器侧处理。
由此,通过针对在待控设备执行当前语音指令后的设定时长内接收到的补充语音指令,结合当前语音指令重新确定新语义关键词,进而按该新语义关键词执行当前语音指令和补充语音指令,免去了用户在发送补充语音指令时需要一并再发送当前语音指令,提升了用户使用的便捷性。
在一个可选实施方式中,还可以包括:获取并执行当前语音指令的过程,具体如下:
所述获取单元102,还可以用于在获取补充语音指令之前,获取当前语音指令。该获取单元102的具体功能及处理还参见步骤S410。
所述控制单元104,还可以用于确定所述当前语音指令的当前语义关键词并存储。该控制单元104的具体功能及处理还参见步骤S420。
可选地,所述控制单元104确定所述当前语音指令的当前语义关键词,可以包括:
所述控制单元104,具体还可以用于对所述当前语音指令进行语义解析,得到所述当前语音指令的当前语义关键词。以及,该控制单元104的具体功能及处理还参见步骤S510。
所述控制单元104,具体还可以用于存储所述当前语义关键词的当前搜索结果。例如:将所述当前语义关键词的当前搜索结果存储在设定的语义解释命令存储模块中。该控制单元104的具体功能及处理还参见步骤S520。
例如:如图9所示,存储语义解释命令模块,把语义解释模块每次语义解释的语义保存起来,以便在规定的时间内进行下一条命令的承接。保留上次查询结果进行二次查询执行,提高查询效率。
例如:如图9所示,执行结果模块,把执行命令模块执行命令的结果存储在执行结果,以便二次查找时直接从执行结果里查询。保留上次查询结果进行二次查询执行,可以减少语音多余词汇的输入,提高用户体验。
由此,通过对当前语音指令进行语义解析得到其当前语义关键词,并存储该当前语义关键词的当前搜索结果以便在需要二次查询时直接以该当前搜索结果为新的搜索范围,大大缩小搜索范围,提高搜索效率。
所述控制单元104,还可以用于按所述当前语义关键词执行所述当前语音指令。该控制单元104的具体功能及处理还参见步骤S430。
由此,通过获取并执行当前语音指令,可以方便用户确定待控设备对当前语音指令的执行情况是否符合自身需求,进而在不符合自身需求的情况下只发送补充语音指令即可,免去了需要再重新发送包含当前语音指令和补充语音指令的新语音指令,大大提升了用户使用的便捷性和使用体验。
在一个可选实施方式中,还可以包括:获取用户对当前语音指令的执行情况的反馈结果的过程,具体可以如下:
所述获取单元102,还可以用于在按当前语义关键词执行当前语音指令之后,获取用户对当前语音指令的执行情况的反馈结果。该获取单元102的具体功能及处理还参见步骤S610。
所述控制单元104,还可以用于确定所述反馈结果是否属于设定的满意结果范围。该控制单元104的具体功能及处理还参见步骤S620。
所述控制单元104,还可以用于若所述反馈结果不属于所述满意结果范围,才在待控设备执行当前语音指令后的设定时长内对补充语音指令进行获取。该控制单元104的具体功能及处理还参见步骤S630。
或者,所述控制单元104,还可以用于若所述反馈结果属于所述满意结果范围,则不对补充语音指令进行获取,或者,存储对当前语音指令的执行情况,以在下次获取所述当前语音指令时直接按当前语义关键词执行所述当前语音指令。该控制单元104的具体功能及处理还参见步骤S640。
由此,通过根据用户对当前语音指令的执行情况的反馈结果,在用户不满意该执行情况时确定继续接收补充语音指令,在用户满意该执行情况时直接存储该最满意的执行情况,可以满足用户的多种需求,使用便捷性好、人性化好。
由于本实施例的装置所实现的处理及功能基本相应于前述图1至图6所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过保留上次查询结果进行二次查询执行,可以减少语音多余词汇的输入,提升用户使用便捷性,提高用户体验。
根据本发明的实施例,还提供了对应于语音控制装置的一种空调。该空调可以包括:以上所述的语音控制装置。
在一个可选实施方式中,本发明的方案,研究一种可保留上一条查询结果进行下一条信息查询补充逻辑处理的方法。
在一个可选例子中,本发明的方案,提供了一种二次快速查找的方法,可以解决第一次查找结果范围太大问题。
其中,一种二次快速查找的方法,是指在第一次查找的结果里进行第二次查找,第二次查找的范围必然更小。
可选地,保留上次查询结果进行二次查询执行,提高查询效率。
可选地,保留上次查询结果进行二次查询执行,可以减少语音多余词汇的输入,提高用户体验。
在一个可选例子中,本发明的方案,提供了一种承接上条命令的方法,保留上一次命令,本次命令在上次的执行结果下执行。
其中,一种承接上条命令的方法,是指可以使用多次的查找,而且每次查找的范围都是在上一个命令的结果里。
在一个可选例子中,本发明的方案,提供了一种与上一条命令进行并操作的方法,上一次命令与本次命令的执行并操作。
其中,一种与上一条命令进行并操作的方法,是指保留第一条命令,第二条命令与第一条命令经过并操作进行重新检索,两条命令通过语法命令进行合并为一条命令进行查找。
在一个可选具体实施方式中,可以结合图8和图9所示的例子,对本发明的方案的具体实现过程进行示例性说明。
图9中,语音采集模块,负责采集语音的输入信息。语义解释模块,把语音采集模块采集到的信息进行解释。存储语义解释命令模块,把语义解释模块每次语义解释的语义保存起来,以便在规定的时间内进行下一条命令的承接。执行命令模块,就是把语义解释模块语义解释出来的语义进行执行。执行结果模块,把执行命令模块执行命令的结果存储在执行结果,以便二次查找时直接从执行结果里查询。
在一个可选具体实施方式中,参见图8和图9所示的例子,本发明的方案的具体实施过程,可以包括:
步骤1、本发明的方案,分为语音采集、语义解释、存储语义解释命令、执行命令、执行结果、结果播放等六个模块。
其中,语义解释、存储语义解释命令、执行命令、执行结果可以设置在服务器;语音采集、结果播放可以设置在本地智能设备。
步骤2、语音采集设置在本地智能设备,采集语音信号;智能设备把采集到的语音信号上传到服务器,由服务器语义解释模块进行语义解释;服务器把解释出来的语义储存在语义解释命令存储单元,并转发到执行命令模块进行处理;服务器执行完语音命令后,把执行结果存储在执行结果单元;执行结果单元把结果按照顺序(搜索结果是一个链表,链表是有顺序的)通过网络输出到智能设备,由智能设备进行结果播放。
例如:用户想听张学友的《沉默是金》,使用语音命令:播放《沉默是金》,服务器收到智能设备空调采集到的用户的语音信息,进行语义解释,把语义“播放沉默是金”储存在‘存储语义命令解释单元’,并把播放沉默是金的语义转发到执行命令单元。服务器经过一系列的逻辑操作后,把结果保存在执行结果单元,执行结果单元把结果一条条返回到空调进行播放。
其中,当服务器返回的结果是张国荣的《沉默是金》时并不是用户想要的结果,用户再使用补充命令:张学友;服务器接收到张学友,并把预先存储在服务器存储语义解释命令单元的语义取出来,作‘并(&)’运算,重新整理结果解释为:播放张学友的沉默是金,再转发给执行命令单元进行执行,把结果返回到执行结果,由执行结果发送到空调进行播放。
其中,补充‘张学友’这个命令词时不需要再进行唤醒,如果前后两条语音命令能结合则播放结合后的服务器运行的结果,如果前后两条语音命令作‘并’运算并没有结果或者没有可以执行的结果,则播放:没有找到张学友唱的《沉默是金》,并继续前一命令的结果播放;如果再需要使用语音命令只能唤醒再使用。
由于本实施例的空调所实现的处理及功能基本相应于前述图7所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过保留上一次命令,本次命令在上次的执行结果下执行,可以减少语音多余词汇的输入,提高用户体验。
根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图6所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过上一次命令与本次命令的执行并操作,可以提高处理效率,提升用户体验。
根据本发明的实施例,还提供了对应于语音控制方法的一种空调。该空调,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。
由于本实施例的空调所实现的处理及功能基本相应于前述图1至图6所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过在第一次查找的结果里进行第二次查找,第二次查找的范围必然更小,可以提高查询效率,提升用户使用的便捷性。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (11)
1.一种语音控制方法,其特征在于,包括:
在待控设备执行当前语音指令后的设定时长内,获取补充语音指令;
根据所述当前语音指令和所述补充语音指令重新确定新语义关键词,包括:
在所述当前语音指令的基础上对所述补充语音指令进行二次查询,得到所需的新语义关键词;或者,将所述当前语音指令和所述补充语音指令进行合并解析,得到所需的新语义关键词;
按所述新语义关键词执行所述当前语音指令和所述补充语音指令;
还包括:
获取用户对当前语音指令的执行情况的反馈结果;
确定所述反馈结果是否属于设定的满意结果范围;
若所述反馈结果不属于所述满意结果范围,才在待控设备执行当前语音指令后的设定时长内对补充语音指令进行获取;
若所述反馈结果属于所述满意结果范围,则不对补充语音指令进行获取,或者,存储对当前语音指令的执行情况,以在下次获取所述当前语音指令时直接按当前语义关键词执行所述当前语音指令。
2.根据权利要求1所述的方法,其特征在于,其中,
在所述当前语音指令的基础上对所述补充语音指令进行二次查询,包括:
获取所述当前语音指令的当前语义关键词的当前搜索结果,并对所述补充语音指令进行语义解析得到补充语音关键词,在所述当前搜索结果中搜索所述补充语义关键词,得到所需的新语义关键词;
将所述当前语音指令和所述补充语音指令进行合并解析,包括:将所述当前语音指令和所述补充语音指令合并为新语音指令,对所述新语音指令进行语义解析得到所述新语义关键词。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
获取当前语音指令;
确定所述当前语音指令的当前语义关键词并存储;
按所述当前语义关键词执行所述当前语音指令。
4.根据权利要求3所述的方法,其特征在于,确定所述当前语音指令的当前语义关键词,包括:
对所述当前语音指令进行语义解析,得到所述当前语音指令的当前语义关键词;以及,
存储所述当前语义关键词的当前搜索结果。
5.一种语音控制装置,其特征在于,包括:
获取单元,用于在待控设备执行当前语音指令后的设定时长内,获取补充语音指令;
控制单元,用于根据所述当前语音指令和所述补充语音指令重新确定新语义关键词,包括:在所述当前语音指令的基础上对所述补充语音指令进行二次查询,得到所需的新语义关键词;或者,将所述当前语音指令和所述补充语音指令进行合并解析,得到所需的新语义关键词;
所述控制单元,还用于按所述新语义关键词执行所述当前语音指令和所述补充语音指令;
还包括:
所述获取单元,还用于获取用户对当前语音指令的执行情况的反馈结果;
所述控制单元,还用于确定所述反馈结果是否属于设定的满意结果范围;
所述控制单元,还用于若所述反馈结果不属于所述满意结果范围,才在待控设备执行当前语音指令后的设定时长内对补充语音指令进行获取;
所述控制单元,还用于若所述反馈结果属于所述满意结果范围,则不对补充语音指令进行获取,或者,存储对当前语音指令的执行情况,以在下次获取所述当前语音指令时直接按当前语义关键词执行所述当前语音指令。
6.根据权利要求5所述的装置,其特征在于,其中,
所述控制单元在所述当前语音指令的基础上对所述补充语音指令进行二次查询,包括:
获取所述当前语音指令的当前语义关键词的当前搜索结果,并对所述补充语音指令进行语义解析得到补充语音关键词,在所述当前搜索结果中搜索所述补充语义关键词,得到所需的新语义关键词;
所述控制单元将所述当前语音指令和所述补充语音指令进行合并解析,包括:
将所述当前语音指令和所述补充语音指令合并为新语音指令,对所述新语音指令进行语义解析得到所述新语义关键词。
7.根据权利要求5或6所述的装置,其特征在于,还包括:
所述获取单元,还用于获取当前语音指令;
所述控制单元,还用于确定所述当前语音指令的当前语义关键词并存储;
所述控制单元,还用于按所述当前语义关键词执行所述当前语音指令。
8.根据权利要求7所述的装置,其特征在于,所述控制单元确定所述当前语音指令的当前语义关键词,包括:
对所述当前语音指令进行语义解析,得到所述当前语音指令的当前语义关键词;以及,
存储所述当前语义关键词的当前搜索结果。
9.一种空调,其特征在于,包括:如权利要求5-8任一所述的语音控制装置。
10.一种存储介质,其特征在于,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4任一所述的语音控制方法。
11.一种空调,其特征在于,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-4任一所述的语音控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811505077.9A CN109671427B (zh) | 2018-12-10 | 2018-12-10 | 一种语音控制方法、装置、存储介质及空调 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811505077.9A CN109671427B (zh) | 2018-12-10 | 2018-12-10 | 一种语音控制方法、装置、存储介质及空调 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109671427A CN109671427A (zh) | 2019-04-23 |
CN109671427B true CN109671427B (zh) | 2021-02-02 |
Family
ID=66144745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811505077.9A Active CN109671427B (zh) | 2018-12-10 | 2018-12-10 | 一种语音控制方法、装置、存储介质及空调 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109671427B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162176B (zh) * | 2019-05-20 | 2022-04-26 | 北京百度网讯科技有限公司 | 语音指令的挖掘方法和装置终端、计算机可读介质 |
CN110299152A (zh) * | 2019-06-28 | 2019-10-01 | 北京猎户星空科技有限公司 | 人机对话的输出控制方法、装置、电子设备及存储介质 |
CN111179928A (zh) * | 2019-12-30 | 2020-05-19 | 上海欣能信息科技发展有限公司 | 一种基于语音交互的变配电站智能控制方法 |
CN112002315B (zh) * | 2020-07-28 | 2023-12-29 | 珠海格力节能环保制冷技术研究中心有限公司 | 一种语音控制方法、装置、电器设备、存储介质及处理器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504374B2 (en) * | 2009-02-02 | 2013-08-06 | Jerry Lee Potter | Method for recognizing and interpreting patterns in noisy data sequences |
US9224387B1 (en) * | 2012-12-04 | 2015-12-29 | Amazon Technologies, Inc. | Targeted detection of regions in speech processing data streams |
CN106796787A (zh) * | 2014-05-20 | 2017-05-31 | 亚马逊技术有限公司 | 在自然语言处理中使用先前对话行为进行的语境解释 |
CN107146607A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 智能设备交互信息的修正方法、装置及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8359020B2 (en) * | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US10740384B2 (en) * | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
-
2018
- 2018-12-10 CN CN201811505077.9A patent/CN109671427B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504374B2 (en) * | 2009-02-02 | 2013-08-06 | Jerry Lee Potter | Method for recognizing and interpreting patterns in noisy data sequences |
US9224387B1 (en) * | 2012-12-04 | 2015-12-29 | Amazon Technologies, Inc. | Targeted detection of regions in speech processing data streams |
CN106796787A (zh) * | 2014-05-20 | 2017-05-31 | 亚马逊技术有限公司 | 在自然语言处理中使用先前对话行为进行的语境解释 |
CN107146607A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 智能设备交互信息的修正方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109671427A (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109671427B (zh) | 一种语音控制方法、装置、存储介质及空调 | |
KR102315732B1 (ko) | 음성 인식 방법, 디바이스, 장치, 및 저장 매체 | |
CN106250474B (zh) | 一种语音控制的处理方法及系统 | |
CN109360563B (zh) | 一种语音控制方法、装置、存储介质及空调 | |
WO2018021237A1 (ja) | 音声対話装置、音声対話方法、および記録媒体 | |
KR20190024762A (ko) | 음악추천방법, 장치, 디바이스 및 저장매체 | |
CN110069608A (zh) | 一种语音交互的方法、装置、设备和计算机存储介质 | |
CN111949240A (zh) | 交互方法、存储介质、服务程序和设备 | |
CN108882101B (zh) | 一种智能音箱的播放控制方法、装置、设备及存储介质 | |
US20140000441A1 (en) | Information processing apparatus, information processing method, and program | |
CN108962233A (zh) | 用于语音对话平台的语音对话处理方法及系统 | |
US11830482B2 (en) | Method and apparatus for speech interaction, and computer storage medium | |
CN111798833A (zh) | 一种语音测试方法、装置、设备和存储介质 | |
CN109036406A (zh) | 一种语音信息的处理方法、装置、设备和存储介质 | |
CN111178081B (zh) | 语义识别的方法、服务器、电子设备及计算机存储介质 | |
WO2022134110A1 (zh) | 一种语音理解方法及装置 | |
CN112669838A (zh) | 一种智能音箱音频播放方法、装置、电子设备、存储介质 | |
CN106601242A (zh) | 操作事件的执行方法及装置、终端 | |
CN112185379A (zh) | 一种语音交互的方法、装置、电子设备及存储介质 | |
CN115148212A (zh) | 一种语音交互方法、智能设备及系统 | |
JP3795350B2 (ja) | 音声対話装置、音声対話方法及び音声対話処理プログラム | |
CN111310059B (zh) | 基于聚合资源的用户意图定位方法和装置 | |
CN109065018B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
CN109960489B (zh) | 生成智能问答系统的方法、装置、设备、介质及问答系统 | |
US11114079B2 (en) | Interactive music audition method, apparatus and terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |