CN113380241B - 语义交互的调整方法、装置、语音设备及存储介质 - Google Patents

语义交互的调整方法、装置、语音设备及存储介质 Download PDF

Info

Publication number
CN113380241B
CN113380241B CN202110559830.8A CN202110559830A CN113380241B CN 113380241 B CN113380241 B CN 113380241B CN 202110559830 A CN202110559830 A CN 202110559830A CN 113380241 B CN113380241 B CN 113380241B
Authority
CN
China
Prior art keywords
target object
time
voice control
round
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110559830.8A
Other languages
English (en)
Other versions
CN113380241A (zh
Inventor
邹佳悦
李绍斌
宋德超
贾巨涛
吴伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202110559830.8A priority Critical patent/CN113380241B/zh
Publication of CN113380241A publication Critical patent/CN113380241A/zh
Application granted granted Critical
Publication of CN113380241B publication Critical patent/CN113380241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明实施例提供了一种语义交互的调整方法、装置、语音设备及存储介质,所述方法包括:确定目标对象,获取所述目标对象相邻轮次的语音控制指令;确定所述目标对象相邻轮次的语音控制指令的时间差;基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。如此可以实现根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。

Description

语义交互的调整方法、装置、语音设备及存储介质
技术领域
本发明实施例涉及人机交互技术领域,尤其涉及一种语义交互的调整方法、装置、语音设备及存储介质。
背景技术
随着物联网技术的快速发展,物联网产品走进了千家万户,智能家居通过物联网技术,已实现将各种智能家居设备连接到一起。其中,语音交互逐渐成为一种重要的控制方式,用来控制各种智能家居设备。
以往的语音交互大多基于单轮语义交互,用户无法实现智能家居设备的连续唤醒。为此,多轮语义交互应运而生。目前,多轮语义交互的控制时间大都由人为设置。
由于不同用户的行为习惯不同,人为设置多轮语义交互的控制时间,容易将多轮语义交互的控制时间设置的过长或过短,无法满足不同用户对智能家居设备的控制需求,影响用户的体验。
发明内容
为了解决上述由于不同用户的行为习惯不同,人为设置多轮语义交互的控制时间,容易将多轮语义交互的控制时间设置的过长或过短,无法满足不同用户对智能家居设备的控制需求,影响用户的体验的技术问题,本发明实施例提供了一种语义交互的调整方法、装置、语音设备及存储介质。
在本发明实施例的第一方面,首先提供了一种语义交互的调整方法,所述方法包括:
确定目标对象,获取所述目标对象相邻轮次的语音控制指令;
确定所述目标对象相邻轮次的语音控制指令的时间差;
基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
在一个可选的实施方式中,所述确定所述目标对象相邻轮次的语音控制指令的时间差,包括:
判断所述目标对象相邻轮次的语音控制指令控制的设备是否相同;
若所述目标对象相邻轮次的语音控制指令控制的设备相同,则确定所述目标对象相邻轮次的语音控制指令的时间差。
在一个可选的实施方式中,所述判断所述目标对象相邻轮次的语音控制指令控制的设备是否相同,包括:
将所述目标对象相邻轮次的语音控制指令转换为文本控制指令,提取所述文本控制指令中的关键字;
若所述文本控制指令中的所述关键字包含相同关键字,则确定所述目标对象相邻轮次的语音控制指令控制的设备相同;
若所述文本控制指令中的所述关键字未包含相同关键字,则确定所述目标对象相邻轮次的语音控制指令控制的设备不同。
在一个可选的实施方式中,所述确定所述目标对象相邻轮次的语音控制指令的时间差,包括:
确定所述目标对象相邻轮次的语音控制指令的接收时刻,确定所述接收时刻之间的时差;
确定所述接收时刻之间的所述时差,为所述目标对象相邻轮次的语音控制指令的时间差。
在一个可选的实施方式中,所述基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间,包括:
统计所述目标对象相邻轮次的语音控制指令的所述时间差对应的数量,并判断所述数量是否超过预设数量阈值;
在所述数量超过所述预设数量阈值的情况下,基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
在一个可选的实施方式中,所述基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间,包括:
确定所述目标对象相邻轮次的语音控制指令的所述时间差对应的平均值以及方差;
通过所述平均值以及所述方差,预测多轮语义交互的第一控制时间;
获取所述多轮语义交互的预设控制时间,将所述多轮语义交互的所述预设控制时间调整为所述第一控制时间。
在一个可选的实施方式中,所述通过所述平均值以及所述方差,预测多轮语义交互的第一控制时间,包括:
将所述平均值以及所述方差对应的标准差输入至控制时间预测模型,获取所述控制时间预测模型输出的第一控制时间;
其中,所述控制时间预测模型包括:
所述t包括所述第一控制时间,所述包括所述平均值,所述N包括正整数,所述σ包括所述方差对应的标准差。
在一个可选的实施方式中,所述方法还包括:
获取所述目标对象输入的所述多轮语义交互的第二控制时间,将所述多轮语义交互的所述第一控制时间调整为所述第二控制时间。
在本发明实施例的第二方面,提供了一种语义交互的调整装置,所述装置包括:
指令获取模块,用于确定目标对象,获取所述目标对象相邻轮次的语音控制指令;
时间差确定模块,用于确定所述目标对象相邻轮次的语音控制指令的时间差;
时间调整模块,用于基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
在本发明实施例的第三方面,还提供了一种语音设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中所述的语义交互的调整方法。
在本发明实施例的第四方面,还提供了一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面中所述的语义交互的调整方法。
在本发明实施例的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面中所述的语义交互的调整方法。
本发明实施例提供的技术方案,确定目标对象,获取目标对象相邻轮次的语音控制指令,确定目标对象相邻轮次的语音控制指令的时间差,基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。通过目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间,如此可以实现根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中示出的一种语义交互的调整方法的实施流程示意图;
图2为本发明实施例中示出的另一种语义交互的调整方法的实施流程示意图;
图3为本发明实施例中示出的一种多轮语义交互效果示意图;
图4为本发明实施例中示出的另一种语义交互的调整方法的实施流程示意图;
图5为本发明实施例中示出的一种用户自主调整语义交互的效果示意图;
图6为本发明实施例中示出的一种语义交互的调整装置的结构示意图;
图7为本发明实施例中示出的一种语音设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在用户有进行多轮语义交互需求的前提下,由于每个用户的行为习惯各不相同,当用户通过智能家居设备(例如空调)控制其他智能家居设备时,用户发出语音控制指令,并在接收到智能家居设备(例如空调)的回复的情况下,会进行不同长度时间的思考,这个思考时间或长或短,即此轮语义交互的控制时间和下一轮语义交互的控制时间或长或短。
当人为设置多轮语义交互的控制时间时,人为设置的多轮语义交互的控制时间过短,用户可能存在着思考时间过长,超出多轮语义交互的控制时间范围的情况。此时用户再发出下一次语音控制指令,由于超出多轮语义交互的控制时间范围,用户不能进行多轮语义交互,从而不能控制其它智能家居设备,届时用户的体验会变差。
而人为设置的多轮语义交互的控制时间过长,用户习惯于接收到智能家居设备(例如空调)的回复时,希望快速对智能家居设备进行控制,或者存在着用户控制其他智能家居设备的需求,此时将多轮语义交互的控制时间设置的过长则显得十分不合理,影响用户体验。基于此,本发明实施例基于用户行为习惯,提出一种语义交互的调整方法。
如图1所示,为本发明实施例提供的一种语义交互的调整方法的实施流程示意图,该方法应用于处理器,具体可以包括以下步骤:
S101,确定目标对象,获取所述目标对象相邻轮次的语音控制指令。
在目标对象(例如用户)有进行多轮语义交互需求的前提下,会与目标设备进行多轮(这里多轮指的是两轮及以上)语义交互,以此来控制智能家居设备。例如在智能家居场景中,用户唤醒空调之后,希望通过空调控制电暖气、智能灯具、电视等,从而与空调进行多轮语义交互。
基于此,在本发明实施例中,确定目标场景中的目标对象,这里目标对象可以是一个用户,也可以是两个及以上的用户,或者出于安全考虑,也可以是两个及以上有权限的用户(这里可以通过声纹识别两个及以上有权限的用户),从而获取目标对象相邻轮次的语音控制指令。
例如,在智能家居场景中,用户A唤醒空调(当然还可以是智能音箱、电视、智慧屏等任何可以以语音控制指令为交互方式的产品)之后,用户A、用户B与空调进行多轮语义交互,从而确定智能家居场景中的用户A、用户B,获取用户A、用户B相邻轮次的语音控制指令,即用户A第一轮次的语音控制指令与用户B第二轮次的语音控制指令,用户B第二轮次的语音控制指令与用户A第三轮次的语音控制指令等等。
例如,在智能家居场景中,用户A唤醒空调(当然还可以是智能音箱、电视、智慧屏等任何可以以语音控制指令为交互方式的产品)之后,用户A与空调进行多轮语义交互,从而确定智能家居场景中的用户A,获取用户A相邻轮次的语音控制指令,即用户A第一轮次的语音控制指令与用户A第二轮次的语音控制指令,用户A第二轮次的语音控制指令与用户A第三轮次的语音控制指令等等。
S102,确定所述目标对象相邻轮次的语音控制指令的时间差。
对于目标对象相邻轮次的语音控制指令,确定目标场景中的目标对象相邻轮次的语音控制指令的时间差。例如,以用户A第一轮次的语音控制指令与用户B第二轮次的语音控制指令为例,确定用户A第一轮次的语音控制指令与用户B第二轮次的语音控制指令的时间差。
例如,以用户A第一轮次的语音控制指令与用户A第二轮次的语音控制指令为例,确定用户A第一轮次的语音控制指令与用户A第二轮次的语音控制指令的时间差。
S103,基于所述目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
对于目标对象相邻轮次的语音控制指令的时间差,代表了用户行为习惯(即用户思考时间),本发明实施例基于目标对象相邻轮次的语音控制指令的时间差,调整多轮(这里指两轮及以上)语义交互的控制时间。
如此根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。
需要说明的是,在目标对象为一个用户的情况下,则目标对象相邻轮次的语音控制指令的时间差,代表了这个用户自身的行为习惯(即这个用户的思考时间),则基于目标对象相邻轮次的语音控制指令的时间差,调整该目标对象对应的多轮语义交互的控制时间。
例如,在目标对象为用户A的情况下,则目标对象相邻轮次的语音控制指令的时间差,表征用户A自身的行为习惯(即用户A的思考时间),则基于目标对象相邻轮次的语音控制指令的时间差,调整该目标对象(即用户A)对应的多轮语义交互的控制时间。
而在目标对象为两个及以上用户、或两个及以上有权限的用户的情况下,则目标对象相邻轮次的语音控制指令的时间差,表征目标场景下两个及以上用户、或两个及以上有权限的用户的行为习惯,则基于目标对象相邻轮次的语音控制指令的时间差,调整目标场景对应的多轮语义交互的控制时间。
例如,在目标对象为用户A、用户B的情况下,则目标对象相邻轮次的语音控制指令的时间差,表征智能家居场景下用户A、用户B的行为习惯,用户A、用户B同属于一个家庭,则基于目标对象相邻轮次的语音控制指令的时间差,调整智能家居场景(即该家庭)对应的多轮语义交互的控制时间。
通过上述对本发明实施例提供的技术方案的描述,确定目标对象,获取目标对象相邻轮次的语音控制指令,确定目标对象相邻轮次的语音控制指令的时间差,基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
通过目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间,如此可以实现根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。
如图2所示,为本发明实施例提供的另一种语义交互的调整方法的实施流程示意图,该方法应用于处理器,具体可以包括以下步骤:
S201,确定目标对象,获取所述目标对象相邻轮次的语音控制指令。
在目标对象(例如用户)有进行多轮语义交互需求的前提下,会与目标设备进行多轮语义交互,以此来控制智能家居设备。例如在智能家居场景中,用户唤醒空调之后,希望通过空调控制电暖气,从而与空调进行多轮语义交互,其中,用户与空调进行多轮语义交互的过程,如图3所示。
基于此,在本发明实施例中,确定目标场景(例如智能家居场景、智能家居设备控制的场景)中的目标对象(例如用户),获取目标对象(例如用户)相邻轮次的语音控制指令。这里目标对象(例如用户)相邻轮次的语音控制指令,例如可以是如图2所示的用户第一轮次的语音控制指令与第二轮次的语音控制指令,用户第二轮次的语音控制指令与第三轮次的语音控制指令等等。
例如,在智能家居场景中,用户A唤醒空调(当然还可以是智能音箱、电视、智慧屏等任何可以以语音控制指令为交互方式的产品)之后,与空调进行多轮语义交互,从而确定智能家居场景中的用户A,获取用户A相邻轮次的语音控制指令,即用户A第一轮次的语音控制指令与第二轮次的语音控制指令,用户A第二轮次的语音控制指令与第三轮次的语音控制指令等等,用户A相邻轮次的语音控制指令如下表1所示。
表1
需要说明的是,对于不同用户的语音控制指令,分别进行存储,可以以Key-Value的形式存储,以便于在确定目标对象之后,根据目标对象的对象标识(例如用户名称、用户ID等),获取目标对象(例如用户)相邻轮次的语音控制指令。
对于确定目标场景中的目标对象的实现方式,可以由人为指定,或者在目标场景中,当接收到语音控制指令时,确定该语音控制指令的发出者为目标场景中的目标对象,本发明实施例对此不作限定。
S202,判断所述目标对象相邻轮次的语音控制指令控制的设备是否相同。
对于目标场景中的目标对象,在目标对象前后控制的设备是同一设备的情况下,才进入到多轮语义交互的逻辑中。例如,用户第一次想要通过空调控制电暖气,之后想要通过空调控制加湿器,由于前后控制的设备并非是同一设备,因此不会进入到多轮语义交互的逻辑中。
基于此,对于目标对象相邻轮次的语音控制指令,判断目标对象相邻轮次的语音控制指令控制的设备是否相同,根据判断结果可以知道目标对象与目标设备之间的交互是否属于多轮语义交互,意味着目标对象相邻轮次的语音控制指令控制的设备相同,目标对象与目标设备之间的交互属于多轮语义交互。
例如,对于用户A相邻轮次的语音控制指令,如上述表1所示,由此可知,用户A第一轮次的语音控制指令与第二轮次的语音控制指令,控制的设备为同一设备(电暖气),说明用户A与空调之间的交互属于多轮语义交互;
用户A第二轮次的语音控制指令与第三轮次的语音控制指令,控制的设备为同一设备(电暖气),说明用户A与空调之间的交互属于多轮语义交互,对于用户A其它相邻轮次的语音控制指令,处理与上述类似,本发明实施例在此不再一一赘述。
S203,若所述目标对象相邻轮次的语音控制指令控制的设备相同,则确定所述目标对象相邻轮次的语音控制指令的时间差。
对于目标对象相邻轮次的语音控制指令,在目标对象相邻轮次的语音控制指令控制的设备相同的情况下,说明目标对象与目标设备之间的交互属于多轮语义交互,意味着在此情况下进入到多轮语义交互的逻辑中,由此可以确定目标场景中的目标对象相邻轮次的语音控制指令的时间差。
对于目标对象相邻轮次的语音控制指令,在目标对象相邻轮次的语音控制指令控制的设备不同的情况下,说明目标对象与目标设备之间的交互非多轮语义交互,意味着在此情况下未进入到多轮语义交互的逻辑中,由此可以舍弃此次目标对象相邻轮次的语音控制指令,意味着对于此次目标对象相邻轮次的语音控制指令,不再参与多轮语义交互的控制时间的调整。
例如,以用户A第一轮次的语音控制指令与第二轮次的语音控制指令为例,在用户A第一轮次的语音控制指令与第二轮次的语音控制指令,控制的设备均为同一设备(电暖气)的情况下,说明用户A与空调的交互属于多轮语义交互,意味着在此情况下进入到多轮语义交互的逻辑中,由此可以确定用户A第一轮次的语音控制指令与第二轮次的语音控制指令之间的时间差,即“XX空调,打开电暖气”与“电暖气1”之间的时间差。
例如,以用户A第三轮次的语音控制指令与第四轮次的语音控制指令为例,在用户A第三轮次的语音控制指令与第四轮次的语音控制指令,控制的设备非同一设备(电暖气)的情况下,说明用户A与空调的交互非多轮语义交互,意味着在此情况下未进入到多轮语义交互的逻辑中,由此可以舍弃此次用户A第三轮次的语音控制指令与第四轮次的语音控制指令,意味着对于此次用户A第三轮次的语音控制指令与第四轮次的语音控制指令,不再参与多轮语义交互的控制时间的调整。
S204,基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
对于目标对象相邻轮次的语音控制指令的时间差,代表了用户行为习惯(即用户思考时间),本发明实施例基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
如此根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。
例如,对于用户A相邻轮次的语音控制指令的时间差,如下表2所示,代表了用户A行为习惯(即用户思考时间),基于用户A相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
表2
通过上述对本发明实施例提供的技术方案的描述,确定目标对象,获取目标对象相邻轮次的语音控制指令,判断目标对象相邻轮次的语音控制指令控制的设备是否相同,若目标对象相邻轮次的语音控制指令控制的设备相同,则确定目标对象相邻轮次的语音控制指令的时间差,基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
通过目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间,如此可以实现根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。
此外通过判断目标对象相邻轮次的语音控制指令控制的设备是否相同,如果目标对象相邻轮次的语音控制指令控制的设备相同,则基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间,可以达到精确调整多轮语义交互的控制时间的目的。
如图4所示,为本发明实施例提供的另一种语义交互的调整方法的实施流程示意图,该方法应用于处理器,具体可以包括以下步骤:
S401,确定目标对象,获取所述目标对象相邻轮次的语音控制指令。
在本发明实施例中,本步骤与上述步骤S201类似,本发明实施例在此不再一一赘述。
S402,判断所述目标对象相邻轮次的语音控制指令控制的设备是否相同。
对于目标对象相邻轮次的语音控制指令,在本发明实施例中可以将目标对象相邻轮次的语音控制指令转换为文本控制指令,提取文本控制指令中的关键字,若文本控制指令中的关键字包含相同关键字,则确定目标场景中的目标对象相邻轮次的语音控制指令控制的设备相同,若文本控制指令中的关键字未包含相同关键字,则确定目标场景中的目标对象相邻轮次的语音控制指令控制的设备不同。
例如,以用户A第一轮次的语音控制指令与第二轮次的语音控制指令为例,将用户A第一轮次的语音控制指令与第二轮次的语音控制指令转换为文本控制指令,如上述表1所示的“XX空调,打开电暖气”、“电暖气1”,提取文本控制指令中的关键字,如下述表3所示。
表3
由上述表3可知,文本控制指令中的关键字包含相同关键字(电暖气),则确定用户A第一轮次的语音控制指令与第二轮次的语音控制指令,两者控制的设备为同一设备(电暖气)。而当文本控制指令中的关键字未包含相同关键字(电暖气)时,说明用户A第一轮次的语音控制指令与第二轮次的语音控制指令,控制的设备非同一设备(电暖气)。
S403,若所述目标对象相邻轮次的语音控制指令控制的设备相同,则确定所述目标对象相邻轮次的语音控制指令的时间差。
对于目标对象相邻轮次的语音控制指令,在目标对象相邻轮次的语音控制指令控制的设备相同的情况下,说明目标对象与目标设备之间的交互属于多轮语义交互,意味着在此情况下进入到多轮语义交互的逻辑中,由此可以确定目标对象相邻轮次的语音控制指令的接收时刻,确定接收时刻之间的时差,确定接收时刻之间的时差,为目标对象相邻轮次的语音控制指令的时间差。
例如,以用户A第一轮次的语音控制指令与第二轮次的语音控制指令为例,在确定用户A第一轮次的语音控制指令与第二轮次的语音控制指令,两者控制的设备为同一设备(电暖气)的情况下,说明用户A与空调(当然还可以是智能音箱、电视、智慧屏等任何可以以语音控制指令为交互方式的产品)的交互属于多轮语义交互,意味着在此情况下进入到多轮语义交互的逻辑中,由此可以确定用户A第一轮次的语音控制指令的接收时刻T1,确定用户A第二轮次的语音控制指令的接收时刻T2,确定接收时刻T1与接收时刻T2之间的时差T,确定接收时刻T1与接收时刻T2之间的时差T,为用户A第一轮次的语音控制指令与第二轮次的语音控制指令之间的时间差。
S404,统计所述目标对象相邻轮次的语音控制指令的所述时间差对应的数量,并判断所述数量是否超过预设数量阈值。
对于目标对象相邻轮次的语音控制指令的时间差,在本发明实施例中统计其对应的数量,并判断该数量是否超过预设数量阈值,即在累积到N(这里是正整数)个目标对象相邻轮次的语音控制指令的时间差之后,判断N是否超过预设数量阈值。
例如,对于用户A相邻轮次的语音控制指令的时间差,在累积到N个用户A相邻轮次的语音控制指令的时间差之后,如下表4所示,判断N是否超过预设数量阈值(例如10),即确定是否累积到10个及以上的用户A相邻轮次的语音控制指令的时间差。
表4
S405,在所述数量超过所述预设数量阈值的情况下,基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
对于目标对象相邻轮次的语音控制指令的时间差,在其对应的数量超过预设数量阈值的情况下,基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间,意味着在累积到N(这里是正整数)个目标对象相邻轮次的语音控制指令的时间差之后,且N超过预设数量阈值,可以基于这N(这里是正整数)个目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
需要说明的是,这里N的取样是随着目标对象(例如用户)与目标设备的不断交互(多轮语义交互)而动态变化的。例如随着时间的推移,目标对象(例如用户)与目标设备之间不断的交互(多轮语义交互),N的取样是逐渐递增的。
由此在累积到N(这里是正整数)个目标对象相邻轮次的语音控制指令的时间差之后,且N超过预设数量阈值,可以从中抽取最新的M(这里是正整数,小于或者等于N,例如10)个目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
此外,对于目标对象相邻轮次的语音控制指令的时间差,在其对应的数量未超过预设数量阈值的情况下,意味着在累积到N(这里是正整数)个目标对象相邻轮次的语音控制指令的时间差之后,这里N未超过预设数量阈值,说明样本不足,此时可以重复执行上述步骤S301~S304,以便于使N超过预设数量阈值,从而基于这N(这里是正整数)或者上述M个目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
其中,在本发明实施例中,具体可以通过以下方式调整多轮语义交互的控制时间:确定目标对象相邻轮次的语音控制指令的时间差对应的平均值以及方差,意味着确定N(这里是正整数,且超过预设数量阈值)或者上述M个目标对象相邻轮次的语音控制指令的时间差对应的平均值以及方差,通过平均值以及方差,预测多轮语义交互的第一控制时间,获取多轮语义交互的预设控制时间,将多轮语义交互的预设控制时间调整为第一控制时间。
例如,在累积到N个用户A相邻轮次的语音控制指令的时间差之后,如上述表4所示,确定这N个用户A相邻轮次的语音控制指令的时间差对应的平均值以及方差,其中,将这N个用户A相邻轮次的语音控制指令的时间差代入如下正态分布公式中,获得方差σ2,通过平均值以及方差,预测多轮语义交互的第一控制时间(例如2分钟),获取多轮语义交互的预设控制时间(例如2.5分钟),将多轮语义交互的预设控制时间调整为第一控制时间,如此实现多轮语义交互的控制时间的自动调整。
需要说明的是,对于多轮语义交互的预设控制时间,在未获得用户行为习惯的前提下,可以根据人为经验原先设置,例如2分钟,从而后续在获得用户行为习惯(即目标对象相邻轮次的语音控制指令的时间差)后,根据用户行为习惯,调整多轮语义交互的控制时间。
对于目标对象相邻轮次的语音控制指令的时间差对应的平均值以及方差,即N(这里是正整数)或者上述M个目标对象相邻轮次的语音控制指令的时间差对应的平均值以及方差,可以将该平均值以及方差对应的标准差(即方差的算术平方根)输入至控制时间预测模型,获取控制时间预测模型输出的第一控制时间,其中,控制时间预测模型包括:
所述t包括所述第一控制时间,所述包括所述平均值,所述N包括正整数,所述σ包括所述方差对应的标准差。这里N例如可以是3,则控制时间预测模型可以包括:
需要说明的是,这里认为用户的思考时间发生在平均值的可能性最大,并且思考时间如正态分布一样,越远离平均值,其发生的概率越小。当控制时间大于其发生的概率极低,即用户会有很小的概率思考这么长时间,所以设置的控制时间满足该用户的大多数思考时间即可。后续在用户进行多轮语义交互的过程中,当用户的多轮语义交互时间差大于/>退出多轮语义交互的判断策略,此时不再进行多轮语义交互。
此外,目标对象(例如用户)可以通过App主动调整多轮语义交互的控制时间,来满足不同用户群体的需求。当用户在APP上输入多轮语义交互的控制时间,可以通过App直接将多轮语义交互的控制时间传输到处理器中,从而处理器据此调整多轮语义交互的控制时间。
基于此,获取目标对象输入的多轮语义交互的第二控制时间,即目标对象在App上输入多轮语义交互的第二控制时间,App将多轮语义交互的第二控制时间传输至处理器,由处理器获取目标对象输入的多轮语义交互的第二控制时间,从而将多轮语义交互的第一控制时间调整为第二控制时间,实现目标对象自主调整多轮语义交互的控制时间,满足不同用户群体的需求。
例如,如图5所示,用户A在App上输入多轮语义交互的第二控制时间1.5分钟,App将多轮语义交互的第二控制时间传输至空调中的处理器,由处理器获取用户A输入的多轮语义交互的第二控制时间,从而将多轮语义交互的第一控制时间(2分钟)调整为第二控制时间,实现用户A自主调整多轮语义交互的控制时间。
通过上述对本发明实施例提供的技术方案的描述,确定目标对象,获取目标对象相邻轮次的语音控制指令,判断目标对象相邻轮次的语音控制指令控制的设备是否相同,若目标对象相邻轮次的语音控制指令控制的设备相同,则确定目标对象相邻轮次的语音控制指令的时间差,基于目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间。
通过目标对象相邻轮次的语音控制指令的时间差,调整多轮语义交互的控制时间,如此可以实现根据用户行为习惯自动调整多轮语义交互的控制时间,从而避免将多轮语义交互的控制时间设置的过长或过短,满足了不同用户对智能家居设备的控制需求,提高了用户的体验。并且实现目标对象自主调整多轮语义交互的控制时间,满足不同用户群体的需求。
与上述方法实施例相对应,本发明实施例还提供了一种语义交互的调整装置,如图6所示,该装置可以包括:指令获取模块610、时间差确定模块620、时间调整模块630。
指令获取模块610,用于确定目标对象,获取所述目标对象相邻轮次的语音控制指令;
时间差确定模块620,用于确定所述目标对象相邻轮次的语音控制指令的时间差;
时间调整模块630,用于基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
本发明实施例还提供了一种语音设备(例如空调、智能音箱、电视、智慧屏等任何可以以语音控制指令为交互方式的产品),如图7所示,包括处理器71、通信接口72、存储器73和通信总线74,其中,处理器71,通信接口72,存储器73通过通信总线74完成相互间的通信,
存储器73,用于存放计算机程序;
处理器71,用于执行存储器73上所存放的程序时,实现如下步骤:
确定目标对象,获取所述目标对象相邻轮次的语音控制指令;确定所述目标对象相邻轮次的语音控制指令的时间差;基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
上述语音设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述语音设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种存储介质,该存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的语义交互的调整方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的语义交互的调整方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在存储介质中,或者从一个存储介质向另一个存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (9)

1.一种语义交互的调整方法,其特征在于,所述方法包括:
确定目标对象,获取所述目标对象相邻轮次的语音控制指令;
确定所述目标对象相邻轮次的语音控制指令的时间差;
基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间,包括:确定所述目标对象相邻轮次的语音控制指令的所述时间差对应的平均值以及方差;通过所述平均值以及所述方差,预测多轮语义交互的第一控制时间;获取所述多轮语义交互的预设控制时间,将所述多轮语义交互的所述预设控制时间调整为所述第一控制时间;
所述通过所述平均值以及所述方差,预测多轮语义交互的第一控制时间,包括:将所述平均值以及所述方差对应的标准差输入至控制时间预测模型,获取所述控制时间预测模型输出的第一控制时间;其中,所述控制时间预测模型包括:
所述t为所述第一控制时间,所述为所述平均值,所述N为正整数,所述σ为所述方差对应的标准差。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标对象相邻轮次的语音控制指令的时间差,包括:
判断所述目标对象相邻轮次的语音控制指令控制的设备是否相同;
若所述目标对象相邻轮次的语音控制指令控制的设备相同,则确定所述目标对象相邻轮次的语音控制指令的时间差。
3.根据权利要求2所述的方法,其特征在于,所述判断所述目标对象相邻轮次的语音控制指令控制的设备是否相同,包括:
将所述目标对象相邻轮次的语音控制指令转换为文本控制指令,提取所述文本控制指令中的关键字;
若所述文本控制指令中的所述关键字包含相同关键字,则确定所述目标对象相邻轮次的语音控制指令控制的设备相同;
若所述文本控制指令中的所述关键字未包含相同关键字,则确定所述目标对象相邻轮次的语音控制指令控制的设备不同。
4.根据权利要求1所述的方法,其特征在于,所述确定所述目标对象相邻轮次的语音控制指令的时间差,包括:
确定所述目标对象相邻轮次的语音控制指令的接收时刻,确定所述接收时刻之间的时差;
确定所述接收时刻之间的所述时差,为所述目标对象相邻轮次的语音控制指令的时间差。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间,包括:
统计所述目标对象相邻轮次的语音控制指令的所述时间差对应的数量,并判断所述数量是否超过预设数量阈值;
在所述数量超过所述预设数量阈值的情况下,基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标对象输入的所述多轮语义交互的第二控制时间,将所述多轮语义交互的所述第一控制时间调整为所述第二控制时间。
7.一种语义交互的调整装置,其特征在于,所述装置包括:
指令获取模块,用于确定目标对象,获取所述目标对象相邻轮次的语音控制指令;
时间差确定模块,用于确定所述目标对象相邻轮次的语音控制指令的时间差;
时间调整模块,用于基于所述目标对象相邻轮次的语音控制指令的所述时间差,调整多轮语义交互的控制时间,包括:确定所述目标对象相邻轮次的语音控制指令的所述时间差对应的平均值以及方差;通过所述平均值以及所述方差,预测多轮语义交互的第一控制时间;获取所述多轮语义交互的预设控制时间,将所述多轮语义交互的所述预设控制时间调整为所述第一控制时间;
所述通过所述平均值以及所述方差,预测多轮语义交互的第一控制时间,包括:将所述平均值以及所述方差对应的标准差输入至控制时间预测模型,获取所述控制时间预测模型输出的第一控制时间;其中,所述控制时间预测模型包括:
所述t为所述第一控制时间,所述为所述平均值,所述N为正整数,所述σ为所述方差对应的标准差。
8.一种语音设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1至6中任一项所述的方法。
9.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的方法。
CN202110559830.8A 2021-05-21 2021-05-21 语义交互的调整方法、装置、语音设备及存储介质 Active CN113380241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110559830.8A CN113380241B (zh) 2021-05-21 2021-05-21 语义交互的调整方法、装置、语音设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110559830.8A CN113380241B (zh) 2021-05-21 2021-05-21 语义交互的调整方法、装置、语音设备及存储介质

Publications (2)

Publication Number Publication Date
CN113380241A CN113380241A (zh) 2021-09-10
CN113380241B true CN113380241B (zh) 2024-03-08

Family

ID=77571695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110559830.8A Active CN113380241B (zh) 2021-05-21 2021-05-21 语义交互的调整方法、装置、语音设备及存储介质

Country Status (1)

Country Link
CN (1) CN113380241B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114356275B (zh) * 2021-12-06 2023-12-29 上海小度技术有限公司 交互控制方法、装置、智能语音设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110931018A (zh) * 2019-12-03 2020-03-27 珠海格力电器股份有限公司 智能语音交互的方法、装置及计算机可读存储介质
CN110992948A (zh) * 2019-11-18 2020-04-10 上海博泰悦臻电子设备制造有限公司 基于多轮语音交互的餐厅预订方法及终端
CN111429895A (zh) * 2018-12-21 2020-07-17 广东美的白色家电技术创新中心有限公司 多轮交互的语义理解方法、装置及计算机存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK201970510A1 (en) * 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111429895A (zh) * 2018-12-21 2020-07-17 广东美的白色家电技术创新中心有限公司 多轮交互的语义理解方法、装置及计算机存储介质
CN110992948A (zh) * 2019-11-18 2020-04-10 上海博泰悦臻电子设备制造有限公司 基于多轮语音交互的餐厅预订方法及终端
CN110931018A (zh) * 2019-12-03 2020-03-27 珠海格力电器股份有限公司 智能语音交互的方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN113380241A (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN108447480B (zh) 智能家居设备控制的方法、智能语音终端和网络设备
US20190286834A1 (en) Centralized throttling service
CN109190070B (zh) 一种数据处理方法、装置、系统及应用服务器
CN108173905B (zh) 一种资源配置方法、装置及电子设备
CN109274567B (zh) 一种波特率的自适应方法及系统
CN108647240B (zh) 一种统计访问量的方法、装置、电子设备及存储介质
CN113380241B (zh) 语义交互的调整方法、装置、语音设备及存储介质
CN113465141B (zh) 一种新风系统控制方法、装置、电子设备及存储介质
CN111291252B (zh) 一种每秒查询率的调整方法、装置、电子设备及存储介质
CN108762846B (zh) 插件化实时推荐方法、服务器及计算机可读存储介质
CN111598139A (zh) 数据处理方法及系统
CN113568717A (zh) 一种设备控制方法、装置、服务器以及介质
CN113777941B (zh) 设备运行控制方法、装置、设备及存储介质
CN112631963B (zh) 缓存数据管理方法、装置、设备及存储介质
WO2021143287A1 (zh) 服务调度方法、装置、电子设备及存储介质
CN112100203B (zh) 一种控制方法、装置、家电设备及存储介质
EP4096187A1 (en) Method and apparatus for managing internet of things device
CN110708370B (zh) 一种数据处理方法及终端
CN113835905B (zh) 一种消息队列负载均衡方法、装置、电子设备及介质
CN111415191B (zh) 一种用户分类方法、装置、电子设备及存储介质
CN111126572B (zh) 一种模型参数处理方法、装置、电子设备及存储介质
CN112311823B (zh) 审核系统的流量控制方法、装置和服务器
CN111757444A (zh) 一种适用于5g场景的基站休眠方法、装置、设备及介质
CN110581842A (zh) Dns请求的处理方法及服务器
CN112484260B (zh) 湿度控制方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant