CN113990318A - 控制方法、装置、车载终端、车辆和存储介质 - Google Patents

控制方法、装置、车载终端、车辆和存储介质 Download PDF

Info

Publication number
CN113990318A
CN113990318A CN202111265003.4A CN202111265003A CN113990318A CN 113990318 A CN113990318 A CN 113990318A CN 202111265003 A CN202111265003 A CN 202111265003A CN 113990318 A CN113990318 A CN 113990318A
Authority
CN
China
Prior art keywords
voice control
control instruction
instruction
sound source
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111265003.4A
Other languages
English (en)
Inventor
李洁辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Rox Intelligent Technology Co Ltd
Original Assignee
Shanghai Rox Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Rox Intelligent Technology Co Ltd filed Critical Shanghai Rox Intelligent Technology Co Ltd
Priority to CN202111265003.4A priority Critical patent/CN113990318A/zh
Publication of CN113990318A publication Critical patent/CN113990318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种控制方法、装置、车载终端、车辆和存储介质。该控制方法包括:接收从客户端输入的第一语音控制指令;根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。采用本申请提供的控制方法,可以提高驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。

Description

控制方法、装置、车载终端、车辆和存储介质
技术领域
本申请涉及自动控制领域,具体涉及一种控制方法、装置、车载终端、车辆和存储介质。
背景技术
随着汽车智能化的发展,驾乘人员(驾驶员以及坐在汽车中的其他人员等)可以通过准确的语音指令对车内的设备(例如可以是座椅、空调、车窗、阅读灯和分区音响等)进行控制。随着车内各种设备的增多,控制各种设备的语音指令也越来越复杂,需要驾乘人员都必须掌握完整的操作指令才能有效控制设备。
驾乘人员对车内各设备的每次操作都需要其输入语义完整的语音指令,该完整的指令中必须包括控制的对象,以及控制对象需要执行的动作,以控制车内的各设备,例如,输入语音“打开主驾驶位置的车窗”,即可打开主驾驶位置的车窗,若此时副驾驶的驾乘人员也要打开副驾驶的车窗,则需要副驾驶的驾乘人员也输入完整的语音,例如“打开副驾驶位置的车窗”,如此导致驾乘人员对之前操作过的同种类型的控制对象的二次操作不够智能、简便和高效。
发明内容
本申请实施例的目的是提供一种控制方法、装置、车载终端、车辆和存储介质,以提高驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
本申请的技术方案如下:
第一方面,提供了一种控制方法,该方法包括:
接收从客户端输入的第一语音控制指令;
根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;
在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;
其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。
第二方面,提供了一种控制装置,该装置包括:
接收模块,用于接收从客户端输入的第一语音控制指令;
第一确定模块,用于根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;
控制模块,用于在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现本申请实施例任一所述的控制方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现本申请实施例任一所述的控制方法的步骤。
本申请的实施例提供的技术方案至少带来以下有益效果:
本申请实施例提供的控制方法,通过根据从客户端输入的第一语音控制指令,确定发出第一语音控制指令的第一声源位置,在确定第一语音控制指令为第二语音控制指令的跟随指令,且第一声源位置与发出第二语音控制指令的声源所在的第二声源位置不相同的情况下,可根据第一语音控制指令控制第一声源位置处的第一控制对象,由于该第一控制对象为与第二语音控制指令中的第二控制对象是相同类型的对象。如此可实现在第一语音控制指令之前若有语音控制指令控制过第二控制对象,则可通过第二语音控制指令的跟随指令直接控制与第二控制对象相同类型的对象,而无需输入完整语义的语音控制指令来控制与第二控制对象相同类型的对象,这样实现了驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
图1是本申请一示例性实施例提供的一种控制方法的示意图之一;
图2是本申请一示例性实施例提供的一种控制方法的示意图之二;
图3是本申请一示例性实施例提供的一种控制装置的结构示意图;
图4是本申请一示例性实施例提供的一种车载终端的结构示意图;
图5是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的例子。
如背景技术所述,现有技术中存在驾乘人员对之前操作过的同种类型的控制对象的二次操作不够智能、简便和高效的问题,为了解决上述问题,本申请实施例提供了一种控制方法,通过根据从客户端输入的第一语音控制指令,确定发出第一语音控制指令的第一声源位置,在确定第一语音控制指令为第二语音控制指令的跟随指令,且第一声源位置与发出第二语音控制指令的声源所在的第二声源位置不相同的情况下,可根据第一语音控制指令控制第一声源位置处的第一控制对象,由于该第一控制对象为与第二语音控制指令中的第二控制对象是相同类型的对象,如此可实现在第一语音控制指令之前若有语音控制指令控制过第二控制对象,则可通过第二语音控制指令的跟随指令直接控制与第二控制对象相同类型的对象,而无需输入完整语义的语音控制指令来控制与第二控制对象相同类型的对象,这样实现了驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的控制方法进行详细地说明。
图1是本申请实施例所提供的一种控制方法的流程示意图,如图1所示,本申请实施例提供的控制方法可以包括步骤110-步骤130。
步骤110、接收从客户端输入的第一语音控制指令。
步骤120、根据第一语音控制指令,确定发出第一语音控制指令的第一声源位置。
步骤130、在确定第一语音控制指令为第二语音控制指令的跟随指令,且第一声源位置与第二声源位置不相同的情况下,根据第一语音控制指令控制第一声源位置处的第一控制对象。
其中,第一控制对象可以为与第二语音控制指令中的第二控制对象是相同类型的对象。
第二声源位置可以为发出第二语音控制指令的声源所在的位置。
在本申请的实施例中,通过根据从客户端输入的第一语音控制指令,确定发出第一语音控制指令的第一声源位置,在确定第一语音控制指令为第二语音控制指令的跟随指令,且第一声源位置与发出第二语音控制指令的声源所在的第二声源位置不相同的情况下,可根据第一语音控制指令控制第一声源位置处的第一控制对象,由于该第一控制对象为与第二语音控制指令中的第二控制对象是相同类型的对象,如此可实现在第一语音控制指令之前若有语音控制指令控制过第二控制对象,则可通过第二语音控制指令的跟随指令直接控制与第二控制对象相同类型的对象,而无需输入完整语义的语音控制指令来控制与第二控制对象相同类型的对象,这样实现了驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
下面将对本申请实施例提供的控制方法进行详细说明。
首先介绍步骤110,接收从客户端输入的第一语音控制指令。
其中,第一语音控制指令可以是从客户端输入的语音控制指令,该第一语音控制指令具体的可以是用于对控制对象进行控制的指令,具体的可以是对车内的设备进行控制的指令,车内的设备可以但不限于是车窗、坐椅、空调、阅读灯、氛围灯和音响等。
在本申请的一些实施例中,用户可以从客户端中输入第一语音控制指令,具体的可以是从客户端的麦克风中输入第一语音控制指令。
然后介绍步骤120、根据第一语音控制指令,确定发出第一语音控制指令的第一声源位置。
其中,第一声源位置可以是发出第一语音控制指令的声源所在的位置。
在本申请的一些实施例中,根据第一语音控制指令,可以利用声源确定算法或者其他可以检测声源位置的算法来确定发出第一语音控制指令的第一声源位置。
在本申请的一些实施例中,具体的如何根据第一语音控制指令,确定发出第一语音控制指令的第一声源位置,可以根据用户需求自行选取算法,这里不做限定,任何可根据第一语音控制指令,确定发出第一语音控制指令的第一声源位置的实现方式均属于本申请实施例的保护范围之列。
在一个示例中,在车辆的副驾驶位置的驾乘人员从客户端发出第一语音控制指令,根据声源确定算法可确定出发出第一语音控制指令的声源在车辆的副驾驶位置(即第一声源位置)。
最后介绍步骤130、在确定第一语音控制指令为第二语音控制指令的跟随指令,且第一声源位置与第二声源位置不相同的情况下,根据第一语音控制指令控制第一声源位置处的第一控制对象。
其中,第二语音控制指令可以是第一语音控制指令所跟随的指令,该第二语音控制指令也可以是从客户端处输入的。
跟随指令可以是跟随某一对象的指令,该跟随指令例如可以但不限于是“我也是”、“我也要”和“我也来点儿”等类似的指令。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的车窗”,若副驾驶位置的驾乘人员从客户端发出第二语音控制指令的跟随指令“我也是”(即第一语音控制指令),则确定第一语音控制指令为第二语音控制指令的跟随指令。
第二声源位置可以为发出第二语音控制指令的声源所在的位置。
在本申请的一些实施例中,具体的根据第二语音控制指令,确定发出第二语音控制指令的第二声源位置,可以参考上述根据第一语音控制指令,确定发出第一语音控制指令的第一声源位置的实现方式,在此不再赘述。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,根据声源确定算法可确定出发出第二语音控制指令的声源在车辆的主驾驶位置(即第二声源位置)。
第一控制对象可以车辆内的与第一语音控制指令对应的控制对象,具体的可以为与第二语音控制指令中的第二控制对象是相同类型的对象。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的车窗”,则“主驾驶位置的车窗”为第二控制对象,则可打开主驾驶的车窗,若此时副驾驶位置的驾乘人员从客户端发出第二语音控制指令的跟随指令“我也是”(即第一语音控制指令),则可打开副驾驶位置的车窗,则“副驾驶位置的车窗”为第一控制对象,该第一控制对象为与第二控制对象是相同类型的对象,即均为车窗。如此,实现了驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性,无需副驾驶位置的驾乘人员输入语义完整的语音控制指令。
在本申请的一些实施例中,为了进一步实现驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性,在步骤110之后,上述所涉及的控制方法还可以包括:
根据第一语音控制指令,确定第一语音控制指令的语义。
在本申请的一些实施例中,在接收到第一语音控制指令后,可以基于语音识别算法或语音检测算法等对第一语音控制指令进行检测,得到第一语音控制指令的语义。
在本申请的一些实施例中,具体的如何根据第一语音控制指令,确定第一语音控制指令的语义可以根据用户需求自行选取,这里不做限定,任何可根据第一语音控制指令,确定第一语音控制指令的语义的实现方式,均属于本申请实施例的保护范围之列。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的车窗”,若副驾驶位置的驾乘人员从客户端发出第二语音控制指令的跟随指令“我也是”(即第一语音控制指令),则对第一语音控制指令“我也是”进行语音检测,确定其语义是“副驾驶位置的驾乘人员也想跟随主驾驶打开副驾驶位置的车窗”。
对应的,步骤130中所述确定第一语音控制指令为第二语音控制指令的跟随指令,具体可以包括:
在确定语义为第二语音控制指令的跟随语义的情况下,确定第一语音控制指令为第二语音控制指令的跟随指令。
在本申请的一些实施例中,在确定了第一语音控制指令的语义为第二语音控制指令的跟随语义的情况下,可以确定第一语音控制指令为第二语音控制指令的跟随指令。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的车窗”,若副驾驶位置的驾乘人员从客户端发出第二语音控制指令的跟随指令“我也是”(即第一语音控制指令),则对第一语音控制指令“我也是”进行语音检测,确定其语义是“副驾驶位置的驾乘人员也想跟随主驾驶打开副驾驶位置的车窗”,该语义是跟随第二语音控制指令的语义“主驶位置的驾乘人员想打开主驾驶位置的车窗”,即第一语音控制指令的语义是第二语音控制指令的跟随语义,则可确定第一语音控制“我也是”为第二语音控制指令“打开主驾驶的车窗”的跟随指令。
在本申请的实施例中,通过对接收到的第一语音控制指令进行分析,得到其对应的语义,通过对其语义进行分析,在确定其语义为第二语音控制指令的跟随语义的情况下,可以确定第一语音控制指令为第二语音控制指令的跟随指令,这样可精确确定第一语音控制指令是否为第二语音控制指令的跟随指令,进而可在确定第一语音控制指令为第二语音控制指令的跟随指令的情况下,可基于该跟随指令,通过第二语音控制指令的跟随指令直接控制与第二控制对象相同类型的对象,而无需输入完整语义的语音控制指令来控制与第二控制对象相同类型的对象,进一步实现了驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
在本申请的一些实施例中,为了进一步提升用户体验,在步骤120之后,上述所涉及的控制方法还可以包括:
确定发出第一语音控制指令的目标用户。
其中,目标用户可以是发出第一语音控制指令的用户。
在本申请的一些实施例中,确定发出第一语音控制指令的目标用户具体可以是通过如下方式来确定的:
(1)根据第一语音控制指令,确定第一语音控制指令对应的音频特征信息;根据音频特征信息,确定发出第一语音控制指令的目标用户。
其中,音频特征信息可以是第一语音控制指令的音频信息,具体的可以但不限于包括下述至少一项:音色信息和声纹信息。
在一个示例中,若副驾驶位置的驾乘人员从客户端发出第一语音控制指令“我也是”,则可获取到发出第一语音控制指令的副驾驶位置的驾乘人员的音频特征信息,在预先存储的音频特征信息与用户的对应关系中查找与副驾驶位置的驾乘人员的音频特征信息对应的用户,例如确定出与副驾驶位置的驾乘人员的音频特征信息对应的用户是张三,则张三即为目标用户。
(2)根据第一声源位置,获取第一声源位置的对象的图像信息;根据图像信息,确定发出第一语音控制指令的目标用户。
其中,图像信息可以是第一声源位置的对象的照片。
在本申请的一些实施例中,可以通过具有拍摄功能的拍摄设备获取第一声源位置的对象的图像信息,例如可以是照相机或摄像头等。
在一个示例中,在根据第一语音控制指令,确定出第一声源位置为副驾驶位置后,可以利用摄像头获取到位于副驾驶位置的驾乘人员的图像信息,对该图像信息进行识别,确定出发出第一语音控制指令的目标用户。
需要说明的是,上述确定发出第一语音控制指令的目标用户的示例仅为本申请实施例提供的两种示例,本领域技术人员应该知道还可以具有其他方式确定出发出第一语音控制指令的目标用户,例如可以是通过获取第一声源位置处的对象的指纹信息来确定发出第一语音控制指令的目标用户,任何可确定出发出第一语音控制指令的目标用户的方式均属于本申请的保护之列。
在确定发出第一语音控制指令的目标用户后,对应的,所述根据第一语音控制指令控制第一声源位置处的第一控制对象,具体可以包括:
根据目标用户,以及目标用户对第一控制对象的历史控制程度信息,确定第一声源位置处的第一控制对象的控制程度信息。
其中,对第一控制对象的历史控制程度信息可以是目标用户之前对第一控制对象进行控制的程度信息。
在一个示例中,以第一控制对象为空调为例,若目标用户以前打开空调时,均是将空调调至为20度,则对第一控制对象的历史控制程度信息即为将空调调至20度。
第一控制对象的控制程度信息可以是对第一控制对象的控制程度。例如,若第一控制对象为车窗,第一控制对象的控制程度可以是车窗打开的高度;若第一控制对象为阅读灯,则第一控制对象的控制程度可以是阅读灯的亮度等。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的空调”,若副驾驶位置的驾乘人员从客户端发出第二语音控制指令的跟随指令“我也是”(即第一语音控制指令),则可获取到发出第一语音控制指令的副驾驶位置的驾乘人员的音频特征信息,在预先存储的音频特征信息与用户的对应关系中查找与副驾驶位置的驾乘人员的音频特征信息对应的用户,即可确定出副驾驶位置的驾乘人员是谁,例如是张三,则可根据张三之前的打开空调的温度的历史控制程度信息(例如张三之前打开空调,都是将空调调为20度),则此时将副驾驶位置的空调打开,并调至20度。
在本申请的实施例中,通过确定发出第一语音控制指令的目标用户,然后根据目标用户,以及目标用户对第一控制对象的历史控制程度信息,确定第一声源位置处的第一控制对象的控制程度信息,这样不仅可以智能高效的对之前操作过的同种类型的控制对象的二次操作,而且还可根据发出第一语音控制指令的目标用户对第一控制对象的历史控制程度信息,来确定出第一控制对象的控制程度,极大的满足了用户的需求,提高了用户体验。
在本申请的一些实施例中,在接收第一语音控制指令,根据第一语音控制指令控制第一声源位置处的第一控制对象之前,需要先接收到第二语音控制指令,这样才可以根据第一语音控制指令控制第一声源位置处的与第二控制对象相同类型的第一控制对象。
在本申请的一些实施例中,在步骤110之前,上述所涉及的控制方法还可以包括:
接收从客户端输入的第二语音控制指令;
根据第二语音控制指令,确定发出第二语音控制指令的第二声源位置;
在确定第二语音控制指令为对第二控制对象的控制指令的情况下,根据第二语音控制指令,控制第二控制对象;
将第二语音控制指令和第二控制对象进行存储。
在本申请的一些实施例中,确定第二语音控制指令为对第二控制对象的控制指令,具体的可以是对第二语音控制指令进行分析,得到第二语音控制指令的语义,对该语义进行分析,根据语义可确定第二语音控制指令是否为对第二控制对象的控制指令。
在一个示例中,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的车窗”,对该第二语音控制指令进行分析,得到其语义可以为“主驶位置的驾乘人员想打开主驾驶位置的车窗”,对该语义进行分析可知,其是要对主驾驶位置的车窗(即第二控制对象)的控制指令,即第二语音控制指令为对第二控制对象的控制指令。
在本申请的一些实施例中,根据第二语音控制指令,控制第二控制对象之后,可以将第二语音控制指令和第二控制对象进行存储,具体的可以是存储至车辆的存储空间中。
在本申请的实施例中,在接收从客户端输入的第一语音控制指令之前,接收从客户端输入的第二语音控制指令,根据第二语音控制指令,确定发出第二语音控制指令的第二声源位置,在确定第二语音控制指令为对第二控制对象的控制指令的情况下,根据第二语音控制指令,控制第二控制对象,将第二语音控制指令和第二控制对象进行存储,如此以便后续在接收到第二语音控制指令的跟随指令的情况下,可直接基于第二语音控制指令的跟随指令控制与第二控制对象同类型的控制对象,而无需输入完整语义的语音控制指令来控制与第二控制对象相同类型的对象,进一步实现了驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
在本申请的一些实施例中,为了确保车辆内的存储空间的存储能力,在所述将第二语音控制指令和第二控制对象进行存储之后,上述所涉及的控制方法还可以包括:
在第二语音控制指令和第二控制对象的存储时长达到预设存储时长的情况下,将第二语音控制指令和第二控制对象进行清除。
其中,第二语音控制指令和第二控制对象的存储时长可以是第二语音控制指令和第二控制对象在存储空间中的存储的时长。
预设存储时长可以是预先设置的针对第二语音控制指令和第二控制对象的存储时长的阈值。
在本申请的一些实施例中,可以预先设置一个存储时长,例如可以是5分钟,在第二语音控制指令和第二控制对象存储的时长达到预设存储时长后,可将第二语音控制指令和第二控制对象进行清除。
在本申请的实施例中,通过在第二语音控制指令和第二控制对象的存储时长达到预设存储时长的情况下,将第二语音控制指令和第二控制对象进行清除,如此可以确保车辆的存储空间的存储能力,避免车辆中存储太多的语音控制指令和控制对象,导致后续的语音控制指令和控制对象无法进行存储的问题。
在本申请的一些实施例中,为了进一步的确保可以根据第一语音控制指令直接控制第一声源位置处的第一控制对象,在根据第一语音控制指令控制第一声源位置处的第一控制对象之前,上述所涉及的控制方法还可以包括:
确定第二语音控制指令和第二控制对象未被清除。
在本申请的实施例中,在确定第一语音控制指令为第二语音控制指令的跟随指令,且第一声源位置与第二声源位置不相同的情况下,还要确定第二语音控制指令和第二控制对象未被清除,如此才可根据第一语音控制指令控制第一声源位置处的与第二控制对象是相同类型的对象的第一控制对象,这样可确保可根据第一语音控制指令精确控制第一控制对象,避免了若第二语音控制指令和第二控制对象被清除后,无法得知与第二控制对象是相同类型的对象是哪个,如此则无法根据第一语音控制指令控制第一控制对象。
在本申请的一些实施例中,在存储空间中可能存储了多组语音控制指令和控制对象的对应关系,若此时输入了跟随指令“我也是”,在基于该跟随指令控制与第二控制对象同类型的第一控制对象时,则从存储空间中选取距离跟随指令最近的一组指令。
在一个示例中,若在存储空间中现有存储了3组语音控制指令和控制对象的对应关系,例如,最开始存储了第一组对应关系:打开主驾驶位置的车窗(语音控制指令)和主驾驶的车窗(控制对象),然后存储了第二组对应关系:打开主驾驶位置的空调(语音控制指令)和主驾驶的空调(控制对象),最后存储了第三组对应关系:打开主驾驶后面的驾驶位置的阅读灯(语音控制指令)和主驾驶后面的驾驶位置的阅读灯(控制对象)。若此次副驾驶位置的驾乘人员输入第一语音控制指令“我也是”,则该第一语音控制指令跟随的是最后一个存储在存储空间的指令,即跟随的是“打开主驾驶后面的驾驶位置的阅读灯”,则根据第一语音控制指令,打开副驾驶位置的阅读灯。
在本申请的实施例中,在存储有多组语音控制指令和控制对象的对应关系的情况下,基于跟随指令控制存储空间中距离跟随指令最近的一组对应关系中的控制对象,如此可以实现精确对控制对象进行控制的效果,避免存储有多个控制对象时,造成混乱。
在本申请的一些实施例中,为了提升用户体验,针对第一控制对象或第二控制对象中的任一目标控制对象,在根据目标语音控制指令,控制目标控制对象之后,上述所涉及的控制方法还可以包括:
将目标控制对象的执行结果反馈至客户端。
其中,目标控制对象可以是第一控制对象或第二控制对象。
目标语音控制指令可以是与目标控制对象对应的语音控制指令,具体的可以是在目标控制对象为第一控制对象的情况下,目标语音控制指令可以为第一语音控制指令;在目标控制对象为第二控制对象的情况下,目标语音控制指令可以为第二语音控制指令。
在一个示例中,以目标控制对象为第二控制对象,目标语音控制指令为第二语音控制指令为例,在车辆的主驾驶位置的驾乘人员从客户端发出第二语音控制指令,例如可以是“打开主驾驶的车窗”,则根据该第二语音控制指令打开了主驾驶位置的车窗,则可将该执行结果反馈给客户端。
在一个示例中,继续参考上述示例,客户端呈现执行结果的方式可以但不限于是:
(1)在客户端中显示以下内容“已打开主驾驶位置的车窗”;
(2)客户端播放语音“已打开主驾驶位置的车窗”;
(3)在客户端中显示的车辆图像中打开了主驾驶位置的车窗。
在本申请的一些实施例中,具体的客户端如何呈现执行结果可以根据用户需求自行设置,这里不做限定。
需要说明的是,在根据第一语音控制指令控制第一控制对象之后,也可以将执行结果反馈至客户端,客户端呈现执行结果的方式可以参考上述呈现的对第二控制对象的执行结果的呈现方式,这里不再赘述。
在本申请的实施例中,针对第一控制对象或第二控制对象中的任一目标控制对象,在根据目标语音控制指令,控制目标控制对象之后,可以将目标控制对象的执行结果反馈至客户端,如此可以使用户很直观的查看到执行结果,提升了用户体验。
为了便于更好的理解本申请实施例提供的控制方法,如图2所示,本申请实施例提供了另一种控制方法的实现方式,如图2所示,本申请实施例所提供的控制方法可以包括如下步骤201-步骤212:
步骤201、接收第二语音控制指令。
步骤202、确定发出第二语音控制指令的第二声源位置,并对第二语音控制指令进行识别。
步骤203、判断第二语音控制指令是否为对第二控制对象的控制指令,若是,执行步骤240。
步骤204、基于第二声源位置,根据第二语音控制指令,控制第二控制对象,并反馈执行结果。
步骤205、将第二语音控制指令和第二控制对象存储,并预设存储时长。
步骤206、接收第一语音控制指令。
步骤207、确定发出第一语音控制指令的第一声源位置,并对第一语音控制指令进行识别。
步骤208、判断第一语音控制指令是否为第二语音控制指令的跟随指令,若是,则执行步骤209。
步骤209、判断存储空间中是否为空,若不为空,则执行步骤210。
步骤210、判断第一声源位置与第二声源位置是否相同,若不同,则执行步骤211。
步骤211、基于第一声源位置,根据第一语音控制指令,控制第一控制对象,并反馈执行结果。
步骤212、将第一语音控制指令和第一控制对象存储,并预设存储时长。
需要说明的是,在根据第一语音控制指令确定第一声源位置时,还可以确定发出第一语音控制指令的目标用户,然后根据目标用户,以及目标用户对第一控制对象的历史控制程度信息,确定第一声源位置处的第一控制对象的控制程度信息。
在对第一语音控制指令和第一控制对象存储,并预设存储时长后,可以继续接收下一个第一语音控制指令,即重复执行步骤206-步骤212。
需要说明的是,本申请实施例提供的控制方法,执行主体可以为控制装置,或者该控制装置中的用于执行控制方法的控制模块。本申请实施例中以控制装置执行控制方法为例,说明本申请实施例提供的控制装置。
基于与上述的控制方法相同的发明构思,本申请还提供了一种控制装置。下面结合图3对本申请实施例提供的控制装置进行详细说明。
图3是根据一示例性实施例示出的一种控制装置的结构示意图。
如图3所示,该控制装置300可以包括:
接收模块310,用于接收从客户端输入的第一语音控制指令;
第一确定模块320,用于根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;
控制模块330,用于在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。
在本申请的一些实施例中,为了进一步实现驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性,上述所涉及的控制装置还可以包括:
第二确定模块,用于根据所述第一语音控制指令,确定所述第一语音控制指令的语义;
所述控制模块330可以包括:
第一确定单元,用于在确定所述语义为所述第二语音控制指令的跟随语义的情况下,确定所述第一语音控制指令为第二语音控制指令的跟随指令。
在本申请的一些实施例中,为了进一步提升用户体验,第一确定模块320还可以用于:
确定发出所述第一语音控制指令的目标用户;
对应的,控制模块330还可以用于:根据所述目标用户,以及所述目标用户对第一控制对象的历史控制程度信息,确定所述第一声源位置处的第一控制对象的控制程度信息。
在本申请的一些实施例中,为了进一步实现驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性,接收模块310还可以用于:接收从所述客户端输入的所述第二语音控制指令;
第一确定模块320还可以用于根据所述第二语音控制指令,确定发出所述第二语音控制指令的第二声源位置;
控制模块330还可以用于在确定所述第二语音控制指令为对所述第二控制对象的控制指令的情况下,根据所述第二语音控制指令,控制所述第二控制对象;
上述所涉及的控制装置还可以包括:存储模块,用于将所述第二语音控制指令和所述第二控制对象进行存储。
在本申请的一些实施例中,为了确保车辆内的存储空间的存储能力,上述所涉及的控制装置还可以包括:
清除模块,用于在所述第二语音控制指令和所述第二控制对象的存储时长达到预设存储时长的情况下,将所述第二语音控制指令和所述第二控制对象进行清除。
在本申请的一些实施例中,为了进一步的确保可以根据第一语音控制指令直接控制第一声源位置处的第一控制对象,控制模块330还可以包括:
第二确定单元,用于确定所述第二语音控制指令和所述第二控制对象未被清除。
在本申请的一些实施例中,为了提升用户体验,上述所涉及的控制装置还可以包括:
反馈模块,用于针对所述第一控制对象或所述第二控制对象中的任一目标控制对象,在根据目标语音控制指令,控制目标控制对象之后,将所述目标控制对象的执行结果反馈至所述客户端;其中,在所述目标控制对象为所述第一控制对象的情况下,所述目标语音控制指令为所述第一语音控制指令;在所述目标控制对象为所述第二控制对象的情况下,所述目标语音控制指令为所述第二语音控制指令。
本申请实施例提供的控制装置,可以用于执行上述各方法实施例提供的控制方法,其实现原理和技术效果类似,为简介起见,在此不再赘述。
基于同一发明构思,本申请实施例还提供一种车载终端。
如图4所示为本申请实施例提供的车载终端400,该车载终端400可以包括处理器410,处理器可以用于实现如上述实施例中提供的控制方法。
在本申请的一些实施例中,为了提升用户体验,该车载终端400还可以包括:显示器,用于显示第一控制对象或第二控制对象的执行结果。
本申请实施例提供的车载终端,可以用于执行上述各方法实施例提供的控制方法,其实现原理和技术效果类似,为简介起见,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种车辆,该车辆可以包括如上述实施例中的车载终端。
基于同一发明构思,本申请实施例还提供了一种电子设备。
图5是本申请实施例提供的一种电子设备的结构示意图。如图5所示,电子设备可以包括处理器501以及存储有计算机程序或指令的存储器502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。在特定实施例中,存储器502包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种控制方法。
在一个示例中,电子设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本发明实施例中各模块、设备、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该电子设备可以执行本发明实施例中的控制方法,从而实现图1-图2任一描述的控制方法。
另外,结合上述实施例中的控制方法,本发明实施例可提供一种可读存储介质来实现。该可读存储介质上存储有程序指令;该程序指令被处理器执行时实现上述实施例中的任意一种控制方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (12)

1.一种控制方法,其特征在于,所述方法包括:
接收从客户端输入的第一语音控制指令;
根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;
在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;
其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。
2.根据权利要求1所述的方法,其特征在于,在所述接收从客户端输入的第一语音控制指令之后,所述方法还包括:
根据所述第一语音控制指令,确定所述第一语音控制指令的语义;
所述确定所述第一语音控制指令为第二语音控制指令的跟随指令,包括:
在确定所述语义为所述第二语音控制指令的跟随语义的情况下,确定所述第一语音控制指令为第二语音控制指令的跟随指令。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置之后,所述方法还包括:
确定发出所述第一语音控制指令的目标用户;
所述根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,包括:
根据所述目标用户,以及所述目标用户对第一控制对象的历史控制程度信息,确定所述第一声源位置处的第一控制对象的控制程度信息。
4.根据权利要求1所述的方法,其特征在于,在所述接收从客户端输入的第一语音控制指令之前,所述方法还包括:
接收从所述客户端输入的所述第二语音控制指令;
根据所述第二语音控制指令,确定发出所述第二语音控制指令的第二声源位置;
在确定所述第二语音控制指令为对所述第二控制对象的控制指令的情况下,根据所述第二语音控制指令,控制所述第二控制对象;
将所述第二语音控制指令和所述第二控制对象进行存储。
5.根据权利要求4所述的方法,其特征在于,在所述将所述第二语音控制指令和所述第二控制对象进行存储之后,所述方法还包括:
在所述第二语音控制指令和所述第二控制对象的存储时长达到预设存储时长的情况下,将所述第二语音控制指令和所述第二控制对象进行清除。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象之前,所述方法还包括:
确定所述第二语音控制指令和所述第二控制对象未被清除。
7.根据权利要求6所述的方法,其特征在于,针对所述第一控制对象或所述第二控制对象中的任一目标控制对象,在根据目标语音控制指令,控制目标控制对象之后,所述方法还包括:
将所述目标控制对象的执行结果反馈至所述客户端;
其中,在所述目标控制对象为所述第一控制对象的情况下,所述目标语音控制指令为所述第一语音控制指令;在所述目标控制对象为所述第二控制对象的情况下,所述目标语音控制指令为所述第二语音控制指令。
8.一种控制装置,其特征在于,所述装置包括:
接收模块,用于接收从客户端输入的第一语音控制指令;
第一确定模块,用于根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;
控制模块,用于在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。
9.一种车载终端,其特征在于,所述车载终端包括处理器,所述处理器用于实现如权利要求1-7任一所述的控制方法的步骤。
10.根据权利要求9所述的车载终端,其特征在于,所述车载终端还包括:显示器;
所述显示器用于显示第一控制对象或第二控制对象的执行结果。
11.一种车辆,其特征在于,所述车辆包括如权利要求9-10任一所述的车载终端。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7任一所述的控制方法的步骤。
CN202111265003.4A 2021-10-28 2021-10-28 控制方法、装置、车载终端、车辆和存储介质 Pending CN113990318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111265003.4A CN113990318A (zh) 2021-10-28 2021-10-28 控制方法、装置、车载终端、车辆和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111265003.4A CN113990318A (zh) 2021-10-28 2021-10-28 控制方法、装置、车载终端、车辆和存储介质

Publications (1)

Publication Number Publication Date
CN113990318A true CN113990318A (zh) 2022-01-28

Family

ID=79743656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111265003.4A Pending CN113990318A (zh) 2021-10-28 2021-10-28 控制方法、装置、车载终端、车辆和存储介质

Country Status (1)

Country Link
CN (1) CN113990318A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114898752A (zh) * 2022-06-30 2022-08-12 广州小鹏汽车科技有限公司 语音交互方法、车辆及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114898752A (zh) * 2022-06-30 2022-08-12 广州小鹏汽车科技有限公司 语音交互方法、车辆及存储介质
CN114898752B (zh) * 2022-06-30 2022-10-14 广州小鹏汽车科技有限公司 语音交互方法、车辆及存储介质

Similar Documents

Publication Publication Date Title
CN111469802B (zh) 座椅安全带状态确定系统和方法
CN111653277A (zh) 车辆语音控制方法、装置、设备、车辆及存储介质
CN108725357A (zh) 基于人脸识别的参数控制方法、系统与云端服务器
CN106471573B (zh) 语音识别装置以及语音识别系统
US11511759B2 (en) Information processing system, information processing device, information processing method, and non-transitory computer readable storage medium storing program
US20160046296A1 (en) Method and device for assigning a driver of a vehicle to a driver class stored in the vehicle and representing a specific driving behaviour of the driver, and computer program product for that purpose
CN113990318A (zh) 控制方法、装置、车载终端、车辆和存储介质
US9869760B2 (en) System and method for recognizing a motion by analyzing a radio signal
CN113246728B (zh) 一种车窗内容显示方法、装置、电子设备及可读存储介质
JP2018501998A (ja) 自動車の機器を制御するためのシステムおよび方法
US10759447B2 (en) Driving support method, vehicle, and driving support system
CN110794735A (zh) 远程控制装置及方法
KR20170132992A (ko) 사용자 동작 인식 기반의 차량용 hmi 시스템 및 이의 동작 방법
CN113323539A (zh) 用于车辆排烟的方法、装置、存储介质、车辆及电子设备
CN109345855A (zh) 一种用户管理方法
US20210005203A1 (en) Voice processing apparatus and voice processing method
US20230365141A1 (en) Information processing device and information processing method
EP3933667A1 (en) Process for configuring a vehicle airbag module and vehicle airbag system
CN117183664A (zh) 一种车载空调控制方法、系统、存储介质及车辆
CN117785091A (zh) 信息显示方法、装置、车辆及计算机存储介质
CN118182351A (zh) 指令处理方法、装置、设备、计算机存储介质及车辆
CN116825098A (zh) 语音通信交互方法、装置、设备及介质
CN114379582A (zh) 一种控制车辆各自动驾驶功能的方法、系统及存储介质
CN114312809A (zh) 车载显示终端控制方法、装置、车辆、介质及程序产品
CN117253218A (zh) 安全带高度调节方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination