CN118262712A - 车载语音控制方法、设备和计算机可读存储介质 - Google Patents
车载语音控制方法、设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN118262712A CN118262712A CN202211692003.7A CN202211692003A CN118262712A CN 118262712 A CN118262712 A CN 118262712A CN 202211692003 A CN202211692003 A CN 202211692003A CN 118262712 A CN118262712 A CN 118262712A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- control
- voice
- instruction
- voice input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004891 communication Methods 0.000 claims abstract description 24
- 230000004044 response Effects 0.000 claims abstract description 12
- 238000005266 casting Methods 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 50
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000001276 controlling effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000004378 air conditioning Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Abstract
本申请提供了一种车载语音控制方法、设备和计算机可读存储介质。基于车机的车载语音控制方法包括下列步骤:通过投屏协议建立车机设备和终端设备之间的通信连接,以使得所述车机设备经由所述投屏协议的接口获得所述终端设备的媒体应用组件的控制权限;响应于接收来自用户的语音输入指令,所述车机设备生成与所述语音输入指令对应的控制指令;以及通过所述控制指令控制车辆的服务组件或所述终端设备的媒体应用组件。
Description
技术领域
本申请涉及车载语音控制,具体涉及车载语音控制方法、设备和计算机可读存储介质。
背景技术
随着互联网和智能汽车产业的高速发展,用户对行车体验的要求也日益增加。移动终端(例如手机等)通过第三方投屏应用(例如carplay、hicar和CarLife等)与车载娱乐信息系统(以下简称“车机”)通信连接,可以实现将手机的媒体应用(例如地图导航、电话、信息、音乐和日历等)投屏到车机进行播放。
目前市面上的手机通过第三方投屏应用与车机互联之后,只能通过手机语音控制手机的媒体应用和车辆的服务组件,导致语音操作的不便利性。
发明内容
本申请的一个目的在于提供一种车载语音控制方法、车载语音控制设备及存储介质,其通过车机设备获得终端设备的媒体应用组件的控制权限,并且生成与语音输入指令对应的控制指令,使得用户在通过语音控制车辆上的服务组件或终端设备的媒体应用组件之前,不用先说出唤醒词,给用户提供了操作控制的便利性。
为实现上述目的,根据本申请的第一方面,提供了一种基于车机的车载语音控制方法,包括:通过投屏协议建立车机设备和终端设备之间的通信连接,以使得所述车机设备经由所述投屏协议的接口获得所述终端设备的媒体应用组件的控制权限;响应于接收来自用户的语音输入指令,所述车机设备生成与所述语音输入指令对应的控制指令;以及通过所述控制指令控制车辆的服务组件或所述终端设备的媒体应用组件。由此本申请的车载语音控制方法能够实现语音免唤醒控制车辆和终端设备。
在一些实施方式中,通过所述控制指令控制车辆上的服务组件或所述终端设备的媒体应用组件,包括:响应于所述控制指令为车机控制指令,所述车机设备将所述车机控制指令直接发送至所述车辆的组件控制模块以控制对应的车辆服务组件;以及响应于所述控制指令为终端设备控制指令,所述车机设备将所述终端设备控制指令通过所述投屏协议发送至所述终端设备,以使得所述终端设备执行相应的媒体控制。本申请的车机设备将车机控制指令直接发送至所述车辆上的组件控制模块,使得用户能够直接对车辆上的服务组件进行相应的控制,使得对车辆上的服务组件的控制响应高、便利性高。
在一些实施方式中,所述车机设备生成与所述语音输入指令对应的控制指令,包括:识别所述语音输入指令是否存在关键词;根据所述关键词确定与所述语音输入指令对应的应用类型;以及根据确定出的、对应的应用类型生成与所述语音输入指令对应的控制指令。通过提取语音输入中的关键词,基于映射表可以精确、快速地确定与语音输入指令对应的应用类型并且精确、快速地生成对应的控制指令。
根据本申请的第二方面,还提供了一种基于终端设备的车载语音控制方法,包括:通过投屏协议建立终端设备和车机设备之间的通信连接;响应于从所述车机设备接收到经由所述投屏协议发送的控制权限请求,允许所述车机设备获得对所述终端设备的媒体应用组件的控制权限;以及根据从所述车机设备接收到媒体控制指令,所述终端设备执行相应的媒体控制操作,其中,所述媒体控制指令由所述车机设备根据用户的语音输入指令生成。本申请的车载语音控制方法能够实现语音免唤醒控制车辆和终端设备。
根据本申请的第三方面,还提供了一种车载语音控制设备,包括:存储器,所述存储器中存储有计算机指令;以及处理器,所述处理器通信连接至所述存储器来执行所述计算机指令,从而执行根据本申请第一方面或第二方面所述的车载语音控制方法。
根据本申请的第四方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行根据本申请第一方面或第二方面所述的车载语音控制方法。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。在附图中:
图1是根据本申请的实施例的车载语音控制方法的场景应用的示意图。
图2示出根据本申请的车载语音控制方法的流程图。
图3是根据本申请的实施例的接收来自用户的语音输入指令以及生成控制指令的流程图。
图4示出根据本申请的基于终端设备的车载语音控制方法的流程图。
图5是根据本申请的实施例的车载语音控制装置与终端设备的媒体应用组件和车辆的服务组件的框图。
图6是适于用来实现本申请示例性实施方式的电子设备的示意框图。
具体实施方式
为了更好地理解本公开,将参考附图对本公开的各个方面做出更详细的说明。应理解,这些详细说明只是对本公开的示例性实施方式的描述,而非以任何方式限制本公开的范围。在说明书全文中,表述“和/或”包括相关联的所列项目中的一个或多个的任何和全部组合。
除非另外限定,否则本文中使用的所有用语(包括技术用语和科学用语)均具有与本公开所属领域普通技术人员的通常理解相同的含义。还应理解的是,用语(例如在常用词典中定义的用语)应被解释为具有与它们在相关技术的上下文中的含义一致的含义,并且将不被以理想化或过度正式意义解释,除非本文中明确如此限定。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1是根据本申请的实施例的车载语音控制方法的场景应用的示意图。如图1所示,该信息处理环境包括通信连接的终端设备110和车机设备120。终端设备110和车机设备120之间的通信连接可以是有线连接或无线连接,用以实现两者之间的数据传输和音视频同步等。终端设备110可以包括但不限于个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。终端设备110可以包括通信模块、存储器和处理器。通信模块用于与车机设备120进行通信。存储器用于存储一个或多个计算机程序。处理器联接或耦合至存储器并且执行一个或多个程序。车机设备120可以设置于车辆中,并且连接至车辆中的各个应用装置,例如可以连接到车载显示器、车载扬声器、车载麦克风、车载空调、车窗等。车机设备120可以包括内置的软件应用程序(例如包括但不限于地图类应用、音乐类应用、视频播放类应用、无线电广播类应用、网页浏览器应用、搜索类应用等),以提供各种导航和娱乐功能。
图2示出根据本申请的基于车机的车载语音控制方法的流程图。
如图2所示,该方法包括:
步骤S11,通过投屏协议建立车机设备120和终端设备110之间的通信连接,以使得车机设备120经由投屏协议的接口获得终端设备110的媒体应用组件的控制权限。
车机设备120和终端设备110可以是有线连接,也可以是无线连接。在具体实施例中,车机设备120和终端设备110通过局域网通信连接。例如,启动车机设备120,并且打开终端设备110上的第三方投屏应用(例如carplay)以及WIFI和/或蓝牙,在终端设备110的界面上选择需要连接的车辆的第三方投屏系统,从而实现通过投屏协议建立终端设备110和车机设备120之间的通信连接。
车机设备120经由第三方投屏协议的接口获取终端设备110的媒体应用组件的控制权限,以实现对终端设备110中的媒体应用组件进行控制。在具体的实施例中,基于车机设备120和终端设备110之间的通信连接,车机设备120通过第三方投屏协议向终端设备110发送控制权限请求,终端设备110接收到该控制权限请求之后,提取当前连接的车机设备120的身份标识,并且根据身份标识确定该车机设备120是否为可授权的设备。如果该车机设备120是可授权的设备,则该车机设备120获取终端设备110的媒体应用组件的控制权限。由此车机设备120通过第三方投屏协议接口可以控制终端设备110中的应用组件(例如,地图导航、电话、信息、音乐、视频等媒体应用组件)。
步骤S12,响应于接收来自用户的语音输入指令,车机设备120生成与语音输入指令对应的控制指令。
步骤S12由车机设备120来执行。车机设备120可以接受针对车辆上的服务组件的语音输入指令,也可以接受针对终端设备110中的媒体应用组件的语音输入指令。例如,车辆上的服务组件可以是车辆上的导航组件、音视频播放组件、空调组件、车窗控制组件、音视频数据采集组件、灯光控制组件中的至少一种。终端设备110中的媒体应用组件可以是地图导航、电话、信息、音乐等组件中的至少一种。
在车机设备120获取终端设备110的媒体应用组件的控制权限之后,使得用户可以通过车机设备120对终端设备110的媒体应用组件进行相应的控制。例如,车机设备120可以识别用户的语音输入指令,从而确定用户期望控制的组件的类型。
图3是根据本申请的实施例的接收来自用户的语音输入指令以及生成控制指令的流程图。识别语音输入指令的类型和生成控制指令由车机设备120来执行。
步骤S121,车机设备120的语音输入装置接收用户的语音输入指令。
在本申请的实施例中,车机设备120的语音输入装置(例如车辆麦克风)可以接收各种可听见的声音。例如,车机设备120的语音输入装置可以接收用户发出的语音输入指令,可以接收用户和乘客等其他人的谈话,还可以接收车内或车外的噪音。
步骤S122,识别语音输入指令是否存在关键词。
在本申请的一个实施例中,例如语音输入是“下一首歌曲”,由此可以识别出关键词“歌曲”;例如语音输入是“打开空调”,由此可以识别出关键词“空调”。可以采用任何合适的语音识别方法来识别语音输入指令中的关键词。
当用户与乘客进行交谈且谈话中不包括控制车辆上的服务组件和终端设备上的媒体应用组件的语音时,车机设备120将识别出语音输入不存在关键词,此时车机设备120将判断出用户并没有发出相应的语音输入指令,此时将返回到步骤S121,继续接收用户的语音输入。
当识别出语音输入为噪音(例如用户的咳嗽声音、鸣笛声音、不规则的低频环境声音等)时,车机设备120将识别出语音输入不存在关键词,此时车机设备120将判断出用户并没有发出相应的语音输入指令,此时将返回到步骤S121,继续接收用户的语音输入。
在本申请的另一个实施例中,车机设备120还包括降噪装置,用于过滤用户的语音输入和环境声音中的噪音,从而可以避免由于接收错误语音声音或噪音导致的误操作。
在本申请的又一个实施例中,当车机设备120识别出语音输入中包括唤醒词时,车机设备120判断出用户可能即将通过语音输入控制终端设备110中的媒体应用组件,则使得第三方投屏系统处于前台运行,并且通过第三方投屏协议将与该唤醒词对应的控制指令发送给终端设备110,以使得终端设备110准备通过其接口接收终端设备控制指令,同时返回到步骤S121。对于不熟悉本车辆的用户来说,即使该用户不知道车辆具有免唤醒功能,车机设备120也可以接收用户的唤醒词,并且准备控制车辆上的服务组件或终端设备的媒体应用组件。
步骤S123,根据关键词确定与语音输入指令对应的应用类型。
在本申请的一个实施例中,基于关键词与应用类型的映射表,确定与语音输入指令对应的应用类型。
例如,当语音输入是“下一首(歌曲)”、“上一首(歌曲)”、“播放电影”、“播放视频”、“继续(暂停)播放”、“快进”、“后退”、“(给……)打电话”、“读取短信”等中的至少一个时,车机设备120识别出关键词“歌曲”、“电影”、“视频”、“电话”和“短信”,车机设备120确定与该语音输入指令对应的是终端设备应用类型。
例如,当语音输入是“打开(关上)空调”、“打开(关闭)灯”、“打开(关闭)车窗”等中的至少一个时,车机设备120识别出关键词“空调”、“灯”、“窗”,确定与该语音输入指令对应的是车辆应用类型。
例如,当语音输入是“打开地图”、“……地名”等中的至少一个时,车机设备120识别出关键词“地图”、“导航”,此时关键词可能对应终端设备应用类型和车辆应用类型中的一个。在本申请的又一个实施例中,为了精确地确定与该语音输入对应的应用类型以避免误操作,当关键词是“地图”或“导航”等中的至少一个时,响应于关键词同时对应终端设备应用类型和车辆应用类型,车机设备120根据车辆的第三方投屏系统是处于前台运行还是后台运行,判断与该语音输入对应的是终端设备应用类型还是车辆应用类型。例如,当车机设备120检测车辆的第三方投屏系统处于前台运行时,确定与该语音输入对应的是终端设备应用类型;当车机设备120检测车辆的第三方投屏系统处于后台运行时,确定与该语音输入对应的是车辆应用类型。
步骤S124,根据确定出的、对应的应用类型生成与语音输入指令对应的控制指令。步骤S124由车机设备120来执行。
在本申请的实施例中,当车机设备120识别出与语音输入指令对应的是车辆应用类型时,生成与该语音输入指令对应的车机控制指令,并且将车机控制指令直接发送至车辆上的组件控制模块。当车机设备120识别出语音输入指令对应的是终端设备应用类型时,生成与该语音输入指令对应的终端设备控制指令,并将终端设备控制指令通过第三方投屏协议发送至终端设备110的接口。
针对车辆上的同一个服务组件,车机设备120可以根据语音输入生成不同的车机控制指令。例如,对应车辆上的空调组件,车机设备120可以生成用于制冷、制热等不同的车机控制指令。
针对终端设备110的同一个服务组件,车机设备120可以根据语音输入生成不同的终端设备控制指令。例如,对于终端设备的音乐播放器,车机设备120可以生成用于暂停、继续播放、播放下一首、播放上一首等不同的终端设备控制指令。
步骤S13,通过控制指令控制车辆的服务组件或终端设备110的媒体应用组件。
响应于控制指令为车机控制指令,车机设备120将该车机控制指令直接发送至车辆上的组件控制模块。在本申请中,术语“直接”意指车机控制指令并不通过第三方投屏协议发送给车辆上的服务组件。车辆上的组件控制模块对直接接收到的车机控制指令进行解析,确定该车机控制指令对应的目标车辆服务组件,从而实现对目标车辆服务组件进行相应的控制,完成车机控制指令的操作。
响应于控制指令为终端设备控制指令,车机设备120通过第三方投屏协议将该终端设备控制指令发送到终端设备110的接口。终端设备110的接口接收该终端设备控制指令并进行解析,以确定该终端设备控制指令与终端设备110上的媒体应用组件对应,调用终端设备110的媒体应用组件,并且将与媒体应用组件对应的控制数据通过第三方投屏协议发送给车机设备120,车机设备120根据接收的控制数据从而实现对目标媒体应用组件进行控制,完成该终端设备控制指令的操作。
例如,当终端设备110的接口接收该终端设备控制指令并进行解析,确定该终端设备控制指令与终端设备110上的音乐播放器对应,随后终端设备110将音频数据通过第三方投屏协议发送到车机设备120,车机设备120处理该音频数据并在扬声器上播放该音频数据。
例如,当终端设备110的接口接收该终端设备控制指令并进行解析,确定该终端设备控制指令与终端设备110上的相册应用对应,随后终端设备110将相册中的图片数据通过第三方投屏协议发送到车机设备120,车机设备120对该图像数据进行处理并在车辆的显示器上显示该图片。
在上述的车载语音控制方法中,车机设备120将车机控制指令直接发送至车辆上的组件控制模块,因此用户能够直接对车辆上的服务组件进行相应的控制,使得对车辆上的服务组件的控制响应高、便利性高。车机设备120通过第三方投屏协议将该终端设备控制指令发送到终端设备110的接口,因此用户也无需说出唤醒词即可对终端设备110的媒体应用组件进行相应的控制。即使用户说出的是车辆的唤醒词,唤醒了车机语音助手,也可以控制终端设备执行相应的动作,无需再唤醒终端设备的语音助手,极大便利了用户的语音控制操作。
本申请的基于车机的车载语音控制方法实现了车辆上的服务组件和终端设备上的媒体应用组件的语音免唤醒控制。
在本申请的上述车载语音控制方法中,车机设备120通过第三方投屏协议获取终端设备110的控制权限,可以通过车辆上更大的屏幕和音响效果更好的扬声器对终端设备110中的视频和音频数据进行播放,提高用户的使用体验。
本申请的车载语音控制方法通过提取语音输入中的关键词,基于映射表可以精确、快速地确定与语音输入指令对应的应用类型并且精确、快速地生成对应的控制指令。
图4示出根据本申请的基于终端设备的车载语音控制方法的流程图。如图4所示,该方法包括:
步骤S21,通过投屏协议建立终端设备110和车机设备120之间的通信连接。
步骤S22,响应于从车机设备120接收到经由投屏协议发送的控制权限请求,允许车机设备120获得对终端设备110的媒体应用组件的控制权限。
步骤S23,根据从车机设备120接收到媒体控制指令,终端设备110执行相应的媒体控制操作。
其中,步骤S23中的媒体控制指令由车机设备120根据用户的语音输入指令生成。
上述步骤S21、S22和S23的具体控制步骤可结合图2有关的详细说明得知,在此不再赘述。
下面将结合一些具体的示例对本申请的车载语音控制方法进行举例说明。
用户通过终端设备110上的第三方投屏应用与安装了第三方投屏系统的车辆连接,使得车机设备120获得终端设备110的媒体应用组件的控制权限。
当用户直接说出打开空调(即,在此之前未说出唤醒词)时,车机设备120接收该语音输入并识别该语音输入为车辆应用类型。车机设备120生成与该语音输入对应的车机控制指令,并且将该车机控制指令直接发送到车辆上的组件控制模块,以直接控制空调被打开。
当用户直接说出下一首歌曲(即,在此之前未说出唤醒词)时,车机设备120接收该语音输入并识别该语音输入为终端设备应用类型。车机设备120生成与该语音输入对应的终端设备控制指令,并且通过第三方投屏协议将终端设备控制指令发送到终端设备110的接口,终端设备110根据终端设备控制指令调用相应的媒体应用组件,并且将相应的控制数据发送到车机设备120,车机设备120在车辆上实现对终端设备110上的音频、视频、图片等的播放和显示。
当用户直接说出导航或地图时,车机设备120接收该语音输入并识别该语音输入可以是车辆应用类型或终端设备应用类型。车机设备120如果检测车辆的第三方投屏系统此时处于前台运行,则确定该语音输入为终端设备应用类型。车机设备120通过第三方投屏协议将生成的终端设备控制指令发送到终端设备110的接口,终端设备110根据终端设备控制指令调用地图应用组件,并且将相应的地图数据发送到车机设备120,车机设备120根据接收的地图数据在车辆上实现导航功能。车机设备120如果检测车辆的第三方投屏系统此时处于后台运行,则确定该语音输入为车辆应用类型。车机设备120生成与该语音输入对应的车机控制指令,并且将该车机控制指令发送到车辆上的组件控制模块,以直接调用车辆上的地图导航装置。
当用户和乘客在车辆内部交流沟通或发出噪音时,车机设备120接收该语音输入并识别该语音输入不是车辆应用类型和终端设备应用类型中的任意一种。车机设备120判断出用户并没有发出任何语音控制输入,因此继续接收并识别语音输入。
当用户说出了唤醒词时,车机设备120接收该语音输入,车机设备120使得第三方投屏系统处于前台运行,并且通过第三方投屏协议将与该唤醒词对应的控制指令发送给终端设备110,并且继续接收并识别语音输入。
当用户说出的语音控制与待控制的组件的当前状态是相同的,例如车辆的车窗都已经打开的情况下,用户说出打开车窗,车机设备120接收该语音输入并识别该语音输入为车辆应用类型。车机设备120生成与该语音输入对应的车机控制指令,并且将该车机控制指令发送到车辆上的组件控制模块。当车窗控制器判断出车窗已经处于打开的状态,将其接收的车机控制指令设置为无效,因此不执行车窗的打开控制。
当用户说出的语音控制的服务组件和手动控制车辆上的服务组件相同时,例如当用户发出打开车窗的语音控制输入,并且由于误操作或不知情已发出了相应的语音控制输入,用户手动操作打开车窗,车机设备120接收该语音输入并识别该语音输入为车辆应用类型,车机设备120生成与该语音输入对应的车机控制指令,并且将该车机控制指令发送到车辆上的组件控制模块。另外,车窗控制器还接收与手动控制对应的手动控制指令。车窗控制器根据车机控制指令和手动控制指令的先后顺序依次执行相应的控制。例如,用户先发出语音打开车窗,随后立刻(例如几秒以内)手动操作打开或关闭车窗,车窗控制器将先根据语音输入执行打开车窗,随后立刻根据手动操作的物理按键,控制车窗继续打开或关闭。例如,用户先手动操作打开或关闭车窗,然后立刻(例如几秒以内)发出语音打开车窗,车窗控制器将先根据手动操作控制车窗打开或关闭,随后立刻根据语音输入执行打开车窗控制。
图5是根据本申请的实施例的车载语音控制装置与终端设备的媒体应用组件和车辆的服务组件的框图。如图5所示,车载语音控制装置40包括:连接模块41,用于通过投屏协议建立车机设备120和终端设备110之间的通信连接;权限获取模块42,用于使得车机设备120经由投屏协议的接口获得终端设备110的媒体应用组件11的控制权限;语音接收模块43,响应于接收来自用户的语音输入指令;控制指令生成模块44,用于生成与语音输入对应的控制指令;以及组件控制模块45,用于通过控制指令控制车辆的服务组件12或终端设备110的媒体应用组件11。
在本申请的又一个实施例中,权限获取模块42用于基于终端设备110和车机设备120之间的通信连接,通过连接模块41向终端设备110发送控制权限请求,以获得终端设备110的媒体应用组件11的控制权限。
在本申请的又一个实施例中,控制指令生成模块44包括:关键词识别模块441,用于识别语音输入指令是否存在关键词;应用类型确定模块442,用于根据关键词确定与语音输入指令对应的应用类型;以及指令生成模块443,用于根据确定出的、对应的应用类型生成与语音输入指令对应的控制指令。
在本申请的一个实施例中,应用类型确定模块442还用于根据关键词和车辆的第三方投屏系统的运行状态(即处于前台运行或后台运行)确定与语音输入指令对应的应用类型。
在本申请的又一个实施例中,组件控制模块45用于:当控制指令生成模块44生成车机控制指令时,将车机控制指令直接发送至车辆上的组件控制模块以控制车辆的服务组件;以及当控制指令生成模块44生成终端设备控制指令时,将终端设备控制指令通过连接模块41发送至终端设备110。
本申请的车载语音控制装置40的实现原理和技术效果与上述车辆的语音控制方法相同,在此不做赘述。
车载语音控制装置的各个模块可以软件、硬件及其组合来实现。各个模块可以硬件形式内嵌于或独立于处理器中,也可以以软件形式存储在存储器中,以便于处理器调用执行以上各个模块对应的操作。
图6是适于用来实现本申请示例性实施方式的电子设备的示意框图。车机设备120包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储车机设备120操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
车机设备120中的多个部件连接至I/O接口505,包括:输入单元506,例如各种按键等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如无线通信收发机等。通信单元509允许车机设备120通过计算机网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如视频处理方法。例如,在一些实施例中,视频处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到车机设备120上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的视频处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行视频处理方法。
本申请的实施例还提供了一种车载语音控制设备,包括:存储器,存储器中存储有计算机指令;以及处理器,处理器通信连接至存储器来执行计算机指令,从而执行如上所述的车载语音控制方法。
本申请的实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行如上所述的车载语音控制方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。
附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
根据本文中所描述的本公开实施方式的电子设备或电气设备和/或任何其他相关设备或组件可利用任何适当的硬件、固件(例如,专用集成电路)、软件或软件、固件和硬件的组合来实施。例如,这些设备的各种组件可形成在一个集成电路(IC)芯片上或形成在分开的IC芯片上。另外,这些设备的各种组件可实现在柔性印刷电路膜、载带封装(TCP)、印刷电路板(PCB)上,或者形成在一个衬底上。另外,这些设备的各种组件可以是在一个或多个计算设备中的一个或多个处理器上运行的、执行计算机程序指令并且与用于执行本文中所描述的各种功能的其他系统组件交互的进程或线程。计算机程序指令存储在可利用例如标准存储设备实现在计算设备中的存储器中,诸如,随机存取存储器(RAM)。计算机程序指令还可例如存储在其他非暂时性计算机可读介质中,诸如CD-ROM、闪存驱动器等。另外,本领域技术人员将认识到,在不背离本公开实施方式的精神和范围的情况下,各种计算设备的功能可组合或集成到单个计算设备中,或者特定计算设备的功能可分布到一个或多个其他计算设备。
以上描述仅为本公开的较佳实施方式以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的保护范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种基于车机的车载语音控制方法,其特征在于,包括:
通过投屏协议建立车机设备和终端设备之间的通信连接,以使得所述车机设备经由所述投屏协议的接口获得所述终端设备的媒体应用组件的控制权限;
响应于接收来自用户的语音输入指令,所述车机设备生成与所述语音输入指令对应的控制指令;以及
通过所述控制指令控制车辆的服务组件或所述终端设备的媒体应用组件。
2.根据权利要求1所述的车载语音控制方法,其中,通过所述控制指令控制车辆上的服务组件或所述终端设备的媒体应用组件,包括:
响应于所述控制指令为车机控制指令,所述车机设备将所述车机控制指令直接发送至所述车辆的组件控制模块以控制对应的车辆服务组件;以及
响应于所述控制指令为终端设备控制指令,所述车机设备将所述终端设备控制指令通过所述投屏协议发送至所述终端设备,以使得所述终端设备执行相应的媒体控制。
3.根据权利要求1所述的车载语音控制方法,其中,通过投屏协议建立车机设备和终端设备之间的通信连接,以使得所述车机设备经由所述投屏协议的接口获得所述终端设备的媒体应用组件的控制权限,包括:
通过第三方投屏协议建立所述车机设备和所述终端设备之间的通信连接;以及
基于所述通信连接,所述车机设备通过所述第三方投屏协议向所述终端设备发送控制权限请求,以获得所述终端设备的媒体应用组件的控制权限。
4.根据权利要求1所述的车载语音控制方法,其中,所述车机设备生成与所述语音输入指令对应的控制指令,包括:
识别所述语音输入指令是否存在关键词;
根据所述关键词确定与所述语音输入指令对应的应用类型;以及
根据确定出的、对应的应用类型生成与所述语音输入指令对应的控制指令。
5.根据权利要求4所述的车载语音控制方法,其中,根据所述关键词确定与所述语音输入指令对应的应用类型的步骤包括:
响应于所述关键词同时对应终端设备应用类型和车辆应用类型,根据所述车辆的第三方投屏系统处于前台运行还是后台运行,确定与所述语音输入指令对应的是终端设备应用类型还是车辆应用类型。
6.根据权利要求1-5中任一项所述的车载语音控制方法,其中,所述用户的语音输入指令为语音免唤醒指令。
7.一种基于终端设备的车载语音控制方法,其特征在于,包括:
通过投屏协议建立终端设备和车机设备之间的通信连接;
响应于从所述车机设备接收到经由所述投屏协议发送的控制权限请求,允许所述车机设备获得对所述终端设备的媒体应用组件的控制权限;以及
根据从所述车机设备接收到媒体控制指令,所述终端设备执行相应的媒体控制操作,
其中,所述媒体控制指令由所述车机设备根据用户的语音输入指令生成。
8.根据权利要求7所述的车载语音控制方法,其中,所述用户的语音输入指令为语音免唤醒指令。
9.一种车载语音控制设备,其特征在于,包括:
存储器,所述存储器中存储有计算机指令;以及
处理器,所述处理器通信连接至所述存储器来执行所述计算机指令,从而执行如权利要求1-8中任一项所述的车载语音控制方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-8中任一项所述的车载语音控制方法。
Publications (1)
Publication Number | Publication Date |
---|---|
CN118262712A true CN118262712A (zh) | 2024-06-28 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2013222879B2 (en) | Method and apparatus for controlling lock/unlock state of terminal through voice recognition | |
CN112470217A (zh) | 用于确定要执行语音识别的电子装置的方法及电子装置 | |
CN104794834A (zh) | 一种智能语音门铃系统及其实现方法 | |
US20150006182A1 (en) | Systems and Methods for Dynamic Download of Embedded Voice Components | |
KR102209092B1 (ko) | 복수의 호출 용어를 이용하여 인공지능 기기를 제어하는 방법 및 시스템 | |
JP2009300537A (ja) | 音声作動システム、音声作動方法および車載装置 | |
CN112040442B (zh) | 交互方法、移动终端、车载终端及计算机可读存储介质 | |
CN113488042B (zh) | 一种语音控制方法及电子设备 | |
CN115312068B (zh) | 语音控制方法、设备及存储介质 | |
CN115881118B (zh) | 一种语音交互方法及相关电子设备 | |
US10923123B2 (en) | Two-person automatic speech recognition training to interpret unknown voice inputs | |
KR20210001082A (ko) | 사용자 발화를 처리하는 전자 장치와 그 동작 방법 | |
CN110659361A (zh) | 一种对话方法、装置、设备及介质 | |
CN114694646A (zh) | 一种语音交互处理方法及相关装置 | |
CN111726284A (zh) | 用于车载智能音箱的微信发送方法和装置 | |
CN107545895B (zh) | 信息处理方法和电子设备 | |
CN118262712A (zh) | 车载语音控制方法、设备和计算机可读存储介质 | |
CN113449068A (zh) | 一种语音交互方法及电子设备 | |
KR20200056754A (ko) | 개인화 립 리딩 모델 생성 방법 및 장치 | |
CN117012205A (zh) | 声纹识别方法、图形界面及电子设备 | |
CN115731923A (zh) | 命令词响应方法、控制设备及装置 | |
CN109597657B (zh) | 针对目标应用的操作方法、装置及计算设备 | |
CN114444042A (zh) | 一种电子设备解锁方法和装置 | |
CN112542171A (zh) | 使用语音识别功能执行动作的电子装置及其方法 | |
WO2019175960A1 (ja) | 音声処理装置および音声処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
CB02 | Change of applicant information |
Country or region after: China Address after: Room 3701, No. 866 East Changzhi Road, Hongkou District, Shanghai, 200080 Applicant after: Botai vehicle networking technology (Shanghai) Co.,Ltd. Address before: 201821 room 208, building 4, No. 1411, Yecheng Road, Jiading Industrial Zone, Jiading District, Shanghai Applicant before: Botai vehicle networking technology (Shanghai) Co.,Ltd. Country or region before: China |