CN118116375A - 唤醒车机系统的第三方语音助手的方法及相关设备 - Google Patents
唤醒车机系统的第三方语音助手的方法及相关设备 Download PDFInfo
- Publication number
- CN118116375A CN118116375A CN202211513539.8A CN202211513539A CN118116375A CN 118116375 A CN118116375 A CN 118116375A CN 202211513539 A CN202211513539 A CN 202211513539A CN 118116375 A CN118116375 A CN 118116375A
- Authority
- CN
- China
- Prior art keywords
- party
- vehicle
- voice assistant
- voice
- wake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000002618 waking effect Effects 0.000 title claims abstract description 24
- 238000004088 simulation Methods 0.000 claims abstract description 27
- 238000003860 storage Methods 0.000 claims abstract description 20
- 230000001960 triggered effect Effects 0.000 claims abstract description 17
- 230000004044 response Effects 0.000 claims abstract description 11
- 230000003213 activating effect Effects 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 10
- 238000001914 filtration Methods 0.000 description 7
- 241000238558 Eucarida Species 0.000 description 5
- 238000004378 air conditioning Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Telephone Function (AREA)
Abstract
本申请提供一种唤醒车机系统的第三方语音助手的方法、车机系统、车辆及可读存储介质。车机系统具有车机语音助手和集成在车机系统的第三方车载系统中的第三方语音助手。方法包括:响应于识别到车机语音助手的预设唤醒词,检测第三方车载系统与移动终端的互联状态;响应于检测到第三方车载系统与移动终端互联,生成模拟语音命令按钮被触发的模拟指令,语音命令按钮用于激活第三方语音助手;以及将模拟指令发送至第三方车载系统以唤醒第三方语音助手。
Description
技术领域
本申请涉及计算机技术领域,更具体地,涉及一种唤醒车机系统的第三方语音助手的方法、车机系统、车辆及可读存储介质。
背景技术
为了提高人机交互体验,大多数车机系统集成有第三方车载系统。
目前,当用户在使用第三方车载系统时,如果想要激活第三方车载系统的第三方语音助手,只能使用唤醒第三方语音助手的特定唤醒词以唤醒第三方语音助手。然而,车机系统自身还具有车机语音助手,用户想要唤醒车机语音助手,也只能使用特定的唤醒词。这就出现了不同的语音助手需要不同的唤醒词的情况,语音交互过程比较麻烦。
发明内容
本申请的第一方面在于提供一种唤醒车机系统的第三方语音助手的方法,使得用户可以使用车机语音助手的唤醒词唤醒第三方语音助手,实现了不同的语音助手能够被统一唤醒词唤醒的目的,提高人机交互体验。
本申请提供的唤醒车机系统的第三方语音助手的方法包括:响应于识别到所述车机语音助手的预设唤醒词,检测所述第三方车载系统与移动终端的互联状态;响应于检测到所述第三方车载系统与所述移动终端互联,生成模拟语音命令按钮被触发的模拟指令,所述语音命令按钮用于激活所述第三方语音助手;以及将所述模拟指令发送至所述第三方车载系统以唤醒所述第三方语音助手。
本申请的第二方面在于提供一种车机系统,包括:处理器;以及存储器,与处理器通讯连接。存储器存储有可被处理器执行的程序,当程序被处理器执行时,处理器能够执行上述的唤醒车机系统的第三方语音助手的方法。
本申请的第三方面在于提供一种车辆,包括:车机系统,所述车机系统集成有第三方车载系统,所述第三方车载系统具有第三方语音助手;以及语音命令按钮,与所述车机系统电连接,用于激活所述第三方语音助手。
本申请的第四方面在于提供一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的唤醒车机系统的第三方语音助手的方法。
附图说明
通过阅读参照以下附图所作的对非限制性实施例的详细描述,本申请的其它特征、目的和优点将会变得更明显。其中:
图1是适用于应用根据本申请实施方式的唤醒车机系统的第三方语音助手的方法的系统架构示意图;
图2是根据本申请实施方式的唤醒车机系统的第三方语音助手的方法的流程示意图;
图3是根据本申请实施方式的预先设置预设唤醒词的流程示意图;
图4是根据本申请实施方式的步骤S220的流程示意图;
图5是适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法的第一应用场景示意图;
图6是第一应用场景中的数据传输示意图;
图7是适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法的第二应用场景示意图;
图8是第二应用场景中的数据传输示意图;
图9是适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法的第三应用场景示意图;
图10是第三应用场景中的数据传输示意图;以及
图11是本申请的示例性实施方式的车机系统的结构示意图。
具体实施方式
为了更好地理解本申请,将参考附图对本申请的各个方面做出更详细的说明。应理解,这些详细说明只是对本申请的示例性实施方式的描述,而非以任何方式限制本申请的范围。在说明书全文中,相同的附图标号指代相同的元件。表述“和/或”包括相关联的所列项目中的一个或多个的任何和全部组合。
还应理解的是,诸如“包括”、“包括有”、“具有”、“包含”和/或“包含有”等表述在本说明书中是开放性而非封闭性的表述,其表示存在所陈述的特征,但不排除一个或多个其它特征和/或它们的组合的存在。此外,当描述本申请的实施方式时,使用“可”表示“本申请的一个或多个实施方式”。并且,用语“示例性的”旨在指代示例或举例说明。
除非另外限定,否则本文中使用的所有措辞(包括工程术语和科技术语)均具有与本申请所属领域普通技术人员的通常理解相同的含义。还应理解的是,除非本申请中有明确的说明,否则在常用词典中定义的词语应被解释为具有与它们在相关技术的上下文中的含义一致的含义,而不应以理想化或过于形式化的意义解释。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。另外,除非明确限定或与上下文相矛盾,否则本申请所记载的方法中包括的具体步骤不必限于所记载的顺序,而可以任意顺序执行或并行地执行。下面将参考附图并结合实施例来详细说明本申请。
本申请的示例性实施方式提出了一种唤醒车机系统的第三方语音助手的方法。其中,车机系统具有车机语音助手和集成在车机系统的第三方车载系统中的第三方语音助手。方法包括:响应于识别到车机语音助手的预设唤醒词,检测第三方车载系统与移动终端的互联状态;响应于检测到第三方车载系统与移动终端互联,生成模拟语音命令按钮被触发的模拟指令,语音命令按钮用于激活第三方语音助手,可以配置为物理按钮;以及将模拟指令发送至第三方车载系统以唤醒第三方语音助手。通过上述方案,当识别到车机语音助手的预设唤醒词时,检测第三方车载系统与移动终端的互联状态,当检测到第三方车载系统与移动终端的互联时,生成模拟语音命令按钮被触发的模拟指令,并将模拟指令发送至第三方车载系统以唤醒第三方语音助手,从而使得用户可以使用车机语音助手的唤醒词唤醒第三方语音助手,实现了不同的语音助手采用相同唤醒词的目的,提高人机交互体验。
在下文中,将结合附图更详细地描述本方案的具体示例。
图1示出了适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法的示例性系统架构100。系统架构100包括车机系统110、集成在车机系统110中的第三方车载系统120以及与可与第三方车载系统120互联的移动终端130。
第三方车载系统120例如为CarPlay、CarLife、HiCar、Android Auto中的任意一项,也可以为其他智能车载系统,本申请对此不在限制。移动终端130例如为个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。第三方车载系统120与移动终端130互联的方式可以为有线连接,也可以为无线连接。作为示例,有线连接可采用USB接口连接。无线连接可采用蓝牙连接、WIFI连接或者红外连接等连接方式。
车机系统110具有车机语音助手111,第三方车载系统120具有第三方语音助手121。用户可以通过发出语音唤醒词的形式激活车机语音助手111或者第三方语音助手121,从而可以实现语音控制的目的。
此外,车机系统110还连接有配置为激活第三方语音助手121的按钮,即语音命令按钮。当用户操作语音命令按钮时,也可以激活第三方语音助手121。可以理解的是,语音命令按钮可以为实体按键,也可以为触摸按键,也可以为屏幕上的图标控件。作为示例,语音命令按钮可以为设置在车辆方向盘上的方控。当用户操作语音命令按钮时,车机系统110检测到语音命令按钮被触发的信号,然后向第三方语音助手121发送激活指令。
当用户使用车机系统110时,可以通过车机语音助手111向车机系统110中的应用程序发送控制指令,以实现相应的功能。例如,可以通过车机语音助手111控制车机系统110的中控屏里显示的娱乐信息应用程序(非汽车部件),如播放音乐、查天气、查股票、播放电、播放电台等。还可以通过车机语音助手111操控车辆零部件,如操控空调、车窗、座椅、氛围灯等。
当用户使用第三方车载系统120时,第三方车载系统120往往是与移动终端130互联的,因此,用户不仅可以通过第三方语音助手121向第三方车载系统中的应用程序发送控制指令,以实现相应的功能。例如,可以通过第三方语音助手121控制第三方车载系统120中安装的导航、音乐、社交等APP。还可以通过第三方语音助手121控制移动终端130中相应的功能,如拨打电话、发送短信等。
图2示出了根据本申请实施方式的唤醒车机系统的第三方语音助手121的方法200的流程。唤醒车机系统的第三方语音助手121的方法200可以在图1中所示出的车机系统110中执行。如图2所示,唤醒车机系统110的第三方语音助手121的方法200的执行包括以下步骤:
S210、响应于识别到车机语音助手的预设唤醒词,检测第三方车载系统与移动终端的互联状态;
S220、响应于检测到第三方车载系统与移动终端互联,生成模拟语音命令按钮被触发的模拟指令;以及
S230、将模拟指令发送至第三方车载系统以唤醒第三方语音助手。
应当理解的是,唤醒车机系统110的第三方语音助手121的方法200中所示的步骤不是排它性的,方法200还可以包括未示出的附加步骤和/或可以省略所示出的步骤,本申请的范围在此方面不受限制。
在一些实施方式中,在步骤S210中的预设唤醒词可以是车机语音助手111的默认唤醒词,也可以是用户根据自身需求预先设置的预设唤醒词。
当采用车机语音助手111的默认唤醒词作为预设唤醒词时,无论用户想要唤醒哪一个语音助手,都可采用这一默认唤醒词。因此,用户仅需记忆这一个默认唤醒词即可实现唤醒车机语音助手111和第三方语音助手121的目的,避免出现唤醒词混淆,不能唤醒想要唤醒的语音助手的情况,提高用户的使用体验。
当用户根据自身需求预先设置预设唤醒词时,用户可以自定义喜欢的唤醒词,提升体验。需要说明的是,用户根据自身需求预先设置预设唤醒词的步骤可在方法200实施之前实施,也可包括在方法200的步骤中,对此,本申请不做限制。
在一些实施方式中,可以采用如下方法的步骤S201至步骤S202预先设置预设唤醒词。如图3所示,步骤S201至步骤S202可具体包括:
S201、接收输入的唤醒词;以及
S202、将所接收到的唤醒词注册为预设唤醒词。
当用户想要设置预设唤醒词时,可以通过车机系统110的设置菜单找到语音唤醒选项,并在唤醒词选项中点击自定义唤醒词。此时,车机系统110的中控屏可以显示“请录入语音唤醒词”的提示窗口。用户在看到提示窗口之后说出唤醒词,在步骤S201中,用户说出的包括唤醒词的声音信号被与车机系统110连接的麦克风所采集。然后在步骤S202中,麦克风所采集的声音信号被传输至车机语音助手111的语音识别引擎,语音识别引擎识别用户的声音信号从而获得用户声音信号中的唤醒词,然后将所识别到的唤醒词注册为预设唤醒词。可以理解的是,语音识别引擎也可以设置在与车机系统110通信连接的云端服务器中。
用户设置的预设唤醒词可以为符合用户使用习惯的唤醒词,例如“语音助手”“博泰”等。这不仅可以实现统一不同语音助手唤醒词的目的,还可以避免出现由于用户英文发音不标准而不能唤醒语音助手的情况。
上述步骤S201中在接收用户输入的语音时,对原始的声音信号进行模数转换、滤波和放大等预处理。模数转换将模拟信号转换为数字信号,以使车机系统能够进行信号处理。滤波能够抑制和防止数字信号中的干扰信号。例如,滤波可以是低通滤波、高通滤波、带通滤波和带阻滤波。放大能够将滤波后的数字信号进行放大,例如放大信号的幅度,以使信号更加清晰,便于后续处理。
上述步骤S202中语音识别引擎识别用户的语音从而获得用户语音中的唤醒词可通过预先训练好的语音识别模型进行。例如可采用卷积神经网络等深度学习的算法进行训练以获得语音识别模型的算法。可选的,选用R-CNN模型算法、Fast-R-CNN模型算法或者YOLO模型算法作为语音识别模型的算法。训练方法的流程大致如下:首先将采集到的音频信号以极短的时间单位进行切片,切片所得的语音片段称为帧,将每帧语音片段输入至一组梅尔滤波器,计算各个梅尔滤波器的能量并拼接成一个向量,该向量称为每帧语音片段的特征向量,即帧特征向量。对于一段定长的语音,经过分帧、提取特征向量、拼接,最终可以得到一个二维的特征矩阵,将语音信号转化成特征矩阵的过程称为预处理。之后,将该二维矩阵作为神经网络的输入,与神经网络各层的权值矩阵进行一系列的矩阵运算,最终得到各个唤醒词和非唤醒词的预测概率。对于预设唤醒词,若其预测概率最大,则表示该预设唤醒词被检测到,那么语音助手将被唤醒。
需要说明的是,本申请预先训练好的语音识别模型的算法是本领域技术人员在本申请的教导下参照相关技术可得出的,本申请此处不再赘述。
下面结合图1至图8进一步描述上述的步骤S210至S230。
S210
用户发出预设唤醒词的声音时,与车机系统110连接的麦克风采集到该声音信号,然后将采集到的声音信号传输至车机语音助手111的语音识别引擎。语音识别引擎采用预先训练好的语音识别模型识别用户的声音信号,从而在识别到用户声音信号中的预设唤醒词时,检测第三方车载系统与移动终端的互联状态。
车机系统110可以通过判断第三方车载系统120与移动终端130之间是否具有数据交换而检测第三方车载系统120与移动终端130之间的互联状态。当第三方车载系统120能够与移动终端130进行数据交换时,说明两者处于互联状态,当第三方车载系统120不能够与移动终端130进行数据交换时,说明两者处于未互联状态。
在一些实施方式中,用户发出预设唤醒词的声音时,还同时发出了语音控制指令的声音。车机系统110在接收预设唤醒词的同时也接收语音控制指令,并且语音识别引擎同样能够识别语音控制指令中的关键词。在唤醒第三方语音助手121后,将识别到的关键词发送至第三方语音助手121,以使第三方语音助手121根据关键词的语义做出响应。
在另外一些实施方式中,车机系统110在接收预设唤醒词的同时也接收语音控制指令,但是,车机语音助手111的语音识别引擎不会对语音控制指令进行识别,而是将语音控制指令保存在车机系统110中。在唤醒第三方语音助手121后,将保存的语音控制指令发送至第三方语音助手121,以使第三方语音助手121的语音识别引引擎识别该语音控制指令中的关键词并根据关键词的语义做出响应。可以理解的是,第三方语音助手121的语音识别引擎也可以设置在与第三方车载系统120通信连接的云端服务器中,例如Apple Cloud。
S220
在步骤S220中,当检测到第三方车载系统120与移动终端130处于互联状态时,生成模拟语音命令按钮被触发的模拟指令。
在一些实施方式中,如图4所示,步骤S220中生成模拟语音命令按钮被触发的模拟指令的步骤包括:
S221、生成模拟语音命令按钮被触发的事件;以及
S222、基于所生成的事件形成模拟指令。
如本文前述所记载的,车机系统110还连接有配置为激活第三方语音助手121的按钮,即语音命令按钮。当用户操作语音命令按钮时,可以激活第三方语音助手121。
本申请中,当检测到第三方车载系统120与移动终端130处于互联状态时,在步骤S221中,生成语音命令按钮被触发的事件。作为示例,当车机系统110采用安卓操作系统时,语音命令按钮被触发的事件可以为按钮updown事件。然后在步骤S222中基于生成的例如为按钮updown事件形成模拟指令。可以理解的是,当车机系统110采用鸿蒙操作系统或者IOS操作系统以及其他操作系统时,在本申请的上述教导下,本领域技术人员能够参照相关技术得出生成模拟语音命令按钮被触发的模拟指令的具体技术方案,本申请此处不再赘述。
换言之,语音命令按钮并没有被手动按下,车机系统110形成的模拟指令可以使第三方语音助手121做出与语音命令按钮被手动按下时一样的响应。
以第三方车载系统为CarPlay为例,模拟指令为RequestSiri指令,包括PreWarm(Siri准备)、ButtonDown(Siri按钮Down)、ButtonUp(Siri按钮Up)、VoiceActivation(Siri启动成功)等状态。
此处需要指出的是,当第三方车载系统为CarLife、HiCar、Android Auto或者其他智能车载系统时,可根据不同的智能车载系统生成不同的模拟指令,本领域技术在本申请的教导下参照相关技术可得出的,本申请此处不再赘述。
S230
当生成模拟语音命令按钮被触发的模拟指令之后,将模拟指令发送至第三方车载系统120以唤醒第三方语音助手121。
在一些实施方式中,可以通过预先约定的协议将模拟指令发送至第三方车载系统120。
作为示例,当第三方车载系统120为CarPlay时,通过iAP2协议发送RequestSiri指令至CarPlay以唤醒Siri语音助手。
当用户确认第三方语音助手121被唤醒之后,即可向第三方语音助手121发出语音控制指令,以使第三方语音助手121的语音识别引擎识别出该语音控制指令中的关键词并根据关键词的语义做出响应。
在一些实施方式中,当在步骤S210中检测到第三方车载系统120与移动终端130的状态为未互联时,则直接唤醒车机语音助手111。可见,本申请采用相同的预设唤醒词即可唤醒第三方语音助手121,也可唤醒车机语音助手111。
下面结合第一应用场景详细介绍本方案的具体示例。
图5示出了适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法200的示例性第一应用场景300。图6示出了第一应用场景300中的数据传输过程。
如图5所示,第一应用场景300中包括行驶中的车辆301,车辆301的座舱内包括用户302。用户302可以为驾驶车辆301的驾驶员,也可以为乘坐车辆301的其他人员。车辆301包括有车机系统303,车机系统303具有车机语音助手304,同时,车机系统303集成有第三方车载系统305,而第三方车载系统305具有第三方语音助手306。第三方车载系统305通过蓝牙接口与移动终端307互联。车辆301上还设置有配置为激活第三方语音助手306的语音命令按钮308。同时,车机系统303中保存有预设唤醒词“你好,博泰”,用于唤醒车机语音助手304或者第三方语音助手306。
用户302在驾驶车辆301的过程中,想要唤醒第三方语音助手306,并通过第三方语音助手306控制第三方车载系统305中安装的音乐播放器播放陈奕迅演唱的孤勇者。此时,用户302可发出“你好,博泰,我想听陈奕迅的孤勇者”的声音。
如图6所示,车机系统303通过麦克风接收到用户302发出的声音信号后,在步骤S210中通过车机系统303的语音识别引擎识别到预设唤醒词“你好,博泰”,然后检测第三方车载系统305与移动终端307之间的互联状态。同时,车机系统303还将麦克风接收到的声音信号保存。然后在步骤S220中,车机系统303检测到第三方车载系统305与移动终端307之间处于互联状态,则生成模拟语音命令按钮308被触发的模拟指令。随后在步骤S230中,将所生成的模拟指令发送至第三方车载系统305以唤醒第三方语音助手306。车机系统303还将保存的声音信号发生至第三方语音助手306的语音识别引擎,以使语音识别引擎识别出用户302发出的声音中的关键词“陈奕迅”“孤勇者”。第三方语音助手306控制音乐播放器启动,并在音乐播放器中搜索“陈奕迅”“孤勇者”,然后播放搜索到的音乐,以实现用户302想要听到孤勇者的目的。
下面结合第二应用场景详细介绍本方案的具体示例。
图7示出了适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法200的示例性第二应用场景400。图8示出了第二应用场景400中的数据传输过程。
如图7所示,第二应用场景400中包括行驶中的车辆401,车辆401的座舱内包括用户402。车辆401包括有车机系统403,车机系统403具有车机语音助手404,同时,车机系统403集成有第三方车载系统405,而第三方车载系统405具有第三方语音助手406。第三方车载系统405通过WIFI接口与移动终端407互联。车辆401上还设置有配置为激活第三方语音助手406的语音命令按钮408。同时,车机系统403中保存有预设唤醒词“你好,博泰”,用于唤醒车机语音助手404或者第三方语音助手406。
用户402在驾驶车辆401的过程中,想要唤醒第三方语音助手406,并通过第三方语音助手406控制移动终端407向小明拨打电话。此时,用户402可发出“你好,博泰”的声音。
如图8所示,车机系统403通过麦克风接收到用户402发出的声音信号后,在步骤S210中通过车机系统403的语音识别引擎识别到预设唤醒词“你好,博泰”,然后检测第三方车载系统405与移动终端407之间的互联状态。然后在步骤S220中,车机系统403检测到第三方车载系统405与移动终端407之间处于互联状态,则生成模拟语音命令按钮408被触发的模拟指令。随后在步骤S230中,将所生成的模拟指令发送至第三方车载系统405以唤醒第三方语音助手406。
当用户402确认第三方语音助手406被唤醒之后,发出“给小明打电话”的声音。与车机系统403连接的麦克风采集用户402发出的声音信号,并将所采集的声音信号发送至第三方车载系统405。第三方车载系统405将接收到的声音信号发送至与其通信连接的云端服务器409。云端服务器409接收到声音信号后,通过语音识别引擎识别到声音信号中包括的关键词“给小明打电话”。云端服务器409将识别到的关键词发送至第三方车载系统405的第三方语音助手406。第三方语音助手406根据接收到的关键词生成控制指令,并将控制指令发送至移动终端407以利用移动终端407向小明拨打电话。移动终端407根据接收到的控制指令拨出小明的电话号码,以实现用户402想要给小明打电话的目的。
下面结合第三应用场景详细介绍本方案的具体示例。
图9示出了适用于应用根据本申请示例性实施方式的唤醒车机系统的第三方语音助手的方法200的示例性第三应用场景500。图10示出了第三应用场景500中的数据传输过程。
如图9所示,第三应用场景500中包括行驶中的车辆501,车辆501的座舱内包括用户502。车辆501包括有车机系统503,车机系统503具有车机语音助手504,同时,车机系统503集成有第三方车载系统505,而第三方车载系统505具有第三方语音助手506。第三方车载系统505与移动终端507处于未互联状态。车辆501上还设置有配置为激活第三方语音助手506的语音命令按钮508。同时,车机系统503中保存有预设唤醒词“你好,博泰”,用于唤醒车机语音助手504或者第三方语音助手506。
用户502在驾驶车辆501的过程中,想要唤醒车机语音助手504,并通过车机语音助手504控制打开车辆501的空调组件509。此时,用户502可发出“你好,博泰,打开空调”的声音。
如图10所示,车机系统503通过麦克风接收到用户502发出的声音信号后,通过车机系统503的语音识别引擎识别到预设唤醒词“你好,博泰”,然后检测第三方车载系统505与移动终端507之间的互联状态。同时,车机系统503还将麦克风接收到的声音信号保存。然后车机系统503检测到第三方车载系统505与移动终端507之间处于未互联的状态,则唤醒车机语音助手504。随后车机系统503将保存的声音信号发生至车机语音助手504的语音识别引擎,以使语音识别引擎识别出用户502发出的声音中的关键词“打开空调”。车机语音助手504根据关键词生成打开空调组件509的控制指令,并控制指令发送至空调组件509。空调组件509在接收到控制指令后,执行该指令以实现用户502想要打开空调的目的。
此外,图11示意性示出了适于用来实现本申请示例性实施方式的车机系统的框图。车机系统1100可以是用于实现执行图2中所描述的各个方法的车机系统110、303、403、503。
如图11所示,车机系统1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序指令或者从存储器1108加载到随机存取存储器(RAM)1103中的计算机程序指令,来执行各种适当的步骤和处理。在RAM 1103中,还可存储车机系统操作所需的各种程序和数据。处理器1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
车机系统1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、手写笔等;输出单元1107,例如各种类型的显示器、扬声器等;存储器1108,例如磁盘、外接硬盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许车机系统通过诸如因特网的计算机网络和/或各种电信网络与其它设备交换信息/数据。
处理器1101可以是各种具有处理和计算能力的通用和/或专用处理部件。处理器1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器1101可以执行上文所描述的各个方法和处理,例如执行方法200。例如,在一些实施方式中,方法200可被实现为计算机软件程序,其被存储于机器可读介质,例如存储器1108。在一些实施方式中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到车机系统上。当计算机程序加载到RAM 1103并由处理器1101执行时,可以执行上文描述的方法200中的一个或多个步骤。可选地,在其他实施方式中,处理器1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法200中的一个或多个步骤。
需要进一步说明的是,本申请可以包括方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本申请的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。本文中所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
本文中所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘车机系统。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,该编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如C语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或车机系统上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本申请的各个方面。
本文中参照根据本申请示例性实施方式的方法、设备(系统)、和计算机程序产品的流程图和/或时序图描述了本申请的各个方面。应当理解,流程图和/或时序图的每个步骤以及流程图和/或时序图中各步骤的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给车机系统中的处理器、通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或时序图中的一个或多个步骤中规定的功能/步骤。
附图中的流程图和时序图显示了根据本申请的多个实施方式的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或时序图中的每个步骤可以代表一个模块、程序段或指令的一部分,该模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实施方式中,步骤中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,时序图和/或流程图中的每个步骤、以及时序图和/或流程图中的步骤的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
此外,本申请的示例性实施方式还提供一种车辆,包括上述的车机系统,车机系统集成有第三方车载系统,第三方车载系统具有第三方语音助手。车辆还包括语音命令按钮,语音命令按钮配置为用于激活第三方语音助手。
在一些实施方式中,车辆还包括方向盘。语音命令按钮安装在方向盘上,与车机系统电连接。
以上描述仅为本申请的较佳实施方式以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种唤醒车机系统的第三方语音助手的方法,其特征在于,所述车机系统具有车机语音助手和集成在所述车机系统的第三方车载系统中的第三方语音助手;
所述方法包括:
响应于识别到所述车机语音助手的预设唤醒词,检测所述第三方车载系统与移动终端的互联状态;
响应于检测到所述第三方车载系统与所述移动终端互联,生成模拟语音命令按钮被触发的模拟指令,所述语音命令按钮用于激活所述第三方语音助手;以及
将所述模拟指令发送至所述第三方车载系统以唤醒所述第三方语音助手。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定出所述第三方车载系统与所述移动终端未互联,唤醒所述车机语音助手。
3.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定出所述第三方语音助手被唤醒,接收语音控制指令;以及
将所接收到的语音控制指令发送至所述第三方语音助手,以使所述第三方语音助手执行所述语音控制指令。
4.根据权利要求1至3中任一项所述的方法,其中,所述方法还包括:
接收输入的唤醒词;以及
将所接收到的唤醒词注册为所述预设唤醒词。
5.根据权利要求1至3中任一项所述的方法,其中,生成模拟所述语音命令按钮被触发的模拟指令的步骤包括:
生成模拟所述语音命令按钮被触发的事件;以及
基于所生成的事件形成所述模拟指令。
6.根据权利要求1至3中任一项所述的方法,其中,将所述模拟指令发送至所述第三方车载系统的步骤包括:
通过预先约定的协议将所述模拟指令发送至所述第三方车载系统。
7.一种车机系统,其特征在于,包括:
处理器;以及
存储器,与所述处理器通讯连接;
其中,所述存储器存储有可被处理器执行的程序,当程序被所述处理器执行时,所述处理器能够执行根据权利要求1至6中任一所述的方法。
8.一种车辆,其特征在于,包括:
根据权利要求7所述的车机系统,所述车机系统集成有第三方车载系统,所述第三方车载系统具有第三方语音助手;以及
语音命令按钮,用于激活所述第三方语音助手。
9.根据权利要求8所述的车辆,其特征在于,所述语音命令按钮安装在方向盘上,所述语音命令按钮与所述车机系统电连接。
10.一种可读存储介质,其特征在于,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现根据权利要求1至6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211513539.8A CN118116375A (zh) | 2022-11-29 | 2022-11-29 | 唤醒车机系统的第三方语音助手的方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211513539.8A CN118116375A (zh) | 2022-11-29 | 2022-11-29 | 唤醒车机系统的第三方语音助手的方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118116375A true CN118116375A (zh) | 2024-05-31 |
Family
ID=91209249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211513539.8A Pending CN118116375A (zh) | 2022-11-29 | 2022-11-29 | 唤醒车机系统的第三方语音助手的方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118116375A (zh) |
-
2022
- 2022-11-29 CN CN202211513539.8A patent/CN118116375A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109410952B (zh) | 一种语音唤醒方法、装置及系统 | |
KR102388992B1 (ko) | 단일 음향 모델 및 자동 악센트 검출로 텍스트 규칙 기반 멀티-악센트 음성 인식 | |
CN111095400A (zh) | 选择系统和方法 | |
CN110998720A (zh) | 话音数据处理方法及支持该方法的电子设备 | |
US11302325B2 (en) | Automatic dialogue design | |
CN111354363A (zh) | 车载语音识别方法、装置、可读存储介质及电子设备 | |
CN205354646U (zh) | 一种应用于车载设备的智能语音识别系统 | |
CN107919138B (zh) | 一种语音中的情绪处理方法及移动终端 | |
US20240038238A1 (en) | Electronic device, speech recognition method therefor, and medium | |
CN112509584A (zh) | 声源位置确定方法、装置和电子设备 | |
CN115312068B (zh) | 语音控制方法、设备及存储介质 | |
US20200286479A1 (en) | Agent device, method for controlling agent device, and storage medium | |
US20220284906A1 (en) | Electronic device and operation method for performing speech recognition | |
US10923123B2 (en) | Two-person automatic speech recognition training to interpret unknown voice inputs | |
CN111883121A (zh) | 唤醒方法、装置及电子设备 | |
KR20190056115A (ko) | 차량의 음성인식 시스템 및 방법 | |
CN112259076A (zh) | 语音交互方法、装置、电子设备及计算机可读存储介质 | |
CN118116375A (zh) | 唤醒车机系统的第三方语音助手的方法及相关设备 | |
CN113287117A (zh) | 交互系统和方法 | |
CN112009395A (zh) | 一种交互控制方法、车载终端及车辆 | |
CN108702410B (zh) | 一种情景模式控制方法及移动终端 | |
CN115841814A (zh) | 语音交互方法及电子设备 | |
CN112634883A (zh) | 控制用户界面 | |
CN114203156A (zh) | 音频识别方法、音频识别装置、电子设备和存储介质 | |
CN115331672B (zh) | 设备控制方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Country or region after: China Address after: Room 3701, No. 866 East Changzhi Road, Hongkou District, Shanghai, 200080 Applicant after: Botai vehicle networking technology (Shanghai) Co.,Ltd. Address before: 201821 room 208, building 4, No. 1411, Yecheng Road, Jiading Industrial Zone, Jiading District, Shanghai Applicant before: Botai vehicle networking technology (Shanghai) Co.,Ltd. Country or region before: China |