CN116016578B - 一种基于设备状态和用户行为的智能语音引导方法 - Google Patents
一种基于设备状态和用户行为的智能语音引导方法 Download PDFInfo
- Publication number
- CN116016578B CN116016578B CN202211468246.2A CN202211468246A CN116016578B CN 116016578 B CN116016578 B CN 116016578B CN 202211468246 A CN202211468246 A CN 202211468246A CN 116016578 B CN116016578 B CN 116016578B
- Authority
- CN
- China
- Prior art keywords
- preset
- information
- interactable
- voice
- guiding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000013507 mapping Methods 0.000 claims abstract description 80
- 230000002452 interceptive effect Effects 0.000 claims abstract description 67
- 230000003993 interaction Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 abstract description 33
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Navigation (AREA)
Abstract
本申请公开了一种基于设备状态和用户行为的智能语音引导方法。所述基于设备状态和用户行为的智能语音引导方法包括:云端获取客户端所传递的车辆使用数据信息;云端获取预设可交互意图信息以及预设的引导话术;云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;车端获取使用者的语音唤醒信号;车端获取当前场景信息;车端根据当前场景信息以及语音规则映射数据库生成引导信息。本申请所提供的基于设备状态和用户行为的智能语音引导方法通过预设的语音规则映射数据库来为驾驶者推荐引导信息,从而能够防止驾驶者完全不知道一些比较隐蔽或者不经常用的可交互内容。
Description
技术领域
本申请车辆语音交互技术领域,尤其涉及一种基于设备状态和用户行为的智能语音引导方法、车辆用智能语音引导方法以及车辆用智能语音引导装置。
背景技术
在用车过程中GUI(图形化交互)方式伴随着硬按键、触摸屏系统已经使用了几十年,随着车联网和人工智能技术的发展,VUI(语音交互)方式兴起,在智能车中得到普遍配备。因其便捷的使用方式,在用车过程中,越来越多的用户接受以语VUI控制车辆的设备,并且在行车的安全性也有助益。
但由于VUI自身形式限制,不能像GUI一样直观的将功能列表展现给用户,用户不清楚VUI支持哪些功能,因此多数时候是在用户找不到GUI的按键位置时,才会想起VUI方式。为解决此问题业内提出语音交互引导话术功能,第一种方案是通过在用户使用手册中列出VUI功能的说法,如:打开空调,打电话给张三等,来告知用户VUI支持的功能列表;另一种方案是在第一种方案基础上设置触发话术展现的时机,即VUI预测用户GUI行为,如长安汽车的CN201710676977.9-语音交互引导系统及方法
以上两种方案由于是预制在系统中,跟用户使用习惯相关性不高,不具备个性化、智能化。另外,第一种解决方法用户使用成本高,经常会忘记使用话术说法,不如GUI的按键直观。第二种解决方法会打断用户当前操作,给用户带来不必要的麻烦。
目前语音交互引导系统存在以下两个问题:
1.语音交互引导话术预置在系统中,导致引导内容与用户使用习惯和使用场景不匹的问题;
2.语音交互引导时机预置规则在系统中,导致引导时机和次数固定(引导n次后不再引导),语音交互引导时机会打断用户当前操作,影响操作体验,增加操作流程,降低行车安全。
因此,希望有一种技术方案来解决或至少减轻现有技术的上述不足。
发明内容
本发明的目的在于提供一种基于设备状态和用户行为的智能语音引导方法来至少解决上述的一个技术问题。
本发明提供了下述方案:
根据本发明的一个方面,提供一种基于设备状态和用户行为的智能语音引导方法,所述基于设备状态和用户行为的智能语音引导方法包括:
云端获取车载客户端所传递的车辆使用数据信息;
云端获取预设的预设可交互意图信息以及预设的引导话术;
云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;
车端获取使用者的语音唤醒信号;
车端获取当前场景信息;
车端根据所述当前场景信息以及语音规则映射数据库生成引导信息。
可选地,所述语音规则映射数据库包括至少一个预设场景信息、预设可交互意图信息以及预设引导话术,一个场景信息与至少一个预设可交互意图信息关联,一个预设可交互意图信息与至少一个预设引导话术关联;
所述车端根据所述当前场景信息以及语音规则映射数据库生成引导信息包括:
车端获取与当前场景信息相同的预设场景信息所关联的预设可交互意图信息;
车端判断所述预设可交互意图信息的数量是否等于1,若是,则
车端根据所述预设可交互意图信息所关联的预设引导话术生成引导信息。
可选地,所述车端根据所述当前场景信息以及语音规则映射数据库生成引导语进一步包括:
车端判断所述预设可交互意图信息的数量是否大于1,若是,则
车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息;
根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息。
可选地,所述语音规则映射数据库进一步包括预设引导话术使用次数;
所述车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息包括:
车端选取预设可交互意图信息所关联的预设引导话术使用次数小于预设阈值或使用次数最少的预设可交互意图信息。
可选地,所述根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息包括:
车端对每个预设可交互意图信息进行如下操作:车端获取预设可交互意图信息所对应的各个预设引导话术中使用次数最少的一个预设引导话术;
根据各个获取的预设引导话术生成引导信息。
可选地,所述基于设备状态和用户行为的智能语音引导方法进一步包括:
车端获取驾驶者图像信息;
车端获取驾驶者使用引导信息频率数据库,所述驾驶者使用引导信息频率数据库包括至少一个预设驾驶者图像信息以及引导信息使用频率数据库,一个预设驾驶者图像信息与一个引导信息使用频率数据库关联;
车端将所述驾驶者图像信息与各个所述预设驾驶者图像信息进行相似度比对,从而获取相似度超过预设阈值的预设驾驶者图像信息所对应的引导信息使用频率数据库;
车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报。
可选地,每个引导信息使用频率数据库包括至少一个预设引导信息以及每个预设引导信息所对应的使用频率;
所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率未超过预设阈值,则
车端根据获取的引导信息使用频率数据库将生成的引导信息进行显示和/或播报。
可选地,所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报进一步包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率超过预设阈值,则
判断生成的引导信息所关联的预设可交互意图信息是否还与其他预设引导话术关联,若是,则
选择其他引导话术生成引导信息。
本申请还提供了一种车辆用智能语音引导方法,所述车辆用智能语音引导方法包括:
获取语音规则映射数据库;
获取使用者的语音唤醒信号;
获取当前场景信息;
根据所述当前场景信息以及语音规则映射数据库生成引导信息。
本申请还提供了一种车辆用智能语音引导装置,所述车辆用智能语音引导装置包括:
语音规则映射数据库获取模块,所述语音规则映射数据库获取模块用于获取语音规则映射数据库;
语音唤醒信号获取模块,所述语音唤醒信号获取模块用于获取使用者的语音唤醒信号;
当前场景信息获取模块,所述当前场景信息获取模块用于获取当前场景信息;
引导信息生成模块,所述引导信息生成模块用于根据所述当前场景信息以及语音规则映射数据库生成引导信息。
本申请所提供的基于设备状态和用户行为的智能语音引导方法通过预设的语音规则映射数据库来为驾驶者推荐引导信息,从而具有如下优点:
1、基于当前设备状态和用户行为序列引导用户语音交互功能,引导信息与用户行为习惯和当前情景高度相关。
2、语音交互引导时机基于当前设备状态,而非当前用户行为,避免打断用户槽位,造成用户困扰。
3、防止驾驶者完全不知道一些比较隐蔽或者不经常用的可交互内容。
附图说明
图1是本申请一实施例中的基于设备状态和用户行为的智能语音引导方法的流程示意图。
图2是本申请一个实施例提供的基于设备状态和用户行为的智能语音引导方法的一种电子设备结构框图。
图3是本申请一个实施例中的语音规则映射数据库的示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本申请一实施例中的基于设备状态和用户行为的智能语音引导方法的流程示意图。
如图1所示的基于设备状态和用户行为的智能语音引导方法包括:
步骤1:云端获取车载客户端所传递的车辆使用数据信息;
步骤2:云端获取预设的预设可交互意图信息以及预设的引导话术;
步骤3:云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;
步骤4:车端获取使用者的语音唤醒信号;
步骤5:车端获取当前场景信息;
步骤6:车端根据所述当前场景信息以及语音规则映射数据库生成引导信息。
本申请所提供的基于设备状态和用户行为的智能语音引导方法通过预设的语音规则映射数据库来为驾驶者推荐引导信息,从而具有如下优点:
1、基于当前设备状态和用户行为序列引导用户语音交互功能,引导信息与用户行为习惯和当前情景高度相关。
2、语音交互引导时机基于当前设备状态,而非当前用户行为,避免打断用户槽位,造成用户困扰。
3、防止驾驶者完全不知道一些比较隐蔽或者不经常用的可交互内容。
在本实施例中,语音规则映射数据库包括至少一个预设场景信息、预设可交互意图信息以及预设引导话术,一个场景信息与至少一个预设可交互意图信息关联,一个预设可交互意图信息与至少一个预设引导话术关联;
所述车端根据所述当前场景信息以及语音规则映射数据库生成引导信息包括:
车端获取与当前场景信息相同的预设场景信息所关联的预设可交互意图信息;
车端判断所述预设可交互意图信息的数量是否等于1,若是,则
车端根据所述预设可交互意图信息所关联的预设引导话术生成引导信息。
在本实施例中,所述车端根据所述当前场景信息以及语音规则映射数据库生成引导语进一步包括:
车端判断所述预设可交互意图信息的数量是否大于1,若是,则
车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息;
根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息。
在本实施例中,所述语音规则映射数据库进一步包括预设引导话术使用次数;
所述车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息包括:
车端选取预设可交互意图信息所关联的预设引导话术使用次数小于预设阈值或使用次数最少的预设可交互意图信息。
在本实施例中,所述根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息包括:
车端对每个预设可交互意图信息进行如下操作:车端获取预设可交互意图信息所对应的各个预设引导话术中使用次数最少的一个预设引导话术;
根据各个获取的预设引导话术生成引导信息。
在本实施例中,所述基于设备状态和用户行为的智能语音引导方法进一步包括:
车端获取驾驶者图像信息;
车端获取驾驶者使用引导信息频率数据库,所述驾驶者使用引导信息频率数据库包括至少一个预设驾驶者图像信息以及引导信息使用频率数据库,一个预设驾驶者图像信息与一个引导信息使用频率数据库关联;
车端将所述驾驶者图像信息与各个所述预设驾驶者图像信息进行相似度比对,从而获取相似度超过预设阈值的预设驾驶者图像信息所对应的引导信息使用频率数据库;
车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报。
在本实施例中,每个引导信息使用频率数据库包括至少一个预设引导信息以及每个预设引导信息所对应的使用频率;
所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率未超过预设阈值,则
车端根据获取的引导信息使用频率数据库将生成的引导信息进行显示和/或播报。
在本实施例中,所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报进一步包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率超过预设阈值,则
判断生成的引导信息所关联的预设可交互意图信息是否还与其他预设引导话术关联,若是,则
选择其他引导话术生成引导信息。
下面以举例的方式对本申请进行进一步详细举例,可以理解的是,该举例并不构成对本申请的任何限制。
云端获取车载客户端所传递的车辆使用数据信息,举例,各个车型A均向云端传递自身的车辆使用数据信息,在本实施例中,车辆使用数据信息包括设备状态信息、用户GUI行为序列数据,例如,图3中的设备状态信息中的导航状态、导航页面均属于设备状态信息;图3中的1、打开地点收藏夹、2打开公司卡片详情等,都属于GUI行为序列,另外,打开导航页面本身也属于GUI行为序列。
云端获取预设的预设可交互意图信息以及预设的引导话术,在本实施例中,图3中的页面意图:navi_exit等即为预设可交互意图信息,图3中的引导话术中的退出导航、还有多久到即为引导话术;
云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;
具体而言,本申请最终所形成的语音规则映射数据库可以以表格形式体现,例如图3所示,另外,本申请采用如下方法生成语音规则映射数据库:
b)云端接收客户端上报的车辆使用数据信息,对设备状态信息,用户GUI行为序列数据做规范化处理:目的是对数据做统一化表示,为后续数据挖掘分析做数据准备。;
c)从时空维度对齐设备状态信息和用户GUI行为序列数据,目的是在云端重构用户GUI交互数据流;
d)分析用户GUI交互数据流中设备状态、用户GUI行为序列,主要分析原则是设备状态和用户GUI行为序列是否可以抽象出一个预设可交互意图信息,如果可以就生成一条设备状态信息、用户GUI行为序列与预设可交互意图信息的映射规则:《设备状态,GUI行为序列,预设可交互意图信息》,否则抛弃掉;
e)对d)映射关系中的每一个预设可交互意图信息,通过用户历史语音请求数据挖掘预设可交互意图信息对应的高频话术作为该预设可交互意图信息的引导话术集合,以及计算预设可交互意图信息的交互频次均值以及引导话术使用频次均值作为引导触发频次值。对于未挖掘到话术的语音指令,人为设计引导话术集合,触发频次值根据经验设置。将引导话术集合和触发频次合并到映射规则对中,从而形成最终的语音规则映射数据库。
f)最后将语音规则映射数据库推送到车载客户端用于语音交互引导功能。
在实际使用时,车端获取使用者的语音唤醒信号;
车端获取当前场景信息;
车端根据所述当前场景信息以及语音规则映射数据库生成引导信息。
具体而言,车端获取使用者的语音唤醒信号,例如,车端通过唤醒语:小度小度唤醒百度地图;
车端获取当前场景信息,例如,当前场景信息为导航场景。
车端根据所述当前场景信息以及语音规则映射数据库生成引导信息,具体而言:
车端根据当前场景信息以及语音规则映射数据库生成引导信息包括:
车端获取与当前场景信息相同的预设场景信息所关联的预设可交互意图信息(即当前场景为导航场景,预设可交互意图信息如图3所示,包括navi_exit,navi_info等);
车端判断所述预设可交互意图信息的数量是否等于1(假设如果只有navi_exit,则认为只有一个),若是,则
车端根据所述预设可交互意图信息所关联的预设引导话术生成引导信息。
在本实施例中,车端判断预设可交互意图信息的数量是否大于1(参见图3,图3中有3个),若是,则
车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息;
根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息。
在本实施例中,车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息包括:
车端选取预设可交互意图信息所关联的预设引导话术使用次数小于预设阈值或使用次数最少的预设可交互意图信息。参见图3,其中退出导航的次数为0,还有多久到、还有多远到目的地的次数为0,因此,选择这两个所对应的预设可交互意图信息。
根据所选取的各个预设可交互意图信息分别关联的预设引导话术生成引导信息包括:
车端对每个预设可交互意图信息进行如下操作:车端获取预设可交互意图信息所对应的各个预设引导话术中使用次数最少的一个预设引导话术;
根据各个获取的预设引导话术生成引导信息(在本实施例中,由于各个获取到的引导话术均为0,因此,根据退出导航、还有多久到、还有多远到目的地的生成引导信息)。
在本实施例中,引导信息可以通过显示屏显示,即将上述文字(退出导航、还有多久到、还有多远到目的地的生成引导信息)显示在屏幕中,让驾驶者知道可以语音这些文字进行交互。
在其他实施例中,还可以通过语音播报的方式将引导信息播放。
可以理解的是,在其他实施例中,所述基于设备状态和用户行为的智能语音引导方法进一步包括:
车端获取驾驶者图像信息;
车端获取驾驶者使用引导信息频率数据库,所述驾驶者使用引导信息频率数据库包括至少一个预设驾驶者图像信息以及引导信息使用频率数据库,一个预设驾驶者图像信息与一个引导信息使用频率数据库关联;
车端将所述驾驶者图像信息与各个所述预设驾驶者图像信息进行相似度比对,从而获取相似度超过预设阈值的预设驾驶者图像信息所对应的引导信息使用频率数据库;
车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报。
具体而言,每个引导信息使用频率数据库包括至少一个预设引导信息以及每个预设引导信息所对应的使用频率;
所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率未超过预设阈值,则
车端根据获取的引导信息使用频率数据库将生成的引导信息进行显示和/或播报。
举例来说,假设导航去公司这个预设引导信息已经被这个驾驶者使用过很多次,那么明显这个驾驶者知道能够进行这样的语音交互,那么驾驶者如果不说这个语音交互,可能是因为根本不想用这个语音交互,此时,就不需要特地为驾驶员播报该引导信息。
可以理解的是,在某些时候,当该预设引导信息还有一些并列的其他预设引导信息时(例如,图3中还有多久到与还有多远到目的地就属于并列的),此时,驾驶者可能习惯说还有多远到目的地,而不知道如果说还有多久到也可以进行语音交互,此时,就可以将引导信息换成还有多久到。
采用这种方式,可以针对不同驾驶者进行不同的引导,从而使得引导更为智能。
在本实施例中,本申请还提供了一种车辆用智能语音引导方法,所述车辆用智能语音引导方法包括:
获取语音规则映射数据库;
获取使用者的语音唤醒信号;
获取当前场景信息;
根据所述当前场景信息以及语音规则映射数据库生成引导信息。
在本实施例中,云端所做的事情可以在离线状态下完成,即在离线状态下生成语音规则映射数据库。
在本实施例中,本申请还提供了一种车辆用智能语音引导装置,所述车辆用智能语音引导装置包括语音规则映射数据库获取模块、语音唤醒信号获取模块、当前场景信息获取模块以及引导信息生成模块,其中,
语音规则映射数据库获取模块用于获取语音规则映射数据库;
语音唤醒信号获取模块用于获取使用者的语音唤醒信号;
当前场景信息获取模块用于获取当前场景信息;
引导信息生成模块用于根据所述当前场景信息以及语音规则映射数据库生成引导信息。
图2是本发明一个或多个实施例提供的一种电子设备结构框图。
如图2所示,本申请还公开了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器中存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行车辆用智能语音引导方法的步骤。
本申请还提供了一种计算机可读存储介质,其存储有可由电子设备执行的计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行车辆用智能语音引导方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
电子设备包括硬件层,运行在硬件层之上的操作系统层,以及运行在操作系统上的应用层。该硬件层包括中央处理器(CPU,Central Processing Unit)、内存管理单元(MMU,Memory Management Unit)和内存等硬件。该操作系统可以是任意一种或多种通过进程(Process)实现电子设备控制的计算机操作系统,例如,Linux操作系统、Unix操作系统、Android操作系统、iOS操作系统或windows操作系统等。并且在本发明实施例中该电子设备可以是智能手机、平板电脑等手持设备,也可以是桌面计算机、便携式计算机等电子设备,本发明实施例中并未特别限定。
本发明实施例中的电子设备控制的执行主体可以是电子设备,或者是电子设备中能够调用程序并执行程序的功能模块。电子设备可以获取到存储介质对应的固件,存储介质对应的固件由供应商提供,不同存储介质对应的固件可以相同可以不同,在此不做限定。电子设备获取到存储介质对应的固件后,可以将该存储介质对应的固件写入存储介质中,具体地是往该存储介质中烧入该存储介质对应固件。将固件烧入存储介质的过程可以采用现有技术实现,在本发明实施例中不做赘述。
电子设备还可以获取到存储介质对应的重置命令,存储介质对应的重置命令由供应商提供,不同存储介质对应的重置命令可以相同可以不同,在此不做限定。
此时电子设备的存储介质为写入了对应的固件的存储介质,电子设备可以在写入了对应的固件的存储介质中响应该存储介质对应的重置命令,从而电子设备根据存储介质对应的重置命令,对该写入对应的固件的存储介质进行重置。根据重置命令对存储介质进行重置的过程可以现有技术实现,在本发明实施例中不做赘述。
为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (5)
1.一种基于设备状态和用户行为的智能语音引导方法,其特征在于,所述基于设备状态和用户行为的智能语音引导方法包括:
云端获取车载客户端所传递的车辆使用数据信息;
云端获取预设的预设可交互意图信息以及预设的引导话术;
云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;
车端获取使用者的语音唤醒信号;
车端获取当前场景信息;
车端根据所述当前场景信息以及语音规则映射数据库生成引导信息;
所述语音规则映射数据库包括至少一个预设场景信息、预设可交互意图信息以及预设引导话术,一个场景信息与至少一个预设可交互意图信息关联,一个预设可交互意图信息与至少一个预设引导话术关联;
所述车端根据所述当前场景信息以及语音规则映射数据库生成引导信息包括:
车端获取与当前场景信息相同的预设场景信息所关联的预设可交互意图信息;
车端判断所述预设可交互意图信息的数量是否等于1,若是,则
车端根据所述预设可交互意图信息所关联的预设引导话术生成引导信息;
所述车端根据所述当前场景信息以及语音规则映射数据库生成引导语进一步包括:
车端判断所述预设可交互意图信息的数量是否大于1,若是,则
车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息;
根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息;
所述语音规则映射数据库进一步包括预设引导话术使用次数;
所述车端自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息包括:
车端选取预设可交互意图信息所关联的预设引导话术使用次数小于预设阈值或使用次数最少的预设可交互意图信息;
所述根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息包括:
车端对每个预设可交互意图信息进行如下操作:车端获取预设可交互意图信息所对应的各个预设引导话术中使用次数最少的一个预设引导话术;
根据各个获取的预设引导话术生成引导信息;
所述基于设备状态和用户行为的智能语音引导方法进一步包括:
车端获取驾驶者图像信息;
车端获取驾驶者使用引导信息频率数据库,所述驾驶者使用引导信息频率数据库包括至少一个预设驾驶者图像信息以及引导信息使用频率数据库,一个预设驾驶者图像信息与一个引导信息使用频率数据库关联;
车端将所述驾驶者图像信息与各个所述预设驾驶者图像信息进行相似度比对,从而获取相似度超过预设阈值的预设驾驶者图像信息所对应的引导信息使用频率数据库;
车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报;其中,
所述语音规则映射数据库采用如下方法获取:
云端接收客户端上报的车辆使用数据信息,对设备状态信息、用户GUI行为序列数据做规范化处理;
从时空维度对齐设备状态信息和用户GUI行为序列数据;
分析用户设备状态信息、用户GUI行为序列数据,判断是否能够从设备状态和用户GUI行为序列中获取预设可交互意图信息,若是,则生成一条设备状态信息、用户GUI行为序列与预设可交互意图信息的映射规则;
对每一个生成的映射规则中的每一个预设可交互意图信息,通过用户历史语音请求数据挖掘预设可交互意图信息对应的高频话术作为该预设可交互意图信息的引导话术集合,并获取预设可交互意图信息的交互频次均值以及引导话术使用频次均值作为引导触发频次值。
2.如权利要求1所述的基于设备状态和用户行为的智能语音引导方法,其特征在于,每个引导信息使用频率数据库包括至少一个预设引导信息以及每个预设引导信息所对应的使用频率;
所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率未超过预设阈值,则
车端根据获取的引导信息使用频率数据库将生成的引导信息进行显示和/或播报。
3.如权利要求2所述的基于设备状态和用户行为的智能语音引导方法,其特征在于,所述车端根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报进一步包括:
车端获取与生成的引导信息相同的预设引导信息所对应的预设引导信息所对应的使用频率,若使用频率超过预设阈值,则
判断生成的引导信息所关联的预设可交互意图信息是否还与其他预设引导话术关联,若是,则
选择其他引导话术生成引导信息。
4.一种车辆用智能语音引导方法,其特征在于,所述车辆用智能语音引导方法包括:
获取语音规则映射数据库;
获取使用者的语音唤醒信号;
获取当前场景信息;
根据所述当前场景信息以及语音规则映射数据库生成引导信息;其中,
语音规则映射数据库采用如下方法获取:
云端获取车载客户端所传递的车辆使用数据信息;
云端获取预设的预设可交互意图信息以及预设的引导话术;
云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;
所述语音规则映射数据库包括至少一个预设场景信息、预设可交互意图信息以及预设引导话术,一个场景信息与至少一个预设可交互意图信息关联,一个预设可交互意图信息与至少一个预设引导话术关联;
所述根据所述当前场景信息以及语音规则映射数据库生成引导信息包括:
获取与当前场景信息相同的预设场景信息所关联的预设可交互意图信息;
判断所述预设可交互意图信息的数量是否等于1,若是,则
根据所述预设可交互意图信息所关联的预设引导话术生成引导信息;
根据所述当前场景信息以及语音规则映射数据库生成引导语进一步包括:
判断所述预设可交互意图信息的数量是否大于1,若是,则
自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息;
根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息;
所述语音规则映射数据库进一步包括预设引导话术使用次数;
自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息包括:
选取预设可交互意图信息所关联的预设引导话术使用次数小于预设阈值或使用次数最少的预设可交互意图信息;
所述根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息包括:
对每个预设可交互意图信息进行如下操作:车端获取预设可交互意图信息所对应的各个预设引导话术中使用次数最少的一个预设引导话术;
根据各个获取的预设引导话术生成引导信息;
所述车辆用智能语音引导方法进一步包括:
获取驾驶者图像信息;
获取驾驶者使用引导信息频率数据库,所述驾驶者使用引导信息频率数据库包括至少一个预设驾驶者图像信息以及引导信息使用频率数据库,一个预设驾驶者图像信息与一个引导信息使用频率数据库关联;
将所述驾驶者图像信息与各个所述预设驾驶者图像信息进行相似度比对,从而获取相似度超过预设阈值的预设驾驶者图像信息所对应的引导信息使用频率数据库;
根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报;其中,
所述语音规则映射数据库采用如下方法获取:
云端接收客户端上报的车辆使用数据信息,对设备状态信息、用户GUI行为序列数据做规范化处理;
从时空维度对齐设备状态信息和用户GUI行为序列数据;
分析用户设备状态信息、用户GUI行为序列数据,判断是否能够从设备状态和用户GUI行为序列中获取预设可交互意图信息,若是,则生成一条设备状态信息、用户GUI行为序列与预设可交互意图信息的映射规则;
对每一个生成的映射规则中的每一个预设可交互意图信息,通过用户历史语音请求数据挖掘预设可交互意图信息对应的高频话术作为该预设可交互意图信息的引导话术集合,并获取预设可交互意图信息的交互频次均值以及引导话术使用频次均值作为引导触发频次值。
5.一种车辆用智能语音引导装置,其特征在于,所述车辆用智能语音引导装置包括:
语音规则映射数据库获取模块,所述语音规则映射数据库获取模块用于获取语音规则映射数据库;
语音唤醒信号获取模块,所述语音唤醒信号获取模块用于获取使用者的语音唤醒信号;
当前场景信息获取模块,所述当前场景信息获取模块用于获取当前场景信息;
引导信息生成模块,所述引导信息生成模块用于根据所述当前场景信息以及语音规则映射数据库生成引导信息;其中,
语音规则映射数据库采用如下方法获取:
云端获取车载客户端所传递的车辆使用数据信息;
云端获取预设的预设可交互意图信息以及预设的引导话术;
云端根据所述预设可交互意图信息、预设的引导话术以及车辆使用数据信息生成语音规则映射数据库并将所述语音规则映射数据库发送给车端;
所述语音规则映射数据库包括至少一个预设场景信息、预设可交互意图信息以及预设引导话术,一个场景信息与至少一个预设可交互意图信息关联,一个预设可交互意图信息与至少一个预设引导话术关联;
所述根据所述当前场景信息以及语音规则映射数据库生成引导信息包括:
获取与当前场景信息相同的预设场景信息所关联的预设可交互意图信息;
判断所述预设可交互意图信息的数量是否等于1,若是,则
根据所述预设可交互意图信息所关联的预设引导话术生成引导信息;
根据所述当前场景信息以及语音规则映射数据库生成引导语进一步包括:
判断所述预设可交互意图信息的数量是否大于1,若是,则
自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息;
根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息;
所述语音规则映射数据库进一步包括预设引导话术使用次数;
自各个所述预设可交互意图信息中选取其中一个或多个预设可交互意图信息包括:
选取预设可交互意图信息所关联的预设引导话术使用次数小于预设阈值或使用次数最少的预设可交互意图信息;
所述根据所选取的各个所述预设可交互意图信息分别关联的预设引导话术生成引导信息包括:
对每个预设可交互意图信息进行如下操作:车端获取预设可交互意图信息所对应的各个预设引导话术中使用次数最少的一个预设引导话术;
根据各个获取的预设引导话术生成引导信息;
所述车辆用智能语音引导装置进一步包括:
获取驾驶者图像信息;
获取驾驶者使用引导信息频率数据库,所述驾驶者使用引导信息频率数据库包括至少一个预设驾驶者图像信息以及引导信息使用频率数据库,一个预设驾驶者图像信息与一个引导信息使用频率数据库关联;
将所述驾驶者图像信息与各个所述预设驾驶者图像信息进行相似度比对,从而获取相似度超过预设阈值的预设驾驶者图像信息所对应的引导信息使用频率数据库;
根据获取的引导信息使用频率数据库判断是否将生成的引导信息进行显示和/或播报;其中,
所述语音规则映射数据库采用如下方法获取:
云端接收客户端上报的车辆使用数据信息,对设备状态信息、用户GUI行为序列数据做规范化处理;
从时空维度对齐设备状态信息和用户GUI行为序列数据;
分析用户设备状态信息、用户GUI行为序列数据,判断是否能够从设备状态和用户GUI行为序列中获取预设可交互意图信息,若是,则生成一条设备状态信息、用户GUI行为序列与预设可交互意图信息的映射规则;
对每一个生成的映射规则中的每一个预设可交互意图信息,通过用户历史语音请求数据挖掘预设可交互意图信息对应的高频话术作为该预设可交互意图信息的引导话术集合,并获取预设可交互意图信息的交互频次均值以及引导话术使用频次均值作为引导触发频次值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211468246.2A CN116016578B (zh) | 2022-11-22 | 2022-11-22 | 一种基于设备状态和用户行为的智能语音引导方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211468246.2A CN116016578B (zh) | 2022-11-22 | 2022-11-22 | 一种基于设备状态和用户行为的智能语音引导方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116016578A CN116016578A (zh) | 2023-04-25 |
CN116016578B true CN116016578B (zh) | 2024-04-16 |
Family
ID=86034272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211468246.2A Active CN116016578B (zh) | 2022-11-22 | 2022-11-22 | 一种基于设备状态和用户行为的智能语音引导方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116016578B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109017564A (zh) * | 2018-08-13 | 2018-12-18 | 合肥紫昱颜信息科技有限公司 | 一种汽车安全行驶系统 |
CN109285543A (zh) * | 2018-09-07 | 2019-01-29 | 惠州市德赛西威汽车电子股份有限公司 | 一种车载多媒体导航仪语音自动化测试系统 |
CN110476150A (zh) * | 2017-03-28 | 2019-11-19 | 三星电子株式会社 | 用于操作语音辨识服务的方法和支持其的电子装置 |
CN112164401A (zh) * | 2020-09-18 | 2021-01-01 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器和计算机可读存储介质 |
CN113212453A (zh) * | 2021-05-13 | 2021-08-06 | 北京信息职业技术学院 | 一种网联环境下的自动驾驶车辆融合导航决策方法 |
CN113779300A (zh) * | 2020-06-09 | 2021-12-10 | 比亚迪股份有限公司 | 语音输入引导方法、装置和车机 |
WO2022057152A1 (zh) * | 2020-09-18 | 2022-03-24 | 广州橙行智动汽车科技有限公司 | 语音交互方法、服务器和计算机可读存储介质 |
CN114420117A (zh) * | 2021-12-28 | 2022-04-29 | 大众问问(北京)信息科技有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10170111B2 (en) * | 2017-01-19 | 2019-01-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Adaptive infotainment system based on vehicle surrounding and driver mood and/or behavior |
US10685648B2 (en) * | 2017-11-08 | 2020-06-16 | International Business Machines Corporation | Sensor fusion model to enhance machine conversational awareness |
-
2022
- 2022-11-22 CN CN202211468246.2A patent/CN116016578B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110476150A (zh) * | 2017-03-28 | 2019-11-19 | 三星电子株式会社 | 用于操作语音辨识服务的方法和支持其的电子装置 |
CN109017564A (zh) * | 2018-08-13 | 2018-12-18 | 合肥紫昱颜信息科技有限公司 | 一种汽车安全行驶系统 |
CN109285543A (zh) * | 2018-09-07 | 2019-01-29 | 惠州市德赛西威汽车电子股份有限公司 | 一种车载多媒体导航仪语音自动化测试系统 |
CN113779300A (zh) * | 2020-06-09 | 2021-12-10 | 比亚迪股份有限公司 | 语音输入引导方法、装置和车机 |
CN112164401A (zh) * | 2020-09-18 | 2021-01-01 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器和计算机可读存储介质 |
WO2022057152A1 (zh) * | 2020-09-18 | 2022-03-24 | 广州橙行智动汽车科技有限公司 | 语音交互方法、服务器和计算机可读存储介质 |
CN113212453A (zh) * | 2021-05-13 | 2021-08-06 | 北京信息职业技术学院 | 一种网联环境下的自动驾驶车辆融合导航决策方法 |
CN114420117A (zh) * | 2021-12-28 | 2022-04-29 | 大众问问(北京)信息科技有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
基于情境感知的车载信息娱乐系统交互设计研究;吴剑斌;张竞元;张凌浩;;包装工程;20180820(16);全文 * |
车载语音识别及控制系统的设计与实现;苟鹏程;宗群;;计算机应用与软件;20170515(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116016578A (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107199971B (zh) | 车载语音交互方法、终端及计算机可读存储介质 | |
CN105989841B (zh) | 车载语音控制方法及装置 | |
US10304443B2 (en) | Device and method for performing voice recognition using trigger voice | |
KR102518543B1 (ko) | 사용자의 발화 에러 보정 장치 및 그 방법 | |
US11372610B2 (en) | Display device, and display method | |
CN110928567A (zh) | 车辆系统升级方法、终端设备及计算机可读存储介质 | |
CN112309380B (zh) | 一种语音控制方法、系统、设备及汽车 | |
KR20120117148A (ko) | 음성 명령어 처리 장치 및 그 방법 | |
US20160357577A1 (en) | Method and device for displaying the execution status of an application | |
KR102441067B1 (ko) | 차량의 사용자 입력 처리 장치 및 사용자 입력 처리 방법 | |
CN109599103B (zh) | 车辆控制方法、装置、系统、计算机可读存储介质和汽车 | |
US20200319841A1 (en) | Agent apparatus, agent apparatus control method, and storage medium | |
US20150336581A1 (en) | Point-of-Sale Vehicle Parameter Configuration | |
CN116016578B (zh) | 一种基于设备状态和用户行为的智能语音引导方法 | |
CN111261149B (zh) | 语音信息识别方法和装置 | |
CN115061762A (zh) | 页面的展示方法、装置、电子设备和介质 | |
US11341189B2 (en) | Multi-character string search engine for in-vehicle information system | |
CN113961114A (zh) | 主题替换方法、装置、电子设备及存储介质 | |
CN115410565A (zh) | 提示信息输出方法、系统、电子设备及可读存储介质 | |
CN114629740B (zh) | 车载can信号收发方法、装置、车载系统、计算机设备及存储介质 | |
CN115662430B (zh) | 输入数据解析方法、装置、电子设备和存储介质 | |
KR20200100142A (ko) | 음성 입력을 처리하기 위한 방법, 장치 및 명령어들을 갖는 컴퓨터 판독 가능한 저장 매체, 음성 처리 기능을 갖는 자동차, 및 사용자 단말기 | |
US20230362110A1 (en) | Methods and devices allowing enhanced interaction between a connected vehicle and a conversational agent | |
US20200219508A1 (en) | Method for commanding a plurality of virtual personal assistants and associated devices | |
CN115881120A (zh) | 处理用户语音请求的方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |