CN110472095A - 语音引导方法、装置、设备和介质 - Google Patents

语音引导方法、装置、设备和介质 Download PDF

Info

Publication number
CN110472095A
CN110472095A CN201910760480.4A CN201910760480A CN110472095A CN 110472095 A CN110472095 A CN 110472095A CN 201910760480 A CN201910760480 A CN 201910760480A CN 110472095 A CN110472095 A CN 110472095A
Authority
CN
China
Prior art keywords
user
object run
scene
target
target voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910760480.4A
Other languages
English (en)
Other versions
CN110472095B (zh
Inventor
林少杰
李勇
徐鹏辉
吴迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910760480.4A priority Critical patent/CN110472095B/zh
Publication of CN110472095A publication Critical patent/CN110472095A/zh
Application granted granted Critical
Publication of CN110472095B publication Critical patent/CN110472095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • G06F16/637Administration of user profiles, e.g. generation, initialization, adaptation or distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Abstract

本发明实施例公开了一种语音引导方法、装置、设备和介质,涉及智能语音技术领域。所述方法包括:确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;根据所述目标操作,从候选语音场景中确定目标语音场景;根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;向用户提供所述目标语音指令。本发明实施例提供了一种语音引导方法、装置、设备和介质,实现了对用户进行用户需求的目标语音指令的引导,同时避免了用户主动查找的麻烦,从而提高了对用户的语音引导效率。

Description

语音引导方法、装置、设备和介质
技术领域
本发明实施例涉及智能语音技术领域,尤其涉及一种语音引导方法、装置、设备和介质。
背景技术
智能语音在驾车导航场景中为用户提供语音交互,解放双手替代手动操作,通过语音交互执行用户操作,在驾车中增强语音功能对用户的智能感知。现阶段智能语音基础功能操作覆盖率已达到90%以上。用户对于智能语音的使用处于接受但未形成习惯的过程,对于智能语音的功能缺乏整体认知。
目前智能语音的引导方法包括:文本方式引导。通常在应用的帮助中心中,介绍有多个语音指令所能执行的操作。
上述方案的缺点在于:帮助中心处于比较隐蔽的位置,用户很难去发现。同时,由于语音指令介绍内容较多,所以用户很少有耐心专门去了解。
发明内容
本发明实施例提供一种语音引导方法、装置、设备和介质,以实现对用户进行用户需求的目标语音指令的引导,同时避免用户主动查找的麻烦,从而提高对用户的语音引导效率。
第一方面,本发明实施例提供了一种语音引导方法,所述方法包括:
确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;
根据所述目标操作,从候选语音场景中确定目标语音场景;
根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;
向用户提供所述目标语音指令。
第二方面,本发明实施例还提供了一种语音引导装置,所述装置包括:
需求确定模块,用于确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;
场景确定模块,用于根据所述目标操作,从候选语音场景中确定目标语音场景;
指令生成模块,用于根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;
指令引导模块,用于向用户提供所述目标语音指令。
第三方面,本发明实施例还提供了一种电子设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一项所述的语音引导方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一项所述的语音引导方法。
本发明实施例通过确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;根据所述目标操作,从候选语音场景中确定目标语音场景;根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;向用户提供所述目标语音指令,从而实现对用户进行用户需求的目标语音指令的引导,同时避免用户主动查找的麻烦,提高了对用户的语音引导效率。
附图说明
图1为本发明实施例公开的一种语音引导方法的流程图;
图2是本发明实施例公开的另一种语音引导方法的流程图;
图3是本发明实施例公开的另一种语音引导方法的流程图;
图4是本发明实施例公开的一种语音引导方法的信令图;
图5是本发明实施例公开的一种语音引导装置的结构示意图;
图6为本发明实施例公开的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
图1为本发明实施例公开的一种语音引导方法的流程图。本实施例可适用于对用户进行语音引导的情况。典型地,本实施例可适用于在基于导航路径行驶的过程中,对用户进行语音引导,以增强用户在驾车过程中对智能语音的认知,并逐步让用户形成使用智能语音习惯的情况。
该方法可以由一种语音引导装置来执行,该装置可以由软件、硬件或软硬件结合的方式实现。具体地,该装置可以配置于客户端所属设备中。典型地,所述语音引导装置可以配置于具有导航功能的车载终端,以在导航服务开启的情况下,对用户进行导航相关操作的语音引导。参见图1,本实施例提供的语音引导方法包括:
S110、确定用户需求。
其中用户需求包括目标操作和目标操作的关键信息。
目标操作是指用户需求的操作。例如,目标操作是对导航终点的修改。
目标操作的关键信息是指,目标操作涉及的信息。例如,若目标操作是对导航终点的修改,则目标操作的关键信息可以是修改后的导航终点名称。
具体地,确定目标操作和目标操作的关键信息包括:
根据用户操作信息,确定目标操作和目标操作的关键信息。
其中,用户操作信息是指用户的手动操作信息。
具体地,用户操作信息可以是指用户对目标应用的操作信息。手动操作包括但不限于对虚拟按键的点击和设定手势的输入等。
用户操作信息可以是一个用户操作序列,该序列中包括至少一个用户操作,且按照操作时间排列。
例如,用户操作信息可以是用户对设备中地图应用的关闭,以及对歌曲应用开启,也可以是对地图应用中导航终点的设置。
客户端的状态切换条件信息是指,对客户端状态进行切换的条件信息。例如,客户端从白天显示模式到夜晚显示模式的切换条件信息可以是,当前时间是白天还是夜晚,以及客户端的当前显示模式。
可选地,确定目标操作和目标操作的关键信息包括:
根据客户端的状态切换条件信息,确定目标操作和目标操作的关键信息。
具体地,根据客户端的状态切换条件信息确定用户需求,包括:
若客户端的当前信息满足一状态的切换条件,则确定用户需求中目标操作是该状态的切换,目标操作的关键信息是该状态的当前状态和即将更新状态。
S120、根据所述目标操作,从候选语音场景中确定目标语音场景。
候选语音场景是可能存在目标语音场景的预设应用场景。
预设应用场景是需要进行语音引导的情景,具体可以根据实际语音引导需求设定。
目标语音场景是与所述目标操作关联的场景。
例如,若目标操作是对导航终点的修改,则目标语音场景是修改导航终点的语音引导情景。
具体地,根据所述目标操作,从候选语音场景中确定目标语音场景,包括:
基于候选语音场景和候选操作的映射关系,将所述目标操作与所述候选操作进行匹配,将匹配成功的候选操作对应的候选语音场景作为目标语音场景。
可选地,所述候选语音场景可以存储于客户端,也可以存储于服务端。
S130、根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令。
其中,目标语音模板是生成目标语音指令的模板。例如,目标语音模板可以是:更换目的地为某地。
目标语音指令是指示执行上述目标操作的指令。例如,目标语音指令是:将更换目的地为一地铁站。
具体地,将所述目标操作的关键信息填充至所述目标语音场景关联的目标语音模板,生成目标语音指令。
S140、向用户提供所述目标语音指令。
可选地,可以通过语音的方式将所述目标语音指令播报给用户;也可以将所述目标语音指令展示在用户方便查看的位置。
为方便用户对提供的目标语音指令的理解,在向用户提供所述目标语音指令前,为所述目标语音指令增加引导语。具体引导语可以根据实际需要设定,例如引导语为:针对目标语音场景可以直接说,唤醒词,目标语音指令。
其中,唤醒词是唤醒智能语音的词语。具体可以根据实际需要设定。
本发明实施例的技术方案,通过确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;根据所述目标操作,从候选语音场景中确定目标语音场景;根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;向用户提供所述目标语音指令,从而实现对用户进行用户需求的目标语音指令的引导,同时避免用户主动查找的麻烦,提高了对用户的语音引导效率。
为方便对目标语音模板的更新,若所述根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令之前,所述方法还包括:
向服务端发送包括目标语音场景标识的语音模板获取请求,由服务端根据所述目标语音场景标识,确定所述目标语音模板;
获取服务端返回的所述目标语音模板。
具体地,S110、S120、S130和S140可以由客户端执行。
也即将目标语音模板存储于服务端中,从而使得仅通过服务端即可完成对候选语音场景的修改,节省了对客户端的修改代价。
为提高用户对目标语音指令的采纳率,所述向用户提供所述目标语音指令之后,所述方法还包括:
确定所述目标语音指令的采纳率;
根据所述采纳率,对所述目标语音场景和/或所述目标语音模板进行修正。
其中,采纳率是指目标语音指令被采纳的几率。
具体地,确定所述目标语音指令的采纳率,包括:
记录用户对所述目标语音指令的指令操作信息;
根据记录的指令操作信息,确定所述目标语音指令的采纳率。
具体地,根据记录的指令操作信息,确定所述目标语音指令的采纳率,包括:
根据记录的指令操作信息,确定所述目标语音指令的使用信息和留存信息;
根据所述目标语音指令的使用信息和留存信息,确定所述目标语音指令的采纳率。
其中,所述使用信息是指对目标语音指令的使用信息,具体可以是使用次数,使用频率等。
留存信息是指用户对目标语音指令的保存信息,具体可以是对目标语音指令进行了保存,或未进行保存。
若候选语音场景和/或目标语音模板存储于服务端,则为方便根据所述采纳率,对所述目标语音场景和/或所述目标语音模板的修正,上述“根据记录的指令操作信息,确定所述目标语音指令的采纳率;”以及“根据所述采纳率,对所述目标语音场景和/或所述目标语音模板进行修正”的操作,可以由服务端执行,从而在对候选语音场景和/或目标语音模板进行更新时,仅需对服务端进行修改即可,避免了对客户端代码的修改。
在上述实施例的基础上,本发明实施例还公开了另一种语音引导方法的流程图,如图2所示,包括:
S210、根据用户操作信息,确定所述目标操作和所述目标操作的关键信息,所述用户操作信息包括用户在设定时段内的目标用户操作序列。
设定时段可以根据实际需要设定。
典型地,设定时段可以是距当前时间设定时间长度的时间段。
目标用户操作序列是指,用户在设定时段内执行的操作序列。
具体地,目标用户操作序列包括至少一个用户操作,且所述至少一个用户操作根据各操作的执行时间顺序排列。
具体地,所述根据用户操作信息,确定所述目标操作和所述目标操作的关键信息,所述用户操作信息包括用户在设定时段内的目标用户操作序列,包括:
基于所述目标用户操作序列和所述目标操作的映射关系,根据所述目标用户操作序列确定所述目标操作;
将所述目标操作与所述目标用户操作序列中的目标用户操作进行匹配;
将匹配成功的目标用户操作关联的信息,作为所述目标操作的关键信息。
S220、根据所述目标操作,从候选语音场景中确定目标语音场景。
S230、根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令。
S240、向用户提供所述目标语音指令。
本发明实施例的技术方案,通过根据用户在设定时段内的目标用户操作序列确定用户需求,从而实现对用户需求的深度挖掘,进而基于深度挖掘的用户需求可以实现对用户的深度语音引导。
在上述实施例的基础上,以执行主体为除服务端以外的其他执行端为例,本发明实施例还公开了另一种语音引导方法的流程图,如图3所示,包括:
S310、确定用户需求。
其中所述用户需求包括目标操作和所述目标操作的关键信息。
S320、向服务端发送候选语音场景的获取请求。
为提高目标语音场景的确定效率,所述向服务端发送所述候选语音场景的获取请求,包括:
若获取到用户发起的目标服务请求,则从预设应用场景中,确定与目标服务关联的预设应用场景,作为所述候选语音场景;
向服务端发送所述候选语音场景的获取请求。
S330、接收服务端返回的所述候选语音场景。
S340、根据所述目标操作,从候选语音场景中确定目标语音场景。
S350、根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令。
S360、向用户提供所述目标语音指令。
由于对客户端进行修改需要重新发布新的版本,成本较高。所以本发明实施例将候选语音场景存储于服务端中,从而使得仅通过服务端即可完成对候选语音场景的修改和动态配置,节省了对客户端的修改代价。
并且对于新增的候选语音场景的语音引导,可以充分利用已有候选语音场景的语音引导配置项,而无需修改客户端已有代码。
在上述实施例的基础上,以执行主体为地图应用客户端,目标服务是地图应用中的导航服务为例,本发明实施例还公开了一种语音引导方法的信令图,如图4所示。
为了保证场景化引导的动态性、可配置性和简便性,针对各个场景下可随时做到动态上新,动态变更和动态下线,据此实现了基于云端配置的智能语音场景化引导。
参见图4,本实施例方案涉及的执行端主要包括:语音引导服务端、基线客户端、导航上层、导航引擎和导航服务端。其中,语音引导服务端用于向客户端下发包括候选语音场景的场景化配置文件和目标语音场景的目标语音模板,以配合客户端实现对用户的语音引导。并且,语音引导服务端还可以接收客户端上传的用户对目标语音指令的操作日志,并对接收的操作日志进行分析,根据分析结果对本端的目标语音模板和/或目标语音场景进行修正。
基线客户端是指地图应用客户端的基础执行部分。导航上层是地图应用客户端中导航服务的执行部分。基线客户端和导航上层均属于语音引导客户端。
导航引擎通常会封装和保护几何数据的拓扑关系和导引数据,对上层提供路线分析、拓扑分析、引导信息的功能。
导航服务端用于提供导航的基础位置或路线的数据。
基于上述执行端,本实施方法可以描述如下:
导航上层若获取到用户发起的导航请求,则通过基线客户端向语音引导服务端发送包括候选语音场景信息的场景化配置文件的获取请求。
语音引导服务端响应上述场景化配置文件的获取请求,将包括最新版的候选语音场景信息的场景化配置文件经基线客户端发送至导航上层。
导航上层获取场景化配置文件后,将场景化配置文件同时下发给导航引擎。
导航引擎对场景化配置文件进行解析,并将解析结果发送给导航上层的策略控制器。此处,如果部分信息解析错误,则抛弃该次语音引导,防止出错。
策略控制器根据解析结果确定候选语音场景,并通过用户在地图应用中对导航服务进行的相关点击事件序列或通过判断当前导航状态下的各个状态切换条件,挖掘用户需求;根据挖掘的用户需求中的目标操作,从候选语音场景中确定目标语音场景,并将目标语音场景的标识发送给功能控制器,由功能控制器经基线客户端,从智能语音服务端获取目标语音场景关联的目标语音模板,利用挖掘的用户需求中目标操作的关键信息对目标语音模板进行填充,生成目标语音指令,并通过智能语音接入层,实现对目标语音指令的引导播报。
同时展示一个小型的面板(对用户形成低干扰),提醒用户以后在这种情景下,可以通过语音发起指令,替代传统的手动操作。
导航上层将用户对目标语音指令的操作日志上传给语音引导服务端,由语音引导服务端对接收的操作日志进行分析,根据分析结果对语音引导服务端的目标语音模板和/或目标语音场景进行修正。
示例性的,针对用户在短时间内完成了退导航、改终点再进导航的点击事件序列,本实施例可以实现如下效果:根据点击事件序列可以确定用户需求为修改目的地。根据用户需求确定目标语音指令(例如,修改目标地为一具体地点),并对目标语音指令进行引导播报,以提醒用户以后在导航中可以直接通过目标语音指令来修改导航终点。具体播报内容可以是:导航中更换目的地可以直接说,唤醒词,更换目标地为一具体点。其中具体地点从用户需求中的关键信息中确定。
本发明实施例的技术方案,通过根据用户需求确定目标语音指令,并将目标语音指令提供给用户,以增强用户在驾车过程中对智能语音的认知,并逐步让用户形成使用智能语音的习惯。
通过实时挖掘用户当前的各种操作和事件形态,及时给用户推送当前最恰当的引导,不同于常规的本文形态的说明,触发次数不限,且针对性强。
通过服务端配置文件的方式,使得仅通过服务端即可完成对候选语音场景的动态配置,节省了对客户端的修改代价。
并且对于新增的候选语音场景的语音引导,可以充分利用已有候选语音场景的语音引导配置项,而无需修改客户端已有代码。
需要说明的是,经过本实施例的技术教导,本领域技术人员有动机将上述实施例中描述的任一种实施方式进行方案的组合,以实现对用户进行用户需求的目标语音指令的引导,同时避免用户主动查找的麻烦,从而提高对用户的语音引导效率。
图5是本发明实施例公开的一种语音引导装置的结构示意图。参见图5,本实施例公开的语音引导装置包括:需求确定模块10、场景确定模块20、指令生成模块30和指令引导模块40。
其中,需求确定模块10,用于确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;
场景确定模块20,用于根据所述目标操作,从候选语音场景中确定目标语音场景;
指令生成模块30,用于根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;
指令引导模块40,用于向用户提供所述目标语音指令。
本发明实施例的技术方案,通过确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;根据所述目标操作,从候选语音场景中确定目标语音场景;根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;向用户提供所述目标语音指令,从而实现对用户进行用户需求的目标语音指令的引导,同时避免用户主动查找的麻烦,提高了对用户的语音引导效率。
进一步地,所述需求确定模块,包括:
需求确定单元,用于根据用户操作信息,确定所述目标操作和所述目标操作的关键信息,所述用户操作信息包括用户在设定时段内的目标用户操作序列。
进一步地,所述需求确定单元具体用于:
基于所述目标用户操作序列和所述目标操作的映射关系,根据所述目标用户操作序列确定所述目标操作;
将所述目标操作与所述目标用户操作序列中的目标用户操作进行匹配;
将匹配成功的目标用户操作关联的信息,作为所述目标操作的关键信息。
进一步地,所述装置还包括:
信息确定模块,用于,确定所述目标语音指令的采纳率;
修正模块,用于根据所述采纳率,对所述目标语音场景和/或所述目标语音模板进行修正。
进一步地,所述装置还包括:
请求发送模块,用于所述根据所述目标操作,从候选语音场景中确定目标语音场景之前,向服务端发送所述候选语音场景的获取请求;
场景接收模块,用于接收服务端返回的所述候选语音场景。
进一步地,所述请求发送模块,包括:
场景确定单元,用于若获取到用户发起的目标服务请求,则从预设应用场景中,确定与目标服务关联的预设应用场景,作为所述候选语音场景;
请求发送单元,用于向服务端发送所述候选语音场景的获取请求。
进一步地,所述装置还包括:
模板请求模块,用于所述根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令之前,向服务端发送包括目标语音场景标识的语音模板获取请求,由服务端根据所述目标语音场景标识,确定所述目标语音模板;
模板接收模块,用于获取服务端返回的所述目标语音模板。
本发明实施例所提供的语音引导装置可执行本发明实施例所提供的语音引导方法,具备执行方法相应的功能模块和有益效果。
图6为本发明实施例公开的一种设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性设备12的框图。图6显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的语音引导方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一项所述的语音引导方法,该方法包括:
确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;
根据所述目标操作,从候选语音场景中确定目标语音场景;
根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;
向用户提供所述目标语音指令。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (15)

1.一种语音引导方法,其特征在于,所述方法包括:
确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;
根据所述目标操作,从候选语音场景中确定目标语音场景;
根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;
向用户提供所述目标语音指令。
2.根据权利要求1所述的方法,其特征在于,确定所述目标操作和所述目标操作的关键信息,包括:
根据用户操作信息,确定所述目标操作和所述目标操作的关键信息,所述用户操作信息包括用户在设定时段内的目标用户操作序列。
3.根据权利要求2所属的方法,其特征在于,所述根据用户操作信息,确定所述目标操作和所述目标操作的关键信息,包括:
基于所述目标用户操作序列和所述目标操作的映射关系,根据所述目标用户操作序列确定所述目标操作;
将所述目标操作与所述目标用户操作序列中的目标用户操作进行匹配;
将匹配成功的目标用户操作关联的信息,作为所述目标操作的关键信息。
4.根据权利要求1所述的方法,其特征在于,所述向用户提供所述目标语音指令之后,所述方法还包括:
确定所述目标语音指令的采纳率;
根据所述采纳率,对所述目标语音场景和/或所述目标语音模板进行修正。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标操作,从候选语音场景中确定目标语音场景之前,所述方法还包括:
向服务端发送所述候选语音场景的获取请求;
接收服务端返回的所述候选语音场景。
6.根据权利要求5所述的方法,其特征在于,所述向服务端发送所述候选语音场景的获取请求,包括:
若获取到用户发起的目标服务请求,则从预设应用场景中,确定与目标服务关联的预设应用场景,作为所述候选语音场景;
向服务端发送所述候选语音场景的获取请求。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令之前,所述方法还包括:
向服务端发送包括目标语音场景标识的语音模板获取请求,由服务端根据所述目标语音场景标识,确定所述目标语音模板;
获取服务端返回的所述目标语音模板。
8.一种语音引导装置,其特征在于,所述装置包括:
需求确定模块,用于确定用户需求,其中所述用户需求包括目标操作和所述目标操作的关键信息;
场景确定模块,用于根据所述目标操作,从候选语音场景中确定目标语音场景;
指令生成模块,用于根据所述目标操作的关键信息和所述目标语音场景关联的目标语音模板,生成目标语音指令;
指令引导模块,用于向用户提供所述目标语音指令。
9.根据权利要求8所述的装置,其特征在于,所述需求确定模块,包括:
需求确定单元,用于根据用户操作信息,确定所述目标操作和所述目标操作的关键信息,所述用户操作信息包括用户在设定时段内的目标用户操作序列。
10.根据权利要求9所述的装置,其特征在于,所述需求确定单元具体用于:
基于所述目标用户操作序列和所述目标操作的映射关系,根据所述目标用户操作序列确定所述目标操作;
将所述目标操作与所述目标用户操作序列中的目标用户操作进行匹配;
将匹配成功的目标用户操作关联的信息,作为所述目标操作的关键信息。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
信息确定模块,用于确定所述目标语音指令的采纳率;
修正模块,用于根据所述采纳率,对所述目标语音场景和/或所述目标语音模板进行修正。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
请求发送模块,用于所述根据所述目标操作,从候选语音场景中确定目标语音场景之前,向服务端发送所述候选语音场景的获取请求;
场景接收模块,用于接收服务端返回的所述候选语音场景。
13.根据权利要求12所述的装置,其特征在于,所述请求发送模块,包括:
场景确定单元,用于若获取到用户发起的目标服务请求,则从预设应用场景中,确定与目标服务关联的预设应用场景,作为所述候选语音场景;
请求发送单元,用于向服务端发送所述候选语音场景的获取请求。
14.一种电子设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的语音引导方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的语音引导方法。
CN201910760480.4A 2019-08-16 2019-08-16 语音引导方法、装置、设备和介质 Active CN110472095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910760480.4A CN110472095B (zh) 2019-08-16 2019-08-16 语音引导方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910760480.4A CN110472095B (zh) 2019-08-16 2019-08-16 语音引导方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN110472095A true CN110472095A (zh) 2019-11-19
CN110472095B CN110472095B (zh) 2023-03-10

Family

ID=68510988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910760480.4A Active CN110472095B (zh) 2019-08-16 2019-08-16 语音引导方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110472095B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111811534A (zh) * 2019-12-25 2020-10-23 北京嘀嘀无限科技发展有限公司 基于语音指令的导航控制方法、装置、存储介质及设备
CN112532691A (zh) * 2020-11-06 2021-03-19 问问智能信息科技有限公司 信息处理方法及装置
CN112837159A (zh) * 2021-02-24 2021-05-25 中国工商银行股份有限公司 基于场景要素的交易引导方法、装置、电子设备及介质
CN113779300A (zh) * 2020-06-09 2021-12-10 比亚迪股份有限公司 语音输入引导方法、装置和车机
CN115202548A (zh) * 2022-06-30 2022-10-18 大众问问(北京)信息科技有限公司 应用功能的语音操作引导方法、装置、计算机设备和介质
CN115883273A (zh) * 2021-09-30 2023-03-31 青岛海尔科技有限公司 场景的调整方法和装置、存储介质及电子装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61128391A (ja) * 1984-11-28 1986-06-16 Matsushita Electric Ind Co Ltd パタンマツチング装置
CN102893327A (zh) * 2010-03-19 2013-01-23 数字标记公司 直觉计算方法和系统
CN107833574A (zh) * 2017-11-16 2018-03-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108337380A (zh) * 2011-09-30 2018-07-27 苹果公司 自动调整用户界面以用于免提交互
CN108520748A (zh) * 2018-02-01 2018-09-11 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统
CN109243457A (zh) * 2018-11-06 2019-01-18 北京智能管家科技有限公司 基于语音的控制方法、装置、设备及存储介质
CN109325097A (zh) * 2018-07-13 2019-02-12 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109710129A (zh) * 2018-12-20 2019-05-03 斑马网络技术有限公司 语音技能命令引导方法、装置、存储介质及电子设备
CN109871551A (zh) * 2019-02-28 2019-06-11 苏州浪潮智能科技有限公司 一种智能用户手册生成方法、装置、终端及存储介质
CN109948151A (zh) * 2019-03-05 2019-06-28 苏州思必驰信息科技有限公司 构建语音助手的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61128391A (ja) * 1984-11-28 1986-06-16 Matsushita Electric Ind Co Ltd パタンマツチング装置
CN102893327A (zh) * 2010-03-19 2013-01-23 数字标记公司 直觉计算方法和系统
CN108337380A (zh) * 2011-09-30 2018-07-27 苹果公司 自动调整用户界面以用于免提交互
CN107833574A (zh) * 2017-11-16 2018-03-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108520748A (zh) * 2018-02-01 2018-09-11 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统
CN109325097A (zh) * 2018-07-13 2019-02-12 海信集团有限公司 一种语音引导方法及装置、电子设备、存储介质
CN109243457A (zh) * 2018-11-06 2019-01-18 北京智能管家科技有限公司 基于语音的控制方法、装置、设备及存储介质
CN109710129A (zh) * 2018-12-20 2019-05-03 斑马网络技术有限公司 语音技能命令引导方法、装置、存储介质及电子设备
CN109871551A (zh) * 2019-02-28 2019-06-11 苏州浪潮智能科技有限公司 一种智能用户手册生成方法、装置、终端及存储介质
CN109948151A (zh) * 2019-03-05 2019-06-28 苏州思必驰信息科技有限公司 构建语音助手的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
段绪彭等: ""公共场所智能语音交互引导系统的设计研究"", 《辽宁石油化工大学学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111811534A (zh) * 2019-12-25 2020-10-23 北京嘀嘀无限科技发展有限公司 基于语音指令的导航控制方法、装置、存储介质及设备
CN111811534B (zh) * 2019-12-25 2023-10-31 北京嘀嘀无限科技发展有限公司 基于语音指令的导航控制方法、装置、存储介质及设备
CN113779300A (zh) * 2020-06-09 2021-12-10 比亚迪股份有限公司 语音输入引导方法、装置和车机
CN112532691A (zh) * 2020-11-06 2021-03-19 问问智能信息科技有限公司 信息处理方法及装置
CN112837159A (zh) * 2021-02-24 2021-05-25 中国工商银行股份有限公司 基于场景要素的交易引导方法、装置、电子设备及介质
CN112837159B (zh) * 2021-02-24 2024-04-02 中国工商银行股份有限公司 基于场景要素的交易引导方法、装置、电子设备及介质
CN115883273A (zh) * 2021-09-30 2023-03-31 青岛海尔科技有限公司 场景的调整方法和装置、存储介质及电子装置
CN115202548A (zh) * 2022-06-30 2022-10-18 大众问问(北京)信息科技有限公司 应用功能的语音操作引导方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
CN110472095B (zh) 2023-03-10

Similar Documents

Publication Publication Date Title
CN110472095A (zh) 语音引导方法、装置、设备和介质
CN111428483B (zh) 语音交互方法、装置和终端设备
CN107423363B (zh) 基于人工智能的话术生成方法、装置、设备及存储介质
US11397724B2 (en) Method and apparatus for obtaining area speed limit value and terminal device
CN107995536A (zh) 一种提取视频预览的方法、装置、设备和计算机存储介质
CN108491373A (zh) 一种实体识别方法及系统
EP4171078A1 (en) Voice scene update method and device, and terminal, server and system
US20140172411A1 (en) Apparatus and method for verifying context
JP7213943B2 (ja) 車載機器の音声処理方法、装置、機器及び記憶媒体
CN104282302A (zh) 用于识别语音和文本的设备和方法
WO2021082885A1 (zh) 语义分割模型的训练样本的生成方法、装置、存储介质及电子设备
JP2002041432A (ja) チャットシステム,端末装置,サーバ装置及び媒体
CN109817210A (zh) 语音写作方法、装置、终端和存储介质
CN108871370A (zh) 导航方法、装置、设备和介质
CN109933269A (zh) 小程序推荐的方法、设备和计算机存储介质
CN105404617A (zh) 一种远程桌面的控制方法、受控端及控制系统
CN108055617A (zh) 一种麦克风的唤醒方法、装置、终端设备及存储介质
CN108932218A (zh) 一种实例扩展方法、装置、设备和介质
CN110059313A (zh) 翻译处理方法和装置
CN109684394A (zh) 文本生成方法、装置、设备和存储介质
JP2022091904A (ja) ミニプログラムページのスキン切り替え方法、装置及び電子機器
CN107861948A (zh) 一种标签提取方法、装置、设备和介质
US11075864B2 (en) Computer-readable recording medium recording conversation control program, conversation control method, and information processing device
CN111578965B (zh) 导航播报信息处理方法、装置、电子设备和存储介质
CN107862035A (zh) 会议记录的网络读取方法、装置、智能平板和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant