CN110310641B - 一种用于语音助手的方法及装置 - Google Patents

一种用于语音助手的方法及装置 Download PDF

Info

Publication number
CN110310641B
CN110310641B CN201910706651.5A CN201910706651A CN110310641B CN 110310641 B CN110310641 B CN 110310641B CN 201910706651 A CN201910706651 A CN 201910706651A CN 110310641 B CN110310641 B CN 110310641B
Authority
CN
China
Prior art keywords
user
knowledge data
engine
key knowledge
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910706651.5A
Other languages
English (en)
Other versions
CN110310641A (zh
Inventor
龚思颖
赵晓朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Suddenly Cognitive Technology Co ltd
Original Assignee
Hangzhou Suddenly Cognitive Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Suddenly Cognitive Technology Co ltd filed Critical Hangzhou Suddenly Cognitive Technology Co ltd
Publication of CN110310641A publication Critical patent/CN110310641A/zh
Application granted granted Critical
Publication of CN110310641B publication Critical patent/CN110310641B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种用于语音助手方法,该方法包括以下步骤:步骤101,语音助手获取用户的语音命令;步骤103,根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,执行步骤105,否则,执行步骤107;步骤105,根据调用的交互子引擎,与用户进行交互;步骤107,语音助手创建该交互子引擎。该方法可以使得语音助手与用户之间的交互更加智能化,人性化,提高交互效率,提高用户体验。

Description

一种用于语音助手的方法及装置
技术领域
本发明实施例涉及信息处理技术领域,特别涉及一种用于语音助手的方法、装置、设备及计算机可读存储介质。
背景技术
随着技术的发展,人工智能逐渐渗透到人们的生活中,语音助手作为人机交互的桥梁,起着很重要的作用,用户通过语音的方式与语音助手交互,一方面可以解放双手,另一方面可以随意与其沟通,但是现有的语音助手仍然较为机械,与用户交互时基于固定的模式提问回答,对用户提供的服务功能相对局限,其智能化程度不高,无法满足用户个性化的需求,给用户带来的体验较差。
如何更加智能化的与用户沟通成为一个亟待解决的问题。
发明内容
针对现有技术中存在的上述问题,本发明提出一种用于语音助手的方法及装置,用以克服上述问题。
本发明实施例提供了一种用于语音助手的方法,包括:
步骤101,语音助手获取用户的语音命令;
步骤103,根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,执行步骤105,否则,执行步骤107;
步骤105,根据调用的交互子引擎,与用户进行交互;
步骤107,语音助手创建该交互子引擎。
优选地,语音助手根据用户语音命令中的关键信息,判断是否存在与该关键信息相关的交互子引擎。
优选地,根据调用的交互子引擎,与用户进行交互包括
判断用户是否调用过该交互子引擎,若未调用过,则根据该交互子引擎包括的槽位信息生成问题,与用户进行语音交互;
若调用过,则获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充。
优选地,获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充包括
若对于同一个槽位,只填充过一次关键知识数据或多次填充的关键知识数据相同,则利用该关键知识数据填充槽位,若不同,则按照一定规则选择关键知识数据进行填充,对于未填充的槽位,则通过与用户的语音交互完成槽位填充;对于填充完成的槽位,将未经用户确认的关键知识数据反馈于用户,由用户确认或进行修改。
优选地,按照一定规则选择关键知识数据进行填充包括至少任一方式:
1)按照预定时间段内槽位填充的关键知识数据的频率进行排序,选择使用频率最高的关键知识数据进行填充;
2)选择用户最新使用过的关键知识数据进行槽位填充;
3)确定用户选择关键知识数据的规律,根据确定的规律为用户选择关键知识数据进行槽位填充。
4)根据多种规则对用户使用过的关键知识数据排序,若多种规则中排序最高的关键知识数据相同,则直接利用该关键知识数据进行填充,若不同,则将每个规则中排序最高的关键知识数据都提供给用户,根据用户选择确定填充的关键知识数据。
优选地,在步骤107中,语音助手创建该交互子引擎包括
语音助手根据关键信息确定该交互子引擎需要的槽位,如果执行该语音命令需要调用与该语音命令的关键信息相关联的其他服务,根据该服务确定所需槽位,根据该槽位生成相关问题,与用户进行交互获取关键知识数据,从而填充槽位。
优选地,语音助手根据用户语音命令中的关键信息,判断是否存在与关键信息相关的交互子引擎包括以下步骤:
步骤301,语音助手判断本地是否存在该交互子引擎,若是则执行步骤105,否则,执行步骤302;
步骤302,语音助手向用户好友发送查询请求,若用户好友具有该关键信息对应的交互子引擎,则发送给语音助手,执行步骤105;否则执行步骤303;
步骤303,语音助手向智能交互平台发起查询请求,确定智能交互平台是否存在对应于该关键信息的交互子引擎,若是,则将该交互子引擎作为目标交互子引擎下载到语音助手或者直接调用该交互子引擎,执行步骤105;否则执行步骤107;
进一步的,当多个好友均反馈了该交互子引擎,则根据预设策略选择交互子引擎,预设策略包括选择与用户亲密度指数最高的好友的交互子引擎、或选择好友最新更新或形成的交互子引擎,其中用户与好友的亲密度指数基于用户与好友之间的互动频率等因素确定。
进一步的,当查询到多个满足条件的交互子引擎时,根据特定规则对交互子引擎进行选择,特定规则包括选择评价分数最高的交互子引擎作为目标交互子引擎、选择下载量最高的交互子引擎作为目标交互子引擎、选择与用户处于同一地理区域的交互子引擎作为目标交互子引擎,或者基于多种规则,如所列举的规则的加权值确定。
优选地,语音助手将该交互子引擎分享至智能交互平台或者向用户好友分享该创建的交互子引擎。
优选地,该方法还包括步骤109,语音助手监控与该交互子引擎关联的任务是否执行完毕,若否,则判断是否存在影响该任务的因素,若存在则根据该因素生成语音,与用户进行交互;
步骤109中,进一步的,语音助手确定是否要修改该交互子引擎中受影响的槽位的关键知识数据,若需要修改,向用户提示和/或向用户提供修改建议,同时根据用户语音命令修改与该交互子引擎关联的任务。
本发明实施例还提供一种用于语音助手的装置,该装置包括:
获取模块,用于获取用户的语音命令;
判断模块,用于根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,触发交互模块,否则,触发创建模块;
交互模块,用于根据调用的交互子引擎,与用户进行交互;
创建模块,用于创建交互子引擎。
优选地,判断模块根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,包括
根据用户语音命令中的关键信息,判断是否存在与关键信息相关的交互子引擎。
优选地,交互模块根据调用的交互子引擎,与用户进行交互包括
判断用户是否调用过该交互子引擎,若未调用过,则根据该交互子引擎包括的槽位信息生成问题,与用户进行语音交互;
若调用过,则获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充。
优选地,获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充包括
若对于同一个槽位,只填充过一次关键知识数据或多次填充的关键知识数据相同,则利用该关键知识数据填充槽位,若不同,则按照一定规则选择关键知识数据进行填充,对于未填充的槽位,则通过与用户的语音交互完成槽位填充;对于填充完成的槽位,将未经用户确认的关键知识数据反馈于用户,由用户确认或进行修改。
优选地,按照一定规则选择关键知识数据进行填充包括至少任一方式:
1)按照预定时间段内槽位填充的关键知识数据的频率进行排序,选择使用频率最高的关键知识数据进行填充;
2)选择用户最新使用过的关键知识数据进行槽位填充;
3)确定用户选择关键知识数据的规律,根据确定的规律为用户选择关键知识数据进行槽位填充。
4)根据多种规则对用户使用过的关键知识数据排序,若多种规则中排序最高的关键知识数据相同,则直接利用该关键知识数据进行填充,若不同,则将每个规则中排序最高的关键知识数据都提供给用户,根据用户选择确定填充的关键知识数据。
优选地,创建模块创建该交互子引擎包括
创建模块根据关键信息确定该交互子引擎需要的槽位,如果执行该语音命令需要调用与该语音命令的关键信息相关联的其他服务,根据该服务确定所需槽位,根据该槽位生成相关问题,与用户进行交互获取关键知识数据,从而填充槽位。
根据用户语音命令中的关键信息,判断是否存在与关键信息相关的交互子引擎包括以下步骤:
步骤301,语音助手判断本地是否存在该交互子引擎,则触发交互模块,否则,执行步骤302;
步骤302,判断模块向用户好友发送查询请求,若用户好友具有该关键信息对应的交互子引擎,则发送给交互模块,触发交互模块;否则执行步骤303;
步骤303,判断模块向智能交互平台发起查询请求,确定智能交互平台是否存在对应于该关键信息的交互子引擎,若是,则将该交互子引擎作为目标交互子引擎下载到交互模块或者直接调用该交互子引擎,触发交互模块;否则触发创建模块;
进一步的,当多个好友均反馈了该交互子引擎,则根据预设策略选择交互子引擎,预设策略包括选择与用户亲密度指数最高的好友的交互子引擎、或选择好友最新更新或形成的交互子引擎,其中用户与好友的亲密度指数基于用户与好友之间的互动频率等因素确定。
进一步的,当查询到多个满足条件的交互子引擎时,根据特定规则对交互子引擎进行选择,特定规则包括选择评价分数最高的交互子引擎作为目标交互子引擎、选择下载量最高的交互子引擎作为目标交互子引擎、选择与用户处于同一地理区域的交互子引擎作为目标交互子引擎,或者基于多种规则,如所列举的规则的加权值确定。
进一步的,该装置包括分享模块,将该交互子引擎分享至智能交互平台或者向用户好友分享该创建的交互子引擎。
优选地,该方法还包括该装置还包括监控模块,监控与该交互子引擎关联的任务是否执行完毕,若否,则判断是否存在影响该任务的因素,若存在则根据该因素生成语音,与用户进行交互;
进一步的,监控模块确定是否要修改该交互子引擎中受影响的槽位的关键知识数据,若需要修改,向用户提示和/或向用户提供修改建议,同时根据用户语音命令修改与该交互子引擎关联的任务。
本发明还提供一种语音助手,该语音助手包括上述装置。
本发明还提供一种终端,该终端包括上述语音助手。
本发明还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如上所述的方法。
本发明还提供一种计算机可读存储介质,存储计算机指令,所述计算机指令用于实现如上所述的方法。
附图说明
图1是本发明实施例提供的智能交互平台示意图。
图2是本发明一种实施例中的用于语音助手的方法。
图3是本发明一种实施例中的用于语音助手的装置。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明的实施例以及实施例的具体特征是对本发明实施例技术方案的详细说明,而非对本发明说明书技术方案的限定,在不冲突的情况下,本发明的实施例以及实施例的技术特征可以相互结合。
参阅图1,图1是本发明智能交互平台的示意图,主要包括:人机交互界面101,处理模块102,数据库103等。其中处理模块包含多个交互引擎112,交互引擎112可以包含语义理解模块201,对话管理和控制模块202,对话生成模块203,命令执行模块204。其中,处理模块102与人机交互界面101相互连接,可以通过人机交互界面101接收用户输入的数据,以及通过人机交互界面向用户输出交互数据,即人机交互界面101一方面可以通过处理模块102接收反馈给用户的对话数据,一方面可以接收处理模块102反馈的命令执行过程及结果数据。对于智能语音交互平台,处理模块102还可以包括:语音识别模块210,语音输出模块211。所述语音识别模块210,语音输出模块211也可被配置于交互引擎112中。此外,交互引擎112可以是单个交互引擎,也可以由一个或多个交互子引擎构成。
智能交互平台中交互引擎的优化的其中一项要点是提高交互引擎的处理能力,增强交互引擎对于语义的理解,提高对话交互的效率,和提升任务执行精准性;这些都需要对用户意图的进行准确理解,通过富集交互引擎中槽位及槽位解析,提高交互引擎对于交互的控制和管理。
请参阅图2,图2是本发明实施例一提供的一种用于语音助手的方法,该方法包括但不限于:
步骤101,语音助手获取用户的语音命令;
步骤103,根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,执行步骤105,否则,执行步骤107;
步骤105,根据调用的交互子引擎,与用户进行交互;
步骤107,语音助手创建该交互子引擎。
具体的,在步骤101,当用户与语音助手对话时,语音助手获取用户的语音命令。
例如当用户需要语音助手协助其购买咖啡时,向语音助手提出“帮我订一杯咖啡”。
在步骤103,根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,包括
语音助手根据用户语音命令中的关键信息,如订购咖啡,判断是否存在与关键信息相关的交互子引擎包括以下步骤:
步骤301,语音助手判断本地是否存在该交互子引擎,若是则执行步骤105,否则,执行步骤302;
步骤302,语音助手向用户好友发送查询请求,若用户好友具有该关键信息对应的交互子引擎,则发送给语音助手,执行步骤105;否则执行步骤303;
进一步的,当多个好友均反馈了该交互子引擎,则根据预设策略选择交互子引擎,如选择与用户亲密度指数最高的好友的交互子引擎、选择好友最新更新或形成的交互子引擎等,其中用户与好友的亲密度指数基于用户与好友之间的互动频率等因素确定。
步骤303,语音助手向智能交互平台发起查询请求,确定智能交互平台是否存在对应于该关键信息的交互子引擎,若是,则将该交互子引擎作为目标交互子引擎下载到语音助手或者直接调用该交互子引擎,执行步骤105;否则执行步骤107;
进一步的,当查询到多个满足条件的交互子引擎时,根据特定规则对交互子引擎进行选择,如选择评价分数最高的交互子引擎作为目标交互子引擎、选择下载量最高的交互子引擎作为目标交互子引擎、选择与用户处于同一地理区域的交互子引擎作为目标交互子引擎,或者基于多种规则,如所列举的规则的加权值确定等。
通过上述过程,使得选择的交互子引擎更满足用户的需求。
步骤105,根据调用的交互子引擎,与用户进行交互。
交互子引擎中包括槽位,其中槽位通常包含槽位描述,槽位内容,以及其他对槽位进行解释的元素,例如槽位类型:该槽位是否必须填写;例如槽位属性:该槽位的含义,如代表时间、地点、周期、区域、或是货币种类;为简单举例,本发明实施例主要以槽位描述,槽位内容示意。
如订购咖啡的交互子引擎包括以下槽位:商家、口味、规格、取货方式、提货时间。下面结合该示例对该交互过程进行描述。
判断用户是否调用过该交互子引擎,若未调用过,则根据该交互子引擎包括的槽位信息生成问题,与用户进行语音交互,如多轮对话完成槽位的填充,若调用过,则获取用户过去调用该交互子引擎时填充于槽位的关键知识数据,若对于同一个槽位,只填充过一次关键知识数据或多次填充的关键知识数据相同,则利用该关键知识数据填充槽位,若不同,则按照一定规则选择关键知识数据,对于未填充的槽位,则通过与用户的语音交互,如多轮对话完成槽位填充;对于填充完成的槽位,将未经用户确认的关键知识数据反馈于用户,由用户确认或进行修改。
优选地,按照一定规则选择关键知识数据进行填充包括至少任一方式:
1)按照预定时间段内槽位填充的关键知识数据的频率进行排序,选择使用频率最高的关键知识数据进行填充;
例如对于规格这一槽位,统计用户最近一个月内选择频率最高的关键知识数据,如大杯选择了9次,中杯选择了7次,小杯选择了3次,则基于该统计,选择使用次数最高的9次的大杯作为规格的填充值。
2)选择用户最新使用过的关键知识数据进行槽位填充;
对于订购咖啡这一语音命令,对于商家这一槽位,用户最新订购咖啡的商家为星巴克,则为用户选择星巴克进行填充。
3)确定用户选择关键知识数据的规律,根据确定的规律为用户选择关键知识数据进行槽位填充。
优选地,在确定关键知识数据时,语音助手可根据需要从其他途径,如网站或APP抓取相应内容,或者调用其他功能辅助确定选择的关键知识数据。
例如对于口味这一槽位,分析用户选择咖啡口味的特点,如在最近一段时间连续选择同一口味的咖啡,如拿铁,则预测用户最近时间段比较喜欢拿铁咖啡,将其作为填充值;若用户每次订购咖啡时优先选择新品咖啡,则从订购咖啡的网站或者APP上抓取相应的内容,获取是否有新品咖啡推出,若有则利用该新品咖啡填充该槽位,若无,则利用最近一次的订购数据填充该槽位。
例如对于商家这一槽位,对于选择具体的星巴克店时,调用GPS功能确定用户的位置,为用户选择一家距离最近的星巴克。
4)根据多种规则对用户使用过的关键知识数据排序,若多种规则中排序最高的关键知识数据相同,则直接利用该关键知识数据进行填充,若不同,则将每个规则中排序最高的关键知识数据都提供给用户,根据用户选择确定填充的关键知识数据。
例如对于口味这一槽位,根据预定时间段内槽位填充的关键知识数据的频率排序后的结果是摩卡咖啡是选择频率最高的咖啡,而根据用户最新使用过的关键知识数据这一规则确定的是拿铁咖啡,则语音助手将两种类型的咖啡提供给用户,让用户进行选择确认,通过这种方式可以为用户提供更多的选择机会。
在步骤107,当不存在对应于语音命令的该关键信息的交互子引擎时,语音助手执行创建该交互子引擎的过程;
语音助手根据关键信息确定该交互子引擎需要的槽位,如果执行该语音命令需要调用与该语音命令的关键信息相关联的其他服务,如网站或APP,根据该服务确定所需槽位。如用户向语音助手发出“在星巴克订一杯咖啡”的语音命令时,获取关键信息:星巴克、订咖啡,根据该关键信息调用订购星巴克咖啡的APP,根据该APP订咖啡的流程,确定创建的该交互子引擎所需槽位至少包括:商家、口味、规格、取货方式。
根据该槽位生成相关问题,与用户进行交互获取关键知识数据,从而填充槽位。由此创建并保存该交互子引擎。通过该步骤,使得语音助手自动创建满足用户需求的交互子引擎,一方面为用户本次需求提供了服务,另一方面为用户后续提供同样服务提供便利。
进一步的,语音助手将该交互子引擎分享至智能交互平台或者向用户好友分享该创建的交互子引擎。通过将交互子引擎分享,克服了仅由开发人员开发交互子引擎的局限性,为语音助手智能化提供了很有利的帮助。
优选地,该方法还包括步骤109,语音助手监控与该交互子引擎关联的任务是否执行完毕,若否,则判断是否存在影响该任务的因素,若存在则根据该因素生成语音,与用户进行交互;进一步的,语音助手确定是否要修改该交互子引擎中受影响的槽位的关键知识数据,若需要修改,向用户提示和/或向用户提供修改建议,同时根据用户语音命令修改与该交互子引擎关联的任务。
语音助手帮用户订购咖啡后,若用户选择的是下午5点自提,语音助手根据用户的位置、路况等信息实时或者周期性监控用户是否可以按时提货,若因为堵车不能按时提货,则生成语音向用户提示由于路况原因当前无法按时提货,并询问用户是否修改提货时间,若是,则更新提货时间槽位填充的内容,并修改与该子引擎关联的订单。
通过该步骤,当完成与用户的此次对话后,对对话关联的任务进一步跟踪监控,根据任务的执行情况随时向用户反馈,提供建议,可以为用户提供更好的体验。
通过本发明的方法,可以使得语音助手与用户之间的交互更加智能化,人性化,提高交互效率,提高用户体验。
本发明还提出的一种用于语音助手的装置,如图3所示,用于执行上述方法,该用于语音助手的装置包括
获取模块,用于获取用户的语音命令;
判断模块,用于根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,触发交互模块,否则,触发创建模块;
交互模块,用于根据调用的交互子引擎,与用户进行交互;
创建模块,用于创建交互子引擎。
具体的,当用户与语音助手对话时,获取模块获取用户的语音命令。
判断模块根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,包括
根据用户语音命令中的关键信息,判断是否存在与关键信息相关的交互子引擎包括:
步骤301,判断模块判断本地是否存在该交互子引擎,若是则触发交互模块,否则,执行步骤302;
步骤302,判断模块向用户好友发送查询请求,若用户好友具有该关键信息对应的交互子引擎,则发送给交互模块,触发交互模块;否则执行步骤303;
进一步的,当多个好友均反馈了该交互子引擎,则根据预设策略选择交互子引擎,如选择与用户亲密度指数最高的好友的交互子引擎、选择好友最新更新或形成的交互子引擎等,其中用户与好友的亲密度指数基于用户与好友之间的互动频率等因素确定。
步骤303,判断模块向智能交互平台发起查询请求,确定智能交互平台是否存在对应于该关键信息的交互子引擎,若是,则将该交互子引擎作为目标交互子引擎下载到交互模块或者直接调用该交互子引擎,触发交互模块;否则触发创建模块;
进一步的,当查询到多个满足条件的交互子引擎时,根据特定规则对交互子引擎进行选择,如选择评价分数最高的交互子引擎作为目标交互子引擎、选择下载量最高的交互子引擎作为目标交互子引擎、选择与用户处于同一地理区域的交互子引擎作为目标交互子引擎,或者基于多种规则,如所列举的规则的加权值确定等。
交互模块根据调用的交互子引擎,与用户进行交互包括
交互子引擎中包括槽位,其中槽位通常包含槽位描述,槽位内容,以及其他对槽位进行解释的元素,例如槽位类型:该槽位是否必须填写;例如槽位属性:该槽位的含义,如代表时间、地点、周期、区域、或是货币种类;为简单举例,本发明实施例主要以槽位描述,槽位内容示意。
交互模块判断用户是否调用过该交互子引擎,若未调用过,则根据该交互子引擎包括的槽位信息生成问题,与用户进行语音交互,如多轮对话完成槽位的填充,若调用过,则获取用户过去调用该交互子引擎时填充于槽位的关键知识数据,若对于同一个槽位,只填充过一次关键知识数据或多次填充的关键知识数据相同,则利用该关键知识数据填充槽位,若不同,则按照一定规则选择关键知识数据,对于未填充的槽位,则通过与用户的语音交互,如多轮对话完成槽位填充;对于填充完成的槽位,将未经用户确认的关键知识数据反馈于用户,由用户确认或进行修改。
优选地,按照一定规则选择关键知识数据进行填充包括至少任一方式:
1)按照预定时间段内槽位填充的关键知识数据的频率进行排序,选择使用频率最高的关键知识数据进行填充;
2)选择用户最新使用过的关键知识数据进行槽位填充;
3)确定用户选择关键知识数据的规律,根据确定的规律为用户选择关键知识数据进行槽位填充。
优选地,在确定关键知识数据时,语音助手可根据需要从其他途径,如网站或APP抓取相应内容,或者调用其他功能辅助确定选择的关键知识数据。
4)根据多种规则对用户使用过的关键知识数据排序,若多种规则中排序最高的关键知识数据相同,则直接利用该关键知识数据进行填充,若不同,则将每个规则中排序最高的关键知识数据都提供给用户,根据用户选择确定填充的关键知识数据。
当不存在对应于语音命令的该关键信息的交互子引擎时,创建模块执行创建交互子引擎的过程;
创建模块根据关键信息确定该交互子引擎需要的槽位,如果执行该语音命令需要调用与该语音命令的关键信息相关联的其他服务,如网站或APP,根据该服务确定所需槽位。
根据该槽位生成相关问题,与用户进行交互获取关键知识数据,从而填充槽位。由此创建并保存该交互子引擎。
进一步的,该装置包括分享模块,将该交互子引擎分享至智能交互平台或者向用户好友分享该创建的交互子引擎。
优选地,该装置还包括监控模块,监控与该交互子引擎关联的任务是否执行完毕,若否,则判断是否存在影响该任务的因素,若存在则根据该因素生成语音,与用户进行交互;进一步的,确定是否要修改该交互子引擎中受影响的槽位的关键知识数据,若需要修改,向用户提示和/或向用户提供修改建议,同时根据用户语音命令修改与该交互子引擎关联的任务。
本发明还提供一种语音助手,该语音助手包括上述装置。
本发明还提供一种终端,该终端包括上述语音助手。
具体地,终端设备可以是计算机、平板电脑、手机、智能助手、车载终端等。
本发明还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如上所述的方法。
本发明还提供一种计算机可读存储介质,存储计算机指令,所述计算机指令用于实现如上所述的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦式可编程只读存储器(EPROM)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码。
以上说明只是为了方便理解本发明而举出的例子,不用于限定本发明的范围。在具体实现时,本领域技术人员可以根据实际情况对装置的部件进行变更、增加、减少,在不影响方法所实现的功能的基础上可以根据实际情况对方法的步骤进行变更、增加、减少或改变顺序。
尽管已经示出和描述了本发明的实施例,本领域技术人员应当理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同替换所限定,在未经创造性劳动所作的改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种用于语音助手的方法,其特征在于,该方法包括以下步骤:
步骤101,语音助手获取用户的语音命令;
步骤103,根据语音命令判断是否存在与该语音命令对应的交互子引擎,若否,执行步骤107;
步骤107,语音助手如果执行该语音命令需要调用与该语音命令的关键信息相关联的其他服务,其他服务包括网站或APP,根据网站或APP界面包括的内容确定所需槽位;根据该槽位生成相关问题,与用户进行交互获取关键知识数据,从而填充槽位,由此创建该交互子引擎;
进一步的,语音助手还监控与该交互子引擎关联的任务是否执行完毕。
2.根据权利要求1所述的方法,其特征在于,
语音助手根据用户语音命令中的关键信息,判断是否存在与该关键信息相关的交互子引擎。
3.根据权利要求1所述的方法,其特征在于,
在步骤103中,若判断存在与该语音命令对应的交互子引擎,则调用该交互子引擎,根据调用的交互子引擎,与用户进行交互,包括
判断用户是否调用过该交互子引擎,若未调用过,则根据该交互子引擎包括的槽位信息生成问题,与用户进行语音交互;
若调用过,则获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充。
4.根据权利要求3所述的方法,其特征在于,
获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充包括
若对于同一个槽位,只填充过一次关键知识数据或多次填充的关键知识数据相同,则利用该关键知识数据填充槽位,若不同,则按照一定规则选择关键知识数据进行填充,对于未填充的槽位,则通过与用户的语音交互完成槽位填充;对于填充完成的槽位,将未经用户确认的关键知识数据反馈于用户,由用户确认或进行修改。
5.根据权利要求4所述的方法,其特征在于,
按照一定规则选择关键知识数据进行填充包括以下至少任一方式:
1)按照预定时间段内槽位填充的关键知识数据的频率进行排序,选择使用频率最高的关键知识数据进行填充;
2)选择用户最新使用过的关键知识数据进行槽位填充;
3)确定用户选择关键知识数据的规律,根据确定的规律为用户选择关键知识数据进行槽位填充;
4)根据多种规则对用户使用过的关键知识数据排序,若多种规则中排序最高的关键知识数据相同,则直接利用该关键知识数据进行填充,若不同,则将每个规则中排序最高的关键知识数据都提供给用户,根据用户选择确定填充的关键知识数据。
6.一种用于语音助手的装置,该装置包括:
获取模块,用于获取用户的语音命令;
判断模块,用于根据语音命令判断是否存在与该语音命令对应的交互子引擎,若否,触发创建模块;
创建模块,用于创建交互子引擎;
其中,创建模块创建交互子引擎包括以下步骤:根据关键信息确定该交互子引擎需要的槽位,如果执行该语音命令需要调用与该语音命令的关键信息相关联的其他服务,其他服务包括网站或APP,根据网站或APP界面包括的内容确定所需槽位;根据该其他服务确定所需槽位;根据该槽位生成相关问题,与用户进行交互获取关键知识数据,从而填充槽位,由此创建该交互子引擎;
监控模块,监控与该交互子引擎关联的任务是否执行完毕。
7.根据权利要求6所述的装置,其特征在于,
判断模块根据语音命令判断是否存在与该语音命令对应的交互子引擎,若是则调用该交互子引擎,包括
根据用户语音命令中的关键信息,判断是否存在与关键信息相关的交互子引擎。
8.根据权利要求6所述的装置,其特征在于,该装置还包括交互模块;
判断模块判断存在与该语音命令对应的交互子引擎,则调用该交互子引擎,触发交互模块,交互模块根据调用的交互子引擎,与用户进行交互,包括:
判断用户是否调用过该交互子引擎,若未调用过,则根据该交互子引擎包括的槽位信息生成问题,与用户进行语音交互;
若调用过,则获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充。
9.根据权利要求8所述的装置,其特征在于,
获取用户过去调用该交互子引擎时填充于槽位的关键知识数据进行槽位填充包括
若对于同一个槽位,只填充过一次关键知识数据或多次填充的关键知识数据相同,则利用该关键知识数据填充槽位,若不同,则按照一定规则选择关键知识数据进行填充,对于未填充的槽位,则通过与用户的语音交互完成槽位填充;对于填充完成的槽位,将未经用户确认的关键知识数据反馈于用户,由用户确认或进行修改。
10.根据权利要求9所述的装置,其特征在于,
按照一定规则选择关键知识数据进行填充包括以下至少任一方式:
1)按照预定时间段内槽位填充的关键知识数据的频率进行排序,选择使用频率最高的关键知识数据进行填充;
2)选择用户最新使用过的关键知识数据进行槽位填充;
3)确定用户选择关键知识数据的规律,根据确定的规律为用户选择关键知识数据进行槽位填充;
4)根据多种规则对用户使用过的关键知识数据排序,若多种规则中排序最高的关键知识数据相同,则直接利用该关键知识数据进行填充,若不同,则将每个规则中排序最高的关键知识数据都提供给用户,根据用户选择确定填充的关键知识数据。
11.一种语音助手,该语音助手包括如权利要求6-10任一项所述的装置。
12.一种终端,其特征在于,包括如权利要求11所述的语音助手。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如权利要求1-5任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,存储计算机指令,所述计算机指令用于实现如权利要求1-5任一项所述的方法。
CN201910706651.5A 2019-02-26 2019-08-01 一种用于语音助手的方法及装置 Active CN110310641B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019101416375 2019-02-26
CN201910141637 2019-02-26

Publications (2)

Publication Number Publication Date
CN110310641A CN110310641A (zh) 2019-10-08
CN110310641B true CN110310641B (zh) 2022-08-26

Family

ID=68082868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910706651.5A Active CN110310641B (zh) 2019-02-26 2019-08-01 一种用于语音助手的方法及装置

Country Status (1)

Country Link
CN (1) CN110310641B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046256B (zh) * 2019-12-03 2024-02-06 上海二六三通信有限公司 一种基于交互引擎簇进行语音交互的方法及装置
CN111124348B (zh) * 2019-12-03 2023-12-05 光禹莱特数字科技(上海)有限公司 一种生成交互引擎簇的方法及装置
CN111105793B (zh) * 2019-12-03 2022-09-06 杭州蓦然认知科技有限公司 一种基于交互引擎簇的语音交互方法及装置
CN111124347B (zh) * 2019-12-03 2023-05-26 杭州蓦然认知科技有限公司 一种聚合形成交互引擎簇的方法、装置
CN111128153B (zh) * 2019-12-03 2020-10-02 北京蓦然认知科技有限公司 一种语音交互方法及装置
CN111091825B (zh) * 2019-12-03 2022-09-23 杭州蓦然认知科技有限公司 一种构建交互引擎簇的方法及装置
CN110992944B (zh) * 2019-12-17 2022-05-10 广州小鹏汽车科技有限公司 语音导航的纠错方法、语音导航装置、车辆和存储介质
CN111125452B (zh) * 2019-12-26 2024-02-20 深圳市旦米科技有限公司 一种基于信息关联的语音交互方法、装置
CN111026538B (zh) * 2019-12-26 2023-04-14 杭州蓦然认知科技有限公司 一种app生态系统建立、使用方法、装置
CN111124649B (zh) * 2019-12-26 2023-04-18 杭州蓦然认知科技有限公司 一种生成app生态系统的方法、装置
CN111061453B (zh) * 2019-12-26 2023-12-26 北京官匠空间科技有限公司 一种用于app生态系统的语音交互方法、装置
CN113496702A (zh) * 2020-04-03 2021-10-12 北京京东振世信息技术有限公司 音频信号响应方法、装置、计算机可读介质及电子设备

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140222422A1 (en) * 2013-02-04 2014-08-07 Microsoft Corporation Scaling statistical language understanding systems across domains and intents
US9613027B2 (en) * 2013-11-07 2017-04-04 Microsoft Technology Licensing, Llc Filled translation for bootstrapping language understanding of low-resourced languages
CN107452382A (zh) * 2017-07-19 2017-12-08 珠海市魅族科技有限公司 语音操作方法及装置、计算机装置和计算机可读存储介质
CN107871500A (zh) * 2017-11-16 2018-04-03 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
CN107886948A (zh) * 2017-11-16 2018-04-06 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
CN107919123A (zh) * 2017-12-07 2018-04-17 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
CN107919127A (zh) * 2017-11-27 2018-04-17 北京地平线机器人技术研发有限公司 语音处理方法、装置和电子设备
CN108509619A (zh) * 2018-04-04 2018-09-07 科大讯飞股份有限公司 一种语音交互方法及设备
US20180260680A1 (en) * 2017-02-14 2018-09-13 Microsoft Technology Licensing, Llc Intelligent device user interactions
CN108551766A (zh) * 2016-12-30 2018-09-18 谷歌有限责任公司 用于与服务提供者的会话建立的自然语言处理
US20180330721A1 (en) * 2017-05-15 2018-11-15 Apple Inc. Hierarchical belief states for digital assistants
CN108962244A (zh) * 2018-06-29 2018-12-07 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN109068005A (zh) * 2018-09-28 2018-12-21 出门问问信息科技有限公司 一种计时提醒事件的创建方法及装置
CN109154900A (zh) * 2016-03-17 2019-01-04 纽昂斯通讯公司 两个或更多个虚拟助理之间的会话处理交互
US20190035387A1 (en) * 2017-07-27 2019-01-31 Microsoft Technology Licensing, Llc Intent and Slot Detection For Digital Assistants
CN109344231A (zh) * 2018-10-31 2019-02-15 广东小天才科技有限公司 一种补全语义残缺的语料的方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105830048A (zh) * 2013-12-16 2016-08-03 纽昂斯通讯公司 用于提供虚拟助理的系统和方法
US10574517B2 (en) * 2017-04-24 2020-02-25 International Business Machines Corporation Adding voice commands to invoke web services
CN109003605B (zh) * 2018-07-02 2020-04-21 北京百度网讯科技有限公司 智能语音交互处理方法、装置、设备及存储介质
CN109697979B (zh) * 2018-12-25 2021-02-19 Oppo广东移动通信有限公司 语音助手技能添加方法、装置、存储介质及服务器
CN110310630B (zh) * 2019-02-26 2021-02-05 北京蓦然认知科技有限公司 一种语音助手的训练和分享方法
CN110136705B (zh) * 2019-04-10 2022-06-14 华为技术有限公司 一种人机交互的方法和电子设备
CN110798506B (zh) * 2019-09-27 2023-03-10 华为技术有限公司 执行命令的方法、装置及设备
CN110718221A (zh) * 2019-10-08 2020-01-21 百度在线网络技术(北京)有限公司 语音技能控制方法、语音设备、客户端以及服务器
CN112379876B (zh) * 2020-11-13 2022-03-15 惠州市德赛西威汽车电子股份有限公司 一种自定义语音技能的方法及服务器

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140222422A1 (en) * 2013-02-04 2014-08-07 Microsoft Corporation Scaling statistical language understanding systems across domains and intents
US9613027B2 (en) * 2013-11-07 2017-04-04 Microsoft Technology Licensing, Llc Filled translation for bootstrapping language understanding of low-resourced languages
CN109154900A (zh) * 2016-03-17 2019-01-04 纽昂斯通讯公司 两个或更多个虚拟助理之间的会话处理交互
CN108551766A (zh) * 2016-12-30 2018-09-18 谷歌有限责任公司 用于与服务提供者的会话建立的自然语言处理
US20180260680A1 (en) * 2017-02-14 2018-09-13 Microsoft Technology Licensing, Llc Intelligent device user interactions
US20180330721A1 (en) * 2017-05-15 2018-11-15 Apple Inc. Hierarchical belief states for digital assistants
CN107452382A (zh) * 2017-07-19 2017-12-08 珠海市魅族科技有限公司 语音操作方法及装置、计算机装置和计算机可读存储介质
US20190035387A1 (en) * 2017-07-27 2019-01-31 Microsoft Technology Licensing, Llc Intent and Slot Detection For Digital Assistants
CN107886948A (zh) * 2017-11-16 2018-04-06 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
CN107871500A (zh) * 2017-11-16 2018-04-03 百度在线网络技术(北京)有限公司 一种播放多媒体的方法和装置
CN107919127A (zh) * 2017-11-27 2018-04-17 北京地平线机器人技术研发有限公司 语音处理方法、装置和电子设备
CN107919123A (zh) * 2017-12-07 2018-04-17 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
CN108509619A (zh) * 2018-04-04 2018-09-07 科大讯飞股份有限公司 一种语音交互方法及设备
CN108962244A (zh) * 2018-06-29 2018-12-07 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN109068005A (zh) * 2018-09-28 2018-12-21 出门问问信息科技有限公司 一种计时提醒事件的创建方法及装置
CN109344231A (zh) * 2018-10-31 2019-02-15 广东小天才科技有限公司 一种补全语义残缺的语料的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Joint Slot Filling and Intent Detection via Capsule Neural Networks;Chenwei Zhang等;《https://arxiv.org/abs/1812.09471v1》;20181222;全文 *

Also Published As

Publication number Publication date
CN110310641A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN110310641B (zh) 一种用于语音助手的方法及装置
AU2020220088B2 (en) Triggering notifications associated with tasks to perform
CN105628048B (zh) 一种地图信息处理方法及终端
CN105933372B (zh) 任务分配执行方法、服务器及终端
EP2883204B1 (en) Virtual agent communication for electronic devices
CN102792320B (zh) 数字助理的个人化词汇
US20170068551A1 (en) Intelli-voyage travel
CN109003605A (zh) 智能语音交互处理方法、装置、设备及存储介质
KR20170070094A (ko) 음성 및 연결 플랫폼
AU2005200320A1 (en) Recognition results postprocessor for use in voice recognition systems
US20200401955A1 (en) Systems and methods for automated itinerary modification
CN107277225B (zh) 语音控制智能设备的方法、装置和智能设备
EP2847693A2 (en) Actionable reminder entries
CN110462647B (zh) 电子设备及执行电子设备的功能的方法
CN107293294B (zh) 一种语音识别处理方法及装置
CN110471858A (zh) 应用程序测试方法、装置及存储介质
US20060212515A1 (en) Applications server and method
US20230206004A1 (en) Composite entity for rule driven acquisition of input data to chatbots
JP5375910B2 (ja) 地図情報共有・更新システム及び端末装置
CN110162292A (zh) 语音播报方法及装置
CN113906432A (zh) 使用知识模型对聊天机器人中的自然理解系统的上下文反馈
WO2017112251A1 (en) Dynamic intent registry
CN111813900A (zh) 多轮对话处理方法、装置、电子设备及存储介质
CN112735407B (zh) 一种对话处理方法及装置
CN107800895A (zh) 一种互动式语音应答方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211231

Address after: 310024 floor 5, zone 2, building 3, Hangzhou cloud computing Industrial Park, Zhuantang street, Xihu District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou suddenly Cognitive Technology Co.,Ltd.

Address before: Room 401, gate 2, block a, Zhongguancun 768 Creative Industry Park, 5 Xueyuan Road, Haidian District, Beijing 100083

Applicant before: BEIJING MORAN COGNITIVE TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant