CN110473521B - 一种任务模型的训练方法、装置、设备 - Google Patents

一种任务模型的训练方法、装置、设备 Download PDF

Info

Publication number
CN110473521B
CN110473521B CN201910706848.9A CN201910706848A CN110473521B CN 110473521 B CN110473521 B CN 110473521B CN 201910706848 A CN201910706848 A CN 201910706848A CN 110473521 B CN110473521 B CN 110473521B
Authority
CN
China
Prior art keywords
user
slot
task
task model
voice assistant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910706848.9A
Other languages
English (en)
Other versions
CN110473521A (zh
Inventor
常凌
赵晓朝
袁志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou suddenly Cognitive Technology Co.,Ltd.
Original Assignee
Hangzhou Suddenly Cognitive Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Suddenly Cognitive Technology Co ltd filed Critical Hangzhou Suddenly Cognitive Technology Co ltd
Publication of CN110473521A publication Critical patent/CN110473521A/zh
Application granted granted Critical
Publication of CN110473521B publication Critical patent/CN110473521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Abstract

本发明实施例公开了一种任务模型的训练方法,应用于语音助手,包括如下步骤:步骤1、语音助手接收用户发送的任务指令,执行任务指令得到执行结果;步骤2、根据执行结果抓取相关的知识图谱;步骤3、根据任务指令获得任务类型,并根据任务类型得到通用意图;步骤4、根据知识图谱和/或多轮对话对通用意图进行修正,获得用户的真实意图;步骤5、根据用户的真实意图生成槽位;步骤6、根据知识图谱和多轮对话填充槽位;步骤7、根据槽位生成可调用的任务模型保存到语音助手中,并根据条件自动触发任务模型。通过本发明的方法提高了语言助手的灵活性,能够满足用户在特定活动中的特殊需求,提升用户体验度。

Description

一种任务模型的训练方法、装置、设备
技术领域
本发明实施例涉及信息处理技术领域,特别涉及一种任务模型的训练方法、装置、设备及计算机可读存储介质。
背景技术
随着人工智能技术的发展,产生了大量的利用语音识别技术辅助用户实现需求的应用或软件,语音助手就是其中一种智能型的应用,通过智能对话和即时问答实现人机交互,帮助用户解决问题,例如帮助用户查询资料、实现订餐、导航等需求。但是现有的语音助手通常是由设备厂商加载到终端产品中,存在功能单一,灵活度不足,不能满足用户个性化需求的问题,为了解决这一问题,本发明提供了一种语音助手中任务模型的训练方法、装置和设备,根据用户选择的源文件提取知识图谱训练针对用户特定需求或特定活动的任务模型。
发明内容
本发明实施例提供了一种基于场景的任务模型的训练方法、装置和设备,可用于解决相关技术中的问题。
一方面,本发明实施例提供了一种任务模型的训练方法,应用于语音助手,该任务模型的训练方法包括如下步骤:
步骤1、语音助手接收用户发送的任务指令,执行任务指令得到执行结果;
步骤2、根据执行结果抓取相关的知识图谱;
步骤3、根据任务指令获得任务类型,并根据任务类型得到通用意图;
步骤4、根据知识图谱和/或多轮对话对通用意图进行分解和修正,获得用户的真实意图;
步骤5、根据用户的真实意图生成槽位;
步骤6、根据知识图谱和多轮对话填充槽位;
步骤7、根据槽位生成可调用的任务模型保存到语音助手中,并根据条件自动触发任务模型。
优选的,步骤1的任务指令为搜索指令,执行结果为搜索结果。
优选的,根据搜索结果抓取相关的知识图谱具体为:搜索结果为日志信息,语音助手按照综合排序规则将多个日志信息推荐给用户,根据用户选择的一个或多个日志信息抓取相关的知识图谱。
其中,用户的真实意图包括一个或多个,一个真实意图对应一个或多个槽位、槽位对或槽位组,槽位对或槽位组分别由两个或多个具有关联关系的槽位组成。
优选的,根据知识图谱和多轮对话填充槽位还包括:填充槽位过程中,根据用户指令修改步骤5中的槽位,并根据知识图谱和多轮对话重新填充槽位。
其中,根据条件自动触发任务模型中的条件包括:
用户通过语音助手触发任务模型执行;
或,到达用户设置的时间点;
或,用户进入或离开特定区域;
另一方面,本发明实施例还提供了一种任务模型的训练装置,该任务模型训练装置包括:数据源接收模块,用于接收用户选择的数据源;知识图谱生成模块,用于根据选择的数据源抓取相关的知识图谱;通用意图生成模块,用于根据任务类型得到通用意图;真实意图生成模块,用于根据知识图谱和/或多轮对话对通用意图进行修正,获得用户的真实意图;槽位生成模块,用于根据用户的真实意图生成槽位;槽位填充模块,根据知识图谱和多轮对话填充槽位;任务模型生成模块,用于根据槽位和任务订单生成可调用的任务模型保存到语音助手中。
优选的,所述数据源为日志信息,根据用户选择的一个或多个日志信息抓取相关的知识图谱。
其中,用户的真实意图包括一个或多个,一个真实意图对应一个或多个槽位、槽位对或槽位组,槽位对或槽位组分别由两个或多个具有关联关系的槽位组成。
优选的,根据用户指令修改槽位生成模块生成的槽位,生成新的槽位;槽位填充模块根据知识图谱和多轮对话重新填充所述新的槽位。
另一方面,本发明实施例还提供了一种语音助手,包含如前所述的任务模型的训练装置。
另一方面,本发明实施例提供了一种终端设备,包含如前所述的任务模型训练装置。
另一方面,本发明实施例提供了一种终端设备,包含如前所述的语音助手。
另一方面,本发明实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如前所述的任务模型的训练方法。
另一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序,所述计算机程序在被执行时实现如前所述的任务模型的训练方法。
本发明实施例的实施能够根据获取的数据源直接训练任务模型,丰富了语音助手的功能,提高语言助手的灵活性,能够满足用户在特定活动中的特殊需求,提升用户体验度,取得了有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的语音助手的结构图。
图2是本说明书实施例提供的任务模型训练方法的流程示意图。
图3是本说明书实施例提供的任务模型训练装置结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明的实施例以及实施例的具体特征是对本发明实施例技术方案的详细说明,而非对本发明说明书技术方案的限定,在不冲突的情况下,本发明的实施例以及实施例的技术特征可以相互结合。
请参阅图1,图1是语音助手的结构图。本发明涉及的语音助手是指能够实现与用户的语音交互,准确获知用户意图,并通过网络连接执行用户意图的软件模块或硬件产品,语音助手可以加载在车机、PDA、PAD、手机、计算机、智能家居等终端产品中,也可以作为独立的硬件产品存在。语音助手中存储有任务模型,任务模型能够与语音助手中的其它模块(例如,语音识别模块、语义解析模块)交互,实现用户的意图,例如:订餐、查询、辅助旅游等功能。
语音助手能够与其它语音助手交互、分享信息,也可以与智能平台进行交互,上传或下载组件、程序、任务模块、数据等信息,实现灵活多样的数据更新和分享功能。
本发明的语音助手主要包括:人机交互界面101,语音识别模102,语义理解模块103,命令执行模块104,任务模型训练装置105,多个任务模型(1071,1072,...107n)和通信接口108。本实施例的语音助手增加了任务模型训练装置105,能够根据用户的需求创建新的任务模型,训练完成后的任务模型保存在语音助手中,供用户在需要时触发或调用。
可选的,语音助手还包括任务订单生成模块106,与任务模型训练装置105相连,用于保存任务模型训练装置105在任务模型训练中根据槽位信息生成的单一任务订单。例如,火车票订单,酒店预订订单等。
还允许用户对存储在语音助手中的任务模型进行多种管理操作,管理操作包括但不限于删除、分享、重命名、二次训练等操作,通过允许用户的管理操作能够给语音助手带来很强的灵活性和针对性。优选的,用户可以删除不再使用的任务模型,以节省语音助手的存储空间;优选的,用户可以直接将某个任务模型通过蓝牙、即时通信软件、管理服务器、APP等方式分享给好友,实现任务模型在两个终端之间的转移;优选的,用户可以给任务模型重新命名以便于查找和使用;优选的,用户还可以对已有的封闭的任务模型进行二次训练,重启训练过程,根据用户的指令修改其中的某些功能组件,例如,将某个旅游任务模型中的景点行程中的A地修改为B地。
实施例一
本实施例结合用户的旅游需求,对本发明的语音助手中各个模块的功能进行描述。下述涉及的具体的过程仅用于说明本发明的语音助手中各个模块的功能如何实现,而不应视为对各个模块的限制。
用户通过语音助手的人机交互界面101向语音助手发出语音指令:请给出清明去杭州玩三天的建议。针对某些用户的使用习惯和工作环境,指令还可以是文字指令、手势指令或图片指令等。如果用户发出语音指令,语音助手的人机交互界面101将接收到的用户语音指令发送给语音识别模块102进行语音识别,并将识别得到的文本信息发送给语义理解模块103进行语义解析,语义理解模块103将解析出的任务执行指令发送给命令执行模块104,命令执行模块104识别并执行该任务指令。本实施例中用户的语音指令最后被识别为搜索清明杭州三日游的攻略。搜索完成后语音助手将m条搜索结果通过人机交互界面101反馈给用户,供用户做出选择。m条搜索结果是语音助手对大量的搜索结果进行筛选后向用户推送的,语音助手可以结合搜索引擎的搜索结果、语音助手保存的用户资料、用户的历史行为、用户的偏好等条件筛选出该m条搜索结果。
用户浏览该m条搜索结果后发现其中作者为LISA的一篇或多篇攻略符合其需求,即可以通过人机交互界面101向语音助手发出这样的指令:选择LISA的攻略。语音助手的任务模型训练装置根据用户的选择生成问题,并通过人机交互界面向用户提问:是否根据LISA的攻略训练任务模型?用户回答:是。语音助手合并上述问题和答案进行识别后,生成任务指令“根据LISA的攻略训练任务模型”,并触发任务模型训练装置105训练任务模型。任务模型训练装置执行本发明的任务模型训练方法开始训练基于LISA的攻略的杭州清明三日游的任务模型,任务模型训练完成后,将其保存在语音助手中。
进一步的,任务模型通过执行多个子任务实现用户的意图,其通过语音助手的通信接口与具体执行子任务的网站、应用、硬件设备、组件、模块等通信以完成子任务的执行。例如,旅游任务模型可以通过语音助手的通信接口与订票网站或者订票APP通信,以实现旅游任务模型中的订票子任务。
进一步的,可以根据预设的条件或用户的指令触发语音助手中的任务模型执行相关的指令,辅助用户的旅游活动。
优选的,预设的条件可以是用户设置的条件或用户的操作,例如:用户设置3月1日8:00触发任务模型;或者用户设置离开北京市时触发任务模型;或者用户人工触发任务模型等。
实施例二
请参阅图2,图2是语音助手的任务模型训练方法的流程图。本发明的用于语音助手的任务模型训练方法包括如下步骤:
步骤1、语音助手接收用户发送的任务指令,执行任务指令得到执行结果;
在该步骤中,语音助手通过人机交互界面接收用户发出的语音指令,识别该语音指令并对其进行语义理解,根据语义理解结果生成能够执行的任务指令,并执行任务指令得到执行结果。优选的,语音助手根据用户的个人数据、历史行为等参数进一步筛选得到推荐的执行结果。
步骤2、根据执行结果抓取相关的知识图谱;
在该步骤中,语音助手将执行结果反馈给用户,供用户选择,用户选择的执行结果作为抓取知识图谱的数据源。
可替代的,用户可以通过人机交互界面直接向语音助手提供用于抓取知识图谱的数据源。数据源包括但不限于文本、图片、软件包、网页等形式。相应的语音助手中配置能够识别各类数据源的软件模块。
步骤3、根据任务指令获得任务类型,并根据任务类型得到通用意图;
在该步骤中,语音助手获取任务类型,该任务类型的获取可以通过分析用户的任务指令获取,也可以根据用户选择的执行结果获取。任务类型对应于通用意图,通用意图是特定任务类型对应的一个或多个基本意图,由语音助手开发人员配置、或专门的任务模型开发人员配置、或由特定的服务器根据大数据分析结果配置,可以保存在语音助手中,也可以保存在与语音助手相连的云服务器或云平台中。语音助手能够根据任务类型获取通用意图。例如:对于旅游任务模型,其通用意图可以为:订票+订酒店+行程安排。
步骤4、根据知识图谱和/或多轮对话对通用意图进行分解和修正,获得用户的真实意图;
由于通用意图仅包括执行某一类型的任务对应的基本意图集合。例如:就医这一类型的任务的通用意图包括挂号、就诊、支付、取药四个意图。仅使用通用意图往往无法满足特定用户的个性化需求。需要对通用意图进行修正,通过分解、删除、增加、修改等方式对通用意图中的一个或多个基本意图进行修正,使其与用户的本次任务更加匹配。例如用户A需要做眼科检查,其任务类型是就医,根据其任务类型获取就医任务的通用意图,包括挂号、就诊、支付、取药四个意图。根据用户A的眼科检查的流程生成真实意图,包括挂号、就诊、眼底检查、支付四个意图;其中增加了眼底检查这个意图,删除了取药这个意图。
步骤5、根据用户的真实意图生成槽位;
在本发明中,通过填充槽位,生成任务订单,执行任务订单来具体实现用户的意图。在步骤中,根据用户的真实意图建立对应的槽位,以实现用户的意图。
步骤6、根据知识图谱和多轮对话填充槽位;
槽位的填充是实现用户意图的关键,根据从数据源中提取的知识图谱,结合与用户之间的多轮对话,来完成槽位的填充。槽位的填充过程可以根据现有技术中的多种方法来实现。槽位填充完成后会构建多个未执行的任务订单,用户触发任务模型后,该任务订单被执行,进而实现用户意图。槽位填充过程中,允许用户修改步骤5生成的槽位,新生成的槽位覆盖原有槽位,并再次根据知识图谱和多轮对话填充新生成的槽位。
步骤7、根据槽位生成可调用的任务模型保存到语音助手中,并根据条件自动触发任务模型,完成任务订单的执行。
将各个意图的槽位信息整合生成任务模型,并存储在语音助手的存储空间中,用户可以为该任务模型命名,设置唤醒词,或设置触发条件,以利用任务模型辅助用户的行为。
下面以旅游场景为例,具体说明本发明的语音助手的任务模型的训练方法。
例如:用户A计划清明节到杭州游玩三天,需要语音助手训练针对该次行程的任务模型以辅助用户A的旅游过程。在训练语音任务模型之前,首先需要获取相关的知识图谱,知识图谱的获取有多种途径,例如根据用户A的历史经验,或者用户A的好友推荐等方式获取。本实施例中,对于没有去过杭州的用户A来说,利用网络上的推荐信息生成知识图谱是最优的做法。此时,用户A可以通过语音输入向语音助手下达任务指令:请给出清明杭州三日游的建议。语音助手接收到该任务指令后,通过其语音识别模块和语义理解模块识别出该指令,生成搜索指令从互联网或者从特定的旅游信息分享网站进行搜索,抓取与该指令相关的旅游日志信息或旅行攻略。通常搜索引擎返回的相关旅游日志信息有很多,语音助手可以在搜索引擎返回的排序的基础上,再结合相关度、评分以及语音助手保存的用户画像、用户历史行为、用户偏好等个性化内容对搜索结果再次排序后向用户推送,并顺次询问用户是否选择该篇日志作为抓取知识图谱的数据源,当用户选择了一篇或多篇旅游日志作为抓取知识图谱的数据源时,语音助手即确定该一篇或多篇旅游日志为本次任务模型的数据源,语音助手从该数据源中抓取知识图谱并开始训练过程。
在本发明中,可以采用实体抽取、语义类抽取、属性和属性值抽取、关系抽取的方法提取知识图谱。也可以采用其它的知识图谱提取方法。
然后,语音助手识别出该任务的类型是国内旅游任务,根据该任务类型匹配出通用意图包括订票、订酒店、景点行程、餐饮。通用意图是指完成一项任务通常涉及的一个或多个基本意图,通用意图与用户是谁没有关系,只与任务类型相关联,是语音助手的开发人员或系统管理人员或语音助手所在的系统根据大数据分析结果定义的,其作用于语音助手所处的整个系统中。该定义可以是动态定义,能够根据整个系统的数据分析实时更新,使其更贴近用户的真实意图。例如,系统定义旅游任务的通用意图包括订票、订酒店、景点行程、餐饮4个意图,这四个意图构成旅游任务的通用意图;又例如,系统定义订餐任务模型的通用意图包括订餐1个意图。
通用意图仅体现了任务的类型特点,不能完全反映特定用户的个性化需求,因此,需要根据知识图谱结合多轮对话对通用意图进行修正,获得用户的真实意图。本实施例中,通过对知识图谱的文本语义理解发现作为数据源的旅游日志推荐从北京乘坐高铁到达杭州,在杭州本地通过租车行租借车辆出行,在多轮对话中获得用户希望从“神州租车”租借车辆出行,或者语音助手根据用户的个人数据,获知用户A拥有神州租车车行的充值卡。语音助手就可以将通用意图进一步分解、修改为订往返高铁票、神州租车订车、订酒店、景点行程、餐饮这五个真实意图,通过多轮对话获得用户的确认。
用户的真实意图确认后,语音助手针对每个真实意图根据知识图谱和/或多轮对话生成槽位,并根据知识图谱和/或多轮对话获取关键知识信息填充槽位。
真实意图1-订往返高铁票包括两个槽位组,两个槽位组都包含出发地、目的地、日期三个槽位,两个槽位组可以标记为:“去程-出发地-目的地-日期”和“回程-出发地-目的地-日期”;
真实意图2-神州租车订车包括租车地点、租车时间、车型三个槽位;
真实意图3-订酒店包括酒店名称、房型、入住时间、退房时间、身份信息、支付信息六个槽位;
真实意图4-景点行程包括多个可扩展的时间-景点槽位对;
真实意图5-餐饮包括餐饮类型-时间-餐厅槽位组,餐饮类型是指早餐、午餐、晚餐、下午茶,时间为该餐饮类型的用餐时间,餐厅为希望用户A希望该时间段用餐的餐厅信息。
语音助手生成真实意图对应的槽位后,优选的,通过人机对话得到用户的确认信息,完成槽位生成过程;或者根据用户的反馈删除、添加、修改槽位,得到每个真实意图对应的所有槽位。
进一步的,语音助手根据知识图谱和多轮对话填充对应的槽位。下面针对本实施中确定的五个真实意图的槽位填充过程进行详细描述。
对于订往返高铁票的真实意图1,首先填充第一个槽位组,根据知识图谱将出发地槽位填充为北京,目的地槽位填充为杭州东,日期填充为4月4日上午,也即第一个槽位组填充为去程-北京-杭州东-4月4日上午;第二个槽位组填充为回程-杭州东-北京-4月7日下午,并生成问题询问用户是否预定从4月4日上午从北京到杭州东的高铁票和4月7日下午从杭州东到北京的高铁票?根据用户的确认回答完成槽位填充过程,或根据用户的否认回答重新填充槽位,槽位填充过程完成后,生成待执行的子任务订单。
对于真实意图2,语音助手根据知识图谱和多轮对话填充租车地点槽位为神州租车杭州东站店,填充租车时间槽位为4月4日下午-4月7日上午,填充车型槽位为速腾,生成问题询问用户:是否从神州租车杭州东站店预定一辆速腾,时间为4月4日下午-4月7日上午?用户回答是,完成槽位填充过程;如果用户回答预定一辆七座车,则根据用户要求获取推荐车型,重新填充车型槽位为GL8,再次生成问题向用户提问,用户确认后,优选的,生成待执行的子任务订单。
对于真实意图3,语音助手根据知识图谱填充酒店名称槽位为杭州维景国际大酒店,房型槽位填充为大床房,入住时间槽位填充为4月4日下午,退房时间槽位填充为4月7日上午,对于身份信息槽位和支付信息槽位这类与用户身份安全密切相关的槽位,可以将槽位的填充信息设置为授权或不授权,当槽位填充信息设置为授权时允许任务模型通过语音助手调用用户存储在本地或相关APP的身份信息和支付信息。身份信息槽位和支付信息槽位也可以像普通槽位一样直接向用户询问并根据用户的回答进行填充。也可以不设置身份信息槽位和支付信息槽位,而是在任务执行过程中,根据任务执行应用或APP的具体设置要求用户填充或直接调用用户填充好的身份信息和支付信息。优选的,根据用户填充的槽位信息生成待执行的酒店预定子任务订单。
对于真实意图4,语音助手根据知识图谱得到针对清明节三日游的推荐景点为西湖、龙井、九溪十八涧、灵隐寺和西溪湿地,并结合景点的相互距离和时间安排,得到4月4日下午西湖,4月5日龙井、九溪十八涧,4月6日灵隐寺-西溪湿地,4月7日上午西湖的推荐行程,填充反映真实意图4的槽位信息:可扩展的时间-景点槽位对,得到4个时间-景点槽位对,生成推荐信息通过人机交互界面的语音模块反馈给用户A,用户A认可该行程,语音助手生成提醒信息嵌入该任务模型。如果用户A确认该行程的过程中,希望获得各个景点的停车位信息,语音助手根据用户需求将时间-景点槽位对信息修改为时间-景点-停车位槽位组信息,并触发停车位信息查询过程,获取到各景点对应的停车位信息,并重新填充槽位组信息为4月4日下午-西湖-停车场A;4月5日-龙井-停车场B-九溪十八涧-停车场C,4月6日灵隐寺-停车场D-西溪湿地停车场E;4月4日下午-西湖-停车场A。优选的,可以生成待执行的导航子任务订单。
对于真实意图5,语音助手根据知识图谱和多轮对话获取餐饮类型-时间-餐厅槽位组。餐饮类型是指早餐、午餐、晚餐、下午茶,时间为该餐饮类型的用餐时间,餐厅为用户A希望该时间段用餐的餐厅信息。例如,根据知识图谱推荐早餐在酒店餐厅,通过与用户的对话获知用户希望在早上七点吃早餐,结合餐厅的供应信息生成合理建议,填充槽位组的槽位信息。根据填充后的槽位信息生成用餐建议和提醒。优选的,生成提醒子任务订单。
上述5个真实意图的槽位信息填充完成后,根据槽位生成可调用的任务模型。该任务模型保存到语音助手的存储空间中,优选的,还可以设置触发条件,并根据条件自动触发任务模型,完成任务订单的执行。
在上述各真实意图的槽位填充过程中,分别生成了待执行的子任务订单,子任务订单由执行主体执行,例如真实意图1的子任务订单由12306执行,真实意图2的子任务订单由神州租车APP执行,优选的,任务模型可以通过语音助手的通信接口建立与这些执行主体的通信连接,在用户触发任务模型时,通过该通信连接实现子任务订单的执行。
上述多个真实意图的实现都可能涉及用户的身份信息和支付信息,例如酒店预订需要身份信息,酒店预定金的支付需要支付信息;租车同样需要用户的驾驶证信息以及支付定金。对于该类操作,可以在真实意图对应的槽位中设置与之关联的槽位,通过用户的回答或语音助手调用相关的用户信息来进行填充,也可以将槽位的填充信息设置为授权或不授权,当槽位填充信息设置为授权时允许任务模型通过语音助手调用用户存储在本地或相关APP的身份信息和支付信息。还可以不设置身份信息槽位和支付信息槽位,而是在任务执行过程中,根据任务执行应用或APP的具体设置要求用户填充或直接调用用户填充好的身份信息和支付信息。例如,涉及酒店预订这一真实意图时,不设置身份信息和支付信息,而是在任务模型调用携程APP时,根据携程APP的设置,由用户输入或者根据用户保存的身份信息完成预订操作和定金支付。
实施例三
请参阅图3,图3示出了本实施例涉及的语音助手中的任务模型训练装置的结构,其能够实现实施例二的任务模型训练方法。任务模型训练装置包括:数据源接收模块,用于接收用户选择的数据源;数据源可以由用户直接通过人机交互界面输入到语音助手,由语音助手发送给数据源接收模块,也可以由语音助手执行用户的任务指令得到执行结果,由用户从执行结果中选择数据源。
知识图谱生成模块,用于根据选择的数据源抓取相关的知识图谱;
通用意图生成模块,用于根据任务类型得到通用意图;
真实意图生成模块,用于根据知识图谱和/或多轮对话对通用意图进行修正,获得用户的真实意图;
槽位生成模块,用于根据用户的真实意图生成槽位;
槽位填充模块,根据知识图谱和多轮对话填充槽位;
任务模型生成模块,用于根据槽位生成可调用的任务模型保存到语音助手中。
优选的,所述数据源为日志信息或攻略信息,例如旅游日志,旅游攻略等。根据用户选择的一个或多个日志信息或攻略信息抓取相关的知识图谱。
优选的,用户的真实意图包括一个或多个,一个真实意图对应一个或多个槽位、槽位对或槽位组,槽位对或槽位组分别由两个或多个具有关联关系的槽位组成。
优选的,槽位生成模块根据用户指令修改生成的槽位,建立新的槽位;槽位填充模块根据知识图谱和多轮对话重新填充所述新的槽位。
基于与前述实施例中的任务模型训练方法同样的构思,本发明实施例还提供了一种终端设备,该终端包含上述实施例一中的语音助手。
具体地,终端设备可以是计算机、平板电脑、手机、智能助手、车载终端等。
基于与前述实施例中的任务模型训练方法同样的构思,本发明实施例还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现相应的任务模型训练方法。
基于与前述实施例中任务模型训练方法同样的构思,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现任务模型训练方法。
以上所述仅是本发明的优选实施方式,并不用于限制本发明,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (14)

1.一种任务模型的训练方法,应用于语音助手,其特征在于,包括如下步骤:
步骤1、语音助手接收用户发送的任务指令,执行任务指令得到执行结果;
步骤2、根据执行结果抓取相关的知识图谱;
步骤3、根据任务类型得到通用意图;
步骤4、根据知识图谱和/或多轮对话对通用意图进行修正,获得用户的真实意图;
步骤5、根据用户的真实意图生成槽位;具体为:用户的真实意图确认后,语音助手针对每个真实意图根据知识图谱和/或多轮对话生成槽位;
步骤6、根据知识图谱和多轮对话填充槽位;
步骤7、根据槽位生成可调用的任务模型保存到语音助手中,并根据条件自动触发任务模型。
2.根据权利要求1所述的方法,其特征在于,步骤1的任务指令为搜索指令,执行结果为搜索结果。
3.根据权利要求2所述的方法,其特征在于,根据搜索结果抓取相关的知识图谱具体为:搜索结果为日志信息,语音助手按照综合排序规则将多个日志信息推荐给用户,根据用户选择的一个或多个日志信息抓取相关的知识图谱。
4.根据权利要求1所述的方法,其特征在于,用户的真实意图包括一个或多个,一个真实意图对应一个或多个槽位、槽位对或槽位组,槽位对或槽位组分别由两个或多个具有关联关系的槽位组成。
5.根据权利要求1所述的方法,其特征在于,步骤6、根据知识图谱和多轮对话填充槽位还包括:
填充槽位过程中,根据用户指令修改步骤5中的槽位,并根据知识图谱和多轮对话重新填充槽位。
6.根据权利要求1所述的方法,其特征在于,步骤7的条件包括:
用户通过语音助手触发任务模型执行;
或,到达用户设置的时间点;
或,用户进入或离开特定区域。
7.一种任务模型的训练装置,其特征在于,包括如下模块:
数据源接收模块,用于接收用户选择的数据源;
知识图谱生成模块,用于根据选择的数据源抓取相关的知识图谱;
通用意图生成模块,用于根据任务类型得到通用意图;
真实意图生成模块,用于根据知识图谱和/或多轮对话对通用意图进行修正,获得用户的真实意图;
槽位生成模块,用于根据用户的真实意图生成槽位;具体为:用户的真实意图确认后,语音助手针对每个真实意图根据知识图谱和/或多轮对话生成槽位;
槽位填充模块,根据知识图谱和多轮对话填充槽位;
任务模型生成模块,用于根据槽位生成可调用的任务模型。
8.根据权利要求7所述的装置,其特征在于,所述数据源为日志信息,根据用户选择的一个或多个日志信息抓取相关的知识图谱。
9.根据权利要求7所述的装置,其特征在于,用户的真实意图包括一个或多个,一个真实意图对应一个或多个槽位、槽位对或槽位组,槽位对或槽位组分别由两个或多个具有关联关系的槽位组成。
10.根据权利要求7所述的装置,其特征在于,槽位生成模块还用于根据用户指令修改生成的槽位,生成新的槽位;槽位填充模块根据知识图谱和多轮对话重新填充所述新的槽位。
11.一种语音助手,其特征在于:包含权利要求7-10任一项所述的任务模型的训练装置。
12.一种终端设备,其特征在于:包含权利要求7-10任一项所述的任务模型训练装置,或包含如权利要求11所述的语音助手。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如权利要求1至6任一项所述的任务模型的训练方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序,所述计算机程序在被执行时实现如权利要求1至6任一项所述的任务模型的训练方法。
CN201910706848.9A 2019-02-26 2019-08-01 一种任务模型的训练方法、装置、设备 Active CN110473521B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019101412675 2019-02-26
CN201910141267 2019-02-26

Publications (2)

Publication Number Publication Date
CN110473521A CN110473521A (zh) 2019-11-19
CN110473521B true CN110473521B (zh) 2022-03-01

Family

ID=68508483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910706848.9A Active CN110473521B (zh) 2019-02-26 2019-08-01 一种任务模型的训练方法、装置、设备

Country Status (1)

Country Link
CN (1) CN110473521B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956958A (zh) * 2019-12-04 2020-04-03 深圳追一科技有限公司 搜索方法、装置、终端设备及存储介质
CN111124649B (zh) * 2019-12-26 2023-04-18 杭州蓦然认知科技有限公司 一种生成app生态系统的方法、装置
CN111026628B (zh) * 2019-12-26 2023-06-30 杭州蓦然认知科技有限公司 一种语音交互方法、装置
CN111026538B (zh) * 2019-12-26 2023-04-14 杭州蓦然认知科技有限公司 一种app生态系统建立、使用方法、装置
CN111177559B (zh) * 2019-12-30 2023-05-30 中国联合网络通信集团有限公司 文旅服务推荐方法、装置、电子设备及存储介质
CN111209381B (zh) * 2020-01-03 2023-12-12 北京搜狗科技发展有限公司 对话场景中时间管理方法及装置
CN111341308B (zh) * 2020-02-12 2023-07-21 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN111524533B (zh) * 2020-03-02 2023-12-08 北京声智科技有限公司 语音操作方法、装置、电子设备及存储介质
CN112002321B (zh) * 2020-08-11 2023-09-19 海信电子科技(武汉)有限公司 显示设备、服务器及语音交互方法
CN112328808A (zh) * 2020-11-03 2021-02-05 四川长虹电器股份有限公司 基于知识图谱的问答方法、装置、电子设备及存储介质
CN112882679B (zh) * 2020-12-21 2022-07-01 广州橙行智动汽车科技有限公司 一种语音交互的方法和装置
CN113299294A (zh) * 2021-05-26 2021-08-24 中国平安人寿保险股份有限公司 任务型对话机器人交互方法、装置、设备及存储介质
CN113515611B (zh) * 2021-06-22 2022-04-26 镁佳(北京)科技有限公司 一种任务型多意图对话的意图识别方法和识别系统
CN114124859B (zh) * 2021-08-17 2023-04-07 北京邮电大学 一种网络维护平台智能客户服务机器人及维护方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018222448A1 (en) * 2017-06-02 2018-12-06 Microsoft Technology Licensing, Llc Modeling an action completion conversation using a knowledge graph

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426436B (zh) * 2015-11-05 2019-10-15 百度在线网络技术(北京)有限公司 基于人工智能机器人的信息提供方法和装置
CN106095858A (zh) * 2016-06-02 2016-11-09 海信集团有限公司 一种音视频搜索方法、装置和终端
CN107291828B (zh) * 2017-05-27 2021-06-11 北京百度网讯科技有限公司 基于人工智能的口语查询解析方法、装置及存储介质
CN108694942A (zh) * 2018-04-02 2018-10-23 浙江大学 一种基于家居智能服务机器人的智能家居交互问答系统
CN108920497B (zh) * 2018-05-23 2021-10-15 北京奇艺世纪科技有限公司 一种人机交互方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018222448A1 (en) * 2017-06-02 2018-12-06 Microsoft Technology Licensing, Llc Modeling an action completion conversation using a knowledge graph

Also Published As

Publication number Publication date
CN110473521A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN110473521B (zh) 一种任务模型的训练方法、装置、设备
CN110998567B (zh) 用于对话语义分析的知识图谱
CN109376311A (zh) 适用于多个共乘模型的驾驶员-乘车者匹配的系统、方法和装置
CN105027061B (zh) 具有上下文交互机制的计算系统及其操作方法
US10417567B1 (en) Learning user preferences in a conversational system
WO2019217722A1 (en) Constructing imaginary discourse trees to improve answering convergent questions
DE102016013099A1 (de) Interaktiver Arbeitsablaufassistent für elektronische Formulare zum dialogartigen Führen von Interaktionen mit elektronischen Formularen
TWI628604B (zh) 用來管理合作工作環境之設備,電腦實作方法及系統
CN107004410A (zh) 语音和连接平台
CN107391522A (zh) 将可选择应用链接并入到消息交换话题中
CN109408709A (zh) 用相关第三方应用内容扩充搜索结果
CN105247511A (zh) 智能自动化助理
US20110231353A1 (en) Artificial intelligence application in human machine interface for advanced information processing and task managing
CN106164869A (zh) 用于并行处理的混合客户端/服务器架构
WO2016054629A1 (en) Systems and methods for private schedule coordination and event planning
CN110310630B (zh) 一种语音助手的训练和分享方法
CN113261020A (zh) 日程管理服务系统及方法
US20220398547A1 (en) System and method for ai-based task management
Simpson et al. Interagency cooperation in the twilight of the great society: telemedicine, NASA, and the Papago nation
KR20190003709A (ko) 메시지 교환 스레드를 사용한 효율적인 검색 촉진
Baccari et al. Design for a context-aware and collaborative mobile learning system
CN104133821A (zh) 利用稳定匹配理论和算法的用户匹配方法和网络系统
CN114726818B (zh) 网络社交方法、装置、设备及计算机可读存储介质
CN106325515A (zh) 一种面向服务的人机交互系统以及实现方法
CN110442694A (zh) 一种智能交互平台训练方法、装置、设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220113

Address after: 310024 floor 5, zone 2, building 3, Hangzhou cloud computing Industrial Park, Zhuantang street, Xihu District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou suddenly Cognitive Technology Co.,Ltd.

Address before: Room 401, gate 2, block a, Zhongguancun 768 Creative Industry Park, 5 Xueyuan Road, Haidian District, Beijing 100083

Applicant before: BEIJING MORAN COGNITIVE TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant