CN108073587A - 一种自动问答方法、装置及电子设备 - Google Patents

一种自动问答方法、装置及电子设备 Download PDF

Info

Publication number
CN108073587A
CN108073587A CN201610987253.1A CN201610987253A CN108073587A CN 108073587 A CN108073587 A CN 108073587A CN 201610987253 A CN201610987253 A CN 201610987253A CN 108073587 A CN108073587 A CN 108073587A
Authority
CN
China
Prior art keywords
answer
question
semantic
semantic item
answered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610987253.1A
Other languages
English (en)
Other versions
CN108073587B (zh
Inventor
赵中州
陈海青
任巨伟
高星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610987253.1A priority Critical patent/CN108073587B/zh
Publication of CN108073587A publication Critical patent/CN108073587A/zh
Application granted granted Critical
Publication of CN108073587B publication Critical patent/CN108073587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0613Third-party assisted

Abstract

本申请公开了两种自动问答方法、装置及电子设备,一种聊天方法、装置及电子设备,两种一种自动问答系统,以及一种语义网络构建方法、装置及电子设备。其中,第一种自动问答方法,通过从用户问题中提取预设语义项,并根据提取到的语义项和预先生成的语义网络,获取用户问题的答案;若该答案包括多个答案,则从结合预设上下文信息后的用户问题中再次提取预设语义项,并根据再次提取到的语义项和所述语义网络,获取用户问题的答案;然后,再根据获得的答案和提取到的语义项,更新上下文信息;最后,根据获得的答案向用户反馈。采用本申请提供的自动问答方法,能够达到提高问答性能、减少存储压力及提高问答准确率的效果。

Description

一种自动问答方法、装置及电子设备
技术领域
本申请涉及机器人技术领域,具体涉及一种自动问答方法。本申请同时涉及一种自动问答装置及电子设备,一种聊天方法、装置及电子设备,一种自动问答系统,又一种自动问答方法、装置及电子设备,又一种自动问答系统,以及一种语义网络构建方法、装置及电子设备。
背景技术
聊天式问答服务是一个连续交互过程,在这一过程中经常出现上下文省略和名词指代的情况。具体的一次提问有时要结合对话上下文或者相关的背景才能确定准确的答案,例如,用户在提问时前后输入了两个问题:第一个问题为“支付的时候”,第二个问题为“手机验证码收不到”,其中,第二个问题出现上下文省略的现象,对于“手机收不到验证码”这个问题可以在问答库中查到多个相似答案(如,支付时手机收不到验证码、登录时手机收不到验证码等),当机器人接收到第二个问题时,此时若机器人不结合上下文信息,单纯对用户的当前提问做解答,则无法向用户返回准确答案。
传统的自动问答处理流程,一般包含问题完整性判断、问题补全及指代消解三个步骤。对于用户提出的问题,首先需要判断该问题是否完整;若问题不完整,则需要对其进行问题补全的处理;若问题中存在人称指代信息,则还需要对该问题进行指代消解的处理。
在上述问题补全的步骤中,需要从上文提取当前问题可能缺失的人称、时间、地点等关键信息;为此,就需要根据具体的聊天场景预先定义好这类关键信息;因此,这种传统自动问答方法存在无法灵活扩展关键信息的问题。另外,在问答过程中,需要主动识别出上下文信息并保存;如果提问中出现新信息,还要考虑替换或追加策略;因此,这种传统自动问答方法还存在计算开销大的问题。再者,在称谓指代的消解过程中,需要运行特定的消解算法;因此,这种传统自动问答方法不仅存在计算开销较大的问题,还存在准确率不高的问题。此外,采用传统的自动问答方法,如果交互时间很长且聊天机器人同时服务大量用户,那么,保存的大量上下文信息也会对系统性能造成较大压力。
综上所述,现有技术存在无法灵活扩展关键信息、计算开销大且问答准确率不高的问题。
发明内容
本申请提供一种自动问答方法,以解决现有技术下无法灵活扩展关键信息、计算开销大且问答准确率不高的问题。本申请还提供一种自动问答装置及电子设备,一种聊天方法、装置及电子设备,一种自动问答系统,又一种自动问答方法、装置及电子设备,又一种自动问答系统,以及一种语义网络构建方法、装置及电子设备。
本申请提供一种自动问答方法,包括:
接收用户提出的待解答问题;
从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;
若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;
根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;
根据所述待解答问题的答案向所述用户反馈。
可选的,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,包括:
若所述待解答问题的答案为唯一答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项作为所述上下文信息;
若所述待解答问题的答案为唯一答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项作为所述上下文信息。
可选的,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,包括:
若所述待解答问题的答案包括多个不相似答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项和动作型语义项作为所述上下文信息;
若所述待解答问题的答案包括多个不相似答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项和动作型语义项作为所述上下文信息。
可选的,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,包括:
若所述待解答问题的答案包括多个相似答案、且所述上下文信息为空,则将所述第一语义项集中的事件型语义项作为所述上下文信息;
若所述待解答问题的答案包括多个相似答案、且所述上下文信息非空,则将所述第二语义项集中的事件型语义项作为所述上下文信息。
可选的,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,采用如下方式:
若未提取到语义项,则将所述待解答问题作为所述上下文信息。
可选的,所述根据所述待解答问题的答案向所述用户反馈,采用如下形式:
若所述第一语义项集包括单一的实体型语义项或单一的动作型语义项、且所述上下文信息为空,则根据所述实体型语义信息或所述动作型语义项向所述用户提出反问。
可选的,所述根据所述待解答问题的答案向所述用户反馈,采用如下方式:
若所述待解答问题的答案为多个相似答案或唯一答案,则向所述用户反馈所述多个相似答案或所述唯一答案。
可选的,在所述接收用户提出的待解答问题之后,还包括:
判断所述待解答问题与所述上下文信息是否具有相关性;若否,则清空所述上下文信息。
可选的,所述从所述待解答问题中提取预设语义项,包括:
通过分词算法获取所述待解答问题包括的词;
通过词性标注算法获取所述词的词性;
通过实体词识别算法,根据所述词的词性获取所述待解答问题包括的实体词;
通过序列标注算法,根据所述实体词获取所述待解答问题包括的具有语义的句子片段;
通过相似度算法,根据所述句子片段获取所述句子片段对应的预设语义项。
可选的,所述预设语义项包括实体型语义项、动作型语义项或事件型语义项。
可选的,所述预先生成的语义网络包括:多个语义型节点、多个答案型节点、及多个节点间的关系。
可选的,所述节点间的关系包括:语义型节点间的关系、或语义型节点与答案型节点之间的关系。
可选的,所述语义型节点间的关系包括:上下位关系、包含关系、从属关系、因果关系、或流程先后关系。
可选的,所述语义型节点与答案型节点之间的关系包括:组合关系或映射关系。
本申请还提供一种自动问答装置,包括:
问题接收单元,用于接收用户提出的待解答问题;
第一答案获取单元,用于从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;
第二答案获取单元,用于若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;
上下文更新单元,用于根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;
答案反馈单元,用于根据所述待解答问题的答案向所述用户反馈。
可选的,所述上下文更新单元包括:
第一更新子单元,用于若所述待解答问题的答案为唯一答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项作为所述上下文信息;
第二更新子单元,用于若所述待解答问题的答案为唯一答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项作为所述上下文信息。
可选的,所述上下文更新单元包括:
第三更新子单元,用于若所述待解答问题的答案包括多个不相似答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项和动作型语义项作为所述上下文信息;
第四更新子单元,用于若所述待解答问题的答案包括多个不相似答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项和动作型语义项作为所述上下文信息。
可选的,所述上下文更新单元包括:
第五更新子单元,用于若所述待解答问题的答案包括多个相似答案、且所述上下文信息为空,则将所述第一语义项集中的事件型语义项作为所述上下文信息;
第六更新子单元,用于若所述待解答问题的答案包括多个相似答案、且所述上下文信息非空,则将所述第二语义项集中的事件型语义项作为所述上下文信息。
可选的,所述上下文更新单元还包括:
第七更新子单元,用于若未提取到语义项,则将所述待解答问题作为所述上下文信息。
可选的,所述答案反馈单元包括:
第一反馈子单元,用于若所述第一语义项集包括单一的实体型语义项或单一的动作型语义项、且所述上下文信息为空,则根据所述实体型语义信息或所述动作型语义项向所述用户提出反问。
可选的,所述答案反馈单元包括:
第二反馈子单元,用于若所述待解答问题的答案为多个相似答案或唯一答案,则向所述用户反馈所述多个相似答案或所述唯一答案。
可选的,所述装置还包括:
上下文清空单元,用于判断所述待解答问题与所述上下文信息是否具有相关性;若否,则清空所述上下文信息。
可选的,所述装置还包括语义项提取单元,用于从所述待解答问题中提取预设语义项;
所述语义项提取单元包括:
分词子单元,用于通过分词算法获取所述待解答问题包括的词;
词性标注子单元,用于通过词性标注算法获取所述词的词性;
实体词识别子单元,用于通过实体词识别算法,根据所述词的词性获取所述待解答问题包括的实体词;
序列标注子单元,用于通过序列标注算法,根据所述实体词获取所述待解答问题包括的具有语义的句子片段;
语义项获取子单元,用于通过相似度算法,根据所述句子片段获取所述句子片段对应的预设语义项。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现自动问答方法的程序,该设备通电并通过所述处理器运行该自动问答方法的程序后,执行下述步骤:接收用户提出的待解答问题;从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;根据所述待解答问题的答案向所述用户反馈。
本申请还提供一种自动问答方法,包括:
接收用户提出的待解答问题;
从结合预设上下文信息后的待解答问题中提取预设语义项;
根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;
根据所述待解答问题的答案向所述用户反馈。
可选的,还包括:
根据所述待解答问题的答案和所述提取到的语义项,更新所述上下文信息。
可选的,在所述从结合预设上下文信息后的待解答问题中提取预设语义项之前,还包括:
从接收到的待解答问题中提取预设语义项;
根据提取到的语义项和所述预先生成的语义网络,获取所述待解答问题的答案;
若所述待解答问题的答案包括唯一答案,则向所述用户反馈所述唯一答案;
若所述待解答问题的答案包括多个答案,则进入下一步骤。
本申请还提供一种自动问答装置,包括:
问题接收单元,用于接收用户提出的待解答问题;
第一语义项提取单元,用于从结合预设上下文信息后的待解答问题中提取预设语义项;
第一答案获取单元,用于根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;
第一答案反馈单元,用于根据所述待解答问题的答案向所述用户反馈。
可选的,还包括:
上下文更新单元,用于根据所述待解答问题的答案和所述提取到的语义项,更新所述上下文信息。
可选的,所述装置还包括:
第二语义项提取单元,用于从接收到的待解答问题中提取预设语义项;
第二答案获取单元,用于根据提取到的语义项和所述预先生成的语义网络,获取所述待解答问题的答案;
第二答案反馈单元,用于若所述待解答问题的答案包括唯一答案,则向所述用户反馈所述唯一答案;
所述第一语义项提取单元,具体用于若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现自动问答方法的程序,该设备通电并通过所述处理器运行该自动问答方法的程序后,执行下述步骤:接收用户提出的待解答问题;从结合预设上下文信息后的待解答问题中提取预设语义项;根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;根据所述待解答问题的答案向所述用户反馈。
本申请还提供一种聊天方法,包括:
向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;
接收所述聊天机器人返回的所述第一待解答问题的第一答案;
显示所述第一答案。
可选的,所述第一答案包括多个答案或向所述用户提出的反问;
所述方法还包括:
向所述聊天机器人发送所述用户根据所述第一答案提出的第二待解答问题,所述第二待解答问题包括所述第一待解答问题的补充信息;
接收所述聊天机器人返回的所述第二待解答问题的第二答案;
显示所述第二答案。
可选的,还包括:
向所述聊天机器人发送第三待解答问题,所述第三待解答问题包括与所述第一待解答问题无关的问题;
接收所述聊天机器人返回的所述第三待解答问题的第三答案;
显示所述第三答案。
本申请还提供一种聊天装置,包括:
第一问题发送单元,用于向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;
第一答案接收单元,用于接收所述聊天机器人返回的所述第一待解答问题的第一答案;
第一答案显示单元,用于显示所述第一答案。
可选的,所述第一答案包括多个答案或向所述用户提出的反问;
所述装置还包括:
第二问题发送单元,用于向所述聊天机器人发送所述用户根据所述第一答案提出的第二待解答问题,所述第二待解答问题包括所述第一待解答问题的补充信息;
第二答案接收单元,用于接收所述聊天机器人返回的所述第二待解答问题的第二答案;
第二答案显示单元,用于显示所述第二答案。
可选的,还包括:
第三问题发送单元,用于向所述聊天机器人发送第三待解答问题,所述第三待解答问题包括与所述第一待解答问题无关的问题;
第三答案接收单元,用于接收所述聊天机器人返回的所述第三待解答问题的第三答案;
第三答案显示单元,用于显示所述第三答案。
本申请还提供一种电子设备,包括:
显示器;
处理器;以及
存储器,用于存储实现聊天方法的程序,该设备通电并通过所述处理器运行该聊天方法的程序后,执行下述步骤:向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;接收所述聊天机器人返回的所述第一待解答问题的第一答案;显示所述第一答案。
本申请还提供一种自动问答系统,包括:上述任一项所述的自动问答装置;以及上述任一项所述的聊天装置。
本申请还提供一种自动问答系统,其特征在于,包括:上述任一项所述的自动问答装置;以及上述任一项所述的聊天装置。
本申请还提供一种语义网络构建方法,包括:
获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;
根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
可选的,所述语义项包括实体型语义项、动作型语义项或事件型语义项。
可选的,所述构建所述特定问题领域的语义网络,包括:
将所述语义项作为所述语义网络的语义型节点;
将所述知识点作为所述语义网络的答案型节点;
将各个所述语义项之间的关系和各个所述语义项与知识点之间的关系作为所述语义网络的节点间关系。
可选的,所述语义项之间的关系包括:上下位关系、包含关系、从属关系、因果关系、或流程先后关系。
可选的,所述语义项与知识点之间的关系包括:组合关系或映射关系。
可选的,所述特定问题领域包括电商服务领域或药品推荐问题领域。
本申请还提供一种语义网络构建装置,包括:
数据获取单元,用于获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;
语义网络构建单元,用于根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储实现语义网络构建方法的程序,该设备通电并通过所述处理器运行该语义网络构建方法的程序后,执行下述步骤:获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
与现有技术相比,本申请提供的自动问答方法,从用户问题中提取预设语义项,并根据提取到的语义项和预先生成的语义网络,获取用户问题的答案;若该答案包括多个答案,则从结合预设上下文信息后的用户问题中再次提取预设语义项,并根据再次提取到的语义项和所述语义网络,获取用户问题的答案;然后,再根据获得的答案和提取到的语义项,更新上下文信息;最后,根据获得的答案向用户反馈。
使用本申请提供的方法,根据用户问题的答案和提取到的语义项,对上下文信息进行管理,在不同答案情况下选择保留上文的实体型语义项、动作型语义项或事件型语义项,可以有效地补全下文中的缺失信息,使得聊天机器人能更全面地理解用户问题,进而能返回更符合语境的答案;这种处理方式,能够直接利用这些语义项补充上下文,省去了场景信息的额外提取开销,且方便通过语义网络灵活扩展语义项;因此,本申请提供的方法可以有效提高问答性能。
在本申请提供的方法中,通过控制上下文信息在不同情况下的语义项继承策略,可以使少量关键信息有效传递;这种处理方式,既不损失背景信息又能够有效减少存储压力;因此,本申请提供的方法可以有效降低上下文信息的存储开销。此外,本申请提供的方法,不依赖指代消解等技术,能够保证答案的准确率且无需额外模型支持;因此,可以有效提高问答准确率和问答性能。
附图说明
图1是本申请提供的一种自动问答方法的实施例的流程图;
图2是本申请提供的一种自动问答方法的实施例的语义网络的局部示意图;
图3是本申请提供的一种自动问答装置的实施例的示意图;
图4是本申请提供的一种电子设备的实施例的示意图;
图5是本申请提供的又一种自动问答方法的实施例的流程图;
图6是本申请提供的又一种自动问答装置的实施例的示意图;
图7是本申请提供的又一种电子设备的实施例的示意图;
图8是本申请提供的一种聊天方法的实施例的流程图;
图9是本申请提供的一种聊天装置的实施例的示意图;
图10是本申请提供的一种电子设备的实施例的示意图;
图11是本申请提供的一种自动问答系统的实施例的示意图;
图12是本申请提供的又一种自动问答系统的实施例的示意图;
图13是本申请提供的一种语义网络构建方法的实施例的流程图;
图14是本申请提供的一种语义网络构建装置的实施例的示意图;
图15是本申请提供的一种电子设备的实施例的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是,本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
在本申请中,提供了一种自动问答方法、装置及电子设备,一种聊天方法、装置及电子设备,一种自动问答系统,又一种自动问答方法、装置及电子设备,又一种自动问答系统,以及一种语义网络构建方法、装置及电子设备。在下面的实施例中逐一进行详细说明。
本申请提供的自动问答方法,其核心的基本思想为:根据用户问题的答案和提取到的语义项,对上下文信息进行管理,在不同答案情况下选择保留上文的实体型语义项、动作型语义项或事件型语义项,可以有效地补全下文中的缺失信息,使得聊天机器人能更全面地理解用户问题,进而能返回更符合语境的答案。由于直接利用从问题中提取到的语义项补充上下文,因此,省去了场景信息的额外提取开销,且方便通过语义网络灵活扩展语义项。
请参考图1,其为本申请的自动问答方法实施例的流程图。所述方法包括如下步骤:
步骤S101:接收用户提出的待解答问题。
要实施本申请提供的自动问答方法,首先需要接收由用户输入的待解答问题。所述待解答问题可以为完整的问题,还可以为省略上下文的不完整问题。所述完整的问题是指,根据问题本身即可获取到唯一答案的问题;相应的,根据问题本身无法获取唯一答案的问题(如,“支付的时候”)即为一个不完整的问题。
获取到用户问题后,就可以进入下一步骤通过语义网络进行知识推理,获取与用户问题对应的答案。
步骤S103:从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案。
本步骤S103首先通过语义解析技术从用户问题中提取预设语义项,然后,通过预先生成的语义网络,根据提取到的语义项进行知识推理,获取用户问题对应的答案。
所述预设语义项是指,所述预先生成的语义网络中的语义型节点对应的语义项。所述预设语义项,包括但不限于:实体型语义项、动作型语义项或事件型语义项,还可以为其它类型的语义项。所述预设语义项可以是较宽泛的语义项,例如,“退款”等,也可以是具体的语义项,例如,“修改登录密码”等。
所述实体型语义项可用于表示问题领域中的物体、概念、时间等语义,通常是在某一领域具有明确定义的名词性词语,例如,在电商服务领域中的“密码”、“账户”及“订单”等词均为实体型语义项;在药品推荐问答领域中的药品名称,如“板蓝根”、“止咳糖浆”等词均为实体型语义项。
所述动作型语义项可用于表示问题领域中涉及的动作语义,通常是能够表示针对实体可以采取的行为的词语,例如,在电商服务领域中,对于“密码”可以有“修改”、“重置”等动作,“修改”、“重置”等词均为动作型语义项;在药品推荐问答领域中,可将动作型语义项限定为药品发挥的功效,如“预防”、“治疗”等词。
所述事件型语义项可用于表示问题领域中的态势等语义,通常是由所述实体型语义项和所述动作型语义项相结合形成的动名词词组,例如,在电商服务领域中,“修改密码”、“取消订单”等文本均为事件型语义项;在药品推荐问答领域中,可将事件型语义项限定为药品的具体效果,如“预防感冒”、“缓解咳嗽”、“降低血压”等。
具体实施时,可根据预设的实体型语义项表、动作型语义项表或事件型语义项表,确定所述预设语义项的类型。在预设的实体型语义项表中保存有所有实体型语义项,在预设的动作型语义项表中保存有所有动作型语义项,在预设的事件型语义项表中保存有所有事件型语义项。对于待确定语义项类型的预设语义项,由存储该预设语义项的表即可确定该预设语义项的类型。
要获取用户问题的答案,首先需要从用户问题中提取预设语义项,然后,再根据这些语义项和预先生成的语义网络,获取用户问题的答案。
具体实施时,从用户问题中提取预设语义项,可包括如下具体步骤:1)通过分词算法获取用户问题包括的词;2)通过词性标注算法获取所述词的词性;3)通过实体词识别算法,根据所述词的词性获取用户问题包括的实体词;4)通过序列标注算法,根据所述实体词获取用户问题包括的具有语义的句子片段;5)通过相似度算法,根据所述句子片段获取所述句子片段对应的预设语义项。
下面以“手机淘宝上我支付的时候收不到验证码”这个问题为例,对从用户问题中提取预设语义项的步骤的具体过程作简要说明。首先,需要对该问题进行分词处理,经过分词后会变成“手机|淘宝|上|我|支付|的|时候|收|不到|验证码|”;然后,对这些词作词性标注的处理,获得“手机|n淘宝|n上|n我|r支付|v的|u时候|n收|v不到|v验证码|n”;接下来,通过实体词识别技术,获取该问题包括的实体文本“手机淘宝”、“支付”、和“验证码”;再下面,通过序列标注技术,获取到“手机淘宝”、“支付”、和“收不到验证码”三个语句块;最后,通过相似度计算,获取到该问题包括“手机淘宝”、“支付”、和“验证码无法收到”三个预设语义项。
需要说明的是,本申请对于语义解析中涉及的各种算法并不作特别的限制,可以采用现有的各种算法,例如,分词算法可以采用基于字符串匹配的分词方法、基于理解的分词方法或基于统计的分词方法等算法。
从用户问题中提取出预设语义项后,就可以通过预先生成的语义网络,根据这些语义项进行知识推理,查找用户问题的答案。为了便于理解本申请的技术方案,下面首先对语义网络作简要说明。
语义网络是自然语言理解及认知科学领域研究中的一个概念,用来表达复杂的概念及其之间的相互关系。语义网络是一种知识表达形式,一个语义网络是一个带标识的有向图,其顶点表示概念,而边则表示这些概念间的语义关系,从而形成一个由节点和弧组成的语义网络描述图。
本申请所述的语义网络,包括但不限于:多个语义型节点、多个答案型(知识点型)节点、及多个节点间的关系,其中,节点之间带有标识的有向弧标识节点之间的语义联系,是语义网络组织知识的关键。
请参考图2,其为本申请的自动问答方法的实施例的语义网络的局部示意图,该语义网络应用在电商客服领域。下面结合图2对本申请所述的语义网络及其中的各种节点和各种关系进行说明。
所述语义型节点表示问题领域中的物体、概念、时间、动作或者态势。与上述预设语义项的类型相对应,所述语义型节点包括但不限于:实体型语义节点、动作型语义节点或事件型语义节点;其中,实体型语义节点对应实体型语义项,例如,图2中“账户”、“淘宝账户”、“会员名”、“订单”等实体型语义节点;动作型语义节点对应动作型语义项,例如,图2中“支付”等动作型语义节点;事件型语义节点对应事件型语义项,例如,图2中“账户登录”等事件型语义节点。
所述答案型节点也可称为知识点型节点,一个答案型节点通常对应一条问答记录。一条问答记录包括标题和内容,标题是简短地描述一个问题或一个概念,通常可以定义为多个事件及实体的组合,内容是详细的阐述标题的含义。例如,图2中“登录时手机验证码收不到怎么办?”、“登录账户名忘记后的找回流程”等答案型语义节点,“登录时手机验证码收不到怎么办?”、“登录账户名忘记后的找回流程”即为问答记录的标题。
本申请所述的语义网络中的每个节点可具有节点类型属性,节点类型属性用于标识该节点为语义型节点还是答案型节点。如果一个节点的节点类型属性为语义型,则该节点为语义型节点;如果一个节点的节点类型属性为答案型,则该节点为答案型节点。
所述语义网络中的每个节点可由多个节点属性进行标识,例如,可具有节点标识属性、语义项/答案属性及节点类型属性。答案型节点具有答案属性,该属性通常为一条问答记录,例如,图2中的“登录时手机验证码收不到怎么办?”节点为答案型节点,“登录时手机验证码收不到怎么办?”是该节点的问题,该节点的答案属性包括该问题的具体解决方案。
所述节点间的关系,包括:语义型节点间的关系、或语义型节点与答案型节点之间的关系。所述语义型节点间的关系,包括但不限于:上下位关系、包含关系、从属关系、因果关系、或流程先后关系。所述语义型节点与答案型节点之间的关系,包括:组合关系或映射关系。
所述上下位关系(INSTANCE_OF)也可称为IS_A的关系,具有该关系的两个语义型节点的形式是相同的,即:都是名词或都是动宾短语,例如,图2中“淘宝账户”节点与“账户”节点之间的关系为上下位关系,(淘宝账户)-[INSTANCE_OF]->(账户);(淘宝账户被盗)-[INSTANCE_OF]->(账户被盗)。
所述包含关系(SUB_OF)的特点为一个节点是另一个节点的问题分支,即:问题更细化,例如,图2中(账户被盗)-[SUB_OF]->(账户),(忘记账户)-[SUB_OF]->(账户),(账户登陆)-[SUB_OF]->(账户)。
所述从属关系(PROP_OF)表示两个节点之间从属、依赖的一种关系,对应的两个节点通常是名词,例如,图2中(密码)-[PROP_OF]->(账户),(会员名)-[PROP_OF]->(账户)。
所述因果关系(BECAUSE_OF)表示问题表象与业务逻辑之间的关系,可回答“为什么”类型的问题,例如,图2中(登录失败)-[BECAUSE_OF]->(账户被盗)。
所述流程先后关系(NEXT_STEP)表示问题表象与方案意图之间的关系,可回答“怎么办”的问题,例如,图2中(账户被盗)-[NEXT_STEP]->(开通账户),(忘记账户)-[NEXT_STEP]->(找回账户)。
所述组合关系(PART_OF)是种语义的组合/复合关系,类似java对象和它的成员变量的关系,例如,图2中语义型节点“手机验证码收不到”和答案型节点“支付时手机验证码收不到”之间的关系为:(手机验证码收不到)-[PART_OF]->(支付时手机验证码收不到),语义型节点“支付”和答案型节点“支付时手机验证码收不到”之间的关系为:(支付)-[PART_OF]->(支付时手机验证码收不到),可见,将语义型节点“手机验证码收不到”和“支付”组合后指向答案型节点“支付时手机验证码收不到”。
所述映射关系(SEMANTIC_OF)是种语义型节点和知识型节点之间一对一的映射关系,例如,答案型节点“登录账户名忘记后的找回流程”与语义型节点“找回账户”之间的关系为:(登录账户名忘记后的找回流程)<-[SEMANTIC_OF]-(找回账户)。
要实施本申请提供的自动问答方法,首先需要根据上述节点间的关系对某一问题领域涉及的具体问题进行拆解,构建该问题领域对应的语义网络。例如,对电商客服领域的问题进行拆解后,可构建如图2所示的语义网络的局部示意图。
具体实施时,构建语义网络可采用W3C的模式,该模式是基于XML(ExtensibleMarkup Language,可扩展标记语言)、RDF(Resource Description Framework,资源描述框架)、OWL(Ontology Web Language,本体语言)、SPARQL(Simple Protocol and RDF QueryLanguage,是为RDF开发的一种查询语言和数据获取协议)等技术构建语义网络的。语义网络中的节点和关系是通过RDF技术以三元组方式定义的,存储是由TripleStore完成,查询(知识推理)是通过SPARQL来完成。目前,可应用的开源语义网络构建框架有Apache Jena、Protégé等。
在本实施例中,为了更简单实用,并没有基于RDF构建保存三元组,而直接采用图数据库的方式构建语义网络。图数据库是一种NoSQL数据库,应用图形理论存储预设语义项之间的关系信息。目前比较流行的图数据库包括:Neo4j、Titan、OrientDB等,在实际应用中,可根据具体需求选用一种图数据库。
本步骤S103通过预先生成的语义网络对从问题中提取出的语义项进行知识推理,查找用户问题的答案。根据用户问题的完整程度,本步骤获取的用户问题的答案可能为唯一答案或多个答案。
以图2所示的语义网络为例,如果用户提出的问题为“帐号忘了”,通过语义解析提取到该问题包括的语义项为“忘记账户”,在图2中对该语义项进行知识推理,首先推理出与“忘记账户”语义型节点具有流程先后关系的“找回帐户”语义型节点,再依据“找回帐户”节点继续进行推理,可推理出与“找回帐户”具有映射关系的答案型节点“登录账户名忘记后的找回流程”,通过该答案型节点即可获取到问题的唯一答案。
再以图2所示的语义网络为例,如果用户提出的问题为“收不到手机验证码”,通过语义解析提取出该问题包括的语义项为“手机验证码收不到”,在图2中对该语义项进行知识推理,可推理出与“手机验证码收不到”具有组合关系的多个答案型节点“支付时手机验证码收不到怎么办?”、“登录时手机验证码收不到怎么办?”、“账户绑定手机时手机验证码收不到怎么办?”,由于这些答案与“手机验证码收不到”具有组合关系,因此这些答案为相似答案。
如果通过本步骤S103获得的答案为多个答案、且基于语义网络管理的上下文信息非空,即:不存在与用户问题直接对应的准确答案且具有上下文信息,则进入下一步骤S105,结合上下文信息对用户问题进行问题补全,并对补全后的问题重新进行语义项解析处理,然后再通过语义网络重新进行知识推理以查找答案。
步骤S105:若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案。
所述预设上下文信息基于所述语义网络管理,上下文信息依赖于已解析出的语义型节点,即:上下文信息中存储的信息为语义网络涉及的语义项。基于语义网络对上下文信息的管理,可以随着语义网络覆盖能力的提高而自动增强上下文的关键信息,省去了现有技术下额外的关键信息提取工作,减少了计算开销,从而提高了问答性能。
具体实施时,可对用户问题和上下文信息中的语义项进行拼接,然后,再对拼接后的问题进行语义解析,从中提取预设语义项,并通过语义网络对再次提取出的语义项进行知识推理,获取与结合上下文信息后的用户问题对应的答案,并将该答案作为用户问题的答案。
以图2所示的语义网络为例,如果用户提出的问题为“收不到手机验证码”,通过步骤S103首先获取到该问题的多个答案,分别为“支付时手机验证码收不到怎么办?”、“登录时手机验证码收不到怎么办?”、“账户绑定手机时手机验证码收不到怎么办?”;若此时上下文信息包括“支付”语义项,则执行本步骤S105,对上下文信息中的“支付”语义项和用户问题“收不到手机验证码”进行拼接后,再从拼接后的信息中提取出“手机验证码收不到”及“支付”两个语义项,通过图2的语义网络对这两个语义项进行知识推理,可获取到“手机验证码收不到”这个省略上下文的问题的唯一答案,即:“支付时手机验证码收不到怎么办?”。
通过步骤S103或步骤S105获取到用户问题的答案后,就可以进入到下一步骤根据获得的答案和提取到的语义项更新上下文信息,实现基于语义网络管理上下文信息的功能。
步骤S107:根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息。
本申请提供的自动问答方法,强调根据问题的答案和提取到的语义项,对上下文信息进行管理,在不同答案情况下选择保留上文的实体型语义项、动作型语义项、事件型语义项或其它类型的语义项。由于直接利用上述步骤提取到的语义项补充上下文,因此,省去了现有技术下场景信息的额外提取开销,且方便通过语义网络灵活扩展语义项。
下面给出不同答案情况下对应的上下文更新策略。
1)用户问题的答案包括多个答案。
如果用户问题的答案包括多个答案,则通常可将提取出的全部语义项作为上下文信息,即:在上下文信息中保存所有语义项。
具体实施时,本步骤S107可包括如下步骤:1.1)若用户问题的答案包括多个答案、且所述上下文信息为空,则将所述第一语义项集作为所述上下文信息;1.2)若所述用户问题的答案包括多个答案、且所述上下文信息非空,则将所述第二语义项集作为所述上下文信息。
当问题的答案包括多个答案时,如果此时的上下文信息为空,则表示这些答案是直接根据用户问题本身获取的,并没有结合上下文信息,因此,根据第一语义项集更新上下文信息;如果此时的上下文信息非空,则表示这些答案是根据结合上下文信息后的用户问题获取的,已经结合了上下文信息,因此,需要根据第二语义项集更新上下文信息。
所述多个答案还可以进一步分为两种具体情况:多个不相似答案、多个相似答案。例如,图2中“登录时手机验证码收不到怎么办?”、和“登录账户名忘记后的找回流程”即为不相似的答案;“支付时手机验证码收不到怎么办?”、“登录时手机验证码收不到怎么办?”及“账户绑定手机时手机验证码收不到怎么办?”为三个相似答案。
如果用户问题的答案包括多个不相似答案,则通常可将提取出的动作型语义项、及实体型语义项作为上下文信息。如果用户问题的答案包括多个相似答案,则通常可将提取出的事件型语义项作为上下文信息。
2)用户问题的答案为唯一答案。
如果用户问题的答案为唯一答案,则通常以实体型语义项的链式继承为核心对上下文信息进行管理。采用这种更新方式,能够在不丢失背景信息的前提下大大减少上下文的存储量,且不需要复杂的替换或失效逻辑,在实时问答场景具有高可用性。
要实现实体型语义项链式继承的功能,可采用如下方式:如果用户问题的答案为唯一答案,则将上述步骤提取到的实体型语义项作为上下文信息。例如,用户问题为“帐号忘了”,从中可提取出“忘记账户”事件型语义项,通过图2对“忘记账户”语义项进行知识推理,获取到该问题的唯一答案“登录账户名忘记后的找回流程”,由于该问题包括的实体型语义项为“账户”,因此,将上下文信息更新为“账户”。
需要注意的是,上下文信息中存储的实体型语义项,既可以为上述步骤中直接提取到的实体型语义项,还可以是上述步骤中提取出的事件型语义项的实体部分。所述事件型语义项的实体部分的获取方式可以为:根据预设的实体型语义项表,从事件型语义项中提取出所述实体部分。
具体实施时,要实现实体型语义项链式继承的功能,本步骤S107可采用如下步骤:1)若用户问题的答案为所述唯一答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项作为所述上下文信息;2)若用户问题的答案为所述唯一答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项作为所述上下文信息。
采用这种以实体型语义项的链式继承为核心的上下文管理策略,随着用户的不断交互,用户问题最相关的实体型语义项会一直在上下文中继承传递,一旦用户转换了话题,新的语义项会自动更替掉上下文信息中的现有内容。
以上给出了不同答案情况下相应的上下文更新策略。在实际应用中,如果从用户问题中没有解析出任何预设语义项,则可将整个问题保存在上下文信息中,随着语义网络覆盖率的不断提升,在实际应用场景这种现象已经很少见。
步骤S109:根据所述用户问题的答案向所述用户反馈。
通过上述步骤获取到用户问题的答案后,即可向提出问题的用户做出反馈。如果获取到的答案为多个相似答案或唯一答案,则可向所述用户反馈所述多个相似答案或所述唯一答案;如果获得的答案包括多个不相似答案、且所述第一语义项集包括单一的实体型语义项或单一的动作型语义项、且所述上下文信息为空时,还可根据单一的实体型语义信息或单一的动作型语义项向用户提出反问。
例如,用户提出的问题为:“支付的时候”,通过语义解析可从中提取出“支付”语义项,根据图2所示的语义网络,由“支付”可推理出的答案涉及多个相互无关的答案;如果此时的上下文信息为空,则无法结合上下文信息进一步提取更多的语义项,由于该问题仅包括一个实体语义项,因此,根据该语义项可向用户提出“您支付时遇到了什么问题呢?”的反问,用户根据该反问可提供进一步的信息,如“手机验证码收不到”,该后续问题包括的语义项为“手机验证码收不到”,结合上下文信息“支付”,在图2中再次进行知识推理,就可以获取到准确答案“支付时手机验证码收不到怎么办?”。可见,通过这种反问方式,可引导用户进一步给出问题的补充信息,因此,可有效提高用户体验。
在本实施例中,在接收用户提出的待解答问题之后,本申请提供的自动问答方法还包括:判断用户问题与上下文信息是否具有相关性的步骤,如果用户提出的问题与上下文信息并不具有相关性,则需要首先清空上下文信息,以免不相关的上下文信息对答案产生影响。
具体实施时,判断用户问题与上下文信息是否具有相关性的步骤,可具体包括如下步骤:1)通过语义解析技术,从用户问题中提取出实体型语义项;2)通过相似度算法,确定该实体型语义项与上下文信息中的实体型语义项是否相似。
下面再给出两个实际问答场景作为示例,以更直观的说明本申请的自动问答方法、及涉及的上下文信息处理方式。
例1,用户首先提出的问题为“手机验证码收不到”,通过语义解析从该问题中提取出预设语义项为“手机验证码收不到”,通过图2所示的语义网络对该语义项进行知识推理,获知与“手机验证码收不到”对应多个相似的问答记录,分别为:“支付时手机验证码收不到怎么办?”、“登录时手机验证码收不到怎么办?”、“账户绑定手机时手机验证码收不到怎么办?”;若此时的上下文信息为空,则可将这些相似的问答记录展示给用户,并将提取到的语义项保存到上下文信息中;用户根据这些相似问答记录,可补充相关信息,例如,提出的后续问题为“支付的时候”,该后续问题包括的语义项为“支付”,结合上下文信息“手机验证码收不到”,就可以获取到准确答案“支付时手机验证码收不到怎么办?”。在回答第一个问题“手机验证码收不到”时,如果上下文信息为“支付”,则可直接结合上下文信息,从而获取到准确答案“支付时手机验证码收不到怎么办?”。
例2,用户首先提出的问题为“帐号忘了”,通过语义解析从该问题中提取出预设语义项为“忘记帐户”,通过图2所示的语义网络对该语义项进行知识推理,获取到该问题的唯一答案“登录账户名忘记后的找回流程”,并根据“账户”这个实体型语义项替换上下文信息;如果后续问题为“好麻烦,能注销掉吗”,通过语义解析从该问题中提取出预设语义项“注销”,通过图2中所示的语义网络对该语义项进行知识推理,由于该语义项是一个较宽泛的语义项,无法查找到与其对应的唯一问答记录,且此时保存有上下文信息,因此,将该问题与“账户”这一上下文信息相结合形成更具体的问题,再从这一具体问题中提取出预设语义项“注销账户”,再通过图2中所示的语义网络对该语义项进行知识推理,获知与“注销账户”具有映射关系的答案型节点“注销账户的操作流程”,至此,获取到第二个问题的唯一答案,该问题所包括的实体型语义项仍为“账户”,因此,上下文信息无需变更。
需要说明的是,如果图2中的“注销账户”语义型节点被拆分为两个节点“注销”及“账户”,则例2中的具体问题也将被解析为两个预设语义项“注销”及“账户”,并通过语义网络对这两个语义项进行知识推理,获取到“注销”与“注销账户的操作流程”之间具有组合关系,“账户”与“注销账户的操作流程”之间同样具有组合关系,且“注销账户的操作流程”仅与“注销”及“账户”分别具有组合关系,因此,可以确定例2中的第二个问题对应的唯一问答记录为“注销账户的操作流程”。
在上述的实施例中,提供了一种自动问答方法,与之相对应的,本申请还提供一种自动问答装置。该装置是与上述方法的实施例相对应。
请参看图3,其为本申请的自动问答装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种自动问答装置,包括:
问题接收单元101,用于接收用户提出的待解答问题;
第一答案获取单元103,用于从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;
第二答案获取单元105,用于若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;
上下文更新单元107,用于根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;
答案反馈单元109,用于根据所述待解答问题的答案向所述用户反馈。
可选的,所述上下文更新单元107包括:
第一更新子单元,用于若所述待解答问题的答案为唯一答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项作为所述上下文信息;
第二更新子单元,用于若所述待解答问题的答案为唯一答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项作为所述上下文信息。
可选的,所述上下文更新单元107包括:
第三更新子单元,用于若所述待解答问题的答案包括多个不相似答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项和动作型语义项作为所述上下文信息;
第四更新子单元,用于若所述待解答问题的答案包括多个不相似答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项和动作型语义项作为所述上下文信息。
可选的,所述上下文更新单元107包括:
第五更新子单元,用于若所述待解答问题的答案包括多个相似答案、且所述上下文信息为空,则将所述第一语义项集中的事件型语义项作为所述上下文信息;
第六更新子单元,用于若所述待解答问题的答案包括多个相似答案、且所述上下文信息非空,则将所述第二语义项集中的事件型语义项作为所述上下文信息。
可选的,所述上下文更新单元107还包括:
第七更新子单元,用于若未提取到语义项,则将所述待解答问题作为所述上下文信息。
可选的,所述答案反馈单元109包括:
第一反馈子单元,用于若所述第一语义项集包括单一的实体型语义项或单一的动作型语义项、且所述上下文信息为空,则根据所述实体型语义信息或所述动作型语义项向所述用户提出反问。
可选的,所述答案反馈单元109包括:
第二反馈子单元,用于若所述待解答问题的答案为多个相似答案或唯一答案,则向所述用户反馈所述多个相似答案或所述唯一答案。
可选的,所述装置还包括:
上下文清空单元,用于判断所述待解答问题与所述上下文信息是否具有相关性;若否,则清空所述上下文信息。
可选的,所述装置还包括语义项提取单元,用于从所述待解答问题中提取预设语义项;
所述语义项提取单元包括:
分词子单元,用于通过分词算法获取所述待解答问题包括的词;
词性标注子单元,用于通过词性标注算法获取所述词的词性;
实体词识别子单元,用于通过实体词识别算法,根据所述词的词性获取所述待解答问题包括的实体词;
序列标注子单元,用于通过序列标注算法,根据所述实体词获取所述待解答问题包括的具有语义的句子片段;
语义项获取子单元,用于通过相似度算法,根据所述句子片段获取所述句子片段对应的预设语义项。
请参考图4,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器101;以及存储器103,用于存储实现自动问答方法的程序,该设备通电并通过所述处理器运行该自动问答方法的程序后,执行下述步骤:接收用户提出的待解答问题;从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;根据所述待解答问题的答案向所述用户反馈。
与上述的自动问答方法相对应,本申请还提供又一种自动问答方法。请参考图5,其为本申请提供的又一种自动问答方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的又一种自动问答方法包括:
步骤S101:接收用户提出的待解答问题。
步骤S103:从结合预设上下文信息后的待解答问题中提取预设语义项。
步骤S105:根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案。
本申请提供的又一种自动问答方法,在接收到用户问题后,直接从结合预设上下文信息后的用户问题中提取预设语义项;然后,通过预先生成的语义网络,根据提取到的预设语义项进行知识推理,以获得用户问题的答案。
为了提高问答效率,在执行步骤S103之前,还可首先不结合上下文信息,而是直接获取用户所提问题本身的答案,然后,根据答案情况确定是否执行步骤S103。
具体实施时,在步骤S103之前,可包括如下具体步骤:1)从接收到的待解答问题中提取预设语义项;2)根据提取到的语义项和所述预先生成的语义网络,获取所述待解答问题的答案;3)若所述待解答问题的答案包括唯一答案,则向所述用户反馈所述唯一答案,并结束本申请提供的又一种自动问答方法;4)若所述待解答问题的答案包括多个答案,则执行步骤S103。
步骤S107:根据所述待解答问题的答案向所述用户反馈。
本申请提供的又一种自动问答方法,还可包括如下步骤:根据所述待解答问题的答案和所述提取到的语义项,更新所述上下文信息。关于更新上下文信息的相关说明,请参见实施例一中的相关描述,此处不再赘述。
在上述的实施例中,提供了又一种自动问答方法,与之相对应的,本申请还提供又一种自动问答装置。该装置是与上述方法的实施例相对应。
请参看图6,其为本申请的又一种自动问答装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的又一种自动问答装置,包括:
问题接收单元101,用于接收用户提出的待解答问题;
第一语义项提取单元103,用于从结合预设上下文信息后的待解答问题中提取预设语义项;
第一答案获取单元105,用于根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;
第一答案反馈单元107,用于根据所述待解答问题的答案向所述用户反馈。
可选的,还包括:
上下文更新单元,用于根据所述待解答问题的答案和所述提取到的语义项,更新所述上下文信息。
可选的,所述装置还包括:
第二语义项提取单元,用于从接收到的待解答问题中提取预设语义项;
第二答案获取单元,用于根据提取到的语义项和所述预先生成的语义网络,获取所述待解答问题的答案;
第二答案反馈单元,用于若所述待解答问题的答案包括唯一答案,则向所述用户反馈所述唯一答案;
所述第一语义项提取单元103,具体用于若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项。
请参考图7,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器101;以及存储器103,用于存储实现自动问答方法的程序,该设备通电并通过所述处理器运行该自动问答方法的程序后,执行下述步骤:接收用户提出的待解答问题;从结合预设上下文信息后的待解答问题中提取预设语义项;根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;根据所述待解答问题的答案向所述用户反馈。
与上述的自动问答方法相对应,本申请还提供一种聊天方法。请参考图8,其为本申请提供的一种聊天方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种聊天方法包括:
步骤S101:向聊天机器人发送用户提出的第一待解答问题。
本申请提供的聊天方法可运行在聊天机器人的客户端程序中,所述客户端程序可以是网页版的客户端程序,也可以是安装在用户机器上的客户端程序,例如,iOS版客户端程序、Android版客户端程序、Windows桌面版客户端程序、Mac桌面版客户端程序。
当用户在所述客户端程序中提交向聊天机器人提出的问题后,触发执行本申请提供的聊天方法,本方法首先向聊天机器人发送用户提出的问题。为了便于说明本方法的技术方案,将该问题称为第一待解答问题。所述第一待解答问题可以为没有唯一答案的问题,也可以为有唯一答案的问题。
步骤S103:接收所述聊天机器人返回的所述第一待解答问题的第一答案。
步骤S105:显示所述第一答案。
聊天机器人接收到所述第一待解答问题之后,将获取该问题对应的答案,并将该答案返回给所述客户端程序。所述客户端程序接收到该答案后,将该答案显示在屏幕上,以供用户参考使用。
如果第一答案包括多个答案或者包括向用户提出的反问时,则表示用户并未获取到其所需要的准确答案,这种情况下,用户可能根据其获得的第一答案,再提出进一步的补充问题,即:第二待解答问题。可见,所述第二待解答问题包括所述第一待解答问题的补充信息。
在本实施例中,本申请提供的聊天方法,还可包括如下具体步骤:1)向所述聊天机器人发送所述用户根据所述第一答案提出的第二待解答问题;2)接收所述聊天机器人返回的所述第二待解答问题的第二答案;3)显示所述第二答案。
例如,第一待解答问题为“支付的时候”,聊天机器人返回的答案为向用户提出的反问“您支付时遇到了什么问题呢?”;用户根据该反问可提供进一步的信息,即:提出第二待解答问题,如“手机验证码收不到”;聊天机器人将这两个信息结合后,获取到准确答案“支付时手机验证码收不到怎么办?”。
再例如,第一待解答问题为“手机验证码收不到”,聊天机器人返回的答案为三个相似答案:“支付时手机验证码收不到怎么办?”、“登录时手机验证码收不到怎么办?”及“账户绑定手机时手机验证码收不到怎么办?”;用户根据这几个相似答案可提供进一步的信息,即:提出第二待解答问题,如“支付的时候”;聊天机器人将这两个信息结合后,获取到准确答案“支付时手机验证码收不到怎么办?”。
此外,本申请提供的聊天方法,还可包括如下具体步骤:1)向所述聊天机器人发送第三待解答问题;2)接收所述聊天机器人返回的所述第三待解答问题的第三答案;3)显示所述第三答案。
所述第三待解答问题包括与所述第一待解答问题无关的问题,例如,第一待解答问题为“支付时手机验证码收不到怎么办?”,第三待解答问题为“账户登录”,聊天机器人在获取到第一待解答问题的准确答案后,又接收到用户提出的第三待解答问题,由于这两个问题间并无相关性,因此,聊天机器人将会仅根据第三待解答问题本身去获取问题的答案,由于第三待解答问题是一个不完整的问题,因此,聊天机器人将获取不到准确的答案,而是获取到多个相似或不相似的答案。
在上述的实施例中,提供了一种聊天方法,与之相对应的,本申请还提供一种聊天装置。该装置是与上述方法的实施例相对应。
请参看图9,其为本申请的聊天装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种聊天装置,包括:
第一问题发送单元101,用于向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;
第一答案接收单元103,用于接收所述聊天机器人返回的所述第一待解答问题的第一答案;
第一答案显示单元105,用于显示所述第一答案。
可选的,所述第一答案包括多个答案或向所述用户提出的反问;
所述装置还包括:
第二问题发送单元,用于向所述聊天机器人发送所述用户根据所述第一答案提出的第二待解答问题,所述第二待解答问题包括所述第一待解答问题的补充信息;
第二答案接收单元,用于接收所述聊天机器人返回的所述第二待解答问题的第二答案;
第二答案显示单元,用于显示所述第二答案。
可选的,还包括:
第三问题发送单元,用于向所述聊天机器人发送第三待解答问题,所述第三待解答问题包括与所述第一待解答问题无关的问题;
第三答案接收单元,用于接收所述聊天机器人返回的所述第三待解答问题的第三答案;
第三答案显示单元,用于显示所述第三答案。
请参考图10,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:显示器101;处理器102;以及存储器103,用于存储实现聊天方法的程序,该设备通电并通过所述处理器运行该聊天方法的程序后,执行下述步骤:向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;接收所述聊天机器人返回的所述第一待解答问题的第一答案;显示所述第一答案。
本申请实施例还提供了一种自动问答系统,如图11所示,该系统包括上述实施例二所述的自动问答装置101和上述实施例所述的聊天装置102。所述自动问答装置101通常部署于服务器,但并不局限于服务器,也可以是能够实现所述自动问答方法的任何设备;所述聊天装置102通常部署于移动通讯设备、个人电脑、PAD、iPad等终端设备。
例如,聊天装置102部署在智能手机上,能够向聊天机器人发送用户提出的待解答问题,并接收、显示聊天机器人返回的待解答问题的答案;所述自动问答装置101部署在服务器上,通过接收用户提出的待解答问题;从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;根据所述待解答问题的答案向所述用户反馈。
本申请提供的一种自动问答方法、装置及系统,根据用户问题的答案和提取到的语义项,对上下文信息进行管理,在不同答案情况下选择保留上文的实体型语义项、动作型语义项或事件型语义项,可以有效地补全下文中的缺失信息,使得聊天机器人能更全面地理解用户问题,进而能返回更符合语境的答案;这种处理方式,能够直接利用这些语义项补充上下文,省去了场景信息的额外提取开销,且方便通过语义网络灵活扩展语义项,从而达到提高问答性能的效果。
本申请实施例还提供了又一种自动问答系统,如图12所示,该系统包括上述实施例五所述的又一种自动问答装置101和上述实施例所述的聊天装置102。所述又一种自动问答装置101通常部署于服务器,但并不局限于服务器,也可以是能够实现所述又一种自动问答方法的任何设备;所述聊天装置102通常部署于移动通讯设备、个人电脑、PAD、iPad等终端设备。
例如,聊天装置102部署在智能手机上,能够向聊天机器人发送用户提出的待解答问题,并接收、显示聊天机器人返回的待解答问题的答案;所述又一种自动问答装置101部署在服务器上,通过接收用户提出的待解答问题;从结合预设上下文信息后的待解答问题中提取预设语义项;根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;根据所述待解答问题的答案向所述用户反馈。
本申请提供的又一种自动问答方法、装置及系统,通过从结合预设上下文信息后的待解答问题中提取预设语义项,并根据提取到的语义项和预先生成的语义网络,获取待解答问题的答案,使得聊天机器人能更全面地理解用户问题,进而能返回更符合语境的答案,从而达到提高问答准确性的效果。
与上述的自动问答方法相对应,本申请还提供一种语义网络构建方法。请参考图13,其为本申请提供的一种语义网络构建方法实施例的流程图,本实施例与第一实施例内容相同的部分不再赘述,请参见实施例一中的相应部分。本申请提供的一种语义网络构建方法包括:
步骤S101:获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集。
所述特定问题领域包括但不限于电商服务领域,还包括其它问题领域,例如,药品推荐问题领域等。
所述语义项包括实体型语义项、动作型语义项或事件型语义项。所述知识点对应一条问答记录,一条问答记录包括标题(问题)和内容(答案)。
所述语义项之间的关系包括:上下位关系、包含关系、从属关系、因果关系、或流程先后关系。所述语义项与知识点之间的关系包括:组合关系或映射关系。
关于上述各种类型的语义项、知识点、上述各种关系的相关说明,请参见实施例一中的相关描述,此处不再赘述。
要实施本申请提供的语义网络构建方法,首先需要由问题领域的运营人员对该问题领域涉及的具体问题进行拆解,设置形成所述语义项集、所述语义项之间的关系集、所述知识点集、和所述语义项与知识点之间的关系集。
上述各种集合的信息,可直接由问题领域的运营人员写在一个或多个配置文件中;这种情况下,这些集合信息的获取操作可通过读取配置文件的方式完成。
上述各种集合的信息,也可通过图形用户界面的方式进行维护,运营人员通过相关图形用户界面提交各个集合的信息,提交的信息可存储在数据库中、或配置文件中。当需要根据这些集合信息构建语义网络时,直接读取数据文件即可获取到这些集合信息。
在获取到上述各种集合的信息后,就可以进入下一步骤根据这些信息为特定问题领域构建语义网络。
步骤S103:根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
本步骤S103可包括如下具体步骤:1)将各个所述语义项作为所述语义网络的语义型节点;2)将各个所述知识点作为所述语义网络的答案型节点;3)将各个所述语义项之间的关系和各个所述语义项与知识点之间的关系作为所述语义网络的节点间关系。
具体实施时,构建语义网络可采用W3C的模式,该模式是基于XML(ExtensibleMarkup Language,可扩展标记语言)、RDF(Resource Description Framework,资源描述框架)、OWL(Ontology Web Language,本体语言)、SPARQL(Simple Protocol and RDF QueryLanguage,是为RDF开发的一种查询语言和数据获取协议)等技术构建语义网络的。语义网络中的节点和关系是通过RDF技术以三元组方式定义的,存储是由TripleStore完成,查询(知识推理)是通过SPARQL来完成。目前,可应用的开源语义网络构建框架有Apache Jena、Protégé等。
在本实施例中,为了更简单实用,并没有基于RDF构建保存三元组,而直接采用图数据库的方式构建语义网络。图数据库是一种NoSQL数据库,应用图形理论存储预设语义项之间的关系信息。目前比较流行的图数据库包括:Neo4j、Titan、OrientDB等,在实际应用中,可根据具体需求选用一种图数据库。
在上述的实施例中,提供了一种语义网络构建方法,与之相对应的,本申请还提供一种语义网络构建装置。该装置是与上述方法的实施例相对应。
请参看图14,其为本申请的语义网络构建装置实施例的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本实施例的一种语义网络构建装置,包括:
数据获取单元101,用于获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;
语义网络构建单元103,用于根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
请参考图15,其为本申请的电子设备实施例的示意图。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
本实施例的一种电子设备,该电子设备包括:处理器102;以及存储器103,用于存储实现语义网络构建方法的程序,该设备通电并通过所述处理器运行该语义网络构建方法的程序后,执行下述步骤:获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
本申请提供的语义网络构建方法、装置及电子设备,通过获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集,并根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。采用本申请提供的语义网络构建方法,能够方便地通过语义网络灵活扩展语义项,进而可以有效提高问答性能。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (48)

1.一种自动问答方法,其特征在于,包括:
接收用户提出的待解答问题;
从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;
若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;
根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;
根据所述待解答问题的答案向所述用户反馈。
2.根据权利要求1所述的自动问答方法,其特征在于,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,包括:
若所述待解答问题的答案为唯一答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项作为所述上下文信息;
若所述待解答问题的答案为唯一答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项作为所述上下文信息。
3.根据权利要求1所述的自动问答方法,其特征在于,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,包括:
若所述待解答问题的答案包括多个不相似答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项和动作型语义项作为所述上下文信息;
若所述待解答问题的答案包括多个不相似答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项和动作型语义项作为所述上下文信息。
4.根据权利要求1所述的自动问答方法,其特征在于,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,包括:
若所述待解答问题的答案包括多个相似答案、且所述上下文信息为空,则将所述第一语义项集中的事件型语义项作为所述上下文信息;
若所述待解答问题的答案包括多个相似答案、且所述上下文信息非空,则将所述第二语义项集中的事件型语义项作为所述上下文信息。
5.根据权利要求1所述的自动问答方法,其特征在于,所述根据所述待解答问题的答案和提取到的语义项,并更新所述上下文信息,采用如下方式:
若未提取到语义项,则将所述待解答问题作为所述上下文信息。
6.根据权利要求1所述的自动问答方法,其特征在于,所述根据所述待解答问题的答案向所述用户反馈,采用如下形式:
若所述第一语义项集包括单一的实体型语义项或单一的动作型语义项、且所述上下文信息为空,则根据所述实体型语义信息或所述动作型语义项向所述用户提出反问。
7.根据权利要求1所述的自动问答方法,其特征在于,所述根据所述待解答问题的答案向所述用户反馈,采用如下方式:
若所述待解答问题的答案为多个相似答案或唯一答案,则向所述用户反馈所述多个相似答案或所述唯一答案。
8.根据权利要求1所述的自动问答方法,其特征在于,在所述接收用户提出的待解答问题之后,还包括:
判断所述待解答问题与所述上下文信息是否具有相关性;若否,则清空所述上下文信息。
9.根据权利要求1所述的自动问答方法,其特征在于,所述从所述待解答问题中提取预设语义项,包括:
通过分词算法获取所述待解答问题包括的词;
通过词性标注算法获取所述词的词性;
通过实体词识别算法,根据所述词的词性获取所述待解答问题包括的实体词;
通过序列标注算法,根据所述实体词获取所述待解答问题包括的具有语义的句子片段;
通过相似度算法,根据所述句子片段获取所述句子片段对应的预设语义项。
10.根据权利要求1所述的自动问答方法,其特征在于,所述预设语义项包括实体型语义项、动作型语义项或事件型语义项。
11.根据权利要求1所述的自动问答方法,其特征在于,所述预先生成的语义网络包括:多个语义型节点、多个答案型节点、及多个节点间的关系。
12.根据权利要求11所述的自动问答方法,其特征在于,所述节点间的关系包括:语义型节点间的关系、或语义型节点与答案型节点之间的关系。
13.根据权利要求12所述的自动问答方法,其特征在于,所述语义型节点间的关系包括:上下位关系、包含关系、从属关系、因果关系、或流程先后关系。
14.根据权利要求12所述的自动问答方法,其特征在于,所述语义型节点与答案型节点之间的关系包括:组合关系或映射关系。
15.一种自动问答装置,其特征在于,包括:
问题接收单元,用于接收用户提出的待解答问题;
第一答案获取单元,用于从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;
第二答案获取单元,用于若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;
上下文更新单元,用于根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;
答案反馈单元,用于根据所述待解答问题的答案向所述用户反馈。
16.根据权利要求15所述的自动问答装置,其特征在于,所述上下文更新单元包括:
第一更新子单元,用于若所述待解答问题的答案为唯一答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项作为所述上下文信息;
第二更新子单元,用于若所述待解答问题的答案为唯一答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项作为所述上下文信息。
17.根据权利要求15所述的自动问答装置,其特征在于,所述上下文更新单元包括:
第三更新子单元,用于若所述待解答问题的答案包括多个不相似答案、且所述上下文信息为空,则将所述第一语义项集中的实体型语义项和动作型语义项作为所述上下文信息;
第四更新子单元,用于若所述待解答问题的答案包括多个不相似答案、且所述上下文信息非空,则将所述第二语义项集中的实体型语义项和动作型语义项作为所述上下文信息。
18.根据权利要求15所述的自动问答装置,其特征在于,所述上下文更新单元包括:
第五更新子单元,用于若所述待解答问题的答案包括多个相似答案、且所述上下文信息为空,则将所述第一语义项集中的事件型语义项作为所述上下文信息;
第六更新子单元,用于若所述待解答问题的答案包括多个相似答案、且所述上下文信息非空,则将所述第二语义项集中的事件型语义项作为所述上下文信息。
19.根据权利要求15所述的自动问答装置,其特征在于,所述上下文更新单元还包括:
第七更新子单元,用于若未提取到语义项,则将所述待解答问题作为所述上下文信息。
20.根据权利要求15所述的自动问答装置,其特征在于,所述答案反馈单元包括:
第一反馈子单元,用于若所述第一语义项集包括单一的实体型语义项或单一的动作型语义项、且所述上下文信息为空,则根据所述实体型语义信息或所述动作型语义项向所述用户提出反问。
21.根据权利要求15所述的自动问答装置,其特征在于,所述答案反馈单元包括:
第二反馈子单元,用于若所述待解答问题的答案为多个相似答案或唯一答案,则向所述用户反馈所述多个相似答案或所述唯一答案。
22.根据权利要求15所述的自动问答装置,其特征在于,所述装置还包括:
上下文清空单元,用于判断所述待解答问题与所述上下文信息是否具有相关性;若否,则清空所述上下文信息。
23.根据权利要求15所述的自动问答装置,其特征在于,所述装置还包括语义项提取单元,用于从所述待解答问题中提取预设语义项;
所述语义项提取单元包括:
分词子单元,用于通过分词算法获取所述待解答问题包括的词;
词性标注子单元,用于通过词性标注算法获取所述词的词性;
实体词识别子单元,用于通过实体词识别算法,根据所述词的词性获取所述待解答问题包括的实体词;
序列标注子单元,用于通过序列标注算法,根据所述实体词获取所述待解答问题包括的具有语义的句子片段;
语义项获取子单元,用于通过相似度算法,根据所述句子片段获取所述句子片段对应的预设语义项。
24.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现自动问答方法的程序,该设备通电并通过所述处理器运行该自动问答方法的程序后,执行下述步骤:接收用户提出的待解答问题;从所述待解答问题中提取预设语义项,形成第一语义项集;以及根据所述第一语义项集和预先生成的语义网络,获取所述待解答问题的答案;若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项,形成第二语义项集;以及根据所述第二语义项集和所述语义网络,获取所述结合上下文信息后的待解答问题的答案,作为所述待解答问题的答案;根据所述待解答问题的答案和提取到的语义项,更新所述上下文信息;根据所述待解答问题的答案向所述用户反馈。
25.一种自动问答方法,其特征在于,包括:
接收用户提出的待解答问题;
从结合预设上下文信息后的待解答问题中提取预设语义项;
根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;
根据所述待解答问题的答案向所述用户反馈。
26.根据权利要求25所述的自动问答方法,其特征在于,还包括:
根据所述待解答问题的答案和所述提取到的语义项,更新所述上下文信息。
27.根据权利要求25所述的自动问答方法,其特征在于,在所述从结合预设上下文信息后的待解答问题中提取预设语义项之前,还包括:
从接收到的待解答问题中提取预设语义项;
根据提取到的语义项和所述预先生成的语义网络,获取所述待解答问题的答案;
若所述待解答问题的答案包括唯一答案,则向所述用户反馈所述唯一答案;
若所述待解答问题的答案包括多个答案,则进入下一步骤。
28.一种自动问答装置,其特征在于,包括:
问题接收单元,用于接收用户提出的待解答问题;
第一语义项提取单元,用于从结合预设上下文信息后的待解答问题中提取预设语义项;
第一答案获取单元,用于根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;
第一答案反馈单元,用于根据所述待解答问题的答案向所述用户反馈。
29.根据权利要求28所述的自动问答装置,其特征在于,还包括:
上下文更新单元,用于根据所述待解答问题的答案和所述提取到的语义项,更新所述上下文信息。
30.根据权利要求28所述的自动问答装置,其特征在于,所述装置还包括:
第二语义项提取单元,用于从接收到的待解答问题中提取预设语义项;
第二答案获取单元,用于根据提取到的语义项和所述预先生成的语义网络,获取所述待解答问题的答案;
第二答案反馈单元,用于若所述待解答问题的答案包括唯一答案,则向所述用户反馈所述唯一答案;
所述第一语义项提取单元,具体用于若所述待解答问题的答案包括多个答案,则从结合预设上下文信息后的待解答问题中提取预设语义项。
31.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现自动问答方法的程序,该设备通电并通过所述处理器运行该自动问答方法的程序后,执行下述步骤:接收用户提出的待解答问题;从结合预设上下文信息后的待解答问题中提取预设语义项;根据提取到的语义项和预先生成的语义网络,获取所述待解答问题的答案;根据所述待解答问题的答案向所述用户反馈。
32.一种聊天方法,其特征在于,包括:
向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;
接收所述聊天机器人返回的所述第一待解答问题的第一答案;
显示所述第一答案。
33.根据权利要求32所述的聊天方法,其特征在于:
所述第一答案包括多个答案或向所述用户提出的反问;
所述方法还包括:
向所述聊天机器人发送所述用户根据所述第一答案提出的第二待解答问题,所述第二待解答问题包括所述第一待解答问题的补充信息;
接收所述聊天机器人返回的所述第二待解答问题的第二答案;
显示所述第二答案。
34.根据权利要求32所述的聊天方法,其特征在于,还包括:
向所述聊天机器人发送第三待解答问题,所述第三待解答问题包括与所述第一待解答问题无关的问题;
接收所述聊天机器人返回的所述第三待解答问题的第三答案;
显示所述第三答案。
35.一种聊天装置,其特征在于,包括:
第一问题发送单元,用于向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;
第一答案接收单元,用于接收所述聊天机器人返回的所述第一待解答问题的第一答案;
第一答案显示单元,用于显示所述第一答案。
36.根据权利要求35所述的聊天装置,其特征在于:
所述第一答案包括多个答案或向所述用户提出的反问;
所述装置还包括:
第二问题发送单元,用于向所述聊天机器人发送所述用户根据所述第一答案提出的第二待解答问题,所述第二待解答问题包括所述第一待解答问题的补充信息;
第二答案接收单元,用于接收所述聊天机器人返回的所述第二待解答问题的第二答案;
第二答案显示单元,用于显示所述第二答案。
37.根据权利要求35所述的聊天装置,其特征在于,还包括:
第三问题发送单元,用于向所述聊天机器人发送第三待解答问题,所述第三待解答问题包括与所述第一待解答问题无关的问题;
第三答案接收单元,用于接收所述聊天机器人返回的所述第三待解答问题的第三答案;
第三答案显示单元,用于显示所述第三答案。
38.一种电子设备,其特征在于,包括:
显示器;
处理器;以及
存储器,用于存储实现聊天方法的程序,该设备通电并通过所述处理器运行该聊天方法的程序后,执行下述步骤:向聊天机器人发送用户提出的第一待解答问题,所述第一待解答问题包括没有唯一答案的问题;接收所述聊天机器人返回的所述第一待解答问题的第一答案;显示所述第一答案。
39.一种自动问答系统,其特征在于,包括:根据上述权利要求15所述的自动问答装置;以及根据上述权利要求35所述的聊天装置。
40.一种自动问答系统,其特征在于,包括:根据上述权利要求28所述的自动问答装置;以及根据上述权利要求35所述的聊天装置。
41.一种语义网络构建方法,其特征在于,包括:
获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;
根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
42.根据权利要求41所述的语义网络构建方法,其特征在于,所述语义项包括实体型语义项、动作型语义项或事件型语义项。
43.根据权利要求41所述的语义网络构建方法,其特征在于,所述构建所述特定问题领域的语义网络,包括:
将所述语义项作为所述语义网络的语义型节点;
将所述知识点作为所述语义网络的答案型节点;
将各个所述语义项之间的关系和各个所述语义项与知识点之间的关系作为所述语义网络的节点间关系。
44.根据权利要求41所述的语义网络构建方法,其特征在于,所述语义项之间的关系包括:上下位关系、包含关系、从属关系、因果关系、或流程先后关系。
45.根据权利要求41所述的语义网络构建方法,其特征在于,所述语义项与知识点之间的关系包括:组合关系或映射关系。
46.根据权利要求41所述的语义网络构建方法,其特征在于,所述特定问题领域包括电商服务领域或药品推荐问题领域。
47.一种语义网络构建装置,其特征在于,包括:
数据获取单元,用于获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;
语义网络构建单元,用于根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
48.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现语义网络构建方法的程序,该设备通电并通过所述处理器运行该语义网络构建方法的程序后,执行下述步骤:获取为特定问题领域预设的语义项集、语义项之间的关系集、知识点集、及语义项与知识点之间的关系集;根据所述语义项集、所述知识点集、所述语义项之间的关系集、及所述语义项与知识点之间的关系集,构建所述特定问题领域的语义网络。
CN201610987253.1A 2016-11-09 2016-11-09 一种自动问答方法、装置及电子设备 Active CN108073587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610987253.1A CN108073587B (zh) 2016-11-09 2016-11-09 一种自动问答方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610987253.1A CN108073587B (zh) 2016-11-09 2016-11-09 一种自动问答方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108073587A true CN108073587A (zh) 2018-05-25
CN108073587B CN108073587B (zh) 2022-05-27

Family

ID=62154084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610987253.1A Active CN108073587B (zh) 2016-11-09 2016-11-09 一种自动问答方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108073587B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829729A (zh) * 2019-01-18 2019-05-31 青牛智胜(深圳)科技有限公司 一种智能外呼系统及方法
CN110069600A (zh) * 2019-03-26 2019-07-30 上海拍拍贷金融信息服务有限公司 对话方法及装置、计算机可读存储介质
WO2020135124A1 (zh) * 2018-12-27 2020-07-02 阿里巴巴集团控股有限公司 会话质量评价方法、装置及电子设备
CN111428018A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 智能问答方法及装置
CN111488431A (zh) * 2020-04-08 2020-08-04 中国银行股份有限公司 命中确定方法、装置及系统
CN111639187A (zh) * 2019-03-01 2020-09-08 上海数眼科技发展有限公司 一种基于知识图谱的知识问答验证码生成系统及方法
CN111831801A (zh) * 2020-05-27 2020-10-27 北京市农林科学院 一种人机对话方法及系统
CN112395887A (zh) * 2020-11-05 2021-02-23 北京文思海辉金信软件有限公司 对话应答方法、装置、计算机设备和存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388025A (zh) * 2008-10-09 2009-03-18 浙江大学 一种基于Pagerank的语义网对象排序方法
CN101566998A (zh) * 2009-05-26 2009-10-28 华中师范大学 一种基于神经网络的中文问答系统
CN102968409A (zh) * 2012-11-23 2013-03-13 海信集团有限公司 智能人机交互语义分析方法及交互系统
CN103488724A (zh) * 2013-09-16 2014-01-01 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN104571485A (zh) * 2013-10-28 2015-04-29 中国科学院声学研究所 一种基于Java Map的人机语音交互系统及方法
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN104881420A (zh) * 2014-03-02 2015-09-02 陈江 语义网络建立系统及其建立方法
CN104933031A (zh) * 2015-06-29 2015-09-23 华东师范大学 一种基于语义网无监督的自动问答方法
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN105243120A (zh) * 2015-09-29 2016-01-13 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN105302859A (zh) * 2015-09-21 2016-02-03 上海智臻智能网络科技股份有限公司 一种基于互联网的智能交互系统
CN105808590A (zh) * 2014-12-31 2016-07-27 中国电信股份有限公司 搜索引擎实现方法、搜索方法以及装置
CN105843791A (zh) * 2015-01-15 2016-08-10 克拉玛依红有软件有限责任公司 一种基于6w语义标识的语义网络模型构建方法
US9418385B1 (en) * 2011-01-24 2016-08-16 Intuit Inc. Assembling a tax-information data structure
CN105868179A (zh) * 2016-04-08 2016-08-17 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388025A (zh) * 2008-10-09 2009-03-18 浙江大学 一种基于Pagerank的语义网对象排序方法
CN101566998A (zh) * 2009-05-26 2009-10-28 华中师范大学 一种基于神经网络的中文问答系统
US9418385B1 (en) * 2011-01-24 2016-08-16 Intuit Inc. Assembling a tax-information data structure
CN102968409A (zh) * 2012-11-23 2013-03-13 海信集团有限公司 智能人机交互语义分析方法及交互系统
CN103488724A (zh) * 2013-09-16 2014-01-01 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN104571485A (zh) * 2013-10-28 2015-04-29 中国科学院声学研究所 一种基于Java Map的人机语音交互系统及方法
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN104881420A (zh) * 2014-03-02 2015-09-02 陈江 语义网络建立系统及其建立方法
CN105808590A (zh) * 2014-12-31 2016-07-27 中国电信股份有限公司 搜索引擎实现方法、搜索方法以及装置
CN105843791A (zh) * 2015-01-15 2016-08-10 克拉玛依红有软件有限责任公司 一种基于6w语义标识的语义网络模型构建方法
CN104933031A (zh) * 2015-06-29 2015-09-23 华东师范大学 一种基于语义网无监督的自动问答方法
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN105302859A (zh) * 2015-09-21 2016-02-03 上海智臻智能网络科技股份有限公司 一种基于互联网的智能交互系统
CN105243120A (zh) * 2015-09-29 2016-01-13 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN105868179A (zh) * 2016-04-08 2016-08-17 上海智臻智能网络科技股份有限公司 一种智能问答方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐芳等: "基于语义网络的化工领域概念检索研究", 《中国科技信息》 *
欧阳杨 等: ""教育语义网中的知识领域本体建模"", 《浙江大学学报(工学版)》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020135124A1 (zh) * 2018-12-27 2020-07-02 阿里巴巴集团控股有限公司 会话质量评价方法、装置及电子设备
CN109829729A (zh) * 2019-01-18 2019-05-31 青牛智胜(深圳)科技有限公司 一种智能外呼系统及方法
CN111639187A (zh) * 2019-03-01 2020-09-08 上海数眼科技发展有限公司 一种基于知识图谱的知识问答验证码生成系统及方法
CN111639187B (zh) * 2019-03-01 2023-05-16 上海数眼科技发展有限公司 一种基于知识图谱的知识问答验证码生成系统及方法
CN110069600A (zh) * 2019-03-26 2019-07-30 上海拍拍贷金融信息服务有限公司 对话方法及装置、计算机可读存储介质
CN111428018A (zh) * 2020-03-26 2020-07-17 中国建设银行股份有限公司 智能问答方法及装置
CN111428018B (zh) * 2020-03-26 2024-02-06 中国建设银行股份有限公司 智能问答方法及装置
CN111488431A (zh) * 2020-04-08 2020-08-04 中国银行股份有限公司 命中确定方法、装置及系统
CN111488431B (zh) * 2020-04-08 2023-03-21 中国银行股份有限公司 命中确定方法、装置及系统
CN111831801A (zh) * 2020-05-27 2020-10-27 北京市农林科学院 一种人机对话方法及系统
CN112395887A (zh) * 2020-11-05 2021-02-23 北京文思海辉金信软件有限公司 对话应答方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN108073587B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN108073587A (zh) 一种自动问答方法、装置及电子设备
CN111046150B (zh) 人机交互处理系统及其方法、存储介质、电子设备
US11334692B2 (en) Extracting a knowledge graph from program source code
KR102268989B1 (ko) 음성 활성 데이터 패킷의 데이터 구조 풀링
US11238226B2 (en) System and method for accelerating user agent chats
CN102737099B (zh) 对查询、会话和搜索的个性化
Kandpal et al. Contextual Chatbot for healthcare purposes (using deep learning)
US11281862B2 (en) Significant correlation framework for command translation
CN112632961B (zh) 基于上下文推理的自然语言理解处理方法、装置以及设备
CN101203906A (zh) 使用脚本的对话管理
CN111078845A (zh) 为聊天机器人对话流能力生成决策树的方法、系统和程序
CN109978060A (zh) 一种自然语言要素抽取模型的训练方法及装置
CN109948151A (zh) 构建语音助手的方法
CN102567455A (zh) 利用语句的加权流行数据来管理文档的方法与系统
CN113641806B (zh) 对话方法、系统、电子设备及存储介质
EP3688624A1 (en) Intelligent inferences of authoring from document layout and formatting
CN113641807A (zh) 对话推荐模型的训练方法、装置、设备和存储介质
US8706909B1 (en) Systems and methods for semantic URL handling
US11586677B2 (en) Resolving user expression having dependent intents
US20220075960A1 (en) Interactive Communication System with Natural Language Adaptive Components
US11429428B2 (en) Invoking functions of agents via digital assistant applications using address templates
US10673789B2 (en) Bot-invocable software development kits to access legacy systems
CN110109675A (zh) 智能合约处理方法、装置以及计算机可读存储介质
WO2020226619A1 (en) Rendering visual components on applications in response to voice commands
US20210081814A1 (en) Using higher order actions to annotate a syntax tree with real data for concepts used to generate an answer to a question

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1255818

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant