CN111858877A - 多类型问题智能问答方法、系统、设备及可读存储介质 - Google Patents

多类型问题智能问答方法、系统、设备及可读存储介质 Download PDF

Info

Publication number
CN111858877A
CN111858877A CN202010558326.1A CN202010558326A CN111858877A CN 111858877 A CN111858877 A CN 111858877A CN 202010558326 A CN202010558326 A CN 202010558326A CN 111858877 A CN111858877 A CN 111858877A
Authority
CN
China
Prior art keywords
question
target
type
answering
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010558326.1A
Other languages
English (en)
Inventor
张圣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010558326.1A priority Critical patent/CN111858877A/zh
Priority to PCT/CN2020/117816 priority patent/WO2021109690A1/zh
Publication of CN111858877A publication Critical patent/CN111858877A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明涉及人工智能技术领域,提供多类型问题智能问答方法、系统、设备及计算机可读存储介质。本发明通过自然语言处理,并利用深度网络模型确定目标问题的问题类型,提升了问题定位的准确性;通过针对第一目标问题进行实体识别与多层次语义解析,有效降低了模型复杂度,能够高效精准地回复具有复杂语义的第一目标问题;通过针对第二目标问题与客户端展开多轮问答,直至获取到客户端对于关联问题集的关联答复,使得能够准确回复需要获知多重相关信息的第二目标问题,从而使得系统能够对其他语义更为复杂,答案更为多样,或是需要在获取多重相关信息后才可进行回答的问题进行准确回复。其中,目标问题的答复信息可存储于区块链中。

Description

多类型问题智能问答方法、系统、设备及可读存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种多类型问题智能问答方法、 系统、设备及计算机可读存储介质。
背景技术
现有智能问答系统的核心是可以准确理解问题语义,返回高质量的答案。 目前疫苗等医学领域的问答系统大多是两类,一类是基于常见问题解答(FQA, Frequently AskedQuestions)技术的问答系统,只能覆盖有确定性答案的 问题;另一类是基于知识库问答(KB-QA,knowledge base question answering) 技术的问答系统,只能覆盖部分简单的不存在唯一答案的问题,而现有智能 问答系统在对其他语义更为复杂,答案更为多样,或是需要在获取多重相关 信息后才可进行回答的问题进行回复时,往往难以为问题提出方提供准确的 答复,因而导致了现有智能问答系统的问题回复准确性不高的技术问题。
发明内容
本发明的主要目的在于提供一种多类型问题智能问答方法、系统、设备 及计算机可读存储介质,旨在解决现有智能问答系统的问题回复准确性不高 的技术问题。
为实现上述目的,本发明提供一种多类型问题智能问答方法,所述多类 型问题智能问答方法包括以下步骤:
在接收到目标问题时,基于预设深度网络模型对所述目标问题进行意图 分类,以确定所述目标问题的问题类型;
在检测到所述目标问题为第一问题类型时,对第一目标问题进行实体识 别与多层次语义解析,以获取所述第一目标问题的问题模板与多层次语义, 并根据所述问题模板与多层次语义,生成所述第一目标问题的答复信息,其 中,所述第一目标问题为第一问题类型的目标问题;
在检测到所述目标问题为第二问题类型时,确定第二目标问题的关联问 题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复, 以基于所述多重关联答复生成所述第二目标问题的答复信息,其中,所述第 二目标问题为第二问题类型的目标问题。
可选地,所述在接收到目标问题时,基于预设深度网络模型对所述目标 问题进行意图分类,以确定所述目标问题的问题类型的步骤包括:
在接收到目标问题时,将所述目标问题输入预训练语言表征模型,得到 所述目标问题对应词序列的序列表征向量;
将所述序列表征向量输入预设双向长短时记忆网络中,得到所述词序列 的隐藏向量;
结合所述序列表征向量与所述隐藏向量,确定所述目标问题的问题类型。
可选地,所述在检测到所述目标问题为第一问题类型时,对第一目标问 题进行实体识别与多层次语义解析,以获取所述第一目标问题的问题模板与 多层次语义,并根据所述问题模板与多层次语义,生成所述第一目标问题的 答复信息的步骤包括:
在检测到所述目标问题为第一问题类型时,基于离线处理方式,使用预 设实体识别模型识别出所述第一目标问题的实体信息,并基于所述实体信息 得到所述问题模板;
基于线上处理方式,对所述第一目标问题进行多层次语义解析,得到所 述第一目标问题的多层次语义;
使用预设概率图模型,并结合所述问题模板与所述多层次语义,预测所 述第一目标问题对应到知识图谱中的属性类别;
根据所述属性类别与所述实体信息,将所述第一目标问题转换为知识图 谱的结构化查询,以得到所述第一目标问题的答复信息,其中,所述第一目 标问题的答复信息存储于区块链中。
可选地,所述对所述第一目标问题进行多层次语义解析,得到所述第一 目标问题的多层次语义的步骤包括:
使用预设语义搜索模型对所述第一目标问题进行实体层语义解析,获取 实体层语义;
使用预设动词模板对所述第一目标问题进行细粒度语义表示,获取所述 第一目标问题的短语层语义;
基于所述问题模板将所述第一目标问题的实体信息进行概念映射,获取 所述第一目标问题的问题层语义,以将所述实体层语义、短语层语义与问题 层语义作为所述多层次语义。
可选地,所述在检测到所述目标问题为第二问题类型时,确定第二目标 问题的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集的 多重关联答复,以基于所述多重关联答复生成所述第二目标问题的答复信息 的步骤包括:
在检测到所述目标问题为第二问题类型时,从预设关联问题库中确定所 述关联问题集,并围绕所述关联问题集与客户端进行多轮问答;
接收多轮问答中客户端发送的所述多重关联答复,并根据所述多重关联 答复进行槽填充;
在检测到槽填充完成时,基于预设深度网络序列标注模型,将所述多重 关联答复转化为可用信息,以使用所述可用信息生成所述第二目标问题的答 复信息,其中,所述第二目标问题的答复信息存储于区块链中。
可选地,所述接收多轮问答中客户端发送的所述多重关联答复,并根据 所述多重关联答复进行槽填充的步骤包括:
从所述多重关联答复中提取出初始槽位信息;
判断所述初始槽位信息是否符合预设有效性标准,并在所述初始槽位信 息不符合预设有效性标准时,使用澄清话术进行澄清表达;
在接收到客户端发送的对于所述澄清话术的修正回复时,根据所述修正 回复修正所述初始槽位信息,直至修正后的初始槽位信息符合所述有效性标 准;
对修正后的初始槽位信息进行标准化处理,并将经标准化处理后的初始 槽位信息作为目标槽位信息,以基于所述目标槽位信息进行槽填充。
可选地,所述在接收到目标问题时,基于预设深度网络模型对所述目标 问题进行意图分类,以确定所述目标问题的问题类型的步骤之后,还包括:
在检测到所述目标问题为第三问题类型时,将第三问题类型的目标问题 作为第三目标问题,并获取所述第三目标问题与基于预设聚类算法所构建的 标准问题集之间的问题相似度;
将所述第三目标问题映射在所述标准问题集中的相似标准问题上,并获 取所述相似标准问题的标准回复,以基于所述标准回复生成所述第三目标问 题的答复信息,其中,所述相似标准问题在所述标准问题集中与所述目标问 题之间的问题相似度最高。
此外,为实现上述目的,本发明还提供一种多类型问题智能问答系统, 所述多类型问题智能问答系统包括:
意图分类模块,用于在接收到目标问题时,基于预设深度网络模型对所 述目标问题进行意图分类,以确定所述目标问题的问题类型;
第一问题答复模块,用于在检测到所述目标问题为第一问题类型时,对 第一目标问题进行实体识别与多层次语义解析,以获取所述第一目标问题的 问题模板与多层次语义,并根据所述问题模板与多层次语义,生成所述第一 目标问题的答复信息,其中,所述第一目标问题为第一问题类型的目标问题
第二问题答复模块,用于在检测到所述目标问题为第二问题类型时,确 定第二目标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关 联问题集的多重关联答复,以基于所述多重关联答复生成所述第二目标问题 的答复信息,其中,所述第二目标问题为第二问题类型的目标问题。
可选地,所述意图分类模块包括:
序列向量获取单元,用于在接收到目标问题时,将所述目标问题输入预 训练语言表征模型,得到所述目标问题对应词序列的序列表征向量;
隐藏向量获取单元,用于将所述序列表征向量输入预设双向长短时记忆 网络中,得到所述词序列的隐藏向量;
分类结果获取单元,用于结合所述序列表征向量与所述隐藏向量,确定 所述目标问题的问题类型。
可选地,所述第一问题答复模块包括:
离线处理单元,用于在检测到所述目标问题为第一问题类型时,基于离 线处理方式,使用预设实体识别模型识别出所述第一目标问题的实体信息, 并基于所述实体信息得到所述问题模板;
线上处理单元,用于基于线上处理方式,对所述第一目标问题进行多层 次语义解析,得到所述第一目标问题的多层次语义;
属性预测单元,用于使用预设概率图模型,并结合所述问题模板与所述 多层次语义,预测所述第一目标问题对应到知识图谱中的属性类别;
问题转换单元,用于根据所述属性类别与所述实体信息,将所述第一目 标问题转换为知识图谱的结构化查询,以得到所述第一目标问题的答复信息, 其中,所述第一目标问题的答复信息存储于区块链中。
可选地,所述线上处理单元还用于:
使用预设语义搜索模型对所述第一目标问题进行实体层语义解析,获取 实体层语义;
使用预设动词模板对所述第一目标问题进行细粒度语义表示,获取所述 第一目标问题的短语层语义;
基于所述问题模板将所述第一目标问题的实体信息进行概念映射,获取 所述第一目标问题的问题层语义,以将所述实体层语义、短语层语义与问题 层语义作为所述多层次语义。
可选地,所述第二问题答复模块包括:
多轮问答单元,用于在检测到所述目标问题为第二问题类型时,从预设 关联问题库中确定所述关联问题集,并围绕所述关联问题集与客户端进行多 轮问答;
槽填充单元,用于接收多轮问答中客户端发送的所述多重关联答复,并 根据所述多重关联答复进行槽填充;
信息转化单元,用于在检测到槽填充完成时,基于预设深度网络序列标 注模型,将所述多重关联答复转化为可用信息,以使用所述可用信息生成所 述第二目标问题的答复信息,其中,所述第二目标问题的答复信息存储于区 块链中。
可选地,所述槽填充单元还用于:
从所述多重关联答复中提取出初始槽位信息;
判断所述初始槽位信息是否符合预设有效性标准,并在所述初始槽位信 息不符合预设有效性标准时,使用澄清话术进行澄清表达;
在接收到客户端发送的对于所述澄清话术的修正回复时,根据所述修正 回复修正所述初始槽位信息,直至修正后的初始槽位信息符合所述有效性标 准;
对修正后的初始槽位信息进行标准化处理,并将经标准化处理后的初始 槽位信息作为目标槽位信息,以基于所述目标槽位信息进行槽填充。
可选地,所述多类型问题智能问答系统还包括:
第三问题检测模块,用于在检测到所述目标问题为第三问题类型时,将 第三问题类型的目标问题作为第三目标问题,并获取所述第三目标问题与基 于预设聚类算法所构建的标准问题集之间的问题相似度;
第三问题答复模块,用于将所述第三目标问题映射在所述标准问题集中 的相似标准问题上,并获取所述相似标准问题的标准回复,以基于所述标准 回复生成所述第三目标问题的答复信息,其中,所述相似标准问题在所述标 准问题集中与所述目标问题之间的问题相似度最高。
此外,为实现上述目的,本发明还提供一种多类型问题智能问答设备, 所述多类型问题智能问答设备包括处理器、存储器、以及存储在所述存储器 上并可被所述处理器执行的多类型问题智能问答程序,其中所述多类型问题 智能问答程序被所述处理器执行时,实现如上述的多类型问题智能问答方法 的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述 计算机可读存储介质上存储有多类型问题智能问答程序,其中所述多类型问 题智能问答程序被处理器执行时,实现如上述的多类型问题智能问答方法的 步骤。
本发明提供一种多类型问题智能问答方法、系统、设备及计算机可读存 储介质。所述多类型问题智能问答方法通过在接收到目标问题时,基于预设 深度网络模型对所述目标问题进行意图分类,以确定所述目标问题的问题类 型;在检测到所述目标问题为第一问题类型时,对第一目标问题进行实体识 别与多层次语义解析,以获取所述第一目标问题的问题模板与多层次语义, 并根据所述问题模板与多层次语义,生成所述第一目标问题的答复信息,其 中,所述第一目标问题为第一问题类型的目标问题;在检测到所述目标问题为第二问题类型时,确定第二目标问题的关联问题集,并基于多轮问答技术 接收客户端对于所述关联问题集的多重关联答复,以基于所述多重关联答复 生成所述第二目标问题的答复信息,其中,所述第二目标问题为第二问题类 型的目标问题。通过上述方式,本发明通过深度网络模型确定目标问题的问 题类型,提升了问题定位的准确性;通过针对第一目标问题进行实体识别与 多层次语义解析,有效降低了模型复杂度,实现了对于第一目标问题的语义 的深层次理解,从而能够高效精准地回复具有复杂语义的第一目标问题;通 过针对第二目标问题与客户端展开多轮问答,直至获取到客户端对于关联问 题集的关联答复,使得能够准确回复需要获知多重相关信息的第二目标问题, 从而使得系统能够对其他语义更为复杂,答案更为多样,或是需要在获取多 重相关信息后才可进行回答的问题进行准确回复,解决了现有智能问答系统 的问题回复准确性不高的技术问题。
附图说明
图1为本发明实施例方案中涉及的多类型问题智能问答设备的硬件结构 示意图;
图2为本发明多类型问题智能问答方法第一实施例的流程示意图;
图3为本发明多类型问题智能问答方法一具体实施例中融合问题模板与 多层次语义解析的KBQA技术框架示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限 定本发明。
本发明实施例涉及的多类型问题智能问答方法主要应用于多类型问题智 能问答设备,该多类型问题智能问答设备可以是PC、便携计算机、移动终端 等具有显示和处理功能的设备。
参照图1,图1为本发明实施例方案中涉及的多类型问题智能问答设备的 硬件结构示意图。本发明实施例中,多类型问题智能问答设备可以包括处理 器1001(例如CPU),通信总线1002,用户接口1003,网络接口1004,存储 器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接 口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口);存储 器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器 1001的存储装置。
本领域技术人员可以理解,图1中示出的硬件结构并不构成对多类型问 题智能问答设备的限定,可以包括比图示更多或更少的部件,或者组合某些 部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以 包括操作系统、网络通信模块以及多类型问题智能问答程序。
在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信; 而处理器1001可以调用存储器1005中存储的多类型问题智能问答程序,并 执行以下操作:
在接收到目标问题时,基于预设深度网络模型对所述目标问题进行意图 分类,以确定所述目标问题的问题类型;
在检测到所述目标问题为第一问题类型时,对第一目标问题进行实体识 别与多层次语义解析,以获取所述第一目标问题的问题模板与多层次语义, 并根据所述问题模板与多层次语义,生成所述第一目标问题的答复信息,其 中,所述第一目标问题为第一问题类型的目标问题;
在检测到所述目标问题为第二问题类型时,确定第二目标问题的关联问 题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复, 以基于所述多重关联答复生成所述第二目标问题的答复信息,其中,所述第 二目标问题为第二问题类型的目标问题。
进一步地,所述在接收到目标问题时,基于预设深度网络模型对所述目 标问题进行意图分类,以确定所述目标问题的问题类型的步骤包括:
在接收到目标问题时,将所述目标问题输入预训练语言表征模型,得到 所述目标问题对应词序列的序列表征向量;
将所述序列表征向量输入预设双向长短时记忆网络中,得到所述词序列 的隐藏向量;
结合所述序列表征向量与所述隐藏向量,确定所述目标问题的问题类型。
进一步地,所述在检测到所述目标问题为第一问题类型时,对第一目标 问题进行实体识别与多层次语义解析,以获取所述第一目标问题的问题模板 与多层次语义,并根据所述问题模板与多层次语义,生成所述第一目标问题 的答复信息的步骤包括:
在检测到所述目标问题为第一问题类型时,基于离线处理方式,使用预 设实体识别模型识别出所述第一目标问题的实体信息,并基于所述实体信息 得到所述问题模板;
基于线上处理方式,对所述第一目标问题进行多层次语义解析,得到所 述第一目标问题的多层次语义;
使用预设概率图模型,并结合所述问题模板与所述多层次语义,预测所 述第一目标问题对应到知识图谱中的属性类别;
根据所述属性类别与所述实体信息,将所述第一目标问题转换为知识图 谱的结构化查询,以得到所述第一目标问题的答复信息,其中,所述第一目 标问题的答复信息存储于区块链中。
进一步地,所述对所述第一目标问题进行多层次语义解析,得到所述第 一目标问题的多层次语义的步骤包括:
使用预设语义搜索模型对所述第一目标问题进行实体层语义解析,获取 实体层语义;
使用预设动词模板对所述第一目标问题进行细粒度语义表示,获取所述 第一目标问题的短语层语义;
基于所述问题模板将所述第一目标问题的实体信息进行概念映射,获取 所述第一目标问题的问题层语义,以将所述实体层语义、短语层语义与问题 层语义作为所述多层次语义。
进一步地,所述在检测到所述目标问题为第二问题类型时,确定第二目 标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集 的多重关联答复,以基于所述多重关联答复生成所述第二目标问题的答复信 息的步骤包括:
在检测到所述目标问题为第二问题类型时,从预设关联问题库中确定所 述关联问题集,并围绕所述关联问题集与客户端进行多轮问答;
接收多轮问答中客户端发送的所述多重关联答复,并根据所述多重关联 答复进行槽填充;
在检测到槽填充完成时,基于预设深度网络序列标注模型,将所述多重 关联答复转化为可用信息,以使用所述可用信息生成所述第二目标问题的答 复信息,其中,所述第二目标问题的答复信息存储于区块链中。
进一步地,所述所述接收多轮问答中客户端发送的所述多重关联答复, 并根据所述多重关联答复进行槽填充的步骤包括:
从所述多重关联答复中提取出初始槽位信息;
判断所述初始槽位信息是否符合预设有效性标准,并在所述初始槽位信 息不符合预设有效性标准时,使用澄清话术进行澄清表达;
在接收到客户端发送的对于所述澄清话术的修正回复时,根据所述修正 回复修正所述初始槽位信息,直至修正后的初始槽位信息符合所述有效性标 准;
对修正后的初始槽位信息进行标准化处理,并将经标准化处理后的初始 槽位信息作为目标槽位信息,以基于所述目标槽位信息进行槽填充。
进一步地,所述在接收到目标问题时,基于预设深度网络模型对所述目 标问题进行意图分类,以确定所述目标问题的问题类型的步骤之后,还包括:
在检测到所述目标问题为第三问题类型时,将第三问题类型的目标问题 作为第三目标问题,并获取所述第三目标问题与基于预设聚类算法所构建的 标准问题集之间的问题相似度;
将所述第三目标问题映射在所述标准问题集中的相似标准问题上,并获 取所述相似标准问题的标准回复,以基于所述标准回复生成所述第三目标问 题的答复信息,其中,所述相似标准问题在所述标准问题集中与所述目标问 题之间的问题相似度最高。
基于上述硬件结构,提出本发明多类型问题智能问答方法的各个实施例。
对于传统的问答系统,主要是以机器自动回答用户所提出来的自然语言 问题。目前问答系统主要覆盖的问题主要可以分为三类:事实型问题、观点 型问题与任务型问题。事实型问题主要是有确定性的答案的知识型的问题, 比如“麻腮风疫苗可以预防哪些疾病?”;观点型问题一般是不存在唯一标 准答案的问题,比如“疫苗免费的好还是自费的好?”;而任务型问题一般 需要从用户连续的对话中获取任务所需的信息,比如“预约接种疫苗”需要 知道接种疫苗种类、预约接种时间、接种地点等信息才可以完成相关问题。
现有智能问答系统的核心是可以准确理解问题语义,返回高质量的答案。 目前疫苗等医学领域的问答系统大多是两类,一类是基于常见问题解答(FQA, Frequently AskedQuestions)技术的问答系统,只能覆盖有确定性答案的 问题;另一类是基于知识库问答(KB-QA,knowledge base question answering) 技术的问答系统,只能覆盖部分简单的不存在唯一答案的问题,而现有智能 问答系统在对其他语义更为复杂,答案更为多样,或是需要在获取多重相关 信息后才可进行回答的问题进行回复时,往往难以为问题提出方提供准确的 答复,因而导致了现有智能问答系统的问题回复准确性不高的技术问题。
为解决上述问题,本发明提供一种多类型问题智能问答方法,即通过深 度网络模型确定目标问题的问题类型,提升了问题定位的准确性;通过针对 第一目标问题进行实体识别与多层次语义解析,有效降低了模型复杂度,实 现了对于第一目标问题的语义的深层次理解,从而能够高效精准地回复具有 复杂语义的第一目标问题;通过针对第二目标问题与客户端展开多轮问答, 直至获取到客户端对于关联问题集的关联答复,使得能够准确回复需要获知 多重相关信息的第二目标问题,从而使得系统能够对其他语义更为复杂,答案更为多样,或是需要在获取多重相关信息后才可进行回答的问题进行准确 回复,从而解决了现有的智能问答系统所支持回答的问题类型不全面的技术 问题。本发明应用于多类型问题智能问答系统。
参照图2,图2为本发明多类型问题智能问答方法第一实施例的流程示意 图。
本发明第一实施例提供一种多类型问题智能问答方法,所述多类型问题 智能问答方法包括以下步骤:
步骤S10,在接收到目标问题时,基于预设深度网络模型对所述目标问题 进行意图分类,以确定所述目标问题的问题类型;
在本实施例中,目标问题通常为用户通过客户端以自然语言输入或语音 输入等方式向多类型问题智能问答系统输入的需要获得回复的问题。预设深 度网络模型融合了Transformer的双向编码器表征(BERT,Bidirectional Encoder Representations fromTransformers)与双向长短时记忆网络 (Bi-LSTM,Bi-directional Long Short-TermMemory)。意图分类旨在将用户 所提出的目标问题通过深度网络模型进行分类。问题类型具体可包括常见型 问题、事实性问题、任务型问题与其他无关问题。多类型问题智能问答系统 (以下简称系统)在接收到用户所提出的当前需要答复的目标问题时,将目 标问题作为模型输入BERT层,BERT层得到所述用户问题对应词序列的序列表 征向量。系统在获取到词序列的序列表征向量后,再将序列表征向量输入 Bi-LSTM层,得到目标问题的词序列的隐藏向量。系统结合序列表征向量和隐 藏向量学习得到目标表征向量,并经过全连接层以及Softmax(输出层的激励 函数)操作,即可得到目标问题的所属分类,也即是上述分类结果。
步骤S20,在检测到所述目标问题为第一问题类型时,对第一目标问题进 行实体识别与多层次语义解析,以获取所述第一目标问题的问题模板与多层 次语义,并根据所述问题模板与多层次语义,生成所述第一目标问题的答复 信息,其中,所述第一目标问题为第一问题类型的目标问题;
在本实施例中,第一问题类型具体可为事实型、观点型、任务型或其他 类型,优选为观点型。当系统识别出当前的目标问题属于观点型问题时,采 用KBQA技术进行答复。KBQA技术即采用知识库问答(KB-QA,knowledge base question answering)技术,通过给定自然语言问题,对问题进行语义理解 和解析,进而利用知识库进行查询、推理得出答案。具体的,从应用领域的 角度划分,知识库问答可以分为开放域的知识问答,如百科知识问答,和特 定域的知识问答,如金融领域,医疗领域,宗教领域等。系统先对第一目标 问题的实体进行识别,以根据第一目标问题的实体信息得到与第一目标问题 相关的问题模板,并对第一目标问题进行多层次语义识别,以深度理解第一 目标问题的语义。最后结合得到的问题模板与解析出的多层次语义,进行知 识图谱的结构化查询,以生成第一目标问题的答复信息。
步骤S30,在检测到所述目标问题为第二问题类型时,确定第二目标问题 的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重 关联答复,以基于所述多重关联答复生成所述第二目标问题的答复信息,其 中,所述第二目标问题为第二问题类型的目标问题。
在本实施例中,第二问题类型具体可为事实型、观点型、任务型或其他 类型,优选为任务型。多轮问答技术为,先获取用户端输入的初始信息也即 是第二目标问题,并对初始信息进行识别,确定出在不同条件组合下对应不 同答案的预定问题,也即是关联问题集,并开始进行对于所确定的预定问题 的第一轮问答。在每一轮问答中,输出对于所确定的预定问题的一个未知条 件的提问,以供用户回答。在获取到用户所答复的条件,也即是多重关联答 复时,根据预定的条件组合和答案之间的对应关系,判断已获取的条件的组合是否存在对应的答案。若存在,则输出已获取的条件的组合所对应的答案; 若不存在,则进行下一轮问答。系统可融合了FAQ、KBQA、多轮问答等技术, 按照当前目标问题所对应的实际分类结果,选择最适用于答复目标问题的目 标技术类型。具体地,若系统识别出当前的目标问题为常见型问题,则可选 用基于预设聚类算法的常见问题解答方式进行处理;若系统识别出当前的目 标问题为事实型问题,则可采用结合问题模板生成与多层次语义解析的KBQA 技术进行处理;若系统识别出当前的目标问题为任务线问题,则可选用基于 槽填充的多轮问答技术进行处理,以得到针对当前目标问题的答复信息并向 用户端进行输出。
在本实施例中,通过在接收到目标问题时,基于预设深度网络模型对所 述目标问题进行意图分类,以确定所述目标问题的问题类型;在检测到所述 目标问题为第一问题类型时,对第一目标问题进行实体识别与多层次语义解 析,以获取所述第一目标问题的问题模板与多层次语义,并根据所述问题模 板与多层次语义,生成所述第一目标问题的答复信息,其中,所述第一目标 问题为第一问题类型的目标问题;在检测到所述目标问题为第二问题类型时, 确定第二目标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复,以基于所述多重关联答复生成所述第二目标问 题的答复信息,其中,所述第二目标问题为第二问题类型的目标问题。通过 上述方式,本发明通过深度网络模型确定目标问题的问题类型,提升了问题 定位的准确性;通过针对第一目标问题进行实体识别与多层次语义解析,有 效降低了模型复杂度,实现了对于第一目标问题的语义的深层次理解,从而 能够高效精准地回复具有复杂语义的第一目标问题;通过针对第二目标问题 与客户端展开多轮问答,直至获取到客户端对于关联问题集的关联答复,使 得能够准确回复需要获知多重相关信息的第二目标问题,从而使得系统能够 对其他语义更为复杂,答案更为多样,或是需要在获取多重相关信息后才可 进行回答的问题进行准确回复,解决了现有智能问答系统的问题回复准确性 不高的技术问题。
进一步地,图中未示的,基于上述图2所示的第一实施例,提出本发明 多类型问题智能问答方法的第二实施例,本实施例中,步骤S10具体包括:
在接收到目标问题时,将所述目标问题输入预训练语言表征模型,得到 所述目标问题对应词序列的序列表征向量;
将所述序列表征向量输入预设双向长短时记忆网络中,得到所述词序列 的隐藏向量;
结合所述序列表征向量与所述隐藏向量,确定所述目标问题的问题类型。
本实施例中,预训练语言表征模型即为上述BERT,BERT是基于双向 Transformer的自然语言预训练模型,再结合自然语言处理(NLP,Natural Language Processing)具体下游任务组合其他网络层形成适应于特定任务的 模型。需要说明BERT模型中[CLS]可以对整个句子进行向量表示。BERT模型 在每个句子的词序列前面加一个特殊的记号[CLS],基于Transformer网络结 构可以将整个句子的全局信息编码到每个位置,BERT模型对[CLS]进行深度表 征可以学到整个句子的上层特征。
具体地,对于一句话先将句子分词得到句子的词序列w1,w2…,wn,并 在整个句子的输入序列开头增加[CLS]得到模型的输入序列w[CLS],w1…,wn。 通过BERT层获取的得到词序列的表征向量e[CLS],e1,e2…,en,其中e[CLS]可 以学习到整个句子的上层特征。将一句话的词向量e1,e2…,en输入Bi-LSTM 层,到隐藏向量h1,h2…,hn。Bi-LSTM可以很好的学习到对应词前后的语 义信息,可以将更深层次的语义信息融入到模型中。然后将上一层得到的隐藏向量h1,h2…,hn与BERT层[CLS]的表征向量e[CLS]进行Attention(注意力 机制)操作,做一个近似于加权求和的操作,得到目标表征向量Vector。将学 习到的目标表征向量Vector经过全连接层以及Softmax操作,得到输入句子 (目标问题)的所属分类,也即是上述问题类型。
进一步地,在本实施例中,步骤S20包括:
在检测到所述目标问题为第一问题类型时,基于离线处理方式,使用预 设实体识别模型识别出所述第一目标问题的实体信息,并基于所述实体信息 得到所述问题模板;
在本实施例中,需要说明的是系统中的KBQA模块主要包含离线处理和线 上输出两个部分。离线处理部分的主要功能是利用QA语料、只是图谱的信息, 从中抽取模板构建问题模板库。具体地,系统中KBQA模块的离线处理部分使 用基于长短时记忆(LSTM,LongShort-Term Memory)-条件随机场(CRF, conditional random field)的实体识别模型可以从自然语句中识别出实体 部分,通过对QA语料中的自然语句进行实体识别操作后,可以将自然语句中 的实体映射到对应的概念上,从而减少大量重复的问题,而且将问题概念化 可以辅助模型学习到更精准的语义信息。通过知识图谱中的属性(关系类型) 进行属性扩展获取得到更多的关系表达。通过对QA语料中的实体概念映射以 及对知识图谱的属性扩展从而获取得到高质量的问题模板。
基于线上处理方式,对所述第一目标问题进行多层次语义解析,得到所 述第一目标问题的多层次语义;
使用预设概率图模型,并结合所述问题模板与所述多层次语义,预测所 述第一目标问题对应到知识图谱中的属性类别;
根据所述属性类别与所述实体信息,将所述第一目标问题转换为知识图 谱的结构化查询,以得到所述第一目标问题的答复信息,其中,所述第一目 标问题的答复信息存储于区块链中。
在本实施例中,线上处理部分的主要功能是对第一目标问题进行解析获 取得到实体以及对应的属性类型,并将其转换成知识图谱结构化查询,最终 将第一目标问题的答案返回给用户。系统中KBQA模块的线上处理部分先对第 一目标问题进行多层次语义解析,再使用预设的概率图模型综合使用问题的 语义解析结果,以及通过离线处理部分获取到的问题模板,预测出第一目标 问题对应到知识图谱中的属性类型,也即是实现问题语义解析。模型预测与 知识图谱查询的功能。线上处理部分最后根据得到的属性类型以及模型识别 出的第一目标问题中的实体等信息,将第一目标问题转换成知识图谱的结构 化查询,并将第一目标问题的答案返回到用户端。需要强调的是,为进一步 保证上述第一目标问题的答复信息的私密和安全性,上述第一目标问题的答 复信息还可以存储于一区块链的节点中。
进一步地,在本实施例中,所述对所述第一目标问题进行多层次语义解 析,得到所述第一目标问题的多层次语义的步骤包括:
使用预设语义搜索模型对所述第一目标问题进行实体层语义解析,获取 实体层语义;
使用预设动词模板对所述第一目标问题进行细粒度语义表示,获取所述 第一目标问题的短语层语义;
基于所述问题模板将所述第一目标问题的实体信息进行概念映射,获取 所述第一目标问题的问题层语义,以将所述实体层语义、短语层语义与问题 层语义作为所述多层次语义。
在本实施例中,多层次语义解析包括实体层语义解析、短语层语义解析 与问题层语义解析。KBQA模块中的线上处理部分使用预设语义搜索模型,基 于知识图谱的实体语义理解,为上层语义计算获取实体层语义信息;主要使 用动词模板用来进行细粒度的语义表示,并综合使用上下文信息进行实体的 概念化,以获取短语层语义信息;还基于问题模板的表示方法,将第一目标 问题中的实体映射到概念上,进一步表示第一目标问题的语义,以获取问题 层语义信息。
作为一具体实施例,第一目标问题为观点型问题。如图3所示,图3为 融合问题模板与多层次语义解析的KBQA技术框架示意图。系统中的KBQA模 块具体可分为离线处理与线上处理两部分。离线处理部分中离线处理模块主 要是利用QA语料、知识图谱的信息从中抽取模板构建出问题模板库;而线上 处理部分包括问题解析子模块、模型预测子模块与知识图谱查询子模块,基 于这些子模块将观点型问题转换成知识图谱的结构化查询,以获取目标问题 的答案。
在本实施例中,进一步通过融合问题模板以及多层次的语义解析技术, 可以有效的降低模型的复杂度,并且可以深层次理解问题,提高了模型的精 度;通过对QA语料中的自然语句进行实体识别操作后,可以将自然语句中的 实体映射到对应的概念上,从而减少大量重复的问题,而且将问题概念化可 以辅助模型学习到更精准的语义信息;通过知识图谱中的属性类型进行属性 扩展可以获取得到更多的属性表达;通过对问答(QA,QuestionAnswering) 语料的中实体概念映射以及对知识图谱的属性扩展从而获取得到高质量的问题模板。
进一步地,图中未示的,基于上述图2所示的第一实施例,提出本发明 多类型问题智能问答方法的第三实施例。本实施例中,所述步骤S30包括:
在检测到所述目标问题为第二问题类型时,从预设关联问题库中确定所 述关联问题集,并围绕所述关联问题集与客户端进行多轮问答;
接收多轮问答中客户端发送的所述多重关联答复,并根据所述多重关联 答复进行槽填充;
在检测到槽填充完成时,基于预设深度网络序列标注模型,将所述多重 关联答复转化为可用信息,以使用所述可用信息生成所述第二目标问题的答 复信息,其中,所述第二目标问题的答复信息存储于区块链中。
在本实施例中,预设关联问题库为预先设定的用于将第二目标问题拆分 为多个子问题的问题库。
系统在检测到目标问题属于第二问题类型时,则可对第二目标问题进行 语义识别,并根据语义识别结果从预设的关联问题库中确定出与用于回答第 二目标问题的多个子问题,也即是上述关联问题集。可采用多轮问答技术, 系统中的用于答复第二目标问题的多轮问答模块围绕关联问题集与客户端进 行多轮问答,并在接收到客户端发送的针对关联问题集的多重关联回复时, 根据客户端的多重关联回复进行槽填充;多轮问答模块使用预设深度网络序 列标注模型,将客户端的多重关联回复转化为可用信息,以根据可用信息生 成第二目标问题的答复信息。其中,预设深度网络序列标注模型即为LSTM-CRF 模型。需要强调的是,为进一步保证上述第二目标问题的答复信息的私密和 安全性,上述第二目标问题的答复信息还可以存储于一区块链的节点中。
进一步地,在本实施例中,所述接收多轮问答中客户端发送的所述多重 关联答复,并根据所述多重关联答复进行槽填充的步骤包括:
从所述多重关联答复中提取出初始槽位信息;
判断所述初始槽位信息是否符合预设有效性标准,并在所述初始槽位信 息不符合预设有效性标准时,使用澄清话术进行澄清表达;
在接收到客户端发送的对于所述澄清话术的修正回复时,根据所述修正 回复修正所述初始槽位信息,直至修正后的初始槽位信息符合所述有效性标 准;
对修正后的初始槽位信息进行标准化处理,并将经标准化处理后的初始 槽位信息作为目标槽位信息,以基于所述目标槽位信息进行槽填充。
在本实施例中,初始槽位信息为根据用户针对关联问题集的回复中的关 键信息。例如,关于“预约疫苗接种”这一任务型问题,“预约疫苗接种” 需要知道疫苗名称、疫苗种类(一类、二类)、疫苗接种点、预约接种时间 等。预约疫苗接种需要知道四个信息,这四个信息即是四个槽位。预设有效 性标准为,判断能否根据从客户端所发送的问题或回复消息中提取出的槽位 信息来完成填槽的标准条件,可根据实际需求灵活设置,例如,对于预约疫 苗接种这一任务型问题,客户端发送的回复语句当中没有关于疫苗种类的信 息,则系统可判定当前仍不满足有效性标准,需要继续进行问答以获取必要 信息。修正回复为用户对于系统发出的澄清表达的回复信息,例如,用户在 关于预约疫苗接种这一任务型问题与系统进行多轮问答时,为说明关于疫苗 种类这一槽位的信息,系统终端多轮问答模块则会向客户端发送类似于“需 要预约接种哪一种类的疫苗”等的澄清表达,以便客户端用户进行明确答复。 系统中的多轮问答模块从所述多重关联答复中提取出初始槽位信息,并判断初始槽位信息是否符合预设有效性标准。若初始槽位信息符合预设有效性标 准,则可判定当前以完成关于第二目标问题的问答;若初始槽位信息中有一 个或多个不符合预设有效性标准,则使用澄清话术机械能澄清表达。多轮问 答模块在接收到客户端发送的对于澄清话术的修正回复时,根据修正回复修 正初始槽位信息,并对修正后的初始槽位信息进行标准化处理,以将经标准 化处理后的初始槽位信息作为目标槽位信息,此时则可判定完成槽填充,无 需再进行问答。
作为一具体实施例,设定第二目标问题为任务型问题。以下以“预约疫 苗接种”为例说明多轮问答的流程。“预约疫苗接种”需要知道疫苗名称、 疫苗种类(一类、二类)、疫苗接种点、预约接种时间等。预约疫苗接种需 要知道四个信息,这四个信息即是四个槽位,从与用户的对话中获取四个槽 位的信息即是填槽(槽填充)。首先需要从用户的初始问题中获取四个槽位 的信息,当检测到当前存在槽位的信息没有填写时,需要使用澄清话术进行澄清表达,比如针对疫苗接种点的澄清话术是“您想预约接种疫苗的疫苗接 种点是哪个?”,并提供候选项给用户进行选择,用户也可以直接使用自然 语言进行回复。槽与槽之间的是否有依赖关系可以分为依赖槽和平级槽,疫 苗种类这个槽是依赖于疫苗名称的,预约的接种时间是依赖于疫苗接种点。 依赖槽在澄清时需要有先后顺序,比如需要获取疫苗接种点的信息,才能澄 清可预约的时间信息。当用户使用自然语言进行回复时,系统使用基于 LSTM-CRF深度网络序列标注模型来获取可用信息。比如当疫苗接种点信息需 要澄清时,机器提问“您想预约接种疫苗的疫苗接种点是哪个?”,并提供 候选项给用户。如果用户是从候选项进行选择,则直接填槽;如果用户是使 用自然语言进行回复,比如“预约某疫苗接种点”,需要使用序列标注模型 可以获取到“预约【某疫苗接种点】(疫苗接种点)”,然后需要验证从对话 中获取的槽位信息的合法性,这里需要验证疫苗接种点是否在可供选择的范 围内。然后继续澄清其他需要填写的槽位信息。比如用户“预约明天上午10 点钟去XXX疫苗接种点接种乙肝疫苗。”,使用序列标注模型可以获取到“预 约【明天上午10点钟】(预约接种时间)去【XXX疫苗接种点】(疫苗接种 点)接种【乙肝疫苗】(疫苗名称)”,然后将从自然语句中获取的不同槽 位的信息进行标准化处理和验证信息是否合法。比如需要将明天上午10点钟 映射成标准时间信息,需要验证用户提及的疫苗接种点和预约接种时间是否 在可供选择的范围内等等。当获取了所有的槽位信息后,需要将所有的槽位 信息与用户进行再次确认,确认无误后即可完成需要使用的信息。
进一步地,在本实施例中,在步骤S10之后,还包括:
在检测到所述目标问题为第三问题类型时,将第三问题类型的目标问题 作为第三目标问题,并获取所述第三目标问题与基于预设聚类算法所构建的 标准问题集之间的问题相似度;
将所述第三目标问题映射在所述标准问题集中的相似标准问题上,并获 取所述相似标准问题的标准回复,以基于所述标准回复生成所述第三目标问 题的答复信息,其中,所述相似标准问题在所述标准问题集中与所述目标问 题之间的问题相似度最高。
在本实施例中,第三问题类型具体可为事实型、观点型、任务型或其他 类型,优选为事实型。预设聚类算法可选用具有噪声的基于密度的聚类方法 (DBSCAN,Density-Based Spatial Clustering of Applications with Noise)、期望最大化(EM,expectation maxmization)聚类算法、K均值 (K-means)聚类算法等,优选为K-means聚类算法。常见问题回答方式即采 用常见问题解答(FQA,Frequently Asked Questions)技术,FAQ是当前网 络上提供在线帮助的主要手段,通过事先组织好一些可能的常问问答对,发 布在网页上为用户提供咨询服务。
FAQ技术通过模型计算用户问题和已有的标准问题之间的相似度,将用户 的问题映射到已有的标准问题上从而实现问答。系统在FAQ模块使用的模型 是复用了意图分类模块中的融合BERT与BiLSTM的深度学习模型,模型的输 入是用户的问题,模型的输出是与第三目标问题相似度最高的标准问题对应 的答案。FAQ技术能覆盖的问题的种类数取决于设计的标准问题的多少,目前 标准问题多是通过人工整理得到,能覆盖的问题的种类数比较少。而本发明 中的系统基于机器学习聚类算法K-means算法从海量的领域问答语料中自动 构建大量高质量的标准问题。自动构建高质量的标准问题主要包括三步:第 一步,从高质量疫苗垂直型网站数据源获取初始的问题;第二步,通过聚类 算法将相似的问题聚成一簇;第三步,筛选标准问题并获取答案。在实际应 用中,通过该步骤可构建五千左右疫苗领域的高质量标准问题集合。
在本实施例中,进一步通过在系统中的多轮问答模块中基于槽填充、多 轮对话技术,高效解决了任务型问题,尤其是针对疫苗问答相关的任务型问 题;通过在FAQ模块中基于K-means聚类算法自动构建大规模高质量的标准 问题集,从而减少了人工整理标注标准问题集的成本。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算 法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中 心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块 中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下 一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务 层等。
此外,本发明实施例还提供一种多类型问题智能问答系统。
本实施例中,所述多类型问题智能问答系统包括:
意图分类模块,用于在接收到目标问题时,基于预设深度网络模型对所 述目标问题进行意图分类,以确定所述目标问题的问题类型;
第一问题答复模块,用于在检测到所述目标问题为第一问题类型时,对 第一目标问题进行实体识别与多层次语义解析,以获取所述第一目标问题的 问题模板与多层次语义,并根据所述问题模板与多层次语义,生成所述第一 目标问题的答复信息,其中,所述第一目标问题为第一问题类型的目标问题
第二问题答复模块,用于在检测到所述目标问题为第二问题类型时,确 定第二目标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关 联问题集的多重关联答复,以基于所述多重关联答复生成所述第二目标问题 的答复信息,其中,所述第二目标问题为第二问题类型的目标问题。
其中,上述多类型问题智能问答系统中各个模块与上述多类型问题智能 问答方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种多类型问题智能问答设备。
所述多类型问题智能问答设备包括处理器、存储器及存储在所述存储器 上并可在所述处理器上运行的多类型问题智能问答程序,其中所述多类型问 题智能问答程序被所述处理器执行时,实现如上所述的多类型问题智能问答 方法的步骤。
其中,所述多类型问题智能问答程序被执行时所实现的方法可参照本发 明多类型问题智能问答方法的各个实施例,此处不再赘述。
此外,本发明实施例还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有多类型问题智能问答程序,其中所 述多类型问题智能问答程序被处理器执行时,实现如上述的多类型问题智能 问答方法的步骤。
其中,多类型问题智能问答程序被执行时所实现的方法可参照本发明多 类型问题智能问答方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变 体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品 或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是 还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的 情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过 程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁 碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机, 服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是 利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间 接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种多类型问题智能问答方法,其特征在于,所述多类型问题智能问答方法包括以下步骤:
在接收到目标问题时,基于预设深度网络模型对所述目标问题进行意图分类,以确定所述目标问题的问题类型;
在检测到所述目标问题为第一问题类型时,对第一目标问题进行实体识别与多层次语义解析,以获取所述第一目标问题的问题模板与多层次语义,并根据所述问题模板与多层次语义,生成所述第一目标问题的答复信息,其中,所述第一目标问题为第一问题类型的目标问题;
在检测到所述目标问题为第二问题类型时,确定第二目标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复,以基于所述多重关联答复生成所述第二目标问题的答复信息,其中,所述第二目标问题为第二问题类型的目标问题。
2.如权利要求1所述的多类型问题智能问答方法,其特征在于,所述在接收到目标问题时,基于预设深度网络模型对所述目标问题进行意图分类,以确定所述目标问题的问题类型的步骤包括:
在接收到目标问题时,将所述目标问题输入预训练语言表征模型,得到所述目标问题对应词序列的序列表征向量;
将所述序列表征向量输入预设双向长短时记忆网络中,得到所述词序列的隐藏向量;
结合所述序列表征向量与所述隐藏向量,确定所述目标问题的问题类型。
3.如权利要求1所述的多类型问题智能问答方法,其特征在于,所述在检测到所述目标问题为第一问题类型时,对第一目标问题进行实体识别与多层次语义解析,以获取所述第一目标问题的问题模板与多层次语义,并根据所述问题模板与多层次语义,生成所述第一目标问题的答复信息的步骤包括:
在检测到所述目标问题为第一问题类型时,基于离线处理方式,使用预设实体识别模型识别出所述第一目标问题的实体信息,并基于所述实体信息得到所述问题模板;
基于线上处理方式,对所述第一目标问题进行多层次语义解析,得到所述第一目标问题的多层次语义;
使用预设概率图模型,并结合所述问题模板与所述多层次语义,预测所述第一目标问题对应到知识图谱中的属性类别;
根据所述属性类别与所述实体信息,将所述第一目标问题转换为知识图谱的结构化查询,以得到所述第一目标问题的答复信息,其中,所述第一目标问题的答复信息存储于区块链中。
4.如权利要求3所述的多类型问题智能问答方法,其特征在于,所述对所述第一目标问题进行多层次语义解析,得到所述第一目标问题的多层次语义的步骤包括:
使用预设语义搜索模型对所述第一目标问题进行实体层语义解析,获取实体层语义;
使用预设动词模板对所述第一目标问题进行细粒度语义表示,获取所述第一目标问题的短语层语义;
基于所述问题模板将所述第一目标问题的实体信息进行概念映射,获取所述第一目标问题的问题层语义,以将所述实体层语义、短语层语义与问题层语义作为所述多层次语义。
5.如权利要求1所述的多类型问题智能问答方法,其特征在于,所述在检测到所述目标问题为第二问题类型时,确定第二目标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复,以基于所述多重关联答复生成所述第二目标问题的答复信息的步骤包括:
在检测到所述目标问题为第二问题类型时,从预设关联问题库中确定所述关联问题集,并围绕所述关联问题集与客户端进行多轮问答;
接收多轮问答中客户端发送的所述多重关联答复,并根据所述多重关联答复进行槽填充;
在检测到槽填充完成时,基于预设深度网络序列标注模型,将所述多重关联答复转化为可用信息,以使用所述可用信息生成所述第二目标问题的答复信息,其中,所述第二目标问题的答复信息存储于区块链中,其中,所述第二目标问题的答复信息存储于区块链中。
6.如权利要求5所述的多类型问题智能问答方法,其特征在于,所述接收多轮问答中客户端发送的所述多重关联答复,并根据所述多重关联答复进行槽填充的步骤包括:
从所述多重关联答复中提取出初始槽位信息;
判断所述初始槽位信息是否符合预设有效性标准,并在所述初始槽位信息不符合预设有效性标准时,使用澄清话术进行澄清表达;
在接收到客户端发送的对于所述澄清话术的修正回复时,根据所述修正回复修正所述初始槽位信息,直至修正后的初始槽位信息符合所述有效性标准;
对修正后的初始槽位信息进行标准化处理,并将经标准化处理后的初始槽位信息作为目标槽位信息,以基于所述目标槽位信息进行槽填充。
7.如权利要求1所述的多类型问题智能问答方法,其特征在于,所述在接收到目标问题时,基于预设深度网络模型对所述目标问题进行意图分类,以确定所述目标问题的问题类型的步骤之后,还包括:
在检测到所述目标问题为第三问题类型时,将第三问题类型的目标问题作为第三目标问题,并获取所述第三目标问题与基于预设聚类算法所构建的标准问题集之间的问题相似度;
将所述第三目标问题映射在所述标准问题集中的相似标准问题上,并获取所述相似标准问题的标准回复,以基于所述标准回复生成所述第三目标问题的答复信息,其中,所述相似标准问题在所述标准问题集中与所述目标问题之间的问题相似度最高。
8.一种多类型问题智能问答系统,其特征在于,所述多类型问题智能问答系统包括:
意图分类模块,用于在接收到目标问题时,基于预设深度网络模型对所述目标问题进行意图分类,以确定所述目标问题的问题类型;
第一问题答复模块,用于在检测到所述目标问题为第一问题类型时,对第一目标问题进行实体识别与多层次语义解析,以获取所述第一目标问题的问题模板与多层次语义,并根据所述问题模板与多层次语义,生成所述第一目标问题的答复信息,其中,所述第一目标问题为第一问题类型的目标问题
第二问题答复模块,用于在检测到所述目标问题为第二问题类型时,确定第二目标问题的关联问题集,并基于多轮问答技术接收客户端对于所述关联问题集的多重关联答复,以基于所述多重关联答复生成所述第二目标问题的答复信息,其中,所述第二目标问题为第二问题类型的目标问题。
9.一种多类型问题智能问答设备,其特征在于,所述多类型问题智能问答设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的多类型问题智能问答程序,其中所述多类型问题智能问答程序被所述处理器执行时,实现如权利要求1至7中任一项所述的多类型问题智能问答方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有多类型问题智能问答程序,其中所述多类型问题智能问答程序被处理器执行时,实现如权利要求1至7中任一项所述的多类型问题智能问答方法的步骤。
CN202010558326.1A 2020-06-17 2020-06-17 多类型问题智能问答方法、系统、设备及可读存储介质 Pending CN111858877A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010558326.1A CN111858877A (zh) 2020-06-17 2020-06-17 多类型问题智能问答方法、系统、设备及可读存储介质
PCT/CN2020/117816 WO2021109690A1 (zh) 2020-06-17 2020-09-25 多类型问题智能问答方法、系统、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010558326.1A CN111858877A (zh) 2020-06-17 2020-06-17 多类型问题智能问答方法、系统、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111858877A true CN111858877A (zh) 2020-10-30

Family

ID=72986186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010558326.1A Pending CN111858877A (zh) 2020-06-17 2020-06-17 多类型问题智能问答方法、系统、设备及可读存储介质

Country Status (2)

Country Link
CN (1) CN111858877A (zh)
WO (1) WO2021109690A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565663A (zh) * 2020-11-26 2021-03-26 平安普惠企业管理有限公司 需求问题回复方法、装置、终端设备及存储介质
WO2021208703A1 (zh) * 2020-11-19 2021-10-21 平安科技(深圳)有限公司 问题解析方法、装置、电子设备及存储介质
CN113704432A (zh) * 2021-08-31 2021-11-26 广州方舟信息科技有限公司 一种基于互联网医院的人工智能客服系统构建方法及装置
CN115062628A (zh) * 2022-06-15 2022-09-16 北京信息科技大学 一种基于知识图谱的医患交流对话自动模拟方法
CN115238101A (zh) * 2022-09-23 2022-10-25 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN115470338A (zh) * 2022-10-27 2022-12-13 之江实验室 一种基于多路召回的多场景智能问答方法和系统

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420111B (zh) * 2021-06-17 2023-08-11 中国科学院声学研究所 一种用于多跳推理问题的智能问答方法及装置
CN113590776B (zh) * 2021-06-23 2023-12-12 北京百度网讯科技有限公司 基于知识图谱的文本处理方法、装置、电子设备及介质
CN113449117B (zh) * 2021-06-24 2023-09-26 武汉工程大学 一种基于Bi-LSTM和中文知识图谱的复合问答方法
CN113689851B (zh) * 2021-07-27 2024-02-02 国家电网有限公司 调度专业语言理解系统及方法
CN116821312B (zh) * 2023-08-30 2023-11-14 中国石油大学(华东) 一种基于学科领域知识图谱的复杂问答方法
CN117171332A (zh) * 2023-11-02 2023-12-05 江西拓世智能科技股份有限公司 基于ai的智能问答方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
CN108491394A (zh) * 2018-06-27 2018-09-04 杭州贝店科技有限公司 一种语义分析方法、装置、计算机设备及存储介质
CN109284363A (zh) * 2018-12-03 2019-01-29 北京羽扇智信息科技有限公司 一种问答方法、装置、电子设备及存储介质
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
JP2019125145A (ja) * 2018-01-16 2019-07-25 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN110245240A (zh) * 2019-05-31 2019-09-17 国网电子商务有限公司 一种问题数据答案的确定方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598445B (zh) * 2013-11-01 2019-05-10 腾讯科技(深圳)有限公司 自动问答系统和方法
CN105159996B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
JP2019125145A (ja) * 2018-01-16 2019-07-25 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN108491394A (zh) * 2018-06-27 2018-09-04 杭州贝店科技有限公司 一种语义分析方法、装置、计算机设备及存储介质
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN109284363A (zh) * 2018-12-03 2019-01-29 北京羽扇智信息科技有限公司 一种问答方法、装置、电子设备及存储介质
CN110245240A (zh) * 2019-05-31 2019-09-17 国网电子商务有限公司 一种问题数据答案的确定方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AKSHAY UPADHYA B ET AL: "Deep Neural Network Models for Question Classification in Community Question-Answering Forums", 《IEEE XPLORE》, pages 1 - 6 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021208703A1 (zh) * 2020-11-19 2021-10-21 平安科技(深圳)有限公司 问题解析方法、装置、电子设备及存储介质
CN112565663A (zh) * 2020-11-26 2021-03-26 平安普惠企业管理有限公司 需求问题回复方法、装置、终端设备及存储介质
CN112565663B (zh) * 2020-11-26 2022-11-18 平安普惠企业管理有限公司 需求问题回复方法、装置、终端设备及存储介质
CN113704432A (zh) * 2021-08-31 2021-11-26 广州方舟信息科技有限公司 一种基于互联网医院的人工智能客服系统构建方法及装置
CN115062628A (zh) * 2022-06-15 2022-09-16 北京信息科技大学 一种基于知识图谱的医患交流对话自动模拟方法
CN115238101A (zh) * 2022-09-23 2022-10-25 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN115238101B (zh) * 2022-09-23 2023-01-03 中国电子科技集团公司第十研究所 一种面向多类型知识库的多引擎智能问答系统
CN115470338A (zh) * 2022-10-27 2022-12-13 之江实验室 一种基于多路召回的多场景智能问答方法和系统

Also Published As

Publication number Publication date
WO2021109690A1 (zh) 2021-06-10

Similar Documents

Publication Publication Date Title
CN111858877A (zh) 多类型问题智能问答方法、系统、设备及可读存储介质
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN109800306B (zh) 意图分析方法、装置、显示终端及计算机可读存储介质
CN117033608B (zh) 一种基于大语言模型的知识图谱生成式问答方法及系统
CN111159385B (zh) 一种基于动态知识图谱的无模板通用智能问答方法
CN111046132A (zh) 一种检索多轮对话的客服问答处理方法及其系统
CN105512228A (zh) 一种基于智能机器人的双向问答数据处理方法和系统
CN105095444A (zh) 信息获取方法和装置
CN109857846B (zh) 用户问句与知识点的匹配方法和装置
CN111309887B (zh) 一种训练文本关键内容提取模型的方法和系统
CN111339302A (zh) 训练要素分类模型的方法和装置
KR20170043955A (ko) 음성 대화 시스템 및 그 시스템에서의 음성 대화 방법
CN116127095A (zh) 一种序列模型与知识图谱结合的问答方法
CN113468891A (zh) 文本处理方法以及装置
CN114220461A (zh) 客服话术的引导方法、装置、设备及存储介质
CN116541493A (zh) 基于意图识别的交互应答方法、装置、设备、存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN116361431A (zh) 模型训练方法、对话生成方法、电子设备和相关装置
US11615787B2 (en) Dialogue system and method of controlling the same
CN114003700A (zh) 一种对话信息的处理方法、系统、电子设备及存储介质
CN113821587A (zh) 文本相关性确定方法、模型训练方法、装置及存储介质
CN111400479B (zh) 针对多轮对话的问题识别方法和装置
CN115905187A (zh) 一种面向云计算工程技术人员认证的智能化命题系统
CN115934904A (zh) 文本处理方法以及装置
CN115408500A (zh) 问答一致性的评估方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination