CN112052324A - 智能问答的方法、装置和计算机设备 - Google Patents
智能问答的方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN112052324A CN112052324A CN202010969745.4A CN202010969745A CN112052324A CN 112052324 A CN112052324 A CN 112052324A CN 202010969745 A CN202010969745 A CN 202010969745A CN 112052324 A CN112052324 A CN 112052324A
- Authority
- CN
- China
- Prior art keywords
- question
- node
- keyword
- nodes
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000011218 segmentation Effects 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 13
- 238000010845 search algorithm Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及大数据技术,揭示了智能问答的方法,包括:获取用户提出的问题语句;提取问题语句中对应的关键词,并获取关键词的分类信息;判断根据关键词的分类信息,是否能在知识树上查找到与关键词的分类信息匹配的节点;若否,则对问题语句进行意图识别,得到问题语句对应的关注点信息;根据问题语句对应的关注点信息,确定知识树上与问题语句匹配的节点;根据知识树上与问题语句匹配的节点,作为答案节点进行智能问答。通过建立结构简单的知识树,根据用户提出的问题语句,匹配知识树中对应的节点,作为问题语句的答案对应的答案节点,并将答案节点对应的知识内容回复至用户,实现数据量偏少或极小的特殊领域的智能问答。
Description
技术领域
本申请涉及大数据领域,特别是涉及到智能问答的方法、装置和计算机设备。
背景技术
智能问答系统能够接受用户以自然语言形式输入的问题,经过问题分析、信息检索和答案抽取等步骤,返回一个较为简洁准确的答案。智能问答系统为开发企业问题处理平台提供了一种选择,给企业在人事、财务、市场、技术等各个垂直业务层面提供自动化的服务,不仅节约了大量人力、提升了解决效率,同时为企业积累了宝贵的知识资产。
现有智能问答系统,一般通过投入大量人力物力形成复杂的知识图谱实现,或通过大量的标准数据训练深度神经网络实现,但发明人意识到对于数据量偏少或极小的特殊领域,无法通过知识图谱或深度神经网络实现智能问答。
发明内容
本申请的主要目的为解决数据量偏少或极小的特殊领域,无法通过知识图谱或深度神经网络实现智能问答的技术问题。
本申请提出一种智能问答的方法,包括:
获取用户提出的问题语句;
提取所述问题语句中对应的关键词,并获取所述关键词的分类信息;
判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点;
若否,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息;
根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点;
根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
优选地,所述提取所述问题语句中对应的关键词,并获取所述关键词的分类信息的步骤,包括:
对所述问题语句去停用词后进行分词,得到所述问题语句对应的分词组合;
判断所述分词组合中,是否存在与预设关键词词典的用语规则不同的指定词汇;
若是,则将所述指定词汇一一对应替换为与所述指定词汇对应的标准化词汇,得到修正分词组合,其中,所述标准化词汇包含于所述关键词词典中;
提取所述修正分词组合中指定词性对应的特征词汇,作为所述关键词;
在所述关键词词典中确定所述关键词对应的分类信息。
优选地,所述判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点的步骤,包括:
获取所述知识树的各节点分别对应的关键词表,以及各所述关键词表分别对应的分类信息,得到所述知识树对应的分类信息集合;
判断所述关键词的分类信息是否包含于所述分类信息集合中;
若是,则判定根据所述关键词的分类信息,能在所述知识树上查找到与所述关键词的分类信息匹配的节点;
根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点。
优选地,所述根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点的步骤,包括:
获取指定节点对应的指定关键词表中所有词汇对应的词汇权重,其中,所述指定节点为所述知识树中所有节点中的任意一个;
根据所述词汇权重,计算所述指定节点与所述关键词的匹配值;
按照所述指定节点与所述关键词的匹配值的计算过程,分别计算所述知识树中所有节点与所述关键词的匹配值;
将所述匹配值最大时对应的节点,作为与所述关键词匹配的节点。
优选地,所述对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息的步骤,包括:
提取所述问题语句的语义特征;
将所述问题语句的语义特征输入文本分类神经网络,得到所述问题语句对应的粗粒度信息分类;
根据所述粗粒度信息分类确定所述问题语句对应的关注点信息。
优选地,所述根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答的步骤,包括:
判断所述答案节点是否存在关联的子节点;
若是,则获取所述子节点的知识内容;
将所述答案节点对应的知识内容作为回应所述问题语句的答案,将所述子节点的知识内容作为智能问答中的知识引导;
将所述问题语句的答案和所述知识引导同步反馈至所述用户对应的终端。
优选地,所述获取用户提出的问题语句的步骤,包括:
获取用户输入的输入语句;
将所述输入语句输入Bert模型,获取所述输入语句中每个字对应的预测值;
根据指定字对应的预测值,判断所述指定字是否为错别字,其中,所述指定字为所述输入语句中所有字中的任意一个;
若是,获取所述指定字对应的拼音;
根据所述指定字对应的拼音,确定拼音相似度最高的候选字,作为所述指定字的校正字;
将所述输入语句中所有的错别字校正后,得到所述用户提出的问题语句。
本申请还提供了一种智能问答的装置,包括:
获取模块,用于获取用户提出的问题语句;
提取模块,用于提取所述问题语句中对应的关键词,并获取所述关键词的分类信息;
判断模块,用于判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点;
意图识别模块,用于若不能在知识树上查找到与所述关键词的分类信息匹配的节点,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息;
确定模块,用于根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点;
作为模块,用于根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本申请通过建立结构简单的知识树,知识树由一个根节点引出,并根据知识结构的关联关系,依次建立与根节点相连的子节点以及叶子节点,每个节点具备固定的元素:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点,可根据用户提出的问题语句,确定问题语句中的关键词分类信息或用户的关注点信息,然后匹配知识树中对应的节点,作为问题语句的答案对应的答案节点,并将答案节点对应的知识内容回复至用户,实现数据量偏少或极小的特殊领域的智能问答。
附图说明
图1本申请一实施例的智能问答的方法流程示意图;
图2本申请一实施例的知识树结构示意图;
图3本申请一实施例的步骤S2的流程示意图;
图4本申请一实施例的步骤S3的流程示意图;
图5本申请一实施例的步骤S34的流程示意图;
图6本申请一实施例的步骤S4的流程示意图;
图7本申请一实施例的步骤S5的流程示意图;
图8本申请一实施例的步骤S6的流程示意图;
图9本申请一实施例的步骤S1的流程示意图;
图10本申请一实施例的智能问答的装置结构示意图;
图11本申请一实施例的计算机设备内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本实施例的智能问答的方法,包括:
S1:获取用户提出的问题语句。
可通过语音接收系统或文本接收系统,获取用户提出的问题,并保存问题对应的语句。
S2:提取所述问题语句中对应的关键词,并获取所述关键词的分类信息。
通过对问题语句进行去停用词后,保留问题语句的关键词,然后根据关键词在关键词词典中查找对应的类别标注信息,得到关键词的分类信息。问题语句中普遍存在一些无实际意义的词,例如:“什么”、“吗”、“的”等等之类的助词或副词,称为停用词。停用词其本身对分类算法的精度没有影响,但是如果大量存在会严重影响计算速度,因此会预先删去停用词。
S3:判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点。
本申请的知识树的结构如图2所示,由一个根节点引出,并按照该知识结构体系依次建立各个节点。每个节点具备固定的元素,包括:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点。构建上述知识树的结构,通过遍历知识材料,查找知识点内容,并按照知识结构生成每个知识点内容分别对应的节点,无需设计、编辑和构建复杂的传统图数据库,对仅具有少量数据的领域,应用效果非常好。
基于问题语句的关键词和各节点分别对应的关键词表,利用关键词搜索算法进行节点匹配,以确定知识树上与问题语句对应的节点,并把该节点的知识作为问题语句的答案。
S4:若否,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息。
本申请的意图识别过程,基于Bert模型对问题语句进行语义特征提取,并通过文本分类神经网络得出用户的关注点信息。基于Bert模型对问题语句进行语义特征提取,仅使用粗粒度的信息分类,不仅初期的人工标注工作量不高,而且既能获取用户意图又不会过度依赖文本分类神经网络的可能性结果。例如:问题语句为“投标的流程是怎么样的?”或者“如何进行投标?”,基于Bert模型对问题语句进行语义特征提取,并通过文本分类神经网络得出用户的关注点信息为:“流程”或者“如何进行”。
S5:根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点。
根据上述获取的关注点信息,与每个节点的节点属性对比,保留两者一致的节点。
S6:根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
本申请通过建立结构简单的知识树,知识树由一个根节点引出,并根据知识结构的关联关系,依次建立与根节点相连的子节点以及叶子节点,每个节点具备固定的元素:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点,可根据用户提出的问题语句,确定问题语句中的关键词分类信息或用户的关注点信息,然后匹配知识树中对应的节点,作为问题语句的答案对应的答案节点,并将答案节点对应的知识内容回复至用户,实现数据量偏少或极小的特殊领域的智能问答。
参照图3,所述提取所述问题语句中对应的关键词,并获取所述关键词的分类信息的步骤S2,包括:
S21:对所述问题语句分词,得到所述问题语句对应的分词组合;
S22:对所述分词组合进行去停用词,得到第一修正分词组合;
S23:判断所述第一修正分词组合中,是否存在与预设关键词词典的用语规则不同的指定词汇;
S24:若是,则将所述指定词汇一一对应替换为与所述指定词汇对应的标准化词汇,得到第二修正分词组合,其中,所述标准化词汇包含于所述关键词词典中;
S25:提取所述第二修正分词组合中指定词性对应的特征词汇,作为所述关键词;
S26:在所述关键词词典中确定所述关键词对应的分类信息。
本申请在提取问题语句的关键词时,会对问题语句进行分词、句法改写和词汇替换。包括将大小写统一成预设的统一格式、专业用语的标准化替换、近义词替换等,使问题语句的关键词与关键词词典中的用语规则相同,以便更精准地定位关键词的分类信息。本申请实施例中使用的分词技术为pkuseg分词技术;句法改写是通过检测用户的问题语句中口语化的词汇,并将口语化的词汇改写成标准化词汇,使提问方式转换成比较统一标准的形式。例如:“如何做**”会改写成“**的实现方式”,“***有什么用”改写为“***的作用”等等。词汇替换包括标准词替换以及近义词替换。标准词替换,是通过建立了标准词表,每个标准词会映射一个或几个常见近似词语。例如:“开标”和“竞标”都会对应“投标”,“过程”、“步骤”、“程序”等都会对应“流程”等。近义词替换,原理和上述标准词替换基本一致,替换时将专有名词的简称或英文,替换为中文的专有名词,例如:“2g”对应“政府事业中心”。经过分词和改写后的问题语句的分词组合,主要会保留问句语句中具备实体意义的特征词语,包括名词、动词类的词汇,以通过这些特征词汇确定问题语句中关键词的分类信息,比如,根据特征词汇在关键词词典中查找其对应的类别标注信息,得到问题语句中关键词的分类信息,以便精准查找知识树结构上的节点。
参照图4,所述判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点的步骤S3,包括:
S31:获取所述知识树各节点分别对应的关键词表,以及各所述关键词表分别对应的分类信息,得到所述知识树对应的分类信息集合;
S32:判断所述关键词的分类信息是否包含于所述分类信息集合中;
S33:若是,则判定根据所述关键词的分类信息,能在知识树上查找到与所述关键词的分类信息匹配的节点;
S34:根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点。
本申请实施例中,每个节点对应关联一个关键词表,关键词表中存储有代表该节点上的知识内容的词汇,比如,该节点上的知识内容为投标内容,则此节点的关键词表中包括的词汇为:竞标、投标、招标、对标、标书等,该关键词表对应的分类信息为金融招标类。本申请知识树的节点,根据节点对应的关键词表的不同,节点对应的分类信息也不同,通过汇总所有节点分别对应的分类信息,组成知识树对应的分类信息集合。若关键词的分类信息包含于分类信息集合中,说明可通过关键词的匹配确定问题问句的节点。
参照图5,所述根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点的步骤S34,包括:
S341:获取指定节点对应的指定关键词表中所有词汇对应的词汇权重;
S342:根据所述词汇权重,计算所述指定节点与所述关键词的匹配值;
S343:按照所述指定节点与所述关键词的匹配值的计算过程,计算所述知识树中所有节点分别与所述关键词的匹配值;
S344:将最大匹配值对应节点,作为与所述关键词匹配的节点。
本申请实施例中,各节点分别对应的关键词表中的词汇具有不同权重,词汇特征越强的其词汇权重越高。问题语句的关键词和各节点分别对应的关键词表中的词汇,分别计算问题语句的关键词与各节点的关键词表的匹配值,根据匹配值的大小进行排序,将匹配值最大的节点作为问题语句的答案节点,将答案节点对应的知识内容作为问题语句的答案,其他匹配值的节点的知识内容将不会呈现在答案中。本申请实施例中关键词表中的词汇权重,通过设置了三种词汇等级以及三种词汇等级分别对应的权重范围,实现了词汇权重匹配。上述三种词汇等级中,第一种是主题词,能够直接反应用户问题关注点的词语,例如:红牌、黄牌、三函、背靠背等;第二种是非主题词,例如:定义、流程、临时、区别等通用型词语;第三种是其他词,例如:企业、设备、条款等中性词。主题词权重最高、非主题词权重最低,其他词权重居中。
参照图6,所述对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息的步骤S4,包括:
S41:提取所述问题语句的语义特征;
S42:将所述问题语句的语义特征输入文本分类神经网络,得到所述问题语句对应的粗粒度信息分类;
S43:根据所述粗粒度信息分类确定所述问题语句对应的关注点信息。
本申请实施例中,通过Bert模型提取问题语句的语义特征,然后将提取的语义特征输入到文本分类神经网络,得到粗粒度信息分类。本申请的文本分类神经网络为基于粗粒度标注数据训练得到的模型。通过Bert模型,获取问题语句的句向量值,作为问题语句的语义特征,然后将句向量值输入文本分类神经网络的全连接层得到问题语句的提问类别,确定问题语句的提问类别属于哪个类型,即得到用户的关注点信息,选择知识树中对应的节点结构进行知识节点搜索。比如关注点信息为“流程”,则选择节点属性为流程的节点结构进行搜索。
参照图7,所述根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点的步骤S5,包括:
S51:将所述关注点信息分别与所述知识树的各节点的节点属性一一对比,分别得到所述问题语句与各节点的匹配值;
S52:将最大匹配值对应的节点,作为所述知识树上与所述问题语句匹配的节点。
本申请结合对问题语句进行语义特征分析,得到问题语句对应的关注点信息,通过将关注点信息和节点属性对比,确定更贴切的节点知识,作为问题答案。本申请可以将关键词搜索和意图识别相结合,优化关键词搜索结果,使其搜索结果可以从多选一改进到三选一、二选一甚至是直接给出精确回答。此外将关键词搜索和意图识别相结合,答案的正确率更高,或者即便答不出,也能给出明确提示,相比于完全依赖深度神经网络的智能问答,智能问答更精准更高效。
本申请的智能问答系统,无需做过多的数据准备,仅需要将垂直领域内的知识材料,编辑成特有的知识树结构,在该垂直领域范围内可以达到较好智能问答体验。本申请其他实施例中,当用户对智能问答系统输入需提问的问题语句时,也可以直接对问题语句进行粗粒度的意图识别,以获得意图分析结果,并根据意图分析结果去匹配答案,省略关键词分类匹配的过程,以节省智能问答的处理流程,提高反馈效率。
参照图8,所述根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答的步骤S6,包括:
S61:判断所述答案节点是否存在关联的子节点;
S62:若是,则获取所述子节点的知识内容;
S63:将所述答案节点对应的知识内容作为回应所述问题语句的答案,将所述子节点的知识内容作为智能问答中的知识引导;
S64:将所述问题语句的答案和所述知识引导同步反馈至所述用户对应的终端。
本申请实施例中,若匹配到的答案节点存在子节点,则认为匹配到的答案节点包括多个,比如包括图2中的节点1、节点1-1和节点1-2,根据同路径知识节点,根节点优先的原则,答案节点中只会保留节点1。1-1节点与1-2节点会以知识引导的方式展现,不会直接保留在答案中。本申请知识树的结构中存储了知识节点的关联关系,从而具备较好的知识引导和知识联想能力,当用户提问的问题语句得到确定答案后,不仅可以提供当前答案节点的知识内容作为问题语句的答案,同时可以将相关的知识节点推出,尤其在多分叉流程上,本申请的智能问答系统具备很好的知识引导效果。
参照图9,所述获取用户提出的问题语句的步骤S1,包括:
S11:获取用户输入的输入语句;
S12:将所述输入语句输入Bert模型,获取所述输入语句中每个字对应的预测值;
S13:根据指定字对应的预测值,判断所述指定字是否为错别字,其中,所述指定字为所述输入语句中所有字中的任意一个;
S14:若是,获取所述指定字对应的拼音;
S15:根据所述指定字对应的拼音,确定拼音相似度最高的候选字,作为所述指定字的校正字;
S16:将所述输入语句中所有的错别字校正后,得到所述用户提出的问题语句。
本申请通过对用户输入语句进行错别字校正,以提高关键词分类或确定用户关注点信息的准确性,比如在语义特征提取,以及通过文本分类神经网络得出用户的关注点信息的过程中,通过对文字进行错误识别与校正,以提高分类的精准度。本申请的错别字校正过程如下:将用户的输入语句输入Bert模型,以获取输入语句中每个字对应的三个或更多个预测值,如果所有预测值都一样,则为正确字,否则判定为错别字。如果是错别字,则通过对预测值对应的原字进行拼音相似度匹配,选择拼音相似度最高的候选字作为校正后的正确字。
参照图10,本申请一实施例的智能问答的装置,包括:
获取模块1,用于获取用户提出的问题语句。
可通过语音接收系统或文本接收系统,获取用户提出的问题,并保存问题对应的语句。
提取模块2,用于提取所述问题语句中对应的关键词,并获取所述关键词的分类信息。
通过对问题语句进行去停用词后,保留问题语句的关键词,然后根据关键词在关键词词典中查找对应的类别标注信息,得到关键词的分类信息。问题语句中普遍存在一些无实际意义的词,例如:“什么”、“吗”、“的”等等之类的助词或副词,称为停用词。停用词其本身对分类算法的精度没有影响,但是如果大量存在会严重影响计算速度,因此会预先删去停用词。
判断模块3,用于判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点。
本申请的知识树的结构如2所示,由一个根节点引出,并按照该知识结构体系依次建立各个节点。每个节点具备固定的元素,包括:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点。构建上述知识树的结构,通过遍历知识材料,查找知识点内容,并按照知识结构生成每个知识点内容分别对应的节点,无需设计、编辑和构建复杂的传统图数据库,对仅具有少量数据的领域,应用效果非常好。
基于问题语句的关键词和各节点分别对应的关键词表,利用关键词搜索算法进行节点匹配,以确定知识树上与问题语句对应的节点,并把该节点的知识作为问题语句的答案。
意图识别模块4,用于若不能在知识树上查找到与所述关键词的分类信息匹配的节点,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息。
本申请的意图识别过程,基于Bert模型对问题语句进行语义特征提取,并通过文本分类神经网络得出用户的关注点信息。基于Bert模型对问题语句进行语义特征提取,仅使用粗粒度的信息分类,不仅初期的人工标注工作量不高,而且既能获取用户意图又不会过度依赖文本分类神经网络的可能性结果。例如:问题语句为“投标的流程是怎么样的?”或者“如何进行投标?”,基于Bert模型对问题语句进行语义特征提取,并通过文本分类神经网络得出用户的关注点信息为:“流程”或者“如何进行”。
确定模块5,用于根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点。
根据上述获取的关注点信息,与每个节点的节点属性对比,保留两者一致的节点。
作为模块6,用于根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
本申请通过建立结构简单的知识树,知识树由一个根节点引出,并根据知识结构的关联关系,依次建立与根节点相连的子节点以及叶子节点,每个节点具备固定的元素:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点,可根据用户提出的问题语句,确定问题语句中的关键词分类信息或用户的关注点信息,然后匹配知识树中对应的节点,作为问题语句的答案对应的答案节点,并将答案节点对应的知识内容回复至用户,实现数据量偏少或极小的特殊领域的智能问答。
进一步地,提取模块2,包括:
分词单元,用于对所述问题语句分词,得到所述问题语句对应的分词组合;
得到单元,用于对所述分词组合进行去停用词,得到第一修正分词组合;
第一判断单元,用于判断所述第一修正分词组合中,是否存在与预设关键词词典的用语规则不同的指定词汇;
替换单元,用于若存在与预设关键词词典的用语规则不同的指定词汇,则将所述指定词汇一一对应替换为与所述指定词汇对应的标准化词汇,得到第二修正分词组合,其中,所述标准化词汇包含于所述关键词词典中;
第一提取单元,用于提取所述第二修正分词组合中指定词性对应的特征词汇,作为所述关键词;
第一确定单元,用于在所述关键词词典中确定所述关键词对应的分类信息。
本申请在提取问题语句的关键词时,会对问题语句进行分词、句法改写和词汇替换。包括将大小写统一成预设的统一格式、专业用语的标准化替换、近义词替换等,使问题语句的关键词与关键词词典中的用语规则相同,以便更精准地定位关键词的分类信息。本申请实施例中使用的分词技术为pkuseg分词技术;句法改写是通过检测用户的问题语句中口语化的词汇,并将口语化的词汇改写成标准化词汇,使提问方式转换成比较统一标准的形式。例如:“如何做**”会改写成“**的实现方式”,“***有什么用”改写为“***的作用”等等。词汇替换包括标准词替换以及近义词替换。标准词替换,是通过建立了标准词表,每个标准词会映射一个或几个常见近似词语。例如:“开标”和“竞标”都会对应“投标”,“过程”、“步骤”、“程序”等都会对应“流程”等。近义词替换,原理和上述标准词替换基本一致,替换时将专有名词的简称或英文,替换为中文的专有名词,例如:“2g”对应“政府事业中心”。经过分词和改写后的问题语句的分词组合,主要会保留问句语句中具备实体意义的特征词语,包括名词、动词类的词汇,以通过这些特征词汇确定问题语句中关键词的分类信息,比如,根据特征词汇在关键词词典中查找其对应的类别标注信息,得到问题语句中关键词的分类信息,以便精准查找知识树结构上的节点。
进一步地,判断模块3,包括:
第一获取单元,用于获取所述知识树各节点分别对应的关键词表,以及各所述关键词表分别对应的分类信息,得到所述知识树对应的分类信息集合;
第二判断单元,用于判断所述关键词的分类信息是否包含于所述分类信息集合中;
判定单元,用于若包含于所述分类信息集合中,则判定根据所述关键词的分类信息,能在知识树上查找到与所述关键词的分类信息匹配的节点;
第二确定单元,用于根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点。
本申请实施例中,每个节点对应关联一个关键词表,关键词表中存储有代表该节点上的知识内容的词汇,比如,该节点上的知识内容为投标内容,则此节点的关键词表中包括的词汇为:竞标、投标、招标、对标、标书等,该关键词表对应的分类信息为金融招标类。本申请知识树的节点,根据节点对应的关键词表的不同,节点对应的分类信息也不同,通过汇总所有节点分别对应的分类信息,组成知识树对应的分类信息集合。若关键词的分类信息包含于分类信息集合中,说明可通过关键词的匹配确定问题问句的节点。
进一步地,第二确定单元,包括:
获取子单元,用于获取指定节点对应的指定关键词表中所有词汇对应的词汇权重;
第一计算子单元,用于根据所述词汇权重,计算所述指定节点与所述关键词的匹配值;
第二计算子单元,用于按照所述指定节点与所述关键词的匹配值的计算过程,计算所述知识树中所有节点分别与所述关键词的匹配值;
作为子单元,用于将最大匹配值对应节点,作为与所述关键词匹配的节点。
本申请实施例中,各节点分别对应的关键词表中的词汇具有不同权重,词汇特征越强的其词汇权重越高。问题语句的关键词和各节点分别对应的关键词表中的词汇,分别计算问题语句的关键词与各节点的关键词表的匹配值,根据匹配值的大小进行排序,将匹配值最大的节点作为问题语句的答案节点,将答案节点对应的知识内容作为问题语句的答案,其他匹配值的节点的知识内容将不会呈现在答案中。本申请实施例中关键词表中的词汇权重,通过设置了三种词汇等级以及三种词汇等级分别对应的权重范围,实现了词汇权重匹配。上述三种词汇等级中,第一种是主题词,能够直接反应用户问题关注点的词语,例如:红牌、黄牌、三函、背靠背等;第二种是非主题词,例如:定义、流程、临时、区别等通用型词语;第三种是其他词,例如:企业、设备、条款等中性词。主题词权重最高、非主题词权重最低,其他词权重居中。
进一步地,意图识别模块4,包括:
第二提取单元,用于提取所述问题语句的语义特征;
输入单元,用于将所述问题语句的语义特征输入文本分类神经网络,得到所述问题语句对应的粗粒度信息分类;
第三确定单元,用于根据所述粗粒度信息分类确定所述问题语句对应的关注点信息。
本申请实施例中,通过Bert模型提取问题语句的语义特征,然后将提取的语义特征输入到文本分类神经网络,得到粗粒度信息分类。本申请的文本分类神经网络为基于粗粒度标注数据训练得到的模型。通过Bert模型,获取问题语句的句向量值,作为问题语句的语义特征,然后将句向量值输入文本分类神经网络的全连接层得到问题语句的提问类别,确定问题语句的提问类别属于哪个类型,即得到用户的关注点信息,选择知识树中对应的节点结构进行知识节点搜索。比如关注点信息为“流程”,则选择节点属性为流程的节点结构进行搜索。
进一步地,确定模块5,包括:
对比单元,用于将所述关注点信息分别与所述知识树的各节点的节点属性一一对比,分别得到所述问题语句与各节点的匹配值;
第一作为单元,用于将最大匹配值对应的节点,作为所述知识树上与所述问题语句匹配的节点。
本申请结合对问题语句进行语义特征分析,得到问题语句对应的关注点信息,通过将关注点信息和节点属性对比,确定更贴切的节点知识,作为问题答案。本申请可以将关键词搜索和意图识别相结合,优化关键词搜索结果,使其搜索结果可以从多选一改进到三选一、二选一甚至是直接给出精确回答。此外将关键词搜索和意图识别相结合,答案的正确率更高,或者即便答不出,也能给出明确提示,相比于完全依赖深度神经网络的智能问答,智能问答更精准更高效。
本申请的智能问答系统,无需做过多的数据准备,仅需要将垂直领域内的知识材料,编辑成特有的知识树结构,在该垂直领域范围内可以达到较好智能问答体验。本申请其他实施例中,当用户对智能问答系统输入需提问的问题语句时,也可以直接对问题语句进行粗粒度的意图识别,以获得意图分析结果,并根据意图分析结果去匹配答案,省略关键词分类匹配的过程,以节省智能问答的处理流程,提高反馈效率。
进一步地,作为模块6,包括:
第三判断单元,用于判断所述答案节点是否存在关联的子节点;
第二获取单元,用于若存在关联的子节点,则获取所述子节点的知识内容;
第二作为单元,用于将所述答案节点对应的知识内容作为回应所述问题语句的答案,将所述子节点的知识内容作为智能问答中的知识引导;
反馈单元,用于将所述问题语句的答案和所述知识引导同步反馈至所述用户对应的终端。
本申请实施例中,若匹配到的答案节点存在子节点,则认为匹配到的答案节点包括多个,比如包括图2中的节点1、节点1-1和节点1-2,根据同路径知识节点,根节点优先的原则,答案节点中只会保留节点1。1-1节点与1-2节点会以知识引导的方式展现,不会直接保留在答案中。本申请知识树的结构中存储了知识节点的关联关系,从而具备较好的知识引导和知识联想能力,当用户提问的问题语句得到确定答案后,不仅可以提供当前答案节点的知识内容作为问题语句的答案,同时可以将相关的知识节点推出,尤其在多分叉流程上,本申请的智能问答系统具备很好的知识引导效果。
进一步地,获取模块1,包括:
第三获取单元,用于获取用户输入的输入语句;
第四获取单元,用于将所述输入语句输入Bert模型,获取所述输入语句中每个字对应的预测值;
第四判断单元,用于根据指定字对应的预测值,判断所述指定字是否为错别字,其中,所述指定字为所述输入语句中所有字中的任意一个;
第五获取单元,用于若为错别字,获取所述指定字对应的拼音;
第四确定单元,用于根据所述指定字对应的拼音,确定拼音相似度最高的候选字,作为所述指定字的校正字;
校正单元,用于将所述输入语句中所有的错别字校正后,得到所述用户提出的问题语句。
本申请通过对用户输入语句进行错别字校正,以提高关键词分类或确定用户关注点信息的准确性,比如在语义特征提取,以及通过文本分类神经网络得出用户的关注点信息的过程中,通过对文字进行错误识别与校正,以提高分类的精准度。本申请的错别字校正过程如下:将用户的输入语句输入Bert模型,以获取输入语句中每个字对应的三个或更多个预测值,如果所有预测值都一样,则为正确字,否则判定为错别字。如果是错别字,则通过对预测值对应的原字进行拼音相似度匹配,选择拼音相似度最高的候选字作为校正后的正确字。
参照图11,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储智能问答的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现智能问答的方法。
上述处理器执行上述智能问答的方法,包括:获取用户提出的问题语句;提取所述问题语句中对应的关键词,并获取所述关键词的分类信息;判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点;若否,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息;根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点;根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
上述计算机设备,通过建立结构简单的知识树,知识树由一个根节点引出,并根据知识结构的关联关系,依次建立与根节点相连的子节点以及叶子节点,每个节点具备固定的元素:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点,可根据用户提出的问题语句,确定问题语句中的关键词分类信息或用户的关注点信息,然后匹配知识树中对应的节点,作为问题语句的答案对应的答案节点,并将答案节点对应的知识内容回复至用户,实现数据量偏少或极小的特殊领域的智能问答。
在一个实施例中,上述处理器提取所述问题语句中对应的关键词,并获取所述关键词的分类信息的步骤,包括:对所述问题语句去停用词后进行分词,得到所述问题语句对应的分词组合;判断所述分词组合中,是否存在与预设关键词词典的用语规则不同的指定词汇;若是,则将所述指定词汇一一对应替换为与所述指定词汇对应的标准化词汇,得到修正分词组合,其中,所述标准化词汇包含于所述关键词词典中;提取所述修正分词组合中指定词性对应的特征词汇,作为所述关键词;在所述关键词词典中确定所述关键词对应的分类信息。
在一个实施例中,上述处理器判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点的步骤,包括:获取所述知识树的各节点分别对应的关键词表,以及各所述关键词表分别对应的分类信息,得到所述知识树对应的分类信息集合;判断所述关键词的分类信息是否包含于所述分类信息集合中;若是,则判定根据所述关键词的分类信息,能在所述知识树上查找到与所述关键词的分类信息匹配的节点;根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点。
在一个实施例中,上述处理器根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点的步骤,包括:获取指定节点对应的指定关键词表中所有词汇对应的词汇权重,其中,所述指定节点为所述知识树中所有节点中的任意一个;根据所述词汇权重,计算所述指定节点与所述关键词的匹配值;按照所述指定节点与所述关键词的匹配值的计算过程,分别计算所述知识树中所有节点与所述关键词的匹配值;将所述匹配值最大时对应的节点,作为与所述关键词匹配的节点。
在一个实施例中,上述处理器对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息的步骤,包括:提取所述问题语句的语义特征;将所述问题语句的语义特征输入文本分类神经网络,得到所述问题语句对应的粗粒度信息分类;根据所述粗粒度信息分类确定所述问题语句对应的关注点信息。
在一个实施例中,上述处理器根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答的步骤,包括:判断所述答案节点是否存在关联的子节点;若是,则获取所述子节点的知识内容;将所述答案节点对应的知识内容作为回应所述问题语句的答案,将所述子节点的知识内容作为智能问答中的知识引导;将所述问题语句的答案和所述知识引导同步反馈至所述用户对应的终端。
在一个实施例中,上述处理器获取用户提出的问题语句的步骤,包括:获取用户输入的输入语句;将所述输入语句输入Bert模型,获取所述输入语句中每个字对应的预测值;根据指定字对应的预测值,判断所述指定字是否为错别字,其中,所述指定字为所述输入语句中所有字中的任意一个;若是,获取所述指定字对应的拼音;根据所述指定字对应的拼音,确定拼音相似度最高的候选字,作为所述指定字的校正字;将所述输入语句中所有的错别字校正后,得到所述用户提出的问题语句。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现智能问答的方法,包括:获取用户提出的问题语句;提取所述问题语句中对应的关键词,并获取所述关键词的分类信息;判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点;若否,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息;根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点;根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
上述计算机可读存储介质,通过建立结构简单的知识树,知识树由一个根节点引出,并根据知识结构的关联关系,依次建立与根节点相连的子节点以及叶子节点,每个节点具备固定的元素:节点位置、节点描述、节点关键词、节点属性(例如:定义、流程、方法等)、节点的子节点,可根据用户提出的问题语句,确定问题语句中的关键词分类信息或用户的关注点信息,然后匹配知识树中对应的节点,作为问题语句的答案对应的答案节点,并将答案节点对应的知识内容回复至用户,实现数据量偏少或极小的特殊领域的智能问答。
在一个实施例中,上述处理器提取所述问题语句中对应的关键词,并获取所述关键词的分类信息的步骤,包括:对所述问题语句去停用词后进行分词,得到所述问题语句对应的分词组合;判断所述分词组合中,是否存在与预设关键词词典的用语规则不同的指定词汇;若是,则将所述指定词汇一一对应替换为与所述指定词汇对应的标准化词汇,得到修正分词组合,其中,所述标准化词汇包含于所述关键词词典中;提取所述修正分词组合中指定词性对应的特征词汇,作为所述关键词;在所述关键词词典中确定所述关键词对应的分类信息。
在一个实施例中,上述处理器判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点的步骤,包括:获取所述知识树的各节点分别对应的关键词表,以及各所述关键词表分别对应的分类信息,得到所述知识树对应的分类信息集合;判断所述关键词的分类信息是否包含于所述分类信息集合中;若是,则判定根据所述关键词的分类信息,能在所述知识树上查找到与所述关键词的分类信息匹配的节点;根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点。
在一个实施例中,上述处理器根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点的步骤,包括:获取指定节点对应的指定关键词表中所有词汇对应的词汇权重,其中,所述指定节点为所述知识树中所有节点中的任意一个;根据所述词汇权重,计算所述指定节点与所述关键词的匹配值;按照所述指定节点与所述关键词的匹配值的计算过程,分别计算所述知识树中所有节点与所述关键词的匹配值;将所述匹配值最大时对应的节点,作为与所述关键词匹配的节点。
在一个实施例中,上述处理器对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息的步骤,包括:提取所述问题语句的语义特征;将所述问题语句的语义特征输入文本分类神经网络,得到所述问题语句对应的粗粒度信息分类;根据所述粗粒度信息分类确定所述问题语句对应的关注点信息。
在一个实施例中,上述处理器根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答的步骤,包括:判断所述答案节点是否存在关联的子节点;若是,则获取所述子节点的知识内容;将所述答案节点对应的知识内容作为回应所述问题语句的答案,将所述子节点的知识内容作为智能问答中的知识引导;将所述问题语句的答案和所述知识引导同步反馈至所述用户对应的终端。
在一个实施例中,上述处理器获取用户提出的问题语句的步骤,包括:获取用户输入的输入语句;将所述输入语句输入Bert模型,获取所述输入语句中每个字对应的预测值;根据指定字对应的预测值,判断所述指定字是否为错别字,其中,所述指定字为所述输入语句中所有字中的任意一个;若是,获取所述指定字对应的拼音;根据所述指定字对应的拼音,确定拼音相似度最高的候选字,作为所述指定字的校正字;将所述输入语句中所有的错别字校正后,得到所述用户提出的问题语句。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种智能问答的方法,其特征在于,包括:
获取用户提出的问题语句;
提取所述问题语句中对应的关键词,并获取所述关键词的分类信息;
判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点;
若否,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息;
根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点;
根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
2.根据权利要求1所述的智能问答的方法,其特征在于,所述提取所述问题语句中对应的关键词,并获取所述关键词的分类信息的步骤,包括:
对所述问题语句去停用词后进行分词,得到所述问题语句对应的分词组合;
判断所述分词组合中,是否存在与预设关键词词典的用语规则不同的指定词汇;
若是,则将所述指定词汇一一对应替换为与所述指定词汇对应的标准化词汇,得到修正分词组合,其中,所述标准化词汇包含于所述关键词词典中;
提取所述修正分词组合中指定词性对应的特征词汇,作为所述关键词;
在所述关键词词典中确定所述关键词对应的分类信息。
3.根据权利要求1所述的智能问答的方法,其特征在于,所述判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点的步骤,包括:
获取所述知识树的各节点分别对应的关键词表,以及各所述关键词表分别对应的分类信息,得到所述知识树对应的分类信息集合;
判断所述关键词的分类信息是否包含于所述分类信息集合中;
若是,则判定根据所述关键词的分类信息,能在所述知识树上查找到与所述关键词的分类信息匹配的节点;
根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点。
4.根据权利要求3所述的智能问答的方法,其特征在于,所述根据关键词搜索算法,确定与所述关键词的分类信息匹配的节点的步骤,包括:
获取指定节点对应的指定关键词表中所有词汇对应的词汇权重,其中,所述指定节点为所述知识树中所有节点中的任意一个;
根据所述词汇权重,计算所述指定节点与所述关键词的匹配值;
按照所述指定节点与所述关键词的匹配值的计算过程,分别计算所述知识树中所有节点与所述关键词的匹配值;
将所述匹配值最大时对应的节点,作为与所述关键词匹配的节点。
5.根据权利要求1所述的智能问答的方法,其特征在于,所述对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息的步骤,包括:
提取所述问题语句的语义特征;
将所述问题语句的语义特征输入文本分类神经网络,得到所述问题语句对应的粗粒度信息分类;
根据所述粗粒度信息分类确定所述问题语句对应的关注点信息。
6.根据权利要求1所述的智能问答的方法,其特征在于,所述根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答的步骤,包括:
判断所述答案节点是否存在关联的子节点;
若是,则获取所述子节点的知识内容;
将所述答案节点对应的知识内容作为回应所述问题语句的答案,将所述子节点的知识内容作为智能问答中的知识引导;
将所述问题语句的答案和所述知识引导同步反馈至所述用户对应的终端。
7.根据权利要求1所述的智能问答的方法,其特征在于,所述获取用户提出的问题语句的步骤,包括:
获取用户输入的输入语句;
将所述输入语句输入Bert模型,获取所述输入语句中每个字对应的预测值;
根据指定字对应的预测值,判断所述指定字是否为错别字,其中,所述指定字为所述输入语句中所有字中的任意一个;
若是,获取所述指定字对应的拼音;
根据所述指定字对应的拼音,确定拼音相似度最高的候选字,作为所述指定字的校正字;
将所述输入语句中所有的错别字校正后,得到所述用户提出的问题语句。
8.一种智能问答的装置,其特征在于,包括:
获取模块,用于获取用户提出的问题语句;
提取模块,用于提取所述问题语句中对应的关键词,并获取所述关键词的分类信息;
判断模块,用于判断根据所述关键词的分类信息,是否能在知识树上查找到与所述关键词的分类信息匹配的节点;
意图识别模块,用于若不能在知识树上查找到与所述关键词的分类信息匹配的节点,则对所述问题语句进行意图识别,得到所述问题语句对应的关注点信息;
确定模块,用于根据所述问题语句对应的关注点信息,确定所述知识树上与所述问题语句匹配的节点;
作为模块,用于根据所述知识树上与所述问题语句匹配的节点,作为答案节点进行智能问答。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969745.4A CN112052324A (zh) | 2020-09-15 | 2020-09-15 | 智能问答的方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969745.4A CN112052324A (zh) | 2020-09-15 | 2020-09-15 | 智能问答的方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112052324A true CN112052324A (zh) | 2020-12-08 |
Family
ID=73604196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010969745.4A Pending CN112052324A (zh) | 2020-09-15 | 2020-09-15 | 智能问答的方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052324A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667789A (zh) * | 2020-12-17 | 2021-04-16 | 中国平安人寿保险股份有限公司 | 用户意图匹配方法装置、终端设备及存储介质 |
CN112966119A (zh) * | 2021-02-25 | 2021-06-15 | 青岛海信网络科技股份有限公司 | 一种信息获取方法、设备及介质 |
CN113076466A (zh) * | 2021-02-26 | 2021-07-06 | 广东电网有限责任公司广州供电局 | 一种最佳答案和兴趣感知推荐方法 |
CN113157868A (zh) * | 2021-04-29 | 2021-07-23 | 青岛海信网络科技股份有限公司 | 一种基于结构化数据库匹配问题答案的方法及装置 |
CN113420130A (zh) * | 2021-05-12 | 2021-09-21 | 同方知网数字出版技术股份有限公司 | 一种基于政务问答系统的意图识别算法 |
CN113918729A (zh) * | 2021-10-08 | 2022-01-11 | 肇庆学院 | 一种基于知识树的任务协同方法及系统 |
CN114756663A (zh) * | 2022-03-29 | 2022-07-15 | 税友信息技术有限公司 | 一种智能问答方法、系统、设备及计算机可读存储介质 |
CN114911915A (zh) * | 2022-05-27 | 2022-08-16 | 重庆长安汽车股份有限公司 | 一种基于知识图谱的问答搜索方法、系统、设备和介质 |
CN115934921A (zh) * | 2023-03-03 | 2023-04-07 | 北京远鉴信息技术有限公司 | 一种任务式回答的确定方法、装置、电子设备及存储介质 |
CN116680368A (zh) * | 2023-04-11 | 2023-09-01 | 浪潮智慧科技有限公司 | 一种基于贝叶斯分类器的水利知识问答方法、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977415A (zh) * | 2017-11-22 | 2018-05-01 | 北京寻领科技有限公司 | 自动问答方法及装置 |
CN110750632A (zh) * | 2019-10-21 | 2020-02-04 | 闽江学院 | 一种改进的中文alice智能问答方法及系统 |
CN110968776A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 政策知识的推荐方法、装置存储介质及处理器 |
CN111428010A (zh) * | 2019-01-10 | 2020-07-17 | 北京京东尚科信息技术有限公司 | 人机智能问答的方法和装置 |
-
2020
- 2020-09-15 CN CN202010969745.4A patent/CN112052324A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977415A (zh) * | 2017-11-22 | 2018-05-01 | 北京寻领科技有限公司 | 自动问答方法及装置 |
CN110968776A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 政策知识的推荐方法、装置存储介质及处理器 |
CN111428010A (zh) * | 2019-01-10 | 2020-07-17 | 北京京东尚科信息技术有限公司 | 人机智能问答的方法和装置 |
CN110750632A (zh) * | 2019-10-21 | 2020-02-04 | 闽江学院 | 一种改进的中文alice智能问答方法及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667789A (zh) * | 2020-12-17 | 2021-04-16 | 中国平安人寿保险股份有限公司 | 用户意图匹配方法装置、终端设备及存储介质 |
CN112966119A (zh) * | 2021-02-25 | 2021-06-15 | 青岛海信网络科技股份有限公司 | 一种信息获取方法、设备及介质 |
CN112966119B (zh) * | 2021-02-25 | 2022-11-25 | 青岛海信网络科技股份有限公司 | 一种信息获取方法、设备及介质 |
CN113076466A (zh) * | 2021-02-26 | 2021-07-06 | 广东电网有限责任公司广州供电局 | 一种最佳答案和兴趣感知推荐方法 |
CN113076466B (zh) * | 2021-02-26 | 2024-05-24 | 广东电网有限责任公司广州供电局 | 一种最佳答案和兴趣感知推荐方法 |
CN113157868A (zh) * | 2021-04-29 | 2021-07-23 | 青岛海信网络科技股份有限公司 | 一种基于结构化数据库匹配问题答案的方法及装置 |
CN113420130A (zh) * | 2021-05-12 | 2021-09-21 | 同方知网数字出版技术股份有限公司 | 一种基于政务问答系统的意图识别算法 |
CN113918729B (zh) * | 2021-10-08 | 2024-04-16 | 肇庆学院 | 一种基于知识树的任务协同方法及系统 |
CN113918729A (zh) * | 2021-10-08 | 2022-01-11 | 肇庆学院 | 一种基于知识树的任务协同方法及系统 |
CN114756663A (zh) * | 2022-03-29 | 2022-07-15 | 税友信息技术有限公司 | 一种智能问答方法、系统、设备及计算机可读存储介质 |
CN114911915A (zh) * | 2022-05-27 | 2022-08-16 | 重庆长安汽车股份有限公司 | 一种基于知识图谱的问答搜索方法、系统、设备和介质 |
CN115934921A (zh) * | 2023-03-03 | 2023-04-07 | 北京远鉴信息技术有限公司 | 一种任务式回答的确定方法、装置、电子设备及存储介质 |
CN116680368A (zh) * | 2023-04-11 | 2023-09-01 | 浪潮智慧科技有限公司 | 一种基于贝叶斯分类器的水利知识问答方法、设备及介质 |
CN116680368B (zh) * | 2023-04-11 | 2024-05-24 | 浪潮智慧科技有限公司 | 一种基于贝叶斯分类器的水利知识问答方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112052324A (zh) | 智能问答的方法、装置和计算机设备 | |
CN112069298B (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
CN109033305B (zh) | 问题回答方法、设备及计算机可读存储介质 | |
CN110727779A (zh) | 基于多模型融合的问答方法及系统 | |
CN110781276A (zh) | 文本抽取方法、装置、设备及存储介质 | |
CN109460459B (zh) | 一种基于日志学习的对话系统自动优化方法 | |
WO2020233386A1 (zh) | 基于aiml的智能问答方法、装置、计算机设备及存储介质 | |
CN108399157B (zh) | 实体与属性关系的动态抽取方法、服务器及可读存储介质 | |
CN111753545A (zh) | 嵌套实体识别方法、装置、电子设备和存储介质 | |
CN113821605B (zh) | 一种事件抽取方法 | |
CN112035675A (zh) | 医疗文本标注方法、装置、设备及存储介质 | |
CN111563384A (zh) | 面向电商产品的评价对象识别方法、装置及存储介质 | |
CN112380848B (zh) | 文本生成方法、装置、设备及存储介质 | |
CN110929498A (zh) | 一种短文本相似度的计算方法及装置、可读存储介质 | |
CN111143531A (zh) | 一种问答对构建方法、系统、装置及计算机可读存储介质 | |
CN110795942B (zh) | 基于语义识别的关键词确定方法、装置和存储介质 | |
CN109992651B (zh) | 一种问题目标特征自动识别和抽取方法 | |
CN117828024A (zh) | 一种插件检索方法、装置、存储介质及设备 | |
CN113157887A (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN110750967B (zh) | 一种发音的标注方法、装置、计算机设备和存储介质 | |
CN111859934A (zh) | 一种中文语句隐喻识别系统 | |
CN111611793B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113822052A (zh) | 一种文本错误检测方法、装置、电子设备及存储介质 | |
CN115881108A (zh) | 语音识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220524 Address after: 518000 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd. Address before: Room 12G, Block H, 666 Beijing East Road, Huangpu District, Shanghai 200000 Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd. |