CN113590790A - 应用于多轮问答的问题检索方法、装置、设备及介质 - Google Patents
应用于多轮问答的问题检索方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113590790A CN113590790A CN202110878293.3A CN202110878293A CN113590790A CN 113590790 A CN113590790 A CN 113590790A CN 202110878293 A CN202110878293 A CN 202110878293A CN 113590790 A CN113590790 A CN 113590790A
- Authority
- CN
- China
- Prior art keywords
- question
- user input
- characterization
- entity
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012512 characterization method Methods 0.000 claims abstract description 109
- 238000007781 pre-processing Methods 0.000 claims abstract description 59
- 239000013598 vector Substances 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本公开涉及一种应用于智能问答系统多轮问答的问题检索方法、装置、设备及介质。该方法包括:对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,利用预训练Bert模型对该实体进行表征;将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题。利用本公开,能够检索出与用户输入问题最接近的候选问题,大大提高了问题检索的准确性,有效解决了现有智能问答系统多轮问答存在的候选问题匹配不准确及答复多且答非所问的问题。
Description
技术领域
本公开涉及人工智能技术领域,尤其是一种应用于智能问答系统多轮问答的问题检索方法、装置、设备及介质。
背景技术
问答(Question Answering,QA)系统起源于图灵测试,随着时间的发展,问答系统领域也发生了重大变革。按照处理的数据格式不同,问答系统分别经历了结构化知识库阶段、无结构文本阶段、基于问题答案数据阶段。
近年来,随着大数据技术和人工智能技术的发展,智能问答系统也取得了很大的发展和进步,已经有很多智能问答系统产品问世,例如IBM研发的智能问答机器人Watson在美国智力竞赛节目中战胜了人类选手。苹果公司的Siri系统和微软公司的cortana分别在iPhone手机中和Windows10操作系统中都取得看很好的效果。
在国内,众多企业和研究团体也推出了很多以智能问答技术为核心的机器人。例如:微软公司的“小冰”、百度公司的“度秘”和中科汇联公司的“爱客服”等。这些产品涉及众多业务领域,如日常生活,医疗,交通,电子商务,旅游业,金融,教育等。
在保险领域,智能问答系统主要应用于客服系统,客服系统是保险行业中解决售前咨询、售后服务、业务扩展的主要方式之一。客服系统的好坏会直接影响公司业务转化和业绩的增长。当前保险行业内,客服系统主要有两种技术形态。第一种、通过技术方式构建人工在线客服服务平台,通过时时通讯的方式,依靠人工服务解决客户咨询问题,而客服人员则通过对内部知识库的查询得到相应客服答案进行问题解答;第二种、通过智能问答系统实现的自动化客服系统,通过对用户咨询内容进行分词或语义分析与知识库内容进行匹配,从而得到关联性较高的问题及答复。
用户在使用现有保险领域的问答系统时,经常会使用简单句子,并没有将每个问题的各种条件全部一次性描述清楚,当用户提出问题而没有得到满意的答复时,用户一般会添加新的限定条件进一步向问答系统提出问题,但是现有保险领域的问答系统大部分是基于单轮问答的问题检索式问答系统,只有面向任务型对话系统才会根据模板补充上下文信息,而问题检索式问答系统很少会有考虑用户输入问题的上文问题,不能将用户的当前问题与上文问题统一考虑检索出最接近的候选问题并给出合适的答复,进而导致检索出最接近的候选问题及答复的准确性低,极易出现候选问题及答复多且答非所问的问题。
发明内容
(一)要解决的技术问题
有鉴于此,本公开的主要目的在于提供一种应用于智能问答系统多轮问答的问题检索方法、装置、设备及介质,以提高问题检索的准确性。
(二)技术方案
本公开的第一方面,提供了一种应用于智能问答系统多轮问答的问题检索方法,包括:对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题。
在一些实施例中,所述对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征的步骤,包括:对用户输入问题进行分词处理、停用词处理、频繁词处理中的至少一种处理方式,将用户输入问题从句子处理为多个词语的组合;利用预训练Bert模型将用户输入问题中的各个词语分别转换成为一个N维向量,该N维向量即为该词语的词向量;再将同属于一个句子的多个词向量合成为一个句子向量。
在一些实施例中,所述对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征的步骤,包括:对用户输入问题的上文问题进行分词处理、停用词处理、频繁词处理中的至少一种处理方式,将用户输入问题的上文问题从句子处理为多个词语的组合;利用文本预处理结果从实体库中抽取与所述上文问题对应的实体;利用预训练Bert模型将该实体中的各个词语分别转换成为一个N维向量,该N维向量即为该词语的词向量;再将同属于一个对话的多个实体的多个词向量合成为一个向量。
在一些实施例中,所述利用文本预处理结果从实体库中抽取与所述上文问题对应的实体的步骤中,实体抽取时选择使用关键词要素抽取的方式抽取年龄、公司、产品、类型、支付方式的关键词。
在一些实施例中,所述将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征的步骤,包括:将对用户输入问题的初步表征与对该实体的表征进行合并,合并方式是根据句子时间与当前时间的差值生成表征因子,该差值越大表征因子越小,该差值越小表征因子越大,将表征因子与表征向量相乘即为实体针对问题的表征向量,将所述实体针对问题的表征向量直接相加,得到的结果即作为当前问题的表征。
在一些实施例中,所述基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题的步骤,包括:基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题,检索时选择当前问题表征向量与数据库中问题表征向量的夹角作为评级指标,夹角越小匹配度越高。
在一些实施例中,所述基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题之后,还包括:将与用户输入问题最接近的候选问题的回复作为最佳回复并输出。
在一些实施例中,所述将与用户输入问题最接近的候选问题的回复作为最佳回复并输出的步骤,包括:根据与用户输入问题最接近的候选问题,找到对应于该最接近的候选问题的回复;将对应于该最接近的候选问题的回复作为用户输入问题的最佳回复并输出。
本公开的另一方面,提供了一种应用于智能问答系统多轮问答的问题检索装置,包括:第一文本预处理模块,用于对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;第二文本预处理模块,用于对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;问题表征模块,用于将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;候选问题匹配模块,用于基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题。
本公开的又一方面,提供了一种应用于智能问答系统多轮问答的问题检索设备,包括:一个或多个处理器;存储器,其存储有计算机可执行程序,该程序在被所述处理器执行时,使得所述处理器实现所述的应用于智能问答系统多轮问答的问题检索方法。
本公开的再一方面,提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令被执行时实现所述的应用于智能问答系统多轮问答的问题检索方法。
本公开的再一方面,提供了一种计算机程序,包括:计算机可执行指令,所述指令被执行时用于实现所述的应用于智能问答系统多轮问答的问题检索方法。
(三)有益效果
从上述技术方案可以看出,本公开提供的应用于智能问答系统多轮问答的问题检索方法、装置、设备及介质,相对于现有技术具有以下有益效果:
本公开提供的应用于智能问答系统多轮问答的问题检索方法、装置、设备及介质,通过对用户输入问题及其上文问题分别进行预处理,对用户输入问题进行初步表征,并对与所述上文问题对应的实体进行表征,然后将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征,进而检索出与用户输入问题最接近的候选问题,大大提高了问题检索的准确性。
本公开提供的应用于智能问答系统多轮问答的问题检索方法、装置、设备及介质,通过将对用户输入问题的初步表征与对应于上文问题的实体进行的表征进行合并,作为当前问题的表征,进而检索出与用户输入问题最接近的候选问题,并将与该最接近的候选问题的回复作为最佳回复输出,使得每一个用户输入问题均能匹配到最佳回复,有效解决了现有智能问答系统存在的候选问题匹配不准确及答复多且答非所问的问题,提升了用户满意度。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1是依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法的流程图。
图2是依照本公开实施例的应用于智能问答系统多轮问答的问题检索装置的框图。
图3是依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法的示意图。
图4是依照本公开实施例的应用于智能问答系统多轮问答的问题检索设备的框图。
【附图标记】:
S1、S2、S3、S4:步骤
200:应用于智能问答系统多轮问答的问题检索装置
201:第一文本预处理模块
202:第二文本预处理模块
203:问题表征模块
204:候选问题匹配模块
S31、S32、S33、S34、S35:步骤
400:应用于智能问答系统多轮问答的问题检索设备
410:处理器
420:存储器
421:计算机程序
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
并且图中各部件的形状和尺寸不反映真实大小和比例,而仅示意本公开实施例的内容。另外,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。
再者,单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。说明书与权利要求书中所使用的序数例如“S1”、“S2”、“S3”等的用词,以修饰权利要求项的步骤,其本身并不意含及代表该请求步骤有任何之前的序数,也不代表某一请求步骤与另一请求步骤的顺序、或是制造方法上的顺序,这些序数的使用仅用来使具有某命名的一请求步骤得以和另一请求步骤能作出清楚区分。
针对现有技术中检索出正确问题的准确性低、极易出现候选问题匹配不准确及答复多且答非所问的问题,本公开的实施例对现有应用于智能问答系统的问题检索方法进行了改进,提供了图1所示的应用于智能问答系统多轮问答的问题检索方法。
本公开的实施例提供了一种应用于智能问答系统多轮问答的问题检索方法,如图1所示,图1是依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法的流程图。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他环境或场景。
如图1所示,根据本公开实施例的应用于智能问答系统多轮问答的问题检索方法,包括如下步骤:
步骤S1:对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;
在本步骤中,所述对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征的步骤,包括:
步骤S11:对用户输入问题进行分词处理、停用词处理、频繁词处理中的至少一种处理方式,将用户输入问题从句子处理为多个词语的组合;
步骤S12:利用预训练Bert模型将用户输入问题中的各个词语分别转换成为一个N维向量,该N维向量即为该词语的词向量;
步骤S13:再将同属于一个句子的多个词向量合成为一个句子向量。
步骤S2:对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;
在本步骤中,所述对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征的步骤,包括:
步骤S21:对用户输入问题的上文问题进行分词处理、停用词处理、频繁词处理中的至少一种处理方式,将用户输入问题的上文问题从句子处理为多个词语的组合;
步骤S22:利用文本预处理结果从实体库中抽取与所述上文问题对应的实体;
在本公开的一个实施例中,实体抽取时选择使用关键词要素抽取的方式抽取年龄、公司、产品、类型、支付方式的关键词,例如表1即为依照本公开的一个实施例的一个对话目标表格,该对话目标表格保存于实体库中,表1中的年龄、公司、产品、类型、支付方式等均为与所述上文问题对应的实体。
年龄范围: | 儿童、青年、老人等 |
产品公司: | 泰康、太平洋等 |
产品关键词: | 万能型、重疾等 |
类型: | 年金等 |
支付方式: | 一次性、分期等 |
定义: | 是、否 |
补充信息: | 名词、词库信息等。 |
表1
步骤S23:利用预训练Bert模型将该实体中的各个词语分别转换成为一个N维向量,该N维向量即为该词语的词向量;
步骤S24:再将同属于一个对话的多个实体的多个词向量合成为一个向量。
步骤S3:将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;
在本步骤中,所述将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征的步骤,包括:将对用户输入问题的初步表征与对该实体的表征进行合并,合并方式是根据句子时间与当前时间的差值生成表征因子,该差值越大表征因子越小,该差值越小表征因子越大,将表征因子与表征向量相乘即为实体针对问题的表征向量,将所述实体针对问题的表征向量直接相加,得到的结果即作为当前问题的表征。
步骤S4:基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题;
在本步骤中,所述基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题的步骤,包括:基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题,检索时选择当前问题表征向量与数据库中问题表征向量的夹角作为评级指标,夹角越小匹配度越高。
根据本公开的实施例,所述基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题之后,还包括:将与用户输入问题最接近的候选问题的回复作为最佳回复并输出。具体而言,是根据与用户输入问题最接近的候选问题,找到对应于该最接近的候选问题的回复;然后将对应于该最接近的候选问题的回复作为用户输入问题的最佳回复并输出。
图1所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法,对现有应用于智能问答系统的问题检索方法进行了有效地改进,通过对用户输入问题及其上文问题分别进行预处理,对用户输入问题进行初步表征,并对与所述上文问题对应的实体进行表征,然后将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征,进而检索出与用户输入问题最接近的候选问题,大大提高了问题检索的准确性。
同时,图1所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法,通过将对用户输入问题的初步表征与对应于上文问题的实体进行的表征进行合并,作为当前问题的表征,进而检索出与用户输入问题最接近的候选问题,并将与该最接近的候选问题的回复作为最佳回复输出,使得每一个用户输入问题均能匹配到最佳回复,有效解决了现有智能问答系统存在的候选问题匹配不准确及答复多且答非所问的问题,提升了用户满意度。
基于图1所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法的流程图,图2示意性示出了依照本公开实施例的应用于智能问答系统多轮问答的问题检索装置的框图。
如图2所示,本公开实施例提供的应用于智能问答系统多轮问答的问题检索装置200,包括第一文本预处理模块201、第二文本预处理模块202、问题表征模块203和候选问题匹配模块204,其中:第一文本预处理模块201用于对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;第二文本预处理模块202用于对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;问题表征模块203用于将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;候选问题匹配模块204用于基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题。
应当理解,第一文本预处理模块201、第二文本预处理模块202、问题表征模块203和候选问题匹配模块204可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。
根据本公开的实施例,第一文本预处理模块201、第二文本预处理模块202、问题表征模块203和候选问题匹配模块204中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,第一文本预处理模块201、第二文本预处理模块202、问题表征模块203和候选问题匹配模块204中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图2所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索装置的框图,对现有应用于智能问答系统的问题检索方法进行了有效地改进,通过对用户输入问题及其上文问题分别进行预处理,对用户输入问题进行初步表征,并对与所述上文问题对应的实体进行表征,然后将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征,进而检索出与用户输入问题最接近的候选问题,大大提高了问题检索的准确性。
同时,图2所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索装置的框图,通过将对用户输入问题的初步表征与对应于上文问题的实体进行的表征进行合并,作为当前问题的表征,进而检索出与用户输入问题最接近的候选问题,并将与该最接近的候选问题的回复作为最佳回复输出,使得每一个用户输入问题均能匹配到最佳回复,有效解决了现有智能问答系统存在的候选问题匹配不准确及答复多且答非所问的问题,提升了用户满意度。
基于图1所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法的流程图以及图2所示的依照本公开实施例的应用于智能问答系统多轮问答的问题检索装置的框图,图3示意性示出了依照本公开实施例的应用于智能问答系统多轮问答的问题检索方法的示意图。
如图3所示,本公开实施例提供的应用于智能问答系统多轮问答的问题检索方法,该方法首先对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;接着对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;然后将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;然后基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题;最后将与该最接近的候选问题的回复作为最佳回复输出,使得每一个用户输入问题均能匹配到最佳回复,有效解决了现有智能问答系统存在的候选问题匹配不准确及答复多且答非所问的问题,大大提高了问题检索的准确性,提升了用户满意度。
图3所示实施例的应用于智能问答系统多轮问答的问题检索方法,具体步骤如下:
S31:对用户输入问题进行文本预处理,包括但不限于分词、停用词处理、频繁词处理的,应用预训练Bert模型对用户输入问题进行初步表征;
S32:对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中提取与所述上文问题对应的实体,实体抽取时选择使用关键词要素抽取的方式抽取年龄、公司、产品、类型、支付方式的关键词,并对该实体选择步骤S31中同样的预训练模型进行表征;
S33:将对用户输入问题的初步表征与对该实体的表征进行合并,合并方式是根据句子时间与当前时间的差值生成表征因子,该差值越大表征因子越小,该差值越小表征因子越大,将表征因子与表征向量相乘即为实体针对问题的表征向量,将所述实体针对问题的表征向量直接相加,得到的结果即作为当前问题的表征;
S34:基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题,检索时选择当前问题与数据库中问题表征向量的夹角作为评级指标,夹角越小匹配度越高;
S35:将与用户输入问题最接近的候选问题的回复作为最佳回复并输出。
本公开实施例还提供了一种应用于智能问答系统多轮问答的问题检索设备,如图4所示,图4示意性示出了依照本公开实施例的应用于智能问答系统多轮问答的问题检索设备400的框图。该应用于智能问答系统多轮问答的问题检索设备400包括:一个或多个处理器410;存储器420,其存储有计算机可执行程序,该程序在被所述处理器410执行时,使得所述处理器410实现图1所示的应用于智能问答系统多轮问答的问题检索方法。
具体地,处理器410例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器410还可以包括用于缓存用途的板载存储器。处理器410可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
存储器420,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
存储器420可以包括计算机程序421,该计算机程序421可以包括代码/计算机可执行指令,其在由处理器410执行时使得处理器410执行根据本公开实施例的方法或其任何变形。
计算机程序421可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序421中的代码可以包括至少一个程序模块,例如包括模块421A、模块421B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器410执行时,使得处理器410可以执行根据本公开实施例的方法或其任何变形。
本公开实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的应用于智能问答系统多轮问答的问题检索方法。
根据本公开的实施例,计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
本公开还提供了一种计算机程序,该计算机程序包括:计算机可执行指令,所述指令被执行时用于实现根据本公开实施例的应用于智能问答系统多轮问答的问题检索方法。
至此,已经结合附图对本公开进行了详细描述。依据以上描述,本领域技术人员应当对本公开有了清楚的认识。
需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各元件的定义并不仅限于实施例中提到的各种具体结构、形状或方式,本领域普通技术人员可对其进行简单地更改或替换。
当然,根据实际需要,本公开还可以包含其他的部分,由于同本公开的创新之处无关,此处不再赘述。
类似地,应当理解,为了精简本公开并帮助理解各个公开方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,公开方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的单独实施例。
此外,在附图或说明书描述中,相似或相同的部分都使用相同的图号。说明书中示例的各个实施例中的技术特征在无冲突的前提下可以进行自由组合形成新的方案,另外每个权利要求可以单独作为一个实施例或者各个权利要求中的技术特征可以进行组合作为新的实施例。再者,附图中未绘示或描述的元件或实现方式,为所属技术领域中普通技术人员所知的形式。另外,虽然本文可提供包含特定值的参数的示范,但应了解,参数无需确切等于相应的值,而是可在可接受的误差容限或设计约束内近似于相应的值。
除非存在技术障碍或矛盾,本公开的上述各种实施方式可以自由组合以形成另外的实施例,这些另外的实施例均在本公开的保护范围中。
虽然结合附图对本公开进行了说明,但是附图中公开的实施例旨在对本公开优选实施方式进行示例性说明,而不能理解为对本公开的一种限制。附图中的尺寸比例仅仅是示意性的,并不能理解为对本公开的限制。
虽然本公开总体构思的一些实施例已被显示和说明,本领域普通技术人员将理解,在不背离本总体公开构思的原则和精神的情况下,可对这些实施例做出改变,本公开的范围以权利要求和它们的等同物限定。
以上所述的具体实施例,对本公开的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本公开的具体实施例而已,并不用于限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (12)
1.一种应用于智能问答系统多轮问答的问题检索方法,其特征在于,包括:
对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;
对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;
将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;以及
基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题。
2.根据权利要求1所述的应用于智能问答系统多轮问答的问题检索方法,其特征在于,所述对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征的步骤,包括:
对用户输入问题进行分词处理、停用词处理、频繁词处理中的至少一种处理方式,将用户输入问题从句子处理为多个词语的组合;
利用预训练Bert模型将用户输入问题中的各个词语分别转换成为一个N维向量,该N维向量即为该词语的词向量;
再将同属于一个句子的多个词向量合成为一个句子向量。
3.根据权利要求1所述的应用于智能问答系统多轮问答的问题检索方法,其特征在于,所述对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征的步骤,包括:
对用户输入问题的上文问题进行分词处理、停用词处理、频繁词处理中的至少一种处理方式,将用户输入问题的上文问题从句子处理为多个词语的组合;
利用文本预处理结果从实体库中抽取与所述上文问题对应的实体;
利用预训练Bert模型将该实体中的各个词语分别转换成为一个N维向量,该N维向量即为该词语的词向量;
再将同属于一个对话的多个实体的多个词向量合成为一个向量。
4.根据权利要求3所述的应用于智能问答系统多轮问答的问题检索方法,其特征在于,所述利用文本预处理结果从实体库中抽取与所述上文问题对应的实体的步骤中,实体抽取时选择使用关键词要素抽取的方式抽取年龄、公司、产品、类型、支付方式的关键词。
5.根据权利要求1所述的应用于智能问答系统多轮问答的问题检索方法,其特征在于,所述将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征的步骤,包括:
将对用户输入问题的初步表征与对该实体的表征进行合并,合并方式是根据句子时间与当前时间的差值生成表征因子,该差值越大表征因子越小,该差值越小表征因子越大,将表征因子与表征向量相乘即为实体针对问题的表征向量,将所述实体针对问题的表征向量直接相加,得到的结果即作为当前问题的表征。
6.根据权利要求1所述的应用于智能问答系统多轮问答的问题检索方法,其特征在于,所述基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题的步骤,包括:
基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题,检索时选择当前问题表征向量与数据库中问题表征向量的夹角作为评级指标,夹角越小匹配度越高。
7.根据权利要求1所述的应用于智能问答系统的问题检索方法,其特征在于,所述基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题之后,还包括:
将与用户输入问题最接近的候选问题的回复作为最佳回复并输出。
8.根据权利要求7所述的应用于智能问答系统多轮问答的问题检索方法,其特征在于,所述将与用户输入问题最接近的候选问题的回复作为最佳回复并输出的步骤,包括:
根据与用户输入问题最接近的候选问题,找到对应于该最接近的候选问题的回复;
将对应于该最接近的候选问题的回复作为用户输入问题的最佳回复并输出。
9.一种应用于智能问答系统多轮问答的问题检索装置,其特征在于,包括:
第一文本预处理模块,用于对用户输入问题进行文本预处理,利用预训练Bert模型对用户输入问题进行初步表征;
第二文本预处理模块,用于对用户输入问题的上文问题进行文本预处理,利用文本预处理结果从实体库中抽取与所述上文问题对应的实体,并利用预训练Bert模型对该实体进行表征;
问题表征模块,用于将对用户输入问题的初步表征与对该实体的表征进行合并,作为当前问题的表征;
候选问题匹配模块,用于基于所述当前问题的表征,检索出与用户输入问题最接近的候选问题。
10.一种应用于智能问答系统多轮问答的问题检索设备,其特征在于,包括:
一个或多个处理器;
存储器,其存储有计算机可执行程序,该程序在被所述处理器执行时,使得所述处理器实现权利要求1,8中任一项所述的应用于智能问答系统多轮问答的问题检索方法。
11.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令被执行时实现权利要求1—8中任一项所述的应用于智能问答系统多轮问答的问题检索方法。
12.一种计算机程序,其特征在于,包括:计算机可执行指令,所述指令被执行时用于实现权利要求1—8中任一项所述的应用于智能问答系统多轮问答的问题检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110878293.3A CN113590790B (zh) | 2021-07-30 | 2021-07-30 | 应用于多轮问答的问题检索方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110878293.3A CN113590790B (zh) | 2021-07-30 | 2021-07-30 | 应用于多轮问答的问题检索方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113590790A true CN113590790A (zh) | 2021-11-02 |
CN113590790B CN113590790B (zh) | 2023-11-28 |
Family
ID=78253488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110878293.3A Active CN113590790B (zh) | 2021-07-30 | 2021-07-30 | 应用于多轮问答的问题检索方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113590790B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150339299A1 (en) * | 2014-05-23 | 2015-11-26 | International Business Machines Corporation | Type evaluation in a question-answering system |
CN108153876A (zh) * | 2017-12-26 | 2018-06-12 | 爱因互动科技发展(北京)有限公司 | 智能问答方法及系统 |
CN108170792A (zh) * | 2017-12-27 | 2018-06-15 | 北京百度网讯科技有限公司 | 基于人工智能的问答引导方法、装置和计算机设备 |
CN109472305A (zh) * | 2018-10-31 | 2019-03-15 | 国信优易数据有限公司 | 答案质量确定模型训练方法、答案质量确定方法及装置 |
CN110674252A (zh) * | 2019-08-26 | 2020-01-10 | 银江股份有限公司 | 一种面向司法领域的高精度语义搜索系统 |
CN111046155A (zh) * | 2019-11-27 | 2020-04-21 | 中博信息技术研究院有限公司 | 一种基于fsm多轮问答的语义相似度计算方法 |
CN111339283A (zh) * | 2020-05-15 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 针对用户问题提供客服答案的方法及装置 |
CN111858859A (zh) * | 2019-04-01 | 2020-10-30 | 北京百度网讯科技有限公司 | 自动问答处理方法、装置、计算机设备及存储介质 |
CN112069298A (zh) * | 2020-07-31 | 2020-12-11 | 杭州远传新业科技有限公司 | 基于语义网和意图识别的人机交互方法、设备及介质 |
CN112100348A (zh) * | 2020-09-01 | 2020-12-18 | 武汉纺织大学 | 一种多粒度注意力机制的知识库问答关系检测方法及系统 |
WO2021065034A1 (ja) * | 2019-10-02 | 2021-04-08 | 日本電信電話株式会社 | 文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム |
CN112667794A (zh) * | 2020-12-31 | 2021-04-16 | 民生科技有限责任公司 | 一种基于孪生网络bert模型的智能问答匹配方法及系统 |
CN113010662A (zh) * | 2021-04-23 | 2021-06-22 | 中国科学院深圳先进技术研究院 | 一种层次化会话式机器阅读理解系统和方法 |
-
2021
- 2021-07-30 CN CN202110878293.3A patent/CN113590790B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150339299A1 (en) * | 2014-05-23 | 2015-11-26 | International Business Machines Corporation | Type evaluation in a question-answering system |
CN108153876A (zh) * | 2017-12-26 | 2018-06-12 | 爱因互动科技发展(北京)有限公司 | 智能问答方法及系统 |
CN108170792A (zh) * | 2017-12-27 | 2018-06-15 | 北京百度网讯科技有限公司 | 基于人工智能的问答引导方法、装置和计算机设备 |
CN109472305A (zh) * | 2018-10-31 | 2019-03-15 | 国信优易数据有限公司 | 答案质量确定模型训练方法、答案质量确定方法及装置 |
CN111858859A (zh) * | 2019-04-01 | 2020-10-30 | 北京百度网讯科技有限公司 | 自动问答处理方法、装置、计算机设备及存储介质 |
CN110674252A (zh) * | 2019-08-26 | 2020-01-10 | 银江股份有限公司 | 一种面向司法领域的高精度语义搜索系统 |
WO2021065034A1 (ja) * | 2019-10-02 | 2021-04-08 | 日本電信電話株式会社 | 文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム |
CN111046155A (zh) * | 2019-11-27 | 2020-04-21 | 中博信息技术研究院有限公司 | 一种基于fsm多轮问答的语义相似度计算方法 |
CN111339283A (zh) * | 2020-05-15 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 针对用户问题提供客服答案的方法及装置 |
CN112069298A (zh) * | 2020-07-31 | 2020-12-11 | 杭州远传新业科技有限公司 | 基于语义网和意图识别的人机交互方法、设备及介质 |
CN112100348A (zh) * | 2020-09-01 | 2020-12-18 | 武汉纺织大学 | 一种多粒度注意力机制的知识库问答关系检测方法及系统 |
CN112667794A (zh) * | 2020-12-31 | 2021-04-16 | 民生科技有限责任公司 | 一种基于孪生网络bert模型的智能问答匹配方法及系统 |
CN113010662A (zh) * | 2021-04-23 | 2021-06-22 | 中国科学院深圳先进技术研究院 | 一种层次化会话式机器阅读理解系统和方法 |
Non-Patent Citations (3)
Title |
---|
YANG LIU ET AL.: "A Multi-level Fused Sequence Matching Model for Candidates Filtering in Multi-paragraphs Question-Answering", 《AADVANCES IN MULTIMEDIA INFORMATION PROCESSING-PCM 2018》, pages 449 - 458 * |
孟秋晴 等: "基于在线问诊文本信息的医生标签自动生成研究", 《情报科学》, no. 05, pages 178 - 185 * |
梁敬东 等: "基于word2vec和LSTM的句子相似度计算及其在水稻FAQ问答系统中的应用", 《南京农业大学学报》, no. 05, pages 60 - 66 * |
Also Published As
Publication number | Publication date |
---|---|
CN113590790B (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885660B (zh) | 一种知识图谱赋能的基于信息检索的问答系统和方法 | |
CN111353310B (zh) | 基于人工智能的命名实体识别方法、装置及电子设备 | |
US9977778B1 (en) | Probabilistic matching for dialog state tracking with limited training data | |
CN110532368B (zh) | 问答方法、电子设备及计算机可读存储介质 | |
US9020805B2 (en) | Context-based disambiguation of acronyms and abbreviations | |
JP5998194B2 (ja) | 対話型検索方法および装置 | |
WO2022022421A1 (zh) | 语言表示模型系统、预训练方法、装置、设备及介质 | |
US20140310005A1 (en) | Virtual assistant conversations for ambiguous user input and goals | |
KR20050005523A (ko) | 단어 상관 방법 및 장치 | |
CN111046154A (zh) | 信息检索方法、装置、介质及电子设备 | |
WO2019242328A1 (zh) | 信息检索方法、装置、设备及计算机可读介质 | |
CN113239169B (zh) | 基于人工智能的回答生成方法、装置、设备及存储介质 | |
US11531693B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
CN111898643A (zh) | 一种语义匹配方法及装置 | |
CN113468894B (zh) | 对话交互方法及装置、电子设备和计算机可读存储介质 | |
US20230059870A1 (en) | Systems and methods for knowledge base question answering using generation augmented ranking | |
US11354599B1 (en) | Methods and systems for generating a data structure using graphical models | |
CN108304381B (zh) | 基于人工智能的实体建边方法、装置、设备及存储介质 | |
US20180047080A1 (en) | System and method for synthetic ideation | |
CN113590789A (zh) | 应用于智能问答系统的问题检索方法、装置、设备及介质 | |
CN109885812B (zh) | 一种动态添加热词的方法、装置及可读存储介质 | |
CN116882372A (zh) | 文本生成方法、装置、电子设备以及存储介质 | |
CN113590790B (zh) | 应用于多轮问答的问题检索方法、装置、设备及介质 | |
Trummer | Data Vocalization with CiceroDB. | |
CN113590788A (zh) | 应用于智能问答系统的意图识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |