CN109299476B - 问答方法、装置、电子设备及存储介质 - Google Patents
问答方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109299476B CN109299476B CN201811436397.3A CN201811436397A CN109299476B CN 109299476 B CN109299476 B CN 109299476B CN 201811436397 A CN201811436397 A CN 201811436397A CN 109299476 B CN109299476 B CN 109299476B
- Authority
- CN
- China
- Prior art keywords
- question
- candidate
- answered
- questions
- matched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013145 classification model Methods 0.000 claims abstract description 22
- 230000014509 gene expression Effects 0.000 claims description 37
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 abstract description 10
- 230000007547 defect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 9
- 235000019580 granularity Nutrition 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种问答方法、装置、电子设备及存储介质。所述方法包括:使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别;从问题类别对应的候选问题集合中,获取与待回答问题匹配的目标候选问题;将目标候选问题的答案作为待回答问题的答案。本公开实施例的技术方案解决了现有技术中应答系统维护不便,难以对用户提出的问题进行大面积覆盖的技术缺陷,实现了简便、快速地对用户提出的绝大部分问题进行准确地应答,且可以简便地通过增加候选问题的操作,扩充候选问题集合,进而可以更大面积地覆盖用户提出的问题。
Description
技术领域
本公开实施例涉及智能问答技术领域,特别是涉及一种问答方法、装置、电子设备及存储介质。
背景技术
随着计算机信息和互联网技术的飞速发展,客户服务逐步向网络化、智能化和个性化的方向发展,由此以自然语言理解为基础通过人工智能技术构建的应答系统(例如聊天机器人等)应运而生。
现有技术中,应答系统一般都是基于正则规则,即用正则表达式确定用户问的问题具体是哪一个问题,然后应答系统将所确定的问题的答案作为用户问题的答案,并将该答案反馈给用户。可知的是正则表达式与问题是一一对应的,即有多少个问题就需要对应有多少个正则表达式,
发明人在具体实施过程中,发现现有技术中存在如下问题:正则表达式越多,应答系统维护越不方便,且不利于应答系统的迁移使用,而且无法通过正则表达式覆盖所有用户问题。
发明内容
有鉴于此,本公开实施例提供了一种问答方法、装置、电子设备及存储介质,主要目的在于解决翻译模型对语音识别结果的容错能力差的问题。
为了解决上述问题,本公开实施例主要提供如下技术方案:
第一方面,本公开实施例提供了一种问答方法,该方法包括:
使用分类模型对接收到的待回答问题进行分类,得到所述待回答问题的问题类别;
从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题;
将所述目标候选问题的答案作为所述待回答问题的答案。
第二方面,本公开实施例还提供一种问答装置,该装置包括:
分类模块,用于使用分类模型对接收到的待回答问题进行分类,得到所述待回答问题的问题类别;
候选问题获取模块,用于从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题;
答案确定模块,用于将所述目标候选问题的答案作为所述待回答问题的答案。
第三方面,本公开实施例还提供一种电子设备,该电子设备包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行本公开任意实施例所述的问答方法。
第四方面,本公开实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本公开任意实施例所述的问答方法。
借由上述技术方案,本公开实施例提供的技术方案至少具有下列优点:
本公开实施例提供的问答方法、装置、电子设备及存储介质,通过先对待回答问题进行分类,然后从分类结果对应的候选问题集合中获取待回答问题匹配的目标候选问题,并将目标候选问题的答案作为待回答问题的答案,解决了现有技术中应答系统维护不便,难以对用户提出的问题进行大面积覆盖的技术缺陷,实现了简便、快速地对用户提出的绝大部分问题进行准确地应答,且可以简便地通过增加候选问题的操作,扩充候选问题集合,进而可以更大面积地覆盖用户提出的问题。
上述说明仅是本公开实施例技术方案的概述,为了能够更清楚了解本公开实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本公开实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本公开实施例一提供的一种问答方法的流程图;
图2示出了本公开实施例二提供的一种问答方法的流程图;
图3示出了本公开实施例三提供的一种问答方法的流程图;
图4示出了本公开实施例四提供的一种问答装置的结构示意图;
图5示出了本公开实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1为本公开实施例一提供的一种问答方法的流程图,本实施例的方法可以由问答装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于电子设备中,例如服务器等。本实施例的方法具体包括:
S101、使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别。
在本实施例中,在接收到待回答问题之后,并不是直接对待回答问题进行解答,而是先将待回答问题进行分类。这里需要说明的是,本实施例中对待回答问题进行分类,具体是指依据大粒度的类别对待回答问题进行分类。
举例来说,如果本实施例中的步骤101和步骤103应用于人设问答,那么通过步骤101可以将待回答问题划分为基本信息、亲戚关系、技能、爱好、知识以及其他,这六个大粒度的类别中的一个。而不会通过步骤101将待回答问题划分为爸爸的姓名、妈妈的姓名、喜好的事物或喜爱的运动等这种小粒度的类别。
可知的是,对于智能问答来说,用户提出的小粒度类别的问题可能是在不断变化且不断增加的。因此,如果分类模型是依据小粒度的类别对待回答问题进行分类的,那么就需要不断地对分类模型重新进行训练,当然在重新训练之前还需要对新的训练语料进行人工标注。如此,会浪费大量的人力物力,增加智能问答的成本,并且如果在模型的使用过程中需要不断地对其重新进行训练,那么一般来说,本领域技术人员会认为该模型设置的不合理,或是模型的使用场景不合理,就会更换模型。
进一步地,在本实施例中,分类模型具体可以是文本卷积神经网络模型,也可以是支持向量机等,本实施例对此不进行限制。
S102、从问题类别对应的候选问题集合中,获取与待回答问题匹配的目标候选问题。
在本实施例中,每一个问题类别对应存在有一个候选问题结合,候选问题集合中包括对应的问题类别下所有已知的用户可能提出的问题,不同的问题类别对应有不同的候选问题集合。示例性地,如果本实施例中的步骤101和步骤103应用于人设问答,且基本信息为人设问题场景下分类模型输出的一个大粒度的类别,那么基本信息对应的候选问题集合中包括的小粒度的类别的问题可以是爸爸的姓名、妈妈的姓名、弟弟的年龄以及喜好的玩具等等。
进一步地,在本实施例中,仅对待回答问题进行两个粒度的类别的分类,即首先通过步骤101中的分类模型进行大粒度的类别的分类,然后通过步骤102中的候选问题集合进行小粒度的类别的分类,在通过步骤102进行小粒度的类别的分类之后,就可以确定待回答问题匹配的目标候选问题,根据该目标候选问题就可以获知待回答问题的答案。
在本实施例中,从问题类别对应的候选问题集合中获取与待回答问题匹配的目标候选问题具体是指从候选问题集合所包括的所有候选问题中,选取与待回答问题的文本匹配度最高的问题。现有技术中获取文本匹配度的计算方法均可在本实施例中使用,用于计算待回答问题与候选问题集合所包括的各个候选问题之间的文本匹配度。
S103、将目标候选问题的答案作为待回答问题的答案。
在本实施例中,在确定与待回答问题匹配的目标候选问题之后,即会获取该目标候选问题的答案,并将该目标候选问题的答案作为待回答问题的答案,进而将该目标候选问题的答案反馈给用户。
进一步地,候选问题集合中所包括的候选问题的答案,既可以同时包括在该候选问题集合中,也可以包括在其他数据集合中,本实施例对此不进行限制。但是,必须保证可以随时准确地获取候选问题集合中所包括的各个候选问题的答案。
本公开实施例提供的问答方法,通过先对待回答问题进行分类,然后从分类结果对应的候选问题集合中获取待回答问题匹配的目标候选问题,并将目标候选问题的答案作为待回答问题的答案,解决了现有技术中应答系统维护不便,难以对用户提出的问题进行大面积覆盖的技术缺陷,实现了简便、快速地对用户提出的绝大部分问题进行准确地应答,且可以简便地通过增加候选问题的操作,扩充候选问题集合,进而可以更大面积地覆盖用户提出的问题。
实施例二
图2是本公开实施例二提供的一种问答方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,给出了一种具体化目标候选问题的确定步骤,增加使用正则表达式回答待回答问题的步骤的具体实施方式。
相应的,本实施例的方法具体包括:
S201、接收待回答问题。
在本实施例中,增加了步骤201至203,即增加了使用正则表达式回答问题的步骤。
可以理解的是,在各个问答场景中都存在被提问频率较高的问题,并且可知的是,通过正则表达式可以对问题进行非常准确的小粒度的分类和解答(即正则表达式可以对其自身对应的小粒度的问题进行准确地判定和解答)。因此,在本实施例中,首先使用了正则表达式对待回答问题进行解答,以使得可以对高频问题进行快速、准确地回答。
S202、判断待回答问题是否与设定正则表达式匹配,若匹配,则执行步骤203,若不匹配,则执行步骤204。
在本实施例中,设定正则表达式具体是指与小粒度的类别的问题一一对应的正则表达式,一个设定正则表达式用于解答一个小粒度的类别的问题。举例来说,“爸爸的姓名”以及“妈妈的姓名”这两个问题可以通过两个不同的正则表达式进行解答。
S203、将与待回答问题匹配的设定正则表达式对应的答案作为待回答问题的答案。
在本实施例中,待回答问题与一个设定正则表达式匹配时,则会直接使用该设定正则表达式对待回答问题进行解答,即将该设定正则表达式对应的答案作为待回答问题的答案,进而将该设定正则表达式对应的答案反馈给用户。
S204、使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别。
S205、对待回答问题进行分词处理,得到待匹配词语组。
在本实施例中,通过步骤205至步骤207获取与待回答问题匹配的候选问题。首先,通过步骤205对待回答问题进行分词处理,然后对分词结果进行去重、去停用词、去感叹词等操作之后得到多个词语,最后使用这多个词语组成词语组,即待匹配词语组。
S206、根据待匹配词语组,从候选问题集合中获取多个待匹配候选问题。
在本实施例中,在获取待匹配词语组之后,会根据该待匹配词语组,从候选问题集合中包括的所有候选问题中,选取多个待匹配候选问题。具体来说可以是根据待匹配词语组中的词语与候选问题集合中包括的各个候选问题分别对应的词语组之间的词向量距离等文本匹配算法,确定待匹配候选问题。
S207、根据设定文本匹配规则,从多个待匹配候选问题中选取与待回答问题匹配的目标候选问题,以及候选问题的标识信息。
在本实施例中,待匹配候选问题确定之后,会根据设定文本匹配规则分别对各个待匹配候选问题与待回答问题进行匹配,以从所有待匹配候选问题中选取与待回答问题的文本匹配度最高的一个,最为与待回答问题匹配的目标候选问题。进一步地,现有技术中的文本匹配算法均可以作为本实施例中的设定文本匹配规则,且本实施例中既可以仅使用一种文本匹配算法计算待匹配候选问题与待回答问题之间的文本匹配度,也可以同时使用多种文本匹配算法计算待匹配候选问题与待回答问题之间的文本匹配度,本实施例对此不进行限制。
进一步地,在本实施例中,候选问题集合中不但包括有候选问题,还包括有各个候选问题的标识信息。候选问题的标识信息具体用于对问题进行唯一性限定,通过该标识信息既可以限定候选问题的唯一编号,也可以限定候选问题对应的唯一小粒度的类别(例如爸爸的姓名)。
在本实施例中,候选问题集合中不包括其所包括的各个候选问题的答案,该各个候选问题的答案存储在与候选问题集合对应的候选问题答案集合中。候选问题答案集合中包括有各个候选问题的标识信息和答案,通过候选问题的标识信息,可以从候选问题答案集合中获取候选问题的答案。
S208、根据目标候选问题对应的标识信息,从候选问题集合对应的候选问题答案集合中获取目标候选问题的答案,并将其作为待回答问题的答案。
在本实施例中,在确定目标候选问题并获取该目标候选问题的标识信息之后,可以从候选问题集合对应的候选问题答案集合中获取目标候选问题的答案,并将该答案作为待回答问题的答案。
本公开实施例提供了一种问答方法,该方法具体化了目标候选问题的确定步骤,实现了快速、简便以及准确地获取目标候选问题,还增加了使用正则表达式回答待回答问题的步骤,实现了对高频问题进行快速、准确地回答。
实施例三
图3是本公开实施例三提供的一种问答方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,给出了一种具体化待匹配候选问题的获取步骤,具体化与待回答问题匹配的目标候选问题的确定步骤的具体实施方式。
相应的,本实施例的方法具体包括:
S301、接收待回答问题。
S302、判断待回答问题是否与设定正则表达式匹配,若匹配,则执行步骤303,若不匹配,则执行步骤304。
S303、将与待回答问题匹配的设定正则表达式对应的答案作为待回答问题的答案。
S304、使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别。
S305、对待回答问题进行分词处理,得到待匹配词语组。
S306、依据包括待匹配词语组中的词语的数量,按照从大到小的顺序对候选问题集合中的所有候选问题进行排序。
在本实施例中,在获取待匹配词语组之后,会确定候选问题集合中包括的各个候选问题中包括有该待匹配词语组中的词语的数量。然后,会按照上述数量,从大到小对候选问题集合中的所有候选问题进行排序。
进一步地,对于包括有相同数量的待匹配词语组中的词语的候选问题,可以按照随机的方式进行排序。
S307、在排序结果中,从前至后选取设定数量的候选问题作为待匹配候选问题。
在本实施例中,在对候选问题集合中的候选问题进行排序之后,会从排序结果中,从前至后选取设定数量的候选问题作为待匹配候选问题。其中,设定数量典型的可以说是10等。
S308、分别根据各个设定文本匹配算法,计算任一个待匹配候选问题与待回答问题之间的各种匹配度。
在本实施例中,会使用多种设定文本匹配算法计算一个待匹配候选问题与待回答问题之间的多种文本匹配度,即从不同角度确定待匹配候选问题与待回答问题之间的文本匹配程度。
进一步地,在本实施例中,设定文本匹配算法具体可以是词向量距离、频率逆文档频率或编辑距离等。
S309、根据各个设定文本匹配算法分别对应的权重以及各种匹配度,计算待匹配候选问题对应的总匹配度。
在本实施例中,每一种设定文本匹配算法对应一个权重,不同的设定文本算法对应的权重既可以相同,也可以不同。
在本实施例中,在计算得到待匹配候选问题与待回答问题之间的各种匹配度之后,会将一个待匹配候选问题对应的各种匹配度分别乘以该匹配度对应的设定文本匹配算法的权重,然后将各个乘积相加,最终得到该待匹配候选问题对应的总匹配度。每一个待匹配候选问题对应有一个总匹配度,该总匹配度体现了待匹配候选问题与待回答问题之间的匹配程度。
S310、根据各个待匹配候选问题分别对应的总匹配度,从多个待匹配候选问题中确定与待回答问题匹配的目标候选问题,以及目标候选问题的标识信息。
在本实施例中,在确定各个待匹配候选问题分别对应的总匹配度之后,会根据总匹配度的大小,从多个待匹配候选问题中选取总匹配度最大的一个待匹配候选问题作为与待回答问题匹配的目标候选问题。
S311、根据目标候选问题对应的标识信息,从候选问题对应的候选问题答案集合中获取目标候选问题的答案,并将其作为待回答问题的答案。
本公开实施例提供了一种问答方法,该方法具体化了待匹配候选问题的获取步骤,实现了简便、快速以及有效地选取待匹配候选问题,还具体化了与待回答问题匹配的目标候选问题的确定步骤,使得可以从多个文本匹配的角度共同确定与待回答问题匹配的目标候选问题,提高了目标候选问题的选取准确度。
在这里需要说明的是,上述各个实施例之间的技术特征的排列组合也落入本发明的保护范围。
实施例四
图4是本公开实施例四提供的一种问答装置的结构图。如图4所示,所述装置包括:分类模块401、目标候选问题获取模块402以及答案确定模块403,其中:
分类模块401,用于使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别;
目标候选问题获取模块402,用于从问题类别对应的候选问题集合中,获取与待回答问题匹配的目标候选问题;
答案确定模块403,用于将目标候选问题的答案作为待回答问题的答案。
本公开实施例提供了一种问答装置,该装置首先通过分类模块401使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别,然后通过目标候选问题获取模块402从问题类别对应的候选问题集合中,获取与待回答问题匹配的目标候选问题,最后通过答案确定模块403,用于将目标候选问题的答案作为待回答问题的答案。
该装置解决了现有技术中应答系统维护不便,难以对用户提出的问题进行大面积覆盖的技术缺陷,实现了简便、快速地对用户提出的绝大部分问题进行准确地应答,且可以简便地通过增加候选问题的操作,扩充候选问题集合,进而可以更大面积地覆盖用户提出的问题。
在上述各实施例的基础上,目标候选问题获取模块402可以包括:
待匹配词语组获取单元,用于对待回答问题进行分词处理,得到待匹配词语组;
待匹配候选问题获取单元,用于根据待匹配词语组,从候选问题集合中获取多个待匹配候选问题;
候选问题确定单元,用于根据设定文本匹配规则,从多个待匹配候选问题中选取与待回答问题匹配的目标候选问题。
在上述各实施例的基础上,待匹配候选问题获取单元可以包括:
排序子单元,用于依据包括待匹配词语组中的词语的数量,按照从大到小的顺序对候选问题集合中的所有候选问题进行排序;
待匹配候选问题确定子单元,用于在排序结果中,从前至后选取设定数量的候选问题作为待匹配候选问题。
在上述各实施例的基础上,候选问题确定单元可以包括:
匹配度计算子单元,用于分别根据各个设定文本匹配算法,计算任一个待匹配候选问题与待回答问题之间的各种匹配度;
总匹配度计算子单元,用于根据各个设定文本匹配算法分别对应的权重以及各种匹配度,计算待匹配候选问题对应的总匹配度;
候选问题选取子单元,用于根据各个待匹配候选问题分别对应的总匹配度,从多个待匹配候选问题中确定与待回答问题匹配的目标候选问题。
在上述各实施例的基础上,设定文本匹配算法可以为:
词向量距离、频率逆文档频率或编辑距离。
在上述各实施例的基础上,候选问题获取模块402具体可以用于:
从问题类别对应的候选问题集合中,获取与待回答问题匹配的目标候选问题,以及目标候选问题的标识信息;
相应地,答案确定模块403具体可以用于:
根据目标候选问题对应的标识信息,从候选问题集合对应的候选问题答案集合中获取目标候选问题的答案,并将其作为待回答问题的答案。
在上述各实施例的基础上,还可以包括:
问题接收模块,用于在使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别之前,接收待回答问题;
正则回答模块,用于如果待回答问题与设定正规表达式匹配,则将与待回答问题匹配的设定正则表达式对应的答案作为待回答问题的答案;
操作执行模块,用于如果待回答问题与设定正规表达式不匹配,则执行使用分类模型对接收到的待回答问题进行分类,得到待回答问题对应的问题类别的操作。
由于本实施例所介绍的问答装置为可以执行本公开实施例中的问答方法的装置,故而基于本公开实施例中所介绍的问答方法,本领域所属技术人员能够了解本实施例的问答装置的具体实施方式以及其各种变化形式,所以在此对于该问答装置如何实现本公开实施例中的多问答方法不再详细介绍。只要本领域所属技术人员实施本公开实施例中问答方法所采用的装置,都属于本申请所欲保护的范围。
实施例五
图5为本公开实施例五提供的一种电子设备的结构示意图。如图5所示,包括:至少一个处理器(processor)51;以及与所述处理器51连接的至少一个存储器(memory)52、总线53;其中,
所述处理器51、存储器52通过所述总线53完成相互间的通信;
所述处理器51用于调用所述存储器52中的程序指令,以执行上述方法实施例中的步骤。
存储器52作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种问答方法对应的程序指令/模块(例如,附图4所示的:分类模块401、目标候选问题获取模块402以及答案确定模块403)。所述处理器51用于调用所述存储器52中的程序指令/模块,以执行上述方法实施例中一种问答方法中的步骤。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例六
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的问答方法。该方法包括:
使用分类模型对接收到的待回答问题进行分类,得到所述待回答问题的问题类别;
从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题;
将所述目标候选问题的答案作为所述待回答问题的答案。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (7)
1.一种问答方法,其特征在于,包括:
使用分类模型依据大粒度的类别对接收到的待回答问题进行分类,得到所述待回答问题的问题类别;
从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题;其中,所述候选问题集合包括各所述候选问题的标识信息,所述候选问题的标识信息集具体用于对所述候选问题进行唯一性限定;
将所述目标候选问题的答案作为所述待回答问题的答案;
其中,所述从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题,包括:
对所述待回答问题进行分词处理,得到待匹配词语组;
根据所述待匹配词语组,从候选问题集合中获取多个待匹配候选问题;
根据设定文本匹配规则,从所述多个待匹配候选问题中选取与所述待回答问题匹配的目标候选问题;
其中,所述根据设定文本匹配规则,从所述多个待匹配候选问题中选取与所述待回答问题匹配的候选问题,包括:
分别根据各个设定文本匹配算法,计算任一个所述待匹配候选问题与所述待回答问题之间的各种匹配度;
根据所述各个设定文本匹配算法分别对应的权重以及所述各种匹配,计算所述待匹配候选问题对应的总匹配度;
根据各个所述待匹配候选问题分别对应的总匹配度,从所述多个待匹配候选问题中确定与所述待回答问题匹配的目标候选问题;
其中,在所述使用分类模型对接收到的待回答问题进行分类,得到所述待回答问题的问题类别之前,还包括:
接收所述待回答问题;
如果所述待回答问题与设定正则表达式匹配,则将与所述待回答问题匹配的正则表达式对应的答案作为所述待回答问题的答案;
如果所述待回答问题与设定正则表达式不匹配,则执行所述使用分类模型对接收到的待回答问题进行分类,得到所述待回答问题对应的问题类别的操作,其中,所述正则表达式是指与小粒度的类别的问题一一对应的正则表达式。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配词语组,从候选问题集合中获取多个待匹配候选问题,包括:
依据包括所述待匹配词语组中的词语的数量,按照从大到小的顺序对所述候选问题集合中的所有候选问题进行排序;
在排序结果中,从前至后选取设定数量的候选问题作为待匹配候选问题。
3.根据权利要求1所述的方法,其特征在于,所述设定文本匹配算法为:
词向量距离、频率逆文档频率或编辑距离。
4.根据权利要求1所述的方法,其特征在于,所述从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题,包括:
从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题,以及所述目标候选问题的标识信息;
相应地,所述将所述目标候选问题的答案作为所述待回答问题的答案,具体包括:
根据所述目标候选问题对应的标识信息,从所述候选问题集合对应的候选问题答案集合中获取所述目标候选问题的答案,并将其作为所述待回答问题的答案。
5.一种问答装置,其特征在于,包括:
分类模块,用于使用分类模型依据大粒度的类别对接收到的待回答问题进行分类,得到所述待回答问题的问题类别;
候选问题获取模块,用于从所述问题类别对应的候选问题集合中,获取与所述待回答问题匹配的目标候选问题;其中,所述候选问题集合包括各所述候选问题的标识信息,所述候选问题的标识信息集具体用于对所述候选问题进行唯一性限定;
答案确定模块,用于将所述目标候选问题的答案作为所述待回答问题的答案;
问题接收模块,用于在使用分类模型对接收到的待回答问题进行分类,得到待回答问题的问题类别之前,接收待回答问题;
正则回答模块,用于如果待回答问题与设定正规表达式匹配,则将与待回答问题匹配的设定正则表达式对应的答案作为待回答问题的答案;其中,所述正则表达式是指与小粒度的类别的问题一一对应的正则表达式;
操作执行模块,用于如果待回答问题与设定正规表达式不匹配,则执行使用分类模型对接收到的待回答问题进行分类,得到待回答问题对应的问题类别的操作;
其中,所述候选问题获取模块,具体用于:
对所述待回答问题进行分词处理,得到待匹配词语组;
根据所述待匹配词语组,从候选问题集合中获取多个待匹配候选问题;
根据设定文本匹配规则,从所述多个待匹配候选问题中选取与所述待回答问题匹配的目标候选问题;
其中,所述根据设定文本匹配规则,从所述多个待匹配候选问题中选取与所述待回答问题匹配的候选问题,包括:
分别根据各个设定文本匹配算法,计算任一个所述待匹配候选问题与所述待回答问题之间的各种匹配度;
根据所述各个设定文本匹配算法分别对应的权重以及所述各种匹配,计算所述待匹配候选问题对应的总匹配度;
根据各个所述待匹配候选问题分别对应的总匹配度,从所述多个待匹配候选问题中确定与所述待回答问题匹配的目标候选问题。
6.一种电子设备,其特征在于,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至权利要求4中任一项所述的问答方法。
7.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至权利要求4中任一项所述的问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811436397.3A CN109299476B (zh) | 2018-11-28 | 2018-11-28 | 问答方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811436397.3A CN109299476B (zh) | 2018-11-28 | 2018-11-28 | 问答方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109299476A CN109299476A (zh) | 2019-02-01 |
CN109299476B true CN109299476B (zh) | 2023-04-18 |
Family
ID=65145011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811436397.3A Active CN109299476B (zh) | 2018-11-28 | 2018-11-28 | 问答方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109299476B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308571B (zh) * | 2019-07-15 | 2024-09-24 | 北京汇钧科技有限公司 | 智能客服应答方法、装置、存储介质及电子设备 |
CN110459210A (zh) * | 2019-07-30 | 2019-11-15 | 平安科技(深圳)有限公司 | 基于语音分析的问答方法、装置、设备及存储介质 |
CN111831800A (zh) * | 2019-08-13 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 问答交互方法、装置、设备及存储介质 |
CN112487800B (zh) * | 2019-08-21 | 2023-06-09 | 顺丰科技有限公司 | 文本处理方法、装置、服务器及存储介质 |
CN110837549B (zh) * | 2019-11-06 | 2023-08-11 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及存储介质 |
CN111353027B (zh) * | 2020-02-17 | 2023-07-28 | 深圳数联天下智能科技有限公司 | 聊天机器人中的答案反馈方法、装置、计算机设备和介质 |
CN111324715B (zh) * | 2020-02-18 | 2023-07-14 | 北京百度网讯科技有限公司 | 问答机器人的生成方法和装置 |
CN112328753A (zh) * | 2020-08-13 | 2021-02-05 | 北京沃东天骏信息技术有限公司 | 问答的处理方法、装置、计算设备及介质 |
CN112667790B (zh) * | 2020-12-18 | 2024-05-10 | 平安科技(深圳)有限公司 | 智能问答方法、装置、设备及存储介质 |
CN113377936B (zh) * | 2021-05-25 | 2022-09-30 | 杭州搜车数据科技有限公司 | 智能问答方法、装置及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893465A (zh) * | 2016-03-28 | 2016-08-24 | 北京京东尚科信息技术有限公司 | 自动问答方法和装置 |
CN107980130A (zh) * | 2017-11-02 | 2018-05-01 | 深圳前海达闼云端智能科技有限公司 | 自动回答方法、装置、存储介质及电子设备 |
CN108595619A (zh) * | 2018-04-23 | 2018-09-28 | 海信集团有限公司 | 一种问答方法及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9703840B2 (en) * | 2014-08-13 | 2017-07-11 | International Business Machines Corporation | Handling information source ingestion in a question answering system |
-
2018
- 2018-11-28 CN CN201811436397.3A patent/CN109299476B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893465A (zh) * | 2016-03-28 | 2016-08-24 | 北京京东尚科信息技术有限公司 | 自动问答方法和装置 |
CN107980130A (zh) * | 2017-11-02 | 2018-05-01 | 深圳前海达闼云端智能科技有限公司 | 自动回答方法、装置、存储介质及电子设备 |
CN108595619A (zh) * | 2018-04-23 | 2018-09-28 | 海信集团有限公司 | 一种问答方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109299476A (zh) | 2019-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299476B (zh) | 问答方法、装置、电子设备及存储介质 | |
US11080481B2 (en) | Method and device for classifying questions based on artificial intelligence | |
CN108920654B (zh) | 一种问答文本语义匹配的方法和装置 | |
CN109471915B (zh) | 一种文本评价方法、装置、设备以及可读存储介质 | |
CN109800306A (zh) | 意图分析方法、装置、显示终端及计算机可读存储介质 | |
CN109299344A (zh) | 排序模型的生成方法、搜索结果的排序方法、装置及设备 | |
CN107291840B (zh) | 一种用户属性预测模型构建方法和装置 | |
US20210234814A1 (en) | Human-machine interaction | |
CN111046147A (zh) | 一种问答方法、装置及终端设备 | |
CN112989822B (zh) | 识别对话中句子类别的方法、装置、电子设备和存储介质 | |
US11410568B2 (en) | Dynamic evaluation of event participants using a smart context-based quiz system | |
CN109582774A (zh) | 自然语言分类方法、装置、设备及存储介质 | |
CN111897955B (zh) | 基于编解码的评语生成方法、装置、设备和存储介质 | |
CN117668181A (zh) | 信息处理方法、装置、终端设备以及存储介质 | |
CN107729491B (zh) | 提高题目答案搜索的准确率的方法、装置及设备 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN108228869B (zh) | 一种文本分类模型的建立方法及装置 | |
CN117332062A (zh) | 一种数据处理方法和相关装置 | |
WO2023093074A1 (zh) | 语音数据处理方法、装置及电子设备、存储介质 | |
CN111260757A (zh) | 一种图像处理方法、装置及终端设备 | |
CN113722452B (zh) | 一种问答系统中基于语义的快速知识命中方法及装置 | |
CN111104951A (zh) | 一种主动学习方法、装置及终端设备 | |
CN114676677A (zh) | 信息处理方法、装置、服务器及存储介质 | |
CN111126066B (zh) | 基于神经网络的中文修辞手法的确定方法和装置 | |
CN114781485A (zh) | 文本分类方法、装置、计算机设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220524 Address after: 210038 8th floor, building D11, Hongfeng science and Technology Park, Nanjing Economic and Technological Development Zone, Jiangsu Province Applicant after: New Technology Co.,Ltd. Applicant after: VOLKSWAGEN (CHINA) INVESTMENT Co.,Ltd. Address before: 100080 Room 501, 5th floor, NO.67, North Fourth Ring Road West, Haidian District, Beijing Applicant before: Beijing Yufanzhi Information Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |