CN110413735A - 一种问答检索方法及其系统、计算机设备、可读存储介质 - Google Patents
一种问答检索方法及其系统、计算机设备、可读存储介质 Download PDFInfo
- Publication number
- CN110413735A CN110413735A CN201910678236.3A CN201910678236A CN110413735A CN 110413735 A CN110413735 A CN 110413735A CN 201910678236 A CN201910678236 A CN 201910678236A CN 110413735 A CN110413735 A CN 110413735A
- Authority
- CN
- China
- Prior art keywords
- retrieved
- morpheme
- collection
- text
- update
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012986 modification Methods 0.000 claims abstract description 48
- 230000004048 modification Effects 0.000 claims abstract description 48
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 239000012141 concentrate Substances 0.000 claims description 6
- 235000013399 edible fruits Nutrition 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000004458 analytical method Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012958 reprocessing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013549 information retrieval technique Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种问答检索方法及其系统、计算机设备、可读存储介质,该方法包括:接收待检索文本;对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;根据待检索语素集进行检索得到与待检索语素集对应的检索结果;根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。本发明至少能够避免相同文本的重复计算,减少检索计算量。
Description
技术领域
本发明涉及问答检索技术领域,特别涉及一种问答检索方法及其系统、计算机设备、可读存储介质。
背景技术
随着互联网的发展和网络信息的不断增长,通过搜索引擎可以从互联网中检索到越来越多的信息,搜索结果呈现出数据海量化,形态多样化,覆盖全面化等特点,一方面提升了用户搜索到结果的可能性,另一方面却使得用户很难快速准确地定位到所需的信息,其中问答检索是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题,是集自然语言处理技术和信息检索技术于一身的新一代搜索引擎,它的出现旨在提供更有力的信息获取工具,现有的问答检索方法通过对整个检索文本进行分析,提取关键词进行问答检索,随着检索到越来越多的信息,检索精确度低,且当操作者修改检索文本内容时,需要对修改的检索文本进行再次计算处理,容易造成相同文本的重复计算,从而增加计算量,增加处理时间。
发明内容
本发明旨在提供一种问答检索方法及其系统、计算机设备、可读存储介质,以避免相同文本的重复计算,提高检索精确度、减少检索计算量以及节约处理时间。
为了实现本发明目的,本发明第一方面提供一种问答检索方法,包括如下步骤:
S1、接收待检索文本;
S2、对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
S3、根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
S4、根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
S5、根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
优选地,所述步骤S3包括:
根据待检索语素集中语素确定检索集中与该待检索语素集中语素对应的文档,其中,所述检索集中包括多个文档。
优选地,所述根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索包括:
根据所述文本修改信息对待检索文本进行更新得到更新后待检索文本;
对所述更新后待检索文本进行语素解析得到更新后待检索语素集,所述更新后待检索语素集包括一个或多个语素;
根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索,所述集合关系包括包含、相交以及相离。
优选地,所述根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索包括:
若更新前待检索语素集包含更新后待检索语素集,则返回步骤S4,根据更新前检索结果及更新后待检索语素集确定检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相交,则确定更新后待检索语素集中与更新前待检索语素集不同的语素,根据所述与更新前待检索语素集不同的语素进行检索得到二次检索结果,并合并所述二次检索结果和语速集更新前所对应的检索结果作为更新后待检索语素集所对应的检索结果,并将其返回至步骤S4中进一步确定更新后待检索语素集所对应的检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相离,则返回步骤S3,对更新后待检索语素集进行检索得到与待检索语素集对应的检索结果。
优选地,所述步骤S2包括:
采用word2vec训练词向量算法对待检索语素集中的一个或多个语素进行词向量预处理。
优选地,所述步骤S4具体根据如下公式计算检索结果与待检索语素集的相关性:
其中,Score(qi,d)表示检索结果与待检索语素集的相关性,qi表示解析的语素,d表示单个检索文档,Wi表示语素qi的权重,R(qi,d)表示语素qi对文档d的相关性得分,N为检索集中文档总数,n(qi)为包含语素qi的文档数;b和k1为调节因子,fi为语素qi在检索文档d中出线的频率,dl为检索文档d的长度,avgdl为检索集中所有文档的平均长度。
优选地,所述根据检索结果与待检索语素集的相关性判断是否检索到对应文档包括:
若没有与语素对应相关的文档,则没有检索到该语素的对应文档;
若存在与语素对应相关的若干文档,则选取相关性最高的文档作为其检索结果。
本发明第二方面提供一种问答检索系统,其用于实施本发明第一方面所述的问答检索方法,所述系统包括:
文本接收单元,被配置为接收待检索文本;
语素解析单元,被配置为对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
检索单元,被配置为根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
确定单元,被配置为根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
判断及输出单元,被配置为根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
本发明第三方面提供提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行第一方面实施例所述问答检索方法的步骤。
本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现如本发明第一方面所述问答检索方法的步骤。
在以上技术方案中,通过语素解析的作用,便于将检索文本进行切分,从而方便后期加权操作,通过词向量预处理的作用,便于将文本数据转换成计算机能识别的数据,方便计算机识别,然后更新表示来预测其上下文,共享相似上下文的文本在向量空间中彼此接近,提高多个语素词组的词义之间的关联性;再通过BM25算法加权的作用,对检索文本的语素进行加权,从文本中识别出最重要的单词,并在将单词组合成文本表示时赋予它们更大的权重,利用其相关性的高低,提高检索结果的精准性。此外,通过对修改部分进行处理的作用,便于根据操作人员需求针对修改检索文本,实时对操作人员的检索文本进行答复,且通过改变量与待检索文本的对比,避免重复量继续进行计算操作,减少计算量,降低检索时间,提高问答检索的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例一所述一种问答检索方法流程图。
图2为本发明实施例二所述一种问答检索系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
如图1所示,本发明实施例一提供一种问答检索方法,包括如下步骤:
S1、接收待检索文本。
S2、对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素。
S3、根据待检索语素集进行检索得到与待检索语素集对应的检索结果;具体而言,所述检索结果为检索集中与所述待检索语素集对应的文本数据。
S4、根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性。
S5、根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
具体而言,对所述待检索文本进行语素解析是指对检索文本进行切分,根据语素定义要求切分成独立存在的语素集合,其中,语素是指最小语音语义的结合体,是语言最小的单位,包括单音节语素、双音节语素和多音节语素。
举例而言,本实施例方法用于进行问答检索,例如输入待检索文本为“广州在中国的什么位置”,则对待检索文本进行语素分析后得到语素:广州、中国、位置;根据语素“广州、中国、位置”查询检索集中文本数据,获取与语素“广州、中国、位置”相关的文本数据,其中,可能会查询得到多个文本数据,因此需进行步骤S4进一步判断检索结果是否可靠准确。
在一实施例中,所述步骤S3包括:
根据待检索语素集中语素确定检索集中与该待检索语素集中语素对应的文档,其中,所述检索集中包括多个文档。
在一实施例中,步骤S5中根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索包括:
根据所述文本修改信息对待检索文本进行更新得到更新后待检索文本;
对所述更新后待检索文本进行语素解析得到更新后待检索语素集,所述更新后待检索语素集包括一个或多个语素;
根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索,所述集合关系包括包含、相交以及相离。
具体而言,所述文本修改信息为对所述待检索文本进行修改更新的内容,本实施例中根据所述文本修改信息对待检索文本进行修改更新得到更新后检索文本,对所述更新后检索文本进行语素解析可以得到更新后待检索语素集更新后。
可以理解的是,更新前待检索语素集和更新后待检索语素集两者之间可能存在包含、相交以及相离的集合关系。其中,当文本修改信息为对待检索文本的内容进行删减,则所述更新前待检索语素集包含所述更新后待检索语素集;当文本修改信息为对待检索文本的部分内容进行修改,则会减少部分旧的语素,同时产生新的语素,则所述更新前待检索语素集与所述更新后待检索语素集之间关系为相交,既有相同的语素,也有不同的语素。当文本修改信息为将待检索文本替换为其他检索文本时,也就是说整个待检索文本都被修改了,更新前待检索文本与更新后检索文本不存在相同的语素内容时,则所述更新前待检索语素集与所述更新后待检索语素集之间关系为相离。
在一实施例中,所述根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索包括:
若更新前待检索语素集包含更新后待检索语素集,则返回步骤S4,根据更新前检索结果及更新后待检索语素集确定检索结果与更新后待检索语素集的相关性;具体而言,由于修改只是删减待检索文本内容,因此更新后的待检索文本实际上都已经检索过了,因此本实施例中对于删减待检索文本中内容的情况,直接重新确定检索结果与更新后待检索语素集的相关性,减少了重新检索,避免重复处理带来的计算耗损。
若更新前待检索语素集与更新后待检索语素集相交,则确定更新后待检索语素集中与更新前待检索语素集不同的语素,根据所述与更新前待检索语素集不同的语素进行检索得到二次检索结果,并合并所述二次检索结果和语速集更新前所对应的检索结果作为更新后待检索语素集所对应的检索结果,并将其返回至步骤S4中进一步确定更新后待检索语素集所对应的检索结果与更新后待检索语素集的相关性;具体而言,由于对待检索文本内容中的部分内容进行了修改,因此,更新后的待检索文本中有部分语素已经检索处理过了,有部分语素没有检索处理,因此本实施例中只对未检索处理的部分语素进行检索得到二次检索结果,然后将更新前待检索文本所对应的检索结果与所述二次检索结果合并作为更新后待检索语素集所对应的检索结果,并返回步骤S4进行相关性确定,因此减少了重新检索,避免重复处理带来的计算耗损。
若更新前待检索语素集与更新后待检索语素集相离,则返回步骤S3,对更新后待检索语素集进行检索得到与待检索语素集对应的检索结果。
在一实施例中,所述步骤S2包括:
采用word2vec训练词向量算法对待检索语素集中的一个或多个语素进行词向量预处理。
具体而言,本实施例中word2vec训练词向量算法包括:先对处理好的语素词组进行词向量编码,将文本数据转换成计算机能识别的数据,便于计算,本实施例中将其转换成数值型数据,然后更新表示来预测其上下文,共享相似上下文的文本在向量空间中彼此接近,根据特定的任务来定制文本表示,并且被训练以最大化模型的性能。
在一实施例中,所述步骤S4具体根据如下公式计算检索结果与待检索语素集的相关性:
其中,qi表示解析的语素,d表示单个检索文档,Wi表示语素qi的权重,R(qi,d)表示语素qi对文档d的相关性得分,N为检索文档的总数,n(qi)为包含语素qi的文档数;b和k1为调节因子,fi为语素qi在检索文档d中出线的频率,dl为检索文档d的长度,avgdl为检索集中所有文档的平均长度。
其中,Score(qi,d)为检索结果与待检索语素集的相关性,Score(qi,d)得分越高,则相关性越强。
在一实施例中,所述根据所述检索结果与待检索语素集的相关性判断是否检索到对应文档包括:
若没有与语素对应相关的文档,则没有检索到该语素的对应文档;
若存在与语素对应相关的若干文档,则选取相关性最高的文档作为其检索结果。
如图2所示,本发明实施例二还提供一种问答检索系统,其用于实施实施例一所述的问答检索方法,所述系统包括:
文本接收单元1,被配置为接收待检索文本;
语素解析单元2,被配置为对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
检索单元3,被配置为根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
确定单元4,被配置为根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
判断及输出单元5,被配置为根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
需说明的是,本实施例二所述系统用于实现实施例一所述方法,因此,关于本实施例二所述系统的相关部分可以参阅实施例一所述方法的内容得到,此处不再赘述。
此外,本发明实施例三还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行实施例一所述问答检索方法的步骤。
此外,本发明实施例四还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现实施例一所述问答检索方法的步骤。
通过以上实施例的描述可知,首先,通过语素解析的作用,便于将检索文本进行切分,从而方便后期加权操作,通过词向量预处理的作用,便于将文本数据转换成计算机能识别的数据,方便计算机识别,然后更新表示来预测其上下文,共享相似上下文的文本在向量空间中彼此接近,提高多个语素词组的词义之间的关联性,再通过BM25算法加权的作用,对检索文本的语素进行加权,从文本中识别出最重要的单词,并在将单词组合成文本表示时赋予它们更大的权重,利用其相关性的高低,提高检索结果的精准性;其次,通过对修改部分进行处理的作用,便于根据操作人员需求针对修改检索文本,实时对操作人员的检索文本进行答复,且通过改变量与待检索文本的对比,避免重复量继续进行计算操作,减少计算量,降低检索时间,提高问答检索的效率。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种问答检索方法,其特征在于,包括如下步骤:
S1、接收待检索文本;
S2、对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
S3、根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
S4、根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
S5、根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
2.如权利要求1所述的问答检索方法,其特征在于,所述步骤S3包括:
根据待检索语素集中语素确定检索集中与该待检索语素集中语素对应的文档,其中,所述检索集中包括多个文档。
3.如权利要求1所述的问答检索方法,其特征在于,所述根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索包括:
根据所述文本修改信息对待检索文本进行更新得到更新后待检索文本;
对所述更新后待检索文本进行语素解析得到更新后待检索语素集,所述更新后待检索语素集包括一个或多个语素;
根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索,所述集合关系包括包含、相交以及相离。
4.如权利要求3所述的问答检索方法,其特征在于,所述根据更新前待检索语素集和更新后待检索语素集的集合关系对所述更新后待检索语素集进行检索包括:
若更新前待检索语素集包含更新后待检索语素集,则返回步骤S4,根据更新前检索结果及更新后待检索语素集确定检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相交,则确定更新后待检索语素集中与更新前待检索语素集不同的语素,根据所述与更新前待检索语素集不同的语素进行检索得到二次检索结果,并合并所述二次检索结果和语速集更新前所对应的检索结果作为更新后待检索语素集所对应的检索结果,并将其返回至步骤S4中进一步确定更新后待检索语素集所对应的检索结果与更新后待检索语素集的相关性;
若更新前待检索语素集与更新后待检索语素集相离,则返回步骤S3,对更新后待检索语素集进行检索得到与待检索语素集对应的检索结果。
5.如权利要求1所述的问答检索方法,其特征在于,所述步骤S2包括:
采用word2vec训练词向量算法对待检索语素集中的一个或多个语素进行词向量预处理。
6.如权利要求1所述的问答检索方法,其特征在于,所述步骤S4具体根据如下公式计算检索结果与待检索语素集的相关性:
其中,Score(qi,d)表示检索结果与待检索语素集的相关性,qi表示解析的语素,d表示单个检索文档,Wi表示语素qi的权重,R(qi,d)表示语素qi对文档d的相关性得分,N为检索集中文档总数,n(qi)为包含语素qi的文档数;b和k1为调节因子,fi为语素qi在检索文档d中出线的频率,dl为检索文档d的长度,avgdl为检索集中所有文档的平均长度。
7.如权利要求1所述的问答检索方法,其特征在于,所述根据检索结果与待检索语素集的相关性判断是否检索到对应文档包括:
若没有与语素对应相关的文档,则没有检索到该语素的对应文档;
若存在与语素对应相关的若干文档,则选取相关性最高的文档作为其检索结果。
8.一种问答检索系统,其用于实施权利要求1-6任一项所述的问答检索方法,其特征在于,所述系统包括:
文本接收单元,被配置为接收待检索文本;
语素解析单元,被配置为对待检索文本进行语素解析得到待检索语素集,所述待检索语素集包括一个或多个语素;
检索单元,被配置为根据待检索语素集进行检索得到与待检索语素集对应的检索结果;
确定单元,被配置为根据检索结果及待检索语素集确定检索结果与待检索语素集的相关性;
判断及输出单元,被配置为根据检索结果与待检索语素集的相关性判断是否检索到对应文档,若是,则输出检索结果,若否,则进一步判断是否接收到文本修改信息,若未接收到文本修改信息,则输出待检索文本,若接收到文本修改信息,则根据文本修改信息更新待检索文本并根据更新后待检索文本进行检索。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至7中任一项所述问答检索方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,以实现如权利要求1至7中任一项所述问答检索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910678236.3A CN110413735B (zh) | 2019-07-25 | 2019-07-25 | 一种问答检索方法及其系统、计算机设备、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910678236.3A CN110413735B (zh) | 2019-07-25 | 2019-07-25 | 一种问答检索方法及其系统、计算机设备、可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110413735A true CN110413735A (zh) | 2019-11-05 |
CN110413735B CN110413735B (zh) | 2022-04-29 |
Family
ID=68363133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910678236.3A Active CN110413735B (zh) | 2019-07-25 | 2019-07-25 | 一种问答检索方法及其系统、计算机设备、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110413735B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708309A (zh) * | 2024-02-18 | 2024-03-15 | 粤港澳大湾区数字经济研究院(福田) | 检索问答方法、系统、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03172966A (ja) * | 1989-12-01 | 1991-07-26 | Nippon Telegr & Teleph Corp <Ntt> | 類似文書検索装置 |
CN101075252A (zh) * | 2007-06-21 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种网络搜索方法及系统 |
CN101251854A (zh) * | 2008-03-19 | 2008-08-27 | 深圳先进技术研究院 | 一种生成检索词条的方法及数据检索方法和系统 |
CN101377777A (zh) * | 2007-09-03 | 2009-03-04 | 北京百问百答网络技术有限公司 | 一种自动问答方法和系统 |
CN101599078A (zh) * | 2009-07-10 | 2009-12-09 | 腾讯科技(深圳)有限公司 | 一种文本检索的方法及装置 |
JP2012084094A (ja) * | 2010-10-14 | 2012-04-26 | Jvc Kenwood Corp | 番組検索装置および番組検索方法 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN106372087A (zh) * | 2015-07-23 | 2017-02-01 | 北京大学 | 一种面向信息检索的信息地图生成方法及其动态更新方法 |
-
2019
- 2019-07-25 CN CN201910678236.3A patent/CN110413735B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03172966A (ja) * | 1989-12-01 | 1991-07-26 | Nippon Telegr & Teleph Corp <Ntt> | 類似文書検索装置 |
CN101075252A (zh) * | 2007-06-21 | 2007-11-21 | 腾讯科技(深圳)有限公司 | 一种网络搜索方法及系统 |
CN101377777A (zh) * | 2007-09-03 | 2009-03-04 | 北京百问百答网络技术有限公司 | 一种自动问答方法和系统 |
CN101251854A (zh) * | 2008-03-19 | 2008-08-27 | 深圳先进技术研究院 | 一种生成检索词条的方法及数据检索方法和系统 |
CN101599078A (zh) * | 2009-07-10 | 2009-12-09 | 腾讯科技(深圳)有限公司 | 一种文本检索的方法及装置 |
JP2012084094A (ja) * | 2010-10-14 | 2012-04-26 | Jvc Kenwood Corp | 番組検索装置および番組検索方法 |
CN104598445A (zh) * | 2013-11-01 | 2015-05-06 | 腾讯科技(深圳)有限公司 | 自动问答系统和方法 |
CN106372087A (zh) * | 2015-07-23 | 2017-02-01 | 北京大学 | 一种面向信息检索的信息地图生成方法及其动态更新方法 |
Non-Patent Citations (1)
Title |
---|
王晶: ""基于Web信息获取的新闻数据分析研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708309A (zh) * | 2024-02-18 | 2024-03-15 | 粤港澳大湾区数字经济研究院(福田) | 检索问答方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110413735B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997370B2 (en) | Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time | |
US9483459B1 (en) | Natural language correction for speech input | |
US8463593B2 (en) | Natural language hypernym weighting for word sense disambiguation | |
KR100546743B1 (ko) | 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템 | |
KR101173561B1 (ko) | 질문 형태 및 도메인 인식 장치 및 그 방법 | |
US20100205198A1 (en) | Search query disambiguation | |
JP2007188352A (ja) | ページリランキング装置、ページリランキングプログラム | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
CN113821646A (zh) | 基于语义检索的智能化专利相似度搜索方法及装置 | |
US20100312778A1 (en) | Predictive person name variants for web search | |
CN103218373B (zh) | 一种相关搜索系统、方法及装置 | |
CN111104488B (zh) | 检索和相似度分析一体化的方法、装置和存储介质 | |
CN107894986B (zh) | 一种基于向量化的企业关系划分方法、服务器以及客户端 | |
US9754083B2 (en) | Automatic creation of clinical study reports | |
CN108763529A (zh) | 一种智能检索方法、装置和计算机可读存储介质 | |
CN104484374A (zh) | 一种创建网络百科词条的方法及装置 | |
CN107168991A (zh) | 一种搜索结果展示方法和装置 | |
CN108475266A (zh) | 用来移除匹配文档的匹配修复 | |
CN110413735A (zh) | 一种问答检索方法及其系统、计算机设备、可读存储介质 | |
CN117076598A (zh) | 基于自适应权重的语义检索模型融合方法及系统 | |
CN110929501B (zh) | 文本分析方法和装置 | |
KR20030006201A (ko) | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 | |
JP3894428B2 (ja) | 情報抽出方法、情報検索方法及び情報抽出コンピュータプログラム | |
JP4526080B2 (ja) | 方法説明検索装置およびプログラム | |
Bahrami et al. | SEUPD@ CLEF: Team INTSEG on Argument Retrieval for Controversial Questions. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |