CN114218371A - 多级目录名称检索匹配方法、装置、设备及介质 - Google Patents
多级目录名称检索匹配方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114218371A CN114218371A CN202111552666.4A CN202111552666A CN114218371A CN 114218371 A CN114218371 A CN 114218371A CN 202111552666 A CN202111552666 A CN 202111552666A CN 114218371 A CN114218371 A CN 114218371A
- Authority
- CN
- China
- Prior art keywords
- directory
- keyword
- keyword set
- keywords
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术,提供了多级目录名称检索匹配方法、装置、设备及介质,是先在确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集,然后根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集,根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果,最后根据第二次检索结果中个检索结果的条数对应进行通知处理。实现了将多目录名称结合多种模式进行检索,提升了数据检索的准确率。
Description
技术领域
本发明涉及人工智能的语音语义技术领域,尤其涉及一种多级目录名称检索匹配方法、装置、计算机设备及存储介质。
背景技术
目前,现有的目录检索方式是用户先录入检索内容,然后在目标目录表中做模糊查询,如包含此检索内容即为匹配成功。但若检索内容对应名称较长,且与目标目录表相应的标准命名方式与不一致,存在很多名词或者形容词不在同一位置的名称匹配不上的情况,以及存在一些后缀不一致匹配不上的情况,这就导致基于现有的模糊查询的方式检索准确率较低。
而且,一些内容简单的检索内容,会在目标目录表中匹配到多条数据,若是随机取一条作为检索结果,易导致应该匹配结果的不是最佳检索结果,也即检索准确率较低。
发明内容
本发明实施例提供了一种多级目录名称检索匹配方法、装置、计算机设备及存储介质,旨在解决现有技术中的目录检索方式是用户先录入检索内容,然后在目标目录表中做模糊查询,若检索内容对应名称较长,且与目标目录表相应的标准命名方式与不一致,导致基于现有的模糊查询的方式检索准确率较低的问题。
第一方面,本发明实施例提供了一种多级目录名称检索匹配方法,其包括:
接收上传端发送的多目录名称,根据所述多目录名称在模型库中进行检索,得到第一次检索结果;其中,所述多目录名称由多层级名称组成;
若确定所述第一次检索结果为在所述模型库中存在所述多目录名称,获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示;
若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集;
根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集;
根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果;
若确定所述第二次检索结果中包括多条检索结果,将所述多目录名称及所述第二次检索结果发送至人工客服终端,并接收人工客户终端发送的与所述第二次检索结果相应的人工核对结果,将所述人工核对结果存储至所述模型库以更新模型库;以及
若确定所述第二次检索结果中包括一条检索结果,将所述第二次检索结果发送至上传端。
第二方面,本发明实施例提供了一种多级目录名称检索匹配装置,其包括:
第一检索单元,用于接收上传端发送的多目录名称,根据所述多目录名称在模型库中进行检索,得到第一次检索结果;其中,所述多目录名称由多层级名称组成;
第一目标内容获取单元,用于若确定所述第一次检索结果为在所述模型库中存在所述多目录名称,获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示;
关键词抽取单元,用于若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集;
关键词组合单元,用于根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集;
第二检索单元,用于根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果;
第一反馈单元,用于若确定所述第二次检索结果中包括多条检索结果,将所述多目录名称及所述第二次检索结果发送至人工客服终端,并接收人工客户终端发送的与所述第二次检索结果相应的人工核对结果,将所述人工核对结果存储至所述模型库以更新模型库;以及
第二反馈单元,用于若确定所述第二次检索结果中包括一条检索结果,将所述第二次检索结果发送至上传端。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的多级目录名称检索匹配方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的多级目录名称检索匹配方法。
本发明实施例提供了一种多级目录名称检索匹配方法、装置、计算机设备及存储介质,先在确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集,然后根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集,根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果,最后根据第二次检索结果中个检索结果的条数对应进行通知处理。实现了将多目录名称结合多种模式进行检索,提升了数据检索的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的多级目录名称检索匹配方法的应用场景示意图;
图2为本发明实施例提供的多级目录名称检索匹配方法的流程示意图;
图3为本发明实施例提供的多级目录名称检索匹配装置的示意性框图;
图4为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的多级目录名称检索匹配方法的应用场景示意图;图2为本发明实施例提供的多级目录名称检索匹配方法的流程示意图,该多级目录名称检索匹配方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S107。
S101、接收上传端发送的多目录名称,根据所述多目录名称在模型库中进行检索,得到第一次检索结果;其中,所述多目录名称由多层级名称组成。
在本实施例中,是以服务器为执行主体描述技术方案。当用户需要检索一个本质上是长文本段(例如该长文本段的总字数超过20个)且包括多层级名称的多目录名称时,若以仅仅只限定以原文为检索条件,可能多目录名称中某一级或多级名称与模型库的目录名称存在细微区别的情况,这样仅以原文为检索条件一般很难得到满意的检索结果。此时,为了提高检索的效率,可以尝试多模式结合的方式来进行检索,也就是不局限于仅以原文为检索条件的单检索模式来进行检索。其中,模型库可以理解为包含多个历史多目录名称的数据库,用户可以根据当前输入的多目录名称在模型库中检索是否存在对应数据。
S102、若确定所述第一次检索结果为在所述模型库中存在所述多目录名称,获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示。
在本实施例中,仍可以保留以原文为检索条件来进行检索,这是考虑到有些用户是熟知模型库中多目录名称的命名规则,故其上传的多目录名称是符合模型库中命名规则的,此时在确定了以多目录名称的原文为检索条件能在所述模型库中检索到相应结果,则获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示。可见,保留这种原始的检索匹配方式,能确保检索效率。
S103、若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集。
在本实施例中,若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,则表明以多目录名称的原文为检索条件无法在所述模型库中检索到相应结果,需要采用另一种模式来实现检索,此时可以采用关键词检索及语义检索相结合的方式做进一步的检索以得到更为全面的检索结果。
在一实施例中,步骤S103包括:
将所述多目录名称通过基于概率统计分词模型进行分词,得到分词结果;
通过词频-逆文本频率指数模型获取所述分词结果中各分词的词频-逆文本频率指数,并将各分词按照词频-逆文本频率指数进行降序排序得到分词排序结果,获取分词排序结果中排名未超出预设的排名阈值的目标分词,组成目录关键词集。
在本实施例中,先通过基于概率统计分词模型对所述多目录名称进行文本分词,得到对应的分词结果,然后通过词频-逆文本频率指数模型对所述分词结果进行关键词抽取得到对应的关键词集合。其中,基于概率统计分词模型和词频-逆文本频率指数模型均是比较成熟的现有技术,此处不再展开论述。其中,需要强调的是通过词频-逆文本频率指数模型(也可以称为词频-逆向文件频率模型,即TF-IDF模型)对所述分词结果进行关键词抽取得到对应的关键词集合时,抽取所述分词结果按词频-逆文本频率指数降序排序后位于预设的排名值之前的关键词,以组成目录关键词集。
S104、根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集。
在本实施例中,为了实现更快速的获取作为检索条件的组合关键词集,此时可以先获取服务器中预先存储的关键词筛选组合策略以从所述目录关键词集中筛选若干满足条件的关键词并进行组合,从而得到组合结果。
在一实施例中,作为步骤S104的第一具体实施例,所述关键词筛选组合策略用于从所述目录关键词集中筛选若干个名词词性关键词进行组合,步骤S104包括:
获取所述目录关键词集中具有名词词性的目录关键词,组成第一次筛选后关键词集;
获取预设的关键词筛选个数,以及第一次筛选后关键词集中词频-逆文本频率指数排名未超出所述关键词筛选个数的目标关键词,组成第二次筛选后关键词集;
将所述第二次筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集。
在本实施例中,为了根据所述目录关键词集进行更加全面的检索,此时可以对目录关键词集进行进一步的筛选和组合,例如可以先仅仅只保留其中名称词性的关键词组成第一次筛选后关键词集,然后获取第一次筛选后关键词集中词频-逆文本频率指数排名未超出所述关键词筛选个数的目标关键词以组成第二次筛选后关键词集,通过上述处理后即可获取关键词个数等于预设的关键词筛选个数的第二次筛选后关键词集。
例如将关键词筛选个数设置为4个,则第二次筛选后关键词集中包括4个名词词性的目录关键词且分别记为W1、W2、W3和W4;将上述W1、W2、W3和W4这4个目录关键词进行组合时,可以得到单关键词组合结果W1、W2、W3和W4,双关键词组合结果W1+W2、W1+W3、W1+W4、W2+W3、W2+W4和W3+W4,三关键词组合W1+W2+W3、W1+W2+W4、W1+W3+W4和W2+W3+W4,四关键词组合W1+W2+W3+W4。最终可以由单关键词组合结果、双关键词组合结果、三关键词组合结果和四关键词组合结果组成组合关键词集。可见,通过上述方式对目录关键词集中的目录关键词进行筛选和组合,能得到数据更加全面的组合关键词集。
在一实施例中,作为步骤S104的第二具体实施例,所述关键词筛选组合策略用于从所述目录关键词集中筛选重要排序值排名未超出关键词筛选个数的关键词进行组合,步骤S104包括:
获取所述目录关键词集中各目录关键词在所述多目录名称中位置顺序,及各位置顺序分别对应的位置序号权重值;
获取所述目录关键词集中各目录关键词分别对应的词频-逆文本频率指数值;
将所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值相乘,得到所述目录关键词集中各目录关键词分别对应的重要排序值;
将所述目录关键词集根据各目录关键词的重要排序值进行降序排序,得到降序排序结果;
获取预设的关键词筛选个数,以及所述降序排序结果中重要排序值排名未超出所述关键词筛选个数的关键词,组成重要词筛选后关键词集;
将所述重要词筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集。
在本实施例中,为了根据所述目录关键词集进行更加全面的检索,此时可以对目录关键词集进行进一步的筛选和组合,具体是先确定所述目录关键词集中各目录关键词在所述多目录名称中位置顺序,及各位置顺序分别对应的位置序号权重值。例如所述目录关键词集中包括10个目录关键词,而且这10个目录关键词可以分别按照在多目录名称中出现的位置顺序进行编号,例如最先出现的目录关键词的位置编号是1,第二出现的目录关键词的位置编号是2,以此类推,直至将上述10个目录关键词均完成了位置编号赋值。由于在多目录名称中先出现的关键词重要程度更高,后出现的关键词重要程度较低,此时可以进一步根据各目录关键词的位置编号(也可以理解为位置序号)和预先设置的位置编号权重对应清单(在该位置编号权重对应清单设置了每一个位置编号分别对应的位置序号权重值,如位置序号为1是对应位置序号权重值为0.15,位置序号为1是对应位置序号权重值为0.13、位置序号为3是对应位置序号权重值为0.11等)。在获取了所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值之后,将所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值相乘,得到所述目录关键词集中各目录关键词分别对应的重要排序值。此时即可根据各目录关键词分别对应的重要排序值进行降序排序,得到降序排序结果。最后获取所述降序排序结果中重要排序值排名未超出所述关键词筛选个数的关键词,组成重要词筛选后关键词集,通过上述处理后即可获取关键词个数等于预设的关键词筛选个数的重要词筛选后关键词集。
在一实施例中,所述将所述重要词筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集,包括:
根据组合个数从所述重要词筛选后关键词集筛选关键词进行组合,得到组合关键词集;其中,所述组合个数的取值从1开始,不断自增1直至取值为所述关键词筛选个数。
例如将关键词筛选个数设置为4个,则重要词筛选后关键词集包括4个名词词性的目录关键词且分别记为W1、W2、W3和W4;仍然参照步骤S104的第一具体实施例中的关键词组合方式,即将上述W1、W2、W3和W4这4个目录关键词进行组合时,可以得到单关键词组合结果W1、W2、W3和W4,双关键词组合结果W1+W2、W1+W3、W1+W4、W2+W3、W2+W4和W3+W4,三关键词组合W1+W2+W3、W1+W2+W4、W1+W3+W4和W2+W3+W4,四关键词组合W1+W2+W3+W4。最终可以由单关键词组合结果、双关键词组合结果、三关键词组合结果和四关键词组合结果组成组合关键词集。可见,通过上述方式对目录关键词集中的目录关键词进行筛选和组合,能得到数据更加全面的组合关键词集。
S105、根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果。
在本实施例中,当获取到了所述组合关键词集后,以所述组合关键词集中各组合关键词为检索条件在所述模型库中进行检索,从而得到各组合关键词分别对应的检索结果,组成了第二次检索结果。
在一实施例中,步骤S105包括:
所述模型库分别以各组合关键词为检索条件进行检索,得到与各组合关键词分别对应的分组检索结果;
将各分组检索结果中进行结果组合和结果去重,得到第二次检索结果。
在本实施例中,分别以各组合关键词为检索条件在所述模型库中进行检索时,得到的检索结果会存在重复的情况,此时只需将各分组检索结果中进行结果组合和结果去重,得到第二次检索结果。通过这一去重方式,可以有效减少检索结果中的重复数据以更直观的展示给用户查看。
S106、若确定所述第二次检索结果中包括多条检索结果,将所述多目录名称及所述第二次检索结果发送至人工客服终端,并接收人工客户终端发送的与所述第二次检索结果相应的人工核对结果,将所述人工核对结果存储至所述模型库以更新模型库。
在本实施例中,若确定所述第二次检索结果中包括多条检索结果,表示多目录名称在模型库中检索到了多个结果,若为了给用户推荐最为精准的检索结果,可以将所述多目录名称及所述第二次检索结果发送至人工客服终端,由人工客服终端的操作者去人工核对所述第二次检索结果中最满足条件的检索结果并编辑为人工核对结果,最后将所述人工核对结果存储至所述模型库以更新模型库实现多检索结果下的精准结果反馈。
S107、若确定所述第二次检索结果中包括一条检索结果,将所述第二次检索结果发送至上传端。
在本实施例中,若确定所述第二次检索结果中包括一条检索结果,表示多目录名称在模型库中检索到了1个结果,该结果即可作为与多目录名称相对应的检索结果,直接将将所述第二次检索结果发送至上传端以供用户查看即可。
在一实施例中,步骤S105之后还包括:
若确定所述第二次检索结果为空,获取人工匹配信息,将所述人工匹配信息存储至所述模型库以更新模型库。
在本实施例中,若确定所述第二次检索结果为空,表示多目录名称在模型库中未检索到任何结果,此时需要人工操作编辑与所述多目录名称相同的人工匹配信息,然后将人工匹配信息基于模型库中各历史多目录名称命名规则进行验证,验证通过后将所述人工匹配信息存储至所述模型库以更新模型库。通过上述方式,实现对模型库的数据扩充,使其包括的数据量更多,有利于后续提高检索的准确性。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
该方法实现了将多目录名称结合多种模式进行检索,提升了数据检索的准确率。
本发明实施例还提供一种多级目录名称检索匹配装置,该多级目录名称检索匹配装置用于执行前述多级目录名称检索匹配方法的任一实施例。具体地,请参阅图3,图3是本发明实施例提供的多级目录名称检索匹配装置100的示意性框图。
其中,如图3所示,多级目录名称检索匹配装置100包括第一检索单元101、第一目标内容获取单元102、关键词抽取单元103、关键词组合单元104、第二检索单元105、第一反馈单元106和第二反馈单元107。
第一检索单元101,用于接收上传端发送的多目录名称,根据所述多目录名称在模型库中进行检索,得到第一次检索结果;其中,所述多目录名称由多层级名称组成。
在本实施例中,是以服务器为执行主体描述技术方案。当用户需要检索一个本质上是长文本段(例如该长文本段的总字数超过20个)且包括多层级名称的多目录名称时,若以仅仅只限定以原文为检索条件,可能多目录名称中某一级或多级名称与模型库的目录名称存在细微区别的情况,这样仅以原文为检索条件一般很难得到满意的检索结果。此时,为了提高检索的效率,可以尝试多模式结合的方式来进行检索,也就是不局限于仅以原文为检索条件的单检索模式来进行检索。其中,模型库可以理解为包含多个历史多目录名称的数据库,用户可以根据当前输入的多目录名称在模型库中检索是否存在对应数据。
第一目标内容获取单元102,用于若确定所述第一次检索结果为在所述模型库中存在所述多目录名称,获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示。
在本实施例中,仍可以保留以原文为检索条件来进行检索,这是考虑到有些用户是熟知模型库中多目录名称的命名规则,故其上传的多目录名称是符合模型库中命名规则的,此时在确定了以多目录名称的原文为检索条件能在所述模型库中检索到相应结果,则获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示。可见,保留这种原始的检索匹配方式,能确保检索效率。
关键词抽取单元103,用于若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集。
在本实施例中,若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,则表明以多目录名称的原文为检索条件无法在所述模型库中检索到相应结果,需要采用另一种模式来实现检索,此时可以采用关键词检索及语义检索相结合的方式做进一步的检索以得到更为全面的检索结果。
在一实施例中,关键词抽取单元103具体用于:
将所述多目录名称通过基于概率统计分词模型进行分词,得到分词结果;
通过词频-逆文本频率指数模型获取所述分词结果中各分词的词频-逆文本频率指数,并将各分词按照词频-逆文本频率指数进行降序排序得到分词排序结果,获取分词排序结果中排名未超出预设的排名阈值的目标分词,组成目录关键词集。
在本实施例中,先通过基于概率统计分词模型对所述多目录名称进行文本分词,得到对应的分词结果,然后通过词频-逆文本频率指数模型对所述分词结果进行关键词抽取得到对应的关键词集合。其中,基于概率统计分词模型和词频-逆文本频率指数模型均是比较成熟的现有技术,此处不再展开论述。其中,需要强调的是通过词频-逆文本频率指数模型(也可以称为词频-逆向文件频率模型,即TF-IDF模型)对所述分词结果进行关键词抽取得到对应的关键词集合时,抽取所述分词结果按词频-逆文本频率指数降序排序后位于预设的排名值之前的关键词,以组成目录关键词集。
关键词组合单元104,用于根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集。
在本实施例中,为了实现更快速的获取作为检索条件的组合关键词集,此时可以先获取服务器中预先存储的关键词筛选组合策略以从所述目录关键词集中筛选若干满足条件的关键词并进行组合,从而得到组合结果。
在一实施例中,作为关键词组合单元104的第一具体实施例,所述关键词筛选组合策略用于从所述目录关键词集中筛选若干个名词词性关键词进行组合,关键词组合单元104具体用于:
获取所述目录关键词集中具有名词词性的目录关键词,组成第一次筛选后关键词集;
获取预设的关键词筛选个数,以及第一次筛选后关键词集中词频-逆文本频率指数排名未超出所述关键词筛选个数的目标关键词,组成第二次筛选后关键词集;
将所述第二次筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集。
在本实施例中,为了根据所述目录关键词集进行更加全面的检索,此时可以对目录关键词集进行进一步的筛选和组合,例如可以先仅仅只保留其中名称词性的关键词组成第一次筛选后关键词集,然后获取第一次筛选后关键词集中词频-逆文本频率指数排名未超出所述关键词筛选个数的目标关键词以组成第二次筛选后关键词集,通过上述处理后即可获取关键词个数等于预设的关键词筛选个数的第二次筛选后关键词集。
例如将关键词筛选个数设置为4个,则第二次筛选后关键词集中包括4个名词词性的目录关键词且分别记为W1、W2、W3和W4;将上述W1、W2、W3和W4这4个目录关键词进行组合时,可以得到单关键词组合结果W1、W2、W3和W4,双关键词组合结果W1+W2、W1+W3、W1+W4、W2+W3、W2+W4和W3+W4,三关键词组合W1+W2+W3、W1+W2+W4、W1+W3+W4和W2+W3+W4,四关键词组合W1+W2+W3+W4。最终可以由单关键词组合结果、双关键词组合结果、三关键词组合结果和四关键词组合结果组成组合关键词集。可见,通过上述方式对目录关键词集中的目录关键词进行筛选和组合,能得到数据更加全面的组合关键词集。
在一实施例中,作为关键词组合单元104的第二具体实施例,所述关键词筛选组合策略用于从所述目录关键词集中筛选重要排序值排名未超出关键词筛选个数的关键词进行组合,关键词组合单元104具体用于:
获取所述目录关键词集中各目录关键词在所述多目录名称中位置顺序,及各位置顺序分别对应的位置序号权重值;
获取所述目录关键词集中各目录关键词分别对应的词频-逆文本频率指数值;
将所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值相乘,得到所述目录关键词集中各目录关键词分别对应的重要排序值;
将所述目录关键词集根据各目录关键词的重要排序值进行降序排序,得到降序排序结果;
获取预设的关键词筛选个数,以及所述降序排序结果中重要排序值排名未超出所述关键词筛选个数的关键词,组成重要词筛选后关键词集;
将所述重要词筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集。
在本实施例中,为了根据所述目录关键词集进行更加全面的检索,此时可以对目录关键词集进行进一步的筛选和组合,具体是先确定所述目录关键词集中各目录关键词在所述多目录名称中位置顺序,及各位置顺序分别对应的位置序号权重值。例如所述目录关键词集中包括10个目录关键词,而且这10个目录关键词可以分别按照在多目录名称中出现的位置顺序进行编号,例如最先出现的目录关键词的位置编号是1,第二出现的目录关键词的位置编号是2,以此类推,直至将上述10个目录关键词均完成了位置编号赋值。由于在多目录名称中先出现的关键词重要程度更高,后出现的关键词重要程度较低,此时可以进一步根据各目录关键词的位置编号(也可以理解为位置序号)和预先设置的位置编号权重对应清单(在该位置编号权重对应清单设置了每一个位置编号分别对应的位置序号权重值,如位置序号为1是对应位置序号权重值为0.15,位置序号为1是对应位置序号权重值为0.13、位置序号为3是对应位置序号权重值为0.11等)。在获取了所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值之后,将所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值相乘,得到所述目录关键词集中各目录关键词分别对应的重要排序值。此时即可根据各目录关键词分别对应的重要排序值进行降序排序,得到降序排序结果。最后获取所述降序排序结果中重要排序值排名未超出所述关键词筛选个数的关键词,组成重要词筛选后关键词集,通过上述处理后即可获取关键词个数等于预设的关键词筛选个数的重要词筛选后关键词集。
在一实施例中,所述将所述重要词筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集,包括:
根据组合个数从所述重要词筛选后关键词集筛选关键词进行组合,得到组合关键词集;其中,所述组合个数的取值从1开始,不断自增1直至取值为所述关键词筛选个数。
例如将关键词筛选个数设置为4个,则重要词筛选后关键词集包括4个名词词性的目录关键词且分别记为W1、W2、W3和W4;仍然参照步骤S104的第一具体实施例中的关键词组合方式,即将上述W1、W2、W3和W4这4个目录关键词进行组合时,可以得到单关键词组合结果W1、W2、W3和W4,双关键词组合结果W1+W2、W1+W3、W1+W4、W2+W3、W2+W4和W3+W4,三关键词组合W1+W2+W3、W1+W2+W4、W1+W3+W4和W2+W3+W4,四关键词组合W1+W2+W3+W4。最终可以由单关键词组合结果、双关键词组合结果、三关键词组合结果和四关键词组合结果组成组合关键词集。可见,通过上述方式对目录关键词集中的目录关键词进行筛选和组合,能得到数据更加全面的组合关键词集。
第二检索单元105,用于根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果。
在本实施例中,当获取到了所述组合关键词集后,以所述组合关键词集中各组合关键词为检索条件在所述模型库中进行检索,从而得到各组合关键词分别对应的检索结果,组成了第二次检索结果。
在一实施例中,第二检索单元105具体用于:
所述模型库分别以各组合关键词为检索条件进行检索,得到与各组合关键词分别对应的分组检索结果;
将各分组检索结果中进行结果组合和结果去重,得到第二次检索结果。
在本实施例中,分别以各组合关键词为检索条件在所述模型库中进行检索时,得到的检索结果会存在重复的情况,此时只需将各分组检索结果中进行结果组合和结果去重,得到第二次检索结果。通过这一去重方式,可以有效减少检索结果中的重复数据以更直观的展示给用户查看。
第一反馈单元106,用于若确定所述第二次检索结果中包括多条检索结果,将所述多目录名称及所述第二次检索结果发送至人工客服终端,并接收人工客户终端发送的与所述第二次检索结果相应的人工核对结果,将所述人工核对结果存储至所述模型库以更新模型库。
在本实施例中,若确定所述第二次检索结果中包括多条检索结果,表示多目录名称在模型库中检索到了多个结果,若为了给用户推荐最为精准的检索结果,可以将所述多目录名称及所述第二次检索结果发送至人工客服终端,由人工客服终端的操作者去人工核对所述第二次检索结果中最满足条件的检索结果并编辑为人工核对结果,最后将所述人工核对结果存储至所述模型库以更新模型库实现多检索结果下的精准结果反馈。
第二反馈单元107,用于若确定所述第二次检索结果中包括一条检索结果,将所述第二次检索结果发送至上传端。
在本实施例中,若确定所述第二次检索结果中包括一条检索结果,表示多目录名称在模型库中检索到了1个结果,该结果即可作为与多目录名称相对应的检索结果,直接将将所述第二次检索结果发送至上传端以供用户查看即可。
在一实施例中,多级目录名称检索匹配装置100还包括:
第三反馈单元,用于若确定所述第二次检索结果为空,获取人工匹配信息,将所述人工匹配信息存储至所述模型库以更新模型库。
在本实施例中,若确定所述第二次检索结果为空,表示多目录名称在模型库中未检索到任何结果,此时需要人工操作编辑与所述多目录名称相同的人工匹配信息,然后将人工匹配信息基于模型库中各历史多目录名称命名规则进行验证,验证通过后将所述人工匹配信息存储至所述模型库以更新模型库。通过上述方式,实现对模型库的数据扩充,使其包括的数据量更多,有利于后续提高检索的准确性。
该装置实现了将多目录名称结合多种模式进行检索,提升了数据检索的准确率。
上述多级目录名称检索匹配装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,也可以是服务器集群。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图4,该计算机设备500包括通过装置总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括存储介质503和内存储器504。
该存储介质503可存储操作装置5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行多级目录名称检索匹配方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行多级目录名称检索匹配方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的多级目录名称检索匹配方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的多级目录名称检索匹配方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,后台服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种多级目录名称检索匹配方法,其特征在于,包括:
接收上传端发送的多目录名称,根据所述多目录名称在模型库中进行检索,得到第一次检索结果;其中,所述多目录名称由多层级名称组成;
若确定所述第一次检索结果为在所述模型库中存在所述多目录名称,获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示;
若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集;
根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集;
根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果;
若确定所述第二次检索结果中包括多条检索结果,将所述多目录名称及所述第二次检索结果发送至人工客服终端,并接收人工客户终端发送的与所述第二次检索结果相应的人工核对结果,将所述人工核对结果存储至所述模型库以更新模型库;以及
若确定所述第二次检索结果中包括一条检索结果,将所述第二次检索结果发送至上传端。
2.根据权利要求1所述的多级目录名称检索匹配方法,其特征在于,所述根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果之后,还包括:
若确定所述第二次检索结果为空,获取人工匹配信息,将所述人工匹配信息存储至所述模型库以更新模型库。
3.根据权利要求1所述的多级目录名称检索匹配方法,其特征在于,所述将所述多目录名称进行关键词抽取,得到目录关键词集,包括:
将所述多目录名称通过基于概率统计分词模型进行分词,得到分词结果;
通过词频-逆文本频率指数模型获取所述分词结果中各分词的词频-逆文本频率指数,并将各分词按照词频-逆文本频率指数进行降序排序得到分词排序结果,获取分词排序结果中排名未超出预设的排名阈值的目标分词,组成目录关键词集。
4.根据权利要求1所述的多级目录名称检索匹配方法,其特征在于,所述关键词筛选组合策略用于从所述目录关键词集中筛选若干个名词词性关键词进行组合;
所述根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集,包括:
获取所述目录关键词集中具有名词词性的目录关键词,组成第一次筛选后关键词集;
获取预设的关键词筛选个数,以及第一次筛选后关键词集中词频-逆文本频率指数排名未超出所述关键词筛选个数的目标关键词,组成第二次筛选后关键词集;
将所述第二次筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集。
5.根据权利要求1所述的多级目录名称检索匹配方法,其特征在于,所述关键词筛选组合策略用于从所述目录关键词集中筛选重要排序值排名未超出关键词筛选个数的关键词进行组合;
所述根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集,包括:
获取所述目录关键词集中各目录关键词在所述多目录名称中位置顺序,及各位置顺序分别对应的位置序号权重值;
获取所述目录关键词集中各目录关键词分别对应的词频-逆文本频率指数值;
将所述目录关键词集中各目录关键词分别对应的位置序号权重值与词频-逆文本频率指数值相乘,得到所述目录关键词集中各目录关键词分别对应的重要排序值;
将所述目录关键词集根据各目录关键词的重要排序值进行降序排序,得到降序排序结果;
获取预设的关键词筛选个数,以及所述降序排序结果中重要排序值排名未超出所述关键词筛选个数的关键词,组成重要词筛选后关键词集;
将所述重要词筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集。
6.根据权利要求5所述的多级目录名称检索匹配方法,其特征在于,所述将所述重要词筛选后关键词集中包括的各关键词根据所述关键词筛选个数进行组合,得到组合关键词集,包括:
根据组合个数从所述重要词筛选后关键词集筛选关键词进行组合,得到组合关键词集;其中,所述组合个数的取值从1开始,不断自增1直至取值为所述关键词筛选个数。
7.根据权利要求1所述的多级目录名称检索匹配方法,其特征在于,所述根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果,包括:
所述模型库分别以各组合关键词为检索条件进行检索,得到与各组合关键词分别对应的分组检索结果;
将各分组检索结果中进行结果组合和结果去重,得到第二次检索结果。
8.一种多级目录名称检索匹配装置,其特征在于,包括:
第一检索单元,用于接收上传端发送的多目录名称,根据所述多目录名称在模型库中进行检索,得到第一次检索结果;其中,所述多目录名称由多层级名称组成;
第一目标内容获取单元,用于若确定所述第一次检索结果为在所述模型库中存在所述多目录名称,获取与所述多目录名称相应的目标内容,并根据所述多目录名称进行匹配成功的提示;
关键词抽取单元,用于若确定所述第一次检索结果为在所述模型库中不存在所述多目录名称,将所述多目录名称进行关键词抽取,得到目录关键词集;
关键词组合单元,用于根据预设的关键词筛选组合策略从所述目录关键词集中筛选若干个关键词进行组合,得到组合关键词集;
第二检索单元,用于根据所述组合关键词集中各组合关键词在所述模型库中进行检索,得到第二次检索结果;
第一反馈单元,用于若确定所述第二次检索结果中包括多条检索结果,将所述多目录名称及所述第二次检索结果发送至人工客服终端,并接收人工客户终端发送的与所述第二次检索结果相应的人工核对结果,将所述人工核对结果存储至所述模型库以更新模型库;以及
第二反馈单元,用于若确定所述第二次检索结果中包括一条检索结果,将所述第二次检索结果发送至上传端。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的多级目录名称检索匹配方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的多级目录名称检索匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111552666.4A CN114218371A (zh) | 2021-12-17 | 2021-12-17 | 多级目录名称检索匹配方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111552666.4A CN114218371A (zh) | 2021-12-17 | 2021-12-17 | 多级目录名称检索匹配方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114218371A true CN114218371A (zh) | 2022-03-22 |
Family
ID=80703725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111552666.4A Pending CN114218371A (zh) | 2021-12-17 | 2021-12-17 | 多级目录名称检索匹配方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114218371A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610958A (zh) * | 2022-05-10 | 2022-06-10 | 上海飞旗网络技术股份有限公司 | 一种传输资源的处理方法、装置及电子设备 |
CN117763106A (zh) * | 2023-12-11 | 2024-03-26 | 中国科学院文献情报中心 | 一种文献查重的方法、装置、存储介质及电子设备 |
-
2021
- 2021-12-17 CN CN202111552666.4A patent/CN114218371A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610958A (zh) * | 2022-05-10 | 2022-06-10 | 上海飞旗网络技术股份有限公司 | 一种传输资源的处理方法、装置及电子设备 |
CN117763106A (zh) * | 2023-12-11 | 2024-03-26 | 中国科学院文献情报中心 | 一种文献查重的方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896212B2 (en) | System and methods for automating trademark and service mark searches | |
US11100124B2 (en) | Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches | |
JP3664874B2 (ja) | 文書検索装置 | |
US20160260033A1 (en) | Systems and Methods for Similarity and Context Measures for Trademark and Service Mark Analysis and Repository Searchess | |
US20070088690A1 (en) | System and method for performing file searches and ranking results | |
CN114218371A (zh) | 多级目录名称检索匹配方法、装置、设备及介质 | |
CN105069103B (zh) | App搜索引擎利用用户评论的方法及系统 | |
WO2005083597A1 (en) | Intelligent search and retrieval system and method | |
JP2012525645A (ja) | 知識ベース構築の方法および装置 | |
CN105404688A (zh) | 搜索方法和搜索设备 | |
CN109885651B (zh) | 一种问题推送方法和装置 | |
CN111400323A (zh) | 数据检索方法、系统、设备及存储介质 | |
CN110889023A (zh) | 一种elasticsearch的分布式多功能搜索引擎 | |
CN110569419A (zh) | 问答系统优化方法、装置、计算机设备及存储介质 | |
CN110413757B (zh) | 一种词语释义确定方法、装置及系统 | |
CN115730039A (zh) | 基于ElasticSearch的智能检索加速方法、设备及存储介质 | |
CN111026836A (zh) | 一种法律法规检索方法和装置 | |
CN110222156B (zh) | 发现实体的方法和装置、电子设备、计算机可读介质 | |
CN112307295A (zh) | 结合rpa和ai的语料泛化方法、装置和电子设备 | |
CN111930911A (zh) | 一种快速领域问答方法及其装置 | |
JP7164015B2 (ja) | 情報検索システム | |
RU2797036C1 (ru) | Система поиска информации | |
CN112286874B (zh) | 一种基于时间的文件管理方法 | |
JP3578045B2 (ja) | 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体 | |
JP6764973B1 (ja) | 関連語辞書作成システム、関連語辞書作成方法及び関連語辞書作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |