CN103473283A - 一种文本案例匹配方法 - Google Patents

一种文本案例匹配方法 Download PDF

Info

Publication number
CN103473283A
CN103473283A CN2013103851222A CN201310385122A CN103473283A CN 103473283 A CN103473283 A CN 103473283A CN 2013103851222 A CN2013103851222 A CN 2013103851222A CN 201310385122 A CN201310385122 A CN 201310385122A CN 103473283 A CN103473283 A CN 103473283A
Authority
CN
China
Prior art keywords
keyword
case
retrieval
phrase
sim
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013103851222A
Other languages
English (en)
Other versions
CN103473283B (zh
Inventor
陶坤旺
张福浩
仇阿根
汤磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN201310385122.2A priority Critical patent/CN103473283B/zh
Publication of CN103473283A publication Critical patent/CN103473283A/zh
Application granted granted Critical
Publication of CN103473283B publication Critical patent/CN103473283B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种文本案例匹配方法,该方法包括:构建案例库、构建标识词组、构建检索词组、求出语义距离、根据语义距离求出语义相似度、为检索词组分配权重、确定综合相似度、确定综合相似度阈值、判断是否全部匹配完成最后输出匹配结果,本发明能够根据相关概念以及相关背景知识进行推理,挖掘出文本中的隐含信息,为相关检索式进行赋权,从而可以实现基于概念的智能检索。在实际系统应用中具有较好的查询效果。

Description

一种文本案例匹配方法
技术领域
本发明涉及智能检索领域,具体涉及一种文本案例匹配方法。 
背景技术
案例推理(CBR)是最近三十多年来日益发展的区别于规则推理的一种新的推理模式。它是一种重要的基于所积累的知识进行现有问题求解和学习的方式,强调人类对于过去积累的知识经验以及前人的智慧结晶的重视。一个典型的案例推理问题求解过程的基本步骤可以归纳为四个主要过程:案例检索(Retrieve)、案例重用(Reuse)、案例修正(Revise)和案例保存(Retain)。案例推理的关键在于检索与当前新发案例最相近的历史案例,即案例检索,以便直接利用或稍加修改其解决方案来应对当前问题,避免了对类似问题做重复的分析工作,从而大量节省处理问题的时间,因此该推理方法广泛受到国内外研究学者的关注。而如何提高新旧案例匹配相似率,一直是学者们研究的重点。 
案例匹配是根据已知的案例内容,去案例库寻找与此最相近的历史案例,从而快速得到解决方案或以此作为参考。分析以往文献可以发现,过去案例匹配的方法多数是通过比较案例间的属性数值来获取最相似案例,而对于文本的相似计算却研究甚少。实际上,在案例中,文本信息占据很大的比例,它主要以文字或辅以图片呈现。因此,案例匹配的准率通常取决于案例中相关文本信息的匹配的精确性。 
传统的文本信息检索采用的方法有布尔检索、向量空间检索和概率检索。早期的信息检索系统采用“布尔查询”的方法来进行全文检索。布尔检索(Boolean Retrieval)是一种简单而常用的严格匹配模型,它定义了一个词组集合来标识文档,该词组被称为标识词组。同时运用布尔逻辑运算符将检索词连接起来形成 检索式,再与文档标识词组做逐一匹配。如此,布尔检索的本质就是将文本匹配转化成词组间的相互匹配。虽然布尔模型具有简单、易理解、易在计算机上实现且检索速度快等优点。但是这种方法很难全面地表达用户需求,对于模糊的信息需求不能很好的处理,用户必须详细的规划自己的查询,其复杂程度不亚于编程语言。而且这种检索方式对于检索词的重要度不加区分,忽视索引词与词之间的内在关系,所以对检索词与标识词的比较过于严格,对于文档与查询的评价就只有“匹配”,“不匹配”两种而已。 
向量空间模型(Vector Space Model)由Salton等人于20世纪70年代提出。该模型用检索项的高维向量空间来表示用户的提问和文本集信息,其中每一维为一个特征。一个用户提问向量或文本向量的第i个元素表示用户提问或文本的第i个特征的重要度,或称权值。用户提问向量的权值由用户指定;文本向量的权值则根据特征在文本或文本集中的出现频率决定。提问向量与文本向量间的余弦角通常用来测定该文本与该用户提问词之间的匹配程度。向量空间模型为索引词引进了权值,通过调节词的权值的大小来反映标引词与被标引文档的相关程度,部分地克服了传统布尔检索的缺陷,但是此模型在各个维度间缺乏相关性,标引词被认为是相互独立的,因而无法对文档中各个词的相关性提供信息。从宏观上看,仍然没有摆脱“关键词匹配”的窠臼。 
概率模型(Probabilistic Model)最早由Maron和Kuhn在1960年提出。概率模型通常利用检索单元作为线索,通过统计得到每个检索单元在相关的文档集中出现和不出现的概率以及其在与该查询不相关的文档集中出现和不出现的概率。最终利用这些概率值,计算文档与查询的相似度。在检索过程中,它通过反复反馈结果和用户需求,使结果得到了很好的调整,但是它沿用了索引词之间相互独立的基本假设,忽略了内在语义关系,影响查询结果的准确性。而且在该模型理论中没有考虑到索引属于在文档中的频率。 
总结来看,传统的文本匹配方法已经越来越难满足当前日益增长的案例信 息的检索需求了。它们在一定程度上忽略了对词语义关系的处理,而仅局限于文本表面的字符匹配。目前还没有出现对一些没有被文字直接表述出来但隐含在案例中的信息进行较好检索的方法。 
发明内容
有鉴于此,本发明提供了一种文本案例匹配方法,突出对词语义关系的处理,能够将一些没有被文字直接表述出来但隐含在案例中的信息较好地检索出来。 
本发明的具体方案是这样的:一种文本案例匹配方法,包括: 
步骤一、从新闻或档案中搜集案例,将所述案例集合起来构建案例库; 
步骤二、对案例库中的所有案例进行关键词提取,利用关键词之间存在着的上下位关系构建多个关键词树,每一个关键词树上的关键词均为同一类的关键词,同义词之间只显示一个词,其余的均隐藏在该词的后面,同时将每一个案例提取出的关键词构建多个形如Q={q1,q2,…qn}的标识词组,每一个标识词组中的关键词均为同一类,n表示标识词的个数; 
步骤三、利用关键词树从用户输入的检索案例中提取关键词,构建多个形如P={p1,p2,…pm}的检索词组,每一个检索词组内的关键词均属于同一类; 
步骤四、将检索案例与案例库中的案例进行匹配,利用关键词树对内部关键词属于同一类的标识词组和检索词组做最近距离匹配,求出检索词组与标识词组的语义距离dP→Q; 
步骤五、利用语义距离dP→Q求出包含着同一类关键词的检索词组与标识词组之间的语义相似度simP→Q; 
步骤六、为包含一个类别的检索词组分配权重λi,其中,i=1……n’,λ12+…+λn′=1; 
步骤七、根据公式求出整个案例的综合相似度SIM,设simi为每个类别检索词组的相似度,λi表示该因子在匹配过程中所占的权重,权重默认值为1/n,其中n为检索词组的分类数,那么 SIM = Σ i = 1 n sim i × λ i = sim 1 × λ 1 + sim 2 × λ 2 + · · · sim n × λ n ′ ;
步骤八、根据需要设定综合相似度阈值; 
步骤九、判断案例库中的所有案例是否已经全部匹配,若否,回到步骤四,若是,进入步骤十; 
步骤十、将大于综合相似度阈值的案例按照综合相似度从大到小输出匹配结果,完成案例匹配过程。 
有益效果: 
本发明在充分利用了词语语义之间的关系构建了关键词树,由关键词树帮助构建检索式,使得用户在使用时,只需输入完整的事件或者事件的一部分而不必编辑复杂的检索式就能够将同义词和上下位语义关系充分挖掘出来,加强了检索系统的推理功能,避免了漏检;而且,本发明采用为检索式赋权的作法使得检索结果更加准确的反映用户的真实信息需求。 
总之,本发明能够根据相关概念以及相关背景知识进行推理,挖掘出文本中的隐含信息,为相关检索式进行赋权,从而可以实现基于概念的智能检索。在实际系统应用中具有较好的查询效果。 
附图说明
图1为本发明的文本案例匹配方法的流程图; 
图2为本发明的地理类别的关键词树示意图; 
图3为本发明的扩展的检索系统界面示意图; 
图4为本发明的扩展的检索系统检索结果示意图。 
具体实施方式
本发明提供一种文本案例匹配方法,如图1~图4所示,包括: 
步骤一、从新闻或档案中搜集案例,将所述案例集合起来构建案例库; 
步骤二、对案例库中的案例进行关键词提取,利用关键词之间存在着的上下位关系构建多个关键词树,每一个关键词树上的关键词均为同一类的关键词,同义词之间只显示一个词,其余的均隐藏在该词的后面; 
同时将每一个案例提取出的关键词构建多个形如Q={q1,q2,…qn}的标识词组,每一个标识词组中的关键词均为同一类,n表示标识词的个数; 
关键词树是通过对案例库中的所有案例提取关键词得来的,案例库对应着非常多的关键词树,这一步非常关键,是整个方法中工作量最大也是最基础的。 
而案例库中的每一个案例,则均对应着多个标识词组,该标志词组内的所有关键词都是通过关键词树遍历该案例得来的,即该案例中存在着的关键词树中的关键词被提取出来,依照类别组成了多个标识词组。 
步骤三、利用关键词树从用户输入的检索案例中提取关键词,构建多个形如P={p1,p2,…pm}的检索词组,每一个检索词组内的关键词均属于同一类,同时根据关键词在关键词树中所处的位置生成检索式,同级采用逻辑“与”,不同级 采用逻辑“或”关系; 
案例检索同普通的检索最大的不同在于,在搜索时输入的不只是检索词,而是一个案例的部分。首先根据检索案例时输入的文本,利用关键词树对其进行全文遍历,找出文中全部关键词以用于算法匹配。遍历出的关键词根据遍历的不同关键词树类别(如人名、地名、不同类型事件),构成不同类别的检索词组,其中每一类检索词组用P={p1,p2,…pm}表示,m表示词组个数。该步骤解决了用户主动提取关键词的难题和提高了系统的查全率。 
步骤四、将检索案例与案例库中的案例进行匹配,利用关键词树对内部关键词属于同一类的标识词组和检索词组做最近距离匹配,求出检索词组与标识词组的语义距离dP→Q; 
语义距离是为体现词与词、词组与词组之间的内在联系,通常用d来表示。语义距离越小,表示词语概念越接近,反之越远。在关键词树中,语义距离指的是关键词连接边的长度,也即它们与其最临近公共父节点距离之和,通过有向边(父节点→子节点)的长度来表示父节点到子节点的距离,因此可用以下公式表示: 
其中,A、B是树状结构中的两个节点关键词,
Figure BDA00003743999600062
为语义距离运算符,F表示A、B的最临近公共父节点;dA-B和dB-A指的是A、B的语义距离;lF-A和lF-B分别表示有向边F→A和F→B的长度。 
两个词组的语义距离指的是以其中一个词组为模板,在另一组词里为该模板中的每个词找到距离最近的词,形成临近词组对,再综合求这些词组对的距离。如词组P={p1,p2,…pm}和词组Q={q1,q2,…qn},设其语义距离为dP-Q。本发明利用向量空间模型法来计算词组语义距离,分别将P和Q看成多维空间的两个向量,以P为模板,在Q中寻找与P中各词语义距离最小的词。 
d P - Q = min P ⊗ Q = min p 1 p 2 · · · p m ⊗ q 1 q 2 · · · q n
Figure BDA00003743999600072
= p 1 ⊗ q x p 2 ⊗ q x · · · p m ⊗ q x , ( x = 1,2 · · · n )
其中,
Figure BDA00003743999600074
表示向量P和Q做距离运算,min[]表示矩阵每行的最小值,qx表示矩阵Q中的某个值。 
步骤五、利用语义距离dP→Q求出包含着同一类关键词的检索词组与标识词组之间的语义相似度simP→Q; 
语义相似度是词语之间内在联系的另一种表示方式,通常用sim表示。文本信息检索的实质就在于寻找文本集中与当前文档语义相似度较大的文档。关键词树结构的特性决定了可用语义距离来体现词与词之间的关联程度,这两个词称为关键词对。不同关键词对间的语义距离相等表明它们的语义相似度是相同的。然而在关键词树中,从父节点到子节点,概念的分类逐步细化。因此,语 义相似度的计算与节点深度有关。在语义距离相等的情况下,处于树中深度较大的节点,其语义相似度应该较大。 
用有向边的深度代替节点的深度,即有向边的权重与其在关键词树中的深度有关。如有向边A→B的深度可用节点A的深度表示。于是,可得到节点深度与有向边权重的关系如下: 
ω A → B = ( 1 2 + 1 2 2 + · · · + 1 2 dep A ) = Σ n = 1 dep A 1 2 n = 1 - 1 2 dep A
其中,ωA-B表示节点A的深度对有向边A→B权重的影响,depA指的是A在关键词树中的深度。根据公式的单调性,可知随着depA的增加,ωA-B值越来越大,这与节点深度对语义相似度的影响是完全符合的。因此,词语之间的语义相似度可用以下公式表示: 
Figure BDA00003743999600082
其中,simA→B指的是A、B的相似度,注意的是当A、B相同或互为同义词时,simA-B值为1。 
在对检索词组完成最近距离匹配之后,利用上述公式计算检索词与最近标识词的相似度。再结合各相似度,求其平均值,即为检索词组的检索相似度simP→Q。 
sim P → Q = ( Σ i = 1,2 , . . . , m j = 1,2 , . . . , n sim p i → q j ) / m
其中,simP-Q代表词组P和Q的语义相似度,m指P中词的个数,∑[]表示矩阵的列求和运算。 
步骤六、为包含一个类别的检索词组分配权重λi,其中,i=1……n’,λ12+…+λn′=1; 
步骤七、根据公式求出整个案例的综合相似度SIM,设simi为每个类别检索词组的相似度,λi表示该因子在匹配过程中所占的权重,权重默认值为1/n,其中n为检索词组的分类数,那么 SIM = Σ i = 1 n sim i × λ i = sim 1 × λ 1 + sim 2 × λ 2 + · · · sim n × λ n ′ ;
由于一个案例有多个检索词组,因此与其对应的simi也相应的有多个。 
步骤八、根据实际需要设定综合相似度阈值; 
步骤九、判断案例库中的所有案例是否已经全部匹配,若否,回到步骤四,若是,进入步骤十; 
步骤十、将大于综合相似度阈值的案例按照综合相似度从大到小输出匹配结果,完成案例匹配过程。 
匹配结果中存储着文档检索的相似度,代表着各文档对检索词的符合程度,根据SIM值的大小对结果集进行排序,得到顺序结果集。顺序结果集中排在最前面的为最符合检索条件的案例,依次往下。最后将顺序结果集输出返回给用户,完成检索步骤。 
本发明在充分利用了词语语义之间的关系构建了关键词树,由关键词树帮助构建检索式,使得用户在使用时,只需输入完整的事件或者事件的一部分而 不必编辑复杂的检索式就能够将同义词和上下位语义关系充分挖掘出来,加强了检索系统的推理功能,避免了漏检;而且,本发明采用为检索式赋权的作法使得检索结果更加准确的反映用户的真实信息需求。 
总之,本发明能够根据相关概念以及相关背景知识进行推理,挖掘出文本中的隐含信息,为相关检索式进行赋权,从而可以实现基于概念的智能检索。在实际系统应用中具有较好的查询效果。 
案例检索系统是上述方法的扩展与应用。以军事案例的信息检索为例。根据军事案例的实际情况。 
一个完整的军事案例包括“名称”、“发生时间”、“地点”、“涉及人物”、“涉及国家”、“起因”、“经过”、“影响”、“结果”等方面。由于是多因子检索,所以此系统采用在“本体库”中创建的关键词树进行遍历,并结合多因子的权重分配对输入文本进行全文匹配,从而大大提高了系统的查准率。 
军事案例检索系统的主界面如图3所示,在此页面中可进行相似案例检索。如查询“朝鲜地下核试验”相关信息,在文本框中可根据字段名输入相应查询条件,同时还能根据输入内容,设置各字段的权重比例。然后点击“相似案例检索”,得到如图4的查询结果,结果中相似度字段表示与当前查询条件的相关程度。 
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 

Claims (1)

1.一种文本案例匹配方法,其特征在于,包括:
步骤一、从新闻或档案中搜集案例,将所述案例集合起来构建案例库;
步骤二、对案例库中的所有案例进行关键词提取,利用关键词之间存在着的上下位关系构建多个关键词树,每一个关键词树上的关键词均为同一类的关键词,同义词之间只显示一个词,其余的均隐藏在该词的后面;同时将每一个案例提取出的关键词构建多个形如Q={q1,q2,…qn}的标识词组,每一个标识词组中的关键词均为同一类,n表示标识词的个数;
步骤三、利用关键词树从用户输入的检索案例中提取关键词,构建多个形如P={p1,p2,…pm}的检索词组,每一个检索词组内的关键词均属于同一类;
步骤四、将检索案例与案例库中的案例进行匹配,利用关键词树对内部关键词属于同一类的标识词组和检索词组做最近距离匹配,求出检索词组与标识词组的语义距离dP→Q
步骤五、利用语义距离dP→Q求出包含着同一类关键词的检索词组与标识词组之间的语义相似度simP→Q
步骤六、为包含一个类别的检索词组分配权重λi,其中,i=1……n’,λ12+…+λn′=1;
步骤七、根据公式求出整个案例的综合相似度SIM,设simi为每个类别检索词组的相似度,λi表示该因子在匹配过程中所占的权重,权重默认值为1/n’,其中n’为检索词组的分类数,那么 SIM = Σ i = 1 n sim 1 × λ i = sim 1 × λ 1 + sim 2 × λ 2 + · · · sim n ′ × λ n ′ ;
步骤八、根据实际需要设定综合相似度阈值;
步骤九、判断检索案例与案例库中的所有案例是否已经全部匹配,若否,回到步骤四,若是,进入步骤十;
步骤十、将大于综合相似度阈值的案例按照综合相似度从大到小输出匹配结果,完成案例匹配过程。
CN201310385122.2A 2013-08-29 2013-08-29 一种文本案例匹配方法 Expired - Fee Related CN103473283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310385122.2A CN103473283B (zh) 2013-08-29 2013-08-29 一种文本案例匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310385122.2A CN103473283B (zh) 2013-08-29 2013-08-29 一种文本案例匹配方法

Publications (2)

Publication Number Publication Date
CN103473283A true CN103473283A (zh) 2013-12-25
CN103473283B CN103473283B (zh) 2017-02-15

Family

ID=49798131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310385122.2A Expired - Fee Related CN103473283B (zh) 2013-08-29 2013-08-29 一种文本案例匹配方法

Country Status (1)

Country Link
CN (1) CN103473283B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008143A (zh) * 2014-05-09 2014-08-27 启秀科技(北京)有限公司 基于数据挖掘的职业能力指标体系构建方法
CN104166698A (zh) * 2014-08-01 2014-11-26 小米科技有限责任公司 数据处理方法和装置
CN104298732A (zh) * 2014-09-29 2015-01-21 中国科学院计算技术研究所 一种面向网络用户的个性化文本排序及推荐方法
CN104573062A (zh) * 2015-01-23 2015-04-29 桂林电子科技大学 基于描述逻辑和案例推理的智能学习方法
CN105045919A (zh) * 2015-08-24 2015-11-11 北京云知声信息技术有限公司 一种信息输出方法及装置
CN105320772A (zh) * 2015-11-02 2016-02-10 武汉大学 一种专利查重的关联论文查询方法
CN105630751A (zh) * 2015-12-28 2016-06-01 厦门优芽网络科技有限公司 一种快速比对文本内容的方法与系统
CN105956206A (zh) * 2016-07-04 2016-09-21 Tcl集团股份有限公司 一种基于关键词树的视频检索方法及系统
CN106022586A (zh) * 2016-05-13 2016-10-12 中国人民解放军国防科学技术大学 一种基于案例匹配的卫星观测任务规划方法
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置
CN106547917A (zh) * 2016-11-29 2017-03-29 国网信息通信产业集团有限公司 一种信息处理方法及电子设备
CN103823900B (zh) * 2014-03-17 2017-07-21 北京百度网讯科技有限公司 信息点重要性确定方法和装置
CN107133276A (zh) * 2017-04-12 2017-09-05 安徽富驰信息技术有限公司 一种司法类案检索系统及其检索方法
CN107291672A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 数据表的处理方法和装置
CN107480140A (zh) * 2017-08-23 2017-12-15 北京仿真中心 一种基于众创的智能案例库实现方法
CN107958007A (zh) * 2016-10-18 2018-04-24 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器
CN110928994A (zh) * 2019-11-28 2020-03-27 北京华宇元典信息服务有限公司 相似案例检索方法、相似案例检索装置和电子设备
CN110955763A (zh) * 2019-11-15 2020-04-03 深圳供电局有限公司 一种基于审计风险库的数据搜索方法及系统
CN112352251A (zh) * 2018-06-25 2021-02-09 株式会社工程师论坛 不足能力提取装置
CN117131241A (zh) * 2023-02-09 2023-11-28 荣耀终端有限公司 搜索对象推荐方法、电子设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777042A (zh) * 2010-01-21 2010-07-14 西南科技大学 基于神经网络和标签库的语句相似度算法
US20130124571A1 (en) * 2011-11-11 2013-05-16 Dwango Co., Ltd. Keyword acquiring device, content providing system, keyword acquiring method, a computer-readable recording medium and content providing method
CN103116588A (zh) * 2011-11-17 2013-05-22 腾讯科技(深圳)有限公司 一种个性化推荐方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777042A (zh) * 2010-01-21 2010-07-14 西南科技大学 基于神经网络和标签库的语句相似度算法
US20130124571A1 (en) * 2011-11-11 2013-05-16 Dwango Co., Ltd. Keyword acquiring device, content providing system, keyword acquiring method, a computer-readable recording medium and content providing method
CN103116588A (zh) * 2011-11-17 2013-05-22 腾讯科技(深圳)有限公司 一种个性化推荐方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
安建成等: ""基于语义树的概念语义相似度计算方法研究"", 《微电子学与计算机》 *
赵军,金千里,徐波: "面向文本检索的语义计算", 《计算机学报》 *
赵军等: ""面向文本检索的语义计算"", 《计算机学报》 *
金博等: ""基于语义理解的文本相似度算法"", 《大连理工大学学报》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103823900B (zh) * 2014-03-17 2017-07-21 北京百度网讯科技有限公司 信息点重要性确定方法和装置
CN104008143A (zh) * 2014-05-09 2014-08-27 启秀科技(北京)有限公司 基于数据挖掘的职业能力指标体系构建方法
CN104166698A (zh) * 2014-08-01 2014-11-26 小米科技有限责任公司 数据处理方法和装置
CN104298732A (zh) * 2014-09-29 2015-01-21 中国科学院计算技术研究所 一种面向网络用户的个性化文本排序及推荐方法
CN104298732B (zh) * 2014-09-29 2018-01-09 中国科学院计算技术研究所 一种面向网络用户的个性化文本排序及推荐方法
CN104573062A (zh) * 2015-01-23 2015-04-29 桂林电子科技大学 基于描述逻辑和案例推理的智能学习方法
CN104573062B (zh) * 2015-01-23 2018-01-23 桂林电子科技大学 基于描述逻辑和案例推理的智能学习方法
CN105045919A (zh) * 2015-08-24 2015-11-11 北京云知声信息技术有限公司 一种信息输出方法及装置
CN105045919B (zh) * 2015-08-24 2019-08-16 北京云知声信息技术有限公司 一种信息输出方法及装置
CN105320772A (zh) * 2015-11-02 2016-02-10 武汉大学 一种专利查重的关联论文查询方法
CN105320772B (zh) * 2015-11-02 2019-03-26 武汉大学 一种专利查重的关联论文查询方法
CN105630751A (zh) * 2015-12-28 2016-06-01 厦门优芽网络科技有限公司 一种快速比对文本内容的方法与系统
CN107291672A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 数据表的处理方法和装置
CN106022586B (zh) * 2016-05-13 2019-10-01 中国人民解放军国防科学技术大学 一种基于案例匹配的卫星观测任务规划方法
CN106022586A (zh) * 2016-05-13 2016-10-12 中国人民解放军国防科学技术大学 一种基于案例匹配的卫星观测任务规划方法
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置
CN105956206A (zh) * 2016-07-04 2016-09-21 Tcl集团股份有限公司 一种基于关键词树的视频检索方法及系统
CN107958007A (zh) * 2016-10-18 2018-04-24 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置
CN107958007B (zh) * 2016-10-18 2022-03-29 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置
CN106547917A (zh) * 2016-11-29 2017-03-29 国网信息通信产业集团有限公司 一种信息处理方法及电子设备
CN107133276A (zh) * 2017-04-12 2017-09-05 安徽富驰信息技术有限公司 一种司法类案检索系统及其检索方法
CN107480140A (zh) * 2017-08-23 2017-12-15 北京仿真中心 一种基于众创的智能案例库实现方法
CN109697231A (zh) * 2017-10-24 2019-04-30 北京国双科技有限公司 一种案件文书的显示方法、系统、存储介质和处理器
CN112352251A (zh) * 2018-06-25 2021-02-09 株式会社工程师论坛 不足能力提取装置
CN110955763A (zh) * 2019-11-15 2020-04-03 深圳供电局有限公司 一种基于审计风险库的数据搜索方法及系统
CN110928994A (zh) * 2019-11-28 2020-03-27 北京华宇元典信息服务有限公司 相似案例检索方法、相似案例检索装置和电子设备
CN117131241A (zh) * 2023-02-09 2023-11-28 荣耀终端有限公司 搜索对象推荐方法、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN103473283B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN103473283B (zh) 一种文本案例匹配方法
CN106991092B (zh) 基于大数据挖掘相似裁判文书的方法和设备
CN107220295B (zh) 一种人民矛盾调解案例搜索和调解策略推荐方法
CN104239513B (zh) 一种面向领域数据的语义检索方法
CN110674840B (zh) 一种多方证据关联模型构建方法和证据链提取方法及装置
CN102419778B (zh) 一种挖掘查询语句子话题并聚类的信息搜索方法
Sarawagi et al. Open-domain quantity queries on web tables: annotation, response, and consensus models
CN103605665A (zh) 一种基于关键词的评审专家智能检索与推荐方法
CN107239512B (zh) 一种结合评论关系网络图的微博垃圾评论识别方法
CN104899273A (zh) 一种基于话题和相对熵的网页个性化推荐方法
CN103544242A (zh) 面向微博的情感实体搜索系统
CN110888991B (zh) 一种弱标注环境下的分段式语义标注方法
CN104268230B (zh) 一种基于异质图随机游走的中文微博客观点探测方法
Sadiq et al. Hybrid intelligent technique for text categorization
CN110287329A (zh) 一种基于商品文本分类的电商类目属性挖掘方法
Chen et al. Georeferencing places from collective human descriptions using place graphs
CN113722478B (zh) 多维度特征融合相似事件计算方法、系统及电子设备
CN105335510A (zh) 文本数据高效搜索方法
CN112036178A (zh) 一种配网实体相关的语义搜索方法
CN105160046A (zh) 基于文本的数据检索方法
Trummer et al. Mining subjective properties on the web
Li et al. Neural factoid geospatial question answering
Huang et al. Design and implementation of oil and gas information on intelligent search engine based on knowledge graph
Yang et al. Research on improvement of text processing and clustering algorithms in public opinion early warning system
Wang et al. An ontology automation construction scheme for Chinese e‐government thesaurus optimizing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

CF01 Termination of patent right due to non-payment of annual fee