CN105930358B - 基于关联度的案例检索方法及其系统 - Google Patents
基于关联度的案例检索方法及其系统 Download PDFInfo
- Publication number
- CN105930358B CN105930358B CN201610219204.3A CN201610219204A CN105930358B CN 105930358 B CN105930358 B CN 105930358B CN 201610219204 A CN201610219204 A CN 201610219204A CN 105930358 B CN105930358 B CN 105930358B
- Authority
- CN
- China
- Prior art keywords
- case
- association
- degree
- feature
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 239000012141 concentrate Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 description 16
- 230000007547 defect Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000001467 acupuncture Methods 0.000 description 1
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于关联度的案例检索方法及其系统,所述方法通过将从案例记录集中提取的特征词构建代表案例类别的特征集,根据所述特征词、案例类别以及计算得到的两者之间的关联度得到候选关联库,再根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。在进行案例检索时,能根据检索特征词及与其关联的其他特征词进行案例检索,使得即使在案例数量非常庞大的案例库中,亦能快速、精确地进行案例检索。
Description
技术领域
本发明涉及数据处理领域,特别是一种基于关联度的案例检索方法及其系统。
背景技术
案例库检索与推荐是实现案例推理的核心关键部分,案例检索与推荐的效率直接影响了系统的应用效率。如何通过关键字迅速准确地找到所需信息,是确保设备案例库高效实用的关键技术难题。
目前,传统案例库检索方法有以下几种:最近邻检索策略,是利用相似度理论对案例特征之间的关系进行评价计算,在此基础上从案例库中找出一个或多个与当前情况距离最近,相似度最大的案例特征作为检索的结果;知识引导方法,是一种利用知识来进行推理的方法,它把领域的知识以规则的形式表示,根据己知的规则来确定哪些属性是案例的重要属性,并依据这些特征属性来指导案例的检索;以及归纳推理方法,是从历史数据中提取规则,构建决策树,通过规则和决策树来分类或指引检索案例记录。
然而,传统案例库检索方法存在以下问题:(1)案例检索效率不高:常用的最近邻检索策略方法虽实用方便,但当案例库成长到一定规模时,或者案例库的案例数量非常大时,采用该方法检索效率就会很差。(2)案例检索不精准:常用的知识引导、归纳推理方法在实际应用过程中,需要大量、全面、完备的规则,会造成知识解释性不清楚,容易在内容或概念上不符合用户的信息需求。
发明内容
针对上述现有技术中存在的问题,本发明提供一种基于关联度的案例检索方法及其系统,在案例数量非常庞大的案例库中,能够快速、精确地进行案例检索。
本发明的基于关联度的案例检索方法,技术方案如下:
在预设的案例记录集中提取特征词,根据所述特征词构建代表案例类别的特征集;
计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,根据所述特征词、案例类别以及两者的关联度得到候选关联库;
根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。
本发明的基于关联度的案例检索系统,包括:
特征词提取模块,用于在预设的案例记录集中提取特征词,根据所述特征词构建代表案例类别的特征集;
关联库生成模块,用于计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,根据所述特征词、案例类别以及两者的关联度得到候选关联库;
案例检索模块,用于根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。
本发明的基于关联度的案例检索方法及其系统,通过将从案例记录集中提取的特征词构建代表案例类别的特征集,根据所述特征词、案例类别以及计算得到的两者之间的关联度得到候选关联库,再根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。在进行案例检索时,能根据检索特征词及与其关联的其他特征词进行案例检索,使得即使在案例数量非常庞大的案例库中,亦能快速、精确地进行案例检索。
附图说明
图1为一个实施例的基于关联度的案例检索方法的流程示意图;
图2为一个实施例的基于关联度的案例检索系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
请参阅图1中一个实施例的基于关联度的案例检索方法的流程示意图,包括步骤S101至步骤S103:
S101,在预设的案例记录集中提取特征词,根据所述特征词构建代表案例类别的特征集。
所述案例记录集可以是通过数据库形式记录案例的数据库,也可以是通过文本形式记录案例的文本或者文本集;所述特征词是指案例中具有专属特性的词。本步骤通过在案例记录集中提取特征词,并根据所述特征词构建代表案例类别的特征集,使得后续的案例检索更具针对性,案例检索更加准确。
优选地,可通过以下方式在预设的案例记录集中提取特征词:根据预设的词库对所述案例记录集进行分词,得到若干候选特征词,统计各候选特征词出现的频率;若候选特征词的频率大于设定阈值,提取该候选特征词作为特征词。通过上述方式提取特征词,使得特征词更能反映案例的专属特性,进一步提高后续案例检索的准确度。
S102,计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,根据所述特征词、案例类别以及两者的关联度得到候选关联库。
相同的案例类别可以有多个不同的特征词,关联度则反映了各个特征词与案例类别的关联程度;根据特征词、案例类别以及两者的关联度得到的候选关联库,则构成了案例类别中不同特征词对应的案例之间的映射关系,其中映射关系可通过量化的形式表示,亦即通过关联度表示。通过该步骤即使在案例数量非常庞大的案例库中,亦能快速构建案例之间的关联,进一步提高后续案例检索的速度。
进一步地,步骤S102中可通过以下公式计算所述特征集中各个特征词与案例类别的关联度:
conf(w,c)=Dw,c/Dw,
其中,conf(w,c)为特征词w与案例类别c的关联度,Dw,c为案例记录集中包含特征词w且属于案例类别c的案例数量,Dw为案例记录集中包含特征词w的案例数量。
进一步地,在计算所述特征集中各个特征词与案例类别的关联度之后,判断特征词与案例类别的关联度是否小于阈值,若是,则从所述特征集中删除该特征词。删除与案例类别的关联度小于阈值的特征词,优化了案例的特征词,进一步提高后续案例检索的准确度。
进一步地,所述根据所述特征词、案例类别以及两者的关联度生成候选关联库,包括根据特征词、案例类别以及两者的关联度得到单元对集为:
Kn=(wn,ck,conf),其中,wn为特征集W={w1,w2,…,wn}的第n个特征词,ck为预设的案例类别集C={c1,c2,…,ck}的第k个案例类别,conf为特征词wn与案例类别ck的关联度;根据各个特征词对应的单元对集构建候选关联库为:F={K1,K2,…,Kn}。
该步骤的候选关联库将案例类别相近的若干特征词相互映射,放在一个组别中,相互之间的相似度程度用关联度表示;再将各组别进行集合,进而构成候选关联库。例如:案例类别为过热的组别可表示为:{(过热,发热,0.8),(过热,金具,0.7),(过热,异常,0.5)}。
S103,根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。该步骤对检索特征词、以及检索特征词所在关联库中其他特征词进行检索,从而使得即使在案例数量非常庞大的案例库中,亦能快速、精确地进行案例检索。
进一步地,在分别采用所述对应案例类别的特征集中各个特征词进行案例检索之后,输出通过采用所述检索特征词检索得到的案例,以及输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例。
进一步地,所述输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例,还包括获取该检索特征词与其所在关联库中其他特征词的近似度,根据所述近似度,对采用该检索特征词所在关联库中其他特征词检索得到的推荐案例进行排序输出。
当某一案例类别中的一个特征词被检索时,相当于该特征词所在的集合中的每个特征词均被检索;检索结果中包括通过该特征词检索得到的案例结果,以及推荐的相近案例类别的案例推荐结果,推荐案例的排列顺序可根据该检索特征词与其所在关联库中其他特征词的近似度确定。
由上述实施例的基于关联度的案例检索方法可知,通过将从案例记录集中提取的特征词构建代表案例类别的特征集,根据所述特征词、案例类别以及计算得到的两者之间的关联度得到候选关联库,再根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。在进行案例检索时,能根据检索特征词及与其关联的其他特征词进行案例检索,使得即使在案例数量非常庞大的案例库中,亦能快速、精确地进行案例检索。
以下为本发明的基于关联度的案例检索方法的一个较佳实现方式,本实现方式具体针对设备缺陷案例进行论述,包括步骤一至步骤四:
步骤一:提取特征词。
具体地,对于设备缺陷案例描述记录集合D={d1,d2,…,dk},对应的缺陷类别为C={c1,c2,…,ck},根据设备缺陷专业词库,对集合D进行分词操作,经过预处理后形成代表设备缺陷类别的特征集W={w1,w2,…,wn}。
其中,形成特征集W的具体过程如下:A、对设备缺陷记录集进行分词,在分词的过程中统计每类设备缺陷的候选特征词,记录所有候选特征出现的频率;B、将候选特征按照频率从大到小进行排序;C、按排序后的顺序依次选取特征词,如果频率大于阈值,将该特征词作为代表此缺陷类别的特征词,并继续选取下一个特征词;如果累积频率小于等于阈值,则截尾,将所有选出的特征词作为缺陷记录类别的特征词;D、对所有的设备缺陷类别的案例重复以上步骤,从而得到每类设备缺陷类别的特征集W={w1,w2,…,wn}。例如对设备过热缺陷类别描述文本进行特征提取,形成代表设备过热缺陷类别特征集W={发热,金具,异常}。
本步骤提出文本特征量提取方法,丰富短文本所携带的特征量,形成代表设备缺陷类型的特征集合,能高效地解析代表短文本的特征词。
步骤二:关联度计算。
计算特征集W中各个特征词与设备缺陷类别的关联度,若关联度小于阈值,则从该集合中删除,然后根据特征词的类别趋向度将特征词集划分为若干个与缺陷类别一一对应的单元对集Kn。具体如下:
a)定义并计算关联度:特征词w对于设备缺陷类别c的关联度记为conf(w,c),其数学定义式为:
conf(w,c)=Dw,c/Dw,
其中,conf(w,c)为特征词w与案例类别c的关联度,Dw,c为案例记录集中包含特征词w且属于案例类别c的案例数量,Dw为案例记录集中包含特征词w的案例数量。计算特征集中各个特征词与设备缺陷类别的关联度,若关联度小于阈值β(0.5≤β≤1),则从该集合中删除该特征词。
b)形成单元对集:根据特征词、设备缺陷类别以及两者的关联度得到特征词与设备缺陷类别一一对应的单元对集:Kn=(wn,ck,conf),其中,其中,wn为特征集W={w1,w2,…,wn}的第n个特征词,ck为预设的案例类别集C={c1,c2,…,ck}的第k个案例类别,conf为特征词wn与案例类别ck的关联度。
步骤三:生成候选关联库。
根据形成的单元对集Kn=(wn,ck,conf),并以这些二元组构成候选关联库为:F={K1,K2,…,Kn}。
所述候选关联知识库,将设备缺陷类别相近的若干特征词相互映射,放在一个组别中,相互之间的相似度程度用关联度表示;再将各组别进行集合,进而构成候选关联库。例如:设备缺陷类别为过热的组别可表示为:{(过热,发热,0.8),(过热,金具,0.7),(过热,异常,0.5)}。
步骤四:推荐案例输出。
根据接收到的检索特征词及其所在的候选关联库,找出对应设备缺陷类别的特征集,分别采用所述对应设备缺陷类别的特征集中各个特征词进行案例检索,输出通过采用所述检索特征词检索得到的案例,以及输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例。还可以获取该检索特征词与其所在关联库中其他特征词的近似度,根据所述近似度,对推荐案例进行排序。
由上述基于关联度的案例检索方法的较佳实现方式可知,通过将从案例记录集中提取的特征词构建代表案例类别的特征集,根据所述特征词、案例类别以及计算得到的两者之间的关联度得到候选关联库,再根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。在进行案例检索时,能根据检索特征词及与其关联的其他特征词进行案例检索,使得即使在案例数量非常庞大的案例库中,亦能快速、精确地进行案例检索。
本发明还提供一种基于关联度的案例检索系统,如图2所示,包括特征词提取模块201,关联库生成模块202以及案例检索模块203。
所示特征词提取模块201用于在预设的案例记录集中提取特征词,根据所述特征词构建代表案例类别的特征集;所述关联库生成模块202用于计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,根据所述特征词、案例类别以及两者的关联度得到候选关联库;以及所述案例检索模块203用于根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。
由上述实施例的基于关联度的案例检索系统可知,通过将从案例记录集中提取的特征词构建代表案例类别的特征集,根据所述特征词、案例类别以及计算得到的两者之间的关联度得到候选关联库,再根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索。在进行案例检索时,能根据检索特征词及与其关联的其他特征词进行案例检索,使得即使在案例数量非常庞大的案例库中,亦能快速、精确地进行案例检索。
在其中一个实施例中,所述关联库生成模块202包括关联度计算子模块,用于通过以下公式计算所述特征集中各个特征词与案例类别的关联度:
conf(w,c)=Dw,c/Dw,
其中,conf(w,c)为特征词w与案例类别c的关联度,Dw,c为案例记录集中包含特征词w且属于案例类别c的案例数量,Dw为案例记录集中包含特征词w的案例数量。
在其中一个实施例中,所述关联库生成模块202还包括关联度优化子模块,用于在计算所述特征集中各个特征词与案例类别的关联度之后,判断特征词与案例类别的关联度是否小于阈值,若是,则从所述特征集中删除该特征词。删除与案例类别的关联度小于阈值的特征词,优化了案例的特征词,进一步提高后续案例检索的准确度。
在其中一个实施例中,所述关联库生成模块202还包括关联库生成子模块,用于根据特征词、案例类别以及两者的关联度得到单元对集为:Kn=(wn,ck,conf),其中,其中,wn为特征集W={w1,w2,…,wn}的第n个特征词,ck为预设的案例类别集C={c1,c2,…,ck}的第k个案例类别,conf为特征词wn与案例类别ck的关联度;根据各个特征词对应的单元对集构建候选关联库为:F={K1,K2,…,Kn}。
在其中一个实施例中,所述特征词提取模块201包括特征词提取子模块,用于根据预设的词库对所述案例记录集进行分词,得到若干候选特征词,统计各候选特征词出现的频率;若候选特征词的频率大于设定阈值,提取该候选特征词作为特征词,使得特征词更能反映案例的专属特性,进一步提高后续案例检索的准确度。
在其中一个实施例中,所述案例检索模块203包括案例输出子模块,所述案例输出子模块用于输出通过采用所述检索特征词检索得到的案例,以及输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例。所述案例输出子模块进一步包括排序输出子模块,用于获取该检索特征词与其所在关联库中其他特征词的近似度,根据所述近似度,对采用该检索特征词所在关联库中其他特征词检索得到的推荐案例进行排序输出。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.基于关联度的案例检索方法,其特征在于,包括如下步骤:
在预设的案例记录集中提取特征词,根据所述特征词构建代表案例类别的特征集;
计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,根据所述特征词、案例类别以及两者的关联度得到候选关联库;
根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索;
所述根据所述特征词、案例类别以及两者的关联度生成候选关联库,包括:
根据特征词、案例类别以及两者的关联度得到单元对集为:
Kn=(wn,ck,conf),
其中,wn为特征集W={w1,w2,…,wn}的第n个特征词,ck为预设的案例类别集C={c1,c2,…,ck}的第k个案例类别,conf为特征词wn与案例类别ck的关联度;
根据各个特征词对应的单元对集构建候选关联库为:
F={K1,K2,…,Kn}。
2.根据权利要求1所述的基于关联度的案例检索方法,其特征在于,所述计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,包括:
通过以下公式计算所述特征集中各个特征词与案例类别的关联度:
conf(w,c)=Dw,c/Dw,
其中,conf(w,c)为特征词w与案例类别c的关联度,Dw,c为案例记录集中包含特征词w且属于案例类别c的案例数量,Dw为案例记录集中包含特征词w的案例数量。
3.根据权利要求2所述的基于关联度的案例检索方法,其特征在于,所述计算所述特征集中各个特征词与案例类别的关联度之后,包括:
判断特征词与案例类别的关联度是否小于阈值,若是,则从所述特征集中删除该特征词。
4.根据权利要求1所述的基于关联度的案例检索方法,其特征在于,所述在预设的案例记录集中提取特征词,包括:
根据预设的词库对所述案例记录集进行分词,得到若干候选特征词,统计各候选特征词出现的频率;
若候选特征词的频率大于设定阈值,提取该候选特征词作为特征词。
5.根据权利要求1所述的基于关联度的案例检索方法,其特征在于,所述分别采用所述对应案例类别的特征集中各个特征词进行案例检索,之后包括:
输出通过采用所述检索特征词检索得到的案例,以及输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例;
所述输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例,还包括:
获取该检索特征词与其所在关联库中其他特征词的近似度,根据所述近似度,对所述推荐案例进行排序输出。
6.基于关联度的案例检索系统,其特征在于,包括:
特征词提取模块,用于在预设的案例记录集中提取特征词,根据所述特征词构建代表案例类别的特征集;
关联库生成模块,用于计算每类案例类别的所述特征集中各个特征词与案例类别的关联度,根据所述特征词、案例类别以及两者的关联度得到候选关联库;
案例检索模块,用于根据接收到的检索特征词及其所在的候选关联库,找出对应案例类别的特征集,分别采用所述对应案例类别的特征集中各个特征词进行案例检索;
所述关联库生成模块还包括:
关联库生成子模块,用于根据特征词、案例类别以及两者的关联度得到单元对集为:Kn=(wn,ck,conf),其中,其中,wn为特征集W={w1,w2,…,wn}的第n个特征词,ck为预设的案例类别集C={c1,c2,…,ck}的第k个案例类别,conf为特征词wn与案例类别ck的关联度;根据各个特征词对应的单元对集构建候选关联库为:F={K1,K2,…,Kn}。
7.根据权利要求6所述的基于关联度的案例检索系统,其特征在于,所述关联库生成模块包括:
关联度计算子模块,用于通过以下公式计算所述特征集中各个特征词与案例类别的关联度:
conf(w,c)=Dw,c/Dw,
其中,conf(w,c)为特征词w与案例类别c的关联度,Dw,c为案例记录集中包含特征词w且属于案例类别c的案例数量,Dw为案例记录集中包含特征词w的案例数量。
8.根据权利要求6所述的基于关联度的案例检索系统,其特征在于,所述案例检索模块包括:
案例输出子模块,用于输出通过采用所述检索特征词检索得到的案例,以及输出采用该检索特征词所在关联库中其他特征词检索得到的推荐案例;
所述案例输出子模块进一步包括:
排序输出子模块,用于获取该检索特征词与其所在关联库中其他特征词的近似度,根据所述近似度,对所述推荐案例进行排序输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610219204.3A CN105930358B (zh) | 2016-04-08 | 2016-04-08 | 基于关联度的案例检索方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610219204.3A CN105930358B (zh) | 2016-04-08 | 2016-04-08 | 基于关联度的案例检索方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105930358A CN105930358A (zh) | 2016-09-07 |
CN105930358B true CN105930358B (zh) | 2019-06-04 |
Family
ID=56840144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610219204.3A Active CN105930358B (zh) | 2016-04-08 | 2016-04-08 | 基于关联度的案例检索方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105930358B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109906449B (zh) * | 2016-10-27 | 2021-07-20 | 华为技术有限公司 | 一种查找方法及装置 |
CN108170691A (zh) * | 2016-12-07 | 2018-06-15 | 北京国双科技有限公司 | 关联文书的确定方法和装置 |
CN108259552B (zh) * | 2017-07-24 | 2020-09-11 | 平安科技(深圳)有限公司 | 案件处理系统和方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699625A (zh) * | 2013-12-20 | 2014-04-02 | 北京百度网讯科技有限公司 | 基于关键词进行检索的方法及装置 |
CN103810168A (zh) * | 2012-11-06 | 2014-05-21 | 深圳市世纪光速信息技术有限公司 | 检索应用的方法、装置及终端 |
CN103902570A (zh) * | 2012-12-27 | 2014-07-02 | 腾讯科技(深圳)有限公司 | 一种文本分类特征提取方法、分类方法及装置 |
CN104216874A (zh) * | 2014-09-22 | 2014-12-17 | 广西教育学院 | 基于相关系数的中文词间加权正负模式挖掘方法及系统 |
CN104778161A (zh) * | 2015-04-30 | 2015-07-15 | 车智互联(北京)科技有限公司 | 基于Word2Vec和Query log抽取关键词方法 |
CN105447206A (zh) * | 2016-01-05 | 2016-03-30 | 深圳市中易科技有限责任公司 | 基于word2vec算法的新评论对象识别方法及系统 |
-
2016
- 2016-04-08 CN CN201610219204.3A patent/CN105930358B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810168A (zh) * | 2012-11-06 | 2014-05-21 | 深圳市世纪光速信息技术有限公司 | 检索应用的方法、装置及终端 |
CN103902570A (zh) * | 2012-12-27 | 2014-07-02 | 腾讯科技(深圳)有限公司 | 一种文本分类特征提取方法、分类方法及装置 |
CN103699625A (zh) * | 2013-12-20 | 2014-04-02 | 北京百度网讯科技有限公司 | 基于关键词进行检索的方法及装置 |
CN104216874A (zh) * | 2014-09-22 | 2014-12-17 | 广西教育学院 | 基于相关系数的中文词间加权正负模式挖掘方法及系统 |
CN104778161A (zh) * | 2015-04-30 | 2015-07-15 | 车智互联(北京)科技有限公司 | 基于Word2Vec和Query log抽取关键词方法 |
CN105447206A (zh) * | 2016-01-05 | 2016-03-30 | 深圳市中易科技有限责任公司 | 基于word2vec算法的新评论对象识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105930358A (zh) | 2016-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241241B (zh) | 基于知识图谱的案件检索方法、装置、设备及存储介质 | |
CN108038183B (zh) | 结构化实体收录方法、装置、服务器和存储介质 | |
CN104199965B (zh) | 一种语义信息检索方法 | |
CN104392006B (zh) | 一种事件查询处理方法及装置 | |
WO2004013775A2 (en) | Data search system and method using mutual subsethood measures | |
CN109408578B (zh) | 一种针对异构环境监测数据融合方法 | |
CN112559747B (zh) | 事件分类处理方法、装置、电子设备和存储介质 | |
CN107291895B (zh) | 一种快速的层次化文档查询方法 | |
CN107180093A (zh) | 信息搜索方法及装置和时效性查询词识别方法及装置 | |
CN105930358B (zh) | 基于关联度的案例检索方法及其系统 | |
CN109582847A (zh) | 一种信息处理方法及装置、存储介质 | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
CN115658940A (zh) | 异源检测特征数据库构建与更新方法、装置及存储介质 | |
CN109165331A (zh) | 一种英文地名的索引建立方法及其查询方法和装置 | |
CN111737482B (zh) | 一种适用于数据挖掘的全景可视化图谱生成方法及装置 | |
CN106933818A (zh) | 一种快速的多关键字文本匹配方法及装置 | |
CN107577690B (zh) | 海量信息数据的推荐方法及推荐装置 | |
CN114491232B (zh) | 信息查询方法、装置、电子设备和存储介质 | |
CN112231547A (zh) | 一种基于知识图谱的内容推荐方法和系统 | |
CN115344734A (zh) | 图像检索方法、装置、电子设备及计算机可读存储介质 | |
CN115617981A (zh) | 一种面向社交网络短文本的信息层次摘要提取方法 | |
CN112612870B (zh) | 一种非结构化数据管理方法及系统 | |
CN114722304A (zh) | 异质信息网络上基于主题的社区搜索方法 | |
CN104615605B (zh) | 用于预测数据对象的类目的方法和装置 | |
CN114357086A (zh) | 一种基于知识图谱的专利ipc分类号推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |