CN103955531B - 基于命名实体库的在线知识地图 - Google Patents

基于命名实体库的在线知识地图 Download PDF

Info

Publication number
CN103955531B
CN103955531B CN201410199271.4A CN201410199271A CN103955531B CN 103955531 B CN103955531 B CN 103955531B CN 201410199271 A CN201410199271 A CN 201410199271A CN 103955531 B CN103955531 B CN 103955531B
Authority
CN
China
Prior art keywords
name entity
entity
attribute
name
knowledge map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410199271.4A
Other languages
English (en)
Other versions
CN103955531A (zh
Inventor
李华康
过敏意
沈耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING TITAN INFORMATION TECHNOLOGY Co Ltd
Original Assignee
NANJING TITAN INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING TITAN INFORMATION TECHNOLOGY Co Ltd filed Critical NANJING TITAN INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410199271.4A priority Critical patent/CN103955531B/zh
Publication of CN103955531A publication Critical patent/CN103955531A/zh
Application granted granted Critical
Publication of CN103955531B publication Critical patent/CN103955531B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明公开了基于命名实体库的在线知识地图,包括以下步骤:步骤1)爬取网页,向整个互联网爬取网页信息,得到互联网数据集;步骤2)抽取命名实体;步骤3)寻找属性词,遍历步骤1中的互联网数据集,建立命名实体与属性词关系集合;步骤4)量化信息,量化属性集合中属性词与命名实体之间的关联关系;步骤5)建立知识地图,通过命名实体关联的属性词集之间的关系,建立命名实体与命名实体之间的拓扑结构,形成知识地图;步骤6)更新。本发明从海量新增网页文本信息中抽取命名实体,自动地建立实体节点与节点之间的关联关系,根据知识节点及其之间的关联关系建立知识地图,并能高效地实现知识地图的更新。

Description

基于命名实体库的在线知识地图
技术领域
本发明涉及一种制作知识地图的方法,具体涉及一种基于命名实体库的在线知识地图。
背景技术
知识地图最早由英国情报学家B·C·布鲁克斯在《情报学基础》中提出情报学的真正任务是组织、加工和整理客官知识,绘制以各个知识单元为节点的知识地图。随着知识管理研究的发展,知识地步作为一种组织和管理的重要工具得到了广泛地研究,被应用于知识审计、知识组织、知识门户、知识评价、知识体系等诸多方面。目前国内外在知识地图的生成技术方面主要有以下几个方面:
迪吉科技有限公司的贺嘉生在2002提出了一种“知识地图的建立、编辑、检索与对应网络上信息内容的编辑方法”【CN1448863A】,依据不同的知识范畴,建立一套向现有知识地图中新增知识节点名称、描述、父节点、型态识别码的方法,接住输入节点识别码修改或删除知识地图中的节点名称及节点描述,最终利用知识地图进行搜寻、分类、编辑、检索,使所汇集的知识、信息图书馆化。
T.H.Ong等人在2005年提出了“Newsmap:一种在线新闻的知识地图(Newsmap:Aknowledge map for on line news)”(Decision Support System,Vol.39,pp.583-597,Apr.2005),通过生成层次化知识地图的可视化技术成功的展示了商业和医疗的新闻知识。
Duen-Ren Liu等人在2008年提出一种“复合电子服务的知识地图:一种基于挖掘与建议耦合的系统平台(Knowledge maps for composite e-services:A Mining-basedsystem platform coupling with recommendations)”(Expert System withApplication,34,pp.700-716,2008)使用系统记录中抽取知识模式,辅以数据挖掘技术构建知识地图。
上海交通大学的王英林等人在2011年提出了一种“基于本体的知识地图绘制系统”【CN102184194A】包括本体知识库、知识地图标示层和知识地图管理层。该技术以本体数据库的图形结构作为基本数据结构,通过对知识概念和知识关联的抽取表达来实现对不同知识地图的创建需求,并以XML形式输出到知识地图显示系统中。其中本体知识库存储通用知识及知识见的关系,知识地图表示层和本体知识库项链,并用抽象的知识节点代替知识库中的具体知识概念,知识关联引入复合运算,知识地图管理层与知识地图标示层项链管理抽象知识和复合知识关联的定义并存储到独立的数据库中实现知识地图的生成。
华中科技大学的金海教授等人在2012年提出了“一种基于维基百科构建概念型知识地 图的方法”【CN102609449A】从维基百科全文数据中抽取知识文档并分析其知识信息存入数据库,以知识节点格式描述将数据库中的知识转化为概念知识节点和类别知识节点,并建立索引提供基于关键字的知识检索。
铭传大学的卢阳正等人在2012年提出的“制作知识地图的方法”【CN103106232A】以词汇为中心,知识地图包含词汇(t)、多个关联词汇(s)及相互间权重(w),通过建立关联知识集{(t,s,w)}提供查询服务。通过词汇关联和知识集筛选,用K-mouns算法将关联词汇分组,输出知识地图。
这些知识地图的生成技术需要一个特定的文档集或者关系数据库中抽取出特定方面的信息,每次构建知识地图时需要重新收集和挖掘必要的信息,面对快速发展的互联网信息很难达到高效地添加新知识,实现高效地知识地图的更新。
发明内容
本发明的目的在于克服现有技术存在的以上问题,提供一种一种基于命名实体库的在线知识地图,本发明从海量新增网页文本信息中抽取命名实体,自动地建立实体节点与节点之间的关联关系,根据知识节点及其之间的关联关系建立知识地图,并能高效地实现知识地图的更新。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
基于命名实体库的在线知识地图的生成方法,包括以下步骤:
步骤1)爬取网页,向整个互联网爬取网页信息,得到互联网数据集;
步骤2)抽取命名实体,对互联网数据集的内容进行识别和抽取,得到命名实体;
步骤3)寻找属性词,遍历步骤1中的互联网数据集,寻找命名实体与属性对,建立与命名实体相关的属性集合;
步骤4)量化信息,量化属性集合中属性词与命名实体之间的关联关系,使命名实体关联属性词集;
步骤5)建立知识地图,通过命名实体关联的属性词集之间的关系,建立命名实体与命名实体之间的拓扑结构,形成知识地图。
步骤6)更新,在固定周期内对拓补结构进行更新。
2、进一步的,所述互联网数据集的内容包括结构化信息、半结构化与非结构化信息。
进一步的,遍历所述步骤2中互联网数据集的文档,对每个文档标签中的关键字进行判别,如果为是则存储至本地,否则忽略继续判别。
进一步的,所述步骤3包括以下过程:
(a1)遍历互联网数据集,以命名实体为中心,寻找出与命名实体相关联的属性词;
(a2)建立属性词与命名实体间的关联关系,形成一个命名实体对应一个属性集合。
进一步的,所述步骤4的量化信息具体为将不同命名实体对应的不同属性集合之间相同的部分进行整合并关联,建立不同属性集合之间的关联关系。
进一步的,所述步骤6包括以下过程:
(b1)重新爬取网页,向整个互联网爬取网页信息,得到最新的互联网数据集;
(b2)抽取命名实体,对最新的互联网数据集的内容进行识别并抽取,得到命名实体;
(b3)寻找属性词,遍历最新的互联网数据集,寻找命名实体与属性对,建立新的命名实体与属性集合;
(b4)对步骤5中的拓扑结构进行更新,将新的命名实体与属性集合和步骤3中命名实体与属性集合进行对比,首先对比命名实体,一致则对比属性集合,不一致则将新的命名实体加入知识地图中并存储至本地,属性集合对比一致则继续对比,不一致则将新的属性集合加入知识地图中关联与之相对应的命名实体并保存至本地;
(b5)量化信息,量化更新后的属性集合中属性词的与命名实体之间的关联关系,使命名实体关联属性词集,完成更新。
本发明的有益效果是:
本发明知识地图的节点来自于命名实体,命名实体间的关系来自于命名实体的属性,通过建立属性间的关联关系,将建立实体与实体之间的关系和权重,最终建立知识地图,其中本发明完全基于一个开放的互联网信息平台,通过分析知识节点的属性之间的集合关系建立知识节点之间的关联关系和层次关系,通过分析知识节点间的关系频率和空间位置来制定传递函数。该发明可以更好地实现新知识地图的生成、知识地图内新节点的衔接、知识节点内容的更新等操作。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的整体结构流程示意图;
图2是本发明的实施例的拓补结构示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
参照图1所示,基于命名实体库的在线知识地图,本实施例主要面向医疗数据方面,医疗体系的命名实体包括疾病、药品、医院、患者、医生等名称实体,这些命名实体包含病症、药品治疗的疾病或症状、医院地址、患者年龄、医生头衔等属性词汇。该实施例选用疾病和药物作为命名实体,选用疾病作为实体词的属性,包括以下步骤:
步骤1)爬取网页,向整个互联网具有医疗信息的服务器爬取网页信息,得到互联网数据集;互联网数据集的内容包括结构化信息、半结构化与非结构化信息,结构化信息:我们通常接触的数据库所管理的信息,包括生产、业务、交易、客户信息等方面的记录。非结构化信息:专业术语为内容,所涵盖的信息更为广泛,可分为:营运内容(operationalcontent):如合约、发票、书信与采购记录;部门内容(workgroupcontent):如文书处理、电子表格、简报档案与电子邮件;Web内容:如HTML与XML等格式的信息;多媒体内容(RichMediaContent):如声音、影片、图形等。半结构化数据:这样的数据和上面两种类别都不一样,它是结构化的数据,但是结构变化很大,因为我们要了解数据的细节所以不能将数据简单的组织成一个文件按照非结构化数据处理,由于结构变化很大也不能够简单的建立一个表和他对应。
因此可以将结构化信息和非结构化信息结合在一起,使用结构化信息来标注训练数据,训练数据由带有结构化信息的非结构化信息构成,来训练其他的非结构化信息,用机器学习的算法来构建分类器。我们可以选用最大熵模型来实现上述的分类器。最大熵模型主要基于两方面因素:特征空间的确定和特征的选择。它的问题描述是设最终输出值构成的语言学类别有限集为Y,对于每个y属于Y,其生成均受上下文信息x的影响和约束。已知与y有关的所有上下文信息组成的集合为X,则模型的目标是:给定上下文x属于X,计算输出为y属于Y的条件概率p(y|x)。
步骤2)抽取命名实体,对互联网数据集的内容进行识别和抽取,得到命名实体;具体为遍历步骤2中互联网数据集的文档,对每个文档标签中的关键字进行判别,如果为是则存储至本地,否则忽略继续判别,本实施例通过最大熵模型,通过结构化数据和非结构化数据,最后抽取出命名实体,此处为疾病名字和药物名字的命名实体词,如下:
疾病实体词:干燥综合征,细菌性心包炎,咖啡细菌性疫病,眼底黄斑病等;
药物实体词:优可达,力克保健液,伸筋丹胶囊,鼻通丸等。
虽然抽取出了命名实体词,而网页数据中很多都是来源于非专业人士,而抽取出的命名 实体词特别是疾病实体词过于学术,缺少口语性的疾病实体词。比如疾病实体题分裂情感性精神病,三联性精神病等,这些词在普通口语表达中即为精神病,但是提取出的实体词缺少这种口语行疾病名字。我们采用对实体词进行分词,提取公共部分的方法,再经由人工过滤提取出诸如精神病、感冒等口语性实体词同学术性实体词一起加入到知识库中。
步骤3)寻找属性词,遍历步骤1中的互联网数据集,寻找命名实体与属性对,建立与命名实体相关的属性集合;这个集合是属性词组成的,命名实体是集合的名称,内容是所有的属性词,包括以下过程:
(a1)遍历互联网数据集,以命名实体为中心,寻找出与命名实体相关联的属性词;
(a2)建立属性词与命名实体间的关联关系,形成一个命名实体对应一个属性集合;
(a3)属性集合中如有相同的属性词,则合并并记录出现频率;此步骤也可在a1中遍历寻找属性词时同时实行。
由于采用的命名实体词为疾病名字和药物名字,所以其属性词就是病症信息,是疾病实体词的属性词。病症与疾病或者药物实体词的区别就在于它并不是专业的术语,而是对疾病的描述,因此在知识库网站或者其他资料网站难以抓取具体的病症词汇,所以我们用抓取的具有医疗数据的互联网数据集来提取病症词汇。
抽取病症词汇基于以下的一个事实:在患者对医生描述病情或者医生向患者阐述该病症状的过程中,患者和医生仅能用有限的词汇去描述描述,并且这些词汇多数是来自于口语,是属于常见的词汇。在得到的大数据的背景下,一般的症状词汇必然是会被重复提起,并且不同的病往往会依托于相同的症状。所以症状词汇必然是在问题答案集里面出现频率较高的词汇。
在对症状词语进行提取时,进行简单的分词提取出的症状词诸如“发烧”“发痒”等词汇实际上是对症状的不完整描述,而不是症状的精确描述,比如“浑身发痒”或者是“脚心发痒”才是症状的完整描述。因此不能仅仅依靠简单的分词,我们使用了N-gram的切词技术来提取症状词汇。针对中文的N-gram的分词技术,3-grams的效果是最好的,因此分别进行3-gram,2-gram,1-gram的切词。根据上文描述的前提,症状词汇必然是出现频率比较高的,所以对词汇的出现频率进行排序,然后选择排名在前的部分词汇即可作为属性词,然后与命名实体建立关联关系。
步骤4)量化信息,量化属性集合中属性词与命名实体之间的关联关系,使命名实体关联属性词集;具体为将不同命名实体对应的不同属性集合之间相同的部分进行整合并关联,建立不同属性集合之间的关联关系。
步骤5)建立知识地图,通过命名实体关联的属性词集之间的关系,建立命名实体与命名实体之间的拓扑结构,形成知识地图。知识库里面有三种词汇:疾病名字,药物名字,病症词汇。很容易就可以得到这三者的关系:病症词汇是个特定疾病的描述,特定的疾病能够被药物所医治,特定的药物能治愈所描述的病症。根据这样的关系,我们根据训练数据的问题答案来建立三者之间的关系。
我们基于这样的前提,在问题答案对里面同时出现的实体词词汇和实体词属性词汇是相关的,并且出现的频率越高,代表他们的相关度也越高。比如:
问题:脚底很痒长红点怎么办?
答案:可以用达克宁试试,可以治脚气。
在这个例子中,我们提取出了疾病实体词“脚气”。药物实体词“达克宁”,以及症状词汇“脚底很痒”和“长红点”。那么我们认为这三种词汇是有联系的,如达克宁可以治疗脚气,脚底很痒和长红点是疾病脚气的描述症状。
根据出现的频率越高,代表相关度越高的概念,我们采用同现频率来表示他们的关联度。假设两个词语W1和W2,在所有的训练样例中,词汇W1出现的次数为N1,词汇W2出现的次数为N2,而两个词汇同时出现的次数为F12,那么计算同现频率的公式为:
根据同现频率的计算公式,我们得到一个类似的基于知识库的关系拓补结构,如图2所示,命名实体与命名实体或属性词之间均建立了关系,而这种关系的强弱则根据同现频率来表现。如疼和止痛膏的同现频率大于疼与胃炎的同现频率,那么疼和止痛膏的关系更加密切一些。
步骤6)更新,在固定周期内对拓补结构进行更新,包括以下过程:
(b1)重新爬取网页,向整个互联网爬取网页信息,得到最新的互联网数据集;
(b2)抽取命名实体,对最新的互联网数据集的内容进行识别并抽取,得到命名实体;
(b3)寻找属性词,遍历最新的互联网数据集,寻找命名实体与属性对,建立新的命名实体与属性集合;
(b4)对步骤5中的拓扑结构进行更新,将新的命名实体与属性集合和步骤3中命名实体与属性集合进行对比,首先对比命名实体,一致则对比属性集合,不一致则将新的命名实体加入知识地图中并存储至本地,属性集合对比一致则继续对比,不一致则将新的属性集合加入知识地图中关联与之相对应的命名实体并保存至本地;
(b5)量化信息,量化更新后的属性集合中属性词的与命名实体之间的关联关系,使命名实体关联属性词集,完成更新。
其中b4步骤中每次更新时的新的命名实体与属性集合均与更新时知识地图中的命名实体与属性集合对比。并且b1、b2、b3和b5步骤均与创建时一致。
本发明可以对整个互联网中所有数据进行创建知识地图,其中节点来自于命名实体,命名实体间的关系来自于实体属性,通过建立属性间的关联关系,并用机器学习的方法,将建立实体与实体之间的关系和权重,最终建立知识地图,所以无需向特定的文档集或者关系数据库中抽取出特定方面的信息,适用范围更广。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.基于命名实体库的在线知识地图的生成方法,其特征在于:包括以下步骤:
步骤1:爬取网页,向整个互联网爬取网页信息,得到互联网数据集;
步骤2:抽取命名实体,对互联网数据集的内容进行识别和抽取,得到命名实体;
步骤3:寻找并建立集合,遍历步骤1中的互联网数据集,寻找命名实体与属性对,建立与命名实体相关的属性集合;
步骤4:量化信息,量化属性集合中属性词与命名实体之间的关联关系,使命名实体关联属性词集;
步骤5:建立知识地图,通过命名实体关联的属性词集之间的关系,建立命名实体与命名实体之间的拓扑结构,形成知识地图;
步骤6:更新,在设定周期内对拓扑结构进行更新;
所述步骤6包括以下过程:
(b1)重新爬取网页,向整个互联网爬取网页信息,得到最新的互联网数据集;
(b2)抽取命名实体,对最新的互联网数据集的内容进行识别并抽取,得到命名实体;
(b3)寻找属性词,遍历最新的互联网数据集,寻找命名实体与属性对,建立新的命名实体与属性集合;
(b4)对步骤5中的拓扑结构进行更新,将新的命名实体与属性集合和步骤3中命名实体与属性集合进行对比,首先对比命名实体,一致则对比属性集合,不一致则将新的命名实体加入知识地图中并存储至本地,属性集合对比一致则继续对比,不一致则将新的属性集合加入知识地图中关联与之相对应的命名实体并保存至本地;
(b5)量化信息,量化更新后的属性集合中属性词与命名实体之间的关联关系,使命名实体关联属性词集,完成更新。
2.根据权利要求1所述的基于命名实体库的在线知识地图的生成方法,特征在于:所述互联网数据集的内容包括结构化信息、半结构化与非结构化信息。
3.根据权利要求1所述的基于命名实体库的在线知识地图的生成方法,其特征在于:遍历所述步骤2中命名实体的判别是将互联网数据集的文档中的关键词所属结构作为分类标签进行多维度识别。
4.根据权利要求1所述的基于命名实体库的在线知识地图的生成方法,特征在于:所述步骤3包括以下过程:
(a1)遍历互联网数据集,以命名实体为中心,寻找出与命名实体相关联的属性词;
(a2)建立属性词与命名实体间的关联关系,形成一个命名实体对应一个属性集合。
5.根据权利要求1所述的基于命名实体库的在线知识地图的生成方法,其特征在于:所述步骤4的量化信息具体为将不同命名实体对应的不同属性集合之间相同的部分进行整合并关联,建立不同属性集合之间的关联关系。
CN201410199271.4A 2014-05-12 2014-05-12 基于命名实体库的在线知识地图 Expired - Fee Related CN103955531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410199271.4A CN103955531B (zh) 2014-05-12 2014-05-12 基于命名实体库的在线知识地图

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410199271.4A CN103955531B (zh) 2014-05-12 2014-05-12 基于命名实体库的在线知识地图

Publications (2)

Publication Number Publication Date
CN103955531A CN103955531A (zh) 2014-07-30
CN103955531B true CN103955531B (zh) 2017-06-30

Family

ID=51332806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410199271.4A Expired - Fee Related CN103955531B (zh) 2014-05-12 2014-05-12 基于命名实体库的在线知识地图

Country Status (1)

Country Link
CN (1) CN103955531B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133916B (zh) * 2014-08-14 2019-01-15 百度在线网络技术(北京)有限公司 搜索结果信息组织方法和装置
CN106030570B (zh) * 2014-12-23 2020-09-29 微软技术许可有限责任公司 显现数据集间的关系
CN105868221A (zh) * 2015-01-23 2016-08-17 北京爱思赛博科技有限公司 一种通过数据节点网络来编辑自动问答程序知识库的方法
CN106355627A (zh) * 2015-07-16 2017-01-25 中国石油化工股份有限公司 一种用于生成知识图谱的方法及系统
CN105069045B (zh) * 2015-07-23 2018-07-31 百度在线网络技术(北京)有限公司 更新数据库中非永久性的关系数据的方法及系统
CN105447104A (zh) * 2015-11-12 2016-03-30 中国建设银行股份有限公司 一种知识地图生成方法及装置
CN105786980B (zh) * 2016-02-14 2019-12-20 广州神马移动信息科技有限公司 对描述同一实体的不同实例进行合并的方法、装置及设备
CN105956362B (zh) * 2016-04-20 2018-12-18 上海爱楷医疗科技有限公司 一种可信的病历结构化方法及系统
CN106055618B (zh) * 2016-05-26 2020-02-07 优品财富管理有限公司 一种基于网络爬虫与结构化存储的数据处理方法
CN106407443B (zh) * 2016-09-28 2022-04-22 医渡云(北京)技术有限公司 一种结构化医疗数据生成方法及装置
CN107169078A (zh) 2017-05-10 2017-09-15 京东方科技集团股份有限公司 中医药知识图谱及其建立方法以及计算机系统
CN108073673B (zh) * 2017-05-15 2019-02-26 北京华宇元典信息服务有限公司 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质
CN109241289A (zh) * 2017-07-04 2019-01-18 北京国双科技有限公司 实体信息图谱扩充方法及装置
CN107729319B (zh) * 2017-10-18 2021-03-09 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN108038183B (zh) * 2017-12-08 2020-11-24 北京百度网讯科技有限公司 结构化实体收录方法、装置、服务器和存储介质
CN108460146B (zh) * 2018-03-20 2021-09-14 武汉光庭信息技术股份有限公司 一种地图显示数据的容量消减方法
CN109446530A (zh) * 2018-11-03 2019-03-08 上海犀语科技有限公司 一种基于lstm模型由文本中抽取信息的方法及装置
CN109840275B (zh) * 2019-01-31 2021-08-17 北京嘉和海森健康科技有限公司 一种医疗搜索语句的处理方法、装置和设备
CN110162640A (zh) * 2019-04-28 2019-08-23 北京百度网讯科技有限公司 新实体挖掘方法、装置、计算机设备及存储介质
CN111104524A (zh) * 2019-12-25 2020-05-05 航天云网科技发展有限责任公司 一种识别电视端用户集合的方法
CN112711594A (zh) * 2021-01-15 2021-04-27 科技谷(厦门)信息技术有限公司 一种轨道交通数据集成方法
CN112786144B (zh) * 2021-01-29 2024-04-02 北京百度网讯科技有限公司 知识图谱的方法、医嘱质控的方法、装置、设备和介质
CN114138923A (zh) * 2021-12-03 2022-03-04 吉林大学 一种构建地质图知识图谱的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1448863A (zh) * 2002-04-04 2003-10-15 迪吉科技有限公司 知识地图的建立、编辑、检索与对应网络上信息内容的编辑方法
CN1494269A (zh) * 2002-11-02 2004-05-05 ��Ϊ�������޹�˾ 传输网络约束路径计算方法
CN103605706A (zh) * 2013-11-11 2014-02-26 华中师范大学 一种基于知识地图的资源检索方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156788A1 (en) * 2001-04-20 2002-10-24 Jia-Sheng Heh Method of constructing, editing, indexing, and matching up with information on the interner for a knowledge map
US20030093394A1 (en) * 2001-11-14 2003-05-15 Normand Frenette Knowledge capture and retrieval method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1448863A (zh) * 2002-04-04 2003-10-15 迪吉科技有限公司 知识地图的建立、编辑、检索与对应网络上信息内容的编辑方法
CN1494269A (zh) * 2002-11-02 2004-05-05 ��Ϊ�������޹�˾ 传输网络约束路径计算方法
CN103605706A (zh) * 2013-11-11 2014-02-26 华中师范大学 一种基于知识地图的资源检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于属性的知识地图渐进式增量模型;潘星 等;《系统工程学报》;20120415;第27卷(第2期);169-176 *
语义对等网环境下节点知识地图的构建;赵捧未 等;《图书情报工作》;20120220;第56卷(第4期);第2节,第3节,第4节 *

Also Published As

Publication number Publication date
CN103955531A (zh) 2014-07-30

Similar Documents

Publication Publication Date Title
CN103955531B (zh) 基于命名实体库的在线知识地图
CN112199511B (zh) 跨语言多来源垂直领域知识图谱构建方法
CN105183869B (zh) 楼宇知识图谱数据库及其构建方法
CN109657074B (zh) 基于地址树的新闻知识图谱构建方法
Wu et al. A survey of techniques for constructing Chinese knowledge graphs and their applications
CN105224622A (zh) 面向互联网的地名地址提取与标准化方法
CN101149751B (zh) 用于分析中医方剂药物组配规律的泛化关联规则挖掘方法
Sun et al. Progress and challenges on entity alignment of geographic knowledge bases
Cheng et al. Research on medical knowledge graph for stroke
CN110600123A (zh) 一种中医临床辅助诊断方法
CN115640406A (zh) 一种基于多源异构大数据分析处理与知识图谱构建方法
CN112420212A (zh) 一种脑卒中医疗知识图谱的构建方法
Heist et al. Language-agnostic relation extraction from abstracts in Wikis
CN112635071A (zh) 融合中西医知识的糖尿病知识图谱构建方法
Dong et al. TCMPR: TCM Prescription recommendation based on subnetwork term mapping and deep learning
Miao et al. Construction of semantic-based traditional Chinese medicine prescription knowledge graph
Cruz et al. Semantic extraction of geographic data from web tables for big data integration
US10924551B2 (en) IRC-Infoid data standardization for use in a plurality of mobile applications
Ding et al. Research on question answering system for COVID-19 based on knowledge graph
CN107291700A (zh) 实体词识别方法及装置
Xie A tcm question and answer system based on medical records knowledge graph
Jin et al. Research on the construction and application of breast cancer-specific database system based on full data lifecycle
CN112579790A (zh) 重症疾病知识库的构建方法、装置、存储介质及电子设备
Xie et al. Research on structured information extraction method of electronic medical records of traditional Chinese medicine
CN109783067A (zh) 基于本体CallCenter平台的智能知识整合与检索系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170630

Termination date: 20190512

CF01 Termination of patent right due to non-payment of annual fee