CN107391677A - 携带实体关系属性的中文通用知识图谱的生成方法及装置 - Google Patents

携带实体关系属性的中文通用知识图谱的生成方法及装置 Download PDF

Info

Publication number
CN107391677A
CN107391677A CN201710602759.0A CN201710602759A CN107391677A CN 107391677 A CN107391677 A CN 107391677A CN 201710602759 A CN201710602759 A CN 201710602759A CN 107391677 A CN107391677 A CN 107391677A
Authority
CN
China
Prior art keywords
entity
relationship
attribute
knowledge mapping
chinese character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710602759.0A
Other languages
English (en)
Other versions
CN107391677B (zh
Inventor
宋亚楠
邱楠
王昊奋
周磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Green Bristlegrass Intelligence Science And Technology Ltd
Original Assignee
Shenzhen Green Bristlegrass Intelligence Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Green Bristlegrass Intelligence Science And Technology Ltd filed Critical Shenzhen Green Bristlegrass Intelligence Science And Technology Ltd
Priority to CN201710602759.0A priority Critical patent/CN107391677B/zh
Publication of CN107391677A publication Critical patent/CN107391677A/zh
Application granted granted Critical
Publication of CN107391677B publication Critical patent/CN107391677B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Abstract

本发明提供的携带实体关系属性的中文通用知识图谱的生成方法及装置,方法为:对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;在多个实体关系中增加属性标识符,得到多个实体关系属性;根据多个实体、多个实体关系和多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。本发明通过在实体关系中添加标识符,建立实体关系属性,使通过知识图谱抽取答案时,由于实体关系属性的增加,提高了答案抽取的效率,且提高了抽取答案的完整性,使知识图谱更为高效地为使用者提供服务。

Description

携带实体关系属性的中文通用知识图谱的生成方法及装置
技术领域
本发明涉及人工智能领域,尤其涉及携带实体关系属性的中文通用知识图谱的生成方法及装置领域。
背景技术
知识图谱技术2012年由谷歌提出,其目标在于描述真实世界中存在的各种实体和概念,及实体、概念之间的关联关系,从而改善搜索结果。随后,知识图谱技术得到了研究人员和企业的重视,并在检索、风控等方面得到了应用。知识图谱在对输入进行回复的过程中,可以做一层、二层甚至多层检索以便组织最符合用户意图的全面的答案。
现有技术方案多是搜索引擎公司开发(google baidu sougou),用于特殊领域,比如百度和搜狗均开发人物关系的知识图谱,谷歌作为英文搜索为主的搜索引擎,对中文知识图谱的建立也有不足。尽管中文开放知识图谱联盟(OpenKG)已经搭建有OpenKG.CN技术平台,有35家机构入驻。吸引了国内如Zhishi.me,CN-DBPedia,PKUBase等最著名知识图谱资源加入,并已经包含了来自于常识、医疗、金融、城市、出行等15个类目的开放知识图谱。但中文通用知识图谱的开发目前仍显不足,中文通用知识图谱的开发平台也仍是空白领域。
当前知识图谱中存储的多是实体、实体属性、实体关系,但是关系本身也是具有属性的。另外,随着知识图谱规模变大,从其中推断新的关系或抽取特定答案工作量也变大,且信息产生的速度越来越快,需要快速更新知识图谱才能保证知识图谱的可靠性、有用性。另外,由于同一语义在自然语言中有多种不同的表达方式(“鲁迅出生在浙江绍兴”和“浙江绍兴是鲁迅的家乡”),导致在进行结构化查询(SPARQL)时无法抽取到完整答案。
因此,现有技术中的缺陷是:现有的知识图谱,由于知识图谱规模不断变大,单单依靠实体、实体属性和实体关系从知识图谱中抽取答案,导致效率慢、可靠性差,且由于同一语义在自然语言中有多种不同的表达方式,使抽取到的答案无法保证完整性。
发明内容
针对上述技术问题,本发明提供一种携带实体关系属性的中文通用知识图谱的生成方法及装置,通过在实体关系中添加标识符,建立实体关系属性,使通过知识图谱抽取答案时,由于实体关系属性的增加,提高了答案抽取的效率,且提高了抽取答案的完整性,使知识图谱更为高效地为使用者提供服务。
为解决上述技术问题,本发明提供的技术方案是:
第一方面,本发明提供一种携带实体关系属性的中文通用知识图谱生成方法,其特征在于,包括:
步骤S1,对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;
步骤S2,在所述多个实体关系中增加属性标识符,得到多个实体关系属性;
步骤S3,根据所述多个实体、所述多个实体关系和所述多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供一种携带实体关系属性的中文通用知识图谱生成方法,其技术方案为:对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;在所述多个实体关系中增加属性标识符,得到多个实体关系属性;根据所述多个实体、所述多个实体关系和所述多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供的一种携带实体关系属性的中文通用知识图谱生成方法,通过在实体关系中添加标识符,建立实体关系属性,使通过知识图谱抽取答案时,由于实体关系属性的增加,提高了答案抽取的效率,且提高了抽取答案的完整性,使知识图谱更为高效地为使用者提供服务。
进一步地,所述步骤S2,具体为:
通过RDF三元组,建立索引列表;
在所述索引列表中增加属性标识符,得到多个实体关系属性,所述实体关系属性中包括谓词的转述表达和谓词的逆转述表达。
进一步地,所述实体关系属性还包括实体树,所述实体树的建立具体为:
在所述多个实体中,选择一个根节点作为根节点,其他实体作为父节点和叶节点;
根据所述根节点、父节点和叶节点,建立实体树,所述实体树至多包括三层,第一层包括所述根节点,第二层包括多个父节点,第三节点包括多个叶节点。
进一步地,所述谓词的转述表达和谓词的逆转述表达采用独立表达方式。
进一步地,还包括检索步骤:
获取检索输入条件;
对所述检索输入条件中的实体通过所述实体树进行模糊或泛化处理,得到模糊实体;
根据所述模糊实体,实现在所述知识图谱中的检索。
第二方面,本发明提供一种携带实体关系属性的中文通用知识图谱生成装置,包括:
实体识别和实体关系识别模块,用于对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;
实体关系属性生成模块,用于在所述多个实体关系中增加属性标识符,得到多个实体关系属性;
知识图谱生成模块,用于根据所述多个实体、所述多个实体关系和所述多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供的携带实体关系属性的中文通用知识图谱生成装置,其技术方案为:通过实体识别和实体关系识别模块,对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;通过实体关系属性生成模块,在所述多个实体关系中增加属性标识符,得到多个实体关系属性;通过知识图谱生成模块,根据所述多个实体、所述多个实体关系和所述多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供一种携带实体关系属性的中文通用知识图谱生成装置,通过在实体关系中添加标识符,建立实体关系属性,使通过知识图谱抽取答案时,由于实体关系属性的增加,提高了答案抽取的效率,且提高了抽取答案的完整性,使知识图谱更为高效地为使用者提供服务。
进一步地,所述实体关系属性生成模块,具体用于:
通过RDF三元组,建立索引列表;
在所述索引列表中增加属性标识符,得到多个实体关系属性,所述实体关系属性中包括谓词的转述表达和谓词的逆转述表达。
进一步地,所述实体关系属性还包括实体树,所述装置还包括实体树建立模块,具体用于:
在所述多个实体中,选择一个根节点作为根节点,其他实体作为父节点和叶节点;
根据所述根节点、父节点和叶节点,建立实体树,所述实体树至多包括三层,第一层包括所述根节点,第二层包括多个父节点,第三节点包括多个叶节点。
进一步地,还包括检索模块,具体用于:
获取检索输入条件;
对所述检索输入条件中的实体通过所述实体树进行模糊或泛化处理,得到模糊实体;
根据所述模糊实体,实现在所述知识图谱中的检索。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现第一方面任一所述的方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。
图1示出了本发明实施例所提供的一种携带实体关系属性的中文通用知识图谱的生成方法的流程图;
图2示出了本发明实施例所提供的一种携带实体关系属性的中文通用知识图谱的生成装置的示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
实施例一
首先,对本发明中出现的名词进行解释:
知识图谱:一种基于图的数据结构,由节点和边组成。知识图谱是实体间关系的最有效表示方式。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。
实体(节点):在知识图谱里,每个节点表示现实世界中存在的“实体”。
实体属性:在知识图谱里,每个节点表示的“实体”的属性。
实体关系:在知识图谱里,每条边为实体与实体之间的“关系”。
实体关系属性:在知识图谱里,表示实体关系所具有的的属性。
第一方面,图1示出了本发明实施例所提供的一种携带实体关系属性的中文通用知识图谱的生成方法的流程图;如图1所示,实施例一提供的一种携带实体关系属性的中文通用知识图谱的生成方法,包括:
步骤S1,对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;
步骤S2,在多个实体关系中增加属性标识符,得到多个实体关系属性;
步骤S3,根据多个实体、多个实体关系和多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供一种携带实体关系属性的中文通用知识图谱生成方法,其技术方案为:对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;在多个实体关系中增加属性标识符,得到多个实体关系属性;根据多个实体、多个实体关系和多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供的一种携带实体关系属性的中文通用知识图谱的生成方法,通过在实体关系中添加标识符,建立实体关系属性,使通过知识图谱抽取答案时,由于实体关系属性的增加,提高了答案抽取的效率,且提高了抽取答案的完整性,使知识图谱更为高效地为使用者提供服务。
其中,步骤S1之前,还包括本体的构建,本体包括通用公开本体和专业领域公开本体,本体用来做数据描述和数据集成。本体可以从OWL(web本体语言)中直接获取,不需要额外的转换。
具体地,步骤S2,具体为:
通过RDF三元组,建立索引列表;
在索引列表中增加属性标识符,得到多个实体关系属性,实体关系属性中包括谓词的转述表达和谓词的逆转述表达。
其中,命名实体的识别,可通过将多种外部数据源和数据库映射为RDF(资源描述框架)结构实现。
具体为:
在RDF三元组后增加其标识id,增加标识id后的关系表示形如:(<object>,<predicate>,<subject>,`id`),如:
(<华为>,<设立>,"1987-09-15",`id_1hm2gmx_1xk_7y5fnj`)
(`id_1hm2gmx_1xk_7y5fnj`,<来源>,<http://www.tianyancha.com/company/24416401>)
(`id_1hm2gmx_1xk_7y5fnj`,<更新时间>,<2017-05-09>)
(`id_1hm2gmx_1xk_7y5fnj`,<谓词转述>,<创立>,<注册登记>,……)
(`id_1hm2gmx_1xk_7y5fnj`,<谓词逆转述>,<被设立>,……)
通过对关系增加属性标识符id,可以通过该id查找到与关系相关的信息,如关系的更新时间、来源、有效期等。
特别地,本发明通过标识符ID的增加,解决对同一语义的不同表达,无法识别出的问题,为实体关系定义谓词的转述表达和谓词的逆转述表达两个属性。其中,谓词的转述表达指该实体关系(RDF三元组)中谓词在自然语言中的同义词,如“诞生”的转述表达有“生于”、“创建”等,谓词的逆转述表达指该实体关系(RDF三元组)中谓词在自然语言中的互逆的词,如“工作”的逆转述表达有“雇佣”、“招纳”等。
特别地,这种表示方式可以保证在进行结构化查询时不需要通过正则等其它运算就可以以谓词的转述和逆转述表达方式为依据抽取到更全面的回答。
优选地,谓词的转述表达和谓词的逆转述表达采用独立表达方式。
考虑到不同语境中相同谓词的转述表达和逆转述表达可能不同,因此本发明将不同关系中谓词的转述表达和逆转述表达均单独表示,虽然会造成存储上的冗余,但是保证了提高结构化查询的精度。
通过知识图谱进行结构化检索的输入条件有时过于严格,在检索时可以适当模糊/泛化实体,如“歌曲”可以模糊为“音乐”,所以在标识实体关系中增加主语(object)的父实体和祖实体两个属性,用以在结构化检索的过程中模糊实体。本发明中为了存储实体的父实体和祖实体,定义了如下的实体树结构,具体为:
在多个实体中,选择一个根节点作为根节点,其他实体作为父节点和叶节点;
根据根节点、父节点和叶节点,建立实体树,实体树至多包括三层,第一层包括根节点,第二层包括多个父节点,第三节点包括多个叶节点。
以建立一个实体树为例,进行具体说明:
将实体按从属关系组织起来,一棵实体树(tree)是由n(n>0)个实体组成的有限集合,其中:
每个实体称为节点;
有且只有一个特定的实体,称为根实体或根(root),可以被包含在这棵实体树中其余任意实体的概念中;
每棵树的树高限制为三层,也就是所有实体树高度不超过三,从根节点到叶子节点每层分别编号为0、1、2,编号为0的层只包括一个根节点,编号为1的一层为父节点,编号为2的一层为叶节点,其中,如果父节点为多个,比如两个,其中第一个父节点对应的叶节点与第二个父节点没有对应关系,第二个父节点有自己对应的叶节点。
存储结构为:(`id_1hm2gmx_1xk_7y5fnj`,<实体树>,`tr_1hm2gmx_1xk_7y5fnj`),其中tr_1hm2gmx_1xk_7y5fnj是该实体关系对应实体树的索引。
还包括检索步骤:
获取检索输入条件;
对检索输入条件中的实体通过实体树进行模糊或泛化处理,得到模糊实体;
根据模糊实体,实现在知识图谱中的检索。
本发明中不采用标识ID,通过其他检索方案与算法,也可以在结构化搜索时找到较完备的答案。
通过知识图谱进行结构化检索答案的过程中,在找到某条实体关系后,可以根据关系的谓词表述、谓词逆表述、实体树等属性快速地抽取更加完备的答案。比如“鲁迅出生在浙江绍兴?”和“浙江绍兴是鲁迅的家乡?”,其中“出生”和“家乡”为谓词的逆转述,可自动识别为同一意思,在知识图谱中通过加入的实体关系属性,快速进行结构化的查询,得到准确的完整的答案。
优选地,对于不同的数据源,没有任何两个源能保证以完全相同的标识符标识同一实体,因此进行标准化处理,使命名实体的识别更准确。
具体地,多种外部数据源包括文本数据、图像数据、音频数据和视频数据中的至少一种。外部数据源为非结构数据,数据库为结构数据。
具体地,对多种外部数据源中的实体进行命名实体识别,具体为:
当外部数据源为文本数据,通过条件随机场、有监督或无监督的机器学习的方式对文本数据中的实体进行命名实体识别;
当外部数据源为图像数据,通过数字图像识别技术对图像数据中的实体进行命名实体识别;具体为:通过图像去燥、分割、特征抽取等步骤获取图像的特征表示,将获取的图像特征输入到分类器中,分类器输出图像中包含的实体类型和实体相关属性,为基于现有技术实现,因此在本发明中不再赘述。
当外部数据源为音频数据,通过语音识别技术将音频数据转化为文本信息后,采用文本数据实体识别技术对文本信息中的实体进行命名实体识别;具体为:语音识别包括语音转文字、分词、标注、命名实体识别等步骤,基于现有技术实现,因此在本发明中不再赘述。
当外部数据源为视频数据,通过视频分析及识别技术对视频数据中的实体进行命名实体识别。具体为:包括:关键帧提取、上下文分析、关键帧识别、场景识别等,其实现方式为基于现有技术实现的,因此在本发明中不再赘述。
不同类型的数据,命名实体的识别过程也不尽相同,对于不同类型的数据进行差异性的识别处理,保证命名实体识别的准确性。
优选地,通过公共实例或类URI对多个实体进行连接,得到多个实体关系。
参见图2,第二方面,本发明提供一种携带实体关系属性的中文通用知识图谱的生成装置10,包括:
实体识别和实体关系识别模块101,用于对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;
实体关系属性生成模块102,用于在多个实体关系中增加属性标识符,得到多个实体关系属性;
知识图谱生成模块103,用于根据多个实体、多个实体关系和多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供的携带实体关系属性的中文通用知识图谱生成装置10,其技术方案为:通过实体识别和实体关系识别模块101,对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;通过实体关系属性生成模块102,在多个实体关系中增加属性标识符,得到多个实体关系属性;通过知识图谱生成模块103,根据多个实体、多个实体关系和多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
本发明提供一种携带实体关系属性的中文通用知识图谱生成装置10,通过在实体关系中添加标识符,建立实体关系属性,使通过知识图谱抽取答案时,由于实体关系属性的增加,提高了答案抽取的效率,且提高了抽取答案的完整性,使知识图谱更为高效地为使用者提供服务。
优选地,实体关系属性生成模块,具体用于:
通过RDF三元组,建立索引列表;
在索引列表中增加属性标识符,得到多个实体关系属性,实体关系属性中包括谓词的转述表达和谓词的逆转述表达。
优选地,实体关系属性还包括实体树,装置还包括实体树建立模块,具体用于:
在多个实体中,选择一个根节点作为根节点,其他实体作为父节点和叶节点;
根据根节点、父节点和叶节点,建立实体树,实体树至多包括三层,第一层包括根节点,第二层包括多个父节点,第三节点包括多个叶节点。
优选地,还包括检索模块,具体用于:
获取检索输入条件;
对检索输入条件中的实体通过实体树进行模糊或泛化处理,得到模糊实体;
根据模糊实体,实现在知识图谱中的检索。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现第一方面任一所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种携带实体关系属性的中文通用知识图谱生成方法,其特征在于,包括:
步骤S1,对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;
步骤S2,在所述多个实体关系中增加属性标识符,得到多个实体关系属性;
步骤S3,根据所述多个实体、所述多个实体关系和所述多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
2.根据权利要求1所述的携带实体关系属性的中文通用知识图谱生成方法,其特征在于,
所述步骤S2,具体为:
通过RDF三元组,建立索引列表;
在所述索引列表中增加属性标识符,得到多个实体关系属性,所述实体关系属性中包括谓词的转述表达和谓词的逆转述表达。
3.根据权利要求1所述的携带实体关系属性的中文通用知识图谱生成方法,其特征在于,
所述实体关系属性还包括实体树,所述实体树的建立具体为:
在所述多个实体中,选择一个根节点作为根节点,其他实体作为父节点和叶节点;
根据所述根节点、父节点和叶节点,建立实体树,所述实体树至多包括三层,第一层包括所述根节点,第二层包括多个父节点,第三节点包括多个叶节点。
4.根据权利要求2所述的携带实体关系属性的中文通用知识图谱生成方法,其特征在于,
所述谓词的转述表达和谓词的逆转述表达采用独立表达方式。
5.根据权利要求3所述的携带实体关系属性的中文通用知识图谱生成方法,其特征在于,
还包括检索步骤:
获取检索输入条件;
对所述检索输入条件中的实体通过所述实体树进行模糊或泛化处理,得到模糊实体;
根据所述模糊实体,实现在所述知识图谱中的检索。
6.一种携带实体关系属性的中文通用知识图谱生成装置,其特征在于,包括:
实体识别和实体关系识别模块,用于对多种外部数据源和数据库中的实体进行命名实体识别,并对识别得到的多个命名实体进行连接,得到多个实体关系;
实体关系属性生成模块,用于在所述多个实体关系中增加属性标识符,得到多个实体关系属性;
知识图谱生成模块,用于根据所述多个实体、所述多个实体关系和所述多个实体关系属性,生成携带实体关系属性的中文通用知识图谱。
7.根据权利要求6所述的携带实体关系属性的中文通用知识图谱生成装置,其特征在于,
所述实体关系属性生成模块,具体用于:
通过RDF三元组,建立索引列表;
在所述索引列表中增加属性标识符,得到多个实体关系属性,所述实体关系属性中包括谓词的转述表达和谓词的逆转述表达。
8.根据权利要求6所述的携带实体关系属性的中文通用知识图谱生成装置,其特征在于,
所述实体关系属性还包括实体树,所述装置还包括实体树建立模块,具体用于:
在所述多个实体中,选择一个根节点作为根节点,其他实体作为父节点和叶节点;
根据所述根节点、父节点和叶节点,建立实体树,所述实体树至多包括三层,第一层包括所述根节点,第二层包括多个父节点,第三节点包括多个叶节点。
9.根据权利要求8所述的携带实体关系属性的中文通用知识图谱生成装置,其特征在于,
还包括检索模块,具体用于:
获取检索输入条件;
对所述检索输入条件中的实体通过所述实体树进行模糊或泛化处理,得到模糊实体;
根据所述模糊实体,实现在所述知识图谱中的检索。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5之一所述的方法。
CN201710602759.0A 2017-07-21 2017-07-21 携带实体关系属性的中文通用知识图谱的生成方法及装置 Expired - Fee Related CN107391677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710602759.0A CN107391677B (zh) 2017-07-21 2017-07-21 携带实体关系属性的中文通用知识图谱的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710602759.0A CN107391677B (zh) 2017-07-21 2017-07-21 携带实体关系属性的中文通用知识图谱的生成方法及装置

Publications (2)

Publication Number Publication Date
CN107391677A true CN107391677A (zh) 2017-11-24
CN107391677B CN107391677B (zh) 2020-10-13

Family

ID=60337040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710602759.0A Expired - Fee Related CN107391677B (zh) 2017-07-21 2017-07-21 携带实体关系属性的中文通用知识图谱的生成方法及装置

Country Status (1)

Country Link
CN (1) CN107391677B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052576A (zh) * 2017-12-08 2018-05-18 国家计算机网络与信息安全管理中心 一种事理知识图谱构建方法及系统
CN108182245A (zh) * 2017-12-28 2018-06-19 北京锐安科技有限公司 人对象属性分类知识图谱的构建方法及装置
CN108304493A (zh) * 2018-01-10 2018-07-20 深圳市腾讯计算机系统有限公司 一种基于知识图谱的上位词挖掘方法及装置
CN108388580A (zh) * 2018-01-24 2018-08-10 平安医疗健康管理股份有限公司 融合医学知识及应用病例的动态知识图谱更新方法
CN108415971A (zh) * 2018-02-08 2018-08-17 兰州智豆信息科技有限公司 采用知识图谱推荐供求信息的方法和装置
CN108509563A (zh) * 2018-03-23 2018-09-07 深圳狗尾草智能科技有限公司 基于知识图谱的机器人推理联想方法、装置、设备及介质
CN109145119A (zh) * 2018-07-02 2019-01-04 北京妙医佳信息技术有限公司 健康管理领域的知识图谱构建装置及构建方法
CN109213844A (zh) * 2018-08-13 2019-01-15 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
CN109840283A (zh) * 2019-03-01 2019-06-04 东北大学 一种基于传递关系的本地自适应知识图谱优化方法
CN109918512A (zh) * 2019-03-01 2019-06-21 北京航空航天大学 一种多域环境中基于知识图谱的高性能服务资源表征方法
CN109960722A (zh) * 2019-03-31 2019-07-02 联想(北京)有限公司 一种信息处理方法及装置
CN110019560A (zh) * 2017-12-28 2019-07-16 中国移动通信集团上海有限公司 一种基于知识图谱的查询方法及装置
CN110674224A (zh) * 2019-08-02 2020-01-10 北京百度网讯科技有限公司 实体数据的处理方法、装置、设备及计算机可读存储介质
CN111400503A (zh) * 2020-02-28 2020-07-10 广州数说故事信息科技有限公司 一种基于多指标的知识图谱生成方法
CN111670446A (zh) * 2017-12-01 2020-09-15 科蒂维蒂公司 自动生成推理图

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156083A (zh) * 2015-03-31 2016-11-23 联想(北京)有限公司 一种领域知识处理方法及装置
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156083A (zh) * 2015-03-31 2016-11-23 联想(北京)有限公司 一种领域知识处理方法及装置
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张奇: ""信息抽取中实体关系识别研究"", 《中国博士学位论文全文数据库 信息科技辑》 *
高小青: "面向自然问句的SPARQL查询生成方法研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111670446A (zh) * 2017-12-01 2020-09-15 科蒂维蒂公司 自动生成推理图
CN111670446B (zh) * 2017-12-01 2023-10-27 科蒂维蒂公司 自动生成推理图
CN108052576B (zh) * 2017-12-08 2021-04-23 国家计算机网络与信息安全管理中心 一种事理知识图谱构建方法及系统
CN108052576A (zh) * 2017-12-08 2018-05-18 国家计算机网络与信息安全管理中心 一种事理知识图谱构建方法及系统
CN108182245A (zh) * 2017-12-28 2018-06-19 北京锐安科技有限公司 人对象属性分类知识图谱的构建方法及装置
CN110019560A (zh) * 2017-12-28 2019-07-16 中国移动通信集团上海有限公司 一种基于知识图谱的查询方法及装置
CN110019560B (zh) * 2017-12-28 2021-09-21 中国移动通信集团上海有限公司 一种基于知识图谱的查询方法及装置
CN108304493A (zh) * 2018-01-10 2018-07-20 深圳市腾讯计算机系统有限公司 一种基于知识图谱的上位词挖掘方法及装置
CN108304493B (zh) * 2018-01-10 2020-06-12 深圳市腾讯计算机系统有限公司 一种基于知识图谱的上位词挖掘方法及装置
CN108388580A (zh) * 2018-01-24 2018-08-10 平安医疗健康管理股份有限公司 融合医学知识及应用病例的动态知识图谱更新方法
CN108415971B (zh) * 2018-02-08 2021-07-23 兰州智豆信息科技有限公司 采用知识图谱推荐供求信息的方法和装置
CN108415971A (zh) * 2018-02-08 2018-08-17 兰州智豆信息科技有限公司 采用知识图谱推荐供求信息的方法和装置
CN108509563A (zh) * 2018-03-23 2018-09-07 深圳狗尾草智能科技有限公司 基于知识图谱的机器人推理联想方法、装置、设备及介质
CN109145119A (zh) * 2018-07-02 2019-01-04 北京妙医佳信息技术有限公司 健康管理领域的知识图谱构建装置及构建方法
CN109213844A (zh) * 2018-08-13 2019-01-15 腾讯科技(深圳)有限公司 一种文本处理方法、装置以及相关设备
WO2020177142A1 (zh) * 2019-03-01 2020-09-10 东北大学 一种基于传递关系的本地自适应知识图谱优化方法
CN109918512A (zh) * 2019-03-01 2019-06-21 北京航空航天大学 一种多域环境中基于知识图谱的高性能服务资源表征方法
CN109840283A (zh) * 2019-03-01 2019-06-04 东北大学 一种基于传递关系的本地自适应知识图谱优化方法
CN109960722A (zh) * 2019-03-31 2019-07-02 联想(北京)有限公司 一种信息处理方法及装置
CN109960722B (zh) * 2019-03-31 2021-10-22 联想(北京)有限公司 一种信息处理方法及装置
CN110674224A (zh) * 2019-08-02 2020-01-10 北京百度网讯科技有限公司 实体数据的处理方法、装置、设备及计算机可读存储介质
CN110674224B (zh) * 2019-08-02 2022-05-27 北京百度网讯科技有限公司 实体数据的处理方法、装置、设备及计算机可读存储介质
CN111400503A (zh) * 2020-02-28 2020-07-10 广州数说故事信息科技有限公司 一种基于多指标的知识图谱生成方法
CN111400503B (zh) * 2020-02-28 2023-09-22 广州数说故事信息科技有限公司 一种基于多指标的知识图谱生成方法

Also Published As

Publication number Publication date
CN107391677B (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN107391677A (zh) 携带实体关系属性的中文通用知识图谱的生成方法及装置
CN109284363B (zh) 一种问答方法、装置、电子设备及存储介质
WO2018072563A1 (zh) 一种知识图谱构建方法、装置及系统
CN108268580A (zh) 基于知识图谱的问答方法及装置
CN106776797A (zh) 一种基于本体推理的知识问答系统及其工作方法
CN107391673A (zh) 携带时间戳的中文通用知识图谱的生成方法及装置
Debattista et al. Linked'Big'Data: towards a manifold increase in big data value and veracity
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
Cortis et al. Discovering semantic equivalence of people behind online profiles
CN114218472A (zh) 基于知识图谱的智能搜索系统
CN113761208A (zh) 一种基于知识图谱的科技创新资讯分类方法和存储设备
CN116244412A (zh) 多意图识别方法及装置
Ramar et al. Technical review on ontology mapping techniques
CN113641833B (zh) 服务需求匹配方法及装置
Li et al. Neural factoid geospatial question answering
Zhang et al. Construction of fuzzy ontologies from fuzzy XML models
CN116467291A (zh) 一种知识图谱存储与搜索方法及系统
CN116561264A (zh) 一种基于知识图谱的智能问答系统的构建方法
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
Malik et al. Semantic annotation framework for intelligent information retrieval using KIM architecture
Puebla-Martínez et al. Automatic expansion of spatial ontologies for geographic information retrieval
Fatma et al. Canonicalizing knowledge bases for recruitment domain
Zlatareva et al. Natural Language to SPARQL Query Builder for Semantic Web Applications
Paulus et al. Recommending Semantic Concepts for Improving the Process of Semantic Modeling
Seidel et al. KESeDa: knowledge extraction from heterogeneous semi-structured data sources

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 301, Building 39, 239 Renmin Road, Gusu District, Suzhou City, Jiangsu Province, 215000

Applicant after: SHENZHEN GOWILD ROBOTICS Co.,Ltd.

Address before: Oriental Science and Technology Building No. 16 Keyuan Road, Shenzhen street 518057 city in Guangdong province Nanshan District Guangdong 1307-09

Applicant before: SHENZHEN GOWILD ROBOTICS Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201013

Termination date: 20210721

CF01 Termination of patent right due to non-payment of annual fee