CN105956052A - 一种基于垂直领域的知识图谱的构建方法 - Google Patents

一种基于垂直领域的知识图谱的构建方法 Download PDF

Info

Publication number
CN105956052A
CN105956052A CN201610267606.0A CN201610267606A CN105956052A CN 105956052 A CN105956052 A CN 105956052A CN 201610267606 A CN201610267606 A CN 201610267606A CN 105956052 A CN105956052 A CN 105956052A
Authority
CN
China
Prior art keywords
class
entity
text
attribute
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610267606.0A
Other languages
English (en)
Inventor
刘晓强
张振峰
王凌杰
于忠清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haiersoft Co Ltd
Original Assignee
Qingdao Haiersoft Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haiersoft Co Ltd filed Critical Qingdao Haiersoft Co Ltd
Priority to CN201610267606.0A priority Critical patent/CN105956052A/zh
Publication of CN105956052A publication Critical patent/CN105956052A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Abstract

一种基于垂直领域的知识图谱的构建方法,包括以下步骤:(1)抽取在线百科的类的词汇实现和类之间的上下位关系;(2)将领域知识的信息进行归并,定义领域的数据属性和关系属性,并且进一步规约属性的定义域和值域;(3)实体层的学习,即抽取实体和填充实体的属性值;结构化和半结构化的数据,利用D2R或数据采集工具批量处理;对于非结构化的文本数据,定义上层本体的类和属性及其之间的关系,根据类和属性的关系识别实例;本发明的优点是:通过该方法,使的垂直领域知识图谱的构建知识分类清晰,且实现了知识图谱的自学习和自动扩展,对垂直领域的信息检索和语义分析起到关键作用。

Description

一种基于垂直领域的知识图谱的构建方法
技术领域
本发明涉及一种基于垂直领域的知识图谱的构建方法,主要用于垂直领域的问答系统和信息搜索的语义分析,并提高检索准确率。本发明通过定义知识图谱中类的约束并根据类的约束识别实体,自动学习和扩展领域知识图谱,依赖于自然语言处理相关技术和计算机技术。
背景技术
2012年5月,谷歌在本体的基础上提出“知识图谱”的概念,扩展了本体的实体及其之间的关系。使得用户的搜索信息对应客观世界的实体,而不仅仅是一个字符串。谷歌利用知识图谱实现了问答系统的功能,返回给用户一个准确的答案,而不仅仅是一系列链接。2012年11月,搜狗推出国内最早的知识图谱--搜狗知立方。2013年2月,百度推出知识图谱百度知心。
知识图谱的构建方法尚处于研究阶段,现有知识图谱的构建方法基本上是基于本体的构建方法,知识图谱强调实体层次的扩展,通用性低,但携带的信息更加具体,实体之间的关系复杂,形成一个网状图。构建知识图谱时,基本采用格式化的数据表,而对于非结构化的文本信息的利用很少。按照本体的通用程度,知识图谱分为通用知识图谱和行业知识图谱。对于知识图谱的构建方法主要有自顶向下的构建方法和自底向上的构建方法。自顶向下的方法是指首先为知识图谱定义数据模式,包括类的上下位关系和类的约束,然后逐步细化构建实体;自底向上的方法则首先构建实体,然后逐步往上抽象形成类。无论自顶而下还是自底而上的方法都需要解决以下三个问题:
1.数据模式的定义:
数据模式的定义包括类的定义及类的约束。由于类之间存在上下位关系,而类的约束依赖于属性的定义,因此数据模式的定义依赖于关系的抽取。
2.关系的抽取:
关系分为分类关系和非分类关系,分类关系即概念的上下位关系,非分类关系即除了分类关系以外其他的关系,通常对应本体中的属性,主要是自然语言中的动词和描述性的词语。
分类关系的抽取。通常采用的方法有:基于词法模式的方法,基于共现分析的方法,基于语言学的方法和基于开发链接数据和在线百科的方法。
非分类关系的抽取。通常采用的方法有:基于关联规则分析的方法和基于开发链接数据和在线百科的方法。
当前的知识图谱构建技术中,主要从结构化和半结构化的数据中抽取实体和关系,且在抽取到分类关系或非分类关系后,没有利用关系对类进行约束,从而不能利用类的约束从非结构化的文本中抽取实例。
3.实体层的学习:
实体是知识图谱中的主要组成部分,实体层的学习包括实体的词汇实现和实体的数据填充。实体的词汇实现是指表述实体的词汇,通常对应文章页面的标题。实体的数据填充主要为实体添加属性及属性值,或者通过属性建立实体与其他实体之间的关系。
发明内容
本发明旨在提供一种基于垂直领域的知识图谱的构建方法,以解决现有垂直领域存在的信息检索和自动问答系统的语义分析,以及信息检索和自动问答系统的召回率、准确率较低的问题。
本发明的技术方案是:
一种基于垂直领域的知识图谱的构建方法,其特征在于,包括以下步骤:
(1)类的词汇实现和类的上下位关系:从在线百科的分类系统和领域的产品分类目录中抽取类的词汇实现和类之间的上下位关系;
(2)定义属性和类的约束:
将领域知识的信息进行归并,定义领域的数据属性和关系属性,并且进一步规约属性的定义域和值域;
(3)实体层的学习,即抽取实体和填充实体的属性值:
实体层的学习根据被填充数据的来源主要分为两部分:一部分为结构化和半结构化的数据,另一部分为非结构化的文本信息;
对于属性及其属性值的格式定义良好的结构化和半结构化的数据,利用D2R或数据采集工具进行批量处理;
对于非结构化的文本信息,则利用自然语言处理技术,对文本进行分词、句法依赖分析,识别类的约束,对满足约束的词汇构建为相应类的实体,并补充数据值。
2、根据权利要求1所述的基于垂直领域的知识图谱的构建方法,其特征在于,所述的步骤(3)中,对于非结构化的文本信息的处理方法包括以下步骤:
(1)文本预处理:利用计算机终端登录互联网,启动客户端,输入客服与
用户的聊天记录等文本信息,借助自然语言处理相关技术,对文本分词、词语标准化、去停用词;
(2)识别文本中的领域知识图谱的类、属性、实体和属性值:
将定义的知识图谱中的类、属性、实体和属性值加入到自定义词典中,
并设置相应的词性,分词时根据词性将词语对应到领域知识图谱中;
(3)对文本中的句子进行语法依赖分析:
利用斯坦福自然语言工具包对文本中的词语进行语法依赖分析,根据词语之间的依赖关系将文本中的词语与知识图谱中类的约束进行映射;
(4)根据已定义的类的约束文本中的实体的属性及属性值:
若词语满足某个类的所有约束,则将该词汇构建为相应类的实体,并将
该实体的属性及其属性关系填充到知识图谱中;并在计算机终端的显示器上输出领域知识图谱的实体和实体的属性值。
本发明的优点是:通过该方法,使的垂直领域知识图谱的构建知识分类清晰,且实现了知识图谱的自学习和自动扩展,对垂直领域的信息检索和语义分析起到关键作用。
附图说明
图1是本发明的垂直领域的知识图谱的构建方法总流程图;
图2是本发明中非结构化的文本数据源实体的识别与实体的数据扩充流程图;
图3是本发明领域知识图谱的类的词汇实现和类的上下位关系示意图;
图4是本发明领域知识图谱的属性和类的约束示意图。
具体实施方式
参见图1,本发明一种基于垂直领域的知识图谱的构建方法,包括以下步骤:
1.抽取在线百科的类的词汇实现:利用计算机终端登录互联网,从在线百科的分类系统和领域的产品分类目录中抽取类的词汇实现和类之间的上下位关系,如图3所示,将母婴领域的知识进行分类,“婴儿用品”分为“奶粉”“纸尿裤”“辅食”等,相应的“母婴用品品牌”分为“奶粉品牌”“纸尿裤品牌”“辅食品牌”等。
输入:在线百科如互动百科(链接:http://fenlei.baike.com/)的分类系统。
输出:领域知识图谱的类的词汇实现和类的上下位关系(参见图3)。
2.定义属性和类的约束:
如图4所示,将领域知识的信息进行归并,定义领域的数据属性和关系属性,并且进一步规约属性的定义域和值域。这种规约定义为一条条的规则描述。如类“奶粉”的属性“品牌”值域是奶粉品牌的实体[安满 惠氏奶粉 荷兰牛栏 ……],这样在检索到某个概念的品牌为在[安满 惠氏奶粉 荷兰牛栏 ……]范围内,则视该概念满足“奶粉”的一个约束。
输入:领域知识丰富的电子商务平台;
输出:领域知识图谱的属性和类的约束(参见图4)。
3.实体层的学习,即抽取实体和填充实体的属性值:
实体层的学习根据被填充数据的来源主要分为两部分:一部分为结构化和半结构化的数据,另一部分为非结构化的文本信息。本步骤仅确定数据源,对不同的数据源采取不同的策略。
4.结构化和半结构化的数据,对于属性及其属性值的格式定义良好,利
用D2R或数据采集工具批量处理。
输入:数据库,领域电子商务平台的产品信息:
输出:领域知识图谱的实体和实体的属性值。
5.对于非结构化的文本数据,根据已定义的类的约束识别文本中的实体的属性及属性值。具体实现流程如图2所示:
对于非结构化的文本数据的填充方法包括以下步骤:
(1)文本预处理:利用计算机终端登录互联网,启动客户端,输入客服与
用户的聊天记录等文本信息,借助自然语言处理相关技术,对文本分词、词语标准化、去停用词(常规技术)。
(2) 识别文本中的领域知识图谱的类、属性、实体和属性值:
将步骤2定义的类的类、属性、实体和属性值加入到自定义词典中,并设置相应的词性,分词时根据词性将词语对应到领域知识图谱中。
(3) 对文本中的句子进行语法依赖分析:
利用斯坦福自然语言工具包对文本中的词语进行语法依赖分析(现有技术),根据词语之间的依赖关系将文本中的词语与知识图谱中类的约束进行映射。
(4)根据已定义的类的约束文本中的实体的属性及属性值:
若词语满足某个类的所有约束,则将该词汇构建为相应类的实体,并将该
实体的属性及其属性关系填充到知识图谱中。并在计算机终端的显示器上输出领域知识图谱的实体和实体的属性值。

Claims (2)

1.一种基于垂直领域的知识图谱的构建方法,其特征在于,包括以下步骤:
(1)类的词汇实现和类的上下位关系:从在线百科的分类系统和领域的产品分类目录中抽取类的词汇实现和类之间的上下位关系;
(2)定义属性和类的约束:
将领域知识的信息进行归并,定义领域的数据属性和关系属性,并且进一步规约属性的定义域和值域;
(3)实体层的学习,即抽取实体和填充实体的属性值:
实体层的学习根据被填充数据的来源主要分为两部分:一部分为结构化和半结构化的数据,另一部分为非结构化的文本信息;
对于属性及其属性值的格式定义良好的结构化和半结构化的数据,利用D2R或数据采集工具进行批量处理;
对于非结构化的文本信息,则利用自然语言处理技术,对文本进行分词、句法依赖分析,识别类的约束,对满足约束的词汇构建为相应类的实体,并补充数据值。
2.根据权利要求1所述的基于垂直领域的知识图谱的构建方法,其特征在于,所述的步骤(3)中,对于非结构化的文本信息的处理方法包括以下步骤:
(1)文本预处理:利用计算机终端登录互联网,启动客户端,输入客服与
用户的聊天记录等文本信息,借助自然语言处理相关技术,对文本分词、词语标准化、去停用词;
识别文本中的领域知识图谱的类、属性、实体和属性值:
将定义的知识图谱中的类、属性、实体和属性值加入到自定义词典中,并设置相应的词性,分词时根据词性将词语对应到领域知识图谱中;
对文本中的句子进行语法依赖分析:
利用斯坦福自然语言工具包对文本中的词语进行语法依赖分析(现有技术),根据词语之间的依赖关系将文本中的词语与知识图谱中类的约束进行映射;
根据已定义的类的约束文本中的实体的属性及属性值:
若词语满足某个类的所有约束,则将该词汇构建为相应类的实体,并将该
实体的属性及其属性关系填充到知识图谱中;并在计算机终端的显示器上输出领域知识图谱的实体和实体的属性值。
CN201610267606.0A 2016-04-27 2016-04-27 一种基于垂直领域的知识图谱的构建方法 Pending CN105956052A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610267606.0A CN105956052A (zh) 2016-04-27 2016-04-27 一种基于垂直领域的知识图谱的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610267606.0A CN105956052A (zh) 2016-04-27 2016-04-27 一种基于垂直领域的知识图谱的构建方法

Publications (1)

Publication Number Publication Date
CN105956052A true CN105956052A (zh) 2016-09-21

Family

ID=56916273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610267606.0A Pending CN105956052A (zh) 2016-04-27 2016-04-27 一种基于垂直领域的知识图谱的构建方法

Country Status (1)

Country Link
CN (1) CN105956052A (zh)

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649264A (zh) * 2016-11-21 2017-05-10 中国农业大学 一种基于篇章信息的中文水果品种信息抽取方法及装置
CN106874378A (zh) * 2017-01-05 2017-06-20 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN106997399A (zh) * 2017-05-24 2017-08-01 海南大学 一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法
CN107038263A (zh) * 2017-06-23 2017-08-11 海南大学 一种面向事务计算效率的基于数据图谱、信息图谱和知识图谱的搜索优化方法
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN107832407A (zh) * 2017-11-03 2018-03-23 上海点融信息科技有限责任公司 用于生成知识图谱的信息处理方法、装置和可读存储介质
CN107862075A (zh) * 2017-11-29 2018-03-30 浪潮软件股份有限公司 一种基于医疗卫生大数据的知识图谱构建方法及装置
CN108197173A (zh) * 2017-12-20 2018-06-22 广州创显科教股份有限公司 一种基于知识图谱的大数据学情分析系统
CN108256063A (zh) * 2018-01-15 2018-07-06 中国人民解放军国防科技大学 一种面向网络安全的知识库构建方法
CN108304519A (zh) * 2018-01-24 2018-07-20 西安交通大学 一种基于图数据库的知识森林构建方法
CN108399180A (zh) * 2017-02-08 2018-08-14 腾讯科技(深圳)有限公司 一种知识图谱构建方法、装置及服务器
CN108491443A (zh) * 2018-02-13 2018-09-04 上海好体信息科技有限公司 由计算机实施的与用户对话的方法和计算机系统
CN109086391A (zh) * 2018-07-27 2018-12-25 北京光年无限科技有限公司 一种构建知识图谱的方法及系统
CN109471949A (zh) * 2018-11-09 2019-03-15 袁琦 一种宠物知识图谱的半自动化构建方法
CN109508381A (zh) * 2018-09-29 2019-03-22 北京国双科技有限公司 知识图谱的处理方法及装置
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统
CN109635125A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种词汇图谱搭建方法及电子设备
CN109684483A (zh) * 2018-12-11 2019-04-26 平安科技(深圳)有限公司 知识图谱的构建方法、装置、计算机设备及存储介质
CN109977291A (zh) * 2019-03-20 2019-07-05 武汉市软迅科技有限公司 基于物理知识图谱的检索方法、装置、设备及存储介质
CN110096584A (zh) * 2019-05-14 2019-08-06 京东数字科技控股有限公司 一种应答方法和装置
CN110162786A (zh) * 2019-04-23 2019-08-23 百度在线网络技术(北京)有限公司 构建配置文件以及抽取结构化信息的方法、装置
CN110210025A (zh) * 2019-05-29 2019-09-06 广州伟宏智能科技有限公司 一种基于文本提取的转换方法
CN110457487A (zh) * 2019-07-10 2019-11-15 北京邮电大学 专利知识图谱的构建方法及装置
CN110489610A (zh) * 2019-08-14 2019-11-22 北京海致星图科技有限公司 一种知识图谱实时查询解决方案
CN110674312A (zh) * 2019-09-18 2020-01-10 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110795932A (zh) * 2019-09-30 2020-02-14 中国地质大学(武汉) 基于地质本体的地质报告文本信息提取方法
CN110851610A (zh) * 2018-07-25 2020-02-28 百度在线网络技术(北京)有限公司 知识图谱生成方法、装置、计算机设备以及存储介质
CN111090736A (zh) * 2018-10-24 2020-05-01 马上消费金融股份有限公司 问答模型的训练方法、问答方法、装置及计算机存储介质
CN111275277A (zh) * 2018-12-05 2020-06-12 北京国双科技有限公司 行政要素结构的监测方法及装置
CN111382277A (zh) * 2018-12-28 2020-07-07 上海汽车集团股份有限公司 面向汽车领域的知识图谱构建方法及装置
CN111488741A (zh) * 2020-04-14 2020-08-04 税友软件集团股份有限公司 一种税收知识数据语义标注方法及相关装置
CN111858962A (zh) * 2020-07-27 2020-10-30 腾讯科技(成都)有限公司 数据处理方法、装置及计算机可读存储介质
CN111897781A (zh) * 2020-08-03 2020-11-06 厦门渊亭信息科技有限公司 一种知识图谱数据抽取方法和系统
CN112163076A (zh) * 2020-09-27 2021-01-01 北京字节跳动网络技术有限公司 知识问题库构建方法、问答处理方法、装置、设备和介质
CN112528045A (zh) * 2020-12-23 2021-03-19 中译语通科技股份有限公司 基于开放百科图谱的领域图谱关系的判定方法及系统
CN112823332A (zh) * 2018-10-10 2021-05-18 N3有限责任公司 语义行业术语
CN113297395A (zh) * 2021-07-08 2021-08-24 中国人民解放军国防科技大学 时空多模态混合数据处理方法、关联方法与索引方法
CN113535968A (zh) * 2020-04-20 2021-10-22 北京沃东天骏信息技术有限公司 数据关键属性的提取方法和装置
CN113849575A (zh) * 2020-12-10 2021-12-28 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN116596412A (zh) * 2023-07-19 2023-08-15 中国电子科技集团公司第十五研究所 人才类型画像的实现方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104035917A (zh) * 2014-06-10 2014-09-10 复旦大学 一种基于语义空间映射的知识图谱管理方法和系统
CN104077415A (zh) * 2014-07-16 2014-10-01 百度在线网络技术(北京)有限公司 搜索方法及装置
CN104462501A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 基于结构化数据的知识图谱构建方法和装置
CN105183869A (zh) * 2015-09-16 2015-12-23 分众(中国)信息技术有限公司 楼宇知识图谱数据库及其构建方法
CN105468605A (zh) * 2014-08-25 2016-04-06 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104035917A (zh) * 2014-06-10 2014-09-10 复旦大学 一种基于语义空间映射的知识图谱管理方法和系统
CN104077415A (zh) * 2014-07-16 2014-10-01 百度在线网络技术(北京)有限公司 搜索方法及装置
CN105468605A (zh) * 2014-08-25 2016-04-06 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN104462501A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 基于结构化数据的知识图谱构建方法和装置
CN105183869A (zh) * 2015-09-16 2015-12-23 分众(中国)信息技术有限公司 楼宇知识图谱数据库及其构建方法

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649264A (zh) * 2016-11-21 2017-05-10 中国农业大学 一种基于篇章信息的中文水果品种信息抽取方法及装置
CN106874378A (zh) * 2017-01-05 2017-06-20 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN106874378B (zh) * 2017-01-05 2020-06-02 北京工商大学 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN108399180A (zh) * 2017-02-08 2018-08-14 腾讯科技(深圳)有限公司 一种知识图谱构建方法、装置及服务器
CN108399180B (zh) * 2017-02-08 2021-11-26 腾讯科技(深圳)有限公司 一种知识图谱构建方法、装置及服务器
CN106997399A (zh) * 2017-05-24 2017-08-01 海南大学 一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN107038263A (zh) * 2017-06-23 2017-08-11 海南大学 一种面向事务计算效率的基于数据图谱、信息图谱和知识图谱的搜索优化方法
CN107038263B (zh) * 2017-06-23 2019-09-24 海南大学 一种基于数据图谱、信息图谱和知识图谱的搜索优化方法
CN107832407A (zh) * 2017-11-03 2018-03-23 上海点融信息科技有限责任公司 用于生成知识图谱的信息处理方法、装置和可读存储介质
CN107862075A (zh) * 2017-11-29 2018-03-30 浪潮软件股份有限公司 一种基于医疗卫生大数据的知识图谱构建方法及装置
CN108197173A (zh) * 2017-12-20 2018-06-22 广州创显科教股份有限公司 一种基于知识图谱的大数据学情分析系统
CN108256063B (zh) * 2018-01-15 2020-11-03 中国人民解放军国防科技大学 一种面向网络安全的知识库构建方法
CN108256063A (zh) * 2018-01-15 2018-07-06 中国人民解放军国防科技大学 一种面向网络安全的知识库构建方法
CN108304519A (zh) * 2018-01-24 2018-07-20 西安交通大学 一种基于图数据库的知识森林构建方法
CN108304519B (zh) * 2018-01-24 2020-08-18 西安交通大学 一种基于图数据库的知识森林构建方法
CN108491443B (zh) * 2018-02-13 2021-05-25 上海好体信息科技有限公司 由计算机实施的与用户对话的方法和计算机系统
CN108491443A (zh) * 2018-02-13 2018-09-04 上海好体信息科技有限公司 由计算机实施的与用户对话的方法和计算机系统
CN110851610B (zh) * 2018-07-25 2022-09-27 百度在线网络技术(北京)有限公司 知识图谱生成方法、装置、计算机设备以及存储介质
CN110851610A (zh) * 2018-07-25 2020-02-28 百度在线网络技术(北京)有限公司 知识图谱生成方法、装置、计算机设备以及存储介质
CN109086391B (zh) * 2018-07-27 2022-07-01 北京光年无限科技有限公司 一种构建知识图谱的方法及系统
CN109086391A (zh) * 2018-07-27 2018-12-25 北京光年无限科技有限公司 一种构建知识图谱的方法及系统
CN109508381A (zh) * 2018-09-29 2019-03-22 北京国双科技有限公司 知识图谱的处理方法及装置
CN112823332A (zh) * 2018-10-10 2021-05-18 N3有限责任公司 语义行业术语
CN111090736A (zh) * 2018-10-24 2020-05-01 马上消费金融股份有限公司 问答模型的训练方法、问答方法、装置及计算机存储介质
CN109471949A (zh) * 2018-11-09 2019-03-15 袁琦 一种宠物知识图谱的半自动化构建方法
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统
CN111275277A (zh) * 2018-12-05 2020-06-12 北京国双科技有限公司 行政要素结构的监测方法及装置
CN109684483A (zh) * 2018-12-11 2019-04-26 平安科技(深圳)有限公司 知识图谱的构建方法、装置、计算机设备及存储介质
CN109635125B (zh) * 2018-12-20 2021-01-26 广东小天才科技有限公司 一种词汇图谱搭建方法及电子设备
CN109635125A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种词汇图谱搭建方法及电子设备
CN111382277B (zh) * 2018-12-28 2023-08-01 上海汽车集团股份有限公司 面向汽车领域的知识图谱构建方法及装置
CN111382277A (zh) * 2018-12-28 2020-07-07 上海汽车集团股份有限公司 面向汽车领域的知识图谱构建方法及装置
CN109977291A (zh) * 2019-03-20 2019-07-05 武汉市软迅科技有限公司 基于物理知识图谱的检索方法、装置、设备及存储介质
CN109977291B (zh) * 2019-03-20 2021-03-02 武汉市软迅科技有限公司 基于物理知识图谱的检索方法、装置、设备及存储介质
CN110162786B (zh) * 2019-04-23 2024-02-27 百度在线网络技术(北京)有限公司 构建配置文件以及抽取结构化信息的方法、装置
CN110162786A (zh) * 2019-04-23 2019-08-23 百度在线网络技术(北京)有限公司 构建配置文件以及抽取结构化信息的方法、装置
CN110096584A (zh) * 2019-05-14 2019-08-06 京东数字科技控股有限公司 一种应答方法和装置
CN110096584B (zh) * 2019-05-14 2021-10-15 京东数字科技控股有限公司 一种应答方法和装置
CN110210025A (zh) * 2019-05-29 2019-09-06 广州伟宏智能科技有限公司 一种基于文本提取的转换方法
CN110457487A (zh) * 2019-07-10 2019-11-15 北京邮电大学 专利知识图谱的构建方法及装置
CN110457487B (zh) * 2019-07-10 2022-03-29 北京邮电大学 专利知识图谱的构建方法及装置
CN110489610A (zh) * 2019-08-14 2019-11-22 北京海致星图科技有限公司 一种知识图谱实时查询解决方案
CN110674312A (zh) * 2019-09-18 2020-01-10 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110674312B (zh) * 2019-09-18 2022-05-17 泰康保险集团股份有限公司 构建知识图谱方法、装置、介质及电子设备
CN110795932A (zh) * 2019-09-30 2020-02-14 中国地质大学(武汉) 基于地质本体的地质报告文本信息提取方法
CN111488741A (zh) * 2020-04-14 2020-08-04 税友软件集团股份有限公司 一种税收知识数据语义标注方法及相关装置
CN113535968A (zh) * 2020-04-20 2021-10-22 北京沃东天骏信息技术有限公司 数据关键属性的提取方法和装置
CN111858962A (zh) * 2020-07-27 2020-10-30 腾讯科技(成都)有限公司 数据处理方法、装置及计算机可读存储介质
CN111897781A (zh) * 2020-08-03 2020-11-06 厦门渊亭信息科技有限公司 一种知识图谱数据抽取方法和系统
CN111897781B (zh) * 2020-08-03 2023-12-26 厦门渊亭信息科技有限公司 一种知识图谱数据抽取方法和系统
CN112163076A (zh) * 2020-09-27 2021-01-01 北京字节跳动网络技术有限公司 知识问题库构建方法、问答处理方法、装置、设备和介质
CN113849575A (zh) * 2020-12-10 2021-12-28 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN113849575B (zh) * 2020-12-10 2022-08-09 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN112528045A (zh) * 2020-12-23 2021-03-19 中译语通科技股份有限公司 基于开放百科图谱的领域图谱关系的判定方法及系统
CN112528045B (zh) * 2020-12-23 2024-04-02 中译语通科技股份有限公司 基于开放百科图谱的领域图谱关系的判定方法及系统
CN113297395A (zh) * 2021-07-08 2021-08-24 中国人民解放军国防科技大学 时空多模态混合数据处理方法、关联方法与索引方法
CN116596412A (zh) * 2023-07-19 2023-08-15 中国电子科技集团公司第十五研究所 人才类型画像的实现方法及系统

Similar Documents

Publication Publication Date Title
CN105956052A (zh) 一种基于垂直领域的知识图谱的构建方法
CN102236722B (zh) 一种基于三元组的用户评论摘要的生成方法与系统
CN103365924B (zh) 一种互联网信息搜索的方法、装置和终端
CN102955848B (zh) 一种基于语义的三维模型检索系统和方法
CN108681574B (zh) 一种基于文本摘要的非事实类问答答案选择方法及系统
CN110147436A (zh) 一种基于教育知识图谱与文本的混合自动问答方法
Furlan et al. Semantic similarity of short texts in languages with a deficient natural language processing support
CN109960786A (zh) 基于融合策略的中文词语相似度计算方法
CN104516949B (zh) 网页数据处理方法和装置、查询处理方法及问答系统
CN107506346A (zh) 一种基于机器学习的中文阅读难度分级方法及系统
CN106503192A (zh) 基于人工智能的命名实体识别方法及装置
CN104408078A (zh) 一种基于关键词的中英双语平行语料库构建方法
CN105512687A (zh) 训练情感分类模型和文本情感极性分析的方法及系统
Zheng et al. Template-independent news extraction based on visual consistency
CN103886034A (zh) 一种建立索引及匹配用户的查询输入信息的方法和设备
CN103455562A (zh) 一种文本倾向性分析方法及基于该方法的商品评论倾向判别器
CN103049435A (zh) 文本细粒度情感分析方法及装置
CN104991891A (zh) 一种短文本特征提取方法
CN102609427A (zh) 舆情垂直搜索分析系统及方法
CN104978332B (zh) 用户生成内容标签数据生成方法、装置及相关方法和装置
CN104182412A (zh) 一种网页爬取方法及系统
CN104679738A (zh) 互联网热词挖掘方法及装置
CN103810251A (zh) 一种文本提取方法及装置
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
Gordon et al. Learning from the web: Extracting general world knowledge from noisy text

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160921