CN106897403A - 面向知识图谱构建的细粒度中文属性对齐方法 - Google Patents
面向知识图谱构建的细粒度中文属性对齐方法 Download PDFInfo
- Publication number
- CN106897403A CN106897403A CN201710077245.8A CN201710077245A CN106897403A CN 106897403 A CN106897403 A CN 106897403A CN 201710077245 A CN201710077245 A CN 201710077245A CN 106897403 A CN106897403 A CN 106897403A
- Authority
- CN
- China
- Prior art keywords
- attribute
- similarity
- property value
- value
- data type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 8
- 238000011524 similarity measure Methods 0.000 claims abstract description 7
- 239000000203 mixture Substances 0.000 claims description 2
- 238000000034 method Methods 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000405414 Rehmannia Species 0.000 description 1
- 241001591024 Samea Species 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710077245.8A CN106897403B (zh) | 2017-02-14 | 2017-02-14 | 面向知识图谱构建的细粒度中文属性对齐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710077245.8A CN106897403B (zh) | 2017-02-14 | 2017-02-14 | 面向知识图谱构建的细粒度中文属性对齐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106897403A true CN106897403A (zh) | 2017-06-27 |
CN106897403B CN106897403B (zh) | 2019-03-26 |
Family
ID=59198739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710077245.8A Active CN106897403B (zh) | 2017-02-14 | 2017-02-14 | 面向知识图谱构建的细粒度中文属性对齐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106897403B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107748799A (zh) * | 2017-11-08 | 2018-03-02 | 四川长虹电器股份有限公司 | 一种多数据源影视数据实体对齐的方法 |
CN108376160A (zh) * | 2018-02-12 | 2018-08-07 | 北京大学 | 一种中文知识图谱构建方法和系统 |
CN108710625A (zh) * | 2018-03-16 | 2018-10-26 | 电子科技大学成都研究院 | 一种专题知识自动挖掘系统及方法 |
CN109002470A (zh) * | 2018-06-12 | 2018-12-14 | 东方银谷(北京)投资管理有限公司 | 知识图谱构建方法及装置、客户端 |
CN109255002A (zh) * | 2018-09-11 | 2019-01-22 | 浙江大学 | 一种利用关系路径挖掘解决知识图谱对齐任务的方法 |
CN109614497A (zh) * | 2018-11-14 | 2019-04-12 | 金色熊猫有限公司 | 基于知识图谱的对齐方法、装置及介质 |
CN109885697A (zh) * | 2019-02-01 | 2019-06-14 | 北京百度网讯科技有限公司 | 构建数据模型的方法、装置、设备和介质 |
CN109947919A (zh) * | 2019-03-12 | 2019-06-28 | 北京字节跳动网络技术有限公司 | 用于生成文本匹配模型的方法和装置 |
CN110765276A (zh) * | 2019-10-21 | 2020-02-07 | 北京明略软件系统有限公司 | 知识图谱中的实体对齐方法及装置 |
CN110826316A (zh) * | 2019-11-06 | 2020-02-21 | 北京交通大学 | 一种应用于裁判文书中敏感信息的识别方法 |
CN111814066A (zh) * | 2020-07-01 | 2020-10-23 | 重庆邮电大学 | 基于启发式算法的动态社交用户对齐方法及系统 |
CN114254131A (zh) * | 2022-02-28 | 2022-03-29 | 南京众智维信息科技有限公司 | 一种网络安全应急响应知识图谱实体对齐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202720057U (zh) * | 2012-05-25 | 2013-02-06 | 嘉兴优太太阳能有限公司 | 光伏电池焊接测温系统 |
CN106156082A (zh) * | 2015-03-31 | 2016-11-23 | 华为技术有限公司 | 一种本体对齐方法及装置 |
CN106202543A (zh) * | 2016-07-27 | 2016-12-07 | 苏州家佳宝妇幼医疗科技有限公司 | 基于机器学习的本体匹配方法和系统 |
CN106202041A (zh) * | 2016-07-01 | 2016-12-07 | 北京奇虎科技有限公司 | 一种解决知识图谱中的实体对齐问题的方法和装置 |
-
2017
- 2017-02-14 CN CN201710077245.8A patent/CN106897403B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN202720057U (zh) * | 2012-05-25 | 2013-02-06 | 嘉兴优太太阳能有限公司 | 光伏电池焊接测温系统 |
CN106156082A (zh) * | 2015-03-31 | 2016-11-23 | 华为技术有限公司 | 一种本体对齐方法及装置 |
CN106202041A (zh) * | 2016-07-01 | 2016-12-07 | 北京奇虎科技有限公司 | 一种解决知识图谱中的实体对齐问题的方法和装置 |
CN106202543A (zh) * | 2016-07-27 | 2016-12-07 | 苏州家佳宝妇幼医疗科技有限公司 | 基于机器学习的本体匹配方法和系统 |
Non-Patent Citations (3)
Title |
---|
GIJS VAN ROOIJ ET AL: ""A Data Type-Driven Property Alignment Framework for Product Duplicate Detection on the Web"", 《《WEB INFORMATION SYSTEMS ENGINEERING-WISE 2016》》 * |
YU LIU ET AL: ""Property Alignment of Linked Data Based on Similarity between Functions"", 《INTERNATIONAL JOURNAL OF DATABASE THEORY AND APPLICATION》 * |
黄峻福 等: ""中文异构百科知识库实体对齐"", 《计算机应用》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107748799A (zh) * | 2017-11-08 | 2018-03-02 | 四川长虹电器股份有限公司 | 一种多数据源影视数据实体对齐的方法 |
CN108376160A (zh) * | 2018-02-12 | 2018-08-07 | 北京大学 | 一种中文知识图谱构建方法和系统 |
CN108376160B (zh) * | 2018-02-12 | 2022-02-18 | 北京大学 | 一种中文知识图谱构建方法和系统 |
CN108710625A (zh) * | 2018-03-16 | 2018-10-26 | 电子科技大学成都研究院 | 一种专题知识自动挖掘系统及方法 |
CN109002470A (zh) * | 2018-06-12 | 2018-12-14 | 东方银谷(北京)投资管理有限公司 | 知识图谱构建方法及装置、客户端 |
CN109255002B (zh) * | 2018-09-11 | 2021-08-27 | 浙江大学 | 一种利用关系路径挖掘解决知识图谱对齐任务的方法 |
CN109255002A (zh) * | 2018-09-11 | 2019-01-22 | 浙江大学 | 一种利用关系路径挖掘解决知识图谱对齐任务的方法 |
CN109614497A (zh) * | 2018-11-14 | 2019-04-12 | 金色熊猫有限公司 | 基于知识图谱的对齐方法、装置及介质 |
CN109885697A (zh) * | 2019-02-01 | 2019-06-14 | 北京百度网讯科技有限公司 | 构建数据模型的方法、装置、设备和介质 |
CN109885697B (zh) * | 2019-02-01 | 2022-02-18 | 北京百度网讯科技有限公司 | 构建数据模型的方法、装置、设备和介质 |
CN109947919A (zh) * | 2019-03-12 | 2019-06-28 | 北京字节跳动网络技术有限公司 | 用于生成文本匹配模型的方法和装置 |
CN109947919B (zh) * | 2019-03-12 | 2020-05-15 | 北京字节跳动网络技术有限公司 | 用于生成文本匹配模型的方法和装置 |
CN110765276A (zh) * | 2019-10-21 | 2020-02-07 | 北京明略软件系统有限公司 | 知识图谱中的实体对齐方法及装置 |
CN110826316A (zh) * | 2019-11-06 | 2020-02-21 | 北京交通大学 | 一种应用于裁判文书中敏感信息的识别方法 |
CN111814066A (zh) * | 2020-07-01 | 2020-10-23 | 重庆邮电大学 | 基于启发式算法的动态社交用户对齐方法及系统 |
CN111814066B (zh) * | 2020-07-01 | 2022-06-03 | 重庆邮电大学 | 基于启发式算法的动态社交用户对齐方法及系统 |
CN114254131A (zh) * | 2022-02-28 | 2022-03-29 | 南京众智维信息科技有限公司 | 一种网络安全应急响应知识图谱实体对齐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106897403B (zh) | 2019-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106897403A (zh) | 面向知识图谱构建的细粒度中文属性对齐方法 | |
Zhang et al. | Exploring syntactic structured features over parse trees for relation extraction using kernel methods | |
Wadud et al. | How can we manage offensive text in social media-a text classification approach using LSTM-BOOST | |
US20190347571A1 (en) | Classifier training | |
Tungthamthiti et al. | Recognition of sarcasms in tweets based on concept level sentiment analysis and supervised learning approaches | |
US20180060306A1 (en) | Extracting facts from natural language texts | |
US8577938B2 (en) | Data mapping acceleration | |
CN103034626A (zh) | 情感分析系统及方法 | |
CN106202042A (zh) | 一种基于图的关键词抽取方法 | |
CN106909655A (zh) | 基于产生式别名挖掘的知识图谱实体发现和链接方法 | |
CN107133212B (zh) | 一种基于集成学习和词句综合信息的文本蕴涵识别方法 | |
CN107122349A (zh) | 一种基于word2vec‑LDA模型的文本主题词提取方法 | |
CN103473380B (zh) | 一种计算机文本情感分类方法 | |
Pariyani et al. | Hate speech detection in twitter using natural language processing | |
CN113849597B (zh) | 基于命名实体识别的违法广告词检测方法 | |
Dos Santos et al. | Multi-domain aspect extraction using bidirectional encoder representations from transformers | |
CN106446147A (zh) | 一种基于结构化特征的情感分析方法 | |
CN107145514A (zh) | 基于决策树和svm混合模型的中文句型分类方法 | |
CN107463703A (zh) | 基于信息增益的英文社交媒体账号分类方法 | |
Bilgin et al. | Sentiment analysis with term weighting and word vectors | |
CN104794209B (zh) | 基于马尔科夫逻辑网络的中文微博情绪分类方法及系统 | |
Chen et al. | Label distribution‐based noise correction for multiclass crowdsourcing | |
Tungthamthiti et al. | Recognition of sarcasm in microblogging based on sentiment analysis and coherence identification | |
Zhining et al. | Combining statistics-based and cnn-based information for sentence classification | |
Melamud et al. | Information-theory interpretation of the skip-gram negative-sampling objective function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20201230 Address after: 250101 No.9, Kuangyuan Road, Gongye North Road, Wangsheren street, Licheng District, Jinan City, Shandong Province Patentee after: Jigang Defense Technology Co.,Ltd. Address before: 100190 No. 19 West North Fourth Ring Road, Haidian District, Beijing Patentee before: Aerospace Information Research Institute,Chinese Academy of Sciences Effective date of registration: 20201230 Address after: 100190 No. 19 West North Fourth Ring Road, Haidian District, Beijing Patentee after: Aerospace Information Research Institute,Chinese Academy of Sciences Address before: 100190 No.19, Beisihuan West Road, Haidian District, Beijing Patentee before: Institute of Electronics, Chinese Academy of Sciences |
|
TR01 | Transfer of patent right |