CN109597925A - 一种基于本体的供应商数据分析方法及分析系统 - Google Patents

一种基于本体的供应商数据分析方法及分析系统 Download PDF

Info

Publication number
CN109597925A
CN109597925A CN201811252063.0A CN201811252063A CN109597925A CN 109597925 A CN109597925 A CN 109597925A CN 201811252063 A CN201811252063 A CN 201811252063A CN 109597925 A CN109597925 A CN 109597925A
Authority
CN
China
Prior art keywords
supplier
ontology
data
local
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811252063.0A
Other languages
English (en)
Inventor
王坚
凌卫青
陈诗芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201811252063.0A priority Critical patent/CN109597925A/zh
Publication of CN109597925A publication Critical patent/CN109597925A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于本体的供应商数据分析方法及分析系统,所述分析方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:1)爬取供应商相关Web数据;2)基于所述供应商相关Web数据构建供应商局部本体;3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。与现有技术相比,本发明将互联网中供应商数据解析为文本数据和结构化数据,并将二者分别构建供应商局部本体,通过本体映射技术,完成领域本体与局部本体以及局部本体与数据库的映射,实现语义查询,确保查询数据的准确性和高效性。

Description

一种基于本体的供应商数据分析方法及分析系统
技术领域
本发明涉及工业数据集成领域,尤其是涉及一种基于本体的供应商数据分析方法及分析系统。
背景技术
随着信息技术的发展,越来越多的数据采用电子化形式存储,以提高数据存储的便捷高效性,同时可以根据这些数据进行后期的分析。
而工业大数据分析的数据量越大,从中分析得到的有效的、有价值的判断就越多。由于工业信息资源具有异质、异构的特征,缺乏统一的数据标准规范,工业数据集成难度较大,因此给数据分析带来了一系列问题。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于本体的供应商数据分析方法。
本发明的目的可以通过以下技术方案来实现:
一种基于本体的供应商数据分析方法,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:
1)爬取供应商相关Web数据;
2)基于所述供应商相关Web数据构建供应商局部本体;
3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。
进一步地,所述供应商局部本体描述有供应商概念及其关系。
进一步地,所述步骤2)中,构建供应商局部本体具体为:
将所述供应商相关Web数据解析为文本数据和结构化数据,分别基于所述文本数据和结构化数据构建对应的供应商局部本体。
进一步地,基于所述文本数据构建供应商局部本体的过程包括:
A1)使用自然语言处理技术对所述文本数据进行处理;
A2)从步骤A1)获得的数据中抽取概念及概念关系;
A3)根据步骤A2),利用Jena进行供应商局部本体构建。
进一步地,基于所述结构化数据构建供应商局部本体的过程包括:
利用D2RQ映射引擎将结构化数据转换为RDF格式数据,构建供应商局部本体。
进一步地,所述供应商局部本体与供应商全局本体的映射规则包括:
如果2个类有相同的父类和子类,那么2个类可能相同;
如果2个类有相同的实例或相同的属性,那么2个类可能相同;
如果2个属性存在相同的定义域和值域,那么这2个属性可能相同;
如果2个属性的父属性或子属性相同,那么这2个属性可能相同。
进一步地,所述供应商局部本体与数据库的映射规则包括:
局部本体中的概念对应到关系数据库中表名;
局部本体中的属性与关系数据库中的属性列相对性;
将局部本体中的关系对应到关系数据库中外键。
本发明还提供一种基于本体的供应商数据分析系统,包括:
请求获取模块,用于获取用户分析请求;
算法调用模块,用于根据所述用户分析请求调用相应的供应商数据分析算法;
查询模块,用于根据所述供应商数据分析算法,利用本体语义查询方法在语义层中查询获得所需的供应商数据;
数据调用模块,用于根据所述查询模块的查询结果在存储层进行所需供应商数据调用;
分析模块,用于根据所述供应商数据分析算法和供应商数据获得分析结果并输出;
所述语义层具有供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系。
与现有技术相比,本发明将本体引入到供应商数据分析中,确保了供应商数据的语义统一,保障了对多源异构的供应商数据分析准确性,具有以如下有益效果:
1)本发明将供应商Web数据解析为文本数据以及结构化数据,并分别构建供应商局部本体,通过建立已有的供应商领域本体与供应商局部本体以及供应商局部本体与数据库的映射规则作为语义层,支持供应商数据的语义查询,同时能够为供应商数据分析提供数据。
2)本发明通过本体来实现语义的查询,解决了工业大数据多源异构等导致的信息孤岛问题。本体可实现形式化地描述概念,从而作为语义的共享模型,为语义集成提供重要的技术支持。
3)本发明供应商数据解析为文本数据以及结构化数据,按不同方式构建相应的供应商局部本体,全面可靠。
4)本发明构建语义层,提供了数据分析的语义查询转换功能,且语义层的构建,考虑特定映射规则,方便可靠地实现供应商局部本体与已有领域本体以及数据库的映射工作。
5)本发明在方法层面与技术层面为供应商数据分析提供解决方案,为供应商选择提供意见。
附图说明
图1为爬取的供应商文本类型数据实例;
图2为爬取的供应商结构化数据实例;
图3为基于文本构建供应商本体的流程示意图;
图4为基于结构化数据构建供应商本体的流程示意图;
图5为查询过程示意图;
图6为基于本体的供应商数据分析流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图6所示,本实施例提供一种基于本体的供应商数据分析方法,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果。其中,语义层的构建具体包括:
步骤1:爬取供应商相关Web数据。
步骤2:基于供应商相关Web数据构建供应商局部本体,具体为:
将供应商相关Web数据解析为文本数据和结构化数据,分别基于文本数据和结构化数据构建对应的供应商局部本体。如图1所示,Web数据中关于供应商的相关简介内容为可以存储为文本数据。结构化数据如图2所示,有一定的表格格式可以转化为结构化数据进行存储。
供应商局部本体描述有供应商概念及其关系。供应商概念涵盖了供应商信息、产品信息、法人代表等。
如图3所示,基于文本数据构建供应商局部本体的过程包括:
A1)使用自然语言处理技术对文本数据进行处理,包括分词、词性标注以及停用词过滤,为接下来的本体概念抽取以及概念关系抽取做准备。
A2)从步骤A1)获得的数据中抽取概念及概念关系。
概念抽取:采用基于规则和统计的方法抽取概念,首先利用词法及句法建立规则,实现对多词短语的抽取,然后使用改进的TF-IDF算法来对概念进行过滤。
关系抽取:概念关系包括分类关系和非分类关系,采用基于规则的方法抽取分类关系,同时采用关联规则及依存句法分析来进行非分类关系抽取。
A3)根据步骤A2),利用Jena进行供应商局部本体构建,基于Protégé可视化本体。
如图4所示,基于结构化数据构建供应商局部本体的过程包括:
利用D2RQ映射引擎将结构化数据转换为RDF格式数据,构建供应商局部本体。
步骤3:分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。本体映射是利用映射规则,完成供应商局部本体与已有领域本体以及数据库的映射工作。
供应商局部本体与供应商全局本体的映射规则包括:
如果2个类有相同的父类和子类,那么2个类可能相同;
如果2个类有相同的实例或相同的属性,那么2个类可能相同;
如果2个属性存在相同的定义域和值域,那么这2个属性可能相同;
如果2个属性的父属性或子属性相同,那么这2个属性可能相同。
供应商局部本体与数据库的映射规则包括:
局部本体中的概念对应到关系数据库中表名;
局部本体中的属性与关系数据库中的属性列相对性;
将局部本体中的关系对应到关系数据库中外键。
基于上述供应商数据分析方法,本实施例可提供一种供应商数据分析系统,包括:
请求获取模块,用于获取用户分析请求;
算法调用模块,用于根据用户分析请求调用相应的供应商数据分析算法;
查询模块,用于根据供应商数据分析算法,利用本体语义查询方法在语义层中查询获得所需的供应商数据;
数据调用模块,用于根据查询模块的查询结果在存储层进行所需供应商数据调用;
分析模块,用于根据供应商数据分析算法和供应商数据获得分析结果并输出,反馈给用户。
查询模块的查询过程如图5所示,具体为:
B1)根据算法提交查询请求,查询生成器将查询请求包装成全局的查询语句,并对Sparql语句进行必要的参数转换。
B2)将封装好的Sparql语句提交到查询分解器,查询分解器将根据局部本体和领域本体的映射关系,以及局部本体和数据源的映射关系,将Sparql语句分解为对应不同数据源的子查询语句,并将接收的子查询相关参数改写为局部数据库中参数,将子查询语句转化为相应数据库的查询语言。
B3)通过修改后的子查询语句对不同的底层数据源进行访问。
B4)数据库将返回访问得到的结果到整合查询模块中。
B5)查询模块将结果按照要求合并处理后返回。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (8)

1.一种基于本体的供应商数据分析方法,其特征在于,该方法基于用户分析请求,利用本体语义查询方法在语义层中获得供应商数据,进而获得分析结果,其中,所述语义层的构建具体包括以下步骤:
1)爬取供应商相关Web数据;
2)基于所述供应商相关Web数据构建供应商局部本体;
3)分别建立供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系,形成语义层。
2.根据权利要求1所述的基于本体的供应商数据分析方法,其特征在于,所述供应商局部本体描述有供应商概念及其关系。
3.根据权利要求1所述的基于本体的供应商数据分析方法,其特征在于,所述步骤2)中,构建供应商局部本体具体为:
将所述供应商相关Web数据解析为文本数据和结构化数据,分别基于所述文本数据和结构化数据构建对应的供应商局部本体。
4.根据权利要求3所述的基于本体的供应商数据分析方法,其特征在于,基于所述文本数据构建供应商局部本体的过程包括:
A1)使用自然语言处理技术对所述文本数据进行处理;
A2)从步骤A1)获得的数据中抽取概念及概念关系;
A3)根据步骤A2),利用Jena进行供应商局部本体构建。
5.根据权利要求3所述的基于本体的供应商数据分析方法,其特征在于,基于所述结构化数据构建供应商局部本体的过程包括:
利用D2RQ映射引擎将结构化数据转换为RDF格式数据,构建供应商局部本体。
6.根据权利要求1所述的基于本体的供应商数据分析方法,其特征在于,所述供应商局部本体与供应商全局本体的映射规则包括:
如果2个类有相同的父类和子类,那么2个类可能相同;
如果2个类有相同的实例或相同的属性,那么2个类可能相同;
如果2个属性存在相同的定义域和值域,那么这2个属性可能相同;
如果2个属性的父属性或子属性相同,那么这2个属性可能相同。
7.根据权利要求1所述的基于本体的供应商数据分析方法,其特征在于,所述供应商局部本体与数据库的映射规则包括:
局部本体中的概念对应到关系数据库中表名;
局部本体中的属性与关系数据库中的属性列相对性;
将局部本体中的关系对应到关系数据库中外键。
8.一种基于本体的供应商数据分析系统,其特征在于,包括:
请求获取模块,用于获取用户分析请求;
算法调用模块,用于根据所述用户分析请求调用相应的供应商数据分析算法;
查询模块,用于根据所述供应商数据分析算法,利用本体语义查询方法在语义层中查询获得所需的供应商数据;
数据调用模块,用于根据所述查询模块的查询结果在存储层进行所需供应商数据调用;
分析模块,用于根据所述供应商数据分析算法和供应商数据获得分析结果并输出;
所述语义层具有供应商局部本体与供应商全局本体的映射关系以及供应商局部本体与数据库的映射关系。
CN201811252063.0A 2018-10-25 2018-10-25 一种基于本体的供应商数据分析方法及分析系统 Pending CN109597925A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811252063.0A CN109597925A (zh) 2018-10-25 2018-10-25 一种基于本体的供应商数据分析方法及分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811252063.0A CN109597925A (zh) 2018-10-25 2018-10-25 一种基于本体的供应商数据分析方法及分析系统

Publications (1)

Publication Number Publication Date
CN109597925A true CN109597925A (zh) 2019-04-09

Family

ID=65958656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811252063.0A Pending CN109597925A (zh) 2018-10-25 2018-10-25 一种基于本体的供应商数据分析方法及分析系统

Country Status (1)

Country Link
CN (1) CN109597925A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175197A (zh) * 2019-05-23 2019-08-27 长沙学院 一种基于语义物联网的本体构建方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385635A (zh) * 2011-12-14 2012-03-21 湖南科技大学 一种基于本体模式的异构数据集成方法
CN102542027A (zh) * 2011-12-22 2012-07-04 北京航空航天大学深圳研究院 一种基于关系模式学习本体的数据集成系统的构建方法
CN102682122A (zh) * 2012-05-15 2012-09-19 北京科技大学 基于本体构建材料科学领域语义数据模型的方法
CN103942234A (zh) * 2013-01-21 2014-07-23 中国电信股份有限公司 对多个异构数据库操作的方法、中间件装置及系统
CN104182454A (zh) * 2014-07-04 2014-12-03 重庆科技学院 基于领域本体构建的多源异构数据语义集成的模型及方法
CN106372145A (zh) * 2016-08-29 2017-02-01 国家超级计算深圳中心(深圳云计算中心) 一种大数据环境下基于本体语义的查询方法及系统
CN107978341A (zh) * 2017-12-22 2018-05-01 南京昂特医信数据技术有限公司 一种基于语境的医学语义框架下的异构数据适配方法及其系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385635A (zh) * 2011-12-14 2012-03-21 湖南科技大学 一种基于本体模式的异构数据集成方法
CN102542027A (zh) * 2011-12-22 2012-07-04 北京航空航天大学深圳研究院 一种基于关系模式学习本体的数据集成系统的构建方法
CN102682122A (zh) * 2012-05-15 2012-09-19 北京科技大学 基于本体构建材料科学领域语义数据模型的方法
CN103942234A (zh) * 2013-01-21 2014-07-23 中国电信股份有限公司 对多个异构数据库操作的方法、中间件装置及系统
CN104182454A (zh) * 2014-07-04 2014-12-03 重庆科技学院 基于领域本体构建的多源异构数据语义集成的模型及方法
CN106372145A (zh) * 2016-08-29 2017-02-01 国家超级计算深圳中心(深圳云计算中心) 一种大数据环境下基于本体语义的查询方法及系统
CN107978341A (zh) * 2017-12-22 2018-05-01 南京昂特医信数据技术有限公司 一种基于语境的医学语义框架下的异构数据适配方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张德海等: "基于本体的电力系统异构数据查询机制", 《云南民族大学学报:自然科学版》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175197A (zh) * 2019-05-23 2019-08-27 长沙学院 一种基于语义物联网的本体构建方法和系统
CN110175197B (zh) * 2019-05-23 2021-03-23 长沙学院 一种基于语义物联网的本体构建方法和系统

Similar Documents

Publication Publication Date Title
CN109582691B (zh) 用于控制数据查询的方法和装置
Hwang Incompletely and imprecisely speaking: using dynamic ontologies for representing and retrieving information.
CN109657072B (zh) 一种应用于政府辅助决策的智能搜索web系统及方法
Bedini et al. Deriving ontologies from XML schema
CN111198898B (zh) 大数据查询方法及大数据查询装置
Lin et al. OWL Ontology Extraction from Relational Databases via Database Reverse Engineering.
CN114528312A (zh) 一种结构化查询语言语句的生成方法和装置
CN109597925A (zh) 一种基于本体的供应商数据分析方法及分析系统
Embley et al. Conceptual modeling foundations for a web of knowledge
Bozic et al. KnowText: Auto-generated Knowledge Graphs for custom domain applications
Avogadro et al. LamAPI: a comprehensive tool for string-based entity retrieval with type-base filters.
Corby et al. Ontology-based approximate query processing for searching the semantic web with corese
Kienast et al. Semantic data integration on biomedical data using semantic web technologies
Iqbal et al. A Negation Query Engine for Complex Query Transformations
Hakeem Layered software patterns for data analysis in big data environment
Raimbault Overviewing the RDF (S) semantic web
English An extensible schema for building large weakly-labeled semantic corpora
Saraswathi et al. Design of dynamically updated automatic ontology for mobile phone information retrieval system
Oruç A semantic Question Answering through Heterogeneous data source in the domain of smart factory
Saranya et al. An ontological approach for originating data services with hazy semantics
Lee et al. GOMS: Large‐scale ontology management system using graph databases
Novello et al. Empowering Natural Language Interfaces to Databases with Aggregations
Gupta et al. An analysis of SPARQL usage for information retrieval in heterogeneous domains through various tools
Gao et al. Ontology-based enterprise information retrieval model
Kanakam et al. HPL Algorithm For Semantic Information Retrieval with RDF And SPARQL

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409