CN102073701A - 一种基于语义定义的多数据源的数据查询方法 - Google Patents

一种基于语义定义的多数据源的数据查询方法 Download PDF

Info

Publication number
CN102073701A
CN102073701A CN2010106135945A CN201010613594A CN102073701A CN 102073701 A CN102073701 A CN 102073701A CN 2010106135945 A CN2010106135945 A CN 2010106135945A CN 201010613594 A CN201010613594 A CN 201010613594A CN 102073701 A CN102073701 A CN 102073701A
Authority
CN
China
Prior art keywords
data
query
definition
formula
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010106135945A
Other languages
English (en)
Inventor
吴晓波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Group Shandong General Software Co Ltd
Original Assignee
Inspur Group Shandong General Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Shandong General Software Co Ltd filed Critical Inspur Group Shandong General Software Co Ltd
Priority to CN2010106135945A priority Critical patent/CN102073701A/zh
Publication of CN102073701A publication Critical patent/CN102073701A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于语义定义的多数据源的数据查询方法,属于数据分析查询领域。该方法通过分析数据查询目标,抽取不同数据项间的相关性标识作为编号属性,并以此为依据对不同数据项定义语义对象,然后通过使用这些语义对象定义查询公式,再通过公式计算组件对查询公式进行解析形成相应的SQL查询语句,取得结果后插入到查询结果中间表,并通过数据库技术依据查询公式设定的编号属性对各数据项进行对应整理形成最终结果保存到查询结果表,最终展示给查询使用者。与现有技术相比,本发明的数据查询方法方便的实现了跨数据库数据的查询,同时,还实现了一种数据源数据整合的方法。

Description

一种基于语义定义的多数据源的数据查询方法
技术领域
本发明涉及一种数据分析查询方法,具体地说是一种基于语义定义的多数据源的数据查询方法。
背景技术
近年来,随着网络及信息技术的迅猛发展和企业信息化进程的逐步深入,企业信息化建设的重心正发生着本质的变化,从建设初期的网络建设、信息发布为主,转向以整合内外部信息资源为主体、以提高管理控制能力、经营决策水平,提高企业在市场的竞争力和可持续发展能力为目标的应用阶段。
目前企业信息化建设必须以信息资源管理为支撑,建立以企业数据模型为核心的数据集成和应用集成平台,统一数据标准,整合各业务部门及分子公司的信息资源,将原来孤立于多个异构数据库系统的信息资源整合起来,为企业信息化应用提供一个完整统一的数据视图,从而实现信息资源的透明访问和充分利用,才能实现为企业经营决策系统提供实时、准确、完整、真实的数据信息支持。
为上述实现企业信息资源整合的目标:首先,需要确定不同信息资源的内在联系,理清整合的路线;在确定信息资源内在联系的的基础上,抽取出统一数据标识;最后以统一数据标识为标准,进行数据的查询、整理和保存,形成决策有用的信息。
发明内容
本发明的技术任务是针对上述现有技术的不足,提供一种基于语义定义的多数据源的数据查询方法,具体地说,是一种关于某业务线索的多个相关数据项进行统计分析时,各数据项在不同数据库中时的数据查询方法。
通过语义对象的定义和查询公式的处理,使用公式计算组件将多数据源的相关业务数据获取到统一的数据库进行数据归集整合并返回查询结果。
本发明的技术任务是按以下方式实现的:基于语义定义的多数据源的数据查询方法,其特点是,通过分析数据查询目标,抽取不同数据项间的相关性标识作为编号属性,并以此为依据对不同数据项定义语义对象,然后通过使用这些语义对象定义查询公式,再通过公式计算组件对查询公式进行解析形成相应的SQL查询语句,取得结果后插入到查询结果中间表,并通过数据库技术依据查询公式设定的编号属性对各数据项进行对应整理形成最终结果保存到查询结果表,最终展示给查询使用者。
上述方法具体包括以下步骤:
一:确定查询目标
所述查询目标为要实现的多数据源各数据项的查询结果内容;
二:定义查询格式
根据查询目标结果内容,定义查询数据项、数据项排列顺序及计算数据项,也就是要确定各数据项的排列顺序,以确定查询结果中数据项的排列顺序,并为后续定义查询公式提供公式和数据项的位置对应提供依据;
三:抽取编号属性
根据目标查询多数据源数据的相关性,抽取各数据源都具有的相同编号属性;
四:定义语义对象
对多数据源的目标数据进行相应的语义对象定义,语义对象定义包含各相同编号属性;
五:定义查询公式
打开查询格式,基于对不同数据源的取数需求,在相应的数据项位置,使用已经完成的语义对象,定义查询公式,也就是使用向导方式选择数据源,选择数据源适用的语义对象,设定取数时需要的编号属性及取数字段标识;
六:打开查询计算显示查询结果
执行数据查询,查询公式计算组件对不同数据源请求数据,在中间数据表整理后返回目标查询结果内容显示。
所述多数据源中的“数据源”,并不局限于数据库和数据表。数据可以是同一单位的不同业务但存在相关性的数据,如供应链数据库、生产数据库和分销数据库,虽属不同业务数据库但都以产品为主线相关;也可以是不同单位相同业务的数据库整合,如将不同单位保存在不同财务数据库的科目数据整合,以查询对比不同单位的情况;也可以是同一数据库中不同业务、业务分类数据表及相同数据表内不同业务数据。
要查询的多数据源的数据项存在相关性,数据的相关性体现在语义对象中的编号属性定义中。
数据的相关性,可以理解为查询结果中各数据项将以何种编号标识为依据进行对应,数据源中没有相应编号信息的,应指定为确定的编号值即可。
步骤四中,语义对象定义就是对查询数据项进行分析抽取一个或多个语义对象,语义对象之间的联系体现在相同的编号属性字段。
所述语义对象,是从业务的角度对系统数据结构的一种描述、抽象和归集,是一个存放着业务数据的数据集,
具体地,
所述语义对象可以是简单的字典对象,如单位字典对象,包含单位编号、单位名称等属性(在语义对象中称属性为快捷名或请求);也可以是一个复杂的取数对象,如往来单位金额对象,包含核算单位、科目、往来单位、会计期间、借方余额、贷方余额、发生数、年初数及累计等属性;语义对象还封装了一些特殊标识,以灵活、方便的表现业务数据,如级数、明细等分级标识。
步骤五中,通过使用语义对象定义查询公式,各查询公式需使用相同的编号字段作为数据标识,以实现不同的数据项的正确对应。
进一步的,在步骤五中定义查询公式时,可以定义查询的取数条件;如果编号字段存在分级属性,可以设定查询时根据编号的分级属性进行分级汇总;如果查询条件属动态的查询条件,可以在步骤二中定义查询格式时定义查询公式变量参数,变量参数可以在步骤五定义查询条件时使用,
定义了分级汇总属性的查询公式,步骤六中,在公式计算组件计算时会对最终查询结果表的数据进行逐级汇总处理;
定义了查询条件的查询公式,步骤六中,在公式计算组件计算时会接收变量参数的值,解析包含变量参数的查询条件,连接数据源请求相应数据项的查询结果。
步骤六中,优选的具体实现过程是:使用公式计算组件根据查询公式对应的语义定义,对不同的查询公式进行计算,分别得到计算结果,并将多个查询公式的计算结果存入中间数据结果表;
多个查询公式计算完成后,公式计算组件根据查询公式定义时的编号属性,对中间数据结果表中的数据,实现不同数据项相同编号属性的对应后,写入查询结果数据表;
最终将查询结果数据表中根据编号对应好的数据项,以目标查询结果内容的形式展现给查询使用者。同时,也实现了多数据源的数据整合过程。
本发明的基于语义定义的多数据源的数据查询方法与现有技术相比具有以下突出的有益效果:
该方法采用定义语义对象的方式,可以屏蔽多数据源数据结构的复杂性,提高查询公式的可理解性和可复用性;可以支持多个不同数据库连接的数据查询,方便的实现了跨数据库数据的查询;支持了查询参数变量的定义和使用,可以实现更加灵活的数据查询定制;查询结果不单纯是每次查询重新生成的一次性数据,保存后即可作为数据整合的成果作为统计分析的依据,为企业经营决策服务。
语义对象是以更贴近商业语言的方式对各数据源数据的存储结构和内容进行描述,有效提高了数据查询实现的可理解性和可复用性,并可进行更多扩展应用。
附图说明
附图1是本发明基于语义定义的多数据源的数据查询方法的流程图;
附图2是本发明实施例涉及查询目标设计及查询格式定义流程图;
附图3是本发明实施例涉及语义对象流程图;
附图4是本发明实施例涉及查询公式流程图;
附图5是本发明实施例涉及查询公式界面实例图。
具体实施方式
参照说明书附图以具体实施例对本发明的一种基于语义定义的多数据源的数据查询方法作以下详细地说明。
实施例:
如附图2,
首先确定查询目标,是对多个部门,即A公司总部、华北分公司、东北分公司等多个公司的多个数据源进行查询,需要查询的数据是各种物料的期末结存数量和结存金额;查询的格式也同时确定(步骤一、二)。
经分析各数据项,抽取编号属性,即会计年度、会计期间、仓库编号、物料编号等(步骤三)。
由于各部门用了同一厂商的管理信息系统,数据结构一致,所以接下来可以如附图3,对应各数据源只需定义一个语义对象即可,这体现了语义对象的可复用性(步骤四)。
打开查询格式,选择相应数据项位置,如附图4、5定义查询公式,可以选择不同数据源,选定义好的语义对象后,指定编号属性和取数数据项,并设定取数条件后,查询公式定义完毕(步骤五)。
最后进入步骤六,执行查询,调用公式计算组件对查询公式进行解析,形成相应的取数查询sql,请求不同的数据源,返回各数据项的结果。各数据项结果经中间结果表处理后,按目标查询格式展现给查询使用者。
本发明描述的方法,其目标是通过语义对象的定义和查询公式的处理,使用公式计算组件将多数据源的相关业务数据获取到统一的数据库进行数据归集整合并返回查询结果。首先,方便的实现了跨数据库数据的查询;其次,语义对象定义的方法,有效提高了数据查询实现的可理解性和可复用性,并可进行更多扩展应用;同时,也是实现了一种数据源数据整合的方法。

Claims (9)

1.一种基于语义定义的多数据源的数据查询方法,其特征在于:该方法通过分析数据查询目标,抽取不同数据项间的相关性标识作为编号属性,并以此为依据对不同数据项定义语义对象,然后通过使用这些语义对象定义查询公式,再通过公式计算组件对查询公式进行解析形成相应的SQL查询语句,取得结果后插入到查询结果中间表,并通过数据库技术依据查询公式设定的编号属性对各数据项进行对应整理形成最终结果保存到查询结果表,最终展示给查询使用者。
2.根据权利要求1所述的基于语义定义的多数据源的数据查询方法,其特征在于
包括以下步骤:
一:确定查询目标
所述查询目标为要实现的多数据源各数据项的查询结果内容;
二:定义查询格式
根据查询目标结果内容,定义查询数据项、数据项排列顺序及计算数据项;
三:抽取编号属性
根据目标查询多数据源数据的相关性,抽取各数据源都具有的相同编号属性;
四:定义语义对象
对多数据源的目标数据进行相应的语义对象定义,语义对象定义包含各相同编号属性;
五:定义查询公式
打开查询格式,基于对不同数据源的取数需求,在相应的数据项位置,使用已经完成的语义对象,定义查询公式;
六:打开查询计算显示查询结果
执行数据查询,查询公式计算组件对不同数据源请求数据,在中间数据表整理后返回目标查询结果内容显示。
3.根据权利要求2所述的基于语义定义的多数据源的数据查询方法,其特征在于
所述多数据源中的数据源是同一单位的不同业务但存在相关性的数据;或是不同单位相同业务的数据库整合;或是同一数据库中不同业务、业务分类数据表及相同数据表内不同业务数据。
4.根据权利要求2所述的基于语义定义的多数据源的数据查询方法,其特征在于
要查询的多数据源的数据项存在相关性,数据的相关性体现在语义对象中的编号属性定义中。
5.根据权利要求2所述的基于语义定义的多数据源的数据查询方法,其特征在于
步骤四中,语义对象定义就是对查询数据项进行分析抽取一个或多个语义对象,语义对象之间的联系体现在相同的编号属性字段。
6.根据权利要求5所述的基于语义定义的多数据源的数据查询方法,其特征在于
所述语义对象,是从业务的角度对系统数据结构的一种描述、抽象、归集,是一个存放着业务数据的数据集,
具体地,
所述语义对象是简单的字典对象;或是复杂的取数对象;或是封装的特殊标识。
7.根据权利要求2所述的基于语义定义的多数据源的数据查询方法,其特征在于
步骤五中,通过使用语义对象定义查询公式,各查询公式需使用相同的编号字段作为数据标识,以实现不同的数据项的正确对应。
8.根据权利要求2所述的基于语义定义的多数据源的数据查询方法,其特征在于
在步骤五中定义查询公式时,可以定义查询的取数条件;如果编号字段存在分级属性,可以设定查询时根据编号的分级属性进行分级汇总;如果查询条件属动态的查询条件,可以在步骤二中定义查询格式时定义查询公式变量参数,变量参数可以在步骤五定义查询条件时使用,
定义了分级汇总属性的查询公式,步骤六中,在公式计算组件计算时会对最终查询结果表的数据进行逐级汇总处理;
定义了查询条件的查询公式,步骤六中,在公式计算组件计算时会接收变量参数的值,解析包含变量参数的查询条件,连接数据源请求相应数据项的查询结果。
9.根据权利要求2所述的基于语义定义的多数据源的数据查询方法,其特征在于
步骤六具体实现过程是:使用公式计算组件根据查询公式对应的语义定义,对不同的查询公式进行计算,分别得到计算结果,并将多个查询公式的计算结果存入中间数据结果表;
多个查询公式计算完成后,公式计算组件根据查询公式定义时的编号属性,对中间数据结果表中的数据,实现不同数据项相同编号属性的对应后,写入查询结果数据表;
最终将查询结果数据表中根据编号对应好的数据项,以目标查询结果内容的形式展现给查询使用者。
CN2010106135945A 2010-12-30 2010-12-30 一种基于语义定义的多数据源的数据查询方法 Pending CN102073701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010106135945A CN102073701A (zh) 2010-12-30 2010-12-30 一种基于语义定义的多数据源的数据查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010106135945A CN102073701A (zh) 2010-12-30 2010-12-30 一种基于语义定义的多数据源的数据查询方法

Publications (1)

Publication Number Publication Date
CN102073701A true CN102073701A (zh) 2011-05-25

Family

ID=44032240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010106135945A Pending CN102073701A (zh) 2010-12-30 2010-12-30 一种基于语义定义的多数据源的数据查询方法

Country Status (1)

Country Link
CN (1) CN102073701A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631952A (zh) * 2013-12-12 2014-03-12 用友软件股份有限公司 一种通过分离与统一的方式从多数据源抽取复杂数据分析信息的方法
CN104657371A (zh) * 2013-11-20 2015-05-27 腾讯科技(深圳)有限公司 一种数据展示方法和装置
CN105868191A (zh) * 2015-01-19 2016-08-17 阿里巴巴集团控股有限公司 数据处理方法及装置
CN106446133A (zh) * 2016-09-19 2017-02-22 广东中标数据科技股份有限公司 同时对接两个数据库的方法及装置
CN107515887A (zh) * 2017-06-29 2017-12-26 中国科学院计算机网络信息中心 一种适用于多种大数据管理系统的交互式查询方法
CN107784063A (zh) * 2017-07-27 2018-03-09 平安科技(深圳)有限公司 算法的生成方法及终端设备
CN107784058A (zh) * 2017-04-11 2018-03-09 平安医疗健康管理股份有限公司 药品数据处理方法及装置
CN107844561A (zh) * 2017-11-01 2018-03-27 山东浪潮云服务信息科技有限公司 一种数据量统计方法及装置
CN108052676A (zh) * 2017-12-28 2018-05-18 广东金赋科技股份有限公司 多数据源数据的配置方法及装置
CN109739878A (zh) * 2018-12-13 2019-05-10 北京达佳互联信息技术有限公司 大数据查询方法、装置、服务器及存储介质
CN109829033A (zh) * 2017-11-23 2019-05-31 阿里巴巴集团控股有限公司 数据展示方法和终端设备
CN109918453A (zh) * 2019-02-13 2019-06-21 中国三峡建设管理有限公司 一种以自然语言搜索关系型复杂管理信息系统数据的方法及系统
CN110262969A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 报表测试方法、装置、电子设备及计算机可读存储介质
CN110765151A (zh) * 2018-07-27 2020-02-07 北京国双科技有限公司 一种计算公式处理方法及装置
CN111506671A (zh) * 2020-03-17 2020-08-07 北京捷通华声科技股份有限公司 处理实体对象的属性的方法、装置、设备及存储介质

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657371A (zh) * 2013-11-20 2015-05-27 腾讯科技(深圳)有限公司 一种数据展示方法和装置
CN103631952A (zh) * 2013-12-12 2014-03-12 用友软件股份有限公司 一种通过分离与统一的方式从多数据源抽取复杂数据分析信息的方法
CN105868191A (zh) * 2015-01-19 2016-08-17 阿里巴巴集团控股有限公司 数据处理方法及装置
CN105868191B (zh) * 2015-01-19 2020-01-17 阿里巴巴集团控股有限公司 数据处理方法及装置
CN106446133A (zh) * 2016-09-19 2017-02-22 广东中标数据科技股份有限公司 同时对接两个数据库的方法及装置
CN107784058A (zh) * 2017-04-11 2018-03-09 平安医疗健康管理股份有限公司 药品数据处理方法及装置
CN107784058B (zh) * 2017-04-11 2020-11-13 平安医疗健康管理股份有限公司 药品数据处理方法及装置
CN107515887B (zh) * 2017-06-29 2021-01-08 中国科学院计算机网络信息中心 一种适用于多种大数据管理系统的交互式查询方法
CN107515887A (zh) * 2017-06-29 2017-12-26 中国科学院计算机网络信息中心 一种适用于多种大数据管理系统的交互式查询方法
CN107784063A (zh) * 2017-07-27 2018-03-09 平安科技(深圳)有限公司 算法的生成方法及终端设备
WO2019019702A1 (zh) * 2017-07-27 2019-01-31 平安科技(深圳)有限公司 算法的生成方法、装置、终端设备及存储介质
CN107784063B (zh) * 2017-07-27 2020-03-17 平安科技(深圳)有限公司 算法的生成方法及终端设备
CN107844561A (zh) * 2017-11-01 2018-03-27 山东浪潮云服务信息科技有限公司 一种数据量统计方法及装置
CN109829033B (zh) * 2017-11-23 2023-04-18 阿里巴巴集团控股有限公司 数据展示方法和终端设备
CN109829033A (zh) * 2017-11-23 2019-05-31 阿里巴巴集团控股有限公司 数据展示方法和终端设备
CN108052676A (zh) * 2017-12-28 2018-05-18 广东金赋科技股份有限公司 多数据源数据的配置方法及装置
CN108052676B (zh) * 2017-12-28 2021-06-18 广东金赋科技股份有限公司 多数据源数据的配置方法及装置
CN110765151A (zh) * 2018-07-27 2020-02-07 北京国双科技有限公司 一种计算公式处理方法及装置
CN109739878A (zh) * 2018-12-13 2019-05-10 北京达佳互联信息技术有限公司 大数据查询方法、装置、服务器及存储介质
CN109918453A (zh) * 2019-02-13 2019-06-21 中国三峡建设管理有限公司 一种以自然语言搜索关系型复杂管理信息系统数据的方法及系统
CN110262969A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 报表测试方法、装置、电子设备及计算机可读存储介质
CN110262969B (zh) * 2019-06-13 2022-03-22 泰康保险集团股份有限公司 报表测试方法、装置、电子设备及计算机可读存储介质
CN111506671A (zh) * 2020-03-17 2020-08-07 北京捷通华声科技股份有限公司 处理实体对象的属性的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN102073701A (zh) 一种基于语义定义的多数据源的数据查询方法
CN110866123B (zh) 基于数据模型构建数据图谱的方法及构建数据图谱的系统
CN103177068B (zh) 按照生存规则合并源记录的系统和方法
CN107193967A (zh) 一种多源异构行业领域大数据处理全链路解决方案
CN103631882B (zh) 基于图挖掘技术的语义化业务生成系统和方法
CN112668968B (zh) 一种基于领域驱动设计的仓储管理建模方法及系统
De Virgilio et al. Semantic web information management: a model-based perspective
CN109739878A (zh) 大数据查询方法、装置、服务器及存储介质
CN113064866A (zh) 一种电力业务数据整合系统
Sabou et al. Tourmislod: A tourism linked data set
CN110490761A (zh) 一种电网配网设备台账数据模型建模方法
CN107679977A (zh) 一种基于语义分析的税务管理平台及实现方法
CN112988919A (zh) 一种电网数据集市构建方法、系统、终端设备及存储介质
CN115438199A (zh) 一种基于智慧城市场景数据中台技术的知识平台系统
CN104765763B (zh) 一种基于概念格的异构空间信息服务分类的语义匹配方法
CN113987210A (zh) 一种船舶产业知识图谱构建与分析方法
Glava et al. Information Systems Reengineering Approach Based on the Model of Information Systems Domains
CN112183037A (zh) 一种平行企业财税SaaS系统中数据分类汇总方法及系统
CN108228787A (zh) 按照多级类目处理信息的方法和装置
CN101719162A (zh) 基于片段模式匹配的多版本开放式地理信息服务访问方法及系统
CN113535966A (zh) 知识图谱的创建方法、信息获取的方法、装置和设备
CN114490571A (zh) 一种建模方法、服务器及存储介质
Atay et al. Modeling and querying multidimensional bitemporal data warehouses
Porshnev et al. Problems and Methods for Integrating Heterogeneous Data (on Example, Metallurgical Production)
US20200183952A1 (en) Numerical information management device using data structure

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110525