CN102591952A - 基于语义的数据查询装置和基于语义的数据查询方法 - Google Patents

基于语义的数据查询装置和基于语义的数据查询方法 Download PDF

Info

Publication number
CN102591952A
CN102591952A CN2011104482724A CN201110448272A CN102591952A CN 102591952 A CN102591952 A CN 102591952A CN 2011104482724 A CN2011104482724 A CN 2011104482724A CN 201110448272 A CN201110448272 A CN 201110448272A CN 102591952 A CN102591952 A CN 102591952A
Authority
CN
China
Prior art keywords
semantic
metadata
data
query
semantic metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104482724A
Other languages
English (en)
Inventor
李长山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yonyou Software Co Ltd
Original Assignee
Yonyou Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yonyou Software Co Ltd filed Critical Yonyou Software Co Ltd
Priority to CN2011104482724A priority Critical patent/CN102591952A/zh
Publication of CN102591952A publication Critical patent/CN102591952A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于语义的数据查询装置,包括:获取单元,获取数据源的语义元数据作为查询语义元数据;语义数据关联单元,根据配置规则生成与语义元数据相关联的关联关系,基于关联关系和语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;构建单元,将多个语义元数据之间的关联关系构建成语义关联关系树;以及查询单元,从构建单元构建的语义关联关系树上选取查询字段,根据查询字段在语义关系树上的路径关系构建查询表达式,从而实现数据的查询。相应的,本发明还提高了一种基于语义的数据查询方法。通过该技术方案,屏蔽了底层数据的差异性,降低了查询建模的难度,提高了建模效率,同时又保证了其可扩展性。

Description

基于语义的数据查询装置和基于语义的数据查询方法
技术领域
本发明涉及计算机技术领域,具体而言涉及基于语义的数据查询装置和基于语义的数据查询方法。
背景技术
企业的业务人员或决策人员对业务信息系统进行报表查询分析的时候,在明确分析指标的前提下,需要基于业务系统的数据构建出查询模型,然后执行取数进行分析。在查询模型构建的过程中,往往会遇到以下几种困难和挑战:
1.由于企业信息化是一个长期过程,其中数据的存储方式,数据结构往往前后差异较大。例如对于同一张人员信息记录表,前后可能分别存储在格式化文件和关系数据库中;对于同一名称列,前后可能分别被定义为mingcheng和name等。不同的数据来源和数据定义,这些数据入口不一致的情况对构建查询分析造成了不少困难。
2.即便对数据入口进行了统一,但是在面对物理数据结构相关技术性很强的概念和理解数据结构与业务实体关联关系时,对大部分使用者来说都是一个挑战。
3.各次的查询分析整体上看都是离散的,不同的查询分析之间很难为彼此提供直接的知识。例如,一次查询中所建立的实体关联关系很难为下一次涉及到相关实体查询建模时所用。
面对查询建模中的问题,现有的解决思路大体是:通过数据的转换存储到关系数据库来解决数据的不一致性,通过在建模过程中利用查询语句把物理数据映射转译为具有业务意义别名,从而完成查询模型的创建。这种实现方式的不足之处在于针对不同数据来源进行数据抓取具有技术实现上的复杂性,而对于查询建模所面向的业务逻辑来讲,并不需要关心这些。另外由于直接针对物理数据进行查询设计,很难使其具有查询设计者的专业业务背景,这样会造成在使用上的歧义和困难;而且在创建新的查询模型时,很难对已有的查询模型进行利用,查询模型之间很难达成知识的共享。
因此,需要一种新的数据查询的方案,可以屏蔽底层数据的差异性。
发明内容
基于上述背景技术的考虑,本发明的一个目的是提供一种基于语义的数据查询装置,本发明的另一目的是提供一种基于语义的数据查询方法,以降低查询建模的难度,提高建模效率,同时又易于扩展。
根据本发明的一个方面,提供了一种基于语义的数据查询装置,包括:获取单元,获取数据源的语义元数据作为查询语义元数据;语义数据关联单元,根据配置规则生成与所述语义元数据相关联的关联关系,基于所述关联关系和所述语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;构建单元,将多个所述语义元数据之间的关联关系构建成语义关联关系树;以及查询单元,从所述构建单元构建的所述语义关联关系树上选取查询字段,根据所述查询字段在所述语义关系树上的路径关系构建查询表达式,从而实现数据的查询。在该技术方案中,以元数据为媒介,将现实业务与数据源对应起来,屏蔽了数据源的差异性,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,降低了查询建模的难度,提高了系统的效率。
在上述技术方案中,优选地,基于语义的数据查询装置,还包括:元数据驱动器,用于建立数据源到所述语义元数据之间的映射关系,不同类型的所述数据源与不同的元数据驱动器一一对应。在该技术方案中,通过建立数据源与元数据的对应,可以将不同类数据结构中的表示同一种实体业务的数据进行统一,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,提高了系统的效率,此外,每个元数据都可以定位到相应的数据驱动其来完成相应的操作。另外,可以提供数据驱动的扩展接口,如果需要增加新的外部数据源,则只需要实现对应的数据驱动即可。
在上述技术方案中,优选地,所述查询单元根据所述查询表达式调用相应的元数据驱动器,在与所述元数据驱动器对应的数据源中进行取数,以加载查询数据。在该技术方案中,通过选择实体业务内容就可以实现对不同数据结构中的源数据进行查询,而不需要用户直接面对不同的数据结构,大大方便了用户的使用。
在上述技术方案中,优选地,所述构建单元将所述获取的语义元数据作为所述语义关联关系树上的第一级节点,将与所述获取的语义元数据相关联的语义元数据作为所述语义关联关系树上的第二级节点。在该技术方案中,通过建立语义关联关系树,保证了数据查询模型的可扩展性。
在上述技术方案中,优选地,所述的基于语义的数据查询装置,还包括:自定义单元,对所述获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成所述自定义关联关系。在该技术方案中,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的建模分析,提高了建模效率。
根据本发明的另一个方面,还提供了一种基于语义的数据查询方法,包括:步骤202,获取数据源的语义元数据作为查询语义元数据;步骤204,根据配置规则生成与所述语义元数据相关联的关联关系,基于所述关联关系和所述语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;步骤206,将多个所述语义元数据之间的关联关系构建成语义关联关系树,从所述语义关联关系树上选取查询字段,根据所述查询字段在所述语义关系树上的路径关系构建查询表达式,从而实现数据的查询。在该技术方案中,以元数据为媒介,将现实业务与数据源对应起来,屏蔽了数据源的差异性,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,降低了查询建模的难度,提高了系统的效率。
在上述技术方案中,优选地,所述的基于语义的数据查询方法,还包括,建立数据源到所述语义元数据之间的映射关系,不同类型的所述数据源与不同的元数据驱动一一对应。在该技术方案中,通过建立数据源与元数据的对应,可以将不同类数据结构中的表示同一种实体业务的数据进行统一,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,提高了系统的效率。
在上述技术方案中,优选地,所述步骤206还包括:根据所述查询表达式调用相应的元数据驱动,在与所述元数据驱动对应的数据源中进行取数,以加载查询数据。在该技术方案中,通过选择实体业务内容就可以实现对不同数据结构中的源数据进行查询,而不需要用户直接面对不同的数据结构,大大方便了用户的使用。
在上述技术方案中,优选地,所述的基于语义的数据查询方法,还包括,将所述获取的语义元数据作为所述语义关联关系树上的第一级节点,将与所述获取的语义元数据相关联的语义元数据作为所述语义关联关系树上的第二级节点。在该技术方案中,通过建立语义关联关系树,保证了数据查询模型的可扩展性。
在上述技术方案中,优选地,所述的基于语义的数据查询方法,还包括,对所述获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成所述自定义关联关系。在该技术方案中,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的建模分析,提高了建模效率。
综上所述,通过本发明中的技术方案,实现了以元数据为媒介,将现实业务与数据源对应起来,屏蔽了数据源的差异性,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,降低了查询建模的难度,提高了系统的效率;通过建立语义关联关系树,保证了数据查询模型的可扩展性;另外,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的建模分析,提高了建模效率。
附图说明
图1是根据本发明一个实施例的基于语义的数据查询装置的框图;
图2是根据本发明一个实施例的基于语义的数据查询方法的流程图;
图3是根据本发明一个实施例的基于语义的数据查询装置的框架示意图;
图4是根据本发明一个实施例的元数据驱动器与数据源的关系示意图;
图5是根据本发明一个实施例的建立语义元数据关联关系的示意图;
图6是根据本发明一个实施例的语义元数据实体之间的关联关系示意图;
图7是根据本发明一个实施例的查询数据的流程图;
图8是根据本发明一个实施例的基于语义的数据查询装置的应用场景的截图;
图9是根据图8的应用场景实现了元数据关联关系的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开的具体实施例的限制。
以下是一些专业术语解释:
语义,业务语义:即对象所具有的特定专业领域的具体含义。例如一个名为ext1的数据库字段,可以看成公司编码也可以被看成是客商编码,可以说其在公司管理和销售管理中具有不同的语义。
元数据:即对数据的结构和意义进行描述的数据,在本发明的实施例中,元数据可以理解为在某一特定领域的语义化的数据。
图1是根据本发明一个实施例的基于语义的数据查询装置的框图。
如图1所示,根据本发明的实施例的基于语义的数据查询装置100,包括:获取单元102,获取数据源的语义元数据作为查询语义元数据;语义数据关联单元104,根据配置规则生成与语义元数据相关联的关联关系,基于关联关系和语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;构建单元106,将多个语义元数据之间的关联关系构建成语义关联关系树;以及查询单元108,从构建单元构建的语义关联关系树上选取查询字段,根据查询字段在语义关系树上的路径关系构建查询表达式,从而实现数据的查询。在该技术方案中,以元数据为媒介,将现实业务与数据源对应起来,屏蔽了数据源的差异性,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,降低了查询建模的难度,提高了系统的效率。
在上述技术方案中,基于语义的数据查询装置100,还包括:元数据驱动器110,用于建立数据源到语义元数据之间的映射关系,不同类型的数据源与不同的元数据驱动器一一对应。在该技术方案中,通过建立数据源与元数据的对应,可以将不同类数据结构中的表示同一种实体业务的数据进行统一,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,提高了系统的效率,此外,每个元数据都可以定位到相应的数据驱动其来完成相应的操作。另外,可以提供数据驱动的扩展接口,如果需要增加新的外部数据源,则只需要实现对应的数据驱动即可。
在上述技术方案中,查询单元108根据查询表达式调用相应的元数据驱动器110,在与元数据驱动器对应的数据源中进行取数,以加载查询数据。在该技术方案中,通过选择实体业务内容就可以实现对不同数据结构中的源数据进行查询,而不需要用户直接面对不同的数据结构,大大方便了用户的使用。
在上述技术方案中,构建单元108将获取的语义元数据作为语义关联关系树上的第一级节点,将与获取的语义元数据相关联的语义元数据作为语义关联关系树上的第二级节点。在该技术方案中,通过建立语义关联关系树,保证了数据查询模型的可扩展性。
在上述技术方案中,基于语义的数据查询装置100,还包括:自定义单元112,对获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成自定义关联关系。在该技术方案中,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的建模分析,提高了建模效率。
图2是根据本发明一个实施例的基于语义的数据查询方法的流程图。
根据本发明的另一个方面,还提供了一种基于语义的数据查询方法,如图2所示,包括:步骤202,获取数据源的语义元数据作为查询语义元数据;步骤204,根据配置规则生成与语义元数据相关联的关联关系,基于关联关系和语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;步骤206,将多个语义元数据之间的关联关系构建成语义关联关系树,从语义关联关系树上选取查询字段,根据查询字段在语义关系树上的路径关系构建查询表达式,从而实现数据的查询。在该技术方案中,以元数据为媒介,将现实业务与数据源对应起来,屏蔽了数据源的差异性,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,降低了查询建模的难度,提高了系统的效率。
在上述技术方案中,基于语义的数据查询方法,还包括,建立数据源到语义元数据之间的映射关系,不同类型的数据源与不同的元数据驱动一一对应。在该技术方案中,通过建立数据源与元数据的对应,可以将不同类数据结构中的表示同一种实体业务的数据进行统一,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,提高了系统的效率。
在上述技术方案中,步骤206还包括:根据查询表达式调用相应的元数据驱动,在与元数据驱动对应的数据源中进行取数,以加载查询数据。在该技术方案中,通过选择实体业务内容就可以实现对不同数据结构中的源数据进行查询,而不需要用户直接面对不同的数据结构,大大方便了用户的使用。
在上述技术方案中,基于语义的数据查询方法,还包括,将获取的语义元数据作为语义关联关系树上的第一级节点,将与获取的语义元数据相关联的语义元数据作为语义关联关系树上的第二级节点。在该技术方案中,通过建立语义关联关系树,保证了数据查询模型的可扩展性。
在上述技术方案中,基于语义的数据查询方法,还包括,对获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成自定义关联关系。在该技术方案中,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的建模分析,提高了建模效率。
因此,本发明通过引入语义层,屏蔽底层物理数据的差异性,而对查询设计使用者来讲,面对的是自己知识领域的数据实体,以及还提出了针对查询数据实体的关联关系实现自我知识发现的方法,对查询建模提供了智能化支持。
以下结合实际应用对本发明中所提供的基于语义的数据查询装置和基于语义的数据查询方法进行详细的说明。
图3是根据本发明实施例的基于语义的数据查询装置的框架示意图。
首先对相关名词作相关解释:
语义(业务语义):对象所具有的特定专业领域的具体含义。例如一个名为ext1的数据库字段,可以看成公司编码也可以被看成是客商编码,可以说其在公司管理和销售管理中具有不同的语义。
元数据:对数据的结构和意义进行描述的数据,在根据本发明的实施例中,元数据可以理解为在某一特定领域的语义化的数据,即语义元数据。
本实施例中,如图3所示,就所涉及的各部分的实现技术方案进行分别说明:
1.语义元数据与外部数据管理(外部数据管理用于管理各种数据源,对于不同元数据驱动器提供的元数据,面向不同的业务领域创建业务语义实体,即对数据实体进行业务语义化):此二者的结合完成了外部物理数据(各种数据源)到具有语义的元数据的映射。在其上层——语义元数据层,具体的对象都是元数据实体,具有如下数据结构:
  编码   名称   类型  字段0  字段1  字段2 ......
对于下层——不同类型的外部文件,实现了对应的元数据驱动器(即不同类型的数据源与不同元数据驱动器进行一一对应,具体示意图可参见图4),其主要功能有:
a)、获取当前数据源上的所有的实体(编码、名称)。
b)、获取具体实体的字段信息。
c)、利用指定的元数据驱动器读取数据。
元数据驱动器与元数据数据结构中的类型一一对应,这样每个元数据都可以定位到相应的数据驱动,使用元数据驱动器来完成相应的操作。另外,可以提供数据驱动的扩展接口,如果需要增加新的外部数据源,则只需要实现对应的数据驱动即可,数据驱动实现的原理如图4所示。其中,NC与U9都是具体的企业信息系统,通过对应的语义元数据驱动器可以提供相应的语义元数据。另外,各个驱动有不同的技术实现,对于关系数据库类型的外部数据源类型,采用了RDBMS提供了相关的接口,对于常见类型的文本格式文件(例如,EXCEL文件),则有相对成熟的第三方组件提供对应的接口。
因此,针对数据存储的不同介质和结构,针对不同的情形,配置不同的数据驱动。通过数据驱动,对上层模块主要提供两种功能,数据的描述——元数据和数据的读取。通过数据驱动接口,完成了对底层数据差异性的屏蔽,通过驱动进行取数,提供查询数据的实时性。
2.语义关联建模(对应图1中的语义数据关联单元104):建立语义元数据之间的关联关系。语义元数据之间关联关系分为三类,各自的实现如下:
a)、物理实体存在的关联:如关系数据库中主键与外键之间的关联,此种关联从数据驱动中可以直接获取。
b)、面向具体业务的关联:同一种业务系统中对于某一个类型可能采用同一标识,例如pk_corp被认为是公司的标识,那么不同的语义元数据中如果都含有pk_corp字段,那么认为二者存在关联。此种类型的关联可以通过预置关联规则进行获取,典型的是通过xml文件定义出通用的业务字段。
c)、自定义的关联:允许对语义元数据自定义关联关系,这种类型常见于跨业务系统之间的关联设置,即同一业务类型数据在不同的系统中具有不同的标识。在进行自定义关联设置时,可以对已存在的关联设置进行知识挖掘,给与智能建议。
语义元数据的数据结构中主要字段可以如下表所示:
  ID   名称   作用域   起始字段   结束字段   关联类型 ......
其中,具体地,作用域——用于标识具体的业务领域,在查询设计时,加载不同的作用域可以得到不同的关联关系;
关联类型——常见的关联类型有:左/右关联(与RMBD数据库表关联类型相同),表达式关联(允许自定义逻辑表达式);
起始/结束字段:其拼写形式为:“元数据标识.字段名”。
图5是根据本发明一个实施例的语义元数据关联关系的具体实现示意图。图6是根据本发明一个实施例的语义元数据实体之间的关联关系示意图。需说明的是,图5中的语义关联设计器对应于图1中的语义数据关联单元104,如图2所示的语义元数据管理向语义关联设计器提供语义元数据,语义关联设计器根据配置规则得到关联数据(即语义元数据关联关系),将关联数据保存至关联关系数据储存,并且通过关联知识挖掘可以进行知识挖掘。
下面结合图6和图5说明语义数据关联单元的具体实现流程:
a)从语义元数据管理装置中选择相应领域中的元数据(即语义元数据),如“用户”元数据(对应于图1中的获取单元获取语义元数据,作为查询语义元数)。
b)由预置规则单元——XML配置文件,生成其内容定义的关联关系。
c)查找“用户”元数据相关的关联关系,并根据上述元数据数据结构中的起始/结束字段信息,加载相关的元数据,即图6中所示的其他5个元数据(组织、语种信息、数据格式、用户组和组织_集团),如图6所示,可以找出与“用户”该语义元数据相关联的其他语义元数据。
d)如果要继续自定义设置关联关系,例如“用户”元数据中的“用户组”字段与“用户组”元数据中的“用户组主键”进行关联,则可以在二者之间设置连线表示建立了关系,同时双击连线通过设置单元(图中未示出)进行关联关系设置。
e)另外,还可以选中两个元数据实体,通过鼠标右键的方式,触发关联知识挖掘单元进行关联知识挖掘,使其给出二个实体之间的关联关系设置建议。
f)设置完元数据实体关系后,进行保存。
3.关联关系的应用——查询建模(对应图1中的查询单元):在报表数据的查询建模时,基于上述两个模块的设置,用户看到的只是面向专有业务领域的业务模型-语义元数据,对于元数据的数据来源,数据之间的关联关系都不需要了解。
下面参照图7来说明查询建模的具体实现步骤,图7是根据本发明一个实施例的查询建模的流程图。
如图7,查询建模的具体建模流程如下:
步骤702,选择主要的查询语义元数据(将选择的语义元数据作为查询语义元数据)。
步骤704,加载相关业务领域的关联关系(可以如图6所示的语义元数据之间的关联关系)。
步骤706,自动将语义元数据之间的关联关系,构建语义关联关系树。
步骤708,从关系树上选择具体的节点作为查询分析指标。
步骤710,根据查询分析指标对应的元数据关联规则构建查询表达式。
步骤712,调用元数据驱动器加载查询数据,并进行数据处理。
其中,参照图8,步骤706、步骤710、步骤712的具体实现方式说明如下:
1)语义关联关系树的自动构建:结合图8所示的应用场景,关联树的构建实现如下:
a)把选择的语义元数据“客商”的字段作为一级节点;
b)根据加载的关联关系模型,判断出“客商”的字段中与哪些外部元数据可进行关联,本例中有“组织”、“集团”、“财务组织”、“地区分类”等四个语义元数据与“客商”语义元数据有关联,关联关系如图9所示。
c)分别加载“组织”、“地区分类”等四个语义元数据信息,并把所有字段作为关联字段的子节点。
以上,根据关联关系领域的不同,就可以实现构造出不同的语义元数据树结构。
2)查询表达式的构建:查询模型设计(对应图1中的查询单元)中所涉及到的元数据和字段信息从元数据构造树(即语义关联关系树)上获取,节点之间的链接对应着其关联关系,这样从树上选取任何一个节点的任何字段都可以构建出链接关系,进而实现数据的查询。依然由图8所示的应用场景,取“客商”、“组织”、“地区分类”这三个元数据进行具体阐述:
a)、如果构建的查询指标为:
  客商编码   客商名称   所属组织名称   所属地区分类名称
元数据树上元数据和与其对应的字段关系如下:
组织
Figure BDA0000126211290000121
b)、构建查询表达式:具体的查询表达式与报表设计时所定义查询模型有关,如果查询使用是的二维数据集,从关系数据库上取数,则查询表达式可以使用SQL实现,具体示意如下:
SELECT客商.客商编码,客商.客商名称,组织.名称,地区分类.地区分类名称FROM客商,组织,地区分类WHERE EXP1 AND EXP2
如果是通过构建多维数据集模型进行的报表查询设计,则可以把相关的元数据分别生成相应的事实表(客商)和维度表(组织和地区分类),设置二者的关联,进而通过相应的OLAP服务器(OLAP-联机事务处理,OLAP服务器是指一种多维数据分析处理的平台/引擎,在业界,如Microsoft,IBM,Oracle都有对应的OLAP服务器)获取结果集。
3)原数据驱动器的数据加载与数据处理跟具体的查询模型相关。如果采用多维数据集模型,则一般其所依赖的OLAP服务器可以直接通过元数据驱动器读取数据,在内存中构建查询所要的多维数据集;如果查询模型依赖于关系数据库和SQL,那么元数据驱动器在加载不同数据库数据或者其他格式类型文件时候,就需要对数据进行复制和转储,借助于RMDBS提供的功能以及第三方接口API,可以很容易实现。
以上结合附图详细说明了本发明的技术方案,实现了以元数据为媒介,将现实业务与数据源对应起来,屏蔽了数据源的差异性,避免了使用者在使用时需要接触各种不同数据结构所带来的困难,降低了查询建模的难度,提高了系统的效率;通过建立语义关联关系树,保证了数据查询模型的可扩展性;另外,用户可以根据需要进行自定义关联关系,而且通过关联知识挖掘,有助于特定领域的建模分析,提高了建模效率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于语义的数据查询装置,其特征在于,包括:
获取单元,获取数据源的语义元数据作为查询语义元数据;
语义数据关联单元,根据配置规则生成与所述语义元数据相关联的关联关系,基于所述关联关系和所述语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;
构建单元,将多个所述语义元数据之间的关联关系构建成语义关联关系树;以及
查询单元,从所述构建单元构建的所述语义关联关系树上选取查询字段,根据所述查询字段在所述语义关系树上的路径关系构建查询表达式,从而实现数据的查询。
2.根据权利要求1所述的基于语义的数据查询装置,其特征在于,还包括:
元数据驱动器,用于建立数据源到所述语义元数据之间的映射关系,不同类型的所述数据源与不同的元数据驱动器一一对应。
3.根据权利要求2所述的基于语义的数据查询装置,其特征在于,所述查询单元根据所述查询表达式调用相应的元数据驱动器,在与所述元数据驱动器对应的数据源中进行取数,以加载查询数据。
4.根据权利要求1所述的基于语义的数据查询装置,其特征在于,所述构建单元将所述获取的语义元数据作为所述语义关联关系树上的第一级节点,将与所述获取的语义元数据相关联的语义元数据作为所述语义关联关系树上的第二级节点。
5.根据权利要求1至4中任一项所述的基于语义的数据查询装置,其特征在于,还包括:
自定义单元,对所述获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成所述自定义关联关系。
6.一种基于语义的数据查询方法,其特征在于,包括:
步骤202,获取数据源的语义元数据作为查询语义元数据;
步骤204,根据配置规则生成与所述语义元数据相关联的关联关系,基于所述关联关系和所述语义元数据的数据结构查找出与获取的语义元数据相关联的语义元数据;
步骤206,将多个所述语义元数据之间的关联关系构建成语义关联关系树,从所述语义关联关系树上选取查询字段,根据所述查询字段在所述语义关系树上的路径关系构建查询表达式,从而实现数据的查询。
7.根据权利要求6所述的基于语义的数据查询方法,其特征在于,建立数据源到所述语义元数据之间的映射关系,不同类型的所述数据源与不同的元数据驱动一一对应。
8.根据权利要求7所述的基于语义的数据查询方法,其特征在于,所述步骤206还包括:
根据所述查询表达式调用相应的元数据驱动,在与所述元数据驱动对应的数据源中进行取数,以加载查询数据。
9.根据权利要求6所述的基于语义的数据查询方法,其特征在于,将所述获取的语义元数据作为所述语义关联关系树上的第一级节点,将与所述获取的语义元数据相关联的语义元数据作为所述语义关联关系树上的第二级节点。
10.根据权利要求6至9中任一项所述的基于语义的数据查询方法,其特征在于,对所述获取的语义元数据自定义关联关系,选择需建立关联关系的多个语义元数据,触发关联知识挖掘,以生成所述自定义关联关系。
CN2011104482724A 2011-12-28 2011-12-28 基于语义的数据查询装置和基于语义的数据查询方法 Pending CN102591952A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104482724A CN102591952A (zh) 2011-12-28 2011-12-28 基于语义的数据查询装置和基于语义的数据查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104482724A CN102591952A (zh) 2011-12-28 2011-12-28 基于语义的数据查询装置和基于语义的数据查询方法

Publications (1)

Publication Number Publication Date
CN102591952A true CN102591952A (zh) 2012-07-18

Family

ID=46480590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104482724A Pending CN102591952A (zh) 2011-12-28 2011-12-28 基于语义的数据查询装置和基于语义的数据查询方法

Country Status (1)

Country Link
CN (1) CN102591952A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092998A (zh) * 2013-02-21 2013-05-08 用友软件股份有限公司 数据查询系统和数据查询方法
WO2014127500A1 (en) * 2013-02-19 2014-08-28 Google Inc. Natural language processing based search
CN104978426A (zh) * 2015-07-08 2015-10-14 克拉玛依红有软件有限责任公司 一种基于6w语义标识的元数据仓库启发式智能搜索方法
CN105550241A (zh) * 2015-12-07 2016-05-04 珠海多玩信息技术有限公司 多维数据库查询方法及装置
CN105912603A (zh) * 2016-04-06 2016-08-31 百度在线网络技术(北京)有限公司 网络空间的业务查询方法及装置
CN107391537A (zh) * 2017-04-25 2017-11-24 阿里巴巴集团控股有限公司 数据关系模型的生成方法、装置及设备
CN108427689A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 信息获取方法和装置
CN109542901A (zh) * 2018-11-12 2019-03-29 北京懿医云科技有限公司 数据处理方法、装置、计算机可读存储介质及电子设备
CN110941629A (zh) * 2019-10-12 2020-03-31 中国平安财产保险股份有限公司 元数据处理方法、装置、设备及计算机可读存储介质
CN111104405A (zh) * 2019-12-06 2020-05-05 苏州浪潮智能科技有限公司 一种元数据的处理方法、装置及计算机可读存储介质
CN111708801A (zh) * 2020-05-29 2020-09-25 北京金山云网络技术有限公司 报表生成方法、装置及电子设备
CN112817569A (zh) * 2021-02-06 2021-05-18 成都飞机工业(集团)有限责任公司 一种面向分析的数据快速映射方法、设备及存储介质
CN113015987A (zh) * 2018-11-29 2021-06-22 西门子股份公司 用于获得生产线的数据源的数据的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040186826A1 (en) * 2003-03-21 2004-09-23 International Business Machines Corporation Real-time aggregation of unstructured data into structured data for SQL processing by a relational database engine
US20050027674A1 (en) * 2003-04-29 2005-02-03 Cognos Incorporated Metadata modelling for reporting
CN1786950A (zh) * 2004-12-06 2006-06-14 国际商业机器公司 处理抽象查询的方法和系统
CN101615192A (zh) * 2009-07-09 2009-12-30 河北全通通信有限公司 决策支持系统共享语义层的实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040186826A1 (en) * 2003-03-21 2004-09-23 International Business Machines Corporation Real-time aggregation of unstructured data into structured data for SQL processing by a relational database engine
US20050027674A1 (en) * 2003-04-29 2005-02-03 Cognos Incorporated Metadata modelling for reporting
CN1786950A (zh) * 2004-12-06 2006-06-14 国际商业机器公司 处理抽象查询的方法和系统
CN101615192A (zh) * 2009-07-09 2009-12-30 河北全通通信有限公司 决策支持系统共享语义层的实现方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014127500A1 (en) * 2013-02-19 2014-08-28 Google Inc. Natural language processing based search
CN103092998A (zh) * 2013-02-21 2013-05-08 用友软件股份有限公司 数据查询系统和数据查询方法
CN103092998B (zh) * 2013-02-21 2017-02-08 用友网络科技股份有限公司 数据查询系统和数据查询方法
CN104978426A (zh) * 2015-07-08 2015-10-14 克拉玛依红有软件有限责任公司 一种基于6w语义标识的元数据仓库启发式智能搜索方法
CN104978426B (zh) * 2015-07-08 2018-03-02 克拉玛依红有软件有限责任公司 一种基于6w语义标识的元数据仓库启发式智能搜索方法
CN105550241A (zh) * 2015-12-07 2016-05-04 珠海多玩信息技术有限公司 多维数据库查询方法及装置
CN105550241B (zh) * 2015-12-07 2019-06-25 珠海多玩信息技术有限公司 多维数据库查询方法及装置
CN105912603A (zh) * 2016-04-06 2016-08-31 百度在线网络技术(北京)有限公司 网络空间的业务查询方法及装置
CN108427689A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 信息获取方法和装置
CN107391537A (zh) * 2017-04-25 2017-11-24 阿里巴巴集团控股有限公司 数据关系模型的生成方法、装置及设备
CN107391537B (zh) * 2017-04-25 2020-09-15 阿里巴巴集团控股有限公司 数据关系模型的生成方法、装置及设备
CN109542901A (zh) * 2018-11-12 2019-03-29 北京懿医云科技有限公司 数据处理方法、装置、计算机可读存储介质及电子设备
CN113015987A (zh) * 2018-11-29 2021-06-22 西门子股份公司 用于获得生产线的数据源的数据的方法和装置
CN110941629A (zh) * 2019-10-12 2020-03-31 中国平安财产保险股份有限公司 元数据处理方法、装置、设备及计算机可读存储介质
CN110941629B (zh) * 2019-10-12 2023-09-29 中国平安财产保险股份有限公司 元数据处理方法、装置、设备及计算机可读存储介质
CN111104405A (zh) * 2019-12-06 2020-05-05 苏州浪潮智能科技有限公司 一种元数据的处理方法、装置及计算机可读存储介质
CN111708801A (zh) * 2020-05-29 2020-09-25 北京金山云网络技术有限公司 报表生成方法、装置及电子设备
CN112817569A (zh) * 2021-02-06 2021-05-18 成都飞机工业(集团)有限责任公司 一种面向分析的数据快速映射方法、设备及存储介质
CN112817569B (zh) * 2021-02-06 2023-10-17 成都飞机工业(集团)有限责任公司 一种面向分析的数据快速映射方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN102591952A (zh) 基于语义的数据查询装置和基于语义的数据查询方法
CN107111617B (zh) 数据库中的图处理
Bloesch et al. ConQuer: a conceptual query language
US7716174B2 (en) System and method for planning and generating queries for multi-dimensional analysis using domain models and data federation
US8903805B2 (en) Method and system for performing query optimization using a hybrid execution plan
US20130173664A1 (en) Mapping non-relational database objects into a relational database model
US20030163461A1 (en) Method and system for defining sets by querying relational data using a set definition language
Comyn-Wattiau et al. Model driven reverse engineering of NoSQL property graph databases: The case of Neo4j
US20160232207A1 (en) Hierarchy modeling and query
JP2006172446A (ja) 複合データアクセス
CN104408171A (zh) 单据子表行关联查询装置和方法
Petermann et al. BIIIG: enabling business intelligence with integrated instance graphs
CN102591960A (zh) 农业经济电子地图数据服务接口方法
Vrgoc et al. MillenniumDB: a persistent, open-source, graph database
Park et al. Finding an efficient rewriting of OLAP queries using materialized views in data warehouses
US6745173B1 (en) Generating in and exists queries using tensor representations
US10642807B2 (en) Column store optimization using telescope columns
CN104050264A (zh) 一种生成sql语句的方法和装置
Ordonez et al. An er-flow diagram for big data
Sattler et al. Interactive example-driven integration and reconciliation for accessing database federations
Kwakye et al. Merging multidimensional data models: a practical approach for schema and data instances
CN108241624A (zh) 一种查询脚本的生成方法及装置
CN108363722B (zh) 一种煤矿数据存储方法及装置
Maowa A comparative study on big data handling using relational and non-relational data model
Szczepaniuk et al. Effectiveness of selected database models in management information systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120718