CN115794967B - 关系数据映射与语义本体同步生成方法及装置 - Google Patents

关系数据映射与语义本体同步生成方法及装置 Download PDF

Info

Publication number
CN115794967B
CN115794967B CN202310045254.4A CN202310045254A CN115794967B CN 115794967 B CN115794967 B CN 115794967B CN 202310045254 A CN202310045254 A CN 202310045254A CN 115794967 B CN115794967 B CN 115794967B
Authority
CN
China
Prior art keywords
semantic
information
target
file
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310045254.4A
Other languages
English (en)
Other versions
CN115794967A (zh
Inventor
马志辉
李翔
刘坤
王强
顾士业
王程珺
刘艺
杨国利
郑奇斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Big Data Advanced Technology Research Institute
Original Assignee
Beijing Big Data Advanced Technology Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Big Data Advanced Technology Research Institute filed Critical Beijing Big Data Advanced Technology Research Institute
Priority to CN202310045254.4A priority Critical patent/CN115794967B/zh
Publication of CN115794967A publication Critical patent/CN115794967A/zh
Application granted granted Critical
Publication of CN115794967B publication Critical patent/CN115794967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种关系数据映射与语义本体同步生成方法及装置,涉及计算机技术领域,该方法通过基于待处理数据源生成初始映射文件以及初始语义本体文件;待处理数据源中包含关系型数据;响应于用户对初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;语义定义操作用于将初始映射文件中的关系型数据的相关信息定义为语义信息;按照指定语义格式,从目标映射文件中提取关系型数据的目标语义信息并添加至初始语义本体文件中,以生成目标语义本体文件。这样,由于目标映射文件中已经包含了经过语义定义操作后的语义信息,只需用户的一次输入即可同步得到目标映射文件以及目标语义本体文件,提高了映射与语义本体的生成效率。

Description

关系数据映射与语义本体同步生成方法及装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种关系数据映射与语义本体同步生成方法及装置。
背景技术
随着计算机技术的发展,越来越多的用户选择使用领域本体的语义概念对数据知识进行描述,从而实现基于本体的数据访问(Ontology-Based Data Access,OBDA),而OBDA的实现往往依赖于映射文件以及语义本体文件。
而在现有的OBDA过程中,通常需要根据用户不同的输入分别构建映射文件以及语义本体文件,导致映射与语义本体的生成效率较差。
发明内容
本公开提供一种关系数据映射与语义本体同步生成方法及装置,以至少解决如何提高映射与语义本体的生成效率的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供了一种关系数据映射与语义本体同步生成方法,包括:
基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;
响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;
按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。
根据本公开实施例的第二方面,提供了一种关系数据映射与语义本体同步生成装置,包括:
初始文件生成模块,用于基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;
映射文件生成模块,用于响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;
语义本体文件生成模块,用于按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。
根据本公开实施例的第三方面,提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的方法。
根据本公开实施例的第四方面,提供了一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备执行如第一方面所述的方法。
根据本公开实施例的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括可读性程序指令,所述可读性程序指令由电子设备的处理器执行时,使得所述电子设备执行如第一方面所述的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:在本公开实施例中,通过基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。这样,由于目标映射文件中已经包含了经过语义定义操作后的语义信息,从而无需用户再对语义本体文件进行编辑或定义,只需用户的一次输入即可同步得到目标映射文件以及目标语义本体文件,提高了映射与语义本体的生成效率。同时,通过目标映射文件同步生成目标语义本体文件,还可以保证映射与语义本体的一致性,避免分别进行编辑所带来的失配问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种关系数据映射与语义本体同步生成方法的流程图;
图2是根据一示例性实施例示出的一种目标映射文件更新的流程图;
图3是根据一示例性实施例示出的一种用户提交配置指令的示意图;
图4是根据一示例性实施例示出的一种生成目标映射文件和目标语义本体文件的流程图;
图5是根据一示例性实施例示出的一种同步生成目标映射和目标语义本体文件的流程图;
图6是根据一示例性实施例示出的一种关系数据映射与语义本体同步生成装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种关系数据映射与语义本体同步生成方法的流程图,如图1所示,该方法可以包括以下步骤:
步骤101、基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据。
其中,上述待处理数据源可以是任一关系型数据库,例如,Oracle、MySQL、PostgreSql、DB2等,也可以是CSV等类关系型表格数据,其中,上述关系型数据指的是以关系模型来表示的数据,其通常以行和列的形式进行存储,可以理解为,关系型数据通常为一组数据表,且不同数据表间存在有关联关系。
其中,上述映射指的是关系型数据源到资源描述框架(Resource DescriptionFramework,RDF)之间的对应关系,通过映射可以实现关系型数据源中的数据与RDF格式的转换,相应地,上述映射文件指的是存储上述对应关系的文件。其中,语义本体简称本体,可以简单理解为数据所对应的业务领域中所代表的概念的含义,是数据在某个领域上的解释和逻辑表示,通常以网络本体语言(Web Ontology Language,OWL)进行描述,相应地,上述语义本体文件指的是用于存储语义本体的文件,也可简称为本体文件。
具体的,在数据领域中,对关系型数据源进行查询通常是以语义本体为参考,通过映射(Relation-RDF mapping, R2R映射)将用户的语义查询转译为数据系统上的结构化查询语言(Structured Query Language,SQL),实现基于本体的数据访问((Ontology-BasedData Access,OBDA),从而可以使有查询需求的业务领域用户从数据存储结构等低层次细节中解放出来,使其专注于业务语义本身。可以理解的,这样的查询方式需要依赖于映射以及语义本体来实现,因此,对于需要提供查询功能的关系型数据源,通常需要为其生成对应的映射文件和语义本体文件。
其中,上述初始映射文件以及初始语义本体文件是通过待处理数据源得到的,初始映射文件中可以包含数据源中各表的SQL获取方式(source)、RDF三元组(target)以及映射标识(mappingId)等信息,其中的信息均为数据源中的原始形式。上述初始语义本体文件中可以包含关系型数据在数据源中的原始命名。其中,上述三元组指的是对数据以主谓宾形式进行的描述,示例性地,对于一个被描述数据“老师”来说,其存在一个属性为姓名,该属性对应的数据值是Tom,从而可以得到被描述数据“老师”叫Tom。
具体的,可以通过预设的关系对象映射框架来读取上述待处理数据源中所存储的关系型数据,从而生成上述初始映射文件以及初始语义本体文件。
步骤102、响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息。
其中,上述用户可以是任一用户,可以是本领域的相关人员。上述语义定义操作可以理解为用户对初始映射文件的编辑操作,用户通过编辑操作可以对初始映射文件中的关系型数据的相关信息进行定义,将其定义为语义信息。可以理解的,语义信息指的是语义本体信息,语义本体信息是关系型数据在领域中的逻辑本体,用户通过本体信息可以专注于数据的语义本身,而无需关注数据存储结构等细节信息。进一步地,上述相关信息可以是关系型数据的名称。示例性地,以存在关系型数据的名称为“wr_code”为例,用户可以将其定义为“write”,从而可以建立数据“wr_code”与语义“write”之间的映射关系。
其中,上述指定映射格式指的是映射文件的生成规则,可以根据映射文件的类型进行设置。具体的,映射文件可以为OBDA文件,从而上述指定映射格式指的是OBDA文件的生成规则。
步骤103、按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。
其中,上述指定语义格式指的是语义本体文件的生成规则,可以根据语义本体文件的类型进行设置。具体的,语义本体文件可以为OWL文件,从而上述指定语义格式指的是OWL文件的生成规则。
具体的,上述目标语义信息指的是经过步骤102中的用户的语义定义操作后的语义信息,可以理解的,语义本体文件是用于向用户提供数据源对应的领域中的语义本体信息,使用户可以根据语义本体文件以及映射文件实现基于本体的数据查询或数据访问。而在上述步骤102中,通过用户对初始映射文件的语义定义操作,可以得到关于待处理数据源的语义信息,从而本公开实施例无需再对语义本体文件进行编辑或定义,可以直接将目标映射文件中的语义信息添加至上述初始语义本体文件中,从而得到与待处理数据源对应的目标语义本体文件。
具体的,上述提取操作可以通过预设的语义提取工具或语义提取接口来实现,本公开实施例对此不作限制。
综上所述,本公开实施例所提供的关系数据映射与语义本体同步生成方法,通过基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。这样,由于目标映射文件中已经包含了经过语义定义操作后的语义信息,从而无需用户再对语义本体文件进行编辑或定义,只需用户的一次输入即可同步得到目标映射文件以及目标语义本体文件,提高了映射与语义本体的生成效率。同时,通过目标映射文件同步生成目标语义本体文件,还可以保证映射与语义本体的一致性,避免分别进行编辑所带来的失配问题。
可选地,所述初始映射文件中的关系型数据包括类信息,上述响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件的操作,本公开实施例具体可以包括下述步骤:
步骤201、响应于所述用户对所述类信息的名称信息的第一定义指令,按照指定映射格式,将所述第一定义指令对应的名称语义信息,添加至所述初始映射文件的第一指定字段中,生成中间映射文件。
步骤202、基于所述中间映射文件生成所述目标映射文件。
其中,上述类信息指的是关系型数据的类别信息,上述第一定义指令指的是对类信息的名称信息的语义定义指令。本公开实施例可以通过接收用户对主语的第一定义指令,将原始的类名称定义为第一定义指令对应的名称语义信息。
具体的,本公开实施例可以通过初始映射文件向用户显示其中的类信息,从而上述第一定义指令可以是用户选择任一类信息并进行编辑操作后触发的,第一定义指令中可以包含类信息的名称信息以及用户定义后的名称语义信息。其中,上述第一指定字段指的是第一定义指令对应的类信息所在的字段,通常为三元组(target)中的主语字段。示例性地,用户通过选中类信息“wr_code”,并通过编辑schema:Author可以将“wr_code”定义为语义信息“Author”,进一步地,通过将“Author”添加至初始映射文件中“wr_code”对应的主语字段,得到:/{wr_code}/ a :Author ,即可完成对类信息“wr_code”的语义定义操作。
可选地,用户还可以对类信息的主语模板进行定义,示例性地,用户可以设定主语模板Template:author#{wr_code}/Binding:wr_code,其中,主语模板可以将对应的模板“author ”绑定至类信息“wr_code”上,从而在通过映射文件进行查询时,使用模板“author”代替“wr_code”进行展现。进一步地,上述主语模板可以与上述名称语义信息相同,当然,也可以不同,本公开实施例对此不作限制。
进一步地,上述中间映射文件指的是还未编辑完成的映射文件,具体的,可以在接收到用户的编辑完成指令时,将当前的中间映射文件作为目标映射文件,或者,也可以是在预设时长内未接收到用户的定义指令的情况下,将当前的中间映射文件作为目标映射文件,本公开实施例对此不作限制。
本公开实施例中,所述初始映射文件中的关系型数据包括类信息,通过响应于所述用户对所述类信息的名称信息的第一定义指令,按照指定映射格式,将所述第一定义指令对应的名称语义信息,添加至所述初始映射文件的第一指定字段中,生成中间映射文件;基于所述中间映射文件生成所述目标映射文件。这样,通过将第一定义指令对应的名称语义信息添加至初始映射文件的第一指定字段,可以完成对关系型数据中的类信息的语义定义,建立类信息的语义映射。
可选地,上述基于所述中间映射文件生成所述目标映射文件的操作,本公开实施例可以包括下述步骤:
步骤301、响应于所述用户对所述类信息对应的数据属性信息的选择操作,获取目标数据属性信息。
具体的,对于任一类信息,可以对应一个或多个数据属性,相当于是该类信息对应的不同属性维度。例如,“老师”可以对应有“姓名”、“年龄”以及“性别”等多个数据属性信息,在三元组中通常为谓语。上述选择操作指的是用户从类信息对应的数据属性信息中,选择目标数据属性信息的操作,可以理解为从数据表中选择目标列的操作。
相应地,上述目标数据属性信息指的是用户所选择的数据属性信息。具体的,用户对类信息进行语义定义之后,还可以进一步对类信息所对应的各数据属性信息依次进行语义定义。
步骤302、响应于所述用户对所述目标数据属性信息的名称信息的第二定义指令,按照所述指定映射格式,将所述第二定义指令对应的名称语义信息添加至所述初始映射文件的第二指定字段中,以生成所述目标映射文件。
其中,上述第二定义指令指的是对目标数据属性信息的名称信息的语义定义指令,上述数据属性信息指的是关系型数据的数据属性。本公开实施例可以通过接收用户对谓语的第二定义指令,将原始的目标数据属性名称定义为第二定义指令对应的名称语义信息。
具体的,本公开实施例可以通过初始映射文件向用户显示目标数据属性信息,从而上述第二定义指令可以是用户对目标数据属性信息的名称信息进行编辑操作后触发的,第二定义指令中可以包含目标数据属性信息的名称信息以及用户定义后的名称语义信息。其中,上述第二指定字段指的是第二定义指令对应的目标数据属性信息所在的字段,通常为三元组(target)中的谓语字段。示例性地,用户通过选中谓语信息“wr_name”,并进行编辑“Name”可以将“wr_name”定义为语义信息“Name”,进一步地,通过将“Name”添加至初始映射文件中“wr_name”对应的谓语字段,得到:name {wr_name},即可完成对目标数据属性信息“wr_name”的语义定义操作。
本公开实施例中,通过响应于所述用户对所述类信息对应的数据属性信息的选择操作,获取目标数据属性信息;响应于所述用户对所述目标数据属性信息的名称信息的第二定义指令,按照所述指定映射格式,将所述第二定义指令对应的名称语义信息添加至所述初始映射文件的第二指定字段中,以生成所述目标映射文件。这样,通过将第二定义指令对应的名称语义信息添加至初始映射文件的第二指定字段,可以完成对关系型数据中的数据属性信息的语义定义,建立数据属性信息的语义映射。
可选地,上述基于所述中间映射文件生成所述目标映射文件的操作,本公开实施例中还可以包括下述步骤:
步骤401、响应于所述用户对所述类信息对应的关联信息的选择操作,获取目标关联属性。
具体的,对于任一类信息,可以对应一个或多个关联属性,也可以称为对象属性,相当于是该类信息与其他类信息之间的关联信息。例如,“老师”分别和“学生”、“学校”之间存在“教学”和“就职”的关联属性,在三元组中通常为谓语。从而上述选择操作指的是用户从类信息对应的关联属性信息中,选择目标关联属性的操作。
相应地,上述目标关联属性指的是用户所选择的关联属性信息。具体的,用户对类信息进行语义定义之后,还可以进一步对类信息所对应的各关联属性信息依次进行语义定义。
步骤402、响应于所述用户对所述目标关联属性的名称信息的第三定义指令,按照所述指定映射格式,将所述第三定义指令对应的名称语义信息添加至所述初始映射文件的第三指定字段中,以生成所述目标映射文件。
其中,上述第三定义指令指的是对目标关联属性的名称信息的语义定义指令,上述目标关联属性指的是关系型数据的关联属性。本公开实施例可以通过接收用户对谓语的第三定义指令,将原始的目标关联属性名称定义为第三定义指令对应的名称语义信息。
具体的,本公开实施例可以通过初始映射文件向用户显示目标关联属性信息,从而上述第三定义指令可以是用户对目标关联属性的名称信息进行编辑操作后触发的,相应地,第三定义指令中可以包含目标关联属性的名称信息以及用户定义后的名称语义信息。其中,上述第三指定字段指的是第三定义指令对应的目标关联属性所在的字段,通常为三元组(target)中的谓语字段。示例性地,用户通过选中谓语信息“book_id”,并通过编辑“Write”可以将“book_id”定义为语义信息“Write”,进一步地,通过将“Write”添加至初始映射文件中“book_id”对应的谓语字段,得到:book/{bk_code}/ :Write :author/{wr_id}/ ,即可完成对目标关联属性“book_id”的语义定义操作。
本公开实施例中,通过响应于所述用户对所述类信息对应的关联属性信息的选择操作,获取目标关联属性;响应于所述用户对所述目标关联属性的名称信息的第三定义指令,按照所述指定映射格式,将所述第三定义指令对应的名称语义信息添加至所述初始映射文件的第三指定字段中,以生成所述目标映射文件。这样,通过将第三定义指令对应的名称语义信息添加至初始映射文件的第三指定字段,可以完成对关系型数据中的关联属性信息的语义定义,建立关联属性信息的语义映射。
可选地,本公开实施例具体还可以包括下述步骤:
步骤501、响应于所述用户的修改操作,对所述目标映射文件进行更新,以获取更新后的目标映射文件。
其中,上述修改操作指的是用户对目标映射文件进行重新编辑的操作,可以包括增加、修改或删除。具体的,可以通过接收用户请求目标映射文件的指令,将上述目标映射文件加载并显示给用户,使得用户可以对目标映射文件进行编辑修改操作。
具体的,上述编辑修改操作可以包括对类映射信息(类R2R映射)、数据属性映射信息(数据属性R2R映射)以及关系属性映射信息(关系属性R2R映射)的修改,从而可以根据用户的修改内容,在目标映射文件中对所修改的对应信息进行相应的修改,实现增量更新。
或者,也可以根据修改后的信息和目标映射文件,重新生成更新后的目标映射文件,实现全量更新,本公开实施例对更新的具体形式不作限制。
图2是根据一示例性实施例示出的一种目标映射文件更新的流程图,如图2所示,修改映射信息可以包括修改类映射、修改数据属性映射以及修改对象属性映射。其中,上述映射指的是R2R映射。
具体的,修改类映射可以包括设定主语模板和对象表名重定义,这与前述对初始映射文件中的类信息的定义操作相同,此处不再赘述。相应地,修改数据属性映射可以包括设定谓语内容和设置目标列,这与前述对初始映射文件中的数据属性信息的定义操作相同,此处也不再赘述。相应地,修改对象属性映射可以以包括设定谓语内容和设置目标对象属性内容,这与前述对初始映射文件中的关联属性信息的定义操作相同,此处也不再赘述。
进一步地,根据所修改的映射信息可以进行全量映射修改提交或增量映射修改提交。
步骤502、基于所述更新后的目标映射文件对所述目标语义本体文件进行更新,以获取更新后的目标语义本体文件。
进一步地,在得到更新后的目标映射文件后,可以根据目标映射文件的更新内容对目标语义本体文件中的既有内容进行改写,从而得到更新后的目标语义本体文件。
本公开实施例中,通过响应于所述用户的修改操作,对所述目标映射文件进行更新,以获取更新后的目标映射文件;基于所述更新后的目标映射文件对所述目标语义本体文件进行更新,以获取更新后的目标语义本体文件。这样,通过接收到用户的修改操作时,对目标映射文件进行更新,并基于更新后的目标映射文件对目标语义本体文件进行更新,可以根据用户的一次修改得到更新后的目标映射文件和目标语义本体文件,而无需分别进行修改,提高了映射与语义本体的修改效率。
可选地,上述从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中的操作,本公开实施例具体可以包括下述步骤:
步骤601、分别通过预设类接口、预设数据属性接口以及预设关系属性接口从所述目标映射文件中提取类信息的语义信息、数据属性信息的语义信息以及关联属性信息的语义信息,并添加至所述初始语义本体文件中的对应字段中。
其中,上述预设类接口、预设数据属性接口以及预设关系属性接口可以由任一语义提取工具或软件提供,可以理解的,预设类接口可以用于提取类信息的语义信息,预设数据属性接口可以用于提取数据属性信息的语义信息,相应地,预设关系属性接口可以用于提取关系属性信息的语义信息。
具体的,上述不同接口可以从目标映射文件中识别出不同的语义信息进行提取,同时按照OWL文件的格式要求识别出各语义信息在初始语义本体文件中的对应字段,并按照OWL文件的格式要求分别添加至对应字段中,从而得到上述目标语义本体文件。
本公开实施例中,分别通过预设类接口、预设数据属性接口以及预设关系属性接口从所述目标映射文件中提取类信息的语义信息、数据属性信息的语义信息以及关联属性信息的语义信息,并添加至所述初始语义本体文件中的对应字段中。这样,通过预设的不同接口可以从目标映射文件中提取出对应的语义信息,并将其添加至初始语义本体文件的对应字段中,从而可以根据目标映射文件得到目标语义本体文件,而无需对映射文件和语义本体文件分别进行编辑或定义操作,提高映射与语义本体的生成效率。
可选地,本公开实施例具体还可以包括下述步骤:
步骤701、接收所述用户的配置指令,以基于所述配置指令获取所述待处理数据源;所述配置指令中至少包括所述待处理数据源的类型信息以及登录信息。
其中,上述配置指令中可以包括待处理数据源的类型信息,可以是Oracle、MySQL、PostgreSql、DB2等关系型数据库。具体的,根据上述类型信息还可以得到数据源的驱动信息以及连接信息,从而通过驱动信息与连接信息得到上述待处理数据源。例如,当数据源为Oracle时,可以获取驱动信息为oracle.jdbc.OracleDriver,连接信息为jdbc:oracle:thin:@//${oracle.url}:${ oracle.port}/${oracle.db}。当数据源MySQL数据库时,可以得到驱动信息为com.mysql.jdbc.Driver,连接信息为jdbc:mysql://${mysql.url}:${mysql.port}/${mysql.db},可以理解的,本公开实施例只是示出了几种数据源的类型信息以及对应的驱动信息和连接信息,还可以是其他数据源,使用其它关系型数据源也有相应的驱动和连接配置,具体可以根据实际需求自行设置和获取。
其中,上述登录信息指的是可以登录待处理数据源的权限信息,可以包括账户和密码。可选地,当待处理数据源为数据库时,上述配置指令中还可以包括数据库的地址信息。
本公开实施例中,通过接收所述用户的配置指令,以基于所述配置指令获取所述待处理数据源;所述配置指令中至少包括所述待处理数据源的类型信息以及登录信息,可以获取到与用户的配置指令相对应的数据源,从而可以生成满足用户需求的映射文件以及语义本体文件。
图3是根据一示例性实施例示出的一种用户提交配置指令的示意图,如图3所示,其中,选择数据源指的是用户通过触发选择数据源的控件或指令,以开启对数据源的选择操作,进入选择操作后,用户可以通过选择数据源类型进入填写配置信息的操作,从而可以通过填写驱动信息、连接池信息(连接信息)、账户以及密码来完成配置,最后,可以通过提交配置来发送上述配置指令,以基于配置指令将与配置信息对应的数据源作为待处理数据源。
可选地,由于OBDA数据服务系统通常需要处理较大的数据量,且数据结构较为复杂,对于内存、性能、并发查询的要求较高,因此本公开实施例可以在获取待处理数据源之前,采用企业级的数据管理软件来搭建数据服务,将数据服务部署在企业级服务器上,示例性地,该服务器的参数可以不小于16核CPU,内存32GB,SSD硬盘1TB。相应地,本公开实施例所提供的关系数据映射与语义本体同步生成方法可以基于上述企业级服务器来实现。
进一步地,本公开实施例在得到目标映射文件以及目标语义本体文件后,还可以接收用户输入的查询语句,从而将目标映射文件以及目标语义本体文件加载到内存中,根据查询需求进行匹配,实时生效用户的R2R映射修改内容,实现查询语句所指示的查询需求,实现基于本体的数据查询(OBDA)。
进一步地,本公开实施例所提供的关系数据映射与语义本体同步生成方法在实际应用场景中,可以向用户提供人机交互界面,从而用户可以通过人机交互界面输入类别R2R映射、数据属性R2R映射、对象属性R2R映射修改信息。
图4是根据一示例性实施例示出的一种生成目标映射文件和目标语义本体文件的流程图,如图4所示,可以包含下述步骤:
步骤211、搭建基于本体的数据服务系统。
其中,上述基于本体的数据服务系统指的是OBDA数据服务系统,也就是可以实现基于本体的数据访问的数据服务系统。
步骤212、设置待处理数据源。
其中,上述待处理数据源指的是OBDA数据源。
步骤213、生成初始映射文件以及初始语义本体文件。
步骤214、编辑映射关系。
其中,上述映射指的是R2R映射。具体的,本步骤可以通过实时接收用户的编辑指令来进行,可以包括对初始映射文件的编辑,还可以包括对目标映射文件的修改。
步骤215、同步生成目标映射和目标语义本体文件。
步骤216、根据用户的修改操作,对目标映射和目标语义本体文件进行增量更新。
步骤217、响应用户的查询需求。
其中,关于上述步骤215,图5是根据一示例性实施例示出的一种同步生成目标映射和目标语义本体文件的流程图,如图5所示,同步生成目标映射和目标语义本体文件实际上可以是根据用户对映射信息的编辑操作,先生成映射文件,进而可以根据已生成的映射文件对初始化语义本体文件(即,初始语义本体文件)进行改写,从而得到重新生成的语义本体文件,也就是目标语义本体文件。
具体的,同步生成指的是用户只需对映射信息进行编辑即可,也就是,用户根据一个输入,即可得到两个输出(目标映射文件以及目标语义本体文件),从而实现了两者的同步生成。
需要说明的是,基于本体的数据访问 (OBDA,Ontology-BasedData Access)已成为一种访问和集成数据源流行的范式。在这种范式中,数据源通常是关系型数据库或CSV类关系型数据表,OBDA以语义本体为参考通过R2R映射(即Relation-RDF mapping,关系到R2R映射)的方式对数据进行虚拟化,将其呈现为由RDF三元组构成的语义图谱。用户可以使用语义查询来实现高效的知识挖掘与信息获取。在查询时,OBDA系统以本体为参考,将用户查询转译为数据库系统上的SQL查询,将业务领域用户从数据存储结构等低层次细节中解放出来,使之能够专注业务语义本身,但当前的OBDA工具在R2R映射生成和语义本体的构建过程上是完全割裂的两个步骤,一方面为较为繁重的本体建模任务增加了额外的工作量,另一方面也容易造成R2R映射与语义本体之间的失配,而本公开实施例通过前述步骤可以基于用户所输入的映射信息同时得到目标映射文件与目标语义本体文件,在减少工作量的同时,由于目标语义本体文件是基于目标映射文件得到的,还可以一定程度上保证R2R映射与语义本体之间的匹配。
图6是根据一示例性实施例示出的一种关系数据映射与语义本体同步生成装置的框图,如图6所示,该装置80可以包括:
初始文件生成模块801,用于基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;
映射文件生成模块802,用于响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;
语义本体文件生成模块803,用于按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。
可选地,所述初始映射文件中的关系型数据包括类信息,所述映射文件生成模块802,包括:
第一语义添加子模块,用于响应于所述用户对所述类信息的名称信息的第一定义指令,按照指定映射格式,将所述第一定义指令对应的名称语义信息,添加至所述初始映射文件的第一指定字段中,生成中间映射文件;
目标映射文件生成子模块,用于基于所述中间映射文件生成所述目标映射文件。
可选地,所述目标映射文件生成子模块,包括:
数据属性获取子模块,用于响应于所述用户对所述类信息对应的数据属性信息的选择操作,获取目标数据属性信息;
第二语义添加子模块,用于响应于所述用户对所述目标数据属性信息的名称信息的第二定义指令,按照所述指定映射格式,将所述第二定义指令对应的名称语义信息添加至所述初始映射文件的第二指定字段中,以生成所述目标映射文件。
可选地,所述目标映射文件生成子模块,还包括:
关联属性获取子模块,用于响应于所述用户对所述类信息对应的关联属性信息的选择操作,获取目标关联属性;
第三语义添加子模块,用于响应于所述用户对所述目标关联属性的名称信息的第三定义指令,按照所述指定映射格式,将所述第三定义指令对应的名称语义信息添加至所述初始映射文件的第三指定字段中,以生成所述目标映射文件。
可选地,所述装置80还包括:
第一更新模块,用于响应于所述用户的修改操作,对所述目标映射文件进行更新,以获取更新后的目标映射文件;
第二更新模块,用于基于所述更新后的目标映射文件对所述目标语义本体文件进行更新,以获取更新后的目标语义本体文件。
可选地,所述语义本体文件生成模块803,具体用于:分别通过预设类接口、预设数据属性接口以及预设关系属性接口从所述目标映射文件中提取类信息的语义信息、数据属性信息的语义信息以及关联属性信息的语义信息,并添加至所述初始语义本体文件中的对应字段中。
可选地,所述装置80还包括:
配置模块,用于接收所述用户的配置指令,以基于所述配置指令获取所述待处理数据源;所述配置指令中至少包括所述待处理数据源的类型信息以及登录信息。
综上所述,本公开实施例提供的关系数据映射与语义本体同步生成装置,通过基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;按照指定语义格式,从所述目标映射文件中提取所述关系型数据的目标语义信息并添加至所述初始语义本体文件中,以生成目标语义本体文件。这样,由于目标映射文件中已经包含了经过语义定义操作后的语义信息,从而无需用户再对语义本体文件进行编辑或定义,只需用户的一次输入即可同步得到目标映射文件以及目标语义本体文件,提高了映射与语义本体的生成效率。同时,通过目标映射文件同步生成目标语义本体文件,还可以保证映射与语义本体的一致性,避免分别进行编辑所带来的失配问题。
根据本公开的一个实施例,提供了一种电子设备,包括:处理器、用于存储处理器可执行指令的存储器,其中,处理器被配置为执行时实现如上述任一个实施例中的关系数据映射与语义本体同步生成方法中的步骤。
根据本公开的一个实施例,还提供了一种存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述任一个实施例中的关系数据映射与语义本体同步生成方法中的步骤。
根据本公开的一个实施例,还提供了一种计算机程序产品,该计算机程序产品包括可读性程序指令,可读性程序指令由电子设备的处理器执行时,使得电子设备能够执行如上述任一个实施例中的关系数据映射与语义本体同步生成方法中的步骤。
本公开所涉及的用户信息(包括但不限于用户的设备信息、用户个人信息等)、相关数据等均为经用户授权或经各方授权后的信息。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (4)

1.一种关系数据映射与语义本体同步生成方法,其特征在于,所述方法包括:
基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;
响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;所述关系型数据包括类信息;
按照指定语义格式,分别通过预设类接口、预设数据属性接口以及预设关系属性接口从所述目标映射文件中提取类信息的语义信息、数据属性信息的语义信息以及关联属性信息的语义信息,并添加至所述初始语义本体文件中的对应字段中,以生成目标语义本体文件;
所述响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件,包括:
响应于所述用户对所述类信息的名称信息的第一定义指令,按照指定映射格式,将所述第一定义指令对应的名称语义信息,添加至所述初始映射文件的第一指定字段中,生成中间映射文件;
基于所述中间映射文件生成所述目标映射文件;
所述基于所述中间映射文件生成所述目标映射文件,包括:
响应于所述用户对所述类信息对应的数据属性信息的选择操作,获取目标数据属性信息;
响应于所述用户对所述目标数据属性信息的名称信息的第二定义指令,按照所述指定映射格式,将所述第二定义指令对应的名称语义信息添加至所述初始映射文件的第二指定字段中,以生成所述目标映射文件;
所述基于所述中间映射文件生成所述目标映射文件,还包括:
响应于所述用户对所述类信息对应的关联属性信息的选择操作,获取目标关联属性;
响应于所述用户对所述目标关联属性的名称信息的第三定义指令,按照所述指定映射格式,将所述第三定义指令对应的名称语义信息添加至所述初始映射文件的第三指定字段中,以生成所述目标映射文件。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述用户的修改操作,对所述目标映射文件进行更新,以获取更新后的目标映射文件;
基于所述更新后的目标映射文件对所述目标语义本体文件进行更新,以获取更新后的目标语义本体文件。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述用户的配置指令,以基于所述配置指令获取所述待处理数据源;所述配置指令中至少包括所述待处理数据源的类型信息以及登录信息。
4.一种关系数据映射与语义本体同步生成装置,其特征在于,所述装置包括:
初始文件生成模块,用于基于待处理数据源生成初始映射文件以及初始语义本体文件;所述待处理数据源中包含关系型数据;
映射文件生成模块,用于响应于用户对所述初始映射文件的语义定义操作,按照指定映射格式,生成目标映射文件;所述语义定义操作用于将所述初始映射文件中的关系型数据的相关信息定义为语义信息;所述关系型数据包括类信息;
语义本体文件生成模块,用于按照指定语义格式,分别通过预设类接口、预设数据属性接口以及预设关系属性接口从所述目标映射文件中提取类信息的语义信息、数据属性信息的语义信息以及关联属性信息的语义信息,并添加至所述初始语义本体文件中的对应字段中,以生成目标语义本体文件;
所述映射文件生成模块,包括:
第一语义添加子模块,用于响应于所述用户对所述类信息的名称信息的第一定义指令,按照指定映射格式,将所述第一定义指令对应的名称语义信息,添加至所述初始映射文件的第一指定字段中,生成中间映射文件;
目标映射文件生成子模块,用于基于所述中间映射文件生成所述目标映射文件;
所述目标映射文件生成子模块,包括:
数据属性获取子模块,用于响应于所述用户对所述类信息对应的数据属性信息的选择操作,获取目标数据属性信息;
第二语义添加子模块,用于响应于所述用户对所述目标数据属性信息的名称信息的第二定义指令,按照所述指定映射格式,将所述第二定义指令对应的名称语义信息添加至所述初始映射文件的第二指定字段中,以生成所述目标映射文件;
所述目标映射文件生成子模块,还包括:
关联属性获取子模块,用于响应于所述用户对所述类信息对应的关联属性信息的选择操作,获取目标关联属性;
第三语义添加子模块,用于响应于所述用户对所述目标关联属性的名称信息的第三定义指令,按照所述指定映射格式,将所述第三定义指令对应的名称语义信息添加至所述初始映射文件的第三指定字段中,以生成所述目标映射文件。
CN202310045254.4A 2023-01-30 2023-01-30 关系数据映射与语义本体同步生成方法及装置 Active CN115794967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310045254.4A CN115794967B (zh) 2023-01-30 2023-01-30 关系数据映射与语义本体同步生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310045254.4A CN115794967B (zh) 2023-01-30 2023-01-30 关系数据映射与语义本体同步生成方法及装置

Publications (2)

Publication Number Publication Date
CN115794967A CN115794967A (zh) 2023-03-14
CN115794967B true CN115794967B (zh) 2023-07-21

Family

ID=85429191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310045254.4A Active CN115794967B (zh) 2023-01-30 2023-01-30 关系数据映射与语义本体同步生成方法及装置

Country Status (1)

Country Link
CN (1) CN115794967B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100590621C (zh) * 2007-10-29 2010-02-17 浙江大学 本体模式与关系数据库模式之间语义映射信息的编辑方法
US8489649B2 (en) * 2010-12-13 2013-07-16 Oracle International Corporation Extensible RDF databases
CN103049555B (zh) * 2012-12-30 2016-03-02 中国人民解放军国防科学技术大学 保证语义正确性的动态分层集成数据访问方法
CN105138526B (zh) * 2014-05-30 2019-02-22 国际商业机器公司 用于为关系型数据库自动生成语义映射的方法和系统
CN114385670A (zh) * 2022-01-17 2022-04-22 暨南大学 复杂产品变型设计的案例推理方法
CN114547168B (zh) * 2022-01-27 2022-09-20 大连理工大学 基于虚拟知识图谱的精细化工安全生产数据融合与重构方法

Also Published As

Publication number Publication date
CN115794967A (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
CN112199086B (zh) 自动编程控制系统、方法、装置、电子设备及存储介质
US20090138430A1 (en) Method for assembly of personalized enterprise information integrators over conjunctive queries
CN108027818A (zh) 基于图的查询
US20140181154A1 (en) Generating information models in an in-memory database system
US9746932B2 (en) Gesture inferred vocabulary bindings
CN111753075B (zh) 客服机器人问答数据的创建方法、装置和计算机设备
US8881127B2 (en) Systems and methods to automatically generate classes from API source code
US20190339950A1 (en) Task ui layout representing semantical relations
US9646004B2 (en) Hierarchical database report generation with automated query generation for placeholders
US20080263142A1 (en) Meta Data Driven User Interface System and Method
CN117909355A (zh) 数据库查询指令生成方法、装置、计算机设备、存储介质
US20080263018A1 (en) Method and System for Mapping Business Objects to Relational Database Tables
CN111666355B (zh) 一种领域、数据、场景三层模型的模型构建方法及装置
US11940964B2 (en) System for annotating input data using graphs via a user interface
US10942732B1 (en) Integration test framework
US20230252700A1 (en) System for ontological graph creation via a user interface
CN108766513B (zh) 一种智慧健康医疗数据结构化处理系统
CN110222047A (zh) 一种动态表单生成方法和装置
CN117931852A (zh) 一种基于自然语言处理的智能查询和可视化方法
Radescu et al. New Database Manipulation Tools in the Easy-Learning On-Line Platform.
CN117851375A (zh) 元数据模型优化方法和计算设备
CN116737113B (zh) 面向海量科学数据的元数据目录管理系统及方法
CN115794967B (zh) 关系数据映射与语义本体同步生成方法及装置
Musleh et al. Automatic generation of android SQLite database components
US20190147082A1 (en) Reporting and data governance management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant