CN101405729B - 具有增量式视图维护的映射体系结构 - Google Patents

具有增量式视图维护的映射体系结构 Download PDF

Info

Publication number
CN101405729B
CN101405729B CN2007800099443A CN200780009944A CN101405729B CN 101405729 B CN101405729 B CN 101405729B CN 2007800099443 A CN2007800099443 A CN 2007800099443A CN 200780009944 A CN200780009944 A CN 200780009944A CN 101405729 B CN101405729 B CN 101405729B
Authority
CN
China
Prior art keywords
view
renewal
database
data
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800099443A
Other languages
English (en)
Other versions
CN101405729A (zh
Inventor
A·阿达雅
J·A·布莱克利
P-A·拉森
S·梅尔尼克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101405729A publication Critical patent/CN101405729A/zh
Application granted granted Critical
Publication of CN101405729B publication Critical patent/CN101405729B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Machine Translation (AREA)

Abstract

提供包括用于将如可由应用程序使用的数据映射到如持久保存在数据库中的数据的映射体系结构的数据访问体系结构。映射体系结构使用两种类型的映射视图——帮助转换查询的查询视图以及帮助转换更新的更新视图。可使用增量式视图维护在应用程序与数据库之间转换数据。

Description

具有增量式视图维护的映射体系结构
背景
将应用程序与数据库连接起来一直是个问题。在1996年,Carey和DeWitt概括了为什么众多技术,包括面向对象数据库和持久编程语言在内,由于查询和更新处理、事务吞吐量和缩放性而没有被普遍接受。他们推测对象关系(O/R)数据库在2006年将占据统治地位。实际上,
Figure G2007800099443D0001092032QIETU
数据库系统包括在常规关系引擎上方使用硬连线O/R映射的内置对象层。然而,这些系统提供的O/R特征看上去除多媒体和空间数据类型以外,很少用于存储企业数据。原因有数据和厂商独立、移植传统数据库的成本、当业务逻辑在数据库内而非中间层内运行时的超范围问题、以及与编程语言的集成不足。
自1990年中期以来,客户机侧数据映射层由于因特网应用程序的增长而得以普及。这样的层的核心功能在于提供展示了严格对准应用程序的数据模型、由显式映射驱动的可更新视图。众多商业产品和开放源代码项目开始提供这些能力。基本上每个企业框架提供客户机侧持久层(例如,J2EE中的EJB)。大多数封装的业务应用程序,诸如ERP和CRM应用程序,包括专有数据访问接口(例如,SAP R/3中的BAPI)。
一种广泛使用的用于
Figure G2007800099443D0001092105QIETU
的开放源代码对象关系映射(ORM)框架是
Figure G2007800099443D0001092114QIETU
。它支持多个继承映射场景、乐观并发控制以及综合对象服务。Hibernate的最新版本遵循EJB3.0标准,它包括Java持久查询语言。在商品化方面,流行的ORM包括Oracle TopLink
Figure G2007800099443D0001092132QIETU
和LLBLGen
Figure 2007800099443100002G2007800099443D0001092132QIETU
。后者在.NET平台上运行。这些和其它ORM与其目标编程语言的对象模型紧密耦合。
BEA
Figure 2007800099443100002G2007800099443D0001092132QIETU
近来引入了称为AquaLogic Data Services Platform
Figure 2007800099443100002G2007800099443D0001092132QIETU
(ALDSP,AquaLogic数据服务平台)。它使用XML模式来对应用程序数据建模。使用XQquery从数据库和web服务汇编XML数据。ALDSP的运行时支持对多个数据源的查询,并执行客户机侧查询优化。更新被执行为对XQuery视图的视图更新。如果更新不具有唯一的转换,则开发员需要使用命令性的代码来覆盖更新逻辑。ALDSP的编程面基于服务数据对象(SDO)。
今天的客户机侧映射层提供各种不同程度的能力、健壮性和所有权的总成本。一般,应用程序和ORM所使用的数据库工件(artifact)之间的映射具有模糊的语义,并驱动逐个情况的推理。场景驱动实现限制了所支持的映射的范围,且通常产生难以扩展的脆弱的运行时。很少数据访问解决方案利用由数据库社区开发的数据变换技术,且通常依赖于自组织的解决方案来查询和更新转换。
数据库研究贡献了可用于构建持久层的众多强大的技术。然而,存在显著的间隙。最关键的间隙之一是支持通过映射的更新。与查询相比,更新难以处理得多,因为它们需要跨映射保持数据一致性,可能会触发业务规则等。因此,商品化数据库系统和数据访问产品对可更新视图提供非常有限的支持。近来,研究者转向了替换方法,诸如双向变换。
传统上,概念建模限于数据库和应用程序设计、反向工程和模式转换。众多设计工具使用UML。仅最近的概念建模开始渗入产业强度(industry-strength)数据映射解决方案。例如,实体和关系的概念加在ALDSP和EJB3.0两者的表面。ALDSP将E-R型联系覆盖在复杂类型的XML数据上方,而EJB3.0允许使用类注释指定对象之间的关系。
模式映射技术用于众多数据集成产品,诸如Microsoft
Figure 2007800099443100002G2007800099443D0001092132QIETU
的BizTalkServer
Figure 2007800099443100002G2007800099443D0001092132QIETU
、IBM
Figure 2007800099443100002G2007800099443D0001092132QIETU
的Rational Data Architect
Figure 2007800099443100002G2007800099443D0001092132QIETU
以及ETL
Figure 2007800099443100002G2007800099443D0001092132QIETU
工具。这些产品允许开发员设计数据变换或从映射中编译它们以转换电子商务消息或加载数据仓库。
概述
提供了用于实现和使用包括映射体系结构的数据访问体系结构的系统、方法和计算机可读介质,该映射体系结构用于将如可由应用程序使用的数据映射到如在数据库中保存的数据。在一个实施例中,映射体系结构使用两种类型的映射视图——帮助转换查询的查询视图以及帮助转换更新的更新视图。增量式的视图维护可用于在应用程序和数据库之间转换数据。以下描述其它方面和实施例。
附图简述
将参考附图进一步描述根据本发明的用于具有增量式视图维护的映射体系结构的系统和方法,附图中:
图1示出了如此所构想的示例性实体框架的体系结构。
图2示出了示例性关系模式。
图3示出了示例性实体数据模型(EDM)模式。
图4示出了实体模式(左)和数据库模式(右)之间的映射。
图5示出了按照对实体模式和关系模式的查询表示的映射。
图6示出了映射编译器为图5中的映射生成的双向视图——查询和更新视图。
图7示出了用于利用物化视图维护算法来通过双向视图传播更新的过程。
图8示出了映射设计器用户界面。
图9示出了编译用映射规范语言(MSL)指定的映射以生成查询和更新视图。
图10示出了更新处理。
图11示出了对象关系(OR)映射器的示例性逻辑部分。
图12示出了当处理用MSL规范指定的映射时由实体数据平台(EDP)生成查询和更新视图。
图13示出了在查询转换中使用QM视图。
图14示出了在更新转换中使用UM视图。
图15示出了映射视图的编译时和运行时处理。
图16示出了视图编译过程中各个组件的交互。
图17示出了EDP查询转换器(EQT)体系结构。EQT利用映射元数据来将查询从对象/EDM空间转换到数据库空间。
图18示出了构成各种Δ表达式以根据对象的Δ表达式获得表的Δ表达式。
详细描述
新颖的数据访问体系结构
在一个实施例中,本发明可在如本章节中所述的新颖的数据访问体系结构——“实体框架”内实现,并包括其各方面。这样的实体框架的示例有由MICROSOFT
Figure 2007800099443100002G2007800099443D0001092132QIETU
公司开发的ADO.NET vNEXT
Figure 2007800099443100002G2007800099443D0001092132QIETU
数据访问体系结构。以下是对ADO.NETvNEXT数据访问体系结构以及众多实现专用细节的一般描述,它们不应被认为是实现本发明所必需的。
概观
传统的客户机—服务器应用将对其数据的查询和持久操作转交给数据库系统。数据库系统对行和表形式的数据进行操作,而应用程序按照(类、结构等)等更高级编程语言构造来对数据操作。应用程序和数据库层之间的数据操纵服务中的阻抗失配甚至在传统系统中也是成问题的。随着面向服务的体系结构(SOA)、应用程序服务器和多层应用程序的出现,对与编程环境有良好集成并且能在任何层中操作的数据访问和操纵服务的需求也大量增长。
微软的ADO.NET实体框架是用于针对将抽象级从关系级提升到概念(实体)级从而显著减少了应用程序和数据中心服务的阻抗失配的数据进行编程的平台。实体框架、总体系统体系结构和底层技术的各个方面将在以下描述。
介绍
现代应用程序要求所有层中的数据管理服务。它们需要日益丰富的各种形式的数据,这不仅包括结构化业务数据(诸如,顾客和订单)而且还包括半结构化和非结构化内容,诸如电子邮件、日历、文件和文档。这些应用程序需要集成来自多个数据源的数据以及收集、净化、变换和存储该数据以启用更灵活的决策过程。这些应用程序的开发员需要数据访问、编程和开发工具来增加其生产率。尽管关系数据库已经成为大多数结构化数据实际上的存储,但在这样的数据库所展示的数据模型(及能力)与应用程序所需的建模能力之间往往存在失配——即公知的阻抗失配问题。
另有两个因素在企业系统设计中也扮演了重要的角色。首先,应用程序的数据表示与底层数据库的数据表示往往不同地演化。其次,众多系统由具有不同程度的能力的不同数据库后端组成。中间层的应用程序逻辑负责调和这些不同并表示更统一的数据视图的数据变换。这些数据变换很快变得复杂。尤其当底层数据需要可更新时,实现它们是一个难题,并对应用程序增加了复杂性。应用程序开发的相当部分——在某些情况下高达40%——专用于编写定制数据访问逻辑以便围绕这些问题进行工作。
对数据中心服务也存在相同且一样严重的问题。常规的服务,诸如查询、更新和事务在逻辑模式(关系)级实现。然而,大量较新的服务,诸如复制和分析,最好在一般与较高级的概念数据模型相关联的工件上操作。例如,SQL
Figure G2007800099443D00061
复制发明了被称为“逻辑记录”的结构来表示有限形式的实体。类似地,SQL Server报告服务在被称为语义数据模型语言(SDML)的实体型数据模型的顶部构建报告。这些服务中的每一个具有定制工具来定义概念实体并将其向下映射到关系表——顾客实体从而将需要按照一路用于复制,另一路用于报告构建还有一路用于其它分析服务等的方式被定义和映射。与应用程序一样,每一服务通常以构建该问题的定制解决方案而告终,且因此在这些服务之间存在代码重复和有限的互操作性。
对象到关系映射(ORM)技术,诸如HIBERNATE
Figure 2007800099443100002G2007800099443D0001092132QIETU
和ORACLE TOPLINK
Figure 2007800099443100002G2007800099443D0001092132QIETU
是定制数据访问逻辑的流行的替换方案。数据库与应用程序之间的映射以定制结构或经由模式注释来表达。这些定制结构可能看起来像概念模型;然而,应用程序不能直接针对该概念模型进行编程。尽管映射在数据库与应用程序之间提供了某一程度的独立性,但这些解决方案并未良好解决处理具有相同数据稍有不同的视图的多个应用程序(例如,考虑想要查看顾客实体的不同投影的两个应用程序)或对倾向于更加动态的服务的需求(先验类生成技术不能良好用于数据服务,因为底层数据库演化得更快)的问题。
ADO.NET实体框架是显著减少应用程序和数据中心服务的阻抗失配的用于针对数据进行编程的平台。它至少在以下方面区别于其它系统和解决方案:
1.实体框架定义一丰富概念数据模型(实体数据模型即EDM)以及在该模型的实例上操作的新数据操纵语言(实体SQL)。与SQL一样,EDM是基于值的,即EDM定义实体的结构方面而非行为(或方法)。
2.该模型由包括支持强大的查询和更新双向(EDM-关系)映射的中间件映射引擎的运行时具体化。
3.应用程序和服务可直接针对基于值的概念层或针对可层叠在概念(实体)抽象上的编程语言专用对象抽象来编程,提供ORM型功能。我们相信,与对象相比,基于值的EDM概念抽象是用于在应用程序和数据中心服务之间共享数据的更灵活的基础。
4.最后,实体框架利用了采用查询表达式来本机扩展编程语言的微软的新语言集成查询(LINQ)技术以进一步减少,对某些情形甚至完全消除应用程序的阻抗失配。
ADO.NET实体框架可并入更大的框架,诸如微软的.NET框架。
数据访问体系结构的描述的其余部分,在ADO.NET实体框架实施例的上下文中,被如下组织。“动机”章节提供了实体框架的附加动机。“实体框架”章节提供了实体框架和实体数据模型。“编程模式”章节描述了实体框架的编程模式。“对象服务”章节概括了对象服务模块。“映射”章节关注实体框架的映射组件,而“查询处理”和“更新处理”章节说明了如何处理查询和更新。“元数据”和“工具”描述了实体框架的元数据子系统和工具组件。
动机
该章节讨论了为何较高级数据建模层对应用程序和数据中心服务变为必需的。
数据应用程序中的信息级
当今用于数据库设计的主要信息建模方法将信息模型分解成四个主要的级:物理、逻辑(关系)、概念和编程/表示。
物理模型描述了数据在物理资源,诸如存储器、电线或盘中如何表示。在此层讨论的概念的词汇包括记录格式、文件分区和分组、堆以及索引。物理模型对应用程序一般是不可见的——对物理模型的改变不应影响应用程序逻辑,但可能影响应用程序执行。
逻辑数据模型是目标域的完全且精确的信息模型。关系模型是大多数逻辑数据模型的选择的表示。在逻辑级讨论的概念包括表、行、主键/外键约束和规范化。尽管规范化帮助实现数据一致性、增加的并发性和更好的OLTP性能,但它也对应用程序引入显著的挑战。逻辑级的规范化数据通常太过细碎,应用程序逻辑需要将来自多个表的行汇编成更加类似于应用程序域的工件的较高层实体。
概念模型从问题域及其关系捕捉核心信息实体。公知的概念模型有由Peter Chen在1976年引入的实体关系模型。UML是更新近的概念模型的示例。大多数应用程序在应用程序开发生命周期的早期涉及概念设计阶段。然而,不幸的是,概念数据模型示意图保持“钉在墙上”,随时间与应用程序实现的实际情况日益脱节。实体框架的一个重要目的在于使得概念数据模型(由在下一章节中描述的实体数据模型体现)成为数据平台的具体的可编程的抽象。
编程/表示模型描述了概念模型的实体和关系需要如何基于手头的任务以不同形式显示(表示)。某些实体需要被变换成编程语言对象以实现应用程序业务逻辑;其它的实体需要被变换成XML流用于web服务调用;还有其它的实体出于用户界面数据绑定目的而需要被变换成存储器内结构,诸如列表或字典。自然地,不存在通用编程模型或表示形式,因此,应用程序需要灵活的机制将实体变换成各种表示形式。
大多数的应用程序和数据中心服务想要按照诸如订单的高级概念而非关于在关系数据库模式中对其规范化订单的若干表来思考。订单可将其自己在表示/编程级上显示为封装与订单相关联的状态和逻辑的VisualBasic或C#中的类实例或用于与web服务通信的XML流。不存在一个正确的表示模型,然而提供具体的概念模型,然后能够使用该模型作为对各个表示模型的和其它较高级数据服务的灵活映射的基础是有价值的。
应用程序和服务的演化
基于数据的应用程序在10-20年前一般被结构化为数据单块;具有在逻辑模式级由与数据库系统交互的带有由动宾功能(例如,创建—订单、更新—顾客)分解的逻辑的封闭系统。若干重要的趋势造就了今天分解和部署现代的基于数据的应用程序的方式。这其中主要有面向对象分解、服务级应用程序组成以及较高层数据中心服务。概念实体是当今应用程序的重要部分。这些实体必须被映射到各种表示,并绑定至各种服务。不存在一个正确的表示或服务绑定:XML、关系和对象表示都是重要的,但没有一个能满足所有的应用程序。从而,存在对支持较高级数据建模层且也允许多个表示层插入的框架的需求——实体框架的目标在于满足这些要求。
数据中心服务也以类似方式演化。20年前“数据平台”提供的服务是最小的,且围绕RDBMS的逻辑模式。这些服务包括查询和更新、原子事务以及诸如备份和加载/提取的大块操作。
SQL Server本身从传统的RDBMS演化成对在概念模式级实现的实体提供多个高价值数据中心服务的完全数据平台。SQL Server产品中的若干较高级数据中心服务,例如复制、报告构建器,越来越多地在概念模式级提供其服务。当前,这些服务中的每一个具有描述概念实体并将其向下映射至底层逻辑模式级的单独工具。实体框架的目标在于提供所有这些服务可共享的通用的高级概念抽象。
实体框架
在本文所述的实体框架之前存在的微软的ADO.NET框架是允许应用程序连接至数据存储并以各种方式操纵包含在其中的数据的数据访问技术。它是微软.NET框架的一部分,且它与.NET框架类库的其余部分高度集成。之前的ADO.NET框架具有两个主要部分:提供者和服务。ADO.NET提供者是了解如何与特定数据存储对话的组件。提供者由三个核心功能组成:连接管理对底层数据源的访问;命令表示要针对数据源执行的命令(查询、过程调用等);而数据读取器表示命令执行的结果。ADO.NET服务包括提供者中立的组件,诸如允许离线数据编程场景的DataSet(数据集)。(DataSet是无论数据源是什么都提供一致关系编程模型的数据驻留在存储器上的表示。)
实体框架——概观
ADO.NET实体框架构建在之前存在的ADO.NET提供者模型上,并添加了以下功能:
1.帮助构建概念模式的新概念数据模型,实体数据模型(EDM)。
2.操纵EDM的实例的新数据操纵语言(DML)实体SQL,以及与不同的提供者通信的查询的程序表示(规范命令树)。
3.定义概念模式和逻辑模式之间的映射的能力。
4.针对概念模式的ADO.NET提供者编程模型。
5.提供ORM型功能的对象服务层。
6.使得易于针对如来自.NET语言的对象的数据编程的与LINQ技术的集成。
实体数据模型
实体数据模型(EDM)允许开发丰富数据中心应用程序。它用来自E-R域的概念扩展经典关系模型。在此处提供的示例性实施例中,EDM中的组织概念包括实体和关系。实体表示具有身份的顶级项目,而关系用于使两个或多个实体相关(或描述其间关系)。
在一个实施例中,EDM是如同关系模型(和SQL)一样基于值的,而非C#(CLR)一样基于对象/引用的。可容易地在EDM上方层叠若干对象编程模型。类似地,EDM可映射到一个或多个DBMS实现供持久保存。
EDM和实体SQL表示更丰富的数据模型和数据平台的数据操纵语言,且旨在允许诸如CRM和ERP的应用程序,诸如报告、业务智能、复制和同步的数据密集服务以及数据密集应用程序在更接近其需求的结构和语义级别上建模和操纵数据。现在讨论关于EDM的各个概念。
EDM类型
EntityType(实体类型)描述实体的结构。实体可具有描述实体的结构的零个或多个属性(性质、字段)。另外,实体类型必须定义键——其值在实体的集合内唯一标识该实体实例的一组属性。实体类型可从另一实体类型(或子类型)导出——EDM支持单继承模型。实体的属性可以是简单或复杂类型的。SimpleType(简单类型)表示标量(或原子)类型(例如,整数、串),而ComplexType(复杂类型)表示结构化属性(例如,地址)。ComplexType由零个或多个属性组成,它们本身可以是标量或复杂类型的属性。Relationship Type(关系类型)描述两个(或多个)实体类型之间的关系。EDM模式提供类型的分组机制——必须按照模式定义类型。与类型名组合的模式的名空间唯一标识特定类型。
EDM实例模型
实体实例(或简称为实体)在逻辑上被包含在EntitySet(实体集)内。EntitySet是实体的同质集合,即EntitySet中的所有实体必须具有相同(或派生的)EntityType。EntitySet在概念上类似于数据库表,而实体类似于表的行。实体实例必须恰好属于一个实体集。以类似方式,关系实例在逻辑上被包含在RelationshipSet(关系集)内。RelationshipSet的定义为关系确定范围。即,它标识了持有参与关系的实体类型的实例的EntitySet。RelationshipSet在概念上类似于数据库中的链接表。Simpl eType和ComplexType仅可被实例化为EntityType的属性。EntityContainer(实体容器)是EntitySet和RelationshipSet的逻辑分组——类似于模式是EDM类型的分组机制。
示例EDM模式
以下示出示例EDM模式:
<?xml version=″1.0″encoding=″utf-8″?>
<Schema Namespace=″AdventureWorks″Alias=″Self″...>
 <EntityContainer Name=″AdventureWorksContainer″>
  <EntitySet Name=″ESalesOrders″
               EntityType=″Self.ESalesOrder″/>
  <EntitySet Name=″ESalesPersons″
               EntityType=″Self.ESalesPerson″/>
  <AssociationSet Name=″ESalesPersonOrders″
            Association=″Self.ESalesPersonOrder″>
  <End Role=″ESalesPerson″
         EntitySet=″ESalesPersons″/>
  <End Role=″EOrder″EntitySet=″ESalesOrders″/>
 </AssociationSet>
</EntityContainer>
<!—销售订单类型分层结构-->
<Entity Type Name=″ESalesOrder″Key=″Id″>
 <Property Name=″Id″Type=″Int32″
             Nullable=″false″/>
 <Property Name=″AccountNum″Type=″String″
             MaxLength=″15″/>
  </EntityType>
  <EntityType Name=″EStoreSalesOrder″
               BaseType=″Self.ESalesOrder″>
  <Property Name=″Tax″Type=″Decimal″
               Precision=″28″Scale=″4″/>
</EntityType>
<!—个人实体类型-->
<EntityType Name=″ESalesPerson″Key=″Id″>
 <!--Propertiesfrom SSalesPersons table-->
 <Property Name=″Id″Type=″Int32″
             Nullable=″false″/>
 <Property Name=″Bonus″Type=″Decimal″
             Precision=″28″Scale=″4″/>
 <!--Propertiesfrom SEmployees table-->
 <Property Name=″Title″Type=″String″
             MaxLength=″50″/>
 <Property Name=″HireDate″Type=″DateTime″/>
 <!--Propertiesfrom the SContacts table-->
 <Property Name=″Name″Type=″String″
             MaxLength=″50″/>
 <Property Name=″Contact″Type=″Self.ContactInfo″
             Nullable=″false″/>
</EntityType>
<ComplexType Name=″ContactInfo″>
 <Property Name=″Email″Type=″String″
             MaxLength=″50″/>
 <Property Name=″Phone″Type=″String″
             MaxLength=″25″/>
 </ComplexType>
 <Association Name=″ESalesPersonOrder″>
  <End Role=″EOrder″Type=″Self.ESalesOrder″
        Multiplicity=″*″/>
  <End Role=″ESalesPerson″Multiplicity=″1″
        Type=″Self.ESalesPerson″/>
 </Association>
</Schema>
高级体系结构
该章节概括了ADO.NET实体框架的体系结构。其主要功能组件在图1示出,并包括以下:
数据源专用提供者。实体框架100在ADO.NET数据提供者模型上构建。存在用于诸如SQL Server151、152、关系源153、非关系154和Web服务155源的若干数据源的专用提供者122-125。提供者122-125可从存储专用ADO.NET提供者API121调用。
EntityClient(实体客户机)提供者。EntityClient提供者110表示具体的概念编程层。它是新的基于值的数据提供者,其中按照EDM实体和关系来访问数据,且使用基于实体的SQL语言(实体SQL)来查询和更新。EntityClient提供者111形成实体数据服务110包的一部分,该包还包括元数据服务112、查询和更新流水线113、事务支持115、视图管理器运行时116以及支持平面关系表上的可更新EDM视图的视图映射子系统114。表和实体之间的映射经由映射规范语言来声明地指定。
对象服务和其它编程层。实体框架100的对象服务组件131提供实体上的丰富对象抽象、这些对象上的丰富的服务集,并允许应用程序使用熟悉的编程语言构造在命令性编码体验161中编程。该组件提供对象的状态管理服务(包括改变跟踪、身份解析),支持用于导航和加载对象和关系的服务,使用诸如Xlinq132的组件支持经由LINQ和实体SQL的查询,并允许更新和持久保存对象。
实体框架允许类似于130的多个编程层插到由EntityClient提供者111所展示的基于值的数据服务层110上。对象服务131组件是覆盖在CLR对象表面并提供ORM型功能的一个这样的编程层。
元数据服务112组件为实体框架100的设计时和运行时需求管理元数据,并对实体框架应用。经由元数据接口展示与EDM概念(实体、关系、EntitySet、RelationshipSet)、存储概念(表、列、约束)以及映射概念相关联的所有元数据。元数据组件112也用作支持模型驱动应用程序设计的域建模工具之间的链接。
设计和元数据工具。实体框架100与域设计器170集成以启用模型驱动的应用程序开发。工具包括EDM设计工具、建模工具171、映射设计工具172、浏览设计工具173、绑定设计工具174、代码生成工具175和查询建模器。
服务。可使用实体框架100构建诸如报告141、同步142、Web服务143和业务分析的丰富数据中心服务。
编程模式
ADO.NET实体框架与LINQ一起通过显著减少应用程序代码与数据之间的阻抗失配来增加应用程序开发员的生产率。在本章节中,讨论在逻辑、概念和对象抽象层上的数据访问编程模式的演化。
考虑以下基于示例AdventureWorks(企业工作)数据库的关系模式片段。该数据库由SContacts(联系人)201、SEmployees(雇员)202,SSalesPersons(销售员)203以及SSalesOrders(销售订单)204表组成,它们遵循如图2所示的关系模式。
SContacts(ContactId(联系人Id),Name(名字),Email(电子邮件),Phone(电话))
SEmployees(EmployeeId(雇员Id),Title(职位),HireDate(雇佣日期))
SSalesPersons(SalesPersonId(销售员Id),Bonus(奖金))
SSalesOrders(SalesOrderId(销售订单Id),SalesPersonId)
考虑获取在某一日期之前雇佣的销售员的名字和雇佣日期的应用程序代码片段(以下示出)。在该代码片段中存在与需要回答的业务问题几乎无关的四个主要的缺点。首先,即使查询可用英语非常简洁地陈述,但SQL语句相当冗长,且需要开发员了解规范化的关系模式以制定从SContacts、SEmployees和SSalesPerson表收集适当列所需的多表联接。另外,对底层数据库模式的任何改变将需要对以下代码片段的相应改变。其次,用户必须定义至数据源的显式连接。第三,由于所返回的结果不是强类型的,对非存在列名的任何引用将仅在执行查询之后才会被发觉。第四,SQL语句对命令API是串属性,且其表述中的任何错误将仅在执行时发现。尽管该代码是使用ADO.NET2.0编写的,但代码模式及其缺点适用于任何其它关系数据访问API,诸如ODBC、JDBC或OLE-DB。
void EmpsByDate(Date Time date){
using(SqlConnection con=
  new SqlConnection(CONN_STRING)){
    con.Open();
    SqlCommand cmd=con.CreateCommand();
    cmd.CommandText=@″
    SELECT SalesPersonID,FirstName,HireDate
    FROM SSalesPersons sp
     INNER JOIN SEmployees e
     ON sp.SalesPersonID=e.EmployeeID
     INNER JOIN SContacts c
     ON e.EmployeeID=c.ContactID
    WHERE e.HireDate<@date″;
    cmd.Parameters.AddWithValue(″@date″,date);
   DbDataReader r=cmd.ExecuteReader();
   while(r.Read()){
    Console.WriteLine(″{0:d}:\t{1}″,
     r[″HireDate″],r[″FirstName″]);
}}}
如图3中所示,示例关系模式可经由EDM模式在概念级捕捉。它定义从SContacts201、SEmployees202和SSalesPersons203表片段抽出的实体类型ESalesPerson(销售员)302。它也捕捉EStoreOrder(商店订单)301与ESalesOrder(销售订单)303实体类型之间的继承关系。
概念层上的等效程序编写如下:
void EmpsByDate(DateTime date){
using(EntityConnection con=
  new EntityConnection(CONN_STRING)){
    con.Open();
    EntityCommand cmd=con.CreateCommand();
    cmd.CommandText=@″
    SELECT VALUE sp
    FROM ESalesPersons sp
    WHERE sp.HireDate<@date″;
    cmd.Parameters.AddWithValue(″date″,
        date);
    DbDataReader r=cmd.ExecuteReader(
             CommandBehavior.SequentialAccess);
   while(r.Read()){
    Console.WriteLine(″{0:d}:\t{1}″,
      r[″HireDate″]],r[″FirstName″])
   }}}
SQL语句被相当程度地简化了——用户不再必须了解精确的数据库布局。而且,应用程序逻辑可与对底层数据库模式的改变分离。然而,该片段仍是基于串的,仍不能获得编程语言类型检查的好处,且返回弱类型结果。
通过在实体周围添加薄对象包装,并使用C#的语言集成查询(LINQ)扩展,可如下重新编写没有阻抗失配的等效函数:
void EmpsByDate(DateTime date){
  using(AdventureWorksDB aw=
    new AdventureWorksDB()){
    var people=from p in aw.SalesPersons
           where p.HireDate<date
           select p;
    foreach(SalesPerson p in people){
      Console.WriteLine(″{0:d}\t{1}″,
        p.HireDate,p.FirstName);
}}}
该查询是简单的;应用程序(大部分)与对底层数据库模式的改变分离;且查询由C#编译器进行完全的类型检查。除查询以外,可与对象交互并对于对象执行常规的创建、读、更新和删除(CRUD)操作。这些的示例将在更新处理章节描述。
对象服务
对象服务组件是概念(实体)层上的编程/表示层。它容纳便于编程语言与基于值的概念层实体之间的交互的若干组件。我们期望对每个编程语言运行时(例如,.NET、Java)存在一个对象服务。如果它被设计成支持.NET CLR,则使用任何.NET语言的程序可与实体框架交互。对象服务由以下主要组件组成:
ObjectContext(对象上下文)类容纳数据库连接、元数据工作空间、对象状态管理器以及对象物化器(materializer)。该类包括允许制定实体SQL或LINQ句法的查询的对象查询接口ObjectQuery<T>,并返回如ObjectReader(对象读取器)<T>的强类型对象结果。ObjectContext也展示编程语言层与概念层之间的查询和更新(即,SaveChanges(保存改变))对象级接口。对象状态管理器具有三个主要的功能:(a)高速缓存查询结果,提供身份解析,并管理融合来自重叠的查询结果的对象的策略,(b)跟踪存储器中的改变,以及(c)构造更新处理基础架构的改变列表输入。对象状态管理器在高速缓存中维护每一实体的状态——(从高速缓存)分离、添加、无改变、修改和删除——并跟踪其状态转移。对象物化器在查询和更新期间在来自概念层的实体值与相应的CLR对象之间执行变换。
映射
在一个实施例中,诸如ADO.NET实体框架的通用数据访问层的主干可以是在应用程序数据与存储在数据库中的数据之间建立关系的映射。应用程序在对象或概念级查询和更新数据,且这些操作经由映射被转换到存储。存在必须由任一映射解决方案解决的多个技术挑战。构建使用一对一映射以将关系表中的每一行展示为对象的ORM是相对直接的,尤其当不需要声明性数据操纵时。然而,随着更复杂的映射、基于集合的操作、性能、多DBMS厂商支持和其它要求的介入,自组织解决方案迅速变得难以控制。
问题:经由映射更新
经由映射访问数据的问题是按照“视图”建模,即客户机层中的对象/实体可被视为表行上的丰富视图。然而,如公知的,仅有限的一类视图是可更新的,例如商业数据库系统不允许对包含联接或并的视图中的多个表进行更新。由于视图的更新行为固有地低于规范,即使在相当简单的视图上找到唯一的更新转换也是几乎不可能的。研究显示,从视图中挑出更新语义是困难的,且可能要求相当的用户专门技能。然而,对映射驱动的数据访问,对视图的每个更新存在良好定义的转换是有利的。
而且,在映射驱动的情形中,可更新性要求超出单个视图。例如,操纵顾客和订单实体的业务应用程序针对两个视图有效地执行操作。有时,一致的应用程序状态仅可通过同时更新若干视图来实现。这样的更新的逐个情况的转换可产生更新逻辑的组合激增。将其实现委托给应用程序开发员是不令人满意的,因为它要求他们手动应付数据访问的最复杂的部分之一。
ADO.NET映射方法
ADO.NET实体框架支持旨在解决以上挑战的革新性的映射体系结构。它采用以下想法:
1.指定:使用良好定义语义并使大量映射情形能为非专家用户所及的声明性语言来指定映射。
2.编译:映射被编译成驱动运行时引擎中的查询和更新处理的双向视图,被称为查询和更新视图。
3.执行:使用利用物化视图维护(一种健壮的数据库技术)的通用机制进行更新转换。查询转换使用视图展开。
新映射体系结构允许以有原则、防过时的方式构建一堆强大的映射驱动技术。而且,它打开了即时实践相关性的有意思的研究方向。以下子章节示出映射的指定和编译。以下在查询处理和更新处理章节中考虑执行。如此处所提供的示例性映射体系结构的其它方面和实施例将在以下题为“其它方面和实施例”的章节中描述。
映射的指定
使用一组映射片段来指定映射。每一映射片段是Q实体=Q表形式的约束,其中Q实体是对实体模式的查询(应用程序侧),而Q表是对数据库模式的查询(存储侧)。映射片段描述实体数据的一部分如何对应于关系数据的一部分。即,映射片段是指定中可独立于其它片段理解的基本单位。
为了示出,考虑图4中的实例映射情形。图4示出了实体模式(左)和数据库模式(右)之间的映射。映射可使用XML文件或图形工具定义。实体模式对应于本文中实体数据模型章节中的一个实体模式。在存储侧,存在四个表:SSalesOrders(销售订单)、SSalesPersons(销售员)、SEmployees(雇员)以及SContacts(联系人)。在实体模式侧,存在两个实体集:ESalesOrder(销售订单)和ESalesPersons(销售员)以及一个关联集ESalesPersonOrders(销售员订单)。
如图5所示,按照对实体模式和关系模式的查询表示映射。
在图5中,片段1表明ESalesOrders中确切类型为ESalesOrder(销售订单)的所有实体的(Id,AccountNum(帐号))值的集合等于从SSalesOrders表中检索的IsOnline(是否在线)为true(真)的值的(SalesOrderId(销售订单Id),AccountNum)的集合。片段2是类似的。片段3将关联集ESalesPersonOrders映射到SSalesOrders表,并表明每一关联实体条目对应于该表中每一行的主键、外键对。片段4、5和6表明ESalesPersons实体集中的实体跨三个表SSalesPersons、SContacts、SEmployees划分。
双向视图
映射被编译成驱动运行时的双向实体SQL视图。查询视图按照表来表示实体,而更新视图按照实体来表示表。
更新视图可能有点违反直觉,因为它们按照虚拟构造指定持久数据,但如下所示,它们可用于适度地(elegant)支持更新。所生成的视图以良好定义的意义“关注”映射,且具有以下属性(注意,表示稍被简化——具体地,持久状态不是完全由虚拟状态定义的):
实体=查询视图(表)
表=更新视图(实体)
实体=查询视图(更新视图(实体))
最后一个条件是往返准则,这确保所有实体数据可按照无损方式从数据库持久保存和重新汇编。包括在实体框架中的映射编译器保证所生成的视图满足往返准则。如果不能从输入映射中产生这样的视图,则它提出错误。
图6示出了映射编译器为图5中的映射生成的双向视图——查询和更新视图。一般,视图可比输入映射复杂得多,因为它们显式指定所需的数据变换。例如,在QV1中,ESalesOrders实体集从SSalesOrders表中构造,使得ESalesOrder或EStoreSalesOrder中的任一个根据IsOnline标志是否为真而实例化。为了从关系表中重新汇编ESalesPersons实体集,需要在SSalesPersons、SEmployees和SContacts表之间执行联接(QV3)。
手写满足往返准则的查询和更新视图是棘手的,要求相当的数据库专门知识,从而实体框架的本实施例仅接受由内建映射编译器产生的视图,尽管接受由其它编译器或手动产生的视图在替换实施例中当然是有可能的。
映射编译器
实体框架包含从EDM模式、存储模式和映射(映射工件在本文中的元数据章节中讨论)生成查询和更新视图的映射编译器。这些视图由查询和更新流水线消费。可在设计时或运行时,当针对EDM模式执行第一个查询时调用编译器。编译器中所使用的视图生成算法基于用于精确重写的使用视图回答查询(answering-queries-using-views)技术。
查询处理
查询语言
在一个实施例中,实体框架可被设计成用于多种查询语言。此处更详细描述实体SQL和LINQ实施例,但可以理解相同或相似的原理可扩展到其它实施例。
实体SQL
实体SQL是设计成查询和操纵EDM实例的SQL的派生物。实体SQL按照以下方式扩展标准SQL。
1.对EDM构造(实体、关系、复杂类型等)的本机支持:构造器、成员访问器、类型询问、关系导航、嵌套/取消嵌套等。
2.名字空间。实体SQL使用名空间作为类型和函数的分组构造(类似于XQuery和其它编程语言)。
3.可扩展函数。实体SQL不支持内建函数。所有函数(最小、最大、子串等)在名空间中外部定义,且通常从底层存储导入到查询。
4.与SQL相比,对子查询和其它构造更为正交的对待。
实体框架例如可支持实体SQL作为EntityClient提供者层以及对象服务组件中的查询语言。在本文的编程模式章节中示出示例实体SQL查询。
语言集成查询(LINQ)
语言集成查询即LINQ是.NET编程语言中对诸如C#和Visual Basic的主流编程语言引入查询相关构造的革新。查询表达式不由外部工具或语言预处理器处理,相反是语言本身的第一类表达式。LINQ允许查询表达式受益于丰富元数据、编译时句法检查、静态类型和之前仅可用于命令性代码的IntelliSense(智能感知)。LINQ定义一组通用标准查询操作符,它们允许遍历、过滤、联接、投影、分类和分组操作以便用任何基于.NET的编程语言以直接且声明性的方式表达。诸如VisualBasic和C#的.NET语言也支持查询综合(querycomprehension)——利用标准查询操作符的语言句法扩展。使用C#的LINQ的示例查询在本文的编程模式章节中示出。
规范命令树
在一个实施例中,规范命令树(或简称为命令树)可以是实体框架中所有查询的程序性(树)表示。经由实体SQL或LINQ表示的查询可首先被解析和转化成命令树;可对命令树执行所有后续处理。实体框架也可允许经由命令树构造/编辑API来动态构造(或编辑)查询。命令树可表示查询、插入、更新、删除和过程调用。命令树由一个或多个表达式组成。表达式仅表示某种计算——实体框架可提供各种表达式,包括常量、参数、算术运算、关系运算(投影、过滤、联接等)、函数调用等。最后,命令树可用作EntityClient提供者与底层存储专用提供者之间的查询的通信手段。
查询流水线
在实体框架的一个实施例中,查询执行可委托给数据存储。实体框架的查询处理基础架构负责将实体SQL或LINQ查询分解成一个或多个可由底层存储评估的基本的仅关系的查询以及附加汇编信息,这些信息可用于将较简单查询的平面结果改造成较丰富的EDM结构。
实体框架可例如假设存储必须支持类似于SQL Server 2000的能力。查询可分解成适合该配置的较简单的平面关系查询。实体框架的其它实施例可允许存储承担大部分的查询处理。
典型的查询可如下处理。
句法和语义分析。实体SQL查询首先使用来自元数据服务组件的信息来解析和语义分析。LINQ查询被解析和分析,作为适当语言编译器的一部分。
转化成规范命令树。现在将查询转化成命令树,而不考虑它原始如何表示和确认。
映射视图展开。实体框架中的查询的目标为概念(EDM)模式。这些查询必须被转换以引用底层数据库表和视图。该过程被称为映射视图展开,类似于数据库系统中的视图展开机制。EDM模式和数据库模式之间的映射被编译成查询和更新视图。然后在用户查询中展开查询视图——查询现在的目标是数据库表和视图。
结构化类型消除。现在从查询中消除对结构化类型的所有引用,并将其添加到重新汇编信息(以引导结果汇编)。这包括对类型构造器、成员访问器、类型询问表达式的引用。
投影修剪。查询被分析,查询中未被引用的表达式被消除。
嵌套拔起。使查询中的任何嵌套操作(构造嵌套集合)对于仅包含平面关系操作符的子树逼近查询树的根部。一般,嵌套操作被变换成左外联接(或外部应用),且来自随后查询的平面结果然后被重新汇编(见以下的结果汇编)成适当的结果。
变换。应用一组试探变换以简化查询。这些包括过滤下推、应用至联接转化、情况表达式折叠等。在该阶段消除冗余联接(自联接、主键、外键联接)。注意,此处查询处理基础架构不执行任何基于成本的优化。
转换成提供者专用命令。查询(即,命令树)现在被转交给提供者以产生提供者专用命令,可能用提供者的本机SQL方言。称此步骤为SQLGen(SQL生成)。
执行。执行提供者命令。
结果汇编。来自提供者的结果(DataReaders(数据读取器))然后使用之前收集的汇编信息被改造成适当的形式,且将单个DataReaders返回给调用者。
物化。对经由对象服务组件发出的查询,结果然后被物化成适当的编程语言对象。
SQLGen
如在之前章节中所述,查询执行可被委托给底层存储。在这样的实施例中,查询必须首先被转换成适于存储的形式。然而,不同的存储支持SQL的不同方言,且实体框架本机支持所有这些方言是不实际的。相反,查询流水线可将命令树形式的查询移交给存储提供者。存储提供者然后可将命令树转换成本机命令。这可通过将命令树转换成提供者的本机SQL方言来完成——因此,为该阶段使用术语SQLGen。然后可执行得到的命令来产生相关结果。
更新处理
本章节描述如何在示例性ADO.NET实体框架中执行更新处理。在一个实施例中,更新处理存在两个阶段:编译时和运行时。在本文提供的双向视图章节中,描述了将映射指定编译成视图表达式的集合的过程。本章节描述如何在运行时利用这些视图表达式以将在对象层执行的对象修改(或EDM层的实体SQLDML更新)转换成关系层的等效SQL更新。
经由视图维护的更新
在示例性ADO.NET映射体系结构中采用的见识之一是物化视图维护算法可用于通过双向视图传播更新。该过程在图7中示出。
数据库内的表,如图7右侧所示,保存持久数据。如图7左侧所示,EntityContainer表示该持久数据的虚拟状态,因为一般仅EntitySet中一小部分实体在客户机上物化。目标在于将实体状态上的更新Δ实体转换成表的持久状态上的更新Δ表。该过程被称为增量视图维护,因为更新是基于表示实体所改变的方面的更新Δ实体来执行的。
这可使用以下两个步骤来完成:
1.视图维护:
Δ表=Δ更新视图(实体,Δ实体)
2.视图展开:
Δ表=Δ更新视图(查询视图(表),Δ实体)
在步骤1中,将视图维护算法应用于更新视图。这产生一组Δ表达式Δ更新视图,这告诉我们如何从Δ实体和实体的快照获取Δ表。由于后者未在客户机上完全物化,在步骤2中,使用视图展开来将Δ表达式与查询视图组合。这些步骤一起生成将初始数据库状态和对实体的更新作为输入的表达式,并计算对数据库的更新。
该方法产生用于一次一个对象和基于组的更新(即,使用数据操纵语句表达的)清楚、统一的算法,并利用健壮数据库技术。在实践中,步骤1通常足以用于更新转换,因为众多更新不直接取决于当前数据库状态;在这些情况中,令Δ表=Δ更新视图(Δ实体)如果给定Δ实体作为对高速缓存的实体的一组一次一个对象修改,则步骤1可通过对经修改的实体直接执行视图维护算法而非计算Δ更新视图表达式来进一步优化。
转换对象的更新
为了示出以上概括的方法,考虑以下示例,其中向在公司工作至少5年的合格的销售员给予奖金和提升。
using(AdventureWorksDB aw=
new AdventureWorksDB(...)){
  //至少雇佣5年的人
  Datetime d=DateTime.Today.AddYears(-5);
  var people=from p in aw.SalesPeople
        where p.HireDate<d
        select p;
  foreach(SalesPerson p in people){
    if(HRWebService.ReadyForPromotion(p)){
       p.Bonus+=10;
       p.Title=″Senior Sales Representative″;
    }
  }
  aw.SaveChanges();//将改变推送到数据库
}
AdventureWorksDB(企业工作数据库)是从被称为ObjectContext的普通对象服务类导出的工具生成的类,它容纳数据库连接、元数据工作空间以及对象高速缓存数据结构并展示SaveChanges方法。如在对象服务章节中所述,对象高速缓存维护实体的列表,其中每一个实体处于以下状态之一中:(从高速缓存)分离、添加、无改变、修改和删除。以上代码片段描述了修改ESalesPerson对象分别存储在SEmployees和SSalesPersons表的职位和奖金属性的更新。由对SaveChanges方法的调用触发的将对象更新变换成相应的表更新的过程可包括以下四个步骤:
改变列表生成。从对象高速缓存为每个实体集创建一个改变列表。更新被表示为删除和插入元素的列表。添加的对象成为插入。删除的对象成为删除。
值表达式传播。该步骤取得改变列表和更新视图(保存在元数据工作空间中),并使用增量物化视图维护表达式Δ更新视图,将对象改变的列表变换成针对底层受影响的表的代数基表插入和删除表达式的序列。对此示例,相关更新视图为图6中所示的UV2和UV3。这些视图是简单的投影选择查询,因此应用视图维护规则是直截了当的。获取以下Δ更新视图表达式,它们对于插入(Δ+)和删除(Δ-)是相同的:
    ΔSSalesPersons=    SELECT p.Id,p.Bonus
FROM ΔESalesPersons AS p
    ΔSEmployees=       SELECT p.Id,p.Title
FROMΔESalesPersons AS p
    ΔSContacts=  SELECT  p.Id,  p.Name,  p.Contact.Email,
p.Contact.Phone FROMΔESalesPersons AS p
假定以上示出的循环将实体E=ESalesPersons(1,20,″″,″Alice″,Contact(″a@sales″,NULL))更新为E=ESalesPersons(1,30,″Senior…(高级…)″,″Alice″,Contact(″a@sales″,NULL))。然后,初始Δ对插入是Δ+ESalesOrders={E},对删除是Δ-ESalesOrders={E}。得到Δ+SSalesPersons={(1,30)},Δ-SSalesPersons={(1,20)}。计算得到的对SSalesPersons表的插入和删除然后被组合成令Bonus(奖金)值为30的单个更新。类似计算对SEmployees的Δ。对SContacts,得到Δ+SContacts=Δ-SContacts,因此不需要更新。
除了计算对受影响的基表的Δ以外,该阶段负责(a)对必须执行表更新的次序正确定序,考虑引用完整性约束,(b)在向数据库提交最终更新之前检索所需的存储生成的键以及(c)收集用于乐观并发控制的信息。
SQL DML或存储过程调用生成。该步骤将插入和删除的Δ加上与并发处理有关的附加注释变换成SQL DML语句或存储过程调用的序列。在该示例中,为受影响的销售员生成的更新语句是:
BEGIN TRANSACTION
UPDATE[dbo].[SSalesPersons]SET[Bonus]=30
WHERE[SalesPersonID]=1
UPDATE[dbo].[SEmployees]
SET[Title]=N′Senior Sales Representative′
WHERE[EmployeeID]=1
END TRANSACTION
高速缓存同步。一旦执行了更新,高速缓存的状态就与数据库的新状态同步。因此,如有需要,执行小型查询处理步骤以将新修改的关系状态变换成其相应的实体和对象状态。
元数据
元数据子系统类似于数据库目录,且被设计成满足实体框架的设计时和运行时元数据需求。
元数据工件
元数据工件可例如包括以下:
概念模式(CSDL文件):概念模式可在CSDL(概念模式定义语言)文件中定义,并包含EDM类型(实体类型、关系)和描述应用程序对数据的概念视图的实体集。
存储模式(SSDL文件):存储模式信息(表、列、键等)可使用CSDL词汇术语来表达。例如,EntitySets表示表,而属性表示列。这些可在SSDL(存储模式定义语言)文件中定义。
C-S映射指定(MSL文件):在映射指定中,一般在MSL文件(映射指定语言)中捕捉概念模式与存储模式之间的映射。该指定由映射编译器用于产生查询和更新视图。
提供者清单:提供者清单可提供每一提供者所支持的功能的描述,且可包括以下示例性信息:
1.提供者所支持的原语类型(varchar、int等),以及它们所对应的EDM类型(string、int32等)。
2.提供者的内建函数(及其签名)。
该信息可由实体SQL解析器使用作为查询分析的一部分。除这些工件之外,元数据子系统也可跟踪生成的对象类,以及这些和相应的概念实体类型之间的映射。
元数据服务体系结构
实体框架所消费的元数据可来自不同格式的不同源。元数据子系统可建立在一组统一的低级元数据接口上,这些接口允许元数据运行时独立于不同元数据持久格式/源的细节工作。
示例性元数据服务可包括:
不同类型的元数据的枚举。
按键进行的元数据搜索。
元数据浏览/导航。
瞬态元数据的创建(例如,用于查询处理)。
会话无关的元数据高速缓存和重用。
元数据子系统包括以下组件。元数据高速缓存,高速缓存从不同源检索到的元数据并向消费者提供检索和操纵元数据的通用API。由于元数据可用不同形式表示,并存储在不同位置,元数据子系统可有利地支持加载器接口。元数据加载器实现加载器接口,并负责从适当的源(CSDL/SSDL文件等)加载元数据。元数据工作空间聚集若干元数据来向应用程序提供完整的元数据集。元数据工作空间一般包含关于概念模型、存储模式、对象类以及这些构造之间的映射的信息。
工具
在一个实施例中,实体框架也可包括设计时工具的集合来增加开发生产率。示例性工具有:
模型设计器:应用程序开发的早期步骤之一是定义概念模型。实体框架允许应用程序设计者和分析者按照实体和关系来描述其应用程序的主要概念。模型设计器是允许该概念建模任务交互式执行的工具。设计的工件在可将其状态持久保存在数据库中的元数据组件中直接捕捉。模型设计器也可生成和消费模型描述(经由CSDL指定),并可从关系元数据合成EDM模型。
映射设计器:一旦设计了EDM模型之后,开发员可指定如何将概念模型映射到关系数据库。该任务由映射设计器来促进,该设计器可呈现如图8中所示的用户界面。映射设计器帮助开发员描述在用户界面的左侧呈现的实体模式中的实体和关系如何映射到如图8的用户界面的右侧呈现的数据库模式所反映的数据库中的表和列。在图8的中间部分呈现的图中的链接使声明性指定为实体SQL查询的等式的映射表达式形象化。这些表达式成为生成查询和更新视图的双向映射编译组件的输入。
代码生成:EDM概念模型对众多应用程序是足够的,因为它提供基于ADO.NET代码模式的熟悉的交互模型(命令、连接、数据读取器)。然而,众多应用程序偏好与作为强类型对象的数据交互。实体框架包括取EDM模型作为输入并为实体类型产生强类型CLR类的一组代码生成工具。代码生成工具还可生成强类型对象上下文(例如,AdventureWorksDB),它对由该模型所定义的所有实体和关系集展示强类型集合(例如,ObjectQuery(对象查询)<SalesPerson(销售员)>)。
其它方面和实施例
映射服务
在一个实施例中,诸如图1中的114的映射组件管理映射的所有方面,并由实体客户机提供者111内部使用。映射在逻辑上指定两个潜在不同的类型空间中的构造之间的变换。例如,概念空间中的实体(如以上使用的该术语一样)可按照存储空间中的数据库表来指定,如图8中图形所示。
规定映射是系统为构造自动确定适当映射的那些映射。非规定映射允许应用程序设计者控制映射的各个方面。映射可具有若干方面。映射的端点(实体、表等)、所映射的属性集、更新行为、诸如延迟加载等运行时影响、对更新的冲突解决行为等仅是这样的方面中的部分列表。
在一个实施例中,映射组件114可产生映射视图。考虑存储空间与模式空间之间的映射。实体由来自一个或多个表的行组成。查询视图按照存储空间中的表将模式空间中的实体表达为查询。可通过评估查询视图来物化实体。
当对一组实体的改变需要回过头来向相应的存储表反映时,改变可通过查询视图以逆向方式传播。这类似于数据库中的视图更新问题——更新传播过程在逻辑上对查询视图的逆执行更新。出于此目的,引入更新视图的概念——这些视图按照实体描述存储表,且可被认为是查询视图的逆。
然而,在众多情况中,我们真正感兴趣的是增量式改变。更新Δ视图是按照对相应实体集合的改变描述对表的改变的视图(查询)。从而,对实体集合(或应用程序对象)的更新处理包括通过评估更新Δ视图然后将这些改变应用到表来计算对表的适当改变。
以类似方式,查询Δ视图按照对底层表的改变描述对实体集合的改变。无效,更一般地是通知,是可能需要使用查询Δ视图的情形。
与数据库中的视图一样,表达为查询的映射视图然后可与用户查询组合——导致对映射更通用的处理。类似地,表达为查询的映射Δ视图允许处理更新的更一般且适度的方法。
在一个实施例中,映射视图的能力可能受到限制。在映射视图中使用的查询构造可能仅是实体框架所支持的所有查询构造的子集。这允许更简单和更高效的映射表达式——尤其是在Δ表达式的情况中。
Δ视图可使用代数改变计算方案在映射组件114中计算以从更新(和查询)视图产生更新(和查询)Δ视图。稍后讨论代数改变计算方案的其它方面。
更新Δ视图通过将计算应用程序所作的实体改变自动转换成数据库中的存储级更新来允许实体框架支持更新。然而,在众多情况中,对于性能和/或数据完整性,映射必须扩充以附加信息。
在某些情况中,将实体上的更新直接映射到其部分或全部底层存储表可能不是合乎需要的。在这样的情况中,更新必须通过存储过程以允许数据确认以及维护信任边界。映射允许指定存储过程以对于实体处理更新和查询。
映射也可在对象服务131中提供对乐观并发控制的支持。具体地,实体的属性可被标记为并发控制字段,诸如时戳或版本字段,且对这些对象的改变仅当存储处的并发控制字段的值与实体中的相同才会成功。注意,这两个乐观并发控制字段仅在应用程序对象层相关,而不在存储专用层120相关。
在一个实施例中,应用程序设计器可使用映射规范语言(MSL)来描述映射的各个方面。典型的映射指定包含以下区段中的一个或多个。
1.数据区可包含对类、表和/或EDM类型的描述。这些描述可描述现有的类/表/类型,或可用于生成这样的实例。若干生成的值、约束、主键等被指定,作为该区段的一部分。
2.映射区段描述类型空间之间的实际映射。例如,按照来自表(或表集)的一个或多个列指定EDM实体的每一属性。
3.运行时区可指定控制执行的各个调节器,例如乐观并发控制参数和取数策略。
映射编译器
在一个实施例中,域建模工具映射组件172可包括映射编译器,该编译器将映射指定编译成查询视图、更新视图以及相应的Δ视图。图9示出编译MSL来生成更新和查询视图。
编译流水线执行以下步骤:
1.从API900调用的视图生成器902转换对象
Figure G2007800099443D0032093555QIETU
实体映射信息901(通过MSL指定),并在对象
Figure G2007800099443D00331
实体空间中产生查询视图、更新视图和相应的(查询和更新)Δ表达式904。该信息可被放置在元数据存储908中。
2.视图生成器906转换实体存储映射信息903(通过MSL指定),并在实体
Figure G2007800099443D00333
存储空间中产生查询视图、更新视图和相应的(查询和更新)Δ表达式907。该信息可被放置在元数据存储908中。
3.依赖性分析909组件检查由视图生成器906产生的视图,并对不违反引用完整性和其它这样的约束的更新确定一致的依赖次序910。该信息可被放置在元数据存储908中。
4.视图、Δ表达式和依赖性次序908然后被传递到元数据服务组件(图1中的112)上。
更新处理
本章节描述更新处理流水线。在一个实施例中,实体框架可支持两种更新。单对象改变是在导航对象图的同时对个别对象作出的改变。对单对象改变,系统跟踪已经在当前事务中创建、更新和删除的对象。这仅在对象层可用。基于查询的改变是通过发出基于对象查询的更新/删除语句来执行的改变,如关系数据库中为更新表所做的。诸如图1中的131的对象提供者可被配置成支持单对象改变,但不支持基于查询的改变。另一方面,实体客户机提供者111可支持基于查询的改变但不支持单对象改变。
图10提供了对一个示例性实施例中的更新处理的说明。在图10中,应用程序层1000处的应用程序的用户1001可保存由这样的应用程序操纵的数据改变1002。在对象提供层1010中,在1011编译改变列表。在改变列表上执行改变分组1012。约束处理1013可产生约束信息以及被保存到元数据存储1017的依赖性模型1022。在1014执行扩展操作。在1015生成并发控制表达式,且并发模型1023被保存到元数据存储1017。对象到实体转化器1016可将对象到实体Δ表达式1024保存到元数据存储1017。
将实体表达式树1018向下传给EDM提供者层1030。选择性更新拆分器1031可选择某些更新,并按需对其拆分。EDM存储转化器1032可将实体到存储Δ表达式1033保存到元数据存储1036。查询视图展开组件1035可将查询映射视图1035保存到元数据存储1036。执行实体到存储补偿1037,且将存储表达式树1038传递给存储提供者层1040。
在存储提供者层1040,简化器组件1041可首先操作,接着是SQL生成组件1042,它生成要在数据库1044上执行的SQL更新1043。可将任何更新结果传递给EDM提供者层1030中的组件1039以处理服务器生成的值。组件1039可将结果向上传给对象提供者层1021中的相似组件。最后,任何结果或更新确认1003被返回给应用程序层1000。
如上所述,作为映射编译的一部分生成更新Δ视图。这些视图在更新过程中使用以标识对存储处的表的改变。
对存储处的一组相关表,实体框架可按照某一次序有利地应用更新。例如,外键约束的存在可能需要以特定顺序应用改变。依赖性分析阶段(映射编译的一部分)标识可在编译时计算的任何依赖性定序要求。
在某些情况中,静态依赖性分析技术可能不是足够的,例如对于循环引用完整性约束(或自引用完整性约束)。实体框架采用乐观方法,并允许这样的更新通过。在运行时,如果检测到循环,则提出异常。
如图10中所示,用于应用程序层1000处的基于实例的更新的更新处理流水线具有以下步骤:
改变分组1012:根据来自改变跟踪器的不同对象集合来对改变进行分组,例如将用于集合Person(个人)的所有改变分组到该集合的插入、删除和更新集中。
约束处理1013:该步骤执行对在值层上不执行任何业务逻辑的事实进行补偿的任何操作——实质上,它允许对象层扩展改变集。在此执行级联删除补偿和依赖性定序(对于各个EDM约束)。
扩展操作执行1014:执行额外(例如,删除)操作,使得相应的商业逻辑可运行。
并发控制表达式生成器1015:为了检测修改的对象是否过时,可生成检查时戳列或如在映射元数据中指定的一组列的表达式。
对象到EDM转化1016:按照插入、删除和更新对象集指定的改变列表现在使用存储在元数据存储1017中的映射Δ表达式来转化,这些表达式是在参考图9描述的映射编译之后存储的。在该步骤之后,改变可用作仅按照EDM实体表达的表达式树1018。
来自步骤1018的表达式树然后被传给EDM提供者层1030中的EDM提供者。在EDM提供者中,处理表达式树,并将改变提交给存储。注意到,表达式树1018也可按照另一方式产生——当应用程序直接针对EDM提供者编程时,它可针对其执行DML语句。这样的DML语句首先由EDM提供者转化成EDM表达式树1018。从DML语句或从应用程序层1000获取的表达式树然后按照以下方式处理:
选择性更新拆分器1031:在此步骤,有些更新被拆分成插入和删除。一般按原样将更新传播到较低层。然而,在某些情况中,可能不可能执行这样的更新,因为未对该情况开发Δ表达式规则,或者因为正确的转换实际上导致对基表的插入和/删除。
EDM到存储转化1032:使用来自适当映射的Δ表达式来将EDM级表达式树1018转换到存储空间中。
查询映射视图展开1034:表达式树1018可包含某些EDM级概念。为了消除它们,使用查询映射视图1035展开表达式树以获取仅按照存储级概念的树1038。树1038可任选地由实体到存储补偿组件1037处理。
现将按照存储空间的表达式树1038给予存储提供者层1040中的存储提供者,它们执行以下步骤:
简化1041:通过使用逻辑表达式转换规则来简化表达式树。
SQL生成1042:给定表达式树,存储提供者从表达式树1038生成实际的SQL1043。
SQL执行1044:在数据库上执行实际的改变。
服务器生成的值:由服务器生成的值被返回给EDP层1030。提供者1044将服务器生成的值传递给层1030中的组件1039,后者使用映射将其转换成EDM概念。应用程序层1000拾取这些改变1003,并将其传播到对象级概念以在该层利用的各个应用程序和对象中安装。
在众多情况中,例如由于数据库管理员(DBA)策略,存储表不能直接更新。对表的更新仅可经由存储过程,因此可执行某些确认检查。在这样的情形中,映射组件可将对象改变转换成对这些存储过程的调用,而非执行“原始”的插入、删除和更新SQL语句。在其它情况中,“存储”过程可在EDP1010或应用程序层1000处指定——在这样的情况中,映射组件必须将经修改的对象转换到EDM空间,然后调用适当的过程。
为了允许这些情形,MSL允许存储过程被指定为映射的一部分;另外,MSL也支持指定如何将各个数据库列映射到存储过程的参数的机制。
EDP层1010支持乐观并发控制。当CDP向存储发送一组改变时,所改变的行可能已经被另一事务改变。CDP必须支持让用户能够检测这样的冲突然后解决这样的冲突的方式。
MSL支持简单机制——时戳、版本号、所改变的列——用于冲突检测。当检测到冲突时,提出异常,且发生冲突的对象(或EDM实体)可由应用程序进行冲突解决。
示例性映射要求
映射基础架构可有利地提供将各个操作从应用程序空间转换成关系空间(例如由开发员编写的对象查询被转换到关系(存储)空间)的能力。这些转换应是高效的,而无需对数据进行过多的复制。映射器可提供转换用于以下示例性操作:
1.查询:对象查询需要被转化到后端关系域,且从数据库获取的元组需要被转换成应用程序对象。注意这些查询可能是基于组的查询(例如,CSQL或C#序列)或是基于导航的(例如,仅跟随引用)。
2.更新:应用程序对其对象所作的改变需要被传回数据库。再一次,对于对象所作的改变可能是基于组的或对个别对象进行的。考虑的另一个方面是正在修改的对象是被完全加载到存储器中还是被部分加载(例如,移交(handoff)对象的集合可能目前不在存储器中)。对于对部分加载的对象的更新,其中不要求这些对象被完全加载到存储器中的设计可能是更优选的。
3.无效和通知:运行在中间层或客户机层的应用程序可能想要在一些对象在后端改变时得到通知。因此,OR映射组件应将对象级的注册转换到关系空间;类似地,当客户机接收到关于所修改的元组的消息时,OR映射器必须将这些通知转换成对象改变。注意,WinFS经由其看守人机制支持这样的“通知”——然而,在这种情况中,映射是规定的,而实体框架应支持对非规定的映射的看守人。
4.也需要类似于通知的机制来从运行在中间层或客户机层中的实体框架进程中使过时对象无效——如果实体框架提供对乐观并发控制的支持以处理发生冲突的读/写,则应用程序可确保在实体框架高速缓存的数据是相当新鲜的(因此,无需因对于对象的读/写而异常中止事务);否则,它们可对老数据作出决策和/或使其事务在稍后异常中止。因此,与通知相同,OR映射器可能必须将来自数据库服务器的“无效”消息转换成对象无效。
5.备份/还原/同步:实体的备份和镜像是可并入某些实施例中的两个特征。对这些特征的要求可简单地转换成从OR映射器的角度对实体的的专门查询;否则,可提供对这样的操作的特殊支持。类似地,同步可能需要对将对象改变、冲突等从OR映射引擎转换到存储及其反向转换的支持。
6.参与并发控制:OR映射器可有利地支持乐观并发控制可由应用程序使用的不同方式,例如使用时戳值、某些特定的字段组等。OR映射器应将诸如时戳属性等并发控制信息向/自对象空间和自/向关系空间转换。OR映射器甚至可提供对悲观并发控制的支持(例如,如Hibernate)。
7.运行时错误报告。在此处所示的示例性实施例中,运行时错误一般在存储级发生。这些错误可被转换到应用程序级。OR映射器可用于便于这些错误的转换。
映射情形
在讨论实体框架可能支持的示例性开发器情形之前,示出OR映射器的各个逻辑部分。在一个实施例中,如图11中所示,OR映射中有五个部分。
1.对象/类/XML(也称为应用程序空间)1101:开发员用选择的语言指定类和对象——最终,这些类被编译成CLR汇编,并可通过反射API访问。这些类包括持久和非持久成员;而且,在该部分中可包括语言专用细节。
2.实体数据模型模式(也称为概念空间)1102:EDM空间由开发员用于对数据建模。如上所述,数据模型的指定按照EDM类型、实体之间的关系经由关联、继承等来完成。
3.数据库模式(也称为存储空间)1103:在该空间中,开发员指定表如何布局;也在此处指定诸如外键和主键约束的约束。该空间中的指定可利用厂商专用特征,例如嵌套表、UDT等。
4.对象-EDM映射1104:该映射指定各个对象和EDM实体如何彼此相关,例如数组可被映射到一对多关联。注意该映射不必是平凡/恒等的,例如多个类可映射到给定EDM类型反之亦然。注意,在这些映射中可能有或可能没有冗余/非规范化(当然,对于非规范化,有可能会碰到保持对象/实体一致的问题)。
5.EDM-存储映射1105:该映射指定EDM实体和类型如何与数据库中的不同表相关,例如此处可使用不同的继承映射策略。
开发员可指定一个或多个空间1101、1102或1103及其之间的一个或多个映射之间的相应映射。如果遗失了任何数据空间,则开发员可给出如何生成该空间的提示,或可期望EDP采用相应的规定的映射来自动生成这些空间。例如,如果开发员指定现有的类、表及其之间的映射,则EDP生成内部EDM模式和相应的对象-EDM和EDM-存储映射。当然,在最普通的情况中,开发员可具有完全的控制,并在这三个空间以及两个映射中指定数据模型。下表示出EDP中所支持的不同情形。这是对其中开发员是否可指定对象、EDM实体、表的情况的穷举列表。
 
情形 对象被指定? CDM被指定? 表被指定? 映射被指定
(A)
(B)
(C) 是是
(D) OE(对象-实体)
(E) OS(对象-存储)
(F) ES(实体-存储)
(G) Y OE,ES
取决于EDP想要支持的以上情形,必须提供工具来产生未指定的数据空间和映射(按照规定的方式或基于所提供的提示)。内部OR映射引擎假定,映射的所有5个部分(对象、EDM指定、表、OE映射、ES映射)均是可用的。因此,映射设计应支持最普通的情况,即上表中的(G)。
映射规范语言
从开发员的角度,OR映射器的一个“可见”部分是映射规范语言即MSL——开发员使用该语言指定映射的各个部分如何彼此连系。运行时控制(例如,延迟取、乐观并发控制问题)也使用MSL指定。
将映射分成三个不同的概念——每一概念解决映射过程的不同方面。注意并未规定这些指定是存储在单个文件、多个文件中还是通过外部储存库(例如,用于数据指定)来指定的。
1.数据指定:在该区中,开发员可指定类描述、表描述和EDM描述。这些描述可提供为对生成目的的指定,或它们可以是已经存在的表/对象的指定。
对象和表指定可按照我们的格式描述,或者可使用某种导入工具从外部元数据储存库导入它们。
注意,服务器生成值、约束、主键等的指定在该部分中完成(例如,在EDM指定中,约束被指定为类型指定的一部分)。
2.映射指定:开发员指定各个对象、EDM类型和表的映射。允许开发员指定对象-EDM、EDM-存储和对象-存储映射。该部分试图使数据指定具有最小冗余。
在所有三个映射情况(OS、ES和OE)中,为每一类或者在顶级“直接”或者在另一类内“间接”指定映射。在每一映射中,字段/属性被映射到另一字段、字段的标量函数、组件或集。为了允许更新,这些映射需要是双向的,即对象与存储空间的往来应不会丢失任何信息,也允许非双向映射,使得对象是只读的。
对象-EDM映射:在一个实施例中,按照EDM类型为每个对象指定映射。
EDM-存储映射:在一个实施例中,按照表为每个实体指定映射。
对象-存储映射:在一个实施例中,按照表为每个对象指定映射。
3.运行时指定:在一个实施例中,允许开发员指定控制执行的各个调节器,例如乐观并发控制参数和取数策略。
此处是OPerson(个人)对象包含一组地址的情况的映射文件的示例。该对象被映射到EDM实体类型,且该集被映射到内联集类型。该数据被存储到两个表中——一个用于个人,另一个用于地址。如前所述,开发员不必指定所有对象、EDM类型和表——仅示出上表中的情况(G)。指定未被假定描述任何具体的句法,它们旨在示出和允许围绕此处公开的概念设计系统。
对象指定
 
ObjectSpec OPerson{string name;Set<Address>addrs;} ObjectSpec OAddress{string state;}
EDM指定
指定一个实体类型CPerson(个人)和内联类型CAddress(地址),使得每一CPerson具有CAddress项目的集合。
 
EDMSpec Entity CPerson{string name;int pid;Set<CAddress>addrs;Key:{pid}} EDMSpec Inline Type CAddress{string state;int aid;}
存储指定
指定两个表类型SPerson(个人)和SAddress(地址)及其键(tpid和taid)。
 
TableSpec SPerson{int pid;nvarchar(10)name;Key:{pid}} TableSpec SAddress{int aid;string state;Key:{aid}}
对象-CDM映射
以下对OPerson的映射表明对象类型OPerson被映射到实体CPerson。之后的列表指定OPerson的每一字段如何映射——名字(name)被映射到名字,而地址(addr)集合被映射到地址集合。
Figure G2007800099443D0041191957QIETU
  
EDM-存储映射:
EDM实体类型CPerson及其键和名字cname属性被映射到表类型SPerson。内联类型CAddress以简单的方式映射到SAddress。注意表SAddress可将外键存储到SPerson;该约束可能已经在表的数据模型指定中指定而非在映射中指定。
 
运行时指定:
开发员可能想要指定,对OPerson的乐观并发控制在pid和name字段上完成。对OAddress(地址),他/她可对state(状态)字段指定并发控制。
 
    RuntimeSpec OPerson{Concurrencyfields:{pid,name}} RuntimeSpec OAddressConcurrencyfields:{state}}
映射设计概观
大多数OR映射技术,诸如Hibernate和ObjectSpaces具有一个重要的缺点——它们以相对自组织的方式处理更新。当对象改变需要被推送回服务器时,这些系统所使用的机制在逐个情况的基础上处理更新,从而限制了系统的可扩展性。当支持更多的映射情况中,更新流水线变得复杂且难以为更新组成映射。随着系统的演化,系统的这一部分变得相当难以在确保其正确的情况下进行改变。
为了避免这样的问题,使用其中使用两种类型的“映射视图”(其一帮助转换查询,另一个帮助转换更新)来执行映射过程的新颖的方法。如图12中所示,当MSL指定1201由EDP处理时,它内部生成两个视图1202和1203用于核心映射引擎的执行。如稍后可见,通过按照这些视图对映射建模,能够利用关系数据库中对物化视图技术的现有知识——具体地,利用增量式视图维护技术用于以正确、适度且可扩展的方式对更新建模。现在讨论这两种类型的映射视图。
使用查询映射视图即QM视图的概念将表数据映射到对象,使用更新映射视图即UM视图将对象改变映射到表更新。这些视图根据其构造的(主要)理由而命名。查询视图将对象查询转换成关系查询,并将传入的关系元组转化成对象。因此,对EDM-存储映射,每一查询视图示出如何从各个表构造EDM类型。例如,如果根据两个表T_P和T_A的联接构造Person实体,则按照这两个表之间的联接来指定Person。当对Person集合请求查询时,Person的QM视图用按照T_P和T_A的表达式代入Person,该表达式然后生成适当的SQL。然后在数据库执行查询,当从服务器接收到回复时,QM视图从所返回的元组物化对象。
为了处理对象更新,可想象通过QM视图推送改变,并利用为关系数据库开发的“视图更新”技术。然而,可更新视图具有多个限制,例如SQL Sever不允许多个基表通过视图更新来修改。因此,代替限制EDP中所允许的映射的类型,本发明的实施例利用物化视图技术中具有少得多的限制的另一方面——视图维护。
按照EDM类型指定更新映射视图即UM视图用于表达系统中的每一表,即在某种意义上,UM视图是QM视图的逆。EDM-存储边界上的表类型的UM视图提供了使用不同EDM类型来构造该表类型的列的方式。因此,如果指定Person对象类型映射到表类型T_P和T_A,则不仅按照T_P和T_A为Person类型生成QM视图,也生成指定给定Person对象类型可如何构造T_P的行的UM视图(对T_A是类似的)。如果事务创建、删除或更新某些Person对象,则可使用更新视图将这样的改变从对象转换成对T_P和T_A的SQL插入、更新和删除语句——UM视图有助于执行这些改变,因为它们告诉我们如何从对象获取关系元组(经由CDM类型)。图13和14在高级示出如何在查询和更新转换中使用QM视图和UM视图。
给定用于将表建模成对象上的视图的这种方法,将对于对象的更新传播回表的过程类似于其中对象是“基本关系”而表是“视图”的视图维护问题。存在解决视图维护问题的大量数据库文献,可为我们的用途使用它们。例如,存在示出如何将对基本关系的增量式改变转换成对视图的增量式改变的大量作品。使用代数方法来确定对视图执行增量式更新所需的表达式——将这些表达式称为Δ表达式。与过程方法相对,使用代数方法对增量式视图维护是适当的,因为它更顺应优化和更新简化。
一般,在EDP核心引擎中使用映射视图的优点包括:
1.视图提供用于表达对象和关系之间的映射的大量能力和灵活性。可以OR映射引擎的核心部分中的受限视图表达式语言来开始。当时间和资源许可时,视图的能力可用于适度地演化系统。
2.已知视图是由查询、更新和视图本身适度组成。尤其对于更新,可组成性对早先尝试的某些OR映射方法是成问题的。通过采用基于视图的技术,可不必对此费心。
使用视图的概念允许我们利用数据库文献中的大量作品。
更新的体系结构层叠
在实现本发明的各方面时考虑的一个重要问题是,用其表达查询和更新映射视图的映射视图语言(即MVL)的能力是什么。它足以捕捉对象与EDM之间所有的非规定映射以及EDM与存储之间的映射。然而,对本机支持所有非关系CLR和EDM概念的MVL,需要为所有这样的构造设计Δ表达式或增量式视图更新规则。具体地,一个示例性实施例可能要求以下非关系代数运算符/概念的更新规则:
复杂类型——对于对象、元组构造器、展平、复杂常量等一部分的访问。
集合——嵌套和取消嵌套、组构造/展平、交叉应用等。
数组/列表——元素的次序不是关系构造;显然,有序列表的代数是相当复杂的。
CLR/C#中需要建模的其它EDM构造和对象构造。
有可能为这些构造的增量式更新开发Δ表达式。用MVL本机支持大集合构造的主要问题在于,它可能会在相当程度上使核心引擎复杂化。在一个实施例中,更合乎需要的方法可以是使系统层叠,使得“核心映射引擎”处理简单MVL然后将非关系构造层叠到该核心的顶部。现在讨论这一设计。
我们用于OR映射的方法通过“层叠”来解决以上问题——在编译时,首先将对象、EDM和数据库空间中的每一非关系构造(WinFS支持嵌套、UDT等)按照规定方式转换成相应的关系构造,然后执行关系构造之间所需的非规定转换。将该方法称为层叠视图映射方法。例如,如果类CPerson包含地址的集合,首先按照一对多关联将该集合转换成关系构造,然后对关系空间中的表执行所需的非规定转换。
MVL分解
MVL被分成两层——按照关系处理实际的非规定映射的一层,以及将非关系构造转换成关系方面的规定转换。前一语言被称为R-MVL(关系MVL),而相应的映射被称为R-MVL映射;类似的,后一(更强大)语言被称为N-MVL(非关系MVL)而映射被称为N-MVL映射。
在一个实施例中,通过构造设计使得所有的非关系构造被推送到查询和更新流水线的结尾来提供映射。例如,对象物化可涉及构造对象、数组、指针等——这样的“操作符”被推送到查询流水线的顶部。类似地,当对于对象发生更新时,在流水线的开头转换对于非关系对象(例如,嵌套集合、数组)的改变然后通过更新流水线传播这些改变。在如WinFS的系统中,需要在更新流水线的结尾转换成UDT。
通过将非规定映射限制成R-MVL,现在具有了需要增量式视图维护规则的一小组关系构造——已经为关系数据库开发了这样的规则。将在R-MVL中所允许的简化的构造/模式称为关系表达的模式即RES。因此,当在对象域中需要(例如)支持某些非关系构造时,得到相应的RES构造以及对象与RES构造之间的规定转换,例如将对象集合转换为RES空间中的一对多关联。而且,为了传播对非关系构造N的更新,要提出将插入、删除和更新从N转换到N相应的RES构造的Δ表达式。注意,这些Δ表达式是规定的,且由我们在设计时生成,例如知道如何将对集合的改变推送到一对多关联上。使用关系数据库的增量式视图维护规则自动生成实际非规定映射的Δ表达式。该层叠方法不仅移除了为过多的非关系构造提出通用的增量式视图维护规则的要求,而且也简化了内部更新流水线。
注意到,我们的层叠映射方法对于通知流水线也有类似的好处——当从服务器接收到对于元组的改变时,需要将其转换成对于对象的增量式改变。除了需要使用查询映射视图来传播这些改变,即生成QM视图的Δ表达式以外,这是与更新流水线相同的要求。
除了简化更新和通知流水线,层叠MVL有一个重要的优点——它允许“上层语言”(对象、EDM、数据库)进行演化,而不会对核心映射引擎造成显著影响。例如,如果将新概念添加到EDM,所有需要做的是提出将其转化成该构造的相应RES的规定方式。类似地,如果在SQL Server中存在非关系概念(例如,UDT、嵌套),可按照规定方式将这些构造转换成MVL,且对MVL和核心引擎具有最小的影响。注意到,RES存储和存储表之间的转换不必是恒等的转换。例如,在支持UDT、嵌套等的后端系统(诸如WinFS后端)中,转换类似于规定的对象关系。
图15示出了对映射视图的编译时和运行时处理。给定如1501、1502和1503示出的采用MSL的数据模型和映射指定,首先为非关系构造1511、1522和1523生成相应的RES1521、1522和1523以及这些构造与RES之间规定的转换,即N-MVL映射。然后为开发员所请求的非规定映射生成查询和更新映射视图,采用R-MVL的对象-EDM以及采用R-MVL的对象-EDM——注意,这些映射视图使用R-MVL语言对RES进行操作。此时,为查询和更新映射视图生成Δ表达式(视图维护表达式)——已经为关系数据库开发了这样的规则。注意,出于通知的目的,需要QM视图的Δ表达式。对N-MVL映射,在设计时由我们确定Δ表达式,因为这些映射是规定的,例如当将Address集合映射到一对多关联时,也设计相应的视图维护表达式。
给定以上视图和转换(N-MVL和R-MVL),可将其合成以获得可按照存储1533中的表表达对象1531的查询映射视图以及可按照对象1531表达表1533的更新映射视图。如图所示,可选择保留映射视图,使得1532中的EDM实体并未从运行时的映射中完全消除——保存这些视图的一个可能的理由是启用利用EDM约束的某种查询优化。当然,这不意味着在运行时实际存储EDM实体。
图16示出了不同的组件如何实现上述的视图编译过程。应用程序调用API1600。视图生成器1601、1603负责三个功能:将非关系构造转换成RES构造、生成查询/更新视图以及生成Δ表达式以便传播更新和通知。它们在实现这些功能时可使用元数据1602。OE视图合成器1605取得对象和EDM信息,并合成它,使得我们有了按照EDM类型的对象代数表达式;类似地,ES视图合成器1606按照表产生EDM类型的代数表达式。在OS视图合成器1607中进一步合成这些视图,并在元数据存储1608中得到单个视图集。如上所述,保存两个视图集用于可能的优化机会。最后,依赖性分析组件1604也可对ES视图生成器输出进行操作以向元数据存储1608提供依赖次序。
映射编译概述
总而言之,对类、EDM类型或表的每一指定M,生成相应的RES以及M与相应的RES之间的规定转换。因此,如图15所示,生成以下内容:
1.对应于M的RES——表示为RES-CDM(M)、RES-对象(M)或RES-存储(M)。
2.按照RES关系表达每一指定M的规定的转换
3.按照M表达这样的RES关系的规定的转换
4.查询映射视图:有两个这样的视图——OE QM视图按照EDM类型表达对象,ES QM视图按照存储(表)表达EDM类型
5.更新映射视图:有两个这样的视图——OE UM视图按照对象表达EDM类型,ES UM视图按照EDM类型表达存储表
6.对更新的增量式维护,也对UM视图生成Δ表达式。
在合成这些视图之后,以四个映射结束。这些映射被存储在元数据存储1608中,并被统称为经编译的映射视图:
查询映射:按照CDM/表来表达对象/CDM。
更新映射:按照CDM/对象来表达表/CDM。
更新Δ表达式:按照CDM/对象的Δ来表达表/CDM的Δ。
通知Δ表达式:按照CDM/表的Δ来表达对象/CDM的Δ。
依赖次序:对不同关系执行各个插入、删除、更新操作的必须次序——该次序确保数据库约束在更新过程期间不会被违反。
集合示例
现在简要示出所考虑的Person示例的规定转换和非规定映射。呈现查询和更新映射视图两者——以下进一步讨论相应的视图维护表达式。
RES
将OPerson转换成仅反映name和pid的RES构造R_OPerson;类似地,将OAddress转换成R_OAddress。为了转换地址的集合,使用一对多关联R_OPerson_Address。类似地,对于EDM构造也一样。表(R_SPerson,R_SAddress)的RES是对Sperson和Saddress的恒等映射。这些RES是:
 
R_OPerson(pid,name)R_OAddress(aid,state)R_OPerson_Address(pid,aid) R_CPerson(pid,name)R_CAddress(aid,state)R_CPerson_Address(pid,aid) R_SPerson(pid,name)R_SAddress(pid,aid,state)
查询映射视图
示出对象-存储映射(在对象-EDM和EDM-存储映射上组成)。
RES空间中的非规定视图
对象与EDM空间之间的映射实质上是恒等的。所有三个视图R_Cperson、R_CAddress以及R_CPerson_Address仅是对R_SPerson和R_SAddress的投影。
 
CREATE VIEWR_OPerson(pid,name)ASSELECT pid,nameFROM R_CPerson CREATE VIEWR_OPerson_Address(pid,aid)ASSELECT pid,aidFROM R_CPerson_Address CREATE VIEWR_OAddress(aid,state)ASSELECT aid,stateFROM R_CAddress
 
CREATE VIEWR_CPerson(pid,name)ASSELECT pid,nameFROM R_SPerson CREATE VIEWR_CPerson_Address(pid,aid)ASSELECT pid,aidFROM R_SAddress CREATE VIEWR_CAddress(aid,state)ASSELECT aid,stateFROM R_SAddress
规定转换(按照RES-对象的对象)
通过使R_OPerson_Address与R_OAddress联接并对结果嵌套来使用R_Operson、R_OAddress以及R_OPerson_Address表达OPerson对象。CREATE PRESCRIBED VIEW OPerson(pid,name,addrs)AS
SELECT pid,name,NEST(SELECT Address(a.aid,a.state)
                FROM R_OAddress a,R_OPerson_Address pa
                WHERE pa.pid=p.pid AND a.aid=pa.aid)
R_OPerson p
Cperson的合成视图
简化之后的合成表达式可以是(记得对该示例,我们在表与其RES构造之间具有恒等转换):
CREATE VIEW OPerson(pid,name,addrs)AS
SELECT pid,name,NEST(SELECT Address(a.aid,a.state)
             FROM SAddress a
             WHERE a.pid=p.pid)
SPerson p
最终的视图表明通过使用“直接”映射方法可能期望获得的视图。当查看更新流水线的Δ表达式时以及在需要查询映射视图的Δ表达式的通知流水线中,RES方法的好处出现。
更新映射视图
RES空间中的非规定视图
R_SPerson的UM视图仅是对R_CPerson的投影,而R_SAddress是通过将R_CAddress与一对多关联表R_CPerson_Address联接而构造成的。CDM与对象空间之间的映射是恒等的。
 
CREATE VIEWR_CPerson(pid,name)ASSELECT pid,nameFROM R_OPerson CREATE VIEWR_CPerson_Address(pid,aid)ASSELECT pid,aidFROM R_OPerson_Address CREATE VIEWR_CAddress(aid,state)ASSELECT aid,stateFROM R_OAddress
 
CREATE VIEW R_SPerson(pid,name)ASSELECT pid,name,FROM R_CPerson CREATE VIEW R_SAddress(aid,pid,state)ASSELECT aid,pid,stateFROM R_C Person_Address,R_CAddressWHERE R_CPerson_Address.aid=R_CAddress.aid
规定转换(按照对象的RES-对象)
需要将对象转换成RES,使得更新可从对象空间推送到RES空间。R_OPerson的规定转换是简单的投影,而R_OAddress和R_OPerson_Address的转换是通过在个人与其地址之间执行联接而实现的。这是“指针联接”或“导航联接”。
 
CREATE PRESCRIBED VIEWR_OPerson(name,pid)ASSELECT name,pidFROM OPerson CREATE PRESCRIBED VI EWR_OAddress(state,aid)ASSELECT a.state,a.aidFROM OPerson p,p.addrs a CREATE PRESCRIBED VIEWR_OPerson_Address(pid,aid)ASSELECT pid,aidFROM OPerson p,p.addrs a
合成的更新映射视图
合成以上视图(以及采用某种简化)来得到以下合成的更新映射视图:
 
CREATE VIEW SPerson(pid,name)ASSELECT pid,name,FROM OPerson CREATE VIEW SAddress(aid,pid,state)ASSELECT a.aid,p.pid,a.stateFROM OPerson p,p.addrs a
因此,表SPerson可被表达为对OPerson的简单投影,而SAddress是通过将OPerson与其地址联接来获得的。
视图确认
所生成的视图需要满足的一个重要性质是它们必须是“往返的”,即防止任何信息损失,必须确保当实体/对象被保存然后检索时,没有信息损失。换言之,想要对所有的实体/对象D确保:
D=QM视图(UM视图(D))
我们的视图生成算法确保该性质。如果该性质为真,则也说“查询和更新视图是往返的”或是双向的。现在为个人-地址示例阐述该性质。为简单起见,关注RES空间中的往返。
对R_OPerson的确认
在OPerson的查询视图中代入SPerson,得到:
R_OPerson(pid,name,age)=
SELECT pid,name,age FROM(SELECT pid,name,age FROMR_SPerson)
简化而得到
R_OPerson(pid,name,age)=SELECT pid,name,age FROM R_SPerson这与SELECT*FROM Person等效。
对OPerson_Address的确认
对R_OPerson_Address,这稍许复杂。我们有:
R_OPerson_Address(pid,aid)=SELECT pid,aid FROM R_SAddress代入R_SAddress,得到:
R_OPerson_Address(pid,aid)=
SELECT pid,aid
FROM(SELECT aid,pid,state
      FROM R_OPerson_Address pa,R_OAddress a
      WHERE pa.aid=a.aid)
这被简化为:
R_OPerson_Address(pid,aid)=
SELECT pid,aid FROM R_OPerson_Address pa,R_OAddress a WHEREpa.aid=a.aid
为了示出以上的确是SELECT*FROM R_OPerson_Address,需要外键依赖R_OPerson_Address.aid→R_OAddress.aid。如果该依赖性不成立,则不能往返。这确实成立,因为设置值的属性addrs(地址)的范围是R_OAddress。该外键约束可按照两种方式表明:
1. R _ OPerson _ Address . aid &SubsetEqual; R _ OAddress . aid
2.πaid,pid(R_OPerson_Address
Figure G2007800099443D0052193038QIETU
R_OAddress)=
R_OPerson_Address
在以上表达式中代入该约束,我们得到:
R_OPerson_Address(pid,aid)=SELECT pid,aid FROMR_OPerson_Address
地址确认
R_OAddress被给定为:
R_OAddress(aid,state)=SELECT aid,state FROM R_SAddress
代入R_SAddress,得到:
R_OAddress(aid,state)=
SELECT aid,state
FROM(SELECT aid,pid,state
FROM R_OPerson_Address pa,R_OAddressa
WHERE pa.aid=a.aid)
这可被重述为:
R_OAddress(aid,state)=SELECT aid,state FROM R_OPerson_Addresspa,R_OAddress a
WHERE pa.aid=a.aid
此处,如果外键依赖性R_OAddress.aid→R_OPerson_Address.aid成立,则与R_OPerson_Address的联接是冗余的。该依赖性仅当R_OAddress在依赖于R_OPerson存在时(即,addrs是合成)时才成立。如果这不是真的,则我们的视图不能往返。因此,我们具有约束:
πaid,state(R_OAddress
Figure G2007800099443D0053193224QIETU
R_OPerson_Address)=R_OAddress
因此,得到以下表达式:
R_OAddress(aid,state)=SELECT aid,state FROM R_OAddress
查询转换
查询转换器
EDP查询转换器(EQT)负责通过利用映射元数据将查询从对象/EDM空间转换到提供者空间。用户查询可用各种句法表达,例如eSQL、C#序列、VB SQL等。EQT体系结构在图17中示出。现在描述EQT的不同组件。
解析器1711通过解析用若干形式中的一种表达的用户查询(包括eSQL、语言集成查询(LINQ)、C#序列以及VB sql)来执行句法分析。此时将检测并标记任何句法错误。
对LINQ,句法分析(以及语义分析)与语言(C#、VB等)本身的句法分析阶段集成。对eSQL,句法分析阶段是查询处理器的一部分。一般,每个语言有一个句法分析器。
句法分析阶段的结果是解析树。该树被馈送到语义分析阶段1712。
参数绑定器和语义分析器组件1712管理用户查询中的参数。该模块跟踪查询中的参数的数据类型和值。
语义分析阶段在语义上确认由句法分析阶段1711产生的解析树。查询中的任何参数此时必须已被绑定,即其数据类型必须已知。此处检测并标记任何语义错误;如果成功,则该解析的结果是语义树。
注意对LINQ,如前所述,语义分析阶段与语言的语义分析阶段本身集成。一般每个语言有一个语义分析器,因为每个语言有一个句法树。
语义分析阶段逻辑上由以下组成:
1.名字解析:查询中的所有名字在此时解析。这包括对范围、类型、类型的属性、类型的方法等的引用。作为副作用,也推断这样的表达式的数据类型。该子阶段与元数据组件交互。
2.类型检查和推断:可类型检查查询中的表达式,并推断结果类型。
3.确认:其他种类的确认在这里进行。例如,在SQL处理器,如果查询块包含分组子句,则该阶段可用于实施选择列表仅可引用分组键或聚合函数的限制。
语义分析阶段的结果是语义树。此时,认为查询是有效的——在查询编译期间之后将不应出现任何其他的语义错误。
代数化阶段1713取得语义分析阶段1712的结果,并将其转化成更适于代数变换的形式。该阶段的结果是逻辑扩展关系操作符树,又称为代数树。
代数树是基于核心关系代数操作符的——选择、投影、联接、并以及将其扩充以附加的操作,如嵌套/取消嵌套以及透视(pivot)/取消透视。
查询转换器的视图展开阶段1714有可能递归地代入用户查询中所引用的任何对象的QM视图表达式。在视图转换过程的结尾,得到按照存储描述查询的树。
在对象层的情况中,视图展开可能已对至存储空间所有方式进行(在我们有存储在元数据储存库中的优化的OS映射的情况中)或查询树可能已经被变换到EDM层。在后一情况中,需要取得该树,并在EDM概念现在要被转换成存储概念的要求下将其重新馈送到视图展开组件。
变换/简化组件1715可以是提供者1730专用的,或在替换实施例中,可以是可由各个提供者利用的EDP通用组件。对查询树执行变换有几个理由:
1.推送到存储的操作符:EQT将复杂操作符(例如,联接、过滤、聚合)推送到存储。否则,这样的操作将必须在EDP中实现。EDP的值物化层仅执行“非关系补偿”操作,诸如嵌套。如果无法将操作符X向下推送到查询树中的值物化节点以下,且值物化层不能执行操作X,则将该查询声明为非法的。例如,如果查询具有不能推送到提供者的聚合操作,将声明该查询非法,因为值物化层不能执行任何聚合。
改进的性能:查询复杂性降低是重要的,且想要避免将巨大的查询发送到后端存储。例如,WinFS中的某些当前查询是非常复杂的,且花费大量时间来执行(相应的手写查询要快一个数量级)。
改进的调试能力:较简单的查询也使得开发员易于调试系统以及理解正在进行的事情。
变换/简化模块1715可将表示查询的某些或全部代数树变换成等效的子树。注意到,这些基于试探的变换是逻辑上的,即不是使用成本模型进行的。这种逻辑变换可包括以下示例性提供者专用服务:
子查询展平(视图和嵌套的子查询)
联接消除
谓词消除和整合
谓词下推
共有子表达式消除
投影修剪
外联接→内联接变换
消除左相关
该SQL生成模块1731是提供者组件1730的一部分,因为所生成的SQL是提供者专用的。在简化之后,将代数树传递给在生成适当SQL之前可能进一步执行提供者专用变换或简化的提供者。
当查询在服务器执行之后,结果被流传送到EDP客户机。提供者1730展示可由应用程序用来获取作为EDM实体的结果的DataReader。值物化服务1741可取得这些读取器,并将其转化成相关EDM实体(作为新的DataReader)。这些实体可由应用程序消费,或新的DataReader可被传递到上层对象物化服务。
EQT1700将物化表示为查询树中的操作符。这允许常规的查询转换流水线产生EDM空间中的对象,这然后可被直接馈送给用户,代替要求特殊的带外操作来执行实际的物化。这也允许如部分对象取、急切加载等各种优化在用户查询上执行。
查询示例
考虑已经开发的个人-地址示例。假定用户想要运行以下查询——找到WA(华盛顿)中的所有人。可将该查询用伪CSQL写成:
SELECT x.name FROM OPerson x,x.addrs y WHERE y.state=“WA”
如果此时使用Person的查询视图进行视图展开,则得到:
SELECT x.name
FROM(SELECT pid,name,
      NEST(SELECT OAddress(a.aid,a.state)FROM SAddress awhere a.pid=p.pid)
FROM SPerson p)as x,x.addrs y
WHERE y.state=“WA”
该查询可在发送给后端服务器之间进行简化:
SELECT p.name
FROM SPerson p,SAddress a
WHEREp.pid=a.pid
元数据
EQT在查询的编译和执行期间要求各种元数据。元数据包括
应用程序空间元数据:关于语义分析期间确认用户查询所需的范围/集合、类型、类型属性、类型方法的信息。
模式空间元数据:关于视图编译期间所需的实体集合、CDM类型和属性的信息。用于变换的关于实体以及实体上的约束之间的关系的信息。
存储空间元数据:如上所述。
应用程序->模式映射:表示视图展开所需的视图定义的逻辑操作符树。
模式->存储映射:如上所述。
错误报告流水线
查询处理各个阶段的错误可按照用户可理解的方式报告。各种编译和执行时错误可在查询处理期间发生。句法和语义分析期间的错误大多数处于应用程序空间中,且要求很少的特殊处理。变换期间的错误大多数是资源错误(在存储器外等),且需要某种特殊处理。代码生成和随后的查询执行期间的错误可能需要适当处理。错误报告中关键的挑战是将在较低的抽象级发生的运行时错误映射到应用程序级有意义的错误。这意味着需要通过存储、概念和应用程序映射处理较低级错误。
查询示例
我们的示例00查询取得在华盛顿有地址的所有人的名字:
SELECT p.name
FROM OPerson p,p.addrs as a
WHERE a.state=′WA′
步骤1:转化到关系方面
该查询可被转化到以下按照R_OPerson、R_OPerson_Address和R_OAddress表达的纯关系查询。实质上,如有需要,将各个导航属性(点“.”表达式)展开成联接表达式。
SELECT p.name
FROM R_OPerson p,R_OPerson_Address pa,R_OAddress a
WHERE p.pid=pa.pid AND pa.aid=a.aid AND a.state=′WA′
注意,查询仍在对象域,且按照对象范围。
步骤2:视图展开:转化到存储空间
现在进行视图展开以将查询转化成SQL:
SELECT p.name
FROM(SELECT pid,name,age FROM SPerson)p,
(SELECT pid,aid FROM SAddress)pa,
(SELECT aid,state FROM SAddress)a
WHERE p.pid=pa.pid AND pa.aid=a.aid AND a.state=′WA′
步骤3:查询简化
现在应用一系列逻辑变换来简化该查询。
SELECT p.name
FROM SPerson p,SAddress pa,SAddress a
WHERE p.pid=pa.pid AND pa.aid=a.aid AND a.state=′WA′
现在,可消除SAddress的主键(aid)上的冗余自联接,并获得:
SELECT p.name
FROM SPerson p,SAddress a
WHERE p.pid=a.pid AND a.state=′WA′
以上所有是相当直接的。现在有了可被发送给SQL Server的查询。
更新的编译时处理
EDP允许应用程序创建新对象、更新它们、删除它们,然后持久存储这些改变。OR映射组件需要确保这些改变被正确地转换成后端存储改变。如前所述,使用按照对象来声明表的更新映射视图。通过使用这样的视图,基本上将更新传播问题缩减为物化视图维护问题,其中对基本关系的改变需要被传播到视图;在UM视图的情况中,“基本关系”是对象而“视图”是表。通过按照此方式对问题建模,可利用已经在关系数据库领域开发的视图维护技术的知识。
更新映射视图生成
如在查询情况中一样,大量用于更新的映射工作在编译时执行。与类、EDM类型和表的关系表达模式一样,生成这些类型和相应的RES构造之间的规定转换。也生成类的RES构造与EDM类型之间以及EDM类型的RES构造与存储表之间的更新映射视图。
在已经开发的个人-地址示例的帮助下,理解这些UM视图。记得所构造的对象RES构造(R_OPerson、R_OAddress、R_OPerson_Address)。
更新映射视图(按照对象RES的表的RES)
R_OPerson的UM视图仅是对R_SPerson的投影,而R_SAddress是通过将R_OAddress与一对多关联表R_OPerson_Address联接而构造成的。
 
CREATE VIEW R_SPerson(pid,name)ASSELECT pid,name,FROM R_OPerson CREATE VIEW R_SAddress(aid,pid,state)ASSELECT aid,pid,stateFROM R_OPerson_Address pa,R_OAddress aWHERE pa.aid=a.aid
规定转换(按照对象的RES)
需要将对象转换成RES,使得更新可从对象空间推送到RES空间。使用“o2r”功能将对象的虚拟存储器地址转换成pid和aid键——在实现中,简单地从对象的阴影状态得到键。R_OPerson的规定转换是简单的投影,而R_OAddress和R_OPerson_Address的转换是通过在个人与其地址之间执行联接而实现的。
 
CREATE PRESCRIBED VIEWR_OPerson(name,pid)ASSELECT name,pidFROM OPerson CREATE PRESCRIBED VIEWR_OAddress(state,aid)ASSELECT a.state,a.aidFROM OPerson p,p.addrs a
 
CREATE PRESCRIBED VI EWR_OPerson_Address(pid,aid)ASSELECT p.pid,a.aidFROM OPerson p,p.addrs a
合成的更新映射视图
合成以上视图(以及采用某种简化)来得到以下合成的更新映射视图:
 
CREATE VIEW SPerson(pid,name)ASSELECT pid,nameFROM OPerson CREATE VIEW SAddress(aid,pid,state)ASSELECT a.aid,p.pid,a.stateFROM OPerson p,p.addrs a
因此,表SPerson可被表达为对OPerson的简单投影,而SAddress是通过将OPerson与其地址联接来获得的。
Δ表达式生成
当应用程序要求其对象改变被保存到后端时,实施例可将这些改变转换到后端存储,即可按照对象的Δ表达式(基本关系)生成表(视图)的Δ表达式。这是视图生成/编译过程分解成RES构造实际有帮助的地方。非规定映射的Δ表达式可相对简单地生成,因为这些映射是在关系空间(RES是纯关系的),且已经做了大量关系数据库中的工作以实现该目标。例如,在数据库文献中,已经为按照关系操作符,诸如选择、投影、内或外或半联接、并、交和差表达的视图开发了Δ表达式。对非关系构造,所有需要做的是设计将非关系构造转换至RES空间/自RES空间转换的规定Δ表达式。
采用我们的Person示例来理解Δ表达式。考虑其中RES构造(例如,R_SAddress)被表达为两个对象集合(R_OAddress和R_OPerson_Address)的联接的情况。这样的视图的Δ表达式可使用以下规则来获取(假定联接视图为V=R JOIN S):
i(V)=[i(R)JOIN S 新]UNION[i(S)JOIN R 新]
d(V)=[d(R)JOIN S]UNION[d(S)JOIN R]
在该表达式中,i(X)和d(X)表示关系或视图X所插入和删除的元组,而R表示基本关系R在应用了其所有更新之后的新值。
因此,为了便于运行时的更新,一个示例性实施例可首先在编译时生成以下Δ表达式:
1.按照更新的对象集合1081的组的Δ改变表达式的RES关系1811的规定Δ改变表达式1803,例如按照i(OPerson)的i(R_OPerson)。
2.按照RES关系1812的Δ改变表达式的表1802的规定Δ改变表达式1804,例如按照i(R_SPerson)的i(SPerson)。
3.按照对象的RES关系的Δ表达式表达的表的RES关系的Δ表达式1813,例如,按照i(R_OPerson)的i(R_SPerson)。
可合成(1)、(2)和(3)来获得按照对象1821(例如,OPerson)的Δ表达式的表1822(例如,SPerson)的Δ表达式1820。该合成在图18示出。因此,与在查询的情况中一样,在编译时,现在具有从对象到表的直接转换。在更新的情况中,实际利用了RES分解来生成Δ表达式(对QM视图,该优点适用于通知)。
注意,不需要更新的Δ表达式——如稍后可见,模型更新可通过将其置入插入和删除集来建模;处理后步骤在稍后在改变实际应用于数据库之前将它们再次转化回更新。该方法的一个理由在于,对增量式视图维护的现有工作一般不具有用于更新的Δ表达式。或者,开发这样的表达式的更复杂实施例是可行的。
当执行视图合成之后,表的Δ表达式是完全按照对象集合和对象的插入和删除集的,即i(SPerson)是按照OPerson、i(OPerson)和d(OPerson)的。这些Δ表达式中的某些需要计算对象集合,例如i(OPerson)需要Eperson用于其计算。然而,整个集合可不在EDP客户机处高速缓存(或可能想要在集合最一致且最新的值上运行操作)。为了解决该问题,使用相应的查询映射视图来展开对象集合,例如使用OPerson的QM视图并按照SPerson和所需的其他关系来表达它。因此,在一个实施例中,在编译过程的结尾处,SPerson的所有Δ表达式是按照i(OPerson)、d(OPerson)和关系SPerson本身表达的——在运行时,给定OPerson的插入和删除集,现在可生成可在服务器执行的相关SQL语句。
总而言之,给定表和对象的RES构造之间的QM视图和UM视图以及这些构造与表/对象之间的规定转换,可执行以下示例性步骤:
1.生成以上在步骤1、2和3中提及的Δ表达式。
2.合成这些表达式,使得具有按照对象(OPerson)的Δ表达式以及对象集合本身的表(SPerson)的Δ表达式。
3.使用其QM视图来展开对象集合以获得按照对象的Δ表达式以及表本身的表(SPerson)的Δ表达式,即消除对象集合。可能存在允许实施例避免这种展开或者了解整个集合在客户机高速缓存的特例。
4.简化/优化表达式,使得它可减少运行时工作。
除了此处明确描述的特定实现之外,本领域的技术人员通过考虑此处公开的说明书,其他方面和实现是显然的。说明书和示出的实现旨在仅被认为是示例,落入所附权利要求书的真正范围和精神之内。

Claims (16)

1.一种用于向应用程序提供数据服务的方法,包括:
生成按照与数据库相关联的数据库模式表达与所述应用程序相关联的应用程序模式的至少一部分的查询视图(1302);
生成按照所述应用程序模式表达所述数据库模式的至少一部分的更新视图(1412);
利用所述查询视图来代表所述应用程序查询所述数据库(1303);
利用所述更新视图来代表所述应用程序更新所述数据库(1414);
其中,利用所述更新视图来计算对所述数据库的更新包括对所述更新视图应用视图维护算法,对所述更新视图应用视图维护算法产生所述更新视图的增量Δ表达式,还包括使用视图展开(1715)将所述增量Δ表达式与查询视图组合。
2.如权利要求1所述的方法,其特征在于,还包括从所述应用程序接收(1411)采用编程语言的对象,所述采用编程语言的对象包括用于更新所述数据库的数据。
3.如权利要求1所述的方法,其特征在于,还包括从所述应用程序接收(1411)创建、插入、更新或删除指令,所述创建、插入、更新或删除指令包括用于更新所述数据库的数据。
4.如权利要求1所述的方法,其特征在于,还包括从所述应用程序接收(1411)采用数据操纵语言DML的表达式,所述表达式包括用于更新所述数据库的数据。
5.如权利要求1所述的方法,其特征在于,利用所述更新视图来计算对所述数据库的更新包括对所接收的用于更新所述数据库的数据应用视图维护算法。
6.如权利要求1所述的方法,其特征在于,所述应用程序模式支持类、关系、继承、聚合和复杂类型。
7.如权利要求1所述的方法,其特征在于,所述更新视图是使用使所述应用程序模式与所述数据库模式相关的映射来生成的。
8.如权利要求7所述的方法,其特征在于,所述查询视图和所述更新视图是使用所述映射生成的。
9.一种用于向应用程序提供数据服务的数据访问系统,包括:
生成按照与数据库相关联的数据库模式表达与所述应用程序相关联的应用程序模式的至少一部分的查询视图的组件(110);
生成按照所述应用程序模式表达所述数据库模式的至少一部分的更新视图的组件(110);
利用所述查询视图来代表所述应用程序查询所述数据库的组件(113);
利用所述更新视图来代表所述应用程序更新所述数据库的组件(113);
其中,利用所述更新视图来计算对所述数据库的更新的所述组件(113)对所述更新视图应用视图维护算法,对所述更新视图应用视图维护算法产生所述更新视图的增量Δ表达式,还包括使用视图展开将所述增量Δ表达式与查询视图组合的组件(113)。
10.如权利要求9所述的数据访问系统,其特征在于,还包括从所述应用程序接收采用编程语言的对象的组件(113),所述采用编程语言的对象包括用于更新所述数据库的数据。
11.如权利要求9所述的数据访问系统,其特征在于,还包括从所述应用程序接收创建、插入、更新或删除指令的组件(113),所述创建、插入、更新或删除指令包括用于更新所述数据库的数据。
12.如权利要求9所述的数据访问系统,其特征在于,还包括从所述应用程序接收采用数据操纵语言DML的表达式的组件(113),所述表达式包括用于更新所述数据库的数据。
13.如权利要求9所述的数据访问系统,其特征在于,利用所述更新视图来计算对所述数据库的更新的所述组件(113)对所接收的用于更新所述数据库的数据应用视图维护算法。
14.如权利要求9所述的数据访问系统,其特征在于,所述应用程序模式支持类、关系、继承、聚合和复杂类型。
15.如权利要求9所述的数据访问系统,还包括用于生成使所述应用程序模式与所述数据库模式相关的映射的组件(114)。
16.如权利要求15所述的数据访问系统,其特征在于,所述查询视图和所述更新视图是使用所述映射生成的。
CN2007800099443A 2006-03-23 2007-03-22 具有增量式视图维护的映射体系结构 Expired - Fee Related CN101405729B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US78567206P 2006-03-23 2006-03-23
US60/785,672 2006-03-23
US11/725,206 US7680767B2 (en) 2006-03-23 2007-03-16 Mapping architecture with incremental view maintenance
US11/725,206 2007-03-16
PCT/US2007/007261 WO2007112009A1 (en) 2006-03-23 2007-03-22 Mapping architecture with incremental view maintenance

Publications (2)

Publication Number Publication Date
CN101405729A CN101405729A (zh) 2009-04-08
CN101405729B true CN101405729B (zh) 2011-04-20

Family

ID=38534796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800099443A Expired - Fee Related CN101405729B (zh) 2006-03-23 2007-03-22 具有增量式视图维护的映射体系结构

Country Status (12)

Country Link
US (1) US7680767B2 (zh)
EP (1) EP2008206B1 (zh)
JP (1) JP5064483B2 (zh)
KR (1) KR101411083B1 (zh)
CN (1) CN101405729B (zh)
AT (1) ATE528720T1 (zh)
AU (1) AU2007231006B2 (zh)
BR (1) BRPI0709108A2 (zh)
CA (1) CA2643699C (zh)
MX (1) MX2008011651A (zh)
RU (1) RU2441273C2 (zh)
WO (1) WO2007112009A1 (zh)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093495B (zh) * 2006-06-22 2011-08-17 国际商业机器公司 基于网状关系维的数据处理方法和系统
US8156149B2 (en) 2007-07-24 2012-04-10 Microsoft Corporation Composite nested streams
US8423955B2 (en) * 2007-08-31 2013-04-16 Red Hat, Inc. Method and apparatus for supporting multiple business process languages in BPM
US7996416B2 (en) * 2007-08-31 2011-08-09 Red Hat, Inc. Parameter type prediction in object relational mapping
US9058571B2 (en) * 2007-08-31 2015-06-16 Red Hat, Inc. Tool for automated transformation of a business process definition into a web application package
US8914804B2 (en) 2007-09-12 2014-12-16 Red Hat, Inc. Handling queues associated with web services of business processes
US8825713B2 (en) * 2007-09-12 2014-09-02 Red Hat, Inc. BPM system portable across databases
US7941398B2 (en) * 2007-09-26 2011-05-10 Pentaho Corporation Autopropagation of business intelligence metadata
US20090138500A1 (en) * 2007-10-12 2009-05-28 Yuan Zhiqiang Method of compact display combined with property-table-view for a complex relational data structure
US8429601B2 (en) * 2007-11-29 2013-04-23 Red Hat, Inc. Code completion for object relational mapping query language (OQL) queries
US8954952B2 (en) * 2007-11-30 2015-02-10 Red Hat, Inc. Portable business process deployment model across different application servers
US9336327B2 (en) * 2007-11-30 2016-05-10 Microsoft Technology Licensing, Llc Mapping and query translation between XML, objects, and relations
US8161000B2 (en) * 2008-01-04 2012-04-17 International Business Machines Corporation Generic bijection with graphs
US8166449B2 (en) * 2008-01-17 2012-04-24 Microsoft Corporation Live bidirectional synchronizing of a visual and a textual representation
US20090193004A1 (en) * 2008-01-30 2009-07-30 Business Objects, S.A. Apparatus and method for forming database tables from queries
US8209340B2 (en) * 2008-03-31 2012-06-26 Microsoft Corporation Efficient functional representation of result shaping
US8375014B1 (en) * 2008-06-19 2013-02-12 BioFortis, Inc. Database query builder
US8364750B2 (en) 2008-06-24 2013-01-29 Microsoft Corporation Automated translation of service invocations for batch processing
US8819046B2 (en) * 2008-06-24 2014-08-26 Microsoft Corporation Data query translating into mixed language data queries
US8375044B2 (en) * 2008-06-24 2013-02-12 Microsoft Corporation Query processing pipelines with single-item and multiple-item query operators
US8713048B2 (en) * 2008-06-24 2014-04-29 Microsoft Corporation Query processing with specialized query operators
US8364751B2 (en) * 2008-06-25 2013-01-29 Microsoft Corporation Automated client/server operation partitioning
US8676749B2 (en) * 2008-07-31 2014-03-18 Sybase, Inc. Statement logging in databases
US8176272B2 (en) * 2008-09-04 2012-05-08 International Business Machines Corporation Incremental backup using snapshot delta views
US8285708B2 (en) * 2008-10-21 2012-10-09 Microsoft Corporation Query submission pipeline using LINQ
CN101419616A (zh) * 2008-12-10 2009-04-29 阿里巴巴集团控股有限公司 一种数据同步方法及装置
US9047338B2 (en) 2008-12-17 2015-06-02 International Business Machines Corporation Managing drill-through targets
US8738584B2 (en) * 2009-02-17 2014-05-27 Microsoft Corporation Context-aware management of shared composite data
US8463743B2 (en) * 2009-02-17 2013-06-11 Microsoft Corporation Shared composite data representations and interfaces
US8065323B2 (en) * 2009-02-23 2011-11-22 Oracle International Corporation Offline validation of data in a database system for foreign key constraints
US8150882B2 (en) * 2009-03-03 2012-04-03 Microsoft Corporation Mapping from objects to data model
US8280924B2 (en) * 2009-03-26 2012-10-02 Microsoft Corporation Object-relational mapping with dynamic relational schemas
US9864796B2 (en) * 2009-06-24 2018-01-09 Microsoft Technology Licensing, Llc Databases from models
US8688752B2 (en) * 2009-08-28 2014-04-01 Adobe Sytems Incorporated Method and system for deploying a model-based application to an application server
CA2679786A1 (en) * 2009-09-16 2009-12-16 Ibm Canada Limited - Ibm Canada Limitee Conceptual representation of business processes for cross-domain mapping
US8667028B2 (en) * 2009-09-28 2014-03-04 At&T Global Network Services Deutschland Gmbh System and method to determine database schema impact
US8768947B2 (en) * 2009-12-22 2014-07-01 At&T Global Network Services Deutschland Gmbh System and method for implementing unique primary keys across enterprise databases
JP5090481B2 (ja) * 2010-01-28 2012-12-05 日本電信電話株式会社 データモデリング方法及び装置及びプログラム
US8739118B2 (en) 2010-04-08 2014-05-27 Microsoft Corporation Pragmatic mapping specification, compilation and validation
US10437846B2 (en) * 2010-05-28 2019-10-08 Oracle International Corporation System and method for providing data flexibility in a business intelligence server using an administration tool
CN101840230B (zh) * 2010-06-04 2012-02-01 浙江中控技术股份有限公司 一种监控和管理数据的方法及系统
US8843843B2 (en) * 2010-06-25 2014-09-23 International Business Machines Corporation Method and system using heuristics in performing batch updates of records
CA2706741C (en) 2010-06-29 2011-12-13 Ibm Canada Limited - Ibm Canada Limitee Managing parameters in filter expressions
US8566318B1 (en) * 2010-09-10 2013-10-22 Giovanni Sacco Process for physical database design based on transaction workload
US9460189B2 (en) 2010-09-23 2016-10-04 Microsoft Technology Licensing, Llc Data model dualization
US20120094600A1 (en) 2010-10-19 2012-04-19 Welch Allyn, Inc. Platform for patient monitoring
US9477730B2 (en) * 2010-10-28 2016-10-25 Microsoft Technology Licensing, Llc Web services runtime for dataset transformation
US8538963B2 (en) 2010-11-16 2013-09-17 International Business Machines Corporation Optimal persistence of a business process
US8874601B2 (en) * 2010-12-17 2014-10-28 Sap Ag SADL query view—a model-driven approach to speed-up read-only use cases
US20120158763A1 (en) * 2010-12-17 2012-06-21 Microsoft Corporation Bulk operations
US8650151B2 (en) * 2011-01-24 2014-02-11 International Business Machines Corporation Transactional service pipeline
US9141403B2 (en) * 2011-02-15 2015-09-22 Microsoft Technology Licensing, Llc Data-driven schema for describing and executing management tasks in a graphical user interface
CN102104510B (zh) * 2011-03-01 2014-01-29 北京中创信测科技股份有限公司 一种数据视图处理方法和系统
JP5673246B2 (ja) * 2011-03-14 2015-02-18 富士通株式会社 データストア制御装置、データストア制御プログラムおよびデータストア制御方法
US8601007B2 (en) * 2011-05-17 2013-12-03 Microsoft Corporation Net change notification based cached views with linked attributes
US9396284B2 (en) * 2011-05-18 2016-07-19 Oracle International Corporation Method and system for implementing efficient updatable relational views over XML data
US9195769B2 (en) * 2011-07-20 2015-11-24 Opentable, Inc. Method and apparatus for quickly evaluating entities
US8601016B2 (en) 2011-08-30 2013-12-03 International Business Machines Corporation Pre-generation of structured query language (SQL) from application programming interface (API) defined query systems
US9201558B1 (en) 2011-11-03 2015-12-01 Pervasive Software Inc. Data transformation system, graphical mapping tool, and method for creating a schema map
US9430114B1 (en) 2011-11-03 2016-08-30 Pervasive Software Data transformation system, graphical mapping tool, and method for creating a schema map
CN102521401B (zh) * 2011-12-24 2014-10-15 北京数码大方科技股份有限公司 数据视图的处理方法及装置
US8990187B2 (en) 2012-05-21 2015-03-24 Google Inc. Efficient top-down hierarchical join on a hierarchically clustered data stream
US9922303B2 (en) 2012-08-30 2018-03-20 Oracle International Corporation Method and system for implementing product group mappings
US9953353B2 (en) 2012-08-30 2018-04-24 Oracle International Corporation Method and system for implementing an architecture for a sales catalog
US10223697B2 (en) 2012-08-30 2019-03-05 Oracle International Corporation Method and system for implementing a CRM quote and order capture context service
RU2515565C1 (ru) * 2012-10-22 2014-05-10 Закрытое акционерное общество Научно-производственное предприятие "Реляционные экспертные системы" Способ обновления структурированных данных в системе управления реляционными базами данных
US9098546B2 (en) * 2012-12-12 2015-08-04 Sap Se Advanced business query language
US9424304B2 (en) * 2012-12-20 2016-08-23 LogicBlox, Inc. Maintenance of active database queries
CN103092998B (zh) * 2013-02-21 2017-02-08 用友网络科技股份有限公司 数据查询系统和数据查询方法
WO2014144931A2 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
US10705802B2 (en) 2013-03-20 2020-07-07 Microsoft Technology Licensing, Llc Extensible and queryable strong types
US9734183B2 (en) * 2013-08-08 2017-08-15 Hong Kong Baptist University System and method for performing view updates in database systems
US9342555B2 (en) 2013-08-30 2016-05-17 International Business Machines Corporation Reporting tools for object-relational databases
WO2015035289A1 (en) * 2013-09-06 2015-03-12 Unisys Corporation Business suite framework for developing software applications
CN104519103B (zh) * 2013-09-30 2018-10-26 腾讯科技(北京)有限公司 网络数据的同步处理方法、服务器及相关系统
CN104598374B (zh) 2013-10-30 2017-12-01 国际商业机器公司 校正失效脚本的方法和设备
US20150193852A1 (en) * 2014-01-09 2015-07-09 Cgi Federal, Inc. System and method for multi-user evaluation of healthplan benefit based on prescription coverage annual cost
EP3097481B1 (en) 2014-01-21 2022-11-30 Oracle International Corporation System and method for supporting multi-tenancy in an application server, cloud, or other environment
CN105138526B (zh) * 2014-05-30 2019-02-22 国际商业机器公司 用于为关系型数据库自动生成语义映射的方法和系统
US10594619B2 (en) 2014-06-23 2020-03-17 Oracle International Corporation System and method for supporting configuration of dynamic clusters in a multitenant application server environment
KR102663126B1 (ko) * 2014-06-23 2024-05-07 오라클 인터내셔날 코포레이션 멀티테넌트 어플리케이션 서버 환경에서 복수의 파티션 편집 세션들을 지원하는 시스템 및 방법
WO2016011677A1 (en) * 2014-07-25 2016-01-28 Hewlett-Packard Development Company, L.P. Local database cache
US20160070541A1 (en) * 2014-09-08 2016-03-10 Unisys Corporation Conversion of business suite solutions
US10372697B2 (en) 2014-12-19 2019-08-06 International Business Machines Corporation Responding to data requests related to constrained natural language vocabulary terms
CN104731911A (zh) * 2015-03-24 2015-06-24 浪潮集团有限公司 一种数据表与实体类的动态映射及转换方法
US10078676B2 (en) * 2015-04-06 2018-09-18 Sap Se Schema evolution in multi-tenant environment
EP3079065B1 (en) 2015-04-08 2019-06-12 Huawei Technologies Co., Ltd. Redo-logging for partitioned in-memory datasets
US10872065B1 (en) * 2015-08-03 2020-12-22 Intelligence Designs, LLC System for managing relational databases using XML objects
US11138223B2 (en) * 2015-09-09 2021-10-05 LiveData, Inc. Techniques for uniting multiple databases and related systems and methods
US10970311B2 (en) * 2015-12-07 2021-04-06 International Business Machines Corporation Scalable snapshot isolation on non-transactional NoSQL
US10394775B2 (en) 2015-12-28 2019-08-27 International Business Machines Corporation Order constraint for transaction processing with snapshot isolation on non-transactional NoSQL servers
US10838940B1 (en) * 2016-08-11 2020-11-17 MuleSoft, Inc. Balanced key range based retrieval of key-value database
US10437564B1 (en) 2016-09-16 2019-10-08 Software Tree, LLC Object mapping and conversion system
US11086895B2 (en) 2017-05-09 2021-08-10 Oracle International Corporation System and method for providing a hybrid set-based extract, load, and transformation of data
US10558658B2 (en) * 2017-05-16 2020-02-11 Sap Se Propagation of structured query language associations
US10521223B1 (en) * 2017-08-22 2019-12-31 Wells Fargo Bank, N.A. Systems and methods of a metadata orchestrator augmenting application development
US11138157B2 (en) 2017-08-30 2021-10-05 Jpmorgan Chase Bank, N.A. System and method for identifying business logic and data lineage with machine learning
US10698884B2 (en) * 2017-11-06 2020-06-30 Bank Of America Corporation Dynamic lineage validation system
CN108038665B (zh) * 2017-12-08 2020-01-24 平安科技(深圳)有限公司 业务规则管理方法、装置、设备及计算机可读存储介质
US11106820B2 (en) * 2018-03-19 2021-08-31 International Business Machines Corporation Data anonymization
US11226854B2 (en) * 2018-06-28 2022-01-18 Atlassian Pty Ltd. Automatic integration of multiple graph data structures
US11036497B1 (en) 2018-10-24 2021-06-15 Cerner Innovation, Inc. Code assessment for quality control of an object relational mapper and correction of problematic cast functions
CN111798311A (zh) * 2020-07-22 2020-10-20 睿智合创(北京)科技有限公司 基于大数据的银行风险分析库平台、搭建方法及可读介质
CN111984977B (zh) * 2020-08-06 2022-07-19 成都安恒信息技术有限公司 一种基于运维审计系统的多租户权限鉴权方法
US20220147568A1 (en) * 2020-11-10 2022-05-12 Sap Se Mapping expression generator
EP4030313A1 (en) * 2021-01-13 2022-07-20 Sage Global Services Limited Sql statement generator
US11829735B2 (en) 2021-07-14 2023-11-28 Bank Of America Corporation Artificial intelligence (AI) framework to identify object-relational mapping issues in real-time
US20230091845A1 (en) * 2021-09-22 2023-03-23 Sap Se Centralized metadata repository with relevancy identifiers
US11797552B2 (en) 2021-10-01 2023-10-24 Sap Se System and method for selective retrieval of metadata artefact versions
US12099883B1 (en) 2023-10-27 2024-09-24 Eygs Llp Systems and methods to generate machine-executable programs configured to present data in cloud environments

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1547137A (zh) * 2003-12-02 2004-11-17 中国科学院计算技术研究所 基于数据库的海量文件管理系统与方法
CN1647080A (zh) * 2002-04-25 2005-07-27 国际商业机器公司 多数据库环境中存取数据的方法、计算机程序和计算机

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504885A (en) * 1993-06-29 1996-04-02 Texas Instruments Incorporated O-R gateway: a system for connecting object-oriented application programs and relational databases
US5907846A (en) * 1996-06-07 1999-05-25 Electronic Data Systems Corporation Method and system for accessing relational databases using objects
US6058391A (en) * 1997-12-17 2000-05-02 Mci Communications Corporation Enhanced user view/update capability for managing data from relational tables
US6175837B1 (en) * 1998-06-29 2001-01-16 Sun Microsystems, Inc. Object-relational mapping toll that processes views
US6718320B1 (en) * 1998-11-02 2004-04-06 International Business Machines Corporation Schema mapping system and method
US6421658B1 (en) * 1999-07-30 2002-07-16 International Business Machines Corporation Efficient implementation of typed view hierarchies for ORDBMS
US6618733B1 (en) * 2000-04-11 2003-09-09 Revelink Inc. View navigation for creation, update and querying of data objects and textual annotations of relations between data objects
US6795825B2 (en) * 2000-09-12 2004-09-21 Naphtali David Rishe Database querying system and method
US6915305B2 (en) * 2001-08-15 2005-07-05 International Business Machines Corporation Restructuring view maintenance system and method
US6865569B1 (en) * 2001-08-22 2005-03-08 Ncr Corporation Determining materialized view coverage
US7263512B2 (en) * 2002-04-02 2007-08-28 Mcgoveran David O Accessing and updating views and relations in a relational database
AU2002953555A0 (en) * 2002-12-23 2003-01-16 Canon Kabushiki Kaisha Method for presenting hierarchical data
CA2438997A1 (en) * 2003-08-28 2005-02-28 Ibm Canada Limited - Ibm Canada Limitee System and method for carrying out legacy application transitions
US7739223B2 (en) * 2003-08-29 2010-06-15 Microsoft Corporation Mapping architecture for arbitrary data models
US8150893B2 (en) * 2004-12-29 2012-04-03 Alcatel Lucent Method and apparatus for incremental evaluation of schema-directed XML publishing
US7685561B2 (en) * 2005-02-28 2010-03-23 Microsoft Corporation Storage API for a common data platform
US7853961B2 (en) * 2005-02-28 2010-12-14 Microsoft Corporation Platform for data services across disparate application frameworks
US20060195460A1 (en) * 2005-02-28 2006-08-31 Microsoft Corporation Data model for object-relational data
US7676493B2 (en) * 2005-09-07 2010-03-09 Microsoft Corporation Incremental approach to an object-relational solution
US7440957B1 (en) * 2005-11-30 2008-10-21 At&T Intellectual Property Ii, L.P. Updates through views
US7467128B2 (en) * 2006-02-15 2008-12-16 Microsoft Corporation Maintenance of materialized outer-join views

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1647080A (zh) * 2002-04-25 2005-07-27 国际商业机器公司 多数据库环境中存取数据的方法、计算机程序和计算机
CN1547137A (zh) * 2003-12-02 2004-11-17 中国科学院计算技术研究所 基于数据库的海量文件管理系统与方法

Also Published As

Publication number Publication date
CN101405729A (zh) 2009-04-08
BRPI0709108A2 (pt) 2011-06-28
KR20090004881A (ko) 2009-01-12
RU2008137769A (ru) 2010-03-27
EP2008206B1 (en) 2011-10-12
US20070226196A1 (en) 2007-09-27
ATE528720T1 (de) 2011-10-15
EP2008206A4 (en) 2010-04-21
CA2643699C (en) 2014-01-07
US7680767B2 (en) 2010-03-16
RU2441273C2 (ru) 2012-01-27
AU2007231006B2 (en) 2011-10-06
JP5064483B2 (ja) 2012-10-31
CA2643699A1 (en) 2007-10-04
AU2007231006A1 (en) 2007-10-04
EP2008206A1 (en) 2008-12-31
JP2009544064A (ja) 2009-12-10
KR101411083B1 (ko) 2014-07-03
WO2007112009A1 (en) 2007-10-04
MX2008011651A (es) 2008-09-22

Similar Documents

Publication Publication Date Title
CN101405729B (zh) 具有增量式视图维护的映射体系结构
US10268742B2 (en) View maintenance rules for an update pipeline of an object-relational mapping (ORM) platform
US5504885A (en) O-R gateway: a system for connecting object-oriented application programs and relational databases
US7647298B2 (en) Generation of query and update views for object relational mapping
Adya et al. Anatomy of the ado. net entity framework
US6611838B1 (en) Metadata exchange
US20100082646A1 (en) Tracking constraints and dependencies across mapping layers
CN100468396C (zh) 用于任意数据模型的映射体系结构
US20040044687A1 (en) Apparatus and method using pre-described patterns and reflection to generate a database schema
JP2008511928A (ja) メタデータの管理
US20040044989A1 (en) Apparatus and method using pre-described patterns and reflection to generate source code
Dittrich et al. Component database systems
Vaduva et al. Metadata management for data warehousing: An overview
Staudt et al. The role of metadata for data warehousing
Brandani Multi-database Access from Amos II using ODBC
US20040044637A1 (en) Apparatus and method using reflection to generate database commands at runtime
Zdonik What Makes Object-Oriented Database Management Systems Different?
Alia et al. A middleware framework for the persistence and querying of java objects
Mordinyi et al. Semantic data integration: tools and architectures
Song et al. Structured data transformation algebra (SDTA) and its applications
SRAI et al. INTEGRATION OF THE MDA APPROACH IN DOCUMENT-ORIENTED NOSQL DATABASES, GENERATION OF A PSM MODEL FROM A PIM MODEL
Habela et al. Overcoming the complexity of object-oriented DBMS metadata management
Russo et al. Programming Microsoft LINQ in. NET Framework 4
Ahmed et al. Using an object model in Pegasus to integrate heterogeneous data
Van Lingen Seamless Integration of Information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150428

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150428

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Washington State

Patentee before: Microsoft Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110420

CF01 Termination of patent right due to non-payment of annual fee