CN105981010B - 创建数据视图 - Google Patents

创建数据视图 Download PDF

Info

Publication number
CN105981010B
CN105981010B CN201580007260.4A CN201580007260A CN105981010B CN 105981010 B CN105981010 B CN 105981010B CN 201580007260 A CN201580007260 A CN 201580007260A CN 105981010 B CN105981010 B CN 105981010B
Authority
CN
China
Prior art keywords
data
view
data element
source
data source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580007260.4A
Other languages
English (en)
Other versions
CN105981010A (zh
Inventor
C·林斯伯格
Z·卡斯珀斯基
S·尤拜伊尔
V·克里希南
S·巴拉苏布拉马尼恩
K·慕克吉
S·L·瑞古纳萨恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN105981010A publication Critical patent/CN105981010A/zh
Application granted granted Critical
Publication of CN105981010B publication Critical patent/CN105981010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及用于创建数据视图的方法、系统和计算机程序产品。本发明的实施例允许在数据源之上自动创建数据视图/推算。可以在一个数据源上(通过查看该数据源内的一个或多个数据元素)或通过查看(同一或不同数据类型的)多个数据源并将各元素组合成一个视图来创建视图。数据源可以是任何类型的数据源,包括但不限于:数据库、文件和Web服务。视图可以从一组预定义的视图中选取、从另一个租户的视图中挑选(或者静态地或者使用模糊逻辑)、基于数据元素分类和/或数据元素关系分类来选择、基于数据使用情况来选择(例如,通过查看日志)等等。

Description

创建数据视图
背景
1.背景和相关技术
计算机系统及相关技术影响社会的许多方面。的确,计算机系统处理信息的能力已转变了人们生活和工作的方式。现在,计算机系统通常执行在计算机系统出现以前人工执行的许多任务(例如,文字处理、日程安排、帐目管理等)。最近,计算机系统彼此耦合并耦合到其它电子设备以形成计算机系统及其它电子设备可在其上传输电子数据的有线和无线计算机网络。因此,许多计算任务的执行被分布在多个不同的计算机系统和/或多个不同的计算环境中。
在许多环境中(诸如例如数据库环境和Web浏览环境),用户经常在一个更大的数据集内查询指定数据。例如,用户可以查询数据库以寻找特定顾客的销售数据的视图(或推算(projection))。在Web上,用户可搜索特定的数据主题。
然而,从数据集中提取有意义的视图/推算可能随着数据集的大小的增加而变得困难。用户可能需要对数据集和底层的数据存储机制以及数据集的存储方案的必要的熟悉程度,以便从数据集中提取有意义的视图。此外,即使为一位用户提取出了有意义的视图,也不能保证同样的视图对其他用户是有意义的。
因此,个人用户常常花费时间来尝试获得领域知识,以及理解产生数据的应用或系统如何存储该数据。在执行这些任务之后,一位用户可能能够在数据之上创建他人能够消费的视图。
然而,即使这样,如果应用/系统如何将数据存储在数据库中的方案或逻辑改变,则之前创建的视图可能变得过时或不再起作用。用户可能需要手动检查这些改变并更新创建的视图以进行匹配。手动检查和更新是容易出错的,并且还需要基本不断的对于数据集的理解和用其进行工作。
简要概述
本发明涉及用于创建数据视图的方法、系统和计算机程序产品。接收包括一个或多个查询项的查询。响应于该查询,访问数据目录。数据目录维护来自一个或多个数据源的多个不同的并且原本不连接的但是相关的数据之间的链接。
通过参考数据目录自动推断满足该一个或多个查询项的数据视图。推断数据视图包括确定第一数据源包含满足该一个或多个查询项的第一数据。推断数据视图还包括确定第二数据源包含满足该一个或多个查询项的第二数据。推断数据视图还包括将第一数据和第二数据组装成数据视图。响应于接收查询而返回该数据视图。
提供本概述以便以简化的形式介绍将在以下的详细描述中进一步描述的一些概念。本概述并非旨在标识出要求保护的主题的关键特征或必要特征,亦非旨在用作辅助确定要求保护的主题的范围。
本发明的附加特征和优点将在以下描述中叙述,并且其一部分根据本描述将是显而易见的,或者可通过对本发明的实践来获知。本发明的特征和优点可通过在所附权利要求书中特别指出的工具和组合来实现和获得。本发明的这些以及其它特征、优点和特征将根据以下描述和所附权利要求而变得更显而易见,或者可通过如此后阐述的对本发明的实践而获知。
附图简述
为了描述可获得本发明的上述和其它优点和特征的方式,将通过参考附图中示出的本发明的具体实施例来呈现以上简要描述的本发明的更具体描述。可以理解,这些附图只描绘了本发明的各典型实施例,并且因此不被认为是对其范围的限制,将通过使用附图并利用附加特征和细节来描述和解释本发明,在附图中:
图1示出促成创建数据视图的示例计算机体系结构。
图2示出用于创建数据视图的示例方法的流程图。
图3示出促成维护数据目录的示例计算机体系结构。
图4示出用于维护数据目录的示例方法的流程图。
详细描述
本发明涉及用于创建数据视图的方法、系统和计算机程序产品。接收包括一个或多个查询项的查询。响应于该查询,访问数据目录。数据目录维护来自一个或多个数据源的多个不同的并且原本不连接的但是相关的数据之间的链接。
通过参考数据目录自动推断满足该一个或多个查询项的数据视图。推断数据视图包括确定第一数据源包含满足该一个或多个查询项的第一数据。推断数据视图还包括确定第二数据源包含满足该一个或多个查询项的第二数据。推断数据视图还包括将第一数据和第二数据组装成数据视图。响应于接收查询而返回该数据视图。
本发明的各实施例可包括或利用专用或通用计算机,该专用或通用计算机包括诸如举例而言一个或多个处理器和系统存储器的计算机硬件,如以下更详细讨论的。本发明范围内的各实施例也包括用于实现或存储计算机可执行指令和/或数据结构的实体及其他计算机可读介质。这样的计算机可读介质可以是可由通用或专用计算机系统访问的任何可用介质。存储计算机可执行指令的计算机可读介质是计算机存储介质(设备)。承载计算机可执行指令的计算机可读介质是传输介质。由此,作为示例而非限制,本发明的各实施例可包括至少两种显著不同的计算机可读介质:计算机存储介质(设备)和传输介质。
计算机存储介质(设备)包括RAM、ROM、EEPROM、CD-ROM、固态驱动器(“SSD”)(如基于RAM)、闪存、相变存储器(“PCM”)、其它类型的存储器、其它光盘存储、磁盘存储或其它磁存储设备、或可用于存储计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的任何其它介质。
“网络”被定义为使得电子数据能够在计算机系统和/或模块和/或其它电子设备之间传输的一个或多个数据链路。当信息通过网络或另一个通信连接(硬连线、无线、或者硬连线或无线的组合)传输或提供给计算机时,该计算机将该连接适当地视为传输介质。传输介质可以包括可以用来携带所需要的以计算机可执行的指令或数据结构的形式存在的程序代码装置并可以被通用或专用计算机访问的网络和/或数据链路。上述的组合应当也被包括在计算机可读介质的范围内。
此外,在到达各种计算机系统组件之后,计算机可执行指令或数据结构形式的程序代码装置可从传输介质自动传输到计算机存储介质(设备)(或反之亦然)。例如,通过网络或数据链接接收到的计算机可执行指令或数据结构可被缓存在网络接口模块(例如,“NIC”)内的RAM中,然后最终被传输到计算机系统RAM和/或计算机系统处的较不易失性的计算机存储介质(设备)。因而,应当理解,计算机存储介质(设备)可被包括在还利用(甚至主要利用)传输介质的计算机系统组件中。
计算机可执行指令例如包括,当在处理器处执行时使通用计算机、专用计算机、或专用处理设备执行某一功能或某组功能的指令和数据。计算机可执行指令可以是例如二进制代码、诸如汇编语言之类的中间格式指令、或甚至源代码。尽管用结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述特征或动作。相反,上述特征和动作是作为实现权利要求的示例形式而公开的。
本领域的技术人员将理解,本发明可以在具有许多类型的计算机系统配置的网络计算环境中实践,这些计算机系统配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式设备、多处理器系统、基于微处理器的或可编程消费电子设备、网络PC、小型计算机、大型计算机、移动电话、PDA、平板、寻呼机、路由器、交换机等等。本发明也可在其中通过网络链接(或者通过硬连线数据链路、无线数据链路,或者通过硬连线和无线数据链路的组合)的本地和远程计算机系统两者都执行任务的分布式系统环境中实施。在分布式系统环境中,程序模块可以位于本地和远程存储器存储设备二者中。
本发明的各实施例还可以在云计算环境中实现。在该描述和下面的权利要求书中,“云计算”被定义为用于允许对可配置计算资源的共享池的按需网络访问的模型。例如,云计算机可被部署于市场以提供对可配置计算资源的共享池的普遍存在且方便的按需访问。可配置计算资源的共享池可经由虚拟化而被快速地供应,并可利用低管理努力或服务提供商交互来释放,并随后相应被缩放。
云计算模型可由各种特性组成,诸如举例来说按需自服务、广泛网络访问、资源池、快速灵活性、测定的服务等。云计算模型还可展现各种服务模型,诸如例如软件即服务(“SaaS”)、平台即服务(“PaaS”)以及基础结构即服务(“IaaS”)。云计算模型还可以使用不同的部署模型来部署,诸如私有云、社区云、公共云、混合云等。在该描述和权利要求书中,“云计算环境”是其中采用了云计算的环境。
本发明的实施例允许在数据源之上自动创建数据视图/推算。可以在一个数据源上(通过查看该数据源内的一个或多个数据元素)或通过查看(同一或不同数据类型的)多个数据源并将各元素组合成一个视图来创建视图。数据源可以是任何类型的数据源,包括但不限于:数据库、文件和Web服务。视图可以从一组预定义的视图中选取、从另一个租户的视图中挑选(或者静态地或者使用模糊逻辑)、基于数据元素分类和/或数据元素关系分类来选择、基于数据使用情况来选择(例如,通过查看日志)等等。
图1示出促成创建数据视图的示例计算机体系结构100。参照图1,计算机体系结构100包括计算机系统101、计算机系统102、数据爬虫108、管理员109、以及数据源111。计算机系统101、计算机系统102、数据爬虫108、管理员109、以及数据源111中的每一个可通过诸如例如局域网(“LAN”)、广域网(“WAN”)、以及甚至因特网等网络(或作为网络的一部分)彼此连接。因此,计算机系统101、计算机系统102、数据爬虫108、管理员109、以及数据源111以及任何其它已连接的计算机系统及其组件可以创建消息相关数据并通过网络交换消息相关数据(例如,网际协议(“IP”)数据报和利用IP数据报的其它更高层协议,诸如传输控制协议(“TCP”)、超文本传输协议(“HTTP”)、简单邮件传输协议(“SMTP”)等,或使用其它非数据报协议)。
如所描绘的,计算机系统102包括视图创建模块103。一般来说,视图创建模块103被配置成接收查询项并返回包含与该查询项有关的数据的数据视图。视图创建模块103进一步包括数据目录104、数据虚拟化系统106、和高速缓存107。数据目录104被配置成维护取自数据源111的数据元素并且维护取自数据源111的各数据元素之间的关系(例如,链接)。在一些实施例中,数据目录104维护来自数据源111中的一个或多个的多个不同的并且原本不连接的但是相关的数据元素之间的链接。
数据虚拟化系统106被配置成将不同格式和/或不同数据类型的数据虚拟化以供数据目录104处理。在一些实施例中,数据虚拟化系统106将不同数据格式和/或不同数据类型的数据转换成可由数据目录104处理的统一格式。因此,视图创建模块103可访问来自任何一个数据源111的数据并且数据目录104能够处理该数据。在其它实施例中,数据目录104理解并且能够处理不同数据格式和/或数据类型。
高速缓存107被配置成存储之前的查询的结果以及其它数据元素。当返回数据视图时,数据目录104可在从数据源111中检索数据元素之前检查数据元素。
数据源111可包括几乎任何类型或种类的数据源,包括但不限于:Web服务、数据库(包括分布式和/或多租户数据库,诸如例如云数据库)、表、列、文件(包括文档、电子表格、图像、视频、音频等)、网页、编程对象等。例如,如所描绘的,数据源111包括:Web服务111A、数据库111B、数据库111C、文件111D、网页111E、以及表111F。数据源可被包含在另一数据源内。例如,表可被包含在数据库内、文件可被包含在网页内等等。
一般来说,数据爬虫108和管理员109被配置成从数据源111中拉取数据供在视图创建模块103处使用(以及可能的存储)。数据爬虫108和管理员109可从相同和/或不同的数据源中拉取数据。例如,管理员109可从Web服务111A、数据库111B、数据库111C、以及文件111D中拉取数据。数据爬虫108可从文件111D、网页111E、以及表111F中拉取数据。数据爬虫108可以是一个自动化的过程。管理员109可以是使用计算机系统的人类用户。
图2示出用于创建数据视图的示例方法200的流程图。方法200将参考计算机架构100的组件和数据来描述。
方法200包括接收查询,该查询包括一个或多个查询项(201)。例如,计算机系统101可发送包括查询项142、143等的查询141给计算机系统102。计算机系统102可从计算机系统101接收查询141。例如,查询项142可以是项“销售额”,而查询项143可以是公司的名称。
方法200包括响应于接收查询,访问数据目录,该数据目录维护来自一个或多个数据源的多个不同的并且原本不连接的但是相关的数据元素之间的链接(202)。例如,响应于接收查询141,视图创建模块103可访问数据目录104。如所描绘的,数据目录104包括链接的数据元素113。
链接的数据元素113指示包含在数据源111中的各数据元素之间的链接。链接的数据元素113可被用于指示相同和/或不同数据源中的数据元素之间的链接。例如,链接131指示数据元素121(来自web服务111A)和数据元素122(来自数据库111C)是链接的。
链接132指示数据元素123(来自数据库111B)和来自网页111E的数据元素124是链接的。链接133指示数据元素124和数据元素126(来自表111F)是链接的。基于链接132和133,还可推断数据元素123和数据元素126具有关系。例如,数据元素123可以是一个潜在的新客户的预计收入,数据元素124可以是来自该潜在的新客户的网页的该潜在的新客户的联系信息,而数据元素126可以是来自公开记录的该潜在的新客户的市值。
方法200包括响应于接收查询,通过参考数据目录来自动推断满足该一个或多个查询项的数据视图(203)。例如,响应于接收查询141,视图创建模块103可推断数据视图144。通过参考数据目录104,数据视图144可满足查询项142、143等中的一个或多个。
自动推断数据视图可包括确定第一数据源包含满足该一个或多个查询项的第一数据(204)。例如,视图创建模块103可确定数据库111B包含数据元素123。数据元素123或其一部分可至少部分满足查询项142、143等中的一个或多个。自动推断数据视图可包括确定第二数据源包含满足该一个或多个查询项的第二数据(205)。例如,视图创建模块103可确定网页111E包含数据元素124。数据元素124或其一部分可至少部分满足查询项142、143等中的一个或多个。
视图创建模块103可进一步确定表111F包含数据元素126。数据元素126或其一部分可至少部分满足查询项142、143等中的一个或多个。
在标识数据元素123、124以及126之际,视图创建模块103可查阅高速缓存107以确定数据元素123、124以及126中的任何一个是否被存储在高速缓存107中。如果数据元素123、124以及126中的任何一个被存储在高速缓存107中,则视图创建模块103可从高速缓存107中访问本地存储的数据元素。对于没有存储在高速缓存107中的数据元素123、124以及126中的任何一个,视图创建模块103可从对应的数据源111中访问那些数据元素。
自动推断数据视图可包括将第一数据和第二数据组装成数据视图(206)。例如,视图创建模块103可将数据元素123和数据元素124组装成数据视图144。视图创建模块还可根据数据元素123、124以及126中的一个或多个来推导或合成数据元素127。虽然未明示地包括在数据源中,但是数据元素127可至少部分满足查询项142和143中的一个或多个。数据元素123、124以及127的组合可满足查询项142、143等。
方法200包括响应于接收查询,返回数据视图(207)。例如,计算机系统102可返回包括数据元素123、124以及127的数据视图144给计算机系统101。计算机系统101可从计算机系统102接收数据视图144。
转到图3,数据目录104的内容,以及更具体的,是链接的数据元素113的内容,可响应于接收到的信号随时间改变。链接的数据元素113中包括的数据元素可改变。类似地,链接的数据元素113中的数据元素之间的链接也可改变。例如,之前不连接但是相关的数据元素之间的链接可能被发现。
图3示出促成维护数据目录的示例计算机体系结构300。参考图3,计算机体系结构300包括计算机系统102和数据源111。如所描述的,计算机系统102和数据源111可被连接到网络(或者是网络的一部分)并且可通过网络创建和交换消息相关数据。
一般来说,计算机系统102可从信号371中接收信号。各种不同信号中的任何一个可被包括在信号371中,包括但不限于:企业的组织图(例如,标识按照相同部门、相同的职位、相同的经理、同事等管理的数据)、与视图有关的用户历史、用户对视图的选择/点击频率、用户反馈、数据的质量(诸如例如数据源的认证/官方属性)、针对性的模型(用户标识的数据元素之间的连接)、根据元数据或数据布局来标识的关系(诸如例如数据类型、列的名称等)、发现相同数据的频率、具有相同或相似的数据布局或元数据布局的多组数据(诸如例如具有(可能明显的)重叠的数据)、专家输入(例如,提高或降低数据或数据之间的链接)、用户搜索项、规则等等。规则可包括对混合数据、非混合数据、作为训练的用户数据、总是浮出的数据、从不浮出的数据、忽略数据等的指示。
如所描绘的,信号371包括组织图372、用户历史373、针对性模型374、专家输入376、规则377、以及查询项378。
图4示出用于维护数据目录的示例方法400的流程图。方法400将参考计算机架构300的组件和数据来描述。
方法400包括访问数据目录,该数据目录包含多个不同的且原本不连接但相关的数据元素之间的链接,该数据目录还包含彼此不链接的多个数据元素,该数据目录用于在多个不同数据源上创建数据视图(401)。例如,视图创建模块103可访问数据目录104。数据目录104可包含链接的数据元素113以及对不链接的其它数据元素的指示。
方法400包括接收与一个或多个数据元素有关的信号(402)。例如,计算机系统102可接收与数据元素351(包含在数据库111B中)以及数据元素352(包含在文件111D中)有关的信号371。方法400包括响应于接收的信号更改数据目录的内容(403)。例如,视图创建模块103可响应于信号371而更改数据目录104。在一些实施例中,视图创建模块103响应于信号371而标识数据元素351和352之间的新链接353。视图创建模块103可随后在链接的数据元素113中指示新链接353。
在其它实施例中,视图创建模块103在数据目录104中指示新数据元素。在进一步实施例中,视图创建模块103移除数据目录104中的数据元素之间的链接。在附加实施例中,视图创建模块103从数据目录104中移除数据元素。
相应地,本发明的各实施例促成在数据之上自动化创建数据视图/推算。可以在一个数据源上(通过查看该数据源内的一个或多个数据元素)或通过查看多个数据源并将各元素组合成一个视图来创建视图。数据源可以是任何类型的数据源,包括数据库、文件和Web服务。
在一些实施例中,使用了更具体的机制来创建数据视图。例如,可从一组预定义的数据视图中选择响应于查询项的数据视图。系统(诸如例如视图创建模块103)可考虑可用数据源(诸如例如数据源111)上的一组预定义视图。预定义视图可由管理员创建或由知晓数据源和对应方案的第三方添加。
在多租户环境中,针对一个租户的响应于查询项的数据视图可基于另一租户对该数据视图的使用情况而被选择。在多租户环境中,系统(诸如例如视图创建模块103)可借鉴他人的构建。例如,两家公司A和B可能正在云中彼此独立地使用视图创建模块。如果在A公司中有人理解数据源Y的方案,并且在B公司中有人有一个看起来像Y的数据源,则视图创建模块可以为B公司提议视图,因为它学习了为A公司创建的视图。匹配可以是静态的(例如,一对一匹配)或模糊的。对于模糊匹配,视图创建模块可通过组合多个视图来提议视图中可适合和/或可适配的部分,即使一些数据元素并不精准地适合某一视图。
系统(诸如例如视图创建模块103)可从数据的自动分类中推断视图。视图创建模块可以自动地对数据元素(例如表、列等)和相应的数据源(例如,数据源111)中的元素之间的关系进行分类。在分类的基础上,视图创建模块可以自动地提议视图。例如,视图创建模块可知道某些分类的元素一般它们自己是没用的,但如果它们与某个其它类型的其它元素联合/匹配,则它们可由消费者使用。
系统(诸如例如视图创建模块103)可创建因使用情况而异的视图。例如,视图创建模块可回顾过往(例如,查看日志或其它历史数据)来标识某些元素如何被用来创建视图。如果具有类似元素的其它数据源变得对视图创建模块可访问,则视图创建模块可自动为这些其它数据源建议视图。
一般来说,推断视图可跨一个或多个数据源进行,其中该一个或多个数据源具有相同类型或不同数据类型(例如,两个SQL服务器数据库、或一个SQL服务器数据库和一个Excel文件)。模糊创建可与所描述的机制和算法中的任何一个一起使用。当完整视图的构建是不可能的时,可以创建部分视图。可以通知管理员或用户来填充空白或作出与没有自动创建的视图部分有关的决策。
本发明可具体化为其它具体形式而不背离其精神或本质特征。所描述的实施例在所有方面都应被认为仅是说明性而非限制性的。从而,本发明的范围由所附权利要求书而非前述描述指示。落入权利要求书的等效方案的含义和范围内的所有改变应被权利要求书的范围所涵盖。

Claims (10)

1.一种用于在包括处理器和系统存储器的计算机系统处控制要被呈现给计算设备的数据视图的方法,所述方法包括:
接收来自所述计算设备的查询,所述查询包括一个或多个查询项;
响应于接收所述查询,视图创建模块:
访问数据目录,所述数据目录维护来自多个数据源的多个不同的并且原本不连接的但是相关的数据元素之间的链接,数据元素和另一数据元素之间的每一个链接准许当所述数据元素中的一者被标识为响应于查询项时访问所述数据元素和所述另一数据元素两者,而无需查询相应数据源以定位所述另一数据元素,所述链接包括从所述计算机系统处接收的一个或多个信号中推导出的链接,所述多个数据源包括第一数据源和第二数据源,所述第一数据源和所述第二数据源为不同类型的数据源,不同类型的数据通过被转换成统一格式而被虚拟化以供数据目录处理;
至少部分通过访问具有到第一数据元素的链接的第二数据元素来将数据元素指派给响应于所述一个或多个查询项的数据视图,所述第一数据元素满足所述一个或多个查询项中的一个,所述指派通过:
通过参考所述数据目录来自动推断所述数据视图,包括:
自动地对数据元素和来自所述多个数据源的相应的数据源中的元素之间的关系进行分类;
确定所述第一数据元素被包含在来自所述多个数据源中的所述第一数据源中;
基于所述链接来确定所述第二数据元素被包含在来自所述多个数据源中的所述第二数据源中;
将所述第一数据元素和所述第二数据元素组装成所述数据视图;以及
响应于接收所述查询而将所述数据视图返回给所述计算设备。
2.如权利要求1所述的方法,其特征在于,所述一个或多个信号与所述多个不同的并且原本不连接的但是相关的数据元素中包括的一个或多个数据元素有关。
3.如权利要求1所述的方法,其特征在于,所述一个或多个信号包括以下中的一者或多者:企业的组织图、用户输入、针对性模型、专家输入、接收的查询项。
4.如权利要求1所述的方法,其特征在于,所述第一数据源和所述第二数据源是不同类型的数据源。
5.如权利要求1所述的方法,其特征在于,将所述第一数据和所述第二数据组装成所述数据视图包括从与所述数据目录相关联的高速缓存中访问所述第一数据和所述第二数据中的至少一个。
6.如权利要求1所述的方法,其特征在于,将所述第一数据和所述第二数据组装成所述数据视图包括:
从所述第一数据元素和所述第二数据元素推导新数据元素;以及
将所推导的新数据元素包括在所述数据视图中。
7.一种供在计算机系统处使用的计算机可读存储介质,所述计算机可读存储介质上存储有计算机可执行指令,所述计算机可执行指令在处理器处执行时使得所述处理器执行一种用于创建数据视图的方法,所述方法包括:
接收来自所述计算设备的查询,所述查询包括一个或多个查询项;
响应于接收所述查询,视图创建模块:
访问数据目录,所述数据目录维护来自多个数据源的多个不同的并且原本不连接的但是相关的数据元素之间的链接,数据元素和另一数据元素之间的每一个链接准许当所述数据元素中的一者被标识为响应于查询项时访问所述数据元素和所述另一数据元素两者,而无需查询相应数据源以定位所述另一数据元素,所述链接包括从所述计算机系统处接收的一个或多个信号中推导出的链接,所述多个数据源包括第一数据源和第二数据源,所述第一数据源和所述第二数据源为不同类型的数据源,不同类型的数据通过被转换成统一格式而被虚拟化以供数据目录处理;
至少部分通过访问具有到第一数据元素的链接的第二数据元素来将数据元素指派给响应于所述一个或多个查询项的数据视图,所述第一数据元素满足所述一个或多个查询项中的一个,所述指派通过:
通过参考所述数据目录来自动推断所述数据视图,包括:
自动地对数据元素和来自所述多个数据源的相应的数据源中的元素之间的关系进行分类;
确定所述第一数据元素被包含在来自所述多个数据源中的所述第一数据源中;
基于所述链接来确定所述第二数据元素被包含在来自所述多个数据源中的所述第二数据源中;
将所述第一数据元素和所述第二数据元素组装成所述数据视图;以及
响应于接收所述查询而将所述数据视图返回给所述计算设备。
8.如权利要求7所述的计算机可读存储介质,其特征在于,所述一个或多个信号与所述多个不同的并且原本不连接的但是相关的数据元素中包括的一个或多个数据元素有关;以及
其中将所述第一数据元素和所述第二数据元素组装成所述数据视图包括:
从所述第一数据元素和所述第二数据元素推导新数据元素;以及
将所推导的新数据元素包括在所述数据视图中。
9.一种计算机系统,所述计算机系统包括:
一个或多个处理器;
系统存储器;以及
一个或多个计算机存储设备,所述计算机存储设备上存储有表示视图创建模块的计算机可执行指令,所述视图创建模块被配置为:
接收来自所述计算设备的查询,所述查询包括一个或多个查询项;
响应于接收所述查询,视图创建模块:
访问数据目录,所述数据目录维护来自多个数据源的多个不同的并且原本不连接的但是相关的数据元素之间的链接,数据元素和另一数据元素之间的每一个链接准许当所述数据元素中的一者被标识为响应于查询项时访问所述数据元素和所述另一数据元素两者,而无需查询相应数据源以定位所述另一数据元素,所述链接包括从所述计算机系统处接收的一个或多个信号中推导出的链接,所述多个数据源包括第一数据源和第二数据源,所述第一数据源和所述第二数据源为不同类型的数据源,不同类型的数据通过被转换成统一格式而被虚拟化以供数据目录处理;
至少部分通过访问具有到第一数据元素的链接的第二数据元素来将数据元素指派给响应于所述一个或多个查询项的数据视图,所述第一数据元素满足所述一个或多个查询项中的一个,所述指派通过:
通过参考所述数据目录来自动推断所述数据视图,包括:
自动地对数据元素和来自所述多个数据源的相应的数据源中的元素之间的关系进行分类;
确定所述第一数据元素被包含在来自所述多个数据源中的第一数据源中;
基于所述链接来确定所述第二数据元素被包含在来自所述多个数据源中的第二数据源中;
将所述第一数据元素和所述第二数据元素组装成所述数据视图;以及
响应于接收所述查询而将所述数据视图返回给所述计算设备。
10.如权利要求9所述的计算机系统,其特征在于,所述计算机系统还包括与所述数据目录相关联的高速缓存,其中所述视图创建模块被配置成将所述第一数据元素和所述第二数据元素组装成所述数据视图包括所述视图创建模块被配置成从所述高速缓存中访问所述第一数据元素和所述第二数据元素中的一个;以及
其中所述视图创建模块被配置成将所述第一数据元素和所述第二数据元素组装成所述数据视图包括所述视图创建模块被配置成:
从所述第一数据元素和所述第二数据元素推导新数据元素;以及
将所推导的新数据元素包括在所述数据视图中。
CN201580007260.4A 2014-02-04 2015-01-30 创建数据视图 Active CN105981010B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/172,445 2014-02-04
US14/172,445 US9672256B2 (en) 2014-02-04 2014-02-04 Creating data views
PCT/US2015/013634 WO2015119839A1 (en) 2014-02-04 2015-01-30 Creating data views

Publications (2)

Publication Number Publication Date
CN105981010A CN105981010A (zh) 2016-09-28
CN105981010B true CN105981010B (zh) 2019-08-06

Family

ID=52633578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580007260.4A Active CN105981010B (zh) 2014-02-04 2015-01-30 创建数据视图

Country Status (5)

Country Link
US (2) US9672256B2 (zh)
EP (1) EP3103031A1 (zh)
CN (1) CN105981010B (zh)
BR (1) BR112016017315A8 (zh)
WO (1) WO2015119839A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10679264B1 (en) 2015-11-18 2020-06-09 Dev Anand Shah Review data entry, scoring, and sharing
CN112988692B (zh) * 2019-12-13 2024-05-07 阿里巴巴集团控股有限公司 数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142025A (zh) * 2010-01-29 2011-08-03 微软公司 构成带有链接的自动创建的视图
US8214225B2 (en) * 2001-11-02 2012-07-03 Siemens Medical Solutions Usa, Inc. Patient data mining, presentation, exploration, and verification

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2326513C (en) 1998-03-27 2009-06-16 Informix Software, Inc. Processing precomputed views
US6915294B1 (en) * 2000-08-18 2005-07-05 Firstrain, Inc. Method and apparatus for searching network resources
WO2002035395A2 (en) * 2000-10-27 2002-05-02 Entigen Corporation Integrating heterogeneous data and tools
US20050033726A1 (en) * 2003-05-19 2005-02-10 Ju Wu Apparatus and method for accessing diverse native data sources through a metadata interface
WO2005045698A2 (fr) * 2003-10-24 2005-05-19 Enrico Maim Procede mis en oeuvre dans un environnement informatique pour engendrer une vue courante a partir d’au moins un objet d’information source susceptible de varier
US7634492B2 (en) * 2004-12-20 2009-12-15 Microsoft Corporation Aggregate data view
US7814090B2 (en) * 2005-05-31 2010-10-12 Oracle International Corporation Query generator
US7693812B2 (en) * 2007-01-17 2010-04-06 International Business Machines Corporation Querying data and an associated ontology in a database management system
US7899803B2 (en) * 2007-02-19 2011-03-01 Viewzi, Inc. Multi-view internet search mashup
US20080228716A1 (en) * 2007-03-13 2008-09-18 Dettinger Richard D System and method for accessing unstructured data using a structured database query environment
US20090112806A1 (en) * 2007-10-31 2009-04-30 Microsoft Corporation Query view inferred from datasource and query
US8060536B2 (en) * 2007-12-18 2011-11-15 Sap Ag Managing structured and unstructured data within electronic communications
US8250106B2 (en) 2009-11-18 2012-08-21 Oracle International Corporation Incremental inference
EP2541856A1 (en) 2011-06-30 2013-01-02 Alcatel Lucent Method for multi-tag cloud views of email
US9569511B2 (en) * 2011-08-25 2017-02-14 Salesforce.Com, Inc. Dynamic data management
US8484208B1 (en) * 2012-02-16 2013-07-09 Oracle International Corporation Displaying results of keyword search over enterprise data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8214225B2 (en) * 2001-11-02 2012-07-03 Siemens Medical Solutions Usa, Inc. Patient data mining, presentation, exploration, and verification
CN102142025A (zh) * 2010-01-29 2011-08-03 微软公司 构成带有链接的自动创建的视图

Also Published As

Publication number Publication date
US20170262510A1 (en) 2017-09-14
WO2015119839A1 (en) 2015-08-13
CN105981010A (zh) 2016-09-28
US20150220598A1 (en) 2015-08-06
EP3103031A1 (en) 2016-12-14
US10635681B2 (en) 2020-04-28
US9672256B2 (en) 2017-06-06
BR112016017315A8 (pt) 2020-06-16

Similar Documents

Publication Publication Date Title
US9800675B2 (en) Methods for dynamically generating an application interface for a modeled entity and devices thereof
RU2546322C2 (ru) Расширение возможностей сотрудничества при использовании внешних данных
US9747331B2 (en) Limiting scans of loosely ordered and/or grouped relations in a database
US11334593B2 (en) Automated ETL workflow generation
EP2182448A1 (en) Federated configuration data management
US20150254289A1 (en) Database architecture for storing multi-structured data
US10164896B2 (en) Cloud-based content management system
Di Martino et al. Semantic representation of cloud patterns and services with automated reasoning to support cloud application portability
CN105164677B (zh) 在并行数据库处执行存储过程的方法和系统
CN111868727B (zh) 用于数据匿名化的方法和系统
CN102253827A (zh) 具有学习机制的糅合基础结构
CN101454779A (zh) 基于搜索的应用开发框架
US9600602B2 (en) Combined deterministic and probabilistic matching for data management
US20170011128A1 (en) Dynamic domain query and query translation
US11983184B2 (en) Multi-tenant, metadata-driven recommendation system
CN105981010B (zh) 创建数据视图
US11636124B1 (en) Integrating query optimization with machine learning model prediction
US11379478B2 (en) Optimizing a join operation
US20230153300A1 (en) Building cross table index in relational database
US11657069B1 (en) Dynamic compilation of machine learning models based on hardware configurations
Angelis et al. Generating and exploiting semantically enriched, integrated, linked and open museum data
US11176134B2 (en) Navigation paths between content items
US9576025B1 (en) Abstracting denormalized data datasets in relational database management systems
US11841857B2 (en) Query efficiency using merged columns
US10956416B2 (en) Data schema discovery with query optimization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant