CN103608809A - 推荐数据富集 - Google Patents

推荐数据富集 Download PDF

Info

Publication number
CN103608809A
CN103608809A CN201280029266.8A CN201280029266A CN103608809A CN 103608809 A CN103608809 A CN 103608809A CN 201280029266 A CN201280029266 A CN 201280029266A CN 103608809 A CN103608809 A CN 103608809A
Authority
CN
China
Prior art keywords
data
enrichment
database
inquiry
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280029266.8A
Other languages
English (en)
Other versions
CN103608809B (zh
Inventor
A·N·比切
D·M·鲁宾逊
H·斯瓦拉马克瑞希楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN103608809A publication Critical patent/CN103608809A/zh
Application granted granted Critical
Publication of CN103608809B publication Critical patent/CN103608809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

此处描述的主题的各方面涉及推荐数据源。在各方面,在推荐引擎处接收对于为数据库提供数据富集的推荐的请求。推荐引擎可以执行对与该数据库相关联的数据的静态和动态分析,并还可基于策略来细化推荐。推荐引擎可随后提供数据富集的推荐(如果有的话),以允许软件开发者例如指示是否要使用这些数据富集。

Description

推荐数据富集
背景
数据库是当今的业务中的普通商品。甚至非常简单的业务软件应用通常将包括对数据库的使用。随着对数据库使用的增长,提供对业务中寻找到的数据进行扩充的数据的数据源和其他数据库也已增长。例如,软件开发者可以创建访问数据库以确定地址的软件应用。因特网上用于生成包括去往目的地的方向的地图的若干数据源是可被获得的。作为另一示例,在因特网上存在提供天气信息的若干站点。实际上,由于有这么多的数据源可被获得,使得发现并使用这些数据源对于软件开发者而言是有挑战性的。
在此要求保护的主题不限于解决任何缺点或仅在诸如上述环境中操作的各个实施例。相反,提供该背景仅用以示出在其中可实践在此描述的部分实施例的一个示例性技术领域。
概述
简单来说,此处所描述的主题的各方面涉及推荐数据源。在各方面,在推荐引擎处接收对于为数据库提供数据富集的推荐的请求。推荐引擎可执行对与数据库相关联的数据的静态和动态分析,并且还可基于各策略来细化各推荐。推荐引擎可随后提供对数据富集的推荐(如果有的话),以允许软件开发者,例如,指示是否要使用该数据富集。
附图说明
图1是表示其中可结合本文所描述主题的各方面的示例性通用计算环境的框图;
图2是表示本文所描述的主题的各方面可以在其中被实现的示例性环境的框图;以及
图3-4是根据此处所描述的主题的各方面的概括地表示可发生的示例性动作的流程图。
详细描述
定义
如本文所使用的,术语“包括”及其变体被当作开放式术语,表示“包括但不限于”。除非上下文另外清楚地指示出,否则术语“或”被当作“和/或”。术语“基于”被当作“至少部分地基于”。术语“一个实施例”和“一实施例”被当作“至少一个实施例”。术语“另一实施例”被当作“至少一个其他实施例”。
如本文所使用的,诸如“一”和“该”等术语包括了所指示的项或动作中的一个或多个。具体而言,在权利要求书中,对某一项的引用一般表示存在至少一个这样的项,并且对一动作的引用表示执行该动作的至少一个示例。
本文中有时可使用术语“第一”、“第二”、“第三”等等。没有其他上下文,权利要求中对这些术语的使用不意在暗示排序,而是用于标识的目的。例如,短语“第一版本”和“第二版本”不一定意味着第一版本是真正的第一个版本或是在第二版本之前创建的,或甚至是第一版本是在第二版本之前被请求或操作的。相反,这些短语用于标识不同的版本。
标题仅是为了方便;关于给定话题的信息可在其标题指示该话题的节之外被寻找到。
其他显式或隐式定义可包括在下文中。
示例性操作环境
图1示出可在其上实现本文所描述的主题的各方面的合适的计算系统环境100的示例。计算系统环境100仅为合适的计算环境的一个示例,并非旨在对本文所描述的主题的各方面的使用范围或功能提出任何限制。也不应该将计算环境100解释为对示例性操作环境100中示出的任一组件或其组合有任何依赖性或要求。
本文所描述的主题的各方面可与众多其他通用或专用计算系统环境或配置一起操作。可适用于这里所述的主题的各方面的已知计算系统、环境或配置的例子包括个人计算机,服务器计算机,手持或膝上型设备,多处理器系统,基于微控制器的系统,机顶盒,可编程消费电子设备,网络PC,微型计算机,大型计算机,个人数字助理(PDA),游戏设备,打印机,包括机顶盒、媒体中心或其他家电的家电设备,嵌入汽车或附加到汽车的计算设备,其他移动设备,包括任何上述系统或设备的分布式计算环境等等。
本文所描述的主题的各方面可在由计算机执行的诸如程序模块等计算机可执行指令的一般上下文中描述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。本文所描述的主题的各方面也可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实现。在分布式计算环境中,程序模块可以位于包括存储器存储设备在内的本地和远程计算机存储介质中。
参考图1,用于实现本文所描述的主题的各方面的示例性系统包括计算机110形式的通用计算设备。计算机可包括能够执行指令的任何电子设备。计算机110的组件可包括处理单元120、系统存储器130以及将包括系统存储器的各种系统组件耦合至处理单元120的系统总线121。系统总线121可以是若干类型的总线结构中的任一种,包括使用各种总线体系结构中的任一种的存储器总线或存储器控制器、外围总线、以及局域总线。作为示例,而非限制,这样的架构包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线、也称为夹层(Mezzanine)总线的外围部件互连(PCI)总线、扩展外围部件互连(PCI-X)总线、高级图形端口(AGP)、以及PCI Express(PCIe)。
计算机110通常包括各种计算机可读介质。计算机可读介质可以是能由计算机110访问的任何可用介质,并包含易失性和非易失性介质以及可移动、不可移动介质。作为示例而非限制,计算机可读介质可包括计算机存储介质和通信介质。
计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术来实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EEPROM、闪存或其他存储器技术CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储设备、或可以用来储存所期望的信息并可由计算机110访问的任一其他介质。
通信介质通常以诸如载波或其他传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其他数据,并包括任何信息传送介质。术语“已调制数据信号”是指使得以在信号中编码信息的方式来设定或改变其一个或多个特征的信号。作为示例而非限制,通信介质包括诸如有线网络或直接线连接之类的有线介质,以及诸如声学、RF、红外及其他无线介质之类的无线介质。上述的任意组合也应包含在计算机可读介质的范围内。
系统存储器130包括易失性和/或非易失性存储器形式的计算机存储介质,如只读存储器(ROM)131和随机存取存储器(RAM)132。包含诸如在启动期间帮助在计算机110内的元件之间传输信息的基本例程的基本输入/输出系统133(BIOS)通常存储在ROM131中。RAM132通常包含处理单元120可立即访问和/或当前正在操作的数据和/或程序模块。作为示例而非限制,图1示出了操作系统134、应用程序135、其他程序模块136和程序数据137。
计算机110也可以包括其他可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例,图1示出了从不可移动非易失性磁介质中读取或向其写入的硬盘驱动器141,从可移动非易失性磁盘152中读取或向其写入的磁盘驱动器151,以及从诸如CD ROM或其他光学介质等可移动非易失性光盘156中读取或向其写入的光盘驱动器155。可以在该示例性操作环境中使用的其他可移动/不可移动、易失性/非易失性计算机存储介质包括磁带盒、闪存卡、数字多功能盘、其他光盘、数字录像带、固态RAM、固态ROM等等。硬盘驱动器141可通过接口140连接至系统总线121,而磁盘驱动器151和光盘驱动器155可通过诸如接口150之类的用于可移动非易失性存储器的接口连接至系统总线121。
以上讨论并在图1中示出的驱动器及其相关联的计算机存储介质为计算机110提供了对计算机可读指令、数据结构、程序模块和其他数据的存储。例如,在图1中,硬盘驱动器141被示为存储操作系统144、应用程序145、其他程序模块146和程序数据147。注意,这些组件可与操作系统134、应用程序135、其他程序模块136和程序数据137相同,也可与它们不同。操作系统144、应用程序145、其他程序模块146和程序数据147在这里被标注了不同的附图标记是为了说明至少它们是不同的副本。
用户可以通过输入设备,如键盘162和定点设备161(通常被称为鼠标、跟踪球或触摸垫)向计算机110输入命令和信息。其它输入设备(未示出)可包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪、触敏屏、写字板等。这些以及其他输入设备通常通过耦合到系统总线的用户输入接口160连接到处理单元120,但也可通过诸如并行端口、游戏端口或通用串行总线(USB)之类的其他接口和总线结构来连接。
监视器191或其他类型的显示设备也经由诸如视频接口190之类的接口连接至系统总线121。除了监视器以外,计算机还可包括诸如扬声器197和打印机196之类的其他外围输出设备,它们可通过输出外围接口195来连接。
计算机110可使用到一个或多个远程计算机(诸如,远程计算机180)的逻辑连接而在联网环境中操作。远程计算机180可以是个人计算机、服务器、路由器、网络PC、对等设备或其他常见网络节点,且通常包括上文相对于计算机110描述的许多或所有元件,但在图1中只示出存储器存储设备181。图1中所示的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也可以包括其他网络。这样的联网环境常见于办公室、企业范围计算机网络、内联网和因特网中。
当在LAN联网环境中使用时,计算机110通过网络接口或适配器170连接到LAN171。当在WAN联网环境中使用时,计算机110可包括调制解调器172或用于通过诸如因特网等WAN173来建立通信的其他装置。可为内置或可为外置的调制解调器172可以经由用户输入接口160或其他合适的机构连接至系统总线121。在联网环境中,相对于计算机110所示的程序模块或其部分可被存储在远程存储器存储设备中。作为示例而非限制,图1示出了远程应用程序185驻留在存储器设备181上。应当理解,所示的网络连接是示例性的,并且可使用在计算机之间建立通信链路的其他手段。
数据富集
如之前所述,发现并使用扩充数据源对于软件开发者而言是有挑战性的。图2是表示本文所描述的主题的各方面可以在其中实现的示例性环境的框图。图2中示出的各组件是示例性的且不意味着包括一切的可能需要或包括的组件。在其他实施例中,结合图2描述的组件可被包括在其他组件(示出或未示出)中或者被放置在子组件中而不背离本文所描述的主题的各方面的精神或范围。
如本文所使用的,术语组件要被当作包括硬件,例如,设备的全部或一部分、一个或多个软件模块或其部分的集合、一个或多个软件模块或其部分与一个或多个设备或其部分的某种组合等等。
转至图2,该环境可包括应用205、数据库管理系统(DMBS)206、丰富数据源207、推荐引擎208、数据存储210和211以及其他组件(未示出)。
各个组件可以相对于彼此接近地定位(例如,在同一机器上或在同一网络的各机器上),或者可以分布在世界各地。各种组件可以经由各种网络彼此通信,这些网络包括办公室内和办公室间网络。
应用205、DBMS206、丰富数据源207和推荐引擎208可以包括一个或多个计算设备或驻留在一个或多个计算设备上。这些设备可包括,例如,个人计算机,服务器计算机,手持式或膝上型设备,多处理器系统,基于微控制器的系统,机顶盒,可编程消费电子产品,网络PC,小型计算机,大型计算机,蜂窝电话,个人数字助理(PDA),游戏设备,打印机,包括机顶盒、媒体中心或其他电器在内的电器,汽车嵌入式或附连的计算设备,其他移动设备,包括以上系统或设备中的任一种的分布式计算环境等。可被配置成用作以上之一的示例性设备包括图1的计算机110。
应用205可包括能够与图2中的其他实体中的一个或多个进行通信的进程。在此使用的术语“进程”及其变体可包括一个或多个传统的进程、线程、组件、库、执行任务的对象等等。可以硬件、软件、或硬件和软件的组合来实现进程。在一实施例中,无论如何命名,进程是能够执行或者用于执行动作的任何机制。进程可分布在多个设备或单个设备上。同样,应用205可具有分布在一个或多个设备上的组件。
在一个实施例中,应用205可包括软件开发工具。软件开发工具可以实现集成开发环境(IDE),该集成开发化境允许软件开发者输入和更新代码、调试代码、创建和更新数据库、将代码与一个或多个数据库相关联、编译代码、创建包、进行其他动作等等。
数据存储210中的数据可以经由DBMS206来访问。DBMS可包括一个或多个程序,其控制数据库的数据的组织、存储、管理和检索。DBMS可接收访问数据库中的数据的请求,并可执行提供该访问所需要的操作。此处使用的访问可包括读数据、写数据、删除数据、更新数据、以及包括以上两个或更多个的组合等。
存储在数据存储210上的数据库可包括关系数据库、面向对象的数据库、分层数据库、网络数据库、其他类型的数据库、上述的某种组合或扩展等。可将存储于数据库中的数据组织为表格、记录、对象、其他数据结构等。可将存储于数据库中的数据存储在专用数据库文件、专用硬盘分区、HTML文件、XML文件、电子数据表、平面文件、文档文件、配置文件、其他文件等中。数据库可引用对数据库只读的一组数据,或者可具有向该组数据读和写的能力。
在描述本文所描述的主题的各方面的时,为简洁起见,本文有时候使用与关系数据库相关联的术语。尽管本文有时候使用关系数据库术语,但也可将本文的技术应用到其它类型的数据库,包括之前已经提到的那些。
丰富数据源207可包括能够提供数据的任何实体。例如,丰富数据源207可包括接收数据(例如,邮政编码)并响应于此而提供数据(例如,天气信息)的服务。作为另一示例,丰富数据源207可包括提供真正的或延迟的股票价格的服务。每一丰富数据源可以通过由一个或多个计算机执行的过程来实现。
丰富数据源207可以丰富存储在数据存储210上的数据库。DBMS206可以从丰富数据源207获得数据,并使得这些数据(例如,对应用205而言)看起来好像来自DBMS206所管理的数据库。可从丰富数据源207获得的数据有时被称为数据富集。例如,DBMS206可使用在数据库中寻找到的邮政编码信息来从丰富数据源获得天气信息。天气信息可经由DBMS206所展示的表格的一列或多列来访问。
DBMS206可以存储指示要向其提供数据存储210的数据库的数据富集的信息。在提供来自数据库的数据时,DBMS206也可以使得数据富集可用。
在一个实施例中,推荐引擎208可以向DBMS206提供数据富集的推荐,该DBMS206可随后将这些推荐提供给应用205。在另一实施例中,推荐引擎208可以向应用205提供数据富集的推荐。推荐可以包括推荐的名称或其他标识符、与该推荐相关联的数据富集所需要的输入数据类型、以及该数据富集所提供的输出数据类型。
推荐引擎208可以按各种方式来确定这些推荐。这些方式中的以下包括例如:
1.动态分析。DBMS206可以收集与DBMS206所执行的查询有关的统计信息。该信息可被提供给推荐引擎208,推荐引擎208可以使用该信息来建议新的富集和数据源。例如,如果查询使用COMPANYFINANCIAL(公司财务)富集,则推荐引擎208可以也推荐COMPANYNEWS(公司新闻)富集。该推荐可被提供,因为两个富集都将公司名称用作输入。
为了使用动态分析来确定富集,推荐引擎208可使用在各富集之间进行映射的数据结构。例如,推荐引擎208可以维护或被提供包括各行的表格,其中每一行包括第一富集和第二富集的字段。第二富集是要基于第一富集来推荐的数据富集。通过使用零行或更多行,该表格可被使用来将第一富集映射到可基于第一富集来推荐的零个或更多其他富集。
诸如查询时间之类的统计数据可被用来推荐与当前正使用的数据源不同地索引的数据源。例如,股票报价器数据源可能能够使用公司名称或股票符号(例如,MSFT)来提供最新的股票价格。当公司名称被提供时,股票报价器数据源可能需要查找该公司对股票市场已知的股票代号。数据源可随后使用该股票代号来获得报价器数据。
接收股票代号的数据源可只直接获得报价器数据,而不是使用以上方法来获得报价器数据,因此与必须将公司名称转换成报价器名称的数据源相比,能够更快地获得该数据。如果公司表具有股票代号字段,但正在使用公司名称数据富集来获得报价器数据,则推荐引擎208可以推荐改为用使用了股票代号字段的数据富集。或者,推荐引擎208可以为公司表中的每一个公司推荐包括股票代号的股票代号实体,并随后可基于该股票代号实体来推荐富集。
2.静态分析。存储数据库中的数据具有与包括表格、列、过程、可扩展标记语言(XML)等数据对象有关的结构化元数据。该结构化元数据可被检查以确定该数据库所存储和处理的数据的种类。结构化元数据的某些示例包括表格名称、列名称、所存储的过程名称、列数据类型、其他对象名称等。
例如,以公司命名的表格可指示该表格具有公司信息。在以公司命名的表格内,以名称命名的列可指示该公司的名称。该元数据可用于确定公司表内的名称列是公司的名称。这可随后被用于为各公司提供富集推荐,诸如COMPANYFINANCIAL(公司财务)富集、COMPANYNEWS(公司新闻)富集、COMAPNYSOCIALNETWORKS(公司社交网络)富集和其他公司富集。
为了便于确定供静态分析的数据富集,可以使用从标识符(例如,名称)映射到与该名称相关联的一个或多个富集的数据结构。例如,推荐引擎208可以维护或被提供包括行的表格,其中每一行包括一个或多个元数据属性字段(例如,表格名称、列、名称、数据类型)以及要基于该元数据属性来推荐的数据富集。通过使用零行或更多行,该表格可被使用来将元数据属性映射到可基于这些元数据属性来推荐的零个或更多其他富集。
作为可基于列数据类型来推荐的数据富集的示例,元数据指示某列使用了GEOMETRY(几何)数据类型。作为响应,推荐引擎208可以推荐LOCATION(位置)实体以及与LOCATION实体相关联的富集(例如,天气、犯罪率、人口密度、人口统计和住宅统计等)。
列数据类型还可以通过检查数据库本身中的数据来确定。例如,通过检查表格中的各列,推荐引擎208可能能够确定这些列表示地址。这可例如通过尝试使用这些列中的数据来查找地址来完成。一旦推荐引擎208确定这些列表示一地址,推荐引擎208可以使用此处提到的映射技术基于该地址来推荐数据富集。
类似地,对数据库中的数据的静态分析可能能够产生与该数据中包含的数据有关的附加信息。该信息也可被用来推荐数据富集。
3.策略。推荐可以基于各策略来作出。这些策略可以由应用205或以其他方式定义。策略可被认为是具有一个或多个条件的规则,该规则基于评估这些条件来约束推荐。例如,策略可以基于交易成本、数据源评级、服务许可协议(SLA)、是否允许将数据持久保持在数据库中、或其他条件。例如,策略可以指示只要数据富集的价格少于某一量,对该数据富集的推荐就被允许。
4.目录。可用数据富集可以是可搜索的。例如,推荐引擎208可以将一列数据富集及其相应的数据源提供在软件开发者等可能会查询的表格中。该表格可以指示作为输入被接受并作为输出被产生的数据的类型。该表还可以包括许可约束、成本(如果有的话)、和有关数据富集的其他数据等。
数据存储211是存储供推荐使用的数据的存储。该数据可包括例如映射数据、可用数据富集的目录、定价、性能、和可靠性数据、关于数据源的许可协议等。
数据存储210-211可使用能够存储数据的任何存储介质来实现。存储可包括易失性存储器(例如,高速缓存)和非易失性存储器(例如,持久存储)。存储可以使用文件系统、数据库、诸如RAM等易失性存储器、其它存储、以上的某种组合等来实现,并可以跨多个设备分布。
术语数据要被宽泛地看作包括可由一个或多个计算机存储元素表示的任何东西。逻辑上,数据可被表示成易失性或非易失性存储器中的一系列1和0。在具有非二进制存储介质的计算机中,数据可根据存储介质的能力来表示。数据可被组织成不同类型的数据结构,包括诸如数字、字母等之类的简单数据类型,分层、链接或其他相关数据类型、包括多个其他数据结构或简单数据类型的数据结构等等。
图3-4是概括地表示根据本文所描述的主题的各方面的可能发生的示例性动作的流程图。为解释简明起见,结合图3-4描述的方法被描绘和描述为一系列动作。可以理解和明白,此处所描述的主题的各方面不受所示出的各动作和/或各动作次序的限制。在一个实施例中,各动作以如下描述的次序发生。然而,在其它实施例中,各动作可以并行地发生、以另一次序发生、和/或与此处未呈现和描述的其它动作一起发生。此外,并非所有示出的动作都是实现根据此处所描述的主题的各方面的方法所必需的。另外,本领域的技术人员将了解和明白,该方法也可以替代地经由状态图而被表示为一系列相互关联的状态或者被表示为事件。
转向图3,在框305处,动作开始。在框310,接收对于为数据库提供数据富集的推荐的请求。例如,参考图2,应用205、DBMS206或其他组件可请求推荐引擎208为由DMBS管理的数据库提供数据富集的推荐。
在框315,可执行对元数据的分析。例如,参考图2,推荐引擎208可使用与DBMS206所提供的数据有关的元数据以及数据存储211上的映射信息来确定要提供的一个或多个推荐。此外,推荐引擎208可评估策略条件来将推荐约束到不会违反这些策略的那些推荐。
虽然在一个实施例中,对元数据的分析可以在接收到提供推荐的请求后被执行,但在其他实施例中,该分析可在接收到该请求之前被执行。在一个实施例,该分析是在关于数据库的元数据改变时连续更新推荐的不间断过程。
在一个实施例中,对元数据的分析可以包括以下示例性动作:
1.获取与数据库相关联的元数据。这可涉及从DBMS请求该数据、(在没有请求的情况下)从DBMS接收该数据、或某一其他机制。
2.寻找元数据中的标识符。这可涉及寻找一个或多个表格、列、所存储的过程、或其他数据库对象的名称。
3.使用使该标识符与数据富集相关联的数据结构来将该标识符映射到该数据富集。这可涉及使用主要包括一个或多个标识符的表格或其他数据结构来表示一个或多个其他标识符。例如,表格或列的名称“公司”可被用来寻找该数据结构中的关联富集。作为另一示例,表格的名称“公司”以及该表格的列的名称“股票代号”可一起被用于寻找相关联的股票报价器富集。
在框320,可执行动态分析。例如,参考图2,推荐引擎208可以分析向数据库发放的一个或多个查询以确定对数据富集的推荐。例如,如果查询指示一个数据富集,则该数据富集可被用来使用与其相似的映射数据结构来标识其他数据富集。此外,推荐引擎208可评估策略条件来将推荐约束到不会违反这些策略的那些推荐。
在一个实现中,动态分析可包括分析向数据库发放的查询。在这个实现中,确定可以通过以下示例性动作来执行推荐,
1.获取至少一个查询所引用的第一数据富集的第一标识符。例如,如果该查询包括数据富集(“COMPANYFINANCIAL(公司财务)”)的标识符,则该标识符可被获取。
2.使用使标识符与数据富集相关联的数据结构将第一标识符映射到第二数据富集的第二标识符。
其他示例性动态分析可涉及以下示例性动作:
1.比较从两个不同的数据源获取相同类型的富集数据(例如,股票价格)的第一查询和第二查询的查询时间;
2.取决于第一查询和第二查询中的哪一个在获取输出数据时具有最小等待时间,选择第一查询和第二查询中最快的查询;
3.确定与最快的查询相关联的数据富集的标识符。
该数据富集可被推荐以例如改善性能。
虽然在一个实施例中,对查询的分析可以在接收到提供推荐的请求后被执行,但在其他实施例中,该分析可在接收到该请求之前被执行。在一个实施例,该分析是在接收到对数据库的查询时连续更新推荐的不间断过程。
在框325,提供基于对元数据的分析的推荐。例如,参考图2,推荐引擎208可以将数据富集的推荐提供给DBMS206、应用205或某一其他组件。
在框330,提供基于动态分析的推荐。例如,参考图2,推荐引擎208可以将数据富集的推荐提供给DBMS206、应用205或某一其他组件。
基于元数据的推荐和基于动态分析的推荐可被一起或分开提供,而不背离此处所描述主题的各方面的精神或范围。在某些情况下,可能只存在基于动态分析的推荐。在某些情况下,可能只存在基于静态分析的推荐。
在框335处,可以执行其他动作(如果有的话)。其他动作可包括例如提供标识数据富集的可检索目录以及对应于数据源的数据富集。
转向图4,在框405处,动作开始。在框410处,接收数据富集推荐。该推荐基于对数据库的元数据的分析以及向提供对该数据库的访问的DBMS发放的查询的分析中的一个或多个。例如,参考图2,DBMS206可从推荐引擎208接收对COMPANYNEWS(公司新闻)富集的推荐。。随后,DBMS206可以将该推荐发送给应用205。在另一实施例中,应用205可以直接从推荐引擎208接收推荐。
在框415,可经由图形界面来提供对推荐的指示。例如,参考图2,应用205可以通过将推荐与用户界面元素一起显示在计算机显示器上来向软件开发者、或用户等提供对该推荐的指示,这允许软件开发者指示软件开发者是否想要使用该数据富集。
在框420,允许软件开发者指示该软件开发者是否想要使用数据富集。例如,参考图2,软件开发者可以向应用205指示是否经由被显示的界面元素来使用被推荐的数据富集。作为响应,应用205可以通知DBMS206是否要使用通知推荐数据富集。
在框425处,可以执行其他动作(如果有的话)。例如,取代接收一组推荐,可接收数据富集目录、其相关联的数据源、和其他信息(例如,成本、速度、或稳定性等)可经由图形界面来显示该目录及其至少一部分。
软件开发者还可发放对该目录的查询,以寻找开发者有兴趣使用的富集。
作为另一示例,软件开发者可能能够(例如,经由图形界面)定义要满足的一个或多个策略,并提供推荐。这些策略可随后被提供给推荐引擎以供在不违反这些策略的推荐数据富集中使用。
如从上述详细描述中可以看到,已经描述了关于推荐数据富集的各方面。尽管本文所描述的主题的各方面易于作出各种修改和替换构造,但其某些说明性实施例在附图中示出并在上面被详细地描述。然而,应当理解,并不旨在将所要求保护主题的各方面限制于所公开的具体形式,而是相反地,目的是要覆盖落入本文所描述的主题的各方面的精神和范围之内的所有修改、替换构造和等效方案。

Claims (10)

1.一种至少部分地由计算机实现的方法,所述方法包括:
接收对于为数据库提供数据富集的推荐的请求;
如果第一推荐存在并且不违反策略,则基于对所述数据库的元数据的分析来提供所述第一推荐;以及
如果第二推荐存在并且不违反策略,则基于对向所述数据库发放的至少一个查询的分析来提供所述第二推荐。
2.如权利要求1所述的方法,其特征在于,还包括通过执行以下动作来确定所述第一推荐,包括:
获取与数据库相关联的元数据;
寻找所述元数据内的标识符;以及
使用使所述标识符与数据富集相关联的数据结构来将所述标识符映射到该数据富集。
3.如权利要求2所述的方法,其特征在于,寻找所述元数据内的标识符包括寻找所述元数据内的列名称,并且其中将所述标识符映射到数据富集包括使用使标识符与数据富集相关联的表格。
4.如权利要求1所述的方法,其特征在于,还包括通过执行以下动作来确定所述第二推荐,包括:
获取所述至少一个查询所引用的第一数据富集的第一标识符;以及
使用使标识符与数据富集相关联的数据结构将第一标识符映射到第二数据富集的第二标识符。
5.如权利要求1所述的方法,其特征在于,还包括通过执行以下动作来确定所述第二推荐,包括:
比较从两个不同的数据源获取相同类型的富集数据的第一查询和第二查询的查询时间;
取决于所述第一查询和所述第二查询中的哪一个在获取输出数据时具有最小等待时间,选择所述第一查询和所述第二查询中最快的查询;
确定与所述最快的查询相关联的数据富集的标识符。
6.一种在计算环境中的系统,包括:
数据库,该数据库用于存储数据和关于该数据的元数据;
数据库管理系统(DBMS),该数据库管理系统用于提供对所述数据库的访问;以及
推荐引擎,该推荐引擎用于基于对所述元数据的分析和/或对向所述DBMS发放的查询的分析来提供数据富集的推荐,规定所提供的任何富集都不违反策略。
7.如权利要求6所述的系统,其特征在于,所述推荐引擎用于基于对所述元数据的分析来提供数据富集的推荐包括:所述推荐引擎用于执行以下动作,包括:
获取与所述数据库相关联的元数据;
寻找所述元数据内的标识符;以及
使用使所述标识符与数据富集相关联的数据结构来将所述标识符映射到所述数据富集。
8.如权利要求6所述的系统,其特征在于,所述推荐引擎用于基于对向所述DBMS发放的查询的分析来提供数据富集的推荐包括:所述推荐引擎用于执行以下动作,包括:
标识由所述查询所引用的第一数据富集;以及
使用关联数据富集的数据结构来将所述第一数据富集映射到第二数据富集。
9.一种具有计算机可执行指令的计算机存储介质,所述计算机可执行指令在被执行时执行以下动作,包括:
接收针对数据库的数据富集的推荐,所述推荐基于以下分析中的一个或多个:对所述数据库的元数据的分析,和对向提供对所述数据库的访问的数据库管理系统(DBMS)发放的查询的分析;以及
响应于接收到该推荐,经由图形界面来提供该推荐的指示。
10.如权利要求9所述的计算机存储介质,其特征在于,还包括接收使推荐与数据源相关联的数据结构,并经由所述图形界面来显示这些推荐中的一部分及其相关联的数据源。
CN201280029266.8A 2011-06-14 2012-06-05 推荐数据富集 Active CN103608809B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/159,654 2011-06-14
US13/159,654 US9244956B2 (en) 2011-06-14 2011-06-14 Recommending data enrichments
PCT/US2012/040950 WO2012173825A2 (en) 2011-06-14 2012-06-05 Recommending data enrichments

Publications (2)

Publication Number Publication Date
CN103608809A true CN103608809A (zh) 2014-02-26
CN103608809B CN103608809B (zh) 2017-11-24

Family

ID=47354526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280029266.8A Active CN103608809B (zh) 2011-06-14 2012-06-05 推荐数据富集

Country Status (11)

Country Link
US (3) US9244956B2 (zh)
EP (1) EP2721531A4 (zh)
JP (1) JP5986195B2 (zh)
KR (2) KR102035984B1 (zh)
CN (1) CN103608809B (zh)
AU (1) AU2012271085B2 (zh)
BR (1) BR112013032101B1 (zh)
CA (1) CA2838502A1 (zh)
MX (1) MX2013014800A (zh)
RU (1) RU2611966C2 (zh)
WO (1) WO2012173825A2 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147195B2 (en) 2011-06-14 2015-09-29 Microsoft Technology Licensing, Llc Data custodian and curation system
US10073858B2 (en) 2013-05-16 2018-09-11 Oracle International Corporation Systems and methods for tuning a storage system
US10629086B2 (en) 2015-06-09 2020-04-21 International Business Machines Corporation Providing targeted, evidence-based recommendations to improve content by combining static analysis and usage analysis
US11456885B1 (en) 2015-12-17 2022-09-27 EMC IP Holding Company LLC Data set valuation for service providers
US10528522B1 (en) 2016-03-17 2020-01-07 EMC IP Holding Company LLC Metadata-based data valuation
US10838946B1 (en) 2016-03-18 2020-11-17 EMC IP Holding Company LLC Data quality computation for use in data set valuation
US10789224B1 (en) * 2016-04-22 2020-09-29 EMC IP Holding Company LLC Data value structures
US10838965B1 (en) 2016-04-22 2020-11-17 EMC IP Holding Company LLC Data valuation at content ingest
US10671483B1 (en) 2016-04-22 2020-06-02 EMC IP Holding Company LLC Calculating data value via data protection analytics
US10210551B1 (en) 2016-08-15 2019-02-19 EMC IP Holding Company LLC Calculating data relevance for valuation
CN106372133A (zh) * 2016-08-19 2017-02-01 苏州七彩部落网络科技有限公司 一种基于大数据的用户行为分析处理方法及系统
US11093564B1 (en) 2016-09-26 2021-08-17 Splunk Inc. Identifying configuration parameters for a query using a metadata catalog
US11157498B1 (en) 2016-09-26 2021-10-26 Splunk Inc. Query generation using a dataset association record of a metadata catalog
CA3043586A1 (en) * 2016-11-09 2018-05-17 Ab Initio Technology Llc Systems and methods for determining relationships among data elements
US10719480B1 (en) 2016-11-17 2020-07-21 EMC IP Holding Company LLC Embedded data valuation and metadata binding
US10936599B2 (en) 2017-09-29 2021-03-02 Oracle International Corporation Adaptive recommendations
US11573955B1 (en) 2018-04-30 2023-02-07 Splunk Inc. Data-determinant query terms
US11238049B1 (en) 2018-04-30 2022-02-01 Splunk Inc. Revising catalog metadata based on parsing queries
US11392578B1 (en) 2018-04-30 2022-07-19 Splunk Inc. Automatically generating metadata for a metadata catalog based on detected changes to the metadata catalog
US11715051B1 (en) 2019-04-30 2023-08-01 Splunk Inc. Service provider instance recommendations using machine-learned classifications and reconciliation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080059454A1 (en) * 2006-08-29 2008-03-06 Switchbook, Inc. Search document generation and use to provide recommendations
CN101452473A (zh) * 2007-12-03 2009-06-10 索尼株式会社 信息处理终端、信息处理方法和程序
CN102055610A (zh) * 2009-10-30 2011-05-11 三星电子株式会社 基于内容使用历史管理网络中的内容服务的方法和装置

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649181A (en) * 1993-04-16 1997-07-15 Sybase, Inc. Method and apparatus for indexing database columns with bit vectors
US5623652A (en) 1994-07-25 1997-04-22 Apple Computer, Inc. Method and apparatus for searching for information in a network and for controlling the display of searchable information on display devices in the network
US5608904A (en) 1995-02-13 1997-03-04 Hewlett-Packard Company Method and apparatus for processing and optimizing queries having joins between structured data and text data
US5615264A (en) 1995-06-08 1997-03-25 Wave Systems Corp. Encrypted data package record for use in remote transaction metered data system
US5960194A (en) * 1995-09-11 1999-09-28 International Business Machines Corporation Method for generating a multi-tiered index for partitioned data
JP4150425B2 (ja) * 1996-05-23 2008-09-17 シティバンク,エヌ.エイ. グローバル金融サービスの統合システム
US5913214A (en) 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
US6016348A (en) 1996-11-27 2000-01-18 Thomson Consumer Electronics, Inc. Decoding system and data format for processing and storing encrypted broadcast, cable or satellite video data
JP3836928B2 (ja) * 1997-02-26 2006-10-25 株式会社日立製作所 データベース処理方法
US7092914B1 (en) 1997-11-06 2006-08-15 Intertrust Technologies Corporation Methods for matching, selecting, narrowcasting, and/or classifying based on rights management and/or other information
JP3648051B2 (ja) * 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
US6763496B1 (en) 1999-03-31 2004-07-13 Microsoft Corporation Method for promoting contextual information to display pages containing hyperlinks
JP2000293590A (ja) 1999-04-12 2000-10-20 Sony Corp 情報処理装置および方法、並びに提供媒体
US6343287B1 (en) 1999-05-19 2002-01-29 Sun Microsystems, Inc. External data store link for a profile service
US7472349B1 (en) 1999-06-01 2008-12-30 Oracle International Corporation Dynamic services infrastructure for allowing programmatic access to internet and other resources
US7007275B1 (en) 1999-10-21 2006-02-28 Unisys Corporation Method and apparatus for automatic execution of concatenated methods across multiple heterogeneous data sources
US7124101B1 (en) 1999-11-22 2006-10-17 Accenture Llp Asset tracking in a network-based supply chain environment
US7213005B2 (en) 1999-12-09 2007-05-01 International Business Machines Corporation Digital content distribution using web broadcasting services
US6618822B1 (en) 2000-01-03 2003-09-09 Oracle International Corporation Method and mechanism for relational access of recovery logs in a database system
US6957214B2 (en) 2000-06-23 2005-10-18 The Johns Hopkins University Architecture for distributed database information access
JP3567861B2 (ja) * 2000-07-07 2004-09-22 日本電信電話株式会社 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体
JP2002149459A (ja) * 2000-11-10 2002-05-24 Mitsubishi Electric Corp 冗長化データベース管理・検索システム
JP4543563B2 (ja) 2001-02-28 2010-09-15 株式会社日立製作所 統合データベースシステムにおける問合せ最適化方法
US20030009424A1 (en) 2001-05-31 2003-01-09 Contentguard Holdings, Inc. Method for managing access and use of resources by verifying conditions and conditions for use therewith
US7546602B2 (en) 2001-07-10 2009-06-09 Microsoft Corporation Application program interface for network software platform
US6928425B2 (en) 2001-08-13 2005-08-09 Xerox Corporation System for propagating enrichment between documents
US7133862B2 (en) 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US20030158767A1 (en) 2001-12-28 2003-08-21 Nwafor John I. Method and system for adaptive software system interface and external database synchronization
US20040139089A1 (en) 2002-03-29 2004-07-15 Wells Ronald B. Method and system for managing information on a network
US7233939B1 (en) * 2002-04-30 2007-06-19 Oracle International Corporation Systems and methods of optimizing database queries for efficient delivery of query data subsets
US6993534B2 (en) 2002-05-08 2006-01-31 International Business Machines Corporation Data store for knowledge-based data mining system
WO2003107223A1 (en) 2002-06-17 2003-12-24 Beingmeta, Inc. Systems and methods for processing queries
US7493311B1 (en) * 2002-08-01 2009-02-17 Microsoft Corporation Information server and pluggable data sources
EP1403764A1 (en) 2002-09-26 2004-03-31 Sap Ag Method and computer system for dynamic data type enrichment
ZA200302281B (en) * 2002-09-30 2003-09-29 Microsoft Corp Accessibility system events mechanism and method.
US7849016B2 (en) 2002-12-18 2010-12-07 Vincent So Internet-based data content rental system and method
US7177874B2 (en) 2003-01-16 2007-02-13 Jardin Cary A System and method for generating and processing results data in a distributed system
US20040148278A1 (en) 2003-01-22 2004-07-29 Amir Milo System and method for providing content warehouse
US7146356B2 (en) 2003-03-21 2006-12-05 International Business Machines Corporation Real-time aggregation of unstructured data into structured data for SQL processing by a relational database engine
JP2004304304A (ja) 2003-03-28 2004-10-28 Fujitsu Ltd 電子署名生成方法,電子署名検証方法,電子署名生成依頼プログラム,及び電子署名検証依頼プログラム
JP2004326250A (ja) 2003-04-22 2004-11-18 Nec Corp 代金情報管理サーバ、代金情報管理方法、及び代金情報管理プログラム
US20040215656A1 (en) 2003-04-25 2004-10-28 Marcus Dill Automated data mining runs
EP1482418A1 (en) 2003-05-28 2004-12-01 Sap Ag A data processing method and system
US7739223B2 (en) 2003-08-29 2010-06-15 Microsoft Corporation Mapping architecture for arbitrary data models
US7594109B2 (en) 2003-12-23 2009-09-22 Hewlett-Packard Development Company, L.P. Digital content distribution system
US8090265B2 (en) 2004-03-05 2012-01-03 Finisar Corporation Byte-configurable memory in an optical transceiver
US8521687B2 (en) * 2004-08-03 2013-08-27 International Business Machines Corporation Apparatus, system, and method for selecting optimal replica sources in a grid computing environment
US7451357B2 (en) 2004-11-18 2008-11-11 International Business Machines Corporation Apparatus and system for adjusting trace data granularity
US7427349B2 (en) 2004-12-16 2008-09-23 Chevron U.S.A. Inc. Fuels hydrocracking and distillate feed hydrofining in a single process
US20130104251A1 (en) 2005-02-01 2013-04-25 Newsilike Media Group, Inc. Security systems and methods for use with structured and unstructured data
US7882122B2 (en) 2005-03-18 2011-02-01 Capital Source Far East Limited Remote access of heterogeneous data
US20060271510A1 (en) 2005-05-25 2006-11-30 Terracotta, Inc. Database Caching and Invalidation using Database Provided Facilities for Query Dependency Analysis
EP1908211A2 (en) 2005-07-27 2008-04-09 Doug Carson & Associates, Inc. Verifying provenance data associated with digital content
US20070056042A1 (en) 2005-09-08 2007-03-08 Bahman Qawami Mobile memory system for secure storage and delivery of media content
US7668821B1 (en) 2005-11-17 2010-02-23 Amazon Technologies, Inc. Recommendations based on item tagging activities of users
KR100656402B1 (ko) 2005-11-26 2006-12-11 한국전자통신연구원 디지털 콘텐츠를 안전하게 배포하는 방법 및 그 장치
US7716240B2 (en) 2005-12-29 2010-05-11 Nextlabs, Inc. Techniques and system to deploy policies intelligently
US9277295B2 (en) 2006-06-16 2016-03-01 Cisco Technology, Inc. Securing media content using interchangeable encryption key
US20100138652A1 (en) 2006-07-07 2010-06-03 Rotem Sela Content control method using certificate revocation lists
US20080091613A1 (en) 2006-09-28 2008-04-17 Microsoft Corporation Rights management in a cloud
US8312036B2 (en) * 2006-09-29 2012-11-13 Apple Inc. Recommended systems
US20100293048A1 (en) 2006-10-19 2010-11-18 Taboola.Com Ltd. Method and system for content composition
US20080104542A1 (en) 2006-10-27 2008-05-01 Information Builders, Inc. Apparatus and Method for Conducting Searches with a Search Engine for Unstructured Data to Retrieve Records Enriched with Structured Data and Generate Reports Based Thereon
GB2446199A (en) 2006-12-01 2008-08-06 David Irvine Secure, decentralised and anonymous peer-to-peer network
US7571069B1 (en) 2006-12-22 2009-08-04 Hewlett-Packard Development Company, L.P. Data assurance workflow derivation and execution
US20080222132A1 (en) 2007-03-07 2008-09-11 Jiangyi Pan Personalized shopping recommendation based on search units
US20080228716A1 (en) 2007-03-13 2008-09-18 Dettinger Richard D System and method for accessing unstructured data using a structured database query environment
US8219523B2 (en) 2007-03-23 2012-07-10 Sap Ag Data quality enrichment integration and evaluation system
US7970943B2 (en) 2007-08-14 2011-06-28 Oracle International Corporation Providing interoperability in software identifier standards
US8972518B2 (en) 2007-09-20 2015-03-03 Flash Networks Ltd. Integrated data-model and flow based policy system
AU2008337244A1 (en) 2007-12-18 2009-06-25 Bae Systems Plc Improvements relating to data curation
US7984056B1 (en) * 2007-12-28 2011-07-19 Amazon Technologies, Inc. System for facilitating discovery and management of feeds
GB2456184A (en) 2008-01-07 2009-07-08 Cvon Innovations Ltd System for selecting an information provider or service provider
ITTO20080434A1 (it) 2008-06-05 2009-12-06 Accenture Global Services Gmbh Sistema di raccolta e di analisi di dati relativi agli acquisti di consumatori e acquirenti
JP2010020524A (ja) 2008-07-10 2010-01-28 Id Solution:Kk Dna認証システム
US7991650B2 (en) 2008-08-12 2011-08-02 Amazon Technologies, Inc. System for obtaining recommendations from multiple recommenders
NO330101B1 (no) 2008-12-23 2011-02-21 Microsoft Int Holdings B V Fremgangsmåte for human-sentrisk informasjonsaksess og presentasjon
US8495005B2 (en) * 2009-01-14 2013-07-23 International Business Machines Corporation Methods for matching metadata from disparate data sources
US8452794B2 (en) 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
EP2230612A1 (fr) 2009-03-19 2010-09-22 France Telecom Génération de recommandations pour un serveur de contenus
US8103681B2 (en) 2009-05-29 2012-01-24 Clear Channel Management Services, Inc. Associating works with unique identifiers
US8122031B1 (en) * 2009-06-11 2012-02-21 Google Inc. User label and user category based content classification
WO2011004380A1 (en) 2009-07-09 2011-01-13 Xeround Systems Ltd. Database system with query interception and redirection
US8812490B1 (en) * 2009-10-30 2014-08-19 Microstrategy Incorporated Data source joins
NO331571B1 (no) 2009-10-30 2012-01-30 Uni I Stavanger System for a beskytte en kryptert informasjonsenhet
US9208230B2 (en) * 2010-10-29 2015-12-08 Google Inc. Enriching search results
US9077462B2 (en) * 2010-12-21 2015-07-07 Cox Communications, Inc. Systems and methods for measuring audience participation over a distribution network
US9122720B2 (en) 2011-06-14 2015-09-01 Microsoft Technology Licensing, Llc Enriching database query responses using data from external data sources
US9147195B2 (en) 2011-06-14 2015-09-29 Microsoft Technology Licensing, Llc Data custodian and curation system
US20150379275A1 (en) 2013-02-08 2015-12-31 Thomson Licensing Privacy against inference attacks for large data
US10445062B2 (en) * 2016-09-15 2019-10-15 Oracle International Corporation Techniques for dataset similarity discovery

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080059454A1 (en) * 2006-08-29 2008-03-06 Switchbook, Inc. Search document generation and use to provide recommendations
CN101452473A (zh) * 2007-12-03 2009-06-10 索尼株式会社 信息处理终端、信息处理方法和程序
CN102055610A (zh) * 2009-10-30 2011-05-11 三星电子株式会社 基于内容使用历史管理网络中的内容服务的方法和装置

Also Published As

Publication number Publication date
BR112013032101B1 (pt) 2021-04-20
WO2012173825A2 (en) 2012-12-20
RU2611966C2 (ru) 2017-03-01
BR112013032101A2 (pt) 2016-12-13
MX2013014800A (es) 2014-01-24
KR20190049924A (ko) 2019-05-09
US20120323843A1 (en) 2012-12-20
US20160140170A1 (en) 2016-05-19
KR20140041546A (ko) 2014-04-04
JP5986195B2 (ja) 2016-09-06
US10540349B2 (en) 2020-01-21
KR102035984B1 (ko) 2019-10-23
RU2013155626A (ru) 2015-06-20
WO2012173825A3 (en) 2013-03-21
EP2721531A2 (en) 2014-04-23
CN103608809B (zh) 2017-11-24
AU2012271085B2 (en) 2017-01-05
US20200042517A1 (en) 2020-02-06
EP2721531A4 (en) 2014-11-26
KR101976220B1 (ko) 2019-05-07
JP2014523013A (ja) 2014-09-08
US9244956B2 (en) 2016-01-26
US11093490B2 (en) 2021-08-17
CA2838502A1 (en) 2012-12-20

Similar Documents

Publication Publication Date Title
CN103608809A (zh) 推荐数据富集
CN107247808B (zh) 一种分布式NewSQL数据库系统及图片数据查询方法
US11468103B2 (en) Relational modeler and renderer for non-relational data
US7917503B2 (en) Specifying relevance ranking preferences utilizing search scopes
JP5592505B2 (ja) トピックに基づいて調整可能なデーター・フィードの総計
AU2012271085A1 (en) Recommending data enrichments
CN102214208B (zh) 一种基于非结构化文本生成结构化信息实体的方法与设备
Holzschuher et al. Querying a graph database–language selection and performance considerations
US20120102453A1 (en) Multi-dimensional objects
US9015608B2 (en) Regenerating a user interface area
US9836462B2 (en) Extensibility model for document-oriented storage services
US11238077B2 (en) Auto derivation of summary data using machine learning
US10944756B2 (en) Access control
US20090300000A1 (en) Method and System For Improved Search Relevance In Business Intelligence systems through Networked Ranking
US10417439B2 (en) Post-hoc management of datasets
Reniers et al. Schema design support for semi-structured data: Finding the sweet spot between NF and De-NF
US8645381B2 (en) Document taxonomy generation from tag data using user groupings of tags
US20100318547A1 (en) Preservation of digital content
US20080278198A1 (en) Buffer for Object Information
US20110137959A1 (en) Representing relational schema information using generic meta schemas
Nasr et al. Datahub for AURIN and ANDS Project
JP2009015511A (ja) メタデータ管理装置、プログラムおよびメタデータ管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150723

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150723

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

GR01 Patent grant
GR01 Patent grant