CN102648466A - 用于取回视图中的数据项批注的方法 - Google Patents

用于取回视图中的数据项批注的方法 Download PDF

Info

Publication number
CN102648466A
CN102648466A CN2010800534329A CN201080053432A CN102648466A CN 102648466 A CN102648466 A CN 102648466A CN 2010800534329 A CN2010800534329 A CN 2010800534329A CN 201080053432 A CN201080053432 A CN 201080053432A CN 102648466 A CN102648466 A CN 102648466A
Authority
CN
China
Prior art keywords
data
comments
annotations
value
data item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800534329A
Other languages
English (en)
Inventor
C·C·麦西
M·瓦兰德
J·P·伯兰德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN102648466A publication Critical patent/CN102648466A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一种取回与视图中的数据项关联的批注的方法,其中所述视图由信息管理系统查询数据源而生成,所述方法包括以下步骤:接收查询的输出;分析所述查询的输出以识别一个或多个数据项,其中数据项包括数据值和与该数据值关联的属性;对于每个所识别的数据值和属性,识别与所述数据值和所述属性中的每一个关联的唯一值,其中与所述数据值关联的所识别的唯一值和与所述属性关联的所识别的唯一值形成唯一值集合;从数据储存器识别与所述唯一值集合对应的先前记录的唯一值集合;响应于肯定的判定,判定所述先前记录的唯一值集合是否包括关联批注;以及响应于肯定的第二判定,从所述数据储存器取回所述批注。

Description

用于取回视图中的数据项批注的方法
技术领域
本发明涉及信息管理的领域。具体地说,本发明涉及一种用于将批注与视图中的数据项关联的改进方法。
背景技术
信息管理系统包括工具及应用,所述工具及应用存储数据、分析数据及对数据执行某一形式的计算,以便向用户提供对数据的某种有意义的理解。
信息管理系统可包括收集、分析及报告信息的任何数目的应用,如数据库应用和电子表格应用。通过使用关系型数据库应用的实例,使用关系模型以便定义具有与其它数据元素同样的属性的数据元素之间的关系。例如,消费者与发票可具有“一对多”关系。这意味着一个消费者可具有“许多”发票,但一张发票不具有“许多”消费者,因为发票倾向于对特定消费者而言是唯一的。一旦已定义了关系,便可接着创建采用预定义关系的查询以便提供有意义的报告。例如,可定义一个查询以查询数据源,以便查明特定消费者具有多少张未付(outstanding)发票。
在一种在线分析处理系统中,通常在星型或雪花型模式(schema)上对基础数据结构建模。所述系统包括称为测量且通过称为维度的事项分类的数值型事实(numeric fact)。从事实表中的记录导出测量,且从维度表导出维度。在数据仓库中,维度是将数据集中的每一项目分类为非重叠区域的数据元素。生成视图,所述视图显示测量及与测量关联的事实,即,数据及描述数据的性质的描述符。例如,数据可采取“等离子屏幕电视”的形式,且“等离子屏幕电视”的维度是“产品”。
另一实例可见于电子表格中,其中数据被填入“组成”列及行的单元格中。通常,使用数据进行某种计算分析,且(例如)以表格形式等来显示结果。
然而,所有以上类型的应用的共同点在于:分析数据,且向用户显示结果以供审阅和/或进一步分析。
通常,当生成报告或视图时,报告的查看者可能希望对报告/视图中的一个或多个项目进行批注。尽管此情形通过向数据所在的单元格添加注释而是可能的,但当重新运行查询且随后刷新报告数据时,将出现问题。这是因为注释并不跟随显示于报告中的第一位置处的数据,且在刷新报告时,数据现在显示于报告中的第二位置处。问题在于,注释仍显示于第一位置处,但数据已移动至不同位置,且因此注释现在引用不正确的数据。
用于解决此问题的一种现有技术解决方案可见于描述一种方法的美国专利申请案第2006/0212469号中,所述方法用于将项目元数据与电子表格中的项目相关联,使得当项目移动至电子表格中的不同单元格时,注释亦与项目一起移动。此情形通过在电子表格自身中创建索引来实现,所述索引创建至元数据表的索引。然而,此解决方案的问题在于,虽然项目元数据将与表中的项目一起移动至新单元格,但此解决方案仅在数据包含在电子表格自身内的情况下起作用。因此,现有技术仍依赖数据的单元格位置来确定将注释移动至的位置。此解决方案在以下情形下不起作用:数据由外部数据源提供和/或生成报告的查询被重新运行。另外,现有技术解决方案需要将元数据索引“插入”项目的单元格中,因此需要通过修改基础电子表格的结构使其具有ID字段。因此,本发明试图减轻上述问题。
发明内容
从第一方面考虑,本发明提供一种取回与视图中的数据项关联的批注的方法,其中所述视图由信息管理系统查询数据源而生成,所述方法包括以下步骤:接收查询的输出;分析所述查询的输出以识别一个或多个数据项,其中数据项包括数据值和与该数据值关联的属性;对于每个所识别的数据值和属性,识别与所述数据值和所述属性中的每一个关联的唯一值,其中与所述数据值关联的所识别的唯一值和与所述属性关联的所识别的唯一值形成唯一值集合;从数据储存器识别与所述唯一值集合对应的先前记录的唯一值集合;响应于肯定的判定,判定所述先前记录的唯一值集合是否包括关联批注;以及响应于肯定的第二判定,从所述数据储存器取回所述批注。
有利地,本发明提供将批注(多个)与视图中的数据项关联并取回所述批注(多个)的能力。批注是传达待与数据项关联的信息的任何形式的注释或元数据。数据项包括数据及数据属性。数据被表征为已从诸如数据仓库的外部数据源查询的数据或已对其执行某一形式的计算分析的数据。数据属性包括列和行标题,即,给出数据的上下文含义的属性。
当接收到查询时,将查询基础数据源,且返回查询的结果以供进一步分析。作为元组(tuple)集合而返回结果。每一维度(即,每一单元格位置)可通过元组(即,行、列、数据)来表示。如果批注与数据项关联,则元组可包括行、列、数据及批注。针对每一数据项(在元组中识别的行、列及数据)识别唯一生成的值。如果数据集包括额外标题或分组,则将此信息包括至所述额外标题或分组。所述唯一值中的每一个唯一值的组合形成唯一值集合,其被记录在批注数据储存器中的索引元组表中。将批注存储在批注表中,且针对批注表中存储的每一批注生成唯一关键字(key)。所述唯一关键字与批注的关联唯一值集合一起存储。唯一值可在所有视图上或基于每个视图为唯一的。
当重新运行查询且将新维度或新属性引入查询的结果时,即,如果该查询正在查询一个数据源以判定“哪些国家已销售了多于500台电视机”,则第一次执行该查询,其可返回这些国家:英国、法国。然而,在后续查询时,可能存在新的可用数据,且该查询的结果可将额外国家(诸如,德国及美国)返回至所述结果中。
因此,分析新查询的结果以识别形成所生成查询的结果的数据项。视图中的每一数据项(数据值和属性,或数据值及维度)与元组相关联,所述元组具有来自每一维度的属性。
分析所述元组中的每一数据项以识别唯一值。记录每一所识别的唯一值以形成唯一值集合,其中所述唯一值集合表示查询结果中的元组。在表中执行查找以识别是否已记录先前唯一值集合,其中所述先前唯一值集合为与当前“正被分析”的唯一值集合相同的值。如果判定为肯定的,则取回与已记录的值集合关联的唯一关键字,且该唯一关键字允许执行查找以便定位关联批注。“正被分析”的唯一值集合然后被映射回至所述数据项中的每个数据项且呈现在视图中,从而显示所述查询的结果。
优选地,本发明提供一种方法,还包括在视图中显示所识别的数据项中的每一个和所述关联批注。
优选地,本发明提供一种方法,其中从所述数据储存器取回所述批注进一步包括:将所述唯一值集合内的所述唯一值中的每一个映射回如在所述查询的输出中识别的所述唯一值的关联数据项;以及在视图中显示所述数据项与所述关联批注。
优选地,本发明提供一种方法,其中数据项包括数据和所述数据的已通过查询数据源而取回的关联属性。
优选地,本发明提供一种方法,其中数据的属性包括如在视图中显示的列和/或行标题。
优选地,本发明提供一种方法,其中批注包括字符串、整数值、URL、至信息源的其它指针或链接。
优选地,本发明提供一种方法,其中批注可与视图中的任何位置处的数据项关联。
优选地,本发明提供一种方法,其中批注与一个或多个视图中的多个数据项关联。
优选地,本发明提供一种方法,其中所述数据源是在所述信息管理系统外部的数据源。
从另一方面考虑,本发明提供一种将批注与视图中的数据项关联的方法,其中所述视图从在视图中呈现查询的结果而生成,所述方法包括以下步骤:接收指令以将批注与视图中的数据项关联;从所述数据项确定与所述视图中的所述数据值关联的一个或多个属性;对于每一数据值及其关联属性,确定与所述数据值及其关联属性相关联的唯一值;记录所述唯一值中的每一个以创建唯一值集合,所述唯一值集合表示所述数据项及所述数据项的属性;以及生成用于将所请求的批注与所述唯一值集合关联的唯一值。
从另一方面考虑,本发明提供一种取回与视图中的数据项关联的批注的装置,其中所述视图由信息管理系统查询数据源而生成,所述装置包括以下组件:用于接收查询的输出的映射组件;用于分析所述查询的输出以识别一个或多个数据项的映射组件,其中数据项包括数据值和与该数据值关联的属性;用于识别与每个数据值和所述数据值中的每个数据值的属性关联的唯一值的映射组件,其中与所述数据值关联的所识别的唯一值和与所述属性关联的所识别的唯一值形成唯一值集合;用于从数据储存器识别与所述唯一值集合对应的先前记录的唯一值集合的映射组件;用于响应于肯定的判定而判定所述先前记录的唯一值集合是否包括关联批注的映射组件;以及用于响应于肯定的第二判定而从所述数据储存器取回所述批注的映射组件。
从另一方面考虑,本发明提供一种包括计算机程序代码的计算机程序,所述计算机程序代码在加载至计算机系统中且执行时执行如上文所描述的方法的所有步骤。
附图说明
现在将仅通过实例参考附图描述本发明的各实施例,这些附图是:
图1a及图1b是本发明的一个优选实施例可在其中操作的数据处理系统的示意性表示;
图2是详细描述如本领域公知的信息管理系统的示意图;
图3是根据本发明的一个优选实施例的详细描述信息管理系统上的组件的示意图;
图4是根据本发明的一个优选实施例的展示信息管理系统生成的具有关联批注的报告的一个实例的示意图;
图5是根据本发明的一个优选实施例的展示索引创建器组件的各组件的示意图;
图6a及图6b是根据本发明的一个优选实施例的展示实例视图及表示视图中的维度的元组的示意图;及
图7是根据本发明的一个优选实施例的详细描述数据库应用的处理步骤的流程图。
具体实施方式
图1a及图1b详细描述与本发明的一个优选实施例一起使用的数据处理系统100。数据处理系统100包括彼此协作以便提供本发明的益处的硬件115及软件120。通常,数据处理系统100包括:某一形式的存储构件120,在存储构件120中本地地在数据处理系统上或经由数据处理系统100外部的存储构件145来存储数据;存储及内存构件115,其用于存储并运行可操作以在所述数据处理系统上使用的信息管理应用;输入构件125,其用于输入指令及与信息管理应用的操作关联的数据;及显示构件130,其用于查看数据库应用的输出。
信息管理应用可以服务器模式135或客户端模式150操作。当以服务器模式135操作时,客户端设备150可操作以经由网络140连接至服务器。客户端设备150可经由任何形式的有线网络构件140或无线网络构件140连接至服务器135。
客户端设备150包括输入构件155及输出构件160,及用于与数据处理系统100交互的内存及存储构件165。客户端设备150为包括输入/输出处理构件的任何设备,诸如膝上型计算机、桌上型计算机、笔记本型计算机、移动电话或其它多功能手持型移动计算设备。以服务器模式135操作的数据处理系统100可操作以与多个客户端设备150通信且接收来自多个客户端设备150的指令。
图2详细描述如本领域中公知的信息管理系统200。然而,本领域技术人员将了解,本发明适用于任何活动数据库应用或电子表格应用,藉此分析并报告数据。此定义被视为涵盖在线交易处理应用,以及数据挖掘应用、关系型数据库应用、多维数据库以及电子表格应用等,它们共享与数据库应用等关联的许多特性。如根据各优选实施例解释的本发明旨在适用于以格式化方式显示来自所生成的查询结果的任何应用,且其中当所显示数据移动至格式化显示器中的另一位置时,与所显示数据关联的批注需要与所显示数据持续地关联。
数据储存器225存储与活动或实体有关的数据,以便在由信息管理系统200进行分析时提供历史、当前及预测性分析以及商业运营(businessoperation)的视图。数据储存器225可采取如在本领域中公知的数据仓库或数据超市的形式。
数据储存器225可与信息管理应用200分离,即,位于不同服务器上但在同一服务器机柜内,或位于与信息管理系统200不同的地理位置。备选地,数据储存器225可与信息管理系统200位于同一服务器上。数据可采取结构化数据的形式,通常,结构化数据是通过数据模型而建模的数据。备选地,数据可为非结构化的数据,即,可见于需要语义分析以便分析并报告数据的含义的电子邮件、SMS、即时消息传送中的数据。
在一个优选实施例中,建模器(modeller)组件220提供其中对基础数据建模以便描述表示和存取数据的方式的手段。数据模型通常定义数据元素及所定义数据元素之间的关系。数据模型可为关系实体模型或星型或雪花型模式等。
查询构建器205使得用户能够通过查询生成器组件230构建查询以供执行。查询生成器组件230分析位于相关数据储存器225中的数据,且以视图或报告215的形式返回相关数据。查询可采取“1998年在多个地理区中销售了多少台电视机?”的形式。视图生成器210接收来自查询生成器组件230的所生成查询,且生成用于显示查询结果的视图215。
视图215或报告215可为所述形式或通过用户定义的任何格式。视图215亦可描述为原始数据集的一个方面的视图215,所述原始数据集已基于用户定义的准则被查询。术语视图215用于描述任何形式的输出显示,藉此向用户显示查询结果。视图215或报告215通常在已对数据源执行查询之后生成。视图215或报告215显示查询结果。术语“视图”将贯穿本说明书的剩余部分使用,且理解为涵盖查询的所有显示输出。
图4中示出查询的简化输出。视图215为“2001年全世界销售了多少台ABC公司的电视机”的查询的输出。藉此,第一列400列出相关产品(即,电视机),第二列405列出地理区,第三列410列出销售的数目或测量,且第四列415列出时间标度(即,所查询的时间段)。每一行435显示查询结果,且由列标题进行分类。列400与行435之间的相交点为单元格440,或亦称为维度425,并且维度包括数据值445。可将数据值视为可从查询生成的数据。
图3详细描述本发明的一个优选实施例。存在与现有技术信息管理应用共享的多个核心组件,即,数据储存器225、建模器组件220及查询构建器205,因此,将不进一步解释这些组件。
根据本发明的一个优选实施例,修改后的信息管理系统300包括批注数据储存器305、修改后的查询生成器组件340、用于生成视图335的修改后的视图生成器组件310、映射组件315、映射表325、用于创建索引元组表的索引创建器组件320,及代码生成器组件330。
当用户提交查询时,查询构建器组件230将查询格式化为查询语言,且查询生成器组件340查询数据储存器225以搜寻所需信息。在本发明的一个优选实施例中,查询生成器组件340将查询作为元组集合返回至视图生成器组件310。元组包括值的集合,其中元组中的所述值中的每个值表示数据库表中的一个维度。例如,如果生成询问“2001年在德国销售了多少台电视机”的查询,则查询可返回以下数据:
“2001年在德国销售了500台电视机”
本领域技术人员将认识到,此实例仅出于说明目的,且通常可以如在图4中展示的结构化表格格式返回结果。
然而,出于高效存储及取回的目的,结果可如下作为元组存储于数据储存器305中:
<产品=电视机,国家=德国,时间=2001,测量=500>
本领域技术人员将认识到,以上元组仅出于说明目的,且在实际中元组将具有更复杂的数据结构。
重要的是指出:元组不仅存储查询结果(数据值),而且存储与查询结果有关的行标题、列标题及子标题。因此,元组存储数据值及数据值的属性。将贯穿说明书使用术语数据项以描述数据值及其关联维度或属性。
再次参看图4,其展示针对ABC公司的等离子电视机的销售的查询的结果的简化视图。仅出于说明目的,展示第五列,其中用户可将注释/批注440添加至报告中的行中。在此实例中,用户已添加的对2001年在德国销售的电视机的数目的批注为“进步”440。此批注440与整个行435关联,但亦可与数据项425、445、450之一而非组成该行的全体数据项关联。因此,对于此实例,元组可以为如下:
<产品=电视机,国家=德国,时间=2001,测量=500,批注=进步>
批注440可采取字符串、整数值或至外部数据源的链接或指针的形式。外部数据源225可为网页、文档或用于传送信息的任何其它形式。
批注440可与显示在组成整个报告的单元格、列及行中的任何数目的数据项关联,或批注可与关联于特定单元格位置的单个数据项关联。
在用户正查看报告时,批注440可与数据项相关联,或在刷新查询且更新维度并将其显示于不同视图中时,可显示批注。
批注440可显示于一个或多个关联数据项正被显示在其中的单元格位置425、450、455处或显示于额外列中,如图4中所说明。备选地,批注440可通过使鼠标“暂留”在包括与批注关联的数据项(多个)的行上来显示。批注440可经由其它显示手段显示于对话框中,所述对话框经由鼠标或菜单功能操作来触发。本领域技术人员将认识到,在不偏离本发明的范围的情况下,存在显示与数据项关联的批注440的多种方式。
批注440存储在批注数据储存器305内的批注表中。批注440可被修正或删除(或与数据项关联的其它批注),且所有改变被更新并反映在批注数据储存器305内的批注表中。
因此,批注440亦可与显示在列而非行中的汇总项目关联,这是因为批注440可与视图或报告中的任何单元格位置中的任何数据值440或数据值的属性400、405、410、415、420关联。
为了将批注与显示在视图335中的一个或多个数据项相关联,将批注链接至作为查询结果的一部分而生成的元组。对于所生成视图的一个方面,将存在许多元组。
例如,使用展示于图4中的视图,包括“进步”的批注的元组可如下:
<产品=ABC公司的等离子电视,地理区=DE,时间=2001,值=5000,批注=进步>
参看图5,包含在以上元组中的数据项存储于批注存储器305内的元组索引表505中,且批注440存储在批注存储器305内的批注表510中。存储在元组索引表505中的元组经由唯一生成的关键字550链接至其在批注表510中的关联批注440。然而,本领域技术人员将认识到,在不偏离本发明的范围的情况下,存在可能的其它存储配置。在以上实例中,字符串“进步”440亦将存储在批注数据储存器305中的批注表510中。然而,如果批注440引用网页,则至网页的URL引用将存储在批注数据储存器305内的批注表510中。
为了取回与元组关联的批注,索引创建器组件320创建所存储元组的索引520。
在此实例中,索引创建器表500包括多个行525至555,每一行525至555表示元组或基础数据模式中的唯一识别的数据项。例如,如果基础数据模式是包括事实表(其具有以下维度:包括国家、地址及邮政编码的地理区,包括电视机、收音机、音频系统、烤面包器的产品,包括2001、2002、2003、2004及2005的年份)的星型模式,则这些数据项亦可在索引创建器表500中列出。因此,表内的行的数目随着与星型模式关联的维度的数目而线性地增大。备选地,可在第一次提交对元组中的数据项的存储操作时(即,在检测到对批注及批注的关联元组的保存操作时)创建索引创建器表500中的行525至555。
首先,索引创建器组件320分析待提交至存储器的元组、检测元组中的第一数据项、在索引创建器表500中执行查找,且检测在元组中识别的第一数据项是否位于表的行525至555中。
如果判定为否定的,即,第一数据项并不存在,则将第一数据项放置在表500的行525至555中,且向第一数据项给予唯一生成的识别符515。所生成的识别符515存储在索引创建器表500中。针对元组中的每一数据项继续此处理,直至元组中的所有数据项均已被分析为止。对于每一提交操作,可存在具有许多数据项的许多元组。
例如,采用如下元组:
<国家=德国,产品=电视机,时间=2001,测量=5000,批注=进步>
索引创建器组件320通过查看位于元组中的第一数据项(即,“国家”)而开始,且识别在索引创建表500中不存在针对“国家”的表项,并将数据项“国家”放置在表500内的可用行525中,且向“国家”指派为(例如)值1的唯一识别符515(针对表500中的每个唯一表项生成唯一值)。索引创建器组件320定位元组中的下一项目(即,“德国”),判定在索引创建器表中不存在针对“德国”的表项且将数据项“德国”添加至索引创建器表500中的下一可用行530,并向数据项“德国”指派值“2”。接下来,索引创建器组件320定位元组中的下一项目(即,“产品”),判定在索引创建器表500中不存在针对“产品”的表项且将数据项“产品”添加至索引创建器表500中的下一可用行540,并向数据项“产品”指派值“4”。接下来,索引创建器组件320单位元组中的下一项目(即,“电视机”),判定在索引创建器表中不存在针对“电视机”的表项且将数据项“电视机”添加至索引创建器表500中的下一可用行545,并向数据项电视指派值“5”。接下来,索引创建器组件320定位元组中的下一项目(即,“时间”),且判定在索引创建器表500中不存在针对“时间”的表项且将数据项“时间”添加至索引创建器表500中的下一可用行545,并向数据项“时间”指派值“10”。针对在元组中识别的每个数据项继续此处理,使得每个数据项已记录于索引创建表500中,且生成唯一值并使所述唯一值与数据项中的每一个相关联。
如果索引创建器组件320识别元组中的批注属性,则索引创建器组件320将批注值(即,字符串、整数值、至其它信息的指针或链接)写入数据储存器305内的批注表510中,且创建唯一关键字550并将唯一关键字550与批注440相关联。对于任何给定元组,可存在许多批注。唯一关键字550亦与元组索引表505中的数据值的相应集合520相关联。其它信息(诸如,创建批注的人员及创建批注的日期及时间)亦可与批注一起存储。
针对提交至存储器的每一元组及关联批注执行上述处理。当用户在查看视图的同时添加批注时,或每当刷新报告且将所有现存批注“拉入”报告中时,此情形可发生。
在随后检测到至批注数据储存器305的提交操作时,索引创建器组件320将再次分析元组的每一数据项。当索引创建器组件320在索引创建表500中执行查找且检测到元组的数据项已记录在索引创建表500中时,索引创建器组件320接着移动至元组中的下一项目且检测下一数据项是否已记录在索引创建表500中。如果已记录该数据项,则索引创建器组件320再次移动至元组中的下一数据项,直至已分析且对照索引创建表500中记录的表项检查所有数据项为止。仅在索引创建器组件320判定元组的数据项未记录在索引创建表500中时,索引创建器组件320才将数据项记录在索引创建表500中且生成唯一识别符515以与记录在索引创建表500中的项目关联。数据项亦包括与视图中的数据项相关联的批注。
如果索引创建器组件320检测到数据项已记录在索引创建表500中,则索引创建器组件320识别与数据项关联的唯一识别符515且将该唯一识别符515写入元组索引表505。
因此,得到的值集合520是唯一地识别元组中的所有数据项(包括任何关联批注440)的值集合。该值集合520存储在元组索引表505中,且批注存储在批注表510中。备选地,可以一起存储值集合520及批注440。
作为额外步骤,所述值集合中的每个值可使用已知散列技术进行散列以便提供批注的更快搜索及取回。
因此,存储在批注数据储存器305中的是这样的值集合:其唯一地识别与批注440关联的维度(即,视图中的位置参考点(单元格位置))的集合。因此,当由于a)来自外部数据源225的数据已被刷新而刷新视图335或b)已重新运行查询而刷新视图335时,接着对于视图335中的每一维度集合,映射组件315查询元组索引表505以识别是否存在与显示于当前视图335中的维度匹配的维度(即,元组参考)的集合。如果定位相同的参考集合,则从批注数据储存器305中的批注表510查询关联批注,且将其取回以便与适当数据项一起显示在视图335中。
由于基础数据源已被更新或查询自身已改变,所以可刷新查询。因此,当查询构建器组件230接收新查询以进行处理时,以上文所描述的方式处理该查询。然而,此次视图生成器组件310需要判定待生成的视图是否包括需要与关联数据项一起显示的任何批注440。此处理通过映射组件315来处置。
当查询生成器组件340将来自查询的元组集合返回至视图生成器310时,映射组件315拦截查询生成器组件340与视图生成器组件310之间的此通信,且通过分析元组中的数据项而开始。
如前所述,识别元组中的第一数据项,且在索引创建表500中执行查找,以识别与第一数据项关联的唯一识别符。映射组件315将所识别的值写入至内存。接下来,映射组件315识别元组中的第二数据项并在索引创建表500中执行查找,且定位与第二数据项关联的唯一识别符并将所识别的值写入至内存。此处理继续,直至元组中的每一数据项均与在索引创建表500中定位的唯一值关联为止。
因此,映射组件315创建唯一地识别元组中的数据项的组合的值集合,该元组为查询的输出。然而,如果映射组件未能在索引表中定位数据项,则处理停止,且需要针对索引创建器组件中的数据项创建唯一值。
接下来,映射组件315获取创建的值集合且在元组索引表505中执行查找,以判定是否存在记录于元组索引表505中的对应的唯一值集合。如果映射组件315识别到对应的值集合,则连同关联批注440一起将所识别的值集合取回至视图生成器组件310以便生成视图335,视图335现在包括与特定元组关联的批注440。
例如,如果查询询问以下问题:
“2001年在英国销售了多少台电视机?”
则查询生成器组件340将返回以下元组:
<产品=电视机,国家=英国,时间=2001,测量=80,000>
映射组件315获取以上元组,且在索引创建表500中执行查找并生成以下值集合:
<4.5.1.3.10.11.7.8>
此时并不知晓是否存在已针对元组<产品=电视机,国家=英国,时间=2001,测量80,000>而存储的任何批注。
因此,映射组件315在元组索引表505中执行查找以搜寻值集合<4.5.1.3.10.11.7.8>,从而识别对应的值集合520。如果找到,则映射组件315将此值写入至映射表325。映射组件315针对在元组中识别的每一项目继续此处理。例如,如果元组为:
<产品=电视机,国家=英国,测量=250000>
则映射组件315将使用来自索引创建表500的信息得到以下值集合。
<4.5.1.3.7.9>
映射组件315在元组索引表505中执行查找以搜寻对应的值组合520。然而,数据值的次序无关紧要,只要值集合520包括相同数据值。如果在单个值集合中找到对应的值组合,则取回所识别的值集合。执行进一步的查找以判定是否存在与所识别的值集合关联的唯一生成的关键字550,且如果存在,则使用唯一关键字550来取回关联批注。
执行反向查找以从所述值集合“回到”数据项以便使视图生成器组件310能够生成视图335,视图335显示所请求的查询的结果及任何关联批注440。
图6a例示了视图335的一个实例,视图335包括许多不同零售渠道的列标题605。每个行610与不同时间段有关,且单元格615中的数据615为特定时间段的销售量。
标签a、b及c描绘与箭头指向的数据值关联的批注。
图6b例示了与图6a中例示的视图相同的视图,但是例示由索引创建器组件325针对图6a中例示的数据而生成的元组。因此,对于图6a中给出的批注,给出以下维度:
a=(2004,户外用品商店,数量)
b=(2006,高尔夫用品商店,数量)
c=(2004,体育用品商店,数量)
其中通过如参考图5描述的处理针对批注a、b及c而生成的元组为:
a=(12::10::3)
b=(26::19::8)
c=(14::10::5)
且采取与批注“a”关联的元组,可通过代码生成器组件330生成以下代码。
Figure BDA00001682988100151
其中可以看到,批注“a”的元组值反映在称为ctxid属性的事项中。ctxid属性的组合等效于图5的元组索引表505中所创建的索引。ctxid属性唯一地识别文档内的元素。
以上代码中的pun/mun/lun/hun/dun属性指代所生成视图335的数据项区段中的行。此情形更详细地展示于以下所生成的代码中。
以下为来自HTML生成器组件330的针对图6a及图6b中所示的表的实例代码输出。
Figure BDA00001682988100162
代码生成器组件330将输出传送至视图生成器组件310,以便呈现输出至图6a中示出的表的视图335。因此可以看到,一旦批注与数据项关联,基础数据源是否被更新、查询是否被刷新以及不同维度集合是否显示在视图中便为无关紧要的,因此改变视图的原始组织结构为无关紧要的,因为批注将始终与其关联数据项一起显示。
还可以在报告级别将批注分组在一起,且因此可显示仅与特定报告有关的批注。这通过引入报告id来完成,且可将批注链接至报告id作为过滤机制。可引入其它分组和过滤机制以便向视图的不同级别和方面提供“向下切入(drill down)及钻研(drill through)”能力。
图7例示用于在用户刷新并查看查询时取回批注的处理流程。
在步骤700,查询生成器组件340接收查询,且对基础数据源225进行查询。返回结果的集合。在步骤705,通过映射组件315分析查询的输出以识别输出的每个维度中的一个或多个数据项,以便识别与每个数据项关联的唯一值515。在步骤710,记录505每个所识别的唯一值515,并且其中每个所识别的唯一值形成表示查询输出中的每个所识别数据项的唯一值集合。在步骤715,映射组件315从数据储存器305识别先前记录的唯一值集合520,其对应于当前正在被分析的唯一值集合520。在步骤720,响应于肯定的判定而判定先前记录的唯一值集合520是否包括关联批注,且在步骤725,响应于肯定的第二判定而从数据储存器取回批注。
本发明可采用完全硬件实施例、完全软件实施例或含有硬件及软件元素两者的实施例的形式。在一个优选实施例中,本发明以软件实施,所述软件包括(但不限于)固件、驻留软件、微代码等。
此外,本发明可以采取可从计算机可用或计算机可读介质访问的计算机程序产品的形式,所述计算机可用或计算机可读介质提供了可以被计算机或任何指令执行系统使用或与计算机或任何指令执行系统结合的程序代码。出于此描述的目的,计算机可用或计算机可读介质可以是任何能够包含、存储、传送、传播或传输由指令执行系统、装置或设备使用或与所述指令执行系统、装置或设备结合的程序的装置。
所述介质可以是电、磁、光、电磁、红外线或半导体系统(或装置或设备)或传播介质。计算机可读介质的实例包括半导体或固态存储器、磁带、可移动计算机盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘的当前实例包括压缩盘-只读存储器(CD-ROM)、压缩盘-读/写(CR-R/W)和DVD。
可在不偏离本发明的范围的情况下对前述内容做出改进及修改。

Claims (11)

1.一种取回与视图中的数据项关联的批注的方法,其中所述视图由信息管理系统查询数据源而生成,所述方法包括以下步骤:
接收查询的输出;
分析所述查询的输出以识别一个或多个数据项,其中数据项包括数据值和与该数据值关联的属性;
对于每个所识别的数据值和属性,识别与所述数据值和所述属性中的每一个关联的唯一值,其中与所述数据值关联的所识别的唯一值和与所述属性关联的所识别的唯一值形成唯一值集合;
从数据储存器识别与所述唯一值集合对应的先前记录的唯一值集合;
响应于肯定的判定,判定所述先前记录的唯一值集合是否包括关联批注;以及
响应于肯定的第二判定,从所述数据储存器取回所述批注。
2.如权利要求1的方法,还包括在视图中显示所识别的数据项中的每一个和所述关联批注。
3.如权利要求1的方法,其中从所述数据储存器取回所述批注进一步包括:将所述唯一值集合内的所述唯一值中的每一个映射回如在所述查询的输出中识别的所述唯一值的关联数据项;以及在视图中显示所述数据项与所述关联批注。
4.如权利要求1的方法,其中数据项包括数据和所述数据的已通过查询数据源而取回的关联属性。
5.如权利要求2的方法,其中数据的属性包括如在视图中显示的列和/或行标题。
6.如权利要求1的方法,其中批注包括字符串、整数值、URL、至信息源的其它指针或链接。
7.如权利要求1的方法,其中批注可与视图中的任何位置处的数据项关联。
8.如权利要求1的方法,其中批注与一个或多个视图中的多个数据项关联。
9.如权利要求1的方法,其中所述数据源是在所述信息管理系统外部的数据源。
10.一种取回与视图中的数据项关联的批注的装置,其中所述视图由信息管理系统查询数据源而生成,所述装置包括以下组件:
用于接收查询的输出的映射组件;
用于分析所述查询的输出以识别一个或多个数据项的映射组件,其中数据项包括数据值和与该数据值关联的属性;
用于识别与每个数据值和所述数据值中的每个数据值的属性关联的唯一值的映射组件,其中与所述数据值关联的所识别的唯一值和与所述属性关联的所识别的唯一值形成唯一值集合;
用于从数据储存器识别与所述唯一值集合对应的先前记录的唯一值集合的映射组件;
用于响应于肯定的判定而判定所述先前记录的唯一值集合是否包括关联批注的映射组件;以及
用于响应于肯定的第二判定而从所述数据储存器取回所述批注的映射组件。
11.一种包括计算机程序代码的计算机程序,所述计算机程序代码在加载至计算机系统中且执行时执行如权利要求1至9中的任一权利要求的方法的所有步骤。
CN2010800534329A 2009-12-03 2010-11-09 用于取回视图中的数据项批注的方法 Pending CN102648466A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09177866 2009-12-03
EP09177866.2 2009-12-03
PCT/EP2010/067127 WO2011067080A1 (en) 2009-12-03 2010-11-09 A method for retrieving a data item annotation in a view

Publications (1)

Publication Number Publication Date
CN102648466A true CN102648466A (zh) 2012-08-22

Family

ID=43460520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800534329A Pending CN102648466A (zh) 2009-12-03 2010-11-09 用于取回视图中的数据项批注的方法

Country Status (5)

Country Link
US (1) US20110137917A1 (zh)
JP (1) JP2013513144A (zh)
CN (1) CN102648466A (zh)
TW (1) TW201142631A (zh)
WO (1) WO2011067080A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241235A (zh) * 2019-07-01 2021-01-19 珠海金山办公软件有限公司 一种电子表格批注方法、显示方法和对应装置

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2716436A1 (en) 2010-03-01 2011-09-01 Dundas Data Visualization, Inc. Systems and methods for generating data visualization dashboards
CA2754520A1 (en) 2010-10-07 2012-04-07 Dundas Data Visualization, Inc. Systems and methods for dashboard image generation
US20120180108A1 (en) 2011-01-06 2012-07-12 Dundas Data Visualization, Inc. Methods and systems for providing a discussion thread to key performance indicator information
US9632994B2 (en) * 2011-03-11 2017-04-25 Microsoft Technology Licensing, Llc Graphical user interface that supports document annotation
US9020969B2 (en) * 2011-07-13 2015-04-28 Sap Se Tracking queries and retrieved results
US9122665B2 (en) 2011-10-10 2015-09-01 Microsoft Technology Licensing, Llc Rich formatting for a data label associated with a data point
US20130110862A1 (en) * 2011-10-27 2013-05-02 Qiming Chen Maintaining a buffer state in a database query engine
US9449059B2 (en) 2011-11-08 2016-09-20 International Business Machines Corporation Report data justifiers
US9652506B2 (en) 2011-12-16 2017-05-16 Microsoft Technology Licensing, Llc Providing data experience(s) via disparate semantic annotations based on a respective user scenario
US9164990B2 (en) * 2011-12-20 2015-10-20 Sap Portals Israel Ltd Annotating contextual workspaces
US9990398B2 (en) 2013-09-20 2018-06-05 Oracle International Corporation Inferring dimensional metadata from content of a query
US9740718B2 (en) 2013-09-20 2017-08-22 Oracle International Corporation Aggregating dimensional data using dense containers
US9836519B2 (en) 2013-09-20 2017-12-05 Oracle International Corporation Densely grouping dimensional data
US20150088919A1 (en) * 2013-09-20 2015-03-26 Oracle International Corporation Transforming a query to reuse stored data
US10162855B2 (en) 2014-06-09 2018-12-25 Dundas Data Visualization, Inc. Systems and methods for optimizing data analysis
US10642831B2 (en) 2015-10-23 2020-05-05 Oracle International Corporation Static data caching for queries with a clause that requires multiple iterations to execute
US10678792B2 (en) 2015-10-23 2020-06-09 Oracle International Corporation Parallel execution of queries with a recursive clause
US10783142B2 (en) 2015-10-23 2020-09-22 Oracle International Corporation Efficient data retrieval in staged use of in-memory cursor duration temporary tables
US10628456B2 (en) * 2015-10-30 2020-04-21 Hartford Fire Insurance Company Universal analytical data mart and data structure for same
US10558659B2 (en) 2016-09-16 2020-02-11 Oracle International Corporation Techniques for dictionary based join and aggregation
US11086876B2 (en) 2017-09-29 2021-08-10 Oracle International Corporation Storing derived summaries on persistent memory of a storage device
US11775552B2 (en) * 2017-12-29 2023-10-03 Apptio, Inc. Binding annotations to data objects
US11222018B2 (en) 2019-09-09 2022-01-11 Oracle International Corporation Cache conscious techniques for generation of quasi-dense grouping codes of compressed columnar data in relational database systems
CN111191009B (zh) * 2019-12-31 2022-10-25 西安近代化学研究所 一种情报分析成果管理与应用系统
CN116501719B (zh) * 2023-06-21 2023-09-12 北京长河数智科技有限责任公司 基于可视化视图实现的数据建模系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050065958A1 (en) * 2003-09-19 2005-03-24 International Business Machines Corporation Expanding the scope of an annotation to an entity level
US20050091253A1 (en) * 2003-10-22 2005-04-28 International Business Machines Corporation Attaching and displaying annotations to changing data views
CN1841421A (zh) * 2004-11-08 2006-10-04 国际商业机器公司 多用户、多时间协作批注的方法和系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07244658A (ja) * 1994-03-04 1995-09-19 Hitachi Ltd 表処理装置のコメント情報付加方法
JP2002073636A (ja) * 2000-08-28 2002-03-12 Casio Comput Co Ltd データ出力装置、及び記憶媒体
CN100367275C (zh) * 2003-04-18 2008-02-06 国际商业机器公司 用于在数据表中创建递归可缩放模板实例的装置和方法
US20040261016A1 (en) * 2003-06-20 2004-12-23 Miavia, Inc. System and method for associating structured and manually selected annotations with electronic document contents
US8321470B2 (en) * 2003-06-20 2012-11-27 International Business Machines Corporation Heterogeneous multi-level extendable indexing for general purpose annotation systems
US7693860B2 (en) * 2005-03-18 2010-04-06 Microsoft Corporation Method and system to associate cell and item metadata
US20100278453A1 (en) * 2006-09-15 2010-11-04 King Martin T Capture and display of annotations in paper and electronic documents
US7809748B2 (en) * 2007-02-23 2010-10-05 Microsoft Corporation Extended cell information in multidimensional data models
US8375291B2 (en) * 2008-11-07 2013-02-12 Web Filings, Inc. Method and system for generating and utilizing persistent electronic tick marks
US8301631B2 (en) * 2009-05-30 2012-10-30 Edmond Kwok-Keung Chow Methods and systems for annotation of digital information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050065958A1 (en) * 2003-09-19 2005-03-24 International Business Machines Corporation Expanding the scope of an annotation to an entity level
US20050091253A1 (en) * 2003-10-22 2005-04-28 International Business Machines Corporation Attaching and displaying annotations to changing data views
CN1841421A (zh) * 2004-11-08 2006-10-04 国际商业机器公司 多用户、多时间协作批注的方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241235A (zh) * 2019-07-01 2021-01-19 珠海金山办公软件有限公司 一种电子表格批注方法、显示方法和对应装置
CN112241235B (zh) * 2019-07-01 2022-08-09 珠海金山办公软件有限公司 一种电子表格批注方法、显示方法和对应装置

Also Published As

Publication number Publication date
TW201142631A (en) 2011-12-01
JP2013513144A (ja) 2013-04-18
WO2011067080A1 (en) 2011-06-09
US20110137917A1 (en) 2011-06-09

Similar Documents

Publication Publication Date Title
CN102648466A (zh) 用于取回视图中的数据项批注的方法
KR101793222B1 (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
JP5721818B2 (ja) 検索におけるモデル情報群の使用
Singh et al. Orion 2.0: native support for uncertain data
US8756567B2 (en) Profile based version comparison
CN107844565B (zh) 商品搜索方法和装置
US8838597B1 (en) Semantic metadata extraction
Etcheverry et al. Enhancing OLAP analysis with web cubes
Yeganeh et al. A framework for data quality aware query systems
JP2013502653A5 (zh)
KR101505858B1 (ko) 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템
CN106164889A (zh) 用于内存数据库搜索的系统和方法
CN103262076A (zh) 分析数据处理
CN102541975A (zh) 诸如利益和提供者合同之类的对象结构的分析
CN110543477B (zh) 一种标签构建系统及方法
US20170300531A1 (en) Tag based searching in data analytics
US20150302090A1 (en) Method and System for the Structural Analysis of Websites
CN111198852A (zh) 微服务架构下知识图谱驱动的元数据关系推理方法
CN110569367A (zh) 一种基于知识图谱的空间关键字查询方法、装置及设备
Hassanzadeh et al. Helix: Online enterprise data analytics
JP6375029B2 (ja) レポートの重要度を分析するメタデータ基盤のオンライン分析処理システム
Jannach et al. Automated ontology instantiation from tabular web sources—the AllRight system
KR20140026796A (ko) 맞춤형 특허분석 서비스 시스템 및 그 방법
US10255246B1 (en) Systems and methods for providing a searchable concept network
Suciu et al. Cloud computing for extracting price knowledge from big data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120822