CN114787795A - 链接数据集 - Google Patents

链接数据集 Download PDF

Info

Publication number
CN114787795A
CN114787795A CN202080085029.8A CN202080085029A CN114787795A CN 114787795 A CN114787795 A CN 114787795A CN 202080085029 A CN202080085029 A CN 202080085029A CN 114787795 A CN114787795 A CN 114787795A
Authority
CN
China
Prior art keywords
column
data set
data
selection
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080085029.8A
Other languages
English (en)
Inventor
詹森·D·弗朗茨
罗伯特·C·伍伦
马西莫·D·西波尔迪
马克斯·H·塞登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sigma Computer Co ltd
Original Assignee
Sigma Computer Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sigma Computer Co ltd filed Critical Sigma Computer Co ltd
Publication of CN114787795A publication Critical patent/CN114787795A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

链接数据集,其包括接收对与第二数据集的第二列相关的第一数据集的第一列的选择;响应于所述选择,基于所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系生成查询;以及根据对所述查询的响应呈现第三数据集。

Description

链接数据集
技术领域
本发明的领域是数据处理,或者更具体地说,是用于链接数据集的方法、装置和产品。
背景技术
现代企业可以在基于云的数据仓库内的远程数据库中存储大量数据。可以使用数据库查询语言,例如结构化查询语言(SQL)来访问该数据。但是,某些查询响应可能包含太多数据而不能在Web应用程序中有效呈现。
发明内容
在本说明书中公开了用于链接数据集的方法、系统和装置。链接数据集可以包括接收对与第二数据集的第二列相关的第一数据集的第一列的选择;响应于该选择,基于第一数据集的第一列和第二数据集的第二列之间的关系生成查询;并且基于对查询的响应呈现第三数据集。
本发明的上述和其它目的、特征和优点将从下面对本发明的示例性实施方案的更具体描述中变得显而易见,如附图中所示,其中相同的附图标记通常表示本发明的示例性实施方案的相同部分。
附图说明
图1示出了根据本发明的实施方案的示例性系统的框图,该示例性系统被配置成用于链接数据集。
图2示出了根据本发明的实施方案的示例性系统的框图,该示例性系统被配置成用于链接数据集。
图3示出了根据本发明的实施方案的示例性图形用户界面的图,该示例性图形用户界面被配置成用于链接数据集。
图4示出了根据本发明的实施方案的示例性图形用户界面的图,该示例性图形用户界面被配置成用于链接数据集。
图5示出了根据本发明的实施方案的示例性图形用户界面的图,该示例性图形用户界面被配置成用于链接数据集。
图6示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法。
图7示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法。
图8示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法。
图9示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法。
具体实施方式
参考附图,从图1开始,描述了根据本发明的用于链接数据集的示例性方法、装置和产品。图1示出了根据本发明的实施方案的自动计算机器的框图,该自动计算机器包括被配置成用于链接数据集的示例性数据访问计算系统(152)。图1的数据访问计算系统(152)包括至少一个计算机处理器(156)或“CPU”,以及通过高速存储器总线(166)和总线适配器(158)连接到处理器(156)和数据访问计算系统(152)的其它部件的随机存取存储器(168)(“RAM”)。
存储在RAM(168)中的是操作系统(154)。根据本发明的实施方案的被配置成用于链接数据集的计算机中有用的操作系统包括UNIXTM、LinuxTM、Microsoft WindowsTM、AIXTM、IBM的i OSTM以及本领域技术人员会想到的其它操作系统。图1的实施例中的操作系统(154)在RAM(168)中示出,但是这种软件的许多组件通常也存储在非易失性存储器中,例如,存储在数据存储器(170)上,例如磁盘驱动器上。链接模块(126)也被存储在RAM中,根据本发明的实施方案,该链接模块(126)是用于链接数据集的模块。
图1的数据访问计算系统(152)包括通过扩展总线(160)和总线适配器(158)耦合到处理器(156)和数据访问计算系统(152)的其它部件的盘驱动器适配器(172)。盘驱动器适配器(172)以数据存储器(170)的形式将非易失性数据存储器连接到数据访问计算系统(152)。根据本发明的实施方案,可用于被配置成用于链接数据集的计算机中的盘驱动器适配器包括集成驱动器电子设备(“IDE”)适配器,小型计算机系统接口(‘SCSI’)适配器,以及本领域技术人员将想到的其它适配器。如本领域技术人员所想到的,非易失性计算机存储器也可以实现为光盘驱动器、电可擦除可编程只读存储器(所谓的“EEPROM”;或“闪存”存储器)、RAM驱动器等。
图1的示例性数据访问计算系统(152)包括一个或多个输入/输出(‘I/O’)适配器(178)。I/O适配器通过例如软件驱动器和计算机硬件实现面向用户的输入/输出,用于控制对诸如计算机显示屏之类的显示设备的输出,以及来自诸如键盘和鼠标之类的用户输入设备(181)的用户输入。图1的示例性数据访问计算系统(152)包括视频适配器(209),该视频适配器是专门设计用于图形输出到诸如显示屏或计算机监视器之类的显示设备(180)的I/O适配器的示例。视频适配器(209)通过高速视频总线(164)、总线适配器(158)和也是高速总线的前侧总线(162)连接到处理器(156)。
图1的示例性数据访问计算系统(152)包括用于与其它计算机进行数据通信以及用于与数据通信网络进行数据通信的通信适配器(167)。这样的数据通信可以通过RS-232连接,通过诸如通用串行总线(“USB”)之类的外部总线,通过诸如IP数据通信网络之类的数据通信网络,以及以本领域技术人员想到的其它方式串行地执行。通信适配器实现数据通信的硬件级别,一台计算机通过该硬件级别直接或通过数据通信网络发送数据通信至另一台计算机。根据本发明的实施方案的被配置成用于链接数据集的计算机中有用的通信适配器的示例包括:用于有线拨号通信的调制解调器、用于有线数据通信的以太网(IEEE802.3)适配器、以及用于无线数据通信的802.11适配器。
通信适配器(167)通信地耦合到广域网(190),广域网(190)还包括基于云的数据仓库(192)和客户端计算系统(194)。基于云的数据仓库(192)是托管用于通过广域网(190)访问的数据库的计算系统或计算系统组。客户端计算系统(194)是通过数据访问计算系统(152)访问数据库的计算系统。
图2示出了根据本发明的实施方案的用于链接数据集的系统的示例性框图。如图2所示,该系统包括数据访问计算系统(152)、基于云的数据仓库(192)和客户端计算系统(196)。数据访问计算系统(152)包括链接模块(126)。基于云的数据仓库(192)包括数据库(206)。客户端计算系统(196)包括客户端应用程序(202)。
数据库(206)是存储在基于云的数据仓库(192)和数据的管理系统中的数据的集合。管理系统可以接收诸如结构查询语言(SQL)查询之类的数据库查询,并用数据集响应查询。链接模块(196)是硬件、软件或硬件和软件的集合,其被配置为管理数据集之间的关系(例如,“链接”)并便于用户浏览或导航链接的数据集。数据集可以包括表格(例如,数据库(206)中的表格、由数据访问计算系统(152)生成的数据的电子表格表示或视图,或其他数据集。
第一数据集可以通过第一数据集的第一列和第二数据集的第二列之间的关系与第二数据集相关。第一数据集的第一列可以用作第二数据集的第二列的外部关键字。第二数据集的第二列可以作为第二数据集的主关键字。例如,假设第一表“案件”在每一行存储律师事务所的特定案件。每一行都可以使用“案件编号”列作为其主关键字。“案件”表还可以包括指示管理该案件的律师事务所的合伙人的“合伙人”列。“合伙人”列可以与第二表“用户”相关,该表在每一行存储系统的每个用户的记录。因此,“案件”表的“合伙人”列可以与“用户”表的“用户ID”或其他主关键字列相关。
第一数据集的多个列可以与第二数据集的同一列相关。继续上面的示例,假设“案件”表还包括一个“指派”列,其指示负责完成特定案件的律师或雇员。“指派”列也可以与“用户”表相关。因此,“案件”表的“合伙人”列和“指派”列都可以与“用户”表的“用户ID”或其他主关键字列相关。
第一数据集的多个列也可以各自与不同的数据集相关。仍然继续上面的示例,假设“案件”表包括“客户”列,其指示提交特定案件的客户。“客户”列可能与“客户”表相关,该表在每一行列出特定客户以及他们的联系信息等。因此,“案件”表包括分别与“用户”表和“客户”表相关的不同列。
浏览或导航第一数据集的用户可能还希望探索第二相关数据集中的数据。例如,使用电子表格视图或其他演示文稿(presentation)浏览“案件”表的用户可能希望在每一行查看“用户”表中每个案件的指派律师的相关信息,例如他们的全名或工作头衔。通常,为了让用户查看这些信息,用户需要生成一个数据库查询(例如,一个连接(JOIN)操作)以将“案件”表与“用户”表连接起来,这对于不熟悉数据库查询的用户来说可能是困难的。替代地,呈现“案件”表可能会导致所有相关表被连接和呈现,这将导致计算负担和网络流量增加,以及可能向用户呈现不需要的信息。
为了解决这些缺点,链接模块(126)可以接收对与第二数据集的第二列相关的第一数据集的第一列的选择。例如,第一数据集(例如,电子表格)的呈现可以包括用于第一数据集中与另一数据集的另一列相关的每一列的可选择元素。这样的可选择元素可以包括按钮、链接(例如,作为列名的链接)或其他元素。用户(例如,通过客户端应用程序(202))对第一列的可选择元素的选择可以使链接模块(126)接收该选择。
可选择元素可以应用于对应于第一列的另一列或可以与该另一列相关联。例如,假设“案件”表包括存储合伙人的用户ID的“合伙人ID”列和存储合伙人的首字母的“合伙人首字母”列两者。“合伙人ID”列可以与“用户”表的“用户ID”字段相关。也就是说,“合伙人ID”充当“用户”的“用户ID”主关键字的外部关键字。在呈现“案件”表时,“合伙人ID”字段可以被隐藏,因为“合伙人ID”可以只包含对用户或查看者无用的唯一标识符。取而代之的是,“合伙人首字母”列可以与可选择元素一起显示。选择“合伙人首字母”列的可选择元素用于选择关联的和隐藏的“合伙人ID”列作为第一列。
响应于该选择,链接模块(126)可以基于第一数据集的第一列和第二数据集的第二列之间的关系生成查询。例如,可以访问指示该关系的数据,该数据可以指示第一数据集的第一列和第二数据集的第二列。链接模块(126)然后可以在第一列和第二列上生成第一数据集和第二数据集的连接查询(例如,其中第一数据集的第一列的值等于第二数据集的第二列的值)。指示该关系的数据还可以指示要与第一数据集连接的第二数据集的列的子集。继续关于“案件”表的“指派”列与“用户”表的“用户ID”列相关的示例,指示该关系的数据可以指示只有来自“用户”表的“名字”和“头衔”列在与第一数据集连接时被选择。查询还可以包括先前应用于第一数据集的呈现的过滤器的附加选择(例如,值约束、选定的列等)。
然后,链接模块(126)基于对查询的响应呈现第三数据集。因此,第三数据集包括第一数据集和来自在线呈现的第二数据集的相关信息。第三数据集可以包括对查询的响应的电子表格呈现。第三数据集可以基于根据一个或多个过滤器、搜索标准、访问许可等对查询的响应的子集。使用这种方法,仅生成和提交用于选择和连接相关数据集信息的数据库查询以响应用户选择来探索相关信息。
链接模块(126)可以从数据访问计算系统(152)或者基于云的数据仓库(192)的管理员或其他用户接收第一数据集的第一列和第二数据集的第二列之间的关系的指示。该关系的指示可以识别第一列和第二列。该关系的指示还可以指示将被包括在与第一数据集的连接(JOIN)中的第二数据集的一个或多个列。如果第一数据集的第一列被隐藏或未被选择用于呈现,则该关系的指示还可以指示关联列,使得对关联列的选择用于选择第一列。例如,在第一列存储唯一标识符(例如,数字标识符)的情况下,关联列可以包括人类可读的值或提供更多信息的文本字符串。该关系的指示可以存储在与第一数据集和/或第二数据集相关联的元数据中。
链接模块(126)可以(例如,响应于呈现第一数据集的请求)访问指示与第一数据集相关联的一个或多个关系的数据。链接模块(126)然后可以从数据中识别第一数据集的第一列和第二数据集的第二列之间的关系,并且基于所识别的关系在第一数据集的呈现中包括可选择元素(例如,按钮,与第一列关联的链接)。该过程可以在呈现第三数据集(例如,与第二数据集的一个或多个列连接的第一数据集)时执行。例如,链接模块(1236)可以访问指示与第二数据集相关联(例如,与第二数据集的一个或多个列相关联,所述第二数据集与第一数据集连接)的一个或多个关系的数据。然后,第三数据集的呈现可以基于识别的关系包括与来自第二数据集的一个或多个连接列相关联的可选择元素。因此,当相关信息的附加列被连接时,用户可以访问附加的相关数据集。
图3示出了根据本发明的实施方案的用于链接数据集的示例性用户界面。显示的是图形用户界面(GUI)(302)。GUI(302)是向用户呈现数据集和图形元素并从用户接收用户输入的用户界面。GUI(302)可以部分地由链接模块(126)呈现并显示在客户端计算系统(194)上(例如,在系统显示器或移动触摸屏上)。GUI(302)可以由托管在数据访问计算系统(152)上的因特网应用程序编码以供客户端计算系统(194)的客户端应用程序(202)呈现。
GUI(302)部分地向用户呈现工作表。工作表是来自数据库(306)的数据集的呈现。引用工作表是从另一工作表(称为数据源工作表)链接的工作表。引用工作表继承在数据源工作表中呈现的数据集(即未从呈现中排除的数据)。引用工作表还可以继承应用于其他数据的公式的结果,而不是公式本身。引用工作表可能限于在数据源工作表中呈现或以其他方式提供的数据集(除非生成引用工作表的用户有权访问数据库中的排除数据)。引用工作表可以从任意数量的数据源(包括多个数据源工作表)链接。
示例性GUI(302)包括电子表格结构(304)和列表结构(306)。电子表格结构(304)包括具有六列(A列(308A)、B列(308B)、C列(308C)、D列(308D)、E列(308E)、F列(308F))的数据集(显示为空行)。
电子表格结构(304)是数据集的图形元素和组织机制。电子表格结构(304)将数据集中的数据显示为按列(列A(308A)、列B(308B)、列C(308C)、列D(308D)、列E(308E)、F列(308F))组织的数据行。这些列描述了数据集的每一行中数据的不同类别。这些列也可以是使用数据集中其他列的计算。
列表结构(306)是用于定义和组织数据集的列(列A(308A)、列B(308B)、列C(308C)、列D(308D)、列E(308E)、F列(308F))之间的层级关系的图形元素。术语“层级关系”是指列的下级和上级分组。例如,数据库可能包括地址簿的行,以及州、县、城市和街道的列。来自数据库的数据集可以首先按州分组,然后按县分组,然后按城市分组。因此,州列将在层级关系中处于最高级别,县列将在层级关系中处于第二级别,而城市列将在层级关系中处于最低级别。
列表结构(306)向用户呈现维度层级。具体地,列表结构(306)呈现跨至少一个维度分层排列的级别。列表结构(306)内的每一级别是列(列A(308A)、列B(308B)、列C(308C)、列D(308D)、列E(308E)、列F(308F))之间的层级关系内的位置。列表结构(306)内的关键字标识作为层级关系中的参与者的一列或多列。每个级别可以有多于一个的关键字。
列表结构(306)中的级别之一可以是基本级别。针对基本级别选择的列以最精细的粒度提供数据。列表结构(306)中的级别之一可以是总级别或根级别。针对总级别选择的列提供最高粒度级别的数据。例如,总级别可以包括字段,该字段计算整个数据集的单个列内的每一行的总和(即,未被任何其他列划分)
GUI(302)可以使用户能够将列(列A(308A)、列B(308B)、列C(308C)、列D(308D)、列E(308E)、F列(308F))拖放到列表结构(306)中。列表结构(306)的顺序可以指定列相对于彼此的层级结构。用户可以随时拖放列表结构(306)中的列以重新定义列之间的层级关系。使用选择作为列表结构(306)中的关键字的列定义的层级关系可以在图表中使用,以便向下钻取(例如,在条上双击)使得新的图表能够基于层次结构中较低的级别来生成。
图4示出了根据本发明的实施方案的用于链接数据集的示例性用户界面。显示的是图形用户界面(GUI)(302)。GUI(302)可以部分地由链接模块(126)呈现并显示在客户端计算系统(194)上(例如,在系统显示器或移动触摸屏上)。GUI(302)可以由托管在数据访问计算系统(152)上的因特网应用程序编码以供客户端计算系统(194)的客户端应用程序(202)呈现。
在该示例中,假设用于跟踪法律案件的第一数据集。第一数据集包括“案件”表。每条记录(例如,行)对应于特定的案例或案件。因此,每一行可以包括用于案件编号的“案件”列、表示管理特定案件的律师事务所的合伙人的“合伙人”以及表示被指派该案件的律师或其他雇员的“指派”列。该数据集反映在工作表的电子表格结构(304)中。
图4的示例性用户界面还包括可选择元素402a和402b,其分别对应于“指派”和“合伙人”列。“指派”和“合伙人”列都与“用户”表的“用户ID”列相关。可选择元素(402a)的选择指示来自“用户”表的与“指派”列相关的信息应该显示在GUI(302)中。换言之,可选择元素(402a)的选择导致基于在“案件”表的“指派”列和“用户”表的“用户ID”列上的“案件”表和“用户”表的连接生成查询。可选择元素(402b)的选择指示来自“用户”表的与“合伙人”列相关的信息应该显示在GUI(302)中。换言之,可选择元素(402b)的选择导致基于在“案件”表的“合伙人”列和“用户”表的“用户ID”列上的“案件”表和“用户”表的连接生成查询。
图5示出了根据本发明的实施方案的用于链接数据集的示例性用户界面。图5与图4的不同之处在于,图5还包括“指派头衔”和“指派名字”列。假设选择了图4的可选择元素(402a),导致对在“案件”表的“指派”列和“用户”表的“用户ID”列上的“案件”表和“用户”表执行连接。选择“用户”表的“头衔”和“名字”列以包含在结果数据集中。因此,图5的GUI(302)包括基于第一数据集和第二数据集的第三数据集的电子表格结构(304)。
为了进一步解释,图6示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法,该方法包括(例如,通过链接模块(126))接收(602)对与第二数据集的第二列相关的第一数据集的第一列的选择(603)。例如,第一数据集(例如,电子表格)的呈现可以包括用于第一数据集中与另一数据集的另一列相关的每一列的可选择元素。这样的可选择元素可以包括按钮、链接(例如,作为列名字的链接)或其他元素。用户(例如,通过客户端应用程序(202))对第一列的可选择元素的选择可以使链接模块(126)接收该选择。可以相对于在第一数据集的呈现中显示的第一列进行该选择,或者如果第一列被隐藏或未被选择以包含在呈现中,则相对于与第一列相关的列进行该选择。
图6的方法还包括,响应于选择(603),(例如,通过链接模块(126))基于第一数据集的第一列和第二数据集的第二列之间的关系生成(604)查询(606)。查询(606)可以包括对第一列和第二列的第一数据集和第二数据集的连接查询(例如,其中第一数据集的第一列的值等于第二数据集的第二列的值)。查询(606)还可以包括对要与第一数据集连接的第二数据集的列的子集的选择(例如,选择命令)。查询(606)还可以包括对先前应用于第一数据集的呈现的过滤器的附加选择(例如,值的约束、选择的列等)。查询(606)可以(例如,通过链接模块(126))被提交到数据库(206)。
图6的方法还包括基于对查询(606)的响应(610)(例如,通过链接模块(126))呈现(608)第三数据集。因此,第三数据集包括第一数据集和来自第二数据集的在线呈现的相关信息(例如,在相同的电子表格结构(304)或相同的GUI(302)中)。第三数据集可以基于根据一个或多个过滤器、搜索标准、访问许可等对查询(606)的响应的子集。
为了进一步解释,图7示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法,该方法包括(例如,通过链接模块(126))接收(602)对与第二数据集的第二列相关的第一数据集的第一列的选择(603);响应于选择(603),(例如,通过链接模块(126))基于第一数据集的第一列和第二数据集的第二列之间的关系生成(604)查询(606);以及基于对查询(606)的响应(610)(例如,通过链接模块(126))呈现(608)第三数据集。
图7的方法与图6的不同之处在于图7的方法包括(例如,通过链接模块(126))接收(702)第一数据集的第一列和第二个数据集的第二列之间的关系的指示(704)。可以从数据访问计算系统(152)或基于云的数据仓库(192)的管理员或其他用户接收指示(704)。该关系的指示(704)可以识别第一列和第二列。该关系的指示(704)还可以指示第二数据集的一个或多个列被包括在与第一数据集的连接中。如果第一数据集的第一列被隐藏或未被选择用于呈现,则该关系的指示(704)还可以指示关联列,使得关联列的选择用于选择第一列。例如,在第一列存储唯一标识符(例如,数字标识符)的情况下,关联列可以包括人类可读的值或提供更多信息的文本字符串。该关系的指示(704)可以存储在与第一数据集和/或第二数据集相关联的元数据中。
为了进一步解释,图8示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法,该方法包括(例如,通过链接模块(126))接收(602)与第二数据集的第二列相关的第一数据集的第一列的选择(603);响应于选择(603),(例如,通过链接模块(126))基于第一数据集的第一列和第二数据集的第二列之间的关系生成(604)查询(606);以及基于对查询(606)的响应(610)(例如,通过链接模块(126))呈现(608)第三数据集。
图8的方法与图6的不同之处在于图8的方法包括访问(802)指示与第一数据集相关联的一个或多个关系的数据。该数据可以包括指示与第一数据集相关联的一个或多个关系的元数据。该数据可以基于先前接收到的与第一数据集相关联的关系的指示。可以响应于呈现或请求呈现第一数据集或第一数据集的一部分来访问数据。
图8的方法与图6的不同之处还在于,图8的方法还包括(例如,通过链接模块(126))从数据中识别(804)第一数据集的第一列和第二数据集的第二列之间的关系。图8的方法与图6的不同之处还在于,图8的方法还包括基于所识别的关系在第一数据集的呈现中(例如,通过链接模块(126))包括(806)可选择元素。可选择元素可以包括按钮、链接或可以理解的其他用户界面元素。可选择元素可以应用于对应于第一列的另一列或与该另一列相关联。例如,假设“案件”表包括存储合伙人的用户ID的“合伙人ID”列和存储合伙人的首字母的“合伙人首字母”列两者。“合伙人ID”列可以与“用户”表的“用户ID”字段相关。也就是说,“合伙人ID”充当“用户”的“用户ID”主关键字的外部关键字。在呈现“案件”表时,“合伙人ID”字段可能会被隐藏,因为“合伙人ID”可能只包含对用户或查看者无用的唯一标识符。取而代之的是,“合伙人首字母”列可以与可选择元素一起显示。选择“合伙人首字母”列的可选择元素用于选择关联的和隐藏的“合伙人ID”列作为第一列。图8的方法与图6的不同之处还在于(例如,通过链接模块(126))接收(602)对与第二数据集的第二列相关的第一数据集的第一列的选择(603)包括(例如,通过链接模块(126))接收(808)对可选择元素的选择。
为了进一步解释,图9示出了流程图,其说明了根据本发明的实施方案的用于链接数据集的示例性方法,该方法包括(例如,通过链接模块(126))接收(602)与第二数据集的第二列相关的第一数据集的第一列的选择(603);响应于选择(603),(例如,通过链接模块(126))基于第一数据集的第一列和第二数据集的第二列之间的关系生成(604)查询(606);以及基于对查询(606)的响应(610)(例如,通过链接模块(126))呈现(608)第三数据集。
图9的方法与图6的不同之处在于图9的方法包括接收(902)与第四数据集的第四列相关的第三数据集的第三列的另一选择(903)。第三数据集的第三列可以对应于包括在第三数据集中的第一数据集的列,或者与第一数据集连接以生成第三数据集的第二数据集的列。图9的方法与图6的不同之处在于,图9的方法还包括响应于另一选择(903),基于第三数据集的第三列和第四个数据集的第四列之间的关系生成(904)另一查询(906)。另一查询(906)可以包括第三列和第四列上的第三数据集和第四数据集的连接。可以将另一查询(906)提交给数据库(206)。
图9的方法与图6的不同之处在于图9的方法包括基于对另一查询(906)的响应(910)来呈现(908)第五数据集。因此,第五数据集包括来自第一和第二数据集(反映在第三数据集)和第四数据集的数据。
鉴于以上阐述的解释,读者将认识到根据本发明的实施方案链接数据集的有益效果包括:
·通过允许运行时间查询生成和数据集呈现以响应于查看相关信息的请求来改进计算系统的操作。
·通过提供用户友好的方法来探索跨不同数据集相关的数据,改进计算系统的操作。
本发明的示例性实施方案主要在用于链接和编写工作表的全功能计算机系统的情况下描述。然而,本领域的技术人员将认识到,本发明也可以体现在设置在计算机可读存储介质上的计算机程序产品中,以与任何合适的数据处理系统一起使用。这样的计算机可读存储介质可以是用于机器可读信息的任何存储介质,包括磁性介质、光学介质或其它合适的介质。这样的介质的示例包括硬盘驱动器中的磁盘或软盘,用于光驱的光盘,磁带,以及本领域技术人员所想到的其它介质。本领域技术人员将立即认识到,具有适当编程装置的任何计算机系统将能够执行体现在计算机程序产品中的本发明的方法的步骤。本领域的技术人员还将认识到,尽管本说明书中描述的一些示例性实施方案是针对在计算机硬件上安装和执行的软件,然而,实现为固件或硬件的替代的实施方案也完全在本发明的范围之内。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有用于使处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质(或媒介)。
计算机可读存储介质可以是有形设备,其可以保留和存储由指令执行设备使用的指令。所述计算机可读存储介质可以是,例如,但不限于,电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、或前述设备的任何适当组合。计算机可读存储介质的更具体示例的非穷举列表包括以下项:便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字通用盘(DVD),存储棒、软盘、例如在其上记录有指令的打孔卡或凹槽中的凸起结构之类的机械编码设备、以及上述的任何适当组合。如本文所使用的,计算机可读存储介质,不应被解释为本身是瞬时信号,例如无线电波或其它自由传播的电磁波,通过波导或其它传输介质传播的电磁波(例如,通过光纤电缆的光脉冲),或通过导线传输的电信号。
这里描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备,或者经由网络(例如因特网、局域网、广域网和/或无线网络)下载到外部计算机或外部存储设备。该网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本发明操作的计算机可读程序指令可以是汇编器指令,指令集体系结构(ISA)指令,机器指令,机器相关指令,微码,固件指令,状态设置数据,或者用一种或多种编程语言(包括面向对象的编程语言,例如Smalltalk,C++等)和常规过程编程语言(例如,“C”编程语言或类似编程语言)的任意组合来编写的源代码或目标代码。计算机可读程序指令可以完全在用户的计算机上执行,作为独立的软件包,部分在用户的计算机上执行,部分在用户的计算机上且部分在远程计算机上执行,或全部在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户的计算机,或者可以进行到外部计算机的连接(例如,通过使用互联网服务提供商的互联网)。在一些实施方案中,包括(例如)可编程逻辑电路,现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)在内的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令,以使电子电路个性化,从而执行本发明的各个方面。
参考根据本发明的实施方案的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本发明的各方面。应当理解,流程图图示和/或框图的每个框,以及流程图图示和/或框图中的框的组合,可以通过计算机可读程序指令来实现。
这些计算机可读程序指令可以被提供给通用计算机的处理器,专用计算机或其它可编程数据处理装置,以产生机器,使得经由计算机的处理器或其它可编程数据处理装置执行的指令创建用于实现流程图和/或框图的一个或多个框中指定的功能/动作的装置。这些计算机可读程序指令也可以被存储在能够引导计算机、可编程数据处理设备和/或以特定方式工作的其它设备的计算机可读存储介质中,使得其中存储有指令的计算机可读存储介质包括制造的产品,该制造的产品包括实现流程图和/或框图的一个或多个框中指定的功能/动作的方面的指令。
计算机可读程序指令也可以加载到计算机,其它可编程数据处理装置,或使一系列操作步骤在计算机上执行的其它设备,用于产生计算机实现的过程的其它可编程设备或其它装置上,使得在计算机、其它可编程装置或其它设备上执行的指令实现流程图和/或框图的一或多个框中指定的功能/动作。
图中的流程图和框图示出了根据本发明的各种的实施方案的系统、方法和计算机程序产品的可能实现方式的体系结构、功能和操作。在这点上,流程图或框图中的每个框可以表示指令的模块、段或部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。在一些替代的实现方式中,框中指出的功能可以不按照图中指出的顺序发生。例如,实际上根据所涉及的功能,连续示出的两个框可以基本上同时执行,或者这些框有时可以以相反的顺序执行。还将注意到,框图和/或流程图图示的每个框,以及框图和/或流程图图示中的框的组合,可以由执行指定功能或动作或者执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。
从前面的描述中应当理解,在不偏离本发明的真实精神的情况下,可以在本发明的各种实施方案中进行修改和改变。本说明书中的描述仅是为了说明的目的,而不应被解释为限制性的。本发明的范围仅由所附权利要求的语言限定。

Claims (20)

1.一种链接数据集的方法,该方法包括:
接收对与第二数据集的第二列相关的第一数据集的第一列的选择;
响应于所述选择,基于所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系生成查询;以及
根据对所述查询的响应呈现第三数据集。
2.根据权利要求1所述的方法,其中,所述查询包括所述第一列上的所述第一数据集与所述第二列上的所述第二数据集的连接。
3.根据权利要求1所述的方法,其还包括接收所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系的指示。
4.根据权利要求1所述的方法,其还包括:
访问指示与所述第一数据集相关联的一个或多个关系的数据;
从所述数据中识别所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的所述关系;以及
基于所识别的所述关系,在所述第一数据集的呈现中包括可选择元素。
5.根据权利要求4所述的方法,其中,接收所述选择包括接收对所述可选择元素的选择。
6.根据权利要求5所述的方法,其中所述第一数据集的所述第一列包括与所述第二数据集的所述第二列相关联的外部关键字,并且其中所述第二数据集的所述第二列包括所述第二数据集的主关键字。
7.根据权利要求1所述的方法,其还包括:
接收对与第四数据集的第四列相关的所述第三数据集的第三列的另一选择;
响应于所述另一选择,基于所述第三数据集的所述第三列和所述第四数据集的所述第四列之间的关系生成另一查询;以及
基于对所述另一查询的响应呈现第五数据集。
8.一种用于链接数据集的装置,所述装置包括计算机处理器,计算机存储器能操作地耦合到所述计算机处理器,所述计算机存储器在其中设置有计算机程序指令,所述计算机程序指令当由该计算机处理器执行时使所述装置执行以下步骤:
接收对与第二数据集的第二列相关的第一数据集的第一列的选择;
响应于所述选择,基于所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系生成查询;以及
根据对所述查询的响应呈现第三数据集。
9.根据权利要求8所述的装置,其中,所述查询包括所述第一列上的所述第一数据集与所述第二列上的所述第二数据集的连接。
10.根据权利要求8所述的装置,其中,所述步骤还包括接收所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系的指示。
11.根据权利要求8所述的装置,其中,所述步骤还包括:
访问指示与所述第一数据集相关联的一个或多个关系的数据;
从所述数据中识别所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的所述关系;以及
基于所识别的所述关系,在所述第一数据集的呈现中包括可选择元素。
12.根据权利要求11所述的装置,其中,接收所述选择包括接收对所述可选择元素的选择。
13.根据权利要求12所述的装置,其中,所述第一数据集的所述第一列包括与所述第二数据集的所述第二列相关联的外部关键字,并且其中所述第二数据集的所述第二列包括所述第二数据集的主关键字。
14.根据权利要求8所述的装置,其中,所述步骤还包括:
接收对与第四数据集的第四列相关的所述第三数据集的第三列的另一选择;
响应于所述另一选择,基于所述第三数据集的所述第三列和所述第四数据集的所述第四列之间的关系生成另一查询;以及
基于对所述另一查询的响应呈现第五数据集。
15.一种用于链接和编写工作表的计算机程序产品,所述计算机程序产品设置在计算机可读介质上,所述计算机程序产品包括计算机程序指令,所述计算机程序指令在执行时使计算机执行以下步骤:
接收对与第二数据集的第二列相关的第一数据集的第一列的选择;
响应于所述选择,基于所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系生成查询;以及
根据对所述查询的响应呈现第三数据集。
16.根据权利要求15所述的计算机程序产品,其中,所述查询包括所述第一列上的所述第一数据集与所述第二列上的所述第二数据集的连接。
17.根据权利要求15所述的计算机程序产品,其中,所述步骤还包括接收所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的关系的指示。
18.根据权利要求15所述的计算机程序产品,其中,所述步骤还包括:
访问指示与所述第一数据集相关联的一个或多个关系的数据;
从所述数据中识别所述第一数据集的所述第一列和所述第二数据集的所述第二列之间的所述关系;以及
基于所识别的所述关系,在所述第一数据集的呈现中包括可选择元素。
19.根据权利要求18所述的计算机程序产品,其中,接收所述选择包括接收对所述可选择元素的选择。
20.根据权利要求19所述的计算机程序产品,其中,所述第一数据集的所述第一列包括与所述第二数据集的所述第二列相关联的外部关键字,并且其中所述第二数据集的所述第二列包括所述第二数据集的主关键字。
CN202080085029.8A 2019-10-09 2020-10-08 链接数据集 Pending CN114787795A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962912878P 2019-10-09 2019-10-09
US62/912,878 2019-10-09
PCT/US2020/054833 WO2021072114A1 (en) 2019-10-09 2020-10-08 Linking data sets

Publications (1)

Publication Number Publication Date
CN114787795A true CN114787795A (zh) 2022-07-22

Family

ID=73020322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080085029.8A Pending CN114787795A (zh) 2019-10-09 2020-10-08 链接数据集

Country Status (4)

Country Link
US (1) US11989183B2 (zh)
EP (1) EP4035026A1 (zh)
CN (1) CN114787795A (zh)
WO (1) WO2021072114A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112860812B (zh) * 2021-02-09 2023-07-11 北京百度网讯科技有限公司 在大数据中无侵入确定数据字段级关联关系的方法和装置
US20230060702A1 (en) * 2021-08-30 2023-03-02 International Business Machines Corporation Large object data type support for column-based database system

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8234293B2 (en) 2005-09-08 2012-07-31 Microsoft Corporation Autocompleting with queries to a database
KR100969656B1 (ko) * 2009-10-30 2010-07-14 (주)비아이매트릭스 엑셀기반 분석보고서 작성 시스템 및 방법
US9773003B2 (en) * 2014-12-09 2017-09-26 Xurmo Technologies Pvt. Ltd. Computer implemented system and method for investigative data analytics
US10235468B2 (en) 2015-12-30 2019-03-19 Business Objects Software Limited Indirect filtering in blended data operations
EP3611630A1 (en) * 2018-08-17 2020-02-19 Ontoforce NV Automated extract, transform, and load process

Also Published As

Publication number Publication date
US20210109933A1 (en) 2021-04-15
US11989183B2 (en) 2024-05-21
EP4035026A1 (en) 2022-08-03
WO2021072114A1 (en) 2021-04-15

Similar Documents

Publication Publication Date Title
CN113228002B (zh) 使用图形用户界面内的维度层次结构生成数据库查询
CN115280300A (zh) 从基于云的数据仓库高速缓存加载仪表板
CN113646754A (zh) 跨组织工作表共享
CN114787795A (zh) 链接数据集
EP4323889A1 (en) Data visualization with derived dimensional hierarchy
US11281672B2 (en) Join key propagation
US20210256001A1 (en) Creating accessible model data sets
CN115315694A (zh) 使用过滤查询从基于云的数据仓库高速缓存加载仪表板
US11886456B2 (en) Creating a model data set using a spreadsheet interface
US12118005B2 (en) Maintaining cardinality of rows while joining worksheets from a database
US11561967B2 (en) Exposing parameters in referencing worksheets
US11360981B2 (en) Servicing database requests using canonicalized tables
CN113906409A (zh) 行级工作表安全
US20200302115A1 (en) Linking and composing worksheets
US11494400B2 (en) Servicing database requests using subsets of canonicalized tables
US11954087B2 (en) Servicing database requests using derivations of canonicalized tables
US12061601B2 (en) Tracking errors in data set lineage
US20230334237A1 (en) Workbook template sharing
CN114651245A (zh) 提供对基于云的数据仓库上的使用报告的访问

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination