CN105117396A - 协同操作数据的方法和系统 - Google Patents

协同操作数据的方法和系统 Download PDF

Info

Publication number
CN105117396A
CN105117396A CN201510240464.4A CN201510240464A CN105117396A CN 105117396 A CN105117396 A CN 105117396A CN 201510240464 A CN201510240464 A CN 201510240464A CN 105117396 A CN105117396 A CN 105117396A
Authority
CN
China
Prior art keywords
data
user
logic
database
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510240464.4A
Other languages
English (en)
Other versions
CN105117396B (zh
Inventor
G·埃尔瓦斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Factual Inc
Original Assignee
Factual Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Factual Inc filed Critical Factual Inc
Publication of CN105117396A publication Critical patent/CN105117396A/zh
Application granted granted Critical
Publication of CN105117396B publication Critical patent/CN105117396B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/101Collaborative creation, e.g. joint development of products or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Abstract

公开了访问并提供从来源获取的信息的方法和系统。方法和系统允许访问在电子存储介质中存储的数据并提供源自从所述存储介质中存储的数据的第一信息集。方法和系统还提供包括所述汇总数据下层的细节数据的第二信息集。

Description

协同操作数据的方法和系统
分案申请
本申请是申请号为201080041039.8、申请日为2010年9月15日并且发明名称为“协同操作数据的方法和系统”的专利申请的分案申请。
技术领域
本申请总体涉及数据库系统领域。具体而言,本申请涉及协同操作数据的方法和系统。
背景技术
网络上数据库驱动应用经组织以便使得用户经过网络请求并接收在数据库中存储的信息。一般通过应用服务器向客户应用(例如,浏览器)提供信息。然而,这些应用底层的数据库并不保证每个数据单元底层的细节数据的可用性,该数据单元提供特定值如何派生的完整历史。此外,当前数据库并不具有本能以处理信息的不可靠性或不确定性。这些数据库不能考量信息来源和声誉的多样性。因此,需要一种数据库方案,托管在由应用直接使用的信息底层的原始数据,并通过将每个单元底层的数据集合具体化为概述的、易于使用的数据点来管理其中的复杂性。此外,还需要使得用户浏览并访问涉及该信息可靠性的信息并提供其他知识以对其改进。
发明内容
公开的方法和系统部分地基于允许由用户浏览数据并协同操作数据库。所述方法和系统允许用户浏览数据单元集合、探索在给定数据单元底层的所有可用细节数据提交,并为随后处理提供要使用的新的输入知识。例如,用户可以浏览所谓事实:某人出生于某个日期。用户可以容易地浏览该信息的属性,例如,围绕该概述值是否形成一致。关于围绕具体事实的一致程度的信息可以向用户提供动机以给出关于真实值的意见。用户然后可选地访问并浏览关于同意或不同意给定信息的来源或用户的底层细节信息。该细节信息可以根据提供的引用、用户声誉或计算方法参考提供参考用于说明事实。由用户提交的任何新信息和给定单元的历史数据提交一起处理以便计算新汇总的数据点以及相关属性,诸如新的共识等级。公开的方法和系统允许比现有技术系统向用户提供更多信息并向用户提供更大机会以操作或评论在一个或多个数据库中找到的数据。可以由其他用户浏览操作的数据和相关信息,提供协同维持数据库,自动披露最准确信息以及其中存储信息的属性。在某些其他实施例中,响应来自用户的请求访问电子存储介质中存储的数据。在其他实施例中,响应来自用户的输入进行访问并提供信息的方法。
在某些方面,提供用于访问并提供从来源获取的信息的方法。该方法包括:访问在电子存储介质中存储的数据。该方法还包括:响应输入,提供第一信息集,所述第一信息集源自在所述存储介质中存储的数据并包括汇总数据和所述汇总数据的属性。此外,该方法包括:响应输入,提供第二信息集,所述第二信息集包括所述汇总数据下层的细节数据。在特定实施例中,使用位于服务器上存储的存储器的计算机可执行编码执行方法。
在某些实施例中,细节数据包括相关元数据。在其他实施例中,数据被存储在电子数据库中。在另一些实施例中,所述第一信息集经传送用于显示在显示设备上。在另一些实施例中,所述第二信息集经传送用于显示在显示设备上。
在特定实施例中,所述属性包括所述汇总数据的可靠性或准确性。在另一些特定实施例中,属性包括关于汇总数据的共识或争议的程度。本文公开的方法的某些实施例还包括:在所述电子存储介质中接收包括细节数据的其他数据并在所述第二信息集以及所述第一信息集的随后计算中包括所述其他数据。
在某些实施例中,所述电子介质中存储的所述数据被组织为一个或多个数据单元,以及第一信息集源自根据每个单元内存储的细节数据而在每个单元中汇总的数据。在其他实施例中,单元包括表示其他单元的属性的数据。在某些其他实施例中,一个或多个单元被组织为元组或行。在特定实施例中,一个或多个单元表示所述元组或行的主键,以及其他单元表示所述主键的属性。在某些实施例中,行进一步经组织为2-维关系数据库表格结构。
另一些实施例包括:将数据提交接收到所述存储介质中,向所述第二信息集添加所述提交,以及响应所述数据提交再次汇总所述第一信息集。
在某些实施例中,主键是系统产生代理或身份关键词。在更多实施例中,主键被自动计算为确保唯一性所需的列的集合。
在某些实施例中,单元中包含的所述数据类型包括:字符串、整数、小数、浮点、日期、时间、二进制或布尔。在其他实施例中,所述数据类型包括:阵列、联阵、哈希表、树或诸如json或XML的数据交换格式。
在另一些实施例中,所述汇总数据的属性包括涉及特定值正确的可能性的信心、共识或确定性等级。在特定实施例中,使用颜色或图标指示所述汇总数据的所述信心、共识或确定性。在更多的特定实施例中,所述汇总数据的所述属性基于包括模式、均值、中值、标准偏差、差异或最近数据提交的底层细节数据的函数。在另一些特定实施例中,所述汇总数据的所述属性包括关于所述单元的意见分布的表示。
在某些实施例中,汇总数据包括用户提交的表示以及汇总数据和用户提交之间的一致性。在其他实施例中,聚合算法使用标准、规则、逻辑和数据确定所汇总的数据。在另外其他实施例中,标准包括和用户提交相关的任何元数据。在其他实施例中,元数据包括用户对所提交数据值准确性的信心。
在更多实施例中,元数据包括来源可信度等级。在其他更多实施例中,元数据包括和所述单元交互的用户的可信度或声誉的等级。在特定实施例中,元数据包括用户提交数据的提交的日期和时间。
在某些实施例中,基于缺少独立性的指示对用户提交去权。在其他实施例中,对从来自单个用户的提交执行去权,并且向更新提交给予更多权重。在另外其他实施例中,对提交去权是基于未经验证的引用。
在某些实施例中,声誉算法确定所述用户的声誉或可信度,所述声誉算法基于包括用户声誉等级、位置文件信息、数据提交历史、预测能力、社交联系以及IP地址的标准。在更多实施例中,使用文件夹或分组视图浏览所述底层细节数据。在更多实施例中,使用原始细节数据视图浏览所述底层细节数据。
在某些实施例中,所述文件夹视图显示如下中的一个或多个:用户提交范围、提交数量以及和每个值正确可能性相关的信心、共识或确定性等级。
在特定实施例中,所述原始细节数据视图包括每个来源的其他元数据和对每个用户提交的评论。在更多特定实施例中,所述原始细节数据视图由用户或时间周期分组数据。
在其他实施例中,在细节数据视图内通过同意或不同意历史数据提交而完成所述数据提交。在另一些其他实施例中,用户提交其他元数据字段。在另一些实施例中,元数据包括表示用户对给定数据提交的信心的信心等级,表示用户对数据正确可能性的信念。在更多实施例中,元数据包括所述来源或引用。在其他实施例中,元数据包括评论。
在另一些更多实施例中,所述提交是被动的并且本质上是非主动提交新数据的交互。在更多实施例中,所述交互是当用户浏览数据,所述用户并不纠正或修改所述数据,以及所述系统确定所述用户同意所述数据比不同意所述数据具有更高可能性。在其他实施例中,所述用户提交经过API调用。
在另外方面,公开一种协同数据采集系统。该系统包括:输入逻辑,用于方法用户提供的命令,以检索、观看、操作和/或浏览在数据库中存储的数据,所述数据库包括包含数据的一个或多个单元,所述数据包括汇总数据、元数据、细节数据和所述数据的所计算属性。该系统包括:访问逻辑,响应输入用于访问并检索在所述数据库中一个或多个单元中存储的数据,以及显示逻辑,用于向用户提供从一个或多个数据库检索的数据,所述显示模块进一步经配置以显示所述数据的一个或多个属性。该系统进一步包括:汇总逻辑,用于分析每个单元内的底层细节数据点集合并产生汇总数据。在某些实施例中,所有的逻辑都包括可执行编码,所述可执行编码被存储在一个或多个存储设备上。
在某些方面,系统进一步包括:数据库逻辑,用于存储一个或多个数据库以及数据。
在特定实施例中,单元包括表示其他单元的属性的数据。在更多特定实施例中,一个或多个单元被组织为元组或行。在更多特定实施例中,一个或多个单元表示所述元组或行的主键,以及其他单元表示所述主键的属性。在甚至更多具体实施例中,行进一步经组织为2-维关系数据库表格结构。
在某些实施例中,缺省主键是系统产生代理或身份关键词。在其他某些实施例中,主键被自动计算为确保唯一性所需的列的集合。
在某些实施例中,单元中包含的所述数据类型包括:字符串、整数、小数、浮点、日期、时间、二进制或布尔。在某些其他实施例中,数据类型包括:阵列、联阵、哈希表、树或诸如json或XML的数据交换格式。
在特定实施例中,所述汇总数据的属性包括涉及特定值正确的可能性的信心、共识或确定性等级。在更多特定实施例中,用颜色或图标指示所述汇总数据的所述信心。在其他更多特定实施例中,所述汇总数据的所述属性基于包括模式、均值、中值、标准偏差、差异或最近数据提交的底层细节数据的函数。在甚至更多特定实施例中,所述汇总数据的所述属性包括关于所述单元的意见分布的表示。
在某些实施例中,汇总数据包括用户提交的表示以及汇总数据和用户提交之间的一致性。在其他实施例中,所述聚合算法使用标准、规则、逻辑和数据确定所汇总的数据。
在某些实施例中,标准包括和用户提交相关的任何元数据。在更多实施例中,元数据包括用户对所提交数据值准确性的信心。在甚至更多实施例中,元数据包括来源或引用的可信度等级。在其他更多实施例中,元数据包括和所述单元交互的用户的可信度或声誉的等级。
在某些实施例中,元数据包括用户提交数据的提交的日期和时间。某些实施例包括的系统进一步包括逻辑,用于基于缺少独立性的指示对用户提交去权。其他实施例包括的系统进一步包括逻辑,用于对来自单个用户的现有提交去权,并且向更新提交给予更多权重。另外实施例包括的系统进一步包括逻辑,用于基于未经验证的引用对提交去权。
在某些实施例中,声誉算法确定所述用户的声誉或可信度,所述声誉算法基于包括用户声誉等级、配置文件信息、数据提交历史、预测能力、社交联系以及IP地址的标准。在其他实施例中,使用文件夹浏览所述底层细节数据。在另外其他实施例中,使用原始细节数据视图浏览所述底层细节数据。在更多实施例中,所述文件夹视图显示如下中的一个或多个:用户提交范围、提交数量以及和每个值正确可能性相关的信心、共识或确定性等级。
在某些实施例中,所述原始细节数据视图包括每个来源的其他元数据和对每个用户提交的评论。在更多实施例中,所述原始细节数据视图由数据值提交、用户、引用或提交时间分组数据。在其他更多实施例中,所述输入逻辑接收数据提交,所述数据提交在细节数据视图内通过同意或不同意历史数据提交而完成。
在其他实施例中,逻辑允许所述用户提交其他元数据字段。在另一些实施例中,元数据包括表示数据准确估计可能性的信心等级。本文公开的系统实施例包括元数据,该元数据包括关于所述来源或引用的数据。
在某些实施例中,元数据包括评论。在某些其他实施例中,所述交互是当用户浏览数据,所述用户并不纠正或修改所述数据,以及所述系统确定所述用户同意所述数据比不同意所述数据具有更高可能性。
本文公开的系统的实施例包括情况:其中所述提交是被动的并且本质上是非主动提交新数据的交互。该系统的某些实施例进一步包括逻辑,根据浏览但不纠正数据的用户,计算用户同意所述数据的可能性。在特定实施例中,所述用户提交经过API调用。
附图说明
当结合附图阅读时,公开的方法和系统的以上和其他目的,以及其各种特征将更加充分地理解,其中。
图1是用于显示并浏览来自集体数据库的数据的系统示意表示。
图2是表示当用户访问数据库中的数据时提供的汇总数据和细节数据的视图的形象化表示。
图3是表示数据浏览和数据操作的示意表示。
图4是当用户访问数据库中的数据时提供的汇总数据的视图的形象化表示。
具体实施方式
在此参考的专利和科学文献构建了本领域普通技术人员可用的知识。本文引用的发布专利、公开的申请、公开的外国申请和参考都通过引用合并在此,如同每个都具体地单独地被指出通过引用合并在此。
将参考附图更全面地描述当前方法和系统,其中表示本发明的优选实施例。然而,本文公开的方法和系统也可以体现于不同形式并应理解为不受限于本文提出的实施例。
在本发明说明书中所使用的术语仅仅用于描述特定实施例,而不打算限制本发明。如在本发明说明书和附加的权利要求中所用的,单数形式“一个”、“这个”和“该”旨在同样包括复数形式,除非上下文另有明确表示。需要进一步理解:术语“包含”或“包含”当用于本说明书时指定声称特征、整型、步骤、操作、元素和/或部件的出现,而不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。
本文公开的当前方法和系统旨在于使得用户浏览概括化数据视图,以利用给定值底层的所有可用数据,并提交用于后续方法新知识。在一方面,公开了一种数据浏览和协同操作的方法。数据包括汇总数据、元数据或细节数据。该方法进一步需要显示汇总数据的第一概述视图,该肆意视图向用户提供汇总数据以及关于所显示的汇总数据的属性的信息。在某些实施例中,方法允许检索并显示元数据或和汇总数据相关的底层细节数据,以及通过在数据库中存储新数据为一个或多个单元中的底层细节数据使得用户操作数据用于随后汇总,由数据库的相同或其他用户执行检索和浏览。
此外,本文公开的系统的方面包括一种用于协同数据采集的系统。该系统包括:输入逻辑,用于方法用户提供的命令,以检索、观看、操作和/或浏览在数据库中存储的数据。所述数据库一般包括包含数据的一个或多个单元,所述数据包括汇总数据、元数据和细节数据。该系统还包括:访问逻辑,响应输入用于检索在所述数据库中一个或多个单元中存储的数据,以及显示逻辑,用于显示一个或多个数据库检索的数据。所述显示逻辑进一步经配置以显示所述数据的一个或多个属性。在某些实施例中,该系统包括数据库逻辑,用于存储数据的任何提交或操作;以及汇总逻辑,用于计算汇总数据点以及给出原始底层细节数据点的相关属性。系统还包括逻辑,该逻辑都包括可执行编码,所述可执行编码被存储在一个或多个存储设备上。
如本文所用,术语“数据”指的是表示值或者值的集合的定性或定量特征的任何信息或信息单元。数据可以是以诸如字符串、整数、小数、浮点、日期、时间、二进制或布尔的格式存储或使用的单独信息片段。在某些情况下,数据可以组织成更复杂的结构,诸如阵列、联阵、哈希表、树或数据交换格式(诸如JXML或JSON)。元数据通常意味着与数据有关的数据。通常,元数据是涉及数据的其他位并描述其他数据或提供有关其他数据信息的数据。如本文所用,“细节数据”指的是提供论证并用做为每个单独单元计算汇总数据的基础的底层原始数据。此外,术语“汇总数据”指的是根据每个单元底层的原始细节数据集合的计算产生的单元内的汇总数据点集合。在特定实施例中,术语“汇总数据”作为“细节数据”的环境下的标签,“细节数据”被用于算法地确定汇总数据。如下详细表示从细节数据计算汇总数据的方法。
如本文所用,术语“单元”是指信息单元的位置。此外,“数据库”指的是系统中存储的信息或数据的集合。常规地根据数据库模型组织数据库。例如,常见的数据库模型包括基于行、基于列、层次、关系、面向对象和网络模型。这些模型需要数据关系的清楚表示。
图1是示出本文公开的特定实施例的示意图。图1显示协同数据采集系统,包括从用户110接收输入的输入逻辑100。输入逻辑100方法由用户提供的命令以检索、浏览和/或操纵由数据库逻辑125存储在一个或多个数据库中的数据。输入逻辑100使得用户与访问逻辑105和显示逻辑115交互。注意:用户可以从允许无线或有线访问网络或互联网的许多设备访问系统。例如,用户设备可以是电脑、手机或手持式计算机设备,诸如PDA。
输入的逻辑100允许用户与访问逻辑105交互。访问逻辑105响应输入。用户110向输入逻辑100提供命令用于检索在数据库140中一个或多个单元130中存储的汇总数据。访问逻辑105经过检索用户所请求数据的数据库逻辑125请求数据。用户110也可以向输入逻辑100提供指令以便利用显示逻辑115显示从数据库140中获取的数据。显示逻辑115向用户提供已经检索的数据,借此允许用户浏览数据和数据的属性。如本文所用,术语“属性”是指数据质量,诸如涉及数据的共识水平、不确定性、可靠性、正确性和/或信心。例如,可以通过比较“同意”特定事实(例如,值)的数据点数量与“不同意”特定事实(例如,值)的数据点数量而简单测量数据的信心和/或可靠性。
参考图1及图2中的示例,用户访问表155,表155涉及多个人的出生日期。表格具有字段〈名字〉以及字段〈生日〉。对于〈jon〉,〈生日〉的值是“3/6/70”。和现有数据库技术相关的几个缺点之一在于用户不能确定特定事实或数据块(“汇总数据”)的可靠性。尽管该汇总数据是基于表示涉及特定信息块的知识提交的数据库更新,通常数据库平台不能提供历史“痕迹”来解释为什么显示这个信息。例如,什么方法或用户集合输入数据最终导致了当前可用数据,并基于什么来源、参考、方法、算法、动机或指示?同样,一般情况下,平台不能有效的向新用户保证谁不同意该信息,除非数据库管理员专门提供该特权。
在这个示例中,用户可以向下挖掘并发现随着参考引用,汇总生日数据是基于两个用户引用“3/6/70”以及第三个用户引用“6/3/70”。该信息表示汇总数据点底层的“细节数据”。在这个示例中,用户是错的并错误地输入数据。使用根据常用输入的真实值的非常简单的预测模型,“3/6/70”更有可能是正确的。然而,新的用户可以选择去做独立研究并发现:事实上,输入“3/6/70”的两个用户引述了列出的“1970年6月3日”为生日的来源。新用户现在可以提交新知识和引用预测:围绕“6/3/70”的准确汇总数据值将达成共识。
在这个非限制示例中,表格用颜色编码用于表示和该具体事实是否有不确定性。Jon的出生日期是黄色的,表示存在和该值相关的极强不确定性或不一致。当然,其他颜色、图标或视觉表现也可以表示不确定性。
回到图1,在看汇总数据时,用户110向输入逻辑100输入请求细节数据的命令。访问逻辑105请求涉及琼恩的出生日期的所有可用细节数据,并以及该请求被转送到数据库逻辑125。如本文所用,术语“细节数据”指的是涉及特定数据单元用户提交的事实、值或数据。显示逻辑115向用户显示细节数据。这里,用户浏览所有历史数据提交,包括其他用户的录入。用户110可以提交新的数据值并通过访问逻辑105输入命令,所述访问逻辑105向数据库逻辑135发送请求以在数据库140中存储新的提交。数据库逻辑125也激活汇总逻辑135,该汇总逻辑135计算有关Jon的生日的新汇总值和属性,然后也由数据库逻辑125存储。显示逻辑115显示有关Jon的生日的新的汇总值并表示涉及Jon生日的该值具有更高的一致性或确定性。
在某些实施例中,在用户显示器上如折叠视图浏览数据。如本文所用,术语“折叠视图”指的是所有底层细节数据提交由特定字段分组的视图。作为示例,或许有10个底层数据提交,但对单独值折叠的详细视图将只显示2个记录,因为唯一的单独值是“3/6/70”和“6/3/70”。在某些实施例中,折叠视图显示单独用户提交的数据值、提交数量、和描述每个单独数据值的预测准确性的信心、共识、或可靠性等级。可以对用户隐藏该视图或根据用户请求显示。
在某些实施例中,“汇总数据视图”显示根据底层“细节数据”计算的值,其中该值在底层细节数据中是最具有代表性的(例如,获得最多提交)。在其他实施例中,“汇总数据视图”是最近收到或最近由用户提交的值。但是在其他实施例中,其他因素或权重也用于确定汇总值,诸如提供数据的每个用户的声誉。
本发明实施例构建在包括可执行编码的逻辑上。可执行编码可存储在一个或多个存储设备上。因此,逻辑并不必须位于特定设备上。此外,逻辑可以使位于本文所述系统中一个或多个设备上的多个可执行编码。例如,响应输入用于访问并检索在数据库中一个或多个单元中存储的数据的访问逻辑可以是在应用服务器上的一个可执行编码。在可替换实施例中,该访问逻辑出现在一个或多个应用服务器上。在另外其他实施例中,该访问逻辑出现在系统中的一个或多个应用服务器以及其他设备上,包括但不限于,“网关”汇总数据服务器和后端数据服务器。本文公开的其他逻辑也可以是位于协同数据系统内的一个或多个设备上的一个或多个可执行编码。
在某些实施例中,公开的系统包括一个或多个应用服务器,以及一个或多个汇总数据服务器,以及一个或多个后端数据服务器。服务器包括存储器以保存本文公开的逻辑。在特定实施例中,一个或多个应用服务器存储执行本文公开的任务所需的逻辑。在其他实施例中,汇总服务器存储执行本文公开的任务所需的逻辑。在其他实施例中,后端服务器存储执行本文公开的任务所需的逻辑。
在某些实施例中,客户端网络浏览器进行请求一个或更多应用服务器。可替换地,所公开的系统包括客户端浏览器所述的一个或多个汇总或后端数据服务器。
在示例性实施例中,一个或多个应用服务器从客户端网络浏览器接收对具体数据或表格的请求。对于这些请求,一个或多个应用服务器调用一个或多个数据库服务器用于从单元或表格请求汇总或细节数据。当进行请求以提交新的数据输入时,一个或多个应用服务器也调用一个或多个数据库服务器。一个或多个应用服务器从一个或多个汇总服务器接收数据,以及一个或多个应用服务器生成HTML和JavaScript对象以返回到客户端网络浏览器。可替换地,一个或多个应用服务器生成XML或JSON以经过API传递对象。
在当前实施例,数据库服务器基于包含一群汇总数据服务器和一群后端数据服务器的架构。然而要注意:系统可能包括单个汇总服务器和后端数据服务器。在该实施例中,汇总数据服务器阵列用于从后端数据服务器请求汇总数据和该汇总数据点的属性(信心、计数等)。汇总服务器阵列也缓存该汇总数据和汇总属性以便更快更快地访问该汇总数据,而不需要另外请求后端数据服务器。
本系统和过程依赖于存储在存储设备中的可执行编码(即逻辑)。存储能存储逻辑的许多设备在本领域中是公知的。存储设备包括存储介质,诸如电脑硬盘、冗余磁盘阵列(“RAID”)、随机存取记忆体(RAM)和光学磁盘驱动器。通用存储器设备的示例是本领域公知的(例如,描述了常规半导体存储设备的美国专利No.7,552,368,并通过引用合并在此)。
本文还公开了用于数据浏览和操作的方法,和现有技术协同特征相比,其有利地提供高级数据浏览和操作。公开的方法不同于用于在数据库驱动的应用中共享和编辑数据的现有的协同特征,因为这些现有的协同特征被设计在应用中或客户应用中。在这样的特点中,数据库层仅仅负责存储和调用记录。例如,常规数据库中的功能仅仅是插入、删除、更新和选择(恢复)。对于主键由单独值定义的特定行,关系数据库中的“单元”在特定表格内给定字段中存储单个值。作为一个示例,员工表可以具有字段′电话号码′,使用主键,名字=′约翰·多伊′的特定记录,我们可得到电话号码=′310-555-1212′。
现有技术数据库也包括关于值′310-555-1212′的其他信息。如果数据库具有交易日志,则其可能具有关于谁插入或更新该单元的历史记录。但是,在今天的系统中,交易日志不代表实时可用/可操作的知识。相反,它可用于其他的系统级功能,诸如复制、备份和恢复、分布式提交、事务退回等。因此,应用开发者实际上并不能直接访问历史数据。面对这种限制,应用开发者可设计具体的数据库用于记录电话号码的历史提交。定制数据库可以用来储存名字、有效日期和电话号码以及包括用户、日期、时间、方法、引用、评论和其他有关信息的元数据。但是,即使在这种情况下,该功能不是针对数据库本身的核心。由于本文提供的新颖特征,当前方法和系统允许人们操纵底层数据。与现有技术相反,当前系统和方法也允许数据库在单个单元中为任何特定值储存多个条目(而非单个条目)。
本文公开的方法包括:访问在数据库的一个或多个单元中存储的数据,该数据包括汇总数据、元数据或细节数据。显示汇总数据的第一视图,该第一视图向用户提供信息。在某些实施例中,信息包括汇总数据值以及显示的汇总数据或底层细节数据的属性。该方法进一步需要检索并显示和汇总数据相关的底层细节数据。该方法进一步还使得用户通过在数据库中存储新数据为一个或多个单元中的底层细节数据,用于以后由数据库的相同或其他用户的汇总、检索、浏览。参见图3,表示数据浏览和操作的示例性方法。
如下是数据浏览和数据协同操作的示例性方法的描述。图3是表示在数据库中浏览并操作数据的流程图。用户210输入命令,该命令被送往输入逻辑200。输入逻辑200经过访问逻辑205访问数据库240。访问逻辑205经配置以经过数据库逻辑225访问数据,该访问逻辑225检索在数据库240的一个或多个单元中存储的数据。数据库240本身存储在存储设备中。数据库240中存储的数据可包括汇总数据、元数据或细节数据。访问逻辑205通过数据库逻辑225从数据库240检索由用户210查询的数据。一旦识别并检索所查询的数据,访问逻辑205经过显示逻辑215向用户210提供数据的一个或多个视图。用户210可以显示并浏览一个或多个第一视图250。如本文所述,一个或多个第一视图向用户210提供汇总数据以及所显示的汇总数据的属性。
在本示例中,用户210提交新数据。虽然新数据可能具有和现有汇总值相同的值,但其仍被认为是新的,因为它是使用单独元数据的新的数据提交。用户然后通过由输入逻辑200接收的命令在数据库中存储新提交的数据。输入逻辑200向访问逻辑205发送事务,访问逻辑205然后将事务转发给数据库逻辑225。数据库逻辑225在数据库240中在合适单元230中存储修改的数据。图3也表示其中用户210通过输入逻辑200命令访问逻辑205和数据库逻辑225以浏览和检索和汇总数据相关的元数据和/或细节数据。在这些情况下,检索的元数据和/或细节数据以与检索汇总数据相同的形式提供给用户210。如图2,本系统使得用户210操作数据库240中的数据并在数据库240的一个或多个单元中存储用户提交,用于由数据库的相同或其他用户以后的再汇总、检索和浏览。
本文公开的方法和系统的实施例允许用户以不同格式浏览数据。在某些实施例中,浏览图表或表格。该表格可包括分成行和列的单元。电子表格是该二维形式的示例,并在本领域是公知的。该表格的示例如图4所示。表格300被组织成涉及主题字段305的垂直列或每个记录的主键,以及涉及具体属性的垂直列或属性字段315,其中列中的每个单元包含寡欲主题355的事实310(即,值)。每个水平行325表示一个元组。在当前示例中,最左边的行涉及关于餐馆的信息。在列335,餐馆的“child-friendliness”显示汇总数据值,其根据用户的历史数据提交所计算。在该示例中,用户为Tanglewood餐厅提交的“child-friendliness”(儿童友好性)的知识是“否”。用户指示系统在数据库中存储该数据,以及系统重新计算对于特定餐厅的“child-friendliness”最可能正确回答的汇总数据。
本文公开的协同数据库能使得用户提交每个单元底层的新的数据点。一般来说,该数据是隐藏的直到用户请求潜在的细节数据用于浏览。可以浏览由所有用户提供的该原始底层细节数据(经常称为输入)。图4中,“输入”是“是”或“否”提交(即,输入)。当该数据被隐藏时,表格是颜色显示的以指示在数据库中存储的该属性显示的值的可靠性。颜色编码指示关于该属性的共识或确定性的量。例如,如果50%的值是“是”以及50%是“否”,具有较高水平的不一致,单元中显示的值具有较低的确定性。如果所有的输入是“否”,则颜色代码则指示对于数据可能是不确定的具有共识。彩色编码仅仅是将可靠性信息传递给用户的示例性方法。本领域普通技术人员将理解:图标、边缘阴影和其他类似强调可用于传达在图4中所示表格中呈现的值的确定性等级、统计意义、共识、信心、不一致或准确性。
如上所述,用户可以查看任何用户提交的所有原始底层细节数据。该信息为用户提供了理解从何处获取底层数据以及如何计算汇总数据提供了基础。当评定数据的可靠性、共识、不一致、准确性或信心时,汇总逻辑235考虑各种信息。例如,数据库具有逻辑,使得降低从看上去是垃圾虫(spammer)或其他预测不可靠的用户或组获取的“输入”的相关性或权重。因此,在当前示例中,用户(即,垃圾虫)在特定时间周期提供多个“是”输入,可能将表格中该值曲解为“是”并影响可靠性等级。另一方面,用户可以浏览该数据,并当考虑该值时考虑。另一方面,数据库将过滤或减少对该值的多个输入的影响以及图表中呈现的可靠性。其他垃圾检测技术在本领域是公知的。
在某些实施例中,汇总逻辑235包括逻辑,用于根据声誉算法加权或去权单个数据提交,该声誉算法确定用户的声誉或诚信。如上所述的该示例,声誉算法是根据包括用户等级、用户配置文件信息、历史数据提交、用户的历史预测能力、社会网络连接和IP地址。该逻辑与算法可用于改善在数据库中的汇总数据的准确性和可靠性。
在某些实施例中,汇总逻辑235也具有逻辑,用于根据缺乏独立性的指示对提交的值去权(de-weighting)。例如当提交都提供相同引用时,发现缺乏独立性。在这种情况下,所有相关提交都依赖于特定引用来源,因此多个用户提供的错误引用有效地放大该错误的影响。数据库逻辑225可以通过考虑底层数据提交的行数以改进其汇总的准确性。
在某些实施例中,汇总逻辑235包括逻辑,用于对从单个用户的之前提交去权,对更新提交给予更多权重。该逻辑减少单个用户曲解汇总逻辑的能力。
在其他实施例中,汇总逻辑235包括逻辑,用于对未经验证来源的提交去权。
也存在如下情况:当用户浏览数据或另外与系统交互时,却不提交数据。在这种情况下,即使没有主动提交数据,也可以“被动”地提交数据。在某些实施例中,系统包括逻辑,用于根据交互计算用户同意或不同意数据的可能性。在一个示例中,用户浏览数据点却不纠正,系统可以计算出,用户同意该数据的可能性比不同意的可能性稍高。汇总逻辑235可利用该其他数据以评价数据的正确性或可靠性。
目前方法和系统的实施例也设想数据库,其中数据库的单元被组织成数据的元组或行,这些元祖或行被组织为表格。在许多实施例中,表格中的一个或多个字段包括主键或主题。在许多实施例中,表格中的一个或多个字段表示提供关于每个记录或行的主键或主题的信息的属性。在某些实施例中,通过识别表格(诸如二维表)中为了确保主键唯一所需的列的最小数量确定(即,计算)主键。在某些实施例中,主键是系统产生的代理键。
本文公开的方法和系统的实施例还包括逻辑,用于使得用户提交和数据相关的元数据。例如,用户可以提交和提交数据值相关的引用、评论、或信心。在用户请求下,提交的元数据随后和提交数据值一起经过数据库逻辑存储为存储设备中的底层细节数据。
本文公开的系统还包括逻辑,用于识别和用户的应用程序接口。事实上,用户可以是任何实体、个人、接口、或可以借助诸如因特网、虚拟私人网络、局域网或网络访问数据库的组。当前系统可用于允许访问数据库的任何系统中。
等同形式
在附图和说明书中,公开了根据本发明的实施例,虽然使用了特定术语,但它们只用于通用的描述意义,而不是用于限制。至于本发明的范围,在如下权利要求中提出。此外,本文公开的附图不应被理解为限制本文提出的权利要求的范围,或将发明范围限制于附图中提出的结构,它们仅仅陈述本发明的示例性实施例。因此,本领域普通技术人员可以理解:在不背离随后权利要求定义的当前发明的精神和范围的情况下可以进行各种形式和细节的改变。

Claims (10)

1.一种访问并提供从来源获取的信息的方法,包括:
访问在电子存储介质中存储的数据;
响应输入,提供第一信息集,所述第一信息集源自在所述存储介质中存储的数据并包括汇总数据和所述汇总数据的属性;以及
响应输入,提供第二信息集,所述第二信息集包括所述汇总数据底层的细节数据。
2.如权利要求1所述的方法,其中所述细节数据包括相关元数据。
3.如权利要求1所述的方法,其中所述数据被存储在电子数据库中。
4.如权利要求1所述的方法,其中所述第一信息集经传送用于显示在显示设备上。
5.如权利要求1所述的方法,其中所述第二信息集经传送用于显示在显示设备上。
6.一种协同数据采集系统,包括:
输入逻辑,用于方法用户提供的命令,以检索、观看、操作和/或浏览在数据库中存储的数据,所述数据库包括包含数据的一个或多个单元,所述数据包括汇总数据、元数据、细节数据和所述数据的所计算属性;
访问逻辑,响应输入用于访问并检索在所述数据库中一个或多个单元中存储的数据;
显示逻辑,用于向用户提供从一个或多个数据库检索的数据,所述显示模块进一步经配置以显示所述数据的一个或多个属性;以及
汇总逻辑,用于分析每个单元内的底层细节数据点集合并产生汇总数据;
所有的逻辑都包括可执行编码,所述可执行编码被存储在一个或多个存储设备上。
7.如权利要求6所述的系统,进一步包括:数据库逻辑,用于存储一个或多个数据库以及数据。
8.如权利要求6所述的系统,其中单元包括表示其他单元的属性的数据。
9.如权利要求6所述的系统,其中一个或多个单元被组织为元组或行。
10.如权利要求9所述的系统,其中一个或多个单元表示所述元组或行的主键,以及其他单元表示所述主键的属性。
CN201510240464.4A 2009-09-15 2010-09-15 协同操作数据的方法和系统 Active CN105117396B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/559,702 US8959070B2 (en) 2009-09-15 2009-09-15 Processes and systems for collaborative manipulation of data
US12/559,702 2009-09-15
CN201080041039.8A CN102640144B (zh) 2009-09-15 2010-09-15 协同操作数据的方法和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201080041039.8A Division CN102640144B (zh) 2009-09-15 2010-09-15 协同操作数据的方法和系统

Publications (2)

Publication Number Publication Date
CN105117396A true CN105117396A (zh) 2015-12-02
CN105117396B CN105117396B (zh) 2021-11-05

Family

ID=43731505

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201080041039.8A Active CN102640144B (zh) 2009-09-15 2010-09-15 协同操作数据的方法和系统
CN201510240464.4A Active CN105117396B (zh) 2009-09-15 2010-09-15 协同操作数据的方法和系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201080041039.8A Active CN102640144B (zh) 2009-09-15 2010-09-15 协同操作数据的方法和系统

Country Status (5)

Country Link
US (3) US8959070B2 (zh)
EP (1) EP2478453A4 (zh)
CN (2) CN102640144B (zh)
HK (1) HK1174987A1 (zh)
WO (1) WO2011034921A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103644A (zh) * 2017-04-21 2017-08-29 腾讯科技(深圳)有限公司 一种虚拟场景中对象的控制方法和装置

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688796B1 (en) 2012-03-06 2014-04-01 Tal Lavian Rating system for determining whether to accept or reject objection raised by user in social network
US9563658B2 (en) * 2012-08-20 2017-02-07 Oracle International Corporation Hardware implementation of the aggregation/group by operation: hash-table method
CN103020262B (zh) * 2012-12-24 2017-04-19 Tcl集团股份有限公司 一种数据存储方法、系统及数据存储设备
CN105556545B (zh) 2013-03-15 2021-08-20 美国结构数据有限公司 用于众包领域特定情报的设备、系统和方法
US8812690B1 (en) * 2013-07-22 2014-08-19 Linkedin Corporation Method and system to provide reputation scores for a social network member
US10061835B2 (en) 2013-10-28 2018-08-28 Motorola Solutions, Inc. Establishing user-confidence levels of data inputs
US10878370B1 (en) * 2014-06-30 2020-12-29 EMC IP Holding Company LLC Conditional formating for display large scale information analytics of reliability data
US10007691B2 (en) * 2014-09-24 2018-06-26 Oracle International Corporation Prioritizing repopulation of in-memory compression units
US20170124043A1 (en) 2015-11-02 2017-05-04 Microsoft Technology Licensing, Llc Sound associated with cells in spreadsheets
US11023668B2 (en) 2015-11-02 2021-06-01 Microsoft Technology Licensing, Llc Enriched compound data objects
US10963635B2 (en) 2015-11-02 2021-03-30 Microsoft Technology Licensing, Llc Extensibility of compound data objects
US9990349B2 (en) 2015-11-02 2018-06-05 Microsoft Technology Licensing, Llc Streaming data associated with cells in spreadsheets
CN105549556B (zh) * 2015-12-17 2018-06-26 东北大学 一种用于工业过程实时监控的数据采集传输系统及方法
US11177937B1 (en) * 2018-03-08 2021-11-16 Anonyome Labs, Inc. Apparatus and method for establishing trust of anonymous identities
US11170002B2 (en) 2018-10-19 2021-11-09 Oracle International Corporation Integrating Kafka data-in-motion with data-at-rest tables
US10812326B1 (en) * 2019-08-01 2020-10-20 EMC IP Holding Company LLC Method and system for data fabric automated configuration for internet of things devices
US11102009B2 (en) 2019-08-01 2021-08-24 EMC IP Holding Company LLC Method and system transacting data using verifiable claims
US10977055B2 (en) 2019-08-01 2021-04-13 EMC IP Holding Company LLC Method and system creating and using sub-data confidence fabrics
US11294734B2 (en) 2019-08-01 2022-04-05 EMC IP Holding Company LLC Method and system optimizing the use of sub-data confidence fabrics
US11310272B2 (en) 2019-08-01 2022-04-19 EMC IP Holding Company LLC Method and system creating and using data confidence fabric processing paths
US11475073B2 (en) 2019-08-02 2022-10-18 EMC IP Holding Company LLC System and method for management of data from deployments
US11360703B2 (en) 2019-10-22 2022-06-14 EMC IP Holding Company LLC Method and system for a trusted actuation via data fabric metadata
US11388147B2 (en) 2020-01-31 2022-07-12 EMC IP Holding Company LLC System and method for redirecting data access to local trust managers via an indirection logic service

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1556482A (zh) * 2003-12-31 2004-12-22 中兴通讯股份有限公司 一种用于实现数据库多表查询的数据处理方法
US20050149259A1 (en) * 1997-10-16 2005-07-07 Kevin Cherveny System and method for updating, enhancing, or refining a geographic database using feedback
US20080270363A1 (en) * 2007-01-26 2008-10-30 Herbert Dennis Hunt Cluster processing of a core information matrix

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504890A (en) * 1994-03-17 1996-04-02 Sanford; Michael D. System for data sharing among independently-operating information-gathering entities with individualized conflict resolution rules
US5867799A (en) * 1996-04-04 1999-02-02 Lang; Andrew K. Information system and method for filtering a massive flow of information entities to meet user information classification needs
US6513041B2 (en) * 1998-07-08 2003-01-28 Required Technologies, Inc. Value-instance-connectivity computer-implemented database
US8161110B2 (en) * 2003-09-25 2012-04-17 Synthetron Nv Method and apparatus for scalable meetings in a discussion synthesis environment
US7877605B2 (en) * 2004-02-06 2011-01-25 Fujitsu Limited Opinion registering application for a universal pervasive transaction framework
EP2024862A4 (en) * 2006-05-02 2011-08-10 Invidi Tech Corp FUZZY-LOGIC-BASED ANSE-INDENTIFICATION FOR TARGETED VALUATION SYSTEM
WO2009137408A2 (en) * 2008-05-05 2009-11-12 Thomson Reuters Global Resources Systems and methods for integrating user-generated content with proprietary content in a database
US8548933B2 (en) * 2008-07-28 2013-10-01 Charles River Analytics, Inc. Objective decision making application using bias weighting factors

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050149259A1 (en) * 1997-10-16 2005-07-07 Kevin Cherveny System and method for updating, enhancing, or refining a geographic database using feedback
CN1556482A (zh) * 2003-12-31 2004-12-22 中兴通讯股份有限公司 一种用于实现数据库多表查询的数据处理方法
US20080270363A1 (en) * 2007-01-26 2008-10-30 Herbert Dennis Hunt Cluster processing of a core information matrix

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
(美)(M.J.科里)MICHAEL J.COREY: "《Oracle 8数据仓库分析、构建实用指南》", 31 January 2000, 机械工业出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107103644A (zh) * 2017-04-21 2017-08-29 腾讯科技(深圳)有限公司 一种虚拟场景中对象的控制方法和装置
CN107103644B (zh) * 2017-04-21 2019-03-08 腾讯科技(深圳)有限公司 一种虚拟场景中对象的控制方法和装置

Also Published As

Publication number Publication date
US20110066605A1 (en) 2011-03-17
US10678825B2 (en) 2020-06-09
EP2478453A1 (en) 2012-07-25
US20150161250A1 (en) 2015-06-11
CN105117396B (zh) 2021-11-05
EP2478453A4 (en) 2017-04-26
US20200401614A1 (en) 2020-12-24
WO2011034921A1 (en) 2011-03-24
HK1174987A1 (zh) 2013-06-21
US8959070B2 (en) 2015-02-17
CN102640144B (zh) 2015-06-10
CN102640144A (zh) 2012-08-15

Similar Documents

Publication Publication Date Title
CN102640144B (zh) 协同操作数据的方法和系统
US10545976B2 (en) Automated presentation of information using infographics
US11526579B1 (en) System and methods for performing automatic data aggregation
JP6420311B2 (ja) データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
US9466023B1 (en) Data mining technique with federated evolutionary coordination
US9064212B2 (en) Automatic event categorization for event ticket network systems
US20080109235A1 (en) Apparatus and method for creating business process workflows within business intelligence systems
US20130238649A1 (en) Visual and context-oriented curation and knowledge/insight discovery platform
US8533132B2 (en) Systems and methods for implementing a machine-learning agent to retrieve information in response to a message
Schintler et al. Encyclopedia of big data
Balusamy et al. Big data: concepts, technology, and architecture
US20080109283A1 (en) Apparatus and method for mixing business intelligence and business process workflows
CN116097241A (zh) 使用语义角色的数据准备
US20200058025A1 (en) System, methods, and devices for payment recovery platform
US7685146B2 (en) Apparatus and method for a collaborative semantic domain and data set based on combining data
US20220114483A1 (en) Unified machine learning feature data pipeline
US20140188657A1 (en) Establishing Customer Attributes
Barrasa et al. Building Knowledge Graphs
Dunlop Beginning Big Data with Power BI and Excel 2013: Big Data Processing and Analysis Using PowerBI in Excel 2013
Planting Developing a data repository for the Climate Adaptive City Enschede
Uzunbayır A comparison between relational database models and NoSQL trends on big data design challenges using a social shopping application
JP6339932B2 (ja) データ管理装置、データ管理方法及びデータ管理プログラム
US20230306033A1 (en) Dashboard for monitoring current and historical consumption and quality metrics for attributes and records of a dataset
US20230289839A1 (en) Data selection based on consumption and quality metrics for attributes and records of a dataset
Khalaf et al. Data Webhouse for Monitoring the Use of Enterprise Information System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant