CN104346435A - 用于数据排序、可视化和相关应用的方法、设备和系统 - Google Patents

用于数据排序、可视化和相关应用的方法、设备和系统 Download PDF

Info

Publication number
CN104346435A
CN104346435A CN201410384968.9A CN201410384968A CN104346435A CN 104346435 A CN104346435 A CN 104346435A CN 201410384968 A CN201410384968 A CN 201410384968A CN 104346435 A CN104346435 A CN 104346435A
Authority
CN
China
Prior art keywords
data
style
data element
level
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410384968.9A
Other languages
English (en)
Inventor
安德鲁·约翰·卡尔诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Business Intelligence Solutions Safe BV
Original Assignee
Business Intelligence Solutions Safe BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Business Intelligence Solutions Safe BV filed Critical Business Intelligence Solutions Safe BV
Publication of CN104346435A publication Critical patent/CN104346435A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了用于数据排序、可视化和相关应用的方法、设备和系统。描述了用于数据可视化计算系统中的创建样式表的方法,样式表用于由多个数据元素或值组成的数据集的图形表示的生成。该方法包括步骤:检索数据集中的数据元素的数据值;确定集合中数据元素的类型;获得与数据元素的每个类型相关联的样式属性;产生样式属性的层级;以及创建样式表以应用于数据集。

Description

用于数据排序、可视化和相关应用的方法、设备和系统
技术领域
本发明涉及用于数据排序、可视化和相关应用的方法、设备和系统。
背景技术
用于编码的样式表的使用是一种可以从内容的细节分离表示结构的方式。例如,在网页设计中,网页的标记语言(即,HTML或XHTML)包含用于页面的结构和语义内容,而没有定义其视觉布局或样式。使用诸如CSS或XSLT的样式表语言,在外部文件(样式表文件)中定义样式。在该设计方式之前,方法是通过页面的标记语言定义样式和结构两者。简而言之,样式表是如下文件:该文件包含用来将格式化信息应用到保持为一个或多个分离文件的一个或多个数据集的规则的集合。
例如,在文字处理和台式打印中,样式表是定义文档的布局的文件或形式。样式表指定诸如页面尺寸、余量、以及字体的参数。然后,这些参数可以被传送到多个文件或文档,以针对包含不同细节内容的文档给出统一外观。也可以定义不同的样式表,例如,用于官方报告的样式表、用于信函的样式表、用于团队会议备忘录或团队会议记录的样式表、用于行动计划的样式表等。
在出现和使用诸如CCS的样式表语言之前,对文件进行格式化的最普通的方式是在HTML标记中包括或包含展示属性;在HTML内对所有字体颜色、背景样式、元素对齐、边界和尺寸进行编码,因此经常需要在HTML内重复信息。CSS的出现允许大量的该格式化信息移到样式表文件。这使得相当程度地简化HTML语言。另外,将所有表示样式保持在一个文件中有助于显著减少维持时间,并且有助于减少人为错误。例如,通过改变样式表文件中的代码的一行或多行,可以遍布整个网站,指定与文本元素的类型相关联的字体颜色,因此更容易修改与文本元素的类型相关联的字体颜色。使用嵌入在每个相应页面中的样式的先前或替代的方式要求对于每个页面执行相同编辑。因为这是冗长且耗时的过程,因此由于人为错误,趋于混入错误。
“外部”样式表文件可以与一个或多个HTML文档相关联,以对文档的表示进行格式化。还可以“调用”或导入多个样式表。如果使用多个样式表,可以对该多个样式表给予优先级,其中,具有最高优先级的样式表控制内容显示。未在最高优先级源中设置的声明被传递到较低优先级的源(诸如用户代理样式)。该过程被称为级联。
级联样式表是如下样式表:该样式表预测将填补或覆盖整体样式表的其他样式表。这为设计者提供了如下优点:如果需要则能够依赖于基本样式表,以及如果希望则覆盖基本样式表。可以在样式表的一连串“级联”级别上发生填补或覆盖。例如,一个样式表可以被创建和链接,以形成网站的每个分离页面作为整体样式表(例如,设置字体类型、字体尺寸、文本颜色、背景等)。对于包括特定类型内容(例如,产品列表)的页面的任意部分,可以使用另一样式表,该二次样式表对于该特定内容修改了基本样式表。另一样式表可以被指定为适用于特定类型的产品显示。
除了控制视觉或显示元素(诸如文本尺寸和颜色)的样式表,样式表还可以包括功能方面。例如,如由样式表所指定的,样式表可以包括对文件中包括的数据进行排序的功能。还已知对数据表与执行诸如排序的功能的表格特定样式表进行结合,以创建具有由数据表指示的整体布局和外观的表格或类似物,其中,如由样式表所指示,对数据进行排序。
尽管按需要一个或多个分离样式表可以被创建并应用于页面或数据集,以对一个或多个文档的表示或顺序进行格式化,但是使用样式表的一个问题是对于每个特定要求的情形,依然需要各个样式表。对于多个分离的数据集,依然需要应用以及维持分离的样式表。如果潜在地需要多个不同格式,则将需要预先考虑这些,对于每个不同格式,按需要,多个样式表将必须被创建以及给予优先级/级联。这潜在地要求增大的存储器的分配、以及增大的处理能力来达到最终结果。
本发明的一个目的是提供一种通过某种方式来克服上述缺点或至少向公众或工业界提供有用选择的对数据进行排序和可视化的方法。
本发明的另一个目的是提供一种通过某种方式来克服上述缺点或至少向公众或工业界提供有用选择的对数据进行排序和可视化的设备。
本发明的另外的目的和优点将在以下说明书的各部分中示出,其中,详细的描述是为了全面地公开本发明的优选实施例的目的,而不对其构成限制。
不应该将背景技术部分的讨论(包括任何潜在的现有技术)视为对公知常识的承认。
发明内容
本说明书和指示性的独立权利要求中使用的术语“包括(comprising)”表示至少部分地由……组成。当解释本说明书和指示性的独立权利要求中包括术语“包括”的每一个语句时,还可能存在该术语引出的特征或多个特征以外的特征。相关的术语比如“包含(comprise)”和“包括(comprises)”应该以相同的方式解释。
如本文中所使用的,术语“和/或”表示“和”或者“或”以及两者。
如本文中所使用的,名词的复数(多个)表示名词的复数和/或单数形式。
在第一方面中,本发明提供了一种数据可视化计算系统,一种创建样式表的计算机实现的方法该样式表用于由多个数据元素或值组成的数据集的图形表示的生成,该方法包括步骤:
检索数据集中的数据元素的数据值;
确定集合中数据元素的类型;
获得与数据元素的每个类型相关联的样式属性;
产生样式属性的层级;以及
创建样式表以应用于数据集。
附图说明
根据以下仅作为示例给出的描述并参照作为示例示出了装置的实施例的附图,本发明的另外的方面将变得清楚。
图1示出了适合于优选实施例的系统的架构的示意性概图,其中示出了主要构造块或系统元件以及这些元件之间的主要连接;以及
图2示出了用于优选实施例的方法的示意性概要流程图。
具体实施方式
根据本发明的各个实施例,这里描述了如下系统和方法:其中,首先评价或确定一个或多个数据集中的数据元素的类型,然后将样式属性或规则的集合与每个元素类型相关联。然后,针对数据元素产生样式属性的层级,该层级用来创建然后被应用到数据集的样式表。
尽管以下描述的各个具体实施例与表格形式数据的表示相关,但将理解的是,例如,所描述的方法和系统还可以适用于其他适当的图形表示方法诸如数据图表或图形。
系统硬件和架构
所描述的方法和系统可应用于任何适当的数据可视化系统,在该数据可视化系统中,以表格单元表示数据值,或者,数据值表示为使用基于数据值自身或数据值所在的值的范围的不同格式(例如,柱状统计图表、圆形分格统计图表、散点图、线形图、热点图、螺旋框(box spiral)等)显示的数据点。
根据以下描述的实施例,数据排序和可视化计算系统使用各种模块和引擎来利用本发明的方法。
数据和可视化系统至少包括处理器、一个或多个存储器装置、或用于连接到一个或多个存储器装置的接口、用于连接到外部装置以便在来自一个或多个用户或外部系统的指示时使得系统接收和操作的输入和输出接口、用于在各个部件之间的内部和外部通信的数据总线、以及适当的电源。此外,数据排序和可视化系统可包括用于与外部和内部装置通信的一个或多个通信装置(有线或无线)、以及一个或多个输入/输出装置诸如显示器、指向装置、键盘或指向装置。
处理器布置成执行作为存储器装置内的程序指令存储的程序的步骤。程序指令使得执行如这里描述的执行本发明的各种方法。可以使用任意适当的软件编程语言和工具包(诸如,例如基于C语言和编译器)开发或实现程序指令。此外,可以以任意适当的方式存储程序质量,诸如,例如,程序指令可以被传输到存储器装置、或由处理器读取诸如例如存储在计算机可读介质上。计算机可读介质可以是用于切实地存储程序指令的任意适当的介质,诸如,例如固态存储器、磁带、致密盘(CD-ROM或CD-R/W)、存储卡、闪速存储器、光盘、磁带或任何其他适当的计算机可读介质。
数据存储和可视化系统被布置成与数据存储系统或装置(例如,外部数据存储系统或装置)通信,以便取得相关数据。
将理解的是,这里描述的系统包括被布置成执行如这里所描述的各种功能和方法的一个或多个元素。这里描述的实施例旨在为阅读者提供如下示例:构成系统的元素的各个模块和/或引擎如何可相互连接以使得实现要执行的功能。此外,说明书的实施例以系统相关的细节说明了如何执行这里描述的方法的步骤。提供概念图以向阅读者指示如何通过各种不同模块和/或引擎、在不同级处理各种数据元素。
将理解的是,取决于系统和用户需求,可以相应地改变模块或引擎的布置和构造,使得通过与这里描述的模块和引擎不同的模块和引擎来执行各种功能,以及可以将特定模块或引擎组合成单个模块或引擎。
将理解的是,可以以使用任意适当的技术形式的指令实现和提供所描述的模块和/或引擎。例如,可以以任意适当的语言所写的任意适当的软件代码实现或创建模块或引擎,其中,代码然后被编译,以产生可以在任何适当的计算系统上运行的可执行程序。可替选地或与可执行程序结合,可以使用硬件、固件和软件的任意适当的混合实现模块或引擎。例如,可以使用专用集成电路(ASIC)、片上系统(SoC)、现场可编程门阵列(FPGA)、或任意其他适当的可改变或可编程处理装置来实现部分模块。
可使用具体被编成以执行所描述的步骤的通用计算系统来实现这里描述的方法。可替选地,可使用特定计算系统(诸如,数据排序和可视化计算机、数据库查询计算机、图形分析计算机、制造数据分析计算机、商业智能计算机等)来实现这里所描述的方法,其中,计算机已具体改变为对从与特定领域相关联的环境捕获的特定数据执行所描述的步骤。
概述
图1是示出优选实施例的系统的架构的示意图,其中示出了主要构造块(building block)或系统元件以及这些元件之间的主要连接。示出了数据存储器101。数据存储器101可以是企业数据仓库、操作数据存储器、数据集市、存储阵列、或类似的,并且可以是从多个源102接收和存储数据的类型,该多个源102可以在地理上广泛地分离。此外,数据存储器可以是用于临时存储实时捕获的输入数据(例如流数据)的高速缓冲存储器。数据存储器也可以是中央位置,或者分布式网络。作为示例(但不限于这些示例),数据可以涉及ATM的使用、自动售货机的使用、手机使用、产品销售额、特定服务的占有率、股票或日用品价格、货币汇率等。来自这些服务点机器的数据中的一些数据或全部数据可以经由网络自动上载到数据存储器101。可能存在若干不同类型的、与每个单独的入口相关联的特定数据。例如,对于ATM使用,每个单独的取款可能构成数据元素,并且机器位置、使用的时间和取款数量可能与每个单独的“使用”或数据元素相关联。对于手机使用,每个单独的电话可能构成单独的数据元素,其中位置、时间和通话持续时间与单独的数据元素相关联。可以看到,其他数据元素可以从以下这些迭代:使用频率(例如,对于ATM)、位置密度(例如来自或去往特定小区的手机呼叫的数量)、用户使用频率(每次单独的用户使用服务)等。数据可以通过任何适当的通信系统103(例如,无线传输、经由建立的电话网络的传输(移动或固定线路)、经由内置硬连线网格等)从源102向数据存储器101发送。数据检索引擎104与数据存储器101通信以使得存储的数据能够被检索并且传送到系统的其他元素。处理模块105与数据检索引擎通信以接收数据并且如下面概述地对数据进行处理。数据检索引擎104和处理模块105与来自终端或接口106的外部输入通信,终端或接口106例如可以是用于输入命令或插入程序或代码的用户接口。呈现引擎107与处理模块105通信。呈现引擎107被布置成按照处理模块105的指示,呈现数据元素以创建在输出装置108上的图像空间的显示。例如,呈现引擎107接收指令以创建表,并且根据所接收的指令,在输出装置108上创建表,并且用由处理模块105所指定的位置中的数据元素来填充表中的单元。打印机元素109也与呈现引擎107和输出装置108并行地示出。打印机装置109可以用于产生由处理模块105将样式表应用于检索到的数据元素的结果的硬拷贝。呈现引擎可以适用于产生适合于屏幕上/在线和硬拷贝或打印输出二者的输出。还示出了发送单元110。发送单元110可以取出处理模块的输出并且以合适的格式发送该输出——例如作为电子邮件发送至智能电话,被适当地格式化以用于经由电子邮件读取。
图2示出了本发明的一般方法的步骤的流程图。在此描述的系统利用计算机实现的方法来检索或获得数据值、产生层次样式属性以应用于数据值、排序并且确定集合中的数据元素的类型;并且将样式属性应用于数据元素以创建样式表来应用于数据集。
在步骤201中,从数据存储器101中检索由多个数据值构成的数据集。这可以响应于用户输入命令,在该用户输入命令中用户请求特定数据,该特定数据可以按照要求来限定(例如,日期范围、特定上限和下限内的销售额等)。在步骤202中,确定或估计检索的集合中的数据元素的类型。可以被检索和评价的数据元素的类型的特定示例在下面的优选实施例中概述。接下来,在步骤203中,获得与数据元素的每种类型相关联的样式属性。下面针对优选实施例给出了可能的样式属性的示例。在步骤204中,产生样式属性的层级。层级指示元素如何被排序和格式化,并且因此在步骤205中,创建样式表,该样式表在步骤206中应用于检索到的数据元素。在最后的步骤207中,在样式表已经应用于数据元素之后,如上面所概述的,结果被呈现和显示在输出装置上。线210示出了用户如何能够浏览来自最后步骤的结果,并且可以改变样式属性的权重使得样式属性的层级改变,来改变步骤205中创建的样式表。线211示出了在处理的开始处的用户输入,使得并非接受自动的权重(该权重可以应用于数据元素的样式属性(条件优先级方法,在下面详细描述),而是用户在后续步骤执行之前手工输入这些(用户设置或用户指示优先级方法,在下面更详细地描述)。
在上面概述的处理中,从数据存储器101中检索数据集。用户经由终端或接口106输入需要的字段,使得数据检索引擎104可以从数据存储器101中检索数据元素。这些字段例如可以是:一个或多个日期范围、销售额的数量或单位、在一段时间上的使用的事件、位置等。还可以有与主字段相关联的子字段,例如,日期范围可以返回与在一年或多年的范围内的销售额有关的数据,进一步可以返回在该特定范围内的每个月、每周或每天的销售额的子细节。使用的事件可以是每周计数,进一步的子细节示出了每天(每24小时)使用的事件,以及在该时段内使用的事件的定时的子子细节。这种级别的细节可能对于模式分析有用。例如,当分析使用时,工作日使用可能要比周末使用更重或更轻,并且这对于计划保持或开发销售策略是有用的。
一旦检索到数据元素,有两种主要的可以产生样式属性的层级的方法:第一,条件优先级方法,以及第二,用户设置或用户指示优先级方法。
对于条件优先级方法,用户所选择的字段的特定组合指示了层级,而不需要进一步的输入。作为示例,用户可以首先选择间隔若干年的日期范围,加上销售图。处理模块105接收数据并且对其进行处理以创建样式表。由于日期范围在若干年上,这被给予最高优先级。销售数据被给予比日期范围较低的优先级。取决于所选择的数据,处理模块105可以将缺省设置应用于特定元素。例如,如果选择了若干年,则缺省的样式表可以是仅示出“年”视图,或者缺省的可以是示出年以及作为那些年内的子范围的月二者。然而,已知两个主要元素(时间范围,和销售额)的相对缺省优先级,产生的样式表将在表的列单元中或者沿着图的x轴水平放置“时间”,并且在表的行单元中或者沿着y轴竖直放置销售数据。数据的类型和范围也可以指示展示的输出,例如,如果所选择的年的数目在特定最小数和最大数之间,并且仅检索总销售图形,那么展示样式可以缺省的为直方图、柱状统计图表等类似的。如果所选择的范围在该范围以外,那么显示可以回到另一样式,例如如果选择单个年,则显示可以回到在条形图上示出单个月的销售额,使得示出12个柱而不是单个柱。
如果诸如位置的第三参数也被选中,则对该第三参数给出最低优先级,并且所创建的样式表将默认在具有更高优先级的两个元素(时间和销售)表示的输出界限内表示该数据。下面针对第一实施例描述关于这方面的示例。
对于用户设置或用户指示的优先级方法,用户首先选择他们需要的数据元素,并且然后对这些数据元素中的每个手动分配或强加优先级,以创建期望的层级。用户可以接受默认输出显示选项,或手动选择输出样式。一旦第一显示迭代完成,如果这使他们满意,则用户可以接受其作为最终结果,或者他们可以通过改变输出样式(例如从柱状统计图表到线形曲线图等)或通过改变优先级以改变层级的排名来细化输出。
第一实施例-销售数据
如上所述,图1示出了系统的主架构元素。原始数据值被存储在数据存储装置101中。在第一实施例中,这些是与产品销售有关的数据值。如针对上面给出的示例所概述的,存在可以与每个单独的数据元素相关联的若干不同特征。下面给出了具体示例。然而,存在也可以相关联的许多不同类型的特征,并且该示例不应被认为是限制性的。在该具体示例中,被加权的相关联的特征如下:销售的价格/尺寸、销售时间、销售位置。该数据被接收并集中存储在数据存储装置101中。用户经由终端或接口106输入请求。该请求的参数可以变化以构成用于请求特定界限或限制内的数据的请求。在该具体示例中,在五年时间内,选中特定总时段内的销售。还请求某些指定位置,诸如像城市或州的指定地理位置内的分支。
数据检索模块104从数据存储装置101提取所请求的数据,并将该数据传递给处理模块105。处理模块105处理每个数据元素并应用规则集合。这些规则一般可以分成两个子集:如标准样式表中那样用于呈现(颜色、文本等)的第一规则子集、以及用于功能元素(例如排序)的第二规则子集。处理模块105将权重分配给数据的特征。这些权重可以根据处理模块105内所包含的指示而变化,并且可以是用户分配的(用户设置或用户指示的优先级方法)或自动分配的(条件性优先级方法),并且下面给出了典型的示例。然而,这不应被认为是将指示或权重限制于这些具体参数。为了举例的目的,权重由用户手动分配(用户设置或用户指示的优先级方法),并且以1-10的尺度给出权重。这些是相对值,而非绝对值,因此,数字本身仅就其如何相对其他选中属性定位属性而言是重要的。
在该示例中,第二规则子集由两个子线程构成:首先按功能排序,其次对每个功能或特征施加优先级。对于上面给出的数据元素的三个特征中的每个特征(总销售的美元值、销售时间、销售位置),施加排序功能,例如可以从最大美元值到最小美元值对销售进行排序。存在多种方式对“销售时间”进行排序,例如通过“月”和“年”两者进行排序或通过“销售季度”或“年”进行排序。也可以以多种方式对销售位置进行排序,例如通过州和城市二者进行排序。接着,对每个功能或特征施加优先级。在该示例中,“销售时间”如用户希望其占主导那样而被加重权重,但是用户还希望通过“销售季度”和“月”对数据排序,其中“年”相比于“销售季度”占主导。因此,以“10”对“销售时间-年”加权,而以“8”对“销售时间-季度”定额(rate)。用户还希望按位置对销售进行排序,但是认为其相对时间是次要的,并且认为各个城市位置相对州位置是次要的。对“位置-州”给出权重“7”,对“位置-城市”给出权重“6”。对“总销售的美元值”给出最低权重“3”。年代(chronology)和位置也可以改变,但是在该示例中,时间元素以线性年代方式被排序(日期升序:2008、2009、2010等,Q1:1月、2月、3月,Q2:4月、5月、6月等),并且州和城市以字母顺序被排序。“总销售的美元值”从最高到最低降序排序。
由于“销售时间-年”被加权为最重,其将占主导,所以数据将按年排序,并且然后按季度(由于其被次重加权)排序。数据然后将按州排序,并且然后按城市排序。最后,数据将按销售的价格/尺寸排序。
在本实施例中,数据作为表格被输出。处理模块105通过计算所需要的行和列的最大数目来创建适当尺寸的表格。处理模块然后组装(populate)单元。在该示例中,首先创建用于年的列,然后是表示季度的子列。创建以州表示位置的行,其中这些行内的子行表示各个城市。然后在子列和子行内从最高到最低对销售进行排序。
还施加用于呈现(颜色、文本等)的第一规则子集,从而生成字体、字体大小、背景的颜色元素、文本、表格等。还可以跨越单元或单元组施加阴影,例如针对州内的城市销售向下(最多到最少)降序的、蓝色阴影直至红色。这些区域还可以被结合至层级或具有其自己的层级(默认或其他方式)。例如,某些区域可以针对背景颜色具有较高的权重。如果该区域处于层级的顶部。则该区域将设置背景颜色。
这创建了销售数据的网格,其中用户可以容易地找到包含特定城市某年内的特定季度的销售数据的单元子集,并且容易地将其与多个单元子集进行比较。例如,可以将特定季度或年内特定州或城市的数据与同一位置的其他季度或年进行比较。替选地,可以将特定季度或年内特定州或城市的数据与同一时间段内的其他位置进行比较。
因此,可以看出:对于任何特定的数据元素的组合,可以将层级或优先级施加于数据元素及其特征,这导致针对给定数据元素“实时(on thefly)”生成样式表。样式表产生的输出可以通过改变元素的优先级(这会改变元素在层级中的顺序)而容易地改变。例如,用户可以改变数据元素的权重以改变生成的表格。如果用户希望更加强调位置,则改变地理位置的权重以使得它们在层级中最高。对“位置-州”给出权重“10”,对“位置-城市”给出权重“9”。以“8”对“销售时间-年”加权,以“7”对“销售时间-月”定额。如前,对“总销售的美元值”给出最低权重“6”或更小。如前,处理模块105通过计算所需要的行和列的最大数目来创建适当尺寸的表格。处理模块然后增加单元。在该示例中,首先创建用于州的列,然后是表示各个城市的子列。创建表示年的行,其中这些行内的子行表示月。然后在子列和子行内从最高到最低对销售进行排序。
通过用户输入对于元素的权重的变化容易地实现该改变,以改变它们在层级中的位置。实时生成样式表以创建所需要的输出。与单独地改变或手动管理功能的情况相比,这导致需要更少的工作。为了使用常规的样式表实现同样的结果,需要对样式表进行手动格式化,从而使得输出结果为特定环境具体需要的输出结果。对于以上示例,样式表必需按照年份、月份、位置等将格式化为第一类。于是,需要按照位置(状态,继而城市)、年份、月份、销售将样式表重新格式化为第一类。即,如果需要进行改变,则需要对整个样式表重新排序/重新格式化以输出变化后的具体指令。
可以看出,与具有可根据需要应用以实现同样结果的多个预先格式化的样式表的情况相反,由于在工作中创建样式表,因而需要较小的存储器。消除了对于多个或级联的样式表的需求。与创建来自多个样式表的末端相比,创建层级继而创建来自层级的样式表需要较少的处理力。可以去除多个样式表和级联所需的存储器。由于不需要针对每种特定情形的单独样式表,因而降低了工作负荷(编码和处理工作两者)。此外,由于要处理的内容较少,因而需要较小的处理力,并且较快地实现期望的输出或者以较小的处理力实现曲线的输出,或者实现上述两者。
具有数据权重字段的示例和所获得输出表格
在下面的示例中,数据元素及其样式属性是第一优选实施例的数据元素及其样式属性,即销售数据。选择这些数据元素的三种属性:总销售的美元值、销售时间及销售位置。按照特征对数据元素进行排序,并对每个属性应用优先级。应用排序函数:从最大美元值至最小美元值对销售进行排序。按照两个子属性(年份和销售季度)对“销售时间”进行排序。用户希望以“年份”为主。按照两个子属性(状态和城市)对销售位置进行排序,并且用户希望以“状态”为主。相对于“位置”,用户将“时间”设置为主导,并且这两者均在层级中均高于“销售”。
这通过用户将优先级或权重手动设置为1-10来实现。如下表所示,用户将它们手动应用于每种样式属性。它们是相对值而非绝对值,因此数本身只有在相对于其它选择的属性关于如何定位属性时重要。
数据元素和属性/子属性 权重
‘销售时间-年份’ 10
‘销售时间-月份’ 8
‘位置-状态’ 7
‘位置-城市’ 6
‘总销售的美元值’ 3
表格1-数据属性的相对权重
一些其它样式元素没有具体说明,并且它们在本示例中恢复为默认设置,例如,按照线性年代顺序形式(日期升序2008、2009、2010等,一月、二月、三月等)存储时间元素。在该示例中,状态和城市的默认排序为按照字母顺序。然而,默认排序可以是任何适合的数据呈现,例如,人口大小。在该示例中,用户允许将“状态”保持(或恢复)为默认设置,以使得按照字母顺序对“状态”进行排序。由于“总销售的美元值”被用户设置为必需字段,这破坏了默认值,并且一旦按照状态内的城市对销售进行了排序(如按照上述表格所示的用户权重所示),则从最高销售至最低销售对城市顺序进行重新排列,如上述表格的最后单元所述的最终用户权重所示)。
由于“销售时间-年份”被赋予了最重的权重,其将占主导,因而,首先将按照年份对数据进行排序,然后按照月份进行排序,因为月份为第二重的权重。然后,将按照状态对数据排序,然后按照城市对数据排序。最后,将按照销售的价格/大小对数据排序。
数据被输出为表格。处理模块105通过计算所需的行和列的最大数量来创建适合大小的表格。然后,处理模块组装这些单元。在该示例中,首先创建针对年份的列,然后创建示出各销售季度的子列。按照状态创建示出位置的行,在这些行内具有用于示出各城市的子行。然后,在子行和子列内从最高至最低对销售进行排序。以下示出显示针对三种状态的三年期间内的示例销售数据的表格,其中,在每个状态中具有三个城市。
表格2-示例输出表
在该示例中,可以看出,总体上,该样式表以可容易使用的格式呈现数据。然而,还可以看出,存在不满足样式表所生成的总体模式的数据点。在该示例中,存在特定城市的销售高于其他城市的、销售季度数据,以及销售低的、销售季度数据。对样式表进行配置,使得当此发生时,按照总体顺序进行评价,并且首先或最先放置在所选择的日期范围内具有最大的最高销售季度的城市。例如,参见2011年的第四季度(Q4)和2012年的第一季度(Q1)。在这两个示例中,休斯顿(Houston)比达拉斯(Dallas)卖的多。然而,在所选择的三年时间范围内的滞销品销售中,达拉斯持续比休斯顿卖的多,因此休斯顿在德克萨斯(Texas)的销售行中显示在第一或在休斯顿上面。在样式表所生成的输出表中,以粗体突出显示四个相关表格单元中的数据。如说明书所示,还应用用于呈现(颜色、文本等)的规则的子集,以生成所需要的字体、字体大小、背景的颜色元素、文本、表格等。应注意,这些字段也可以与层级结合或具有它们自己的层级。在该实例中,以粗字体突出在不适合模式的四个字段,以引起用户注意在数据生成的模式的剩余物之外或与其相反的数据。
在该示例中,呈现规则还标记(通过突出显示)数据中的其它异常:在所选择的所有城市中,销售相当高于2010年的第四季度和2011年的前两个季度的平均或平均值。呈现规则子集通过突出显示相关列标记了这些。这引起了用户对于相关数据的注意。该示例中的较高的销售数字是由于全国性的营销活动导致的,这引起了销售“反弹”。可以看出,该活动对于所选择的所有城市都有作用。如果在这些列中存在保持非突出显示的数据单元,这也将吸引用户的注意,并且允许他们研究这些数据以查看是否存在特定区域没有对国家的其它区域反弹的特定原因。
尽管已经通过描述本发明的实施例对本发明进行了说明,并且尽管详细描述了实施例,然而申请人的意图不是以任何形式将所附权利要求书的范围限制为具体。此外,上述实施例可以单独地实施,或可以协调地组合实施。本领域的技术人员将明白另外的优点和变型,这些变型包括上述实施例的组合。因此,本发明有更宽的方面而不限于所示出和描述的具体细节、相应设备和方法以及示例性示例。因此,在不脱离申请人的总的创造性构思的精神或范围的情况下可以根据这些细节得到启示。

Claims (21)

1.在数据可视化计算系统中,一种创建样式表的计算机实现的方法,所述样式表用于由多个数据元素或值组成的数据集的图形表示的生成,所述方法包括步骤:
检索所述数据集中的所述数据元素的数据值;
确定集合中数据元素的类型;
获得与数据元素的每个类型相关联的样式属性;
产生样式属性的层级;以及
创建样式表以应用于所述数据集。
2.根据权利要求1所述的方法,其中,在获得所述样式属性和产生样式属性的层级的步骤中,基于每个数据元素的预先设置的或预先存在的权重产生所述层级。
3.根据权利要求2所述的方法,其中,用户可以覆盖所述预先设置的权重并且改变所述层级的等级。
4.根据权利要求1所述的方法,其中,在获得所述样式属性和产生样式属性的层级的步骤中,用户设置所述数据元素的每一个的相对权重。
5.根据权利要求1至4中的任意一项所述的方法,其中,获得所述样式属性和产生样式属性的层级的步骤被划分为如下步骤:首先,按照功能将所检索的数据元素排序;第二,向每个功能应用优先权或权重。
6.根据权利要求5所述的方法,其中,所述层级根据所述权重产生,所述层级形成样式表的框架或基础,所述样式表被应用于所检索的数据元素以格式化所述数据元素的输出。
7.根据权利要求1至6中的任意一项所述的方法,其中,所述方法还包括如下步骤:针对总体的呈现样式应用规则集合,以生成所需要的元素,所述所需要的元素包括但不限于字体、字体大小、背景的颜色元素、文本、表格大小、阴影。
8.根据权利要求7所述的方法,其中,与总体的呈现样式有关的元素与所述层级相关联,以使得输出的总体外观取决于所述层级。
9.根据权利要求1至8中的任意一项所述的方法,其中,在检索所述数据集中的所述数据元素的数据值的步骤中,用户在要检索的所述数据值周围设置参数。
10.根据权利要求9所述的方法,其中,所述参数包括但不限于:数据范围、时间范围、位置范围或位置子集、交易范围或子集。
11.根据权利要求1至10中的任意一项所述的方法,其中,所述数据元素可以是不限于以下元素的任意组合:销售时间、位置、使用时间、销售数量。
12.根据权利要求1至11中的任意一项所述的方法,其中,用户可以在输出之前或输出之后手动输入或重新布置层级顺序。
13.根据权利要求1至12中的任意一项所述的方法,其中,所述数据以不限于以下格式的任意一种输出:表格、柱状统计图表、圆形分格统计图表、散点图、线形图、热点图、螺旋框。
14.根据权利要求1至13中的任意一项所述的方法,其中,所述用户设置的字段可以从不限于以下元素的任意组合中选择:数据范围、位置范围或位置数量、销售范围、收入范围。
15.根据权利要求1至14中的任意一项所述的方法,其中,所述方法在产生样式属性的层级之后包括如下步骤:评价所述层级和所述数据元素形成的整体模式,以及使用形成大多数的那些数据元素来产生用于输出的整体模式,所检索的数据中不自然地符合的少数数据元素被覆盖以配合到所述整体模式中。
16.根据权利要求15所述的方法,其中,所述方法还包括针对总体的呈现样式应用规则集合的步骤,不自然地配合到所述模式中的少数数据元素以与大多数数据元素不同的方式呈现。
17.根据权利要求15所述的方法,其中,所述方法还包括如下步骤:针对总体的呈现样式应用规则集合;并且评价所述整体模式中位于均值或平均值一定量以外或偏离所述均值或平均值一定量的任何结果,这些结果以与大多数数据元素不同的方式呈现。
18.根据权利要求17所述的方法,其中,所述量是默认量。
19.根据权利要求17所述的方法,其中,所述量是用户指定量。
20.根据权利要求18或19所述的方法,其中,所述量是百分比。
21.根据权利要求18或19所述的方法,其中,所述量是基于相关的数据元素的数值。
CN201410384968.9A 2013-08-06 2014-08-06 用于数据排序、可视化和相关应用的方法、设备和系统 Pending CN104346435A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361862702P 2013-08-06 2013-08-06
US61/862,702 2013-08-06

Publications (1)

Publication Number Publication Date
CN104346435A true CN104346435A (zh) 2015-02-11

Family

ID=51538712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410384968.9A Pending CN104346435A (zh) 2013-08-06 2014-08-06 用于数据排序、可视化和相关应用的方法、设备和系统

Country Status (3)

Country Link
US (2) US9798707B2 (zh)
CN (1) CN104346435A (zh)
AU (1) AU2014100875A4 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287471A (zh) * 2019-06-28 2019-09-27 重庆回形针信息技术有限公司 一种图表分析系统
CN112559600A (zh) * 2020-12-22 2021-03-26 南京万购信息科技有限公司 基于搜索引擎检索数据的企业产品名录挖掘方法
CN113688298A (zh) * 2021-08-24 2021-11-23 北京房江湖科技有限公司 数据的呈现方法和存储介质
CN113961862A (zh) * 2021-10-27 2022-01-21 苏州浪潮智能科技有限公司 一种设置层叠样式表中Z-Index的方法、系统、设备和介质
US11366826B2 (en) 2019-09-05 2022-06-21 International Business Machines Corporation Customizing data visualizations according to user activity

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10176153B1 (en) * 2014-09-25 2019-01-08 Amazon Technologies, Inc. Generating custom markup content to deter robots
CN105677654B (zh) * 2014-11-18 2020-07-03 阿里巴巴(中国)有限公司 广告过滤方法及装置
US10089285B2 (en) * 2016-12-14 2018-10-02 Rfpio, Inc. Method to automatically convert proposal documents
US10866696B2 (en) 2018-10-04 2020-12-15 The Toronto-Dominion Bank Automated device for data transfer
US10984418B2 (en) 2018-10-04 2021-04-20 The Toronto-Dominion Bank Automated device for data transfer
US11069201B2 (en) 2018-10-04 2021-07-20 The Toronto-Dominion Bank Automated device for exchange of data
US10996838B2 (en) 2019-04-24 2021-05-04 The Toronto-Dominion Bank Automated teller device having accessibility configurations

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167278A1 (en) * 2002-02-28 2003-09-04 Thomas Baudel Interactive generation of graphical visualizations of large data structures
US20050174397A1 (en) * 2002-05-20 2005-08-11 Alessandro Scardovi Ink jet printer with high capacity tank and associated ink refilling system
CN1656476A (zh) * 2002-06-12 2005-08-17 甲骨文国际公司 管理电子文档样式的方法和系统
CN101183372A (zh) * 2007-12-21 2008-05-21 腾讯科技(深圳)有限公司 一种样式表处理系统及方法
CN101258529A (zh) * 2005-07-22 2008-09-03 埃森哲环球服务有限公司 使用图形直观化的数据分析
US20090063403A1 (en) * 2002-12-18 2009-03-05 International Business Machines Corporation Systems and computer program products to identify related data in a multidimensional database
US20110138357A1 (en) * 2009-12-03 2011-06-09 International Business Machines Corporation Managing graphical user interface (gui) objects in a testing environment

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7107521B2 (en) * 2001-07-03 2006-09-12 International Business Machines Corporation XSL dynamic inheritance
US20060101134A1 (en) * 2002-10-29 2006-05-11 David Nocera Apparatus, method and article of manufacture for visualizing patterns of change and behavior on a compute infrastructure
US20040168115A1 (en) * 2003-02-21 2004-08-26 Bauernschmidt Bill G. Method and system for visualizing data from multiple, cached data sources with user defined treemap reports
US7917382B2 (en) * 2003-03-05 2011-03-29 Teradata Us, Inc. Integration of visualizations, reports, and data
WO2005008543A1 (en) * 2003-07-10 2005-01-27 Computer Associates Think, Inc. System and method for customizing a data display using a presentation profile
US20050057566A1 (en) * 2003-09-11 2005-03-17 International Business Machines Corporation Rich graphic visualization generation from abstract data representation
US9870629B2 (en) * 2008-06-20 2018-01-16 New Bis Safe Luxco S.À R.L Methods, apparatus and systems for data visualization and related applications
WO2009154479A1 (en) * 2008-06-20 2009-12-23 Business Intelligence Solutions Safe B.V. A method of optimizing a tree structure for graphical representation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167278A1 (en) * 2002-02-28 2003-09-04 Thomas Baudel Interactive generation of graphical visualizations of large data structures
US20050174397A1 (en) * 2002-05-20 2005-08-11 Alessandro Scardovi Ink jet printer with high capacity tank and associated ink refilling system
CN1656476A (zh) * 2002-06-12 2005-08-17 甲骨文国际公司 管理电子文档样式的方法和系统
US20090063403A1 (en) * 2002-12-18 2009-03-05 International Business Machines Corporation Systems and computer program products to identify related data in a multidimensional database
CN101258529A (zh) * 2005-07-22 2008-09-03 埃森哲环球服务有限公司 使用图形直观化的数据分析
CN101183372A (zh) * 2007-12-21 2008-05-21 腾讯科技(深圳)有限公司 一种样式表处理系统及方法
US20110138357A1 (en) * 2009-12-03 2011-06-09 International Business Machines Corporation Managing graphical user interface (gui) objects in a testing environment

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287471A (zh) * 2019-06-28 2019-09-27 重庆回形针信息技术有限公司 一种图表分析系统
US11366826B2 (en) 2019-09-05 2022-06-21 International Business Machines Corporation Customizing data visualizations according to user activity
CN112559600A (zh) * 2020-12-22 2021-03-26 南京万购信息科技有限公司 基于搜索引擎检索数据的企业产品名录挖掘方法
CN112559600B (zh) * 2020-12-22 2021-07-27 南京万购信息科技有限公司 基于搜索引擎检索数据的企业产品名录挖掘方法
CN113688298A (zh) * 2021-08-24 2021-11-23 北京房江湖科技有限公司 数据的呈现方法和存储介质
CN113961862A (zh) * 2021-10-27 2022-01-21 苏州浪潮智能科技有限公司 一种设置层叠样式表中Z-Index的方法、系统、设备和介质
CN113961862B (zh) * 2021-10-27 2024-01-12 苏州浪潮智能科技有限公司 一种设置层叠样式表中Z-index的方法、系统、设备和介质

Also Published As

Publication number Publication date
US20180067908A1 (en) 2018-03-08
US9798707B2 (en) 2017-10-24
AU2014100875A4 (en) 2014-09-04
US20150046794A1 (en) 2015-02-12

Similar Documents

Publication Publication Date Title
CN104346435A (zh) 用于数据排序、可视化和相关应用的方法、设备和系统
US9658759B2 (en) User adjustable data sharing between multiple graph elements
JP3463010B2 (ja) 情報処理装置および情報処理方法
CN106599039B (zh) 一种支持关系数据库数据自由组合嵌套的统计表述方法
US9058307B2 (en) Presentation generation using scorecard elements
US20140039981A1 (en) Systems and methods for detection of satisficing in surveys
CN110399420A (zh) 一种可配置化Excel格式的导出方法、电子设备和介质
CN102841938A (zh) 一种参数化报表的生成方法及系统
US8161374B2 (en) Butterfly diagrams enabling multi-dimensional performance analysis
CN105760400A (zh) 一种基于搜索行为的推送消息排序方法及装置
CN110609989B (zh) 采用预定义布局组件快速生成信息表单操作方法及系统
CN109634992B (zh) 一种报表结构分解方法、报表生成方法、装置
CN109165377A (zh) 生成表单数据的方法和制表设备
EP3617910A1 (en) Method and apparatus for displaying textual information
Antonioli et al. Specialization and KIBS in the Euro area: A vertically integrated sector perspective
CN104182226B (zh) 一种通用移动信息系统适配方法与装置
CN102243634A (zh) 一种数据统计方法及系统
CN108537441A (zh) 土地利用转型经济社会效应评价与监控信息集成系统
CN104199648B (zh) 一种通用移动信息系统适配方法与装置
JP2004005671A (ja) 情報処理装置および情報処理方法
CN113641719A (zh) 数据处理方法、装置、计算机及存储介质
US20130091412A1 (en) Representation of data records in graphic tables
CN114722789B (zh) 数据报表集成方法、装置、电子设备及存储介质
CN114780084B (zh) 一种协同多种类型交互界面设计的组态系统
Saris et al. CASIP: a complete automated system for information processing in family budget research

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150211