CN103823667A - 根据可视反馈自动调整值序列分析任务的方法和系统 - Google Patents
根据可视反馈自动调整值序列分析任务的方法和系统 Download PDFInfo
- Publication number
- CN103823667A CN103823667A CN201310563640.9A CN201310563640A CN103823667A CN 103823667 A CN103823667 A CN 103823667A CN 201310563640 A CN201310563640 A CN 201310563640A CN 103823667 A CN103823667 A CN 103823667A
- Authority
- CN
- China
- Prior art keywords
- annotation
- value sequence
- section
- sequence
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 122
- 238000004458 analytical method Methods 0.000 title claims abstract description 15
- 230000000007 visual effect Effects 0.000 title abstract 2
- 238000012300 Sequence Analysis Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 28
- 238000009826 distribution Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 21
- 238000004590 computer program Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000009467 reduction Effects 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000001932 seasonal effect Effects 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种根据可视反馈自动调整值序列分析任务的方法和系统。提供了一种用于针对值序列选择分析过程的方法,所述方法包括:在计算机显示器上显示值序列;接收一个或多个由用户提供的注释序列,其中所述注释覆盖所述计算机显示器上的所述值序列的至少一个子区间;使用所述用户提供的注释序列从一组值序列分析方法中选择最佳值序列分析方法,其中选择最佳值序列分析方法包括确定所述最佳值序列分析方法的参数值;以及向所述用户呈现所选择的最佳值序列分析方法和参数以及所述注释序列的最佳重构。
Description
技术领域
本公开涉及用于预处理值序列(value series)数据的方法,值序列数据包含时间序列数据,以便选择适当的分析方法并调整参数。
背景技术
选择正确的分析方法并且适当地调整其参数是进行有用的分析应用的先决条件。对于时间或值序列的分析尤为如此。调整和选择正确的分析方法一方面需要统计专业知识以便理解方法及其调整过程,而另一方面需要领域专业知识以便解释数据并且理解感兴趣的任务。统计分析通常对于领域专家而言难以理解和使用,而统计人员则浪费时间来获得用于解决感兴趣的任务的必需领域专业知识。
一个典型的实例是对从传感器数据获得的时间序列进行降噪。这些序列可以展现任何事物,从添加到实际信号的随机噪声到极值或完全的传感器故障。
存在许多已知的方法以便过滤噪声并且从数据中删除异常值。简单的实例是基于移动平均的平滑算法、基于样条的方法,或者诸如低通滤波器之类的过滤技术。
这些方法具有挑战。
●设置参数并非易事,其通常需要例如关于传感器属性的大量背景知识。在大量多种多样并且高度可调整的方法中选择最佳降噪方法需要统计上的专业知识。
●“正确的”过滤参数可以随时间改变,甚至可能频繁改变。例如,传感器可以在白天和夜间展现不同的属性。
●搜索空间可以很大,这从计算复杂性和统计显著性的角度产生挑战。
由于这些原因,预处理大量时间序列以便分析仍是一项工作非常密集的任务,需要有关过滤器属性和原始数据分布的渊博统计知识。
与此相反,一种改进的方法将:
●足够简单以便专家无需太多的统计知识即可使用;
●将交互量降至最低;以及
●允许将方法细粒度地应用于单个或一组序列。
现有技术通过试错方法执行该操作,其中专家测试不同的方法和参数以调整这些方法以便查找最合适的方法。但是,这种方法可能需要大量手动工作并且容易出错。
如果给定监管式学习任务,则一种替代方案是将包装器与进化计算一起使用以便优化该任务的参数。因为该优化的搜索空间可以很大,所以这些方法可能过度拟合并且具有高计算复杂性。此外,这些方法仅适用于监管式任务。还存在用于群集的半监管式学习方法,这些方法通常获得实体对并且将它们标记为相似或不同。根据这点,可以获知最佳参数和距离度量。虽然这些方法可能非常适合于某些数据集,但它们通常需要许多标记的对,并且依赖良好的现有特性,这些特性通常不可用于值序列。此外,这些方法通常针对群集进行调整并且不适用于分析值序列。最重要的是,与用户的交互限于用户提供的标签,这限制了用户和分析系统之间的交互。
发明内容
根据本发明的一个方面,提供一种用于针对值序列选择分析过程的计算机实现的方法,包括:在计算机显示器上显示值序列;接收一个或多个由用户提供的注释序列,其中所述注释覆盖所述计算机显示器上的所述值序列的至少一个子区间;使用所述用户提供的注释序列从一组值序列分析方法中选择最佳值序列分析方法,其中选择最佳值序列分析方法包括确定所述最佳值序列分析方法的参数值;以及向所述用户呈现所选择的最佳值序列分析方法和参数以及所述注释序列的最佳重构。
根据本发明的进一步方面,所述方法包括:在向所述用户呈现所选择的最佳值序列分析方法之后,从所述用户处接收用户提供的附加注释序列,以及从一组值序列分析方法中选择最佳地重构所述用户提供的注释序列的另一最佳值序列分析方法。
根据本发明的进一步方面,所述方法包括:在所述计算机显示器上显示多个值序列,其中至少一个由用户提供的注释序列连接不同值序列中的点。
根据本发明的进一步方面,所述值序列是时间序列,并且还包括根据用户提供的注释序列将所述时间序列划分为段。
根据本发明的进一步方面,选择最佳地重构所述用户提供的注释序列的最佳值序列分析方法包括针对所述用户注释的段,确定最小化所述段中的时间序列点与所述用户注释之间的误差的最佳过滤器。
根据本发明的进一步方面,选择最佳地重构所述用户提供的注释序列的最佳值序列分析方法包括针对所述用户未注释的段,标识相似的已注释的段,并且确定最小化所述未注释的段与所述已注释的段中的时间序列点之间的误差的最佳过滤器。
根据本发明的进一步方面,根据所述未注释的段和所述已注释的段的方差和频率分布而标识相似的已注释的段。
根据本发明的进一步方面,根据由所述最佳过滤器过滤之前和之后的所述未注释的段之间的误差分布而标识相似的已注释的段。
根据本发明的进一步方面,所述方法包括:根据每个段的总体特性,将未针对其标识相似的已注释的段的所有段聚集成一个或多个群集,以及向所述用户呈现每个群集的表示以便注释。
根据本发明的进一步方面,所述方法包括提取最大程度地关联用户提供的不同注释序列的特性。
根据本发明的进一步方面,所述特性包括滞后值和窗口宽度中的一个或多个。
根据本发明的进一步方面,所述最佳值序列分析方法最佳地重构所述用户提供的注释序列。
附图说明
图1示出根据本发明的一个实施例的具有两组分组值的值序列的图;
图2是根据本发明的一个实施例的用于根据用户提供的一个或多个值序列注释来选择值序列分析方法的方法的流程图;
图3是示出根据本发明的一个实施例的从选择的值序列点获得特性的图;
图4是根据本发明的一个实施例的用于实现根据用户提供的一个或多个值序列注释来选择值序列分析方法的方法的示例性计算机系统的框图。具体实施方式
本发明的示例性实施例如在此描述的,通常包括用于根据用户提供的一个或多个值序列注释来选择值序列分析方法的系统和方法。因此,虽然本发明易于具有各种修改和备选形式,但在附图中通过实例的方式示出本发明的特定实施例并且将在此详细描述。但是,应当理解,并非旨在将本发明限于所公开的特定形式,相反,本发明目的是覆盖所有落入本发明的精神和范围内的修改物、等效物和备选物。
本公开的实施例提供实现方法的值序列分析系统,这些方法允许用户以图形方式注释时间或值序列并且利用这些注释自动调整感兴趣的值序列分析任务。注释表示用户(如果给出他/她的领域知识)将什么视为“信息”而不是噪声、异常值、随机关联或无关模式。用户将值序列形式的反馈返回到分析系统。这种类型的反馈允许新的交互方案,这些交互方案采用询问用户有关他/她的专业知识并且检索反馈的方式,以及利用用户的反馈以便解决感兴趣的任务的方式。
本公开的实施例允许用户以图形方式沿着时间和值维度标记用户视为与感兴趣的任务相关的一个或多个值序列的子段。感兴趣的任务可以是任何事物,从值序列的纯预处理和降噪到预测、回归、模式提取、分类、特性提取或者复杂关系的定义(只要任务涉及值序列或一组值序列)。用户的反馈则采用选择或简述的值序列段的形式。这些值序列段通常从原始值序列导出。反馈不一定涉及独有的序列值,但可以涉及任意数量的序列值。用户例如可以定义跨越相同或不同值序列的两个或多个子段相关,因此它们在时间上的共同出现表示某些有价值的信息。
根据本公开的实施例的方法不同于根据原始数据标记时间间隔,并且不同于监管式学习。根据本公开的实施例的注释不是标签,而是以可以不同于原始信号的形式突出信号各部分或者信号各部分之间的关系。信号部分指时间维度上的段,但也指值维度上的分解。
使用根据本公开的实施例的方法,用户做到两全其美:(1)使注释简单并且直观;以及(2)具有有限数量的注释,可以自动分析整个序列或者一组序列而不必手动定义过程。自动调整由分析系统选择的过程,以便针对为其提供过程的值序列的其余部分重新产生用户的注释。
根据本公开的实施例的方法允许用户突出时间数据中的信息内容而不标记该内容。图1示出根据本发明的一个实施例的具有两组分组值的值序列的点10的图。为清楚起见,仅指示两个点。现在参考图1,用户不需要表达曲线11和12确切意味着什么,这是领域专家通常发现很困难的任务。然而,这种反馈允许分析系统自动获得比仅针对数据手动标识所能获得的过程更复杂的预处理过程。
图2是根据本发明的一个实施例的用于根据用户提供的一个或多个值序列注释来选择值序列分析方法的方法的流程图。现在参考该图,如果给出一个或多个值序列以及用于所述值序列的多组分析方法,则方法在步骤11开始,在计算机显示器上显示一个或多个值序列的点的2维(2D)图。如图1中所示,点可以通过圆10表示,但是这种表示是示例性的而非限制性的,并且可以使用值序列点的其它表示(例如圆点或多边形)。在步骤12,用户可以标记一个或多个序列的任意多个此类部分,然后指示所有标记的序列部分共同组成序列中与其感兴趣的任务相关的信息内容。根据这点,在步骤13,分析系统从用于解决感兴趣的任务的一组工具中,选择用于序列的最佳处理工具,并且在步骤14,向用户呈现该最佳处理工具以便查看。在步骤15,用户然后可以决定添加附加注释并且再次启动过程。用户反馈包括在值序列形式下进行标记,以便告知分析系统应该如何执行分析。分析系统然后根据用于解决该感兴趣的任务的一组工具,选择要使用的最佳技术以及如何调整该技术的参数。
根据本公开的一个实施例的方法的计算方面包括查找最佳值序列分析方法,并且根据用户的反馈调整其参数。总体思想是查找最佳地重构用户作为信息注释提交的内容的这些值序列分析方法。如何执行该操作依赖于感兴趣的值序列分析任务。
根据本公开的实施例的其中可以使用这种从信号中提取信息的两个感兴趣的任务包括交互式降噪和辅助特性提取。应当理解,根据本公开的实施例的注释和调整方法是通用的,可以应用于几乎任何值序列分析任务。因此,以下两个实例是本公开的示例性而非限制性实施例。
交互式降噪:在根据本公开的一个实施例的交互式降噪中,领域专家用户首先以图形方式标记时间序列部分中的信号。根据该注释,随着时间对完整的时间序列进行分段。
可以根据季节性、用户输入或通用时间序列分段算法确定初始分段本身。对于每个完全注释的段,确定最佳过滤准则,即,导致测量的信号与用户注释之间的最小误差的过滤器。
对于每个非注释的段,通过相似性搜索标识相似的已注释的段。相似性可以基于两个可能的特性集:(1)段的总体特性,例如方差或频率分布;以及(2)原始信号与过滤后的信号之间的误差分布。根据该相似性,选择最相似的段,并且将用于该段的过滤方法应用于非注释的段。
根据本公开的实施例的方法允许对时间序列进行图形过滤,以便不具备进一步统计知识的专家用户可以轻松执行该方法。选择正确过滤技术并且优化其参数的负担完全由分析系统根据用户的注释来接管。最佳过滤准则可以是局部的,因此同一过滤器不会应用于整个序列,但不同准则可以应用于序列的不同部分。另一方面,重新出现或相似的段仅需要被注释一次。此优化很合理,因为它使用误差分布作为准则来确定两个段是否彼此足够接近。
辅助特性提取:时间序列分析中的一个最富有挑战性的任务是标识预测序列的未来值的良好特性。此类特性可以是当前序列或其它序列的过去窗口或趋势、季节性特性等。标识特性富有挑战性,特别是如果仅给出有限的数据。因此,用户给出的信息对于成功的特性提取非常有用,该信息为分析系统提供有关哪些序列可以相关的暗示。
另一方面,用户只是确切说明哪些特性相关也富有挑战性。本公开的实施例为用户提供一种方法,以便从以上意义上说,在一个或多个相关的序列中注释信号段对。
根据这些关系,可以提取最大程度地关联这两者的特性。图3是示出根据本发明的一个实施例的从选择的值序列点获得特性的图。例如,现在参考图3,可以使用特性从两个注释31、32之间的距离获知滞后值34,并且从注释的第一信号31和原始第一信号的差异获知窗口宽度33。应当注意,对于特性提取,通常不必将过滤器应用于对的第二成员,因为这表示预测的值。
交互式预测和回归:大多数时间序列预测算法非常适用于固定的时间序列,固定意味着时间序列的行为不随时间变化。但是,检测和处理可能重新出现的打破这种固定性假设的异常行为富有挑战性,并且通常对预测算法的质量具有负面影响。可以使用值序列注释来注释此类异常行为及其对值序列的其它部分的影响。实现该操作的方法与针对辅助特性提取提供的方法相似。
预测和回归的另一个应用是(在所述实例的精神中)针对交互式降噪:大多数时候,选择正确的预测算法并且调整其参数富有挑战性。可以使用根据在降噪实例中提供的实施例的方法适当地选择和调整预测算法,以便用于给定值序列。
交互式分类:可以通过要求用户选择时间序列的某些段并且对它们进行手动分类,在分类的上下文中使用值序列注释。然后,与降噪实例相似,例如可以使用以下技术之一对整个时间序列进行分段:季节性、用户输入或通用时间序列分段算法。对于每个非注释的段,与特性提取实例相似,可以使用相似性度量检测最相似的已注释的段,并且将该非注释的段归于其最相似段的分类。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是—但不限于—电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括例如在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括—但不限于—电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括—但不限于—无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的各个方面的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其它设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article ofmanufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的一个或多个方框中规定的功能/动作的过程。
图4是用于实现根据用户提供的一个或多个值序列注释来选择值序列分析方法的方法的示例性计算机系统的框图。现在参考图4,用于实现本发明的计算机系统41可以包括中央处理单元(CPU)42、存储器43和输入/输出(I/O)接口44。计算机系统41通常通过I/O接口44耦合到显示器45和各种输入设备46,例如鼠标和键盘。支持电路可以包括诸如高速缓存、电源、时钟电路和通信总线之类的电路。存储器43可以包括随机存取存储器(RAM)、只读存储器(ROM)、磁盘驱动器、磁带驱动器等或者它们的组合。本发明可以实现为例程47,其存储在存储器43中并且由CPU42执行以便处理来自信号源48的信号。因此,计算机系统41是通用计算机系统,当执行本发明的例程47时,其变成专用计算机系统。
计算机系统41还包括操作系统和微指令代码。在此描述的各种过程和功能可以是微指令代码的一部分或者应用程序的一部分(或者它们的组合),微指令代码或应用程序通过操作系统执行。此外,各种其它外围设备可以连接到计算机平台,例如其它数据存储器件和打印设备。
附图中的流程图和框图显示了根据本发明的不同实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
尽管参考示例性实施例详细描述了本发明,但所属技术领域的技术人员应该理解,可以对本发明进行各种修改和替代而不偏离所附权利要求中给出的本发明的精神和范围。
Claims (13)
1.一种用于针对值序列选择分析过程的计算机实现的方法,所述方法包括以下步骤:
在计算机显示器上显示值序列;
接收一个或多个由用户提供的注释序列,其中所述注释覆盖所述计算机显示器上的所述值序列的至少一个子区间;
使用所述用户提供的注释序列从一组值序列分析方法中选择最佳值序列分析方法,其中选择最佳值序列分析方法包括确定所述最佳值序列分析方法的参数值;以及
向所述用户呈现所选择的最佳值序列分析方法和参数以及所述注释序列的最佳重构。
2.根据权利要求1的方法,还包括在向所述用户呈现所选择的最佳值序列分析方法之后,从所述用户处接收用户提供的附加注释序列,以及从一组值序列分析方法中选择最佳地重构所述用户提供的注释序列的另一最佳值序列分析方法。
3.根据权利要求1的方法,还包括在所述计算机显示器上显示多个值序列,其中至少一个由用户提供的注释序列连接不同值序列中的点。
4.根据权利要求1的方法,其中所述值序列是时间序列,并且还包括根据用户提供的注释序列将所述时间序列划分为段。
5.根据权利要求4的方法,其中选择最佳地重构所述用户提供的注释序列的最佳值序列分析方法包括针对所述用户注释的段,确定最小化所述段中的时间序列点与所述用户注释之间的误差的最佳过滤器。
6.根据权利要求4的方法,其中选择最佳地重构所述用户提供的注释序列的最佳值序列分析方法包括针对所述用户未注释的段,标识相似的已注释的段,并且确定最小化所述未注释的段与所述已注释的段中的时间序列点之间的误差的最佳过滤器。
7.根据权利要求6的方法,其中根据所述未注释的段和所述已注释的段的方差和频率分布而标识相似的已注释的段。
8.根据权利要求6的方法,其中根据由所述最佳过滤器过滤之前和之后的所述未注释的段之间的误差分布而标识相似的已注释的段。
9.根据权利要求6的方法,还包括根据每个段的总体特性,将未针对其标识相似的已注释的段的所有段聚集成一个或多个群集,以及向所述用户呈现每个群集的表示以便注释。
10.根据权利要求1的方法,还包括提取最大程度地关联用户提供的不同注释序列的特性。
11.根据权利要求10的方法,其中所述特性包括滞后值和窗口宽度中的一个或多个。
12.根据权利要求1的方法,其中所述最佳值序列分析方法最佳地重构所述用户提供的注释序列。
13.一种用于针对值序列选择分析过程的系统,所述系统包括被配置为执行权利要求1至12中的任一权利要求的方法步骤的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/677,937 | 2012-11-15 | ||
US13/677,937 US9183649B2 (en) | 2012-11-15 | 2012-11-15 | Automatic tuning of value-series analysis tasks based on visual feedback |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103823667A true CN103823667A (zh) | 2014-05-28 |
CN103823667B CN103823667B (zh) | 2017-03-01 |
Family
ID=50681274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310563640.9A Active CN103823667B (zh) | 2012-11-15 | 2013-11-14 | 根据可视反馈自动调整值序列分析任务的方法和系统 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9183649B2 (zh) |
CN (1) | CN103823667B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USD682304S1 (en) * | 2012-01-06 | 2013-05-14 | Path, Inc. | Display screen with graphical user interface |
US10223175B2 (en) | 2016-10-10 | 2019-03-05 | International Business Machines Corporation | Modifying a device based on an annotated time series of sensor readings |
US10216695B1 (en) * | 2017-09-21 | 2019-02-26 | Palantir Technologies Inc. | Database system for time series data storage, processing, and analysis |
US11042786B2 (en) | 2018-03-30 | 2021-06-22 | Mitsubishi Electric Corporation | Learning processing device, data analysis device, analytical procedure selection method, and recording medium |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5912656A (en) * | 1994-07-01 | 1999-06-15 | Ohmeda Inc. | Device for producing a display from monitored data |
US6792400B2 (en) | 2000-12-18 | 2004-09-14 | General Motors Corporation | Visualization of complex system interactions |
US7890198B1 (en) * | 2004-06-15 | 2011-02-15 | The Mathworks, Inc. | Tool for design of multiple single-input-single-output control loops |
US20060190184A1 (en) * | 2005-02-23 | 2006-08-24 | Incogen, Inc. | System and method using a visual or audio-visual programming environment to enable and optimize systems-level research in life sciences |
US20060245641A1 (en) * | 2005-04-29 | 2006-11-02 | Microsoft Corporation | Extracting data from semi-structured information utilizing a discriminative context free grammar |
US7487465B2 (en) * | 2006-01-06 | 2009-02-03 | International Business Machines Corporation | Application clippings |
EP2074505A4 (en) * | 2006-10-05 | 2010-01-13 | Splunk Inc | CHRONOLOGICAL SERIES SEARCH ENGINE |
US7865254B2 (en) * | 2007-01-11 | 2011-01-04 | The Mathworks, Inc. | Modeling of control systems with open-loop representations and factorization of components |
US8467888B2 (en) * | 2009-06-05 | 2013-06-18 | The Mathworks, Inc. | Automated PID controller design |
JP5431235B2 (ja) * | 2009-08-28 | 2014-03-05 | 株式会社日立製作所 | 設備状態監視方法およびその装置 |
CN101660372A (zh) | 2009-09-17 | 2010-03-03 | 贾群 | 信号锁工具 |
US8214063B2 (en) * | 2009-09-29 | 2012-07-03 | Kollmorgen Corporation | Auto-tune of a control system based on frequency response |
-
2012
- 2012-11-15 US US13/677,937 patent/US9183649B2/en not_active Expired - Fee Related
-
2013
- 2013-11-14 CN CN201310563640.9A patent/CN103823667B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103823667B (zh) | 2017-03-01 |
US9183649B2 (en) | 2015-11-10 |
US20140132627A1 (en) | 2014-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brodu et al. | Exploring two novel features for EEG-based brain–computer interfaces: Multifractal cumulants and predictive complexity | |
CN102411583B (zh) | 一种文本匹配方法及装置 | |
Liu et al. | Time-aware click model | |
US20180060426A1 (en) | Systems and methods for issue management | |
KR101897080B1 (ko) | 의료 기록 문서에서의 의료 단어의 연관 규칙 생성 방법 및 그 장치 | |
CN106484777A (zh) | 一种多媒体数据处理方法以及装置 | |
Zhou et al. | Physiological indicators for user trust in machine learning with influence enhanced fact-checking | |
CN104346419A (zh) | 数据库分析装置及方法 | |
CN103823667A (zh) | 根据可视反馈自动调整值序列分析任务的方法和系统 | |
CN110019806A (zh) | 一种文档聚类方法及设备 | |
Duflou et al. | Systematic innovation through patent based product aspect analysis | |
CN113886697A (zh) | 基于聚类算法的活动推荐方法、装置、设备及存储介质 | |
Kuri et al. | Understanding Software Quality Metrics for Virtual Reality Products-A Mapping Study | |
GB2576663A (en) | Validation of search query in data analysis system | |
Cavallo et al. | Track Xplorer: A System for Visual Analysis of Sensor‐based Motor Activity Predictions | |
KR20180052243A (ko) | 클릭 로그 데이터를 이용하여 이상 사용자를 검출하는 방법 및 장치 | |
CN111344804A (zh) | 用于显示电子健康记录的系统和方法 | |
Dubey et al. | Wikigaze: Gaze-based personalized summarization of wikipedia reading session | |
Zhang et al. | On the cost of interactions in interactive visual machine learning | |
Wang et al. | Research on opinion spam detection by time series anomaly detection | |
Juneja | Identifying, measuring and contesting algorithmically curated misinformation | |
CN112200602A (zh) | 用于广告推荐的神经网络模型训练方法及装置 | |
CN110309062A (zh) | 用例生成方法、装置、电子设备及存储介质 | |
Pan et al. | An enhanced hal-based pseudo relevance feedback model in clinical decision support retrieval | |
Mehla | Application of Deep Learning in Big Data Analytics for Healthcare Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |