CN101385062B - 重叠密度(od)热图及一致性数据显示 - Google Patents
重叠密度(od)热图及一致性数据显示 Download PDFInfo
- Publication number
- CN101385062B CN101385062B CN200780005979XA CN200780005979A CN101385062B CN 101385062 B CN101385062 B CN 101385062B CN 200780005979X A CN200780005979X A CN 200780005979XA CN 200780005979 A CN200780005979 A CN 200780005979A CN 101385062 B CN101385062 B CN 101385062B
- Authority
- CN
- China
- Prior art keywords
- data
- array
- overlapping
- value
- number percent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- User Interface Of Digital Computer (AREA)
- Image Generation (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
以有益地简化较大数据集中的趋势可视化的方式生成或提供多个数据集的重叠显示的系统和方法。可对多个类似数据集生成2维事件计数阵列。阵列中的每个元素的值是对应的数据值对x、y在N个数据集中出现的次数,其中每个数据元素对应于x与y数据值的离散间隔。一旦生成阵列,就可通过将期望重叠百分比与每个阵列元素的值作比较来生成重叠密度的图形显示。具有满足期望重叠百分比的值的那些阵列元素作为显示对象使用表示重叠百分比的变化程度的一种或多种色彩、阴影和/或图案来再现。
Description
发明背景
本发明一般涉及数据显示,尤其涉及多个重叠数据集的显示。
在许多领域中,科学家必须了解并找到较大数据量的图案。这种情况的一个示例是新陈代谢学领域,新陈代谢的研究响应于诸如药物或疾病等扰动而变化。新陈代谢学融合统计分析和分析化学技术,诸如核磁共振(NMR)谱学、质谱学(MS)和色谱学。新陈代谢学可导致对许多疾病的更容易、更快和更准确的诊断,因此被预测将成为药物发现和开发的焦点。
通常,当同时显示较大数据量时,使用传统显示系统显现数据中的趋势会是十分困难的(如果并非不可能)。例如,图1示出多个IR光谱的传统图形表示的示例。对每个光谱任意地指派不同且唯一的颜色。虽然不同光谱之间存在明显的重叠,但是使用传统层叠数据显示类型来显现所显示的IR光谱中的最高重叠区是十分困难的(如果并非不可能)。
因此,提供克服以上和其它问题的系统和方法是合需的。此类系统和方法应当提供对重叠数据的有益显示,以及应当允许灵活操作数据显示以提供经提升的数据挖掘和趋势显现能力。
发明概述
本发明提供以有益地简化较大数据集中的趋势可视化的方式生成或提供多个数据集的重叠显示的系统和方法。通常,本发明可应用于期望被显示的任何数据类型的图形显示。例如,本发明可用于分析来自诸如化学信息学、分析信息学、新陈代谢学、化学计量学、基因组学、蛋白质组学及其它的学科的较大量图形数据并适用于包括生命科学和诊断学的科学研究的所有分支。
根据本发明,2维事件计数阵列是针对多个类似数据集生成的。阵列中的每个元素的值表示对应的数据值对x、y在N个数据集中出现的次数,其中每个阵列元素对应于x与y数据值的离散间隔。在一个方面,事件计数过程类似于在所有要被处理的数据集的组合显示上放置2维阵列和对于每个阵列元素计数具有落在相应阵列元素的x-y范围内的数据的数据集的数目。一旦生成阵列,就可通过将期望重叠百分比与每个阵列元素的值作比较来生成重叠密度的图形显示。具有满足期望重叠百分比的值的那些阵列元素作为显示对象被再现。例如,在一个方面,表示特定重叠百分比或重叠百分比范围的OD热图对象可被显示为从用于指示所有N个数据集之间最高重叠区的一种特定色彩、阴影或图案到用于指示所有集之间最低重叠区的第二色彩、阴影或图案且具有指示中间(intermediate)重叠区的色彩、阴影或图案的区域的一种或多种色彩、阴影和/或图案的范围。
根据本发明的一个方面,提供用于生成用来显示多个类似数据集的数据的方法。该方法通常包括:接收N个数据集,每个数据集包括表示量x和y的两对或多对数据值;以及通过对每个阵列元素确定事件计数值M来生成包括X乘Y个元素的事件计数阵列,其中每个事件计数值M是对应数据值对x、y在N个数据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散间隔。该方法还通常包括:接收重叠密度的指示,所述指示表示标识数据重叠百分比的范围;确定落在所标识的重叠百分比范围内的阵列元素;以及生成用于表示阵列中落在所标识的数据重叠百分比范围内的元素的图形显示的图形数据。在某些方面,该指示可标识0%与100%之间的数据重叠百分比范围,其中对应显示表示2个和所有数据集之间的并集。在某些方面,指示标识等于100%的数据重叠百分比,其中显示表示所有N个数据集的交集。在某些方面,指示标识等于0%的数据重叠百分比,其中显示表示所有N个数据集的差异,或所有N个数据集上的唯一值。
根据本发明的另一方面,提供了包括在由处理器执行时控制该处理器生成用于再现多个类似数据集的显示的图形数据的代码的计算机可读介质。该代码通常包括用于生成N个数据集的事件计数阵列的指令,每个数据集包括表示量x和y的两对或多对数据值,阵列通过对每个阵列元素确定事件计数值M来包括X乘Y个元素,其中每个事件计数值M是对应数据值对x、y在该N个数据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散间隔。该代码通常还包括响应于用户输入重叠密度的指示确定落在所标识的重叠百分比内的阵列元素的指令,其中该指示标识数据重叠百分比。该代码通常还包括生成用于表示阵列中落在所标识的数据重叠百分比内的元素的图形显示的图像数据的指令。在某些方面,指示可标识0%与100%之间的数据重叠百分比范围,其中对应显示表示2个和所有N个数据集之间的并集。在某些方面,指示可标识等于100%的数据重叠百分比,其中显示表示所有N个数据集的交集。在某些方面,指示可标识等于0%的数据重叠百分比,其中显示表示所有N个数据集的差异,或所有N个数据集上的唯一值。
参看说明书包括附图和权利要求的其余部分将实现本发明的其它特征和优点。在以下参照附图详细描述本发明的其它特征和优点以及本发明的各个实施例的结构和操作。在附图中,类似附图标记指示相同或功能上类似的元素。
附图简述
图1示出传统层叠显示中的25个IR光谱——所有正烷烃和支链烷烃。
图2示出根据本发明的实施例的用于生成多个数据集或数据对象的重叠显示的过程的结果。
图3示出生成两个数据集的4×4事件计数阵列的简化示例。
图4示出图1中所示的IR光谱按照具有设在0的OD标度值的OD热图的显示。
图5示出图1中所示的IR光谱按照具有设成100的OD标度值的OD热图的显示。
图6示出图1中所示的IR光谱按照具有设成50的OD标度值的OD热图的显示。
图7示出图1中所示的IR光谱按照表示所有光谱区中最大值的单一一致性(CONSENSUS)IR光谱的OD一致性的显示,其中OD标度值=50,即其中50%的光谱对象重叠。
图8示出图1中所示的IR光谱按照具有设成-100的OD标度的OD热图的显示。
图9示出根据一个方面的允许用户选择不同显示类型和参数的滑条。
图10示出根据一个方面的具有允许用户选择最小值(Min)和最大值(Max)截至电平两者的各个滑臂的滑条。
发明详细描述
本发明提供以有益地简化较大数据集中的趋势可视化的方式生成或提供多个数据集的重叠显示的系统和方法。通常,本发明可应用于期望被显示的任何数据类型的图形显示。
在某些方面,例如,本发明可用于估计和发现较大数据集中的趋势和公共性,这些数据集包括以下图形对象类型:圆二向色性(CD);电导测定法;电量分析;由凝胶电泳导致的密度图(densitogram)等;差示扫描量热法(DSC);差示热分析(DTA);电子自旋共振(ESR);由凝胶电泳导致的电泳图谱等;气相色谱图(GC);高性能液相色谱图(HPLC);直方图;红外(IR)光谱图;离子迁移率光谱测定法(IMS);液相色谱图(LC);质谱(MS);核磁共振(NMR);旋光分散(ORD);极谱法;电势测定法;拉曼光谱;超临界流体(SCF)谱法图;热重量分析(TGA);紫外-可见光(UV-Vis)光谱图;伏安法;X射线荧光(XRF)光谱图;X射线粉末衍射(XRPD);X-Y线图;X-Y散布图以及其它。
在一方面,本发明可应用于处理数据集,其中每个数据集包括多个数据点——各自具有一对表示感兴趣的分析量的值。可在具有表示感兴趣的一个量的一个轴和表示另一感兴趣的量的另一个轴的二维坐标系中表示这种数据集。例如,在IR光谱的情形中,成对的值可表示频率(或波长)和强度值。图1示出多个IR光谱的传统图形表示的一个示例,其中x轴表示波长值而y轴表示强度值(归一化)。对每个光谱任意地指派不同且唯一的色彩。虽然不同光谱之间存在明显的重叠,但是使用这种传统层叠数据显示类型来显现所显示对象(所显示的IR光谱)中的最高重叠区是十分困难的(如果并非不可能)。如以下所讨论的,本发明的技术实现图形对象的重叠的经提升的可视化程度。
类似地,在另一方面,本发明可应用于处理数据集,其中每个数据集包括多个数据点——各自具有表示感兴趣的分析量的3个(或更多个)值。此类数据集可在3(或更多)维坐标系——并且各个轴表示3种数据值类型中之一——中显示。此类数据集也可在二维坐标系中观看,并且3(或更多个)数据值中的两个被用于定义2维坐标系。在二维坐标系中观看此类数据集类似于获取3(或更多)维图像的横截切片。因此,应当理解,本发明可应用于表示3(或更多)维的视觉显示。然而,出于简便的目的,以下讨论经集中在2维视觉数据显示。
根据本发明,一般地参照图2描述用于生成多个数据集或数据对象的重叠显示的过程100的实施例。在步骤110,多个数据集被接收到或被另外采集。在某些方面,数据集应当包括沿轴连续且以离散间隔等距隔开的数据。例如,在图1中,IR光谱数据包括以大致4cm-1的离散间隔沿x轴的连续数据(波数)。
在其中在驻留于数据采集设备——诸如IR光谱仪——内的智能模块(例如,执行指令的处理器)中实现过程100的情形中,当在收集数据时,数据集可被实时地提供到智能模块,或者它可被存储在存储器单元或缓冲器中并在实验完成之后被提供给智能模块。类似地,数据集可经由到采集设备的网络连接(例如,LAN、VPN、内联网、因特网等)或直接连接(例如,USB或其它直接有线或无线连接)被提供给诸如台式计算机系统或其它计算机系统的单独系统,或者被提供到诸如CD、DVD、软盘等便携式介质上。在某些方面,数据集各自包括具有至少一对表示感兴趣的分析量的值(或2维向量)的数据点。例如,在IR光谱的情形中,此成对的值可表示频率(或波长)和强度值。在步骤110中已接收到或采集到数据集之后,数据集可被处理。
在步骤120,数据集任选地可被归一化。例如,在一个方面,数据集被归一化到相同的x-y分辨率。当被处理的所有数据集是由同一仪器来提供时,此步骤可能并非必需的,因为所有数据集将很可能具有相同x-y分辨率。然而,x和/或y值可通过将最大值设置为诸如1或100的任意值或通过将整个数据集除以最大值并乘以任意值来归一化。另外,应当理解,数据集可在步骤110之前被归一化。例如,单独过程或系统可将数据集归一化并提供经归一化的数据集进行处理以及重叠和一致性显示的生成。
在步骤130,执行事件计数过程。在一个方面,生成事件计数的2维阵列。在此方面,数据集被分成相同的x轴范围和相同的y轴范围。例如,x轴可分成1000个离散间隔而y轴可分成1000个离散间隔,对应于大小为1000×1000(106个阵列元素)的事件计数阵列,或者x轴可分成1000个离散间隔而y轴可分成500个离散间隔,对应于大小为1000×500(5×105个阵列元素)的事件计数阵列。通常,x轴和y轴间隔可以是相同的或者它们可以是不同的。而且,事件计数阵列可以是任何大小的,诸如具有最多达106、108、1010或更多数目的阵列元素。事件计数过程类似于在所有要被处理的数据集的组合显示上放置2维阵列以及对于每个阵列元素计数具有落在阵列元素的x-y范围内的数据的数据集的数目。
图3示出生成两个数据集的4×4事件计数阵列的简化示例。图3a示出绘制在x-y坐标系中的两个数据集。如图所示,绘图横跨4个x值间隔以及4个y值间隔——对应于总共16个阵列元素。图3b示出每个单独数据集的事件计数阵列;在此示例中,根据数据集是否包括落在阵列元素的x-y范围内的数据,对4×4阵列中的每个阵列元素指派1或0。图3c示出两个数据集的组合事件计数阵列。如可看到的,取决于数据集是否包括阵列元素范围中的数据,每个阵列元素具有值0、1或2。在一个方面,当生成事件计数阵列时,每个阵列元素将具有范围为从0到N——应用事件计数过程的数据集的数目——的值M。事件计数阵列中具有N值的任何阵列元素表示为所有N个数据集共有的数据点;类似地,具有0值的阵列元素表示不包括在N个数据集中的数据点。中间值(M=1到N-1)表示为N个数据集中的1个或多个、但并非全部所共有的数据点。具体阵列元素的公共性程度可通过将特定阵列元素值的值M除以被处理的数据集的数目N来确定:
M/N=公共性程度。
如果M/N=1,被处理的所有数据集包括由阵列元素表示的数据值;在由阵列元素表示的x-y数据值范围内存在所有数据集的完全重叠。类似地,如果M/N<1,则是少于完全重叠。如果M/N=0,则没有数据集包括落在由阵列元素表示的x-y数据值范围内的数据。最大M值Mmax以及还有由此的事件计数阵列的最大M/N值(M/N)max也可用于确定在如将在以下更详细讨论地再现重叠显示时使用的重叠程度。类似地,事件计数阵列的最小M值(M/N)min也可用于确定重叠程度。
在某些方面,可在生成事件计数阵列时使用内插值。例如,在其中数据集仅包括500个x值——对于1000×1000的事件计数阵列——的情形中,可实现内插过程(例如,使用最小二乘方过程、三次样条插值过程等)来提供内插数据值。而且,可使用阵列元素附近的2(或更多)个数据值的简单平均值。
参看图2,在步骤140,生成重叠显示。在一个方面,用户可选择显示类型以及要被显示的重叠程度。显示类型包括如将在以下更详细讨论的重叠密度热图(OD热图)显示和重叠密度一致性(OD一致性)显示。在此步骤,要求将期望被显示的重叠程度作为输入参数。作为默认,可提供指示完全重叠的参数。在一个方面,重叠可通过用户使用如图4-9中所示以及在以下更详细描述的滑块10来选择。
在一个方面,OD热图的显示可在显示设备——例如与处理数据集的智能模块耦合的显示器——上再现。如本文中所用的,OD热图是表示重叠数据对象的对象。在一个方面,OD热图被显示为从用于指示所有N个数据对象(OBJECT)之间最高重叠区的一种特定色彩、阴影或图案到用于指示所有对象之间最低重叠区的第二色彩、阴影或图案且具有指示中间重叠区的色彩、阴影或图案的区域的色彩、阴影和/或图案的区域。通常,“对象”指数据集,无论其是接收到的数据集或经处理的数据集,例如,OD热图对象或OD一致性对象。任何对象自身可用于后续处理,例如,使用OD一致性对象作为与其它数据对象比较的标准。
OD热图可被定义成显示定义了所有对象的并集(UNION)的重叠对象的所有区、为所有对象所共有的重叠对象的区(交集)、或者并集或交集之间由对象在每个重叠对象的区中的重叠百分比定义的任何区域。在另一方面,OD热图可被定义成显示唯一或不同的、或者具有极少或没有公共部分的的对象区,如以下所讨论的。
在一个方面,从I到J以及从J到K的数字OD标度被用于定义OD热图,其中K表示其中所有N个对象上100%的对象重叠(交集;(M/N)max)的数据,J表示所有数据(并集;M/N>0),而J与K之间的中间值表示并集与交集之间的某一区域。类似地,I表示其中没有数据重叠(并集减所有交集;(M/N)min)的数据,而I与J之间的中间值表示并集与(并集减所有交集)之间的某些区域。I、J和K可以是任何任意值,诸如I=-100,J=0以及K=100。
为了确定要为OD热图显示的色彩,在一个方面,经归一化的事件计数值例如通过将每个阵列值M乘以(色彩的数目-1)/Mmax来确定并与色彩标度相匹配。例如,对于16种色彩(4比特的色彩标度),将每个阵列元素值乘以15/Mmax。以下给出OD热图显示示例和用于确定热图对象和显示色彩的样本代码。在某些方面,用户可选择用于再现显示的OD标度值和/或色彩标度。
在另一方面,可再现OD一致性的显示。在一个方面,OD一致性是表示在OD标度值下的所有数据集(对象)上的最大值的对象。可创建OD一致性,或者用户可通过指定重叠密度的量(例如,在OD标度上I=交集减所有并集、J=并集以及K=交集的任意标度上的)并基于所有对象在给定OD标度值下的最大密度值创建单个对象来将任何OD热图转换成OD一致性。OD一致性可用作对象,例如,作为与其它数据对象作比较的标准。以下给出OD一致性显示示例和用于确定一致性对象的样本代码。
图4-8示出根据本发明的使用具有分别设成任意值-100、0和100的I、J和K的OD标度的OD热图和OD一致性显示的示例。图4示出图1中所示的IR光谱按照具有设在0的OD标度值的OD热图的显示。使用设在0(并集)的OD标度值,OD热图的所有区域都被显示而不管重叠密度水平如何。在此示例中,表示所有光谱对象100%重叠(OD标度=100)的光谱区被显示为红色(针对此示例任选的;色彩可以是用户定义的),被单个光谱覆盖(OD标度=-100)的光谱区被显示为紫色(针对此示例任选的;色彩可以是用户定义的),而表示中间重叠密度水平的所有光谱区由从红色到紫色范围内的色彩来表示。
图5示出图1中所示的IR光谱按照具有设在100的OD标度值的OD热图显示的显示。使用设在100的OD标度,仅存在于被比较的对象集合中的所有对象中的那些光谱区被显示。换言之,仅图4中显示为纯粹红色的那些值被显示在图5中。图5清晰地示出为集合中所有光谱所共有的区域。
图6示出图1中所示的IR光谱按照具有设在50的OD标度值的OD热图显示的显示。使用设在50的OD标度,其中50%或更多光谱区重叠的IR光谱区域被显示。即,具有M/Mmax值大于或等于0.5的IR光谱事件计数阵列的区域被显示。图6清晰地示出光谱集合中最公共的区域。
图7示出表示所有光谱区的最大值的单个一致性IR光谱的OD一致性显示,其中OD标度值=50,即,其中50%的光谱对象重叠。这对应于图6中所显示的热图对象的最大值。
图8示出图1中所示的IR光谱按照具有设在-100的OD标度值的OD热图显示的显示。使用设在-100的OD标度,其中0%的光谱区重叠的IR光谱区域被显示。即,仅没有重叠的数据(并集减所有交集;(M/N)min))被显示。
在一个方面,用户能够将OD标度值图形地调节成I与J之间的任何值——例如-100到0之间的任何小数——以及J与K之间的任何值——例如0到100之间的任何小数。例如,这可通过用户例如,使用鼠标、键盘或其它选择设备与在显示的右侧的图形滑块交互来实时地进行,以便与图9中所示并在图4-8中的右侧的滑块10交互。如图所示,滑块10允许用户在“公共”、“全部”和“唯一”水平之中或之间进行选择。在一个方面,“全部”水平显示所有OD水平的整体OD热图。在一个方面,选择“公共”水平,仅显示为100%的对象所共有的那些区域,即,具有最高OD水平的那些对象。向上朝标度的“公共”水平移动滑块将移除越来越多的最低OD水平的信息。选择“唯一”水平仅显示完全特有并与任何其它对象没有任何公共部分的那些区域,即,具有最低OD水平的那些对象。向下朝“唯一”移动滑块将移除越来越多的最高OD水平的信息。例如,对于图1中所显示的IR光谱,如果用户从滑块10选择“公共”,则将显示类似于图5的显示(交集)。类似地,如果用户从滑块10选择“全部”,则将显示类似于图4的显示(并集)。如果用户从滑块10选择“唯一”,则将显示类似于图8的显示(OD差异;并集减所有交集;(M/N)min)。
以下示出根据一个方面的配置成使用图4-7所示的显示滑块10的J到K滑块部分对x-y值的光谱(2维)向量的输入阵列执行操作130和140的代码的示例:
//输入:光谱向量阵列,全部被归一化成包含X数目个数据点
//heatmap_array(热图_阵列):指定成包含X*Y个元素,其中Y取决于输入向量的分辨率(256或1024)。
//spectrurn_vector(光谱_向量):数据向量的输入阵列,被归一化成从0到1
//计算热图阵列(事件计数)
for int x=1 to X
for int y=1 to Y
heatmap_array[x][y]=0
end for
end for
for int i=1 to number_of_vectors
for int x=1 to X
for int y=1 to spectrum_vector[i][x]*Y
heatmap_array[x][y]+=1
end for
end for
end for
//计算最大热图值以进行归一化
int max_val=0
for int x=1to X
for int y=1 to Y
ifheatmap_array[x][y]>max_val then
max_val=heatmap_array[x][y]
end for
end for
//色彩梯度阵列
COLOR colors[NUM_COLS]
//截止:高于其将绘制热图像素的阈值(范围从0到1)
//绘制画面
forint x=1 to X
forint y=1 to Y
if heatmap_array[x][y]/max_val>cutoff then
DrawPixel(x, y,
colors[heatmap_array[x][y]*(NUM_COLS-1)/max_val])
end for
end for
//生成归一化的一致性光谱
int consensusVector[X]
for int x=1to X
consensusVector[x]=0
for int y=Y to 1step-1
if heatmap_array[x][y]/max_val>cutoff then
consensusVector[x]=y-1
break for
end if
end for
end for
根据另一方面,对于x-y-z值的光谱(3维)向量的输入阵列——其中热图阵列被指定成包含X*Y*Z个元素——以上的代码部分可类似:
//计算热图阵列
for int x=1 to X
for int y=1 to Y
for int z=1 to Z
heatmap_array[x][y][z]=0
end for
end for
end for
for int i=1 to number_of_vectors
for int x=1 to X
for int y=1 to Y
for int z=1to spectrum_vector[i][x][y]*Z
heatmap_array[x][y][z]+=1
end for
end for
end for
end for
//计算最大热图值以进行归一化
int max_val=0
for int x=1 to X
for int y=1 to Y
for int z=1 to Z
if heatmap_array[x][y][z]>max_val then
max_val=heatmap_array[x][y][z]
end for
end for
end for
在此方面,3维图形OD热图和OD一致性显示可被生成或再现,或者可通过选择适当的X-Y、X-Z或Y-Z热图阵列元素(例如,将z、y或x设置成特定值)来生成2维显示。
根据一个方面,配置成生成显示和生成用于与图9中所示的整个显示滑块10一起使用的归一化一致性光谱的代码的示例示出如下:
//minCutoff(最小截止):在高于其将绘制热图像素的阈值(范围可从0到maxCutoff(最大截止))
//maxCutoff:低于其将绘制热图像素的阈值(范围可从minCutoff到1)
//绘制画面
for int x=1 to X
int yDraw=1;
for int y=1 to Y
double val=heatmap_array[x][y]/max_val
if val>minCutoff AND val<=maxCutoff then
DrawPixel(x, yDraw,
colors[heatmap_array[x][y]*(NUM_COLS-1)/max_val])
yDraw+=1
end if
end for
end for
//生成归一化的一致性光谱
int consensusVector[X]
for int x=1 to X
consensusVector[x]=0
int maxY=Y
for int y=1 to Y
if heatmap_array[x][y]/max_val<=maxCutoff then
maxY=y
break for
end if
end for
for int y=Y to 1 step-1
if heatmap array[x][y]/max_val>minCutoff then
consensusVector[x]=y-maxY
break for
end if
end for
end for
类似地,用于生成3维向量归一化一致性表面的代码的示例可类似:
//生成归一化的一致性表面区域
int consensusSurface[X][Y]
for int x=1 to X
for int y=1 to Y
consensus Surface[x][y]=0
int maxZ=Z
for int z=1to Z
if heatmap_array[x][y][z]/max_val<=maxCutoff then
maxZ=z
break for
end if
end for
for int z=Z to 1step-1
if heatmap_array[x][y][z]/max_val>minCutoff then
consensusSurface[x][y]=z-maxZ
break for
end if
end for
end for
end for
根据又一个方面,如图10中所示,提供了具有用于最小(Min)和最大(Max)水平的各个滑臂的滑条。对于以上代码,“Min”和“Max”滑臂允许用户选择“MinCutoff(最小截止)”和“MaxXCutoff(最大截止)”值。例如,对于图1中所显示的IR光谱,如果用户选择图10(1)中所示的配置,则将显示类似于图4的显示(并集)。类似地,如果用户选择图10(2)中所示的配置,则将显示类似于图5的显示(交集)。如果用户选择图10(3)中所示的配置,则将显示类似于图8的显示(并集减所有交集)。选择“MinCutoff”和“MaxCutoff”的中间值将产生所选重叠范围的显示。回顾图4-9,应当理解,滑块10被配置成允许用户在“MaxCutoff”值被设在100(或100%)的情况下调节“MinCutoff”。
应当理解,本发明的过程或其部分可在运行于处理器或计算机系统上的计算机代码中实现。代码包括用于控制一个处理器或多个处理器来实现过程100的各个方面和步骤的指令。代码可通常被存储在硬盘、ROM、RAM或诸如CD、DVD等的便携式介质上。类似地,过程100或其部分可在数据采集设备——包括执行存储在耦合至处理器的存储器单元中的指令的处理器——中实现。包括此类指令的代码的部分或全部可以可通过到代码源的有线和/或无线网络连接或者直接连接传送或下载到数据采集设备存储器单元、或者可另外使用众所周知的便携式介质提供的载波信号来体现。在某些方面中,本发明的过程可使用诸如C、C++、C#、Fortran、VisualBasic等各种编程语言以及诸如可提供用于数据可视化和分析的预封装例程、函数或程序的的应用来编码。后者的一个示例是
本发明的OD显示系统和方法可在各种科学和统计的实验领域中直接应用。例如,在新陈代谢学领域中,OD显示系统和方法允许研究人员通过使用来自所收集的由统计分析中分类的每个疾病状态产生的光谱或色谱的OD一致性来为统计分析中分类的每个疾病状态自动创建生物标志。结果OD一致性光谱或色谱允许研究人员通过对照由OD一致性光谱或色谱设置的标准比较未知光谱或色谱来诊断疾病状态。OD差异显示在例如新陈代谢学中也是有益的。
虽然已作为示例并根据特定实施例描述了本发明,但是应当理解,本发明并不限于所公开的实施例。相反,它旨在涵盖各种更改和类似布置,这对于本领域技术人员是显而易见的。因此,所附权利要求的范围应当被授予最宽泛的解释以包括所有这些更改和类似布置。
Claims (24)
1.一种显示多个类似数据集的方法,所述方法包括:
接收N个数据集,每个数据集包括表示量x和y的两对或多对数据值;
通过对每个阵列元素确定事件计数值M来生成包括X乘Y个元素的事件计数阵列,其中每个阵列元素对应于x和y数据值的离散间隔,所述离散间隔为x-y范围,其中每个事件计数值M是相应离散间隔内的数据值对x、y在所述N个数据集中出现的次数;
接收重叠密度的指示,所述指示标识数据重叠百分比;
确定落在所标识的重叠百分比内的所述阵列元素;以及
生成用于表示所述阵列中落在所标识的数据重叠百分比内的所述元素的图形显示的图形数据。
2.如权利要求1所述的方法,其特征在于,还包括将所述N个数据集归一化成相同的X和Y尺度。
3.如权利要求2所述的方法,其特征在于,归一化是在所述接收步骤之后执行的。
4.如权利要求2所述的方法,其特征在于,归一化是在所述接收步骤之前执行的。
5.如权利要求1所述的方法,其特征在于,所述图形显示是表示所述阵列中具有所标识的重叠百分比的所有元素的重叠密度热图显示,其中具有不同的事件计数值范围的元素以不同色彩、阴影和/或图案来显示。
6.如权利要求5所述的方法,其特征在于,所述指示标识0%与100%之间的数据重叠百分比范围,并且其中所述显示表示多个数据集的并集。
7.如权利要求5所述的方法,其特征在于,所述指示标识等于100%的数据重叠百分比,并且其中所述显示表示所有N个数据集的交集。
8.如权利要求5所述的方法,其特征在于,所述指示标识等于0%的数据重叠百分比,并且其中所述显示表示所有N个数据集的差异。
9.如权利要求1所述的方法,其特征在于,所述图形显示是表示所述阵列中具有所标识的重叠百分比的所有元素上的每一数据值对x、y的最大值y的重叠密度一致性显示。
10.如权利要求1所述的方法,其特征在于,确定包括:
对所述整个阵列确定最大事件计数值Mmax,其中Mmax≤N;以及
对于每个阵列元素,将所述指示与M/Mmax作比较以确定所述元素是否落在所标识的重叠百分比内。
11.如权利要求1所述的方法,其特征在于,所述指示是由用户输入的。
12.如权利要求11所述的方法,其特征在于,所述接收到的指示包括最小值,并且其中最大值是预置的。
13.如权利要求11所述的方法,其特征在于,所述接收到的指示包括最小值和最大值。
14.如权利要求11所述的方法,其特征在于,所述接收到的指示是由所述用户实时调节的。
15.如权利要求1所述的方法,其特征在于,是在驻留于或耦合至数据采集设备中的处理器中实现的。
16.如权利要求1所述的方法,其特征在于,还包括使用所述图形数据在显示设备上再现所述图形显示。
17.一种用于生成用来再现多个类似数据集的显示的图形数据的设备,包括:
用于生成N个数据集的事件计数阵列的装置,每个数据集包括表示量x和y的两对或多对数据值,所述阵列通过对每个阵列元素确定事件计数值M来包括X乘Y个元素,其中每个阵列元素对应于x和y数据值的离散间隔,所述离散间隔为x-y范围,其中每个事件计数值M是相应离散间隔内的数据值对x、y在所述N个数据集中出现的次数;
用于响应于用户输入重叠密度的指示确定落在所标识的重叠百分比内的所述阵列元素的装置;以及
用于生成用于表示所述阵列中落在所标识的数据重叠百分比内的所述元素的图形显示的图形数据的装置。
18.如权利要求17所述的设备,其特征在于,包括用于将所述N个数据集归一化成相同的X和Y尺度的装置。
19.如权利要求17所述的设备,其特征在于,所述指示标识0%与100%之间的数据重叠百分比范围,并且其中所述显示表示多个数据集的并集。
20.如权利要求17所述的设备,其特征在于,所述指示标识等于100%的数据重叠百分比,并且其中所述显示表示所有N个数据集的交集。
21.如权利要求17所述的设备,其特征在于,所述指示标识等于0%的数据重叠百分比,并且其中所述显示表示所有N个数据集中的唯一值。
22.如权利要求17所述的设备,其特征在于,所述图形显示是表示所述阵列中具有所标识的重叠百分比的所有元素上的每一数据值对x、y的最大值y的重叠密度一致性显示。
23.如权利要求17所述的设备,其特征在于,所述图形显示是表示所述阵列中具有所标识的重叠百分比的所有元素的重叠密度热图显示,其中具有不同的事件计数值范围的元素以不同色彩、阴影和/或图案来显示。
24.如权利要求17所述的设备,其特征在于,所述用于确定的装置用于:
对所述整个阵列确定最大事件计数值Mmax,其中Mmax≤N;以及
对于每个阵列元素,将所述指示与M/Mmax作比较以确定所述元素是否落在所标识的重叠百分比内。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/360,000 US7492372B2 (en) | 2006-02-21 | 2006-02-21 | Overlap density (OD) heatmaps and consensus data displays |
US11/360,000 | 2006-02-21 | ||
PCT/US2007/004452 WO2007098180A2 (en) | 2006-02-21 | 2007-02-21 | Overlap density (od) heatmaps and consensus data displays |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101385062A CN101385062A (zh) | 2009-03-11 |
CN101385062B true CN101385062B (zh) | 2010-10-06 |
Family
ID=38427709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780005979XA Expired - Fee Related CN101385062B (zh) | 2006-02-21 | 2007-02-21 | 重叠密度(od)热图及一致性数据显示 |
Country Status (6)
Country | Link |
---|---|
US (2) | US7492372B2 (zh) |
EP (1) | EP1994521A4 (zh) |
JP (1) | JP5290774B2 (zh) |
CN (1) | CN101385062B (zh) |
CA (1) | CA2641025C (zh) |
WO (1) | WO2007098180A2 (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7492372B2 (en) * | 2006-02-21 | 2009-02-17 | Bio-Rad Laboratories, Inc. | Overlap density (OD) heatmaps and consensus data displays |
US8463743B2 (en) * | 2009-02-17 | 2013-06-11 | Microsoft Corporation | Shared composite data representations and interfaces |
US8738584B2 (en) * | 2009-02-17 | 2014-05-27 | Microsoft Corporation | Context-aware management of shared composite data |
US8577505B2 (en) | 2010-01-27 | 2013-11-05 | Honeywell International Inc. | Energy-related information presentation system |
US8380737B2 (en) * | 2010-12-17 | 2013-02-19 | International Business Machines Corporation | Computing intersection of sets of numbers |
US20120262472A1 (en) * | 2011-04-13 | 2012-10-18 | Honeywell International Inc. | Heatmap timeline for visualization of time series data |
US8996305B2 (en) * | 2012-06-07 | 2015-03-31 | Yahoo! Inc. | System and method for discovering photograph hotspots |
US8947437B2 (en) | 2012-09-15 | 2015-02-03 | Honeywell International Inc. | Interactive navigation environment for building performance visualization |
RU2015121702A (ru) * | 2012-11-07 | 2016-12-27 | Лайф Текнолоджиз Корпорейшн | Средства визуализации данных цифровой пцр |
US9558427B2 (en) * | 2014-06-20 | 2017-01-31 | Varian Medical Systems International Ag | Shape similarity measure for body tissue |
RU2608568C2 (ru) * | 2015-02-12 | 2017-01-23 | Общество С Ограниченной Ответственностью "Яндекс" | Способ создания тепловой карты и компьютерная система для ее создания |
JP7039179B2 (ja) * | 2017-04-13 | 2022-03-22 | キヤノン株式会社 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
JP7194119B2 (ja) * | 2017-05-25 | 2022-12-21 | フロージョー エルエルシー | 大規模マルチパラメータデータセットの可視化、比較分析、及び自動差異検出 |
EP3621050B1 (en) | 2018-09-05 | 2022-01-26 | Honeywell International Inc. | Method and system for improving infection control in a facility |
US10978199B2 (en) | 2019-01-11 | 2021-04-13 | Honeywell International Inc. | Methods and systems for improving infection control in a building |
JPWO2021033620A1 (zh) * | 2019-08-21 | 2021-02-25 | ||
US11620594B2 (en) | 2020-06-12 | 2023-04-04 | Honeywell International Inc. | Space utilization patterns for building optimization |
US11783652B2 (en) | 2020-06-15 | 2023-10-10 | Honeywell International Inc. | Occupant health monitoring for buildings |
US11914336B2 (en) | 2020-06-15 | 2024-02-27 | Honeywell International Inc. | Platform agnostic systems and methods for building management systems |
US11783658B2 (en) | 2020-06-15 | 2023-10-10 | Honeywell International Inc. | Methods and systems for maintaining a healthy building |
US11823295B2 (en) | 2020-06-19 | 2023-11-21 | Honeywell International, Inc. | Systems and methods for reducing risk of pathogen exposure within a space |
US11184739B1 (en) | 2020-06-19 | 2021-11-23 | Honeywel International Inc. | Using smart occupancy detection and control in buildings to reduce disease transmission |
US11619414B2 (en) | 2020-07-07 | 2023-04-04 | Honeywell International Inc. | System to profile, measure, enable and monitor building air quality |
US11402113B2 (en) | 2020-08-04 | 2022-08-02 | Honeywell International Inc. | Methods and systems for evaluating energy conservation and guest satisfaction in hotels |
US11894145B2 (en) | 2020-09-30 | 2024-02-06 | Honeywell International Inc. | Dashboard for tracking healthy building performance |
US11372383B1 (en) | 2021-02-26 | 2022-06-28 | Honeywell International Inc. | Healthy building dashboard facilitated by hierarchical model of building control assets |
US11662115B2 (en) | 2021-02-26 | 2023-05-30 | Honeywell International Inc. | Hierarchy model builder for building a hierarchical model of control assets |
US11474489B1 (en) | 2021-03-29 | 2022-10-18 | Honeywell International Inc. | Methods and systems for improving building performance |
CN115980279B (zh) * | 2023-02-14 | 2023-05-23 | 博纯材料股份有限公司 | 氖气纯度检测系统的稳定性优化方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265958A (en) * | 1989-09-12 | 1993-11-30 | The Secretary Of State For Defence In Her Britannic Majesty's Government Of The United Kingdom And Northern Ireland | Testing device for thermal imagers |
CN1139243A (zh) * | 1995-04-18 | 1997-01-01 | 佳能株式会社 | 数据处理方法和装置 |
US5710772A (en) * | 1994-06-06 | 1998-01-20 | Nec Corporation | TDMA radio communication system |
US5886664A (en) * | 1997-04-16 | 1999-03-23 | Trw Inc. | Method and apparatus for detecting mines using radiometry |
CN1214769A (zh) * | 1996-02-02 | 1999-04-21 | 量度测试设备股份有限公司 | 无损伤性近红外光谱仪的多光谱分析方法和装置 |
CN1712955A (zh) * | 2004-06-25 | 2005-12-28 | 中国科学院大连化学物理研究所 | 一种精确测定色谱峰形参数和重叠峰面积的方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61111425A (ja) * | 1984-11-05 | 1986-05-29 | Shimadzu Corp | スペクトルパタ−ンの一致度判定法 |
JPH0774761B2 (ja) * | 1987-12-16 | 1995-08-09 | 株式会社島津製作所 | スペクトルパターンの類似度判定法 |
JPH0820361B2 (ja) * | 1990-09-14 | 1996-03-04 | 株式会社島津製作所 | スペクトルデータ同定方法 |
JPH04127039A (ja) * | 1990-09-19 | 1992-04-28 | Hitachi Ltd | 蛍光スペクトルによる物質の同定方法 |
US5710722A (en) * | 1996-05-24 | 1998-01-20 | The United States Of America As Represented By The Secretary Of The Army | Automated minimum resolvable temperature difference test for imaging infrared systems |
WO2000054307A1 (fr) * | 1999-03-05 | 2000-09-14 | Canon Kabushiki Kaisha | Dispositif de formation d'images |
US6674894B1 (en) * | 1999-04-20 | 2004-01-06 | University Of Utah Research Foundation | Method and apparatus for enhancing an image using data optimization and segmentation |
US6334099B1 (en) * | 1999-05-25 | 2001-12-25 | Digital Gene Technologies, Inc. | Methods for normalization of experimental data |
JP2003500662A (ja) * | 1999-05-25 | 2003-01-07 | ディジタル・ジーン・テクノロジーズ・インコーポレーテッド | 振幅の正規化及びデータピークの選択のための方法とシステム |
JP2001008384A (ja) * | 1999-06-21 | 2001-01-12 | Toshiba Corp | 系統画面表示装置および記録媒体 |
US6459435B1 (en) * | 2000-01-11 | 2002-10-01 | Bluebolt Networks, Inc. | Methods, systems and computer program products for generating storyboards of interior design surface treatments for interior spaces |
US8001465B2 (en) * | 2001-06-26 | 2011-08-16 | Kudrollis Software Inventions Pvt. Ltd. | Compacting an information array display to cope with two dimensional display space constraint |
US6873915B2 (en) * | 2001-08-24 | 2005-03-29 | Surromed, Inc. | Peak selection in multidimensional data |
GB0202467D0 (en) * | 2002-02-02 | 2002-03-20 | Qinetiq Ltd | Sensor with obscurant detection |
US7203716B2 (en) * | 2002-11-25 | 2007-04-10 | Simmonds Precision Products, Inc. | Method and apparatus for fast interpolation of multi-dimensional functions with non-rectangular data sets |
JP4399196B2 (ja) * | 2003-07-01 | 2010-01-13 | 日立プラズマディスプレイ株式会社 | プラズマディスプレイパネル |
US7492372B2 (en) * | 2006-02-21 | 2009-02-17 | Bio-Rad Laboratories, Inc. | Overlap density (OD) heatmaps and consensus data displays |
-
2006
- 2006-02-21 US US11/360,000 patent/US7492372B2/en not_active Expired - Fee Related
-
2007
- 2007-02-21 EP EP07751226.7A patent/EP1994521A4/en not_active Ceased
- 2007-02-21 CN CN200780005979XA patent/CN101385062B/zh not_active Expired - Fee Related
- 2007-02-21 JP JP2008556398A patent/JP5290774B2/ja not_active Expired - Fee Related
- 2007-02-21 WO PCT/US2007/004452 patent/WO2007098180A2/en active Application Filing
- 2007-02-21 CA CA2641025A patent/CA2641025C/en not_active Expired - Fee Related
-
2008
- 2008-12-17 US US12/337,530 patent/US7705854B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265958A (en) * | 1989-09-12 | 1993-11-30 | The Secretary Of State For Defence In Her Britannic Majesty's Government Of The United Kingdom And Northern Ireland | Testing device for thermal imagers |
US5710772A (en) * | 1994-06-06 | 1998-01-20 | Nec Corporation | TDMA radio communication system |
CN1139243A (zh) * | 1995-04-18 | 1997-01-01 | 佳能株式会社 | 数据处理方法和装置 |
CN1214769A (zh) * | 1996-02-02 | 1999-04-21 | 量度测试设备股份有限公司 | 无损伤性近红外光谱仪的多光谱分析方法和装置 |
US5886664A (en) * | 1997-04-16 | 1999-03-23 | Trw Inc. | Method and apparatus for detecting mines using radiometry |
CN1712955A (zh) * | 2004-06-25 | 2005-12-28 | 中国科学院大连化学物理研究所 | 一种精确测定色谱峰形参数和重叠峰面积的方法 |
Non-Patent Citations (1)
Title |
---|
CN 1139243 A,全文. |
Also Published As
Publication number | Publication date |
---|---|
US20070195092A1 (en) | 2007-08-23 |
US7492372B2 (en) | 2009-02-17 |
CN101385062A (zh) | 2009-03-11 |
US7705854B2 (en) | 2010-04-27 |
WO2007098180A3 (en) | 2008-04-24 |
CA2641025C (en) | 2013-04-16 |
CA2641025A1 (en) | 2007-08-30 |
JP5290774B2 (ja) | 2013-09-18 |
US20090096791A1 (en) | 2009-04-16 |
WO2007098180A2 (en) | 2007-08-30 |
EP1994521A4 (en) | 2014-08-06 |
EP1994521A2 (en) | 2008-11-26 |
JP2009527766A (ja) | 2009-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101385062B (zh) | 重叠密度(od)热图及一致性数据显示 | |
Seo et al. | Interactively exploring hierarchical clustering results [gene identification] | |
Petrey et al. | GRASP2: visualization, surface properties, and electrostatics of macromolecular structures and sequences | |
US7177452B2 (en) | Visualization of information with an established order | |
Thakur et al. | A 3D visualization of multiple time series on maps | |
US20180197726A1 (en) | Data processing device | |
de Juan et al. | Local rank analysis for exploratory spectroscopic image analysis. Fixed size image window-evolving factor analysis | |
Kölling et al. | WHIDE—a web tool for visual data mining colocation patterns in multivariate bioimages | |
Klyuchko | On the mathematical methods in biology and medicine | |
Kaever et al. | MarVis: a tool for clustering and visualization of metabolic biomarkers | |
Keiriz et al. | NeuroCave: A web-based immersive visualization platform for exploring connectome datasets | |
Nowosad et al. | Global inventory of landscape patterns and latent variables of landscape spatial configuration | |
Roberts Jr | Correspondence analysis of two-mode network data | |
Furmanová et al. | COZOID: contact zone identifier for visual analysis of protein-protein interactions | |
Meyer et al. | Visualization of data | |
US20090147005A1 (en) | Methods, systems and computer readable media facilitating visualization of higher dimensional datasets in a two-dimensional format | |
CN113946730B (zh) | 一种基于基因数据的染色质层次结构分析的可视化方法 | |
CN111831721B (zh) | 一种空间数据可视化的处理方法、系统及设备 | |
Erny et al. | Finnee—a Matlab toolbox for separation techniques hyphenated high resolution mass spectrometry dataset | |
Acar et al. | New exploratory clustering tool | |
US8838397B1 (en) | Representing a plot with a mini-plot | |
He et al. | DataColor: unveiling biological data relationships through distinctive color mapping | |
Jagadeesan et al. | MALDIViz: a comprehensive informatics tool for MALDI-MS data visualization and analysis | |
Rose et al. | DriftWeed: a visual metaphor for interactive analysis of multivariate data | |
Chen et al. | Resolution control for balancing overview and detail in multivariate spatial analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20101006 Termination date: 20210221 |
|
CF01 | Termination of patent right due to non-payment of annual fee |