CN103988078B - 用于生化数据分析的系统和方法 - Google Patents

用于生化数据分析的系统和方法 Download PDF

Info

Publication number
CN103988078B
CN103988078B CN201280057371.2A CN201280057371A CN103988078B CN 103988078 B CN103988078 B CN 103988078B CN 201280057371 A CN201280057371 A CN 201280057371A CN 103988078 B CN103988078 B CN 103988078B
Authority
CN
China
Prior art keywords
field
analyte
selection
data
subgroup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280057371.2A
Other languages
English (en)
Other versions
CN103988078A (zh
Inventor
T·耶克
N·K·汤姆森
J·C·达纳韦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bio Rad Laboratories Inc
Original Assignee
Bio Rad Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bio Rad Laboratories Inc filed Critical Bio Rad Laboratories Inc
Publication of CN103988078A publication Critical patent/CN103988078A/zh
Application granted granted Critical
Publication of CN103988078B publication Critical patent/CN103988078B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)

Abstract

提供了用于生化数据分析的方法和系统。可接收数据集,并且比较字段的选择可用于创建数据子组以在该数据子集上运行统计分析。数据集的子组可基于比较字段的选择而创建。可计算关于每一数据子组的统计信息,并且在用户显示器上显示该统计信息。可提供信息用于进一步的数据集精炼。用户可供应对照组选择,并且这种选择随后可导致显示器上的关于哪一群体表示对照组的指示。用户可供应信息以供进一步的数据集过滤。这种信息可用于在创建统计分析的子组之前过滤数据。

Description

用于生化数据分析的系统和方法
相关申请的交叉引用
本申请要求2011年9月22日提交的题为“用于生化数据分析的系统和方法(Systems and Methods for Biochemical Data Analysis)”的美国临时申请号61/538,073的优先权,并且是该临时申请的非临时申请,该临时申请的全部内容出于所有目的通过引用结合于此。
背景技术
本发明一般涉及生化数据分析,并且更具体地涉及使用用户供应的参数对生化数据的分析。
生化实验数据分析大部分以手动的方式继续。用户经由各种实验手段获取与在生物样品上进行的研究有关的实验数据,包括软件程序输出的结果。这种数据可具有大量的各种各样的特性,并且因此难以管理和分析。当前用户常常采用Excel,执行许多手动步骤以用于将数据导入电子数据表(spreadsheet)、用于从整个数据集中选择数据类别以供评估和比较、以及用于提供宏以供统计计算和制图表。手动方案对用户来说难以实现和管理、耗时、易于出错、并且存在潜在的商业风险。
用户当前尚未拥有易于使用的界面和系统用于容易地提供关于如何对数据集分段(slice)的信息,导致数据子集、统计信息用户视图的自动更新、和/或重新计算数据(例如,对数据和图表的统计)。
因此,期望提供克服以上以及其他问题的系统和方法。
发明内容
实施例可提供用于生化数据分析的方法和系统。例如,可接收数据集,并且对比较字段的选择可用于创建数据子组来在该数据子组上运行统计分析。可基于对比较字段的选择而创建数据集的子组。可计算关于每一数据子组的统计信息,并且在用户显示器上显示该统计信息。在各个方面,提供其他信息以用于进一步的数据集精炼。在一方面,用户可供应对照组选择。然后,这种选择可导致在显示器上产生哪一群体(population)代表对照组的指示。在另一方面,用户可供应信息以供进一步的数据集过滤。这种信息可用于在创建统计分析的子组之前过滤数据。
根据一个实施例,提供了一种生化数据分析的方法。计算机系统接收多个生物样品的数据集。数据集具有用于每一生物样品的多个字段,其中数据集的至少一部分从涉及生物样品的实验中获取。数据集包括多个第一字段。每一第一字段包括多个值,每一值对应于各个生物样品的各个特性。数据集可包括一个或多个第二字段。每一第二字段对应于各个分析物,并且包括实验中的各个分析物的多个浓度。各个第二字段中的每一浓度对应于各个生物样品。从多个第一字段接收对比较字段的选择。计算机系统基于比较字段的多个值,来标识数据集中的生物样品的子组以用于统计分析。子组具有用于比较字段的相同值。从统计分析的一个或多个第二字段接收对分析物的选择。提供以子组分开的信息的显示,从而为比较字段的每一子组传达所选分析物的统计信息。
其他实施例涉及与本文中所描述的方法相关联的系统、装置、以及计算机可读介质。
对说明书的其余部分(包括附图和权利要求)的参考将了解本发明的其他特征和优点。在下文中参考附图详细地描述本发明的其他特征和优点、以及本发明的各个实施例的结构和操作。在附图中,相似的附图标记可指示相同或功能类似的要素。
附图说明
在附图中,相似的附图标记用于引用相似的要素。虽然以下附图描绘本发明的各个示例,但是本发明不限于在附图中描绘的示例。
图1A是示出运行生化分析组件的实例的生化分析系统的框图。图1B是示出生化分析应用的实施例的各个GUI组件的框图。
图2是示出生化数据分析系统的步骤的流程图。
图3示出生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出其中未选择比较字段且未选择对照组的屏幕。
图4是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于选择比较字段的下拉列表和所产生的组比较。
图5是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于选择对照组的下拉列表和所产生的组的重新组织以及相关联计算。
图6是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于添加性别的过滤参数的下拉列表和所产生的计算的数据更新的缩减。
图7是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于添加样品ID的过滤参数的下拉列表。
图8是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出用于选择过滤标准的复选框。
图9是示出统计概要的生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出其中比较字段被选为“条件”、对照组被选为“正常(normal)”、过滤条件被设为“条件”、以及所有条件被选为过滤标准的视图。
图10是根据本发明的实施例的UI页面的散布图1000。
图11是生化分析系统的一个实施例的UI页面的屏幕截图,该屏幕截图示出该系统的数据修改和注释的一个示例。
图12示出可与根据本发明实施例的系统和方法一起使用的示例计算机系统1200的框图。
具体实施方式
研究人员以及其他用户在生物样品上运行各种实验(例如,对血样的实验以确定各种分析物的浓度)。然后,这些用户可能要求对从各实验中采集的数据进行分析。可通过将从实验中获取的数据导入数据库并使用各种工具来分析所导入数据,来执行分析。在一些情况下,用户可能想要对实验数据执行统计分析以获得对数据群体的特性的洞察。作为示例,可对聚合酶链反应(PCR)数据或者来自其他生化过程的任何其他数据执行分析。
以下是其他数据的示例。免疫测定(immunoassay)数据可源自任何平台(例如,基于平板的酶联免疫吸附测定(ELISA)、具有包括平面阵列、基于珠的测定、流式细胞术、以及其他测量技术的任何风格(flavor)的多重平台),可使用原始荧光或者源自校准曲线的经计算的浓度。实时PCR数据可使用相对量(也称为归一化量或倍数表示)或者源自校准曲线的经计算的值。微阵列数据通常使用原始荧光值(这些值可通过一些背景减除被修改)。质谱数据通常使用峰值以下的区域。其它数据可包括:肺功能数据,诸如通常以排出空气的体积来测量的肺功能;血液化学(例如针对HDL、胆固醇、肝酶素等等的测试);以及物理测量结果,诸如骨密度、骨长度、和踝关节周长(例如,来测量膨胀和实验动物)。
可将研究数据导入数据库,然后通过应用来分析,该应用接受各种用户参数以计算该数据集的统计结果,并向该用户提供与计算有关的信息。因此,各实施例可提供对于数据的用户定义的参数设定,该参数设定可用于将数据集划分成数据子集以进行统计分析。可分析这些数据子集以按照每个数据子组提供数据表示和/或统计信息的经更新的用户视图。
用户可提供统计分析的某些参数。例如,用户可提供选择,诸如比较字段、对照组、统计测试类型、过滤参数、以及过滤标准。比较字段可表示研究人员在为统计分析而划分数据集时感兴趣的字段。对于从对于多个生物样品的实验获得的包含针对每个样品的与癌症类型有关的信息的数据集,研究人员可能对研究每种特殊癌症类型的子群体中的特性(例如特定分析物的浓度,等等)感兴趣。在该情况下,用户可选择“疾病状况”字段作为所选择的比较字段。
对照组可表示数据中被视为实验对照的子组或子群体。例如,如上所讨论地在“疾病状况”被选择为比较字段的情况下,可将“正常”或“健康个体”的数据值选择为对照组。这样的组可提供基线,可将数据集的所有其它子群体与该基线作比较。
此外,研究人员可能对进一步过滤数据集以获得对于数据集的各种特性的洞察感兴趣。例如,继续上述的“疾病状况”子群体示例,研究人员可能想要仅针对男性对象来研究各种类型癌症的分析物浓度。在这种情况下,用户可能想要提供“疾病状况”的比较字段选择,这会导致特定“疾病状况”的所有样品的数据作为组被分析和显示,并且其它“疾病状况”的样品的数据被类似地作为组被分析和显示。用户还可选择“正常”(即无疾病)的对照组,并进一步提供过滤信息(诸如性别仅等于“男性”)。其它参数可由用户供应或系统提供,以用于生化分析的自动化。提供上述参数仅仅是作为示例,而不意味着限制所要求保护的实施例的范围。
I.系统概览
图1A是示出运行生化分析应用的实例的生化分析系统1的框图。在各个实施例中,生化分析系统可支持实验数据集的用户导入、用户选择各种参数用于统计计算、以及统计信息的自动计算和显示的更新。在一种实现中,数据库组件10和生化分析应用20在客户机计算机上运行。在另一实现中,数据库组件10和生化分析应用20分布在多个计算机上(例如按照客户机-服务器体系结构)。
数据库组件10可用于存储和管理实验数据集、用户偏好和输入、以及经过计算或分析的值。数据库组件10可以是关系数据库、面向对象的数据库、或可支持生物数据分析系统的逻辑的任何其它合适的数据库。例如,可使用数据库体系结构即由IBM开发的等等来实施多个实施例,而不背离所要求保护实施例的范围。
应用20可提供用户界面以用于分析驻留在数据库10中的数据。在一个实施例中,数据库可位于在应用20外部。在另一实施例中,数据库可嵌入在应用20中。在又一实施例中,应用可具有嵌入的数据结构(可以是数据库)以用于处理所选择的数据,且可具有外部数据库,该外部数据库可存留许多用户、样品以及实验的数据。可用可用于实现生化分析系统所要求的功能的任何语言来编写应用20。例如,可利用JAVA、.NET、C、C++、C#或任何其它合适的语言来开发应用20,而不背离所要求保护的实施例的范围。
在各个实施例中,数据库10和/或应用20可在多于一个机器上运行。系统还可在任何网络(例如因特网)上工作。在一因特网实现中,数据库10可驻留在连接至因特网的网络上,且应用20可驻留在也连接至因特网的另一网络上。组件10和20可按照任何适合的方式在联网系统上分布,而不背离所要求保护的实施例的范围。在一个实施例中,数据库组件10可在一个或多个单独的数据库机器上运行,应用20的一个或多个实例可连接至该一个或多个单独的数据库机器。这样的分布式客户机-服务器应用的用户例如利用专用的TCP/IP端口和被分配的数据库登录可连接至该数据库。在另一方面中,因特网用户可利用HTTP和/或HTTPS连接来连接至数据库10。
图1B是示出生化分析应用20的实施例的各个图表用户界面(GUI)组件的框图。如所示,应用20包括:分析数据表50、图表输出和统计信息显示60、比较字段选择71、对照组选择72、统计类型73、过滤参数选择74、以及过滤标准75。在一个方面中,分析物数据表50可用于显示各种分析物以及它们的平均浓度和其它计算值的表格表示。例如,通过使分析物表中的行高亮显示,可将表50用于选择感兴趣的分析物以进行统计分析。
统计信息显示60可显示从组件50选择的分析物的表,并以表格形式显示所选分析物的数据集的各种统计信息。组件60还可用于显示与所选分析物有关的图表信息,诸如散布图、柱状图、箱须图等等,这些图表信息可被连续地呈现。统计信息显示60可用于显示所需的计算出的任何类型的信息,而不背离实施例的范围。
还示出应用20包括:比较字段选择71,表示GUI组件,用户可通过该GUI组件提供比较字段以用于创建子群体来进行统计分析;对照组选择72,表示GUI组件,用户可通过该GUI组件提供对照组以作为实验对照;统计类型73组件,表示GUI组件,用户可通过该GUI组件提供与用户感兴趣的统计计算的类型有关的信息;以及过滤器参数74和过滤标准75GUI组件,表示一种机制,用户可通过该机制来提供数据集过滤信息。
各种GUI组件71-75可被实现为下拉列表框,用户可通过该下拉列表框来选择特定的感兴趣的参数。其它GUI组件71-75可被实现为输入字段、或单选按钮或复选框或任何其它合适的选择机制,用户可通过该选择机制来供应参数选择信息。GUI组件可按照任何顺序来排列在一页上或多页上等而不背离所要求保护的实施例的范围。图1B示出一种GUI实现,但也可使用其它GUI布局。
II.生化数据分析
图2示出根据本发明的实施例的用于生化数据分析的方法200。如图所示,方法200包括接收数据集步骤210、分析物选择步骤220、比较字段选择步骤230、对照组选择步骤240、过滤器参数/标准选择步骤250、子组创建步骤260、以及统计信息显示步骤270。这些步骤可按照各种各样的顺序或并行地执行,并且可任选地不执行一个或多个步骤。
在步骤210中,系统(例如如图1A所示的系统)接收多个生物样品的实验结果数据集。例如,这些样品可以是从人类对象获得的血浆或血清。可从任何数量的器官和任何数量的生物组织获得这些生物样品,而不背离所要求保护的实施例的范围。样品类型的示例包括血清、血浆、细胞培养、以及不同的暴露组(exposure gruop)。
数据集可包括多个数据行,每个数据行具有各种属性(字段)。一些属性可提供与从其中获得生物样品的该器官的特性有关的信息。在一个实施例中,数据行表示生物样品。例如,一个数据行可具有性别、年龄、疾病状况等等属性,这些属性具有在相应样品的各个行中的各个字段中的值(例如以列排列)。其它数据字段(属性)可包括从在生物样品上进行的实验获得的值。例如,数据行可包含来自在各个生物样品上执行的一个或多个实验的各种分析物浓度(例如每个浓度字段一个浓度)。因此,每个数据行可表示一个生物样品,具有多个字段来表征该样品并提供来自实验结果的值(例如分析物浓度、荧光强度(FI))、或来自一个或多个实验的任何其它数值测量结果。
其它数据行可对应于其它生物样品。数据行可具有用于相同数据字段的值,例如所有数据行均具有用于“性别”数据字段的值。数据字段可按照列来排列,其中列对应于特定数据字段。在一个实施例中,一个以上数据行可由一个特定生物样品的实验结果来表示,例如以示出来自重复同一实验的结果。
所导入的数据集可与项目相关联。例如,一个数据集可被导入到“癌症研究1”项目中,而另一数据集可被导入“女性种族差异研究100”项目中。基于研究人员正在进行的研究的类型,数据集与项目的相关可帮助提供数据集的不同特性。
在步骤220,系统接收要进行数据分析的分析物的选择。例如,用户可提供要进行数据分析的分析物的选择。例如,用户可选择表示图1B的分析物数据表50中的特定分析物的平均值的数据行,该分析物数据表50包含多种分析物的数据。可使用任何其它合适的方式来提供感兴趣的分析物,例如输入名称、从下拉框中选择、等等。
在步骤230,系统接收比较字段的选择。例如,用户可提供比较字段的选择。可从表征生物样品的数据集的多个字段之一中选择比较字段。在一个实现中,其中数据行具有性别(gender)、种族、男女(sex)以及疾病状况的属性,图1B的比较字段选择71可由所说明的四个属性所填充以作为比较字段的可能选择。然后,用户可选择四个字段中的一个作为所选择的比较字段。可允许用户选择多于一个的比较字段(例如疾病状况和性别,这导致通过疾病和性别对数据集的子群体的进一步划分)。在用户未提供选择的情况下,可能存在默认的比较字段值。
在一个实施例中,一旦用户选择要分析的数据集,比较字段选择的下拉列表框可被多个值自动填充,这多个值对应于数据集的多个属性。在另一实施例中,比较字段列表框可替代地包含用于用户选择的静态值。呈现给用户以供选择的可能的比较字段可受限于数据集的可能属性。因此,响应于拥有具有两个属性(疾病和性别)的数据集的项目,系统可使仅这两个字段可用于选择,作为比较字段。
在步骤240,系统接收对照组的选择,该选择可由用户提供。对照组列表可包括所选比较字段的可能数据值。例如,其中疾病状况被选为比较字段,图1B的对照组选择72可由数据集的疾病状况字段中的所有独特的可能值填充。因此,这可导致对照组列表中包括“肺癌”、“乳腺癌”、“正常”、以及“结肠癌”。然后用户可选择任一值作为对照组,例如“正常”的子组。
在一种实现中,在步骤230中的比较字段的选择自动地更新对照组的用于选择的可能的数据值。对照组列表框中的值的自动更新可自动地实现,例如,通过从被分析的数据集中选择所选比较字段的所有独特的可能数据值,并用这些独特值来填充对照组列表框以供用户选择。在一个实施例中,用户可能能够选择一个以上对照组。
在步骤240对对照组的选择可能导致数据结果显示窗口的可视指示。例如,所得的分析视图(例如柱状图、散布图等等)可具有位于一系列图表的最左边或位于被分析的统计表的最上面的对照组数据。对于哪个群体表示对照组的可视指示提供了易于将对照组与所研究的其它群体相比较的优势。在其中计算出的数据被导出至文件的情况下,对照组可被指示为导出文件中的字符串或其它文本指示符。
在步骤250,系统接收过滤信息(例如用于过滤参数的标准值),过滤信息可由用户提供。在各实施例中,用户可提供过滤参数和过滤标准,以用于进一步的数据集精炼,以用于分析目的。过滤参数可以是针对被分析的数据集中的每个数据行的属性或字段中的一个或多个(例如年龄、性别、种族、疾病状况、样品类型等等)。在一个实施例中,一旦用户选择要分析的数据集,图1B的过滤参数组件(例如过滤器参数选择74)可由数据集的字段的可能值自动填充。在另一实施例中,过滤器参数对照可包括静态值以供用户选择。过滤标准可表示所选过滤参数的可能数据值(例如在所选过滤参数是性别的情况下,为男性或女性)。在一个实施例中,可允许用户选择一个以上过滤标准以进行数据集过滤。
在一个实现中,一旦用户选择了过滤参数,就触发了用于选择过滤标准的可能值的自动更新。例如,如果用户选择了样品类型作为过滤参数,则过滤参数旁边的具有复选框的列表,对于诸如对于图1B所描述的过滤标准75,可由可能的数据值“血浆”或“血清”所更新。在一个实施例中,然后用户可选择样品类型值中的一种或两种来进行统计分析。例如,在用户仅对查看血浆样品值用于分析感兴趣的情况下,她可仅选择“血浆”旁边的复选框。
在步骤260,用户供应的参数和标准可用于生成数据的子组进行统计分析。在一个实施例中,子组基于所选择的比较字段。例如,假使要分析的数据集总共具有900行数据:其中300行具有状况列的“肺癌”的值,300行具有状况列的“结肠癌”的值,且300行具有状况列的“正常”的值,可确定三个不同的子组。实际的子组的数量和每个子组的数据点的数量可取决于过滤参数和标准。在上述示例中,如果对于性别列,这900行在上述每种类别中,样品的一半具有“女性”的值,并且这些数据行的另一半具有“男性”的值,则男性的过滤器可对于每种状况提供150个数据点。在一个实现中,可自动地并且响应于上述选择步骤中的任一步骤来执行子组的生成。
在步骤270中,可按照子组来显示数据分析信息。在一个实施例中,每当新的过滤器、比较字段、对照或其它相关值改变时,计算数据分析信息。在一个实现中,计算是实时进行的,以减少存储要求并向顾客提供即时结果。例如,如果要显示的数据从荧光信号(在下文中详细描述)改变成观测到的浓度然后变回荧光信号,则会再次执行对荧光信号的计算。因此,对于要分析的数据、要对数据执行的计算、以及如何显示数据和任何计算出的值(例如统计值),存在许多选项。
假设用户选择了“状况”作为比较列、“正常”作为对照组、性别作为过滤参数、以及“男性”作为过滤标准,则可首先执行按照“男性”对数据集的过滤步骤,然后可执行对数据划分子组的步骤。从而所得的用于分析的子组将会是:“肺癌”、“结肠癌”、以及“正常”,利用标记将“正常”类别标记为对照组。然后在该示例中,作为仅过滤男性对象的结果,这将导致对每种类型的癌症分析150行数据,其中健康的个体子组将被标注为对照组。
在一个实施例中,用户可进一步提供感兴趣的统计分析类型的选择(例如参量、t测试、单向ANOVA、非参量、曼-惠特尼(Mann-Whitney)、克鲁斯卡尔-瓦勒斯(Kruskal-Walles)、等等)。可在图1B的统计类型73中提供该对照。然后该系统可对步骤260中创建的数据的子组运行统计分析,并显示属于这些计算的信息。所呈现的统计值的类型可包括:与对照组相比较的每个组的p值、对照和其它生物复制组之间的测得值的倍数变化(例如通过使用多种人口统计学信息类型来建立比较的维度)、以及每个复制组的平均测得值以及描述多样性并通知在统计学上显著的差别的统计输出。
例如,可在GUI显示区域(诸如图1B的组件60)中为数据的每个划分集提供具有统计数字的概要表。在一个实施例中,所选择的对照组将导致显示上的一些可视标记,从而指示哪个数据行或数据集表示该对照组。可对于数据的每个子群体显示基于统计分析生成的各个图。在一个实现中,在最左边显示对照组。
所显示的图表可以是散布图、柱状图、箱须图或统计数据的任何其它合适的图表表示。在一个实施例中,将向悬停在散布图上的点上方的用户提供工具提示,具有与该点所表示的样品有关的附加信息。可显示该数据分析信息和/或以任何合适的形式将其提供给用户。作为一个示例,参数选择可导致基于这些选择创建具有统计信息的导出数据文件。
III.导入/导出数据
多个实施例还可提供数据导入、修改以及丰富。在一个实施例中,用户可通过导入由逗号分隔的数据文件、或图1A的数据库10可支持的任何其它合适的文件格式,来导入从实验运行中获得的数据。在另一实施例中,用户可剪切并粘贴来自电子数据表程序的数据,该电子数据表程序的数据将在自动化生化数据分析系统的数据库组件10中被更新。
在一个实施例中,数据库10可提供任何给定数据集行的字段的基本集合。作为字段的任何基本集合的附加或替代,用户可定义驻留数据集的新属性(例如通过导入或通过剪切和粘贴)。例如,可添加多个属性以提供适用于数据集的附加特性,作为丰富。这样的数据丰富可逐项目地完成,从而允许基于该项目的自定义数据表征(例如一个研究可需要每次实验回合的与性别和种族有关的信息,而这样的特性可能与另一研究无关)。
还可执行数据修改。驻留在系统中的数据不论是通过导入还是通过剪切和粘贴而获得,都可按照表格方式给出以进行进一步修改。在各实施例中,可向数据中添加新的列、可通过选择表中的单元并修改值来修改数据、可从单元中选择数据值并按照任何方向拖拽以将其复制到附加的单元中、以及可选择并删除多个单元以去除数据值。
还可导出生化分析数据。对于将生化分析数据导入其它统计包以进行数据的进一步评估而言,数据导出是特别有利的。在一个实施例中,例如用户可通过使分析物数据表50中的一个或多个行高亮显示来选择多个分析物。在一个方面中,一旦用户选择分析物,利用包含分析物的底层(underlying)数据的表来更新统计信息显示60。在一个实施例中,可导出这样的数据以在另一系统中使用或以其它方式使用。
IV.用户界面
在各实施例中,可从外部数据库(例如现有项目的)、文件(例如作为实验的一部分而从实验室装置输出的文件)中手动地导入数据,如同对于新项目那样。在一个方面中,来自外部的数据可以来自曾保存的先前会话。当选择先前会话时,可从外部数据库取回该数据并输入到该应用中,该应用可具有嵌入的数据库或其它机制来组织数据。在一个实施例中,在“打开(管理)项目”对话框中,用户可编辑项目属性、打开项目、和/或从活动的项目列表中移除项目(这会导致项目移动至可经由新的标签访问的不活动项目)。因此,在一个实现中,仍可打开这些不活动的项目。以下屏幕截图提供了根据本发明的实施例的示例。
图3示出了生化分析系统的一个实施例的UI页面300的屏幕截图。页面300示出了未选择比较字段、并且未选择对照组的屏幕。该屏幕中的右上象限示出了分析物数据表304,以及通过选择该分析物“Hu FGF Basic”的行使得“Hu FGF Basic”作为所选分析物。右下象限表示分析物细节视图305(例如统计显示),该视图是对于所选分析物的所有数据样品的散布图。注意,该屏幕截图并未提供按照子群体的任何信息,因为用户尚未选择比较字段。
视图导航按钮301可改变呈现给用户的视图。管理数据集按钮301a可访问一视图,其中以相关细节列出了构成该项目的所有数据集。在该数据集视图的一个实施例中,用户可对数据集执行一些维护功能,诸如编辑数据集属性(例如名称、用户姓名、采集时间、描述、导入日期、以及由谁导入)、删除数据集(从分析中永久移除——与将其过滤不同)、以及将表复制到剪贴板。编辑样品/添加列按钮301b可访问一视图,在该视图中顾客可访问适用于标注它们的数据(例如添加样品细节)的控件。可向数据集中添加新的列以作为自定义字段。查看结果/查看热点图按钮301c可实现一视图,其中按照表格形式显示该项目中的每个样品的所有实验值(例如观察到的浓度(Obs Conc)、浓度范围(In Range)等等)。还可提供该热点图(heatmap)的图表显示。执行分析/创建图表按钮301d可允许用户查看按照相似属性分组的样品的分析。该视图的细节在别处呈现。
主工具栏302提供导航以及其它功能。按钮311到314定义用于分析的数据。所有这些数据都是可利用由运行该仪器的软件所创建的数据文件导入的值。例如,取决于执行(actuated)的视图,荧光强度(FI)按钮311在被激活时呈现荧光值(浓度的原始仪器读数的示例)或从荧光值导出的计算值。因此,如果选择了FI按钮311,则分析物数据表304中示出的数据将反映荧光值。观察到的浓度(ObsConc)按钮312与计算值相关,该计算值基于仪器软件中生成的校准曲线计算得出。取决于执行的视图,激活该按钮呈现出观察到的浓度值或从这些值导出的计算值。
类似地,浓度范围(In Range)按钮313和比值(Ratio)按钮314可用于改变每个视图中所呈现或被用于计算的数据。浓度范围按钮313(即浓度范围)与校准曲线的可靠范围内的浓度相关。例如,浓度范围按钮313会报告与ObsConc相同的值,但范围之外的值会被报告成OOR(在范围之外),而不是提供实际值。比值按钮314可呈现比值数据,该比值数据是由因子将测量结果(例如FI值)归一化(例如通过例行分析物的另一测量结果来归一化)的数据。可将任何测量值归一化,然后可从归一化值来计算统计值。
分析控件303允许对分析数据表304中的数据进行各种分析。比较字段307提供选择列表(或其它输入机制)来选择将被用作比较字段的参数。对照字段308提供类似机制来选择对照。统计选项309提供不同的统计测试来分析比较字段和对照。过滤器选项310提供选择过滤器参数(例如从选择列表)然后输入所选过滤器参数的特定过滤器标准(例如血浆或血清)的机制。在一些实施例中,可选择一个以上的过滤器参数。
在分析物数据表304中,多个列示出了与观察到的浓度按钮312相关的数据。如果曾经选择按钮(例如311、313或314)中的任一个,则可在分析物数据表304中显示其它数据。列315可示出来自指定测试的p值。列316可示出与所选分析物中具有最高值和最低值的样品的变化;该值可用以2为底数或其它底数的对数来表达。在该示例中,在这些列中未示出数据,因为未选择比较字段。列317示出了项目中的所有样品的对于每种分析物的利用按钮311-314标识的输出的平均值。列318示出了项目中的所有样品的对于每种分析物的利用按钮311-314标识的输出的标准差。
在所示示例中,分析物视图305示出了对所选分析物(Hu FGF basic)观察到的浓度。数据点沿着X轴分布(未标记值),以允许更好地可视化,以查明多少数据点处于特定的观察到的浓度。直线355示出了平均浓度。因为未选择比较字段,所以该图针对从血浆或血清(如对于过滤器所选择)获得的该分析物的所有数据点。分析物细节工具栏306允许用户改变分析物细节视图305的显示。
图4是生化分析系统的一个实施例的UI页面400的屏幕截图,示出了用于选择比较字段的下拉列表。该比较字段提供了下拉列表框410,其具有“样品ID”、“数据集”、“样品类型”、“描述”、“孔位置”、“样品标签”、“基质”、“状况”以及“性别”这些可能值。示出在比较字段中选择了“状况”值。该显示的右下象限示出了散布图,基于“状况”的比较字段被选择为比较字段,该散布图被划分成“乳腺癌”、“结肠癌”、“肺癌”、以及“正常”的子群体。因此,该实施例已经标识了该数据中针对所选分析物的这四个状况。此外,位于右上象限与右下象限之间的分析物细节工具栏示出了各种类型的显示和统计信息,用户可从这些类型的显示和统计信息中选择用于在右下象限中显示。在该示例中,用户已选择了“散布图”图标作为图表的选择。
高亮显示的行420描绘了方法200的步骤220的实施例。其示出了用户已经选择了分析物“Hu FGF Basic”进行分析。该选择示出了用于“Hu FGFBasic”分析物的数据集将被用于进一步分析。下拉列表框410描绘了步骤230的一个实现。其示出了用户已经选择“状况”作为比较字段。可在GUI应用的背景中执行或由另一单独的应用进程来执行步骤260中的子组的创建。象限405描绘了步骤270的实施例。其示出了对步骤260创建的子组产生四个子组,这些子组已经被统计地分析(例如在后台进程中)。所得的组被示为“乳腺癌”、“结肠癌”、“肺癌”以及“正常”。这些子组下方的标题是“状况”,表明用户所选择的比较字段。所显示的一系列图表是四个子群体的散布图,因为用户已经选择“散布图”图标作为所选择的感兴趣的图表类型。在一个实施例中,用户可在工具栏上可用的多个不同的信息类型(例如柱状图、散布图、盒须图、信息表等等)之间切换。
图5是生化分析系统的一个实施例的UI页面500的屏幕截图,示出了用于选择对照组的下拉列表510,如图2的步骤240所描述。对照组选择列表框510示出了“无”、“乳腺癌”、“结肠癌”、“肺癌”、以及“正常”的可能值。注意,这些值对应于图4的所选比较字段“状况”的可能数据集值。示出“正常”值被选择为对照组。
图5的象限505与图4所讨论的象限基本相同,不同之处在于它进一步示出了将“正常”组选为对照组的效果。作为将“正常”选为对照组的结果,与“正常”相关联的子群体及其散布图已被移至所有子群体的散布图的最左边。这便于用户在视觉上将“正常”群体与其它群体进行比较。图5还示出了p值(统计数),用于与它们各自的散布图中的每个子群体的对照进行逐对比较。
图6是生化分析系统的一个实施例的UI页面600的屏幕截图,示出了用于选择过滤器参数的下拉列表610,如方法200的步骤250所描述。它示出了过滤器参数选择列表框610,并且“性别”正在被选择为过滤参数。在该示例中,过滤器参数选择框610中的可能值与图4中讨论的比较字段选择列表中的可能值相同。比较字段和过滤器参数二者都可被导出作为被分析的数据集的可能字段或属性的列表。因此,它们可能具有与每个参数相关联的下拉列表框中的相同值。
分析物细节视图605仍然示出仅一个过滤器参数基质的数据,因为尚未添加性别标准。仅选中了过滤器标准“血清”,而血浆尚未被选中作为过滤器标准。在该实现中,基质指的是其中进行反应的流体或物质,其可描述样品的类型(例如血清、血浆、细胞培养上清液)。由于尚未实现性别过滤器,所以分析物细节视图以散布图示出应用了性别(仅男性)和基质(血清)二者的结果。
图7是生化分析系统的一个实施例的UI页面700的屏幕截图,示出了用于添加样品ID的过滤器参数的下拉列表710。在此,示出了过滤器参数选择列表框710以及“性别”和“基质”二者被选择为过滤参数,其中该过程中的参数被改变至样品ID。正在使用的过滤器参数被标记,如图7中可见。分析物细节视图705以散布图示出了针对性别(仅男性)和基质(血清)二者的过滤器的数据。
图8是生化分析系统的一个实施例的UI页面800的屏幕截图,示出了用于选择过滤标准的复选框,如方法200的步骤250所描述。它示出了可能的过滤标准复选框是“血浆”和/或“血清”。注意,这基于用户将“基质”选择为过滤参数。还示出仅“血清”样品被选择用于数据集分析。在一个实现中,选择列表810中示出的过滤器控制显示哪种过滤器标准。为了确定被使用的所有过滤器标准,可标识被使用的参数(例如,当启用选择列表810时被过滤器图标标记的那些参数),然后导航至每一参数以查看哪些标准被选择。所示用于特定参数的标准可默认地被设置,或取决于数据集中实际出现的值。
该过滤标准的选择的影响是仅选择具有所选过滤器参数的选中值的那些数据集行,例如如步骤250中所选。象限805示出了仅针对以“血清”作为数据集中的“基质”属性的数据值的样品来过滤数据集的效果。它示出了与图5相比的散布图上点数量的相应减少,图5中用户未曾选择进一步的过滤标准。用户可替代地选择“血浆”作为感兴趣的样品。在一个方面中,用户可选中“血浆”和“血清”二者,然而,用户选择所有可能值的净效果将会是不过滤,因为所有样品都将被选择。
图9是示出统计概要的生化分析系统的一个实施例的UI页面900的屏幕截图,示出了其中比较字段被选择为“状况”、对照组被选择为“正常”、并且未提供对数据的进一步过滤(即,因为为状况过滤器参数选择了所有状况标准并且未应用其它过滤器)的视图。该显示的象限905示出了基于将“状况”选择作为比较字段的对于每个子群体的具有统计数的表。它还示出了基于将“正常”作为对照组的用户选择的位于最上方的“正常”子群体。该概要表明显地示出源自在比较和对照下拉中作出的选择的计算。
如所示,这些计算具有在主工具栏中指定的值。在本示例中,所选择的值是观察到的浓度912。列中的值如下:样品——每个组中的总样品数量;#有效样品——具有用于执行计算的有效数据的样品数量;P-值——针对在p-值方法中指定的测试;倍数变化——在对照的平均值与以2为底数的对数表示的每个组的平均值之间(不同于分析物表中的倍数变化);平均——组中的所有样品的算术平均;StdDev——组中的所有有效样品的标准差;%CV——组中的所有有效样品的变异系数;Min和Max是该组的最小和最大值;Q1和Q3是该组的第一和第三个四分位数;且Median是该组的中值。
图10是根据本发明的实施例的UI页面的散布图1000。此处的散布图是可显示在此处所示的UI页面中的象限的放大图。在一个实施例中,点分布在x轴上,使得“鼠标悬停”产生被呈现给用户的相关样品信息。组合地或单独地,其他实施例可具有标记特定样品以通过其他分析物跟踪该特定样品的能力、标记样品的特定属性以通过其他组跟踪该特定属性的能力(例如用于以图表方式调出特定患者以通过该曲线图可视化)、以及在点上双击以调出具有全部人口统计学信息的表格的能力。在其他实施例中,可显示其他图,诸如“箱须”类型的图和“柱形”类型的图。
图11是生化分析系统的一个实施例的UI页面1100的屏幕截图,示出了该系统的数据修改的一个示例。作为示例,可已将以表格方式呈现的该数据导入该系统中或从电子数据表表单剪切和粘贴到该系统中。该显示示出用户可如何通过输入诸如第一单元格的“男性”的值的列的数据来进一步修改新添加作为自定义字段或预先存在的“性别”列。
在该示例中,通过选择UI页面300中的视图导航按钮301的编辑样品/编辑列按钮301b,可访问该显示。在一个方面中,该显示可示出导入至项目中的所有数据集中的每个样品(无重复)。在一个实施例中,添加列按钮1101允许向样品列表中添加自定义列(属性)。可添加的列的数量可被配置成无限制或有上限。列1102展示了其中添加了信息的新添加的列。在一个实施例中,在从执行测量的实验室装置导入的原始数据中可不存在状况1103和基质1104的列,但按照另一方式来跟踪它们。例如,可由正在运行该样品并且通过其他渠道(例如从患者处获得的或由采集该样品的医疗专业人员标记的调查问卷)知晓状况和基质的技术人员来添加状况和基质。
在导出数据的一个实施例中,用户可选择多种分析物。用于导出的数据可在页面300的分析物细节视图305中出现。分析物细节视图305可示出所选分析物的底层数据集。然后可导出这样的数据以在其他系统中使用或用于任何其他目的。在一个方面中,选择比较字段并应用过滤器使得该应用尤其适用于创建这些表。可导出原始数据或从计算中得出的数据。
V.示例工作流程
存在其中用户在分析他们的数据时可能使用的许多可能的事件顺序。在一个示例中,用户可导入两个数据文件(例如作为新项目的部分),然后在新的列中添加信息,如图11所描述。用户然后可选择如图4可见的比较字段“状况”,并选择如图5可见的对照“正常”。然后用户可能判断,如果仅使用从血清导出的样品,则该数据可能更可解释,如图8所示。可基于这些选择来更新分析物细节视图中的显示。用户可能还想调查女性相比于男性是否展现出不同的分析物水平,例如通过首先使用针对女性的过滤器来显示仅女性的数据,然后使用过滤器来显示仅男性的数据。在一个实施例中,当应用关闭该项目时,最后的比较、控制和过滤选择可保留在该项目中。
在另一示例中,用户可导入不同的仪器结果文件,然后添加信息,如同图11中的过程。用户可判断来自孔号A1的读数存在问题,并通过使用过滤器工具利用参数“孔位置”从该分析中排除该孔,由此通过一次鼠标点击将其从所有数据文件中排除。而在另一示例中,用户可选择仅分析来自“血清”的样品。可作出对比较字段“状况”和对照字段“正常”的选择。然后用户可分别查阅每种分析物的结果,然后作出结论。现在,如果用户在标识其中仪器未正常工作的仪器运行之后,在两个星期之后返回至该数据,则用户可从分析中删除数据文件#13(例如使用管理数据集视图)并按照分析物来重新查阅该数据,以作出结论。用户也可重新运行来自数据文件#13的样品,并将该数据文件导入该项目中,添加新样品的样品信息,并按照分析物来查阅结果以作出结论。
在另一示例中,用户可能想要保存一种或多种“分析方法”。如上所述,用户导入15个不同的仪器结果文件、添加信息、排除孔、选择“血清”、选择比较字段“状况”和对照字段“正常”、然后单独查阅每种分析物的结果并作出结论。用户可将该分析状态保存为“仅血清”。然后用户可将该过滤器改为“血浆”,并将该分析状态保存为“仅血浆”。用户可从分析中去除男性,并将其保存为“仅血浆,女性”。在一个实现中,用户可在日后返回,并按需取回每个比较选择、对照选择以及过滤器状态,以作出关于实验系统的结论。
VI.流式细胞分析
在一个实施例中,可使用流式细胞分析来测量浓度。因此,上述的用于测量浓度的实验可包括流式细胞分析。例如,被测量浓度的分析物可以是细胞类型或特定分子。在一个实现中,可使用流式细胞分析来对特定类型的细胞(例如红细胞或白细胞和其他感兴趣的细胞类型,以及细菌和病毒之类的病原体)的数量进行计数。该计数可直接用作浓度,或基于样品的量(例如重量或体积)或另一细胞类型的计数来归一化。流式细胞分析可允许用户非常迅速地表征细胞群体。在另一实现中,可使用信号强度(例如荧光)来检测特定分子(诸如葡萄糖)。
流式细胞分析将来自样品单个文件的细胞传递至利用光发射器(通常是激光)和检测器的检测机制,光发射器和检测器二者直接放置在入射光对面(across from)并且垂直于入射光。一般存在两种类型的参数,这两种类型的参数可独立或一起使用以表征群体:物理细胞特性和特定荧光标签的荧光强度。因此,要处理和显示的数据可包括计数和荧光。对于计数,研究人员可针对每个样品跟踪每种细胞类型(例如门控(gated)群体)中的细胞的数量。对于荧光,研究人员可跟踪许多波长下的荧光水平,以标识特定生物分子的存在和数量。
为了确定物理细胞特性,该分析可利用侧向散射和荧光散射数据来表征细胞。存在尺寸与荧光散射的相关(散射越多,与光相互作用的细胞的体积越大),因此侧向散射可用于进一步表征细胞。不同的侧向散射量可指示不同的复杂程度、细胞器官密度和尺寸等等。两种散射读数可用于创建样品中的细胞的不同群体的概况。如果散射读数匹配概况,则可使相应群体的计数器递增。因此,可对属于感兴趣的样品内的不同群体的细胞的数量进行计数。
相应地,对于细胞特性,处理该数据的仪器和软件可允许研究人员使用散射信息来标识细胞群体。可将该数据绘制在图表上,所绘制的图表指示通过该检测器的每个细胞的荧光散射水平相对侧向散射。通过基本上在分立群体周围画圆圈(称为门控),用户可限定群体。每个圆圈被认为是门。将同一门用于每个样品,并且将落在给定门中的所有细胞视为感兴趣的群体的一部分。
特定荧光标签的荧光强度可用于标记细胞上的自然出现的分子,以评估该分子在该细胞上的存在和密度(也可使用除荧光标签之外的其他计数)。典型地,使用抗体来特别地标识感兴趣的特定生物分子在细胞上的存在和数量(或在其中不常见)。可按照各种各样的方式来标记该抗体,以在限定波长中产生荧光,该荧光可被仪器及其相关软件检测。许多仪器可检测三个或更多个不同波长,以检测感兴趣的多种生物分子。如果细胞上具有感兴趣的生物分子,则将在特定波长检测到荧光。该荧光的强度与存在的生物分子的量直接地成正比。
作为示例,研究人员可能对以下感兴趣:落入四个特定门的四种不同细胞类型,以及在这些细胞的薄膜中存在的在实验系统中浓度不同的三种生物分子。因此对于每个样品,研究人员可能想要获得门1-4中的每一个的计数以及每个群体中的三个荧光标记中的每一个的荧光强度的平均值(或平均值、或中值或众数)。例如,研究人员可能获得以下表中的数据。
样品 门 计数 荧光1 荧光2 荧光3
1 1 1.2x106 2344 98 2090
可将每个样品的实际散射数据和它们相关联的图表存储在数据库中。然后研究人员可查阅门的列表,然后点击至光散射图的图像,从光散射图中可提取门控数据。
VII.计算机系统
此处提及的任何计算机系统可利用任何合适数量的子系统。在图12中以计算机装置1200示出这样的子系统的示例。在一些实施例中,计算机系统包括单个计算机装置,其中各子系统可以是该计算机装置的各组件。在其他实施例中,计算机系统可包括具有内部组件的多个计算机装置,每一个作为子系统。
图12中所示的子系统经由系统总线1275互连。示出了附加子系统,诸如打印机1274、键盘1278、固定盘1279、耦合到显示适配器1282的监视器1276及其它。耦合到I/O控制器1271的外围设备和输入/输出(I/O)设备可通过诸如串行端口1277(例如USB)之类的本领域公知的任何种数量的装置来连接到计算机系统。例如,串行端口1277或外部接口1281可被用来将计算机系统1200连接到诸如因特网之类的广域网、鼠标输入设备、或扫描仪。经由系统总线1275的互连使中央处理器1273能与每一子系统通信,并控制来自系统存储器1272或固定盘1279的指令的执行以及各子系统之间的信息交换。系统存储器1272和/或固定盘1279可以包括计算机可读介质。此处提及的任何值可从一个组件输出到另一个组件且可被输出到用户。
计算机系统可包括例如通过外部接口1281或通过内部接口连接到一起的多个相同的组件或子系统。在一些实施例中,计算机系统、子系统或设备可通过网络通信。在这样的实例中,一个计算机可被视为客户机,而另一计算机可被视为服务器,其中每个计算机可以是同一计算机系统的一部分。客户机和服务器可各自包括多个系统、子系统或组件。
应当理解,本发明的任何实施例能以模块化或集成方式使用硬件和/或使用计算机软件以控制逻辑的形式实现。基于本文中所提供的公开和教导,本领域普通技术人员将知道并理解使用硬件以及硬件和软件的组合来实现本发明的实施例的其它方式和/或方法。
在本申请中描述的任何软件组件或功能可被实现为将由处理器执行的使用例如常规或面向对象技术、使用例如Java、C++、或Perl的任何适当计算机语言的软件代码。软件代码可作为一系列指令或命令存储在用于存储和/或传输的计算机可读介质上,合适的介质包括随机存取存储器(RAM)、只读存储器(ROM)、诸如硬盘或软盘等磁性介质、或诸如紧致盘(CD)或DVD(数字多功能盘)等光学介质、闪存等。该计算机可读介质可以是此类存储或传输装置的任何组合。
此类程序也可利用适于经由符合包括因特网的各种协议的有线、光学和/或无线网络进行传输的载波信号来编码和传输。因此,根据本发明一实施例的计算机可读介质可利用通过此类程序编码的数据信号来创建。利用程序代码编码的计算机可读介质可与兼容设备封装在一起,或与其它设备分开地提供(例如经由因特网下载)。任何此类计算机可读介质可驻留在单个计算机程序产品(例如硬盘驱动器、CD、或整个计算机系统)之上或其中,且可存在于系统或网络中的不同计算机程序产品之上或其中。计算机系统可包括监视器、打印机,或用于向用户提供本文中提及的任一结果的其它合适的显示器。
本申请中描述的任一方法可完全或部分地由包括处理器的计算机系统来执行,该计算机系统可被配置成执行这些步骤。因此,各实施例可涉及被配置成执行本申请中描述的任一方法的步骤的计算机系统,这些计算机系统可能具有执行相应步骤或相应步骤组的不同组件。虽然呈现为多个步骤,但本申请中的方法步骤可同时执行或按照不同的顺序来执行。此外,这些步骤的多个部分可与来自其它方法的其它步骤的多个部分一起使用。而且,步骤的所有或多个部分可能是可选的。此外,任一方法的任一步骤可由执行这些步骤的模块、电路或其它装置来执行。
上述实施例中的任一实施例可单独使用或按照任何组合与彼此一起使用。本说明书中包含的方法也可包括在发明内容或摘要中仅部分提及或暗示或者在发明内容或摘要中完全未提及或暗示的实施例。虽然本发明的各个实施例可能受到现有技术存在的各种缺陷的启示(可能在说明书中一处或多处讨论或暗示这些缺陷),但本发明的实施例不必然解决这些缺陷中的任一种。换言之,本发明的不同实施例可能解决在本说明书中讨论的不同缺陷。一些实施例可能仅部分地解决在说明书中讨论的一些缺陷或仅一种缺陷,并且一些实施例可能未解决这些缺陷中的任一种。
出于说明和描述的目的,已给出本发明的示例实施例的上述描述。不旨在穷举或将本发明限制于所描述的精确形式,而且鉴于以上教导,许多修改和变化是可能的。选择和描述了这些实施例以最清楚地说明本发明的原理及其实际应用,从而使本领域普通技术人员能按照各个实施例以及适合所构想的特定用途的各种修改来最好地利用本发明。
“一个”或“所述”的引用旨在表示“一个或多个”,除非特别地相反声明。
以上提及的所有专利、专利申请、出版物、以及描述出于所有目的通过引用整体纳入于此。没有任何内容被承认为是现有技术。

Claims (19)

1.一种生化数据分析的方法,所述方法包括:
在计算机系统处接收多个生物样品的数据集,所述数据集对每一生物样品具有多个字段,所述数据集的至少一部分从涉及所述生物样品的实验中获取,其中所述数据集包括:
多个第一字段,每一第一字段包括多个值,每一值对应于各个生物样品的各个特性,以及
多个第二字段,每一第二字段对应于各个分析物并且包括所述实验中的各个分析物的多个浓度,每一浓度对应于各个生物样品;
响应于用户选择所述数据集,用所述多个第一字段自动填充下拉框;
响应于在计算机系统的用户界面(UI)页面中的下拉框的选择,在所述UI页面上的第一区域内显示所述多个第一字段的列表;
接收来自所述多个第一字段的列表的比较字段的选择;
响应于接收到所述比较字段的选择,标识所述数据集中的多个值以用于所选择的比较字段;
通过所述计算机系统基于所选择的比较字段的所标识的多个值,来标识所述数据集中的所述生物样品的子组以用于统计分析,其中子组的生物样品具有所述比较字段的相同值;
在所述UI页面上的第二区域内显示表中的分析物的列表;
接收来自统计分析的所述多个第二字段的分析物的选择,其中接收来自统计分析的所述多个第二字段的分析物的选择包括:接收所述表中的分析物的选择,并且在所述表中的与所选择分析物相对应的一个或多个单元格中显示与所选择分析物对应的数据的一个或多个统计值;
响应于接收到所述分析物的选择,从所述数据集中标识所选择的分析物的多个浓度;以及
基于所述分析物和所述比较字段的接收到的选择,提供按照子组分开的所检取的多个浓度的信息的显示,从而针对所述比较字段的每一子组传达所选分析物的统计信息,其中,在所述UI页面上的第三区域内显示按照子组分开的所检取的多个浓度的所述信息,来帮助视觉比较。
2.如权利要求1所述的方法,其特征在于,提供按照子组分开的信息的显示包括:
显示每一子组的图表,其中每一图表显示所述子组沿着浓度值的轴的每一浓度。
3.如权利要求1所述的方法,其特征在于,还包括:
接收来自对照组列表的对照组的选择;以及
在统计信息的显示上提供关于哪个子组对应于所述对照组的可视指示。
4.如权利要求3所述的方法,其特征在于,还包括:
基于对所述比较字段的选择来更新所述对照组列表,其中所述对照组表示来自所述比较字段的所述多个值的特定数据值。
5.如权利要求3所述的方法,其特征在于,所述统计信息的显示包括一系列图表,每一图表对应于不同的子组,并且其中所述可视指示包括以左对齐的方式显示与所述对照组相对应的图表。
6.如权利要求1所述的方法,其特征在于,还包括:
接收来自过滤参数列表的第一过滤参数的选择,其中所述过滤参数列表包括所述多个第一字段的至少一部分,所述第一过滤参数具有多个第一标准值;
接收所述多个第一标准值的一部分的选择;以及
显示与所选择部分相对应且不与未选择的第一标准值相对应的统计信息。
7.如权利要求6所述的方法,其特征在于,还包括:
基于所选过滤参数刷新可能的标准值的用户视图,其中所述可能的标准值允许过滤被执行统计分析的数据;
基于所刷新的用户视图来接收标准值的一个或多个用户选择;以及
基于所选过滤标准来过滤统计分析的数据的子组。
8.如权利要求6所述的方法,其特征在于,还包括:
接收来自所述过滤参数列表的第二过滤参数的选择,所述第二过滤参数具有多个第二标准值;
接收所述多个第二标准值的一部分的选择;以及
显示与所述第一和第二标准值的所选择部分相对应且不与未选择的第一和第二标准值相对应的统计信息。
9.如权利要求6所述的方法,其特征在于,所述第一过滤参数不是所述比较字段。
10.如权利要求1所述的方法,其特征在于,还包括:
接收对统计分析的类型的选择;
基于所接收的统计分析的类型来计算与所选择分析物相对应的数据的一个或多个统计值;以及
显示所述一个或多个统计值。
11.如权利要求1所述的方法,其特征在于,还包括:
接收所述多个生物样品的数据集的自定义属性的定义,其中所述自定义属性是与所述多个第一字段之一相对应的用户供应的属性。
12.如权利要求1所述的方法,其特征在于,所述多个第二字段中的至少一个对应于作为相应分析物的细胞类型。
13.一种生化数据分析的计算机系统,所述计算机系统包括:
用于接收多个生物样品的数据集的装置,所述数据集具有每一生物样品的多个字段,所述数据集的至少一部分从涉及所述生物样品的实验中获取,其中所述数据集包括:
多个第一字段,每一第一字段包括多个值,每一值对应于各个生物样品的各个特性,以及
多个第二字段,每一第二字段对应于各个分析物并且包括所述实验中的各个分析物的多个浓度,每一浓度对应于各个生物样品;
用于响应于用户选择所述数据集,用所述多个第一字段自动填充下拉框的装置;
用于响应于在计算机系统的用户界面(UI)页面中的所述下拉框的选择,在所述UI页面上的第一区域内显示多个第一字段的列表的装置;
用于接收来自所述多个第一字段的列表的比较字段的选择的装置;
用于响应于接收到所述比较字段的选择,标识所述数据集中的多个值以用于所选择的比较字段的装置;
用于基于所选择的比较字段的所标识的多个值标识所述数据集中的所述生物样品的子组以用于统计分析的装置,其中子组的生物样品具有所述比较字段的相同值;
用于在所述UI页面上的第二区域内显示表中的分析物的列表的装置;
用于接收来自统计分析的所述多个第二字段的分析物的选择的装置,其中接收来自统计分析的所述多个第二字段的分析物的选择包括:接收所述表中的分析物的选择,并且在所述表中的与所选择分析物相对应的一个或多个单元格中显示与所选择分析物对应的数据的一个或多个统计值;
用于响应于接收到所述分析物的选择,从所述数据集中标识所选择的分析物的多个浓度;以及
用于基于所述分析物和所述比较字段的接收到的选择,提供按照子组分开的所检取的多个浓度的信息的显示的装置,从而针对所述比较字段的每一子组传达所选分析物的统计信息,其中,在所述UI页面上的第三区域内显示按照子组分开的所检取的多个浓度的所述信息,来帮助视觉比较。
14.如权利要求13所述的系统,其特征在于,还包括:
用于接收来自对照组列表的对照组的选择的装置;以及
用于在统计信息的显示上提供关于哪个子组对应于对照组的可视指示的装置。
15.如权利要求13所述的系统,其特征在于,还包括:
用于接收来自过滤参数列表的第一过滤参数的选择的装置,其中所述过滤参数列表包括所述多个第一字段的至少一部分,所述第一过滤参数具有多个第一标准值;
用于接收所述多个第一标准值的一部分的选择的装置;以及
用于显示与所选择部分相对应且不与未选择的第一标准值相对应的统计信息的装置。
16.如权利要求15所述的系统,其特征在于,还包括:
用于基于所选过滤参数刷新可能标准值的用户视图的装置,其中所述可能标准值允许过滤被执行统计分析的数据;
用于基于所刷新的用户视图来接收标准值的一个或多个用户选择的装置;以及
用于基于所选过滤标准过滤统计分析的数据的子组的装置。
17.一种用于生化数据分析的系统,包括:
数据库系统;以及
一个或多个处理器,所述一个或多个处理器被配置成:
接收多个生物样品的数据集,所述数据集具有每一生物样品的多个字段,所述数据集的至少一部分从涉及所述生物样品的实验中获取,其中所述数据集包括:
多个第一字段,每一第一字段包括多个值,每一值对应于各个生物样品的各个特性,以及
多个第二字段,每一第二字段对应于各个分析物并且包括所述实验中的各个分析物的多个浓度,每一浓度对应于各个生物样品;
响应于用户选择所述数据集,用所述多个第一字段自动填充下拉框;
响应于在计算机系统的用户界面(UI)页面中的下拉框的选择,在所述UI页面上的第一区域内显示所述多个第一字段的列表;
接收来自所述多个第一字段的列表的比较字段的选择;
响应于接收到所述比较字段的选择,标识所述数据集中的多个值以用于所选择的比较字段;
基于所选择的比较字段的所标识的多个值标识所述数据集中的所述生物样品的子组以用于统计分析,其中子组的生物样品具有所述比较字段的相同值;
在所述UI页面上的第二区域内显示表中的分析物的列表;
接收来自统计分析的所述多个第二字段的分析物的选择,其中接收来自统计分析的所述多个第二字段的分析物的选择包括:接收所述表中的分析物的选择,并且在所述表中的与所选择分析物相对应的一个或多个单元格中显示与所选择分析物对应的数据的一个或多个统计值;
响应于接收到所述分析物的选择,从所述数据集中标识所选择的分析物的多个浓度;
基于所述分析物和所述比较字段的接收到的选择,提供按照子组分开的所检取的多个浓度的信息的显示,从而针对所述比较字段的每一子组传达所选分析物的统计信息,其中,在所述UI页面上的第三区域内显示按照子组分开的所检取的多个浓度的所述信息,来帮助视觉比较;
接收来自对照组列表的对照组的选择;以及
在统计信息的显示上提供关于哪个子组对应于对照组的可视指示。
18.如权利要求17所述的系统,其特征在于,所述一个或多个处理器还被配置成:
接收来自过滤参数列表的第一过滤参数的选择,其中所述过滤参数列表包括所述多个第一字段的至少一部分,所述第一过滤参数具有多个第一标准值;
接收所述多个第一标准值的一部分的选择;以及
显示与所选择部分相对应且不与未选择的第一标准值相对应的统计信息。
19.如权利要求18所述的系统,其特征在于,所述一个或多个处理器还被配置成:
基于所选过滤参数刷新可能标准值的用户视图,其中所述可能标准值允许过滤被执行统计分析的数据;
基于所刷新的用户视图来接收标准值的一个或多个用户选择;以及
基于所选择的过滤标准过滤统计分析的数据的子组。
CN201280057371.2A 2011-09-22 2012-09-24 用于生化数据分析的系统和方法 Active CN103988078B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161538073P 2011-09-22 2011-09-22
US61/538,073 2011-09-22
PCT/US2012/056939 WO2013044244A1 (en) 2011-09-22 2012-09-24 Systems and methods for biochemical data analysis

Publications (2)

Publication Number Publication Date
CN103988078A CN103988078A (zh) 2014-08-13
CN103988078B true CN103988078B (zh) 2016-11-02

Family

ID=47912369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280057371.2A Active CN103988078B (zh) 2011-09-22 2012-09-24 用于生化数据分析的系统和方法

Country Status (5)

Country Link
US (1) US9792548B2 (zh)
EP (1) EP2758781A4 (zh)
JP (1) JP6096781B2 (zh)
CN (1) CN103988078B (zh)
WO (1) WO2013044244A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130145296A1 (en) * 2011-12-01 2013-06-06 International Business Machines Corporation Dynamic icon ordering in a user interface
US10523728B1 (en) * 2013-06-28 2019-12-31 EMC IP Holding Company LLC Ingesting data from managed elements into a data analytics platform
US10387494B2 (en) * 2014-09-24 2019-08-20 Oracle International Corporation Guided data exploration
US11398308B2 (en) * 2014-12-30 2022-07-26 Cerner Innovation, Inc. Physiologic severity of illness score for acute care patients
WO2017004468A1 (en) 2015-06-30 2017-01-05 Yoshikawa Alex M System and method for management, execution, and analysis of laboratory experiments
CN109325218A (zh) * 2017-08-01 2019-02-12 珠海金山办公软件有限公司 一种数据筛选统计方法、装置、电子设备及存储介质
JP6601988B1 (ja) * 2018-11-30 2019-11-06 株式会社Splink 情報生成システム及び情報生成方法
CN112988692B (zh) * 2019-12-13 2024-05-07 阿里巴巴集团控股有限公司 数据处理方法及装置
CN112557284B (zh) * 2020-12-03 2023-05-30 桂林优利特医疗电子有限公司 一种进行自动调节cv质控的方法、装置及相应的流式细胞仪
US20230229299A1 (en) * 2022-01-18 2023-07-20 Waters Technologies Ireland Limited Methods, mediums, and systems for processing custom field formulas

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6683455B2 (en) * 2000-12-22 2004-01-27 Metabometrix Limited Methods for spectral analysis and their applications: spectral replacement
CN1902587A (zh) * 2003-12-17 2007-01-24 Sap股份公司 数据处理系统和方法
CN101079030A (zh) * 2006-05-25 2007-11-28 上海宝信软件股份有限公司 质量分析系统中的数据处理方法
CN101528118A (zh) * 2006-11-03 2009-09-09 Ric投资有限责任公司 患者信息管理系统
US7901873B2 (en) * 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999013316A1 (fr) * 1997-09-08 1999-03-18 Hitachi, Ltd. Systeme d'examen des urines
US6633772B2 (en) * 2000-08-18 2003-10-14 Cygnus, Inc. Formulation and manipulation of databases of analyte and associated values
US20040080536A1 (en) * 2002-10-23 2004-04-29 Zohar Yakhini Method and user interface for interactive visualization and analysis of microarray data and other data, including genetic, biochemical, and chemical data
JP4679843B2 (ja) 2004-07-02 2011-05-11 シスメックス株式会社 血液分析装置および分析プログラム
US8019749B2 (en) * 2005-03-17 2011-09-13 Roy Leban System, method, and user interface for organizing and searching information
GB2428240A (en) * 2005-07-14 2007-01-24 Univ Gen Ve Diagnostic method for brain damage-related disorders
JP2007333466A (ja) 2006-06-13 2007-12-27 Olympus Corp 分析装置
EP2041707A1 (en) * 2006-07-10 2009-04-01 Mercato Solutions Limited Improvements in data retrieval and handling systems, virtual warehousing, price comparison, price aggregation and stock availability engines
AU2008242910A1 (en) * 2007-04-17 2008-10-30 Emd Millipore Corporation Graphical user interface for analysis and comparison of location-specific multiparameter data sets
US7908266B2 (en) * 2007-07-18 2011-03-15 Sas Institute Inc. Systems and methods for automatically creating an SQL join expression
JP4866808B2 (ja) * 2007-07-31 2012-02-01 株式会社日立ハイテクノロジーズ 自動分析装置
US8150711B2 (en) * 2007-10-05 2012-04-03 Cerner Innovation, Inc. Generating and managing medical documentation sets
US8843437B2 (en) * 2007-10-18 2014-09-23 Agilent Technologies, Inc. Measurement data management with combined file database and relational database
JP5210800B2 (ja) 2008-10-31 2013-06-12 シスメックス株式会社 検体分析装置、検体分析装置における試薬情報表示方法およびコンピュータプログラム
JP2010230428A (ja) * 2009-03-26 2010-10-14 Tohoku Univ 検査データの評価方法および装置
US9389238B2 (en) * 2009-09-28 2016-07-12 Hitachi High-Technologies Corporation Automatic analyzing device, information display method thereof, and information display system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6683455B2 (en) * 2000-12-22 2004-01-27 Metabometrix Limited Methods for spectral analysis and their applications: spectral replacement
US7901873B2 (en) * 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
CN1902587A (zh) * 2003-12-17 2007-01-24 Sap股份公司 数据处理系统和方法
CN101079030A (zh) * 2006-05-25 2007-11-28 上海宝信软件股份有限公司 质量分析系统中的数据处理方法
CN101528118A (zh) * 2006-11-03 2009-09-09 Ric投资有限责任公司 患者信息管理系统

Also Published As

Publication number Publication date
JP2014528080A (ja) 2014-10-23
EP2758781A1 (en) 2014-07-30
JP6096781B2 (ja) 2017-03-15
EP2758781A4 (en) 2015-05-27
US9792548B2 (en) 2017-10-17
US20130080373A1 (en) 2013-03-28
WO2013044244A1 (en) 2013-03-28
CN103988078A (zh) 2014-08-13

Similar Documents

Publication Publication Date Title
CN103988078B (zh) 用于生化数据分析的系统和方法
dos Santos et al. Data mining and machine learning techniques applied to public health problems: A bibliometric analysis from 2009 to 2018
Hunter et al. The role of artificial intelligence in early cancer diagnosis
Tannenbaum et al. Sex and gender analysis improves science and engineering
McNally et al. BURRITO: An interactive multi-omic tool for visualizing taxa–function relationships in microbiome data
Khoury et al. Transforming epidemiology for 21st century medicine and public health
López-Illescas et al. Coverage and citation impact of oncological journals in the Web of Science and Scopus
Parmigiani Use R!
Riehle et al. The Genboree Microbiome Toolset and the analysis of 16S rRNA microbial sequences
CN106971071A (zh) 一种临床决策支持系统及方法
Diggins et al. Generating quantitative cell identity labels with marker enrichment modeling (MEM)
Noumba et al. Do globalization and resource rents matter for human well-being? Evidence from African countries
Ansarifar et al. Performance prediction of crosses in plant breeding through genotype by environment interactions
Ahamad et al. Early-stage detection of ovarian cancer based on clinical data using machine learning approaches
Campos et al. A vulnerability analysis for the management of and response to the COVID-19 epidemic in the second most populous state in Brazil
Wiréhn et al. Assessing agricultural vulnerability to climate change in the Nordic countries–an interactive geovisualization approach
Laurinavicius et al. Comprehensive immunohistochemistry: digital, analytical and integrated
McBroome et al. Identifying SARS-CoV-2 regional introductions and transmission clusters in real time
Dhariwal et al. ResistoXplorer: a web-based tool for visual, statistical and exploratory data analysis of resistome data
Leon et al. Routine Health Information System (RHIS) interventions to improve health systems management
Windels et al. Graphlet Laplacians for topology-function and topology-disease relationships
Holzhüter et al. Visualizing uncertainty in biological expression data
Adelson et al. Machine Learning Approach for Improved Longitudinal Prediction of Progression from Mild Cognitive Impairment to Alzheimer’s Disease
Liu et al. Regional Accuracy Assessment of 30-Meter GLC_FCS30, GlobeLand30, and CLCD Products: A Case Study in Xinjiang Area
Galloway-Peña et al. Novel approaches in microbiome analyses and data visualization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant