CN110300980A

CN110300980A - 实验室数据的探索与可视化

Info

Publication number: CN110300980A
Application number: CN201680049795.2A
Authority: CN
Inventors: A·M·吉川; A·V·萨思绥; A·奥塔; B·C·克莱恩; B·M·邦德; B·M·佛雷扎; C·R·拉穆勒; C·L·霍夫勒; C·Y·李; C·E·韦伯斯特; D·J·克莱伯姆; G·N·斯坦利; G·W·弗雷泽; G·罗比肖; H·E·布克曼; J·R·麦克南; J·K·梁; P·R·楚雷克; R·M·蒂德; R·E·瓦拉斯
Original assignee: Emerald Cloud Labs Inc
Current assignee: Emerald Cloud Labs Inc
Priority date: 2015-06-30
Filing date: 2016-06-30
Publication date: 2019-10-01
Anticipated expiration: 2036-06-30
Also published as: CN110300980B; EP3317826A1; JP2021177178A; IL256647A; SG10202105478TA; CN110300982A; AU2022201311B2; IL310917A; CA2991094A1; AU2016287731B2; EP3317824A1; IL256644B; HK1255230A1; JP2018523227A; IL256644A; US20180190386A1; JP2018531367A; US20180196913A1; HK1255231A1; JP2023123585A

Abstract

本公开提供了用于进行和管理集成的实验室实验的系统和方法。该系统包括进行大量不同类型的实验的连接的各种实验仪器，以及用于设计实验和调整用于实验的参数的用户界面。通过集成，系统可以进一步从相关样本和仪器中获取数据，以确定或调整某些实验参数来优化实验效率和结果。

Description

实验室数据的探索与可视化

相关申请的交叉引用

本申请依据35U.S.C§119(e)要求均于2015年6月30日提交的美国临时申请序列号62/186,928和62/186,936的优先权，其全部内容通过引用并入本文。

背景技术

数据可视化和分析是生命科学研究的重要工具。数据可视化是计算机图形学、科学可视化和信息可视化在解释和探索实验数据中的应用。示例包括HPLC曲线的可视化、凝胶电泳图像、DNA和蛋白质序列、基因组、比对、系统发育、大分子结构、系统生物学、显微镜和磁共振成像数据。可用于协助进行数据可视化和分析的软件工具通常需要从不同来源导入数据，并且无法将这些数据集成到对可视化和分析有用的附加信息。

生命科学研究项目通常涉及大量延续很长一段时间的步骤，每个步骤可能需要不同的仪器并具有不同的输入和输出样本。例如，筛选siRNA可涉及siRNA合成、纯化、验证和定量、无细胞测定和体外测试。没有单一仪器被设计来进行如此多样的实验，目前还没有用于灵活地指定和自动化这种多技术、多仪器、多平台研究项目的系统或方法。事实上，本领域的许多技术人员将通用的实验平台视为不可能的，因为可能存在几乎指数级的许多技术组合以及可以随着每种技术改变的无数特定参数。尽管一些人声称具有灵活性，但是该领域实际的现实情况是，功能系统集中于自动化或电子化地表示一个小型的、受限制的、明确定义的以一个特定任务为中心的实验集，例如高通量筛选特定酶的配体。这种限制性的方法通过完全避免通用问题的指数规模来“解决”这一问题，因此不能提供构建如本文所公开的真正灵活的通用实验系统的技术基础。

其中一个原因在于，用于管理、存储和查看实验数据的现有电子系统没有指定以适合于计算机化分析和推理的机器可读形式使用的实验协议。因此，即使计算机可以访问原始实验数据，对于生成原始数据的实验也缺乏丰富的理解。例如在Indigo电子实验笔记本(“ELN”，Electronic Lab Notebook)中，实验协议只是自由文本。参见例如EPAM LifeSciences，Indigo ELN用户指南版本1.2，图18，右下图。因此，关于在Indigo ELN中的实验设置的信息不是机器可解析的，并且不能以程序方式验证或将由自由文本实现的实验协议信息与存储在系统中的其他信息相关联。正如许多领域所观察到的，这样做的一个后果在于不可能验证自由文本中包含的实验协议信息的完整性。这样做的另一个后果在于无法将实验协议信息和产生的实验数据连接在一起，因此无法实现将实验连接在一起的高效、可靠和可扩展的通用框架。

发明内容

在一些实施例中，本公开提供了用于实验数据的数据分析的系统和方法。该分析可以包括不是从本实验直接生成的参考数据，该参考数据可以是由用户提供的、由系统利用用户的输入计算的或者由系统不使用来自用户的任何输入而计算的实验参数的值。这种参考数据的另一个示例可以是关于仪器的信息，例如仪器的校准方法。

在一个实施例中，提供了用于分析从实验室实验获得的数据的系统，其包括处理器、存储器和程序代码，包括被配置为存储用于执行实验的实验参数的值的实验模块；被配置为存储来自实验的结果的数据模块；被配置为存储关于运行实验的仪器的信息的仪器模块；被配置为存储运行实验的环境条件的环境模块；以及数据可视化模块，其被配置为显示存储在所述数据模块中的结果的视觉表示，其中所述视觉表示还包括从由以下各项组成的组中选择的一个或多个参考数据点的表示：实验参数的值，关于仪器的信息和环境条件。

另一个实施例提供了一种用于分析从实验室实验获得的数据的系统，包括处理器、存储器和程序代码，包括：实验模块，所述实验模块被配置为显示实验中使用的样品的标识、用于进行实验的仪器的标识、从实验中生成的数据集的标识，以及环境记录的标识，所述环境记录包括进行实验的时间和地点的环境条件的测量；数据模块，被配置为显示数据提取或可视化以表示数据集，识别生成数据集的实验并识别在数据集上执行的分析；仪器模块，被配置为显示在仪器上进行的实验的列表，在仪器上运行的对照实验的列表以及仪器的维护记录；分析模块，被配置为显示进行分析的数据集的识别以及表示分析结果的分析摘要或图形；以及环境模块，被配置为显示进行实验的时间和地点的环境条件，其中该系统使得用户能够在向用户呈现由实验模块显示的实验面板的同时探索与实验有关的信息：(1)允许用户点击实验面板上的实验生成的数据集的标识，从而调用数据模块以显示对数据面板上的数据集执行的分析的标识，这允许用户点击在数据集上执行的分析的标识以调用分析模块以在分析面板上显示表示分析结果的分析摘要或图形；(2)允许用户点击环境记录的标识，从而调用环境模块以显示实验进行的时间和地点的环境条件；(3)允许用户点击进行实验的仪器的标识，从而调用仪器模块以在仪器面板上显示在仪器上运行的对照实验的列表，以及与实验相关的仪器的维护记录。

本公开在一些实施例中提供了用于实现用于实验室实验设计、调整、调度、编译、执行、分析、可视化、验证和共享的集成系统的系统、方法、计算机可读介质、模块和装置。这样的系统能够适应不同种类的样本在不同类型的仪器上运行。此外，不同的样本、实验和仪器被整合，以使得来自不同实体的信息可以共享，从而有益于实验的设计、验证和分析。

本公开的一些实施例的系统的集成在至少几个方面可以是有利的。例如，在用户针对一个实验输入一个或多个参数后，系统可以验证参数，建议替代参数或最佳参数，相应地调整其他参数，或者填写用户没有给出输入的其他参数。因此，在没有来自用户的有限输入的情况下，系统可以生成用于执行实验的完整的指令和参数集，从而导致高可预测性和可再现性。这样的指令可以被逐项化，线性化，并行化，以其他方式被优化，并且提供用于进行实验的明确命令。

另一个优点在于，集成系统允许用户在同一个界面中执行分析，该界面指定生成数据的实验，接收生成的数据，和/或在生成数据之后便于设计额外的实验。尽管并不总是可见的，但是在某些实施例中，本系统针对一个实验生成一组完整的指定参数。

所公开的本发明不同于传统技术，其对于难以分类或定量的信息采用自由的非结构化条目。在一个实施例中，本技术提供对同时支持期待动作(例如实验)和数据的结构化输入的用户界面内的编程语言的支持。与本领域可用的大量自由文本输入系统相比，编程语言的使用允许将实验规范、实验的实际执行、所产生的数据关联在一起，以及在一个环境中的一个线性进程中分析。此外，该进展以及整体进展的元素是机器可读的，并且可以进行明确的计算处理。

根据本技术的一个实施例，系统对实验设计期间的每个步骤进行保证，这在分割的系统中实际上是不可能的。在这种情况下的保证意味着对实验协议的描述是完整的，即包括进行实验所需的所有信息。另一方面，该保证在于实验方案自动链接到详细记录实际实验运行的日志、控制日志、输出的样本和生成的数据。在一些实施例中，链接被用于将一个实验协议关联到另一个。用户可以直接引用原始实验然后仅指定用户想要以不同的方式完成的内容(例如不同的样本输入、不同的温度，不限于此)，而不是简单地复制和粘贴原始实验协议然后更改输入样本。这有利地允许非常紧凑且易于阅读的代码，而不会损失完整性、精确性或再现性。根据本技术的一个实施例，系统被配置为保证当用户复制实验协议时，使用新的参数或输入的重新运行可以相应地调整和验证。

本公开的另一个实施例涉及以编程方式为实验提供合理的默认设置。用户只需要指定哪一个不同。如果实验不是以机器可计算的形式(例如自由文本)来表示，则这是不可能的。此外，默认设置通过不强制用户输入实验所需的每个参数，大大提高了易用性。在另一个实施例中，该实验自动地与关于实验中使用的材料的物流信息相关联，例如所使用的储备溶液的年份。

本技术的某些实施例的另一个优点在于分析模块可以自动理解实验的输出，因为在预先指定实验中，系统从上下文意识到输出的定义。

附图说明

附图中的图仅通过示例的方式描述了所提供的实施例，其中：

图1示出了用于选择要在本公开的系统上运行的实验类型的用户界面；

图2示出了在选择实验类型之后向用户呈现用于选择样本的界面；

图3示出了用户选择要在实验中运行的样本的界面；

图4示出了被选择用于实验的样本；

图5示出了允许用户调整实验参数的用户界面；

图6A示出了用户调整过的某些实验参数；

图6B示出了在评估参数的输入值时，由系统给出的警告；

图7示出了系统确认已经由用户成功指定并由系统成功接收生效的实验；

图8示出了数据模块的界面；

图9示出了实验模块的界面；

图10示出了仪器模块的界面；

图11示出了通过其界面上的链接来相互连接的多个对象的示例，允许用户探索相关信息；

图12A至图12C示出了可以被包括在分析或报告模块的界面上的可视化面板以及各种图标；

图13示出了系统如何整合能够在系统上执行的实验室研究项目的不同元素；

图14-图17示出了生成或用于数据勘探和挖掘的相互连接的对象的多个示例；

图18示出了整体系统设计；

图19示出了本公开的一个实施例的系统；以及

图20A-G示出了本公开的一些实施例的系统。

附图中的一些或全部是示例的示意性说明；因此，它们不一定描绘所示元素的实际相对尺寸或位置。出于说明一个或多个实施例的目的而呈现附图，明确理解它们将不被用于限制所附权利要求的范围或含义。

具体实施方式

本公开提供了用于指导和管理综合实验室实验的系统和方法。该系统可以包括连接到一个或多个计算机或与一个或多个计算机互连的各种实验室仪器。计算机可以相对于它控制的独立仪器是本地或远程的，发送命令到每个单独的仪器，并接收输出。计算机可以单独操作，也可以作为更大的一组计算机的一部分，例如数据中心。为了促进用户、仪器和计算机之间的通信，已经开发了基于来自Wolfram Research(Champaign，IL)的语言的被称为“符号实验室语言”(SLL，Symbolic Lab Language)的计算机语言包。为了说明一个或多个实施例的概念方面的目的，呈现了SLL脚本和句法，而应明确理解它们将不被用于限制所附权利要求的范围或含义。此外，可以创建用户界面(例如，图形用户界面、网络界面、Windows或Mac界面或移动界面)，使不熟悉计算机语言的用户能够有效地使用该系统。

用于实验设计和管理的用户界面

图1-7示出了供用户设计要由本公开的系统的一个实施例运行的实验室实验(或简称为“实验”)的计算机用户界面。本文所使用的术语“实验”是指进行以做出发现、测试假设或者展示事实的涉及使用生物或化学样本或试剂的过程。可以认识到的是，实验可以如单一步骤一样简单并且不需要生物或化学反应(例如，检查样本在260nm处的吸光度)。还应理解的是，一个实验不需要尽可能完整地作出结论性的发现或支持或不支持假设。本文中使用的术语“技术”是指用于完成特定任务，特别是科学程序的执行或实现的专用程序和方法。为了提高本公开的清晰性，术语“技术”应该用于指代可以结合起来进行实验的单独的步骤。然而，这纯粹是为了清楚起见，并不限制在本公开中使用的术语“实验”的范围和定义，例如，技术也是实验。最后，本文所使用的术语“方案”是指用于科学实验的计划。与“技术”一样，该术语用于使文章清晰，并不意图限制术语“实验”的定义或范围，例如上下文中的术语“实验”可以指该实验的方案。

在图1中，界面100包括菜单区域101、主面板102和计算机脚本面板103，在本文中有时被称为“笔记本”、“实验室笔记本”或“电子实验室笔记本”。本文所使用的术语“脚本”是指以计算机编程或脚本语言编写的指令，其可以在先前编译成机器语言程序或未经编译的情况下执行。计算机脚本面板被配置为交互式地显示和处理以编程或脚本语言编写的指令，并且可选地还可以被配置为显示和处理纯文本、数据、图像和其它媒体。面板也可以嵌入其他面板。例如，在一些实施例中，脚本面板被配置为包括数据、实验、可视化以及本文公开的其他面板。这些面板可以通过图形用户界面调用，也可以通过在脚本面板中输入脚本命令来调用。类似地，如在本公开的其他地方所讨论的，模块也可以被嵌入在其他面板和模块内。菜单区域包括在界面的使用期间的任何点处供用户从中选择的菜单选项104的列表。菜单项“Projects(项目)”允许用户组织实验，包括记录在笔记本中的实验形式，以及创建、查看、修改、删除、分享或试验项目。“Samples(样本)”允许用户添加、修改、注释、选择、删除或检查样本。由于样本可以由用户从远程位置提供，“样本”菜单还允许用户检查样本的接收状态、数量和状况等。菜单项“Models(模型)”使用户能够访问各种概念框架、本体论实体、受控术语、受控分类法或其他知识表示方案，其参数化其中可能与样本相关联的物理性质，以及物理对象的概念性占位符。“Reports(报告)”显示系统在实验过程中或实验后生成的报告，允许用户生成可视化，提取或操作数据，并检查实验过程和条件。不限于此，另一个菜单项“Data(数据)”提供对原始数据、处理后的数据、经组织的数据或提取的数据的访问。可以在菜单区域中呈现的菜单选项或者其他可用的菜单选项不限于以上示例或者在图1中示出的菜单选项。例如，附加菜单选项可以包括但不限于“实验”、“绘图”、“模拟”“分析”和“搜索”。

当创建新项目时，主面板102将向用户显示相关信息并允许用户输入适当的输入。例如，如图1所示，从多个命令(105)中，用户选择“Compile Experiment(编译实验)”，并且作为响应，界面示出了106中的可用实验类型的列表。编译实验是指编写或验证限定该实验的脚本的过程，包括验证指定的参数(包括样本)，导出未指定参数的值，生成执行脚本所需的计算机对象，以及可选地在实验室中进行实验，发送结果和/或分析结果。在一些实施例中，术语“执行”与编译同义地使用，特别是关于在实验室中的参数验证、对象生成以及可选地对实验进行变化。最后，虽然图1描述了一个实施例，但是也可以使用其他布局和面板组。

实验类型

与典型商业实验室仪器附带的计算机系统和软件包不同，本公开的系统和软件能够整合不同类型的实验室仪器。因此，本系统能够以单个和任何兼容的组合的方式远程运行各种实验，包括组成串联或并联的连续实验的组合。这种能力体现在界面上。本公开的系统和软件可以有利地被配置成拒绝运行物理上无意义的或危险的组合，例如创建固体材料，然后试图用液体处理装置来操纵它。在本公开中列举的实验和技术的类型是为了说明一个或多个实施例的功能性，并且明确地理解它们将不被用于限制所附权利要求的范围或含义。

因此，在一个实施例中，实验技术的列表包括以下类型中的至少两种：合成、纯化、扩增、定量和细胞培养。一方面，列表至少包括合成和纯化。在一个方面，列表至少包括扩增和定量。一方面，列表至少包括纯化和细胞培养。

在一些实施例中，列表可以进一步包括除定量之外的技术(非定量技术)。非定量技术可以包括例如色谱法、显微术、电泳、光谱学和体积或重量检查。在特定的示例中，列表可以至少包括核酸或蛋白质合成、核酸或蛋白质分析以及核酸扩增。此外，实验技术可能属于多种类型，例如，高效液相色谱(HPLC)既是纯化技术也是定量技术。

“合成”是指在不使用细胞的情况下从起始材料生产有机或生物分子。有机合成可以是全合成或半合成。全合成是从简单的、商业上可获得的或天然的前体完成的复杂有机分子的化学合成。全合成可以通过线性或收敛方法完成。在线性合成中，一个接一个地进行几个步骤直到分子完成。在每个步骤中制造的化合物被称为合成中间体。对于更复杂的分子，不同的方法可能是优选的：收敛合成涉及几个“片段”(关键中间体)的单独制备，然后将其组合以形成期望的产物。半合成或部分化学合成是使用从天然来源(例如植物材料或细菌或细胞培养物)分离的化合物作为起始材料的化学合成类型。这些天然生物分子通常是大而复杂的分子。这与全合成相反，其中，小分子和廉价(通常是石油化学)结构单元的逐步组合合成大分子。

在一个方面，合成是生物分子(例如，核酸或肽)合成。核酸合成是具有确定的化学结构(序列)的相对较短的核酸片段的化学合成。有时候，这个过程是通过使用亚磷酰胺法和衍生自被保护的2'-脱氧核苷(dA，dC，dG和T)、核糖核苷(A，C，G和U)的亚磷酰胺结构单元或化学修饰的核苷(例如LNA或BNA)的固相合成。其他方法也是可用的。可以通过将一个氨基酸的羧基或C端与另一个氨基酸的氨基或N端偶联来合成肽。由于可能发生意想不到的反应，通常需要保护基团。化学肽合成可以是液相合成或固相合成，不限于此。分子合成的非限制性示例包括DNA/RNA合成、有机合成(毫克至克级)和肽合成。

“纯化”是指增加样本中所需物质(例如细胞、化合物、核酸或肽分子)浓度的方法，其通常包括去除被认为是杂质的物质。纯化实验的非限制性示例包括基因组DNA制备、离心、流式细胞术、快速蛋白质液相色谱法(FPLC)、快速色谱法、HPLC(离子交换)、HPLC(反相)、RNA提取、cDNA制备、蛋白质提取、固相萃取(TLC)、薄层色谱法(TLC)、琼脂糖凝胶电泳、毛细管电泳、错流过滤(TFF)、透析(制备型)、荧光激活细胞分选(FACS)、HPLC(正相)、HPLC(制备型)、免疫沉淀、气相色谱法、气相色谱质谱(GC-MS)、液-液萃取和超临界流体色谱法(SFC)。

本文使用的术语“扩增”是指增加样本中核酸片段的拷贝数的过程。最著名的扩增方法是聚合酶链式反应(PCR)方法，包括定量实时PCR(qPCR)和数字液滴PCR。

“定量”是指确定生物物质，特别是蛋白质或核酸分子的量的过程。非限制性示例包括总蛋白定量、快速蛋白液相色谱(FPLC)、HPLC(离子交换)、HPLC(反相)、薄层色谱法(TLC)、UV/Vis光谱、蛋白质印迹法(Western blot)、微阵列分析、流式细胞术、HPLC(正相)和HPLC(制备型)。

“细胞培养”包括在培养的细胞上生长细胞或进行实验的实验，例如蛋白质表达、凋亡测定、哺乳动物细胞培养、转染、细菌细胞培养、酵母细胞培养、菌落采集和电穿孔。

“非定量分析”是指除定量之外的揭示某些特征(例如分子量、分子同一性、序列、大小、纯度、pH值、动力学、电荷、熔点、糖基化状态)的任何实验。非定量分析的实例包括但不限于，分析天平读数、荧光显微镜、快速蛋白液相色谱法(FPLC)、快速色谱法、荧光动力学、荧光偏振、荧光光谱法、荧光热力学、HPLC(离子交换)、HPLC(反向)、光学显微镜、MALDI质谱、pH读数、聚丙烯酰胺凝胶电泳(PAGE)、温度计读数、薄层色谱法(TLC)、UV/Visual(Vis)动力学、UV/Vis光谱，UV/Vis热力学、蛋白质印迹(Western blot)、体积检查、琼脂糖凝胶电泳、原子吸收光谱法、原子发射光谱法、原子力显微镜、毛细管电泳、圆二色性(CD)、共聚焦显微镜、透析(平衡)、差示扫描量热法(DSC)、DNA测序(下一代)、DNA测序(Sanger)、动态光散射(DLS)、电子显微镜、电喷雾电离(ESI)质谱、酶联免疫吸附测定法(ELISA)、HPLC(正相)、HPLC(制备型)、荧光原位杂交(FISH)、气相色谱、气相色谱质谱(GC-MS)、电感耦合等离子体质谱(ICP-MS)、红外光谱、等温滴定量热法(ITC)、液相色谱质谱(LC-MS)、熔点测定、微阵列分析、核磁共振(2D/结构)、核磁共振(碳)、核磁共振(质子)、膜片钳记录、光激励发光(PSL)、超临界流体色谱(SFC)、折射法、扫描隧道显微镜、溶解度测试、表面等离子体共振(SPR)、串联质谱(MS-MS)、全内反射荧光(TIRF)显微镜法，和X射线晶体学。

在一些方面，列表进一步包括一个或多个以下实验：高压灭菌、缓冲液制备、液体处理、冻干、旋转蒸发、真空离心蒸发(speedvac)浓缩、真空过滤、病毒制备、拟南芥研究、生物反应器、弹式量热法、秀丽隐杆线虫研究、结晶、果蝇研究、流动化学、质粒构建、超声处理、组织均质化、超速离心、微波反应和分子克隆。

转换和显示脚本

在界面100上，用户可以向系统给出指令，例如通过在主区域102中进行期望的选择。如图2所示，指令是进行“Western Blot”实验。这些指令将被转换成计算机代码，以指示相应的仪器进行实验。在一些实施例中，计算机代码是以脚本语言的形式。在一方面，脚本语言是符号实验室语言(SLL)。

SLL是基于语言开发的。除了提供的用户友好的语法和全面的数据操作和可视化功能之外，SLL还包括专门为生命科学设计的功能、对象和知识表示。如本文所使用的，除非另有说明，没有进一步修改的“对象”是指数据结构和/或功能。同样重要的是，模块已经被构建用于与大量的实验室仪器接口，以实现有效的仪器管理和数据通信。

SLL可以以各种性能折衷在各种数据库上得到支持。如本文所使用的，术语“数据库”是指保存在计算机中的结构化数据集，特别是可以以各种方式访问的结构化数据集。数据库类型的非限制性示例包括关系数据库、图形数据库、概率数据库、XML、SQL、XQuery和NoSQL。数据库的非限制性示例包括PostgreSQL、MySQL、Oracle Relational DBMS、MongoDB、DB2和Cassandra。

SLL为查询、操作和显示实验结果提供了一个客观的系统。每个实验的结果，包括参与绘图(如色谱或光谱等)、图像(如凝胶，印迹和显微镜幻灯片)和元数据(如实验的日期，在实验过程中使用的试剂，用于进行实验的仪器等)的数据点被表示为对象，并被处理并插入到数据库中并连接在一起。在一个实施例中，这是通过可用于访问这样的相关但概念上不同的信息的指针或“密钥”来实现的。当一个对象与多个异质实验相关时，例如，仪器对象与利用该仪器的所有实验相关联，而不管精确的实验技术，样本类型等如何，这是特别有力的。

这种设置使得科学家们可以轻松而紧凑地在多个笔记本和团队之间共享数据，而不会丢失定量精度或任何相关细节。

此外，通过给予人们编写处理这些对象作为输入并以算法方式处理它们的脚本的能力，每个SLL的数据对象的计算系统允许人们抽象地处理大量的实验数据组。

为了更清楚地说明SLL以及由SLL实现示例出的所公开的本发明的一些概念，以下是SLL对象、函数及其使用的非限制性示例。

数据对象的示例：data[索引,<类型>]，例如data[44,NMR]可以指向在实验室中执行的第44次核磁共振(NMR)实验，data[1023,MALDI]是指执行的第1023次基质辅助激光解吸/电离(MALDI)实验的组合的结果。精确的索引方案并不重要-既不需要时间顺序，也不需要任何特定的符号标识符，例如用户定义的字符串可以用来标识一个对象，只要系统能够可靠地确定预期的对象即可。

函数的示例：

info[]-调用数据对象的信息，例如info[data[44,NMR]]连接到数据库，然后返回与该实验相关的所有数据的列表。在一些实施例中，info被配置为在本地缓存该数据，使得对info[]的进一步调用将自动引用本地缓存副本(以使得执行时间更快)，而不是连接到数据库；以及

inform[]-以替换规则的形式调用与实验相关联的所有数据的列表的报告：将检查以查看数据是否已经被插入到数据库中，如果是，则返回先前插入的data[]对象，否则会将该data插入到数据库中，并返回一个新的data[]指针指向该对象。

SLL还包括跟踪和查询实验室样本的完整历史记录的功能。跟踪信息的示例包括：关于原材料的信息；从其创建过程所包括的处理中获得的术前信息；其目前的性质，比如它所使用的实验；质量保证(QA)信息；有关其性质的信息，如体积、浓度和pH值；有关其先天性质的信息，例如化学成分，以及在实验室或设施中的物理位置。

对象的其他例子：

表示物理样本(sample)的对象：sample[“样本名”,<类型>],例如sample[“最近邻居链4”,“DNA”]封装涉及该样本的信息，如涉及其创建所包括的原材料、涉及的生产实验的实验结果和日期，样本的属性，如体积、pH值、浓度，以及在实验室中的物理位置(储存的地方)；或者

group[“集合名”]，例如group[“最近邻居链”]是指你想要批量处理的样本的集合。组(group)可以引用任何大小的样本集合，样本可以是多个组的成员。

协议对象是根据实验函数的执行生成的。例如，执行命令：ExperimentHPLC[sample[“粗糙近邻序列5”]，Method->离子交换，FlowRate->3毫升/分钟]将产生协议对象procotol[12345，HPLC]，系统利用该协议来指导和协调由通过以每分钟3毫升的流速运行制备型离子交换HPLC的粗糙近邻序列5的纯化导致的新的物理样本(和相应的样本对象)的产生。通过这种方式，实验函数被用于从实验室笔记本内指导实验室内的物理活动。在优选实施例中，这由协议对象介导，但是也可以利用其他对象配置。此外，在优选实施例中，协议对象被返回给用户。

在优选的实施例中，代表实验的协议对象被放置在队列中以等待处理成实际研究设施中的命令和切实动作。最初，从笔记本内执行任何实验函数，开始于将涉及该处理的样本和指令添加到处理队列中。处理队列是等待在实验室内物理执行的实验队列。在一些实施例中，处理队列的管理由人来执行，而在其他实施例中，其由计算机算法管理或由人和算法决策联合管理。一个实验从队列中移除并执行后，最初启动实验的用户将被告知实验已完成，并接收到来自该实验(样本和/或数据)的结果。在优选实施例中，用户接收代表样本和/或数据的计算机对象，其允许用户访问关于该结果的相关信息。

此外，当协议对象从队列中取出并由编排模块处理时，生成用于执行指定实验(本领域中通常称为实验协议，因此称为“协议对象”)的实际指令。编配模块可以位于要进行实验的实验室中、远程服务器上或其他地方，只要它能够与要进行实验的实验室进行通信即可。当操作人员在实验室进行给定实验时，生成的指令的相关方面会作为计算机、便携式平板电脑、智能手机或其他能够共享信息的远程设备上的动态交互清单呈现给他。随着操作人员进行该处理，这些清单将显示标记每个步骤的完成的字段，输入来自指令的文件名、标准观察值，甚至在运行出现意外困难时的详细注释等信息。部分由于所生成的指令与实验参数、物理样本输入、环境传感器以及其他上下文信息的编程连接，优选实施例还支持与特定仪器程序和物理跟踪设备(例如条形码或射频识别标签)的整合，用于跟踪在实验过程中使用的源材料，并自动链接该信息以输出样本和任何结果数据。此外，所产生的指令本身可以响应于从实验室接收的信息而动态地改变。本领域技术人员将容易认识到，由编配模块分配给人的某些步骤也可以被分配给机器人系统，单独或与人类合作，并且这些变体也要求保护。

一旦接收到在用户界面100处接收到的指令并将其转换为计算机脚本，脚本就可以显示在脚本面板103中。这样的显示器有多种用途。首先，用户可以通过左侧的图形界面将脚本与用户的指令进行比较来确认该指令。其次，不熟悉脚本语言(例如SLL)的用户可以通过基于图形用户界面中的用户输入来查看动态生成的脚本来熟悉该语言。第三，用户可以直接在脚本面板中输入脚本，或者修改已有的脚本。由于脚本的直接编写提供了更好的灵活性和更多的控制，给用户直接访问脚本可以进一步增强用户的权利。在优选实施例中，脚本面板是例如在Mathematica中找到的解释开发环境的一部分，并且脚本以解释计算机语言(例如基于SLL的Wolfram语言)编写。其他实施例支持其他解释和编译语言，例如SciPy和NumPy，以及编译和解释开发环境。

在某些方面，当用户在脚本面板直接输入脚本命令或者修改现有脚本命令时，添加或改变可以反映在面板102中。例如，如果用户将面板103中所示的脚本从“experiment[蛋白质印迹]”到“experiment[转染]”，而不是提示用户选择蛋白质样本和抗体样本，界面会提示用户识别DNA样本和细胞样本。

样本选择

一旦在106中选择了实验类型，系统将确定实验所需的样本类型，并提示用户选择合适的样本。例如，在图2的示例中，用户点击“Western Blot(蛋白质印迹)”，然后系统确定这样的实验需要蛋白质样本和抗体样本，并相应地显示两个输入区域201和202，供用户识别样本。在一些实施例中，系统将仅在尝试执行函数时确定样本类型和其他参数。

可以将从头开始创建的或从计算机上的数据源中标识的样本发送到设施，作为整个系统中已经存在的样本。当创建样本(或者在数据源中输入新的样本)时，用户可以有注释选项，即指定样本的各种属性的值，例如浓度、体积、纯度、生成日期和/或准备样本的实验室或技术人员的姓名，不限于此。在优选实施例中，系统被配置为要求某些特性的注释，例如以确保输入可能的子序列实验执行所必需的信息。

根据样本或实验的类型，实验设计可能需要样本的某些特性。例如，HPLC实验可能需要蛋白质样本的pH值和浓度。如果用户不提供pH值和浓度，则系统将需要相应地处理缺少的数据。例如，系统可以添加一个步骤来确定样本的pH和浓度，然后根据需要将其调整到最佳值。在没有这样的确定或在这样的确定之前，系统可以使用预定的默认值。系统还可以提示用户输入缺少的样本属性值。

在一些方面，系统为重要参数(例如，pH值、浓度、体积)设置确定步骤，无论用户是否为样本提供这样的信息。如果用户提供的信息不准确或信息例如在运送期间已经改变，这是有用的。系统还可以交叉检查相关参数或依赖属性，以确保内部一致性。

当选择用于实验的样本时，如图3所示，用户可以简单地突出显示来自菜单301的期望的样本，并将其拖放到适当的区域(201或202)。如上所述，这样的样本选择将触发相应的计算机脚本的生成，其将被显示在脚本面板103中。

在附图中未示出的一些实施例中，用户可以选择首先选择样本，随后选择实验类型。在这种情况下，向用户呈现实验类型时，系统可以根据样本类型过滤实验类型列表。例如，如果选择DNA样本，蛋白质印迹将不会被列入清单。用户也可以直接输入脚本而不需要图形辅助的帮助。

实验参数调整

一旦识别了实验类型和样本，系统将向用户呈现界面以设置实验参数(参见例如图5中的面板501)。需要指出的是，用于用户输入和/或调整的确切实验参数不仅取决于实验类型，还可以受所选样本影响。

当呈现实验参数以便用户输入或调整时，系统还可以确定参数的子集，其中用户输入是优选的、期望的或是需要的。例如，对于蛋白质印迹实验，系统可以确定与其他参数相比，染色时间和洗涤时间最好由用户确定。因此，这两个项目可能被突出显示以引起用户的注意。

在一些实施例中，除了实验参数之外，该系统还包括用于用户确定的一个或多个期望的实验结果。在一方面中，期望的结果是从实验产生的产物的期望浓度、期望纯度、期望重量(或拷贝数)。一旦界面接收到来自用户的关于这样的期望结果的输入，则系统可以计算适当的实验参数以实现期望的结果。期望的实验结果也可以是一个参数。

参数解析

在一些情况下，本公开的系统确保实验的所有参数被确定(或者被称为“解析”)，并在实验实际进行之前保存以备将来参考。这样的努力至少有三个好处。首先，一旦实验的参数解析完成，用户就有信心按照预期进行实验，而不需要用户进一步的输入、调整或修正(受到某些严重故障的影响，如在运输过程中样本损坏)。其次，实验结果将是可重复的，因为参数解析消除了对于实验执行而言的任何参数模糊材料，从而消除了实验不一致的主要来源。第三，未来的实验可以复制或利用样本和基础参数，使得在遥远的过去产生的数据和样本作为进一步的实验研究的基础，如昨天生成的数据和样本，因为关于实验的上下文知识没有丢失。换句话说，本技术可以获得在实验室实验中的高的可预测性和可重复性，如下面进一步所示的那样。此外，值得注意的是，这种程序识别和实验参数解析只能在集成电子系统中进行；如果没有给定实验的机器可读定义，计算机将无法理解正在请求的内容，因此无法协助确定请求是否形成良好和充分。

不可再生性长期困扰着科学界，特别是生命科学方面。一种不可重复性来自科学家尝试复制科学杂志上报道的一个实验的努力。例如，在量化这种不可重现性的努力中，进行实验以确定问题的主要原因(Vasilevsky等，PeerJ，2013年9月5日；1：e148)。据推测，一些不一致是由于所用的试剂、工具和模型系统缺乏“可识别性”。报告发现，这些资源中有54％不是唯一可识别的，这使得同行难以重现准确的测试条件。

如果有人在同一个实验室或组织中重复同一个人或另一个人早些时候的实验，就会出现另一种不可重复性。例如，最近有报道说，“超过70％的研究人员试图复制另一个科学家的实验但没有成功，一半以上的研究人员没有重现自己的实验”(自然533,452-454(2016年5月26日))。这种高不可重复性至少有一个原因在于设置和/或记录实验参数或条件时的模糊性。相比之下，在本文公开的技术的一些实施例中，在执行实验之前解析所有实验参数或条件(有时称为“选项”)。这个过程可以被称为“选项解析”或“参数解析”。

参数解析的一个方面涉及参数识别，即在执行实验之前需要确定哪些参数和条件。另一方面涉及确定这些参数和条件，包括哪些确定可以从用户那里获得输入。又一方面，在接收到用户输入之后，系统检查输入，并在需要时进行建议、警告或自动调整。下面将更详细地描述这些方面中的每一个。

在执行实验之前为实验确定的参数和条件通常比当以类似的实验以常规方式进行时更广泛。以HPLC为例。在常规的HPLC实验中，在开始HPLC实验之前，技术人员可以确定使用什么样的色谱柱、样本的浓度和体积、缓冲液和流速。然而，其他参数或条件在很大程度上仍然是未决定的，或者是实际进行实验的人的默认未记录知识的一部分。此外，记录参数在科学研究中很重要，因为人们往往不知道未来什么是重要或有影响的，所以选择性或随意记录会带来很高的遗漏有价值知识的风险。

通常在传统实验中未指定的一种类型的参数是仪器准备或校准。例如，在HPLC的示例中，参数“冲洗频率”，其指定将插入样本之间的额外的冲洗运行的频率，通常由特定实验室的传统或技术人员的习惯或培训决定。同样，这些重要的信息不会被记录下来，也不会以与特定实验相关联的方式被捕获，即使它可能会产生很大的影响。例如，内部实验已经表明某些冲洗频率可以在单个实验中引入足够的可变性，以便使得到的数据无用，但是这种重要的信息片段不记录在传统系统中。另一个这样的示例是“冲洗后的标准”，它决定了每个额外冲洗运行后是否运行一个标准。又一个例子是流式细胞仪中光电二极管上的放大器增益，这个参数通常在仪器首次安装后被设置，然后便被遗忘，尽管它对实验观察有很大的影响。然而，在本公开的一个实施例中，在实验设计步骤期间，需要识别这些仪器准备或校准参数并确定值。

在传统实验中通常未确定的另一类参数是实验后护理。一个这样的例子是HPLC实验的关闭方法或清理冲洗。在本公开的一个实施例中，在实验设计步骤期间，这样的仪器实验后护理参数需要被识别并且确定值。

通常在常规实验中未确定的另一组参数是可以在实验期间执行的操作或分析的参数。一些操作或分析可能取决于实验的某些输出。例如，在HPLC实验过程中，可以特别地确定或调整各种部分收集参数(例如开始时间、结束时间、收集模式、最大收集体积)。然而，在本公开的一个实施例中，可以在样本加载之前确定参数。例如，可以要求用户输入标准(例如，定义用于检测峰值的信号阈值的峰值起始阈值)，然后将其用于确定部分收集参数。

用户不熟悉本系统设定解析的许多参数可能是常见的。因此，在一些实施例中，本公开的系统通过包括或呈现参数的推荐值来辅助用户。在一个实施例中，在系统中预先确定参数的推荐值。例如，对于分析型HPLC，系统在没有明确的用户指示的情况下默认设定注射量为1纳摩尔；对于制备型HPLC，系统默认注射量为50纳摩尔。在另一个示例中，系统根据用户选择的反相或离子交换HPLC来动态地将温度参数默认为45摄氏度或25摄氏度。与其他参数一样，系统选择的温度值可以被用户覆盖。在优选实施例中，系统只要求用户指定系统无法自行解析的参数或者用户希望覆盖系统自己的解析值的参数，从而允许非常紧凑的脚本。例如，SLL中的HPLC实验函数有43个参数：报告、接受、选项、比例、选择片段、注射体积、冲洗频率、冲洗后标准、注射量、列、仪器、类型、缓冲A、缓冲B、缓冲C、批量标准注射体积、批量标准样本、批量标准方法、冲洗方法、关闭方法、梯度标准、梯度标准注射体积、温度、流速、检测波长、梯度B、梯度C、梯度起始、梯度结束、梯度持续时间、平衡稳定时间、冲洗时间、梯度方法、部分收集起始时间、部分收集结束时间、部分收集模式、最大部分体积、绝对阈值、最大斜率、最大斜率持续时间、最大收集时间段、峰值终止阈值以及部分收集方法，这些全部可以由系统解析。因此，在优选实施例中，不希望覆盖任何系统推荐设置的用户可以简单地输入：

ExperimentHPLC[“样本1”]

而不是笨拙而恐怖的：

ExperimentHPLC[“样本1”,报告->用户值,接受->用户值,选项->用户值,比例->用户值,选择片段->用户值,注射体积->用户值,冲洗频率->用户值,冲洗后标准->用户值,注射量->用户值,列->用户值,仪器->用户值,类型->用户值,缓冲A->用户值,缓冲B->用户值,缓冲C->用户值,批量标准注射体积->用户值,批量标准样本->用户值,批量标准方法->用户值,冲洗方法->用户值,关闭方法->用户值,梯度标准->用户值,梯度标准注射体积->用户值,温度->用户值,流速->用户值,检测波长->用户值,梯度B->用户值,梯度C->用户值,梯度起始->用户值,梯度结束->用户值,梯度持续时间->用户值,平衡稳定时间->用户值,冲洗时间->用户值,梯度方法->用户值,部分收集起始时间->用户值,部分收集结束时间->用户值,部分收集模式->用户值,最大部分体积->用户值,绝对阈值->用户值,最大斜率->用户值,最大斜率持续时间->用户值,最大收集时间段->用户值,峰值终止阈值->用户值,以及部分收集方法->用户值]；其中“用户值”表示用户将指定期望的参数值。重要的是，无论参数是由系统还是由用户决定，所有参数值都将被保存以供将来参考。这意味着用户很容易在将来重新运行完全相同的实验，因为可以简单地复制保存的参数值。这可以由系统自动完成或由用户手动完成。以易于阅读的脚本的方式(其是紧凑而计算完整的)灵活地指定实验的所有参数的能力，代表了本领域的强大的进步。

在另一个实施例中，参数的推荐值取决于另一个参数。例如，在一个实施例中，一旦系统解析样本类型，系统可以确定合适的检测波长。对于确定为DNA的样本，系统建议将检测波长参数设置为260nm；对于确定为蛋白质的样本，系统建议检测波长为280nm。

在另一个实施例中，参数的推荐值不是固定值，而是取自另一个实验或同一实验的另一部分的输入的公式或函数。在这种情况下，应注意的是，在一些实施例中，系统被配置为监测实验的性能，并且在监测期间收集的信息可以用于帮助确定或调整另一个实验或实验的另一部分中的实验参数。

在一种情况下，用于确定或调整一个或多个实验参数的信息是例如来自较早/上游实验的样本的历史信息。例如，当样本是细胞样本并且系统具有与样本中的细胞类型的生长速率相关的数据时，则可以使用历史生长速率信息来调整实验参数以确保细胞在合适的速率生长。

在另一种情况下，用于确定或调整一个或多个实验参数的信息是仪器的历史信息。仪器可以定期校准。校准结果可以用来指导实验参数的调整。仪器上运行的其他实验结果也可以用来调整和优化参数。

在一个实施例中，参数的推荐值可以被用于在没有进一步的用户输入的情况下自动设置这些参数。这种自动填充的值在图5中示出。然而，即使系统可能施加某些限制，也可以允许用户根据需要调整任意参数。在图6A中，例如，用户选择调整对于选择的蛋白质印迹实验的Sample Volume(样本体积)、Separation Time(分离时间)和Separation Voltage(分离电压)的值。一旦接收到这些值，在一个实施例中，系统评估这些值的有效性。在一些实施例中，仅将参数的子集呈现给用户以供考虑。

考虑到一些参数具有与其他参数的依赖性，在一些实施例中，系统以观察这种依赖性的顺序来检查值的有效性。例如，关于在图6A中调整的三个参数，系统可以首先检查Sample Volume(样本体积)、Antibody Volume(抗体体积)、Luminal Volume(腔体积)和Peroxide Volume(过氧化物体积)的值是否在最佳范围、推荐范围或可接受范围内。为此，需要注意的是，当系统确定参数的推荐值时，系统可以确定参数的最佳范围、推荐范围和可接受范围。

此外，一些参数的解析取决于其他本身需要解析的参数的值。可以基于公式或函数来解析各种参数，因此全解析可以取决于复杂的一系列相互关联函数的解析。重要的是要注意，在优选实施例中，用于此的逻辑不一定被明确地编程到系统中，相反，解析自然地由选择的顺序解析来处理，类似于计算机科学中递归函数调用的解析。

然后，系统评估Separation Time(分离时间)、Separation Voltage(分离电压)、Stacking Time(堆积时间)和Stacking Voltage(堆积电压)的值，以便它们适用于提供的这个特定的实验，只要它具有在前一步骤中已被评估过的Sample Volume(样本体积)、Antibody Volume(抗体体积)、Luminal Volume(腔体积)和Peroxide Volume(过氧化物体积)的值。在图6B所示的示例中，系统确定用户提供的Separation Voltage(分离电压)过高，因此在右侧面板中显示警告。

根据本公开的某些实施例，在用户完成实验的设计(例如，点击图6A或6B的界面上的“执行实验”按钮)之后，不再需要用户输入以完成实验的执行。在一个实施例中，输入是指涉及样本操纵的信息。在一个实施例中，输入是指关于试剂选择的信息。在一个实施例中，输入是指关于仪器的调节、准备、设置或校准的信息。在一个实施例中，输入是指关于收集来自实验的输出样本的信息。在一个实施例中，输入是指关于来自实验的输出样本的进一步处理的信息。在一个实施例中，输入是指关于设定实验的环境参数的信息。在一个实施例中，输入是指关于存储或显示实验结果的信息。

接收和加载样本

由于目前公开的系统能够使在计算上完成实验的描述成为可能，所以可以通过机器或机器与人的组合来远程执行实验，从而实现云实验概念的版本。因此，除了通过计算机界面工作之外，在一些实施例中，用户仅需要将样本发送到系统的仪器所在的地方(即，实验室)而不需要采取其他物理行动。

样本可以在关于样本的信息输入到系统之前或之后发送。然而，通常情况下，至少每个样本在实验室收到之前已经有了一些基本的信息。例如，给每个样本一个名称或识别号码，以及优选地样本类型(例如，DNA样本、蛋白质样本、细胞系)。在某些情况下，还会在系统中输入其他信息，例如浓度、pH值、制备数据、分子量等。

一旦样本在实验室被接收，样本可以在被放入储存或装入仪器之前被检查。检查可以包括浓度、温度、体积、重量和/或pH值的测量，不限于此。如果用户提供的信息存在差异，则可以进行调整，或者对样本的质量或储存性质进行标记。

在一些实施例中，基于这种测量来调整用于实验的实验参数。在一种情况下，测量结果不同于用户在界面上提供的结果。这可能是由于例如运输过程中的样本降解或湿度损失引起的。在另一种情况下，当某些参数未由用户设置时，系统可能在实验设计中使用默认值。

复合实验

本公开的实验室系统的能力不仅反映在其自动化大量简单且复杂的实验的能力上，而且还突出了其设计和执行复合实验的能力。“复合实验”是指包括至少两个组分实验的实验，其中一个组分实验的输出是另一个组分实验的输入样本。此外，两个组分实验的类型可能不同，例如分子合成、纯化、扩增、定量、细胞培养和分析。在一些实施例中，复合实验包括至少三种不同类型的实验。在一些实施例中，该系统能够支持任意多个不同实验的复合实验，并且仅受可用资源的限制。复合实验的部分可能随着时间的推移而发生，因为一部分取决于另一部分的输出或结果。复合实验的部分可以彼此串联或并联进行。复合实验的一部分的执行可以取决于用户首先复查复合实验的另一部分的结果并根据需要调整复合实验。复合实验在执行开始之前不需要完全指定；例如，用户可以通过随时间添加额外的组分实验来创建或扩展复合实验。在实践中，某些实施例能够复制在任何生命科学出版物中详述的由分析化学、细胞生物学和/或分子生物学技术组成的总体实验。

复合实验的一个示例包括核酸合成(合成)，随后是核酸纯化(纯化)、核酸定量(定量)、然后是核酸扩增(扩增)、然后是测序(分析)。在另一个示例中，复合实验包括蛋白质表达(细胞培养)，随后是蛋白质纯化(纯化)和ELISA(定量)。

一旦复合实验中的一个组分实验完成，系统从该组分实验中收集适当的输出样本，可选地随后进行合适的样本分析。例如，对于多核苷酸示例，可以检查浓度和体积。如果需要，可以进行浓缩、稀释、pH调节等。随后，该输出样本被传送到下一个组分实验的仪器。下一个组分实验的实验参数也可以根据样本分析和后续调整进行立即调整。

复合实验可以进一步包括一个或多个组分实验，其“作为分支进入”或“作为分支离开”基础化合物实验。分支进入组件实验生成样本或数据，其与输出样本和/或数据或第二组分实验一起，形成第三组分实验的输入。相比之下，分支离开组分实验与第二组分实验共享从第三组分实验中产生的输入样本或数据。在每个组分实验中收集的数据可以被用来自动或基于用户输入来调整任何其他组分实验的实验参数。

设计复合实验时的参数解析可能需要考虑复合实验内的单个实验之间的关系。请参阅以下具有7个技术的复合实验示例：

阶段I：

1)ExperimentDNASynthesis＝>生成DNA样本

2)ExperimentHPLC(离子交换)＝>纯化(1)中生成的样本

3)AnalyzePeaks＝>分析(2)中产生的峰值，并根据这些峰值选择部分样本

阶段II：

现在取(3)中选择的部分样本，并行执行以下四个实验，或者按照用户需要的任何顺序执行以下四个实验，每个实验产生用于进一步分析的数据：

4)ExperimentHPLC(分析的HPLC实验)

5)ExperimentPAGE(PAGE实验)

6)ExperimentMassSpectrometry(质量分析法实验)

7)ExperimentAbsorbanceQuantification(吸收度量化实验)

阶段III：

以任意顺序进行适当的任意一项或多项分析：

8)AnalyzePeaks(峰值分析)

9)PlotPAGE(PAGE曲线)

10)PlotMassSpectrometry(质量分析曲线)

11)AnalyzeAbsorbanceQuantification(吸收度量化分析)

在这个示例中，参数解析的一个特别的考虑在于，步骤(4)的ExperimentHPLC实验可以继承步骤(2)中运行的ExperimentHPLC的许多参数。因此，一旦步骤(1)的参数被解析，则涉及步骤(4)的用户仅需要较少的输入或者不需要输入。有利的是，这也减少了由于(1)和(4)之间的参数值的无意变化而导致错误的机会，这可能发生在许多参数值未被明确考虑或记录的手动设置中。此外，在处理和分析上述步骤之后，可以对输出样本执行以下一个或多个实验：

12)ExperimentAbsorbanceThermodynamics(吸收度热力学实验)

13)ExperimentFluorescenceKinetics(荧光动力学实验)

14)ExperimentTransfection(转染实验)

请注意，上述复合实验不是由专业人员预先配置的，用户可以以任何方式改变它，或完全做其他事情。任何物理上可允许的组合都可以在所公开的发明上执行，其区别于例如高通量筛选系统。能力的差异类似于通用计算机与计算器；所公开的实施例的灵活性和概括性允许以前不可能的能力。作为另一个示例，以下内容是从在《自然生物技术(NatureBiotechnology)》中发表的文章的方法部分选取的：“大肠杆菌K-12菌株BW25113(基因型：F-，Δ(araD-araB)567，ΔlacZ4787(::rrnB-3)，λ-，rph-1，Δ(rhaD-rhaB)568，hsdR514)用于产生全部22个条件的蛋白质组图谱。从KEIO集合中取出具有缺失的rimL，rimJ或rimI基因的突变株。通过PCR检测缺失的正确性。此外，还测定了MG1655(基因型：F-，λ-，rph-1)和NCM3722(基因型：F+)菌株的葡萄糖和LB条件的蛋白质组。”Alexander Schmidt等，定量和条件依赖的大肠杆菌蛋白质组(The quantitative and condition-dependentEscherichia coli proteome)，《自然生物技术(Nature Biotechnology)》34,104-110(2015年12月7日)。这可以在SLL中表示为：

菌株

baseLine＝model["BW25113",细胞]；

rimLLine＝model["BW25113ΔrimL",细胞]；

rimJLine＝model["BW25113ΔrimJ",细胞]；

rimILine＝model["BW25113ΔrimI",细胞]；

altCellLines＝{model["MG1655",细胞],model["NCM3722",细胞]}；

引物

rimLFowardPrimer＝model["rimLFoward",低聚体]；

rimLReversePrimer＝model["rimLReverse",低聚体]；

rimLBeacon＝model["rimLBeacon",低聚体]；

rimJFowardPrimer＝model["rimJFoward",低聚体]；

rimJReversePrimer＝model["rimJReverse",低聚体]；

rimJBeacon＝model["rimJBeacon",低聚体]；

rimIFowardPrimer＝model["rimIFoward",低聚体]；

rimIReversePrimer＝model["rimIReverse",低聚体]；

rimIBeacon＝model["rimIBeacon",低聚体]；

实验

ExperimentcDNAPrep[{rimLLine,rimJPrimerSet,rimIPrimerSet},

PBSSample->model["PBS",储液],LysisSolutionSample-

>model["ABIcDNAPrepLysis",化学],MediaVolume->150微升,

WashVolume->100微升,AnnealingTemperature->45摄氏度]

protocol[123123,cDNAPrep]

lysisSamples＝SamplesOut/.Info[cellPrep]

{sample[12451,Lysate],sample[12452,Lysate],sample[12453,Lysate]}

ExperimentqPCR[lysisSamples,FowardPrimers->{rimLFowardPrimer,

rimJFowardPrimer,rimIFowardPrimer},ReversePrimers->{rimLReversePrimer,

rimJReversePrimer,rimIReversePrimer},Beacons->{rimLBeacon,rimJBeacon,

rimIBeacon},TemplateVolume->2微升,ForwardConcentration->0.5微摩尔,

ReverseConcentration->0.5微摩尔,BeaconConcentration->250毫微摩尔,

DenaturationTemperature->95摄氏度,DenaturationTime->15秒,

AnnealingTemperature->60摄氏度,AnnealingTime->30秒,NumberOfCycles->50]

protocol[123141,qPCR]

qPCRData＝Data/.Info[protocol[123141,qPCR]]

{data[124584,qPCR],data[124608,qPCR],data[124602,qPCR]}

PlotObject[qPCRData].

由该命令产生的示例曲线在图12D中示出。

注意，本公开的发明没有专门设计来执行本文中的实验。相反，系统的灵活性突出表现在它能够重新构建利用它所能支持的任何技术的任意实验，比如本文的实验。此外，请注意，上述SLL脚本中指定的多个参数在源文件中是不明确的，这是通过使用SLL脚本结合本公开的发明的其他方面而被清晰解析的。另外，如果将来需要重新运行相同的实验，用户只需要参考与实验相关的对象，例如protocol[123141，qPCR]，以提取实验所使用的确切参数，从而能够检索对实验中采取的所有步骤的真正完整的描述。此外，调用qPCR实验函数的函数调用虽然具有完整性，但是非常紧凑：例如，ExperimentqPCR需要42个参数，但是只有12个参数由用户指定，在该示例中覆盖系统解析的默认值以与本文匹配。系统仍保存用于所有42个参数的值，无论是用户还是系统指定的。

另外，文中所公开的实验的其余部分也可以用SLL脚本来表示，但是为了简洁起见，在这里并没有这样做。发明人不知道任何能够具有这种灵活性和规模的系统。其基本点在于：本公开的发明具有高度的灵活性，能够表示和执行各种各样的实验，以进行广泛的科学研究，包括基础研究和开发。

实验协议的生成

在一些实施例中，一旦实验的设计由用户完成并提交，则系统基于设计生成实验协议对象，其可以包括参数解析的结果。在一些实施例中，鉴于参数解析的完整性，协议对象也可以被认为是计算完成的，即，不需要进一步的用户输入来描述预期的实验，并且用作对仪器(以及可选地，技术人员)的一系列指令来进行实验。

为了产生在实验室内使用的实验协议，在一些实施例中，系统处理协议对象并且解决步骤、样本、试剂和/或任务调度(例如，并行性、设备的可用性、潜在的瓶颈、在实验室中仪器之间的物理距离、相关样本的位置等)之间的相关性来产生在实验室中要遵循的实验方案。该解析可能需要创建协议对象的系统部分(例如，用户的本地计算机)不可用的信息。该实验协议可以包括用于控制机器人和/或仪器的机器代码，包括API(应用程序接口)调用，以及根据需要由人执行的分项指令。在一些实施例中，当协议对象被创建时，生成实验协议并将其包括在协议对象中。在优选实施例中，当协议对象由特定实验室相关联的编排模块处理时，创建实验协议。协议对象的创建可以发生在任何计算机上，例如用户的计算机、远程计算机服务器或位于实验室中的计算机。协议对象的处理也可以发生在任何计算机上，例如用户的计算机、远程计算机服务器或位于实验室中的计算机。

在一些实施例中，可以在实验室中使用用户界面来呈现可能需要由技术人员执行的某些步骤的指令，诸如从仓库取回试剂。因此，在一些实施例中，指令的分项列表可以顺序地呈现给技术人员，并且可选地，在完成每条指令时，系统接收确认。技术人员可以进行确认(例如，通过扫描试剂包装上的条形码)或自动从仪器(例如，仪器感测样本被加载)进行确认。

协议对象可以起到协调实验的设计、执行和数据记录的作用。如所提供的，根据实验函数的执行生成协议对象。协议对象可以指导和协调新物理样本的生成，包括生成相应的样本对象。此外，协议对象可以直接或间接地与仪器和/或技术人员进行交互，以执行实验，监测实验过程，并记录实验产生的数据。

实验的执行

本公开的系统可以根据其用户的需求进行配置。在一些实施例中，该系统包括互连的或每个连接到中央服务器的一个或多个计算机(在图18中示出为工作站)。数据源(如数据库)可以位于其中一台计算机上，但优选地位于远程服务器(如数据中心中的一台计算机)上。

该系统还可以包括一个或多个装备有科学仪器的实验室(在图18中示出为实验室)；每个实验室及其仪器都与系统中的一台或多台计算机进行电子数据通信。在一个方面，该系统包括用于每种类型的实验(例如合成、纯化、扩增、定量、细胞培养和分析)的至少一个实验室仪器。在一个方面，该系统至少包括用于纯化、扩增和定量的实验室仪器。在一个方面，该系统至少包括用于纯化、定量和细胞培养的实验室仪器。在一个方面，该系统至少包括用于纯化、分析和细胞培养的实验室仪器。

在一些方面，实验室仪器配置为至少执行HPLC、PCR和孵育。在一个方面，该系统还包括液体处理站、流式细胞仪、离心机、DNA合成仪、pH计和显微镜。

在一些方面，系统还包括用于监测实验环境的各种传感器和用于控制环境的HVAC(加热、通风和空器调节)系统。在一个方面，系统至少包括温度传感器、压力传感器、湿度传感器和/或光传感器，其中的每一个都连接到系统的计算机。在相关方面，在实验之前、实验期间和/或实验之后，将传感器数据与实验数据相关联地记录以用于将来的数据分析和故障排除。

程序代码、编译器和解析器可以存储在一台或多台计算机中，这些计算机可以实现仪器操作、监视、数据收集和分析。在一些方面，程序代码将系统配置为呈现图形用户界面以使得用户能够设计实验、监测实验以及审查和分析实验结果，这些在附图中示出。程序代码、解析器或编译器不需要本地存储在执行系统任何方面的计算机上。

数据整合模块

图8-10显示了本系统生成的一些数据可视化界面。这样的截面由SLL系统的各种对象、程序和功能(在此也称为“模块”)实现。对象和功能的非限制性示例包括“实验”、“数据”、“分析”、“样本”、“仪器”、“对照”、“库存”、“维护”、“操作员”、“公司”、“模型”、“报告”、“校准”、“容器”、“方法”、“模型”、“部件”、“产品”、“程序”、“协议”、“传感器”、“模拟”以及“环境”。在许多情况下，一个术语可以与一个对象和一个功能相关联，例如，可以同时存在实验对象和实验功能。

“实验”模块配置为显示有关实验的信息。如图9所示，“实验面板”901可以包括用于容易识别实验类型(例如流式细胞术)的可选图像902。此外，显示在面板上的信息可以包括(列903代表信息类型，列905具有细节)：

-Operator(操作员)：实验操作员

-Instrument(仪器)：进行实验的仪器

-Samples In(样本)：实验中使用的样本

-Data(数据)：实验产生的数据

-Environmental(环境)：显示测量的环境数据(例如实验室中的温度，气压和湿度)的环境记录的标识

-Date(日期)：实验的日期和时间

-这类实验的其他信息，例如流速和通道。

要注意的是，这些信息类别中的每一个都可以嵌入通向另一个模块的链接或其他计算手段。例如，当用户点击仪器行905时，仪器模块(详情如下)将被调用并呈现一个新的面板，显示关于在该实验中使用的仪器的信息。

“数据”模块，或被称作“分析”或“绘图”模块，被配置为显示从面板上的实验生成的数据的至少一部分的可视显示(例如，图8中的数据面板801)。对于任何数据集，通常有多种方法来提取相关数据进行分析，以及各种方法来分析和可视化数据。在一个实施例中，数据模块被配置为能够自动确定合适的数据提取、分析和可视化方法，并且仍然允许用户采用其他可用的方法。

例如，认识到图8的数据取自流式细胞术数据集，数据模块默认地在针对该特定数据集立即确定的适当尺度下生成散点图802。请注意，此功能通常取决于精确的参数解析。对于某些更为复杂的实验数据，可以生成多个数据条目(例如，在实验模块面板上显示为多个条目)，每个数据条目引导用户到不同的数据分析或可视化面板。

类似于实验面板，“数据”面板包括与数据有关的信息(参见信息类型的列803和详细信息的列804)：

-Experiment(实验)：从中生成数据的实验

-Figures(图形)：实验过程中仪器产生的图形或来自数据的图形

-Analysis(分析)：数据可用的分析

-Date(日期)：实验的日期和时间

-特定于这种类型的数据的其他信息，例如门控，聚类。

这些信息类别中的每一个都可以嵌入通向另一模块的链接或者其他计算手段。例如，当用户点击实验行805时，将调用实验模块并显示与实验相关的信息。

“分析”模块显示数据分析和相关可视化，例如：

-Source Data(源数据)：用于生成分析的数据

-Processed Data(处理数据)：为了分析而被处理的数据

-Figures(图形)：为分析生成的图形

-Date(日期)：分析的日期和时间

-特定于分析的其他信息，例如分析的技术细节(例如，对于聚类分析，用于聚类的K均值和用于相似性测量的欧几里得距离)

这些信息类别中的每一个都可以嵌入通向另一模块的链接或者其他计算手段。例如，当用户点击Source Data(源数据)时，系统将使数据模块显示与用于分析的数据有关的信息。

“样本”模块被配置为显示关于样本的信息，样本可以是在实验室中接收的由客户提供的样本、由供货商提供的样本或从实验产生的样本。这些信息可以包括，例如：

-Supplier(供应商)：提供样本的人员或公司

-Experiment(实验)：对样本进行的实验

-Source Experiment(源实验)：生成样本的实验

-Container/Location(容器/位置)：存储样本的容器和/或位置的标识

-Model(模型)：样本的实体类型和相关的领域、参数等(例如，化学结构、蛋白质序列、细胞类型)

-Control(对照)：识别合适的对照样本

-Date(日期)：生成或接收样本的日期和时间

-特定于样本的其他信息，例如类型、溶剂、浓度。

这些信息类别中的每一个都可以嵌入通向另一模块的链接或者其他计算手段。例如，当用户点击Source Experiment(源实验)字段时，系统将调用实验模块来显示与生成样本的实验有关的信息。

“仪器”模块被配置为显示关于仪器的信息。如图10所示，面板1001上显示的信息例如可以包括图1002中所示的仪器：

-Model(型号)(见第1003栏)：仪器制造商型号(见第1004栏)(不要与SLL中的模型的一般概念或模型对象混淆)

-Experiments(实验)：列出已经在仪器上运行的实验

-Maintenance(维护)：列出针对仪器进行的维护

-Controls(对照)：在仪器上运行的对照实验/样本

-Data(数据)：通过在仪器上运行的实验生成的数据集

-Date of Installation(安装日期)：仪器安装的日期和时间

-Visualization(可视化)：仪器的图片

-Manual(手动)：手动文件

-特定于仪器的其他信息，例如序列号，软件。

这些信息类别中的每一个都可以嵌入通向另一模块的链接或者其他计算手段。例如，当用户单击Experiments(实验)下列出的实验时，系统将调用实验模块以显示与仪器上运行的实验有关的信息。由于对象的链接特性，很容易运行高度灵活和独特的查询，如查看实验中出现的所有样本(protocol[123,Western][SamplesIn]或者相同地SamplesIn/.Info[protocol[123,Western]])或查看所有在Western数据质谱上执行的所有峰值采集分析(protocol[123,Western][Data][PeaksSourceSpectra]或者相同地PeaksSourceSpectra/.Info[Data/.Info[protocol[123,Western]]])。

“对照”模块被配置为显示与用仪器上的一个或多个样本进行的用于校准和/或质量控制目的的对照实验相关的信息。在一些实施例中，对照模块是显示对照实验的实验模块。对照模块可以呈现的信息包括，例如：

-Sample(样本)：用于进行对照实验的样本

-Instrument(仪器)：进行对照实验的仪器

-Result(结果)：指示对照实验是否通过

-Data(数据)：由对照实验产生的数据

-Expected Values(预期值)：结果中某些数据点的预期值或值范围

-Visualization(可视化)：来自数据的数据可视化

-Date(日期)：运行控制实验的日期和时间

-特定于对照实验的其他信息，例如对照类型。

这些信息类别中的每一个都可以嵌入通向另一模块的链接或者其他计算手段。例如，当用户点击仪器时，系统将调用仪器模块显示与仪器相关的信息。

“库存”模块被配置为显示关于用户组(例如公司)中的用户的样本清单、实验和/或数据的信息。库存模块可以提供的信息包括，例如：

-Samples(样本)：列出由用户或用户组提供或为其生成的样本

-Experiments(实验)：列出由用户或用户组设计或为其运行的实验

-Data(数据)：从列出的实验中生成的数据

-User(用户)：用户或用户组(例如公司)

-特定于清单的其他信息，例如上次编辑时间。

这些信息类别中的每一个都可以嵌入通向另一模块的链接或者其他计算手段。例如，当用户点击样本时，系统将调用样本模块以显示与样本相关的信息。

“环境”模块(有时也称为“传感器”模块)被配置为显示进行实验时收集的环境信息。可以理解的是，实验室内的温度、气压等环境因素可能会对实验产生影响。尽管如此，可能由于缺乏适当的整合系统或者对这些因素的重要性的认识，在设计、执行和记录实验时，往往不考虑这些环境因素。在本技术中，环境变量是严格控制的，并将其细节记录下来用于实验后分析。环境因素的非限制性示例包括温度、气压、人、亮度和空气纯度(例如，PM2.5)。根据本公开的一个实施例的环境模块被配置为显示对任意一个或多个环境因素的测量结果，并将他们与正在进行的实验联系起来。因素可能具有一般性或局部性，例如实验室中的温度与特定液体处理器附近的温度。

不限于此，本系统还包括以下模块：用于显示仪器的维护信息的“维护”模块，用于显示特定样本的实体信息的“模型”模块(例如针对化学样本的化学结构，针对蛋白质样本的蛋白质序列，针对细胞样本的细胞类型)，用于显示与系统中的任何物质有关的集合信息(例如与模型有关的文献)的“报告”模块，用于显示进行实验(例如，将样本加载到系统)的操作者的信息的“操作者”模块以及用于显示关于公司(例如，仪器的供货商)的信息的“公司”模块。

数据挖掘和可视化

集成的实验室系统和数据集成模块使用户能够以用户友好的方式挖掘系统收集的与实验相关的任何数据。在图14-17中示出了一些示例。以下示例以需要通过图形用户界面与用户交互的方式呈现。在图形用户界面上，用户可以查看模块的某些显示信息，并通过点击链接或通过其他输入机制与系统交互。然而，这样的示例仅用于说明的目的，因为本领域技术人员将容易理解，系统中的数据的挖掘不一定需要可视化，更不用说图形可视化。此外，通过不同模块的导航也不需要用户的机械动作，并且可以仅用机器可读的代码或指令来执行。因此，下面的例子中的点击可以被理解为调用一个函数或执行一个命令。

在图14中，当用户通过命令(例如通过点击或输入适当的脚本)打开面板以调用项目的实验模块时，实验模块在面板上显示与项目中的实验有关的信息。在该例中，该实验是流式细胞术实验(顶部方框，也参见图9)。在面板上，用户可以点击文本中嵌入的指示实验产生的数据的链接(参见图9的倒数第二行)，并调用数据模块，显示新的面板(数据面板，也参见图8)。

由数据模块显示的数据面板除了列803和804中的文本信息链接以外还示出了可选的图形802。该图形不需要表示从实验产生的所有数据。此外，在一些方面，由于该图形提供了数据的概述，其生成不需要用户输入。因此，在某些方面，系统会自动选择数据提取/转换和可视化技术来呈现数据。例如，对于流式细胞术数据，数据模块自动选择一个散点图并按照容纳至少95％的可用数据点进行缩放。

与实验面板一样，数据面板也包含其他模块/面板的链接。例如，链接805将用户指回实验面板。

因为可以用多种方法分析数据集，所以数据面板也可以包括到分析模块的多个实例的链接(在图14中示出为两个分析模块区块)。在这里，一个分析用于门控，另一个用于聚类。当被调用时，分析模块可以显示源数据，分析的方法的详细信息和分析结果，不限于此。

除了通过由实验生成的数据集、以没有或者最少的用户输入生成分析面板外，系统还可以从分析结果中创建一个报告。从外部，当用户点击任一分析面板上的报告链接时，报告模块将出现一个显示报告的面板。

在一方面，报告面板显示与实验有关的信息的集合。与分析面板类似但与传统报告不同，报告面板可以是动态的，因为它由集成的数据源支持并连接到实验室仪器。

例如，图12A示出了可以包括在分析和报告面板中的动态图形。在此，给出了用于酶动力学模拟的时间依赖性浓度曲线(1204)，其可以用于与实际实验进行比较。在曲线之上，有三个可移动的条(1203)，允许用户改变并且看到这些改变的即时模拟结果。即使在曲线上，如果用户将光标移动到特定点(例如1205)，用户将能够调整曲线以适应需要。还可以看出，脚本1201被用于生成可视化，并且脚本的任何改变都可以导致可视化的更新或重新创建。

图15示出了另一种情况，其中用户可以通过点击实验面板来检查实验中使用的仪器，然后控制在仪器上进行的实验。对照实例可以是在实际实验之前的最近的对照实验，或者是与实际实验(包括之后)最接近的实验。在某些方面，如果仪器能够处理不同类型的样本和实验，则对照实验与实际实验的种类相同。

在图16中，当用户点击实验(流式细胞术)中使用的样本(细胞样本)的链接时，用户可以检查在样本上进行的另一个实验(细胞染色)。然后，通过显示染色实验的面板，用户可以查看用于染色的不同样本(例如，化学样本)。通过样本面板，用户可以访问模型面板，其显示化学结构、供应商(再次访问公司面板上的供应商信息)以及与化学样本的化学实体相关的其他信息(例如，可用于化学实体的质谱数据)。另外，分别从化学样本面板和模型面板，用户点击数据和控制链接，以查看该化学实体的相关对照样本和化学物质的NMR数据。

图16中的示例强调了系统通过普通样本关联不同实验的能力，而图17中的示例显示了系统进行复合实验的能力。

在图17中，细胞样本20943在流式细胞术实验中运行。然后将流式细胞术实验后收集的细胞进行细胞染色实验，其将某些细胞(19423)标识为输出。这些输出细胞随后在细胞分裂实验中运行，其生成数据和数据分析。识别的样本旨在是特定类型(模型21)。如果用户有兴趣了解细胞类型的更多信息，用户可以通过点击模型面板上的报告链接来查找文献信息。

所有这些能力和其他能力都部分表示在图11中，每条虚线表示允许用户通过其接口上呈现的链接在连接的面板之间导航的联接。系统的互连性可以概括在图3中。

图12B和图12C示出了两个曲线图，其说明了本技术相对于传统技术的优点。在图12B的曲线图PlotMassSpectrometry中，直线垂直线(由箭头指示)指示系统估计峰值应该在的位置。这只有通过实验设计、执行和分析的整合才有可能。PlotMassSpectrometry函数访问包含进入曲线图的原始质谱数据的数据对象，解除链接到与该数据对象关联的样本对象的链接，然后解除链接到与样本关联的模型对象的链接(该模型包括样本的推定的核酸序列)，然后根据模型对象中的信息计算样本的分子量，并计算样本的n-1，n-2和n-3截短版本的分子量。例如，如果模型指示样本是ATGCATATGC，则它计算ATGCATATGC、ATGCATATG、ATGCATAT和ATGCATA的分子量。这是有帮助的，因为人们期望合成过程有时会提前终止，因此样本应该具有对应于其较短链的峰。为了可视化的目的，PlotMassSpectrometry函数随后围绕计算的样本的预期分子量将图形居中。例如，如果某人在距今几年后希望查看测定的样本的基础序列，然后再次合成相同的样本以用于他自己的实验，则这种整合也是有利的。这在本领域是非常困难和不可能的，但是通过所公开的发明执行则毫无障碍；它可以用单行脚本来完成，例如data[38913，质谱][SamplesIn][Model][Strand]，或者相同地，Strand/.Info[Model/.Info[SamplesIn/.Info[data[38913，质谱]]]]检索序列，其随后可以输入到一个新的合成实验。

这样的优点源自紧密集成的本公开的系统的一个实施例，并且分析功能能够将数据一直追溯到建立产生数据和查询实验设置的实验的功能。用户界面中的实验功能侧的参数检查确保了在实验建立时指定了所有必要的信息。这样的整合有助于确保实验的执行，另外还可以确保分析结果数据，并利用这种保证来支持更强大的分析体验。

突出整合优点的另一个示例是图12C所示的PlotQuantificationCycle曲线。在此，为了确定可视化的上限，绘图函数访问实验协议，获得为实验指定的周期数，然后基于实际执行的周期数设置上限和下限(由箭头表示)。其余的数据可以被认为是虚假的，因为函数知道只有n个周期运行。舍去虚假数据改进了对合适的拐点(圆圈)的自动计算。

因此，在一个实施例中，本公开的数据分析方法需要在实验(本实验)的分析中包括不是从本实验直接产生的参考数据。这样的参考数据的一个示例可以是由用户提供的、由系统利用来自用户的输入计算的或者由系统在不使用来自用户的任何输入的情况下计算的实验参数的值。这种参考数据的另一个示例可以是关于仪器的信息，例如仪器的校准方法。

这样的参考数据的另一个示例可以是运行本实验的环境条件，包括但不限于温度、亮度和湿度。另外重要的是，在又一个示例中，参考数据是从与本实验之前的实验有关的任何信息中导出的，并且优选地与本实验相关联。这样的之前的实验可以是产生本实验中使用的样本、分析本实验的样本、或揭示本实验的限制的实验。在一些实施例中，参考数据对本实验的解释施加限制，用于清理本实验的结果(例如，消除数据的非相关、无效或较不重要的部分)，或用作标准或本实验的对照。在一些实施例中，来自前面实验的数据被用于解释本实验的结果。

在一个实施例中，本公开提供了用于开发科学实验的系统。该系统可以包括存储器、处理器、仪器以及某些软件环境和模块。如图19所示，系统1900概念上可以分成两个部分，一些模块位于客户端计算机(1901)上，而一些模块可以被认为更直接地与实验室设置(1902)相关。它们可以通过远程服务器上的数据库(1903)进行连接。如本领域技术人员容易理解的那样，图19示出的配置仅用于说明，并不限制系统如何配置。

在一个实施例中，该系统包括实验模块(1904)、参数解析模块(1905)和用户界面模块(1906)。在一些实施例中，两个或更多个实验模块被包括在系统的基于软件的开发环境中，其中的每一个包括一个或多个参数和用于每个参数的一个或多个标准，并且被配置为生成用于通过一个或多个参数执行实验技术的指令。

实验模块1904与用户界面模块1906通信，该用户界面模块1906可以呈现用户界面(1907)，在其上系统可以接收来自用户的执行两个或更多个实验技术的命令。每个命令可以包括用于其中一个实验技术的一个或多个参数的输入值。这些输入值可以在参数解析模块(1905)中参考用于参数解析。在本文中，例如，对于接收到输入值的每个参数，参数解析模块基于参数的至少一个准则来确定输入值是否有效。这样的确定也可以从实验模块获取信息。此外，对于没有接收到输入值但输入值可被计算的每个参数，参数解析模块基于参数的至少一个准则来计算值。随后，如果至少一个参数缺少输入值，则参数解析模块可以生成警告。

在参数解析之后，可以保存并执行实验或者在某些实施方案中保存并执行两种或更多种实验技术。信息可以保存在数据库(1903)中，其中信息可以被系统的其他部分检索。实验的执行可以由编配模块(1909)来协调，编配模块(1909)与技术人员(1910)交互以执行(和确认)实验的某些步骤(例如，定位样本)。编配模块还可以指示传感器模块(1908)监视各种实验条件和环境条件。实验的执行可以由向实验室中的各种仪器(1913)进行呼叫的执行模块(1911)来控制，其向报告模块(1912)发送数据或报告。这些模块中的每个模块都可以直接或间接地与编配模块进行交互。

如图19所示的系统可以适用于执行两种或更多种实验技术，或者三种或更多种、四种或更多种或五种或更多种实验技术。在一些实施例中，从以下组中选择的实验技术：分析平衡读数，细胞凋亡测定，高压灭菌，缓冲液制备，离心，DNA/RNA合成，落射荧光显微术，快速蛋白质液相色谱(FPLC)，快速色谱法，流式细胞术，荧光动力学，荧光偏振，荧光光谱，荧光热力学，基因组DNA制备，HPLC(离子交换)，HPLC(反相)，光学显微镜，液体处理，冻干，MALDI质谱，哺乳动物细胞培养，pH读数，聚丙烯酰胺凝胶电泳(PAGE)，聚合酶链式反应(PCR)，蛋白质提取，定量实时PCR(qPCR)，RNA提取/cDNA制备，旋转蒸发，固相提取，真空离心蒸发浓缩，温度计读数，薄层色谱(TLC)，总蛋白定量，转染，UV/Vis动力学，UV/Vis光谱学，UV/Vis热力学，真空过滤，病毒制备，数量检查，蛋白质印迹法，琼脂糖凝胶电泳，拟南芥研究，原子吸收光谱学，原子发射光谱学，原子力显微镜，细菌细胞培养，生物反应器，弹式量热法，C线虫研究，毛细管电泳，圆二色性(CD)，菌落拣选，共焦显微镜，错流过滤(TFF)，结晶，透析(平衡)，透析(制备)，差示扫描量热法(DSC)，数字液滴PCR，DNA测序(下一代)，DNA测序(双脱氧法)，果蝇研究，动态光散射(DLS)，电子显微镜，电穿孔，电喷雾电离(ESI)质谱，酶联免疫吸附测定(ELISA)，流动化学，荧光激活细胞分选(FACS)，荧光原位杂交(FISH)，气相色谱法，气相色谱质谱(GC-MS)，HPLC(正相)，HPLC(制备型)，免疫沉淀，电感耦合等离子体质谱(ICP-MS)，红外光谱，等温滴定量热(ITC)，液相色谱质谱(LC-MS)，液-液萃取，熔点测定，微阵列分析，微波反应，分子克隆，NMR(2D/结构)，NMR(碳)，NMR(质子)，有机合成(毫克至克级)，膜片钳记录，肽合成，光致发光(PSL)，质粒构建，折射率测定，扫描隧道显微镜检查，溶解度测试，超声波处理，超临界流体色谱法(SFC)，表面等离子体共振(SPR)，串联质谱(MS-MS)，组织均质化，全内反射荧光(TIRF)显微镜，超速离心，X射线晶体学和酵母细胞培养。

在一些实施例中，条件之一是不产生警告。在一些实施例中，条件之一是仅产生非严重警告。

在一些实施例中，执行模块还被配置为生成反映所接收的命令的对象。在一些实施例中，执行模块还被配置为利用物理实验室中的生成的对象来执行由所接收的命令指定的实验技术。

在一些实施例中，该系统还包括用于接收通过执行所接收的命令而生成的数据的模块。在一些实施例中，该系统还包括用于在基于软件的开发环境中显示接收到的数据的一部分的模块。在一些实施例中，该系统还包括用于在基于软件的开发环境中分析接收到的数据的一部分的模块。在一些实施例中，该系统还包括用于基于接收到的数据的分析来生成图形元素的模块。在一些实施例中，系统还包括用于在接收到数据之后从用户接收一个或多个附加可执行命令的模块。

在一些实施例中，基于软件的开发环境包括用于选择可执行命令的图形元素。在一些实施例中，基于软件的开发环境包括用于图形显示接收到的数据的功能。

本公开的另一实施例提供了一种用于分析从实验室实验获得的数据的系统。该系统可以包括处理器、存储器和包括如下所述的一个或多个模块的程序代码。一些示例系统在图20A-G中示出。。

例如，在图20A中，用户激活绘图模块(2008)并使其访问包含由特定实验产生的数据的数据对象(2004)。绘图模块访问数据对象中的链接到协议对象(2002)的链接以识别协议对象并从协议对象中检索它需要的信息。绘图模块类似地访问从数据对象到分析对象(2003)和样本对象(2005)的链接，以从这些对象中识别和检索它需要的信息。绘图模块还访问样本对象中的链接，以从模型对象(2001)中识别和检索它需要的相关信息。另外，绘图模块(2007)可以从环境模块(2006)接收信息。绘图模块将关于所期待的绘图的信息返回到用户界面(2008)。在一个实施例中，而是通过类似的链接机制访问的是环境对象，而不是环境模块。。

图20B-G描述了在分析(2009)和模拟模块执行过程中使用的类似操作。在优选实施例中，绘图、分析和模拟模块(2010)仅根据需要访问链接，例如，如果模块已经具有足够的信息来解析参数，则它可以可选地不访问潜在的相关链接，即使它存在于对象中。本领域技术人员将容易认识到，除了这里描述的那些链接以外，可以存在到附加对象的附加链接，并且可以由模块根据需要使用与这里描述的相同的一组动作来访问。例如，在图21中，数据对象可能指向多个样本对象，分析模块能够从该多个样本对象中识别和检索信息。。

另外，在一些实施例中，模块可以与另一个模块一起工作。例如，分析模块可以调用绘图模块绘制分析模块的输出。

在一些实施例中，系统2000包括被配置为存储用于执行实验的实验参数的值的一个或多个实验模块。每个实验模块可以代表一个实验(或实验技术)，因此多个实验模块可以代表多个实验，其可能是相互关联的。或者，一个实验模块可能代表多于一个实验。

另外，数据模块可以包含在系统中，并被配置为存储来自实验的结果。在一些实施例中，存储在数据模块中的数据也可以被实验模块检索或使用。在一个实施例中，该系统还包括仪器模块，其被配置成存储关于运行实验的仪器的信息。一个实验可以使用更多的仪器，其可以由一个或多个仪器模块来表示。

而在另一个实施例中，该系统包括被配置为存储运行实验的环境条件的环境模块。上面描述了环境条件的示例。

不限于此，系统还可以包括数据分析、探索或可视化模块。数据分析、探索或可视化模块被配置用于分析和/或可视化实验数据。在一个实施例中，分析或可视化基于存储在数据模块中的结果，但是可以进一步包括来自其他数据源的一个或多个参考数据点或其表示。这种数据源的示例是实验模块、数据模块、仪器模块或环境模块。对于数据可视化，可以将参考数据点与实验结果一起显示在用户界面上。

在一些实施例中，参考数据点是来自与正被分析的实验有关的第二实验的结果。在一些实施例中，该关系是参考数据点对结果的解释施加了限制。例如，参考数据点有助于消除一部分与数据分析无关的结果，验证结果或使结果无效，或作为结果的标准或对照。

在另一个实施例中，本公开提供了用于分析从实验室实验获得的数据的系统，其包括处理器、存储器和程序代码，所述程序代码包括实验模块，该实验模块被配置为显示实验中使用的样本的标识、进行实验的仪器的标识、从实验产生的数据组的标识、以及环境记录的标识，所述环境记录包括进行实验的时间和地点的环境条件的测量；数据模块，被配置成显示数据提取或可视化以表示数据集、生成数据集的实验的标识，以及对数据集执行的分析的标识；仪器模块，被配置为显示在仪器上进行的实验的列表、在仪器上运行的对照实验的列表以及仪器的维护记录；分析模块，被配置为显示进行分析的数据集的标识以及表示分析结果的分析摘要或图形；以及环境模块，被配置为显示进行实验的时间和地点的环境条件，其中所述系统使用户能够在向用户呈现由实验模块显示的实验面板的同时探索与实验有关的信息：(1)允许用户点击实验面板上由实验生成的数据集的标识，从而调用数据模块以在数据面板上显示对数据集执行的分析的标识，这允许用户点击在数据集上执行的分析的标识以调用分析模块以在分析面板上显示表示分析结果的分析摘要或图形；(2)允许用户点击环境记录的标识，从而调用环境模块以显示实验进行的时间和地点的环境条件；(3)允许用户点击进行实验的仪器的标识，从而调用仪器模块以在仪器面板上显示在仪器上运行的控制实验的列表，以及与实验相关的仪器的维护记录。

在一些实施例中，程序代码进一步包括样本模块，该样本模块被配置为显示从中生成样本的第一实验和在样本上执行的第二实验的标识。

在一些实施例中，分析面板上显示的分析摘要或图形允许用户对生成分析概要或图形的数据集进行调整和访问。

在一些实施例中，系统允许用户点击仪器面板上的实验列表以查看在仪器上进行的一个或多个其他实验以进行比较。

尽管上面的讨论可能涉及方法步骤的具体顺序和组成，但是应当理解的是，这些步骤的顺序可以与所描述的顺序不同。例如，两个或更多个步骤可以同时执行或部分同时执行。而且，作为分立步骤执行的一些步骤可以被合并，同时执行或者前后执行的步骤可以被分离成分立步骤，某些处理的顺序可以被颠倒或者改变，并且分立处理的性质或者数量可以是改变或变化。任何元件或装置的顺序或次序可根据替代实施例而改变或替代。因此，所有这样的修改意图被包括在本发明的范围内。这种变化将取决于所选择的软件和硬件系统以及设计者的选择。应该理解，所有这些变化都在本发明的范围内。类似地，本发明的软件和网络实现可以用标准编程技术和逻辑来完成，以完成各种数据库搜索步骤、相关步骤、比较步骤和决定步骤。

除非另外定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。

本文中说明性描述的发明可以在没有任何一个或多个要素、一个或多个限制的情况下适当地实施，这里没有具体公开。例如，术语“包含”、“包括”、“含有”等应当被广义地理解而不限于此。此外，本文中使用的术语和表达已经被用作描述的术语而不是限制；因此，这些术语和表达的使用并不意味着排除所示出和描述的特征或其部分的任何等同物。相反，应认识到，在要求保护的本发明的范围内可以进行各种修改。

同样，尽管本发明已经通过优选实施例和可选特征具体公开，但是有知识的读者将理解本文中实现的主题的修改、改进和变化。这些修改、改进和变化被认为在本发明的范围内。

这里已经广泛地和一般性地描述了本发明。落入一般性公开内容中的每个较窄的种类和次一般的分组也构成本发明的一部分。这包括对本发明的一般性描述，以及从属中移除任何主题的附带条件或负面限制，而不管是否具体描述了移除的材料。

在通过参考马库什(Markush)组描述本发明的特征或方面的情况下，本发明还由此被描述为马库什组的任何单个成员或亚组成员。

本文提及的所有出版物、专利申请、专利和其他参考文献均明确地通过引用整体并入，如同每个都单独通过引用并入。如有冲突，以本说明书(包括定义)为准。

尽管已经结合上述实施例描述了本发明，但是前面的描述和示例旨在说明而不是限制本公开的范围。在本公开的范围内的其他方面、优点和修改对于本公开所属领域的技术人员将是显而易见的。

Claims

1.一种用于分析从实验室实验获得的数据的系统，包括处理器、存储器和程序代码，包括：

实验模块，被配置为存储用于执行实验的实验参数的值；

数据模块，被配置为存储来自实验的结果；

仪器模块，其被配置为存储关于运行实验的仪器的信息；

环境模块，其被配置为存储运行实验的环境条件；

数据可视化模块，被配置为显示存储在数据模块中的结果的视觉表示，

其中所述视觉表示还包括从由所述实验参数的值、关于所述仪器的信息和所述环境条件组成的组中选择的一个或多个参考数据点的表示。

2.根据权利要求1所述的系统，其中所述参考数据点还包括来自第二实验的结果。

3.根据权利要求1所述的系统，其中所述参考数据点对所述结果的解释施加限制。

4.根据权利要求3所述的系统，其中所述参考数据点消除了与所述数据的分析无关的一部分结果。

5.根据权利要求3所述的系统，其中所述参考数据点使所述结果生效或无效。

6.根据权利要求3所述的系统，其中所述参考数据点用作所述结果的标准或对照。

7.一种用于分析从实验室实验获得的数据的系统，包括处理器、存储器和程序代码，所述程序代码包括：

实验模块，其被配置为显示在实验中使用的样本的标识、用于进行实验的仪器的标识、从实验产生的数据集的标识以及环境记录的标识，所述环境记录包括进行实验的时间和地点的环境条件的测量，

数据模块，其被配置为显示数据提取或可视化以表示数据集、生成所述数据集的实验的标识以及对所述数据集执行的分析的标识；

仪器模块，其被配置为显示在仪器上进行的实验的列表，在仪器上运行的对照实验的列表以及仪器的维护记录；

分析模块，其被配置为显示进行分析的数据集的标识以及表示分析结果的分析摘要或图形；以及

环境模块，其被配置为显示进行实验的时间和地点的环境条件，

其中所述系统使得用户能够在向用户呈现由所述实验模块显示的实验面板的同时探索与实验有关的信息，通过：

(1)允许用户点击实验面板上由实验产生的数据集的标识，从而调用所述数据模块以在数据面板上显示对数据集执行的分析的标识，这允许用户点击对数据集执行分析的标识以调用所述分析模块，以在分析面板上显示表示分析结果的分析摘要或图形；

(2)允许用户点击环境记录的标识，从而调用所述环境模块以显示实验进行的时间和地点的环境条件；

(3)允许用户点击用于执行实验的仪器的标识，从而调用所述仪器模块以在仪器面板上显示在仪器上运行的对照实验列表以及与实验有关的仪器的维护记录。

8.根据权利要求7所述的系统，其中，所述程序代码进一步包括样本模块，所述样本模块被配置为显示生成所述样本的第一实验和在所述样本上执行的第二实验的标识。

9.根据权利要求7所述的系统，其中，所述分析面板上显示的分析摘要或图形允许用户对生成分析摘要或图形的数据集进行调整和访问。

10.根据权利要求7所述的系统，其中所述系统允许所述用户点击所述仪器面板上的实验列表以查看在所述仪器上进行的一个或多个其他实验以进行比较。