CN110689962A

CN110689962A - 模拟肿瘤的演变

Info

Publication number: CN110689962A
Application number: CN201910611371.6A
Authority: CN
Inventors: G·勒菲弗; A·巴尔; N·佩居谢; M·祖利安
Original assignee: Dassault Systemes of America Corp
Current assignee: Dassault Systemes SE; Dassault Systemes of America Corp
Priority date: 2018-07-04
Filing date: 2019-07-04
Publication date: 2020-01-14
Also published as: US11972871B2; JP2020021472A; JP7406929B2; EP3591666A1; US20200027564A1

Abstract

本发明尤其涉及用于模拟与致癌基因相关的肿瘤的演变的计算机实现的方法。该方法包括提供(S10)多个数据段，每个数据段对应于肿瘤的给定细胞，并且包括给定细胞中致癌基因的激活程度。该方法还包括提供(S20)模型，该模型被配置为获取输入的数据段并输出关于与输入的数据段相对应的相应给定细胞的增殖的信息。关于增殖的信息取决于致癌基因的激活程度。该方法还包括在多个数据段的一个或多个数据段上运行(S30)模型，并基于运行(S30)的结果更新(S40)多个数据段。这种方法改善了肿瘤的演变的模拟。

Description

模拟肿瘤的演变

技术领域

本发明涉及计算机程序和系统领域，更具体地涉及用于模拟肿瘤的演变的方法、系统和程序。

背景技术

存在用于模拟肿瘤的演变的计算机实现的方法。随着计算资源的增加，这些方法允许研究肿瘤的动态，并且因而形成重要的工具以及医学领域的信息来源。

这些方法中的一些基于求解偏微分方程。这些方法允许模拟特定位置的肿瘤并描述组织规模的肿瘤行为。然而，尽管这些模型可以描述肿瘤，但是它们的准确性相对较低。

在这一背景下，仍然需要一种用于模拟肿瘤的演变的改进方法。

发明内容

因此，提供一种用于模拟肿瘤的演变的计算机实现的方法。所述肿瘤与致癌基因相关联。所述方法包括提供多个数据段。每个数据段对应于所述肿瘤的给定细胞。每个数据段包括对应于相应数据段的所述给定细胞中所述致癌基因的激活程度。所述方法还包括提供模型。所述模型被配置为获取输入的数据段。所述模型还被配置为输出关于与所述输入的数据段相对应的所述相应给定细胞的增殖的信息。关于增殖的信息取决于所述相应给定细胞中的致癌基因的激活程度。所述方法还包括在所述多个数据段的一个或多个数据段上运行所述模型。所述模型还包括基于运行的结果来更新所述多个数据段。

所述方法可以包括以下各项中的一个或多个：

-每个数据段还包括所述肿瘤的给定细胞的空间定位；

-关于所述相应给定细胞的增殖的信息包括与所述相应给定细胞的分裂的存在或不存在有关的信息，并且当所述关于所述相应给定细胞的增殖的信息包括与分裂的存在有关的信息时，所述关于所述相应给定细胞的增殖的信息还包括对于由所述分裂产生的每个细胞的关于相应空间定位的信息，每个相应空间定位在所述相应给定细胞的空间定位附近；

-所述关于所述相应给定细胞的增殖的信息还取决于在所述相应给定细胞附近的空间可用性；

-与所述相应给定细胞的分裂的存在或不存在有关的信息基于在所述相应给定细胞附近的所述空间可用性，并且当所述关于所述相应给定细胞的增殖的信息包括与分裂的存在有关的信息时，在所述相应给定细胞的所述空间定位附近的所述相应空间定位处于未占用的空间定位；

-当所述关于所述相应给定细胞的增殖的信息包括与分裂的存在有关的信息时，所述关于所述相应给定细胞的增殖的信息还包括基于所述相应给定细胞的所述致癌基因的激活程度的由所述分裂产生的每个细胞的致癌基因的相应激活程度；

-由所述分裂产生的每个细胞的所述致癌基因的相应激活程度对应于所述相应给定细胞的所述致癌基因的激活程度的至少部分概率的变化；

-所述模型是基于决策的，并且相对于所述相应给定细胞包括以下各项：关于死亡或存活的决策，关于分裂的存在或不存在的决策，以及关于在分裂期间获得一个或多个新改变的决策；

-提供治疗类型，关于增殖的信息取决于所述治疗类型；

-对提供、运行和更新进行迭代(S50)，并且每次迭代所提供的多个数据段是先前迭代的经更新的多个数据段；

-提供与患有所述肿瘤的患者有关的数据，所述模型包括取决于与所述患者有关的数据的参数；

-提供所述模型包括：将所述参数确定为被配置用于通过以下方式检索所述多个数据段的值：定义一个或多个其他数据段，每个其他数据段对应于所述肿瘤的初始状态的给定细胞，每个其他数据段包括给定细胞中致癌基因的激活程度；在一个或多个其他数据段上运行所述模型；基于运行的结果来更新所述多个其他数据段；

-可选地，基于与所述患者有关的数据初始化参数的值；和/或

-基于经更新的多个数据段来确定与所述致癌基因有关的统计数据。

还提供了一种计算机程序，其包括用于执行所述方法的指令。

还提供了一种包括所述模型的数据结构。换而言之，所述数据结构包括模型的规范，所述模型被配置为获取与肿瘤的给定细胞相对应并且包括在给定细胞中与所述肿瘤相关的致癌基因的激活程度的输入数据段。所述模型还被配置为输出关于所述给定细胞的增殖的信息，关于增殖的信息取决于所述给定细胞中致癌基因的激活程度。所述模型被配置为被运行。

还提供了一种计算机可读存储介质，其上记录有计算机程序和/或包括所述模型的数据结构。

还提供了一种系统，其包括耦合到存储器的处理器和图形用户界面，所述存储器上记录有计算机程序和/或包括所述模型的数据结构。

附图说明

现在将通过非限制性示例并参考附图来描述本发明的实施例，其中：

图1示出了方法的示例的流程图；

图2示出了利用与患者有关的数据调整模型的参数的示例的流程图；

图3示出了包括校准模型的方法的示例的图；

图4示出了用于构建多个数据段的被分析肿瘤细胞的图像的实例；

图5A和5B示出了方法的模型的示例的流程图；

图6示出了用于输入与患者有关的数据的GUI的示例；

图7示出了被模拟肿瘤的示例；

图8-9示出了根据模型计算的统计数据的示例；

图10示出了系统的示例；

图11示出了模型的示例的数据流的流程图；

图12示出了包括若干次迭代的模型的示例的数据流的流程图；

图13示出了确定模型的输入和参数的示例的流程图；以及

图14示出了计算针对患者的模型的个性化参数的示例的流程图。

具体实施方式

参考图1的流程图，提出了一种用于模拟与致癌基因相关的肿瘤的演变的计算机实现的方法。该方法包括S10：提供多个数据段。每个数据段是储存在计算机中的信息，其对应于肿瘤的给定细胞。每个数据段包括给定细胞中致癌基因的激活程度。该方法还包括S20：提供被配置为将数据段作为输入的模型。该模型还被配置为输出关于对应于输入的数据段的相应给定细胞的增殖的信息。关于增殖的信息取决于相应给定细胞中致癌基因的激活程度。该方法还包括S30：在一个或多个数据段上运行模型，该数据段是多个数据段的一部分。该方法还包括S40：基于模型运行的结果更新多个数据段。

这种方法改善了肿瘤的演变的模拟。

值得注意的是，该方法通过在S30处计算一个或多个细胞的增殖并且在S40处基于S30的结果更新在S10处提供的多个数据段来模拟肿瘤的演变。

由于在S20处提供了被配置为根据致癌基因的激活程度输出增殖信息的模型，该模型在模拟细胞如何增殖时考虑了致癌基因的所述激活程度。这提高了肿瘤的演变模拟的准确性。实际上，细胞如何增殖受到细胞内致癌基因的激活程度的影响。例如，随着细胞内致癌基因的激活程度增加，这种细胞的分裂速率会增加。

由于取决于细胞中致癌基因的激活程度而输出的对应于用作模型输入的数据段的该细胞的增殖信息，肿瘤的演变的模拟考虑了细胞水平的信息。这提高了准确性。

由于来自多个数据段的每个数据段包括相应细胞中致癌基因的激活程度，并且多个数据段的更新S40基于运行S30的结果，所更新的多个数据段中的每个数据段包括其相应细胞中的致癌基因的激活程度。因此，在整个模拟过程中维持了与不同细胞中致癌基因的激活程度相关的肿瘤内异质性。这也提高了模拟的准确性。实际上，癌症是异质性疾病，并且关于肿瘤内异质性的知识提高了诊断和治疗的准确性，例如乳腺癌。

肿瘤的演变是肿瘤如何适时发展。例如，肿瘤的大小可能随着时间的推移以及肿瘤细胞的分裂而增加。替代地，如果患有肿瘤的患者接受治疗，则肿瘤的大小可能会减小。另外或替代地，肿瘤的演变可能包括肿瘤细胞的演变，诸如获得一个或多个细胞对某些治疗的抗性和/或一个或多个细胞中的一个或多个致癌基因的激活水平的变化。

肿瘤与致癌基因相关。因此，致癌基因可以在肿瘤的至少一个细胞中具有活性。这种细胞内的致癌基因会具有不同程度的激活。在示例中，致癌基因的激活程度可以对应于细胞中致癌基因的数量。另外或替代地，致癌基因的激活程度可以对应于细胞中致癌基因的表达水平。细胞中致癌基因的激活程度可以是细胞中一种或多种改变的结果。在示例中，改变可以包括以下任何一种或任何组合：基因拷贝数的增加、激活突变和/或导致基因融合的染色体间重排或染色体内重排。

在S10处提供的多个数据段分别对应于给定(即相应/对应)的肿瘤细胞。一个数据段对应于一个肿瘤细胞。每个数据段包括致癌基因在其对应细胞中的激活程度。换而言之，每个数据段包括表示对应细胞中致癌基因的实际激活程度的值，可能近似地和/或通过模拟来表示这种真实的激活程度。在示例中，多个数据段可以各自包括与肿瘤相关的多于一个致癌基因的激活程度。一个数据段中多于一个致癌基因的激活程度可以来自不同类型的致癌基因。在示例中，两个数据段可以包括不同致癌基因的激活程度。

对应于多个数据段中的每个数据段的肿瘤细胞代表真实的肿瘤细胞。在示例中，可以利用关于人的肿瘤细胞的可用信息来确定在S10处提供的多个数据段。该人可以是患有癌症的患者。在示例中，可以利用关于相应单个肿瘤细胞的可用信息来确定每个数据段。在这种情况下，在S20处提供的多个数据段中包括的细胞中致癌基因的激活程度可以对应于在给定时间点处属于患者肿瘤的细胞中致癌基因的实际激活程度。替代地，可以根据关于肿瘤细胞的可用信息来推断一个或多个数据段中的致癌基因的激活程度。在示例中，在多个数据段的数据段中致癌基因的激活程度的分布可以对应于癌细胞群中致癌基因的激活程度的实际分布。

在S20处提供的模型输出的增殖信息可以是表示细胞的时间演变(即细胞如何增殖)和/或会对细胞中致癌基因的激活程度产生影响的机制细胞的时间演变的任何信息。在示例中，关于增殖的信息可以包括关于细胞死亡或存活的信息(即关于细胞是否存活的信息)，关于分裂不存在或存在的信息(即关于细胞是否分裂、何时存活的信息)，和/或关于致癌基因激活程度的演变的信息(即，关于在由亲本细胞分裂产生的两个细胞中致癌基因激活程度相对于该亲本细胞是否已经改变的信息，例如，举例来说，关于在分裂期间获得一个或多个新改变的信息)。

关于模型输出的细胞增殖的信息取决于细胞中致癌基因的激活程度。该依赖性可以是实现关于真实细胞过程的知识的任何关系。例如，已知如果细胞中致癌基因的激活程度增加，则与作为输入的数据段相对应的细胞的分裂速率会增加。在示例中，该依赖性可以是这样的：随着输入到模型的相应给定细胞中致癌基因的激活程度的增加，相应给定细胞更可能分裂和/或更可能增加由相对于相应给定细胞中致癌基因的激活程度的分裂产生的两个细胞中致癌基因的激活程度(例如，更可能在分裂期间获得一个或多个新的改变)。因此，该模型提供了准确的输出。

在多个数据段的一个或多个数据段上运行模型S30。该模型模拟一个或多个细胞的演变，每个细胞具有与肿瘤相关联的致癌基因的相应激活程度。细胞的集体演变模拟肿瘤的演变。在示例中，可以从单个细胞启动模拟。替代地，可以从一组细胞启动模拟。

在S40处更新的多个数据段代表肿瘤的演变。更新的多个数据段表示与在稍后时间点处在S30中运行之后在S10处提供的多个数据段相对应的细胞。这样，包括在更新的多个数据段中的致癌基因的相应激活程度对应于在所述稍后时间点处在对应细胞中致癌基因的激活程度。如果在模拟细胞的演变之后由所述至少一个数据段表示的细胞中致癌基因的激活程度没有改变，则在更新后至少一个数据段可以保持不变。替代地或另外地，可以在模拟之后修改至少一个数据段。在示例中，如果在运行S30之后，关于与该数据段相对应的细胞的增殖的信息包括与细胞死亡相关的信息，则可以丢弃至少一个数据段。在更新S40期间，可以从多个数据段中删除丢弃的数据段。替代地或另外地，可以为细胞创建一个新的数据段，该细胞由在运行S30期间对应于作为输入的数据段的细胞的分裂而产生。在这种情况下，可以设置值。在每次运行模型之后可以更新多个数据段。替代地，在使用关于细胞增殖的每个相应信息更新多个数据段之前，可以在多个数据段上运行模型。

所提供的多个数据段与更新的多个数据段之间的变化模拟肿瘤的演变。基于在运行S30期间执行的细胞增殖的模拟，每个更新的数据段具有与肿瘤相关联的致癌基因的更新的激活程度。模拟的肿瘤的演变维持了由不同细胞中致癌基因的不同激活程度反映的模拟的异质性。因此，该方法允许确定肿瘤细胞之间异质性演变的预测。

在示例中，每个数据段可以进一步包括与相应的数据段相对应的细胞的空间定位。空间定位允许将细胞定位在二维或三维空间中。二维或三维空间可以具有最大尺寸。换而言之，根据三维或二维空间中的方向的最大长度。在示例中，空间定位可以是与点、面或体积相对应的一组坐标。在示例中，可以关于由单元(即网格单元)组成的网格来指定空间定位。在示例中，网格可以是规则的和/或单元可以是立方的。细胞的空间定位可以对应于相应的单元。在示例中，两个细胞可能不位于相同的空间定位处。当模拟肿瘤的演变时，这种空间定位允许一个或多个更新的数据段提供关于致癌基因的激活程度的空间分布的附加信息。实际上，当定位与更新的多个数据段相对应的细胞时，相对于致癌基因的激活程度的空间肿瘤内异质性变得明显。在示例中，肿瘤演变的模拟可以将更新的多个细胞定位在三维或二维网格中，并且向用户提供模拟肿瘤的空间肿瘤内异质性。

在示例中，在S20处提供的模型还可以被配置为确定细胞是否经历分裂。该确定可以取决于细胞内致癌基因的激活程度。然后，取决于由模型执行的确定，当运行模型(S30)时，关于细胞增殖的信息可以包括与细胞分裂的存在或不存在相关的信息。

当模型确定相应的细胞分裂时，在S30处输出的关于相应细胞增殖的信息可以允许确定由分裂产生的两个细胞的空间定位。此外，关于增殖的信息可以进一步允许确定在两个细胞中致癌基因的激活程度。在示例中，由分裂产生的两个细胞的空间定位和它们相应的致癌基因的激活程度可以被包括在S30处输出的关于增殖的信息中。

由分裂产生的两个细胞的空间定位可以在亲本细胞的邻域中。给定细胞的邻域可以是低于预定阈值的距离处的所有点的空间。该距离可以是欧几里德距离。预定阈值可以严格地低于二维或三维空间的最大长度的一半。在示例中，预定阈值低于十个单元长度和/或十个网格单元。在示例中，预定阈值等于一个单元长度和/或一个网格单元。换而言之，邻域可以对应于与给定细胞相邻的所有空间定位。例如，在等于单元长度的距离处的两个空间定位和/或对应于共享公共面、边或顶点的两个网格单元的两个空间定位。由分裂产生的两个细胞中的一个细胞的空间定位可以对应于与由模型用其作为输入的数据段相对应的细胞的空间定位。在示例中，如果没有细胞分裂，则在更新S40期间细胞的空间定位不会改变。因此，由分裂产生的细胞的空间定位可以取决于经历分裂的细胞的空间定位。因此，更新多个数据段保持了细胞的空间定位的初始分布的一致性。因此，模拟可以包括下一代细胞的真实空间分布以及它们相应的致癌基因的激活程度。

在示例中，关于与由模型用其作为输入的一个数据段相对应的细胞的增殖的信息可以进一步取决于细胞的空间定位附近的空间可用性。空间可用性是指细胞是否位于空间定位处。换而言之，空间可用性取决于空间定位是否已经被分配给任何细胞。

在示例中，与作为输入的细胞的分裂的存在或不存在有关的信息可以基于细胞邻域中的空间可用性。在示例中，对于该模型，为了在运行S30期间肯定地确定与作为输入的数据段相对应的细胞经历分裂，在细胞的空间定位附近的至少一个空间定位必须是未占用的空间定位，因而没有被分配给任何细胞。在细胞的空间定位附近的每个未占用的相应空间定位是可以被分配给由分裂产生的细胞的可用空间定位。在示例中，模型可以在运行S30之前根据可用的数据段来确定哪些空间定位可用。替代地，模型可以在运行期间执行确定，允许多个模拟并行运行，每个模拟对应于不同的数据段。

在示例中，如果模型在运行S30期间确定对应于作为输入的数据段的细胞分裂，则关于细胞增殖的信息可以包括对于由分裂产生的每个细胞，致癌基因的相应激活程度。致癌基因的相应激活程度基于与由模型用其作为输入的数据段相对应的细胞的致癌基因的激活程度。由分裂产生的细胞的致癌基因的激活程度可以彼此不同，并且还可以与对应于作为输入的数据段的细胞的致癌基因的激活程度不同。实际上，在运行S30期间，致癌基因的激活程度可能由于细胞中发生的模拟改变而变化。这允许模型更接近地模拟肿瘤的演变。在示例中，该模型可以考虑新的改变，例如新的突变和/或不对称的细胞分裂。如果致癌基因的初始激活程度增加，则新的突变和/或不对称的细胞分裂的频率会增加。替代地或另外地，由分裂产生的细胞的致癌基因的激活程度可以与对应于由模型用其作为输入的数据段的细胞相同。因此，可以提高肿瘤的演变的模拟的准确性。实际上，该方法可以模拟肿瘤，其中，新的改变不会在肿瘤细胞中系统地出现。

在示例中，由分裂产生的每个细胞的致癌基因的激活程度可以对应于相应给定细胞中致癌基因的激活程度的至少部分是概率的变化。“至少部分是概率的”意味着变化取决于随机变量。另外，该变化可以进一步取决于确定性变量。在示例中，相应给定细胞中致癌基因的激活程度的变化可以取决于随机变量和固定值，例如，随机变量的生成值与固定值的比较。随机变量可以是根据范围[0,1]上的均匀概率分布生成的0到1之间的数字，并且固定值可以表示生物过程发生的概率。然后可以将随机变量的生成值与固定值进行比较，从而在运行S30的迭代中模拟概率。因此，在S20处提供的模型可以考虑控制细胞演变的生物过程的概率性质。

例如，细胞中致癌基因的激活程度可以基于出现改变的概率而增加。在示例中，可以基于根据数学模型确定的阈值来确定细胞的一个或多个生物过程的发生概率。另外，仅在模型确定细胞经历分裂时，才可以执行在S20期间由模型执行的与细胞中致癌基因的激活程度的改变有关的计算。因此，该模型在每次运行S30期间使用较少的计算资源，同时保持对生物学的考虑。实际上，改变可能主要在细胞分裂期间出现。另外或替代地，由分裂产生的细胞中致癌基因的激活程度可以基于也遵循概率规则的细胞分裂的不对称性。因此，模拟的肿瘤的演变基于细胞的致癌基因的激活程度，并且受制于控制细胞演变的机制固有的概率变化，这提高了模拟的准确性。

在示例中，在S20处提供的模型可以是基于决策的模型，例如决策树模型。基于决策的模型通过呈现取决于模型的参数而导致至少两种可能结果的决策来执行模拟。在示例中，模型可以是这样的：一旦确定了结果，就可以再次呈现新的决策。新的决策也导致至少两个结果。在S20处提供的模型可以包括关于与作为输入的数据段相对应的细胞的死亡或存活的决策。然后，如果结果是细胞存活，则接着可以是不存在或存在细胞分裂的决策。然后，如果结果是细胞分裂，则接着可以是获得新的改变的决策，例如可以改变细胞中致癌基因的激活程度。新的改变可以与新的着丝粒的获得、新的突变的获得、染色体的改变、染色体拷贝数的增益或损失和/或不对称分裂有关。决策可能受到与作为输入的数据段相对应的细胞中致癌基因的激活程度的影响。替代地，当做出决策时，决策可能受到细胞中致癌基因的激活程度的影响。基于决策的模型允许按照它们出现的顺序遵循肿瘤细胞演变的不同阶段。因此，所得细胞中致癌基因的激活程度是生物过程的顺序模拟的结果。因此，肿瘤的演变的模拟的准确性增加。

另外，可以基于相对于概率的计算结果来确定每个决策。概率可以取决于细胞中致癌基因的激活程度。这样，在S20处提供的模型模拟可能导致细胞内致癌基因的激活程度的变化的事件序列和生物机制的概率性质二者。因此，进一步增加了肿瘤的演变的模拟的准确性。

在示例中，可以提供治疗类型，并且关于增殖的信息可以进一步取决于治疗类型。治疗类型可以涉及一种或多种治疗或治疗的组合，诸如药物治疗或治疗性治疗。然后，在S20处提供的模型可以进一步被配置为在确定与作为输入的数据段相对应的细胞是否存活时考虑治疗类型。确定与作为输入的数据段相对应的细胞是否存活可以在运行期间的任何时刻执行。因此，肿瘤的演变的模拟可以预测特定治疗或治疗组合的相对功效。在示例中，治疗类型可以是选择性的，例如靶向一种或多种特定致癌基因的治疗。替代地或另外地，治疗类型可以是一般的治疗类型，例如化疗。这样，通过考虑一种或多种治疗的作用机制，可以提高预测治疗或治疗组合的相对功效的准确性。

在示例中，在利用运行结果更新多个数据段S40之后，可以通过再次运行模型来执行迭代S50，将来自更新的多个数据段中的一个或多个数据段作为输入。更新的多个数据段可以包括由模型的先前运行中的细胞分裂产生的新数据段。对于每次迭代，在使用来自更新的多个数据段的一个或多个数据段运行模型S30之后，基于新运行的结果进一步更新所更新的多个数据段。这允许通过模拟几代细胞来模拟肿瘤随时间的演变。因此，可以执行肿瘤的演变的模拟以在给定量的时间过去之后估计肿瘤。在示例中，每次将数据段作为模型的输入时，时间跳跃可以与对应于该数据段的细胞相关联。

在示例中，在更新之后，对应于多个数据段的多个细胞被认为在时间上提前了等于完成细胞周期所需的时间的持续时间。

在示例中，在更新之后，多个数据段被认为在时间上提前了等于下式的持续时间：

(完成细胞周期所需的时间)

其中n是作为输入的数据段的数量，N是多个数据段中的数据段的数量。例如，如果将十分之一的数据段作为输入，则在更新之后，细胞群在时间上提前完成细胞周期所需的时间的十分之一。这允许异步模拟肿瘤细胞。

在示例中，在S20处提供模型之前，可以提供与患有肿瘤的患者相关的数据。然后可以基于与患者有关的数据来调整在S20处提供的模型。“调整”意味着可以根据与患者有关的数据来修改模型的至少一个参数。如果模型的参数值为空，则可以设置值。例如，细胞突变的概率可以取决于生活方式数据或患者的其他临床数据。生活方式数据可以包括吸烟、体重指数(BMI)和/或年龄中的任何一个或组合。与患者有关的数据可以包括物理数据。物理数据可以包括身高、体重、体重指数(BMI)中的任何一个或组合或者与患者的生活方式相关的任何信息。替代地或另外地，与患者有关的数据可以包括患者的医疗信息。患者的医疗信息可以包括遗传风险因素、病史、患者的生活方式或与患者的遗传性疾病有关的任何信息中的任何一个或组合。附加地或替代地，可以通过对特定患者群体的校准来调整模型。在示例中，特异性可以是肿瘤位置或致癌基因。

通过利用与患者有关的数据调整在S20处提供的模型，肿瘤演变的模拟变得对所述患者个性化。这增加了所述患者的模拟的肿瘤演变的准确性。替代地，可以根据来自文献的数据来配置在S20处提供的模型。例如，当与患者有关的数据不可用时。

现在参考图2，在示例中，在S20处提供的模型可以包括一个或多个参数。可以通过配置值来确定参数，使得能够检索在S10处提供的多个数据段。可以通过定义一个或多个其他数据段S22来执行检索。每个其他数据段可以对应于肿瘤初始状态的给定细胞，并且包括与给定细胞中的肿瘤相关的致癌基因的激活程度。肿瘤的初始状态可以包括可以导致肿瘤的一个或多个细胞，例如由S10处提供的多个数据段表示的肿瘤。一个或多个其他数据段可以对应于在S10处提供的多个数据段的选定部分。替代地或另外地，一个或多个其他数据段可以分别被分配随机空间定位和致癌基因的随机激活程度。

模型的参数被初始化S24。换而言之，选择模型参数的第一值。

接下来，在S22处定义的一个或多个其他数据段上运行S26模型。

接下来，基于运行S26的结果更新S27一个或多个其他数据段。

接下来，可以迭代S26和S27，以便增加形成多个其他数据段的其他数据段的数量，并且及时模拟肿瘤的进展。

接下来，将更新的多个其他数据段与在S10处提供的多个数据段的数据段进行比较。

如果对应于更新的多个其他数据段的数据段的细胞与对应于S10处提供的多个数据段的数据段的细胞基本相同，则参数的值被验证S29。“基本相同”意味着对应于更新的多个其他数据段的其他数据段的细胞和与S10处提供的多个数据段的数据段相对应的细胞具有相似的值，在可以自动定义或通过用户输入定义的公差范围内。细胞之间的相似值可以包括细胞中致癌基因的相应激活程度和/或细胞的相应空间定位。替代地，该比较可以涉及细胞群之间致癌基因的激活程度的分布。

如果对应于更新的多个其他数据段的其他数据段的细胞与对应于在S10处提供的多个数据段的数据段的细胞不基本相同，则模型的参数值根据比较的细胞之间的相似性改变，并重复该过程。附加地或替代地，在与S10处提供的多个数据段进行比较之前，可以对其他数据段执行若干次的运行和更新迭代。在示例中，执行迭代直到更新的多个其他数据段的其他数据段的数量与在S10处提供的多个数据段的数据段的数量基本相同为止。替代地，可以执行迭代，使得更新的多个其他数据段的细胞群中致癌基因的激活程度的分布与对应于在S10处提供的数据段的细胞中致癌基因的激活程度的分布基本相同。可以在每次迭代之间执行对应于更新的多个其他数据段的其他数据段的细胞与对应于在S10处提供的多个数据段的数据段的细胞之间的比较。替代地，可以在多次迭代之后执行比较。

通过使用在S10处提供的多个数据段作为比较参考来调整模型的参数，进一步增加了利用这种模型执行的肿瘤演变的模拟的准确性。实际上，对应于在S10处提供的多个数据段的数据段的细胞代表真实的肿瘤细胞。因此，从肿瘤样本的模拟中检索真实世界数据表明模型的参数被正确调整并且将更准确地实现。因此，其细胞对应于在S10处提供的多个数据段的数据段的肿瘤的演变的模拟将是准确的。

在示例中，在初始化S24期间模型的参数的第一值基于与患者有关的数据。换而言之，与患者有关的数据可以用作模型参数的先验数据。这增加了给定患者的模型的准确性，并且避免了可能不与患者相对应的参数的组合。实际上，该模型包括多于一个参数，这样，可以存在可能导致类似模拟的参数值的多于一个的组合。取决于在S24处初始化参数期间选择的初始值，在调整模型时可以达到参数值的不同组合。通过基于与患者有关的数据来初始化参数，在S29处验证的参数值与患者的数据直接有关。这进一步使肿瘤的演变的模拟个性化。因此，增加了模拟的准确性。

现在参考图3，示出了利用模型的校准来模拟肿瘤的演变的过程的示例。来自患者肿瘤的过去数据未知，因为没有关于其何时首次被开发的临床信息。为了校准模型，提供了细胞池并且一组参数被选择和/或计算。来自患者肿瘤的当前数据包括肿瘤的图像，可以根据该图像计算当前肿瘤的数值表示，例如以数据段的形式。该模型利用细胞池和过去数据的参数来运行，直到它与根据当前数据计算的数值表示基本相同为止。然后，模型被校准并且可以用于执行代表将来数据的肿瘤演变的数值预测。

回到图1，在示例中，在S40更新多个数据段至少一次之后，可以计算与致癌基因有关并且基于多个数据段的统计数据。该统计数据可以包括计算对应于更新的多个数据段的细胞群中致癌基因的激活程度的分布的形状和值。另外，统计数据可以进一步包括对应于更新的多个数据段的数据段的细胞中致癌基因的激活程度的空间分布。根据统计数据，可以进一步计算指示具有肿瘤的致癌基因的不同激活程度的区域的空间表示。根据空间表示或计算的统计数据，用户可以检索预测的肿瘤内空间异质性。另外，统计数据可以包括计算异质性的数值并将其连同肿瘤大小一起呈现给用户。

用于模拟肿瘤的演变的方法可以用于帮助医学专家选择最适合患者的治疗。实际上，肿瘤的演变的模拟可以预测肿瘤的生长，允许医学专家调整患者的治疗优先级。附加地或替代地，假设模拟可以预测肿瘤内异质性，该方法可以进一步帮助医学专家选择治疗选择。此外，该方法适用于医疗专业人员的时间约束。实际上，模拟可以集中于有限数量的致癌基因而不执行对应于细胞的基因组的大部分的计算。这使得模拟可以非常短，以便在诊所或医院中用于不能长时间停留的患者。

该方法是计算机实现的。这意味着该方法的步骤(或基本上所有步骤)由至少一个计算机或类似的任何系统执行。因此，该方法的步骤由计算机执行，可能是完全自动的或半自动的。在示例中，可以通过用户-计算机交互来执行对该方法的至少一些步骤的触发。所要求的用户-计算机交互水平可以取决于预见的自动化水平，并与实现用户意愿的需求保持平衡。在示例中，该水平可以是用户定义的和/或预定义的。

该方法的计算机实现的典型示例是利用适用于此目的的系统来执行该方法。该系统可以包括耦合到存储器的处理器和图形用户界面(GUI)，该存储器具有记录在其上的计算机程序，该计算机程序包括用于执行该方法的指令。存储器还可以存储数据库。存储器是适用于这种存储的任何硬件，可能包括若干个物理不同部分(例如，程序的部分，并且可能数据库的部分)。

图10示出了该系统的示例，其中，该系统是客户端计算机系统，例如，用户的工作站。

该示例的客户端计算机包括连接到内部通信总线1000的中央处理单元(CPU)1010和也连接到总线的随机存取存储器(RAM)1070。客户端计算机还提供有图形处理单元(GPU)1110，其与连接到总线的视频随机存取存储器1100相关联。视频RAM 1100在本领域中也被称为帧缓冲器。大容量存储设备控制器1020管理对诸如硬盘驱动器1030的大容量存储器设备的存取。适合于有形地体现计算机程序指令和数据的大容量存储器设备包括所有形式的非易失性存储器，包括例如半导体存储器设备，诸如EPROM、EEPROM和闪存设备；磁盘，诸如内部硬盘和可移动磁盘；磁光盘；以及CD-ROM盘1040。前面的任何一个都可以由专门设计的ASIC(专用集成电路)补充或被并入其中。网络适配器1050管理对网络1060的访问。客户端计算机还可以包括触觉设备1090，诸如光标控制设备、键盘等。在客户端计算机中使用光标控制设备以允许用户选择性地将光标定位在显示器1080上的任何期望位置处。此外，光标控制设备允许用户选择各种命令，并且输入控制信号。光标控制设备包括多个信号生成设备，用于向系统输入控制信号。通常，光标控制设备可以是鼠标，鼠标的按钮用于生成信号。替代地或另外地，客户端计算机系统可以包括敏感垫和/或敏感屏幕。

该计算机程序可以包括可由计算机执行的指令，该指令包括用于使上述系统执行该方法的模块。该程序可以在任何数据存储介质(包括系统的存储器)上记录。该程序可以例如在数字电子电路中实现，或者在计算机硬件、固件、软件或它们的组合中实现。该程序可以被实现为装置，例如有形地体现在机器可读存储设备中的产品，用于由可编程处理器执行。方法步骤可以由执行指令程序的可编程处理器执行，以通过对输入数据进行操作并生成输出来执行该方法的功能。因此，处理器可以是可编程的并且被耦合以从数据存储系统、至少一个输入设备以及至少一个输出设备接收数据和指令，并将数据和指令发送到数据存储系统、至少一个输入设备以及至少一个输出设备。如果需要，应用程序可以利用高级的面向过程或面向对象的编程语言实现，或者利用汇编语言或机器语言实现。在任何情况下，该语言可以是编译语言或解释语言。该程序可以是完整安装程序或更新程序。程序在系统上的应用导致在执行该方法的指令中的任何情况。

以下是与该方法在其上构建的肿瘤有关的治疗决策的讨论。

该讨论参考以下学术文献的列表：

1、诊断介入性成像，2014年6月；95(6)：527-39，Ammari S，Thiam R，Cuenod CA等人，对治疗响应的放射学评估：应用于接收抗血管生成治疗的转移性肾癌(Ammari S,ThiamR,Cuenod CA,et al.Radiological evaluation of response to treatment:application to metastatic renal cancers receiving anti-angiogenictreatment.Diagn Interv Imaging.2014Jun；95(6):527-39)。

2、肿瘤学年鉴，2017年2月19日doi:10.1093/annonc/mdx036，Cardoso F等人，第3届ESO-ESMO高级乳腺癌国际共识指南(ABC 3)(Cardoso F,et al.3rd ESO-ESMOInternational Consensus Guidelines for Advanced Breast Cancer(ABC 3).AnnOncol.2017Feb 19.doi:10.1093/annonc/mdx036)。

3、分子诊断学杂志，2013；15(4):415-53，Lindeman NI等人，选择EGFR和ALK酪氨酸激酶抑制剂的肺癌患者的分子测试指南：来自美国病理学家学院、国际肺癌研究协会和分子病理学协会的指南(Lindeman NI,et al.Molecular testing guideline forselection of lung cancer patients for EGFR and ALK tyrosine kinaseinhibitors:guideline from the College of American Pathologists,InternationalAssociation for the Study of Lung Cancer,and Association for MolecularPathology.J Mol Diagn.2013；15(4):415-53)。

4、肿瘤学年鉴，2016年9月；27(第5期增刊)：卷1至卷27渐进分析，计算与应用数学(2006)，Novello S等人，《转移性非小细胞肺癌：用于诊断、治疗和随访的ESMO临床实践指南》(Novello S.,et al.Metastatic non-small-cell lung cancer:ESMO ClinicalPractice Guidelines for diagnosis,treatment and follow-up.Ann Oncol.2016Sep；27(suppl 5):v1-v27asymptotic analysis."Computational&Applied Mathematics(2006))。

5、Watanabe T，促进对致癌基因扩增机制的理解的模型系统。由YahwardiahSiregar编辑的发布于2013年1月24日，ISBN 978-953-51-0858-0的书《致癌基因和癌症-从实验室到诊所》(Watanabe T.Model Systems Facilitating an Understanding ofMechanisms for Oncogene Amplification.Oncogene and Cancer-From Bench toClinic,book edited by Yahwardiah Siregar,ISBN 978-953-51-0858-0,Published:January 24,2013)。

6、分子诊断学杂志，2013年，Wolff AC等人，《人表皮生长因子受体2的建议》(Wolff AC,et al.Recommendations for Human Epidermal Growth Factor Receptor2.J Clin Oncol；2013)。

7、细胞，2006；127(5)：增补的905-915，“IEEE图像处理事务2004”Anderson ARA，Weaver AM，Cummings PT,Quaranta V.，《来自微环境的选择性压力驱动的肿瘤形态和表型进化》(Anderson ARA,Weaver AM,Cummings PT,Quaranta V.Tumor morphology andphenotypic evolution driven by selective pressure from themicroenvironment.Cell.2006；127(5):905–915inpainting."IEEE Transactions onImage Processing 2004)。

8、科学报告，2016；6：23383，Buckley，NE等人，《乳腺癌中HER2异质性的定量-鉴定亚显性克隆用于个性化治疗的意义》(Buckley,NE et al.Quantification ofHER2heterogeneity in breast cancer–implications for identification of sub-dominant clones for personalised treatment.Sci Rep.2016；6:23383)。

9、肿瘤学年鉴，2008；19：595-7，Cottu PH等人，《HER2/neu表达的瘤内异质性及其对晚期乳腺癌管理的影响》(Cottu PH,et al.Intratumoral heterogeneity of HER2/neuexpression and its consequences for the management of advanced breastcancer.Ann Oncol 2008；19:595–7)。

10、分子诊断学杂志，2009；27(18)：2962-9，Dowsett M等人，《根据HER2扩增程度，无论是否接受1年曲妥珠单抗辅助化疗的患者的无病生存期：HERA试验》(Dowsett M etal.Disease-free survival according to degree of HER2amplification forpatients treated with adjuvant chemotherapy with or without 1year oftrastuzumab:the HERA Trial.J Clin Oncol 2009；27(18):2962-9)。

11、PLoS One，2017；12(9):e0184229，Iwasaki WM等人，《用于在癌细胞群中产生肿瘤内异质性模式的模拟框架》(Iwasaki WM,et al.Simulation framework forgenerating intratumor heterogeneity patterns in a cancer cell population.PLoSOne.2017；12(9):e0184229)。

12、美国临床病理学杂志，2014；142：755-766，Lee HJ等人，《HER2异质性影响HER2阳性转移性乳腺癌患者的曲妥珠单抗响应和生存》(Lee HJ,et al.HER2HeterogeneityAffects Trastuzumab Responses and Survival in Patients With HER2-PositiveMetastatic Breast Cancer.Am J Clin Pathol 2014；142:755-766)。

13、数学医学和生物学：IMA期刊，34(2)，151-176，Lefebvre，G.，Cornelis，F.，Cumsille，P.，Colin，T.，Poignard，C.，和Saut，O，《肿瘤耐药性的空间建模：GIST肝转移的病例》(Lefebvre,G.,Cornelis,F.,Cumsille,P.,Colin,T.,Poignard,C.,&Saut,O.(2016).Spatial modelling of tumour drug resistance:the case of GIST livermetastases.Mathematical medicine and biology:a journal of the IMA,34(2),151-176)。

14、国际病理学，2016；66(6)：313-24，Nitta H等人，《乳腺癌中HER2状态的评估：过去，现在和未来》(Nitta H,et al.The assessment of HER2 status in breastcancer:the past,the present,and the future.Pathol Int.2016；66(6):313-24)。

15、PLoS计算生物学，2015；11(3)：e1004025，Poleszczuk J，Hahnfeldt P，Enderling H，《癌症干细胞的进化和表型选择》(Poleszczuk J,Hahnfeldt P,EnderlingH.Evolution and phenotypic selection of cancer stem cells.PLoSComput.Biol.2015；11(3):e1004025)。

16、理论生物学和医学建模3,1，2006年，Ribba，B.，Colin，T.，Schnell，S.《癌症的多尺度数学模型及其在分析辐射疗法中的应用》(Ribba,B.,Colin,T.,Schnell,S.,2006.Amultiscale mathematical model of cancer,and its use in analyzing irradiationtherapies.Theoretical Biology and Medical Modelling 3,1)。

17、美国临床病理学杂志，2012；137：595-605，Starczynski J等人，《乳腺癌中的HER2基因扩增：罗格的挑战诊断案例库：UKNEQAS解释指南和研究建议》(Starczynski J etal.HER2Gene Amplification in Breast Cancer:A Rogues’Gallery of ChallengingDiagnostic Cases:UKNEQAS Interpretation Guidelines and ResearchRecommendations.Am J Clin Pathol 2012；137:595-605)。

18、自然.遗传学，2015；47(3)：209-216，Sottoriva A，Kang H，Ma Z，Graham TA，Salomon MP，Zhao J等人，《人类结肠直肠肿瘤生长的大爆炸模型》(Sottoriva A,Kang H,Ma Z,Graham TA,Salomon MP,Zhao J,et al.A Big Bang model of human colorectaltumor growth.Nat.Genet.2015；47(3):209–216)。

19、科学转化医学期刊，2012；4(127)：127ps10，Yap TA等人，《瘤内异质性：看到树木》(Yap TA,et al.Sci Transl Med.Intratumor heterogeneity:seeing the wood forthe trees.2012；4(127):127ps10)。

20、自然通讯，2016；7：12222，法拉利A等人，《HER2阳性乳腺癌的全基因组序列和转录组观点》(Ferrari A,et al.Awhole-genome sequence and transcriptomeperspective on HER2-positive breast cancers.Nat Commun.2016；7:12222)。

21、乳腺癌研究，2012；14，R150，doi：10.1186/bcr3362，Marotta M，Chen X，Inoshita A，Stephens R，Thomas Budd G，Crowe JP等人，《乳腺癌中ERBB2扩增的常见拷贝数断点与复杂的节段重复块共定位》(Marotta M,Chen X,Inoshita A,Stephens R,ThomasBudd G,Crowe JP,et al.A common copy-number breakpoint of ERBB2amplificationin breast cancer colocalizes with a complex block of segmentalduplications.Breast Cancer Research 2012；14,R150.doi:10.1186/bcr3362)。

22、科学报告，2017；7：41921，Marotta M.Palindromic，《原发性HER2阳性乳腺肿瘤中ERBB2致癌基因的回文扩增》(Marotta M.Palindromic amplification of theERBB2oncogene in primary HER2-positive breast tumors.Sci Rep.2017；7:41921)。

23、2017年6月21日访问的NICE指南，https://pathways.nice.org.uk/pathways/advanced-breast-cancer#path＝view％3A/pathways/advanced-breast-cancer/managing-advanced-breast-cancer.xml&content＝view-node％3Anodes-hrpos-and-her2pos(NICE guideline,accessed 2017June 21.https://pathways.nice.org.uk/pathways/advanced-breast-cancer#path＝view％3A/pathways/advanced-breast-cancer/managing-advanced-breast-cancer.xml&content＝view-node％3Anodes-hrpos-and-her2pos)。

24. 2017年6月21日访问的NCCN指南，https：//www.nccn.org/professionals/physician_gls/pdf/breast.pdf(NCCN guidelines,accessed 2017June 21.https://www.nccn.org/professionals/physician_gls/pdf/breast.pdf)。

25.生物化学与生物物理学报，2015；1856(1)：73-85，Barnard ME等人，《确定乳腺癌的危险因素和内在肿瘤亚型的风险》(Barnard ME,et al.Established breast cancerrisk factors and risk of intrinsic tumor subtypes.Biochim Biophys Acta.2015；1856(1):73-85)。

26、肿瘤流行病学，生物标志物和预防，2014年1月；23(1)：84-97，O'Brien KM等人，《乳腺癌亚型和先前确定的遗传风险因素：贝叶斯方法》(O’Brien KM,et al.Breastcancer subtypes and previously established genetic risk factors:ABayesianapproach.Cancer Epidemiol Biomarkers Prev.2014Jan；23(1):84–97)。

在医学中，治疗决策基于诊断。例如，肿瘤科医生可以在肿瘤活组织检查确诊并且通过扩展的放射学或病理学检查进行治疗后来治疗浸润性乳腺癌。在精准医学中，可以添加生物学标记(生物标记)以支持临床决策，因为它们有助于改进诊断并帮助预测治疗结果。例如，基于雌激素受体、孕酮受体和HER2(人表皮受体2)的表达，将乳腺癌分为不同的亚组，并且它们指导使用激素疗法和抗HER2靶向疗法。伴随诊断测试是专门设计用于与特定药物配对的生物标记。伴随诊断是医疗设备，其可以帮助医生决定为患者提供哪些治疗方案，以及为患者量身定制的剂量。目前，联邦药物管理局批准了39项基于遗传或组织学生物标记的伴随测试。

生物标记(和伴随诊断测试)结果解释的一个主要限制是如许多生物过程所观察到的个体间变异性，这意味着值相对于统计分布而分布。生物标记可用性的另一个限制是肿瘤内异质性，这是一种普遍现象，其中不同的癌细胞群可以在单个肿瘤中共存。在这种情况下，不清楚伴随测试应该针对哪些细胞群。

目前的生物标记确实考虑了个体间和肿瘤内异质性，即使在通过批准的测试评估遗传肿瘤内异质性时，诸如例如用于检测HER2ALK基因扩增、RET基因融合、ROS1基因融合的原位杂交(ISH)和/或免疫组织化学(IHC)的蛋白质表达，CD274(PD-L1)表达、ESR/PGR(激素受体)表达。

目前，这些生物标记基于使用独特临界点的定量测量的离散化以识别符合条件的患者进行特定治疗。基因扩增或蛋白质表达的临界点来自专家指南。临界点的示例包括：

-超过10％的细胞中的HER2表达(IHC)[6]

-超过10％的细胞中的HER2基因扩增(ISH)，由平均HER2拷贝数≥

6.0信号/细胞或比率HER2/着丝粒比率≥2.0定义[6]

-超过15％的细胞中的ALK基因融合[3]。

目前，具有阳性生物标记的所有患者都有资格获得FDA批准的药物。例如，HER2阳性乳腺癌患者均优选使用帕妥珠单抗(pertuzumab)-曲妥珠单抗(trastuzumab)联合一线化疗，并使用二线阿托-曲妥珠单抗(TDM-1，ado-trastuzumabemtansine)进行治疗[2]，无论HER2模式如何。在肺癌的示例中，ALK阳性肺癌患者在一线治疗中都符合接受ALK抑制剂的条件[4]。

尽管指南建议明确解释的临界点，但临界病例或生物标记的异常模式经常发生。许多研究报到，大约10％的乳腺癌具有HER2基因扩增异质性[8,9,17]，这种情况与使用曲妥珠单抗(一种治疗性抗HER2单克隆抗体[12])治疗时的较差生存率相关。

对于精确治疗，也可以考虑患者间的变异性。的确，Dowsett等人表明HER2扩增水平遵循大量患者群体中的高斯分布，并且表明HER2扩增水平与曲妥珠单抗疗效的负相关性。

癌症是一个动态的过程。肿瘤学中的治疗决策基于治疗的效果及其演变。评估治疗中肿瘤动态演变的手段之一是使用RECIST评估标准来比较治疗前后医学成像的肿瘤大小。然而，RECIST没有考虑到遗传性肿瘤的异质性。相比之下，遗传性肿瘤异质性生物标记的动态评估在临床上是不可行的，因为多次活检的患者随访不符合临床约束，需要快速治疗决策、治疗启动和道德规范。

所提出的用于模拟肿瘤的演变的方法考虑了异质细胞群并且在不使用临界点或系统规则(诸如仅考虑主要群体)的情况下改善患者选择。

模拟肿瘤演变的方法能够用于授权治疗决策。例如，当要求遗传和/或组织学生物标记来预测不同治疗或治疗组合的抗肿瘤疗效时。用于模拟肿瘤演变的方法可以模拟肿瘤生长期间和癌症治疗期间致癌基因的演变及其空间肿瘤内异质性。在乳腺癌细胞的示例中，所述细胞内的致癌基因可以通过不同的改变而被激活，诸如增加基因拷贝数，也被称为扩增(即HER2扩增)，激活突变(诸如KRAS p.G12C或EGFR p.L858R)，或者导致基因融合(即ALK基因融合)的染色体间或染色体内重排。

该方法可以根据致癌基因的肿瘤内异质性改善与肿瘤生长和治疗疗效有关的预测。

现在讨论该方法的实现方式。

在该实现方式中，提供了多个数据段，每个数据段对应于患者的肿瘤细胞。每个数据段包括与肿瘤相关联的一个或多个致癌基因的激活程度和分配给细胞的空间定位。每个致癌基因的激活程度可以是对应于细胞中致癌基因数量的数值。可以根据患者的肿瘤细胞的图像确定多个数据段。还提供了一种模型，其被配置为获取输入的数据段并输出关于与输入的数据段相对应的相应细胞的增殖的信息。

关于增殖的信息包括关于细胞死亡或存活的信息、和/或关于细胞分裂的存在或不存在的信息、和/或关于在分裂期间获得一个或多个新改变的信息。关于获得一个或多个新改变的信息可以包括关于获得着丝粒、断裂-融合-桥延伸事件和/或不平衡染色体分离中的任何一个或组合的信息。

关于增殖的信息取决于细胞中一个或多个致癌基因的激活程度。值得注意的是，随着激活程度的增加，关于增殖的信息更可能表示存在分裂。此外，随着激活程度的增加，关于增殖的信息更可能表示获得一个或多个新改变。

此外，关于增殖的信息表示存在分裂，这取决于细胞附近的空间可用性。值得注意的是，只有在细胞附近存在空间可用性的情况下，关于增殖的信息才能够表示存在分裂。

当关于增殖的信息包括关于存在分裂的信息时，由分裂产生的每个细胞的相应空间定位也被包括在关于增殖的信息中。关于由分裂产生的每个细胞的相应空间定位的信息允许为由分裂产生的每个细胞分配空间定位。由单个分裂产生的每个细胞的空间定位可以在彼此附近。由分裂产生的细胞中的一个细胞的空间定位位于与作为输入的数据段相对应的细胞的空间定位处。

当关于增殖的信息包括与分裂的存在有关的信息时，关于增殖的信息还包括由分裂产生的每个细胞中一个或多个致癌基因的相应激活程度。由分裂产生的每个细胞中一个或多个致癌基因的激活程度取决于与作为输入的数据段相对应的细胞的一个或多个致癌基因的激活程度。

该模型在一个或多个数据段上运行。基于运行的结果更新多个数据段。基于与作为输入的数据段相对应的细胞的增殖信息来执行更新。因此，更新是细胞角度的(cell-wise)，因为关于单个细胞的信息用于更新多个数据段。

在更新时，当关于增殖的信息包括存在分裂时，创建一个或多个数据段。由于在运行之前和之后包括在数据段中的空间定位，对应于多个数据段的细胞在空间上被协调。因此，对应于多个数据段的细胞的空间布置遵循细胞分裂的约束。

在更新时，当与所述至少一个数据段相对应的关于细胞增殖的信息包括与细胞死亡有关的信息时，丢弃至少一个数据段。

在更新时，当对应于所述至少一个数据段的细胞增殖的信息包括关于不存在分裂的信息或者至少不包括关于存在分裂的信息时，包括在至少一个数据段中的一个或多个致癌基因的激活程度不变。

在更新时，当关于与作为输入的数据段相对应的至少一个细胞增殖的信息包括获得至少一个改变时，由分裂产生的至少一个细胞中的一个或多个致癌基因的激活程度增加。

在更新多个数据段之后，重复一次或多次迭代。迭代包括在更新的数据段的一个或多个数据段上运行模型，并基于运行的结果更新所更新的数据段。对应于作为输入的数据段的任何细胞与稍后时间点处的细胞相对应。因此，通过几次迭代，该模型模拟了肿瘤的演变。由于对应于肿瘤的各个细胞的数据段，增加了肿瘤演变的模拟的准确性。在每次运行时注入模型的数据相对较小(即仅由一个或多个致癌基因的激活程度和空间定位组成)。

另外，还提供了治疗类型。治疗类型包括靶向治疗和/或一般治疗中的任何一种或组合。靶向治疗对具有一个或多个特定的致癌基因的细胞更有效。在这种情况下，关于增殖的信息取决于治疗类型。当提供对与多个数据段相对应的细胞有效的治疗类型时，关于增殖的信息更可能包括关于细胞死亡的信息。通过考虑治疗类型，对肿瘤演变的模拟预测治疗类型相对于肿瘤的疗效。可以提供不同的治疗类型。对肿瘤演变的模拟可以提供对每种治疗类型的疗效的比较。

该模型包括固定的参数。可选地，提供患者数据，并且根据患者数据调整模型的参数。患者数据与根据其确定多个数据段的数据来自相同的患者。通过改变参数的一个或多个值来执行参数调整。患者数据是与患者有关的信息。患者数据包括身体信息和/或医疗信息。通过调整来自患者数据的参数，肿瘤演变的模拟考虑了患者特有的额外数据。因此，肿瘤演变的模拟对患者是个性化的并且其准确性增加。

以下是参考图3-8和先前提供的学术文献列表的方法的这种实现方式的示例。

肿瘤异质性随时间的演变可以捕获个体间和肿瘤内异质性，并且因此可以帮助预测最佳治疗策略，包括治疗的组合。相比之下，目前的生物标记发展侧重于选择“最佳”临界点来选择将得益于特定治疗的患者群体。

此外，所提出的方法基于用于致癌基因扩增的生物学驱动的特定模型。

该方法可以通过单个时间点分析来预测肿瘤演变，这改善了RECIST演变测量。

该模型可以用任何编程语言编码，包括但不限于python和OpenGL。该方法处理个性化医疗，可以考虑基因组学、患者以及肿瘤特性(例如类型和/或位置)以及患者特性。

参考图4，可以根据包括用于致癌基因激活的信息的单个细胞数据来计算多个数据段。用于致癌基因激活(即HER2扩增)的单个细胞数据可以通过FISH图像分析，通过对HER2和CEP17信号的数量进行计数来获得。肿瘤细胞的其他类型的图像也可以用于提取肿瘤细胞数据。图4示出了由Starczynski J等人发表的FISH分析。可以处理FISH图像以描绘每个细胞核，定量每个细胞中的CEP17和HER2信号以提供HER2拷贝数异质性的分布。创建了1000个数据段，其表示与分析的图像的细胞群相似的初始肿瘤细胞群。换而言之，从提取的肿瘤细胞数据中提供了对应于肿瘤细胞的多个数据段，每个肿瘤细胞具有HER2的激活程度。另外，每个数据段归因于表示肿瘤的三维空间中的空间定位。

图5A和图5B示出了模型的示例的相应部分。图5A所示的部分通过箭头A501连接到图5B所示的部分。在该示例中，该模型特定于一个或多个致癌基因。该模型基于致癌基因激活遗传机制(诸如基因扩增、融合、突变)的生物学知识。该模型还基于对核心细胞路径的致癌基因功能效应(诸如细胞生长、细胞分裂、细胞凋亡、旁分泌)。对于HER2基因扩增，该模型考虑到：

-细胞分裂率，取决于致癌基因状态(即HER2扩增水平)；

-细胞死亡率，可以取决于治疗类型(诸如化疗和抗HER2抗体)；

-破裂-融合-桥事件的概率[20，21，25，5]，(诸如在端粒侧HER2基因处断裂)，导致二中心染色体17并启动HER2扩增(启动事件)；

-断裂-融合-桥的概率，仅当存在二中心染色体17时(延伸事件)；

-有丝分裂染色体分离不平衡的概率，由二中心染色体增加导致不对称分裂。

该模型被配置为通过异步细胞自动化来模拟肿瘤的演变。单独的细胞被独立地更新，使得细胞的新状态影响相邻细胞中的状态的计算，并且使用决策树模型来随机驱动细胞事件。

现在参考图6，患者的临床数据和基因组数据用于以患者个体化方式识别模型参数值。图6示出了可以在其上输入与患者有关的数据的GUI的示例。可以进一步从数据库存储和检索与患者有关的数据。根据与患者有关的数据，调整模型参数的值。

在该示例中，该模型进一步考虑了晚期HER2乳腺癌的三种治疗类型：化学疗法(诸如紫杉醇)、抗HER2疗法(诸如TDM-1曲妥珠单抗-Ado-Emtensine)以及化疗和抗HER2两者的组合(诸如曲妥珠单抗+帕妥珠单抗+紫杉醇)。可以根据它们的作用机制对这三种治疗类型进行建模。可以将每种治疗类型计算为向治疗类型所包括的每种作用机制返回值的向量。

每种治疗都有自己的作用方式。化疗是一种非选择性治疗。它独立于细胞的状态和性质而杀死细胞。化疗可以通过以下概率函数建模：

其中chimio_eff是化疗的疗效。

如果细胞中存在更多的HER2拷贝，则抗HER2治疗是更有效的靶向治疗。这种现象可以通过概率函数建模，诸如以下Death_AntiHER概率函数：

其中：

-β是正参数；

-#HER是HER2的激活程度，并且取决于HER2拷贝的数量。如果#HER2低于2，则死亡概率为零。

替代地，可以选择本领域已知的概率函数。

回到图5A，一旦模型被初始化，就随机选择对应于数据段的细胞，并且在每个决策时应用具有线性地分布在0和1之间的随机值“r”的决策树。将r的值与关联于决策的概率进行比较，并相应地选择结果。

细胞通过不同的决策步骤。首先，基于诱导细胞死亡的治疗效果来计算细胞存活的决策。如果细胞死亡，则随机选择新细胞。如果细胞存活，则采取关于细胞是否分裂的新决策。

细胞分裂的概率取决于细胞的生长速率，其可以使用由共变模型、先前的生物学知识和肿瘤历史的重放的组合确定的3个参数来建模。可以对生长速率建模的示例性概率函数如下所示：

其中：

-γ₀在0和1之间，并且是参考生长速率；

-α是根据#HER2的强度调节生长速率的参数并且取决于患者；

-#HER2是HER2的激活程度。

此外，在距离细胞的空间定位的范围R附近执行关于空间可用性的验证。参数R可以在模型的初始化期间固定，并且对应于到细胞的空间定位的距离。只有当随机抽取r低于由GrowthRate函数给出的值并且存在针对由分裂产生的新细胞的可用空间定位时，细胞才进行分裂。在这种情况下，遵循箭头A501的路径并在图5B上继续。可以在该步骤确定将由细胞分裂产生的两个细胞的空间定位。如果不满足细胞分裂的两个条件中的任何一个，则不存在分裂，并且随机选择新细胞。

现在参考图5B，在确定细胞经历分裂之后，跟随箭头A501的路径。接下来，对细胞内HER2的激活程度执行验证。验证可以包括细胞的每个染色体是否具有正好1个着丝粒和1个HER2拷贝。如果是这种情况，则计算细胞在HER2周围具有启动事件(双链DNA断裂，然后是断裂-融合-桥(BFB))的概率。这也被称为获得着丝粒。获得着丝粒的概率可以通过被称为P_gain_centromere的函数来建模。该概率函数可以根据混合非线性模型建模，以与患者有关的数据作为协变量，诸如BMI指数、年龄[25]和吸烟及遗传风险因素[26]；诸如FGFR2：rs2981579和FGFR2：2981582上的突变。下面给出了函数对数的一个示例：

Log(P_gain_centromere_j)＝Log(P_gain_ceontromere_basal)+p×COV_j+η_j

其中

-

获得着丝粒的平均概率。

-权重参数；

-

考虑BMI指数、患者FGFR2：rs2981579和FGFR2：2981582的年龄和两个遗传风险因子的协方差矩阵；

-

其中，ω²(≈0.01)考虑了生物机制的变异性的随机噪声。

如果细胞在至少一个染色体上已经具有多于一个着丝粒或多于一个HER2拷贝，则代替计算获得HER2周围的启动事件的概率，而是计算双着丝粒细胞具有BFB延伸事件的概率。双着丝粒细胞具有BFB延伸事件的概率可以与获得HER2周围的启动事件的概率进行类似地建模。可以通过将随机值r的结果与建模概率进行比较来执行计算。

接下来，除了在细胞分裂期间出现的复制染色体之外，还进行计算以确定细胞是否获得额外的染色体。如果细胞获得额外的染色体，则HER2的激活程度显著增加。

接下来，计算细胞具有不平衡的染色体分离的概率，导致不对称分裂。正常细胞分裂是对称的，在这种情况下，由分裂产生的两个细胞具有相同程度的HER2激活。然而，细胞可以不对称地分裂，导致由分裂产生的两个细胞之间的HER激活程度之间的差异。在图5B所示的示例中，由不对称细胞分裂产生的第一个细胞具有每个染色体两个着丝粒和三个HER2拷贝。由不对称细胞分裂产生的第二个细胞具有每个染色体仅一个HER2拷贝和一个着丝粒。可以类似于获得另外的染色体的确定来计算对不对称细胞分裂的存在或不存在的确定。如果细胞经历不对称细胞分裂，则第二计算可以确定不对称细胞分裂是否强烈。强烈的不对称细胞分裂是不对称细胞分裂，其中由分裂产生的两个细胞之间的染色体数量是不平衡的。在图5B的示例中，由强烈的不对称细胞分裂产生的第一个细胞具有三个染色体，而第二个细胞仅具有一个染色体。确定强烈的不对称细胞分裂的存在的计算可以与不对称细胞分裂的存在类似地进行。

在细胞分裂后，创建两个新细胞。每个细胞对应于相应的数据段。相应的数据段中的一个数据段可以替换对应于经历决策树的细胞的数据段。运行后可以创建另一个数据段。可以在每次运行之后利用由决策树产生的结果来更新多个数据段。替代地，可以在对应于多个数据段的所有细胞已经通过决策树之后更新多个数据段。空间可用性的确定可以考虑由细胞分裂产生的新细胞，即使多个数据段尚未更新。

在所有细胞已经通过决策树之后，可以利用更新的多个数据段来执行模型的新迭代。

图7示出了在经过模型之前和经过模型的一次或多次运行之后对应于多个数据段的细胞的空间表示的示例。通过强度和颜色的差异，还可以表示细胞中HER2的激活程度。替代地，当计算细胞在其相应空间定位中的表示时，可以使用区分细胞中致癌基因的激活程度的其他方法。通过模型后细胞的空间表示是模拟肿瘤如何从其初始状态演变到最终状态。最终状态取决于从用于创建初始多个数据段的细胞中提取的数据，以及与患者和/或治疗类型有关的数据。可以在模型的每次运行之后计算空间表示，使得可以由用户可视化肿瘤的实时演变。这种视觉表示可以由病理学家直接解释用于组织学分析。

现在参考图8，替代地或另外地，可以根据更新的多个数据段来计算拷贝数曲线图，就好像肿瘤已经被测序并且然后被分析。该曲线图可以对应于整个更新的多个数据段。替代地，该曲线图可以对应于多个数据段的一部分，诸如对应于位于穿过模拟的肿瘤的二维平面中的细胞的数据段。可以进一步计算细胞之间的平均拷贝数和噪声分布的置信区间。总细胞群中HER2拷贝数分布的直方图(诸如图8中所示)可以被进一步呈现给用户。计算此类统计数据有助于遗传学家对结果的解释，因为从模拟中提取的遗传信息以与基因组学分析类似的格式呈现。

现在参考图9，替代地或另外地，可以基于以下公式计算肿瘤演变的百分比：

该计算有助于将肿瘤演变与其他类似病例进行比较。另外，可以同时向用户呈现针对相同肿瘤的若干模拟。例如，由不同治疗组合产生的模拟，每个显示在与初始肿瘤大小(虚线)相比时的肿瘤演变百分比。另外，根据细胞中HER2的激活程度，可以计算肿瘤内异质性的比较值并将其呈现给用户。这些计算有助于肿瘤学家对模拟结果的解释，因为它们与RECIST标准类似。RECIST标准仅允许跟踪肿瘤体积的演变，但不提供关于肿瘤异质性的信息。该方法还提供了关于肿瘤异质性演变的信息。

另外，用于模拟肿瘤演变的方法可以利用HER2的激活程度以及也存在于乳腺癌中的一个或多个其他致癌基因的激活程度来执行。在这种情况下，模型的参数值可以取决于一个或多个致癌基因，类似于上述示例中参数如何依赖于HER2。

图11是模型构建和用于模拟肿瘤演变的方法的模型示例的数据流的示例。根据与肿瘤有关的现象的生物学知识(100)，可以构建模型(320)(S310)。将参数和初始条件注入模型并输出数据。in参数和/或初始条件可以是给定时间t的模型的输入数据。输出数据可以对应于输入数据的时间演变，即未来时间t+t'的输入数据。

图12是输出对用于模拟肿瘤演变的输入数据(900)的时间演变的预测的模型的示例。输入数据(510)表示细胞池，例如，输入数据可以是数据段，每个数据段代表肿瘤细胞。参数(500)被注入到模型中以进行模拟。运行模型(S300)。该运行可以包括迭代(S340)来自模型(320)的输入-输出若干次。在每次迭代时，模型输出对未来时间的输入数据的预测(S330)。例如，在每次迭代之后，细胞池的时间演变可以在时间上提前等于细胞周期的持续时间。替代地，取决于输入数据，细胞池可以在时间上提前等于细胞周期的一小部分的持续时间。在几次迭代之后，可以计算对输入数据的时间演变的预测。

图13是说明针对给定患者的模型的参数(患者参数)调整的示例。根据与患者有关的数据(120)、群组数据(130)、生物学知识(100)和肿瘤数据(110)的组合或任何一个来调整患者参数(500)。在其他示例中，可以使用与患者有关的数据、群组数据、生物学知识和肿瘤数据中的任何一个或其组合来确定患者参数。群组数据可以是来自与患者具有相似肿瘤的其他患者的数据。根据群组数据，可以建立共变模型(S600)，这在文献中是已知的。可以对与患者有关的数据(120)运行共变模型(S610)，其可以确定患者参数。还可以根据生物学知识(100)调整患者参数，例如，来自文献的数据。可以组合群组数据(130)和生物学知识(100)以创建平均模型参数(530)。这些平均模型参数表示模型的参数，其针对群体的平均成员进行调整。在模型调整(700)中注入平均模型参数。肿瘤数据(100)，诸如从患者的肿瘤的生物图像提取的数据，可以用于将来自其中模型被参数化的模型运行的输出数据与平均模型数据进行比较，以便如前所述为患者调整模型(S700)。可以通过模型的运行进一步调整患者参数(500)。然后，模型可以输出代表患者的肿瘤的数值数据(510)。

图14是S700处的模型调整的示例。在模型调整中，可以在将平均参数(530)注入到模型之前将随机噪声应用(S710)到平均参数(530)。计算随机初始肿瘤数据(S720)作为输入数据并运行模型(S300)。输出对应于参数和输入数据的选择的数字肿瘤演变(900)。在与患者的肿瘤数据(诸如从患者的肿瘤图像中提取的数据)进行比较之前，模型可以在输出的数据上再次运行多次。随机初始肿瘤数据的计算和随机噪声到平均参数和随后的模型运行的应用被重复(S730)，直到数字肿瘤充分代表真实肿瘤数据为止。根据其计算出充分代表真实肿瘤数据的数值肿瘤的模型参数然后可以成为患者参数(500)，并且模型可以代表患者肿瘤的数值数据(510)，因为参数现在对患者是个性化的。

Claims

1.一种用于模拟与致癌基因相关联的肿瘤的演变的计算机实现的方法，所述方法包括：

提供(S10)多个数据段，每个数据段与所述肿瘤的给定细胞相对应，每个数据段包括在所述给定细胞中所述致癌基因的激活程度；

提供(S20)模型，所述模型被配置为获取输入的数据段并且输出关于与所述输入的数据段相对应的相应给定细胞的增殖的信息，关于增殖的信息取决于所述相应给定细胞中所述致癌基因的激活程度；

在所述多个数据段的一个或多个数据段上运行(S30)所述模型；以及

基于运行(S30)的结果来更新(S40)所述多个数据段。

2.根据权利要求1所述的方法，其中，每个数据段还包括所述肿瘤的所述给定细胞的空间定位。

3.根据权利要求2所述的方法，其中：

关于所述相应给定细胞的增殖的信息包括与所述相应给定细胞的分裂的存在或不存在有关的信息，并且

当所述关于所述相应给定细胞的增殖的信息包括与分裂的存在有关的信息时，所述关于所述相应给定细胞的增殖的信息还包括对于由所述分裂产生的每个细胞的关于相应空间定位的信息，每个相应空间定位在所述相应给定细胞的空间定位附近。

4.根据权利要求3所述的方法，其中，所述关于所述相应给定细胞的增殖的信息还取决于在所述相应给定细胞附近的空间可用性。

5.根据权利要求4所述的方法，其中：

与所述相应给定细胞的分裂的存在或不存在有关的信息基于在所述相应给定细胞附近的所述空间可用性，并且

当所述关于所述相应给定细胞的增殖的信息包括与分裂的存在有关的信息时，在所述相应给定细胞的所述空间定位附近的所述相应空间定位处于未占用的空间定位。

6.根据权利要求5所述的方法，其中，当所述关于所述相应给定细胞的增殖的信息包括与分裂的存在有关的信息时，所述关于所述相应给定细胞的增殖的信息还包括基于所述相应给定细胞的所述致癌基因的激活程度的对于由所述分裂产生的每个细胞的致癌基因的相应激活程度。

7.根据权利要求6所述的方法，其中，由所述分裂产生的每个细胞的致癌基因的相应激活程度与所述相应给定细胞的所述致癌基因的激活程度的概率的变化相对应。

8.根据权利要求1至7中任一项所述的方法，其中，所述模型是基于决策的，并且相对于所述相应给定细胞包括以下各项：

关于死亡或存活的决策，

关于分裂的存在或不存在的决策，以及

关于获得在分裂期间的一个或多个新改变的决策。

9.根据权利要求1至8中任一项所述的方法，其中，所述方法还包括提供治疗类型，关于增殖的信息取决于所述治疗类型。

10.根据权利要求1至9中任一项所述的方法，其中，对提供、运行以及更新进行迭代(S50)，并且每次迭代所提供的多个数据段是先前迭代的经更新的多个数据段。

11.根据权利要求1至10中任一项所述的方法，还提供与患有所述肿瘤的患者有关的数据，所述模型包括取决于与所述患者有关的数据的参数。

12.根据权利要求11所述的方法，其中，提供所述模型包括将所述参数确定为值，所述值被配置用于通过以下方式检索所述多个数据段：

定义一个或多个其他数据段，每个其他数据段与所述肿瘤的初始状态的给定细胞相对应，每个其他数据段包括所述给定细胞中所述致癌基因的激活程度；

在一个或多个其他数据段上运行所述模型；并且

基于运行的结果来更新所述多个其他数据段，

其中，可选地，所述参数的值是基于与所述患者有关的数据来初始化的。

13.根据权利要求1至12中任一项所述的方法，还包括基于经更新的多个数据段来确定与所述致癌基因有关的统计数据。

14.一种数据结构，其包括被配置为被提供用于执行根据权利要求1至13中任一项所述的方法的模型。

15.一种计算机程序，其包括用于执行根据权利要求1至13中任一项所述的方法的指令。

16.一种系统，其包括耦合到存储器的处理器，所述存储器上记录有根据权利要求15所述的计算机程序。