CN117616113A

CN117616113A - 对多能干细胞特异性的标记物及其使用方法

Info

Publication number: CN117616113A
Application number: CN202280031788.5A
Authority: CN
Inventors: T·伯克; S·史密斯; A·斯特劳斯
Original assignee: Fujifilm Cell Dynamics Co
Current assignee: Fujifilm Cell Dynamics Co
Priority date: 2021-03-08
Filing date: 2022-03-07
Publication date: 2024-02-27
Also published as: JP2024510965A; WO2022192131A1; KR20230165908A; EP4305152A1; AU2022232596A1; CA3211361A1

Abstract

本发明提供多能干细胞的特异性标记物。具体地，本发明涉及由多能干细胞选择性表达的核酸和多肽标记物；以及通过检测此类标记物以用于检测一个或多个多能干细胞的存在和/或不存在的方法。

Description

对多能干细胞特异性的标记物及其使用方法

序列表

本发明包含序列表，在此通过引用将其全部并入。

技术领域

本发明通常涉及对多能干细胞特异性的标记物。特别地，本发明涉及由多能干细胞选择性表达的核酸和多肽标记物；以及通过检测一种或多种此类标记物的存在和/或不存在来检测一种或多种多能干细胞的存在和/或不存在的方法。

背景技术

多能干细胞(PSC)通常被认为在体外表现出无限自我更新的能力(即在未分化状态下无限分裂的能力)；并具有分化成为代表早期胚胎的三个初级生殖细胞层(即外胚层、内胚层和中胚层)的细胞类型的能力。通过能够发育成这三个胚层，PSC由此能够产生成熟生物体的所有细胞类型。参见Thomson等人(Science,1998；282:1145–1147)。在特殊情况下，例如环境条件和/或细胞信号通路的改变，PSC退出自我更新的周期，并分化为来源于三个胚层的特化细胞类型。

最初，PSC来源于胚胎(胚胎干细胞；ESC)，尽管最近，显示了PSC通过重编程因子的表达从成熟(体)细胞中产生。参见Takahashi等人(Cell,2006,126(4):663-76)。这些PSC被称为诱导性PSC(iPSC)，通常是通过向体细胞传递编码重编程因子的遗传物质来产生，其触发体细胞恢复到多能状态。因此，iPSC是PSC的重要来源，不受限制ESC实用性的伦理和技术约束(例如，生产与患者匹配的干细胞系)。

由于其多能性，PSC，例如iPSC，在例如医学和科学研究、药物发现、细胞治疗、再生医学和组织工程学的领域中是重要的。在PSC随后分化为特化细胞的应用中，例如在组织工程中，希望能够确定在分化过程之后是否有PSC残留。例如，在细胞治疗产品和工程化组织中，残留的未分化PSC的存在代表了质量控制问题，因为这些细胞有可能在体内形成畸胎瘤(即致肿瘤性)。

已建立的检测PSC的存在的技术包括表型多能性检测(例如，胚状体形成；体内畸胎瘤形成)，以及分子多能性检测，包括检测与PSC相关的分子标记。然而，用于此目的的许多在PSC中差异化表达的标记物在分化细胞中也显示出一定水平的表达(尽管具有不同的表达水平，和/或不同的表达模式)，因此使得在更大的衍生的组织细胞群体中检测少量残留的PSC成为了问题和挑战。

发明内容

本发明通过提供在PSC中唯一表达的标记基因的子集解决了本领域中上述缺陷。因此，这些标记基因作为检测少量PSC的分子标记是有用的，包括，例如在主要分化的PSC来源的细胞群体中的少量的残留的未分化的PSC的存在。本发明的非限制性实施方式包括如下。

[1]一种检测多能干细胞的方法，所述方法包括：

(a)获取含有多个细胞的目的样本；

(b)分析所述目的样本以检测至少一个标记基因的表达，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；以及

(c)当在所述目的样本中检测到所述至少一种标记基因的表达时，确定所述目的样本含有多能干细胞。

[2]根据[1]的方法，其中目的样本包含诱导多能干细胞。

[3]根据[1]的方法，其中目的样本包含胚胎多能干细胞。

[4]根据[1]的方法，其中所述目的样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[5]根据[1]的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测所述至少一个标记基因的表达。

[6]根据[1]的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测所述至少一个标记基因的表达。

[7]根据[5]的方法，其中通过包括选自由以下技术组成的组中的方法中检测所述至少一个标记基因的表达：液滴数字聚合酶链式反应(dd-PCR)、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[8]根据[7]的方法，其中所述技术包括微阵列分析或下一代测序。

[9]一种检测多能干细胞的方法，所述方法包括：

(a)获取含有多个细胞的目的样本；

(b)测量所述目的样本中至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；

(c)将步骤(b)中检测到的表达水平与参考表达水平进行比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，并且其中所述至少一个参考样本基本上不含多能干细胞；以及

(d)当在步骤(b)中检测到的表达水平大于所述参考表达水平时，确定所述目的样本含有多能干细胞，或

当在步骤(b)中检测到的表达水平等于或小于所述参考表达水平时，确定所述目的样本基本上不含多能干细胞。

[10]一种定量样本中多能干细胞数量的方法，所述方法包括：

(a)获取含有多个细胞的目的样本；

(c)将步骤(b)中检测到的表达水平与参考表达水平进行比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，其中所述至少一个参考样本包含多能干细胞，并且其中在所述至少一个参考样本中基本上所有的细胞都是多能干细胞；以及

(d)根据步骤(c)中的比较结果计算所述目的样本中的多能干细胞的数量。

[11]根据[9]的方法，其中目的样本包含诱导多能干细胞。

[12]根据[9]的方法，其中目的样本包含胚胎多能干细胞。

[13]根据[9]的方法，其中所述目的样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[14]根据[9]的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[15]根据[9]的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[16]根据[14]的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[17]根据[10]的方法，其中目的样本包含诱导多能干细胞。

[18]根据[10]的方法，其中目的样本包含胚胎多能干细胞。

[19]根据[10]的方法，其中所述目的样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[20]根据[10]的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[21]根据[10]的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[22]根据[20]的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[23]一种用于检测治疗产品中的残留iPSC的检测方法，所述检测方法包括：

(a)获得由iPSC生产的治疗产品的样本，所述样本包含多个细胞；

(b)分析所述样本以检测至少一个标记基因的表达，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；以及

(c)当在所述样本中检测到所述至少一个标记基因的表达时，确定所述治疗产品含有残留的iPSC。

[24]根据[23]的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[25]根据[23]的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[26]根据[23]的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[27]根据[25]的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[28]一种用于定量治疗产品中残留iPSC数量的检测方法，所述检测方法包括：

(a)获得由iPSCs生产的治疗产品的样本，所述样本包含多个细胞；

(b)测量所述样本中至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；

(c)将步骤(b)中检测到的表达水平与参考表达水平进行比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，其中所述至少一个参考样本包含iPSC，并且其中所述至少一个参考样本中的基本上所有的细胞都是iPSC；以及

(d)根据步骤(c)中的比较结果定量所述治疗产品中残留iPSC的数量。

[29]根据[28]的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[30]根据[28]的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[31]根据[28]的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[32]根据[30]的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[33]一种用于检测治疗产品中残留iPSC的检测方法，所述检测方法包括：

(d)当在步骤(b)中检测到的表达水平大于所述参考表达水平时，确定所述治疗产品含有残留iPSC，或

当在步骤(b)中检测到的表达水平等于或小于所述参考表达水平时，确定所述治疗产品基本上不含残留iPSC。

[34]根据[33]的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[35]根据[33]的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[36]根据[33]的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[37]根据[35]的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[38]一种在不同分化时间下定量治疗产品中残留iPSC数量的检测方法，所述检测方法包括：

(a)获得治疗产品的第一样本，所述第一样本在第一分化时间、或在分化开始前获得，所述第一样本含有多个细胞；

(b)在不同分化时间获得治疗产品的至少一个额外样本，所述至少一个额外样本含有多个细胞；

(c)测量在(a)和(b)中获得的样本中的至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ IDNO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；以及

(d)根据在步骤(c)中的测量结果，定量在不同分化时间下所述治疗产品中的iPSC的数量。

[39]根据[38]的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[40]根据[38]的检测方法，其中在步骤(c)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[41]根据[38]的检测方法，其中在步骤(c)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[42]根据[40]的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[43]一种测定分化产品纯度的检测方法，所述检测方法包括：

(a)获得分化产品的样本，所述样本含有多个细胞；

(c)将步骤(b)中检测到的表达水平与参考表达水平进行比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，其中所述至少一个参考样本包含iPSC，并且其中所述至少一个参考样本中基本上所有的细胞都是iPSC；以及

(d)根据步骤(c)中的比较结果计算所述样本中iPSC的数量，从而确定分化产品的纯度。

[44]根据[43]的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[45]根据[43]的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[46]根据[43]的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[47]根据[45]的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[48]一种测定分化产品纯度的检测方法，所述检测方法包括：

(a)获得分化产品的样本，所述样本含有多个细胞；

(c)将步骤(b)中检测到的表达水平与参考表达水平进行比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，并且其中所述至少一个参考样本基本上不包含多能干细胞；以及

[49]根据[48]的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[50]根据[48]的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[51]根据[48]的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[52]根据[50]的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[53]一种评估iPSC群体分化能力的方法，所述方法包括：

(a)获得iPSC群体的第一样本，所述第一样本在诱导所述iPSCs分化前获得，所述第一样本含有多个细胞；

(b)获得iPSC群体的至少一个额外样本，所述至少一个额外样本是在诱导所述iPSC分化后获得，所述至少一个额外样本含有多个细胞；

(d)将步骤(c)中检测到的不同样本的表达水平相互比较，和/或与参考表达水平比较，从而评估所述iPSC群体中iPSC的分化能力。

[54]根据[53]的方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[55]根据[53]的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[56]根据[53]的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[57]根据[55]的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[58]一种评估iPSC群体多能性的方法，所述方法包括：

(a)获取iPSC群体的样本，所述样本含有多个细胞；

(c)将步骤(b)中检测到的表达水平与参考表达水平进行比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，其中所述至少一个参考样本包含iPSC，并且其中所述至少一个参考样本中基本上所有的细胞都是能够分化的iPSC；以及

(d)根据步骤(c)的比较结果评估所述iPSC群体中iPSC的多能性。

[59]根据[58]的方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[60]根据[58]的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[61]根据[58]的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[62]根据[60]的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[63]一种评估iPSC群体多能性的方法，所述方法包括：

(a)获得iPSC群体的第一样本，所述第一样本在诱导所述iPSC分化前获得，所述第一样本含有多个细胞；

(c)测量在(a)和(b)中获得的样本中的至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ IDNO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；

(d)将步骤(c)中检测到的不同样本的表达水平相互比较，和/或与参考表达水平比较，从而评估所述iPSC群体中iPSC细胞的多能性。

[64]根据[63]的方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

[65]根据[63]的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

[66]根据[63]的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

[67]根据[65]的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

[68]一种用于检测治疗产品中残留iPSC的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

[69]根据[68]的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

[70]一种用于检测治疗产品中残留iPSC的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

[71]一种用于定量治疗产品中iPSC数量的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

[72]根据[71]的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

[73]一种用于定量治疗产品中iPSC数量的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

[74]一种用于确定分化产品纯度的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

[75]根据[74]的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

[76]一种测定分化产品纯度的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

[77]一种评估iPSC群体分化能力的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

[78]根据[77]的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

[79]一种用于评估iPSC群体分化能力的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

[80]一种用于评估iPSC群体多能性的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

[81]根据[80]的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

[82]一种用于评估iPSC群体多能性的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

参引合并

本说明书中引用的所有专利、出版物和专利申请在本发明中通过引用合并于此本发明中，如同每个单独的专利、出版物或专利申请被具体和单独地指示为出于所有的目的而通过引用将其整体并入。

附图说明

专利或申请文件包含至少一幅以彩色执行的附图。专利局将根据请求并支付必要费用后，提供带有彩色附图的本专利或本专利申请出版物的副本。

图1描述了检测标记基因LNCPRESS2、AC009446.1和AL117378.1在纯iPSC样品、纯光感受器前体(PRP)细胞样品和含有不同iPSC：PRP比例的iPSC/PRP混合物中的表达。通过从细胞样品中制备cDNA，然后通过液滴数字PCR(dd-PCR)来检测标记基因的表达。

图2描述了检测标记基因LNCPRESS2、AC009446.1和AL117378.1在纯iPSC样品、纯视网膜色素上皮(RPE)细胞样品和含有不同iPSC：RPE比例的iPSC/RPE混合物中的表达。通过从细胞样品中制备cDNA，然后通过液滴数字PCR(dd-PCR)来检测标记基因的表达。

具体实施方式

应当理解，本发明使用的术语仅用于描述特定实施方式的目的，而不旨在限制。如在本说明书和所附的权利要求书中所使用的，除非上下文另有明确说明，单数形式“a”、“an”和“the”包括复数指示物。因此，例如，对“细胞(a cell)”的指代包括一个或多个细胞。

除非另有定义，本发明使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管类似于或等效于本发明所描述的方法和材料的其它方法和材料在本发明中是可用的，但本发明描述了优选的材料和方法。

如本发明所用，“受试者”、“个体”或“患者”在本发明中可互换使用，并且是指脊索动物门的任何成员，包括但不限于人类和其它灵长类动物，包括非人灵长类动物，例如恒河猴、黑猩猩和其它猴子和猿类；农场动物，例如牛、绵羊、猪、山羊和马；家养哺乳动物，例如狗和猫；实验动物，包括兔子、小鼠、大鼠和豚鼠；鸟类，包括家禽、野禽和猎禽，例如鸡、火鸡和其它鹑鸡类鸟类、鸭和鹅；等等。该术语并不表示特定的年龄或性别。因此，该术语包括成年、年轻和新生个体以及男性和女性。在一些实施方式中，细胞(例如干细胞，包括多能干细胞、祖细胞或特定组织细胞)来源于受试者。在一些实施方式中，受试者是非人受试者。

如本发明所用，“细胞培养”是指在受控条件下的细胞生长。原代细胞培养是直接从生物体中提取的并在第一次传代培养之前的细胞、组织或器官的培养。当细胞在促进细胞生长和/或分裂的条件下被放置于生长培养基中时，细胞在培养中扩增，从而产生更大的细胞群体。当细胞在培养中扩增时，细胞增殖的速度通常是用细胞数量翻倍所需的时间来衡量的，也被称为倍增时间。

如本发明所用，“饲养层”是指可用于支持干细胞增殖的非增殖细胞层。饲养层的生产方法是本领域已知的，并且可以在互联网上获得，例如在美国典型培养物保藏中心(ATCC)维护的国家干细胞资源网站上。

如本发明所用，“分化”是指非特化细胞，例如多能干细胞或其它干细胞，获得成熟细胞特有的结构和/或功能特征的过程。如本发明所用，“扩增”或“增殖”可以指细胞培养物中的细胞数量由于细胞分裂而增加的过程。在本发明的特定实施方式中，在扩增或增殖阶段，细胞不分化形成成熟细胞，而是分裂形成更多(未分化)细胞。

如本发明所用，“拟胚体”是指多能干细胞的三维聚集体。这些细胞可以分化成内胚层、中胚层和外胚层三个胚层的细胞。三维结构，包括在拟胚体微环境中建立复杂的细胞粘附和旁分泌信号，使分化和形态发生成为可能。

如本发明所用，“干细胞”是指具有自我更新能力的细胞，即在维持细胞非终末分化状态的同时经历细胞分裂的多个周期的能力。干细胞可以是全能的、多能的、多潜能的、寡能的或单能的。干细胞可以是，例如，胚胎干细胞、胎儿干细胞、羊膜干细胞、成熟干细胞或诱导多能干细胞。

如本发明所用，“多能干细胞(PSC)”是指具有无限期自我繁殖能力，并分化成为成熟生物体的任何其它细胞类型的细胞。一般来说，多能干细胞是在移植到免疫缺陷(SCID)小鼠中时能够诱导畸胎瘤的干细胞；能够分化为所有三个胚层的细胞类型(例如，可以分化为外胚层、中胚层和内胚层的细胞类型)；并表达一种或多种PSC特征标记物。

由PSC(例如胚胎干细胞(ESC)和iPSC)表达的此类标记物的示例包括Oct 4、碱性磷酸酶、SSEA-3表面抗原、SSEA-4表面抗原、nanog、TRA-1-60、TRA-1-81、SOX2和REX1。例如，本发明范围内的PSC可以是胚胎干细胞(ESC)或诱导多能干细胞(iPSC)。

如本发明所用，“诱导多能干细胞(iPSC)”是指人工衍生自非多能细胞(通常是体细胞)的一类多能干细胞。在一些实施方式中，体细胞是人体细胞。体细胞的示例包括但不限于真皮成纤维细胞、骨髓来源的间充质细胞、心肌细胞、角化细胞、肝细胞、胃细胞、神经干细胞、肺细胞、肾细胞、脾细胞和胰腺细胞。体细胞的其它示例包括免疫系统的细胞，包括但不限于B细胞、树突细胞、粒细胞、天然淋巴细胞、巨核细胞、单核细胞/巨噬细胞、骨髓来源的抑制细胞、自然杀伤(NK)细胞、T细胞、胸腺细胞和造血干细胞。

iPSC可以通过对体细胞重编程，通过在体细胞中表达或诱导表达一种或多种因子的组合(在本发明中称为重编程因子)来产生。iPSC可以使用胎儿的、产后的、新生的、青少年的或成人体细胞产生。在某些情况下，可以用于将体细胞重编程为多能干细胞的因子包括，例如Oct4(Oct3/4)、Sox2、c-Myc、和Klf4、Nanog和Lin28。在一些实施方式中，可以通过表达至少两个重编程因子、至少三个重编程因子或至少四个重编程因子重编程体细胞，以将体细胞重编程为多能干细胞。细胞可以通过使用载体，包括例如慢病毒、逆转录病毒、腺病毒和仙台病毒载体，引入重编程因子进行重编程。或者，用于引入重编程因子的非病毒技术包括，例如mRNA转染、miRNA感染/转染、PiggyBac、微环载体和附着体质粒。iPSC也可以通过，例如，使用基于CRISPR-Cas9的技术，以引入重编程因子或激活内源性编程基因产生。

如本发明所用，“胚胎干细胞”是来源于胚胎组织的胚胎细胞，优选地，囊胚或桑葚胚的内细胞团，可选地，已作为细胞系连续传代。此术语包括从胚胎的一个或多个卵裂球分离的细胞，优选地，不破坏胚胎的其余部分。此术语还包括通过体细胞核移植产生的细胞。例如，ESC可以由受精卵、卵裂球或囊胚阶段的哺乳动物胚胎(例如，通过精子和卵细胞的融合、核移植或孤雌生殖产生)产生或衍生。人ESC包括但不限于MAO1、MAO9、ACT-4、No.3、H1、H7、H9、H14和ACT30胚胎干细胞。示例性的多能干细胞包括来自囊胚阶段胚胎的内细胞团(ICM)的胚胎干细胞，以及来自卵裂期或桑胚期胚胎的一个或多个卵裂球的胚胎干细胞。这些胚胎干细胞可以通过受精产生的胚胎材料中产生，或者通过无性方式，包括体细胞核移植(SCNT)、孤雌生殖和雄核发育。在子宫内移植时，单独的PSC不能发育成胎儿或成年动物，因为它们缺乏助于所有胚胎外组织(例如，体内胎盘或体外滋养层)的潜力。

如本发明所用，术语“野生型”、“天然存在”和“未修饰的”在本发明中用于指代自然界中存在的典型(或最常见的)形式、外观、表型或菌株；例如，细胞、生物体、多核苷酸、蛋白质、大分子复合物、基因、RNA、DNA或基因组的典型形式，由于它们存在于自然资源中，并能够从自然资源中分离。野生型的形态、外观、表型或菌株在有目的地修饰之前作为原始亲本。因此，突变、变体、工程化、重组和修饰形式都不是野生型。

“分离的”是指，例如，当涉及细胞、多核苷酸或多肽分子，包括例如标记分子时。例如，所指分子是从自然界中发现该分子的整个生物体中分离并不相连的；和/或在基本上不存在其它相同类型的生物大分子的情况下存在。对于多核苷酸，术语“分离的”是指全部或部分缺乏通常与其在自然中相关的序列的核酸分子；或一个序列，由于其存在于自然界中，但具有与其相关的异源序列；或分离自染色体的分子。

如本发明所用的术语“纯化的”优选地是指存在至少75％的重量，更优选地至少85％的重量，更优选地仍然至少95％的重量，并且最优选地至少98％重量的相同分子。

术语“工程化”、“遗传工程化”、“遗传修饰的”、“重组的”、“修饰的”、“非天然存在的”和“非天然的”表示人类有目的操纵的生物体或细胞的基因组。这些术语包括基因组修饰的方法，包括本发明所定义的基因组编辑，以及改变基因表达或失活、酶工程、定向进化、基于知识的设计、随机诱变方法、基因重排、密码子优化等技术。基因工程的方法在本领域是已知的。

如本发明所用，术语“核酸序列”、“核苷酸序列”和“寡核苷酸”都是指核苷酸的聚合形式。如本发明所用，术语“多核苷酸”是指核苷酸的聚合形式，当呈线性形式时，具有一个5'端和一个3'端，并且可以包含一个或多个核酸序列。该核苷酸可以是脱氧核糖核苷酸(DNA)、核糖核苷酸(RNA)、其类似物或其组合，并且可以是任何长度。多核苷酸可以执行任何功能，并且可以具有各种二级和三级结构。这些术语包括天然核苷酸的已知类似物和以碱基、糖和/或磷酸基团处修饰的核苷酸。特定核苷酸的类似物具有相同的碱基配对特异性(例如，A的类似物与T碱基配对)。多核苷酸可以包含一个修饰的核苷酸或多个修饰的核苷酸。修饰核苷酸的示例包括氟化核苷酸、甲基化核苷酸和核苷酸类似物。核苷酸结构可以在聚合物组装之前或之后进行修饰。聚合之后，多核苷酸可以通过，例如，与标记组分或靶向结合组分的偶联进行额外修饰。核苷酸序列可以包含非核苷酸组分。这些术语还包括包含修饰的主链残基或连接的核酸，(这些核酸)是合成的、天然存在的和/或非天然存在的，并且具有与参考多核苷酸(例如DNA或RNA)相似的结合特性。此类类似物的示例包括但不限于硫代磷酸酯、酰胺磷酸酯、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸、肽核酸(PNA)、锁核酸(LNA^TM)(Exiqon,Inc.,Woburn,MA)核苷、乙二醇核酸、桥接核酸和吗啉结构。肽核酸(PNA)是核酸的合成同源物，其中多核苷酸磷酸糖骨架被柔性的伪肽聚合物取代。核碱基与聚合物相连。PNA具有以高亲和力和特异性与RNA和DNA的互补序列杂交的能力。除非另有说明，多核苷酸序列在本发明中以常规的5'至3'方向显示。

如本发明所用，“序列同一性”通常是指使用具有各种加权参数的算法将第一多核苷酸或多肽与第二多核苷酸或多肽进行比对的核苷酸碱基或氨基酸的百分比同一性。两个多核苷酸或两个多肽之间的序列同一性可以通过各种方法和通过万维网站点可获得的计算机程序(例如，Exonerate、BLAST、CS-BLAST、FASTA、HMMER、L-ALIGN等)使用序列比对来确定，包括但不限于GENBANK(www.ncbi.nlm.nih.gov/genbank/)和EMBL-EBI(www.ebi.ac.uk.)。两个多核苷酸或两个多肽序列之间的序列同一性通常使用各种方法或计算机程序的标准默认参数来计算。两个多核苷酸或两个多肽之间的高度的序列同一性通常是在参考多核苷酸或多肽或查询序列长度上的约90％同一性和100％同一性之间，例如，在参考多核苷酸或多肽或查询序列长度上的约90％同一性或更高、约91％同一性或更高、约92％同一性或更高、约93％同一性或更高、约94％同一性或更高、约95％同一性或更高、约96％同一性或更高、约97％同一性或更高、约98％同一性或更高，或约99％同一性或更高。还可以对两个序列的重叠区域(在重叠区域中只有两个序列的一部分可以对齐)计算序列同一性。

两个多核苷酸或两个多肽之间的中等程度的序列同一性通常是在参考多核苷酸或多肽或查询序列长度上的约80％同一性至约90％同一性之间，例如，在参考多核苷酸或多肽或查询序列长度上的约80％同一性或更高、约81％同一性或更高、约82％同一性或更高、约83％同一性或更高、约84％同一性或更高、约85％同一性或更高、约86％同一性或更高、约87％同一性或更高，约88％同一性或更高，或约89％同一性或更高，但是少于90％。

两个多核苷酸或两个多肽之间的低程度的序列同一性通常是在参考多核苷酸或多肽或查询序列长度上的约50％同一性和75％同一性之间，例如，在参考多核苷酸或多肽或查询序列长度上的约50％同一性或更高、约60％同一性或更高、约70％同一性或更高，但是少于75％同一性。

本发明涉及的多核苷酸和多肽，例如分子标记，可以具有与已知或参考多核苷酸或多肽序列(例如已知或参考标记多核苷酸序列或已知或参考标记多肽序列)或查询序列具有小于100％的同一性。

如本发明所用的“杂交(hybridization)”、“杂交(hybridize)”或“杂交的(hybridizing)”是通过氢碱基配对将两个互补的单链DNA或RNA分子结合从而形成单个双链分子(DNA/DNA、DNA/RNA、RNA/RNA)的过程。杂交严格度通常由杂交温度和杂交缓冲液的盐浓度决定；例如，高温和低盐提供了高严格度杂交条件。不同杂交条件下的盐浓度范围和温度范围的示例如下：高严格度，约0.01M至约0.05M盐，杂交温度低于T_m 5℃至10℃；中等严格度，约0.16M至约0.33M盐，杂交温度低于T_m 20℃至29℃；以及低严格度，约0.33M至约0.82M盐，杂交温度低于T_m 40℃至48℃。双链核酸序列的T_m是通过本领域熟知的标准方法计算的(参见例如，Maniatis,T.等人，《分子克隆:实验室手册》，冷泉港实验室出版社:纽约(1982)；Casey,J.等，核酸研究4:1539-1552(1977)；Bodkin,D.K，等，Journal of virologyMethods 10(1):45-52(1985)；Wallace,R.B等，核酸研究9(4):879-894(1981))。估计T_m的算法预测工具也是广泛可获得的。杂交的高严格度条件通常是指与靶序列互补的多核苷酸主要与靶序列杂交，且基本上不与非靶序列杂交的条件。通常，杂交条件具有中等严格性，优选高严格性。

如本发明所用，“互补性”是指核酸序列与另一核酸序列形成氢键的能力(例如，通过典型的Watson-Crick碱基配对)。互补性百分比表示核酸序列中可以与第二核酸序列形成氢键的残基的百分比。如果两个核酸序列具有100％互补性，则这两个序列是完全互补的，即第一多核苷酸的所有连续残基与第二多核苷酸中相同数量的连续残基形成氢键。

如本发明所用，“结合”是指大分子之间的非共价相互作用(例如，蛋白质与多核苷酸之间，多核苷酸与多核苷酸之间，或蛋白质与蛋白质之间等)。这种非共价相互作用也被称为“联合”或“相互作用”(例如，如果第一大分子与第二大分子相互作用，则第一大分子以非共价方式与第二大分子结合)。结合相互作用的某些部分可以是序列特异性的(术语“序列特异性结合”、“特异性结合序列”、“位点特异性结合”和“特异性结合位点”在本发明中可以互换使用)。结合相互作用可以通过解离常数(Kd)来表征。“结合亲合力”是指结合相互作用的强度。增加的结合亲和力与更低的Kd相关。

本发明所用的“基因”是指包括外显子和相关调控序列的多核苷酸序列。基因还可以包含内含子和/或非翻译区(UTR)。

如本发明所用，术语“可操作地连接”是指置于彼此之间具有功能关系的多核苷酸序列或氨基酸序列。例如，如果调节序列调节或有助于调控多核苷酸的转录，则调节序列(例如启动子或增强子)“可操作地连接”到编码基因产物的多核苷酸。可操作地连接的调控元件通常与编码序列相邻。然而，如果增强子与启动子相隔数千个碱基或更多，增强子就可以发挥作用。因此，一些调控元件可以可操作地连接到多核苷酸序列，但不与多核苷酸序列相邻。类似地，翻译调控元件有助于调控多核苷酸对蛋白质表达。在一些实施方式中，可操作地连接的元件可以是彼此异源的。

如本发明所用，“表达”是指来自DNA模板的多核苷酸的转录，从而产生例如信使RNA(mRNA)或其它RNA转录物(例如，非编码的，例如结构RNA或支架RNA)。该术语进一步是指通过转录的mRNA被翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以被统称为“基因产物”。如果多核苷酸来源于基因组DNA，表达可以包括在真核细胞中剪接mRNA。

“编码序列”或“编码”选定多肽的序列是一种核酸分子，当置于适当的调控序列的控制下时，其在体外或体内被转录(在DNA的情况下)和翻译(在mRNA的情况下)进多肽。编码序列的边界由位于5'端的起始密码子和位于3'端的翻译终止密码子决定。转录终止序列可以位于编码序列的3'处。

如本发明所用，“互补DNA(cDNA)序列”是指由RNA模板合成(通常通过逆转录)的DNA序列，并且可以包括第一链cDNA分子、第二链cDNA分子、或包含第一链和第二链cDNA的双链cDNA分子。因此，对于给定的RNA模板(例如mRNA转录物)，“相应的互补DNA(cDNA)序列”是指由逆转录RNA模板产生的DNA序列。

如本发明所用，术语“调控”是指在性质、活性、功能或物理分子的数量、程度或数目上的变化。基因表达的“调控”包括基因激活和基因抑制。调控可以通过确定直接或间接受靶基因的表达影响的任意特征来测定。这些特征包括，例如在RNA或蛋白质水平、蛋白质活性、产物水平、基因的表达或报告基因的活性水平上的变化。

如本发明所用，例如本发明的标记基因的“不同”或“改变”的表达水平是可测定地不同(并且优选地，是统计学显著性)的差异(例如，不能归因于用于评估表达的测定的标准误差)。在一些实施方式中，在表达水平上的差异，例如，与对照或参考样本相比，目的样品中的本发明的标记基因，例如，根据被分析的基因表达，以及例如分析技术，可以是，例如，大于2倍的差异；大于5倍的差异；大于10倍的差异；大于20倍的差异；大于50倍的差异；大于75倍的差异；大于100倍的差异；大于250倍的差异；大于500倍的差异；大于750倍的差异；大于1000倍的差异；大于5000倍的差异；大于10000倍的差异；大于25000倍的差异；大于50000倍的差异；大于75000倍的差异；大于100000倍的差异；大于250000倍的差异；大于500000倍的差异；大于750000倍的差异；大于1000000倍的差异；大于2500000倍的差异；大于5000000倍的差异；大于7500000倍的差异；大于10000000倍的差异；大于50000000倍的差异；大于100000000倍的差异；大于250000000倍的差异；大于500000000倍的差异；大于750000000倍的差异；大于1000000000倍的差异；大于5000000000倍的差异；或大于10000000000倍的差异。

如本发明所用的“载体”和“质粒”是指将遗传物质引入细胞中的多核苷酸载体。载体可以是线性的或环形的。载体可以含有能够影响在合适的宿主细胞中的载体复制的复制序列(例如，复制的起点)。在转化合适的宿主后，载体可以独立于宿主基因组或整合到宿主基因组中进行复制和发挥功能。除此之外，载体设计取决于载体的预期用途和宿主细胞，并且用于特定用途和宿主细胞的本发明的载体的设计是在本领域的技术水平内。载体的四种主要类型是质粒、病毒载体、黏质体和人工染色体。通常，载体包括复制起点、多克隆位点和/或选择性标记。表达载体可以包括表达盒。“重组病毒”是指经过基因改造的病毒，例如，通过在病毒基因组或其部分中添加或插入异源核酸构建体。

如本发明所用，“表达盒”是指使用重组方法或通过合成手段生成的多核苷酸构建体，并且包含可操作地连接到选定的多核苷酸的调控序列，以促进所选的多核苷酸在宿主细胞中的表达。例如，调节序列可以促进所选多核苷酸在宿主细胞中的转录，或所选多核苷酸在宿主细胞中的转录和翻译。例如，表达盒可以被整合在宿主细胞的基因组中或存在于载体中以形成表达载体。

如本发明所用，术语“在…之间”包括给定范围的末端值(例如，长度在约1至约50个核苷酸之间包括1个核苷酸和50个核苷酸)。

如本发明所用，术语“氨基酸”是指天然的和合成的(非天然的)氨基酸，包括氨基酸类似物、修饰的氨基酸、拟肽、甘氨酸和D或L光学异构体。

如本发明所用，术语“肽”、“多肽”和“蛋白质”是可以互换的，并且是指氨基酸的聚合物。多肽可以是任意长度。其可以是分支的或线性的，其可以被非氨基酸打断，以及其可以包含修饰的氨基酸。该术语还指通过例如乙酰化、二硫键形成、糖基化、脂化、磷酸化、聚乙二醇化、生物素化、交联和/或偶联(例如与标记成分或配体)修饰的氨基酸聚合物。除非另有说明，多肽序列在本发明以常规的N-末端到C-末端方向展示。多肽和多核苷酸可以用分子生物学领域的常规技术制得。

如本发明所用的术语“融合蛋白”和“嵌合蛋白”是指通过连接在单个蛋白质中非自然地一起存在的两个或更多蛋白质、蛋白质结构域或蛋白质片段而产生的单个蛋白质。融合蛋白可以包含表位标签(例如，组氨酸标签、(Sigma Aldrich,St.Louis,MO)标签、Myc标签)，报告蛋白序列(例如，谷胱甘肽-S-转移酶、β-半乳糖苷酶、荧光素酶、绿色荧光蛋白、青色荧光蛋白、黄色荧光蛋白)，和/或核酸序列结合域(例如，DNA结合域或RNA结合域)。

如本发明所用的“基团”是指分子的一部分。基团可以是一个官能团，或描述具有多个官能团的分子的一部分(例如具有共同的结构外观)。术语“基团”和“官能团”通常可以互换使用；然而，“官能团”可以更具体地指分子中包含某些共同化学行为的部分。“基团”通常用作结构描述。

组合物或药剂(如本发明提供的工程化组织)的术语“有效量”或“治疗有效量”，是指提供所需反应的组合物或药剂的足够量。这种反应将取决于涉及的特定疾病。例如，在一些实施方式中，希望从PSC中产生分化的细胞或组织，以施用给受试者来治疗例如一种或多种症状、疾病或缺陷。

如本发明所用的“转化”是指将外源多核苷酸插入宿主细胞中，而不考虑所用的插入的方法。例如，转化可以通过直接摄取、转染、感染等。外源多核苷酸可以被维持作为非整合载体，例如，附加体，或者可替代地，可以整合到宿主基因组中。

生成iPSC的方法

本发明部分涉及用于检测PSC存在的方法。在本发明的某些实施方式中，PSC是存在于主要来源于PSC的分化细胞群体中的残余的未分化的PSC。

本发明考虑从，例如，体细胞(包括人体细胞)中产生iPSC细胞。体细胞可以来源于人类或非人动物，包括例如人类和其它灵长类动物，包括非人灵长类动物，如恒河猴、黑猩猩和其它猴子和猿类；农场动物，例如牛、绵羊、猪、山羊和马；家养哺乳动物，例如狗和猫；实验动物，包括兔子、小鼠、大鼠和豚鼠；鸟类，包括家禽、野禽和猎禽，如鸡、火鸡和其它鹑鸡类鸟类、鸭和鹅；等等。在一些实施方式中，体细胞选自角质化上皮细胞、粘膜上皮细胞、外分泌腺上皮细胞、内分泌细胞、肝细胞、上皮细胞、内皮细胞、成纤维细胞、肌肉细胞、血液和免疫系统细胞、神经系统细胞(包括神经细胞和胶质细胞)、色素细胞和祖细胞(包括造血干细胞)。体细胞可以是完全分化(特化)的，或者可以是未完全分化的。例如，可以使用非PSC的未分化祖细胞，包括成体干细胞，并最终分化的成熟细胞。体细胞可以来自任何年龄的动物，包括成人细胞和胎儿细胞。

体细胞可以是哺乳动物源的。例如，如果细胞将被用于体内移植，则可以使用同种异体细胞。在一些实施方式中，iPSC与受试者的MHC-/HLA不匹配。在一些实施方式中，iPSCs与受试者的MHC-/HLA匹配。例如，在实施方式中，当将iPSCs用于生产PSC衍生细胞来用于再生医学的情况下，体细胞可以从待治疗的受试者，或从与该受试者具有相同或基本相同HLA类型的另一受试者处获得。例如，体细胞可以在核重编程之前进行培养，或可以在分离后不进行培养而重编程。

为了将重编程因子引入体细胞，例如，可以使用病毒载体，包括例如SV40、腺病毒、牛痘病毒、腺相关病毒、疱疹病毒(包括HSV和EBV)、辛德毕斯病毒、α病毒、人疱疹病毒载体(HHV)，例如HHV-6和HHV-7、和逆转录病毒的病毒载体。慢病毒包括但不限于人类免疫缺陷病毒1型(HIV-1)、人类免疫缺陷病毒2型(HIV-2)、猴免疫缺陷病毒(SIV)、猫免疫缺陷病毒(FIV)、马传染性贫血病毒(EIAV)、牛免疫缺陷病毒(BIV)、羊维斯那病毒(VISNA)和山羊关节炎脑炎病毒(CAEV)。慢病毒载体能够感染非分裂细胞，并可以用于体内和体外基因转移和核酸序列的表达。通过将病毒蛋白(例如包膜蛋白)与结合剂(例如抗体)或特定配体(用于靶向，例如，特定细胞类型上或内的受体或蛋白质)连接，病毒载体能够靶向于特定细胞类型。

在一些实施方式中，病毒载体，例如慢病毒载体，可以整合到宿主细胞的基因组中。由此，转移的遗传物质随后被转录并可能在宿主细胞内被翻译成蛋白质。在其它实施方式中，使用不整合到宿主细胞基因组中的病毒载体。

病毒基因递送系统可以是基于RNA或基于DNA的病毒载体。附加体基因递送系统可以是，例如质粒、基于EB病毒(EBV)的附加体载体、基于酵母的载体、基于腺病毒的载体、基于猴病毒40(SV40)的附加体载体、基于牛乳头状瘤病毒(BPV)的载体或慢病毒载体。

体细胞可以使用本领域技术人员已知的方法重编程以生产诱导多能干细胞(iPSC)。本领域技术人员可以容易地生产诱导多能干细胞，例如参见公开的美国专利申请2009/0246875号、公开的美国专利申请2010/0210014号、公开的美国专利申请2012/0276636号；美国专利8,058,065号、8,129,187号、和美国专利8,268,620号，其所有都是通过引用并入本发明的。

通常，可用于产生诱导多能干细胞的重编程因子，无论是单独的，组合的，或作为与转录激活域的融合，包括但不限于以下一个或多个基因：Oct4(Oct3/4、Pou5f1)、Sox(例如Sox1、Sox2、Sox3、Sox18或Sox15)、Klf(例如Klf4、Klf1、Klf3、Klf2或Klf5)、Myc(例如c-myc、N-myc或L-myc)、nanog或LIN28。作为这些基因和蛋白质序列的示例，提供以下编录号：小鼠MyoD：M84918，NM_010866；小鼠Oct4(POU5F1)：NM_013633；小鼠Sox2：NM_011443；小鼠Klf4：NM_010637；小鼠c-Myc：NM_001177352，NM_001177353，NM_001177354；小鼠Nanog：NM_028016；小鼠Lin28：NM_145833：人MyoD：NM_002478；人Oct4(POU5F1)：NM_002701，NM_203289，NM_001173531；人Sox2：NM_003106；人Klf4：NM_004235；人c-Myc：NM_002467；人Nanog：NM_024865；和/或人Lin28：NM_024674。还考虑与之相似的序列，包括那些具有至少约80％、至少约81％、至少约82％、至少约83％、至少约84％、至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％的序列同一性的。在一些实施方式中，利用Klf4、c-Myc、Oct3/4、Sox2、Nanog和Lin28中的至少三种或至少四种。在其它实施方式中，利用Oct3/4、Sox2、c-Myc和Klf4。

用于生产iPSC的示例性的重编程因子包括(1)Oct3/4、Klf4、Sox2、L-Myc(Sox2可被替换为Sox1、Sox3、Sox15、Sox17或Sox18；Klf4可被替换为Klf1、Klf2或Klf5)；(2)Oct3/4、Klf4、Sox2、L-Myc、TERT、SV40大T抗原(SV40LT)；(3)Oct3/4、Klf4、Sox2、L-Myc、TERT、人乳头瘤病毒(HPV)16E6；(4)Oct3/4、Klf4、Sox2、L-Myc、TERT、HPV16 E7；(5)Oct3/4、Klf4、Sox2、L-Myc、TERT、HPV16 E6、HPV16 E7；(6)Oct3/4、Klf4、Sox2、L-Myc、TERT、Bmi1；(7)Oct3/4、Klf4、Sox2、L-Myc、Lin28；(8)Oct3/4、Klf4、Sox2、L-Myc、Lin28、SV40LT；(9)Oct3/4、Klf4、Sox2、L-Myc、Lin28、TERT、SV40LT；(10)Oct3/4、Klf4、Sox2、L-Myc、SV40LT；(11)Oct3/4、Esrrb、Sox2、L-Myc(Esrrb可被Esrrg替代)；(12)Oct3/4、Klf4、Sox2；(13)Oct3/4、Klf4、Sox2、TERT、SV40LT；(14)Oct3/4、Klf4、Sox2、TERT、HPV16 E6；(15)Oct3/4、Klf4、Sox2、TERT、HPV16 E7；(16)Oct3/4、Klf4、Sox2、TERT、HPV16 E6、HPV16E7；(17)Oct3/4、Klf4、Sox2、TERT、Bmi1；(18)Oct3/4、Klf4、Sox2、Lin28(19)Oct3/4、Klf4、Sox2、Lin28、SV40LT；(20)Oct3/4、Klf4、Sox2、Lin28、TERT、SV40LT；(21)Oct3/4、Klf4、Sox2、SV40LT；或(22)Oct3/4、Esrrb、Sox2(Esrrb可被Esrrg替代)。

在制备iPSC期间和之后，可以根据细胞类型在合适的培养基中培养细胞，例如Dulbecco's Modified Eagle's培养基(DMEM)、DMEM F12培养基、Eagle's MinimumEssential培养基、F12K培养基，Iscove's Modified Dulbecco's培养基、Knockout DMEM或RPMI-1640培养基。还考虑用哺乳动物血清补充细胞培养基。这类血清的示例包括胎牛血清(FBS)、牛血清(BS)、小牛血清(CS)、胎牛血清(FCS)、新生牛血清(NCS)、山羊血清(GS)、马血清(HS)、人血清、鸡血清、猪血清、绵羊血清、兔血清、大鼠血清(RS)、血清替代物和牛胚胎液。例如，可以用约0.5％至约5％或更高，包括约5％至约15％或更高，例如约20％、约25％或约30％浓度的总血清(例如FBS)或血清替代物分离和/或扩增细胞。

额外的补充剂也可以用来为细胞提供最佳生长和扩增的微量元素。这些补充剂包括胰岛素、转铁蛋白、硒钠及其组合。这些成分可以包含在盐溶液中，例如但不限于Hanks’平衡盐溶液、Earle’s盐溶液、抗氧化补充剂、MCDB-201、磷酸盐缓冲盐溶液(PBS)、N-2-羟乙基哌酸-N’-乙磺酸(HEPES)、烟酰胺、抗坏血酸和/或抗坏血酸-2-磷酸，以及额外的氨基酸。这些氨基酸包括但不限于L-丙氨酸、L-精氨酸、L-天门冬氨酸、L-天冬氨酸、L-半胱氨酸、L-半胱氨酸、L-谷氨酸、L-谷氨酰胺、L-甘氨酸、L-组氨酸、L-肌醇、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-蛋氨酸，L-苯丙氨酸，L-脯氨酸，L-丝氨酸，L-苏氨酸，L-色氨酸，L-酪氨酸和L-缬氨酸。

抗生素通常也用于细胞培养中以减轻细菌、支原体和真菌污染。此类抗生素或抗霉菌化合物可以包括，例如，青霉素/链霉素、两性霉素、氨苄西林、庆大霉素、博来霉素、潮霉素、卡那霉素、丝裂霉素、霉酚酸、萘啶酸、新霉素、制霉菌素、巴龙霉素、多粘菌素、嘌呤霉素、利福平、奇霉素、四环素、泰乐霉素和博莱霉素。

可选的，激素也可用于细胞培养中，并包括但不限于D-醛固酮、己烯雌酚(DES)、地塞米松、β-雌二醇、氢化可的松、胰岛素、催乳素、，黄体酮、生长激素抑制素/人生长激素(HGH)、促甲状腺素、甲状腺素和L-甲状腺氨酸。β-巯基乙醇也可以补充在细胞培养培养基中。

根据细胞类型和分化细胞的命运，脂质和脂质载体也可以用来补充细胞培养基。这些脂质和载体可以包括但不限于环糊精、胆固醇、与白蛋白偶联的亚油酸、与白蛋白偶联的亚油酸和油酸、未偶联的亚油酸、与白蛋白偶联的亚油酸-油酸-花生四烯酸、与白蛋白不偶联或偶联的油酸等。白蛋白同样可以用于无脂肪酸的配方。

培养中的细胞可以保持于悬浮液中或附着在固体支撑物上，例如细胞外基质成分和合成物或生物聚合物。其它有助于增强对固体支撑物的附着的因素包括，例如I型、II型和IV型胶原蛋白、刀豆蛋白A、硫酸软骨素、纤连蛋白、纤连蛋白样聚合物、明胶、层粘连蛋白、聚D和聚L-赖氨酸、基底膜基质、血小板反应蛋白和/或玻连蛋白。

iPSC培养物也可以包含细胞因子，以允许iPSC保持未分化形式，包括例如，表皮生长因子(EGF)、血小板衍生生长因子(PDGF)、白血病抑制因子(LIF)、碱性成纤维生长因子(bFGF)、及其组合。

iPSCs通常表现出人类胚胎干细胞(hESC)的特征形态，并表达多能因子NANOG。胚胎干细胞特异性表面抗原(SSEA-3、SSEA-4、TRA1-60、TRA1-81)也可用于鉴定完全重编程的人类细胞。此外，在功能水平上，PSC，例如ESC和iPSC，也显示出从所有三个胚胎胚层分化成谱系的能力，并在体内形成畸胎瘤(例如在SCID小鼠中)。

分化PSC的方法

本发明进一步考虑了将包括ESC和iPSC的PSC分化为分化(特化)细胞，并然后，例如使用本发明所述的标记基因从分化细胞中区分残留的PSC。

PSC可以分化为任意的目的细胞类型，包括部分或完全特化的细胞，例如，造血祖细胞、红细胞、B淋巴细胞、T淋巴细胞、自然杀伤细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、单核细胞、巨噬细胞和血小板；神经祖细胞；神经元，例如肾上腺素能或多巴胺能神经元、运动神经元、外周神经元、星形胶质细胞和寡树突胶质细胞、小神经胶质细胞；色素上皮细胞、皮肤细胞和内耳细胞；吸收细胞、杯状细胞、潘氏细胞和肠内分泌细胞；肝细胞、胰腺祖细胞、胰岛素分泌细胞、胆管细胞、肺泡上皮细胞和肠上皮细胞；存在于毛囊基部，并产生毛囊和表皮的角化细胞；心肌细胞、心脏祖细胞、心外膜细胞、骨骼肌细胞、骨骼肌成肌细胞、内皮细胞，包括血管内皮细胞、肝细胞、骨细胞、软骨细胞、肾祖细胞和肾上皮细胞；间充质干细胞；内胚层相关组织细胞；视网膜色素上皮细胞；和光感受器前体细胞。分化多能干细胞的方法是本领域已知的。

检测PSC的标记物

本发明考虑了检测多能干细胞特异性的标记物，其可用于，例如，确认样本中一个或多个多能干细胞的存在和/或不存在。具体地，本发明涉及由多能干细胞选择性表达的核酸和多肽标记物；以及通过检测一个或多个此类标记的存在和/或不存在来检测一个或多个多能干细胞的存在和/或不存在的方法。

在本发明的一些实施方式中，至少一个标记基因的表达被检测和/或测量。在一些实施方式中，至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括选自以下核苷酸序列：AC009446.1(SEQ ID NO:1)；AL117378.1a(SEQ ID NO:2)；AL117378.1b(SEQID NO:3)；AL117378.1c(SEQ ID NO:4)；和LNCPRESS2(SEQ ID NO:5)。在一些实施方式中，可以检测到上述标记中的至少2个、至少3个、至少4个或5个。

在一些实施方式中，至少一个标记基因表达具有相应互补DNA(cDNA)序列的转录物，互补DNA序列包括与从选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有小于100％的序列同一性的核苷酸序列。例如，本发明考虑的是检测至少一个表达具有相应互补DNA(cDNA)序列的转录物的标记基因，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少70％序列同一性、至少75％序列同一性、至少80％序列同一性、至少85％序列同一性、至少90％序列同一性、至少91％序列同一性、至少92％序列同一性、至少93％序列同一性、至少94％序列同一性、至少95％序列同一性，至少96％序列同一性，至少97％序列同一性，至少98％序列同一性，或至少99％序列同一性的核苷酸序列。在一些实施方式中，可以检测上述变体序列中的至少2个、至少3个、至少4个或至少5个。

本发明的标记物可以被单独地、以组合地、顺序地、同时地、同步地和/或与其它标记物联合检测，其它标记物可以是或可以不是PSC特异性的，包括例如，与PSC相比，也在分化细胞中表达，但是数量不同或表达模式不同的标记物。

在一些实施方式中，除了检测和/或测量表达具有相应的互补DNA(cDNA)序列的转录物(转录物包括选自由SEQ ID NO:1-5组成的组中的核苷酸序列)的至少一个标记基因的表达外(和/或除了检测和/或测量至少一个表达具有相应互补DNA(cDNA)序列的转录物的标记基因的表达外，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少70％序列同一性、至少75％序列同一性、至少80％序列同一性、至少85％序列同一性、至少90％序列同一性、至少91％序列同一性、至少92％序列同一性、至少93％序列同一性、至少94％序列同一性、至少95％序列同一性，至少96％序列同一性，至少97％序列同一性，至少98％序列同一性，或至少99％序列同一性的核苷酸序列)，可以检测和/或测量对PSC特异性的至少一个额外标记物。

在一些实施方式中，对PSC特异性的且可被检测和/或测量的至少一个额外标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括选自以下的核苷酸序列：AC106875.1a(SEQ ID NO:6)；AC106875.1b(SEQ ID NO:7)；AL138720.1a(SEQ ID NO:8)；AL138720.1b(SEQ ID NO:9)；AL353052.1(SEQ ID NO:10)；AL392023.1(SEQ ID NO:11)；AL591742.2(SEQ ID NO:12)；AP002856.2(SEQ ID NO:13)；C11orf86(SEQ ID NO:14)；CCDC172a(SEQ ID NO:15)；CCDC172b(SEQ ID NO:16)；CCDC172c(SEQ ID NO:17)；CCDC172d(SEQ ID NO:18)；DPPA5(SEQ ID NO:19)；FOXI2(SEQ ID NO:20)；LINC01194a(SEQ ID NO:21)；LINC01194b(SEQ ID NO:22)；LINC01194c(SEQ ID NO:23)；LINC01194d(SEQ ID NO:24)；SLC52A3a(SEQ ID NO:25)；SLC52A3b(SEQ ID NO:26)；SLC52A3c(SEQ ID NO:27)；和TCL1B(SEQ ID NO:28)。

在一些实施方式中，对PSC特异性的且可被检测和/或测量的至少一个额外标记基因表达具有相应互补DNA(cDNA)序列的转录物，互补DNA序列包括与选自由SEQ ID NO:6-28组成的组中的核苷酸序列具有小于100％的序列同一性的核苷酸序列。例如，本发明考虑的是检测至少一个表达具有相应的互补DNA(cDNA)序列的转录物的额外标记基因，包括与选自由SEQ ID NO:6-28组成的组中的核苷酸序列具有至少70％序列同一性、至少75％序列同一性、至少80％序列同一性、至少85％序列同一性、至少90％序列同一性、至少91％序列同一性、至少92％序列同一性、至少93％序列同一性、至少94％序列同一性、至少95％序列同一性，至少96％序列同一性，至少97％序列同一性，至少98％序列同一性，或至少99％序列同一性的核苷酸序列。

在一些实施方式中，可以检测到上述额外标记物、或其变体序列中的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、或至少23个。

在一些实施方式中，测量以上列出的一个或多个标记物的表达以确定PSC在例如组合物、溶液、细胞聚集体、细胞悬浮液或组织中的存在。

在某些实施方式中，一个或多个标记物在多个细胞(例如组合物、溶液、细胞聚集体、细胞悬浮液或组织)中的表达与对照或参考样本的相同一个或多个标记物的表达比较。对照或参考样本可以包含多个细胞，例如组合物、溶液、细胞聚集体、细胞悬浮液或组织。例如，对照或参考样本可以是包含多个PSC，例如ESC、iPSC、或两者(例如，阳性对照)的样本。此外，或者可替代地，对照或参考样本可以是，例如，包含多个非PSC，例如特化细胞；或者非终末分化的非PSC(例如，阴性对照)的样本。在一些实施方式中，对照或参考样本基本上不含PSC。在一些实施方式中，对照或参考样本不含PSC。在一些实施方式中，在对照或参考样本中，唯一的细胞或实质上唯一的细胞是PSC。“基本上不含PSC”，其是指样本中PSC的量小于或等于检测条件下的检测限。“在对照或参考样本中，实质上唯一的细胞是PSC”，其是指样本中非PSC的量小于或等于检测条件下的检测限。

在一些实施方式中，使用归一化数据将目的样本中的本发明的一个或多个标记物的表达水平与对照或参考值比较。归一化可以基于，例如，一个或多个参考基因或基因产物的表达水平，例如，被理解为在未分化和分化细胞之间以恒定方式表达的基因；和/或在不同条件下。表达数据的归一化也可以基于全局基因表达模式。本发明考虑的其它数据归一化方法包括，例如，全局秩不变集归一化(GRSN)；互相关归一化(Xcorr)；非参数变量选择与逼近(NVSA)；核密度加权黄土归一化(KWDL)；核密度分位数归一化(KDQ)；迭代秩序归一化(IRON)；最小变集归一化(LVS)；改进的最小变集归一化(LVSmiR)；不变量归一化；HMM辅助归一化(HMM)；生物标度归一化(BSN)；支持向量回归(SVR)；不变集归一化(ISN)；加标标准；加权低度归一化(wlowess)；加权循环黄土归一化(wcloess)；子集分位数归一化(SQN)；loessm；泛用型普氏分析(GPA)；鲁棒多阵列平均(RMA)；交叉归一化(CrossNorm)；信息交叉归一化(ICN)；全局平均；和dChip。

在高通量RNA/cDNA测序应用中，例如RNA-seq，例如归一化可以基于基因长度、测序深度或两者。例如，归一化的表达数据可以表示为RPM(Reads per million mappedReads)、RPKM(Reads per kilo base per million mapped reads)、TPM(Transcript permillion)或FPKM(Fragments per kilo base per million mapped Reads)。

标记物表达可以通过检测转录分子(例如mRNA)或蛋白质表达的多种熟知的方法中的任一种来评估。这些方法的非限制性示例包括用于检测分泌的、细胞表面的、细胞质的或核蛋白质的免疫学方法、蛋白质纯化方法、蛋白质功能或活性测定、核酸杂交方法、核酸逆转录方法和核酸扩增方法。

在某些实施方式中，本发明的标记物的表达可以通过确定标记基因的信使RNA(mRNA)表达的水平来测量。例如，这种mRNA分子可以从生物样本(诸如含有细胞的组合物、含有细胞的溶液、细胞聚集体、细胞悬浮液或组织)中分离、衍生或扩增。这种mRNA可以直接分析；或例如合成其对应的cDNA分子并用于进一步分析。

当从组织或细胞中分离RNA时，防止在组织或细胞从培养物中移除后，在基因表达中的任何进一步变化都可能是重要的。已知表达水平的变化在扰动(例如热休克或用脂多糖(LPS)或其它试剂激活)之后迅速变化。此外，组织和细胞中的RNA可能迅速降解。因此，在一些实施方式中，获得的组织或细胞可以，例如，在分析之前被保存或快速冷冻。

RNA可以通过多种方法从组织或细胞样本中提取，例如，在硫氰酸胍裂解后进行CsCl离心(Chirgwin等人，1979,Biochemistry 18:5294-5299)。可以如从单细胞制备cDNA文库的方法中所述的来获得来自单个细胞的RNA，例如Dulac,C.(1998)Curr.Top.Dev.Biol.36,245和Jena等人，(1996)J.Immunol.Methods 190:199中描述的方法。RNA提取的其它方法和试剂盒在本领域是熟知的。

分离的RNA样本也可以对特定的种类进行富集。例如，poly(A)+RNA可以从RNA样本中分离出来。一般来说，这种纯化利用了mRNA上的poly-A尾的优点。例如，poly-T寡核苷酸可以固定化充当mRNA的亲和配体。用于此目的的试剂盒可以从商业上获得，例如MessageMaker试剂盒(Life Technologies,Grand Island,N.Y.)。

在一些实施方式中，RNA群体可以被特异性地富集某些序列，包括例如一个或多个标记序列。富集可以，例如通过引物特异性cDNA合成，或基于cDNA合成和模板定向体外转录的多轮线性扩增(参见，例如，Wang等人，(1989)PNAS 86,9717；Dulac等人，同上，和Jena等人，同上)进行。

分离的RNA，是否富集特定种类或序列，都可以进一步扩增。例如，当RNA是mRNA时，扩增过程，例如可以利用RT-PCR扩增mRNA，从而增强可检测的或检测的信号。这样的扩增过程是有益的，特别是当组织或细胞样本时，例如，是小尺寸或体积的。

各种扩增和检测方法可用于辅助标记基因的表达的检测。例如，在进一步分析之前将mRNA逆转录成cDNA(例如，聚合酶链式反应，RT-PCR)在本发明的范围内。可在本发明中利用的其它已知扩增方法包括但不限于“NASBA”或“3SR”技术；Q-beta扩增；链置换扩增；靶向介导扩增；连接酶链式反应(LCR)；自维持序列复制(SSR)；和转录扩增。

检测、表征和/或定量核酸序列的方法；以及用于检测、表征和/或定量mRNA表达的方法是本领域技术人员已知的，并且包括但不限于，例如PCR程序、RT-PCR、定量PCR或RT-PCR、Northern blot分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验、基因表达系列分析(SAGE)、基于数字条形码定量测定的杂交、多重RT-PCR、数字液滴PCR(ddPCR)、qRT-PCR、qPCR、紫外光谱、DNA测序、RNA测序、下一代测序，包括RNAseq，利用分支DNA信号扩增的基于裂解物的杂交分析，例如QuantiGene 2.0Single Plex，以及分支DNA分析方法。

核酸测序技术的非限制性示例，例如对于DNA测序和RNA测序，包括Maxam-Gilbert测序、Sanger测序(即链终止)、合成测序(SBS)、连接测序、焦磷酸测序、单分子实时测序、MiSeq测序、大规模并行特征测序(MPSS)、聚合酶克隆测序、454测序、纳米孔测序。本发明还包括但不限于下一代测序技术。

下一代测序技术的非限制性示例包括，例如，Ion Torrent、Illumina、SOLiD、454；大规模并行特征测序固相，可逆染料终止测序；和DNA纳米球测序。数字条形码定量分析可以包括BeadArray(Illumina)、xMAP系统(Luminex)、nCounter(Nanostring)、高通量基因组学(HTG)分子、BioMark(Fluidigm)、或Wafergen微阵列。检测方法可以包括DASL(Illumina)、RNA-Seq(Illumina)、TruSeq(Illumina)、SureSelect(Agilent)、Bioanalyzer(Agilent)和TaqMan(ThermoFisher)。

一般来说，PCR描述了基因扩增的方法，其包括(i)在核酸样本或文库中引物对特定基因或序列的序列特异性杂交，(ii)随后的涉及使用耐热性DNA聚合酶进行多轮退火、延伸和变性的扩增，以及(iii)筛选正确大小的PCR产物条带。所使用的引物是足够长度和适当序列以提供聚合起始的寡核苷酸，即，每个引物被特异性地设计为与待扩增的基因座的链互补。可以通过逆转录(RT)PCR和定量RT-PCR(QRT-PCR)，或实时PCR方法确定基因的mRNA水平。RT-PCR和QRT-PCR的方法在本领域是熟知的。本发明阐述了示例性标记基因的核酸序列。因此，熟练的技术人员可以基于公开的序列设计适当的引物，用于确定相应标记基因的mRNA水平。

可以使用本领域中熟知的多种程序中的任意一种从样本中分离核酸和核糖核酸(RNA)分子，所选择的特定分离程序适合于特定生物样本。

在一些实施方式中，本发明所述的一种或多种试剂(例如，核酸探针)可以包含可检测的标签和/或包含产生可检测信号的能力(例如，通过催化反应将化合物转化为可检测产物)。可检测的标签可以包括，例如，吸光染料、荧光染料或放射性标签。可检测的标签、检测它们的方法以及将它们合并入试剂(例如抗体和核酸探针)的方法是本领域熟知的。

在一些实施方式中，可检测的标签可以包括可通过光谱、光化学、生化、免疫化学、电磁、放射化学或化学手段(例如荧光、化学荧光或化学发光)、或任何其它适当手段检测的标签。可检测的标签可以是初级标签(其中所述标签包含可直接检测的基团或产生可直接检测的基团)；或二级标签(其中可检测的标签与另一个基团结合以产生可检测的信号，例如，常见的在免疫标记中使用二级和三级抗体)。可检测的标签可以通过共价或非共价方式连接到试剂。或者，可检测的标记可以连接，例如通过直接标记通过配体-受体结合对排列或其它此类特异性识别分子实现与试剂结合的分子。可检测的标签可以包括但不限于放射性同位素、生物性发光化合物、发色团、抗体、化学发光化合物、荧光化合物、金属螯合物和酶。

在一些实施方式中，本发明的多个标记物的表达水平可以被同时(例如多重检测)或并行测定。

在其它实施方式中，可以检测与本发明的标记基因相关的基因表达产物(蛋白质)以确定PSC的存在。这些检测技术为本领域技术人员所已知的，并包括例如ELISA(酶联免疫吸附测定法)、western blot、FACS、放射性免疫测定法；(RIA)；夹心测定法；荧光原位杂交(FISH)；免疫组织学染色；免疫电泳；免疫沉淀法和使用检测试剂(例如抗体或蛋白质结合剂)的免疫荧光法。

在一些实施方式中，本发明涉及用于检测样本中PSC(例如ESC或iPSC或两者)的存在的方法。在一些实施方式中，样本是含有细胞的组合物、含有细胞的溶液、细胞聚集体、细胞悬浮液或组织。在某些实施方式中，样本主要包含非PSC细胞。在进一步的实施方式中，样本中的细胞主要是比PSC更高分化的细胞，包括例如特化细胞，并且所述方法确定组合物中存在的PSC的存在和/或数量。在进一步的实施方式中，样本中的细胞主要是通过分化PSC产生的比PSC更高分化的细胞。例如，比PSC更高分化的细胞可以是，例如，光感受器前体(PRP)细胞或视网膜色素上皮(RPE)细胞。因此，本发明所述的方法可用于检测和/或定量组合物中的PSC，包括在分化PSC(例如产生特化细胞)的过程后的残留PSC。

在一些实施方式中，测试目的样本(例如含有细胞的组合物、含有细胞的溶液、细胞聚集体、细胞悬浮液或组织)以通过检测本发明的一种或多种标记物在目的样本内的细胞中的表达来确定其中PSC的存在。在一些实施方式中，还将目的样本中的一种或多种标记物的确定的表达水平与来自已知不含PSC的参考样本的一种或多种标记物的表达水平进行比较，例如，以确认目的样本中PSC存在或不存在。

在其它实施方式中，通过最初测量的在目的样本中的本发明的一种或多种标记物的表达水平来定量目的样本(例如含有细胞的组合物、含有细胞的溶液、细胞聚集体、细胞悬浮液或组织)中的PSC的数量。然后可以将目的样本中检测的一种或多种标记物的表达水平与参考样本中的一种或多种标记物的表达水平进行比较，例如，其中，参考样本中的所有细胞都是PSC。在其它实施方式中，然后将目的样本中检测的一种或多种标记物的表达水平与包含已知比例的PSC细胞的参考样本(相对于样本中的所有细胞)中的一种或多种标记物的表达水平进行比较。PSC占总细胞的比例可以是，例如，100％或更少、90％或更少、80％或更少、70％或更少、60％或更少、50％或更少、40％或更少、30％或更少、30％或更少、20％或更少、10％或更少、5％或更少、1％或更少、0.1％或更少、0.01％或更少、0.001％或更少、0.0001％或更少、0.00001％或更少、0.000001％或更少、0.0000001％或更少、0.00000001％或更少、0.000000001％或更少、0.000000001％或更少。

因此，通过将目的样本中本发明的一种或多种标记物的测定的表达水平与仅含有PSC(或相对于样本中所有细胞，包含已知比例的PSC)的参考样本中的一种或多种标记物的表达水平进行比较，可以确定目的样本中PSC细胞的比例。

根据上述方法，如果目的样本被确定不含PSC，可以对其进行确定。此外，当目的样本是从细胞培养物或组织培养物中获得的，根据该测定，可以允许培养物中的细胞或组织进一步扩增或增殖。

此外，当目的样本涉及细胞组合物或工程化组织，用于施用给受试者时，根据该测定，例如，可以在施用前进行或不进行进一步的扩增或增殖步骤来施用细胞或组织。

在其它实施方式中，可以在单个细胞水平上检测和/或定量本发明的一种或多种标记物的表达。也就是说，本发明的一种或多种标记物的表达可以在单个PSC中检测和/或定量(例如，单细胞分析)。例如，在分离单细胞后(例如，通过本领域已知的方法，包括连续稀释、显微操作、激光捕获显微切割、FACS和微流控)，可以进行单细胞分析。此外，本发明包括在其中，目的样本可以在多个其它(非PSC)细胞中仅包含单个PSC，并且本本发明的一种或多种标记物的表达可以在该单个PSC中检测和/或量化的实施方式。

本发明的另一方面涉及用于分析本发明所述的至少一个标记基因的表达的试剂盒、组合物或装置。在一个实施方式中，考虑用于分析至少一个标记基因表达的试剂盒、组合物或装置，包括至少一个引物和/或选择性地用于确定至少一个标记基因表达水平的探针。一些实施方式涉及选择性地包含用于确定多个标记基因表达水平的至少10个引物和/或探针、至少30个引物和/或探针、至少50个引物和/或探针、或至少100个引物和/或探针的试剂盒、组合物或装置。

术语“探针”是指诸如RNA或DNA的核苷酸片段，其可以特异性地与例如mRNA的核苷酸结合，并且具有几个碱基至几百个碱基的长度。探针可以标记有放射性同位素，从而可以确定特定mRNA的存在或不存在、或表达水平。探针可以被构建为寡核苷酸探针、单链DNA探针、双链DNA探针、RNA探针等形式。

术语“引物”是指具有游离3’羟基的短核苷酸序列，其可以与互补模板进行碱基配对相互作用，并可以充当作为复制模板链的起点。引物可在用于聚合的试剂(例如，DNA聚合酶或逆转录酶)的存在下和在合适的缓冲液中四种不同的三磷酸核苷以及合适的温度下启动DNA合成。

术语“核苷酸”是指脱氧核糖核苷酸或核糖核苷酸，并且除非另有说明，核苷酸可以包括天然核苷酸的类似物和包含修饰的糖或碱基的类似物。

所述探针或引物可以使用磷酰胺固体支持物法或其它广泛已知的方法进行化学合成。这些核苷酸序列也可以通过使用本领域已知的各种方法进行修饰。此类修饰的示例包括甲基化、胶囊化、用其类似物替代一种或多种天然核苷酸，以及核苷酸间修饰，例如对不带电偶联物(例如，甲基磷酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等)或带电偶联物(例如，硫代磷酸酯、二硫代磷酸酯等)的修饰。

探针或引物可以具有10个核苷酸或以上的长度，或可以具有20个核苷酸或以上的长度。探针或引物可以具有100个核苷酸或以下、90个核苷酸或以下、80个核苷酸或以下、70个核苷酸或以下、60个核苷酸或以下、50个核苷酸或以下、40个核苷酸或以下、30个核苷酸或以下、或25个核苷酸或以下的长度。

试剂盒还可以包括用于使用试剂盒组件以实施方法的说明书。用于实施方法的说明书通常记录在合适的记录介质上。例如，说明书可以印在基材上，例如纸或塑料等。说明书可能以包装说明书或在试剂盒或其组件的容器的标签上(例如，与包装或子包装相关)的形式存在于试剂盒中。

实施例

本发明的非限制性实施方式如以下实施例所示。已尽力确保关于数字的准确性(例如，数量、浓度、百分比变化等等)，但应当考虑到一些实验误差和偏差。应当理解的是，这些实施例仅以说明的方式给出，并不旨在限制发明人认为的本发明的各种实施方式的范围。并非每个实施例中列出的所有以下步骤都是必需的，也不必按照每个实施例中展示的步骤顺序。

实施例1

PSC特异性标记物的验证

分析了三个标记基因(LNCPRESS2、AC009446.1和AL117378.1)以确定其在PSC中是否为差异化表达。为此，设计并合成了这三个标记基因的序列特异性探针和引物，从而能够特异性检测对应于每个标记基因的互补DNA(cDNA)。如下使用这些探针和引物，通过液滴数字聚合酶链式反应(ddPCR)计量这三个标记基因的表达：

从iPSC、视网膜色素上皮(RPE)细胞或光感受器前体(PRP)细胞中提取总RNA。然后通过逆转录反应制备cDNA，并使用QX200数字PCR平台将得到的cDNA进行ddPCR。

在一组实验中，分别分析从iPSC和PRP细胞中获得的cDNA样本，并以不同的比例(1:100、1:1000、1:10000、1:100000和1:1000000)混合在一起后进行分析以得到具有iPSC:PRP cDNA不同比例的稀释系列。对于纯iPSC样本，由于信号饱和，与其它测试样本相比，使用的cDNA样本少了100倍。结果显示于图1中。如图1所示，如通过稀释系列的结果所证实的，检测的三个标记基因(LNCPRESS2、AC009446.1和AL117378.1)中的每一个均在iPSC细胞中而不在PRP细胞中特异性表达。

在第二组实验中，分别分析从iPSC和RPE细胞中获得的cDNA样本，并以不同的比例(1:100、1:1000、1:10000、1:100000和1:1000000)混合在一起后进行分析以得到具有iPSC:RPE cDNA不同比例的稀释系列。对于纯iPSC样品，由于信号饱和，与其它测试样本相比，使用的cDNA样品少了100倍。结果果显示于图2中。如图2所示，如通过稀释系列结果所证实的，检测的三个标记基因(LNCPRESS2、AC009446.1和AL117378.1)中的每一个均在iPSC细胞中而不在RPE细胞中特异性表达。

这些结果表明，三个标记基因(LNCPRESS2、AC009446.1和AL117378.1)可用于在样本中特异性检测PSC的存在，例如，在含有大部分的RPE或PRP细胞(由iPSC细胞产生)的样本中。

序列表

<110> 富士胶片细胞动力学公司

<120> 对多能干细胞特异性的标记物及其使用方法

<130> F272839

<150> US 63/158,125

<151> 2021-03-08

<160> 28

<170> PatentIn version 3.5

<210> 1

<211> 808

<212> DNA

<213> 智人

<400> 1

actcagcccc cctgcaccca ggtgaaataa acagccatgt tgctcacaca aagcctgttt 60

ggtgatctct tcacatggat gcacatgaaa tttggtgctg tgactcagat cgggggacct 120

cccttgggag atcaatcccc tgtactcctg ttctttgctc catgacaaag atccacctat 180

gacctcaggt cctcagaccg accagcccaa ggaacatctc accaattgta aatcaggtga 240

agtatgaagt tatgaggaga aaggaacaga ggacaaccac acagagaaag tgtagcttta 300

tctactagag ctgaagacat tcaaatttat gatccaacaa ttctactctg aagtgcagtg 360

gtgtatatac tgcaacaatg tgtactcatg tgccctgaga actagatatg aaaaaacctt 420

acagcaatat gcataatagt aaaaaaaaaa aaaaaaaact ggaaacaaca aaaatgttca 480

ttgaccatat acaatgataa atgtggtata ctcgtagcat ggaaaactac acaacattga 540

aaatgaacaa actaaaactg tacacagcaa catgaacgaa ttccacagat aatattgagt 600

gaaagatacc agacaccaaa taatatccca tatgatttca tttacattaa atgttttttt 660

tttgagatgg agtctcgctc tgttgcccag gctggagtgc agtggcacaa tcttggctca 720

ctgcaacctc tgcttttcag gttcaagcta ttctcccact tcagcctccc cagtagctgg 780

gactacaggt acctgccacc acgcccaa 808

<210> 2

<211> 2305

<212> DNA

<213> 智人

<400> 2

acaaagcctg tttggtggtc tcttcacacg gacgcgcatg aaatttggtg ccatgactcg 60

gatcggggga cctcccttgg gagatcaatc ccctgtcttc ctgttctttg ctccgtgaga 120

aagatccacc tacaacctca ggtcctcaga ccgaccagcc caaggaacat ctcaccaatt 180

ttaaatcagc tccaggagaa tgggtgactt gaactggcaa ggagcaacct gctctctcca 240

cgggcctctg gaaccccggc aagagaagat cccttgatca ccatggacac tcaagttggc 300

aagaagagct ccttagagaa gtcgtgggag ggcaagcaag ctgatgtgga gccaggacga 360

tttgatgtgg gagcacctgc agtggagcac agccagggag agccatctcc ccaggcctga 420

cttgctccca taggagactt tagccctagg ggaactgtcc atcctgatct ctgcagggtg 480

gtcttgtcca tcagacaggg ctgattcgac ctgagcaccc cttggtctgc tggcctttct 540

ggggtcccag cctggccaga cctgcttgca gggcagtctt gggtgccctg gaggccacgc 600

catagcttct gtgctggcag atagtatctg actggtggag agctccagca aggctgcccc 660

taggccacac accagcccat ccaccccctc cccacactgc agcttcccta ggcccaggaa 720

actcctcacg tgtctttgct ggcacaagtc tgcacaggta ggttttgcct tccttgccct 780

gccagtgcat gggagtgtag tctgcccccc tgccccgtct ggctgtcatt gaagacagag 840

ccttggtggg cacagagcaa gccagctccc ccgcaacgcc cacctcaaca cctggccctt 900

gtgctaacac tgtgcagaga acagtggacc ctgctcgcac cctgagtgat cactcctgct 960

tgtggggcac agagaaggtg tccagacctg ctcacgccag tgccctgccc ccaagccaac 1020

accacatcca acaggagcct gcacccagtc ttcagcatag aggtgaaaga tctctacgag 1080

gagaactatg aaacactgct caaaataatc aaatatgata caagcaaatg gaagagcatg 1140

caatgctcat ggataggaag aatcaatatc ataaaaatgg ccatactgcc caaagcaatt 1200

tatagattca atgctattcc tattaaacta ccattgatat tcttcacaaa actagagaaa 1260

actattttaa agttcatatg gaaccaaaaa agagcctgaa tagccaagga aatcctaagc 1320

aaaaagaaca aagctggaag catcatgcta cccaacttca aactatacta caggactaca 1380

gtaaccaaaa cagcgtggta ctggtacaaa aacagacaca tagaccaatg aaacagaata 1440

gagaacccag aaatggttct ctatttcaca cacctacaac tatctgatct tcgacaaacc 1500

tgataaaaac aagcaatagg gaaatgattc tgtattcatt aaatgatgct ggaataactg 1560

gctagccata tgctgaagat taaaactgga ccccttcctt atactgtaca caaaaatcaa 1620

ctcaaaatgg atgaaagact taaatgtaaa acccaaaact ataacaacaa tagaagacaa 1680

cctaggcaat accatcttgg atataggaac aggcaaaaat ttcatgacaa agacaccaaa 1740

agcaattgaa acaaaagcaa aaattgaaaa gtgggttcta aataaaacta aagagctcct 1800

gcacagcaaa gaaaatacaa acagagtgaa cagacaacct acagaatgac agtatctgca 1860

aactatacat ccaacaaaga tctaatattc agcatctata agaaacttaa acaaatttcc 1920

aaaaacaacc ccattaaaaa gtgggcaaag catatgaaca gacacttttc aaaagaagac 1980

atacatgcag ccaacaaaca tgaaaaaggc tcaacaccac caatcattag agaaatgcaa 2040

atcaaaacca caatgagata ccatctcaca ctagtcagaa tggctgatgg ctgttattaa 2100

aaagtcaaaa aataacagat gctggcaagg ttgtggagaa aaggcaatgc ttatgcactg 2160

ttggtgggag tataaattag ttcaatcatt gtggttgaca gtgtggtgat tcctcaaaga 2220

tctgaaaaca gaaatataat tctacctagc aatgctacta ctgggtatat acccaaagaa 2280

aaataaattg ttcaattata aagac 2305

<210> 3

<211> 601

<212> DNA

<213> 智人

<400> 3

caaagcctgt ttggtggtct cttcacacgg acgcgcatga aatttggtgc catgactcgg 60

atcgggggac ctcccttggg agatcaatcc cctgtcttcc tgttctttgc tccgtgagaa 120

agatccacct acaacctcag gtcctcagac cgaccagccc aaggaacatc tcaccaattt 180

taaatcagga gcttactaca cgtgccggca atctggccac tgggccaagg aatgcccgca 240

gcccgggatt cctcctaagc cgcgtcccat ctgtgtggga ccccactgga aatcggactg 300

ttcaactcac ctggcagcca ctcccagagc ccctggaact ctggcccaag gctctctgac 360

tgactccttc ccagatcttc ttggcttagc ggctgaagac tgacactgcc cgattgcctt 420

ggaagccccc taaaccatca cggatgccga gcttcgggta actctcacag tggaagggac 480

gtgcatgaaa gttaggggta gaagaaaaga tggattgagg ttgtcctcag actttccatg 540

gtatctgagc tgttttcctc ttccggaatt gtgtctcata tgaagttcct cttcatttga 600

g 601

<210> 4

<211> 712

<212> DNA

<213> 智人

<400> 4

ccctgagaca ctttacagcc ctagacccta aaaggtcaaa aggccgtctt attctcaaaa 60

tacattttat tacccgacat taataaaaca ttaaataaaa ctccaaaaat taaattccgg 120

ccctcaaacc tcacaacagg atttaattaa cctcgccttc aaggtgtacg ataatagaaa 180

aaagttgcaa ttccttgcct ccacggtgag acaaacccca gccacatctc cagcacacaa 240

gaacttccaa atgcctgaac cgcagaggcc aggcattcct ccagaacctc ctcccacagg 300

agcttactac acgtgccggc aatctggcca ctgggccaag gaatgcccgc agcccgggat 360

tcctcctaag ccgcgtccca tctgtgtggg accccactgg aaatcggact gttcaactca 420

cctggcagcc actcccagag cccctggaac tctggcccaa ggctctctga ctgactcctt 480

cccagatctt cttggcttag cggctgaaga ctgacactgc ccgattgcct tggaagcccc 540

ctaaaccatc acggatgccg agcttcgggt aactctcaca gtggaaggga cgtgcatgaa 600

agttaggggt agaagaaaag atggattgag gttgtcctca gactttccat ggtatctgag 660

ctgttttcct cttccggaat tgtgtctcat atgaagttcc tcttcatttg ag 712

<210> 5

<211> 616

<212> DNA

<213> 智人

<400> 5

ggaacatctc accaatttta aatcagtttt tcaagtggta cctgagattc agcacttcta 60

aaaagctcca aggtgatgaa ggtgctgcta gttggaggcc atactttgag ttgccagatg 120

ctaaaaattc aacagatggg gtatgtaagc agatagtgta gcatattgaa aacaactctc 180

agtttgaatc agaagcctgg gtctgtgata ttatgacact aactagctta atattttgtg 240

gattattgtg catgaaatat atccatttaa atatcatact ttcaatttaa attatgggtt 300

tcaactttgc caggcaaata taatcaacaa tatattcaat agtatgccac agctaaagac 360

acaaatgaaa acaatgatct cagacttttg atccaggtgc caagttagaa aaagaagtta 420

aaacagtgta gtttatttct gttcaatgtc ctgtataggt ggaaactaat ttcagggtta 480

atttttggtt aaacaactag cttggaaatt tataattatt tgggattgag gaccaaacaa 540

ggtgaggcac gataaagaaa ttagaagggg atcgctatga aaatcaagat gaataaaacg 600

aagggagtgt ttacgg 616

<210> 6

<211> 1059

<212> DNA

<213> 智人

<400> 6

gtgctggctt ccccttcgcc ttctgccgtc atttgacagg aaattaggat gagcacgagc 60

aaagtcggtg gtcacaaggg agcagccagg ccagtcctgc ttaaactcct gctgttacat 120

gtttgcgatt gaactcgtag caagctgccg atggaacaca acctgcctcc ggcacagacg 180

ccgatcttca atcccttctc cccagcaccg gtgacagccc tagtcatcct tcaaggccca 240

gttcaaatgc ctccatctcc ataccatttc agttcgtggt tggggatagg agctcccgtc 300

gcgatcgtca tctttctgct gcagacagat tttgtttccc tctgtaaagt tggagtgcag 360

gggacaaggc tctgaacata gcatttaagt gacagagatg gttgtggtca tgtcccagta 420

tgtatttatc tatctcctgc tccagtaaat gtcacactcc ccggggcagc gagggtgtca 480

ccatctcggt gtccccacag cacctagcac agtctcccag acgatccagg gcagaccctt 540

cgcatgggaa cgcaagtccc tgtttgtccg ggtcactcag gtttacgcct attgtcctgt 600

aattatttat gcaccctctt ttgctgtcat aggtgttggg ttggaacagt caccctattt 660

agcacacacc tattaagcca aagcacctta gtgtgtaggc ttccctcacc caaacctgtt 720

cccaaaggtc ctttctcacc ggctactttg ggggccccag taatcttccc gacccctctg 780

gtcagggcca gagtggggag caagtgtcta aagcaaggcc ttcaacaagg tcccttccct 840

gagagactca gtttgtgacg cttgtgattg tgaagctcaa atggattatg tgactccaca 900

taactctgca aactgtggtg cgccctatta ttgccgttta acttgtcagt gtcggttctg 960

cacccctgca ggctctgtag gggctggaga agaacacttg atttggaatt tcggtaatag 1020

ccagtgagct aagaaccaca taaaataatg cagatcata 1059

<210> 7

<211> 1170

<212> DNA

<213> 智人

<400> 7

tgctggcttc cccttcgcct tctgccgtca ttgtgagccg tggggaggcc ttgagcgccc 60

cctggaggtg acactctgcc actacacata ggaaaccacc tggaaaccca accacagtgt 120

ctgatgtgac ttttcttagt gacaggaaat taggatgagc acgagcaaag tcggtggtca 180

caagggagca gccaggccag tcctgcttaa actcctgctg ttacatgttt gcgattgaac 240

tcgtagcaag ctgccgatgg aacacaacct gcctccggca cagacgccga tcttcaatcc 300

cttctcccca gcaccggtga cagccctagt catccttcaa ggcccagttc aaatgcctcc 360

atctccatac catttcagtt cgtggttggg gataggagct cccgtcgcga tcgtcatctt 420

tctgctgcag acagattttg tttccctctg taaagttgga gtgcagggga caaggctctg 480

aacatagcat ttaagtgaca gagatggttg tggtcatgtc ccagtatgta tttatctatc 540

tcctgctcca gtaaatgtca cactccccgg ggcagcgagg gtgtcaccat ctcggtgtcc 600

ccacagcacc tagcacagtc tcccagacga tccagggcag acccttcgca tgggaacgca 660

agtccctgtt tgtccgggtc actcaggttt acgcctattg tcctgtaatt atttatgcac 720

cctcttttgc tgtcataggt gttgggttgg aacagtcacc ctatttagca cacacctatt 780

aagccaaagc accttagtgt gtaggcttcc ctcacccaaa cctgttccca aaggtccttt 840

ctcaccggct actttggggg ccccagtaat cttcccgacc cctctggtca gggccagagt 900

ggggagcaag tgtctaaagc aaggccttca acaaggtccc ttccctgaga gactcagttt 960

gtgacgcttg tgattgtgaa gctcaaatgg attatgtgac tccacataac tctgcaaact 1020

gtggtgcgcc ctattattgc cgtttaactt gtcagtgtcg gttctgcacc cctgcaggct 1080

ctgtaggggc tggagaagaa cacttgattt ggaatttcgg taatagccag tgagctaaga 1140

accacataaa ataatgcaga tcatatgaaa 1170

<210> 8

<211> 778

<212> DNA

<213> 智人

<400> 8

atgtgggtgg ctgagaaggg cactagggtg ggggtggctg gaggaatttt aagtgctgtg 60

atgaaatggg cacccttctc tgccctccat cgccaagccc tacacctctg cgaagactgt 120

gacacataaa gtcctgtgtc aacgatctgt gcccgcagag agagcctgct ccagcctctt 180

tgctacagcc ttgagtcttc tgctgaagct gtggagacta ccaaatggac tcgtctagat 240

ttcacatgca acgtggctct gccttccctg agcactctgg gcctttccat ggagacagaa 300

tgaatagata atgggctgtc accatcttgc actgccagct gtcctctctg aaggttgaac 360

tcctaacaga agtttcctca tgtttgtggt agcagcacct tgagaagtag agaagacaag 420

aagaaaaaag gagtcagcac agatgacaag ctctgctttt tagtgtacat ggtcttcccc 480

agtatgcaca ttcttttcct attcttgact tatctccctt aacgataaaa tggccaagtt 540

agaaacccta gacactctta ttctcttttc tttctttctt tcttttcttt cttaagagac 600

agggtctcat tctgtcaccc aggctggagt acagtggcac aactgtaggt agctcactgc 660

agcctgaaat tcctaggctc aagtgattct cctgcctcag cgacttcgga gtggctgaga 720

ttccaagctt aaaccattgt gtcctgcact tctcactttc atggctgtta tcctgggg 778

<210> 9

<211> 1017

<212> DNA

<213> 智人

<400> 9

cataggctcc agaaaacaag aagcaagact ggaaagctgg ggatgattgt acgccctcgc 60

ctgaatctta cgtggttcct ccttcttcca cctggccagt gcagagccgt gggtgccacg 120

tggccacttc tggattgggt tccccttggc ctgccaccct gtccttctgc tttcccactt 180

tgccagccag agtcaatttg aggacgccaa gttctcctct ccatacagag ctcctggtct 240

ccttgtaact tgtaactcct gggcacagtt acaagtgctg aattcttgcg aggatgaact 300

caagatacaa aatatgcttg gcaactcacc cctgagtggc cacaggcaca cgcaggagtc 360

gaacccaccc acctctgctg acagtcatgg gtcaagctca aagtcctggc tgcttctctg 420

ctcaagatct gtgcccgcag agagagcctg ctccagcctc tttgctacag ccttgagtct 480

tctgctaaga aaagacacag aggcaaagag aaacacatag agaggagaat gcctcgtgaa 540

aatggagacc gagattggtg caatgtgtcc acaagccagg gaatgccaac gtggccagca 600

accaccagaa gctgggagag aggcatggaa cagagtcctc ggagcctcca gaaggaacca 660

accctgttga taccttgact gaaaacttcc agcctccaga actgtgacag aattaatttc 720

tgttatttaa agccattcag tctgtggtaa tttgttacat cagccctgaa tagcaaatac 780

agatgaccca ggtttaaatc ctagttctgc cacttatgag cgtgggtaca taactacttt 840

ctagagcccc ggtttcctca tctgtaaaaa acctcatacg gttattaaga agatcaaatg 900

agatacaaac ataaattctt aacagtgctg gcatgttaat tgttcaataa atatgagtta 960

tttacaacaa ttgtgatagt aatgagtaac acagagaaat gagaattgac ttaacag 1017

<210> 10

<211> 818

<212> DNA

<213> 智人

<400> 10

tggtagtgaa taactctcac aagatctgat ggtttgataa ggggaaaccc gtttcacttg 60

gctttcattc tctcttgcag ccaccatgcc accttccacc atgattttga ggcctcccca 120

gacacgtgga cctagcaaca catgttctaa catgtgtgag actgactgcc tctcctctat 180

gaagagatgc cagtgacagc caggactggt gtaggctcta ttgagcatca cagtcatatg 240

tgagtgccca agagaagcta ttcactttct cagatgcggt ttgcagaggg aacttcacag 300

gctctctggg attgctcaca tttggcagct aaagtggaat caccaatcca aaatactcac 360

cccaggcgtg gggtcactcc cagtggcgga gatgccctgc atttccattg cctggactga 420

ggaacagatg aaaggggaac cacaccaggg tggtggcctg ggatgtgcct actccctaag 480

ccaagcttct ctgtcctgag tgggcttagg gtcccctgca gcgtgggtgt taaatgctgc 540

ttcctaggcc tcaccctcag agcttccagt tcagtcgagt ccaggtccct aacctgtcgt 600

cgtccaattg attttgatca ggtgccccat ggccccactt tgagaagcag atcgagtcca 660

cctgtgcatc ttccctgttg tccctaaaaa taaggctaaa aaaaggcacc agttcaaaaa 720

tccagtttat ttgtttgaag ttcaggttta cagttcctcc aattctcaga tcgcagaaga 780

agcatctgga aggaaatgac ccctgcaccc accacacc 818

<210> 11

<211> 531

<212> DNA

<213> 智人

<400> 11

actgacactt ttcggactca gcctgcctgc acccaggtga ttaaaagctt tattgctcac 60

acaaagcctg tttggtggtc tcttcacatg gatgcgcatg aaatttggtg cggtgactcg 120

gatcggggga cctcccttgg gagatcaatc ccctgtcctc ctgttctttg ctccgtgaga 180

aagagccacc tacgacctca ggtcctcaga ccaaccaggc caagaaacat ctcaccaatt 240

tcaaatccgc cactcccaga gcccctggaa ctctggccca aggctctctg actgactcct 300

tcccagatct tctcggctta gcggctgaag actgacactg ctcaatcacc ttggaagccc 360

cctagaccat cacggacgcc gagcttcagc aggagaagac aaggagatgg agagactgtc 420

aacctagaac cagtaatgac cagttccaac ttaattacag aaagggagaa aagatcaatc 480

atttaagttg cttcatcgtc taaataaaag tgttttggct gttgaaacat g 531

<210> 12

<211> 2119

<212> DNA

<213> 智人

<400> 12

ggacttagcc cacctgcacc caggggaaat aaacagcctt gttgctcaca caaagcctgt 60

ttggtggtct cttcacacgg acgtgtgtga caaggaacac cctccttgag cacaggggga 120

gggtgaatat cagaactgaa tctgacttct gacaacatag gagctgaagg gaccttggat 180

gttgggtaag cagttcccac tgtctgtcac aagccctaat aaaatacaag taagagaaaa 240

gaacaaaact ggggcaatct aatcaagaaa ggctttctgg aatgcatgag gccccagcga 300

gatctaaaat tcctagatgg acttggtgtt gtggaagcaa gacagcagtc gggcaaagga 360

gagacaggaa gcaaatgaat tctaccttgc caacaatggg aaacagacat acttaatgtg 420

agtagagagg tagccttggc caggaaagtt tgtttgaaga tcctggtctg tcttgacttt 480

aaatcacttg cctttggaat ggaagagaac agacatctca tcaaatgaac caatctgaat 540

gcaaggagca cccgaatcca tccccactca ggaatcctgg ttacagatgc taaaagatgt 600

ctttgacagt gaacagtggg tcataagatc tatttctgcc tcctgtctgt gactcactgg 660

atgactcaag gtgaatctct ccccatttct gagtatctgg cccccatcca tgaagaacag 720

aagatcacat cagtatttcc cttcggcaag gttggccccc gctgcagcaa ctgtgcaaag 780

accaccagac tgccctctct gccagcttac tcttcagcct ttctggctct ttctcccact 840

tccacatccc tgcttcattt ttctttttct ccttttgcaa atagcattgc tccaaagcaa 900

cccaggcacg tgtcttgggg acagcgctgc gagctacccc tgagctgtgg ggagcaggcc 960

caagattgtt tgctattagc aactcctgtt tgcaggataa ataaagcgaa cctgagtgca 1020

ggctcctgtg ggctgggaca ttttcattct gcagcaggtc agcttccatt ccactagggg 1080

gctttgaatg ttaataggca tttctttcca ggtacccttc tcctttctct acagtgcacc 1140

agtccctgtg ggaccttcca ttggcatcct acggagagat tattactctt ttcattgttt 1200

tccttacaaa ttagtttctg gatttaatgg ctttggttgc tgagcagatt ttggaaattg 1260

gggcagatgg tggggtgggg tgatctgcag agcccattat gggcactggg ttattgactg 1320

cttgggattt aaggtggaat taacgctttc ctgtttcttg gggaattttg cgatggggtt 1380

ggaccttctt ttcccttaga aggaattgtg tttgttgtta ttgcatgttt aagaagcttc 1440

tagaaattgt agctctggaa tacaataggt agagaatgca ggtttttaat gggatgtggg 1500

ggagtgttgc tcagttgtgg gaagatttgt aataatggtt gggactgggg atagagcgtt 1560

acctgaggac ggttttatta atgccacaaa gcataaagtt taaaaaaaaa gaaaaaagaa 1620

aatccagggg tgtcttactg tcagaagctt tggaaccatg ttgaataggt gctgggtaaa 1680

atgagactga gacctgctgg gctgcattcc caggaggtta gggattcgca gtcacagggt 1740

gtttacagtt aagggaacag gttaataatg tttaccaaac agacccagga cttaacagac 1800

ccaagaaatg tcttgatgtc ctgctatctt aagcacaaaa gcattctttg tttagtaata 1860

aattttgctt taaagatagt aatatagatt cttgcaaaag tcagtagtta cacaaggatt 1920

aacaatcctt tgtcatgagc ccttgtaata gaccacatcc ttttcatgat tttttgcctt 1980

gttatctcat atataaacat gcattgcacc taataaggtg ggcgccttac tcctcttgct 2040

ttcagaaatg ccctgctcag tccatggagc aaccattctt tcattccttt actttcttaa 2100

taaacttgct ttcacttta 2119

<210> 13

<211> 584

<212> DNA

<213> 智人

<400> 13

actgaaccag tatcattaaa gcttgaagtg ttgaaataag tggcctggga ctggcttcca 60

cggtgataaa agattcatct ggtagcacca gagtaaaaga agtctcacta aacactggcc 120

gggcagctgc tgctcggtgt gagcatcccg gggatgcaag cgtgggggag gcatcccttt 180

gtttcctgag tcctagaagc aggtccccga cgaggaacaa cgatgcctgg actcagcttc 240

agcctctgtt cttctaccgt tcagaagcca ccctccggca aggtgacccc ggctgctgga 300

tggggcaagc ccaggaattc tcggcttctg acacatgacg cattcatctt ctccgacagt 360

gttcccatgc acaacttgtg gttcgggttg gaaatgcaaa gtggaaaaat gcatagcagt 420

atcccctcct ccaaggcctc agtctctgtg ctcatattca ctgagactag tgacccccga 480

cttcccactc gccggcccct cctcctcccc ttccaacata atatgctgtt tacttattta 540

ttgtgttcat tttccgtctc acccaaatct attctagaaa aggt 584

<210> 14

<211> 1185

<212> DNA

<213> 智人

<400> 14

gtggaggcac tgggccacct cagagggcca gtgtcttgct gaggggccgg agcagtcctg 60

tgcctgcagc ctccggagcc atgggaacag ggctgcgaag tcagtccttg cgagagcccc 120

gaccctccta tggaaagctg caggagccct gggggaggcc ccaggagggc caactccgca 180

gggcgctaag cctcagacag gggcaagaga agtccaggtc ccagggcctc gagagaggca 240

cagaagggcc agatgccact gcccaggagc gggtgccggg gagcctgggg gacacagagc 300

agctgatcca agcccagcga agaggcagcc ggtggtggct gaggcggtac caacaggtaa 360

gaagaaggtg ggagagcttt gtcgccatct tccccagcgt gactctgagt cagccggcct 420

ccccgtagcc cacactgggc accatcagct aaagatgctg gaagccatcg tggccccctt 480

gctgtgcctg gaccagccca ccgtgtctgc tgacctacct cttcacagct ctctggactt 540

tggctgggtg gccctaggag gcttctgcca ccagctcact ggagtcgcca cgtggctgcc 600

actcttagct ctggcccttc cactccagca ctagctctct ttgaagatcc cagcagggtc 660

aaaaagaagg gggctcagct gtctgccctc tgggcttggg taggggcctt ggactatgat 720

tctatgaagg tttagaagaa gcctgcccgg aatgggggct gtggacgctc ctgccccaca 780

cgaccagctg tcaacttcca ggacggagct tgatgaagcc agacccatgg ccgagaggct 840

cacggacgtt gcctggtcac tgggccatga cccaactgcc cttcttgtca gttgctgatg 900

gtgggccagg gcgcaggtct ccctcccaga tggtgagccc tctggggcaa ggaccacagc 960

tgggtggccc tcctggctga gcactctgtg ctgaaaacct ttgaacctca cggtgtcctg 1020

atgaaggaag cagaggaagt cttcctccct gtgtgacaga gggggaaact gaggcccaga 1080

gtggggaagg gatttcttgg ttttgacatc tccgacccca ccccacccca tccagtgtcc 1140

agcactggag tcgaacacag taataaagat gctgagaaaa agtca 1185

<210> 15

<211> 1703

<212> DNA

<213> 智人

<400> 15

ggcaaggccc gacctgaagc actggctcca gccttaggga aggttttggc cgtgggtttt 60

gttggcacgt accattttgc tgaaagacag agcaccttga ggacgttatc cctaaaatga 120

gagaggactg ggattgaaag gctgactaca gaaatggctg ctgcccagac gccctcaaaa 180

gccaaggatc ctcagagttg gttataaaat atttaagggc gagaaaagga tcgcaggagc 240

caggccctga gatgagcttg gagtccctgt ttcagcacat catcttcacc gagcatcagg 300

cggaggagag tcgccgtttg atgcgagaag taaggtcgga aataaccaga tgtcgtgaaa 360

aaattaagaa agcaacggag gagctgaatg aagagaaaat caagctggaa tctaaggttc 420

aacagttttt tgaaaaatcc ttcttcttac agcttttgaa agctcatgaa aatgctttag 480

aaaaacagta cagtgaaatt acaaaccata ggaatatgct tcttcaaacc tttgaggcta 540

taaagaaaca aatgatagag gaggaagaca aatttattaa ggaaattaca gactttaata 600

atgattatga aataacaaag aaaagagagc ttttgatgaa agaaaatgtc aagattgaaa 660

tatctgactt agaaaaccaa gcaaacatgt tgaaaagtga aatgaagtca atggaacatg 720

atagtagcca gttaaatgaa cttcaaaaac aaaagagtga attgatacaa gaattattta 780

ctctccaaag aaaacttaaa gtttttgaag atgaagagaa tgaatccatt tgtactacca 840

aatatctaga ggcagaaaaa ataaaaatca gtgaaaagcc tcaaaatgat acagaatgct 900

taagacttaa aaaagaatta gaactttata aggaagatga catggaaagt gtttatgaag 960

ctctccaaac agaaatagaa tttttggagt tgacattggc acagaaagat cttcaggaaa 1020

gcaaataact tacagagaat tgatcagcca tctgagattt gatcagaata tctgagaatc 1080

aaatctttgt gatagatata tgaatggtac ccgttacaac ggatccttgt gggaaatatg 1140

gggtttaaaa tattcaaatt gttattatct agaaatgatg tgttagccct ttaagataat 1200

ttttgtcttg ttactcaaac tttaagagtt cttctgtggt ttgattttgt ttctaaaaga 1260

aggaaaagga gaagaagtag ataccgtgtt cccaggcttc ttatatgccc ctgaacctca 1320

agctgtccta ttctttctaa tctatataat atggtttgga tctgtgtcca tgcccaaatc 1380

tcatgttgaa ttgtgatccc cactgttgga ggtgggtcct gataggaggt gattgggtca 1440

tgggggtggg tttctcatga atagcttagc accattcttc ttggtactgt ccttgagttc 1500

tcctgagagc tagttgttta ctagtgtata gcacttctcc actttgctcc tgctgccacc 1560

gtatgagatg tctcactccc cctttgcctt cagtcatgat tggaaacttc ctgaggcctc 1620

cctagaagca gaagtcacta tgcttcctgt acagcctgca gaaccgtggg acaattaaac 1680

ttgtgttctt tgtaaattaa aaa 1703

<210> 16

<211> 1940

<212> DNA

<213> 智人

<400> 16

gttaatatta ctgcagcttg attacaaaag gcaatgatta attttaaagc agacaaaaaa 60

gatatgccct gattacaaag gaatgattaa ggcggaatgt cagacattgc acatttatag 120

cagtctttgc catcgtcaaa gtataagact ttgtaaaagt ttatatttag aatcacagtt 180

actttgtact ttataatatt cagtgtttgc gccttggata ccgggcaacc ctactccaac 240

tgggcctaag acctttgggg ttcacatgcc cagggcaaac ctgcccccca caggatggtc 300

ccaatgagcc gccgtagttt aagttctcac aggcaaggcc cgacctgaag cactggctcc 360

agccttaggg aaggttttgg ccgtgggttt tgttggcacg taccattttg ctgaaagaca 420

gagcaccttg aggacgttat ccctaaaatg agagaggact gggattgaaa ggctgactac 480

agaaatggct gctgcccaga cgccctcaaa agccaaggat cctcagagtt ggttataaaa 540

tatttaaggg cgagaaaagg atcgcaggag ccaggccctg agatgagctt ggagtccctg 600

tttcagcaca tcatcttcac cgagcatcag gcggaggaga gtcgccgttt gatgcgagaa 660

gtaaggtcgg aaataaccag atgtcgtgaa aaaattaaga aagcaacgga ggagctgaat 720

gaagagaaaa tcaagctgga atctaagctt ttgaaagctc atgaaaatgc tttagaaaaa 780

cagtacagtg aaattacaaa ccataggaat atgcttcttc aaacctttga ggctataaag 840

aaacaaatga tagaggagga agacaaattt attaaggaaa ttacagactt taataatgat 900

tatgaaataa caaagaaaag agagcttttg atgaaagaaa atgtcaagat tgaaatatct 960

gacttagaaa accaagcaaa catgttgaaa agtgaaatga agtcaatgga acatgatagt 1020

agccagttaa atgaacttca aaaacaaaag agtgaattga tacaagaatt atttactctc 1080

caaagaaaac ttaaagtttt tgaagatgaa gagaatgaat ccatttgtac taccaaatat 1140

ctagaggcag aaaaaataaa aatcagtgaa aagcctcaaa atgatacaga atgcttaaga 1200

cttaaaaaag aattagaact ttataaggaa gatgacatgg aaagtgttta tgaagctctc 1260

caaacagaaa tagaattttt ggagttgaca ttggcacaga aagatcttca ggaaagcaaa 1320

taacttacag agaattgatc agccatctga gatttgatca gaatatctga gaatcaaatc 1380

tttgtgatag atatatgaat ggtacccgtt acaacggatc cttgtgggaa atatggggtt 1440

taaaatattc aaattgttat tatctagaaa tgatgtgtta gccctttaag ataatttttg 1500

tcttgttact caaactttaa gagttcttct gtggtttgat tttgtttcta aaagaaggaa 1560

aaggagaaga agtagatacc gtgttcccag gcttcttata tgcccctgaa cctcaagctg 1620

tcctattctt tctaatctat ataatatggt ttggatctgt gtccatgccc aaatctcatg 1680

ttgaattgtg atccccactg ttggaggtgg gtcctgatag gaggtgattg ggtcatgggg 1740

gtgggtttct catgaatagc ttagcaccat tcttcttggt actgtccttg agttctcctg 1800

agagctagtt gtttactagt gtatagcact tctccacttt gctcctgctg ccaccgtatg 1860

agatgtctca ctcccccttt gccttcagtc atgattggaa acttcctgag gcctccctag 1920

aagcagaagt cactatgctt 1940

<210> 17

<211> 1420

<212> DNA

<213> 智人

<400> 17

aatattactg cagcttgatt acaaaaggca atgattaatt ttaaagcaga caaaaaagat 60

atgccctgat tacaaaggaa tgattaaggc ggaatgtcag acattgcaca tttatagcag 120

tctttgccat cgtcaaagta taagactttg taaaagttta tatttagaat cacagttact 180

ttgtacttta taatattcag tgtttgcgcc ttggataccg ggcaacccta ctccaactgg 240

gcctaagacc tttggggttc acatgcccag ggcaaacctg ccccccacag gatggtccca 300

atgagccgcc gtagtttaag ttctcacagg caaggcccga cctgaagcac tggctccagc 360

cttagggaag gttttggccg tgggttttgt tggcacgtac cattttgctg aaagacagag 420

caccttgagg acgttatccc taaaatgaga gaggactggg attgaaaggc tgactacaga 480

aatggctgct gcccagacgc cctcaaaagc caaggatcct cagagttggt tataaaatat 540

ttaagggcga gaaaaggatc gcaggagcca ggccctgaga tgagcttgga gtccctgttt 600

cagcacatca tcttcaccga gcatcaggcg gaggagagtc gccgtttgat gcgagaagta 660

aggtcggaaa taaccagatg tcgtgaaaaa attaagaaag caacggagga gctgaatgaa 720

gagaaaatca agctggaatc taaggttcaa cagttttttg aaaaatcctt cttcttacag 780

cttttgaaag ctcatgaaaa tgctttagaa aaacagtaca gtgaaattac aaaccatagg 840

aatatgcttc ttcaaacctt tgaggctata aagaaacaaa tgatagagga ggaagacaaa 900

tttattaagg aaattacaga ctttaataat gattatgaaa taacaaagaa aagagagctt 960

ttgatgaaag aaaatgtcaa gattgaaata tctgacttag aaaaccaagc aaacatgttg 1020

aaaagtgaaa tgaagtcaat ggaacatgat agtagccagt taaatgaact tcaaaaacaa 1080

aagagtgaat tgatacaaga attatttact ctccaaagaa aacttaaagt ttttgaagat 1140

gaagagaatg aatccatttg tactaccaaa tatctagagg cagaaaaaat aaaaatcagt 1200

gaaaagcctc aaaatgatac agaatgctta aggtaactaa aagggtgagt ggtcaccacc 1260

taattctgat aggcatgaga agtcatacag aacctgtagt ccatttgaag tgaagagatg 1320

gatgagcacg tgttgatgga atggtgggaa tatctctacc attttatttg aaaaataaat 1380

ttattaaaaa gaaggcttat gtacatttca atagcagcat 1420

<210> 18

<211> 1617

<212> DNA

<213> 智人

<400> 18

gaaaaacaaa cccagggagg gacggaggcc tgagtcaggg gttccgccag ggaaaaaggc 60

agaccttgaa actgccctct tagggcgtga gggagaaaag cccggatcct cagagttggt 120

tataaaatat ttaagggcga gaaaaggatc gcaggagcca ggccctgaga tgagcttgga 180

gtccctgttt cagcacatca tcttcaccga gcatcaggcg gaggagagtc gccgtttgat 240

gcgagaagta aggtcggaaa taaccagatg tcgtgaaaaa attaagaaag caacggagga 300

gctgaatgaa gagaaaatca agctggaatc taaggttcaa cagttttttg aaaaatcctt 360

cttcttacag cttttgaaag ctcatgaaaa tgctttagaa aaacagtaca gtgaaattac 420

aaaccatagg aatatgcttc ttcaaacctt tgaggctata aagaaacaaa tgatagagga 480

ggaagacaaa tttattaagg aaattacaga ctttaataat gattatgaaa taacaaagaa 540

aagagagctt ttgatgaaag aaaatgtcaa gattgaaata tctgacttag aaaaccaagc 600

aaacatgttg aaaagtgaaa tgaagtcaat ggaacatgat agtagccagt taaatgaact 660

tcaaaaacaa aagagtgaat tgatacaaga attatttact ctccaaagaa aacttaaagt 720

ttttgaagat gaagagaatg aatccatttg tactaccaaa tatctagagg cagaaaaaat 780

aaaaatcagt gaaaagcctc aaaatgatac agaatgctta agacttaaaa aagaattaga 840

actttataag gaagatgaca tggaaagtgt ttatgaagct ctccaaacag aaatagaatt 900

tttggagttg acattggcac agaaagatct tcaggaaagc aaataactta cagagaattg 960

atcagccatc tgagatttga tcagaatatc tgagaatcaa atctttgtga tagatatatg 1020

aatggtaccc gttacaacgg atccttgtgg gaaatatggg gtttaaaata ttcaaattgt 1080

tattatctag aaatgatgtg ttagcccttt aagataattt ttgtcttgtt actcaaactt 1140

taagagttct tctgtggttt gattttgttt ctaaaagaag gaaaaggaga agaagtagat 1200

accgtgttcc caggcttctt atatgcccct gaacctcaag ctgtcctatt ctttctaatc 1260

tatataatat ggtttggatc tgtgtccatg cccaaatctc atgttgaatt gtgatcccca 1320

ctgttggagg tgggtcctga taggaggtga ttgggtcatg ggggtgggtt tctcatgaat 1380

agcttagcac cattcttctt ggtactgtcc ttgagttctc ctgagagcta gttgtttact 1440

agtgtatagc acttctccac tttgctcctg ctgccaccgt atgagatgtc tcactccccc 1500

tttgccttca gtcatgattg gaaacttcct gaggcctccc tagaagcaga agtcactatg 1560

cttcctgtac agcctgcaga accgtgggac aattaaactt gtgttctttg taaatta 1617

<210> 19

<211> 660

<212> DNA

<213> 智人

<400> 19

gattaggcct ggtttgcgct ggagagtggt cttggttgtg agggtcataa gatgggaact 60

ctcccggcac gtagacatat cccgccgtgg gtgaaagttc ccgaagacct gaaagatcca 120

gaggtgttcc aggtccagac gcggctgctg aaagccattt tcggcccgga cggatctcga 180

atcccttaca tcgagcaggt gagcaaggcc atgctcgagc tgaaggctct ggagtcttca 240

gacctcaccg aggtcgtggt ttacggctcc tatttgtaca agctccggac caagtggatg 300

ctccagtcca tggctgagtg gcaccgccag cgccaggagc gagggatgct caaacttgcc 360

gaagccatga atgccctcga actaggccct tggatgaagt gaaccagttt ccagccaatg 420

caatgaagcc gggttgcaga gattaggttg tggccagagc tagagtgatt ccttaagctt 480

gttttaaaat ctgctccagc ctaaagagtt aagggaaaac catttgttcc cttaaagagt 540

taagggaaaa cccttggctc tgagtcttgt tgtgaatatt tctttgatga ttgttaataa 600

aaagtgtttt ttcttttttc ccatttttaa aaataacaat aaagttttaa ataagttgat 660

<210> 20

<211> 3178

<212> DNA

<213> 智人

<400> 20

atggccacct actgcgacga cctgggcccc tcctcggccc cgcccggcca ggcccaggcc 60

accgcgcacc ccccgggcta tgagccaggg gatctgggcg cggtgggcgg gggccccctc 120

ctgtgggtga acgcgccagc gctcagcccc aagtcctacg cttcgggtcc cgggcctgcg 180

ccgccctacg cggccccgag ctacggggct cccggcccgc tcctcggcgc cccgggcggc 240

ctggcgggcg ccgacctcgc ctggctgagc ctctccggcc agcaggagct gctgaggctg 300

gtgcggccgc cctactccta ctcggcgctc atcgccatgg ccatccagag cgcgccgctg 360

cggaagctga cgctcagcca gatctaccag tacgtggctg gtaacttccc tttctacaag 420

cgcagcaagg cgggctggca gaactccatc cgccacaacc tgtcgctcaa cgactgcttc 480

aagaaggtgc cccgcgacga ggacgaccca ggtaaaggca attactggac cctggacccc 540

aactgcgaga agatgtttga caacgggaac ttccgaagga agaggaagag gagagctgaa 600

gccagcgcgg ccgtgcgctc gggagccagg agcgtgggag gggccgaggc gccagcgctg 660

gagcccccga gcgcggcttg cctggacctg caggcctcgc cctctccatc cgcacccgag 720

gccgccacct gcttctccgg tttcgcttct gctatgagcg ctctggctgg cggccttggc 780

accttccccg ggggcctggc gggcgacttt tctttcggga ggcggccacc gacagtcgcc 840

acccacgctc cccagaccct taacccctcc cctggcttcg cccctggcca ccagaccgcg 900

gccgccggct tccgcctcag tcacctcctc tacagccggg aagggaccga agtttgaagg 960

gaggctggag gctagccggg tgcgggtcca gaggtgctga gctcaggcct ccggtttccc 1020

ctggtgacag ccccacgtgt tggcgttgaa ggccttggtg ccctgggagg aagcgcagag 1080

ccgggggcgg ctcggccagc agggagctgg gctgagcggc tcttgggctt tggggtgggt 1140

ggcccttctg ctgtgcaccc ctcacccagg cgaccttcgg aacctccctg ctctgcctct 1200

aagtccagcc gccctgggcg tctagaacct gtgctctcga gggatttgcc ttgaaggggc 1260

ggcgggtcgg ccctcagctc cagcgttttc caaggaggct ggctgactcc aaagagcctt 1320

agagcagatg ggaagaaggt gggctgccag agcggcccag gtggtggggg ccctttccac 1380

ctccacccag cttggcccac ctggctcagg gccttccctt ctgcttcagg gaagctgccg 1440

caggggctgg gggacagagc tcaggagcag ctgcagtggg ctccaggtgg gccaggagcc 1500

tgcagtgagg ggatctgaga cagttggcat tgggtcctgt gtaaggaagg tcttgctaat 1560

ggttggaact gctggtggtg ggagggagaa gcactgcgtg ggcagaaagc gcccttggga 1620

taccagctcc cttccctgtc actcagccct ggtccttgat gacccccctc taggacaagg 1680

caactcccca gggccccgcc accactgacc acaggagcgg tgcccagcac ccaggagttc 1740

cccaagggtc caggtttgtg ccacccacac ccacactcac acccacactc acacccacac 1800

tcacacccac acccacaccc acacccacac tcacactcac actcacaccc acactcacac 1860

ccacactcac acccacaccc acacccacac tcacacacac tcacacccac acccacactc 1920

acacccacac acactcacac ccacacacac ccacactcat actcacactc acacccacac 1980

tcacaccaca cccacactca cactgacacc cacactcaca cccacactca cactgacacc 2040

cacactcaca cccacactca tactcacact cacacccaca ctcacactca cacccacact 2100

cacaccacac tcacacccac acacacccac actcatactc acacccacac ccacactcat 2160

actcacacac ccacacccac acccacaccc acacccacac ccacacccac actcacacag 2220

gctcatggaa ggccacactt gttttggtct ctttcccctc caaacccaca gtttgagcca 2280

aagctgtgcg tgtgttcaga gctcctgaac agcagcctcc tgtgtaaatt gaaccctgcc 2340

ccacccagtt ccttcttagg gatggtatct ttgtgaagga caaggagccc ccagtcactg 2400

ggaagaggaa ttttttggcc tctgtactcc ttagaggacc taagtgcccc agtcagatgc 2460

cctgagtctt tgtggcatct gggactccct ggagatggag acgttggtgg ggggggggta 2520

cccaccttgt tgttgatggg ggtacctatc ttccctgcat tttgggggag ggtgggaggg 2580

gtccttccca ggaagagagt ggagacaggt tactgttact ttggagtggg acaggctggt 2640

ttagcaatcc taagccccag ccacgcaggt attcctgatc tgcctgcagg gcccctcact 2700

gcagctgcca ccagtgctgg aaatgagagc agggctcctg actgtcccta gagctgactc 2760

atcatggccc tgctgaagag tgaggtgtgt gtgtgtgtgt gcgtgtgtgc gtaagacaga 2820

gagggaggga gaaggaagga ggcgggggaa catggagaga aggagccagg agttgggata 2880

aacctggccc tggtcatatg tttcatcagc agtggctcct aactccacgt gccatctctg 2940

ctgctgccct ccacaagcag gtgagcagag tgccagttgt gttgaaggtg atgatgtcgc 3000

ctaactaaac tcacaaccaa cccgcaatct ctcttggggg gacactcccc ataagcaata 3060

caattaaaga agaccaggaa aggaaaataa attccttagc ttatacattt aaaaagtatc 3120

ccttgaacct attttaatag aatgaaatgc taaaaataaa gaccaatata acatacat 3178

<210> 21

<211> 1319

<212> DNA

<213> 智人

<400> 21

ctccacaccg ccttgcaagc tgagggagcc ggctccggcc tctgccagcc caggaagggg 60

ctcccacagt gcagcggcgg gctgaaggac tcctcaagtg ccaccaaagt gggagcccag 120

gcagaggagg cgccgagagc gagcgagggc tgcctgccag cacgctgtca cgtctcagca 180

atagactgct cttgaggctg gagtgcaatg ttgttatcat agctcactgc aacctggaac 240

ccctagtctc aagagatcct ccagcctcag cctccctggg atggctattt ttgttacttc 300

tgaattctac tacaaaagag tgctgcaata aaaatctttg aacaagttct aatgccgttc 360

aactggaatt gaagttttca atcgttggat atgtcaaaat ttaatcagat tgtatattgc 420

tcaattactt tcaaattatg tacaccaagt cattcttgct ctggcaaaat aagaatattt 480

tcattaatat atcattcaac ttgaaattgc ccagcttttc cttctcattt ccccccagtc 540

aaatgagttg aattaatact gtctaaaaat atatattcat ttgcttacct gttagtattt 600

gttccatgta ttaagaagct ttgctagtat atgaaaatat atgtattacc atgtcttgtg 660

aattagtact tttatcattt tgaaatgttt gttttcattt ctgctgaccg ttctaacctg 720

ggtatctatt ttgactggtt tttaatgtaa ctactaacat ctttttatgt tcagcacttt 780

ttcacaattt tactttcaat gtctttattt ttaaaatgta tcttctgtag acagtgtaca 840

ggtggtcttg ttttattgta aatcaagtga caatctctat ttcataattg acatatttaa 900

tccatatata tttaatttaa ttgttgttat tttgagactt aatatccagt tttactattt 960

tggcccattt atttttggtt tattttagat gtcttgcctt atcttagatt gattgatatt 1020

tttagtattt aattacattt cttttataaa tgtaatttct tgaatatttg tttttatttt 1080

agcaattgct ctgggaatat aaaaatcatc tttaaaatct atttagagtt aatggtacta 1140

ctttatgcag taggtaaaaa catttcacta gcacaatttc atttgcaggc acctaacctt 1200

ctgtgatagt attgtcttat attgttatat ttatgagata caatcactac agtaaaatac 1260

tattttctat tcattgtgcc atcttataaa taaacagatg aataaacaga tatttttga 1319

<210> 22

<211> 670

<212> DNA

<213> 智人

<400> 22

ctccacaccg ccttgcaagc tgagggagcc ggctccggcc tctgccagcc caggaagggg 60

ctcccacagt gcagcggcgg gctgaaggac tcctcaagtg ccaccaaagt gggagcccag 120

gcagaggagg cgccgagagc gagcgagggc tgcctgccag cacgctgtca cgtctcagca 180

atagactgct cttgaggctg gagtgcaatg ttgttatcat agctcactgc aacctggaac 240

ccctagtctc aagagatcct ccagcctcag cctccctgtt ccaggataca tgtgcaggat 300

gtgcaagttt gctacatggg taaatatgtg ccatggcagt ttgctgcatc tattaaccca 360

ttacctaggt attaagcccg atacaagagt tatggaaaag ctgcactctt ctacttccaa 420

agtttaactt cttcacagaa gtcagtttca gagttgagaa aagcaaatac ttgctacata 480

ttttgaggaa caataagtat tgaagttgca aacaggttct atggatattt gtcaacagaa 540

gatagctgat cacaaatgcg cagagaggta gaaaaatgac acaatgacca ccctaccctc 600

tgagtcagca aattgttttc tcagtacatt tctactctgg tccttgttta ataaaacctc 660

tttctcctta 670

<210> 23

<211> 540

<212> DNA

<213> 智人

<400> 23

ctccacaccg ccttgcaagc tgagggagcc ggctccggcc tctgccagcc caggaagggg 60

ctcccacagt gcagcggcgg gctgaaggac tcctcaagtg ccaccaaagt gggagcccag 120

gcagaggagg cgccgagagc gagcgagggc tgcctgccag cacgctgtca cgtctcagca 180

atagactgct cttgaggctg gagtgcaatg ttgttatcat agctcactgc aacctggaac 240

ccctagtctc aagagatcct ccagcctcag cctccctgtt ccaggataca tgtgcaggat 300

gtgcaagttt gctacatggg taaatatgtg ccatggcagt ttgctgcatc tattaaccca 360

ttacctaggt attaagcccg gaaataagaa tggcagaaat gtgaagagtt attgtgtggg 420

gaagtggcct ctacatagaa atgtttttcc actgaatgtt cctgttgtgc tgatgaacaa 480

aggagttcat cacaggccag aaactaagat agatagataa ataaataaat aaataaataa 540

<210> 24

<211> 195

<212> DNA

<213> 智人

<400> 24

ctgccaccca ggctagagtg caatggcatg accatagctc actgctacct caaacacctg 60

ggctcaagtg atccccctgc ctcagcctct caattccagg atacatgtgc aggatgtgca 120

agtttgctac atgggtaaat atgtgccatg gcagtttgct gcatctatta acccattacc 180

taggtattaa gcccg 195

<210> 25

<211> 2716

<212> DNA

<213> 智人

<400> 25

gtgagggaat tccgtgtgtg ggaaccgtgg ggaggagctg ccaggattca ggagtttcct 60

gggtgaggcg tggccacaac ggacactcct gctttgtact agaaggaaga agtatggagt 120

taaagactgc agcgtgaact gaggagtccc ggacaggccg cttgctgcag aggatccagt 180

ccagatccca ggagagcccc tctgcccctt cggacctcgt ctcccatcta caaaacgtga 240

agattggccc agttagcgtg tctctacaaa aaggtgcata taccactgcc ccgctgcagg 300

ctgatctgag aaagcctctg gcccagggca gataccgcca tggccttcct gatgcacctg 360

ctggtctgcg tcttcggaat gggctcctgg gtgaccatca atgggctctg ggtagagctg 420

cccctgctgg tgatggagct gcccgagggc tggtacctgc cctcctacct cacggtggtc 480

atccagctgg ccaacatcgg gcccctcctg gtcaccctgc tccatcactt ccggcccagc 540

tgcctttccg aagtgcccat catcttcacc ctgctgggcg tgggaaccgt cacctgcatc 600

atctttgcct tcctctggaa tatgacctcc tgggtgctgg acggccacca cagcatcgcc 660

ttcttggtcc tcaccttctt cctggccctg gtggactgca cctcttcagt gaccttcctg 720

ccgttcatga gccggctgcc cacctactac ctcaccacct tctttgtggg tgaaggactc 780

agcggcctct tgcccgccct ggtggctctt gcccagggct ccggtctcac tacctgcgtc 840

aatgtcactg agatatcaga cagcgtacca agccctgtac ccacgaggga gactgacatc 900

gcacagggag ttcccagagc tttggtgtcc gccctccccg gaatggaagc acccttgtcc 960

cacctggaga gccgctacct tcccgcccac ttctcacccc tggtcttctt cctcctccta 1020

tccatcatga tggcctgctg cctcgtggcg ttctttgtcc tccagcgtca acccaggtgc 1080

tgggaggctt ccgtggaaga cctcctcaat gaccaggtca ccctccactc catccggccg 1140

cgggaagaga atgacttggg ccctgcaggc acggtggaca gcagccaggg ccaggggtat 1200

ctagaggaga aagcagcccc ctgctgcccg gcgcacctgg ccttcatcta taccctggtg 1260

gccttcgtca acgcgctcac caacggcatg ctgccctctg tgcagaccta ctcctgcctg 1320

tcctatgggc cagttgccta ccacctggct gccaccctca gcattgtggc caaccctctt 1380

gcctcgttgg tctccatgtt cctgcctaac aggtctctgc tgttcctggg ggtcctctcc 1440

gtgcttggga cctgctttgg gggctacaac atggccatgg cggtgatgag cccctgcccc 1500

ctcttgcagg gccactgggg tggggaagtc ctcattgtgg cctcgtgggt gcttttcagc 1560

ggctgcctca gttacgtcaa ggtgatgctg ggcgtggtcc tgcgcgacct cagccgcagc 1620

gccctcttgt ggtgcggggc ggcggtgcag ctgggctcgc tgctcggagc gctgctcatg 1680

ttccctctgg tcaacgtgct gcggctcttc tcgtccgcgg acttctgcaa tctgcactgt 1740

ccagcctagg caggccgccg accccgcccc catcgctcac ggacggaact ggggtccaga 1800

gaggccaggt cacagagcaa ggggcaggaa cagagagaca gagcctgagt aattgaatca 1860

tgaacgcaag tgcccactgg ggactgtggg gaagatggca cctggaaatg caaggtgcgg 1920

ctctatcccc aactctgtgt cacactacct gtgacgacca gctcagatct cctttgcttt 1980

gactctcaag agaggactga tttgcagcat ctagctggag gcaggcccaa gggtgttaga 2040

agggaaacag ctgggacagc cggctgtccc ttcaggctgt gtgaccttgg gaaagtcatt 2100

tggcttctct gtgcctgttt cttcatgcat gcagtgggga ttccagtaag taccaactac 2160

ctcacaggca tggcacggag gcaaaaggaa aaagcagccc gcatcaagca agccctcctg 2220

ggccacctgc tgatctgaca gtccatcgta gtaacaagag tggcagtctg cacaacctag 2280

aagtggccag aagggttgag acacgcccct gccctctctc ctttgcccct cagtctcaca 2340

gaggggcttc tacaagacaa gcagataacg atagaatctt gggcatcttg gctttcggat 2400

tctcagtgtg gagggacgta gtaccccaca caccccttcc tgtcatcctt cctggcccat 2460

aaagcccact agttggagag taagtaccct cctggaagcc gggagagatg atttgctggt 2520

ggggctgggg aaggcccatc cctgagcctc tgaaagtgaa ctccccgacc aggttgggga 2580

ccagacatgc agagcccctg gaagtattct ctcaaatgga ggcaacagag gtgattgtta 2640

ttttgtttta gtttctgttt ttcatttttt taaataaagg cattccctgc ttttaaaaaa 2700

aaaaaaaaaa aaaaaa 2716

<210> 26

<211> 2624

<212> DNA

<213> 智人

<400> 26

atgcagagcg gctggggaac tggaccagca gaaggaagaa gtatggagtt aaagactgca 60

gcgtgaactg aggagtcccg gacaggccgc ttgctgcaga ggatccagtc cagatcccag 120

gagagcccct ctgccccttc ggacctcgtc tcccatctac aaaacgtgaa gattggccca 180

gttagcgtgt ctctacaaaa aggtgcatat accactgccc cgctgcaggc tgatctgaga 240

aagcctctgg cccagggcag ataccgccat ggccttcctg atgcacctgc tggtctgcgt 300

cttcggaatg ggctcctggg tgaccatcaa tgggctctgg gtagagctgc ccctgctggt 360

gatggagctg cccgagggct ggtacctgcc ctcctacctc acggtggtca tccagctggc 420

caacatcggg cccctcctgg tcaccctgct ccatcacttc cggcccagct gcctttccga 480

agtgcccatc atcttcaccc tgctgggcgt gggaaccgtc acctgcatca tctttgcctt 540

cctctggaat atgacctcct gggtgctgga cggccaccac agcatcgcct tcttggtcct 600

caccttcttc ctggccctgg tggactgcac ctcttcagtg accttcctgc cgttcatgag 660

ccggctgccc acctactacc tcaccacctt ctttgtgggt gaaggactca gcggcctctt 720

gcccgccctg gtggctcttg cccagggctc cggtctcact acctgcgtca atgtcactga 780

gatatcagac agcgtaccaa gccctgtacc cacgagggag actgacatcg cacagggagt 840

tcccagagct ttggtgtccg ccctccccgg aatggaagca cccttgtccc acctggagag 900

ccgctacctt cccgcccact tctcacccct ggtcttcttc ctcctcctat ccatcatgat 960

ggcctgctgc ctcgtggcgt tctttgtcct ccagcgtcaa cccaggtgct gggaggcttc 1020

cgtggaagac ctcctcaatg accaggtcac cctccactcc atccggccgc gggaagagaa 1080

tgacttgggc cctgcaggca cggtggacag cagccagggc caggggtatc tagaggagaa 1140

agcagccccc tgctgcccgg cgcacctggc cttcatctat accctggtgg ccttcgtcaa 1200

cgcgctcacc aacggcatgc tgccctctgt gcagacctac tcctgcctgt cctatgggcc 1260

agttgcctac cacctggctg ccaccctcag cattgtggcc aaccctcttg cctcgttggt 1320

ctccatgttc ctgcctaaca ggtctctgct gttcctgggg gtcctctccg tgcttgggac 1380

ctgctttggg ggctacaaca tggccatggc ggtgatgagc ccctgccccc tcttgcaggg 1440

ccactggggt ggggaagtcc tcattgtggc ctcgtgggtg cttttcagcg gctgcctcag 1500

ttacgtcaag gtgatgctgg gcgtggtcct gcgcgacctc agccgcagcg ccctcttgtg 1560

gtgcggggcg gcggtgcagc tgggctcgct gctcggagcg ctgctcatgt tccctctggt 1620

caacgtgctg cggctcttct cgtccgcgga cttctgcaat ctgcactgtc cagcctaggc 1680

aggccgccga ccccgccccc atcgctcacg gacggaactg gggtccagag aggccaggtc 1740

acagagcaag gggcaggaac agagagacag agcctgagta attgaatcat gaacgcaagt 1800

gcccactggg gactgtgggg aagatggcac ctggaaatgc aaggtgcggc tctatcccca 1860

actctgtgtc acactacctg tgacgaccag ctcagatctc ctttgctttg actctcaaga 1920

gaggactgat ttgcagcatc tagctggagg caggcccaag ggtgttagaa gggaaacagc 1980

tgggacagcc ggctgtccct tcaggctgtg tgaccttggg aaagtcattt ggcttctctg 2040

tgcctgtttc ttcatgcatg cagtggggat tccagtaagt accaactacc tcacaggcat 2100

ggcacggagg caaaaggaaa aagcagcccg catcaagcaa gccctcctgg gccacctgct 2160

gatctgacag tccatcgtag taacaagagt ggcagtctgc acaacctaga agtggccaga 2220

agggttgaga cacgcccctg ccctctctcc tttgcccctc agtctcacag aggggcttct 2280

acaagacaag cagataacga tagaatcttg ggcatcttgg ctttcggatt ctcagtgtgg 2340

agggacgtag taccccacac accccttcct gtcatccttc ctggcccata aagcccacta 2400

gttggagagt aagtaccctc ctggaagccg ggagagatga tttgctggtg gggctgggga 2460

aggcccatcc ctgagcctct gaaagtgaac tccccgacca ggttggggac cagacatgca 2520

gagcccctgg aagtattctc tcaaatggag gcaacagagg tgattgttat tttgttttag 2580

tttctgtttt tcattttttt aaataaaggc attccctgct ttta 2624

<210> 27

<211> 3133

<212> DNA

<213> 智人

<400> 27

atgcagagcg gctggggaac tggaccagca gaaggaagaa gtatggagtt aaagactgca 60

gcgtgaactg aggagtcccg gacaggccgc ttgctgcaga ggatccagtc cagatcccag 120

gagagcccct ctgccccttc ggacctcgtc tcccatctac aaaacgtgaa gattggccca 180

gttagcgtgt ctctacaaaa aggtgcatat accactgaag ctgctttgtt tgcttttgtg 240

tgtcggattg aacttttctt tcatgaatca cggttaggaa aggcttctct tgttttctgc 300

taataaaaag acagcttggg ccaggcgtgg tggctcacac tgtaatccca gcactttggg 360

aggccgaggc aggcggatca cctgaggcca ggagttcgag accagcctga ccaacgtggg 420

gaaaccctgt ttccactaaa aatacaaaat tagctggcat ggtggcatgc acctgtaatc 480

ccagctattt gggaaactga ggcaggagaa tcacttgagc ccaggaggca gagggtcact 540

gagccgagat catcccattg cactccagcc tggactaaaa gagtgaaact atgtctcaaa 600

ggaaaaaaaa aaaagccagc ttgttcacag gaaggggagt aataagagaa aactctgggc 660

cccaggtccc agcatcttgc taggtggtga agctggaatt actcacctgg tgtccttctc 720

tgccagcccc gctgcaggct gatctgagaa agcctctggc ccagggcaga taccgccatg 780

gccttcctga tgcacctgct ggtctgcgtc ttcggaatgg gctcctgggt gaccatcaat 840

gggctctggg tagagctgcc cctgctggtg atggagctgc ccgagggctg gtacctgccc 900

tcctacctca cggtggtcat ccagctggcc aacatcgggc ccctcctggt caccctgctc 960

catcacttcc ggcccagctg cctttccgaa gtgcccatca tcttcaccct gctgggcgtg 1020

ggaaccgtca cctgcatcat ctttgccttc ctctggaata tgacctcctg ggtgctggac 1080

ggccaccaca gcatcgcctt cttggtcctc accttcttcc tggccctggt ggactgcacc 1140

tcttcagtga ccttcctgcc gttcatgagc cggctgccca cctactacct caccaccttc 1200

tttgtgggtg aaggactcag cggcctcttg cccgccctgg tggctcttgc ccagggctcc 1260

ggtctcacta cctgcgtcaa tgtcactgag atatcagaca gcgtaccaag ccctgtaccc 1320

acgagggaga ctgacatcgc acagggagtt cccagagctt tggtgtccgc cctccccgga 1380

atggaagcac ccttgtccca cctggagagc cgctaccttc ccgcccactt ctcacccctg 1440

gtcttcttcc tcctcctatc catcatgatg gcctgctgcc tcgtggcgtt ctttgtcctc 1500

cagcgtcaac ccaggtgctg ggaggcttcc gtggaagacc tcctcaatga ccaggtcacc 1560

ctccactcca tccggccgcg ggaagagaat gacttgggcc ctgcaggcac ggtggacagc 1620

agccagggcc aggggtatct agaggagaaa gcagccccct gctgcccggc gcacctggcc 1680

ttcatctata ccctggtggc cttcgtcaac gcgctcacca acggcatgct gccctctgtg 1740

cagacctact cctgcctgtc ctatgggcca gttgcctacc acctggctgc caccctcagc 1800

attgtggcca accctcttgc ctcgttggtc tccatgttcc tgcctaacag gtctctgctg 1860

ttcctggggg tcctctccgt gcttgggacc tgctttgggg gctacaacat ggccatggcg 1920

gtgatgagcc cctgccccct cttgcagggc cactggggtg gggaagtcct cattgtggcc 1980

tcgtgggtgc ttttcagcgg ctgcctcagt tacgtcaagg tgatgctggg cgtggtcctg 2040

cgcgacctca gccgcagcgc cctcttgtgg tgcggggcgg cggtgcagct gggctcgctg 2100

ctcggagcgc tgctcatgtt ccctctggtc aacgtgctgc ggctcttctc gtccgcggac 2160

ttctgcaatc tgcactgtcc agcctaggca ggccgccgac cccgccccca tcgctcacgg 2220

acggaactgg ggtccagaga ggccaggtca cagagcaagg ggcaggaaca gagagacaga 2280

gcctgagtaa ttgaatcatg aacgcaagtg cccactgggg actgtgggga agatggcacc 2340

tggaaatgca aggtgcggct ctatccccaa ctctgtgtca cactacctgt gacgaccagc 2400

tcagatctcc tttgctttga ctctcaagag aggactgatt tgcagcatct agctggaggc 2460

aggcccaagg gtgttagaag ggaaacagct gggacagccg gctgtccctt caggctgtgt 2520

gaccttggga aagtcatttg gcttctctgt gcctgtttct tcatgcatgc agtggggatt 2580

ccagtaagta ccaactacct cacaggcatg gcacggaggc aaaaggaaaa agcagcccgc 2640

atcaagcaag ccctcctggg ccacctgctg atctgacagt ccatcgtagt aacaagagtg 2700

gcagtctgca caacctagaa gtggccagaa gggttgagac acgcccctgc cctctctcct 2760

ttgcccctca gtctcacaga ggggcttcta caagacaagc agataacgat agaatcttgg 2820

gcatcttggc tttcggattc tcagtgtgga gggacgtagt accccacaca ccccttcctg 2880

tcatccttcc tggcccataa agcccactag ttggagagta agtaccctcc tggaagccgg 2940

gagagatgat ttgctggtgg ggctggggaa ggcccatccc tgagcctctg aaagtgaact 3000

ccccgaccag gttggggacc agacatgcag agcccctgga agtattctct caaatggagg 3060

caacagaggt gattgttatt ttgttttagt ttctgttttt cattttttta aataaaggca 3120

ttccctgctt tta 3133

<210> 28

<211> 1172

<212> DNA

<213> 智人

<400> 28

tggaaagcta cacgtgtgag cctagaggcg ggtcccggtt gcagacttgc catggcctcc 60

gaagcttctg tgcgtctagg ggtgccccct ggccgtctgt ggatccagag gcctggcatc 120

tacgaagatg aggaggggag aacctgggtg actgtggtcg tgcggttcaa tccctcgcgt 180

agggaatggg ccagggcctc ccagggcagc agatatgaac ccagcatcac agtgcacttg 240

tggcagatgg cagtgcatac ccgggagcta ctctcctccg gccagatgcc cttctcccag 300

ctgcccgccg tgtggcagct ctaccccggg aggaagtacc gagcagcgga ttccagtttc 360

tgggaaatag cagaccatgg ccagattgac tctatggagc agctggtcct aacatatcag 420

ccggagagga aagactgaca ctgggagtgg ctggccctgc tggccctgcc tcttctggcc 480

tggtgtctcc tcatgccccc tcagtgagga tcttcatgta cctgctcttc tgtttgcaca 540

cccagcatag cctccttgca ggcagaaggc agtagggccc ctgcacactc agtttctctc 600

gttttcctta gttatcagtc ctgtcctgtc ccactcaggt ctgtacttag ggcagctggc 660

ctggatgggc ttcactgggg ccctgtctgt gtgctgagcc agtttcccct gctggctgca 720

agctgtgggt tctttctcct ctgtgcccct catgctgatc ttctagatgc cactcccaaa 780

tccccttcat acccaccagg atgtgtgccc agccaggcct ccagcacccc cagtgcagct 840

cgtgattgga aactcaccat cggcaggcag tggttcggtt taagagatgg cattagaggg 900

agcccagtct ggatgtggac ttggatgccc tgtgggtatc agttctgctg acactttggc 960

ccgaaataga tccagtgctg agcaagcaat gtacaccaga gcctcagtga gcccatctgc 1020

acagtgggga gcatggaggg atgggtttgg cctgtgcttc tgcttattca gtccttcagc 1080

tcacggaagg gatgctagtc cgtgaaggtg acctcacagt actggttaat taaactttat 1140

tgctcactgt ccacttttgt gctgaaaaaa aa 1172

Claims

1.一种检测多能干细胞的方法，所述方法包括：

(a)获取含有多个细胞的目的样本；

(c)当在所述目的样本中检测到所述至少一个标记基因的表达时，确定所述目的样本含有多能干细胞。

2.根据权利要求1所述的方法，其中目的样本包含诱导多能干细胞。

3.根据权利要求1所述的方法，其中目的样本包含胚胎多能干细胞。

4.根据权利要求1所述的方法，其中所述目的样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

5.根据权利要求1所述的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测所述至少一个标记基因的表达。

6.根据权利要求1所述的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测所述至少一个标记基因的表达。

7.根据权利要求5所述的方法，其中通过包括选自由以下技术组成的组中的方法中检测所述至少一个标记基因的表达：液滴数字聚合酶链式反应(dd-PCR)、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern blot分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

8.根据权利要求7所述的方法，其中所述技术包括微阵列分析或下一代测序。

9.一种检测多能干细胞的方法，所述方法包括：

(a)获取含有多个细胞的目的样本；

(b)测量所述目标样本中至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；

(c)将步骤(b)中检测到的表达水平与参考表达水平比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，并且其中所述至少一个参考样本基本上不含多能干细胞；以及

10.一种定量样本中多能干细胞数量的方法，所述方法包括：

(a)获取含有多个细胞的目的样本；

(c)将步骤(b)中检测到的表达水平与参考表达水平比较，所述参考表达水平是通过在至少一个参考样本中测量所述至少一个标记基因的表达水平获得的，其中所述至少一个参考样本包含多个细胞，其中所述至少一个参考样本包含多能干细胞；并且其中在所述至少一个参考样本中基本上所有的细胞都是多能干细胞；以及

11.根据权利要求9所述的方法，其中目的样本包含诱导多能干细胞。

12.根据权利要求9所述的方法，其中目的样本包含胚胎多能干细胞。

13.根据权利要求9所述的方法，其中所述目的样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

14.根据权利要求9所述的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

15.根据权利要求9所述的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

16.根据权利要求14所述的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern blot分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

17.根据权利要求10所述的方法，其中目的样本包含诱导多能干细胞。

18.根据权利要求10所述的方法，其中目的样本包含胚胎多能干细胞。

19.根据权利要求10所述的方法，其中所述目的样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

20.根据权利要求10所述的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

21.根据权利要求10所述的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

22.根据权利要求20所述的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

23.一种用于检测治疗产品中的残留iPSC的检测方法，所述检测方法包括：

24.根据权利要求23所述的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

25.根据权利要求23所述的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

26.根据权利要求23所述的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

27.根据权利要求25所述的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

28.一种用于定量治疗产品中残留iPSC数量的检测方法，所述检测方法包括：

29.根据权利要求28所述的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

30.根据权利要求28所述的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

31.根据权利要求28所述的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

32.根据权利要求30所述的检测方法，其中通过包括选自由以下技术组成的组中的方法中检至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

33.一种用于检测治疗产品中残留iPSC的检测方法，所述检测方法包括：

34.根据权利要求33所述的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

35.根据权利要求33所述的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

36.根据权利要求33所述的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

37.根据权利要求35所述的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

38.一种在不同分化时间下定量治疗产品中残留iPSC数量的检测方法，所述检测方法包括：

(c)测量在(a)和(b)中获得的样本中的至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；以及

39.根据权利要求38所述的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

40.根据权利要求38所述的检测方法，其中在步骤(c)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

41.根据权利要求38所述的检测方法，其中在步骤(c)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

42.根据权利要求40所述的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

43.一种测定分化产品纯度的检测方法，所述检测方法包括：

(a)获得分化产品的样本，所述样本含有多个细胞；

44.根据权利要求43所述的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

45.根据权利要求43所述的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

46.根据权利要求43所述的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

47.根据权利要求45所述的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

48.一种确定分化产品纯度的检测方法，所述检测方法包括：

(a)获得分化产品的样本，所述样本含有多个细胞；

49.根据权利要求48所述的检测方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

50.根据权利要求48所述的检测方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

51.根据权利要求48所述的检测方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

52.根据权利要求50所述的检测方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

53.一种评估iPSC群体分化能力的方法，所述方法包括：

(b)获得iPSC群体的至少一个额外样本，所述至少一个额外样本在诱导所述iPSCs分化后获得，所述至少一个额外样本含有多个细胞；

54.根据权利要求53所述的方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

55.根据权利要求53所述的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

56.根据权利要求53所述的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

57.根据权利要求55所述的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

58.一种评估iPSC群体多能性的方法，所述方法包括：

(a)获取iPSC群体的样本，所述样本含有多个细胞；

(d)根据步骤(c)的比较结果评估所述iPSC群体中iPSC的多能性。

59.根据权利要求58所述的方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

60.根据权利要求58所述的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

61.根据权利要求58所述的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

62.根据权利要求60所述的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

63.一种评估iPSC群体多能性的方法，所述方法包括：

(c)测量在(a)和(b)中获得的样本中的至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由从SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列；

64.根据权利要求63所述的方法，其中所述样本中的所述多个细胞以细胞混合物、细胞聚集体或组织的形式存在。

65.根据权利要求63所述的方法，其中在步骤(b)中，通过测量所述标记基因的mRNA表达水平检测至少一个标记基因的表达。

66.根据权利要求63所述的方法，其中在步骤(b)中，通过测量由所述标记基因编码的表达蛋白的水平检测至少一个标记基因的表达。

67.根据权利要求65所述的方法，其中通过包括选自由以下技术组成的组中的方法中检测至少一个标记基因的表达：dd-PCR、聚合酶链式反应(PCR)、逆转录酶PCR(RT-PCR)、定量PCR、定量RT-PCR、Northern印迹分析、差异基因表达、RNA保护试验、微阵列分析、杂交试验和下一代测序。

68.一种用于检测治疗产品中残留iPSC的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

69.根据权利要求68所述的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

70.一种用于检测治疗产品中残留iPSC的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包括核酸、探针或一个或多个引物。

71.一种用于定量治疗产品中iPSC数量的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NOs:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

72.根据权利要求71所述的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

73.一种用于定量治疗产品中iPSC数量的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

74.一种用于确定分化产品纯度的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

75.根据权利要求74所述的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

76.一种测定分化产品纯度的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

77.一种评估iPSC群体分化能力的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

78.根据权利要求77所述的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

79.一种用于评估iPSC群体分化能力的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。

80.一种用于评估iPSC群体多能性的检测试剂盒，所述检测试剂盒包含至少一种适用于特异性检测至少一个标记基因表达水平的试剂，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列。

81.根据权利要求80所述的检测试剂盒，其中所述试剂包含核酸、探针或一个或多个引物，能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因。

82.一种用于评估iPSC群体多能性的检测试剂，其中所述试剂能够特异性检测至少一个标记基因的表达水平，其中所述至少一个标记基因表达具有相应的互补DNA(cDNA)序列的转录物，包括与选自由SEQ ID NO:1-5组成的组中的核苷酸序列具有至少90％序列同一性的核苷酸序列，并且

其中所述试剂包含核酸、探针或一个或多个引物。