CN112708679B

CN112708679B - 检测人群微卫星不稳定性的生物标志物组及其应用

Info

Publication number: CN112708679B
Application number: CN202110114500.8A
Authority: CN
Inventors: 宋庆涛; 李有彩; 杨爽; 张吓妹; 洪燕女; 裴艳瑞; 阮力; 郑立谋
Original assignee: Amoy Diagnostics Co Ltd
Current assignee: Amoy Diagnostics Co Ltd
Priority date: 2021-01-27
Filing date: 2021-01-27
Publication date: 2023-01-24
Anticipated expiration: 2041-01-27
Also published as: CN112708679A; WO2022161272A1; JP2024504198A

Abstract

本发明公开了检测人群微卫星不稳定性的生物标志物组及其应用，包括以下标志物中的至少之二：第一至第二十二标志物。用本发明检测人群的MSI的检测准确度高，检测平台通用性高，检测成本低廉。

Description

检测人群微卫星不稳定性的生物标志物组及其应用

技术领域

本发明属于微卫星不稳定性检测技术领域，具体涉及检测人群微卫星不稳定性的生物标志物组及其应用。

背景技术

微卫星(Microsatellite，MS)也称为短串联重复序列(Short tandem repeat，STR)，是指人类基因组中以少数几个核苷酸(多为1～6个)为单位串联重复的DNA序列，其重复长度为5～50次，人类基因组中广泛分布着约50万个短串联重复序列。当短串联重复序列进行复制时，碱基高度重复导致的“链滑”(Strand slippage)使复制错误几率远远高于正常序列。在健康人体中，短串联重复序列发生的错配可被DNA错配修复(Mismatch repair，MMR)机制及时修复，短串联重复序列维持固定长度。当DNA错配修复功能出现异常时，短串联重复序列的复制错误得不到纠正并不断累积，使得重复长度或碱基组成发生改变，称为微卫星不稳定(Microsatellite instability，MSI)。

目前，MSI检测的金标准为PCR-毛细管电泳法检测5种微卫星标志物，检测时需使用一代测序仪进行扩增产物的分析，最早由美国国家癌症研究所(National cancerinstitute，NCI)提出。其panel包括2个单核苷酸重复标志物和3个二核苷酸重复标志物，2004年进行修订后使用单核苷酸重复标志物替代二核苷酸重复标志物，以改善检测的灵敏度与特异性。分析检测MSI结果时，2个或以上标志物发生微卫星不稳定时，为高度微卫星不稳定(Microsatellite instability-High，MSI-H)；只检测出1个标志物不稳定时，为低度微卫星不稳定(Microsatellite instability-Low，MSI-L)；没有标志物显示微卫星不稳定时，为微卫星稳定(Microsatellite stable，MSS)。金标准检测具有以下明显的缺点导致MSI检测普及存在困难：

1.检测每份样本时需同时检测待测样本与对照样本，提高了检测成本及工作量；

2.检测流程较长，需PCR扩增、扩增产物处理、一代测序仪片段分析检测、专用软件分析等，导致难以快速完成MSI检测；

3.仪器购买成本较高，此外，一代测序仪配套使用的试剂、耗材等也造成MSI检测成本较高；

4.检测平台通用性较差，常规检测中毛细管电泳法相关产品较少，各实验室毛细管电泳平台专业水平较薄弱；

5.由于扩增产物浓度较高，在检测过程种需多次开启扩增产物反应管，易导致污染等。

免疫组化(IHC)可用于MMR相关蛋白(MLH1、MSH2、MSH6、PMS2)的检测，检测时可对相应蛋白进行荧光标记，通过显微设备观察各个细胞中是否发生表达，进而分析是否发生MMR功能缺陷。当所有细胞中均可检出4种蛋白时，则为MMR表达正常(pMMR)；当细胞中存在一种或以上蛋白表达缺失时，则为MMR表达缺失(dMMR)。免疫组化可作为基础检测进行开展，但是由于不同检测试剂盒性能差异较大、检测灵敏度稍低、肉眼观察时对医师要求较高等原因，故免疫组化难以作为MSI检测的标准方案。

NGS可用于MSI标志物的检测，检测时对样本中的众多标志物进行文库制备，使用二代测序仪对文库进行测序，结合生信算法分析各标志物重复长度是否发生改变，进而判断MSI状态。NGS平台检测MSI正在不断成熟，但是由于测序试剂保真度无法继续提高、检测成本高、检测周期长、不同检测试剂盒检测算法差异较大等缺点，导致应用前景被限制。

以上三种检测MSI状态的方法均存在较明显缺陷，因此急需一种检测准确度高、检测平台通用、检测成本低廉、检测周期短的检测方法用于MSI状态的确认。

发明内容

本发明的目的在于克服现有技术缺陷，提供检测人群微卫星不稳定性的生物标志物组。

本发明的另一目的在于提供上述检测人群微卫星不稳定性的生物标志物组的应用。

本发明的技术方案如下：

检测人群微卫星不稳定性的生物标志物组，包括以下标志物中的至少之二：

第一标志物，包含12个连续A的同聚物重复，其定位在人EIF4E3基因并起始于chr3：71739332；

第二标志物，包含12个连续T的同聚物重复，其定位在人UBAC2基因并起始于chr13：99890849；

第三标志物，包含12个连续A的同聚物重复，其定位在人TAOK3基因并起始于chr12：118675984；

第四标志物，包含11个连续T的同聚物重复，其定位在人IFT140基因并起始于chr16：1612145；

第五标志物，包含11个连续T的同聚物重复，其定位在人PRR5-ARHGAP8基因并起始于chr22：45205158；

第六标志物，包含10个连续A的同聚物重复，其定位在人AVIL基因并起始于chr12：58202496；

第七标志物，包含8个连续A的同聚物重复，其定位在人ACVR2A基因并起始于chr2：148683685；

第八标志物，包含12个连续A的同聚物重复，其定位在人PPP1CC基因并起始于chr12：111160513；

第九标志物，包含12个连续T的同聚物重复，其定位在人RBM14-RBM4基因并起始于chr11：66410771；

第十标志物，包含11个连续T的同聚物重复，其定位在人SDHC基因并起始于chr1：161309335。

第十一标志物，包含12个连续A的同聚物重复，其定位在人PUM2基因并起始于chr2：20526998；

第十二标志物，包含12个连续T的同聚物重复，其定位在人DEC1基因并起始于chr9：118164375；

第十三标志物，包含12个连续A的同聚物重复，其定位在人COL11A1基因并起始于chr1：103468855；

第十四标志物，包含11个连续T的同聚物重复，其定位在人YTHDF3基因并起始于chr8：64081981；

第十五标志物，包含12个连续T的同聚物重复，其定位在人ACTL6A基因并起始于chr3：179291295；

第十六标志物，包含12个连续A的同聚物重复，其定位在人MCM3AP基因并起始于chr21：47703455；

第十七标志物，包含12个连续T的同聚物重复，其定位在人SPDL1基因并起始于chr5：169020337；

第十八标志物，包含12个连续T的同聚物重复，其定位在人SMARCA2基因并起始于chr9：2083325；

第十九标志物，包含12个连续A的同聚物重复，其定位在人PROSER1基因并起始于chr13：39608335；

第二十标志物，包含12个连续A的同聚物重复，其定位在人MZB1基因并起始于chr5：138723143。

第二十一标志物，包含12个连续T的同聚物重复，其定位在人ANKIB1基因并起始于chr7：92020452；

第二十二标志物，包含10个连续A的同聚物重复，其定位在人BRD4基因并起始于chr19：15366000。

在本发明的一个优选实施方中，由所述标志物中的至少之二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十、二十一或全部组成。

本发明的另一技术方案如下：

分析人群生物学样本中的微卫星不稳定性的方法，包括：确定以下标志物中的至少之二的同聚物重复的碱基数量：

在本发明的一个优选实施方中，确定所述标志物中的至少之二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十、二十一或全部的同聚物重复碱基数量及其突变形式。

在本发明的一个优选实施方中，还包括：扩增所述同聚物重复或其突变形式的区域。

进一步优选的，所述检测过程完成后生成熔解曲线数据。

进一步优选的，所述扩增包括使用分子信标探针。

更进一步优选的，对应于每一所述同聚物重复或其突变形式的区域，所述扩增还包括一限制性引物和一过量引物，该限制性引物与所述分子信标探针具有相同的方向，过量引物产生的单链模板可与所述分子信标探针进行互补配对，且过量引物的量大于限制性引物的量。

再进一步优选的，所述限制性引物与过量引物的比例为1∶3-20。

进一步优选的，所述扩增包括使用Light off/Light on探针对。

更进一步优选的，对应于每一所述同聚物重复或其突变形式的区域，所述扩增还包括一限制性引物和一过量引物，该限制性引物与所述Light off/Light on探针对具有相同的方向，过量引物产生的单链模板可与所述Light off/Light on探针对进行互补配对，且过量引物的量大于限制性引物的量。

进一步优选的，所述扩增的循环数为40-70个。

进一步优选的，进行所述扩增采用高保真DNA聚合酶。

本发明的再一技术方案如下：

分析人群生物学样本中的微卫星不稳定性的试剂盒，包括用于扩增以下标志物中的至少之二的引物对和探针：

在本发明的一个优选实施方案中，包括用于扩增所述标志物中的至少之二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十、二十一或全部的同聚物重复的碱基数量的引物对和探针。

在本发明的一个优选实施方案中，所述探针为分子信标探针。

进一步优选的，对应于每一所述同聚物重复，所述引物对由一限制性引物和一过量引物组成，该限制性引物与所述分子信标探针具有相同的方向，过量引物产生的单链模板可与所述分子信标探针进行互补配对，且过量引物的量大于限制性引物的量。

更进一步优选的，所述限制性引物与过量引物的比例为1∶3-20。

在本发明的一个优选实施方案中，所述探针为Light off/Light on探针对。

进一步优选的，对应于每一所述同聚物重复，所述引物对由一限制性引物和一过量引物组成，该限制性引物与所述Light off/Light on探针对具有相同的方向，过量引物产生的单链模板可与所述Light off/Light on探针对进行互补配对，且过量引物的量大于限制性引物的量。

在本发明的一个优选实施方案中，用所述引物对进行扩增的循环数为40-70个。

在本发明的一个优选实施方案中，用所述引物对进行扩增采用高保真DNA聚合酶。

本发明的有益效果是：

1、用本发明检测人群的MSI的检测准确度高，检测平台通用性高，检测成本低廉。

2、本发明检测的同聚物重复长度集中在7-14bp范围内，标志物可检测人群的MSI状态。

3、本发明可使用荧光PCR平台进行检测，相比一代测序、二代测序，仪器价格从百万左右降低至约15万。

4、本发明涉及的检测平台，降低了仪器和试剂的捆绑，提高了试剂盒检测的通用性，检测的判读无需软件算法，直接根据熔解峰的“有/无”进行判断，可快速进行肉眼判读。

5、本发明试剂盒在一台荧光PCR仪上，可2小时左右完成24-48个样本的检测，通量适中，检测时间快。

6、本发明使用熔解曲线进行检测，检测时使用荧光标记的探针，探针与突变型序列一致，突变型序列由NGS进行验证后确定，突变型序列为重复碱基变化1bp，也可能碱基变化2bp。

附图说明

图1为本发明实施例1中的MSI检测相关位点的来源及筛选流程。

图2为本发明实施例1中的MSS(negative)和MSI(positive)样本在标志物中的突变分布。

图3为本发明实施例2中的分子信标探针及Light-off/Light-on探针不同样本检测线形图。

图4为本发明实施例4中的标志物检测临床样本熔解曲线线形图。

具体实施方式

以下通过具体实施方式结合附图对本发明的技术方案进行进一步的说明和描述。

实施例1

本发明的生物标志物组来源于人群WGS、WES等测序数据，接图1的方案进行MS标志物的选择。

根据MSI阴、阳性样本中MS标志物上串联重复序列长度的差异，对MS标志物进行分析。根据NCBI、Ensembl、UCSC等人类基因组数据库数据作为参考序列，分析NGS测序数据中MS标志物的长度变化。收集人群结直肠癌样本WGS、WES的NGS测序数据，确定各个MS标志物的检测长度，通过比较MS标志物中参考序列与检测序列的重复长度变化，确定各个标志物在结直肠癌患者中组织样本的变化。其中，MSI样本中MS标志物应发生长度变化，且长度减短或加长的突变丰度应较高；MSS样本中MS标志物应与参考序列的重复长度一致。

通过建立训练集与测试集，验证选择位点在不同分组样本中的灵敏度及特异性，对MS标志物的灵敏度与特异性数据使用SPASS软件计算各个MS标志物的AUC，AUC越接近于1.0时表明标志物区分MSI及MSS样本能力越强。选择出的标志物见下表1：

表1 测序数据分析后选择的MS标志物信息

使用“金标准”PCR-毛细管电泳法检测临床样本，确定各个样本的MSI状态，作为NGS位点筛选的标准结果。对测序数据分析后选择的标志物设计oligo，对金标准确定MSI状态的临床样本分别进行建库，并进行NGS测序，经生信分析确定各个标志物中MSI及MSS样本的重复长度，根据NCBI、Ensembl、UCSC等人类基因组数据库数据作为标准参考序列，分析各个标志物在MSI样本中的检测灵敏度，分析各个标志物在MSS样本中的检出特异性。对标志物突变型序列的阴阳性进行分析作图，分析结果如图2所示。使用SPASS等软件分析各个标志物在MSI及MSS样本中的检测结果，较多标志物可有效区分MSI及MSS样本。各标志物检测MSS及MSI样本AUC信息如下表2所示：

表2 NGS筛选出的标志物区分MSI及MSS样本的AUC信息

分析结果表明，验证的22个标志物分别检测MSS及MSI样本时具有优异的区分度，其AUC值均大于0.95，可特异性区分阴阳性样本。

实施例2

本实施例针对荧光PCR熔解曲线法对实施例1获得的各MS标志物进行检测，熔解曲线检测时使用荧光探针进行分析。检测标志物序列见下划线序列，各标志物序列如下：

1.EIF4E3(chr3：71739332，SEQ ID NO.01)：

2.UBAC2(chr13：99890849，SEQ ID NO.02)

3.TAOK3(chr12：118675984，SEQ ID NO.03)

4.IFT140(chr16：1612145，SEQ ID NO.04)

5.PRR5-ARHGAP8(chr22：45205158，SEQ ID NO.05)

6.AVIL(chr12：58202496，SEQ ID NO.06)

7.ACVR2A(chr2：148683685，SEQ ID NO.07)

8.PPP1CC(chr12：111160513，SEQ ID NO.08)

9.RBM14-RBM4(chr11：66410771，SEQ ID NO.09)

10.SDHC(chr1：161309335，SEQ ID NO.10)

11.PUM2(chr2：20526998，SEQ ID NO.11)

12.DEC1(chr9：118164375，SEQ ID NO.12)

13.COL11A1(chr11：103468855，SEQ ID NO.13)

14.YTHDF3(chr8：64081981，SEQ ID NO.14)

15.ACTL6A(chr3：179291295，SEQ ID NO.15)

16.MCM3AP(chr21：47703455，SEQ ID NO.16)

17.SPDL1(chr5：169020337，SEQ ID NO.17)

18.SMARCA2(chr9：2083325，SEQ ID NO.18)

19.PROSER1(chr13：39608335，SEQ ID NO.19)

20.MZB1(chr5：138723143，SEQ ID NO.20)

21.ANKIB1(chr7：92020452，SEQ ID NO.21)

22.BRD4(chr19：15366000，SEQ ID NO.22)

针对上述NGS筛选出的标志物设计上下游引物，引物扩增出目的标志物序列，且扩增子长度应适中。进行扩增时，应对上下游引物用量进行调整，以使用其中一条引物扩增出足够的单链寡核苷酸与探针进行杂交配对。其中用量较少的一条引物为“限制性引物”、用量较大的一条引物为“过量引物”，探针应与限制性引物具有相同方向。标志物引物设计序列如下表3：

表3 标志物引物信息

针对实施例1中NGS筛选出的标志物设计检测探针，探针对突变型序列进行设计，探针应位于上下游引物中间，且Tm值在30-55℃范围。探针为避免被3’→5’校正活性降解，可在5’端使用硫代修饰进行保护；探针为避免在5’→3’聚合活性下进行延伸，需在3’使用淬灭基团或封闭基团进行修饰。设计的探针可为分子信标探针，也可为Light-off/Light-on探针，过量引物产生的单链寡核苷酸可与探针互补配对。探针需使用荧光基团与淬灭基团进行修饰，荧光基于团修饰包括FAM、VIC、HEX、ROX、CY3或CY5等修饰，淬灭基团包括BHQ1、BHQ2和BHQ3等修饰，封闭基团包括氨基修饰、双脱氧修饰或C3/C6 Spacer等。标志物探针设计序列如下表4所示：

表4 标志物探针信息

使用限制性引物、过量引物与探针配制检测反应液，对MS标志物进行扩增。检测过程在荧光PCR仪上进行，根据引物Tm值设计退火温度，设定扩增循环数为60个，设定熔解曲线收集温度范围为30-55℃范围。完成扩增后收集探针与单链寡核苷酸模板的熔解曲线，将温度与荧光值进行负求导，得到熔解峰值曲线进行结果判读。熔解曲线检测线形如图3所示，分子信标探针峰形向上，当样本为纯突变型模板时Tm较高处有熔解峰，当样本为纯野生型模板时Tm值较低处有熔解峰，当样本中同时存在突变型与野生型模板时Tm值高、低坐标处均有熔解峰；使用Light-off/Light-on探针时熔解峰向下，当样本为纯突变型模板时Tm较高处有熔解峰，当样本为纯野生型模板时Tm值较低处有熔解峰，当样本中同时存在突变型与野生型模板时Tm值高、低坐标处均有熔解峰。

实施例3

本发明所述的试剂盒为实施例2中的生物标志物组成的MSI检测试剂盒，进行标志物选择前，需分析各个标志物在MSI阴、阳性样本中的灵敏度与特异性。各个MS标志物使用分子信标探针或Light-off/Light-on探针对MSI及MSS样本进行检测，完成检测后汇总统计各个标志物检测MSI样本的灵敏度、检测MSS样本的特异性，单个MS标志物检测灵敏度、特异性如下表所示：

表5 标志物MSI检测灵敏度与特异性

检测结果表明，实施例2中的各个标志物检测MSI及MSS样本时均具有较高检测性能，但需对标志物进行组合方可进一步保证试剂盒检测性能。标志物检测MSS样本时，均能保证特异性为100％，非发现非特异检出的样本；MSI样本的检测灵敏度不同标志物之间存在差异，灵敏度为89.02-96.34％范围，作为试剂盒使用时需对不同标志物进行组合。

实施例4

通过实施例2中的不同标志物的组合，形成MSI检测试剂盒。组成试剂盒时，MS标志物数量应足够合理，试剂盒使用MS标志物过多时导致试剂盒生产成本过高、检测时浪费样本DNA、增加检测工作量、降低检测通量；试剂盒使用MS标志物过少时，将存在漏检、假阳等风险，导致试剂盒检测性能可能降低。对各个MS标志物进行检测结果的一致性分析，确定不同MS标志物检测结果是否存在重叠赘余、漏检补充等表现。

对标志物进行组合，组合分别包含4个两组标志物组合、3个四组标志物组合、2个八组标志物组合与1个十组标志物组合。通过标志物的随机选择，进行两两标志物的组合，产生4组两两标志物组合；通过标志物的随机选择，进行4个标志物的组合，产生3组4标志物组合；通过标志物的随机选择，进行8个标志物的组合，产生2组8标志物组合；通过标志物的随机选择，进行10个标志物的组合，形成1组10标志物组合，具体组合信息如下表所示：

表6 标志物组合MSI检测灵敏度与特异性

选择出MSI标志物后，可对标志物进行并管，将不同标志物于同一反应管中进行检测。可在单管反应液中加入内控基因，内控基因可对样本质量、检测试剂及检测过程进行质控，提高试剂盒稳定性、可靠性。

将表6中的10个分组组合与金标准“PCR-毛细管电泳法”进行一致性对比。将临床样本进行编盲处理，分别使用表6中的10个分组组合与“PCR-毛细管电泳法”试剂盒对相同临床样本分别进行检测，对检测结果进行判读时，无需算法、图形分析软件等的额外参与，可人工直接、快速完成判读。完成检测后以金标准检测方法为对比，分析两种试剂检测一致性，临床样本检测线形示例见图4。对本发明试剂盒及金标准检测试剂盒的检测结果进行一致性分析，统计灵敏度、特异性、阳性预测值、阴性预测值、总符合率及Kappa值，临床样本检测一致性如表7-16所示：

表7 金标准与分组1组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表8 金标准与分组2组合一致性对比

本发明试剂盒灵敏度＝99.39％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝99.53％

总符合率＝100％

Kappa＝1.0

表9 金标准与分组3组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表10 金标准与分组4组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表11 金标准与分组5组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表12 金标准与分组6组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表13 金标准与分组7组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表14 金标准与分组8组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表15 金标准与分组9组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

表16 金标准与分组10组合一致性对比

本发明试剂盒灵敏度＝100％

本发明试剂盒特异性＝100％

阳性预测值＝100％

阴性预测值＝100％

总符合率＝100％

Kappa＝1.0

检测结果表明，取实施例2的生物标志物进行不同随机组合的检测性能均较优异，随机两两组合即可维持检测特异性100％，且灵敏度高于99％，检测性能均非常优异。

以上所述，仅为本发明的较佳实施例而已，故不能依此限定本发明实施的范围，即依本发明专利范围及说明书内容所作的等效变化与修饰，皆应仍属本发明涵盖的范围内。

序列表

<110> 厦门艾德生物医药科技股份有限公司

<120> 检测人群微卫星不稳定性的生物标志物组及其应用

<160> 132

<170> SIPOSequenceListing 1.0

<210> 1

<211> 201

<212> DNA

<213> Homo sapiens

<400> 1

cccactaaag aggcatttac attccagact tggacgacgt cttctcggtc ccgaacactg 60

acactaactc ctattacttc atcatctgag gggaagacag gaaaaaaaaa aaatgagtga 120

tacttccaag tcagtctgac tgtttctaag aacttagtct ttttatctga aaattaagga 180

taagatggaa aaaagaaggt g 201

<210> 2

<211> 201

<212> DNA

<213> Homo sapiens

<400> 2

ctgcctcact gccagaagct ctttgtgtat gaccttcacg cagtcaagaa cgacttccag 60

gtaagctctg cctcattggc ccctgagagg agagcggaca gttttttttt tttctttcta 120

gatttgcttt ttcttcctgc tgttagtccc tcaaagcccc caatttgtaa gaaatattta 180

ttattaatat ttcattaagt a 201

<210> 3

<211> 201

<212> DNA

<213> Homo sapiens

<400> 3

atcaatgcat gagaatgtag gtaggctagt ccatgcaagg ctccatgagt aatggcagcg 60

atctccactt cctgaagtgg ttttttatga actgaggaag gaaaaaaaaa aaagtcagta 120

gatgatcagt ttcattcctc attttattat tttatacagc tataccagac tgggttacat 180

actttctcac atgacaattt g 201

<210> 4

<211> 201

<212> DNA

<213> Homo sapiens

<400> 4

gccgggggaa gctctcatga agcaggaagc cgtgctcttc ggaaatgaag aaggacagga 60

tcaaaacatc tgcctgggag agaaagaaaa gtactgttct gttttttttt ttaacttaca 120

taaatttctg gggtatgagt gccattttgc tacacacact gcgtcacggt ggggtcgttg 180

ctacacactg cgtcatggtg g 201

<210> 5

<211> 201

<212> DNA

<213> Homo sapiens

<400> 5

ctctattgca acaactctgc tggactgtgt tccagtaaaa cattatggac gctgaaatgt 60

gaatttcatg tcattttcac gtgtcatgaa atattcttct gttttttttt ttcaaccact 120

taaaaacata aaaagccatt tttagcttgc agcctgtacc aaagcaggaa gcaggctagg 180

ttcatcctgc ctgcccattc t 201

<210> 6

<211> 201

<212> DNA

<213> Homo sapiens

<400> 6

ggtaattcac ctctatgaag ccacatgata taagcgtctc ccctctggga gtcagagtca 60

aattctaact cacttttgtc taaggaccaa ggtacctgcc taaaaaaaaa atgactgagt 120

ggaacatttt tggatctgtt tattggcttg cggtgattat ggttgttaat ttttaggatg 180

attatgctgt gttctttcag t 201

<210> 7

<211> 201

<212> DNA

<213> Homo sapiens

<400> 7

cttttcagga cctgtagatg aatacatgtt gccatttgag gaggaaattg gccagcatcc 60

atctcttgaa gacatgcagg aagttgttgt gcataaaaaa aagaggcctg ttttaagaga 120

ttattggcag aaacatgctg taagttatcc agttagcttt tcatttgaaa ttccaataaa 180

acacttttca gaggaattat t 201

<210> 8

<211> 201

<212> DNA

<213> Homo sapiens

<400> 8

agatcacaaa gaagaccttg atctggtaca tcagttggtc gcataattcg ccgaatctgc 60

tccatagatt gaagatctgg tgataaacct attcaatgag gaaaaaaaaa aaatgaagaa 120

agcagaactt ttaaaaggat actacccctt caaaagttcc atttgtctac agagaaattc 180

aataatcctg acataaaaac t 201

<210> 9

<211> 201

<212> DNA

<213> Homo sapiens

<400> 9

atttcttaag catttaaact gttgttatag ctgaaatatt tcttcatcta agtggtcttt 60

tcctgaaatc aggtcattat actgaatcta tatgttgagt cttttttttt tttccttttt 120

atcttttcct aaagatgagt cctgcattag aattgtctag ataaagccat tgctatgacc 180

agtgtctggg gtaggggctg g 201

<210> 11

<211> 201

<212> DNA

<213> Homo sapiens

<400> 11

agtactagga ttacaggtgt gagccaccat gccagctcca actttaatga gtgtctttga 60

cccatgtttc tccttgcgaa aggagttttg agttataatc attttttttt ttctcagccc 120

tatcagtgat gcagtctggt aaaggtaggg atccttctcc ataaatcagt tttctttatt 180

ctttaattta tttttgtaac c 201

<210> 11

<211> 201

<212> DNA

<213> Homo sapiens

<400> 11

ttttaaagct aaaaatcaca acagaattgt acaatctgaa atttaaaccc ctccatatag 60

tttggaagat atgaccacta tttccaggaa gggagatggt taaaaaaaaa aaataagtta 120

caatggctca aaataaagtg aggtgtaagt tcttagtatt tgcaaacatt tacctctccc 180

attccccgag attctaatgc a 201

<210> 12

<211> 201

<212> DNA

<213> Homo sapiens

<400> 12

agatccgatt taattaatga aggcacaaac cccctggctt tcttgctggg tttcatgaca 60

tcttattaaa cacactttat ttagcaagct tggttatttg cttttttttt tttgtctccc 120

agcagattga atgtaagtga cttggaaaag gaagaggagt tgccagaaac agctaaaatg 180

tcagtagaag acttgacagc t 201

<210> 13

<211> 206

<212> DNA

<213> Homo sapiens

<400> 13

agcaatacat acaggctgcc ctggagctcc tggagttccc cttggaccca gcaaacctcg 60

tgggccctag gagaaaaaga aaaagcacgc ctttattaaa aaaaaaaaat gtcctaataa 120

catgcctctt tcaatgaaga aatcctaagg ttatttttag aataaaaata tttggacatc 180

ttttattaac acactgaaag tgatgt 206

<210> 14

<211> 201

<212> DNA

<213> Homo sapiens

<400> 14

attaacacac tttttctttt cttccttttt ctcctcttta ccgcatcttt cgtcttgcaa 60

cacagagacc taaagggcaa ggaaataaag gtgagtttgg attttttttt ttcttattgc 120

tcaatgttgc cttaatgtta cttttaaact ctgtgagggt attttgtttg tttttgctcc 180

ctcttgggaa aaaatgtagg a 201

<210> 15

<211> 201

<212> DNA

<213> Homo sapiens

<400> 15

acctacaaaa tgcatgtcaa atcagaagcc agtctccatc ctgttctcat gtcagaggca 60

ccggtgagat aaagattttc tttttcacgt ttctctagtt gttttttttt tttctttttt 120

ttttccttta gttttctact catttgatga acatttttct ttaaagaggc atagaaattc 180

atattttgaa tttgaaaatt a 201

<210> 16

<211> 201

<212> DNA

<213> Homo sapiens

<400> 16

gaatatgcca agttatgaaa taaatagtgc tatcccagcc tatgctaata agatatttga 60

gtactttctc tatattatag taagcaaaca actgagggac caaaaaaaaa aaacaggttt 120

taaagtgaca aggttcaaat ctagggtaac aaatggcaag atgggagtac tcacatgatc 180

aaagaaatgt accactgcaa g 201

<210> 17

<211> 201

<212> DNA

<213> Homo sapiens

<400> 17

ggcaaatagg aaactccaat agtatcatca ttcagtaagt ttggttcaat cagttcaatc 60

agtgattgtt tttagaaaga aaataacttt caatttatga cttttttttt tttggcttta 120

gatagaaaaa ctgaaagtgg aattagatga agccaggctt agtgaaaagc agctgaagca 180

ccaagtagat catcagaagg a 201

<210> 18

<211> 202

<212> DNA

<213> Homo sapiens

<400> 18

ctgtagcccc tttcaaggtg aggcctgaac atgaataaga acatcttttt aaccattgat 60

ttttatacaa atgtcttttt tctgttgttt tttttttttg ttccatagga ctctatctaa 120

ctggacatat gaatttgaca aatgggctcc ttctgtggtg aagatttctt acaaggtttg 180

gaatgctgta tttatatata aa 202

<210> 19

<211> 194

<212> DNA

<213> Homo sapiens

<400> 19

atacctgttc actagaaaag tatccatgca catattcaat tgcttttaat ttgtattctg 60

tcaaaacagc ctaaaaaaaa aaaacacaca cacacagagt aaaacagcat taatatacgt 120

aagcagcaca gtaatataca tctatcaaaa ctgcccaagc aactcaacag tggcaggtct 180

acttcagccc tgtc 194

<210> 20

<211> 201

<212> DNA

<213> Homo sapiens

<400> 20

caggaggctg aggtgggaga atcgcctgaa cctgggaggt ggaggttgca tcgagccaag 60

aacactgcac tccagcctgg gtgacagagt gagactgtct caaaaaaaaa aaattgattt 120

tgagagtttt tttttttttt tcacaaggga catcagcaga aacaccaatg tctgcactcc 180

cagccccaca agcacctttt g 201

<210> 21

<211> 201

<212> DNA

<213> Homo sapiens

<400> 21

tttcaaaatt ttaactagtt tcttacttca aaagagttag atttaactga gaaaccacat 60

agaccctgga tttgctattg attaacctat gaagcctgtg attttttttt tttctctgct 120

tactatagac agacctagaa atggtcactg aagaccttgc ccagaaagtc aataggcctt 180

accttcgcac accccgccac a 201

<210> 22

<211> 201

<212> DNA

<213> Homo sapiens

<400> 22

caccagtcag atatgtagaa aggcactgac agcctagggg tgagtgcaat gtcacaacct 60

ttcggaggtt tctgtgtcaa gaacacagat attataattg gaaaaaaaaa aggggggggg 120

cgcagaaaga gtggactgag caaggaggga aaagttactc tgagggtgcc cacagaagga 180

accccatgcc cagggggccc a 201

<210> 23

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tgacactaac tcctattact tcatcatctg 30

<210> 24

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

gttcttagaa acagtcagac tgacttggaa g 31

<210> 25

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

gacttccagg taagctctgc ctc 23

<210> 26

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

tttgagggac taacagcagg aa 22

<210> 27

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

catgagtaat ggcagcgatc t 21

<210> 28

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

aaagtatgta acccagtctg gtatagctg 29

<210> 29

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

acatctgcct gggagagaaa gaa 23

<210> 30

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

atggcactca taccccagaa at 22

<210> 31

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

tgtgaatttc atgtcatttt cacgtgtca 29

<210> 32

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

tgcaagctaa aaatggcttt ttatg 25

<210> 33

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

taactcactt ttgtctaagg accaagg 27

<210> 34

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

taacaaccat aatcaccgca agccaat 27

<210> 35

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

agcatccatc tcttgaagac atgcaggaag t 31

<210> 36

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

ctaactggat aacttacagc atgtttc 27

<210> 37

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

tctgctccat agattgaaga tctggtg 27

<210> 38

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

caaatggaac ttttgaaggg gtagtatcct t 31

<210> 39

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

cttttcctga aatcaggtca ttatactgaa tc 32

<210> 40

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

ttctaatgca ggactcatc 19

<210> 41

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

taatgagtgt ctttgaccca tgtttctcct 30

<210> 42

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

acctttacca gactgcatca ctgat 25

<210> 43

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

agatatgacc actatttcca ggaagggag 29

<210> 44

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

atgtttgcaa atactaagaa cttacacct 29

<210> 45

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

tcttgctggg tttcatgaca tcttattaaa c 31

<210> 46

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

ccttttccaa gtcacttaca ttcaatct 28

<210> 47

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

ctcgtgggcc ctaggagaaa aagaaaaagc acg 33

<210> 48

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

tatttttatt ctaaaaataa ccttaggatt tct 33

<210> 49

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

tttcgtcttg caacacagag acctaaag 28

<210> 50

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

gtttaaaagt aacattaagg caacattgag 30

<210> 51

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

catgtcagag gcaccggtga gata 24

<210> 52

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

gttcatcaaa tgagtagaaa acta 24

<210> 53

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

tttctctata ttatagtaag caaacaactg ag 32

<210> 54

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

gtactcccat cttgccattt gttaccctag 30

<210> 55

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

cagtaagttt ggttcaatca gttcaatc 28

<210> 56

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

gcttcatcta attccacttt cagtttttct 30

<210> 57

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

gtgaggcctg aacatgaata agaacatctt 30

<210> 58

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

attcatatgt ccagttagat agagtcc 27

<210> 59

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

catattcaat tgcttttaat ttgtattctg tca 33

<210> 60

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

tagatgtata ttactgtgct gcttacgtat a 31

<210> 61

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

cactccagcc tgggtgacag agtgag 26

<210> 62

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

ggtgtttctg ctgatgtccc ttgt 24

<210> 63

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

aactgagaaa ccacatagac cctggat 27

<210> 64

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

tcagtgacca tttctaggtc tgtctat 27

<210> 65

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

cggaggtttc tgtgtcaaga acacagatat 30

<210> 66

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

ccctcagagt aacttttccc tccttgctc 29

<210> 67

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

cgtcgctcat tttttttttc ctcgacg 27

<210> 68

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

gactgacttg gaagtatca 19

<210> 69

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

ctcatttttt ttttcct 17

<210> 70

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

cgtgcacagt tttttttttc tttcgcacg 29

<210> 71

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

ctgagaggag agcggac 17

<210> 72

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

acagtttttt ttttctttc 19

<210> 73

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

cgtcctgact tttttttttc cttcggacg 29

<210> 74

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

tgactttttt ttttccttc 19

<210> 75

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

cagttcataa aaaaccact 19

<210> 76

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

cgtgcttctg tttttttttt aacttgcacg 30

<210> 77

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

ttctgttttt tttttaactt 20

<210> 78

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

acataaattt ctggggtatg 20

<210> 79

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

cgagccttct gttttttttt tcaagctcg 29

<210> 80

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

cttctgtttt ttttttcaa 19

<210> 81

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

ccacttaaaa acataaaaag c 21

<210> 82

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

cgtcgagtca ttttttttta ggccgacg 28

<210> 83

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

gatccaaaaa tgttccact 19

<210> 84

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

agtcattttt ttttaggc 18

<210> 85

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

cgtcgctctt tttttatgca cacgacg 27

<210> 86

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

ccaataatct cttaaaacag g 21

<210> 87

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

ctcttttttt atgcaca 17

<210> 88

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

cgtcggagga aaaaaaaaat gaagcgacg 29

<210> 89

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

gaggaaaaaa aaaatgaag 19

<210> 90

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

gaagaaagca gaactttta 19

<210> 91

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

cattcggagt cttttttttt tcctcgaatg 30

<210> 92

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

gagtcttttt tttttcct 18

<210> 93

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 93

ttttatcttt tcctaaagat gag 23

<210> 94

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 94

cgtgcatcat tttttttttc tcaggcacg 29

<210> 95

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 95

cgaaaggagt tttgagttat 20

<210> 96

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 96

atcatttttt ttttctcag 19

<210> 97

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 97

cgtcgactta tttttttttt ttaaccacga cg 32

<210> 98

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 98

ctttattttg agccattgt 19

<210> 99

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 99

acttattttt tttttttaac ca 22

<210> 100

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 100

cgtgcttgct tttttttttg tctgcacg 28

<210> 101

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 101

ttatttagca agcttggtta t 21

<210> 102

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 102

ttgctttttt ttttgtct 18

<210> 103

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 103

gcacgaggac attttttttt taatacgtgc 30

<210> 104

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 104

attgaaagag gcatgttat 19

<210> 105

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 105

aggacatttt ttttttaata 20

<210> 106

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 106

cgtcgttgga tttttttttt cttatcgacg 30

<210> 107

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 107

caaggaaata aaggtgag 18

<210> 108

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 108

ttggattttt tttttcttat 20

<210> 109

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 109

cgtcgtagtt gttttttttt tctttcgacg 30

<210> 110

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 110

gattttcttt ttcacgtttc t 21

<210> 111

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 111

tagttgtttt ttttttcttt 20

<210> 112

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 112

gctgccctgt tttttttttg gtcgcagc 28

<210> 113

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 113

ttgaaccttg tcactttaaa 20

<210> 114

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 114

cctgtttttt ttttggtc 18

<210> 115

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 115

cgtgctatga cttttttttt tgggcacg 28

<210> 116

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 116

ttttagaaag aaaataactt tcaat 25

<210> 117

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 117

tatgactttt ttttttgg 18

<210> 118

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 118

gcagcttgtt ttttttttgt tccgctgc 28

<210> 119

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 119

tttttataca aatgtctttt ttct 24

<210> 120

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 120

ttgttttttt tttgttcc 18

<210> 121

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 121

cgagctgtgt ttttttttta gggctcg 27

<210> 122

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 122

ctgttttact ctgtgtgt 18

<210> 123

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 123

tgtgtttttt ttttagg 17

<210> 124

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 124

cgagccaatt ttttttttga gagctcg 27

<210> 125

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 125

aaaaaaaaaa actctcaaaa t 21

<210> 126

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 126

caattttttt tttgaga 17

<210> 127

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 127

cgagcgattt tttttttctc tgctgctcg 29

<210> 128

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 128

gattaaccta tgaagcctg 19

<210> 129

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 129

gatttttttt ttctctgct 19

<210> 130

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 130

cgagccccct ttttttttcc agctcg 26

<210> 131

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 131

actctttctg cgccccc 17

<210> 132

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 132

cccctttttt tttcca 16

Claims

1.非诊断治疗目的的分析人群生物学样本中的微卫星不稳定性的方法，其特征在于：包括：确定以下标志物组的同聚物重复的碱基数量，该标志物组至少包括以下标志物：

第一标志物，包含12个连续A的同聚物重复，其定位在人EIF4E3基因，且其序列如SEQID NO.01所示；

第二标志物，包含12个连续T的同聚物重复，其定位在人UBAC2基因，且其序列如SEQ IDNO.02所示；

第三标志物，包含12个连续A的同聚物重复，其定位在人TAOK3基因，且其序列如SEQ IDNO.03所示；

第四标志物，包含11个连续T的同聚物重复，其定位在人IFT140基因，且其序列如SEQID NO.04所示；

第五标志物，包含11个连续T的同聚物重复，其定位在人PRR5-ARHGAP8基因，且其序列如SEQ ID NO.05所示；

第七标志物，包含8个连续A的同聚物重复，其定位在人ACVR2A基因，且其序列如SEQ IDNO.07所示；

第八标志物，包含12个连续A的同聚物重复，其定位在人PPP1CC基因，且其序列如SEQID NO.08所示；

第九标志物，包含12个连续T的同聚物重复，其定位在人RBM14-RBM4基因，且其序列如SEQ ID NO.09所示。

2.如权利要求1所述的方法，其特征在于：所述标志物组还包括如下至少之一：

第六标志物，包含10个连续A的同聚物重复，其定位在人AVIL基因，且其序列如SEQ IDNO.06所示；

第十标志物，包含11个连续T的同聚物重复，其定位在人SDHC基因，且其序列如SEQ IDNO.10所示；

第十一标志物，包含12个连续A的同聚物重复，其定位在人PUM2基因，且其序列如SEQID NO.11所示；

第十二标志物，包含12个连续T的同聚物重复，其定位在人DEC1基因，且其序列如SEQID NO.12所示；

第十三标志物，包含12个连续A的同聚物重复，其定位在人COL11A1基因，且其序列如SEQ ID NO.13所示；

第十四标志物，包含11个连续T的同聚物重复，其定位在人YTHDF3基因，且其序列如SEQID NO.14所示；

第十五标志物，包含12个连续T的同聚物重复，其定位在人ACTL6A基因，且其序列如SEQID NO.15所示；

第十六标志物，包含12个连续A的同聚物重复，其定位在人MCM3AP基因，且其序列如SEQID NO.16所示；

第十七标志物，包含12个连续T的同聚物重复，其定位在人SPDL1基因，且其序列如SEQID NO.17所示；

第十八标志物，包含12个连续T的同聚物重复，其定位在人SMARCA2基因，且其序列如SEQ ID NO.18所示；

第十九标志物，包含12个连续A的同聚物重复，其定位在人PROSER1基因，且其序列如SEQ ID NO.19所示；

第二十标志物，包含12个连续A的同聚物重复，其定位在人MZB1基因，且其序列如SEQID NO.20所示；

第二十一标志物，包含12个连续T的同聚物重复，其定位在人ANKIB1基因，且其序列如SEQ ID NO.21所示；

第二十二标志物，包含10个连续A的同聚物重复，其定位在人BRD4基因，且其序列如SEQID NO.22所示。

3.如权利要求1或2所述的方法，其特征在于：还包括：扩增所述同聚物重复或其突变形式的区域。

4.如权利要求3所述的方法，其特征在于：所述检测过程完成后生成熔解曲线数据。

5.如权利要求3所述的方法，其特征在于：所述扩增包括使用分子信标探针。

6.如权利要求5所述的方法，其特征在于：对应于每一所述同聚物重复或其突变形式的区域，所述扩增还包括一限制性引物和一过量引物，该限制性引物与所述分子信标探针具有相同的方向，过量引物产生的单链模板可与所述分子信标探针进行互补配对，且过量引物的量大于限制性引物的量。

7.如权利要求6所述的方法，其特征在于：所述限制性引物与过量引物的比例为1:3-20。

8. 如权利要求3所述的方法，其特征在于：所述扩增包括使用Light off / Light on探针对。

9. 如权利要求8所述的方法，其特征在于：对应于每一所述同聚物重复或其突变形式的区域，所述扩增还包括一限制性引物和一过量引物，该限制性引物与所述Light off /Light on探针对具有相同的方向，过量引物产生的单链模板可与所述Light off / Lighton探针对进行互补配对，且过量引物的量大于限制性引物的量。

10.如权利要求9所述的方法，其特征在于：所述限制性引物与过量引物的比例为1:3-20。

11.如权利要求3所述的方法，其特征在于：所述扩增的循环数为40-70个。

12.如权利要求3所述的方法，其特征在于：进行所述扩增采用高保真DNA聚合酶。

13.分析人群生物学样本中的微卫星不稳定性的试剂盒，其特征在于：包括用于扩增以下标志物组的引物对和探针，该标志物组至少包括以下标志物：

14.如权利要求13所述的试剂盒，其特征在于：

第六标志物，包含10个连续A的同聚物重复，其定位在人AVIL基因，且其序列如SEQ IDNO.06所示；所述标志物组还包括如下至少之一：

15.如权利要求13或14所述的试剂盒，其特征在于：所述探针为分子信标探针。

16.如权利要求15所述的试剂盒，其特征在于：对应于每一所述同聚物重复，所述引物对由一限制性引物和一过量引物组成，该限制性引物与所述分子信标探针具有相同的方向，过量引物产生的单链模板可与所述分子信标探针进行互补配对，且过量引物的量大于限制性引物的量。

17.如权利要求16所述的试剂盒，其特征在于：所述限制性引物与过量引物的比例为1:3-20。

18.如权利要求13或14所述的试剂盒，其特征在于：所述探针为Light off / Light on探针对。

19. 如权利要求18所述的试剂盒，其特征在于：对应于每一所述同聚物重复，所述引物对由一限制性引物和一过量引物组成，该限制性引物与所述Light off / Light on探针对具有相同的方向，过量引物产生的单链模板可与所述Light off / Light on探针对进行互补配对，且过量引物的量大于限制性引物的量。

20.如权利要求19所述的试剂盒，其特征在于：所述限制性引物与过量引物的比例为1:3-20。

21.如权利要求13或14所述的试剂盒，其特征在于：用所述引物对进行扩增的循环数为40-70个。

22.如权利要求13或14所述的试剂盒，其特征在于：用所述引物对进行扩增采用高保真DNA聚合酶。