CN113227400A - 与子宫内膜异位症相关的线粒体dna缺失 - Google Patents

与子宫内膜异位症相关的线粒体dna缺失 Download PDF

Info

Publication number
CN113227400A
CN113227400A CN201980085361.1A CN201980085361A CN113227400A CN 113227400 A CN113227400 A CN 113227400A CN 201980085361 A CN201980085361 A CN 201980085361A CN 113227400 A CN113227400 A CN 113227400A
Authority
CN
China
Prior art keywords
seq
nucleotide
nucleotides
deletion
mtdna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980085361.1A
Other languages
English (en)
Inventor
珍妮弗·克里特
安德烈娅·马格拉
布赖恩·赖古伊
安德烈·哈博特尔
罗伯特·厄舍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MDNA LIFE SCIENCES Inc
Original Assignee
MDNA LIFE SCIENCES Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MDNA LIFE SCIENCES Inc filed Critical MDNA LIFE SCIENCES Inc
Publication of CN113227400A publication Critical patent/CN113227400A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/689Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to pregnancy or the gonads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/36Gynecology or obstetrics
    • G01N2800/364Endometriosis, i.e. non-malignant disorder in which functioning endometrial tissue is present outside the uterine cavity

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Reproductive Health (AREA)
  • Pregnancy & Childbirth (AREA)
  • Gynecology & Obstetrics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明提供了具有特定大规模缺失且与子宫内膜异位症相关的畸变的线粒体DNA(mtDNA)分子。畸变或突变的mtDNA可包括亲本核酸(即,大sblimon),特别是当重新环化时,其中,在缺失后,相邻核苷酸融合以形成连接位点。替代地,mtDNA可以包括缺失的链(即,小sublimon),特别是当重新环化时创建连接位点。此外,还提供了由这种突变mtDNA产生的融合转录本及其假定的蛋白质产物,其中,这种转录本和蛋白质也与子宫内膜异位症相关。本发明提供了用于检测、诊断或监测子宫内膜异位症的杂交探针和扩增引物以及包括它们的试剂盒。

Description

与子宫内膜异位症相关的线粒体DNA缺失
相关申请的交叉引用
本申请根据巴黎公约要求2018年12月22日提交的美国申请号62/784,403和2019年11月5日提交的美国申请号62/931,173的优先权。这些在先申请的全部内容通过引用并入本文。
关于序列表的声明
与本申请相关的序列表以ASCII格式与本申请同时提交,并在此通过引用并入本说明书。包括该序列表的文本文件名为“Sequence_Listing.txt”,创建于2019年12月17日,大小约为119kb。
技术领域
本说明书总体上涉及用于检测/诊断和/或监测子宫内膜异位症的新型生物标志物和方法。该描述还涉及在主题方法中有用的独特分析物和/或试剂。
背景技术
子宫内膜异位症是一种负荷较重的疾病,在多达5%至10%的育龄妇女中发生,并且是不孕症的常见原因[1-7,58]。该疾病的特征在于,存在子宫外生长的子宫内膜组织(上皮细胞和基质)。这种异位子宫内膜组织可见于盆腔腹膜和输卵管、卵巢、肠和膀胱,很少见于更远端的身体部位[8-11]。患有子宫内膜异位症的女性经常会出现经常使人虚弱的症状,包括非经期盆腔疼痛、痛经、性交疼痛、疲劳和不孕[12],这些会导致生活质量大幅下降[13]。鉴于其高患病率和显着的发病率,子宫内膜异位症在全球范围内造成非常显着的经济损失,估计每年高达数千亿欧元[14]。
不幸的是,子宫内膜异位症的诊断通常是一个漫长的过程,导致治疗延迟。目前诊断子宫内膜异位症的“黄金标准”包括腹腔镜手术,然后对组织样本进行组织病理学确认[5,15]。由于延迟的报告[16]和对症状的误读[17]进一步使及时诊断变得更加复杂,如果患者对接受昂贵且侵入性的腹腔镜手术犹豫不决,则可能会进一步延迟。事实上,子宫内膜异位症的诊断延迟可能超过十年[16]。由于这些延误,大多数女性在做出明确诊断时已经出现中度至重度症状,这可能导致发病率增加、治疗费用增加和生活质量下降[14]。因此,需要一种可靠的、非侵入性的测试,其可以促进子宫内膜异位症的早期检测并提供可操作的实时结果。然而,目前还没有用于检测子宫内膜异位症的非侵入性方法。
分子生物标志物已被广泛用作测量、检测和预测人类疾病的工具[18-24];然而,寻找子宫内膜异位症特异性生物标志物已被证明是很困难的[25]。一些关键挑战包括非标准化的样本收集、分析方法以及数据解释和缺乏生物标志物特异性[17],尽管最近已经做出努力来协调用于收集和存储生物样本以及报告子宫内膜异位症数据的方法,包括世界子宫内膜异位症研究基金会(WERF)EPHect协议[26]。已经报道了来自血液、组织和尿液的各种候选生物标志物,但没有一个被成功转化为临床应用。这些候选物中的许多对样本收集有特定的限制(例如从患病组织中进行活检、在月经的特定时期收集的要求)或者依赖于炎症诱导的调节模式(例如,基因表达、DNA甲基化)的变化,这可以与其他妇科疾病重叠[10,17]并增加假阳性检测的可能性。因此,理想的生物标志物应能够从健康细胞或体液中检测到,并且不受暂时性疾病、炎症生成的或周期性的生理变化的影响。
线粒体基因组代表较少探索的生物标志物库。如图1所示,线粒体基因组编码24个基因的互补序列,包括2个rRNA和22个tRNA,它们确保对电子传递至关重要的其余13个基因的正确翻译。由于高突变频率、有限的DNA修复能力、存在于所有有核细胞中以及高拷贝数(每个细胞有数千个基因组),线粒体DNA(mtDNA)目标从诊断角度来看很有吸引力[27]。因此,即使是低频突变或缺失事件也可以从异质线粒体群体中可靠地扩增。事实上,mtDNA突变已被很好地描述为多种身体部位癌症的生物标志物,这些身体部位包括骨、脑、乳腺、肺、结肠直肠、胃、卵巢、前列腺和子宫内膜组织[28-37]。线粒体(mt)基因组相对较小,有16569个核酸碱基对,而核基因组有超过30亿个碱基对。此外,考虑到卵子内线粒体的克隆扩增,一旦发生受精,给定个体中的所有mtDNA基因组通常都是相同的。mt基因组的不寻常体现为其是一个环状的、无内含子的DNA分子,散布着重复基序,这些重复基序位于特定长度的序列两侧。在未被充分理解的情况下,这些重复之间的序列容易缺失。此外,此类缺失通常包括一个或两个侧翼重复序列的至少一部分。如下文进一步讨论,一旦构成缺失的序列被去除,剩余的“亲本”mtDNA重新环化来形成“大sublimon(large sublimon)”。同样地,缺失的序列也可能重新环化,形成“小sublimon(small sublimon)”。鉴于mt基因组中的重复数目,有许多可能的缺失。这些缺失最著名的例子之一是4977bp的“常见缺失”,它与各种疾病状态有关。尽管也将常见缺失作为子宫内膜异位症的标志物进行了研究[54],但缺乏特异性并不显示这种缺失能成为该疾病的有效标志物。某些线粒体DNA缺失以前曾与某些特定病症和与年龄相关的疾病有关(参见[59]-[64])。mtDNA基因组的核苷酸5371-14058之间的8686bp缺失也已被发表([65]),但与疾病状态或状况没有任何相关性。
在一些情况下,mtDNA缺失和其他大规模mtDNA重排可导致能够被转录的突变mtDNA序列,从而产生线粒体融合转录本。线粒体融合转录本与疾病状态之间关联的实例已在例如本申请人的先前申请号:PCT/CA2006/000652、PCT/CA2007/001711、PCT/CA2009/000351和PCT/CA2010/000423中描述,其全部公开内容通过引用并入本文。
在子宫内膜癌的研究过程中,已在子宫内膜中检测到mtDNA改变[37-40]。然而,这些研究并未揭示mtDNA基因组内的共有区域或与子宫内膜疾病相关的特定mtDNA改变。因此,这些研究并未提出mtDNA改变可用作检测子宫内膜异位症的生物标志物的结论。此外,据信没有进行过任何与线粒体融合转录本和子宫内膜疾病或状态有关的先前研究。
因此,需要一种准确和/或更有效的检测子宫内膜疾病和/或病症的手段,以解决已知方法中的至少一个缺陷。
发明内容
一方面,本说明书提供了用于检测、诊断和/或监测受试者的子宫内膜异位症的方法、试剂和/或试剂盒。本说明书涉及线粒体DNA(mtDNA)生物标志物、其融合转录本和/或已在本文中被识别为与子宫内膜异位症相关的翻译的融合蛋白的使用。本方法可以使用从被筛选的受试者获得的生物样品进行。这种样品可以包括组织(例如活检组织)、月经液体、循环血或血液衍生物,例如血清或血浆。目前描述的方法可以在从被怀疑患有或正在发展为子宫内膜异位症的受试者非侵入性地获得的样品上进行,并作为确定是否需要进一步侵入性诊断研究的有效手段。
一方面,提供了一种检测、诊断和/或监测哺乳动物受试者中的子宫内膜异位症的方法,该方法包括在来自受试者的生物样品中识别具有在重新连接或重新环化的mtDNA核苷酸序列中产生连接点的至少一个缺失的异常线粒体DNA(mtDNA)分子,其中,连接点位于SEQ ID NO:1的mtDNA核苷酸序列的核苷酸对8469:13447、7992:15730、9191:12909、9188:12906、10367:12829、6260:12814、7973:9023、9086:10313、9079:14988、7260:15540、8431:10841、8984:13833或5362:14049。
一方面,该方法包括通过将生物样品与设计成与畸变mtDNA杂交的DNA探针或引物接触来识别畸变mtDNA。
一方面,该方法包括识别一个或多个畸变mtDNA分子的融合转录本。
在另一方面,该方法包括识别由一个或多个畸变mtDNA分子编码的融合蛋白。
一方面,提供了一种在来自哺乳动物受试者的生物样品中识别具有缺失的异常线粒体DNA(mtDNA)分子的方法,其中,所述缺失包括SEQ ID NO:1的mtDNA核苷酸序列的核苷酸5362-14049、8469-13447、7992-15730、9191-12909、9188-12906、10367-12829、6260-12814、7973-9023、9086-10313、9079-14988、7260-15540、8431-10841或8984-13833之间的核苷酸序列,并且其中,一旦重新环化,mtDNA包括连接点。
在另一方面,提供了一种在来自哺乳动物受试者的生物样品中识别具有缺失的异常线粒体DNA(mtDNA)分子的方法,其中,一旦重新环化,mtDNA包括由第一和第二核苷酸组成的连接点,并且其中,对于SEQ ID NO:1:
a)缺失包括核苷酸5377-14048,第一个核苷酸在核苷酸5362-5377之间并且第二个核苷酸在核苷酸14048-14063之间;
b)缺失包括核苷酸8483-13446,第一个核苷酸在核苷酸8469-8483之间并且第二个核苷酸在核苷酸13446-13460之间;
c)缺失包括核苷酸7993-15722,第一个核苷酸在核苷酸7985-7993之间并且第二个核苷酸在核苷酸15722-15730之间;
d)缺失包括核苷酸9196-12908,第一个核苷酸在核苷酸9191-9196之间并且第二个核苷酸在核苷酸12908-12912之间;
e)缺失包括核苷酸9196-12905,第一个核苷酸在核苷酸9188-9196之间并且第二个核苷酸在核苷酸12905-12913之间;
f)缺失包括核苷酸10368-12825,第一个核苷酸在核苷酸10364-10368之间并且第二个核苷酸在核苷酸12825-12829之间;
g)缺失包括核苷酸6261-12813,第一个核苷酸在核苷酸6260-6271之间并且第二个核苷酸在核苷酸12813-12824之间;
h)缺失包括核苷酸7984-9022,第一个核苷酸在核苷酸7973-7984之间并且第二个核苷酸在核苷酸9022-9033之间;
i)缺失包括核苷酸9087-10303,第一个核苷酸在核苷酸9077-9087之间并且第二个核苷酸在核苷酸10303-10313之间;
j)缺失包括核苷酸9086-14987,第一个核苷酸在核苷酸9079-9086之间并且第二个核苷酸在核苷酸14987-14904之间;
k)缺失包括核苷酸7261-15531,第一个核苷酸在核苷酸7252-7261之间并且第二个核苷酸在核苷酸15531-15540之间;
l)缺失包括核苷酸8440-10840,第一个核苷酸在核苷酸8431-8440之间并且第二个核苷酸在核苷酸10840-10849之间;或者,
m)缺失包括核苷酸8994-13832,第一个核苷酸在核苷酸8984-8994之间并且第二个核苷酸在核苷酸13832-13842之间。
在另一方面,提供了一种检测由畸变mtDNA分子或由mtDNA缺失产生的融合转录本和融合蛋白的方法。
附图说明
在参考附图的以下详细描述中,某些实施例的特征将变得更加明显,其中:
图1是显示线粒体编码基因的图示。
图2A至图2J示出了如实施例1中所讨论的子宫内膜组织中融合转录本1、4、14、16、120、122、193、400、516和586的检测。散点图代表子宫内膜对照组织和子宫内膜异位症阳性组织的标准化结果,用对十种融合转录本有特异性的探针对这些组织进行测试,识别为转录本编号:1(图2A);4(图2B);14(图2C);16(图2D);120(图2E);122(图2F);193(图2G);400(图2H);516(图2I);和586(图2J)。每幅图的y轴表示标准化的相对发光单位RLU(log2LOQProbe-Log2LOQHK23),其中,HK23是核管家转录本人β-2-微球蛋白。每幅图的x轴表示组织诊断,由医生在腹腔镜检查时的诊断确定,其中:子宫内膜对照=0.0,并且子宫内膜异位症阳性=1.0。
图3描绘了mtDNA融合转录本图,其示出了SEQ ID NO:1的mtDNA基因组、基因位置和本文所述的10个mtDNA缺失部分(即“探针”或“靶标”),其由跨越每个缺失的长度的线指示。
图4A和图4B示出了实施例2的1.2kb缺失和3.7kb缺失的诊断准确性,比较了有症状的对照样品和来自具有确诊子宫内膜疾病状况的患者的样品。评估了1.2kb缺失和3.7kb缺失对于区分有症状患者样本和确诊子宫内膜异位症患者样本(所有亚型/病期组合)的能力。构建受试者工作特征曲线(receiver operator characteristic curve)并计算曲线下面积。缩写:CI=置信区间;ROC=接受者操作特征;Std=标准;vs=对比。
图5A至图5D示出了实施例2的1.2kb缺失在区分有症状的对照样品和不同子宫内膜疾病亚型的样品中的诊断准确性。评估了1.2kb缺失对于区分有症状患者样本和来自按子宫内膜异位症亚型(腹膜、卵巢、深部浸润)分层的患者样本的能力。图5A示出了对于来自有症状对照和患有腹膜、卵巢或深部浸润性子宫内膜异位症患者的样本的标准化的1.2kb缺失的分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线(whiskers)代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。对每组的描述性统计进行了总结(右)。在图5B至图5D,构建了1.2kb缺失的受试者工作特征曲线,并计算了曲线下的面积,显示了诊断准确性。缩写:CI=置信区间;Dev=偏差;DIE=深部浸润性子宫内膜异位症;N=每组样本数;ROC=接受者操作特征;Std=标准;vs=对比。
图6A至图6D示出了实施例2的3.7kb缺失在区分有症状的对照样品和子宫内膜疾病亚型的样品中的诊断准确性。评估了3.7kb缺失对于区分有症状患者样本和来自按子宫内膜异位症亚型(腹膜、卵巢、深部浸润)分层的患者的样本的能力。图6A示出了来自有症状对照和患有腹膜、卵巢或深部浸润性子宫内膜异位症患者的样本的标准化3.7kb缺失的分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。对每组的描述性统计进行了总结(右)。在图6B至图6D中,构建了3.7kb缺失的受试者工作特征曲线,并计算了曲线下的面积,显示了诊断准确性。缩写:CI=置信区间;Dev=偏差;DIE=深部浸润性子宫内膜异位症;N=每组样本数;ROC=接受者操作特征;Std=标准;vs=对比。
图7A至图7C示出了实施例2的1.2kb缺失在区分有症状的对照样品和来自具有已知疾病病期的患者的样品中的诊断准确性。评估了1.2kb缺失对于区分有症状患者样本和来自按子宫内膜异位症病期(低或高)分层的患者样本的能力。图7A示出了来自有症状的对照和子宫内膜异位症的低(I/II)或高(III/IV)病期的患者的标准化1.2kb缺失的分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。对每组的描述性统计进行了总结(右)。在图7B和7C中,构建了1.2kb缺失的受试者工作特征曲线,并计算了曲线下的面积,显示了诊断准确性。缩写:CI=置信区间;Dev=偏差;N=每组样本数;ROC=接受者操作特征;标准=标准;vs=对比。
图8A至8C示出了实施例2的3.7kb缺失在区分有症状的对照样品和来自具有已知疾病病期的患者的样品中的诊断准确性。评估了3.7kb缺失对于区分有症状患者样本和来自按子宫内膜异位症阶段(低或高)分层的患者样本的能力。图8A示出了来自有症状的对照和子宫内膜异位症的低(I/II)或高(III/IV)病期的患者的标准化3.7kb缺失的分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。对每组的描述性统计进行了总结(右)。在图8B和8C中,构建了3.7kb缺失的受试者操作特征(ROC)曲线,并计算了曲线下的面积,显示了诊断准确性。缩写:CI=置信区间;Dev=偏差;N=每组样本数;ROC=接受者操作特征;标准=标准;vs=对比。
图9是显示子宫内膜异位症阳性样品、有症状对照样品和正常健康对照样品之间8.7kb缺失评分的差异的散点图。
图10是显示了子宫内膜异位症阳性样品、有症状对照样品和正常健康对照样品之间8.7kb缺失评分的差异的箱线图。
图11显示了比较子宫内膜异位症阳性患者对比健康/正常对照的8.7kb缺失的ROC曲线。
图12示出了8.7kb缺失的诊断准确性—有症状的对比所有子宫内膜疾病。通过计算ROC曲线下的面积,评估了8.7kb缺失对于区分有症状患者样本和确诊子宫内膜异位症患者样本(所有亚型/病期组合)的能力。缩写:CI=置信区间;ROC=接受者操作特征;标准=标准;vs=对比。
图13A至图13B进一步示出了8.7kb缺失的诊断准确性—对照对照亚型疾病。这些图示出了一项关于8.7kb缺失测定是否可以区分来自有症状的参与者的样本和来自按子宫内膜异位症亚型(腹膜、卵巢、深部浸润)分层的参与者的样本的研究。图13A显示了来自无症状和有症状对照、患有腹膜、卵巢或深部浸润性子宫内膜异位症的参与者的样本的标准化8.7kb缺失分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。还总结了每组的描述性统计数据。图13B至图13D显示了ROC曲线下的面积,其被计算以显示诊断准确性。缩写:AsCon=无症状对照;CI=置信区间;Dev=偏差;DIE=深部浸润性子宫内膜异位症;N=每组样本数;ROC=接受者操作特征;Sym Con=有症状对照;Std=标准;vs=对比。
图14A至14C进一步示出了8.7kb缺失的诊断准确性——对照对比疾病病期。这些图示出了8.7kb缺失检测是否可以区分来自有症状的参与者的样本和来自按子宫内膜异位症I/II和III/IV期分层的参与者的样本。图14A显示了来自有症状的对照、子宫内膜异位症的低(I/II)或高(III/IV)阶段的参与者的标准化8.7kb缺失分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。对每组总结了描述性统计数据。图14B和图14C显示了经计算以显示诊断准确性的ROC曲线下的面积。缩写:CI=置信区间;Dev=偏差;N=每组样本数;ROC=接受者操作特征;Sym Con=有症状对照;Std=标准;vs=对比。
图15进一步示出了8.7kb缺失对子宫内膜异位症的疾病特异性。该图总结了女性癌症(包括子宫内膜癌、卵巢癌和乳腺癌)中8.7kb缺失的频率的评估。来自子宫内膜癌、卵巢癌、乳腺癌、有症状对照以及患有腹膜、卵巢或深部浸润性子宫内膜异位症的参与者的标准化8.7kb缺失分布。箱边界代表第25个和第75个百分位数,中间的线代表中位数,而两端的线代表第90个(顶部)和第10个(底部)百分位数。点代表离群值(左)。
图16是显示子宫内膜异位症阳性样品、有症状对照样品和正常健康对照样品之间4.8kb缺失评分的差异的散点图。
图17是显示子宫内膜异位症阳性样品、有症状对照样品和正常健康对照样品之间4.8kb缺失评分的差异的箱线图。
图18示出了比较来自子宫内膜异位症阳性患者与有症状对照的数据的4.8kb缺失的ROC。
图19示出了比较来自子宫内膜异位症阳性患者与健康/正常对照的数据的4.8kb缺失的ROC。
图20示出了根据本说明书的缺失事件。
具体实施例
除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管下文描述了用于实践或测试本发明的合适材料和方法,但可以使用与本文所述的那些相似或等效的其他已知材料和方法。
如本文所用的关于mtDNA的术语“缺失”、“缺失片段”或“缺失序列”将被理解为指从野生型或天然存在的mtDNA基因组中去除或缺失的核苷酸序列或片段。
术语“野生型mtDNA”或“天然存在的mtDNA”是指修订的剑桥参考序列(CambridgeReference Sequence(rCRS))(2001,GenBank访问号:NC_012920.1),其在本文中作为SEQID NO:1提供。尽管该序列被识别为长度为16569bp,但核苷酸的实际数量为16568。如本领域已知的,该序列在位置3107处包括空位或占位核苷酸。
如本文所用的关于mtDNA的术语“突变”或“畸变”将被理解为与术语“缺失”同义。
在本说明书的上下文中使用的术语“突变的mtDNA”或“畸变的mtDNA”将被理解为是指在其基因组序列中具有至少一个缺失(如上定义)的mtDNA分子。
术语“连接(junction)”或“连接点”将被理解为是指重新环化的mtDNA分子的核苷酸序列中的位置,所述分子包括缺失去除后剩余的mtDNA基因组序列的重新连接或拼接的核苷酸。如本文进一步讨论的,缺失事件通常导致两个新序列片段的产生,其由对应于缺失去除后重新连接的mtDNA分子的亲本序列和对应于缺失部分的缺失序列组成。一般情况下,亲本序列比缺失序列长。如上所述,长片段和短片段通常都重新环化,分别形成已知的大sublimon和小sublimon。可以理解,两个sublimon在它们的核苷酸序列中都具有独特的连接点。因此,术语连接或连接点可用于指代大sublimon或小sublimon。
短语“具有缺失”将被理解为指一种mtDNA分子,其核苷酸序列中的缺失序列被去除。换言之,短语“具有缺失的mtDNA”是指亲本核酸。因此,“具有常见缺失的mtDNA”是指序列中不包括4977bp缺失序列的mtDNA分子。
如本文所用,术语“检测”将被理解为表示确定或识别和/或测量或量化在生物样品中特定特征的存在。一方面,术语“检测”将在本文中用于指识别线粒体DNA(mtDNA)序列,更具体地,具有缺失的mtDNA。术语“检测”还可用于指识别线粒体融合转录本和/或由这类mtDNA分子编码的蛋白质。在后一种情况下,蛋白质在本文中被称为“融合蛋白”并且将包括由缺失事件后重新连接的mtDNA的翻译产生的氨基酸序列。这种mtDNA可以包括亲本、或畸变mtDNA或缺失的序列。
如本文所用,术语“诊断”将被理解为表示疾病状况或疾病状态的识别或疾病状况或疾病状态存在的更高或增加的可能性的确定。例如,就本说明书而言,当检测到本文所述的mtDNA分子或融合转录本时,将认为存在或“诊断出”子宫内膜异位症状态或病症的较高存在概率。应当理解,状态或病症的实际存在或临床诊断将由临床医生在检查活检样本时或通过其他此类方式做出。因此,在一些情况下,术语“检测”和“诊断”在本文中可以互换使用。
如本文所用,术语“生物样品”将被理解为是指含有细胞或核酸的组织或体液,可从中获得目的分子。生物样品既可以直接从来源处获得,也可以最初进行预处理以改变样品的特性。一方面,生物样品是血液,特别是循环血,应当理解,本文使用的术语“血液”旨在包括血液衍生物,例如血浆和/或血清。在另一方面,生物样品是包括经血的月经液体。在另一方面,生物样品是从受试者获得的组织样品。一方面,循环血可用作生物样品。应当理解,为了本说明书的目的,可以从受试者身体上的任何来源抽取血样。这包括但不限于通过注射器等从静脉源抽取的血液、月经液体样本的收集或毛细血管血液(例如通过手指刺破抽取的血液)。采用目前描述的使用循环血液(包括如上所述的血液衍生物)的方法,提供了一种有效的手段来检测怀疑患有子宫内膜异位症的个体中子宫内膜异位症的存在,而不必经历不必要的痛苦和危险的侵入性手术。如上所述,在目前描述的方法表明存在子宫内膜异位症的情况下,诊断仍将需要临床评估,并且可能需要腹腔镜检查/手术或活检样本的分析。因此,应当理解,在一方面,当前描述的方法,特别是当使用循环血(或其一种或多种衍生物,如上所述)作为生物样品时,可以对患者亚群进行,包括那些有一种或多种迹象表明存在子宫内膜异位症的个体。还应当理解,当前描述的方法可以作为筛查子宫内膜异位症的初始阶段对一般人群进行。换句话说,目前描述的方法可以对无症状的受试者(即没有症状的个体)进行。
如本文所用,短语“线粒体融合转录本”或“融合转录本”是指作为mtDNA序列转录的结果产生的RNA转录产物。
如本文所用,术语“变体”是指不同于天然存在的序列但保留其基本或功能特性的核酸序列。一方面,术语“变体”可以指相对于野生型序列变化的序列。通常,在mtDNA的情况下,变体总体上非常相似,并且在许多区域中与选定的mtDNA序列相同。在本说明书的上下文中,变体可包括剪接基因的连接点的核苷酸中的至少一个并且还可包括与其相邻的一个或多个核苷酸。一方面,变体序列与本文所述的给定mtDNA序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性或是其互补链。
如本文所用,短语“基本相似”是指功能相同但其各自核酸序列不同的核酸。一方面,彼此基本相似的两个序列可称为“变体”。因此,当相应核酸序列之间的一个或多个核苷酸的差异不改变它们的功能特性或由此类核酸编码的任何多肽的功能特性时,可认为两个核酸分子基本相似。可以理解,由于遗传密码的简并性,碱基对的变化可能不会导致编码的氨基酸序列发生变化。
短语“基本互补性”是指核酸分子的核苷酸序列之间的足够高程度的互补性,允许其间杂交,但不一定是100%互补性。例如,与靶序列具有基本互补性的引物或探针可与靶序列具有80%至99%的序列同一性。一方面,如本文所用的基本互补性是指序列之间的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列一致性。
如本文所用,术语“片段”是指作为给定线粒体基因组序列或其互补链的一部分的核酸序列。一方面,这样的“部分”包括至少两个核苷酸,该核苷酸包括剪接基因的连接点,并且可以还包括与其相邻的一个或多个核苷酸。即,该部分包括去除缺失后重新连接或重新环化的DNA序列。本文所述的片段长度至少约150个核苷酸(nt)、至少约75nt、至少约50nt、至少约40nt、至少约30nt、至少约20nt或优选至少长约15nt。尽管上文列举了某些最小核苷酸长度,但将理解如本文所述,任何大小的片段(例如,50、150、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000或更多个核苷酸)也被考虑在内。
在序列长度的上下文中,如本文所用的术语“约”包括特别列举的值或在任一末端或在两个末端或多或少几个(5、4、3、2或1)个核苷酸的值。
如本文所用,术语“探针”或“引物”是指由于探针/引物的序列的至少一部分与目标分子的核苷酸序列的一部分的互补性,而与靶核酸形成双链体结构或与靶核酸“杂交”的寡核苷酸分子。在一些情况下,靶核酸分子可以是天然存在的核酸分子的片段。可根据本领域已知的方法标记本文所述的探针。应当理解,本文所述的探针或引物将在本领域技术人员已知的合适的杂交条件下使用。本文中的探针也可称为杂交探针。如本领域技术人员所理解的,本文所述的探针和引物可以是任何长度。仅作为示例,目前描述的探针和引物具有约150、140、130、120、100、90、80、70、60、50、40、30、25、20、15或10个核苷酸(nt)的长度。在一个优选的方面,本文所述的探针和/或引物长度为约12nt至约35nt,或优选长度为约18nt至约25nt,更优选长度为约15nt。本领域技术人员将理解,探针可以具有比引物更长的核苷酸长度。因此,在一些情况下,本文所述的探针的长度可为约50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、809、950、1000、1500、2000或2500个核苷酸。本说明书不限于任何特定的探针或引物长度。
在本说明书中可以使用术语“包含”或“包括”。如本文所用(包括说明书和/或权利要求),这些术语应被解释为指定所述特征、整体、步骤或组件的存在,但不排除存在对相关领域的普通技术人员而言显而易见的一个或多个其他特征、整体、步骤、组件或其群组。因此,本说明书中使用的术语“包括”是指“至少部分由……组成”。在解释本说明书中包括该术语的陈述时,在每个陈述中以该术语开头的特征都需要存在,但其他也可以存在特征。相关术语如“包括”和“包括”应以相同方式解释。
术语“和/或”可以表示“和”或“或”。
除非本文另有说明,否则冠词“一”在用于标识任何元素时并不旨在构成对仅一个的限制,而是将被理解为表示“至少一个”或“一个或多个”。
如本文所述,发明人已经识别了新的mtDNA缺失,其在一方面与子宫内膜异位症相关并因此构成这种病症的准确诊断标记。发明人还识别了在一方面与子宫内膜异位症相关的新型mtDNA融合转录本。下面将进一步讨论这两个方面。本说明书还包括由融合转录本产生的翻译产物。
在一方面,本描述涉及发明人的假设,即在月经期间从月经液体中脱落的子宫内膜细胞将具有与异位和/或在位子宫内膜病变中存在的子宫内膜样细胞相同的基因谱。利用从绘制人类线粒体基因组的大规模缺失、对这些缺失的高频率的观察以及其他疾病类型中转录活性突变mtDNA分子的证据中获得的知识,发明人进一步假设线粒体缺失和融合转录本可能存在于异位和/或在位子宫内膜病变中的子宫内膜样细胞中。
为了检验这些假设,基于整个线粒体基因组中预测的直接和间接重复,选择了268个线粒体融合转录本,并筛选了它们作为子宫内膜异位症的生物标志物的用途。许多mtDNA缺失和相应的融合转录本被发明人识别为在区分患有子宫内膜异位症的样品和没有子宫内膜异位症的样品中特别有用。这些缺失和融合转录本将在下面进一步讨论。这些mtDNA分子产生具有开放阅读框(ORF)的融合序列,可以通过线粒体转录机制进行转录,从而产生融合转录本。预计也会产生由这种融合转录本编码的蛋白质产物或融合蛋白。
1.0)mtDNA缺失、融合转录本和翻译产物
1.1)线粒体DNA(mtDNA)突变
如上所述,mtDNA突变通常包括mtDNA野生型序列的一部分的缺失。本描述基于特定mtDNA突变,特别是mtDNA基因组序列的缺失与子宫内膜异位症之间的关联。
根据本说明书,为了确定候选基因组序列,首先识别由序列缺失产生的连接点。序列缺失主要通过直接或间接的重复元件识别,这些重复元件位于待缺失的序列的5'和3'末端侧翼。从基因组中去除一部分核苷酸,然后连接剩余的基因组,会产生新的连接点。
在识别连接点后,确定连接点两侧基因的核苷酸以识别缝接基因。通常,缝接基因包含来自第一基因的起始密码子和第二基因的终止密码子,并且可以表达为连续转录本,即从两个缝接基因的开头到结尾都保持阅读框的转录本。还可能使用包含在基因序列中的替代起始或终止密码子。
线粒体基因组中的大规模缺失通常会导致突变过程产生两种产物。这些产物是mtDNA基因组两个部分重新环化的结果:1)一个短序列,在一方面,其可能对应于缺失的mtDNA序列;和2)一个长序列,在一方面,其可以对应于剩余的mtDNA基因组序列。应当理解,根据缺失的大小,缺失可能大于剩余的mtDNA。例如,当缺失的序列长度大于约8200bp时,就会发生这种情况。通常,短序列和长序列都重新环化以分别形成已知的小sublimon和大sublimon。在小组分的核苷酸数量不足的情况下,重新环化是不可能的,在这种情况下,突变过程只会产生一个大的sublimon。如本文所讨论的,可以识别大sublimon和小sublimon,从而允许使用这两种分子来检测、诊断和/或监测子宫内膜异位症。
1.2)融合转录本
线粒体基因组中的大规模重排突变导致融合转录本的产生。因此,预计与子宫内膜异位症相关的mtDNA重排将导致也与子宫内膜异位症相关的融合转录本。因此,本文提供了编码此类转录本的mtDNA和针对其的探针用于诊断和监测子宫内膜异位症的用途。
本说明书提供了可用于预测、诊断和/或监测子宫内膜异位症的方法中的融合转录本和相关杂交探针和引物的识别。本领域技术人员将理解,此类分子可通过天然存在的转录本的分离或可替代地通过根据本发明的方法分离的mtDNA分子的重组表达而衍生。如所讨论的,此类mtDNA分子通常包含具有来自第一基因的起始密码子和第二基因的终止密码子的缝接基因。因此,由其衍生的融合转录本包含与缝接基因相关的连接点。
1.3)翻译产品
基于本文所述的融合转录本,本说明书还提供了由主题融合转录本(subjectfusion transcript)的翻译产生的推定蛋白质(即,“融合蛋白”)的氨基酸序列。该描述还提供了融合转录本的至少一部分(特别是包含转录的融合位点或mtDNA的连接点的部分)的翻译产物。
可以通过已知的方法从生物样品中回收和纯化所描述的融合蛋白,这些方法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和色谱、羟基磷灰石色谱、疏水电荷相互作用色谱和凝集素色谱。最优选地,使用高效液相色谱法(“HPLC”)进行纯化。
可以使用多种技术测定生物样品中的融合蛋白水平。例如,可以用经典的免疫组织学方法研究组织中的蛋白质表达(Jalkanen etal.,J.Cell.Biol.101:976-985(1985);Jalkanen,M.,etal.,J.Cell.Biol.105:3087-3096(1987))。可用于检测蛋白质表达的其他方法包括免疫测定,例如酶联免疫吸附测定(ELISA)和放射免疫测定(RIA)。合适的抗体测定标记是本领域已知的并且包括:酶标记,例如葡萄糖氧化酶;和放射性同位素,例如碘(<125>I、<121>I)、碳(<14>C)、硫(<35>S)、氚(<3>H)、铟(<112>In)和锝(<99m>Tc);以及荧光标记物,例如荧光素和罗丹明;以及生物素。
描述的多肽也可以通过本领域已知的重组技术产生。通常这涉及用包含编码目标蛋白质或多肽的多核苷酸的表达载体转化(包括转染、转导或感染)合适的宿主细胞。
抗体和蛋白质结合剂
可针对本文所述的野生型或表达的融合蛋白或其抗原性多肽片段产生用于本发明的测定中的蛋白质特异性抗体,其可与载体蛋白例如白蛋白一起呈递到动物系统(例如兔子或小鼠),或者,如果它足够长(至少约25个氨基酸),则无需载体。应当理解的是,虽然描述了抗体,但也可以使用任何其他合适的、特异于识别蛋白质的结合剂。在任一情况下,抗体或结合剂都能够通过特异性结合代表或指示缺失的此类蛋白质的一个区域来识别本文所述的融合蛋白。一方面,融合蛋白具有独特的氨基酸谱(amino acid profile),其代表缺失事件后mtDNA分子(大sublimon或小sublimon)的连接点的翻译。
如本文所用,术语“抗体”(Ab)或“单克隆抗体”(Mab)是指包括完整分子及其抗体片段或抗原结合片段(例如,Fab和F(ab’)2片段),它们能够与线粒体融合蛋白特异性结合或对于线粒体融合蛋白具有“特异性”。Fab和F(ab’)2片段缺乏完整抗体的Fc片段,从循环中清除得更快,并且可能与完整抗体的非特异性组织结合较少(Wahl et al.,J.Nucl.Med.24:316-325(1983))。因此,这些片段是优选的。
本发明的抗体可以通过多种方法中的任一种来制备。例如,可以将表达线粒体融合蛋白或其抗原性片段的细胞施用于动物以诱导产生含有多克隆抗体的血清。在一种方法中,制备并纯化线粒体融合蛋白制剂以使其基本上不含天然污染物。然后将这种制剂引入动物以产生具有更大特定活性的多克隆抗血清。
在相关方法中,本说明书的抗体是单克隆抗体。此类单克隆抗体可以使用杂交瘤技术(Kohler et al.,Nature 256:495(1975);Kohler et al.,Eur.J.Immunol.6:511(1976);Kohler et al.,Eur.J.Immunol.6:292(1976);Hammerling et al.,in:Monoclonal Antibodies and T-Cell Hybridomas,Elsevier,N.Y.,(1981)pp.563-681)而制备。通常,此类程序包括用线粒体融合蛋白抗原或用表达线粒体融合蛋白的细胞免疫动物(优选小鼠)。
一方面,本说明书包括使用对本文所述的融合蛋白具有特异性的抗体或抗原结合片段(如上所述)的免疫学测定。包含抗体或抗原结合片段以及任何其他必要试剂、测试条、材料、说明等的试剂盒可以促进此类免疫学测定。
测定
测量生物样品中诸如融合蛋白的翻译产物的水平可以确定受试者中子宫内膜异位症的存在或进展。因此,一方面,本说明书提供了用于预测、诊断或监测子宫内膜异位症的方法,该方法包括获得一种或多种生物样品,从样品中提取线粒体融合蛋白,并通过以下方式测定样品中的此类分子:量化样品中一种或多种分子的量并将检测到的量与参考值进行比较。如本领域技术人员将理解的,参考值取决于该方法是寻求预测、诊断还是监测子宫内膜异位症。因此,参考值可以涉及从一种或多种对照样品或子宫内膜异位症非阳性生物样品、一种或多种子宫内膜异位症阳性生物样品和/或随时间采集的一种或多种生物样品采集的蛋白质数据。
用于对样品中蛋白质进行定量的技术是本领域众所周知的,包括例如典型的免疫组织学方法(Jalkanen et al.,J.Cell.Biol.101:976-985(1985);Jalkanen,M.,et al.,J.Cell.Biol.105:3087-3096(1987))。用于检测蛋白质表达的其他方法包括免疫测定,例如放射免疫测定(RIA)和酶联免疫吸附测定(ELISA)。
一方面,本说明书提供了一种检测、诊断或监测哺乳动物子宫内膜异位症的方法,该方法包括测定来自哺乳动物的组织样品中是否存在至少一种线粒体融合蛋白。
2.0)探针和引物
2.1)mtDNA探针和引物
本文还描述了能够在合适的杂交条件下与畸变的mtDNA序列杂交的mtDNA杂交探针和/或引物。可以使用任何已知的杂交方法。
探针和/或引物可以直接针对本文所述的示例性mtDNA融合分子(例如下表1中列出的那些)或其片段或变体产生。例如,本文讨论的畸变mtDNA序列可用于设计引物或探针,以检测包含目的融合核苷酸序列的核酸序列。如本领域技术人员所理解的,与这些核酸分子杂交的引物和/或探针可以在高度严格的杂交条件或较低严格条件下进行。这样的条件对于本领域技术人员来说是已知的并且在例如Current Protocols in MolecularBiology((John Wiley&Sons,New York(1989))的6.3.1-6.3.6节中所描述的。
在一些方面,本文所述的探针和引物含有畸变mtDNA的至少一部分互补的序列,该畸变mtDNA包含缝接基因的连接点。如上所述,该“部分”至少包括去除缺失后留在mtDNA基因组中的两个核苷酸,从而产生在本文中标识为A:B的连接点,其中“A”和“B”代表mtDNA缺失序列两侧的基因组核苷酸,但在剩余序列重新环化后彼此相邻。该“部分”还可包含与连接点相邻的一个或多个核苷酸。就此而言,本说明书包括任何合适的、使用涉及连接点A:B和/或邻近连接点A:B的核苷酸来选择mtDNA分子的靶向机制。本文进一步考虑引物和探针序列可以通过一个或多个碱基对改变,而同时仍然能够与靶序列杂交。此类引物或探针将被称为与靶序列具有“基本互补性”。如上所述,在缺失事件之后,可能产生大sublimon和小sublimon,一旦分子被重新环化,这两个sublimon将具有各自的连接点,例如上文定义的。
此外,一方面,本说明书包括设计成在正向或反向上跨越缺失连接或连接点A:B的引物。在另一方面,一个或多个引物可被设计为与靶序列上与连接点相邻的位置杂交。
本领域已知的各种类型的探针被考虑用于本说明书中。例如,探针可以是杂交探针,其与靶核苷酸序列的结合可以使用一般的DNA结合染料(例如溴化乙锭、
Figure BDA0003125697870000171
等)来进行检测。替代地,探针可并入一种或多种能够检测的标记物。能够检测的标记物是可以被直接或间接检测到的分子,并且以这样的方式选择能够检测的标记物,即,使得探针与其靶序列杂交的能力不受影响。标记核酸序列的方法是本领域众所周知的(例如参见Ausubel et al.,(1997&updates)Current Protocols inMolecular Biology,Wiley&Sons,New York)。
适用于本说明书的探针的标记包括那些能够直接检测的标记物,例如放射性同位素、荧光团、化学发光团、酶、胶体颗粒、荧光微粒等。本领域技术人员将理解,能够直接检测的标记物可能需要额外的成分,例如底物、触发试剂、光等以能够检测到标记物。本说明书还考虑使用能够间接检测的标记物。
如上所述,目前描述的探针和引物可以是本领域技术人员理解的任何合适的长度。本说明书的探针和引物的核苷酸长度在上面讨论过。如上所述,本文所述的探针和/或引物的长度可优选为约12至约25个核苷酸,更优选长度为约12至约15个核苷酸。应当理解,本文所述的引物和/或探针的长度可以优选地至少是mtDNA重复单元(即重复的)序列的大小。本说明书不限于任何特定的引物或探针长度。
本文所述的探针将优选与来自本文所述生物样品的核酸分子杂交,从而实现所述方法。因此,一方面,提供了用于检测子宫内膜异位症的杂交探针,其中所述探针与本文所述的畸变mtDNA分子的至少一部分或来自mtDNA基因组的缺失序列的一部分互补或基本互补。
2.2)融合转录本探针和引物
一旦融合转录本被表征,就可以开发引物或探针以靶向生物样品中的转录本。此类引物和探针可以使用任何已知方法(如上所述)或如下面提供的实施例中所述来制备。例如,可以为融合转录本生成探针,并且可以使用检测技术(例如PanomicsTM的QuantiGeneTM2.0)来检测样品中转录本的存在。引物和探针可以直接针对本文所述的示例性融合转录本或其片段或变体产生。例如,本文列出的序列(例如下表2中列出的序列)可用于设计探针或引物,以检测包含目的融合序列的RNA序列。
如本领域技术人员将理解的,设计用于与本文所述的融合转录本杂交的探针和引物包含与表达缝接基因的连接点的转录本的至少一部分互补或基本互补的序列。该部分包括与表达的连接点互补的至少两个核苷酸,并且可以进一步包括与其相邻的一个或多个互补核苷酸。在这点上,本说明书涵盖任何合适的靶向机制,其将选择使用涉及并邻近缝接基因的连接点的核苷酸的融合转录本。
本领域已知的各种类型的探针和标记方法被考虑用于制备本文所述的转录本探针。上文关于基因组序列的检测描述了此类类型和方法的一些示例。本发明的转录探针的长度为至少约150nt、至少约75nt、至少约50nt、至少约40nt、至少约30nt、至少约20nt或优选至少约12nt至15nt。例如,“长度至少为20nt”的探针旨在包括与本发明的mtDNA序列互补的20个或更多个连续碱基。当然,更大的探针(例如,50、150、500、600、2000个核苷酸)可能是优选的。如上所述,18nt至25nt的引物或探针是优选的。
在一些方面,提供了一种或多种用于检测子宫内膜异位症的杂交探针和/或引物,其中所述一种或多种探针和/或引物与本文描述的线粒体融合转录本的一部分至少互补或基本互补。
3.0)用于检测mtDNA缺失、融合转录本及其蛋白质产物的测定
如上所述,本说明书提供了线粒体DNA生物标志物,其可用于使用来自受试者的生物样品检测来诊断和/或监测受试者中的子宫内膜异位症。特别地,这种生物样本是非侵入性采集的月经液、循环血和/或组织(例如活检组织)。因此,一方面,本说明书提供了一种基于月经液或月经血的测试,其将能够及早准确地检测子宫内膜异位症,从而防止不必要的初始和重复外科手术。因此,当怀疑有子宫内膜异位症但未检测到时,本文描述的方法将减少对不必要的腹腔镜手术的需要。本方法还将通过允许随时间监测受试者的子宫内膜异位症来帮助确定子宫内膜异位症是否已经复发。
3.1)畸变mtDNA的测量
根据本文所述的方法,测量生物样品中本发明的一种或多种畸变mtDNA标记物的水平可以确定受试者中子宫内膜异位症的存在或病期或进展。因此,本说明书提供了用于检测、诊断和/或监测受试者中的子宫内膜异位症的方法,包括通过测量和/或定量来自受试者的生物样品中的一种或多种本文所述的畸变mtDNA生物标志物(或“标志物”)的量来测定所述样品中的一种或多种异常mtDNA标记。一旦量化,标志物的量可以与参考值(即对照)进行比较。参考值可以取决于该方法是寻求检测、诊断还是监测子宫内膜异位症。例如,在检测或诊断子宫内膜异位症的情况下,参考值可以包括来自健康受试者,即,未患有子宫内膜异位症的受试者的样品中的畸变mtDNA的量。此类样品在本文中可被描述为“已知的(或非涉及的)非子宫内膜异位”生物样品。或者,参考值可以包括来自已知患有子宫内膜异位症的受试者的样品中畸变mtDNA的量。这种样品在本文中可以被描述为“已知的(或涉及的)子宫内膜异位症”生物样品。当对照包括来自非子宫内膜异位源的值或量时,其在本文中可称为“非子宫内膜异位量”。在本文所述的其他方面,对照可包括来自相同生物样品的另一种分析物的参考值。在一些情况下,并且如本文进一步描述的,畸变mtDNA的量可以首先针对取自同一受试者的核DNA的量标准化,例如编码一个或多个管家基因的那些,例如编码rRNA的那些。一方面,所使用的核DNA序列可以编码18S rRNA。然后可以将mtDNA的标准化值与阈值进行比较。在检测或诊断子宫内膜异位症的情况下,受试者畸变mtDNA量的增加表明患有子宫内膜异位症。在监测子宫内膜异位症的情况下,可以随着时间的推移从受试者身上采集生物样品并在给定的时间段内进行比较。一种或多种本文描述的畸变mtDNA的量随时间增加表明受试者的子宫内膜异位症的发展、复发或进展。
当前描述的方法还包括针对本文描述的一组畸变mtDNA标志物来测定生物样品,其中该组包含两个或更多个主题mtDNA标志物。例如,这样的组可以包含2、3、4、5、6、7、8、9、10或更多个目前描述的mtDNA标志物。
在一个方面,本文提供了一种检测哺乳动物子宫内膜异位症的方法,该方法包括:通过将来自哺乳动物受试者的生物样品(例如血液、月经液、组织样品等)与至少一种能够识别或杂交如本文所述的突变mtDNA序列的杂交探针杂交,来测定样品中是否存在畸变mtDNA。特别地,并且如本文所述,此类探针具有适于与样品的mtDNA分子的一部分杂交的核苷酸序列,其中该部分包括本文所述的连接点。
在一些方面,本发明方法包括通过将来自哺乳动物的生物样品与至少两种适于与如本文所述的畸变mtDNA分子杂交的引物杂交来测定样品。一方面,引物之一可以设计有核苷酸序列,该核苷酸序列与具有如本文所述的连接点的mtDNA的一部分互补。在另一方面,引物可具有与邻近mtDNA连接点的区域杂交的核苷酸序列并适于与连接点重叠。
在另一方面,本说明书提供了一种用于检测子宫内膜异位症的方法,其中该测定包括:
a)使用至少一种本文所述的探针进行杂交反应以允许该至少一个探针与从生物样品中提取的畸变线粒体DNA序列杂交;
b)通过对与所述至少一种探针杂交的线粒体DNA的量进行定量来定量样品中所述至少一种畸变线粒体DNA序列的量;和,
c)将样品中线粒体DNA的量与至少一个已知参考值进行比较,其中:
-如果参考值包含与子宫内膜异位症无关的mtDNA的量,则样品中更高量的畸变mtDNA表明存在子宫内膜异位症;或者,
-如果参考值包含与子宫内膜异位症相关的mtDNA的量,则样品中更低量的畸变mtDNA表明不存在子宫内膜异位症。
本文还考虑了通过识别特定线粒体突变来诊断子宫内膜异位症的方法和筛选工具。可以使用任何已知的杂交方法来实施这样的方法,包括但不限于基于探针和/或引物的技术,包括单重和多重的分支DNA和qPCR。也可以使用具有匹配野生型或突变区的寡核苷酸探针和对照探针的阵列技术。可商购的阵列例如微阵列或基因芯片适用于目前描述的方法。
因此,通过检测生物样品中本文所述的畸变mtDNA分子,可以检测或诊断受试者的子宫内膜异位症。此外,通过定性或定量地测量和比较来自受试者的一定时间内连续样本中畸变mtDNA的量,可以监测该受试者的子宫内膜异位症的进展。
3.2)融合转录本的测量
测量生物样品中本文所述的线粒体融合转录本的水平还可以确定受试者中子宫内膜异位症的存在或病期或进展。因此,提供了用于检测、诊断和/或监测子宫内膜异位症的方法,包括从获取自受试者的一个或多个生物样品中提取线粒体RNA,并测定样品中对应于本文所述的畸变mtDNA的融合转录本。这种测定可包括:量化样品中一种或多种融合转录本的量并将检测到的量与参考值进行比较。参考值基于该方法是否寻求诊断或监测子宫内膜异位症。因此,参考值可以涉及从一种或多种已知的非子宫内膜异位生物样品、一种或多种已知的子宫内膜异位生物样品、一组已知的非子宫内膜异位或已知的子宫内膜异位样品和/或随着时间推移从受试者身上采集的一个或多个生物样品采集的转录数据。
一方面,本文所述的方法包括针对一组指示子宫内膜异位症的融合转录本标志物测定来自受试者的一个或多个生物样品,其中该组包括2、3、4、5、6、7、8、9或10个本文描述的RNA标志物。
因此,在一个方面,提供了一种检测哺乳动物子宫内膜异位症的方法,该方法包括:通过将来自所述哺乳动物的生物样品(例如血液、月经液或组织)与至少一种具有与线粒体融合转录本的至少一部分互补的核酸序列的杂交探针杂交,来测定来自样品中是否存在至少一种本文描述的融合转录本,其中所述部分包括线粒体融合转录本中的融合连接点。
在另一方面,提供了包括通过将样品与至少两种引物杂交来测定来自哺乳动物的生物样品的方法。如上所述,至少一个引物可以具有允许与融合转录本的一部分(包括融合连接点)杂交的序列。在其他方面,引物可具有允许与融合连接点的两侧区域杂交的序列。
在另一方面,本发明提供了一种如上的方法,其中测定包括:
a)使用至少一种上述探针进行杂交反应以允许该至少一种探针与互补的线粒体融合转录本杂交;
b)通过量化与所述至少一种探针杂交的转录本的量来量化样品中所述至少一种线粒体融合转录本的量;和
c)将样品中线粒体融合转录本的量与至少一种已知参考值进行比较,其中:
-如果参考值包含与子宫内膜异位症无关的线粒体融合转录本的量,则样品中更高的量表明存在子宫内膜异位症;和
-如果参考值包括与子宫内膜异位症相关的mtDNA的量,则样品中更低量的畸变mtDNA表明不存在子宫内膜异位症。
3.3)翻译蛋白的检测
本文描述的融合转录本的翻译产物、蛋白质可以使用公知的方法检测,例如利用抗体或其他此类特异性结合成分的免疫学测定。特别是,这些成分与翻译的融合位点或mtDNA的连接点特异性结合。
4.0)试剂盒
本说明书包括用于体外检测、诊断和/或监测受试者子宫内膜异位症的诊断或筛选试剂盒。此类试剂盒优选地包括一种或多种本文所述的探针或引物,任选地与进行测定可能需要的试剂、说明书、工具和/或容器等组合。
试剂盒可以包括进行诊断测定所需的试剂,例如缓冲液、盐、检测试剂、抗凝剂等。试剂盒中还可以包括其他成分,例如用于生物样品的分离和/或处理的缓冲液和溶液。试剂盒的一种或多种组分可以被冻干并且试剂盒可以进一步包含适合于重构冻干组分的试剂。
在适当的情况下,本文所述的试剂盒还可包含取样工具、反应容器、混合容器和/或其他组件以促进测试样品的采集和/或制备。该试剂盒还可以任选地包括使用说明书,其可以以纸张形式或计算机可读形式(例如光盘、CD、DVD等)提供。
一方面,本说明书提供了一种用于进行体外测定以检测和/或诊断子宫内膜异位症的试剂盒,其包含本文所述的杂交探针和用于进行测定的至少一种试剂。
一方面,本文所述的试剂盒包含至少一种杂交探针,其与本文所述的畸变mtDNA的至少一部分或本文所述的线粒体RNA融合转录本的至少一部分互补。如上所述,一方面,探针与之杂交的序列部分包含mtDNA或融合转录本中的连接点或融合连接点。一方面,该试剂盒可包含一种或多种适于与一种或多种对照序列杂交的探针。
在另一方面,本文所述的试剂盒包含一对引物,例如正向和反向引物,用于扩增本文所述的畸变mtDNA的至少一部分或本文所述的线粒体RNA融合转录本的至少一部分。一方面,引物中的至少一种具有适合与mtDNA或融合转录本中的连接点或融合连接点杂交的核苷酸序列。在另一方面,引物中的至少一种具有适于与mtDNA或融合转录本的序列杂交的核苷酸序列,该mtDNA或融合转录本的序列与mtDNA或融合转录本中的连接点或融合连接点相邻。一方面,该试剂盒可包含一种或多种适合于与一种或多种对照序列杂交的引物或引物对。
5.0)示例性mtDNA突变、融合转录本、翻译产物、探针和引物
下面描述了已发现可用于当前要求保护的方法的mtDNA突变(或畸变mtDNA)和融合转录本。还提供了推定的翻译产品,并且由于同样的原因相信它们也很有用。下面还提供了可用于检测主题mtDNA和融合转录本的探针和引物序列。
5.1)示例性mtDNA突变
表1列出了所研究的畸变mtDNA分子(即,具有缺失的mtDNA分子)。所列序列基于野生型线粒体基因组(SEQ ID NO:1)的修饰,并已被指定为融合或“FUS”名称。当出现“AltMet”时,其是指替代翻译起始位点。表1中列出的序列是mtDNA基因组的各个部分,其在去除主题缺失(subject deletion)后重新连接或重新环化。
表1:mtDNA畸变。
Figure BDA0003125697870000231
Figure BDA0003125697870000241
在表1中,“缺失ID”是从筛选的那些中识别mtDNA缺失的参考。“SEQ ID NO”表示本文归属于主题mtDNA缺失的核苷酸序列标识符。“缺失名称”标识了“FUS”名称,其中A:B代表第一缝接基因的最后一个线粒体核苷酸和第二缝接基因的第一个线粒体核苷酸之间的连接点。“缺失的位置”标识了从亲本mtDNA分子中缺失的相应序列的部分。下列的“缝接基因”标识了由缺失产生的缝接基因。在这方面,ATP8代表ATPase8,ATP6代表ATPase6,CO2代表COII,CO1代表COI。“mtDNA位置”标识对应于野生型mtDNA基因组(即SEQ ID NO:1)的mtDNA序列片段。“连接位点”识别去除缺失后突变的mtDNA的连接点的位置(基于野生型mtDNA基因组,SEQ ID NO:1)。因此,举例来说,对于具有“连接位点”7586-7992/15730-15887的缺失ID No.4(SEQ ID NO:3),缺失的mtDNA区段包括核苷酸7993至15729。在这种情况下,一旦重新环化,畸变mtDNA在核苷酸7992和15730处包含一个连接点。该列括号中的部分标识了相应SEQ ID NO.中的缝接位置。最后一列标识了缺失侧翼的重复序列。方括号中显示的重复与第三列中显示的缺失一起被缺失。
如表1所示,侧翼重复序列之一与缺失的序列一起被去除,因此形成缺失的序列的一部分。然而,其他重复序列也可能包含在缺失中。这种缺失机制如图20所示,其显示了亲本mtDNA分子10,其中,12和20代表mtDNA分子的相对末端,并且16代表缺失或缺失序列(如表1第三列中所述))。重复序列在14和18处表示。在缺失事件期间,重复序列14或18中的一个与缺失16一起被缺失,因此构成缺失16的一部分。因此,剩余的亲本mtDNA,一旦重新环化,将包括片段12-18-20或片段12-14-10,如图20所示。尽管如上所述,一个完整的重复单元被描述为包含在缺失的序列中,但有可能只有一个或两个重复的一部分可以包含在缺失中。
根据本说明书的突变mtDNA序列可以包含导致产生融合转录本的任何修饰。此类修饰的非限制性实例包括插入、易位、缺失、复制、重组、重排或其组合。
检测目前描述的mtDNA突变的步骤可以选自本领域技术人员已知的任何技术。例如,分析mtDNA可以包括通过分支DNA选择靶标、测序mtDNA、通过PCR扩增mtDNA、Southern印迹杂交、Northern印迹杂交、Western印迹杂交、South-Western印迹杂交、变性HPLC、与微阵列、生物芯片或基因芯片的杂交、分子标记分析、生物传感器、熔解温度分析或上述任意的组合。
还考虑了本文识别的mtDNA序列的变体或片段。本说明书包括这些序列的变体或片段用于诊断和/或监测子宫内膜异位症的用途。
5.2)示例性融合转录本
用于本文所述方法的示例性融合转录本提供于表2中。检测到这些融合转录本并发现这些融合转录本可用于检测、诊断和/或监测子宫内膜异位症,如实施例中所示。
表2:本发明的融合转录本。
Figure BDA0003125697870000261
在表2中:“转录本编号”是分配给融合转录本的识别编号并且也对应于表1的mtDNA缺失ID编号。“mtDNA缺失SEQ ID NO是来自表1的mtDNA缺失序列标识符。”转录本SEQID NO”是主题融合转录本的序列标识符。“融合转录本名称”标识了“FUS”名称,其中,A:B代表第一缝接基因的最后一个线粒体核苷酸和第二缝接基因的第一个线粒体核苷酸之间的连接点。“侧翼基因”识别由缺失产生的缝接基因。“缺失连接点”标识了缺失去除后mtDNA分子的连接点的位置。
天然存在的融合转录本可以从生物样品中提取并根据本领域已知的任何合适的方法进行识别,例如本说明书的实施例中描述的那些方法。
融合转录本也可以通过本领域已知的重组技术产生。通常,这涉及用包含感兴趣的mtDNA序列的表达载体转化(包括转染、转导或感染)合适的宿主细胞。
还考虑了本文识别的融合转录本的变体或片段。
5.3)融合抄本的示例性翻译产品
表3中提供了与mtDNA缺失1、4、14、16、120、122、193、400、516、586、8590和2767的转录本对应的推定氨基酸序列。
表3:对应于本说明书的融合转录本的推定氨基酸序列
Figure BDA0003125697870000262
Figure BDA0003125697870000271
实施例
提供以下实施例以进一步说明本说明书的各个方面。这些示例无意以任何方式限制描述的范围。
实施例1:子宫内膜组织中的大规模融合转录本筛选
在子宫内膜组织样品上筛选了对应于融合转录本的268种探针,以寻找从子宫内膜异位症患者获得的样品中相对于对照样品中的差异表达的证据。筛选方法和结果在下文中描述。
探针库的生成
使用专有的核苷酸碱基对重复发现程序识别了268个探针。该程序基于直接和间接重复元件识别了超过16000个潜在的缺失,这些元件位于待在5'和3'末端缺失的序列的侧翼。268个探针的选择是基于至少需要8个碱基对重复单元的标准;然而,少于8个碱基对重复单元的缺失也是可能的。例如,缺失16的重复单元为3bp。
组织样品
获得大的子宫内膜样品(>0.49g)。由医生在手术时确定的组织的“状态”或诊断以及手术原因如表4所示。
表4:组织样品。
样品ID 状态/手术原因
4360 子宫内膜异位症(卵巢囊肿)
3461 子宫内膜异位症(卵巢子宫内膜异位囊肿)
3462 子宫内膜异位症(卵巢囊肿,疼痛)
3463 对照(手术前已患有子宫内膜异位症7-8年;可能的输卵管结扎手术时不存在)
3464 对照(子宫肌瘤)
3465 对照(可能的输卵管复通术)
3466 对照(疑似子宫内膜异位症病灶的消融治疗)
使用表4中列出的样品,使用用于“新鲜或冷冻动物组织”的QuantiGeneTM样品处理试剂盒制备组织均质。对于每个样品,切取4份冷冻子宫内膜组织并称重(每份约100mg),然后加入到含有60μL蛋白酶K的6mL均质溶液中。使用Qiagen的组织破裂探针使样品均匀化,然后在65℃下培育过夜。然后通过以16000xg离心两次15分钟来澄清均质。保存上清液并用作后续分支DNA测定的模板。或者,根据组织方案,使用Qiagen的QiaAmpTMDNA Mini Kit从组织均质或直接从新鲜冷冻组织中提取DNA。然后在NanodropTM分光光度计上对DNA进行定量,并进行标准化以供随后在qPCR反应中使用。
可以使用许多分子技术中的一种来检测线粒体DNA缺失和产生的融合转录本。在此,分支DNA和定量PCR技术分别用于检测融合转录本和亲本畸变mtDNA分子。
分支DNA平台
对于组织样品,遵循Panomics的QuantigeneTM2.0方案“从新鲜、冷冻或FFPE组织均质中捕获目标RNA”。由水、裂解液、封闭剂和探针组成的工作探针集合首先添加到捕获板上。本实施例中使用的探针(或“捕获探针”)包含被设计(具有互补核苷酸序列)成结合编码上表2中列出的相应融合转录本的mtDNA的连接点的寡核苷酸。特别是,用于分支DNA(bDNA)分析的探针是下表5中列出的那些。
然后将均质加入到捕获板并在55℃培育过夜以实现探针-模板杂交。在一系列洗涤和杂交步骤之后,加入化学发光底物。与探针-模板杂交体结合的碱性磷酸酶降解产生发光信号,报告为相对发光单位(RLU)。每个捕获板一式两份读取,并在Promega GlomaxTM光度计上测量RLU。对RLU值进行了生物信息学分析。一式两份的平板读数以及一式三份的值均取平均值,前提是它们的CV(变异系数;即,标准偏差与平均值的比率)为15%。此外,确定RLU值是否高于给定探针的背景。具体而言,计算定量下限LOQ(LOQ=探针背景的RLU平均值加上背景平均值的10个标准偏差)并从样品RLU中减去。然后将样品RLU值转换为log2或log10值,以便于分析。最后,对于任何给定的探针,通过从样品RLU中减去或除以管家(HK)RLU,将样本RLU标准化。在3个子宫内膜异位症阳性和4个对照子宫内膜样品上测试探针1、4、14、120、122、193、400、516和586(其中,探针编号与上面提供的融合转录本编号对应)的标准化结果显示在图2A到图2J中并总结在下面的表5中。
表5:融合转录本的性能
Figure BDA0003125697870000281
Figure BDA0003125697870000291
表5显示了对照和子宫内膜异位症阳性(“Endo.Pos.”)组织样品的平均标准化RLU值(Log2LOQ探针-Log2LOQHK23),对应于图2A到2J中所示的散点图。提供了两个组织群组之间的平均差异以及差异的显着性。给定融合转录本(即探针1、4、14、16、400、586、120、122、193和516)的平均拷贝数也显示在表5中。
qPCR反应
对转录本编号1、4、14、16、120、122、193、586、8590和2767进行qPCR分析(见下表6)。使用无核酸酶的超纯水将纯化的DNA提取物标准化至0.25ng/μL的浓度。qPCR反应是在室温下使用Qiagen的QuantitectTMSybr
Figure BDA0003125697870000293
PCR试剂盒在昏暗光线下建立的。根据目标,将10μL模板以及0.025至0.0625μL的100μM正向和0.025至0.0625μL的100μM反向引物一起添加到12.5μL的2X预混合物中。为特定的DNA靶标设计了引物序列,这些序列显示在表6(连接引物)和7(侧翼引物)中。如本文所用,术语“连接引物”应理解为指与靶DNA分子的一个区域杂交的引物,该区域具有在去除缺失后形成连接点的核苷酸对中的至少一个。因此,一方面,连接引物可以与形成连接点的两个核苷酸或仅这些核苷酸中的一个重叠。如下表所示,在某些情况下使用了不止一套引物。使用PCR级H2O将反应液补足至25μL的终体积。反应混合物在Chromo 4TM(Biorad)或Opticon 2TM(MJResearch)实时PCR循环仪上循环。
表6:qPCR反应中用于靶向大规模mtDNA缺失的连接引物序列
Figure BDA0003125697870000292
Figure BDA0003125697870000301
Figure BDA0003125697870000311
Figure BDA0003125697870000321
表7:qPCR反应中用于靶向大规模mtDNA缺失的侧翼引物序列
Figure BDA0003125697870000322
Figure BDA0003125697870000331
结果与讨论
如上所述,在本研究过程中筛选了大约268个融合转录本,从中选择了10个子宫内膜异位症标志物用于进一步研究,如本文更详细讨论的。特别是,如本文所述,子宫内膜组织中与缺失ID No.1、4、14、16、120、122、193、400、516和586(即,分别为SEQ ID NO:13至SEQID NO:15以及SEQ ID NO:17至SEQ ID NO:23的转录本)相关的融合转录本水平升高被发现与子宫内膜异位症有关。每个转录本的存在是通过测定各自的探针来确定的,所述探针具有与至少一部分具有连接点的转录本互补的核苷酸序列。
所有融合转录本探针的散点图和性能显示在图2A至图2J和表5中。图3示出了跨越线粒体基因组的融合转录本的位置、基因组内的基因位置和本发明的10个mtDNA融合转录本(即,“探针”或“靶标”)在基因组内的位置由跨越每个缺失的长度的线表示。对应于上述融合转录本的探针针对3个子宫内膜异位症阳性和4个子宫内膜异位症阴性子宫内膜样品进行测试(见表1)。对于每个样品,RLU值针对管家基因转录本HK23(人类β-2-微球蛋白)、HK25(人类GAPD)和HK18(肽基-脯氨酰异构酶B)获得的RLU值进行标准化。
基于本研究的结果,得出的结论是融合转录本1、4、14、16、120、122、193、400、516和586(即,分别具有SEQ ID NO:13至SEQ ID NO:15以及SEQ ID NO:17至SEQ ID NO:23所示的序列的转录本)可用于检测子宫内膜异位症,尤其是通过测定子宫内膜组织。特别是,在本研究中,已发现子宫内膜组织样本中主题转录本水平升高与子宫内膜异位症高度相关。主题融合转录本的检测可以使用上文识别的探针来实现,所述探针具有与相应融合转录本的至少一部分的核苷酸序列至少基本上互补的核苷酸序列,其中该部分包括连接点,以使得探针与各自的融合转录本杂交。
基于这些发现,还得出结论,具有上述缺失1、4、14、16、120、122、193、400、516和586(即,分别具有SEQ ID NO:2至SEQ ID NO:4以及SEQ ID NO:6至SEQ ID NO:12所示的核苷酸序列的缺失)可用于检测子宫内膜异位症。可以通过在重新环化(即,重新环化的大sublimon)后识别亲本mtDNA的连接点来识别这种缺失。可以使用具有与至少一部分包括连接点的mtDNA核苷酸序列至少基本互补的核苷酸序列的探针来识别连接点,使得探针与相应的mtDNA杂交。也可以使用引物识别连接点,其中引物中的至少一种具有与具有连接点的mtDNA核苷酸序列基本上互补的核苷酸序列。替代地,引物可包括具有基本上与连接点相邻的mtDNA序列至少互补的核苷酸序列的对。
类似地,可以得出结论,也可以通过识别重新环化后缺失序列的连接点(即,重新环化的小sublimon)来识别缺失。
来自融合转录本的翻译产物(即,分别具有SEQ ID NO:24至SEQ ID NO:26、SEQ IDNO:28至SEQ ID NO:34以及SEQ ID NO:84所示的氨基酸序列的融合蛋白)也可用于此类检测方法。
因此,如本文所述,提供了一种用于检测子宫内膜异位症的方法,其中,该方法包括使用探针和引物来识别上述融合转录本或畸变mtDNA。这些探针和引物分别具有与此类线粒体融合转录本及其亲本畸变mtDNA分子互补的核酸序列。特别地,本文所述的探针被设计为至少基本上与编码对应于重新连接的(或重新环化的)mtDNA的转录连接点的融合转录本互补。此处描述的引物优选被设计为使得引物对之一具有核苷酸序列,该核苷酸序列与在移除此处描述的缺失之后的畸变重环化mtDNA的连接点互补。还应当理解,可以设计其他引物对,其中引物对之一至少与重新环化的缺失序列的连接点基本互补,或者其中引物对至少与邻近连接点的mtDNA核苷酸序列基本互补。
实施例2:循环血样中mtDNA缺失的检测
在该实施例中,研究了线粒体DNA、mtDNA、缺失作为子宫内膜异位症的潜在生物标志物。该研究主要关注从循环血液样本中获得的mtDNA缺失。研究了七个缺失。这些缺失中的两个,通过使用采集自潜在具有子宫内膜异位症症状的育龄妇女的微创血液样本,确定了“1.2kb缺失”和“3.7kb缺失”作为生物标志物具有很高的诊断准确性,下面将进一步讨论。上面讨论了1.2kb缺失和3.7kb缺失,其中,1.2kb缺失被识别为缺失“193”,3.7kb缺失被识别为缺失“14”或“14a”。这些缺失的这些特征在前面的表1中进行了总结,但为方便起见,再次提供在表8中。应当理解,本文对“3.7kb缺失”的引用将被理解为对缺失14或缺失14a的引用。
表8:实施例2中研究的mtDNA畸变
Figure BDA0003125697870000351
如前所述,1.2kb缺失是指从野生型mtDNA基因组(SEQ ID NO:1)中缺失9087-10312位核苷酸。因此,这样的缺失导致具有碱基0-9086和10313-16568的大sublimon,当重新环化时,在核苷酸9086和10313之间具有连接点。类似地,3.7kb缺失是指核苷酸9189-12905的缺失,产生具有碱基0-9188和12906-16568的大sublimon,当重新环化时,在核苷酸9188和12906之间具有连接点。
如上所述,虽然已经讨论了大sublimon的重新环化,但是小sublimon的这种重新环化也是可能的,其中,重新环化的小sublimon具有所示的独特的连接点。在本研究中,在测序样品过程中识别了对应于1.2kb缺失和3.7kb缺失的小sublimon。因此,本实施例中的发现可以扩展到检测由本文所述的缺失产生的小sublimon。
方法
参与者和样品采集
本研究利用从前瞻性登记的患者中采集的残留的去标识临床样本,作为牛津大学约翰拉德克利夫医院牛津子宫内膜异位症护理中心的EndOx研究(EndOx study at OxfordEndometriosis CaRe Centre,John Radcliffe Hospital,University of Oxford)的一部分。简而言之,从因盆腔疼痛(有症状)或输卵管结扎(无症状)而怀疑患有子宫内膜异位症而计划接受腹腔镜检查的女性中采集样本。研究参与者是女性,年龄在18岁或以上(直到更年期),并且被确认没有怀孕。所有样本均根据获得国家研究伦理服务(Oxfordshire RECA,09/H0604/58)适当伦理委员会批准的研究方案获得。所有临床样本均进行匿名处理,以保护来源患者的身份。该研究的设计、实施和报告符合国际协调理事会(InternationalCouncil for Harmonisation)、良好临床实践的三方协调准则(Harmonised TripartiteGuidelines for Good Clinical Practice)、适用的当地法规以及赫尔辛基宣言(Declaration of Helsinki)中规定的伦理原则。所有患者在参与前均给予书面知情同意。
在手术前采集血液样本和广泛的临床表型数据。根据标准化的WERFEPHect程序采集、运输和储存研究样本[26,41-44]。
患者群体/研究群组
本研究中使用的临床样本被分类为无症状对照、经手术证实不存在子宫内膜异位症的有症状对照或经手术证实的子宫内膜异位症病例。无症状对照被定义为从接受预定输卵管结扎术而没有临床怀疑子宫内膜异位症的患者身上采集的样本,并且通过手术证实没有子宫内膜异位症。有症状的对照被定义为从有疼痛或其他症状(不包括不孕症)且临床怀疑子宫内膜异位症的患者身上采集的样本,但经验丰富的妇科医生通过腹腔镜检查没有发现子宫内膜异位症病变。
子宫内膜异位症由手术外科医生使用修订后的美国生殖医学学会(rASRM)子宫内膜异位症分类进行评分[45]。病例按疾病亚型(腹膜、卵巢、深部子宫内膜异位症)和rASRM分期分组,I期到IV期分别代表轻微、轻度、中度和重度疾病。
样品处理、加工和mtDNA扩增
DNA提取
使用QIAamp 96QIAcubeHTTM提取试剂盒(Qiagen,Crawley,UK)从200μL血浆中提取总DNA,在QIAcube HTTM系统(Qiagen,Crawley,UK)上自动化。提取的DNA在200μL的AE缓冲液中洗脱。
mtDNA缺失实时qPCR
使用96孔微孔板(Bio-Rad,Hemel Hempstead,UK)在20μL反应中进行扩增。每孔含有5μL未标准化的DNA模板、1×SYBR
Figure BDA0003125697870000373
预混液和250nM的相应引物。用于反应的引物在表9中提供。
表9:用于扩增1.2kb缺失和3.7kb缺失的引物序列
Figure BDA0003125697870000371
使用Chromo4TM实时PCR检测系统(Bio-Rad,Hemel Hempstead,UK)分析PCR和SYBR
Figure BDA0003125697870000372
I荧光。1.2kb缺失的循环条件如下:95℃下3分钟,随后进行5个循环的95℃下30秒、67℃下30秒、72℃下30秒;对于随后的每个循环,退火温度以0.5℃的增量降低。扩增条件为:95℃下30秒、65℃下30秒、72℃下30秒,共45个循环。所有其他缺失均按照45个循环的标准方案进行扩增,即,95℃下30秒、58-65℃下30秒和72℃下30秒。扩增后,从70℃到90℃进行熔解曲线分析,每0.5℃读取一次。每个样品板和对照板在三个不同的场合一式三份扩增。
使用18S rRNA进行实时qPCR标准化
使用18S rRNA核DNA基因标准化靶扩增子数量。扩增反应在96孔微孔板中作为20μL反应进行。每孔含有5μL未标准化的DNA模板、1×SYBR
Figure BDA0003125697870000374
预混液和200nM的每种引物。使用Chromo 4实时PCR检测系统分析扩增和SYBR
Figure BDA0003125697870000375
I荧光。扩增条件为:95℃下3分钟,随后进行40个循环的95℃下30秒、64.5℃下30秒、72℃下30秒。扩增后,从70℃到90℃进行熔解曲线分析,每0.5℃读取一次。
质量控制
使用CFX manager software回归模型(Bio-Rad,HemelHempstead,UK)计算量化循环(Cq)。将每个缺失扩增子的Cq标准化为多拷贝核靶标18S rRNA基因扩增子的Cq。所有样品在单独的平板上一式三份扩增,如果三个重复中至少有两个在1.5Cq内并且解链温度(Tm)与存在的目标扩增产物一致,则认为已通过,(缺失Tm 81℃±2℃,18S rRNA Tm 82℃±2℃)。
与每批DNA提取物一起处理两个无模板对照样品,并证实缺失靶标和18SrRNA基因的扩增均为阴性。每个PCR板上都包含两个无模板对照反应,并证实缺失靶标和18S rRNA基因的扩增均为阴性。使用rho 0细胞DNA(用以检测线粒体假基因扩增)以及来自健康男性口腔拭子的DNA和从rho 0亲本细胞系(线粒体耗尽之前)提取的DNA评估缺失引物特异性。
对于第一轮标准PCR反应,使用Repli-GTM线粒体DNA试剂盒(Qiagen)对从确诊的子宫内膜异位症患者中提取的DNA进行全基因组扩增,以确保在该阶段有足够的DNA量。
准备Rho0细胞
如前所述准备Rho 0细胞[46]。简而言之,来自人骨癌细胞系143B(ATCCCRL-8303)的细胞用溴化乙锭处理以消耗细胞质线粒体DNA。细胞在含有丙酮酸、L型谷氨酰胺、尿苷(50μg/ml)和5%FBS的高葡萄糖DMEM中生长至融合。
统计分析
没有进行正式的样本量计算;使用的临床样本数量被认为足以满足研究目标。
对于qPCR,从所有样本一式三份扩增靶标并计算平均Cq值。通过相对于18S rRNA参考扩增子量化缺失扩增子来确定标准化缺失值(ΔCq)。使用Graphpad PrismTM5.0(Graphpad softwareInc.,LaJolla,CA,USA)进行统计分析,以得到接受者工作特征(ROC)曲线和描述性统计数据。SPSS v17.0(IBM Corp.,Armonk,NY,USA)用于执行相关性和显着性检验。使用分类数据的计数和百分比以及连续变量的平均值、标准偏差(SD)和范围来总结临床特征。分别使用Student t检验和Mann-Whitney U检验比较两组的参数和非参数分布的平均值。用Pearson相关系数(r)评估两个变量之间的相关性。关于子宫内膜异位症的存在,除了6.5kb缺失外,其他所有的都构建了ROC曲线。ROC的曲线下面积(AUC)以及选定截断值(如下所述)处的灵敏性和特异性是用95%置信区间(CI)计算的。对于所有测试,p值<0.05被认为是统计学显著的。
结果
患者群体和临床样本
在表10中总结了供评估1.2kb缺失和3.7kb缺失的临床样本的患者的人口统计学和临床特征。
表10:人口统计学和临床特征
Figure BDA0003125697870000391
缩写:N=患者/样本的数量;SD=标准偏差。(1)呈现平均值(SD);为样本采集时提供年龄的患者计算平均值和标准偏差。(2)样本采集后3个月内患者的状态。(3)样本采集时患者的月经状况。
用于1.2kb和3.7kb评估的患者和样本的临床和人口统计学特征相似和不同,因为仅包括那些具有18S rRNA的配对qPCR结果且每个缺失满足之前所述的接受标准的样品。
1.2kb缺失群体
在1.2kb缺失评估中使用了171个样本。提供样本的患者的平均(SD)年龄为34.2(6.8)岁。对照组和病例组的平均年龄相似,平均(SD)年龄分别为36.6(6.9)和33.7(6.7)岁,无统计学差异(p=0.113)。在用于评估的171例患者样本中,116例(67.8%)患者报告在样本采集前三个月内未接受激素治疗,48例(28.1%)报告在样本采集前三个月内接受过激素治疗,7例(4.1%)未确定。使用与患者正常周期长度相关的采血日期之前的最后一次月经期(LMP)计算月经周期阶段数据。24名(14.0%)患者报告没有月经(其中19名服用激素),12名(7.0%)报告月经不调,31名(18.1%)处于月经期(从LMP的第一天起1至5天之间),44人(25.7%)处于卵泡期(LMP后5至14天),60人(35.1%)处于黄体+延长月经期(LMP后大于15天)。
对照组共包括28份样本;18(64.3%)份样本采集自有症状患者(除了不孕症和手术证实没有该疾病外,表现出与子宫内膜异位症一致的症状)和10(35.7%)份样本采集自计划进行输卵管结扎术的无症状患者。测试组包括来自具有三种疾病亚型(腹膜、卵巢和深部浸润性[DI]子宫内膜异位症)的患者的143份样本,这些亚型分为四个阶段(rASRM I至IV)。腹膜子宫内膜异位症女性样本49份(34.3%),卵巢子宫内膜异位症女性样本45份(31.5%),深部子宫内膜异位症女性样本49份(34.3%)。63份(44.1%)样本来自I期患者,21份(14.7%)为II期,29份(20.3%)为III期,28份(18.6%)为IV期。两个(1.4%)样本的疾病病期未知。
3.7kb缺失群体
181个样本用于3.7kb缺失评估。提供样本的患者的平均(SD)年龄为34.4(6.9)岁。对照组和病例组的平均年龄相似,平均(SD)年龄分别为37.2(6.8)和33.8(6.8)岁,没有统计学差异(p=0.166)。119名(65.7%)患者报告在样本采集前三个月内未接受激素治疗,55名(30.4%)报告在样本采集前三个月内接受过激素治疗,7名(3.9%)未确定。26名(14.4%)患者报告没有月经,15名(8.3%)报告月经不调,31名(17.1%)处于月经期(1至5天),44名(24.3%)处于卵泡期(5至14天),65人(35.9%)处于黄体+延长月经期(>15天)。
对照组共包括32份样本;19(58.4%)份样本采集自有症状患者,13份(40.6%)样本采集自无症状患者。测试组包括149个样本。腹膜子宫内膜异位症女性样本52份(34.9%),卵巢子宫内膜异位症女性样本47份(31.5%),深部子宫内膜异位症患者50份(33.6%)。65份(43.6%)样本来自I期女性,24份(16.1%)为II期,30份(20.1%)为III期,28份(18.8%)为IV期。两个(1.3%)样本的疾病病期未知。
mtDNA缺失和初步评估——标准PCR
根据序列组成、线粒体基因组主弧(在此报告了成比例的更多缺失[47]和先前在子宫内膜组织中的观察(数据未显示))内侧翼重复位置的存在,最初选择了七个候选缺失用于评估。在以下基因组区域内选择缺失:CO2至ATP6(1.0kb缺失);ATP6到ND3(1.2kb缺失);ATP8到ND4(2.4kb缺失);ATP6到ND5(3.7kb缺失);ATP8到ND5(5.0kb缺失);CO1到ND5(6.5kb缺失);和CO2到CytB(7.7kb缺失)。凝胶电泳后的第一轮标准(定性)PCR和可视化用于预识别每个缺失靶标并确定每个候选物是否:(i)是能够检测的;(ii)有足够的拷贝数进行可靠检测;(iii)具有预测的扩增子大小;(iv)是特异性的并且不会共同扩增核假基因或产生非特异性扩增产物。
在血浆中循环能够检测到所有七种预测缺失。然而,5.0kb和6.5kb缺失扩增了rho0细胞DNA,表明核线粒体假基因(numts)的潜在共扩增。此外,6.5kb缺失的拷贝数不足,不被认为是进一步QPCR测试的可行候选者。7.7kb和2.4kb缺失的拷贝数较低,但仍有可能用QPCR检测到,因此需要进一步评估。5.0kb缺失扩增了来自健康男性口腔拭子的DNA,表明可能缺乏疾病特异性。7.7kb缺失也从该样本获得具有低水平的扩增。
使用QPCR进一步评估剩余的6个缺失以确定目标是否:i)在没有全基因组扩增的情况下以足够的拷贝数存在,ii)具有足够的诊断准确性,iii)使用更灵敏的QPCR在rho 0细胞中可检测得到,以及iv)测定的精确度是否可以接受。可接受的精度标准是每个目标缺失的三个重复中至少有两个之间的最大偏差为1.5Ct。
临床样品的初步评估
作为对剩余六个候选者的初步评估,我们使用一组55个临床样本评估了缺失;46个样本来自确诊的子宫内膜异位症患者,并且9个样本来自有症状的对照患者。在初始QPCR测试后,确定2.4kb缺失拷贝数不足,从rho 0细胞中提取的1.0kb缺失扩增的DNA表明numts的共扩增,7.7kb缺失仅在不太严格的退火温度下扩增,这意味着更有可能是错误引发事件(mis-priming events)。这些候选缺失不满足此处设计的测定要求,但仍有可能作为生物标志物存在,受益于进一步的测定优化以获得更好的序列特异性和检测灵敏度。
在最初选择的七个缺失中,1.2kb缺失和3.7kb缺失在血浆中以足够的拷贝数存在以促进容易和可靠的检测。该测定在测试的PCR条件下具有特异性,可准确区分健康(无症状)对照样本和来自确诊子宫内膜异位症患者的样本(数据未显示)。此外,1.2kb缺失和3.7kb缺失在区分有症状的对照和子宫内膜疾病病例(所有亚型和病期组合)方面也很准确。1.2kb缺失的AUC(95%CI)为0.8116(0.6178-1.005),具有统计学显著性(p=0.0034)。类似地,3.7kb缺失的AUC(95%CI)为0.8478(0.6663-1.029),这也是显著的(p=0.0011;表11)。
表11:缺失的初步评价
Figure BDA0003125697870000421
缩写:AUC=曲线下面积;CI=置信区间;N=评估集中的样本的数量;PCR=聚合酶链反应。
1.2kb缺失和3.7kb缺失的诊断准确性
为了更全面地评估1.2kb缺失和3.7kb缺失作为子宫内膜异位症临床上可行的生物标志物,通过使用更大的一组临床样本(表10),我们确定了这些缺失在区分有症状对照和所有子宫内膜异位症类型(组合了三种亚型和子宫内膜异位症的四个病期)的能力。从171个1.2kb缺失样本和181个3.7kb缺失样本获得了有效的配对结果(靶基因和18S基因扩增)。这些分析仅使用有症状的对照和确诊的疾病样本进行,以便更准确地反映临床相关的患者群体——即出现子宫内膜异位症症状并以手术确认了作为结果的疾病状态的女性。重要的是,1.2kb缺失和3.7kb缺失在有症状和无症状对照样本之间没有检测差异,分别为p=0.462和p=0.878。
有症状的对照与所有疾病
与使用55个临床样本的初步分析相似,1.2kb缺失和3.7kb缺失都准确地区分了有症状对照样本和子宫内膜疾病样本(腹膜、卵巢和深部子宫内膜异位症样本)。1.2kb缺失的AUC(95%CI)为0.7879(0.6791-0.8967),具有统计学显著性(p<0.0001)。3.7kb缺失的AUC(95%CI)为0.807(0.7063-0.9077),这也是显著的(p<0.0001;图4A和图4B)。检查接受者操作(ROC)曲线的坐标并选择阈值或截断值以优化灵敏度。应用-4.43的阈值来区分有症状对照和使用1.2kb缺失的子宫内膜异位症的所有亚型/病期,灵敏度和特异性值分别为81.8%和72.2%。在阈值为10.51时,3.7kb缺失的灵敏度和特异性值分别为85.1%和57.9%(表12)。
表12:1.2kb缺失和3.7kb缺失的性能
Figure BDA0003125697870000431
将1.2kb缺失与3.7kb缺失相结合,提高了诊断准确性(所有有症状对照和所有子宫内膜异位症之间的AUC 0.827(0.722–0.931),以及有症状对照和I/II期疾病之间的AUC0.882(0.784–0.980)(数据未显示))。
疾病不同亚型—1.2kb缺失
子宫内膜异位症的任何诊断辅助工具的一个重要特征是能够准确检测所有疾病亚型。我们评估了1.2kb缺失在区分有症状的对照样本和确诊的腹膜、卵巢和深部子宫内膜异位症患者样本的能力。每个疾病亚型的1.2kb缺失的分布显示在图5A中。对于症状对照,平均(SD)ΔCt值为-4.312(2.075),对于腹膜疾病为-7.187(2.581),对于卵巢疾病为-6.291(2.344),对于深部子宫内膜异位症为-6.193(2.143)。对于腹膜(p<0.0001)、卵巢(p=0.003)和深部子宫内膜异位症(p=0.0012),有症状对照之间标准化1.2kb缺失量的差异具有统计学显著性。
1.2kb缺失的诊断准确性显示在图5B至图5D中,其中,用于腹膜子宫内膜异位症的检测的AUC(95%CI)值为0.8549(0.7425-0.9672)、p<0.0001;用于卵巢子宫内膜异位症的检测的AUC(95%CI)值为0.7457(0.6118-0.8796)、p=0.0025;用于深部子宫内膜异位症的检测的AUC(95%CI)值为0.7596(0.6292-0.8901)、p=0.0012。总之,这些数据表明1.2kb缺失能够准确地区分从有症状的对照和腹膜、卵巢和深部子宫内膜异位症患者采集的样本。应用-4.430的阈值来区分有症状的对照和使用1.2kb缺失的腹膜子宫内膜异位症,灵敏度和特异性值分别为81.8%和72.2%。在阈值为-4.675时,1.2kb缺失区分有症状对照和卵巢子宫内膜异位症的灵敏度和特异性分别为75.6%和72.2%。在-4.350的阈值下,1.2kb缺失区分有症状对照和深部子宫内膜异位症的灵敏度和特异性分别为78.6%和66.7%(表12)。
疾病不同亚型—3.7kb缺失
每个疾病亚型的3.7kb缺失的分布显示在图6A中。平均(SD)ΔCt值对于有症状对照为11.12(2.239),对于腹膜子宫内膜异位症为7.569(1.843),对于卵巢子宫内膜异位症为8.549(2.089),对于深部子宫内膜异位症为8.617(2.125)。对于腹膜(p<0.0001)、卵巢(p<0.0001)和深部子宫内膜异位症(p=0.0072),有症状对照之间扩增子数量的差异具有统计学显著性。3.7kb缺失在检测三种疾病亚型中的每一种时的诊断准确性显示在图6B至图6D中,其中,用于检测腹膜的AUC(95%CI)值为0.8978(0.8131-0.9824)、p<0.0001;用于检测卵巢的AUC(95%CI)值为0.8158(0.7003-0.9313)、p<0.0001,以及检测深部子宫内膜异位症的AUC(95%CI)值为0.7110(0.5746-0.8475)、p=0.0071。总之,这些数据表明3.7kb缺失能够准确地区分从有症状的对照组和患有腹膜、卵巢和深部子宫内膜异位症的女性采集的样本。应用8.805的阈值来区分有症状的对照和使用3.7kb缺失的腹膜子宫内膜异位症,灵敏度和特异性值分别为88.5%和73.7%。在阈值为8.910时,3.7kb缺失区分有症状对照和卵巢子宫内膜异位症的灵敏度和特异性分别为80.9%和68.4%。在阈值为11.01时,3.7kb缺失区分有症状对照和深部子宫内膜异位症的灵敏度和特异性分别为80.0%和52.6%(表12)。
疾病分期—1.2kb缺失
子宫内膜异位症的生物标志物的另一个重要特征是检测疾病的低期和高期的能力。我们接下来评估了1.2kb缺失区分有症状的对照样本和来自确诊的疾病低期(I/II)或高期(III/IV)的样本的能力。I/II期和III/IV期疾病的1.2kb缺失分布示于图7A中。对于有症状对照,平均(SD)ΔCt值为-4.312(2.075),对于I/II期平均(SD)ΔCt值为-6.692(2.505),对于III/IV期平均(SD)ΔCt值为-6.348(2.25)。对于I/II期(p<0.0001)和III/IV期(p=0.001)疾病组,症状对照之间的差异具有统计学显著性。I/II期和III/IV期之间的差异统计学不显著(p=0.406)。
1.2kb缺失的诊断准确性显示在图7A至图7C中,对于I/II期检测的AUC(95%CI)值为0.7989(0.6868-0.9111)、p<0.0001,以及对于III/IV期疾病检测的AUC(95%CI)值为0.7661(0.6398-0.8924)、p=0.0007。因此,1.2kb缺失能够准确地区分有症状的对照和疾病的所有病期。在阈值为-4.430时,1.2kb缺失区分有症状对照和I/II期子宫内膜异位症的灵敏度和特异性分别为82.1%和72.2%。在阈值为4.490时,1.2kb缺失区分有症状对照和III/IV期子宫内膜异位症的灵敏度和特异性分别为80.7%和72.2%(表12)。
疾病的不同病期—3.7kb缺失
I/II期和III/IV期疾病的3.7kb缺失的分布显示在图8A中。对于有症状对照的平均(SD)ΔCt值为11.12(2.239),I/II期的平均(SD)ΔCt值为8.243(2.156),III/IV期的平均(SD)ΔCt值为8.112(2.14)。对于I/II期(p<0.0001)和III/IV期(p=0.0008)疾病组,有症状对照之间的差异具有统计学显著性。3.7kb缺失的诊断准确性显示在图8B至8C中,其中,用于I/II期检测的AUC(95%CI)值为0.8383(0.7412-0.9353)、p<0.0001以及用于III/IV期疾病检测的AUC(95%CI)值为0.7591(0.6354-0.8837)、p=0.0007。对于3.7kb缺失,I/II期和III/IV期之间的差异具有统计学显著性(p=0.016)。这些数据表明3.7kb缺失能够准确地区分有症状的对照和疾病的所有病期。在阈值为10.17时,3.7kb缺失在区分有症状对照和I/II期子宫内膜异位症的灵敏度和特异性分别为87.6%和63.2%。在阈值为11.00时,3.7kb缺失区分有症状对照和III/IV期子宫内膜异位症的灵敏度和特异性分别为84.5%和52.6%。
与患者年龄、样本年龄、激素治疗和月经期的相关性—1.2kb缺失
理想的生物标志物测试将提供与患者和样本年龄、激素疗法的治疗以及样本采集期间月经期的时间无关的准确结果。这些参数对疾病检测的影响总结在表13中。
表13:患者和样本年龄、激素疗法和月经周期的影响
Figure BDA0003125697870000451
Figure BDA0003125697870000461
(1)T检验是用于确定激素状况对子宫内膜异位症检测的影响
(2)方差分析(ANOVA)是用于确定月经周期对子宫内膜异位症检测的影响
对于1.2kb的缺失,我们确定与疾病的检测和患者年龄没有相关性;相关系数(r)为r=0.030(p=0.698)。疾病检测与采集年份的样本年龄也没有相关性(r=0.072,p=0.353)。当按激素状况(样本采集前3个月内接受激素治疗或未接受激素治疗的患者)分层时,疾病检测的差异无统计学显著性(p=0.120)。当患者按月经期(无月经、月经不调、月经、卵泡期或黄体期+月经延长期)分层时,1.2kb缺失在疾病检测方面没有统计学显著差异(p=0.228)。
类似地,基于3.7kb缺失的疾病检测与患者年龄(r=0.1034;p=0.166)或样本年龄(r=0.0628;p=0.4009)没有显著相关性或不受激素疗法的显着影响(p=0.195)。用3.7kb缺失检测子宫内膜异位症与月经期(p=0.036)显著相关,这是由报告无月经患者和处于卵泡期(p=0.026)的患者之间的检测差异所特别驱动的,相差1.72。综合起来,这些数据表明1.2kb的准确性不受这些临床相关变量的显着影响,而3.7kb缺失的准确性受月经期的影响很小。
讨论
子宫内膜异位症是育龄妇女中高度流行的疾病,其带来巨大的经济负担并导致患者的生活质量显着降低。导致这一临床问题的关键因素之一是缺乏有助于早期检测和干预的诊断工具。目前的诊断黄金标准是彻底的腹腔镜检查,最好接着对可疑病变进行组织学确认[5,15]。由于可用的客观数据很少,这个过程的诊断价值在很大程度上不清楚。一些人认为使用腹腔镜检查可能不准确,甚至与组织学确认相结合的准确性据报道其范围为从60%到85%[48-51]。如果疾病本身不典型,或者处于没有经验的外科医生不容易看到和忽视的疾病的早期阶段,那么标准的诊断过程可能会更加复杂。此外,在可以启动医疗干预以避免或延迟手术的情况下,基于准确的生物标志物测试的子宫内膜异位症的推定诊断可以提供支持这种治疗的必要证据。因此,显然需要改进当前的标准,特别是在疾病早期提供更多常规结果的方式。
在当前的研究中,我们识别并评估了两个新的mtDNA缺失作为子宫内膜异位症的潜在生物标志物。针对1.2kb缺失和3.7kb缺失的检测符合稳健诊断测试的标准,利用微创样本,如果成功转化为临床使用,可有助于减少与当前诊断实践相关的诊断时间延迟,并在手术之前提供医疗干涉的机会。设置诊断阈值(如上所述)后,1.2kb缺失检测的灵敏度为81.8%,并且特异性为72.2%。3.7kb缺失检测的诊断性能相似,灵敏度和特异性分别为85.1%和57.9%。因此,基于这些缺失之一的诊断分析有可能补充当前的护理标准。特别重要的是这些缺失对早期疾病的诊断准确性,因为在目前的实践中使用超声更容易检测到晚期疾病。在初级医疗设置中,阳性检测结果可以支持启动子宫内膜异位症的一线药物(例如口服避孕药)治疗或触发专家转诊。估计有10%的痛经女性患有继发性痛经,其中大部分由子宫内膜异位症引起[52]。在该人群中,1.2kb缺失和3.7kb缺失将非常有效地排除子宫内膜异位症,阴性预测值(NPV)为97%。在二级医疗设置中,阳性测试可以指导决定开始使用二线药物(如促性腺激素释放激素拮抗剂)治疗或进行腹腔镜手术。重要的是,在前一种设置中,可以选择诊断截断值来最大化测试灵敏度,因为与错误假阳性结果相关的风险不太重要,而在后者中,设置不同的诊断截断值以最大化特异性并最小化未患有该疾病的女性承担与这些干预措施相关的风险可能是有益的。
除了诊断准确性外,这两种生物标志物检测子宫内膜异位症的能力与患者年龄、样本年龄或激素状况无关,只有3.7kb缺失与患者在样本采集时的月经周期阶段有轻微相关性。需要进一步的研究来确认这种与月经期的相关性是否存在于更大的患者群体中,或者它是否是本研究中使用的样本数量的人为因素。我们证明了1.2kb缺失和3.7kb缺失都能准确检测所有亚型和疾病病期。与目前的诊断标准涉及手术过程中的可视化和可能切除病变以进行组织学确认相比,基于mtDNA缺失的分析只需要血液样本,并且可能在手术干预之前或替代手术干预提供客观结果。因此,如果成功转化为临床应用,基于mtDNA的检测有可能减少诊断延迟[16]并在疾病过程中比目前可能更早提供可操作的结果。
从实用的观点来看,使用基于血液的生物标志物测定具有若干优点以有效地增加当前的护理标准。通过静脉穿刺采集样本既简单又便宜,并且与采集相关的并发症的可能性很低。可以在门诊医生办公室或诊所轻松采集血液样本,无需专用的手术空间和设备。由于mtDNA的高拷贝数,可使用标准DNA提取方法,且无需富集技术,并且可以从标准血液样本中回收大量DNA,因此可以预期较低的测试失败率。这些检测使用基于PCR的技术,这种技术具有成本效益并广泛用于临床实验室,虽然检测是定量的,但输出结果很容易解释——也就是说,检测结果要么高于或低于定义的诊断截断值,对应于到积极或消极的结果。最后,与月经期无相关性或具有最小相关性可确保简化采样要求,并且在安排静脉穿刺时无需考虑月经的时间。
成功疾病管理的关键要素是了解疾病流行病学。部分由于相对复杂的诊断过程和与其他妇科疾病重叠的症状,子宫内膜异位症的流行病学特征不明确,并且因患者人群和地理位置而异[1,2,4,6]。随着分子检测的出现,例如这里描述的那些,额外的数据可能变得更容易获得,并有助于填补我们对子宫内膜异位症流行病学理解的一些空白。重要的是,这项研究利用公开可用的标准化流程来采集和处理样本,这将允许更直接地比较不同研究和患者人群的测试结果[41-44,53]。
重要的是,mtDNA缺失的位置也可能有助于阐明子宫内膜异位症的病理生理过程。1.2kb缺失和3.7kb缺失都会影响编码呼吸链复合物I和V(ATP合酶)和几种tRNA的全部或部分基因。尽管这些缺失可能导致线粒体ATP合酶和复合物I蛋白异常,但mtDNA的异质性可能允许种群内进行某种程度的功能补偿。有趣的是,本研究中测试的7个候选中的两个最佳候选是线粒体基因组中相互重叠区域内的缺失。鉴于1.2kb缺失区域(ATP6至ND3)位于较大的3.7kb缺失(ATP6至ND5)内,因此这两个缺失的诊断准确性相似也就不足为奇了。
基于此处提供的数据,1.2kb和3.7kb mtDNA缺失与子宫内膜异位症有关;然而,需要额外的研究来了解这个线粒体基因组区域在子宫内膜异位症的发展中所起的机制作用。
本研究的局限性包括使用患者报告的激素和月经状态,这可能不如进行研究特定数据测量准确。这些数据虽然令人鼓舞,但需要在更大的独立数据集中进行复制和验证。这项研究目前正在进行中。
总结
以下是上述研究的总结:
·子宫内膜异位症是一种严重的健康负担,影响到全世界多达10%的女性。目前,诊断是基于手术可视化和随后的组织学确认。
·由于多变的临床表现和与其他妇科疾病重叠的症状,诊断通常很复杂。因此,明确的诊断可能会延迟长达十年,这可能导致受影响者的发病率更高,生活质量下降。
·因此,显然需要快速、可靠的诊断辅助工具,其可以在疾病的早期提供可操作的结果。
·研究样本采集自因盆腔疼痛(有症状)或输卵管结扎术(无症状)而计划接受腹腔镜检查的女性。研究参与者是女性,年龄在18岁或以上(直到更年期),并且被确认没有怀孕。
·识别并评估了7个候选mtDNA缺失,以确定每个缺失是否可在血浆中检测到、是否具有足够的拷贝数以进行可靠检测、具有预测的扩增子大小、具有特异性且不共同扩增核假基因或产生非特异性扩增产物。
·通过QPCR和临床样本进一步评估了六个候选缺失以确定每个是否满足稳健诊断测定的标准并评估区分子宫内膜异位症和对照样本的准确性。选择两个缺失作为潜在的生物标志物候选物(1.2kb缺失和3.7kb缺失)。
·1.2kb缺失和3.7kb缺失准确检测到子宫内膜异位症,包括所有亚型和疾病病期,并且检测与患者或样本年龄或激素治疗无关。3.7kb缺失与仅限于两个阶段的月经期显著相关。
·源自线粒体基因组的生物标志物,包括此处描述的1.2kb缺失和3.7kb缺失,为寻找可有效转化为临床应用的子宫内膜异位症诊断标志物提供了一条有前途且很大程度上未开发的途径。
·基于微创样本,基于这些标志物的检测可以通过减少诊断延迟并提供快速、可操作和客观的测试结果,对子宫内膜异位症的诊断前景产生积极影响。
结论
源自线粒体基因组的生物标志物,特别是本文所述的1.2kb缺失和3.7kb缺失,为寻找可有效转化为临床应用的子宫内膜异位症的诊断标志物提供了一条有前途的且很大程度上未开发的途径。基于微创样本,已经发现基于这些标记的检测可以准确诊断患者血液样本中的子宫内膜异位症。因此,本说明书提供了一种快速、准确和有效的诊断子宫内膜异位症的手段,从而减少了获得诊断和实施必要治疗方案的延迟。本描述允许对一个或多个mtDNA缺失(包括大sublimon或小sublimon)和由此产生的任何融合转录本进行主题诊断。同样的结论也可以扩展到由融合转录本产生的任何翻译产品。
实施例3:用于检测子宫内膜异位症的8.7kbmtDNA缺失的识别
在该研究中,我们使用下一代测序(NGS)和专有数据挖掘软件的组合,在从Fidelis Research(Sofia,Bulgaria)获取的10个病例和10个对照中识别8.7kb缺失(缺失ID No.2767)。识别所用的方法在实施例4中更详细的描述。我们使用qPCR和NGS在子宫内膜异位症组织病变中直接检测该生物标志物。我们选择了8.7kb缺失,用于基于序列组成、线粒体基因组主弧内(在此报告了成比例的更多缺失[47]以及在子宫内膜组织中的观察)侧翼重复位置的存在进行评估。该研究的数据在表14中提供并在图9至图11中说明。
表14:8.7kb mtDNA缺失的识别
子宫内膜异位症阳性 有症状对照 正常/健康对照
值的数目 14 10 12
最小值 3.18 4.985 6.55
25%百分位数 3.678 6.04 7.753
中位数 5.158 7.028 8.82
75%百分位数 6.808 8.156 10.63
最大值 7.86 10.44 11.78
范围 4.68 5.455 5.23
平均值 5.431 7.216 9.052
标准偏差 1.648 1.526 1.686
平均值的标准误差 0.4406 0.4824 0.4868
平均值的95%CI下限 4.479 6.125 7.98
平均值的95%CI上限 6.383 8.307 10.12
总和 76.04 72.16 108.6
8.7kb缺失去除了NADH脱氢酶亚基2-5之间的全部或部分基因。凝胶电泳后的第一轮标准(定性)PCR和可视化用于对缺失靶标进行预识别并确定该缺失是否:(i)能够被检测到;(ii)有足够的拷贝数进行可靠检测;(iii)具有预测的扩增子大小;(iv)是特异性的并且不会共同扩增核假基因或产生非特异性扩增产物。
我们成功地检测到循环血浆中的缺失,并通过qPCR进行进一步评估,以确定使用更灵敏的qPCR是否可在rho 0细胞中检测到靶标。我们还评估了该测定是否具有足够的诊断准确性和可接受的精度(定义为三个重复中至少两个之间的最大偏差为1.5Ct)。
在实施例4中描述了对该缺失的进一步研究。
实施例4:8.7kb mtDNA缺失用于在有症状女性血浆中检测子宫内膜异位症
在该实施例中,研究了8.7kb mtDNA缺失(FUS 5362:14049)作为诊断子宫内膜异位症的潜在生物标志物,包括i)诊断准确性的初步评估,然后ii)通过将生物标志物的女性血浆中的频率与子宫内膜异位症和有症状对照、以及子宫内膜癌、卵巢癌和乳腺癌进行比较来评估疾病特异性。
方法
诊断准确性—参与者和样品采集
这是一项病例对照研究,其中前瞻性地从18岁以上(直至绝经)的女性中采集残留血浆样本,这些女性未怀孕并因为盆腔疼痛怀疑有子宫内膜异位症(有症状对照和子宫内膜异位症病例)或输卵管结扎术(无症状对照)计划接受腹腔镜检查。该研究是英国牛津大学约翰拉德克利夫医院牛津子宫内膜异位症护理中心EndOx研究(EndOx study at OxfordEndometriosis CaRe Centre,John Radcliffe Hospital,University of Oxford,UK)的一部分。
样品和数据的采集、匿名化和处理如先前报道的[26、41-44、57]。研究实施、相关当局批准(Oxfordshire REC A,09/H0604/58)和同意程序也如先前报道的[26,41-44;57]。
诊断准确性—参与者群体/群组
采集的样品被分类为对照样品或病例样品。对照组包括:a)无症状对照,即,从接受安排的输卵管结扎术而无临床怀疑子宫内膜异位症且经手术证实不存在子宫内膜异位症的参与者采集的样本;b)有症状对照,采集自有疼痛或其他症状(不包括不孕症)且临床怀疑有子宫内膜异位症、但经验丰富的妇科医生通过腹腔镜检查未发现子宫内膜异位症病变的参与者。
病例组包括在腹腔镜检查期间被诊断出存在子宫内膜异位症并由手术外科医生使用修订的美国生殖医学学会(rASRM)分期(I:轻微;II:轻度;III:中度;IV:重度疾病)[45]进行分类。样本还按疾病亚型分组:腹膜子宫内膜异位症、卵巢子宫内膜异位症和深部浸润性(DI)子宫内膜异位症。
疾病特异性—参与者和样品采集
来自诊断准确性评估的子宫内膜异位症病例和对照用于评估疾病特异性,并与从OBIO(El Segundo,USA)和Ontario Tumour Bank(Toronto,Canada)获得的残留血浆样品进行比较。
样品处理、加工和mtDNA扩增
血液采集和处理
将全血采集在10ml的K2EDTA
Figure BDA0003125697870000511
(BD Medical p/n BD366643)中,并在采集后1小时内以2500xg在4℃下离心10分钟。取出血浆层,等分并储存在-80℃直到提取DNA。
DNA提取
使用QIAampTM96QIAcubeTMHT提取试剂盒(Qiagen,Crawley,UK)从血浆(200μL)中提取总脱氧核糖核酸(DNA),在QIAcubeTMHT系统(Qiagen,Crawley,UK)上自动化,并用缓冲液AE(200μL)洗脱提取的DNA。
mtDNA缺失qPCR和用18S rRNA的qPCR标准化
对于两种实时聚合酶链反应(qPCR)程序,我们使用96孔微孔板(Bio-Rad,HemelHempstead,UK)在20μL反应中进行扩增,每个孔含有未标准化的DNA模板(5μL),
Figure BDA0003125697870000521
Green预混液和250nM的每种引物,用于8.7kb缺失和18S核糖体核糖核酸(rRNA)。使用的引物在表15中提供。
表15:用于扩增8.7kb缺失的引物序列
Figure BDA0003125697870000522
我们使用CFX96 Touch实时PCR检测系统(Bio-Rad,Hemel Hempstead,UK)进行SYBR Green I荧光定量聚合酶链反应(QPCR)。
8.7kb缺失和18S rRNA的循环条件是:95℃下30秒、66℃下30秒和72℃下30秒,进行45个循环。扩增后,我们从70℃到90℃进行熔解曲线分析,每0.5℃读取一次。每个样品板和对照板在三个不同的场合一式三份扩增。
质量控制
如前所述进行质量控制[56]。简而言之,我们计算了定量循环(Cq)并将缺失扩增子的Cq标准化为多拷贝核靶标18S rRNA基因扩增子的Cq。我们在不同的平板上一式三份地扩增所有样品。与每批DNA提取物一起处理两个无模板对照样品,并证实缺失靶标和18SrRNA基因的扩增均为阴性。
Rho0细胞准备
如前所述准备Rho 0细胞[46;Creed 2019]。简而言之,来自人骨癌细胞系143B(ATCC CRL 8303)的细胞用溴化乙锭处理以消耗细胞质mtDNA。细胞在含有丙酮酸、L型谷氨酰胺、尿苷(50μg/mL)和5%胎牛血清的高葡萄糖DMEM培养基(Dulbecco’s ModifiedEagle’s Medium)中生长至融合。
统计分析
没有进行正式的样本量计算;使用的临床样本数量被认为足以满足研究目标。对于qPCR,从所有样本中扩增靶标一式三份,并计算平均Cq值。我们通过相对于18S rRNA参考扩增子量化缺失扩增子来确定标准化缺失值(ΔCq)。使用Graphpad PrismTM5.0(GraphpadsoftwareInc.,LaJolla,CA,USA)对ROC、描述性统计、相关性和显著性检验进行统计分析。我们使用分类数据的计数和百分比以及连续变量的平均值、标准偏差(SD)和范围来总结临床特征。分别使用Student t检验和Mann-Whitney U检验比较两组的参数和非参数分布的平均值。使用Spearman相关性(r)或MannWhitneyU检验或Kruskal-Wallis检验评估两个变量之间的相关性。关于子宫内膜异位症的存在,构建了ROC曲线。ROC的曲线下面积(AUC)以及选定截断值的灵敏度和特异性是用95%置信区间(CI)计算的。对于所有测试,p值<0.05被认为具有统计学显著性。
结果
研究人群和临床样本
在表16中总结了提供样本的参与者的人口统计学和临床特征。
表16:研究人群人口统计学和临床特征
特征 总N(%) 对照N(%) 病例N(%)
N 182 32 150
患者年龄<sup>1</sup> 34.4(±6.9) 37.16(±6.901) 33.78(±6.820)
激素治疗状态<sup>2</sup>
55(30.2) 11(34.5) 44(29.3)
120(65.9) 19(59.4) 101(67.3)
未确定 7(3.8) 2(6.3) 5(3.3)
月经期<sup>3</sup>
无月经 27(14.8) 8(25.0) 19(12.7)
月经失调 15(8.2) 2(6.3) 13(8.7)
月经 30(16.5) 6(18.8) 24(16.0)
卵泡期 46(25.3) 3(9.4) 43(28.7)
黄体期和延长期 64(35.2) 13(40.6) 51(34.0)
非子宫内膜异位症/子宫内膜异位症类型
有症状 18(9.9) 18(56.3) NA
无症状 14(7.7) 14(43.8) NA
腹膜子宫内膜异位症 52(28.6) NA 52(34.7)
卵巢子宫内膜异位症 48(26.4) NA 48(32.0)
深部浸润性子宫内膜异位症 50(27.5) NA 50(33.3)
子宫内膜异位症病期
I/II期 NA NA 91(60.7)
III/IV期 NA NA 58(38.7)
未知 NA NA 1(0.7)
缩写:N=参与者/样本的数量;SD=标准偏差。(1)呈现了平均值(SD);为提供样本采集时年龄的参与者计算平均值和标准偏差。(2)参与者在样本采集后3个月内的状态。(3)采集样本时参与者的月经情况。
总体而言,对照组和病例组的年龄的平均值(SD)在统计学上有显著差异:37.2(6.9)和33.8(6.8)岁,p=0.0124。大多数参与者(121;66.5%)在样本采集前三个月内没有接受激素治疗。大多数报告没有月经的参与者在服用激素(20/26;76.9%)。
在采集的182个样本中,32个来自对照组,18个(9.49%)来自有症状的参与者,14个(7.7%)来自无症状的参与者。其余150份样本来自病例组,其中,52名(28.6%)参与者患有腹膜子宫内膜异位症,48名(26.4%)患有卵巢子宫内膜异位症,50名(27.5%)患有深部浸润性子宫内膜异位症,并被归类为91例(60.7%)rASRM I/II期疾病和58例(31.9%)为III/IV期。在182份样本中,178份(97.8%)产生了有效的检测结果,2份子宫内膜异位症腹膜样本和1份卵巢子宫内膜异位症样本以及1份有症状对照样本由于超出18S rRNACq范围而无法进行统计分析。
8.7kb mtDNA缺失初步评估—标准PCR
如上文实施例3中所讨论的,我们先前在一组10个病例和10个对照中使用下一代测序(NGS)和专有数据挖掘软件的组合识别了8.7kb缺失。如上所述,我们成功检测到循环血浆中的缺失,并通过qPCR进行进一步评估,以确定使用更灵敏的qPCR在rho 0细胞中是否可检测到靶标。
8.7kb缺失的诊断准确性
在循环血浆和子宫内膜异位病灶中成功检测到8.7kb缺失后,我们研究了在来自更多临床样本的血浆中8.7kb缺失是否可以区分有症状的对照与所有子宫内膜异位症;是否可以区分三个亚型;以及是否可以区分修订后的美国生殖医学学会(r-ASRM)分类病期。我们主要使用有症状对照和来自确诊患有该疾病参与者的样本进行分析,以更准确地反映临床相关的患者群体,即,所有表现出子宫内膜异位症症状的患者。我们还测量了无症状对照样本中缺失的频率,并在有症状和无症状(p=0.681)对照样本之间没有检测到8.7kb缺失的差异。
有症状对照对比所有疾病
我们能够使用8.7kb测定很好地区分有症状对照和所有子宫内膜异位症样本。0.8007(0.7035-0.8979)的AUC(95%CI)具有统计学显著性(p<0.0001)。我们检查了ROC坐标并选择了一个阈值来优化灵敏度,阈值为6.650,可区分有症状的对照和子宫内膜异位症的所有亚型/病期,并给出可接受的灵敏度和特异性值(表17)。
表17:8.7kb缺失在65%特异性下的表现,截断值6.65
Figure BDA0003125697870000551
不同疾病亚型的检测
重要的是我们可以准确地检测子宫内膜异位症的所有疾病亚型。在我们的研究中,8.7kb缺失测定区分了来自有症状对照和来自腹膜、卵巢和DI子宫内膜异位症患者的样本(图13A至图13D),平均(SD)ΔCt值对于无症状对照为6.724(1.192),有症状对照为6.908(1.26),腹膜疾病为4.086(2.134),卵巢疾病为5.283(1.801),深部浸润性子宫内膜异位症为5.617(1.767)。此外,对于腹膜(p<0.0001)、卵巢(p=0.0002)和深部浸润性子宫内膜异位症(p=0.0023),有症状对照之间标准化的8.7kb缺失量的差异具有统计学显著性。
还评估了每个亚型的8.7kb缺失测定的诊断准确性(图13A至图13D)。我们准确地区分了有症状对照和疾病亚型的样本:AUC(95%CI)对于检测腹膜疾病为0.8882(0.8043-0.9722;p<0.0001),对于检测卵巢子宫内膜异位症为0.7766(0.6572-0.8960;p=0.0008),对于检测深部浸润性子宫内膜异位症为0.7359(0.6057-0.8661;p=0.0039)。此外,阈值6.65提供了可接受的灵敏度和特异性值,用于区分有症状对照与腹膜子宫内膜异位症、卵巢和深部浸润性疾病(表17)。
不同r-ASRM病期的检测
子宫内膜异位症病例被分为两个病期组,r-ASRM I/II期和III/IV期,以确定使用8.7kb缺失是否能准确识别低期和高期疾病。8.7kb缺失测定区分来自有症状对照的样本和来自低期(I/II期)和高期(III/IV期)患者的样本(图14A至图14C),平均(SD)ΔCt值对于有症状对照为6.908(1.26),对于低期为4.614(2.063),对于高期病为5.565(1.794)。
通过接受者操作曲线评估的诊断准确性对于I/II期最高:AUC 0.8361(0.7426-0.9295;p<0.0001),相比于III/IV期:AUC 0.7465(0.6232-0.8697;p=0.0021)。在6.65的阈值下,所有病期的灵敏度和特异性是可以接受的(表17)。
与患者年龄、样本年龄、激素治疗和月经期的相关性
对于理想的测定,诊断准确性不会受到诸如患者和样本年龄、激素治疗和月经期等因素的影响。我们发现ΔCt值与患者年龄(p=0.749)和收集年份的样本年龄(p=0.222)之间没有相关性(表3)。类似地,当我们按激素状况(p=0.838)或月经期(p=0.233)对参与者进行分层时,未观察到ΔCt值的统计学显着差异(表18)。
表18:患者和样本年龄、激素状况和月经周期的影响
Figure BDA0003125697870000561
Mann-Whitney U检验用于确定激素状况对子宫内膜异位症检测的影响。KruskalWallis用于确定月经周期对子宫内膜异位症检测的影响。
评估8.7kb缺失对子宫内膜异位症的疾病特异性
为了进一步评估其他女性疾病是否具有升高的8.7kb缺失水平,我们从随后被诊断患有子宫内膜癌(n=12)、卵巢癌(n=72)和乳腺癌(n==51)的女性获取血浆样品,并将标志物频率与三种子宫内膜异位症亚型(腹膜、卵巢和深部浸润性子宫内膜异位症)以及有症状的对照组的标志物频率进行比较(图14A至图14C)。在所有三种癌症中检测到的8.7kb缺失显着较少,其中子宫内膜癌的缺失估计比子宫内膜异位症少64倍,卵巢癌少16倍,乳腺癌少8倍(p<0.0001)。该评估的结果在表19中提供。
表19:8.7kb缺失对子宫内膜异位症的疾病特异性
Figure BDA0003125697870000562
来自表19的数据在图15中说明,图15示出了来自子宫内膜癌、卵巢癌、乳腺癌、有症状的对照和患有腹膜、卵巢或深部浸润性子宫内膜异位症的参与者的标准化的8.7kb缺失分布。
讨论
在本研究中,我们证明了测量血浆样品中8.7kb缺失生物标志物的水平作为检测子宫内膜异位症的潜在测定方法的效用。我们的测定方法符合诊断测试的稳健性标准,利用来自血液的微创样本,并准确检测疾病所有亚型和病期,在子宫内膜异位症的腹膜亚型和较低病期(两者均在初级医疗设置中高频出现)表现最佳。当转化为临床应用时,这种检测可能会缩短诊断时间并允许在手术前进行医疗干预。通过静脉穿刺采集样本既简单又便宜,与此类采集相关的并发症的可能性很低。
8.7kb缺失测定方法以良好的诊断准确性(尤其是对于低病期和腹膜疾病)有可能提高当前的护理标准,尤其是在腹膜疾病的诊断中,与卵巢和深部浸润性子宫内膜异位症不同,腹膜疾病不能通过成像方式可靠地检测到。8.7kb缺失测定方法相对简单,意味着其可用于初级和二级医疗设置。血液样本在初级医疗设置中常规收集,无需专用手术空间或设备。mtDNA的高拷贝数意味着使用标准DNA提取方法即可,无需富集技术。此外,鉴于从标准血液样本中回收的DNA数量充足,该测试的高失败率不太可能。基于实时PCR的技术广泛用于临床实验室,产生易于解释和定量的结果。
在我们的研究中,我们展现了缺失与患者年龄、样本年龄、激素状况或月经周期阶段之间不存在相关性。与月经期无相关性简化了采样要求,在安排样本收集时无需考虑月经期。
当前复杂的诊断过程,加上与其他妇科疾病重叠的症状,意味着子宫内膜异位症的流行病学尚未完全表征,但这是成功管理任何病症的关键因素[1,2,4,6]。分子检测和新型生物标志物的出现将提供更多、更容易获得的数据,以帮助提高我们对子宫内膜异位症流行病学的理解。重要的是,我们的研究使用了公开可用的标准化方法来收集和处理样本,从而可以更直接地比较不同研究和患者群体的测试结果[41-44,53]。
结论
使用线粒体衍生的8.7kb缺失生物标志物的上述测定方法是一种微创的、基于血液样本的用于诊断子宫内膜异位症的方法,其可用于初级和二级临床设置。该测定方法提供的相对简单且对患者更友好的途径将缩短诊断时间,从而改善本文所述的衰弱状况的管理,从而提高患者的生活质量。
实施例5:用于检测子宫内膜异位症的4.8kb mtDNA缺失识别
进行了类似于上述研究的研究,以识别4.8kb mtDNA缺失(缺失ID 8590)的频率与子宫内膜异位症之间的相关性。该分析遵循实施例4的方法。用于该研究的引物显示在表20中。
表20:用于扩增4.8kb缺失的引物序列
Figure BDA0003125697870000581
说明4.8kb缺失在检测子宫内膜异位症中的效用的数据提供在表21中并在图12至图14中说明。
表21:4.8kbmtDNA缺失的识别
子宫内膜异位症阳性 有症状对照 正常健康对照
值的数目 14 10 12
最小值 1.005 2.93 4.575
25%百分位数 1.67 4.771 5.85
中位数 3.033 5.945 6.89
75%百分位数 5.489 6.7 8.224
最大值 9.47 11.74 8.93
范围 8.465 8.81 4.355
平均值 3.833 6.161 6.899
标准偏差 2.537 2.547 1.436
平均值的标准误差 0.6781 0.8053 0.4147
平均值的95%CI下限 2.368 4.339 5.986
平均值的95%CI上限 5.298 7.982 7.811
总和 53.67 61.61 82.79
尽管以上描述包括对某些特定实施例的参考,但其各种修改对于本领域技术人员而言是显而易见的。在此提供的任何示例仅出于说明的目的而被包括在内,并不旨在以任何方式进行限制。此处提供的任何附图仅用于说明描述的各个方面的目的,并不旨在按比例绘制或以任何方式进行限制。所附权利要求的范围不应受到上述描述中阐述的优选实施例的限制,而应被给予与本说明书整体一致的最宽泛的解释。本文引用的所有文件的公开内容通过引用整体并入本文。
参考文献
1.Eskenazi B,Warner ML.Epidemiology of endometriosis.Obstet.Gynecol.Clin.North Am.24(2),235–258(1997).
2.Kjerulff KH,Erickson BA,Langenberg PW.Chronic gynecologicalconditions reported by US women:findings from the National Health InterviewSurvey,1984to 1992.Am J Public Health.86(2),195–199(1996).
3.Houston DE,Noller KL,Melton LJ,Selwyn BJ,Hardy RJ.Incidence ofpelvic endometriosis in Rochester,Minnesota,1970-1979.Am.J.Epidemiol.125(6),959–969(1987).
4.Wheeler JM.Epidemiology of endometriosis-associated infertility.JReprod Med.34(1),41–46(1989).
5.Giudice LC,Kao LC.Endometriosis.Lancet.364(9447),1789–1799(2004).
6.Vessey MP,Villard-Mackintosh L,Painter R.Epidemiology ofendometriosis in women attending family planning clinics.BMJ.306(6871),182–184(1993).
7.Zondervan KT,Becker CM,Koga K,Missmer SA,Taylor RN,ViganòP.Endometriosis.Nature Reviews Disease Primers.4(1),9(2018).
8.Barlow DH,Kennedy S.Endometriosis:new genetic approaches andtherapy.Annu.Rev.Med.56,345–356(2005).
9.Giudice LC.Clinical practice.Endometriosis.N.Engl.J.Med.362(25),2389–2398(2010).
10.Fassbender A,Vodolazkaia A,Saunders P,et al.Biomarkers ofendometriosis.Fertil.Steril.99(4),1135–1145(2013).**Review on recent work inbiomarkers of endometriosis
11.SK,Kantawala KP,Menias CO.Beyond the boundaries-endometriosis:typical and atypical locations.Curr Probl Diagn Radiol.40(6),219–232(2011).
12.Berkley KJ,Rapkin AJ,Papka RE.The pains ofendometriosis.Science.308(5728),1587–1589(2005).
13.Nnoaham KE,Hummelshoj L,Webster P,et al.Impact of endometriosis onquality of life and work productivity:a multicenter study across tencountries.Fertil.Steril.96(2),366-373.e8(2011).
14.Simoens S,Dunselman G,Dirksen C,et al.The burden of endometriosis:costs and quality of life of women with endometriosis and treated in referralcentres.Hum.Reprod.27(5),1292–1299(2012).
15.Dunselman G a.J,Vermeulen N,Becker C,et al.ESHRE guideline:management of women with endometriosis.Hum.Reprod.29(3),400–412(2014).
16.Hadfield R,Mardon H,Barlow D,Kennedy S.Delay in the diagnosis ofendometriosis:a survey of women from the USA and the UK.Hum.Reprod.11(4),878–880(1996).
17.Ahn SH,Singh V,Tayade C.Biomarkers in endometriosis:challenges andopportunities.Fertil.Steril.107(3),523–532(2017).**Review on recent work inbiomarkers of endometriosis
18.Rifai N,Gillette MA,Carr SA.Protein biomarker discovery andvalidation:the long and uncertain path to clinical utility.Nat.Biotechnol.24(8),971–983(2006).
19.Hu C,van der Heijden R,Wang M,van der Greef J,Hankemeier T,XuG.Analytical strategies in lipidomics and applications in disease biomarkerdiscovery.J.Chromatogr.B Analyt.Technol.Biomed.Life Sci.877(26),2836–2846(2009).
20.Liotta LA,Petricoin EF.Serum peptidome for cancer detection:spinning biologic trash into diagnostic gold.J.Clin.Invest.116(1),26–30(2006).
21.Petricoin EF,Ardekani AM,Hitt BA,et al.Use of proteomic patternsin serum to identify ovarian cancer.Lancet.359(9306),572–577(2002).
22.Petricoin EF,Belluco C,Araujo RP,Liotta LA.The blood peptidome:ahigher dimension of information content for cancer biomarkerdiscovery.Nat.Rev.Cancer.6(12),961–967(2006).
23.Zhang Z,Bast RC,Yu Y,et al.Three biomarkers identified from serumproteomic analysis for the detection of early stage ovarian cancer.CancerRes.64(16),5882–5890(2004).
24.Anderson NL,Anderson NG.The human plasma proteome:history,character,and diagnostic prospects.Mol.Cell Proteomics.1(11),845–867(2002).
25.May KE,Conduit-Hulbert SA,Villar J,Kirtley S,Kennedy SH,BeckerCM.Peripheral biomarkers of endometriosis:a systematicreview.Hum.Reprod.Update.16(6),651–674(2010).
26.Rahmioglu N,Fassbender A,Vitonis AF,et al.Harmonization ofClinical and Laboratory Data to Improve Biomarker Discovery in Endometriosis:WERF EPHect.In:Biomarkers for Endometriosis.Springer,Cham,199–226.**Summaryof standardized methods in endometriosis research
27.Taylor RW,Turnbull DM.Mitochondrial DNA mutations in humandisease.Nat.Rev.Genet.6(5),389–402(2005).
28.Polyak K,Li Y,Zhu H,et al.Somatic mutations of the mitochondrialgenome in human colorectal tumours.Nat.Genet.20(3),291–293(1998).
29.Petros JA,Baumann AK,Ruiz-Pesini E,et al.mtDNA mutations increasetumorigenicity in prostate cancer.Proc.Natl.Acad.Sci.U.S.A.102(3),719–724(2005).
30.Creed J,Klotz L,Harbottle A,et al.A single mitochondrial DNAdeletion accurately detects significant prostate cancer in men in the PSA“grey zone.”World J Urol.36(3),341–348(2018).
31.Parrella P,Xiao Y,Fliss M,et al.Detection of mitochondrial DNAmutations in primary breast cancer and fine-needle aspirates.Cancer Res.61(20),7623–7626(2001).
32.Liang BC.Evidence for association of mitochondrial DNA sequenceamplification and nuclear localization in human low-gradegliomas.Mutat.Res.354(1),27–33(1996).
33.Guo X-G,Guo Q-N.Mutations in the mitochondrial DNA D-Loop regionoccur frequently in human osteosarcoma.Cancer Lett.239(1),151–155(2006).
34.Alonso A,Martin P,Albarran C,et al.Detection of somatic mutationsin the mitochondrial DNA control region of colorectal and gastric tumors byheteroduplex and single-strand conformation analysis.Electrophoresis.18(5),682–685(1997).
35.Liu VW,Shi HH,Cheung AN,et al.High incidence of somaticmitochondrial DNA mutations in human ovarian carcinomas.Cancer Res.61(16),5998–6001(2001).
36.Dai JG,Xiao YB,Min JX,Zhang GQ,Yao K,Zhou RJ.Mitochondrial DNA4977 BP deletion mutations in lung carcinoma.Indian J Cancer.43(1),20–25(2006).
37.Liu VWS,Yang HJ,Wang Y,et al.High frequency of mitochondrialgenome instability in human endometrial carcinomas.Br.J.Cancer.89(4),697–701(2003).
38.Wang Y,Xue WC,Liu VWS,Ngan HYS.Detection of mosaic pattern ofmitochondrial DNA alterations in different populations of cells from the sameendometrial tumor.Mitochondrion.7(1–2),171–175(2007).
39.Semczuk A,Lorenc A,Putowski L,et al.Clinicoprognostical featuresof endometrial cancer patients with somatic mtDNA mutations.Oncol.Rep.16(5),1041–1045(2006).
40.Pejovic T,Ladner D,Intengan M,et al.Somatic D-loop mitochondrialDNA mutations are frequent in uterine serous carcinoma.Eur.J.Cancer.40(16),2519–2524(2004).
41.Rahmioglu N,Fassbender A,Vitonis AF,et al.World EndometriosisResearch Foundation Endometriosis Phenome and Biobanking HarmonizationProject:III.Fluid biospecimen collection,processing,and storage inendometriosis research.Fertil.Steril.102(5),1233–1243(2014).*Harmonizedmethods for endometriosis research
42.Fassbender A,Rahmioglu N,Vitonis AF,et al.World EndometriosisResearch Foundation Endometriosis Phenome and Biobanking HarmonisationProject:IV.Tissue collection,processing,and storage in endometriosisresearch.Fertil.Steril.102(5),1244–1253(2014).*Harmonized methods forendometriosis research
43.Becker CM,Laufer MR,Stratton P,et al.World Endometriosis ResearchFoundation Endometriosis Phenome and Biobanking Harmonisation Project:I.Surgical phenotype data collection in endometriosisresearch.Fertil.Steril.102(5),1213–1222(2014).*Harmonized methods forendometriosis research
44.Vitonis AF,Vincent K,Rahmioglu N,et al.World EndometriosisResearch Foundation Endometriosis Phenome and Biobanking HarmonizationProject:II.Clinical and covariate phenotype data collection in endometriosisresearch.Fertil.Steril.102(5),1223–1232(2014).*Harmonized methods forendometriosis research
45.American Society for Reproductive Medicine.Revised AmericanSociety for Reproductive Medicine classification of endometriosis:1996.Fertility and Sterility.67(5),817–821.
46.King MP,Attardi G.Human cells lacking mtDNA:repopulation withexogenous mitochondria by complementation.Science.246(4929),500–503(1989).
47.Brandon MC,Lott MT,Nguyen KC,et al.MITOMAP:a human mitochondrialgenome database--2004 update.Nucleic Acids Res.33(Database issue),D611-613(2005).
48.Stratton P,Winkel C,Premkumar A,et al.Diagnostic accuracy oflaparoscopy,magnetic resonance imaging,and histopathologic examination forthe detection of endometriosis.Fertil.Steril.79(5),1078–1085(2003).
49.Mettler L,Schollmeyer T,Lehmann-Willenbrock E,et al.Accuracy oflaparoscopic diagnosis of endometriosis.JSLS.7(1),15–18(2003).*Evaluation ofcurrent gold standard for diagnosis of endometriosis
50.Falcone T,Mascha E.The elusive diagnostic test forendometriosis.Fertil.Steril.80(4),886–888(2003).
51.Wykes CB,Clark TJ,Khan KS.Accuracy of laparoscopy in the diagnosisof endometriosis:a systematic quantitative review.BJOG.111(11),1204–1212(2004).
52.Harel Z.Dysmenorrhea in adolescents and young adults:etiology andmanagement.J Pediatr Adolesc Gynecol.19(6),363–371(2006).
53.Casper RF.Introduction:new tools for enhancing collaborativeendometriosis research.Fertil.Steril.102(5),1211–1212(2014).
54.Salahi,E.,et al.;Mitochondrial DNA 4977-bp deletion inendometriosis.Genes&Genomics,35(5),563-567(2013).
55.Taylor HS.Diagnosing endometriosis:Is laparoscopy the goldstandard?Supplement to OBG Management.S1-S2(2019).
56.Ballard K,Lowton K,Wright J.What's the delay?A qualitative studyof women's experiences of reaching a diagnosis of endometriosis.Fertil.Steril86(5),1296-301(2006).
57.Creed J,Maggrah A,Reguly B,Harbottle A.Mitochondrial DNA deletionsaccurately detect endometriosis in symptomatic females of child-bearingage.Biomark.Med.13(4),291–306(2019).
58.The Practice Committee of the American Society for ReproductiveMedicine.Endometriosis and infertility.Fertil.Steril.81,1441-1446(2004).
59.Nicholls,T.J.,et al.,Linear mtDNA fragments and unusual mtDNArearrangements associated with pathological deficiency of MGME1exonuclease.Hum Mol Genet.,23(23):6147-62(2014).
60.Zhang C.et al.,Multiple mitochondrial DNA deletions in an elderlyhuman individual.FEBS,297,1,2,34-38(1992).
61.Wei,Y.H.,Mitochondrial DNA alterations as ageing-associatedmolecular events.Mutat.Res.,275(3-6),145-55(1992).
62.Tanaka,M.et al.,Direct sequencing of deleted mitochondrial DNA inmyopathic patients.Biochem Biophys Res Commun.,164(1):156-63,(1989).
63.Kapsa,R.et al.,A novel mtDNA deletion in an infant with Pearsonsyndrome.J Inherit Metab Dis.,17(5):521-6,(1974).
64.Hseih,R.H.,et al.,Multiple rearrangements of mitochondrial DNA inunfertilized human oocytes.Fertil Steril.,77(5):1012-7,(2002).
65.Hjelm,B.E.et al.,http://mitobreak.portugene.com/cgi-bin/Mitobreak_ individual_page.cgi?Name=5371:14058&Breaktype=Del&Species=Homsap&Published =Pub
SEQUENCE LISTING
<110> MDNA生命科学有限公司
<120> 与子宫内膜异位症相关的线粒体 DNA缺失
<130> 11871/00286
<150> 62/784,403
<151> 2018-12-22
<150> 62/931,173
<151> 2019-11-05
<160> 84
<170> PatentIn version 3.5
<210> 1
<211> 16569
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (3107)..(3107)
<223> 空位
<400> 1
gatcacaggt ctatcaccct attaaccact cacgggagct ctccatgcat ttggtatttt 60
cgtctggggg gtatgcacgc gatagcattg cgagacgctg gagccggagc accctatgtc 120
gcagtatctg tctttgattc ctgcctcatc ctattattta tcgcacctac gttcaatatt 180
acaggcgaac atacttacta aagtgtgtta attaattaat gcttgtagga cataataata 240
acaattgaat gtctgcacag ccactttcca cacagacatc ataacaaaaa atttccacca 300
aaccccccct cccccgcttc tggccacagc acttaaacac atctctgcca aaccccaaaa 360
acaaagaacc ctaacaccag cctaaccaga tttcaaattt tatcttttgg cggtatgcac 420
ttttaacagt caccccccaa ctaacacatt attttcccct cccactccca tactactaat 480
ctcatcaata caacccccgc ccatcctacc cagcacacac acaccgctgc taaccccata 540
ccccgaacca accaaacccc aaagacaccc cccacagttt atgtagctta cctcctcaaa 600
gcaatacact gaaaatgttt agacgggctc acatcacccc ataaacaaat aggtttggtc 660
ctagcctttc tattagctct tagtaagatt acacatgcaa gcatccccgt tccagtgagt 720
tcaccctcta aatcaccacg atcaaaagga acaagcatca agcacgcagc aatgcagctc 780
aaaacgctta gcctagccac acccccacgg gaaacagcag tgattaacct ttagcaataa 840
acgaaagttt aactaagcta tactaacccc agggttggtc aatttcgtgc cagccaccgc 900
ggtcacacga ttaacccaag tcaatagaag ccggcgtaaa gagtgtttta gatcaccccc 960
tccccaataa agctaaaact cacctgagtt gtaaaaaact ccagttgaca caaaatagac 1020
tacgaaagtg gctttaacat atctgaacac acaatagcta agacccaaac tgggattaga 1080
taccccacta tgcttagccc taaacctcaa cagttaaatc aacaaaactg ctcgccagaa 1140
cactacgagc cacagcttaa aactcaaagg acctggcggt gcttcatatc cctctagagg 1200
agcctgttct gtaatcgata aaccccgatc aacctcacca cctcttgctc agcctatata 1260
ccgccatctt cagcaaaccc tgatgaaggc tacaaagtaa gcgcaagtac ccacgtaaag 1320
acgttaggtc aaggtgtagc ccatgaggtg gcaagaaatg ggctacattt tctaccccag 1380
aaaactacga tagcccttat gaaacttaag ggtcgaaggt ggatttagca gtaaactaag 1440
agtagagtgc ttagttgaac agggccctga agcgcgtaca caccgcccgt caccctcctc 1500
aagtatactt caaaggacat ttaactaaaa cccctacgca tttatataga ggagacaagt 1560
cgtaacatgg taagtgtact ggaaagtgca cttggacgaa ccagagtgta gcttaacaca 1620
aagcacccaa cttacactta ggagatttca acttaacttg accgctctga gctaaaccta 1680
gccccaaacc cactccacct tactaccaga caaccttagc caaaccattt acccaaataa 1740
agtataggcg atagaaattg aaacctggcg caatagatat agtaccgcaa gggaaagatg 1800
aaaaattata accaagcata atatagcaag gactaacccc tataccttct gcataatgaa 1860
ttaactagaa ataactttgc aaggagagcc aaagctaaga cccccgaaac cagacgagct 1920
acctaagaac agctaaaaga gcacacccgt ctatgtagca aaatagtggg aagatttata 1980
ggtagaggcg acaaacctac cgagcctggt gatagctggt tgtccaagat agaatcttag 2040
ttcaacttta aatttgccca cagaaccctc taaatcccct tgtaaattta actgttagtc 2100
caaagaggaa cagctctttg gacactagga aaaaaccttg tagagagagt aaaaaattta 2160
acacccatag taggcctaaa agcagccacc aattaagaaa gcgttcaagc tcaacaccca 2220
ctacctaaaa aatcccaaac atataactga actcctcaca cccaattgga ccaatctatc 2280
accctataga agaactaatg ttagtataag taacatgaaa acattctcct ccgcataagc 2340
ctgcgtcaga ttaaaacact gaactgacaa ttaacagccc aatatctaca atcaaccaac 2400
aagtcattat taccctcact gtcaacccaa cacaggcatg ctcataagga aaggttaaaa 2460
aaagtaaaag gaactcggca aatcttaccc cgcctgttta ccaaaaacat cacctctagc 2520
atcaccagta ttagaggcac cgcctgccca gtgacacatg tttaacggcc gcggtaccct 2580
aaccgtgcaa aggtagcata atcacttgtt ccttaaatag ggacctgtat gaatggctcc 2640
acgagggttc agctgtctct tacttttaac cagtgaaatt gacctgcccg tgaagaggcg 2700
ggcataacac agcaagacga gaagacccta tggagcttta atttattaat gcaaacagta 2760
cctaacaaac ccacaggtcc taaactacca aacctgcatt aaaaatttcg gttggggcga 2820
cctcggagca gaacccaacc tccgagcagt acatgctaag acttcaccag tcaaagcgaa 2880
ctactatact caattgatcc aataacttga ccaacggaac aagttaccct agggataaca 2940
gcgcaatcct attctagagt ccatatcaac aatagggttt acgacctcga tgttggatca 3000
ggacatcccg atggtgcagc cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac 3060
gtgatctgag ttcagaccgg agtaatccag gtcggtttct atctacnttc aaattcctcc 3120
ctgtacgaaa ggacaagaga aataaggcct acttcacaaa gcgccttccc ccgtaaatga 3180
tatcatctca acttagtatt atacccacac ccacccaaga acagggtttg ttaagatggc 3240
agagcccggt aatcgcataa aacttaaaac tttacagtca gaggttcaat tcctcttctt 3300
aacaacatac ccatggccaa cctcctactc ctcattgtac ccattctaat cgcaatggca 3360
ttcctaatgc ttaccgaacg aaaaattcta ggctatatac aactacgcaa aggccccaac 3420
gttgtaggcc cctacgggct actacaaccc ttcgctgacg ccataaaact cttcaccaaa 3480
gagcccctaa aacccgccac atctaccatc accctctaca tcaccgcccc gaccttagct 3540
ctcaccatcg ctcttctact atgaaccccc ctccccatac ccaaccccct ggtcaacctc 3600
aacctaggcc tcctatttat tctagccacc tctagcctag ccgtttactc aatcctctga 3660
tcagggtgag catcaaactc aaactacgcc ctgatcggcg cactgcgagc agtagcccaa 3720
acaatctcat atgaagtcac cctagccatc attctactat caacattact aataagtggc 3780
tcctttaacc tctccaccct tatcacaaca caagaacacc tctgattact cctgccatca 3840
tgacccttgg ccataatatg atttatctcc acactagcag agaccaaccg aacccccttc 3900
gaccttgccg aaggggagtc cgaactagtc tcaggcttca acatcgaata cgccgcaggc 3960
cccttcgccc tattcttcat agccgaatac acaaacatta ttataataaa caccctcacc 4020
actacaatct tcctaggaac aacatatgac gcactctccc ctgaactcta cacaacatat 4080
tttgtcacca agaccctact tctaacctcc ctgttcttat gaattcgaac agcatacccc 4140
cgattccgct acgaccaact catacacctc ctatgaaaaa acttcctacc actcacccta 4200
gcattactta tatgatatgt ctccataccc attacaatct ccagcattcc ccctcaaacc 4260
taagaaatat gtctgataaa agagttactt tgatagagta aataatagga gcttaaaccc 4320
ccttatttct aggactatga gaatcgaacc catccctgag aatccaaaat tctccgtgcc 4380
acctatcaca ccccatccta aagtaaggtc agctaaataa gctatcgggc ccataccccg 4440
aaaatgttgg ttataccctt cccgtactaa ttaatcccct ggcccaaccc gtcatctact 4500
ctaccatctt tgcaggcaca ctcatcacag cgctaagctc gcactgattt tttacctgag 4560
taggcctaga aataaacatg ctagctttta ttccagttct aaccaaaaaa ataaaccctc 4620
gttccacaga agctgccatc aagtatttcc tcacgcaagc aaccgcatcc ataatccttc 4680
taatagctat cctcttcaac aatatactct ccggacaatg aaccataacc aatactacca 4740
atcaatactc atcattaata atcataatag ctatagcaat aaaactagga atagccccct 4800
ttcacttctg agtcccagag gttacccaag gcacccctct gacatccggc ctgcttcttc 4860
tcacatgaca aaaactagcc cccatctcaa tcatatacca aatctctccc tcactaaacg 4920
taagccttct cctcactctc tcaatcttat ccatcatagc aggcagttga ggtggattaa 4980
accaaaccca gctacgcaaa atcttagcat actcctcaat tacccacata ggatgaataa 5040
tagcagttct accgtacaac cctaacataa ccattcttaa tttaactatt tatattatcc 5100
taactactac cgcattccta ctactcaact taaactccag caccacgacc ctactactat 5160
ctcgcacctg aaacaagcta acatgactaa cacccttaat tccatccacc ctcctctccc 5220
taggaggcct gcccccgcta accggctttt tgcccaaatg ggccattatc gaagaattca 5280
caaaaaacaa tagcctcatc atccccacca tcatagccac catcaccctc cttaacctct 5340
acttctacct acgcctaatc tactccacct caatcacact actccccata tctaacaacg 5400
taaaaataaa atgacagttt gaacatacaa aacccacccc attcctcccc acactcatcg 5460
cccttaccac gctactccta cctatctccc cttttatact aataatctta tagaaattta 5520
ggttaaatac agaccaagag ccttcaaagc cctcagtaag ttgcaatact taatttctgt 5580
aacagctaag gactgcaaaa ccccactctg catcaactga acgcaaatca gccactttaa 5640
ttaagctaag cccttactag accaatggga cttaaaccca caaacactta gttaacagct 5700
aagcacccta atcaactggc ttcaatctac ttctcccgcc gccgggaaaa aaggcgggag 5760
aagccccggc aggtttgaag ctgcttcttc gaatttgcaa ttcaatatga aaatcacctc 5820
ggagctggta aaaagaggcc taacccctgt ctttagattt acagtccaat gcttcactca 5880
gccattttac ctcaccccca ctgatgttcg ccgaccgttg actattctct acaaaccaca 5940
aagacattgg aacactatac ctattattcg gcgcatgagc tggagtccta ggcacagctc 6000
taagcctcct tattcgagcc gagctgggcc agccaggcaa ccttctaggt aacgaccaca 6060
tctacaacgt tatcgtcaca gcccatgcat ttgtaataat cttcttcata gtaataccca 6120
tcataatcgg aggctttggc aactgactag ttcccctaat aatcggtgcc cccgatatgg 6180
cgtttccccg cataaacaac ataagcttct gactcttacc tccctctctc ctactcctgc 6240
tcgcatctgc tatagtggag gccggagcag gaacaggttg aacagtctac cctcccttag 6300
cagggaacta ctcccaccct ggagcctccg tagacctaac catcttctcc ttacacctag 6360
caggtgtctc ctctatctta ggggccatca atttcatcac aacaattatc aatataaaac 6420
cccctgccat aacccaatac caaacgcccc tcttcgtctg atccgtccta atcacagcag 6480
tcctacttct cctatctctc ccagtcctag ctgctggcat cactatacta ctaacagacc 6540
gcaacctcaa caccaccttc ttcgaccccg ccggaggagg agaccccatt ctataccaac 6600
acctattctg atttttcggt caccctgaag tttatattct tatcctacca ggcttcggaa 6660
taatctccca tattgtaact tactactccg gaaaaaaaga accatttgga tacataggta 6720
tggtctgagc tatgatatca attggcttcc tagggtttat cgtgtgagca caccatatat 6780
ttacagtagg aatagacgta gacacacgag catatttcac ctccgctacc ataatcatcg 6840
ctatccccac cggcgtcaaa gtatttagct gactcgccac actccacgga agcaatatga 6900
aatgatctgc tgcagtgctc tgagccctag gattcatctt tcttttcacc gtaggtggcc 6960
tgactggcat tgtattagca aactcatcac tagacatcgt actacacgac acgtactacg 7020
ttgtagccca cttccactat gtcctatcaa taggagctgt atttgccatc ataggaggct 7080
tcattcactg atttccccta ttctcaggct acaccctaga ccaaacctac gccaaaatcc 7140
atttcactat catattcatc ggcgtaaatc taactttctt cccacaacac tttctcggcc 7200
tatccggaat gccccgacgt tactcggact accccgatgc atacaccaca tgaaacatcc 7260
tatcatctgt aggctcattc atttctctaa cagcagtaat attaataatt ttcatgattt 7320
gagaagcctt cgcttcgaag cgaaaagtcc taatagtaga agaaccctcc ataaacctgg 7380
agtgactata tggatgcccc ccaccctacc acacattcga agaacccgta tacataaaat 7440
ctagacaaaa aaggaaggaa tcgaaccccc caaagctggt ttcaagccaa ccccatggcc 7500
tccatgactt tttcaaaaag gtattagaaa aaccatttca taactttgtc aaagttaaat 7560
tataggctaa atcctatata tcttaatggc acatgcagcg caagtaggtc tacaagacgc 7620
tacttcccct atcatagaag agcttatcac ctttcatgat cacgccctca taatcatttt 7680
ccttatctgc ttcctagtcc tgtatgccct tttcctaaca ctcacaacaa aactaactaa 7740
tactaacatc tcagacgctc aggaaataga aaccgtctga actatcctgc ccgccatcat 7800
cctagtcctc atcgccctcc catccctacg catcctttac ataacagacg aggtcaacga 7860
tccctccctt accatcaaat caattggcca ccaatggtac tgaacctacg agtacaccga 7920
ctacggcgga ctaatcttca actcctacat acttccccca ttattcctag aaccaggcga 7980
cctgcgactc cttgacgttg acaatcgagt agtactcccg attgaagccc ccattcgtat 8040
aataattaca tcacaagacg tcttgcactc atgagctgtc cccacattag gcttaaaaac 8100
agatgcaatt cccggacgtc taaaccaaac cactttcacc gctacacgac cgggggtata 8160
ctacggtcaa tgctctgaaa tctgtggagc aaaccacagt ttcatgccca tcgtcctaga 8220
attaattccc ctaaaaatct ttgaaatagg gcccgtattt accctatagc accccctcta 8280
ccccctctag agcccactgt aaagctaact tagcattaac cttttaagtt aaagattaag 8340
agaaccaaca cctctttaca gtgaaatgcc ccaactaaat actaccgtat ggcccaccat 8400
aattaccccc atactcctta cactattcct catcacccaa ctaaaaatat taaacacaaa 8460
ctaccaccta cctccctcac caaagcccat aaaaataaaa aattataaca aaccctgaga 8520
accaaaatga acgaaaatct gttcgcttca ttcattgccc ccacaatcct aggcctaccc 8580
gccgcagtac tgatcattct atttccccct ctattgatcc ccacctccaa atatctcatc 8640
aacaaccgac taatcaccac ccaacaatga ctaatcaaac taacctcaaa acaaatgata 8700
accatacaca acactaaagg acgaacctga tctcttatac tagtatcctt aatcattttt 8760
attgccacaa ctaacctcct cggactcctg cctcactcat ttacaccaac cacccaacta 8820
tctataaacc tagccatggc catcccctta tgagcgggca cagtgattat aggctttcgc 8880
tctaagatta aaaatgccct agcccacttc ttaccacaag gcacacctac accccttatc 8940
cccatactag ttattatcga aaccatcagc ctactcattc aaccaatagc cctggccgta 9000
cgcctaaccg ctaacattac tgcaggccac ctactcatgc acctaattgg aagcgccacc 9060
ctagcaatat caaccattaa ccttccctct acacttatca tcttcacaat tctaattcta 9120
ctgactatcc tagaaatcgc tgtcgcctta atccaagcct acgttttcac acttctagta 9180
agcctctacc tgcacgacaa cacataatga cccaccaatc acatgcctat catatagtaa 9240
aacccagccc atgaccccta acaggggccc tctcagccct cctaatgacc tccggcctag 9300
ccatgtgatt tcacttccac tccataacgc tcctcatact aggcctacta accaacacac 9360
taaccatata ccaatgatgg cgcgatgtaa cacgagaaag cacataccaa ggccaccaca 9420
caccacctgt ccaaaaaggc cttcgatacg ggataatcct atttattacc tcagaagttt 9480
ttttcttcgc aggatttttc tgagcctttt accactccag cctagcccct accccccaat 9540
taggagggca ctggccccca acaggcatca ccccgctaaa tcccctagaa gtcccactcc 9600
taaacacatc cgtattactc gcatcaggag tatcaatcac ctgagctcac catagtctaa 9660
tagaaaacaa ccgaaaccaa ataattcaag cactgcttat tacaatttta ctgggtctct 9720
attttaccct cctacaagcc tcagagtact tcgagtctcc cttcaccatt tccgacggca 9780
tctacggctc aacatttttt gtagccacag gcttccacgg acttcacgtc attattggct 9840
caactttcct cactatctgc ttcatccgcc aactaatatt tcactttaca tccaaacatc 9900
actttggctt cgaagccgcc gcctgatact ggcattttgt agatgtggtt tgactatttc 9960
tgtatgtctc catctattga tgagggtctt actcttttag tataaatagt accgttaact 10020
tccaattaac tagttttgac aacattcaaa aaagagtaat aaacttcgcc ttaattttaa 10080
taatcaacac cctcctagcc ttactactaa taattattac attttgacta ccacaactca 10140
acggctacat agaaaaatcc accccttacg agtgcggctt cgaccctata tcccccgccc 10200
gcgtcccttt ctccataaaa ttcttcttag tagctattac cttcttatta tttgatctag 10260
aaattgccct ccttttaccc ctaccatgag ccctacaaac aactaacctg ccactaatag 10320
ttatgtcatc cctcttatta atcatcatcc tagccctaag tctggcctat gagtgactac 10380
aaaaaggatt agactgaacc gaattggtat atagtttaaa caaaacgaat gatttcgact 10440
cattaaatta tgataatcat atttaccaaa tgcccctcat ttacataaat attatactag 10500
catttaccat ctcacttcta ggaatactag tatatcgctc acacctcata tcctccctac 10560
tatgcctaga aggaataata ctatcgctgt tcattatagc tactctcata accctcaaca 10620
cccactccct cttagccaat attgtgccta ttgccatact agtctttgcc gcctgcgaag 10680
cagcggtggg cctagcccta ctagtctcaa tctccaacac atatggccta gactacgtac 10740
ataacctaaa cctactccaa tgctaaaact aatcgtccca acaattatat tactaccact 10800
gacatgactt tccaaaaaac acataatttg aatcaacaca accacccaca gcctaattat 10860
tagcatcatc cctctactat tttttaacca aatcaacaac aacctattta gctgttcccc 10920
aaccttttcc tccgaccccc taacaacccc cctcctaata ctaactacct gactcctacc 10980
cctcacaatc atggcaagcc aacgccactt atccagtgaa ccactatcac gaaaaaaact 11040
ctacctctct atactaatct ccctacaaat ctccttaatt ataacattca cagccacaga 11100
actaatcata ttttatatct tcttcgaaac cacacttatc cccaccttgg ctatcatcac 11160
ccgatgaggc aaccagccag aacgcctgaa cgcaggcaca tacttcctat tctacaccct 11220
agtaggctcc cttcccctac tcatcgcact aatttacact cacaacaccc taggctcact 11280
aaacattcta ctactcactc tcactgccca agaactatca aactcctgag ccaacaactt 11340
aatatgacta gcttacacaa tagcttttat agtaaagata cctctttacg gactccactt 11400
atgactccct aaagcccatg tcgaagcccc catcgctggg tcaatagtac ttgccgcagt 11460
actcttaaaa ctaggcggct atggtataat acgcctcaca ctcattctca accccctgac 11520
aaaacacata gcctacccct tccttgtact atccctatga ggcataatta taacaagctc 11580
catctgccta cgacaaacag acctaaaatc gctcattgca tactcttcaa tcagccacat 11640
agccctcgta gtaacagcca ttctcatcca aaccccctga agcttcaccg gcgcagtcat 11700
tctcataatc gcccacgggc ttacatcctc attactattc tgcctagcaa actcaaacta 11760
cgaacgcact cacagtcgca tcataatcct ctctcaagga cttcaaactc tactcccact 11820
aatagctttt tgatgacttc tagcaagcct cgctaacctc gccttacccc ccactattaa 11880
cctactggga gaactctctg tgctagtaac cacgttctcc tgatcaaata tcactctcct 11940
acttacagga ctcaacatac tagtcacagc cctatactcc ctctacatat ttaccacaac 12000
acaatggggc tcactcaccc accacattaa caacataaaa ccctcattca cacgagaaaa 12060
caccctcatg ttcatacacc tatcccccat tctcctccta tccctcaacc ccgacatcat 12120
taccgggttt tcctcttgta aatatagttt aaccaaaaca tcagattgtg aatctgacaa 12180
cagaggctta cgacccctta tttaccgaga aagctcacaa gaactgctaa ctcatgcccc 12240
catgtctaac aacatggctt tctcaacttt taaaggataa cagctatcca ttggtcttag 12300
gccccaaaaa ttttggtgca actccaaata aaagtaataa ccatgcacac tactataacc 12360
accctaaccc tgacttccct aattcccccc atccttacca ccctcgttaa ccctaacaaa 12420
aaaaactcat acccccatta tgtaaaatcc attgtcgcat ccacctttat tatcagtctc 12480
ttccccacaa caatattcat gtgcctagac caagaagtta ttatctcgaa ctgacactga 12540
gccacaaccc aaacaaccca gctctcccta agcttcaaac tagactactt ctccataata 12600
ttcatccctg tagcattgtt cgttacatgg tccatcatag aattctcact gtgatatata 12660
aactcagacc caaacattaa tcagttcttc aaatatctac tcatcttcct aattaccata 12720
ctaatcttag ttaccgctaa caacctattc caactgttca tcggctgaga gggcgtagga 12780
attatatcct tcttgctcat cagttgatga tacgcccgag cagatgccaa cacagcagcc 12840
attcaagcaa tcctatacaa ccgtatcggc gatatcggtt tcatcctcgc cttagcatga 12900
tttatcctac actccaactc atgagaccca caacaaatag cccttctaaa cgctaatcca 12960
agcctcaccc cactactagg cctcctccta gcagcagcag gcaaatcagc ccaattaggt 13020
ctccacccct gactcccctc agccatagaa ggccccaccc cagtctcagc cctactccac 13080
tcaagcacta tagttgtagc aggaatcttc ttactcatcc gcttccaccc cctagcagaa 13140
aatagcccac taatccaaac tctaacacta tgcttaggcg ctatcaccac tctgttcgca 13200
gcagtctgcg cccttacaca aaatgacatc aaaaaaatcg tagccttctc cacttcaagt 13260
caactaggac tcataatagt tacaatcggc atcaaccaac cacacctagc attcctgcac 13320
atctgtaccc acgccttctt caaagccata ctatttatgt gctccgggtc catcatccac 13380
aaccttaaca atgaacaaga tattcgaaaa ataggaggac tactcaaaac catacctctc 13440
acttcaacct ccctcaccat tggcagccta gcattagcag gaataccttt cctcacaggt 13500
ttctactcca aagaccacat catcgaaacc gcaaacatat catacacaaa cgcctgagcc 13560
ctatctatta ctctcatcgc tacctccctg acaagcgcct atagcactcg aataattctt 13620
ctcaccctaa caggtcaacc tcgcttcccc acccttacta acattaacga aaataacccc 13680
accctactaa accccattaa acgcctggca gccggaagcc tattcgcagg atttctcatt 13740
actaacaaca tttcccccgc atcccccttc caaacaacaa tccccctcta cctaaaactc 13800
acagccctcg ctgtcacttt cctaggactt ctaacagccc tagacctcaa ctacctaacc 13860
aacaaactta aaataaaatc cccactatgc acattttatt tctccaacat actcggattc 13920
taccctagca tcacacaccg cacaatcccc tatctaggcc ttcttacgag ccaaaacctg 13980
cccctactcc tcctagacct aacctgacta gaaaagctat tacctaaaac aatttcacag 14040
caccaaatct ccacctccat catcacctca acccaaaaag gcataattaa actttacttc 14100
ctctctttct tcttcccact catcctaacc ctactcctaa tcacataacc tattcccccg 14160
agcaatctca attacaatat atacaccaac aaacaatgtt caaccagtaa ctactactaa 14220
tcaacgccca taatcataca aagcccccgc accaatagga tcctcccgaa tcaaccctga 14280
cccctctcct tcataaatta ttcagcttcc tacactatta aagtttacca caaccaccac 14340
cccatcatac tctttcaccc acagcaccaa tcctacctcc atcgctaacc ccactaaaac 14400
actcaccaag acctcaaccc ctgaccccca tgcctcagga tactcctcaa tagccatcgc 14460
tgtagtatat ccaaagacaa ccatcattcc ccctaaataa attaaaaaaa ctattaaacc 14520
catataacct cccccaaaat tcagaataat aacacacccg accacaccgc taacaatcaa 14580
tactaaaccc ccataaatag gagaaggctt agaagaaaac cccacaaacc ccattactaa 14640
acccacactc aacagaaaca aagcatacat cattattctc gcacggacta caaccacgac 14700
caatgatatg aaaaaccatc gttgtatttc aactacaaga acaccaatga ccccaatacg 14760
caaaactaac cccctaataa aattaattaa ccactcattc atcgacctcc ccaccccatc 14820
caacatctcc gcatgatgaa acttcggctc actccttggc gcctgcctga tcctccaaat 14880
caccacagga ctattcctag ccatgcacta ctcaccagac gcctcaaccg ccttttcatc 14940
aatcgcccac atcactcgag acgtaaatta tggctgaatc atccgctacc ttcacgccaa 15000
tggcgcctca atattcttta tctgcctctt cctacacatc gggcgaggcc tatattacgg 15060
atcatttctc tactcagaaa cctgaaacat cggcattatc ctcctgcttg caactatagc 15120
aacagccttc ataggctatg tcctcccgtg aggccaaata tcattctgag gggccacagt 15180
aattacaaac ttactatccg ccatcccata cattgggaca gacctagttc aatgaatctg 15240
aggaggctac tcagtagaca gtcccaccct cacacgattc tttacctttc acttcatctt 15300
gcccttcatt attgcagccc tagcaacact ccacctccta ttcttgcacg aaacgggatc 15360
aaacaacccc ctaggaatca cctcccattc cgataaaatc accttccacc cttactacac 15420
aatcaaagac gccctcggct tacttctctt ccttctctcc ttaatgacat taacactatt 15480
ctcaccagac ctcctaggcg acccagacaa ttatacccta gccaacccct taaacacccc 15540
tccccacatc aagcccgaat gatatttcct attcgcctac acaattctcc gatccgtccc 15600
taacaaacta ggaggcgtcc ttgccctatt actatccatc ctcatcctag caataatccc 15660
catcctccat atatccaaac aacaaagcat aatatttcgc ccactaagcc aatcacttta 15720
ttgactccta gccgcagacc tcctcattct aacctgaatc ggaggacaac cagtaagcta 15780
cccttttacc atcattggac aagtagcatc cgtactatac ttcacaacaa tcctaatcct 15840
aataccaact atctccctaa ttgaaaacaa aatactcaaa tgggcctgtc cttgtagtat 15900
aaactaatac accagtcttg taaaccggag atgaaaacct ttttccaagg acaaatcaga 15960
gaaaaagtct ttaactccac cattagcacc caaagctaag attctaattt aaactattct 16020
ctgttctttc atggggaagc agatttgggt accacccaag tattgactca cccatcaaca 16080
accgctatgt atttcgtaca ttactgccag ccaccatgaa tattgtacgg taccataaat 16140
acttgaccac ctgtagtaca taaaaaccca atccacatca aaaccccctc cccatgctta 16200
caagcaagta cagcaatcaa ccctcaacta tcacacatca actgcaactc caaagccacc 16260
cctcacccac taggatacca acaaacctac ccacccttaa cagtacatag tacataaagc 16320
catttaccgt acatagcaca ttacagtcaa atcccttctc gtccccatgg atgacccccc 16380
tcagataggg gtcccttgac caccatcctc cgtgaaatca atatcccgca caagagtgct 16440
actctcctcg ctccgggccc ataacacttg ggggtagcta aagtgaactg tatccgacat 16500
ctggttccta cttcagggtc ataaagccta aatagcccac acgttcccct taaataagac 16560
atcacgatg 16569
<210> 2
<211> 783
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (81)..(82)
<223> 位置81和位置82包括突变的左基因和突变的右基因之间的连接位置
<400> 2
atggcccacc ataattaccc ccatactcct tacactattc ctcatcaccc aactaaaaat 60
attaaacaca aactaccacc tacctccctc accattggca gcctagcatt agcaggaata 120
cctttcctca caggtttcta ctccaaagac cacatcatcg aaaccgcaaa catatcatac 180
acaaacgcct gagccctatc tattactctc atcgctacct ccctgacaag cgcctatagc 240
actcgaataa ttcttctcac cctaacaggt caacctcgct tccccaccct tactaacatt 300
aacgaaaata accccaccct actaaacccc attaaacgcc tggcagccgg aagcctattc 360
gcaggatttc tcattactaa caacatttcc cccgcatccc ccttccaaac aacaatcccc 420
ctctacctaa aactcacagc cctcgctgtc actttcctag gacttctaac agccctagac 480
ctcaactacc taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc 540
aacatactcg gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt 600
acgagccaaa acctgcccct actcctccta gacctaacct gactagaaaa gctattacct 660
aaaacaattt cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata 720
attaaacttt acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca 780
taa 783
<210> 3
<211> 565
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (407)..(408)
<223> 位置407和位置408包括突变的左基因和突变的右基因之间的连接位置
<400> 3
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactcctagc cgcagacctc 420
ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 480
gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 540
gaaaacaaaa tactcaaatg ggcct 565
<210> 4
<211> 1905
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (665)..(666)
<223> 位置665和位置666包括突变的左基因和突变的右基因之间的连接位置
<400> 4
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600
atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660
tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720
ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780
cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840
agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900
agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960
gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020
ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080
tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140
cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200
tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260
tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320
tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380
accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440
ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500
aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560
gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620
aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680
cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740
ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800
caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860
tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905
<210> 5
<211> 1905
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (662)..(663)
<223> 位置662和位置663包括突变的左基因和突变的右基因之间的连接位置
<400> 5
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600
atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660
tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720
ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780
cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840
agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900
agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960
gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020
ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080
tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140
cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200
tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260
tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320
tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380
accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440
ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500
aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560
gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620
aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680
cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740
ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800
caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860
tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905
<210> 6
<211> 1629
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (309)..(310)
<223> 位置309和位置310包括突变的左基因和突变的右基因之间的连接位置
<400> 6
ataaacttcg ccttaatttt aataatcaac accctcctag ccttactact aataattatt 60
acattttgac taccacaact caacggctac atagaaaaat ccacccctta cgagtgcggc 120
ttcgacccta tatcccccgc ccgcgtccct ttctccataa aattcttctt agtagctatt 180
accttcttat tatttgatct agaaattgcc ctccttttac ccctaccatg agccctacaa 240
acaactaacc tgccactaat agttatgtca tccctcttat taatcatcat cctagcccta 300
agtctggcca acacagcagc cattcaagca atcctataca accgtatcgg cgatatcggt 360
ttcatcctcg ccttagcatg atttatccta cactccaact catgagaccc acaacaaata 420
gcccttctaa acgctaatcc aagcctcacc ccactactag gcctcctcct agcagcagca 480
ggcaaatcag cccaattagg tctccacccc tgactcccct cagccataga aggccccacc 540
ccagtctcag ccctactcca ctcaagcact atagttgtag caggaatctt cttactcatc 600
cgcttccacc ccctagcaga aaatagccca ctaatccaaa ctctaacact atgcttaggc 660
gctatcacca ctctgttcgc agcagtctgc gcccttacac aaaatgacat caaaaaaatc 720
gtagccttct ccacttcaag tcaactagga ctcataatag ttacaatcgg catcaaccaa 780
ccacacctag cattcctgca catctgtacc cacgccttct tcaaagccat actatttatg 840
tgctccgggt ccatcatcca caaccttaac aatgaacaag atattcgaaa aataggagga 900
ctactcaaaa ccatacctct cacttcaacc tccctcacca ttggcagcct agcattagca 960
ggaatacctt tcctcacagg tttctactcc aaagaccaca tcatcgaaac cgcaaacata 1020
tcatacacaa acgcctgagc cctatctatt actctcatcg ctacctccct gacaagcgcc 1080
tatagcactc gaataattct tctcacccta acaggtcaac ctcgcttccc cacccttact 1140
aacattaacg aaaataaccc caccctacta aaccccatta aacgcctggc agccggaagc 1200
ctattcgcag gatttctcat tactaacaac atttcccccg catccccctt ccaaacaaca 1260
atccccctct acctaaaact cacagccctc gctgtcactt tcctaggact tctaacagcc 1320
ctagacctca actacctaac caacaaactt aaaataaaat ccccactatg cacattttat 1380
ttctccaaca tactcggatt ctaccctagc atcacacacc gcacaatccc ctatctaggc 1440
cttcttacga gccaaaacct gcccctactc ctcctagacc taacctgact agaaaagcta 1500
ttacctaaaa caatttcaca gcaccaaatc tccacctcca tcatcacctc aacccaaaaa 1560
ggcataatta aactttactt cctctctttc ttcttcccac tcatcctaac cctactccta 1620
atcacataa 1629
<210> 7
<211> 1692
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (357)..(358)
<223> 位置357位和位置358包括突变的左基因和突变的右基因之间的连接位置
<400> 7
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240
tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300
agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360
cgagcagatg ccaacacagc agccattcaa gcaatcctat acaaccgtat cggcgatatc 420
ggtttcatcc tcgccttagc atgatttatc ctacactcca actcatgaga cccacaacaa 480
atagcccttc taaacgctaa tccaagcctc accccactac taggcctcct cctagcagca 540
gcaggcaaat cagcccaatt aggtctccac ccctgactcc cctcagccat agaaggcccc 600
accccagtct cagccctact ccactcaagc actatagttg tagcaggaat cttcttactc 660
atccgcttcc accccctagc agaaaatagc ccactaatcc aaactctaac actatgctta 720
ggcgctatca ccactctgtt cgcagcagtc tgcgccctta cacaaaatga catcaaaaaa 780
atcgtagcct tctccacttc aagtcaacta ggactcataa tagttacaat cggcatcaac 840
caaccacacc tagcattcct gcacatctgt acccacgcct tcttcaaagc catactattt 900
atgtgctccg ggtccatcat ccacaacctt aacaatgaac aagatattcg aaaaatagga 960
ggactactca aaaccatacc tctcacttca acctccctca ccattggcag cctagcatta 1020
gcaggaatac ctttcctcac aggtttctac tccaaagacc acatcatcga aaccgcaaac 1080
atatcataca caaacgcctg agccctatct attactctca tcgctacctc cctgacaagc 1140
gcctatagca ctcgaataat tcttctcacc ctaacaggtc aacctcgctt ccccaccctt 1200
actaacatta acgaaaataa ccccacccta ctaaacccca ttaaacgcct ggcagccgga 1260
agcctattcg caggatttct cattactaac aacatttccc ccgcatcccc cttccaaaca 1320
acaatccccc tctacctaaa actcacagcc ctcgctgtca ctttcctagg acttctaaca 1380
gccctagacc tcaactacct aaccaacaaa cttaaaataa aatccccact atgcacattt 1440
tatttctcca acatactcgg attctaccct agcatcacac accgcacaat cccctatcta 1500
ggccttctta cgagccaaaa cctgccccta ctcctcctag acctaacctg actagaaaag 1560
ctattaccta aaacaatttc acagcaccaa atctccacct ccatcatcac ctcaacccaa 1620
aaaggcataa ttaaacttta cttcctctct ttcttcttcc cactcatcct aaccctactc 1680
ctaatcacat aa 1692
<210> 8
<211> 572
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (387)..(388)
<223> 位置387和位置388包括突变的左基因和突变的右基因之间的连接位置
<400> 8
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacag gccacctact catgcaccta attggaagcg 420
ccaccctagc aatatcaacc attaaccttc cctctacact tatcatcttc acaattctaa 480
ttctactgac tatcctagaa atcgctgtcg ccttaatcca agcctacgtt ttcacacttc 540
tagtaagcct ctacctgcac gacaacacat aa 572
<210> 9
<211> 652
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (560)..(561)
<223> 位置560 和位置561包括突变的左基因和突变的右基因之间的连接位置
<400> 9
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc actaatagtt atgtcatccc tcttattaat catcatccta 600
gccctaagtc tggcctatga gtgactacaa aaaggattag actgaaccga at 652
<210> 10
<211> 1453
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (553)..(554)
<223> 位置553和位置554包括突变的左基因和突变的右基因之间的连接位置
<400> 10
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttca cgccaatggc gcctcaatat tctttatctg cctcttccta 600
cacatcgggc gaggcctata ttacggatca tttctctact cagaaacctg aaacatcggc 660
attatcctcc tgcttgcaac tatagcaaca gccttcatag gctatgtcct cccgtgaggc 720
caaatatcat tctgaggggc cacagtaatt acaaacttac tatccgccat cccatacatt 780
gggacagacc tagttcaatg aatctgagga ggctactcag tagacagtcc caccctcaca 840
cgattcttta cctttcactt catcttgccc ttcattattg cagccctagc aacactccac 900
ctcctattct tgcacgaaac gggatcaaac aaccccctag gaatcacctc ccattccgat 960
aaaatcacct tccaccctta ctacacaatc aaagacgccc tcggcttact tctcttcctt 1020
ctctccttaa tgacattaac actattctca ccagacctcc taggcgaccc agacaattat 1080
accctagcca accccttaaa cacccctccc cacatcaagc ccgaatgata tttcctattc 1140
gcctacacaa ttctccgatc cgtccctaac aaactaggag gcgtccttgc cctattacta 1200
tccatcctca tcctagcaat aatccccatc ctccatatat ccaaacaaca aagcataata 1260
tttcgcccac taagccaatc actttattga ctcctagccg cagacctcct cattctaacc 1320
tgaatcggag gacaaccagt aagctaccct tttaccatca ttggacaagt agcatccgta 1380
ctatacttca caacaatcct aatcctaata ccaactatct ccctaattga aaacaaaata 1440
ctcaaatggg cct 1453
<210> 11
<211> 1705
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (1357)..(1358)
<223> 位置1357和位置1358包括突变的左基因和突变的右基因之间的连接位置
<400> 11
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240
tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300
agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360
ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420
gcctccgtag acctaaccat cttctcctta cacctagcag gtgtctcctc tatcttaggg 480
gccatcaatt tcatcacaac aattatcaat ataaaacccc ctgccataac ccaataccaa 540
acgcccctct tcgtctgatc cgtcctaatc acagcagtcc tacttctcct atctctccca 600
gtcctagctg ctggcatcac tatactacta acagaccgca acctcaacac caccttcttc 660
gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 720
cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 780
tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 840
ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 900
acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 960
tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 1020
gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1080
tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1140
ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1200
tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1260
gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1320
tcggactacc ccgatgcata caccacatga aacatccctc cccacatcaa gcccgaatga 1380
tatttcctat tcgcctacac aattctccga tccgtcccta acaaactagg aggcgtcctt 1440
gccctattac tatccatcct catcctagca ataatcccca tcctccatat atccaaacaa 1500
caaagcataa tatttcgccc actaagccaa tcactttatt gactcctagc cgcagacctc 1560
ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 1620
gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 1680
gaaaacaaaa tactcaaatg ggcct 1705
<210> 12
<211> 1361
<212> DNA
<213> 人
<220>
<221> misc_feature
<222> (66)..(67)
<223> 位置66和位置 67包括突变的左基因和突变的右基因之间的连接位置
<400> 12
atgccccaac taaatactac cgtatggccc accataatta cccccatact ccttacacta 60
ttcctcacca cccacagcct aattttagca tcatccctct actatttttt aaccaaatca 120
acaacaacct atttagctgt tccccaacct tttcctccga ccccctaaca acccccctcc 180
taatactaac tacctgactc ctacccctca caatcatggc aagccaacgc cacttatcca 240
gtgaaccact atcacgaaaa aaactctacc tctctatact aatctcccta caaatctcct 300
taattataac attcacagcc acagaactaa tcatatttta tatcttcttc gaaaccacac 360
ttatccccac cttggctatc atcacccgat gaggcaacca gccagaacgc ctgaacgcag 420
gcacatactt cctattctac accctagtag gctcccttcc cctactcatc gcactaattt 480
acactcacaa caccctaggc tcactaaaca ttctactact cactctcact gcccaagaac 540
tatcaaactc ctgagccaac aacttaatag actagcttac acaatagctt ttatagtaaa 600
gatacctctt tacggactcc acttatgact ccctaaagcc catgtcgaag cccccatcgc 660
tgggtcaata gtacttgccg cagtactctt aaaactaggc ggctatggta taatacgcct 720
cacactcatt ctcaaccccc tgacaaaaca catagcctac cccttccttg tactatccct 780
atgaggcata attataacaa gctccatctg cctacgacaa acagacctaa aatcgctcat 840
tgcatactct tcaatcagcc acatagccct cgtagtaaca gccattctca tccaaacccc 900
ctgaagcttc accggcgcag tcattctcat aatcgcccac gggcttacat cctcattact 960
attctgccta gcaaactcaa actacgaacg cactcacagt cgcatcataa tcctctctca 1020
aggacttcaa actctactcc cactaatagc tttttgatga cttctagcaa gcctcgctaa 1080
cctcgcctta ccccccacta ttaacctact gggagaactc tctgtgctag taaccacgtt 1140
ctcctgatca aatatcactc tcctacttac aggactcaac atactagtca cagccctata 1200
ctccctctac atatttacca caacacaatg gggctcactc acccaccaca ttaacaacat 1260
aaaaccctca ttcacacgag aaaacaccct catgttcata cacctatccc ccattctcct 1320
cctatccctc aaccccgaca tcattaccgg gttttcctct t 1361
<210> 13
<211> 783
<212> RNA
<213> 人
<400> 13
auggcccacc auaauuaccc ccauacuccu uacacuauuc cucaucaccc aacuaaaaau 60
auuaaacaca aacuaccacc uaccucccuc accauuggca gccuagcauu agcaggaaua 120
ccuuuccuca cagguuucua cuccaaagac cacaucaucg aaaccgcaaa cauaucauac 180
acaaacgccu gagcccuauc uauuacucuc aucgcuaccu cccugacaag cgccuauagc 240
acucgaauaa uucuucucac ccuaacaggu caaccucgcu uccccacccu uacuaacauu 300
aacgaaaaua accccacccu acuaaacccc auuaaacgcc uggcagccgg aagccuauuc 360
gcaggauuuc ucauuacuaa caacauuucc cccgcauccc ccuuccaaac aacaaucccc 420
cucuaccuaa aacucacagc ccucgcuguc acuuuccuag gacuucuaac agcccuagac 480
cucaacuacc uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc 540
aacauacucg gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu 600
acgagccaaa accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu 660
aaaacaauuu cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua 720
auuaaacuuu acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca 780
uaa 783
<210> 14
<211> 565
<212> RNA
<213> 人
<400> 14
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuagc cgcagaccuc 420
cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 480
guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 540
gaaaacaaaa uacucaaaug ggccu 565
<210> 15
<211> 1905
<212> RNA
<213> 人
<400> 15
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600
auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660
uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720
cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780
caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840
agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900
agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960
gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020
cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080
uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140
cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200
ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260
uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320
ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380
acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440
cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500
aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560
gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620
aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680
ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740
cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800
caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860
ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905
<210> 16
<211> 1905
<212> RNA
<213> 人
<400> 16
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600
auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660
uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720
cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780
caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840
agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900
agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960
gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020
cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080
uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140
cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200
ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260
uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320
ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380
acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440
cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500
aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560
gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620
aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680
ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740
cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800
caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860
ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905
<210> 17
<211> 1629
<212> RNA
<213> 人
<400> 17
auaaacuucg ccuuaauuuu aauaaucaac acccuccuag ccuuacuacu aauaauuauu 60
acauuuugac uaccacaacu caacggcuac auagaaaaau ccaccccuua cgagugcggc 120
uucgacccua uaucccccgc ccgcgucccu uucuccauaa aauucuucuu aguagcuauu 180
accuucuuau uauuugaucu agaaauugcc cuccuuuuac cccuaccaug agcccuacaa 240
acaacuaacc ugccacuaau aguuauguca ucccucuuau uaaucaucau ccuagcccua 300
agucuggcca acacagcagc cauucaagca auccuauaca accguaucgg cgauaucggu 360
uucauccucg ccuuagcaug auuuauccua cacuccaacu caugagaccc acaacaaaua 420
gcccuucuaa acgcuaaucc aagccucacc ccacuacuag gccuccuccu agcagcagca 480
ggcaaaucag cccaauuagg ucuccacccc ugacuccccu cagccauaga aggccccacc 540
ccagucucag cccuacucca cucaagcacu auaguuguag caggaaucuu cuuacucauc 600
cgcuuccacc cccuagcaga aaauagccca cuaauccaaa cucuaacacu augcuuaggc 660
gcuaucacca cucuguucgc agcagucugc gcccuuacac aaaaugacau caaaaaaauc 720
guagccuucu ccacuucaag ucaacuagga cucauaauag uuacaaucgg caucaaccaa 780
ccacaccuag cauuccugca caucuguacc cacgccuucu ucaaagccau acuauuuaug 840
ugcuccgggu ccaucaucca caaccuuaac aaugaacaag auauucgaaa aauaggagga 900
cuacucaaaa ccauaccucu cacuucaacc ucccucacca uuggcagccu agcauuagca 960
ggaauaccuu uccucacagg uuucuacucc aaagaccaca ucaucgaaac cgcaaacaua 1020
ucauacacaa acgccugagc ccuaucuauu acucucaucg cuaccucccu gacaagcgcc 1080
uauagcacuc gaauaauucu ucucacccua acaggucaac cucgcuuccc cacccuuacu 1140
aacauuaacg aaaauaaccc cacccuacua aaccccauua aacgccuggc agccggaagc 1200
cuauucgcag gauuucucau uacuaacaac auuucccccg caucccccuu ccaaacaaca 1260
aucccccucu accuaaaacu cacagcccuc gcugucacuu uccuaggacu ucuaacagcc 1320
cuagaccuca acuaccuaac caacaaacuu aaaauaaaau ccccacuaug cacauuuuau 1380
uucuccaaca uacucggauu cuacccuagc aucacacacc gcacaauccc cuaucuaggc 1440
cuucuuacga gccaaaaccu gccccuacuc cuccuagacc uaaccugacu agaaaagcua 1500
uuaccuaaaa caauuucaca gcaccaaauc uccaccucca ucaucaccuc aacccaaaaa 1560
ggcauaauua aacuuuacuu ccucucuuuc uucuucccac ucauccuaac ccuacuccua 1620
aucacauaa 1629
<210> 18
<211> 1692
<212> RNA
<213> 人
<400> 18
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240
ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300
agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360
cgagcagaug ccaacacagc agccauucaa gcaauccuau acaaccguau cggcgauauc 420
gguuucaucc ucgccuuagc augauuuauc cuacacucca acucaugaga cccacaacaa 480
auagcccuuc uaaacgcuaa uccaagccuc accccacuac uaggccuccu ccuagcagca 540
gcaggcaaau cagcccaauu aggucuccac cccugacucc ccucagccau agaaggcccc 600
accccagucu cagcccuacu ccacucaagc acuauaguug uagcaggaau cuucuuacuc 660
auccgcuucc acccccuagc agaaaauagc ccacuaaucc aaacucuaac acuaugcuua 720
ggcgcuauca ccacucuguu cgcagcaguc ugcgcccuua cacaaaauga caucaaaaaa 780
aucguagccu ucuccacuuc aagucaacua ggacucauaa uaguuacaau cggcaucaac 840
caaccacacc uagcauuccu gcacaucugu acccacgccu ucuucaaagc cauacuauuu 900
augugcuccg gguccaucau ccacaaccuu aacaaugaac aagauauucg aaaaauagga 960
ggacuacuca aaaccauacc ucucacuuca accucccuca ccauuggcag ccuagcauua 1020
gcaggaauac cuuuccucac agguuucuac uccaaagacc acaucaucga aaccgcaaac 1080
auaucauaca caaacgccug agcccuaucu auuacucuca ucgcuaccuc ccugacaagc 1140
gccuauagca cucgaauaau ucuucucacc cuaacagguc aaccucgcuu ccccacccuu 1200
acuaacauua acgaaaauaa ccccacccua cuaaacccca uuaaacgccu ggcagccgga 1260
agccuauucg caggauuucu cauuacuaac aacauuuccc ccgcaucccc cuuccaaaca 1320
acaauccccc ucuaccuaaa acucacagcc cucgcuguca cuuuccuagg acuucuaaca 1380
gcccuagacc ucaacuaccu aaccaacaaa cuuaaaauaa aauccccacu augcacauuu 1440
uauuucucca acauacucgg auucuacccu agcaucacac accgcacaau ccccuaucua 1500
ggccuucuua cgagccaaaa ccugccccua cuccuccuag accuaaccug acuagaaaag 1560
cuauuaccua aaacaauuuc acagcaccaa aucuccaccu ccaucaucac cucaacccaa 1620
aaaggcauaa uuaaacuuua cuuccucucu uucuucuucc cacucauccu aacccuacuc 1680
cuaaucacau aa 1692
<210> 19
<211> 572
<212> RNA
<213> 人
<400> 19
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacag gccaccuacu caugcaccua auuggaagcg 420
ccacccuagc aauaucaacc auuaaccuuc ccucuacacu uaucaucuuc acaauucuaa 480
uucuacugac uauccuagaa aucgcugucg ccuuaaucca agccuacguu uucacacuuc 540
uaguaagccu cuaccugcac gacaacacau aa 572
<210> 20
<211> 652
<212> RNA
<213> 人
<400> 20
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc acuaauaguu augucauccc ucuuauuaau caucauccua 600
gcccuaaguc uggccuauga gugacuacaa aaaggauuag acugaaccga au 652
<210> 21
<211> 1453
<212> RNA
<213> 人
<400> 21
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuuca cgccaauggc gccucaauau ucuuuaucug ccucuuccua 600
cacaucgggc gaggccuaua uuacggauca uuucucuacu cagaaaccug aaacaucggc 660
auuauccucc ugcuugcaac uauagcaaca gccuucauag gcuauguccu cccgugaggc 720
caaauaucau ucugaggggc cacaguaauu acaaacuuac uauccgccau cccauacauu 780
gggacagacc uaguucaaug aaucugagga ggcuacucag uagacagucc cacccucaca 840
cgauucuuua ccuuucacuu caucuugccc uucauuauug cagcccuagc aacacuccac 900
cuccuauucu ugcacgaaac gggaucaaac aacccccuag gaaucaccuc ccauuccgau 960
aaaaucaccu uccacccuua cuacacaauc aaagacgccc ucggcuuacu ucucuuccuu 1020
cucuccuuaa ugacauuaac acuauucuca ccagaccucc uaggcgaccc agacaauuau 1080
acccuagcca accccuuaaa caccccuccc cacaucaagc ccgaaugaua uuuccuauuc 1140
gccuacacaa uucuccgauc cgucccuaac aaacuaggag gcguccuugc ccuauuacua 1200
uccauccuca uccuagcaau aauccccauc cuccauauau ccaaacaaca aagcauaaua 1260
uuucgcccac uaagccaauc acuuuauuga cuccuagccg cagaccuccu cauucuaacc 1320
ugaaucggag gacaaccagu aagcuacccu uuuaccauca uuggacaagu agcauccgua 1380
cuauacuuca caacaauccu aauccuaaua ccaacuaucu cccuaauuga aaacaaaaua 1440
cucaaauggg ccu 1453
<210> 22
<211> 1705
<212> RNA
<213> 人
<400> 22
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240
ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300
agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360
ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420
gccuccguag accuaaccau cuucuccuua caccuagcag gugucuccuc uaucuuaggg 480
gccaucaauu ucaucacaac aauuaucaau auaaaacccc cugccauaac ccaauaccaa 540
acgccccucu ucgucugauc cguccuaauc acagcagucc uacuucuccu aucucuccca 600
guccuagcug cuggcaucac uauacuacua acagaccgca accucaacac caccuucuuc 660
gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 720
ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 780
uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 840
ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 900
acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 960
uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 1020
gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1080
ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1140
cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1200
ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1260
guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1320
ucggacuacc ccgaugcaua caccacauga aacaucccuc cccacaucaa gcccgaauga 1380
uauuuccuau ucgccuacac aauucuccga uccgucccua acaaacuagg aggcguccuu 1440
gcccuauuac uauccauccu cauccuagca auaaucccca uccuccauau auccaaacaa 1500
caaagcauaa uauuucgccc acuaagccaa ucacuuuauu gacuccuagc cgcagaccuc 1560
cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 1620
guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 1680
gaaaacaaaa uacucaaaug ggccu 1705
<210> 23
<211> 1362
<212> RNA
<213> 人
<400> 23
augccccaac uaaauacuac cguauggccc accauaauua cccccauacu ccuuacacua 60
uuccucacca cccacagccu aauuauuagc aucaucccuc uacuauuuuu uaaccaaauc 120
aacaacaacc uauuuagcug uuccccaacc uuuuccuccg acccccuaac aaccccccuc 180
cuaauacuaa cuaccugacu ccuaccccuc acaaucaugg caagccaacg ccacuuaucc 240
agugaaccac uaucacgaaa aaaacucuac cucucuauac uaaucucccu acaaaucucc 300
uuaauuauaa cauucacagc cacagaacua aucauauuuu auaucuucuu cgaaaccaca 360
cuuaucccca ccuuggcuau caucacccga ugaggcaacc agccagaacg ccugaacgca 420
ggcacauacu uccuauucua cacccuagua ggcucccuuc cccuacucau cgcacuaauu 480
uacacucaca acacccuagg cucacuaaac auucuacuac ucacucucac ugcccaagaa 540
cuaucaaacu ccugagccaa caacuuaaua gacuagcuua cacaauagcu uuuauaguaa 600
agauaccucu uuacggacuc cacuuaugac ucccuaaagc ccaugucgaa gcccccaucg 660
cugggucaau aguacuugcc gcaguacucu uaaaacuagg cggcuauggu auaauacgcc 720
ucacacucau ucucaacccc cugacaaaac acauagccua ccccuuccuu guacuauccc 780
uaugaggcau aauuauaaca agcuccaucu gccuacgaca aacagaccua aaaucgcuca 840
uugcauacuc uucaaucagc cacauagccc ucguaguaac agccauucuc auccaaaccc 900
ccugaagcuu caccggcgca gucauucuca uaaucgccca cgggcuuaca uccucauuac 960
uauucugccu agcaaacuca aacuacgaac gcacucacag ucgcaucaua auccucucuc 1020
aaggacuuca aacucuacuc ccacuaauag cuuuuugaug acuucuagca agccucgcua 1080
accucgccuu accccccacu auuaaccuac ugggagaacu cucugugcua guaaccacgu 1140
ucuccugauc aaauaucacu cuccuacuua caggacucaa cauacuaguc acagcccuau 1200
acucccucua cauauuuacc acaacacaau ggggcucacu cacccaccac auuaacaaca 1260
uaaaacccuc auucacacga gaaaacaccc ucauguucau acaccuaucc cccauucucc 1320
uccuaucccu caaccccgac aucauuaccg gguuuuccuc uu 1362
<210> 24
<211> 260
<212> PRT
<213> 人
<400> 24
Met Ala His His Asn Tyr Pro His Thr Pro Tyr Thr Ile Pro His His
1 5 10 15
Pro Thr Lys Asn Ile Lys His Lys Leu Pro Pro Thr Ser Leu Thr Ile
20 25 30
Gly Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser
35 40 45
Lys Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp
50 55 60
Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser
65 70 75 80
Thr Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr
85 90 95
Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys
100 105 110
Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn
115 120 125
Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys
130 135 140
Leu Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp
145 150 155 160
Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr
165 170 175
Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg
180 185 190
Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu
195 200 205
Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser
210 215 220
Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met
225 230 235 240
Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu
245 250 255
Leu Leu Ile Thr
260
<210> 25
<211> 189
<212> PRT
<213> 人
<220>
<221> misc_feature
<222> (189)..(189)
<223> Xaa 可以是任何天然存在的氨基酸
<400> 25
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr
130 135 140
Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln
145 150 155 160
Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr
165 170 175
Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
180 185
<210> 26
<211> 634
<212> PRT
<213> 人
<400> 26
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
180 185 190
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu
195 200 205
Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser
210 215 220
Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser
225 230 235 240
Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala
245 250 255
Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr
260 265 270
Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile
275 280 285
Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile
290 295 300
Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala
305 310 315 320
Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser
325 330 335
Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln
340 345 350
Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala
355 360 365
Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu
370 375 380
Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr
385 390 395 400
Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe
405 410 415
Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met
420 425 430
Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser
435 440 445
Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly
450 455 460
Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr
465 470 475 480
Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly
485 490 495
Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr
500 505 510
Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly
515 520 525
Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met
530 535 540
Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr
545 550 555 560
Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser
565 570 575
Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu
580 585 590
Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr
595 600 605
Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe
610 615 620
Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr
625 630
<210> 27
<211> 634
<212> PRT
<213> 人
<400> 27
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
180 185 190
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu
195 200 205
Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser
210 215 220
Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser
225 230 235 240
Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala
245 250 255
Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr
260 265 270
Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile
275 280 285
Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile
290 295 300
Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala
305 310 315 320
Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser
325 330 335
Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln
340 345 350
Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala
355 360 365
Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu
370 375 380
Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr
385 390 395 400
Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe
405 410 415
Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met
420 425 430
Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser
435 440 445
Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly
450 455 460
Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr
465 470 475 480
Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly
485 490 495
Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr
500 505 510
Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly
515 520 525
Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met
530 535 540
Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr
545 550 555 560
Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser
565 570 575
Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu
580 585 590
Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr
595 600 605
Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe
610 615 620
Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr
625 630
<210> 28
<211> 542
<212> PRT
<213> 人
<400> 28
Met Asn Phe Ala Leu Ile Leu Met Ile Asn Thr Leu Leu Ala Leu Leu
1 5 10 15
Leu Met Ile Ile Thr Phe Trp Leu Pro Gln Leu Asn Gly Tyr Met Glu
20 25 30
Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp Pro Met Ser Pro Ala Arg
35 40 45
Val Pro Phe Ser Met Lys Phe Phe Leu Val Ala Ile Thr Phe Leu Leu
50 55 60
Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro Leu Pro Trp Ala Leu Gln
65 70 75 80
Thr Thr Asn Leu Pro Leu Met Val Met Ser Ser Leu Leu Leu Ile Ile
85 90 95
Ile Leu Ala Leu Ser Leu Ala Asn Thr Ala Ala Ile Gln Ala Ile Leu
100 105 110
Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu Ala Leu Ala Trp Phe
115 120 125
Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn
130 135 140
Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala
145 150 155 160
Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met
165 170 175
Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val
180 185 190
Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn
195 200 205
Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr
210 215 220
Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile
225 230 235 240
Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile
245 250 255
Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala
260 265 270
Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn
275 280 285
Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr
290 295 300
Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala
305 310 315 320
Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu
325 330 335
Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu
340 345 350
Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu
355 360 365
Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu
370 375 380
Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser
385 390 395 400
Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro
405 410 415
Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val
420 425 430
Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn
435 440 445
Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met
450 455 460
Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly
465 470 475 480
Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp
485 490 495
Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr
500 505 510
Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu
515 520 525
Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr
530 535 540
<210> 29
<211> 563
<212> PRT
<213> 人
<400> 29
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val
50 55 60
Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn
65 70 75 80
Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg
85 90 95
Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu
100 105 110
Leu Ala Ser Ala Met Val Glu Ala Arg Ala Asp Ala Asn Thr Ala Ala
115 120 125
Ile Gln Ala Ile Leu Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu
130 135 140
Ala Leu Ala Trp Phe Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln
145 150 155 160
Met Ala Leu Leu Asn Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu
165 170 175
Leu Leu Ala Ala Ala Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp
180 185 190
Leu Pro Ser Ala Met Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His
195 200 205
Ser Ser Thr Met Val Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His
210 215 220
Pro Leu Ala Glu Asn Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu
225 230 235 240
Gly Ala Ile Thr Thr Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn
245 250 255
Asp Ile Lys Lys Ile Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu
260 265 270
Met Met Val Thr Ile Gly Ile Asn Gln Pro His Leu Ala Phe Leu His
275 280 285
Ile Cys Thr His Ala Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly
290 295 300
Ser Ile Ile His Asn Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly
305 310 315 320
Gly Leu Leu Lys Thr Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly
325 330 335
Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys
340 345 350
Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala
355 360 365
Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr
370 375 380
Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu
385 390 395 400
Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg
405 410 415
Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile
420 425 430
Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu
435 440 445
Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu
450 455 460
Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe
465 470 475 480
Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr
485 490 495
Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu
500 505 510
Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln
515 520 525
His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile
530 535 540
Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu
545 550 555 560
Leu Ile Thr
<210> 30
<211> 136
<212> PRT
<213> 人
<400> 30
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Gln Ala Thr Tyr Ser Cys Thr
130 135
<210> 31
<211> 217
<212> PRT
<213> 人
<400> 31
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Leu Met Val Met Ser
180 185 190
Ser Leu Leu Leu Ile Ile Ile Leu Ala Leu Ser Leu Ala Tyr Glu Trp
195 200 205
Leu Gln Lys Gly Leu Asp Trp Thr Glu
210 215
<210> 32
<211> 484
<212> PRT
<213> 人
<400> 32
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu His Ala Asn Gly Ala Ser
180 185 190
Met Phe Phe Ile Cys Leu Phe Leu His Ile Gly Arg Gly Leu Tyr Tyr
195 200 205
Gly Ser Phe Leu Tyr Ser Glu Thr Trp Asn Ile Gly Ile Ile Leu Leu
210 215 220
Leu Ala Thr Met Ala Thr Ala Phe Met Gly Tyr Val Leu Pro Trp Gly
225 230 235 240
Gln Met Ser Phe Trp Gly Ala Thr Val Ile Thr Asn Leu Leu Ser Ala
245 250 255
Ile Pro Tyr Ile Gly Thr Asp Leu Val Gln Trp Ile Trp Gly Gly Tyr
260 265 270
Ser Val Asp Ser Pro Thr Leu Thr Arg Phe Phe Thr Phe His Phe Ile
275 280 285
Leu Pro Phe Ile Ile Ala Ala Leu Ala Thr Leu His Leu Leu Phe Leu
290 295 300
His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile Thr Ser His Ser Asp
305 310 315 320
Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys Asp Ala Leu Gly Leu
325 330 335
Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr Leu Phe Ser Pro Asp
340 345 350
Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr
355 360 365
Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile
370 375 380
Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu
385 390 395 400
Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met Ser Lys Gln
405 410 415
Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu
420 425 430
Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser
435 440 445
Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr
450 455 460
Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met
465 470 475 480
Leu Lys Trp Ala
<210> 33
<211> 568
<212> PRT
<213> 人
<400> 33
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val
50 55 60
Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn
65 70 75 80
Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg
85 90 95
Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu
100 105 110
Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val
115 120 125
Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Ser Val Asp
130 135 140
Leu Thr Ile Phe Ser Leu His Leu Ala Gly Val Ser Ser Ile Leu Gly
145 150 155 160
Ala Ile Asn Phe Ile Thr Thr Ile Ile Asn Met Lys Pro Pro Ala Met
165 170 175
Thr Gln Tyr Gln Thr Pro Leu Phe Val Trp Ser Val Leu Ile Thr Ala
180 185 190
Val Leu Leu Leu Leu Ser Leu Pro Val Leu Ala Ala Gly Ile Thr Met
195 200 205
Leu Leu Thr Asp Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly
210 215 220
Gly Gly Asp Pro Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His
225 230 235 240
Pro Glu Val Tyr Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His
245 250 255
Ile Val Thr Tyr Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly
260 265 270
Met Val Trp Ala Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp
275 280 285
Ala His His Met Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr
290 295 300
Phe Thr Ser Ala Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val
305 310 315 320
Phe Ser Trp Leu Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala
325 330 335
Ala Val Leu Trp Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly
340 345 350
Leu Thr Gly Ile Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His
355 360 365
Asp Thr Tyr Tyr Val Val Ala His Phe His Tyr Val Leu Ser Met Gly
370 375 380
Ala Val Phe Ala Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe
385 390 395 400
Ser Gly Tyr Thr Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile
405 410 415
Met Phe Ile Gly Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly
420 425 430
Leu Ser Gly Met Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr
435 440 445
Thr Trp Asn Ile Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe
450 455 460
Ala Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu
465 470 475 480
Ala Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His
485 490 495
Met Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu
500 505 510
Tyr Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly
515 520 525
Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val
530 535 540
Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile
545 550 555 560
Glu Asn Lys Met Leu Lys Trp Ala
565
<210> 34
<211> 191
<212> PRT
<213> 人
<400> 34
Met Pro Gln Leu Asn Thr Thr Val Trp Pro Thr Met Ile Thr Pro Met
1 5 10 15
Leu Leu Thr Leu Phe Leu Thr Thr His Ser Leu Ile Ile Ser Ile Ile
20 25 30
Pro Leu Leu Phe Phe Asn Gln Ile Asn Asn Asn Leu Phe Ser Cys Ser
35 40 45
Pro Thr Phe Ser Ser Asp Pro Leu Thr Thr Pro Leu Leu Met Leu Thr
50 55 60
Thr Trp Leu Leu Pro Leu Thr Ile Met Ala Ser Gln Arg His Leu Ser
65 70 75 80
Ser Glu Pro Leu Ser Arg Lys Lys Leu Tyr Leu Ser Met Leu Ile Ser
85 90 95
Leu Gln Ile Ser Leu Ile Met Thr Phe Thr Ala Thr Glu Leu Ile Met
100 105 110
Phe Tyr Ile Phe Phe Glu Thr Thr Leu Ile Pro Thr Leu Ala Ile Ile
115 120 125
Thr Arg Trp Gly Asn Gln Pro Glu Arg Leu Asn Ala Gly Thr Tyr Phe
130 135 140
Leu Phe Tyr Thr Leu Val Gly Ser Leu Pro Leu Leu Ile Ala Leu Ile
145 150 155 160
Tyr Thr His Asn Thr Leu Gly Ser Leu Asn Ile Leu Leu Leu Thr Leu
165 170 175
Thr Ala Gln Glu Leu Ser Asn Ser Trp Ala Asn Asn Leu Met Asp
180 185 190
<210> 35
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 正向引物
<400> 35
tctaccccct ctagagccca ctgt 24
<210> 36
<211> 25
<212> DNA
<213> 人工序列
<400> 36
ctaggctgcc aatggtgagg gaggt 25
<210> 37
<211> 30
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 37
tgcgactcct agccgcagac ctcctcattc 30
<210> 38
<211> 28
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 38
ggtacccaaa tctgcttccc catgaaag 28
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 39
tgcgactcct agccgcagac 20
<210> 40
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 40
cgccatcatc ctagtcctca tcgc 24
<210> 41
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 41
gaatgaggag gtctgcggct aggagtc 27
<210> 42
<211> 26
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 42
gtaagcctct acctacactc caactc 26
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 43
gcggatgagt aagaagattc ctg 23
<210> 44
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 44
ggagacctaa ttgggctgat ttg 23
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 45
ggccgtacgc ctaaccgcta 20
<210> 46
<211> 29
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 46
gttgtgggtc tcatgagttg gagtgtagg 29
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 47
ccctggccgt acgcctaacc 20
<210> 48
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 48
atttgttgtg ggtctcatga gttggagtgt agg 33
<210> 49
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 49
ccctaagtct ggccaacaca gcagc 25
<210> 50
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 50
gggtggagac ctaattgggc tg 22
<210> 51
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 51
acaacgttat cgtcacagcc catgc 25
<210> 52
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 52
gattgcttga atggctgctg tgttggc 27
<210> 53
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 53
cgtctgaact atcctgcccg c 21
<210> 54
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 54
caattaggtg catgagtagg tggcctg 27
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 55
aaggcacacc tacacccctt 20
<210> 56
<211> 28
<212> DNA
<213> 人工序列
<400> 56
gagggatgac ataactatta gtggcagg 28
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 57
aaccaatagc cctggccgta 20
<210> 58
<211> 31
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 58
gagggatgac ataactatta gtggcaggtt a 31
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<400> 59
ctatagcacc ccctctaccc c 21
<210> 60
<211> 27
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 60
gatgctaata attaggctgt gggtggt 27
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 61
acagtgaaat gccccaacta 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 62
gctcaggcgt ttgtgtatga 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 63
caacgatccc tcccttacca 20
<210> 64
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 64
agtacggatg ctacttgtcc a 21
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 65
gaagcgccac cctagcaata 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 66
ggtgaggctt ggattagcgt 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 67
aatccacccc ttacgagtgc 20
<210> 68
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 68
acaacgttat cgtcacagcc c 21
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 69
gtgaggcttg gattagcgtt 20
<210> 70
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 70
ctgaacctac gagtacaccg a 21
<210> 71
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 71
gtgtgaaaac gtaggcttgg a 21
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 72
tcgaaaccat cagcctactc a 21
<210> 73
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 引物
<400> 73
ccaattcggt tcagtctaat cct 23
<210> 74
<211> 773
<212> DNA
<213> 人
<400> 74
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactatca aactaacctc aaaacaaatg ataaccatac 180
acaacactaa aggacgaacc tgatctctta tactagtatc cttaatcatt tttattgcca 240
caactaacct cctcggactc ctgcctcact catttacacc aaccacccaa ctatctataa 300
acctagccat ggccatcccc ttatgagcgg gcacagtgat tataggcttt cgctctaaga 360
ttaaaaatgc cctagcccac ttcttaccac aaggcacacc tacacccctt atccccatac 420
tagttattat cgaaaccatc agcctactca ttcaaccaac agccctagac ctcaactacc 480
taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc aacatactcg 540
gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt acgagccaaa 600
acctgcccct actcctccta gacctaacct gactagaaaa gctattacct aaaacaattt 660
cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata attaaacttt 720
acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca taa 773
<210> 75
<211> 993
<212> DNA
<213> 人
<400> 75
attaatcccc tggcccaacc cgtcatctac tctaccatct ttgcaggcac actcatcaca 60
gcgctaagct cgcactgatt ttttacctga gtaggcctag aaataaacat gctagctttt 120
attccagttc taaccaaaaa aataaaccct cgttccacag aagctgccat caagtatttc 180
ctcacgcaag caaccgcatc cataatcctt ctaatagcta tcctcttcaa caatatactc 240
tccggacaat gaaccataac caatactacc aatcaatact catcattaat aatcataata 300
gctatagcaa taaaactagg aatagccccc tttcacttct gagtcccaga ggttacccaa 360
ggcacccctc tgacatccgg cctgcttctt ctcacatgac aaaaactagc ccccatctca 420
atcatatacc aaatctctcc ctcactaaac gtaagccttc tcctcactct ctcaatctta 480
tccatcatag caggcagttg aggtggatta aaccaaaccc agctacgcaa aatcttagca 540
tactcctcaa ttacccacat aggatgaata atagcagttc taccgtacaa ccctaacata 600
accattctta atttaactat ttatattatc ctaactacta ccgcattcct actactcaac 660
ttaaactcca gcaccacgac cctactacta tctcgcacct gaaacaagct aacatgacta 720
acacccttaa ttccatccac cctcctctcc ctaggaggcc tgcccccgct aaccggcttt 780
ttgcccaaat gggccattat cgaagaattc acaaaaaaca atagcctcat catccccacc 840
atcatagcca ccatcaccct ccttaacctc tacttctacc tacgcctaat ctactccacc 900
tccatcatca cctcaaccca aaaaggcata attaaacttt acttcctctc tttcttcttc 960
ccactcatcc taaccctact cctaatcaca taa 993
<210> 76
<211> 773
<212> RNA
<213> 人
<400> 76
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuauca aacuaaccuc aaaacaaaug auaaccauac 180
acaacacuaa aggacgaacc ugaucucuua uacuaguauc cuuaaucauu uuuauugcca 240
caacuaaccu ccucggacuc cugccucacu cauuuacacc aaccacccaa cuaucuauaa 300
accuagccau ggccaucccc uuaugagcgg gcacagugau uauaggcuuu cgcucuaaga 360
uuaaaaaugc ccuagcccac uucuuaccac aaggcacacc uacaccccuu auccccauac 420
uaguuauuau cgaaaccauc agccuacuca uucaaccaac agcccuagac cucaacuacc 480
uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc aacauacucg 540
gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu acgagccaaa 600
accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu aaaacaauuu 660
cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua auuaaacuuu 720
acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca uaa 773
<210> 77
<211> 993
<212> RNA
<213> 人
<400> 77
auuaaucccc uggcccaacc cgucaucuac ucuaccaucu uugcaggcac acucaucaca 60
gcgcuaagcu cgcacugauu uuuuaccuga guaggccuag aaauaaacau gcuagcuuuu 120
auuccaguuc uaaccaaaaa aauaaacccu cguuccacag aagcugccau caaguauuuc 180
cucacgcaag caaccgcauc cauaauccuu cuaauagcua uccucuucaa caauauacuc 240
uccggacaau gaaccauaac caauacuacc aaucaauacu caucauuaau aaucauaaua 300
gcuauagcaa uaaaacuagg aauagccccc uuucacuucu gagucccaga gguuacccaa 360
ggcaccccuc ugacauccgg ccugcuucuu cucacaugac aaaaacuagc ccccaucuca 420
aucauauacc aaaucucucc cucacuaaac guaagccuuc uccucacucu cucaaucuua 480
uccaucauag caggcaguug agguggauua aaccaaaccc agcuacgcaa aaucuuagca 540
uacuccucaa uuacccacau aggaugaaua auagcaguuc uaccguacaa cccuaacaua 600
accauucuua auuuaacuau uuauauuauc cuaacuacua ccgcauuccu acuacucaac 660
uuaaacucca gcaccacgac ccuacuacua ucucgcaccu gaaacaagcu aacaugacua 720
acacccuuaa uuccauccac ccuccucucc cuaggaggcc ugcccccgcu aaccggcuuu 780
uugcccaaau gggccauuau cgaagaauuc acaaaaaaca auagccucau cauccccacc 840
aucauagcca ccaucacccu ccuuaaccuc uacuucuacc uacgccuaau cuacuccacc 900
uccaucauca ccucaaccca aaaaggcaua auuaaacuuu acuuccucuc uuucuucuuc 960
ccacucaucc uaacccuacu ccuaaucaca uaa 993
<210> 78
<211> 222
<212> PRT
<213> 人
<400> 78
Met Ser His Gln Gln Pro Thr Asn His His Pro Thr Met Thr Ile Lys
1 5 10 15
Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys Gly Arg Thr
20 25 30
Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala Thr Thr Asn
35 40 45
Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr Gln Leu Ser
50 55 60
Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr Val Ile Met
65 70 75 80
Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe Leu Pro Gln
85 90 95
Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile Glu Thr Ile
100 105 110
Ser Leu Leu Ile Gln Pro Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn
115 120 125
Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met
130 135 140
Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly
145 150 155 160
Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp
165 170 175
Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr
180 185 190
Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu
195 200 205
Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr
210 215 220
<210> 79
<211> 296
<212> PRT
<213> 人
<400> 79
Met Asn Met Leu Ala Phe Ile Pro Val Leu Thr Lys Lys Met Asn Pro
1 5 10 15
Arg Ser Thr Glu Ala Ala Ile Lys Tyr Phe Leu Thr Gln Ala Thr Ala
20 25 30
Ser Met Ile Leu Leu Met Ala Ile Leu Phe Asn Asn Met Leu Ser Gly
35 40 45
Gln Trp Thr Met Thr Asn Thr Thr Asn Gln Tyr Ser Ser Leu Met Ile
50 55 60
Met Met Ala Met Ala Met Lys Leu Gly Met Ala Pro Phe His Phe Trp
65 70 75 80
Val Pro Glu Val Thr Gln Gly Thr Pro Leu Thr Ser Gly Leu Leu Leu
85 90 95
Leu Thr Trp Gln Lys Leu Ala Pro Ile Ser Ile Met Tyr Gln Ile Ser
100 105 110
Pro Ser Leu Asn Val Ser Leu Leu Leu Thr Leu Ser Ile Leu Ser Ile
115 120 125
Met Ala Gly Ser Trp Gly Gly Leu Asn Gln Thr Gln Leu Arg Lys Ile
130 135 140
Leu Ala Tyr Ser Ser Ile Thr His Met Gly Trp Met Met Ala Val Leu
145 150 155 160
Pro Tyr Asn Pro Asn Met Thr Ile Leu Asn Leu Thr Ile Tyr Ile Ile
165 170 175
Leu Thr Thr Thr Ala Phe Leu Leu Leu Asn Leu Asn Ser Ser Thr Thr
180 185 190
Thr Leu Leu Leu Ser Arg Thr Trp Asn Lys Leu Thr Trp Leu Thr Pro
195 200 205
Leu Ile Pro Ser Thr Leu Leu Ser Leu Gly Gly Leu Pro Pro Leu Thr
210 215 220
Gly Phe Leu Pro Lys Trp Ala Ile Ile Glu Glu Phe Thr Lys Asn Asn
225 230 235 240
Ser Leu Ile Ile Pro Thr Ile Met Ala Thr Ile Thr Leu Leu Asn Leu
245 250 255
Tyr Phe Tyr Leu Arg Leu Ile Tyr Ser Thr Ser Ile Ile Thr Ser Thr
260 265 270
Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu
275 280 285
Ile Leu Thr Leu Leu Leu Ile Thr
290 295
<210> 80
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 正向引物
<400> 80
tgccctagcc cacttcttac c 21
<210> 81
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 反向(连接)引物
<400> 81
tagttgaggt ctagggctgt tggtt 25
<210> 82
<211> 25
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 正向引物
<400> 82
gggccattat cgaagaattc acaaa 25
<210> 83
<211> 24
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<223> 反向(连接)引物
<400> 83
gaggtgatga tggaggtgga gtag 24
<210> 84
<211> 259
<212> PRT
<213> 人
<400> 84
Met Ala Phe Met Val Lys Met Pro Leu Tyr Gly Leu His Leu Trp Leu
1 5 10 15
Pro Lys Ala His Val Glu Ala Pro Ile Ala Gly Ser Met Val Leu Ala
20 25 30
Ala Val Leu Leu Lys Leu Gly Gly Tyr Gly Met Met Arg Leu Thr Leu
35 40 45
Ile Leu Asn Pro Leu Thr Lys His Met Ala Tyr Pro Phe Leu Val Leu
50 55 60
Ser Leu Trp Gly Met Ile Met Thr Ser Ser Ile Cys Leu Arg Gln Thr
65 70 75 80
Asp Leu Lys Ser Leu Ile Ala Tyr Ser Ser Ile Ser His Met Ala Leu
85 90 95
Val Val Thr Ala Ile Leu Ile Gln Thr Pro Trp Ser Phe Thr Gly Ala
100 105 110
Val Ile Leu Met Ile Ala His Gly Leu Thr Ser Ser Leu Leu Phe Cys
115 120 125
Leu Ala Asn Ser Asn Tyr Glu Arg Thr His Ser Arg Ile Met Ile Leu
130 135 140
Ser Gln Gly Leu Gln Thr Leu Leu Pro Leu Met Ala Phe Trp Trp Leu
145 150 155 160
Leu Ala Ser Leu Ala Asn Leu Ala Leu Pro Pro Thr Ile Asn Leu Leu
165 170 175
Gly Glu Leu Ser Val Leu Val Thr Thr Phe Ser Trp Ser Asn Ile Thr
180 185 190
Leu Leu Leu Thr Gly Leu Asn Met Leu Val Thr Ala Leu Tyr Ser Leu
195 200 205
Tyr Met Phe Thr Thr Thr Gln Trp Gly Ser Leu Thr His His Ile Asn
210 215 220
Asn Met Lys Pro Ser Phe Thr Arg Glu Asn Thr Leu Met Phe Met His
225 230 235 240
Leu Ser Pro Ile Leu Leu Leu Ser Leu Asn Pro Asp Ile Ile Thr Gly
245 250 255
Phe Ser Ser

Claims (54)

1.一种在来自哺乳动物受试者的生物样品中识别具有缺失的畸变的线粒体DNA即mtDNA分子的方法,其中,所述缺失包括SEQ ID NO:1的mtDNA核苷酸序列的核苷酸5362-14049、8469-13447、7992-15730、9191-12909、9188-12906、10367-12829、6260-12814、7973-9023、9086-10313、9079-14988、7260-15540、8431-10841或8984-13833之间的核苷酸序列,并且其中,一旦重新环化,所述mtDNA包括连接点。
2.一种在来自哺乳动物受试者的生物样品中识别具有缺失的畸变的线粒体DNA即mtDNA分子的方法,其中,一旦重新环化,所述mtDNA包括由第一核苷酸和第二核苷酸组成的连接点,并且其中,关于SEQ ID NO:1:
a)所述缺失包括核苷酸5377-14048,所述第一核苷酸在核苷酸5362-5377之间并且所述第二核苷酸在核苷酸14048-14063之间;
b)所述缺失包括核苷酸8483-13446,所述第一核苷酸在核苷酸8469-8483之间并且所述第二核苷酸在核苷酸13446-13460之间;
c)所述缺失包括核苷酸7993-15722,所述第一核苷酸在核苷酸7985-7993之间并且所述第二核苷酸在核苷酸15722-15730之间;
d)所述缺失包括核苷酸9196-12908,所述第一核苷酸在核苷酸9191-9196之间并且所述第二核苷酸在核苷酸12908-12912之间;
e)所述缺失包括核苷酸9196-12905,所述第一核苷酸在核苷酸9188-9196之间并且所述第二核苷酸在核苷酸12905-12913之间;
f)所述缺失包括核苷酸10368-12825,所述第一核苷酸在核苷酸10364-10368之间并且所述第二核苷酸在核苷酸12825-12829之间;
g)所述缺失包括核苷酸6261-12813,所述第一核苷酸在核苷酸6260-6271之间并且所述第二核苷酸在核苷酸12813-12824之间;
h)所述缺失包括核苷酸7984-9022,所述第一核苷酸在核苷酸7973-7984之间并且所述第二核苷酸在核苷酸9022-9033之间;
i)所述缺失包括核苷酸9087-10303,所述第一核苷酸在核苷酸9077-9087之间并且所述第二核苷酸在核苷酸10303-10313之间;
j)所述缺失包括核苷酸9086-14987,所述第一核苷酸在核苷酸9079-9086之间并且所述第二核苷酸在核苷酸14987-14904之间;
k)所述缺失包括核苷酸7261-15531,所述第一核苷酸在核苷酸7252-7261之间并且所述第二核苷酸在核苷酸15531-15540之间;
l)所述缺失包括核苷酸8440-10840,所述第一核苷酸在核苷酸8431-8440之间并且所述第二核苷酸在核苷酸10840-10849之间;或者,
m)所述缺失包括核苷酸8994-13832,所述第一核苷酸在核苷酸8984-8994之间并且所述第二核苷酸在核苷酸13832-13842之间。
3.根据权利要求2所述的方法,其中:
a)所述缺失包括核苷酸5377-14048,所述第一核苷酸在位置5362处并且所述第二核苷酸在位置14049处;
b)所述缺失包括核苷酸8483-13446,所述第一核苷酸在位置8469处并且所述第二核苷酸在位置13447处;
c)所述缺失包括核苷酸7993-15722,所述第一核苷酸在位置7992处并且所述第二核苷酸在位置15730处;
d)所述缺失包括核苷酸9196-12908,所述第一核苷酸在位置9191处并且所述第二核苷酸在位置12909处;
e)所述缺失包括核苷酸9196-12905,所述第一核苷酸在位置9188处并且所述第二核苷酸在位置12906处;
f)所述缺失包括核苷酸10368-12825,所述第一核苷酸在位置10367处并且所述第二核苷酸在位置12829处;
g)所述缺失包括核苷酸6261-12813,所述第一核苷酸在位置6260处并且所述第二核苷酸在位置12814处;
h)所述缺失包括核苷酸7984-9022,所述第一核苷酸在位置7973处并且所述第二核苷酸在位置9023处;
i)所述缺失包括核苷酸9087-10303,所述第一核苷酸在位置9086处并且所述第二核苷酸在位置10313处;
j)所述缺失包括核苷酸9086-14987,所述第一核苷酸在位置9079处并且所述第二核苷酸在位置14988处;
k)所述缺失包括核苷酸7261-15531,所述第一核苷酸在位置7260处并且所述第二核苷酸在位置15532处;
l)所述缺失包括核苷酸8440-10840,所述第一核苷酸在位置8431处并且所述第二核苷酸在位置10841处;或者,
m)所述缺失包括核苷酸8994-13832,所述第一核苷酸在位置8984处并且所述第二核苷酸在位置13833处。
4.一种在来自哺乳动物受试者的生物样品中识别畸变的线粒体DNA即mtDNA分子的方法,其中,所述mtDNA分子在其核酸序列中具有缺失,并且一旦重新环化,所述mtDNA在SEQID NO:1的mtDNA核苷酸序列的核苷酸5362:14049、8469:13447、7992:15730、9191:12909、9188:12906、10367:12829、6260:12814、7973:9023、9086:10313、9079:14988、7260:15540、8431:10841或8984:13833处具有连接点。
5.根据权利要求1至4中任一项所述的方法,其中,所述畸变的mtDNA包括在SEQ ID NO:75、SEQ ID NO:2至SEQ ID NO:12以及SEQ ID NO:74中任一个中列出的核苷酸序列。
6.根据权利要求1至5中任一项所述的方法,其中,所述识别包括将所述生物样品与核酸探针接触,所述核酸探针具有与包括所述连接点的所述畸变的mtDNA的核苷酸序列的一部分至少基本互补的核苷酸序列。
7.根据权利要求1至5中任一项所述的方法,其中,所述识别包括将所述生物样品与核酸引物对接触,其中,引物之一具有与包括所述连接点的所述畸变的mtDNA的核苷酸序列的一部分互补的核苷酸序列。
8.根据权利要求7所述的方法,其中,所述引物对中的一个引物具有选自SEQ ID NO:83、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60或SEQ ID NO:81的核苷酸序列。
9.根据权利要求1至5中任一项所述的方法,其中,所述识别包括将所述生物样品与核酸引物对接触,其中,引物中的每一个具有与所述畸变的mtDNA的邻近所述连接点的核苷酸序列互补的核苷酸序列。
10.权利要求9的方法,其中,所述引物对包括:SEQ ID NO:61和SEQ ID NO:62;SEQ IDNO:63和SEQ ID NO:64;SEQ ID NO:65和SEQ ID NO:66;SEQ ID NO:67和SEQ ID NO:66;SEQID NO:68和SEQ ID NO:69;SEQ ID NO:70和SEQ ID NO:71;或者SEQ ID NO:72和SEQ IDNO:73。
11.一种在来自哺乳动物受试者的生物样品中识别融合转录本的方法,所述融合转录本由具有缺失的畸变的线粒体DNA即mtDNA分子的至少一部分编码,其中,所述缺失包括SEQID NO:1的mtDNA核苷酸序列的核苷酸5362-14049、8469-13447、7992-15730、9191-12909、9188-12906、10367-12829、6260-12814、7973-9023、9086-10313、9079-14988、7260-15540、8431-10841或者8984-13833。
12.一种在来自哺乳动物受试者的生物样品中识别融合转录本的方法,所述融合转录本由畸变的线粒体DNA即mtDNA分子的至少一部分编码,所述mtDNA分子具有缺失,所述缺失导致在所述mtDNA重新环化后产生连接点,其中,所述连接点在SEQ ID NO:1的mtDNA核苷酸序列的核苷酸5362:14049、8469:13447、7992:15730、9191:12909、9188:12906、10367:12829、6260:12814、7973:9023、9086:10313、9079:14988、7260:15540、8431:10841或8984:13833之间。
13.一种在来自哺乳动物受试者的生物样品中识别根据权利要求1至5中任一项所限定的畸变的线粒体DNA即mtDNA分子的至少一部分编码的融合转录本的方法。
14.根据权利要求13所述的方法,其中,所述方法包括使所述生物样品与核酸探针接触,所述核酸探针的核酸序列与具有转录连接点的所述融合转录本的核苷酸序列互补。
15.根据权利要求11至14中任一项所述的方法,其中,所述融合转录本包括在SEQ IDNO:77、SEQ ID NO:13至SEQ ID NO:23以及SEQ ID NO:76中任一个中列出的核苷酸序列。
16.根据权利要求11至15中任一项所述的方法,其中,所述融合转录本的识别的步骤包括识别所述融合转录本的翻译产物。
17.根据权利要求16所述的方法,其中,所述翻译产物具有在SEQ ID NO:79、SEQ IDNO:24至SEQ ID NO:34、SEQ ID NO:84以及SEQ ID NO:78中任一个中列出的氨基酸序列。
18.一种在来自哺乳动物受试者的生物样品中识别融合蛋白的方法,所述融合蛋白包括在SEQ ID NO:79、SEQ ID NO:24至SEQ ID NO:34、SEQ ID NO:84以及SEQ ID NO:78中任一个中列出的氨基酸序列。
19.根据权利要求16至18中任一项所述的方法,其中,所述蛋白的识别包括免疫学测定。
20.根据权利要求19所述的方法,其中,所述识别包括对所述蛋白具有特异性的抗体。
21.根据权利要求1至10中任一项所述的方法,其中,识别的步骤包括识别由所述畸变的mtDNA编码的融合蛋白。
22.根据权利要求1至21中任一项所述的方法,其中,识别的步骤还包括检测、诊断和/或监测所述哺乳动物受试者中的子宫内膜异位症。
23.根据权利要求1至22中任一项所述的方法,还包括对所述生物样品中所述畸变的mtDNA的量进行定量。
24.根据权利要求23所述的方法,还包括将定量的畸变mtDNA的量与指示所述受试者中子宫内膜异位症的存在或子宫内膜异位症的发展的参考值进行比较。
25.根据权利要求24所述的方法,其中,在比较的步骤之前,将定量的畸变mtDNA的量相对于核DNA序列标准化。
26.根据权利要求25所述的方法,其中,所述核DNA序列编码rRNA。
27.根据权利要求25所述的方法,其中,所述rRNA是18S rRNA。
28.根据权利要求1至27中任一项所述的方法,其中,所述受试者是被怀疑患有子宫内膜异位症的亚群的成员或者未被怀疑患有子宫内膜异位症的亚群的成员。
29.根据权利要求1至28中任一项所述的方法,其中,所述生物样品是血液、血液衍生物、组织、和月经液体中的一种或多种。
30.权利要求29所述的方法,其中,所述血液衍生物是血浆和/或血清。
31.一种在来自哺乳动物受试者的生物样品中识别有缺失的线粒体DNA即mtDNA分子的方法,其中,所述缺失包括SEQ ID NO:1的mtDNA核苷酸序列的核苷酸5362-14049、8469-13447、7992-15730、9191-12909、9188-12906、10367-12829、6260-12814、7973-9023、9086-10313、9079-14988、7260-15540、8431-10841或8984-13833。
32.根据权利要求31所述的方法,其中,识别的步骤还包括检测、诊断和/或监测所述哺乳动物受试者中的子宫内膜异位症。
33.根据权利要求31或32所述的方法,还包括对所述生物样品中所述有缺失的mtDNA的量进行定量。
34.根据权利要求33所述的方法,还包括将被定量的所述缺失的mtDNA的量与指示所述受试者中子宫内膜异位症的存在或子宫内膜异位症的发展的参考值进行比较。
35.根据权利要求31至34中任一项所述的方法,其中,所述生物样品是血液、血液衍生物、组织和月经液体中的一种或多种。
36.根据权利要求1至35中任一项所述的方法,其中,所述方法在体外进行。
37.一种用于进行根据权利要求1至36中任一项所述的方法的试剂盒。
38.根据权利要求37所述的试剂盒,其中,所述试剂盒包括核酸引物对,其中,引物之一具有与包括所述连接点的所述畸变的mtDNA的核苷酸序列的一部分互补的核苷酸序列。
39.根据权利要求38所述的试剂盒,其中,所述引物对中的一个引物具有选自SEQ IDNO:83、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60或SEQ ID NO:81的核苷酸序列。
40.根据权利要求37的试剂盒,其中,所述试剂盒包括核酸引物对,其中,引物中的每一个具有与所述畸变的mtDNA的邻近所述连接点的核苷酸序列互补的核苷酸序列。
41.根据权利要求40所述的试剂盒,其中,所述引物对包括:SEQ ID NO:61和SEQ IDNO:62;SEQ ID NO:63和SEQ ID NO:64;SEQ ID NO:65和SEQ ID NO:66;SEQ ID NO:67和SEQID NO:66;SEQ ID NO:68和SEQ ID NO:69;SEQ ID NO:70和SEQ ID NO:71;或者SEQ ID NO:72和SEQ ID NO:73。
42.根据权利要求37所述的试剂盒,其中,所述试剂盒包括与所述畸变的mtDNA分子的一种或多种融合转录本互补的引物和/或探针。
43.根据权利要求37所述的试剂盒,其中,所述试剂盒包括适于结合由所述畸变的mtDNA分子编码的蛋白质的结合剂。
44.一种用于体外识别生物样品中畸变的线粒体DNA即mtDNA分子的试剂盒,其中,所述mtDNA具有在SEQ ID NO:1的mtDNA核苷酸序列的5362-14049、8469-13447、7992-15730、9191-12909、9188-12906、10367-12829、6260-12814、7973-9023、9086-10313、9079-14988、7260-15540、8431-10841或8984-13833之间的核苷酸序列的缺失,并且其中,一旦重新环化,所述mtDNA包括连接点。
45.一种用于体外识别生物样品中畸变的线粒体DNA即mtDNA分子的试剂盒,其中,所述mtDNA分子具有缺失,并且其中,一旦重新环化,所述mtDNA包括由第一核苷酸和第二核苷酸组成的连接点,并且其中,关于SEQ ID NO:1:
a)所述缺失包括核苷酸5377-14048,所述第一核苷酸在核苷酸5362-5377之间并且所述第二核苷酸在核苷酸14048-14063之间;
b)所述缺失包括核苷酸8483-13446,所述第一核苷酸在核苷酸8469-8483之间并且所述第二核苷酸在核苷酸13446-13460之间;
c)所述缺失包括核苷酸7993-15722,所述第一核苷酸在核苷酸7985-7993之间并且所述第二核苷酸在核苷酸15722-15730之间;
d)所述缺失包括核苷酸9196-12908,所述第一核苷酸在核苷酸9191-9196之间并且所述第二核苷酸在核苷酸12908-12912之间;
e)所述缺失包括核苷酸9196-12905,所述第一核苷酸在核苷酸9188-9196之间并且所述第二核苷酸在核苷酸12905-12913之间;
f)所述缺失包括核苷酸10368-12825,所述第一核苷酸在核苷酸10364-10368之间并且所述第二核苷酸在核苷酸12825-12829之间;
g)所述缺失包括核苷酸6261-12813,所述第一核苷酸在核苷酸6260-6271之间并且所述第二核苷酸在核苷酸12813-12824之间;
h)所述缺失包括核苷酸7984-9022,所述第一核苷酸在核苷酸7973-7984之间并且所述第二核苷酸在核苷酸9022-9033之间;
i)所述缺失包括核苷酸9087-10303,所述第一核苷酸在核苷酸9077-9087之间并且所述第二核苷酸在核苷酸10303-10313之间;
j)所述缺失包括核苷酸9086-14987,所述第一核苷酸在核苷酸9079-9086之间并且所述第二核苷酸在核苷酸14987-14904之间;
k)所述缺失包括核苷酸7261-15531,所述第一核苷酸在核苷酸7252-7261之间并且所述第二核苷酸在核苷酸15531-15540之间;
l)所述缺失包括核苷酸8440-10840,所述第一核苷酸在核苷酸8431-8440之间并且所述第二核苷酸在核苷酸10840-10849之间;或者,
m)所述缺失包括核苷酸8994-13832,所述第一核苷酸在核苷酸8984-8994之间并且所述第二核苷酸在核苷酸13832-13842之间。
46.根据权利要求45所述的试剂盒,其中:
a)所述缺失包括核苷酸5377-14048,所述第一核苷酸在位置5362处并且所述第二核苷酸在位置14049处;
b)所述缺失包括核苷酸8483-13446,所述第一核苷酸在位置8469处并且所述第二核苷酸在位置13447处;
c)所述缺失包括核苷酸7993-15722,所述第一核苷酸在位置7992处并且所述第二核苷酸在位置15730处;
d)所述缺失包括核苷酸9196-12908,所述第一核苷酸在位置9191处并且所述第二核苷酸在位置12909处;
e)所述缺失包括核苷酸9196-12905,所述第一核苷酸在位置9188处并且所述第二核苷酸在位置12906处;
f)所述缺失包括核苷酸10368-12825,所述第一核苷酸在位置10367处并且所述第二核苷酸在位置12829处;
g)所述缺失包括核苷酸6261-12813,所述第一核苷酸在位置6260处并且所述第二核苷酸在位置12814处;
h)所述缺失包括核苷酸7984-9022,所述第一核苷酸在位置7973处并且所述第二核苷酸在位置9023处;
i)所述缺失包括核苷酸9087-10303,所述第一核苷酸在位置9086处并且所述第二核苷酸在位置10313处;
j)所述缺失包括核苷酸9086-14987,所述第一核苷酸在位置9079处并且所述第二核苷酸在位置14988处;
k)所述缺失包括核苷酸7261-15531,所述第一核苷酸在位置7260处并且所述第二核苷酸在位置15532处;
l)所述缺失包括核苷酸8440-10840,所述第一核苷酸在位置8431处并且所述第二核苷酸在位置10841处;或者,
m)所述缺失包括核苷酸8994-13832,所述第一核苷酸在位置8984处并且所述第二核苷酸在位置13833处。
47.一种用于体外识别生物样品中畸变的线粒体DNA即mtDNA分子的试剂盒,其中,所述mtDNA具有缺失,并且一旦重新环化,所述mtDNA包括SEQ ID NO:1的mtDNA核苷酸序列的核苷酸5362:14049、8469:13447、7992:15730、9191:12909、9188:12906、10367:12829、6260:12814、7973:9023、9086:10313、9079:14988、7260:15540、8431:10841、或8984:13833之间的连接点。
48.根据权利要求44至47中任一项所述的试剂盒,其中,所述试剂盒包括核酸引物对,其中,引物之一具有与所述畸变的mtDNA的包括所述连接点的核苷酸序列的一部分互补的核苷酸序列。
49.根据权利要求48所述的试剂盒,其中,该引物对中的一个引物具有核苷酸序列SEQID NO:83、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:42、SEQID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:54、SEQ ID NO:56、SEQID NO:58、SEQ ID NO:60或SEQ ID NO:81。
50.根据权利要求44至47中任一项所述的试剂盒,其中,所述试剂盒包括核酸引物对,其中,引物中的每一个具有与所述畸变的mtDNA的邻近所述连接点的核苷酸序列互补的核苷酸序列。
51.根据权利要求50所述的试剂盒,其中,所述引物对包括:SEQ ID NO:61和SEQ IDNO:62;SEQ ID NO:63和SEQ ID NO:64;SEQ ID NO:65和SEQ ID NO:66;SEQ ID NO:67和SEQID NO:66;SEQ ID NO:68和SEQ ID NO:69;SEQ ID NO:70和SEQ ID NO:71;或者SEQ ID NO:72和SEQ ID NO:73。
52.根据权利要求44至47中任一项所述的试剂盒,其中,所述试剂盒包括与所述畸变的mtDNA分子的一种或多种融合转录本互补的引物和/或探针。
53.根据权利要求44至47中任一项所述的试剂盒,其中,所述试剂盒包括适于结合由所述畸变的mtDNA分子编码的蛋白质的结合剂。
54.根据权利要求54所述的试剂盒,其中,所述结合剂包括抗体或抗体片段。
CN201980085361.1A 2018-12-22 2019-12-20 与子宫内膜异位症相关的线粒体dna缺失 Pending CN113227400A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862784403P 2018-12-22 2018-12-22
US62/784,403 2018-12-22
US201962931173P 2019-11-05 2019-11-05
US62/931,173 2019-11-05
PCT/US2019/068098 WO2020132596A2 (en) 2018-12-22 2019-12-20 Mitochondrial dna deletions associated with endometriosis

Publications (1)

Publication Number Publication Date
CN113227400A true CN113227400A (zh) 2021-08-06

Family

ID=69185737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980085361.1A Pending CN113227400A (zh) 2018-12-22 2019-12-20 与子宫内膜异位症相关的线粒体dna缺失

Country Status (9)

Country Link
US (1) US20220251655A1 (zh)
EP (1) EP3899050A2 (zh)
JP (1) JP2022514924A (zh)
KR (1) KR20210107719A (zh)
CN (1) CN113227400A (zh)
AU (1) AU2019401465A1 (zh)
CA (1) CA3124497A1 (zh)
SG (1) SG11202106711YA (zh)
WO (1) WO2020132596A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116200485A (zh) * 2022-11-01 2023-06-02 广东省生殖科学研究所(广东省生殖医院) 一种甲基化位点在子宫内膜异位症诊断和分型中的应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200270B (zh) * 2020-11-17 2022-12-20 金弗康生物科技(上海)股份有限公司 一种用于纠正高通量组学数据缺失的数据分区填充方法
GB202114374D0 (en) * 2021-10-07 2021-11-24 Univ Edinburgh Endometriosis biomarker
GB202204595D0 (en) * 2022-03-30 2022-05-11 Univ Newcastle Methods dor determining mitochondrial DNA damage

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7871778B2 (en) * 2007-04-25 2011-01-18 The Regents Of The University Of California Methods of diagnosing endometriosis

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116200485A (zh) * 2022-11-01 2023-06-02 广东省生殖科学研究所(广东省生殖医院) 一种甲基化位点在子宫内膜异位症诊断和分型中的应用
CN116200485B (zh) * 2022-11-01 2023-12-15 广东省生殖科学研究所(广东省生殖医院) 一种甲基化位点在子宫内膜异位症诊断和分型中的应用

Also Published As

Publication number Publication date
SG11202106711YA (en) 2021-07-29
WO2020132596A3 (en) 2020-07-23
KR20210107719A (ko) 2021-09-01
CA3124497A1 (en) 2020-06-25
JP2022514924A (ja) 2022-02-16
AU2019401465A1 (en) 2021-07-22
US20220251655A1 (en) 2022-08-11
EP3899050A2 (en) 2021-10-27
WO2020132596A2 (en) 2020-06-25

Similar Documents

Publication Publication Date Title
DK2456889T3 (en) Markers of endometrial cancer
JP7000658B2 (ja) 肝臓病変を評価する方法
CN113227400A (zh) 与子宫内膜异位症相关的线粒体dna缺失
KR102264761B1 (ko) 간질 폐렴의 위험을 예측하는 방법
JP2009529878A (ja) 原発細胞の増殖
WO2020249962A1 (en) Methods of detecting and predicting breast cancer
US20210285057A1 (en) Method for estimating breast cancer cell existence ratio
EP2912468B1 (en) Papanicolaou test for ovarian and endometrial cancers
US20240141435A1 (en) Methods for detecting and predicting cancer
WO2018211404A1 (en) Composite epigenetic biomarkers for accurate screening, diagnosis and prognosis of colorectal cancer
CN109642257B (zh) 药物疗法对癌的效果的预测方法
US20150111769A1 (en) Method for assessing endometrial cancer susceptibility
US20120289416A1 (en) Methods and kits used in assessing cancer risk
KR101879498B1 (ko) 바이오마커를 포함하는 임신 중 고혈압성 장애 진단용 조성물
WO2010106788A1 (ja) 妊孕性検査方法、妊孕性検査キット、ポリヌクレオチド、ポリペプチド、及び抗体
CN117248004A (zh) Runx2多肽突变体在制备评估颅锁骨发育不良患者的试剂盒中的应用
WO2014006952A1 (ja) 慢性閉塞性肺疾患の増悪指標の検出方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination