CN111386352A - 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法 - Google Patents

利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法 Download PDF

Info

Publication number
CN111386352A
CN111386352A CN201880075735.7A CN201880075735A CN111386352A CN 111386352 A CN111386352 A CN 111386352A CN 201880075735 A CN201880075735 A CN 201880075735A CN 111386352 A CN111386352 A CN 111386352A
Authority
CN
China
Prior art keywords
chromosome
sequence
liver cancer
cpg sites
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880075735.7A
Other languages
English (en)
Other versions
CN111386352B (zh
Inventor
金永峻
金多元
崔元荣
李柾雨
郑敏赫
河静实
金智元
李娟受
黄贞娥
金泰裕
林裕周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lepido Co ltd
Original Assignee
Lepido Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lepido Co ltd filed Critical Lepido Co ltd
Priority claimed from PCT/KR2018/014207 external-priority patent/WO2019103421A2/ko
Publication of CN111386352A publication Critical patent/CN111386352A/zh
Application granted granted Critical
Publication of CN111386352B publication Critical patent/CN111386352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种利用混合正常组织的临床检测体评估肝癌的预后或风险的方法,其中通过测量正常及血液组织中显示低的甲基化状况,但在癌组织中显示高的甲基化状况的一个以上的CpG部位的甲基化状况。

Description

利用基因的CPG甲基化变化评估肝癌的预后或者风险的方法
技术领域
本发明涉及测量特定基因CpG部位的甲基化程度,从而评估有关肝癌风险的方法。
背景技术
癌症是一种由于细胞周期不受控制而无法控制细胞分裂的疾病,它会在浸润周围组织并迅速生长,且扩散或者转移到身体的每个部位,并威胁生命。
在肝中发生的癌症称为肝癌,且肝癌是全世界范围内发病率高的癌症之一。在韩国,肝癌的死亡率以每10万人中有23人是属于非常高的,并且在韩国人中,总死亡率的约10%与肝炎、肝硬化和肝癌有关。
肝癌可被分类为其他组织的癌转移到肝的转移性肝癌和从干细胞自身发生癌症的原发性肝癌(HCC;hepatocellular carcinoma),但是,原发性肝癌占肝癌的90%,因此,大部分的肝癌是指原发性肝癌(HCC)。
诊断肝癌的方法具有超声检查(ultrasound)、计算机断层成像(CT)、磁共振成像(MRI)和肝血管造影(Angiography)等成像诊断方法。超声检查根据肝癌的大小对灵敏度的影响很大,并且被利用为观察肝癌发生的主要成像检查方法。
对于5cm以上的大的肝癌组织的情况,呈现75%以上的灵敏度,然而,对于小于1cm的小的肝癌的情况,呈现约42%的灵敏度(Gomaa et al.,World J Gastro.,15:1301,2009)。
计算机断层成像(CT)作为灵敏度最高的检查,对于2cm以上的肝癌几乎100%、对于1-2cm为93%、对于1cm以下的肝癌为60%的灵敏度可进行诊断(Gomaa et al.,World JGastro.,15:1301,2009)。
然而,这种检查是费用相对昂贵,因此,在普通公众中用作常规筛选检查时成为负担的检查方法。
在肝癌的情况下,诊断时的肿瘤大小是预后的,并且为了提高患者的存活率,要尽早发现肝癌。因此,迫切需要开发能够以高灵敏度早期可发现肝癌的诊断技术。
一方面,表观遗传学(epigenetics)是研究在DNA的碱基序列未改变的状态下产生的基因表达调节的领域。表观遗传学通过诸如DNA甲基化、miRNA或者组蛋白的乙酰化、甲基化、磷酸化及泛素化等的表观遗传变异研究基因表达调节。
双重DNA甲基化是研究最多的表观遗传变异。表观遗传变异可导致遗传功能变异及向肿瘤细胞的改变。因此,DNA甲基化与细胞内疾病调节基因的表达(或者抑制和诱导)有关,并且最近提出了通过测量DNA甲基化来诊断癌症的方法。
DNA甲基化主要发生在特定基因的启动子部位的CpG(CpG岛)的胞嘧啶(cytosine)中,由此转录因子的结合受到阻止,从而阻断特定基因的表达(gene silencing),并且在编码序列(coding sequence)没有突变,也能丧失其基因功能的主要机制。
除了基因的启动子区域外,已知如增强子(enhancer)和调节部位的非翻译区域的DNA甲基化也与染色体的结构变异、组蛋白修饰(modification)一起作用,成为引起多种疾病的机制。在包括癌的多种疾病中,报告了在CpG岛的这种非正常的甲基化/去甲基化,并且正在积极研究调查疾病相关基因启动子的甲基化,并用于诊断各种疾病的尝试。
本发明人已经选择了与肝癌的发病有关的基因的甲基化部位,并通过验证实验来提供诊断肝癌的危险性或者预后的方法。
在整个说明书中,引用了多个论文和专利文件,并指出了其引用。被引用的论文和专利文件的公开内容作为全部被插入到本说明书进行参考,并且更清楚地描述了本发明所属的技术领域的水平和本发明的内容。
发明内容
发明所要解决的问题
本发明为了解决上述的现有技术的问题,其目的在于提供诊断肝癌的危险性或者预后的方法,从而为了早期发现肝癌的危险性,利用在正常组织或者血液中呈现低的甲基化,而在肝癌组织中就呈现高甲基化状况的特性,测量检测体的甲基化状况。
用于解决问题的方案
根据本发明的一个方面,提供一种评估肝癌的预后或者风险的方法,其步骤包括:(a)从受试者(subject)的生物样品中提供DNA的步骤;及(b)从所述分离的DNA中测量由从2号染色体的25438725至25439276序列、12号染色体的95941906至95942979序列、10号染色体的134597357至134602649序列、8号染色体的144649774至144651774序列、1号染色体的47998899至47999517序列、2号染色体的26394102至26396102序列、8号染色体的104510870至104513913序列、8号染色体的98289604至98290404序列、2号染色体的63281034至63281347序列、8号染色体的67873388至67875600序列、4号染色体的76555366至76556079序列、1号染色体的63782394至63790471序列、5号染色体的7849945至7850439序列、2号染色体的39186777至39187968序列以及14号染色体的74207665至74208665序列形成的群中选择的CpG部位的甲基化状况。
在一个实施例中,所述方法可以测量两个以上的CpG部位的甲基化状况。
在一个实施例中,所述2号染色体的25438725至25439276序列具有序列编号1的碱基序列,所述12号染色体的95941906至95942979序列具有序列编号2的碱基序列,所述10号染色体的134597357至134602649序列具有序列编号3的碱基序列,所述8号染色体的144649774至144651774序列具有序列编号4的碱基序列,所述1号染色体的47998899至47999517序列具有序列编号5的碱基序列,所述2号染色体的26394102至26396102序列具有序列编号6的碱基序列,所述8号染色体的104510870至104513913序列具有序列编号7的碱基序列,所述8号染色体的98289604至98290404序列具有序列编号8的碱基序列,所述2号染色体的63281034至63281347序列具有序列编号9的碱基序列,所述8号染色体的67873388至67875600序列具有序列编号10的碱基序列,所述4号染色体的76555366至76556079序列具有序列编号11的碱基序列,所述1号染色体的63782394至63790471序列具有序列编号12的碱基序列,所述5号染色体的7849945至7850439序列具有序列编号13的碱基序列,所述2号染色体的39186777至39187968序列具有序列编号14的碱基序列,所述14号染色体的74207665至74208665序列具有序列编号15的碱基序列。
在一个实施例中,所述2号染色体25438725至25439276序列的CpG部位位于2号染色体的25439110,所述12号染色体的95941906至95942979序列的CpG部位位于12号染色体的95941988,所述10号染色体的134597357至134602649序列的CpG部位位于10号染色体的134599823,所述8号染色体144649774至144651774序列的CpG部位位于8号染色体的144651002,所述1号染色体的47998899至47999517序列的CpG部位位于1号染色体的47999163,所述2号染色体的26394102至26396102序列的CpG部位位于2号染色体的26395458,所述8号染色体104510870至104513913的CpG部位位于8号染色体的104512877,所述8号染色体98289604至98290404序列的CpG部位位于8号染色体的98290148,所述2号染色体的63281034至63281347的CpG部位位于2号染色体的63281139,所述8号染色体67873388至67875600的CpG部位位于8号染色体的67874178,所述4号染色体76555366至76556079序列的CpG部位位于4号染色体的76555832,所述1号染色体63782394至63790471的CpG部位位于1号染色体63789278,所述5号染色体7849945至7850439序列的CpG部位位于5号染色体的7850070,所述2号染色体的39186777至39187968序列的CpG部位位于2号染色体的39187533,所述14号染色体的74207665至74208665序列的CpG部位位于14号染色体的74208165的CpG部位。
在一个实施例中,所述生物样品是由从可疑肝癌患者或者诊断对象由来的组织、细胞、血液、血浆、粪便及尿液形成的群中选择的一种。
在一个实施例中,所述(b)步骤是由从PCR、甲基化特异性PCR、实时甲基化特异性PCR、荧光法PCR(MethyLight PCR)、荧光法数字PCR(MehtyLight digital PCR)、EpiTYPER、利用甲基化DNA特异性结合蛋白质的PCR、DNA芯片、焦磷酸测序及亚硫酸氢盐测序形成的群中选择的一种方法被执行。
在一个实施例中,所述方法还包括:(c)在所述(b)步骤之后,将所述甲基化状况与正常对照群的甲基化状况进行比较。
根据本发明的另一个方面,提供一种肝癌发病风险诊断用试剂盒,其中,所述肝癌发病风险诊断用试剂盒包括探针,所述探针结合在由从2号染色体25438725-25439276序列、12号染色体95941906-95942979序列、10号染色体134597357-134602649序列、8号染色体144649774-144651774序列、1号染色体47998899-47999517序列、2号染色体26394102至26396102序列、8号染色体104510870至104513913序列、8号染色体98289604至98290404序列、2号染色体63281034至63281347序列、8号染色体67873388至67875600序列、4号染色体76555366至76556079序列、1号染色体63782394至63790471序列、5号染色体7849945至7850439序列、2号染色体39186777至39187968序列以及14号染色体74207665至74208665序列形成的群中选择的CpG部位。
在一个实施例中,所述的肝癌发病风险诊断用试剂盒包括结合在所述CpG部位的两个以上的探针。
发明效果
根据本发明的一个方面,不仅测量癌与正常组织,而且测量包括血液的大部分的正常细胞和呈现其他甲基化状况的特定CpG部位的甲基化,从而利用混合有正常组织的临床检测体,可有效地预测肝癌的发病可能性。
本发明的效果不限定于上述的效果,应该理解为包括记载于本发明的详细的说明或者权利要求范围的从发明的构成可推论的所有效果。
附图说明
图1是本发明的肝癌诊断标志物选择管线的示意图。
图2是示出根据本发明的一个实施例的在DNA甲基化数据归一化之前(左)和之后(右)的肝癌患者分布的图表。
图3是示出根据本发明的一个实施例的在肝癌患者中成过甲基化,在正常人中成低甲基化的DMPs(Differentially methylated probes,不同甲基化探针)的热图。
图4是示出通过热图(热图)选择的探针的肝癌样品、肝正常样品、在血液样品中的甲基化程度的热图。越是红色表示过甲基化。
图5是示出根据本发明的一个实施例的通过机器学习选择诊断标记的结果。
图6是示出在肝癌样品、肝正常样品、血液样品确认通过机器学习选择的根据本发明的一个实施例的诊断标志物的甲基化程度的热图。
图7是示出根据本发明的一个实施例评估单个探针的肝癌诊断效率的结果。每个探针的肝癌诊断效率由AUC表示。
图8是示出从公共数据库(Public DB)的TCGA(The Cancer Genome Atlas,癌症基因组图谱)的肝癌数据,评估根据本发明的一个实施例的单个探针的肝癌诊断效率的结果。每个探针的肝癌诊断效率由AUC表示。
图9是示出根据本发明的一个实施例的根据探针(15种)的组合来确认诊断效率的结果。
图10是示出通过焦磷酸测序显示根据本发明的一个实施例选择的探针的甲基化程度。X轴代表196名独立群体的肝癌和相应于此的肝的正常样本,Y轴代表探针(黄色框)和探针附近的CpG部位。
图11是示出通过EpiTYPER实验显示根据本发明的一个实施例选择的探针的甲基化程度的热图。X轴代表184名独立群体的肝癌和相应于此的肝的正常样本,Y轴代表探针(黄色框)和探针附近的CpG部位。
具体实施方式
在下文中,将参照附图描述本发明。但是,本发明可以以各种不同的形式来实现,因此不限于在此描述的实施例。
某些部件“包括”某些构成要素时,除另有说明外,意味着还可以具备其他组件而不是排除其他构成要素。
除另有定义,可以通过在本领域技术人员的范围内重组DNA领域中常用的常规技术来进行分子生物学、微生物学、蛋白质纯化、蛋白质工程及DNA序列分析。这些技术是本领域技术人员已知的,并且在许多标准化的教科书和参考文献中进行了描述。
除本说明书另外定义,所使用的所有技术和科学术语具有与本领域普通技术人员通常理解的含义。
包括本说明书所包括的术语的各种科学词典是本领域众所周知的并且是可获得的。尽管发现与本说明书描述类似或者等价的任意方法及物质用于本说明书的实践或者测试中,但是描述了几种方法和材料。根据本领域技术人员所使用的上下文可多样的进行使用,因此,本发明不限于特定的方法学、协议和试剂。
如本说明书所使用,文章未被明确指示的情况下,单数形式包括多个对象。此外,除另有说明,核酸分别以从左至右和5'至3'的方向书写,氨基酸序列以从左至右和氨基至羧基的方向书写。在下文中,将更详细地描述本发明。
根据本发明的一个方面,提供一种评估肝癌的预后或者风险的方法,其步骤包括测量一种以上的CpG部位的甲基化状况。
所述受试者(subject)作为诊断对象可以是人,所述生物样品是从用于评估与肝癌相关疾病的所述受试者中分离的样品,包括组织、细胞、血液、血浆、腹膜液、滑液、唾液、尿液、粪便等,但不限定于此。优选地,所述生物样品可以是血液,具体地可以是从血液分离的血浆。
此外,单独分析所述CpG部位的甲基化状况,以诊断肝癌的预后或者危险性与否,但是,优选地同时分析两种以上、三种以上或者四种以上的CpG部位,从而可提高诊断的准确性。
所述诊断作为确定对于特定疾病或者疾患的受试者的感受性(susceptibility),优选包括确定受试者当前是否患有肝癌、确定患有肝癌的受试者的预后(prognosis)或者治疗指标(therametrics)。
所述“甲基化”是指在构成DNA的核苷酸粘贴甲基。优选地,甲基化与否是指在特定基因的特定CpG部位的胞嘧啶中是否发生甲基化。
所述“甲基化状态”是指DNA碱基序列中存在或者不存在一个以上的CpG二核苷酸的5-甲基-胞嘧啶。所述“甲基化状况”是指例如在所有基因组区域和某些非基因组区域中存在于靶DNA甲基化基因的DNA碱基序列中的甲基化的量。
所述甲基化状况可由从PCR、甲基化特异性PCR(methylation specific PCR)、实时甲基化特异性PCR(real time methylation specific PCR)、MethyLight PCR、MehtyLight digital PCR、EpiTYPER、利用甲基化DNA特异性结合蛋白的PCR、定量PCR、DNA芯片、焦磷酸测序及亚硫酸氢盐测序形成的群中选择的一种方法被执行,但不限定于此。
所述甲基化程度可由微阵列鉴定。所述微阵列可以利用固定在固相表面上的探针。所述探针可以包括包含所述SNP的各个基因上的10至100个连续核苷酸序列的互补的序列。
所述CpG部位是指存在于所述基因的DNA上的CpG部位。所述基因的DNA是包括所有表达所需的并且可操作地连接的一系列构成单元的概念,例如包括启动子区域,开放阅读框架(open reading frame,ORF)和终止子区域。
因此,所述基因的CpG部位可以存在于相应基因的启动子区域、开放阅读框架(open reading frame,ORF)或者终止子区域等。一个优选的例子可以是存在于所述基因的启动子区域中的CpG部位。
所述CpG部位可存在于由从2号染色体的25438725至25439276序列、12号染色体的95941906至95942979序列、10号染色体的134597357至134602649序列、8号染色体的144649774至144651774序列、1号染色体的47998899至47999517序列、2号染色体的26394102至26396102序列、8号染色体的104510870至104513913序列、8号染色体的98289604至98290404序列、2号染色体的63281034至63281347序列、8号染色体67873388至67875600序列、4号染色体的76555366至76556079序列、1号染色体的63782394至63790471序列、5号染色体的7849945至7850439序列、2号染色体的39186777至39187968序列、14号染色体的74207665至74208665序列形成的群中选择的一种以上的碱基序列内。
所述2号染色体的25438725至25439276序列具有序列编号1的碱基序列、所述12号染色体的95941906至95942979序列具有序列编号2的碱基序列、所述10号染色体的134597357至134602649序列具有序列编号3的碱基序列、所述8号染色体的144649774至144651774序列具有序列编号4的碱基序列、所述1号染色体的47998899至47999517序列具有序列编号5的碱基序列、所述2号染色体的26394102至26396102序列具有序列编号6的碱基序列、所述8号染色体的104510870至104513913序列具有序列编号7的碱基序列、所述8号染色体的98289604至98290404序列具有序列编号8的碱基序列、所述2号染色体的63281034至63281347具有序列编号9的碱基序列、所述8号染色体的67873388至67875600序列具有序列编号10的碱基序列、所述4号染色体的76555366至76556079序列具有序列编号11的碱基序列、所述1号染色体的63782394至63790471序列具有序列编号12的碱基序列、所述5号染色体的7849945至7850439序列具有序列编号13的碱基序列、所述2号染色体的39186777至39187968序列具有序列编号14的碱基序列、所述14号染色体的74207665至74208665序列可能具有序列编号15的碱基序列。
所述2号染色体的25438725至25439276序列的CpG部位位于2号染色体的25439110、所述12号染色体的95941906至95942979序列的CpG部位位于12号染色体的95941988、所述10号染色体的134597357至134602649序列的CpG部位位于10号染色体的134599823、所述8号染色体的144649774至144651774序列的CpG部位位于8号染色体的144651002、所述1号染色体的47998899至47999517序列的CpG部位位于1号染色体的47999163、所述2号染色体的26394102至26396102序列的CpG部位位于2号染色体的26395458、所述8号染色体的104510870至104513913序列的CpG部位域位于8号染色体的104512877、所述8号染色体的98289604至98290404序列的CpG部位位于8号染色体的98290148、所述2号染色体的63281034至63281347序列的CpG部位位于2号染色体的63281139、所述8号染色体的67873388至67875600序列的CpG部位位于8号染色体的67874178、所述4号染色体的76555366至76556079序列的CpG部位位于4号染色体的76555832、所述1号染色体的63782394至63790471序列的CpG部位位于1号染色体的63789278、所述5号染色体7849945至7850439序列的CpG部位位于5号染色体的7850070、所述2号染色体的39186777至39187968序列的CpG部位位于2号染色体的39187533、所述14号染色体的74207665至74208665序列的CpG部位可以位于14号染色体的74208165。
根据本发明的另一方面,提供一种包括探针的肝癌发病风险诊断用试剂盒,所述探针结合在由从2号染色体的25438725至25439276序列、12号染色体的95941906至95942979序列、10号染色体的134597357至134602649序列、8号染色体的144649774至144651774序列、1号染色体的47998899至47999517序列、2号染色体的26394102至26396102序列、第8号染色体的104510870至104513913序列、8号染色体的98289604至98290404序列、2号染色体的63281034至63281347序列、第8号染色体的67873388至67875600序列、4号染色体的76555366至76556079序列、1号染色体的63782394至63790471序列、5号染色体的7849945至7850439序列、2号染色体的39186777至39187968序列以及14号染色体的74207665至74208665序列形成的群中选择的CpG部位。
所述探针可以用作可杂交阵列元件(hybridizable array element),并且可以固定在基底(substrate)上。
所述气体是合适的刚性或者半刚性载体,其可以包括例如膜、过滤器、芯片、载玻片、晶片、纤维、磁性珠或者非磁性珠、凝胶、管、板、聚合物、微粒和毛细管。所述杂交阵列元件可以被布置并固定在气相上。
所述固定化可以通过化学键合法或者共价键合法例如UV来进行。例如,所述杂交阵列元件可以结合到已被修饰为包括环氧化合物或者醛基的玻璃表面,也可以通过UV在聚赖氨酸涂覆的表面结合。另外,所述杂交阵列元件可以通过连接基团(例如,乙二醇低聚物和二胺)结合在气体。
适用于所述于微阵列的样品DNA可被标记(labeling),并可与微阵列上的阵列元件杂交。杂交条件可以进行各种改变,并且可以根据标记物质以各种方式进行杂交程度的检测和分析。
所述探针的标记可以提供检测是否存在杂交的信号,并且可以与寡核苷酸连接。
所述标记可包括具有如荧光团(例如荧光素(fluorescein)、藻红蛋白(phycoerythrin)、若丹明,赖氨酰胺(lissamine)和Cy3与Cy5(Pharmacia))、发色团、化学发光基团、磁性颗粒、放射性同位素元素(P32和S35)、质量标记、电子致密颗粒、酶(碱性磷酸酶或者辣根过氧化物酶)、辅因子、对于酶的基质、重金属(例如金)和抗体、链霉亲和素、生物素、洋地黄毒苷和螯合基团的特定结合配偶体的半抗原,但不限于此。
所述标记可以通过本领域常用的多种方法实施,例如,切口平移法(nicktranslation)、随机引物法(Multiprime DNA labelling systems booklet,“Amersham”(1989))和钾化法(Maxam&Gilbert,Methodsin Enzymology,65:499(1986))标记。
所述标记可以提供通过荧光、放射性、比色法、重量测量、X射线衍射或者吸收、磁性、酶活性、质量分析、结合亲和力、杂交射频、纳米晶体可检测的信号。
可以利用从各种生物样品(biosample)获得的mRNA来制备成为所述分析对象的核酸样品。相比于所述探针,标记成为分析对象的cDNA也可以实施杂交反应-基础分析。
当利用所述探针时,可将探针与cDNA分子杂交。所述合适的杂交条件可以通过优化程序由一系列程序被确定。所述过程可以由本领域技术人员按照一系列过程来被实施,以建立用于实验室的协议。
例如,温度、成分浓度、杂交及洗涤时间、缓冲液成分及其pH和离子强度等的条件,依赖于探针的长度及GC量以及靶核苷酸序列等的各种因子。所述杂交的详细条件可参照Joseph Sambrook,et al.,MolecularCloning,A LaboratoryManual,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(2001)(Joseph Sambrook等人,《分子循环》,实验室手册,冷泉港实验室出版社,纽约冷泉港(2001));及M.L.M.Anderson,NucleicAcid Hybridization,Springer-Verlag New York Inc.N.Y.(1999)(M.L.M.安德森,《核酸酸性杂交》,Springer-Verlag纽约公司,纽约(1999))。
例如,在所述严格条件中,高严格条件可意味着在0.5M NaHPO4、7%SDS(sodiumdodecyl sulfate,十二烷基硫酸钠)、1mM EDTA以65℃条件杂交,在0.1×SSC(standardsaline citrate,柠檬酸标准盐水)/0.1%SDS以68℃条件洗涤。或者,所述高严格条件可意味着在6×SSC/0.05%焦磷酸钠以48℃条件洗涤,低严格条件可意味着在0.2×SSC/0.1%SDS以42℃条件洗涤。
所述杂交反应之后,可以检测通过杂交反应发出的杂交信号。例如,当所述探针被酶标记时,可以将酶的基质与杂交反应产物反应来确认杂交与否。
所述酶和基质可以使用过氧化物酶(例如,辣根过氧化物酶)和氯萘酚、氨基乙基咔唑、二氨基联苯胺、D-萤光素、光泽精(双-N-硝酸吖啶甲酯)、间苯二酚苄醚、鲁米诺、安培红试剂(10-乙酰基3,7-二羟基苯恶嗪)、HYR(对苯二胺-HCl(p-phenylenediamine-HCl)和邻苯二酚(pyrocatechol))、TMB(tetramethylbenzidine,四甲基联苯胺)、ABTS(2,2'-Azine-di[3-ethylbenzthiazoline sulfonate],2,2'-Azine-二[3-乙基苯并噻唑啉磺酸盐])、邻苯二胺(OPD)及萘酚/吡咯烷酮;碱性磷酸酶及溴氯吲哚磷酸酯(BCIP)、硝基蓝四唑鎓(NBT)、萘酚-AS-B1-磷酸酯(naphthol-AS-B1-phosphate)及ECF基质;葡萄糖氧化酶和t-NBT(nitroblue tetrazolium,硝基蓝四氮唑)和m-PMS(phenzaine methosulfate,甲基苯扎因甲硫酸盐)。
当所述探针由金颗粒标记时,也可以利用硝酸银由银染色方法进行检测。
评估所述肝癌的预后或者风险的方法,可以通过各种统计处理方法来评估肝癌诊断的可能性。作为统计处理方法,在一个实施例中使用机器学习(Machine learning)方法,并且可以参照Maxwell W.Libbrecht,2015,Nature Reviews Genetics 16:321-332(Maxwell W.Libbrecht,2015年,《自然评论遗传学》16:321-332)。
所述机器学习是人工智能的一个领域,从模式识别和计算机学习理论的研究发展的领域。机器学习是基于经验数据进行学习并预测,研究并构建提高自身性能的系统和用于此的算法的技术。机器学习算法不是执行严格定义的静态程序指令,而是基于输入数据构建用于导出预测或者决定的特定模型的方式。
在下文中,将通过实施例更详细地描述本发明。
实施例1.选择与肝癌发病有关的DMP
样品
从首尔大学医院的184例肝癌患者中获取肝癌样本,以筛选与肝癌发展相关的DNA甲基化区域。与肝癌组织相应的正常组织使用了正常对照群。
利用基于柱的DNA提取方法(PureLinkTMGenomic DNA Mini Kit,Invitrogen;PureLinkTM基因组DNA迷你试剂盒,英杰公司)和珠子(Bead)方式的DNA提取方法(MagListoTM5M Genomic DNA Extraction Kit,Bioneer;MagListoTM5M基因组DNA提取试剂盒,百奥尼),从每个样品中提取基因组DNA(genomic DNA)。使用分光光度计(nanodrop)对提取的genomic DNA进行定量,并且DNA状态是在1.5%琼脂糖凝胶上进行电泳从而确认降解与否。
亚硫酸氢盐处理
在genomic DNA处理亚硫酸氢盐(Bisulfite)时,DNA碱基序列中的5'-CpG-3'部位的胞嘧啶被甲基化时保持不变,但是当非甲基化时,可以变为尿嘧啶测量甲基化程度。
因此,为了区分甲基化的胞嘧啶和非甲基化的胞嘧啶,用亚硫酸氢盐处理了genomic DNA。利用EZ DNA甲基化试剂盒(EZ DNA Methylation Kit)(Zymoresearch Inc.)按照制造商的手册处理700ng的genomic DNA,将由此制备的经亚硫酸氢盐处理的DNA,由M-洗脱缓冲液(M-Elution Buffer)进行溶解,并在-80℃下保存直至使用。
经亚硫酸氢盐处理的DNA在一个月内使用。
DNA甲基化微阵列
使用Infinium(
Figure BDA0002503823260000131
Human Methylation 850K BeadChip)执行DNA甲基化微阵列。
利用Illumina Infinium甲基化EPIC芯片试剂盒(Illumina InfiniumMethylation EPIC BeadChip kits)(Illumina,Inc.,San Diego,CA;加利福尼亚州圣地亚哥Illumina公司)并按照制造商的手册,扩增亚硫酸氢盐处理的DNA,切断(fragmentation)、沉淀(precipitation)及再浑浊(resuspension)之后杂交(hybridization)在芯片(BeadChip)。
清洗后,利用illumina iScan扫描仪(Illumina iScan scanner)扫描芯片(BeadChip)。
在R程序包中,利用minfi程序包并根据程序包的手册执行数据质量控制(qualitycontrol)。对于通过质量控制标准的样品,计算将由甲基化程度着色的raw data的idat文件数值化的值β值。
DNA甲基化的程度由具有0-1值的β值表示,β值0意味着相应的CpG部位完全被非甲基化,而1意味着完全被甲基化。将计算的结果进行了归一化和校正。所有统计在R统计环境(v.3.3.2以上)中执行(图1)。
实施例2.选择诊断标记候选物
参照图1,从182例肝癌和相应于此的肝正常样品中提取DNA,然后进行InfiniumMethylation EPIC BeadChip。
由自身建立的管线分析了甲基化数据(methylation data)。选择了在正常情况下甲基化程度低,在肿瘤(tumor)处甲基化程度高的探针(probe)。
首先,选择了显示正常样品和癌症样品的甲基化差异的DMP。
选择在正常样品中甲基化状况非常低,并且在70%以上的癌症患者中甲基化为50%以上的非常高的7个探针,并且有机器学习方法验证了效率(图1,蓝色)。
选择在正常样品中,甲基化(methylation)非常低(10%以下),并且在肝癌患者中平均为30%以上的高的探针,并进行机器学习以选择能有效地区分肝癌/肝正常样品的上位9个探针(图1,棕色)。
通过各种实验验证了最终选择的15种(一种重复)肝癌诊断标志群。
实施例3.通过热图(Heatmap)选择探针
调查182个肝癌样品和127个正常样品的DNA甲基化的结果,从5%以上的肝癌样品中选择了30%以上过甲基化的100,053DMP(differentially methylated probes,不同甲基化探针)。
从正常样品中选择了甲基化为10%以下的非常低的13,078个探针,以使在显示正常/癌症样品之间的差异的DMP中的可进行血液活检。
在选择的探针中,从70%以上的癌症患者中选择了50%以上过甲基化的7个探针(表1)。
【表1】
区分 探针ID 50%以上过甲基化的肝癌比率(%)
探针1 cg20172627 78.16
探针2 cg22538054 77.59
探针3 cg27583690 74.14
探针4 cg19951303 72.99
探针5 cg22524657 71.84
探针6 cg24563094 70.11
探针7 cg25744484 70.11
制备了确认所选的7个探针的肝癌患者的甲基化值的热图(图4)。
实施例4.通过机器学习选择探针
在显示正常/癌症样品之间差异的DMP中,选择了在正常样品中甲基化状况非常低且在肝癌患者中平均30%以上的高的探针。
利用所述探针进行机器学习,选择了可有效区分肝癌/肝正常样品的上位9个探针。
参照图5,蓝色圆圈表示一个探针,并且以重要性高的顺序(x,y轴)的选择了上位9个探针。
X轴表示由机器学习构建的模型中的每个探针的准确性,Y轴表示由机器学习构建的模型中每个探针的纯度。
制备了将由机器学习选择的9个探针的甲基化程度,在200例全血(whole blood)、125例正常样品、180例肝癌样品中确认的甲基化值的热图(图6)。
通过实施例4及5的方法最终选择的15个探针信息如下表2。
【表2】
Figure BDA0002503823260000151
Figure BDA0002503823260000161
实施例5.单个探针肝癌诊断效率的评估
评估了选择的15个探针的肝癌诊断效率(图7)。
图7是通过AUC显示各探针的肝癌诊断效率的结果。
单独使用15个探针确认肝癌诊断效率(AUC;area under the curve,曲线下的面积)的结果如下表3。
【表3】
Figure BDA0002503823260000162
Figure BDA0002503823260000171
另外,在公共数据库中验证了单个探针的肝癌诊断效率(图8),图8是将每个探针的肝癌诊断效率由AUC显示的结果。
利用TCGA LIHC methylation data(450K)(TCGA LIHC甲基化数据(450K))验证单个探针效率的结果如下4。
由灰色显示的区域表示Infinium Methylation450K BeadChip中不存在,而仅在Infinium Methylation EPIC BeadChip(850K)中存在的探针。
【表4】
Figure BDA0002503823260000172
Figure BDA0002503823260000181
另外,为了分析15个面板探针的肝癌诊断效率,将15个探针整合以确认肝癌诊断效率(AUC;area under the curve,曲线下的面积)(图8)。图8是由15个探针进行机器学习获得的训练数据及验证数据的混淆矩阵(confusion matrix)结果(二次交叉验证)。
为了防止数据偏差,将随机分为两部分的二次交叉验证方法进行10次,并分类为测试集(Testing set)和训练集(Training set)。
基于分类为训练集的数据,学习正常和肝癌的模式,并根据此构建了肝癌特异性诊断模型。
下表5是训练集的误差矩阵。
【表5】
输入值 正常判定 肝癌判定 误差率
正常 62 1 0.159
肝癌 3 87 0.333
基于由所述训练集构建的肝癌特异性诊断模型,对测试集进行诊断确认了肝癌诊断效率(表6)。
【表6】
样品 正常判定 肝癌判定
正常 61 0
肝癌 1 90
参照表5和表6,由基于机器学习选择的15个探针可构建肝癌特异性诊断模型,并且被评估为非常高的状况。
实施例6.利用多个探针的肝癌诊断效率评估
为了基于所述肝癌特异性诊断模型寻找在15个探针中具有最大效率的最小探针的个数,测量了每个探针的效率(图9)。
图9示出了通过对可能的探针组合进行机器学习获得的结果(二次交叉验证)。X轴表示探针的个数,Y轴表示AUC(诊断效率)。
参照图9,由于当探针的个数为3个以上时诊断效率收敛到99%以上,所以可以提供非常准确的诊断信息。
因此,与利用单个探针时相比,利用多个探针时可以显着提高诊断的准确性。
实施例7.包括通过焦磷酸测序的探针的CpG岛的甲基化分析
为了在选择的探针中测量结合探针的CpG部分的甲基化程度,实施了焦磷酸测序。
焦磷酸测序利用从核苷酸添加中释放的焦磷酸(PPi)。在存在5'磷酸腺苷的情况下,通过ATP硫化酶PPi被转化为ATP。
萤光素酶使用ATP将萤光素转化为氧化萤光素,该反应产生可以被检测和分析的光。
将所选的探针的CpG部位的甲基化程度显示为热图(图10)。
确认结果,在正常情况下显示甲基化状况低而在肿瘤中显示甲基化状况高,并且确认了所选探针的CpG部位和其周围的甲基化程度相似。
实施例8.包括通过EpiTYPER的探针的CpG岛的甲基化分析
为了验证数据,利用EpiTYPERTM分析仪(EpiTYPERTMassay)(加利福尼亚州圣地亚哥市的塞克农;Sequenom,San Diego,CA)定量分析了探针中上位三个探针的甲基化状态。
PCR扩增后,将在试验管内转录的扩增片段(amplicons)用虾碱性磷酸酶(shrimpalkaline phosphatase)进行处理,用RNaseA切割后,为了确定甲基化状态放入MALDI-TOF质谱(MALDI-TOF Mass Spectrometry)。
结果是利用EpiTYPER TM ver.1.0软件进行了分析。
对于三个选择的探针,由EpiTYPER进行了验证(validation)。通过热图确认了所选探针及其周围的CpG部位的甲基化程度(图11)。
参照图11,在正常情况下显示甲基化状况低而在肿瘤中显示甲基化状况高,并且确认了所选探针的CpG部位及其周围的甲基化程度相似。
因此,包括CpG探针在内的整个CpG岛的甲基化状况也可相同地用于诊断癌症的预后及风险。
本发明的以上描述仅用于说明,并且本发明所属领域的技术人员可以理解,在不改变本发明的技术精神或者基本特征的情况下,可以容易地将其修改为其他特定形式。因此,应该理解为,上述实施例在所有方面都是说明性的,而不是限制性的。例如,描述为单一类型的每个组件可以以分布式方式实现,并且类似地,描述为分布式的组件可以以组合形式实现。
本发明的范围由所附的权利要求书来表示,并且从权利要求书的含义和范围以及等同概念得出的所有修改或者变化都应解释为包括在本发明的范围内。
<110> 延世大学
<120> 利用基因的CPG甲基化变化评估肝癌的预后或者风险的方法
<130> DP-2017-1051
<160> 44
<170> KoPatentIn 3.0
<210> 1
<211> 552
<212> DNA
<213> 智人
<400> 1
tcgccctctg gctcggcacg gaggggggcg ctcagccttt ctggggcaaa tttagtaata 60
tgggacccga gccctcgacc cgaaatacgc ccgaggcatt tatcctaaaa aacgacaagg 120
tccgggcgcc cagcagaacg gcccggctcg accgcgcgca gcttgcaggc aggggggtgt 180
gcaggtcacc gcgccacccc ggcgagcaga gccgcggagg gcgccacgtc ggtgcgctgg 240
ccccgcccga gcggggcggg accttcctgt acccccggaa gcccccgcgg gcagctgggg 300
aggaaaccgc ggccacgcgc tcggggggcc cggctcggga agggcagtgc gcgcgcatgc 360
gttggggcgg ggcgcctggg acctgcgggc cccaggccca gcgcgccgcc agccggagtg 420
cccggcgccc gtcgaaaggc ccctgcgccg gttcaggacc cgcacccagc tacgctgcgg 480
agccccagct cgcagcaccc tcccacccac cgctcctggc tgcttttctc ctgagtctgc 540
ggggcggggt cg 552
<210> 2
<211> 1074
<212> DNA
<213> 智人
<400> 2
gcggcagcag gtgccggcag cgcggggacc gatcgatgga gagaaggcgg gcaagacgcc 60
gggaagcgca ttcctcctca accgagtgcc acaaccgccc tcccgaagtg ccccggggct 120
tcgagcatca cctcgcggta atccgggagg gtggagggat gcggctggac ccgggcgttg 180
cgtgctccac acagcgccca gcccgtgcca gccccgcgcc cacctctcca cgacgctcgt 240
gccgggatca gcgcgaagcc ccttccagtc cccgaagccc tcgcccgcgc ccgttctccc 300
ccagctcgcc ccctccagcc cgctgcgcct tgccgcagca tctccgggca ctctgaggct 360
gccgccggga cagggtcgga gcgccgcaga acccaccgaa acttcccagg ggggcaattc 420
aaaattcgcc ggacgcgtcg ccgccgcgcg cccctcggct cattcccttc cgcgcgcccg 480
cagccccagg ctctccctct ctcaggaccc cccagcgccc tgcgcggcga gaataggccc 540
ccaggtgcct cccggccccg ggggctgccg tcgcacgtcc gctcccgcag gggtcctcac 600
tccgccaatc gccgcggccg cgcgccctcg cgcacactca ccagcccgag ccggggcggc 660
catcttagcg ctcaccccgg ccccccgccc cccggttcgg cggccgcgac gacccggtgc 720
ggcggctacg acagccgtga cgcgcagcag gccccgcccc ctcccacagc cccacccctg 780
cgccggctct tcgcgggcac cgagaacctg ccggtggccg ccttccgcgc ctcgtggggg 840
ggtcggggcc acggacggtc cccggcgccg caagtgggtc tgcgcgaaca acaagcactg 900
cctccccggg cgggcttcgc acctgtagtg ccgtcgggac acgggagggt aaacccagcg 960
tgtcctgtgt gcctgtgagc cgcagaatca tccacggacg tcgttagtcc ttcctggaat 1020
ttctgcgatt tacacaacgt cgaattgttt ggcagaaacg cgtggcaaac tccg 1074
<210> 3
<211> 5293
<212> DNA
<213> 智人
<400> 3
acgcgccgag tttaagccct ttctatttcc ctttaacgct tccgcaaatg ccaagagaaa 60
tcgtaccacc gcagtgatat cattatttac atttaatttt taaaaattaa aactcaacag 120
ccacgcccat taagatgcag cgatgggcag ccccggccac agaggctgcg ggaggctgga 180
ggggttttgt cagccgcagt cacagccccg cggagctggc ggcatttcag ggcaggagac 240
gggtcccccg agcccccggc tgggcgctgc gggccttgcc cagggggcct ccggctccct 300
gaccccgcgt gacccacggg aggccccgcc gctccgcggg cggaattatt tcggatttct 360
ctttgcggtc ctagttcgga agaaactgct ttccaccgcg ggaagatctg gcgggatggt 420
gaccgaaggg cctccgtgca gcggatcaga cccggttcca ccggctgagc ccagggcggg 480
cctatgggat ccgctgatgc gcagagggac tttggaaata atcagagcga agccctcggc 540
caagcgggaa cgggtgcccg gtggcaacga gtacgtggcc ccaaagcggg aaaacggaag 600
aagaaaaacc tcccgcgggg actcgaggcg ggtacgcggc tcacccgccc tttcgggaac 660
ccccaagcgc gtccgaatcc gccccgaggc gaggcgggcc gggccgtacc tgctgctccg 720
tccccggctc cgtcccgggc tcctggcggc tgtcgctgcg gttccttccc gcgggccggg 780
ccccttccct gcgccttcgc cgcctcctcg cgcctgcccg gggcccgcag cctccgcacc 840
gggaacccgg aggacccgag gcgggcgcag gggcgaagcc ggggccgggg aggggccgcc 900
tcgctccggg ttcgagacgg aagaaacacg cggcgcaggc tccggagcga cggctccgac 960
ggggacccgt taaataattt attgatgata caaagcgact cgcgcccacc cggggccgcc 1020
cccggattct gcaaaaatag attcgccccc accccgcggg tcctcacaag gcgtcccccg 1080
cgccgccgcc gcacgggctg accagcgcca agttcgaggg tttgtgcttc ttgagcagcc 1140
gcgtgatctt ctcgtcgtcc gagttggggt ccaggggccg gttgtattcg tcgtcgtcct 1200
ccgcgtccga gccgcccacc ttcagcttct cggcgtccga gtcctgcttc ttcttggccg 1260
acgccatctc caccgcgtgc cgcttgcgcc acttggtccg gcggttctgg aaccagacct 1320
gggagtggac ggggcggtca ggcggccgcg gggcccgggg ctggcgctgg ggccgttcgc 1380
aggacgcggg cccccggctc tgctctcccg agccccgccg cgctcacctt cacctggctc 1440
tcggtcatgc ccagcgagta ggcgagacgc gcgcgctccg ggcccgccag gtacttggtc 1500
tgctcgaagg ttttctccag cgcgaagatc tgctggcccg agaaggtcgg gcgcgagtgc 1560
ttcttcttcc cgtccttgtc caggacgccg ccggccgggg ctgcaaggga ggggaaggga 1620
gggaggtcag cggccggcgg ggtccccctc cgcgcccacc cgccccgcac cccccgcgcg 1680
ggccactcac ccgggccagc cagacgcggg tccctccagg gcgcgccctg caccacgccg 1740
ggccagaaga tgggcgggcg ccccggcagc tcggccaggg gcttggggta gccgcgcgcc 1800
acagcggccg cgggcccgaa gtaaacgccg gcggacgacg cgagcccgtt gagccggggc 1860
agccccccca ggaggccccc gcccgccgcg cccacgggcc ggcccaggat gtcgctgatg 1920
ccgtgcgggg tcccgagcgg gagctgcgcg cccaggcccc ccagcgcggg cgccttgaag 1980
ccggccggac cctgcagcgc gtaggggaac agcgacgtct tcatctcggc catgttgtgc 2040
agcgcggcca gcggggcact gctcagcacg aacgcgcccg ggcggttagt gtccatgggc 2100
gccgccgccg ccggcccggg ctcccatccg ggccccgccg ccgccgcccc tgcccgccgg 2160
cccgggaagt ttgcgcgcgg cccgggcggg cgtcggctgc agcgcggggc gcggggcgcg 2220
gggggcgggc gggcggctcc ggcgcggggc gggcgggcgg gcggcggcgg cggcggctcc 2280
ggggccggtc ggagcggcgc cgcgcgggac ggacgcgctg ataacggggg ctccccgggg 2340
cgcggcgcgc gcgctgattg gctgcggacc ccgcggtccg gccattggcc ggcgcccccc 2400
ccccgcccgc gcgcccccgc cggccgcgca ctccatgaag ggcccattag cgcggcaggt 2460
gcctcccggg ctgtaaattc gccccgattt atctccccgg ggacgaaata aatccagctt 2520
ggatgggagt gtagttaggc aaaggttttc atgcgaaatc aggaaaaaat acgagaacgt 2580
attttattaa cggaaagaat gcagatttga ggacccgccc gcgcgctcgg agcgccccac 2640
tcggggaaga gtcccggccc gcgtcccagt cgcgactgct ccgccgcccg tggctggggt 2700
gggtgtgagc ggcagcggac gccggcgggg aacgcgctcc gggcaggtcg gggccacagg 2760
agggcggagg acgcgggcct cgagtccacg gaatccacgg gcctcacggc cgggcgaggc 2820
tcgcacggag ctgcctctgg tttcgccgac acgcggccgg cgcggtggag gagtgaggca 2880
ggcgggagcg gggcggggag gcgggtcccg ggaccacacg cgcggctcgg cacttccccg 2940
tcatcggcct ccaggtctcc cgctgggggt cccccaggat gtgacctggg cccacgactt 3000
cgcccacggg ccgcctctcg cgaatccccg gccgggagaa cagagaccag gacggcctca 3060
gcgcggaagc cctgtccagg gcccgaacgt gggtgcgggc tgggggcgca gcggcagaaa 3120
cgcggcctta gacgcgcgcg gggggccggt gtcccccccg cccccacggc accgggagcc 3180
gctcgctcat ccatcccgca gaccgggcgg tgagatgact ccgagccccg cgcacggcgg 3240
ccgcgagcaa acgctccgac gtctgtggtg acgtctcgta ttgatttagg gacacggggc 3300
ggctgtggct gtggcccacg gctcgtgggg agcccgagtc tgtgcgcagg gaacgccgct 3360
gcgtggcctc tctcgggcct gtgccgcgga ggaaggcggc gcccggggtt cggggccggg 3420
gtctcacgtc cgccccctcg cccccctcca gcgtccgttt tcgttttgtg caggtcgagg 3480
cggggacttg gcgccgtcgg ccgctcctgg atggcggctt ggaaaagcca cctgcggcca 3540
aactccgggg cagtggtgcg gccgccgggt gtgtgcgcgc tcggggctgc cccggcggct 3600
tccggctcca ctgaggtgca gccccgcgtt cacggggggt tcgcttcccc cgtcgactcc 3660
gcactcgatt cgactgggat tgggattcga ttgggcgcgg ccgccccacc ggtgatcggc 3720
ccccgcggag cctggcccgg gaacccccag cgcccgtccg gccccgagac ccgccccggc 3780
ctgtcctgcg ccccgctccc tcggaggaga cacgaggaag ggccctcccg ggtcgggttc 3840
gggcccctcc cagcacccca aggcgacggc gcccgcgccc aaggctcggg ctctgagctg 3900
agacgcggga actgcggggc cggggggggc gggcaggggg agttgggggc gggggctgct 3960
gtcgccctgg gatcccccac tctgcgcggc cgggcagacc ctgggcgggc cgggaggggt 4020
gcgggtcgcc cgaactgagg cccaggaggc gcgcgcgggc ggaacggcgg gaggaagccg 4080
cgctcgggac aggctctggc tcttctcaca gcctggaggg gcggggcagg gggcgtcgct 4140
agcgctgttt tatggctgag gaaacatgga cctggaggcg ctgcgctgcg gcccgataaa 4200
ccctgggtct gtctgcgccc cccggtcctc cctgggctgc cgagggaacg cgtggggtcg 4260
cgggtggggc tggcgtgtca ctggctgcgg agcgcgcggc tctccagggc tcaggggcgc 4320
gggatgaggg gccagggtga gttgggggcg cagaggagcc gggtaagggg gggtccctct 4380
cccacgttct tgtaagccgt ggaagtcttg gcgcgctccg caggtgccgc gtcctacccg 4440
gctccccggc ctgcgcccca cgcgctttcc cgccctcctc ctcgcggagc tgcgcgtggg 4500
tccggtggct tcacctccta cgcttcccgg cgcccactcc gggccccgtc ccctctccgg 4560
cccccgcccg caccttttct cctgcgtccc ccggtgccgc cctctcggaa accaccgagg 4620
caactccccc tcctcccggg aaggtccgag cgcctccgac cgcgatgtct ttgcctgggc 4680
tccgccgccc ggcggccccg ctgcctggag aggtccgcga tgccacctcc tggcccgcga 4740
gcagatgtcc cgcgaggaag gctgccggca tcggcgccga cgctccgcgc tggaaaaccg 4800
agagcgcggg gtttggcaga ggccattcaa gtttgtttta ctcgttcagc ctgtatttgt 4860
ggggctccta ccgcgcccgg gctgtccggg gggtgcaccg tgaacgcagc gggctccggc 4920
ccgggcgcgg gcgggtcaga gcagcaaacg cgctcccccg gcacccccgc ggcgtctgca 4980
ggggagcggg cgacggggag gacggcgggg gtgtcggccc ggaaggagag ccggcctagg 5040
ccccggtgtc cccgcgctgg gggctgaggg gcgacggggg aactccacag agggaaggag 5100
cctgcgttcg ccttcggccg cccaggccat agagttcaca aactctgatt tatcactgag 5160
gtgacttgtc ccgcgcagcc ctaggcgagt tgccaagctg cccgccctga ccgcgccccc 5220
aggccggggg tctcctagca gttcccggca aaggccctgc attgtctttt ttcccgaagt 5280
gagcgcattc ccg 5293
<210> 4
<211> 2001
<212> DNA
<213> 智人
<400> 4
gcctcaccct ggaacaggga gtccagcagg tcctggttga cacagccggg gctggcgtgg 60
tggacaagga agcctggacc acagcagatg catgagtgca ggccccacag ccccccaggg 120
ggaggctggc ccagctccca aagccccggt gccaggggca gtgtgacccc gggcggcctc 180
acctataagc acggcggctg cccggcgcag ggggtcctgt ggactccgca ggtagccctg 240
ggtctggctc aggaagttgg gcacgtggcc tgggtatcgc tgaacctggg gacaaaaggg 300
ctagtggcag gacaggaggg ctgatcctga gtgcggagga ggctgcagag ctgaatccag 360
gggccggggt tccaggggag cccccagggc aggtggcatg gtcggagacc ttggacttgc 420
cccaccagta gcctatctgg tttggctgca gtagaaacgg ttgggggccc cggtgaaccc 480
tggaacaagt gggctgctga tcataccccc ttgcggtcac cttgcttccc ctactgacca 540
ggcggcagca gaggtggctc agggcctcgg ggctgtcata gtgggccacg gtgaccaact 600
cctccagcag gccccagcaa aaggcgtggt cacagcgggc cagggtccac tctgagctct 660
gggatagggg aagtgagccg ggtcaggggt ccaggaagta gaaaggcaaa aggtggggtg 720
ggaagagggg gagcaagggc atcgggtgag gggcagaaga gcccagggca ggagactgga 780
ttgattctgc tcaagggaag agcagtagta acctggccgc ccgtcacacc tgccactgag 840
gtccttggga tgggtgagtc cctgacctgt aattgtcgga ggggaggcac ggtgggagtg 900
gtgagtgttg gatggcatag gggtgggatg gtgtcggggg ctgctgacct cagcagcgtc 960
cctgctgggg tcatgcaggc gcagcagcag cggcacgaga ctctgcagca ccagcttccg 1020
cagggggccg cggagcccca gccggagccc gccccggccc cggcgcacca gagtcccaag 1080
gagcccgacg gccgaggcgc ggattgagtc ccgtgtctgc gtgggagggc gcagtcaggg 1140
caggcggaga cagagagggg ctgcaagggt gggagggggc ggccagcgcg gagcgaggaa 1200
gcggcgggtc tagggaaggc tgctgactcg gtgtgatctg gggacaggga acagggcctg 1260
gagctggacc tggttgggaa gcctggagag cccctgcagg gggtggggct tgaagggatg 1320
gggtccggaa ggaaaagtcg agcggggagg agcttggcgg gacacggccc tggaggggcg 1380
gagctgggcg acagcaggcg ggaggggcgg gggcggtcag gagggaagaa atctgggacg 1440
gagacactgg ggggacgggg cctgggaggg agaaactgga ggggcggggc ggagcctggg 1500
aggtcagggc ctgggaggga cagactgaca gactgggggg cggggcatgg gaaggagaaa 1560
ctagaggggc gggcggggcc tgggaggcgg ggcctgggag ggagagactg taggggcggg 1620
gcggggcatg agagggagaa acaggagggg cggggcgggg cctgggaggg agactggggg 1680
cggggcctgg gagggagaga ctggaagggc ggggcggggc ctgagagggc ggggcctggg 1740
cgggagagac gggggcgggg cctgggaggg agagactgga agggcggggg cggtgacagc 1800
ggcaggggcg ggacccggag gcggggcgtt tgctcacgtc gtccagtagc ggagggaggc 1860
gcggtcccag ctccgcgctc aggagccgca caggcgcccg gggccgcagc aggagcctcc 1920
tcagggcgcc cagcgctgca cccacgagcc gcgcgtcgcc ttcgcccagt gcgcccagga 1980
gcgccggcag cagcgtgctc a 2001
<210> 5
<211> 619
<212> DNA
<213> 智人
<400> 5
ccgtccggga ctcgggggga ggcgcgctgg gtggtccggc agccgggggc gggcggtagc 60
ctgcaggcgt aattggcatg cacgccgttg tagctgagac cgcttaataa agcattacat 120
atctcaccgc ttccatattt cattacctca cgcggagcct gtgagagggc cctaatggga 180
gtcagctgtg tttttacttt ctgttgtcgg ccgggacggg tttctctgcg gattctttga 240
aatgaaataa tgtgatgcac gccgcgataa gggccggcct gtaatgaggc ccaggccgcc 300
gggcggctgc tattgctcca ggtgtcgcgt atttgggctg cgaggacaag gaggaggagg 360
gggcggcgcc ggaggatcgg gggggagggg gaagtcgcga ggggcagggg gtgggagaag 420
gcggagggag gaggcagggg gcagggggcg ggcggaagag gggaggaagg agggggcggc 480
gggccgcggc aggccaggcg ggagaagccg gagacagaga gaggacgggg acagtggcgg 540
cctgcagagc cctaggaacc cgggttcaaa tcctgcccgc cagcgtgaga gagcgtttgc 600
ccgcccaggc ggtccaccg 619
<210> 6
<211> 2001
<212> DNA
<213> 智人
<400> 6
ggctgccatt tctcatgggg ttcgagccat aagatgccag gtgtcagtca cctcagaaga 60
gagggttttg tttgtatttg gtggggttct tccgggggta ccgaggctga ggactgatgg 120
atcgaggcgg gtggatcact tgagttcgga gttcgagacc agcctggcca acatggcgaa 180
accctgtctc tactaaaaat acaaaaatta gccaggtgaa aaattagccg ggcatggtgg 240
tgcttgtctg taatcccagc tacatatgta attccagcta ctcaggaagc tgaggcagga 300
gaattgcttg aacctgcggg gcggaggttg cagtgagccg agatcgtgcc actacactcc 360
cgtgagggag cagcctaggg actaaggccc gctggctccg cgagatcagc caggcccgca 420
tcatccccca attacctgca gagggcgccg cagacacaga gagggcgagg ccgaggccga 480
ggccatctaa gcttctggga agggggtccc aaagggaggc cccgagctgg agtccagggg 540
gcttggaagg aagaggtgag gacagcagaa aaggaaacgc aaattaaaag aagggaacga 600
aggctgggcg cggtggctta cgcctgtaag tccagcactt tgggaggccg agtcgggagg 660
atcgcttgag gtcaggagtt caagaccagc ctggccaaca tggtgaaacg ccgtctctac 720
taaaaataca aaaaaattag ccaggagtgg tggcaggtgc ctgtcatccc agctactccg 780
caggctgagg tgggaggatc gcttgagccc gggaggtggg ggttgcagtg agccgagatc 840
gcgccactgc actccaggct gggtgataga gtgagaccca gtctcaaaaa aagagaagga 900
aaagagagaa gggatggtgg cggtggggga ggaaggcggt tcttgtaatg atccgagagg 960
agaccgcagc accggttacg ccctcgaacc tcggcctcct catctgcaga atggacgcag 1020
tccacaccgc gtgctgtgga agggttggag cgccggttta catgacacag ggctatcggc 1080
taagggggcg ctgggaacgt ggaaggtgct ctatggtggg gcgctgtagg gtgctcttgg 1140
gcagtagggt tggagtcaaa tctgggttga agtccaacct aggttgaagt cctggctgcc 1200
acctgacctc tgcccctcag tttgctcatc agtaaaatgg ggttaaggag gctgcctcgc 1260
ccagctccac ggagccggag gtgatgaagg tcctggaaga gcagaattca gaacccgagc 1320
tttgggcggc ggagcaggac agggcgcggg tgggcgcggc ctccgggagg ccagcacgag 1380
ggggagcggc ggggcccgga cacacccagc cagaaggagg aggccgaccc cgcgccgact 1440
ccgcagatgc cgctcgggac ttcgttgtcc ctccaggcgc ccgccctggg gtcctccatc 1500
acccgccgtc acctgggcgc ggggaagctg gcgggagggg aggcggggct tggcggcagc 1560
ggcgggtggg ggccggggag cgggggcagg ggcgggcgga cggagcgcgg ggctggggac 1620
ccggggtccc agaagggggc gcggggacgg ggtccgagga gagggggccg gggcggggca 1680
gggcggacag ggctgggggc ggaggtccgg gggtgggtcc ggcggcgagt ccgggtcggg 1740
gcggacagag cagggggcgg gggtccggga ggagggggcc ggggtccggg aggagggggc 1800
ggggcccggg ggcggggccg gggtcggcgc cctgcgggga ggccggccac gtgacgcccg 1860
cggcccggcg gggctgccag gcggcgagcg ccgcggcggc cccgggaggt ggcggcgggc 1920
gcgagagcct gggccgcgcg ggactgaccg tcggggcccc gggacggcgg ccccggggcg 1980
cccatgccat ggagaagctg g 2001
<210> 7
<211> 3044
<212> DNA
<213> 智人
<400> 7
gcgcgcgtgt ggaaggctgg gtggggtgcg cacacacgct cacttgtgta cgtacacaca 60
cacacacaca cacacacaca caggcacaca cacccgagct cagtcaccca cattgcttgc 120
ccagggcgcc tggaagagct ggcgagcccg cccagctctg ttcacccggc cccgccccgc 180
cccctccggg agggctctcc gggcggcgcc cagccccgag cagagcaaag gacggcggcg 240
gccacctccg ttctccggcc gctggtttct cgtctttcct cgtcctttca ttgaacccat 300
ctccgtgctt cgaaaatctg actctaaccc gatctcttcg cgtctccgcc tcttctttct 360
agagtgagcg ccaaaaaggg cctgacagac agaagccttt ggccccagca ccggcccagc 420
ccgtctctag acgattcttg ctcctttcac cctcacagcc tccagtggtc gcttcatctt 480
cgcaccctcc cggccaaccc taactctcct cgtctctcct cgcgctgtct cgcgtcctcc 540
cctcaggatc cttccgcaca ttctcagcgt ccagcgcggt ttcccacaac ttcctcacgc 600
cccgctcccc tcgccctgtc cccgccctcg acaccacctg cgttccccac tcgctccaac 660
ctccctcccc cgctatcccc acttgtgggc ctccagctct ctgccccttt cctggccccc 720
atccctgaca ccccagggac ccttcctccc tcctcacgtt ctccctcctt ccaggatccc 780
gccccgacac ttcggggccc tcccgctacg cgcactcttt ctcctcaggt cctgacacct 840
gggcgccccc tccctgtcac ccaccttcag ctccagccct gactctcggg cgccttgcca 900
cccttacgct ccccgccccg ccccggtccc tcgggcgccc ccactcgccg cctctacctc 960
cctacctgct acacctggca cccctgcccc cacccctgct catactcttc ccccgccccc 1020
gacacctcgg gcgccccctc acacgctcct attctccaca cttccgtccc cgaaaactcg 1080
ggcgccctct cccttcacgc tcagtctctc ctccctcccc gcccggcccc ggacccagcc 1140
tggagatcgc gctcgggagg ggcggctgcc gcccgcgggg cgcccgcggt gcccgggcct 1200
gggcagcgag gaggtgacgc cgcccccgcg ggatgagccc gggaggcgga ggggcggagg 1260
aggtgctggc ggcggcactg agcggcggcg gcgcagggcg cgcgggcctt ccgcgccgac 1320
tccatcgacc caaggggcgg cggcggtggc ggcggctgag cgaccctggg ccgggcgcgt 1380
gatgaggagg ggccggcgcc agaccccgct gcacgtcgga gctcgcctgg atccgggcgt 1440
tggcagccga agggccctgg ccccgggact ctccgccgct agcccccgtc atatcttctc 1500
cgctttcgct tctccactct agccgggggt ggggtgggtg gggttggggt ctccgcgggg 1560
gtttccggcc ccgcggcccg ctcccgggtg tgcctggagg agttctccct ctgtggcgcg 1620
cgggagccct gtgatgcgtc agccggcggg acggatgagt tgcttctccg ggaaaccgtc 1680
ctcgcttcct cacgaccctc tcggctcccg cctgggtgcc cctcgggccg gcagtactcc 1740
gcctccgggc gctcgaagcg agttccccgg gggcttgttc gcaggcaccc cttcccctcc 1800
gaggcggcgc gcgcgctccc ggccctgacc gcggccggac acactcgcgc cccggtccgc 1860
ctgtcgccct cccgcctgct ccctccagtc accccaccct tagctgtccc cgccacctta 1920
ctccaccacc ctcccccgcc tctccgcgca ctccgcgtcc cggcctccag ttcccctttc 1980
ccttgaaccg ctcacttcac agcccttcgc ccccgggaag aagaaacatt tcccgaagcg 2040
cactcctcag ccctccttcc ccacgcgctc gccctcccct ccccctgctt ttcttggggg 2100
aggggggctg tcgccttgga ttgaaggcca ttgatttgta tgtatttgtc ccagcgctgg 2160
aggctgcccc agccgccgcg ccggtgccgc cgctgccagt ggagttgcct ccccgcttcc 2220
ctagggtggt tcggctccac caaacatgtc ggctcctgtc gggccccggg gccgcctggc 2280
tcccatcccg gcggcctctc agccgcctct gcagcccgag atgcctgacc tcagccacct 2340
cacggaggag gagaggaaaa tcatcctggc cgtcatggat aggcagaaga aagaagagga 2400
gaaggagcag tccgtgctca agtaaggacc tggctccata ttcccgcctc tctccctgcc 2460
ctccgccccc tcgcccactg ccctgcggcc gcctgcgcgc cccagttcgc cgccctccct 2520
cccgctggcg gcgcccaggc cacgagggct gcggccagcg ccggccgccc gggctgtttt 2580
aggggtgtct gagagcaggg gtgtgtgtcg gggagggagg gcgccaaggc cggctgaggt 2640
gagggtggcg agccttaggc ggtgtgattt tccttggcgc ctttccggat ttcctcgctg 2700
gtcatcttgg ctccggggcc ccagcgggac tggggctgaa cccaggctct gtgcgtaccc 2760
tctcctttcc cgccgcgctg aggcagtgac tggggcacag aatccaatat ggccgtgcac 2820
aggtgctccc tggacggacc cgggcgaagg cgcgctggca ggggatgcgg acgccaccct 2880
ggtcccacgc ctccgcgggg cggctctacc agcaacgcgg gacagagcag ggctgcccac 2940
agtggctgcg agcagcgggc ggcggcgcgg gctaggggcc taagctctgt cgcggtcggg 3000
tgggtgtgcg tccgccgcca tcttccagcc cctccccctc ggcg 3044
<210> 8
<211> 801
<212> DNA
<213> 智人
<400> 8
ccgcggtgct acaggtttct ggggccttct tcccggcagg gccacgccgg tttccaacgc 60
ggggggcatt tttcggcctt cccacggttc ccgctgttcc cacgaagaca gtgtctgcgg 120
ccaggcgctc cgagagagat gcggccttcc ccgggccggg cctggccgcg gcctgcccgt 180
ggtcccccgc agctcgggcc cgcagcgcga ggccacagtc cagggggagc cggcaggcgg 240
cctcctcccc gagccggagg agctgcgcgg acgcagcggc ttccaggcca ccccaccccg 300
cgccagcctg cacctgtgcc gcctgggtgt cttccccgag actctggtac tgtgaagggt 360
ccgggtcgcg cggggcgtcg tccggagcag ggcggactcg ggctttggcg cggcctttgc 420
cccggttttt ggcgcgggag gactttcgac cccgacttcg gccgctcatg gtggcggcgg 480
aggcagcttc aaagacacgc tgtgaccctg cggctcctga cgccagctct cggtcgggac 540
cgagcgggtc tctccacggc aaccgccgac gtcacgaacg tacaactgta ccgtcgcgag 600
aggacgtgat gcgcccggtg attggcgccg ccgctgcggc tgcgcaggag acgacccccg 660
cgggcgctcc cacccccatc tcgcgcggac tcgctttagg tctcggcgag tttctctgat 720
atgcgctcgc gggggtgctg ccatttcatc tcttccgcgc gggctcatcg tgctctcagg 780
gtctcgttga acaaggcaac g 801
<210> 9
<211> 314
<212> DNA
<213> 智人
<400> 9
tcggccgccc gagggagttt cttttattcc cagttcggct ttcttttgcg aaggccgaga 60
tctgggcctg ccaggggcct gcccgagtcc tctatcgcgg gtccacgtgg ccaccaatga 120
cccgcggcgc ccccgcgtgt ccccgcagcc actccgcgga agcagcggcg ggagcgcacc 180
accttcacgc gttcacagct ggacgtgctc gaggcgctct tcgccaagac tcgctaccct 240
gacatcttca tgcgggagga ggtggcgctc aagatcaacc tgccggagtc tagagtccag 300
gtgcgcactc cccg 314
<210> 10
<211> 2213
<212> DNA
<213> 智人
<400> 10
ccggctttaa acgcctctcc agccacctgt gaaccgcgaa ggagccggct ttcgcggcgg 60
ggaccttgcc accagtaccc tcgcgggccg aggtcgttct cccggtcggc ttcccgcctc 120
acccgaaaag gaattagagc atctacccaa gacggtgact ggcagggcag atcaaggtgt 180
cctggtctcg gccccagccc cgcggtgcgc cccgcccgct taccttgacc gggtgcaggt 240
agccatcgcc gcgcagggcg cccaacccgg cgtccgccgg cgcctcggcg tcgtcctgca 300
ggctgcgggt gagatgcgcg atgtaggtgg tggccagcag cagcacgtcc agcttggaca 360
gcttggtgtc gggcggcacg gacggcagcg tgcgctgcag ctccaggaaa gcgtgccgca 420
gggtctgcac ccggctgcgc tcccgcgccg cattcgccgc cgccggccgc ccgctcccgg 480
aacgcgagcc gcccccaggg cccgccggcc ccggcccggt ccgcccggga cgcgagtcgc 540
ggatggcggc ggccaggggc gcgggctcgg cgctggcgct gagggggctg cccgctgggc 600
ggccgcggtc catggcagct tcccgcgccg cgcgcgctgc aaaggaccga aggtgcggtg 660
aggccggggg gcggtcgggc ttaacccgag aggcgcagcc ccctggttct ccccgtgcgc 720
ccaccagcag cccaacgggg ctaagggcgc tctcaagcga gctcgttttg cctgggacgc 780
gatttgcttc cggacgtctg gggagagttg cggaactccg gagttcttgg gcttcctaga 840
aggataagaa gaggcgcagt gccggctttg cttttcaggg gcaaattaag caaaaggtct 900
actctacccg ggaagaaaga tctcggaagc acagctcagg atcagcactc gttcgcgctt 960
gggtgacttt atccaacccg gcacgcacga gaggtggcgc ggctccttct cgccgacgcc 1020
gcggaaaacc acggctcacc agccgccctc ggcctttcac gccagggggg atttctgccc 1080
gaggagcggg ggacccttag cctcacctcg gggtacggca cccgccaccg ttccgagccc 1140
gagagctgcg cagtacgcgt ctgacgggcc cctcaccttt cctggagcgg ctgagtggag 1200
ctccgctccg tcgtgagggc gggcgagggg cgtggagcag ggcctgtgtg gccagggccg 1260
cgctggtcac tccatcctcg tccggccgat gcccaagtcg acggctgttt ccaacctccg 1320
ctggctgtga cttttatgcg ggcgccccgc ggccaggcgt gtgtgctccg accggctaag 1380
gcaggtcggg cggaggacct ggcccaccgg agaggctacg ccgggggctg aggcggctta 1440
gagggtcatt aatcaaaccc tccggcgggg cgggctcggg ggcggggcgt cctcctggcc 1500
ccgcccctcg gctcactgcc tcacgctgct ttccccgagg cgcctcgctg agggcggcgt 1560
gtggagagtt tggggtgtct gccgccggct gcggtggggc cgggctggag gccgcgggtg 1620
aggcctgtgg ttaacctcgc gctgccgagg tcttacctcc tcgagtccag tctgattcca 1680
ggccgcttcc aggccggtgc ccagctgagg cgggaacgct gcagtttggt tgagcgtgac 1740
ttttaggctc tgtgaggaaa agtcgagcgc gccacatcga ggcgctagcc gtttattcta 1800
ccacaaggta aaagattcat gctgtcctag ttaccctaaa gctgggagat acactgcact 1860
tcctaccaga ccccgaatgc tctcagtgtc tgtaattctt taagaagttc ctagagcaga 1920
cagcccttgg atcgtgggca cttctccccg gggacgggga ccctgctgac cgcctccgct 1980
gcccccgcgg gggccaccgc tctttaatta tttgggcgaa acattctttt ctggttttgc 2040
acttgtggac tcacgggaag cgtgacttgc agcgaggcag gacccgatcc caggcttctt 2100
tagaaagcgg acgctgcgcc ccaaggcctg ttcagagccg ccccaggaag ccgtgggtcc 2160
ccgaccgccc caaaccgcag cggtttctgc aggtcctgga cccgtcgcct tcg 2213
<210> 11
<211> 714
<212> DNA
<213> 智人
<400> 11
gcggacgcag tcacgagtcc agggcgaagc aggcagggag gcaggtgggc ctcggtccgc 60
cgcaagctca cacttaggag gaccacgggc cgcatgctgt cgtcgtcaag gcaacgacct 120
cactctgtcc ccaaccatag gcacaaagtc ttgggagaca gatacggccc aggtcagaat 180
gcgttcacgg caggcaccaa cacctgtgaa ggccaagggc tagagagcaa ttagctgggt 240
gagaggcacc acctcccagc tcgtaaggcg cccagtacct ggagcctggg aacctgcacc 300
gctccaacta cccctgggcg aaggcgttgg ccgcggagct gcaagggggg gcggtttctc 360
acccgccccg agagcgccag gcctcccttc ttctgattgg ccgagccgag tcgtcacgag 420
ccatgattgg ctcagggcca accaccccgc cccttcacct agggctcggc ccaggttctg 480
ctccctgaca cgcagaggcc ctgcgtcccc acacgccttg gttctcgtca ggaggcgcct 540
ttctgccttc cccagcggga ggaggcgatt gtgatgccca cgcgaagggt aaaggtggcg 600
gttatgtagg actgcgaaga ctatgcaaaa tgcgatacgg tttccctcat agcatcgccg 660
ctggggcagg ggcgggcgcc gggcgccctg agtcgcgtag gcgcggcctg accg 714
<210> 12
<211> 8078
<212> DNA
<213> 智人
<400> 12
gcgggcaggc ccaagctgcg atgtggagaa ttcgatgtcc gagcgacctc ctcggaggag 60
tgggtcgagt taaatataac cgcgcgaatg gaatggcgct aaaaataagg cagcagctgg 120
cctgtccaca gccctgtccc gggaggggcg ggggccccag tggtcttggg caggaaggcc 180
gcgtccggcc caggggcgag aaggctgcgg cgtccgcagc cagggctgga aggcctggga 240
ggccgcgctc tgtgggcccc ggggcctcca ttcgggctgg gtcgcgggcc tggacgggga 300
ctgtccagag gcatccgaaa gccaggccaa cttgcctgga cgtaacaaga cggaagggct 360
gggcgctgag gtcctgccag cccggccgcc agagggagct gagcgccaga ggaggacaag 420
ccgaaccctt caggaggccg ggcgtctccg gagaccgaag cgccggagga cccgaggagg 480
tctgccccgc gcgctgctct ggagactccc ggggcgggtg gcgctcggcc tttccgctcc 540
cttccttccc acaagtccct tcccgcgcgc gccccacggc cctgcccgcc ctcccgcgtc 600
agcgccccaa ccgtcaagcc agcaattgaa acgtttccaa aacggtctat ttatttgctc 660
ccaataaatc gatcggcggt gattaaagaa tcgatgtggc ctgggtgggc gagtcgcttg 720
aggggaggga ttgggggctt tcgcccggcg cctgcaggga ggccgagggc gggcgcgggc 780
ctgagggagg cgtgtcccgc ccgggccaca cccgaggacc cgacacctgg gctggcaggc 840
cccggcaggc agcgttccct ccggcggaga ggggcgcgcg cccgccgcct gctttcctcg 900
gcccctctcg cctttctcgc gcgccgggga ggctgtggcc gccagtggct gcggagctgc 960
tcagaggctt ttgttgctcc tcggccggct gaatggggat tttgtaaagc gggacagata 1020
aaaatgagca gcatcatatt gtttgacaga atgatctcgc atgatgaagt gtcggctccg 1080
aagggggtga aaatggtgaa ttcctaaaaa cccagccctg ggctcctcct cgagctgccg 1140
gtagcctgga gggacccagc ggacagccgg gcctggccgc atcgctccaa acggtgtcag 1200
aaagactccg gctttcaatg ccaagtcatt tttaagcccc gatcctgtcc aggacctttc 1260
tcctcgtgga tgaaaagaac aattttcgag agaaaggctc gtttttatta aatccgacat 1320
gctgctgata actccatgct aatgtgaaat aattaacata atagccataa ttaaaagcac 1380
gctaacaatg ccataaattt atcacacaat tttactagct ttctgcccct aactgctctc 1440
tcatcgttaa ttaaacgtgt tgccttttac agaatggatg tttatatatt tccaatataa 1500
ataaattcga aaccatcctc tctctcttcc tctttctctc ctcctttcct tttggtctct 1560
cgccatttac aggcacgcct tggcgtggac cctgagtggc agacatcttg aaaataaatg 1620
aagttttgag atgcaaatcc aaacaagaac attaaaatag cctctttttt tccaccccga 1680
aaagatccgg agaggtatac aagggggtag tggtgggtaa gagagttgaa aatcccccgc 1740
tttgggaaat ggaagtaatc tgggtgggtt ggggccttgg gtaccacctc tgccctttcc 1800
caccttcctt ggtggcggcc atccagacaa agaggccggt aatagtttaa caaatctatg 1860
aagattttca agaagcagca gactttgatt gttgcgggcg cgggggtgtt ggggagaaag 1920
gaggggaatt tttctaatag tcccacccac gttttgctcc ctcttggaca aagagtaact 1980
actcttggtg ggggacgcgc ccttcactcc gcggaacctg gtcccaactc cccgtattgt 2040
aagaaaagtg cacccgcgcg cgggcatgat gattctatct cacatcgcgc caacgactta 2100
ttcaagccac tggcactgtc tctgacttaa aagaggagaa aagaggcata tgggttcact 2160
tgggcctggt gaggggtagg tgggcaattc ccgccttccg cactctaacc gtgcccctcc 2220
tccagtgttg accacctaag aacccaaaat gagctgtaat taatttccct ttctccatca 2280
taaatttttc tatccatttc ttccccccca tccccccact ggacgcacac actaaatctc 2340
ccctcccctg gagacgtctc aatttccttc ctatcgatcc ggactccatt cttcttgcct 2400
cctgttgcta gaacctagat ccccactccc cgcacccctc attcccaccg cgtccaggtg 2460
gctttcccag cggggtacca tgtactctgc ccgctccaga ggaaccgaag gggtttcatt 2520
ccattctcct ttggttgaaa catttcaaac atttgagcag gtgaggcagc tggctgccat 2580
cttccttttt aaatctctcc tgggaagttc gcttgttgag actcaaagag tcactcaaac 2640
tcataattgc gtgtgtgtgt ctactcattc tccctctatc tctccaataa ccctttgaga 2700
ctcagaaact ttttatccac atacaccctt tatcacattt tcttcccccc actacatgtg 2760
tctcactttc tctctgtatc tgtctcgctt cttccgtctc tgtcctacag cttggcggta 2820
actgacgacc tgtgagcttt tagctgcaaa ctgcaactac gcggcaaaca atttatttag 2880
cccgacatct agccggtctc cggcaggacc ctgcaccgcg tcgggatcgg acccttccgc 2940
tggggcggcc tcctgcgtca aggccagcag gaaccttcct gtcgccctcc ccggccgccg 3000
cttcgcctcc ttcccgcccc cggaggttgt gcaggcgcta tggtccgcct ggagggagaa 3060
agccggcggc cggttcctga gccgagagcg gccgcggaaa aatcctctgc ctccgctgga 3120
aatcgatatt aggccggcgc gggcgcggga cgtcggggcc gcagccagta ggttgtgcac 3180
gtctcatcat ttagctaatc gagtcgaaaa gtttctgtaa gggccggacc cagcatcaga 3240
tggtaacact gattgaacaa gagattagca caatagatct ctaaccgagg ggaagcgttg 3300
cttttcacgc tacgcgccgt aattaatggt atgaatcaat taatttgact tttattgtgt 3360
cgaaggaaaa aagcgcaaca aatggaaccg gcagctggga gttgttcgtc ctccaccccc 3420
ttccccaggg aggttccaag gagacaccgg ggaatggacg gatcaggctg ggccgtggca 3480
gagggagggt aggaggcagc gaccagcagc gtggagggag tccagagagc tagcctctgc 3540
ggacggcgga atcgaaatta ggctcatttg gagactactt cgagaccggt gaggggagcc 3600
ctgtagccac catcctccgg cgcgcatcca cacatactag tccacgcggg cccagccacc 3660
aaggccgcgg cagggccagc gctgcgcccc gggcccctgc ctttagggct gggcaaccca 3720
agcagagcaa aggaggttcc tgaatgtgta aatttccgct ttttagcttt tttttttttt 3780
ttttttggac cttccgacac ttcggttgct gaggcagttg cagacgcgac ctctgcagtc 3840
ctgggcgatg gccagccagc tcagctcggg tcggtttcgc ggaaagctgt ctagacggca 3900
ttgtaaacgg ttcggagcct gcgggccaca aagctgtgga gctacggaaa tcaactctga 3960
gatgcgtttt agggccgtgt gcaacctcgg gatcatttag ataaagaaaa actgtggagg 4020
ttggcgggcg tctcaggata gtgtcaccac cccctaccct gctcccagcc tcagatgagt 4080
agtgttatat cctgggaaac tgtctaatgg ggatgaaagt caatctgtgt gtctcaatgc 4140
ctgtaatgaa gcaagtttac agatttttaa atttttattt ttattttatt gaattatttt 4200
tggtgtgtct aggccaagga aagaggagat cgtgggtggg gaaacagact gagggaatca 4260
gaagcaccac tgtccatccg gaattaaatc cacatcccag catcttctgc aaatatttca 4320
ctaattattt cctctcggaa ctcctcccct cgtgctcctt cctctggtga ggccggcgct 4380
cccctcccag gccgcagcgg acagacaggg attgggttcc gtgtgcctgc cacaccaggc 4440
aggctcttgc ggctcccaac taggcggcct aaatgaggga ggaaagagga ggcgcatcgc 4500
tgattcaccg cgtcaagagc actgactttc cttggaggtg tgaggtccac gcaccccagc 4560
cacgcacttg ggggtcggtt tgcggtgcct ccccctccag tcccagtgaa atccccacag 4620
tttttcctac tatcactgac ttgccttgca ctccgcgtgc attggccaca catcctcgcc 4680
tcctccaccc gctccgccgc cggttttctt ggaagttaaa tcttggagga tttgtccaca 4740
ccttaagaga agaaaatcca cgttagctgg cagcaacgga gatcccagca tgctggcatg 4800
cccaagtctg cccaggttcc cccaaggcca tgcccgccgc ccgggaagtc actgcccgca 4860
cccctcacgt ttcttcagcc gcccctgggc gctgcgtcta acctgaagac accaggcctc 4920
ttcccggatc cactcgactt acccaggccg ctgccaatcc cagctccttc cccagcgcct 4980
catttccgat tttttcatat gctaagtcgt ttaacaactc caagtagcca gttatggctt 5040
ctttatttat aggttccctg ctattttacg tcgtttttat ttctctcggc aactattcta 5100
gtagattaat caatagccat tttctgacct tcgggaaccc cagctgatgc tttttgtggc 5160
cgcacgaaaa aatacataca ggaaaacacg cccgcatcaa gccgggaaag agcaggtagg 5220
acctgagtgg tttggttggg ggagggggaa aaagacatct cagcaggtgt cttccccgga 5280
atgagcactg aggccagagg ggaatctgaa atctaattag caggagggag ccgggtgcgc 5340
tgctcttact ctttaaagct aaaaacaatg aaacaaaaag caaaacagag actaagtttt 5400
gctttttaaa acacgatatg ggaacctcgt tctaggtcgc ccagtccctg tctaaggagt 5460
gtgacaaagt gggggggaga agggcggaag ggagaggggg cggggaaggc agggcagcga 5520
cagtcgcaca gtcccgcgga cgctcccagg cccacgccct gactcgctca cacccaccca 5580
cactcacacc cacccgctcc ctgggcccca gggcccggat ccagcctggg tgggggggtc 5640
tccgggcggg ccgcagcgcc ctccgtgccc cggggatgct ggcgcacagt gcggagcgga 5700
gttgcgcgtc tctcgtccct ttgttgacaa ttccctgaac caacttgagt ttggccggct 5760
cggccgcggc cctgacgtca cgcacggtca cgtggccccg cctcccgctg gatctttaag 5820
tagaaagtaa tctatcaggc cagtccttaa aacgggactt tcgactaccg gggcttcggc 5880
gtccctgaca cccagccccc tgcccccccg ctactgtccc tgcccgcgcc ctcccgagct 5940
gctcggcgcc cggcgtcccg cgcccgcctg gaccgctcct gcgccccacg ccagggccag 6000
aggccgagga aggcgggcta agtgaggggg cgcggcgtgg agaaccgccg gggccgggag 6060
cggtagcgag cgcctagtac cgagcgccag ggacggcagg agttcgcgga gcgcggccgc 6120
tgggggcgga cggcagagcc cgcgccacgc gatgcggggc cgccgagtgt gagctgagcc 6180
cagcgggccc caagccacct gcggccccct cccctctccc tgccccccat ctttcggggg 6240
cactcaaacc ctcttcccct gagctccgtg gcagcccccg aacaccctca tcgcccgctg 6300
ccccctcccc gccgccgcta ccaaccccga ggagggatga ccctctccgg cggcggcagc 6360
gccagcgaca tgtccggcca gacggtgctg acggccgagg acgtggacat cgatgtggtg 6420
ggcgagggcg acgacgggct ggaagagaag gacagcgacg caggttgcga tagccccgcg 6480
gggccgccgg agctgcgcct ggacgaggcg gacgaggtgc ccccggcggc accccatcac 6540
ggacagcctc agccgcccca ccagcagccc ctgacattgc ccaaggaggc ggccggagcc 6600
ggggccggac cggggggcga cgtgggcgcg ccggaggcgg acggctgcaa gggcggtgtt 6660
ggcggcgagg agggcggcgc gagcggcggc gggcctggcg cgggcagcgg ttcggcggga 6720
ggcctggccc cgagcaagcc caagaacagc ctagtgaagc cgccttactc gtacatcgcg 6780
ctcatcacca tggccatcct gcagagcccg cagaagaagc tgaccctgag cggcatctgc 6840
gagttcatca gcaaccgctt cccctactac agggagaagt tccccgcctg gcagaacagc 6900
atccgccaca acctctcact caacgactgc ttcgtcaaga tcccccgcga gccgggcaac 6960
ccgggcaagg gcaactactg gaccctggac ccgcagtccg aggacatgtt cgacaacggc 7020
agcttcctgc ggcgccggaa acgcttcaag cgccaccagc aggagcacct gcgcgagcag 7080
acggcgctca tgatgcagag cttcggcgct tacagcctgg cggcggcggc cggcgccgcg 7140
ggaccctacg gccgccccta cggcctgcac cctgcggcgg cggccggtgc ctattcgcac 7200
ccggcagcgg cggcggccgc ggctgctgcg gcggcgctcc agtacccgta cgcgctgccg 7260
ccggtggcac cggtgctgcc tcccgctgtg ccgctgctgc cctcgggcga gctgggccgc 7320
aaagcggccg ccttcggctc acagctcggc ccgggcctgc agctgcagct caatagcctg 7380
ggcgccgccg cggccgctgc gggcacagcg ggcgccgcgg gcaccaccgc gtcgctcatc 7440
aagtccgagc caagcgcgcg gccgtcgttc agcatcgaga acatcatagg tgggggcccc 7500
gcggctcctg ggggctcggc ggtgggcgct ggggtcgccg gcggcactgg gggttcaggg 7560
ggcggcagca cggcgcagtc gtttctgcgg ccacccggga ccgtgcagtc ggcagcgctc 7620
atggccaccc accaaccgct gtcgctgagc cggacgactg ccaccatcgc gcccattctt 7680
agcgtgccac tctccggaca gtttctgcag cccgcagcct cggccgccgc cgctgctgcg 7740
gccgccgctc aagccaaatg gccggcgcaa tagggacgcg ccaatggccg ggacccaggg 7800
tccggcggcg gcctcgagca acaaatgcac ctccaggctg cgcgccctgt cccaagcccg 7860
gtcccggtcc cgctgcccaa tcctggactc tgcctctccc caatttcctt tcccctgagc 7920
ccccaacgcc taccttccgc ggcctccatc ccctcgcgca cacctaagct ggtcgagcaa 7980
actcaccgcg cgcccgccgg ggatagcttt ccatacaggt aaaaccgaaa accgaatttt 8040
ccaaaaatgc accccgacgg cgcctgctct tagtaccg 8078
<210> 13
<211> 495
<212> DNA
<213> 智人
<400> 13
ccgcgccctg gaccatccgg gcgtagtccc ggcagcaagg ccttctttcc ttgctagcct 60
gggcctgccg cagacagacc ccagagggag ccgcgcccag cccgctgggc ggccccggct 120
tcccgcgacc ccctccagac cctgggcaga aagagcgccc tgctgtcccg acagagccac 180
tgtgcttttg agggatcctg acacctagtg gctcccgctc ccttctccga agagcaccgg 240
gtcctatctg agcattcccg cgactcccag cccctgatcg cagctaagac acccattcgc 300
gcacccggct tctcccacat cctcgtccca ggggttcagc tgacactggt agtcgcctga 360
gctgtactct ttggggccca ggcgccttgg cgggagctca ccctccctgt ctccccagct 420
gaccctgccg cgcccccttc atctccgcac gctcccaccc ggccccctcc acaggctgtc 480
cagccccgcc cctcg 495
<210> 14
<211> 1192
<212> DNA
<213> 智人
<400> 14
tcgggcctcc gctcgacgga ctgccttgtc cactctccgc ctgggaacgg gggttcgtgg 60
gagcgcctta gtggaagttt gtggagctcg ggaggtggca tgcacaggcg cctcggagcg 120
cggccccgag gggcgccggc aggcgagagg cctgcactaa ccggccgtaa gcacagctct 180
tttgtactct gttttccccc taaagacatc tgatgccccc agtgaagaaa agccaacagc 240
agcaaagcct gatggagagc atgcagcccg ggaagcccag tgactgggag ctggagggca 300
ggaagcacga gcggcccgag agccttctgg caccgacgca gttctgcgcg gccgagcagg 360
acgtgaaggc gctggccggg cccctgcagg ccatcccgga gatggacttc gagtcctctc 420
cggcggagcc gctgggcaac gtggagcgct ccctgcgcgc cccggccgag ctcctgcccg 480
atgcccgcgg cttcgtgccc gcggcctacg aagagttcga gtacggcggc gagatcttcg 540
cgctgcccgc gccctacgac gaggagccgt tccaggctcc ggccctcttc gagaactgct 600
cgcctgcctc ctccgagtcc agcctggaca tctgcttcct gcggcccgtc agcttcgcca 660
tggaggccga gcggccggag cacccgctgc agccgctgcc caagagcgct acgtcgccgg 720
cgggcagcag cagcgcctac aaactggagg cggcggcgca ggcgcacggc aaggccaagc 780
cgctgagccg ctctctcaaa gagttcccgc gtgcgccgcc agccgacggc gtggccccac 840
gcctctacag cacgcgcagc agcagcggcg gccgcgcgcc catcaaggcc gagcgcgccg 900
cgcaggcgca cggcccggcc gccgccgccg tcgccgcccg cggcgcatcc aggaccttct 960
tcccccaaca gaggtcccaa agcgaaaaac agacctattt ggaagtaagg agggtaaagt 1020
aaaaccgaac cgaaacccac agcgtcgacg gccccaggcc tagatctgca ggaagcatcc 1080
cgagttctcc tagcgtggag aggagcgggg ccgggccagg ctagggggcg gctgcgcgag 1140
ccgtcggcgg gtggaggcgg agggagagca ggggcagccc ccgcgccctg cg 1192
<210> 15
<211> 1001
<212> DNA
<213> 智人
<400> 15
cctgggaaga gctgctgggt ggggctgtgg ctgccagagt ctttcccaaa ctagcacaga 60
acctgttttg caaccctggc agggtggagg caggatccag gccaagagct ggtcagcagc 120
tgaccccgcc cctgcctgac ccctgcccct tccactgccg aagagcccct ggcaaatagt 180
gtaactcaga tcgtagaggg tgcagattgc tagaactcag ttccagaagg tttctccacg 240
ataatgtcat gacttaagta cacagttttt ccatttttgt ttcgtaactt gattttttaa 300
agcagtcgct acagaacaga atctagacct gtattttata gcatagctgc ttgcatgtat 360
ttttcaagac ttttctttcc ctcagagtga tgtttgggtt ttgttttttt cctgggaagt 420
tggtgggggt gggagctaca tagcccacct ctttccccag taagattctg gtccctagga 480
agaggggaaa acagctcggg cggctctgaa gaggaaatct caggccctag atgctacagg 540
tcattgttag caaccccagc cgctcccagg aaaccagcca gcagcagcgg agggcagggc 600
tgggcgggca cagggtcccg actataccca gtttgcagtt cggcccaccc ccagcaccag 660
gaatgcccct cccaggctat cgctcctctg caggcttccg cagctcccca gcccctgtgc 720
tcctggagcc tgcctgcctc ctgcccgcct gcgtgactca ctgagggccc cctccctatc 780
tttcactttc acccagcacc cagaagggga gtaatttcct cctccatttc cttcctcagc 840
tcctgggcct tgaagagagt aagagaccct cctcgtgtgc agcctttgtc ttttcatata 900
tgaagctgga gggagggaga ggcacagaga ctaggagggc atccaagtca ccctcacccc 960
cagcaagagg ggagtggggg gatttggaca agaagtgcag a 1001
<210> 16
<211> 2001
<212> DNA
<213> 智人
<400> 16
taaatgagtg aatgaatgaa aattatttta tttttatttg agctttggtt ctgccatttg 60
ctagcagtgt gactcaagag aagccagtaa cccccctgag cttccctagt tcacaaaatg 120
cttgtcatga agtcgacagc ttccggaggc tgcgaggctc gcaagaaatg cccacatgaa 180
tgtgcgctta gggcgtgagt gctcactcca gaaaactcca acacagtgaa aaggcagaag 240
cggtgttttt cttttttaca tttttataag aatatataaa aaatgatata aatggacatt 300
tacggtagtg ggggaaggca tatatctacg ttaaaaggca ggacattttt aaaagctcta 360
ttttctaaat gaaaactacg aaagcggggt gggttgtggc gggggcagtt gtggccctgt 420
aggaccttcg gtgactgatg atctaagttt cccgaggttt ctcagagcct ctctggttct 480
ttcaatcggg gatgtctgca gagggcagaa agaaaacagg cgttagaaac ctgaggtcaa 540
agatgtgtgg cacatcccgc cctcctctct tgccgtccct accggcattg aaatacttat 600
ggataaagtt ctcgcaatgg cttcacgtgc atgtacccgc cgccaccgct ctcccacacc 660
tccctggtcc agcagctagt ccactgcccg cctggctgct ccaggcgcgc cgaccgctca 720
agcgctccag gtccacccgg cggagggcag agaaagcgcg accgcgcggc ccgcagggtt 780
gcaagaagaa aacgagtgtt atataatgag tctcagtggt tgctcacaat gccaggcgcg 840
aaggcgtgaa gatgtggcct ttcccttccc gcatccccag gcatcttttg cacctggtgc 900
ggagtgagcc agccagcttg cgataaccaa agggcgcctc aggctctggc gctcctcggc 960
ggaatcccgt agcttcccta cgcatgcctg cttctacaaa cccacaaatg gtttccgatc 1020
atttctgaaa caaaatggat gctcatttat tcatgtgctc tggcttctgc cttcctctct 1080
aatctcgttg cgtatgggct ccagctcgcc gttcggttct cccgaggcag catttacact 1140
tgagagtctc aagattattt tattcctgag ggagcatttg cacttgaaag tctcttttta 1200
cgtttattcc tgaggcagca tttgcacttg agtttctttc tcccgtagct tgcattagat 1260
tctccgacca ctctttagct tctcctccta ttcacacttc atatttaccc attgcattgg 1320
ttttataaac tcgctctctg aaaatagatt gttatcttcc ttaacgtctg tttcccaggt 1380
cgggcaagat agcttgggac tgtaatccca gtactttagg aggaggaggg gggatgatcg 1440
cttgagccca gataacatgg tgagaccttc gtctctatta aacaaacaaa caaacccagg 1500
cgtcgtggcg tgcacctgtg gtcccagcta gtcgggaggc tcaggtggga gaaccccttg 1560
agccagggag tttgaggctg cagtgagctg tgatcgcgcc actgcactcc aggttgggca 1620
acagatcgac tctgtctcca aatgtaaacc ccatgagggc aagactcttg tttggtctca 1680
ttcaccttgg cgtgcccacc acctagaaca gggctgatca cgcagtagaa tctaaccata 1740
taattaattg tgcttgaaga gggggtgttg gggagtaaga gaaggaaggg aggagggaag 1800
aaatgaaaga cttgtgtgtt tggattaaat atattaggtt tggttaagag tcgttcagtt 1860
tattcatttg cttgtggccc aattcagtag ttttactccc tctcccactt ggctcctcag 1920
gctttttgct cagccctgga accgcgctgt aattggcagc tccttctaaa tcgggacccg 1980
gatgctagct gtaactggag c 2001
<210> 17
<211> 1834
<212> DNA
<213> 智人
<400> 17
tcgctccgga atggggaagc ggctgcgccc tggacggaga ggggcgggga cttcgcgact 60
gcaggcggag ggagggcggg tgtcgctggc gcaggcggtg acagggagac accgccgcca 120
ctgagtattc ctatgcaagt ttcttcatct tcctgtgcat cagtgtttac actggggtaa 180
tgataaatgc tgtgttgaaa aattatttga tggggccatg gaaggaacgg aaggaacggc 240
gtcctggccc gctcggggcc cgcgcacgcc gccaccaagc cgcgggggcg ggtcggaggg 300
gagagttgcg tcagccaggc cgctgtcaga tgacgagccc ggggcgtgac ggggtggagc 360
atccccaaaa aagtgcatgc ctaggatccc gcccagtgta tccctgcgcg cggcgggccg 420
ggctgggcag ctttataaac agccgtggtg tgagcctcga agggaaccat cagcgcctcc 480
tgtccacgga gctccaggtc tacaatggca gcggccgcca gccccgcgtt ccttctgtgc 540
ctcccgcttc tgcacctgct gtctggctgg tcccgggcag gatgggtcgg tgagttcggg 600
gatgtagcct aagcagggcg ggggccaaac ctgggaggtt gtggactgca gcgggtttca 660
gaggagggga ggcttctgga aggaccggcg cgatctccct gaacgaacat cgcggtctcc 720
ccgaacgtcg cggtccctcc gaacgtcgcg gtctccccga acatcgcggt gcccccgaac 780
atcgctgtct ccccgaacat cgcgatctcc ccgaacatcg tgatctcccc agacatgccc 840
agctgaaggc actcagttcc cctcggtggc tcctttccgc cgggtccgct tcctgcggct 900
gctgcttgcc cctcaggcca ggaggtttct ggaaggaccg gtgctgtctc cccgaacatc 960
gtggtctccc cgaacatcgc ggcctctccg aacatcgccc tctctccgag caacgcgatc 1020
tccccgaaca tcgcggtctc cccgaaaatc gcgatctccc cgaacattgc catctcaccg 1080
aacatcgcga tctcgccgaa catgcccggc tgaaggcact cagttcccct ccgcggctcc 1140
tttccgccgg gtctgattcc tgcggctgct gcttgccccg caggccagga ggcttctggt 1200
agcaccggcg cgatgccccc gaacatcgcg ttctacccca acatcgcgat ccctccgaac 1260
atcgtgatcc cccccgaaca tcgccgtccc cccgagtaac gcggtctccc cgaacatcgc 1320
ggtccccccg aacatcgcgg tacccccgaa catcgccgtc tccccgtaca ttgcgatccc 1380
ccgaaacatt gcgatctccc cgaacatcgc gatctcgccg aacatgcccg gctgaaggca 1440
ctcagttccc ctccgcggct cctttcctcc gggtccgctt cctgcggctg ctgcttgccc 1500
cataggccag gaggcttctg ggtggaccag cgcgatctcc ccgaatatcg cggtctaccc 1560
gaacatcgcg gcctccccga acatcgcggt ctccccgaac atcgcgatcc cccagaacat 1620
cgcggcctcc ccgaacatcg cggtctcccc gaacatcgcg atcccccaga acatcgcggt 1680
ctacccgaac atcgcggcct ccccgaacat cgcggtctcc ccgaacatcg cgatccccca 1740
gaacatcgcg gtctccccga acatcgctgt ctccccgaac gtgcctggct gaaggcactc 1800
agttcccctc cggggctcct ttccgccgag tccg 1834
<210> 18
<211> 597
<212> DNA
<213> 智人
<400> 18
acgagtgcgt gcgcttgatc tggtttctgc tctctgggag gtgagtggcc gtgcggggcg 60
gtggcagctg gcgacacctg cgggctgttg ggcaccagcc cggggcgggc gctcgcacct 120
gtcgggcgtg cacaaaggcc cggcgcacgc tgtgggggcg gggcctcccg ggttggccaa 180
tgaaaagctg gcactgggtc ggaggcgcca gccaagtggg gggcggagct tccaccaccg 240
gccaatgggg atctggcttc gggatgtggg cggggtccac ccggtcgcaa cccgttgagt 300
ctctgcacag ctgccgcgct gacgcgtttt ccgcgtgtcc cgagccccgg cggccccgcg 360
agctcggtcc gtgcggggaa agcagggctg acgccgtctg cggagaggac tgcgcagccg 420
ggcttgtgtg gggccgcgcg taacggcagc ggctactccc tgcccaggcc ggccagcaca 480
gggccatggc cgaggcggct gcgcctccgg taagggcgac cctcatggag gcttggggac 540
gtggagccga gtcctgaatt cgccaggagg atgttccacc ccccaccatc tccggcg 597
<210> 19
<211> 481
<212> DNA
<213> 智人
<400> 19
tcggatcggc ctcccacgcg aagcttgctc cccaccagca tccccacgtt ggtggcgacg 60
ctgccccggc cccacggata cttccgcgcc tgtcagactc cctgatgaac tacccttccc 120
agagtaccgc gggagctcgg gctcctgagg gcgacggtcc tctgatggca gatgcgggag 180
aaactctggc gtcaggcggc cctcgcgtgg agcacacgaa gtcgtggctt attctggctt 240
cagtatgtgg ggtggagaag gcgatccacg cagctgcgtc tatttcctgt ggatcaatcg 300
caaaatacgt tctgtaagcc ccgcccccac tgcgtgcggg cggcttttgt ctccacggca 360
accgtcaact ctggaaacgc ctgtctttct ccatggcaac tgtctacgcc gcaggctgga 420
gctgcccatt accggagccc gtaagcagta tgggtgctgg acaaacagcg tgatcgggtc 480
g 481
<210> 20
<211> 1001
<212> DNA
<213> 智人
<400> 20
gtctgtgttc cttttcttaa ctgtaagaag aaggctctgg tttcttcagg ttataatttc 60
attaaaataa ttttattgtt ttctgacctg aaaaaattca gaatatgtat atctgcttga 120
tattttcttt tgggcatctt ggtgcaacac ttaaaatcta tttcattttg tagtttggga 180
gccataattg cagcttcacc aggcttggtt cttcttggcc cgggcccttc ccttcccttg 240
ctggttagta ccagccgagc tggtttgctt tttccctttt tggtactatt ctcctcctcc 300
ttcctccacg ttaccttctg ccacggcctc tcttcttttt ccctccattt tcaatttaca 360
cttacatttt ccctcctcct cctggccctc cctagttttt cccctcccct ggtttctagc 420
tcctttttgc tttctgtttg tgttactgag ggcagtgctc caattacctc atatttggag 480
agaggaagct gcagccaatc cggtttctgt ctgcttttag gtcaagtgat ttctgaactg 540
cagtgagatg ctttgaattt gtcttgttgc agctctgagc ctgtaagatg gctgtctgaa 600
tcggcagcgg ctggaagaga cagagagagg cggggaggga gggagaaaga attggaggga 660
ttgccggcat agtgcatgtt tttaaatgtg catcgaatcc gatgaggcca aggttgggat 720
ttctgtggga tcccaggact ggcttagctg cgtttttgct gagattagga gaggaaggaa 780
atgggaaatt cactgggctg ttttaaggag ccgaaagagt caatagctat tcctgagaag 840
gctcccatat ctcctaagaa aagggttcgg ttcaaaagga ggtggagagg gaagaaaatc 900
cctactccag aggcatctca ccaggaagaa acctcagaag gaactggagt cattgaagag 960
actgaaaccc taacgaagtt aacagagagt ctccaaaagg a 1001
<210> 21
<211> 206
<212> DNA
<213> 智人
<400> 21
acgccaccgg tcgaggacgg caggagaccc ccgagtgcag agaaagctca aaccggcagc 60
gaagtcggtc ctagccaagc tgaaaaaacg tctcggattt cgcggacagc ggcctagaca 120
cagcccgatc ttccagtcct agtgccctgg tcgagacggt tctatccttt tgcaaagaag 180
ccggaaagag ctgggtcccg ggggcg 206
<210> 22
<211> 2001
<212> DNA
<213> 智人
<400> 22
acccttgtag gccggatgcg gtggcttacg cctgtaatcc cagaactctg ggtggctgag 60
gcgggtggat cacctgaggt tgggagttca agactagcct gaccaacatg gagaaaccct 120
gtctctacta aataaataca aaattagccg ggcgtggtgg cgcatgcctg taatcccagc 180
tactcgggag gctgaggcag gagaattgct tgaagccggg aggcggaggt tgtggtgagc 240
caagctcgcg ccattgcact ctggcctggg caacaagaga gacactccat ctcaaaaaaa 300
aaaaaaaaaa atagaacaac ccttctaaat gtaatccaca gctcactcac cttagtccac 360
acaatgacca ccacattttg gatgtctcca ttctgaagca ctccccagat ttccagacct 420
gggtgttcag ccacctactt aatgcctact taatgtctct gaaacatctc aaactcttac 480
atgaccaaat aaagctcctg ttgtctccag tgaatattac tgttaatacc aacttctcca 540
tctcagttga agaaccatgg ggtcatcgct gaatcctgtt tcactccctc gctgtctaca 600
tcagaaaatt tagttgctcc ctttaaaaat ttgcatccag aatgcaacac atctcctaat 660
caatgactct ggtccattac cctggactgg ctgtagcttc cactctgatc ttctttcctc 720
ttccctcaac cccacagtct gctctccacg ctaacgggat ggaccctgtt aggactttgg 780
taagatcacc tccctcttgt aacccaaatc tctcattacc tccagaatag gtacccaact 840
tctcaggcag ccactgcagt cctgactcct tccccctgct ctttgttccc agctaaaagg 900
aaacagatct atggtttcct caaaaatctc agcttagttt tactaagcac ttgcgcctcc 960
tgataccagt gccagagata acctttcaca agtttccact ggctgacaaa aatgggaaca 1020
cctcagtata acccctgtaa cctctggcat ggacttaaga gccctgggct tggaatttct 1080
ccagggcacc agacccagga ttggggtaac agcacttaag aatactagga aaccacaatc 1140
ccaagaacat gggggtagag gctactgagg gaccgaacac tctccacttc cctatgtgag 1200
ttccatacgc ccttctacaa ctgggagaac cagggaaaga ggaatgcatc cctggtgagg 1260
ctagatgagc tcaagcctcc ctgtagccct gcctggccct gaactcaggc tggctgtttt 1320
actttctggt ctcagtgctg tcacctcttg ccaactgtag ggcaatgaaa aaaagatgta 1380
gcctcccact atctcaatgt cctcatcgcc ccatcgctgc tcttcctgtg aacagtcttt 1440
ggaaaagttt ttaaacccta acatagggcg ggcacggtgg ctcacgcctg taatcccagc 1500
actttgggag gccgaggcag gaggatcact tgtcaggagt tccagaccag tctggccaaa 1560
atggtgaaat cccgtctcta ctaaaaatac aaaaaattag ccggacgttg taatcccagc 1620
tgcaggcttg taatcccagc tgctggggag gctgaggcag gagaatcgct tgaacccggg 1680
agtcggaggt tgcagtgacc cgagatcgcg tcattgcact ccagcctggg cgataagagc 1740
gaaactccgt ctcaaagaaa aaaaaactaa cataaatggc gtccctcctt tgttcagaac 1800
tctccgtggc ttctagcatc ctcacaatga cagtacaacc ctaggagtaa ctccgcctca 1860
tattcttcgt tccctgcaga aaacagcttt ccgaattctc ctggctcagt cgcgcctcaa 1920
cctttgcacg cgccggttcc tccgcctgtc acgctctccc acacctcgtc acacgcagtg 1980
tcaaaaaaag ggccccaccc a 2001
<210> 23
<211> 561
<212> DNA
<213> 智人
<400> 23
tcgcccggct caaccccgac gtccgcgccc cggccgcctg ttggccatgg cgggcctggg 60
cctgggctcc gccgttcccg tgtggctggc cgaggacgac ctcggctgca tcatctgcca 120
ggggctgctg gactggcccg ccacgctgcc ctgcggccac agcttctgcc gccactgcct 180
ggaggccctg tggggcgccc gcgacgcccg ccgctgggcc tgccccactt gccgccaggg 240
cgccgcgcag cagccgcacc tgcggaagaa cacgctactg caggacctgg ccgacaagta 300
ccgccgcgcc gcacgcgaga tacaggcggg ctccgaccct gcccactgcc cctgcccggg 360
ctccagttcc ctctccagcg cggccgcgag gccccggcgc cgcccggaac tgcagcgggt 420
agggaggccg ggcccgcagc tcccctggct cccccgggct gcccgccgcc tgaccctttc 480
ccatgtggct cgaacccctt tcctcagccg ttctactttt acgttccttt tctcagtcta 540
aaagtcgagt tccgctcttc g 561
<210> 24
<211> 2001
<212> DNA
<213> 智人
<400> 24
gaaagttcct ctgttgctct gggagagggc gggggagagc aggctcgaga gccaggctcc 60
tccgaggctg gtcttgaggc acttctctag tagcttctcc aaaagactga gagtgccggc 120
gtaggtatga cagtgagggt acctcacaga cccttctcca aagtctggcg ggccttgggg 180
tttttcgggg ccaccaggct cggtggaatt tttgaaacgc tttcgaaata catagtttcc 240
tctgtggagt gagtgcctac aacgcgcagg ccggactgat cccccgttgc tgcaggttgg 300
tgccccaagc tgcgggtgct cgggcgccaa ctaaagccag ctctgtccag acgcggaaag 360
aaaaatgggc tgtgaaaaag caaaaggcct cgtctttgaa tgaaagttaa acattaaaat 420
ctgaccctag agttgtctaa agatcgcgga attttgaagc tccggcagag cggactaaaa 480
aacggtgcta tgagagatgg tgagaatact ctaggcatga acgtgtgcgt gtgtgtttgt 540
gtgtgtgtgt gtgtttcatt cttcccgcaa aacaattttt tgtttttttc ctattcccgg 600
tttgttatcg gcctagggcg ggagaaccac gcagcggctt ctgggcccta aggacaaaag 660
agttaaaaca atgaggctca cccgggaaga gacgctgccc tgggcacaat agggtcgcct 720
gcattactcc tccatacaca catctttaaa tgtgtccctg tgtgtgttcg ttagggtgct 780
gtattacaga aaaagaaagg cctaaaaaca cccccagccc tggtcgcgcc tttcgctacc 840
gcctgagtct ggagccgaca gctccacctc ttctgctccc tggaccgccg cgtctccacg 900
ccacggcgcc ctttttacta aaagatcttt tctcatccta tcagcaaatc gttaagaaag 960
gcttagccat tgcgggggct ccaacttaag gattcccccg gcccactaaa aggctaggcc 1020
cggcctgtag cccagctccg cagaaagcca gagggtgctg ggctttcagc ttcttcctcc 1080
tagacacttg ccccacaaat atatttcgtt ttctctaatc caaataccca tctttttctt 1140
ttttaaaaaa tgataacgta atgggaaatg accaaccgaa ctctgttaca taaagttagt 1200
tctgttagat cttccacccc acccccatcc cgcgggagcg agtaaataga attcatgagc 1260
ttagctcccc aggttcacgc tctggaatgg tttctttttg cctcattccc taagttttct 1320
ctcttctgcc tcctgaatgg agctcaggct aaggagaacg gcagaaagag caaactctga 1380
tctgaatctc taattatgac cccatgtatt acccatttga acataaggcc ctagacgggc 1440
tccgtgcgat ctggggcctc ccaagagaaa acttccccgg gacaggacgt ctgccacgcg 1500
cagctaaaca acttctgttt tttccgccgt ggggaaaata aaagaacctt acaaattcta 1560
aggcgtcata acccctgcaa gaacttctaa ctgtatgaag gcccacgcga gattttgaca 1620
atagataaat gagctgagga aatagggtct ggccagcgaa gggaaacaca cagtagccct 1680
gggtgccttt ctggaatgcc cacgcagggg tccgcgtgga caagcacttg cattcaaata 1740
caggaaaagg cttggacggt cgaaataaat ctccttttaa ttttcttttc atcgactaat 1800
aaaaataatt ccccagcact aaactcaaat accgtaacgg gccacaaaaa cacggagaat 1860
tcataaaact ctatctctgc aggtcacccg ctaatcgcat tattattagc ctcgggagca 1920
tggaaattga actgtcactg cctaaagaga aaatgtaagc gacagctgtc cctcctctga 1980
gttggacagc tttgtggctg a 2001
<210> 25
<211> 2001
<212> DNA
<213> 智人
<400> 25
gggcagaaat gaaatcaact gtggcaaggc cttggctgct ttcacggagg agtttttctg 60
cgccagtgtc tttttccttc cctttaaaat aaaattaaaa atagcaagca cttctcaggc 120
attcatcaga gatagataga tgcacgagga ttgagtgggc attttcataa agaatgaggc 180
cggctgttat agaccggcgg cctagcagat gaaaacttaa ttagcgtgcc tgtcctaaaa 240
cctaggcata aatctccctc tgccttttgg ataacgctat atctttgctt atgagaaatg 300
ggatgtgagc aactcgctgc acatttctct gattctccag gtcttggtcg gctgacacgc 360
attcgatcaa gtttaaagga atgcgcataa atcagcaagc ccctagcgtc tccttgggag 420
aggtccgcaa atccaggagg gcgcctctga acccaccggg tctggggatt agcagtccag 480
ggcaacctcc gtctctgctc ctgaactcgg gaattcacag aggaagcaag acactgcatc 540
ttcaccaagg cctccaaaca catgcagcag agtgcaatct gcacttacat gtattacaaa 600
gtgaaatctg tgtcaactct ccgcacacaa atgttgcatc tgcagctgaa tttcactgcc 660
tagtggtgaa tttttaagaa aagatttcaa ctaggttgtt ttaatttttt tcttcccttt 720
tctgttaatt ttttttaaaa acccacaact tgaataactt gaatgggtgg cttcagctct 780
gcatcagtca caaataggag tgaaatgcat agcgacattt aacaatcatc cacttaaaat 840
aagtaaataa atatgatagt actgagagca gatagaaaaa gtagcgtttt tttttaaagt 900
cccattttta ttttcttaat tcaggaagag ttttcttttt agaaaaaaat actttaatca 960
ggctttcaac aacattatcc atgggtcagt ggctgatact attattccta tttttcagga 1020
ggtggctggt ctctccttga tttttgtttt tgtttttgtt tttgttttaa ggttttagac 1080
tgattgctat ttgggcatta aaggagccat aataaataat ccatgcccac tttaggttat 1140
ctggtagatc cacagaaatt ttaaatagga ggagagttag gtaagatcga cactatcaat 1200
gaccatttta gaactggggg gaaaaaatcc ccacaacaac cctgaaatgt cttctgtcat 1260
tacagtttca aaaactagag agagaaaaaa agaaggctac tactttaccc agggttcctg 1320
tagtggtgat ggctttcgaa aggggcggga tcccggctgg agagctgctg ttggcctcct 1380
tcctaggctc gaggctcaga atatttctta catctaaaga aaaatatccc ctgtcaacag 1440
aagagtccct tttggagctg ttcttaaaca cacagtttga tccagctttg aggggatttt 1500
ccaccacttt aaacattttg ggagaaagtt gttactttgg cttgatggca gctcatttgg 1560
aaatggagta ctgtttggaa caagaggtgg agaggtgggt ctgaagcaac attatcattt 1620
gtttccacaa gtggagtgaa aatcctcagg gcagcaaaat ataattgaat ttctcgagac 1680
ctttcgatat gtatgtttca acaccagcct gtttttgaga cagctttaga gactctttcg 1740
taattctcat ctataaagaa gttgtgagtc ctcaggagag gttggagagg tttccggcag 1800
ccacttttgt aaccaatcaa tattattttc cataaaatga tgaatctggt tcttccattc 1860
actattactt tcctctaacg taaagataaa attagcctgc atctcacaat tctgcatccc 1920
acggctactg attccaccaa cattttaata catatgcgca tagcatagat ttgacaaaaa 1980
cacattatcc tatgtgtata t 2001
<210> 26
<211> 516
<212> DNA
<213> 智人
<400> 26
gcggcatccg ggatctggcg ccgcttttgc gtcaggcttc tgcctgagct cggttagggc 60
ctcaccgacc tgcttccacc cctcagggag gcctcagtga ttcggccaca gcctcagcct 120
ccgtcgctct gtgacctgcg ggtattggat gattcgtagc taagactcta cgacatccct 180
gaagccggga aatggtgagt gtgccgggca gggcgtccgg aggcgacgtg gcggggaggc 240
cttatcggaa ccagcgggaa atggcggcag cggtacccag tctgcgaacg gagtccccgc 300
tgccgccgct cagccctcgg tcctcagtcc cctccggtga gggacccgcg ctcctgtcgg 360
gggacccgcg ctcctgtcgg ggtccccgca aggctgctct ggcccagcct gcagccctcc 420
ttgtgcagtt ttgcgcccgc agccccgcac cttccccggg ctgtggggtg aggagtagct 480
catctggaag acgcctgcgt cgcgtgcgcg atgccg 516
<210> 27
<211> 329
<212> DNA
<213> 智人
<400> 27
acgaacgcct cagtgtcccc gaccctgggc agcggggact cgagcaggcg cccctcactg 60
atggctttag aacgtgggtg ggggaaggtg tgtgaggacg ggaagacgcc gcactcacct 120
gagttggcgt cctcagagtg gccgctgcca tcagactctg cgggtagagc tgggccggga 180
gcgacgggcg acattggtag ggacccgggg acagcggtcc ctatcccagg cctgacgtgg 240
gtcccccagg gcggcgtcgc caaggcttag acgctttcgt gcaggaggga cgacgactcc 300
cctcacgcct tcgtggcccc aactcggcg 329
<210> 28
<211> 4240
<212> DNA
<213> 智人
<400> 28
ccgcagaaat tactcgtgcg caccatttcc gctgtggggg cattcgtaca agtttccgct 60
gcacacacag cctcccgggc cctctcctcc aaggctctgc cggatcttcc aacgaaatcc 120
cagagcagcc tgcgctgggg agcccgcaag tctctccaga tctctgcacc ccgcaccgcc 180
cggaatctgg gacggcgccc acgcagggct gggccaaggg cagagctcgc accctgcctt 240
cacgcccggt tcacttgcgt ccacgaaagc agcgtgccgg cctcctccat cttcccactc 300
gcgcaacgca cggcgacccg cgcgacactt ctgcaatctg aaggcttgct tcttacaaat 360
aaagggccag agtctcacac ttgccttcgt tggagggact tagaagatcc tccccacgtc 420
cacaccttgt aggaaatgca aaacagatcg atgaaattaa acagttgcat ttggaagccc 480
cagaaagacc taaagacatc gtgccggttt gttggagaga gggttgcggg acagggggag 540
cgggccttac gcaacagaaa aggtgggcac agcgcgctca aaatgaccca gtgaggagtt 600
ggtgccgccg ggccagaggc tgcgagtcca gctggctctg gacttgctcc gcaggcgtca 660
gacgccgtgg gaacctgtgt ctgcttcttc tctccaaagt gtatcggtta aaaaaaaata 720
aaagtagtag tagtagtagt ggtaaggaaa aaaataaaaa taaaaaggag acacaattaa 780
ccaggtcata aaagctaggg caccttcgac cagggctctg gccctccagc gatcgttttg 840
cgttgtttct cttctcaaaa gtagtctcag acccctgcct ttccgctgca gctctgcgac 900
ttccccaaac tccttaatcc tgtaaattct gcaagaaact cccatcctgc aagctgcttt 960
tccccctccc ccctgcgttc cttttttctc tccccacccg cgccgcctct ctatgcccct 1020
ctcttctcag aaaaattcct gccccccgcg cgccccaaag cccgggctgc aaacttttcc 1080
ccgccgggcg cctctgcgcc agatgccgga gcgtctccac aaagcctgag catctgcaca 1140
agttcgcagc ctaactgcgg gataaagacg tttcccccgt agcttaacta gaaaagcgcc 1200
atcgatgggt gtgttaaacg ggataactag agatttcaaa caccttttat ttgcctgtct 1260
tgaaaaaaaa atctaaatga atacgcccgc taccaaaagg caaaataaaa ccaaccttaa 1320
gggtttttgt tgtttttttt ttttttcaaa agtggcgata gggactgttt ggacctgact 1380
ccaacctgcg ccctcccttc ctctatgacc ctcctgcgct tttcctggaa cccaaagctc 1440
tgacttcgtc aaacttacac aattaaaggc aggcggaaga acgcgggctg ggaagcaagc 1500
gggaagattc tagaatggaa gggagcccgc cgagcgccgc gagccgcgcc aggccgggtc 1560
cgatggagca ggcggggatt cctcccccag gcggaccccc gccaccagcc ctgccgggag 1620
ctcgcggcct gcggagcgcc cgggctggcc gctcaccgcc cgcttccccc agcgaacgac 1680
tcggggaagc tccaggaggc catctgtgct gacggttcac accagacagg accacttgca 1740
aggacaaaaa taagaaattt aggaaacgaa aaaagacgta ctggggcgag gggcgcgggc 1800
gcggcgacga cggggccggg ggcacatcct ggcggccgct cggggagaga ggacacgcgc 1860
gggaaggagc gcggcgggtg cacggccgcg ggtgggagta cgcgcctgtg cgcgcggggc 1920
gagggcgagg gcgcgtgcgt gtgaccgcgg ggagggggcg ggcgcgtgtg cggggagcgc 1980
gccgcgccag gggccgagtg tgtggggccg atccagaagt gcgcagcccc ctcacctggc 2040
ccccgtgtca tccccgaaat cccgggaaag ggtgggccgc gcgcgggagt ttggtggagt 2100
tggaactttc ggtcgcgctc gctgcccact ccgctggcgc ccggtggccc gtggtgaagg 2160
gggactaggg tggggaacac cggggccctg cggtcccctc cctttcctgt atttaagaag 2220
ccgccggcgg cgcagaggcc caggcgggct ggcgcggggg cgaggcggcc cggtggcagc 2280
agcgggcggg gcgggcgctc cggagtcggt ggggcccgcg ggttgggggg cggggagagg 2340
ggggagtgga agggaggggg aacgcagggg agggagagga ggggaggagc cgcgcggccc 2400
gcgccgcttc cgaaccggaa agttggtctt gccgaagtcc tgccaccccg gcgtgcgcac 2460
tccgctccgc tccggccgcg agcctccgag cccggccggc cgccggggga agcccgcgga 2520
ggggacgcgg ggccgggcga gaaggtccgg agagcggggg gcacctgagc ccgggcgggc 2580
ccgccgcgct gagcggcgct gagagccgcg gcggagcagc gaaggcggcc ggccgacccc 2640
gcgcgcccgg aacaggaggc gcggcgcccg agcggcccgg gcgagacaaa ggcgccgggt 2700
cggagccctg cccgcggccg ctcgctccgg gaggggccgc ccggcggcgg cggcgggggg 2760
ggcgcgggcg gcggcgcaga cactctataa aggggcgagc ccggcgcgcc ggcggagacg 2820
gcgccgcgcg gacgccgcca aagtttgctg cctgcgccct gcggagggac ggccaccgcg 2880
gcccgcgccg cacccgggcc ccgccacagc cgcacccggg gcggccgagg agcgcggcgc 2940
cggagcccgc gatgtgaggc ggcgccgggc agcgcgcgcc ccggtcccga ggcgccgcgg 3000
ccccctcctc gtcggcgcgg ccgctaattg cgagcgcggc ctcatttgca taggccgccg 3060
gagtccgctg gagcccggcc aatcggcgcg gccctccgct aatggccatg cattattcac 3120
cagcctaatt gctcagcccc atgcgcggcc cgcgcagccg ccgccgcccc gcgccccgcg 3180
ccgcgcgccc gccaggccgc cccgcgccgt ccccgccggc cgccccgctg atgccgctgc 3240
cccgcgcggg gcccgagcgc cgctagcagc atgtctcggc gcaagcaggc caagccccag 3300
cacctcaagt cggacgagga gctgctgccg cctgacgggg ctcccgagca cggtgagggc 3360
cggggctgcg gggtggccgg ggggtctggg gctgcccgtc cgggctgggg aagcgcgtgc 3420
ggcgggagcg gatgcgcgcg tccgggagcg ggagaaagtt ccctgcttcc tgcgggcaag 3480
cgtccgcccc gcgccaggcc ggccgcgggg ccccgggtac ttcgccggag cgcgcgcggc 3540
cgccgagaga gttgtgggcg aagtaaactt ggctcctctc ctcggagtcg gggagctgcc 3600
cgcgaagggc gccgaggccg cggccggctc gaggacggct cggaggccgg ggcgggaggg 3660
agtccacggt gcctccgccg ccgcgccgcc ccccagggtc tctgcgccag gacgctgagg 3720
ccggcggcgg cggggaaggc gaccgcagcc cacctaccgc tggacgcggg ttggggaccc 3780
cgccgcccgg ccagctttgt tcgggggccc gcggcccctc ccgggccccc gcaccgcctc 3840
gggtgacccg cggtgtccca gcgcgttgac gcagcctgtg atccctcgcg aggcgaggag 3900
aaggtcgggg gcttggctct gcctaatggc cgcccgggga attaagctgg gggtgagcgc 3960
agcggcggcg gcctgggcct ggcccctgct cgcggcgtgt ttccggggcg ttcgttgcag 4020
cgtctgcgcg ggccttttct ctcccgtctt tttggatccg ccgaggccgg gcgctggaga 4080
cctcggcttt gcagtcattt cgctggtagg agcgtcctct tcgaaacatc caagagcaaa 4140
gggcaggcgc cgcgaaagtt aagagactgg caaagggctg gacttcccag agtggcgcct 4200
tagccccgca aagtttgggg cgcccccacc cccttcgtcg 4240
<210> 29
<211> 2188
<212> DNA
<213> 智人
<400> 29
gcgcgcgcgg agcccgctga gacttgaatc aatctggtct aacggtttcc cctaaaccgc 60
taggagccct caatcggcgg gacagcaggg cgcggtgagt caccgccggt gactaagcga 120
ccccacccct ctccctcggg ctttcctctg ccaccgccgt ctcgcaactc ccgccgtccg 180
aagctggact gagcccgtta ggtccctcga cagaacctcc cctcccccca acatctctcc 240
gccaaggcaa gtcgatggac agaggcgcgg gccggagcag cccccctttc caagcgggcg 300
gcgcgcgagg ctgcggcgag gcctgagccc tgcgttcctg cgctgtgcgc gcccccaccc 360
cgcgttccaa tctcaggcgc tctttgtttc tttctccgcg acttcagatc tgagggattc 420
cttactcttt cctcttcccg ctcctttgcc cgcgggtctc cccgcctgac cgcagccccg 480
agaccgccgc gcacctcctc ccacgcccct ttggcgtggt gccaccggac ccctctggtt 540
cagtcccagg cggacccccc cctcaccgcg cgaccccgcc tttttcagca ccccagggtg 600
agcccagctc agactatcat ccggaaagcc cccaaaagtc ccagcccagc gctgaagtaa 660
cgggaccatg cccagtccca ggccccggag caggaaggct cgagggcgcc cccaccccac 720
ccgcccaccc tccccgcttc tcgctaggtc cctattggct ggcgcgctcc gcggctggga 780
tggcagtggg aggggaccct ctttcctaac ggggttataa aaacagcgcc ctcggcgggg 840
tccagtcctc tgccactctc gctccgaggt ccccgcgcca gagacgcagc cgcgctccca 900
ccacccacac ccaccgcgcc ctcgttcgcc tcttctccgg gagccagtcc gcgccaccgc 960
cgccgcccag gccatcgcca ccctccgcag ccatgtccac caggtccgtg tcctcgtcct 1020
cctaccgcag gatgttcggc ggcccgggca ccgcgagccg gccgagctcc agccggagct 1080
acgtgactac gtccacccgc acctacagcc tgggcagcgc gctgcgcccc agcaccagcc 1140
gcagcctcta cgcctcgtcc ccgggcggcg tgtatgccac gcgctcctct gccgtgcgcc 1200
tgcggagcag cgtgcccggg gtgcggctcc tgcaggactc ggtggacttc tcgctggccg 1260
acgccatcaa caccgagttc aagaacaccc gcaccaacga gaaggtggag ctgcaggagc 1320
tgaatgaccg cttcgccaac tacatcgaca aggtgcgctt cctggagcag cagaataaga 1380
tcctgctggc cgagctcgag cagctcaagg gccaaggcaa gtcgcgcctg ggggacctct 1440
acgaggagga gatgcgggag ctgcgccggc aggtggacca gctaaccaac gacaaagccc 1500
gcgtcgaggt ggagcgcgac aacctggccg aggacatcat gcgcctccgg gagaagtaag 1560
gctgcgccca tgcaagtagc tgggcctcgg gagggggctg gagggagagg ggaacgcccc 1620
cccggccccc gcgagagctg ccacgccctt ggggatgtgg ccggggggag gcctgccagg 1680
gagacagcgg agagcggggc tgtggctgtg gtggcgcagc cccgcccaga acccagacct 1740
tgcagttcgc atttcctcct ctgtccccac acattgccca aggacgctcc gtttcaagtt 1800
acagatttct taaaactacc actttgtgtg cagttgaagg cccttgggca caatgagagc 1860
cagtcctcca aactttcaga aagtttcctg ccccttctgg caggctgcca atcaccgggc 1920
gggagaagga aggaggggaa ggcggtggag ggagcgagac aaagggatgg tccctcgggg 1980
gcggggatgg cggggctgtc ctgtaggtct gtgcggccac cgtgattgcc cctctgcgcg 2040
gtgcccgaag tcccgctgaa acctgccgag ggcagcaggt ctgaaagctg caggcgctag 2100
ttgcgcggag gtggcgcagc tgctctggag gcgcagagcg aatacgtggt gtttgggtgt 2160
ggccgccccg cccctggcgg tttcctcg 2188
<210> 30
<211> 2933
<212> DNA
<213> 智人
<400> 30
gcgccggtcc ggagccggag cgcgggaatc actcgctgcc tcagcccaag cgggttcact 60
gggtgcctgc ggcagctgcg caggtggaga gcgcccagcc tgggaggcag tagtacgggt 120
aatagtagga gggctgcagt ggcagaagcg agggtggccg cagcacttcg ccgggcaggt 180
attgtctctg gtcgtcgcgc accagcacct ttacggccac cttcttggcg gcgggcgccg 240
aggccagcag gtcggctgcc atctgccggc gctttgtctt gtagcgacgg ttctggaacc 300
agattttcac ctgcgtctcg gtgagcttca gcgacgcggc caggtctgcg cgctcgggcc 360
cggacaggta gcgctggtgg ttaaagcggc gctccagctc gaagacctgc gcgtgggaga 420
aagcggcccg cgagcgcttc ttgcgtggct tgggcgccgc cggctcctcc tcctcctccg 480
cgacgcctgc cggcccgctg ccgcccccgc cgccggcccc gctgcacagc gcggacacgt 540
gtgcacctct ggggccaaca ccgtcgtcct cggtccttgg gctgcggtcg cctgcggacc 600
ccggtgggaa cagaaacaag agactgtcag cgccacagac gaggtgaggc cgggcctcaa 660
ctgcaggggt cacgggagtg gggcggaaat acactttgat cccactcaag cggagcggag 720
gtctgggagg ccctgggccc gggagaccag tcttagactc ttgccccact gggtatccca 780
tctaggcctc ttctggggag ggcggcagac tcagccgctg tgtcaacgct gtgttgtcga 840
gaccagctcc ccaccctctc tgggccccag gctcccctca gtaacttggg gcactcgacc 900
cgagcatccg cgaaagccct cccggctctc agcgttgagc attgggattc tagactgcat 960
ttccgtctct ctgcttgggt tcacgcgcct ctccacactt agttcacacg cacacacgcg 1020
cgcgtcctcg cagcacacac ttgtctggtg caggtaaggg aaggtggagg cggatcctgg 1080
ggccaaaggt atttagaatc tttcaccctc agccgcctgg gattgctgtg agagacatgg 1140
aaacaggctg agccgaggcc ttagatgaga ggatggactg gagagtaaag agggagggtt 1200
gcccctgcat cgagtttttg gaccctgatc ccacaccagc ttctcggtct cgtacccgcc 1260
cttccgaaga actccagcag aaaggtccag cggtcccctg tgcttgaggc ctacagaagc 1320
ttgtacccaa ctagggcagg cacccgggtc ttccagacca caggacagga caggccacgg 1380
ctgaggaggc ctctctcctg cctccaggat gaactaaaga cccaatccgg gatcttcggc 1440
ctagggctgc tctcccagac ctggggtctg agaaagccaa accagccctt tccccaaagc 1500
tctagttctg cagattctca gctctggccc actcggaggt gttcttcacc acctatccac 1560
ctactgtggg gcccggccct gggaccttga actggcaggt ctctggtcca gagctaggtc 1620
actggctacc tgaggtctct gaacccctca cttttccgct tccctgattt tggggatttg 1680
gggacagaca cggcagaaag cactggcgac gaactcaaaa actcccgaac gcaaggggca 1740
gcggttctcc caacccagtc taatgcacat tggcccagga tgtctcaggc ctcaccccag 1800
gacgtagggc tctgaggagc tactccggtc tctcgcgggc tcagttcccg aagtgataga 1860
gcagctcgcg ccagagcgca gaacttcggg atttggccag cctccgagcc ccagggcgca 1920
gggtgctcaa gccgaccacc ccactcggcg tggttgccct ccgcgtccat cccctcagcc 1980
cggcccccat ccccgcgaag ccgcagcaga cctgagacgc tggcggacat ctcgctgtcg 2040
ctccggcccg cggcttcctc ctctaggtct ttggaagcgg ccagctcaca gaccggctgg 2100
ccgaggctca aggatccccc cgcaaggccg gccccgctgg ccccccgcgc gtccgcgcag 2160
cgccgcctgc tctcgttctc ctcgctgagc gcggagtccg agtcccagcc ttccgggctc 2220
tccgcagtcc gccccgcagc tgttctggta ccggcaggag acgccagcag agagtcctcg 2280
gcgcccccca acgcgcccgc gtccctctcc ccaaagagcc gccaacagca gacagcggga 2340
gccgcggcca ccgatgccgc tgtgcccccg ggcgccgggc gcccctctgg cgcggccagc 2400
ccgccgcgct cctctttctt gttgaggatc gcctggatgg agaaggacgt caaggtgttg 2460
gcgccgcgca cagccatctg cgccgcgggc aggagcggcc ggcggggcgg gcagctgggg 2520
cgccgagcag ctccgagcgg gacagagagc gccggcggcc gcagcgcgag tgagctgggt 2580
gtgcgaggcc gccgccgccc actgctgcgc ggcccagcag ctcccgcccc actccgtccc 2640
aggatcagcg ccgaccctcg cccccacctt agaggcccac cccgcccgga gaccccctcc 2700
ccccgaatcc agagccagac gctctccttt cgcagctcag ctggattatc tcatcgcttc 2760
tcgcccttag gggcgggctg gggtctgccc cctcggggga cgtgaaggag gattggcggg 2820
ggcccctccg tggcagcagt cccctcccga gcgccgccgg ggcgcacagc ccgagtcact 2880
ttttctttgc gcgtctgtcc cttcctcgcc tgcaggattt cgctcctggc ccg 2933
<210> 31
<211> 2001
<212> DNA
<213> 智人
<400> 31
agtgtcacat caacaaattt acacatcaat ctaccgcagc taacttcgta acaatgggag 60
aaacattcag aataatactg agcatcctac caagggtctg aaaaattgaa ttcaaatact 120
ctgtgtgtaa aatgcctaga ctctgtcatt ccagcacatc tatgatctga tctagcaagt 180
atatcgttag actacaaatt acctttttcc tatgacgtgt aaaactccat taaaaatgaa 240
ttcttcctaa taaagttttt tatggcgtct aaaattgctg tgaatgttac accttttaca 300
atcacctttt agccagaaag ccattatttg tagaatcctc ctgtatttca gttatttgtc 360
acctatttag gctgggccta atagcaaaac tgtcccccgt tactgaattc agagaattat 420
tcgggcacac gatttatttc ctatcttgat tagactcctg agcccgtgcc ccagcctctc 480
gctaatctcc ctggaccaga caactccatt agaatctggc acccacgttt gttctgccta 540
acactgcagg aaggacagag acttcaaagc acgtgtttgt ttttttgttt tgtttttggc 600
taccaagaag ccaaatttct gtatcctcta ccattcaaaa ccccaattca acaaatttac 660
acgggggttt ttcctccacg ttaagcagtt agtcgggtac tagagataca catataaaac 720
acagactctg ccctcaaaca acccaatgag cagaaaattc tcttaggcac caaaacgctg 780
taatagattc aagtgtgtag aggagaagtt tggtagagtg gatatgacgc tttctttctt 840
tgtagtacag aaaagataaa tctgtagaaa agggagaaag acaactgggt agaaaattta 900
tttcaaatat ctaacccaaa tcttcaacag attttccatt ttaaatattc caaaaagtgt 960
accattgtat attatactaa atgcaggttc atttatcact taaaaatttt taagctaaaa 1020
aatctcaaac aattaacatt tgggaagaaa aacaggactg atacacaaag tagtcaaaat 1080
atttcagctt tctaaactgt atgcactgga ctaactgttc aatattagaa tatctctaca 1140
tttgaatttg gatagcccac agtgataaat actggactga aaaatctgac atcgaacata 1200
tgcaaaacta atggctacta tgaaaaaaga tagaatgggg agagaaaact tgaatgtgcc 1260
aaaacattta aacgctcttt aaaatatcct gagatgctaa attaaggaca aaacgattag 1320
agttccaaga atacaaattt tcatctcttt caagattcaa ctgaatattg aatctcattg 1380
agattatgaa atattctcta agcatgtgct taacttctat ttggctttcc gcatttcacc 1440
acagtgaaca gcccattctt tttccttgtt tacaccaaat gctcgttttg aacacaactc 1500
aaaatggaat tccaggccca aaagtcacca cccctacttt cacccccaca ggcagctact 1560
taacagataa ggaattcaag tgcaggacct gaaggtctta tttccatgca aatttcacaa 1620
tccccgttac ttgcccagat acaacaatta aagcttaaaa ggtggcggga gtgggggact 1680
tgaggactgg tctgaggaga aagtgaatct cccaagggtt cctaaatggt tttgcttcca 1740
gtataaaaac tgcgagctac cagtagaatt taacaacagc tcaaccttgc atttggaaca 1800
gttactatat agttcacttt cttttttcat gggggcgggg tatggtgtct tacctactct 1860
taaatttgaa cgtattaaca ggttcccctc cgcgcacact gacatatttc ttatccccca 1920
taatgaattc agccatatgg cattctttcc catcgaaggc catcgggaat ggctttagga 1980
agctgatttt caagctttaa g 2001
<210> 32
<211> 567
<212> DNA
<213> 智人
<400> 32
tcggcggccc ccccgctgtc tggcggacac ttgttagtgg ctgcggagaa gccactcaca 60
aagtttccca tcccgttgag ggaaggggtc ctgactgcgc cagcggggca ggcccagaag 120
gcgcggtatc tgggaggtcc ggccgccgca gacgaccccg ccgaggccca aagtgcgcca 180
gcttctccgc gcccctccgc ctcctcctcc tcctcctccc tgcagagggg cgcacgcgca 240
cagacacacg cacgcacgca cgcacttaca cacaaaagga agtcatggaa ggtgctggtc 300
cctgcataca ggcacactcg cgcgggacac acacacaccc cccaaaaaga ggcgtgcggg 360
gttcgccaga cggtgggcaa aagcccgtcc tccccccctt ccagggcctg ctcacttcag 420
ggagcgccca ctcgcccagc cacgggccaa gagcgcacgg acccaggcgg gcggcagccc 480
acccgccacc acgcagctcc acttcgctgt tccacagcca ccaaccgcac agccggcaca 540
gtcccgcccg cgcagctggc ccaatcg 567
<210> 33
<211> 1001
<212> DNA
<213> 智人
<400> 33
ggcatagttt aaaactatcc ctgctcattc tttaaaataa gtccacagta gagaataaga 60
catcggaaaa tacaaacatt tcttcatatc cgaatctatt tgaatcctaa gatgcagata 120
cggagagttc agagtgccat cagtacaggg cagagaggtt gaagagctca ggaacagaca 180
tagggtgggg gaaaggggta ggggcaacga cgctgacttt tggttaacaa agcccttcca 240
ggctgcggag caacctcctc tgcccttcac ctgcccggcc catctctggc caagaagacc 300
ctgccgccaa atccccacac ccagtccagg tcgcagtgca cagactggcc cttccgaagc 360
ccctcagcgg tagcccgact ccgaagctca ccgaggcatc cgtgagagga gatgccacct 420
agcgcagatc acatctgctc tgaatccttg acaaccgcag cccaaagaat gataaactac 480
aaaggccgga aatgcgtcac cgcggcccgc tctccgcgaa acagcggttc cggctgtgtt 540
ccttctagga aggccggagg tttccacacc tctgtggtcg tcactctgaa tcccgtctgt 600
agtcttaagt gagatactag gtgacacatt gtcttccacg cggcaatata ataacggcca 660
acatagtgtt ttaacacgta ttaattcatt accccgcata acaaccctgt gagttaggta 720
caattatctc catttaacag gtgaggaaac tgaagcacat ttctacattt attagttgcc 780
atttcctgca aagaataccc tttcttttcc ctgccgtctc attttatcac gatgaactca 840
tggattcctt tacaaataat tactgttatt attatgttga tgctcaaatt atttaaaatt 900
tggtcagttg gagccctttc acactgctcc ctctcttttc tttttttgac aaagtctcca 960
ggctggagtg cagtggatgc gatctcagct cactgcaacc t 1001
<210> 34
<211> 383
<212> DNA
<213> 智人
<400> 34
tcgcacgttc gcaggcgcgg gcttcctgtg cgcggccgag cccgggccca gcgccgcctg 60
cagcctcggg aagggagcgg atagcggagc cccgagccgc ccgcagagca agcgcgggga 120
accaaggaga cgctcctggc actgcaggta cgccgacttc agtctcgcgc tcccgcccgc 180
ctttcctctc ttgaacgtgg cagggacgcc gggggacttc ggtgcgaggg tcaccgccgg 240
gttaactggc gaggcaaggc gggggcagcg cgcacgtggc cgtggagccc ggcctggtcc 300
cgcgcgcgcc tgcgggtgcc ccctggggac tcagtggtgt cgcctcgccc gggaccagag 360
attgcgctgg atggattccc gcg 383
<210> 35
<211> 279
<212> DNA
<213> 智人
<400> 35
ccgccagggc acggcccccc ctgcgcccca aactgagcgg caaagtcagg gcccgcggcc 60
ggatgctcag agctaaaggc cgcggaggac agatgtgctt cttcctcctt cccgcgtctc 120
cccatacaag tactaccccg cacgtcccat caggcttgcc tgtgggccag gattcagggt 180
cctgagccga aacctaccag gagagagaag gctctggaga cctctgtaac agtcgtgcgg 240
agaagacaaa gtcagctgcg tgcgtctcct ccggcgccg 279
<210> 36
<211> 2775
<212> DNA
<213> 智人
<400> 36
tcggagtcac gtgagcgccg aggcccctcc cgcggcaggc ggcgaaaggg cttgcgcgcc 60
ctcccctcct ccacagcccc ccgcccctcg cgggcccgcc cctccaggcg aggccaacct 120
ccgcgcccgc cgcccgagcc tcagcggtcc gggaggagct cccggcggcg ctcggcagag 180
ccctcggccg gtgccccgcg gccgccgcgc tcccagggct actggcgcag cgcacggaga 240
acccggttct cggcgcggtg cgtcgtgctg ggcccccgcg ccgggccacc tgaagccaga 300
ggatttgggg cgcactgaag ggactgcgtc tcccagctcg aacccggctt aagtggggcc 360
gggagcgagg tcgggaaagt ctcacccgcc caaagcctca ccaccgagag gcacttaaaa 420
aggaaagcgc agagggaccc tgcccacgcg cgtgtacaca cacacccccc cacacacaca 480
caagcaaaca cgagctcccc gccacttcct ccccagggtc tcctcaaggc caaatattgc 540
tcccaatgac agccagtcac cccttggcga acgcctgcta aggctccgaa gagccgggcc 600
accgatctag ctcccggctg aaagcagccg accttgtcac gcgcggggcc gggaatggga 660
gggagggtgt tagagggtga tcgctgtggg aaagtgagag ggagcggctg ttagtcattg 720
ctccgggtcc attaccgaga atccccaaac ctagtccgcc gctgcgtggc ccctctcccc 780
atgcaaagca gacccccgaa gaagccatgc caggctgagg gacagacgcc ggggctcgaa 840
gctccgggca gattcagaaa gaggcgtcgc tgcagaaagg acgcatcaca gttttcagat 900
cttaatgtgg ccgaggtttt acaactcccg acccggcgca gaaaggaaat cccaccatgt 960
tccccggagt cgagaaaacg gtgaacagct ttcggcctgc gctcgacctc tgcgtctgcg 1020
tctctctcgc ctcggcttcc cttatttttt aaaccaccac cacactcctt cccccgccac 1080
ttccttcccc cacccccttc ctccgttgca ccagcagcag agtcgcacgc agcaaatact 1140
ccttcaagaa ttttacctac ctacagttca agcagttact gggatgtcct gactaatcga 1200
agatgctgcc gcgcgcgtgg gtcgctctgc gcaagggcct cttcgaaaac ccgactaggc 1260
gcaactcagc gttcagcagg gccgggagcg ccaggtcgtc cccggggccc gggccccatg 1320
actcctgccc caaagcccac tccacccgac ctccctttcc tgaggctgtt cccagttgct 1380
gctttgggtc gctccggagc tcaagaactc gggttgcctg ccgccccact ctccacgcac 1440
atacttggtt ttcttcttag gggcattggc aggtagactt tgaggaagaa aagtaaagga 1500
tcgaacagct cagccctccc tcccgaccgt ggatgcccgg agtcgaccaa cacctcaggt 1560
ccgggtgcgg aggccgcggg cgcccctgcg cgaccgtccg cgcccggcaa gagccgcgcg 1620
gctttcgcct ttgctggtcc cgcgccaccg ctggggcggg ctgcgaaagg gttgggaaga 1680
gcaaagggtt tttttgtttt gttttgagac gcagaagccc tttaaaaagc ccggcgagga 1740
gaggtccaga agtagagaaa gcagacggag gcaagctgtg cccgcggggc aaagggacag 1800
tagaaggggc gggcgcccgg gttccccgga aaaccctcgg ccccaaggaa tctcctgggg 1860
cgggagagcg cggttctaaa accgagagga taggaagggg aagggggagt tgtgtttcaa 1920
tttcggattc accaggattc atctctagtc acatttttct tctcaaattt ttaaatcgaa 1980
aagataaaag ccaaaagaac tttcatcccc agagcttttt attgggggaa aggaatgtaa 2040
ctcggggtgg ttgtccttca cttccctact cgaatcttct cctaatgccg aaatgtgttt 2100
acaggtagcc tcagtttacc aagtatgtat cttttggggg tttaacctct cacaaagcct 2160
tcaactcaca aaccgcgatc cttggaaacc atcctccaaa gcagtgcttg gaggcctcta 2220
aggcccccgg accaactccc gctggaagaa gcctgcaggg actcgggaat cacgggaacc 2280
tttcccgtcg gttccgggcc tggagggcca ggaagagccg cgcgtccgcc tttcgtcccg 2340
ccaggaactc cccataggac acgacaccgc aggaacaagc gtcctgggag cccctgggat 2400
cttggctgtc gtctctaggg accctacacc gtgaaatgat agaggcgagg ttccttgggt 2460
tccgcaagtc gacgaaaata gctcgtggag aaggcgcgtc ctgcaactgc agttcgcaag 2520
ctctcagggc gccccgccag ctgggggcca gattgggtga cactcccctc gacgcagcct 2580
ccggagcggc gcgcactctc cagaggccag caggactgcg ctctctaccg cagaacctgc 2640
tccagctagg tgttctctcc ccatctcgcc gtcgctctgc cccctcactc tctctggacc 2700
tcagagccgg ttctctcctt cctcctcccg cgctttccgt ccggggatcg caacctccag 2760
cccgtgggca acgcg 2775
<210> 37
<211> 2255
<212> DNA
<213> 智人
<400> 37
ccgctttaga ggcagcgctt atagcgctag ctggtcgtgg aatgcgatta cagcgtctcc 60
attggagacc gctgagtgcc tcggtttccc tgtctgtgca aagtgcactc cccagacgcc 120
gctgcctcga gggaccagga aatgcgtctg ggggcgccag gaaagatgag aagataaagt 180
cacgatgcgt ccagctagct atagacacaa gcagaggagc cagtaggcca aaggagacgc 240
acagctgatc cgtgccgagg cgcgggctcc actccctgaa gtggagggac ccttgaatct 300
ttccttgcgt aggcgcgcgg cagagcagcg atttggcgaa aagggccgag actcaggatg 360
cctgcaatgc gagcgagggg cggacagggc gcacggggcg cggcaaggct gcgaggggcg 420
ggcctgggcc ctgagcctcc tgcacttcca gccacagctc tgggccttgg gggcgggaag 480
gggtggagcc acgtggggag gagcaaaacc cggaggtccc gggcaccttg ggcagagcca 540
gagcggcggg agccggtcct gggcgcgttg ccccgggagc gcccgtcgtc cgggcagagc 600
gcagccgcaa ccgcgaccac agccgcagtc gctttccagc ctgccttcgg tgcgcagcgg 660
gggaacaggg ctagtgcagc cgccggaggg gggcacgggc tcctctccca tcccagagct 720
actgggctgc ccttgctgtc ctcgccgccc cagcagaccc cggccggacc tgccacctgc 780
gccctggttg cgccatggat ccttcggaaa agaagatatc ggtgtggatc tgccaggaag 840
agaagctggt gtccggcctc tcccgccgca ccacttgctc cgacgttgtg cgagtgcttt 900
tggaggacgg ctgccggcgg cgacggagac agcggcggag ccggcggctg gggtcggccg 960
gcgacccgca tggcccggga gagctgcccg aacccccgaa cgaggacgac gaggacgacg 1020
acgaggcgct gccgcagggc atgctgtgcg ggcccccgca gtgctattgc atcgtggaga 1080
agtggcgcgg ctttgagcgc atcctcccca acaagacgcg catcttgcgc ctctgggctg 1140
cctggggcga agagcaagag aatgtgcgct tcgtgctagt gcgcagcgag gcatcgctgc 1200
ctaacgccgg cccccgcagc gccgaggcgc gcgtagtgct gagccgagag cgcccctgtc 1260
cggcccgcgg ggccccggcg cggcccagcc tggccatgac ccaggagaaa cagcggcgag 1320
tggtgcgcaa ggcctttcgc aaactggcca agctcaaccg gcggcgccag cagcagacac 1380
cgtcgtcctg ttcgtccact tcgtcgtcca ctgcctcgtc ctgctcttcg tcgccgcgga 1440
cccacgagag cgcgtcggtg gagcgcatgg agacgctggt gcatctggtg ctttcccagg 1500
accacacaat tcgccagcag gtgcagcggc tccacgagct ggaccgcgag atcgatcact 1560
acgaggccaa ggtgcacctg gaccgcatgc ggcgtcacgg ggtcaactac gtgcaggaca 1620
cttacttggt tggggcaggc atcgagctcg acgggtccag accgggagag gagccagaag 1680
aggtggcggc ggaggcggag gaggcggcgg cggcgccccc tctagccggc gaggcgcagg 1740
cggcggcgct ggaggagctg gcccggcgct gcgacgactt gctgcggctt caggagcaac 1800
gggttcagca ggaggagttg ctggagcgcc tttcagccga gattcaggag gaactcaacc 1860
agaggtggat gcgacggcgc caggaggagc tggcggcgcg ggaggagccc ctggagcccg 1920
acggtggccc cgacggcgag ctgctgctgg agcaggaacg ggtcaggacg cagctcagta 1980
ccagccttta cattgggctg cggctcaaca cggacctaga ggccgtcaag tcggacttgg 2040
attacagcca gcagcaatgg gacagcaaga agcgcgagct acagggcctt ctgcaaactt 2100
tgcacacttt ggagctgacg gtggcaccgg atggggctcc tggctctggc agtccctcgc 2160
gggaacctgg gcctcaagcc tgcgccgaca tgtgggtgga ccaggcccgt ggactggcca 2220
agagcggtcc tggcaacgac gaagactcgg atacg 2255
<210> 38
<211> 875
<212> DNA
<213> 智人
<400> 38
ccgcgccacc cctcggctct ctctctctct ctccctaccc cgcaggatct acaccggctg 60
tgacatggac cgcctgaccc cctcgcccaa cgactcgccg cgctcgcaga tcgtgcccgg 120
ggcccgctac gccatggccg gctctttcct gcaggaccag ttcgtgagca actacgccaa 180
ggcccgcttc cacccgggcg cgggcgcggg ccccgggccg ggtacggacc gcagcgtgcc 240
gcacaccaac gggctgctgt cgccgcagca ggccgaggac ccgggcgcgc cctcgccgca 300
acgctggttt gtgacgccgg ccaacaaccg gctggacttc gcggcctcgg cctatgacac 360
ggccacggac ttcgcgggca acgcggccac gctgctctct tacgcggcgg cgggcgtgaa 420
ggcgctgccg ctgcaggctg caggctgcac tggccgcccg ctcggctact acgccgaccc 480
gtcgggctgg ggcgcccgca gtcccccgca gtactgcggc accaagtcgg gctcggtgct 540
gccctgctgg cccaacagcg ccgcggccgc cgcgcgcatg gccggcgcca atccctacct 600
gggcgaggag gccgagggcc tggccgccga gcgctcgccg ctgccgcccg gcgccgccga 660
ggacgccaag cccaaggacc tgtccgattc cagctggatc gagacgccct cctcgatcaa 720
gtccatcgac tccagcgact cggggattta cgagcaggcc aagcggaggc ggatctcgcc 780
ggccgacacg cccgtgtccg agagttcgtc cccgctcaag agcgaggtgc tggcccagcg 840
ggactgcgag aagaactgcg ccaaggacat tagcg 875
<210> 39
<211> 975
<212> DNA
<213> 智人
<400> 39
ccgccgggtc actggagtct cagccttccg gaatccgagc cggcccgccc cactccccgc 60
ccttcgcggt cccgcccacg acctctcccc acgcctcccg ctccggcccc caacctcccg 120
gtcggacgtt cgttcccggc tctagccggc ctccgcgcct ctggcctctt tccttccggc 180
cgtcccgacg gagatatttc ttcaatactc cataaataca ccccgccgcg gaacccaccc 240
ggagtgagac gcccaacacg tcgtcgaact ggggttggcc gggggccgct ccccgccgcg 300
ggcccgcaga ctcgtggcgt cgccccgcag ctccgcctgg ccgacgggga accggccgag 360
acccggacac gcacgcccgg gaggacaaaa gcgcgggcgg accccgcagg ctgggacccc 420
ggcggctggc ccgctccccg agaagggccg tggtcggggg gctctcactc acgagccgct 480
ggctctgggt cagccctgcc cccagggcag cgctccatca tgaggctggc ggggcgctga 540
gccgtggcgt cctcgctcct gcgctgcccc tctgcatcct ggccccttcc ctgcacacgc 600
agagctgcca cactgagcgc ccctcagctt acttaagctc ggcaaggctg gagaaggccg 660
tctgggtgac cgggcggagg gggatgctgg ggaaggaaga attcaggcag ctgcaaagag 720
cgcgcgaata tattcattcg acatacctca tgggcgccta ccctgggcct ggtccggggc 780
gggtgtttgc ggggtggggc cgaagcaggg gcgtcgccga gttgaagacg tgtactccga 840
gcgctcctgc gttcattcat tcgctgggtg gagagaggaa ggacaagagc cccgcgccga 900
tcggagggga gcagaatagt aggcacagtt agagggtctt cacggtgcgt ttcggaacct 960
tggctgcccg gctcg 975
<210> 40
<211> 1284
<212> DNA
<213> 智人
<400> 40
tcgacaaacg caaagcgacc caaaccctgg agggtcacat cccggctgct acaaacctcg 60
gcggggcggc cccgctcttg cggccgggac agcgcagcgg cagcaggggc cgcaggggac 120
ccgcagattg gcacgccgct ccccatcccc gcagcgcgtc tgcaccggag actctgcggg 180
gattgtagcc ggagggcggg ccgggctccg aggcgctgct caggcattgg ggtttgtcct 240
catgagctcc acgtcggcgt gcaccatctc cctcaccagc tcctgcaaca caggggtggg 300
cgtgagggag gagcttctgc cactctctcc tggtgacacc ccaccccggg tgtcggcccc 360
agagaggcct ccgcgtccct cgttccagct cccctcactt ctcccgcacc ccgccttccg 420
ggctttgggc atcgcaggcg cctcaggcgc ccgaccctga gagctgccgc cctgcagccc 480
ggggccccgc agcgggcggc gtgcgcccta agagatactc acatcgaaag cgacccgggg 540
cttccagttc agcttctgtt tcgctttggt gcagtcgccc tgcagaaagt cctagggaag 600
aagaggggga gacgaagcag gcgtgggtcg tgggggtggg ggcagcaggt cccgagcccc 660
gggaactccc accgttccgc tccctctggg cgcacaaggc tccgggtttc cctgctttcg 720
gtccctgctg tgcgcgttca gttgcggctc tcggcgccgt aaatcactag gtcgcggtta 780
agaatgtgct gtgcggaccc gtgaggaccg tgaccgcgat ccacccccag ctacctccac 840
acctcttctc cccaaggcgt cccttgggct cttaatgctt tttttttttt tttttttttt 900
tttttataac atgaagttgt cagggacgct cctatgagaa ctgtttggaa ttgctgcact 960
tctctggcta ggagggaagt gagtaaatca ccaggcgccc ctcccagctg cccgtgtccc 1020
tgcgccgctc agctcctgcc gcagggctgg ccgcgccaag cgcgcgtcct acccaaagcc 1080
accagccccg cggggaaggg actcgggctg tggggcgcga ggccccagga ctcggggacc 1140
cctctacctc ggcggcagcg tgcgaccctc tttctaacgc ggccgtggat gtttcttccc 1200
gggccgcagc caagcgcggt tcttcctggg cggtggcttt gggcttttcg tacccacagt 1260
caagtcagtt cacgtcgcct cccg 1284
<210> 41
<211> 1001
<212> DNA
<213> 智人
<400> 41
actgctctaa atacttcata tatattaact cctctattct gtacttctgt tcccgtttta 60
tacagcagga aattgaaaca ctgagaggtt aagtaactaa agttacagag ctagagtgac 120
aggagtaaag cttcaactca ggcaacccag acttccagag ttctgatctc cactactaag 180
ctgctagcat agcttttctg gtaactattt ttaattcaaa tataattcga gtgatctatc 240
taacaagtca tcactctgac aactcagtga cttgtaatgt aaaattattc attgtaattc 300
atttaatatt attgtttctc tgtgctgcaa aaatcatagc aatcgagatg taatttatta 360
ctctccctcc cacctccggc atcttgtgct aatccttctg ccctgcggac ctcccccgac 420
tctttactat gcgtgtcaac tgccatcaac ttccttgctt gctggggact ggggccgcga 480
gggcataccc ccgaggggta cggggctagg gctaggcagg ctgtgcggtt gggcggggcc 540
ctgtgcccca ctgcggagtg cgggtcggga agcggagaga gaagcagctg tgtaatccgc 600
tggatgcgga ccagggcgct ccccattccc gtcgggagcc cgccgattgg ctgggtgtgg 660
gcgcacgtga ccgacatgtg gctgtattgg tgcagcccgc cagggtgtca ctggagacag 720
aatggaggtg ctgccggact cggaaatggg gtaggtgctg gagccaccat ggccaggctt 780
gctgcggggg gaggggggaa ggtggttttc cctcgcactg tcttaaaccg atggcctttc 840
cttggcacag ggtccactgc agcatgccaa acgaggaggc aggggcgtcg tccccccgcc 900
ccccactgca gcactggaga tggatttcct gtacttcgga tccagggttt ttgacagaag 960
aggaagaagg gggaggggta gaagtgttaa ggggagtctg c 1001
<210> 42
<211> 859
<212> DNA
<213> 智人
<400> 42
acgcagaggc cgtggcatct ggccgcagct gggctgcagt gcgtgcgcgc ctggcctggt 60
ggtccgatgg gaagcccggg gcggggcagc cgcggggcgg gggcggggcg tcgcggagat 120
aggccacgcc cctgcccgcc cgcgcaggcg cgctgcgggt cgttagctgt cagagccaag 180
cggcgggctg gcggcgggct ccgacgtctg cgccaggacc tggctggctg agcccggcgc 240
agcagcagca gccagggcag cgcggcccct actccctgtc aggtcgtaga ggcgagcagg 300
gaccagctgg tcgccggccc ctcgggcaag atggggaacc gggagatgga ggagctgatc 360
ccgctggtga accgtctgca ggacgcgttt tcggcgctgg gacagagctg cctgctggag 420
ctgccgcaga tcgccgtggt gggcggccag agcgccggca agagctcggt gctcgagaac 480
ttcgtgggca ggtaagcgcg cagggcgcgg agtaaggatg cggcagtggg gcgaccccgc 540
tgcgggccgt tggaacgtgg acgggcagcg ggagccagag ggtggatgga ccaggcgctg 600
cggtggaatg gggggcagag tggaatgggg ggcagagtgg cggtgtccgt ggggcgggcg 660
gggtcctcca gctctgggca tcctccgtcc cctgccaccc cccgcctggt ggccctcctg 720
cctgcctttc atcgtgcgat acaaagccat ttcctccctg tcctccagtc ggggagtcgg 780
gggaggggtc cgccccgggc tcgaccccca ccccctcggt gcgcgccagc cccgggcagc 840
ctccctgcgt agcgcgccg 859
<210> 43
<211> 2001
<212> DNA
<213> 智人
<400> 43
gacagaaaac agccagagcg caccactcac ctgagtgcca ggtaaacacc tgggcgcgac 60
agggacagga aacaagggta gggtgcggag gctggggagg aagaggttgg aaagggggga 120
aataaatggg cggggcctag caggtcctgt gcggggctta gggccggggc ggggcccagg 180
aagactcagc agcgggtggg tgagggtcta aaggcggcaa ttccgggccg ggtgcggtgg 240
ctcacgcctg taatcccagc actttggtag gccgaggcgg gcggatcacc tgagatcaag 300
agctcgagac cagcctgggc aacgtggtga aaccccgtct ctactaaaaa tacaaaaatt 360
agctgggcgt ggtggcgggc gcctgtagtc ccagctactt gggaggctga ggcaggagaa 420
tcgcttgaac ccgggacgtg gaggttgcag tgagctgaga tcgcgccact gtactccagc 480
ctgggtcaca acagggaaac tccgtctcaa aaaagaaaaa aaaaaaaggc aattccgagc 540
ccagacaaac cttaaggagg ggatcctgga tcttcagtta agtgggcgac acctggagtg 600
aggggcgggg catatgcaga gtaggtgcgg cctacaagcc aaaaaggaga aagagttgga 660
atggtgggcc tggcttatgc gggtgggcgg ggagagggtg gatcctagag gaggtgaggc 720
ctaacattgg gcgaagaagg cgggagcctg ggccaatgag ctgacggtag gccggggagg 780
gggcggtggg gtggggtggg caatgggcaa tgagacggag ggcggggccg ggacctaata 840
tggcgggtca ggagggtctg gaagacgaag aagagggaca ggcaatgcca ggtctaggac 900
taggagggag gcgcgggcgg tattagcggc tggaggaggc ttcgggaggc ccggccgacg 960
gccgccgcct ggtgctaccc acccaggggc gcgcgaccct cccttcggtc tggctccaaa 1020
gacctagcag cactgacttc acccagctgt ggttccaacg gcgggtccag cggcctcggc 1080
ccggcgccgt cctcctgctg gcccaacagg cccgccagcc cgcccctgta cgtctgtgat 1140
tggacggcgg cggccactga tgttcaagcg acaggtcctg gcccgggagc caatctgcag 1200
gtgttgaggc ccaggctccg agagcgggcc gaggaggcgt ggataccctg attcctaggg 1260
ggcaggcctg gttcccccga ggaggacccg gcctatgaat gactggagtt ctggggttct 1320
ggccgaaaga ggaagtggga cagggccggg tgtgatgggg cctagagtca cagagccttg 1380
cggccctgct gtccctgcaa gaagccagct tctggccagg cgcggtggct cacgcctgta 1440
atcccagcac tttgggaggc cgaggcgggc ggatcacgag gtcaggagat cgagaccatc 1500
ctaacatggt gaaaccctgt ctctactaaa aatacaaaaa attagccagg cgtggtggcg 1560
ggcgcctgta gtcccagcta ctagggaggc tgaggcagga gaacggcgtg aacccaggag 1620
gcggaggttg cagtgagctg agattgcgcc actgcactcc agccagggcg acagagcgag 1680
actccgtctc aaaaaaaaaa aaaaaagcag ccagcttctt cctcctattt tgcaaccttc 1740
tcccgatatc cttgaacatt ttagggacag ccatcactta accatagagc aaccctatta 1800
agtctaagta gcataatcac attcctgtag tatagatcat gaacctgaaa ttcgaggatg 1860
aagtcatttg cctgaagaca tacatcttgt aaaatagcca tccgcaaaga tgtagggaaa 1920
aaggcagcga tctgtggcta cacctcccct tcctcccgga agcagccact ggaacgtttt 1980
tagctttttc tttttttttc a 2001
<210> 44
<211> 1007
<212> DNA
<213> 智人
<400> 44
acgcggtgac cttgaccccg gcccaggccc tgctaatgaa gaggaaagcc cgtacgcact 60
cggcctgacc cacggcgacc ctctgtgacc aatcatacta ccaacctctt aaacagagct 120
ccaccgacgc aatgcccagg cataaaaagg ccaggccgga gagaccgcca ccagtcacgg 180
accctggacc cagcgcaccc gcaccatggc cggccccagc ctcgcttgct gtctgctcgg 240
cctcctggcg ctgacctccg cctgctacat ccagaactgc cccctgggag gcaagagggc 300
cgcgccggac ctcgacgtgc gcaaggtgag tccccagccc tggtcccgcg gcgctccggg 360
gagggaggga cccgcagcca caggggcgcg ccccgctccg gcctcgcctg agaactccag 420
gagctgagcg gattttgacg ccccgccctt gaccgcggtc gaggccccca cggcgcccca 480
gcgcgtctca gccccgctgt cccgcccgaa ctccgaaccc cggaccccag catccttgcc 540
cggcgcaccc cggccggcct cgcagggtcc tccgagcgag tccccagcgc cgccccggct 600
cccgctcacc ccgcccgtcc ccgcagtgcc tcccctgcgg ccccgggggc aaaggccgct 660
gcttcgggcc caatatctgc tgcgcggaag agctgggctg cttcgtgggc accgccgaag 720
cgctgcgctg ccaggaggag aactacctgc cgtcgccctg ccagtccggc cagaaggcgt 780
gcgggagcgg gggccgctgc gcggtcttgg gcctctgctg cagcccgggt gagcggggca 840
aggcgctccg gggccagggg gaggcgggcg ggggtgcggc cgggattccc ctgactccac 900
ctcttcctcc agacggctgc cacgccgacc ctgcctgcga cgcggaagcc accttctccc 960
agcgctgaaa cttgatggct ccgaacaccc tcgaagcgcg ccactcg 1007

Claims (9)

1.一种评估肝癌的预后或者风险的方法,其步骤包括:
(a)从受试者的生物样品中提供DNA的步骤;及
(b)从所述分离的DNA中测量由从2号染色体的25438725至25439276序列、12号染色体的95941906至95942979序列、10号染色体的134597357至134602649序列、8号染色体的144649774至144651774序列、1号染色体的47998899至47999517序列、2号染色体的26394102至26396102序列、8号染色体的104510870至104513913序列、8号染色体的98289604至98290404序列、2号染色体的63281034至63281347序列、8号染色体的67873388至67875600序列、4号染色体的76555366至76556079序列、1号染色体的63782394至63790471序列、5号染色体的7849945至7850439序列、2号染色体的39186777至39187968序列以及14号染色体的74207665至74208665序列形成的群中选择的CpG部位的甲基化状况。
2.根据权利要求1所述的评估肝癌的预后或者风险的方法,其中,测量两个以上的CpG部位的甲基化状况。
3.根据权利要求1所述的评估肝癌的预后或者风险的方法,其中,所述2号染色体的25438725至25439276序列具有序列编号1的碱基序列,
所述12号染色体的95941906至95942979序列具有序列编号2的碱基序列,
所述10号染色体的134597357至134602649序列具有序列编号3的碱基序列,
所述8号染色体的144649774至144651774序列具有序列编号4的碱基序列,
所述1号染色体的47998899至47999517序列具有序列编号5的碱基序列,
所述2号染色体的26394102至26396102序列具有序列编号6的碱基序列,
所述8号染色体的104510870至104513913序列具有序列编号7的碱基序列,
所述8号染色体的98289604至98290404序列具有序列编号8的碱基序列,
所述2号染色体的63281034至63281347序列具有序列编号9的碱基序列,
所述8号染色体的67873388至67875600序列具有序列编号10的碱基序列,
所述4号染色体的76555366至76556079序列具有序列编号11的碱基序列,
所述1号染色体的63782394至63790471序列具有序列编号12的碱基序列,
所述5号染色体的7849945至7850439序列具有序列编号13的碱基序列,
所述2号染色体的39186777至39187968序列具有序列编号14的碱基序列,
所述14号染色体的74207665至74208665序列具有序列编号15的碱基序列。
4.根据权利要求1所述的评估肝癌的预后或者风险的方法,其中,测量所述2号染色体25438725至25439276序列的CpG部位位于2号染色体的25439110,
所述12号染色体的95941906至95942979序列的CpG部位位于12号染色体的95941988,
所述10号染色体的134597357至134602649序列的CpG部位位于10号染色体的134599823,
所述8号染色体144649774至144651774序列的CpG部位位于8号染色体的144651002,
所述1号染色体的47998899至47999517序列的CpG部位位于1号染色体的47999163,
所述2号染色体的26394102至26396102序列的CpG部位位于2号染色体的26395458,
所述8号染色体104510870至104513913的CpG部位位于8号染色体的104512877,
所述8号染色体98289604至98290404序列的CpG部位位于8号染色体的98290148,
所述2号染色体的63281034至63281347的CpG部位位于2号染色体的63281139,
所述8号染色体67873388至67875600的CpG部位位于8号染色体的67874178,
所述4号染色体76555366至76556079序列的CpG部位位于4号染色体的76555832,
所述1号染色体63782394至63790471的CpG部位位于1号染色体63789278,
所述5号染色体7849945至7850439序列的CpG部位位于5号染色体的7850070,
所述2号染色体的39186777至39187968序列的CpG部位位于2号染色体的39187533,
所述14号染色体的74207665至74208665序列的CpG部位位于第14号染色体的74208165的CpG部位的甲基化状况。
5.根据权利要求1所述的评估肝癌的预后或者风险的方法,其中,所述生物样品是由从可疑肝癌患者或者诊断对象由来的组织、细胞、血液、血浆、粪便及尿液形成的群中选择的一种。
6.根据权利要求1所述的评估肝癌的预后或者风险的方法,其中,所述(b)步骤是由从PCR、甲基化特异性PCR、实时甲基化特异性PCR、荧光法PCR、荧光法数字PCR、EpiTYPER、利用甲基化DNA特异性结合蛋白质的PCR、DNA芯片、焦磷酸测序及亚硫酸氢盐测序形成的群中选择的一种方法被执行。
7.根据权利要求1所述的评估肝癌的预后或者风险的方法,其步骤还包括:
(c)在所述(b)步骤之后,将所述甲基化状况与正常对照群的甲基化状况进行比较。
8.一种肝癌发病风险诊断用试剂盒,其中,所述肝癌发病风险诊断用试剂盒包括探针,所述探针结合在由从2号染色体25438725-25439276序列、12号染色体95941906-95942979序列、10号染色体134597357-134602649序列、8号染色体144649774-144651774序列、1号染色体47998899-47999517序列、2号染色体26394102至26396102序列、8号染色体104510870至104513913序列、8号染色体98289604至98290404序列、2号染色体63281034至63281347序列、8号染色体67873388至67875600序列、4号染色体76555366至76556079序列、1号染色体63782394至63790471序列、5号染色体7849945至7850439序列、2号染色体39186777至39187968序列以及14号染色体74207665至74208665序列形成的群中选择的CpG部位。
9.根据权利要求8所述的肝癌发病风险诊断用试剂盒,其中,所述的肝癌发病风险诊断用试剂盒包括结合在所述CpG部位的两个以上的探针。
CN201880075735.7A 2017-11-22 2018-11-19 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法 Active CN111386352B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2017-0156527 2017-11-22
KR20170156527 2017-11-22
KR10-2018-0137644 2018-11-09
KR1020180137644A KR102052089B1 (ko) 2017-11-22 2018-11-09 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법
PCT/KR2018/014207 WO2019103421A2 (ko) 2017-11-22 2018-11-19 유전자의 cpg 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법

Publications (2)

Publication Number Publication Date
CN111386352A true CN111386352A (zh) 2020-07-07
CN111386352B CN111386352B (zh) 2024-04-16

Family

ID=66675922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880075735.7A Active CN111386352B (zh) 2017-11-22 2018-11-19 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法

Country Status (6)

Country Link
US (2) US20210147943A1 (zh)
EP (2) EP4180540A1 (zh)
JP (2) JP7306723B2 (zh)
KR (3) KR102052089B1 (zh)
CN (1) CN111386352B (zh)
SG (1) SG11202004795RA (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113621704A (zh) * 2021-07-22 2021-11-09 武汉艾米森生命科技有限公司 肝癌的检测和诊断的试剂及试剂盒
CN113948150A (zh) * 2021-12-21 2022-01-18 北京迈基诺基因科技股份有限公司 Jmml相关基因甲基化水平评估方法、模型及构建方法
CN113981046A (zh) * 2021-11-05 2022-01-28 朱运峰 一种基于定量pcr技术dna甲基化检测方法及其试剂盒
CN114369663A (zh) * 2022-01-18 2022-04-19 博尔诚(北京)科技有限公司 用于肝癌筛查的标志物、探针组合物及其应用
WO2023082140A1 (zh) * 2021-11-11 2023-05-19 华大数极生物科技(深圳)有限公司 一种用于诊断肝癌的核酸检测试剂盒
WO2023082139A1 (zh) * 2021-11-11 2023-05-19 华大数极生物科技(深圳)有限公司 一种用于诊断肝癌的核酸及蛋白检测试剂盒
CN116179694A (zh) * 2022-11-02 2023-05-30 武汉艾米森生命科技有限公司 检测甲基化水平的试剂在制备前列腺癌诊断产品中的应用以及前列腺癌诊断试剂盒

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102155044B1 (ko) * 2019-10-08 2020-09-11 주식회사 레피다인 생물학적 시료의 간암 조직 기원 여부를 판별하는 방법
IL280297B (en) * 2021-01-19 2022-09-01 Nucleix Ltd Non-invasive cancer detection is based on DNA methylation changes

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101680025A (zh) * 2007-01-09 2010-03-24 癌甲基化组科学公司 选定基因中的表观遗传变化和癌症
KR20100041937A (ko) * 2008-10-15 2010-04-23 재단법인서울대학교산학협력재단 암 전이 억제 물질의 스크리닝 방법
KR20130103110A (ko) * 2012-03-09 2013-09-23 (주)지노믹트리 간암 특이적 과메틸화 CpG 서열을 이용한 간암의 검출방법
WO2016097120A1 (en) * 2014-12-18 2016-06-23 Hospital Clínic De Barcelona Method for the prognosis of hepatocellular carcinoma
US20170175205A1 (en) * 2015-12-17 2017-06-22 Illumina, Inc. Distinguishing methylation levels in complex biological samples
KR20170071724A (ko) * 2015-12-16 2017-06-26 연세대학교 산학협력단 간암 발생 특이적 유전자 발현에 관여하는 유전자 구조 내 cpg 섬의 dna 메틸화 변이를 이용한 간암의 예측 또는 진단 방법
WO2017143296A2 (en) * 2016-02-18 2017-08-24 Gill Inderbir Singh Prostate cancer aggressiveness biomarkers

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100221723A1 (en) * 2007-08-14 2010-09-02 The Trustees Of Columbia University In The City Of New York Early detection of cancer by methylated dna in blood
JP6054750B2 (ja) 2011-01-28 2016-12-27 国立研究開発法人国立がん研究センター 肝細胞癌のリスク評価方法
WO2014046198A1 (ja) 2012-09-19 2014-03-27 シスメックス株式会社 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット
JP6369857B2 (ja) 2013-05-29 2018-08-08 シスメックス株式会社 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット
AU2015374019B2 (en) * 2014-12-31 2022-03-10 Case Western Reserve University Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus
US11851711B2 (en) * 2017-09-29 2023-12-26 Arizona Board Of Regents On Behalf Of The University Of Arizona DNA methylation biomarkers for cancer diagnosing

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101680025A (zh) * 2007-01-09 2010-03-24 癌甲基化组科学公司 选定基因中的表观遗传变化和癌症
KR20100041937A (ko) * 2008-10-15 2010-04-23 재단법인서울대학교산학협력재단 암 전이 억제 물질의 스크리닝 방법
KR20130103110A (ko) * 2012-03-09 2013-09-23 (주)지노믹트리 간암 특이적 과메틸화 CpG 서열을 이용한 간암의 검출방법
WO2016097120A1 (en) * 2014-12-18 2016-06-23 Hospital Clínic De Barcelona Method for the prognosis of hepatocellular carcinoma
KR20170071724A (ko) * 2015-12-16 2017-06-26 연세대학교 산학협력단 간암 발생 특이적 유전자 발현에 관여하는 유전자 구조 내 cpg 섬의 dna 메틸화 변이를 이용한 간암의 예측 또는 진단 방법
US20170175205A1 (en) * 2015-12-17 2017-06-22 Illumina, Inc. Distinguishing methylation levels in complex biological samples
WO2017143296A2 (en) * 2016-02-18 2017-08-24 Gill Inderbir Singh Prostate cancer aggressiveness biomarkers

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
喻军: "SFRP1 基因启动子甲基化和肝细胞癌关系的Meta 分析", 胃肠病学和肝病学杂志, vol. 26, no. 4, pages 376 - 380 *
章明: "女贞子对HepG2 肝癌细胞相关基因去甲基化作用的研究", 江西中医药, vol. 48, no. 5, pages 61 - 64 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113621704A (zh) * 2021-07-22 2021-11-09 武汉艾米森生命科技有限公司 肝癌的检测和诊断的试剂及试剂盒
CN113621704B (zh) * 2021-07-22 2023-08-29 武汉艾米森生命科技有限公司 肝癌的检测和诊断的试剂及试剂盒
CN113981046A (zh) * 2021-11-05 2022-01-28 朱运峰 一种基于定量pcr技术dna甲基化检测方法及其试剂盒
WO2023082140A1 (zh) * 2021-11-11 2023-05-19 华大数极生物科技(深圳)有限公司 一种用于诊断肝癌的核酸检测试剂盒
WO2023082139A1 (zh) * 2021-11-11 2023-05-19 华大数极生物科技(深圳)有限公司 一种用于诊断肝癌的核酸及蛋白检测试剂盒
CN113948150A (zh) * 2021-12-21 2022-01-18 北京迈基诺基因科技股份有限公司 Jmml相关基因甲基化水平评估方法、模型及构建方法
CN113948150B (zh) * 2021-12-21 2022-04-19 北京迈基诺基因科技股份有限公司 Jmml相关基因甲基化水平评估方法、模型及构建方法
CN114369663A (zh) * 2022-01-18 2022-04-19 博尔诚(北京)科技有限公司 用于肝癌筛查的标志物、探针组合物及其应用
CN116179694A (zh) * 2022-11-02 2023-05-30 武汉艾米森生命科技有限公司 检测甲基化水平的试剂在制备前列腺癌诊断产品中的应用以及前列腺癌诊断试剂盒

Also Published As

Publication number Publication date
KR102103887B1 (ko) 2020-05-29
KR102052089B1 (ko) 2019-12-05
JP7452894B2 (ja) 2024-03-19
EP3715474A4 (en) 2022-02-09
US20220259676A1 (en) 2022-08-18
JP7306723B2 (ja) 2023-07-11
KR20190088924A (ko) 2019-07-29
KR20190087344A (ko) 2019-07-24
EP4180540A1 (en) 2023-05-17
US20210147943A1 (en) 2021-05-20
SG11202004795RA (en) 2020-06-29
EP3715474A2 (en) 2020-09-30
KR20190059215A (ko) 2019-05-30
CN111386352B (zh) 2024-04-16
KR102103886B1 (ko) 2020-05-29
JP2022164712A (ja) 2022-10-27
JP2021503956A (ja) 2021-02-15

Similar Documents

Publication Publication Date Title
CN111386352B (zh) 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法
CN110382521B (zh) 从氧化应激区分肿瘤抑制性foxo活性的方法
DK2681333T3 (en) EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY
CN107743524B (zh) 前列腺癌预后的方法
AU2012345789B2 (en) Methods of treating breast cancer with taxane therapy
US6773883B2 (en) Prognostic classification of endometrial cancer
AU2012203810B2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
CN112725454B (zh) 膀胱癌患者总体生存率预后模型
CN108138237A (zh) 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
CA2430981A1 (en) Gene expression profiling of primary breast carcinomas using arrays of candidate genes
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
CN111479933A (zh) 使用靶基因表达的数学建模评估jak-stat1/2细胞信号传导途径活性
CA2726736A1 (en) Composition and method for determining esophageal cancer
AU2012207442B2 (en) Prognostic signature for colorectal cancer recurrence
US20040219579A1 (en) Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer
AU2008203227A1 (en) Colorectal cancer prognostics
CN115135779A (zh) 鉴定宿主rna感染生物标志物
CA2666057C (en) Genetic variations associated with tumors
CN1637151B (zh) 结肠直肠癌预后
CN112391466A (zh) 用于检测乳腺癌的甲基化生物标记物或其组合和应用
CN115505640A (zh) 检测肺癌的dna甲基化标志物及应用
KR20210090086A (ko) ATAC-seq 데이터 정규화 및 이의 활용 방법
KR20230024344A (ko) 암 및/또는 cin3를 검출하고 예측하기 위한 방법
AU2014201129A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
PL240899B1 (pl) Sposób identyfikacji osób o niewystarczającym stopniu mobilizacji farmakologicznej dla pozyskiwania HS PC, ludzki gen Panx1 z występującym w nim polimorfizmem do zastosowania w identyfikacji takich osób oraz zestaw do identyfikacji takich osób

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant