CN116867510A - 用线粒体甘油-3-磷酸酰基转移酶(gpam)抑制剂治疗肝病 - Google Patents

用线粒体甘油-3-磷酸酰基转移酶(gpam)抑制剂治疗肝病 Download PDF

Info

Publication number
CN116867510A
CN116867510A CN202280016246.0A CN202280016246A CN116867510A CN 116867510 A CN116867510 A CN 116867510A CN 202280016246 A CN202280016246 A CN 202280016246A CN 116867510 A CN116867510 A CN 116867510A
Authority
CN
China
Prior art keywords
seq
complement
gpam
nucleic acid
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280016246.0A
Other languages
English (en)
Inventor
L·A·洛塔
N·维尔韦杰
C·奥杜什莱恩
J·马奇尼
A·巴拉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN116867510A publication Critical patent/CN116867510A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/45Transferases (2)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本公开提供治疗患有肝病的受试者的方法,以及鉴定患肝病的风险提高的受试者的方法。

Description

用线粒体甘油-3-磷酸酰基转移酶(GPAM)抑制剂治疗肝病
对序列表的引用
本申请包括以电子方式提交的序列表,其为2022年2月22日创建的名为18923805802SEQ的文本文件,大小为269千字节。所述序列表以引用的方式并入本文中。
技术领域
本公开一般涉及用线粒体甘油-3-磷酸酰基转移酶(GPAM)抑制剂治疗患有肝病的受试者,以及鉴定患肝病的风险提高的受试者的方法。
背景技术
慢性肝病和肝硬化是美国发病率和死亡率的主要原因,并且2014年导致38,170人死亡(占总死亡人数的1.5%)(Kochanek等人,Nat'l.Vital Stat.Rep.,2016,65,1-122)。在美国,最常见的肝硬化病因是酒精性肝病、慢性丙型肝炎和非酒精性脂肪性肝病(NAFLD),在2004年至2013年期间,所述疾病共占等待肝移植的受试者的80%(Wong等人,Gastroenterology,2015,148,547-555)。NAFLD在美国的估计患病率在19%与46%之间(Browning等人,Hepatology,2004,40,1387-1395;Lazo等人,Am.J.Epidemiol.,2013,178,38-45;和Williams等人,Gastroenterology,2011,140,124-131),并且随着时间的推移而上升(Younossi等人,Clin.Gastroenterol.Hepatol.,2011,9,524-530),可能与肥胖率增加有关,这是其主要风险因素(Cohen等人,Science,2011,332,1519-1523)。虽然丙型肝炎的治疗取得了重大进展,但目前还没有针对酒精性或非酒精性肝病和肝硬化的循证治疗方法。
线粒体甘油-3-磷酸酰基转移酶(GPAM)是位于线粒体外膜中的甘油脂酰基转移酶蛋白家族(pfam)01553家族的成员。GPAM使用饱和脂肪酸作为其合成甘油脂的底物。GPAM将酰基-ACP的酰基酯化至甘油-3-磷酸的sn-1位,这是甘油脂生物合成的重要步骤,并且是三酰甘油(TAG)合成的第一个重要步骤。此代谢途径的第一步骤是由编码酶催化的。GPAM在肝脏和脂肪组织中表达最高,但也存在于包括脑、肾、心脏和肾上腺的许多其它组织中。
发明内容
本公开提供治疗患有肝病或有患肝病的风险的受试者的方法,所述方法包括向受试者施用GPAM抑制剂。
本公开还提供治疗患有脂肪肝病或肝脂肪或有患脂肪肝病或肝脂肪的风险的受试者的方法,所述方法包括向受试者施用GPAM抑制剂。
本公开还提供治疗患有肝细胞癌或有患肝细胞癌的风险的受试者的方法,所述方法包括向受试者施用GPAM抑制剂。
本公开还提供治疗患有肝硬化或有患肝硬化的风险的受试者的方法,所述方法包括向受试者施用GPAM抑制剂。
本公开还提供治疗患有肝纤维化或有患肝纤维化的风险的受试者的方法,所述方法包括向受试者施用GPAM抑制剂。
本公开还提供治疗患有单纯性脂肪变性、脂肪性肝炎或非酒精性脂肪性肝炎(NASH)或有患单纯性脂肪变性、脂肪性肝炎或NASH的风险的受试者的方法,所述方法包括向受试者施用GPAM抑制剂。
本公开还提供用治疗或抑制肝病的治疗剂治疗受试者的方法,其中受试者罹患肝病,所述方法包括以下步骤:通过如下方式确定受试者是否具有编码人GPAM多肽的GPAM预测功能丧失变体核酸分子:获得或已经获得来自受试者的生物样品;和对生物样品进行或已经进行序列分析以确定受试者是否具有包含GPAM预测功能丧失变体核酸分子的基因型;以及当受试者是GPAM参考时,则以标准剂量向受试者施用或继续施用治疗或抑制肝病的治疗剂,并向受试者施用GPAM抑制剂;以及当患者对GPAM预测功能丧失变体呈杂合时,则以等于或低于标准剂量的量向受试者施用或继续施用治疗或抑制肝病的治疗剂,并向受试者施用GPAM抑制剂;其中具有编码人GPAM多肽的GPAM预测功能丧失变体核酸分子的基因型的存在表明受试者患肝病的风险降低。
本公开还提供鉴定患肝病的风险提高的受试者的方法,其中所述方法包括:确定或已经确定在获自所述受试者的生物样品中存在或不存在编码人GPAM多肽的甘油-3-磷酸酰基转移酶(GPAM)预测功能丧失变体核酸分子;其中:当所述受试者是GPAM参考时,则所述受试者患肝病的风险提高;并且当所述受试者对GPAM预测功能丧失变体呈杂合或纯合时,则所述受试者患肝病的风险降低。
本公开还提供治疗或抑制肝病的治疗剂,其用于治疗具有以下的受试者的肝病:具有编码人GPAM多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170。
本公开还提供GPAM抑制剂,其用于治疗具有以下的受试者的肝病:具有编码人GPAM多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含对应于根据SEQ IDNO:2或其互补序列的位置3,195的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170。
具体实施方式
在整个说明书和权利要求书中使用与本公开的多个方面相关的各种术语。除非另有说明,否则此类术语将被赋予其在本领域中的普通含义。其它特定定义的术语将以与本文提供的定义一致的方式来解释。
除非另外明确说明,否则决不意图将本文陈述的任何方法或方面解释为要求以特定顺序执行其步骤。因此,在权利要求书或说明书中,当方法权利要求没有确切地说明步骤是限于特定顺序时,在任何方面决非意图推断顺序。这适用于任何可能的非表达解释基础,包括相对于步骤排列或操作流程的逻辑事项、从语法组织或标点中得到的普通含义或者在说明书中描述的方面的编号或类型。
除非上下文另外明确指出,否则如本文所用,单数形式“一(a/an)”和“所述(the)”包括复数个指示物。
如本文所用,术语“约”表示所列举的数值是近似值,并且小的变化不会显著影响公开的实施方案的实践。在使用数值的情况下,除非上下文另外指明,否则术语“约”意指数值可变化±10%并且仍在所公开的实施方案的范围内。
如本文所用,根据需要,在特定实施方案中,术语“包含”可替换为“由……组成”或“基本上由……组成”。
如本文所用,关于核酸分子或多肽的术语“分离的”意指核酸分子或多肽处于不同于其天然环境的条件下,例如远离血液和/或动物组织。在一些实施方案中,分离的核酸分子或多肽基本上不含其它核酸分子或其它多肽,特别是动物来源的其它核酸分子或多肽。在一些实施方案中,核酸分子或多肽可呈高度纯化的形式,即大于95%纯或大于99%纯。当在此上下文中使用时,术语“分离的”不排除存在呈替代物理形式,例如二聚体或可替代地磷酸化或衍生化形式的相同核酸分子或多肽。
如本文所用,术语“核酸”、“核酸分子”、“核酸序列”、“多核苷酸”或“寡核苷酸”可包括任何长度的核苷酸的聚合物形式,可包括DNA和/或RNA,并且可以是单链的、双链的或多链的。核酸的一条链还指其互补物。
如本文所用,术语“受试者”包括任何动物,包括哺乳动物。哺乳动物包括但不限于农场动物(例如马、牛、猪)、伴侣动物(例如狗、猫)、实验室动物(例如小鼠、大鼠、兔)和非人灵长类动物。在一些实施方案中,受试者是人。在一些实施方案中,人是在医生护理下的患者。
根据本公开已经鉴定了与人类受试者患肝病的风险降低相关的GPAM基因中的常见错义变体。例如,已观察到将人GPAM参考(参见SEQ ID NO:1)中位置3,195的腺嘌呤核苷酸变为鸟嘌呤的遗传改变,表明具有此类改变的人患肝病的风险疾病可能降低。总而言之,本文所述的遗传分析令人惊讶地表明GPAM基因,特别是GPAM基因的变体与患肝病的风险降低相关。因此,作为GPAM参考的患肝病(例如脂肪肝病(包括酒精性脂肪肝病(AFLD)和NAFLD)、肝细胞癌、肝硬化、肝纤维化、单纯性脂肪变性、脂肪性肝炎、非酒精性脂肪性肝炎(NASH)和实质性肝病)的风险提高的受试者可被治疗,从而预防肝病、减轻其症状和/或抑制症状的发展。因此,本公开提供了利用受试者中此类变体的鉴定来对此类受试者患肝病的风险进行鉴定或分层,或将受试者诊断为患肝病的风险提高的方法,使得可相应地治疗有风险的受试者或患有活动性疾病的受试者。
根据本公开进一步观察到,某些GPAM变体的总负荷与患肝病(例如脂肪肝病(包括AFLD和NAFLD)、肝细胞癌、肝硬化、肝纤维化、单纯性脂肪变性、脂肪性肝炎、非酒精性脂肪性肝炎(NASH)和实质性肝病)的风险较低相关。因此,据信患有肝病的人可用抑制GPAM的分子进行治疗。因此,本公开提供了利用受试者中此类变体的鉴定和具有此类变体的总负荷来对此类受试者患肝病的风险进行鉴定或分层,或将受试者诊断为患有肝病的方法,使得可治疗有风险的受试者或患有活动性疾病的受试者。
出于本公开的目的,可将任何特定的人分类为具有三种GPAM基因型之一:i)GPAM参考;ii)对GPAM预测功能丧失变体呈杂合;或iii)对GPAM预测功能丧失变体呈纯合。当一个人不具有GPAM预测功能丧失变体核酸分子的拷贝时,所述人是GPAM参考。当一个人具有GPAM预测功能丧失变体核酸分子的单个拷贝时,所述人对GPAM预测功能丧失变体呈杂合。GPAM预测功能丧失变体核酸分子是编码具有部分功能丧失、完全功能丧失、预测部分功能丧失或预测完全功能丧失的GPAM多肽的任何GPAM核酸分子(例如基因组核酸分子、mRNA分子或cDNA分子)。具有有部分功能丧失(或预测部分功能丧失)的GPAM多肽的人是GPAM亚等位基因的。GPAM预测功能丧失变体核酸分子可以是编码GPAM Ile43Val的任何核酸分子。GPAM Ile43Val被认为至少是部分预测功能丧失变体。当人具有GPAM预测功能丧失变体核酸分子的两个拷贝时,所述人对GPAM预测功能丧失变体呈纯合。
对于基因分型或确定为GPAM参考的受试者,此类受试者患肝病(例如脂肪肝病(包括AFLD和NAFLD)、肝细胞癌、肝硬化、肝纤维化、单纯性脂肪变性、脂肪性肝炎、非酒精性脂肪性肝炎(NASH)和实质性肝病)的风险提高。对于基因分型或确定为GPAM参考或对GPAM预测功能丧失变体呈杂合的受试者,可用GPAM抑制剂治疗此类受试者。
在本文所述的任何实施方案中,所述GPAM预测功能丧失变体核酸分子可以是编码具有部分功能丧失、完全功能丧失、预测部分功能丧失或预测完全功能丧失的GPAM多肽的任何GPAM核酸分子(例如基因组核酸分子、mRNA分子或cDNA分子)。例如,GPAM预测功能丧失变体核酸分子可以是编码GPAM Ile43Val的任何核酸分子。在本文所述的任何实施方案中,GPAM变体核酸分子可以是作为错义变体核酸分子的任何GPAM核酸分子。
在本文所述的任何实施方案中,GPAM预测功能丧失多肽可以是具有部分功能丧失、完全功能丧失、预测部分功能丧失或预测完全功能丧失的任何GPAM多肽。在本文所述的任何实施方案中,GPAM预测功能丧失多肽可以是本文所述的任何GPAM多肽,包括例如GPAMIle43Val。
在本文所述的任何实施方案中,肝病是脂肪肝病,包括AFLD和NAFLD、肝细胞癌、肝硬化、肝纤维化、单纯性脂肪变性、脂肪性肝炎、NASH或实质性肝病。在一些实施方案中,肝病是脂肪肝病。在一些实施方案中,肝病是AFLD。在一些实施方案中,肝病是NAFLD。在一些实施方案中,肝病是肝细胞癌。在一些实施方案中,肝病是肝硬化。在一些实施方案中,肝病是肝纤维化。在一些实施方案中,肝病是单纯性脂肪变性。在一些实施方案中,肝病是脂肪性肝炎。在一些实施方案中,肝病是NASH。在一些实施方案中,肝病是实质性肝病。
在一些实施方案中,肝病是肝损伤、肝脂肪沉积、肝脏炎症、中毒性肝病、免疫性肝病或丙氨酸转氨酶(ALT)升高。在一些实施方案中,肝病是肝损伤。在一些实施方案中,肝损伤通过肝酶的升高来测量。在一些实施方案中,肝病是肝脂肪沉积。在一些实施方案中,肝脂肪沉积通过成像、活检或其它程序来鉴定。在一些实施方案中,肝病是肝脏炎症。在一些实施方案中,肝脏炎症通过活检、成像或其它程序来鉴定。在一些实施方案中,肝病是中毒性肝病。在一些实施方案中,肝病是免疫性肝病。在一些实施方案中,肝病是ALT升高。在一些实施方案中,肝病是由于金属、蛋白质物质、胆汁酸或其它刺激性或促炎性物质的积累所致。在一些实施方案中,肝病是由于金属,例如铁的积累所致。在一些实施方案中,肝病是由于蛋白质物质的积累所致,例如在α1抗胰蛋白酶缺乏中。在一些实施方案中,肝病是由于胆汁酸的积累所致。在一些实施方案中,肝病是由于刺激物的积累所致。在一些实施方案中,肝病是由于促炎性物质的积累所致。
肝病的症状包括但不限于肝脏肿大、疲劳、右上腹部疼痛、腹部肿胀(腹水)、皮肤表面下的血管增大、男性乳房增大、脾脏肿大、手掌发红、皮肤和眼睛发黄(黄疸)、瘙痒、尿色深、粪便颜色苍白、恶心或呕吐、食欲不振以及容易瘀伤。肝病检测可包括血液检测、肝脏成像和肝脏活组织检查。如果受试者具有至少一个已知的风险因素(例如遗传因素,如致病突变),使得具有所述风险因素的个体患肝病的风险相比于没有所述风险因素的个体统计显著更高,则所述个体患肝病的风险提高。肝病的风险因素也是众所周知的,并且包括例如过量饮酒、肥胖、高胆固醇、血液中甘油三酯水平高、多囊卵巢综合征、睡眠呼吸暂停、2型糖尿病、甲状腺功能低下(甲状腺功能减退症)、垂体功能低下(垂体功能减退症)和代谢综合征,包括血脂升高。
本公开提供了治疗患有肝病的受试者的方法,所述方法包括向所述受试者施用GPAM抑制剂。
本公开还提供了治疗患有脂肪肝病(例如AFLD或NAFLD)的受试者的方法,所述方法包括向所述受试者施用GPAM抑制剂。
本公开还提供了治疗患有肝细胞癌的受试者的方法,所述方法包括向所述受试者施用GPAM抑制剂。
本公开还提供了治疗患有肝硬化的受试者的方法,所述方法包括向所述受试者施用GPAM抑制剂。
本公开还提供了治疗患有肝纤维化的受试者的方法,所述方法包括向所述受试者施用GPAM抑制剂。
本公开还提供了治疗患有单纯性脂肪变性、脂肪性肝炎或NASH的受试者的方法,所述方法包括向所述受试者施用GPAM抑制剂。
在一些实施方案中,GPAM抑制剂包含抑制性核酸分子。在一些实施方案中,抑制性核酸分子包含反义分子。在一些实施方案中,抑制性核酸分子包含小干扰RNA(siRNA)分子。在一些实施方案中,抑制性核酸分子包含短发夹RNA(shRNA)分子。此类抑制性核酸分子可设计成靶向GPAM mRNA的任何区域。在一些实施方案中,抑制性核酸分子与GPAM基因组核酸分子或mRNA分子内的序列杂交,并降低受试者细胞中GPAM多肽的表达。在一些实施方案中,GPAM抑制剂包含与GPAM基因组核酸分子或mRNA分子杂交并降低受试者细胞中GPAM多肽的表达的反义RNA。在一些实施方案中,GPAM抑制剂包含与GPAM基因组核酸分子或mRNA分子杂交并降低受试者细胞中GPAM多肽的表达的siRNA。在一些实施方案中,GPAM抑制剂包含与GPAM基因组核酸分子或mRNA分子杂交并降低受试者细胞中GPAM多肽的表达的shRNA。在一些实施方案中,抑制性核酸分子不是siRNA分子。
在一些实施方案中,GPAM抑制剂包含核酸酶剂或DNA结合蛋白,所述核酸酶剂在识别序列处诱导一个或多个切口或双链断裂,所述DNA结合蛋白与GPAM基因组核酸分子内的识别序列结合。识别序列可位于GPAM基因的编码区内,或位于影响基因表达的调控区内。DNA结合蛋白或核酸酶剂的识别序列可位于内含子、外显子、启动子、增强子、调控区或任何非蛋白质编码区中。识别序列可包括或接近GPAM基因的起始密码子。例如,识别序列可位于距起始密码子约10、约20、约30、约40、约50、约100、约200、约300、约400、约500或约1,000个核苷酸处。作为另一实例,可使用两种或更多种核酸酶剂,每种核酸酶剂均靶向包括或接近起始密码子的核酸酶识别序列。作为另一实例,可使用两种核酸酶剂,一种靶向包括或接近起始密码子的核酸酶识别序列,并且一种靶向包括或接近终止密码子的核酸酶识别序列,其中核酸酶剂的切割可导致两个核酸酶识别序列之间的编码区的缺失。可在所需识别序列中诱导切口或双链断裂的任何核酸酶剂均可用于本文公开的方法和组合物中。结合所需识别序列的任何DNA结合蛋白均可用于本文公开的方法和组合物中。
用于本文的合适的核酸酶剂和DNA结合蛋白包括但不限于锌指蛋白或锌指核酸酶(ZFN)对、转录激活因子样效应物(TALE)蛋白或转录激活因子样效应物核酸酶(TALEN),或成簇规则散布的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统。识别序列的长度可变化,并且包括例如对于锌指蛋白或ZFN对为约30-36bp、对于每个ZFN为约15-18bp、对于TALE蛋白或TALEN为约36bp并且对于CRISPR/Cas指导RNA为约20bp的识别序列。
在一些实施方案中,CRISPR/Cas系统可用于修饰细胞内的GPAM基因组核酸分子。本文公开的方法和组合物可通过利用CRISPR复合物(包含与Cas蛋白复合的指导RNA(gRNA))采用CRISPR-Cas系统用于GPAM核酸分子的定点裂解。
Cas蛋白通常包含至少一个可与gRNA相互作用的RNA识别或结合域。Cas蛋白还可包含核酸酶域(例如DNA酶或RNA酶域)、DNA结合域、解旋酶域、蛋白质-蛋白质相互作用域、二聚化域和其它域。合适的Cas蛋白包括例如野生型Cas9蛋白和野生型Cpf1蛋白(例如FnCpf1)。Cas蛋白可具有完全切割活性以在GPAM基因组核酸分子中产生双链断裂,或者它可以是在GPAM基因组核酸分子中产生单链断裂的切口酶。Cas蛋白的另外的实例包括但不限于Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966,以及它们的同源物或修饰型式。Cas蛋白也可以可操作地连接至异源多肽为融合蛋白。例如,Cas蛋白可与切割域、表观遗传修饰域、转录激活域或转录抑制域融合。Cas蛋白可以任何形式提供。例如,Cas蛋白可以蛋白质,例如与gRNA复合的Cas蛋白的形式提供。替代地,Cas蛋白可以编码Cas蛋白的核酸分子,例如RNA或DNA的形式提供。
在一些实施方案中,可通过使细胞与Cas蛋白和一种或多种gRNA接触来产生GPAM基因组核酸分子的靶向遗传修饰,所述gRNA与在GPAM基因组核酸分子中的靶基因组基因座内的一种或多种gRNA识别序列杂交。例如,gRNA识别序列可位于SEQ ID NO:1的区域内。所述gRNA识别序列还可包括或接近对应于根据SEQ ID NO:1的位置3,195的位置。例如,gRNA识别序列可位于距对应于根据SEQ ID NO:1的位置3,195的位置的约1000、约500、约400、约300、约200、约100、约50、约45、约40、约35、约30、约25、约20、约15、约10或约5个核苷酸处。所述gRNA识别序列可包括或接近GPAM基因组核酸分子的起始密码子或GPAM基因组核酸分子的终止密码子。例如,gRNA识别序列可位于距起始密码子或终止密码子约10、约20、约30、约40、约50、约100、约200、约300、约400、约500或约1,000个核苷酸处。
GPAM基因组核酸分子中靶基因组基因座内的gRNA识别序列位于原型间隔区邻近基序(PAM)序列附近,PAM序列是紧随Cas9核酸酶靶向的DNA序列之后的2-6个碱基对的DNA序列。规范的PAM是序列5’-NGG-3’,其中“N”是任何核碱基,接着是两个鸟嘌呤(“G”)核碱基。gRNA可将Cas9转运至基因组中的任何位置用于基因编辑,但在除了Cas9识别PAM的位点之外的任何位点都不会发生编辑。另外,5’-NGA-3’可作为人体细胞的高效非经典PAM。一般地,PAM在gRNA靶向的DNA序列下游约2-6个核苷酸处。PAM可侧接gRNA识别序列。在一些实施方案中,gRNA识别序列可在3’端被PAM侧接。在一些实施方案中,gRNA识别序列可在5’端被PAM侧接。例如,Cas蛋白的切割位点可在PAM序列上游或下游约1个至约10个、约2个至约5个碱基对,或3个碱基对处。在一些实施方案中(例如当使用来自酿脓链球菌(S.pyogenes)的Cas9或密切相关的Cas9时),非互补链的PAM序列可以是5’-NGG-3’,其中N是任何DNA核苷酸并且紧邻靶DNA的非互补链的gRNA识别序列的3’。因而,互补链的PAM序列将是5’-CCN-3’,其中N是任何DNA核苷酸并紧邻靶DNA的互补链的gRNA识别序列的5’。
gRNA是与Cas蛋白结合并将Cas蛋白靶向GPAM基因组核酸分子内的特定位置的RNA分子。示例性gRNA是有效指导Cas酶结合于或切割GPAM基因组核酸分子的gRNA,其中所述gRNA包含DNA靶向区段,其与GPAM基因组核酸分子内的gRNA识别序列杂交,所述gRNA识别序列包含或接近对应于:根据SEQ ID NO:1的位置3,195的位置。例如,可选择gRNA以使其与位于距对应于根据SEQ ID NO:1的位置3,195的位置的约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约100、约200、约300、约400、约500或约1,000个核苷酸处的gRNA识别序列杂交。其它示例性gRNA包含DNA靶向区段,其与GPAM基因组核酸分子内存在的gRNA识别序列杂交,所述gRNA识别序列包含或接近起始密码子或终止密码子。例如,可选择gRNA以使其与位于距起始密码子约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约100、约200、约300、约400、约500或约1,000个核苷酸处或位于距终止密码子约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约100、约200、约300、约400、约500或约1,000个核苷酸处的gRNA识别序列杂交。合适的gRNA可包含约17至约25个核苷酸、约17至约23个核苷酸、约18至约22个核苷酸或约19至约21个核苷酸。在一些实施方案中,gRNA可包含20个核苷酸。
位于人GPAM参考基因内的合适的gRNA识别序列的示例在表1中作为SEQ ID NO:31-44列出。
表1:GPAM变异附近的指导RNA识别序列
gRNA识别序列 SEQ ID NO:
- ATGGCCTTTTCCGACTCATT 31
+ AAAGCCTAATGAGTCGGAAA 32
- GTAAGGTTCTTACCCAGCTC 33
- ATTAGGGTCAATAAGCAGTA 34
+ AGTCGGAAAAGGCCATTTGT 35
- TAAGGTTCTTACCCAGCTCT 36
+ AATATTTGTCAGGGTGAGTG 37
- GTTGCAGATCTGAAGATGGT 38
- TACCCAGCTCTGGGGAGTGC 39
+ GGAAAGAAAGCCTAATGAGT 40
- AAGGTTCTTACCCAGCTCTG 41
- AGTTGCAGATCTGAAGATGG 42
+ ATTATTTCCAACTTTGTAGT 43
- TAACAACATCTTCCAACAAA 44
Cas蛋白和gRNA形成复合物,并且Cas蛋白切割靶GPAM基因组核酸分子。Cas蛋白可在gRNA的DNA靶向区段将与之结合的靶GPAM基因组核酸分子中存在的核酸序列内或外的位点处切割核酸分子。例如,CRISPR复合物(包含与gRNA识别序列杂交并与Cas蛋白复合的gRNA)的形成可导致在gRNA的DNA靶向区段将结合的GPAM基因组核酸分子中存在的核酸序列中或附近(例如来自所述核酸序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个或更多个碱基对内)的一条或两条链的切割。
此类方法可产生例如其中SEQ ID NO:1的区域被破坏、起始密码子被破坏、终止密码子被破坏或编码序列被破坏或缺失的GPAM基因组核酸分子。任选地,细胞可进一步与一种或多种另外的gRNA接触,所述另外的gRNA与GPAM基因组核酸分子中靶基因组基因座内另外的gRNA识别序列杂交。通过使所述细胞与一种或多种另外的gRNA(例如与第二gRNA识别序列杂交的第二gRNA)接触,由Cas蛋白切割可产生两个或更多个双链断裂或者两个或更多个单链断裂。
在一些实施方案中,GPAM抑制剂包含小分子。在一些实施方案中,GPAM抑制剂是FSG67。在一些实施方案中,GPAM抑制剂包含:取代或未取代的苯甲酸衍生物(例如2-(链烷磺酰胺基)苯甲酸,例如4-([1,1'-联苯]-4-羰基)-2-(辛烷磺酰胺基)苯甲酸))(参见Outlaw等人,Med.Chem.Comm.,2014,5,826-830);取代或未取代的7-氨基吲哚衍生物(例如7-氨基-5-氰基吲哚)(参见Outlaw等人,Org.Lett.,2014,16,6334-6337);取代或未取代的苯甲酸衍生物(例如2-(壬基磺酰胺基)苯甲酸)(参见Wydysh等人,J.Med.Chem.,2011,52,3317-3327);取代或未取代的噻吩和硫代内酯、取代或未取代的膦酸酯、取代或未取代的苯基、取代或未取代的苯甲酸、取代或未取代的2-、3-或4-(链烷磺酰胺基)苯甲酸、取代或未取代的2-、3-或4-(链烷磺酰胺基)苯甲酸,或2-、3-或4-(链烷磺酰胺基)苯甲酸膦酸(参见美国专利第9,149,445号);以及取代或未取代的2-(链烷磺酰胺基)苯甲酸(参见PCT公开案第WO 2019/165232号)。
在一些实施方案中,治疗方法还包括检测来自受试者的生物样品中存在或不存在编码人GPAM多肽的GPAM预测功能丧失变体核酸分子。如本公开通篇所用,“GPAM预测功能丧失变体核酸分子”是编码具有部分功能丧失、完全功能丧失、预测部分功能丧失或预测完全功能丧失的GPAM多肽的任何GPAM核酸分子(例如基因组核酸分子、mRNA分子或cDNA分子)。
本公开还提供了用治疗或抑制肝病的治疗剂治疗受试者的方法,其中所述受试者罹患肝病。在一些实施方案中,方法包括通过以下确定受试者是否具有编码人GPAM多肽的GPAM预测功能丧失变体核酸分子:获得或已经获得来自受试者的生物样品,并且对生物样品进行或已经进行序列分析以确定受试者是否具有包含GPAM预测功能丧失变体核酸分子的基因型。当受试者是GPAM参考时,以标准剂量向受试者施用或继续施用治疗或抑制肝病的治疗剂,并且向受试者施用GPAM抑制剂。当受试者对GPAM预测功能丧失变体呈杂合时,以等于或低于标准剂量的量向受试者施用或继续施用治疗或抑制肝病的治疗剂,并且向受试者施用GPAM抑制剂。具有编码人GPAM多肽的GPAM预测功能丧失变体核酸分子的基因型的存在表明受试者患肝病的风险降低。在一些实施方案中,受试者是GPAM参考。在一些实施方案中,受试者对GPAM预测功能丧失变体呈杂合。
在一些实施方案中,方法包括通过以下确定受试者具有多个由mRNA分子产生的GPAM预测功能丧失变体基因组核酸分子、GPAM预测功能丧失变体mRNA分子和/或GPAM预测功能丧失变体cDNA分子的总负荷:对从受试者获得的生物样品进行或已经进行序列分析以确定受试者的总负荷。当受试者具有较小总负荷时,受试者患肝病的风险较高,并且向受试者施用或继续施用标准剂量的治疗或抑制肝病的治疗剂。当受试者具有较大总负荷时,受试者患肝病的风险较低,并且向受试者施用或继续施用等于或低于标准剂量的治疗或抑制肝病的治疗剂。总负荷越大,患肝病的风险就越低。
对于被基因分型或确定为GPAM参考或对GPAM预测功能丧失变体呈杂合的受试者,可用如本文所述的GPAM抑制剂治疗此类受试者。
检测来自受试者的生物样品中存在或不存在GPAM预测功能丧失变体核酸分子和/或确定受试者是否具有GPAM预测功能丧失变体核酸分子可通过本文所述的任何方法进行。在一些实施方案中,这些方法可在体外进行。在一些实施方案中,这些方法可原位进行。在一些实施方案中,这些方法可在体内进行。在这些实施方案中的任一者中,核酸分子可存在于从受试者获得的细胞内。
在一些实施方案中,当受试者是GPAM参考时,还以标准剂量向受试者施用治疗或抑制肝病的治疗剂。在一些实施方案中,当受试者对GPAM预测功能丧失变体呈杂合时,还以等于或低于标准剂量的剂量向受试者施用治疗或抑制肝病的治疗剂。
在一些实施方案中,治疗方法还包括检测来自受试者的生物样品中GPAM预测功能丧失多肽的存在或不存在。在一些实施方案中,当受试者不具有GPAM预测功能丧失多肽时,还以标准剂量向受试者施用治疗或抑制肝病的治疗剂。在一些实施方案中,当受试者具有GPAM预测功能丧失多肽时,还以等于或低于标准剂量的剂量向受试者施用治疗或抑制肝病的治疗剂。
本公开还提供了用治疗或抑制肝病的治疗剂治疗受试者的方法,其中所述受试者罹患肝病。在一些实施方案中,方法包括通过以下方式确定受试者是否具有GPAM预测功能丧失多肽:从所述受试者获得或已经获得生物样品,并且对所述生物样品进行或已经进行测定以确定所述受试者是否具有GPAM预测功能丧失多肽。当受试者不具有GPAM预测功能丧失多肽时,以标准剂量向受试者施用或继续施用治疗或抑制肝病的治疗剂,并且向受试者施用GPAM抑制剂。当受试者具有GPAM预测功能丧失多肽时,以等于或低于标准剂量的量向受试者施用或继续施用治疗或抑制肝病的治疗剂,并且向受试者施用GPAM抑制剂。GPAM预测功能丧失多肽的存在指示受试者患肝病的风险降低。在一些实施方案中,受试者具有GPAM预测功能丧失多肽。在一些实施方案中,受试者不具有GPAM预测功能丧失多肽。
检测来自受试者的生物样品中存在或不存在GPAM预测功能丧失多肽和/或确定受试者是否具有GPAM预测功能丧失多肽可通过本文所述的任何方法进行。在一些实施方案中,这些方法可在体外进行。在一些实施方案中,这些方法可原位进行。在一些实施方案中,这些方法可在体内进行。在这些实施方案中的任一者中,多肽可存在于从受试者获得的细胞内。
治疗或抑制肝病的治疗剂的实例包括但不限于:双硫仑、纳曲酮、阿坎酸、泼尼松(Prednisone)、泼尼松、硫唑嘌呤、青霉胺、曲恩汀、去铁胺、环丙沙星、诺氟沙星、头孢曲松、氧氟沙星、阿莫西林-克拉维酸、植物甲萘醌、布美他尼(Bumetanide)、呋塞米、氢氯噻嗪、氯噻嗪、阿米洛利(Amiloride)、氨苯蝶啶、螺内酯、奥曲肽、阿替洛尔(Atenolol)、美托洛尔(Metoprolol)、纳多洛尔(Nadolol)、普萘洛尔(Propranolol)、噻吗洛尔(Timolol)和卡维地洛(Carvedilol)。
肝病治疗剂(例如用于慢性丙型肝炎治疗)的其它实例包括但不限于利巴韦林(ribavirin)、帕利普韦(paritaprevir)、西米普韦(simeprevir)(Olysio)、格拉瑞韦(grazoprevir)、雷迪帕韦(ledipasvir)、奥比他韦(ombitasvir)、依巴司韦(elbasvir)、达卡他韦(daclatasvir)(Daklinza)、达拉他韦(dasabuvir)、利托那韦(ritonavir)、索非布韦(sofosbuvir)、维帕他韦(velpatasvir)、伏西瑞韦(voxilaprevir)、格卡瑞韦(glecaprevir)、哌仑他韦(pibrentasvir)、聚乙二醇干扰素α-2a、聚乙二醇干扰素α-2b和干扰素α-2b。
肝病治疗剂(例如用于非酒精性脂肪肝)的其它实例包括但不限于体重减轻诱导剂,例如奥利司他(orlistat)或西布曲明(sibutramine);胰岛素增敏剂,例如噻唑烷二酮(TZD)、二甲双胍和格列奈类;降脂剂,例如他汀类药物、贝特类药物和ω-3脂肪酸;抗氧化剂,例如维生素E、甜菜碱、N-乙酰半胱氨酸、卵磷脂、水飞蓟素和β-胡萝卜素;抗TNF剂,例如己酮可可碱;益生菌,例如VSL#3;和细胞保护剂,例如熊去氧胆酸(UDCA)。其它合适的治疗包括ACE抑制剂/ARB、低聚果糖和肠促胰岛素类似物。
肝病治疗剂(例如用于NASH)的其它实例包括但不限于(奥贝胆酸)、司隆色替(Selonsertib)、艾拉菲诺(Elafibranor)、塞尼维罗(Cenicriviroc)、GR_MD_02、MGL_3196、IMM124E、花生酰氨基胆酸(ARAMCHOLTM)、GS0976、恩利卡生(Emricasan)、伏昔巴特(Volixibat)、NGM282、GS9674、托匹非索(Tropifexor)、MN_001、LMB763、BI_1467335、MSDC_0602、PF_05221304、DF102、沙罗格列扎(Saroglitazar)、BMS986036、拉尼兰诺(Lanifibranor)、索马鲁肽(Semaglutide)、硝唑尼特(Nitazoxanide)、GRI_0621、EYP001、VK2809、纳美芬(Nalmefene)、LIK066、MT_3995、依洛西巴特(Elobixibat)、纳莫德森(Namodenoson)、福雷芦单抗(Foralumab)、SAR425899、索格列净(Sotagliflozin)、EDP_305、艾萨布特(Isosabutate)、吉卡宾(Gemcabene)、TERN_101、KBP_042、PF_06865571、DUR928、PF_06835919、NGM313、BMS_986171、那马珠单抗(Namacizumab)、CER_209、ND_L02_s0201、RTU_1096、DRX_065、IONIS_DGAT2Rx、INT_767、NC_001、Seladepar、PXL770、TERN_201、NV556、AZD2693、SP_1373、VK0214、Hepastem、TGFTX4、RLBN1127、GKT_137831、RYI_018、CB4209-CB4211和JH_0920。
在一些实施方案中,与作为GPAM参考的人类受试者(其可接受标准剂量)相比,对于对GPAM预测功能丧失变体呈杂合的受试者,治疗或抑制肝病的治疗剂的剂量可减少约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%或约90%(即,低于标准剂量)。在一些实施方案中,治疗或抑制肝病的治疗剂的剂量可减少约10%、约20%、约30%、约40%或约50%。另外,与作为GPAM参考的受试者相比,在对GPAM预测功能丧失变体呈杂合的受试者中,治疗或抑制肝病的治疗剂的剂量可以较低频率施用。
治疗或抑制肝病的治疗剂和/或GPAM抑制剂的施用可在一天、两天、三天、五天、一周、两周、三周、一个月、五周、六周、七周、八周、两个月或三个月后重复。重复施用可为相同剂量或不同剂量。施用可重复一次、两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次。例如,根据某些剂量方案,受试者可接受长时间段的疗法,例如6个月、1年或更长时间。
治疗或抑制肝病的治疗剂和/或GPAM抑制剂的施用可通过任何合适的途径进行,包括但不限于肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌内。用于施用的药物组合物理想地是无菌且基本上等渗的,并且在GMP条件下制造。药物组合物可以单位剂型(即单次施用的剂量)提供。药物组合物可使用一种或多种生理上和药学上可接受的载剂、稀释剂、赋形剂或助剂来配制。配制物取决于所选的施用途径。术语“药学上可接受的”意指载剂、稀释剂、赋形剂或助剂与配制物的其它成分相容,并且对其接受者基本上无害。
在本文所述的任何实施方案中,本文所述的任何治疗化合物都可配制成药物组合物。使用标准药物配制技术,例如以引用的方式整体并入本文中的Remington's TheScience and Practice of Pharmacy,第21版,Lippincott Williams&Wilkins(2005)中公开的那些技术。因此,药物组合物可包含:a)安全且治疗有效量的本文所述的化合物或其药学上可接受的盐,和/或b)药学上可接受的载剂、稀释剂、赋形剂或其组合。
在本文所述的任何实施方案中,本文所述的任何治疗化合物都可配制成单一药物组合物。在一些实施方案中,本文所述的任何治疗化合物可与一种或多种第二药剂或包含一种或多种第二药剂的药物组合物组合施用。
术语“药学上可接受的载剂”或“药学上可接受的赋形剂”包括任何和所有溶剂、稀释剂、乳化剂、粘合剂、缓冲剂、分散介质、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等,或任何其它可用于制备药物配制物的此类化合物。除非任何常规介质或试剂与活性成分不相容,否则考虑将其用于治疗组合物中。补充性活性成分也可掺入组合物中。另外,可包括各种佐剂,例如本领域常用的佐剂。这些和其它此类化合物描述于文献中,例如MerckIndex,Merck&Company,Rahway,NJ中。药物组合物中包含各种组分的考虑因素描述于例如Gilman等人(编)(1990);Goodman and Gilman’s:The Pharmacological Basis ofTherapeutics,第8版,Pergamon Press中。
在一些实施方案中,可用作药学上可接受的载剂或其组分的物质包括但不限于:糖,例如乳糖、葡萄糖和蔗糖;淀粉,例如玉米淀粉和马铃薯淀粉;纤维素和其衍生物,例如羧甲基纤维素钠、乙基纤维素和甲基纤维素;黄蓍粉;麦芽;明胶;滑石;固体润滑剂,例如硬脂酸和硬脂酸镁;硫酸钙;植物油,例如花生油、棉籽油、芝麻油、橄榄油、玉米油和可可油;多元醇,例如丙二醇、甘油、山梨醇、甘露醇和聚乙二醇;海藻酸;乳化剂,例如TWEENS;润湿剂,例如十二烷基硫酸钠;着色剂;调味剂;压片剂、稳定剂;抗氧化剂;防腐剂;无热原水;等渗盐水;和磷酸盐缓冲溶液。与主题化合物结合使用的药学上可接受的载剂的选择可根据化合物的施用方式来确定。
本文所述的药物组合物可以单位剂型提供。如本文所用,“单位剂型”是含有适合根据良好医学实践以单次剂量施用于受试者的量的化合物的组合物。然而,单次剂型或单位剂型的制备并不意味着所述剂型每天施用一次或每个疗程施用一次。单位剂型可包含单次日剂量或部分亚剂量,其中在一天的过程中施用若干个单位剂型以完成日剂量。在一些实施方案中,单位剂型可以多于或少于每天一次施用,且可在治疗过程中施用多于一次。此类剂型可以与其配制物一致的任何方式施用,包括经口、肠胃外,并且可在一段时间(例如约30分钟至约2-6小时)内作为输注施用。虽然特别考虑了单次施用,但是根据本文所述的方法施用的组合物也可作为连续输注或通过可植入输注泵施用。
在一些实施方案中,可使用各种口服剂型,包括固体形式,例如片剂、胶囊、颗粒和散装粉末。片剂可以是压制片、研制片剂、肠溶衣、糖衣、薄膜衣或多重压制片,其含有合适的粘合剂、润滑剂、稀释剂、崩解剂、着色剂、调味剂、流动诱导剂和融化剂。液体口服剂型包括水溶液、乳液、悬浮液、由非泡腾颗粒复原的溶液和/或悬浮液、以及由泡腾颗粒复原的泡腾制剂,其含有合适的溶剂、防腐剂、乳化剂、悬浮剂、稀释剂、甜味剂、融化剂、着色剂和调味剂。
片剂典型地包含常规的药学相容性佐剂作为惰性稀释剂,例如碳酸钙、碳酸钠、甘露醇、乳糖和纤维素;粘合剂,例如淀粉、明胶和蔗糖;崩解剂,例如淀粉、海藻酸和交联羧甲基纤维素;润滑剂,例如硬脂酸镁、硬脂酸、微晶纤维素、羧甲基纤维素和滑石。片剂还可包含增溶剂或乳化剂,例如泊洛沙姆、克列莫佛(cremophor)//甲基纤维素、羟丙基甲基纤维素或本领域已知的其它试剂。助流剂例如二氧化硅可用于改善粉末混合物的流动特征。为了美观,可添加着色剂,例如FD&C染料。甜味剂和调味剂,例如阿斯巴甜、糖精、薄荷醇、薄荷和果味香精是咀嚼片的有用佐剂。胶囊典型地包含一种或多种上文公开的固体稀释剂。根据需要,载剂组分的选择取决于次要考虑因素,如味道、成本和储存稳定性。
口服(PO)组合物还包括液体溶液、乳液、悬浮液等。用于糖浆、酏剂、乳液和悬浮液的载剂的典型组分包括乙醇、甘油、丙二醇、聚乙二醇、液体蔗糖、山梨醇和水。对于悬浮液,典型的悬浮剂包括甲基纤维素、羧甲基纤维素钠、AVICEL RC-591、黄蓍胶和海藻酸钠;典型的润湿剂包括卵磷脂和聚山梨醇酯80;并且典型的防腐剂包括对羟基苯甲酸甲酯和苯甲酸钠。口服液体组合物还可含有一种或多种组分,例如甜味剂、调味剂和着色剂。
在一些实施方案中,组合物还可通过常规方法进行包覆,典型地使用pH或时间依赖性包衣,使得化合物在所需局部施用附近的胃肠道中释放,或在不同时间释放以延长所需作用。此类剂型典型地包括但不限于以下中的一者或多者:邻苯二甲酸乙酸纤维素、邻苯二甲酸聚乙酸乙烯酯、邻苯二甲酸羟丙基甲基纤维素、乙基纤维素、Eudragit包衣、蜡和虫胶。
在一些实施方案中,可用于实现主题化合物的全身递送的组合物包括舌下、经颊和经鼻剂型。此类组合物典型地包含以下中的一者或多者:可溶性填充剂物质,例如蔗糖、山梨醇和甘露醇;以及粘合剂,例如阿拉伯胶、微晶纤维素、羧甲基纤维素和羟丙基甲基纤维素。还可包括助流剂、润滑剂、甜味剂、着色剂、抗氧化剂和调味剂。
在一些实施方案中,可用于本文公开的药物组合物中的防腐剂包括但不限于苯扎氯铵、PHMB、氯丁醇、硫柳汞、苯汞、乙酸盐和硝酸苯汞。有用的表面活性剂为例如Tween 80。同样,可使用各种有用的媒剂,包括但不限于聚乙烯醇、聚维酮、羟丙基甲基纤维素、泊洛沙姆、羧甲基纤维素、羟乙基纤维素和纯化水。
在一些实施方案中,可根据需要或方便添加张力调节剂。其包括但不限于盐,特别是氯化钠、氯化钾、甘露醇和甘油,或任何其它合适的张力调节剂。
在一些实施方案中,可使用各种用于调节pH的缓冲剂和方法。在一些实施方案中,pH将在4与9之间。合适的缓冲剂包括但不限于乙酸盐缓冲剂、柠檬酸盐缓冲剂、磷酸盐缓冲剂和硼酸盐缓冲剂。根据需要,可使用酸或碱来调节这些配制物的pH。
在一些实施方案中,组合物可包含抗氧化剂,包括但不限于焦亚硫酸钠、硫代硫酸钠、乙酰半胱氨酸、丁基化羟基茴香醚和丁基化羟基甲苯。
在一些实施方案中,组合物可包含其它赋形剂组分,例如螯合剂。有用的螯合剂是乙二胺四乙酸二钠,但也可使用其它螯合剂。
在一些实施方案中,组合物用于局部使用,包括用于透皮施用、乳膏、软膏、凝胶、溶液或悬浮液等。局部配制物通常可由药物载剂、助溶剂、乳化剂、渗透促进剂、防腐剂系统和润肤剂构成。
对于静脉内施用,本文所述的化合物和组合物可溶解或分散于药学上可接受的稀释剂,例如盐水或葡萄糖溶液中。可包括合适的赋形剂以达到所需pH,包括但不限于NaOH、碳酸钠、乙酸钠、HCl和柠檬酸。在一些实施方案中,最终组合物的pH在2至8或4至7范围内。抗氧化剂赋形剂可包括亚硫酸氢钠、丙酮亚硫酸氢钠、甲醛钠、次硫酸盐、硫脲和EDTA。最终静脉内组合物中存在的合适赋形剂的其它非限制性实例可包括磷酸钠或磷酸钾、柠檬酸、酒石酸、明胶和碳水化合物,例如葡萄糖、甘露醇和葡聚糖。其它可接受的赋形剂描述于Powell等人,PDAJ.Pharm.Sci.and Tech.,1998,52 238-311和Nema等人,PDAJ.Pharm.Sci.Tech.,2011,65 287-332中。还可包括抗微生物剂以获得抑细菌或抑真菌溶液,包括但不限于硝酸苯汞、硫柳汞、苄索氯铵、苯扎氯铵、苯酚、甲酚和氯代丁醇。
在一些实施方案中,用于静脉内施用的组合物可以一种或多种固体的形式提供给照料者,所述固体在施用前不久用合适的稀释剂例如无菌水、盐水或葡萄糖水溶液复原。在一些实施方案中,组合物以准备胃肠外施用的溶液形式提供。在一些实施方案中,组合物以在施用前进一步稀释的溶液形式提供。在包括施用本文所述的化合物和另一种药剂的组合的实施方案中,所述组合可作为混合物提供给照料者,或者照料者可在施用之前混合两种药剂,或者可单独施用两种药剂。
本文所述的化合物和/或本文所述的第二药剂的实际单位剂量取决于具体的化合物和待治疗的病况。在一些实施方案中,剂量可为约0.01mg/kg至约120mg/kg体重或更多、约0.05mg/kg或更少至约70mg/kg、约0.1mg/kg至约50mg/kg体重、约1.0mg/kg至约10mg/kg体重、约5.0mg/kg至约10mg/kg体重、或约10.0mg/kg至约20.0mg/kg体重。在一些实施方案中,剂量可小于约100mg/kg、小于约90mg/kg、小于约80mg/kg、小于约70mg/kg、小于约60mg/kg、小于约50mg/kg、小于约40mg/kg、小于约30mg/kg、小于约25mg/kg、小于约20mg/kg、小于约10mg/kg、小于约7.5mg/kg、小于约6mg/kg、小于约5mg/kg、小于约4mg/kg、小于约3mg/kg、小于约2.5mg/kg、小于约1mg/kg、小于约0.5mg/kg、小于约0.1mg/kg、小于约0.05mg/kg、或小于约0.005mg/kg体重。在一些实施方案中,实际单位剂量为0.05mg/kg体重、0.07mg/kg体重、0.1mg/kg体重、0.3mg/kg体重、1.0mg/kg体重、3.0mg/kg体重、5.0mg/kg体重、10.0mg/kg体重或25.0mg/kg体重。因此,对于施用于70kg体重的人,剂量范围将为约0.1mg至约70mg、约1mg至约50mg、约0.5mg至约10mg、约1mg至约10mg、约2.5mg至约30mg、约35mg或更少至约700mg或更多、约7mg至约600mg、约10mg至约500mg、或约20mg至约300mg、或约200mg至约2000mg。在一些实施方案中,实际单位剂量为约0.1mg。在一些实施方案中,实际单位剂量为约0.5mg。在一些实施方案中,实际单位剂量为约1mg。在一些实施方案中,实际单位剂量为约1.5mg。在一些实施方案中,实际单位剂量为约2mg。在一些实施方案中,实际单位剂量为约2.5mg。在一些实施方案中,实际单位剂量为约3mg。在一些实施方案中,实际单位剂量为约3.5mg。在一些实施方案中,实际单位剂量为约4mg。在一些实施方案中,实际单位剂量为约4.5mg。在一些实施方案中,实际单位剂量为约5mg。在一些实施方案中,实际单位剂量为约10mg。在一些实施方案中,实际单位剂量为约25mg。在一些实施方案中,实际单位剂量为约250mg或更少。在一些实施方案中,实际单位剂量为约100mg或更少。在一些实施方案中,实际单位剂量为约70mg或更少。
在一些实施方案中,化合物剂量可为约0.1mg至约100mg、约0.1mg至约50mg、约0.1mg至约20mg、约0.1mg至约10mg、约0.5mg至约100mg、约0.5mg至约50mg、约0.5mg至约20mg、约0.5mg至约10mg、约1mg至约100mg、约1mg至约50mg、约1mg至约20mg、约1mg至约10mg、约2.5mg至约50mg、约2.5mg至约20mg、约2.5mg至约10mg、或约2.5mg至约5mg。在一些实施方案中,化合物剂量为约5mg至约300mg、约5mg至约200mg、约7.5mg至约200mg、约10mg至约100mg、约15mg至约100mg、约20mg至约100mg、约30mg至约100mg、约40mg至约100mg、约10mg至约80mg、约15mg至约80mg、约20mg至约80mg、约30mg至约80mg、约40mg至约80mg、约10mg至约60mg、约15mg至约60mg、约20mg至约60mg、约30mg至约60mg、或约40mg至约60mg。在一些实施方案中,施用的化合物为约20mg至约60mg、约27mg至约60mg、约20mg至约45mg、或约27mg至约45mg。
在一些实施方案中,施用的化合物为约5mg至约7.5mg、约5mg至约9mg、约5mg至约10mg、约5mg至约12mg、约5mg至约14mg、约5mg至约15mg、约5mg至约16mg、约5mg至约18mg、约5mg至约20mg、约5mg至约22mg、约5mg至约24mg、约5mg至约26mg、约5mg至约28mg、约5mg至约30mg、约5mg至约32mg、约5mg至约34mg、约5mg至约36mg、约5mg至约38mg、约5mg至约40mg、约5mg至约42mg、约5mg至约44mg、约5mg至约46mg、约5mg至约48mg、约5mg至约50mg、约5mg至约52mg、约5mg至约54mg、约5mg至约56mg、约5mg至约58mg、约5mg至约60mg、约10mg至约12mg、约10mg至约14mg、约10mg至约15mg、约10mg至约16mg、约10mg至约18mg、约10mg至约20mg、约10mg至约22mg、约10mg至约24mg、约10mg至约26mg、约10mg至约28mg、约10mg至约30mg、约10mg至约32mg、约10mg至约34mg、约10mg至约36mg、约
10mg至约38mg、约10mg至约40mg、约10mg至约42mg、约
10mg至约44mg、约10mg至约46mg、约10mg至约48mg、约
10mg至约50mg、约10mg至约52mg、约10mg至约54mg、约
10mg至约56mg、约10mg至约58mg、约10mg至约60mg、约
15mg至约16mg、约15mg至约18mg、约15mg至约20mg、约
15mg至约22mg、约15mg至约24mg、约15mg至约26mg、约
15mg至约28mg、约15mg至约30mg、约15mg至约32mg、约
15mg至约34mg、约15mg至约36mg、约15mg至约38mg、约
15mg至约40mg、约15mg至约42mg、约15mg至约44mg、约
15mg至约46mg、约15mg至约48mg、约15mg至约50mg、约
15mg至约52mg、约15mg至约54mg、约15mg至约56mg、约
15mg至约58mg、约15mg至约60mg、约20mg至约22mg、约
20mg至约24mg、约20mg至约26mg、约20mg至约28mg、约
20mg至约30mg、约20mg至约32mg、约20mg至约34mg、约
20mg至约36mg、约20mg至约38mg、约20mg至约40mg、约
20mg至约42mg、约20mg至约44mg、约20mg至约46mg、约
20mg至约48mg、约20mg至约50mg、约20mg至约52mg、约
20mg至约54mg、约20mg至约56mg、约20mg至约58mg、约
20mg至约60mg、约25mg至约26mg、约25mg至约28mg、约
25mg至约30mg、约25mg至约32mg、约25mg至约34mg、约
25mg至约36mg、约25mg至约38mg、约25mg至约40mg、约
25mg至约42mg、约25mg至约44mg、约25mg至约46mg、约
25mg至约48mg、约25mg至约50mg、约25mg至约52mg、约
25mg至约54mg、约25mg至约56mg、约25mg至约58mg、约
25mg至约60mg、约30mg至约32mg、约30mg至约34mg、约
30mg至约36mg、约30mg至约38mg、约30mg至约40mg、约
30mg至约42mg、约30mg至约44mg、约30mg至约46mg、约
30mg至约48mg、约30mg至约50mg、约30mg至约52mg、约
30mg至约54mg、约30mg至约56mg、约30mg至约58mg、约
30mg至约60mg、约40mg至约42mg、约40mg至约44mg、约40mg至约46mg、约40mg至约48mg、约40mg至约50mg、约40mg至约52mg、约40mg至约54mg、约40mg至约56mg、约40mg至约58mg、约40mg至约60mg、约45mg至约48mg、约45mg至约50mg、约45mg至约52mg、约45mg至约54mg、约45mg至约56mg、约45mg至约58mg、约45mg至约60mg、约50mg至约52mg、约50mg至约54mg、约50mg至约56mg、约50mg至约58mg、或约50mg至约60mg。
在一些实施方案中,化合物剂量为大于约5mg、大于约10mg、大于约12.5mg、大于约13.5mg、大于约15mg、大于约17.5mg、大于约20mg、大于约22.5mg、大于约25mg、大于约27mg、大于约30mg、大于约40mg、大于约50mg、大于约60mg、大于约70mg、大于约80mg、大于约90mg、大于约100mg、大于约125mg、大于约150mg、或大于约200mg。在一些实施方案中,化合物剂量为小于约5mg、小于约10mg、小于约12.5mg、小于约13.5mg、小于约15mg、小于约17.5mg、小于约20mg、小于约22.5mg、小于约25mg、小于约27mg、小于约30mg、小于约40mg、小于约50mg、小于约60mg、小于约70mg、小于约80mg、小于约90mg、小于约100mg、小于约125mg、小于约150mg、或小于约200mg。在一些实施方案中,化合物剂量为约5mg、约10mg、约12.5mg、约13.5mg、约15mg、约17.5mg、约20mg、约22.5mg、约25mg、约27mg、约30mg、约40mg、约50mg、约60mg、约70mg、约80mg、约90mg、约100mg、约125mg、约150mg、约200mg、约225mg、约250mg、约275mg、或约300mg。
如本文所用,术语“治疗(treat)”、“治疗(treating)”和“治疗(treatment)”以及“预防(prevent)”、“预防(preventing)”和“预防(prevention)”分别是指引发所需生物反应,例如治疗效果和预防效果。在一些实施方案中,在施用所述药剂或包含所述药剂的组合物后,治疗效果包括以下中的一者或多者:肝病的降低/减轻、肝病的严重程度的降低/减轻(例如降轻或抑制肝病的发展)、症状和肝病相关效应的降低/减轻、延迟症状和肝病相关效应的发作、减轻肝病相关效应的症状的严重程度、减轻急性发作的严重程度、减少症状和肝病相关效应的数目、减少症状和肝病相关效应的潜伏期、症状和肝病相关效应的改善、减少继发性症状、减少继发性感染、预防肝病复发、降低复发发作的次数或频率、增加症状发作间隔的潜伏期、增加持续进展的时间、加快缓解、诱导缓解、加强缓解、加速恢复、或增加替代治疗剂的功效或降低对替代治疗剂的抗性、和/或增加受影响宿主动物的存活时间。预防效果可包括在治疗方案的施用后完全或部分避免/抑制或延迟肝病发展/进展(例如完全或部分避免/抑制或延迟),以及增加受影响宿主动物的存活时间。肝病的治疗涵盖治疗已经被诊断为患有处于任何临床阶段或表现的任何形式的肝病的受试者,延迟肝病的症状或体征的发作或演变或加重或恶化,和/或预防和/或减轻肝病的严重程度。
本公开还提供鉴定患肝病的风险提高的受试者的方法。在一些实施方案中,所述方法包括确定或已经确定在从受试者获得的生物样品中存在或不存在编码人GPAM多肽的GPAM预测功能丧失变体核酸分子(例如基因组核酸分子、mRNA分子和/或cDNA分子)。当受试者缺少GPAM预测功能丧失变体核酸分子(即,受试者基因型分类为GPAM参考)时,则受试者患肝病的风险提高。当受试者具有GPAM预测功能丧失变体核酸分子(即,受试者对GPAM预测功能丧失变体呈杂合或纯合)时,则受试者患肝病的风险降低。
与不具有GPAM预测功能丧失变体核酸分子的拷贝相比,具有GPAM预测功能丧失变体核酸分子的单个拷贝更能保护受试者免于患肝病。无意受限于任何特定理论或作用机制,认为GPAM预测功能丧失变体核酸分子的单个拷贝(即对GPAM预测功能丧失变体呈杂合)能够保护受试者免于患上肝病,并且还认为相对于具有单个拷贝的受试者,具有GPAM预测功能丧失变体核酸分子的两个拷贝(即对GPAM预测功能丧失变体呈纯合)更能够保护受试者免于患肝病。因此,在一些实施方案中,GPAM预测功能丧失变体核酸分子的单个拷贝可能不具完全保护性,而是可能部分或不完全地保护受试者免于患肝病。虽然不希望受任何特定理论束缚,但可能存在涉及患肝病的其它因子或分子,其仍存在于具有GPAM预测功能丧失变体核酸分子的单个拷贝的受试者中,因此导致对患肝病的保护不太完全。
确定受试者在来自受试者的生物样品中是否具有GPAM预测功能丧失变体核酸分子和/或确定受试者是否具有GPAM预测功能丧失变体核酸分子可通过本文所述的任何方法进行。在一些实施方案中,这些方法可在体外进行。在一些实施方案中,这些方法可原位进行。在一些实施方案中,这些方法可在体内进行。在这些实施方案中的任一者中,核酸分子可存在于从受试者获得的细胞内。
本公开还提供鉴定患肝病的风险提高的受试者的方法,其中所述方法包括确定或已经确定受试者具有本文所述的一种或多种GPAM预测功能丧失变体基因组核酸分子、mRNA分子或cDNA分子,和/或本文所述的一种或多种GPAM预测功能丧失变体多肽的总负荷。受试者的总负荷越大,患肝病的风险就越低。受试者的总负荷越小,患肝病的风险就越高。
在一些实施方案中,方法还可包括确定受试者具有预测功能丧失变体GPAM基因组核酸分子、mRNA分子或由mRNA分子产生的cDNA分子、和/或与肝病风险降低相关的预测功能丧失变体GPAM多肽的总负荷。总负荷是GPAM基因中所有变体的总和,其可在与肝病的关联分析中进行。在一些实施方案中,受试者对与患肝病的风险降低相关的一种或多种预测功能丧失变体GPAM核酸分子呈纯合。在一些实施方案中,受试者对与患肝病的风险降低相关的一种或多种预测功能丧失变体GPAM核酸分子呈杂合。关联分析的结果表明,GPAM的功能丧失和错义变异与肝病风险降低相关。在一些实施方案中,当受试者基于其总负荷被鉴定为患肝病的风险提高时,受试者进一步如本文所述用治疗或抑制肝病的治疗剂和/或GPAM抑制剂治疗。
在一些实施方案中,受试者具有任何一个或多个GPAM预测功能丧失变体核酸分子的总负荷代表多个任何预测功能丧失变体核酸分子的加权和。在一些实施方案中,使用至少约2、至少约3、至少约4、至少约5、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约100、至少约120、至少约150、至少约200、至少约250、至少约300,至少约400、至少约500或至少约1,000种与肝病相关的遗传变体计算总负荷。在一些实施方案中,当受试者具有高于所需阈值分数的总负荷时,受试者患肝病的风险较低或降低。在一些实施方案中,当受试者具有低于所需阈值分数的总负荷时,受试者患肝病的风险较高或提高。
在一些实施方案中,总负荷可分为五分位数,例如最高五分位数、中间五分位数和最低五分位数,其中总负荷的最高五分位数对应于最低风险组,并且总负荷的最低五分位数对应于最高风险组。在一些实施方案中,具有较大总负荷的受试者包括最高加权总负荷,包括但不限于受试者群体的总负荷的前10%、前20%、前30%、前40%或前50%。在一些实施方案中,遗传变体包括在相关性p值范围的前10%、前20%、前30%、前40%或前50%中的与肝病相关的遗传变体。在一些实施方案中,每个鉴定的遗传变体包括与肝病相关的遗传变体,其p值不大于约10-2、约10-3、约10-4、约10-5、约10-6、约10-7、约10-8、约10-9、约10-10、约10-11、约10-12、约10-13、约10-14或约10-15。在一些实施方案中,鉴定的遗传变体包括p值小于5×10-8的与肝病相关的遗传变体。在一些实施方案中,鉴定的遗传变体包括与高风险受试者的肝病相关的遗传变体,与参考群体的剩余部分相比具有以下比值比(OR):对于分布的前20%为约1.5或更大、约1.75或更大、约2.0或更大、或约2.25或更大;或约1.5或更大、约1.75或更大、约2.0或更大、约2.25或更大、约2.5或更大、或约2.75或更大。在一些实施方案中,比值比(OR)的范围可为约1.0至约1.5、约1.5至约2.0、约2.0至约2.5、约2.5至约3.0、约3.0至约3.5、约3.5至约4.0、约4.0至约4.5、约4.5至约5.0、约5.0至约5.5、约5.5至约6.0、约6.0至约6.5或约6.5至约7.0。在一些实施方案中,高风险受试者包括具有参考群体中的最低十分位数、五分位数或三分位数的总负荷的受试者。
在一些实施方案中,当受试者被鉴定为患肝病的风险提高时,受试者进一步如本文所述用治疗或抑制肝病的治疗剂和/或GPAM抑制剂治疗。例如,当受试者是GPAM参考,并因此患肝病的风险提高时,向受试者施用GPAM抑制剂。在一些实施方案中,还向此类受试者施用治疗或抑制肝病的治疗剂。在一些实施方案中,当受试者对GPAM预测功能丧失变体呈杂合时,以等于或低于标准剂量的剂量向受试者施用治疗或抑制肝病的治疗剂,并且还向其施用GPAM抑制剂。在一些实施方案中,受试者是GPAM参考。在一些实施方案中,受试者对GPAM预测功能丧失变体呈杂合。此外,当受试者因具有GPAM预测功能丧失变体核酸分子的总负荷较低并因此具有提高的肝病风险时,向受试者施用治疗或抑制肝病的治疗剂。在一些实施方案中,当受试者因具有GPAM预测功能丧失变体核酸分子的总负荷较低时,以等于或大于向具有GPAM预测功能丧失变体核酸分子的总负荷较高的受试者施用的标准剂量的剂量向受试者施用治疗或抑制肝病的治疗剂。
本公开还提供了检测来自受试者的生物样品中存在或不存在GPAM预测功能丧失变体基因组核酸分子,和/或来自受试者的生物样品中存在或不存在GPAM预测功能丧失变体mRNA分子,和/或来自受试者的生物样品中存在或不存在由mRNA分子产生的GPAM预测功能丧失变体cDNA分子的方法。应理解,群体内的基因序列和由此类基因编码的mRNA分子可因多态性(例如单核苷酸多态性)而变化。本文提供的GPAM变体基因组核酸分子、GPAM变体mRNA分子和GPAM变体cDNA分子的序列仅是示例性序列。GPAM变体基因组核酸分子、变体mRNA分子和变体cDNA分子的其它序列也是可能的。
生物样品可来源于来自受试者的任何细胞、组织或生物流体。样品可包括任何临床相关组织,诸如骨髓样品、肿瘤活检、细针抽吸物或体液样品,诸如血液、龈沟液、血浆、血清、淋巴液、腹水、囊液或尿液。在一些情况下,样品包括口腔拭子。本文所公开的方法中使用的样品将基于测定形式、检测方法的性质以及用作样品的组织、细胞或提取物而变化。生物样品可根据所采用的测定进行不同处理。例如,当检测任何GPAM变体核酸分子时,可采用被设计为针对基因组DNA来分离或富集样品的初步处理。多种技术可用于此目的。当检测任何GPAM变体mRNA的水平时,可采用不同的技术使生物样品富集mRNA。可使用检测mRNA的存在或水平或特定变体基因组DNA基因座的存在的各种方法。
在一些实施方案中,检测受试者中的人GPAM预测功能丧失变体核酸分子包括对从受试者获得的生物样品进行测定或分析,以确定生物样品中的GPAM基因组核酸分子和/或生物样品中的GPAM mRNA分子和/或生物样品中由mRNA 24分子产生的GPAM cDNA分子是否包含一种或多种导致功能丧失(部分或完全)或预测会导致功能丧失(部分或完全)的变异。
在一些实施方案中,检测受试者中存在或不存在GPAM预测功能丧失变体核酸分子(例如基因组核酸分子、mRNA分子和/或由mRNA分子产生的cDNA分子)的方法包括对从受试者获得的生物样品进行测定。所述测定确定生物样品中的核酸分子是否包含特定核苷酸序列。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:2的位置3,195(对于基因组核酸分子)、根据SEQ ID NO:9的位置327(对于mRNA分子)或根据SEQ ID NO:21的位置327(对于从mRNA分子获得的cDNA分子)。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:10的位置291(对于mRNA分子),或根据SEQ ID NO:22的位置291(对于从mRNA分子获得的cDNA分子)。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:11的位置323(对于mRNA分子),或根据SEQ ID NO:23的位置323(对于从mRNA分子获得的cDNA分子)。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:12的位置326(对于mRNA分子),或根据SEQ ID NO:24的位置326(对于从mRNA分子获得的cDNA分子)。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:13的位置305(对于mRNA分子),或根据SEQ ID NO:25的位置305(对于从mRNA分子获得的cDNA分子)。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:14的位置170(对于mRNA分子),或根据SEQ ID NO:26的位置170(对于从mRNA分子获得的cDNA分子)。
在一些实施方案中,核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170。
在一些实施方案中,核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ IDNO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ IDNO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170。
在一些实施方案中,生物样品包含细胞或细胞裂解物。此类方法还可包括例如从受试者获得包含GPAM基因组核酸分子或mRNA分子的生物样品,并且如果包含mRNA,则任选地将mRNA逆转录成cDNA。此类测定可包括例如确定特定GPAM核酸分子的这些位置的同一性。在一些实施方案中,所述方法是体外方法。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对生物样品中GPAM基因组核酸分子、GPAM mRNA分子或GPAM cDNA分子的核苷酸序列的至少一部分进行测序,其中测序部分包含导致功能丧失(部分或完全)或预测会导致功能丧失(部分或完全)的一种或多种变异。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对以下各者的至少一部分进行测序:生物样品中GPAM基因组核酸分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置;生物样品中GPAM mRNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:9或其互补序列的位置327的位置;和/或生物样品中由mRNA产生的GPAM cDNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ IDNO:21或其互补序列的位置327的位置。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:2的位置3,195、根据SEQ ID NO:9的位置327或根据SEQ ID NO:21的位置327。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对以下各者的至少一部分进行测序:生物样品中GPAM mRNA分子的核苷酸序列,其中测序部分包含对应于根据SEQID NO:10或其互补序列的位置291的位置;和/或生物样品中由mRNA产生的GPAM cDNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:22或其互补序列的位置291的位置。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:10的位置291,或根据SEQ ID NO:22的位置291。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对以下各者的至少一部分进行测序:生物样品中GPAM mRNA分子的核苷酸序列,其中测序部分包含对应于根据SEQID NO:11或其互补序列的位置323的位置;和/或生物样品中由mRNA产生的GPAM cDNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:23或其互补序列的位置323的位置。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:11的位置323,或根据SEQ ID NO:23的位置323。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对以下各者的至少一部分进行测序:生物样品中GPAM mRNA分子的核苷酸序列,其中测序部分包含对应于根据SEQID NO:12或其互补序列的位置326的位置;和/或生物样品中由mRNA产生的GPAM cDNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:24或其互补序列的位置326的位置。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:12的位置326,或根据SEQ ID NO:24的位置326。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对以下各者的至少一部分进行测序:生物样品中GPAM mRNA分子的核苷酸序列,其中测序部分包含对应于根据SEQID NO:13或其互补序列的位置305的位置;和/或生物样品中由mRNA产生的GPAM cDNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:25或其互补序列的位置305的位置。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:13的位置305,或根据SEQ ID NO:25的位置305。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对以下各者的至少一部分进行测序:生物样品中GPAM mRNA分子的核苷酸序列,其中测序部分包含对应于根据SEQID NO:14或其互补序列的位置170的位置;和/或生物样品中由mRNA产生的GPAM cDNA分子的核苷酸序列,其中测序部分包含对应于根据SEQ ID NO:26或其互补序列的位置170的位置。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:14的位置170,或根据SEQ ID NO:26的位置170。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对生物样品中GPAM基因组核酸分子的核苷酸序列的至少一部分进行测序,其中测序部分包含对应于根据SEQ IDNO:2或其互补序列的位置3,195的位置,则生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对生物样品中GPAM mRNA分子的核苷酸序列的至少一部分进行测序,其中测序部分包含对应于以下的位置:根据SEQID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:9的位置327、根据SEQID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQID NO:13的位置305或根据SEQ ID NO:14的位置170。
在一些实施方案中,确定步骤、检测步骤或序列分析包括对生物样品中GPAM cDNA分子的核苷酸序列的至少一部分进行测序,其中测序部分包含对应于以下的位置:根据SEQID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170。当生物样品中的GPAM核酸分子的测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的GPAM核酸分子是GPAM预测功能丧失变体核酸分子:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM的核苷酸序列的以下部分杂交:基因组核酸分子,其接近对应于根据SEQ ID NO:2的位置3,195的位置的一部分;mRNA分子,其接近对应于根据SEQ ID NO:9的位置327的位置的一部分;和/或cDNA分子,其接近对应于根据SEQ ID NO:21的位置327的位置的一部分;b)将引物延伸至少通过GPAM的核苷酸序列的以下位置:对应于根据SEQ ID NO:2的位置3,195的基因组核酸分子;对应于根据SEQ ID NO:9的位置327的mRNA分子;和/或对应于根据SEQ ID NO:21的位置327的cDNA分子;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:2的位置3,195、根据SEQ ID NO:9的位置327和/或根据SEQ ID NO:21的位置327。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM的核苷酸序列的以下部分杂交:mRNA分子,其接近对应于根据SEQ IDNO:10的位置291的位置的一部分;和/或cDNA分子,其接近对应于根据SEQ ID NO:22的位置291的位置的一部分;b)将引物延伸至少通过GPAM的核苷酸序列的以下位置:对应于根据SEQ ID NO:10的位置291的mRNA分子;和/或对应于根据SEQ ID NO:22的位置291的cDNA分子;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:10的位置291,和/或根据SEQ ID NO:22的位置291。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM的核苷酸序列的以下部分杂交:mRNA分子,其接近对应于根据SEQ IDNO:11的位置323的位置的一部分;和/或cDNA分子,其接近对应于根据SEQ ID NO:23的位置323的位置的一部分;b)将引物延伸至少通过GPAM的核苷酸序列的以下位置:对应于根据SEQ ID NO:11的位置323的mRNA分子;和/或对应于根据SEQ ID NO:23的位置323的cDNA分子;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:11的位置323,和/或根据SEQ ID NO:23的位置323。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM的核苷酸序列的以下部分杂交:mRNA分子,其接近对应于根据SEQ IDNO:12的位置326的位置的一部分;和/或cDNA分子,其接近对应于根据SEQ ID NO:24的位置326的位置的一部分;b)将引物延伸至少通过GPAM的核苷酸序列的以下位置:对应于根据SEQ ID NO:12的位置326的mRNA分子;和/或对应于根据SEQ ID NO:24的位置326的cDNA分子;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:12的位置326,和/或根据SEQ ID NO:24的位置326。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM的核苷酸序列的以下部分杂交:mRNA分子,其接近对应于根据SEQ IDNO:13的位置305的位置的一部分;和/或cDNA分子,其接近对应于根据SEQ ID NO:25的位置305的位置的一部分;b)将引物延伸至少通过GPAM的核苷酸序列的以下位置:对应于根据SEQ ID NO:13的位置305的mRNA分子;和/或对应于根据SEQ ID NO:25的位置305的cDNA分子;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:13的位置305,和/或根据SEQ ID NO:25的位置305。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM的核苷酸序列的以下部分杂交:mRNA分子,其接近对应于根据SEQ IDNO:14的位置170的位置的一部分;和/或cDNA分子,其接近对应于根据SEQ ID NO:26的位置170的位置的一部分;b)将引物延伸至少通过GPAM的核苷酸序列的以下位置:对应于根据SEQ ID NO:14的位置170的mRNA分子;和/或对应于根据SEQ ID NO:26的位置170的cDNA分子;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:14的位置170,和/或根据SEQ ID NO:26的位置170。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM基因组核酸分子的核苷酸序列的一部分杂交,所述部分接近对应于根据SEQ ID NO:2的位置3,195的位置;b)将引物延伸至少通过GPAM基因组核酸分子的核苷酸序列中对应于根据SEQ ID NO:2的位置3,195的位置;以及c)确定引物的延伸产物是否包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM mRNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;b)将引物延伸至少通过GPAM mRNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)使生物样品与引物接触,所述引物与GPAM cDNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;b)将引物延伸至少通过GPAM cDNA分子的核苷酸序列中对应于以下的位置:根据SEQ IDNO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ IDNO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;以及c)确定引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
在一些实施方案中,测定包括对整个核酸分子进行测序。在一些实施方案中,仅分析GPAM基因组核酸分子。在一些实施方案中,仅分析GPAM mRNA。在一些实施方案中,仅分析从GPAM mRNA获得的GPAM cDNA。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:2或其互补序列的位置3,195;根据SEQ ID NO:9或其互补序列的位置327;和/或根据SEQ ID NO:21或其互补序列的位置327;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:2或其互补序列的位置3,195;根据SEQID NO:9或其互补序列的位置327;和/或根据SEQ ID NO:21或其互补序列的位置327;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:10或其互补序列的位置291;和/或根据SEQ ID NO:22或其互补序列的位置291;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:10或其互补序列的位置291;和/或根据SEQ ID NO:22或其互补序列的位置291;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:11或其互补序列的位置323;和/或根据SEQ ID NO:23或其互补序列的位置323;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:11或其互补序列的位置323;和/或根据SEQ ID NO:23或其互补序列的位置323;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:12或其互补序列的位置326;和/或根据SEQ ID NO:24或其互补序列的位置326;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:12或其互补序列的位置326;和/或根据SEQ ID NO:24或其互补序列的位置326;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:13或其互补序列的位置305;和/或根据SEQ ID NO:25或其互补序列的位置305;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:13或其互补序列的位置305;和/或根据SEQ ID NO:25或其互补序列的位置305;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:14或其互补序列的位置170;和/或根据SEQ ID NO:26或其互补序列的位置170;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:14或其互补序列的位置170;和/或根据SEQ ID NO:26或其互补序列的位置170;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及d)检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:a)对编码人GPAM多肽的核酸分子的至少一部分进行扩增,其中扩增的部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;b)用可检测标记来标记扩增的核酸分子;c)将标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及d)检测可检测标记。
在一些实施方案中,核酸分子是mRNA,并且确定步骤还包括在扩增步骤之前将mRNA逆转录成cDNA。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:2或其互补序列的位置3,195;根据SEQ ID NO:9或其互补序列的位置327;和/或根据SEQ ID NO:21或其互补序列的位置327;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:10或其互补序列的位置291;和/或根据SEQ IDNO:22或其互补序列的位置291;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:11或其互补序列的位置323;和/或根据SEQ IDNO:23或其互补序列的位置323;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:12或其互补序列的位置326;和/或根据SEQ IDNO:24或其互补序列的位置326;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:13或其互补序列的位置305;和/或根据SEQ IDNO:25或其互补序列的位置305;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:14或其互补序列的位置170;和/或根据SEQ IDNO:26或其互补序列的位置170;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及检测可检测标记。
在一些实施方案中,确定步骤、检测步骤或序列分析包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及检测可检测标记。
改变特异性聚合酶链反应技术可用于检测核酸序列中的突变,例如SNP。因为当与模板存在失配时,DNA聚合酶将不延伸,所以可使用改变特异性引物。
在一些实施方案中,样品中的核酸分子是mRNA,并且在扩增步骤之前将所述mRNA逆转录成cDNA。在一些实施方案中,核酸分子存在于从受试者获得的细胞内。
在一些实施方案中,测定包括使生物样品与引物或探针,例如改变特异性引物或改变特异性探针接触,所述引物或探针在严格条件下与GPAM变体基因组序列、变体mRNA序列或变体cDNA序列特异性杂交,而不与相应的GPAM参考序列特异性杂交,并且确定是否已经发生杂交。
在一些实施方案中,测定包括RNA测序(RNA-Seq)。在一些实施方案中,测定还包括例如通过逆转录酶聚合酶链反应(RT-PCR)将mRNA逆转录成cDNA。
在一些实施方案中,所述方法利用足够核苷酸长度的探针和引物与靶核苷酸序列结合,并特异性检测和/或鉴定包含GPAM变体基因组核酸分子、变体mRNA分子或变体cDNA分子的多核苷酸。杂交条件或反应条件可由操作人员确定以实现此结果。核苷酸长度可为足以用于所选择的检测方法(包括本文描述或例示的任何测定)的任何长度。此类探针和引物可在高严格杂交条件下与靶核苷酸序列特异性杂交。探针和引物可具有与靶核苷酸序列内连续核苷酸的完全核苷酸序列同一性,但可通过常规方法设计不同于靶核苷酸序列并保留特异性检测和/或鉴定靶核苷酸序列的能力的探针。探针和引物可与靶核酸分子的核苷酸序列具有约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或100%序列同一性或互补性。
在一些实施方案中,为了确定生物样品中的GPAM核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补分子是否含有包含以下各者的核苷酸序列:对应于根据SEQ IDNO:2的位置3,195的位置处的鸟嘌呤(基因组核酸分子),或对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤(mRNA分子),或对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤(cDNA分子),可使用引物对使生物样品经受扩增方法,以产生扩增子,所述引物对包含源自5’侧接序列的第一引物和源自3’侧接序列的第二引物,所述第一引物与对应于根据SEQID NO:2的位置3,195的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤相邻,所述第二引物与对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤相邻,所述扩增子指示在编码以下各者的位置处存在SNP:对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤,或对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤,或对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度。此距离的范围可从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,所述引物对侧接包括以下位置的区域,所述位置包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤、对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤或对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤,以及包含以下各者的位置的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:对应于根据SEQID NO:2的位置3,195的位置处的鸟嘌呤、对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤或对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤。
在一些实施方案中,为了确定生物样品中的GPAM核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补分子是否包含对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤(mRNA分子),或对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤(cDNA分子),可使用引物对使生物样品经受扩增方法,以产生扩增子,所述引物对包含源自5’侧接序列的第一引物和源自3’侧接序列的第二引物,所述第一引物与对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤相邻,所述第二引物与对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤相邻,所述扩增子指示在编码以下各者的位置处存在SNP:对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤,或对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度。此距离的范围可从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,所述引物对侧接包括以下位置的区域,所述位置包含对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤,或对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤,以及包含以下各者的位置的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤,或对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤。
在一些实施方案中,为了确定生物样品中的GPAM核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补分子是否含有包含对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤(mRNA分子),或对应于根据SEQ ID NO:23的位置323的位置处的鸟嘌呤(cDNA分子)的核苷酸序列,可使用引物对使生物样品经受扩增方法,以产生扩增子,所述引物对包含源自5’侧接序列的第一引物和源自3’侧接序列的第二引物,所述第一引物与对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:23的位置323的位置处的鸟嘌呤相邻,所述第二引物与对应于根据SEQ ID NO:23的位置323的位置处的鸟嘌呤相邻,所述扩增子指示在编码以下各者的位置处存在SNP:对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤,或对应于根据SEQ ID NO:23的位置323的位置处的鸟嘌呤。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度。此距离的范围可从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,所述引物对侧接包括以下位置的区域,所述位置包含对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤,或对应于根据SEQ IDNO:23的位置323的位置处的鸟嘌呤,以及包含以下各者的位置的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤,或对应于根据SEQ ID NO:23的位置323的位置处的鸟嘌呤。
在一些实施方案中,为了确定生物样品中的GPAM核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补分子是否含有包含对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤(mRNA分子),或对应于根据SEQ ID NO:24的位置326的位置处的鸟嘌呤(cDNA分子)的核苷酸序列,可使用引物对使生物样品经受扩增方法,以产生扩增子,所述引物对包含源自5’侧接序列的第一引物和源自3’侧接序列的第二引物,所述第一引物与对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:24的位置326的位置处的鸟嘌呤相邻,所述第二引物与对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:24的位置326的位置处的鸟嘌呤相邻,所述扩增子指示在编码以下各者的位置处存在SNP:对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤,或对应于根据SEQ ID NO:24的位置326的位置处的鸟嘌呤。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度。此距离的范围可从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,所述引物对侧接包括以下位置的区域,所述位置包含对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤,或对应于根据SEQ ID NO:24的位置326的位置处的鸟嘌呤,以及包含以下各者的位置的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤,或对应于根据SEQ IDNO:24的位置326的位置处的鸟嘌呤。
在一些实施方案中,为了确定生物样品中的GPAM核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补分子是否含有包含对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤(mRNA分子),或对应于根据SEQ ID NO:25的位置305的位置处的鸟嘌呤(cDNA分子)的核苷酸序列,可使用引物对使生物样品经受扩增方法,以产生扩增子,所述引物对包含源自5’侧接序列的第一引物和源自3’侧接序列的第二引物,所述第一引物与对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:25的位置305的位置处的鸟嘌呤相邻,所述第二引物与对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:25的位置305的位置处的鸟嘌呤相邻,所述扩增子指示在编码以下各者的位置处存在SNP:对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤,或对应于根据SEQ ID NO:25的位置305的位置处的鸟嘌呤。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度。此距离的范围可从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,所述引物对侧接包括以下位置的区域,所述位置包含对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤,或对应于根据SEQ ID NO:25的位置305的位置处的鸟嘌呤,以及包含以下各者的位置的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤,或对应于根据SEQ IDNO:25的位置305的位置处的鸟嘌呤。
在一些实施方案中,为了确定生物样品中的GPAM核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补分子是否含有包含对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤(mRNA分子),或对应于根据SEQ ID NO:26的位置170的位置处的鸟嘌呤(cDNA分子)的核苷酸序列,可使用引物对使生物样品经受扩增方法,以产生扩增子,所述引物对包含源自5’侧接序列的第一引物和源自3’侧接序列的第二引物,所述第一引物与对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:26的位置170的位置处的鸟嘌呤相邻,所述第二引物与对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤相邻,或与对应于根据SEQ ID NO:26的位置170的位置处的鸟嘌呤相邻,所述扩增子指示在编码以下各者的位置处存在SNP:对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤,或对应于根据SEQ ID NO:26的位置170的位置处的鸟嘌呤。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至可通过DNA扩增方案产生的扩增子的任何长度。此距离的范围可从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,所述引物对侧接包括以下位置的区域,所述位置包含对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤,或对应于根据SEQ ID NO:26的位置170的位置处的鸟嘌呤,以及包含以下各者的位置的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤,或对应于根据SEQ IDNO:26的位置170的位置处的鸟嘌呤。
可由mRNA和/或cDNA序列产生类似的扩增子。PCR引物对可例如通过使用意图用于所述目的的计算机程序而来源于已知的序列,所述计算机程序诸如Vector NTI版本10的PCR引物分析工具(Informax Inc.,Bethesda Md.);PrimerSelect(DNASTAR Inc.,Madison,Wis.);以及Primer3(版本0.4.0.COPYRGT.,1991,Whitehead Institute forBiomedical Research,Cambridge,Mass.)。另外,可视觉扫描序列并使用已知指南手动鉴定引物。
核酸测序技术的说明性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。其它方法涉及除了测序以外的核酸杂交方法,其包括使用针对纯化的DNA、扩增的DNA和固定细胞制品的标记的引物或探针(荧光原位杂交(FISH))。在一些方法中,可在检测之前或在检测的同时对靶核酸分子进行扩增。核酸扩增技术的例示性示例包括但不限于聚合酶链反应(PCR)、连接酶链反应(LCR)、链置换扩增反应(SDA)以及基于核酸序列的扩增反应(NASBA)。其它方法包括但不限于连接酶链反应、链置换扩增反应和嗜热SDA(tSDA)。
在杂交技术中,可采用严格条件,使得探针或引物特异性地与其靶标杂交。在一些实施方案中,在严格条件下的多核苷酸引物或探针将与其靶序列杂交,其程度可检测地比与其它非靶序列的杂交大例如至少2倍、至少3倍、至少4倍或更多倍(相对于背景),包括大超过10倍(相对于背景)。在一些实施方案中,在严格条件下的多核苷酸引物或探针将与其靶核苷酸序列杂交,其程度可检测地比与其它核苷酸序列的杂交大至少2倍。在一些实施方案中,在严格条件下的多核苷酸引物或探针将与其靶核苷酸序列杂交,其程度可检测地比与其它核苷酸序列的杂交大至少3倍。在一些实施方案中,在严格条件下的多核苷酸引物或探针将与其靶核苷酸序列杂交,其程度可检测地比与其它核苷酸序列的杂交大至少4倍。在一些实施方案中,在严格条件下的多核苷酸引物或探针将与其靶核苷酸序列杂交,其程度可检测地比与其它核苷酸序列的杂交大超过10倍(相对于背景)。严格条件是序列依赖性的并且在不同的环境中将是不同的。
促进DNA杂交的适当严格性条件(例如6X氯化钠/柠檬酸钠(SSC),在约45℃下,接着在50℃下进行2X SSC的洗涤)是已知的并且可见于Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。通常,用于杂交和检测的严格条件将是其中如下所述的那些:在pH 7.0至8.3时的盐浓度低于约1.5M Na+离子、通常约0.01至1.0M Na+离子浓度(或其它盐),并且温度对于短探针(例如10至50个核苷酸)是至少约30℃,并且对于较长探针(例如大于50个核苷酸)是至少约60℃。还可通过添加例如甲酰胺等去稳定剂来实现严格条件。任选地,洗涤缓冲液可包含约0.1%至约1% SDS。杂交的持续时间通常少于约24小时,通常约4至约12小时。洗涤时间将持续至少足以达到平衡的时间长度。
本公开还提供检测人GPAM预测功能丧失性多肽的存在的方法,其包括对获自受试者的样品进行测定以确定受试者中的GPAM多肽是否含有致使多肽具有功能丧失(部分或完全)或预测功能丧失(部分或完全)的一种或多种变异。GPAM预测功能丧失多肽可为本文所述的任何GPAM截短变体多肽。在一些实施方案中,所述方法检测GPAM Ile43Val的存在。
在一些实施方案中,所述方法包括对获自受试者的样品进行测定以确定样品中的GPAM多肽是否包含对应于根据SEQ ID NO:29的位置43的位置处的缬氨酸。在一些实施方案中,所述方法包括对获自受试者的样品进行测定以确定样品中的GPAM多肽是否包含对应于根据SEQ ID NO:30的位置43的位置处的缬氨酸。
在一些实施方案中,检测步骤包括对包含对应于根据SEQ ID NO:29、SEQ ID NO:27或SEQ ID NO:28的位置43的位置的多肽的至少一部分进行测序。在一些实施方案中,检测步骤包括对包含对应于根据SEQ ID NO:30、SEQ ID NO:27或SEQ ID NO:28的位置43的位置的多肽的至少一部分进行测序。
在一些实施方案中,检测步骤包括用于检测包含对应于根据SEQ ID NO:29、SEQID NO:27或SEQ ID NO:28的位置43的位置的多肽的存在的免疫测定。在一些实施方案中,检测步骤包括用于检测包含对应于根据SEQ ID NO:30或SEQ ID NO:27或SEQ ID NO:28的位置43的位置的多肽的存在的免疫测定。
在一些实施方案中,当受试者不具有GPAM预测功能丧失多肽时,则受试者患肝病的风险提高。在一些实施方案中,当受试者具有GPAM预测功能丧失多肽时,则受试者患肝病的风险降低。
本公开还提供与GPAM变体基因组核酸分子、GPAM变体mRNA分子和/或GPAM变体cDNA分子(例如本文公开的基因组变体核酸分子、mRNA变体分子和cDNA变体分子中的任一者)杂交的分离的核酸分子。在一些实施方案中,分离的核酸分子与GPAM核酸分子的一部分杂交,所述部分包括对应于以下的位置:根据SEQ ID NO:2的位置3,195、根据SEQ ID NO:9的位置327或根据SEQ ID NO:21的位置327。在一些实施方案中,分离的核酸分子与GPAM核酸分子的一部分杂交,所述部分包括对应于根据SEQ ID NO:10的位置291或根据SEQ IDNO:22的位置291的位置。在一些实施方案中,分离的核酸分子与GPAM核酸分子的一部分杂交,所述部分包括对应于根据SEQ ID NO:11的位置323或根据SEQ ID NO:23的位置323的位置。在一些实施方案中,分离的核酸分子与GPAM核酸分子的一部分杂交,所述部分包括对应于根据SEQ ID NO:12的位置326或根据SEQ ID NO:24的位置326的位置。在一些实施方案中,分离的核酸分子与GPAM核酸分子的一部分杂交,所述部分包括对应于根据SEQ ID NO:13的位置305或根据SEQ ID NO:25的位置305的位置。在一些实施方案中,分离的核酸分子与GPAM核酸分子的一部分杂交,所述部分包括对应于根据SEQ ID NO:14的位置170或根据SEQ ID NO:26的位置170的位置。
在一些实施方案中,此类分离的核酸分子包含至少约5个、至少约8个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少约85个、至少约90个、至少约95个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约2000个、至少约3000个、至少约4000个或至少约5000个核苷酸或由其组成。在一些实施方案中,此类分离的核酸分子包含至少约5个、至少约8个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个或至少约25个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含至少约18个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含至少约15个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含约10个至约35个、约10个至约30个、约10个至约25个、约12个至约30个、约12个至约28个、约12个至约24个、约15个至约30个、约15个至约25个、约18个至约30个、约18个至约25个、约18个至约24个或约18个至约22个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含约18个至约30个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含至少约15个核苷酸至至少约35个核苷酸或由其组成。
在一些实施方案中,此类分离的核酸分子在严格条件下与GPAM变体核酸分子(例如基因组核酸分子、mRNA分子和/或cDNA分子)杂交。此类核酸分子例如可用作本文所描述或例示的探针、引物、改变特异性探针或改变特异性引物,并且包括但不限于引物、探针、反义RNA、shRNA和siRNA,其中每一者都在本文他处被更详细地描述,并且可在本文所述的任何方法中使用。
在一些实施方案中,分离的核酸分子与核酸分子的至少约15个连续核苷酸杂交,所述核酸分子与GPAM变体基因组核酸分子、GPAM变体mRNA分子和/或GPAM变体cDNA分子至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一。在一些实施方案中,分离的核酸分子包含约15个至约100个核苷酸或约15个至约35个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含约15个至约100个核苷酸或由其组成。在一些实施方案中,分离的核酸分子包含约15个至约35个核苷酸或由其组成。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人GPAM多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:2或其互补序列的位置3,195;根据SEQ ID NO:9或其互补序列的位置327;或根据SEQ ID NO:21或其互补序列的位置327。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于以下的位置:根据SEQ ID NO:2或其互补序列的位置3,195-3,197;根据SEQ ID NO:9或其互补序列的位置327-329;和/或根据SEQID NO:21或其互补序列的位置327-329。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人GPAM多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:10或其互补序列的位置291;或根据SEQ ID NO:22或其互补序列的位置291。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:10或其互补序列的位置291-293;和/或根据SEQID NO:22或其互补序列的位置291-293。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人GPAM多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:11或其互补序列的位置323;或根据SEQ ID NO:23或其互补序列的位置323。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:11或其互补序列的位置323-325;和/或根据SEQID NO:23或其互补序列的位置323-325。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人GPAM多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:12或其互补序列的位置326;或根据SEQ ID NO:24或其互补序列的位置326。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:12或其互补序列的位置326-328;和/或根据SEQID NO:24或其互补序列的位置326-328。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人GPAM多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:25或其互补序列的位置305。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:13或其互补序列的位置305-307;和/或根据SEQID NO:25或其互补序列的位置305-307。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人GPAM多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:14或其互补序列的位置170;或根据SEQ ID NO:26或其互补序列的位置170。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:14或其互补序列的位置170-172;和/或根据SEQID NO:26或其互补序列的位置170-172。
在一些实施方案中,改变特异性探针和改变特异性引物包含DNA。在一些实施方案中,改变特异性探针和改变特异性引物包含RNA。
在一些实施方案中,本文所述的探针和引物(包括改变特异性探针和改变特异性引物)具有与本文公开的任何核酸分子特异性杂交的核苷酸序列,或其互补序列。在一些实施方案中,所述探针和引物在严格条件下与本文公开的核酸分子中的任一者特异性杂交。
在一些实施方案中,引物(包括改变特异性引物)可用于第二代测序或高通量测序中。在一些情况下,可修饰引物,包括改变特异性引物。特别地,引物可包含在例如大规模平行签名测序(MPSS)、聚合酶克隆测序(Polony sequencing)和454焦磷酸测序的不同步骤中使用的各种修饰。在所述过程的几个步骤中可使用修饰的引物,包括在克隆步骤中使用生物素酰化的引物,并且在珠粒装载步骤和检测步骤中使用荧光标记的引物。通常使用双端测序标签文库进行聚合酶克隆测序,其中每个DNA模板分子的长度约为135bp。在珠粒装载步骤和乳液PCR中使用生物素酰化的引物。在检测步骤中使用荧光标记的简并九聚物寡核苷酸。衔接子可含有用于将DNA文库固定至链酶亲和素包被的珠粒上的5’-生物素标签。
本文所述的探针和引物可用于检测本文公开的GPAM变体基因组核酸分子、GPAM变体mRNA分子和/或GPAM变体cDNA分子中的任一者内的核苷酸变异。本文所述的引物可用于扩增GPAM变体基因组核酸分子、GPAM变体mRNA分子或GPAM变体cDNA分子或其片段。
本公开还提供包含上述引物中的任一者的引物对。例如,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:1的位置3,195的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考基因组核酸分子的存在。相反,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体基因组核酸分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ IDNO:3的位置327的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考mRNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ IDNO:9的位置327的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体mRNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:15的位置327的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考cDNA分子的存在。相反,如果引物的3’端之一与特定GPAMmRNA分子中对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体cDNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:21的位置327的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。
另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:4的位置291的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考mRNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体mRNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:10的位置291的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:16的位置291的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考cDNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:22的位置291的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体cDNA分子的存在。在一些实施方案中,与在对应于根据SEQ IDNO:22的位置291的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。
另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:5的位置323的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考mRNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体mRNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:11的位置323的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:17的位置323的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考cDNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:23的位置323的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体cDNA分子的存在。在一些实施方案中,与在对应于根据SEQ IDNO:23的位置323的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。
另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:6的位置326的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考mRNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体mRNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:12的位置326的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:18的位置326的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考cDNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:24的位置326的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体cDNA分子的存在。在一些实施方案中,与在对应于根据SEQ IDNO:24的位置326的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。
另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:7的位置305的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考mRNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体mRNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:13的位置305的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:19的位置305的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考cDNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:25的位置305的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体cDNA分子的存在。在一些实施方案中,与在对应于根据SEQ IDNO:25的位置305的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。
另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:8的位置170的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考mRNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体mRNA分子的存在。在一些实施方案中,与在对应于根据SEQ ID NO:14的位置170的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。另外,如果引物的3’端之一与特定GPAM核酸分子中对应于根据SEQ ID NO:20的位置170的位置处的腺嘌呤(而不是鸟嘌呤)杂交,则扩增片段的存在将指示GPAM参考cDNA分子的存在。相反,如果引物的3’端之一与特定GPAM mRNA分子中对应于根据SEQ ID NO:26的位置170的位置处的鸟嘌呤(而不是腺嘌呤)杂交,则扩增片段的存在将指示GPAM变体cDNA分子的存在。在一些实施方案中,与在对应于根据SEQ IDNO:26的位置170的位置处的鸟嘌呤互补的引物的核苷酸可在引物的3’端。
在本公开的上下文中,“特异性杂交”意指探针或引物(例如改变特异性探针或改变特异性引物)不与编码GPAM参考基因组核酸分子、GPAM参考mRNA分子和/或GPAM参考cDNA分子的核酸序列杂交。
在一些实施方案中,探针(例如改变特异性探针)包含标记。在一些实施方案中,所述标记是荧光标记、放射性标记或生物素。
本公开还提供包含本文所公开的探针中的任一者或多者所附接的底物的支持物。固体支持物是固态基底或支持物,例如本文公开的任何探针的分子可与之结合。固体支持物的一种形式是阵列。固体支持物的另一种形式是阵列检测物。阵列检测物是多种不同的探针以阵列、网格或其它组织化模式与其偶联的固体支持物。固态基底的一种形式是微量滴定皿,例如标准96孔类型。在一些实施方案中,可采用通常每孔含有一个阵列的多孔玻璃载片。
GPAM参考基因组核酸分子的核苷酸序列如SEQ ID NO:1所示。参考SEQ ID NO:1,位置3,195是腺嘌呤。
存在GPAM的变体基因组核酸分子,其中位置3,195处的腺嘌呤被鸟嘌呤替换。这种GPAM参考基因组核酸分子的核苷酸序列如SEQ ID NO:2中所示。
GPAM参考mRNA分子的核苷酸序列示于SEQ ID NO:3中。参考SEQ ID NO:3,位置327是腺嘌呤。另一种GPAM参考mRNA分子的核苷酸序列示于SEQ ID NO:4中。参考SEQ ID NO:4,位置291是腺嘌呤。另一种GPAM参考mRNA分子的核苷酸序列示于SEQ ID NO:5中。参考SEQID NO:5,位置323是腺嘌呤。另一种GPAM参考mRNA分子的核苷酸序列示于SEQ ID NO:6中。参考SEQ ID NO:6,位置326是腺嘌呤。另一种GPAM参考mRNA分子的核苷酸序列示于SEQ IDNO:7中。参考SEQ ID NO:7,位置305是腺嘌呤。另一种GPAM参考mRNA分子的核苷酸序列示于SEQ ID NO:8中。参考SEQ ID NO:8,位置170是腺嘌呤。
存在GPAM的变体mRNA分子,其中位置327处的腺嘌呤被鸟嘌呤替换。这种GPAM变体mRNA分子的核苷酸序列示于SEQ ID NO:9中。
存在GPAM的另一种变体mRNA分子,其中位置291处的腺嘌呤被鸟嘌呤替换。这种GPAM变体mRNA分子的核苷酸序列示于SEQ ID NO:10中。
存在GPAM的另一种变体mRNA分子,其中位置323处的腺嘌呤被鸟嘌呤替换。这种GPAM变体mRNA分子的核苷酸序列示于SEQ ID NO:11中。
存在GPAM的另一种变体mRNA分子,其中位置326处的腺嘌呤被鸟嘌呤替换。这种GPAM变体mRNA分子的核苷酸序列示于SEQ ID NO:12中。
存在GPAM的另一种变体mRNA分子,其中位置305处的腺嘌呤被鸟嘌呤替换。这种GPAM变体mRNA分子的核苷酸序列示于SEQ ID NO:13中。
存在GPAM的另一种变体mRNA分子,其中位置170处的腺嘌呤被鸟嘌呤替换。这种GPAM变体mRNA分子的核苷酸序列示于SEQ ID NO:14中。
GPAM参考cDNA分子的核苷酸序列示于SEQ ID NO:15中。参考SEQ ID NO:15,位置327是腺嘌呤。另一种GPAM参考cDNA分子的核苷酸序列示于SEQ ID NO:16中。参考SEQ IDNO:16,位置291是腺嘌呤。另一种GPAM参考cDNA分子的核苷酸序列示于SEQ ID NO:17中。参考SEQ ID NO:17,位置323是腺嘌呤。另一种GPAM参考cDNA分子的核苷酸序列示于SEQ IDNO:18中。参考SEQ ID NO:18,位置326是腺嘌呤。另一种GPAM参考cDNA分子的核苷酸序列示于SEQ ID NO:19中。参考SEQ ID NO:19,位置305是腺嘌呤。另一种GPAM参考cDNA分子的核苷酸序列示于SEQ ID NO:20中。参考SEQ ID NO:20,位置170是腺嘌呤。
存在GPAM的变体cDNA分子,其中位置327处的腺嘌呤被鸟嘌呤替换。这种GPAM变体cDNA分子的核苷酸序列示于SEQ ID NO:21中。
存在GPAM的另一种变体cDNA分子,其中位置291处的腺嘌呤被鸟嘌呤替换。这种GPAM变体cDNA分子的核苷酸序列示于SEQ ID NO:22中。
存在GPAM的另一种变体cDNA分子,其中位置323处的腺嘌呤被鸟嘌呤替换。这种GPAM变体cDNA分子的核苷酸序列示于SEQ ID NO:23中。
存在GPAM的另一种变体cDNA分子,其中位置326处的腺嘌呤被鸟嘌呤替换。这种GPAM变体cDNA分子的核苷酸序列示于SEQ ID NO:24中。
存在GPAM的另一种变体cDNA分子,其中位置305处的腺嘌呤被鸟嘌呤替换。这种GPAM变体cDNA分子的核苷酸序列示于SEQ ID NO:25中。
存在GPAM的另一种变体cDNA分子,其中位置170处的腺嘌呤被鸟嘌呤替换。这种GPAM变体cDNA分子的核苷酸序列示于SEQ ID NO:26中。
基因组核酸分子、mRNA分子和cDNA分子可来自任何生物体。例如,所述基因组核酸分子、mRNA分子和cDNA分子可以是人的或来自另一生物体(例如非人哺乳动物、啮齿动物、小鼠或大鼠)的直向同源物。应理解,群体内的基因序列可因多态性(例如单核苷酸多态性)而变化。本文提供的实例仅为示例性序列。其它序列也是可能的。
本文还提供了可与所公开的核酸分子相互作用的功能性多核苷酸。功能性多核苷酸的实例包括但不限于反义分子、适体、核酶、三链体形成分子以及外部指导序列。功能性多核苷酸可以充当靶分子所具有的特定活性的影响剂、抑制剂、调节剂和刺激剂,或者功能性多核苷酸可具有独立于任何其它分子的全新活性。
本文公开的分离的核酸分子可包括RNA、DNA或RNA和DNA两者。所述分离的核酸分子还可连接或融合至异源核酸序列(例如在载体中)或异源标记。例如,本文所公开的分离的核酸分子可在载体中或作为包含分离的核酸分子和异源核酸序列的外源供体序列。分离的核酸分子还可与异源标记连接或融合。标记可以是直接可检测的(例如荧光团)或间接可检测的(例如半抗原、酶或荧光团淬灭剂)。此类标记可通过光谱学、光化学、生物化学、免疫化学或化学手段检测。此类标记包括例如放射性标记、颜料、染料、色原、自旋标记和荧光标记。标记也可以是例如化学发光物质;含金属物质;或酶,其中发生依赖于酶的二次信号产生。术语“标记”还可指“标签”或半抗原,其可选择性地结合缀合分子,使得缀合分子在随后与底物一起添加时用于产生可检测信号。例如,生物素可与辣根过氧化物酶(HRP)的亲和素或链霉亲和素缀合物一起用作标签以结合标签,并使用量热底物(例如四甲基联苯胺(TMB))或荧光底物进行检查以检测HRP的存在。可用作标签来促进纯化的示例性标记包括但不限于myc、HA、FLAG或3XFLAG、6Xhis或聚组氨酸、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白、表位标签或免疫球蛋白的Fc部分。多种标记包括例如颗粒、荧光团、半抗原、酶以及其量热、荧光和化学发光底物和其它标记。
所公开的核酸分子可包括例如核苷酸或非天然或修饰的核苷酸,例如核苷酸类似物或核苷酸替代物。此类核苷酸包括含有修饰的碱基、糖或磷酸酯基团的核苷酸,或者在其结构中掺入非天然部分的核苷酸。非天然核苷酸的实例包括但不限于双脱氧核苷酸、生物素酰化的、胺化的、脱氨基的、烷基化的、苄化的和荧光团标记的核苷酸。
本文公开的核酸分子还可包含一种或多种核苷酸类似物或取代。核苷酸类似物是含有对碱基、糖或磷酸酯部分的修饰的核苷酸。对碱基部分的修饰包括但不限于A、C、G和T/U以及不同的嘌呤或嘧啶碱基(例如假尿苷、尿嘧啶-5-基、次黄嘌呤-9-基(I)和2-氨基腺嘌呤-9-基)的天然和合成修饰。修饰的碱基包括但不限于5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基和其它烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基和其它烷基衍生物、2-硫代尿嘧啶、2-硫代胸腺嘧啶和2-硫代胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基尿嘧啶和胞嘧啶、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫代尿嘧啶、8-卤代、8-氨基、8-硫代、8-硫代烷基、8-羟基和其它8-取代的腺嘌呤和鸟嘌呤、5-卤代(例如5-溴)、5-三氟甲基和其它5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤、7-甲基腺嘌呤、8-氮杂鸟嘌呤、8-氮杂腺嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、3-脱氮鸟嘌呤和3-脱氮腺嘌呤。
核苷酸类似物还可包括对糖部分的修饰。对糖部分的修饰包括但不限于核糖和脱氧核糖的天然修饰以及合成修饰。糖修饰包括但不限于在2’位置处的以下修饰:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1-10烷基或C2-10烯基和C2-10炔基。示例性的2'糖修饰还包括但不限于-O[(CH2)nO]mCH3、-O(CH2)nOCH3、-O(CH2)nNH2、-O(CH2)nCH3、-O(CH2)n-ONH2和-O(CH2)nON[(CH2)nCH3)]2,其中n和m是1至约10。2’位置处的其它修饰包括但不限于C1-10烷基、取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学特性的基团或用于改善寡核苷酸的药效动力学特性的基团,以及具有类似特性的其它取代基。还可在糖上的其它位置进行类似的修饰,特别是糖在3’末端核苷酸上或在2’-5’连接的寡核苷酸中的3’位置和5’末端核苷酸的5’位置。修饰的糖还可包括那些在桥接环氧处含有修饰的糖,例如CH2和S。核苷酸糖类似物还可具有糖模拟物,例如环丁基部分代替呋喃戊糖。
核苷酸类似物还可在磷酸酯部分处进行修饰。修饰的磷酸部分包括但不限于可以经修饰以使得两个核苷酸之间的键含有以下的修饰的磷酸部分:硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其它烷基膦酸酯(包括3'-亚烷基膦酸酯和手性膦酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰氨基磷酸酯、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和硼烷磷酸酯。两个核苷酸之间的这些磷酸酯或修饰的磷酸酯键联可通过3'-5'键联或2'-5'键联,并且所述键联可包含反转的极性诸如3'-5'至5'-3'或2'-5'至5'-2'。还包括各种盐、混合盐以及游离酸形式。核苷酸替代物还包括肽核酸(PNA)。
本公开还提供包含本文公开的核酸分子中的任一者或多者的载体。在一些实施方案中,载体包含本文公开的任何一种或多种核酸分子和异源核酸。所述载体可为能够转运核酸分子的病毒或非病毒载体。在一些实施方案中,所述载体为质粒或粘粒(例如,可将另外的DNA区段连接至其中的环状双链DNA)。在一些实施方案中,所述载体为病毒载体,其中另外的DNA区段可连接至病毒基因组中。表达载体包括但不限于质粒、粘粒、逆转录病毒、腺病毒、腺相关病毒(AAV)、植物病毒(诸如花椰菜花叶病毒和烟草花叶病毒)、酵母人工染色体(YAC)、Epstein-Barr(EBV)衍生的附加体以及本领域已知的其它表达载体。
用于哺乳动物宿主细胞表达的所需调控序列可包括例如指导哺乳动物细胞中的高水平多肽表达的病毒元件,例如衍生自逆转录病毒LTR、巨细胞病毒(CMV)(例如CMV启动子/增强子)、猿猴病毒40(SV40)(例如SV40启动子/增强子)、腺病毒(例如腺病毒主要晚期启动子(AdMLP))的启动子和/或增强子、多瘤病毒和哺乳动物强启动子(例如天然免疫球蛋白和肌动蛋白启动子)。在细菌细胞或真菌细胞(例如酵母细胞)中表达多肽的方法也是众所周知的。启动子可为例如组成型活性启动子、条件启动子、诱导型启动子、时间受限型启动子(例如发育调控型启动子)或空间受限型启动子(例如细胞特异性或组织特异性启动子)。
核酸分子内的核苷酸序列或多肽内的氨基酸序列的特定伸长段之间的同一性百分比(或互补性百分比)可使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,J.Mol.Biol.,1990,215,403-410;Zhang和Madden,Genome Res.,1997,7,649-656)或通过使用Gap程序(Wisconsin序列分析包,用于Unix的版本8,Gen eticsComputer Group,University Research Park,Madison Wis.),使用默认设置(其使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489))来确定。在本文中,如果对序列同一性百分比进行参考,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
本公开还提供包含本文公开的分离的核酸分子、基因组核酸分子、mRNA分子和/或cDNA分子中的任一者或多者的组合物。在一些实施方案中,所述组合物是药物组合物。在一些实施方案中,所述组合物包含载剂和/或赋形剂。载剂的实例包括但不限于聚(乳酸)(PLA)微球、聚(D,L-乳酸-共乙醇酸)(PLGA)微球、脂质体、胶束、反胶束、脂质螺旋物和脂质微管。载剂可包括缓冲盐溶液,例如PBS、HBSS等。
如本文所用,当在对特定核苷酸或核苷酸序列或位置的编号的语境中使用时,短语“对应于”或其语法变型是指当将特定核苷酸或核苷酸序列与参考序列进行比较时对指定参考序列的编号(例如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:15)。换句话说,特定聚合物的残基(例如核苷酸或氨基酸)编号或残基(例如核苷酸或氨基酸)位置相对于参考序列来指定,而不是通过残基在特定核苷酸或核苷酸序列内的实际数值位置来指定。例如,特定核苷酸序列可通过引入缺口以优化两个序列之间的残基匹配来与参考序列比对。在这些情况下,虽然存在缺口,但是对特定核苷酸或核苷酸序列中的残基的编号是相对于其所比对的参考序列来进行的。
例如,包含编码人GPAM多肽的核苷酸序列的核酸分子(其中所述核苷酸序列包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤)意味着将如果GPAM基因组核酸分子的核苷酸序列与SEQ ID NO:2的序列进行比对,则GPAM序列在对应于SEQ ID NO:2的位置3,195的位置处具有鸟嘌呤残基。这同样适用于包含编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:9的位置327的位置处的鸟嘌呤,和包含编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQID NO:21的位置327的位置处的鸟嘌呤。换句话说,这些短语是指编码GPAM多肽的核酸分子,其中基因组核酸分子具有包含与SEQ ID NO:2的位置3,195处的鸟嘌呤残基同源的鸟嘌呤残基的核苷酸序列(或其中mRNA分子具有包含与SEQ ID NO:9的位置327处的鸟嘌呤残基同源的鸟嘌呤残基的核苷酸序列,或其中cDNA分子具有包含与SEQ ID NO:21的位置327处的鸟嘌呤残基同源的鸟嘌呤残基的核苷酸序列)。在本文中,提及基因组核酸分子时,此类序列也被称为“具有Ile43Val改变的GPAM序列”或“具有Ile43Val变异的GPAM序列”(或提及mRNA分子时为“具有A327G改变的GPAM序列”或“具有A327G变异的GPAM序列”,以及提及cDNA分子时为“具有A327G改变的GPAM序列”或“具有A327G变异的GPAM序列”)。
如本文所述,GPAM基因组核酸分子内对应于根据SEQ ID NO:2的位置3,195的位置,例如,可通过在特定GPAM核酸分子的核苷酸序列与SEQ ID NO:2的核苷酸序列之间进行序列比对来鉴定。存在多种计算算法可用于进行序列比对以鉴定对应于例如SEQ ID NO:2中的位置3,195的核苷酸位置。例如,通过使用NCBI BLAST算法(Altschul等人,NucleicAcids Res.,1997,25,3389-3402)或CLUSTALW软件(Sievers和Higgins,MethodsMol.Biol.,2014,1079,105-116),可进行序列比对。然而,序列也可手动地进行比对。
GPAM参考多肽的氨基酸序列在SEQ ID NO:27中列出。参考SEQ ID NO:27,GPAM参考多肽的长度为828个氨基酸。参考SEQ ID NO:27,位置43为异亮氨酸。另一种GPAM参考多肽的氨基酸序列在SEQ ID NO:28中列出。参考SEQ ID NO:28,GPAM参考多肽的长度为710个氨基酸。参考SEQ ID NO:28,位置43为异亮氨酸。
存在GPAM变体多肽,其氨基酸序列示于SEQ ID NO:29中。参考SEQ ID NO:29,GPAM变体多肽的长度为828个氨基酸。参考SEQ ID NO:29,位置43为缬氨酸。
存在另一种GPAM变体多肽,其氨基酸序列示于SEQ ID NO:30中。参考SEQ ID NO:30,GPAM变体多肽的长度为710个氨基酸。参考SEQ ID NO:30,位置43为缬氨酸。
所附序列表中列出的核苷酸序列和氨基酸序列是使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出的。所述核苷酸序列遵循从序列的5’端开始并且前进(即在每一行中从左到右)至3’端的标准惯例。仅示出了每一个核苷酸序列的一条链,但应理解的是,互补链是通过对所展示链的任何参考而被包括在内的。氨基酸序列遵循从序列的氨基末端开始并且前进(即在每一行中从左到右)至羧基末端的标准惯例。
本公开还提供治疗或抑制肝病的治疗剂,其用于治疗受试者的肝病(或用于制备用于治疗肝病的药物),其中所述受试者具有编码本文所述的人GPAM多肽的基因组核酸分子、mRNA分子和/或cDNA分子中的任一者。治疗或抑制肝病的治疗剂可为本文所述的治疗或抑制肝病的治疗剂中的任一者。
在一些实施方案中,所述受试者包含:具有编码人GPAM多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:9或其互补序列的位置327的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列具有对应于根据SEQ ID NO:21或其互补序列的位置327的位置处的鸟嘌呤;或GPAM多肽,其包含对应于根据SEQ ID NO:29的位置43的位置处的缬氨酸。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:10或其互补序列的位置291的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:22或其互补序列的位置291的位置处的鸟嘌呤;或GPAM多肽,其包含对应于根据SEQ ID NO:30的位置43的位置处的缬氨酸。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:11或其互补序列的位置323的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:23或其互补序列的位置323的位置处的鸟嘌呤。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:12或其互补序列的位置326的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:24或其互补序列的位置326的位置处的鸟嘌呤。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:13或其互补序列的位置305的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:25或其互补序列的位置305的位置处的鸟嘌呤。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:14或其互补序列的位置170的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:26或其互补序列的位置170的位置处的鸟嘌呤。
本公开还提供GPAM抑制剂,其用于治疗受试者的肝病(或用于制备用于治疗肝病的药物),其中所述受试者具有编码本文所述的人GPAM多肽的基因组核酸分子、mRNA分子和/或cDNA分子中的任一者。GPAM抑制剂可为本文所述的GPAM抑制剂中的任一者。
在一些实施方案中,所述受试者包含:具有编码人GPAM多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:9或其互补序列的位置327的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列具有对应于根据SEQ ID NO:21或其互补序列的位置327的位置处的鸟嘌呤;或GPAM多肽,其包含对应于根据SEQ ID NO:29的位置43的位置处的缬氨酸。GPAM抑制剂可为本文所述的GPAM抑制剂中的任一者。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:10或其互补序列的位置291的位置处的鸟嘌呤;具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:22或其互补序列的位置291的位置处的鸟嘌呤;或GPAM多肽,其包含对应于根据SEQ ID NO:30的位置43的位置处的缬氨酸。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:11或其互补序列的位置323的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:23或其互补序列的位置323的位置处的鸟嘌呤。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:12或其互补序列的位置326的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:24或其互补序列的位置326的位置处的鸟嘌呤。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:13或其互补序列的位置305的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:25或其互补序列的位置305的位置处的鸟嘌呤。
在一些实施方案中,受试者包含:具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:14或其互补序列的位置170的位置处的鸟嘌呤,或具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:26或其互补序列的位置170的位置处的鸟嘌呤。
以上或以下所引用的所有专利文献、网站、其它出版物、登录号等均出于所有目的以引用的方式整体并入,其程度犹如每个单独项目均具体地且单独地被指示为以引用的方式如此并入一样。如果序列的不同版本与不同时间的登录号相关,则意指与本申请的有效提交日期的登录号相关的版本。有效提交日期意指实际提交日期或优先权申请的提交日期中较早的日期,如果适用,则参考登录号。同样,如果出版物、网站等的不同版本在不同时间公布,除非另有说明,否则意指在申请的有效提交日期最近公布的版本。除非另有明确说明,否则本公开的任何特征、步骤、元素、实施方案或方面可与任何其它特征、步骤、元素、实施方案或方面组合使用。尽管出于清楚和理解的目的已通过说明和实例详细描述本公开,但将显而易见的是,可在所附权利要求的范围内实施某些变化和修改。
提供以下实施例来更详细地描述实施方案。它们意图说明但不限制所要求保护的实施方案。以下实施例为本领域普通技术人员提供本文所述的化合物、组合物、制品、装置和/或方法如何制备和评价的公开和描述,并且意图仅仅是示例性的并且不意图限制任何权利要求的范围。已经努力确保关于数字(例如量、温度等)的准确性,但可考虑一些误差和偏差。除非另外指示,否则份数是重量份,温度是以℃计或处于环境温度,并且压力处于或接近大气压。
实施例
实施例1:编码线粒体甘油-3-磷酸酰基转移酶(GPAM)的基因的功能丧失与较低肝脏脂肪、较低ALT和预防肝病相关
为了确定导致慢性肝病的遗传因素,对UK Biobank队列(UKB)的40,058名参与者进行了估算基因型数据、外显子组序列数据和磁共振成像(MRI)衍生表型的分析。随后评估了统计学上显著的发现与通过ALT(一种广泛使用的肝损伤量度)测量的肝损伤的关系。还评估了与代谢表型、慢性肝病诊断、2型糖尿病和冠状动脉疾病的关联。此分析包括UKBiobank队列(UKB)、Geisinger Health System MyCode Community Health Initiative队列研究(GHS)和Mount Sinai’s BioMe Personalized Medicine队列(SINAI)中的597,856名欧洲血统参与者。
使用包含11,914,698个变体和37,250名参与UKB的欧洲血统个体的估算数据集,对MRI衍生表型进行全基因组分析研究(GWAS)。结果表型包括质子密度脂肪分数(PDFF),一种肝脂肪含量的量度;细胞外液分数(ECF),一种肝纤维化和炎症的指标;以及铁校正T1测量结果(cT1)。PDFF被定义为来自脂肪(甘油三酯)的移动质子密度与来自移动甘油三酯和移动水的质子总密度的比率,并且反映了组织内脂肪的浓度。ECF和cT1测量响应于炎症和纤维化而发生的细胞外组织液的增加。
PDFF的GWAS在全基因组水平上确定了19个具有统计显著性的关联(p<5×10-8)。一个基因座包含rs2792751(T->C,替代等位基因频率为73%),编码一种常见的错义变异,将所编码的GPAM蛋白的第43个氨基酸处的异亮氨酸变为缬氨酸(Ile43Val)。在欧洲群体的GPAM基因座处,Ile43Val与PDFF的前哨遗传变体(即关联p值最低的变体)处于近乎完美的连锁不平衡(r2=0.99)。Ile43Val与较低的PDFF水平显著相关(P<6.9×10-16),如表2中所示。
表2:UKB中通过磁共振成像(MRI)得出的质子密度脂肪分数(PDFF)测量的Ile43Val和GPAM pLOF负荷与肝脏脂肪含量的关联
注:PDFF,质子密度脂肪分数;RR,不携带替代变体等位基因的个体(纯合非携带者)的数量;RA,携带单一替代变体等位基因的个体(杂合携带者)的数量;AA,两个基因拷贝中携带替代变体等位基因的个体(纯合携带者)的数量;替代等位基因是遵循人类基因组序列参考构建38和HGVS蛋白质序列命名法,引起功能丧失或氨基酸变化的等位基因;AAF,替代等位基因频率;SD,标准差单位。
使用外显子组序列数据,估计了GPAM基因中罕见(AAF<1%)预测功能丧失(pLOF)变体的负荷与肝脏MRI中通过PDFF测量的肝脏脂肪之间的关联。在此分析中,GPAM中的pLOF变体与较低的PDFF水平相关(p=0.024),如表2中所示。
接着进行遗传关联研究的荟萃分析,以确定与ALT(肝损伤的生物标志物)相关的基因。发现GPAM位点处的Ile43Val变体与较低的ALT水平相关(P<4.20×10-54),如表3中所示,并且与此位点处的前哨变体处于完美连锁不平衡(r2>0.99)。
表3:GPAM Ile43Val等位基因和GPAM中蛋白质截短变体的负荷与较低的循环ALT水平相关。结果以标准差单位和原始临床单位(国际单位/升)显示
注:RR,不携带替代变体等位基因的个体(纯合非携带者)的数量;RA,携带单一替代变体等位基因的个体(杂合携带者)的数量;AA,两个基因拷贝中携带替代变体等位基因的个体(纯合携带者)的数量;替代等位基因是遵循人类基因组序列参考构建38和HGVS蛋白质序列命名法,引起功能丧失或氨基酸变化的等位基因;AAF,替代等位基因频率;SD,标准差单位;U/L,单位每升。
使用外显子组序列数据,估计了GPAM基因中罕见(AAF<1%)预测功能丧失(pLOF)变体的负荷与ALT之间的关联。在此分析中,GPAM中的pLOF变体与p=2.5×10-06的循环ALT水平降低密切相关,如表3中所示。表2和表3中所述的Ile43Val和GPAM pLOF负荷的关联模式表明Ile43Val很可能引起GPAM功能丧失。
表4显示Ile43Val与UKB中以MRI测量的肝脏炎症测量结果减少相关。这些结果与表2和表3中的结果一起表明GPAM功能丧失与较低肝脏炎症相关。GPAM pLOF变体的携带者在成像时的肝脏炎症水平在数值上较低,但根据观察到的Ile43Val效应和GPAM pLOF变体的低频率,统计能力仅限于检测GPAM pLOF负荷与肝脏炎症之间的显著关联。
表4:Ile43Val与UKB中肝脏成像表型之间有显著相关性,表明肝脏炎症
注:*表示表型针对包括BMI、饮酒量和糖尿病的技术协变量进行了调整;ECF表示细胞外液;T1表示纵向磁化恢复的时间常数,它是净磁化恢复至其基态的速度的度量,所述速度受到磁场强度和组织成分(例如组织中的脂肪和/或铁)的影响;cT1=T1校正肝脏铁含量的影响,导致T1值被低估。RR,不携带替代变体等位基因的个体(纯合非携带者)的数量;RA,携带单一替代变体等位基因的个体(杂合携带者)的数量;AA,两个基因拷贝中携带替代变体等位基因的个体(纯合携带者)的数量;替代等位基因是遵循人类基因组序列参考构建38和HGVS蛋白质序列命名法,引起功能丧失或氨基酸变化的等位基因;AAF表示替代等位基因频率;SD表示标准差单位。
表5和表6显示了Ile43Val与多种心脏代谢表型,包括较低HbA1c、较低载脂蛋白B、较低LDL-C、较低腰臀比(根据BMI进行调整,WHRadjBMI)、较低血压、较高体重指数(BMI)和较高甘油三酯之间的关联。所述变体与2型糖尿病或冠状动脉疾病的风险无关。
表5:GPAM中的Ile43Val变体与心血管和代谢连续表型相关。结果来自GHS和UKB队列的逆方差加权荟萃分析
注:LDL-C表示低密度脂蛋白胆固醇,HDL-C表示高密度脂蛋白胆固醇,SBP表示收缩压,DBP表示舒张压,BMI表示身体质量指数,WHRadjBMI表示腰臀比调整后的BMI,HbA1c表示血红蛋白A1c,CAD表示冠状动脉疾病;RR,不携带替代变体等位基因的个体(纯合非携带者)的数量;RA,携带单一替代变体等位基因的个体(杂合携带者)的数量;AA,两个基因拷贝中携带替代变体等位基因的个体(纯合携带者)的数量;替代等位基因是遵循人类基因组序列参考构建38和HGVS蛋白质序列命名法,引起功能丧失或氨基酸变化的等位基因;AAF表示替代等位基因频率;SD表示标准差单位。
表6:GPAM中的变体Ile43Val与2型糖尿病或冠状动脉疾病的风险无关。结果来自GHS和UKB队列的逆方差加权荟萃分析
注:CAD表示冠状动脉疾病;RR,不携带替代变体等位基因的个体(纯合非携带者)的数量;RA,携带单一替代变体等位基因的个体(杂合携带者)的数量;AA,两个基因拷贝中携带替代变体等位基因的个体(纯合携带者)的数量;替代等位基因是遵循人类基因组序列参考构建38和HGVS蛋白质序列命名法,引起功能丧失或氨基酸变化的等位基因;AAF表示替代等位基因频率;SD表示标准差单位。
表7显示,GPAM中的Ile43Val也与预防肝病诊断,包括实质性肝病、酒精性、非酒精性肝病、肝纤维化、肝硬化和病毒性肝炎密切相关。这些结果与表2和表3中的结果一起表明,GPAM功能丧失可预防各种慢性肝病和病毒性肝炎。
表7:Ile43Val与UKB、GHS和SINAI的荟萃分析中肝病的临床诊断的关联
注:RR,不携带替代变体等位基因的个体(纯合非携带者)的数量;RA,携带单一替代变体等位基因的个体(杂合携带者)的数量;AA,两个基因拷贝中携带替代变体等位基因的个体(纯合携带者)的数量;替代等位基因是遵循人类基因组序列参考构建38和HGVS蛋白质序列命名法,引起功能丧失或氨基酸变化的等位基因;AAF表示替代等位基因频率;SD表示标准差单位;OR表示比值比。
功能丧失变体的负荷与PDFF或ALT之间的关联是由GPAM中的多个错义和功能丧失变体驱动的。表8包含关联中使用的所有单独变体。
表8:Chr:position:ref:alt表示遗传变体在染色体(chr)上的位置,以及基因组参考联盟构建38上的参考(ref)和其替代(alt)等位基因。蛋白质变化遵循人类基因组变异协会的建议,并与每个Ensembl转录本标识相对应,在蛋白质编码变体的情况下给出hgvsp(蛋白质变化),在剪接变体的情况下给出hgvsc(cDNA变化)
参与队列:
在United Kingdom Biobank(UKB)队列(Bycroft等人,2018,doi:10.1038/s41586-018-0579-z;Van Hout等人,2020,doi:10.1038/s41586-020-2853-0)、来自Geisinger Health System(GHS)的MyCode Community Health Initiative队列(Carey等人,2016,doi:10.1038/gim.2015.187)和Mount Sinai’s BioMe Personalized Medicine队列(SINAI)(Gottesman等人,2013,doi:10.1038/gim.2013.72)中进行了遗传关联研究。
UKB是2006-2010年间通过英国22家检测中心招募的40至69岁人群的基于群体的队列研究。总共包括430,998名来自UKB的具有可用的全基因组测序和表型数据的欧洲血统参与者。GHS MyCode研究是2007-2019年从美国宾夕法尼亚州中部和东部(Central andEastern Pennsylvania(USA))招募的患者的基于健康系统的队列。总共包括136,239名来自GHS的具有可用的全基因组测序和表型数据的欧洲血统参与者。Mount Sinai’s BioMePersonalized Medicine队列(SINAI)是一个与电子健康记录相关的临床护理队列,由30,619人组成。这些人来自不同的血统,并以广泛的生物医学性状为特征。
肝脏MRI表型:
参与UKB的40,058名个体的子集经历了肝脏磁共振成像(MRI)的成像期(Littlejohns等人,2020,doi:10.1038/s41467-020-15948-9)。大多数选择进行肝脏MRI的UK Biobank参与者都经历了两次采集,一次用于估计脂肪含量,且另一次用于定量T1作图序列。对于前者,大约10,000名受试者根据Dixon梯度回波方案进行了成像;2016年,用于测量脂肪分数的采集方案更新为IDEAL序列(利用回波不对称和最小二乘估计迭代分解水和脂肪)。此次采集的数据以每个受试者的一系列复值2D图像的形式提供。面内像素尺寸为2.5×2.5mm;切片厚度为6mm。后一种方案“ShMOLLI”(缩短修改的Look-Locker反转恢复)在整个研究中保持一致。此次采集的数据以每个受试者的一个实值2D预先计算的T1图的形式提供。面内像素尺寸为1.15×1.15mm;切片厚度为8mm。两个MRI数据集都是在每个受试者相同的2D横截面处获取的,旨在通过肝门。所有图像均在Siemens MAGNETOM Aera 1.5T临床MRI扫描仪上采集。
PDFF、ECF、T1和校正T1的测量结果是通过在肝脏MRI图像上分割肝脏后应用预定义的数学模型获得的(Hernando等人,2012,doi:10.1002/mrm.23044;Wood等人,2005,doi:10.1182/blood-2004-10-3982;Tunnicliffe等人,2017,doi:10.1002/jmri.25392)。两次腹部MRI采集得出三种不同的表型,一种用于估计脂肪含量,并且其它的用于定量T1作图序列:质子密度脂肪分数(PDFF)和细胞外液分数(ECF,肝纤维化和炎症的代表)。PDFF被估计为脂肪信号相对于总脂肪加水信号的分数。ECF是通过从其发布的表格中插值来估计的,所述表格含有非线性数值模型的网格点,所述模型将ECF描述为T1(来自ShM OLLI MRI)和肝铁含量(来自IDEAL MRI)的函数,并校正场强。
使用阈值方法对属于肝脏的像素进行分割,对PDFF图进行Li阈值处理以鉴定肝脏组织,并对T1图进行Otsu阈值处理以排除较大的血管。为了获得每个受试者每个性状的汇总测量,对每个参数图的肝脏内的所有像素取平均值。
通过将性状与以下协变量进行残差来消除所有性状的混杂:性别、年龄、年龄平方、血统的前20个主成分、年龄*性别、成像中心、成像方案。其它协变量(此处称为‘额外’)为BMI、BMI2、7个二元酒精变量(每日、每周1-2次、每周3-4次、每月1-3次、特殊场合、先前、当前)、2个二元体重增加变量(去年体重增加、去年体重减轻)和5个二元疾病变量(糖尿病、心脏病、心绞痛、中风、高血压)。
表型定义:
ALT、LDL-C、HDL-C、甘油三酯、BMI、腰围、臀围、血糖和Hb1Ac的临床实验室测量结果是从GHS参与者的电子健康记录(EHR)中提取的,或从UKB招募中心的血液中测量的。对于GHS,计算所有参与者的两次或更多次测量的中值。在UKB中,在研究的基线访视时,由IFCC(国际临床化学联合会)在Beckman Coulter AU5800上进行分析来测量ALT、LDL-C、HDL-C、甘油三酯和血糖,并在多次测量时取平均值。Hb1Ac由HPLC使用Bio-Rad VARIANT II Turbo来测量。在遗传关联分析之前,连续表型值通过逆标准正态函数进行转换,应用于每个血统组内并单独应用于男性和女性中。
在GHS、UKB和SINAI中,疾病结果是根据国际疾病分类(InternationalClassification of Diseases)第九版和第十版(ICD-9和ICD-10)以及EHR中存储的读取代码来定义的,并在可用时使用自我报告;所有这些并组合成单个变量,以将个体分类为病例或对照。使用先前描述的算法来鉴定患有2型糖尿病的个体(Eastwood等人,2016,doi:10.1371/journal.pone.0162388)。如表9中所述,结合EHR记录、自我报告和ALT测量结果,鉴定出患有冠状动脉疾病或肝脏疾病的个体。
表9:使用EHR记录和自我报告在GHS、UKB和SINAI中鉴定出患有或未患疾病的个体。OPCS4代码(操作程序)、f.20002(自我报告的疾病)和f.20004(自我报告的操作程序)变量特定于UKB。在每个队列中,带有ICD-9或读取代码的EHR记录被转换为ICD-10代码
基因型数据:
如先所描述进行高覆盖率全外显子组测序(Science,2016,354:aaf6814;和Nature,2020;586,749-756)并总结如下。将NimbleGen探针(VCRome;对于GHS队列的一部分)或可从Integrated DNA Technologies获得的xGen设计的经修饰型式(IDT;对于GHS的其余部分和其它队列)用于外显子组的靶序列捕获。在文库制备期间向每个DNA片段添加独特的6碱基对(bp)条形码(VCRome)或10bp条形码(IDT)以促进多重外显子组捕获和测序。在进行外显子组捕获之前合并等量样品。使用Illumina v4 HiSeq 2500(对于GHS队列的一部分)或NovaSeq(对于GHS的其余部分和其它队列)仪器上的75bp配对末端读段进行测序。测序的覆盖深度(即,覆盖基因组靶区中的每个核苷酸的序列读段的数目)足以在96%的VCRome样品中提供对85%的靶碱基的大于20x覆盖,并且在99%的IDT样品中提供对90%的靶碱基的20x覆盖。数据处理步骤包括使用Illumina软件进行样品分用(de-multiplexing),与GRCh38人类基因组参考序列进行比对,包括生成二进制比对和作图文件(BAM),处理BAM文件(例如标记重复读段和其它读段作图评价)。使用GLNexus系统(DOI:10.1101/343970)执行变体调用。变体作图和注释是基于GRCh38人类基因组参考序列和使用snpEff软件的Ensembl v85基因定义的。然后通过选择对于每个基因最有害的功能效应类别,将涉及具有注释的起始和终止的蛋白编码转录本的snpEff预测组合成单个功能影响预测。这些注释的等级(从最有害到最不有害)是移码、停止增加、停止丧失、剪接受体、剪接供体、停止丧失、框内插入缺失、错义、其它注释。预测的LOF遗传变体包括:a)导致移码的插入或缺失,b)导致引入提前终止密码子或转录起始位点或终止位点损失的插入、缺失或单核苷酸变体,和c)供体或受体剪接位点的变体。针对可能的功能影响根据使用SIFT(Adzhubei等人,Nat.Methods,2010,7,248-9)和Polyphen2_HVAR(Adzhubei等人,Nat.Methods,2010,7,248-9)、LRT(Chun等人,Genome Res.,2009,19,1553-61)以及MutationTaster(Schwarz等人,Nat.Methods,2010,7,575-6)预测有害性的计算机预测算法对错义变体进行分类。对于每个基因,每个变体的替代等位基因频率(AAF)和功能注释确定包含在这7次基因负荷暴露中:1)AAF<1%的pLOF变体;2)通过5/5算法预测为有害的,AAF<1%的pLOF或错义变体;3)通过5/5算法预测为有害的,AAF<0.1%的pLOF或错义变体;4)通过至少1/5算法预测为有害的,AAF<1%的pLOF或错义变体;5)通过至少1/5算法预测为有害的,AAF<0.1%的pLOF或错义变体;6)AAF<1%的pLOF或任何错义;7)AAF<0.1%的pLOF或任何错义变体。
罕见功能丧失变异的基因负荷关联分析:
通过使用REGENIE v1.0(doi:万维网上的“doi.org/10.1101/2020.06.19.162354”)拟合针对近似基因组亲属关系矩阵的多基因评分调整的线性(对于数量性状)或firth偏差校正逻辑(对于二元性状)回归模型,检查了给定基因中的罕见预测功能丧失或错义变体的负荷与表型之间的关联。分析按血统进行分层,并根据年龄、年龄2、性别、年龄与性别和年龄2与性别交互项、实验批次相关协变量、10个常见变体衍生主成分和20个罕见变体衍生主成分进行调整。使用固定效应逆方差加权荟萃分析来组合每个变体-表型关联的跨队列结果。在基因负荷测试中,如果所有个体携带一种或多种合格的罕见变体(如上所述,基于频率和功能注释),则所有个体被标记为杂合子,并且如果他们携带纯合状态的任何合格变体,则被标记为纯合子。接着使用这种“复合基因型”来测试关联性。
常见变体的GWAS:
通过进行全基因组关联研究,鉴定了相关的常见变体,包括使用单倍型参考联盟(Haplotype Reference Consortium)小组估算的超过1200万个常见至低频遗传变体。在GHS研究中,分别在用Illumina人类Omni表达外显子组阵列(Illumina Human OmniExpress Exome array,OMNI集合)和全局筛选阵列(GSA集合)进行基因分型的样品中单独进行插补。然后在两个GHS集合中合并来自插补变体的剂量数据,以获得用于关联分析的组合数据集。通过使用REGENIE拟合全基因组回归模型,分别在GHS和UKB中进行全基因组关联分析(Mbatchou等人,2020,doi:10.1101/2020.06.19.162354)。如针对负荷测试在上文所述,在每个队列内,分析按血统进行分层并根据年龄、年龄2、性别、年龄与性别和年龄2与性别交互项、实验批次相关协变量和10个常见变体衍生主成分进行调整。然后通过逆方差加权元分析组合来自UKB和GHS分析的结果,以在发现队列的欧洲子集中获得全基因组元分析。
根据前面的描述,除了本文描述的修改以外,对所描述的主题的各种修改对于本领域技术人员来说将是显而易见的。此类修改也意图落在随附权利要求书的范围内。本申请中引用的每篇参考文献(包括但不限于期刊文章、美国和非美国专利、专利申请公布、国际专利申请公布、基因库登录号等)均通过引用以其整体并且出于所有目的并入本文中。
序列表
<110> 雷杰纳荣制药公司(Regeneron Pharmaceuticals, Inc.)
L·A·洛塔(Lotta, Luca Andrea)
N·维尔韦杰(Verweij, Niek)
C·奥杜什莱恩(O'Dushlaine, Colm)
J·马奇尼(Marchini, Jonathan)
A·巴拉斯(Baras, Aris)
<120> 用线粒体甘油-3-磷酸酰基转移酶(GPAM)抑制剂治疗肝病
<130> 189238.05802 (3466) (10855WO01)
<160> 44
<170> PatentIn 3.5版
<210> 1
<211> 33901
<212> DNA
<213> 智人(homo sapien)
<400> 1
gcgccactgc agctggcatt ggccgggact ggaagtgcgg gcttctgcag cagccgaagc 60
tggagctgct agggtgcgaa ctgccagggc aggtgtgggc tgcgggaggc tactcgggcc 120
gggagcgccg ggacaagtgc atggaggtgg tgcgactcct gcaagttgct ggggcagtcg 180
tgtcccctat tccctgacac ccgagctccg gtcttctccc tgagaaatcg gtcgggctcg 240
tgcaggggtg gggatcagga ttcatctctc ctggggagac tgcgctgggg catgggttcc 300
cctgggttgg aaggagtcct tatggactca gtcccctaag tatctgcacg cgcggaggcg 360
ccgccagcca gcccgcctgg gtccctaggg aacattgagg cagtaagggg tactctgaga 420
gcagccggta tgctggagat aattaatgac agcgttacca ttgattggac tgagcgctca 480
ctgtgtgtta cacactgtgg tagacccttt gtttatatta ttccgtcctc tcaacaatcc 540
aggaggttaa gagctatcat tctgcccatt ttccagatgg gaaaactaag gcatagaagt 600
taaccaactt atggtaataa aaaatcacac agatggtaag cagtggaaga tttaaacctc 660
acagctggtc ttccagcctc tgtccttttc agatcctcta gtcagcttct ctcagcgcat 720
gctgctggct ggtgcctctg ggatattgct tctttattac tccttgacct agagcgaact 780
gtgcggaggg aggaagtgca aaacgtggac ctcctgttgg cacaaacgag cctctttgtc 840
ctctcctcat cctctcttca cttcattttc tcaggcagca gcggctcccc tgttgtatgg 900
acattctgca cccgaaactg atagctgagt cctgaagttt tatgttatga aacagaagaa 960
ctttcatccc aggtgcattg gtttattctc tcccctagcc tgttatgtta gattgtactt 1020
atgttaaatt tttaaggaca taggtggtta tgccgagaat aacagtgact gtagccaacc 1080
catgtgggga ttgtaaagaa attggaatat gccttccaaa ggaacactgt taatctagac 1140
atgacctttc aggattttaa aggaataatt ttaggccagg tgagaaacag ccaaaagcaa 1200
aaataatgtg aggctagaga ttatgtttga aagtttttat attttggatt aatatctatt 1260
ctaggagttt actcttagtg aatctttttc cttagggtag aaaaaagctt atcgaaaagg 1320
atgaaaactt atacatcaga tatttcaaaa tagtgtgctt ttctttcaga gctttgtagc 1380
tttgtattac ctttgtatta aaagtgaaaa tgttctttta ggacatcaca agaaaattaa 1440
gatcttaatt taagtacggg aacttaaggg gtgccctaat tgccttaatt aaataaacat 1500
gccttccttc tgccaggaac tattcaatta acaaaaatga aataagaata agctcttatt 1560
ttcatttgca aatgactatt catagctatt ttgtttggat acaattcata gctattttgt 1620
ttggatacta ttttgtttgc atactatgtt ttgtttggat actattcata gctattttgt 1680
gtggatacaa aggatacaat gttgtatcct tatatattca ggaagtctta gaatacaaat 1740
gctgattttt tttttttcta gtcagggaag cctaactgtg ttcatataaa cacatcaaag 1800
tcagttttta ccttgtgact caacatggta gaagtctgtc agttcatgtg atatcccatt 1860
gtggagcaaa gtaatgtaga aatcagaatt ttgagttcta gtatttactc tctcgattcc 1920
ttgttaattt aaatggtacc tattttttat agcacatgat ttgggaatta cactttgtga 1980
catggatgaa tctgcactga cccttggtac aatagatgtt tcttatctgc cacattcatc 2040
agaatacagt gttggtcgat gtaagcacac aagtgaggaa tgggtaagtt taggataaga 2100
gttaaaagca ctcagcctaa aaatgttcat ttcaatgatg tttatgaagg tgcaaatact 2160
ggcagcaaca taatatcaca tcaagattaa tagctacaga aactggtatg tttatgaagc 2220
ctaataaaaa attttatggc attatattgg gaagaaaaaa tggttagaaa atttatgtac 2280
actgattatg ttagaaaaca aaataatcat tttgcatagg aaaaaaaccc tagtagtagt 2340
tttgggtcgg taagaaattt ttttttcttt ctttctcttg gtatgtactt tccatgagtt 2400
atacttgaaa agcatgaatt ttataataga agtaaacttt aaaaaattag gaacttatag 2460
tatgaattca atccaaaagg cgtacatttt cttggattgt ttttcctatt tcaatataac 2520
atgacgtatt ttaaatatct taattgtctt tatataaaaa atggtggggt tttttttttt 2580
gcttaatttt gagaatgtta tatctgtata acagagatgt gagcaactga gctcaaagtt 2640
aagcattttt agaatagaag agcaaggttt gaccctaatt gaatagtata gctataattt 2700
aagttctggt ctttaagttc ccttgataag ataaaggaat gttatataag tttacctgtt 2760
ttttatttaa agtaaaatta taaaaacttg ctcactatgt aaggccttta tagttctgta 2820
gtgcgactgt gtgatttaaa agggggtaag gttaattgtt agactagaga tccaggagtc 2880
tgaattgatt tatctagctg tcagaagtct gtttgacctt ctacaattta gtttttaaat 2940
ttttgaatac tgccttcagt gtgtagctat tactatcctt gggtgctcag cttttgctta 3000
tgtggtaagc ttttatccaa gtgttgatca tggagggagt acttaaatga aaatcaccca 3060
gaatatgcca taagtttttc ttctgttcaa aatactttag attttgagat caagtagaca 3120
agtattctct tgccatttag aaactatatt tttttcttaa tatttgtcag ggtgagtgtg 3180
gctttagacc caccatcttc agatctgcaa ctttaaaatg gaaagaaagc ctaatgagtc 3240
ggaaaaggcc atttgttgga agatgttgtt actcctgcac tccccagagc tgggtaagaa 3300
ccttactgct tattgaccct aatactcagc ataaaatatt atttccaact ttgtagtagg 3360
cagtcttatt ggactaaatt cactttcaga acagagaccc atgtttatga accaaatatt 3420
tcaagtaaag atgttgacac actttttctt tccatttatt tattcagtaa atattggtcc 3480
cataattgat actaggtaac attctagttc ttttgaggtt ttagtaggat tttaaggggg 3540
agagtagatc ttacttttgg ttaagtcttc aaaggagtta gtgggaacct tcatgaactt 3600
ttaggtgttg aactttagca cttaacatta aaattctagc aagataagaa agagataatg 3660
ggacagaata agaagttaaa gctgtgactt tgctctgagc ctttgctaat ggaaggtgtc 3720
tgttgacttt gtgatagtga aagattgtca ctaaaatgtt agaatgaaga tttaagagag 3780
tgtatatggg tttgttgttt gtattttggt gaaaaaacac aagccatgca atatcttttg 3840
cattacagtg cagtctttga gaagagccaa gtgggtgaga ggtatatttt cggtggtagt 3900
tgaagagaag gacaaattag cacaggaaca agaacttcac gtagttgtgt ttgaaggcag 3960
tagaattgcc ttttaaaagt catatctgga tgttaagctc tctctgggat ccagttatta 4020
ggatgaagaa attctgccgt ttaagtgcct gccatttata gaggttgctt gtaacttgtg 4080
tggctaggta attgtgctgt gtgaattttc tactcaaggt tggtttggca gaaagtagaa 4140
ttctgagtct ggtataaagg ggtttactaa catgggagag atttgtgtgg aacccaagca 4200
gtttatgtta aatgttcaga tctgctgaag aatgtcttgt tataaatatt gcttctttta 4260
aaccacaact accttgttgc aagaatttgg tagaattcaa gaatcacaga aatttctagc 4320
ctaggagtaa agctagttca gattaatagg tcacttgaaa tcaagattta aacagaatgt 4380
cattttcttt ttagatctga catctagtct aattctaatt ttgaatactt aaaacaataa 4440
ctacaatgtg ttcttaagtc agagggtata ggaaataatt tggtggtggt aatggtttgg 4500
agtaaagggt aaaggtagat agtacaacag acaattgatt tttgccctac tatagtacct 4560
gatggagttg aacttgatct tgaattactt ccatgacatg atcatttaaa ataatttgtt 4620
taaaaatgtt tttattggta actgtataat atttgctatc ttttctctga aatcgtattt 4680
tccttttctc taaagagatt ccacttaagt agttttatat ttgttgaggg aacattgtgc 4740
tttttcagca tttaagtgtg gaacagttac ctttttgccc atattgataa agctatagac 4800
tatcttttca gcaaagctat ctctggatta tctttcaaga tcacatgtaa agagggtgac 4860
cagtagacag acgatttctc attaaatgga cagttattta ggggtaatag aaagaccata 4920
ctctttagat caagacataa gattgaatcc taaacctctc ccggtcttag tttctcacct 4980
agaaaatggt gataactctt ttgtgtcagg gattttggga gatttagtaa gcaacaataa 5040
ctgcatggta cttagcgtgg tctttgtatt ttgggaaaac tgaaatctct gacattcttg 5100
tagcttcact tctttcaggg tggagatgag gagtcaagca gcaaggggta ctgtttcctt 5160
tggttttaag gtggtttgtt tgtttgtttg ttttttgttt ttgtttttgt ttttttgaga 5220
tggagtcttg ctttgtcgcc caggctggag tacaatggca tcgtgttggc tcactgcaac 5280
ctccgtctct taggttcaag caattctcct gcctcagcct cccaagtagc tgggattaca 5340
ggcaccgacc accacaccca gctaattttt atatttttgg tagagacgga gtttcaccat 5400
gttggccagg ctggtctcaa actaatgacc tcaggtgatc tgcccgcttc ggcctcccaa 5460
agtgctgaga ttacgggtgt gagccactgc gcctggctag ttttaagatt ttaaagatga 5520
attttgagtt tatgacattc tttgaaggct aaaaagtact tttcaataaa acttttttct 5580
tccctaagat ttttgaggca atatctgttt ttatgcttga tattaaagtt atcaagaact 5640
cataatgaga gctcttcacc gtcaatctag ttgtgtattt atgtctacat ttactttgtt 5700
ttatatagga caaatttttc aaccccagta tcccgtcttt gggtttgcgg aatgttattt 5760
atatcaatga aactcacaca aggtaaaaag aaatttctta tgtttttaat acatctcaaa 5820
agaaaaactt cataataatc agttaacaca ctttaagctg aattgctttg cattactgag 5880
agtgaataga atatgagttt ctgacacaag agagattatc tgaaaattgg aagcagtata 5940
gccacagaga gaactattac tgttaccact tgtgtactta cagataattt caggggagtg 6000
tagatgtcac ttagaatgtt ctttgactta tattgatttg catatgaagt atgccaaaat 6060
gtgggaaata tttgtctgag aagaccggta ggtttgaatc tcttatgatt tattatgact 6120
atttaatact taaaaaaagt ataaattatt gaaatctgcc caatctgtag ggtgttaaaa 6180
gacattttct ctgttgagca aatgttgttt gagttactat ttacccaaga ctttacttag 6240
agttcttaca atttctaggc atatggggat aggcttgtaa gcaccagtgt gagagaaaaa 6300
ggtctttgtt ttatctgact ctaggccagg ggacagggaa ggagggtcga aaggttgtgt 6360
gaatgtctgt gaggcaagag aatcagtagc caaatgctag cagtccttgt aattctaaaa 6420
atagatacct ggagtaggca ggcagatagg ctcagatgag aaatacttga aattctatga 6480
aaattagtgc aagaaatcaa ctacttgaag cccttatgat attacttctc ataatttgat 6540
gatgagatca catatgagaa tgataatact tggatatata gtaaactttt aaaaatagaa 6600
cttaagtcta agtacatgag cagatcattc ccaggctgct ggtctctctc tctctctctt 6660
ttaaatttgc atttaaattt aaatttaaaa aagaggggag agactttggt ccgttgaatt 6720
ttttttgata agatgataag atcctaagaa aagggatctc agagtcttcc ttatgtaagt 6780
agatatttta tatataaagc caagaggttt gtttcttgcc ctcaattaga gacagttaag 6840
gaaaatcgca tttgctatga tgacgaggca gaatgaaact attcagtgaa ataagctgca 6900
tgttcagcta tttacttctt ctgtgtattc tatgaagcaa agcctaaaac atttttacac 6960
attcacatag agtcacacac tctgtcactg tcacactcat gcacatgtgc gcacacacac 7020
acaatgcttt cagtcagttg caaagggatt tcatagagag cttggacttt gtacatacca 7080
ataatatttc tgaaaatgtt gactgaagga ggagtttagg attaacattt aatatattgg 7140
gccaaatttt tggaagattt agacaaagga agggaggaag aaaaagagaa tggcaggaag 7200
gagaggtgaa gaaataggtg attcataaac agttctcttt caagttactt tttctctatt 7260
gagggtattc tgggtctttt cagagttact gaattgataa taataatgtg atatcatgta 7320
atcattacaa atgttttcaa agtattacat aatgaaagct tgtagcattc ttattctgaa 7380
actcatctct ccatcctccc atctaaacac cacatagtca tttataactg acaggaatat 7440
gttctatccc tcaggtgtat ttaaaatgtg aagggggaaa aagtgagaaa ttctggcttc 7500
gttagcctag agtacaaata tttagatcat gcttgacttc tttcaactga tctgccttgt 7560
caattcaatt agagaatcag tgattatctt aggaaaaaac aaacaaaaac ttaacaaaaa 7620
aaattagtct ttgatcatag gaaaagactt ccaaatttat ctttttatag cccatagcta 7680
taaatataag ctgtatggtt tatcagaata gatatagctt atatatagca ttaaacattt 7740
ttgccttttt aatggtatta ataaagccag atgttcttat ttcttttgtt ttcatattag 7800
ggttattcgg cacagtaaca ctattcaaac attaatacac aaattccaag tttcagtttt 7860
agctgagagt acatgaataa aattggctgc acaacattct gaactactaa ggagaatttg 7920
ctgtaggaga accctaaatc tcagaaagag atgacattag gctttgtttt tatgggcgga 7980
aaattagttt atgatttaag caacttgttt taggggtacc tctaatactt ctctgctaaa 8040
tcattttcac agacaccgcg gatggcttgc aagacgcctt tcttacgttc tttttattca 8100
agagcgagat gtgcataagg gcatgtttgc caccaatgtg actgaaaatg tgctgaacag 8160
cagtaggtaa gggcggggca aggtgtaaag gtgggaagag gcagggatgg gcggtaggag 8220
tgggaggggg aagtaattct tagtaacctt tagtttctct gggactgtgt ctcaagaagt 8280
gttcacattt ccaaacatta aatgttaagc tccaaaggaa actaaagaaa ggcaggagaa 8340
caggtgcttt ggtgacagtg ccatgtggga atagcagcct tgttttatgg attaataatt 8400
gaatgggttt ctaaaacatg aaaggcaaat aagagttcag agatgcacat atttccagag 8460
ttctctgctt tctgtaatat aaatgttgga gacattgtat ttcctatttt atagccgaaa 8520
gagaattgag tttgatattt ttgccagtta ctgagtatct aggtacaaat tcttgtactg 8580
gaaagtcatt gctagaaatc ttaacagaat gaattactgc ctttgctctt acaggagctt 8640
gcttacaata ggaaagactg attggaactc aggtggaatg gggaaataaa tattctagaa 8700
tatgggagtt tgggtgaaga tgttccaaac tcccgtactc tagaatattg attctagagt 8760
actggcctca ttggtgtggc cagtttcaga gatctacctg gatttgggga gcaggagacc 8820
agggtgaatt aaaaggctgc tttaaattca taagtgtcat ctgtagactc ttcgttatgt 8880
ttgttaaggc ctgaacaatg ctggcacata atatgtactc aagaaatact tctcgaatgg 8940
atgagtgagt agttgataat ggaggtgcat cagtcatggt aatgacgtgt agaaacattc 9000
ctggtcagaa tgcaatgaat gctttttagg gaatagactt ggggggcatc agtgtcctgt 9060
ggtattggtc tttttgtatt agtgaattat ggggctatgt ggaattttgc tgtacttcac 9120
tagtccaaaa tcagcaccac tgggataaaa cacaattatg tgaaattctt agattattat 9180
atattctgtt ttcttgttaa aaccttcaag tacatttatt tcatccagat gttttgacta 9240
gtaactggga tgttagaagt ggtttaagga ggttgaacct catgctttct cccctaagtc 9300
agctggaaga tttataaaac tggattaaat gtttcctttt atctcactgc ttattattct 9360
gtgctgtgct cttttgatct tgagctgtgc cttttaaaaa ttactggttt gagttgaaaa 9420
aatttgtaaa tatttatgac catttttggt ccctcccaga gttttacata tagttttact 9480
aatggagtca caatacaaat taaaagtaaa ttaagtcttc aaaagaaaaa tcacacatta 9540
atttggtagt agacttttgg atacctctga attatatgcc taaagggata acctttcttt 9600
ttctctcttc tgctagagta caatttcgtg tccctcatac tttaatggga acattcaaat 9660
tcacccagta aatttgaatt aaattcttag tctgctttcc agattcctca gagattcatt 9720
gatttaggaa tatagtattc ttaatattta atagatagcc agaaagagca cttctagctt 9780
gagcttattc tttcatgtta ccgcatttta aagagaacat acattttgtt ttgtgattta 9840
cagctgcagt ttagaaaata ctgaatacag aatgtagtat agaaacaatt acattgtctc 9900
tttttccatt ttcataccag agtacaagag gcaattgcag aagtggctgc tgaattaaac 9960
cctgatggtt ctgcccagca gcaatcaaaa gccgttaaca aagtgaaaaa gaaagctaaa 10020
aggattcttc aagaaatggt tgccactgtc tcaccggcaa tgatcaggta ttaaaaggca 10080
aggcagaaag ctttcaatca cagccatgct gatttgagca aataagactg aattattgaa 10140
ctttcctagc acagttctct ttgtccaaaa gatgttttaa tgaatcctga tattaaatta 10200
aactcttctt atattcttat tcagctttcg tgcaaagtag cactgtggta ggcttgaagg 10260
tgccttcata tctgttaatt gatagcagcc aatgtattac tactaacatc tgctcaccta 10320
gactgcttgt gaatcaactt tcacgtatct gagtcataaa aggagtggtt tgtgtacatc 10380
agagggatca ttctgctcac taaatattca ttcgccttgg tcatttgctt ctgcagtata 10440
aaatgttatt agagtgaact atgactgtag tctataataa atggatactt ctgtaagtag 10500
tatatatata tataaaatta gctctagttc agcaattcag acatacgtgc atgcatgtgc 10560
acacacacta agtcatttac aagtactttg aggttgtagg tccataaatt taagtagaca 10620
gaagtcaact gtatgtgctt gtatgtaaaa ataacgtgtg ttcatttatg ttgttttttt 10680
tgtttgtact ttgtttcaga ctgactgggt gggtgctgct aaaactgttc aacagcttct 10740
tttggaacat tcaaattcac aaaggtcaac ttgagatggt taaagctgca actgaggcaa 10800
gaatttctgt gaatctatta ccccattttc ccctcaattg tagagtggtt ttagggttct 10860
tgtggaaatg ttttcttgtg tactgtgatg tatttcaacc catttggaag atttccctca 10920
tttatgataa cttcaatagc tgtgtatttg gggaggagaa atgagataca ggagtactta 10980
ctagcaatat gcaggattcc ttttgtaagt taccttgcaa caaccctgaa aatctggtag 11040
aacaatccct attttgtaga tgaagcaata gagacacaga tagataaata ggttgtctca 11100
agtggcagat aataagtgac ttgccctgga tttcaaatca aaccaagcct gactccaaaa 11160
cctgtgctct ttttatatca gtggagctgc ttctcagaaa gggtataggt caactggaac 11220
tcttgattgc tcttcttccc ccaacttatt tctgttgtta tagttgctct ttttcttttt 11280
agctcagaaa gtattacatt gaaggaagtt cctattattg gaaaatgttt ttaaagagtg 11340
agtcactgat tagccagtgt ttgagtgact ctagccaaat atgcagttgc aaagtgtgat 11400
tgaattttac atttgagttt taaatttggc atttttccct ttgctagacg aatttgccgc 11460
ttctgtttct accagttcat agatcccata ttgactatct gctgctcact ttcattctct 11520
tctgccataa catcaaagca ccatacattg cttcaggcaa taatctcaac atcccaatct 11580
tcaggtaaga tgagcttatt ttggaattta aggaattaaa aagattatgt tttgaatttt 11640
aattttttaa attatagctt tcgatatgtt attgtaaaga tgacattagc cttttttctt 11700
ttattataaa agtgatacat agttattgtg taaaatttgg agagtgcaaa aatgcattaa 11760
gactatcatc attatttata tattttatat gggatacttg gtgaactgtg actacctaaa 11820
ctttatgggc attgtttatc aaatagataa aaggcaatta gaaaggcaag atagcaaatt 11880
accataccag gctcagcagt agggagttgt ttggtggagg agggggcagt gaagtgggag 11940
aagggttagt gatataaaga caaccatacc tgttactttg acctcataat ttagtagagc 12000
tagaaccact taaaaagtac aatatcatgt gaaaggtatg ttttagaggt tttcaccttt 12060
tgaaaggttt tttagaggtt ttcctcaatg cgttccattc aggggaaata gtatgtgcaa 12120
atgcggagag atacaggagc atggtatggt tgggaagtga tggacaattg ggtaaggtgg 12180
gaatatggga tgcattagga aggatcagag actggaggtg gtagctgtgt aggtagtgaa 12240
agctggatca aaacaatttc taagccaaga gattagagtc tgtcctgtac ttgagaaatg 12300
acatgttcag gtttgtattt tgaaaggtca ttctggatta gaaagaatga aatcaattct 12360
gcttccatta ggatagttca ggcagaagat aatggaggtt taaattgtag tattgttttt 12420
ggacaggagg gcatagattt aaaaagtact tagtagctcg aatttaaaga cccagtgcta 12480
gtccctatgg gggctcaata gagggggaga ggaaggagca agattcccag gtgtttacca 12540
cctaggaaac tgggtaggtg gtaggtctga tcaccaacaa agaattggtg aggaactggt 12600
tgagctggtt tgggaaatta aaagtttcaa acctgaaagg acaaagcatc tctaaggtca 12660
gctctgtggg tagagagtgg ataaaaggag catgaattta gaaagagact ggaaggaaag 12720
tgggctggca ggttgtgcag gtggagcttc acaagatggc cttcgtcacc tttgtgtgct 12780
gtgtcctcag tatcacagtc taaggagctc cttcttaatc ccttggttca gagttctata 12840
ggctttcaga gttctgtagc taaccagact cttgtgaccc aactgaagag aagccatgga 12900
ttcatgcagt cagtgatatt tatccagctg tgctttagac aagagagaac aaaatatata 12960
gtccttgcct tcacatagct taatggataa tgtagacaga cagctagctg taatagcgtg 13020
tgatatgatt ctacagggta gatgtgcttt tccaggaatt agaatatctg tgtttgctct 13080
ccaggggacc tctctccagg aacaaggaac cgggaaactg aattagaaag tcatcaggaa 13140
gtttctggtg ggcacagact tagagggaag aggactattc cactggggct ctagagaagc 13200
cttgcttctc ttgtaattag aatatttcct atacccattt ccttcacatt tggttctcaa 13260
ttaggatttc ttggaactgc ttaataaaca ctgataattt tttgtaatcc aacttccctt 13320
tcatggactc tatgccagtg actgtgtagc tcacctgtcc ttcagacaca gcaggctgta 13380
gttagcccag cctgtttttg tgcagctttc ttttgttaca tgacagtcta cccattcaca 13440
aaccacttct caggtgttat ttttgtggat ggctcatctc attcatttta ttctgcagag 13500
ttttactctc aaagagtgat actaagcttt ggcaacacct tactgtggcc tccttctatt 13560
tactgtagag cagtggtccc caaccttttt ggcatcaggg accagtttca tggaagacaa 13620
tttccacaga ccatgggggt ggggaggatg gttttgggat gattcaagca tgttacattt 13680
attgtgcact ttatttctat tattattact ttgtaatata taaagaaata attatacaac 13740
tcatcataat gtagaatcac tagacggtcc caactggggg tgataggaga cagtgacaga 13800
tcatcaggca ttagattctc ataaggaatg cacaacctag atccctcatg ggcagatgtg 13860
cagttcacaa taggatttgc gctcctatcc tatgagaatc taatgctgtt gctgatctga 13920
caggaggcgg agctcagagg gtaatgcaag tgatggggaa tggctgtaaa tatagatgaa 13980
gctttgcttg cttgcctgcc actcatctcc tgctgtgtgg cccggttcct aacaggccgg 14040
ggaccggtat tggtccgtgg ccccggggtt tgggaccact gctgtagagg ataccaaaaa 14100
tatatattaa tgtttatgtt agtatcactc tacttgaaaa gaataggagg ctgtgagttt 14160
ggaaagattg acttagacag tttcaacttc atatcaaaat tagtgttgta gaaagagaca 14220
tagggttagg aaaagaatcg ttttatgcct gtgtatgtgc aaatgaagca catttttgtt 14280
tcatgttttg gaaagatggt tatgcttggt ttcagttgga taaaattgtt tttgtctcac 14340
aaggatcctc tgtaaacaat aattatttga gaaaatttcc cccaaggagc tttcgtaata 14400
aacatcatat tcattttgta gtaaacatgc catgcgcaaa tttcagaatg tctaagggtc 14460
agtgtcttga gaccctgggc aggattttaa aatttagaag tgttctataa tcctcttaaa 14520
atctatacta tcatttttac gggtaatatg tcatgcaaac tccttttggc ttggaacaga 14580
tataatagag gctcattata cacagtgata tcccaaagac tgatgaacaa tgtaaatgac 14640
tgaaacatgt cgataatatg gaaaatgaaa aaaatgcctg catttttact gtcagctgct 14700
caaacggcac atatggcttg tatccacttg gcaaatgttt tcaattaact tggaatgtga 14760
gtattctttt tacatttttc tttgtaaata attcatgtat tctgaattta tagtaccttg 14820
atccataagc ttgggggctt cttcatacga cgaaggctcg atgaaacacc agatggacgg 14880
aaagatgttc tctatagagc tttgctccat ggggtatgtg tgatctctaa ttatccttag 14940
ggacattgtg ttggttatca cagtggaagg aaaaatgact cttttgagtt gagattttta 15000
aaaactgctc tttgagtaac tggagtgatt attgcttgag tttggtaatt tgttgttgtt 15060
gttgttgttg ttattaccaa aatatagcat tggaggagct gttttattag tgtgaataag 15120
atactttgtc agtagtgaag ttatcgtttt ttctgttttg cttttaaaga tttaattttt 15180
ctgagctcat tctaagttga gtggtcttga atgtatgttt tactttcttc ttatatccca 15240
gcatatagtt gaattacttc gacagcagca attcttggag atcttcctgg aaggcacacg 15300
ttctaggagt ggaaaaacct cttgtgctcg ggcaggactt ttgtcagttg tggtagatac 15360
tctgtctacc aatgtcatcc cagacatctt gataatacct gttggaatct cctatgatcg 15420
cattatcgaa ggtcactaca atggtgaaca actggtaagg gtacctacac aaaagttttc 15480
tttgcttatc aagtctttta gatttaactt ttagaattta catttgcttt tagaattaag 15540
aatttttttt ggtactccct atgtttaaag cactgtatga aatgtgattg gatgggcatg 15600
gtgagtagct ttcatgccct atctttaact tgattggtag tgcttatgtg gtgttttctt 15660
gagcttggca gaagtgacct ggttagattt atcagtgccg accttggtca tgggattggg 15720
aagtgggaga agacttgcca ccgtgttgcc atctctgctg tggaaggtta tctgcggttt 15780
gttctcccca gggcttaatg aatatgtgca tattttaaat tgggcttgaa gaacttgtgg 15840
ggtcatgttg gcaaaaacac ctacagatta atttgagagg tagcaatgac tttttcagta 15900
taccttttta ttgaagtata atagttacaa aagagtatat aaatcatagg catgtagctt 15960
gaattatcac aaagtgaata catctatgca actagcaccc agatcaagga acaatattac 16020
caggaccttt gaaaccctcc ttgtgcttct cctatcatca tccccgcaag ggtaatgatt 16080
aatttcattt cttacagact gggttagttt tgcatatttt tgcacttacg taaattggat 16140
aacatgtggt ctgtacgcat ctggtttcct ttgcttaagc aggtgtttgt gagattcatc 16200
cacattgttg catgtagtct attccttctc atagctgtgt agtattccag tgtatggtat 16260
accataattt attctactgt taacaaaatg tttggctgta atcattcttg gatatttttt 16320
cttgatgacc atatatattc attttgttgg gtatgtgcct aggagaagaa ctgatgggtc 16380
ttaaaaaata tgtattttca gctttagtag gtactgccaa ccactttatc agaatggttt 16440
taccagctta ccactccagt cagcagttag agttcaagag gaatttagtt ttgttcttat 16500
ttattgtgga aattttggct gaggtactta tttcaagctt acggctccag acatgtcaga 16560
aattcaagga cgtctgacaa tcagaggctt tagaaattaa gtgataggct tacaaattaa 16620
gtgatatgat ctgtatgaca ctcttctcct tgtgttctat gaatctgtcc ttgatgtata 16680
ccctactcat cctgactgtg tctcacgagt tcatatctga gtctgtgtcc gttatatgtc 16740
ctgtcattgt gccttatgtg taatagatac taggtattta ctgaatgaat actcagctca 16800
aaggccactg taaggctgga tttgcaatta cttgcctaat attagacatt tagactctgg 16860
tgatcatcag acctcagata aatggcctct ttgatgtttt attcttgttt aagaaccaca 16920
gaagttttcc aggctatgtc attttttcct tcattagttt gcaattgtat ttttgtgaat 16980
tgtgtgaaca tgatactaaa tgaaatagta ttaaatgttt tgtttttcat tgactgaatt 17040
ccatctccca atgacatgat tacatctttg aatactaaac gttttctgac aggccgcagt 17100
taatgattac ctcctttcct tcttcattca ttgttcttct tcaagatgaa cttacagttt 17160
ccataaaaca agttattctg tggataatag aatgtttgtg tatgtgttgg ctttatttct 17220
caccatgtta ttctcactat tggaatttag ggcaaaccta agaagaatga gagcctgtgg 17280
agtgtagcaa gaggtgttat tagaatgtta cgaaaaaact atggttgtgt ccgagtggat 17340
tttgcacagc cattttcctt aaaggtgagt gtctgttgaa atgaaaccat gttgaagcat 17400
ctacctggag tcaggaggct ccagtgctga ctcttaacag cacctctctg tgtgacttgg 17460
ggctgcagtt tgctctcctg taaaatgagg actatgataa aggtggtgtt gcctaaattt 17520
ttccacaaaa tttgcctatt gacaaaggag agtgagtatc tgtttttggg agatatcagg 17580
ctcgacattt attgctatta ttattttttt ttaattcatg accatctaag gggaacaaaa 17640
aacaggtaga aggaataagt tttagtattt gatagtacag tagggaaatt atagttagca 17700
gtaatttatt gtatatttca aaataactaa aagagaagaa ttgtaatatt cccaaccccc 17760
cacaaaaagc taagtgtttg aggtgatggt tatcccaatt accctgattt tatcattaca 17820
cattgtatat agatatcaaa atatcacatg taccccaaaa tatgtacaag tattatatat 17880
caattaaccc caaaagtcaa aaaaattttg agatggatga atgaataaat gaataaataa 17940
ttgtaaaaaa ataaaaattc atgggaatct tgcatgtgcc tttataatac gtatttatat 18000
cttatgtttc aaaattgcct ttaggggaaa tttttccaaa cacctcccct aaaagctggg 18060
taactttttt tttgagacgg agtttcatgt tcttgtagcc caggctggag tgcagtggcg 18120
aaatctcagc tcactgcaac ctctgccccc taggttcaag caattctcct gcgtcagcct 18180
cctaagtagc tgggattaca ggtgcccgct accacacctg gctaattttt gtatttttag 18240
tagagacggg gtttcaccat gttggccagg ctggcctcaa acttctgacc tcaggtgatc 18300
tgcccgcctc ctcatctgcc tcccaaagtg ctgggattac aggtgtgagc cacttcgggc 18360
agccaaagct gggtgaattt gacaggataa tgctctctat gtcctattgt gtagaatcca 18420
gtacccacac atcccaaagg atagtgccat cctcattgaa agtctgggac tggcaggtcc 18480
ctgaggccct tgctggttta aattcttaag gtattcaaat tgtaaaggag aaggagaaaa 18540
atgggtacag aagtagggag cccagggata aggagcagaa ggtcccgcct ctccttttat 18600
tctacttcct ggcttaactt taagagattc cagctgctgt ggtagatgct tgctaacctt 18660
aaatgctttg atcttttaga accttatcat ttcttgccac tttctttctc tttatttttt 18720
aaatggtcac atagcttctc tgtcttgtta tgatttgctt ttagattgag gttcttttga 18780
aaataatgtg acccttgggt tgccagattt ttttaagtat gattatgtct atcatcacta 18840
ttaatgatat taagaatgtc agttttatga tgatgtgtga gaaaagttaa aaatttcttt 18900
taattttaaa atgattttgt ttaagcatcc tattctttgt gtcttcagtg ttcaagttca 18960
gtttcatgct tagcagcatt ctgtgaatca ttctggactt ctgaagacag tttaggatat 19020
agaaagtatt tcccatgctc tatagcatgg cttatttcat aaacaactcc cttttaacct 19080
ttggaagatg aaattacatt ttatatgttg gtgcgaaagt gagggtaaat gatcatgttg 19140
tgtttttttc tccaggaata tttagaaagc caaagtcaga aaccggtgtc tgctctactt 19200
tccctggagc aagcgttgtt accagctata cttccttcaa ggtaaaattt gtagaattgt 19260
ttaatgctaa tcaagctacc aaacatctgt tatttcttgt attgcataga ttaaccttat 19320
taaaaatgcg cacattctta ttttcacttc ttaagtaact tttctcttag tccaataagg 19380
gatattgaga tgacatgttt tcatattagt ttggaagttt ttaattattt gcttataact 19440
ttttgatttt gtgactcata taggagttct taattgattt atgctttttg aatgcttgaa 19500
ctgagttttt ttggtagtag gttatgcata ttgtatgtaa gtgaaccata tgaaagaatt 19560
ttgctgtttg aatttttcgg aattcaaatt gaattcaaat tgaattttaa cttagagaaa 19620
ttgaatatga agcctttcct ttaatatgtg gaagtgttga attttcagaa atgttttaaa 19680
ataaggcatc ttgaattatg tattctttct gccagtggtt ttggaagtgg tgtatcaaca 19740
gactatttag tcataactaa ataacatgtt ttggccaggc cataatgtag tatattatgg 19800
aggaaaataa gccatagaaa taatctgttt gtggtttaaa tttaaaatat atagtaattt 19860
aaagtatcta attcatttaa agatcagttc cacatggttt gccttgtaaa agagtgcggt 19920
tgtgtgttga tttttgaaac actttttaga cccagtgatg ctgctgatga aggtagagac 19980
acgtccatta atgagtccag aaatgcaaca gatgaatccc tacgaaggag gttgattgca 20040
aatctggctg agcatattct attcagtaag tagaatacca gactctttaa ttctacaatt 20100
tagattcatc atggtatggt gcaaactata cagattttgg aatctgctga ggttagtttc 20160
cacttctatt aattcacagg tggtgatagg taagttatta gaaagaaggt gataccgtga 20220
ggatttgaga taattggagt taaacatctt atacagtgtc tggtaattag taggtgttca 20280
tgtggtagtt gttgtacttt ttaaaaatag ttattattaa aatgatttgt tgcctctgtt 20340
gctcattaat gtgttttatt tgaactactt gaactaattt gtggtacaac gtctagattt 20400
atagttgcat gtccatttct cctttgaccc catgagtttt tgtaatgcag caaatatgag 20460
tggccttgta taaagctttg ccttagccgt ggagaataca aaatgaataa ttaatggttc 20520
tgaactcaat gagcttatgt tcttgtcagt gggatggtta tacacaaata attaaagtga 20580
acctagagag gagaggagtg tgagttcact gcaggaccag tcttctttaa gttccaagct 20640
gtacaattgt gtactgttgt ggaggctgct ttaaaatccc aaggcagcac agtggttctt 20700
tggtgctcag cctagttgtg atttctttct tgctgctctc tgggccagga ccctgatgat 20760
actctccgca ccccctgcca atgctactgg ggaggtcttc ctccctcacc ttgctcctcc 20820
cattctggag gcccctattc ctgcttgact ttgggtcaga ggattctttc tcaagcacat 20880
ttgattatgt ctctatcctg cttaaaatct ggatacaaaa aataatacct tattgttaaa 20940
aagtttgaaa ataaagatga aatagacagc aaaaacccat tacccaaata accagtggtg 21000
ttgctgtgta gtctctaaaa atatttttta cagttttgta ttgtgcagct ttccatttat 21060
aacacaatat tcatatttaa aaattcttta taaatatttt taatagctat acatatagta 21120
ctgagtactt ttttttaaca ctggagacga cttcagttac cagtggtgaa tgaagtattc 21180
ttaaatttat tgttatctta gaaaactcac aaatgttatc gtgatttaag attattccat 21240
gggtgttctc agatttgatt tatataatta taattttatg caaattcagt gtaggggtgt 21300
gcactgtagt cattctcaaa tgtgtgtctg tgcccttcct tcttacctct gggtcaggtt 21360
gaaagaggaa atacaaatat gctgagcacc cattactgtg gctcctgtgc cgggccagtc 21420
attttattct catgtggtct aatgagctag gtaggatttt cattttatca gcaaggaagg 21480
tgaggccagg aatttaagta atttgcccca agtcatgaag ttagttagtg agtaaattag 21540
gatttgagcc cagatttttc tgacttcaag tcagctgtta tccttctact acaccttcgt 21600
tttaatatgg tgaataccag caagaagagt gaagtagagt tgtagttata atagactgta 21660
ggtgggagca agtaaaggaa tatggaaatg ggagatcccg tagaactaaa acagccttgt 21720
actttgggtc ttgatatttc aataaaagtg tctcttcgtc attcagtaac taaattccac 21780
tggcctggat tgaagttgga cctgtcttac ttagcctgtt gtatgatgaa tagtgatctc 21840
taatgaggtt ccattatacc agaacactgt agtattataa cttccttttg gtaaatcaca 21900
cttatgggaa atgtgataga agactttcac agttttaaat actcctgttt aaaatttagg 21960
tatttcaaaa aagttcagct atgtttgtaa aaagtgcaac taaaaaaagc tttgtgtttg 22020
ccttccagct gctagcaagt cctgtgccat tatgtccaca cacattgtgg cttgcctgct 22080
cctctacaga cacaggcagg tatgtctgca atgtcacctg cagttaagta ggaagcagga 22140
gaatgttttg tcagctgctc agatacatac tcaggggcag atttggccca ctcatggcta 22200
gtactatgag gtaaacagta aaataagctg aggaccctgc ccaaaggagc ttatcaactt 22260
ggtggaggaa gaatctacat ttaaaaacaa aacaaaacag actgcttaat atatatagta 22320
ctaagctatt gcttgattaa tactgttaat gtaaataagg tctaactcat taacatgtgg 22380
tatatattct gaaagcaaat gctttccaaa tgaattgact ggcattttag aacccaccct 22440
ttatcctccc aaaatacatt tgtctgagct ttatgatgga agagaccaca ccagtcttgt 22500
tcagtcatat tctcaacacc aaacagtgcc aatatatata ggcaccaaat aaatatttgc 22560
cagataaata tttaaaatga aggaaatttt gctaaaaaat aagcactcct tacttgcaga 22620
tggctttttt cctccccctt gtgatcttat gtgtgcatat catgtgtcat ggctagagtg 22680
ttcactagca tgtgtaatac cttgacattc ctggaggacc agctttttaa gtagttttct 22740
gactcgctct gcattggtgt tctggcccta cttctctatg tgctagcagt gagctgcagg 22800
aaagccaagg caagaagaaa gtcttggaat gttggcctct cagctttttg gaaagtaggt 22860
tttccaccat catgataccg tttccatctt tctttaggga attgatctct ccacattggt 22920
cgaagacttc tttgtgatga aagaggaagt cctggctcgt gattttgacc tggggttctc 22980
aggaaattca gaagatgtag taatgcatgc catacagctg ctgggaaatt gtgtcacaat 23040
cacccacact agcaggaacg atgagttttt tatcaccccc agcacaactg tcccatcagt 23100
cttcgaactc aacttctaca gcaatggggt acttcatgtc tttatcatgg aggccatcat 23160
aggtatgtca gaccttgaaa tattttcagt aattttcatg gaaaataaaa aggcctaaaa 23220
cacatagtgg tatctgcttt aatttgggtg atagcccctt gcttgaggga atgtggctat 23280
aattttagtt ttcaaacgaa aatgtaatct cctgttatat cactgtttac aatgagtagt 23340
tactgaatta ccgtttgtat agcattaccc ttatttttca ggagaggtag agtgtcttgc 23400
tatccaggag ctgaaaatct aactgagatg agacatacac agagcagcaa agtgagtgga 23460
gggcctcatt tgtgattaag agaaaagaga ggaaggagag aagagggggc ttatgtcttt 23520
ggagaaggtt tttgatgcag ttgggatcat atggaatcat aagaatttag tcttatggga 23580
tttacttaaa tttctccaaa tacaggccat tatttttgat gtattaataa tctcttaagg 23640
ttattcaagc cagttgaagt ttttcttgga gactttgagc tggcaacttc attgttgctt 23700
ttcttttctt agcttgcagc ctttatgcag ttctgaacaa gaggggactg gggggtccca 23760
ctagcacccc acctaacctg atcagccagg agcagctggt gcggaaggcg gccagcctgt 23820
gctaccttct ctccaatgaa ggcaccatct cactggtgag tgaagaccct tcagtgttgc 23880
ctggtctctt ttcttgagcg ttttcatgaa aacgtaaccc cccgtgtttt tctgttagat 23940
aatgtttgac ccattgttga tactttatat tccactcctg gatttcagtg accaccaaac 24000
caatatgtca tttactatct tggtttgctc tctgggtcac tgctccactg aatctatcct 24060
gcagctatga gccatgatag gacagattgc tcaatgttct caggcagtca catccaaagc 24120
tagtgagcac gtattgtgtg tgaggcactg ggtcagtggt ttgtaaataa ttaacacacc 24180
cacctgtaga tgatggaacc acagatggta agagtcagaa gcagccttaa aaatcatctg 24240
ctcggccagg tgcggtggct cacgcctgta atctcagcac tttgggaggc tgaggcgggc 24300
agatcacgag gtcaggagat cgagaccatc ctggctaacg tggagaaacc ccgtctctac 24360
taaaaataca aaaaaaaatt agccaggtgt agtagcacct gcctgtagtc ccagctactt 24420
tggaggctga ggcaggagga tcacttgaac ctgggaggcg gaggatgcag tgagctgaga 24480
ttgcgccact gttctccagc ctgagtgaca gagcgagact ccatctcaaa aaaaaaaaaa 24540
aaaaaaaaag aaaatcatct gctcaacacc tctcaattta caaatgagga aaaccaagcc 24600
cagcagtact aatgagcatt tatattatat acccaaacac ttttaggcat ttatcatgag 24660
acatatgtat taagtagtag atttccttct tctcaaagtc atcaacatgt agaattcata 24720
ttttatttga attccgatat tttcttttgt atgaatgtgt cttgagatgt tgacgagatg 24780
agtgcatgtg ttaggagtac cgccccctcc atgccatgct ttgtgtgagg tgtgctcgtg 24840
gtcctgttgg ggaatctgtt ttgcatgaac cttgggtggt gggatggaag ggatgagggc 24900
agataagact tccaagattg accttgtcct ttctctggta tttatttact tattccaatg 24960
ttgcctttcc tcaatcacca cttttgtgta cagtatttat tataagataa ctattgcaga 25020
gaaattgtct tataaagtaa aagaaataga tggtgggggg ctgataagca gtcttcagag 25080
ggctttccac actgtgggtg tggggagaga attgagctca ggagtacccc ttgcaggtgg 25140
tgcagtgttg ggtgctctgc caactttaag tgacagaggt cttttcttgg gctttgtcca 25200
tgaccgtgtg tgtatcaaga cagtgggcac tgggaatcac aggacttgct cagtggggtg 25260
atggaggtaa cagaatggaa ggctttggca gctaccttgt accatgtttt ctgcgtttaa 25320
aaaaagaagt ataaaatggt ggcatttata tttaaatgaa ttttcttttc agccttgcca 25380
gacattttac caagtctgcc atgaaacagt aggaaagttt atccagtatg gcattcttac 25440
agtggcagag gtaagaggta gagctttcct ttatttgtct ttatacttac tcttcattcc 25500
cttacctttt ctacaactta tttaaaccaa taattggcca ggcatggtgg catgtgcctg 25560
taatcccagc actttgggag gtgaaggcgg gtggatcacc tgaggtcagg agtacgagag 25620
cagcctggcc aacatggcac aaccctgtct ttcctaaaaa tacaaaaatt agctgggcat 25680
ggtggcacac acctgtaatc ccagctactt gggaggctga ggcacaagaa tcggagtggt 25740
ggaggtttca gtgagccaag atcatgtcag tgcactccag cctgggtgac agagtgagac 25800
tcagtctcat aaataagtaa acaaaccaat aattacattt ggtatatagt catgttcaga 25860
tgtagagaag caaaaaataa gaatggggag aataagtgtc ctttgggatt atttaatatt 25920
ttggttccta tttgtaagtt gtgttgtcta aaacatatcc tgacttgatt ccgtgacatc 25980
cagaagtttg tatgctaagt tgagacgtta cacctatcag tatgcttgca gcttgcacat 26040
ctgcagtttt catttttgag attctatttt aattttggta gatttagtgt agaggagatg 26100
gcctggaaaa gtacatatca atttagaaca tgtgggggta cttttatttg atctttcttt 26160
ctggtagctc tcccctccca cctgcccttt cttttgtctc ctgctgtctc ctgactgagt 26220
ttgagtttgg aagggaagtg gactgacatt atgagtggct aaacagagaa gagccaggaa 26280
gggtcagaga agaggactgc cttgtcctgg ctccactggg cagttgtttg tgtgccagtg 26340
catatttatt tactatccat catctccttg gcctagcacg atgaccagga agatatcagt 26400
cctagtcttg ctgagcagca gtgggacaag aagcttccag aacctttgtc ttggagaagt 26460
gatgaagaag atgaagacag tgactttggg gaggaacagc gagattgcta cctgaaggta 26520
cttgggtgaa gaattctggt ggatattaca gggatatgtt gaggtttatg ctgcagtgag 26580
atcagctgga gtcctggtga tgtcttctta tctaaagaat cccccaacta gctctggtac 26640
cttctgtgtg gtaaagacac tcaaactgtt tgagttgaat taatagcatt ttaagtagaa 26700
aaggaaagga gagtctgaaa agtcaggaag atgaatgtca taggtgagac tttcaccatc 26760
cttttatgaa atacacaggt gcatacctgt ttacctacac ctgcacccct catgaggcag 26820
cagttttgct attgagctgc cactgacctg gctgctcttt ttgagtcact cttgctgtcc 26880
ctcccaaaat ttcatatatt aagctctttg ctgtcaatta aaacaaatac cattatagga 26940
gaaaattgag attaaaaaaa aagtccctga tttagaaaaa tcaattttgt ctaatttata 27000
attttagaac ttagtaataa tgacccgtct tttctgaata ctctaagagg attactcttt 27060
tttgacattt agaaattgtc ttctttttca cttgggtggt attagtttag tttcaagatg 27120
gggcagtgat cttgctttca cactccagag gggcttgacc gaaccagtgt gttttgggta 27180
ggtacagtga gagcctctcg gccataaagc accgccgtca cagtggccat cattccccac 27240
agtgctggac tgtgggcaaa ggccatttag gggaggcagg gaataggtgc tgcagaagga 27300
gtgagataat cttggtggtc tcccattggt ctttctgcag acttgagtga ctgttgagcc 27360
caggcttcaa accatggagg gcctggtctt aggagcggct atttttagtg atgacagcgt 27420
atcacaagta gggcattcat ttatgaaaat ttcttctagg tggctgttca atgaacacaa 27480
gcctcaaata ccataaaaaa gtgaatgatt acaataaaga atgtgtttga aagccagcag 27540
ttgtttccag cagagattct ctgcatgagg ggcagggggc cgctttcatg tagtgctgat 27600
gtgagtggcc atcttctcac gttactggct ctccagagaa agtcctctgt ccacttgcct 27660
tgtgtctctt gtcccttcct catgacttca tctcctgctt ttgcacactc aggtgagcca 27720
atccaaggag caccagcagt ttatcacctt cttacagaga ctccttgggc ctttgctgga 27780
ggcctacagc tctgctgcca tctttgttca caacttcagt ggtcctgttc cagaacctga 27840
gtatctgcaa aagttgcaca aatacctaat aaccagaaca gaaagaaatg ttgcagtata 27900
tggtatgtta agtcactatt tattctttta aaatcttttt tttttttttg gatttcagaa 27960
atttgctaat tgtagaaaat tggaaaaatg caaacttatc ctgacctcta acaccgtaga 28020
gtattactat tatcttcttt ggcatgttat ataagttgaa tgatacagtt atacactctt 28080
acatctggct tttttcacgt aacgttattt ttgagattca tacatgttgc atatagttgt 28140
tcctttgttc ttgttgtgta gtgttccatt gtataaatat ttaccacatt ttattcattc 28200
tgctgttgat ggatatttgg gttgttttca gttcacagct gctttgaaca gtgttgctat 28260
gagcatattt gaatatgtct tttggtgaat atctgtgccc ctatatacag catgtatgtg 28320
ggaacagaat tgcctggttg taggctctgg gtatattcgg ctttggtaga taccaccaaa 28380
cagtttccaa gggattatac ctacttgtac tcccacaaca gtgtgtgttt cacttgctgc 28440
acatcttggc cagcgctccg tcttctttgt tttaggaggt gtgattgggg tgggagtact 28500
attttataca gttgtagttt ggagctgaaa ctacttgaat cactttttag agccaaaagg 28560
aatctaatct aatcacctca ttttatagtt gaggaaaata ccccaggtca cactgctaat 28620
taatgggtaa tctcgggatc agaattcttg tttcctaacc tcgaggcctg tgctttctct 28680
ggttccactg atgtacaatc atctgtgtac cactgggtag cttaaagaat atttatacac 28740
tatctcattt gattctcaca acagtcctgg aaaatggatg ttttaggtat ttctacttcc 28800
ctctgttctc cctatttctc tctctacacc ctcttttctt tccccttccc tttcttattt 28860
acctcaatat aggacaaagt aggtgtaagc aaagtaggtt taacagcaag tcatctgaga 28920
actcacaggt tgccagtggt ggaagtgggg ccccaccctt gtctgctgac ttgccctcat 28980
tctcttccta gctccccata ctttcttact gtggctgctg ggattgtcat gatttgttga 29040
gcgtaaccat ttgacagggt tttattctct ctcttcagct gagagtgcca catattgtct 29100
tgtgaagaat gctgtgaaaa tgtttaagga tattggggta ggtgtccacc atttatggta 29160
taaaagctat ctcaacttct gttctcttta gatctagtct gtttgagcta cctttgtggt 29220
ggggtggacc ccgagagaag cagtttctgc tggcttaatg ataaaggcat ttttgggaac 29280
ggggcatgta ggatgggttg ggctatgttg aaggtgaagc ccatcagtgt agatttattt 29340
gaatgttctg gaattttact ggtttcacat ttattcccaa gctgctatat ataactggta 29400
tcaatatgtt tcaaggtgct acaggttgaa tatcccttat ccaaaatgtt gggaccagaa 29460
atgttttgga tttcagattt ttttgggatt ttggaatatg tgcattagac ttacaggttg 29520
agcgtctcta atccaaaacc caaaatgctc tgatgagcat gtcttttgag catcatattg 29580
atgttcaaaa tctttcagat tttggagtac ttcagatttt tgattttggg attaggacca 29640
caatcttggc tcttaattat tccatatgat ttttagttac tttcttgtat ttttacaaga 29700
atttctagaa gtatcctcag gtgtccttta ccttcatgat tcatggggaa tgtaagttct 29760
atagagatac tagcggcctt ttgtgaggga ctgtttgtga ctttattcta agtcatttta 29820
gagtatagtt atgttggttg aaattttaga atatagttaa tgttggttga actccatcaa 29880
aacaaaaaaa aaaaaataga aaaagaaaac cttgtttgca ttggaaactc ccacctcatg 29940
ctcacacaca cccaggcata catttactta atgccaggat atggtttttt gtgcctttac 30000
tgccttctga ggtctaggac accacaggtc aggttggtaa tggaaatttt ttttattttt 30060
tattttttgc ctttaattta atctaaacct tttctttagg ttttcaagga gaccaaacaa 30120
aagagagtgt ctgttttaga actgagcagc acttttctac ctcaatgcaa ccgacaaaaa 30180
cttctagaat atattctgag ttttgtggtg ctgtaggtaa cgtgtggcac tgctggcaaa 30240
tgaaggtcat gagatgagtt ccttgtaggt accagcttct ggctcaagag ttgaaggtgc 30300
catcgcaggg tcaggcctgc cctgtcccga agtgatctcc tggaagacaa gtgccttctc 30360
cctccatgga tctgtgatct tcccagctct gcatcaacac agcagcctgc agataacact 30420
tggggggacc tcagcctcta ttcgcaactc ataatccgta gactacaaga tgaaatctca 30480
ataaattatt tttgagttta ttaaagattg acattttaag tacaactttt aaggactaat 30540
tactgtgatg gacacagaaa tgtagctgtg ttctggaact gaatcttaca tggtatactt 30600
agtgctgctg ggtaatttgt tggtatatta tctggttagt ggttaatgct tcctttaaaa 30660
ataattgagt catccattca ctctttttca gttttatctg tcaatagtag ctacattttt 30720
aatgggagca ccttttatcc caaagtgctt tataaattga gtggactgat atatatcaca 30780
cccaggtatc actgtgctgt cctttgctgt cagatttaga aatgttttta agagctatgt 30840
gaaaacagac aatattagtt taggtcggga actgagatat tgtaatcaaa tagttaacat 30900
caggaagtta atttggctgg caaaattcta gggaaacttg gccagaaaac tggtgttgaa 30960
ggcttttgct catataaaca agtgccattg agtttcaaat gaccagcaaa tatatttaga 31020
acccttcctg ttttatgtct gtacctcgtc cacccctcag gtaatacctg cctctcacag 31080
gtacagctgt ttcttggaaa tcctccaacc aaatagcagt tttcctaact tgattagctt 31140
gagctgacag actgttagaa tacagttctc tggccacagc tgatgagggc tttctgtact 31200
gcacacagat tgtgtactgc accccagtcc aggtgactgg tacccactcg agttgtgccg 31260
tgcacaacct gtccagtata tgcatgtggt ggccctactg actggtaatg gttagaggca 31320
tttatggatt tttagctttg aggaaaaacc atgactttta acaaattttt atgggttata 31380
tgcctaaacc cttatgccac atagtggtaa ataattatga aaaatggtct gttcataatt 31440
ggtaggtgcc ttttgtgagc agggagcata attattggtt tattatggta attatggtga 31500
ttttttaaat atcatgtaat gttaaaacgt tttctaacag tttactgttg cttatctcca 31560
agatattatg gaattaagaa tttttccaga tgagtgttac atagattctt tgaatttagt 31620
ataaaagtac tgagaattaa gtttgtactt ccataagctt ggattttaaa cactgatagt 31680
atctcatgag taatgtgtgt tttgggagag ggagggatgc tgattgatat ttcacattgt 31740
atgaaatacc atgtttgaaa ctcatagcaa taatgctatg ctgttgtgat ccctctcaag 31800
ttctgcattt aaaatatatt ttttctttat aggaattgat gtataccatg aagtcattgt 31860
cagttgtagt agctctgatg ttgaatgaga tatcatgttt tagcattcca ttttactgac 31920
tagggtagaa gaacactttt cttggctaca tttggaggat acccagggag tcttgggtgt 31980
tccttatctg gggaagcaaa catttcacta gtctcttttt ttcatccttt aaattgtaaa 32040
ttaaggatta ctcaagctca ccattattca agattgggac tcgcttccca gtcgacactc 32100
tgccctgcct gtcattgctg caaagagctg ctgctttgcc aacctaagca aagaaaatac 32160
ggcttctctt gcattatttt cccttttggt tggtttgttt tctagaagta cgttcagatg 32220
ctttggggaa tgcaatgtat gatttgctag ctctctcacc acttaactca ctgtgaggat 32280
aaatatgcat gctttttgta attaactggt gctttgaaaa tcttttttaa gggagaaaaa 32340
tctcaaccaa agttatgctc atccagacaa gctgaccttt gagttaattt cagcacaact 32400
cattcttcag tgcctcatga ctgaaaacaa aaaacaaaaa aacgaaagca tcttcacaat 32460
gaagcttcca gatagcaccg ttttgctaaa agatacattc tcattgtttt ccaacagtga 32520
tggcttccac ataaggttaa acaaactagg tgcttgtaaa taatttatta cagtttactc 32580
tatcgcattt ctgtaacatg aaatgcatgc ccttcttcag gggaagactg tggtcaagtt 32640
aaaaaaaaaa aacaatatta aacaacatga aactgcagtc tgtttttgaa aatgagaatg 32700
tcctaagtga ttcagaagag aggagggaag ttgtgcactc tgaaaatgca tgaaaaacaa 32760
aggcaaaaac tagtgggaaa tgtgtagaac tgttaactga gatggcttcg agtcttcctt 32820
ctggaatctg ttaaatttca caaagtcatg agggtaaatg gagaaaatat ttctgggatt 32880
acaatgaatg taagcccaaa ttgtggaatt gccagtaacc tggatgggga aaagcatttc 32940
ccatagcact ccatgtaata tgagtgctct gtgagatgtt catcagtgtt ttatagaaat 33000
ggtgttgctg ggaaaccaag tttgcacctg gaaacttaca atgcacttta gcgcagtaag 33060
ggcttggcat ccggtagtga aaaactgtct aacccagcat tgcccaaact attttgacac 33120
caggaccttt ttctcctttg ggatacttat gaacctctca ctaatgtcct gtggagaaca 33180
ttttgggaaa cactatgtta gatagttctt taaggagaca aaacggtaat gaacagatag 33240
cactggggca gaatatgcat gcattttgta acgtccagtg tggcgttgaa tagatgtgta 33300
tttcctcccc tgcagaaaat aagcacagaa aattataatg taggtgatcg gagctctttc 33360
ctttgataga gagaacagcc ccaatgatcc tggctttttc actgaacgta tcagaataca 33420
tggatgaatt ggggtaaata aggttttaat tcagatctag aagaaagtat tgtacgtttg 33480
aatgcagatt tttatccaca gatagttgta gtgtttagac atgacaggac ctatcgttga 33540
ggtttctaag acttactatg ggctgtaaac ctgtttttta aaactatttt agaaacctga 33600
gacttgccgt ctggcatttt agtttaatac aaactaatga ttgcatttga aagagattct 33660
tgaccttatt tctaaacgtc tagagctctg aaatgtcttg atggaaggta ttaaactatt 33720
tgcctgttgt acaaagaaat gttaagactc gtgaaaagaa ttactataag gtactgtgaa 33780
ataactgcga ttttgtgagc aaaacatact tggaaatgct gattgatttt tatgcttgtt 33840
agtgtattgc aagaaacaca gaaaatgtag ttttgtttta ataaaccaaa aattgaacat 33900
a 33901
<210> 2
<211> 33901
<212> DNA
<213> 智人(homo sapien)
<400> 2
gcgccactgc agctggcatt ggccgggact ggaagtgcgg gcttctgcag cagccgaagc 60
tggagctgct agggtgcgaa ctgccagggc aggtgtgggc tgcgggaggc tactcgggcc 120
gggagcgccg ggacaagtgc atggaggtgg tgcgactcct gcaagttgct ggggcagtcg 180
tgtcccctat tccctgacac ccgagctccg gtcttctccc tgagaaatcg gtcgggctcg 240
tgcaggggtg gggatcagga ttcatctctc ctggggagac tgcgctgggg catgggttcc 300
cctgggttgg aaggagtcct tatggactca gtcccctaag tatctgcacg cgcggaggcg 360
ccgccagcca gcccgcctgg gtccctaggg aacattgagg cagtaagggg tactctgaga 420
gcagccggta tgctggagat aattaatgac agcgttacca ttgattggac tgagcgctca 480
ctgtgtgtta cacactgtgg tagacccttt gtttatatta ttccgtcctc tcaacaatcc 540
aggaggttaa gagctatcat tctgcccatt ttccagatgg gaaaactaag gcatagaagt 600
taaccaactt atggtaataa aaaatcacac agatggtaag cagtggaaga tttaaacctc 660
acagctggtc ttccagcctc tgtccttttc agatcctcta gtcagcttct ctcagcgcat 720
gctgctggct ggtgcctctg ggatattgct tctttattac tccttgacct agagcgaact 780
gtgcggaggg aggaagtgca aaacgtggac ctcctgttgg cacaaacgag cctctttgtc 840
ctctcctcat cctctcttca cttcattttc tcaggcagca gcggctcccc tgttgtatgg 900
acattctgca cccgaaactg atagctgagt cctgaagttt tatgttatga aacagaagaa 960
ctttcatccc aggtgcattg gtttattctc tcccctagcc tgttatgtta gattgtactt 1020
atgttaaatt tttaaggaca taggtggtta tgccgagaat aacagtgact gtagccaacc 1080
catgtgggga ttgtaaagaa attggaatat gccttccaaa ggaacactgt taatctagac 1140
atgacctttc aggattttaa aggaataatt ttaggccagg tgagaaacag ccaaaagcaa 1200
aaataatgtg aggctagaga ttatgtttga aagtttttat attttggatt aatatctatt 1260
ctaggagttt actcttagtg aatctttttc cttagggtag aaaaaagctt atcgaaaagg 1320
atgaaaactt atacatcaga tatttcaaaa tagtgtgctt ttctttcaga gctttgtagc 1380
tttgtattac ctttgtatta aaagtgaaaa tgttctttta ggacatcaca agaaaattaa 1440
gatcttaatt taagtacggg aacttaaggg gtgccctaat tgccttaatt aaataaacat 1500
gccttccttc tgccaggaac tattcaatta acaaaaatga aataagaata agctcttatt 1560
ttcatttgca aatgactatt catagctatt ttgtttggat acaattcata gctattttgt 1620
ttggatacta ttttgtttgc atactatgtt ttgtttggat actattcata gctattttgt 1680
gtggatacaa aggatacaat gttgtatcct tatatattca ggaagtctta gaatacaaat 1740
gctgattttt tttttttcta gtcagggaag cctaactgtg ttcatataaa cacatcaaag 1800
tcagttttta ccttgtgact caacatggta gaagtctgtc agttcatgtg atatcccatt 1860
gtggagcaaa gtaatgtaga aatcagaatt ttgagttcta gtatttactc tctcgattcc 1920
ttgttaattt aaatggtacc tattttttat agcacatgat ttgggaatta cactttgtga 1980
catggatgaa tctgcactga cccttggtac aatagatgtt tcttatctgc cacattcatc 2040
agaatacagt gttggtcgat gtaagcacac aagtgaggaa tgggtaagtt taggataaga 2100
gttaaaagca ctcagcctaa aaatgttcat ttcaatgatg tttatgaagg tgcaaatact 2160
ggcagcaaca taatatcaca tcaagattaa tagctacaga aactggtatg tttatgaagc 2220
ctaataaaaa attttatggc attatattgg gaagaaaaaa tggttagaaa atttatgtac 2280
actgattatg ttagaaaaca aaataatcat tttgcatagg aaaaaaaccc tagtagtagt 2340
tttgggtcgg taagaaattt ttttttcttt ctttctcttg gtatgtactt tccatgagtt 2400
atacttgaaa agcatgaatt ttataataga agtaaacttt aaaaaattag gaacttatag 2460
tatgaattca atccaaaagg cgtacatttt cttggattgt ttttcctatt tcaatataac 2520
atgacgtatt ttaaatatct taattgtctt tatataaaaa atggtggggt tttttttttt 2580
gcttaatttt gagaatgtta tatctgtata acagagatgt gagcaactga gctcaaagtt 2640
aagcattttt agaatagaag agcaaggttt gaccctaatt gaatagtata gctataattt 2700
aagttctggt ctttaagttc ccttgataag ataaaggaat gttatataag tttacctgtt 2760
ttttatttaa agtaaaatta taaaaacttg ctcactatgt aaggccttta tagttctgta 2820
gtgcgactgt gtgatttaaa agggggtaag gttaattgtt agactagaga tccaggagtc 2880
tgaattgatt tatctagctg tcagaagtct gtttgacctt ctacaattta gtttttaaat 2940
ttttgaatac tgccttcagt gtgtagctat tactatcctt gggtgctcag cttttgctta 3000
tgtggtaagc ttttatccaa gtgttgatca tggagggagt acttaaatga aaatcaccca 3060
gaatatgcca taagtttttc ttctgttcaa aatactttag attttgagat caagtagaca 3120
agtattctct tgccatttag aaactatatt tttttcttaa tatttgtcag ggtgagtgtg 3180
gctttagacc caccgtcttc agatctgcaa ctttaaaatg gaaagaaagc ctaatgagtc 3240
ggaaaaggcc atttgttgga agatgttgtt actcctgcac tccccagagc tgggtaagaa 3300
ccttactgct tattgaccct aatactcagc ataaaatatt atttccaact ttgtagtagg 3360
cagtcttatt ggactaaatt cactttcaga acagagaccc atgtttatga accaaatatt 3420
tcaagtaaag atgttgacac actttttctt tccatttatt tattcagtaa atattggtcc 3480
cataattgat actaggtaac attctagttc ttttgaggtt ttagtaggat tttaaggggg 3540
agagtagatc ttacttttgg ttaagtcttc aaaggagtta gtgggaacct tcatgaactt 3600
ttaggtgttg aactttagca cttaacatta aaattctagc aagataagaa agagataatg 3660
ggacagaata agaagttaaa gctgtgactt tgctctgagc ctttgctaat ggaaggtgtc 3720
tgttgacttt gtgatagtga aagattgtca ctaaaatgtt agaatgaaga tttaagagag 3780
tgtatatggg tttgttgttt gtattttggt gaaaaaacac aagccatgca atatcttttg 3840
cattacagtg cagtctttga gaagagccaa gtgggtgaga ggtatatttt cggtggtagt 3900
tgaagagaag gacaaattag cacaggaaca agaacttcac gtagttgtgt ttgaaggcag 3960
tagaattgcc ttttaaaagt catatctgga tgttaagctc tctctgggat ccagttatta 4020
ggatgaagaa attctgccgt ttaagtgcct gccatttata gaggttgctt gtaacttgtg 4080
tggctaggta attgtgctgt gtgaattttc tactcaaggt tggtttggca gaaagtagaa 4140
ttctgagtct ggtataaagg ggtttactaa catgggagag atttgtgtgg aacccaagca 4200
gtttatgtta aatgttcaga tctgctgaag aatgtcttgt tataaatatt gcttctttta 4260
aaccacaact accttgttgc aagaatttgg tagaattcaa gaatcacaga aatttctagc 4320
ctaggagtaa agctagttca gattaatagg tcacttgaaa tcaagattta aacagaatgt 4380
cattttcttt ttagatctga catctagtct aattctaatt ttgaatactt aaaacaataa 4440
ctacaatgtg ttcttaagtc agagggtata ggaaataatt tggtggtggt aatggtttgg 4500
agtaaagggt aaaggtagat agtacaacag acaattgatt tttgccctac tatagtacct 4560
gatggagttg aacttgatct tgaattactt ccatgacatg atcatttaaa ataatttgtt 4620
taaaaatgtt tttattggta actgtataat atttgctatc ttttctctga aatcgtattt 4680
tccttttctc taaagagatt ccacttaagt agttttatat ttgttgaggg aacattgtgc 4740
tttttcagca tttaagtgtg gaacagttac ctttttgccc atattgataa agctatagac 4800
tatcttttca gcaaagctat ctctggatta tctttcaaga tcacatgtaa agagggtgac 4860
cagtagacag acgatttctc attaaatgga cagttattta ggggtaatag aaagaccata 4920
ctctttagat caagacataa gattgaatcc taaacctctc ccggtcttag tttctcacct 4980
agaaaatggt gataactctt ttgtgtcagg gattttggga gatttagtaa gcaacaataa 5040
ctgcatggta cttagcgtgg tctttgtatt ttgggaaaac tgaaatctct gacattcttg 5100
tagcttcact tctttcaggg tggagatgag gagtcaagca gcaaggggta ctgtttcctt 5160
tggttttaag gtggtttgtt tgtttgtttg ttttttgttt ttgtttttgt ttttttgaga 5220
tggagtcttg ctttgtcgcc caggctggag tacaatggca tcgtgttggc tcactgcaac 5280
ctccgtctct taggttcaag caattctcct gcctcagcct cccaagtagc tgggattaca 5340
ggcaccgacc accacaccca gctaattttt atatttttgg tagagacgga gtttcaccat 5400
gttggccagg ctggtctcaa actaatgacc tcaggtgatc tgcccgcttc ggcctcccaa 5460
agtgctgaga ttacgggtgt gagccactgc gcctggctag ttttaagatt ttaaagatga 5520
attttgagtt tatgacattc tttgaaggct aaaaagtact tttcaataaa acttttttct 5580
tccctaagat ttttgaggca atatctgttt ttatgcttga tattaaagtt atcaagaact 5640
cataatgaga gctcttcacc gtcaatctag ttgtgtattt atgtctacat ttactttgtt 5700
ttatatagga caaatttttc aaccccagta tcccgtcttt gggtttgcgg aatgttattt 5760
atatcaatga aactcacaca aggtaaaaag aaatttctta tgtttttaat acatctcaaa 5820
agaaaaactt cataataatc agttaacaca ctttaagctg aattgctttg cattactgag 5880
agtgaataga atatgagttt ctgacacaag agagattatc tgaaaattgg aagcagtata 5940
gccacagaga gaactattac tgttaccact tgtgtactta cagataattt caggggagtg 6000
tagatgtcac ttagaatgtt ctttgactta tattgatttg catatgaagt atgccaaaat 6060
gtgggaaata tttgtctgag aagaccggta ggtttgaatc tcttatgatt tattatgact 6120
atttaatact taaaaaaagt ataaattatt gaaatctgcc caatctgtag ggtgttaaaa 6180
gacattttct ctgttgagca aatgttgttt gagttactat ttacccaaga ctttacttag 6240
agttcttaca atttctaggc atatggggat aggcttgtaa gcaccagtgt gagagaaaaa 6300
ggtctttgtt ttatctgact ctaggccagg ggacagggaa ggagggtcga aaggttgtgt 6360
gaatgtctgt gaggcaagag aatcagtagc caaatgctag cagtccttgt aattctaaaa 6420
atagatacct ggagtaggca ggcagatagg ctcagatgag aaatacttga aattctatga 6480
aaattagtgc aagaaatcaa ctacttgaag cccttatgat attacttctc ataatttgat 6540
gatgagatca catatgagaa tgataatact tggatatata gtaaactttt aaaaatagaa 6600
cttaagtcta agtacatgag cagatcattc ccaggctgct ggtctctctc tctctctctt 6660
ttaaatttgc atttaaattt aaatttaaaa aagaggggag agactttggt ccgttgaatt 6720
ttttttgata agatgataag atcctaagaa aagggatctc agagtcttcc ttatgtaagt 6780
agatatttta tatataaagc caagaggttt gtttcttgcc ctcaattaga gacagttaag 6840
gaaaatcgca tttgctatga tgacgaggca gaatgaaact attcagtgaa ataagctgca 6900
tgttcagcta tttacttctt ctgtgtattc tatgaagcaa agcctaaaac atttttacac 6960
attcacatag agtcacacac tctgtcactg tcacactcat gcacatgtgc gcacacacac 7020
acaatgcttt cagtcagttg caaagggatt tcatagagag cttggacttt gtacatacca 7080
ataatatttc tgaaaatgtt gactgaagga ggagtttagg attaacattt aatatattgg 7140
gccaaatttt tggaagattt agacaaagga agggaggaag aaaaagagaa tggcaggaag 7200
gagaggtgaa gaaataggtg attcataaac agttctcttt caagttactt tttctctatt 7260
gagggtattc tgggtctttt cagagttact gaattgataa taataatgtg atatcatgta 7320
atcattacaa atgttttcaa agtattacat aatgaaagct tgtagcattc ttattctgaa 7380
actcatctct ccatcctccc atctaaacac cacatagtca tttataactg acaggaatat 7440
gttctatccc tcaggtgtat ttaaaatgtg aagggggaaa aagtgagaaa ttctggcttc 7500
gttagcctag agtacaaata tttagatcat gcttgacttc tttcaactga tctgccttgt 7560
caattcaatt agagaatcag tgattatctt aggaaaaaac aaacaaaaac ttaacaaaaa 7620
aaattagtct ttgatcatag gaaaagactt ccaaatttat ctttttatag cccatagcta 7680
taaatataag ctgtatggtt tatcagaata gatatagctt atatatagca ttaaacattt 7740
ttgccttttt aatggtatta ataaagccag atgttcttat ttcttttgtt ttcatattag 7800
ggttattcgg cacagtaaca ctattcaaac attaatacac aaattccaag tttcagtttt 7860
agctgagagt acatgaataa aattggctgc acaacattct gaactactaa ggagaatttg 7920
ctgtaggaga accctaaatc tcagaaagag atgacattag gctttgtttt tatgggcgga 7980
aaattagttt atgatttaag caacttgttt taggggtacc tctaatactt ctctgctaaa 8040
tcattttcac agacaccgcg gatggcttgc aagacgcctt tcttacgttc tttttattca 8100
agagcgagat gtgcataagg gcatgtttgc caccaatgtg actgaaaatg tgctgaacag 8160
cagtaggtaa gggcggggca aggtgtaaag gtgggaagag gcagggatgg gcggtaggag 8220
tgggaggggg aagtaattct tagtaacctt tagtttctct gggactgtgt ctcaagaagt 8280
gttcacattt ccaaacatta aatgttaagc tccaaaggaa actaaagaaa ggcaggagaa 8340
caggtgcttt ggtgacagtg ccatgtggga atagcagcct tgttttatgg attaataatt 8400
gaatgggttt ctaaaacatg aaaggcaaat aagagttcag agatgcacat atttccagag 8460
ttctctgctt tctgtaatat aaatgttgga gacattgtat ttcctatttt atagccgaaa 8520
gagaattgag tttgatattt ttgccagtta ctgagtatct aggtacaaat tcttgtactg 8580
gaaagtcatt gctagaaatc ttaacagaat gaattactgc ctttgctctt acaggagctt 8640
gcttacaata ggaaagactg attggaactc aggtggaatg gggaaataaa tattctagaa 8700
tatgggagtt tgggtgaaga tgttccaaac tcccgtactc tagaatattg attctagagt 8760
actggcctca ttggtgtggc cagtttcaga gatctacctg gatttgggga gcaggagacc 8820
agggtgaatt aaaaggctgc tttaaattca taagtgtcat ctgtagactc ttcgttatgt 8880
ttgttaaggc ctgaacaatg ctggcacata atatgtactc aagaaatact tctcgaatgg 8940
atgagtgagt agttgataat ggaggtgcat cagtcatggt aatgacgtgt agaaacattc 9000
ctggtcagaa tgcaatgaat gctttttagg gaatagactt ggggggcatc agtgtcctgt 9060
ggtattggtc tttttgtatt agtgaattat ggggctatgt ggaattttgc tgtacttcac 9120
tagtccaaaa tcagcaccac tgggataaaa cacaattatg tgaaattctt agattattat 9180
atattctgtt ttcttgttaa aaccttcaag tacatttatt tcatccagat gttttgacta 9240
gtaactggga tgttagaagt ggtttaagga ggttgaacct catgctttct cccctaagtc 9300
agctggaaga tttataaaac tggattaaat gtttcctttt atctcactgc ttattattct 9360
gtgctgtgct cttttgatct tgagctgtgc cttttaaaaa ttactggttt gagttgaaaa 9420
aatttgtaaa tatttatgac catttttggt ccctcccaga gttttacata tagttttact 9480
aatggagtca caatacaaat taaaagtaaa ttaagtcttc aaaagaaaaa tcacacatta 9540
atttggtagt agacttttgg atacctctga attatatgcc taaagggata acctttcttt 9600
ttctctcttc tgctagagta caatttcgtg tccctcatac tttaatggga acattcaaat 9660
tcacccagta aatttgaatt aaattcttag tctgctttcc agattcctca gagattcatt 9720
gatttaggaa tatagtattc ttaatattta atagatagcc agaaagagca cttctagctt 9780
gagcttattc tttcatgtta ccgcatttta aagagaacat acattttgtt ttgtgattta 9840
cagctgcagt ttagaaaata ctgaatacag aatgtagtat agaaacaatt acattgtctc 9900
tttttccatt ttcataccag agtacaagag gcaattgcag aagtggctgc tgaattaaac 9960
cctgatggtt ctgcccagca gcaatcaaaa gccgttaaca aagtgaaaaa gaaagctaaa 10020
aggattcttc aagaaatggt tgccactgtc tcaccggcaa tgatcaggta ttaaaaggca 10080
aggcagaaag ctttcaatca cagccatgct gatttgagca aataagactg aattattgaa 10140
ctttcctagc acagttctct ttgtccaaaa gatgttttaa tgaatcctga tattaaatta 10200
aactcttctt atattcttat tcagctttcg tgcaaagtag cactgtggta ggcttgaagg 10260
tgccttcata tctgttaatt gatagcagcc aatgtattac tactaacatc tgctcaccta 10320
gactgcttgt gaatcaactt tcacgtatct gagtcataaa aggagtggtt tgtgtacatc 10380
agagggatca ttctgctcac taaatattca ttcgccttgg tcatttgctt ctgcagtata 10440
aaatgttatt agagtgaact atgactgtag tctataataa atggatactt ctgtaagtag 10500
tatatatata tataaaatta gctctagttc agcaattcag acatacgtgc atgcatgtgc 10560
acacacacta agtcatttac aagtactttg aggttgtagg tccataaatt taagtagaca 10620
gaagtcaact gtatgtgctt gtatgtaaaa ataacgtgtg ttcatttatg ttgttttttt 10680
tgtttgtact ttgtttcaga ctgactgggt gggtgctgct aaaactgttc aacagcttct 10740
tttggaacat tcaaattcac aaaggtcaac ttgagatggt taaagctgca actgaggcaa 10800
gaatttctgt gaatctatta ccccattttc ccctcaattg tagagtggtt ttagggttct 10860
tgtggaaatg ttttcttgtg tactgtgatg tatttcaacc catttggaag atttccctca 10920
tttatgataa cttcaatagc tgtgtatttg gggaggagaa atgagataca ggagtactta 10980
ctagcaatat gcaggattcc ttttgtaagt taccttgcaa caaccctgaa aatctggtag 11040
aacaatccct attttgtaga tgaagcaata gagacacaga tagataaata ggttgtctca 11100
agtggcagat aataagtgac ttgccctgga tttcaaatca aaccaagcct gactccaaaa 11160
cctgtgctct ttttatatca gtggagctgc ttctcagaaa gggtataggt caactggaac 11220
tcttgattgc tcttcttccc ccaacttatt tctgttgtta tagttgctct ttttcttttt 11280
agctcagaaa gtattacatt gaaggaagtt cctattattg gaaaatgttt ttaaagagtg 11340
agtcactgat tagccagtgt ttgagtgact ctagccaaat atgcagttgc aaagtgtgat 11400
tgaattttac atttgagttt taaatttggc atttttccct ttgctagacg aatttgccgc 11460
ttctgtttct accagttcat agatcccata ttgactatct gctgctcact ttcattctct 11520
tctgccataa catcaaagca ccatacattg cttcaggcaa taatctcaac atcccaatct 11580
tcaggtaaga tgagcttatt ttggaattta aggaattaaa aagattatgt tttgaatttt 11640
aattttttaa attatagctt tcgatatgtt attgtaaaga tgacattagc cttttttctt 11700
ttattataaa agtgatacat agttattgtg taaaatttgg agagtgcaaa aatgcattaa 11760
gactatcatc attatttata tattttatat gggatacttg gtgaactgtg actacctaaa 11820
ctttatgggc attgtttatc aaatagataa aaggcaatta gaaaggcaag atagcaaatt 11880
accataccag gctcagcagt agggagttgt ttggtggagg agggggcagt gaagtgggag 11940
aagggttagt gatataaaga caaccatacc tgttactttg acctcataat ttagtagagc 12000
tagaaccact taaaaagtac aatatcatgt gaaaggtatg ttttagaggt tttcaccttt 12060
tgaaaggttt tttagaggtt ttcctcaatg cgttccattc aggggaaata gtatgtgcaa 12120
atgcggagag atacaggagc atggtatggt tgggaagtga tggacaattg ggtaaggtgg 12180
gaatatggga tgcattagga aggatcagag actggaggtg gtagctgtgt aggtagtgaa 12240
agctggatca aaacaatttc taagccaaga gattagagtc tgtcctgtac ttgagaaatg 12300
acatgttcag gtttgtattt tgaaaggtca ttctggatta gaaagaatga aatcaattct 12360
gcttccatta ggatagttca ggcagaagat aatggaggtt taaattgtag tattgttttt 12420
ggacaggagg gcatagattt aaaaagtact tagtagctcg aatttaaaga cccagtgcta 12480
gtccctatgg gggctcaata gagggggaga ggaaggagca agattcccag gtgtttacca 12540
cctaggaaac tgggtaggtg gtaggtctga tcaccaacaa agaattggtg aggaactggt 12600
tgagctggtt tgggaaatta aaagtttcaa acctgaaagg acaaagcatc tctaaggtca 12660
gctctgtggg tagagagtgg ataaaaggag catgaattta gaaagagact ggaaggaaag 12720
tgggctggca ggttgtgcag gtggagcttc acaagatggc cttcgtcacc tttgtgtgct 12780
gtgtcctcag tatcacagtc taaggagctc cttcttaatc ccttggttca gagttctata 12840
ggctttcaga gttctgtagc taaccagact cttgtgaccc aactgaagag aagccatgga 12900
ttcatgcagt cagtgatatt tatccagctg tgctttagac aagagagaac aaaatatata 12960
gtccttgcct tcacatagct taatggataa tgtagacaga cagctagctg taatagcgtg 13020
tgatatgatt ctacagggta gatgtgcttt tccaggaatt agaatatctg tgtttgctct 13080
ccaggggacc tctctccagg aacaaggaac cgggaaactg aattagaaag tcatcaggaa 13140
gtttctggtg ggcacagact tagagggaag aggactattc cactggggct ctagagaagc 13200
cttgcttctc ttgtaattag aatatttcct atacccattt ccttcacatt tggttctcaa 13260
ttaggatttc ttggaactgc ttaataaaca ctgataattt tttgtaatcc aacttccctt 13320
tcatggactc tatgccagtg actgtgtagc tcacctgtcc ttcagacaca gcaggctgta 13380
gttagcccag cctgtttttg tgcagctttc ttttgttaca tgacagtcta cccattcaca 13440
aaccacttct caggtgttat ttttgtggat ggctcatctc attcatttta ttctgcagag 13500
ttttactctc aaagagtgat actaagcttt ggcaacacct tactgtggcc tccttctatt 13560
tactgtagag cagtggtccc caaccttttt ggcatcaggg accagtttca tggaagacaa 13620
tttccacaga ccatgggggt ggggaggatg gttttgggat gattcaagca tgttacattt 13680
attgtgcact ttatttctat tattattact ttgtaatata taaagaaata attatacaac 13740
tcatcataat gtagaatcac tagacggtcc caactggggg tgataggaga cagtgacaga 13800
tcatcaggca ttagattctc ataaggaatg cacaacctag atccctcatg ggcagatgtg 13860
cagttcacaa taggatttgc gctcctatcc tatgagaatc taatgctgtt gctgatctga 13920
caggaggcgg agctcagagg gtaatgcaag tgatggggaa tggctgtaaa tatagatgaa 13980
gctttgcttg cttgcctgcc actcatctcc tgctgtgtgg cccggttcct aacaggccgg 14040
ggaccggtat tggtccgtgg ccccggggtt tgggaccact gctgtagagg ataccaaaaa 14100
tatatattaa tgtttatgtt agtatcactc tacttgaaaa gaataggagg ctgtgagttt 14160
ggaaagattg acttagacag tttcaacttc atatcaaaat tagtgttgta gaaagagaca 14220
tagggttagg aaaagaatcg ttttatgcct gtgtatgtgc aaatgaagca catttttgtt 14280
tcatgttttg gaaagatggt tatgcttggt ttcagttgga taaaattgtt tttgtctcac 14340
aaggatcctc tgtaaacaat aattatttga gaaaatttcc cccaaggagc tttcgtaata 14400
aacatcatat tcattttgta gtaaacatgc catgcgcaaa tttcagaatg tctaagggtc 14460
agtgtcttga gaccctgggc aggattttaa aatttagaag tgttctataa tcctcttaaa 14520
atctatacta tcatttttac gggtaatatg tcatgcaaac tccttttggc ttggaacaga 14580
tataatagag gctcattata cacagtgata tcccaaagac tgatgaacaa tgtaaatgac 14640
tgaaacatgt cgataatatg gaaaatgaaa aaaatgcctg catttttact gtcagctgct 14700
caaacggcac atatggcttg tatccacttg gcaaatgttt tcaattaact tggaatgtga 14760
gtattctttt tacatttttc tttgtaaata attcatgtat tctgaattta tagtaccttg 14820
atccataagc ttgggggctt cttcatacga cgaaggctcg atgaaacacc agatggacgg 14880
aaagatgttc tctatagagc tttgctccat ggggtatgtg tgatctctaa ttatccttag 14940
ggacattgtg ttggttatca cagtggaagg aaaaatgact cttttgagtt gagattttta 15000
aaaactgctc tttgagtaac tggagtgatt attgcttgag tttggtaatt tgttgttgtt 15060
gttgttgttg ttattaccaa aatatagcat tggaggagct gttttattag tgtgaataag 15120
atactttgtc agtagtgaag ttatcgtttt ttctgttttg cttttaaaga tttaattttt 15180
ctgagctcat tctaagttga gtggtcttga atgtatgttt tactttcttc ttatatccca 15240
gcatatagtt gaattacttc gacagcagca attcttggag atcttcctgg aaggcacacg 15300
ttctaggagt ggaaaaacct cttgtgctcg ggcaggactt ttgtcagttg tggtagatac 15360
tctgtctacc aatgtcatcc cagacatctt gataatacct gttggaatct cctatgatcg 15420
cattatcgaa ggtcactaca atggtgaaca actggtaagg gtacctacac aaaagttttc 15480
tttgcttatc aagtctttta gatttaactt ttagaattta catttgcttt tagaattaag 15540
aatttttttt ggtactccct atgtttaaag cactgtatga aatgtgattg gatgggcatg 15600
gtgagtagct ttcatgccct atctttaact tgattggtag tgcttatgtg gtgttttctt 15660
gagcttggca gaagtgacct ggttagattt atcagtgccg accttggtca tgggattggg 15720
aagtgggaga agacttgcca ccgtgttgcc atctctgctg tggaaggtta tctgcggttt 15780
gttctcccca gggcttaatg aatatgtgca tattttaaat tgggcttgaa gaacttgtgg 15840
ggtcatgttg gcaaaaacac ctacagatta atttgagagg tagcaatgac tttttcagta 15900
taccttttta ttgaagtata atagttacaa aagagtatat aaatcatagg catgtagctt 15960
gaattatcac aaagtgaata catctatgca actagcaccc agatcaagga acaatattac 16020
caggaccttt gaaaccctcc ttgtgcttct cctatcatca tccccgcaag ggtaatgatt 16080
aatttcattt cttacagact gggttagttt tgcatatttt tgcacttacg taaattggat 16140
aacatgtggt ctgtacgcat ctggtttcct ttgcttaagc aggtgtttgt gagattcatc 16200
cacattgttg catgtagtct attccttctc atagctgtgt agtattccag tgtatggtat 16260
accataattt attctactgt taacaaaatg tttggctgta atcattcttg gatatttttt 16320
cttgatgacc atatatattc attttgttgg gtatgtgcct aggagaagaa ctgatgggtc 16380
ttaaaaaata tgtattttca gctttagtag gtactgccaa ccactttatc agaatggttt 16440
taccagctta ccactccagt cagcagttag agttcaagag gaatttagtt ttgttcttat 16500
ttattgtgga aattttggct gaggtactta tttcaagctt acggctccag acatgtcaga 16560
aattcaagga cgtctgacaa tcagaggctt tagaaattaa gtgataggct tacaaattaa 16620
gtgatatgat ctgtatgaca ctcttctcct tgtgttctat gaatctgtcc ttgatgtata 16680
ccctactcat cctgactgtg tctcacgagt tcatatctga gtctgtgtcc gttatatgtc 16740
ctgtcattgt gccttatgtg taatagatac taggtattta ctgaatgaat actcagctca 16800
aaggccactg taaggctgga tttgcaatta cttgcctaat attagacatt tagactctgg 16860
tgatcatcag acctcagata aatggcctct ttgatgtttt attcttgttt aagaaccaca 16920
gaagttttcc aggctatgtc attttttcct tcattagttt gcaattgtat ttttgtgaat 16980
tgtgtgaaca tgatactaaa tgaaatagta ttaaatgttt tgtttttcat tgactgaatt 17040
ccatctccca atgacatgat tacatctttg aatactaaac gttttctgac aggccgcagt 17100
taatgattac ctcctttcct tcttcattca ttgttcttct tcaagatgaa cttacagttt 17160
ccataaaaca agttattctg tggataatag aatgtttgtg tatgtgttgg ctttatttct 17220
caccatgtta ttctcactat tggaatttag ggcaaaccta agaagaatga gagcctgtgg 17280
agtgtagcaa gaggtgttat tagaatgtta cgaaaaaact atggttgtgt ccgagtggat 17340
tttgcacagc cattttcctt aaaggtgagt gtctgttgaa atgaaaccat gttgaagcat 17400
ctacctggag tcaggaggct ccagtgctga ctcttaacag cacctctctg tgtgacttgg 17460
ggctgcagtt tgctctcctg taaaatgagg actatgataa aggtggtgtt gcctaaattt 17520
ttccacaaaa tttgcctatt gacaaaggag agtgagtatc tgtttttggg agatatcagg 17580
ctcgacattt attgctatta ttattttttt ttaattcatg accatctaag gggaacaaaa 17640
aacaggtaga aggaataagt tttagtattt gatagtacag tagggaaatt atagttagca 17700
gtaatttatt gtatatttca aaataactaa aagagaagaa ttgtaatatt cccaaccccc 17760
cacaaaaagc taagtgtttg aggtgatggt tatcccaatt accctgattt tatcattaca 17820
cattgtatat agatatcaaa atatcacatg taccccaaaa tatgtacaag tattatatat 17880
caattaaccc caaaagtcaa aaaaattttg agatggatga atgaataaat gaataaataa 17940
ttgtaaaaaa ataaaaattc atgggaatct tgcatgtgcc tttataatac gtatttatat 18000
cttatgtttc aaaattgcct ttaggggaaa tttttccaaa cacctcccct aaaagctggg 18060
taactttttt tttgagacgg agtttcatgt tcttgtagcc caggctggag tgcagtggcg 18120
aaatctcagc tcactgcaac ctctgccccc taggttcaag caattctcct gcgtcagcct 18180
cctaagtagc tgggattaca ggtgcccgct accacacctg gctaattttt gtatttttag 18240
tagagacggg gtttcaccat gttggccagg ctggcctcaa acttctgacc tcaggtgatc 18300
tgcccgcctc ctcatctgcc tcccaaagtg ctgggattac aggtgtgagc cacttcgggc 18360
agccaaagct gggtgaattt gacaggataa tgctctctat gtcctattgt gtagaatcca 18420
gtacccacac atcccaaagg atagtgccat cctcattgaa agtctgggac tggcaggtcc 18480
ctgaggccct tgctggttta aattcttaag gtattcaaat tgtaaaggag aaggagaaaa 18540
atgggtacag aagtagggag cccagggata aggagcagaa ggtcccgcct ctccttttat 18600
tctacttcct ggcttaactt taagagattc cagctgctgt ggtagatgct tgctaacctt 18660
aaatgctttg atcttttaga accttatcat ttcttgccac tttctttctc tttatttttt 18720
aaatggtcac atagcttctc tgtcttgtta tgatttgctt ttagattgag gttcttttga 18780
aaataatgtg acccttgggt tgccagattt ttttaagtat gattatgtct atcatcacta 18840
ttaatgatat taagaatgtc agttttatga tgatgtgtga gaaaagttaa aaatttcttt 18900
taattttaaa atgattttgt ttaagcatcc tattctttgt gtcttcagtg ttcaagttca 18960
gtttcatgct tagcagcatt ctgtgaatca ttctggactt ctgaagacag tttaggatat 19020
agaaagtatt tcccatgctc tatagcatgg cttatttcat aaacaactcc cttttaacct 19080
ttggaagatg aaattacatt ttatatgttg gtgcgaaagt gagggtaaat gatcatgttg 19140
tgtttttttc tccaggaata tttagaaagc caaagtcaga aaccggtgtc tgctctactt 19200
tccctggagc aagcgttgtt accagctata cttccttcaa ggtaaaattt gtagaattgt 19260
ttaatgctaa tcaagctacc aaacatctgt tatttcttgt attgcataga ttaaccttat 19320
taaaaatgcg cacattctta ttttcacttc ttaagtaact tttctcttag tccaataagg 19380
gatattgaga tgacatgttt tcatattagt ttggaagttt ttaattattt gcttataact 19440
ttttgatttt gtgactcata taggagttct taattgattt atgctttttg aatgcttgaa 19500
ctgagttttt ttggtagtag gttatgcata ttgtatgtaa gtgaaccata tgaaagaatt 19560
ttgctgtttg aatttttcgg aattcaaatt gaattcaaat tgaattttaa cttagagaaa 19620
ttgaatatga agcctttcct ttaatatgtg gaagtgttga attttcagaa atgttttaaa 19680
ataaggcatc ttgaattatg tattctttct gccagtggtt ttggaagtgg tgtatcaaca 19740
gactatttag tcataactaa ataacatgtt ttggccaggc cataatgtag tatattatgg 19800
aggaaaataa gccatagaaa taatctgttt gtggtttaaa tttaaaatat atagtaattt 19860
aaagtatcta attcatttaa agatcagttc cacatggttt gccttgtaaa agagtgcggt 19920
tgtgtgttga tttttgaaac actttttaga cccagtgatg ctgctgatga aggtagagac 19980
acgtccatta atgagtccag aaatgcaaca gatgaatccc tacgaaggag gttgattgca 20040
aatctggctg agcatattct attcagtaag tagaatacca gactctttaa ttctacaatt 20100
tagattcatc atggtatggt gcaaactata cagattttgg aatctgctga ggttagtttc 20160
cacttctatt aattcacagg tggtgatagg taagttatta gaaagaaggt gataccgtga 20220
ggatttgaga taattggagt taaacatctt atacagtgtc tggtaattag taggtgttca 20280
tgtggtagtt gttgtacttt ttaaaaatag ttattattaa aatgatttgt tgcctctgtt 20340
gctcattaat gtgttttatt tgaactactt gaactaattt gtggtacaac gtctagattt 20400
atagttgcat gtccatttct cctttgaccc catgagtttt tgtaatgcag caaatatgag 20460
tggccttgta taaagctttg ccttagccgt ggagaataca aaatgaataa ttaatggttc 20520
tgaactcaat gagcttatgt tcttgtcagt gggatggtta tacacaaata attaaagtga 20580
acctagagag gagaggagtg tgagttcact gcaggaccag tcttctttaa gttccaagct 20640
gtacaattgt gtactgttgt ggaggctgct ttaaaatccc aaggcagcac agtggttctt 20700
tggtgctcag cctagttgtg atttctttct tgctgctctc tgggccagga ccctgatgat 20760
actctccgca ccccctgcca atgctactgg ggaggtcttc ctccctcacc ttgctcctcc 20820
cattctggag gcccctattc ctgcttgact ttgggtcaga ggattctttc tcaagcacat 20880
ttgattatgt ctctatcctg cttaaaatct ggatacaaaa aataatacct tattgttaaa 20940
aagtttgaaa ataaagatga aatagacagc aaaaacccat tacccaaata accagtggtg 21000
ttgctgtgta gtctctaaaa atatttttta cagttttgta ttgtgcagct ttccatttat 21060
aacacaatat tcatatttaa aaattcttta taaatatttt taatagctat acatatagta 21120
ctgagtactt ttttttaaca ctggagacga cttcagttac cagtggtgaa tgaagtattc 21180
ttaaatttat tgttatctta gaaaactcac aaatgttatc gtgatttaag attattccat 21240
gggtgttctc agatttgatt tatataatta taattttatg caaattcagt gtaggggtgt 21300
gcactgtagt cattctcaaa tgtgtgtctg tgcccttcct tcttacctct gggtcaggtt 21360
gaaagaggaa atacaaatat gctgagcacc cattactgtg gctcctgtgc cgggccagtc 21420
attttattct catgtggtct aatgagctag gtaggatttt cattttatca gcaaggaagg 21480
tgaggccagg aatttaagta atttgcccca agtcatgaag ttagttagtg agtaaattag 21540
gatttgagcc cagatttttc tgacttcaag tcagctgtta tccttctact acaccttcgt 21600
tttaatatgg tgaataccag caagaagagt gaagtagagt tgtagttata atagactgta 21660
ggtgggagca agtaaaggaa tatggaaatg ggagatcccg tagaactaaa acagccttgt 21720
actttgggtc ttgatatttc aataaaagtg tctcttcgtc attcagtaac taaattccac 21780
tggcctggat tgaagttgga cctgtcttac ttagcctgtt gtatgatgaa tagtgatctc 21840
taatgaggtt ccattatacc agaacactgt agtattataa cttccttttg gtaaatcaca 21900
cttatgggaa atgtgataga agactttcac agttttaaat actcctgttt aaaatttagg 21960
tatttcaaaa aagttcagct atgtttgtaa aaagtgcaac taaaaaaagc tttgtgtttg 22020
ccttccagct gctagcaagt cctgtgccat tatgtccaca cacattgtgg cttgcctgct 22080
cctctacaga cacaggcagg tatgtctgca atgtcacctg cagttaagta ggaagcagga 22140
gaatgttttg tcagctgctc agatacatac tcaggggcag atttggccca ctcatggcta 22200
gtactatgag gtaaacagta aaataagctg aggaccctgc ccaaaggagc ttatcaactt 22260
ggtggaggaa gaatctacat ttaaaaacaa aacaaaacag actgcttaat atatatagta 22320
ctaagctatt gcttgattaa tactgttaat gtaaataagg tctaactcat taacatgtgg 22380
tatatattct gaaagcaaat gctttccaaa tgaattgact ggcattttag aacccaccct 22440
ttatcctccc aaaatacatt tgtctgagct ttatgatgga agagaccaca ccagtcttgt 22500
tcagtcatat tctcaacacc aaacagtgcc aatatatata ggcaccaaat aaatatttgc 22560
cagataaata tttaaaatga aggaaatttt gctaaaaaat aagcactcct tacttgcaga 22620
tggctttttt cctccccctt gtgatcttat gtgtgcatat catgtgtcat ggctagagtg 22680
ttcactagca tgtgtaatac cttgacattc ctggaggacc agctttttaa gtagttttct 22740
gactcgctct gcattggtgt tctggcccta cttctctatg tgctagcagt gagctgcagg 22800
aaagccaagg caagaagaaa gtcttggaat gttggcctct cagctttttg gaaagtaggt 22860
tttccaccat catgataccg tttccatctt tctttaggga attgatctct ccacattggt 22920
cgaagacttc tttgtgatga aagaggaagt cctggctcgt gattttgacc tggggttctc 22980
aggaaattca gaagatgtag taatgcatgc catacagctg ctgggaaatt gtgtcacaat 23040
cacccacact agcaggaacg atgagttttt tatcaccccc agcacaactg tcccatcagt 23100
cttcgaactc aacttctaca gcaatggggt acttcatgtc tttatcatgg aggccatcat 23160
aggtatgtca gaccttgaaa tattttcagt aattttcatg gaaaataaaa aggcctaaaa 23220
cacatagtgg tatctgcttt aatttgggtg atagcccctt gcttgaggga atgtggctat 23280
aattttagtt ttcaaacgaa aatgtaatct cctgttatat cactgtttac aatgagtagt 23340
tactgaatta ccgtttgtat agcattaccc ttatttttca ggagaggtag agtgtcttgc 23400
tatccaggag ctgaaaatct aactgagatg agacatacac agagcagcaa agtgagtgga 23460
gggcctcatt tgtgattaag agaaaagaga ggaaggagag aagagggggc ttatgtcttt 23520
ggagaaggtt tttgatgcag ttgggatcat atggaatcat aagaatttag tcttatggga 23580
tttacttaaa tttctccaaa tacaggccat tatttttgat gtattaataa tctcttaagg 23640
ttattcaagc cagttgaagt ttttcttgga gactttgagc tggcaacttc attgttgctt 23700
ttcttttctt agcttgcagc ctttatgcag ttctgaacaa gaggggactg gggggtccca 23760
ctagcacccc acctaacctg atcagccagg agcagctggt gcggaaggcg gccagcctgt 23820
gctaccttct ctccaatgaa ggcaccatct cactggtgag tgaagaccct tcagtgttgc 23880
ctggtctctt ttcttgagcg ttttcatgaa aacgtaaccc cccgtgtttt tctgttagat 23940
aatgtttgac ccattgttga tactttatat tccactcctg gatttcagtg accaccaaac 24000
caatatgtca tttactatct tggtttgctc tctgggtcac tgctccactg aatctatcct 24060
gcagctatga gccatgatag gacagattgc tcaatgttct caggcagtca catccaaagc 24120
tagtgagcac gtattgtgtg tgaggcactg ggtcagtggt ttgtaaataa ttaacacacc 24180
cacctgtaga tgatggaacc acagatggta agagtcagaa gcagccttaa aaatcatctg 24240
ctcggccagg tgcggtggct cacgcctgta atctcagcac tttgggaggc tgaggcgggc 24300
agatcacgag gtcaggagat cgagaccatc ctggctaacg tggagaaacc ccgtctctac 24360
taaaaataca aaaaaaaatt agccaggtgt agtagcacct gcctgtagtc ccagctactt 24420
tggaggctga ggcaggagga tcacttgaac ctgggaggcg gaggatgcag tgagctgaga 24480
ttgcgccact gttctccagc ctgagtgaca gagcgagact ccatctcaaa aaaaaaaaaa 24540
aaaaaaaaag aaaatcatct gctcaacacc tctcaattta caaatgagga aaaccaagcc 24600
cagcagtact aatgagcatt tatattatat acccaaacac ttttaggcat ttatcatgag 24660
acatatgtat taagtagtag atttccttct tctcaaagtc atcaacatgt agaattcata 24720
ttttatttga attccgatat tttcttttgt atgaatgtgt cttgagatgt tgacgagatg 24780
agtgcatgtg ttaggagtac cgccccctcc atgccatgct ttgtgtgagg tgtgctcgtg 24840
gtcctgttgg ggaatctgtt ttgcatgaac cttgggtggt gggatggaag ggatgagggc 24900
agataagact tccaagattg accttgtcct ttctctggta tttatttact tattccaatg 24960
ttgcctttcc tcaatcacca cttttgtgta cagtatttat tataagataa ctattgcaga 25020
gaaattgtct tataaagtaa aagaaataga tggtgggggg ctgataagca gtcttcagag 25080
ggctttccac actgtgggtg tggggagaga attgagctca ggagtacccc ttgcaggtgg 25140
tgcagtgttg ggtgctctgc caactttaag tgacagaggt cttttcttgg gctttgtcca 25200
tgaccgtgtg tgtatcaaga cagtgggcac tgggaatcac aggacttgct cagtggggtg 25260
atggaggtaa cagaatggaa ggctttggca gctaccttgt accatgtttt ctgcgtttaa 25320
aaaaagaagt ataaaatggt ggcatttata tttaaatgaa ttttcttttc agccttgcca 25380
gacattttac caagtctgcc atgaaacagt aggaaagttt atccagtatg gcattcttac 25440
agtggcagag gtaagaggta gagctttcct ttatttgtct ttatacttac tcttcattcc 25500
cttacctttt ctacaactta tttaaaccaa taattggcca ggcatggtgg catgtgcctg 25560
taatcccagc actttgggag gtgaaggcgg gtggatcacc tgaggtcagg agtacgagag 25620
cagcctggcc aacatggcac aaccctgtct ttcctaaaaa tacaaaaatt agctgggcat 25680
ggtggcacac acctgtaatc ccagctactt gggaggctga ggcacaagaa tcggagtggt 25740
ggaggtttca gtgagccaag atcatgtcag tgcactccag cctgggtgac agagtgagac 25800
tcagtctcat aaataagtaa acaaaccaat aattacattt ggtatatagt catgttcaga 25860
tgtagagaag caaaaaataa gaatggggag aataagtgtc ctttgggatt atttaatatt 25920
ttggttccta tttgtaagtt gtgttgtcta aaacatatcc tgacttgatt ccgtgacatc 25980
cagaagtttg tatgctaagt tgagacgtta cacctatcag tatgcttgca gcttgcacat 26040
ctgcagtttt catttttgag attctatttt aattttggta gatttagtgt agaggagatg 26100
gcctggaaaa gtacatatca atttagaaca tgtgggggta cttttatttg atctttcttt 26160
ctggtagctc tcccctccca cctgcccttt cttttgtctc ctgctgtctc ctgactgagt 26220
ttgagtttgg aagggaagtg gactgacatt atgagtggct aaacagagaa gagccaggaa 26280
gggtcagaga agaggactgc cttgtcctgg ctccactggg cagttgtttg tgtgccagtg 26340
catatttatt tactatccat catctccttg gcctagcacg atgaccagga agatatcagt 26400
cctagtcttg ctgagcagca gtgggacaag aagcttccag aacctttgtc ttggagaagt 26460
gatgaagaag atgaagacag tgactttggg gaggaacagc gagattgcta cctgaaggta 26520
cttgggtgaa gaattctggt ggatattaca gggatatgtt gaggtttatg ctgcagtgag 26580
atcagctgga gtcctggtga tgtcttctta tctaaagaat cccccaacta gctctggtac 26640
cttctgtgtg gtaaagacac tcaaactgtt tgagttgaat taatagcatt ttaagtagaa 26700
aaggaaagga gagtctgaaa agtcaggaag atgaatgtca taggtgagac tttcaccatc 26760
cttttatgaa atacacaggt gcatacctgt ttacctacac ctgcacccct catgaggcag 26820
cagttttgct attgagctgc cactgacctg gctgctcttt ttgagtcact cttgctgtcc 26880
ctcccaaaat ttcatatatt aagctctttg ctgtcaatta aaacaaatac cattatagga 26940
gaaaattgag attaaaaaaa aagtccctga tttagaaaaa tcaattttgt ctaatttata 27000
attttagaac ttagtaataa tgacccgtct tttctgaata ctctaagagg attactcttt 27060
tttgacattt agaaattgtc ttctttttca cttgggtggt attagtttag tttcaagatg 27120
gggcagtgat cttgctttca cactccagag gggcttgacc gaaccagtgt gttttgggta 27180
ggtacagtga gagcctctcg gccataaagc accgccgtca cagtggccat cattccccac 27240
agtgctggac tgtgggcaaa ggccatttag gggaggcagg gaataggtgc tgcagaagga 27300
gtgagataat cttggtggtc tcccattggt ctttctgcag acttgagtga ctgttgagcc 27360
caggcttcaa accatggagg gcctggtctt aggagcggct atttttagtg atgacagcgt 27420
atcacaagta gggcattcat ttatgaaaat ttcttctagg tggctgttca atgaacacaa 27480
gcctcaaata ccataaaaaa gtgaatgatt acaataaaga atgtgtttga aagccagcag 27540
ttgtttccag cagagattct ctgcatgagg ggcagggggc cgctttcatg tagtgctgat 27600
gtgagtggcc atcttctcac gttactggct ctccagagaa agtcctctgt ccacttgcct 27660
tgtgtctctt gtcccttcct catgacttca tctcctgctt ttgcacactc aggtgagcca 27720
atccaaggag caccagcagt ttatcacctt cttacagaga ctccttgggc ctttgctgga 27780
ggcctacagc tctgctgcca tctttgttca caacttcagt ggtcctgttc cagaacctga 27840
gtatctgcaa aagttgcaca aatacctaat aaccagaaca gaaagaaatg ttgcagtata 27900
tggtatgtta agtcactatt tattctttta aaatcttttt tttttttttg gatttcagaa 27960
atttgctaat tgtagaaaat tggaaaaatg caaacttatc ctgacctcta acaccgtaga 28020
gtattactat tatcttcttt ggcatgttat ataagttgaa tgatacagtt atacactctt 28080
acatctggct tttttcacgt aacgttattt ttgagattca tacatgttgc atatagttgt 28140
tcctttgttc ttgttgtgta gtgttccatt gtataaatat ttaccacatt ttattcattc 28200
tgctgttgat ggatatttgg gttgttttca gttcacagct gctttgaaca gtgttgctat 28260
gagcatattt gaatatgtct tttggtgaat atctgtgccc ctatatacag catgtatgtg 28320
ggaacagaat tgcctggttg taggctctgg gtatattcgg ctttggtaga taccaccaaa 28380
cagtttccaa gggattatac ctacttgtac tcccacaaca gtgtgtgttt cacttgctgc 28440
acatcttggc cagcgctccg tcttctttgt tttaggaggt gtgattgggg tgggagtact 28500
attttataca gttgtagttt ggagctgaaa ctacttgaat cactttttag agccaaaagg 28560
aatctaatct aatcacctca ttttatagtt gaggaaaata ccccaggtca cactgctaat 28620
taatgggtaa tctcgggatc agaattcttg tttcctaacc tcgaggcctg tgctttctct 28680
ggttccactg atgtacaatc atctgtgtac cactgggtag cttaaagaat atttatacac 28740
tatctcattt gattctcaca acagtcctgg aaaatggatg ttttaggtat ttctacttcc 28800
ctctgttctc cctatttctc tctctacacc ctcttttctt tccccttccc tttcttattt 28860
acctcaatat aggacaaagt aggtgtaagc aaagtaggtt taacagcaag tcatctgaga 28920
actcacaggt tgccagtggt ggaagtgggg ccccaccctt gtctgctgac ttgccctcat 28980
tctcttccta gctccccata ctttcttact gtggctgctg ggattgtcat gatttgttga 29040
gcgtaaccat ttgacagggt tttattctct ctcttcagct gagagtgcca catattgtct 29100
tgtgaagaat gctgtgaaaa tgtttaagga tattggggta ggtgtccacc atttatggta 29160
taaaagctat ctcaacttct gttctcttta gatctagtct gtttgagcta cctttgtggt 29220
ggggtggacc ccgagagaag cagtttctgc tggcttaatg ataaaggcat ttttgggaac 29280
ggggcatgta ggatgggttg ggctatgttg aaggtgaagc ccatcagtgt agatttattt 29340
gaatgttctg gaattttact ggtttcacat ttattcccaa gctgctatat ataactggta 29400
tcaatatgtt tcaaggtgct acaggttgaa tatcccttat ccaaaatgtt gggaccagaa 29460
atgttttgga tttcagattt ttttgggatt ttggaatatg tgcattagac ttacaggttg 29520
agcgtctcta atccaaaacc caaaatgctc tgatgagcat gtcttttgag catcatattg 29580
atgttcaaaa tctttcagat tttggagtac ttcagatttt tgattttggg attaggacca 29640
caatcttggc tcttaattat tccatatgat ttttagttac tttcttgtat ttttacaaga 29700
atttctagaa gtatcctcag gtgtccttta ccttcatgat tcatggggaa tgtaagttct 29760
atagagatac tagcggcctt ttgtgaggga ctgtttgtga ctttattcta agtcatttta 29820
gagtatagtt atgttggttg aaattttaga atatagttaa tgttggttga actccatcaa 29880
aacaaaaaaa aaaaaataga aaaagaaaac cttgtttgca ttggaaactc ccacctcatg 29940
ctcacacaca cccaggcata catttactta atgccaggat atggtttttt gtgcctttac 30000
tgccttctga ggtctaggac accacaggtc aggttggtaa tggaaatttt ttttattttt 30060
tattttttgc ctttaattta atctaaacct tttctttagg ttttcaagga gaccaaacaa 30120
aagagagtgt ctgttttaga actgagcagc acttttctac ctcaatgcaa ccgacaaaaa 30180
cttctagaat atattctgag ttttgtggtg ctgtaggtaa cgtgtggcac tgctggcaaa 30240
tgaaggtcat gagatgagtt ccttgtaggt accagcttct ggctcaagag ttgaaggtgc 30300
catcgcaggg tcaggcctgc cctgtcccga agtgatctcc tggaagacaa gtgccttctc 30360
cctccatgga tctgtgatct tcccagctct gcatcaacac agcagcctgc agataacact 30420
tggggggacc tcagcctcta ttcgcaactc ataatccgta gactacaaga tgaaatctca 30480
ataaattatt tttgagttta ttaaagattg acattttaag tacaactttt aaggactaat 30540
tactgtgatg gacacagaaa tgtagctgtg ttctggaact gaatcttaca tggtatactt 30600
agtgctgctg ggtaatttgt tggtatatta tctggttagt ggttaatgct tcctttaaaa 30660
ataattgagt catccattca ctctttttca gttttatctg tcaatagtag ctacattttt 30720
aatgggagca ccttttatcc caaagtgctt tataaattga gtggactgat atatatcaca 30780
cccaggtatc actgtgctgt cctttgctgt cagatttaga aatgttttta agagctatgt 30840
gaaaacagac aatattagtt taggtcggga actgagatat tgtaatcaaa tagttaacat 30900
caggaagtta atttggctgg caaaattcta gggaaacttg gccagaaaac tggtgttgaa 30960
ggcttttgct catataaaca agtgccattg agtttcaaat gaccagcaaa tatatttaga 31020
acccttcctg ttttatgtct gtacctcgtc cacccctcag gtaatacctg cctctcacag 31080
gtacagctgt ttcttggaaa tcctccaacc aaatagcagt tttcctaact tgattagctt 31140
gagctgacag actgttagaa tacagttctc tggccacagc tgatgagggc tttctgtact 31200
gcacacagat tgtgtactgc accccagtcc aggtgactgg tacccactcg agttgtgccg 31260
tgcacaacct gtccagtata tgcatgtggt ggccctactg actggtaatg gttagaggca 31320
tttatggatt tttagctttg aggaaaaacc atgactttta acaaattttt atgggttata 31380
tgcctaaacc cttatgccac atagtggtaa ataattatga aaaatggtct gttcataatt 31440
ggtaggtgcc ttttgtgagc agggagcata attattggtt tattatggta attatggtga 31500
ttttttaaat atcatgtaat gttaaaacgt tttctaacag tttactgttg cttatctcca 31560
agatattatg gaattaagaa tttttccaga tgagtgttac atagattctt tgaatttagt 31620
ataaaagtac tgagaattaa gtttgtactt ccataagctt ggattttaaa cactgatagt 31680
atctcatgag taatgtgtgt tttgggagag ggagggatgc tgattgatat ttcacattgt 31740
atgaaatacc atgtttgaaa ctcatagcaa taatgctatg ctgttgtgat ccctctcaag 31800
ttctgcattt aaaatatatt ttttctttat aggaattgat gtataccatg aagtcattgt 31860
cagttgtagt agctctgatg ttgaatgaga tatcatgttt tagcattcca ttttactgac 31920
tagggtagaa gaacactttt cttggctaca tttggaggat acccagggag tcttgggtgt 31980
tccttatctg gggaagcaaa catttcacta gtctcttttt ttcatccttt aaattgtaaa 32040
ttaaggatta ctcaagctca ccattattca agattgggac tcgcttccca gtcgacactc 32100
tgccctgcct gtcattgctg caaagagctg ctgctttgcc aacctaagca aagaaaatac 32160
ggcttctctt gcattatttt cccttttggt tggtttgttt tctagaagta cgttcagatg 32220
ctttggggaa tgcaatgtat gatttgctag ctctctcacc acttaactca ctgtgaggat 32280
aaatatgcat gctttttgta attaactggt gctttgaaaa tcttttttaa gggagaaaaa 32340
tctcaaccaa agttatgctc atccagacaa gctgaccttt gagttaattt cagcacaact 32400
cattcttcag tgcctcatga ctgaaaacaa aaaacaaaaa aacgaaagca tcttcacaat 32460
gaagcttcca gatagcaccg ttttgctaaa agatacattc tcattgtttt ccaacagtga 32520
tggcttccac ataaggttaa acaaactagg tgcttgtaaa taatttatta cagtttactc 32580
tatcgcattt ctgtaacatg aaatgcatgc ccttcttcag gggaagactg tggtcaagtt 32640
aaaaaaaaaa aacaatatta aacaacatga aactgcagtc tgtttttgaa aatgagaatg 32700
tcctaagtga ttcagaagag aggagggaag ttgtgcactc tgaaaatgca tgaaaaacaa 32760
aggcaaaaac tagtgggaaa tgtgtagaac tgttaactga gatggcttcg agtcttcctt 32820
ctggaatctg ttaaatttca caaagtcatg agggtaaatg gagaaaatat ttctgggatt 32880
acaatgaatg taagcccaaa ttgtggaatt gccagtaacc tggatgggga aaagcatttc 32940
ccatagcact ccatgtaata tgagtgctct gtgagatgtt catcagtgtt ttatagaaat 33000
ggtgttgctg ggaaaccaag tttgcacctg gaaacttaca atgcacttta gcgcagtaag 33060
ggcttggcat ccggtagtga aaaactgtct aacccagcat tgcccaaact attttgacac 33120
caggaccttt ttctcctttg ggatacttat gaacctctca ctaatgtcct gtggagaaca 33180
ttttgggaaa cactatgtta gatagttctt taaggagaca aaacggtaat gaacagatag 33240
cactggggca gaatatgcat gcattttgta acgtccagtg tggcgttgaa tagatgtgta 33300
tttcctcccc tgcagaaaat aagcacagaa aattataatg taggtgatcg gagctctttc 33360
ctttgataga gagaacagcc ccaatgatcc tggctttttc actgaacgta tcagaataca 33420
tggatgaatt ggggtaaata aggttttaat tcagatctag aagaaagtat tgtacgtttg 33480
aatgcagatt tttatccaca gatagttgta gtgtttagac atgacaggac ctatcgttga 33540
ggtttctaag acttactatg ggctgtaaac ctgtttttta aaactatttt agaaacctga 33600
gacttgccgt ctggcatttt agtttaatac aaactaatga ttgcatttga aagagattct 33660
tgaccttatt tctaaacgtc tagagctctg aaatgtcttg atggaaggta ttaaactatt 33720
tgcctgttgt acaaagaaat gttaagactc gtgaaaagaa ttactataag gtactgtgaa 33780
ataactgcga ttttgtgagc aaaacatact tggaaatgct gattgatttt tatgcttgtt 33840
agtgtattgc aagaaacaca gaaaatgtag ttttgtttta ataaaccaaa aattgaacat 33900
a 33901
<210> 3
<211> 6372
<212> RNA
<213> 智人(homo sapien)
<400> 3
gcgccacugc agcuggcauu ggccgggacu ggaagugcgg gcuucugcag cagccgaagc 60
uggagcugcu agggcagcag cggcuccccu guuguaugga cauucugcac ccgaaacuga 120
uagcugaguc cugaaguuuu auguuaugaa acagaagaac uuucauccca gcacaugauu 180
ugggaauuac acuuugugac auggaugaau cugcacugac ccuugguaca auagauguuu 240
cuuaucugcc acauucauca gaauacagug uuggucgaug uaagcacaca agugaggaau 300
ggggugagug uggcuuuaga cccaccaucu ucagaucugc aacuuuaaaa uggaaagaaa 360
gccuaaugag ucggaaaagg ccauuuguug gaagauguug uuacuccugc acuccccaga 420
gcugggacaa auuuuucaac cccaguaucc cgucuuuggg uuugcggaau guuauuuaua 480
ucaaugaaac ucacacaaga caccgcggau ggcuugcaag acgccuuucu uacguucuuu 540
uuauucaaga gcgagaugug cauaagggca uguuugccac caaugugacu gaaaaugugc 600
ugaacagcag uagaguacaa gaggcaauug cagaaguggc ugcugaauua aacccugaug 660
guucugccca gcagcaauca aaagccguua acaaagugaa aaagaaagcu aaaaggauuc 720
uucaagaaau gguugccacu gucucaccgg caaugaucag acugacuggg ugggugcugc 780
uaaaacuguu caacagcuuc uuuuggaaca uucaaauuca caaaggucaa cuugagaugg 840
uuaaagcugc aacugagacg aauuugccgc uucuguuucu accaguucau agaucccaua 900
uugacuaucu gcugcucacu uucauucucu ucugccauaa caucaaagca ccauacauug 960
cuucaggcaa uaaucucaac aucccaaucu ucaguaccuu gauccauaag cuugggggcu 1020
ucuucauacg acgaaggcuc gaugaaacac cagauggacg gaaagauguu cucuauagag 1080
cuuugcucca ugggcauaua guugaauuac uucgacagca gcaauucuug gagaucuucc 1140
uggaaggcac acguucuagg aguggaaaaa ccucuugugc ucgggcagga cuuuugucag 1200
uugugguaga uacucugucu accaauguca ucccagacau cuugauaaua ccuguuggaa 1260
ucuccuauga ucgcauuauc gaaggucacu acaaugguga acaacugggc aaaccuaaga 1320
agaaugagag ccuguggagu guagcaagag guguuauuag aauguuacga aaaaacuaug 1380
guuguguccg aguggauuuu gcacagccau uuuccuuaaa ggaauauuua gaaagccaaa 1440
gucagaaacc ggugucugcu cuacuuuccc uggagcaagc guuguuacca gcuauacuuc 1500
cuucaagacc cagugaugcu gcugaugaag guagagacac guccauuaau gaguccagaa 1560
augcaacaga ugaaucccua cgaaggaggu ugauugcaaa ucuggcugag cauauucuau 1620
ucacugcuag caaguccugu gccauuaugu ccacacacau uguggcuugc cugcuccucu 1680
acagacacag gcagggaauu gaucucucca cauuggucga agacuucuuu gugaugaaag 1740
aggaaguccu ggcucgugau uuugaccugg gguucucagg aaauucagaa gauguaguaa 1800
ugcaugccau acagcugcug ggaaauugug ucacaaucac ccacacuagc aggaacgaug 1860
aguuuuuuau cacccccagc acaacugucc caucagucuu cgaacucaac uucuacagca 1920
augggguacu ucaugucuuu aucauggagg ccaucauagc uugcagccuu uaugcaguuc 1980
ugaacaagag gggacugggg ggucccacua gcaccccacc uaaccugauc agccaggagc 2040
agcuggugcg gaaggcggcc agccugugcu accuucucuc caaugaaggc accaucucac 2100
ugccuugcca gacauuuuac caagucugcc augaaacagu aggaaaguuu auccaguaug 2160
gcauucuuac aguggcagag cacgaugacc aggaagauau caguccuagu cuugcugagc 2220
agcaguggga caagaagcuu ccagaaccuu ugucuuggag aagugaugaa gaagaugaag 2280
acagugacuu uggggaggaa cagcgagauu gcuaccugaa ggugagccaa uccaaggagc 2340
accagcaguu uaucaccuuc uuacagagac uccuugggcc uuugcuggag gccuacagcu 2400
cugcugccau cuuuguucac aacuucagug guccuguucc agaaccugag uaucugcaaa 2460
aguugcacaa auaccuaaua accagaacag aaagaaaugu ugcaguauau gcugagagug 2520
ccacauauug ucuugugaag aaugcuguga aaauguuuaa ggauauuggg guuuucaagg 2580
agaccaaaca aaagagagug ucuguuuuag aacugagcag cacuuuucua ccucaaugca 2640
accgacaaaa acuucuagaa uauauucuga guuuuguggu gcuguaggua acguguggca 2700
cugcuggcaa augaagguca ugagaugagu uccuuguagg uaccagcuuc uggcucaaga 2760
guugaaggug ccaucgcagg gucaggccug cccugucccg aagugaucuc cuggaagaca 2820
agugccuucu cccuccaugg aucugugauc uucccagcuc ugcaucaaca cagcagccug 2880
cagauaacac uuggggggac cucagccucu auucgcaacu cauaauccgu agacuacaag 2940
augaaaucuc aauaaauuau uuuugaguuu auuaaagauu gacauuuuaa guacaacuuu 3000
uaaggacuaa uuacugugau ggacacagaa auguagcugu guucuggaac ugaaucuuac 3060
augguauacu uagugcugcu ggguaauuug uugguauauu aucugguuag ugguuaaugc 3120
uuccuuuaaa aauaauugag ucauccauuc acucuuuuuc aguuuuaucu gucaauagua 3180
gcuacauuuu uaaugggagc accuuuuauc ccaaagugcu uuauaaauug aguggacuga 3240
uauauaucac acccagguau cacugugcug uccuuugcug ucagauuuag aaauguuuuu 3300
aagagcuaug ugaaaacaga caauauuagu uuaggucggg aacugagaua uuguaaucaa 3360
auaguuaaca ucaggaaguu aauuuggcug gcaaaauucu agggaaacuu ggccagaaaa 3420
cugguguuga aggcuuuugc ucauauaaac aagugccauu gaguuucaaa ugaccagcaa 3480
auauauuuag aacccuuccu guuuuauguc uguaccucgu ccaccccuca gguaauaccu 3540
gccucucaca gguacagcug uuucuuggaa auccuccaac caaauagcag uuuuccuaac 3600
uugauuagcu ugagcugaca gacuguuaga auacaguucu cuggccacag cugaugaggg 3660
cuuucuguac ugcacacaga uuguguacug caccccaguc caggugacug guacccacuc 3720
gaguugugcc gugcacaacc uguccaguau augcaugugg uggcccuacu gacugguaau 3780
gguuagaggc auuuauggau uuuuagcuuu gaggaaaaac caugacuuuu aacaaauuuu 3840
uauggguuau augccuaaac ccuuaugcca cauaguggua aauaauuaug aaaaaugguc 3900
uguucauaau ugguaggugc cuuuugugag cagggagcau aauuauuggu uuauuauggu 3960
aauuauggug auuuuuuaaa uaucauguaa uguuaaaacg uuuucuaaca guuuacuguu 4020
gcuuaucucc aagauauuau ggaauuaaga auuuuuccag augaguguua cauagauucu 4080
uugaauuuag uauaaaagua cugagaauua aguuuguacu uccauaagcu uggauuuuaa 4140
acacugauag uaucucauga guaaugugug uuuugggaga gggagggaug cugauugaua 4200
uuucacauug uaugaaauac cauguuugaa acucauagca auaaugcuau gcuguuguga 4260
ucccucucaa guucugcauu uaaaauauau uuuuucuuua uaggaauuga uguauaccau 4320
gaagucauug ucaguuguag uagcucugau guugaaugag auaucauguu uuagcauucc 4380
auuuuacuga cuaggguaga agaacacuuu ucuuggcuac auuuggagga uacccaggga 4440
gucuugggug uuccuuaucu ggggaagcaa acauuucacu agucucuuuu uuucauccuu 4500
uaaauuguaa auuaaggauu acucaagcuc accauuauuc aagauuggga cucgcuuccc 4560
agucgacacu cugcccugcc ugucauugcu gcaaagagcu gcugcuuugc caaccuaagc 4620
aaagaaaaua cggcuucucu ugcauuauuu ucccuuuugg uugguuuguu uucuagaagu 4680
acguucagau gcuuugggga augcaaugua ugauuugcua gcucucucac cacuuaacuc 4740
acugugagga uaaauaugca ugcuuuuugu aauuaacugg ugcuuugaaa aucuuuuuua 4800
agggagaaaa aucucaacca aaguuaugcu cauccagaca agcugaccuu ugaguuaauu 4860
ucagcacaac ucauucuuca gugccucaug acugaaaaca aaaaacaaaa aaacgaaagc 4920
aucuucacaa ugaagcuucc agauagcacc guuuugcuaa aagauacauu cucauuguuu 4980
uccaacagug auggcuucca cauaagguua aacaaacuag gugcuuguaa auaauuuauu 5040
acaguuuacu cuaucgcauu ucuguaacau gaaaugcaug cccuucuuca ggggaagacu 5100
guggucaagu uaaaaaaaaa aaacaauauu aaacaacaug aaacugcagu cuguuuuuga 5160
aaaugagaau guccuaagug auucagaaga gaggagggaa guugugcacu cugaaaaugc 5220
augaaaaaca aaggcaaaaa cuagugggaa auguguagaa cuguuaacug agauggcuuc 5280
gagucuuccu ucuggaaucu guuaaauuuc acaaagucau gaggguaaau ggagaaaaua 5340
uuucugggau uacaaugaau guaagcccaa auuguggaau ugccaguaac cuggaugggg 5400
aaaagcauuu cccauagcac uccauguaau augagugcuc ugugagaugu ucaucagugu 5460
uuuauagaaa ugguguugcu gggaaaccaa guuugcaccu ggaaacuuac aaugcacuuu 5520
agcgcaguaa gggcuuggca uccgguagug aaaaacuguc uaacccagca uugcccaaac 5580
uauuuugaca ccaggaccuu uuucuccuuu gggauacuua ugaaccucuc acuaaugucc 5640
uguggagaac auuuugggaa acacuauguu agauaguucu uuaaggagac aaaacgguaa 5700
ugaacagaua gcacuggggc agaauaugca ugcauuuugu aacguccagu guggcguuga 5760
auagaugugu auuuccuccc cugcagaaaa uaagcacaga aaauuauaau guaggugauc 5820
ggagcucuuu ccuuugauag agagaacagc cccaaugauc cuggcuuuuu cacugaacgu 5880
aucagaauac auggaugaau ugggguaaau aagguuuuaa uucagaucua gaagaaagua 5940
uuguacguuu gaaugcagau uuuuauccac agauaguugu aguguuuaga caugacagga 6000
ccuaucguug agguuucuaa gacuuacuau gggcuguaaa ccuguuuuuu aaaacuauuu 6060
uagaaaccug agacuugccg ucuggcauuu uaguuuaaua caaacuaaug auugcauuug 6120
aaagagauuc uugaccuuau uucuaaacgu cuagagcucu gaaaugucuu gauggaaggu 6180
auuaaacuau uugccuguug uacaaagaaa uguuaagacu cgugaaaaga auuacuauaa 6240
gguacuguga aauaacugcg auuuugugag caaaacauac uuggaaaugc ugauugauuu 6300
uuaugcuugu uaguguauug caagaaacac agaaaaugua guuuuguuuu aauaaaccaa 6360
aaauugaaca ua 6372
<210> 4
<211> 5664
<212> RNA
<213> 智人(homo sapien)
<400> 4
gaagcuggag cugcuagggu gcgaacugcc agggcaggca gcagcggcuc cccuguugua 60
uggacauucu gcacccgaaa cugauagcug aguccugaag uuuuauguua ugaaacagaa 120
gaacuuucau cccagcacau gauuugggaa uuacacuuug ugacauggau gaaucugcac 180
ugacccuugg uacaauagau guuucuuauc ugccacauuc aucagaauac aguguugguc 240
gauguaagca cacaagugag gaauggggug aguguggcuu uagacccacc aucuucagau 300
cugcaacuuu aaaauggaaa gaaagccuaa ugagucggaa aaggccauuu guuggaagau 360
guuguuacuc cugcacuccc cagagcuggg acaaauuuuu caaccccagu aucccgucuu 420
uggguuugcg gaauguuauu uauaucaaug aaacucacac aagacaccgc ggauggcuug 480
caagacgccu uucuuacguu cuuuuuauuc aagagcgaga ugugcauaag ggcauguuug 540
ccaccaaugu gacugaaaau gugcugaaca gcaguagagu acaagaggca auugcagaag 600
uggcugcuga auuaaacccu gaugguucug cccagcagca aucaaaagcc guuaacaaag 660
ugaaaaagaa agcuaaaagg auucuucaag aaaugguugc cacugucuca ccggcaauga 720
ucagacugac ugggugggug cugcuaaaac uguucaacag cuucuuuugg aacauucaaa 780
uucacaaagg ucaacuugag augguuaaag cugcaacuga gacgaauuug ccgcuucugu 840
uucuaccagu ucauagaucc cauauugacu aucugcugcu cacuuucauu cucuucugcc 900
auaacaucaa agcaccauac auugcuucag gcaauaaucu caacauccca aucuucagua 960
ccuugaucca uaagcuuggg ggcuucuuca uacgacgaag gcucgaugaa acaccagaug 1020
gacggaaaga uguucucuau agagcuuugc uccaugggca uauaguugaa uuacuucgac 1080
agcagcaauu cuuggagauc uuccuggaag gcacacguuc uaggagugga aaaaccucuu 1140
gugcucgggc aggacuuuug ucaguugugg uagauacucu gucuaccaau gucaucccag 1200
acaucuugau aauaccuguu ggaaucuccu augaucgcau uaucgaaggu cacuacaaug 1260
gugaacaacu gggcaaaccu aagaagaaug agagccugug gaguguagca agagguguua 1320
uuagaauguu acgaaaaaac uaugguugug uccgagugga uuuugcacag ccauuuuccu 1380
uaaaggaaua uuuagaaagc caaagucaga aaccgguguc ugcucuacuu ucccuggagc 1440
aagcguuguu accagcuaua cuuccuucaa gacccaguga ugcugcugau gaagguagag 1500
acacguccau uaaugagucc agaaaugcaa cagaugaauc ccuacgaagg agguugauug 1560
caaaucuggc ugagcauauu cuauucacug cuagcaaguc cugugccauu auguccacac 1620
acauuguggc uugccugcuc cucuacagac acaggcaggg aauugaucuc uccacauugg 1680
ucgaagacuu cuuugugaug aaagaggaag uccuggcucg ugauuuugac cugggguucu 1740
caggaaauuc agaagaugua guaaugcaug ccauacagcu gcugggaaau ugugucacaa 1800
ucacccacac uagcaggaac gaugaguuuu uuaucacccc cagcacaacu gucccaucag 1860
ucuucgaacu caacuucuac agcaaugggg uacuucaugu cuuuaucaug gaggccauca 1920
uagcuugcag ccuuuaugca guucugaaca agaggggacu gggggguccc acuagcaccc 1980
caccuaaccu gaucagccag gagcagcugg ugcggaaggc ggccagccug ugcuaccuuc 2040
ucuccaauga aggcaccauc ucacugccuu gccagacauu uuaccaaguc ugccaugaaa 2100
caguaggaaa guuuauccag uauggcauuc uuacaguggc agagcacgau gaccaggaag 2160
auaucagucc uagucuugcu gagcagcagu gggacaagaa gcuuccagaa ccuuugucuu 2220
ggagaaguga ugaagaagau gaagacagug acuuugggga ggaacagcga gauugcuacc 2280
ugaagguacu ugggugaaga auucuggugg auauuacagg gauauguuga gguuuaugcu 2340
gcagugagau cagcuggagu ccuggugaug ucuucuuauc uaaagaaucc cccaacuagc 2400
ucugguaccu ucuguguggu aaagacacuc aaacuguuug aguugaauua auagcauuuu 2460
aaguagaaaa ggaaaggaga gucugaaaag ucaggaagau gaaugucaua ggugagacuu 2520
ucaccauccu uuuaugaaau acacaggugc auaccuguuu accuacaccu gcaccccuca 2580
ugaggcagca guuuugcuau ugagcugcca cugaccuggc ugcucuuuuu gagucacucu 2640
ugcugucccu cccaaaauuu cauauauuaa gcucuuugcu gucaauuaaa acaaauacca 2700
uuauaggaga aaauugagau uaaaaaaaaa gucccugauu uagaaaaauc aauuuugucu 2760
aauuuauaau uuuagaacuu aguaauaaug acccgucuuu ucugaauacu cuaagaggau 2820
uacucuuuuu ugacauuuag aaauugucuu cuuuuucacu ugggugguau uaguuuaguu 2880
ucaagauggg gcagugaucu ugcuuucaca cuccagaggg gcuugaccga accagugugu 2940
uuuggguagg uacagugaga gccucucggc cauaaagcac cgccgucaca guggccauca 3000
uuccccacag ugcuggacug ugggcaaagg ccauuuaggg gaggcaggga auaggugcug 3060
cagaaggagu gagauaaucu ugguggucuc ccauuggucu uucugcagac uugagugacu 3120
guugagccca ggcuucaaac cauggagggc cuggucuuag gagcggcuau uuuuagugau 3180
gacagcguau cacaaguagg gcauucauuu augaaaauuu cuucuaggug gcuguucaau 3240
gaacacaagc cucaaauacc auaaaaaagu gaaugauuac aauaaagaau guguuugaaa 3300
gccagcaguu guuuccagca gagauucucu gcaugagggg cagggggccg cuuucaugua 3360
gugcugaugu gaguggccau cuucucacgu uacuggcucu ccagagaaag uccucugucc 3420
acuugccuug ugucucuugu cccuuccuca ugacuucauc uccugcuuuu gcacacucag 3480
gugagccaau ccaaggagca ccagcaguuu aucaccuucu uacagagacu ccuugggccu 3540
uugcuggagg ccuacagcuc ugcugccauc uuuguucaca acuucagugg uccuguucca 3600
gaaccugagu aucugcaaaa guugcacaaa uaccuaauaa ccagaacaga aagaaauguu 3660
gcaguauaug guauguuaag ucacuauuua uucuuuuaaa aucuuuuuuu uuuuuuugga 3720
uuucagaaau uugcuaauug uagaaaauug gaaaaaugca aacuuauccu gaccucuaac 3780
accguagagu auuacuauua ucuucuuugg cauguuauau aaguugaaug auacaguuau 3840
acacucuuac aucuggcuuu uuucacguaa cguuauuuuu gagauucaua cauguugcau 3900
auaguuguuc cuuuguucuu guuguguagu guuccauugu auaaauauuu accacauuuu 3960
auucauucug cuguugaugg auauuugggu uguuuucagu ucacagcugc uuugaacagu 4020
guugcuauga gcauauuuga auaugucuuu uggugaauau cugugccccu auauacagca 4080
uguauguggg aacagaauug ccugguugua ggcucugggu auauucggcu uugguagaua 4140
ccaccaaaca guuuccaagg gauuauaccu acuuguacuc ccacaacagu guguguuuca 4200
cuugcugcac aucuuggcca gcgcuccguc uucuuuguuu uaggaggugu gauuggggug 4260
ggaguacuau uuuauacagu uguaguuugg agcugaaacu acuugaauca cuuuuuagag 4320
ccaaaaggaa ucuaaucuaa ucaccucauu uuauaguuga ggaaaauacc ccaggucaca 4380
cugcuaauua auggguaauc ucgggaucag aauucuuguu uccuaaccuc gaggccugug 4440
cuuucucugg uuccacugau guacaaucau cuguguacca cuggguagcu uaaagaauau 4500
uuauacacua ucucauuuga uucucacaac aguccuggaa aauggauguu uuagguauuu 4560
cuacuucccu cuguucuccc uauuucucuc ucuacacccu cuuuucuuuc cccuucccuu 4620
ucuuauuuac cucaauauag gacaaaguag guguaagcaa aguagguuua acagcaaguc 4680
aucugagaac ucacagguug ccaguggugg aaguggggcc ccacccuugu cugcugacuu 4740
gcccucauuc ucuuccuagc uccccauacu uucuuacugu ggcugcuggg auugucauga 4800
uuuguugagc guaaccauuu gacaggguuu uauucucucu cuucagcuga gagugccaca 4860
uauugucuug ugaagaaugc ugugaaaaug uuuaaggaua uugggguagg uguccaccau 4920
uuaugguaua aaagcuaucu caacuucugu ucucuuuaga ucuagucugu uugagcuacc 4980
uuuguggugg gguggacccc gagagaagca guuucugcug gcuuaaugau aaaggcauuu 5040
uugggaacgg ggcauguagg auggguuggg cuauguugaa ggugaagccc aucaguguag 5100
auuuauuuga auguucugga auuuuacugg uuucacauuu auucccaagc ugcuauauau 5160
aacugguauc aauauguuuc aaggugcuac agguugaaua ucccuuaucc aaaauguugg 5220
gaccagaaau guuuuggauu ucagauuuuu uugggauuuu ggaauaugug cauuagacuu 5280
acagguugag cgucucuaau ccaaaaccca aaaugcucug augagcaugu cuuuugagca 5340
ucauauugau guucaaaauc uuucagauuu uggaguacuu cagauuuuug auuuugggau 5400
uaggaccaca aucuuggcuc uuaauuauuc cauaugauuu uuaguuacuu ucuuguauuu 5460
uuacaagaau uucuagaagu auccucaggu guccuuuacc uucaugauuc auggggaaug 5520
uaaguucuau agagauacua gcggccuuuu gugagggacu guuugugacu uuauucuaag 5580
ucauuuuaga guauaguuau guugguugaa auuuuagaau auaguuaaug uugguugaac 5640
uccaucaaaa caaaaaaaaa aaaa 5664
<210> 5
<211> 6368
<212> RNA
<213> 智人(homo sapien)
<400> 5
gcgccacugc agcuggcauu ggccgggacu ggaagugcgg gcuucugcag cagccgaagc 60
uggagcugcu aggcagcggc uccccuguug uauggacauu cugcacccga aacugauagc 120
ugaguccuga aguuuuaugu uaugaaacag aagaacuuuc aucccagcac augauuuggg 180
aauuacacuu ugugacaugg augaaucugc acugacccuu gguacaauag auguuucuua 240
ucugccacau ucaucagaau acaguguugg ucgauguaag cacacaagug aggaaugggg 300
ugaguguggc uuuagaccca ccaucuucag aucugcaacu uuaaaaugga aagaaagccu 360
aaugagucgg aaaaggccau uuguuggaag auguuguuac uccugcacuc cccagagcug 420
ggacaaauuu uucaacccca guaucccguc uuuggguuug cggaauguua uuuauaucaa 480
ugaaacucac acaagacacc gcggauggcu ugcaagacgc cuuucuuacg uucuuuuuau 540
ucaagagcga gaugugcaua agggcauguu ugccaccaau gugacugaaa augugcugaa 600
cagcaguaga guacaagagg caauugcaga aguggcugcu gaauuaaacc cugaugguuc 660
ugcccagcag caaucaaaag ccguuaacaa agugaaaaag aaagcuaaaa ggauucuuca 720
agaaaugguu gccacugucu caccggcaau gaucagacug acuggguggg ugcugcuaaa 780
acuguucaac agcuucuuuu ggaacauuca aauucacaaa ggucaacuug agaugguuaa 840
agcugcaacu gagacgaauu ugccgcuucu guuucuacca guucauagau cccauauuga 900
cuaucugcug cucacuuuca uucucuucug ccauaacauc aaagcaccau acauugcuuc 960
aggcaauaau cucaacaucc caaucuucag uaccuugauc cauaagcuug ggggcuucuu 1020
cauacgacga aggcucgaug aaacaccaga uggacggaaa gauguucucu auagagcuuu 1080
gcuccauggg cauauaguug aauuacuucg acagcagcaa uucuuggaga ucuuccugga 1140
aggcacacgu ucuaggagug gaaaaaccuc uugugcucgg gcaggacuuu ugucaguugu 1200
gguagauacu cugucuacca augucauccc agacaucuug auaauaccug uuggaaucuc 1260
cuaugaucgc auuaucgaag gucacuacaa uggugaacaa cugggcaaac cuaagaagaa 1320
ugagagccug uggaguguag caagaggugu uauuagaaug uuacgaaaaa acuaugguug 1380
uguccgagug gauuuugcac agccauuuuc cuuaaaggaa uauuuagaaa gccaaaguca 1440
gaaaccggug ucugcucuac uuucccugga gcaagcguug uuaccagcua uacuuccuuc 1500
aagacccagu gaugcugcug augaagguag agacacgucc auuaaugagu ccagaaaugc 1560
aacagaugaa ucccuacgaa ggagguugau ugcaaaucug gcugagcaua uucuauucac 1620
ugcuagcaag uccugugcca uuauguccac acacauugug gcuugccugc uccucuacag 1680
acacaggcag ggaauugauc ucuccacauu ggucgaagac uucuuuguga ugaaagagga 1740
aguccuggcu cgugauuuug accugggguu cucaggaaau ucagaagaug uaguaaugca 1800
ugccauacag cugcugggaa auugugucac aaucacccac acuagcagga acgaugaguu 1860
uuuuaucacc cccagcacaa cugucccauc agucuucgaa cucaacuucu acagcaaugg 1920
gguacuucau gucuuuauca uggaggccau cauagcuugc agccuuuaug caguucugaa 1980
caagagggga cugggggguc ccacuagcac cccaccuaac cugaucagcc aggagcagcu 2040
ggugcggaag gcggccagcc ugugcuaccu ucucuccaau gaaggcacca ucucacugcc 2100
uugccagaca uuuuaccaag ucugccauga aacaguagga aaguuuaucc aguauggcau 2160
ucuuacagug gcagagcacg augaccagga agauaucagu ccuagucuug cugagcagca 2220
gugggacaag aagcuuccag aaccuuuguc uuggagaagu gaugaagaag augaagacag 2280
ugacuuuggg gaggaacagc gagauugcua ccugaaggug agccaaucca aggagcacca 2340
gcaguuuauc accuucuuac agagacuccu ugggccuuug cuggaggccu acagcucugc 2400
ugccaucuuu guucacaacu ucaguggucc uguuccagaa ccugaguauc ugcaaaaguu 2460
gcacaaauac cuaauaacca gaacagaaag aaauguugca guauaugcug agagugccac 2520
auauugucuu gugaagaaug cugugaaaau guuuaaggau auugggguuu ucaaggagac 2580
caaacaaaag agagugucug uuuuagaacu gagcagcacu uuucuaccuc aaugcaaccg 2640
acaaaaacuu cuagaauaua uucugaguuu uguggugcug uagguaacgu guggcacugc 2700
uggcaaauga aggucaugag augaguuccu uguagguacc agcuucuggc ucaagaguug 2760
aaggugccau cgcaggguca ggccugcccu gucccgaagu gaucuccugg aagacaagug 2820
ccuucucccu ccauggaucu gugaucuucc cagcucugca ucaacacagc agccugcaga 2880
uaacacuugg ggggaccuca gccucuauuc gcaacucaua auccguagac uacaagauga 2940
aaucucaaua aauuauuuuu gaguuuauua aagauugaca uuuuaaguac aacuuuuaag 3000
gacuaauuac ugugauggac acagaaaugu agcuguguuc uggaacugaa ucuuacaugg 3060
uauacuuagu gcugcugggu aauuuguugg uauauuaucu gguuaguggu uaaugcuucc 3120
uuuaaaaaua auugagucau ccauucacuc uuuuucaguu uuaucuguca auaguagcua 3180
cauuuuuaau gggagcaccu uuuaucccaa agugcuuuau aaauugagug gacugauaua 3240
uaucacaccc agguaucacu gugcuguccu uugcugucag auuuagaaau guuuuuaaga 3300
gcuaugugaa aacagacaau auuaguuuag gucgggaacu gagauauugu aaucaaauag 3360
uuaacaucag gaaguuaauu uggcuggcaa aauucuaggg aaacuuggcc agaaaacugg 3420
uguugaaggc uuuugcucau auaaacaagu gccauugagu uucaaaugac cagcaaauau 3480
auuuagaacc cuuccuguuu uaugucugua ccucguccac cccucaggua auaccugccu 3540
cucacaggua cagcuguuuc uuggaaaucc uccaaccaaa uagcaguuuu ccuaacuuga 3600
uuagcuugag cugacagacu guuagaauac aguucucugg ccacagcuga ugagggcuuu 3660
cuguacugca cacagauugu guacugcacc ccaguccagg ugacugguac ccacucgagu 3720
ugugccgugc acaaccuguc caguauaugc augugguggc ccuacugacu gguaaugguu 3780
agaggcauuu auggauuuuu agcuuugagg aaaaaccaug acuuuuaaca aauuuuuaug 3840
gguuauaugc cuaaacccuu augccacaua gugguaaaua auuaugaaaa auggucuguu 3900
cauaauuggu aggugccuuu ugugagcagg gagcauaauu auugguuuau uaugguaauu 3960
auggugauuu uuuaaauauc auguaauguu aaaacguuuu cuaacaguuu acuguugcuu 4020
aucuccaaga uauuauggaa uuaagaauuu uuccagauga guguuacaua gauucuuuga 4080
auuuaguaua aaaguacuga gaauuaaguu uguacuucca uaagcuugga uuuuaaacac 4140
ugauaguauc ucaugaguaa uguguguuuu gggagaggga gggaugcuga uugauauuuc 4200
acauuguaug aaauaccaug uuugaaacuc auagcaauaa ugcuaugcug uugugauccc 4260
ucucaaguuc ugcauuuaaa auauauuuuu ucuuuauagg aauugaugua uaccaugaag 4320
ucauugucag uuguaguagc ucugauguug aaugagauau cauguuuuag cauuccauuu 4380
uacugacuag gguagaagaa cacuuuucuu ggcuacauuu ggaggauacc cagggagucu 4440
uggguguucc uuaucugggg aagcaaacau uucacuaguc ucuuuuuuuc auccuuuaaa 4500
uuguaaauua aggauuacuc aagcucacca uuauucaaga uugggacucg cuucccaguc 4560
gacacucugc ccugccuguc auugcugcaa agagcugcug cuuugccaac cuaagcaaag 4620
aaaauacggc uucucuugca uuauuuuccc uuuugguugg uuuguuuucu agaaguacgu 4680
ucagaugcuu uggggaaugc aauguaugau uugcuagcuc ucucaccacu uaacucacug 4740
ugaggauaaa uaugcaugcu uuuuguaauu aacuggugcu uugaaaaucu uuuuuaaggg 4800
agaaaaaucu caaccaaagu uaugcucauc cagacaagcu gaccuuugag uuaauuucag 4860
cacaacucau ucuucagugc cucaugacug aaaacaaaaa acaaaaaaac gaaagcaucu 4920
ucacaaugaa gcuuccagau agcaccguuu ugcuaaaaga uacauucuca uuguuuucca 4980
acagugaugg cuuccacaua agguuaaaca aacuaggugc uuguaaauaa uuuauuacag 5040
uuuacucuau cgcauuucug uaacaugaaa ugcaugcccu ucuucagggg aagacugugg 5100
ucaaguuaaa aaaaaaaaac aauauuaaac aacaugaaac ugcagucugu uuuugaaaau 5160
gagaaugucc uaagugauuc agaagagagg agggaaguug ugcacucuga aaaugcauga 5220
aaaacaaagg caaaaacuag ugggaaaugu guagaacugu uaacugagau ggcuucgagu 5280
cuuccuucug gaaucuguua aauuucacaa agucaugagg guaaauggag aaaauauuuc 5340
ugggauuaca augaauguaa gcccaaauug uggaauugcc aguaaccugg auggggaaaa 5400
gcauuuccca uagcacucca uguaauauga gugcucugug agauguucau caguguuuua 5460
uagaaauggu guugcuggga aaccaaguuu gcaccuggaa acuuacaaug cacuuuagcg 5520
caguaagggc uuggcauccg guagugaaaa acugucuaac ccagcauugc ccaaacuauu 5580
uugacaccag gaccuuuuuc uccuuuggga uacuuaugaa ccucucacua auguccugug 5640
gagaacauuu ugggaaacac uauguuagau aguucuuuaa ggagacaaaa cgguaaugaa 5700
cagauagcac uggggcagaa uaugcaugca uuuuguaacg uccagugugg cguugaauag 5760
auguguauuu ccuccccugc agaaaauaag cacagaaaau uauaauguag gugaucggag 5820
cucuuuccuu ugauagagag aacagcccca augauccugg cuuuuucacu gaacguauca 5880
gaauacaugg augaauuggg guaaauaagg uuuuaauuca gaucuagaag aaaguauugu 5940
acguuugaau gcagauuuuu auccacagau aguuguagug uuuagacaug acaggaccua 6000
ucguugaggu uucuaagacu uacuaugggc uguaaaccug uuuuuuaaaa cuauuuuaga 6060
aaccugagac uugccgucug gcauuuuagu uuaauacaaa cuaaugauug cauuugaaag 6120
agauucuuga ccuuauuucu aaacgucuag agcucugaaa ugucuugaug gaagguauua 6180
aacuauuugc cuguuguaca aagaaauguu aagacucgug aaaagaauua cuauaaggua 6240
cugugaaaua acugcgauuu ugugagcaaa acauacuugg aaaugcugau ugauuuuuau 6300
gcuuguuagu guauugcaag aaacacagaa aauguaguuu uguuuuaaua aaccaaaaau 6360
ugaacaua 6368
<210> 6
<211> 4918
<212> RNA
<213> 智人(homo sapien)
<400> 6
ggccacugca gcuggcauug gccgggacug gaagugcggg cuucugcagc agccgaagcu 60
ggagcugcua gggcagcagc ggcuccccug uuguauggac auucugcacc cgaaacugau 120
agcugagucc ugaaguuuua uguuaugaaa cagaagaacu uucaucccag cacaugauuu 180
gggaauuaca cuuugugaca uggaugaauc ugcacugacc cuugguacaa uagauguuuc 240
uuaucugcca cauucaucag aauacagugu uggucgaugu aagcacacaa gugaggaaug 300
gggugagugu ggcuuuagac ccaccaucuu cagaucugca acuuuaaaau ggaaagaaag 360
ccuaaugagu cggaaaaggc cauuuguugg aagauguugu uacuccugca cuccccagag 420
cugggacaaa uuuuucaacc ccaguauccc gucuuugggu uugcggaaug uuauuuauau 480
caaugaaacu cacacaagac accgcggaug gcuugcaaga cgccuuucuu acguucuuuu 540
uauucaagag cgagaugugc auaagggcau guuugccacc aaugugacug aaaaugugcu 600
gaacagcagu agaguacaag aggcaauugc agaaguggcu gcugaauuaa acccugaugg 660
uucugcccag cagcaaucaa aagccguuaa caaagugaaa aagaaagcua aaaggauucu 720
ucaagaaaug guugccacug ucucaccggc aaugaucaga cugacugggu gggugcugcu 780
aaaacuguuc aacagcuucu uuuggaacuu ucaaauucac aaaggucaac uugagauggu 840
uaaagcugca acugagacga auuugccgcu ucuguuucua ccaguucaua gaucccauau 900
ugacuaucug cugcucacuu ucauucucuu cugccauaac aucaaagcac cauacauugc 960
uucaggcaau aaucucaaca ucccaaucuu caguaccuug auccauaagc uugggggcuu 1020
cuucauacga cgaaggcucg augaaacacc agauggacgg aaagauguuc ucuauagagc 1080
uuugcuccau gggcauauag uugaauuacu ucgacagcag caauucuugg agaucuuccu 1140
ggaaggcaca cguucuagga guggaaaaac cucuugugcu cgggcaggac uuuugucagu 1200
ugugguagau acucugucua ccaaugucau cccagacauc uugauaauac cuguuggaau 1260
cuccuaugau cgcauuaucg aaggucacua caauggugaa caacugggca aaccuaagaa 1320
gaaugagagc cuguggagug uagcaagagg uguuauuaga auguuacgaa aaaacuaugg 1380
uuguguccga guggauuuug cacagccauu uuccuuaaag gaauauuuag aaagccaaag 1440
ucagaaaccg gugucugcuc uacuuucccu ggagcaagcg uuguuaccag cuauacuucc 1500
uucaagaccc agugaugcug cugaugaagg uagagacacg uccauuaaug aguccagaaa 1560
ugcaacagau gaaucccuac gaaggagguu gauugcaaau cuggcugagc auauucuauu 1620
cacugcuagc aaguccugug ccauuauguc cacacacauu guggcuugcc ugcuccucua 1680
cagacacagg cagggaauug aucucuccac auuggucgaa gacuucuuug ugaugaaaga 1740
ggaaguccug gcucgugauu uugaccuggg guucucagga aauucagaag auguaguaau 1800
gcaugccaua cagcugcugg gaaauugugu cacaaucacc cacacuagca ggaacgauga 1860
guuuuuuauc acccccagca caacuguccc aucagucuuc gaacucaacu ucuacagcaa 1920
ugggguacuu caugucuuua ucauggaggc caucauagcu ugcagccuuu augcaguucu 1980
gaacaagagg ggacuggggg gucccacuag caccccaccu aaccugauca gccaggagca 2040
gcuggugcgg aaggcggcca gccugugcua ccuucucucc aaugaaggca ccaucucacu 2100
gccuugccag acauuuuacc aagucugcca ugaaacagua ggaaaguuua uccgguaugg 2160
cauucuuaca guggcagagc acgaugacca ggaagauauc aguccuaguc uugcugagca 2220
gcagugggac aagaagcuuc cagaaccuuu gucuuggaga agugaugaag aagaugaaga 2280
cagugacuuu ggggaggaac agcgagauug cuaccugaag gugagccaau ccaaggagca 2340
ccagcaguuu aucaccuucu uacagagacu ccuugggccu uugcuggagg ccuacagcuc 2400
ugcugccauc uuuguucaca acuucagugg uccuguucca gaaccugagu aucugcaaaa 2460
guugcacaaa uaccuaauaa ccagaacaga aagaaauguu gcaguauaug cugagagugc 2520
cacauauugu cuugugaaga augcugugaa aauguuuaag gauauugggg uuuucaagga 2580
gaccaaacaa aagagagugu cuguuuuaga acugagcagc acuuuucuac cucaaugcaa 2640
ccgacaaaaa cuucuagaau auauucugag uuuuguggug cuguagguaa cguguggcac 2700
ugcuggcaaa ugaaggucau gagaugaguu ccuuguaggu accagcuucu ggcucaagag 2760
uugaaggugc caucgcaggg ucaggccugc ccugucccga agugaucucc uggaagacaa 2820
gugccuucuc ccuccaugga ucugugaucu ucccagcucu gcaucaacac agcagccugc 2880
agauaacacu uggggggacc ucagccucua uucgcaacuc auaauccgua gacuacaaga 2940
ugaaaucuca auaaauuauu uuugaguuua uuaaagauug acauuuuaag uacaacuuuu 3000
aaggacuaau uacugugaug gacacagaaa uguagcugug uucuggaacu gaaucuuaca 3060
ugguauacuu agugcugcug gguaauuugu ugguauauua ucugguuagu gguuaaugcu 3120
uccuuuaaaa auaauugagu cauccauuca cucuuuuuca guuuuaucug ucaauaguag 3180
cuacauuuuu aaugggagca ccuuuuaucc caaagugcuu uauaaauuga guggacugau 3240
auauaucaca cccagguauc acugugcugu ccuuugcugu cagauuuaga aauguuuuua 3300
agagcuaugu gaaaacagac aauauuaguu uaggucggga acugagauau uguaaucaaa 3360
uaguuaacau caggaaguua auuuggcugg caaaauucua gggaaacuug gccagaaaac 3420
ugguguugaa ggcuuuugcu cauauaaaca agugccauug aguuucaaau gaccagcaaa 3480
uauauuuaga acccuuccug uuuuaugucu guaccucguc caccccucag guaauaccug 3540
ccucucacag guacagcugu uucuuggaaa uccuccaacc aaauagcagu uuuccuaacu 3600
ugauuagcuu gagcugacag acuguuagaa uacaguucuc uggccacagc ugaugagggc 3660
uuucuguacu gcacacagau uguguacugc accccagucc aggugacugg uacccacucg 3720
aguugugccg ugcacaaccu guccaguaua ugcauguggu ggcccuacug acugguaaug 3780
guuagaggca uuuauggauu uuuagcuuug aggaaaaacc augacuuuua acaaauuuuu 3840
auggguuaua ugccuaaacc cuuaugccac auagugguaa auaauuauga aaaauggucu 3900
guucauaauu gguaggugcc uuuugugagc agggagcaua auuauugguu uauuauggua 3960
auuaugguga uuuuuuaaau aucauguaau guuaaaacgu uuucuaacag uuuacuguug 4020
cuuaucucca agauauuaug gaauuaagaa uuuuuccaga ugaguguuac auagauucuu 4080
ugaauuuagu auaaaaguac ugagaauuaa guuuguacuu ccauaagcuu ggauuuuaaa 4140
cacugauagu aucucaugag uaaugugugu uuugggagag ggagggaugc ugauugauau 4200
uucacauugu augaaauacc auguuugaaa cucauagcaa uaaugcuaug cuguugugau 4260
cccucccaag uucugcauuu aaaauauauu uuuucuuuau aggaauugau guauaccaug 4320
aagucauugu caguuguagu agcucugaug uugaaugaga uaucauguuu uagcauucca 4380
uuuuacugac uaggguagaa gaacacucuu cuuggcuaca uuuggaggau acccagggag 4440
ucuugggugu uccuuaucug gggaagcaaa cauuucacua gucucuuuuu uucauccuuu 4500
aaauuguaaa uuaaggauua cucaagcuca ccauuauuca agauugggac ucgcuuccca 4560
gucgacacuc ugcccugccu gucauugcug caaagagcug cugcuuugcc aaccuaagca 4620
aagaaaauac ggcuucucuu gcauuauuuu cccuuuuggu ugguuuguuu ucuagaagua 4680
cguucagaug cuuuggggaa ugcaauguau gauuugcuag cucucucacc acuuaacuca 4740
cugugaggau aaauaugcau gcuuuuugua auuaacuggu gcuuugaaaa ucuuuuuuaa 4800
gggagaaaaa ucucaaccaa aguuaugcuc auccagacaa gcugaccuuu gaguuaauuu 4860
cagcacaacu cauucuucag ugccucauga cugaaaacaa aaaaaaaaaa aaaaaaaa 4918
<210> 7
<211> 3490
<212> RNA
<213> 智人(homo sapien)
<400> 7
agcgggcugg aagugcgggc uucugcagca gccgaagcug gagcugcuag ggcagcagcg 60
gcuccccugu uguauggaca uucugcaccc gaaacugaua gcugaguccu gaaguuuuau 120
guuaugaaac agaagaacuu ucaucccagc acaugauuug ggaauuacac uuugugacau 180
ggaugaauau gcacugaccc uugguacaau agauguuucu uaucugccac auucaucaga 240
auacaguguu ggucgaugua agcacacaag ugaggaaugg ggugagugug gcuuuagacc 300
caccaucuuc agaucugcaa cuuuaaaaug gaaagaaagc cuaaugaguc ggaaaaggcc 360
auuuguugga agauguuguu acuccugcac uccccagagc ugggacaaau uuuucaacac 420
caguaucccg ucuuuggguu ugcggaaugu uauuuauauc aaugaaacuc acacaagaca 480
ccgcggaugg cuugcaagac gccuuucuua cguucuuuuu auucaagagc gagaugugca 540
uaagggcaug uuugccacca augugacuga aaaugugcug aacagcagua gaguacaaga 600
ggcaauugca gaaguggcug cugaauuaaa cccugauggu ucugcccagc agcaaucaaa 660
agccguuaac aaagugaaaa agaaagcuaa aaggauucuu caagaaaugg uugccacugu 720
cucaccggca augaucagac ugacugggug ggugcugcua aaacuguuca acagcuucuu 780
uuggaacauu caaauucaca aaggucaacu ugagaugguu aaagcugcaa cugagacgaa 840
uuugccgcuu cuguuucuac caguucauag aucccauauu gacuaucugc ugcucacuuu 900
cauucucuuc ugccauaaca ucaaagcacc auacauugcu ucaggcaaua aucucaacau 960
cccaaucuuc aguaccuuga uccauaagcu ugggggcuuc uucauacgac gaaggcucga 1020
ugaaacacca gauggacgga aagauguucu cuauagagcu uugcuccaug ggcauauagu 1080
ugaauuacuu cgacagcagc aauucuugga gaucuuccug gaaggcacac guucuaggag 1140
uggaaaaacc ucuugugcuc gggcaggacu uuugucaguu gugguagaua cucugucuac 1200
caaugucauc ccagacaucu ugauaauacc uguuggaauc uccuaugauc gcauuaucga 1260
aggucacuac aauggugaac aacugggcaa accuaagaag aaugagagcc uguggagugu 1320
agcaagaggu guuauuagaa uguuacgaaa aaacuauggu uguguccgag uggauuuugc 1380
acagccauuu uccuuaaagg aauauuuaga aagccaaagu cagaaaccgg ugucugcucu 1440
acuuucccug gagcaagcgu uguuaccagc uauacuuccu ucaagaccca gugaugcugc 1500
ugaugaaggu agagacacgu ccauuaauga guccagaaau gcaacagaug aaucccuacg 1560
aaggagguug auugcaaauc uggcugagca uauucuauuc acugcuagca aguccugugc 1620
cauuaugucc acacacauug uggcuugccu gcuccucuac agacacaggc agggaauuga 1680
ucucuccaca uuggucgaag acuucuuugu gaugaaagag gaaguccugg cucgugauuu 1740
ugaccugggg uucucaggaa auucagaaga uguaguaaug caugccauac agcugcuggg 1800
aaauuguguc acaaucaccc acacuagcag gaacgaugag uuuuuuauca cccccagcac 1860
aacuguccca ucagucuucg aacucaacuu cuacagcaau gggguacuuc augucuuuau 1920
cauggaggcc aucauagcuu gcagccuuua ugcaguucug aacaagaggg gacugggggg 1980
ucccacuagc accccaccua accugaucag ccaggagcag cuggugcgga aggcggccag 2040
ccugugcuac cuucucucca augaaggcac caucucacug ccuugccaga cauuuuacca 2100
agucugccau gaaacaguag gaaaguuuau ccaguauggc auucuuacag uggcagagca 2160
cgaugaccag gaagauauca guccuagucu ugcugagcag cagugggaca agaagcuucc 2220
agaaccuuug ucuuggagaa gugaugaaga agaugaagac agugacuuug gggaggaaca 2280
gcgagauugc uaccugaagg ugagccaauc caaggagcac cagcaguuua ucaccuucuu 2340
acagagacuc cuugggccuu ugcuggaggc cuacagcucu gcugccaucu uuguucacaa 2400
cuucaguggu ccuguuccag aaccugagua ucugcaaaag uugcacaaau accuaauaac 2460
cagaacagaa agaaauguug caguauaugc ugagagugcc acauauuguc uugugaagaa 2520
ugcugugaaa auguuuaagg auauuggggu uuucaaggag accaaacaaa agagaguguc 2580
uguuuuagaa cugagcagca cuuuucuacc ucaaugcaac cgacaaaaac uucuagaaua 2640
uauucugagu uuuguggugc uguagguaac guguggcacu gcuggcaaau gaaggucaug 2700
agaugaguuc cuuguaggua caagcuucug gcucaagagu ugaaggugcc aucgcagggu 2760
caggccugcc cugucccgaa gugaucuccu ggaagacaag ugccuucucc auccauggau 2820
cugugaucuu cccagcucug caucaacaca gcagccugca gauaacacuu ggggggaccu 2880
cagccucuau ucgcaacuca uaauccguag acuacaagau gaaaucucaa uaaauuauuu 2940
uugaguuuau uaaagauuga cauuuuaagu acaacuuuua aggacuaauu acugugaugg 3000
acacagaaau guagcugugu ucuggaacug aaucuuacau gguauacuua gugcugcugg 3060
guaauuuguu gguauauuau cugguuagug guuaaugcuu ccuuuaaaaa uaauugaguc 3120
auccauucac ucuuuuucag uuuuaucugu caauaguagc uacauuuuua augggagcac 3180
cuuuuauccc aaagugcuuu auaaauugag uggacugaua uauaucacac ccagguauca 3240
cugugcuguc cuuugcuguc agauuuagaa auguuuuuaa gagcuaugug aaaacagaca 3300
auauuaguuu aggucgggaa cugagauauu guaaucaaau aguuaacauc aggaaguuaa 3360
uuuggcuggc aaaauucuag ggaaacuugg ccagaaaacu gguguugaag gcuuuugcuc 3420
auauaaacaa gugccauuga guuucaaaug accagcaaau auauuuagaa cucaaaaaaa 3480
aaaaaaaaaa 3490
<210> 8
<211> 2855
<212> RNA
<213> 智人(homo sapien)
<400> 8
aacuuucauc ccagcacaug auuugggaau uacacuuugu gacauggaug aaucugcacu 60
gacccuuggu acaauagaug uuucuuaucu gccacauuca ucagaauaca guguuggucg 120
auguaagcac acaagugagg aaugggguga guguggcuuu agacccacca ucuucagauc 180
ugcaacuuua aaauggaaag aaagccuaau gagucggaaa aggccauuug uuggaagaug 240
uuguuacucc ugcacucccc agagcuggga caaauuuuuc aaccccagua ucccgucuuu 300
ggguuugcgg aauguuauuu auaucaauga aacucacaca agacaccgcg gauggcuugc 360
aagacgccuu ucuuacguuc uuuuuauuca agagcgagau gugcauaagg gcauguuugc 420
caccaaugug acugaaaaug ugcugaacag caguagagua caagaggcaa uugcagaagu 480
ggcugcugaa uuaaacccug augguucugc ccagcagcaa ucaaaagccg uuaacaaagu 540
gaaaaagaaa gcuaaaagga uucuucaaga aaugguugcc acugucucac cggcaaugau 600
cagacugacu gggugggugc ugcuaaaacu guucaacagc uucuuuugga acauucaaau 660
ucacaaaggu caacuugaga ugguuaaagc ugcaacugag acgaauuugc cgcuucuguu 720
ucuaccaguu cauagauccc auauugacua ucugcugcuc acuuucauuc ucuucugcca 780
uaacaucaaa gcaccauaca uugcuucagg caauaaucuc aacaucccaa ucuucaguac 840
cuugauccau aagcuugggg gcuucuucau acgacgaagg cucgaugaaa caccagaugg 900
acggaaagau guucucuaua gagcuuugcu ccaugggcau auaguugaau uacuucgaca 960
gcagcaauuc uuggagaucu uccuggaagg cacacguucu aggaguggaa aaaccucuug 1020
ugcucgggca ggacuuuugu caguuguggu agauacucug ucuaccaaug ucaucccaga 1080
caucuugaua auaccuguug gaaucuccua ugaucgcauu aucgaagguc acuacaaugg 1140
ugaacaacug ggcaaaccua agaagaauga gagccugugg aguguagcaa gagguguuac 1200
uagaauguua cgaaaaaacu augguugugu ccgaguggau uuugcacagc cauuuuccuu 1260
aaaggaauau uuagaaagcc aaagucagaa accggugucu gcucuacuuu cccuggagca 1320
agcguuguua ccagcuauac uuccuucaag acccagugau gcugcugaug aagguagaga 1380
cacguccauu aaugagucca gaaaugcaac agaugaaucc cuacgaagga gguugauugc 1440
aaaucuggcu gagcauauuc uauucacugc uagcaagucc ugugccauua uguccacaca 1500
cauuguggcu ugccugcucc ucuacagaca caggcaggga auugaucucu ccacauuggu 1560
cgaagacuuc uuugugauga aagaggaagu ccuggcucgu gauuuugacc ugggguucuc 1620
aggaaauuca gaagauguag uaaugcaugc cauacagcug cugggaaauu gugucacaau 1680
cacccacacu agcaggaacg augaguuuuu uaucaccccc agcacaacug ucccaucagu 1740
cuucgaacuc aacuucuaca gcaauggggu acuucauguc uuuaucaugg aggccaucau 1800
agcuugcagc cuuuaugcag uucugaacaa gaggggacug ggggguccca cuagcacccc 1860
accuaaccug aucagccagg agcagcuggu gcggaaggcg gccagccugu gcuaccuucu 1920
cuccaaugaa ggcaccaucu cacugccuug ccagacauuu uaccaagucu gccaugaaac 1980
aguaggaaag uuuauccagu auggcauucu uacaguggca gagcacgaug accaggaaga 2040
uaucaguccu agucuugcug agcagcagug ggacaagaag cuuccugaac cuuugucuug 2100
gagaagugau gaagaagaug aagacaguga cuuuggggag gaacagcgag auugcuaccu 2160
gaaggugagc caauccaagg agcaccagca guuuaucacc uucuuacaga gacuccuugg 2220
gccuuugcug gaggccuaca gcucugcugc caucuuuguu cacaacuuca gugguccugu 2280
uccagaaccu gaguaucugc aaaaguugca caaauaccua auaaccagaa cagaaagaaa 2340
uguugcagua uaugcugaga gugccacaua uugucuugug aagaaugcug ugaaaauguu 2400
uaaggauauu gggguuuuca aggagaccaa acaaaagaga gugucuguuu uagaacugag 2460
cagcacuuuu cuaccucaau gcaaccgaca aaaacuucua gaauauauuc ugaguuuugu 2520
ggugcuguag guaacgugug gcacugcugg caaaugaagg ucaugagaug aguuccuugu 2580
agguaccagc uucuggcuca agaguugaag gugccgucgc agggucaggc cugcccuguc 2640
ccgaggugau cuccuggaag acaagugccu ucucccucca uggaucugug aucuucccag 2700
cucugcauca acacagcagc cugcagauaa cacuuggggg gaccucagcc ucuauucgca 2760
acucauaauc cguagacuac aagaugaaau cucaauaaau uauuuuugag uuuauuaaag 2820
aggucuuuua aggcaaaaaa aaaaaaaaaa aaaaa 2855
<210> 9
<211> 6372
<212> RNA
<213> 智人(homo sapien)
<400> 9
gcgccacugc agcuggcauu ggccgggacu ggaagugcgg gcuucugcag cagccgaagc 60
uggagcugcu agggcagcag cggcuccccu guuguaugga cauucugcac ccgaaacuga 120
uagcugaguc cugaaguuuu auguuaugaa acagaagaac uuucauccca gcacaugauu 180
ugggaauuac acuuugugac auggaugaau cugcacugac ccuugguaca auagauguuu 240
cuuaucugcc acauucauca gaauacagug uuggucgaug uaagcacaca agugaggaau 300
ggggugagug uggcuuuaga cccaccgucu ucagaucugc aacuuuaaaa uggaaagaaa 360
gccuaaugag ucggaaaagg ccauuuguug gaagauguug uuacuccugc acuccccaga 420
gcugggacaa auuuuucaac cccaguaucc cgucuuuggg uuugcggaau guuauuuaua 480
ucaaugaaac ucacacaaga caccgcggau ggcuugcaag acgccuuucu uacguucuuu 540
uuauucaaga gcgagaugug cauaagggca uguuugccac caaugugacu gaaaaugugc 600
ugaacagcag uagaguacaa gaggcaauug cagaaguggc ugcugaauua aacccugaug 660
guucugccca gcagcaauca aaagccguua acaaagugaa aaagaaagcu aaaaggauuc 720
uucaagaaau gguugccacu gucucaccgg caaugaucag acugacuggg ugggugcugc 780
uaaaacuguu caacagcuuc uuuuggaaca uucaaauuca caaaggucaa cuugagaugg 840
uuaaagcugc aacugagacg aauuugccgc uucuguuucu accaguucau agaucccaua 900
uugacuaucu gcugcucacu uucauucucu ucugccauaa caucaaagca ccauacauug 960
cuucaggcaa uaaucucaac aucccaaucu ucaguaccuu gauccauaag cuugggggcu 1020
ucuucauacg acgaaggcuc gaugaaacac cagauggacg gaaagauguu cucuauagag 1080
cuuugcucca ugggcauaua guugaauuac uucgacagca gcaauucuug gagaucuucc 1140
uggaaggcac acguucuagg aguggaaaaa ccucuugugc ucgggcagga cuuuugucag 1200
uugugguaga uacucugucu accaauguca ucccagacau cuugauaaua ccuguuggaa 1260
ucuccuauga ucgcauuauc gaaggucacu acaaugguga acaacugggc aaaccuaaga 1320
agaaugagag ccuguggagu guagcaagag guguuauuag aauguuacga aaaaacuaug 1380
guuguguccg aguggauuuu gcacagccau uuuccuuaaa ggaauauuua gaaagccaaa 1440
gucagaaacc ggugucugcu cuacuuuccc uggagcaagc guuguuacca gcuauacuuc 1500
cuucaagacc cagugaugcu gcugaugaag guagagacac guccauuaau gaguccagaa 1560
augcaacaga ugaaucccua cgaaggaggu ugauugcaaa ucuggcugag cauauucuau 1620
ucacugcuag caaguccugu gccauuaugu ccacacacau uguggcuugc cugcuccucu 1680
acagacacag gcagggaauu gaucucucca cauuggucga agacuucuuu gugaugaaag 1740
aggaaguccu ggcucgugau uuugaccugg gguucucagg aaauucagaa gauguaguaa 1800
ugcaugccau acagcugcug ggaaauugug ucacaaucac ccacacuagc aggaacgaug 1860
aguuuuuuau cacccccagc acaacugucc caucagucuu cgaacucaac uucuacagca 1920
augggguacu ucaugucuuu aucauggagg ccaucauagc uugcagccuu uaugcaguuc 1980
ugaacaagag gggacugggg ggucccacua gcaccccacc uaaccugauc agccaggagc 2040
agcuggugcg gaaggcggcc agccugugcu accuucucuc caaugaaggc accaucucac 2100
ugccuugcca gacauuuuac caagucugcc augaaacagu aggaaaguuu auccaguaug 2160
gcauucuuac aguggcagag cacgaugacc aggaagauau caguccuagu cuugcugagc 2220
agcaguggga caagaagcuu ccagaaccuu ugucuuggag aagugaugaa gaagaugaag 2280
acagugacuu uggggaggaa cagcgagauu gcuaccugaa ggugagccaa uccaaggagc 2340
accagcaguu uaucaccuuc uuacagagac uccuugggcc uuugcuggag gccuacagcu 2400
cugcugccau cuuuguucac aacuucagug guccuguucc agaaccugag uaucugcaaa 2460
aguugcacaa auaccuaaua accagaacag aaagaaaugu ugcaguauau gcugagagug 2520
ccacauauug ucuugugaag aaugcuguga aaauguuuaa ggauauuggg guuuucaagg 2580
agaccaaaca aaagagagug ucuguuuuag aacugagcag cacuuuucua ccucaaugca 2640
accgacaaaa acuucuagaa uauauucuga guuuuguggu gcuguaggua acguguggca 2700
cugcuggcaa augaagguca ugagaugagu uccuuguagg uaccagcuuc uggcucaaga 2760
guugaaggug ccaucgcagg gucaggccug cccugucccg aagugaucuc cuggaagaca 2820
agugccuucu cccuccaugg aucugugauc uucccagcuc ugcaucaaca cagcagccug 2880
cagauaacac uuggggggac cucagccucu auucgcaacu cauaauccgu agacuacaag 2940
augaaaucuc aauaaauuau uuuugaguuu auuaaagauu gacauuuuaa guacaacuuu 3000
uaaggacuaa uuacugugau ggacacagaa auguagcugu guucuggaac ugaaucuuac 3060
augguauacu uagugcugcu ggguaauuug uugguauauu aucugguuag ugguuaaugc 3120
uuccuuuaaa aauaauugag ucauccauuc acucuuuuuc aguuuuaucu gucaauagua 3180
gcuacauuuu uaaugggagc accuuuuauc ccaaagugcu uuauaaauug aguggacuga 3240
uauauaucac acccagguau cacugugcug uccuuugcug ucagauuuag aaauguuuuu 3300
aagagcuaug ugaaaacaga caauauuagu uuaggucggg aacugagaua uuguaaucaa 3360
auaguuaaca ucaggaaguu aauuuggcug gcaaaauucu agggaaacuu ggccagaaaa 3420
cugguguuga aggcuuuugc ucauauaaac aagugccauu gaguuucaaa ugaccagcaa 3480
auauauuuag aacccuuccu guuuuauguc uguaccucgu ccaccccuca gguaauaccu 3540
gccucucaca gguacagcug uuucuuggaa auccuccaac caaauagcag uuuuccuaac 3600
uugauuagcu ugagcugaca gacuguuaga auacaguucu cuggccacag cugaugaggg 3660
cuuucuguac ugcacacaga uuguguacug caccccaguc caggugacug guacccacuc 3720
gaguugugcc gugcacaacc uguccaguau augcaugugg uggcccuacu gacugguaau 3780
gguuagaggc auuuauggau uuuuagcuuu gaggaaaaac caugacuuuu aacaaauuuu 3840
uauggguuau augccuaaac ccuuaugcca cauaguggua aauaauuaug aaaaaugguc 3900
uguucauaau ugguaggugc cuuuugugag cagggagcau aauuauuggu uuauuauggu 3960
aauuauggug auuuuuuaaa uaucauguaa uguuaaaacg uuuucuaaca guuuacuguu 4020
gcuuaucucc aagauauuau ggaauuaaga auuuuuccag augaguguua cauagauucu 4080
uugaauuuag uauaaaagua cugagaauua aguuuguacu uccauaagcu uggauuuuaa 4140
acacugauag uaucucauga guaaugugug uuuugggaga gggagggaug cugauugaua 4200
uuucacauug uaugaaauac cauguuugaa acucauagca auaaugcuau gcuguuguga 4260
ucccucucaa guucugcauu uaaaauauau uuuuucuuua uaggaauuga uguauaccau 4320
gaagucauug ucaguuguag uagcucugau guugaaugag auaucauguu uuagcauucc 4380
auuuuacuga cuaggguaga agaacacuuu ucuuggcuac auuuggagga uacccaggga 4440
gucuugggug uuccuuaucu ggggaagcaa acauuucacu agucucuuuu uuucauccuu 4500
uaaauuguaa auuaaggauu acucaagcuc accauuauuc aagauuggga cucgcuuccc 4560
agucgacacu cugcccugcc ugucauugcu gcaaagagcu gcugcuuugc caaccuaagc 4620
aaagaaaaua cggcuucucu ugcauuauuu ucccuuuugg uugguuuguu uucuagaagu 4680
acguucagau gcuuugggga augcaaugua ugauuugcua gcucucucac cacuuaacuc 4740
acugugagga uaaauaugca ugcuuuuugu aauuaacugg ugcuuugaaa aucuuuuuua 4800
agggagaaaa aucucaacca aaguuaugcu cauccagaca agcugaccuu ugaguuaauu 4860
ucagcacaac ucauucuuca gugccucaug acugaaaaca aaaaacaaaa aaacgaaagc 4920
aucuucacaa ugaagcuucc agauagcacc guuuugcuaa aagauacauu cucauuguuu 4980
uccaacagug auggcuucca cauaagguua aacaaacuag gugcuuguaa auaauuuauu 5040
acaguuuacu cuaucgcauu ucuguaacau gaaaugcaug cccuucuuca ggggaagacu 5100
guggucaagu uaaaaaaaaa aaacaauauu aaacaacaug aaacugcagu cuguuuuuga 5160
aaaugagaau guccuaagug auucagaaga gaggagggaa guugugcacu cugaaaaugc 5220
augaaaaaca aaggcaaaaa cuagugggaa auguguagaa cuguuaacug agauggcuuc 5280
gagucuuccu ucuggaaucu guuaaauuuc acaaagucau gaggguaaau ggagaaaaua 5340
uuucugggau uacaaugaau guaagcccaa auuguggaau ugccaguaac cuggaugggg 5400
aaaagcauuu cccauagcac uccauguaau augagugcuc ugugagaugu ucaucagugu 5460
uuuauagaaa ugguguugcu gggaaaccaa guuugcaccu ggaaacuuac aaugcacuuu 5520
agcgcaguaa gggcuuggca uccgguagug aaaaacuguc uaacccagca uugcccaaac 5580
uauuuugaca ccaggaccuu uuucuccuuu gggauacuua ugaaccucuc acuaaugucc 5640
uguggagaac auuuugggaa acacuauguu agauaguucu uuaaggagac aaaacgguaa 5700
ugaacagaua gcacuggggc agaauaugca ugcauuuugu aacguccagu guggcguuga 5760
auagaugugu auuuccuccc cugcagaaaa uaagcacaga aaauuauaau guaggugauc 5820
ggagcucuuu ccuuugauag agagaacagc cccaaugauc cuggcuuuuu cacugaacgu 5880
aucagaauac auggaugaau ugggguaaau aagguuuuaa uucagaucua gaagaaagua 5940
uuguacguuu gaaugcagau uuuuauccac agauaguugu aguguuuaga caugacagga 6000
ccuaucguug agguuucuaa gacuuacuau gggcuguaaa ccuguuuuuu aaaacuauuu 6060
uagaaaccug agacuugccg ucuggcauuu uaguuuaaua caaacuaaug auugcauuug 6120
aaagagauuc uugaccuuau uucuaaacgu cuagagcucu gaaaugucuu gauggaaggu 6180
auuaaacuau uugccuguug uacaaagaaa uguuaagacu cgugaaaaga auuacuauaa 6240
gguacuguga aauaacugcg auuuugugag caaaacauac uuggaaaugc ugauugauuu 6300
uuaugcuugu uaguguauug caagaaacac agaaaaugua guuuuguuuu aauaaaccaa 6360
aaauugaaca ua 6372
<210> 10
<211> 5664
<212> RNA
<213> 智人(homo sapien)
<400> 10
gaagcuggag cugcuagggu gcgaacugcc agggcaggca gcagcggcuc cccuguugua 60
uggacauucu gcacccgaaa cugauagcug aguccugaag uuuuauguua ugaaacagaa 120
gaacuuucau cccagcacau gauuugggaa uuacacuuug ugacauggau gaaucugcac 180
ugacccuugg uacaauagau guuucuuauc ugccacauuc aucagaauac aguguugguc 240
gauguaagca cacaagugag gaauggggug aguguggcuu uagacccacc gucuucagau 300
cugcaacuuu aaaauggaaa gaaagccuaa ugagucggaa aaggccauuu guuggaagau 360
guuguuacuc cugcacuccc cagagcuggg acaaauuuuu caaccccagu aucccgucuu 420
uggguuugcg gaauguuauu uauaucaaug aaacucacac aagacaccgc ggauggcuug 480
caagacgccu uucuuacguu cuuuuuauuc aagagcgaga ugugcauaag ggcauguuug 540
ccaccaaugu gacugaaaau gugcugaaca gcaguagagu acaagaggca auugcagaag 600
uggcugcuga auuaaacccu gaugguucug cccagcagca aucaaaagcc guuaacaaag 660
ugaaaaagaa agcuaaaagg auucuucaag aaaugguugc cacugucuca ccggcaauga 720
ucagacugac ugggugggug cugcuaaaac uguucaacag cuucuuuugg aacauucaaa 780
uucacaaagg ucaacuugag augguuaaag cugcaacuga gacgaauuug ccgcuucugu 840
uucuaccagu ucauagaucc cauauugacu aucugcugcu cacuuucauu cucuucugcc 900
auaacaucaa agcaccauac auugcuucag gcaauaaucu caacauccca aucuucagua 960
ccuugaucca uaagcuuggg ggcuucuuca uacgacgaag gcucgaugaa acaccagaug 1020
gacggaaaga uguucucuau agagcuuugc uccaugggca uauaguugaa uuacuucgac 1080
agcagcaauu cuuggagauc uuccuggaag gcacacguuc uaggagugga aaaaccucuu 1140
gugcucgggc aggacuuuug ucaguugugg uagauacucu gucuaccaau gucaucccag 1200
acaucuugau aauaccuguu ggaaucuccu augaucgcau uaucgaaggu cacuacaaug 1260
gugaacaacu gggcaaaccu aagaagaaug agagccugug gaguguagca agagguguua 1320
uuagaauguu acgaaaaaac uaugguugug uccgagugga uuuugcacag ccauuuuccu 1380
uaaaggaaua uuuagaaagc caaagucaga aaccgguguc ugcucuacuu ucccuggagc 1440
aagcguuguu accagcuaua cuuccuucaa gacccaguga ugcugcugau gaagguagag 1500
acacguccau uaaugagucc agaaaugcaa cagaugaauc ccuacgaagg agguugauug 1560
caaaucuggc ugagcauauu cuauucacug cuagcaaguc cugugccauu auguccacac 1620
acauuguggc uugccugcuc cucuacagac acaggcaggg aauugaucuc uccacauugg 1680
ucgaagacuu cuuugugaug aaagaggaag uccuggcucg ugauuuugac cugggguucu 1740
caggaaauuc agaagaugua guaaugcaug ccauacagcu gcugggaaau ugugucacaa 1800
ucacccacac uagcaggaac gaugaguuuu uuaucacccc cagcacaacu gucccaucag 1860
ucuucgaacu caacuucuac agcaaugggg uacuucaugu cuuuaucaug gaggccauca 1920
uagcuugcag ccuuuaugca guucugaaca agaggggacu gggggguccc acuagcaccc 1980
caccuaaccu gaucagccag gagcagcugg ugcggaaggc ggccagccug ugcuaccuuc 2040
ucuccaauga aggcaccauc ucacugccuu gccagacauu uuaccaaguc ugccaugaaa 2100
caguaggaaa guuuauccag uauggcauuc uuacaguggc agagcacgau gaccaggaag 2160
auaucagucc uagucuugcu gagcagcagu gggacaagaa gcuuccagaa ccuuugucuu 2220
ggagaaguga ugaagaagau gaagacagug acuuugggga ggaacagcga gauugcuacc 2280
ugaagguacu ugggugaaga auucuggugg auauuacagg gauauguuga gguuuaugcu 2340
gcagugagau cagcuggagu ccuggugaug ucuucuuauc uaaagaaucc cccaacuagc 2400
ucugguaccu ucuguguggu aaagacacuc aaacuguuug aguugaauua auagcauuuu 2460
aaguagaaaa ggaaaggaga gucugaaaag ucaggaagau gaaugucaua ggugagacuu 2520
ucaccauccu uuuaugaaau acacaggugc auaccuguuu accuacaccu gcaccccuca 2580
ugaggcagca guuuugcuau ugagcugcca cugaccuggc ugcucuuuuu gagucacucu 2640
ugcugucccu cccaaaauuu cauauauuaa gcucuuugcu gucaauuaaa acaaauacca 2700
uuauaggaga aaauugagau uaaaaaaaaa gucccugauu uagaaaaauc aauuuugucu 2760
aauuuauaau uuuagaacuu aguaauaaug acccgucuuu ucugaauacu cuaagaggau 2820
uacucuuuuu ugacauuuag aaauugucuu cuuuuucacu ugggugguau uaguuuaguu 2880
ucaagauggg gcagugaucu ugcuuucaca cuccagaggg gcuugaccga accagugugu 2940
uuuggguagg uacagugaga gccucucggc cauaaagcac cgccgucaca guggccauca 3000
uuccccacag ugcuggacug ugggcaaagg ccauuuaggg gaggcaggga auaggugcug 3060
cagaaggagu gagauaaucu ugguggucuc ccauuggucu uucugcagac uugagugacu 3120
guugagccca ggcuucaaac cauggagggc cuggucuuag gagcggcuau uuuuagugau 3180
gacagcguau cacaaguagg gcauucauuu augaaaauuu cuucuaggug gcuguucaau 3240
gaacacaagc cucaaauacc auaaaaaagu gaaugauuac aauaaagaau guguuugaaa 3300
gccagcaguu guuuccagca gagauucucu gcaugagggg cagggggccg cuuucaugua 3360
gugcugaugu gaguggccau cuucucacgu uacuggcucu ccagagaaag uccucugucc 3420
acuugccuug ugucucuugu cccuuccuca ugacuucauc uccugcuuuu gcacacucag 3480
gugagccaau ccaaggagca ccagcaguuu aucaccuucu uacagagacu ccuugggccu 3540
uugcuggagg ccuacagcuc ugcugccauc uuuguucaca acuucagugg uccuguucca 3600
gaaccugagu aucugcaaaa guugcacaaa uaccuaauaa ccagaacaga aagaaauguu 3660
gcaguauaug guauguuaag ucacuauuua uucuuuuaaa aucuuuuuuu uuuuuuugga 3720
uuucagaaau uugcuaauug uagaaaauug gaaaaaugca aacuuauccu gaccucuaac 3780
accguagagu auuacuauua ucuucuuugg cauguuauau aaguugaaug auacaguuau 3840
acacucuuac aucuggcuuu uuucacguaa cguuauuuuu gagauucaua cauguugcau 3900
auaguuguuc cuuuguucuu guuguguagu guuccauugu auaaauauuu accacauuuu 3960
auucauucug cuguugaugg auauuugggu uguuuucagu ucacagcugc uuugaacagu 4020
guugcuauga gcauauuuga auaugucuuu uggugaauau cugugccccu auauacagca 4080
uguauguggg aacagaauug ccugguugua ggcucugggu auauucggcu uugguagaua 4140
ccaccaaaca guuuccaagg gauuauaccu acuuguacuc ccacaacagu guguguuuca 4200
cuugcugcac aucuuggcca gcgcuccguc uucuuuguuu uaggaggugu gauuggggug 4260
ggaguacuau uuuauacagu uguaguuugg agcugaaacu acuugaauca cuuuuuagag 4320
ccaaaaggaa ucuaaucuaa ucaccucauu uuauaguuga ggaaaauacc ccaggucaca 4380
cugcuaauua auggguaauc ucgggaucag aauucuuguu uccuaaccuc gaggccugug 4440
cuuucucugg uuccacugau guacaaucau cuguguacca cuggguagcu uaaagaauau 4500
uuauacacua ucucauuuga uucucacaac aguccuggaa aauggauguu uuagguauuu 4560
cuacuucccu cuguucuccc uauuucucuc ucuacacccu cuuuucuuuc cccuucccuu 4620
ucuuauuuac cucaauauag gacaaaguag guguaagcaa aguagguuua acagcaaguc 4680
aucugagaac ucacagguug ccaguggugg aaguggggcc ccacccuugu cugcugacuu 4740
gcccucauuc ucuuccuagc uccccauacu uucuuacugu ggcugcuggg auugucauga 4800
uuuguugagc guaaccauuu gacaggguuu uauucucucu cuucagcuga gagugccaca 4860
uauugucuug ugaagaaugc ugugaaaaug uuuaaggaua uugggguagg uguccaccau 4920
uuaugguaua aaagcuaucu caacuucugu ucucuuuaga ucuagucugu uugagcuacc 4980
uuuguggugg gguggacccc gagagaagca guuucugcug gcuuaaugau aaaggcauuu 5040
uugggaacgg ggcauguagg auggguuggg cuauguugaa ggugaagccc aucaguguag 5100
auuuauuuga auguucugga auuuuacugg uuucacauuu auucccaagc ugcuauauau 5160
aacugguauc aauauguuuc aaggugcuac agguugaaua ucccuuaucc aaaauguugg 5220
gaccagaaau guuuuggauu ucagauuuuu uugggauuuu ggaauaugug cauuagacuu 5280
acagguugag cgucucuaau ccaaaaccca aaaugcucug augagcaugu cuuuugagca 5340
ucauauugau guucaaaauc uuucagauuu uggaguacuu cagauuuuug auuuugggau 5400
uaggaccaca aucuuggcuc uuaauuauuc cauaugauuu uuaguuacuu ucuuguauuu 5460
uuacaagaau uucuagaagu auccucaggu guccuuuacc uucaugauuc auggggaaug 5520
uaaguucuau agagauacua gcggccuuuu gugagggacu guuugugacu uuauucuaag 5580
ucauuuuaga guauaguuau guugguugaa auuuuagaau auaguuaaug uugguugaac 5640
uccaucaaaa caaaaaaaaa aaaa 5664
<210> 11
<211> 6368
<212> RNA
<213> 智人(homo sapien)
<400> 11
gcgccacugc agcuggcauu ggccgggacu ggaagugcgg gcuucugcag cagccgaagc 60
uggagcugcu aggcagcggc uccccuguug uauggacauu cugcacccga aacugauagc 120
ugaguccuga aguuuuaugu uaugaaacag aagaacuuuc aucccagcac augauuuggg 180
aauuacacuu ugugacaugg augaaucugc acugacccuu gguacaauag auguuucuua 240
ucugccacau ucaucagaau acaguguugg ucgauguaag cacacaagug aggaaugggg 300
ugaguguggc uuuagaccca ccgucuucag aucugcaacu uuaaaaugga aagaaagccu 360
aaugagucgg aaaaggccau uuguuggaag auguuguuac uccugcacuc cccagagcug 420
ggacaaauuu uucaacccca guaucccguc uuuggguuug cggaauguua uuuauaucaa 480
ugaaacucac acaagacacc gcggauggcu ugcaagacgc cuuucuuacg uucuuuuuau 540
ucaagagcga gaugugcaua agggcauguu ugccaccaau gugacugaaa augugcugaa 600
cagcaguaga guacaagagg caauugcaga aguggcugcu gaauuaaacc cugaugguuc 660
ugcccagcag caaucaaaag ccguuaacaa agugaaaaag aaagcuaaaa ggauucuuca 720
agaaaugguu gccacugucu caccggcaau gaucagacug acuggguggg ugcugcuaaa 780
acuguucaac agcuucuuuu ggaacauuca aauucacaaa ggucaacuug agaugguuaa 840
agcugcaacu gagacgaauu ugccgcuucu guuucuacca guucauagau cccauauuga 900
cuaucugcug cucacuuuca uucucuucug ccauaacauc aaagcaccau acauugcuuc 960
aggcaauaau cucaacaucc caaucuucag uaccuugauc cauaagcuug ggggcuucuu 1020
cauacgacga aggcucgaug aaacaccaga uggacggaaa gauguucucu auagagcuuu 1080
gcuccauggg cauauaguug aauuacuucg acagcagcaa uucuuggaga ucuuccugga 1140
aggcacacgu ucuaggagug gaaaaaccuc uugugcucgg gcaggacuuu ugucaguugu 1200
gguagauacu cugucuacca augucauccc agacaucuug auaauaccug uuggaaucuc 1260
cuaugaucgc auuaucgaag gucacuacaa uggugaacaa cugggcaaac cuaagaagaa 1320
ugagagccug uggaguguag caagaggugu uauuagaaug uuacgaaaaa acuaugguug 1380
uguccgagug gauuuugcac agccauuuuc cuuaaaggaa uauuuagaaa gccaaaguca 1440
gaaaccggug ucugcucuac uuucccugga gcaagcguug uuaccagcua uacuuccuuc 1500
aagacccagu gaugcugcug augaagguag agacacgucc auuaaugagu ccagaaaugc 1560
aacagaugaa ucccuacgaa ggagguugau ugcaaaucug gcugagcaua uucuauucac 1620
ugcuagcaag uccugugcca uuauguccac acacauugug gcuugccugc uccucuacag 1680
acacaggcag ggaauugauc ucuccacauu ggucgaagac uucuuuguga ugaaagagga 1740
aguccuggcu cgugauuuug accugggguu cucaggaaau ucagaagaug uaguaaugca 1800
ugccauacag cugcugggaa auugugucac aaucacccac acuagcagga acgaugaguu 1860
uuuuaucacc cccagcacaa cugucccauc agucuucgaa cucaacuucu acagcaaugg 1920
gguacuucau gucuuuauca uggaggccau cauagcuugc agccuuuaug caguucugaa 1980
caagagggga cugggggguc ccacuagcac cccaccuaac cugaucagcc aggagcagcu 2040
ggugcggaag gcggccagcc ugugcuaccu ucucuccaau gaaggcacca ucucacugcc 2100
uugccagaca uuuuaccaag ucugccauga aacaguagga aaguuuaucc aguauggcau 2160
ucuuacagug gcagagcacg augaccagga agauaucagu ccuagucuug cugagcagca 2220
gugggacaag aagcuuccag aaccuuuguc uuggagaagu gaugaagaag augaagacag 2280
ugacuuuggg gaggaacagc gagauugcua ccugaaggug agccaaucca aggagcacca 2340
gcaguuuauc accuucuuac agagacuccu ugggccuuug cuggaggccu acagcucugc 2400
ugccaucuuu guucacaacu ucaguggucc uguuccagaa ccugaguauc ugcaaaaguu 2460
gcacaaauac cuaauaacca gaacagaaag aaauguugca guauaugcug agagugccac 2520
auauugucuu gugaagaaug cugugaaaau guuuaaggau auugggguuu ucaaggagac 2580
caaacaaaag agagugucug uuuuagaacu gagcagcacu uuucuaccuc aaugcaaccg 2640
acaaaaacuu cuagaauaua uucugaguuu uguggugcug uagguaacgu guggcacugc 2700
uggcaaauga aggucaugag augaguuccu uguagguacc agcuucuggc ucaagaguug 2760
aaggugccau cgcaggguca ggccugcccu gucccgaagu gaucuccugg aagacaagug 2820
ccuucucccu ccauggaucu gugaucuucc cagcucugca ucaacacagc agccugcaga 2880
uaacacuugg ggggaccuca gccucuauuc gcaacucaua auccguagac uacaagauga 2940
aaucucaaua aauuauuuuu gaguuuauua aagauugaca uuuuaaguac aacuuuuaag 3000
gacuaauuac ugugauggac acagaaaugu agcuguguuc uggaacugaa ucuuacaugg 3060
uauacuuagu gcugcugggu aauuuguugg uauauuaucu gguuaguggu uaaugcuucc 3120
uuuaaaaaua auugagucau ccauucacuc uuuuucaguu uuaucuguca auaguagcua 3180
cauuuuuaau gggagcaccu uuuaucccaa agugcuuuau aaauugagug gacugauaua 3240
uaucacaccc agguaucacu gugcuguccu uugcugucag auuuagaaau guuuuuaaga 3300
gcuaugugaa aacagacaau auuaguuuag gucgggaacu gagauauugu aaucaaauag 3360
uuaacaucag gaaguuaauu uggcuggcaa aauucuaggg aaacuuggcc agaaaacugg 3420
uguugaaggc uuuugcucau auaaacaagu gccauugagu uucaaaugac cagcaaauau 3480
auuuagaacc cuuccuguuu uaugucugua ccucguccac cccucaggua auaccugccu 3540
cucacaggua cagcuguuuc uuggaaaucc uccaaccaaa uagcaguuuu ccuaacuuga 3600
uuagcuugag cugacagacu guuagaauac aguucucugg ccacagcuga ugagggcuuu 3660
cuguacugca cacagauugu guacugcacc ccaguccagg ugacugguac ccacucgagu 3720
ugugccgugc acaaccuguc caguauaugc augugguggc ccuacugacu gguaaugguu 3780
agaggcauuu auggauuuuu agcuuugagg aaaaaccaug acuuuuaaca aauuuuuaug 3840
gguuauaugc cuaaacccuu augccacaua gugguaaaua auuaugaaaa auggucuguu 3900
cauaauuggu aggugccuuu ugugagcagg gagcauaauu auugguuuau uaugguaauu 3960
auggugauuu uuuaaauauc auguaauguu aaaacguuuu cuaacaguuu acuguugcuu 4020
aucuccaaga uauuauggaa uuaagaauuu uuccagauga guguuacaua gauucuuuga 4080
auuuaguaua aaaguacuga gaauuaaguu uguacuucca uaagcuugga uuuuaaacac 4140
ugauaguauc ucaugaguaa uguguguuuu gggagaggga gggaugcuga uugauauuuc 4200
acauuguaug aaauaccaug uuugaaacuc auagcaauaa ugcuaugcug uugugauccc 4260
ucucaaguuc ugcauuuaaa auauauuuuu ucuuuauagg aauugaugua uaccaugaag 4320
ucauugucag uuguaguagc ucugauguug aaugagauau cauguuuuag cauuccauuu 4380
uacugacuag gguagaagaa cacuuuucuu ggcuacauuu ggaggauacc cagggagucu 4440
uggguguucc uuaucugggg aagcaaacau uucacuaguc ucuuuuuuuc auccuuuaaa 4500
uuguaaauua aggauuacuc aagcucacca uuauucaaga uugggacucg cuucccaguc 4560
gacacucugc ccugccuguc auugcugcaa agagcugcug cuuugccaac cuaagcaaag 4620
aaaauacggc uucucuugca uuauuuuccc uuuugguugg uuuguuuucu agaaguacgu 4680
ucagaugcuu uggggaaugc aauguaugau uugcuagcuc ucucaccacu uaacucacug 4740
ugaggauaaa uaugcaugcu uuuuguaauu aacuggugcu uugaaaaucu uuuuuaaggg 4800
agaaaaaucu caaccaaagu uaugcucauc cagacaagcu gaccuuugag uuaauuucag 4860
cacaacucau ucuucagugc cucaugacug aaaacaaaaa acaaaaaaac gaaagcaucu 4920
ucacaaugaa gcuuccagau agcaccguuu ugcuaaaaga uacauucuca uuguuuucca 4980
acagugaugg cuuccacaua agguuaaaca aacuaggugc uuguaaauaa uuuauuacag 5040
uuuacucuau cgcauuucug uaacaugaaa ugcaugcccu ucuucagggg aagacugugg 5100
ucaaguuaaa aaaaaaaaac aauauuaaac aacaugaaac ugcagucugu uuuugaaaau 5160
gagaaugucc uaagugauuc agaagagagg agggaaguug ugcacucuga aaaugcauga 5220
aaaacaaagg caaaaacuag ugggaaaugu guagaacugu uaacugagau ggcuucgagu 5280
cuuccuucug gaaucuguua aauuucacaa agucaugagg guaaauggag aaaauauuuc 5340
ugggauuaca augaauguaa gcccaaauug uggaauugcc aguaaccugg auggggaaaa 5400
gcauuuccca uagcacucca uguaauauga gugcucugug agauguucau caguguuuua 5460
uagaaauggu guugcuggga aaccaaguuu gcaccuggaa acuuacaaug cacuuuagcg 5520
caguaagggc uuggcauccg guagugaaaa acugucuaac ccagcauugc ccaaacuauu 5580
uugacaccag gaccuuuuuc uccuuuggga uacuuaugaa ccucucacua auguccugug 5640
gagaacauuu ugggaaacac uauguuagau aguucuuuaa ggagacaaaa cgguaaugaa 5700
cagauagcac uggggcagaa uaugcaugca uuuuguaacg uccagugugg cguugaauag 5760
auguguauuu ccuccccugc agaaaauaag cacagaaaau uauaauguag gugaucggag 5820
cucuuuccuu ugauagagag aacagcccca augauccugg cuuuuucacu gaacguauca 5880
gaauacaugg augaauuggg guaaauaagg uuuuaauuca gaucuagaag aaaguauugu 5940
acguuugaau gcagauuuuu auccacagau aguuguagug uuuagacaug acaggaccua 6000
ucguugaggu uucuaagacu uacuaugggc uguaaaccug uuuuuuaaaa cuauuuuaga 6060
aaccugagac uugccgucug gcauuuuagu uuaauacaaa cuaaugauug cauuugaaag 6120
agauucuuga ccuuauuucu aaacgucuag agcucugaaa ugucuugaug gaagguauua 6180
aacuauuugc cuguuguaca aagaaauguu aagacucgug aaaagaauua cuauaaggua 6240
cugugaaaua acugcgauuu ugugagcaaa acauacuugg aaaugcugau ugauuuuuau 6300
gcuuguuagu guauugcaag aaacacagaa aauguaguuu uguuuuaaua aaccaaaaau 6360
ugaacaua 6368
<210> 12
<211> 4918
<212> RNA
<213> 智人(homo sapien)
<400> 12
ggccacugca gcuggcauug gccgggacug gaagugcggg cuucugcagc agccgaagcu 60
ggagcugcua gggcagcagc ggcuccccug uuguauggac auucugcacc cgaaacugau 120
agcugagucc ugaaguuuua uguuaugaaa cagaagaacu uucaucccag cacaugauuu 180
gggaauuaca cuuugugaca uggaugaauc ugcacugacc cuugguacaa uagauguuuc 240
uuaucugcca cauucaucag aauacagugu uggucgaugu aagcacacaa gugaggaaug 300
gggugagugu ggcuuuagac ccaccgucuu cagaucugca acuuuaaaau ggaaagaaag 360
ccuaaugagu cggaaaaggc cauuuguugg aagauguugu uacuccugca cuccccagag 420
cugggacaaa uuuuucaacc ccaguauccc gucuuugggu uugcggaaug uuauuuauau 480
caaugaaacu cacacaagac accgcggaug gcuugcaaga cgccuuucuu acguucuuuu 540
uauucaagag cgagaugugc auaagggcau guuugccacc aaugugacug aaaaugugcu 600
gaacagcagu agaguacaag aggcaauugc agaaguggcu gcugaauuaa acccugaugg 660
uucugcccag cagcaaucaa aagccguuaa caaagugaaa aagaaagcua aaaggauucu 720
ucaagaaaug guugccacug ucucaccggc aaugaucaga cugacugggu gggugcugcu 780
aaaacuguuc aacagcuucu uuuggaacuu ucaaauucac aaaggucaac uugagauggu 840
uaaagcugca acugagacga auuugccgcu ucuguuucua ccaguucaua gaucccauau 900
ugacuaucug cugcucacuu ucauucucuu cugccauaac aucaaagcac cauacauugc 960
uucaggcaau aaucucaaca ucccaaucuu caguaccuug auccauaagc uugggggcuu 1020
cuucauacga cgaaggcucg augaaacacc agauggacgg aaagauguuc ucuauagagc 1080
uuugcuccau gggcauauag uugaauuacu ucgacagcag caauucuugg agaucuuccu 1140
ggaaggcaca cguucuagga guggaaaaac cucuugugcu cgggcaggac uuuugucagu 1200
ugugguagau acucugucua ccaaugucau cccagacauc uugauaauac cuguuggaau 1260
cuccuaugau cgcauuaucg aaggucacua caauggugaa caacugggca aaccuaagaa 1320
gaaugagagc cuguggagug uagcaagagg uguuauuaga auguuacgaa aaaacuaugg 1380
uuguguccga guggauuuug cacagccauu uuccuuaaag gaauauuuag aaagccaaag 1440
ucagaaaccg gugucugcuc uacuuucccu ggagcaagcg uuguuaccag cuauacuucc 1500
uucaagaccc agugaugcug cugaugaagg uagagacacg uccauuaaug aguccagaaa 1560
ugcaacagau gaaucccuac gaaggagguu gauugcaaau cuggcugagc auauucuauu 1620
cacugcuagc aaguccugug ccauuauguc cacacacauu guggcuugcc ugcuccucua 1680
cagacacagg cagggaauug aucucuccac auuggucgaa gacuucuuug ugaugaaaga 1740
ggaaguccug gcucgugauu uugaccuggg guucucagga aauucagaag auguaguaau 1800
gcaugccaua cagcugcugg gaaauugugu cacaaucacc cacacuagca ggaacgauga 1860
guuuuuuauc acccccagca caacuguccc aucagucuuc gaacucaacu ucuacagcaa 1920
ugggguacuu caugucuuua ucauggaggc caucauagcu ugcagccuuu augcaguucu 1980
gaacaagagg ggacuggggg gucccacuag caccccaccu aaccugauca gccaggagca 2040
gcuggugcgg aaggcggcca gccugugcua ccuucucucc aaugaaggca ccaucucacu 2100
gccuugccag acauuuuacc aagucugcca ugaaacagua ggaaaguuua uccgguaugg 2160
cauucuuaca guggcagagc acgaugacca ggaagauauc aguccuaguc uugcugagca 2220
gcagugggac aagaagcuuc cagaaccuuu gucuuggaga agugaugaag aagaugaaga 2280
cagugacuuu ggggaggaac agcgagauug cuaccugaag gugagccaau ccaaggagca 2340
ccagcaguuu aucaccuucu uacagagacu ccuugggccu uugcuggagg ccuacagcuc 2400
ugcugccauc uuuguucaca acuucagugg uccuguucca gaaccugagu aucugcaaaa 2460
guugcacaaa uaccuaauaa ccagaacaga aagaaauguu gcaguauaug cugagagugc 2520
cacauauugu cuugugaaga augcugugaa aauguuuaag gauauugggg uuuucaagga 2580
gaccaaacaa aagagagugu cuguuuuaga acugagcagc acuuuucuac cucaaugcaa 2640
ccgacaaaaa cuucuagaau auauucugag uuuuguggug cuguagguaa cguguggcac 2700
ugcuggcaaa ugaaggucau gagaugaguu ccuuguaggu accagcuucu ggcucaagag 2760
uugaaggugc caucgcaggg ucaggccugc ccugucccga agugaucucc uggaagacaa 2820
gugccuucuc ccuccaugga ucugugaucu ucccagcucu gcaucaacac agcagccugc 2880
agauaacacu uggggggacc ucagccucua uucgcaacuc auaauccgua gacuacaaga 2940
ugaaaucuca auaaauuauu uuugaguuua uuaaagauug acauuuuaag uacaacuuuu 3000
aaggacuaau uacugugaug gacacagaaa uguagcugug uucuggaacu gaaucuuaca 3060
ugguauacuu agugcugcug gguaauuugu ugguauauua ucugguuagu gguuaaugcu 3120
uccuuuaaaa auaauugagu cauccauuca cucuuuuuca guuuuaucug ucaauaguag 3180
cuacauuuuu aaugggagca ccuuuuaucc caaagugcuu uauaaauuga guggacugau 3240
auauaucaca cccagguauc acugugcugu ccuuugcugu cagauuuaga aauguuuuua 3300
agagcuaugu gaaaacagac aauauuaguu uaggucggga acugagauau uguaaucaaa 3360
uaguuaacau caggaaguua auuuggcugg caaaauucua gggaaacuug gccagaaaac 3420
ugguguugaa ggcuuuugcu cauauaaaca agugccauug aguuucaaau gaccagcaaa 3480
uauauuuaga acccuuccug uuuuaugucu guaccucguc caccccucag guaauaccug 3540
ccucucacag guacagcugu uucuuggaaa uccuccaacc aaauagcagu uuuccuaacu 3600
ugauuagcuu gagcugacag acuguuagaa uacaguucuc uggccacagc ugaugagggc 3660
uuucuguacu gcacacagau uguguacugc accccagucc aggugacugg uacccacucg 3720
aguugugccg ugcacaaccu guccaguaua ugcauguggu ggcccuacug acugguaaug 3780
guuagaggca uuuauggauu uuuagcuuug aggaaaaacc augacuuuua acaaauuuuu 3840
auggguuaua ugccuaaacc cuuaugccac auagugguaa auaauuauga aaaauggucu 3900
guucauaauu gguaggugcc uuuugugagc agggagcaua auuauugguu uauuauggua 3960
auuaugguga uuuuuuaaau aucauguaau guuaaaacgu uuucuaacag uuuacuguug 4020
cuuaucucca agauauuaug gaauuaagaa uuuuuccaga ugaguguuac auagauucuu 4080
ugaauuuagu auaaaaguac ugagaauuaa guuuguacuu ccauaagcuu ggauuuuaaa 4140
cacugauagu aucucaugag uaaugugugu uuugggagag ggagggaugc ugauugauau 4200
uucacauugu augaaauacc auguuugaaa cucauagcaa uaaugcuaug cuguugugau 4260
cccucccaag uucugcauuu aaaauauauu uuuucuuuau aggaauugau guauaccaug 4320
aagucauugu caguuguagu agcucugaug uugaaugaga uaucauguuu uagcauucca 4380
uuuuacugac uaggguagaa gaacacucuu cuuggcuaca uuuggaggau acccagggag 4440
ucuugggugu uccuuaucug gggaagcaaa cauuucacua gucucuuuuu uucauccuuu 4500
aaauuguaaa uuaaggauua cucaagcuca ccauuauuca agauugggac ucgcuuccca 4560
gucgacacuc ugcccugccu gucauugcug caaagagcug cugcuuugcc aaccuaagca 4620
aagaaaauac ggcuucucuu gcauuauuuu cccuuuuggu ugguuuguuu ucuagaagua 4680
cguucagaug cuuuggggaa ugcaauguau gauuugcuag cucucucacc acuuaacuca 4740
cugugaggau aaauaugcau gcuuuuugua auuaacuggu gcuuugaaaa ucuuuuuuaa 4800
gggagaaaaa ucucaaccaa aguuaugcuc auccagacaa gcugaccuuu gaguuaauuu 4860
cagcacaacu cauucuucag ugccucauga cugaaaacaa aaaaaaaaaa aaaaaaaa 4918
<210> 13
<211> 3490
<212> RNA
<213> 智人(homo sapien)
<400> 13
agcgggcugg aagugcgggc uucugcagca gccgaagcug gagcugcuag ggcagcagcg 60
gcuccccugu uguauggaca uucugcaccc gaaacugaua gcugaguccu gaaguuuuau 120
guuaugaaac agaagaacuu ucaucccagc acaugauuug ggaauuacac uuugugacau 180
ggaugaauau gcacugaccc uugguacaau agauguuucu uaucugccac auucaucaga 240
auacaguguu ggucgaugua agcacacaag ugaggaaugg ggugagugug gcuuuagacc 300
caccgucuuc agaucugcaa cuuuaaaaug gaaagaaagc cuaaugaguc ggaaaaggcc 360
auuuguugga agauguuguu acuccugcac uccccagagc ugggacaaau uuuucaacac 420
caguaucccg ucuuuggguu ugcggaaugu uauuuauauc aaugaaacuc acacaagaca 480
ccgcggaugg cuugcaagac gccuuucuua cguucuuuuu auucaagagc gagaugugca 540
uaagggcaug uuugccacca augugacuga aaaugugcug aacagcagua gaguacaaga 600
ggcaauugca gaaguggcug cugaauuaaa cccugauggu ucugcccagc agcaaucaaa 660
agccguuaac aaagugaaaa agaaagcuaa aaggauucuu caagaaaugg uugccacugu 720
cucaccggca augaucagac ugacugggug ggugcugcua aaacuguuca acagcuucuu 780
uuggaacauu caaauucaca aaggucaacu ugagaugguu aaagcugcaa cugagacgaa 840
uuugccgcuu cuguuucuac caguucauag aucccauauu gacuaucugc ugcucacuuu 900
cauucucuuc ugccauaaca ucaaagcacc auacauugcu ucaggcaaua aucucaacau 960
cccaaucuuc aguaccuuga uccauaagcu ugggggcuuc uucauacgac gaaggcucga 1020
ugaaacacca gauggacgga aagauguucu cuauagagcu uugcuccaug ggcauauagu 1080
ugaauuacuu cgacagcagc aauucuugga gaucuuccug gaaggcacac guucuaggag 1140
uggaaaaacc ucuugugcuc gggcaggacu uuugucaguu gugguagaua cucugucuac 1200
caaugucauc ccagacaucu ugauaauacc uguuggaauc uccuaugauc gcauuaucga 1260
aggucacuac aauggugaac aacugggcaa accuaagaag aaugagagcc uguggagugu 1320
agcaagaggu guuauuagaa uguuacgaaa aaacuauggu uguguccgag uggauuuugc 1380
acagccauuu uccuuaaagg aauauuuaga aagccaaagu cagaaaccgg ugucugcucu 1440
acuuucccug gagcaagcgu uguuaccagc uauacuuccu ucaagaccca gugaugcugc 1500
ugaugaaggu agagacacgu ccauuaauga guccagaaau gcaacagaug aaucccuacg 1560
aaggagguug auugcaaauc uggcugagca uauucuauuc acugcuagca aguccugugc 1620
cauuaugucc acacacauug uggcuugccu gcuccucuac agacacaggc agggaauuga 1680
ucucuccaca uuggucgaag acuucuuugu gaugaaagag gaaguccugg cucgugauuu 1740
ugaccugggg uucucaggaa auucagaaga uguaguaaug caugccauac agcugcuggg 1800
aaauuguguc acaaucaccc acacuagcag gaacgaugag uuuuuuauca cccccagcac 1860
aacuguccca ucagucuucg aacucaacuu cuacagcaau gggguacuuc augucuuuau 1920
cauggaggcc aucauagcuu gcagccuuua ugcaguucug aacaagaggg gacugggggg 1980
ucccacuagc accccaccua accugaucag ccaggagcag cuggugcgga aggcggccag 2040
ccugugcuac cuucucucca augaaggcac caucucacug ccuugccaga cauuuuacca 2100
agucugccau gaaacaguag gaaaguuuau ccaguauggc auucuuacag uggcagagca 2160
cgaugaccag gaagauauca guccuagucu ugcugagcag cagugggaca agaagcuucc 2220
agaaccuuug ucuuggagaa gugaugaaga agaugaagac agugacuuug gggaggaaca 2280
gcgagauugc uaccugaagg ugagccaauc caaggagcac cagcaguuua ucaccuucuu 2340
acagagacuc cuugggccuu ugcuggaggc cuacagcucu gcugccaucu uuguucacaa 2400
cuucaguggu ccuguuccag aaccugagua ucugcaaaag uugcacaaau accuaauaac 2460
cagaacagaa agaaauguug caguauaugc ugagagugcc acauauuguc uugugaagaa 2520
ugcugugaaa auguuuaagg auauuggggu uuucaaggag accaaacaaa agagaguguc 2580
uguuuuagaa cugagcagca cuuuucuacc ucaaugcaac cgacaaaaac uucuagaaua 2640
uauucugagu uuuguggugc uguagguaac guguggcacu gcuggcaaau gaaggucaug 2700
agaugaguuc cuuguaggua caagcuucug gcucaagagu ugaaggugcc aucgcagggu 2760
caggccugcc cugucccgaa gugaucuccu ggaagacaag ugccuucucc auccauggau 2820
cugugaucuu cccagcucug caucaacaca gcagccugca gauaacacuu ggggggaccu 2880
cagccucuau ucgcaacuca uaauccguag acuacaagau gaaaucucaa uaaauuauuu 2940
uugaguuuau uaaagauuga cauuuuaagu acaacuuuua aggacuaauu acugugaugg 3000
acacagaaau guagcugugu ucuggaacug aaucuuacau gguauacuua gugcugcugg 3060
guaauuuguu gguauauuau cugguuagug guuaaugcuu ccuuuaaaaa uaauugaguc 3120
auccauucac ucuuuuucag uuuuaucugu caauaguagc uacauuuuua augggagcac 3180
cuuuuauccc aaagugcuuu auaaauugag uggacugaua uauaucacac ccagguauca 3240
cugugcuguc cuuugcuguc agauuuagaa auguuuuuaa gagcuaugug aaaacagaca 3300
auauuaguuu aggucgggaa cugagauauu guaaucaaau aguuaacauc aggaaguuaa 3360
uuuggcuggc aaaauucuag ggaaacuugg ccagaaaacu gguguugaag gcuuuugcuc 3420
auauaaacaa gugccauuga guuucaaaug accagcaaau auauuuagaa cucaaaaaaa 3480
aaaaaaaaaa 3490
<210> 14
<211> 2855
<212> RNA
<213> 智人(homo sapien)
<400> 14
aacuuucauc ccagcacaug auuugggaau uacacuuugu gacauggaug aaucugcacu 60
gacccuuggu acaauagaug uuucuuaucu gccacauuca ucagaauaca guguuggucg 120
auguaagcac acaagugagg aaugggguga guguggcuuu agacccaccg ucuucagauc 180
ugcaacuuua aaauggaaag aaagccuaau gagucggaaa aggccauuug uuggaagaug 240
uuguuacucc ugcacucccc agagcuggga caaauuuuuc aaccccagua ucccgucuuu 300
ggguuugcgg aauguuauuu auaucaauga aacucacaca agacaccgcg gauggcuugc 360
aagacgccuu ucuuacguuc uuuuuauuca agagcgagau gugcauaagg gcauguuugc 420
caccaaugug acugaaaaug ugcugaacag caguagagua caagaggcaa uugcagaagu 480
ggcugcugaa uuaaacccug augguucugc ccagcagcaa ucaaaagccg uuaacaaagu 540
gaaaaagaaa gcuaaaagga uucuucaaga aaugguugcc acugucucac cggcaaugau 600
cagacugacu gggugggugc ugcuaaaacu guucaacagc uucuuuugga acauucaaau 660
ucacaaaggu caacuugaga ugguuaaagc ugcaacugag acgaauuugc cgcuucuguu 720
ucuaccaguu cauagauccc auauugacua ucugcugcuc acuuucauuc ucuucugcca 780
uaacaucaaa gcaccauaca uugcuucagg caauaaucuc aacaucccaa ucuucaguac 840
cuugauccau aagcuugggg gcuucuucau acgacgaagg cucgaugaaa caccagaugg 900
acggaaagau guucucuaua gagcuuugcu ccaugggcau auaguugaau uacuucgaca 960
gcagcaauuc uuggagaucu uccuggaagg cacacguucu aggaguggaa aaaccucuug 1020
ugcucgggca ggacuuuugu caguuguggu agauacucug ucuaccaaug ucaucccaga 1080
caucuugaua auaccuguug gaaucuccua ugaucgcauu aucgaagguc acuacaaugg 1140
ugaacaacug ggcaaaccua agaagaauga gagccugugg aguguagcaa gagguguuac 1200
uagaauguua cgaaaaaacu augguugugu ccgaguggau uuugcacagc cauuuuccuu 1260
aaaggaauau uuagaaagcc aaagucagaa accggugucu gcucuacuuu cccuggagca 1320
agcguuguua ccagcuauac uuccuucaag acccagugau gcugcugaug aagguagaga 1380
cacguccauu aaugagucca gaaaugcaac agaugaaucc cuacgaagga gguugauugc 1440
aaaucuggcu gagcauauuc uauucacugc uagcaagucc ugugccauua uguccacaca 1500
cauuguggcu ugccugcucc ucuacagaca caggcaggga auugaucucu ccacauuggu 1560
cgaagacuuc uuugugauga aagaggaagu ccuggcucgu gauuuugacc ugggguucuc 1620
aggaaauuca gaagauguag uaaugcaugc cauacagcug cugggaaauu gugucacaau 1680
cacccacacu agcaggaacg augaguuuuu uaucaccccc agcacaacug ucccaucagu 1740
cuucgaacuc aacuucuaca gcaauggggu acuucauguc uuuaucaugg aggccaucau 1800
agcuugcagc cuuuaugcag uucugaacaa gaggggacug ggggguccca cuagcacccc 1860
accuaaccug aucagccagg agcagcuggu gcggaaggcg gccagccugu gcuaccuucu 1920
cuccaaugaa ggcaccaucu cacugccuug ccagacauuu uaccaagucu gccaugaaac 1980
aguaggaaag uuuauccagu auggcauucu uacaguggca gagcacgaug accaggaaga 2040
uaucaguccu agucuugcug agcagcagug ggacaagaag cuuccugaac cuuugucuug 2100
gagaagugau gaagaagaug aagacaguga cuuuggggag gaacagcgag auugcuaccu 2160
gaaggugagc caauccaagg agcaccagca guuuaucacc uucuuacaga gacuccuugg 2220
gccuuugcug gaggccuaca gcucugcugc caucuuuguu cacaacuuca gugguccugu 2280
uccagaaccu gaguaucugc aaaaguugca caaauaccua auaaccagaa cagaaagaaa 2340
uguugcagua uaugcugaga gugccacaua uugucuugug aagaaugcug ugaaaauguu 2400
uaaggauauu gggguuuuca aggagaccaa acaaaagaga gugucuguuu uagaacugag 2460
cagcacuuuu cuaccucaau gcaaccgaca aaaacuucua gaauauauuc ugaguuuugu 2520
ggugcuguag guaacgugug gcacugcugg caaaugaagg ucaugagaug aguuccuugu 2580
agguaccagc uucuggcuca agaguugaag gugccgucgc agggucaggc cugcccuguc 2640
ccgaggugau cuccuggaag acaagugccu ucucccucca uggaucugug aucuucccag 2700
cucugcauca acacagcagc cugcagauaa cacuuggggg gaccucagcc ucuauucgca 2760
acucauaauc cguagacuac aagaugaaau cucaauaaau uauuuuugag uuuauuaaag 2820
aggucuuuua aggcaaaaaa aaaaaaaaaa aaaaa 2855
<210> 15
<211> 6372
<212> DNA
<213> 智人(homo sapien)
<400> 15
gcgccactgc agctggcatt ggccgggact ggaagtgcgg gcttctgcag cagccgaagc 60
tggagctgct agggcagcag cggctcccct gttgtatgga cattctgcac ccgaaactga 120
tagctgagtc ctgaagtttt atgttatgaa acagaagaac tttcatccca gcacatgatt 180
tgggaattac actttgtgac atggatgaat ctgcactgac ccttggtaca atagatgttt 240
cttatctgcc acattcatca gaatacagtg ttggtcgatg taagcacaca agtgaggaat 300
ggggtgagtg tggctttaga cccaccatct tcagatctgc aactttaaaa tggaaagaaa 360
gcctaatgag tcggaaaagg ccatttgttg gaagatgttg ttactcctgc actccccaga 420
gctgggacaa atttttcaac cccagtatcc cgtctttggg tttgcggaat gttatttata 480
tcaatgaaac tcacacaaga caccgcggat ggcttgcaag acgcctttct tacgttcttt 540
ttattcaaga gcgagatgtg cataagggca tgtttgccac caatgtgact gaaaatgtgc 600
tgaacagcag tagagtacaa gaggcaattg cagaagtggc tgctgaatta aaccctgatg 660
gttctgccca gcagcaatca aaagccgtta acaaagtgaa aaagaaagct aaaaggattc 720
ttcaagaaat ggttgccact gtctcaccgg caatgatcag actgactggg tgggtgctgc 780
taaaactgtt caacagcttc ttttggaaca ttcaaattca caaaggtcaa cttgagatgg 840
ttaaagctgc aactgagacg aatttgccgc ttctgtttct accagttcat agatcccata 900
ttgactatct gctgctcact ttcattctct tctgccataa catcaaagca ccatacattg 960
cttcaggcaa taatctcaac atcccaatct tcagtacctt gatccataag cttgggggct 1020
tcttcatacg acgaaggctc gatgaaacac cagatggacg gaaagatgtt ctctatagag 1080
ctttgctcca tgggcatata gttgaattac ttcgacagca gcaattcttg gagatcttcc 1140
tggaaggcac acgttctagg agtggaaaaa cctcttgtgc tcgggcagga cttttgtcag 1200
ttgtggtaga tactctgtct accaatgtca tcccagacat cttgataata cctgttggaa 1260
tctcctatga tcgcattatc gaaggtcact acaatggtga acaactgggc aaacctaaga 1320
agaatgagag cctgtggagt gtagcaagag gtgttattag aatgttacga aaaaactatg 1380
gttgtgtccg agtggatttt gcacagccat tttccttaaa ggaatattta gaaagccaaa 1440
gtcagaaacc ggtgtctgct ctactttccc tggagcaagc gttgttacca gctatacttc 1500
cttcaagacc cagtgatgct gctgatgaag gtagagacac gtccattaat gagtccagaa 1560
atgcaacaga tgaatcccta cgaaggaggt tgattgcaaa tctggctgag catattctat 1620
tcactgctag caagtcctgt gccattatgt ccacacacat tgtggcttgc ctgctcctct 1680
acagacacag gcagggaatt gatctctcca cattggtcga agacttcttt gtgatgaaag 1740
aggaagtcct ggctcgtgat tttgacctgg ggttctcagg aaattcagaa gatgtagtaa 1800
tgcatgccat acagctgctg ggaaattgtg tcacaatcac ccacactagc aggaacgatg 1860
agttttttat cacccccagc acaactgtcc catcagtctt cgaactcaac ttctacagca 1920
atggggtact tcatgtcttt atcatggagg ccatcatagc ttgcagcctt tatgcagttc 1980
tgaacaagag gggactgggg ggtcccacta gcaccccacc taacctgatc agccaggagc 2040
agctggtgcg gaaggcggcc agcctgtgct accttctctc caatgaaggc accatctcac 2100
tgccttgcca gacattttac caagtctgcc atgaaacagt aggaaagttt atccagtatg 2160
gcattcttac agtggcagag cacgatgacc aggaagatat cagtcctagt cttgctgagc 2220
agcagtggga caagaagctt ccagaacctt tgtcttggag aagtgatgaa gaagatgaag 2280
acagtgactt tggggaggaa cagcgagatt gctacctgaa ggtgagccaa tccaaggagc 2340
accagcagtt tatcaccttc ttacagagac tccttgggcc tttgctggag gcctacagct 2400
ctgctgccat ctttgttcac aacttcagtg gtcctgttcc agaacctgag tatctgcaaa 2460
agttgcacaa atacctaata accagaacag aaagaaatgt tgcagtatat gctgagagtg 2520
ccacatattg tcttgtgaag aatgctgtga aaatgtttaa ggatattggg gttttcaagg 2580
agaccaaaca aaagagagtg tctgttttag aactgagcag cacttttcta cctcaatgca 2640
accgacaaaa acttctagaa tatattctga gttttgtggt gctgtaggta acgtgtggca 2700
ctgctggcaa atgaaggtca tgagatgagt tccttgtagg taccagcttc tggctcaaga 2760
gttgaaggtg ccatcgcagg gtcaggcctg ccctgtcccg aagtgatctc ctggaagaca 2820
agtgccttct ccctccatgg atctgtgatc ttcccagctc tgcatcaaca cagcagcctg 2880
cagataacac ttggggggac ctcagcctct attcgcaact cataatccgt agactacaag 2940
atgaaatctc aataaattat ttttgagttt attaaagatt gacattttaa gtacaacttt 3000
taaggactaa ttactgtgat ggacacagaa atgtagctgt gttctggaac tgaatcttac 3060
atggtatact tagtgctgct gggtaatttg ttggtatatt atctggttag tggttaatgc 3120
ttcctttaaa aataattgag tcatccattc actctttttc agttttatct gtcaatagta 3180
gctacatttt taatgggagc accttttatc ccaaagtgct ttataaattg agtggactga 3240
tatatatcac acccaggtat cactgtgctg tcctttgctg tcagatttag aaatgttttt 3300
aagagctatg tgaaaacaga caatattagt ttaggtcggg aactgagata ttgtaatcaa 3360
atagttaaca tcaggaagtt aatttggctg gcaaaattct agggaaactt ggccagaaaa 3420
ctggtgttga aggcttttgc tcatataaac aagtgccatt gagtttcaaa tgaccagcaa 3480
atatatttag aacccttcct gttttatgtc tgtacctcgt ccacccctca ggtaatacct 3540
gcctctcaca ggtacagctg tttcttggaa atcctccaac caaatagcag ttttcctaac 3600
ttgattagct tgagctgaca gactgttaga atacagttct ctggccacag ctgatgaggg 3660
ctttctgtac tgcacacaga ttgtgtactg caccccagtc caggtgactg gtacccactc 3720
gagttgtgcc gtgcacaacc tgtccagtat atgcatgtgg tggccctact gactggtaat 3780
ggttagaggc atttatggat ttttagcttt gaggaaaaac catgactttt aacaaatttt 3840
tatgggttat atgcctaaac ccttatgcca catagtggta aataattatg aaaaatggtc 3900
tgttcataat tggtaggtgc cttttgtgag cagggagcat aattattggt ttattatggt 3960
aattatggtg attttttaaa tatcatgtaa tgttaaaacg ttttctaaca gtttactgtt 4020
gcttatctcc aagatattat ggaattaaga atttttccag atgagtgtta catagattct 4080
ttgaatttag tataaaagta ctgagaatta agtttgtact tccataagct tggattttaa 4140
acactgatag tatctcatga gtaatgtgtg ttttgggaga gggagggatg ctgattgata 4200
tttcacattg tatgaaatac catgtttgaa actcatagca ataatgctat gctgttgtga 4260
tccctctcaa gttctgcatt taaaatatat tttttcttta taggaattga tgtataccat 4320
gaagtcattg tcagttgtag tagctctgat gttgaatgag atatcatgtt ttagcattcc 4380
attttactga ctagggtaga agaacacttt tcttggctac atttggagga tacccaggga 4440
gtcttgggtg ttccttatct ggggaagcaa acatttcact agtctctttt tttcatcctt 4500
taaattgtaa attaaggatt actcaagctc accattattc aagattggga ctcgcttccc 4560
agtcgacact ctgccctgcc tgtcattgct gcaaagagct gctgctttgc caacctaagc 4620
aaagaaaata cggcttctct tgcattattt tcccttttgg ttggtttgtt ttctagaagt 4680
acgttcagat gctttgggga atgcaatgta tgatttgcta gctctctcac cacttaactc 4740
actgtgagga taaatatgca tgctttttgt aattaactgg tgctttgaaa atctttttta 4800
agggagaaaa atctcaacca aagttatgct catccagaca agctgacctt tgagttaatt 4860
tcagcacaac tcattcttca gtgcctcatg actgaaaaca aaaaacaaaa aaacgaaagc 4920
atcttcacaa tgaagcttcc agatagcacc gttttgctaa aagatacatt ctcattgttt 4980
tccaacagtg atggcttcca cataaggtta aacaaactag gtgcttgtaa ataatttatt 5040
acagtttact ctatcgcatt tctgtaacat gaaatgcatg cccttcttca ggggaagact 5100
gtggtcaagt taaaaaaaaa aaacaatatt aaacaacatg aaactgcagt ctgtttttga 5160
aaatgagaat gtcctaagtg attcagaaga gaggagggaa gttgtgcact ctgaaaatgc 5220
atgaaaaaca aaggcaaaaa ctagtgggaa atgtgtagaa ctgttaactg agatggcttc 5280
gagtcttcct tctggaatct gttaaatttc acaaagtcat gagggtaaat ggagaaaata 5340
tttctgggat tacaatgaat gtaagcccaa attgtggaat tgccagtaac ctggatgggg 5400
aaaagcattt cccatagcac tccatgtaat atgagtgctc tgtgagatgt tcatcagtgt 5460
tttatagaaa tggtgttgct gggaaaccaa gtttgcacct ggaaacttac aatgcacttt 5520
agcgcagtaa gggcttggca tccggtagtg aaaaactgtc taacccagca ttgcccaaac 5580
tattttgaca ccaggacctt tttctccttt gggatactta tgaacctctc actaatgtcc 5640
tgtggagaac attttgggaa acactatgtt agatagttct ttaaggagac aaaacggtaa 5700
tgaacagata gcactggggc agaatatgca tgcattttgt aacgtccagt gtggcgttga 5760
atagatgtgt atttcctccc ctgcagaaaa taagcacaga aaattataat gtaggtgatc 5820
ggagctcttt cctttgatag agagaacagc cccaatgatc ctggcttttt cactgaacgt 5880
atcagaatac atggatgaat tggggtaaat aaggttttaa ttcagatcta gaagaaagta 5940
ttgtacgttt gaatgcagat ttttatccac agatagttgt agtgtttaga catgacagga 6000
cctatcgttg aggtttctaa gacttactat gggctgtaaa cctgtttttt aaaactattt 6060
tagaaacctg agacttgccg tctggcattt tagtttaata caaactaatg attgcatttg 6120
aaagagattc ttgaccttat ttctaaacgt ctagagctct gaaatgtctt gatggaaggt 6180
attaaactat ttgcctgttg tacaaagaaa tgttaagact cgtgaaaaga attactataa 6240
ggtactgtga aataactgcg attttgtgag caaaacatac ttggaaatgc tgattgattt 6300
ttatgcttgt tagtgtattg caagaaacac agaaaatgta gttttgtttt aataaaccaa 6360
aaattgaaca ta 6372
<210> 16
<211> 5664
<212> DNA
<213> 智人(homo sapien)
<400> 16
gaagctggag ctgctagggt gcgaactgcc agggcaggca gcagcggctc ccctgttgta 60
tggacattct gcacccgaaa ctgatagctg agtcctgaag ttttatgtta tgaaacagaa 120
gaactttcat cccagcacat gatttgggaa ttacactttg tgacatggat gaatctgcac 180
tgacccttgg tacaatagat gtttcttatc tgccacattc atcagaatac agtgttggtc 240
gatgtaagca cacaagtgag gaatggggtg agtgtggctt tagacccacc atcttcagat 300
ctgcaacttt aaaatggaaa gaaagcctaa tgagtcggaa aaggccattt gttggaagat 360
gttgttactc ctgcactccc cagagctggg acaaattttt caaccccagt atcccgtctt 420
tgggtttgcg gaatgttatt tatatcaatg aaactcacac aagacaccgc ggatggcttg 480
caagacgcct ttcttacgtt ctttttattc aagagcgaga tgtgcataag ggcatgtttg 540
ccaccaatgt gactgaaaat gtgctgaaca gcagtagagt acaagaggca attgcagaag 600
tggctgctga attaaaccct gatggttctg cccagcagca atcaaaagcc gttaacaaag 660
tgaaaaagaa agctaaaagg attcttcaag aaatggttgc cactgtctca ccggcaatga 720
tcagactgac tgggtgggtg ctgctaaaac tgttcaacag cttcttttgg aacattcaaa 780
ttcacaaagg tcaacttgag atggttaaag ctgcaactga gacgaatttg ccgcttctgt 840
ttctaccagt tcatagatcc catattgact atctgctgct cactttcatt ctcttctgcc 900
ataacatcaa agcaccatac attgcttcag gcaataatct caacatccca atcttcagta 960
ccttgatcca taagcttggg ggcttcttca tacgacgaag gctcgatgaa acaccagatg 1020
gacggaaaga tgttctctat agagctttgc tccatgggca tatagttgaa ttacttcgac 1080
agcagcaatt cttggagatc ttcctggaag gcacacgttc taggagtgga aaaacctctt 1140
gtgctcgggc aggacttttg tcagttgtgg tagatactct gtctaccaat gtcatcccag 1200
acatcttgat aatacctgtt ggaatctcct atgatcgcat tatcgaaggt cactacaatg 1260
gtgaacaact gggcaaacct aagaagaatg agagcctgtg gagtgtagca agaggtgtta 1320
ttagaatgtt acgaaaaaac tatggttgtg tccgagtgga ttttgcacag ccattttcct 1380
taaaggaata tttagaaagc caaagtcaga aaccggtgtc tgctctactt tccctggagc 1440
aagcgttgtt accagctata cttccttcaa gacccagtga tgctgctgat gaaggtagag 1500
acacgtccat taatgagtcc agaaatgcaa cagatgaatc cctacgaagg aggttgattg 1560
caaatctggc tgagcatatt ctattcactg ctagcaagtc ctgtgccatt atgtccacac 1620
acattgtggc ttgcctgctc ctctacagac acaggcaggg aattgatctc tccacattgg 1680
tcgaagactt ctttgtgatg aaagaggaag tcctggctcg tgattttgac ctggggttct 1740
caggaaattc agaagatgta gtaatgcatg ccatacagct gctgggaaat tgtgtcacaa 1800
tcacccacac tagcaggaac gatgagtttt ttatcacccc cagcacaact gtcccatcag 1860
tcttcgaact caacttctac agcaatgggg tacttcatgt ctttatcatg gaggccatca 1920
tagcttgcag cctttatgca gttctgaaca agaggggact ggggggtccc actagcaccc 1980
cacctaacct gatcagccag gagcagctgg tgcggaaggc ggccagcctg tgctaccttc 2040
tctccaatga aggcaccatc tcactgcctt gccagacatt ttaccaagtc tgccatgaaa 2100
cagtaggaaa gtttatccag tatggcattc ttacagtggc agagcacgat gaccaggaag 2160
atatcagtcc tagtcttgct gagcagcagt gggacaagaa gcttccagaa cctttgtctt 2220
ggagaagtga tgaagaagat gaagacagtg actttgggga ggaacagcga gattgctacc 2280
tgaaggtact tgggtgaaga attctggtgg atattacagg gatatgttga ggtttatgct 2340
gcagtgagat cagctggagt cctggtgatg tcttcttatc taaagaatcc cccaactagc 2400
tctggtacct tctgtgtggt aaagacactc aaactgtttg agttgaatta atagcatttt 2460
aagtagaaaa ggaaaggaga gtctgaaaag tcaggaagat gaatgtcata ggtgagactt 2520
tcaccatcct tttatgaaat acacaggtgc atacctgttt acctacacct gcacccctca 2580
tgaggcagca gttttgctat tgagctgcca ctgacctggc tgctcttttt gagtcactct 2640
tgctgtccct cccaaaattt catatattaa gctctttgct gtcaattaaa acaaatacca 2700
ttataggaga aaattgagat taaaaaaaaa gtccctgatt tagaaaaatc aattttgtct 2760
aatttataat tttagaactt agtaataatg acccgtcttt tctgaatact ctaagaggat 2820
tactcttttt tgacatttag aaattgtctt ctttttcact tgggtggtat tagtttagtt 2880
tcaagatggg gcagtgatct tgctttcaca ctccagaggg gcttgaccga accagtgtgt 2940
tttgggtagg tacagtgaga gcctctcggc cataaagcac cgccgtcaca gtggccatca 3000
ttccccacag tgctggactg tgggcaaagg ccatttaggg gaggcaggga ataggtgctg 3060
cagaaggagt gagataatct tggtggtctc ccattggtct ttctgcagac ttgagtgact 3120
gttgagccca ggcttcaaac catggagggc ctggtcttag gagcggctat ttttagtgat 3180
gacagcgtat cacaagtagg gcattcattt atgaaaattt cttctaggtg gctgttcaat 3240
gaacacaagc ctcaaatacc ataaaaaagt gaatgattac aataaagaat gtgtttgaaa 3300
gccagcagtt gtttccagca gagattctct gcatgagggg cagggggccg ctttcatgta 3360
gtgctgatgt gagtggccat cttctcacgt tactggctct ccagagaaag tcctctgtcc 3420
acttgccttg tgtctcttgt cccttcctca tgacttcatc tcctgctttt gcacactcag 3480
gtgagccaat ccaaggagca ccagcagttt atcaccttct tacagagact ccttgggcct 3540
ttgctggagg cctacagctc tgctgccatc tttgttcaca acttcagtgg tcctgttcca 3600
gaacctgagt atctgcaaaa gttgcacaaa tacctaataa ccagaacaga aagaaatgtt 3660
gcagtatatg gtatgttaag tcactattta ttcttttaaa atcttttttt tttttttgga 3720
tttcagaaat ttgctaattg tagaaaattg gaaaaatgca aacttatcct gacctctaac 3780
accgtagagt attactatta tcttctttgg catgttatat aagttgaatg atacagttat 3840
acactcttac atctggcttt tttcacgtaa cgttattttt gagattcata catgttgcat 3900
atagttgttc ctttgttctt gttgtgtagt gttccattgt ataaatattt accacatttt 3960
attcattctg ctgttgatgg atatttgggt tgttttcagt tcacagctgc tttgaacagt 4020
gttgctatga gcatatttga atatgtcttt tggtgaatat ctgtgcccct atatacagca 4080
tgtatgtggg aacagaattg cctggttgta ggctctgggt atattcggct ttggtagata 4140
ccaccaaaca gtttccaagg gattatacct acttgtactc ccacaacagt gtgtgtttca 4200
cttgctgcac atcttggcca gcgctccgtc ttctttgttt taggaggtgt gattggggtg 4260
ggagtactat tttatacagt tgtagtttgg agctgaaact acttgaatca ctttttagag 4320
ccaaaaggaa tctaatctaa tcacctcatt ttatagttga ggaaaatacc ccaggtcaca 4380
ctgctaatta atgggtaatc tcgggatcag aattcttgtt tcctaacctc gaggcctgtg 4440
ctttctctgg ttccactgat gtacaatcat ctgtgtacca ctgggtagct taaagaatat 4500
ttatacacta tctcatttga ttctcacaac agtcctggaa aatggatgtt ttaggtattt 4560
ctacttccct ctgttctccc tatttctctc tctacaccct cttttctttc cccttccctt 4620
tcttatttac ctcaatatag gacaaagtag gtgtaagcaa agtaggttta acagcaagtc 4680
atctgagaac tcacaggttg ccagtggtgg aagtggggcc ccacccttgt ctgctgactt 4740
gccctcattc tcttcctagc tccccatact ttcttactgt ggctgctggg attgtcatga 4800
tttgttgagc gtaaccattt gacagggttt tattctctct cttcagctga gagtgccaca 4860
tattgtcttg tgaagaatgc tgtgaaaatg tttaaggata ttggggtagg tgtccaccat 4920
ttatggtata aaagctatct caacttctgt tctctttaga tctagtctgt ttgagctacc 4980
tttgtggtgg ggtggacccc gagagaagca gtttctgctg gcttaatgat aaaggcattt 5040
ttgggaacgg ggcatgtagg atgggttggg ctatgttgaa ggtgaagccc atcagtgtag 5100
atttatttga atgttctgga attttactgg tttcacattt attcccaagc tgctatatat 5160
aactggtatc aatatgtttc aaggtgctac aggttgaata tcccttatcc aaaatgttgg 5220
gaccagaaat gttttggatt tcagattttt ttgggatttt ggaatatgtg cattagactt 5280
acaggttgag cgtctctaat ccaaaaccca aaatgctctg atgagcatgt cttttgagca 5340
tcatattgat gttcaaaatc tttcagattt tggagtactt cagatttttg attttgggat 5400
taggaccaca atcttggctc ttaattattc catatgattt ttagttactt tcttgtattt 5460
ttacaagaat ttctagaagt atcctcaggt gtcctttacc ttcatgattc atggggaatg 5520
taagttctat agagatacta gcggcctttt gtgagggact gtttgtgact ttattctaag 5580
tcattttaga gtatagttat gttggttgaa attttagaat atagttaatg ttggttgaac 5640
tccatcaaaa caaaaaaaaa aaaa 5664
<210> 17
<211> 6368
<212> DNA
<213> 智人(homo sapien)
<400> 17
gcgccactgc agctggcatt ggccgggact ggaagtgcgg gcttctgcag cagccgaagc 60
tggagctgct aggcagcggc tcccctgttg tatggacatt ctgcacccga aactgatagc 120
tgagtcctga agttttatgt tatgaaacag aagaactttc atcccagcac atgatttggg 180
aattacactt tgtgacatgg atgaatctgc actgaccctt ggtacaatag atgtttctta 240
tctgccacat tcatcagaat acagtgttgg tcgatgtaag cacacaagtg aggaatgggg 300
tgagtgtggc tttagaccca ccatcttcag atctgcaact ttaaaatgga aagaaagcct 360
aatgagtcgg aaaaggccat ttgttggaag atgttgttac tcctgcactc cccagagctg 420
ggacaaattt ttcaacccca gtatcccgtc tttgggtttg cggaatgtta tttatatcaa 480
tgaaactcac acaagacacc gcggatggct tgcaagacgc ctttcttacg ttctttttat 540
tcaagagcga gatgtgcata agggcatgtt tgccaccaat gtgactgaaa atgtgctgaa 600
cagcagtaga gtacaagagg caattgcaga agtggctgct gaattaaacc ctgatggttc 660
tgcccagcag caatcaaaag ccgttaacaa agtgaaaaag aaagctaaaa ggattcttca 720
agaaatggtt gccactgtct caccggcaat gatcagactg actgggtggg tgctgctaaa 780
actgttcaac agcttctttt ggaacattca aattcacaaa ggtcaacttg agatggttaa 840
agctgcaact gagacgaatt tgccgcttct gtttctacca gttcatagat cccatattga 900
ctatctgctg ctcactttca ttctcttctg ccataacatc aaagcaccat acattgcttc 960
aggcaataat ctcaacatcc caatcttcag taccttgatc cataagcttg ggggcttctt 1020
catacgacga aggctcgatg aaacaccaga tggacggaaa gatgttctct atagagcttt 1080
gctccatggg catatagttg aattacttcg acagcagcaa ttcttggaga tcttcctgga 1140
aggcacacgt tctaggagtg gaaaaacctc ttgtgctcgg gcaggacttt tgtcagttgt 1200
ggtagatact ctgtctacca atgtcatccc agacatcttg ataatacctg ttggaatctc 1260
ctatgatcgc attatcgaag gtcactacaa tggtgaacaa ctgggcaaac ctaagaagaa 1320
tgagagcctg tggagtgtag caagaggtgt tattagaatg ttacgaaaaa actatggttg 1380
tgtccgagtg gattttgcac agccattttc cttaaaggaa tatttagaaa gccaaagtca 1440
gaaaccggtg tctgctctac tttccctgga gcaagcgttg ttaccagcta tacttccttc 1500
aagacccagt gatgctgctg atgaaggtag agacacgtcc attaatgagt ccagaaatgc 1560
aacagatgaa tccctacgaa ggaggttgat tgcaaatctg gctgagcata ttctattcac 1620
tgctagcaag tcctgtgcca ttatgtccac acacattgtg gcttgcctgc tcctctacag 1680
acacaggcag ggaattgatc tctccacatt ggtcgaagac ttctttgtga tgaaagagga 1740
agtcctggct cgtgattttg acctggggtt ctcaggaaat tcagaagatg tagtaatgca 1800
tgccatacag ctgctgggaa attgtgtcac aatcacccac actagcagga acgatgagtt 1860
ttttatcacc cccagcacaa ctgtcccatc agtcttcgaa ctcaacttct acagcaatgg 1920
ggtacttcat gtctttatca tggaggccat catagcttgc agcctttatg cagttctgaa 1980
caagagggga ctggggggtc ccactagcac cccacctaac ctgatcagcc aggagcagct 2040
ggtgcggaag gcggccagcc tgtgctacct tctctccaat gaaggcacca tctcactgcc 2100
ttgccagaca ttttaccaag tctgccatga aacagtagga aagtttatcc agtatggcat 2160
tcttacagtg gcagagcacg atgaccagga agatatcagt cctagtcttg ctgagcagca 2220
gtgggacaag aagcttccag aacctttgtc ttggagaagt gatgaagaag atgaagacag 2280
tgactttggg gaggaacagc gagattgcta cctgaaggtg agccaatcca aggagcacca 2340
gcagtttatc accttcttac agagactcct tgggcctttg ctggaggcct acagctctgc 2400
tgccatcttt gttcacaact tcagtggtcc tgttccagaa cctgagtatc tgcaaaagtt 2460
gcacaaatac ctaataacca gaacagaaag aaatgttgca gtatatgctg agagtgccac 2520
atattgtctt gtgaagaatg ctgtgaaaat gtttaaggat attggggttt tcaaggagac 2580
caaacaaaag agagtgtctg ttttagaact gagcagcact tttctacctc aatgcaaccg 2640
acaaaaactt ctagaatata ttctgagttt tgtggtgctg taggtaacgt gtggcactgc 2700
tggcaaatga aggtcatgag atgagttcct tgtaggtacc agcttctggc tcaagagttg 2760
aaggtgccat cgcagggtca ggcctgccct gtcccgaagt gatctcctgg aagacaagtg 2820
ccttctccct ccatggatct gtgatcttcc cagctctgca tcaacacagc agcctgcaga 2880
taacacttgg ggggacctca gcctctattc gcaactcata atccgtagac tacaagatga 2940
aatctcaata aattattttt gagtttatta aagattgaca ttttaagtac aacttttaag 3000
gactaattac tgtgatggac acagaaatgt agctgtgttc tggaactgaa tcttacatgg 3060
tatacttagt gctgctgggt aatttgttgg tatattatct ggttagtggt taatgcttcc 3120
tttaaaaata attgagtcat ccattcactc tttttcagtt ttatctgtca atagtagcta 3180
catttttaat gggagcacct tttatcccaa agtgctttat aaattgagtg gactgatata 3240
tatcacaccc aggtatcact gtgctgtcct ttgctgtcag atttagaaat gtttttaaga 3300
gctatgtgaa aacagacaat attagtttag gtcgggaact gagatattgt aatcaaatag 3360
ttaacatcag gaagttaatt tggctggcaa aattctaggg aaacttggcc agaaaactgg 3420
tgttgaaggc ttttgctcat ataaacaagt gccattgagt ttcaaatgac cagcaaatat 3480
atttagaacc cttcctgttt tatgtctgta cctcgtccac ccctcaggta atacctgcct 3540
ctcacaggta cagctgtttc ttggaaatcc tccaaccaaa tagcagtttt cctaacttga 3600
ttagcttgag ctgacagact gttagaatac agttctctgg ccacagctga tgagggcttt 3660
ctgtactgca cacagattgt gtactgcacc ccagtccagg tgactggtac ccactcgagt 3720
tgtgccgtgc acaacctgtc cagtatatgc atgtggtggc cctactgact ggtaatggtt 3780
agaggcattt atggattttt agctttgagg aaaaaccatg acttttaaca aatttttatg 3840
ggttatatgc ctaaaccctt atgccacata gtggtaaata attatgaaaa atggtctgtt 3900
cataattggt aggtgccttt tgtgagcagg gagcataatt attggtttat tatggtaatt 3960
atggtgattt tttaaatatc atgtaatgtt aaaacgtttt ctaacagttt actgttgctt 4020
atctccaaga tattatggaa ttaagaattt ttccagatga gtgttacata gattctttga 4080
atttagtata aaagtactga gaattaagtt tgtacttcca taagcttgga ttttaaacac 4140
tgatagtatc tcatgagtaa tgtgtgtttt gggagaggga gggatgctga ttgatatttc 4200
acattgtatg aaataccatg tttgaaactc atagcaataa tgctatgctg ttgtgatccc 4260
tctcaagttc tgcatttaaa atatattttt tctttatagg aattgatgta taccatgaag 4320
tcattgtcag ttgtagtagc tctgatgttg aatgagatat catgttttag cattccattt 4380
tactgactag ggtagaagaa cacttttctt ggctacattt ggaggatacc cagggagtct 4440
tgggtgttcc ttatctgggg aagcaaacat ttcactagtc tctttttttc atcctttaaa 4500
ttgtaaatta aggattactc aagctcacca ttattcaaga ttgggactcg cttcccagtc 4560
gacactctgc cctgcctgtc attgctgcaa agagctgctg ctttgccaac ctaagcaaag 4620
aaaatacggc ttctcttgca ttattttccc ttttggttgg tttgttttct agaagtacgt 4680
tcagatgctt tggggaatgc aatgtatgat ttgctagctc tctcaccact taactcactg 4740
tgaggataaa tatgcatgct ttttgtaatt aactggtgct ttgaaaatct tttttaaggg 4800
agaaaaatct caaccaaagt tatgctcatc cagacaagct gacctttgag ttaatttcag 4860
cacaactcat tcttcagtgc ctcatgactg aaaacaaaaa acaaaaaaac gaaagcatct 4920
tcacaatgaa gcttccagat agcaccgttt tgctaaaaga tacattctca ttgttttcca 4980
acagtgatgg cttccacata aggttaaaca aactaggtgc ttgtaaataa tttattacag 5040
tttactctat cgcatttctg taacatgaaa tgcatgccct tcttcagggg aagactgtgg 5100
tcaagttaaa aaaaaaaaac aatattaaac aacatgaaac tgcagtctgt ttttgaaaat 5160
gagaatgtcc taagtgattc agaagagagg agggaagttg tgcactctga aaatgcatga 5220
aaaacaaagg caaaaactag tgggaaatgt gtagaactgt taactgagat ggcttcgagt 5280
cttccttctg gaatctgtta aatttcacaa agtcatgagg gtaaatggag aaaatatttc 5340
tgggattaca atgaatgtaa gcccaaattg tggaattgcc agtaacctgg atggggaaaa 5400
gcatttccca tagcactcca tgtaatatga gtgctctgtg agatgttcat cagtgtttta 5460
tagaaatggt gttgctggga aaccaagttt gcacctggaa acttacaatg cactttagcg 5520
cagtaagggc ttggcatccg gtagtgaaaa actgtctaac ccagcattgc ccaaactatt 5580
ttgacaccag gacctttttc tcctttggga tacttatgaa cctctcacta atgtcctgtg 5640
gagaacattt tgggaaacac tatgttagat agttctttaa ggagacaaaa cggtaatgaa 5700
cagatagcac tggggcagaa tatgcatgca ttttgtaacg tccagtgtgg cgttgaatag 5760
atgtgtattt cctcccctgc agaaaataag cacagaaaat tataatgtag gtgatcggag 5820
ctctttcctt tgatagagag aacagcccca atgatcctgg ctttttcact gaacgtatca 5880
gaatacatgg atgaattggg gtaaataagg ttttaattca gatctagaag aaagtattgt 5940
acgtttgaat gcagattttt atccacagat agttgtagtg tttagacatg acaggaccta 6000
tcgttgaggt ttctaagact tactatgggc tgtaaacctg ttttttaaaa ctattttaga 6060
aacctgagac ttgccgtctg gcattttagt ttaatacaaa ctaatgattg catttgaaag 6120
agattcttga ccttatttct aaacgtctag agctctgaaa tgtcttgatg gaaggtatta 6180
aactatttgc ctgttgtaca aagaaatgtt aagactcgtg aaaagaatta ctataaggta 6240
ctgtgaaata actgcgattt tgtgagcaaa acatacttgg aaatgctgat tgatttttat 6300
gcttgttagt gtattgcaag aaacacagaa aatgtagttt tgttttaata aaccaaaaat 6360
tgaacata 6368
<210> 18
<211> 4918
<212> DNA
<213> 智人(homo sapien)
<400> 18
ggccactgca gctggcattg gccgggactg gaagtgcggg cttctgcagc agccgaagct 60
ggagctgcta gggcagcagc ggctcccctg ttgtatggac attctgcacc cgaaactgat 120
agctgagtcc tgaagtttta tgttatgaaa cagaagaact ttcatcccag cacatgattt 180
gggaattaca ctttgtgaca tggatgaatc tgcactgacc cttggtacaa tagatgtttc 240
ttatctgcca cattcatcag aatacagtgt tggtcgatgt aagcacacaa gtgaggaatg 300
gggtgagtgt ggctttagac ccaccatctt cagatctgca actttaaaat ggaaagaaag 360
cctaatgagt cggaaaaggc catttgttgg aagatgttgt tactcctgca ctccccagag 420
ctgggacaaa tttttcaacc ccagtatccc gtctttgggt ttgcggaatg ttatttatat 480
caatgaaact cacacaagac accgcggatg gcttgcaaga cgcctttctt acgttctttt 540
tattcaagag cgagatgtgc ataagggcat gtttgccacc aatgtgactg aaaatgtgct 600
gaacagcagt agagtacaag aggcaattgc agaagtggct gctgaattaa accctgatgg 660
ttctgcccag cagcaatcaa aagccgttaa caaagtgaaa aagaaagcta aaaggattct 720
tcaagaaatg gttgccactg tctcaccggc aatgatcaga ctgactgggt gggtgctgct 780
aaaactgttc aacagcttct tttggaactt tcaaattcac aaaggtcaac ttgagatggt 840
taaagctgca actgagacga atttgccgct tctgtttcta ccagttcata gatcccatat 900
tgactatctg ctgctcactt tcattctctt ctgccataac atcaaagcac catacattgc 960
ttcaggcaat aatctcaaca tcccaatctt cagtaccttg atccataagc ttgggggctt 1020
cttcatacga cgaaggctcg atgaaacacc agatggacgg aaagatgttc tctatagagc 1080
tttgctccat gggcatatag ttgaattact tcgacagcag caattcttgg agatcttcct 1140
ggaaggcaca cgttctagga gtggaaaaac ctcttgtgct cgggcaggac ttttgtcagt 1200
tgtggtagat actctgtcta ccaatgtcat cccagacatc ttgataatac ctgttggaat 1260
ctcctatgat cgcattatcg aaggtcacta caatggtgaa caactgggca aacctaagaa 1320
gaatgagagc ctgtggagtg tagcaagagg tgttattaga atgttacgaa aaaactatgg 1380
ttgtgtccga gtggattttg cacagccatt ttccttaaag gaatatttag aaagccaaag 1440
tcagaaaccg gtgtctgctc tactttccct ggagcaagcg ttgttaccag ctatacttcc 1500
ttcaagaccc agtgatgctg ctgatgaagg tagagacacg tccattaatg agtccagaaa 1560
tgcaacagat gaatccctac gaaggaggtt gattgcaaat ctggctgagc atattctatt 1620
cactgctagc aagtcctgtg ccattatgtc cacacacatt gtggcttgcc tgctcctcta 1680
cagacacagg cagggaattg atctctccac attggtcgaa gacttctttg tgatgaaaga 1740
ggaagtcctg gctcgtgatt ttgacctggg gttctcagga aattcagaag atgtagtaat 1800
gcatgccata cagctgctgg gaaattgtgt cacaatcacc cacactagca ggaacgatga 1860
gttttttatc acccccagca caactgtccc atcagtcttc gaactcaact tctacagcaa 1920
tggggtactt catgtcttta tcatggaggc catcatagct tgcagccttt atgcagttct 1980
gaacaagagg ggactggggg gtcccactag caccccacct aacctgatca gccaggagca 2040
gctggtgcgg aaggcggcca gcctgtgcta ccttctctcc aatgaaggca ccatctcact 2100
gccttgccag acattttacc aagtctgcca tgaaacagta ggaaagttta tccggtatgg 2160
cattcttaca gtggcagagc acgatgacca ggaagatatc agtcctagtc ttgctgagca 2220
gcagtgggac aagaagcttc cagaaccttt gtcttggaga agtgatgaag aagatgaaga 2280
cagtgacttt ggggaggaac agcgagattg ctacctgaag gtgagccaat ccaaggagca 2340
ccagcagttt atcaccttct tacagagact ccttgggcct ttgctggagg cctacagctc 2400
tgctgccatc tttgttcaca acttcagtgg tcctgttcca gaacctgagt atctgcaaaa 2460
gttgcacaaa tacctaataa ccagaacaga aagaaatgtt gcagtatatg ctgagagtgc 2520
cacatattgt cttgtgaaga atgctgtgaa aatgtttaag gatattgggg ttttcaagga 2580
gaccaaacaa aagagagtgt ctgttttaga actgagcagc acttttctac ctcaatgcaa 2640
ccgacaaaaa cttctagaat atattctgag ttttgtggtg ctgtaggtaa cgtgtggcac 2700
tgctggcaaa tgaaggtcat gagatgagtt ccttgtaggt accagcttct ggctcaagag 2760
ttgaaggtgc catcgcaggg tcaggcctgc cctgtcccga agtgatctcc tggaagacaa 2820
gtgccttctc cctccatgga tctgtgatct tcccagctct gcatcaacac agcagcctgc 2880
agataacact tggggggacc tcagcctcta ttcgcaactc ataatccgta gactacaaga 2940
tgaaatctca ataaattatt tttgagttta ttaaagattg acattttaag tacaactttt 3000
aaggactaat tactgtgatg gacacagaaa tgtagctgtg ttctggaact gaatcttaca 3060
tggtatactt agtgctgctg ggtaatttgt tggtatatta tctggttagt ggttaatgct 3120
tcctttaaaa ataattgagt catccattca ctctttttca gttttatctg tcaatagtag 3180
ctacattttt aatgggagca ccttttatcc caaagtgctt tataaattga gtggactgat 3240
atatatcaca cccaggtatc actgtgctgt cctttgctgt cagatttaga aatgttttta 3300
agagctatgt gaaaacagac aatattagtt taggtcggga actgagatat tgtaatcaaa 3360
tagttaacat caggaagtta atttggctgg caaaattcta gggaaacttg gccagaaaac 3420
tggtgttgaa ggcttttgct catataaaca agtgccattg agtttcaaat gaccagcaaa 3480
tatatttaga acccttcctg ttttatgtct gtacctcgtc cacccctcag gtaatacctg 3540
cctctcacag gtacagctgt ttcttggaaa tcctccaacc aaatagcagt tttcctaact 3600
tgattagctt gagctgacag actgttagaa tacagttctc tggccacagc tgatgagggc 3660
tttctgtact gcacacagat tgtgtactgc accccagtcc aggtgactgg tacccactcg 3720
agttgtgccg tgcacaacct gtccagtata tgcatgtggt ggccctactg actggtaatg 3780
gttagaggca tttatggatt tttagctttg aggaaaaacc atgactttta acaaattttt 3840
atgggttata tgcctaaacc cttatgccac atagtggtaa ataattatga aaaatggtct 3900
gttcataatt ggtaggtgcc ttttgtgagc agggagcata attattggtt tattatggta 3960
attatggtga ttttttaaat atcatgtaat gttaaaacgt tttctaacag tttactgttg 4020
cttatctcca agatattatg gaattaagaa tttttccaga tgagtgttac atagattctt 4080
tgaatttagt ataaaagtac tgagaattaa gtttgtactt ccataagctt ggattttaaa 4140
cactgatagt atctcatgag taatgtgtgt tttgggagag ggagggatgc tgattgatat 4200
ttcacattgt atgaaatacc atgtttgaaa ctcatagcaa taatgctatg ctgttgtgat 4260
ccctcccaag ttctgcattt aaaatatatt ttttctttat aggaattgat gtataccatg 4320
aagtcattgt cagttgtagt agctctgatg ttgaatgaga tatcatgttt tagcattcca 4380
ttttactgac tagggtagaa gaacactctt cttggctaca tttggaggat acccagggag 4440
tcttgggtgt tccttatctg gggaagcaaa catttcacta gtctcttttt ttcatccttt 4500
aaattgtaaa ttaaggatta ctcaagctca ccattattca agattgggac tcgcttccca 4560
gtcgacactc tgccctgcct gtcattgctg caaagagctg ctgctttgcc aacctaagca 4620
aagaaaatac ggcttctctt gcattatttt cccttttggt tggtttgttt tctagaagta 4680
cgttcagatg ctttggggaa tgcaatgtat gatttgctag ctctctcacc acttaactca 4740
ctgtgaggat aaatatgcat gctttttgta attaactggt gctttgaaaa tcttttttaa 4800
gggagaaaaa tctcaaccaa agttatgctc atccagacaa gctgaccttt gagttaattt 4860
cagcacaact cattcttcag tgcctcatga ctgaaaacaa aaaaaaaaaa aaaaaaaa 4918
<210> 19
<211> 3490
<212> DNA
<213> 智人(homo sapien)
<400> 19
agcgggctgg aagtgcgggc ttctgcagca gccgaagctg gagctgctag ggcagcagcg 60
gctcccctgt tgtatggaca ttctgcaccc gaaactgata gctgagtcct gaagttttat 120
gttatgaaac agaagaactt tcatcccagc acatgatttg ggaattacac tttgtgacat 180
ggatgaatat gcactgaccc ttggtacaat agatgtttct tatctgccac attcatcaga 240
atacagtgtt ggtcgatgta agcacacaag tgaggaatgg ggtgagtgtg gctttagacc 300
caccatcttc agatctgcaa ctttaaaatg gaaagaaagc ctaatgagtc ggaaaaggcc 360
atttgttgga agatgttgtt actcctgcac tccccagagc tgggacaaat ttttcaacac 420
cagtatcccg tctttgggtt tgcggaatgt tatttatatc aatgaaactc acacaagaca 480
ccgcggatgg cttgcaagac gcctttctta cgttcttttt attcaagagc gagatgtgca 540
taagggcatg tttgccacca atgtgactga aaatgtgctg aacagcagta gagtacaaga 600
ggcaattgca gaagtggctg ctgaattaaa ccctgatggt tctgcccagc agcaatcaaa 660
agccgttaac aaagtgaaaa agaaagctaa aaggattctt caagaaatgg ttgccactgt 720
ctcaccggca atgatcagac tgactgggtg ggtgctgcta aaactgttca acagcttctt 780
ttggaacatt caaattcaca aaggtcaact tgagatggtt aaagctgcaa ctgagacgaa 840
tttgccgctt ctgtttctac cagttcatag atcccatatt gactatctgc tgctcacttt 900
cattctcttc tgccataaca tcaaagcacc atacattgct tcaggcaata atctcaacat 960
cccaatcttc agtaccttga tccataagct tgggggcttc ttcatacgac gaaggctcga 1020
tgaaacacca gatggacgga aagatgttct ctatagagct ttgctccatg ggcatatagt 1080
tgaattactt cgacagcagc aattcttgga gatcttcctg gaaggcacac gttctaggag 1140
tggaaaaacc tcttgtgctc gggcaggact tttgtcagtt gtggtagata ctctgtctac 1200
caatgtcatc ccagacatct tgataatacc tgttggaatc tcctatgatc gcattatcga 1260
aggtcactac aatggtgaac aactgggcaa acctaagaag aatgagagcc tgtggagtgt 1320
agcaagaggt gttattagaa tgttacgaaa aaactatggt tgtgtccgag tggattttgc 1380
acagccattt tccttaaagg aatatttaga aagccaaagt cagaaaccgg tgtctgctct 1440
actttccctg gagcaagcgt tgttaccagc tatacttcct tcaagaccca gtgatgctgc 1500
tgatgaaggt agagacacgt ccattaatga gtccagaaat gcaacagatg aatccctacg 1560
aaggaggttg attgcaaatc tggctgagca tattctattc actgctagca agtcctgtgc 1620
cattatgtcc acacacattg tggcttgcct gctcctctac agacacaggc agggaattga 1680
tctctccaca ttggtcgaag acttctttgt gatgaaagag gaagtcctgg ctcgtgattt 1740
tgacctgggg ttctcaggaa attcagaaga tgtagtaatg catgccatac agctgctggg 1800
aaattgtgtc acaatcaccc acactagcag gaacgatgag ttttttatca cccccagcac 1860
aactgtccca tcagtcttcg aactcaactt ctacagcaat ggggtacttc atgtctttat 1920
catggaggcc atcatagctt gcagccttta tgcagttctg aacaagaggg gactgggggg 1980
tcccactagc accccaccta acctgatcag ccaggagcag ctggtgcgga aggcggccag 2040
cctgtgctac cttctctcca atgaaggcac catctcactg ccttgccaga cattttacca 2100
agtctgccat gaaacagtag gaaagtttat ccagtatggc attcttacag tggcagagca 2160
cgatgaccag gaagatatca gtcctagtct tgctgagcag cagtgggaca agaagcttcc 2220
agaacctttg tcttggagaa gtgatgaaga agatgaagac agtgactttg gggaggaaca 2280
gcgagattgc tacctgaagg tgagccaatc caaggagcac cagcagttta tcaccttctt 2340
acagagactc cttgggcctt tgctggaggc ctacagctct gctgccatct ttgttcacaa 2400
cttcagtggt cctgttccag aacctgagta tctgcaaaag ttgcacaaat acctaataac 2460
cagaacagaa agaaatgttg cagtatatgc tgagagtgcc acatattgtc ttgtgaagaa 2520
tgctgtgaaa atgtttaagg atattggggt tttcaaggag accaaacaaa agagagtgtc 2580
tgttttagaa ctgagcagca cttttctacc tcaatgcaac cgacaaaaac ttctagaata 2640
tattctgagt tttgtggtgc tgtaggtaac gtgtggcact gctggcaaat gaaggtcatg 2700
agatgagttc cttgtaggta caagcttctg gctcaagagt tgaaggtgcc atcgcagggt 2760
caggcctgcc ctgtcccgaa gtgatctcct ggaagacaag tgccttctcc atccatggat 2820
ctgtgatctt cccagctctg catcaacaca gcagcctgca gataacactt ggggggacct 2880
cagcctctat tcgcaactca taatccgtag actacaagat gaaatctcaa taaattattt 2940
ttgagtttat taaagattga cattttaagt acaactttta aggactaatt actgtgatgg 3000
acacagaaat gtagctgtgt tctggaactg aatcttacat ggtatactta gtgctgctgg 3060
gtaatttgtt ggtatattat ctggttagtg gttaatgctt cctttaaaaa taattgagtc 3120
atccattcac tctttttcag ttttatctgt caatagtagc tacattttta atgggagcac 3180
cttttatccc aaagtgcttt ataaattgag tggactgata tatatcacac ccaggtatca 3240
ctgtgctgtc ctttgctgtc agatttagaa atgtttttaa gagctatgtg aaaacagaca 3300
atattagttt aggtcgggaa ctgagatatt gtaatcaaat agttaacatc aggaagttaa 3360
tttggctggc aaaattctag ggaaacttgg ccagaaaact ggtgttgaag gcttttgctc 3420
atataaacaa gtgccattga gtttcaaatg accagcaaat atatttagaa ctcaaaaaaa 3480
aaaaaaaaaa 3490
<210> 20
<211> 2855
<212> DNA
<213> 智人(homo sapien)
<400> 20
aactttcatc ccagcacatg atttgggaat tacactttgt gacatggatg aatctgcact 60
gacccttggt acaatagatg tttcttatct gccacattca tcagaataca gtgttggtcg 120
atgtaagcac acaagtgagg aatggggtga gtgtggcttt agacccacca tcttcagatc 180
tgcaacttta aaatggaaag aaagcctaat gagtcggaaa aggccatttg ttggaagatg 240
ttgttactcc tgcactcccc agagctggga caaatttttc aaccccagta tcccgtcttt 300
gggtttgcgg aatgttattt atatcaatga aactcacaca agacaccgcg gatggcttgc 360
aagacgcctt tcttacgttc tttttattca agagcgagat gtgcataagg gcatgtttgc 420
caccaatgtg actgaaaatg tgctgaacag cagtagagta caagaggcaa ttgcagaagt 480
ggctgctgaa ttaaaccctg atggttctgc ccagcagcaa tcaaaagccg ttaacaaagt 540
gaaaaagaaa gctaaaagga ttcttcaaga aatggttgcc actgtctcac cggcaatgat 600
cagactgact gggtgggtgc tgctaaaact gttcaacagc ttcttttgga acattcaaat 660
tcacaaaggt caacttgaga tggttaaagc tgcaactgag acgaatttgc cgcttctgtt 720
tctaccagtt catagatccc atattgacta tctgctgctc actttcattc tcttctgcca 780
taacatcaaa gcaccataca ttgcttcagg caataatctc aacatcccaa tcttcagtac 840
cttgatccat aagcttgggg gcttcttcat acgacgaagg ctcgatgaaa caccagatgg 900
acggaaagat gttctctata gagctttgct ccatgggcat atagttgaat tacttcgaca 960
gcagcaattc ttggagatct tcctggaagg cacacgttct aggagtggaa aaacctcttg 1020
tgctcgggca ggacttttgt cagttgtggt agatactctg tctaccaatg tcatcccaga 1080
catcttgata atacctgttg gaatctccta tgatcgcatt atcgaaggtc actacaatgg 1140
tgaacaactg ggcaaaccta agaagaatga gagcctgtgg agtgtagcaa gaggtgttac 1200
tagaatgtta cgaaaaaact atggttgtgt ccgagtggat tttgcacagc cattttcctt 1260
aaaggaatat ttagaaagcc aaagtcagaa accggtgtct gctctacttt ccctggagca 1320
agcgttgtta ccagctatac ttccttcaag acccagtgat gctgctgatg aaggtagaga 1380
cacgtccatt aatgagtcca gaaatgcaac agatgaatcc ctacgaagga ggttgattgc 1440
aaatctggct gagcatattc tattcactgc tagcaagtcc tgtgccatta tgtccacaca 1500
cattgtggct tgcctgctcc tctacagaca caggcaggga attgatctct ccacattggt 1560
cgaagacttc tttgtgatga aagaggaagt cctggctcgt gattttgacc tggggttctc 1620
aggaaattca gaagatgtag taatgcatgc catacagctg ctgggaaatt gtgtcacaat 1680
cacccacact agcaggaacg atgagttttt tatcaccccc agcacaactg tcccatcagt 1740
cttcgaactc aacttctaca gcaatggggt acttcatgtc tttatcatgg aggccatcat 1800
agcttgcagc ctttatgcag ttctgaacaa gaggggactg gggggtccca ctagcacccc 1860
acctaacctg atcagccagg agcagctggt gcggaaggcg gccagcctgt gctaccttct 1920
ctccaatgaa ggcaccatct cactgccttg ccagacattt taccaagtct gccatgaaac 1980
agtaggaaag tttatccagt atggcattct tacagtggca gagcacgatg accaggaaga 2040
tatcagtcct agtcttgctg agcagcagtg ggacaagaag cttcctgaac ctttgtcttg 2100
gagaagtgat gaagaagatg aagacagtga ctttggggag gaacagcgag attgctacct 2160
gaaggtgagc caatccaagg agcaccagca gtttatcacc ttcttacaga gactccttgg 2220
gcctttgctg gaggcctaca gctctgctgc catctttgtt cacaacttca gtggtcctgt 2280
tccagaacct gagtatctgc aaaagttgca caaataccta ataaccagaa cagaaagaaa 2340
tgttgcagta tatgctgaga gtgccacata ttgtcttgtg aagaatgctg tgaaaatgtt 2400
taaggatatt ggggttttca aggagaccaa acaaaagaga gtgtctgttt tagaactgag 2460
cagcactttt ctacctcaat gcaaccgaca aaaacttcta gaatatattc tgagttttgt 2520
ggtgctgtag gtaacgtgtg gcactgctgg caaatgaagg tcatgagatg agttccttgt 2580
aggtaccagc ttctggctca agagttgaag gtgccgtcgc agggtcaggc ctgccctgtc 2640
ccgaggtgat ctcctggaag acaagtgcct tctccctcca tggatctgtg atcttcccag 2700
ctctgcatca acacagcagc ctgcagataa cacttggggg gacctcagcc tctattcgca 2760
actcataatc cgtagactac aagatgaaat ctcaataaat tatttttgag tttattaaag 2820
aggtctttta aggcaaaaaa aaaaaaaaaa aaaaa 2855
<210> 21
<211> 6372
<212> DNA
<213> 智人(homo sapien)
<400> 21
gcgccactgc agctggcatt ggccgggact ggaagtgcgg gcttctgcag cagccgaagc 60
tggagctgct agggcagcag cggctcccct gttgtatgga cattctgcac ccgaaactga 120
tagctgagtc ctgaagtttt atgttatgaa acagaagaac tttcatccca gcacatgatt 180
tgggaattac actttgtgac atggatgaat ctgcactgac ccttggtaca atagatgttt 240
cttatctgcc acattcatca gaatacagtg ttggtcgatg taagcacaca agtgaggaat 300
ggggtgagtg tggctttaga cccaccgtct tcagatctgc aactttaaaa tggaaagaaa 360
gcctaatgag tcggaaaagg ccatttgttg gaagatgttg ttactcctgc actccccaga 420
gctgggacaa atttttcaac cccagtatcc cgtctttggg tttgcggaat gttatttata 480
tcaatgaaac tcacacaaga caccgcggat ggcttgcaag acgcctttct tacgttcttt 540
ttattcaaga gcgagatgtg cataagggca tgtttgccac caatgtgact gaaaatgtgc 600
tgaacagcag tagagtacaa gaggcaattg cagaagtggc tgctgaatta aaccctgatg 660
gttctgccca gcagcaatca aaagccgtta acaaagtgaa aaagaaagct aaaaggattc 720
ttcaagaaat ggttgccact gtctcaccgg caatgatcag actgactggg tgggtgctgc 780
taaaactgtt caacagcttc ttttggaaca ttcaaattca caaaggtcaa cttgagatgg 840
ttaaagctgc aactgagacg aatttgccgc ttctgtttct accagttcat agatcccata 900
ttgactatct gctgctcact ttcattctct tctgccataa catcaaagca ccatacattg 960
cttcaggcaa taatctcaac atcccaatct tcagtacctt gatccataag cttgggggct 1020
tcttcatacg acgaaggctc gatgaaacac cagatggacg gaaagatgtt ctctatagag 1080
ctttgctcca tgggcatata gttgaattac ttcgacagca gcaattcttg gagatcttcc 1140
tggaaggcac acgttctagg agtggaaaaa cctcttgtgc tcgggcagga cttttgtcag 1200
ttgtggtaga tactctgtct accaatgtca tcccagacat cttgataata cctgttggaa 1260
tctcctatga tcgcattatc gaaggtcact acaatggtga acaactgggc aaacctaaga 1320
agaatgagag cctgtggagt gtagcaagag gtgttattag aatgttacga aaaaactatg 1380
gttgtgtccg agtggatttt gcacagccat tttccttaaa ggaatattta gaaagccaaa 1440
gtcagaaacc ggtgtctgct ctactttccc tggagcaagc gttgttacca gctatacttc 1500
cttcaagacc cagtgatgct gctgatgaag gtagagacac gtccattaat gagtccagaa 1560
atgcaacaga tgaatcccta cgaaggaggt tgattgcaaa tctggctgag catattctat 1620
tcactgctag caagtcctgt gccattatgt ccacacacat tgtggcttgc ctgctcctct 1680
acagacacag gcagggaatt gatctctcca cattggtcga agacttcttt gtgatgaaag 1740
aggaagtcct ggctcgtgat tttgacctgg ggttctcagg aaattcagaa gatgtagtaa 1800
tgcatgccat acagctgctg ggaaattgtg tcacaatcac ccacactagc aggaacgatg 1860
agttttttat cacccccagc acaactgtcc catcagtctt cgaactcaac ttctacagca 1920
atggggtact tcatgtcttt atcatggagg ccatcatagc ttgcagcctt tatgcagttc 1980
tgaacaagag gggactgggg ggtcccacta gcaccccacc taacctgatc agccaggagc 2040
agctggtgcg gaaggcggcc agcctgtgct accttctctc caatgaaggc accatctcac 2100
tgccttgcca gacattttac caagtctgcc atgaaacagt aggaaagttt atccagtatg 2160
gcattcttac agtggcagag cacgatgacc aggaagatat cagtcctagt cttgctgagc 2220
agcagtggga caagaagctt ccagaacctt tgtcttggag aagtgatgaa gaagatgaag 2280
acagtgactt tggggaggaa cagcgagatt gctacctgaa ggtgagccaa tccaaggagc 2340
accagcagtt tatcaccttc ttacagagac tccttgggcc tttgctggag gcctacagct 2400
ctgctgccat ctttgttcac aacttcagtg gtcctgttcc agaacctgag tatctgcaaa 2460
agttgcacaa atacctaata accagaacag aaagaaatgt tgcagtatat gctgagagtg 2520
ccacatattg tcttgtgaag aatgctgtga aaatgtttaa ggatattggg gttttcaagg 2580
agaccaaaca aaagagagtg tctgttttag aactgagcag cacttttcta cctcaatgca 2640
accgacaaaa acttctagaa tatattctga gttttgtggt gctgtaggta acgtgtggca 2700
ctgctggcaa atgaaggtca tgagatgagt tccttgtagg taccagcttc tggctcaaga 2760
gttgaaggtg ccatcgcagg gtcaggcctg ccctgtcccg aagtgatctc ctggaagaca 2820
agtgccttct ccctccatgg atctgtgatc ttcccagctc tgcatcaaca cagcagcctg 2880
cagataacac ttggggggac ctcagcctct attcgcaact cataatccgt agactacaag 2940
atgaaatctc aataaattat ttttgagttt attaaagatt gacattttaa gtacaacttt 3000
taaggactaa ttactgtgat ggacacagaa atgtagctgt gttctggaac tgaatcttac 3060
atggtatact tagtgctgct gggtaatttg ttggtatatt atctggttag tggttaatgc 3120
ttcctttaaa aataattgag tcatccattc actctttttc agttttatct gtcaatagta 3180
gctacatttt taatgggagc accttttatc ccaaagtgct ttataaattg agtggactga 3240
tatatatcac acccaggtat cactgtgctg tcctttgctg tcagatttag aaatgttttt 3300
aagagctatg tgaaaacaga caatattagt ttaggtcggg aactgagata ttgtaatcaa 3360
atagttaaca tcaggaagtt aatttggctg gcaaaattct agggaaactt ggccagaaaa 3420
ctggtgttga aggcttttgc tcatataaac aagtgccatt gagtttcaaa tgaccagcaa 3480
atatatttag aacccttcct gttttatgtc tgtacctcgt ccacccctca ggtaatacct 3540
gcctctcaca ggtacagctg tttcttggaa atcctccaac caaatagcag ttttcctaac 3600
ttgattagct tgagctgaca gactgttaga atacagttct ctggccacag ctgatgaggg 3660
ctttctgtac tgcacacaga ttgtgtactg caccccagtc caggtgactg gtacccactc 3720
gagttgtgcc gtgcacaacc tgtccagtat atgcatgtgg tggccctact gactggtaat 3780
ggttagaggc atttatggat ttttagcttt gaggaaaaac catgactttt aacaaatttt 3840
tatgggttat atgcctaaac ccttatgcca catagtggta aataattatg aaaaatggtc 3900
tgttcataat tggtaggtgc cttttgtgag cagggagcat aattattggt ttattatggt 3960
aattatggtg attttttaaa tatcatgtaa tgttaaaacg ttttctaaca gtttactgtt 4020
gcttatctcc aagatattat ggaattaaga atttttccag atgagtgtta catagattct 4080
ttgaatttag tataaaagta ctgagaatta agtttgtact tccataagct tggattttaa 4140
acactgatag tatctcatga gtaatgtgtg ttttgggaga gggagggatg ctgattgata 4200
tttcacattg tatgaaatac catgtttgaa actcatagca ataatgctat gctgttgtga 4260
tccctctcaa gttctgcatt taaaatatat tttttcttta taggaattga tgtataccat 4320
gaagtcattg tcagttgtag tagctctgat gttgaatgag atatcatgtt ttagcattcc 4380
attttactga ctagggtaga agaacacttt tcttggctac atttggagga tacccaggga 4440
gtcttgggtg ttccttatct ggggaagcaa acatttcact agtctctttt tttcatcctt 4500
taaattgtaa attaaggatt actcaagctc accattattc aagattggga ctcgcttccc 4560
agtcgacact ctgccctgcc tgtcattgct gcaaagagct gctgctttgc caacctaagc 4620
aaagaaaata cggcttctct tgcattattt tcccttttgg ttggtttgtt ttctagaagt 4680
acgttcagat gctttgggga atgcaatgta tgatttgcta gctctctcac cacttaactc 4740
actgtgagga taaatatgca tgctttttgt aattaactgg tgctttgaaa atctttttta 4800
agggagaaaa atctcaacca aagttatgct catccagaca agctgacctt tgagttaatt 4860
tcagcacaac tcattcttca gtgcctcatg actgaaaaca aaaaacaaaa aaacgaaagc 4920
atcttcacaa tgaagcttcc agatagcacc gttttgctaa aagatacatt ctcattgttt 4980
tccaacagtg atggcttcca cataaggtta aacaaactag gtgcttgtaa ataatttatt 5040
acagtttact ctatcgcatt tctgtaacat gaaatgcatg cccttcttca ggggaagact 5100
gtggtcaagt taaaaaaaaa aaacaatatt aaacaacatg aaactgcagt ctgtttttga 5160
aaatgagaat gtcctaagtg attcagaaga gaggagggaa gttgtgcact ctgaaaatgc 5220
atgaaaaaca aaggcaaaaa ctagtgggaa atgtgtagaa ctgttaactg agatggcttc 5280
gagtcttcct tctggaatct gttaaatttc acaaagtcat gagggtaaat ggagaaaata 5340
tttctgggat tacaatgaat gtaagcccaa attgtggaat tgccagtaac ctggatgggg 5400
aaaagcattt cccatagcac tccatgtaat atgagtgctc tgtgagatgt tcatcagtgt 5460
tttatagaaa tggtgttgct gggaaaccaa gtttgcacct ggaaacttac aatgcacttt 5520
agcgcagtaa gggcttggca tccggtagtg aaaaactgtc taacccagca ttgcccaaac 5580
tattttgaca ccaggacctt tttctccttt gggatactta tgaacctctc actaatgtcc 5640
tgtggagaac attttgggaa acactatgtt agatagttct ttaaggagac aaaacggtaa 5700
tgaacagata gcactggggc agaatatgca tgcattttgt aacgtccagt gtggcgttga 5760
atagatgtgt atttcctccc ctgcagaaaa taagcacaga aaattataat gtaggtgatc 5820
ggagctcttt cctttgatag agagaacagc cccaatgatc ctggcttttt cactgaacgt 5880
atcagaatac atggatgaat tggggtaaat aaggttttaa ttcagatcta gaagaaagta 5940
ttgtacgttt gaatgcagat ttttatccac agatagttgt agtgtttaga catgacagga 6000
cctatcgttg aggtttctaa gacttactat gggctgtaaa cctgtttttt aaaactattt 6060
tagaaacctg agacttgccg tctggcattt tagtttaata caaactaatg attgcatttg 6120
aaagagattc ttgaccttat ttctaaacgt ctagagctct gaaatgtctt gatggaaggt 6180
attaaactat ttgcctgttg tacaaagaaa tgttaagact cgtgaaaaga attactataa 6240
ggtactgtga aataactgcg attttgtgag caaaacatac ttggaaatgc tgattgattt 6300
ttatgcttgt tagtgtattg caagaaacac agaaaatgta gttttgtttt aataaaccaa 6360
aaattgaaca ta 6372
<210> 22
<211> 5664
<212> DNA
<213> 智人(homo sapien)
<400> 22
gaagctggag ctgctagggt gcgaactgcc agggcaggca gcagcggctc ccctgttgta 60
tggacattct gcacccgaaa ctgatagctg agtcctgaag ttttatgtta tgaaacagaa 120
gaactttcat cccagcacat gatttgggaa ttacactttg tgacatggat gaatctgcac 180
tgacccttgg tacaatagat gtttcttatc tgccacattc atcagaatac agtgttggtc 240
gatgtaagca cacaagtgag gaatggggtg agtgtggctt tagacccacc gtcttcagat 300
ctgcaacttt aaaatggaaa gaaagcctaa tgagtcggaa aaggccattt gttggaagat 360
gttgttactc ctgcactccc cagagctggg acaaattttt caaccccagt atcccgtctt 420
tgggtttgcg gaatgttatt tatatcaatg aaactcacac aagacaccgc ggatggcttg 480
caagacgcct ttcttacgtt ctttttattc aagagcgaga tgtgcataag ggcatgtttg 540
ccaccaatgt gactgaaaat gtgctgaaca gcagtagagt acaagaggca attgcagaag 600
tggctgctga attaaaccct gatggttctg cccagcagca atcaaaagcc gttaacaaag 660
tgaaaaagaa agctaaaagg attcttcaag aaatggttgc cactgtctca ccggcaatga 720
tcagactgac tgggtgggtg ctgctaaaac tgttcaacag cttcttttgg aacattcaaa 780
ttcacaaagg tcaacttgag atggttaaag ctgcaactga gacgaatttg ccgcttctgt 840
ttctaccagt tcatagatcc catattgact atctgctgct cactttcatt ctcttctgcc 900
ataacatcaa agcaccatac attgcttcag gcaataatct caacatccca atcttcagta 960
ccttgatcca taagcttggg ggcttcttca tacgacgaag gctcgatgaa acaccagatg 1020
gacggaaaga tgttctctat agagctttgc tccatgggca tatagttgaa ttacttcgac 1080
agcagcaatt cttggagatc ttcctggaag gcacacgttc taggagtgga aaaacctctt 1140
gtgctcgggc aggacttttg tcagttgtgg tagatactct gtctaccaat gtcatcccag 1200
acatcttgat aatacctgtt ggaatctcct atgatcgcat tatcgaaggt cactacaatg 1260
gtgaacaact gggcaaacct aagaagaatg agagcctgtg gagtgtagca agaggtgtta 1320
ttagaatgtt acgaaaaaac tatggttgtg tccgagtgga ttttgcacag ccattttcct 1380
taaaggaata tttagaaagc caaagtcaga aaccggtgtc tgctctactt tccctggagc 1440
aagcgttgtt accagctata cttccttcaa gacccagtga tgctgctgat gaaggtagag 1500
acacgtccat taatgagtcc agaaatgcaa cagatgaatc cctacgaagg aggttgattg 1560
caaatctggc tgagcatatt ctattcactg ctagcaagtc ctgtgccatt atgtccacac 1620
acattgtggc ttgcctgctc ctctacagac acaggcaggg aattgatctc tccacattgg 1680
tcgaagactt ctttgtgatg aaagaggaag tcctggctcg tgattttgac ctggggttct 1740
caggaaattc agaagatgta gtaatgcatg ccatacagct gctgggaaat tgtgtcacaa 1800
tcacccacac tagcaggaac gatgagtttt ttatcacccc cagcacaact gtcccatcag 1860
tcttcgaact caacttctac agcaatgggg tacttcatgt ctttatcatg gaggccatca 1920
tagcttgcag cctttatgca gttctgaaca agaggggact ggggggtccc actagcaccc 1980
cacctaacct gatcagccag gagcagctgg tgcggaaggc ggccagcctg tgctaccttc 2040
tctccaatga aggcaccatc tcactgcctt gccagacatt ttaccaagtc tgccatgaaa 2100
cagtaggaaa gtttatccag tatggcattc ttacagtggc agagcacgat gaccaggaag 2160
atatcagtcc tagtcttgct gagcagcagt gggacaagaa gcttccagaa cctttgtctt 2220
ggagaagtga tgaagaagat gaagacagtg actttgggga ggaacagcga gattgctacc 2280
tgaaggtact tgggtgaaga attctggtgg atattacagg gatatgttga ggtttatgct 2340
gcagtgagat cagctggagt cctggtgatg tcttcttatc taaagaatcc cccaactagc 2400
tctggtacct tctgtgtggt aaagacactc aaactgtttg agttgaatta atagcatttt 2460
aagtagaaaa ggaaaggaga gtctgaaaag tcaggaagat gaatgtcata ggtgagactt 2520
tcaccatcct tttatgaaat acacaggtgc atacctgttt acctacacct gcacccctca 2580
tgaggcagca gttttgctat tgagctgcca ctgacctggc tgctcttttt gagtcactct 2640
tgctgtccct cccaaaattt catatattaa gctctttgct gtcaattaaa acaaatacca 2700
ttataggaga aaattgagat taaaaaaaaa gtccctgatt tagaaaaatc aattttgtct 2760
aatttataat tttagaactt agtaataatg acccgtcttt tctgaatact ctaagaggat 2820
tactcttttt tgacatttag aaattgtctt ctttttcact tgggtggtat tagtttagtt 2880
tcaagatggg gcagtgatct tgctttcaca ctccagaggg gcttgaccga accagtgtgt 2940
tttgggtagg tacagtgaga gcctctcggc cataaagcac cgccgtcaca gtggccatca 3000
ttccccacag tgctggactg tgggcaaagg ccatttaggg gaggcaggga ataggtgctg 3060
cagaaggagt gagataatct tggtggtctc ccattggtct ttctgcagac ttgagtgact 3120
gttgagccca ggcttcaaac catggagggc ctggtcttag gagcggctat ttttagtgat 3180
gacagcgtat cacaagtagg gcattcattt atgaaaattt cttctaggtg gctgttcaat 3240
gaacacaagc ctcaaatacc ataaaaaagt gaatgattac aataaagaat gtgtttgaaa 3300
gccagcagtt gtttccagca gagattctct gcatgagggg cagggggccg ctttcatgta 3360
gtgctgatgt gagtggccat cttctcacgt tactggctct ccagagaaag tcctctgtcc 3420
acttgccttg tgtctcttgt cccttcctca tgacttcatc tcctgctttt gcacactcag 3480
gtgagccaat ccaaggagca ccagcagttt atcaccttct tacagagact ccttgggcct 3540
ttgctggagg cctacagctc tgctgccatc tttgttcaca acttcagtgg tcctgttcca 3600
gaacctgagt atctgcaaaa gttgcacaaa tacctaataa ccagaacaga aagaaatgtt 3660
gcagtatatg gtatgttaag tcactattta ttcttttaaa atcttttttt tttttttgga 3720
tttcagaaat ttgctaattg tagaaaattg gaaaaatgca aacttatcct gacctctaac 3780
accgtagagt attactatta tcttctttgg catgttatat aagttgaatg atacagttat 3840
acactcttac atctggcttt tttcacgtaa cgttattttt gagattcata catgttgcat 3900
atagttgttc ctttgttctt gttgtgtagt gttccattgt ataaatattt accacatttt 3960
attcattctg ctgttgatgg atatttgggt tgttttcagt tcacagctgc tttgaacagt 4020
gttgctatga gcatatttga atatgtcttt tggtgaatat ctgtgcccct atatacagca 4080
tgtatgtggg aacagaattg cctggttgta ggctctgggt atattcggct ttggtagata 4140
ccaccaaaca gtttccaagg gattatacct acttgtactc ccacaacagt gtgtgtttca 4200
cttgctgcac atcttggcca gcgctccgtc ttctttgttt taggaggtgt gattggggtg 4260
ggagtactat tttatacagt tgtagtttgg agctgaaact acttgaatca ctttttagag 4320
ccaaaaggaa tctaatctaa tcacctcatt ttatagttga ggaaaatacc ccaggtcaca 4380
ctgctaatta atgggtaatc tcgggatcag aattcttgtt tcctaacctc gaggcctgtg 4440
ctttctctgg ttccactgat gtacaatcat ctgtgtacca ctgggtagct taaagaatat 4500
ttatacacta tctcatttga ttctcacaac agtcctggaa aatggatgtt ttaggtattt 4560
ctacttccct ctgttctccc tatttctctc tctacaccct cttttctttc cccttccctt 4620
tcttatttac ctcaatatag gacaaagtag gtgtaagcaa agtaggttta acagcaagtc 4680
atctgagaac tcacaggttg ccagtggtgg aagtggggcc ccacccttgt ctgctgactt 4740
gccctcattc tcttcctagc tccccatact ttcttactgt ggctgctggg attgtcatga 4800
tttgttgagc gtaaccattt gacagggttt tattctctct cttcagctga gagtgccaca 4860
tattgtcttg tgaagaatgc tgtgaaaatg tttaaggata ttggggtagg tgtccaccat 4920
ttatggtata aaagctatct caacttctgt tctctttaga tctagtctgt ttgagctacc 4980
tttgtggtgg ggtggacccc gagagaagca gtttctgctg gcttaatgat aaaggcattt 5040
ttgggaacgg ggcatgtagg atgggttggg ctatgttgaa ggtgaagccc atcagtgtag 5100
atttatttga atgttctgga attttactgg tttcacattt attcccaagc tgctatatat 5160
aactggtatc aatatgtttc aaggtgctac aggttgaata tcccttatcc aaaatgttgg 5220
gaccagaaat gttttggatt tcagattttt ttgggatttt ggaatatgtg cattagactt 5280
acaggttgag cgtctctaat ccaaaaccca aaatgctctg atgagcatgt cttttgagca 5340
tcatattgat gttcaaaatc tttcagattt tggagtactt cagatttttg attttgggat 5400
taggaccaca atcttggctc ttaattattc catatgattt ttagttactt tcttgtattt 5460
ttacaagaat ttctagaagt atcctcaggt gtcctttacc ttcatgattc atggggaatg 5520
taagttctat agagatacta gcggcctttt gtgagggact gtttgtgact ttattctaag 5580
tcattttaga gtatagttat gttggttgaa attttagaat atagttaatg ttggttgaac 5640
tccatcaaaa caaaaaaaaa aaaa 5664
<210> 23
<211> 6368
<212> DNA
<213> 智人(homo sapien)
<400> 23
gcgccactgc agctggcatt ggccgggact ggaagtgcgg gcttctgcag cagccgaagc 60
tggagctgct aggcagcggc tcccctgttg tatggacatt ctgcacccga aactgatagc 120
tgagtcctga agttttatgt tatgaaacag aagaactttc atcccagcac atgatttggg 180
aattacactt tgtgacatgg atgaatctgc actgaccctt ggtacaatag atgtttctta 240
tctgccacat tcatcagaat acagtgttgg tcgatgtaag cacacaagtg aggaatgggg 300
tgagtgtggc tttagaccca ccgtcttcag atctgcaact ttaaaatgga aagaaagcct 360
aatgagtcgg aaaaggccat ttgttggaag atgttgttac tcctgcactc cccagagctg 420
ggacaaattt ttcaacccca gtatcccgtc tttgggtttg cggaatgtta tttatatcaa 480
tgaaactcac acaagacacc gcggatggct tgcaagacgc ctttcttacg ttctttttat 540
tcaagagcga gatgtgcata agggcatgtt tgccaccaat gtgactgaaa atgtgctgaa 600
cagcagtaga gtacaagagg caattgcaga agtggctgct gaattaaacc ctgatggttc 660
tgcccagcag caatcaaaag ccgttaacaa agtgaaaaag aaagctaaaa ggattcttca 720
agaaatggtt gccactgtct caccggcaat gatcagactg actgggtggg tgctgctaaa 780
actgttcaac agcttctttt ggaacattca aattcacaaa ggtcaacttg agatggttaa 840
agctgcaact gagacgaatt tgccgcttct gtttctacca gttcatagat cccatattga 900
ctatctgctg ctcactttca ttctcttctg ccataacatc aaagcaccat acattgcttc 960
aggcaataat ctcaacatcc caatcttcag taccttgatc cataagcttg ggggcttctt 1020
catacgacga aggctcgatg aaacaccaga tggacggaaa gatgttctct atagagcttt 1080
gctccatggg catatagttg aattacttcg acagcagcaa ttcttggaga tcttcctgga 1140
aggcacacgt tctaggagtg gaaaaacctc ttgtgctcgg gcaggacttt tgtcagttgt 1200
ggtagatact ctgtctacca atgtcatccc agacatcttg ataatacctg ttggaatctc 1260
ctatgatcgc attatcgaag gtcactacaa tggtgaacaa ctgggcaaac ctaagaagaa 1320
tgagagcctg tggagtgtag caagaggtgt tattagaatg ttacgaaaaa actatggttg 1380
tgtccgagtg gattttgcac agccattttc cttaaaggaa tatttagaaa gccaaagtca 1440
gaaaccggtg tctgctctac tttccctgga gcaagcgttg ttaccagcta tacttccttc 1500
aagacccagt gatgctgctg atgaaggtag agacacgtcc attaatgagt ccagaaatgc 1560
aacagatgaa tccctacgaa ggaggttgat tgcaaatctg gctgagcata ttctattcac 1620
tgctagcaag tcctgtgcca ttatgtccac acacattgtg gcttgcctgc tcctctacag 1680
acacaggcag ggaattgatc tctccacatt ggtcgaagac ttctttgtga tgaaagagga 1740
agtcctggct cgtgattttg acctggggtt ctcaggaaat tcagaagatg tagtaatgca 1800
tgccatacag ctgctgggaa attgtgtcac aatcacccac actagcagga acgatgagtt 1860
ttttatcacc cccagcacaa ctgtcccatc agtcttcgaa ctcaacttct acagcaatgg 1920
ggtacttcat gtctttatca tggaggccat catagcttgc agcctttatg cagttctgaa 1980
caagagggga ctggggggtc ccactagcac cccacctaac ctgatcagcc aggagcagct 2040
ggtgcggaag gcggccagcc tgtgctacct tctctccaat gaaggcacca tctcactgcc 2100
ttgccagaca ttttaccaag tctgccatga aacagtagga aagtttatcc agtatggcat 2160
tcttacagtg gcagagcacg atgaccagga agatatcagt cctagtcttg ctgagcagca 2220
gtgggacaag aagcttccag aacctttgtc ttggagaagt gatgaagaag atgaagacag 2280
tgactttggg gaggaacagc gagattgcta cctgaaggtg agccaatcca aggagcacca 2340
gcagtttatc accttcttac agagactcct tgggcctttg ctggaggcct acagctctgc 2400
tgccatcttt gttcacaact tcagtggtcc tgttccagaa cctgagtatc tgcaaaagtt 2460
gcacaaatac ctaataacca gaacagaaag aaatgttgca gtatatgctg agagtgccac 2520
atattgtctt gtgaagaatg ctgtgaaaat gtttaaggat attggggttt tcaaggagac 2580
caaacaaaag agagtgtctg ttttagaact gagcagcact tttctacctc aatgcaaccg 2640
acaaaaactt ctagaatata ttctgagttt tgtggtgctg taggtaacgt gtggcactgc 2700
tggcaaatga aggtcatgag atgagttcct tgtaggtacc agcttctggc tcaagagttg 2760
aaggtgccat cgcagggtca ggcctgccct gtcccgaagt gatctcctgg aagacaagtg 2820
ccttctccct ccatggatct gtgatcttcc cagctctgca tcaacacagc agcctgcaga 2880
taacacttgg ggggacctca gcctctattc gcaactcata atccgtagac tacaagatga 2940
aatctcaata aattattttt gagtttatta aagattgaca ttttaagtac aacttttaag 3000
gactaattac tgtgatggac acagaaatgt agctgtgttc tggaactgaa tcttacatgg 3060
tatacttagt gctgctgggt aatttgttgg tatattatct ggttagtggt taatgcttcc 3120
tttaaaaata attgagtcat ccattcactc tttttcagtt ttatctgtca atagtagcta 3180
catttttaat gggagcacct tttatcccaa agtgctttat aaattgagtg gactgatata 3240
tatcacaccc aggtatcact gtgctgtcct ttgctgtcag atttagaaat gtttttaaga 3300
gctatgtgaa aacagacaat attagtttag gtcgggaact gagatattgt aatcaaatag 3360
ttaacatcag gaagttaatt tggctggcaa aattctaggg aaacttggcc agaaaactgg 3420
tgttgaaggc ttttgctcat ataaacaagt gccattgagt ttcaaatgac cagcaaatat 3480
atttagaacc cttcctgttt tatgtctgta cctcgtccac ccctcaggta atacctgcct 3540
ctcacaggta cagctgtttc ttggaaatcc tccaaccaaa tagcagtttt cctaacttga 3600
ttagcttgag ctgacagact gttagaatac agttctctgg ccacagctga tgagggcttt 3660
ctgtactgca cacagattgt gtactgcacc ccagtccagg tgactggtac ccactcgagt 3720
tgtgccgtgc acaacctgtc cagtatatgc atgtggtggc cctactgact ggtaatggtt 3780
agaggcattt atggattttt agctttgagg aaaaaccatg acttttaaca aatttttatg 3840
ggttatatgc ctaaaccctt atgccacata gtggtaaata attatgaaaa atggtctgtt 3900
cataattggt aggtgccttt tgtgagcagg gagcataatt attggtttat tatggtaatt 3960
atggtgattt tttaaatatc atgtaatgtt aaaacgtttt ctaacagttt actgttgctt 4020
atctccaaga tattatggaa ttaagaattt ttccagatga gtgttacata gattctttga 4080
atttagtata aaagtactga gaattaagtt tgtacttcca taagcttgga ttttaaacac 4140
tgatagtatc tcatgagtaa tgtgtgtttt gggagaggga gggatgctga ttgatatttc 4200
acattgtatg aaataccatg tttgaaactc atagcaataa tgctatgctg ttgtgatccc 4260
tctcaagttc tgcatttaaa atatattttt tctttatagg aattgatgta taccatgaag 4320
tcattgtcag ttgtagtagc tctgatgttg aatgagatat catgttttag cattccattt 4380
tactgactag ggtagaagaa cacttttctt ggctacattt ggaggatacc cagggagtct 4440
tgggtgttcc ttatctgggg aagcaaacat ttcactagtc tctttttttc atcctttaaa 4500
ttgtaaatta aggattactc aagctcacca ttattcaaga ttgggactcg cttcccagtc 4560
gacactctgc cctgcctgtc attgctgcaa agagctgctg ctttgccaac ctaagcaaag 4620
aaaatacggc ttctcttgca ttattttccc ttttggttgg tttgttttct agaagtacgt 4680
tcagatgctt tggggaatgc aatgtatgat ttgctagctc tctcaccact taactcactg 4740
tgaggataaa tatgcatgct ttttgtaatt aactggtgct ttgaaaatct tttttaaggg 4800
agaaaaatct caaccaaagt tatgctcatc cagacaagct gacctttgag ttaatttcag 4860
cacaactcat tcttcagtgc ctcatgactg aaaacaaaaa acaaaaaaac gaaagcatct 4920
tcacaatgaa gcttccagat agcaccgttt tgctaaaaga tacattctca ttgttttcca 4980
acagtgatgg cttccacata aggttaaaca aactaggtgc ttgtaaataa tttattacag 5040
tttactctat cgcatttctg taacatgaaa tgcatgccct tcttcagggg aagactgtgg 5100
tcaagttaaa aaaaaaaaac aatattaaac aacatgaaac tgcagtctgt ttttgaaaat 5160
gagaatgtcc taagtgattc agaagagagg agggaagttg tgcactctga aaatgcatga 5220
aaaacaaagg caaaaactag tgggaaatgt gtagaactgt taactgagat ggcttcgagt 5280
cttccttctg gaatctgtta aatttcacaa agtcatgagg gtaaatggag aaaatatttc 5340
tgggattaca atgaatgtaa gcccaaattg tggaattgcc agtaacctgg atggggaaaa 5400
gcatttccca tagcactcca tgtaatatga gtgctctgtg agatgttcat cagtgtttta 5460
tagaaatggt gttgctggga aaccaagttt gcacctggaa acttacaatg cactttagcg 5520
cagtaagggc ttggcatccg gtagtgaaaa actgtctaac ccagcattgc ccaaactatt 5580
ttgacaccag gacctttttc tcctttggga tacttatgaa cctctcacta atgtcctgtg 5640
gagaacattt tgggaaacac tatgttagat agttctttaa ggagacaaaa cggtaatgaa 5700
cagatagcac tggggcagaa tatgcatgca ttttgtaacg tccagtgtgg cgttgaatag 5760
atgtgtattt cctcccctgc agaaaataag cacagaaaat tataatgtag gtgatcggag 5820
ctctttcctt tgatagagag aacagcccca atgatcctgg ctttttcact gaacgtatca 5880
gaatacatgg atgaattggg gtaaataagg ttttaattca gatctagaag aaagtattgt 5940
acgtttgaat gcagattttt atccacagat agttgtagtg tttagacatg acaggaccta 6000
tcgttgaggt ttctaagact tactatgggc tgtaaacctg ttttttaaaa ctattttaga 6060
aacctgagac ttgccgtctg gcattttagt ttaatacaaa ctaatgattg catttgaaag 6120
agattcttga ccttatttct aaacgtctag agctctgaaa tgtcttgatg gaaggtatta 6180
aactatttgc ctgttgtaca aagaaatgtt aagactcgtg aaaagaatta ctataaggta 6240
ctgtgaaata actgcgattt tgtgagcaaa acatacttgg aaatgctgat tgatttttat 6300
gcttgttagt gtattgcaag aaacacagaa aatgtagttt tgttttaata aaccaaaaat 6360
tgaacata 6368
<210> 24
<211> 4918
<212> DNA
<213> 智人(homo sapien)
<400> 24
ggccactgca gctggcattg gccgggactg gaagtgcggg cttctgcagc agccgaagct 60
ggagctgcta gggcagcagc ggctcccctg ttgtatggac attctgcacc cgaaactgat 120
agctgagtcc tgaagtttta tgttatgaaa cagaagaact ttcatcccag cacatgattt 180
gggaattaca ctttgtgaca tggatgaatc tgcactgacc cttggtacaa tagatgtttc 240
ttatctgcca cattcatcag aatacagtgt tggtcgatgt aagcacacaa gtgaggaatg 300
gggtgagtgt ggctttagac ccaccgtctt cagatctgca actttaaaat ggaaagaaag 360
cctaatgagt cggaaaaggc catttgttgg aagatgttgt tactcctgca ctccccagag 420
ctgggacaaa tttttcaacc ccagtatccc gtctttgggt ttgcggaatg ttatttatat 480
caatgaaact cacacaagac accgcggatg gcttgcaaga cgcctttctt acgttctttt 540
tattcaagag cgagatgtgc ataagggcat gtttgccacc aatgtgactg aaaatgtgct 600
gaacagcagt agagtacaag aggcaattgc agaagtggct gctgaattaa accctgatgg 660
ttctgcccag cagcaatcaa aagccgttaa caaagtgaaa aagaaagcta aaaggattct 720
tcaagaaatg gttgccactg tctcaccggc aatgatcaga ctgactgggt gggtgctgct 780
aaaactgttc aacagcttct tttggaactt tcaaattcac aaaggtcaac ttgagatggt 840
taaagctgca actgagacga atttgccgct tctgtttcta ccagttcata gatcccatat 900
tgactatctg ctgctcactt tcattctctt ctgccataac atcaaagcac catacattgc 960
ttcaggcaat aatctcaaca tcccaatctt cagtaccttg atccataagc ttgggggctt 1020
cttcatacga cgaaggctcg atgaaacacc agatggacgg aaagatgttc tctatagagc 1080
tttgctccat gggcatatag ttgaattact tcgacagcag caattcttgg agatcttcct 1140
ggaaggcaca cgttctagga gtggaaaaac ctcttgtgct cgggcaggac ttttgtcagt 1200
tgtggtagat actctgtcta ccaatgtcat cccagacatc ttgataatac ctgttggaat 1260
ctcctatgat cgcattatcg aaggtcacta caatggtgaa caactgggca aacctaagaa 1320
gaatgagagc ctgtggagtg tagcaagagg tgttattaga atgttacgaa aaaactatgg 1380
ttgtgtccga gtggattttg cacagccatt ttccttaaag gaatatttag aaagccaaag 1440
tcagaaaccg gtgtctgctc tactttccct ggagcaagcg ttgttaccag ctatacttcc 1500
ttcaagaccc agtgatgctg ctgatgaagg tagagacacg tccattaatg agtccagaaa 1560
tgcaacagat gaatccctac gaaggaggtt gattgcaaat ctggctgagc atattctatt 1620
cactgctagc aagtcctgtg ccattatgtc cacacacatt gtggcttgcc tgctcctcta 1680
cagacacagg cagggaattg atctctccac attggtcgaa gacttctttg tgatgaaaga 1740
ggaagtcctg gctcgtgatt ttgacctggg gttctcagga aattcagaag atgtagtaat 1800
gcatgccata cagctgctgg gaaattgtgt cacaatcacc cacactagca ggaacgatga 1860
gttttttatc acccccagca caactgtccc atcagtcttc gaactcaact tctacagcaa 1920
tggggtactt catgtcttta tcatggaggc catcatagct tgcagccttt atgcagttct 1980
gaacaagagg ggactggggg gtcccactag caccccacct aacctgatca gccaggagca 2040
gctggtgcgg aaggcggcca gcctgtgcta ccttctctcc aatgaaggca ccatctcact 2100
gccttgccag acattttacc aagtctgcca tgaaacagta ggaaagttta tccggtatgg 2160
cattcttaca gtggcagagc acgatgacca ggaagatatc agtcctagtc ttgctgagca 2220
gcagtgggac aagaagcttc cagaaccttt gtcttggaga agtgatgaag aagatgaaga 2280
cagtgacttt ggggaggaac agcgagattg ctacctgaag gtgagccaat ccaaggagca 2340
ccagcagttt atcaccttct tacagagact ccttgggcct ttgctggagg cctacagctc 2400
tgctgccatc tttgttcaca acttcagtgg tcctgttcca gaacctgagt atctgcaaaa 2460
gttgcacaaa tacctaataa ccagaacaga aagaaatgtt gcagtatatg ctgagagtgc 2520
cacatattgt cttgtgaaga atgctgtgaa aatgtttaag gatattgggg ttttcaagga 2580
gaccaaacaa aagagagtgt ctgttttaga actgagcagc acttttctac ctcaatgcaa 2640
ccgacaaaaa cttctagaat atattctgag ttttgtggtg ctgtaggtaa cgtgtggcac 2700
tgctggcaaa tgaaggtcat gagatgagtt ccttgtaggt accagcttct ggctcaagag 2760
ttgaaggtgc catcgcaggg tcaggcctgc cctgtcccga agtgatctcc tggaagacaa 2820
gtgccttctc cctccatgga tctgtgatct tcccagctct gcatcaacac agcagcctgc 2880
agataacact tggggggacc tcagcctcta ttcgcaactc ataatccgta gactacaaga 2940
tgaaatctca ataaattatt tttgagttta ttaaagattg acattttaag tacaactttt 3000
aaggactaat tactgtgatg gacacagaaa tgtagctgtg ttctggaact gaatcttaca 3060
tggtatactt agtgctgctg ggtaatttgt tggtatatta tctggttagt ggttaatgct 3120
tcctttaaaa ataattgagt catccattca ctctttttca gttttatctg tcaatagtag 3180
ctacattttt aatgggagca ccttttatcc caaagtgctt tataaattga gtggactgat 3240
atatatcaca cccaggtatc actgtgctgt cctttgctgt cagatttaga aatgttttta 3300
agagctatgt gaaaacagac aatattagtt taggtcggga actgagatat tgtaatcaaa 3360
tagttaacat caggaagtta atttggctgg caaaattcta gggaaacttg gccagaaaac 3420
tggtgttgaa ggcttttgct catataaaca agtgccattg agtttcaaat gaccagcaaa 3480
tatatttaga acccttcctg ttttatgtct gtacctcgtc cacccctcag gtaatacctg 3540
cctctcacag gtacagctgt ttcttggaaa tcctccaacc aaatagcagt tttcctaact 3600
tgattagctt gagctgacag actgttagaa tacagttctc tggccacagc tgatgagggc 3660
tttctgtact gcacacagat tgtgtactgc accccagtcc aggtgactgg tacccactcg 3720
agttgtgccg tgcacaacct gtccagtata tgcatgtggt ggccctactg actggtaatg 3780
gttagaggca tttatggatt tttagctttg aggaaaaacc atgactttta acaaattttt 3840
atgggttata tgcctaaacc cttatgccac atagtggtaa ataattatga aaaatggtct 3900
gttcataatt ggtaggtgcc ttttgtgagc agggagcata attattggtt tattatggta 3960
attatggtga ttttttaaat atcatgtaat gttaaaacgt tttctaacag tttactgttg 4020
cttatctcca agatattatg gaattaagaa tttttccaga tgagtgttac atagattctt 4080
tgaatttagt ataaaagtac tgagaattaa gtttgtactt ccataagctt ggattttaaa 4140
cactgatagt atctcatgag taatgtgtgt tttgggagag ggagggatgc tgattgatat 4200
ttcacattgt atgaaatacc atgtttgaaa ctcatagcaa taatgctatg ctgttgtgat 4260
ccctcccaag ttctgcattt aaaatatatt ttttctttat aggaattgat gtataccatg 4320
aagtcattgt cagttgtagt agctctgatg ttgaatgaga tatcatgttt tagcattcca 4380
ttttactgac tagggtagaa gaacactctt cttggctaca tttggaggat acccagggag 4440
tcttgggtgt tccttatctg gggaagcaaa catttcacta gtctcttttt ttcatccttt 4500
aaattgtaaa ttaaggatta ctcaagctca ccattattca agattgggac tcgcttccca 4560
gtcgacactc tgccctgcct gtcattgctg caaagagctg ctgctttgcc aacctaagca 4620
aagaaaatac ggcttctctt gcattatttt cccttttggt tggtttgttt tctagaagta 4680
cgttcagatg ctttggggaa tgcaatgtat gatttgctag ctctctcacc acttaactca 4740
ctgtgaggat aaatatgcat gctttttgta attaactggt gctttgaaaa tcttttttaa 4800
gggagaaaaa tctcaaccaa agttatgctc atccagacaa gctgaccttt gagttaattt 4860
cagcacaact cattcttcag tgcctcatga ctgaaaacaa aaaaaaaaaa aaaaaaaa 4918
<210> 25
<211> 3490
<212> DNA
<213> 智人(homo sapien)
<400> 25
agcgggctgg aagtgcgggc ttctgcagca gccgaagctg gagctgctag ggcagcagcg 60
gctcccctgt tgtatggaca ttctgcaccc gaaactgata gctgagtcct gaagttttat 120
gttatgaaac agaagaactt tcatcccagc acatgatttg ggaattacac tttgtgacat 180
ggatgaatat gcactgaccc ttggtacaat agatgtttct tatctgccac attcatcaga 240
atacagtgtt ggtcgatgta agcacacaag tgaggaatgg ggtgagtgtg gctttagacc 300
caccgtcttc agatctgcaa ctttaaaatg gaaagaaagc ctaatgagtc ggaaaaggcc 360
atttgttgga agatgttgtt actcctgcac tccccagagc tgggacaaat ttttcaacac 420
cagtatcccg tctttgggtt tgcggaatgt tatttatatc aatgaaactc acacaagaca 480
ccgcggatgg cttgcaagac gcctttctta cgttcttttt attcaagagc gagatgtgca 540
taagggcatg tttgccacca atgtgactga aaatgtgctg aacagcagta gagtacaaga 600
ggcaattgca gaagtggctg ctgaattaaa ccctgatggt tctgcccagc agcaatcaaa 660
agccgttaac aaagtgaaaa agaaagctaa aaggattctt caagaaatgg ttgccactgt 720
ctcaccggca atgatcagac tgactgggtg ggtgctgcta aaactgttca acagcttctt 780
ttggaacatt caaattcaca aaggtcaact tgagatggtt aaagctgcaa ctgagacgaa 840
tttgccgctt ctgtttctac cagttcatag atcccatatt gactatctgc tgctcacttt 900
cattctcttc tgccataaca tcaaagcacc atacattgct tcaggcaata atctcaacat 960
cccaatcttc agtaccttga tccataagct tgggggcttc ttcatacgac gaaggctcga 1020
tgaaacacca gatggacgga aagatgttct ctatagagct ttgctccatg ggcatatagt 1080
tgaattactt cgacagcagc aattcttgga gatcttcctg gaaggcacac gttctaggag 1140
tggaaaaacc tcttgtgctc gggcaggact tttgtcagtt gtggtagata ctctgtctac 1200
caatgtcatc ccagacatct tgataatacc tgttggaatc tcctatgatc gcattatcga 1260
aggtcactac aatggtgaac aactgggcaa acctaagaag aatgagagcc tgtggagtgt 1320
agcaagaggt gttattagaa tgttacgaaa aaactatggt tgtgtccgag tggattttgc 1380
acagccattt tccttaaagg aatatttaga aagccaaagt cagaaaccgg tgtctgctct 1440
actttccctg gagcaagcgt tgttaccagc tatacttcct tcaagaccca gtgatgctgc 1500
tgatgaaggt agagacacgt ccattaatga gtccagaaat gcaacagatg aatccctacg 1560
aaggaggttg attgcaaatc tggctgagca tattctattc actgctagca agtcctgtgc 1620
cattatgtcc acacacattg tggcttgcct gctcctctac agacacaggc agggaattga 1680
tctctccaca ttggtcgaag acttctttgt gatgaaagag gaagtcctgg ctcgtgattt 1740
tgacctgggg ttctcaggaa attcagaaga tgtagtaatg catgccatac agctgctggg 1800
aaattgtgtc acaatcaccc acactagcag gaacgatgag ttttttatca cccccagcac 1860
aactgtccca tcagtcttcg aactcaactt ctacagcaat ggggtacttc atgtctttat 1920
catggaggcc atcatagctt gcagccttta tgcagttctg aacaagaggg gactgggggg 1980
tcccactagc accccaccta acctgatcag ccaggagcag ctggtgcgga aggcggccag 2040
cctgtgctac cttctctcca atgaaggcac catctcactg ccttgccaga cattttacca 2100
agtctgccat gaaacagtag gaaagtttat ccagtatggc attcttacag tggcagagca 2160
cgatgaccag gaagatatca gtcctagtct tgctgagcag cagtgggaca agaagcttcc 2220
agaacctttg tcttggagaa gtgatgaaga agatgaagac agtgactttg gggaggaaca 2280
gcgagattgc tacctgaagg tgagccaatc caaggagcac cagcagttta tcaccttctt 2340
acagagactc cttgggcctt tgctggaggc ctacagctct gctgccatct ttgttcacaa 2400
cttcagtggt cctgttccag aacctgagta tctgcaaaag ttgcacaaat acctaataac 2460
cagaacagaa agaaatgttg cagtatatgc tgagagtgcc acatattgtc ttgtgaagaa 2520
tgctgtgaaa atgtttaagg atattggggt tttcaaggag accaaacaaa agagagtgtc 2580
tgttttagaa ctgagcagca cttttctacc tcaatgcaac cgacaaaaac ttctagaata 2640
tattctgagt tttgtggtgc tgtaggtaac gtgtggcact gctggcaaat gaaggtcatg 2700
agatgagttc cttgtaggta caagcttctg gctcaagagt tgaaggtgcc atcgcagggt 2760
caggcctgcc ctgtcccgaa gtgatctcct ggaagacaag tgccttctcc atccatggat 2820
ctgtgatctt cccagctctg catcaacaca gcagcctgca gataacactt ggggggacct 2880
cagcctctat tcgcaactca taatccgtag actacaagat gaaatctcaa taaattattt 2940
ttgagtttat taaagattga cattttaagt acaactttta aggactaatt actgtgatgg 3000
acacagaaat gtagctgtgt tctggaactg aatcttacat ggtatactta gtgctgctgg 3060
gtaatttgtt ggtatattat ctggttagtg gttaatgctt cctttaaaaa taattgagtc 3120
atccattcac tctttttcag ttttatctgt caatagtagc tacattttta atgggagcac 3180
cttttatccc aaagtgcttt ataaattgag tggactgata tatatcacac ccaggtatca 3240
ctgtgctgtc ctttgctgtc agatttagaa atgtttttaa gagctatgtg aaaacagaca 3300
atattagttt aggtcgggaa ctgagatatt gtaatcaaat agttaacatc aggaagttaa 3360
tttggctggc aaaattctag ggaaacttgg ccagaaaact ggtgttgaag gcttttgctc 3420
atataaacaa gtgccattga gtttcaaatg accagcaaat atatttagaa ctcaaaaaaa 3480
aaaaaaaaaa 3490
<210> 26
<211> 2855
<212> DNA
<213> 智人(homo sapien)
<400> 26
aactttcatc ccagcacatg atttgggaat tacactttgt gacatggatg aatctgcact 60
gacccttggt acaatagatg tttcttatct gccacattca tcagaataca gtgttggtcg 120
atgtaagcac acaagtgagg aatggggtga gtgtggcttt agacccaccg tcttcagatc 180
tgcaacttta aaatggaaag aaagcctaat gagtcggaaa aggccatttg ttggaagatg 240
ttgttactcc tgcactcccc agagctggga caaatttttc aaccccagta tcccgtcttt 300
gggtttgcgg aatgttattt atatcaatga aactcacaca agacaccgcg gatggcttgc 360
aagacgcctt tcttacgttc tttttattca agagcgagat gtgcataagg gcatgtttgc 420
caccaatgtg actgaaaatg tgctgaacag cagtagagta caagaggcaa ttgcagaagt 480
ggctgctgaa ttaaaccctg atggttctgc ccagcagcaa tcaaaagccg ttaacaaagt 540
gaaaaagaaa gctaaaagga ttcttcaaga aatggttgcc actgtctcac cggcaatgat 600
cagactgact gggtgggtgc tgctaaaact gttcaacagc ttcttttgga acattcaaat 660
tcacaaaggt caacttgaga tggttaaagc tgcaactgag acgaatttgc cgcttctgtt 720
tctaccagtt catagatccc atattgacta tctgctgctc actttcattc tcttctgcca 780
taacatcaaa gcaccataca ttgcttcagg caataatctc aacatcccaa tcttcagtac 840
cttgatccat aagcttgggg gcttcttcat acgacgaagg ctcgatgaaa caccagatgg 900
acggaaagat gttctctata gagctttgct ccatgggcat atagttgaat tacttcgaca 960
gcagcaattc ttggagatct tcctggaagg cacacgttct aggagtggaa aaacctcttg 1020
tgctcgggca ggacttttgt cagttgtggt agatactctg tctaccaatg tcatcccaga 1080
catcttgata atacctgttg gaatctccta tgatcgcatt atcgaaggtc actacaatgg 1140
tgaacaactg ggcaaaccta agaagaatga gagcctgtgg agtgtagcaa gaggtgttac 1200
tagaatgtta cgaaaaaact atggttgtgt ccgagtggat tttgcacagc cattttcctt 1260
aaaggaatat ttagaaagcc aaagtcagaa accggtgtct gctctacttt ccctggagca 1320
agcgttgtta ccagctatac ttccttcaag acccagtgat gctgctgatg aaggtagaga 1380
cacgtccatt aatgagtcca gaaatgcaac agatgaatcc ctacgaagga ggttgattgc 1440
aaatctggct gagcatattc tattcactgc tagcaagtcc tgtgccatta tgtccacaca 1500
cattgtggct tgcctgctcc tctacagaca caggcaggga attgatctct ccacattggt 1560
cgaagacttc tttgtgatga aagaggaagt cctggctcgt gattttgacc tggggttctc 1620
aggaaattca gaagatgtag taatgcatgc catacagctg ctgggaaatt gtgtcacaat 1680
cacccacact agcaggaacg atgagttttt tatcaccccc agcacaactg tcccatcagt 1740
cttcgaactc aacttctaca gcaatggggt acttcatgtc tttatcatgg aggccatcat 1800
agcttgcagc ctttatgcag ttctgaacaa gaggggactg gggggtccca ctagcacccc 1860
acctaacctg atcagccagg agcagctggt gcggaaggcg gccagcctgt gctaccttct 1920
ctccaatgaa ggcaccatct cactgccttg ccagacattt taccaagtct gccatgaaac 1980
agtaggaaag tttatccagt atggcattct tacagtggca gagcacgatg accaggaaga 2040
tatcagtcct agtcttgctg agcagcagtg ggacaagaag cttcctgaac ctttgtcttg 2100
gagaagtgat gaagaagatg aagacagtga ctttggggag gaacagcgag attgctacct 2160
gaaggtgagc caatccaagg agcaccagca gtttatcacc ttcttacaga gactccttgg 2220
gcctttgctg gaggcctaca gctctgctgc catctttgtt cacaacttca gtggtcctgt 2280
tccagaacct gagtatctgc aaaagttgca caaataccta ataaccagaa cagaaagaaa 2340
tgttgcagta tatgctgaga gtgccacata ttgtcttgtg aagaatgctg tgaaaatgtt 2400
taaggatatt ggggttttca aggagaccaa acaaaagaga gtgtctgttt tagaactgag 2460
cagcactttt ctacctcaat gcaaccgaca aaaacttcta gaatatattc tgagttttgt 2520
ggtgctgtag gtaacgtgtg gcactgctgg caaatgaagg tcatgagatg agttccttgt 2580
aggtaccagc ttctggctca agagttgaag gtgccgtcgc agggtcaggc ctgccctgtc 2640
ccgaggtgat ctcctggaag acaagtgcct tctccctcca tggatctgtg atcttcccag 2700
ctctgcatca acacagcagc ctgcagataa cacttggggg gacctcagcc tctattcgca 2760
actcataatc cgtagactac aagatgaaat ctcaataaat tatttttgag tttattaaag 2820
aggtctttta aggcaaaaaa aaaaaaaaaa aaaaa 2855
<210> 27
<211> 828
<212> PRT
<213> 智人(homo sapien)
<400> 27
Met Asp Glu Ser Ala Leu Thr Leu Gly Thr Ile Asp Val Ser Tyr Leu
1 5 10 15
Pro His Ser Ser Glu Tyr Ser Val Gly Arg Cys Lys His Thr Ser Glu
20 25 30
Glu Trp Gly Glu Cys Gly Phe Arg Pro Thr Ile Phe Arg Ser Ala Thr
35 40 45
Leu Lys Trp Lys Glu Ser Leu Met Ser Arg Lys Arg Pro Phe Val Gly
50 55 60
Arg Cys Cys Tyr Ser Cys Thr Pro Gln Ser Trp Asp Lys Phe Phe Asn
65 70 75 80
Pro Ser Ile Pro Ser Leu Gly Leu Arg Asn Val Ile Tyr Ile Asn Glu
85 90 95
Thr His Thr Arg His Arg Gly Trp Leu Ala Arg Arg Leu Ser Tyr Val
100 105 110
Leu Phe Ile Gln Glu Arg Asp Val His Lys Gly Met Phe Ala Thr Asn
115 120 125
Val Thr Glu Asn Val Leu Asn Ser Ser Arg Val Gln Glu Ala Ile Ala
130 135 140
Glu Val Ala Ala Glu Leu Asn Pro Asp Gly Ser Ala Gln Gln Gln Ser
145 150 155 160
Lys Ala Val Asn Lys Val Lys Lys Lys Ala Lys Arg Ile Leu Gln Glu
165 170 175
Met Val Ala Thr Val Ser Pro Ala Met Ile Arg Leu Thr Gly Trp Val
180 185 190
Leu Leu Lys Leu Phe Asn Ser Phe Phe Trp Asn Ile Gln Ile His Lys
195 200 205
Gly Gln Leu Glu Met Val Lys Ala Ala Thr Glu Thr Asn Leu Pro Leu
210 215 220
Leu Phe Leu Pro Val His Arg Ser His Ile Asp Tyr Leu Leu Leu Thr
225 230 235 240
Phe Ile Leu Phe Cys His Asn Ile Lys Ala Pro Tyr Ile Ala Ser Gly
245 250 255
Asn Asn Leu Asn Ile Pro Ile Phe Ser Thr Leu Ile His Lys Leu Gly
260 265 270
Gly Phe Phe Ile Arg Arg Arg Leu Asp Glu Thr Pro Asp Gly Arg Lys
275 280 285
Asp Val Leu Tyr Arg Ala Leu Leu His Gly His Ile Val Glu Leu Leu
290 295 300
Arg Gln Gln Gln Phe Leu Glu Ile Phe Leu Glu Gly Thr Arg Ser Arg
305 310 315 320
Ser Gly Lys Thr Ser Cys Ala Arg Ala Gly Leu Leu Ser Val Val Val
325 330 335
Asp Thr Leu Ser Thr Asn Val Ile Pro Asp Ile Leu Ile Ile Pro Val
340 345 350
Gly Ile Ser Tyr Asp Arg Ile Ile Glu Gly His Tyr Asn Gly Glu Gln
355 360 365
Leu Gly Lys Pro Lys Lys Asn Glu Ser Leu Trp Ser Val Ala Arg Gly
370 375 380
Val Ile Arg Met Leu Arg Lys Asn Tyr Gly Cys Val Arg Val Asp Phe
385 390 395 400
Ala Gln Pro Phe Ser Leu Lys Glu Tyr Leu Glu Ser Gln Ser Gln Lys
405 410 415
Pro Val Ser Ala Leu Leu Ser Leu Glu Gln Ala Leu Leu Pro Ala Ile
420 425 430
Leu Pro Ser Arg Pro Ser Asp Ala Ala Asp Glu Gly Arg Asp Thr Ser
435 440 445
Ile Asn Glu Ser Arg Asn Ala Thr Asp Glu Ser Leu Arg Arg Arg Leu
450 455 460
Ile Ala Asn Leu Ala Glu His Ile Leu Phe Thr Ala Ser Lys Ser Cys
465 470 475 480
Ala Ile Met Ser Thr His Ile Val Ala Cys Leu Leu Leu Tyr Arg His
485 490 495
Arg Gln Gly Ile Asp Leu Ser Thr Leu Val Glu Asp Phe Phe Val Met
500 505 510
Lys Glu Glu Val Leu Ala Arg Asp Phe Asp Leu Gly Phe Ser Gly Asn
515 520 525
Ser Glu Asp Val Val Met His Ala Ile Gln Leu Leu Gly Asn Cys Val
530 535 540
Thr Ile Thr His Thr Ser Arg Asn Asp Glu Phe Phe Ile Thr Pro Ser
545 550 555 560
Thr Thr Val Pro Ser Val Phe Glu Leu Asn Phe Tyr Ser Asn Gly Val
565 570 575
Leu His Val Phe Ile Met Glu Ala Ile Ile Ala Cys Ser Leu Tyr Ala
580 585 590
Val Leu Asn Lys Arg Gly Leu Gly Gly Pro Thr Ser Thr Pro Pro Asn
595 600 605
Leu Ile Ser Gln Glu Gln Leu Val Arg Lys Ala Ala Ser Leu Cys Tyr
610 615 620
Leu Leu Ser Asn Glu Gly Thr Ile Ser Leu Pro Cys Gln Thr Phe Tyr
625 630 635 640
Gln Val Cys His Glu Thr Val Gly Lys Phe Ile Gln Tyr Gly Ile Leu
645 650 655
Thr Val Ala Glu His Asp Asp Gln Glu Asp Ile Ser Pro Ser Leu Ala
660 665 670
Glu Gln Gln Trp Asp Lys Lys Leu Pro Glu Pro Leu Ser Trp Arg Ser
675 680 685
Asp Glu Glu Asp Glu Asp Ser Asp Phe Gly Glu Glu Gln Arg Asp Cys
690 695 700
Tyr Leu Lys Val Ser Gln Ser Lys Glu His Gln Gln Phe Ile Thr Phe
705 710 715 720
Leu Gln Arg Leu Leu Gly Pro Leu Leu Glu Ala Tyr Ser Ser Ala Ala
725 730 735
Ile Phe Val His Asn Phe Ser Gly Pro Val Pro Glu Pro Glu Tyr Leu
740 745 750
Gln Lys Leu His Lys Tyr Leu Ile Thr Arg Thr Glu Arg Asn Val Ala
755 760 765
Val Tyr Ala Glu Ser Ala Thr Tyr Cys Leu Val Lys Asn Ala Val Lys
770 775 780
Met Phe Lys Asp Ile Gly Val Phe Lys Glu Thr Lys Gln Lys Arg Val
785 790 795 800
Ser Val Leu Glu Leu Ser Ser Thr Phe Leu Pro Gln Cys Asn Arg Gln
805 810 815
Lys Leu Leu Glu Tyr Ile Leu Ser Phe Val Val Leu
820 825
<210> 28
<211> 710
<212> PRT
<213> 智人(homo sapien)
<400> 28
Met Asp Glu Ser Ala Leu Thr Leu Gly Thr Ile Asp Val Ser Tyr Leu
1 5 10 15
Pro His Ser Ser Glu Tyr Ser Val Gly Arg Cys Lys His Thr Ser Glu
20 25 30
Glu Trp Gly Glu Cys Gly Phe Arg Pro Thr Ile Phe Arg Ser Ala Thr
35 40 45
Leu Lys Trp Lys Glu Ser Leu Met Ser Arg Lys Arg Pro Phe Val Gly
50 55 60
Arg Cys Cys Tyr Ser Cys Thr Pro Gln Ser Trp Asp Lys Phe Phe Asn
65 70 75 80
Pro Ser Ile Pro Ser Leu Gly Leu Arg Asn Val Ile Tyr Ile Asn Glu
85 90 95
Thr His Thr Arg His Arg Gly Trp Leu Ala Arg Arg Leu Ser Tyr Val
100 105 110
Leu Phe Ile Gln Glu Arg Asp Val His Lys Gly Met Phe Ala Thr Asn
115 120 125
Val Thr Glu Asn Val Leu Asn Ser Ser Arg Val Gln Glu Ala Ile Ala
130 135 140
Glu Val Ala Ala Glu Leu Asn Pro Asp Gly Ser Ala Gln Gln Gln Ser
145 150 155 160
Lys Ala Val Asn Lys Val Lys Lys Lys Ala Lys Arg Ile Leu Gln Glu
165 170 175
Met Val Ala Thr Val Ser Pro Ala Met Ile Arg Leu Thr Gly Trp Val
180 185 190
Leu Leu Lys Leu Phe Asn Ser Phe Phe Trp Asn Ile Gln Ile His Lys
195 200 205
Gly Gln Leu Glu Met Val Lys Ala Ala Thr Glu Thr Asn Leu Pro Leu
210 215 220
Leu Phe Leu Pro Val His Arg Ser His Ile Asp Tyr Leu Leu Leu Thr
225 230 235 240
Phe Ile Leu Phe Cys His Asn Ile Lys Ala Pro Tyr Ile Ala Ser Gly
245 250 255
Asn Asn Leu Asn Ile Pro Ile Phe Ser Thr Leu Ile His Lys Leu Gly
260 265 270
Gly Phe Phe Ile Arg Arg Arg Leu Asp Glu Thr Pro Asp Gly Arg Lys
275 280 285
Asp Val Leu Tyr Arg Ala Leu Leu His Gly His Ile Val Glu Leu Leu
290 295 300
Arg Gln Gln Gln Phe Leu Glu Ile Phe Leu Glu Gly Thr Arg Ser Arg
305 310 315 320
Ser Gly Lys Thr Ser Cys Ala Arg Ala Gly Leu Leu Ser Val Val Val
325 330 335
Asp Thr Leu Ser Thr Asn Val Ile Pro Asp Ile Leu Ile Ile Pro Val
340 345 350
Gly Ile Ser Tyr Asp Arg Ile Ile Glu Gly His Tyr Asn Gly Glu Gln
355 360 365
Leu Gly Lys Pro Lys Lys Asn Glu Ser Leu Trp Ser Val Ala Arg Gly
370 375 380
Val Ile Arg Met Leu Arg Lys Asn Tyr Gly Cys Val Arg Val Asp Phe
385 390 395 400
Ala Gln Pro Phe Ser Leu Lys Glu Tyr Leu Glu Ser Gln Ser Gln Lys
405 410 415
Pro Val Ser Ala Leu Leu Ser Leu Glu Gln Ala Leu Leu Pro Ala Ile
420 425 430
Leu Pro Ser Arg Pro Ser Asp Ala Ala Asp Glu Gly Arg Asp Thr Ser
435 440 445
Ile Asn Glu Ser Arg Asn Ala Thr Asp Glu Ser Leu Arg Arg Arg Leu
450 455 460
Ile Ala Asn Leu Ala Glu His Ile Leu Phe Thr Ala Ser Lys Ser Cys
465 470 475 480
Ala Ile Met Ser Thr His Ile Val Ala Cys Leu Leu Leu Tyr Arg His
485 490 495
Arg Gln Gly Ile Asp Leu Ser Thr Leu Val Glu Asp Phe Phe Val Met
500 505 510
Lys Glu Glu Val Leu Ala Arg Asp Phe Asp Leu Gly Phe Ser Gly Asn
515 520 525
Ser Glu Asp Val Val Met His Ala Ile Gln Leu Leu Gly Asn Cys Val
530 535 540
Thr Ile Thr His Thr Ser Arg Asn Asp Glu Phe Phe Ile Thr Pro Ser
545 550 555 560
Thr Thr Val Pro Ser Val Phe Glu Leu Asn Phe Tyr Ser Asn Gly Val
565 570 575
Leu His Val Phe Ile Met Glu Ala Ile Ile Ala Cys Ser Leu Tyr Ala
580 585 590
Val Leu Asn Lys Arg Gly Leu Gly Gly Pro Thr Ser Thr Pro Pro Asn
595 600 605
Leu Ile Ser Gln Glu Gln Leu Val Arg Lys Ala Ala Ser Leu Cys Tyr
610 615 620
Leu Leu Ser Asn Glu Gly Thr Ile Ser Leu Pro Cys Gln Thr Phe Tyr
625 630 635 640
Gln Val Cys His Glu Thr Val Gly Lys Phe Ile Gln Tyr Gly Ile Leu
645 650 655
Thr Val Ala Glu His Asp Asp Gln Glu Asp Ile Ser Pro Ser Leu Ala
660 665 670
Glu Gln Gln Trp Asp Lys Lys Leu Pro Glu Pro Leu Ser Trp Arg Ser
675 680 685
Asp Glu Glu Asp Glu Asp Ser Asp Phe Gly Glu Glu Gln Arg Asp Cys
690 695 700
Tyr Leu Lys Val Leu Gly
705 710
<210> 29
<211> 828
<212> PRT
<213> 智人(homo sapien)
<400> 29
Met Asp Glu Ser Ala Leu Thr Leu Gly Thr Ile Asp Val Ser Tyr Leu
1 5 10 15
Pro His Ser Ser Glu Tyr Ser Val Gly Arg Cys Lys His Thr Ser Glu
20 25 30
Glu Trp Gly Glu Cys Gly Phe Arg Pro Thr Val Phe Arg Ser Ala Thr
35 40 45
Leu Lys Trp Lys Glu Ser Leu Met Ser Arg Lys Arg Pro Phe Val Gly
50 55 60
Arg Cys Cys Tyr Ser Cys Thr Pro Gln Ser Trp Asp Lys Phe Phe Asn
65 70 75 80
Pro Ser Ile Pro Ser Leu Gly Leu Arg Asn Val Ile Tyr Ile Asn Glu
85 90 95
Thr His Thr Arg His Arg Gly Trp Leu Ala Arg Arg Leu Ser Tyr Val
100 105 110
Leu Phe Ile Gln Glu Arg Asp Val His Lys Gly Met Phe Ala Thr Asn
115 120 125
Val Thr Glu Asn Val Leu Asn Ser Ser Arg Val Gln Glu Ala Ile Ala
130 135 140
Glu Val Ala Ala Glu Leu Asn Pro Asp Gly Ser Ala Gln Gln Gln Ser
145 150 155 160
Lys Ala Val Asn Lys Val Lys Lys Lys Ala Lys Arg Ile Leu Gln Glu
165 170 175
Met Val Ala Thr Val Ser Pro Ala Met Ile Arg Leu Thr Gly Trp Val
180 185 190
Leu Leu Lys Leu Phe Asn Ser Phe Phe Trp Asn Ile Gln Ile His Lys
195 200 205
Gly Gln Leu Glu Met Val Lys Ala Ala Thr Glu Thr Asn Leu Pro Leu
210 215 220
Leu Phe Leu Pro Val His Arg Ser His Ile Asp Tyr Leu Leu Leu Thr
225 230 235 240
Phe Ile Leu Phe Cys His Asn Ile Lys Ala Pro Tyr Ile Ala Ser Gly
245 250 255
Asn Asn Leu Asn Ile Pro Ile Phe Ser Thr Leu Ile His Lys Leu Gly
260 265 270
Gly Phe Phe Ile Arg Arg Arg Leu Asp Glu Thr Pro Asp Gly Arg Lys
275 280 285
Asp Val Leu Tyr Arg Ala Leu Leu His Gly His Ile Val Glu Leu Leu
290 295 300
Arg Gln Gln Gln Phe Leu Glu Ile Phe Leu Glu Gly Thr Arg Ser Arg
305 310 315 320
Ser Gly Lys Thr Ser Cys Ala Arg Ala Gly Leu Leu Ser Val Val Val
325 330 335
Asp Thr Leu Ser Thr Asn Val Ile Pro Asp Ile Leu Ile Ile Pro Val
340 345 350
Gly Ile Ser Tyr Asp Arg Ile Ile Glu Gly His Tyr Asn Gly Glu Gln
355 360 365
Leu Gly Lys Pro Lys Lys Asn Glu Ser Leu Trp Ser Val Ala Arg Gly
370 375 380
Val Ile Arg Met Leu Arg Lys Asn Tyr Gly Cys Val Arg Val Asp Phe
385 390 395 400
Ala Gln Pro Phe Ser Leu Lys Glu Tyr Leu Glu Ser Gln Ser Gln Lys
405 410 415
Pro Val Ser Ala Leu Leu Ser Leu Glu Gln Ala Leu Leu Pro Ala Ile
420 425 430
Leu Pro Ser Arg Pro Ser Asp Ala Ala Asp Glu Gly Arg Asp Thr Ser
435 440 445
Ile Asn Glu Ser Arg Asn Ala Thr Asp Glu Ser Leu Arg Arg Arg Leu
450 455 460
Ile Ala Asn Leu Ala Glu His Ile Leu Phe Thr Ala Ser Lys Ser Cys
465 470 475 480
Ala Ile Met Ser Thr His Ile Val Ala Cys Leu Leu Leu Tyr Arg His
485 490 495
Arg Gln Gly Ile Asp Leu Ser Thr Leu Val Glu Asp Phe Phe Val Met
500 505 510
Lys Glu Glu Val Leu Ala Arg Asp Phe Asp Leu Gly Phe Ser Gly Asn
515 520 525
Ser Glu Asp Val Val Met His Ala Ile Gln Leu Leu Gly Asn Cys Val
530 535 540
Thr Ile Thr His Thr Ser Arg Asn Asp Glu Phe Phe Ile Thr Pro Ser
545 550 555 560
Thr Thr Val Pro Ser Val Phe Glu Leu Asn Phe Tyr Ser Asn Gly Val
565 570 575
Leu His Val Phe Ile Met Glu Ala Ile Ile Ala Cys Ser Leu Tyr Ala
580 585 590
Val Leu Asn Lys Arg Gly Leu Gly Gly Pro Thr Ser Thr Pro Pro Asn
595 600 605
Leu Ile Ser Gln Glu Gln Leu Val Arg Lys Ala Ala Ser Leu Cys Tyr
610 615 620
Leu Leu Ser Asn Glu Gly Thr Ile Ser Leu Pro Cys Gln Thr Phe Tyr
625 630 635 640
Gln Val Cys His Glu Thr Val Gly Lys Phe Ile Gln Tyr Gly Ile Leu
645 650 655
Thr Val Ala Glu His Asp Asp Gln Glu Asp Ile Ser Pro Ser Leu Ala
660 665 670
Glu Gln Gln Trp Asp Lys Lys Leu Pro Glu Pro Leu Ser Trp Arg Ser
675 680 685
Asp Glu Glu Asp Glu Asp Ser Asp Phe Gly Glu Glu Gln Arg Asp Cys
690 695 700
Tyr Leu Lys Val Ser Gln Ser Lys Glu His Gln Gln Phe Ile Thr Phe
705 710 715 720
Leu Gln Arg Leu Leu Gly Pro Leu Leu Glu Ala Tyr Ser Ser Ala Ala
725 730 735
Ile Phe Val His Asn Phe Ser Gly Pro Val Pro Glu Pro Glu Tyr Leu
740 745 750
Gln Lys Leu His Lys Tyr Leu Ile Thr Arg Thr Glu Arg Asn Val Ala
755 760 765
Val Tyr Ala Glu Ser Ala Thr Tyr Cys Leu Val Lys Asn Ala Val Lys
770 775 780
Met Phe Lys Asp Ile Gly Val Phe Lys Glu Thr Lys Gln Lys Arg Val
785 790 795 800
Ser Val Leu Glu Leu Ser Ser Thr Phe Leu Pro Gln Cys Asn Arg Gln
805 810 815
Lys Leu Leu Glu Tyr Ile Leu Ser Phe Val Val Leu
820 825
<210> 30
<211> 710
<212> PRT
<213> 智人(homo sapien)
<400> 30
Met Asp Glu Ser Ala Leu Thr Leu Gly Thr Ile Asp Val Ser Tyr Leu
1 5 10 15
Pro His Ser Ser Glu Tyr Ser Val Gly Arg Cys Lys His Thr Ser Glu
20 25 30
Glu Trp Gly Glu Cys Gly Phe Arg Pro Thr Val Phe Arg Ser Ala Thr
35 40 45
Leu Lys Trp Lys Glu Ser Leu Met Ser Arg Lys Arg Pro Phe Val Gly
50 55 60
Arg Cys Cys Tyr Ser Cys Thr Pro Gln Ser Trp Asp Lys Phe Phe Asn
65 70 75 80
Pro Ser Ile Pro Ser Leu Gly Leu Arg Asn Val Ile Tyr Ile Asn Glu
85 90 95
Thr His Thr Arg His Arg Gly Trp Leu Ala Arg Arg Leu Ser Tyr Val
100 105 110
Leu Phe Ile Gln Glu Arg Asp Val His Lys Gly Met Phe Ala Thr Asn
115 120 125
Val Thr Glu Asn Val Leu Asn Ser Ser Arg Val Gln Glu Ala Ile Ala
130 135 140
Glu Val Ala Ala Glu Leu Asn Pro Asp Gly Ser Ala Gln Gln Gln Ser
145 150 155 160
Lys Ala Val Asn Lys Val Lys Lys Lys Ala Lys Arg Ile Leu Gln Glu
165 170 175
Met Val Ala Thr Val Ser Pro Ala Met Ile Arg Leu Thr Gly Trp Val
180 185 190
Leu Leu Lys Leu Phe Asn Ser Phe Phe Trp Asn Ile Gln Ile His Lys
195 200 205
Gly Gln Leu Glu Met Val Lys Ala Ala Thr Glu Thr Asn Leu Pro Leu
210 215 220
Leu Phe Leu Pro Val His Arg Ser His Ile Asp Tyr Leu Leu Leu Thr
225 230 235 240
Phe Ile Leu Phe Cys His Asn Ile Lys Ala Pro Tyr Ile Ala Ser Gly
245 250 255
Asn Asn Leu Asn Ile Pro Ile Phe Ser Thr Leu Ile His Lys Leu Gly
260 265 270
Gly Phe Phe Ile Arg Arg Arg Leu Asp Glu Thr Pro Asp Gly Arg Lys
275 280 285
Asp Val Leu Tyr Arg Ala Leu Leu His Gly His Ile Val Glu Leu Leu
290 295 300
Arg Gln Gln Gln Phe Leu Glu Ile Phe Leu Glu Gly Thr Arg Ser Arg
305 310 315 320
Ser Gly Lys Thr Ser Cys Ala Arg Ala Gly Leu Leu Ser Val Val Val
325 330 335
Asp Thr Leu Ser Thr Asn Val Ile Pro Asp Ile Leu Ile Ile Pro Val
340 345 350
Gly Ile Ser Tyr Asp Arg Ile Ile Glu Gly His Tyr Asn Gly Glu Gln
355 360 365
Leu Gly Lys Pro Lys Lys Asn Glu Ser Leu Trp Ser Val Ala Arg Gly
370 375 380
Val Ile Arg Met Leu Arg Lys Asn Tyr Gly Cys Val Arg Val Asp Phe
385 390 395 400
Ala Gln Pro Phe Ser Leu Lys Glu Tyr Leu Glu Ser Gln Ser Gln Lys
405 410 415
Pro Val Ser Ala Leu Leu Ser Leu Glu Gln Ala Leu Leu Pro Ala Ile
420 425 430
Leu Pro Ser Arg Pro Ser Asp Ala Ala Asp Glu Gly Arg Asp Thr Ser
435 440 445
Ile Asn Glu Ser Arg Asn Ala Thr Asp Glu Ser Leu Arg Arg Arg Leu
450 455 460
Ile Ala Asn Leu Ala Glu His Ile Leu Phe Thr Ala Ser Lys Ser Cys
465 470 475 480
Ala Ile Met Ser Thr His Ile Val Ala Cys Leu Leu Leu Tyr Arg His
485 490 495
Arg Gln Gly Ile Asp Leu Ser Thr Leu Val Glu Asp Phe Phe Val Met
500 505 510
Lys Glu Glu Val Leu Ala Arg Asp Phe Asp Leu Gly Phe Ser Gly Asn
515 520 525
Ser Glu Asp Val Val Met His Ala Ile Gln Leu Leu Gly Asn Cys Val
530 535 540
Thr Ile Thr His Thr Ser Arg Asn Asp Glu Phe Phe Ile Thr Pro Ser
545 550 555 560
Thr Thr Val Pro Ser Val Phe Glu Leu Asn Phe Tyr Ser Asn Gly Val
565 570 575
Leu His Val Phe Ile Met Glu Ala Ile Ile Ala Cys Ser Leu Tyr Ala
580 585 590
Val Leu Asn Lys Arg Gly Leu Gly Gly Pro Thr Ser Thr Pro Pro Asn
595 600 605
Leu Ile Ser Gln Glu Gln Leu Val Arg Lys Ala Ala Ser Leu Cys Tyr
610 615 620
Leu Leu Ser Asn Glu Gly Thr Ile Ser Leu Pro Cys Gln Thr Phe Tyr
625 630 635 640
Gln Val Cys His Glu Thr Val Gly Lys Phe Ile Gln Tyr Gly Ile Leu
645 650 655
Thr Val Ala Glu His Asp Asp Gln Glu Asp Ile Ser Pro Ser Leu Ala
660 665 670
Glu Gln Gln Trp Asp Lys Lys Leu Pro Glu Pro Leu Ser Trp Arg Ser
675 680 685
Asp Glu Glu Asp Glu Asp Ser Asp Phe Gly Glu Glu Gln Arg Asp Cys
690 695 700
Tyr Leu Lys Val Leu Gly
705 710
<210> 31
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 31
atggcctttt ccgactcatt 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 32
aaagcctaat gagtcggaaa 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 33
gtaaggttct tacccagctc 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 34
attagggtca ataagcagta 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 35
agtcggaaaa ggccatttgt 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 36
taaggttctt acccagctct 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 37
aatatttgtc agggtgagtg 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 38
gttgcagatc tgaagatggt 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 39
tacccagctc tggggagtgc 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 40
ggaaagaaag cctaatgagt 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 41
aaggttctta cccagctctg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 42
agttgcagat ctgaagatgg 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 43
attatttcca actttgtagt 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> gRNA识别序列
<400> 44
taacaacatc ttccaacaaa 20

Claims (96)

1.一种治疗患有肝病或有患肝病的风险的受试者的方法,所述方法包括向所述受试者施用甘油-3-磷酸酰基转移酶(GPAM)抑制剂。
2.一种治疗患有脂肪肝病或有患脂肪肝病的风险的受试者的方法,所述方法包括向所述受试者施用甘油-3-磷酸酰基转移酶(GPAM)抑制剂。
3.根据权利要求2所述的方法,其中所述脂肪肝病是酒精性脂肪肝病(AFLD)或非酒精性脂肪肝病(NAFLD)。
4.一种治疗患有肝细胞癌或有患肝细胞癌的风险的受试者的方法,所述方法包括向所述受试者施用甘油-3-磷酸酰基转移酶(GPAM)抑制剂。
5.一种治疗患有肝硬化或有患肝硬化的风险的受试者的方法,所述方法包括向所述受试者施用甘油-3-磷酸酰基转移酶(GPAM)抑制剂。
6.一种治疗患有肝纤维化或有患肝纤维化的风险的受试者的方法,所述方法包括向所述受试者施用甘油-3-磷酸酰基转移酶(GPAM)抑制剂。
7.一种治疗患有单纯性脂肪变性、脂肪性肝炎或非酒精性脂肪性肝炎(NASH)或有患单纯性脂肪变性、脂肪性肝炎或NASH的风险的受试者的方法,所述方法包括向所述受试者施用甘油-3-磷酸酰基转移酶(GPAM)抑制剂。
8.根据权利要求1至7中任一项所述的方法,其中所述GPAM抑制剂包含与GPAM mRNA杂交的反义核酸分子、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
9.根据权利要求1至7中任一项所述的方法,其中所述GPAM抑制剂包含与GPAM基因组核酸分子内的gRNA识别序列杂交的Cas蛋白和指导RNA(gRNA)。
10.根据权利要求9所述的方法,其中所述Cas蛋白是Cas9或Cpf1。
11.根据权利要求9或权利要求10所述的方法,其中所述gRNA识别序列包括或邻近对应于根据SEQ ID NO:1的位置3,195的位置。
12.根据权利要求9或权利要求10所述的方法,其中所述gRNA识别序列位于距对应于根据SEQ ID NO:1的位置3,195的位置约1000、约500、约400、约300、约200、约100、约50、约45、约40、约35、约30、约25、约20、约15、约10或约5个核苷酸处。
13.根据权利要求9或权利要求10所述的方法,其中原间隔序列邻近基序(PAM)序列在所述gRNA识别序列下游约2至约6个核苷酸处。
14.根据权利要求9至13中任一项所述的方法,其中所述gRNA包含约17至约23个核苷酸。
15.根据权利要求9至13中任一项所述的方法,其中所述gRNA识别序列包含根据SEQ IDNO:31-44中任一者的核苷酸序列。
16.根据权利要求1至7中任一项所述的方法,其中所述GPAM抑制剂包含小分子。
17.根据权利要求1至16中任一项所述的方法,所述方法还包括检测来自所述受试者的生物样品中编码人GPAM多肽的GPAM预测功能丧失变体核酸分子的存在或不存在。
18.根据权利要求17所述的方法,其中当所述受试者是GPAM参考时,还以标准剂量向所述受试者施用治疗或抑制肝病的治疗剂。
19.根据权利要求17所述的方法,其中当所述受试者对GPAM预测功能丧失变体呈杂合时,还以等于或低于标准剂量的剂量向所述受试者施用治疗或抑制肝病的治疗剂。
20.根据权利要求17至19中任一项所述的方法,其中所述GPAM预测功能丧失变体核酸分子是编码GPAM Ile43Val的核酸分子。
21.根据权利要求20所述的方法,其中所述GPAM预测功能丧失变体核酸分子是:
具有以下核苷酸序列的基因组核酸分子,所述核苷酸序列包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤;
具有包含对应于以下的位置处的鸟嘌呤的核苷酸序列的mRNA分子:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;或
由所述生物样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含对应于以下的位置处的鸟嘌呤的核苷酸序列:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
22.根据权利要求17至21中任一项所述的方法,其中所述检测步骤在体外进行。
23.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括对所述生物样品中的所述GPAM基因组核酸分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置;
其中当所述生物样品中的所述GPAM基因组核酸分子的所述测序部分包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤时,则所述生物样品中的所述GPAM基因组核酸分子是GPAM预测功能丧失变体基因组核酸分子。
24.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括对所述生物样品中的所述GPAM mRNA分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于以下的位置:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;
其中当所述生物样品中的所述GPAM mRNA分子的所述测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的所述GPAM mRNA分子是GPAM预测功能丧失变体mRNA分子:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
25.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括对所述生物样品中由mRNA分子产生的所述GPAM cDNA分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于以下的位置:根据SEQ ID NO:21或其互补序列的位置327;根据SEQID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQID NO:26或其互补序列的位置170;
其中当所述生物样品中的所述GPAM cDNA分子的所述测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中由mRNA分子产生的所述GPAM cDNA分子是GPAM预测功能丧失变体cDNA分子:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
26.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM基因组核酸分子的核苷酸序列的一部分杂交,所述部分接近对应于根据SEQ ID NO:2的位置3,195的位置;
b)将所述引物延伸至少通过所述GPAM基因组核酸分子的核苷酸序列中对应于根据SEQID NO:2的位置3,195的位置;以及
c)确定所述引物的延伸产物是否包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤。
27.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM mRNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;
b)将所述引物延伸至少通过所述GPAM mRNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ IDNO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;以及
c)确定所述引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
28.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM cDNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;
b)将所述引物延伸至少通过所述GPAM cDNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;以及
c)确定所述引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ IDNO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
29.根据权利要求23至28中任一项所述的方法,其中所述检测步骤包括对整个核酸分子进行测序。
30.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
a)对编码所述人GPAM多肽的所述基因组核酸分子的至少一部分进行扩增,其中所述部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及
d)检测所述可检测标记。
31.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
a)对编码所述人GPAM多肽的所述mRNA分子的至少一部分进行扩增,其中所述部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ IDNO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ IDNO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ IDNO:14或其互补序列的位置170;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及
d)检测所述可检测标记。
32.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
a)对编码所述人GPAM多肽的所述cDNA分子的至少一部分进行扩增,其中所述部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ IDNO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ IDNO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ IDNO:26或其互补序列的位置170;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及
d)检测所述可检测标记。
33.根据权利要求32所述的方法,其中所述样品中的所述核酸分子是mRNA,并且在所述扩增步骤之前将所述mRNA逆转录成cDNA。
34.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
将所述生物样品中的所述基因组核酸分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及
检测所述可检测标记。
35.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
将所述生物样品中的所述mRNA分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及
检测所述可检测标记。
36.根据权利要求17至22中任一项所述的方法,其中所述检测步骤包括:
将所述生物样品中的所述cDNA分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ IDNO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ IDNO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及
检测所述可检测标记。
37.一种用治疗或抑制肝病的治疗剂治疗受试者的方法,其中所述受试者罹患肝病,所述方法包括以下步骤:
通过如下方式确定所述受试者是否具有编码人甘油-3-磷酸酰基转移酶(GPAM)多肽的GPAM预测功能丧失变体核酸分子:
获得或已经获得来自所述受试者的生物样品;和
对所述生物样品进行或已经进行序列分析以确定所述受试者是否具有包含所述GPAM预测功能丧失变体核酸分子的基因型;以及
当所述受试者是GPAM参考时,则以标准剂量向所述受试者施用或继续施用所述治疗或抑制肝病的治疗剂,并且向所述受试者施用GPAM抑制剂;以及
当所述受试者对GPAM预测功能丧失变体呈杂合时,以等于或低于标准剂量的量向所述受试者施用或继续施用所述治疗或抑制肝病的治疗剂,并且向所述受试者施用GPAM抑制剂;
其中具有编码所述人GPAM多肽的所述GPAM预测功能丧失变体核酸分子的基因型的存在表明所述受试者患肝病的风险降低。
38.根据权利要求37所述的方法,其中所述受试者是GPAM参考,并且以标准剂量向所述受试者施用或继续施用所述治疗或抑制肝病的治疗剂,并且施用GPAM抑制剂。
39.根据权利要求37所述的方法,其中所述受试者对GPAM预测功能丧失变体呈杂合,并且以等于或低于标准剂量的量向所述受试者施用或继续施用所述治疗或抑制肝病的治疗剂,并且施用GPAM抑制剂。
40.根据权利要求37至39中任一项所述的方法,其中所述GPAM预测功能丧失变体核酸分子是编码GPAM Ile43Val的核酸分子。
41.根据权利要求37至40中任一项所述的方法,其中所述GPAM预测功能丧失变体核酸分子是:
具有以下核苷酸序列的基因组核酸分子,所述核苷酸序列包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤;
具有包含对应于以下的位置处的鸟嘌呤的核苷酸序列的mRNA分子:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;或
由所述生物样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含对应于以下的位置处的鸟嘌呤的核苷酸序列:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
42.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括对所述生物样品中的所述GPAM基因组核酸分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置;
其中当所述生物样品中的所述GPAM基因组核酸分子的所述测序部分包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤时,则所述生物样品中的所述GPAM基因组核酸分子是GPAM预测功能丧失变体基因组核酸分子。
43.根据权利要求37至41任一项所述的方法,其中所述序列分析包括对所述生物样品中的所述GPAM mRNA分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于以下的位置:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;
其中当所述生物样品中的所述GPAM mRNA分子的所述测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的所述GPAM mRNA分子是GPAM预测功能丧失变体mRNA分子:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
44.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括对所述生物样品中由mRNA分子产生的所述GPAM cDNA分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于以下的位置:根据SEQ ID NO:21或其互补序列的位置327;根据SEQID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQID NO:26或其互补序列的位置170;
其中当所述生物样品中的所述GPAM cDNA分子的所述测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中由mRNA分子产生的所述GPAM cDNA分子是GPAM预测功能丧失变体cDNA分子:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
45.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM基因组核酸分子的核苷酸序列的一部分杂交,所述部分接近对应于根据SEQ ID NO:2的位置3,195的位置;
b)将所述引物延伸至少通过所述GPAM基因组核酸分子的核苷酸序列的对应于根据SEQID NO:2的位置3,195的位置;以及
c)确定所述引物的延伸产物是否包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤。
46.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM mRNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;
b)将所述引物延伸至少通过所述GPAM mRNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;以及
c)确定所述引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
47.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM cDNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;
b)将所述引物延伸至少通过所述GPAM cDNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;以及
c)确定所述引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ IDNO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
48.根据权利要求42至47中任一项所述的方法,其中所述序列分析包括对整个核酸分子进行测序。
49.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
a)对编码所述人GPAM多肽的所述基因组核酸分子的至少一部分进行扩增,其中所述部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及
d)检测所述可检测标记。
50.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
a)对编码所述人GPAM多肽的所述mRNA分子的至少一部分进行扩增,其中所述部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ IDNO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ IDNO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ IDNO:14或其互补序列的位置170;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及
d)检测所述可检测标记。
51.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
a)对编码所述人GPAM多肽的所述cDNA分子的至少一部分进行扩增,其中所述部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ IDNO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ IDNO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ IDNO:26或其互补序列的位置170;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及
d)检测所述可检测标记。
52.根据权利要求51所述的方法,其中所述样品中的所述核酸分子是mRNA,并且在所述扩增步骤之前将所述mRNA逆转录成cDNA。
53.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
将所述生物样品中的所述基因组核酸分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及
检测所述可检测标记。
54.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
将所述生物样品中的所述mRNA分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及
检测所述可检测标记。
55.根据权利要求37至41中任一项所述的方法,其中所述序列分析包括:
将所述生物样品中的所述cDNA分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ IDNO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ IDNO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及
检测所述可检测标记。
56.根据权利要求37至55中任一项所述的方法,其中所述核酸分子存在于从所述受试者获得的细胞内。
57.根据权利要求37至56中任一项所述的方法,其中所述GPAM抑制剂包含与GPAM mRNA杂交的反义核酸分子、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
58.根据权利要求37至56中任一项所述的方法,其中所述GPAM抑制剂包含与GPAM基因组核酸分子内的gRNA识别序列杂交的Cas蛋白和指导RNA(gRNA)。
59.根据权利要求58所述的方法,其中所述Cas蛋白是Cas9或Cpf1。
60.根据权利要求58或权利要求59所述的方法,其中所述gRNA识别序列包括或邻近对应于根据SEQ ID NO:1的位置3,195的位置。
61.根据权利要求58或权利要求59所述的方法,其中所述gRNA识别序列位于距对应于根据SEQ ID NO:1的位置3,195的位置约1000、约500、约400、约300、约200、约100、约50、约45、约40、约35、约30、约25、约20、约15、约10或约5个核苷酸处。
62.根据权利要求58或权利要求59所述的方法,其中原间隔序列邻近基序(PAM)序列在所述gRNA识别序列下游约2至6个核苷酸处。
63.根据权利要求58至62中任一项所述的方法,其中所述gRNA包含约17至约23个核苷酸。
64.根据权利要求58至63中任一项所述的方法,其中所述gRNA识别序列包含根据SEQID NO:31-44中任一者的核苷酸序列。
65.根据权利要求37至56中任一项所述的方法,其中所述GPAM抑制剂包含小分子。
66.一种鉴定患肝病的风险提高的受试者的方法,其中所述方法包括:
确定或已经确定在获自所述受试者的生物样品中编码人甘油-3-磷酸酰基转移酶(GPAM)多肽的GPAM预测功能丧失变体核酸分子的存在或不存在;
其中:
当所述受试者是GPAM参考时,则所述受试者患肝病的风险提高;并且
当所述受试者对GPAM预测功能丧失变体呈杂合或纯合时,则所述受试者患肝病的风险降低。
67.根据权利要求66所述的方法,其中所述GPAM预测功能丧失变体核酸分子是编码GPAM Ile43Val的核酸分子。
68.根据权利要求67所述的方法,其中所述GPAM预测功能丧失变体核酸分子是:
具有以下核苷酸序列的基因组核酸分子,所述核苷酸序列包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤;
具有包含对应于以下的位置处的鸟嘌呤的核苷酸序列的mRNA分子:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;或
由所述生物样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含对应于以下的位置处的鸟嘌呤的核苷酸序列:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
69.根据权利要求66至21中任一项所述的方法,其中所述确定步骤在体外进行。
70.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括对所述生物样品中的所述GPAM基因组核酸分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置;
其中当所述生物样品中的所述GPAM基因组核酸分子的所述测序部分包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤时,则所述生物样品中的所述GPAM基因组核酸分子是GPAM预测功能丧失变体基因组核酸分子。
71.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括对所述生物样品中的所述GPAM mRNA分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于以下的位置:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;
其中当所述生物样品中的所述GPAM mRNA分子的所述测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中的所述GPAM mRNA分子是GPAM预测功能丧失变体mRNA分子:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
72.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括对所述生物样品中由mRNA分子产生的所述GPAM cDNA分子的核苷酸序列的至少一部分进行测序,其中所述测序部分包含对应于以下的位置:根据SEQ ID NO:21或其互补序列的位置327;根据SEQID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQID NO:26或其互补序列的位置170;
其中当所述生物样品中的所述GPAM cDNA分子的所述测序部分包含对应于以下的位置处的鸟嘌呤时,则所述生物样品中由mRNA分子产生的所述GPAM cDNA分子是GPAM预测功能丧失变体cDNA分子:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
73.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM基因组核酸分子的核苷酸序列的一部分杂交,所述部分接近对应于根据SEQ ID NO:2的位置3,195的位置;
b)将所述引物延伸至少通过所述GPAM基因组核酸分子的核苷酸序列的对应于根据SEQID NO:2的位置3,195的位置;以及
c)确定所述引物的延伸产物是否包含对应于根据SEQ ID NO:2的位置3,195的位置处的鸟嘌呤。
74.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM mRNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;
b)将所述引物延伸至少通过所述GPAM mRNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170;以及
c)确定所述引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9的位置327、根据SEQ ID NO:10的位置291、根据SEQ ID NO:11的位置323、根据SEQ ID NO:12的位置326、根据SEQ ID NO:13的位置305或根据SEQ ID NO:14的位置170。
75.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
a)将所述生物样品与引物接触,所述引物与所述GPAM cDNA分子的核苷酸序列中接近对应于以下的位置的一部分杂交:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;
b)将所述引物延伸至少通过所述GPAM cDNA分子的核苷酸序列中对应于以下的位置:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ ID NO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170;以及
c)确定所述引物的延伸产物是否包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21的位置327、根据SEQ ID NO:22的位置291、根据SEQ ID NO:23的位置323、根据SEQ IDNO:24的位置326、根据SEQ ID NO:25的位置305或根据SEQ ID NO:26的位置170。
76.根据权利要求70至75中任一项所述的方法,其中所述确定步骤包括对整个核酸分子进行测序。
77.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
a)对编码所述人GPAM多肽的所述基因组核酸分子的至少一部分进行扩增,其中所述部分包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及
d)检测所述可检测标记。
78.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
a)对编码所述人GPAM多肽的所述mRNA分子的至少一部分进行扩增,其中所述部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ IDNO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ IDNO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ IDNO:14或其互补序列的位置170;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及
d)检测所述可检测标记。
79.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
a)对编码所述人GPAM多肽的所述cDNA分子的至少一部分进行扩增,其中所述部分包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ IDNO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ IDNO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ IDNO:26或其互补序列的位置170;
b)用可检测标记来标记所扩增的核酸分子;
c)将所述标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核酸序列杂交的核苷酸序列,所述扩增的核酸分子的核酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及
d)检测所述可检测标记。
80.根据权利要求792所述的方法,其中所述样品中的所述核酸分子是mRNA,并且在所述扩增步骤之前将所述mRNA逆转录成cDNA。
81.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
将所述生物样品中的所述基因组核酸分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;以及
检测所述可检测标记。
82.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
将所述生物样品中的所述mRNA分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ IDNO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ IDNO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;以及
检测所述可检测标记。
83.根据权利要求66至69中任一项所述的方法,其中所述确定步骤包括:
将所述生物样品中的所述cDNA分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与所述扩增的核酸分子的核苷酸序列杂交的核苷酸序列,所述扩增的核酸分子的核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ IDNO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ IDNO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ IDNO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170;以及
检测所述可检测标记。
84.根据权利要求66至83中任一项所述的方法,其中所述受试者是GPAM参考,并且以标准剂量向所述受试者施用治疗或抑制肝病的治疗剂,并且施用GPAM抑制剂。
85.根据权利要求66至83中任一项所述的方法,其中所述受试者对GPAM预测功能丧失变体呈杂合,并且以等于或低于标准剂量的量向所述受试者施用治疗或抑制肝病的治疗剂,并且施用GPAM抑制剂。
86.一种治疗或抑制肝病的治疗剂,所述治疗剂用于治疗具有以下的受试者的肝病:
具有编码人甘油-3-磷酸酰基转移酶(GPAM)多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;
具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;或
具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170。
87.一种用于治疗受试者的肝病的甘油-3-磷酸酰基转移酶(GPAM)抑制剂,所述抑制剂具有:
具有编码人GPAM多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含对应于根据SEQ ID NO:2或其互补序列的位置3,195的位置处的鸟嘌呤;
具有编码人GPAM多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:9或其互补序列的位置327;根据SEQ ID NO:10或其互补序列的位置291;根据SEQ ID NO:11或其互补序列的位置323;根据SEQ ID NO:12或其互补序列的位置326;根据SEQ ID NO:13或其互补序列的位置305;或根据SEQ ID NO:14或其互补序列的位置170;或
具有编码人GPAM多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含对应于以下的位置处的鸟嘌呤:根据SEQ ID NO:21或其互补序列的位置327;根据SEQ ID NO:22或其互补序列的位置291;根据SEQ ID NO:23或其互补序列的位置323;根据SEQ ID NO:24或其互补序列的位置326;根据SEQ ID NO:25或其互补序列的位置305;或根据SEQ ID NO:26或其互补序列的位置170。
88.根据权利要求87所述的方法,其中所述GPAM抑制剂包含与GPAM mRNA杂交的反义核酸分子、小干扰RNA(siRNA)或短发夹RNA(shRNA)。
89.根据权利要求87所述的方法,其中所述GPAM抑制剂包含与GPAM基因组核酸分子内的gRNA识别序列杂交的Cas蛋白和指导RNA(gRNA)。
90.根据权利要求89所述的方法,其中所述Cas蛋白是Cas9或Cpf1。
91.根据权利要求89或权利要求90所述的方法,其中所述gRNA识别序列包括或邻近对应于根据SEQ ID NO:1的位置3,195的位置。
92.根据权利要求89或权利要求90所述的方法,其中所述gRNA识别序列位于距对应于根据SEQ ID NO:1的位置3,195的位置约1000、约500、约400、约300、约200、约100、约50、约45、约40、约35、约30、约25、约20、约15、约10或约5个核苷酸处。
93.根据权利要求89或权利要求90所述的方法,其中原间隔序列邻近基序(PAM)序列在所述gRNA识别序列下游约2至约6个核苷酸处。
94.根据权利要求89至93中任一项所述的方法,其中所述gRNA包含约17至约23个核苷酸。
95.根据权利要求89至93中任一项所述的方法,其中所述gRNA识别序列包含根据SEQID NO:31-44中任一者的核苷酸序列。
96.根据权利要求87所述的方法,其中所述GPAM抑制剂包含小分子。
CN202280016246.0A 2021-02-27 2022-02-25 用线粒体甘油-3-磷酸酰基转移酶(gpam)抑制剂治疗肝病 Pending CN116867510A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163154693P 2021-02-27 2021-02-27
US63/154,693 2021-02-27
PCT/US2022/017899 WO2022182985A1 (en) 2021-02-27 2022-02-25 Treatment of liver disease with mitochondrial glycerol-3-phosphate acyltransferase (gpam) inhibitors

Publications (1)

Publication Number Publication Date
CN116867510A true CN116867510A (zh) 2023-10-10

Family

ID=80786652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280016246.0A Pending CN116867510A (zh) 2021-02-27 2022-02-25 用线粒体甘油-3-磷酸酰基转移酶(gpam)抑制剂治疗肝病

Country Status (10)

Country Link
US (1) US20220307032A1 (zh)
EP (1) EP4297772A1 (zh)
JP (1) JP2024508824A (zh)
KR (1) KR20230151996A (zh)
CN (1) CN116867510A (zh)
AU (1) AU2022227748A1 (zh)
CA (1) CA3210481A1 (zh)
IL (1) IL304543A (zh)
MX (1) MX2023009986A (zh)
WO (1) WO2022182985A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120004276A1 (en) * 2008-07-03 2012-01-05 Marie Lindholm Rna antagonist compounds for the inhibition of expression of mitochondrial glycerol-3 phosphate acyltransferase 1 (mtgpat1)
WO2011019498A1 (en) 2009-07-27 2011-02-17 The Trustees Of Princeton University Inhibition of glycerol-3-phosphate acyltransferase (gpat) and associated enzymes for treatment of viral infections
US11702394B2 (en) 2018-02-23 2023-07-18 The Board Of Trustees Of The Leland Stanford Junior University Inhibitors of phospholipid synthesis and methods of use
JP2023529903A (ja) * 2020-06-09 2023-07-12 アルナイラム ファーマシューティカルズ, インコーポレイテッド GPAM(グリセロール-3-リン酸アシルトランスフェラーゼ1、ミトコンドリア)発現をサイレンシングするためのsiRNA組成物および方法

Also Published As

Publication number Publication date
IL304543A (en) 2023-09-01
KR20230151996A (ko) 2023-11-02
MX2023009986A (es) 2023-09-06
US20220307032A1 (en) 2022-09-29
JP2024508824A (ja) 2024-02-28
EP4297772A1 (en) 2024-01-03
CA3210481A1 (en) 2022-09-01
AU2022227748A9 (en) 2024-05-09
AU2022227748A1 (en) 2023-08-10
WO2022182985A1 (en) 2022-09-01

Similar Documents

Publication Publication Date Title
CN101641451A (zh) chr8q24.21上的癌症易感性变体
AU2018290809B2 (en) Biomarkers for the diagnosis and treatment of fibrotic lung disease
CN102317470A (zh) 促进前列腺癌风险的遗传性变型
KR20230124915A (ko) 세포 사멸 유도 dffa 유사 이펙터 b(cideb) 억제제를 이용한 간 질환의 치료
CN116249787A (zh) 用g蛋白偶联受体75(gpr75)抑制剂治疗肥胖症
CN107217092A (zh) 纤维变性易感性il22ra2基因及其用途
CN116867510A (zh) 用线粒体甘油-3-磷酸酰基转移酶(gpam)抑制剂治疗肝病
US12123001B2 (en) Methods of treating liver diseases with phosphodiesterase 3B (PDE3B) inhibitors
US20040241712A1 (en) Diagnostic detection of nucleic acids
CN118265529A (zh) 使用camp应答元件结合蛋白3样3(creb3l3)抑制剂的肝病治疗
CN117597132A (zh) 用环指蛋白213(rnf213)抑制剂治疗肝病
EP4301375A1 (en) Treatment of liver disease with ring finger protein 213 (rnf213) inhibitors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination