CN113727732B - 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高 - Google Patents

用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高 Download PDF

Info

Publication number
CN113727732B
CN113727732B CN202080030927.3A CN202080030927A CN113727732B CN 113727732 B CN113727732 B CN 113727732B CN 202080030927 A CN202080030927 A CN 202080030927A CN 113727732 B CN113727732 B CN 113727732B
Authority
CN
China
Prior art keywords
seq
srebf1
complement
position corresponding
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080030927.3A
Other languages
English (en)
Other versions
CN113727732A (zh
Inventor
A·舒尔迪纳
N·戈萨利亚
C·范霍特
龚大为
J·A·佩里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
University of Maryland at Baltimore
Original Assignee
Regeneron Pharmaceuticals Inc
University of Maryland at Baltimore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc, University of Maryland at Baltimore filed Critical Regeneron Pharmaceuticals Inc
Priority to CN202310867404.XA priority Critical patent/CN116889627A/zh
Publication of CN113727732A publication Critical patent/CN113727732A/zh
Application granted granted Critical
Publication of CN113727732B publication Critical patent/CN113727732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/06Antihyperlipidemics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

本公开提供了治疗患有脂质水平升高的受试者的方法、鉴定罹患脂质水平升高的风险增加的受试者的方法、检测人固醇调节元件结合转录因子1(SREBF1)变体核酸分子和变体多肽的方法以及SREBF1变体核酸分子和变体多肽。

Description

用固醇调节元件结合转录因子1(SREBF1)抑制剂治疗脂质水 平升高
对序列表的引用
本申请包括作为文本文件以电子方式提交的序列表,该文本文件命名为18923802002SEQ,于2020年3月7日创建,大小为191千字节。所述序列表以引用的方式并入本文。
技术领域
本公开总体上涉及用固醇调节元件结合转录因子1(SREBF1)抑制剂对患有脂质水平升高的受试者进行的治疗、鉴定罹患脂质水平升高的风险增加的受试者的方法、检测SREBF1变体核酸分子和变体多肽的方法,以及SREBF1变体核酸分子和SREBF1变体多肽。
背景技术
脂质代谢紊乱是众所周知的肥胖并发症。脂质代谢紊乱的特征通常在于高胰岛素血症、载脂蛋白B水平升高、甘油三酯浓度高、低密度脂蛋白(LDL)胆固醇浓度高和高密度脂蛋白(HDL)胆固醇浓度低。
固醇调节元件结合蛋白(SREBP)是控制脂肪生成和脂质摄取的转录因子。哺乳动物中有两个SREBP基因,SREBP-1和SREBP-2。SREBP-1基因转录由不同启动子编码的两种同种型SREBP-1a和SREBP-1c,它们调节控制脂肪酸合成的基因。SREBP-2调节参与胆固醇合成的基因。然而,SREBP-1和SREBP-2的作用在脂质代谢的调节中显著重叠。在正常组织中,SREBP水平和活性通过负反馈调节受到内源性固醇水平的严格控制。SREBP与SREBP裂解激活蛋白(SCAP)缔合地位于内质网(ER)膜中,它们在细胞固醇水平充足时被胰岛素诱导的基因(Insig)保留在内质网(ER)膜中。一旦固醇水平降低,SCAP蛋白与Insig蛋白解离并将SREBP护送到高尔基体,在高尔基体中它们依次被位点-1蛋白酶和位点-2蛋白酶(S1P和S2P)切割,从而使N端释放出来,N端然后进入到细胞核中以转录脂肪生成基因和低密度脂蛋白受体(LDLR)。
发明内容
本公开还提供了治疗患有总胆固醇升高的受试者的方法,所述方法包括向所述受试者施用SREBF1抑制剂。
本公开还提供了治疗患有低密度脂蛋白(LDL)升高的受试者的方法,所述方法包括向所述受试者施用SREBF1抑制剂。
本公开还提供了用治疗或抑制脂质水平升高的治疗剂治疗受试者的方法,其中所述受试者患有脂质水平升高,所述方法包括以下步骤:通过如下方式确定所述受试者是否具有编码人SREBF1多肽的SREBF1变体核酸分子:获得或已经获得来自所述受试者的生物样品;以及对所述生物样品进行或已经进行基因分型测定以确定所述受试者是否具有包含SREBF1变体核酸分子的基因型;以及当所述受试者是SREBF1参考时,则以标准剂量向所述受试者施用或继续施用治疗或抑制所述脂质水平升高的所述治疗剂,并且向所述受试者施用SREBF1抑制剂;以及当所述受试者对于所述SREBF1变体是杂合的时,则以等于或低于标准剂量的量向所述受试者施用或继续施用治疗或抑制所述脂质水平升高的所述治疗剂,并且向所述受试者施用SREBF1抑制剂;其中具有编码所述人SREBF1多肽的所述SREBF1变体核酸分子的基因型的存在表明所述受试者罹患脂质水平升高的风险降低;其中所述脂质水平升高是血清脂质水平升高、总胆固醇升高或LDL升高;并且其中所述SREBF1变体核酸分子是:i)具有包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的核苷酸序列的基因组核酸分子或其互补物;ii)具有包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的核苷酸序列的mRNA分子或其互补物;iii)具有包含在对应于根据SEQ IDNO:7的第1,260位的位置处的尿嘧啶的核苷酸序列的mRNA分子或其互补物;iv)具有包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的核苷酸序列的mRNA分子或其互补物;v)由所述样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的核苷酸序列或其互补物;vi)由所述样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的核苷酸序列或其互补物;和/或vii)由所述样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的核苷酸序列或其互补物。
本公开还提供了鉴定罹患脂质水平升高的风险增加的人类受试者的方法,其中所述方法包括确定或已经确定在从所述受试者获得的生物样品中编码人SREBF1多肽的SREBF1变体核酸分子的存在或不存在;其中:当所述人类受试者是SREBF1参考时,则所述人类受试者罹患脂质水平升高的风险增加;并且当所述人类受试者对于所述SREBF1变体核酸分子是杂合的或对于所述变体核酸分子是纯合的时,则所述人类受试者罹患脂质水平升高的风险降低;其中所述SREBF1变体核酸分子是:i)具有包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的核苷酸序列的基因组核酸分子或其互补物;ii)具有包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的核苷酸序列的mRNA分子或其互补物;iii)具有包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的核苷酸序列的mRNA分子或其互补物;iv)具有包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的核苷酸序列的mRNA分子或其互补物;v)由所述样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的核苷酸序列或其互补物;vi)由所述样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的核苷酸序列或其互补物;和/或vii)由所述样品中的mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的核苷酸序列或其互补物。
本公开还提供了在人类受试者中检测人SREBF1变体核酸分子的方法,所述包括测定从所述人类受试者获得的样品以确定所述样品中的核酸分子是否包含这样的核苷酸序列,所述核苷酸序列包含:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;和/或vii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。
本公开还提供了包含至少约15个核苷酸的分离的改变特异性探针或改变特异性引物,其中所述改变特异性探针或改变特异性引物包含与编码人SREBF1多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下位置的位置:i)根据SEQ IDNO:2的第17,922位或其互补物;ii)根据SEQ ID NO:6的第1,185位或其互补物;iii)根据SEQ ID NO:7的第1,260位或其互补物;iv)根据SEQ ID NO:8的第1,056位或其互补物;v)根据SEQ ID NO:12的第1,185位或其互补物;vi)根据SEQ ID NO:13的第1,260位或其互补物;或vii)根据SEQ ID NO:14的第1,056位或其互补物。
本公开还提供了包含编码人SREBF1多肽的核苷酸序列的分离的核酸分子,其中所述多肽包含:i)在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸或其互补物;ii)在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸或其互补物;或iii)在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸或其互补物。
本公开还提供了包含编码人SREBF1多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物。
本公开还提供了包含编码人SREBF1多肽的核苷酸序列的分离的mRNA分子,其中所述核苷酸序列包含:i)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;ii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;或iii)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物。
本公开还提供了包含编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含:i)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;ii)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或iii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。
本公开还提供了分离的SREBF1多肽,其具有:i)与SEQ ID NO:18至少约90%同一的氨基酸序列,其中所述多肽包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸;ii)与SEQ ID NO:19至少约90%同一的氨基酸序列,其中所述多肽包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸;或iii)与SEQ ID NO:20至少约90%同一的氨基酸序列,其中所述多肽包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸。
本公开还提供了治疗或抑制脂质水平升高的治疗剂,所述治疗剂用于治疗人类受试者中的脂质水平升高,所述治疗剂具有:i)具有编码人SREBF1多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;vii)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物;viii)包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸的SREBF1多肽;ix)包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸的SREBF1多肽;和/或x)包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸的SREBF1多肽。
本公开还提供了用于治疗人类受试者中脂质水平升高的SREBF1抑制剂,其具有:i)具有编码人SREBF1多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ IDNO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;vii)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物;viii)包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸的SREBF1多肽;ix)包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸的SREBF1多肽;和/或x)包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸的SREBF1多肽。
本公开还提供了分子复合物,其包含与以下杂交的改变特异性引物或改变特异性探针:i)包含编码人SREBF1多肽的核苷酸序列的基因组核酸分子,其中所述改变特异性引物或所述改变特异性探针与在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物杂交;ii)包含编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述改变特异性引物或所述改变特异性探针与以下杂交:在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;或在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;或iii)包含编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述改变特异性引物或所述改变特异性探针与以下杂交:在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。
附图说明
并入本专利说明书中且构成其一部分的附图示出若干个方面,并连同说明书一起用于解释本公开的原理。
专利或申请文件至少包含一张彩色附图。带有一张或多张彩色附图的本专利或专利申请公布的副本将在请求和支付必要费用后由专利局提供。
图1(A图至C图)示出了SREBF1错义变体与低密度脂蛋白胆固醇(LDL-C)降低(A图)、非HDL胆固醇降低(B图)和总胆固醇降低(C图)的关联。
图2示出了3xflag标记的核以及全长SREBP-wt和SREBP-R334C质粒构建体对LDLR启动子荧光素酶报告基因的反式激活活性的抗flag蛋白质印迹蛋白分析。
图3示出了luc报告基因与图2的SREBP-wt和SREBP-R334C的相对活性。
图4示出了低于0.025μg的SREBP滴定转染的结果。
具体实施方式
与本公开的各方面相关的各种术语在整个说明书和权利要求书中使用。除非另外指明,否则此类术语将被赋予其在本领域中的普通含义。其他具体定义的术语将以与本文提供的定义一致的方式来解读。
除非另外明确陈述,否则决不意图将本文阐述的任何方法或方面理解为要求按特定顺序执行其步骤。因此,在权利要求书或说明书中,当方法权利要求没有确切地说明步骤是限于特定顺序时,在任何方面决非意图推断顺序。这适用于任何可能的非表达解释基础,包括相对于步骤排列或操作流程的逻辑事项、从语法组织或标点中得到的明显含义或者在说明书中所描述的方面的数字或类型。
除非上下文另外明确指出,否则如本文所用,单数形式“一个(种)(a/an)”和“所述(the)”包括复数对象。
如本文所用,术语“受试者”包括任何动物,包括哺乳动物。哺乳动物包括但不限于农场动物(诸如,例如马、牛、猪)、伴侣动物(诸如,例如狗、猫)、实验室动物(诸如,例如小鼠、大鼠、兔)和非人灵长类动物。在一些实施方案中,受试者为人。
如本文所用,“核酸”、“核酸分子”、“核酸序列”、“多核苷酸”或“寡核苷酸”可以包括任何长度的核苷酸的聚合物形式,可以包括DNA和/或RNA,并且可以是单链的、双链的或多链的。核酸的一条链还指其互补链。
如本文所用,在特定实施方案中,根据需要,术语“包含”可替换为“由……组成”或“基本上由……组成”。
“分离的”核酸分子是处于不同于其天然环境(诸如除血液和动物组织之外)的条件下的多核苷酸。在优选的形式中,分离的核酸分子基本上不含其他多核苷酸,特别是动物来源的其他多肽。优选以高度纯化的形式(即纯度大于95%,更优选纯度大于99%)提供核酸分子。当在此语境中使用时,术语“分离的”不排除存在呈替代物理形式(诸如二聚体或可替代地磷酸化或衍生化形式)的相同核酸分子。
根据本公开已经观察到,SREBF1的特定变异与低密度脂蛋白(LDL)降低和总胆固醇降低相关。据认为,没有任何SREBF1基因或蛋白的变体与低密度脂蛋白(LDL)降低和总胆固醇降低有任何已知的关联。
已经根据本公开鉴定了与LDL降低和总胆固醇降低分离的SREBF1基因中的罕见变体。例如,已经观察到将人野生型SREBF1基因(SEQ ID NO:1)中第17,922位的胞嘧啶核苷酸改变为胸腺嘧啶的遗传改变,表明具有此种改变的人可能具有降低的LDL和降低的总胆固醇。总之,本文所述的遗传分析令人惊讶地表明,SREBF1基因,以及特别是SREBF1基因中的变体,与降低的LDL和降低的总胆固醇相关。因此,可以治疗罹患脂质水平升高的风险增加的作为SREBF1参考的人类受试者,从而抑制脂质水平升高、减轻其症状和/或抑制症状的发展。因此,本公开提供了利用受试者中的此类变体的鉴定对此类受试者罹患脂质水平升高的风险进行鉴定或分级,使得处于风险中的受试者或患有活动性疾病的受试者可被相应地治疗的方法。另外,本公开提供了分离的SREBF1变体基因组核酸分子、变体mRNA分子和变体cDNA分子。因此,本文提供了被发现与LDL降低和总胆固醇降低相关的SREBF1变体核酸分子。
出于本公开的目的,可以将任何特定的人归类为具有以下三种SREBF1基因型中的一种:i)SREBF1参考;ii)对于SREBF1变体(诸如预测功能丧失变体)是杂合的,和iii)对于SREBF1变体(诸如预测功能丧失变体)是纯合的。SREBF1参考类别中的人没有SREBF1变体核酸分子(诸如预测功能丧失变体核酸分子)的拷贝。对于SREBF1变体核酸分子(诸如预测功能丧失变体核酸分子)是杂合的人具有SREBF1变体核酸分子(诸如预测功能丧失变体核酸分子)的单个拷贝。对于SREBF1变体核酸分子(诸如预测功能丧失变体核酸分子)是纯合的人具有SREBF1变体核酸分子(诸如预测功能丧失变体核酸分子)的两个拷贝。SREBF1预测功能丧失变体核酸分子是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SREBF1多肽的任何SREBF1核酸分子(诸如基因组核酸分子、mRNA分子或cDNA分子)。具有部分功能丧失(或预测的部分功能丧失)的SREBF1多肽的人对于SREBF1是亚型的(hypomorphic)。SREBF1变体核酸分子可以是编码SREBF1 Arg334Cys、Arg364Cys或Arg310Cys的任何核酸分子。据信,本文所述的编码SREBF1Arg334Cys、Arg364Cys或Arg310Cys的SREBF1变体核酸分子是SREBF1预测功能丧失变体核酸分子。在一些实施方案中,SREBF1变体核酸分子编码SREBF1 Arg334Cys。在一些实施方案中,SREBF1变体核酸分子编码SREBF1 Arg364Cys。在一些实施方案中,SREBF1变体核酸分子编码SREBF1 Arg310Cys。
对于被基因分型或确定为SREBF1参考的人类受试者,此类人类受试者罹患脂质水平升高(诸如血清脂质水平升高、总胆固醇升高和/或LDL升高)的风险增加。对于被基因分型或确定为SREBF1参考或对于SREBF1变体核酸分子(诸如预测功能丧失变体)是杂合的人类受试者,可以用SREBF1抑制剂治疗此类人类受试者。
本公开提供了治疗患有血清脂质水平升高的受试者的方法,所述方法包括向受试者施用SREBF1抑制剂。
本公开还提供了治疗患有总胆固醇升高的受试者的方法,所述方法包括向受试者施用SREBF1抑制剂。
本公开还提供了治疗患有LDL升高的受试者的方法,所述方法包括向受试者施用SREBF1抑制剂。
在本文所述的任何实施方案中,脂质水平升高是血清脂质水平升高、总胆固醇升高或LDL升高。在一些实施方案中,脂质水平升高是血清脂质水平升高。在一些实施方案中,脂质水平升高是总胆固醇升高。在一些实施方案中,脂质水平升高是血清胆固醇升高。在一些实施方案中,脂质水平升高是LDL升高。
在一些实施方案中,SREBF1抑制剂包含反义分子。反义分子的实例包括但不限于反义核酸分子、小干扰RNA(siRNA)和短发夹RNA(shRNA)。此类反义分子可以被设计为靶向SREBF1 mRNA的任何区域。在一些实施方案中,反义RNA、siRNA或shRNA与SREBF1基因组核酸分子或mRNA分子内的序列杂交并降低受试者的细胞中SREBF1多肽的表达。在一些实施方案中,SREBF1抑制剂包含与SREBF1基因组核酸分子或mRNA分子杂交并降低受试者的细胞中SREBF1多肽的表达的反义RNA。在一些实施方案中,SREBF1抑制剂包含与SREBF1基因组核酸分子或mRNA分子杂交并降低受试者的细胞中SREBF1多肽的表达的siRNA。在一些实施方案中,SREBF1抑制剂包含与SREBF1基因组核酸分子或mRNA分子杂交并降低受试者的细胞中SREBF1多肽的表达的shRNA。
在一些实施方案中,SREBF1抑制剂包含在一个或多个识别序列处诱导一个或多个切口或双链断裂的核酸酶剂或与SREBF1基因组核酸分子内的识别序列结合的DNA结合蛋白。识别序列可以位于SREBF1基因的编码区域内或位于影响基因表达的调节区域内。DNA结合蛋白或核酸酶剂的识别序列可以位于内含子、外显子、启动子、增强子、调节区域或任何非蛋白质编码区域中。识别序列可以包括或接近SREBF1基因的起始密码子。例如,识别序列可以位于起始密码子的约10、20、30、40、50、100、200、300、400、500或1,000个核苷酸处。作为另一个实例,可以使用两种或更多种核酸酶剂,每种核酸酶剂均靶向包括或接近起始密码子的核酸酶识别序列。作为另一个实例,可以使用两种核酸酶剂,一种靶向包括或接近起始密码子的核酸酶识别序列,以及一种靶向包括或接近终止密码子的核酸酶识别序列,其中核酸酶剂的切割可以导致两个核酸酶识别序列之间的编码区域的缺失。在本文公开的方法和组合物中可以使用诱导切口或双链断裂成所需识别序列的任何核酸酶剂。在本文公开的方法和组合物中可以使用与所需识别序列结合的任何DNA结合蛋白。
用于本文的合适的核酸酶剂和DNA结合蛋白包括但不限于锌指蛋白或锌指核酸酶(ZFN)对、转录激活因子样效应物(TALE)蛋白或转录激活因子样效应物核酸酶(TALEN),或成簇的规则散布的短回文重复(CRISPR)/CRISPR相关(Cas)系统。识别序列的长度可以变化,并且包括例如对于锌指蛋白或ZFN对为约30-36bp(即,对于每个ZFN为约15-18bp)、对于TALE蛋白或TALEN为约36bp以及对于CRISPR/Cas指导RNA为约20bp的识别序列。
在一些实施方案中,CRISPR/Cas系统可用于修饰细胞内的SREBF1基因组核酸分子。本文公开的方法和组合物可以通过利用CRISPR复合物(包含与Cas蛋白复合的指导RNA(gRNA))对SREBF1核酸分子进行定点切割来使用CRISPR-Cas系统分子。
Cas蛋白一般包含至少一个可以与gRNA相互作用的RNA识别或结合结构域。Cas蛋白还可以包含核酸酶结构域(诸如,例如DNase或RNase结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其他结构域。合适的Cas蛋白包括例如,野生型Cas9蛋白和野生型Cpf1蛋白(诸如,例如FnCpf1)。Cas蛋白可以具有完全切割活性以在SREBF1基因组核酸分子创建双链断裂,或者它可以是在SREBF1基因组核酸分子中创建单链断裂的切口酶。另外的Cas蛋白实例包括,但不限于Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Casl0d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或修饰型式。Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。例如,Cas蛋白可以融合到切割结构域、表观遗传修饰结构域、转录激活结构域或转录抑制结构域。Cas蛋白可以任何形式提供。例如,Cas蛋白可以蛋白质,诸如与gRNA复合的Cas蛋白的形式提供。可替代地,Cas蛋白可以编码Cas蛋白的核酸分子,诸如RNA或DNA的形式提供。
在一些实施方案中,SREBF1基因组核酸分子的靶向基因修饰可以通过使细胞与Cas蛋白和一种或多种gRNA接触来产生,所述一种或多种gRNA与位于SREBF1基因组核酸分子中的靶基因组基因座内的一种或多种gRNA识别序列杂交。例如,gRNA识别序列可以在SEQID NO:1的区域内。作为另一个实例,gRNA识别序列还可以包括或接近对应于根据SEQ IDNO:1的第17,922位的位置。例如,gRNA识别序列可以位于对应于根据SEQ ID NO:1的第17,922位的位置的约1000、500、400、300、200、100、50、45、40、35、30、25、20、15、10或5个核苷酸处。作为又一个实例,gRNA识别序列可以包括或接近SREBF1基因组核酸分子的起始密码子或SREBF1基因组核酸分子的终止密码子。例如,gRNA识别序列可以位于起始密码子或终止密码子的约10、20、30、40、50、100、200、300、400、500或1,000个核苷酸处。
位于SREBF1基因组核酸分子中的靶基因组基因座内的gRNA识别序列位于前间区序列邻近基序(PAM)序列附近,所述前间区序列邻近基序(PAM)序列是紧跟在Cas9核酸酶靶向的DNA序列之后的2-6碱基对DNA序列。经典的PAM是序列5'-NGG-3',其中“N”是后跟两个鸟嘌呤(“G”)核碱基的任何核碱基。gRNA可以将Cas9运输到基因组中的任何位置进行基因编辑,但在除了Cas9识别PAM的位点外的任何站点都不能进行编辑。此外,5'-NGA-3'对于人细胞可以是高效的非经典PAM。一般地,PAM在gRNA靶向的DNA序列下游约2-6个核苷酸处。PAM可以侧接gRNA识别序列。在一些实施方案中,gRNA识别序列可以在3'端上由PAM侧接。在一些实施方案中,gRNA识别序列可以在5'端上由PAM侧接。例如,Cas蛋白的切割位点可以在PAM序列上游或下游约1个至约10个、约2个至约5个碱基对,或3个碱基对处。在一些实施方案中(诸如当使用来自酿脓链球菌(S.pyogenes)的Cas9或密切相关的Cas9时),非互补链的PAM序列可以是5'-NGG-3',其中N是任何DNA核苷酸并紧邻靶DNA的非互补链的gRNA识别序列的3'。因而,互补链的PAM序列将是5'-CCN-3',其中N是任何DNA核苷酸并紧邻靶DNA的互补链的gRNA识别序列的5'。
gRNA是与Cas蛋白结合并使Cas蛋白靶向SREBF1基因组核酸分子内的特定位置的RNA分子。一个示例性gRNA是有效指导Cas酶结合或切割SREBF1基因组核酸分子的gRNA,其中gRNA包含与SREBF1基因组核酸分子内的gRNA识别序列杂交的DNA靶向区段,所述gRNA识别序列包括或接近对应于根据SEQ ID NO:1的第17,922位的位置。例如,可以选择gRNA以使其与位于对应于根据SEQ ID NO:1的第17,922位的位置的约5、10、15、20、25、30、35、40、45、50、100、200、300、400、500或1,000个核苷酸处的gRNA识别序列杂交。其他示例性gRNA包含与SREBF1基因组核酸分子内的gRNA识别序列杂交的DNA靶向区段,所述gRNA识别序列处于SEQ ID NO:1区域内。其他示例性gRNA包含与SREBF1基因组核酸分子内的gRNA识别序列杂交的DNA靶向区段,所述gRNA识别序列包括或接近起始密码子或终止密码子。例如,可以选择gRNA以使其与位于起始密码子的约5、10、15、20、25、30、35、40、45、50、100、200、300、400、500或1,000个核苷酸处或位于起始密码子或终止密码子的约5、10、15、20、25、30、35、40、45、50、100、200、300、400、500或1,000个核苷酸处的gRNA识别序列杂交。gRNA的设计和合成描述于例如Mali等人,Science,2013,339,823-826;Jinek等人,Science,2012,337,816-821;Hwang等人,Nat.Biotechnol.,2013,31,227-229;Jiang等人,Nat.Biotechnol.,2013,31,233-239;和Cong等人,Science,2013,339,819-823中。合适的gRNA可包含约17至约23个核苷酸、约18至约22个核苷酸或约19至约21个核苷酸。在一些实施方案中,gRNA可包含20个核苷酸。
位于人野生型SREBF1基因内的合适的gRNA识别序列的实例在SEQ ID NO:21-41中列出。
SREBF1变异附近的指导RNA识别序列
Cas蛋白和gRNA形成复合物,并且Cas蛋白切割靶SREBF1基因组核酸分子。Cas蛋白可以在靶SREBF1基因组核酸分子中存在的将与gRNA的DNA靶向区段结合的核酸序列之内或之外的位点处切割核酸分子。例如,CRISPR复合物(包含与gRNA识别序列杂交并与Cas蛋白复合的gRNA)的形成可以导致一条或两条链在SREBF1基因组核酸分子中存在的将与gRNA的DNA靶向区段结合的核酸序列中或附近(诸如,例如在来自所述核酸序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个或更多个碱基对内)被切割。
此类方法可产生,例如,其中SEQ ID NO:1的区域被破坏、起始密码子被破坏、终止密码子被破坏或编码序列被删除的SREBF1基因组核酸分子。任选地,可以进一步使所述细胞与一种或多种与SREBF1基因组核酸分子中的靶基因组基因座内的另外的gRNA识别序列杂交的另外的gRNA接触。通过使细胞与一种或多种另外的gRNA(诸如,例如与第二gRNA识别序列杂交的第二gRNA)接触,Cas蛋白的切割可创建两个或更多个双链断裂或两个或更多个单链断裂。
在一些实施方案中,SREBF1抑制剂包含小分子。在一些实施方案中,SREBF1抑制剂是Fatostatin A或PF-429242。
在一些实施方案中,所述方法进一步包括检测来自受试者的生物样品中编码人SREBF1多肽的SREBF1预测功能丧失变体核酸分子的存在或不存在。在一些实施方案中,所述方法进一步包括检测来自受试者的生物样品中SREBF1预测功能丧失变体多肽的存在或不存在。如本公开通篇所用,“SREBF1预测功能丧失变体核酸分子”是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SREBF1多肽的任何SREBF1核酸分子(诸如,例如基因组核酸分子、mRNA分子或cDNA分子)。例如,SREBF1预测功能丧失变体核酸分子可以是编码SREBF1 Arg334Cys、Arg364Cys或Arg310Cys的任何核酸分子。在一些实施方案中,SREBF1预测功能丧失变体核酸分子编码SREBF1 Arg334Cys。在一些实施方案中,SREBF1预测功能丧失变体核酸分子编码SREBF1 Arg364Cys。在一些实施方案中,SREBF1预测功能丧失变体核酸分子编码SREBF1Arg310Cys。
在一些实施方案中,SREBF1预测功能丧失变体核酸分子是:i)具有包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的核苷酸序列的基因组核酸分子;ii)具有包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的核苷酸序列的mRNA分子;iii)具有包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的核苷酸序列的mRNA分子;iv)具有包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的核苷酸序列的mRNA分子;v)由mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的核苷酸序列;vi)由mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的核苷酸序列;或vii)由mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的核苷酸序列。
在一些实施方案中,当受试者是SREBF参考时,还以标准剂量向受试者施用治疗或抑制脂质水平升高的治疗剂。在一些实施方案中,当受试者对于SREBF预测功能丧失变体是杂合的时,还以等于或低于标准剂量的剂量向受试者施用治疗或抑制脂质水平升高的治疗剂。
本公开还提供了用治疗或抑制脂质水平升高的治疗剂治疗受试者的方法,其中受试者患有脂质水平升高,所述方法包括以下步骤:通过如下方式确定受试者是否具有编码人SREBF1多肽的SREBF1预测功能丧失变体核酸分子:获得或已经获得来自受试者的生物样品;和对生物样品进行或已经进行基因分型测定以确定受试者是否具有包含SREBF1预测功能丧失变体核酸分子的基因型;以及当受试者是SREBF1参考时,则:i)以标准剂量向受试者施用或继续施用治疗或抑制脂质水平升高的治疗剂,并向受试者施用SREBF1抑制剂;以及当患者对于SREBF1预测功能丧失变体是杂合的时,则:i)以等于或低于标准剂量的量向受试者施用或继续施用治疗或抑制脂质水平升高的治疗剂,并向受试者施用SREBF1抑制剂;其中具有编码人SREBF1多肽的SREBF1预测功能丧失变体核酸分子的基因型的存在表明受试者罹患脂质水平升高的风险降低。在一些实施方案中,受试者是SREBF1参考。在一些实施方案中,受试者对于SREBF1预测功能丧失变体是杂合的。
SREBF1预测功能丧失变体核酸分子可以是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SREBF1多肽的任何SREBF1核酸分子(诸如,例如基因组核酸分子、mRNA分子或cDNA分子)。例如,SREBF1预测功能丧失变体核酸分子可以是编码SREBF1 Arg334Cys、Arg364Cys或Arg310Cys的任何核酸分子。
在一些实施方案中,SREBF1预测功能丧失变体核酸分子是:i)具有包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的核苷酸序列的基因组核酸分子;ii)具有包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的核苷酸序列的mRNA分子;iii)具有包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的核苷酸序列的mRNA分子;iv)具有包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的核苷酸序列的mRNA分子;v)由mRNA分子产生的cDNA分子,其中cDNA分子具有包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的核苷酸序列;vi)由mRNA分子产生的cDNA分子,其中cDNA分子具有包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的核苷酸序列;和/或vii)由mRNA分子产生的cDNA分子,其中cDNA分子具有包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的核苷酸序列。
检测来自受试者的生物样品中SREBF1预测功能丧失变体核酸分子(诸如,例如编码SREBF1 Arg334Cys、Arg364Cys或Arg310Cys的核酸分子)的存在或不存在以及/或者确定受试者是否具有SREBF1预测功能丧失变体核酸分子(诸如,例如编码SREBF1 Arg334Cys、Arg364Cys或Arg310Cys的核酸分子)可以通过本文所述的任何方法进行。在一些实施方案中,这些方法可以在体外进行。在一些实施方案中,这些方法可以原位进行。在一些实施方案中,这些方法可以在体内进行。
在一些实施方案中,检测步骤(detection step/detecting step)或基因分型测定包括对生物样品中的SREBF1基因组核酸分子、SREBF1mRNA分子或SREBF1 cDNA分子的核苷酸序列的至少一部分进行测序,其中被测序的部分包含导致功能丧失或预测会导致功能丧失的一个或多个变异。例如,在一些实施方案中,检测步骤或基因分型测定包括对以下的至少一部分进行测序:i)编码SREBF1多肽的基因组核酸分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:2的第17,922位的位置或其互补物;ii)编码SREBF1多肽的mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:6的第1,185位的位置或其互补物;iii)编码SREBF1多肽的mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:7的第1,260位的位置或其互补物;iv)编码SREBF1多肽的mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:8的第1,056位的位置或其互补物;v)编码SREBF1多肽的cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQID NO:12的第1,185位的位置或其互补物;vi)编码SREBF1多肽的cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:13的第1,260位的位置或其互补物;和/或vii)编码SREBF1多肽的cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ IDNO:14的第1,056位的位置或其互补物。当生物样品中SREBF1基因组核酸分子的被测序的部分包含:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶;在对应于根据SEQID NO:6的第1,185位的位置处的尿嘧啶;在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶;在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶;在对应于根据SEQID NO:12的第1,185位的位置处的胸腺嘧啶;在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶;或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶,则生物样品中的SREBF1 cDNA分子是SREBF1预测功能丧失变体cDNA分子。
在一些实施方案中,检测步骤或基因分型测定包括:a)使生物样品与引物接触,所述引物与以下杂交:i)SREBF1基因组核酸分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:2的第17,922位的位置;ii)SREBF1 mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:6的第1,185位的位置;iii)SREBF1 mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:7的第1,260位的位置;iv)SREBF1 mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:8的第1,056位的位置;v)SREBF1 cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:12的第1,185位的位置;vi)SREBF1 cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:13的第1,260位的位置;和/或vii)SREBF1 cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:14的第1,056位的位置;b)使引物延伸至少通过:i)对应于根据SEQ ID NO:2的第17,922位的SREBF1基因组核酸分子的核苷酸序列的位置;ii)对应于根据SEQ ID NO:6的第1,185位的SREBF1mRNA分子的核苷酸序列的位置;iii)对应于根据SEQ ID NO:7的第1,260位的SREBF1 mRNA分子的核苷酸序列的位置;iv)对应于根据SEQ ID NO:8的第1,056位的SREBF1 mRNA分子的核苷酸序列的位置;v)对应于根据SEQ ID NO:12的第1,185位的SREBF1 cDNA分子的核苷酸序列的位置;vi)对应于根据SEQ ID NO:13的第1,260位的SREBF1 cDNA分子的核苷酸序列的位置;和/或vii)对应于根据SEQ ID NO:14的第1,056位的SREBF1 cDNA分子的核苷酸序列的位置;和c)确定引物的延伸产物是否包括:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶;iii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶;vi)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶;和/或vii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。在一些实施方案中,所述确定步骤包括对整个核酸分子进行测序。
在一些实施方案中,检测步骤或基因分型测定包括:a)扩增编码人SREBF1多肽的核酸分子的至少一部分,其中所述部分包含:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)在对应于根据SEQ IDNO:13的第1,260位的位置处的胸腺嘧啶或其互补物;和/或vii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物;b)用可检测标记对扩增的核酸分子进行标记;c)使标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;ii)包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iii)包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iv)包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;v)包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;vi)包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;和/或vii)包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;以及d)对可检测标记进行检测。在一些实施方案中,所述核酸分子是mRNA,并且所述确定步骤进一步包括在扩增步骤之前将mRNA逆转录成cDNA。
在一些实施方案中,检测步骤或基因分型测定包括:使生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;ii)包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iii)包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iv)包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;v)包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;vi)包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;和/或vii)包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;以及对可检测标记进行检测。
在这些实施方案中的任一者中,核酸分子可以存在于从人类受试者获得的细胞内。
在本文所述的任何实施方案中,脂质水平升高是血清脂质水平升高、总胆固醇升高或LDL升高。在一些实施方案中,脂质水平升高是血清脂质水平升高。在一些实施方案中,脂质水平升高是总胆固醇升高。在一些实施方案中,脂质水平升高是血清胆固醇升高。在一些实施方案中,脂质水平升高是LDL升高。
在一些实施方案中,脂质水平升高包括高脂血症,诸如高胆固醇血症(胆固醇升高)。脂质水平升高还包括高脂蛋白血症,这是指存在升高的脂蛋白(通常为LDL)。
对于被基因分型或确定为SREBF1参考或对于SREBF1预测功能丧失变体是杂合的人类受试者,可用如本文所述的SREBF1抑制剂治疗此类人类受试者。
治疗或抑制脂质水平升高的治疗剂的实例包括但不限于:螺环氮杂环丁酮衍生物、斯达汀(statin)、PPAR激动剂、烟酸(nicotinic acid)、尼克酸(niacin)、依泽替米贝(ezetimibe)、PCSK9抑制剂、RXR激动剂、激素、基于磺酰脲的药物、双胍、α-葡萄糖苷酶抑制剂、GLP-1激动剂和PPARα/δ双重激动剂,或它们的任意组合。
螺环氮杂环丁酮衍生物包括但不限于在例如美国RE 37,721;美国专利号5,631,356;5,767,115;5,846,966;5,698,548;5,633,246;5,656,624;5,624,920;5,688,787;和5,756,470;美国公开No.2002/0137689;和PCT公开号WO 02/066464、WO 95/08522和WO96/19450中公开的那些。
他汀类药物包括但不限于阿托伐他汀(atorvastatin)、氟伐他汀(fluvastatin)、洛伐他汀(lovastatin)、匹伐他汀(pitavastatin)、普伐他汀(pravastatin)、瑞舒伐他汀(rosuvastatin)、西立伐他汀(cerivastatin)和辛伐他汀(simvastatin)。
PPAR激动剂包括但不限于噻唑烷二酮或贝特(fibrate)。噻唑烷二酮包括但不限于5-((4-(2-(甲基-2-吡啶基氨基)乙氧基)苯基)甲基)-2,4-噻唑烷二酮、曲格列酮(troglitazone)、吡格列酮(pioglitazone)、环格列酮(ciglitazone)、WAY-120,744、恩格列酮(englitazone)、AD 5075、达格列酮(darglitazone)和罗格列酮(rosiglitazone)。贝特类包括但不限于吉非贝齐(gemfibrozil)、非诺贝特(fenofibrate)、氯贝丁酯(clofibrate)和环丙贝特(ciprofibrate)。
RXR激动剂包括但不限于LG 100268、LGD 1069、9-顺式视黄酸、2-(1-(3,5,5,8,8-五甲基-5,6,7,8-四氢-2-萘基)-环丙基)-吡啶-5-羧酸和4-((3,5,5,8,8-五甲基-5,6,7,8-四氢-2-萘基)2-羰基)-苯甲酸。
激素包括但不限于甲状腺激素、雌激素和胰岛素。合适的胰岛素包括但不限于可注射胰岛素、经皮胰岛素和吸入胰岛素或其任何组合。作为胰岛素的替代物,可以使用胰岛素衍生物、促分泌素、敏化剂或模拟物。胰岛素促分泌素包括但不限于毛喉素(forskolin)、二丁酰cAMP和异丁基甲基黄嘌呤(IBMX)。
基于磺酰脲的药物包括但不限于格列派特(glisoxepid)、格列本脲(glyburide)、醋磺己脲(acetohexamide)、氯磺丙脲(chlorpropamide)、格列波脲(glibornuride)、甲苯磺丁脲(tolbutamide)、妥拉磺脲(tolazamide)、格列吡嗪(glipizide)、格列齐特(gliclazide)、格列喹酮(gliquidone)、格列己脲(glyhexamide)、苯磺丁脲(phenbutamide)和甲磺环己脲(tolcyclamide)。
双胍包括但不限于二甲双胍(metformin)、苯乙双胍(phenformin)和丁福明(buformin)。
α-葡萄糖苷酶抑制剂包括但不限于阿卡波糖(acarbose)和米格列醇(miglitol)。
GLP-1激动剂包括但不限于和/>(利拉鲁肽(liraglutide))、/>和/>(艾塞那肽(exenatide))、/>(利西那肽(lixisenatide))、/>(阿必鲁肽(albiglutide))、/>(度拉鲁肽(dulaglutide))和/>(司美格鲁肽(semaglutide))。
对于被基因分型或确定为SREBF1参考或对于SREBF1预测功能丧失变体是杂合的人类受试者,也可以用本文所述的任何一种或多种SREBF1预测功能丧失多肽治疗此类人类受试者。
在一些实施方案中,与作为SREBF1参考的人类受试者(其可接受标准剂量)相比,对于SREBF1预测功能丧失变体核酸分子是杂合的受试者,治疗或抑制脂质水平升高的治疗剂的剂量可减少约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%或约90%(即,低于标准剂量)。在一些实施方案中,治疗或抑制脂质水平升高的治疗剂的剂量可减少约10%、约20%、约30%、约40%或约50%。此外,与作为SREBF1参考的受试者相比,在对于SREBF1预测功能丧失变体核酸分子是杂合的受试者中,治疗或抑制脂质水平升高的治疗剂的剂量可以以更低频率施用。
治疗或抑制脂质水平升高的治疗剂和/或SREBF1抑制剂的施用可以例如在一天、两天、三天、五天、一周、两周、三周、一个月、五周、六周、七周、八周、两个月或三个月之后重复。重复施用可以是相同剂量或不同剂量。施用可以重复一次、两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次。例如,根据某些剂量方案,受试者可以接受较长时间段,例如6个月、1年或更长时间的疗法。
治疗或抑制脂质水平升高的治疗剂和/或SREBF1抑制剂的施用可以通过任何合适的途径进行,所述途径包括但不限于肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌内。用于施用的药物组合物理想地是无菌的且基本上等渗的,并且是在GMP条件下制造的。药物组合物可以单位剂型(即,单次施用的剂量)提供。药物组合物可以使用一种或多种生理上且药学上可接受的载剂、稀释剂、赋形剂或辅助剂来配制。制剂取决于所选的施用途径。术语“药学上可接受的”意指载剂、稀释剂、赋形剂或辅助剂与制剂的其他成分相容,并且对其接受者基本上无害。
如本文所用,术语“治疗(treat)”、“治疗(treating)”和“治疗(treatment)”以及“预防(prevent)”、“预防(preventing)”和“预防(prevention)”分别是指引发期望的生物反应,诸如治疗性和预防性作用。在一些实施方案中,治疗作用包括以下中的一种或多种:在所述剂或包含所述剂的组合物被施用后,脂质水平升高减少/降低,脂质水平升高严重程度减少/降低(诸如,例如脂质水平升高降低或脂质水平升高的形成受到抑制),症状和脂质水平升高相关影响的增加减少/降低,延迟症状和脂质水平升高相关影响的发作,降低脂质水平升高相关影响的症状的严重程度,降低急性发作的严重程度,降低症状和脂质水平升高相关影响的数量,降低症状和脂质水平升高相关影响的潜伏期,改善症状和脂质水平升高相关影响,降低继发症状,降低继发感染,预防脂质水平升高复发,减少复发发作的次数或频率,增加症状性发作之间的潜伏期,增加达到持续进展的时间,加快缓解、诱导缓解、增强缓解、加速恢复,或增加替代治疗剂的功效或减少对替代治疗的抗性,和/或增加受影响宿主动物的存活时间。预防性作用可包括,在治疗方案被施用后完全或部分避免/抑制或延迟了脂质水平升高的发展/进展(诸如,例如完全或部分的避免/抑制或延迟),以及使受影响宿主动物的存活时间增加。对脂质水平升高的治疗涵盖对已被诊断为处于任何临床阶段或表现的任何形式的脂质水平升高的受试者的治疗,对脂质水平升高的症状或体征的发作或演变或加重或恶化的延迟,和/或预防和/或降低脂质水平升高的严重程度。
在一些实施方案中,所述方法包括检测来自受试者的生物样品中SREBF1多肽的存在或不存在,其中所述SREBF1多肽包含:i)在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸;ii)在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸;或iii)在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸;其中:当人类受试者不具有SREBF1多肽时,则人类受试者罹患脂质水平升高的风险增加;并且当人类受试者具有SREBF1多肽时,则人类受试者罹患脂质水平升高的风险降低。
在一些实施方案中,检测步骤包括对包含以下的多肽的至少一部分进行测序:i)对应于根据SEQ ID NO:18的第334位的位置;ii)对应于根据SEQ ID NO:19的第364位的位置;或iii)对应于根据SEQ ID NO:20的第310位的位置。在一些实施方案中,所述检测步骤包括对整个多肽进行测序。在一些实施方案中,检测步骤包括执行用于检测多肽的存在的免疫测定,所述多肽包含:i)对应于根据SEQ ID NO:18的第334位的位置;ii)对应于根据SEQ ID NO:19的第364位的位置;或iii)对应于根据SEQ ID NO:20的第310位的位置。
本公开还提供了鉴定罹患脂质水平升高的风险增加的人类受试者的方法,其中所述方法包括本文所述的用于检测本文所述的任何SREBF1预测功能丧失变体核酸分子(诸如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的任何方法。确定或已经确定从受试者获得的样品中特定核酸分子的存在或不存在可以通过本文所述的任何方法进行。当人类受试者缺乏SREBF1预测功能丧失变体核酸分子时(即,人类受试者在基因型上被归类为SREBF1参考),则所述人类受试者罹患脂质水平升高的风险增加。当人类受试者具有SREBF1预测功能丧失变体核酸分子时(即,人类受试者被归类为对于SREBF1预测功能丧失变体是杂合的或对于SREBF1预测功能丧失变体是纯合的),则所述人类受试者罹患脂质水平升高的风险降低。与不具有SREBF1预测功能丧失变体核酸分子的拷贝相比,具有SREBF1预测功能丧失变体核酸分子的单个拷贝更能保护人类受试者免于罹患脂质水平升高。
无意受限于任何特定的理论或作用机制,据认为SREBF1预测功能丧失变体核酸分子的单个拷贝(即,对于SREBF1预测功能丧失变体是杂合的)能够保护人类受试者免于罹患脂质水平升高,并且还据认为具有SREBF1预测功能丧失变体核酸分子的两个拷贝(即,对于SREBF1预测功能丧失变体是纯合的)相对于具有单个拷贝的人类受试者,可能更能保护人类受试者免于罹患脂质水平升高。因此,在一些实施方案中,SREBF1预测功能丧失变体核酸分子的单个拷贝可能不能完全保护人类受试者免于罹患脂质水平升高,而是可能部分或不完全地保护人类受试者免于罹患脂质水平升高。虽然不希望受任何特定理论的约束,但可能存在与脂质水平升高的罹患相关的另外的因素或分子,这些因素或分子在具有SREBF1预测功能丧失变体核酸分子的单个拷贝的人类受试者中仍然存在,从而导致不能完全防止脂质水平升高的罹患。
本公开还提供了鉴定罹患脂质水平升高的风险增加的人类受试者的方法,其中所述方法包括:检测来自受试者的生物样品中SREBF1预测功能丧失变体多肽的存在或不存在,其中SREBF1预测功能丧失变体多肽包含:i)在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸;ii)在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸;或iii)在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸;其中:当人类受试者不具有SREBF1预测功能丧失变体多肽时,则所述人类受试者罹患脂质水平升高的风险增加;并且当人类受试者具有SREBF1预测功能丧失变体多肽时,则人类受试者罹患脂质水平升高的风险降低。
在一些实施方案中,所述确定步骤包括对包含对应于根据SEQ ID NO:18的第334位的位置的多肽的至少一部分进行测序。在一些实施方案中,所述确定步骤包括对包含对应于根据SEQ ID NO:19的第364位的位置的多肽的至少一部分进行测序。在一些实施方案中,所述确定步骤包括对包含对应于根据SEQ ID NO:20的第310位的位置的多肽的至少一部分进行测序。在一些实施方案中,所述确定步骤包括对整个多肽进行测序。在一些实施方案中,所述确定步骤包括免疫测定。
在一些实施方案中,对人类受试者进一步用治疗或抑制脂质水平升高的治疗剂和/或如本文所述的SREBF1抑制剂进行治疗。例如,当人类受试者是SREBF1参考,并因此罹患脂质水平升高的风险增加时,向所述人类受试者施用SREBF1抑制剂。在一些实施方案中,还向这样的受试者施用治疗或抑制脂质水平升高的治疗剂。在一些实施方案中,当受试者对于SREBF1预测功能丧失变体是杂合的时,以等于或低于标准剂量的剂量向受试者施用治疗或抑制脂质水平升高的治疗剂,并且还向其施用SREBF1抑制剂。在一些实施方案中,受试者是SREBF1参考。在一些实施方案中,受试者对于SREBF1预测功能丧失变体是杂合的。
本公开还提供了检测来自受试人的生物样品中SREBF1预测功能丧失变体基因组核酸分子、SREBF1预测功能丧失变体mRNA分子和/或SREBF1预测功能丧失变体cDNA分子的存在的方法。应理解,群体内的基因序列和由此类基因编码的mRNA分子可以由于多态性(诸如单核苷酸多态性)而变化。本文提供的SREBF1变体基因组核酸分子、SREBF1变体mRNA分子和SREBF1变体cDNA分子的序列仅为示例性序列。SREBF1变体基因组核酸分子、变体mRNA分子和变体cDNA分子的其他序列也是可能的。
所述生物样品可以来源于受试者的任何细胞、组织或生物流体。所述样品可以包括任何临床上相关的组织诸如骨髓样品、肿瘤活检物、细针抽吸物,或体液的样品(诸如血液、龈沟液、血浆、血清、淋巴、腹水液、囊液或尿液)。在一些情况下,所述样品包括口腔拭子。本文公开的方法中使用的样品将根据测定形式、检测方法的性质以及用作样品的组织、细胞或提取物而变化。生物样品可以根据所采用的测定进行不同处理。例如,当检测任何SREBF1变体核酸分子时,可以采用被设计为针对基因组DNA来分离或富集样品的初步处理。各种已知的技术可用于此目的。当检测任何SREBF1变体mRNA的水平时,不同的技术可以用于使生物样品富集mRNA。可以使用检测mRNA的存在或水平或者特定变体基因组DNA基因座的存在的各种方法。
在一些实施方案中,检测人类受试者中人SREBF1预测功能丧失变体核酸分子的方法包括对从人类受试者获得的生物样品进行测定,以确定生物样品中的SREBF1基因组核酸分子、SREBF1 mRNA分子或SREBF1 cDNA分子是否包含一种或多种导致功能丧失(部分或完全)或预测会导致功能丧失(部分或完全)的变异。例如,在一些实施方案中,检测人类受试者中人SREBF1预测功能丧失变体核酸分子的方法包括对从受试者获得的生物样品进行测定以确定生物样品中的SREBF1核酸分子是否包含这样的核苷酸序列,所述核苷酸序列包含:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)在对应于根据SEQID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或vii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。在一些实施方案中,所述方法是体外方法。
在一些实施方案中,检测人类受试者中SREBF1预测功能丧失变体核酸分子(诸如,例如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的方法包括:对从受试者获得的生物样品进行测定,该测定确定生物样品中的核酸分子是否包含这样的核苷酸序列,所述核苷酸序列编码:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶;iii)在对应于根据SEQID NO:7的第1,260位的位置处的尿嘧啶;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶;vi)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶;或vii)在对应于根据SEQ IDNO:14的第1,056位的位置处的胸腺嘧啶。在一些实施方案中,生物样品包括细胞或细胞裂解物。此类方法可以进一步包括,例如,从受试者获得包含SREBF1基因组核酸分子或mRNA分子的生物样品,并且如果是mRNA,则任选地将mRNA逆转录成cDNA,并对生物样品进行测定,所述测定确定SREBF1基因组核酸分子、mRNA或cDNA的某个位置编码:i)在对应于根据SEQID NO:2的第17,922位的位置处的胸腺嘧啶;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶;iii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶;vi)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶;或vii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。此类测定可以包括,例如确定特定SREBF1核酸分子的这些位置的身份。在一些实施方案中,所述方法是体外方法。
在一些实施方案中,所述测定包括对生物样品中的SREBF1基因组核酸分子、SREBF1 mRNA分子或SREBF1 cDNA分子的核苷酸序列的至少一部分进行测序,其中被测序的部分包含一种或多种导致功能丧失(部分或完全)的变异。例如,在一些实施方案中,所述测定包括对以下的至少一部分进行测序:i)生物样品中的SREBF1基因组核酸分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:2的第17,922位的位置或其互补物;ii)生物样品中的SREBF1mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ IDNO:6的第1,185位的位置或其互补物;iii)生物样品中的SREBF1mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:7的第1,260位的位置或其互补物;iv)生物样品中的SREBF1mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:8的第1,056位的位置或其互补物;v)生物样品中的SREBF1cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:12的第1,185位的位置或其互补物;vi)生物样品中的SREBF1cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:13的第1,260位的位置或其互补物;和/或vii)生物样品中的SREBF1 cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:14的第1,056位的位置或其互补物。当生物样品中SREBF1基因组核酸分子的被测序部分包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶时,则生物样品中的SREBF1基因组核酸分子是SREBF1预测功能丧失变体基因组核酸分子。当生物样品中SREBF1 mRNA分子的被测序部分包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶时,则生物样品中的SREBF1mRNA分子是SREBF1预测功能丧失变体mRNA分子。当生物样品中SREBF1 mRNA分子的被测序部分包含在对应于根据SEQ IDNO:7的第1,260位的位置处的尿嘧啶时,则生物样品中的SREBF1mRNA分子是SREBF1预测功能丧失变体mRNA分子。当生物样品中SREBF1 mRNA分子的被测序部分包含在对应于根据SEQID NO:8的第1,056位的位置处的尿嘧啶时,则生物样品中的SREBF1mRNA分子是SREBF1预测功能丧失变体mRNA分子。当生物样品中SREBF1 cDNA分子的被测序部分包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶时,则生物样品中的SREBF1cDNA分子是SREBF1预测功能丧失变体cDNA分子。当生物样品中SREBF1 cDNA分子的被测序部分包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶时,则生物样品中的SREBF1cDNA分子是SREBF1预测功能丧失变体cDNA分子。当生物样品中SREBF1 cDNA分子的被测序部分包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶时,则生物样品中的SREBF1 cDNA分子是SREBF1预测功能丧失变体cDNA分子。
在一些实施方案中,所述测定包括:a)使样品与引物接触,所述引物与以下杂交:i)SREBF1基因组核酸分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:2的第17,922位的位置;ii)SREBF1mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:6的第1,185位的位置;iii)SREBF1 mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQID NO:7的第1,260位的位置;iv)SREBF1mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:8的第1,056位的位置;v)SREBF1 cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:12的第1,185位的位置;vi)SREBF1cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:13的第1,260位的位置;或vii)SREBF1 cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:14的第1,056位的位置;b)使引物延伸至少通过:i)对应于根据SEQ ID NO:2的第17,922位的SREBF1基因组核酸分子的核苷酸序列的位置;ii)对应于根据SEQ ID NO:6的第1,185位的SREBF1 mRNA分子的核苷酸序列的位置;iii)对应于根据SEQ ID NO:7的第1,260位的SREBF1 mRNA分子的核苷酸序列的位置;iv)对应于根据SEQ ID NO:8的第1,056位的SREBF1mRNA分子的核苷酸序列的位置;v)对应于根据SEQ ID NO:12的第1,185位的SREBF1 cDNA分子的核苷酸序列的位置;vi)对应于根据SEQID NO:13的第1,260位的SREBF1 cDNA分子的核苷酸序列的位置;或vii)对应于根据SEQ IDNO:14的第1,056位的SREBF1 cDNA分子的核苷酸序列的位置;和c)确定引物的延伸产物是否包含:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶;iii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶;vi)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶;vii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。在一些实施方案中,所述测定包括对整个核酸分子进行测序。在一些实施方案中,仅分析SREBF1基因组核酸分子。在一些实施方案中,仅分析SREBF1mRNA。在一些实施方案中,仅分析从SREBF1 mRNA获得的SREBF1cDNA。
在一些实施方案中,所述测定包括:a)扩增编码人SREBF1多肽的核酸分子的至少一部分,其中所述部分包含:i)在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;v)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;v)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物;b)用可检测标记对扩增的核酸分子进行标记;c)使标记的核酸分子与包含改变特异性探针的支持物接触,其中改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;ii)包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iii)包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iv)包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;v)包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;vi)包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;vii)包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;以及d)对可检测标记进行检测。在一些实施方案中,所述核酸分子是mRNA,并且所述确定步骤进一步包括在扩增步骤之前将mRNA逆转录成cDNA。
在一些实施方案中,所述测定包括:将生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;ii)包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iii)包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;iv)包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列或其互补物;v)包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;vi)包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;vii)包含在对应于根据SEQID NO:14的第1,056位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列或其互补物;以及对可检测标记进行检测。改变特异性聚合酶链反应技术可以用于检测核酸序列中的突变,诸如SNP。可以使用改变特异性引物,因为当与模板不匹配时,DNA聚合酶不会延伸。
在一些实施方案中,样品中的核酸分子是mRNA并且在扩增步骤之前将mRNA逆转录成cDNA。在一些实施方案中,核酸分子存在于从人类受试者获得的细胞内。
SREBF1预测功能丧失变体核酸分子可以是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SREBF1多肽的任何SREBF1核酸分子(诸如,例如基因组核酸分子、mRNA分子或cDNA分子)。例如,SREBF1预测功能丧失变体核酸分子可以是编码SREBF1 Arg334Cys、Arg364Cys或Arg310Cys的任何核酸分子。
在一些实施方案中,所述测定包括使生物样品与引物或探针,诸如改变特异性引物或改变特异性探针接触,所述引物或探针在严格条件下与SREBF1变体基因组序列、变体mRNA序列或变体cDNA序列而不与对应的SREBF1参考序列特异性杂交;以及确定是否发生了杂交。
在一些实施方案中,所述测定包括RNA测序(RNA-Seq)。在一些实施方案中,所述测定还包括,诸如用逆转录酶聚合酶链反应(RT-PCR),将mRNA逆转录成cDNA。
在一些实施方案中,所述方法利用具有足够核苷酸长度的探针和引物来结合到靶核酸序列并特异性地检测和/或鉴定包含SREBF1变体基因组核酸分子、变体mRNA分子或变体cDNA分子的多核苷酸。杂交条件或反应条件可以由操作员决定以实现此结果。此核苷酸长度可以是足以用于所选择的检测方法(包括本文描述或例示的任何测定)的任何长度。此类探针和引物可以在高严格杂交条件下与靶核苷酸序列特异性地杂交。探针和引物可以具有与靶核苷酸序列内连续核苷酸的完全核苷酸序列同一性,但可以通过常规方法设计不同于靶核苷酸序列并保留特异性地检测和/或鉴定靶核苷酸序列的能力的探针。因此,探针和引物可以与靶核酸分子的核苷酸序列共享约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或100%序列同一性或互补性。
在一些实施方案中,为了确定生物样品内SREBF1核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物是否包含编码以下的核苷酸序列:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶、在对应于根据SEQ IDNO:8的第1,056位的位置处的尿嘧啶、在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶,可以使用引物对来对生物样品执行扩增方法,所述引物对包括衍生自与以下相邻的5'侧翼序列的第一引物:在对应于根据SEQ IDNO:2的第17,922位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶、在对应于根据SEQID NO:8的第1,056位的位置处的尿嘧啶、在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶,以及衍生自与以下相邻的3'侧翼序列的第二引物:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶、在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶、在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶,以产生扩增子,所述扩增子指示在编码以下的位置处SNP的存在:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶、在对应于根据SEQ IDNO:8的第1,056位的位置处的尿嘧啶、在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。在一些实施方案中,扩增子的长度范围可以从引物对加上一个核苷酸碱基对的组合长度到任何可通过DNA扩增方案产生的扩增子的长度。此距离的范围可以从一个核苷酸碱基对至扩增反应的极限,或约两万个核苷酸碱基对。任选地,引物对侧接包括编码以下的位置的区域:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶、在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶、在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或在对应于根据SEQ IDNO:14的第1,056位的位置处的胸腺嘧啶,以及编码以下的位置中的每一侧上的至少1、2、3、4、5、6、7、8、9、10个或更多个核苷酸:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQID NO:7的第1,260位的位置处的尿嘧啶、在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶、在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。可以从mRNA和/或cDNA序列产生相似的扩增子。可以例如通过使用意图用于此目的的计算机程序从已知的序列获得PCR引物对,所述计算机程序诸如VectorNTI版本10中的PCR引物分析工具(Informax公司,Bethesda Md.);PrimerSelect(DNASTAR公司,Madison,Wis.);以及Primer3(版本0.4.0.COPYRGT.,1991,Whitehead Institutefor Biomedical Research,Cambridge,Mass.)。此外,可以目视扫描所述序列并使用已知指南手动识别引物。
可以使用多种技术,包括例如核酸测序、核酸杂交和核酸扩增。核酸测序技术的例示性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。
其他方法涉及除了测序以外的核酸杂交方法,其包括使用针对纯化的DNA、扩增的DNA和固定细胞制品的标记的引物或探针(荧光原位杂交(FISH))。在一些方法中,可以在检测之前或在检测的同时对靶核酸分子进行扩增。核酸扩增技术的例示性实例包括但不限于聚合酶链反应(PCR)、连接酶链反应(LCR)、链置换扩增反应(SDA)以及基于核酸序列的扩增反应(NASBA)。其他方法包括但不限于连接酶链反应、链置换扩增反应和嗜热SDA(tSDA)。
在杂交技术中,可以采用严格条件,使得探针或引物将特异性地与其靶标杂交。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶序列杂交的程度可检测地高于所述多核苷酸引物或探针与其他非靶序列杂交的程度,诸如比背景高出至少2倍、至少3倍、至少4倍或更多,包括比背景高出超过10倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将比所述多核苷酸引物或探针与其他核苷酸序列杂交的程度可检测地高出至少2倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将比所述多核苷酸引物或探针与其他核苷酸序列杂交的程度可检测地高出至少3倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将比所述多核苷酸引物或探针与其他核苷酸序列杂交的程度可检测地高出至少4倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将可检测地高于所述多核苷酸引物或探针与其他核苷酸序列杂交的程度,比背景高出超过10倍。严格条件是序列依赖性的并且在不同环境中将不同。
促进DNA杂交的适当严格性条件(例如,在约45℃下6X氯化钠/柠檬酸钠(SSC)下,接着在50℃下用2X SSC洗涤)是已知的,或者可在Current Protocols in MolecularBiology,John Wiley和Sons,N.Y.(1989),6.3.1-6.3.6中找到。通常,用于杂交和检测的严格条件将是其中盐浓度在pH 7.0至8.3下低于约1.5M Na+离子、通常约0.01至1.0M Na+离子浓度(或其他盐),并且温度对于短探针(诸如,例如10至50个核苷酸)而言是至少约30℃,而对于较长探针(诸如,例如大于50个核苷酸)是至少约60℃的那些。还可以通过添加去稳定剂诸如甲酰胺来实现严格条件。任选地,洗涤缓冲液可以包含约0.1%至约1%SDS。杂交的持续时间一般少于约24小时,通常约4至约12小时。洗涤时间的持续时间将至少是足以达到平衡的时间长度。
本公开还提供了检测人SREBF1预测功能丧失变体多肽的存在的方法,所述方法包括对从人类受试者获得的样品进行测定以确定受试者中的SREBF1多肽是否含有导致多肽具有功能丧失(部分或完全)的一种或多种变异。在一些实施方案中,所述方法检测人SREBF1预测功能丧失变体多肽(诸如,例如SREBF1 Arg334Cys变体多肽)的存在,并且包括对从人类受试者获得的样品进行测定以确定样品中的SREBF1多肽是否包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸。在一些实施方案中,所述检测步骤包括对包含对应于根据SEQ ID NO:15或SEQ ID NO:18的第334位的位置的多肽的至少一部分进行测序。在一些实施方案中,所述检测步骤包括对整个多肽进行测序。在一些实施方案中,所述检测步骤包括用于检测多肽的存在的免疫测定,所述多肽包含对应于根据SEQ ID NO:15或SEQ ID NO:18的第334位的位置。
在一些实施方案中,所述方法检测人SREBF1预测功能丧失变体多肽(诸如,例如SREBF1 Arg364Cys变体多肽)的存在,并且包括对从人类受试者获得的样品进行测定以确定样品中的SREBF1多肽是否包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸。在一些实施方案中,检测步骤包括对包含对应于根据SEQ ID NO:16或SEQ ID NO:19的第364位的位置的多肽的至少一部分进行测序。
在一些实施方案中,所述检测步骤包括对整个多肽进行测序。在一些实施方案中,所述检测步骤包括用于检测多肽的存在的免疫测定,所述多肽包含对应于根据SEQ ID NO:16或SEQ ID NO:19的第364位的位置。
在一些实施方案中,所述方法检测人SREBF1预测功能丧失变体多肽(诸如,例如SREBF1 Arg310Cys变体多肽)的存在,并且包括对从人类受试者获得的样品进行测定以确定样品中的SREBF1多肽是否包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸。在一些实施方案中,所述检测步骤包括对包含对应于根据SEQ ID NO:17或SEQ ID NO:20的第310位的位置的多肽至少一部分进行测序。在一些实施方案中,所述检测步骤包括对整个多肽进行测序。在一些实施方案中,所述检测步骤包括用于检测多肽的存在的免疫测定,所述多肽包含对应于根据SEQ ID NO:17或SEQ ID NO:20的第310位的位置。
本公开还提供了与SREBF1预测功能丧失变体基因组核酸分子(诸如SEQ ID NO:2)、SREBF1预测功能丧失变体mRNA分子(诸如SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8)和/或SREBF1预测功能丧失变体cDNA分子(诸如SEQ ID NO:12、SEQ ID NO:13和SEQ ID NO:14)杂交的分离的核酸分子。在一些实施方案中,分离的核酸分子与SREBF1核酸分子的这样的部分杂交,所述部分包括对应于根据SEQ ID NO:2的第17,922位的位置,并且包括对应于根据SEQ ID NO:6或SEQ ID NO:12的第1,185位的位置,包括对应于根据SEQ ID NO:7或SEQID NO:13的第1,260位的位置,或包括对应于根据SEQ ID NO:8或SEQ ID NO:14的第1,056位的位置。
在一些实施方案中,此类分离的核酸分子包含至少约5个、至少约8个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少约85个、至少约90个、至少约95个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约2000个、至少约3000个、至少约4000个、至少约5000个、至少约6000个、至少约7000个、至少约8000个、至少约9000个、至少约10000个、至少约11000个、至少约12000个、至少约13000个、至少约14000个、至少约15000个、至少约16000个、至少约17000个、至少约18000个、至少约19000个或至少约20000个核苷酸或者由其组成。在一些实施方案中,此类分离的核酸分子包含至少约5个、至少约8个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个或至少约25个核苷酸或者由其组成。在优选的实施方案中,所述分离的核酸分子包含至少约18个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含至少约15个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含约10个至约35个、约10个至约30个、约10个至约25个、约12个至约30个、约12个至约28个、约12个至约24个、约15个至约30个、约15个至约25个、约18个至约30个、约18个至约25个、约18个至约24个,或约18个至约22个核苷酸或者由其组成。在优选的实施方案中,所述分离的核酸分子包含约18个至约30个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含至少约15个核苷酸到至少约35个核苷酸或者由其组成。
在一些实施方案中,此类分离的核酸分子在严格条件下与SREBF1预测功能丧失变体基因组核酸分子(诸如SEQ ID NO:2)、SREBF1预测功能丧失变体mRNA分子(诸如SEQ IDNO:6、SEQ ID NO:7和SEQ ID NO:8)和/或SREBF1预测功能丧失变体cDNA分子(诸如SEQ IDNO:12、SEQ ID NO:13和SEQ ID NO:14)杂交。此类核酸分子可用作,例如如本文所述或例示的探针、引物、改变特异性探针或改变特异性引物,并且包括但不限于引物、探针、反义RNA、shRNA和siRNA,其中每一者均在本文别处被更详细地描述,并且可以在本文描述的任何方法中使用。
在一些实施方案中,所述分离的核酸分子与同SREBF1预测功能丧失变体基因组核酸分子(诸如SEQ ID NO:2)、SREBF1预测功能丧失变体mRNA分子(诸如SEQ ID NO:6、SEQ IDNO:7和SEQ ID NO:8)和/或SREBF1预测功能丧失变体cDNA分子(诸如SEQ ID NO:12、SEQ IDNO:13和SEQ ID NO:14)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一性的核酸分子的至少约15个连续核苷酸杂交。在一些实施方案中,所述分离的核酸分子包含约15个至约100个核苷酸或约15个至约35个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含约15个至约100个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含约15个至约35个核苷酸或者由其组成。
在一些实施方案中,分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中改变特异性探针或改变特异性引物包含与编码人SREBF1多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下位置的位置:根据SEQ ID NO:2的第17,922位或其互补物;根据SEQ ID NO:6的第1,185位或其互补物;根据SEQ ID NO:7的第1,260位或其互补物;根据SEQ ID NO:8的第1,056位或其互补物;根据SEQ ID NO:12的第1,185位或其互补物;根据SEQ ID NO:13的第1,260位或其互补物;或根据SEQ ID NO:14的第1,056位或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:2的第17,922位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:2的第17,922至17,924位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:6的第1,185位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:6的第1,185至1,187位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:7的第1,260位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:7的第1,260至1,262位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:8的第1,056位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:8的第1,056至1,058位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:12的第1,185位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:12的第1,185至1,187位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:13的第1,260位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:13的第1,260至1,262位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:14的第1,056位的位置或其互补物。在一些实施方案中,改变特异性探针或改变特异性引物包含与核苷酸序列的一部分互补的核苷酸序列,所述部分包含对应于根据SEQ ID NO:14的第1,056至1,058位的位置或其互补物。
在一些实施方案中,改变特异性探针或改变特异性引物包含DNA。在一些实施方案中,改变特异性探针和改变特异性引物包含RNA。
在一些实施方案中,本文所述的探针和引物(包括改变特异性探针和改变特异性引物)具有与本文公开的核酸分子中的任一种特异性杂交的核苷酸序列或其互补物。在一些实施方案中,所述探针或引物在严格条件下与本文公开的核酸分子中的任一种特异性地杂交。
在一些实施方案中,包括改变特异性引物在内的引物可以用于第二代测序或高通量测序中。在一些情况下,包括改变特异性引物在内的引物可以被修饰。具体地,引物可以包含在例如大规模平行签名测序(Massive Parallel Signature Sequencing,MPSS)、聚合酶克隆测序(Polony sequencing)和454焦磷酸测序(454Pyrosequencing)的不同步骤中使用的各种修饰。在所述过程的几个步骤中可以使用修饰的引物,包括在克隆步骤中使用的生物素化的引物以及在珠粒装载步骤和检测步骤中使用的荧光标记的引物。一般使用双端(paired-end)标签文库进行聚合酶克隆测序,其中每个DNA模板分子的长度约为135bp。在珠粒装载步骤和乳液PCR中使用生物素化的引物。在检测步骤中使用荧光标记的简并九聚物寡核苷酸。衔接子可以包含用于将DNA文库固定到链酶亲和素包被的珠粒上的5'-生物素标签。
本文所述的探针和引物可以用于检测SREBF1变体基因组核酸分子(诸如SEQ IDNO:2)内的C17,922T变异、SREBF1变体mRNA分子(诸如SEQ ID NO:6)内的C1,185U变异、SREBF1变体mRNA分子(诸如SEQ ID NO:7)内的C1,260U变异、SREBF1变体mRNA分子(诸如SEQID NO:8)内的C1,056U变异、SREBF1变体cDNA分子(诸如SEQ ID NO:12)内的C1,185T变异、SREBF1变体cDNA分子(诸如SEQ ID NO:13)内的C1,260T变异或SREBF1变体cDNA分子(诸如SEQ ID NO:14)内的C1,056T变异。例如,所述引物可以用于扩增包含C17,922T变异的SREBF1变体基因组核酸分子或其片段。所述引物还可以用于扩增包含C1,185U变异、C1,260U变异和/或C1,056U变异的SREBF1变体mRNA或其片段。所述引物还可用于扩增包含C1,185T变异、C1,260T变异和/或C1,056T变异的SREBF1变体cDNA或其片段。
本公开还提供了包含上述引物中的任一种的引物对。如果引物的3'-端之一与特定SREBF1核酸分子中第17,922位处的胞嘧啶(而不是胸腺嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考基因组核酸分子。相反地,如果引物的3'-端之一与特定SREBF1核酸分子中第17,922位处的胸腺嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体基因组核酸分子。在一些实施方案中,与在对应于SEQ ID NO:2中第17,922位的位置处的胸腺嘧啶互补的引物的核苷酸可以在引物的3'端。
如果引物的3'-端之一与特定SREBF1 mRNA分子中第1,185位处的胞嘧啶(而不是尿嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考mRNA分子。相反地,如果引物的3'-端之一与特定SREBF1 mRNA分子中第1,185位处的尿嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体mRNA分子。在一些实施方案中,与在对应于SEQ IDNO:6中第1,185位的位置处的尿嘧啶互补的引物的核苷酸可以在引物的3'端。此外,如果引物的3'-端之一与特定SREBF1 mRNA分子中第1,260位处的胞嘧啶(而不是尿嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考mRNA分子。相反地,如果引物的3'-端之一与特定SREBF1 mRNA分子中第1,260位处的尿嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体mRNA分子。在一些实施方案中,与在对应于SEQ ID NO:7中第1,260位的位置处的尿嘧啶互补的引物的核苷酸可以在引物的3'端。此外,如果引物的3'-端之一与特定SREBF1 mRNA分子中第1,056位处的胞嘧啶(而不是尿嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考mRNA分子。相反地,如果引物的3'-端之一与特定SREBF1 mRNA分子中第1,056位处的尿嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体mRNA分子。在一些实施方案中,与在对应于SEQ ID NO:8中第1,056位的位置处的尿嘧啶互补的引物的核苷酸可以在引物的3'端。如果引物的3'-端之一与特定SREBF1 cDNA分子中第1,185位处的胞嘧啶(而不是胸腺嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考cDNA分子。相反地,如果引物的3'-端之一与特定SREBF1 cDNA分子中第1,185位处的胸腺嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体cDNA分子。在一些实施方案中,与在对应于SEQ ID NO:12中第1,185位的位置处的胸腺嘧啶互补的引物的核苷酸可以在引物的3'端。此外,如果引物的3'-端之一与特定SREBF1cDNA分子中第1,260位处的胞嘧啶(而不是胸腺嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考cDNA分子。相反地,如果引物的3'-端之一与特定SREBF1 cDNA分子中第1,260位处的胸腺嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体cDNA分子。在一些实施方案中,与在对应于SEQ ID NO:13中第1,260位的位置处的胸腺嘧啶互补的引物的核苷酸可以在引物的3'端。此外,如果引物的3'-端之一与特定SREBF1 cDNA分子中第1,056位处的胞嘧啶(而不是胸腺嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1参考cDNA分子。相反地,如果引物的3'-端之一与特定SREBF1 cDNA分子中第1,056位处的胸腺嘧啶(而不是胞嘧啶)杂交,则所扩增片段的存在将表明存在SREBF1变体cDNA分子。在一些实施方案中,与在对应于SEQ ID NO:14中第1,056位的位置处的胸腺嘧啶互补的引物的核苷酸可以在引物的3'端。
在一些实施方案中,探针或引物包含与SREBF1基因组核酸分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:2的SREBF1基因组核酸分子在包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在一些实施方案中,探针或引物包含与SREBF1 mRNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:6的SREBF16mRNA分子在包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在一些实施方案中,探针或引物包含与SREBF1 mRNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:7的SREBF16mRNA分子在包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在一些实施方案中,探针或引物包含与SREBF1 mRNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:8的SREBF16mRNA分子在包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在一些实施方案中,探针或引物包含与SREBF1 cDNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:12的SREBF1cDNA分子在包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在一些实施方案中,探针或引物包含与SREBF1 cDNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:13的SREBF1cDNA分子在包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在一些实施方案中,探针或引物包含与SREBF1 cDNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。在一些实施方案中,探针或引物包含与包含SEQ ID NO:14的SREBF1cDNA分子在包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。
在本公开的语境中,“特异性杂交”意指探针或引物(诸如,例如改变特异性探针或改变特异性引物)不与编码SREBF1参考基因组核酸分子、SREBF1参考mRNA分子和/或SREBF1参考cDNA分子的核酸序列杂交。
在一些实施方案中,所述探针(诸如,例如改变特异性探针)包含标记。在一些实施方案中,所述标记是荧光标记、放射性标记或生物素。
本公开还提供了包含本文公开的探针中的任一种或多种所附接的衬底的支持物。固体支持物是分子(诸如本文公开的探针中的任一种)可以与之缔合的固态衬底或支持物。固体支持物的一种形式是阵列。固体支持物的另一种形式是阵列检测器。阵列检测器是多个不同的探针以阵列、网格或其他组织化模式与之耦接的固体支持物。固态衬底的一种形式是微量滴定皿,诸如标准96孔型。在一些实施方案中,可以采用通常每孔含有一个阵列的多孔玻璃载片。
本公开还提供了分子复合物,其包含本文所述的SREBF1核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物中的任一种以及本文所述的改变特异性引物或改变特异性探针中的任一种,或者由其组成。在一些实施方案中,分子复合物中的SREBF1核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物是单链的。在一些实施方案中,所述SREBF1核酸分子是本文所述的基因组核酸分子中的任一种。在一些实施方案中,所述SREBF1核酸分子是本文所述的mRNA分子中的任一种。在一些实施方案中,所述SREBF1核酸分子是本文所述的cDNA分子中的任一种。在一些实施方案中,所述分子复合物包含本文所述的SREBF1核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物中的任一种以及本文所述的改变特异性引物中的任一种,或者由其组成。在一些实施方案中,所述分子复合物包含本文所述的SREBF1核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物中的任一种以及本文所述的改变特异性探针中的任一种,或者由其组成。
在一些实施方案中,所述分子复合物包含与基因组核酸分子杂交的改变特异性引物或改变特异性探针或者由其组成,所述基因组核酸分子包含编码人SREBF1多肽的核苷酸序列,其中改变特异性引物或改变特异性探针与以下杂交:在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物。在一些实施方案中,所述分子复合物包含与以下杂交的改变特异性引物或改变特异性探针或者由其组成:在对应于根据SEQ ID NO:2的第17,922至17,924位的位置处的TGC密码子。在一些实施方案中,所述分子复合物包含含有SEQ ID NO:2的基因组核酸分子或者由其组成。
在一些实施方案中,所述分子复合物包含与mRNA分子杂交的改变特异性引物或改变特异性探针或者由其组成,所述mRNA分子包含编码人SREBF1多肽的核苷酸序列,其中改变特异性引物或改变特异性探针与以下杂交:在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;或在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物。在一些实施方案中,所述分子复合物包含与以下杂交的改变特异性引物或改变特异性探针或者由其组成:在对应于根据SEQ ID NO:6的第1,185至1,187位的位置处的UGC密码子、在对应于根据SEQ ID NO:6的第1,260至1,262位的位置处的UGC密码子,或在对应于根据SEQ ID NO:8的第1,056至1,058位的位置处的UGC密码子。在一些实施方案中,所述分子复合物包含含有SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:8的mRNA分子或者由其组成。
在一些实施方案中,所述分子复合物包含与cDNA分子杂交的改变特异性引物或改变特异性探针或者由其组成,所述cDNA分子包含编码人SREBF1多肽的核苷酸序列,其中改变特异性引物或改变特异性探针与以下杂交:在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。在一些实施方案中,所述分子复合物包含与以下杂交的改变特异性引物或改变特异性探针或者由其组成:在对应于根据SEQ ID NO:12的第1,185至1,187位的位置处的TGC密码子、在对应于根据SEQ ID NO:13的第1,260至1,262位的位置处的TGC密码子,或在对应于根据SEQ ID NO:14的第1,056至1,058位的位置处的TGC密码子。在一些实施方案中,所述分子复合物包含含有SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14的cDNA分子或者由其组成。
在一些实施方案中,所述分子复合物包含含有标记的改变特异性探针或改变特异性引物。在一些实施方案中,所述标记是荧光标记、放射性标记或生物素。在一些实施方案中,所述分子复合物进一步包含非人类聚合酶。
本公开还提供了包含编码人SREBF1多肽的核苷酸序列的分离的核酸分子,其中所述多肽包含在对应于以下的位置处的半胱氨酸:根据SEQ ID NO:18的第334位或其互补物;根据SEQ ID NO:19的第364位或其互补物;或根据SEQ ID NO:20的第310位或其互补物。
在一些实施方案中,所述分离的核酸分子编码具有与SEQ ID NO:18有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列的SREBF1多肽,并且包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸;SEQ ID NO:19,并且包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸;或SEQ ID NO:20,并且包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸。
在一些实施方案中,所述核酸分子编码包含SEQ ID NO:18、SEQ ID NO:19或SEQID NO:20的SREBF1多肽。在一些实施方案中,所述核酸分子编码由SEQ ID NO:18、SEQ IDNO:19或SEQ ID NO:20组成的SREBF1多肽。
SREBF1参考基因组核酸分子的核苷酸序列在SEQ ID NO:1中列出。参考SEQ IDNO:1,SREBF1参考基因组核酸分子的第17,922位是胞嘧啶。存在SREBF1的变体基因组核酸分子,其中第17,922位的胞嘧啶被胸腺嘧啶替换。此SREBF1预测功能丧失变体基因组核酸分子的核苷酸序列在SEQ ID NO:2中列出。
本公开提供了包含编码人SREBF1多肽的核苷酸序列或者由其组成的分离的基因组核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶(C17,922T)或其互补物。在一些实施方案中,所述分离的基因组核酸分子包含编码人SREBF1多肽的核苷酸序列,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922至17,924位的位置处的TGC密码子。
在一些实施方案中,所述分离的基因组核酸分子包含与SEQ ID NO:2有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的核苷酸序列或者由其组成,并且包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的基因组核酸分子包含与SEQ ID NO:2有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的核苷酸序列或者由其组成,并且包含在对应于根据SEQ ID NO:2的第17,922至17,924位的位置处的TGC密码子或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的基因组核酸分子包含SEQ ID NO:2。在一些实施方案中,所述分离的基因组核酸分子由SEQ ID NO:2组成。
在一些实施方案中,所述分离的基因组核酸分子包含少于完整的基因组DNA序列。在一些实施方案中,所述分离的基因组核酸分子包含SEQ ID NO:2的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约2000个、至少约3000个、至少约4000个、至少约5000个、至少约6000个、至少约7000个、至少约8000个、至少约9000个、至少约10000个、至少约11000个、至少约12000个、至少约13000个、至少约14000个、至少约15000个、至少约16000个、至少约17000个或至少约18000个连续核苷酸或者由其组成。在一些实施方案中,所述分离的基因组核酸分子包含SEQ ID NO:2的至少约1000个至至少约2000个连续核苷酸或者由其组成。在一些实施方案中,这些分离的基因组核酸分子包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶。
三个SREBF1参考mRNA分子的核苷酸序列在SEQ ID NO:3、SEQ ID NO:4和SEQ IDNO:5中列出。参考SEQ ID NO:3,SREBF1参考mRNA分子的第1,185位是胞嘧啶。参考SEQ IDNO:4,SREBF1参考mRNA分子的第1,260位是胞嘧啶。参考SEQ ID NO:5,SREBF1参考mRNA分子的第1,056位是胞嘧啶。存在SREBF1的三种变体mRNA分子,其中胞嘧啶被胸腺嘧啶替换。参考SEQ ID NO:6,变体SREBF1 mRNA分子的第1,185位是胸腺嘧啶。参考SEQ ID NO:7,变体SREBF1 mRNA分子的第1,260位是胸腺嘧啶。参考SEQ ID NO:8,变体SREBF1 mRNA分子的第1,056位是胸腺嘧啶。
本公开提供了包含编码人SREBF1多肽的核苷酸序列或者由其组成的分离的mRNA分子,其中所述核苷酸序列包含:在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;或在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物。
在一些实施方案中,所述分离的mRNA分子包含编码人SREBF1多肽的核苷酸序列或者由其组成,其中所述核苷酸序列包含:在对应于根据SEQ ID NO:6的第1,185至1,187位的位置处的UGC密码子;在对应于根据SEQ ID NO:7的第1,260至1,262位的位置处的UGC密码子;或在对应于根据SEQ ID NO:8的第1,056至1,058位的位置处的UGC密码子。
在一些实施方案中,所述分离的mRNA分子包含与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的核苷酸序列或者由其组成,并且包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;SEQ ID NO:7,并且包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;SEQ ID NO:8,并且包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的mRNA分子包含与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的核苷酸序列或者由其组成,并且包含在对应于根据SEQ ID NO:6的第1,185至1,187位的位置处的UGC密码子或其互补物;SEQ ID NO:7,并且包含在对应于根据SEQ ID NO:7的第1,260至1,262位的位置处的UGC密码子或其互补物;或SEQ ID NO:8,并且包含在对应于根据SEQ ID NO:8的第1,056至1,058位的位置处的UGC密码子或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的mRNA分子包含SEQ ID NO:6、SEQ ID NO:7或SEQID NO:8。在一些实施方案中,所述分离的mRNA分子由SEQ ID NO:6、SEQ ID NO:7或SEQ IDNO:8组成。在一些实施方案中,所述分离的mRNA分子由SEQ ID NO:6组成。
三个SREBF1参考cDNA分子的核苷酸序列在SEQ ID NO:9、SEQ ID NO:10和SEQ IDNO:11中列出。参考SEQ ID NO:9,SREBF1参考cDNA分子的第1,185位是胞嘧啶。参考SEQ IDNO:10,SREBF1参考cDNA分子的第1,260位是胞嘧啶。参考SEQ ID NO:11,SREBF1参考cDNA分子的第1,056位是胞嘧啶。存在SREBF1的三种变体cDNA分子,其中胞嘧啶被胸腺嘧啶替换。参考SEQ ID NO:12,变体SREBF1 cDNA分子的第1,185位是胸腺嘧啶。参考SEQ ID NO:13,变体SREBF1 cDNA分子的第1,260位是胸腺嘧啶。参考SEQ ID NO:14,变体SREBF1 cDNA分子的第1,056位是胸腺嘧啶。
本公开提供了包含编码人SREBF1多肽的核苷酸序列或者由其组成的分离的cDNA分子,其中所述核苷酸序列包含:在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。
在一些实施方案中,所述分离的cDNA分子包含编码人SREBF1多肽的核苷酸序列或者由其组成,其中所述核苷酸序列包含:在对应于根据SEQ ID NO:12的第1,185至1,187位的位置处的TGC密码子;在对应于根据SEQ ID NO:13的第1,260至1,262位的位置处的TGC密码子;或在对应于根据SEQ ID NO:14的第1,056至1,058位的位置处的TGC密码子。
在一些实施方案中,所述分离的cDNA分子包含与SEQ ID NO:12具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的核苷酸序列或者由其组成,并且包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;SEQ ID NO:13,并且包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或SEQ ID NO:14,并且包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的cDNA分子包含与SEQ ID NO:12具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的核苷酸序列或者由其组成,并且包含在对应于根据SEQ ID NO:12的第1,185至1,187位的位置处的TGC密码子或其互补物;SEQ ID NO:13,并且包含在对应于根据SEQ ID NO:13的第1,260至1,262位的位置处的TGC密码子或其互补物;或SEQ ID NO:14,并且包含在对应于根据SEQ ID NO:14的第1,056至1,058位的位置处的TGC密码子或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的cDNA分子包含SEQ ID NO:12、SEQ ID NO:13或SEQID NO:14。在一些实施方案中,所述分离的cDNA分子由SEQ ID NO:12、SEQ ID NO:13或SEQID NO:14组成。
在一些实施方案中,所述分离的mRNA分子或cDNA分子包含少于完整的mRNA或cDNA序列。在一些实施方案中,所述分离的cDNA分子包含SEQ ID NO:6、SEQ ID NO:7或SEQ IDNO:8(对于mRNA)或SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14(对于cDNA)的至少约5个、至少约8个、至少约10个、至少约12个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2100个、至少约2200个、至少约2300个、至少约2400个、至少约2500个、至少约2600个、至少约2700个、至少约2800个、至少约2900个、至少约3000个、至少约3100个、至少约3200个或至少约3300个连续核苷酸或者由其组成。
所述基因组核酸分子、mRNA分子和cDNA分子可以来自任何生物体。例如,所述基因组核酸分子、mRNA分子和cDNA分子可以是人的或来自另一生物体(诸如非人哺乳动物、啮齿动物、小鼠或大鼠)的直向同源物。应理解,群体内的基因组核酸分子、mRNA分子和cDNA序列可因多态性诸如单核苷酸多态性而变化。本文提供的实例仅为示例性序列。其他序列也是可能的。
本文还提供了可以与公开的核酸分子相互作用的功能性多核苷酸。功能性多核苷酸是具有特定功能(诸如结合靶分子或催化特定反应)的核酸分子。功能性多核苷酸的实例包括但不限于反义分子、适体、核酶、三链体形成分子以及外部引导序列。功能性多核苷酸可以充当靶分子所具有的特定活性的效应子(effector)、抑制剂、调节剂和刺激剂,或者功能性多核苷酸可以具有独立于任何其他分子的从头(de novo)活性。
本文公开的分离的核酸分子可以包括RNA、DNA,或者RNA和DNA两者。所述分离的核酸分子还可以连接或融合到异源标记上。此类标记包括例如化学发光剂、金属、标签、酶、放射性标记、颜料、染料、色原、自旋标记和荧光标记。标记还包括例如颗粒,荧光团,半抗原,酶以及其量热、荧光和化学发光底物和其他标记。
所公开的核酸分子可以包括例如核苷酸或非天然或修饰的核苷酸,诸如核苷酸类似物或核苷酸替代物。此类核苷酸包括含有修饰的碱基、修饰的糖或修饰的磷酸酯基团的核苷酸,或者在其结构中掺入有非天然部分的核苷酸。
本公开还提供了包含本文公开的核酸分子中的任一种或多种的载体。在一些实施方案中,所述载体包含本文公开的核酸分子中的任一种或多种和异源核酸。所述载体可以是能够转运核酸分子的病毒或非病毒载体。在一些实施方案中,所述载体是质粒或粘粒。
核酸分子内的核苷酸序列或多肽内的氨基酸序列的特定伸长段之间的同一性百分比(或互补性百分比)可以使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,J.Mol.Biol.,1990,215,403-410;Zhang和Madden,Genome Res.,1997,7,649-656)或通过使用Gap程序(Wisconsin序列分析包,用于Unix的版本8,GeneticsComputer Group,University Research Park,Madison Wis.)使用默认设置(其使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489)来确定。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
本公开还提供了包含本文公开的分离的核酸分子、基因组核酸分子、mRNA分子和/或cDNA分子中的任一种或多种的组合物。在一些实施方案中,所述组合物是药物组合物。在一些实施方案中,所述组合物包含载剂和/或赋形剂。
三种SREBF1参考多肽的氨基酸序列在SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17中列出。参考SEQ ID NO:15,SREBF1参考多肽的第334位是精氨酸。参考SEQ ID NO:16,SREBF1参考多肽的第364位是精氨酸。参考SEQ ID NO:17,SREBF1参考多肽的第310位是精氨酸。存在三种变体SREBF1多肽,其中精氨酸被半胱氨酸替换。参考SEQ ID NO:18,变体SREBF1多肽的第334位是半胱氨酸。参考SEQ ID NO:19,变体SREBF1多肽的第364位是半胱氨酸。参考SEQ ID NO:20,变体SREBF1多肽的第310位是半胱氨酸。
本公开还提供了与SEQ ID NO:18具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的氨基酸序列的分离的人SREBF1多肽,其中所述多肽包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸;SEQ ID NO:19,其中所述多肽包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸;或SEQ ID NO:20,其中所述多肽包含在对应于根据SEQID NO:20的第310位的位置处的半胱氨酸。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。
在一些实施方案中,所述分离的人SREBF1多肽的氨基酸序列包含SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20。在一些实施方案中,所述分离的人SREBF1多肽的氨基酸序列由SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20组成。
在一些实施方案中,所述分离的多肽包含与SEQ ID NO:18、SEQ ID NO:19或SEQID NO:20的至少约8个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、至少约500个、至少约550个、至少约600个、至少约650个、至少约700个、至少约750个、至少约800个、至少约850个、至少约900个、至少约950个、至少约1000个、至少约1050个或至少约1100个连续氨基酸至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的氨基酸序列或者由其组成。在一些实施方案中,所述分离的多肽还包含:在对应于SEQ ID NO:18的第334位的位置处的半胱氨酸;在对应于SEQ ID NO:19的第364位的位置处的半胱氨酸;或在对应于SEQ ID NO:20的第310位的位置处的半胱氨酸。
本文公开的分离的多肽可以包含天然存在的SREBF1多肽的氨基酸序列,或可以包含非天然存在的序列。在一些实施方案中,由于保守氨基酸取代,天然存在的序列可以不同于非天然存在的序列。
在一些实施方案中,所述分离的多肽包含非天然或修饰的氨基酸或肽类似物。例如,存在许多具有与天然存在的氨基酸不同的官能取代基的D-氨基酸或氨基酸。
SREBF1参考多肽可以用于例如筛选充当拮抗剂的化合物,这些化合物可以用于治疗作为SREBF1参考或对于SREBF1预测功能丧失核酸分子是杂合的受试者。变体SREBF1多肽(诸如本文所述的SREBF1预测功能丧失多肽)可以用于例如筛选充当激动剂的化合物,这些化合物可以用于治疗作为SREBF1参考或对于SREBF1预测功能丧失核酸分子是杂合的受试者。
本公开还提供了编码本文公开的多肽中的任一种的核酸分子。这包括与特定多肽序列相关的所有简并序列。因此,虽然每个特定核酸序列可能未在本文中写出,但是实际上每一个序列均通过公开的多肽序列在本文中公开并描述。
本公开还提供了包含本文公开的核酸分子中的任一种或多种和/或多肽中的任一种或多种的组合物。在一些实施方案中,所述组合物包含载剂。
本公开还提供了产生本文公开的SREBF1多肽或其片段中的任一种的方法。此类SREBF1多肽或其片段可以通过任何合适的方法产生。
本公开还提供了包含本文公开的核酸分子中的任一种或多种和/或多肽中的任一种或多种的细胞。所述细胞可以是体外的、离体的或体内的。核酸分子可以连接到启动子和其他调控序列,所以它们被表达从而产生编码的蛋白质。
所附序列表中列出的核苷酸序列和氨基酸序列是使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出的。所述核苷酸序列遵循从序列的5'端开始并向前行进(即在每一行中从左到右)到3'端的标准惯例。仅示出了每个核苷酸序列的一条链,但是互补链应被理解为通过对所示链的任何参考而被包括在内。所述氨基酸序列遵循从序列的氨基末端开始并向前行进(即在每一行中从左到右)到羧基末端的标准惯例。
如本文所用,当在特定核苷酸或核苷酸序列或位置的编号的上下文中使用时,短语"对应于"或其语法变型是指当将特定核苷酸或核苷酸序列与参考序列比较时对指定参考序列的编号。换句话讲,特定聚合物的残基(诸如,例如核苷酸或氨基酸)编号或残基(诸如,例如核苷酸或氨基酸)位置是相对于参考序列来指定,而不是根据残基在特定核苷酸或核苷酸序列内的实际数值位置来指定。例如,可以通过引入缺口以优化特定核苷酸序列与参考序列之间的残基匹配来使这两个序列对齐。在这些情况下,虽然存在缺口,但是对特定核苷酸或核苷酸序列中的残基的编号是相对于与它对齐的参考序列来进行的。
例如,包含编码人SREBF1多肽的核苷酸序列的核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶意味着如果SREBF1基因组核酸分子的核苷酸序列与SEQ ID NO:2的序列对齐,则SREBF1序列在对应于SEQ ID NO:2的第17,922位的位置处具有胸腺嘧啶残基。这同样适用于包含编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含:在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶、在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶,或在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶;以及包含编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含:在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶、在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶,或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶。换句话讲,这些短语是指编码SREBF1多肽的核酸分子,其中所述基因组核酸分子具有包含与SEQ ID NO:2的第17,922位的胸腺嘧啶残基同源的胸腺嘧啶残基的核苷酸序列(或其中所述mRNA分子具有包含尿嘧啶残基的核苷酸序列,所述尿嘧啶残基与SEQ ID NO:6的第1,185位的尿嘧啶残基同源;与SEQ ID NO:7的第1,260位的尿嘧啶残基同源;或与SEQ ID NO:8的第1,056位的尿嘧啶残基同源,或其中所述cDNA分子具有包含胸腺嘧啶残基的核苷酸序列,所述胸腺嘧啶残基与SEQ ID NO:12的第1,185位的胸腺嘧啶残基同源;与SEQ ID NO:13的第1,260位的胸腺嘧啶残基同源;或与SEQID NO:14的第1,056位的胸腺嘧啶残基同源)。在本文中,此类序列也称为参考基因组核酸分子“具有C17,922T改变的SREBF1序列”或“具有C17,922T变异的SREBF1序列”(或参考mRNA分子“具有C1,185U改变的SREBF1序列”或“具有C1,185U变异的SREBF1序列”或“具有C1,260U改变的SREBF1序列”或“具有C1,260U变异的SREBF1序列”或“具有C1,056U改变的SREBF1序列”或“具有C1,056U变异的SREBF1序列”,以及参考cDNA分子“具有C1,185T改变的SREBF1序列”或“具有C1,185T变异的SREBF1序列”或“具有C1,260T改变的SREBF1序列”或“具有C1,260T变异的SREBF1序列”或“具有C1,056T改变的SREBF1序列”或“具有C1,056T变异的SREBF1序列”)。
如本文所述,SREBF1基因组核酸分子内对应于根据SEQ ID NO:2的第17,922位的位置可以通过在特定SREBF1核酸分子的核苷酸序列和SEQ ID NO:2的核苷酸序列之间进行序列比对来鉴定。存在多种计算算法可用于进行序列比对以鉴定对应于例如SEQ ID NO:2中的第17,922位的核苷酸位置。例如,通过使用NCBI BLAST算法(Altschul等人,NucleicAcids Res.,1997,25,3389-3402)或CLUSTALW软件(Sievers和Higgins,MethodsMol.Biol.,2014,1079,105-116),可以进行序列比对。然而,还可以手动地对序列进行对齐。
本公开还提供了治疗或抑制脂质水平升高的治疗剂,其用于治疗人类受试者中的脂质水平升高(或用于制备用于治疗脂质水平升高的药物),其中所述人类受试者具有:i)具有编码人SREBF1多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物;ii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;vii)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物;viii)包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸的SREBF1多肽;ix)包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸的SREBF1多肽;和/或x)包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸的SREBF1多肽。治疗或抑制脂质水平升高的治疗剂可以是本文所述的治疗或抑制脂质水平升高的治疗剂中的任一种。
本公开还提供了用于治疗人类受试者中的脂质水平升高(或用于制备用于治疗脂质水平升高的药物)的SREBF1抑制剂,其中所述人类受试者具有:i)具有编码人SREBF1多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:2的17,922位的位置处的胸腺嘧啶或其互补物;ii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;iii)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;iv)具有编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含在对应于根据SEQID NO:8的第1,056位的位置处的尿嘧啶或其互补物;v)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;vi)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;vii)具有编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物;viii)包含在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸的SREBF1多肽;ix)包含在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸的SREBF1多肽;和/或x)包含在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸的SREBF1多肽。所述SREBF1抑制剂可以是本文所述的任何SREBF1抑制剂。
以上或以下所引用的所有专利文献、网站、其他出版物、登录号等出于所有目的以引用的方式整体并入,引用程度如同每个单独项均被具体地且单独地指出如此以引用的方式并入。如果序列的不同版本与不同时间的登录号相关,那么意指与在本申请的有效申请日时的登录号相关的版本。如果适用的话,提及登录号时,有效申请日意指实际申请日或优先权申请的申请日中较早者。同样,如果出版物、网站等的不同版本在不同的时间公布,那么除非另外指明,否则意指在本申请的有效申请日时最新公布的版本。除非另外具体指明,否则本公开的任何特征、步骤、元件、实施方案或方面均可以与任何其他特征、步骤、元件、实施方案或方面组合使用。尽管出于清楚和理解的目的已通过说明和实例详细描述本公开,但将显而易见的是,可以在所附权利要求的范围内进行某些变化和修改。
提供以下实施例来更详细地描述实施方案。它们意图说明但不限制所要求保护的实施方案。以下实施例为本领域普通技术人员提供了如何制造和评价本文所述的化合物、组合物、制品、装置和/或方法的公开和描述,并且意图仅仅是示例性的,而不意图限制任何权利要求的范围。已努力确保关于所用数值(诸如,例如量、温度等)的准确性,但可以考虑一些误差和偏差。除非另外指明,否则份数是重量份,温度是以℃计或处于环境温度,并且压力处于或接近大气压。
实施例
实施例1:在老派阿曼派(Old Order Amish)中SREBF1(SREBP)中的错义变体与LDL-C和总胆固醇的降低显著相关
分析了从老派阿曼派群组中获得的pLoF多态性和错义变体。结果(参见表1和图1)示出SREBF1变体与LDL-C和总胆固醇的降低显著相关。所述变体在老派阿曼派中以0.032的等位基因频率存在,并且与gnomAD相比漂移了约2900倍。
表1:SREBF1变体与降低的LDL-C、非HDL胆固醇和总胆固醇的关联
*p值和影响已经针对APOB p.R3527Q基因型进行了调整,该基因型在老派阿曼派中更为常见。所有性状也针对年龄、年龄2、性别和研究进行了调整。
实施例2:SREBF1变体调节LDLR启动子活性
在HEK293细胞中以恒定和滴定剂量用各自0.4μg的SREBF1WT或呈核形式或全长形式的突变型SREBF1(R334C)变体和对照pSMPUW质粒进行含有pLDLR-luc报告基因(G10855)的质粒的瞬时转染。48小时后收集细胞用于荧光素酶测定和抗flag蛋白质印迹蛋白分析。测量荧光素酶活性作为LDLR启动子活性的替代物,用抗flag抗体进行蛋白质印迹(图2)以测量flag标记的SREBP蛋白表达,并且使用ImageLab软件对蛋白质带进行量化(图3)。
结果表明,SREBF1(R334C)的全长和切割的核变体以及全长变体与野生型相比对LDLR启动子报告基因具有较低的LDLR启动子反式激活报告基因活性,如荧光素酶和ImageLab结果(图4)所示,表明SREBP变体可能对LDLR和其他靶基因具有更低的调节活性。R334C变异属于SREBP的HLH结构域,所述结构域与靶基因的启动子DNA结合。
除了本文所述的修改之外,所述主题的各种修改对于本领域技术人员来说将从前述描述中显而易见。此类修改也旨在落在所附权利要求书的范围内。本申请中引用的每篇参考文献(包括但不限于期刊文章、美国和非美国专利、专利申请公布、国际专利申请公布、基因库登录号等)均以其整体和出于所有目的以引用的方式并入本文。
序列表
<110> 雷杰纳荣制药公司(Regeneron Pharmaceuticals, Inc.)
马里兰大学巴尔的摩分校(University of Maryland, Baltimore)
<120> 用固醇调节元件结合转录因子1 (SREBF1)抑制剂治疗脂质水平升高
<130> 189238.02002 (3201) (10536WO01)
<150> 62/879,138
<151> 2019-07-26
<150> 62/820,893
<151> 2019-03-20
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 24930
<212> DNA
<213> 智人(homo sapien)
<400> 1
gcggccgggg gaacccagtt tccgaggaac ttttcgccgg cgccgggccg cctctgaggc 60
cagggcagga cacgaacgcg cggagcggcg gcggcgactg agagccgggg ccgcggcggc 120
gctccctagg aagggccgta cgaggcggcg ggcccggcgg gcctcccgga ggaggcggct 180
gcgccatgga cgagccaccc ttcagcgagg cggctttgga gcaggcgctg ggcgagccgt 240
gcgatctgga cgcggcgctg ctgaccgaca tcgaaggtgc gtcagggcgg gcagggcttg 300
aagctgcgcc gggtggcgcg agtagggggc gcgcaggtgt ctccctggcc tttgtctccc 360
ccacgggcgc cagctccgtg ctgtgctcgc gcgggacttc ccggtgtctc tgagctcggt 420
gtcccgagcc tcaccgagcc tccctggttc ccgcgctagc gtctcgggcc gcgcgcttgt 480
gggtgagggc tcctgggccg ggccggggtc ccttggcggc tccgggccgg gacacgtgcg 540
cctctacgcg tcccaggccg ggtgccgccc gaccggtgac tctccagccc tgtgatggcc 600
acggctgaag ctggggaccc aggcgtcgcc gaagctccgc cccagcccca gccgtgacgt 660
aattgcgagg ttactcacgg tcattccctc cggcccgaga gttcagctcg gcgtcggagc 720
tcttgcgcat gcgcatgggc gctgcctcgc gcccttcccc cgcctcgtgt cgggttctcc 780
cggtctgcga cgggcacagc ctccgcactc attcactgac atccaccgaa tgccaggccc 840
cgtcttaggc accgagggtt tacagacaga cctgggtacc ccctctttta gggaacacaa 900
aaatctcccg ggaaaccaaa cgggtattta gttgtacctt gggtggagcg aggctggggg 960
agggcaggga tgtggctact ttgggtagag cggtcaggga cttctaagct gagacctgag 1020
ggtcaccccc aggaccagca aggaaagatg ttttccaggc cacggcaagg gaagggcaaa 1080
ggcctcgagg cagggcctaa gtgtgaggag ttagaggctt gcaaaggagt gaggtcaggg 1140
aggaggagga cgcaaaccga cttggtcggc cagggaaagg gcggagcaga acagtggcac 1200
cggcttccat ctttggagca tcaccctggc tgtgatgaga aggggtttgg ggccaatggt 1260
ggcaccaagt gccaattagg aggcccgttg cttccatttt gtagatagag caaacggaag 1320
cccctagcaa attgcctgca tggtttctgt gcaggagttt tagcagcact agctaagttg 1380
cacttggttg atgaggaaac tgaggccaag gtcgcaggaa caagatgcct agactcacag 1440
cctgaatgga catgtccatg gaacccgtgg ccaccctggg gttggcaaaa cagatatatc 1500
tatgccacca ccactcctgc cctactgcag ccttgcagat gagcccagct ggttgccagc 1560
cccagaagct tcccagccct ccctccttcc ccctggggct gggctagggg aggaccccag 1620
aggagaggcc ctgattgtga ggcttttcca aaacagcctc ccctatccct ggcacgaggg 1680
gttgtccttc actgccctct ggagtgatga accctgaaat cccaagccct agggagatct 1740
gggcctgact caactaccag ttccacatca ctgggcccag tgagtgtagt cccaagaggc 1800
aacgtgacca agccaggagg acatgcgctt tggggtcaga acttgaacct ggacactcct 1860
cacttccttt gtcatcctgc tcaagccctc tcaccctcta aaccttagtt tccacctcca 1920
gaaaaatgat gcaaaccctc ccttcatggg caagttggac aacagaaccc gttctgggcc 1980
acaggtctga tacagacctt tgtttgtttg tttgtttgtt ttctgcagtg gcgcaatttt 2040
ggctcactgc aagctcctcc tcctgggttc acgccattct cctgccttag tctcccaagt 2100
agctgggact acaggcgcca gccaccacgc ctggctaatt ttttgtattt ttagtagaga 2160
cggggtttca ctgtgctagc caggatggtc tcgatctcct gaccttgtga tccgcccgcc 2220
tcagcctccc aaagtgctgg gattacaggt gtgagccacc gctcccagcc cagacctttc 2280
ttactgacag aatctggtct gggccagagg tctgatacag acctttctta ctgactcatg 2340
gataaaaaca ttgtctctcc agaaccaaag gccaggcatg ggcagccatg tggcccaagg 2400
tctagtctat gagagagtgg gggcagtccc agccccttga agactggggg cagccccttc 2460
tcactaggca gggctcagct ttacccactt cagtagagga tttttcagtt tttattcaaa 2520
cttcctgttt ttcttcccaa ttacacacat cttttttcat tgtagaaaac ttagaaaatg 2580
caagtgagca aaaagaagaa aataaaatct ttagacctgg ggtggtggct cacacctata 2640
atcccagcac ttgggaggtc gaagcaagag gatgacttgt gtccaggagt ttgagaccag 2700
cctgggcaac atgacaaaat cctgtctcta caaaaataaa aaattagctg ggtgtgggtg 2760
acatgtgcct gtagtctcag ctactctgga ggctgaagtg ggaggattgc ttgagcctgg 2820
acttagaggc tgcagtgagc tataaccatg ccgttgcact cagcctggat gacagagtga 2880
gattctgttt caaaaaaaac tttaaaccta ccacccagag ataagccctg ctaattatgt 2940
gaaagagctt ttcttctctc tctctctctc tctctgtgtg tttatatgtg tttggggatg 3000
ggtgcacact cttcataaac tttttttttt ttgagacagg gtctcgctct tttgcccatg 3060
ctgtagtcca gtggcatgat ctcagctcac tgcaaactct gcctctcagg ttcaagagat 3120
tctccagctc ccaagtagct gggattacag tcatgcaccg ccacgcctgg ttaaattttg 3180
tatttttagt agagatggcc atgttggcca ggctggtctc gaactcctga gctcaggtga 3240
tctgcccacc tcagcctctc aaaagtgctg ggattacagg gcatgaacca ccatgcccgg 3300
ccttcatcaa ttttttaaaa acgactttat tgaggtatac tttatgtatc acaaaattta 3360
cccattttta gtatatcatt caatgatttt tagttaactt tttgagttgt gtgacaatta 3420
ctagctgtcg aacattttta tcacacagtg agatccctta tacttcttta gtcagttcct 3480
gttcctgctc ccagccccgg gcagctgtgg atctgtatgt gtgtgtgtat atatatatat 3540
atatatatat attttttttt tttttttttt tttttttttt ttgagacgga gtcttgctct 3600
gtcgcccagg ctggagtgca gtggtgcgat cttggctcac tgcaagctcc gcctcccagg 3660
ttcaaacagt tctgcctcag cctcccgagt agctgggatt acaggcacct gccaccacgc 3720
ccggctaatt tttttgtatt tttagtagag atggggtttc accatgttag ccaggatggt 3780
ctcgatctcc tgaccttgtg atctgcccac ctcggcctcc caacgttctg gaattacagg 3840
cgtgagccac cgcgcccggc tggatctgta tttttataaa ttaaaatagg gtccattggt 3900
tcacagctga ttggaatctg cttggttcca tgtcaacagc cagacgacag taaggtttcc 3960
tcttattacc cacctgattc cctgtcgatg gacacctagg ttgttttatc tttataaact 4020
gctgcagtgg acactgaggc cggttttttt ctttgttttt ttttttttgt ttgtttgttt 4080
ttgagacaga gtcttgctct gtcacccagg ctggagtgca gtggcgcgat ctcggctcac 4140
tgcaaactcc gcctcccggg ttcacaccat tctcctgcct cagcctcccg agtagcttgg 4200
gactataggt gcgtgccacc atgcctggct aattttttgt atttttagta gagacggggt 4260
ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc atgatctgcc cgcctcggcc 4320
tcccaaagtg ctgggattac aggcgtgagc cactgtgcct ggccactgag gccagtcttt 4380
gcccggatcc tcactgtgtt cctaggatga ggttctggga ggggaattgc tggtcagagg 4440
tcgagcctgc ttttgaagct tcttctacca ggagtggagc tgagcaggtt tgataaggtc 4500
tgaagatttg ggggtggaaa tgccaggtcc cttgagagac atgagggata agagggggcc 4560
aggctggcct tgagtgccag agtgcagagc tgggctagat gtgaggacag tcgggggtca 4620
gagcaggggc acaccgagct tcagttccct ctggctgctt ggatggagga tcgtaatgtg 4680
aacagaaaac actaattgag tacttactgt gtttcagaca gtgtgttgat aatcccactt 4740
aatcccctga caaccccaag taggtagaca tatgatgaag atgacggcct tgaggaccag 4800
agaggttaag tgatttgcct gagatcacac agccagatga tggcaaagcc agaattcaaa 4860
cccaggctgt gggctccaga gcctagctct taagctctta agcactgggc tcctaagaat 4920
ggggatgagg ggttgaggga ggctcctcca caggggctac tctgggggcc tggaagtggg 4980
tcacagaggg gtcagaggct atgtggctac ctccccatcc cagtccagag cagtgtttga 5040
gtcattagac tgggaaccag ccctggtgag ccagccaagg gccttgggcc ccatccggtc 5100
ctgctgcctg ccacagccaa actcttgtca tgtgaatgga tttggggatg gagctgcctc 5160
catgagtcct tgcatctgtg ggtgaaggca ctgccctggc tatagtgtcc ctgggtttga 5220
gtcctgcatc tgcaccaaga cctcaggtga gcctgtctcc ttctgggcct cagagtacct 5280
tgcagctgtc gggggaggat ggatcaggag atggccctgt acctgtgttg gggattattg 5340
ttaagcccgt ggcagtcttc acctccctgc tgaggattaa tttatccaat tttgcacaag 5400
cttatgagtg cagaagaggc agacggaaac agagttctgg ccaagagcct ggaacagggc 5460
ctcggggtct ctttcctatg cctggacccc gtcatgtctg ctctttgtct gtcggacccc 5520
agatgtctgc caagccccgt cagaggctgc ttcccagaaa gcccttctgg gtgtcacctt 5580
gccccgagca gtgcgttctc agagttctcc cgccctgatg tccctcccag catgcccagc 5640
ccagccacaa cagggccttg cttctagtca tgtgtctggc tgtttgctgg gtccaggcca 5700
gccctggtag ggcacaatgg gggcccgctc tgccacccca tacctctccc caggatatct 5760
catgccccag ttctctccct agttccacca agcactggca ctccttagaa aacacagctc 5820
tagactagtt actgccctag cttacagcac agaactcccc tggtctccaa ccattcatgg 5880
ctccctagtg ctccaagata aagttccctt gtctcagccg ggttgggagt taccttctgc 5940
ccaacattca cctagctgga cacaaacatc ctgagtgacc cggtcagctc caggcaggag 6000
tcactgccag cagaggcctg ggatctggac tttgcctgct gacaggtgga gcccaggccg 6060
gccagaggaa gtgcctctga ccttgtctcc tagcagccac gggccatgtg gacatgcctt 6120
ttgaccctgg gcactgacag tgtgtgacag cctgcaccat gtgctccaca ggggcggctg 6180
tgtgtgtcgg gggtgaggtg gggaaagcct taactggctc aggggtgaga ggtcagggag 6240
ccattgagac tggctccagg tgtgggtccc ctgctgggtt ggggcttgtg ggaggtggga 6300
cggggctggg ggtccatccc cctaggggga atttgtggcc taccccgaac cctgtttgag 6360
ctcctttcct aactgactcc ccgtccctgc acctgtctcc cagcaggcct tgcctctgca 6420
tgctgcccct gccaggctct ggggtccctg tgctccctgc agctagaagg ctgggatcag 6480
gggtcttaac aagcagccct actgtatgac cttggacaag tccaagaacc ttcaggttct 6540
taacaatgta aagggagcag tactaaaagc agcttcttgg aattgtgggg atccgatgag 6600
tgaaggctta agcagtgcat ggcacatagt aggccctgaa ccaatgccag ttagtgttat 6660
tattatcacc atttagccag atgcagtggc tcacgcctat aatcttattg actttagagg 6720
ctgaggttgg aggattgctt gagaccagga gttcaagacc agcctgggca acatagcaag 6780
gccctgtttg ttttagagaa aacaaacaaa tcaccattta gagcacctaa ccagtacctg 6840
gcacgcgata ggtttagctc aacaaatgtt agcagcaatt acccaaggag cctgtgctgg 6900
aagtttctag gatgtaccag gctatggttc caagttctga gcatctacca tgtggtggtc 6960
tggagttggt gagagacagg atggggctga ctaggccagt ggggagcacc ccccgccatg 7020
gggaacaagc accctatcct tggcttccat ggaagataat tgatgctggg cacagtggct 7080
cacgcctgta atcccagcac tttgggaggc tgaggcaggg ggatcgcttg agtctgggag 7140
ttcaagacca gcctgggcaa cattgtgaga cccaaactaa aaaaattagc ttggcatggt 7200
ggagtgtgcc tgtcgtccca gctactcagg aggctgaggc taaagctgga ggattgcttg 7260
agcccaggag gttgaggctg cagtgagcca tgatcatacc actacactcc agcctgggca 7320
acatagtgag gccctgtctc aaaacaaaca aacaaaaaga acctgctgag gaagcagtgt 7380
ttctggctgg gggaggacgg gcagagtggc catctggcca cagatggcgg tttctgtgca 7440
aaacacatca aggcagcctt ggaaatgtga gtgaaagcac cttcaaagtt ctggtcacag 7500
ccttgggact aagcaaagcc accaaaagta cataaaagac aatgaccatc acccagtgcc 7560
ggtgatgcta gaaggaaagg gaatacgttg tagggaaggt tgtaaagggc tttatctttt 7620
ccagactgga gcctggcagc tcgaaaacat cttgctgcct tcatatgagc tttaaaacaa 7680
gctgcagaga aacaactcaa gagggagaaa tatatatata tatgtgtgtg tgtgtgtatg 7740
tgtgagtgtg tgtgtgtgtg tgtatacata tatatatata tatatatata tatatatttt 7800
tttttttttt taagatggag tctcgttctg tcaccaggct ggagtgcagt ggtacaatct 7860
cggctcactg caacctccgc ctcctgggtt caaatgattc tcctgcgtca gcctcccaag 7920
cagctgggac tataggcaca taccaccacg cccagctaat ttttgtattt ttagtagagg 7980
ctggatttca ccatgttggc caggatggtt ttgatctcct gacctcgtga tctgcctgcc 8040
ttagcctccc aaagtgttgg gattacaggc gtgagccagt ttgtttttag agacggggtc 8100
ttgctctgtc acccaggctg gaataccatg gcacaatcac agctcgctgc aatgttgaac 8160
tcccgggttc aagggatcct cccacctcag cctccagagt aatggagact acaggctcat 8220
gccaccatgc ccagctattt ttaaaacttt gtagagatgg ggccttgcta cattgcccag 8280
gctggtcttg aactcctggg ctcaagtgat ctgcctgcct ttgcctccca aagtgctgtt 8340
attacaggtg tgagcccctg cgcctaacct tagcactgcc attttgactg aaaacaggtg 8400
cccagcagca ggggctactc ccagaattgc cactgcatca ggcccgtggg ttgttttcag 8460
ctgccagtga taagtatgtg ccctgggcca cctctcggac aaggtgtctg aattggtgcc 8520
gaccagcatc acatgtaatt gccatctcgc aggtgctgct gagggtaatt ccgcacacct 8580
gtagctccgg gaagagccta gtggggagga ggaaacgtgg ctctgaggtt tatagggtca 8640
gacggtcagt atgttgggag ctggcatgtg gaggggcaca gacaagggaa gaatgggagg 8700
tggcatcaga gcaagttttg atggaggaat aggaattcac caggtggaaa gggcattcct 8760
ggtggaggga acagcctggc cttcaatagc ttgtggtgtt cagaaagcag gcagggaaag 8820
ggaggcccag ggagacacca gttaggggat gggggtggag gcagacgagg gtggaggaag 8880
ccatggctgg agtctgcacg gcctctgact ggggtccctg ctgtggtcag ccctgtgctg 8940
ggtgaggctg gggtcacagc tggttcaggc cctgacagga ggggccccca gctgaggccc 9000
agcctctaat ttggcagggc aggtggatag gtctgggggg gtggtggtta ggaagcctcc 9060
aggaggaggc agtgccggag ctgagcctta aagagcttcg tgttgtcctc tctgtctttg 9120
cactctgcac acactcactg aactgcgaca aatgaggata gctggtcagg gcagaggcag 9180
gccggagttg gggctcactg ctgtccccca caggctgggg ctgaagggca ggctctgggg 9240
ccgcagaatg gggtttgtgt accagattct tcatatggca gctgtgggac tttgggcacg 9300
aggcctccgt ctgagcctta gtttcctcaa gaggacctgc gcccaggtgc acctggggct 9360
ccagccatgg gtgcgtccca ttccgggaag agctggcaca cacttgtgcc cccggggcag 9420
ccatgagtgc acaaagggca gcctgtgcca ctgctggata cacgaccagc tgagaacacg 9480
aggaccgccg actccagtta ggaggatcaa ggaagtgcct ggtgggagca gaacagcagg 9540
tggggtgcag cccagctccc tggagggatg gtgggcaccc atcctcaccc tgctgcctcc 9600
attagcaggc cgagagggtg tgctctggaa tcccatgagc acctgtgcca catcctcccc 9660
tgtggctgac ccttcttcac agttggtgca gctttgtggt ctgtagtgca gggatcaatt 9720
ggcaaatccc tttcccaccc attccctgga gaattggggt ccttggctca gatgacagac 9780
caacctgagt tggaatccca gctccttggt ggccgtcctg gcctccaccc cctcactgcc 9840
tccgctcctc ctatcctgcc cacgcccact gcagggcctt tgcacacact gtttcttctg 9900
ccctcccttc cggcccactc cctcatatca ttcagtcctc ctttcagatg tcacctccta 9960
agatgggctg ccctgaccac ctcatctata atggccccag tgcctggcac aggattggca 10020
cacagtagat attgtcagag atggatctgg gttctgtgga caaggctgtg ggggcaggtg 10080
aagagctccc tcttccagga ggttgtttgg ggttcaaggc cttgtttggg ttgtaggctt 10140
ctgtgctggt cagcgttggg ccctacaagc gcatgccatg aggcctgccc aggatttccc 10200
tcatggcctc acagaataca tcggccagag tcattaaagg gcgcctgcat ctgccttcag 10260
agagaggttt gaaggtagaa ctggggaggg atgccaggtg ggggttcagg tttcctgttg 10320
ggtcctgata gaatcagggc aggagaggaa gaagaagagg gaagaggagg aacccaggct 10380
tggggagggg tggcagggct tcacaagcct ggggaaggtg aactagggag cagttggggc 10440
caccatggcc cagagtctat gcctcctctt ccttcctgtg ttcagagtgt gtgtgggaac 10500
cacaagggcc ttctcagtgt tcatagggaa gcccggttca cccatgggtg ggccgcaatt 10560
tgggtgccac agtgagcccc tagagaccag ctctcccagc ttccaggaca gggactaggg 10620
gaggcaagag aggctcttcc ttaaattgtg cacccaaggt gcctcagctg ccttactcta 10680
gactggcccc gttaactccc cttaaaaaaa aaaaaaaaaa gactcagtcg aatggtaatg 10740
gagctccaac gtgaatactg caagtatcag gcaactcact acctgacttt ccagttctaa 10800
accattctaa ttgctgtaga gagaactaac ctttgttgag actgttgagt gatggatgtt 10860
ttacacactt gctttcccag aattcccacc tctggagatc gtaggtgtgg gagctcagag 10920
ggtggggagt ggactgtccc catcacacag caagggaggg gctaaaggaa gagcagggcc 10980
tggcatgcag ccccagatag cccacttggg tgtgtctctg agggaggctg cagggctggc 11040
tctagagttt cctttttcag tcttaacctg gtgaccagct tccacagaaa ttggcacggt 11100
gactcatgcc tgtaatcgca acacattggg aggccgaggt gggaggatca cctgaggtca 11160
ggagttcgag accagcctgg ccaacgtggt gaaaccctgt ctctactaaa aatacaaaaa 11220
ttacatttca ttacaggtgt ggtggcgcac acctgtaatc ccagctactc aggaggctga 11280
ggcaggagag tcacttgaac ccgggaggta gaggttgcag tgagctgaga tcgtgtcact 11340
gcactccagc ctgggtgaca gagccagact ctgtctcaaa aaaaaaaaaa aaaaaaaaag 11400
aaattggcca gtagatcagc cccaggggag agtgagccag ggtttggcca ggccttgagt 11460
ttcagaggct ggccatggcc agtggcaccc aggcccttcc cccttcctcg gggcatctta 11520
gcttagtctg tgccctctgc ccaagggcca gccctctgtt cccaggtcac accccctcct 11580
cttggaaggc cccccccgcc ccacccccat cagagtcttt aatgactctg ctgcccctgg 11640
ggctcagaga gcaaccgccc tctcccatcg cgcttcctca gtgggatggg agggggttag 11700
agcaggaaga tgagacaaat aaagacacaa taagaggcag gaatatgtgg taaagccaag 11760
atgggtaagg ggaggggaca ggcttgactg ttcacagtgg ccctggccct gctgtctcag 11820
gctagtatct gcttgttggt ctcaccacat tctaggctca gaaactgggg agcaaagtaa 11880
tgaaagaacc aggctgggag gccatgggga actcatgcct ggagttcagc tctcagtgtg 11940
cttttgggtc aaggacgctt ccctgtctta agtcactcat gtcagagcct ttgccaagag 12000
caatgctgtg ttttgttttg ggggtgaggg aacacccgcg ggctgagggg agggttgggc 12060
catgctagag aggccgtctg ttgtccttga acctcccaaa gctgggaaat aagggcctgg 12120
gctggacggc ggtggcgagg acaggttgcg agagagacat ggctgggttt tcttgcttag 12180
ggtcctgaat agagagcaag gttgaggccg cagggacccc agcccccaat ggactgctga 12240
gtcgctgggt ctgcccaggg ttcaggcacc ctctcaggtt gcagccaact ggggtgtgga 12300
ccaggcagag gcgctggcct gcagtttggg gcagaggcag gctttgctgg tggtctactt 12360
ggctgcaaaa tcaactggcc aggctctgat cactttgtgt gtgtgtgtgt gtgtaacttt 12420
tacctttgac aaaagaggga agacaggccc aggcacctcc tcaaaagaac cctagagcct 12480
gtcacccctt ccttacccat cttctgtcct agggactgca gcccttcctg gcttcccagg 12540
gccctacaat gaatagtggg tcgggactca cttggtgact gctgggttgt gaggccttga 12600
gggggagggg cagacttcac ccatctggca gagggacatc ggtgctggca gtcaggaaac 12660
ccttatttcc aggcctcagt ttcccggaag tgacctgttt tcaggagtgg cctcatccca 12720
gaccatcagc cccgctgtgg tgaggggtgg ccccttcctg gggctgccct agaaggggga 12780
ggtccctgca cccaccgcag ctgccactcg gcagcccttg gccttaatta aacgcttctt 12840
gcgtactaag tgctgcaccc atattatctc ccttctacca ttcgacgcca gggagataat 12900
gactgtcctg ttttctggag gagtaaacgg agggttggag cggttaaggc tcgctcaggg 12960
tgccagcgaa ccagtgattt cgaacacaga gttctggtgt gttgggccag gacttctctg 13020
ctttgaccct ttaacgaagg gggcgggagc tgagggccag tgaccgccag taaccccggc 13080
agacgctggc accgagcggg ttaaaggcgg acgtccgcta gtaaccccaa ccccattcag 13140
cgccgcgggg tgaaactcga gcccccgccg ccgtggggag gtggggcggg ggccggggcc 13200
gggccctagc gaggcggcag cgcggccgct gattggccgc gcgcgctcac cccatgcccg 13260
gcccgcagcc ccgaagggcg gggcggggcg ggacctgcag gcggggcggg gctggggcgg 13320
ggctgggggc ggggcggggc ggggcgggcg cgccgcagcg ctcaacggct tcaaaaatcc 13380
gccgcgcctt gacaggtgaa gtcggcgcgg ggaggggtag ggccaacggc ctggacgccc 13440
caagggcggg cgcagatcgc ggagccatgg attgcacttt cgaaggtatt tttggaggcc 13500
tccccaccag ccctttatac aatgcctccg tctcctgcag gttctcctgg ggtgggcggg 13560
catgcgggct acgcaacttg agcaggaaag agccccttcc cgagggagaa ggtgtgacag 13620
ttaccagctc gctggggaag tggagggcta cctccaacca aattagtgtc ccctgcaact 13680
caagggggaa gggtttgctt agagacccaa aagcagcatc ccgacctaag agggtttgga 13740
gggagagggt ggtcttctct acattctctg cacccgcttt gggacaggac caggaggaag 13800
cagggaggag ggcccgttgt ccctctgcca cagcgtctgc cctattcagc acccctgcct 13860
attgtgggca tcttagactt ttcaggaaga cagtgggagc cctagattgt caaaattgtc 13920
agtttttctt tcaggcctca gtttccccca tctatcgaag aggctcacac ggactggggt 13980
aaagggatgg gaaaccctgc agttgaaagt ccattatgac ttgatgactt gtgacctggg 14040
gggtccacaa accaggagag tttctacttg agaagccagg aagactgggg ctgccacccc 14100
atcctgttct gccaactgct ctaggaaatt cccctcctgc agtagcttcc ctgcctgggt 14160
acctgtcagt aggcaatgtt gggtctccac tcggtgccag ctgcctgcca agcaaagcct 14220
cgggcagccg taccaaaagg ggtttagtct tttctgttgt acagatgagg aaactggggc 14280
cagtgagagg aggctgttgg tccaggctcc acttcaagct ggtggtgggc agggctggga 14340
gctcaggctg gggatcctga gagcactgga ggcccccatg ggtcctgtag agcattctga 14400
cccagtgggt gccaccacga gtgggttaga gggccctggg ctgagccaga taggctgcta 14460
gtcaccagct gggggagagg gcccttggcc aggtggggct gaggtgggag tgtgtcccag 14520
tctgtatgag gaggaaggag tcaggacaga cagcacttgc ttttacagag atgaaatcaa 14580
agccctgagt ggccaggcct gggtcttgag gctacttggc tgcaggcaaa gcctggactt 14640
gagcccagaa ctctacacag agacacactg gttggccatg tggccagcag ctggcttggc 14700
cctaagcctt ggtctgttcc actgagtaat gggttggtga tggcagcctg gctcttggct 14760
tcttagtggg gcaagaaaag gcagagagac aatagatttg ggattttgta gacctgggtt 14820
tgaaccccac tgcatgctct tgggctgctt gtggtcctcc ctgagcctca gtgtcttttc 14880
ttgtctccaa gatgaggtga gctaatcttt tgaggtagtc tagggtagtg gccagtggtt 14940
ggggcattgg agtcaaaata gggtctggac tcagttgagt ctctgactct ataagaactt 15000
aggccagtaa gtcacctctc tacagctcag tttcttcacg tgtagaatgg ggccaatgat 15060
cacatcaccc tctcagctgt gggtgaggat taggggtcta gcctggcccc atcaatgtgg 15120
gtagccccac agcgggcctg gcttttggac cagacccacc cttctgacat gggcccccac 15180
ccttagagtc cttctagtgt ggatgaggac cctgctctga tctggggtcc tcttggggga 15240
cttccctgtc tgccattctc tttggggatc ctgcgctgcc ctaggaagag tgggcccagg 15300
ctgcacagtt ggtccttggt cacagaggat cccaccactt cttcagggcc tcaaggcaat 15360
cctgcctctc tctgcacccc tcttccccct gtaaactgag gggaggggaa aatcacccac 15420
tcctcagcag tttctaagtt gctttgtcaa attcagtgcc cagaggatcc tgctgggggt 15480
gcgttttagg atgagaccag gagtggccaa tggtggggtg tggggcccat cgctcctata 15540
tgaagacccc ctctgcccta gactgctcct ccctccccat ccccatctcc atcccaaaga 15600
ctggagctgc tggatctgtg gatggaggcg tgccccccgt ttcacacatt gagaaacagg 15660
ccccaagtgg agccagggaa ggctgcacct gggcctctgg attccttttg ttctgtgtgg 15720
ggttgggggt gatggactgt ggagagggca ggagagctgt ctggaagggt tggtcacctc 15780
atgggcaaat gcttggaagc tggtctgagt ccacggtgca gtgtgtatgt gtgtgtgtgt 15840
gtgtgtgtgt atgtgtgtgg actcagaggt ggatgtcttg tagaatgcat gccccatgaa 15900
gacaggagta aaagtttacc accatccaca tcaagctaca ggacactccc agctccccag 15960
aaagttgctt agttctaggc agggatttcc cttattcaca gccgggagca gtgcctggca 16020
tagtgtgggc actcagcact cagcacatgc tcactggatg agtgaatgaa tgtgagcctg 16080
ctgtttgctg tggactaagg atgtttctag atgtttgggc aaataccgga tggtgggaag 16140
agctcaggct ctgaagtctg cagtcttggg cccgaccctg ggctcagccc cagcctagct 16200
gtggggcaag attgtgagcc ttgtggtgcc caccttgtcc aggtattgtg atgcactcgc 16260
agcagcaggc attgctttag acagcacagg tgctcgcaaa atggctgtat gtccgggaac 16320
accagctcct gtgggtggct ttctgtcctg gtggcattgc ccacacatac agctgtgtgc 16380
caacaagggt tgtgcaaata aggttgtgtt tggatgtgtg tgatgccctg tttgggggtc 16440
agtctctgcc tcactcacgc accctcttct ccttttcaca gacatgcttc agcttatcaa 16500
caaccaagac agtgacttcc ctggcctatt tgacccaccc tatgctggga gtggggcagg 16560
gggcacagac cctgccagcc ccgataccag ctccccaggc agcttgtctc cacctcctgc 16620
cacattgagc tcctctcttg aagccttcct gagcgggccg caggcagcgc cctcacccct 16680
gtcccctccc cagcctgcac ccactccatt gaagatgtac ccgtccatgc ccgctttctc 16740
ccctgggcct ggtatcaagg aagagtcagt gccactgagc atcctgcaga cccccacccc 16800
acagcccctg ccaggggccc tcctgccaca gagcttccca gccccagccc caccgcagtt 16860
cagctccacc cctgtgttag gctaccccag ccctccggga ggcttctcta caggtaaggg 16920
ggatgtgtgg cgggagggga cacccggggt ggggcttcca ggagcacagg aagaagcttc 16980
tgctgtgatg tgagtagagg tctgtgcagg ctttagaaac tggggctcca ctcggctgct 17040
tgagatgccc tgttactagc agtcctggtg tgcttgttgc cggggtaggc gcaacctcgc 17100
actggaggcc tggcttgaag ccagtgcatt tgcatcagag cccaggcagg gactgtccat 17160
aggaagccac atggggcaat gactcatcca aggccagtcg gtgatagaga cctgaagagc 17220
aggttgaaag tgggagaggg aggtctgtgt ctgcagcccc atgctttatt tctgcaggaa 17280
gccctcccgg gaacacccag cagccgctgc ctggcctgcc actggcttcc ccgccagggg 17340
tcccgcccgt ctccttgcac acccaggtcc agagtgtggt cccccagcag ctactgacag 17400
tcacagctgc ccccacggca gcccctgtaa cgaccactgt gacctcgcag atccagcagg 17460
tcccggtgag ggggtctggc caggggttgg ggagggggca gccccagccc agacacacag 17520
cttacagcca agcctctccc accctcaggt cctgctgcag ccccacttca tcaaggcaga 17580
ctcgctgctt ctgacagcca tgaagacaga cggagccact gtgaaggcgg caggtctcag 17640
tcccctggtc tctggcacca ctgtgcagac agggcctttg ccggtgggtg acgtgggcag 17700
ggcataaggg agtggggtct acacacacac acacatgccc acctggtaac atgtgcctgg 17760
ccctgcagac cctggtgagt ggcggaacca tcttggcaac agtcccactg gtcgtagatg 17820
cggagaagct gcctatcaac cggctcgcag ctggcagcaa ggccccggcc tctgcccaga 17880
gccgtggaga gaagcgcaca gcccacaacg ccattgagaa gcgctaccgc tcctccatca 17940
atgacaaaat cattgagctc aaggatctgg tggtgggcac tgaggcaaag gtgtggagag 18000
gcctgcaggg gcacagaccg gggtgtccct aggaaggaac agatcagggg caactggaag 18060
gaagagaggg agtgagactg agcctggaca agcagggaat tggaattcag cctccccagg 18120
cctggccagc ctcgtttatt tagttaaact ggtttgcagg cctcttcaat aaaggtgggg 18180
ctgtgctagg cattggggat gcagcaatga acaagacaga caaaaattgt ccctcaaaga 18240
agagccgacc ttctggtggg ggagatggac agtaggcagg atgaataagt gctcgagacc 18300
accacgtttg gctcgttgca gagaaagcag gaagaggatg gtgagggtcc cctggtggta 18360
gccagggaag gcctccctga gatggcggca ggcacagcag cagctagcca gaccctgctg 18420
tctgcatctt acattctaac cctatgcccg gcctgggagg tgggtgctac taggcgagga 18480
acggttcagg tagaaggaac aagtgcaaag gtcctgaggc agtaatgttg caaagcagct 18540
ccgcaccccc ttgctagggc tctccaaccc cacaaccccc gacctgacag gccacctgtg 18600
cgctccccct ccctcccaca ccgtgcagct gaataaatct gctgtcttgc gcaaggccat 18660
cgactacatt cgctttctgc aacacagcaa ccagaaactc aagcaggaga acctaagtct 18720
gcgcactgct gtccacaaaa gcagtgagtc ctggctttat tgagctccag tctggcctct 18780
tctctagcct tgctccacct cccggcccca ccccatccct agccccaccc cacccttggt 18840
tctggcccac cctctgccct gcccacctca cccttggctg tagccctgca ttcagctcta 18900
gtcccttggt tacctctggt cctgaaagag acctggtgcc tccctttggc cctaacccag 18960
ccccatcaaa gcgtcctggg ctagctttag gagctacagt agtccctagg cctccaaggg 19020
cctaggctct gatttggggt cacatatcca gcctttactc ctggctctgt tcctttcggc 19080
ccacagaatc tctgaaggat ctggtgtcgg cctgtggcag tggagggaac acagacgtgc 19140
tcatggaggg cgtgaagact gaggtggagg acacactgac cccacccccc tcggatgctg 19200
gctcaccttt ccagagcagc cccttgtccc ttggcagcag gggcagtggc agcggtggca 19260
gtggcagtga ctcggagcct gacagcccag tctttgagga cagcaaggtt gggccctgcc 19320
acggtgcccc cttccccact cccagccata tcctctgagc ctcatgacag ggccgggaag 19380
accctaacag atcctacctc ccatttcata gacagaataa ctgaggcctg gagccacgtg 19440
gggtcccaca gtaaggtggg cagaatcctg acccccccct tcccagcccc atgctctctg 19500
gggtccctcc gattctgccc tcaccaccct gcccaacccc accaggcaaa gccagagcag 19560
cggccgtctc tgcacagccg gggcatgctg gaccgctccc gcctggccct gtgcacgctc 19620
gtcttcctct gcctgtcctg caaccccttg gcctccttgc tgggggcccg ggggcttccc 19680
agcccctcag ataccaccag cgtctaccat agccctgggc gcaacgtgct gggcaccgag 19740
agcagaggtg ggaccggcca gcctgggcat ctttgggagg gacactcggg gtgagccccc 19800
aggcttgtga acttggggct ctggatttcc tgggagctgt gtccccagct ttccctctgt 19860
ccatagatgg ccctggctgg gcccagtggc tgctgccccc agtggtctgg ctgctcaatg 19920
ggctgttggt gctcgtctcc ttggtgcttc tctttgtcta cggtgagcca gtcacacggc 19980
cccactcagg ccccgccgtg tacttctgga ggcatcgcaa gcaggctgac ctggacctgg 20040
cccgggtaag gggctggccc cggcagagtg ggcagggcag ggaccccagg ctgtgaaggt 20100
gctgggtgtc aacccttgtt cctgctccct gtgcacacca tgaatctgtc ccgtcctccc 20160
tgtgcctagc cacgcatccg cagaccccca ccacccctcc agagcctgct gtggacggct 20220
cttctgagct ttggggcagc tgctctgacc tcacttttct cacctggaaa accctcatcc 20280
acagggagac tttgcccagg ctgcccagca gctgtggctg gccctgcggg cactgggccg 20340
gcccctgccc acctcccacc tggacctggc ttgtagcctc ctctggaacc tcatccgtca 20400
cctgctgcag cgtctctggg tgggccgctg gctggcaggc cgggcagggg gcctgcagca 20460
ggactgtgct ctgcgagtgg atgctagcgc cagcgcccga gacgcagccc tggtctacca 20520
taagctgcac cagctgcaca ccatgggtag gactgagcgt ggggcgggct ccgaggtgct 20580
ccctgctgcc tgtgctccac ccacagcctc atgcctgctt gccttccagg gaagcacaca 20640
ggcgggcacc tcactgccac caacctggcg ctgagtgccc tgaacctggc agagtgtgca 20700
ggggatgccg tgtctgtggc gacgctggcc gagatctatg tggcggctgc attgagagtg 20760
aagaccagtc tcccacgggc cttgcatttt ctgacagtga gtgggttggg gggctggggg 20820
cttatccctg cagctctctc cagaggctcc ctgggtaaga gctacacggg atgtggcagt 20880
ggttaccagg gggactccag gccaagctgg gactcggccc ggggtctggc cccaggctgt 20940
gtccactgtg acagcccagt accctcccct acagcgcttc ttcctgagca gtgcccgcca 21000
ggcctgcctg gcacagagtg gctcagtgcc tcctgccatg cagtggctct gccaccccgt 21060
gggccaccgt ttcttcgtgg atggggactg gtccgtgctc agtaccccat gggagagcct 21120
gtacagcttg gccgggaacc caggtgctct cttacccctt ccctgtcccc tctcctgtcc 21180
ctcatcctca ttcctgtcct gtcccttgtc gcctgaatct ctggctgtct ctggccaccc 21240
cagtccttct ccctgccatg ggttgttgct gtgggggttg caggaaggga aaggcctggg 21300
tgcctctcgt tcccattggg gctttcagaa gcacatgcag ggattgatgg gcagatggct 21360
aattggagaa gtgaccccag gcagtgccgc tgtggagtaa ggaagcggag ccaacaatgg 21420
catcttctca agtcggtttt cctttggaag cagtgtaggg caggcctcag tgttgtctcc 21480
tggccaaggc tggtgctggt gatagttatg tccacccgct ttcccctgtc cttggcaggg 21540
gctgcaccca ggggcatgcc ggcacttccc agtggcccta ggtgtggccc cagcccaccc 21600
aggaaaaagc ccttagcttg gagaggaggg tggggccctg ctccccaccc cactcacctc 21660
ctcctctcca cagtggaccc cctggcccag gtgactcagc tattccggga acatctctta 21720
gagcgagcac tgaactgtgt gacccagccc aaccccagcc ctgggtcagc tgatggggac 21780
aagtaagtgt cgttgtgccc tcctccaggc aaggcccctc cggcgggatt ctgagaatag 21840
ctctggcctc aaccctgtgg agagagccca gagctgggct accgtgcgtg ccatgcacgc 21900
ttcattcctc tctgagtttc ctctccccac cagcctgtgg gaggagacag tggcactttg 21960
cagagccagg ggccaggctg tactctggag ggcaggtggg gagcaccctc ctaggacccc 22020
tgccatctgt tccgacagcc agctctctcc ttccacaggg aattctcgga tgccctcggg 22080
tacctgcagc tgctgaacag ctgttctgat gctgcggggg ctcctgccta cagcttctcc 22140
atcagttcca gcatggccac caccaccggt gagtccccgg cccctgtcct ggctcccttc 22200
tcagctcccc cgtgcagcgt gactgagggt tcaggggacc ctccctcttc tgcaggcgta 22260
gacccggtgg ccaagtggtg ggcctctctg acagctgtgg tgatccactg gctgcggcgg 22320
gatgaggagg cggctgagcg gctgtgcccg ctggtggagc acctgccccg ggtgctgcag 22380
gagtctgagt gagtgcacgg caggttcctc ctgcctggtc ccgggctcag ccttcctcat 22440
cccctgggca ctgtgcctca ctcagccttt gttctgtgca ggaggagtca ccaccttttt 22500
tcctcaggga actcgagcca gggaagtggg gggcactcag ccagggcttg tggactggtc 22560
tgactggcac tcttctgccc tggtcccaac aggagacccc tgcccagggc agctctgcac 22620
tccttcaagg ctgcccgggc cctgctgggc tgtgccaagg cagagtctgg tccagccagc 22680
ctgaccatct gtgagaaggc cagtgggtac ctgcaggaca gcctggctac cacaccagcc 22740
agcagctcca ttgacaaggt gaggggtggg gtcaggggcc tggcagggct gggggattca 22800
gctttccatt ccctggttcc tctccccagc ccccaggggc tgcagaagac catggggtta 22860
gcccaagcag cacaggatag ggggtccagc agaccctgct ttttggctaa ggcttctgtc 22920
cagaggagag gggttgcccc tatctggcct cagtttcccc atccctggga ggaggggggt 22980
ggatggtgtg gtaggatccc tttggaggcc ctgcatcagg agggctggac agctgctccc 23040
gggccggtgg cgggtgtggg ggccgagaga ggcgggcggc cccgcggtgc attgctgttg 23100
cattgcacgt gtgtgaggcg ggtgcagtgc ctcggcagtg cagcccggag ccggcccctg 23160
gcaccacggg cccccatcct gcccctccca gagctggagc cctggtgacc cctgccctgc 23220
ctgccacccc caggccgtgc agctgttcct gtgtgacctg cttcttgtgg tgcgcaccag 23280
cctgtggcgg cagcagcagc ccccggcccc ggccccagca gcccagggca ccagcagcag 23340
gccccaggct tccgcccttg agctgcgtgg cttccaacgg gacctgagca gcctgaggcg 23400
gctggcacag agcttccggc ccgccatgcg gagggtgagt gcccgatggc cctgtcctca 23460
agacggggag tcaggcagtg gtggagatgg agagccctga gcctccactc tcctggcccc 23520
caggtgttcc tacatgaggc cacggcccgg ctgatggcgg gggccagccc cacacggaca 23580
caccagctcc tcgaccgcag tctgaggcgg cgggcaggcc ccggtggcaa aggaggtgag 23640
ggggcagctg ctgaccaggg atgtgctgtc tgctcagcag ggaagggcgc acatgggatg 23700
tgataccaag ggaggctgtg tgtgtgtcag acgggacaga caggcctggc gcagtggctc 23760
acacctagca ctttgggagg ctcagttggg aggacagctt gagcccagga gttggaggcc 23820
gcagtgagcc tgagtgacag ggagagtccc tgtctcaaaa aaaaaaaaag accaagcatc 23880
ttcttgatgg ttacctgatg acaattcctt tcacaaggaa tcagtggggt gactgtcatt 23940
tgtgggatac atgactgcac gtgcgtgact cagtctgtgg actttgtgtg tgggctgaga 24000
ctagggtggg gagaggggaa cccgccaggc ccccgccagg tacctgtgtg ccaggtacag 24060
gcggctggtg ccgtggcttg tgtgtgggca gggctcccgc gggggcgtgg ccagcttgag 24120
acccatccct gacacatcct cgtgtgcgca ggcgcggtgg cggagctgga gccgcggccc 24180
acgcggcggg agcacgcgga ggccttgctg ctggcctcct gctacctgcc ccccggcttc 24240
ctgtcggcgc ccgggcagcg cgtgggcatg ctggctgagg cggcgcgcac actcgagaag 24300
cttggcgatc gccggctgct gcacgactgt cagcagatgc tcatgcgcct gggcggtggg 24360
accactgtca cttccagcta gaccccgtgt ccccggcctc agcacccctg tctctagcca 24420
ctttggtccc gtgcagcttc tgtcctgcgt cgaagctttg aaggccgaag gcagtgcaag 24480
agactctggc ctccacagtt cgacctgcgg ctgctgtgtg ccttcgcggt ggaaggcccg 24540
aggggcgcga tcttgaccct aagaccggcg gccatgatgg tgctgacctc tggtggccga 24600
tcggggcact gcaggggccg agccattttg gggggccccc ctccttgctc tgcaggcacc 24660
ttagtggctt ttttcctcct gtgtacaggg aagagagggg tacatttccc tgtgctgacg 24720
gaagccaact tggctttccc ggactgcaag cagggctctg ccccagaggc ctctctctcc 24780
gtcgtgggag agagacgtgt acatagtgta ggtcagcgtg cttagcctcc tgacctgagg 24840
ctcctgtgct actttgcctt ttgcaaactt tattttcata gattgagaag ttttgtacag 24900
agaattaaaa atgaaattat ttataatctg 24930
<210> 2
<211> 24930
<212> DNA
<213> 智人(homo sapien)
<400> 2
gcggccgggg gaacccagtt tccgaggaac ttttcgccgg cgccgggccg cctctgaggc 60
cagggcagga cacgaacgcg cggagcggcg gcggcgactg agagccgggg ccgcggcggc 120
gctccctagg aagggccgta cgaggcggcg ggcccggcgg gcctcccgga ggaggcggct 180
gcgccatgga cgagccaccc ttcagcgagg cggctttgga gcaggcgctg ggcgagccgt 240
gcgatctgga cgcggcgctg ctgaccgaca tcgaaggtgc gtcagggcgg gcagggcttg 300
aagctgcgcc gggtggcgcg agtagggggc gcgcaggtgt ctccctggcc tttgtctccc 360
ccacgggcgc cagctccgtg ctgtgctcgc gcgggacttc ccggtgtctc tgagctcggt 420
gtcccgagcc tcaccgagcc tccctggttc ccgcgctagc gtctcgggcc gcgcgcttgt 480
gggtgagggc tcctgggccg ggccggggtc ccttggcggc tccgggccgg gacacgtgcg 540
cctctacgcg tcccaggccg ggtgccgccc gaccggtgac tctccagccc tgtgatggcc 600
acggctgaag ctggggaccc aggcgtcgcc gaagctccgc cccagcccca gccgtgacgt 660
aattgcgagg ttactcacgg tcattccctc cggcccgaga gttcagctcg gcgtcggagc 720
tcttgcgcat gcgcatgggc gctgcctcgc gcccttcccc cgcctcgtgt cgggttctcc 780
cggtctgcga cgggcacagc ctccgcactc attcactgac atccaccgaa tgccaggccc 840
cgtcttaggc accgagggtt tacagacaga cctgggtacc ccctctttta gggaacacaa 900
aaatctcccg ggaaaccaaa cgggtattta gttgtacctt gggtggagcg aggctggggg 960
agggcaggga tgtggctact ttgggtagag cggtcaggga cttctaagct gagacctgag 1020
ggtcaccccc aggaccagca aggaaagatg ttttccaggc cacggcaagg gaagggcaaa 1080
ggcctcgagg cagggcctaa gtgtgaggag ttagaggctt gcaaaggagt gaggtcaggg 1140
aggaggagga cgcaaaccga cttggtcggc cagggaaagg gcggagcaga acagtggcac 1200
cggcttccat ctttggagca tcaccctggc tgtgatgaga aggggtttgg ggccaatggt 1260
ggcaccaagt gccaattagg aggcccgttg cttccatttt gtagatagag caaacggaag 1320
cccctagcaa attgcctgca tggtttctgt gcaggagttt tagcagcact agctaagttg 1380
cacttggttg atgaggaaac tgaggccaag gtcgcaggaa caagatgcct agactcacag 1440
cctgaatgga catgtccatg gaacccgtgg ccaccctggg gttggcaaaa cagatatatc 1500
tatgccacca ccactcctgc cctactgcag ccttgcagat gagcccagct ggttgccagc 1560
cccagaagct tcccagccct ccctccttcc ccctggggct gggctagggg aggaccccag 1620
aggagaggcc ctgattgtga ggcttttcca aaacagcctc ccctatccct ggcacgaggg 1680
gttgtccttc actgccctct ggagtgatga accctgaaat cccaagccct agggagatct 1740
gggcctgact caactaccag ttccacatca ctgggcccag tgagtgtagt cccaagaggc 1800
aacgtgacca agccaggagg acatgcgctt tggggtcaga acttgaacct ggacactcct 1860
cacttccttt gtcatcctgc tcaagccctc tcaccctcta aaccttagtt tccacctcca 1920
gaaaaatgat gcaaaccctc ccttcatggg caagttggac aacagaaccc gttctgggcc 1980
acaggtctga tacagacctt tgtttgtttg tttgtttgtt ttctgcagtg gcgcaatttt 2040
ggctcactgc aagctcctcc tcctgggttc acgccattct cctgccttag tctcccaagt 2100
agctgggact acaggcgcca gccaccacgc ctggctaatt ttttgtattt ttagtagaga 2160
cggggtttca ctgtgctagc caggatggtc tcgatctcct gaccttgtga tccgcccgcc 2220
tcagcctccc aaagtgctgg gattacaggt gtgagccacc gctcccagcc cagacctttc 2280
ttactgacag aatctggtct gggccagagg tctgatacag acctttctta ctgactcatg 2340
gataaaaaca ttgtctctcc agaaccaaag gccaggcatg ggcagccatg tggcccaagg 2400
tctagtctat gagagagtgg gggcagtccc agccccttga agactggggg cagccccttc 2460
tcactaggca gggctcagct ttacccactt cagtagagga tttttcagtt tttattcaaa 2520
cttcctgttt ttcttcccaa ttacacacat cttttttcat tgtagaaaac ttagaaaatg 2580
caagtgagca aaaagaagaa aataaaatct ttagacctgg ggtggtggct cacacctata 2640
atcccagcac ttgggaggtc gaagcaagag gatgacttgt gtccaggagt ttgagaccag 2700
cctgggcaac atgacaaaat cctgtctcta caaaaataaa aaattagctg ggtgtgggtg 2760
acatgtgcct gtagtctcag ctactctgga ggctgaagtg ggaggattgc ttgagcctgg 2820
acttagaggc tgcagtgagc tataaccatg ccgttgcact cagcctggat gacagagtga 2880
gattctgttt caaaaaaaac tttaaaccta ccacccagag ataagccctg ctaattatgt 2940
gaaagagctt ttcttctctc tctctctctc tctctgtgtg tttatatgtg tttggggatg 3000
ggtgcacact cttcataaac tttttttttt ttgagacagg gtctcgctct tttgcccatg 3060
ctgtagtcca gtggcatgat ctcagctcac tgcaaactct gcctctcagg ttcaagagat 3120
tctccagctc ccaagtagct gggattacag tcatgcaccg ccacgcctgg ttaaattttg 3180
tatttttagt agagatggcc atgttggcca ggctggtctc gaactcctga gctcaggtga 3240
tctgcccacc tcagcctctc aaaagtgctg ggattacagg gcatgaacca ccatgcccgg 3300
ccttcatcaa ttttttaaaa acgactttat tgaggtatac tttatgtatc acaaaattta 3360
cccattttta gtatatcatt caatgatttt tagttaactt tttgagttgt gtgacaatta 3420
ctagctgtcg aacattttta tcacacagtg agatccctta tacttcttta gtcagttcct 3480
gttcctgctc ccagccccgg gcagctgtgg atctgtatgt gtgtgtgtat atatatatat 3540
atatatatat attttttttt tttttttttt tttttttttt ttgagacgga gtcttgctct 3600
gtcgcccagg ctggagtgca gtggtgcgat cttggctcac tgcaagctcc gcctcccagg 3660
ttcaaacagt tctgcctcag cctcccgagt agctgggatt acaggcacct gccaccacgc 3720
ccggctaatt tttttgtatt tttagtagag atggggtttc accatgttag ccaggatggt 3780
ctcgatctcc tgaccttgtg atctgcccac ctcggcctcc caacgttctg gaattacagg 3840
cgtgagccac cgcgcccggc tggatctgta tttttataaa ttaaaatagg gtccattggt 3900
tcacagctga ttggaatctg cttggttcca tgtcaacagc cagacgacag taaggtttcc 3960
tcttattacc cacctgattc cctgtcgatg gacacctagg ttgttttatc tttataaact 4020
gctgcagtgg acactgaggc cggttttttt ctttgttttt ttttttttgt ttgtttgttt 4080
ttgagacaga gtcttgctct gtcacccagg ctggagtgca gtggcgcgat ctcggctcac 4140
tgcaaactcc gcctcccggg ttcacaccat tctcctgcct cagcctcccg agtagcttgg 4200
gactataggt gcgtgccacc atgcctggct aattttttgt atttttagta gagacggggt 4260
ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc atgatctgcc cgcctcggcc 4320
tcccaaagtg ctgggattac aggcgtgagc cactgtgcct ggccactgag gccagtcttt 4380
gcccggatcc tcactgtgtt cctaggatga ggttctggga ggggaattgc tggtcagagg 4440
tcgagcctgc ttttgaagct tcttctacca ggagtggagc tgagcaggtt tgataaggtc 4500
tgaagatttg ggggtggaaa tgccaggtcc cttgagagac atgagggata agagggggcc 4560
aggctggcct tgagtgccag agtgcagagc tgggctagat gtgaggacag tcgggggtca 4620
gagcaggggc acaccgagct tcagttccct ctggctgctt ggatggagga tcgtaatgtg 4680
aacagaaaac actaattgag tacttactgt gtttcagaca gtgtgttgat aatcccactt 4740
aatcccctga caaccccaag taggtagaca tatgatgaag atgacggcct tgaggaccag 4800
agaggttaag tgatttgcct gagatcacac agccagatga tggcaaagcc agaattcaaa 4860
cccaggctgt gggctccaga gcctagctct taagctctta agcactgggc tcctaagaat 4920
ggggatgagg ggttgaggga ggctcctcca caggggctac tctgggggcc tggaagtggg 4980
tcacagaggg gtcagaggct atgtggctac ctccccatcc cagtccagag cagtgtttga 5040
gtcattagac tgggaaccag ccctggtgag ccagccaagg gccttgggcc ccatccggtc 5100
ctgctgcctg ccacagccaa actcttgtca tgtgaatgga tttggggatg gagctgcctc 5160
catgagtcct tgcatctgtg ggtgaaggca ctgccctggc tatagtgtcc ctgggtttga 5220
gtcctgcatc tgcaccaaga cctcaggtga gcctgtctcc ttctgggcct cagagtacct 5280
tgcagctgtc gggggaggat ggatcaggag atggccctgt acctgtgttg gggattattg 5340
ttaagcccgt ggcagtcttc acctccctgc tgaggattaa tttatccaat tttgcacaag 5400
cttatgagtg cagaagaggc agacggaaac agagttctgg ccaagagcct ggaacagggc 5460
ctcggggtct ctttcctatg cctggacccc gtcatgtctg ctctttgtct gtcggacccc 5520
agatgtctgc caagccccgt cagaggctgc ttcccagaaa gcccttctgg gtgtcacctt 5580
gccccgagca gtgcgttctc agagttctcc cgccctgatg tccctcccag catgcccagc 5640
ccagccacaa cagggccttg cttctagtca tgtgtctggc tgtttgctgg gtccaggcca 5700
gccctggtag ggcacaatgg gggcccgctc tgccacccca tacctctccc caggatatct 5760
catgccccag ttctctccct agttccacca agcactggca ctccttagaa aacacagctc 5820
tagactagtt actgccctag cttacagcac agaactcccc tggtctccaa ccattcatgg 5880
ctccctagtg ctccaagata aagttccctt gtctcagccg ggttgggagt taccttctgc 5940
ccaacattca cctagctgga cacaaacatc ctgagtgacc cggtcagctc caggcaggag 6000
tcactgccag cagaggcctg ggatctggac tttgcctgct gacaggtgga gcccaggccg 6060
gccagaggaa gtgcctctga ccttgtctcc tagcagccac gggccatgtg gacatgcctt 6120
ttgaccctgg gcactgacag tgtgtgacag cctgcaccat gtgctccaca ggggcggctg 6180
tgtgtgtcgg gggtgaggtg gggaaagcct taactggctc aggggtgaga ggtcagggag 6240
ccattgagac tggctccagg tgtgggtccc ctgctgggtt ggggcttgtg ggaggtggga 6300
cggggctggg ggtccatccc cctaggggga atttgtggcc taccccgaac cctgtttgag 6360
ctcctttcct aactgactcc ccgtccctgc acctgtctcc cagcaggcct tgcctctgca 6420
tgctgcccct gccaggctct ggggtccctg tgctccctgc agctagaagg ctgggatcag 6480
gggtcttaac aagcagccct actgtatgac cttggacaag tccaagaacc ttcaggttct 6540
taacaatgta aagggagcag tactaaaagc agcttcttgg aattgtgggg atccgatgag 6600
tgaaggctta agcagtgcat ggcacatagt aggccctgaa ccaatgccag ttagtgttat 6660
tattatcacc atttagccag atgcagtggc tcacgcctat aatcttattg actttagagg 6720
ctgaggttgg aggattgctt gagaccagga gttcaagacc agcctgggca acatagcaag 6780
gccctgtttg ttttagagaa aacaaacaaa tcaccattta gagcacctaa ccagtacctg 6840
gcacgcgata ggtttagctc aacaaatgtt agcagcaatt acccaaggag cctgtgctgg 6900
aagtttctag gatgtaccag gctatggttc caagttctga gcatctacca tgtggtggtc 6960
tggagttggt gagagacagg atggggctga ctaggccagt ggggagcacc ccccgccatg 7020
gggaacaagc accctatcct tggcttccat ggaagataat tgatgctggg cacagtggct 7080
cacgcctgta atcccagcac tttgggaggc tgaggcaggg ggatcgcttg agtctgggag 7140
ttcaagacca gcctgggcaa cattgtgaga cccaaactaa aaaaattagc ttggcatggt 7200
ggagtgtgcc tgtcgtccca gctactcagg aggctgaggc taaagctgga ggattgcttg 7260
agcccaggag gttgaggctg cagtgagcca tgatcatacc actacactcc agcctgggca 7320
acatagtgag gccctgtctc aaaacaaaca aacaaaaaga acctgctgag gaagcagtgt 7380
ttctggctgg gggaggacgg gcagagtggc catctggcca cagatggcgg tttctgtgca 7440
aaacacatca aggcagcctt ggaaatgtga gtgaaagcac cttcaaagtt ctggtcacag 7500
ccttgggact aagcaaagcc accaaaagta cataaaagac aatgaccatc acccagtgcc 7560
ggtgatgcta gaaggaaagg gaatacgttg tagggaaggt tgtaaagggc tttatctttt 7620
ccagactgga gcctggcagc tcgaaaacat cttgctgcct tcatatgagc tttaaaacaa 7680
gctgcagaga aacaactcaa gagggagaaa tatatatata tatgtgtgtg tgtgtgtatg 7740
tgtgagtgtg tgtgtgtgtg tgtatacata tatatatata tatatatata tatatatttt 7800
tttttttttt taagatggag tctcgttctg tcaccaggct ggagtgcagt ggtacaatct 7860
cggctcactg caacctccgc ctcctgggtt caaatgattc tcctgcgtca gcctcccaag 7920
cagctgggac tataggcaca taccaccacg cccagctaat ttttgtattt ttagtagagg 7980
ctggatttca ccatgttggc caggatggtt ttgatctcct gacctcgtga tctgcctgcc 8040
ttagcctccc aaagtgttgg gattacaggc gtgagccagt ttgtttttag agacggggtc 8100
ttgctctgtc acccaggctg gaataccatg gcacaatcac agctcgctgc aatgttgaac 8160
tcccgggttc aagggatcct cccacctcag cctccagagt aatggagact acaggctcat 8220
gccaccatgc ccagctattt ttaaaacttt gtagagatgg ggccttgcta cattgcccag 8280
gctggtcttg aactcctggg ctcaagtgat ctgcctgcct ttgcctccca aagtgctgtt 8340
attacaggtg tgagcccctg cgcctaacct tagcactgcc attttgactg aaaacaggtg 8400
cccagcagca ggggctactc ccagaattgc cactgcatca ggcccgtggg ttgttttcag 8460
ctgccagtga taagtatgtg ccctgggcca cctctcggac aaggtgtctg aattggtgcc 8520
gaccagcatc acatgtaatt gccatctcgc aggtgctgct gagggtaatt ccgcacacct 8580
gtagctccgg gaagagccta gtggggagga ggaaacgtgg ctctgaggtt tatagggtca 8640
gacggtcagt atgttgggag ctggcatgtg gaggggcaca gacaagggaa gaatgggagg 8700
tggcatcaga gcaagttttg atggaggaat aggaattcac caggtggaaa gggcattcct 8760
ggtggaggga acagcctggc cttcaatagc ttgtggtgtt cagaaagcag gcagggaaag 8820
ggaggcccag ggagacacca gttaggggat gggggtggag gcagacgagg gtggaggaag 8880
ccatggctgg agtctgcacg gcctctgact ggggtccctg ctgtggtcag ccctgtgctg 8940
ggtgaggctg gggtcacagc tggttcaggc cctgacagga ggggccccca gctgaggccc 9000
agcctctaat ttggcagggc aggtggatag gtctgggggg gtggtggtta ggaagcctcc 9060
aggaggaggc agtgccggag ctgagcctta aagagcttcg tgttgtcctc tctgtctttg 9120
cactctgcac acactcactg aactgcgaca aatgaggata gctggtcagg gcagaggcag 9180
gccggagttg gggctcactg ctgtccccca caggctgggg ctgaagggca ggctctgggg 9240
ccgcagaatg gggtttgtgt accagattct tcatatggca gctgtgggac tttgggcacg 9300
aggcctccgt ctgagcctta gtttcctcaa gaggacctgc gcccaggtgc acctggggct 9360
ccagccatgg gtgcgtccca ttccgggaag agctggcaca cacttgtgcc cccggggcag 9420
ccatgagtgc acaaagggca gcctgtgcca ctgctggata cacgaccagc tgagaacacg 9480
aggaccgccg actccagtta ggaggatcaa ggaagtgcct ggtgggagca gaacagcagg 9540
tggggtgcag cccagctccc tggagggatg gtgggcaccc atcctcaccc tgctgcctcc 9600
attagcaggc cgagagggtg tgctctggaa tcccatgagc acctgtgcca catcctcccc 9660
tgtggctgac ccttcttcac agttggtgca gctttgtggt ctgtagtgca gggatcaatt 9720
ggcaaatccc tttcccaccc attccctgga gaattggggt ccttggctca gatgacagac 9780
caacctgagt tggaatccca gctccttggt ggccgtcctg gcctccaccc cctcactgcc 9840
tccgctcctc ctatcctgcc cacgcccact gcagggcctt tgcacacact gtttcttctg 9900
ccctcccttc cggcccactc cctcatatca ttcagtcctc ctttcagatg tcacctccta 9960
agatgggctg ccctgaccac ctcatctata atggccccag tgcctggcac aggattggca 10020
cacagtagat attgtcagag atggatctgg gttctgtgga caaggctgtg ggggcaggtg 10080
aagagctccc tcttccagga ggttgtttgg ggttcaaggc cttgtttggg ttgtaggctt 10140
ctgtgctggt cagcgttggg ccctacaagc gcatgccatg aggcctgccc aggatttccc 10200
tcatggcctc acagaataca tcggccagag tcattaaagg gcgcctgcat ctgccttcag 10260
agagaggttt gaaggtagaa ctggggaggg atgccaggtg ggggttcagg tttcctgttg 10320
ggtcctgata gaatcagggc aggagaggaa gaagaagagg gaagaggagg aacccaggct 10380
tggggagggg tggcagggct tcacaagcct ggggaaggtg aactagggag cagttggggc 10440
caccatggcc cagagtctat gcctcctctt ccttcctgtg ttcagagtgt gtgtgggaac 10500
cacaagggcc ttctcagtgt tcatagggaa gcccggttca cccatgggtg ggccgcaatt 10560
tgggtgccac agtgagcccc tagagaccag ctctcccagc ttccaggaca gggactaggg 10620
gaggcaagag aggctcttcc ttaaattgtg cacccaaggt gcctcagctg ccttactcta 10680
gactggcccc gttaactccc cttaaaaaaa aaaaaaaaaa gactcagtcg aatggtaatg 10740
gagctccaac gtgaatactg caagtatcag gcaactcact acctgacttt ccagttctaa 10800
accattctaa ttgctgtaga gagaactaac ctttgttgag actgttgagt gatggatgtt 10860
ttacacactt gctttcccag aattcccacc tctggagatc gtaggtgtgg gagctcagag 10920
ggtggggagt ggactgtccc catcacacag caagggaggg gctaaaggaa gagcagggcc 10980
tggcatgcag ccccagatag cccacttggg tgtgtctctg agggaggctg cagggctggc 11040
tctagagttt cctttttcag tcttaacctg gtgaccagct tccacagaaa ttggcacggt 11100
gactcatgcc tgtaatcgca acacattggg aggccgaggt gggaggatca cctgaggtca 11160
ggagttcgag accagcctgg ccaacgtggt gaaaccctgt ctctactaaa aatacaaaaa 11220
ttacatttca ttacaggtgt ggtggcgcac acctgtaatc ccagctactc aggaggctga 11280
ggcaggagag tcacttgaac ccgggaggta gaggttgcag tgagctgaga tcgtgtcact 11340
gcactccagc ctgggtgaca gagccagact ctgtctcaaa aaaaaaaaaa aaaaaaaaag 11400
aaattggcca gtagatcagc cccaggggag agtgagccag ggtttggcca ggccttgagt 11460
ttcagaggct ggccatggcc agtggcaccc aggcccttcc cccttcctcg gggcatctta 11520
gcttagtctg tgccctctgc ccaagggcca gccctctgtt cccaggtcac accccctcct 11580
cttggaaggc cccccccgcc ccacccccat cagagtcttt aatgactctg ctgcccctgg 11640
ggctcagaga gcaaccgccc tctcccatcg cgcttcctca gtgggatggg agggggttag 11700
agcaggaaga tgagacaaat aaagacacaa taagaggcag gaatatgtgg taaagccaag 11760
atgggtaagg ggaggggaca ggcttgactg ttcacagtgg ccctggccct gctgtctcag 11820
gctagtatct gcttgttggt ctcaccacat tctaggctca gaaactgggg agcaaagtaa 11880
tgaaagaacc aggctgggag gccatgggga actcatgcct ggagttcagc tctcagtgtg 11940
cttttgggtc aaggacgctt ccctgtctta agtcactcat gtcagagcct ttgccaagag 12000
caatgctgtg ttttgttttg ggggtgaggg aacacccgcg ggctgagggg agggttgggc 12060
catgctagag aggccgtctg ttgtccttga acctcccaaa gctgggaaat aagggcctgg 12120
gctggacggc ggtggcgagg acaggttgcg agagagacat ggctgggttt tcttgcttag 12180
ggtcctgaat agagagcaag gttgaggccg cagggacccc agcccccaat ggactgctga 12240
gtcgctgggt ctgcccaggg ttcaggcacc ctctcaggtt gcagccaact ggggtgtgga 12300
ccaggcagag gcgctggcct gcagtttggg gcagaggcag gctttgctgg tggtctactt 12360
ggctgcaaaa tcaactggcc aggctctgat cactttgtgt gtgtgtgtgt gtgtaacttt 12420
tacctttgac aaaagaggga agacaggccc aggcacctcc tcaaaagaac cctagagcct 12480
gtcacccctt ccttacccat cttctgtcct agggactgca gcccttcctg gcttcccagg 12540
gccctacaat gaatagtggg tcgggactca cttggtgact gctgggttgt gaggccttga 12600
gggggagggg cagacttcac ccatctggca gagggacatc ggtgctggca gtcaggaaac 12660
ccttatttcc aggcctcagt ttcccggaag tgacctgttt tcaggagtgg cctcatccca 12720
gaccatcagc cccgctgtgg tgaggggtgg ccccttcctg gggctgccct agaaggggga 12780
ggtccctgca cccaccgcag ctgccactcg gcagcccttg gccttaatta aacgcttctt 12840
gcgtactaag tgctgcaccc atattatctc ccttctacca ttcgacgcca gggagataat 12900
gactgtcctg ttttctggag gagtaaacgg agggttggag cggttaaggc tcgctcaggg 12960
tgccagcgaa ccagtgattt cgaacacaga gttctggtgt gttgggccag gacttctctg 13020
ctttgaccct ttaacgaagg gggcgggagc tgagggccag tgaccgccag taaccccggc 13080
agacgctggc accgagcggg ttaaaggcgg acgtccgcta gtaaccccaa ccccattcag 13140
cgccgcgggg tgaaactcga gcccccgccg ccgtggggag gtggggcggg ggccggggcc 13200
gggccctagc gaggcggcag cgcggccgct gattggccgc gcgcgctcac cccatgcccg 13260
gcccgcagcc ccgaagggcg gggcggggcg ggacctgcag gcggggcggg gctggggcgg 13320
ggctgggggc ggggcggggc ggggcgggcg cgccgcagcg ctcaacggct tcaaaaatcc 13380
gccgcgcctt gacaggtgaa gtcggcgcgg ggaggggtag ggccaacggc ctggacgccc 13440
caagggcggg cgcagatcgc ggagccatgg attgcacttt cgaaggtatt tttggaggcc 13500
tccccaccag ccctttatac aatgcctccg tctcctgcag gttctcctgg ggtgggcggg 13560
catgcgggct acgcaacttg agcaggaaag agccccttcc cgagggagaa ggtgtgacag 13620
ttaccagctc gctggggaag tggagggcta cctccaacca aattagtgtc ccctgcaact 13680
caagggggaa gggtttgctt agagacccaa aagcagcatc ccgacctaag agggtttgga 13740
gggagagggt ggtcttctct acattctctg cacccgcttt gggacaggac caggaggaag 13800
cagggaggag ggcccgttgt ccctctgcca cagcgtctgc cctattcagc acccctgcct 13860
attgtgggca tcttagactt ttcaggaaga cagtgggagc cctagattgt caaaattgtc 13920
agtttttctt tcaggcctca gtttccccca tctatcgaag aggctcacac ggactggggt 13980
aaagggatgg gaaaccctgc agttgaaagt ccattatgac ttgatgactt gtgacctggg 14040
gggtccacaa accaggagag tttctacttg agaagccagg aagactgggg ctgccacccc 14100
atcctgttct gccaactgct ctaggaaatt cccctcctgc agtagcttcc ctgcctgggt 14160
acctgtcagt aggcaatgtt gggtctccac tcggtgccag ctgcctgcca agcaaagcct 14220
cgggcagccg taccaaaagg ggtttagtct tttctgttgt acagatgagg aaactggggc 14280
cagtgagagg aggctgttgg tccaggctcc acttcaagct ggtggtgggc agggctggga 14340
gctcaggctg gggatcctga gagcactgga ggcccccatg ggtcctgtag agcattctga 14400
cccagtgggt gccaccacga gtgggttaga gggccctggg ctgagccaga taggctgcta 14460
gtcaccagct gggggagagg gcccttggcc aggtggggct gaggtgggag tgtgtcccag 14520
tctgtatgag gaggaaggag tcaggacaga cagcacttgc ttttacagag atgaaatcaa 14580
agccctgagt ggccaggcct gggtcttgag gctacttggc tgcaggcaaa gcctggactt 14640
gagcccagaa ctctacacag agacacactg gttggccatg tggccagcag ctggcttggc 14700
cctaagcctt ggtctgttcc actgagtaat gggttggtga tggcagcctg gctcttggct 14760
tcttagtggg gcaagaaaag gcagagagac aatagatttg ggattttgta gacctgggtt 14820
tgaaccccac tgcatgctct tgggctgctt gtggtcctcc ctgagcctca gtgtcttttc 14880
ttgtctccaa gatgaggtga gctaatcttt tgaggtagtc tagggtagtg gccagtggtt 14940
ggggcattgg agtcaaaata gggtctggac tcagttgagt ctctgactct ataagaactt 15000
aggccagtaa gtcacctctc tacagctcag tttcttcacg tgtagaatgg ggccaatgat 15060
cacatcaccc tctcagctgt gggtgaggat taggggtcta gcctggcccc atcaatgtgg 15120
gtagccccac agcgggcctg gcttttggac cagacccacc cttctgacat gggcccccac 15180
ccttagagtc cttctagtgt ggatgaggac cctgctctga tctggggtcc tcttggggga 15240
cttccctgtc tgccattctc tttggggatc ctgcgctgcc ctaggaagag tgggcccagg 15300
ctgcacagtt ggtccttggt cacagaggat cccaccactt cttcagggcc tcaaggcaat 15360
cctgcctctc tctgcacccc tcttccccct gtaaactgag gggaggggaa aatcacccac 15420
tcctcagcag tttctaagtt gctttgtcaa attcagtgcc cagaggatcc tgctgggggt 15480
gcgttttagg atgagaccag gagtggccaa tggtggggtg tggggcccat cgctcctata 15540
tgaagacccc ctctgcccta gactgctcct ccctccccat ccccatctcc atcccaaaga 15600
ctggagctgc tggatctgtg gatggaggcg tgccccccgt ttcacacatt gagaaacagg 15660
ccccaagtgg agccagggaa ggctgcacct gggcctctgg attccttttg ttctgtgtgg 15720
ggttgggggt gatggactgt ggagagggca ggagagctgt ctggaagggt tggtcacctc 15780
atgggcaaat gcttggaagc tggtctgagt ccacggtgca gtgtgtatgt gtgtgtgtgt 15840
gtgtgtgtgt atgtgtgtgg actcagaggt ggatgtcttg tagaatgcat gccccatgaa 15900
gacaggagta aaagtttacc accatccaca tcaagctaca ggacactccc agctccccag 15960
aaagttgctt agttctaggc agggatttcc cttattcaca gccgggagca gtgcctggca 16020
tagtgtgggc actcagcact cagcacatgc tcactggatg agtgaatgaa tgtgagcctg 16080
ctgtttgctg tggactaagg atgtttctag atgtttgggc aaataccgga tggtgggaag 16140
agctcaggct ctgaagtctg cagtcttggg cccgaccctg ggctcagccc cagcctagct 16200
gtggggcaag attgtgagcc ttgtggtgcc caccttgtcc aggtattgtg atgcactcgc 16260
agcagcaggc attgctttag acagcacagg tgctcgcaaa atggctgtat gtccgggaac 16320
accagctcct gtgggtggct ttctgtcctg gtggcattgc ccacacatac agctgtgtgc 16380
caacaagggt tgtgcaaata aggttgtgtt tggatgtgtg tgatgccctg tttgggggtc 16440
agtctctgcc tcactcacgc accctcttct ccttttcaca gacatgcttc agcttatcaa 16500
caaccaagac agtgacttcc ctggcctatt tgacccaccc tatgctggga gtggggcagg 16560
gggcacagac cctgccagcc ccgataccag ctccccaggc agcttgtctc cacctcctgc 16620
cacattgagc tcctctcttg aagccttcct gagcgggccg caggcagcgc cctcacccct 16680
gtcccctccc cagcctgcac ccactccatt gaagatgtac ccgtccatgc ccgctttctc 16740
ccctgggcct ggtatcaagg aagagtcagt gccactgagc atcctgcaga cccccacccc 16800
acagcccctg ccaggggccc tcctgccaca gagcttccca gccccagccc caccgcagtt 16860
cagctccacc cctgtgttag gctaccccag ccctccggga ggcttctcta caggtaaggg 16920
ggatgtgtgg cgggagggga cacccggggt ggggcttcca ggagcacagg aagaagcttc 16980
tgctgtgatg tgagtagagg tctgtgcagg ctttagaaac tggggctcca ctcggctgct 17040
tgagatgccc tgttactagc agtcctggtg tgcttgttgc cggggtaggc gcaacctcgc 17100
actggaggcc tggcttgaag ccagtgcatt tgcatcagag cccaggcagg gactgtccat 17160
aggaagccac atggggcaat gactcatcca aggccagtcg gtgatagaga cctgaagagc 17220
aggttgaaag tgggagaggg aggtctgtgt ctgcagcccc atgctttatt tctgcaggaa 17280
gccctcccgg gaacacccag cagccgctgc ctggcctgcc actggcttcc ccgccagggg 17340
tcccgcccgt ctccttgcac acccaggtcc agagtgtggt cccccagcag ctactgacag 17400
tcacagctgc ccccacggca gcccctgtaa cgaccactgt gacctcgcag atccagcagg 17460
tcccggtgag ggggtctggc caggggttgg ggagggggca gccccagccc agacacacag 17520
cttacagcca agcctctccc accctcaggt cctgctgcag ccccacttca tcaaggcaga 17580
ctcgctgctt ctgacagcca tgaagacaga cggagccact gtgaaggcgg caggtctcag 17640
tcccctggtc tctggcacca ctgtgcagac agggcctttg ccggtgggtg acgtgggcag 17700
ggcataaggg agtggggtct acacacacac acacatgccc acctggtaac atgtgcctgg 17760
ccctgcagac cctggtgagt ggcggaacca tcttggcaac agtcccactg gtcgtagatg 17820
cggagaagct gcctatcaac cggctcgcag ctggcagcaa ggccccggcc tctgcccaga 17880
gccgtggaga gaagcgcaca gcccacaacg ccattgagaa gtgctaccgc tcctccatca 17940
atgacaaaat cattgagctc aaggatctgg tggtgggcac tgaggcaaag gtgtggagag 18000
gcctgcaggg gcacagaccg gggtgtccct aggaaggaac agatcagggg caactggaag 18060
gaagagaggg agtgagactg agcctggaca agcagggaat tggaattcag cctccccagg 18120
cctggccagc ctcgtttatt tagttaaact ggtttgcagg cctcttcaat aaaggtgggg 18180
ctgtgctagg cattggggat gcagcaatga acaagacaga caaaaattgt ccctcaaaga 18240
agagccgacc ttctggtggg ggagatggac agtaggcagg atgaataagt gctcgagacc 18300
accacgtttg gctcgttgca gagaaagcag gaagaggatg gtgagggtcc cctggtggta 18360
gccagggaag gcctccctga gatggcggca ggcacagcag cagctagcca gaccctgctg 18420
tctgcatctt acattctaac cctatgcccg gcctgggagg tgggtgctac taggcgagga 18480
acggttcagg tagaaggaac aagtgcaaag gtcctgaggc agtaatgttg caaagcagct 18540
ccgcaccccc ttgctagggc tctccaaccc cacaaccccc gacctgacag gccacctgtg 18600
cgctccccct ccctcccaca ccgtgcagct gaataaatct gctgtcttgc gcaaggccat 18660
cgactacatt cgctttctgc aacacagcaa ccagaaactc aagcaggaga acctaagtct 18720
gcgcactgct gtccacaaaa gcagtgagtc ctggctttat tgagctccag tctggcctct 18780
tctctagcct tgctccacct cccggcccca ccccatccct agccccaccc cacccttggt 18840
tctggcccac cctctgccct gcccacctca cccttggctg tagccctgca ttcagctcta 18900
gtcccttggt tacctctggt cctgaaagag acctggtgcc tccctttggc cctaacccag 18960
ccccatcaaa gcgtcctggg ctagctttag gagctacagt agtccctagg cctccaaggg 19020
cctaggctct gatttggggt cacatatcca gcctttactc ctggctctgt tcctttcggc 19080
ccacagaatc tctgaaggat ctggtgtcgg cctgtggcag tggagggaac acagacgtgc 19140
tcatggaggg cgtgaagact gaggtggagg acacactgac cccacccccc tcggatgctg 19200
gctcaccttt ccagagcagc cccttgtccc ttggcagcag gggcagtggc agcggtggca 19260
gtggcagtga ctcggagcct gacagcccag tctttgagga cagcaaggtt gggccctgcc 19320
acggtgcccc cttccccact cccagccata tcctctgagc ctcatgacag ggccgggaag 19380
accctaacag atcctacctc ccatttcata gacagaataa ctgaggcctg gagccacgtg 19440
gggtcccaca gtaaggtggg cagaatcctg acccccccct tcccagcccc atgctctctg 19500
gggtccctcc gattctgccc tcaccaccct gcccaacccc accaggcaaa gccagagcag 19560
cggccgtctc tgcacagccg gggcatgctg gaccgctccc gcctggccct gtgcacgctc 19620
gtcttcctct gcctgtcctg caaccccttg gcctccttgc tgggggcccg ggggcttccc 19680
agcccctcag ataccaccag cgtctaccat agccctgggc gcaacgtgct gggcaccgag 19740
agcagaggtg ggaccggcca gcctgggcat ctttgggagg gacactcggg gtgagccccc 19800
aggcttgtga acttggggct ctggatttcc tgggagctgt gtccccagct ttccctctgt 19860
ccatagatgg ccctggctgg gcccagtggc tgctgccccc agtggtctgg ctgctcaatg 19920
ggctgttggt gctcgtctcc ttggtgcttc tctttgtcta cggtgagcca gtcacacggc 19980
cccactcagg ccccgccgtg tacttctgga ggcatcgcaa gcaggctgac ctggacctgg 20040
cccgggtaag gggctggccc cggcagagtg ggcagggcag ggaccccagg ctgtgaaggt 20100
gctgggtgtc aacccttgtt cctgctccct gtgcacacca tgaatctgtc ccgtcctccc 20160
tgtgcctagc cacgcatccg cagaccccca ccacccctcc agagcctgct gtggacggct 20220
cttctgagct ttggggcagc tgctctgacc tcacttttct cacctggaaa accctcatcc 20280
acagggagac tttgcccagg ctgcccagca gctgtggctg gccctgcggg cactgggccg 20340
gcccctgccc acctcccacc tggacctggc ttgtagcctc ctctggaacc tcatccgtca 20400
cctgctgcag cgtctctggg tgggccgctg gctggcaggc cgggcagggg gcctgcagca 20460
ggactgtgct ctgcgagtgg atgctagcgc cagcgcccga gacgcagccc tggtctacca 20520
taagctgcac cagctgcaca ccatgggtag gactgagcgt ggggcgggct ccgaggtgct 20580
ccctgctgcc tgtgctccac ccacagcctc atgcctgctt gccttccagg gaagcacaca 20640
ggcgggcacc tcactgccac caacctggcg ctgagtgccc tgaacctggc agagtgtgca 20700
ggggatgccg tgtctgtggc gacgctggcc gagatctatg tggcggctgc attgagagtg 20760
aagaccagtc tcccacgggc cttgcatttt ctgacagtga gtgggttggg gggctggggg 20820
cttatccctg cagctctctc cagaggctcc ctgggtaaga gctacacggg atgtggcagt 20880
ggttaccagg gggactccag gccaagctgg gactcggccc ggggtctggc cccaggctgt 20940
gtccactgtg acagcccagt accctcccct acagcgcttc ttcctgagca gtgcccgcca 21000
ggcctgcctg gcacagagtg gctcagtgcc tcctgccatg cagtggctct gccaccccgt 21060
gggccaccgt ttcttcgtgg atggggactg gtccgtgctc agtaccccat gggagagcct 21120
gtacagcttg gccgggaacc caggtgctct cttacccctt ccctgtcccc tctcctgtcc 21180
ctcatcctca ttcctgtcct gtcccttgtc gcctgaatct ctggctgtct ctggccaccc 21240
cagtccttct ccctgccatg ggttgttgct gtgggggttg caggaaggga aaggcctggg 21300
tgcctctcgt tcccattggg gctttcagaa gcacatgcag ggattgatgg gcagatggct 21360
aattggagaa gtgaccccag gcagtgccgc tgtggagtaa ggaagcggag ccaacaatgg 21420
catcttctca agtcggtttt cctttggaag cagtgtaggg caggcctcag tgttgtctcc 21480
tggccaaggc tggtgctggt gatagttatg tccacccgct ttcccctgtc cttggcaggg 21540
gctgcaccca ggggcatgcc ggcacttccc agtggcccta ggtgtggccc cagcccaccc 21600
aggaaaaagc ccttagcttg gagaggaggg tggggccctg ctccccaccc cactcacctc 21660
ctcctctcca cagtggaccc cctggcccag gtgactcagc tattccggga acatctctta 21720
gagcgagcac tgaactgtgt gacccagccc aaccccagcc ctgggtcagc tgatggggac 21780
aagtaagtgt cgttgtgccc tcctccaggc aaggcccctc cggcgggatt ctgagaatag 21840
ctctggcctc aaccctgtgg agagagccca gagctgggct accgtgcgtg ccatgcacgc 21900
ttcattcctc tctgagtttc ctctccccac cagcctgtgg gaggagacag tggcactttg 21960
cagagccagg ggccaggctg tactctggag ggcaggtggg gagcaccctc ctaggacccc 22020
tgccatctgt tccgacagcc agctctctcc ttccacaggg aattctcgga tgccctcggg 22080
tacctgcagc tgctgaacag ctgttctgat gctgcggggg ctcctgccta cagcttctcc 22140
atcagttcca gcatggccac caccaccggt gagtccccgg cccctgtcct ggctcccttc 22200
tcagctcccc cgtgcagcgt gactgagggt tcaggggacc ctccctcttc tgcaggcgta 22260
gacccggtgg ccaagtggtg ggcctctctg acagctgtgg tgatccactg gctgcggcgg 22320
gatgaggagg cggctgagcg gctgtgcccg ctggtggagc acctgccccg ggtgctgcag 22380
gagtctgagt gagtgcacgg caggttcctc ctgcctggtc ccgggctcag ccttcctcat 22440
cccctgggca ctgtgcctca ctcagccttt gttctgtgca ggaggagtca ccaccttttt 22500
tcctcaggga actcgagcca gggaagtggg gggcactcag ccagggcttg tggactggtc 22560
tgactggcac tcttctgccc tggtcccaac aggagacccc tgcccagggc agctctgcac 22620
tccttcaagg ctgcccgggc cctgctgggc tgtgccaagg cagagtctgg tccagccagc 22680
ctgaccatct gtgagaaggc cagtgggtac ctgcaggaca gcctggctac cacaccagcc 22740
agcagctcca ttgacaaggt gaggggtggg gtcaggggcc tggcagggct gggggattca 22800
gctttccatt ccctggttcc tctccccagc ccccaggggc tgcagaagac catggggtta 22860
gcccaagcag cacaggatag ggggtccagc agaccctgct ttttggctaa ggcttctgtc 22920
cagaggagag gggttgcccc tatctggcct cagtttcccc atccctggga ggaggggggt 22980
ggatggtgtg gtaggatccc tttggaggcc ctgcatcagg agggctggac agctgctccc 23040
gggccggtgg cgggtgtggg ggccgagaga ggcgggcggc cccgcggtgc attgctgttg 23100
cattgcacgt gtgtgaggcg ggtgcagtgc ctcggcagtg cagcccggag ccggcccctg 23160
gcaccacggg cccccatcct gcccctccca gagctggagc cctggtgacc cctgccctgc 23220
ctgccacccc caggccgtgc agctgttcct gtgtgacctg cttcttgtgg tgcgcaccag 23280
cctgtggcgg cagcagcagc ccccggcccc ggccccagca gcccagggca ccagcagcag 23340
gccccaggct tccgcccttg agctgcgtgg cttccaacgg gacctgagca gcctgaggcg 23400
gctggcacag agcttccggc ccgccatgcg gagggtgagt gcccgatggc cctgtcctca 23460
agacggggag tcaggcagtg gtggagatgg agagccctga gcctccactc tcctggcccc 23520
caggtgttcc tacatgaggc cacggcccgg ctgatggcgg gggccagccc cacacggaca 23580
caccagctcc tcgaccgcag tctgaggcgg cgggcaggcc ccggtggcaa aggaggtgag 23640
ggggcagctg ctgaccaggg atgtgctgtc tgctcagcag ggaagggcgc acatgggatg 23700
tgataccaag ggaggctgtg tgtgtgtcag acgggacaga caggcctggc gcagtggctc 23760
acacctagca ctttgggagg ctcagttggg aggacagctt gagcccagga gttggaggcc 23820
gcagtgagcc tgagtgacag ggagagtccc tgtctcaaaa aaaaaaaaag accaagcatc 23880
ttcttgatgg ttacctgatg acaattcctt tcacaaggaa tcagtggggt gactgtcatt 23940
tgtgggatac atgactgcac gtgcgtgact cagtctgtgg actttgtgtg tgggctgaga 24000
ctagggtggg gagaggggaa cccgccaggc ccccgccagg tacctgtgtg ccaggtacag 24060
gcggctggtg ccgtggcttg tgtgtgggca gggctcccgc gggggcgtgg ccagcttgag 24120
acccatccct gacacatcct cgtgtgcgca ggcgcggtgg cggagctgga gccgcggccc 24180
acgcggcggg agcacgcgga ggccttgctg ctggcctcct gctacctgcc ccccggcttc 24240
ctgtcggcgc ccgggcagcg cgtgggcatg ctggctgagg cggcgcgcac actcgagaag 24300
cttggcgatc gccggctgct gcacgactgt cagcagatgc tcatgcgcct gggcggtggg 24360
accactgtca cttccagcta gaccccgtgt ccccggcctc agcacccctg tctctagcca 24420
ctttggtccc gtgcagcttc tgtcctgcgt cgaagctttg aaggccgaag gcagtgcaag 24480
agactctggc ctccacagtt cgacctgcgg ctgctgtgtg ccttcgcggt ggaaggcccg 24540
aggggcgcga tcttgaccct aagaccggcg gccatgatgg tgctgacctc tggtggccga 24600
tcggggcact gcaggggccg agccattttg gggggccccc ctccttgctc tgcaggcacc 24660
ttagtggctt ttttcctcct gtgtacaggg aagagagggg tacatttccc tgtgctgacg 24720
gaagccaact tggctttccc ggactgcaag cagggctctg ccccagaggc ctctctctcc 24780
gtcgtgggag agagacgtgt acatagtgta ggtcagcgtg cttagcctcc tgacctgagg 24840
ctcctgtgct actttgcctt ttgcaaactt tattttcata gattgagaag ttttgtacag 24900
agaattaaaa atgaaattat ttataatctg 24930
<210> 3
<211> 4178
<212> DNA
<213> 智人(homo sapien)
<400> 3
gcggccgggg gaacccaguu uccgaggaac uuuucgccgg cgccgggccg ccucugaggc 60
cagggcagga cacgaacgcg cggagcggcg gcggcgacug agagccgggg ccgcggcggc 120
gcucccuagg aagggccgua cgaggcggcg ggcccggcgg gccucccgga ggaggcggcu 180
gcgccaugga cgagccaccc uucagcgagg cggcuuugga gcaggcgcug ggcgagccgu 240
gcgaucugga cgcggcgcug cugaccgaca ucgaagacau gcuucagcuu aucaacaacc 300
aagacaguga cuucccuggc cuauuugacc cacccuaugc ugggaguggg gcagggggca 360
cagacccugc cagccccgau accagcuccc caggcagcuu gucuccaccu ccugccacau 420
ugagcuccuc ucuugaagcc uuccugagcg ggccgcaggc agcgcccuca ccccuguccc 480
cuccccagcc ugcacccacu ccauugaaga uguacccguc caugcccgcu uucuccccug 540
ggccugguau caaggaagag ucagugccac ugagcauccu gcagaccccc accccacagc 600
cccugccagg ggcccuccug ccacagagcu ucccagcccc agccccaccg caguucagcu 660
ccaccccugu guuaggcuac cccagcccuc cgggaggcuu cucuacagga agcccucccg 720
ggaacaccca gcagccgcug ccuggccugc cacuggcuuc cccgccaggg gucccgcccg 780
ucuccuugca cacccagguc cagagugugg ucccccagca gcuacugaca gucacagcug 840
cccccacggc agccccugua acgaccacug ugaccucgca gauccagcag gucccggucc 900
ugcugcagcc ccacuucauc aaggcagacu cgcugcuucu gacagccaug aagacagacg 960
gagccacugu gaaggcggca ggucucaguc cccuggucuc uggcaccacu gugcagacag 1020
ggccuuugcc gacccuggug aguggcggaa ccaucuuggc aacaguccca cuggucguag 1080
augcggagaa gcugccuauc aaccggcucg cagcuggcag caaggccccg gccucugccc 1140
agagccgugg agagaagcgc acagcccaca acgccauuga gaagcgcuac cgcuccucca 1200
ucaaugacaa aaucauugag cucaaggauc uggugguggg cacugaggca aagcugaaua 1260
aaucugcugu cuugcgcaag gccaucgacu acauucgcuu ucugcaacac agcaaccaga 1320
aacucaagca ggagaaccua agucugcgca cugcugucca caaaagcaaa ucucugaagg 1380
aucugguguc ggccuguggc aguggaggga acacagacgu gcucauggag ggcgugaaga 1440
cugaggugga ggacacacug accccacccc ccucggaugc uggcucaccu uuccagagca 1500
gccccuuguc ccuuggcagc aggggcagug gcagcggugg caguggcagu gacucggagc 1560
cugacagccc agucuuugag gacagcaagg caaagccaga gcagcggccg ucucugcaca 1620
gccggggcau gcuggaccgc ucccgccugg cccugugcac gcucgucuuc cucugccugu 1680
ccugcaaccc cuuggccucc uugcuggggg cccgggggcu ucccagcccc ucagauacca 1740
ccagcgucua ccauagcccu gggcgcaacg ugcugggcac cgagagcaga gauggcccug 1800
gcugggccca guggcugcug cccccagugg ucuggcugcu caaugggcug uuggugcucg 1860
ucuccuuggu gcuucucuuu gucuacggug agccagucac acggccccac ucaggccccg 1920
ccguguacuu cuggaggcau cgcaagcagg cugaccugga ccuggcccgg ggagacuuug 1980
cccaggcugc ccagcagcug uggcuggccc ugcgggcacu gggccggccc cugcccaccu 2040
cccaccugga ccuggcuugu agccuccucu ggaaccucau ccgucaccug cugcagcguc 2100
ucuggguggg ccgcuggcug gcaggccggg cagggggccu gcagcaggac ugugcucugc 2160
gaguggaugc uagcgccagc gcccgagacg cagcccuggu cuaccauaag cugcaccagc 2220
ugcacaccau ggggaagcac acaggcgggc accucacugc caccaaccug gcgcugagug 2280
cccugaaccu ggcagagugu gcaggggaug ccgugucugu ggcgacgcug gccgagaucu 2340
auguggcggc ugcauugaga gugaagacca gucucccacg ggccuugcau uuucugacac 2400
gcuucuuccu gagcagugcc cgccaggccu gccuggcaca gaguggcuca gugccuccug 2460
ccaugcagug gcucugccac cccgugggcc accguuucuu cguggauggg gacugguccg 2520
ugcucaguac cccaugggag agccuguaca gcuuggccgg gaacccagug gacccccugg 2580
cccaggugac ucagcuauuc cgggaacauc ucuuagagcg agcacugaac ugugugaccc 2640
agcccaaccc cagcccuggg ucagcugaug gggacaagga auucucggau gcccucgggu 2700
accugcagcu gcugaacagc uguucugaug cugcgggggc uccugccuac agcuucucca 2760
ucaguuccag cauggccacc accaccggcg uagacccggu ggccaagugg ugggccucuc 2820
ugacagcugu ggugauccac uggcugcggc gggaugagga ggcggcugag cggcugugcc 2880
cgcuggugga gcaccugccc cgggugcugc aggagucuga gagaccccug cccagggcag 2940
cucugcacuc cuucaaggcu gcccgggccc ugcugggcug ugccaaggca gagucugguc 3000
cagccagccu gaccaucugu gagaaggcca guggguaccu gcaggacagc cuggcuacca 3060
caccagccag cagcuccauu gacaaggccg ugcagcuguu ccugugugac cugcuucuug 3120
uggugcgcac cagccugugg cggcagcagc agcccccggc cccggcccca gcagcccagg 3180
gcaccagcag caggccccag gcuuccgccc uugagcugcg uggcuuccaa cgggaccuga 3240
gcagccugag gcggcuggca cagagcuucc ggcccgccau gcggagggug uuccuacaug 3300
aggccacggc ccggcugaug gcgggggcca gccccacacg gacacaccag cuccucgacc 3360
gcagucugag gcggcgggca ggccccggug gcaaaggagg cgcgguggcg gagcuggagc 3420
cgcggcccac gcggcgggag cacgcggagg ccuugcugcu ggccuccugc uaccugcccc 3480
ccggcuuccu gucggcgccc gggcagcgcg ugggcaugcu ggcugaggcg gcgcgcacac 3540
ucgagaagcu uggcgaucgc cggcugcugc acgacuguca gcagaugcuc augcgccugg 3600
gcggugggac cacugucacu uccagcuaga ccccgugucc ccggccucag caccccuguc 3660
ucuagccacu uuggucccgu gcagcuucug uccugcgucg aagcuuugaa ggccgaaggc 3720
agugcaagag acucuggccu ccacaguucg accugcggcu gcugugugcc uucgcggugg 3780
aaggcccgag gggcgcgauc uugacccuaa gaccggcggc caugauggug cugaccucug 3840
guggccgauc ggggcacugc aggggccgag ccauuuuggg gggccccccu ccuugcucug 3900
caggcaccuu aguggcuuuu uuccuccugu guacagggaa gagaggggua cauuucccug 3960
ugcugacgga agccaacuug gcuuucccgg acugcaagca gggcucugcc ccagaggccu 4020
cucucuccgu cgugggagag agacguguac auaguguagg ucagcgugcu uagccuccug 4080
accugaggcu ccugugcuac uuugccuuuu gcaaacuuua uuuucauaga uugagaaguu 4140
uuguacagag aauuaaaaau gaaauuauuu auaaucug 4178
<210> 4
<211> 4253
<212> DNA
<213> 智人(homo sapien)
<400> 4
caguuuccga ggaacuuuuc gccggcgccg ggccgccucu gaggccaggg caggacacga 60
acgcgcggag cggcggcggc gacugagagc cggggccgcg gcggcgcucc cuaggaaggg 120
ccguacgagg cggcgggccc ggcgggccuc ccggaggagg cggcugcgcc auggacgagc 180
cacccuucag cgaggcggcu uuggagcagg cgcugggcga gccgugcgau cuggacgcgg 240
cgcugcugac cgacaucgaa ggugaagucg gcgcggggag ggguagggcc aacggccugg 300
acgccccaag ggcgggcgca gaucgcggag ccauggauug cacuuucgaa gacaugcuuc 360
agcuuaucaa caaccaagac agugacuucc cuggccuauu ugacccaccc uaugcuggga 420
guggggcagg gggcacagac ccugccagcc ccgauaccag cuccccaggc agcuugucuc 480
caccuccugc cacauugagc uccucucuug aagccuuccu gagcgggccg caggcagcgc 540
ccucaccccu guccccuccc cagccugcac ccacuccauu gaagauguac ccguccaugc 600
ccgcuuucuc cccugggccu gguaucaagg aagagucagu gccacugagc auccugcaga 660
cccccacccc acagccccug ccaggggccc uccugccaca gagcuuccca gccccagccc 720
caccgcaguu cagcuccacc ccuguguuag gcuaccccag cccuccggga ggcuucucua 780
caggaagccc ucccgggaac acccagcagc cgcugccugg ccugccacug gcuuccccgc 840
cagggguccc gcccgucucc uugcacaccc agguccagag uguggucccc cagcagcuac 900
ugacagucac agcugccccc acggcagccc cuguaacgac cacugugacc ucgcagaucc 960
agcagguccc gguccugcug cagccccacu ucaucaaggc agacucgcug cuucugacag 1020
ccaugaagac agacggagcc acugugaagg cggcaggucu caguccccug gucucuggca 1080
ccacugugca gacagggccu uugccgaccc uggugagugg cggaaccauc uuggcaacag 1140
ucccacuggu cguagaugcg gagaagcugc cuaucaaccg gcucgcagcu ggcagcaagg 1200
ccccggccuc ugcccagagc cguggagaga agcgcacagc ccacaacgcc auugagaagc 1260
gcuaccgcuc cuccaucaau gacaaaauca uugagcucaa ggaucuggug gugggcacug 1320
aggcaaagcu gaauaaaucu gcugucuugc gcaaggccau cgacuacauu cgcuuucugc 1380
aacacagcaa ccagaaacuc aagcaggaga accuaagucu gcgcacugcu guccacaaaa 1440
gcaaaucucu gaaggaucug gugucggccu guggcagugg agggaacaca gacgugcuca 1500
uggagggcgu gaagacugag guggaggaca cacugacccc accccccucg gaugcuggcu 1560
caccuuucca gagcagcccc uugucccuug gcagcagggg caguggcagc gguggcagug 1620
gcagugacuc ggagccugac agcccagucu uugaggacag caaggcaaag ccagagcagc 1680
ggccgucucu gcacagccgg ggcaugcugg accgcucccg ccuggcccug ugcacgcucg 1740
ucuuccucug ccuguccugc aaccccuugg ccuccuugcu gggggcccgg gggcuuccca 1800
gccccucaga uaccaccagc gucuaccaua gcccugggcg caacgugcug ggcaccgaga 1860
gcagagaugg cccuggcugg gcccaguggc ugcugccccc aguggucugg cugcucaaug 1920
ggcuguuggu gcucgucucc uuggugcuuc ucuuugucua cggugagcca gucacacggc 1980
cccacucagg ccccgccgug uacuucugga ggcaucgcaa gcaggcugac cuggaccugg 2040
cccggggaga cuuugcccag gcugcccagc agcuguggcu ggcccugcgg gcacugggcc 2100
ggccccugcc caccucccac cuggaccugg cuuguagccu ccucuggaac cucauccguc 2160
accugcugca gcgucucugg gugggccgcu ggcuggcagg ccgggcaggg ggccugcagc 2220
aggacugugc ucugcgagug gaugcuagcg ccagcgcccg agacgcagcc cuggucuacc 2280
auaagcugca ccagcugcac accaugggga agcacacagg cgggcaccuc acugccacca 2340
accuggcgcu gagugcccug aaccuggcag agugugcagg ggaugccgug ucuguggcga 2400
cgcuggccga gaucuaugug gcggcugcau ugagagugaa gaccagucuc ccacgggccu 2460
ugcauuuucu gacacgcuuc uuccugagca gugcccgcca ggccugccug gcacagagug 2520
gcucagugcc uccugccaug caguggcucu gccaccccgu gggccaccgu uucuucgugg 2580
auggggacug guccgugcuc aguaccccau gggagagccu guacagcuug gccgggaacc 2640
caguggaccc ccuggcccag gugacucagc uauuccggga acaucucuua gagcgagcac 2700
ugaacugugu gacccagccc aaccccagcc cugggucagc ugauggggac aaggaauucu 2760
cggaugcccu cggguaccug cagcugcuga acagcuguuc ugaugcugcg ggggcuccug 2820
ccuacagcuu cuccaucagu uccagcaugg ccaccaccac cggcguagac ccgguggcca 2880
aguggugggc cucucugaca gcugugguga uccacuggcu gcggcgggau gaggaggcgg 2940
cugagcggcu gugcccgcug guggagcacc ugccccgggu gcugcaggag ucugagagac 3000
cccugcccag ggcagcucug cacuccuuca aggcugcccg ggcccugcug ggcugugcca 3060
aggcagaguc ugguccagcc agccugacca ucugugagaa ggccaguggg uaccugcagg 3120
acagccuggc uaccacacca gccagcagcu ccauugacaa ggccgugcag cuguuccugu 3180
gugaccugcu ucuuguggug cgcaccagcc uguggcggca gcagcagccc ccggccccgg 3240
ccccagcagc ccagggcacc agcagcaggc cccaggcuuc cgcccuugag cugcguggcu 3300
uccaacggga ccugagcagc cugaggcggc uggcacagag cuuccggccc gccaugcgga 3360
ggguguuccu acaugaggcc acggcccggc ugauggcggg ggccagcccc acacggacac 3420
accagcuccu cgaccgcagu cugaggcggc gggcaggccc cgguggcaaa ggaggcgcgg 3480
uggcggagcu ggagccgcgg cccacgcggc gggagcacgc ggaggccuug cugcuggccu 3540
ccugcuaccu gccccccggc uuccugucgg cgcccgggca gcgcgugggc augcuggcug 3600
aggcggcgcg cacacucgag aagcuuggcg aucgccggcu gcugcacgac ugucagcaga 3660
ugcucaugcg ccugggcggu gggaccacug ucacuuccag cuagaccccg uguccccggc 3720
cucagcaccc cugucucuag ccacuuuggu cccgugcagc uucuguccug cgucgaagcu 3780
uugaaggccg aaggcagugc aagagacucu ggccuccaca guucgaccug cggcugcugu 3840
gugccuucgc gguggaaggc ccgaggggcg cgaucuugac ccuaagaccg gcggccauga 3900
uggugcugac cucugguggc cgaucggggc acugcagggg ccgagccauu uuggggggcc 3960
ccccuccuug cucugcaggc accuuagugg cuuuuuuccu ccuguguaca gggaagagag 4020
ggguacauuu cccugugcug acggaagcca acuuggcuuu cccggacugc aagcagggcu 4080
cugccccaga ggccucucuc uccgucgugg gagagagacg uguacauagu guaggucagc 4140
gugcuuagcc uccugaccug aggcuccugu gcuacuuugc cuuuugcaaa cuuuauuuuc 4200
auagauugag aaguuuugua cagagaauua aaaaugaaau uauuuauaau cug 4253
<210> 5
<211> 4056
<212> DNA
<213> 智人(homo sapien)
<400> 5
gcggggcggg cgcgccgcag cgcucaacgg cuucaaaaau ccgccgcgcc uugacaggug 60
aagucggcgc ggggaggggu agggccaacg gccuggacgc cccaagggcg ggcgcagauc 120
gcggagccau ggauugcacu uucgaagaca ugcuucagcu uaucaacaac caagacagug 180
acuucccugg ccuauuugac ccacccuaug cugggagugg ggcagggggc acagacccug 240
ccagccccga uaccagcucc ccaggcagcu ugucuccacc uccugccaca uugagcuccu 300
cucuugaagc cuuccugagc gggccgcagg cagcgcccuc accccugucc ccuccccagc 360
cugcacccac uccauugaag auguacccgu ccaugcccgc uuucuccccu gggccuggua 420
ucaaggaaga gucagugcca cugagcaucc ugcagacccc caccccacag ccccugccag 480
gggcccuccu gccacagagc uucccagccc cagccccacc gcaguucagc uccaccccug 540
uguuaggcua ccccagcccu ccgggaggcu ucucuacagg aagcccuccc gggaacaccc 600
agcagccgcu gccuggccug ccacuggcuu ccccgccagg ggucccgccc gucuccuugc 660
acacccaggu ccagagugug gucccccagc agcuacugac agucacagcu gcccccacgg 720
cagccccugu aacgaccacu gugaccucgc agauccagca ggucccgguc cugcugcagc 780
cccacuucau caaggcagac ucgcugcuuc ugacagccau gaagacagac ggagccacug 840
ugaaggcggc aggucucagu ccccuggucu cuggcaccac ugugcagaca gggccuuugc 900
cgacccuggu gaguggcgga accaucuugg caacaguccc acuggucgua gaugcggaga 960
agcugccuau caaccggcuc gcagcuggca gcaaggcccc ggccucugcc cagagccgug 1020
gagagaagcg cacagcccac aacgccauug agaagcgcua ccgcuccucc aucaaugaca 1080
aaaucauuga gcucaaggau cugguggugg gcacugaggc aaagcugaau aaaucugcug 1140
ucuugcgcaa ggccaucgac uacauucgcu uucugcaaca cagcaaccag aaacucaagc 1200
aggagaaccu aagucugcgc acugcugucc acaaaagcaa aucucugaag gaucuggugu 1260
cggccugugg caguggaggg aacacagacg ugcucaugga gggcgugaag acugaggugg 1320
aggacacacu gaccccaccc cccucggaug cuggcucacc uuuccagagc agccccuugu 1380
cccuuggcag caggggcagu ggcagcggug gcaguggcag ugacucggag ccugacagcc 1440
cagucuuuga ggacagcaag gcaaagccag agcagcggcc gucucugcac agccggggca 1500
ugcuggaccg cucccgccug gcccugugca cgcucgucuu ccucugccug uccugcaacc 1560
ccuuggccuc cuugcugggg gcccgggggc uucccagccc cucagauacc accagcgucu 1620
accauagccc ugggcgcaac gugcugggca ccgagagcag agauggcccu ggcugggccc 1680
aguggcugcu gcccccagug gucuggcugc ucaaugggcu guuggugcuc gucuccuugg 1740
ugcuucucuu ugucuacggu gagccaguca cacggcccca cucaggcccc gccguguacu 1800
ucuggaggca ucgcaagcag gcugaccugg accuggcccg gggagacuuu gcccaggcug 1860
cccagcagcu guggcuggcc cugcgggcac ugggccggcc ccugcccacc ucccaccugg 1920
accuggcuug uagccuccuc uggaaccuca uccgucaccu gcugcagcgu cucugggugg 1980
gccgcuggcu ggcaggccgg gcagggggcc ugcagcagga cugugcucug cgaguggaug 2040
cuagcgccag cgcccgagac gcagcccugg ucuaccauaa gcugcaccag cugcacacca 2100
uggggaagca cacaggcggg caccucacug ccaccaaccu ggcgcugagu gcccugaacc 2160
uggcagagug ugcaggggau gccgugucug uggcgacgcu ggccgagauc uauguggcgg 2220
cugcauugag agugaagacc agucucccac gggccuugca uuuucugaca cgcuucuucc 2280
ugagcagugc ccgccaggcc ugccuggcac agaguggcuc agugccuccu gccaugcagu 2340
ggcucugcca ccccgugggc caccguuucu ucguggaugg ggacuggucc gugcucagua 2400
ccccauggga gagccuguac agcuuggccg ggaacccagu ggacccccug gcccagguga 2460
cucagcuauu ccgggaacau cucuuagagc gagcacugaa cugugugacc cagcccaacc 2520
ccagcccugg gucagcugau ggggacaagg aauucucgga ugcccucggg uaccugcagc 2580
ugcugaacag cuguucugau gcugcggggg cuccugccua cagcuucucc aucaguucca 2640
gcauggccac caccaccggc guagacccgg uggccaagug gugggccucu cugacagcug 2700
uggugaucca cuggcugcgg cgggaugagg aggcggcuga gcggcugugc ccgcuggugg 2760
agcaccugcc ccgggugcug caggagucug agagaccccu gcccagggca gcucugcacu 2820
ccuucaaggc ugcccgggcc cugcugggcu gugccaaggc agagucuggu ccagccagcc 2880
ugaccaucug ugagaaggcc aguggguacc ugcaggacag ccuggcuacc acaccagcca 2940
gcagcuccau ugacaaggcc gugcagcugu uccuguguga ccugcuucuu guggugcgca 3000
ccagccugug gcggcagcag cagcccccgg ccccggcccc agcagcccag ggcaccagca 3060
gcaggcccca ggcuuccgcc cuugagcugc guggcuucca acgggaccug agcagccuga 3120
ggcggcuggc acagagcuuc cggcccgcca ugcggagggu guuccuacau gaggccacgg 3180
cccggcugau ggcgggggcc agccccacac ggacacacca gcuccucgac cgcagucuga 3240
ggcggcgggc aggccccggu ggcaaaggag gcgcgguggc ggagcuggag ccgcggccca 3300
cgcggcggga gcacgcggag gccuugcugc uggccuccug cuaccugccc cccggcuucc 3360
ugucggcgcc cgggcagcgc gugggcaugc uggcugaggc ggcgcgcaca cucgagaagc 3420
uuggcgaucg ccggcugcug cacgacuguc agcagaugcu caugcgccug ggcgguggga 3480
ccacugucac uuccagcuag accccguguc cccggccuca gcaccccugu cucuagccac 3540
uuuggucccg ugcagcuucu guccugcguc gaagcuuuga aggccgaagg cagugcaaga 3600
gacucuggcc uccacaguuc gaccugcggc ugcugugugc cuucgcggug gaaggcccga 3660
ggggcgcgau cuugacccua agaccggcgg ccaugauggu gcugaccucu gguggccgau 3720
cggggcacug caggggccga gccauuuugg ggggcccccc uccuugcucu gcaggcaccu 3780
uaguggcuuu uuuccuccug uguacaggga agagaggggu acauuucccu gugcugacgg 3840
aagccaacuu ggcuuucccg gacugcaagc agggcucugc cccagaggcc ucucucuccg 3900
ucgugggaga gagacgugua cauaguguag gucagcgugc uuagccuccu gaccugaggc 3960
uccugugcua cuuugccuuu ugcaaacuuu auuuucauag auugagaagu uuuguacaga 4020
gaauuaaaaa ugaaauuauu uauaaucugg aaaaaa 4056
<210> 6
<211> 4178
<212> DNA
<213> 智人(homo sapien)
<400> 6
gcggccgggg gaacccaguu uccgaggaac uuuucgccgg cgccgggccg ccucugaggc 60
cagggcagga cacgaacgcg cggagcggcg gcggcgacug agagccgggg ccgcggcggc 120
gcucccuagg aagggccgua cgaggcggcg ggcccggcgg gccucccgga ggaggcggcu 180
gcgccaugga cgagccaccc uucagcgagg cggcuuugga gcaggcgcug ggcgagccgu 240
gcgaucugga cgcggcgcug cugaccgaca ucgaagacau gcuucagcuu aucaacaacc 300
aagacaguga cuucccuggc cuauuugacc cacccuaugc ugggaguggg gcagggggca 360
cagacccugc cagccccgau accagcuccc caggcagcuu gucuccaccu ccugccacau 420
ugagcuccuc ucuugaagcc uuccugagcg ggccgcaggc agcgcccuca ccccuguccc 480
cuccccagcc ugcacccacu ccauugaaga uguacccguc caugcccgcu uucuccccug 540
ggccugguau caaggaagag ucagugccac ugagcauccu gcagaccccc accccacagc 600
cccugccagg ggcccuccug ccacagagcu ucccagcccc agccccaccg caguucagcu 660
ccaccccugu guuaggcuac cccagcccuc cgggaggcuu cucuacagga agcccucccg 720
ggaacaccca gcagccgcug ccuggccugc cacuggcuuc cccgccaggg gucccgcccg 780
ucuccuugca cacccagguc cagagugugg ucccccagca gcuacugaca gucacagcug 840
cccccacggc agccccugua acgaccacug ugaccucgca gauccagcag gucccggucc 900
ugcugcagcc ccacuucauc aaggcagacu cgcugcuucu gacagccaug aagacagacg 960
gagccacugu gaaggcggca ggucucaguc cccuggucuc uggcaccacu gugcagacag 1020
ggccuuugcc gacccuggug aguggcggaa ccaucuuggc aacaguccca cuggucguag 1080
augcggagaa gcugccuauc aaccggcucg cagcuggcag caaggccccg gccucugccc 1140
agagccgugg agagaagcgc acagcccaca acgccauuga gaagugcuac cgcuccucca 1200
ucaaugacaa aaucauugag cucaaggauc uggugguggg cacugaggca aagcugaaua 1260
aaucugcugu cuugcgcaag gccaucgacu acauucgcuu ucugcaacac agcaaccaga 1320
aacucaagca ggagaaccua agucugcgca cugcugucca caaaagcaaa ucucugaagg 1380
aucugguguc ggccuguggc aguggaggga acacagacgu gcucauggag ggcgugaaga 1440
cugaggugga ggacacacug accccacccc ccucggaugc uggcucaccu uuccagagca 1500
gccccuuguc ccuuggcagc aggggcagug gcagcggugg caguggcagu gacucggagc 1560
cugacagccc agucuuugag gacagcaagg caaagccaga gcagcggccg ucucugcaca 1620
gccggggcau gcuggaccgc ucccgccugg cccugugcac gcucgucuuc cucugccugu 1680
ccugcaaccc cuuggccucc uugcuggggg cccgggggcu ucccagcccc ucagauacca 1740
ccagcgucua ccauagcccu gggcgcaacg ugcugggcac cgagagcaga gauggcccug 1800
gcugggccca guggcugcug cccccagugg ucuggcugcu caaugggcug uuggugcucg 1860
ucuccuuggu gcuucucuuu gucuacggug agccagucac acggccccac ucaggccccg 1920
ccguguacuu cuggaggcau cgcaagcagg cugaccugga ccuggcccgg ggagacuuug 1980
cccaggcugc ccagcagcug uggcuggccc ugcgggcacu gggccggccc cugcccaccu 2040
cccaccugga ccuggcuugu agccuccucu ggaaccucau ccgucaccug cugcagcguc 2100
ucuggguggg ccgcuggcug gcaggccggg cagggggccu gcagcaggac ugugcucugc 2160
gaguggaugc uagcgccagc gcccgagacg cagcccuggu cuaccauaag cugcaccagc 2220
ugcacaccau ggggaagcac acaggcgggc accucacugc caccaaccug gcgcugagug 2280
cccugaaccu ggcagagugu gcaggggaug ccgugucugu ggcgacgcug gccgagaucu 2340
auguggcggc ugcauugaga gugaagacca gucucccacg ggccuugcau uuucugacac 2400
gcuucuuccu gagcagugcc cgccaggccu gccuggcaca gaguggcuca gugccuccug 2460
ccaugcagug gcucugccac cccgugggcc accguuucuu cguggauggg gacugguccg 2520
ugcucaguac cccaugggag agccuguaca gcuuggccgg gaacccagug gacccccugg 2580
cccaggugac ucagcuauuc cgggaacauc ucuuagagcg agcacugaac ugugugaccc 2640
agcccaaccc cagcccuggg ucagcugaug gggacaagga auucucggau gcccucgggu 2700
accugcagcu gcugaacagc uguucugaug cugcgggggc uccugccuac agcuucucca 2760
ucaguuccag cauggccacc accaccggcg uagacccggu ggccaagugg ugggccucuc 2820
ugacagcugu ggugauccac uggcugcggc gggaugagga ggcggcugag cggcugugcc 2880
cgcuggugga gcaccugccc cgggugcugc aggagucuga gagaccccug cccagggcag 2940
cucugcacuc cuucaaggcu gcccgggccc ugcugggcug ugccaaggca gagucugguc 3000
cagccagccu gaccaucugu gagaaggcca guggguaccu gcaggacagc cuggcuacca 3060
caccagccag cagcuccauu gacaaggccg ugcagcuguu ccugugugac cugcuucuug 3120
uggugcgcac cagccugugg cggcagcagc agcccccggc cccggcccca gcagcccagg 3180
gcaccagcag caggccccag gcuuccgccc uugagcugcg uggcuuccaa cgggaccuga 3240
gcagccugag gcggcuggca cagagcuucc ggcccgccau gcggagggug uuccuacaug 3300
aggccacggc ccggcugaug gcgggggcca gccccacacg gacacaccag cuccucgacc 3360
gcagucugag gcggcgggca ggccccggug gcaaaggagg cgcgguggcg gagcuggagc 3420
cgcggcccac gcggcgggag cacgcggagg ccuugcugcu ggccuccugc uaccugcccc 3480
ccggcuuccu gucggcgccc gggcagcgcg ugggcaugcu ggcugaggcg gcgcgcacac 3540
ucgagaagcu uggcgaucgc cggcugcugc acgacuguca gcagaugcuc augcgccugg 3600
gcggugggac cacugucacu uccagcuaga ccccgugucc ccggccucag caccccuguc 3660
ucuagccacu uuggucccgu gcagcuucug uccugcgucg aagcuuugaa ggccgaaggc 3720
agugcaagag acucuggccu ccacaguucg accugcggcu gcugugugcc uucgcggugg 3780
aaggcccgag gggcgcgauc uugacccuaa gaccggcggc caugauggug cugaccucug 3840
guggccgauc ggggcacugc aggggccgag ccauuuuggg gggccccccu ccuugcucug 3900
caggcaccuu aguggcuuuu uuccuccugu guacagggaa gagaggggua cauuucccug 3960
ugcugacgga agccaacuug gcuuucccgg acugcaagca gggcucugcc ccagaggccu 4020
cucucuccgu cgugggagag agacguguac auaguguagg ucagcgugcu uagccuccug 4080
accugaggcu ccugugcuac uuugccuuuu gcaaacuuua uuuucauaga uugagaaguu 4140
uuguacagag aauuaaaaau gaaauuauuu auaaucug 4178
<210> 7
<211> 4253
<212> DNA
<213> 智人(homo sapien)
<400> 7
caguuuccga ggaacuuuuc gccggcgccg ggccgccucu gaggccaggg caggacacga 60
acgcgcggag cggcggcggc gacugagagc cggggccgcg gcggcgcucc cuaggaaggg 120
ccguacgagg cggcgggccc ggcgggccuc ccggaggagg cggcugcgcc auggacgagc 180
cacccuucag cgaggcggcu uuggagcagg cgcugggcga gccgugcgau cuggacgcgg 240
cgcugcugac cgacaucgaa ggugaagucg gcgcggggag ggguagggcc aacggccugg 300
acgccccaag ggcgggcgca gaucgcggag ccauggauug cacuuucgaa gacaugcuuc 360
agcuuaucaa caaccaagac agugacuucc cuggccuauu ugacccaccc uaugcuggga 420
guggggcagg gggcacagac ccugccagcc ccgauaccag cuccccaggc agcuugucuc 480
caccuccugc cacauugagc uccucucuug aagccuuccu gagcgggccg caggcagcgc 540
ccucaccccu guccccuccc cagccugcac ccacuccauu gaagauguac ccguccaugc 600
ccgcuuucuc cccugggccu gguaucaagg aagagucagu gccacugagc auccugcaga 660
cccccacccc acagccccug ccaggggccc uccugccaca gagcuuccca gccccagccc 720
caccgcaguu cagcuccacc ccuguguuag gcuaccccag cccuccggga ggcuucucua 780
caggaagccc ucccgggaac acccagcagc cgcugccugg ccugccacug gcuuccccgc 840
cagggguccc gcccgucucc uugcacaccc agguccagag uguggucccc cagcagcuac 900
ugacagucac agcugccccc acggcagccc cuguaacgac cacugugacc ucgcagaucc 960
agcagguccc gguccugcug cagccccacu ucaucaaggc agacucgcug cuucugacag 1020
ccaugaagac agacggagcc acugugaagg cggcaggucu caguccccug gucucuggca 1080
ccacugugca gacagggccu uugccgaccc uggugagugg cggaaccauc uuggcaacag 1140
ucccacuggu cguagaugcg gagaagcugc cuaucaaccg gcucgcagcu ggcagcaagg 1200
ccccggccuc ugcccagagc cguggagaga agcgcacagc ccacaacgcc auugagaagu 1260
gcuaccgcuc cuccaucaau gacaaaauca uugagcucaa ggaucuggug gugggcacug 1320
aggcaaagcu gaauaaaucu gcugucuugc gcaaggccau cgacuacauu cgcuuucugc 1380
aacacagcaa ccagaaacuc aagcaggaga accuaagucu gcgcacugcu guccacaaaa 1440
gcaaaucucu gaaggaucug gugucggccu guggcagugg agggaacaca gacgugcuca 1500
uggagggcgu gaagacugag guggaggaca cacugacccc accccccucg gaugcuggcu 1560
caccuuucca gagcagcccc uugucccuug gcagcagggg caguggcagc gguggcagug 1620
gcagugacuc ggagccugac agcccagucu uugaggacag caaggcaaag ccagagcagc 1680
ggccgucucu gcacagccgg ggcaugcugg accgcucccg ccuggcccug ugcacgcucg 1740
ucuuccucug ccuguccugc aaccccuugg ccuccuugcu gggggcccgg gggcuuccca 1800
gccccucaga uaccaccagc gucuaccaua gcccugggcg caacgugcug ggcaccgaga 1860
gcagagaugg cccuggcugg gcccaguggc ugcugccccc aguggucugg cugcucaaug 1920
ggcuguuggu gcucgucucc uuggugcuuc ucuuugucua cggugagcca gucacacggc 1980
cccacucagg ccccgccgug uacuucugga ggcaucgcaa gcaggcugac cuggaccugg 2040
cccggggaga cuuugcccag gcugcccagc agcuguggcu ggcccugcgg gcacugggcc 2100
ggccccugcc caccucccac cuggaccugg cuuguagccu ccucuggaac cucauccguc 2160
accugcugca gcgucucugg gugggccgcu ggcuggcagg ccgggcaggg ggccugcagc 2220
aggacugugc ucugcgagug gaugcuagcg ccagcgcccg agacgcagcc cuggucuacc 2280
auaagcugca ccagcugcac accaugggga agcacacagg cgggcaccuc acugccacca 2340
accuggcgcu gagugcccug aaccuggcag agugugcagg ggaugccgug ucuguggcga 2400
cgcuggccga gaucuaugug gcggcugcau ugagagugaa gaccagucuc ccacgggccu 2460
ugcauuuucu gacacgcuuc uuccugagca gugcccgcca ggccugccug gcacagagug 2520
gcucagugcc uccugccaug caguggcucu gccaccccgu gggccaccgu uucuucgugg 2580
auggggacug guccgugcuc aguaccccau gggagagccu guacagcuug gccgggaacc 2640
caguggaccc ccuggcccag gugacucagc uauuccggga acaucucuua gagcgagcac 2700
ugaacugugu gacccagccc aaccccagcc cugggucagc ugauggggac aaggaauucu 2760
cggaugcccu cggguaccug cagcugcuga acagcuguuc ugaugcugcg ggggcuccug 2820
ccuacagcuu cuccaucagu uccagcaugg ccaccaccac cggcguagac ccgguggcca 2880
aguggugggc cucucugaca gcugugguga uccacuggcu gcggcgggau gaggaggcgg 2940
cugagcggcu gugcccgcug guggagcacc ugccccgggu gcugcaggag ucugagagac 3000
cccugcccag ggcagcucug cacuccuuca aggcugcccg ggcccugcug ggcugugcca 3060
aggcagaguc ugguccagcc agccugacca ucugugagaa ggccaguggg uaccugcagg 3120
acagccuggc uaccacacca gccagcagcu ccauugacaa ggccgugcag cuguuccugu 3180
gugaccugcu ucuuguggug cgcaccagcc uguggcggca gcagcagccc ccggccccgg 3240
ccccagcagc ccagggcacc agcagcaggc cccaggcuuc cgcccuugag cugcguggcu 3300
uccaacggga ccugagcagc cugaggcggc uggcacagag cuuccggccc gccaugcgga 3360
ggguguuccu acaugaggcc acggcccggc ugauggcggg ggccagcccc acacggacac 3420
accagcuccu cgaccgcagu cugaggcggc gggcaggccc cgguggcaaa ggaggcgcgg 3480
uggcggagcu ggagccgcgg cccacgcggc gggagcacgc ggaggccuug cugcuggccu 3540
ccugcuaccu gccccccggc uuccugucgg cgcccgggca gcgcgugggc augcuggcug 3600
aggcggcgcg cacacucgag aagcuuggcg aucgccggcu gcugcacgac ugucagcaga 3660
ugcucaugcg ccugggcggu gggaccacug ucacuuccag cuagaccccg uguccccggc 3720
cucagcaccc cugucucuag ccacuuuggu cccgugcagc uucuguccug cgucgaagcu 3780
uugaaggccg aaggcagugc aagagacucu ggccuccaca guucgaccug cggcugcugu 3840
gugccuucgc gguggaaggc ccgaggggcg cgaucuugac ccuaagaccg gcggccauga 3900
uggugcugac cucugguggc cgaucggggc acugcagggg ccgagccauu uuggggggcc 3960
ccccuccuug cucugcaggc accuuagugg cuuuuuuccu ccuguguaca gggaagagag 4020
ggguacauuu cccugugcug acggaagcca acuuggcuuu cccggacugc aagcagggcu 4080
cugccccaga ggccucucuc uccgucgugg gagagagacg uguacauagu guaggucagc 4140
gugcuuagcc uccugaccug aggcuccugu gcuacuuugc cuuuugcaaa cuuuauuuuc 4200
auagauugag aaguuuugua cagagaauua aaaaugaaau uauuuauaau cug 4253
<210> 8
<211> 4056
<212> DNA
<213> 智人(homo sapien)
<400> 8
gcggggcggg cgcgccgcag cgcucaacgg cuucaaaaau ccgccgcgcc uugacaggug 60
aagucggcgc ggggaggggu agggccaacg gccuggacgc cccaagggcg ggcgcagauc 120
gcggagccau ggauugcacu uucgaagaca ugcuucagcu uaucaacaac caagacagug 180
acuucccugg ccuauuugac ccacccuaug cugggagugg ggcagggggc acagacccug 240
ccagccccga uaccagcucc ccaggcagcu ugucuccacc uccugccaca uugagcuccu 300
cucuugaagc cuuccugagc gggccgcagg cagcgcccuc accccugucc ccuccccagc 360
cugcacccac uccauugaag auguacccgu ccaugcccgc uuucuccccu gggccuggua 420
ucaaggaaga gucagugcca cugagcaucc ugcagacccc caccccacag ccccugccag 480
gggcccuccu gccacagagc uucccagccc cagccccacc gcaguucagc uccaccccug 540
uguuaggcua ccccagcccu ccgggaggcu ucucuacagg aagcccuccc gggaacaccc 600
agcagccgcu gccuggccug ccacuggcuu ccccgccagg ggucccgccc gucuccuugc 660
acacccaggu ccagagugug gucccccagc agcuacugac agucacagcu gcccccacgg 720
cagccccugu aacgaccacu gugaccucgc agauccagca ggucccgguc cugcugcagc 780
cccacuucau caaggcagac ucgcugcuuc ugacagccau gaagacagac ggagccacug 840
ugaaggcggc aggucucagu ccccuggucu cuggcaccac ugugcagaca gggccuuugc 900
cgacccuggu gaguggcgga accaucuugg caacaguccc acuggucgua gaugcggaga 960
agcugccuau caaccggcuc gcagcuggca gcaaggcccc ggccucugcc cagagccgug 1020
gagagaagcg cacagcccac aacgccauug agaagugcua ccgcuccucc aucaaugaca 1080
aaaucauuga gcucaaggau cugguggugg gcacugaggc aaagcugaau aaaucugcug 1140
ucuugcgcaa ggccaucgac uacauucgcu uucugcaaca cagcaaccag aaacucaagc 1200
aggagaaccu aagucugcgc acugcugucc acaaaagcaa aucucugaag gaucuggugu 1260
cggccugugg caguggaggg aacacagacg ugcucaugga gggcgugaag acugaggugg 1320
aggacacacu gaccccaccc cccucggaug cuggcucacc uuuccagagc agccccuugu 1380
cccuuggcag caggggcagu ggcagcggug gcaguggcag ugacucggag ccugacagcc 1440
cagucuuuga ggacagcaag gcaaagccag agcagcggcc gucucugcac agccggggca 1500
ugcuggaccg cucccgccug gcccugugca cgcucgucuu ccucugccug uccugcaacc 1560
ccuuggccuc cuugcugggg gcccgggggc uucccagccc cucagauacc accagcgucu 1620
accauagccc ugggcgcaac gugcugggca ccgagagcag agauggcccu ggcugggccc 1680
aguggcugcu gcccccagug gucuggcugc ucaaugggcu guuggugcuc gucuccuugg 1740
ugcuucucuu ugucuacggu gagccaguca cacggcccca cucaggcccc gccguguacu 1800
ucuggaggca ucgcaagcag gcugaccugg accuggcccg gggagacuuu gcccaggcug 1860
cccagcagcu guggcuggcc cugcgggcac ugggccggcc ccugcccacc ucccaccugg 1920
accuggcuug uagccuccuc uggaaccuca uccgucaccu gcugcagcgu cucugggugg 1980
gccgcuggcu ggcaggccgg gcagggggcc ugcagcagga cugugcucug cgaguggaug 2040
cuagcgccag cgcccgagac gcagcccugg ucuaccauaa gcugcaccag cugcacacca 2100
uggggaagca cacaggcggg caccucacug ccaccaaccu ggcgcugagu gcccugaacc 2160
uggcagagug ugcaggggau gccgugucug uggcgacgcu ggccgagauc uauguggcgg 2220
cugcauugag agugaagacc agucucccac gggccuugca uuuucugaca cgcuucuucc 2280
ugagcagugc ccgccaggcc ugccuggcac agaguggcuc agugccuccu gccaugcagu 2340
ggcucugcca ccccgugggc caccguuucu ucguggaugg ggacuggucc gugcucagua 2400
ccccauggga gagccuguac agcuuggccg ggaacccagu ggacccccug gcccagguga 2460
cucagcuauu ccgggaacau cucuuagagc gagcacugaa cugugugacc cagcccaacc 2520
ccagcccugg gucagcugau ggggacaagg aauucucgga ugcccucggg uaccugcagc 2580
ugcugaacag cuguucugau gcugcggggg cuccugccua cagcuucucc aucaguucca 2640
gcauggccac caccaccggc guagacccgg uggccaagug gugggccucu cugacagcug 2700
uggugaucca cuggcugcgg cgggaugagg aggcggcuga gcggcugugc ccgcuggugg 2760
agcaccugcc ccgggugcug caggagucug agagaccccu gcccagggca gcucugcacu 2820
ccuucaaggc ugcccgggcc cugcugggcu gugccaaggc agagucuggu ccagccagcc 2880
ugaccaucug ugagaaggcc aguggguacc ugcaggacag ccuggcuacc acaccagcca 2940
gcagcuccau ugacaaggcc gugcagcugu uccuguguga ccugcuucuu guggugcgca 3000
ccagccugug gcggcagcag cagcccccgg ccccggcccc agcagcccag ggcaccagca 3060
gcaggcccca ggcuuccgcc cuugagcugc guggcuucca acgggaccug agcagccuga 3120
ggcggcuggc acagagcuuc cggcccgcca ugcggagggu guuccuacau gaggccacgg 3180
cccggcugau ggcgggggcc agccccacac ggacacacca gcuccucgac cgcagucuga 3240
ggcggcgggc aggccccggu ggcaaaggag gcgcgguggc ggagcuggag ccgcggccca 3300
cgcggcggga gcacgcggag gccuugcugc uggccuccug cuaccugccc cccggcuucc 3360
ugucggcgcc cgggcagcgc gugggcaugc uggcugaggc ggcgcgcaca cucgagaagc 3420
uuggcgaucg ccggcugcug cacgacuguc agcagaugcu caugcgccug ggcgguggga 3480
ccacugucac uuccagcuag accccguguc cccggccuca gcaccccugu cucuagccac 3540
uuuggucccg ugcagcuucu guccugcguc gaagcuuuga aggccgaagg cagugcaaga 3600
gacucuggcc uccacaguuc gaccugcggc ugcugugugc cuucgcggug gaaggcccga 3660
ggggcgcgau cuugacccua agaccggcgg ccaugauggu gcugaccucu gguggccgau 3720
cggggcacug caggggccga gccauuuugg ggggcccccc uccuugcucu gcaggcaccu 3780
uaguggcuuu uuuccuccug uguacaggga agagaggggu acauuucccu gugcugacgg 3840
aagccaacuu ggcuuucccg gacugcaagc agggcucugc cccagaggcc ucucucuccg 3900
ucgugggaga gagacgugua cauaguguag gucagcgugc uuagccuccu gaccugaggc 3960
uccugugcua cuuugccuuu ugcaaacuuu auuuucauag auugagaagu uuuguacaga 4020
gaauuaaaaa ugaaauuauu uauaaucugg aaaaaa 4056
<210> 9
<211> 4178
<212> DNA
<213> 智人(homo sapien)
<400> 9
gcggccgggg gaacccagtt tccgaggaac ttttcgccgg cgccgggccg cctctgaggc 60
cagggcagga cacgaacgcg cggagcggcg gcggcgactg agagccgggg ccgcggcggc 120
gctccctagg aagggccgta cgaggcggcg ggcccggcgg gcctcccgga ggaggcggct 180
gcgccatgga cgagccaccc ttcagcgagg cggctttgga gcaggcgctg ggcgagccgt 240
gcgatctgga cgcggcgctg ctgaccgaca tcgaagacat gcttcagctt atcaacaacc 300
aagacagtga cttccctggc ctatttgacc caccctatgc tgggagtggg gcagggggca 360
cagaccctgc cagccccgat accagctccc caggcagctt gtctccacct cctgccacat 420
tgagctcctc tcttgaagcc ttcctgagcg ggccgcaggc agcgccctca cccctgtccc 480
ctccccagcc tgcacccact ccattgaaga tgtacccgtc catgcccgct ttctcccctg 540
ggcctggtat caaggaagag tcagtgccac tgagcatcct gcagaccccc accccacagc 600
ccctgccagg ggccctcctg ccacagagct tcccagcccc agccccaccg cagttcagct 660
ccacccctgt gttaggctac cccagccctc cgggaggctt ctctacagga agccctcccg 720
ggaacaccca gcagccgctg cctggcctgc cactggcttc cccgccaggg gtcccgcccg 780
tctccttgca cacccaggtc cagagtgtgg tcccccagca gctactgaca gtcacagctg 840
cccccacggc agcccctgta acgaccactg tgacctcgca gatccagcag gtcccggtcc 900
tgctgcagcc ccacttcatc aaggcagact cgctgcttct gacagccatg aagacagacg 960
gagccactgt gaaggcggca ggtctcagtc ccctggtctc tggcaccact gtgcagacag 1020
ggcctttgcc gaccctggtg agtggcggaa ccatcttggc aacagtccca ctggtcgtag 1080
atgcggagaa gctgcctatc aaccggctcg cagctggcag caaggccccg gcctctgccc 1140
agagccgtgg agagaagcgc acagcccaca acgccattga gaagcgctac cgctcctcca 1200
tcaatgacaa aatcattgag ctcaaggatc tggtggtggg cactgaggca aagctgaata 1260
aatctgctgt cttgcgcaag gccatcgact acattcgctt tctgcaacac agcaaccaga 1320
aactcaagca ggagaaccta agtctgcgca ctgctgtcca caaaagcaaa tctctgaagg 1380
atctggtgtc ggcctgtggc agtggaggga acacagacgt gctcatggag ggcgtgaaga 1440
ctgaggtgga ggacacactg accccacccc cctcggatgc tggctcacct ttccagagca 1500
gccccttgtc ccttggcagc aggggcagtg gcagcggtgg cagtggcagt gactcggagc 1560
ctgacagccc agtctttgag gacagcaagg caaagccaga gcagcggccg tctctgcaca 1620
gccggggcat gctggaccgc tcccgcctgg ccctgtgcac gctcgtcttc ctctgcctgt 1680
cctgcaaccc cttggcctcc ttgctggggg cccgggggct tcccagcccc tcagatacca 1740
ccagcgtcta ccatagccct gggcgcaacg tgctgggcac cgagagcaga gatggccctg 1800
gctgggccca gtggctgctg cccccagtgg tctggctgct caatgggctg ttggtgctcg 1860
tctccttggt gcttctcttt gtctacggtg agccagtcac acggccccac tcaggccccg 1920
ccgtgtactt ctggaggcat cgcaagcagg ctgacctgga cctggcccgg ggagactttg 1980
cccaggctgc ccagcagctg tggctggccc tgcgggcact gggccggccc ctgcccacct 2040
cccacctgga cctggcttgt agcctcctct ggaacctcat ccgtcacctg ctgcagcgtc 2100
tctgggtggg ccgctggctg gcaggccggg cagggggcct gcagcaggac tgtgctctgc 2160
gagtggatgc tagcgccagc gcccgagacg cagccctggt ctaccataag ctgcaccagc 2220
tgcacaccat ggggaagcac acaggcgggc acctcactgc caccaacctg gcgctgagtg 2280
ccctgaacct ggcagagtgt gcaggggatg ccgtgtctgt ggcgacgctg gccgagatct 2340
atgtggcggc tgcattgaga gtgaagacca gtctcccacg ggccttgcat tttctgacac 2400
gcttcttcct gagcagtgcc cgccaggcct gcctggcaca gagtggctca gtgcctcctg 2460
ccatgcagtg gctctgccac cccgtgggcc accgtttctt cgtggatggg gactggtccg 2520
tgctcagtac cccatgggag agcctgtaca gcttggccgg gaacccagtg gaccccctgg 2580
cccaggtgac tcagctattc cgggaacatc tcttagagcg agcactgaac tgtgtgaccc 2640
agcccaaccc cagccctggg tcagctgatg gggacaagga attctcggat gccctcgggt 2700
acctgcagct gctgaacagc tgttctgatg ctgcgggggc tcctgcctac agcttctcca 2760
tcagttccag catggccacc accaccggcg tagacccggt ggccaagtgg tgggcctctc 2820
tgacagctgt ggtgatccac tggctgcggc gggatgagga ggcggctgag cggctgtgcc 2880
cgctggtgga gcacctgccc cgggtgctgc aggagtctga gagacccctg cccagggcag 2940
ctctgcactc cttcaaggct gcccgggccc tgctgggctg tgccaaggca gagtctggtc 3000
cagccagcct gaccatctgt gagaaggcca gtgggtacct gcaggacagc ctggctacca 3060
caccagccag cagctccatt gacaaggccg tgcagctgtt cctgtgtgac ctgcttcttg 3120
tggtgcgcac cagcctgtgg cggcagcagc agcccccggc cccggcccca gcagcccagg 3180
gcaccagcag caggccccag gcttccgccc ttgagctgcg tggcttccaa cgggacctga 3240
gcagcctgag gcggctggca cagagcttcc ggcccgccat gcggagggtg ttcctacatg 3300
aggccacggc ccggctgatg gcgggggcca gccccacacg gacacaccag ctcctcgacc 3360
gcagtctgag gcggcgggca ggccccggtg gcaaaggagg cgcggtggcg gagctggagc 3420
cgcggcccac gcggcgggag cacgcggagg ccttgctgct ggcctcctgc tacctgcccc 3480
ccggcttcct gtcggcgccc gggcagcgcg tgggcatgct ggctgaggcg gcgcgcacac 3540
tcgagaagct tggcgatcgc cggctgctgc acgactgtca gcagatgctc atgcgcctgg 3600
gcggtgggac cactgtcact tccagctaga ccccgtgtcc ccggcctcag cacccctgtc 3660
tctagccact ttggtcccgt gcagcttctg tcctgcgtcg aagctttgaa ggccgaaggc 3720
agtgcaagag actctggcct ccacagttcg acctgcggct gctgtgtgcc ttcgcggtgg 3780
aaggcccgag gggcgcgatc ttgaccctaa gaccggcggc catgatggtg ctgacctctg 3840
gtggccgatc ggggcactgc aggggccgag ccattttggg gggcccccct ccttgctctg 3900
caggcacctt agtggctttt ttcctcctgt gtacagggaa gagaggggta catttccctg 3960
tgctgacgga agccaacttg gctttcccgg actgcaagca gggctctgcc ccagaggcct 4020
ctctctccgt cgtgggagag agacgtgtac atagtgtagg tcagcgtgct tagcctcctg 4080
acctgaggct cctgtgctac tttgcctttt gcaaacttta ttttcataga ttgagaagtt 4140
ttgtacagag aattaaaaat gaaattattt ataatctg 4178
<210> 10
<211> 4253
<212> DNA
<213> 智人(homo sapien)
<400> 10
cagtttccga ggaacttttc gccggcgccg ggccgcctct gaggccaggg caggacacga 60
acgcgcggag cggcggcggc gactgagagc cggggccgcg gcggcgctcc ctaggaaggg 120
ccgtacgagg cggcgggccc ggcgggcctc ccggaggagg cggctgcgcc atggacgagc 180
cacccttcag cgaggcggct ttggagcagg cgctgggcga gccgtgcgat ctggacgcgg 240
cgctgctgac cgacatcgaa ggtgaagtcg gcgcggggag gggtagggcc aacggcctgg 300
acgccccaag ggcgggcgca gatcgcggag ccatggattg cactttcgaa gacatgcttc 360
agcttatcaa caaccaagac agtgacttcc ctggcctatt tgacccaccc tatgctggga 420
gtggggcagg gggcacagac cctgccagcc ccgataccag ctccccaggc agcttgtctc 480
cacctcctgc cacattgagc tcctctcttg aagccttcct gagcgggccg caggcagcgc 540
cctcacccct gtcccctccc cagcctgcac ccactccatt gaagatgtac ccgtccatgc 600
ccgctttctc ccctgggcct ggtatcaagg aagagtcagt gccactgagc atcctgcaga 660
cccccacccc acagcccctg ccaggggccc tcctgccaca gagcttccca gccccagccc 720
caccgcagtt cagctccacc cctgtgttag gctaccccag ccctccggga ggcttctcta 780
caggaagccc tcccgggaac acccagcagc cgctgcctgg cctgccactg gcttccccgc 840
caggggtccc gcccgtctcc ttgcacaccc aggtccagag tgtggtcccc cagcagctac 900
tgacagtcac agctgccccc acggcagccc ctgtaacgac cactgtgacc tcgcagatcc 960
agcaggtccc ggtcctgctg cagccccact tcatcaaggc agactcgctg cttctgacag 1020
ccatgaagac agacggagcc actgtgaagg cggcaggtct cagtcccctg gtctctggca 1080
ccactgtgca gacagggcct ttgccgaccc tggtgagtgg cggaaccatc ttggcaacag 1140
tcccactggt cgtagatgcg gagaagctgc ctatcaaccg gctcgcagct ggcagcaagg 1200
ccccggcctc tgcccagagc cgtggagaga agcgcacagc ccacaacgcc attgagaagc 1260
gctaccgctc ctccatcaat gacaaaatca ttgagctcaa ggatctggtg gtgggcactg 1320
aggcaaagct gaataaatct gctgtcttgc gcaaggccat cgactacatt cgctttctgc 1380
aacacagcaa ccagaaactc aagcaggaga acctaagtct gcgcactgct gtccacaaaa 1440
gcaaatctct gaaggatctg gtgtcggcct gtggcagtgg agggaacaca gacgtgctca 1500
tggagggcgt gaagactgag gtggaggaca cactgacccc acccccctcg gatgctggct 1560
cacctttcca gagcagcccc ttgtcccttg gcagcagggg cagtggcagc ggtggcagtg 1620
gcagtgactc ggagcctgac agcccagtct ttgaggacag caaggcaaag ccagagcagc 1680
ggccgtctct gcacagccgg ggcatgctgg accgctcccg cctggccctg tgcacgctcg 1740
tcttcctctg cctgtcctgc aaccccttgg cctccttgct gggggcccgg gggcttccca 1800
gcccctcaga taccaccagc gtctaccata gccctgggcg caacgtgctg ggcaccgaga 1860
gcagagatgg ccctggctgg gcccagtggc tgctgccccc agtggtctgg ctgctcaatg 1920
ggctgttggt gctcgtctcc ttggtgcttc tctttgtcta cggtgagcca gtcacacggc 1980
cccactcagg ccccgccgtg tacttctgga ggcatcgcaa gcaggctgac ctggacctgg 2040
cccggggaga ctttgcccag gctgcccagc agctgtggct ggccctgcgg gcactgggcc 2100
ggcccctgcc cacctcccac ctggacctgg cttgtagcct cctctggaac ctcatccgtc 2160
acctgctgca gcgtctctgg gtgggccgct ggctggcagg ccgggcaggg ggcctgcagc 2220
aggactgtgc tctgcgagtg gatgctagcg ccagcgcccg agacgcagcc ctggtctacc 2280
ataagctgca ccagctgcac accatgggga agcacacagg cgggcacctc actgccacca 2340
acctggcgct gagtgccctg aacctggcag agtgtgcagg ggatgccgtg tctgtggcga 2400
cgctggccga gatctatgtg gcggctgcat tgagagtgaa gaccagtctc ccacgggcct 2460
tgcattttct gacacgcttc ttcctgagca gtgcccgcca ggcctgcctg gcacagagtg 2520
gctcagtgcc tcctgccatg cagtggctct gccaccccgt gggccaccgt ttcttcgtgg 2580
atggggactg gtccgtgctc agtaccccat gggagagcct gtacagcttg gccgggaacc 2640
cagtggaccc cctggcccag gtgactcagc tattccggga acatctctta gagcgagcac 2700
tgaactgtgt gacccagccc aaccccagcc ctgggtcagc tgatggggac aaggaattct 2760
cggatgccct cgggtacctg cagctgctga acagctgttc tgatgctgcg ggggctcctg 2820
cctacagctt ctccatcagt tccagcatgg ccaccaccac cggcgtagac ccggtggcca 2880
agtggtgggc ctctctgaca gctgtggtga tccactggct gcggcgggat gaggaggcgg 2940
ctgagcggct gtgcccgctg gtggagcacc tgccccgggt gctgcaggag tctgagagac 3000
ccctgcccag ggcagctctg cactccttca aggctgcccg ggccctgctg ggctgtgcca 3060
aggcagagtc tggtccagcc agcctgacca tctgtgagaa ggccagtggg tacctgcagg 3120
acagcctggc taccacacca gccagcagct ccattgacaa ggccgtgcag ctgttcctgt 3180
gtgacctgct tcttgtggtg cgcaccagcc tgtggcggca gcagcagccc ccggccccgg 3240
ccccagcagc ccagggcacc agcagcaggc cccaggcttc cgcccttgag ctgcgtggct 3300
tccaacggga cctgagcagc ctgaggcggc tggcacagag cttccggccc gccatgcgga 3360
gggtgttcct acatgaggcc acggcccggc tgatggcggg ggccagcccc acacggacac 3420
accagctcct cgaccgcagt ctgaggcggc gggcaggccc cggtggcaaa ggaggcgcgg 3480
tggcggagct ggagccgcgg cccacgcggc gggagcacgc ggaggccttg ctgctggcct 3540
cctgctacct gccccccggc ttcctgtcgg cgcccgggca gcgcgtgggc atgctggctg 3600
aggcggcgcg cacactcgag aagcttggcg atcgccggct gctgcacgac tgtcagcaga 3660
tgctcatgcg cctgggcggt gggaccactg tcacttccag ctagaccccg tgtccccggc 3720
ctcagcaccc ctgtctctag ccactttggt cccgtgcagc ttctgtcctg cgtcgaagct 3780
ttgaaggccg aaggcagtgc aagagactct ggcctccaca gttcgacctg cggctgctgt 3840
gtgccttcgc ggtggaaggc ccgaggggcg cgatcttgac cctaagaccg gcggccatga 3900
tggtgctgac ctctggtggc cgatcggggc actgcagggg ccgagccatt ttggggggcc 3960
cccctccttg ctctgcaggc accttagtgg cttttttcct cctgtgtaca gggaagagag 4020
gggtacattt ccctgtgctg acggaagcca acttggcttt cccggactgc aagcagggct 4080
ctgccccaga ggcctctctc tccgtcgtgg gagagagacg tgtacatagt gtaggtcagc 4140
gtgcttagcc tcctgacctg aggctcctgt gctactttgc cttttgcaaa ctttattttc 4200
atagattgag aagttttgta cagagaatta aaaatgaaat tatttataat ctg 4253
<210> 11
<211> 4056
<212> DNA
<213> 智人(homo sapien)
<400> 11
gcggggcggg cgcgccgcag cgctcaacgg cttcaaaaat ccgccgcgcc ttgacaggtg 60
aagtcggcgc ggggaggggt agggccaacg gcctggacgc cccaagggcg ggcgcagatc 120
gcggagccat ggattgcact ttcgaagaca tgcttcagct tatcaacaac caagacagtg 180
acttccctgg cctatttgac ccaccctatg ctgggagtgg ggcagggggc acagaccctg 240
ccagccccga taccagctcc ccaggcagct tgtctccacc tcctgccaca ttgagctcct 300
ctcttgaagc cttcctgagc gggccgcagg cagcgccctc acccctgtcc cctccccagc 360
ctgcacccac tccattgaag atgtacccgt ccatgcccgc tttctcccct gggcctggta 420
tcaaggaaga gtcagtgcca ctgagcatcc tgcagacccc caccccacag cccctgccag 480
gggccctcct gccacagagc ttcccagccc cagccccacc gcagttcagc tccacccctg 540
tgttaggcta ccccagccct ccgggaggct tctctacagg aagccctccc gggaacaccc 600
agcagccgct gcctggcctg ccactggctt ccccgccagg ggtcccgccc gtctccttgc 660
acacccaggt ccagagtgtg gtcccccagc agctactgac agtcacagct gcccccacgg 720
cagcccctgt aacgaccact gtgacctcgc agatccagca ggtcccggtc ctgctgcagc 780
cccacttcat caaggcagac tcgctgcttc tgacagccat gaagacagac ggagccactg 840
tgaaggcggc aggtctcagt cccctggtct ctggcaccac tgtgcagaca gggcctttgc 900
cgaccctggt gagtggcgga accatcttgg caacagtccc actggtcgta gatgcggaga 960
agctgcctat caaccggctc gcagctggca gcaaggcccc ggcctctgcc cagagccgtg 1020
gagagaagcg cacagcccac aacgccattg agaagcgcta ccgctcctcc atcaatgaca 1080
aaatcattga gctcaaggat ctggtggtgg gcactgaggc aaagctgaat aaatctgctg 1140
tcttgcgcaa ggccatcgac tacattcgct ttctgcaaca cagcaaccag aaactcaagc 1200
aggagaacct aagtctgcgc actgctgtcc acaaaagcaa atctctgaag gatctggtgt 1260
cggcctgtgg cagtggaggg aacacagacg tgctcatgga gggcgtgaag actgaggtgg 1320
aggacacact gaccccaccc ccctcggatg ctggctcacc tttccagagc agccccttgt 1380
cccttggcag caggggcagt ggcagcggtg gcagtggcag tgactcggag cctgacagcc 1440
cagtctttga ggacagcaag gcaaagccag agcagcggcc gtctctgcac agccggggca 1500
tgctggaccg ctcccgcctg gccctgtgca cgctcgtctt cctctgcctg tcctgcaacc 1560
ccttggcctc cttgctgggg gcccgggggc ttcccagccc ctcagatacc accagcgtct 1620
accatagccc tgggcgcaac gtgctgggca ccgagagcag agatggccct ggctgggccc 1680
agtggctgct gcccccagtg gtctggctgc tcaatgggct gttggtgctc gtctccttgg 1740
tgcttctctt tgtctacggt gagccagtca cacggcccca ctcaggcccc gccgtgtact 1800
tctggaggca tcgcaagcag gctgacctgg acctggcccg gggagacttt gcccaggctg 1860
cccagcagct gtggctggcc ctgcgggcac tgggccggcc cctgcccacc tcccacctgg 1920
acctggcttg tagcctcctc tggaacctca tccgtcacct gctgcagcgt ctctgggtgg 1980
gccgctggct ggcaggccgg gcagggggcc tgcagcagga ctgtgctctg cgagtggatg 2040
ctagcgccag cgcccgagac gcagccctgg tctaccataa gctgcaccag ctgcacacca 2100
tggggaagca cacaggcggg cacctcactg ccaccaacct ggcgctgagt gccctgaacc 2160
tggcagagtg tgcaggggat gccgtgtctg tggcgacgct ggccgagatc tatgtggcgg 2220
ctgcattgag agtgaagacc agtctcccac gggccttgca ttttctgaca cgcttcttcc 2280
tgagcagtgc ccgccaggcc tgcctggcac agagtggctc agtgcctcct gccatgcagt 2340
ggctctgcca ccccgtgggc caccgtttct tcgtggatgg ggactggtcc gtgctcagta 2400
ccccatggga gagcctgtac agcttggccg ggaacccagt ggaccccctg gcccaggtga 2460
ctcagctatt ccgggaacat ctcttagagc gagcactgaa ctgtgtgacc cagcccaacc 2520
ccagccctgg gtcagctgat ggggacaagg aattctcgga tgccctcggg tacctgcagc 2580
tgctgaacag ctgttctgat gctgcggggg ctcctgccta cagcttctcc atcagttcca 2640
gcatggccac caccaccggc gtagacccgg tggccaagtg gtgggcctct ctgacagctg 2700
tggtgatcca ctggctgcgg cgggatgagg aggcggctga gcggctgtgc ccgctggtgg 2760
agcacctgcc ccgggtgctg caggagtctg agagacccct gcccagggca gctctgcact 2820
ccttcaaggc tgcccgggcc ctgctgggct gtgccaaggc agagtctggt ccagccagcc 2880
tgaccatctg tgagaaggcc agtgggtacc tgcaggacag cctggctacc acaccagcca 2940
gcagctccat tgacaaggcc gtgcagctgt tcctgtgtga cctgcttctt gtggtgcgca 3000
ccagcctgtg gcggcagcag cagcccccgg ccccggcccc agcagcccag ggcaccagca 3060
gcaggcccca ggcttccgcc cttgagctgc gtggcttcca acgggacctg agcagcctga 3120
ggcggctggc acagagcttc cggcccgcca tgcggagggt gttcctacat gaggccacgg 3180
cccggctgat ggcgggggcc agccccacac ggacacacca gctcctcgac cgcagtctga 3240
ggcggcgggc aggccccggt ggcaaaggag gcgcggtggc ggagctggag ccgcggccca 3300
cgcggcggga gcacgcggag gccttgctgc tggcctcctg ctacctgccc cccggcttcc 3360
tgtcggcgcc cgggcagcgc gtgggcatgc tggctgaggc ggcgcgcaca ctcgagaagc 3420
ttggcgatcg ccggctgctg cacgactgtc agcagatgct catgcgcctg ggcggtggga 3480
ccactgtcac ttccagctag accccgtgtc cccggcctca gcacccctgt ctctagccac 3540
tttggtcccg tgcagcttct gtcctgcgtc gaagctttga aggccgaagg cagtgcaaga 3600
gactctggcc tccacagttc gacctgcggc tgctgtgtgc cttcgcggtg gaaggcccga 3660
ggggcgcgat cttgacccta agaccggcgg ccatgatggt gctgacctct ggtggccgat 3720
cggggcactg caggggccga gccattttgg ggggcccccc tccttgctct gcaggcacct 3780
tagtggcttt tttcctcctg tgtacaggga agagaggggt acatttccct gtgctgacgg 3840
aagccaactt ggctttcccg gactgcaagc agggctctgc cccagaggcc tctctctccg 3900
tcgtgggaga gagacgtgta catagtgtag gtcagcgtgc ttagcctcct gacctgaggc 3960
tcctgtgcta ctttgccttt tgcaaacttt attttcatag attgagaagt tttgtacaga 4020
gaattaaaaa tgaaattatt tataatctgg aaaaaa 4056
<210> 12
<211> 4178
<212> DNA
<213> 智人(homo sapien)
<400> 12
gcggccgggg gaacccagtt tccgaggaac ttttcgccgg cgccgggccg cctctgaggc 60
cagggcagga cacgaacgcg cggagcggcg gcggcgactg agagccgggg ccgcggcggc 120
gctccctagg aagggccgta cgaggcggcg ggcccggcgg gcctcccgga ggaggcggct 180
gcgccatgga cgagccaccc ttcagcgagg cggctttgga gcaggcgctg ggcgagccgt 240
gcgatctgga cgcggcgctg ctgaccgaca tcgaagacat gcttcagctt atcaacaacc 300
aagacagtga cttccctggc ctatttgacc caccctatgc tgggagtggg gcagggggca 360
cagaccctgc cagccccgat accagctccc caggcagctt gtctccacct cctgccacat 420
tgagctcctc tcttgaagcc ttcctgagcg ggccgcaggc agcgccctca cccctgtccc 480
ctccccagcc tgcacccact ccattgaaga tgtacccgtc catgcccgct ttctcccctg 540
ggcctggtat caaggaagag tcagtgccac tgagcatcct gcagaccccc accccacagc 600
ccctgccagg ggccctcctg ccacagagct tcccagcccc agccccaccg cagttcagct 660
ccacccctgt gttaggctac cccagccctc cgggaggctt ctctacagga agccctcccg 720
ggaacaccca gcagccgctg cctggcctgc cactggcttc cccgccaggg gtcccgcccg 780
tctccttgca cacccaggtc cagagtgtgg tcccccagca gctactgaca gtcacagctg 840
cccccacggc agcccctgta acgaccactg tgacctcgca gatccagcag gtcccggtcc 900
tgctgcagcc ccacttcatc aaggcagact cgctgcttct gacagccatg aagacagacg 960
gagccactgt gaaggcggca ggtctcagtc ccctggtctc tggcaccact gtgcagacag 1020
ggcctttgcc gaccctggtg agtggcggaa ccatcttggc aacagtccca ctggtcgtag 1080
atgcggagaa gctgcctatc aaccggctcg cagctggcag caaggccccg gcctctgccc 1140
agagccgtgg agagaagcgc acagcccaca acgccattga gaagtgctac cgctcctcca 1200
tcaatgacaa aatcattgag ctcaaggatc tggtggtggg cactgaggca aagctgaata 1260
aatctgctgt cttgcgcaag gccatcgact acattcgctt tctgcaacac agcaaccaga 1320
aactcaagca ggagaaccta agtctgcgca ctgctgtcca caaaagcaaa tctctgaagg 1380
atctggtgtc ggcctgtggc agtggaggga acacagacgt gctcatggag ggcgtgaaga 1440
ctgaggtgga ggacacactg accccacccc cctcggatgc tggctcacct ttccagagca 1500
gccccttgtc ccttggcagc aggggcagtg gcagcggtgg cagtggcagt gactcggagc 1560
ctgacagccc agtctttgag gacagcaagg caaagccaga gcagcggccg tctctgcaca 1620
gccggggcat gctggaccgc tcccgcctgg ccctgtgcac gctcgtcttc ctctgcctgt 1680
cctgcaaccc cttggcctcc ttgctggggg cccgggggct tcccagcccc tcagatacca 1740
ccagcgtcta ccatagccct gggcgcaacg tgctgggcac cgagagcaga gatggccctg 1800
gctgggccca gtggctgctg cccccagtgg tctggctgct caatgggctg ttggtgctcg 1860
tctccttggt gcttctcttt gtctacggtg agccagtcac acggccccac tcaggccccg 1920
ccgtgtactt ctggaggcat cgcaagcagg ctgacctgga cctggcccgg ggagactttg 1980
cccaggctgc ccagcagctg tggctggccc tgcgggcact gggccggccc ctgcccacct 2040
cccacctgga cctggcttgt agcctcctct ggaacctcat ccgtcacctg ctgcagcgtc 2100
tctgggtggg ccgctggctg gcaggccggg cagggggcct gcagcaggac tgtgctctgc 2160
gagtggatgc tagcgccagc gcccgagacg cagccctggt ctaccataag ctgcaccagc 2220
tgcacaccat ggggaagcac acaggcgggc acctcactgc caccaacctg gcgctgagtg 2280
ccctgaacct ggcagagtgt gcaggggatg ccgtgtctgt ggcgacgctg gccgagatct 2340
atgtggcggc tgcattgaga gtgaagacca gtctcccacg ggccttgcat tttctgacac 2400
gcttcttcct gagcagtgcc cgccaggcct gcctggcaca gagtggctca gtgcctcctg 2460
ccatgcagtg gctctgccac cccgtgggcc accgtttctt cgtggatggg gactggtccg 2520
tgctcagtac cccatgggag agcctgtaca gcttggccgg gaacccagtg gaccccctgg 2580
cccaggtgac tcagctattc cgggaacatc tcttagagcg agcactgaac tgtgtgaccc 2640
agcccaaccc cagccctggg tcagctgatg gggacaagga attctcggat gccctcgggt 2700
acctgcagct gctgaacagc tgttctgatg ctgcgggggc tcctgcctac agcttctcca 2760
tcagttccag catggccacc accaccggcg tagacccggt ggccaagtgg tgggcctctc 2820
tgacagctgt ggtgatccac tggctgcggc gggatgagga ggcggctgag cggctgtgcc 2880
cgctggtgga gcacctgccc cgggtgctgc aggagtctga gagacccctg cccagggcag 2940
ctctgcactc cttcaaggct gcccgggccc tgctgggctg tgccaaggca gagtctggtc 3000
cagccagcct gaccatctgt gagaaggcca gtgggtacct gcaggacagc ctggctacca 3060
caccagccag cagctccatt gacaaggccg tgcagctgtt cctgtgtgac ctgcttcttg 3120
tggtgcgcac cagcctgtgg cggcagcagc agcccccggc cccggcccca gcagcccagg 3180
gcaccagcag caggccccag gcttccgccc ttgagctgcg tggcttccaa cgggacctga 3240
gcagcctgag gcggctggca cagagcttcc ggcccgccat gcggagggtg ttcctacatg 3300
aggccacggc ccggctgatg gcgggggcca gccccacacg gacacaccag ctcctcgacc 3360
gcagtctgag gcggcgggca ggccccggtg gcaaaggagg cgcggtggcg gagctggagc 3420
cgcggcccac gcggcgggag cacgcggagg ccttgctgct ggcctcctgc tacctgcccc 3480
ccggcttcct gtcggcgccc gggcagcgcg tgggcatgct ggctgaggcg gcgcgcacac 3540
tcgagaagct tggcgatcgc cggctgctgc acgactgtca gcagatgctc atgcgcctgg 3600
gcggtgggac cactgtcact tccagctaga ccccgtgtcc ccggcctcag cacccctgtc 3660
tctagccact ttggtcccgt gcagcttctg tcctgcgtcg aagctttgaa ggccgaaggc 3720
agtgcaagag actctggcct ccacagttcg acctgcggct gctgtgtgcc ttcgcggtgg 3780
aaggcccgag gggcgcgatc ttgaccctaa gaccggcggc catgatggtg ctgacctctg 3840
gtggccgatc ggggcactgc aggggccgag ccattttggg gggcccccct ccttgctctg 3900
caggcacctt agtggctttt ttcctcctgt gtacagggaa gagaggggta catttccctg 3960
tgctgacgga agccaacttg gctttcccgg actgcaagca gggctctgcc ccagaggcct 4020
ctctctccgt cgtgggagag agacgtgtac atagtgtagg tcagcgtgct tagcctcctg 4080
acctgaggct cctgtgctac tttgcctttt gcaaacttta ttttcataga ttgagaagtt 4140
ttgtacagag aattaaaaat gaaattattt ataatctg 4178
<210> 13
<211> 4253
<212> DNA
<213> 智人(homo sapien)
<400> 13
cagtttccga ggaacttttc gccggcgccg ggccgcctct gaggccaggg caggacacga 60
acgcgcggag cggcggcggc gactgagagc cggggccgcg gcggcgctcc ctaggaaggg 120
ccgtacgagg cggcgggccc ggcgggcctc ccggaggagg cggctgcgcc atggacgagc 180
cacccttcag cgaggcggct ttggagcagg cgctgggcga gccgtgcgat ctggacgcgg 240
cgctgctgac cgacatcgaa ggtgaagtcg gcgcggggag gggtagggcc aacggcctgg 300
acgccccaag ggcgggcgca gatcgcggag ccatggattg cactttcgaa gacatgcttc 360
agcttatcaa caaccaagac agtgacttcc ctggcctatt tgacccaccc tatgctggga 420
gtggggcagg gggcacagac cctgccagcc ccgataccag ctccccaggc agcttgtctc 480
cacctcctgc cacattgagc tcctctcttg aagccttcct gagcgggccg caggcagcgc 540
cctcacccct gtcccctccc cagcctgcac ccactccatt gaagatgtac ccgtccatgc 600
ccgctttctc ccctgggcct ggtatcaagg aagagtcagt gccactgagc atcctgcaga 660
cccccacccc acagcccctg ccaggggccc tcctgccaca gagcttccca gccccagccc 720
caccgcagtt cagctccacc cctgtgttag gctaccccag ccctccggga ggcttctcta 780
caggaagccc tcccgggaac acccagcagc cgctgcctgg cctgccactg gcttccccgc 840
caggggtccc gcccgtctcc ttgcacaccc aggtccagag tgtggtcccc cagcagctac 900
tgacagtcac agctgccccc acggcagccc ctgtaacgac cactgtgacc tcgcagatcc 960
agcaggtccc ggtcctgctg cagccccact tcatcaaggc agactcgctg cttctgacag 1020
ccatgaagac agacggagcc actgtgaagg cggcaggtct cagtcccctg gtctctggca 1080
ccactgtgca gacagggcct ttgccgaccc tggtgagtgg cggaaccatc ttggcaacag 1140
tcccactggt cgtagatgcg gagaagctgc ctatcaaccg gctcgcagct ggcagcaagg 1200
ccccggcctc tgcccagagc cgtggagaga agcgcacagc ccacaacgcc attgagaagt 1260
gctaccgctc ctccatcaat gacaaaatca ttgagctcaa ggatctggtg gtgggcactg 1320
aggcaaagct gaataaatct gctgtcttgc gcaaggccat cgactacatt cgctttctgc 1380
aacacagcaa ccagaaactc aagcaggaga acctaagtct gcgcactgct gtccacaaaa 1440
gcaaatctct gaaggatctg gtgtcggcct gtggcagtgg agggaacaca gacgtgctca 1500
tggagggcgt gaagactgag gtggaggaca cactgacccc acccccctcg gatgctggct 1560
cacctttcca gagcagcccc ttgtcccttg gcagcagggg cagtggcagc ggtggcagtg 1620
gcagtgactc ggagcctgac agcccagtct ttgaggacag caaggcaaag ccagagcagc 1680
ggccgtctct gcacagccgg ggcatgctgg accgctcccg cctggccctg tgcacgctcg 1740
tcttcctctg cctgtcctgc aaccccttgg cctccttgct gggggcccgg gggcttccca 1800
gcccctcaga taccaccagc gtctaccata gccctgggcg caacgtgctg ggcaccgaga 1860
gcagagatgg ccctggctgg gcccagtggc tgctgccccc agtggtctgg ctgctcaatg 1920
ggctgttggt gctcgtctcc ttggtgcttc tctttgtcta cggtgagcca gtcacacggc 1980
cccactcagg ccccgccgtg tacttctgga ggcatcgcaa gcaggctgac ctggacctgg 2040
cccggggaga ctttgcccag gctgcccagc agctgtggct ggccctgcgg gcactgggcc 2100
ggcccctgcc cacctcccac ctggacctgg cttgtagcct cctctggaac ctcatccgtc 2160
acctgctgca gcgtctctgg gtgggccgct ggctggcagg ccgggcaggg ggcctgcagc 2220
aggactgtgc tctgcgagtg gatgctagcg ccagcgcccg agacgcagcc ctggtctacc 2280
ataagctgca ccagctgcac accatgggga agcacacagg cgggcacctc actgccacca 2340
acctggcgct gagtgccctg aacctggcag agtgtgcagg ggatgccgtg tctgtggcga 2400
cgctggccga gatctatgtg gcggctgcat tgagagtgaa gaccagtctc ccacgggcct 2460
tgcattttct gacacgcttc ttcctgagca gtgcccgcca ggcctgcctg gcacagagtg 2520
gctcagtgcc tcctgccatg cagtggctct gccaccccgt gggccaccgt ttcttcgtgg 2580
atggggactg gtccgtgctc agtaccccat gggagagcct gtacagcttg gccgggaacc 2640
cagtggaccc cctggcccag gtgactcagc tattccggga acatctctta gagcgagcac 2700
tgaactgtgt gacccagccc aaccccagcc ctgggtcagc tgatggggac aaggaattct 2760
cggatgccct cgggtacctg cagctgctga acagctgttc tgatgctgcg ggggctcctg 2820
cctacagctt ctccatcagt tccagcatgg ccaccaccac cggcgtagac ccggtggcca 2880
agtggtgggc ctctctgaca gctgtggtga tccactggct gcggcgggat gaggaggcgg 2940
ctgagcggct gtgcccgctg gtggagcacc tgccccgggt gctgcaggag tctgagagac 3000
ccctgcccag ggcagctctg cactccttca aggctgcccg ggccctgctg ggctgtgcca 3060
aggcagagtc tggtccagcc agcctgacca tctgtgagaa ggccagtggg tacctgcagg 3120
acagcctggc taccacacca gccagcagct ccattgacaa ggccgtgcag ctgttcctgt 3180
gtgacctgct tcttgtggtg cgcaccagcc tgtggcggca gcagcagccc ccggccccgg 3240
ccccagcagc ccagggcacc agcagcaggc cccaggcttc cgcccttgag ctgcgtggct 3300
tccaacggga cctgagcagc ctgaggcggc tggcacagag cttccggccc gccatgcgga 3360
gggtgttcct acatgaggcc acggcccggc tgatggcggg ggccagcccc acacggacac 3420
accagctcct cgaccgcagt ctgaggcggc gggcaggccc cggtggcaaa ggaggcgcgg 3480
tggcggagct ggagccgcgg cccacgcggc gggagcacgc ggaggccttg ctgctggcct 3540
cctgctacct gccccccggc ttcctgtcgg cgcccgggca gcgcgtgggc atgctggctg 3600
aggcggcgcg cacactcgag aagcttggcg atcgccggct gctgcacgac tgtcagcaga 3660
tgctcatgcg cctgggcggt gggaccactg tcacttccag ctagaccccg tgtccccggc 3720
ctcagcaccc ctgtctctag ccactttggt cccgtgcagc ttctgtcctg cgtcgaagct 3780
ttgaaggccg aaggcagtgc aagagactct ggcctccaca gttcgacctg cggctgctgt 3840
gtgccttcgc ggtggaaggc ccgaggggcg cgatcttgac cctaagaccg gcggccatga 3900
tggtgctgac ctctggtggc cgatcggggc actgcagggg ccgagccatt ttggggggcc 3960
cccctccttg ctctgcaggc accttagtgg cttttttcct cctgtgtaca gggaagagag 4020
gggtacattt ccctgtgctg acggaagcca acttggcttt cccggactgc aagcagggct 4080
ctgccccaga ggcctctctc tccgtcgtgg gagagagacg tgtacatagt gtaggtcagc 4140
gtgcttagcc tcctgacctg aggctcctgt gctactttgc cttttgcaaa ctttattttc 4200
atagattgag aagttttgta cagagaatta aaaatgaaat tatttataat ctg 4253
<210> 14
<211> 4056
<212> DNA
<213> 智人(homo sapien)
<400> 14
gcggggcggg cgcgccgcag cgctcaacgg cttcaaaaat ccgccgcgcc ttgacaggtg 60
aagtcggcgc ggggaggggt agggccaacg gcctggacgc cccaagggcg ggcgcagatc 120
gcggagccat ggattgcact ttcgaagaca tgcttcagct tatcaacaac caagacagtg 180
acttccctgg cctatttgac ccaccctatg ctgggagtgg ggcagggggc acagaccctg 240
ccagccccga taccagctcc ccaggcagct tgtctccacc tcctgccaca ttgagctcct 300
ctcttgaagc cttcctgagc gggccgcagg cagcgccctc acccctgtcc cctccccagc 360
ctgcacccac tccattgaag atgtacccgt ccatgcccgc tttctcccct gggcctggta 420
tcaaggaaga gtcagtgcca ctgagcatcc tgcagacccc caccccacag cccctgccag 480
gggccctcct gccacagagc ttcccagccc cagccccacc gcagttcagc tccacccctg 540
tgttaggcta ccccagccct ccgggaggct tctctacagg aagccctccc gggaacaccc 600
agcagccgct gcctggcctg ccactggctt ccccgccagg ggtcccgccc gtctccttgc 660
acacccaggt ccagagtgtg gtcccccagc agctactgac agtcacagct gcccccacgg 720
cagcccctgt aacgaccact gtgacctcgc agatccagca ggtcccggtc ctgctgcagc 780
cccacttcat caaggcagac tcgctgcttc tgacagccat gaagacagac ggagccactg 840
tgaaggcggc aggtctcagt cccctggtct ctggcaccac tgtgcagaca gggcctttgc 900
cgaccctggt gagtggcgga accatcttgg caacagtccc actggtcgta gatgcggaga 960
agctgcctat caaccggctc gcagctggca gcaaggcccc ggcctctgcc cagagccgtg 1020
gagagaagcg cacagcccac aacgccattg agaagtgcta ccgctcctcc atcaatgaca 1080
aaatcattga gctcaaggat ctggtggtgg gcactgaggc aaagctgaat aaatctgctg 1140
tcttgcgcaa ggccatcgac tacattcgct ttctgcaaca cagcaaccag aaactcaagc 1200
aggagaacct aagtctgcgc actgctgtcc acaaaagcaa atctctgaag gatctggtgt 1260
cggcctgtgg cagtggaggg aacacagacg tgctcatgga gggcgtgaag actgaggtgg 1320
aggacacact gaccccaccc ccctcggatg ctggctcacc tttccagagc agccccttgt 1380
cccttggcag caggggcagt ggcagcggtg gcagtggcag tgactcggag cctgacagcc 1440
cagtctttga ggacagcaag gcaaagccag agcagcggcc gtctctgcac agccggggca 1500
tgctggaccg ctcccgcctg gccctgtgca cgctcgtctt cctctgcctg tcctgcaacc 1560
ccttggcctc cttgctgggg gcccgggggc ttcccagccc ctcagatacc accagcgtct 1620
accatagccc tgggcgcaac gtgctgggca ccgagagcag agatggccct ggctgggccc 1680
agtggctgct gcccccagtg gtctggctgc tcaatgggct gttggtgctc gtctccttgg 1740
tgcttctctt tgtctacggt gagccagtca cacggcccca ctcaggcccc gccgtgtact 1800
tctggaggca tcgcaagcag gctgacctgg acctggcccg gggagacttt gcccaggctg 1860
cccagcagct gtggctggcc ctgcgggcac tgggccggcc cctgcccacc tcccacctgg 1920
acctggcttg tagcctcctc tggaacctca tccgtcacct gctgcagcgt ctctgggtgg 1980
gccgctggct ggcaggccgg gcagggggcc tgcagcagga ctgtgctctg cgagtggatg 2040
ctagcgccag cgcccgagac gcagccctgg tctaccataa gctgcaccag ctgcacacca 2100
tggggaagca cacaggcggg cacctcactg ccaccaacct ggcgctgagt gccctgaacc 2160
tggcagagtg tgcaggggat gccgtgtctg tggcgacgct ggccgagatc tatgtggcgg 2220
ctgcattgag agtgaagacc agtctcccac gggccttgca ttttctgaca cgcttcttcc 2280
tgagcagtgc ccgccaggcc tgcctggcac agagtggctc agtgcctcct gccatgcagt 2340
ggctctgcca ccccgtgggc caccgtttct tcgtggatgg ggactggtcc gtgctcagta 2400
ccccatggga gagcctgtac agcttggccg ggaacccagt ggaccccctg gcccaggtga 2460
ctcagctatt ccgggaacat ctcttagagc gagcactgaa ctgtgtgacc cagcccaacc 2520
ccagccctgg gtcagctgat ggggacaagg aattctcgga tgccctcggg tacctgcagc 2580
tgctgaacag ctgttctgat gctgcggggg ctcctgccta cagcttctcc atcagttcca 2640
gcatggccac caccaccggc gtagacccgg tggccaagtg gtgggcctct ctgacagctg 2700
tggtgatcca ctggctgcgg cgggatgagg aggcggctga gcggctgtgc ccgctggtgg 2760
agcacctgcc ccgggtgctg caggagtctg agagacccct gcccagggca gctctgcact 2820
ccttcaaggc tgcccgggcc ctgctgggct gtgccaaggc agagtctggt ccagccagcc 2880
tgaccatctg tgagaaggcc agtgggtacc tgcaggacag cctggctacc acaccagcca 2940
gcagctccat tgacaaggcc gtgcagctgt tcctgtgtga cctgcttctt gtggtgcgca 3000
ccagcctgtg gcggcagcag cagcccccgg ccccggcccc agcagcccag ggcaccagca 3060
gcaggcccca ggcttccgcc cttgagctgc gtggcttcca acgggacctg agcagcctga 3120
ggcggctggc acagagcttc cggcccgcca tgcggagggt gttcctacat gaggccacgg 3180
cccggctgat ggcgggggcc agccccacac ggacacacca gctcctcgac cgcagtctga 3240
ggcggcgggc aggccccggt ggcaaaggag gcgcggtggc ggagctggag ccgcggccca 3300
cgcggcggga gcacgcggag gccttgctgc tggcctcctg ctacctgccc cccggcttcc 3360
tgtcggcgcc cgggcagcgc gtgggcatgc tggctgaggc ggcgcgcaca ctcgagaagc 3420
ttggcgatcg ccggctgctg cacgactgtc agcagatgct catgcgcctg ggcggtggga 3480
ccactgtcac ttccagctag accccgtgtc cccggcctca gcacccctgt ctctagccac 3540
tttggtcccg tgcagcttct gtcctgcgtc gaagctttga aggccgaagg cagtgcaaga 3600
gactctggcc tccacagttc gacctgcggc tgctgtgtgc cttcgcggtg gaaggcccga 3660
ggggcgcgat cttgacccta agaccggcgg ccatgatggt gctgacctct ggtggccgat 3720
cggggcactg caggggccga gccattttgg ggggcccccc tccttgctct gcaggcacct 3780
tagtggcttt tttcctcctg tgtacaggga agagaggggt acatttccct gtgctgacgg 3840
aagccaactt ggctttcccg gactgcaagc agggctctgc cccagaggcc tctctctccg 3900
tcgtgggaga gagacgtgta catagtgtag gtcagcgtgc ttagcctcct gacctgaggc 3960
tcctgtgcta ctttgccttt tgcaaacttt attttcatag attgagaagt tttgtacaga 4020
gaattaaaaa tgaaattatt tataatctgg aaaaaa 4056
<210> 15
<211> 1147
<212> PRT
<213> 智人(homo sapien)
<400> 15
Met Asp Glu Pro Pro Phe Ser Glu Ala Ala Leu Glu Gln Ala Leu Gly
1 5 10 15
Glu Pro Cys Asp Leu Asp Ala Ala Leu Leu Thr Asp Ile Glu Asp Met
20 25 30
Leu Gln Leu Ile Asn Asn Gln Asp Ser Asp Phe Pro Gly Leu Phe Asp
35 40 45
Pro Pro Tyr Ala Gly Ser Gly Ala Gly Gly Thr Asp Pro Ala Ser Pro
50 55 60
Asp Thr Ser Ser Pro Gly Ser Leu Ser Pro Pro Pro Ala Thr Leu Ser
65 70 75 80
Ser Ser Leu Glu Ala Phe Leu Ser Gly Pro Gln Ala Ala Pro Ser Pro
85 90 95
Leu Ser Pro Pro Gln Pro Ala Pro Thr Pro Leu Lys Met Tyr Pro Ser
100 105 110
Met Pro Ala Phe Ser Pro Gly Pro Gly Ile Lys Glu Glu Ser Val Pro
115 120 125
Leu Ser Ile Leu Gln Thr Pro Thr Pro Gln Pro Leu Pro Gly Ala Leu
130 135 140
Leu Pro Gln Ser Phe Pro Ala Pro Ala Pro Pro Gln Phe Ser Ser Thr
145 150 155 160
Pro Val Leu Gly Tyr Pro Ser Pro Pro Gly Gly Phe Ser Thr Gly Ser
165 170 175
Pro Pro Gly Asn Thr Gln Gln Pro Leu Pro Gly Leu Pro Leu Ala Ser
180 185 190
Pro Pro Gly Val Pro Pro Val Ser Leu His Thr Gln Val Gln Ser Val
195 200 205
Val Pro Gln Gln Leu Leu Thr Val Thr Ala Ala Pro Thr Ala Ala Pro
210 215 220
Val Thr Thr Thr Val Thr Ser Gln Ile Gln Gln Val Pro Val Leu Leu
225 230 235 240
Gln Pro His Phe Ile Lys Ala Asp Ser Leu Leu Leu Thr Ala Met Lys
245 250 255
Thr Asp Gly Ala Thr Val Lys Ala Ala Gly Leu Ser Pro Leu Val Ser
260 265 270
Gly Thr Thr Val Gln Thr Gly Pro Leu Pro Thr Leu Val Ser Gly Gly
275 280 285
Thr Ile Leu Ala Thr Val Pro Leu Val Val Asp Ala Glu Lys Leu Pro
290 295 300
Ile Asn Arg Leu Ala Ala Gly Ser Lys Ala Pro Ala Ser Ala Gln Ser
305 310 315 320
Arg Gly Glu Lys Arg Thr Ala His Asn Ala Ile Glu Lys Arg Tyr Arg
325 330 335
Ser Ser Ile Asn Asp Lys Ile Ile Glu Leu Lys Asp Leu Val Val Gly
340 345 350
Thr Glu Ala Lys Leu Asn Lys Ser Ala Val Leu Arg Lys Ala Ile Asp
355 360 365
Tyr Ile Arg Phe Leu Gln His Ser Asn Gln Lys Leu Lys Gln Glu Asn
370 375 380
Leu Ser Leu Arg Thr Ala Val His Lys Ser Lys Ser Leu Lys Asp Leu
385 390 395 400
Val Ser Ala Cys Gly Ser Gly Gly Asn Thr Asp Val Leu Met Glu Gly
405 410 415
Val Lys Thr Glu Val Glu Asp Thr Leu Thr Pro Pro Pro Ser Asp Ala
420 425 430
Gly Ser Pro Phe Gln Ser Ser Pro Leu Ser Leu Gly Ser Arg Gly Ser
435 440 445
Gly Ser Gly Gly Ser Gly Ser Asp Ser Glu Pro Asp Ser Pro Val Phe
450 455 460
Glu Asp Ser Lys Ala Lys Pro Glu Gln Arg Pro Ser Leu His Ser Arg
465 470 475 480
Gly Met Leu Asp Arg Ser Arg Leu Ala Leu Cys Thr Leu Val Phe Leu
485 490 495
Cys Leu Ser Cys Asn Pro Leu Ala Ser Leu Leu Gly Ala Arg Gly Leu
500 505 510
Pro Ser Pro Ser Asp Thr Thr Ser Val Tyr His Ser Pro Gly Arg Asn
515 520 525
Val Leu Gly Thr Glu Ser Arg Asp Gly Pro Gly Trp Ala Gln Trp Leu
530 535 540
Leu Pro Pro Val Val Trp Leu Leu Asn Gly Leu Leu Val Leu Val Ser
545 550 555 560
Leu Val Leu Leu Phe Val Tyr Gly Glu Pro Val Thr Arg Pro His Ser
565 570 575
Gly Pro Ala Val Tyr Phe Trp Arg His Arg Lys Gln Ala Asp Leu Asp
580 585 590
Leu Ala Arg Gly Asp Phe Ala Gln Ala Ala Gln Gln Leu Trp Leu Ala
595 600 605
Leu Arg Ala Leu Gly Arg Pro Leu Pro Thr Ser His Leu Asp Leu Ala
610 615 620
Cys Ser Leu Leu Trp Asn Leu Ile Arg His Leu Leu Gln Arg Leu Trp
625 630 635 640
Val Gly Arg Trp Leu Ala Gly Arg Ala Gly Gly Leu Gln Gln Asp Cys
645 650 655
Ala Leu Arg Val Asp Ala Ser Ala Ser Ala Arg Asp Ala Ala Leu Val
660 665 670
Tyr His Lys Leu His Gln Leu His Thr Met Gly Lys His Thr Gly Gly
675 680 685
His Leu Thr Ala Thr Asn Leu Ala Leu Ser Ala Leu Asn Leu Ala Glu
690 695 700
Cys Ala Gly Asp Ala Val Ser Val Ala Thr Leu Ala Glu Ile Tyr Val
705 710 715 720
Ala Ala Ala Leu Arg Val Lys Thr Ser Leu Pro Arg Ala Leu His Phe
725 730 735
Leu Thr Arg Phe Phe Leu Ser Ser Ala Arg Gln Ala Cys Leu Ala Gln
740 745 750
Ser Gly Ser Val Pro Pro Ala Met Gln Trp Leu Cys His Pro Val Gly
755 760 765
His Arg Phe Phe Val Asp Gly Asp Trp Ser Val Leu Ser Thr Pro Trp
770 775 780
Glu Ser Leu Tyr Ser Leu Ala Gly Asn Pro Val Asp Pro Leu Ala Gln
785 790 795 800
Val Thr Gln Leu Phe Arg Glu His Leu Leu Glu Arg Ala Leu Asn Cys
805 810 815
Val Thr Gln Pro Asn Pro Ser Pro Gly Ser Ala Asp Gly Asp Lys Glu
820 825 830
Phe Ser Asp Ala Leu Gly Tyr Leu Gln Leu Leu Asn Ser Cys Ser Asp
835 840 845
Ala Ala Gly Ala Pro Ala Tyr Ser Phe Ser Ile Ser Ser Ser Met Ala
850 855 860
Thr Thr Thr Gly Val Asp Pro Val Ala Lys Trp Trp Ala Ser Leu Thr
865 870 875 880
Ala Val Val Ile His Trp Leu Arg Arg Asp Glu Glu Ala Ala Glu Arg
885 890 895
Leu Cys Pro Leu Val Glu His Leu Pro Arg Val Leu Gln Glu Ser Glu
900 905 910
Arg Pro Leu Pro Arg Ala Ala Leu His Ser Phe Lys Ala Ala Arg Ala
915 920 925
Leu Leu Gly Cys Ala Lys Ala Glu Ser Gly Pro Ala Ser Leu Thr Ile
930 935 940
Cys Glu Lys Ala Ser Gly Tyr Leu Gln Asp Ser Leu Ala Thr Thr Pro
945 950 955 960
Ala Ser Ser Ser Ile Asp Lys Ala Val Gln Leu Phe Leu Cys Asp Leu
965 970 975
Leu Leu Val Val Arg Thr Ser Leu Trp Arg Gln Gln Gln Pro Pro Ala
980 985 990
Pro Ala Pro Ala Ala Gln Gly Thr Ser Ser Arg Pro Gln Ala Ser Ala
995 1000 1005
Leu Glu Leu Arg Gly Phe Gln Arg Asp Leu Ser Ser Leu Arg Arg
1010 1015 1020
Leu Ala Gln Ser Phe Arg Pro Ala Met Arg Arg Val Phe Leu His
1025 1030 1035
Glu Ala Thr Ala Arg Leu Met Ala Gly Ala Ser Pro Thr Arg Thr
1040 1045 1050
His Gln Leu Leu Asp Arg Ser Leu Arg Arg Arg Ala Gly Pro Gly
1055 1060 1065
Gly Lys Gly Gly Ala Val Ala Glu Leu Glu Pro Arg Pro Thr Arg
1070 1075 1080
Arg Glu His Ala Glu Ala Leu Leu Leu Ala Ser Cys Tyr Leu Pro
1085 1090 1095
Pro Gly Phe Leu Ser Ala Pro Gly Gln Arg Val Gly Met Leu Ala
1100 1105 1110
Glu Ala Ala Arg Thr Leu Glu Lys Leu Gly Asp Arg Arg Leu Leu
1115 1120 1125
His Asp Cys Gln Gln Met Leu Met Arg Leu Gly Gly Gly Thr Thr
1130 1135 1140
Val Thr Ser Ser
1145
<210> 16
<211> 1177
<212> PRT
<213> 智人(homo sapien)
<400> 16
Met Asp Glu Pro Pro Phe Ser Glu Ala Ala Leu Glu Gln Ala Leu Gly
1 5 10 15
Glu Pro Cys Asp Leu Asp Ala Ala Leu Leu Thr Asp Ile Glu Gly Glu
20 25 30
Val Gly Ala Gly Arg Gly Arg Ala Asn Gly Leu Asp Ala Pro Arg Ala
35 40 45
Gly Ala Asp Arg Gly Ala Met Asp Cys Thr Phe Glu Asp Met Leu Gln
50 55 60
Leu Ile Asn Asn Gln Asp Ser Asp Phe Pro Gly Leu Phe Asp Pro Pro
65 70 75 80
Tyr Ala Gly Ser Gly Ala Gly Gly Thr Asp Pro Ala Ser Pro Asp Thr
85 90 95
Ser Ser Pro Gly Ser Leu Ser Pro Pro Pro Ala Thr Leu Ser Ser Ser
100 105 110
Leu Glu Ala Phe Leu Ser Gly Pro Gln Ala Ala Pro Ser Pro Leu Ser
115 120 125
Pro Pro Gln Pro Ala Pro Thr Pro Leu Lys Met Tyr Pro Ser Met Pro
130 135 140
Ala Phe Ser Pro Gly Pro Gly Ile Lys Glu Glu Ser Val Pro Leu Ser
145 150 155 160
Ile Leu Gln Thr Pro Thr Pro Gln Pro Leu Pro Gly Ala Leu Leu Pro
165 170 175
Gln Ser Phe Pro Ala Pro Ala Pro Pro Gln Phe Ser Ser Thr Pro Val
180 185 190
Leu Gly Tyr Pro Ser Pro Pro Gly Gly Phe Ser Thr Gly Ser Pro Pro
195 200 205
Gly Asn Thr Gln Gln Pro Leu Pro Gly Leu Pro Leu Ala Ser Pro Pro
210 215 220
Gly Val Pro Pro Val Ser Leu His Thr Gln Val Gln Ser Val Val Pro
225 230 235 240
Gln Gln Leu Leu Thr Val Thr Ala Ala Pro Thr Ala Ala Pro Val Thr
245 250 255
Thr Thr Val Thr Ser Gln Ile Gln Gln Val Pro Val Leu Leu Gln Pro
260 265 270
His Phe Ile Lys Ala Asp Ser Leu Leu Leu Thr Ala Met Lys Thr Asp
275 280 285
Gly Ala Thr Val Lys Ala Ala Gly Leu Ser Pro Leu Val Ser Gly Thr
290 295 300
Thr Val Gln Thr Gly Pro Leu Pro Thr Leu Val Ser Gly Gly Thr Ile
305 310 315 320
Leu Ala Thr Val Pro Leu Val Val Asp Ala Glu Lys Leu Pro Ile Asn
325 330 335
Arg Leu Ala Ala Gly Ser Lys Ala Pro Ala Ser Ala Gln Ser Arg Gly
340 345 350
Glu Lys Arg Thr Ala His Asn Ala Ile Glu Lys Arg Tyr Arg Ser Ser
355 360 365
Ile Asn Asp Lys Ile Ile Glu Leu Lys Asp Leu Val Val Gly Thr Glu
370 375 380
Ala Lys Leu Asn Lys Ser Ala Val Leu Arg Lys Ala Ile Asp Tyr Ile
385 390 395 400
Arg Phe Leu Gln His Ser Asn Gln Lys Leu Lys Gln Glu Asn Leu Ser
405 410 415
Leu Arg Thr Ala Val His Lys Ser Lys Ser Leu Lys Asp Leu Val Ser
420 425 430
Ala Cys Gly Ser Gly Gly Asn Thr Asp Val Leu Met Glu Gly Val Lys
435 440 445
Thr Glu Val Glu Asp Thr Leu Thr Pro Pro Pro Ser Asp Ala Gly Ser
450 455 460
Pro Phe Gln Ser Ser Pro Leu Ser Leu Gly Ser Arg Gly Ser Gly Ser
465 470 475 480
Gly Gly Ser Gly Ser Asp Ser Glu Pro Asp Ser Pro Val Phe Glu Asp
485 490 495
Ser Lys Ala Lys Pro Glu Gln Arg Pro Ser Leu His Ser Arg Gly Met
500 505 510
Leu Asp Arg Ser Arg Leu Ala Leu Cys Thr Leu Val Phe Leu Cys Leu
515 520 525
Ser Cys Asn Pro Leu Ala Ser Leu Leu Gly Ala Arg Gly Leu Pro Ser
530 535 540
Pro Ser Asp Thr Thr Ser Val Tyr His Ser Pro Gly Arg Asn Val Leu
545 550 555 560
Gly Thr Glu Ser Arg Asp Gly Pro Gly Trp Ala Gln Trp Leu Leu Pro
565 570 575
Pro Val Val Trp Leu Leu Asn Gly Leu Leu Val Leu Val Ser Leu Val
580 585 590
Leu Leu Phe Val Tyr Gly Glu Pro Val Thr Arg Pro His Ser Gly Pro
595 600 605
Ala Val Tyr Phe Trp Arg His Arg Lys Gln Ala Asp Leu Asp Leu Ala
610 615 620
Arg Gly Asp Phe Ala Gln Ala Ala Gln Gln Leu Trp Leu Ala Leu Arg
625 630 635 640
Ala Leu Gly Arg Pro Leu Pro Thr Ser His Leu Asp Leu Ala Cys Ser
645 650 655
Leu Leu Trp Asn Leu Ile Arg His Leu Leu Gln Arg Leu Trp Val Gly
660 665 670
Arg Trp Leu Ala Gly Arg Ala Gly Gly Leu Gln Gln Asp Cys Ala Leu
675 680 685
Arg Val Asp Ala Ser Ala Ser Ala Arg Asp Ala Ala Leu Val Tyr His
690 695 700
Lys Leu His Gln Leu His Thr Met Gly Lys His Thr Gly Gly His Leu
705 710 715 720
Thr Ala Thr Asn Leu Ala Leu Ser Ala Leu Asn Leu Ala Glu Cys Ala
725 730 735
Gly Asp Ala Val Ser Val Ala Thr Leu Ala Glu Ile Tyr Val Ala Ala
740 745 750
Ala Leu Arg Val Lys Thr Ser Leu Pro Arg Ala Leu His Phe Leu Thr
755 760 765
Arg Phe Phe Leu Ser Ser Ala Arg Gln Ala Cys Leu Ala Gln Ser Gly
770 775 780
Ser Val Pro Pro Ala Met Gln Trp Leu Cys His Pro Val Gly His Arg
785 790 795 800
Phe Phe Val Asp Gly Asp Trp Ser Val Leu Ser Thr Pro Trp Glu Ser
805 810 815
Leu Tyr Ser Leu Ala Gly Asn Pro Val Asp Pro Leu Ala Gln Val Thr
820 825 830
Gln Leu Phe Arg Glu His Leu Leu Glu Arg Ala Leu Asn Cys Val Thr
835 840 845
Gln Pro Asn Pro Ser Pro Gly Ser Ala Asp Gly Asp Lys Glu Phe Ser
850 855 860
Asp Ala Leu Gly Tyr Leu Gln Leu Leu Asn Ser Cys Ser Asp Ala Ala
865 870 875 880
Gly Ala Pro Ala Tyr Ser Phe Ser Ile Ser Ser Ser Met Ala Thr Thr
885 890 895
Thr Gly Val Asp Pro Val Ala Lys Trp Trp Ala Ser Leu Thr Ala Val
900 905 910
Val Ile His Trp Leu Arg Arg Asp Glu Glu Ala Ala Glu Arg Leu Cys
915 920 925
Pro Leu Val Glu His Leu Pro Arg Val Leu Gln Glu Ser Glu Arg Pro
930 935 940
Leu Pro Arg Ala Ala Leu His Ser Phe Lys Ala Ala Arg Ala Leu Leu
945 950 955 960
Gly Cys Ala Lys Ala Glu Ser Gly Pro Ala Ser Leu Thr Ile Cys Glu
965 970 975
Lys Ala Ser Gly Tyr Leu Gln Asp Ser Leu Ala Thr Thr Pro Ala Ser
980 985 990
Ser Ser Ile Asp Lys Ala Val Gln Leu Phe Leu Cys Asp Leu Leu Leu
995 1000 1005
Val Val Arg Thr Ser Leu Trp Arg Gln Gln Gln Pro Pro Ala Pro
1010 1015 1020
Ala Pro Ala Ala Gln Gly Thr Ser Ser Arg Pro Gln Ala Ser Ala
1025 1030 1035
Leu Glu Leu Arg Gly Phe Gln Arg Asp Leu Ser Ser Leu Arg Arg
1040 1045 1050
Leu Ala Gln Ser Phe Arg Pro Ala Met Arg Arg Val Phe Leu His
1055 1060 1065
Glu Ala Thr Ala Arg Leu Met Ala Gly Ala Ser Pro Thr Arg Thr
1070 1075 1080
His Gln Leu Leu Asp Arg Ser Leu Arg Arg Arg Ala Gly Pro Gly
1085 1090 1095
Gly Lys Gly Gly Ala Val Ala Glu Leu Glu Pro Arg Pro Thr Arg
1100 1105 1110
Arg Glu His Ala Glu Ala Leu Leu Leu Ala Ser Cys Tyr Leu Pro
1115 1120 1125
Pro Gly Phe Leu Ser Ala Pro Gly Gln Arg Val Gly Met Leu Ala
1130 1135 1140
Glu Ala Ala Arg Thr Leu Glu Lys Leu Gly Asp Arg Arg Leu Leu
1145 1150 1155
His Asp Cys Gln Gln Met Leu Met Arg Leu Gly Gly Gly Thr Thr
1160 1165 1170
Val Thr Ser Ser
1175
<210> 17
<211> 1123
<212> PRT
<213> 智人(homo sapien)
<400> 17
Met Asp Cys Thr Phe Glu Asp Met Leu Gln Leu Ile Asn Asn Gln Asp
1 5 10 15
Ser Asp Phe Pro Gly Leu Phe Asp Pro Pro Tyr Ala Gly Ser Gly Ala
20 25 30
Gly Gly Thr Asp Pro Ala Ser Pro Asp Thr Ser Ser Pro Gly Ser Leu
35 40 45
Ser Pro Pro Pro Ala Thr Leu Ser Ser Ser Leu Glu Ala Phe Leu Ser
50 55 60
Gly Pro Gln Ala Ala Pro Ser Pro Leu Ser Pro Pro Gln Pro Ala Pro
65 70 75 80
Thr Pro Leu Lys Met Tyr Pro Ser Met Pro Ala Phe Ser Pro Gly Pro
85 90 95
Gly Ile Lys Glu Glu Ser Val Pro Leu Ser Ile Leu Gln Thr Pro Thr
100 105 110
Pro Gln Pro Leu Pro Gly Ala Leu Leu Pro Gln Ser Phe Pro Ala Pro
115 120 125
Ala Pro Pro Gln Phe Ser Ser Thr Pro Val Leu Gly Tyr Pro Ser Pro
130 135 140
Pro Gly Gly Phe Ser Thr Gly Ser Pro Pro Gly Asn Thr Gln Gln Pro
145 150 155 160
Leu Pro Gly Leu Pro Leu Ala Ser Pro Pro Gly Val Pro Pro Val Ser
165 170 175
Leu His Thr Gln Val Gln Ser Val Val Pro Gln Gln Leu Leu Thr Val
180 185 190
Thr Ala Ala Pro Thr Ala Ala Pro Val Thr Thr Thr Val Thr Ser Gln
195 200 205
Ile Gln Gln Val Pro Val Leu Leu Gln Pro His Phe Ile Lys Ala Asp
210 215 220
Ser Leu Leu Leu Thr Ala Met Lys Thr Asp Gly Ala Thr Val Lys Ala
225 230 235 240
Ala Gly Leu Ser Pro Leu Val Ser Gly Thr Thr Val Gln Thr Gly Pro
245 250 255
Leu Pro Thr Leu Val Ser Gly Gly Thr Ile Leu Ala Thr Val Pro Leu
260 265 270
Val Val Asp Ala Glu Lys Leu Pro Ile Asn Arg Leu Ala Ala Gly Ser
275 280 285
Lys Ala Pro Ala Ser Ala Gln Ser Arg Gly Glu Lys Arg Thr Ala His
290 295 300
Asn Ala Ile Glu Lys Arg Tyr Arg Ser Ser Ile Asn Asp Lys Ile Ile
305 310 315 320
Glu Leu Lys Asp Leu Val Val Gly Thr Glu Ala Lys Leu Asn Lys Ser
325 330 335
Ala Val Leu Arg Lys Ala Ile Asp Tyr Ile Arg Phe Leu Gln His Ser
340 345 350
Asn Gln Lys Leu Lys Gln Glu Asn Leu Ser Leu Arg Thr Ala Val His
355 360 365
Lys Ser Lys Ser Leu Lys Asp Leu Val Ser Ala Cys Gly Ser Gly Gly
370 375 380
Asn Thr Asp Val Leu Met Glu Gly Val Lys Thr Glu Val Glu Asp Thr
385 390 395 400
Leu Thr Pro Pro Pro Ser Asp Ala Gly Ser Pro Phe Gln Ser Ser Pro
405 410 415
Leu Ser Leu Gly Ser Arg Gly Ser Gly Ser Gly Gly Ser Gly Ser Asp
420 425 430
Ser Glu Pro Asp Ser Pro Val Phe Glu Asp Ser Lys Ala Lys Pro Glu
435 440 445
Gln Arg Pro Ser Leu His Ser Arg Gly Met Leu Asp Arg Ser Arg Leu
450 455 460
Ala Leu Cys Thr Leu Val Phe Leu Cys Leu Ser Cys Asn Pro Leu Ala
465 470 475 480
Ser Leu Leu Gly Ala Arg Gly Leu Pro Ser Pro Ser Asp Thr Thr Ser
485 490 495
Val Tyr His Ser Pro Gly Arg Asn Val Leu Gly Thr Glu Ser Arg Asp
500 505 510
Gly Pro Gly Trp Ala Gln Trp Leu Leu Pro Pro Val Val Trp Leu Leu
515 520 525
Asn Gly Leu Leu Val Leu Val Ser Leu Val Leu Leu Phe Val Tyr Gly
530 535 540
Glu Pro Val Thr Arg Pro His Ser Gly Pro Ala Val Tyr Phe Trp Arg
545 550 555 560
His Arg Lys Gln Ala Asp Leu Asp Leu Ala Arg Gly Asp Phe Ala Gln
565 570 575
Ala Ala Gln Gln Leu Trp Leu Ala Leu Arg Ala Leu Gly Arg Pro Leu
580 585 590
Pro Thr Ser His Leu Asp Leu Ala Cys Ser Leu Leu Trp Asn Leu Ile
595 600 605
Arg His Leu Leu Gln Arg Leu Trp Val Gly Arg Trp Leu Ala Gly Arg
610 615 620
Ala Gly Gly Leu Gln Gln Asp Cys Ala Leu Arg Val Asp Ala Ser Ala
625 630 635 640
Ser Ala Arg Asp Ala Ala Leu Val Tyr His Lys Leu His Gln Leu His
645 650 655
Thr Met Gly Lys His Thr Gly Gly His Leu Thr Ala Thr Asn Leu Ala
660 665 670
Leu Ser Ala Leu Asn Leu Ala Glu Cys Ala Gly Asp Ala Val Ser Val
675 680 685
Ala Thr Leu Ala Glu Ile Tyr Val Ala Ala Ala Leu Arg Val Lys Thr
690 695 700
Ser Leu Pro Arg Ala Leu His Phe Leu Thr Arg Phe Phe Leu Ser Ser
705 710 715 720
Ala Arg Gln Ala Cys Leu Ala Gln Ser Gly Ser Val Pro Pro Ala Met
725 730 735
Gln Trp Leu Cys His Pro Val Gly His Arg Phe Phe Val Asp Gly Asp
740 745 750
Trp Ser Val Leu Ser Thr Pro Trp Glu Ser Leu Tyr Ser Leu Ala Gly
755 760 765
Asn Pro Val Asp Pro Leu Ala Gln Val Thr Gln Leu Phe Arg Glu His
770 775 780
Leu Leu Glu Arg Ala Leu Asn Cys Val Thr Gln Pro Asn Pro Ser Pro
785 790 795 800
Gly Ser Ala Asp Gly Asp Lys Glu Phe Ser Asp Ala Leu Gly Tyr Leu
805 810 815
Gln Leu Leu Asn Ser Cys Ser Asp Ala Ala Gly Ala Pro Ala Tyr Ser
820 825 830
Phe Ser Ile Ser Ser Ser Met Ala Thr Thr Thr Gly Val Asp Pro Val
835 840 845
Ala Lys Trp Trp Ala Ser Leu Thr Ala Val Val Ile His Trp Leu Arg
850 855 860
Arg Asp Glu Glu Ala Ala Glu Arg Leu Cys Pro Leu Val Glu His Leu
865 870 875 880
Pro Arg Val Leu Gln Glu Ser Glu Arg Pro Leu Pro Arg Ala Ala Leu
885 890 895
His Ser Phe Lys Ala Ala Arg Ala Leu Leu Gly Cys Ala Lys Ala Glu
900 905 910
Ser Gly Pro Ala Ser Leu Thr Ile Cys Glu Lys Ala Ser Gly Tyr Leu
915 920 925
Gln Asp Ser Leu Ala Thr Thr Pro Ala Ser Ser Ser Ile Asp Lys Ala
930 935 940
Val Gln Leu Phe Leu Cys Asp Leu Leu Leu Val Val Arg Thr Ser Leu
945 950 955 960
Trp Arg Gln Gln Gln Pro Pro Ala Pro Ala Pro Ala Ala Gln Gly Thr
965 970 975
Ser Ser Arg Pro Gln Ala Ser Ala Leu Glu Leu Arg Gly Phe Gln Arg
980 985 990
Asp Leu Ser Ser Leu Arg Arg Leu Ala Gln Ser Phe Arg Pro Ala Met
995 1000 1005
Arg Arg Val Phe Leu His Glu Ala Thr Ala Arg Leu Met Ala Gly
1010 1015 1020
Ala Ser Pro Thr Arg Thr His Gln Leu Leu Asp Arg Ser Leu Arg
1025 1030 1035
Arg Arg Ala Gly Pro Gly Gly Lys Gly Gly Ala Val Ala Glu Leu
1040 1045 1050
Glu Pro Arg Pro Thr Arg Arg Glu His Ala Glu Ala Leu Leu Leu
1055 1060 1065
Ala Ser Cys Tyr Leu Pro Pro Gly Phe Leu Ser Ala Pro Gly Gln
1070 1075 1080
Arg Val Gly Met Leu Ala Glu Ala Ala Arg Thr Leu Glu Lys Leu
1085 1090 1095
Gly Asp Arg Arg Leu Leu His Asp Cys Gln Gln Met Leu Met Arg
1100 1105 1110
Leu Gly Gly Gly Thr Thr Val Thr Ser Ser
1115 1120
<210> 18
<211> 1147
<212> PRT
<213> 智人(homo sapien)
<400> 18
Met Asp Glu Pro Pro Phe Ser Glu Ala Ala Leu Glu Gln Ala Leu Gly
1 5 10 15
Glu Pro Cys Asp Leu Asp Ala Ala Leu Leu Thr Asp Ile Glu Asp Met
20 25 30
Leu Gln Leu Ile Asn Asn Gln Asp Ser Asp Phe Pro Gly Leu Phe Asp
35 40 45
Pro Pro Tyr Ala Gly Ser Gly Ala Gly Gly Thr Asp Pro Ala Ser Pro
50 55 60
Asp Thr Ser Ser Pro Gly Ser Leu Ser Pro Pro Pro Ala Thr Leu Ser
65 70 75 80
Ser Ser Leu Glu Ala Phe Leu Ser Gly Pro Gln Ala Ala Pro Ser Pro
85 90 95
Leu Ser Pro Pro Gln Pro Ala Pro Thr Pro Leu Lys Met Tyr Pro Ser
100 105 110
Met Pro Ala Phe Ser Pro Gly Pro Gly Ile Lys Glu Glu Ser Val Pro
115 120 125
Leu Ser Ile Leu Gln Thr Pro Thr Pro Gln Pro Leu Pro Gly Ala Leu
130 135 140
Leu Pro Gln Ser Phe Pro Ala Pro Ala Pro Pro Gln Phe Ser Ser Thr
145 150 155 160
Pro Val Leu Gly Tyr Pro Ser Pro Pro Gly Gly Phe Ser Thr Gly Ser
165 170 175
Pro Pro Gly Asn Thr Gln Gln Pro Leu Pro Gly Leu Pro Leu Ala Ser
180 185 190
Pro Pro Gly Val Pro Pro Val Ser Leu His Thr Gln Val Gln Ser Val
195 200 205
Val Pro Gln Gln Leu Leu Thr Val Thr Ala Ala Pro Thr Ala Ala Pro
210 215 220
Val Thr Thr Thr Val Thr Ser Gln Ile Gln Gln Val Pro Val Leu Leu
225 230 235 240
Gln Pro His Phe Ile Lys Ala Asp Ser Leu Leu Leu Thr Ala Met Lys
245 250 255
Thr Asp Gly Ala Thr Val Lys Ala Ala Gly Leu Ser Pro Leu Val Ser
260 265 270
Gly Thr Thr Val Gln Thr Gly Pro Leu Pro Thr Leu Val Ser Gly Gly
275 280 285
Thr Ile Leu Ala Thr Val Pro Leu Val Val Asp Ala Glu Lys Leu Pro
290 295 300
Ile Asn Arg Leu Ala Ala Gly Ser Lys Ala Pro Ala Ser Ala Gln Ser
305 310 315 320
Arg Gly Glu Lys Arg Thr Ala His Asn Ala Ile Glu Lys Cys Tyr Arg
325 330 335
Ser Ser Ile Asn Asp Lys Ile Ile Glu Leu Lys Asp Leu Val Val Gly
340 345 350
Thr Glu Ala Lys Leu Asn Lys Ser Ala Val Leu Arg Lys Ala Ile Asp
355 360 365
Tyr Ile Arg Phe Leu Gln His Ser Asn Gln Lys Leu Lys Gln Glu Asn
370 375 380
Leu Ser Leu Arg Thr Ala Val His Lys Ser Lys Ser Leu Lys Asp Leu
385 390 395 400
Val Ser Ala Cys Gly Ser Gly Gly Asn Thr Asp Val Leu Met Glu Gly
405 410 415
Val Lys Thr Glu Val Glu Asp Thr Leu Thr Pro Pro Pro Ser Asp Ala
420 425 430
Gly Ser Pro Phe Gln Ser Ser Pro Leu Ser Leu Gly Ser Arg Gly Ser
435 440 445
Gly Ser Gly Gly Ser Gly Ser Asp Ser Glu Pro Asp Ser Pro Val Phe
450 455 460
Glu Asp Ser Lys Ala Lys Pro Glu Gln Arg Pro Ser Leu His Ser Arg
465 470 475 480
Gly Met Leu Asp Arg Ser Arg Leu Ala Leu Cys Thr Leu Val Phe Leu
485 490 495
Cys Leu Ser Cys Asn Pro Leu Ala Ser Leu Leu Gly Ala Arg Gly Leu
500 505 510
Pro Ser Pro Ser Asp Thr Thr Ser Val Tyr His Ser Pro Gly Arg Asn
515 520 525
Val Leu Gly Thr Glu Ser Arg Asp Gly Pro Gly Trp Ala Gln Trp Leu
530 535 540
Leu Pro Pro Val Val Trp Leu Leu Asn Gly Leu Leu Val Leu Val Ser
545 550 555 560
Leu Val Leu Leu Phe Val Tyr Gly Glu Pro Val Thr Arg Pro His Ser
565 570 575
Gly Pro Ala Val Tyr Phe Trp Arg His Arg Lys Gln Ala Asp Leu Asp
580 585 590
Leu Ala Arg Gly Asp Phe Ala Gln Ala Ala Gln Gln Leu Trp Leu Ala
595 600 605
Leu Arg Ala Leu Gly Arg Pro Leu Pro Thr Ser His Leu Asp Leu Ala
610 615 620
Cys Ser Leu Leu Trp Asn Leu Ile Arg His Leu Leu Gln Arg Leu Trp
625 630 635 640
Val Gly Arg Trp Leu Ala Gly Arg Ala Gly Gly Leu Gln Gln Asp Cys
645 650 655
Ala Leu Arg Val Asp Ala Ser Ala Ser Ala Arg Asp Ala Ala Leu Val
660 665 670
Tyr His Lys Leu His Gln Leu His Thr Met Gly Lys His Thr Gly Gly
675 680 685
His Leu Thr Ala Thr Asn Leu Ala Leu Ser Ala Leu Asn Leu Ala Glu
690 695 700
Cys Ala Gly Asp Ala Val Ser Val Ala Thr Leu Ala Glu Ile Tyr Val
705 710 715 720
Ala Ala Ala Leu Arg Val Lys Thr Ser Leu Pro Arg Ala Leu His Phe
725 730 735
Leu Thr Arg Phe Phe Leu Ser Ser Ala Arg Gln Ala Cys Leu Ala Gln
740 745 750
Ser Gly Ser Val Pro Pro Ala Met Gln Trp Leu Cys His Pro Val Gly
755 760 765
His Arg Phe Phe Val Asp Gly Asp Trp Ser Val Leu Ser Thr Pro Trp
770 775 780
Glu Ser Leu Tyr Ser Leu Ala Gly Asn Pro Val Asp Pro Leu Ala Gln
785 790 795 800
Val Thr Gln Leu Phe Arg Glu His Leu Leu Glu Arg Ala Leu Asn Cys
805 810 815
Val Thr Gln Pro Asn Pro Ser Pro Gly Ser Ala Asp Gly Asp Lys Glu
820 825 830
Phe Ser Asp Ala Leu Gly Tyr Leu Gln Leu Leu Asn Ser Cys Ser Asp
835 840 845
Ala Ala Gly Ala Pro Ala Tyr Ser Phe Ser Ile Ser Ser Ser Met Ala
850 855 860
Thr Thr Thr Gly Val Asp Pro Val Ala Lys Trp Trp Ala Ser Leu Thr
865 870 875 880
Ala Val Val Ile His Trp Leu Arg Arg Asp Glu Glu Ala Ala Glu Arg
885 890 895
Leu Cys Pro Leu Val Glu His Leu Pro Arg Val Leu Gln Glu Ser Glu
900 905 910
Arg Pro Leu Pro Arg Ala Ala Leu His Ser Phe Lys Ala Ala Arg Ala
915 920 925
Leu Leu Gly Cys Ala Lys Ala Glu Ser Gly Pro Ala Ser Leu Thr Ile
930 935 940
Cys Glu Lys Ala Ser Gly Tyr Leu Gln Asp Ser Leu Ala Thr Thr Pro
945 950 955 960
Ala Ser Ser Ser Ile Asp Lys Ala Val Gln Leu Phe Leu Cys Asp Leu
965 970 975
Leu Leu Val Val Arg Thr Ser Leu Trp Arg Gln Gln Gln Pro Pro Ala
980 985 990
Pro Ala Pro Ala Ala Gln Gly Thr Ser Ser Arg Pro Gln Ala Ser Ala
995 1000 1005
Leu Glu Leu Arg Gly Phe Gln Arg Asp Leu Ser Ser Leu Arg Arg
1010 1015 1020
Leu Ala Gln Ser Phe Arg Pro Ala Met Arg Arg Val Phe Leu His
1025 1030 1035
Glu Ala Thr Ala Arg Leu Met Ala Gly Ala Ser Pro Thr Arg Thr
1040 1045 1050
His Gln Leu Leu Asp Arg Ser Leu Arg Arg Arg Ala Gly Pro Gly
1055 1060 1065
Gly Lys Gly Gly Ala Val Ala Glu Leu Glu Pro Arg Pro Thr Arg
1070 1075 1080
Arg Glu His Ala Glu Ala Leu Leu Leu Ala Ser Cys Tyr Leu Pro
1085 1090 1095
Pro Gly Phe Leu Ser Ala Pro Gly Gln Arg Val Gly Met Leu Ala
1100 1105 1110
Glu Ala Ala Arg Thr Leu Glu Lys Leu Gly Asp Arg Arg Leu Leu
1115 1120 1125
His Asp Cys Gln Gln Met Leu Met Arg Leu Gly Gly Gly Thr Thr
1130 1135 1140
Val Thr Ser Ser
1145
<210> 19
<211> 1177
<212> PRT
<213> 智人(homo sapien)
<400> 19
Met Asp Glu Pro Pro Phe Ser Glu Ala Ala Leu Glu Gln Ala Leu Gly
1 5 10 15
Glu Pro Cys Asp Leu Asp Ala Ala Leu Leu Thr Asp Ile Glu Gly Glu
20 25 30
Val Gly Ala Gly Arg Gly Arg Ala Asn Gly Leu Asp Ala Pro Arg Ala
35 40 45
Gly Ala Asp Arg Gly Ala Met Asp Cys Thr Phe Glu Asp Met Leu Gln
50 55 60
Leu Ile Asn Asn Gln Asp Ser Asp Phe Pro Gly Leu Phe Asp Pro Pro
65 70 75 80
Tyr Ala Gly Ser Gly Ala Gly Gly Thr Asp Pro Ala Ser Pro Asp Thr
85 90 95
Ser Ser Pro Gly Ser Leu Ser Pro Pro Pro Ala Thr Leu Ser Ser Ser
100 105 110
Leu Glu Ala Phe Leu Ser Gly Pro Gln Ala Ala Pro Ser Pro Leu Ser
115 120 125
Pro Pro Gln Pro Ala Pro Thr Pro Leu Lys Met Tyr Pro Ser Met Pro
130 135 140
Ala Phe Ser Pro Gly Pro Gly Ile Lys Glu Glu Ser Val Pro Leu Ser
145 150 155 160
Ile Leu Gln Thr Pro Thr Pro Gln Pro Leu Pro Gly Ala Leu Leu Pro
165 170 175
Gln Ser Phe Pro Ala Pro Ala Pro Pro Gln Phe Ser Ser Thr Pro Val
180 185 190
Leu Gly Tyr Pro Ser Pro Pro Gly Gly Phe Ser Thr Gly Ser Pro Pro
195 200 205
Gly Asn Thr Gln Gln Pro Leu Pro Gly Leu Pro Leu Ala Ser Pro Pro
210 215 220
Gly Val Pro Pro Val Ser Leu His Thr Gln Val Gln Ser Val Val Pro
225 230 235 240
Gln Gln Leu Leu Thr Val Thr Ala Ala Pro Thr Ala Ala Pro Val Thr
245 250 255
Thr Thr Val Thr Ser Gln Ile Gln Gln Val Pro Val Leu Leu Gln Pro
260 265 270
His Phe Ile Lys Ala Asp Ser Leu Leu Leu Thr Ala Met Lys Thr Asp
275 280 285
Gly Ala Thr Val Lys Ala Ala Gly Leu Ser Pro Leu Val Ser Gly Thr
290 295 300
Thr Val Gln Thr Gly Pro Leu Pro Thr Leu Val Ser Gly Gly Thr Ile
305 310 315 320
Leu Ala Thr Val Pro Leu Val Val Asp Ala Glu Lys Leu Pro Ile Asn
325 330 335
Arg Leu Ala Ala Gly Ser Lys Ala Pro Ala Ser Ala Gln Ser Arg Gly
340 345 350
Glu Lys Arg Thr Ala His Asn Ala Ile Glu Lys Cys Tyr Arg Ser Ser
355 360 365
Ile Asn Asp Lys Ile Ile Glu Leu Lys Asp Leu Val Val Gly Thr Glu
370 375 380
Ala Lys Leu Asn Lys Ser Ala Val Leu Arg Lys Ala Ile Asp Tyr Ile
385 390 395 400
Arg Phe Leu Gln His Ser Asn Gln Lys Leu Lys Gln Glu Asn Leu Ser
405 410 415
Leu Arg Thr Ala Val His Lys Ser Lys Ser Leu Lys Asp Leu Val Ser
420 425 430
Ala Cys Gly Ser Gly Gly Asn Thr Asp Val Leu Met Glu Gly Val Lys
435 440 445
Thr Glu Val Glu Asp Thr Leu Thr Pro Pro Pro Ser Asp Ala Gly Ser
450 455 460
Pro Phe Gln Ser Ser Pro Leu Ser Leu Gly Ser Arg Gly Ser Gly Ser
465 470 475 480
Gly Gly Ser Gly Ser Asp Ser Glu Pro Asp Ser Pro Val Phe Glu Asp
485 490 495
Ser Lys Ala Lys Pro Glu Gln Arg Pro Ser Leu His Ser Arg Gly Met
500 505 510
Leu Asp Arg Ser Arg Leu Ala Leu Cys Thr Leu Val Phe Leu Cys Leu
515 520 525
Ser Cys Asn Pro Leu Ala Ser Leu Leu Gly Ala Arg Gly Leu Pro Ser
530 535 540
Pro Ser Asp Thr Thr Ser Val Tyr His Ser Pro Gly Arg Asn Val Leu
545 550 555 560
Gly Thr Glu Ser Arg Asp Gly Pro Gly Trp Ala Gln Trp Leu Leu Pro
565 570 575
Pro Val Val Trp Leu Leu Asn Gly Leu Leu Val Leu Val Ser Leu Val
580 585 590
Leu Leu Phe Val Tyr Gly Glu Pro Val Thr Arg Pro His Ser Gly Pro
595 600 605
Ala Val Tyr Phe Trp Arg His Arg Lys Gln Ala Asp Leu Asp Leu Ala
610 615 620
Arg Gly Asp Phe Ala Gln Ala Ala Gln Gln Leu Trp Leu Ala Leu Arg
625 630 635 640
Ala Leu Gly Arg Pro Leu Pro Thr Ser His Leu Asp Leu Ala Cys Ser
645 650 655
Leu Leu Trp Asn Leu Ile Arg His Leu Leu Gln Arg Leu Trp Val Gly
660 665 670
Arg Trp Leu Ala Gly Arg Ala Gly Gly Leu Gln Gln Asp Cys Ala Leu
675 680 685
Arg Val Asp Ala Ser Ala Ser Ala Arg Asp Ala Ala Leu Val Tyr His
690 695 700
Lys Leu His Gln Leu His Thr Met Gly Lys His Thr Gly Gly His Leu
705 710 715 720
Thr Ala Thr Asn Leu Ala Leu Ser Ala Leu Asn Leu Ala Glu Cys Ala
725 730 735
Gly Asp Ala Val Ser Val Ala Thr Leu Ala Glu Ile Tyr Val Ala Ala
740 745 750
Ala Leu Arg Val Lys Thr Ser Leu Pro Arg Ala Leu His Phe Leu Thr
755 760 765
Arg Phe Phe Leu Ser Ser Ala Arg Gln Ala Cys Leu Ala Gln Ser Gly
770 775 780
Ser Val Pro Pro Ala Met Gln Trp Leu Cys His Pro Val Gly His Arg
785 790 795 800
Phe Phe Val Asp Gly Asp Trp Ser Val Leu Ser Thr Pro Trp Glu Ser
805 810 815
Leu Tyr Ser Leu Ala Gly Asn Pro Val Asp Pro Leu Ala Gln Val Thr
820 825 830
Gln Leu Phe Arg Glu His Leu Leu Glu Arg Ala Leu Asn Cys Val Thr
835 840 845
Gln Pro Asn Pro Ser Pro Gly Ser Ala Asp Gly Asp Lys Glu Phe Ser
850 855 860
Asp Ala Leu Gly Tyr Leu Gln Leu Leu Asn Ser Cys Ser Asp Ala Ala
865 870 875 880
Gly Ala Pro Ala Tyr Ser Phe Ser Ile Ser Ser Ser Met Ala Thr Thr
885 890 895
Thr Gly Val Asp Pro Val Ala Lys Trp Trp Ala Ser Leu Thr Ala Val
900 905 910
Val Ile His Trp Leu Arg Arg Asp Glu Glu Ala Ala Glu Arg Leu Cys
915 920 925
Pro Leu Val Glu His Leu Pro Arg Val Leu Gln Glu Ser Glu Arg Pro
930 935 940
Leu Pro Arg Ala Ala Leu His Ser Phe Lys Ala Ala Arg Ala Leu Leu
945 950 955 960
Gly Cys Ala Lys Ala Glu Ser Gly Pro Ala Ser Leu Thr Ile Cys Glu
965 970 975
Lys Ala Ser Gly Tyr Leu Gln Asp Ser Leu Ala Thr Thr Pro Ala Ser
980 985 990
Ser Ser Ile Asp Lys Ala Val Gln Leu Phe Leu Cys Asp Leu Leu Leu
995 1000 1005
Val Val Arg Thr Ser Leu Trp Arg Gln Gln Gln Pro Pro Ala Pro
1010 1015 1020
Ala Pro Ala Ala Gln Gly Thr Ser Ser Arg Pro Gln Ala Ser Ala
1025 1030 1035
Leu Glu Leu Arg Gly Phe Gln Arg Asp Leu Ser Ser Leu Arg Arg
1040 1045 1050
Leu Ala Gln Ser Phe Arg Pro Ala Met Arg Arg Val Phe Leu His
1055 1060 1065
Glu Ala Thr Ala Arg Leu Met Ala Gly Ala Ser Pro Thr Arg Thr
1070 1075 1080
His Gln Leu Leu Asp Arg Ser Leu Arg Arg Arg Ala Gly Pro Gly
1085 1090 1095
Gly Lys Gly Gly Ala Val Ala Glu Leu Glu Pro Arg Pro Thr Arg
1100 1105 1110
Arg Glu His Ala Glu Ala Leu Leu Leu Ala Ser Cys Tyr Leu Pro
1115 1120 1125
Pro Gly Phe Leu Ser Ala Pro Gly Gln Arg Val Gly Met Leu Ala
1130 1135 1140
Glu Ala Ala Arg Thr Leu Glu Lys Leu Gly Asp Arg Arg Leu Leu
1145 1150 1155
His Asp Cys Gln Gln Met Leu Met Arg Leu Gly Gly Gly Thr Thr
1160 1165 1170
Val Thr Ser Ser
1175
<210> 20
<211> 1123
<212> PRT
<213> 智人(homo sapien)
<400> 20
Met Asp Cys Thr Phe Glu Asp Met Leu Gln Leu Ile Asn Asn Gln Asp
1 5 10 15
Ser Asp Phe Pro Gly Leu Phe Asp Pro Pro Tyr Ala Gly Ser Gly Ala
20 25 30
Gly Gly Thr Asp Pro Ala Ser Pro Asp Thr Ser Ser Pro Gly Ser Leu
35 40 45
Ser Pro Pro Pro Ala Thr Leu Ser Ser Ser Leu Glu Ala Phe Leu Ser
50 55 60
Gly Pro Gln Ala Ala Pro Ser Pro Leu Ser Pro Pro Gln Pro Ala Pro
65 70 75 80
Thr Pro Leu Lys Met Tyr Pro Ser Met Pro Ala Phe Ser Pro Gly Pro
85 90 95
Gly Ile Lys Glu Glu Ser Val Pro Leu Ser Ile Leu Gln Thr Pro Thr
100 105 110
Pro Gln Pro Leu Pro Gly Ala Leu Leu Pro Gln Ser Phe Pro Ala Pro
115 120 125
Ala Pro Pro Gln Phe Ser Ser Thr Pro Val Leu Gly Tyr Pro Ser Pro
130 135 140
Pro Gly Gly Phe Ser Thr Gly Ser Pro Pro Gly Asn Thr Gln Gln Pro
145 150 155 160
Leu Pro Gly Leu Pro Leu Ala Ser Pro Pro Gly Val Pro Pro Val Ser
165 170 175
Leu His Thr Gln Val Gln Ser Val Val Pro Gln Gln Leu Leu Thr Val
180 185 190
Thr Ala Ala Pro Thr Ala Ala Pro Val Thr Thr Thr Val Thr Ser Gln
195 200 205
Ile Gln Gln Val Pro Val Leu Leu Gln Pro His Phe Ile Lys Ala Asp
210 215 220
Ser Leu Leu Leu Thr Ala Met Lys Thr Asp Gly Ala Thr Val Lys Ala
225 230 235 240
Ala Gly Leu Ser Pro Leu Val Ser Gly Thr Thr Val Gln Thr Gly Pro
245 250 255
Leu Pro Thr Leu Val Ser Gly Gly Thr Ile Leu Ala Thr Val Pro Leu
260 265 270
Val Val Asp Ala Glu Lys Leu Pro Ile Asn Arg Leu Ala Ala Gly Ser
275 280 285
Lys Ala Pro Ala Ser Ala Gln Ser Arg Gly Glu Lys Arg Thr Ala His
290 295 300
Asn Ala Ile Glu Lys Cys Tyr Arg Ser Ser Ile Asn Asp Lys Ile Ile
305 310 315 320
Glu Leu Lys Asp Leu Val Val Gly Thr Glu Ala Lys Leu Asn Lys Ser
325 330 335
Ala Val Leu Arg Lys Ala Ile Asp Tyr Ile Arg Phe Leu Gln His Ser
340 345 350
Asn Gln Lys Leu Lys Gln Glu Asn Leu Ser Leu Arg Thr Ala Val His
355 360 365
Lys Ser Lys Ser Leu Lys Asp Leu Val Ser Ala Cys Gly Ser Gly Gly
370 375 380
Asn Thr Asp Val Leu Met Glu Gly Val Lys Thr Glu Val Glu Asp Thr
385 390 395 400
Leu Thr Pro Pro Pro Ser Asp Ala Gly Ser Pro Phe Gln Ser Ser Pro
405 410 415
Leu Ser Leu Gly Ser Arg Gly Ser Gly Ser Gly Gly Ser Gly Ser Asp
420 425 430
Ser Glu Pro Asp Ser Pro Val Phe Glu Asp Ser Lys Ala Lys Pro Glu
435 440 445
Gln Arg Pro Ser Leu His Ser Arg Gly Met Leu Asp Arg Ser Arg Leu
450 455 460
Ala Leu Cys Thr Leu Val Phe Leu Cys Leu Ser Cys Asn Pro Leu Ala
465 470 475 480
Ser Leu Leu Gly Ala Arg Gly Leu Pro Ser Pro Ser Asp Thr Thr Ser
485 490 495
Val Tyr His Ser Pro Gly Arg Asn Val Leu Gly Thr Glu Ser Arg Asp
500 505 510
Gly Pro Gly Trp Ala Gln Trp Leu Leu Pro Pro Val Val Trp Leu Leu
515 520 525
Asn Gly Leu Leu Val Leu Val Ser Leu Val Leu Leu Phe Val Tyr Gly
530 535 540
Glu Pro Val Thr Arg Pro His Ser Gly Pro Ala Val Tyr Phe Trp Arg
545 550 555 560
His Arg Lys Gln Ala Asp Leu Asp Leu Ala Arg Gly Asp Phe Ala Gln
565 570 575
Ala Ala Gln Gln Leu Trp Leu Ala Leu Arg Ala Leu Gly Arg Pro Leu
580 585 590
Pro Thr Ser His Leu Asp Leu Ala Cys Ser Leu Leu Trp Asn Leu Ile
595 600 605
Arg His Leu Leu Gln Arg Leu Trp Val Gly Arg Trp Leu Ala Gly Arg
610 615 620
Ala Gly Gly Leu Gln Gln Asp Cys Ala Leu Arg Val Asp Ala Ser Ala
625 630 635 640
Ser Ala Arg Asp Ala Ala Leu Val Tyr His Lys Leu His Gln Leu His
645 650 655
Thr Met Gly Lys His Thr Gly Gly His Leu Thr Ala Thr Asn Leu Ala
660 665 670
Leu Ser Ala Leu Asn Leu Ala Glu Cys Ala Gly Asp Ala Val Ser Val
675 680 685
Ala Thr Leu Ala Glu Ile Tyr Val Ala Ala Ala Leu Arg Val Lys Thr
690 695 700
Ser Leu Pro Arg Ala Leu His Phe Leu Thr Arg Phe Phe Leu Ser Ser
705 710 715 720
Ala Arg Gln Ala Cys Leu Ala Gln Ser Gly Ser Val Pro Pro Ala Met
725 730 735
Gln Trp Leu Cys His Pro Val Gly His Arg Phe Phe Val Asp Gly Asp
740 745 750
Trp Ser Val Leu Ser Thr Pro Trp Glu Ser Leu Tyr Ser Leu Ala Gly
755 760 765
Asn Pro Val Asp Pro Leu Ala Gln Val Thr Gln Leu Phe Arg Glu His
770 775 780
Leu Leu Glu Arg Ala Leu Asn Cys Val Thr Gln Pro Asn Pro Ser Pro
785 790 795 800
Gly Ser Ala Asp Gly Asp Lys Glu Phe Ser Asp Ala Leu Gly Tyr Leu
805 810 815
Gln Leu Leu Asn Ser Cys Ser Asp Ala Ala Gly Ala Pro Ala Tyr Ser
820 825 830
Phe Ser Ile Ser Ser Ser Met Ala Thr Thr Thr Gly Val Asp Pro Val
835 840 845
Ala Lys Trp Trp Ala Ser Leu Thr Ala Val Val Ile His Trp Leu Arg
850 855 860
Arg Asp Glu Glu Ala Ala Glu Arg Leu Cys Pro Leu Val Glu His Leu
865 870 875 880
Pro Arg Val Leu Gln Glu Ser Glu Arg Pro Leu Pro Arg Ala Ala Leu
885 890 895
His Ser Phe Lys Ala Ala Arg Ala Leu Leu Gly Cys Ala Lys Ala Glu
900 905 910
Ser Gly Pro Ala Ser Leu Thr Ile Cys Glu Lys Ala Ser Gly Tyr Leu
915 920 925
Gln Asp Ser Leu Ala Thr Thr Pro Ala Ser Ser Ser Ile Asp Lys Ala
930 935 940
Val Gln Leu Phe Leu Cys Asp Leu Leu Leu Val Val Arg Thr Ser Leu
945 950 955 960
Trp Arg Gln Gln Gln Pro Pro Ala Pro Ala Pro Ala Ala Gln Gly Thr
965 970 975
Ser Ser Arg Pro Gln Ala Ser Ala Leu Glu Leu Arg Gly Phe Gln Arg
980 985 990
Asp Leu Ser Ser Leu Arg Arg Leu Ala Gln Ser Phe Arg Pro Ala Met
995 1000 1005
Arg Arg Val Phe Leu His Glu Ala Thr Ala Arg Leu Met Ala Gly
1010 1015 1020
Ala Ser Pro Thr Arg Thr His Gln Leu Leu Asp Arg Ser Leu Arg
1025 1030 1035
Arg Arg Ala Gly Pro Gly Gly Lys Gly Gly Ala Val Ala Glu Leu
1040 1045 1050
Glu Pro Arg Pro Thr Arg Arg Glu His Ala Glu Ala Leu Leu Leu
1055 1060 1065
Ala Ser Cys Tyr Leu Pro Pro Gly Phe Leu Ser Ala Pro Gly Gln
1070 1075 1080
Arg Val Gly Met Leu Ala Glu Ala Ala Arg Thr Leu Glu Lys Leu
1085 1090 1095
Gly Asp Arg Arg Leu Leu His Asp Cys Gln Gln Met Leu Met Arg
1100 1105 1110
Leu Gly Gly Gly Thr Thr Val Thr Ser Ser
1115 1120
<210> 21
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 21
tctccgcatc tacgaccagt ggg 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 22
ccagctgcga gccggttgat agg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 23
ttctccgcat ctacgaccag tgg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 24
agtcccactg gtcgtagatg cgg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 25
cctatcaacc ggctcgcagc tgg 23
<210> 26
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 26
cggagaagct gcctatcaac cgg 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 27
tgcgcttctc tccacggctc tgg 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 28
gcgcttctct ccacggctct ggg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 29
aatcattgag ctcaaggatc tgg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 30
ccttgctgcc agctgcgagc cgg 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 31
agaccggggt gtccctagga agg 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 32
gttccttcct agggacaccc cgg 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 33
gcacagaccg gggtgtccct agg 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 34
gagctcaagg atctggtggt ggg 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 35
tccctaggaa ggaacagatc agg 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 36
tgagctcaag gatctggtgg tgg 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 37
accccggtct gtgcccctgc agg 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 38
gcctgcaggg gcacagaccg ggg 23
<210> 39
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 39
cattgagctc aaggatctgg tgg 23
<210> 40
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 40
ccggctcgca gctggcagca agg 23
<210> 41
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<220>
<223> SREBF1变异附近的指导RNA识别序列
<400> 41
ggagcggtag cacttctcaa tgg 23

Claims (12)

1.一种包含至少15个核苷酸的分离的改变特异性探针或改变特异性引物,其中所述改变特异性探针或改变特异性引物包含与编码人固醇调节元件结合转录因子1(SREBF1)多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下位置的位置:i)根据SEQ ID NO:2的第17,922位或其互补物;ii)根据SEQ ID NO:6的第1,185位或其互补物;iii)根据SEQ ID NO:7的第1,260位或其互补物;iv)根据SEQ ID NO:8的第1,056位或其互补物;v)根据SEQ ID NO:12的第1,185位或其互补物;vi)根据SEQ ID NO:13的第1,260位或其互补物;或vii)根据SEQ ID NO:14的第1,056位或其互补物。
2.一种分离的核酸分子或其互补物,所述分离的核酸分子包含编码人固醇调节元件结合转录因子1(SREBF1)多肽的核苷酸序列,其中所述多肽包含:i)在对应于根据SEQ ID NO:18的第334位的位置处的半胱氨酸或其互补物;ii)在对应于根据SEQ ID NO:19的第364位的位置处的半胱氨酸或其互补物;或iii)在对应于根据SEQ ID NO:20的第310位的位置处的半胱氨酸或其互补物。
3.根据权利要求2所述的核酸分子或其互补物,其中所述多肽包含SEQ ID NO:18、SEQID NO:19或SEQ ID NO:20。
4.一种分离的核酸分子或其互补物,所述分离的核酸分子包含编码人固醇调节元件结合转录因子1(SREBF1)多肽的核苷酸序列,其中所述核苷酸序列包含在对应于根据SEQ IDNO:2的第17,922位的位置处的胸腺嘧啶或其互补物。
5.根据权利要求4所述的分离的核酸分子或其互补物,其中所述核苷酸序列包含SEQID NO:2。
6.一种分离的mRNA分子或其互补物,所述分离的mRNA分子包含编码人固醇调节元件结合转录因子1(SREBF1)多肽的核苷酸序列,其中所述核苷酸序列包含:i)在对应于根据SEQID NO:6的第1,185位的位置处的尿嘧啶或其互补物;ii)在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;或iii)在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物。
7.根据权利要求6所述的分离的mRNA分子或其互补物,其中所述核苷酸序列包含SEQID NO:6、SEQ ID NO:7或SEQ ID NO:8。
8.一种cDNA分子或其互补物,所述cDNA分子包含编码人固醇调节元件结合转录因子1(SREBF1)多肽的核苷酸序列,其中所述核苷酸序列包含:i)在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;ii)在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或iii)在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。
9.根据权利要求8所述的cDNA分子或其互补物,其中所述核苷酸序列包含SEQ ID NO:12、SEQ ID NO:13或SEQ ID NO:14。
10.一种分离的人固醇调节元件结合转录因子1(SREBF1)多肽,其包含SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:20。
11.一种分子复合物,其包含与以下杂交的改变特异性引物或改变特异性探针:
包含编码人SREBF1多肽的核苷酸序列的基因组核酸分子,其中所述改变特异性引物或所述改变特异性探针与在对应于根据SEQ ID NO:2的第17,922位的位置处的胸腺嘧啶或其互补物杂交;
包含编码人SREBF1多肽的核苷酸序列的mRNA分子,其中所述改变特异性引物或所述改变特异性探针与以下杂交:在对应于根据SEQ ID NO:6的第1,185位的位置处的尿嘧啶或其互补物;在对应于根据SEQ ID NO:7的第1,260位的位置处的尿嘧啶或其互补物;或在对应于根据SEQ ID NO:8的第1,056位的位置处的尿嘧啶或其互补物;或
包含编码人SREBF1多肽的核苷酸序列的cDNA分子,其中所述改变特异性引物或所述改变特异性探针与以下杂交:在对应于根据SEQ ID NO:12的第1,185位的位置处的胸腺嘧啶或其互补物;在对应于根据SEQ ID NO:13的第1,260位的位置处的胸腺嘧啶或其互补物;或在对应于根据SEQ ID NO:14的第1,056位的位置处的胸腺嘧啶或其互补物。
12.根据权利要求11所述的分子复合物,其进一步包含非人类聚合酶。
CN202080030927.3A 2019-03-20 2020-03-19 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高 Active CN113727732B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310867404.XA CN116889627A (zh) 2019-03-20 2020-03-19 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962820893P 2019-03-20 2019-03-20
US62/820,893 2019-03-20
US201962879138P 2019-07-26 2019-07-26
US62/879,138 2019-07-26
PCT/US2020/023532 WO2020191141A1 (en) 2019-03-20 2020-03-19 Treatment of increased lipid levels with sterol regulatory element binding transcription factor 1 (srebf1) inhibitors

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310867404.XA Division CN116889627A (zh) 2019-03-20 2020-03-19 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高

Publications (2)

Publication Number Publication Date
CN113727732A CN113727732A (zh) 2021-11-30
CN113727732B true CN113727732B (zh) 2023-08-08

Family

ID=70289471

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310867404.XA Pending CN116889627A (zh) 2019-03-20 2020-03-19 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高
CN202080030927.3A Active CN113727732B (zh) 2019-03-20 2020-03-19 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310867404.XA Pending CN116889627A (zh) 2019-03-20 2020-03-19 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高

Country Status (6)

Country Link
US (2) US11504390B2 (zh)
EP (1) EP3942048A1 (zh)
JP (1) JP2022525545A (zh)
CN (2) CN116889627A (zh)
CA (1) CA3133000A1 (zh)
WO (1) WO2020191141A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4259279A1 (en) * 2020-12-14 2023-10-18 Regeneron Pharmaceuticals, Inc. Methods of treating metabolic disorders and cardiovascular disease with inhibin subunit beta e (inhbe) inhibitors

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5688787A (en) 1991-07-23 1997-11-18 Schering Corporation Substituted β-lactam compounds useful as hypochlesterolemic agents and processes for the preparation thereof
CA2131184A1 (en) 1992-04-03 1993-10-14 Jan Willem Hubert Smeets Selective n-acylation of amino alcohols
LT3595B (en) 1993-01-21 1995-12-27 Schering Corp Spirocycloalkyl-substituted azetidinones useful as hypocholesterolemic agents
US5631365A (en) 1993-09-21 1997-05-20 Schering Corporation Hydroxy-substituted azetidinone compounds useful as hypocholesterolemic agents
FR2710337B1 (fr) 1993-09-23 1995-12-08 Gerard Coquerel Procédé de dédoublement de deux antipodes optiques par entraînement polythermique programmé et autoensemencé.
US5624920A (en) 1994-11-18 1997-04-29 Schering Corporation Sulfur-substituted azetidinone compounds useful as hypocholesterolemic agents
US5633246A (en) 1994-11-18 1997-05-27 Schering Corporation Sulfur-substituted azetidinone compounds useful as hypocholesterolemic agents
US5656624A (en) 1994-12-21 1997-08-12 Schering Corporation 4-[(heterocycloalkyl or heteroaromatic)-substituted phenyl]-2-azetidinones useful as hypolipidemic agents
US5756470A (en) 1996-10-29 1998-05-26 Schering Corporation Sugar-substituted 2-azetidinones useful as hypocholesterolemic agents
US6602710B1 (en) 1998-08-27 2003-08-05 Chugai Seiyaku Kabushiki Kaisha Screening method for SREBP pathway-specific inhibitors
GB9916757D0 (en) 1999-07-17 1999-09-15 Glaxo Group Ltd Method
DK1345895T3 (da) 2000-12-21 2007-05-07 Sanofi Aventis Deutschland Hidtil ukendt diphenylazetidioner, fremgangsmåde til deres fremstilling, lægemidler indeholdende disse forbindelser og deres anvendelse til behandling af lipidstofskifteforstyrrelser
TWI291957B (en) 2001-02-23 2008-01-01 Kotobuki Pharmaceutical Co Ltd Beta-lactam compounds, process for repoducing the same and serum cholesterol-lowering agents containing the same
US20080249040A1 (en) * 2001-05-18 2008-10-09 Sirna Therapeutics, Inc. RNA interference mediated inhibition of sterol regulatory element binding protein 1 (SREBP1) gene expression using short interfering nucleic acid (siNA)
WO2003008625A2 (en) 2001-07-20 2003-01-30 Incyte Genomics, Inc. Structural and cytoskeleton-associated proteins
US20050014177A1 (en) 2003-05-19 2005-01-20 Koustubh Ranade Human sterol response element binding protein 1 (SREBP1) single nucleotide polymorphisms
JP5431940B2 (ja) 2006-09-18 2014-03-05 アルナイラム ファーマシューティカルズ, インコーポレイテッド SCAPのRNAi調節およびその治療的使用
US9187746B2 (en) 2009-09-22 2015-11-17 Alnylam Pharmaceuticals, Inc. Dual targeting siRNA agents
US20170002421A1 (en) 2013-12-23 2017-01-05 The General Hospital Corporation Methods and assays for determining reduced brca1 pathway function in a cancer cell
WO2017100542A1 (en) 2015-12-10 2017-06-15 Alnylam Pharmaceuticals, Inc. Sterol regulatory element binding protein (srebp) chaperone (scap) irna compositions and methods of use thereof
CN105441454B (zh) 2015-12-23 2018-12-11 北京大学人民医院 Scap基因突变体及其应用
ES2938626T3 (es) 2016-05-03 2023-04-13 Lonza Ag Modulación del metabolismo de los lípidos para la producción de proteínas
JP2021511029A (ja) * 2018-01-18 2021-05-06 ロシュ イノベーション センター コペンハーゲン エーエス Srebp1を標的とするアンチセンスオリゴヌクレオチド
MX2020007956A (es) 2018-01-29 2021-01-08 Capulus Therapeutics Llc Inhibidores de la proteína de unión al elemento regulador de esterol (srebp) que comprenden un anillo central de 6 miembros.
WO2019186558A1 (en) 2018-03-29 2019-10-03 Technion Research And Development Foundation Limited Vesicles comprising a pten inhibitor and uses of same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Effects of SREBF-1a and SCAP polymorphisms on plasma levels of lipids,severity,progression and regression of coronary atherosclerosis and response to therapy with fluvastatin";LORRAINE SALEK ET AL;《JOURNAL OF MOLECULAR MEDICINE》;20020911;第80卷(第11期);737-744 *

Also Published As

Publication number Publication date
CN113727732A (zh) 2021-11-30
US20230263821A1 (en) 2023-08-24
EP3942048A1 (en) 2022-01-26
JP2022525545A (ja) 2022-05-17
CN116889627A (zh) 2023-10-17
US11504390B2 (en) 2022-11-22
US20200297752A1 (en) 2020-09-24
WO2020191141A1 (en) 2020-09-24
CA3133000A1 (en) 2020-09-24

Similar Documents

Publication Publication Date Title
KR101866152B1 (ko) 종양 억제 유전자에 대한 천연 안티센스 전사체의 억제에 의해 종양 억제 유전자 관련된 질환의 치료
US20220411870A1 (en) Treatment Of Obesity With G-Protein Coupled Receptor 75 (GPR75) Inhibitors
CN113727732B (zh) 用固醇调节元件结合转录因子1(srebf1)抑制剂治疗脂质水平升高
US11713461B2 (en) Treatment of decreased bone mineral density with zinc and ring finger 3 (ZNRF3) inhibitors
CN117396499A (zh) 用神经源性位点Notch同源蛋白3(NOTCH3)剂治疗脑血管疾病
CA2826522A1 (en) Genetic polymorphism in pnlpa3 associated with liver fibrosis methods of detection and uses thereof
WO2023034761A1 (en) Treatment of liver diseases with camp responsive element binding protein 3 like 3 (creb3l3) inhibitors
KR20240043753A (ko) Wnt 패밀리 구성원 5B(WNT5B) 저해제를 사용한 감소된 골밀도의 치료
KR20240043752A (ko) 막횡단 단백질 1(kremen1) 억제제를 함유하는 크링글을 사용하여 감소된 골밀도를 치료하는 방법
CN113825839A (zh) 用固醇调节元件结合蛋白切割激活蛋白(scap)抑制剂治疗脂质水平升高
KR20240031334A (ko) 용질 담체 계열 27 구성원 3 (slc27a3) 억제제를 이용한 천식 치료 방법
US20230034093A1 (en) Treatment Of Cognitive Impairment With Alpha-N-Acetylgalactosaminide Alpha-2,6-Sialyltransferase 5 (ST6GALNAC5) Inhibitors
CN114846157A (zh) 腺苷酸环化酶7(adcy7)变体及其用途
WO2023278694A1 (en) Treatment of hypertension with solute carrier family 9 isoform a3 regulatory factor 2 (slc9a3r2) inhibitors
WO2023137265A1 (en) Triggering receptor expressed on myeloid cells 2 (trem2) variants and uses thereof in treating alzheimer&#39;s disease
CN114222588A (zh) 巨噬细胞刺激1受体(mst1r)变体及其用途
CN115667548A (zh) 含有Kelch结构域的7B(KLHDC7B)变体及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant