CN114207133A - 使用gata1基因疗法用于治疗dba的组合物和方法 - Google Patents

使用gata1基因疗法用于治疗dba的组合物和方法 Download PDF

Info

Publication number
CN114207133A
CN114207133A CN202080056795.1A CN202080056795A CN114207133A CN 114207133 A CN114207133 A CN 114207133A CN 202080056795 A CN202080056795 A CN 202080056795A CN 114207133 A CN114207133 A CN 114207133A
Authority
CN
China
Prior art keywords
sequence
nucleic acid
acid sequence
seq
gata1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080056795.1A
Other languages
English (en)
Inventor
维杰·G·桑卡兰
理查德·A·沃伊特
莱夫·S·路德维希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Childrens Medical Center Corp
Original Assignee
Childrens Medical Center Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Childrens Medical Center Corp filed Critical Childrens Medical Center Corp
Publication of CN114207133A publication Critical patent/CN114207133A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/1703Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • A61K38/1709Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/48Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Diabetes (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Microbiology (AREA)
  • Toxicology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文描述的是与用于治疗Diamond‑Blackfan贫血的GATA‑1基因疗法相关的方法和组合物。

Description

使用GATA1基因疗法用于治疗DBA的组合物和方法
相关申请的交叉引用
根据35 U.S.C.§119(e),本申请要求2019年6月10日提交的美国临时申请号62/859,369的权益,以引用的方式将其内容整体并入本文。
政府支持
本发明是在由美国国立卫生研究院授予的基金号:R1 DK103794和R33 HL120791的政府支持下完成的。美国政府对本发明享有一定的权利。
序列表
本申请包含已以ASCII格式用电子方式提交的序列表,并在此以引用的方式将其整体并入。所述ASCII副本创建于2020年6月3日,名为701039-094470WOPT_SL.txt,大小为188,598字节。
技术领域
本文描述的技术涉及用于治疗Diamond-Blackfan贫血的GATA-1基因疗法的组合物和方法及其用途。
背景技术
Diamond-Blackfan贫血(DBA)是一组罕见的遗传性骨髓衰竭综合征(IBMFS)之一,其特征在于红细胞衰竭、存在先天异常和癌症易感性。DBA通常在儿童生命的第一年被诊断出来。患有DBA的儿童无法制造足够的红血细胞,该细胞将氧携带至身体的所有其它细胞。在患有DBA的儿童中,许多将会变成红血细胞的细胞在其发育之前死亡。除了为遗传性骨髓衰竭综合征之外,DBA还被归类为核糖体病,因为在超过50%的病例中,该综合征似乎是由小亚基或大亚基相关的核糖体蛋白二者之一的单倍不足(haploinsufficiency)引起的。
DBA的特征在于红血(红系)细胞及其前体的产生特异性减少,而其它造血谱系没有缺陷。在过去十年中,核糖体蛋白基因RPS19的突变的阐明和随后9个其它核糖体蛋白基因的突变的发现产生了DBA是核糖体生物发生紊乱的假设。然而,尽管在这些病例中对所有核糖体蛋白和其它候选基因进行了系统测序,但有约50%的DBA病例具有尚未鉴别的分子突变。
GATA-1基因位于X染色体并编码调控红细胞发育的转录因子。最近,在Diamond-Blackfan贫血(DBA)患者中发现了GATA-1中的功能丧失突变。然而,目前还没有专门针对红系细胞中的GATA-1增强的治疗。因此,需要直接针对红系细胞中GATA-1功能障碍的治疗方法以提供有效的治疗。
发明内容
最近的研究表明,红系细胞中GATA-1增强可能对Diamond-Blackfan贫血(DBA)具有治疗作用。然而,在体内增加包括GATA-1在内的治疗性蛋白质的谱系特异性表达仍然具有挑战性。尝试用现有技术增加GATA1表达必然增加细胞(例如HSC)中GATA1的表达,在此情况下,它对受试者是极大的危害,否定了任何可能的治疗效果。
如本文所述,本发明人鉴别出专门在早期红系祖细胞中而不是在造血干细胞中增加GATA1的谱系特异性表达的组合物和方法,以作为用于治疗Diamond-Blackfan贫血的基因治疗方法。DBA的特征在于红血(红系)细胞及其前体的产生特异性减少,而其它造血谱系没有缺陷。
在任意实施方式的一个方面,本文描述了核酸序列,所述核酸序列包含至少一个异源调控序列以及编码GATA结合因子1(GATA1)多肽的序列,所述异源调控序列选自于造血增强子元件和用于HSC限制性miRNA的miRNA结合位点。
在任意方面的一些实施方式中,所述核酸序列包含至少一个造血增强子元件。
在任意方面的一些实施方式中,所述增强子元件包含与选自于由以下序列所组成的组中的核苷酸序列具有至少80%同源性的序列:SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:38和/或SEQ ID NO:39。
在任意方面的一些实施方式中,所述增强子元件包含选自于由以下所组成的组的基因的增强子元件:Kell金属内肽酶(KEL);5'氨基乙酰丙酸合酶2(ALAS2);和血型糖蛋白A(GYPA)。
在任意方面的一些实施方式中,所述核酸序列包含用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
在任意方面的一些实施方式中,用于至少一个HSC限制性miRNA的至少一个miRNA结合位点选自于由以下所组成的组:用于miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126miR126、miR181、miR193、miR223T、miR542和let7e的miR结合位点。
在任意方面的一些实施方式中,所述核酸序列包含至少一个造血增强子元件以及用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
在任意方面的一些实施方式中,包含:a.异源5'UTR,所述异源5'UTR包含:i.除GATA1以外的造血转录因子的5'UTR序列,ii.至少20个核苷酸的序列,和/或iii.1-25个上游密码子uAUG;和/或b.造血增强子微小基因(minigene)。
在任意实施方式的一个方面,本文描述了包含5'UTR和编码GATA结合因子1(GATA1)多肽的序列的核酸序列,所述5'UTR包含:i.除GATA1以外的造血转录因子的5'UTR序列;ii.至少20个核苷酸的序列;和/或iii.1-25个上游密码子uAUG。
在任意方面的一些实施方式中,所述5'UTR包含选自于由以下所组成的组的基因的5'UTR:Runt相关转录因子1(RUNX1)、LIM Domain Only 2(LMO2)或ETS变体6(ETV6)。
在任意方面的一些实施方式中,所述核酸序列进一步包含至少一个造血增强子元件、用于HSC限制性miRNA的miRNA结合位点和/或造血增强子微小基因(G1HEM)。
在任意实施方式的一个方面,本文描述了包含造血增强子微小基因(G1HEM)、编码GATA结合因子1(GATA1)多肽的序列的核酸序列。
在任意方面的一些实施方式中,造血增强子微小基因(mG1HEM)包含与核苷酸序列SEQ ID NO:13具有至少80%同源性的序列。
在任意方面的一些实施方式中,所述核酸序列进一步包含5'UTR、和/或至少一个造血增强子元件、和/或用于HSC限制性miRNA的至少一个miRNA结合位点,所述5'UTR包含:i.除GATA1以外的造血转录因子的5'UTR序列;ii.至少20个核苷酸的序列;和/或iii.1-25个上游密码子uAUG。
在任意方面的一些实施方式中,所述核酸序列进一步包含5'UTR、至少一个造血增强子元件和/或用于HSC限制性miRNA的至少一个miRNA结合位点,所述5'UTR包含选自于由Runt相关转录因子1(RUNX1)组成的组的基因的5'UTR。
在任意方面的一些实施方式中,所述核酸序列包含与a和b的元件可操作地连接的启动子。
在任意方面的一些实施方式中,所述启动子不为GATA1启动子。
在任意方面的一些实施方式中,所述启动子包含延伸因子1-α1(eEF1a1)的启动子序列。
在任意方面的一些实施方式中,编码GATA结合因子1(GATA1)多肽的序列包含与编码人GATA1多肽的核苷酸序列具有至少60%序列同一性的序列。
在任意方面的一些实施方式中,所述核酸序列包含:与编码GATA1多肽的序列可操作地连接的转录后调控元件。
在任意方面的一些实施方式中,所述转录后调控元件包括土拨鼠肝炎病毒转录后调控元件(WPRE)。
在任意方面的一些实施方式中,所述核酸序列进一步包含内部核糖体进入位点。
在任意方面的一些实施方式中,所述内部核糖体进入位点与标志物基因可操作地连接,并且其中,所述标志物基因编码光学可见的蛋白质或酶。
在任意方面的一些实施方式中,所述序列包含选自于SEQ ID NO 8、SEQ ID NO 9和SEQ ID NO 62的序列。
在任意方面的一些实施方式中,所述核酸序列为载体。
在任意方面的一些实施方式中,所述载体为质粒、或腺病毒载体、慢病毒载体或逆转录病毒载体。
在任意实施方式的一个方面,本文描述了包含所述核酸序列的慢病毒颗粒。
在任意实施方式的一个方面,本文描述了包含核酸序列或颗粒以及药学上可接受的运载体的组合物。
在任意实施方式的一个方面,本文描述了治疗有需要的受试者中的Diamond-Blackfan贫血的方法,所述方法包括向患者给予治疗有效量的核酸序列、颗粒或组合物。
在任意实施方式的一个方面,本文描述了恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述方法包括使包含早期红系祖细胞的细胞群与核酸序列、颗粒或组合物接触。
在任意方面的一些实施方式中,所述早期红系祖细胞包含DBA相关的基因突变。
在任意实施方式的一个方面,本文描述了本文所述的核酸序列、颗粒或组合物用于治疗有需要的受试者中的Diamond-Blackfan贫血的用途。
附图说明
图1描绘了参与Diamond-Blackfan贫血(DBA)发病机制的分子途径的示意图。
图2A、图2B和图2C证明了降低的核糖体水平以及DBA分子病变。
图3证明了来自具有RP基因突变的DBA患者(此处示出的患者中存在RPS19、RPL5和RPL35A突变)的造血干细胞(HSPC)中GATA1表达水平降低。
图4A、图4B和图4C证明了通过GATA1慢病毒转导在DBA患者HSPC中挽救红系谱系定型(commitment)和分化(通过形态学评估,图4B)以及终末分化标志物(图4C;底部)。图4A.示出的三名患者在RPS19(患者2和患者3)和RPL35A(患者1)处有突变。
图5描绘了允许受调控的GATA1表达的要求保护的载体的示意图。内源性GATA1基因座示出于上方,以及下方示出了pRRL.PPT.EFS载体(包括具有安全性修饰的自我灭活型长末端重复元件[LTR]和土拨鼠肝炎病毒转录后调控元件)。所述载体包含内源性GATA1启动子或短EF1α(EFS)启动子二者之一。GATA1 cDNA经密码子优化以改善表达。图5按出现顺序分别公开了SEQ ID NO 67-SEQ ID NO 69。
图6描绘了要求保护的GATA1载体在原代人造血细胞中使用的示意图。
图7描绘了在早期红系祖细胞中而不是在造血干细胞中实现GATA1发育忠实型(developmentally faithful)表达的载体的各种组合的示意图。
图8A和图8B示出了人GATA1的基因组图和两个载体的示意图。图8A证明了人GATA1上游的染色质可及性。图8B.两个载体在早期红系祖细胞中而不是在造血干细胞中实现GATA1的发育忠实型表达。
图9A、图9B、图9C、图9D和图9E描绘了包括对照载体的五种载体,以在早期红系祖细胞中而不是在造血干细胞中实现GATA1的发育忠实型表达。图9A.R18 EF-1αIRES GFP对照。图9B.R21 EF-1αIRES GFP miR126。图9C.R49 EF-1α1peak增强子GFP。图9D.R50 3Peak增强子GFP。图9E.具有增强子和miR126结合位点的GATA1载体。
图10示出了用R18 EF-1αIRES GFP对照转染的细胞在体外分化期间,CD71和CD235a的第4天、第9天和第11天的FACS分析图。随着细胞从第1象限移动到第4象限,它们在红系谱系中逐渐成熟。
图11示出了用R21 EF-1αIRES GFP转染的细胞的FACS分析图。
图12示出了用R21 EF-1αIRES GFP miR126转染的细胞的FACS分析图。
图13示出了用R49 EF-1α1peak增强子GFP转染的细胞的FACS分析图。
图14示出了用R49 EF-1α3peak增强子GFP转染的细胞的FACS分析图。
图15示出了用R18 EF-1αIRES GFP对照、R21 EF-1αIRES GFP miR126、R49 EF-1α1peak增强子GFP、R50 3Peak增强子GFP转染的细胞的FACS分析图。
图16证明了人GATA增强子的R50 3Peak增强子GFP优先驱动红系转基因表达而不是CD34+细胞。
图17描绘了使用miR126、miR223T、1peak、3peak、1peak-miR126、1peak-miR223T、3peak-miR126、3peak-miR223T、和Ef1a-GFP的HSC d4的FACS分析图。实验概述:D0:将CD34+细胞解冻到SSII+cc100+TPO,在5%O2下培养。D2:慢病毒感染,在SSII+cc100+TPO中过夜复苏。HSC D3:分开培养,一半在HSC条件下,一半在RBC分化条件下。HSC D4和D7:通过流式细胞术分析。RBC D4:通过流式细胞术分析(每3-4天继续)。
图18A和图18B示出了描绘在第4天(图18A)和第7天(图18B)CD34+CD38-CD45RA-CD90+亚群中的GFP表达的柱状图。
图19描绘了使用miR126、miR223T、1peak、3peak、1peak-miR126、1peak-miR223T、3peak-miR126、3peak-miR223T、和Ef1a-GFP的RBC D4的FACS分析图。
图20示出了描绘CD71+CD235+的RBC d4的GFP表达的柱状图。
图21描绘了红系亚群CD71-CD235-、CD71+CD235-和CD71+CD235+中GFP的%。
图22示出了描绘RBC相对于HSC的%GFP倍数增加的柱状图。示出了Ef1a-GFP、miR126、miR223T、1peak、3peak、1peak-miR126、1peak-miR223T、3peak-miR126和3peak-miR223T的结果。
图23示出了RPS19敲低损害红系分化的FACS分析图。实验概述:D0:将细胞解冻至I期培养基中。D2:用shRNA lenti+/-GATA1表达构建体进行旋转感染(spinfect)。D4:开始puro选择。D6:移除puro。D7流式分析。
图24示出了通过GATA1过表达挽救的RPS19敲低的FACS分析图。
图25示出了通过GATA1过表达挽救的RPS19敲低的FACS分析图。
图26示出了描绘EF1a-GFP、EF1a-GATA-IRES-GFP、1peak-GATA-GFP、3peak-GATA-GFP和HMD-GATA-GFP的CD235+/CD235-水平的柱状图。
图27示出了描绘GATA1基因疗法载体治愈DBA的关键特征和实验验证的总结的示意图。
图28A、图29B、图28C和图28D示出了GATA1发育上受调控表达体外挽救DBA表型。图28A.从HSPC到网织红细胞按降序排列的人GATA1上游的可接近的染色质(顶部)和慢病毒载体实现受调控的GATA1表达的示意图(底部)。图28B.在原代人HSPC中RPS19的shRNA敲低损害红系发育,并被GATA1表达挽救。图28C.鼠类G1E细胞的红系分化通过受调控的GATA1表达而实现。图28D.与HSC相比,红系祖细胞中的GFP比率显示出发育上受调控的表达。
图29A、图29B和图29C示出了红系分化期间的外源性GATA1的表达。图29A.红系前体的分化首先表达CD71,然后是CD235,最后在终末红系分化过程中丧失CD71。图29B.在感染GATA1病毒后,第4天表达CD71(深灰色)或CD71和CD235两者(浅灰色)的红系祖细胞的百分比较高。图29C.与CD71+CD235+细胞相比,CD71-CD235+细胞的GFP表达比率揭示了hG1E在终末红系分化期间的表达降低,模拟了内源性GATA1表达。
图30A和图30B。RPS19编辑后受调控的GATA1挽救红系模块。图30A.GATA1感染后,也表达CD235的CD71+细胞的比例较高。图30B.受调控的GATA1促进红系集落形成。
具体实施方式
如本文所述,红系细胞中GATA-1增强可在Diamond-Blackfan贫血(DBA)中具有治疗作用。然而,增加红系细胞中GATA-1表达的现有方法也必然增加在其它细胞类型中的表达(例如在造血干细胞中)。这些脱靶效应会导致破坏性的副作用,并且必须避免,以便为受试者提供实际治疗。也就是说,在体内增加包括GATA-1在内的治疗性蛋白质的谱系特异性表达已被证明具有挑战性,且尚未成功完成。
如本文所述,本发明人鉴别出包含可恢复早期红系祖细胞特异性GATA1表达的调控序列的核酸序列,从而允许对DBA治疗的方法。简而言之,本文所述的方法涉及作为DBA的疗法在早期红系祖细胞中而不是在造血干细胞中增加GATA1的谱系特异性表达的组合物和方法。更具体而言,本文描述了通过使早期红系祖细胞群与如本文所述的核酸序列、颗粒或组合物接触来恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述早期红系祖细胞群包括但不限于包含DBA相关基因突变的细胞。
DBA的特征在于红血(红系)细胞及其前体的产生特异性减少,而其它造血谱系没有缺陷。本文提供了治疗有需要的受试者中Diamond-Blackfan贫血的方法,该方法包括给予治疗有效量的如本文所述的核酸序列、颗粒或组合物,包括但不限于用于开发广泛适用于DBA患者的造血基因治疗方法的具有特定基因调控元件的载体。
此外,本文提供了恢复早期红系祖细胞细胞特异性GATA1表达的方法,该方法包括使包含早期红系祖细胞的细胞群与如本文所述的核酸序列、颗粒或组合物接触。
Diamond-Blackfan贫血(DBA)是通常在婴儿期出现的先天性红系发育不全。DBA导致红血细胞计数低(贫血),而不显著影响其它血液成分(血小板和白血细胞)。约47%的受影响个体同时具有多种先天异常,包括颅面畸形、拇指或上肢异常、心脏缺陷、泌尿生殖系统畸形和腭裂。有时观测到低出生体重和普遍的生长延迟。DBA患者具有发生白血病和其它恶性肿瘤的适度风险。
DBA的特征在于红血(红系)细胞及其前体的产生特异性减少,而其它造血谱系没有缺陷。在超过50%的病例中,DBA由编码核糖体蛋白的11个基因(包括RPL5、RPL11、RPL35A、RPS10、RPS17、RPS19、RPS24和RPS26基因)之一中的杂合性功能丧失突变(heterozygous loss-of-function mutations)(单倍不足)引起。这些和其它与Diamond-Blackfan贫血相关的基因为制造核糖体蛋白提供了指导。大约25%的患Diamond-Blackfan贫血的个体的RPS19基因具有突变。大约另外25%到35%的患有此紊乱的个体在RPL5、RPL11、RPL35A、RPS10、RPS17、RPS24或RPS26基因中具有突变。任何这些基因的突变都被认为导致关于核糖体功能的问题。令人惊讶的是,此类泛在表达的核糖体蛋白的突变导致此种特定的人紊乱。研究表明,功能性核糖体短缺可能会增加骨髓中造血细胞的自我毁灭,从而导致贫血。细胞分裂的异常调控或凋亡的不当触发可能会带来影响一些具有Diamond-Blackfan贫血的人的其它健康问题。已经提出了关于这些疾病的根本的发病机制的许多理论。然而,这些模型无法解释DBA和其它核糖体紊乱的精细细胞类型特异性。
核糖体蛋白的单倍不足可引起人的其它细胞类型特异性疾病,包括先天性无脾和T细胞淋巴细胞性白血病。令人惊讶的是,此类泛在表达的核糖体蛋白的突变导致此类特定的人紊乱。已经提出了关于这些疾病的根本的发病机制的许多理论。然而,这些模型无法解释DBA和其它核糖体疾病的精细细胞类型特异性。
在各种实施方式中,本文描述了恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述方法包括使包含早期红系祖细胞的细胞群与如本文所述的核酸序列、颗粒或组合物接触。此外,预期本文所述的核酸序列、颗粒或组合物可用于通过向有需要治疗DBA的患者给予治疗有效量的如本文所述的核酸序列、颗粒或组合物来治疗DBA。
如本文所用,“GATA-1”、“GATA1”或“GATA结合蛋白1”是由GATA1基因编码的蛋白。由该基因编码的蛋白是GATA转录因子家族的蛋白质。该蛋白通过调控胎儿血红蛋白向成人血红蛋白的转换从而在红系发育中发挥重要作用。GATA1基因位于X染色体(Xp11.23),且编码调控红细胞发育的转录因子。GATA-1中的功能丧失突变与造血紊乱有关,包括DBA。
GATA-1多肽具有三个功能结构域:N-末端反式激活结构域(TD)(其对转录激活活性必不可少),N-末端锌指(NF),以及C-末端锌指(CF)(其负责与DNA结合)。在患有红细胞生成异常性贫血、血小板减少、地中海贫血和红细胞生成性卟啉症的家族中鉴别到了外显子4的突变。还描述了相关的种系突变。DBA中GATA-1的功能丧失突变发生在GATA-1基因外显子2的供体剪接位点,且导致外显子跳跃。
许多种类的GATA1序列是已知的,例如人GATA1(GATA1 NCBI Gene ID为2623)mRNA序列(例如NM_002049.3、XM_011543897.2、XM_011543898.2和XM_024452363.1)和多肽序列(例如NP_002040.1、XP_011542199.1、XP_011542200.1、XP_024308131.1)是本领域已知的。这些序列连同任意天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,GATA1核酸包括或源自具有以下核酸序列CCDS14305.1(SEQ ID NO:1)的人GATA1。
Figure BDA0003499981180000111
在任意方面的一些实施方式中,GATA1 mRNA序列包括或源自具有以下序列NM_002049.3(SEQ ID NO:2)的人GATA1:
Figure BDA0003499981180000121
在任意方面的一些实施方式中,GATA1 mRNA序列包括或源自具有以下序列XM_011543898.2(SEQ ID NO:3)的人GATA1:
Figure BDA0003499981180000131
在任意方面的一些实施方式中,GATA1 mRNA序列包括或源自具有以下序列XM_024452363.1(SEQ ID NO:4)的人GATA1:
Figure BDA0003499981180000132
Figure BDA0003499981180000141
在任意方面的一些实施方式中,GATA1 mRNA序列包括或源自具有以下序列XM_011543897.2(SEQ ID NO:5)的人GATA1:
Figure BDA0003499981180000142
在任意方面的一些实施方式中,GATA1多肽包括或源自具有以下氨基酸序列NP_002040.1(SEQ ID NO:6)的人GATA1:
Figure BDA0003499981180000151
在任意方面的一些实施方式中,GATA1多肽包括或源自具有以下氨基酸序列XP_011542199.1(SEQ ID NO:7)的人GATA1:
Figure BDA0003499981180000152
在任意方面的一些实施方式中,GATA1多肽包括或源自具有以下氨基酸序列XP_011542200.1(SEQ ID NO:64)的人GATA1:
Figure BDA0003499981180000153
在任意方面的一些实施方式中,GATA1多肽包括或源自具有以下氨基酸序列XP_024308131.1(SEQ ID NO:65)的人GATA1:
Figure BDA0003499981180000154
在任意方面的一些实施方式中,编码GATA结合因子1(GATA1)多肽的序列包含与编码人GATA1多肽的核苷酸序列具有至少60%序列同一性。在任意方面的一些实施方式中,编码GATA结合因子1(GATA1)多肽的序列包含编码人GATA1多肽的核苷酸序列。
在任意方面的一些实施方式中,编码GATA1多肽的序列包含以下序列、由以下序列组成或基本上由以下序列组成:选自于SEQ ID NO:1-SEQ ID NO:5中的任一种的核酸序列。在任意方面的一些实施方式中,编码GATA1多肽的序列包含以下序列、由以下序列组成或基本上由以下序列组成:与SEQ ID NO.1-SEQ ID NO.5中的一个具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性的核酸序列。在任意方面的一些实施方式中,编码GATA1多肽的序列包含以下序列、由以下序列组成或基本上由以下序列组成:与SEQ ID NO.1-SEQ ID NO.5中的一个具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性的核酸序列,所述序列编码保留GATA1野生型活性的多肽,例如,其具有如本文所述的转录因子活性。
在任意方面的一些实施方式中,GATA1多肽包含以下序列、由以下序列组成或基本上由以下序列组成:选自于SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.64和/或SEQ ID NO.65中的任一种的氨基酸序列。在任意方面的一些实施方式中,GATA1多肽包含以下序列、由以下序列组成或基本上由以下序列组成:与SEQ ID NO.6、SEQ ID NO.7、SEQ ID NO.64和/或SEQ ID NO.65中的一个具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性的氨基酸序列。在任意方面的一些实施方式中,GATA1多肽包含以下序列、由以下序列组成或基本上由以下序列组成:与SEQ ID NO.6、SEQ ID NO.7、SEQ IDNO.64和/或SEQ ID NO.65中的一个具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性的氨基酸序列,所述序列保留GATA1野生型活性,例如,其具有如本文所述的转录因子活性。
造血干细胞(HSC)是产生其它血细胞的干细胞。此过程称为造血作用。此过程发生在位于大多数骨骼中央的红骨髓中。在胚胎发育中,红骨髓源自称为中胚层的胚胎层。造血作用是产生所有成熟血细胞的过程。它必须在巨大的生产需求与精确调控循环中每种血细胞类型数量的需求之间取得平衡。在脊椎动物中,绝大多数造血作用发生在骨髓中,并且源自多能且能够进行广泛自我更新的数量有限的HSC。HSC发现于成体的骨髓中,尤其是在骨盆、股骨和胸骨中。它们也发现于脐带血中,且少量发现于外周血中。哺乳动物造血作用产生大约10种不同的细胞类型,其中最丰富的属于红系谱系。红细胞生成引起大量红血细胞的产生,红血细胞负责为发育中的胚胎、胎儿和成体组织提供氧。它们还有助于维持血液粘度并提供血管发育和重塑所需的剪切应力。
如本文所用,术语“造血干细胞”或“HSC”是指能够最终分化成造血系统的所有细胞类型的克隆源性的(clonogenic)、自我更新的多能细胞,包括B细胞、T细胞、NK细胞、淋巴样树突细胞、髓样树突细胞、粒细胞、巨噬细胞、巨核细胞和红系细胞。与造血系统的其它细胞一样,HSC可通过特征性细胞标志物的组的存在来界定。在任意方面的一些实施方式中,HSC可为表达CD34、CD90或其组合的细胞。用于识别HSC的其它标志物特征包括但不限于:EMCN+、CD34+、CD59+、CD90+、CD117+、CD133+、CD38-、lin-、CD150+、CD48-和CD244-
来自DBA患者的HSC中GATA1蛋白水平受到遏制,并且在那些细胞中特异性地增加GATA1表达可改善DBA的红系谱系定型缺陷特征。需要调控终末红细胞生成过程中GATA1的表达。
在任意实施方式的一个方面,本文描述了包含a)至少一个异源调控序列以及b)编码GATA结合因子1(GATA1)多肽的序列的核酸序列,所述异源调控序列选自于i)造血增强子元件和/或ii)用于HSC限制性miRNA的结合位点。
如本文公开的调控序列包括但不限于启动子、增强子和其它表达控制元件(例如聚腺苷酸化信号),它们控制与它们可操作地连接的基因的转录或翻译。此类调控序列描述于例如Goeddel;Gene Expression Technology.Methods in Enzymology 185,AcademicPress,San Diego,Calif.(1990)中。用于哺乳动物宿主细胞表达的调控序列的实例包括指导在哺乳动物细胞中高水平蛋白质表达的病毒元件,例如源自巨细胞病毒(CMV)、猿猴病毒40(SV40)、腺病毒(例如腺病毒主要晚期启动子(AdMLP))和多瘤病毒的启动子和/或增强子。或者,可使用非病毒调控序列,例如泛素启动子、延伸因子1-α1(eEF1a1)启动子或β-珠蛋白启动子。真核启动子是位于基因上游的DNA调控区域,其结合转录因子II D(TFIID)并且允许转录起始复合物组分的后续协调,从而促进RNA聚合酶II的募集以及转录的起始。
在任意方面的一些实施方式中,本文公开了允许造血祖细胞中GATA1精细受调控的表达以改善DBA中的红细胞生成而不对造血作用产生不利影响的异源调控序列或其组合。
如本文所用,“HSC限制性的”,例如当用于调控序列时,是与造血谱系的其它细胞(例如红细胞或红系前体)相比优先发生于或存在于HSC中的活性或元件。在任意方面的一些实施方式中,活性或元件以相比造血谱系的其它细胞(例如红细胞或红系前体)而言至少10x、至少100x或更高的水平发生或存在于HSC中。更具体而言,HSC限制性miRNA是在HSC中以比在造血谱系的其它细胞(例如红细胞或红系前体)中更高(例如,10x、100x或更高)水平表达的miRNA。
术语“异源”是指非天然存在的元件的组合。例如,异源调控序列是与所考虑的编码序列可操作地连接的非天然发现的调控序列。在任意方面的一些实施方式中,异源调控序列可为在该物种中非天然发现的调控序列。
如本文所用,“调控序列”是指能够增加或降低特定基因、核酸序列或多肽的表达的核酸序列。
在任意方面的一些实施方式中,异源调控序列是造血增强子元件。造血增强子元件是在造血细胞中(例如在HSC中和/或红系谱系的其它细胞中)有活性的增强子元件。在一些实施方式中,造血增强子元件在经历红细胞生成的细胞中是有活性的。造血增强子元件不一定在前述细胞的任一种中都具有排他性活性(exclusively active)。或者,在任意方面的一些实施方式中,造血增强子元件可为HSC限制性的和/或限制于红系前体/祖细胞。在一些实施方式中,增强子元件位于编码GATA1的序列的远端(例如其为远端增强子元件)。本领域技术人员可通过查阅(例如在万维网上免费获得的关于红系谱系中的一种或多种细胞类型的表达数据)并鉴别在那些细胞中表达或高度表达的基因来容易地鉴别合适的增强子元件。
在任意方面的一些实施方式中,所述异源增强子元件包含以下核酸序列:NC_000023.11:48638900-48639300,位于智人X染色体,GRCh38.p12初级组装(SEQ ID NO:10):
Figure BDA0003499981180000191
在任意方面的一些实施方式中,所述异源增强子元件包含以下核酸序列:NC_000023.11:48641200-48641700,位于智人X染色体,GRCh38.p12初级组装(SEQ ID NO:11):
Figure BDA0003499981180000192
在任意方面的一些实施方式中,所述异源增强子元件包含以下核酸序列:
NC_000023.11:48644250-48645100,位于智人X染色体,GRCh38.p12初级组装(SEQID NO:12):
Figure BDA0003499981180000193
Figure BDA0003499981180000201
在任意方面的一些实施方式中,所述异源增强子元件包含以下核酸序列(SEQ IDNO:38):
Figure BDA0003499981180000202
在任意方面的一些实施方式中,所述异源增强子元件包含以下核酸序列(SEQ IDNO:39):
Figure BDA0003499981180000203
在任意方面的一些实施方式中,所述造血增强子元件包含以下序列、由以下序列组成或基本上由以下序列组成:与选自于由SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:38和/或SEQ ID NO:39所组成的组中的核苷酸序列具有至少80%同源性的序列。在任意方面的一些实施方式中,造血增强子元件包含以下序列、由以下序列组成或基本上由以下序列组成:至少与SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:38和/或SEQ ID NO:39中的一个具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性的序列。在任意方面的一些实施方式中,本文所述的核酸序列包含至少1个、或至少2个、或至少3个、或至少4个、或至少5个、或至少6个、或至少7个、或至少10个、或至少11个、或至少12个、或至少13个、或至少14个、或至少15个、或至少16个、或至少17个、或至少20个、或至少25个、或至少30个造血增强子元件。在使用三个前述造血增强子元件的亚群中,造血增强子元件的任意组合可用于本文所述方面的各个实施方式中的每一个。例如,本文特别考虑可使用3个造血增强子元件的任意成对组合(例如表1中所示的任意组合)。
表1:增强子元件的预期示例性组合由“X”表示
Figure BDA0003499981180000221
在任意方面的一些实施方式中,所述造血增强子元件可为选自于由以下所组成的组的基因的增强子元件:Kell金属内肽酶(KEL)、5'-氨基乙酰丙酸合酶2(ALAS2)、血型糖蛋白A(GYPA)。
如本文所用,“KEL”、“ECE3”、“CD238”或“Kell金属内肽酶”是II型跨膜糖蛋白,所述II型跨膜糖蛋白是高度多态性的Kell血型抗原。许多种类的KEL序列是已知的,例如人KEL(KEL NCBI Gene ID为3792)、核酸序列(例如NG_007492.2)、mRNA序列(例如NM_000420.3)和多肽序列(例如,NP_000411.1)是本领域已知的。这些连同任何天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,KEL增强子元件包括或源自具有以下核酸序列NG_007492.2(SEQ ID NO:40)的人KEL序列:
NG_007492.2:5001-26303智人Kell金属内肽酶(Kell血型)(KEL),RefSeqGene位于7号染色体
Figure BDA0003499981180000231
Figure BDA0003499981180000241
Figure BDA0003499981180000251
Figure BDA0003499981180000261
Figure BDA0003499981180000271
Figure BDA0003499981180000281
Figure BDA0003499981180000291
Figure BDA0003499981180000301
如本文所用,“ALAS2”、“ASB”、“ANH1”或“5'-氨基乙酰丙酸合酶2”是红系特异性线粒体定位酶。许多种类的ALAS2序列是已知的,例如人ALAS2(ALAS2 NCBI Gene ID为212)、核酸序列(例如NG_008983.1)、mRNA序列(例如NM_001037967.3)和多肽序列(例如NP_001033056.1)是本领域已知的。这些连同任何天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,ALAS2增强子元件包括或源自具有以下核酸序列NG_008983.1(SEQ ID NO:41)的人ALAS2序列:
NG_008983.1:5088-27010智人5'-氨基乙酰丙酸合酶2(ALAS2),RefSeqGene(LRG_1163)位于X染色体
Figure BDA0003499981180000311
Figure BDA0003499981180000321
Figure BDA0003499981180000331
Figure BDA0003499981180000341
Figure BDA0003499981180000351
Figure BDA0003499981180000361
Figure BDA0003499981180000371
Figure BDA0003499981180000381
如本文所用,“GYPA”、“GPA”、“MN”或“血型糖蛋白A”是人红细胞膜的唾液酸糖蛋白,其带有MN和Ss血型的抗原决定簇。许多种类的序列是已知的,例如人GYPA(GYPA NCBIGene ID为2993)、核酸序列(例如NG_007470.3)、mRNA序列(例如NM_001308190.1)和多肽序列(例如NP_001295119.1)是本领域已知的。这些连同任何天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,GYPA增强子元件包括或源自具有以下核酸序列NG_007470.3(SEQ ID NO:42)的人GYPA序列:
NG_007470.3:5001-36438智人血型糖蛋白A(MNS血型)(GYPA),RefSeqGene位于4号染色体
Figure BDA0003499981180000401
Figure BDA0003499981180000411
Figure BDA0003499981180000421
Figure BDA0003499981180000431
Figure BDA0003499981180000441
Figure BDA0003499981180000451
Figure BDA0003499981180000461
Figure BDA0003499981180000471
Figure BDA0003499981180000481
Figure BDA0003499981180000491
Figure BDA0003499981180000501
本文所述的核酸中使用的增强子元件可为增强子元件序列的单个实体,或者一个或多个单独的独特增强子元件序列的串联或重复。串联和重复可包含单个序列的2个、3个、4个、5个或更多个实体,或2个、3个、4个、5个或更多个可区分增强子元件序列的集合(例如来自一个基因的不同元件或来自不同基因的不同元件)。
在任意方面的一些实施方式中,所述造血增强子元件位于距GATA-1基因的开放阅读框的边界至少约5kb,例如距GATA-1基因的开放阅读框的边界至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb或更远。在任意方面的一些实施方式中,所述造血增强子元件序列位于距GATA-1基因的开放阅读框的边界至少5kb,例如距GATA-1基因的开放阅读框的边界至少5kb、至少6kb、至少7kb、至少8kb、至少9kb、至少10kb或更远。在任意方面的一些实施方式中,所述造血增强子元件序列位于距GATA-1基因的开放阅读框的边界约5kb,例如距GATA-1基因的开放阅读框的边界约5kb、约6kb、约7kb、约8kb、约9kb或约10kb。在任意方面的一些实施方式中,所述造血增强子元件序列可在基因间(intergenic)序列中或在间插基因(intervening gene)的序列中。在本文所述的任意方面的一些实施方式中,可在距开放阅读框末端约500bp至约10kb(例如距开放阅读框约1kb至约9kb、约2kb至约8kb、约3kb至约7kb、或约4kb至约6kb)的序列内鉴别靶序列。在本文所述的任意方面的一些实施方式中,所述造血增强子元件序列可位于距开放阅读框末端500bp至10kb(例如距开放阅读框1kb至9kb、2kb至8kb、3kb至7kb、或4kb至6kb)的序列内。
在任意方面的一些实施方式中,所述异源调控序列是GATA1造血增强子微小基因(G1HEM)。G1HEM可允许GATA1特异性在早期红系祖细胞中谱系特异性的表达但不在造血干细胞中表达,例如作为治疗Diamond-Blackfan贫血的基因治疗方法。GATA1造血增强子微小基因(G1HEM)包含4个不同调控元件的连结,以实现GATA1特异性在早期红系祖细胞中谱系特异性表达。如本文公开的G1HEM元件包括-3kb造血增强子、上游双GATA基序、上游CACCC盒以及GATA1的第一内含子的区段。事实上,此微小基因中存在的979个核苷酸足以适当地驱动Gata1 cDNA挽救Gata1敲除小鼠并允许表面上正常的红细胞生成。
在任意方面的一些实施方式中,GATA1造血增强子微小基因(G1HEM)包含以下核酸序列(SEQ ID NO:13):
Figure BDA0003499981180000511
在任意方面的一些实施方式中,本文描述了GATA1造血增强子微小基因(G1HEM),所述GATA1造血增强子微小基因(G1HEM)包含与SEQ ID NO:13具有至少80%同源性的序列、由与SEQ ID NO:13具有至少80%同源性的序列组成或基本上由与SEQ ID NO:13具有至少80%同源性的序列组成。在任意方面的一些实施方式中,GATA1造血增强子微小基因(G1HEM)包含以下序列、由以下序列组成或基本上由以下序列组成:与SEQ ID NO:13具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高序列同一性的序列。
在任意方面的一些实施方式中,所述核酸序列包含至少1个、或至少2个、或至少3个、或至少4个、或至少5个、或至少6个、或至少7个、或至少10个、或至少11个、或至少12个、或至少13个、或至少14个、或至少15个、或至少16个、或至少17个、或至少20个、或至少25个、或至少30个GATA1造血增强子微小基因(G1HEM)。
在任意方面的一些实施方式中,GATA1造血增强子微小基因位于距GATA-1基因的开放阅读框的边界至少约5kb,例如距GATA-1基因的开放阅读框的边界至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb或更远。在任意方面的一些实施方式中,GATA1造血增强子微小基因序列位于距GATA-1基因的开放阅读框的边界至少5kb,例如距GATA-1基因的开放阅读框的边界至少5kb、至少6kb、至少7kb、至少8kb、至少9kb、至少10kb或更远。在任意方面的一些实施方式中,GATA1造血增强子微小基因位于距GATA-1基因的开放阅读框的边界约5kb,例如距GATA-1基因的开放阅读框的边界约5kb、约6kb、约7kb、约8kb、约9kb或约10kb。在任意方面的一些实施方式中,GATA1造血增强子微小基因序列可在基因间序列中或在间插基因的序列中。在本文描述的任意方面的一些实施方式中,GATA1造血增强子微小基因序列可位于距所述开放阅读框的末端约500bp至约10kb(例如距所述开放阅读框约1kb至约9kb、约2kb至约8kb、约3kb至约7kb、或约4kb至约6kb)。在本文所述的任意方面的一些实施方式中,GATA1造血增强子微小基因序列位于距开放阅读框的末端500bp至10kb(例如距开放阅读框1kb至9kb、2kb至8kb、3kb至7kb、或4kb至6kb)。
在任意方面的一些实施方式中,本文公开了HSC限制性miRNA的结合位点,所述结合位点允许GATA1在造血祖细胞中的调控表达以改善DBA中的红细胞生成而不会对造血作用有不利影响。
HSC限制性miRNA的非限制性实例包括miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126、miR181、miR193、miR223T、miR542和let7e。这些miRNA的序列的许多种类是本领域已知的,例如人miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126miR126、miR181、miR193、miR223T、miR542和let7e。
这些miRNA中的各自的结合位点在本领域中同样是已知的并且包括在miRBase、miRDB和/或TargetScan上容易获得的那些。简而言之,动物miRNA结合位点将与miRNA序列的至少“种子区域”(6-8nt长度)互补。本文所述的miRNA各自的种子区域是公开可得的,例如在TargetScan和本文表2中提供的SEQ ID NO:43-SEQ ID NO:55。
在任意方面的一些实施方式中,本文描述的给定miRNA的结合位点可为如下序列:所述序列包含与该miRNA的种子区域互补的序列、由与该miRNA的种子区域互补的序列组成、或基本上由与该miRNA的种子区域互补的序列组成。在任意方面的一些实施方式中,本文所述的核酸序列可包含与单个HSC限制性miRNA的种子区域互补的序列的2个、3个、4个或更多个重复。这样的序列可包括个体序列的重复和/或不同序列的串联组合。
在任意方面的一些实施方式中,本文所述的两个或更多个miRNA的结合位点可为如下序列:所述序列包含与那些miRNA的种子区域互补的序列、由与那些miRNA的种子区域互补的序列组成、或基本上由与那些miRNA的种子区域互补的序列组成。在任意方面的一些实施方式中,本文所述的两个或更多个miRNA的结合位点可为如下序列:所述序列包含具有与那些miRNA的种子区域互补的序列的2个、3个、4个或更多个重复的序列,由具有与那些miRNA的种子区域互补的序列的2个、3个、4个或更多个重复的序列组成,或基本上由具有与那些miRNA的种子区域互补的序列的2个、3个、4个或更多个重复的序列组成。这样的序列可包括个体序列的重复和/或不同序列的串联组合。
在任意方面的一些实施方式中,本文所述的一个或多个miRNA的结合位点可为如下序列:所述序列包含选自于SEQ ID NO:31-SEQ ID NO:37的一个或多个序列、由选自于SEQ ID NO:31-SEQ ID NO:37的一个或多个序列组成、或基本上由选自于SEQ ID NO:31-SEQ ID NO:37的一个或多个序列组成。在任意方面的一些实施方式中,本文所述的一个或多个miRNA的结合位点可为如下序列:所述序列包含具有2个、3个、4个或更多个选自SEQ IDNO:31-SEQ ID NO:37的序列的序列,由具有2个、3个、4个或更多个选自SEQ ID NO:31-SEQID NO:37的序列的序列组成、或基本上由具有2个、3个、4个或更多个选自SEQ ID NO:31-SEQ ID NO:37的序列的序列组成。这样的序列可包括个体序列的重复和/或不同序列的串联组合。在任意方面的一些实施方式中,本文所述的核酸序列可包含以下序列:所述序列包含选自于SEQ ID NO:31-SEQ ID NO:37的序列的4个重复、由选自于SEQ ID NO:31-SEQ IDNO:37的序列的4个重复组成、或基本上由选自于SEQ ID NO:31-SEQ ID NO:37的序列的4个重复组成。
表2:HSC限制性miRNA的名称、miRBase登录号、核苷酸序列、示例性种子区域和miRNA结合位点的示例性核苷酸序列的非限制性实例。
Figure BDA0003499981180000541
Figure BDA0003499981180000551
在任意实施方式的一个方面中,本文描述了包含用于至少一个HSC限制性miRNA的至少一个miRNA结合位点的核酸序列,所述用于至少一个HSC限制性miRNA的至少一个miRNA结合位点选自于由以下miR结合位点所组成的组:用于miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126、miR181、miR193、miR223T、miR542和let7e的miR结合位点。在任意实施方式的一个方面中,本文描述了包含至少一个、或至少两个、或至少三个、或至少四个、或至少五个、或至少六个、或至少七个、或至少八个、或至少十个、或至少十一个、或至少十二个用于至少一个HSC限制性miRNA的结合位点的核酸序列,所述结合位点选自于由以下miR结合位点所组成的组:用于miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126、miR181、miR193、miR223T、miR542和let7e的miR结合位点。在使用用于前述miRNA的miRNA结合位点的亚群里,miRNA结合位点的任意组合可用于本文所述方面的各种实施方式中的每一个。例如,本文特别考虑可使用用于12个miRNA的结合位点的任意成对组合(例如,表3中示出的任意组合)。
在任意实施方式的一个方面中,本文描述了包含至少一个造血增强子元件和用于至少一个HSC限制性miRNA的至少一个miRNA结合位点的核酸序列。在任意实施方式的一个方面中,本文描述了包含至少一个造血增强子元件和用于至少一个HSC限制性miRNA的至少一个结合位点和编码GATA1多肽的序列的核酸序列。
表3:所考虑的miRNA结合位点的示例性组合由“X”表示
Figure BDA0003499981180000571
Figure BDA0003499981180000581
在任意方面的一些实施方式中,miRNA结合位点位于距GATA-1基因的开放阅读框的边界至少约5kb,例如距GATA-1基因的开放阅读框的边界至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb或更远。在任意方面的一些实施方式中,miRNA结合位点序列位于距GATA-1基因的开放阅读框的边界至少5kb,例如距GATA-1基因的开放阅读框的边界至少5kb、至少6kb、至少7kb、至少8kb、至少9kb、至少10kb或更远。在任意方面的一些实施方式中,miRNA结合位点序列位于距GATA-1基因的开放阅读框的边界约5kb,例如距GATA-1基因的开放阅读框的边界约5kb、约6kb、约7kb、约8kb、约9kb或约10kb。在任意方面的一些实施方式中,miRNA结合位点序列可在基因间序列中或在间插基因的序列中。在本文描述的任何方面的一些实施方式中,靶序列位于距开放阅读框的末端约500bp至约10kb(例如距开放阅读框约1kb至约9kb、约2kb至约8kb、约3kb至约7kb或约4kb至约6kb)的序列内。在本文所述的任意方面的一些实施方式中,miRNA结合位点序列位于距开放阅读框的末端500bp至10kb(例如距开放阅读框1kb至9kb、2kb至8kb、3kb至7kb或4kb至6kb)。
在任意方面的一些实施方式中,本文公开了包含编码GATA1多肽的序列和异源5'UTR的核酸序列。此类组合允许GATA1特异性地在早期红系祖细胞中谱系特异性表达。
基因表达的Cap分析用于定义正在进行红系谱系定型(在该阶段中出现红系分化中的功能缺陷)的HSPC中用于转录本的5'非翻译区域(UTR)。在基系(baseline)时高度翻译并且具有短且非结构的5'UTR的转录本倾向于成为在RP单倍不足的背景下翻译水平下调的转录本。5'UTR或“5'非翻译区域”或5'前导序列是指未翻译的mRNA区域。本文描述了以下发现:在所有造血主要转录因子中,只有GATA1具有短的5'UTR,以及用其它转录因子(包括但不限于RUNX1、LMO2或ETV6)的5'UTR替换该5'UTR改变GATA1造血转录因子的翻译。
在任意实施方式的一个方面,本文描述了包含以下的核酸序列:i)异源5'UTR和ii)编码GATA1多肽的核酸序列,所述异源5'UTR包含a)除GATA1以外的造血转录因子的5'UTR序列,b)至少20个核苷酸的序列,和/或c)1-25个上游密码子uAUG。在任意方面的一些实施方式中,本文所述的核酸序列可进一步包含异源5'UTR,所述异源5'UTR包含a)除GATA1以外的造血转录因子的5'UTR序列,b)至少20个核苷酸的序列,和/或c)1-25个上游密码子uAUG。
5'UTR的长度可通过突变(例如置换、删除或插入)所述5'UTR来修饰。所述5'UTR可通过突变天然存在的起始密码子或翻译起始位点来进一步修饰,以使得密码子不再作为起始密码子起作用并且翻译可在替代起始位点起始。
在任意方面的一些实施方式中,除GATA1以外的造血转录因子的5'UTR序列可为选自于由以下所组成的组的基因的5'UTR:Runt相关转录因子1(RUNXl)、LIM Domain Only 2(LMO2)以及ETS变体6(ETV6)。
如本文所用,“RUNX1”、“ANL1”或“Runt相关转录因子1”是指异二聚体核心结合因子(CBF)转录因子的α亚基,该转录因子被认为与正常造血作用的改善有关。RUNX1本身是转录因子,并且与CBFB辅因子复合形成CBF。关于RUNX1的序列的许多种类是已知的,例如人RUNX1(RUNX1 NCBI Gene ID为861)mRNA序列(例如NM_001001890.2)和多肽序列(例如NP_001001890.1)是本领域已知的。这些序列连同任何天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,RUNX1 5'UTR包括如下的5'UTR,所述5'UTR含有以下核酸序列、由以下核酸序列组成、基本上由以下核酸序列组成或衍生自以下核酸序列:NG_011402.2:940414-1201911智人RUNX家族转录因子1(RUNX1),RefSeqGene(LRG_482),位于21号染色体,(SEQ ID NO:14):
Figure BDA0003499981180000601
如本文所用,“LMO2”、“TTG2”或“LIM Domain Only 2”是指卵黄囊红细胞生成所需的富含半胱氨酸的两个LIM结构域的蛋白。关于LMO2的序列的许多种类是已知的,例如人LMO2(LMO2 NCBI Gene ID为4005)mRNA序列(例如NM_001142315.1)和多肽序列(例如NP_001135787.1)是本领域已知的。这些序列连同任何天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,LMO2 5'UTR包括以下的5'UTR,所述5'UTR含有以下核酸序列、由以下核酸序列组成、基本上由以下核酸序列组成或衍生自以下核酸序列:NC_000011.10:c33892289-33858576智人11号染色体,GRCh38.p12,(SEQ ID NO:15):
Figure BDA0003499981180000611
如本文所用,“ETV6”、“TEL”或“ETS变体6”是指具有两个功能结构域的转录因子:N-末端指向(N-terminal pointed,PNT)结构域,其参与自身和其它蛋白质的蛋白质-蛋白质相互作用;以及C-末端DNA结合结构域。关于ETV6的序列的许多种类是已知的,例如人ETV6(ETV6 NCBI Gene ID为2120)mRNA序列(例如NM_001987.4)和多肽序列(例如NP_001978.1)是本领域已知的。这些序列连同任何天然存在的等位基因、剪接变体及其催化相同反应的加工形式一起被考虑用于本文所述的方法和组合物中。
在任意方面的一些实施方式中,ETV6 5'UTR包括以下的5'UTR,所述5'UTR含有以下核酸序列、由以下核酸序列组成、基本上由以下核酸序列组成或衍生自以下核酸序列:NG_011443.1:5001-250549智人ETS变体6(ETV6),RefSeqGene(LRG_609),位于12号染色体(SEQ ID NO:16):
Figure BDA0003499981180000612
本文所述的核酸序列/元件能够可操作地连接,使得它们可直接或间接相互作用以执行预期的功能(例如介导或调节核酸序列的表达)。“可操作地连接”是指元件的布置,其中如此描述的部件被配置以执行它们的通常功能。因此,与开放阅读框可操作地连接的控制元件能够影响所述开放阅读框的表达。控制元件不需要与开放阅读框相邻,只要它们起到指导其表达的作用。因此,例如间插的未翻译但已转录的序列可存在于启动子序列和开放阅读框之间,所述启动子序列仍可被视为与所述开放阅读框“可操作地连接”。可操作地连接的序列的相互作用能够例如由与可操作地连接的序列相互作用的蛋白质介导。
在任意方面的一些实施方式中,启动子能够可操作地连接至本文公开的元件中的任一个,例如包含异源5'UTR的核酸序列、至少一个远端造血干细胞(HSC)限制性增强子元件、用于HSC限制性miRNA的结合位点和/或编码GATA1多肽的核酸。在任意方面的一些实施方式中,所述启动子不为GATA1启动子。
在任意方面的一些实施方式中,所述启动子包含延伸因子1-α1(eEF1a1)的启动子序列。如本文所用,“eEF1a1”、“CCS-3”或“LENG7”是指延伸因子-1复合物的α亚基,其负责将氨酰基tRNA酶促递送至核糖体。关于eEF1a1的序列的许多种类是已知的,例如人eEF1a1(eEF1a1NCBI Gene ID为1915)是本领域已知的。在任意方面的一些实施方式中,eEF1a1启动子包括以下的启动子,所述启动子含有以下核酸序列、由以下核酸序列组成、基本上由以下核酸序列组成或衍生自以下核酸序列:NC_000006.12:c73521032-73515750智人6号染色体,GRCh38.p12初级组装(SEQ ID NO:17):
Figure BDA0003499981180000621
Figure BDA0003499981180000631
Figure BDA0003499981180000641
复杂的细胞和发育过程取决于mRNA和蛋白质水平及活性的精确时空调控。此类调控主要发生在转录、转录后和翻译后水平。转录后调控是在RNA水平上控制基因表达,因此介于基因的转录和翻译之间。转录后调控可通过蛋白质-RNA和RNA-RNA相互作用二者来控制。如本文所用,转录后调控元件包括核苷酸序列,包括但不限于土拨鼠肝炎病毒转录后调控元件。在任意方面的一些实施方式中,本文所述的核酸序列可进一步包含与编码GATA1多肽的序列可操作地连接的转录后调控元件。
在任意方面的一些实施方式中,转录后调控元件包括土拨鼠肝炎病毒转录后调控元件。土拨鼠肝炎病毒(WHP)转录后调控元件(缩写为WPRE)是在转录时产生增强表达的三级结构的DNA序列。WPRE是具有γ、α和β组分的由三部分组成的调控元件。
在任意方面的一些实施方式中,土拨鼠肝炎病毒转录后调控元件(WPRE)包含以下核苷酸序列(SEQ ID NO:56)、由以下核苷酸序列(SEQ ID NO:56)组成或基本上由以下核苷酸序列(SEQ ID NO:56)组成:
Figure BDA0003499981180000651
在任意方面的一些实施方式中,土拨鼠肝炎病毒转录后调控元件(WPRE)包含以下核苷酸序列(SEQ ID NO:63)、由以下核苷酸序列(SEQ ID NO:63)组成或基本上由以下核苷酸序列(SEQ ID NO:63)组成:
Figure BDA0003499981180000652
替代的和/或优化的WPRE也是本领域已知的,例如如Patel和Olsen RNA VirusVectors 11:S322(2005)中所述,以引用的方式将其整体并入本文。
在任意方面的一些实施方式中,WPRE包含与SEQ ID NO:56和/或SEQ ID NO:63的核苷酸序列具有至少80%同源性的序列。在任意方面的一些实施方式中,WPRE包含与SEQID NO:56和/或SEQ ID NO:63具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性的序列。在任意方面的一些实施方式中,WPRE包含与SEQ IDNO:56和/或SEQ ID NO:63具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性并且保留了SEQ ID NO:56和/或SEQ ID NO:63的野生型活性的序列。本文所述的核酸序列可包含多个转录后调控元件,例如所述核酸序列包含至少1个、或至少2个、或至少3个、或至少4个、或至少5个、或至少6个、或至少7个、或至少10个、或至少11个、或至少12个、或至少13个、或至少14个、或至少15个、或至少16个、或至少17个、或至少20个、或至少25个、或至少30个转录后调控元件。
在任意方面的一些实施方式中,所述转录后调控元件位于距GATA-1基因的开放阅读框的边界至少约5kb,例如距GATA-1基因的开放阅读框的边界至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb或更远。在任意方面的一些实施方式中,所述转录后调控元件序列位于距GATA-1基因的开放阅读框的边界至少5kb,例如距GATA-1基因的开放阅读框的边界至少5kb、至少6kb、至少7kb、至少8kb、至少9kb、至少10kb或更远。在任意方面的一些实施方式中,所述转录后调控元件序列位于距GATA-1基因的开放阅读框的边界约5kb,例如距GATA-1基因的开放阅读框的边界约5kb、约6kb、约7kb、约8kb、约9kb或约10kb。在任意方面的一些实施方式中,所述转录后调控元件序列可在基因间序列中或在间插基因的序列中。在本文描述的任意方面的一些实施方式中,所述转录后调控元件序列可位于距开放阅读框的末端约500bp至约10kb(例如距开放阅读框约1kb至约9kb、约2kb至约8kb、约3kb至约7kb或约4kb至约6kb)的序列内。在本文所述的任意方面的一些实施方式中,所述转录后调控元件序列可位于距开放阅读框的末端约500bp至10kb(例如距开放阅读框1kb至9kb、2kb至8kb、3kb至7kb或4kb至6kb)。
在任意方面的一些实施方式中,本文所述的核酸序列可进一步包含内部核糖体进入位点。内部核糖体进入位点(缩写为IRES)是允许以非帽依赖的方式起始翻译的RNA元件,作为更大的蛋白质合成过程的部分。在真核翻译中,起始通常发生在mRNA分子的5'端,因为起始复合物的组装需要5'帽的识别。IRES元件的位置通常位于5'UTR,但也可能出现在mRNA的其它地方。
在任意方面的一些实施方式中,内部核糖体进入位点包含以下核苷酸序列(SEQID NO:66)、由以下核苷酸序列(SEQ ID NO:66)组成或基本上由以下核苷酸序列(SEQ IDNO:66)组成:
Figure BDA0003499981180000661
在任意方面的一些实施方式中,本文描述了包含与SEQ ID NO:66的核苷酸序列具有至少80%同源性的序列的IRES。在任意方面的一些实施方式中,IRES包含与SEQ ID NO:66具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高序列同一性的序列。在任意方面的一些实施方式中,IRES包含与SEQ ID NO:66具有至少60%、至少80%、至少85%、至少90%、至少95%、至少98%或更高的序列同一性并保留了SEQ ID NO:66的野生型活性的序列。
本文所述的核酸序列可包含多个IRES,例如核酸序列可包含至少1个、或至少2个、或至少3个、或至少4个、或至少5个、或至少6个、或至少7个、或至少10个、或至少11个、或至少12个、或至少13个、或至少14个、或至少15个、或至少16个、或至少17个、或至少20个、或至少25个、或至少30个IRES序列。
在任意方面的一些实施方式中,IRES位于距GATA-1基因的开放阅读框的边界至少约5kb,例如距GATA-1基因的开放阅读框的边界至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb或更远。在任意方面的一些实施方式中,IRES序列位于距GATA-1基因的开放阅读框的边界至少5kb,例如距GATA-1基因的开放阅读框的边界至少5kb、至少6kb、至少7kb、至少8kb、至少9kb、至少10kb或更远。在任意方面的一些实施方式中,IRES序列位于距GATA-1基因的开放阅读框的边界约5kb,例如距GATA-1基因的开放阅读框的边界约5kb、约6kb、约7kb、约8kb、约9kb或约10kb。在任意方面的一些实施方式中,IRES序列可在基因间序列中或在间插基因的序列中。在本文所述的任意方面的一些实施方式中,IRES序列可位于距开放阅读框的末端约500bp至约10kb(例如距开放阅读框约1kb至约9kb、约2kb至约8kb、约3kb至约7kb或约4kb至约6kb)的序列中。在本文所述的任意方面的一些实施方式中,IRES序列可位于距开放阅读框的末端500bp至10kb(例如距开放阅读框1kb至9kb、2kb至8kb、3kb至7kb或4kb至6kb)的序列内。
在任意方面的一些实施方式中,本文所述的核酸序列可进一步包含自剪切2A多肽。自剪切的肽或2A肽是能够诱导其作为一部分的多肽(例如本文所述的重组GATA-1)的剪切的多肽。因此,2A肽可用于将较长的肽剪切成两个较短的肽,从而可以用单个转录本生成两个肽。2A肽来源于病毒基因组中的2A区域。2A-肽介导的剪切在翻译后开始。所述剪切通过破坏2A肽C末端中脯氨酸(P)和甘氨酸(G)之间的肽键触发。2A多肽可包含至少10个、至少15个、至少20个、至少25个、至少30个或至少40个氨基酸。
在任意方面的一些实施方式中,2A肽能够与IRES元件组合在单个核酸序列中,从而产生在单个转录本内编码的三个单独的多肽。
可用于本文所述方法的示例性2A肽包括但不限于P2A、E2A、F2A和T2A(也参见表4,SEQ ID NO:57-SEQ ID NO:60)。F2A来源于口蹄疫病毒18;E2A来源于马甲型鼻炎病毒;P2A来源于猪捷申病毒-1 2A;T2A来源于明脉扁刺蛾(thosea asigna)病毒2A。
表4:能够用于本文所述的各种实施方式的2A肽的名称和序列。可在所列2A肽的N末端添加任选的接头“GSG”(Gly-Ser-Gly)(粗体)。
Figure BDA0003499981180000681
在任意方面的一些实施方式中,IRES和/或自剪切2A多肽能够可操作地连接至标志物基因(例如编码光学可检测蛋白质或酶的标志物基因)。光学可检测蛋白质/酶可包含光学可检测标记和/或具有产生可检测信号的能力(例如通过催化将化合物转化为可检测产物的反应)。可检测标记可包括例如吸光部分或荧光部分。可检测标记、标志物基因、检测它们的方法以及将它们掺入试剂(例如抗体和核酸探针)中的方法是本领域公知的。
光学可检测标记/信号可包括人眼可见的标记/信号或用光学装置可检测的标记/信号,例如通过光谱、光化学、生物化学、免疫化学、电磁、放射化学或化学手段(例如荧光、化学荧光或化学发光),或任何其它适当的方式。可检测标记可包括但不限于放射性同位素、生物发光化合物、生色团、抗体、化学发光化合物、荧光化合物、金属螯合物和酶。
标志物基因是本领域公知的,例如可包括但不限于:天然荧光蛋白,例如维多利亚多管发光水母(Aequorea Victoria)的绿色荧光蛋白(GFP)(Cubitt,A.B.等.1995.Understanding,improving,and using green fluorescent proteins.TrendsBiochem.Sci.20:448-455;Chalfie,M.和Prasher,D.C.U.S.Pat.NO:5,491,084);编码β-半乳糖苷酶的lacZ基因;辣根过氧化物酶;碱性磷酸酶;苹果酸脱氢酶;葡萄球菌核酸酶;δ-V-类固醇异构酶;酵母醇脱氢酶;α-甘油磷酸脱氢酶;磷酸丙糖异构酶;辣根过氧化物酶;碱性磷酸酶;天冬酰胺酶;葡萄糖氧化酶;β-半乳糖苷酶;核糖核酸酶;脲酶;过氧化氢酶;葡萄糖-VI-磷酸脱氢酶;葡萄糖淀粉酶;和乙酰胆碱酯酶。
在任意方面的一些实施方式中,本文所述的核酸序列可包含以下序列、由以下序列组成或基本上由以下序列组成:选自于SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:61和SEQID NO:62。
SEQ ID NO:61(也被称为R18 EF1a IRES GFP)包含EF1A启动子,与编码GFP的核苷酸序列可操作地连接的IRES序列:
Figure BDA0003499981180000691
Figure BDA0003499981180000701
Figure BDA0003499981180000711
Figure BDA0003499981180000721
SEQ ID NO:8(也被称为R21 miR126)包含EF1A启动子,以及与编码GFP和用于HSC限制性miRNA miR126的四个miRNA结合位点的核苷酸序列可操作地连接的IRES序列:
Figure BDA0003499981180000722
Figure BDA0003499981180000731
Figure BDA0003499981180000741
SEQ ID NO:9(也被称为R49 1peak增强子)包含与编码GFP的核苷酸序列可操作地连接的IRES序列和一个造血增强子元件:
Figure BDA0003499981180000742
Figure BDA0003499981180000751
Figure BDA0003499981180000761
SEQ ID NO:62(也被称为R50 3peak增强子)包含与编码GFP的核苷酸序列可操作地连接的IRES序列和三个造血增强子元件:
Figure BDA0003499981180000762
Figure BDA0003499981180000771
Figure BDA0003499981180000781
在任意方面的一些实施方式中,本文所述的核酸序列是载体或包含在载体中或在载体中提供。所述载体可为例如质粒、病毒载体,或腺病毒载体、慢病毒载体或逆转录病毒载体。如本文所用,术语“逆转录病毒”是指将其基因组的拷贝插入其侵入的宿主细胞的DNA中,从而改变该细胞的基因组的RNA病毒。此类病毒是单链RNA病毒或双链DNA病毒中的一者。在任意方面的一些实施方式中,逆转录病毒是α逆转录病毒。如本文所用,术语“慢病毒”是指复合逆转录病毒的组(或属)。慢病毒能够感染非分裂细胞类型以及活跃分裂的细胞类型,而标准逆转录病毒只能感染有丝分裂活跃的细胞类型。示例性慢病毒包括但不限于:HIV(人类免疫缺陷病毒;包括1型HIV和2型HIV);梅迪-维斯那病毒(visna-maedi virus,VMV)病毒;山羊关节炎脑炎病毒(CAEV);马传染性贫血病毒(EIAV);猫免疫缺陷病毒(FIV);牛免疫缺陷病毒(BIV);和猴免疫缺陷病毒(SIV)。如本文所用,术语“腺病毒”是指具有包含双链DNA基因组的二十面体核壳的无包膜病毒。如本文所用,术语“病毒载体”是指核酸载体构建体,所述核酸载体构建体包含至少一个病毒来源的元件并具有被包装到病毒载体颗粒中的能力。病毒载体可含有本文所述的核酸代替非必需的病毒基因。所述载体和/或颗粒可用于在体外或体内将任意核酸转移至细胞中的目的。许多形式的病毒载体是本领域已知的。
在任意方面的一些实施方式中,本文所述的核酸序列和/或载体包含在病毒颗粒(例如慢病毒颗粒)中、以病毒颗粒(例如慢病毒颗粒)提供或位于病毒颗粒(例如慢病毒颗粒)中。
在任意实施方式的一个方面中,本文描述了包含如本文所述的核酸序列、载体或颗粒以及药学上可接受的运载体的组合物。
在任意实施方式的一个方面中,本文描述了包含本文所述的核酸序列(和/或包含此类核酸序列的载体或病毒颗粒)和任选的药学上可接受的运载体的药物组合物。在任意方面的一些实施方式中,所述药物组合物的活性成分包含如本文所述的核酸(和/或包含此类核酸序列的载体或病毒颗粒)。在任意方面的一些实施方式中,所述药物组合物的活性成分由如本文所述的核酸(和/或包含此类核酸序列的载体或病毒颗粒)组成。药学上可接受的运载体和稀释剂包括盐水、水性缓冲溶液、溶剂和/或分散介质。此类运载体和稀释剂的使用是本领域公知的。可用作药学上可接受的运载体的材料的一些非限制性实例包括:(1)糖类,例如乳糖、葡萄糖和蔗糖;(2)淀粉,例如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,例如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)黄蓍胶粉;(5)麦芽;(6)明胶;(7)润滑剂,例如硬脂酸镁、十二烷基硫酸钠和滑石;(8)赋形剂,例如可可脂和栓剂蜡;(9)油类,例如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;(10)二元醇类,例如丙二醇;(11)多元醇,例如甘油、山梨糖醇、甘露糖醇和聚乙二醇(PEG);(12)酯类,油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,例如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏溶液;(19)乙醇;(20)pH缓冲溶液;(21)聚酯、聚碳酸酯和/或聚酸酐;(22)填充剂,例如多肽和氨基酸;(23)血清组分,例如血清白蛋白、HDL和LDL;(22)C2-C12醇,例如乙醇;以及(23)用于药物制剂的其它无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可存在于所述制剂中。例如“赋形剂”、“运载体”、“药学上可接受的运载体”等术语在本文中可互换使用。在任意方面的一些实施方式中,所述运载体抑制活性剂的降解,例如抑制包含编码如本文所述的GATA结合因子1(GATA1)多肽的序列的核酸的降解。
在任意方面的一些实施方式中,包含如本文所述的核酸序列(和/或包含此类核酸序列的载体或病毒颗粒)的药物组合物可为肠胃外剂型,所述核酸序列包含编码GATA结合因子1(GATA1)多肽的序列。由于肠胃外剂型的给予通常绕过患者对污染物的天然防御,肠胃外剂型优选为无菌的或能够在给予患者之前被灭菌。肠胃外剂型的实例包括但不限于即用型注射液、溶解或悬浮于药学上可接受的注射用媒介中的即用型干燥产品、即用型注射剂、和乳液。此外,可制备用于给予患者的控释肠胃外剂型,包括但不限于
Figure BDA0003499981180000801
型剂型和剂量倾泻。
可用于提供包含如本文所述的核酸序列(和/或包含此类核酸序列的载体或病毒颗粒)的药物组合物的肠胃外剂型的合适媒介是本领域技术人员众所公知的,所述核酸序列包含编码GATA结合因子1(GATA1)多肽的序列。实例不受限地包括:无菌水;注射用水USP;盐水溶液;葡萄糖溶液;水性媒介(例如但不限于氯化钠注射液、林格氏注射液、葡萄糖注射液、右旋糖和氯化钠注射液、和乳酸林格氏注射液);水混溶的媒介(例如但不限于乙醇、聚乙二醇和丙二醇);以及非水性媒介(例如但不限于玉米油、棉籽油、花生油、芝麻油、油酸乙酯、肉豆蔻酸异丙酯和苯甲酸苄酯)。改变或修饰本文公开的药物组合物的药学上可接受的盐的溶解度的化合物也可并入本公开的肠胃外剂型,包括常规和控释肠胃外剂型。
包含如本文所述的含有编码GATA结合因子1(GATA1)多肽的序列的核酸序列(和/或包含此类核酸序列的载体或病毒颗粒)的药物组合物也可配制为适用于口服给药,例如作为离散剂型,例如但不限于片剂(包括但不限于刻痕或包衣片剂)、丸剂、囊片、胶囊剂、咀嚼片剂、粉包、扁囊剂、锭剂、口腔膜剂(wafers)、气溶胶喷雾剂或液体,例如但不限于糖浆剂、酏剂、溶液剂、或在水性液体、非水性液体、水包油乳液或油包水乳液中的悬浮剂。此类组合物含有预定量的公开化合物的药学上可接受的盐,并且可通过本领域技术人员公知的药学方法制备。通常参见Remington:The Science and Practice of Pharmacy,第21版,Lippincott,Williams和Wilkins,Philadelphia PA.(2005)。
常规剂型通常提供从制剂中快速或立即的药物释放。依据药物的药理学和药代动力学,使用常规剂型会导致患者血液和其它组织中药物浓度的大幅波动。这些波动会影响许多参数,例如剂量频率、作用开始、功效持续时间、治疗血液水平的维持、毒性、副作用等。有利地,控释制剂可用于控制药物的作用开始、作用持续时间、治疗窗口内的血浆水平和峰血液水平。特别是,控释或延迟释放剂型或制剂可用于确保实现药物的最大有效性,同时使潜在的不良作用和安全问题最小化,这都可能发生在使药物剂量不足(即低于最低治疗水平进行)以及超过关于该药物的毒性水平中。在任意方面的一些实施方式中,包含如本文公开的含有编码GATA结合因子1(GATA1)多肽的序列的核酸序列(和/或含有此类核酸序列的载体或病毒颗粒)可以以缓释制剂给药。
控释药物产品具有改善药物疗法的普遍目的,优于它们的非控释对应物所实现的药物疗法。理想地,在医学治疗中使用优化设计的控释制品的特征在于使用最少的药物物质以在最小量的时间内治愈或控制病症。控释制剂的优点包括:1)延长的药物活性;2)减少的剂量频率;3)增加的患者依从性;4)使用更少的总药物;5)局部或系统性副作用减少;6)药物积累的最小化;7)血液水平波动减少;8)治疗功效改善;9)药物活性的增强或丧失减少;以及10)疾病或病症控制速度改善。Kim,Cherng-ju,Controlled Release Dosage FormDesign,2(Technomic Publishing,Lancaster,Pa.:2000)。
大多数控释制剂被设计为最初释放一定量的迅速产生所需治疗效果的药物(活性成分),并且逐渐且持续地释放其它量的药物以在延长的一段时间内维持该水平的治疗或预防效果。为了在体内维持该恒定的药物水平,药物必须以一定的速率从剂型中释放,这将取代从体内被代谢和排出的药物量。活性成分的控释可通过各种条件刺激,包括但不限于pH、离子强度、渗透压、温度、酶、水和其它生理条件或化合物。
多种已知的控释或延迟释放剂型、制剂和设备可适用于与本公开的盐和组合物一起使用。实例包括但不限于美国专利号:3,845,770、3,916,899、3,536,809、3,598,123、4,008,719、5674,533、5,059,595、5,591,767、5,120,548、5,073,543、5,639,476、5,354,556、5,733,566和6,365,185B1中所描述的;通过引用的方式将其各自并入本文。这些剂型可用于提供一种或多种活性成分的缓释或控释,使用例如羟丙基甲基纤维素、其它聚合物基质、凝胶、渗透膜、渗透系统(例如
Figure BDA0003499981180000821
(Alza Corporation,Mountain View,Calif.USA))或它们的组合,以提供不同比例的期望的释放谱。
在实施方式的一些方面,本文描述了治疗有需要的受试者中Diamond-Blackfan贫血的方法,所述方法包括向患者给予治疗有效量的如本文所述的核酸序列、颗粒或组合物。
本文所述的组合物可给予患有或诊断为患有DBA的受试者。在任意方面的一些实施方式中,本文所述的方法包括向受试者给予有效量的本文所述的组合物(例如有效量的如本文所述的包含编码GATA结合因子1(GATA1)多肽的序列的核酸),以缓解DBA的症状。如本文所用,“缓解症状”是改善与DBA相关的任意病症或症状。通过任意标准测量,与对等的未处理对照相比,此种减少为至少5%、10%、20%、40%、50%、60%、80%、90%、95%、99%或更多。将本文所述的组合物给予受试者的多种手段是本领域技术人员已知的。此类方法可包括但不限于口服、肠胃外、静脉内、肌内、皮下、经皮、气道(气溶胶)、肺、皮肤、局部或注射给予。给予可为局部的或系统性的。
如本文所用的术语“有效量”是指缓解疾病或紊乱的至少一种或多种症状所需的活性剂的量,并且涉及提供期望效果的足够量的药理学组合物。因此,术语“治疗有效量”是指当给予典型受试者时足以提供特定效果的活性剂的量。如本文所用的有效量,在各种情况下,还包括足以延迟疾病症状的发展,改变疾病症状的进程(例如但不限于减缓疾病症状的进展)或逆转疾病的症状的量。因此,具体说明确切的“有效量”通常不可行。然而,对于任何给定的情况,合适的“有效量”可由本领域普通技术人员仅使用常规实验来确定。
有效量、毒性和治疗功效可通过细胞培养物或实验动物中的标准药学程序来确定,例如用于确定LD50(使50%群体致死的剂量)和ED50(在50%群体中治疗有效的剂量)。剂量可依据所采用的剂型和所使用的给药途径而变化。毒性和治疗效果之间的剂量比为治疗指数,并且可表示为LD50/ED50比值。优选表现出大的治疗指数的组合物和方法。治疗有效剂量可从细胞培养试验中初步估计。此外,可在动物模型中制定剂量以达到循环血浆浓度范围,该范围包括在细胞培养中或在合适的动物模型中确定的IC50(即达到了对症状的半数最大抑制的活性剂的浓度)。例如,可通过高效液相色谱法测量血浆中的水平。任何特定剂量的效果可通过合适的生物测定(例如其中的红血细胞和/或红细胞生成水平的测定等)来监测。剂量可由医生确定,并在必要时进行调整以适应观察到的治疗效果。
如本文所述的组合物的剂量可由医生确定并在必要时进行调整以适应观察到的治疗效果。关于治疗的持续时间和频率,熟练的临床医生通常监测受试者以确定何时治疗提供治疗益处,并确定是否增加或降低剂量、增加或降低给予频率、停止治疗、恢复治疗、或对治疗方案进行其它改变。依据许多临床因素(例如受试者对活性剂的敏感性),剂量计划可以从每周一次到每天一次不等。期望的激活剂量或量可一次性给予或分成亚剂量给予,例如2-4个亚剂量并在一段时间内(例如以一天中的适当间隔或其它适当的计划)给予。在任意方面的一些实施方式中,给予可为长期的,例如在数周或数月的时间段内每天一个或多个剂量和/或治疗。剂量和/或治疗计划的实例为在1周、2周、3周、4周、1个月、2个月、3个月、4个月、5个月或6个月或更长时间的时段内每天、每天两次、每天三次或每天四次或更多次给予。可以在一段时间内(例如5分钟、10分钟、15分钟、20分钟或25分钟内)给予包含如本文公开的含有编码GATA结合因子1(GATA1)多肽的序列的核酸序列(和/或含有此类核酸序列的载体或病毒颗粒)的组合物。
在任意方面的一些实施方式中,在初始治疗方案之后,治疗可在较低频率的基础上给予。例如,每两周治疗三个月后,治疗可每月、六个月、或一年或更长时间重复一次。根据本文所述的方法的治疗可将病症的标志物或症状的水平减少至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、或至少90%或更多。
根据本文所述的方法,如本文公开的包含编码GATA结合因子1(GATA1)多肽的序列的核酸序列(和/或包含此类核酸序列的载体或病毒颗粒)的给予的剂量范围取决于,例如抑制剂的形式、其效力、以及本文所述病症的症状、标志物或指标的期望减少程度(例如百分比)。通常,剂量将随患者的年龄、病症和性别而变化并且可由本领域技术人员确定。在任何并发症的情况中,剂量也可由个体医生调整。
如本文所公开的包含编码GATA结合因子1(GATA1)多肽的序列的核酸序列(和/或包含此类核酸序列的载体或病毒颗粒)在例如DBA或本文所述的任何其它病症的治疗中的功效或诱导如本文所述的反应的功效可由熟练的临床医生确定。然而,如果在根据本文所述的方法进行治疗后,本文所述的病症的体征或症状中的一种或多种以有益的方式改变,其它临床上可接受的症状得到改善或甚至好转,或期望的反应被诱导(例如至少10%),治疗被认为是如本文所使用的术语“有效治疗”。例如,可通过测量根据本文所述的方法治疗的病症的标志物、指标、症状和/或发病率或任何其它适当的可测量参数来评估功效。也可通过个体未能恶化(通过住院治疗评估)或对医疗干预的需要(即疾病的进展停止)来测量功效。测量这些指标的方法是本领域技术人员已知的和/或在本文中有所描述。治疗包括对个体或动物(一些非限制性实例包括人或动物)的疾病的任何治疗,并且包括:(1)抑制疾病,例如防止症状恶化;或(2)减轻疾病的严重程度,例如引起症状的消退。疾病治疗的有效量是指当给予有需要的受试者时足以引起对于该疾病的如本文所定义的术语所述的有效治疗的量。可通过评估病症或期望反应的物理指标来确定药剂的功效。通过测量此类参数中的任一个或参数的任意组合来监测给药和/或治疗的功效完全在本领域技术人员的能力内。可在本文所述的病症的动物模型中评估功效,例如DBA的治疗。
在任意实施方式的一个方面中,本文描述了恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述方法包括:使包含早期红系祖细胞的细胞群与如本文所述的核酸序列、颗粒或组合物接触。
在任意方面的一些实施方式中,早期红系祖细胞包含DBA相关的基因突变,包括但不限于表5中所列的那些。在任意方面的一些实施方式中,红系祖细胞包含一个或多个DBA相关的基因突变。DBA相关的基因突变是本领域众所公知的,并且包括但不限于表5中列出的突变(例如,参见Int J Hematol.2010Oct;92(3):413-8)。
表5:示例性DBA相关的基因突变
Figure BDA0003499981180000851
在任意方面的一些实施方式中,以非限制性实例的方式,GATA-1的水平可通过蛋白质印迹、免疫沉淀、酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、夹心式测定、荧光原位杂交(FISH)、免疫组织学染色、放射免疫测定、免疫荧光测定、质谱和/或免疫电泳测定来测量。
RNA和/或DNA分子可从生物样品(例如血液样品)中分离、衍生或扩增。用于检测mRNA表达的技术是本领域技术人员已知的,并且可以包括但不限于PCR程序、RT-PCR、定量RT-PCR、Northern印迹测定、差异基因表达、RNAse保护测定、基于微阵列的分析、下一代测序、杂交方法等。
通常而言,PCR程序描述了基因扩增的方法,所述方法包括(i)引物与核酸样品或文库中的特定基因或序列的序列特异性杂交;(ii)后续扩增,所述扩增涉及使用热稳定的DNA聚合酶的多轮退火、延伸和变性;以及(iii)筛选PCR产物中正确大小的条带。所使用的引物是足够长且合适的序列的寡核苷酸以提供聚合的起始,即每个引物被专门设计为与待扩增的基因组基因座的链互补。在替代的实施方式中,本文所述的基因表达产物的mRNA水平可以通过逆转录(RT)PCR以及通过定量RT-PCR(QRT-PCR)或实时PCR方法来确定。RT-PCR和QRT-PCR的方法是本领域公知的。
在任意方面的一些实施方式中,mRNA的水平可通过定量测序技术(例如定量下一代测序技术)来测量。对核酸序列进行测序的方法是本领域公知的。简而言之,可使从受试者获得的样品与一个或多个引物接触,所述一个或多个引物和靶基因序列侧翼的单链核酸序列特异性杂交并合成互补链。在一些下一代技术中,将连接头(双链或单链)连接到样品中的核酸分子,然后从连接头或连接头兼容的引物开始合成。在一些第三代技术中,可以例如通过确定探针杂交的位置和模式,或测量单个分子在其通过传感器时的一个或多个特征(例如当核酸分子通过纳米孔时电场的调制)来确定所述序列。示例性的测序方法包括但不限于:Sanger测序、双脱氧链终止、高通量测序、下一代测序、454测序、SOLiD测序、polony测序、Illumina测序、Ion Torrent测序、通过杂交测序、纳米孔测序、Helioscope测序、单分子实时测序、RNAP测序等。用于执行这些测序方法的方法和方案是本领域已知的,参见例如“Next Generation Genome Sequencing”,Michal Janitz编著,Wiley-VCH;“High-Throughput Next Generation Sequencing”,Kwon和Ricke编著,Humanna Press,2011;以及Sambrook等,Molecular Cloning:A Laboratory Manual(第4版),Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,USA(2012);以引用的方式将它们的整体并入本文。
核酸和核糖核酸(RNA)分子可使用本领域公知的多种程序中的任一种从特定生物样品中分离,选择的特定分离程序适合于特定生物样品。例如,冻融和碱裂解程序可对从固体材料中获取核酸分子有用;加热和碱裂解程序可对从尿液中获取核酸分子有用;以及蛋白酶K提取可用于从血液中获取核酸(Roiff,A等,PCR:Clinical Diagnostics andResearch,Springer(1994))。
在任意方面的一些实施方式中,本文所述的试剂(例如抗体试剂和/或核酸探针)中的一种或多种可包含可检测标记和/或包含产生可检测信号的能力(例如通过催化反应以将化合物转化为可检测的产物)。可检测标记可包括例如吸光染料、荧光染料或放射性标记。可检测标记、检测它们的方法以及将它们掺入试剂(例如抗体和核酸探针)中的方法是本领域公知的。
在任意方面的一些实施方式中,可检测标记可包括可通过光谱、光化学、生物化学、免疫化学、电磁、放射化学或化学手段(例如荧光、化学荧光或化学发光),或者任何其它适当的手段来检测的标记。本文所述方法中使用的可检测标记可为初级标记(其中标记包含可直接检测或产生可直接检测部分的部分)或二级标记(其中可检测标记结合另一部分以产生可检测信号,例如在使用二级和三级抗体的免疫标记中很常见)。可检测标记可通过共价或非共价手段与试剂连接。或者,例如可通过直接对分子进行标记来连接可检测标记,所述分子经由配体-受体结合对排列或其它此类特异性识别分子实现与试剂结合。可检测标记可包括但不限于放射性同位素、生物发光化合物、生色团、抗体、化学发光化合物、荧光化合物、金属螯合物和酶。
在其它实施方式中,检测试剂由荧光化合物标记。当荧光标记的试剂暴露在适当波长的光下时,由于荧光可检测到它的存在。在任意方面的一些实施方式中,可检测标记可为荧光染料分子或荧光团,所述荧光染料分子或荧光团包括但不限于荧光素、藻红蛋白、藻蓝蛋白、邻苯二甲醛、荧光胺、Cy3TM、Cy5TM、异藻蓝蛋白、德克萨斯红、peridenin叶绿素、花菁、串联偶联物(例如藻红蛋白-Cy5TM)、绿色荧光蛋白、罗丹明、异硫氰酸荧光素(FITC)和俄勒冈绿TM、罗丹明及衍生物(例如德克萨斯红和四罗丹明异硫氰酸酯(TRITC))、生物素、藻红蛋白、AMCA、CyDyesTM、6-羧基荧光素(carboxyfhiorescein,通常缩写为FAM和F)、6-羧基-2',4',7',4,7-六氯荧光素(HEX)、6-羧基-4',5'-二氯-2',7'-二甲氧基荧光素(JOE或J)、N,N,N',N'-四甲基-6羧基罗丹明(TAMRA或T)、6-羧基-X-罗丹明(ROX或R)、5-羧基罗丹明-6G(R6G5或G5)、6-羧基罗丹明-6G(R6G6或G6)和罗丹明110、花菁染料(例如Cy3、Cy5和Cy7染料)、香豆素(例如伞形酮)、苯甲亚胺染料(例如Hoechst 33258)、菲啶染料(例如德克萨斯红)、乙锭染料、吖啶染料、咔唑染料、吩噁嗪染料、卟啉染料、聚甲炔染料(例如花菁染料,如Cy3、Cy5等)、BODIPY染料和喹啉染料。在任意方面的一些实施方式中,可检测标记可为放射性标记,包括但不限于3H、125I、35S、14C、32P和33P。在任意方面的一些实施方式中,可检测标记可为酶,包括但不限于辣根过氧化物酶和碱性磷酸酶。酶标记可产生例如化学发光信号、颜色信号或荧光信号。考虑用于可检测标记的抗体试剂的酶包括但不限于苹果酸脱氢酶、葡萄球菌核酸酶、δ-V-类固醇异构酶、酵母醇脱氢酶、α-甘油磷酸脱氢酶、磷酸丙糖异构酶、辣根过氧化物酶、碱性磷酸酶、天冬酰胺酶、葡萄糖氧化酶、β-半乳糖苷酶、核糖核酸酶、脲酶、过氧化氢酶、葡萄糖-VI-磷酸脱氢酶、葡萄糖淀粉酶和乙酰胆碱酯酶。在任意方面的一些实施方式中,可检测标记是化学发光标记,包括但不限于光泽精、鲁米诺、萤光素、异鲁米诺、theromatic吖啶酯、咪唑、吖啶盐和草酸酯。在任意方面的一些实施方式中,可检测标记可为光谱比色标记,包括但不限于胶体金或有色玻璃或塑料(例如聚苯乙烯、聚丙烯和乳胶)珠。
在任意方面的一些实施方式中,检测试剂也可用可检测标签进行标记,例如c-Myc、HA、VSV-G、HSV、FLAG、V5、HIS或生物素。也可使用其它检测系统,例如生物素-链霉亲和素系统。在该系统中,与感兴趣的生物标志物有免疫反应性(即特异性)的抗体被生物素化。使用链霉亲和素-过氧化物酶偶联物和显色底物确定与生物标志物结合的生物素化抗体的量。此类链霉亲和素过氧化物酶检测试剂盒是可商业获得的,例如从DAKO;Carpinteria,CA。还可使用荧光发射金属(例如152Eu或镧系元素的其它金属)可检测地标记试剂。这些金属可使用诸如二乙烯三胺五乙酸(DTPA)或乙二胺四乙酸(EDTA)之类的金属螯合基团附接至所述试剂。
低于参比水平的水平可为以下水平:相对于参比水平,低至少约5%、至少约10%、至少约15%、至少约20%、至少约50%、至少约60%、至少约80%、至少约90%或更少的水平。在任意方面的一些实施方式中,低于参比水平的水平可为统计学上显著低于参比水平的水平。
高于参比水平的水平可为以下水平:与参比水平相比而言,高至少约10%、至少约20%、至少约50%、至少约60%、至少约80%、至少约90%、至少约100%、至少约200%、至少约300%、至少约500%或更多的水平。在任意方面的一些实施方式中,高于参比水平的水平可为统计学上显著高于参比水平的水平。
在任意方面的一些实施方式中,所述参比可为未患有或未被诊断为患有和/或未表现出肺部感染和/或肺部炎症的体征或症状的受试者群体中靶标的水平。在任意方面的一些实施方式中,所述参比还可为对照样品、对照个体的合并样品或基于它们的数值或数值范围中靶标的水平。在任意方面的一些实施方式中,所述参比可为在较早时间点从同一受试者获得的样品中靶标的水平,例如本文所述的方法可用于确定受试者对给定的疗法的敏感性或反应是否随着时间而改变。
在前述方面的一些实施方式中,可将给定基因的表达水平相对于一个或多个参比基因或参比蛋白质的表达水平来进行归一化。
在任意方面的一些实施方式中,参比水平可为以下样品中的水平:相似细胞类型,样品类型,样品处理,和/或从具有与待确定中性粒细胞积聚和/或polyP的水平的样品/受试者相似的年龄、性别和其它人口统计学参数的受试者获得的的样品。在任意方面的一些实施方式中,测试样品和对照参比样品为相同类型,即从相同的生物来源获得并且包含相同的组成,例如相同数量和类型的细胞。
如本文所用,术语“样品”或“测试样品”表示从生物有机体获取或分离的样品(例如来自受试者的血液或血浆样品)。在任意方面的一些实施方式中,本发明包括生物样品的若干实例。在任意方面的一些实施方式中,生物样品是细胞、或组织、或外周血、或体液。示例性生物样品包括但不限于活体检查切片、肿瘤样品、生物流体样品、血液、血清、血浆、尿、精子、粘液、组织活体检查切片、器官活体检查切片、滑液、胆汁液、脑脊液、黏膜分泌物、积液、汗、唾液和/或组织样品等。该术语还包括上述样品的混合物。术语“测试样品”还包括未处理或预处理(或预先加工)的生物样品。在任意方面的一些实施方式中,测试样品可包含来自受试者的细胞。在任意方面的一些实施方式中,测试样品可为肺样品、肺抽出物、痰样品、气道样品、血清样品等。
测试样品可通过从受试者中移取样品来获得,但也可通过使用先前分离的样品(例如在先前的时间点分离以及由同一人或另一人分离)来完成。
在任意方面的一些实施方式中,测试样品可为未处理的测试样品。如本文所用,短语“未处理的测试样品”是指除稀释和/或悬浮在溶液中之外没有进行任何先前样品预处理的测试样品。用于处理测试样品的示例性方法包括但不限于离心、过滤、超声、均质化、加热、冷冻和解冻及它们的组合。在任意方面的一些实施方式中,测试样品可为冷冻测试样品,例如冷冻组织。在采用本文所述的方法、测定和系统之前,可将冷冻样品解冻。解冻后,冷冻样品可在进行本文所述的方法、测定和系统之前进行离心。在任意方面的一些实施方式中,测试样品是澄清的测试样品,例如通过离心和收集包含澄清的测试样品的上清液。在任意方面的一些实施方式中,测试样品可为预先加工的测试样品,例如由选自于由离心、过滤、解冻、纯化及它们的任意组合所组成的组中的处理所产生的上清液或滤液。在任意方面的一些实施方式中,可用化学和/或生物试剂处理测试样品。在加工过程中,可使用化学和/或生物试剂来保护和/或维持样品包括其中的生物分子(例如核酸和蛋白质)的稳定性。一种示例性试剂为蛋白酶抑制剂,所述蛋白酶抑制剂通常用于在加工过程中保护或维持蛋白质的稳定性。技术人员非常了解适用于对确定如本文所述的表达产物的水平所需的生物样品进行预先加工的方法和过程。
为方便起见,以下提供了本说明书、实施例和所附权利要求中使用的一些术语和短语的含义。除非另有说明或上下文中隐含,以下术语和短语包括以下提供的含义。提供所述定义旨在帮助描述特定的实施方式,而非旨在限制所要求保护的发明,因为本发明的范围仅由权利要求限制。除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。如果本领域中术语的使用与本文提供的其定义之间存在明显差异,应以本说明书中提供的定义为准。
为方便起见,将本说明书、实施例和所附权利要求中即本文使用的某些术语收集于此。
术语“降低(decrease)”、“减少(reduced/reduction)”、或“抑制(inhibit)”在本文中均用于表示统计学上显著量的降低。在任意方面的一些实施方式中,“减少”或“降低”或“抑制”通常是指与参比水平(例如不存在给定的治疗或药剂)相比,至少10%的降低,并且可包括例如至少约10%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或更多的降低。如本文所用,“减少”或“抑制”不包括与参比水平相比的完全抑制或减少。“完全抑制”为与参比水平相比的100%的抑制。对于不具有给定紊乱的个体,降低可优选地下降至在正常范围内可接受的水平。
术语“增加(increased/increase)”、“增强(enhance)”或“激活(activate)”在本文中均用于表示统计学上显著量的增加。在任意方面的一些实施方式中,术语“增加”、“增强”或“激活”可表示与参比水平相比至少10%的增加,例如与参考水平相比至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%的增加或高达并包括100%增加或介于10%-100%之间的任意增加,或与参比水平相比至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍或至少约10倍的增加,或介于2倍和10倍之间或更多的任意增加。在标志物或症状的上下文中,“增加”是关于该水平的统计学上显著的增加。
如本文所用,“受试者”意指人或动物。通常,动物是脊椎动物,例如灵长类动物、啮齿动物、家养动物或狩猎动物。灵长类动物包括黑猩猩、食蟹猴(cynomologous monkeys)、蜘蛛猴和猕猴(例如恒河猴)。啮齿动物包括小鼠、大鼠、土拨鼠、雪貂、兔子和仓鼠。家养动物和狩猎动物包括牛、马、猪、鹿、野牛、水牛、猫科物种(例如家猫)、犬科物种(例如狗、狐狸、狼)、鸟类物种(例如鸡、鸸鹋、鸵鸟)以及鱼类(例如鳟鱼、鲶鱼和鲑鱼)。在任意方面的一些实施方式中,受试者为哺乳动物,例如灵长类动物(例如人)。术语“个体”、“患者”和“受试者”在本文中可互换使用。
优选地,受试者是哺乳动物。哺乳动物可为人、非人灵长类动物、小鼠、大鼠、狗、猫、马或牛,但不限于这些实例。人以外的哺乳动物可有利地用作代表病症的物模型的受试者。受试者可为雄性或雌性。
受试者可为先前已被诊断患有或被鉴定为遭受或具有需要治疗的病症或与此类病症相关的一种或多种并发症的受试者,并且任选地已经经历了该病症或与该病症相关的一种或多种并发症的治疗的受试者。或者,受试者也可为先前未被诊断为患有该病症或与该病症相关的一种或多种并发症的受试者。例如,受试者可为表现出关于该病症或与该病症相关的一种或多种并发症的一种或多种风险因素的受试者或不表现出风险因素的受试者。
对特定病症的治疗的“有需要的受试者”可为患有该病症、被诊断为患有该病症或处于发展为该病症的风险中的受试者。
在本文所述的各种实施方式中,进一步考虑包括所述的特定多肽的任意的变体(天然存在的或其它方式)、等位基因、同系物、保守修饰变体和/或保守置换变体。对于氨基酸序列,本领域技术人员将认识到,改变了编码序列中的单个氨基酸或小部分氨基酸的对核酸、肽、多肽或蛋白质序列的个体替换、删除或添加是“保守修饰的变体”,其中的改变使得氨基酸被化学上相似的氨基酸置换,并保留了多肽的期望活性。此类保守修饰的变体包括并且不排除符合本公开的多态性变体、种间同系物和等位基因。
给定的氨基酸可被具有相似生理化学特征的残基替换,例如用一个脂肪族残基置换另一个(例如Ile、Val、Leu或Ala置换为另一个),或用一个极性残基置换另一个(例如Lys和Arg之间;Glu和Asp之间;或Gln和Asn之间)。其它此类保守置换(例如具有相似疏水特性的整个区域的置换)是公知的。可在本文所述的任意一种测定中测试包含保守氨基酸置换的多肽以确认期望的活性(例如天然或参比多肽的活性和特异性)得以保留。
氨基酸可根据其侧链性质的相似性进行分组(在A.L.Lehninger,inBiochemistry,第2版,pp.73-75,Worth Publishers,New York(1975)中):(1)非极性:Ala(A)、Val(V)、Leu(L)、Ile(I)、Pro(P)、Phe(F)、Trp(W)、Met(M);(2)不带电荷极性:Gly(G)、Ser(S)、Thr(T)、Cys(C)、Tyr(Y)、Asn(N)、Gln(Q);(3)酸性:Asp(D)、Glu(E);(4)碱性:Lys(K)、Arg(R)、His(H)。或者,天然存在的残基可基于常见的侧链特性分组:(1)疏水性:正亮氨酸、Met、Ala、Val、Leu、Ile;(2)中性亲水性:Cys、Ser、Thr、Asn、Gln;(3)酸性:Asp、Glu;(4)碱性:His、Lys、Arg;(5)影响链取向的残基:Gly、Pro;(6)芳香族:Trp、Tyr、Phe。非保守置换将需要将这些分类之一的成员交换为另一个分类。特定的保守置换包括例如;Ala变为Gly或变为Ser;Arg变为Lys;Asn变为Gln或变为His;Asp变为Glu;Cys变为Ser;Gln变为Asn;Glu变为Asp;Gly变为Ala或变为Pro;His变为Asn或变为Gln;Ile变为Leu或变为Val;Leu变为Ile或变为Val;Lys变为Arg、变为Gln或变为Glu;Met变为Leu、变为Tyr或变为Ile;Phe变为Met、变为Leu或变为Tyr;Ser变为Thr;Thr变为Ser;Trp变为Tyr;Tyr变为Trp;和/或Phe变为Val、变为Ile或变为Leu。
术语“miRNA”和“microRNA”是指源自内源性基因的21-25nt的非编码RNA。它们由更长(约75nt)的发夹样前体(称为pre-miRNA)加工而成。microRNA组装为称为miRNP的复合物,并通过反义互补性识别它们的靶标。如果microRNA与其靶标100%匹配(即互补性是完全的),则靶标mRNA被剪切,且miRNA的作用类似于siRNA。如果匹配不完全(即互补性是部分的),则靶标mRNA的翻译被阻断。
术语“miRNA靶位点”或“microRNA靶位点”是指mRNA靶标中microRNA的特异性靶结合序列。miRNA与其靶位点之间的互补性不必是完全的。
如本文所用,术语“蛋白质”和“多肽”在本文中可互换使用,以指代通过相邻残基的α-氨基基团和羧基基团之间的肽键彼此连接的一系列氨基酸残基。术语“蛋白质”和“多肽”是指氨基酸的聚合物,包括修饰的氨基酸(例如磷酸化、糖化、糖基化等)和氨基酸类似物,无论其大小或功能如何。“蛋白质”和“多肽”通常用于指相对大的多肽,而术语“肽”通常用于指小的多肽,但这些术语在本领域中的用法重叠。当涉及基因产物及其片段时,术语“蛋白质”和“多肽”在本文中可互换使用。因此,示例性多肽或蛋白质包括基因产物、天然存在的蛋白质、同系物、直系同源物、旁系同源物、片段,和上述的其它等同物、变体、片段和类似物。
在任意方面的一些实施方式中,本文所述的多肽(或编码此类多肽的核酸)可为本文所述的氨基酸序列之一的功能片段。如本文所用,“功能片段”是根据本文下文描述的测定保留至少50%的野生型参比多肽活性的肽片段或区段。功能片段可包含本文公开的序列的保守置换。
在任意方面的一些实施方式中,本文所述的多肽可为本文所述的序列的变体。在任意方面的一些实施方式中,所述变体是保守修饰的变体。例如,保守置换变体可通过天然核苷酸序列的突变来获得。如本文所指,“变体”是与天然或参比多肽基本上同源的多肽,但由于一个或多个删除、插入或置换而具有与天然或参比多肽的氨基酸序列不同的氨基酸序列。编码变体多肽的DNA序列当与天然或参比DNA序列相比时,包含含有一个或多个核苷酸添加、删除或置换的序列,但编码保留活性的变体蛋白质或其片段。多种多样的基于PCR位点特异性诱变方法是本领域已知的并且可由普通技术人员来实施。
变体氨基酸或DNA序列可为与天然或参比序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更多的同一性。例如可通过使用万维网上用于此目的的常用的免费可得的计算机程序(例如具有默认设置的BLASTp或BLASTn)比较这两个序列,来确定天然序列和突变序列之间的同源性程度(同一性百分比)。
天然氨基酸序列的改变可通过本领域技术人员已知的多种技术中的任一种来实现。可例如通过合成含有突变序列的寡核苷酸并且其侧翼有限制性位点以能够与天然序列的片段连接,从而在特定基因座引入突变。连接后,所得的重建序列编码具有所需氨基酸插入、置换或删除的类似物。或者,可采用寡核苷酸定向的位点特异性诱变程序来提供具有根据所需的置换、删除或插入而改变的特定密码子的经改变的核苷酸序列。进行此类改变的技术已经非常成熟,且包括例如由以下公开的技术:Walder等,(Gene 42:133,1986);Bauer等,(Gene 37:73,1985);Craik(BioTechniques,January 1985,12-19);Smith等,(GeneticEngineering:Principles and Methods,Plenum Press,1981)和美国专利号4,518,584和4,737,462,通过引用的方式将它们的整体并入本文。任何不参与维持多肽正确构象的半胱氨酸残基也可被置换,通常置换为丝氨酸替换,以提高分子的氧化稳定性并防止异常交联。相反,可将一个或多个半胱氨酸键添加到多肽中以提高其稳定性或促进寡聚化。
如本文所用,术语“红细胞生成”是产生红血细胞的过程,该过程从红细胞生成的干细胞发育为成熟红血细胞。如本文所用,术语“红系细胞”是指红血细胞。
如本文所用,术语“核酸”或“核酸序列”是指合并核糖核酸、脱氧核糖核酸或其类似物的单元的任意分子,优选聚合的分子。所述核酸可为单链或双链。单链核酸可为变性的双链DNA的一条核酸链。或者,它可为不是源自任何双链DNA的单链核酸。在任意实施方式的一个方面中,核酸可为DNA。在另一方面中,核酸可为RNA。合适的DNA可包括例如基因组DNA或cDNA。合适的RNA可包括例如mRNA。
术语“表达”是指涉及产生RNA和蛋白质以及适当时位分泌蛋白质的细胞过程,在适用的情况下包括但不限于例如转录、转录本加工、翻译、和蛋白质折叠、修饰和加工。表达可指源自本发明的一个或多个核酸片段的有义(mRNA)或反义RNA的转录和稳定积累和/或指mRNA翻译为多肽。
在任意方面的一些实施方式中,本文所述的生物标志物、靶标或基因/多肽的表达是组织特异性的。在任意方面的一些实施方式中,本文所述的生物标志物、靶标或基因/多肽的表达是整体的。在任意方面的一些实施方式中,本文所述的生物标志物、靶标或基因/多肽的表达是系统性的。
如本文所用,“表达产物”包括从基因转录的RNA,和通过翻译从基因转录的mRNA获得的多肽。术语“基因”意指当与适当的调控序列可操作地连接时在体外或体内转录(DNA)成为RNA的核酸序列。所述基因可包括或可不包括编码区域之前和之后的区域,例如5'非翻译(5'UTR)或“前导”序列以及3'UTR或“尾部(trailer)”序列,以及各个编码片段(外显子)之间的插入序列(内含子)。
如本文所用,“5'UTR”或“5'非翻译区域”或“5'前导序列”是指不翻译的mRNA区域。5'UTR通常在转录起始位点开始,并刚好在编码区域的翻译起始位点或起始密码子(通常是mRNA中的AUG,DNA序列中的ATG)之前结束。5'UTR的长度可通过突变来修饰,例如5'UTR的置换、删除或插入。5'UTR可通过突变天然存在的起始密码子或翻译起始位点而进一步修饰,从而使得所述密码子不再作为起始密码子起作用并且翻译可在替代的起始位点起始。
如本文所用,“表达增强子”、“增强子序列”或“增强子元件”是指能够增强与它们可操作地连接的下游异源开放阅读框(ORF)的表达的核酸序列。
如本文所用,术语“转录后调控”是指在RNA水平上,介于基因的转录和翻译之间对基因表达的控制。
如本文所用,术语“可操作地连接”是指直接或间接相互作用以执行预期功能(例如介导或调制核酸序列的表达)的序列。可操作地连接的序列的相互作用可以例如由与可操作地连接的序列相互作用的蛋白质介导。通常,它是指转录调控序列与转录序列的功能关系。例如,启动子序列如果在合适的宿主细胞或其它表达系统中刺激或调制开放阅读框的转录,则它与开放阅读框可操作地连接。通常,与转录序列可操作地连接的启动子转录调控序列与该转录序列在物理上连续,即它们是顺式作用的。然而,一些转录调控序列(例如增强子)不需要在物理上与它们所增强转录的开放阅读框连续或位于它们所增强转录的开放阅读框紧临。
在本发明的上下文中,“标志物”是指表达产物(例如核酸或多肽),与从对照受试者(例如健康受试者)采集的可比较的样品相比,所述表达产物在取自具有增加的中性粒细胞积累和/或polyP的受试者的样品中差异地存在。术语“生物标志物”与术语“标志物”可互换使用。
在任意方面的一些实施方式中,本文所述的方法涉及测量、检测或确定至少一种标志物的水平。如本文所用,术语“检测”或“测量”是指观测来自例如探针、标记或靶分子的信号,以指示样品中分析物的存在。本领域已知的用于检测特定标记部分的任何方法均可用于检测。示例性检测方法包括但不限于光谱、荧光、光化学、生物化学、免疫化学、电学、光学或化学方法。在任意方面的一些实施方式中,测量可为定量观测。
在任意方面的一些实施方式中,可对如本文所述的多肽、核酸或细胞进行工程化。如本文所用,“工程化的”是指已被人的手操纵的方面。例如,当多肽的至少一个方面(例如其序列)已经由人的手操纵使得与自然界中存在的方面不同时,所述多肽被认为是“工程化的”。按照通常的做法以及本领域技术人员所理解,工程化细胞的后代通常仍然被称为“工程化的”,即使实际操作是在先前实体上进行的。
如本文所用,术语“远端”是指基因上游的核酸序列,其可包含额外的调控元件(例如远端启动子元件是可与它们所调控的基因相距许多千碱基的调控DNA序列)。DNA或RNA的每条链各自都有5'端和3'端,因脱氧核糖(或核糖)环上的碳位置而得名。如本文所用,术语“上游”是指其中发生RNA转录的分别在DNA和/或RNA中5'至3'方向的遗传密码的相对位置。
术语“外源性”是指存在于并非其天然来源的细胞中的物质。术语“外源性”当在本文中使用时可指已通过人的手参与的过程导入至生物系统(例如细胞或生物体)中的核酸(例如,编码多肽的核酸)或多肽,在该系统中它通常不存在并且希望将所述核酸或多肽引入此类细胞或生物体。或者,“外源性”可指已通过人的手参与的过程导入至生物系统(例如细胞或生物体)中的核酸或多肽,在该系统中它以相对低的量存在并且希望增加该细胞或生物体中所述核酸或多肽的量(例如以产生异位表达或水平)。相反,术语“内源性”是指生物系统或细胞的天然物质。如本文所用,“异位的”是指以不寻常的位置和/或量存在的物质。异位的物质可为通常在给定细胞中存在的物质,但量少得多和/或在不同时间被发现。异位的还包括物质,例如在其自然环境中的给定细胞中并非天然存在或表达的多肽或核酸。
在任意方面的一些实施方式中,本文所述的核酸(例如抑制性核酸)当其包含在载体中时被提供或被给予。在本文所述的一些方面中,核酸序列与载体可操作地连接。如本文所用,术语“载体”是指设计用于递送至宿主细胞或用于在不同宿主细胞之间转移的核酸构建体。如本文所用,载体可为病毒的或非病毒的。
术语“载体”包括当与适当的控制元件相关联时能够复制并且可将基因序列转移至细胞的任意遗传元件。载体可包括但不限于克隆载体、表达载体、质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒粒子等。载体可为质粒或慢病毒载体。
如本文所用,术语“病毒载体”是指包括病毒来源的至少一个元件并且具有被包装到病毒载体颗粒中的能力的核酸载体构建体。病毒载体可包含代替了非必需病毒基因的如本文所述的编码多肽的核酸。所述载体和/或颗粒可用于在体外或体内两者之一中将任意核酸转移至细胞中的目的。病毒载体的多种形式在本领域中是已知的。
“重组载体”是指包括异源核酸序列或能够在体内表达的“转基因”的载体。应当理解,在任意方面的一些实施方式中,本文所述的载体可与其它合适的组合物和疗法组合。在任意方面的一些实施方式中,载体是附加型的。合适的附加型载体的使用提供了在受试者中以高拷贝数的染色体外DNA维持感兴趣的核苷酸的手段,从而消除染色体整合的潜在影响。在任意方面的一些实施方式中,所述载体是重组的(例如它包含源自至少两个不同来源的序列)。在任意方面的一些实施方式中,所述载体包含源自至少两个不同物种的序列。在任意方面的一些实施方式中,所述载体包含源自至少两个不同基因的序列,例如它包含融合蛋白或编码表达产物的核酸,所述核酸与至少一个非天然(例如异源)遗传控制元件(例如启动子、抑制子、激活子、增强子、反应元件等)可操作地连接。
如本文所用,术语“异源的”是指源自外来物种的核酸序列或多肽,或者如果来自相同物种,则其原始形式基本上被修饰。
在任意方面的一些实施方式中,本文所述的载体或核酸是密码子优化的,例如核酸序列的天然或野生型序列已被改变或工程化以包括替代密码子,从而使得改变的或工程化的核酸编码与天然/野生型序列相同的多肽表达产物,但将在期望的表达系统中以改善的效率进行转录和/或翻译。在任意方面的一些实施方式中,表达系统是除天然/野生型序列(或从此类生物体获得的细胞)的来源之外的生物体。在任意方面的一些实施方式中,本文所述的载体和/或核酸序列是密码子优化的,以在哺乳动物或哺乳动物细胞(例如小鼠、小鼠细胞或人细胞)中表达。在任意方面的一些实施方式中,本文所述的载体和/或核酸序列是密码子优化的,以在人细胞中表达。在任意方面的一些实施方式中,本文所述的载体和/或核酸序列是密码子优化的,以在酵母或酵母细胞中表达。在任意方面的一些实施方式中,本文所述的载体和/或核酸序列是密码子优化的,以在细胞中表达。在任意方面的一些实施方式中,本文所述的载体和/或核酸序列是密码子优化的,以在大肠杆菌(E.coli)细胞中表达。
如本文所用,术语“表达载体”是指指导由与载体上的转录调控序列连接的序列表达RNA或多肽的载体。表达的序列通常但不必须与细胞为异源的。表达载体可包含附加的元件,例如表达载体可具有两个复制系统,从而允许其在两种生物体中维持(例如在人细胞中用于表达和在原核宿主中用于克隆和扩增)。
术语“调控序列”旨在包括启动子、增强子和其它表达控制元件(例如聚腺苷酸化信号),从而控制与其可操作地连接的基因的转录或翻译。在例如Goeddel;GeneExpression Technology.Methods in Enzymology 185,Academic Press,San Diego,Calif.(1990)中描述了此类调控序列。用于哺乳动物宿主细胞表达的调控序列的实例包括指导在哺乳动物细胞中高水平蛋白质表达的病毒元件,例如源自巨细胞病毒(CMV)、猿猴病毒40(SV40)、腺病毒(例如腺病毒主要晚期启动子(AdMLP))和多瘤病毒的启动子和/或增强子。或者,可使用非病毒调控序列,例如泛素启动子、延伸因子1-α1(eEF1a1)启动子或β-珠蛋白启动子。真核启动子是位于基因上游的DNA调控区域,其结合转录因子II D(TFIID)并允许转录起始复合物的组分的后续协调,促进RNA聚合酶II的募集和转录的起始。具有复杂启动子的基因可能会选择性地利用调控元件(例如增强子和沉默子),允许根据需要进行不同水平的表达。
如本文所用,术语“治疗(treat/treatment/treating)”或“缓解(amelioration)”是指治疗性治疗,其中目的是逆转、减轻、缓解、抑制、减慢或停止与疾病或紊乱相关的病症的进展或严重程度,例如肺部感染和/或肺部炎症。术语“治疗”包括减少或减轻病症相关的病症、疾病或紊乱的至少一种副作用或症状。如果一种或多种症状或临床标志物减少,治疗通常是“有效的”。或者,如果疾病的进展减少或停止,治疗是“有效的”。也就是说,“治疗”不仅包括症状或标志物的改善,还包括与在没有治疗的情况下预期的情况相比,中止或至少减缓症状的进展或恶化。有益的或期望的临床结果包括但不限于减轻一种或多种症状、减小疾病程度、稳定(即不恶化)疾病状态、延迟或减缓疾病进展、缓解或缓和疾病状态、减退(无论是部分还是全部)和/或降低的死亡率,无论是可检测的还是不可检测的。疾病的术语“治疗”还包括提供疾病的症状或副作用的减轻(包括姑息治疗)。
如本文所用,术语“药物组合物”是指与药学上可接受的运载体(例如制药工业中常用的载体)组合的活性剂。短语“药学上可接受的”在本文中用于指在合理医学判断范围内适合与人和动物组织接触使用而不会过度的毒性、刺激、过敏反应或其它问题或并发症,与合理的收益/风险比相称的那些化合物、材料、组合物和/或剂型。在任意方面的一些实施方式中,药学上可接受的运载体可为除水之外的运载体。在任意方面的一些实施方式中,药学上可接受的运载体可为乳膏、乳液、凝胶、脂质体、纳米颗粒和/或油膏。在任意方面的一些实施方式中,药学上可接受的运载体可为人工或工程化的运载体,例如活性成分在自然界中不被发现的运载体。
如本文所用,术语“给予”是指通过使得在期望位点至少部分递送药剂的方法或途径将如本文所公开的化合物放置到受试者中。包含本文所公开的化合物的药物组合物可以通过在受试者中产生有效治疗的任何适当途径给予。在任意方面的一些实施方式中,给予包括人的身体活动,例如注射、摄取动作、涂抹动作和/或递送装置或机器的操作。此类活动可以例如由医学专业人员和/或被治疗的受试者进行。
如本文所用,“接触”是指用于将药剂递送或暴露于至少一个细胞的任何合适方式。示例性递送方法包括但不限于直接递送至细胞培养基、灌注、注射或本领域技术人员公知的其它递送方法。在任意方面的一些实施方式中,接触包括人的身体活动(例如注射;分配、混合和/或倾析的行为);和/或操作递送设备或机器。
术语“统计学上显著的”或“显著地”是指统计学显著性并且通常意指两个标准差(2SD)或更大的差异。
除在操作实例中或在另外指明的情况下之外,本文使用的表示成分或反应条件的量的所有数字应理解为在所有情况下由术语“约”修饰。与百分比结合使用时,术语“约”可表示±1%。
如本文所用,术语“包括/包含”意指除所呈现的定义的要素之外,还可存在其它的要素。使用“包括/包含”表示包括而非限制。
术语“由……组成”是指如本文所述的组合物、方法及其各自的组分,其排除在实施方式的描述中未列举的任何要素。
如本文所用,术语“基本上由……组成”是指给定实施方式所需的那些要素。该术语允许存在不实质上影响本发明的该实施方式的基本的和新颖或功能的特性的附加要素。
如本文所用,术语“特异性结合”是指两个分子、化合物、细胞和/或颗粒之间的化学相互作用,其中,第一实体以比它结合至非靶标的第三实体更大的特异性和亲和力结合至第二靶标实体。在任意方面的一些实施方式中,特异性结合可指第一实体对第二靶标实体的亲和力为对第三非靶标实体的亲和力的至少10倍、至少50倍、至少100倍、至少500倍、至少1000倍或更大。对给定的靶标具有特异性的试剂是在所使用的测定条件下表现出对该靶标特异性结合的试剂。
除非上下文另有明确指出,单数术语“一个/一种(a/an)”和“该/所述(the)”包括复数所指对象。类似地,除非上下文另有明确说明,否则词语“或”旨在包括“和”。尽管在本公开的实践或测试中可以使用与本文所述的那些方法和材料相似或等同的方法和材料,下文描述了合适的方法和材料。缩写“e.g.”源自拉丁语exempli gratia,且在本文用于表示非限制性实例。因此,缩写“e.g.”与术语“例如”同义。
本文所公开的本发明的替代要素或实施方式的分组不应被解释为限制。每个组成员可单独或与组的其它成员或在本文中发现的其它要素任意组合被提及和要求保护。出于方便和/或可专利性的原因,组的一个或多个成员可包含在组中或从组中删除。当发生任何此类包含或删除时,本说明书在此被视为包含所修改的组,从而满足所附权利要求中使用的所有马库什组的书面描述。
除非本文另有定义,否则与本申请相关的科学和技术术语应具有本公开所属领域的普通技术人员通常理解的含义。应当理解,本发明不限于本文所述的特定方法学、方案和试剂等,因此可以变化。本文使用的术语仅用于描述特定实施方式的目的,并不旨在限制本发明的范围,本发明的范围仅由权利要求限定。免疫学和分子生物学中常用术语的定义可见于:The Merck Manual of Diagnosis and Therapy,第20版,Merck Sharp&Dohme Corp.出版,2018(ISBN 0911910190,978-0911910421);Robert S.Porter等(编著),TheEncyclopedia of Molecular Cell Biology and Molecular Medicine,BlackwellScience Ltd.出版,1999-2012(ISBN9783527600908);以及Robert A.Meyers(编著),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,VCHPublishers,Inc.出版,1995(ISBN 1-56081-569-8);Immunology by Werner Luttmann,Elsevier出版,2006;Janeway's Immunobiology,Kenneth Murphy,Allan Mowat,CaseyWeaver(编著),W.W.Norton&Company,2016(ISBN 0815345054,978-0815345053);Lewin'sGenes XI,Jones&Bartlett Publishers出版,2014(ISBN-1449659055);Michael RichardGreen和Joseph Sambrook,Molecular Cloning:A Laboratory Manual,第4版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(2012)(ISBN1936113414);Davis等,Basic Methods in Molecular Biology,Elsevier SciencePublishing,Inc.,New York,USA(2012)(ISBN 044460149X);Laboratory Methods inEnzymology:DNA,Jon Lorsch(编著)Elsevier,2013(ISBN 0124199542);CurrentProtocols in Molecular Biology(CPMB),Frederick M.Ausubel(编著),John Wiley andSons,2014(ISBN 047150338X,9780471503385),Current Protocols in Protein Science(CPPS),John E.Coligan(编著),John Wiley and Sons,Inc.,2005;以及CurrentProtocols in Immunology(CPI)(John E.Coligan,ADA M Kruisbeek,David HMargulies,Ethan M Shevach,Warren Strobe,(编著)John Wiley and Sons,Inc.,2003(ISBN 0471142735,9780471142737);通过引用的方式将它们全部以其整体并入本文。
其它术语在本文中本发明的各个方面的描述内定义。
为了描述和公开的目的,以引用的方式将本申请全文所引用的所有专利和其它出版物(包括参考文献、颁发的专利、公布的专利申请和共同未决的专利申请)明确并入本文,例如此类出版物中描述的方法学可能与本文所述的技术结合使用。提供这些公开文本仅因为它们在本申请的申请日之前公开。在这方面的任何内容都不应被解释为承认因在先发明或任何其它原因而本发明人无权先于此类公开。所有关于日期的陈述或关于这些文件内容的表示均基于申请人可获得的信息,并不构成对这些文件的日期或内容的正确性的任何承认。
本公开的实施方式的描述并非旨在是详尽的或将本公开限制为所公开的精确形式。虽然出于说明的目的本文中描述了本公开的特定实施方式和实例,但是如相关领域的技术人员将认识到的,在本公开的范围内各种等效修饰是可能的。例如,虽然方法步骤或功能以给定的顺序呈现,但替代实施方式可以以不同的顺序执行功能,或者可基本同时地执行功能。本文提供的本公开的教导可适当地应用于其它程序或方法。可组合本文描述的各种实施方式以提供进一步的实施方式。如果需要,可修改本公开的方面以采用以上参考文献和应用的组成、功能和概念来提供本公开的更进一步的实施方式。此外,出于生物功能等效性的考虑,可在不影响生物或化学活动的种类或量的情况下对蛋白质结构进行一些改变。根据详细描述,可对本公开做出这些和其它改变。所有这些修饰都旨在包括在所附权利要求的范围内。
前述实施方式的任一个的特定要素可组合或替代其它实施方式中的要素。此外,虽然已经在这些实施方式的上下文中描述了与本公开的某些实施方式相关的优点,但其它实施方式也可展现出此类优点,并且并非所有实施方式都必须展现出此类优点以落入本公开的范围内。
本文所述的技术的一些实施方式可根据以下编号段落中的任一项来定义:
1.一种核酸序列,所述核酸序列包含
a.至少一个异源调控序列,所述异源调控序列选自于造血增强子元件和用于HSC限制性miRNA的miRNA结合位点;以及
b.编码GATA结合因子1(GATA1)多肽的序列。
2.如段落1所述的核酸序列,所述核酸序列包含至少一个造血增强子元件。
3.如段落2所述的核酸序列,其中,所述增强子元件包含与选自于由以下序列组成的组中的核苷酸序列具有至少80%同源性的序列:SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:38和/或SEQ ID NO:39。
4.如段落2所述的核酸序列,其中,所述增强子元件包含选自于由以下组成的组的基因的增强子元件:
Kell金属内肽酶(KEL);5'氨基乙酰丙酸合酶2(ALAS2);和血型糖蛋白A(GYPA)。
5.如段落1-4中任一项所述的核酸序列,所述核酸序列包含用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
6.如段落1-5中任一项所述的核酸序列,其中,所述用于至少一个HSC限制性miRNA的至少一个miRNA结合位点选自于由用于以下的miR结合位点所组成的组:miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126miR126、miR181、miR193、miR223T、miR542和let7e。
7.如段落1-6中任一项所述的核酸序列,所述核酸序列包含至少一个造血增强子元件以及用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
8.如段落1-7中任一项所述的核酸序列,所述核酸序列进一步包含:
a.异源5'UTR,所述异源5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列,
ii.至少20个核苷酸的序列,和/或
iii.1-25个上游密码子uAUG;和/或
b.造血增强子微小基因。
9.一种核酸序列,所述核酸序列包含
a.5'UTR,所述5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列;
ii.至少20个核苷酸的序列;和/或
iii.1-25个上游密码子uAUG;
b.编码GATA结合因子1(GATA1)多肽的序列。
10.如段落1-9中任一项所述的核酸序列,其中,所述5'UTR包含选自于由以下组成的组的基因的5'UTR:Runt相关转录因子1(RUNX1)、LIM Domain Only 2(LMO2)或ETS变体6(ETV6)。
11.如段落1-10中任一项所述的核酸序列,所述核酸序列进一步包含至少一个造血增强子元件、用于HSC限制性miRNA的miRNA结合位点和/或造血增强子微小基因(G1HEM)。
12.一种核酸序列,所述核酸序列包含:
a.造血增强子微小基因(G1HEM);
b.编码GATA结合因子1(GATA1)多肽的序列。
13.如段落12所述的核酸序列,其中,所述造血增强子微小基因(mG1HEM)包含与核苷酸序列SEQ ID NO:13具有至少80%同源性的序列。
14.如段落12-13中任一项所述的核酸序列,所述核酸序列进一步包含5'UTR、和/或至少一个造血增强子元件;和/或用于HSC限制性miRNA的至少一个miRNA结合位点,
所述5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列,
ii.至少20个核苷酸的序列,和/或
iii.1-25个上游密码子uAUG。
15.如段落14所述的核酸序列,其中,所述除GATA1以外的造血转录因子的5'UTR序列为选自于由以下组成的组的基因的5'UTR序列:Runt相关转录因子1(RUNX1);
至少一个造血增强子元件;
和/或用于HSC限制性miRNA的至少一个miRNA结合位点。
16.如段落1-15中任一项所述的核酸序列,其中,所述用于至少一个HSC限制性miRNA的结合位点包含选自于SEQ ID NO:31-SEQ ID NO:37和SEQ ID NO:43-SEQ ID NO:55的序列。
17.如段落1-16中任一项所述的核酸序列,其中,所述造血增强子元件包含与选自于SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:38和SEQ ID NO:39的序列具有至少80%序列同一性的序列。
18.如段落1-17中任一项所述的核酸序列,其中,所述5'UTR序列包含与选自于SEQID NO:14、SEQ ID NO:15和SEQ ID NO:16的序列具有至少80%序列同一性的序列。
19.如段落1-18中任一项所述的核酸序列,其中,所述序列包含与a和b的元件可操作地连接的启动子。
20.如段落19所述的核酸序列,其中,所述启动子不为GATA1启动子。
21.如段落20所述的核酸序列,其中,所述启动子包含延伸因子1-α1(eEF1a1)的启动子序列。
22.如段落1-21中任一项所述的核酸序列,其中,所述编码GATA结合因子1(GATA1)多肽的序列包含与编码人GATA1多肽的核苷酸序列具有至少60%序列同一性的序列。
23.如段落1-22中任一项所述的核酸序列,所述核酸序列进一步包含:
与编码所述GATA1多肽的序列可操作地连接的转录后调控元件。
24.如段落23所述的核酸序列,其中,所述转录后调控元件包括土拨鼠肝炎病毒转录后调控元件(WPRE)。
25.如段落1-24中任一项所述的核酸序列,所述核酸序列进一步包含内部核糖体进入位点。
26.如段落25所述的核酸序列,其中,所述内部核糖体进入位点与标志物基因可操作地连接,并且其中,所述标志物基因编码光学可见的蛋白质或酶。
27.如段落1-26中任一项所述的核酸序列,其中,所述序列包含选自于SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:61和SEQ ID NO:62的序列。
28.如段落1-27中任一项所述的核酸序列,其中,所述核酸序列为载体。
29.如段落28所述的核酸序列,其中,所述载体为质粒、或腺病毒载体、慢病毒载体或逆转录病毒载体。
30.一种包含如段落1-30中任一项所述的核酸序列的慢病毒颗粒。
31.一种组合物,所述组合物包含如段落1-31中任一项所述的核酸序列或颗粒以及药学上可接受的运载体。
32.一种治疗有需要的受试者中的Diamond-Blackfan贫血的方法,所述方法包括向所述患者给予治疗有效量的如段落1-31中任一项所述的核酸序列、颗粒或组合物。
33.一种恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述方法包括使包含早期红系祖细胞的细胞群与如段落1-31中任一项所述的核酸序列、颗粒或组合物接触。
34.如段落33所述的方法,其中,所述早期红系祖细胞包含DBA相关的基因突变。
本文描述的技术的一些实施方式可根据以下编号段落中的任一项来定义:
1.一种核酸序列,所述核酸序列包含
a.至少一个异源调控序列,所述异源调控序列选自于造血增强子元件和用于HSC限制性miRNA的miRNA结合位点;以及
b.编码GATA结合因子1(GATA1)多肽的序列。
2.如段落1所述的核酸序列,所述核酸序列包含至少一个造血增强子元件。
3.如段落2所述的核酸序列,其中,所述增强子元件包含与选自于由以下序列所组成的组中的核苷酸序列具有至少80%同源性的序列:SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:38和/或SEQ ID NO:39。
4.如段落2所述的核酸序列,其中,所述增强子元件包含选自于由以下所组成的组的基因的增强子元件:
Kell金属内肽酶(KEL);5'氨基乙酰丙酸合酶2(ALAS2);和血型糖蛋白A(GYPA)。
5.如段落1-4中任一项所述的核酸序列,所述核酸序列包含用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
6.如段落1-5中任一项所述的核酸序列,其中,所述用于至少一个HSC限制性miRNA的至少一个miRNA结合位点选自于由用于以下的miR结合位点所组成的组:miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126miR126、miR181、miR193、miR223T、miR542和let7e。
7.如段落1-6中任一项所述的核酸序列,所述核酸序列包含至少一个造血增强子元件以及用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
8.如段落1-7中任一项所述的核酸序列,所述核酸序列进一步包含:
a.异源5'UTR,所述异源5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列,
ii.至少20个核苷酸的序列,和/或
iii.1-25个上游密码子uAUG;和/或
b.造血增强子微小基因。
9.一种核酸序列,所述核酸序列包含:
a.5'UTR,所述5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列,
ii.至少20个核苷酸的序列,和/或
iii.1-25个上游密码子uAUG;
b.编码GATA结合因子1(GATA1)多肽的序列。
10.如段落1-9中任一项所述的核酸序列,其中,所述5'UTR包含选自于由以下所组成的组的基因的5'UTR:Runt相关转录因子1(RUNX1)、LIM Domain Only 2(LMO2)或ETS变体6(ETV6)。
11.如段落1-10中任一项所述的核酸序列,所述核酸序列进一步包含至少一个造血增强子元件、用于HSC限制性miRNA的miRNA结合位点和/或造血增强子微小基因(G1HEM)。
12.一种核酸序列,所述核酸序列包含
a.造血增强子微小基因(G1HEM);
b.编码GATA结合因子1(GATA1)多肽的序列。
13.如段落12所述的核酸序列,其中,所述造血增强子微小基因(mG1HEM)包含与核苷酸序列SEQ ID NO:13具有至少80%同源性的序列。
14.如段落12-13中任一项所述的核酸序列,所述核酸序列进一步包含5'UTR、和/或至少一个造血增强子元件、和/或用于HSC限制性miRNA的至少一个miRNA结合位点,
所述5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列;
ii.至少20个核苷酸的序列;和/或
iii.1-25个上游密码子uAUG。
15.如段落14所述的核酸序列,其中,所述除GATA1以外的造血转录因子的5'UTR序列为选自于由以下所组成的组的基因的5'UTR序列:Runt相关转录因子1(RUNX1);
至少一个造血增强子元件;
和/或用于HSC限制性miRNA的至少一个miRNA结合位点。
16.如段落1-15中任一项所述的核酸序列,其中,所述用于至少一个HSC限制性miRNA的结合位点包含选自于SEQ ID NO:31-SEQ ID NO:37和SEQ ID NO:43-SEQ ID NO:55的序列。
17.如段落1-16中任一项所述的核酸序列,其中,所述造血增强子元件包含与选自于SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:38和SEQ ID NO:39的序列具有至少80%序列同一性的序列。
18.如段落1-17中任一项所述的核酸序列,其中,所述5'UTR序列包含与选自于SEQID NO:14、SEQ ID NO:15和SEQ ID NO:16的序列具有至少80%序列同一性的序列。
19.如段落1-18中任一项所述的核酸序列,其中,所述序列包含与a和b的元件可操作地连接的启动子。
20.如段落19所述的核酸序列,其中,所述启动子不为GATA1启动子。
21.如段落20所述的核酸序列,其中,所述启动子包含延伸因子1-α1(eEF1a1)的启动子序列。
22.如段落1-21中任一项所述的核酸序列,其中,所述编码GATA结合因子1(GATA1)多肽的序列包含与编码人GATA1多肽的核苷酸序列具有至少60%序列同一性的序列。
23.如段落1-22中任一项所述的核酸序列,所述核酸序列进一步包含:
与编码所述GATA1多肽的序列可操作地连接的转录后调控元件。
24.如段落23所述的核酸序列,其中,所述转录后调控元件包括土拨鼠肝炎病毒转录后调控元件(WPRE)。
25.如段落1-24中任一项所述的核酸序列,所述核酸序列进一步包含内部核糖体进入位点。
26.如段落25所述的核酸序列,其中,所述内部核糖体进入位点与标志物基因可操作地连接,并且其中,所述标志物基因编码光学可见的蛋白质或酶。
27.如段落1-26中任一项所述的核酸序列,其中,所述序列包含选自于SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:61和SEQ ID NO:62的序列。
28.如段落1-27中任一项所述的核酸序列,其中,所述核酸序列为载体。
29.如段落28所述的核酸序列,其中,所述载体为质粒、或腺病毒载体、慢病毒载体或逆转录病毒载体。
30.一种包含如段落1-30中任一项所述的核酸序列的慢病毒颗粒。
31.一种组合物,所述组合物包含如段落1-31中任一项所述的核酸序列或颗粒以及药学上可接受的运载体。
32.一种治疗有需要的受试者中的Diamond-Blackfan贫血的方法,所述方法包括向患者给予治疗有效量的如段落1-31中任一项所述的核酸序列、颗粒或组合物。
33.一种恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述方法包括使包含早期红系祖细胞的细胞群与如段落1-31中任一项所述的核酸序列、颗粒或组合物接触。
34.如段落33所述的方法,其中,所述早期红系祖细胞包含DBA相关的基因突变。
35.如段落1-31中任一项所述的核酸序列、颗粒或组合物用于治疗有需要的受试者中的Diamond-Blackfan贫血的用途。
本文描述的技术通过以下实施例进一步说明,这些实施例绝不应被解释为进一步限制。
实施例
实施例1:使用GATA1基因疗法治疗DBA的方法
Diamond-Blackfan贫血(DBA),也称为先天性发育不良性贫血,是1938年首次描述的病症,且其特征在于患者骨髓中缺乏红血细胞祖细胞和前体细胞,而造血作用的所有其它方面以表面上正常的方式发生(1,2)。估计每100,000至200,000例活产婴儿中大约有1例出现DBA(3),尽管考虑到许多被发现具有可变表达能力或可能被误诊的个体,这可能低估了。几十年来,DBA的诊断主要基于临床标准进行,并辅以生物标志物红细胞腺苷脱氨酶的使用,该酶在~80%的DBA患者中升高(3)。
经过跨越1990年代的大部分时间的广泛绘制工作,1999年通过鉴定在19号染色体上具有易位的个体发现了第一个在DBA中发生突变的基因(4)。令人惊讶的是,在大约20%-25%的DBA病例中,在这个最初的突变基因(该基因是泛在表达的核糖体蛋白(RP)基因RPS19)中鉴别出杂合性功能丧失突变(heterozygous loss of function mutations)。这立即引发了很多关于潜在机制的猜测,以及是否可能参与RPS19的核糖体或非核糖体作用。许多随后的研究表明,由于RP单倍不足,受损的核糖体生物发生似乎是导致此种表型的主要因素,表明了核糖体活性/水平在此种表型中的作用(5)。然而,该紊乱的红系特异性的潜在基础仍然是个谜。
在DBA患者的同期群(cohort)中的后续研究采用靶向测序、使用单核苷酸多态性微阵列/比较基因组杂交评估拷贝数变异或全外显子组测序,揭示了总共19个不同的RP具有杂合性功能丧失突变,该突变导致RP单倍不足(6,7)。总的来说,这些突变解释了大约60%-80%的DBA病例的病因。这19个RP基因突变不均匀地分布在整个核糖体中,并且涉及核糖体的大亚基(60S)和小亚基(40S)两者。核糖体的特定结构区域没有突变的聚集(8)。最近,通过在超过450名诊断为DBA的患者的同期群上的全外显子组测序,本发明人已鉴别出另外7个RP基因突变,使与该紊乱有关的RP基因总数达到26个,共同解释了大约80%的DBA病例潜在的基础(构成核糖体的RP的近1/3)(9)。
尽管在了解DBA的大部分遗传原因方面取得了进展,但仍存在两个主要限制。尽管关于大多数DBA病例中的杂合性RP功能缺失突变有强有力的发现结果,但这如何能导致DBA中红系特异性造血缺陷仍然成谜(10)。其次,目前可用于治疗DBA患者的疗法非常有限(3,10)。一些患者对皮质类固醇有反应,但通常存在明显的副作用,限制了该疗法在大多数患者中的长期有效性。许多患者需要长期红血细胞输注,这可能与严重且难以控制的铁过载有关。最后,一些患者可通过使用同种异体的骨髓移植治愈,但鉴于在这种情况下非亲缘关系的供体移植表现出的不良结果,通常这仅限于那些有匹配的同胞供体的患者(11)。迄今为止,仅开发了有限的候选实验疗法,并且遗憾的是,许多在后期的临床前或临床研究中并未显示出稳健的功效(12)。因此,迫切需要新的和改善的DBA疗法,这种疗法可对患有这种病症的大多数患者有效,该病症由于主要影响RP基因的大量不同的突变所引起。
考虑到这些局限性,本发明人推断通过人类遗传学结合机械跟踪的使用对DBA进一步研究可让我们进一步了解这种紊乱,并允许我们确定改善的治疗策略。本发明人随后鉴别出了该紊乱中的第一个非RP基因突变。本发明人鉴别出数名诊断为DBA的患者具有损害造血主转录因子GATA1的长蛋白形式产生的突变(13)。随后也报道了数名其它具有类似突变类型的患者(14-16)。虽然这些发现表明GATA1突变可能引起类似于DBA的表型,但更常见的RP基因突变与GATA1突变之间是否存在分子联系尚不清楚。
本发明人测试了RP单倍不足(DBA的最常见病因)是否会改变GATA1翻译。本发明人可以证明使用在RP单倍不足的背景下GATA1mRNA翻译受损的DBA患者样品中以及原代人造血干细胞和祖细胞(HSPC)中的两种RP抑制,而各种其它红系重要转录本在这种情况下在它们的翻译方面不受影响(15)。此外,本发明人证明了通过慢病毒表达增加GATA1蛋白水平足以挽救来自具有各种RP基因突变的DBA患者的单核细胞中存在的红系分化缺陷(达到在正常个体中所见的水平)。这些结果产生了如图1所示的关于DBA的发病机制的模型。
然而,仍然存在许多问题。(1)目前尚不清楚在RP单倍不足的背景下核糖体具体是如何被改变的。在这种情况下,核糖体的组成可能会发生变化,尽管在这种状况下发现的28个不同的RP突变使这看起来不太可能。另一种,虽然并不相互排斥,但在RP单倍不足的背景下,但可能是核糖体水平降低。(2)超出最初研究中专门测试的转录本的转录本范围以及这些转录本的共同特征尚不清楚。(3)出现这些缺陷的造血阶段也不清楚。
然后,本发明人采用核糖体谱分析方法以在基因组水平上更好地了解哪些转录本受到由于DBA相关的分子病变引起的这种核糖体水平降低的影响(19,20)。本发明人能够从正在经历红系谱系定型(红系分化功能缺陷出现的阶段)的RP单倍不足HSPC获得高质量的核糖体分析数据。重要的是,通过对该数据的分析,本发明人可以证实,在RP单倍不足的背景下(类似于RPS19或RPL5阻抑),约500个转录本的有限组显示出最显著的翻译效率变化。与本发明人早期从多核糖体分析中得到的靶向发现一致,在翻译效率方面,GATA1 mRNA是下调最大的转录本之一。有趣的是,显示翻译下调的大多数其它转录本是核糖体或核糖体相关因子的所有组分,包括所有RP和各种翻译起始和延伸因子。通过使用基因表达的cap分析进行进一步分析来定义这些转录本的5'非翻译区域(UTR),本发明人可以证实那些在基系时翻译程度最高且具有短且非结构化5'UTR的转录本趋向于成为在RP单倍不足的背景下在翻译水平上下调的转录本。有趣的是,在所有造血主转录因子中,只有GATA1具有短的5'UTR,并且本发明人可证实用其它主调控子(如RUNX1、LMO2或ETV6)的那些5'UTR替换该5'UTR改变了这个关键的造血转录因子的翻译。
最后,本发明人还证明了这在DBA患者体内发生,并且本发明人评估了出现这些病变出现的造血作用阶段。本发明人通过骨髓活检标本中GATA1的免疫组织化学和使用细胞内流式细胞术两者均表明DBA患者的造血祖细胞中GATA1水平减少。重要的是,本发明人证明了与对照样品相比,即使在其中具有GATA1最早表达的来自DBA患者骨髓细胞的非常原始的CD34+CD38-HSPC上,GATA1水平也减少(图3)。此外,本发明人发现即使GATA1水平在更成熟的CD34+CD38+HSPC中增加,DBA患者细胞中的GATA1水平继续降低。这些结果与造血谱系定型发生在干细胞和祖细胞最原始阶段的出现模式一致,并证明了这些发现与人类疾病的相关性(21-23)。
所有这些机制发现对于提高对DBA发病机制的理解具有重要意义。然而,如何为DBA开发更好的疗法仍然存在挑战。如上所讨论,目前唯一可用的疗法是长期使用皮质类固醇、定期血液输注或同种异体造血干细胞移植(10)。替代的且有价值的方法是将自体造血干细胞移植与基因疗法联用(24)。事实上,已经尝试开发慢病毒载体以增加RPS19的产生(25)。鉴于DBA患者中存在多效性RP基因突变(迄今为止已鉴别出28个突变),难以想象这种方法如何对大多数患者有用。鉴于本发明人发现GATA1蛋白产生受损是所有DBA病例的基础,并且增加GATA1蛋白足以挽救这些患者中存在的红系分化缺陷,开发GATA1基因疗法是实现DBA患者治愈性治疗的有价值的方法。如下文详细讨论的,主要限制是造血干细胞(HSC)区室中GATA1的表达将引起干细胞早熟分化,并且需要调控终末红细胞生成过程中GATA1的表达。
虽然在来自DBA患者的HSPC中GATA1蛋白水平受到阻抑并且增加GATA1表达可缓解DBA的红系谱系定型缺陷特征,但GATA1的失调表达可能是有问题的。用外源性GATA1表达可能使HSC经历早熟分化,并且有效的终末红细胞生成需要GATA1水平的调控。
基于本发明人的机理研究,开发用于治疗DBA的GATA1基因疗法是引人注目的,并且似乎是有前途的方法。本发明人已经能够证明,增加GATA1表达可挽救来自DBA患者的原代HSPC中的红系分化缺陷,这些DBA患者在各种RP基因中具有各种分子病变。此外,本发明人还能够表明,他们可通过基于RNA干扰的方法在建模与原代HSPC中的各种DBA相关分子病变中有规律地产生相同的结果(15,17)。在这些情况下,增加的GATA1表达通过慢病毒的使用而实现,其中包含改变的5'UTR和3'UTR元件的GATA1 cDNA处于慢病毒LTR的转录控制下,该LTR显示出高水平和泛在的表达。出于治疗目的,此类表达必须在分化过程的各个阶段进行调控和调整。必须控制GATA1水平以避免任何造血作用的干扰。
先前的研究表明,小鼠HSC中Gata1的外源性不受调控的表达可促进向巨核细胞和红系谱系的早熟分化,同时阻止能够长期植入的自我更新HSC的维持(26,27)。事实上,外源性Gata1表达可重新编程其它造血谱系以承担红系命运(26)。然而,Gata1转基因受调控的表达可允许长期维持HSC(27)。为了在人类环境中支持这些发现,本发明人利用了无血清培养系统,该系统允许在培养的几天过程中维持长期植入的人HSC(能够植入免疫缺陷异种移植受体)。在这种背景下,由慢病毒LTR元件调控的外源性GATA1表达的引入引起这些细胞的早熟分化,而对照细胞保持其表型和功能能力以产生长期造血移植。这些发现扩展了先前发表的小鼠模型结果(26)。这些结果还共同强调需要阻止早期HSC中的GATA1表达以允许有效植入,这是治愈性慢病毒基因疗法所必需的。此外,在终末红系分化期间GATA1水平不能过度升高,因为这会损害有效的红细胞生成(28)。为了解决这些问题,本发明人进行了一系列研究以鉴别将允许由慢病毒载体而来的GATA1受调控表达的关键调控元件。
为了实现用于有效基因疗法的GATA1的调控表达,本发明人采用两种互补和协同的方法来确保不会有潜在有害的异位表达,同时还在红系分化期间调控GATA1的水平。本文中预期可单独使用任一方法,或者它们可组合使用。
基因疗法载体中使用的第一调控元件是GATA1造血增强子微小基因(G1HEM),所述GATA1造血增强子微小基因连接4个不同的调控元件以在造血作用中实现GATA1的忠实表达(27,29)。这些元件包括-3kb造血增强子、上游双GATA基序、上游CACCC盒和GATA1的第一内含子的区段。事实上,此微小基因中存在的979个核苷酸足以适当地驱动Gata1 cDNA表达以挽救Gata1基因敲除小鼠并允许表面上正常的红细胞生成。
为了开发临床上可用并涉及上述讨论的第一转录调控元件的GATA1表达载体,本发明人利用已在人类临床研究中被证明有效的安全且设计良好的载体。在多种人造血细胞类型中表现出受控和良好调控的外源性cDNA表达并已用于临床环境(30)的pRRL.PPT.EFS载体就是这样一种载体。G1HEM可整合到GATA1 cDNA的上游,该GATA1 cDNA由内源性启动子或由修饰的(缩短的)泛在EF1α启动子(EFS)来双双驱动,这作为替代和互补的方法。重要的是,如上所讨论,来自小鼠的G1HEM中包含的Gata1调控元件能够仅在Gata1正常表达的细胞类型中驱动标志物基因的调控表达,并且足以允许使用Gata1 cDNA适当挽救敲除小鼠(27,31)。
本发明人已经生产了总共4种不同的载体(图6中所示的2种,两种小鼠和人调控元件用于所有情况)。本发明人在GATA1 cDNA之后并入了自剪切2A肽(P2A)元件,然后是Venus荧光标志物,以便能够实时地迅速跟踪那些表达GATA1的细胞。使用流式细胞测定量化了在测试的各种造血细胞类型中看到的Venus表达的程度。可通过对特定群体进行细胞分选来评估正常表达这种转录因子的细胞类型中GATA1表达的增加程度。最后,使用这种原代细胞培养方法,本发明人可评估随GATA1表达而发生的表型变化(32-34)。这种有力的方法允许本发明人使用与体内造血作用的过程直接相关的改进方法同时确定有效性、特异性和对造血分化的影响。每个载体都在2-3个独立的原代人造血细胞样本中进行测试,以弄清表达的特异性和有效性。
虽然上面讨论的构成G1HEM的转录调控元件允许GATA1 cDNA受调控的表达,但研究表明,使用该调控元件在HSC区室中可能存在泄漏表达(27)。由于这可能会严重影响获得长期植入的能力(26),因此必须防止在HSC区室中的表达。为了实现这一点,本发明人在土拨鼠肝炎病毒(PRE)的转录后调控元件之后(例如在经修饰的pRRL.PPT.EES衍生物中),并入了第二基因调控元件HSC限制性microRNA(miR)的结合元件miR126。在PRE之后插入三个重复的miR126结合元件阻止转基因在HSC区室中的表达。同样地,本发明人还用G1HEM和GATA1cDNA修饰pRRL.PPT.EFS以包括这些miR126元件。在原代人造血细胞中进行体外测试以确保有效和选择性的表达。将要被移植到NOD.Cg-KitW-41J Tyr+PrkdcscidI12rgtm1Wjl(NBSGW)小鼠模型中的HSC可被转导,该模型先前已成功并广泛用于生产人造血异种移植模型(36)。然后可在植入16周后使用表型标志物量化、二次移植到NBSGW受体中以及通过评估表型HSC区室中的Venus表达来测试HSC功能。
本文描述了临床级慢病毒载体的开发,该载体允许GATA1 cDNA受调控的表达以在基因疗法中使用。原代人造血细胞中的体外和体内研究允许筛选多个独立的载体,这些载体并入了miR126结合元件和转录调控元件(G1HEM或其衍生物)的关键组二者。
参考文献:
1.Nathan DG,Clarke BJ,Hillman DG,Alter BP,Housman DE.Erythroidprecursors in congenital hypoplastic(Diamond-Blackfan)anemia.The Journal ofclinical investigation.1978;61(2):489-98.doi:10.1172/JCI108960.PubMed PMID:621285;PMCID:PMC372560.
2.Iskander D,Psaila B,Gerrard G,Chaidos A,En Foong H,Harrington Y,Kamik LC,Roberts I,de la Fuente J,Karadimitris A.Elucidation of the EP defectin Diamond-Blackfan anemia by characterization and prospective isolation ofhuman EPs.Blood.2015;125(16):2553-7.doi:10.1182/blood-2014-10-608042.PubMedPMID:25755292.
3.Vlachos A,Ball S,Dahl N,Alter BP,Sheth S,Ramenghi U,Meerpohl J,Karlsson S,Liu JM,Leblanc T,Paley C,Kang EM,Leder EJ,Atsidaftos E,SbimamuraA,Bessler M,Glader B,Lipton JM,Participants of Sixth Annual Daniella MariaArturi International Consensus C.Diagnosing and treating Diamond Blackfananaemia:results of an international clinical consensus conference.Br JHaematol.2008;142(6):859-76.doi:10.1111/j.1365-2141.2008.07269.x.PubMed PMID:18671700;PMCID:PMC2654478.
4.Draptchinskaia N,Gustavsson P,Andersson B,Pettersson M,Willig TN,Dianzani I,Ball S,Tchernia G,Klar J,Matsson H,Tentler D,Mohandas N,CarlssonB,Dahl N.The gene encoding ribosomal protein S19is mutated in Diamond-Blackfananaemia.Nat Genet.1999:21(2):169-75.doi:10.1038/5951.PubMed PMID:9988267.
5.Flygare J,Karlsson S.Diamond-Blackfan anemia:erythropoiesis lost intranslation.Blood.2007:109(8):3152-4.doi:10.1182/blood-2006-09-001222.PubMedPMID:17164339.
6.Mirabello L,Khincha PP,Ellis SR,Giri N,Brodie S,ChandrasekharappaSC,Donovan FX,Zhou W,Hicks BD,Boland JF,Yeager M,Jones K,Zhu B,Wang M,AlterBP,Savage SA.Novel and known ribosomal causes of Diamond-Blackfan anaemiaidentified through comprehensive genomic characterisation.J MedGenet.2017.doi:10.1136/jmedgenet-2016-104346.PubMed PMID:28280134.
7.Landowski M,O′Donohue MF,Buros C,Ghazvinian R,Montel-Lehry N,Vlachos A,Sieff CA,Newburger PE,Niewiadomska E,Matysiak M,Glader B,AtsidaftosE,Lipton JM,Beggs AH,Gleizes PE,Gazda HT.Novel deletion of RPL15identified byarray-comparative genomic hybridization in Diamond-Blackfan anemia.HumGenet.2013;132(11):1265-74.doi:10.1007/s00439-013-1326-z.PubMed PMID:23812780;PMCID:PMC3797874.
8.Khatter H,Myasnikov AG,Natehiar SK,Klaholz BP.Structure of thehuman 80S ribosome.Nature.2015;520(7549):640-5.doi:10.1038/nature14427.PubMedPMID:25901680.
9.Ulirseh JC,Verboon JM,Kazerounian S,Guo MH,Yuan D,Ludwig LS,Handsaker RE,Abdulhay NJ,Fiorini C,Genovese G,Lim ET,Cheng A,Cummings BB,ChaoKR,Beggs AH,Genetti CA,Sieff CA,Newburger PE,Niewiadomska E,Matysiak M,Vlachos A,Lipton JM,Atsidaftos E,Glader B,Narla A,Gleizes PE,O′Donohue MF,Montel-Lehry N,Amor DJ,McCarroll SA,O′Donnell-Luria AH,Gupta N,Gabriel SB,MacArthur DG.Lander ES,Lek M,Da Costa L,Nathan DG,Korostelev AA,Do R,SankaranVG,Gazda HT.The Genetic Landscape of Diamond-Blackfan Anemia.Am J HumGenet.2018;103(6):930-47.doi:10.1016/j.ajhg.2018.10027.PubMed PMID:30503522.
10.Lipton JM,Ellis SR.Diamond-Blackfan anemia:diagnosis,treatment,andmolecular pathogenesis.Hematology/oncologyclinics of North America.2009;23(2):261-82.doi:10.1016/i.hoc.2009.01.004.PubMed PMID:19327583;PMCID:PMC2886591.
11.Roy V,Perez WS,Eapen M,Marsh JC,Pasquini M,Pasquini R,MustafaMM.Bredeson CN,Non-Malignant Marrow Disorders Working Committee of theInternational Bone Marrow Transplant R.Bone marrow transplantation fordiamond-blackfan anemia.Biol Blood Marrow Transplant.2005;11(8):600-8.doi:10.1016/j.bbmt.2005.05.005.PubMed PMID:16041310.
12.Narla A,Vlachos A,Nathan DG.Diamond Blackfan anemia treatment:past,present,and future.Semin Hematol.2011;48(2):117-23.doi:10.1053/j.seminhematol.2011.01.004.PubMed PMID:21435508;PMCID:PMC3073777.
13.Sankaran VG,Ghazvinian R,DoR,Thiru P,Vergilio JA,Beggs AH,SieffCA.Orkin SH,Nathan DG.Lander ES,Gazda HT.Exome sequencing identifies GATAlmutationsresulting in Diamond-Blackfan anemia.The Journal of clinicalinvestigation.2012;122(7):2439-43.doi:10.1172/JCI63597.PubMed PMID:22706301;PMCID:PMC3386831.
14.Parrella S,Aspesi A,Quarello P,Garelli E,Pavesi E,Carando A,NardiM,Ellis SR,Ramenghi U,Dianzani I.Loss of GATA-l full length as a cause ofDiamond-Blackfan anemia phenotype.Pediatr Blood Cancer.2014:61(7):1319-21.doi:10.1002/pbc.24944.PubMed PMID:24453067;PMCID:PMC4684094.
15Ludwig LS,Gazda HT,Eng JC,Eichhorn SW,Thiru P,Ghazvinian R,GeorgeTI,Gotlib JR,Beggs AH,SieffCA,Lodish HF,Lander ES,Sankaran VG.Alteredtranslation ofGATAl in Diamond-Blackfan anemia.Nature medicine.2014;20(7):748-53.doi:10.1038/nm.3557.PubMed PMID:24952648;PMCID:PMC4087046.
16Klar J,Khalfallah A,Arzoo PS,Gazda HT,Dahl N.Recurrent GATA1mutations in Diamond-Blackfan anaemia.Br J Haematol.2014;166(6):949-51.doi:10.1111/bjh.12919.PubMed PMID:24766296.
17.Khajuria RK,Munschauer M,Ulirsch JC,Fiorini C,LudwigLS,McFarlandSK,Abdulhay NJ,Specht H,Keshishian H,Mani DR,Jovanovic M,Ellis SR,Fulco CP,Engreitz JM,Schutz S,Lian J,Gripp KW,Weinberg OK,Pinkus GS.Gehrke L,Regev A,Lander ES,Gazda HT,Lee WY,Panse VG,Carr SA,Sankaran VG.RibosomeLevels Selectively Regulate Translation and Lineage Commitment in HumanHematopoiesis.Cell.2018;173(1):90-103e19.doi:10.1016/j.cell.2018.02.036.PubMed PMID:29551269;PMCID:PMC5866246.
18.Mills EW,Green R.Ribosomopathies:There′s strength innumbers.Science.2017;358(6363).doi:10.1126/science.aan2755.PubMed PMID:29097519.
19.Ingolia NT,Ghaemmaghami S,Newman JR,Weissman JS.Genome-wideanalysis in vivo of translation with nucleotide resolution using ribosomeprofiling.Science.2009;324(5924):218-23.doi:10.1126/science.1168978.PubMedPMID:19213877;PMCID:PMC2746483.
20.Ingolia NT.Ribosome Footpnnt Profiling of Translation throughoutthe Genome.Cell.2016;165(1):22-33.doi:10.1016/j.cell.2016.02.066.PubMed PMID:27015305;PMCID:PMC4917602.
21.Notta F,Zandi S,Takayama N,Dobson S,Gan OI,Wilson G,Kaufmann KB,McLeod J,Laurenti E,Dunant CF,McPherson JD,Stein LD,Dror Y,Dick JE.Distinctroutes of lineage development reshape the human blood hierarehy acrossontogeny.Science.2016;351(6269):aab2116.doi:10.1126/science.aab2116.PubMedPMID:26541609;PMCID:PMC4816201.
22.Velten L,HaasSF,Raffel S,BlaszkiewiczS,IslamS,HennigBP,HircheC,Lutz C,Buss EC,Nowak D,Boch T,Hofmann WK,Ho AD,Huber W,Trumpp A,Essers MA,Steinmetz LM.Human haematopoietic stem cell lineage commitment is acontinuous process.Nature cell biology.2017;19(4):271-81.doi:10.1038/ncb3493.PubMed PMID:28319093;PMCID:PMC5496982.
23.PaulF,Arkin Y,Giladi A,Jaitin DA,Kenigsberg E,Keren-Shaul H,WinterD,Lara-Astiaso D,Guy M,Weiner A,David E,Cohen N,Lauridsen FK,Haas S,SchlitzerA,Mildner A,Ginhoux F,Jung S,Trumpp A,Porse BT,Tanay A,Amit I.TranscriptionalHeterogeneity and Lineage Commitment in Myeloid Progenitors.Cell.2015;163(7):1663-77.doi:10.1016/j.cell.2015.11.013.PubMed PMID:26627738.
24.Sankaran VG,Weiss MJ.Anemia:progress in molecular mechanisms andtherapies.Nature medicine.2015;21(3):221-30.doi:10.1038/nm.3814.PubMed PMID:25742458;PMCID:4452951.
25.Debnath S,Jaako P,Siva K,Rothe M,Chen J,Dahl M,Gaspar HB,FlygareJ,Schambach A,Karlsson S.Lentiviral Vectors with Cellular Promoters CorreetAnemia and Lethal Bone Marow Failure in a Mouse Model for Diamond-BlackfanAnemia.Molecular therapy:the joumal of the American Society of GeneTherapy.2017;25(8):1805-14.doi:10.1016/j.ymthe.2017.04.002.PubMed PMID:28434866;PMCID:PMC5542636.
26.Iwasaki H,Mizuno S,Wells RA,Cantor AB,Watanabe S,Akashi K.GATA-1converts lymphoid and myelomonocytic progenitors into the megakaryocyte/erythrocyte lineages.Immunity.2003;19(3):451-62.PubMed PMID:14499119.
27.Takai J,Moriguchi T,Suzuki M,Yu L,Ohneda K,Yamamoto M.The Gata1 5′region harbors distinct cis-regulatory modules that direct gene activation inerythroid cells and gene inactivation in HSCs.Blood.2013;122(20):3450-60.doi:10.1182/blood-2013-01-476911.PubMed PMID:24021675.
28.Whyatt D,Lindeboom F,Karis A,Ferreira R,Milot E,Hendriks R,deBruijn M,Langeveld A,Gribnau J,Grosveld F,Philipsen S.An intrinsic but cell-nonautonomous defect in GATA-1-overexpressing mouse erythroidcells.Nature.2000;406(6795):519-24.doi:10.1038/35020086.PubMed PMID:10952313.
29.Ohneda K,Shimizu R,Nishimura S,Muraosa Y,Takahashi S,Engel JD,Yamamoto M.A minigene containing four discrete cis elements recapitulatesGATA-1 gene expression in vivo.Genes Cells.2002;7(12):1243-54.PubMed PMID:12485164.
30.Schambach A,Bohne J,Chandra S,Will E,Margison GP,Williams DA,BaumC.Equal potency of gammaretroviral and lentiviral SIN vectors for expressionof O6-methylguanine-DNA methyltransferase in hematopoietic cells.MolTher.2006;13(2):391-400.Epub 2005/10/18.doi:10.1016/j.ymthe.2005.08.012.PubMed PMID:16226060.
31.Shimizu R,Hasegawa A,Ottolenghi S,Ronchi A,Yamamoto M.Verificationof the in vivo activity of three distinct cis-acting elements within theGatal gene promoter-proximal enhancer in mice.Genes Cells.2013;18(11):1032-41.Epub 2013/10/15.doi:101111/gtc.12096.PubMed PMID:24118212.
32.Sankaran VG,Ludwig LS,Sicinska E,Xu J,Bauer DE,Eng JC,PattersonHC.Metcalf RA,Natkunam Y,Orkin SH,Sicinski P,Lander ES,Lodish HF.Cyclin D3coordinatesthecellcycle during differentiation to regulate erythrocyte sizeand number.Genes Dev.2012;26(18):2075-87.Epub 2012/08/30.doi:10.1101/gad.197020.112.PubMed PMID:22929040;PMCID:3444733.
33.Sankaran VG,Menne TF,Scepanovic D,Vergilio JA,Ji P,Kim J,Thiru P,Orkin SH,Lander ES,Lodish HF.MicroRNA-15a and-16-1 act via MYB to elevatefetalhemoglobin expression in human trisomy 13.Proc Natl Acad Sci U S A.2011;108(4):1519-24.Epub 2011/01/06.doi:10.1073/pnas.1018384108PubMed PMID:21205891;PMCID:3029749.
34.Sankaran VG,Xu J,Byron R,Greisman HA,Fisher C,Weatherall DJ,SabathDE,Groudine M,Orkin SH,Premawardhena A,Bender MA.A functional elementnecessary for fetal hemoglobin silencing.N Engl J Med.2011;365(9):807-14.Epub2011/09/02.doi:10.1056/NEJMoal 103070.PubMed PMID:21879898;PMCID:3174767.
35.Gentner B,Visigalli I,Hiranatsu H,Lechman E,Ungari S,GiustacchiniA,Schira G,Amendola M,Quattrini A,Martino S,Orlacchio A,Dick JE,Biffi A,Naldini L.Identification of hematopoietic stem cell-specific miRNAs enablesgene therapy of globoid cell leukodystrophy.Sci Transl Med.2010;2(58):58ra84.doi:10.1126/scitranslmed.3001522.PubMed PMID:21084719.
36.Fiorini C,Abdulhay NJ,McFarland SK,Munschauer M,Ulirsch JC,ChiarleR,Sankaran VG.Developmentally-faithful and effective human erythropoiesis inimmunodeficient and Kit mutant mice.Am J Hematol.2017;92(9):E513-E9.doi:10.1002/ajh.24805.PubMed PMID:28568895;PMCID:PMC5546987.
37.Ito E,Konno Y,Toki T,Terui K.Molecular pathogenesis in Diamond-Blackfan anemia.Int J Hematol.2010Oct;92(3):413-8.
实施例2:作为用于Diamond-Blackfan贫血的疗法而用于GATA1谱系特异性表达的载体设计
在任意方面的一些实施方式中,本文描述了以下慢病毒载体的各种组合(图7):
1)慢病毒骨架:基于pHIV-GFP的第三代自灭活慢病毒骨架(Welm等,Cell StemCell.2008Jan 10.2(1):90-102),由EF1a启动子驱动并含有IRES-GFP序列用于初始表征和测试,但将从最终载体序列中移除。
2)小鼠GATA1造血增强子微小基因(mG1HEM):小鼠GATA1转录起始位点上游的3个序列和来自小鼠GATA1的第一内含子的第四序列的连结,这些序列已被证明忠实地允许GATA1在红系细胞中而非造血干细胞中表达(Takai等,Blood.2013Nov 14122(20):3450-3460)。
3)最小启动子(minP):来自小鼠GATA1的5′UTR或来自萤火虫荧光素酶报告载体pGL4.25两者之一,Genbank登录号DQ904457.1。
4)具有密码子优化的人GATA1 cDNA(GATA1),用于在人细胞中进行最优表达,具有或不具有FLAG标签。
5)土拨鼠肝炎病毒转录后调控元件(WPRE),用于增强转基因mRNA的稳定性。
6)miR126结合位点(miR126 BS):重复序列,其与miR126结合(miR126是在造血干细胞中表达的microRNA),并使得干细胞区室中转基因表达降低(Gentner等,Sci TransMed.2010Nov 172(58):58-84)。
参考文献:
Welm et al Cell Stem Cell.2008 Jan 10.2(1):90-102.Gentner et al.SciTrans Med.2010 Nov 172(58):58-84.
实施例3:作为用于Diamond-Blackfan贫血疗法的GATA1基因疗法
通过本发明人的临床前研究表明,红系细胞中的GATA-1增强显示了对Diamond-Blackfan贫血(DBA)的治疗效果。在此,本发明人展示了进一步实验的结果,这些实验证明红系前体中而非造血干细胞中GATA1表达的受调控增加提供了在DBA中的治疗效果。
用于DBA的临床相关GATA1基因疗法载体必须实现四个关键功能
(图27)。首先,尽管需要将基因疗法载体整合到长期的、未分化的造血干细胞(LT-HSC)的基因组中,但在干细胞区室中GATA1转基因的表达必须很少,因为在HSC中的GATA1表达导致自我更新干细胞的丢失。其次,为了克服作为DBA标志的红系分化缺陷,一旦早期祖细胞致力于红系分化,基因疗法载体必须驱动在早期祖细胞中的稳健表达。第三,为了模拟内源性GATA1表达模式并实现正常的终末红系分化,基因疗法载体的表达应在红系发育后期下降。第四,发育上受调控增加的GATA1表达必须足以克服实验模型系统和原代患者样品中由核糖体蛋白单倍不足引起的红系成熟阻滞。
为了设计包含上述四个关键特征的载体,本发明人首先分析了GATA1上游的可及性染色质的峰,并鉴别了在分化的红系细胞中而不是在HSC或其它早期祖细胞中开放的染色质。本发明人提供了证据,这些DNA区域包含负责GATA1的红系特异性表达的调控元件。本发明人通过将DNA的3个区域与GATA1上游的开放染色质连结,构建了人GATA1增强子(hG1E)元件(图28A)。本发明人开发了通过在两个基因之间包含内部核糖体进入位点(IRES)序列,使用hG1E元件来驱动GATA1和GFP表达的载体。作为实现发育上受调控的转基因表达的额外机制,本发明人将hG1E元件与先前用于限制HSC区室中的转基因表达的miR223T结合位点组合。
为了评估hG1E-GATA1或hG1E-GATA1-miR构建体是否能够驱动GATA1表达的充分增加,本发明人使用了DBA的体外模型。用靶向DBA基因RPS19的shRNA载体感染原代人CD34+HSPC,本发明人先前已经证明,该载体可模拟DBA特有的体外红系分化缺陷。本发明人将红系比率定义为在红细胞生成条件下培养时表达红系标志物的细胞的比例。当与hG1E-GATA1或hG1E-GATA1-miR载体共感染时,在RPS19敲低后,CD34+HSPC的红细胞比率恢复到与用HMD-GATA1载体组成型GATA1过表达相当的水平,显示出DBA表型的挽救(图28B)。作为hG1E-GATA1和hG1E-GATA1-miR载体可驱动足够的具有生理相关性的GATA1表达的进一步证据,本发明人使用了缺乏内源性GATA1表达的G1E鼠造血细胞系。用hG1E-GATA1和hG1E-GATA1-miR载体感染G1E细胞诱导终末红系分化,如通过Ter119表达所测量的(图28C)。
已经在红系祖细胞中实现了功能上充分增加的GATA1表达,本发明人试图确定本发明人的新调控元件是否能够限制LT-HSC区室中的GATA1表达,因为这些细胞中的GATA1表达会损害骨髓中干细胞的维持。本发明人用hG1E-GATA1或hG1E-GATA1-miR载体感染CD34+HSPC,并在能够在体外短期维持HSC的条件下培养它们。感染后两天,通过流式细胞术评估LT-HSC标志物的表面表达和GFP表达,以量化LT-HSC中的转基因表达。然后,将这些细胞转移到促进红系发育的介质中,并在分化的红系前体中测量GFP表达。与具有组成型GATA1表达的HMD-GATA1病毒相比,感染hG1E-GATA1和hG1E-GATA1-miR病毒的细胞中,红系细胞中GFP表达与HSC中GFP的比率(RBCGFP/HSCGFP比率)显著增加(图28D)。增加的RBCGFP/HSCGFP比率是由于HSC中实验载体的表达受限。这些数据表明,红系前体中受调控的、增加的GATA1表达足以克服两种不同的体外DBA模型中的分化阻滞,并且在LT-HSC区室中具有受限制的表达。GATA1表达的这种发育忠实型的增加表明,基于受调控的GATA1过表达的基因疗法可有望治愈Diamond-Blackfan贫血。
为了进一步研究在发育中的红系细胞中来自hG1E-GATA1载体的GATA1的表达,本发明人使用三相培养系统在体外诱导人HSPC分化为完全血红蛋白化、无核的红血细胞。在体外分化期间,发育中的红系祖细胞和前体首先表达高水平的转铁蛋白受体CD71。几天后,血型糖蛋白A(CD235a)高度表达,随后在终末分化的RBC中CD71表达丧失(图5a)。在用HMD-GATA1或hG1E-GATA1转导后,通过表达CD71的细胞百分比测量,与阴性对照相比,已经准备好进行红系细胞发育的细胞经历更快速的早期分化(图29B)。接下来,本发明人将终末分化的CD71-CD235a+亚群中的GFP表达与更原始的CD71+CD235a+亚群中的GFP表达进行了比较(红细胞GFP/祖细胞GFP)。在终末分化的红细胞中,来自hG1E-GATA1载体的GFP表达显著降低,忠实地概括了终末分化期间GATA1表达降低的模式。值得注意但并非出乎意料的是,在HMD-GATA1样品中未观察到这种降低的GFP表达,表明终末分化受损且GATA1表达不受调控(图29C)。
接下来,本发明人尝试通过使用CRISPR/Cas9介导的RPS19基因破坏来概括从健康成年供体分离的原代HSPC中的RPS19单倍不足。本发明人表明,RPS19的有效编辑导致红系成熟阻滞,并且在早期红系培养期间表达CD71的细胞显著更少。然后,本发明人用HMD-空、HMD-GATA1或hG1E-GATA1病毒转导RPS19编辑的HSPC。培养第4天在致力于红系分化的细胞中(通过CD71表达测量),感染有HMD-GATA1或hG1E-GATA1病毒的群体具有更多的CD235表达(图30A),证实了GATA1表达受调控的增加的能力,从而挽救如在DBA中所见的由核糖体蛋白丧失所引起的红系分化中的阻滞。最后,在RPS19编辑后甲基纤维素集落形成测定中检测到的红系集落显著减少,这部分地被hG1E-GATA1挽救(图30B)。总之,本发明人的数据表明hG1E-GATA1载体满足成为治愈DBA的基因疗法所需的所有四个标准(图27)。
序列表
<110> 儿童医疗中心有限公司
<120> 使用 GATA1 基因疗法用于治疗 DBA 的组合物和方法
<130> 701039-094470WOPT
<140>
<141>
<150> 62/859,369
<151> 2019-06-10
<160> 69
<170> PatentIn version 3.5
<210> 1
<211> 1242
<212> DNA
<213> 智人
<400> 1
atggagttcc ctggcctggg gtccctgggg acctcagagc ccctccccca gtttgtggat 60
cctgctctgg tgtcctccac accagaatca ggggttttct tcccctctgg gcctgagggc 120
ttggatgcag cagcttcctc cactgccccg agcacagcca ccgctgcagc tgcggcactg 180
gcctactaca gggacgctga ggcctacaga cactccccag tctttcaggt gtacccattg 240
ctcaactgta tggaggggat cccagggggc tcaccatatg ccggctgggc ctacggcaag 300
acggggctct accctgcctc aactgtgtgt cccacccgcg aggactctcc tccccaggcc 360
gtggaagatc tggatggaaa aggcagcacc agcttcctgg agactttgaa gacagagcgg 420
ctgagcccag acctcctgac cctgggacct gcactgcctt catcactccc tgtccccaat 480
agtgcttatg ggggccctga cttttccagt accttctttt ctcccaccgg gagccccctc 540
aattcagcag cctattcctc tcccaagctt cgtggaactc tccccctgcc tccctgtgag 600
gccagggagt gtgtgaactg cggagcaaca gccactccac tgtggcggag ggacaggaca 660
ggccactacc tatgcaacgc ctgcggcctc tatcacaaga tgaatgggca gaacaggccc 720
ctcatccggc ccaagaagcg cctgattgtc agtaaacggg caggtactca gtgcaccaac 780
tgccagacga ccaccacgac actgtggcgg agaaatgcca gtggggatcc cgtgtgcaat 840
gcctgcggcc tctactacaa gctacaccag gtgaaccggc cactgaccat gcggaaggat 900
ggtattcaga ctcgaaaccg caaggcatct ggaaaaggga aaaagaaacg gggctccagt 960
ctgggaggca caggagcagc cgaaggacca gctggtggct ttatggtggt ggctgggggc 1020
agcggtagcg ggaattgtgg ggaggtggct tcaggcctga cactgggccc cccaggtact 1080
gcccatctct accaaggcct gggccctgtg gtgctgtcag ggcctgttag ccacctcatg 1140
cctttccctg gacccctact gggctcaccc acgggctcct tccccacagg ccccatgccc 1200
cccaccacca gcactactgt ggtggctccg ctcagctcat ga 1242
<210> 2
<211> 1501
<212> DNA
<213> 智人
<400> 2
gacaccccct gggatcacac tgagcttgcc acatccccaa ggcggccgaa ccctccgcaa 60
ccaccagccc aggttaatcc ccagaggctc catggagttc cctggcctgg ggtccctggg 120
gacctcagag cccctccccc agtttgtgga tcctgctctg gtgtcctcca caccagaatc 180
aggggttttc ttcccctctg ggcctgaggg cttggatgca gcagcttcct ccactgcccc 240
gagcacagcc accgctgcag ctgcggcact ggcctactac agggacgctg aggcctacag 300
acactcccca gtctttcagg tgtacccatt gctcaactgt atggagggga tcccaggggg 360
ctcaccatat gccggctggg cctacggcaa gacggggctc taccctgcct caactgtgtg 420
tcccacccgc gaggactctc ctccccaggc cgtggaagat ctggatggaa aaggcagcac 480
cagcttcctg gagactttga agacagagcg gctgagccca gacctcctga ccctgggacc 540
tgcactgcct tcatcactcc ctgtccccaa tagtgcttat gggggccctg acttttccag 600
taccttcttt tctcccaccg ggagccccct caattcagca gcctattcct ctcccaagct 660
tcgtggaact ctccccctgc ctccctgtga ggccagggag tgtgtgaact gcggagcaac 720
agccactcca ctgtggcgga gggacaggac aggccactac ctatgcaacg cctgcggcct 780
ctatcacaag atgaatgggc agaacaggcc cctcatccgg cccaagaagc gcctgattgt 840
cagtaaacgg gcaggtactc agtgcaccaa ctgccagacg accaccacga cactgtggcg 900
gagaaatgcc agtggggatc ccgtgtgcaa tgcctgcggc ctctactaca agctacacca 960
ggtgaaccgg ccactgacca tgcggaagga tggtattcag actcgaaacc gcaaggcatc 1020
tggaaaaggg aaaaagaaac ggggctccag tctgggaggc acaggagcag ccgaaggacc 1080
agctggtggc tttatggtgg tggctggggg cagcggtagc gggaattgtg gggaggtggc 1140
ttcaggcctg acactgggcc ccccaggtac tgcccatctc taccaaggcc tgggccctgt 1200
ggtgctgtca gggcctgtta gccacctcat gcctttccct ggacccctac tgggctcacc 1260
cacgggctcc ttccccacag gccccatgcc ccccaccacc agcactactg tggtggctcc 1320
gctcagctca tgagggcaca gagcatggcc tccagaggag gggtggtgtc cttctcctct 1380
tgtagccaga attctggaca acccaagtct ctgggcccca ggcaccccct ggcttgaacc 1440
ttcaaagctt ttgtaaaata aaaccaccaa agtcctgaaa aaaaaaaaaa aaaaaaaaaa 1500
a 1501
<210> 3
<211> 1501
<212> DNA
<213> 智人
<400> 3
gacaccccct gggatcacac tgagcttgcc acatccccaa ggcggccgaa ccctccgcaa 60
ccaccagccc aggttaatcc ccagaggctc catggagttc cctggcctgg ggtccctggg 120
gacctcagag cccctccccc agtttgtgga tcctgctctg gtgtcctcca caccagaatc 180
aggggttttc ttcccctctg ggcctgaggg cttggatgca gcagcttcct ccactgcccc 240
gagcacagcc accgctgcag ctgcggcact ggcctactac agggacgctg aggcctacag 300
acactcccca gtctttcagg tgtacccatt gctcaactgt atggagggga tcccaggggg 360
ctcaccatat gccggctggg cctacggcaa gacggggctc taccctgcct caactgtgtg 420
tcccacccgc gaggactctc ctccccaggc cgtggaagat ctggatggaa aaggcagcac 480
cagcttcctg gagactttga agacagagcg gctgagccca gacctcctga ccctgggacc 540
tgcactgcct tcatcactcc ctgtccccaa tagtgcttat gggggccctg acttttccag 600
taccttcttt tctcccaccg ggagccccct caattcagca gcctattcct ctcccaagct 660
tcgtggaact ctccccctgc ctccctgtga ggccagggag tgtgtgaact gcggagcaac 720
agccactcca ctgtggcgga gggacaggac aggccactac ctatgcaacg cctgcggcct 780
ctatcacaag atgaatgggc agaacaggcc cctcatccgg cccaagaagc gcctgattgt 840
cagtaaacgg gcaggtactc agtgcaccaa ctgccagacg accaccacga cactgtggcg 900
gagaaatgcc agtggggatc ccgtgtgcaa tgcctgcggc ctctactaca agctacacca 960
ggtgaaccgg ccactgacca tgcggaagga tggtattcag actcgaaacc gcaaggcatc 1020
tggaaaaggg aaaaagaaac ggggctccag tctgggaggc acaggagcag ccgaaggacc 1080
agctggtggc tttatggtgg tggctggggg cagcggtagc gggaattgtg gggaggtggc 1140
ttcaggcctg acactgggcc ccccaggtac tgcccatctc taccaaggcc tgggccctgt 1200
ggtgctgtca gggcctgtta gccacctcat gcctttccct ggacccctac tgggctcacc 1260
cacgggctcc ttccccacag gccccatgcc ccccaccacc agcactactg tggtggctcc 1320
gctcagctca tgagggcaca gagcatggcc tccagaggag gggtggtgtc cttctcctct 1380
tgtagccaga attctggaca acccaagtct ctgggcccca ggcaccccct ggcttgaacc 1440
ttcaaagctt ttgtaaaata aaaccaccaa agtcctgaaa aaaaaaaaaa aaaaaaaaaa 1500
a 1501
<210> 4
<211> 1273
<212> DNA
<213> 智人
<400> 4
ggaagggagc ctcaaaggcc aaggccagcc aggacacccc ctgggatcac actgagcttg 60
ccacatcccc aaggcggccg aaccctccgc aaccaccagc ccagtctttc aggtgtaccc 120
attgctcaac tgtatggagg ggatcccagg gggctcacca tatgccggct gggcctacgg 180
caagacgggg ctctaccctg cctcaactgt gtgtcccacc cgcgaggact ctcctcccca 240
ggccgtggaa gatctggatg gaaaaggcag caccagcttc ctggagactt tgaagacaga 300
gcggctgagc ccagacctcc tgaccctggg acctgcactg ccttcatcac tccctgtccc 360
caatagtgct tatgggggcc ctgacttttc cagtaccttc ttttctccca ccgggagccc 420
cctcaattca gcagcctatt cctctcccaa gcttcgtgga actctccccc tgcctccctg 480
tgaggccagg gagtgtgtga actgcggagc aacagccact ccactgtggc ggagggacag 540
gacaggccac tacctatgca acgcctgcgg cctctatcac aagatgaatg ggcagaacag 600
gcccctcatc cggcccaaga agcgcctgat tgtcagtaaa cgggcaggta ctcagtgcac 660
caactgccag acgaccacca cgacactgtg gcggagaaat gccagtgggg atcccgtgtg 720
caatgcctgc ggcctctact acaagctaca ccaggtgaac cggccactga ccatgcggaa 780
ggatggtatt cagactcgaa accgcaaggc atctggaaaa gggaaaaaga aacggggctc 840
cagtctggga ggcacaggag cagccgaagg accagctggt ggctttatgg tggtggctgg 900
gggcagcggt agcgggaatt gtggggaggt ggcttcaggc ctgacactgg gccccccagg 960
tactgcccat ctctaccaag gcctgggccc tgtggtgctg tcagggcctg ttagccacct 1020
catgcctttc cctggacccc tactgggctc acccacgggc tccttcccca caggccccat 1080
gccccccacc accagcacta ctgtggtggc tccgctcagc tcatgagggc acagagcatg 1140
gcctccagag gaggggtggt gtccttctcc tcttgtagcc agaattctgg acaacccaag 1200
tctctgggcc ccaggcaccc cctggcttga accttcaaag cttttgtaaa ataaaaccac 1260
caaagtcctg aaa 1273
<210> 5
<211> 1501
<212> DNA
<213> 智人
<400> 5
gacaccccct gggatcacac tgagcttgcc acatccccaa ggcggccgaa ccctccgcaa 60
ccaccagccc aggttaatcc ccagaggctc catggagttc cctggcctgg ggtccctggg 120
gacctcagag cccctccccc agtttgtgga tcctgctctg gtgtcctcca caccagaatc 180
aggggttttc ttcccctctg ggcctgaggg cttggatgca gcagcttcct ccactgcccc 240
gagcacagcc accgctgcag ctgcggcact ggcctactac agggacgctg aggcctacag 300
acactcccca gtctttcagg tgtacccatt gctcaactgt atggagggga tcccaggggg 360
ctcaccatat gccggctggg cctacggcaa gacggggctc taccctgcct caactgtgtg 420
tcccacccgc gaggactctc ctccccaggc cgtggaagat ctggatggaa aaggcagcac 480
cagcttcctg gagactttga agacagagcg gctgagccca gacctcctga ccctgggacc 540
tgcactgcct tcatcactcc ctgtccccaa tagtgcttat gggggccctg acttttccag 600
taccttcttt tctcccaccg ggagccccct caattcagca gcctattcct ctcccaagct 660
tcgtggaact ctccccctgc ctccctgtga ggccagggag tgtgtgaact gcggagcaac 720
agccactcca ctgtggcgga gggacaggac aggccactac ctatgcaacg cctgcggcct 780
ctatcacaag atgaatgggc agaacaggcc cctcatccgg cccaagaagc gcctgattgt 840
cagtaaacgg gcaggtactc agtgcaccaa ctgccagacg accaccacga cactgtggcg 900
gagaaatgcc agtggggatc ccgtgtgcaa tgcctgcggc ctctactaca agctacacca 960
ggtgaaccgg ccactgacca tgcggaagga tggtattcag actcgaaacc gcaaggcatc 1020
tggaaaaggg aaaaagaaac ggggctccag tctgggaggc acaggagcag ccgaaggacc 1080
agctggtggc tttatggtgg tggctggggg cagcggtagc gggaattgtg gggaggtggc 1140
ttcaggcctg acactgggcc ccccaggtac tgcccatctc taccaaggcc tgggccctgt 1200
ggtgctgtca gggcctgtta gccacctcat gcctttccct ggacccctac tgggctcacc 1260
cacgggctcc ttccccacag gccccatgcc ccccaccacc agcactactg tggtggctcc 1320
gctcagctca tgagggcaca gagcatggcc tccagaggag gggtggtgtc cttctcctct 1380
tgtagccaga attctggaca acccaagtct ctgggcccca ggcaccccct ggcttgaacc 1440
ttcaaagctt ttgtaaaata aaaccaccaa agtcctgaaa aaaaaaaaaa aaaaaaaaaa 1500
a 1501
<210> 6
<211> 413
<212> PRT
<213> 智人
<400> 6
Met Glu Phe Pro Gly Leu Gly Ser Leu Gly Thr Ser Glu Pro Leu Pro
1 5 10 15
Gln Phe Val Asp Pro Ala Leu Val Ser Ser Thr Pro Glu Ser Gly Val
20 25 30
Phe Phe Pro Ser Gly Pro Glu Gly Leu Asp Ala Ala Ala Ser Ser Thr
35 40 45
Ala Pro Ser Thr Ala Thr Ala Ala Ala Ala Ala Leu Ala Tyr Tyr Arg
50 55 60
Asp Ala Glu Ala Tyr Arg His Ser Pro Val Phe Gln Val Tyr Pro Leu
65 70 75 80
Leu Asn Cys Met Glu Gly Ile Pro Gly Gly Ser Pro Tyr Ala Gly Trp
85 90 95
Ala Tyr Gly Lys Thr Gly Leu Tyr Pro Ala Ser Thr Val Cys Pro Thr
100 105 110
Arg Glu Asp Ser Pro Pro Gln Ala Val Glu Asp Leu Asp Gly Lys Gly
115 120 125
Ser Thr Ser Phe Leu Glu Thr Leu Lys Thr Glu Arg Leu Ser Pro Asp
130 135 140
Leu Leu Thr Leu Gly Pro Ala Leu Pro Ser Ser Leu Pro Val Pro Asn
145 150 155 160
Ser Ala Tyr Gly Gly Pro Asp Phe Ser Ser Thr Phe Phe Ser Pro Thr
165 170 175
Gly Ser Pro Leu Asn Ser Ala Ala Tyr Ser Ser Pro Lys Leu Arg Gly
180 185 190
Thr Leu Pro Leu Pro Pro Cys Glu Ala Arg Glu Cys Val Asn Cys Gly
195 200 205
Ala Thr Ala Thr Pro Leu Trp Arg Arg Asp Arg Thr Gly His Tyr Leu
210 215 220
Cys Asn Ala Cys Gly Leu Tyr His Lys Met Asn Gly Gln Asn Arg Pro
225 230 235 240
Leu Ile Arg Pro Lys Lys Arg Leu Ile Val Ser Lys Arg Ala Gly Thr
245 250 255
Gln Cys Thr Asn Cys Gln Thr Thr Thr Thr Thr Leu Trp Arg Arg Asn
260 265 270
Ala Ser Gly Asp Pro Val Cys Asn Ala Cys Gly Leu Tyr Tyr Lys Leu
275 280 285
His Gln Val Asn Arg Pro Leu Thr Met Arg Lys Asp Gly Ile Gln Thr
290 295 300
Arg Asn Arg Lys Ala Ser Gly Lys Gly Lys Lys Lys Arg Gly Ser Ser
305 310 315 320
Leu Gly Gly Thr Gly Ala Ala Glu Gly Pro Ala Gly Gly Phe Met Val
325 330 335
Val Ala Gly Gly Ser Gly Ser Gly Asn Cys Gly Glu Val Ala Ser Gly
340 345 350
Leu Thr Leu Gly Pro Pro Gly Thr Ala His Leu Tyr Gln Gly Leu Gly
355 360 365
Pro Val Val Leu Ser Gly Pro Val Ser His Leu Met Pro Phe Pro Gly
370 375 380
Pro Leu Leu Gly Ser Pro Thr Gly Ser Phe Pro Thr Gly Pro Met Pro
385 390 395 400
Pro Thr Thr Ser Thr Thr Val Val Ala Pro Leu Ser Ser
405 410
<210> 7
<211> 418
<212> PRT
<213> 智人
<400> 7
Met Glu Phe Pro Gly Leu Gly Ser Leu Gly Thr Ser Glu Pro Leu Pro
1 5 10 15
Gln Phe Val Asp Pro Ala Leu Val Ser Ser Thr Pro Glu Ser Gly Val
20 25 30
Phe Phe Pro Ser Gly Pro Glu Gly Leu Asp Ala Ala Ala Ser Ser Thr
35 40 45
Ala Pro Ser Thr Ala Thr Ala Ala Ala Ala Ala Leu Ala Tyr Tyr Arg
50 55 60
Asp Ala Glu Ala Tyr Arg His Ser Pro Val Phe Gln Val Tyr Pro Leu
65 70 75 80
Leu Asn Cys Met Glu Gly Ile Pro Gly Gly Ser Pro Tyr Ala Gly Trp
85 90 95
Ala Tyr Gly Lys Thr Gly Leu Tyr Pro Ala Ser Thr Val Cys Pro Thr
100 105 110
Arg Glu Asp Ser Pro Pro Gln Ala Val Glu Asp Leu Asp Gly Lys Gly
115 120 125
Ser Thr Ser Phe Leu Glu Thr Leu Lys Thr Glu Arg Leu Ser Pro Asp
130 135 140
Leu Leu Thr Leu Gly Pro Ala Leu Pro Ser Ser Leu Pro Val Pro Asn
145 150 155 160
Ser Ala Tyr Gly Gly Pro Asp Phe Ser Ser Thr Phe Phe Ser Pro Thr
165 170 175
Gly Ser Pro Leu Asn Ser Ala Ala Tyr Ser Ser Pro Lys Leu Arg Gly
180 185 190
Thr Leu Pro Leu Pro Pro Cys Glu Ala Arg Glu Cys Val Asn Cys Gly
195 200 205
Ala Thr Ala Thr Pro Leu Trp Arg Arg Asp Arg Thr Gly His Tyr Leu
210 215 220
Cys Asn Ala Cys Gly Leu Tyr His Lys Met Asn Gly Gln Asn Arg Pro
225 230 235 240
Leu Ile Arg Pro Lys Lys Arg Leu Ile Val Ser Lys Arg Ala Gly Thr
245 250 255
Gln Cys Thr Asn Cys Gln Thr Thr Thr Thr Thr Leu Trp Arg Arg Asn
260 265 270
Ala Ser Gly Asp Pro Val Cys Asn Ala Cys Gly Leu Tyr Tyr Lys Leu
275 280 285
His Gln Pro Pro Phe Trp Gln Val Asn Arg Pro Leu Thr Met Arg Lys
290 295 300
Asp Gly Ile Gln Thr Arg Asn Arg Lys Ala Ser Gly Lys Gly Lys Lys
305 310 315 320
Lys Arg Gly Ser Ser Leu Gly Gly Thr Gly Ala Ala Glu Gly Pro Ala
325 330 335
Gly Gly Phe Met Val Val Ala Gly Gly Ser Gly Ser Gly Asn Cys Gly
340 345 350
Glu Val Ala Ser Gly Leu Thr Leu Gly Pro Pro Gly Thr Ala His Leu
355 360 365
Tyr Gln Gly Leu Gly Pro Val Val Leu Ser Gly Pro Val Ser His Leu
370 375 380
Met Pro Phe Pro Gly Pro Leu Leu Gly Ser Pro Thr Gly Ser Phe Pro
385 390 395 400
Thr Gly Pro Met Pro Pro Thr Thr Ser Thr Thr Val Val Ala Pro Leu
405 410 415
Ser Ser
<210> 8
<211> 8244
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 8
gtcgacggat cgggagatct cccgatcccc tatggtgcac tctcagtaca atctgctctg 60
atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc gctgagtagt 120
gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc atgaagaatc 180
tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 240
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 300
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 360
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 420
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 480
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 540
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 600
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 660
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 720
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 780
gcggtaggcg tgtacggtgg gaggtctata taagcagcgc gttttgcctg tactgggtct 840
ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 900
aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 960
tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtggc 1020
gcccgaacag ggacttgaaa gcgaaaggga aaccagagga gctctctcga cgcaggactc 1080
ggcttgctga agcgcgcacg gcaagaggcg aggggcggcg actggtgagt acgccaaaaa 1140
ttttgactag cggaggctag aaggagagag atgggtgcga gagcgtcagt attaagcggg 1200
ggagaattag atcgcgatgg gaaaaaattc ggttaaggcc agggggaaag aaaaaatata 1260
aattaaaaca tatagtatgg gcaagcaggg agctagaacg attcgcagtt aatcctggcc 1320
tgttagaaac atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga 1380
caggatcaga agaacttaga tcattatata atacagtagc aaccctctat tgtgtgcatc 1440
aaaggataga gataaaagac accaaggaag ctttagacaa gatagaggaa gagcaaaaca 1500
aaagtaagac caccgcacag caagcggccg gccgctgatc ttcagacctg gaggaggaga 1560
tatgagggac aattggagaa gtgaattata taaatataaa gtagtaaaaa ttgaaccatt 1620
aggagtagca cccaccaagg caaagagaag agtggtgcag agagaaaaaa gagcagtggg 1680
aataggagct ttgttccttg ggttcttggg agcagcagga agcactatgg gcgcagcgtc 1740
aatgacgctg acggtacagg ccagacaatt attgtctggt atagtgcagc agcagaacaa 1800
tttgctgagg gctattgagg cgcaacagca tctgttgcaa ctcacagtct ggggcatcaa 1860
gcagctccag gcaagaatcc tggctgtgga aagataccta aaggatcaac agctcctggg 1920
gatttggggt tgctctggaa aactcatttg caccactgct gtgccttgga atgctagttg 1980
gagtaataaa tctctggaac agatttggaa tcacacgacc tggatggagt gggacagaga 2040
aattaacaat tacacaagct taatacactc cttaattgaa gaatcgcaaa accagcaaga 2100
aaagaatgaa caagaattat tggaattaga taaatgggca agtttgtgga attggtttaa 2160
cataacaaat tggctgtggt atataaaatt attcataatg atagtaggag gcttggtagg 2220
tttaagaata gtttttgctg tactttctat agtgaataga gttaggcagg gatattcacc 2280
attatcgttt cagacccacc tcccaacccc gaggggaccc gacaggcccg aaggaataga 2340
agaagaaggt ggagagagag acagagacag atccattcga ttagtgaacg gatcggcact 2400
gcgtgcgcca attctgcaga caaatggcag tattcatcca caattttaaa agaaaagggg 2460
ggattggggg gtacagtgca ggggaaagaa tagtagacat aatagcaaca gacatacaaa 2520
ctaaagaatt acaaaaacaa attacaaaaa ttcaaaattt tcgggtttat tacagggaca 2580
gcagagatcc agtttggtta gtaccgggcc cgctctagcg tgaggctccg gtgcccgtca 2640
gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg tcggcaattg 2700
aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa agtgatgtcg tgtactggct 2760
ccgccttttt cccgagggtg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt 2820
tctttttcgc aacgggtttg ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg 2880
gcctggcctc tttacgggtt atggcccttg cgtgccttga attacttcca cctggctgca 2940
gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt cgaggccttg 3000
cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg 3060
ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata agtctctagc 3120
catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata gtcttgtaaa 3180
tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg gcgacggggc 3240
ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc caccgagaat 3300
cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg cgccgccgtg 3360
tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt gagcggaaag 3420
atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga 3480
gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc 3540
atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct cgagcttttg 3600
gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc cccacactga 3660
gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct tggaatttgc 3720
cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc aaagtttttt 3780
tcttccattt caggtgtcgt gagcggccgc tgagttaact attctagacc cgggctagga 3840
tccgcccctc tccctccccc ccccctaacg ttactggccg aagccgcttg gaataaggcc 3900
ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc aatgtgaggg 3960
cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc cctctcgcca 4020
aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa 4080
gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct ggcgacaggt 4140
gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca caaccccagt 4200
gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca agcgtattca 4260
acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat ctggggcctc 4320
ggtacacatg ctttacatgt gtttagtcga ggttaaaaaa acgtctaggc cccccgaacc 4380
acggggacgt ggttttcctt tgaaaaacac gatgataata tggccacaac catggtgagc 4440
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 4500
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 4560
accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 4620
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 4680
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 4740
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 4800
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 4860
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4920
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4980
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 5040
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 5100
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta aagcggccgc 5160
atcgataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat tcttaactat 5220
gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca tgctattgct 5280
tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttgctgtc tctttatgag 5340
gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc 5400
cccactggtt ggggcattgc caccacctgt cagctccttt ccgggacttt cgctttcccc 5460
ctccctattg ccacggcgga actcatcgcc gcctgccttg cccgctgctg gacaggggct 5520
cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga agctgacgtc ctttccatgg 5580
ctgctcgcct gtgttgccac ctggattctg cgcgggacgt ccttctgcta cgtcccttcg 5640
gccctcaatc cagcggacct tccttcccgc ggcctgctgc cggctctgcg gcctcttccg 5700
cgtcttcgcc ttcgccctca gacgagtcgg atctcccttt gggccgcctc cccgcgaatt 5760
cgcattatta ctcacggtac gagcattatt actcacggta cgagcattat tactcacggt 5820
acgagcatta ttactcacgg tacgagcgat cgccctcagg tacctttaag accaatgact 5880
tacaaggcag ctgtagatct tagccacttt ttaaaagaaa aggggggact ggaagggcta 5940
attcactccc aacgaagaca agatatcctt gatctgtgga tctaccacac acaaggctac 6000
ttccctgatt ggcagaacta cacaccaggg ccagggatca gatatccact gacctttgga 6060
tggtgctaca agctagtacc agttgagcaa gagaaggtag aagaagccaa tgaaggagag 6120
aacacccgct tgttacaccc tgtgagcctg catgggatgg atgacccgga gagagaagta 6180
ttagagtgga ggtttgacag ccgcctagca tttcatcaca tggcccgaga gctgcatccg 6240
gactgtactg ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta 6300
gggaacccac tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc 6360
cgtctgttgt gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa 6420
atctctagca gcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 6480
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 6540
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 6600
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 6660
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 6720
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 6780
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 6840
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 6900
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 6960
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 7020
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 7080
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 7140
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 7200
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 7260
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 7320
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 7380
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 7440
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 7500
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 7560
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 7620
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 7680
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 7740
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 7800
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 7860
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 7920
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 7980
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 8040
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 8100
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 8160
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 8220
tttccccgaa aagtgccacc tgac 8244
<210> 9
<211> 6780
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 9
gtcgacggat cgggagatct cccgatcccc tatggtgcac tctcagtaca atctgctctg 60
atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc gctgagtagt 120
gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc atgaagaatc 180
tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 240
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 300
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 360
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 420
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 480
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 540
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 600
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 660
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 720
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 780
gcggtaggcg tgtacggtgg gaggtctata taagcagcgc gttttgcctg tactgggtct 840
ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 900
aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 960
tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtggc 1020
gcccgaacag ggacttgaaa gcgaaaggga aaccagagga gctctctcga cgcaggactc 1080
ggcttgctga agcgcgcacg gcaagaggcg aggggcggcg actggtgagt acgccaaaaa 1140
ttttgactag cggaggctag aaggagagag atgggtgcga gagcgtcagt attaagcggg 1200
ggagaattag atcgcgatgg gaaaaaattc ggttaaggcc agggggaaag aaaaaatata 1260
aattaaaaca tatagtatgg gcaagcaggg agctagaacg attcgcagtt aatcctggcc 1320
tgttagaaac atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga 1380
caggatcaga agaacttaga tcattatata atacagtagc aaccctctat tgtgtgcatc 1440
aaaggataga gataaaagac accaaggaag ctttagacaa gatagaggaa gagcaaaaca 1500
aaagtaagac caccgcacag caagcggccg gccgctgatc ttcagacctg gaggaggaga 1560
tatgagggac aattggagaa gtgaattata taaatataaa gtagtaaaaa ttgaaccatt 1620
aggagtagca cccaccaagg caaagagaag agtggtgcag agagaaaaaa gagcagtggg 1680
aataggagct ttgttccttg ggttcttggg agcagcagga agcactatgg gcgcagcgtc 1740
aatgacgctg acggtacagg ccagacaatt attgtctggt atagtgcagc agcagaacaa 1800
tttgctgagg gctattgagg cgcaacagca tctgttgcaa ctcacagtct ggggcatcaa 1860
gcagctccag gcaagaatcc tggctgtgga aagataccta aaggatcaac agctcctggg 1920
gatttggggt tgctctggaa aactcatttg caccactgct gtgccttgga atgctagttg 1980
gagtaataaa tctctggaac agatttggaa tcacacgacc tggatggagt gggacagaga 2040
aattaacaat tacacaagct taatacactc cttaattgaa gaatcgcaaa accagcaaga 2100
aaagaatgaa caagaattat tggaattaga taaatgggca agtttgtgga attggtttaa 2160
cataacaaat tggctgtggt atataaaatt attcataatg atagtaggag gcttggtagg 2220
tttaagaata gtttttgctg tactttctat agtgaataga gttaggcagg gatattcacc 2280
attatcgttt cagacccacc tcccaacccc gaggggaccc gacaggcccg aaggaataga 2340
agaagaaggt ggagagagag acagagacag atccattcga ttagtgaacg gatcggcact 2400
gcgtgcgcca attctgcaga caaatggcag tattcatcca caattttaaa agaaaagggg 2460
ggattggggg gtacagtgca ggggaaagaa tagtagacat aatagcaaca gacatacaaa 2520
ctaaagaatt acaaaaacaa attacaaaaa ttcaaaattt tcgggtttat tacagggaca 2580
gcagagatcc agtttggtta gtaccgggcc cgctctagcg tgaggctccg gtgcccgtca 2640
gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg tcggcaattg 2700
aaccggtgct agcatggcgg gcaagaagtt gaggccactg tccctgggtg ttcctacccc 2760
cacaccctca ccccaagaca gcctgttact gcggcgccaa cagccacggt cgcctacatc 2820
tgataagact tatctgctgc cccagggcag gccggagctg gcgtaagccc cagtggggcg 2880
ctaagtgagt gtgcccctgc ctcccgccag cactggcctg gcctgcaggc ttagcctggg 2940
tcatcaaggt atcccacagg ctctagttca aatccagcag aacctctctg agcctcactc 3000
ttctcacctg caaaatgggt acagccacat cccttctctc cctgcagcca ggaagacgca 3060
catacacagg agtctagccc acaccggccc cgcacaaatt aagggcttta ctctctgaaa 3120
agcccagtga agtcatgaaa ccatatctgc tattttcatt tatcttggtt tcagcctatt 3180
ttgcttgtct ggacactaca gtccacggga gcctaggtcg agcgaggtcc aagaatcccc 3240
agggtgggca gggagggtgg aagagggcct ccagtgccca agaggtgccc cacaagcatg 3300
ggacccgccc cctcccctgg actgccccac ccactggggc accagccact ccctggggag 3360
gagggaggag ggagaaggga gggagggagg gagggaggaa gggagcctca aaggccaagg 3420
ccagccagga caccccctgg gatcacactg agcttgccac atccccaagg cggccgaacc 3480
ctccgcaacc accagcccag agatctagag ttaatcccca gaggctccat ggtgagcaag 3540
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 3600
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 3660
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 3720
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 3780
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 3840
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 3900
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 3960
aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg 4020
aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag 4080
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc 4140
cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 4200
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag cggccgcatc 4260
gataccgtcg acctcgatcg agacctagaa aaacatggag caatcacaag tagcaataca 4320
gcagctacca atgctgattg tgcctggcta gaagcacaag aggaggagga ggtgggtttt 4380
ccagtcacac ctcaggtacc tttaagacca atgacttaca aggcagctgt agatcttagc 4440
cactttttaa aagaaaaggg gggactggaa gggctaattc actcccaacg aagacaagat 4500
atccttgatc tgtggatcta ccacacacaa ggctacttcc ctgattggca gaactacaca 4560
ccagggccag ggatcagata tccactgacc tttggatggt gctacaagct agtaccagtt 4620
gagcaagaga aggtagaaga agccaatgaa ggagagaaca cccgcttgtt acaccctgtg 4680
agcctgcatg ggatggatga cccggagaga gaagtattag agtggaggtt tgacagccgc 4740
ctagcatttc atcacatggc ccgagagctg catccggact gtactgggtc tctctggtta 4800
gaccagatct gagcctggga gctctctggc taactaggga acccactgct taagcctcaa 4860
taaagcttgc cttgagtgct tcaagtagtg tgtgcccgtc tgttgtgtga ctctggtaac 4920
tagagatccc tcagaccctt ttagtcagtg tggaaaatct ctagcagcat gtgagcaaaa 4980
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 5040
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 5100
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 5160
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 5220
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 5280
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 5340
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 5400
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 5460
actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 5520
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 5580
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 5640
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 5700
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 5760
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 5820
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 5880
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 5940
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 6000
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 6060
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 6120
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 6180
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 6240
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 6300
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 6360
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 6420
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 6480
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 6540
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 6600
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 6660
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 6720
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 6780
<210> 10
<211> 401
<212> DNA
<213> 智人
<400> 10
actttcatga aattactgac ataattttgg gtccaaaatt tcaaaatttt aaatattttt 60
atttggaatt ttaaaataat ttatatgctc tttttactgg ctaataatgc tattcattat 120
aatctgatat tcaaactgtc taaaaaagtt aacaatcatt gatttatttg ttgtatatac 180
agtttatttc tatgacagtt ttaatgtcac ctaatattat ttttaatgtt tcaatttctc 240
atttaaatac attttgtgtt gtttatttta atctcattca atctgtatgt gcaaatggct 300
tagaaaaaaa ggccatatat gacaagccca cagctaacat catatagtca acagtgaaaa 360
actaaaagct tctcctttaa gatcaggaac aaggcaagga t 401
<210> 11
<211> 501
<212> DNA
<213> 智人
<400> 11
ttttattatt tatttatttt tttgagacag attctcactc tgtcgcctag gctggaatgc 60
aatggcgtga tcccggctca ctgcaacctc tgcctcccag gttcaagcga ttctcctgcc 120
tcagcctccc gagtagctgg gattacaggc atgcgccacc acgcctggct aattttttgt 180
atttttagta gagacagggt ttctccatgt tggtcaggct ggtctcgaac taccgacctt 240
aggtaatcct cccacctcgg cctccgaaag tgctgggatt acaggcgtga gccactgcgc 300
ccggcctaca tttattttta aataaatgga tttaaatgtt aagacctgaa cctataaaaa 360
tgggacacct gcatagggca ttaaccatga gtagagcttg caggactgga agttgctatg 420
ggtgagtcag tgtgtgagtg gtgagtgaat gggaaggcct aggacattcc tgtacactac 480
catggacttt ataaattctg t 501
<210> 12
<211> 851
<212> DNA
<213> 智人
<400> 12
tcatagaaac aaaacactag gatggtggtt gccaggggct gagaggatgg ggaaatgggg 60
agttgctgtt caatggatat tgcgcccggc cagccacacc aattcttaca ccaagaagtg 120
atggagcaca agtgctgatg ggccttaaca ccatcataaa catcttttgt ttgtcccggg 180
gaagaaattc ccaactcctt ccaaaggtct gccaaagtct accagtatcc caagctgatt 240
tccttatccc ctcagcagat gctggaaagc tggaagtctc cttccttctc actctcctgc 300
ttgacatctg cacagccatt cttcttcctc cccttgctcc ccttcctccc cttctccttc 360
tcctacttat tgagacagag tctcgctctg tcgccgaggc tggagtgcag tggtgtcatc 420
tcggctcact gcaacctctg cctcctgggt tcaagcaatt ctcttgcctc cacctcctga 480
gtaggtggga ttacaggtgt gtgccaccac agcaggctaa tttttgtatt tttagtagag 540
acggggtttc accatattgg ccaggatggt ctcgaactcc tgacctcagg tgatctgcct 600
gtcttggcct cccaaagtgc cgggattaca ggcatgagcc accggcgccc ggcccttttt 660
attattatat attatttttg agactgggtc tcactctgta atccaggctg gagggcagtg 720
gcgtgatcac agctcactgc agccctgacc tcttgggcac aagcagtcct cccgcgtcag 780
ccacccaaag tgctgggtct acaggcatga gctactgtgc ccagtctacg atttttttaa 840
aatttataat t 851
<210> 13
<211> 1010
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 13
accggtggcg cgccgatcca aggaagagag gacattagca tgggtctcaa atggaagcct 60
gacagagaag acgcttcaac ccggacaccc cacccccgcc tgcaatgggc tcccccaagc 120
ctagcctggc ccccgctgat tcccttatct atgccttccc agctgcctcc ctgctggctg 180
aactgtggcc acagacttct gggccttgca ccccctccac tgccccccag ccccaagaca 240
gcctgttact gcggcaccaa cagccacagt cgagtccatc tgataagact tatctgctgc 300
cccagagcag gccagagctg gcgtaagccc caggcacgag ccgaagcact aaagaagtgt 360
atgtaccctt acccactagt agtaaaacat gaaacttaga tcttgactaa ttgctcatat 420
gacttgactg gacactggac tccacagaag ccaaaggcaa aggggatcca acaacctgca 480
ggatagacag gaagggcgga gggactagag cctaaaaggt cctccacaag gaggcggcac 540
accccctccc ctgcactgcc ccacccactg gggcaccagc cactccctgg ggaggaaaga 600
ggagggagaa ggtgagtggg agggagggag ggcgggcggg ctggcaggag ggagagaagg 660
gagactcaga ggccgagctc caaggataaa ttacttgttg aataaggatc taatgtgtag 720
aacccatact gacatggtag caggcacatc agcacagttt tagggaaatg ggagatggag 780
aagactcact ggaggctcac aggcctgtcc tggtacacac ggtggaaaaa tatgagaccc 840
tctttaaaaa ggaagtggat ggtaaggacc aacacccatg tttgtccact gacctccaga 900
tagatagata gatagataga tagatagata gatagataga tagatagata gatagacaga 960
ctgactgact gactgactga ctgactgact gactgactga ttgactgcag 1010
<210> 14
<211> 170
<212> DNA
<213> 智人
<400> 14
cacagaacca caagttgggt agcctggcag tgtcagaagt ctgaacccag catagtggtc 60
agcaggcagg acgaatcaca ctgaatgcaa accacagggt ttcgcagcgt ggtaaaagaa 120
atcattgagt cccccgcctt cagaagaggg tgcattttca ggaggaagcg 170
<210> 15
<211> 511
<212> DNA
<213> 智人
<400> 15
acaagggcct ctgggtgtcc tggcagagag gggagatggc acaggcacca ggtgctaggg 60
tgccagggcc tcccgagaag gaacaggtgc aaagcaggca attagcccag aaggtatccg 120
tggggcaggc agcctagatc tgatggggga agccaccagg attacatcat ctgctgtaac 180
aactgctctg aaaagaagat atttttcaac ctgaacttgc agtagctagt ggagaggcag 240
gaaaaaggaa atgaaaccag agacagaggg aagctgagcg aaaatagacc ttcccgagag 300
aggaggaagc ccggagagag acgcacggtc ccctccccgc ccctaggccg ccgccccctc 360
tctgccctcg gcggcgagca gcgcgccgcg acccgggccg aaggtgcgag gggctccggg 420
cggccgggcg ggcgcacacc atccccgcgg gcggcgcgga gccggcgaca gcgcgcgaga 480
gggaccgggc ggtggcggcg gcgggaccgg g 511
<210> 16
<211> 453
<212> DNA
<213> 智人
<400> 16
cgtcagtttc tgcactgaaa ctctcaagat caatgagcaa agagctttct cagttctgcc 60
tttcagtttc tctcttccag gaaggaaaac attcgagaga gcgagggaga gccgcgggag 120
ggcggggggc gggggcgccg gctgcgggtg ggaggagaga ccgggaggcc ggccgggctg 180
cgtcccgggt ccccgcgccg cgccgcgacc tgcagacccc gccgccgcgc tcgggcccgt 240
ctcccacgcc cccgccgccc cgcgcgccca actccgccgg ccgccccgcc ccgccccgcg 300
cgctccagac ccccggggcg gctgccggga gagatgctgg aagaaacttc ttaaatgacc 360
gcgtctggct ggccgtggag cctttctggg ttggggagag gaaaggaaag tggaaaaaac 420
ctgagaactt cctgatctct ctcgctgtga gac 453
<210> 17
<211> 5283
<212> DNA
<213> 智人
<400> 17
ctttttcgca acgggtttgc cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg 60
cctggcctct ttacgggtta tggcccttgc gtgccttgaa ttacttccac gcccctggct 120
gcagtacgtg attcttgatc ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc 180
ttgcgcttaa ggagcccctt cgcctcgtgc ttgagttgag gcctggcttg ggcgctgggg 240
ccgccgcgtg cgaatctggt ggcaccttcg cgcctgtctc gctgctttcg ataagtctct 300
agccatttaa aatttttgat gacctgctgc gacgcttttt ttctggcaag atagtcttgt 360
aaatgcgggc caagatctgc acactggtat ttcggttttt ggggccgcgg gcggcgacgg 420
ggcccgtgcg tcccagcgca catgttcggc gaggcggggc ctgcgagcgc ggccaccgag 480
aatcggacgg gggtagtctc aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc 540
gtgtatcgcc ccgccctggg cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga 600
aagatggccg cttcccggcc ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg 660
agagcgggcg ggtgagtcac ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc 720
ttcatgtgac tccacggagt accgggcgcc gtccaggcac ctcgattagt tctcgagctt 780
ttggagtacg tcgtctttag gttgggggga ggggttttat gcgatggagt ttccccacac 840
tgagtgggtg gagactgaag ttaggccagc ttggcacttg atgtaattct ccttggaatt 900
tgcccttttt gagtttggat cttggttcat tctcaagcct cagacagtgg ttcaaagttt 960
ttttcttcca tttcaggtgt cgtgaaaact acccctaaaa gccaaaatgg gaaaggaaaa 1020
gactcatatc aacattgtcg tcattggaca cgtagattcg ggcaagtcca ccactactgg 1080
ccatctgatc tataaatgcg gtggcatcga caaaagaacc attgaaaaat ttgagaagga 1140
ggctgctgag gtatgtttaa taccagaaag ggaaagatca actaaaatga gttttaccag 1200
cagaatcatt aggtgatttc cccagaacta gtgagtggtt tagatctgaa tgctaatagt 1260
taagacctta cttatgaaat aattttgctt ttggtgactt ctgtaatcgt attgctagtg 1320
agtagatttg gatgttaata gttaagatcc gacttataaa agtttgattt ttggttgctt 1380
ctgtaaccca aagtgactaa aatcactttg gacttggagt tgtaaagtgg aaactgccaa 1440
ttaagggctg gggacaagga aattgaagct ggagtttgtg ttttagtaac caagtaacga 1500
ctcttaatcc ttacagatgg gaaagggctc cttcaagtat gcctgggtct tggataaact 1560
gaaagctgag cgtgaacgtg gtatcaccat tgatatctcc ttgtggaaat ttgagaccag 1620
caagtactat gtgactatca ttgatgcccc aggacacaga gactttatca aaaacatgat 1680
tacagggaca tctcaggttg gtgggattaa taattctagg tttctttatc ccaaaaggct 1740
tgctttgtac actggttttg tcatttggag agttgacagg gatatgtctt tgctttcttt 1800
aaaggctgac tgtgctgtcc tgattgttgc tgctggtgtt ggtgaatttg aagctggtat 1860
ctccaagaat gggcagaccc gagagcatgc ccttctggct tacacactgg gtgtgaaaca 1920
actaattgtc ggtgttaaca aaatggattc cactgagcca ccctacagcc agaagagata 1980
tgaggaaatt gttaaggaag tcagcactta cattaagaaa attggctaca accccgacac 2040
agtagcattt gtgccaattt ctggttggaa tggtgacaac atgctggagc caagtgctaa 2100
cgtaagtggc tttcaagacc attgttaaaa agctctggga atggcgattt catgcttaca 2160
caaattggca tgcttgtgtt tcagatgcct tggttcaagg gatggaaagt cacccgtaag 2220
gatggcaatg ccagtggaac cacgctgctt gaggctctgg actgcatcct accaccaact 2280
cgtccaactg acaagccctt gcgcctgcct ctccaggatg tctacaaaat tggtggtaag 2340
ttggctgtaa acaaagttga atttgagttg atagagtact gtctgccttc ataggtattt 2400
agtatgctgt aaatattttt aggtattggt actgttcctg ttggccgagt ggagactggt 2460
gttctcaaac ccggtatggt ggtcaccttt gctccagtca acgttacaac ggaagtaaaa 2520
tctgtcgaaa tgcaccatga agctttgagt gaagctcttc ctggggacaa tgtgggcttc 2580
aatgtcaaga atgtgtctgt caaggatgtt cgtcgtggca acgttgctgg tgacagcaaa 2640
aatgacccac caatggaagc agctggcttc actgctcagg taacaattta aagtaacatt 2700
aacttattgc agaggctaaa gtcatttgag actttggatt tgcactgaat gcaaatcttt 2760
tttccaaggt gattatcctg aaccatccag gccaaataag cgccggctat gcccctgtat 2820
tggattgcca cacggctcac attgcatgca agtttgctga gctgaaggaa aagattgatc 2880
gccgttctgg taaaaagctg gaagatggcc ctaaattctt gaagtctggt gatgctgcca 2940
ttgttgatat ggttcctggc aagcccatgt gtgttgagag cttctcagac tatccacctt 3000
tgggtaagga tgactactta aatgtaaaaa agttgtgtta aagatgaaaa atacaactga 3060
acagtacttt gggtaataat taactttttt tttaataggt cgctttgctg ttcgtgatat 3120
gagacagaca gttgcggtgg gtgtcatcaa agcagtggac aagaaggctg ctggagctgg 3180
caaggtcacc aagtctgccc agaaagctca gaaggctaaa tgaatattat ccctaatacc 3240
tgccacccca ctcttaatca gtggtggaag aacggtctca gaactgtttg tttcaattgg 3300
ccatttaagt ttagtagtaa aagactggtt aatgataaca atgcatcgta aaaccttcag 3360
aaggaaagga gaatgttttg tggaccactt tggttttctt ttttgcgtgt ggcagtttta 3420
agttattagt ttttaaaatc agtacttttt aatggaaaca acttgaccaa aaatttgtca 3480
cagaattttg agacccatta aaaaagttaa atgagaaacc tgtgtgttcc tttggtcaac 3540
accgagacat ttaggtgaaa gacatctaat tctggtttta cgaatctgga aacttcttga 3600
aaatgtaatt cttgagttaa cacttctggg tggagaatag ggttgttttc cccccacata 3660
attggaaggg gaaggaatat catttaaagc tatgggaggg ttgctttgat tacaacactg 3720
gagagaaatg cagcatgttg ctgattgcct gtcactaaaa caggccaaaa actgagtcct 3780
tgtgttgcat agaaagcttc atgttgctaa accaatgtta agtgaatctt tggaaacaaa 3840
atgtttccaa attactggga tgtgcatgtt gaaacgtggg ttaaaatgac tgggcagtga 3900
aagttgacta tttgccatga cataagaaat aagtgtagtg gctagtgtac accctatgag 3960
tggaagggtc cattttgaag tcagtggagt aagctttatg ccagtttgat ggtttcacaa 4020
gttctattga gtgctattca gaataggaac aaggttctaa tagaaaaaga tggcaatttg 4080
aagtagctat aaaattagac taatctacat tgcttttctc ctgcagagtc taataccttt 4140
tatgctttga taattagcag tttgtctact tggtcactag gaatgaaact acatggtaat 4200
aggcttaaca ggtgtaatag cccacttact cctgaatctt taagcatttg tgcatttgaa 4260
aaatgctttt cgcgatcttc ctgctgggat tacaggcatg agccactgtg cctgacctcc 4320
catatgtaaa agtgtctaaa ggtttttttt tggttataaa aggaaaattt ttgcttaagt 4380
ttgaaggata ggtaaaatta aaggacatgc tttctgtttg tgtgatggtt tttaaaaatt 4440
ttttttaaga tggagttctt gttgcccagg ctagaatgca atggcaaaat ctcactgcaa 4500
tctcctcctc ctgggttcaa gcaattctcc tacttcagcc tcccaagtag ctgggattac 4560
aggcatgtgc taatttggtg tttttaatag agatgaggtt tttccatgtt ggtcaggctg 4620
gtctcaaact cctgacctta ggtgatcgcc tcggcctcct aaagtgctgg aattacaggc 4680
atgagccacc atgcctggcc aggacatgtg ttcttaagga catgctaagc aggagttaaa 4740
gcagcccaag agataaggcc tcttaaagtg actggcaatg tgtattgctc aagattcaaa 4800
ggtacttgaa ttggccatag acaagtctgt aatgaagtgt tatcgttttc cctcatctga 4860
gtctgaatta gataaaatgc cttcccatca gccagtgctc tgaggtatca agtctaaatt 4920
gaactagaga tttttgtcct tagtttcttt gctatctaat gtttacacaa gtaaatagtc 4980
taagatttgc tggatgacag aaaaaacagg taaggccttt aatagatggc caatagatgc 5040
cctgataatg aaagttgaca cctgtaagat ttaccagtag agaattcttg acatgcaagg 5100
aagcaagatt taactgaaaa attgttccca ctggaagcag gaatgagtca gtttacttgc 5160
atatactgag attgagatta acttcctgtg aaacccagtg tcttagacaa ctgtggcttg 5220
agcaccacct gctggtattc attacaaact tgctcactac aataaatgaa ttttaagctt 5280
taa 5283
<210> 18
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 18
uacccuguag auccgaauuu gug 23
<210> 19
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 19
aacccguaga uccgaucuug ug 22
<210> 20
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 20
acaggugagg uucuugggag cc 22
<210> 21
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 21
cauuauuacu uuugguacgc g 21
<210> 22
<211> 65
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 22
cuguuaaugc uaaucgugau agggguuuuu gccuccaacu gacuccuaca uauuagcauu 60
aacag 65
<210> 23
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 23
aacauucaac gcugucggug agu 23
<210> 24
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 24
aacuggccua caaaguccca gu 22
<210> 25
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 25
caacaacauu aaaccacccg a 21
<210> 26
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 26
ugucaguuug ucaaauaccc ca 22
<210> 27
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 27
ugugacagau ugauaacuga aa 22
<210> 28
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 28
ugagguagga gguuguauag uu 22
<210> 29
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 29
gcucuuuuca cauugugcua cu 22
<210> 30
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 30
cauaaaguag aaagcacuac u 21
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 31
cacaaattcg gatctacagg gta 23
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 32
gcattattac tcacggtacg a 21
<210> 33
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 33
ccaacaacag gaaactacct a 21
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 34
tgtcagtttg tcaaataccc c 21
<210> 35
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 35
aactatacaa cctactacct ca 22
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 36
cagtgcaatg ttaaaagggc at 22
<210> 37
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 37
tccataaagt aggaaacact aca 23
<210> 38
<211> 1179
<212> DNA
<213> 未知
<220>
<223> 未知的描述:
异源增强子元件序列
<400> 38
atgaaaccat atctgctatt ttcatttatc ttggtttcag cctattttgc ttgtctggac 60
actacagtcc acgggagcct aggtcgagcg aggtccaaga atccccaggg tgggcaggga 120
gggtggaaga gggcctccag tgcccaagag gtgccccaca agcatgggac ccgccccctc 180
ccctggactg ccccacccac tggggcacca gccactccct ggggaggagg gaggagggag 240
aagggaggga gggagggagg gaggaaggga gcctcaaagg ccaaggccag ccaggacacc 300
ccctgggatc acactgagct tgccacatcc ccaaggcggc cgaaccctcc gcaaccacca 360
gcccagagat ctagagttaa tccccagagg ctccatggtg agcaagggcg aggagctgtt 420
caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc acaagttcag 480
cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga agttcatctg 540
caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccctga cctacggcgt 600
gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca agtccgccat 660
gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca actacaagac 720
ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc tgaagggcat 780
cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact acaacagcca 840
caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact tcaagatccg 900
ccacaacatc gaggacggca gcgtgcagct cgccgaccac taccagcaga acacccccat 960
cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agcacccagt ccgccctgag 1020
caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg 1080
gatcactctc ggcatggacg agctgtacaa gtaaagcggc cgcatcgata ccgtcgacct 1140
cgatcgagac ctagaaaaac atggagcaat cacaagtag 1179
<210> 39
<211> 796
<212> DNA
<213> 未知
<220>
<223> 未知的描述:
异源增强子元件序列
<400> 39
atggcgggca agaagttgag gccactgtcc ctgggtgttc ctacccccac accctcaccc 60
caagacagcc tgttactgcg gcgccaacag ccacggtcgc ctacatctga taagacttat 120
ctgctgcccc agggcaggcc ggagctggcg taagccccag tggggcgcta agtgagtgtg 180
cccctgcctc ccgccagcac tggcctggcc tgcaggctta gcctgggtca tcaaggtatc 240
ccacaggctc tagttcaaat ccagcagaac ctctctgagc ctcactcttc tcacctgcaa 300
aatgggtaca gccacatccc ttctctccct gcagccagga agacgcacat acacaggagt 360
ctagcccaca ccggccccgc acaaattaag ggctttactc tctgaaaagc ccagtgaagt 420
catgaaacca tatctgctat tttcatttat cttggtttca gcctattttg cttgtctgga 480
cactacagtc cacgggagcc taggtcgagc gaggtccaag aatccccagg gtgggcaggg 540
agggtggaag agggcctcca gtgcccaaga ggtgccccac aagcatggga cccgccccct 600
cccctggact gccccaccca ctggggcacc agccactccc tggggaggag ggaggaggga 660
gaagggaggg agggagggag ggaggaaggg agcctcaaag gccaaggcca gccaggacac 720
cccctgggat cacactgagc ttgccacatc cccaaggcgg ccgaaccctc cgcaaccacc 780
agcccagaga tctaga 796
<210> 40
<211> 21303
<212> DNA
<213> 智人
<400> 40
gggaggagaa gcctgggtgc cccccactga taagcaggct ccacccagag gccagtcctg 60
tgtgtctggg gacaaggcga aagagcagca gaagtgcccc ttctccagga tcaaggaact 120
ggggcggggg gtgtttcctg gaccccagtc ctccgaatca gctcctagag tggaaccagg 180
aaggattctg gagccacaga agatagacag atggtaagtc cccttttgga gtcagaggct 240
tagcggggag gggtgagggt ggctgtgtgc aaaagtcctg cccccactgg aggggaggga 300
atgtaaggct tacagagtag aaaggtgggg agagagggag gtaatgggag agggatcgag 360
aaatggcaca ttcaggggac aggttcgttc tgaagcccat ctgggaacac tgctccgaga 420
taaaaatatg tgtgtggggg cagggcaggc agcgagggta tcaaaatggc ctgataaaac 480
tctcttcaat gcaccatttc ctgaaccagc ttctctctcc tccttctccc tccactcact 540
tcaggaaggt ggggaccaaa gtgaggaaga gccgagggaa cgcagccagg caggtggaat 600
gggaactctc tggagccaag aggtaagtgg cctcctctcc tgggtctgga atacactgat 660
gttgtcactc tcggctctaa aatcccacaa acactcatct actaactgtc tgcttcatcc 720
tcacccaaaa cagttgacat tccttgtttt ctcatctccc aggagttaaa gtagggctgg 780
gtttaggaag aattgggata attatttctg tataaaggga ctgtagcacc aacagattca 840
ttctctctcc tcttcttccc atccctgtct ctcaaccccc atcttgtatc tttcacctct 900
tggttcctcc cacagagcac tccagaagag aggctgcccg tggaagggag caggccatgg 960
gcagtggcca ggcgggtgct gacagctatc ctgattttgg gcctgctcct ttgtttttct 1020
gtgcttttgt tctacaactt ccagaactgt ggccctcgta agcaagatcc cagaccccct 1080
aacctagtca gccctccccc agccctgggg cccaggccca gtccctgctc ctggggcttc 1140
tgcccaccct gacccttggg gtccccatgg ttcttcttcc tccctgcatc ctaaccattt 1200
ctttttcatc agctccccac ttagttactc acctgatgtt ctttgcctag ccccttgggg 1260
gagcccttgt ctttttgcct cttctttccc agctctgagc ttttccccac aggcccctgt 1320
gagacatctg tgtgtttgga tctccgggat cattacctgg cctctgggaa cacaagtgtg 1380
gccccctgca ccgacttctt cagctttgcc tgtggaaggg ccaaagagac caataattct 1440
tttcaggagc ttgccacaaa gaacaaaaac cgacttcgga gaatactggg tgaggaaagc 1500
agggtggaag atgctctgtg caagtgggtg actctgtgcc taaaatgacc atgactgctc 1560
caaaccctgt gtagttgtgg aacaactgat ttgcaccatc ccaggtggga ttatacgggt 1620
ggatgattgg agatgatggg ggagtaaaag aggcaggatg gcgggagctg cctgggtttg 1680
ctcatctctc actgtttcct gttgccttgc cttgggtacc cttcttccgt ttctcttggt 1740
ccctttctgc atttttttct ttatctaatt tccatcttct ttgcttctcc atgtatccat 1800
aattactcca ttctctccaa cttgtccctt ttagcaagct ccatctttgt tgcttcctcc 1860
aaatgttcag tttctatcct atgcatggtg ttttcctcca caagcatctc ttcagcatct 1920
cctgcatttc aattcttttg tccatcactc tcattctcta acctccaaaa cctcagtctc 1980
ccaatgactc cttgtcaaca ttaccctctc cctctcacca tgccggagct cccctctctc 2040
acaatgatct cttgcttctt gcttctccat tgaaaccttg aaccatggca agcaagttga 2100
cctggaacaa gtgggatgtt agagatggat gattggagat gatggatgat ggtggaatga 2160
aaggggtagg atggtggggt gagaagtgag agagggcttc atcactgtgc ataagagaaa 2220
aagtgggtaa gtacaaagga tatgctggaa gaagaggaga gctgagttaa ttggcagtgg 2280
aagtaaagtt cctgcagatg gaggctggag aggaaaactg ccaggactga gaggaaaacc 2340
agaaggatga gctgaaactg agtaggaggt tggaagtgcg tcccaggaag ttggtggatg 2400
gtggtgagga tttgggaata agaacatata agatagacat gcatttccag tgcaagggaa 2460
cctaaagaat gtgttgacac tatcaattag aatctgggaa aagtaaatgc acccctctgc 2520
cctctttttt tgatggggaa agagtgggag ggggcctctc tttgggtaaa tggatacttt 2580
cagggaaggc acagagataa aaagaaaaaa tatgctcagg ataaattata ttgcctacaa 2640
tgggatgaat agatatcagg gggactgagg gtgaaaagag tgttagatat tagagggtgg 2700
atgattcaga gagacttgca tttgattatt gtagtgtgtt tgtttcctgg gatcaatgga 2760
tgaggagtct ggactagaag agtcttcccc tgtttcttct ctttgctaaa cctttcctta 2820
tgagttttct tctctccaaa tccttaaagt tctctagttc cctgaatttg tctaatttct 2880
tcaatcattt cttttgtctt tcatttctct cttttctcct ttgcccatat cccacttatt 2940
gctacctttc tcctttcttc cctgtctttt ccttcttggt ttcttcccca catttctttt 3000
attttccata ttgtcttctt ctcctcattc tctttccctg ctttcatcat ttcatcaagt 3060
tgatccattc caaattgggc agtcctctca tctttcttat tttcctcatc tctattcctc 3120
cccctccttc catattctgt gggagtcttt ctttcctgta agctccctgt ctcccaccct 3180
ccctctttgc ctctatacca gttgccactc ctttaattct cctgccgaca aaaagagtca 3240
aactctgtaa aatatttgaa aagatttatt ttgagccaaa tatgagtgac catggcccat 3300
gatacagtcc tcaggagatc ctgagaacat gtgcccaagg tggctggggc acagcttggt 3360
tttatacatt ttagagagtc atgagacatc aatcaaatac atttaagaaa tacattggtt 3420
tggtccagaa aggtggaaca actcaaaggg gtgggggtgg cttccagggt acaggtgaat 3480
ttaaacattt ccggattgac agttgcttga gtttgtctaa agatctggga tagatagaaa 3540
gggaatgttc agggtaagat aaagattgcg gagaccgaag ttcttttgaa gtcttatagt 3600
ggctgccctt agagacaata ggtgacaaat gtttcctatt cagatcttag ttaatcaaaa 3660
gatctagcta tgttaatgag atatgttaat agctaataga gatgctttac agatgcaaat 3720
tttcctccac aaagaacagc tttgcagggc catttcaaaa tgtggcaaag aaacatgttt 3780
tggggtaaaa tatttttgtt ttcttctttg tctcgtaatg ttatgccaga atcaggttag 3840
aaagtaaatc atgttacatg ggttaaataa aacccatctg atgagaactt atgatatagg 3900
gcatgactcc ccagacccct ttgataggaa tttggggcaa gataaaaaaa atcagagttt 3960
agtcctcact cccatgcttc ctttctagag gtccagaatt cctggcaccc aggctctggg 4020
gaggagaaag ccttccagtt ctacaactcc tgcatggata cacttgccat tgaagctgca 4080
gggactggtc ccctcagaca agttattgag gaggtgagaa aagttgggat attaactttt 4140
ctggatacat aacatatggg accaatgcat gcttagggct gccatttttt tttctagagg 4200
gtgggtcttc ttcctagggc cccccaattt ctaggaggga gatggagatg gaaatggtta 4260
tgccctatga aagtatcagg accttgggag aaggcagata aaaaaggata gatgtggctt 4320
cctagaggaa tcgaagggcg cagggcagag gtcaggcagt agcagctgtg taagagccga 4380
tccagacaat gggggatggg ctccacggat ccttatgctc agccccctct ctctccttta 4440
aagcttggag gctggcgcat ctctggtaaa tggacttcct taaactttaa ccgaacgctg 4500
agacttctga tgagtcagta tggccatttc cctttcttca gagcctacct aggacctcat 4560
cctgcctctc cacacacacc agtcatccag gtgagggatg cactggcgaa gacacagttg 4620
gacctggcct gcctccaact ctagccaatc atcccttaga ggaaggttgc aggttgggaa 4680
gagaggacac ctgtgtgata taggaaacaa ccctacctta agggaaaatt attgatgtga 4740
aagtcaggga cattagctgg gggtgggaaa tggagcagca gagccagtgc tgggaagaca 4800
gaagtaggcc tggtctttct tactgttaat ctggattagt ctcagagccc cttaaccagt 4860
cctcctatct ctaggattgc cctcatttta tttactcttt atttttacta gagggaactt 4920
ttctaaacca agggctaact aactatgcta ctgtctgtat ttaaatgctt gtcagtgacc 4980
cagtggcttg ccaggtcatc agaatctagt ccctaatctt tagtaaagct ttgcaagcac 5040
cttgtgatct gacccctaca cacttctcca gccttatctc ccgtacattc cttctctccc 5100
ttacccccaa gccatgctga ctcactgctg cttccaggaa tattcctcag ttctttgcct 5160
atgctgctcc ctgtgcctgc aaccatcccc cacactgaac ctggaaaact tacatgtttt 5220
tcaaatgttg gctttattat ctcttccagg aagtcttcac cgacacccta gttatgagtt 5280
aggtgaagcc ctgctctccc tactttcgtt tcctcatgct ctcagcattt atcactctgt 5340
gttgaagatt gtgagcctct ttagaacagg accatgcttt attcaccttt gtttctcagg 5400
acctatcaca gggccaggca gctagaagtt ttgccaggta tttgtagtga gtgagtaact 5460
aaataaaaac actggagcta tcactcttgt ggttaaacaa tgtaatgcta tctgcatatt 5520
tgggccctac tgtcaaaaga gccacaaaat taccaaagga taagtacaaa agaagaattg 5580
attatcatta tgaggtgttc taaaatttag ttttaaacag tctgctcagg agtttaactg 5640
atgtggcctt taggggccgg ttaagatctg gttaaggaga ggctcagaga ggagagaatg 5700
agagaaggtg agctaagcca gccttgaaac atggttaatt cacacaagtg gaggtgaagc 5760
tatggggcgt tggaaatgct gagccagggg gaggacctgg aatggtgtga ttccttcgtg 5820
gagtcagtga ggaggctgat ctatttaatt gaggatttgg gaggcaaggt ggggtgcagt 5880
gggaggtaaa agtgagactg aagacataag gttgagcctg attatttcta agaagccagg 5940
cgaaggtgaa acatttgaca taatagaaaa aaaaaaaaga gctactgagg ccatccaact 6000
cttatgacaa ttgtgcatag agcaagtatt ttgatggttg tgcgtagagt cagcagtttt 6060
gaaggtcagt ctgggggtgt tgaggaaact aaatgagcat ttttgaggcc ctgagataga 6120
ggtagaaatg gaaaggaaga gccaggcaca aggatttagg caacttcacc ctagtgatga 6180
tagttcatgc tgtttctaga ggatttggtg actgattgga tataaagaaa gaaagtgggg 6240
gattacacag tgatcccatt gttttgattt agtgtgagtg ggaggagggt gattatcatc 6300
agtgtgagcc tggatagtct cttgggttaa aagcaggtag gaagaatgga ctacagaaag 6360
agaagtccaa agactgaggg cagaagggag ccagggaaga gagagtacta ttggagagat 6420
gggagctaga ccagtatggt gggccacaaa ggaaagaaaa ggagcttcag gaaggagggg 6480
tcagctcaga gaagaaggaa tgagaagaca cccttggata cctagagata ctttccaaac 6540
agttatggca gtggacacag actgcacaga gcttaggagg aagataagaa agtggaaaca 6600
atgggcatag atgctttttt gttctttgaa ctgtggacat acaatgtagc aaaagggtca 6660
agtgaaagtt tttttcgaga cagaaggaaa agtatatggc tcaagataag agtgggatat 6720
tgaaattgga gaagaaaagg gaaagagtag aagcaaagat cttcagaata gaaacaaggg 6780
ttcatcaggg ccagactaag gtgaaatata catggtgctt acctggggtg ctaatttaag 6840
aaggtcccca aaactcagta tcatgataaa tagtatttta ttaaatattc ctaaaaaatc 6900
aaaatcaatg caacaataca tgatggaaca aaatatcaaa cttttcttca ttatgaattt 6960
ttttgaaaaa agattatgct ttttttccca aaaaatggga caaaattctg tgtgaatctt 7020
tttgaaaata ctaatttttt tattcaaaat gaatcaaaaa tacattgagg acttttcttg 7080
aacacatcat gattcttttc aaaattgact aaaagtatgt ttttttgggg aaaaaaagtc 7140
catgataagc aaagttttga gattttattt atcatacatt tttggtagta attttgattt 7200
tttaaaatgt taattattta tcttgattac tgagtttttt taaaaaagag tttatttgag 7260
caaagactga tttatgaatt gggcagcatc ctgaagcagt agaggttcag agagctccac 7320
ccaacaatgc aggcaggcag tatttacaga aagaggaagt gacacccaga aacagcttga 7380
ttggttacag cttagcaatt gtctttaatg ggcatggtct gatcacttga cagcctgtgg 7440
ttgcctgaag atcagctggt atggctggct gagatggagc tacctgttgc aagaatatac 7500
tcctaagtta ggttgcagtt tgattactga gtttttggta cctcttagat tttgtacctg 7560
ggacaggttc ctcacctcac tcaccctggc cctgttcctg agacaaggaa tagctccttt 7620
taagatgctg attatcatgc ttctgccttg ctgggcacac ccacactggt tgtaatactc 7680
accatctctt cccattttca catctggact cttcttctca tgcccctcaa cccttaatcc 7740
ctccctttct ttgtactctt gcttctcttc tgtccaatct ttgtgtccat ctcccaaggc 7800
catctcccat ggtatattcc ccacctcccc acacctgccc tctccatccg ccatgctccc 7860
tgcttctctc cagtctctct tgtgcccaga tagaccagcc agagtttgat gttcccctca 7920
agcaagatca agaacagaag atctatgccc aggtaagatg gcacatggac aaaggccctg 7980
ccctctgagg ccaggagaaa agcagggacc tctggcacct gtgactgaca tttccttcct 8040
ccagatcttt cgggaatacc tgacttacct gaatcagctg ggaaccttgc tgggaggaga 8100
cccaagcaag gtgcaagaac actcttcctt gtcaatctcc atcacttcac ggctgttcca 8160
gtttctgagg cccctggagc agcggcgggc acagggcaag ctcttccaga tggtcactat 8220
cgaccagctc aaggtgcctg gaactggggg ccagaagact gtgggcatgg ggatcttcct 8280
ctcaaacatt acctcctttc cttcttcctc ctagtgccct taataccttt tcattctgtc 8340
tctgactcca tcccctcccc cagttagcct gttctcttct ttttctcaca cccaagggga 8400
agccctttcc ccttccttct cttttccttt tccccctcag ctttgtgtcc ctcctctaag 8460
gaaatggccc ccgccatcga ctggttgtcc tgcttgcaag cgacattcac accgatgtcc 8520
ctgagccctt ctcagtccct cgtggtccat gacgtggaat atttgaaaaa catgtcacaa 8580
ctggtggagg agatgctgct aaagcagagg ttcgccgcag gtgggattgg ggagatcatg 8640
gaaatggagg agagcctgag caccgtagat cttgggggca aaggaaacct tggggaaggc 8700
aggctggtaa gggcctccca ggaggataag aggaacctgc cacctgtgcg ggcagagaag 8760
cgtggggtgg gtggcacaga gaggatggag ggatcaagaa ggatgtgtct tgggagcacg 8820
agtaagggag gatacacacg acatgaggaa cgcagggtca gccaagacac ggggtttcct 8880
gagagtagaa caccagccag tcaagagcct ctgagctgta gaagatgctg gaagacccag 8940
acacagaaga cagttaagtg tatgtatgtc tttttagcag ctgaggactg tgggcaggag 9000
gaggaggcac atgagatgag gagatgaaga tggtgaaggc tggggatgct taggggaaga 9060
aaggaagagg aggggccatt cctcaggtgt ggtgtgaaga tgctggagct cttatgggaa 9120
acaatgtcta agagcatttc tgctggtgtc aggaaatcaa gggggtgttg gggttgggga 9180
catgaaagag tggctctttg ttgggctctc tgcctcccct gatacctggg tggctaccac 9240
ctgaaagcag tggctttctt ccaggggctt ggacctaagg gccttcttca tggtggcagc 9300
agcatctgga aatccttttt gagggaggta gctgcccatt cacatggcag tgagcaggct 9360
tacataaggg tgcaatgcag ccctggcagg agcattgctg gtggaggaga gagcagtcac 9420
agagaccagc ttacttatgc ttatgagata catctgagga taaccagaga tatcttgact 9480
gtggaagcag aatctgtttc atgacatgag tccagactcc atctagccca gaactttctt 9540
tccctgtgac tttgaaggct gcctcttcat ctagtttctt ttactaagga gctagatccc 9600
accccaacct acatcatgaa aagctctttt tgacttgggt gcatgttaaa acacttatta 9660
atacagagga gaaggagctg ccttcacgag tatcaaggtg acttacacaa ggagaggctc 9720
ttcttgaagc atccccagat tcctggggta tatgtgtggg tctcttttgt ctccataggg 9780
actttctgca gagccacatg atcttagggc tggtggtgac cctttctcca gccctggaca 9840
gtcaattcca ggaggcacgc agaaagctca gccagaaact gcgggaactg acagagcaac 9900
cacccatggt gaggagagga gcgggtgtat ttgcccagat actcgaaagg agtatctact 9960
cttttgaggg gtaaatgtcg gcatctctct ctcagggagg gggccgtgat ggtagatgcc 10020
cctccatgtc ttggctttcc atagaagcag gcaagttgga cagacaaagt ttaacttgaa 10080
aaccaagatg ccacgtgcca gaccttcagg cacacatctc ccagcctgac tacctctctg 10140
gcttcttgct gggtgtttga gctcaaatat aaaactctga tattatcaaa actgcccttt 10200
ctttgtcatg atgcttacac tatttgctca ggataacttg gacttagagc ttacaattta 10260
ttgggatgac agagagatat gttacgcagt ggccttcctt atgtctagtt gattccatgt 10320
tcaaacgtgc ttcacaaaga gtttatctct gacatccagt gggatccact gggccacatg 10380
tagactttgt ggcacagatg tggatatatc tgaggagggg cctgggtaga aaatgcactt 10440
cactaaccag agtctactta ttacataaga tgcagagatg ctcctttgct gagaatcttg 10500
aaatcccaag ttggatatat ccaaatgcaa gcagaagagt ctagtacatt ggatacatcc 10560
caacctcagt gaaggcctca gtttagtctt aaaaatcact ggattttttt tcttagtaat 10620
ttgtggtcca tttccctgcc ttggagaaac tctctgcttt ggcaacctaa aattgctgtg 10680
gaattcagag aagataaatg tattcacagg gactggaatg tagttattgc ttatcaagag 10740
ctaatggtgt gctagacact ctgaaatcct ttagatctaa atctagattt agatttaatc 10800
tttacaattc catgaggtac catggatgcc atttggttcc tattttaaag aggaggagac 10860
agaggcacga aagataagga agttgctcag gtatgacagt aagttagtgg ggtgaggatt 10920
tgaaccctgg cagtctggct ccagggtctg tgttgtttac tcattgtgct aaaaaagcag 10980
tcttcctgag gaacatcact tgggttggag agtggccaag aagcttctgc ccagcttttc 11040
tcttgattca gatgaagcag accagagccc caagttatct taattggggt tgctacaaaa 11100
tcctggcaac aaacagctac ctataaatgc cagcaccatg gcctcatggc acttcttgga 11160
ggctgtaaga gtgctaatgt tgaggcttag gcttaaagaa tgcagaaggc ttagatgtcc 11220
tgaagccatt atcttttcca ctagggcaca taattgtcct tgggcttaaa agctgaacta 11280
atctctgcca acaaatagtt gtgtgacctt ggggacgcca cttcaccttt ctggaacaat 11340
agtataaaag atggcactta ataataatga taatagctgc tatacatgga gtagtcactg 11400
tctgtcagca cttgggacag gttattcatt taaatcttcc agaaacactt ggaggttttt 11460
aatccccatt ttgcagaagc aaaaataggc tcagaaaggt caagaaactt tctcaagacc 11520
acacagctca caagtaagtg aacagactcc aaaacagatg ttttggctca taaagtcatg 11580
tttttaacca cacactatac aggattgaga aacaagtagg tgctacaaac aaaggttaga 11640
aaactttttt ataaagggca acatagtaaa tatcgacttc gtgatccata aatggttggt 11700
gttacaaact actcaactct gtccctgtag tgcaaaaaca actgtacact aagtaaatgc 11760
tgtgttccca ggggatcctg gttgagacag cagatattct tggagttccc aagagggaga 11820
gatcagggag catttgaagg atcagtggca tctctgtgca ggaggcagaa ctgacaaaat 11880
gtctagagag aggaaggagt tttctggtga agaaaggggt atcatctcat ggggacaggg 11940
caggaggcag gctggctaaa acttggtgca gggtgaggga tcctcctggt ggctctggtt 12000
gagaggagaa gactaggctt gctgtgtcca ctgatgcccc tggagcatgc tccaggtgtt 12060
tgagaatcag caagggagcc agggcacctg gatcagagtg actaggacaa tagtggggag 12120
ggaatcagag caggaaggag agaaccatac aaggtctggt aggttgctga aggacttttg 12180
cttctctctg tatgaaataa agacatgcag agggatttat ctcatttatg ttttaaaaga 12240
acatatttta aggttagtaa tgggatgtcc tgatgatgag tgatgtgaga aggagaatgg 12300
aatcaaagac atcacctaga gtttggcctt gatatgatca aaatgtttgg ttttattcag 12360
tggccattaa ttaccgactt ctgatcatat tcttttgaat gaattataat ttatagtgcc 12420
cttatacaga aagatttcta aatctcatta ttggcccatc tttggatgat tagttttgaa 12480
tagagttata gtcaatgaaa atggctgtta agtcaggttt tcttttatga aacttgggaa 12540
ggtgggtttt gagaagtaaa agcagaactt cacatttgtg atgattaaat gtgaatgatt 12600
tatattcagc ccaacatctc aatttattca ggtcttccag ctttggatca tttgcaattt 12660
tattcagtgt atcttcgtcc agactactgt taagatcctg aagggagaag ggcatcgggt 12720
caggttattg aagacctaga tatggattta tgcattcatt tatgtaacaa acatttattg 12780
agaacctagt gtacttcagg tacttctcca ggcacttgga atgcagcaat gaacaaaaaa 12840
gacaaataaa taatcctgcc ttcagccaca tatcctggtg aaagaagaaa gacaataaac 12900
aaactaataa aataataaaa tatgttagga ggtgttatga agaaaagcaa aacaggaaat 12960
gaggaaagga aatgctaagt gagtggtagt taggattctt agtaggaatg tcactggagg 13020
tcaagttaac ttgaaatcat tcaccattga tgtttacttt tgattcagcc agatgagact 13080
ccactcaaat tgcactatca ttcaacatca gtttctctat ctaattcacg aggactcaat 13140
ctgtgttttt caagcctggc taaatcaaga taatgccaac agagtggggt agtgccttag 13200
agtacttgaa aggtattatt tcacctgatc cccaaacctg tgaggaaggt agactagata 13260
ttgttttcat ttcgacaact ggtgtcactg aaccacaggg gtttaagtta ataactcaaa 13320
cttagtaagt gctaatactc tattcagtgg taggatggta gtggtgcttg aggatgtatt 13380
tcgtctatag atgtgttttg ttagcctgta gaatcttttg caaactttga attaatcacc 13440
aacattcaaa aactaggata tggcatgcca gcattcaggt ttctagtgtg tgtgtgtgtg 13500
tgtgtgtgtg tgtgtgtctg tgaagcttgg gaaacactgg gctacccttc tcctgtggca 13560
acaactgact gtcgctacat gatgcagctc agggctgggt gcgctctctg aagccccacc 13620
acagcctgta gctctgatgt tgcactgctg ttctctgtta tgcctctgca tggcccctat 13680
tggagtttgc ggcttccggt ctttcatatg cctcagttac ataagccttt tagccagaag 13740
aatttttatc attttggcat tatttttctt cagtgatcct atcatagccc ttagtagtta 13800
cacattattt tccaagtgtt aaaaaactgt ttaatgattc gttccacaat tttgtttaga 13860
aattaacatt aaggattcct ggttggctcg taatccctaa aatttccttt catcctatag 13920
aagattggtc aaatttttgc ttccctccgg actcttagaa tctgtcctga tttctatcat 13980
ttctcaaata ctatctgtgg ttctgaggtt gtatatggaa cttttttttt ctggtgccct 14040
aaaattagtc cactgagttt cattatcttg ggtttgaagt atttcttcta ttgtttatat 14100
tttggagact tttttttctc gaattctatt tctctccctc tctttctctc tctgactctc 14160
cctttgcagt caatgtggta tacactacca ttccacatct tgagagagag ctgtagtagt 14220
ggtctgaggt ggcgattgta ttatccagta gtcaggtccc acggcaaagc atgttggaga 14280
aatgatcagg ctccagcaaa gggcatcagg aaacaaatca agaatgagaa ggggtgagaa 14340
gaataggcag atctacactt ccaagctcaa gtggtctccc tgctgatgct ggttgctgct 14400
ccacatgtag caactgtctg gtaagaggta ttcctggagc caagcttgtc cagcagaatg 14460
tggctggcag attctcaact tggcctataa ttgctttcag acccggactt ctttttagtt 14520
cctgttgttt cagagctcca actcatgcag catgagaaga atctgagcct cttctcttta 14580
tcagagacaa ggttggccag gtgcggtggc tcttgcctgc aatcccagca ctttgggagg 14640
ccaaggcaga tggaccactt gagcccagga gtttgagacc agcctggcca acatggcaaa 14700
acttcatctc tggtggtagc cacctgtaat cccagctact tgggagactg aagcagaaga 14760
ctcacttgaa cccgggaggt gaaagttgca gtgagccgag attgcaccac tgcactccag 14820
cctgggtcac agagtgagac tctgttacaa aataaaaata aaaataagac tcaaggttag 14880
cagacctcaa ggttcaatag aacacagatg tggacagcca ggcctgcagc aacctccaaa 14940
atgataacct ctttaactgg tgggttcggg agttttttct tcggtgacta ccagactggc 15000
ctctttggtc tgtttcctgt agtgggatgc acataaaccc cctccattcc caggaccagc 15060
ctagctcctg cggggagagt attagtggca gccttcctac cttccccgtg ggcaggtctt 15120
tgggaagtaa aaaaatcaca ggaataaagt tttgaggctt catcctgcct aacccaaatt 15180
agcatattag ctggtattta tcagttccag ctcagctttc cctcaggcca gctacctcct 15240
cctgtccctg ggttccttga gtgtgtgtct ccatttaccg tgtcatctct gggtttatgc 15300
cttggtcaag tttttaaagc catgcaagcc caccgccaag accttctcag catctgtctc 15360
ttctgtttct cattcttgag gtcctcagct ggcactgccc tcttggatgt ttgtccatgg 15420
cctcctgcct ctgcagtgaa agccctccac cttcctgttc tattctctcc tctctgactt 15480
ggctggaagt cttccagctc tatgaattta tacactgagt cttgtcttgt gtcctctttt 15540
cctagcaaac aatatggcat ctaaaaccca gttctactct gataattttt tctttacaag 15600
atgctacagt atgatacacc atgcccacct ggagagagga taaaggtgat ggtggtagga 15660
cagaatttcc atccgcaatc tccgttttga gcaaagaagc atggaggatg gaagtcattg 15720
ctgggacccc ggagtagagt ggtggtgggg gaacaggggg aacatcagac tgccgaggta 15780
tgagtttggg ttctcatctt cttcccagga ggcttttgaa accccaggat gatgcctcct 15840
agaggccttg ctgtcaaatt caataggcaa taacatgaag gatttactca gccaggctca 15900
tgagaccagc tctgaggaag ctgtgctttt cttgtactga tcggtgatgt gcatcaccct 15960
aagggatagt aaacagatga aacccagaaa gtccagtcaa aagagcaccc tctgggaatg 16020
aagatctagt gaagactggg gagacagatg aggaaagagt cctgaacagg agccactcat 16080
tccagctttg tctccatagc ctgcccgccc acgatggatg aagtgcgtgg aggagacagg 16140
cacgttcttc gagcccacgc tggcggcttt gtttgttcgt gaggcctttg gcccgagcac 16200
ccgaagtgct gtatgtgaga gctcttccca gcccacatcc ctccacccct tcctacccaa 16260
agcagccttc cctcttctat taactttgac tttctcagtg gtgtgtgtga ttggggaatt 16320
gggcagtcag agaagggcca ctgagagagg gaacccaaag gcctgctcca tccctggtgt 16380
ggaaacagtt cagcttcagg ccacaaattc tccatgacat gctctcactt ggacaagtca 16440
cccaactttc ctggtcttgt gtttcttcaa ccatcaaatg agaaaatcga gccaggctcg 16500
gtggctcaca cctgtaatcc cagcactttg ggaggctgag gtgggcggat cacctgaggt 16560
caggagttca agaccagcct gaccaacatg gagaaacccc atctctacta aaaatacaaa 16620
attagctggg cgtggtggtg catgcctgta atcccagcta ctcgggaggc cgaggcaggc 16680
gaatcgcttg aacctgggcg gcagaggttg cagtgagccg agatcacgcc attgtactct 16740
agcctgggtg acaagagtga aactccatct ccaaaaaaaa aaaaggaaaa ttgaacacta 16800
tcatctctaa gtctcctccc tgttgtagct aagatttttt taacaacaca tgacgtgaca 16860
tcagaacaga tgacataatc ttgaagaggg caaataaatc aaataaatca ccactgaata 16920
ctttctgagt acctaccaca tgcctgggac tccttcaaga actttgcatg aactacgtca 16980
tttagttcct attatgatcc tgattttata caagagggaa ctgaagcaaa gagaggttaa 17040
gtgacttgcc caaagtcaca cagttaccaa aaagcagaga cagggtttga actcaggcat 17100
tctgatgcca gagcccaggc tctcgatatt gcctttcatt ttcctccagg aaaggattta 17160
catgagatgg caggtggctg gggaagcagt gagtacacac tcacgttgtg aaggcaggga 17220
gacttgtggg ggacttgctg ggaagctgaa gagctcagga ggatgaggag agggagtgga 17280
cggtttaaaa aagacagtgt gagaacaaga gccctgagcc agaggagaaa atgacagccc 17340
tctcctccct ctgatttctg agaggtgttc ctgcccccag gagtgaggac actgtctttc 17400
tcctgtgtca ggctatttcc ccatggaaag gaactatatc tccctgatgg ccctcacgga 17460
tggccaggcc ccaccttccc tttgtgggct tggcactgcc ttcctttctc cacagatcct 17520
ttagttgctt tagttgagct gctcctctag cagcagctcc agcccaggca gctccttggg 17580
gccaagccct tttccaaggg tcagaagctg tgggcagggc caggctgagg cctctcctga 17640
tcctgtcccc ctgtccctgg acctcactcc cacaggccat gaaattattc actgcgatcc 17700
gggatgccct catcactcgc ctcagaaacc ttccctggat gaatgaggag acccagaaca 17760
tggcccagga caaggtcagg ccaggcgtcc tggctggtgt gggagcctgt gcagggaatg 17820
gagtattgga acaagcgaga tggggattgg aagcaaatgc caaaggcccc cccaggcaca 17880
tgctaagtag ggaagccact gggctgtata ctcacactgg caacaatgtg agaggctggg 17940
acagggcaac gagtgggaga aatttcctct ggtagactcg gagagtattc ctagcctctt 18000
ctgtgtctct ctccaggttg ctcaactgca ggtggagatg ggggcttcag aatgggccct 18060
gaagccagag ctggcccgac aagaatacaa cgatgtgggt ccctgtgttt tccagctcct 18120
tttcagtcct tgacttctcg tcacttctct gaccctccta agtctttgtt ggacaatcag 18180
ttttccctgg gtgacttagc tctgtcctta ctctggtgct ggctggggtt gatggggaaa 18240
tatccacact gtacgtcttg ctggcagaag aacagaatct tttcaggtcc caacgcatgt 18300
gccaacacac atgcatgcat cctgtgactt gtctgggcgt gttcatctgt gtgctgatat 18360
gtgtaaagcc tgggtgtgct gtgtagtgat gccattgggc tgctctctcc taatccctgg 18420
atgcctgcct gtcagggctt gcctgtttgg ggtcaaatgg tcccattggt gtttgtcagc 18480
gtgcatctat agaagtctct gtgtgcccaa gtcacctcct gcctcttccc cagatacagc 18540
ttggatcgag cttcctgcag tctgtcctga gctgtgtccg gtccctccga gctagaattg 18600
tccagagctt cttgcagcct cacccccaac acaggtatga cagcagggga gacacaggca 18660
ctccatccca gagagaccca tccatgattc acaggaaagg aagccagggc tcagggcagg 18720
cagcatgaac agtaatggta gttgggaggg actgtgtagg tctcagggtg gcagggcaat 18780
acgtggtggg ggctggagtt cacatgtcct cttcccacag gtggaaggtg tccccttggg 18840
acgtcaatgc ttactattcg gtatctgacc atgtggtagt ctttccagct ggactcctcc 18900
aacccccatt cttccaccct ggctatccca ggtatgggtc actctgtaag ggtaggtagg 18960
gagtttccca agaggggccg acaggtgtta tgatggatgg gacttacggt tggagaattg 19020
gggtcacaaa tgctgagaga ttctgggggt caaataagcc cttgtctccc tagagccgtg 19080
aactttggcg ctgctggcag catcatggcc cacgagctgt tgcacatctt ctaccagctc 19140
tgtgggtaac aggggccact gggaggtggg ataataggga acctaaggga agaccacaag 19200
ggaggcctgg aggggaaagg gaggttattt gagggtttga ggtggggcag tcctgggaac 19260
tttgccatgc tcctgggagc tgattcagtc tgtggtacca cccacatcct cacctaggca 19320
gcaccaaccc tatgttctct tgctgtatgt tctcttgtcc cattttcaac agtactgcct 19380
gggggctgcc tcgcctgtga caaccatgcc ctccaggaag ctcacctgtg cctgaagcgc 19440
cattatgctg cctttccatt acctagcaga acctccttca atgactccct cacattctta 19500
gagaatgctg cagacgttgg ggggctagcc atcgcgctgc aggtatgcaa gtgtcaaggg 19560
ccacagttta tgtgtactgg cagactagaa aacatgtcct caagttttcc ttccaccatt 19620
cctgacacaa gtacagttgc atggctttct gcccttcgca tccccactga atagacggca 19680
acttggggat ccccctccta ccccagagat cctccatttt aggacatcta taggtcttct 19740
gggaagtact ctttcttctg gctcagatca actagtcagt gcagaaccag tgagcaaggg 19800
ccatgggttt tgggtactgt gtggagggac tttcaaatgg ccacaggtct agagcctgat 19860
ggcccttctc tacccacccc tacccaggca tacagcaaga ggctgttacg gcaccatggg 19920
gagactgtcc tgcccagcct ggacctcagc ccccagcaga tcttctttcg aagctatgcc 19980
caggtaggca gcggccacct cccgccacag cttgctttat gtcagttgaa cgccttatta 20040
ctgaagctca tggaagtccc ctcttcagac actccgtcaa ataccccaaa ccctcttctg 20100
cagatgtcct cactgttatc ttttctcttc cctccctacc ccttggaatc acccctcaga 20160
tgactacagg ttcttctacc taattcagca cccccacaac tcaaaaggta gaaaaaactc 20220
tattcccaag ttcctccagg agaggaggag accaactttt ttttcctctc atacccccaa 20280
aatacagatg ccttaaaaat gagcctgtgg ttgggcacag tggctcacac ctgtaatcct 20340
ggcactctag gaggccgagg tgggcggatc acttgagatc aggagtttaa gaccagcctg 20400
gccaatatgg tgaaaccccg tctctactaa aaatacaaaa cttagctggg cttggtggcg 20460
ggcgcctgta atcccagcta cttgagaggc tgaggcacga gaatcgcttg aacctgggag 20520
gcggaggttg cagtgagcca agatcatgcc actgcactcc aggctgggtg gtagagcaag 20580
actcagtctc acaaaaaaaa aaaaaaagcc tgcgacaggc tgactgtgtg ccacattcct 20640
cttcagacac ctgaccttag gtgtggcgcc cacttgacat cacctcctta agcaccctgt 20700
actccctcaa cagactcagg tgccaggtct tcaacacgct tagattagac ttcaccccag 20760
agctcctgcg ctagaccctg cctctctgtc attgataaat ggtatcatta cacagcccag 20820
gccctcctcc tggactccta ttgccagatt aaatgaacta tacatttcaa atgctccatg 20880
tggcccttgg ggcacttgat cccctggttc ccctctttgt ctgctgtccc tgatcacccc 20940
ttgtcaccgg gtcagctttg tcctgtggac cctccccctt caatgacctc tcttcctgct 21000
caggtgatgt gtaggaagcc cagcccccag gactctcacg acactcacag ccctccacac 21060
ctccgagtcc acgggcccct cagcagcacc ccagcctttg ccaggtattt ccgctgtgca 21120
cgtggtgctc tcttgaaccc ctccagccgc tgccagctct ggtaacttgg ttaccaaaga 21180
tgccacagca cagaaatatc gaccaacacc tccctggtca catccatgga atcagagcaa 21240
gatttccttt ctgcttctgt tccaaaaata aaagctggca cttggcttcc gcttgtctct 21300
taa 21303
<210> 41
<211> 21923
<212> DNA
<213> 智人
<400> 41
acctgtcatt cgttcgtcct cagtgcaggg caacaggtaa gagctgcttt cagcctggca 60
ccctatctct ggtctgccag ctggtctctc agggctgtac acactgactc tctggtctga 120
gtagatctga ctttttcctt tgtttgtttc ttagaatctg tctctttttc attttctttt 180
tatctcccat gtctctttct gtctttcctc attttcagct tttttctctc tttttccctt 240
cgttactttc ttttgttagt tttcaagatc attcatttca tttcatcatt ctctgacact 300
cttgctttct cttatttttc cctctgaatt ctaactatct ttttctctaa atttctttct 360
ctcccccttt ttgtctcttt cctcggcttt gtatctctcc gtctctgtgt ttctgtctct 420
ctcttcctct ctatcaagaa cgatggctta atatttcttc ctgcaattcc ccattcctct 480
ctccctttga ctccctctac ctgctgggct gacagcagag ctcagtgggt cagagcccat 540
ggggagccta ggggtggggg aagagctagg gagggaaact aagaggatgt gggggtgatg 600
ggaatgatga attgggtaag gagagatttg gggaattgag agatgaataa ttagcagaaa 660
taagtgaaga aagtggaaga ggaatgtagt gtcactatac agaaagtaaa cagatttcta 720
ttctcatcct aattcactgt gagaccctag gcaagtcatt cactctctga aaaaaaggct 780
tggcctgtaa tttccaccac cctttctagt tttgattttg tgatcttcta aattttcctg 840
tttctaagaa tttctgattc tctgattaca gttatctaaa gttctgtatg attctttcat 900
ggtgggaaag gggtactagg aagagaagta aggcctgatg tttccaactc ctgaagagaa 960
attaccactt cccttccaga cctaattgac ttttgcaaag caggccacaa aaggggtggg 1020
ggggtggggg acaaggaatg ctgcaatgag tgttttctgg ctgtctgctg gggtagagtt 1080
gcagttggcc cttttcacct ctgggagtac agattgggtg ctgacacaag agaggatttt 1140
aaagtcgtag ggaaaaactt tcagtaatga tctgttactt ggtctcaaat ttcaccatca 1200
tctctttggt taaaagtatt gttttaagaa gatgcctggc aagcattatc acacattagg 1260
tacataagtt attgaatggt agagtaaatg aatattcaac agtacctgaa attccactgt 1320
agttacagat ctgttccttt ggtaaggcat tggtgacaaa tggcatatga cctggaaaga 1380
ggcctatgtt agtgcagcag aggagataaa tgtctagagt caggccctca gtcaagaaaa 1440
aaaggtagta atatttgaat cacagatcca taatggttaa gttaggaatc tctggaaaca 1500
gattgcctag gttcaaatcc tgcttctcct atgtactagc tttctgatct agacaggtta 1560
cttaatcttt ttgggattca gtttccctat catcacaggg ttgacatgag aacacggcct 1620
ggcacagagg gctctgtaag tgtttgacta tcagaactag gcggaatcta tgaaattatc 1680
tagtccaatg tcagtggaga aacggaagcc cagagagggg aattacagag cccaagttca 1740
cacaataaat tgtaacagga ttgggacaag aatcaattct ctagcttccc aaacccagcc 1800
tggtatattc atgtgacttc ccttggctgt acgttcattt tttctacatg ggaaatggag 1860
aaaataaaaa taataaagtc tatcaattaa atataatatt taacactttt ttactgttta 1920
ctctgggata ggtactctgc taaatgcttt atatggatta tcttactgaa tcttcacaac 1980
attcctgtga tgcagattgt ccttgttatt accaacattt tccagatata agatgtacag 2040
cagggaagtg acttttctaa ggtcccaaag ctagtgagtg gtggagccag gattcaaacc 2100
caagtagttt ggctctagag cctatactct ttatacccta aattgactaa aatgcttcct 2160
tgattcaatt ttactcactc tagtctcttg gtaggtaatg agatggaata gaaacagagc 2220
ccatggtaac tagactacaa ggtcatgggt ataatgatgg ccaggcagag tgaggcagag 2280
caaatttcag gaaaggagta acagaacaag agaaatgaga acaggagctt gaaagaactt 2340
gagaattcaa caaattccaa gaagtggtct atattttccc aggaccctga gcatatcatg 2400
gccaaaagcc ccctagtaat gatgtgtgtt aatttctcct gtttttatat acaggaggta 2460
ggtcttctcc accatcccaa ggcaggactg gactttgcct ccaatattgg gggctttcct 2520
tcccactaca taccccaatg ttgttggcat tattgttgcc agtattgatg ttaggggagt 2580
ttacaggagc ctggagcctt gtcatctgcc ttgcctgcac ttctgggcca tccatttctt 2640
accaccaata gccagggcca gctctagcca gatgctcaga cgtgattcca ggaaggggct 2700
cctcttctct cccacgccct ggtctcagct tggggagtgg tcagacccca atggcgataa 2760
actctggcaa ctttatctgt ggtctgcagg ctcagcccca agtgctttag ctttcacaag 2820
caggcagggg aagggaaaca catatctcca gatatgaggt aggcactgga tccaattcct 2880
tacctacctt gtgaagtggc cataattacc tcacgtttga cagctgatga aggccaagat 2940
ccagagaggg gaagtgattt gaacaagaac atccaacaat gaaattggag agctggaatt 3000
ttaataagaa aagctaacat ttattgaaga tttactatgt gccaaaaact atactaaagg 3060
cttaacttgg attgtttcat ttagtccctc caacaaccct tctgtctttt ccaatttcag 3120
ggcccacatg ccttggcccc acataccaac ccaggctgct gtgacagccc atgagagggg 3180
gagaggttgc tctgggatgg aacaagaaaa agaggttgtt ttgtgaggta cggggagggt 3240
gcttgttcta tgagatcagg aagggaggga gatgaaggag gttgccatat gagggcaggg 3300
ccatgagctg acctgtccct caaaacataa ggctgagggt gctagtagat tctactcagt 3360
aactttcttc acagtgtcag tgctttagtc ttctcacatt ctcccatgtc tctcccattg 3420
tactgtccct tatcttgtct cactttttga ctctgtcttt ccaatttgcc ctttttcttt 3480
acatctgtct ctccttcttg ctctctctag ctgtctttct cttggtgtct ctcagctctc 3540
acccctctta accctcatcc ccctgcttta gtcacctctc tgtctctatc ctttgatctt 3600
gtcattttct ctactctctt ctctctgtcc ctcagtctct ctctcatctc cctcaattag 3660
ggccatgatt ctcttcccta aacttactta gccttttgca atttctggca gcattttttt 3720
atgtttgtgt ctgactgact ctctacccct gctggatcct ctccactcct gttctcactt 3780
ctatgaatct ttgtataatc ctctagactc attgatccct cctcatgtcc ctttcgtgcc 3840
ccttggtcta tctgtctctg cctttatccc tgtgtgcact atcaccaccc cctttttctt 3900
ttttcatttt ctctttctct cgactcaatc tctgttttca tctctaccct gctccctttc 3960
cctctacctt tgatctcttt ttccccctca atttctgttc ttttaactct accaccacca 4020
ccacatcttt gttctctctc tactttcctc cttttatctt tcctaaattt tcttttcttc 4080
tggcttttct cctagtccct tctccttcct caatttcaga ctctgttcat tcatcaattt 4140
accccaaaat tcaacaaata tttattgagt gcctgtgtgt catttgcttt ctctttttct 4200
gatctctttg ccccctttct cttctctgtc ttggcctctg cctgtttcac taatccatag 4260
actatgtctt tgtccctgtt ttccagcccc actgggactt gctttcacct cttcctatat 4320
ctgtgcttat ccaagagaca ggagcaaatt caaagacagc ataatatcag gctggtggta 4380
cacattctgt aggacctagg gcctaccctt ccttccggat cccttgattt ccttaaactg 4440
atacatgtga cctcaagctc cttctcccct ctggctgatc ctgcttagga aacaccctgg 4500
gccaagcctc aggagctcta ctcaatgaca tatgtttgca ttagcaggct gaatcttcac 4560
ttggctaaga ccaacattct tagaaagatt cttggcctta agtattgatc aaagggttag 4620
tgggttggca gttctcatcc tgccacacaa aaacacattt cagtgatcct catcatcaca 4680
gaggtagtca gtgccagaat gtgagtcaga atccaggctt tctgacctcc agttagaact 4740
gtttccttca cccctttgcc cagtagtcag tttcctattt cttcctccct catgttttat 4800
tggtacatgt taacattggg aaagaagttc tttccctgga agggcaataa gagcatctcg 4860
gaggcagcaa gttttgggtg ggaagctgaa gacgaggatc aaaggcttgg ctttttgcca 4920
ggccctcatg atggaacctc atctcttcca tgtcttctgc aggactttag gttcaagatg 4980
gtgactgcag ccatgctgct acagtgctgc ccagtgcttg cccggggccc cacaagcctc 5040
ctaggcaagg tggttaagac tcaccagttc ctgtttggta ttggacgctg tcccatcctg 5100
gctacccaag gaccaaactg ttctcaaatc caccttaagg caacaaaggc tggaggaggt 5160
aagaagaggc tgctagcaaa aggggagaat gttagggtcc tggggtaaaa gttccaagtt 5220
atactggcca tctttgccta ataattagga cggttcatgt gaaaagtgtc aagatagcat 5280
gaactggccc caaaatatac ccagaatctg tcttctgcca ggttctctag aaagagtctc 5340
attctcggcc aggcacagtg gctcacgcct gtaatcccag cactttggga ggccgaggcg 5400
agtggatcac gaggtcagga gttcaagacc accctggcca agatggtgaa atcccatatc 5460
tactaaaaat aaaaaaatta gccaggagtg gtggtgggcg cctgtaatcc cagctgcttg 5520
ggaggctgag gcagagaatt gcttgaaccc aggaggcgga ggttgcagtg agccaagatc 5580
atgccactgc actccagcct gggcaacaga gcgagaatct gtcaaagaaa agaaaagaaa 5640
agaaaagaaa cagtctcact gtcatgtccc tcacacacta tactccagac atgctgaaac 5700
tacttaaaat tgcctaaatc aactattctg tcaagagttt gtgcctttgc tcctgtcaga 5760
ttaccctctc ctagaccctg tactggagaa tctcatactt ctcatttgac actaagcttg 5820
gccatcatct cctctgcaaa gcctgcttag acctccaaac tgtctaattc caattctggc 5880
tcatttcccc tccctcttct ggacttctgt agcccatgta cttcctctat cccagcactg 5940
ttcacaatgt gtcttcagtg tatgccattc ccaccagttt agtagctccc ctagcacagg 6000
gaccagactc atctatctct gtgtctctac aatagcctga gatagggctt taggggtaca 6060
ttagatctca gcaattattg ttgagctgaa cttatgacta gaaatgcacc ccaaattact 6120
ctcttacctt tgcatagatt ctccatcttg ggcgaagggc cactgtccct tcatgctgtc 6180
ggaactccag gatgggaaga gcaagattgt gcagaaggca gccccagaag tccaggaaga 6240
tgtgaaggct ttcaagacag gttggagtca agttccacct tatgcaacct ttactcctaa 6300
tgcttgaaca cactacgtca cagtcctgag ctaggctaat acaaaagcag ccagtacaca 6360
tcccatgatg agaagtccag tctttccagg ggagccatgg taggcaacag tttaggctgt 6420
atgctgaagc acaccatacc tgacaaacac atatgtacgg gctcctgaaa cttttagtca 6480
ttattctaag atgagccctc tagaattttg actcctcttt ttcaggtggc taaactgatc 6540
ccaacaggct ggggtcccac atttcagcaa gaccactcta tgagaatatg gatttgcatg 6600
aaagagaaag agctgggagt aggtacctcc tttaaccagg gtgcagatcc ccaggtcaac 6660
ttaattagtg cagaccaccc aagataatca cccttgagat atggccacac tgttgacatc 6720
tttcataggc ccctttggga tatcattaag gacaaaaact tcaaaattga aatttaatga 6780
tgtttagaaa agaagagtaa ggtacattat cctgcatcta ctttctaaat gcaggaccca 6840
gggtggctgc tccagttacc tgagccaagg gaaaatccta gtggagagaa gtatgattca 6900
ccttatagaa ggtttcctaa caatgtaata gtctccattc ggggggataa atagaagctc 6960
accttggaga agatttcttc tcgctgtaga agctgccctt accttataaa cttgaatttt 7020
catgtgttgc attgagctta aagaggacaa cacatgcttt ctttttcccc cattctcttc 7080
acggccaatg aatctcacat tccgtctcag atctgcctag ctccctggtc tcagtcagcc 7140
taaggaagcc attttccggt ccccaggagc aggagcagat ctctgggaag gtcacacacc 7200
tgattcagaa caatatgcct ggtgagtttg ctgaggtgga aaaaaagggg accggaatag 7260
ggaaggcatt ctgaaagggc ctctgtcaca gtaggggaaa cagtacagaa gggccttgga 7320
accaaaggaa atttgagttt aaaatttaat gctggcactt gctggatcta ggtgttttgg 7380
caagtaagac actttccttc agtggcattt aatacctacc tcaataggtt accatgagaa 7440
gaaagtgaaa ttacatttat ggaagtgttt ctaatgaggc ttcattaaat attaggctta 7500
tttccattat ttcttctcta tgcttccctc aaaaactttc acccttcata cagcaccttt 7560
tccccattct tatatgtgtt tatattcctt tccataatga catttacatt attttctaat 7620
gtaaaaggaa tatgattcat ggtaaaatat ttttcaacat atacaggaaa gtataaggag 7680
ggaaatttaa gtcatgcaga gttccaccat taagtttttg ttatattttc tcccagatat 7740
ttttctatgg ctacacacac acacacacac acacacacac acacaccctc tgctctcttc 7800
accacaccca tgcttttgtt agaagtgtga tcttatttta cctggagttc gttatgctgt 7860
tttgttcact taaaaatatg tcatgggtat agtatggatt caatatcatt cagttaatca 7920
agcatctata atttaagttg tttccaattt tttgtattct ctcagtttag attgtaggtt 7980
ggttttacat acatacaaat gtactcaaag aaaatgtata gtattacttt tttcaatttt 8040
tatttttacc taataatatc ttgctatata ttttactctg tgcccttttt tcactcaaca 8100
atatactgtg gaaatgcttc cactttaaca catatgtatc taccttattt ttcaatgctt 8160
caaaatattt tgtagtatag atataataga gattatttgg ctactcctct atttggttgc 8220
ttccaatttt ttctattaca aacagtggtg caacaaacat ccttgaatgt atctccttgt 8280
gtacacaggc aagtgtttct ccaggataaa cactcagtgg tggaaattct tgggatgtaa 8340
ggatgtgtac atttttgata ttaatacatt ttgtcaatta gccctccaac atggctgtac 8400
cagttatcaa ggagggtatc catagtctca tacccttacc agcccttgat attatcaaac 8460
tttaaatctt tatcaattga taggtgaaat tttgttttcc cagttttatt tttcctgatt 8520
aagaatcttt ttctacattt attgaattgt ctgttcatat tctatgccca tttttctact 8580
gagttgaaat ttttcatgtt aatttttcag agattatata ataaattctg agtatcaatc 8640
atttgtctgt taagtatgct gcaaatattt ctctagatat gtcagtatgt gcatttaaaa 8700
aacttttgat atgtatttcc aaacatctct gcagcaagga tgttaccagt ttgcacctcc 8760
agcagccata taaattgctg tctgcaacat gatttctgtc tcacgtaaag agttctagag 8820
tttaacaagc tctttggcaa acgttatttc aatttatcct agaaataaag ttaccccatt 8880
ttgtagtggt aatggttaaa gaagtgggct ctgagttact tacttgatga acacttactt 8940
gctgcatgac cctggtcaag ttgtctaaca cttaatgccc cagttccctc atctgtaaaa 9000
tggagatact aatagaactg tccatggagc attgttgtga ggaataaatt aaatatttat 9060
aaagttccta ggaaagaact tacatgtact aggcattcat taaatgttag ctataatgat 9120
gtaattgaat attagctatc tttattagta ttattatgac tactaatact atagcagtaa 9180
taatactact attaccatgt gccatttatt agtttgaata tattacatgt tgttggttgt 9240
cagatgctca caactctcca aggaaagtat tattagcctc attctacaaa taaagaaatt 9300
taaagtaaga aagaagattc atgacttgtt caaggccaca cagctaggaa gtggcaaaga 9360
gatcgctaga aacaagatct gttgatactc cttccagtga gactgaaagc agtgattcta 9420
gtaaggaggc tgccacacca acccgggaag agagatgagg ccataagaaa gtctaaatga 9480
atgtgtgaat gaactactga gtgaatgagt gaatgagtaa gcaaaaggat ggctgaatga 9540
agtagtagag agttaatgtg gtccataagt caatgactga gcaaataaat gaatatgtgg 9600
aaaaagagtt ggagaactca aaatcagcaa catgggtaaa atacagacta gccagggaga 9660
gacttaaaac gaattctttt catcctcata tctgctcctg caggaaacta tgtcttcagt 9720
tatgaccagt ttttcaggga caagatcatg gagaagaaac aggatcacac ctaccgtgtg 9780
ttcaagactg tgaaccgctg ggctgatgca tatccctttg cccaacattt ctctgaggca 9840
tctgtggcct caaaggatgt gtccgtctgg tgtagtaatg attacctggg catgagccga 9900
caccctcagg tcttgcaagc cacacagtga gtagtaggct ttcagccatc agcagtggcc 9960
agaggagatg aaaaaccaca catggaaaaa aaaaaaaggc agagctggca gtggaaactt 10020
gggttctatc accacttctt ttgtccaagg tcctccatca tatctattcc ttggatatga 10080
aataagtcaa cacaccatgt ttcccaaact cttcggtgtc caatgctatg gaggggaagg 10140
atgggagacc aagcaaggcc cactctgcct gagtttttaa tctagctgca gaattagtat 10200
tgccagagat ggagtgtgac ttcctctagg tcttccaaac tactcaagct caacctagct 10260
tctccctctc tccctgagta cctccagtcc tagaaggaag gcacatgtct ccctatcctc 10320
cccatccttc cctctacttt gtctcatagg acacagttta tataggatca ctaactcaac 10380
attgactccc atcaaggaag agaaacctac ccagttcctc gatgcctgac aagagtttct 10440
ttttctcctt ttctcctgtt ttctcctggc cagggagacc ctgcagcgtc atggtgctgg 10500
agctggtggc acccgcaaca tctcaggcac cagtaagttt catgtggagc ttgagcagga 10560
gctggctgag ctgcaccaga aggactcagc cctgctcttc tcctcctgct ttgttgccaa 10620
tgactctact ctcttcacct tggccaagat cctgccaggt aagcctgagg cctgagcttt 10680
gttcagggct ggtatcctgc aatacagcat ccagtttcac tggttccatc actccttccc 10740
tgtatttgga gttccctcac tcccattgtt cttccttctt atccaccttg catatcctca 10800
acactggata attatatccc tctgctttct ctccttctgc acgtagagag gaccattacc 10860
ggggaacatt accccacctc acagaaagga aacactataa attcatcacc tcccaactca 10920
actgagctct taacacacat acatagttat tttatgtctc cacaggagct ttttcaaact 10980
tcttctcctc ttctaaaacc tctgactacc ttctcctcca cacttagcaa ataacctcac 11040
atcttacttc acaataaaaa cagaagcccc agacagagaa tccttattta ttgccaccaa 11100
acctacgaac ttatctaatt gtttatctag ccttgcctca ttctttcctt ttacaatgga 11160
aggcatatct ctccttctgc ctaaaaccaa tcccttcact tgtacactgg ttcccatatt 11220
cccagtctcc tactctctag tctgtaatgt cctcacctca tacgccttgt tgtccttccg 11280
ccaaggccca atccagaatg aatacaaccc tccatcttca ctatatcaat tccgggctca 11340
tacagttgct cagacaggag tcactaaaaa ttcatactct taacctctac tgggttctcc 11400
atggtctctg acaatcccat ttccctggtc agttctcgaa gtttatgggg cagttttgcc 11460
aaaccaccat tatcctcagc cttcccacac cccctcctcc ccatctccct cagcagacaa 11520
cttcatgttc tactacattc aaaatagaag ataccagaca gcaatgtcct tgactcccag 11580
ccacaaagca cctacaaact cataagcatc ttcaaatgtc ctctcctcac tccttctctt 11640
ctgtcatagt ggaagaagta tcctttttct tgtgactaat ccttccactg ttgctctgtg 11700
ccccattccc ctctaccacc ttaggaatct tgacctattg gctctctcct cctctcctgt 11760
atcttcagcc tctccctctc tttaaacatg ttttcaagtc tcttgtatct tataaaaaaa 11820
cattgcctca acccctgatc actctctagc tactgccctc tttcctccct ataacaggca 11880
aactgcttga gagaagtctt cgctcttact atctacttcc tcacctcctg ctgattcttc 11940
agcacagcaa aaatattacc accacttctc agaaactttt tttgagtcca cccataagcc 12000
ccaactaaac tcaacatctt taagttgttt ttagtccatc ccctcctcaa ccattaaact 12060
tctttccatc tctactgcca gcatcctagc ctgatccaac atcatttttt aaagaaaatt 12120
ttacctttgc cctccgataa tctattcttt acaacagtca gaattttttt taatgcaaaa 12180
ctatctttgt caccccaccc tcagccctgg tcaaaaccct ttagtggacc cccattcccc 12240
caggaccaaa tccaaatttc ttatcacagc ttctaaagtt ctcaataatc tggcttctat 12300
gtatctcttc ggtctcacct ttttgcatcc ctcctctcac tatttcattc agtaatacat 12360
tcattcatat actcattcac ttacttataa atctgtcatc agtttattta tccattcatt 12420
taataaatgt ttacttagca tctactgtgt gcttactctt atactggaca ccagagacag 12480
agagataata agatgttttt gctcccatgc aactcccagt ctgcttgtct ttcaagccat 12540
tttctccaga aagccataac tcattttctc aggtggaagt tatcccttaa tcttataata 12600
aggccacagt tccttgatgg cagtgcagtt ggtggcaggg gttggggagg tccaggaatc 12660
aactccctct accaatttca catgcccacc tgccccacca ggattgccca gtaaaaagcc 12720
ctgcattctt caaatctttc tggaccttag ctttctcact tgtatagtaa agggatgaat 12780
cccatgatca ctaacagccc tgccagctct gacatgccat aagcttatga ttccaacagt 12840
aaaagcctga taaatatcca tccctgtaac cacaagcaga tgctacctgg aatggatgga 12900
atttcatcta gactaggaac aatctagcat cagtccgagt caacaaacat tccctggggt 12960
aatccctttt tcaagtcttg atcttatata ttggggagaa ggaaaatagg tcccgtcctc 13020
aaaaaactct gaagcttctt gggaaattaa atgttcttcc accccaaggc agtcagaggc 13080
tagaccaggg ttacaaatga ctggagggaa ggatgtaggg gtcagaattt gggaacagtg 13140
aagtccttcc aagggagaaa gaagtgtcac aaaagttccc agagaaggaa gaagcagagc 13200
aaggtcttca aagggaagaa agggttggcc cttttctttg ccaggtcaaa cctgaaggtt 13260
gaagtgggag tactgggaca gaagcttaag gattatacat ctgcttcctc agggtgcgag 13320
atttactcag acgcaggcaa ccatgcttcc atgatccaag gtatccgtaa cagtggagca 13380
gccaagtttg tcttcaggca caatgaccct gaccacctaa agaaacttct agagaagtct 13440
aaccctaaga tacccaaaat tgtggccttt gagactgtcc actccatgga tggtatgtat 13500
atgagtgagt gtatgtttac tagtgttggt ctcacaaaaa ccatgatgat catgatgatg 13560
atgatgacga taacattata acagctaata tttatagtgt ttattatgtg ccaagcaaaa 13620
ttattagtat tttacatgta ttaattcatt taattttctg aacaattcta tgtgataggt 13680
gttattatta ttttgatttt ttacatgagg aaactgagac ataagagtaa tttgtccaag 13740
gtcacacagc tagtaaatgc caaagaatgg aggcagctat tacattcatc ttataggtaa 13800
agaaactaaa gttcagagtt ggcatccaat tcatcttgag tggctcagca agttggtgct 13860
aaagtgagta tctgcaccct aacacatata actccaattc ctcgagtaac acttctcttg 13920
ttagaaatga tatgtaaatc aataatccca gtgtttggtt tttatgaagg aaatttcaaa 13980
aaccattgcc taggattttt ttcaaggtcc agtatgaagc attggggtca aaacaggttt 14040
tcaagtcaga gagacctggg ttcaaatccc acctttgaca gttactggct atgaccatgg 14100
gtaactcttt aactgtctaa gcctcaattt tcccaaaggt aaaatatctg gttgtaagaa 14160
ttagagatga tagaaaccat tctagttatt atgctttagt agaattaaat gatcttcaca 14220
ctcctacctc ctttctttgc tcaattgaaa caatgtccaa agctttctat tgctggccct 14280
gttgtgtaga aatcatgtgt tttaggcatc ctcttatgga tttatttaag ggaagaggtc 14340
ctcaactcat ttcagtttgt cccttttcca actgaaacaa aagagtccat agtattccct 14400
gatttaggta tcttaagtgg catgtaatga ctatacacac aggctctaaa accagactat 14460
ccatgttcaa atcctagcat gaccatttac tagcttgggc aagcttctta attgctctgt 14520
gtctcagttc tcagttgctt atttgaaaaa tgtaagtgat aataattaaa taggtatgca 14580
aattaaatga gttaatatat gtaagaaact tactattatg cccactccca catttctaac 14640
actagcaata aagtaaaact atcctatccc ttttgtatat ttctaccact gagactattc 14700
aaattcatta tttctctagt ggaaactatg ttggtaccat tctacctcgt tacatttgca 14760
aataaatagt tatttaccta tttttggggt gcaaactctg cccaaactgt tgatccttag 14820
gctgaatctc tcccattgaa atgatgctag gctgaacaca gcagaaacag gaaaatagac 14880
attgtcagaa tgaagtaaaa acagaaagac aaagagtcaa gccttgatcc caggctgggg 14940
aacacacaca catgcgcaca cacacgtaca cacacacaca cacacacaca cacacacaca 15000
cacacacaca cacacacaga gagacagaga gagagagaga gaaggcaggg atgagataca 15060
ggcaatcgat ccatacacag aggtttgtaa tagttctaaa tgaaggcgca catcctcctt 15120
cctctctaca acaccctttt ccaacccaaa gtaggcatgt atgggaaatt ccacattgga 15180
gatggagctg gggaagggtt atgatgtcct acctctatcc cttggctttg ctcaggtgcc 15240
atctgtcccc tcgaggagtt gtgtgatgtg tcccaccagt atggggccct gaccttcgtg 15300
gatgaggtcc atgctgtagg actgtatggg tcccggggcg ctgggattgg ggagcgtgat 15360
ggaattatgc ataagattga catcatctct ggaactcttg gtaagtgaat gctttgggcc 15420
ttcttatata ccctccagag aggaggccct tacaaaattc ttttctgcct cctccccaaa 15480
gctatagggg ttgtttggac agaattcaca gccccaggct gctgccatcc tggactccct 15540
ctctccactc gcatcccact gcagagttga tgagaaagtc tggtagagtt ttttgaaaag 15600
accttgaact aggccaaata gttagattca acttgagtat gtgaagagct gtgtttctaa 15660
acccctcccc caccctagcc ccaagcttca tcttagctcc actcctgacc ctatccagct 15720
aaaggtcccc acccagctcc tgcctatcta gtcattgcat atggcaagac ttgaaagtcc 15780
tatctcaaag cagcagaatt atcagctacg actgccttgt catggacaga tgagcagagg 15840
cctgggaaga cagcctggag ccccaacttc tggtgcaccc ccttgtgtta tctggcacat 15900
gatcctgttg ctctgggact gattatggga tctgtgtata tcttattcct ttctgtctcc 15960
aggcaaggcc tttggctgtg tgggcggcta cattgccagc acccgtgact tggtggacat 16020
ggtgcgctcc tatgctgcag gcttcatctt taccacttct ctgcccccca tggtgctctc 16080
tggagctcta gaatctgtgc ggctgctcaa gggagaggag ggccaagccc tgaggcgagc 16140
ccaccagcgc aatgtcaagc acatgcgcca gctactcatg gacaggggcc ttcctgtcat 16200
cccctgcccc agccacatca tccccatccg ggtgagagcc ccaccatgcc cattgccctc 16260
tccacctatt tattctggga gcctcacgct cccaacaaac ctacatctgt tgctgtcttc 16320
aattatttgc tttcctgcta accattccct ttattgccag ctttgtttcc ctttttgaaa 16380
aattatcagc cattctggat taaccagtct tttccttgca tcagccatta cctcatgctt 16440
attagattat cctaacccta acaatagcga gtgctcacag cctataattc agagtttttc 16500
aaactggatc aagacaatta atgggtcaca aaatcagctt agtgggttat cattagcatt 16560
aaaaaaagaa aagaaacaga aaatgttgga gtacatcaca tactaagggt atcatcaatt 16620
tgtgaaaaat ttgtatgcat tttgggtatt tgcatataca catgtatgtg tatgtgtgcg 16680
tttatggtca cggtgtaaaa cgtacttctt attgagaaat gagggcagaa aaataaaatc 16740
aaaagccata ggattagctg ctactttgga tcctcaatat gagcatttac tgcctttaaa 16800
aatgaactgc tacttctttc ttaaataaca cgtatttgtg tgagtcagta agccagggca 16860
gggaaaggac acttatttgt gacaattttg tggatgagaa atagtcactg ctctttagac 16920
taacctagta tttcctttaa acactcattt tatgaattaa tttagtgaca gcaccccaga 16980
attggcttgg cgggggttcc agaattggct tggtgggggg tatcttctca cccagaacca 17040
tcccaaacta agatattagc taagtaaaat cagtgtgctt gctctgcaaa cagcttccaa 17100
acagggctcc tggtaccacc tctgctccat ccttttcaaa ccaaattgct agctctgagc 17160
tcctccttga tagaaattct ggagctgcca ctaagcccct aatggaaaaa aaaaatctat 17220
cccaaaattc agtgatgttc cctcatctag ttccctccat ctgcttaatg gagctagtga 17280
tggtggagcc agagtggcag gtactgatta gcctttctcc tgagtccagg tgggcaatgc 17340
agcactcaac agcaagctct gtgatctcct gctctccaag catggcatct atgtgcaggc 17400
catcaactac ccaactgtcc cccggggtga agagctcctg cgcttggcac cctcccccca 17460
ccacagccct cagatgatgg aagattttgt gggtaagttc tcaacatggg tgcctacagg 17520
acctccctcc cctcagcccc aggatctgaa agagaagctg agaggacaga gaccactgag 17580
tttacaaaat atttctggaa catctaatgt gtgccagcac ctatactagg gtcacaaata 17640
aatgagaagc agcccctaca cttgtagggc tccagtttgg ttggggatac catagtgaac 17700
acaaacaatg acactaaggg atgatcaaag ctccacaagg cagtgcatga tagagttgtc 17760
ggagcagaga ggaggggcct gactcagcct gagggatgca agacccactt cctagtagag 17820
gtgacacctg agctgagtct tgcaaagtga gtggtattaa aagaaagagg gcatggaaga 17880
agtattccta ccagagggaa gagcatgaag ataggtgagg agaatgagaa gcagccaggg 17940
atatatcaag aacaataagc aggtggtatt ggaatgtagg gtcataggaa tggagtgggg 18000
caggggagta tcaatctatg agtctacaaa gacaacatga gatagagact ggattgagag 18060
gcttgtagag ctgagtagtt tgagatttac cctgaaaatg ccagtttagt caattcacct 18120
aatgtttgtt ggatttctgt tgggtagttt tgtttttgtt tgtttgtttt tgtttttgtt 18180
tttttgagac agagtctggc tctgtagccc aggctggagt gcagtggcac gatcttggct 18240
cactgctacc tctgcctccc gggtcctggc tcaagcaatt ctcctgcctc agcctcccaa 18300
gtagctggga ttacaggcac gtgccaccat gcctagctaa tttctgtatt tttagtagag 18360
atggggtttc accatgttgg ccaggctagt ctcgaactcc tgacctcgta atccacctgc 18420
ctaggcctcc caaagtgctg ggattacagg cgtgagccac catgcccggc ctgggtagtt 18480
tttaatgcag ggcctgacat tgaataggtg ctcattccag gcctgttgga tgaaagacat 18540
gtaggcagtt gatggtctag cagaggagcc agatatagat ggtactggtc cagtatgatg 18600
agctccagta ttctgggagc tagagggagt ggacacatta tggagagaga gggtgggaag 18660
gatgaaattg gagaggcttt gtgagtaagg aagtttttat gatgcatgtt gaagtacatg 18720
tgaatatgtt gtaagaatat tccagaataa gggaattcca cgagcaatga cctagagata 18780
ggaaagcagt gggtatgtat tgacaacata attctgtttg tctgaagcat gggcagtatg 18840
agaattcaag gaagacaagc taggtaggcg ccattcattc attcaaaaac attaaataat 18900
gctggctaac attaagtact taccatgtgc caagcactgt tctaaacact ttacacgtat 18960
taactcatct aatccccaca acaacctcaa gagttagaga tcctcttatc atttccattt 19020
tgtacatgtg gaaattgagg cacaaaaata tatagtcgct gatccaaggt cacacagctt 19080
ctaagttgca actgggaggt ctgtctctac ctccatggtc ataactgcta ggtctaccac 19140
ctctctgagc tgatgaccca gactcctggg ccttttgttc agtattctct tttgctctgg 19200
gcttcaattg tagagctctc agtattcttg gttctctgaa tgtccaccta ggctaggctt 19260
ttgtaagaat atatgaggca tccacgatgg ctccaccagt ccctaagttc catagccaat 19320
ccatcctgaa atcctgcaaa agttatctat aatctctctc aaacctattt gcttttctcc 19380
cctgccactt ctttaatcca tgtcaacatg atttttttcc taatttctct gcttctctct 19440
tgctcctctc aaatcctttc tcgatgatga ccactagagg gatttttcta aaattctgac 19500
tatattgctc ccttgcttaa accccttcat gtttccctct agactctaaa gcagtgacct 19560
ccaaggggta tgcaaaatga ttacagggtg aaggaacaga atatgtatta gaattttatg 19620
tttttttatc ttaaaaatag gaaatcaagc atcactgata ctgatcttta atatacagac 19680
tgacagttat acatgtatat aatatataaa caaatataga gattggaggt acatgctaaa 19740
acatttgtac tgatagggat gtatagtcca aaatttggaa acattgacat ataggacaga 19800
gttgaagctc ttcagcatag cattcaatgc cttccacatg gtgatctcta tgccctcacc 19860
tcctccccac atgcattttg ttttttcagc tacactgaag gacttgtcgt tccctcattt 19920
ttttctgctc tcttacctct gggactttgc tcatgctgct ctcttttgat tggaatgccc 19980
tccctcacac tttcctctgg cttactttcc ttcatcttgt agacttaact taggcattct 20040
ttcaacaaat atttattgag taccaactgt gtactagata ctgttctagg cactggggat 20100
gcagtagcaa acaaatcaga cacaaaattc ctaccctctg gagcttacat tctagtggaa 20160
ggggtagtaa aaaaaattac caaaaataag caaattaagt agcacattag ttctaagtgc 20220
tatgggaaaa aataaagcag gataaggaga atgggataag gggccagggg cgagttcaga 20280
gaagggttgt agtattagag tggcaagggt agaagacgct gaggtgaaac ttgagcaaaa 20340
atttgaagga ggtgaagtta gtgaggcaga tatctaaggg aatggcatcg caggcagagg 20400
gaacatccta aggcagggaa gacacaggag tattcctttt atatttgagg aacagtaaga 20460
agatgggtgt gggtggaatg gtataagcaa gtgggagaca gaaaaattga gtacatagag 20520
gcaatgtggg accagattgt atagggtatg gtaggccatt agaaggagtt tggcttttac 20580
tctgagagcc cttgaaagga tttgaacaca ggactgatat ttctgactcg ggttttaaca 20640
aaattgctcc aacttctatg tagagaatac actaaaaggg agcaagggtg gaagcaggga 20700
gacccaagag tgggctacag taatatccca ggtgagagat gatggtggct cagacttgat 20760
cataatgaag gcaataagaa gtggtcagat tttgaaggta gagccaaggg tctttgctga 20820
tagatgggat atagggtaag agagaaagag aaaaataaag gatagctctg aaatttttgg 20880
actgagcaac tggaattgcc atccactgag atgggaaaag ctaaaagtag aatagcttgg 20940
tggagggtag ggacatgagt agctcagttg tactcctaag ttagaaatgc atattagaca 21000
tctaggtgga gatggagaaa agccattgga tatacaagat tggaaaccag tagagtggcg 21060
tgagctggag attaaaattt ctgaaccatc agcatataga tggtctttaa agtcatgtga 21120
ctagacaaga tcaacaaggg catgaacaca gaaaaggcca agaacagagc cctggaacgt 21180
acctggggta cttcctccag ctaggtcagg ttcccttctc tgggttttca cacccccagg 21240
tggaccccct accccaggtt tcctggtcat agcaccaatg acacagtata gttactgtca 21300
ttatcattgt cctcataggg cttagagttc ccaagcagac agtcattctt gggccacagc 21360
acatcctata cttagggagt ggtccaggcc aggacagtat ggcttcaaat tgtgtcaaag 21420
gagagcttcc aaatctttta taatatatat cccagcatcc agatacaaat ggtaatattc 21480
acggcacaca cagaagcaaa cagtaggcta cttctggccc tgaggtatct tgaagggttg 21540
agggggatca atatcttggc tcatctgtac tgtgacagat ttggaagatc tagtctaacc 21600
cattttttcc ctcccctccc cctaccacct tcagagaagc tgctgctggc ttggactgcg 21660
gtggggctgc ccctccagga tgtgtctgtg gctgcctgca atttctgtcg ccgtcctgta 21720
cactttgagc tcatgagtga gtgggaacgt tcctacttcg ggaacatggg gccccagtat 21780
gtcaccacct atgcctgaga agccagctgc ctaggattca caccccacct gcgcttcact 21840
tgggtccagg cctactcctg tcttctgctt tgttgtgtgc ctctagctga attgagccta 21900
aaaataaagc acaaaccaca gca 21923
<210> 42
<211> 31438
<212> DNA
<213> 智人
<400> 42
gcaggaaggt gggcctggaa gataacagct agcaggctaa ggtcagacac tgacacttgc 60
agttgtcttt ggtagttttt ttgcactaac ttcaggaacc agctcatgat ctcaggatgt 120
atggaaaaat aatctttgta ttactattgt caggtaagtg attttatttc atcttggttc 180
tgttatattg ggtatgagat catagaataa aatatgaact accctatttt agttctatct 240
tatttaaatc aataaatgag tagtatttcc tcttccagtc tggtggatgg attttactgg 300
aactcagcta ccaatgtggg ggaaatggca caagggagcc cagtatttat ggccaaatcc 360
agttttctag tatgagaagc ttacttcaat tctaagtcta gctagaatta aaataatttt 420
atcaaatgct atgagaaata cctctctgtg aataaatgta ttgctttgtt tgagttataa 480
ggagattcat ttccaaacta aagagttatt aacgaagatg ttggtagcta tatggctttt 540
agttttcaaa aggtataatt tcctatttct gccaaatggc gagaagccaa aagcatgaac 600
actgaaaccg tggggagttg ttcgcttctc tgtgggtcca ttactaaagt gtcacatagg 660
aagaaaaaaa acaaaaacaa ctcttactgg cttaggtatc ctgtgaattt taggagaaat 720
ttaaatccat taaaataaag aaatatcata gggttattat taaattgtat taattcaata 780
atttgaattt aacttagttt aaatttaatt attaatttag tgtcttaaat taacatgatt 840
ttggcctctt tctgagaata ttatagttaa acatcctctc aagtgcagtg cttatgtgtt 900
agcaatacta gtgcccagca cacagcgggc aggcagttgc ttgaaacatt ctgagtctat 960
tagacattgc tgtatcccaa gtgagagcaa gtatcaagga gctactgagc actctgtagc 1020
acacagggag gagagatcag cattttctaa gataccctag gggaggataa aatagtgcaa 1080
tagttaagag cacaggcatg aggaacagac agaactgggt tcaaatctac ttttacttct 1140
caaggctggg gaacattaag gcaaattatg tgcccacatt tttatgtgtc ctcgtcttta 1200
aaatgcaggc agtgttggta cttacctcat aataattgca taaagattaa acaaaatatt 1260
taatggaata cacttactga tgcctgaaac aaagtaaaat gttaagatta ctatgcattt 1320
tctgtgatta gaattaacta tcatgattaa aaagtattaa taatatatta ttaaaataag 1380
cagtagctat caatagttac agactaggga acaaacctac gtatgtgatt ggtgatttct 1440
gaaaagtcag agagaaaaga aaattacaga aagaaaacag aaaacaaaca tagctactct 1500
aattttttaa gcagaaaagt atgaaaacat ttagtttgaa gaaaagaaaa caaatgaaag 1560
ggatgtagtg taatatttgt atatatattc atatatttga agtgctatta cacagaaaaa 1620
aagatgtatt ctttgtgttg ctccatgggg caaaccaaac tggatgtaac tcaagcaaaa 1680
ttagacactg catactctac tgggggtgtg cccagcattt gggaaaactc tgtgtgactt 1740
acaagtgccc caaatttgga aagggttcct ggcaaagaaa tgattttttt tttaaatttc 1800
tacaactaca caagcagata gtgtattaaa gccttaaatg gcacttggtc actggggcaa 1860
gatgaccctg aaagctacaa tggtctccag tacccaagct gttatcatct ttgtagcttc 1920
agaaaccctc caaggaaact ctcttgatgt ggctacttta tagtataaca gaaaggtgta 1980
agatcaagtt tttcccccat actgattagc tgaagagtaa acatggtgaa gtctttttct 2040
ttttctttta tgttgctata aaaaaaaaga tgattgcctt gctttctcca ggaatcttaa 2100
gaataaagcc aatatttcta attctaaact taccagagat ctccttccaa atggagaatc 2160
cattttttct aatatgactt gattcccagt ccctgaattc ctgcactcat ttgatgattc 2220
agtcattaca tgtcagattg tgaaccagac actgagccca cagcaggaag aaaaatgggc 2280
tcccatggag gatacacgga gggtaggcgc agtggatgat gggagggaac gcagataata 2340
aatggaacaa caactatctt attaaaataa gataaaaaca gtcaaaacta atacaaagca 2400
tataaaacca ggtaagatga taaacatgaa tgccgaaagc tgcttaagaa aagggtagca 2460
gggagttatt ttctgagtag atgacattta tgctaaatgt ggaacaagga gacggagcca 2520
accctgaaaa ttctgggaaa agaggacaga aggcagaggg aagagcaaga gcaaaaattc 2580
tgaaacagca ggtaagttag tgttttcaag gaaaagctgg agcttttatc tgaaaatcag 2640
attctgaagc taagaaccaa tttgaaaata caatacaata tcacttcgac taggaaatta 2700
tggcataaac caggagtctc caaaagcttt ttgtgtttac ttaaaaattc atacaaaatt 2760
tgcattctag gtcataatat actaatttaa ttggaggaaa caaaggcact ggtatgatat 2820
catcatgcct actttattca tccgtgtatc cccagaatct agcacagttc ccgattggta 2880
tttatagtag catattggtt gaataagcaa ggaaggaggt gaagggaggg agaaggagag 2940
agaagcagag agggagagga aggaagaaag aaaaggaaaa agggaaggaa agaagagagg 3000
agggagagag ggagggaggc aagaagggag aagagagaag ggaagggaag agacaggagg 3060
aaggggagga ggaaaggaaa gaggaaatat ttgttttcat ctggttagac acagtgagtg 3120
ctccgcatag acagatcatt attaccctgt gcatctgact catacccctg caagtacatc 3180
agtctgagaa gcacatgtta agtgaagaaa caaggcatct cttttttttt tttttttcag 3240
ggatccaaga agagagcctt gctagctgct atttaattgg cacaggaaag agttacagga 3300
actgtatgcc agggaataca tgactataaa ttctttaaaa gcaaaacctg tgtcttcgct 3360
tatgtgtccc acacattgtc agccacatag taggcagtca atatcaacta ctcaaaatga 3420
caaatgacaa atgaccagaa ttctgcggca gactagttta gccatgaaaa atcatttaac 3480
acccgtgggc ctcagttttc ttgtgcctat tcaataaagc gccgagtaga tggtatctac 3540
aagcattttt caactgtaaa ccccaatgaa tccccaaaat tcagcctgag atgagctgga 3600
ctagttgcca aacctataaa tatctttagc atggtgtgaa atagggtttt tagaaagaaa 3660
cagacaccca ctgtgaactc ctttgcagaa aaggtctgaa tagaggggaa agtagggatg 3720
gtatctcaaa cttactttgt agtgatttta aattaggaaa tttagcttca cattcttgtg 3780
ataaatttct tttcaccttg gtttctagaa gattattcaa aacatctgtg agactatttg 3840
agaagtatac ttttggggaa tttccccaag ttatctttat agattatatt ttgacatcaa 3900
ctgcaaatgt aatatctttt actcaaaaaa aacccaatcc tacttacatg gtgctgacaa 3960
aatcaggctg gacctacatt tttacatcat agatttccag ccattattat catatccaca 4020
tctttagtaa gtacctatct gtgtagtttt ctgtgataaa tgaactaaac taaaactaaa 4080
gcaaaaatgt tgaaaaaaaa ttccaggttt atctctgagt gttgggattg caaggttttt 4140
ttttctcatt ttaaatactt tctaaatttt ctgcaaagag aaccatataa tctaatcagg 4200
acaagtttta atatatttta aaaagtaaac cgaacaaaca caatctctgc tttctaagaa 4260
gtctttaatt tttgtacgtt ggtcatagac tatgactata caatttattt gtgatatgta 4320
ttaagaattt ctgtctaacc caaattatta tatgtaagca cgggaaaaat gatgtcatct 4380
ttgtttgtag tgtacaaagt tctataaaca gctatttgat caactttggt atttccatcc 4440
ctagatttat atacagcagg ttaggttcca tacagaggca ggttctgaat aataataacc 4500
aacactgata atagcactta ctttgtgccg tgcactgttc taagcaattt acatacactt 4560
aatttttaaa attgtagtaa aatacacata atataaattt accatttgaa ccattttaaa 4620
gtgtacaatg ggtagcattt aatgcagtca aaatgatgca cacccatcac cattatgtag 4680
ctccagaaca ttttcatcac tccaaaagga aacctcttac ccattagcag ccacttccaa 4740
ttcctccagc ccctggaaac cactaatttg ttttctacat ctacagatat acccattgta 4800
gatatttcat ataaatggaa tcatataata ggtagccttt tgtgtatgtc ctctttcact 4860
taaaataatg tgtttaaagt tcatccatat tgtagcatgt atcagtattt cattcctttt 4920
ataattgtgt tggtatatct cattttgttt atccacccat catttgatta aaatttgggt 4980
tggcatatca cattttgctt atcgatccat catttgatta aaatttgtgt tgtttccacc 5040
ttttggctat tgtgaatagt gctgctataa atattcctgt actagttttg tttgaaccca 5100
cttttaatac tcaaagatgt ataggggtag aattgctggg tcatagtaat tttatgttta 5160
acttactaag gaactgctca actcttttcc acaggagctg caccttttga ccttttcacc 5220
agggtgtatg aggtgccaat ttctccacaa tcttgccaga aattgtactt tttcattttt 5280
ttaattatag ccatttcaga gggtatgaaa tggtttttca ctgtggtttc ttgcattttc 5340
ctaataacta atgacgctga gaatcttctc atgtaattgt tggtaactgc attttgcata 5400
tctttggaga aatgttggta ctagtccttc acccattttt caatctattt ttctttttgt 5460
gttgctaagt tgtaagagtt ctttctatgt tctggataaa gagtcttatc agatatacta 5520
tttgcaaatc ttttccttca ttctgtagat ttttgttttt acttttgata gtgtcctttg 5580
atgcacaaat gtttttcatt ttcaagtcca atttattttt ttttcttttg ctgcttacgc 5640
ttttgatatc atatctaaaa ataattgcca aatttaaagt cataaaaatt tctccctatg 5700
ttttcttcta agagttttgt atttcttctc ttatatttag atctttggtt tattatcagt 5760
taatttttct atatgatgta tgataagagt ccacctttat tattttgcag ctgtcccagc 5820
accatttgtt gaagagacta tcctttgccc attgaatggt cttgacaccc ttcttgaaag 5880
ttaattggcc atggatatat gagtttattt ctggagtctc aattctatcc taagaatatg 5940
tctgttcttg gggcaaaatc acacagtttt tattgctgtt acttggttat acgtttttaa 6000
ttcatgaagt gtgattcacc aaactttgtt cttcaagatt gttttgccta tttagatccc 6060
taacaatttc atagaaattt taggattagg ttttccattc ttgcaaaaaa ataattatgt 6120
gcattttaac ttaacctgtt caataactct ataaggtaga gactaatcca tgtataatga 6180
tggaacaaaa atatagagat taagtaaatt ttgcaaggtc tcaggtagtt gctagaggaa 6240
ttagtttgag cctaggcagt tccactgcag aatctgtgca cttagagaat atgtcatgtt 6300
gcctgtacca tacctagtga tgttccagga ttggctcctt tactcttaca acattgtcac 6360
tcagtgttct gcctgtgctt tcaccaagct gaagacttta atgaaggttg acggtctgtc 6420
ttcctcacgt ggtgcagcta aggaactcta actgtgtggc tgttatgtta gccttttgct 6480
cctttttata tgggctatag aaaatgtttt taaatcctgg aggcctcctt ttgatgttat 6540
cacttatttc ccagtcatca ctatattttt aaaagccaaa atagaaggaa ataaatacaa 6600
aacataaaac atgaatagta cagctatttg aggcaactga gaatagagat catggcactg 6660
aaattgcatt ttgctaggaa aaagaccaca aaagttctcc ccttgctacc tttcctgaac 6720
tattctgcta gattcagact tcaaaaacat tgtatcagga aatacagaaa tgttctttca 6780
aaatgagtgt atgggaatgt gggaatgcct aataaaatct gtcctcattg attcgttagc 6840
aaaaatcata taaatcaata ccttgtgatt gcaagcagat atatttcaga tcctttctgt 6900
gtttgttttt ttgctttctt gatctatcac aattggagaa aacttaaaat ttctcaatgg 6960
tattgtattt ttgccaattt cttattctgc tttatgtttc tcgttgctat attattgggc 7020
tataatggtc cataattact taagaatcac tgtgaaatat attgcttaat gacacaagta 7080
aatctttttc attgtttgta atgtctttgc tcttaattct actttgccta agattaatac 7140
ggttattcct gtttagtttt atatgtattt atttatttat tttgaagatg gagtctcgtt 7200
ctgtcgccca ggctggagtg cagttgcatg atctcggctc actgcaacct ctgcctcccg 7260
ggttcaagca attctcctgc ctcagcctcc caagtagctg agaatacagg cgcacaccat 7320
cgcgcccagt taattttttg tattttagta gagacggggt ttcactgtgt tgcccatgct 7380
ggtctccaac tcctgagctc aggcaatcca cctgcctcgg cctcccaaag tgttgggatt 7440
acaggcatga gccattgcac cagtcctaac ctatctcttt tgactcaatc taaaagtttc 7500
tgtcttttaa tacaaaacca caatccatat gcattcatta attcacaact gacatttagt 7560
atcttatttc tgttatccta tttcatattt tatgattcct tgtttctgct cttttgatat 7620
ataaattatg ttttatttgc ccttatcctt tcatgtgttt ctaaagtata tagcctacgt 7680
gtaattgtcc cattagctaa ctttatgttt ttgaaagcat tctctctcag aattcccatt 7740
ttagtggtgc agcacacata gaaagtctaa gtgctttctg gagctagata agctggataa 7800
aggtgtgcat gagccactgg tcaatggctt gtgcaggcgg tgagtgcatt tctggtattt 7860
catatgctat tgatctggca gccaggtatt cagatagggt ataaccaggt tcatcaggct 7920
caaaacataa tcaagtatta ttgagacata gttaatgtgc actacaactc acagcacaca 7980
ggctcacaca cacacttgtc tgaaataaaa ttccacaaaa taataccttc ccttattctg 8040
tgtgatgtac tttgatatat tctctcctgt tttatacaac ttaatttttt ttagagaaaa 8100
gattttgctc tgtggcctaa gctggactgc aacggcacag tcatagctta cttcagtctt 8160
gaactgctgg attcaagtga ttctccagct tctgcctctc aagtagctga gacttcaggt 8220
gtgctcaacc acacctgact aattttttgg ttatttaatt tgtaaatatg gggtcttgct 8280
atgttgccca ggctggtctc gagctcctgg cctcaagcga tcctcctgcc ttggcctccc 8340
aaagcactgg ggttacaggc atgagccacc acacctagaa tacaacttaa ttttttagtg 8400
ccagtgacaa cccactggac tgatttcata acccattagt agaggaatgc accatcttga 8460
ctgaaggttg gaattttctc agggaatcta tgtagcactg atgattgggt ttcatatcca 8520
gagattctag ttatgctaat acagaggcca agcaaactat agcctgtgaa tggccggccc 8580
cctggttttg tataccttac aagttacaaa tgatttttac ttttttaagt gcttaaaaaa 8640
accaaaatag gccgggtgca gtggttcaag cctgtaatcc catcactttg ggaggctgag 8700
gcaggcggat cacgaggtca gaggatcgag atcgtcctgg ctaacacagt gaaaccccat 8760
ctctcctaaa aatacaaaaa attagccagg cttggtggtg ggcgcctgta gtcctagcta 8820
cttgggaggc tgaggcagga gaatggagtg aacccgggag gcagagcttg cagtgagcca 8880
agatcatgcc acttcactct agcctgggca acagagcaag cctctgtctc aaagaaaaaa 8940
aaaaagaaag acacaaaaaa aatcaaaata ataataataa tatgtgaata ttatatgaaa 9000
ttcaaattct actgcccaca aatcattatt ggaacatagt catactcatt tatttatgct 9060
ttggtttaca tattgtctgt agctgctttt gcacagtgac agagttgaat atttgtaata 9120
gatggtccac aaagcctaaa gtagttgtgg cccacaaatc ctaaagtagt tactctctct 9180
ccctttacat aggaagttta ctaatacttg tgctaaggga tctcaacaga caatctgaaa 9240
aacttaagtt ttagactaaa gatttccaat ctaaattcct gtggagcttt ctgaagctgc 9300
caggtggaga tgggaacagg ttgtgaggct gcaggccaaa cactcaggcc agcttccacc 9360
aagcagttca actctgtctg tttcacacac tgatgagctt atccttggaa agtgattaaa 9420
gtaaaattaa atgcgaattg agggaggaag tgagggagac tgtggctcta aaacaaaacc 9480
ctaagaaaca ccaacattta agatggcaaa tgatgttatt tctaaagtcg ttcaggctaa 9540
tatcacatac tatagctgtt cactttatag ataaaggtga cactacaacc atagaaaatg 9600
taagagtgga cctcgaaact caggaagatg aagtttacat atattaatct atattaccaa 9660
ctggagcagt tgttctcact gctggccgca catcagaatc caattcctgg gatatcacag 9720
atgattctac catgcagtca aggatgagaa caaactaggt tcatttctgc aattttttta 9780
ttgttcaacc agtgaaaagg aagtaccagt ggtgtgagaa ctttgggata aagtttttgt 9840
tttcaattaa aattattttc atccagccca acttccttaa gcccaaattt aatgtgtgtg 9900
aagttcagct acagaaatac caaaccttag actaaagcgg acacaggtaa aatatgtgaa 9960
atcctctttt gttctgagga ttctttagta ggcaggagtg accagatagg aatatgcttg 10020
gctggaaaaa ttaagattca agttaacaaa ctgttaataa ccaggaccat ctgctcttcc 10080
gtaatgtgga tttgccactg caggtcaccc tacaatgcta tgttagaggt acaacactct 10140
taccctcagg ctataaacaa ggtgaattat tatctttata tctcttcatt tagccctgat 10200
ttgctgaagt gaaggctcgc ttgagagttg gttgcattat aatttggtga gaatttaatc 10260
tctcaatgac aacttacttg attccctcat tctctttctg ctacatagat cacagtagac 10320
cttggcagac agttctgtag ttacataggt ctgaattcaa aatccaggtc tgccacttgg 10380
tggctgtgtg aacttaagca agtcaggcaa tgcttctgat gtttttttcc tcctccacaa 10440
agaataatta acatataaca atagggtctc agctagttgt tttaaaaatg gttagagaga 10500
tgtgtggaat gaagtaagtg tgcagtaagt gttaactaca aatattatta tcttagacat 10560
acagatttcc atgattcatg aatggtgaag catcttagaa gacatccatt ccaggccagg 10620
catggtggtg tgcacctata gtccaagttg ctcagtagaa tgaggcagga gaattgcttg 10680
agcctaggag tttgaggcta gtatgggcaa tatggtgaaa ccctatctca agaaaaaagc 10740
aaaacatttt ttaaagttta aaaagagaga catctgttcc actactctca tcttagaggc 10800
cataaaactg aggctcagat aatttcagag acttgcacag atcccccaac catttggtgg 10860
caaagccagg aagagaactc tgctctcctt tcccactggg acagtggaag aaattcgtct 10920
tgatttccat ctgtccaggc tgaagaatgt gcactggctg gaatgacaga ctgaccgact 10980
ttttttctcc acctctgctg tctcagcaat ggtttgggac agtgtggatg accagaagct 11040
ggatagtaca gagccaggct aaagagttca ggcttcctga agggaagctg cagtcctcct 11100
aggccacaac accttcgaga tagaatacat aaagcaccct tctctaccaa gttaggaaag 11160
gaagaagtgt gaccaattag ctgtatgggg actgccaaag catgccagtc tgaagatgag 11220
cagaaactgg ctcattccat ttggcaccta gcacactaac tgcatccgtt aataggccat 11280
gcttttctcc agagccattg gctgaagaga tcaaataaaa agtattgaga ataggctacc 11340
caaaacagta ggctcagatg ctatcacaca aagcacttta tccttaagtt caatttttct 11400
aaattgtagt tggctgcttt ggcttaataa aaacttccaa aaaagaaaaa cgaatggcca 11460
cagacagtat gggtatctaa ctatattatc acaacttgac caagattgaa cttgccaatc 11520
ctttggttca agagccaaac aaaatcgttc ccttaaaata ttgcttcatg ggaacagtct 11580
tcttcaaaca tcttttagca caggcaagat tcccatttat acattaattc tgttcaagac 11640
aatgagattg ggcagaaaag gcattgagtt ggaagtcaat ggatatgagt ttttatccca 11700
gttttaccac aaattagctg agcataactt ccacagatgc atttatcaag tagttttcat 11760
ggtcattgca atgccaaaaa actgtagcat ttagaaaatt tagttttcag acttggaaac 11820
tatttaaggc atttcatatg aagggtgtgt ccttgtgaga gtttgcttat gcaagataag 11880
gcttctttca gctgcaagtc aggagcgaac caaaactcaa agcagcagct gcatgagctg 11940
actttatcac atcttgacaa gagctcagcc actggaagtt ttggcataca gcgaaactga 12000
agcgtactta tacaatatca cattttattt ttattgtttc taatagcatt ccaggttaga 12060
aatgtcaatt atttgggaaa gctgagggtc tggtagataa agcatgcagc agagagctag 12120
gaggctggct atttccagtc gttatcctaa catgtcttgg gcccccaagt caccccacct 12180
ccatggtaca atgggaactg tggcagaagt ccacgctctc tcccccaaca catggggata 12240
agagacaaga gaggtgaaat gttctggaac atatccgatg ttatacaagt ataagctgtg 12300
agatgatcca aacgcaaata ttgaatattt cattttctag aaagtatacc aattcattcc 12360
acccttctca aacctaaatt acagaattca attcaggtca cacagattta ctttgtacta 12420
agtaccatag caaatgccat ttcagtgcct gaaaactgaa aaacataaat ttaaagtagg 12480
agtttgaggc ctcactaata tgacaaaaca tacctttata ttttattttg cagtaatttg 12540
ccacttaatc attaaactct tatcaatctg agagatttgc caacacttgc ctgctaggtg 12600
acctaagcct ccacatcaat gcatgttata ctcccctttc tccatatgtt aggcccatgc 12660
tatttcttta tccctcctcc tctgcatctt cacctaaaac tctgcccatc cttcagggtt 12720
catccagtga ttcatttgca agcaggcatg gggtaaggtc ttcagagtat gtttctcaga 12780
ggcccatgca gctaagaaaa tgtgcagtgt tggcacaagg tctgtctatt cctgggtagc 12840
cagatgctgg acacatcttt cataacacca caaggtaaat atacttcact tggagagaga 12900
ggtgaaattt tgcaggtata gactggatgt gttcctgcca gaagatgtga agggattaag 12960
aaactgactc tcatctccgt attgctagag caaaacataa tttctcatag tggctatagt 13020
ataaggacac tgaggggtaa gagatataat ctaagtaata caataaatta gtgtggaaaa 13080
atcatcaaaa tgaagactac atggttttta ctaaaattct agcttttagg atgtccaggg 13140
agctcaggaa tttagctgtc cttttttgta tgtacaatat gccccaatgc ttgctgacta 13200
atgtactaaa acattagaga aatcttgctg acaagatctc aaccagtcag cgagatccgg 13260
aaggtgagac taatattgag ggtcagcaga attaagtctc agttctgctg cttaccagat 13320
atgctgatct gagctagtca tttaattttt atgagaccaa atgtctatct gtaaagtcgg 13380
caatttggat tagatgtgct gcaagtggtt ttctagctta aatgtacctt ctgaattcaa 13440
caggacaata cttaaactga cctttaatct aggaatgaca caagtagatt tttgaaagct 13500
actttagcta cagaaagctg agagcaccaa aggcaaagag ataaaaataa caggagagcc 13560
ttcccttaat ccagtcccta agcagttttg gcaaactaaa gtttgttgtt caatggttac 13620
gagtttgctt caatgctttc tacccagttt actgaactaa atagtatata gctatagtaa 13680
aaagtcctat tcaaaaacca gcttctcaca gatattttgc agctttgcag aattgaatat 13740
gtccacagac gtctattagc tggttagggt cttaggaatc taggagagcc aagtagttgt 13800
gtgagctgtt gttatcaaat gtagttttga acattcttgg tgattttaag ggatcatatt 13860
gtggaaattt ggtttcctta ccttgaattt tgaatgaagc tttagaattt gaggatgttt 13920
ctttggtttc tccttccagg taagtgattt tttttttttt caaccagatg ctggtttatt 13980
taatttgaag gtattgatga aattctttaa attgccccca tgtgattcta ctctggaata 14040
actacgaaat tatttaaaag ttaattaata caagaaaata tgaaaactca tttttatggg 14100
agctattgtt ccttcaagat gacactgttt tgtaaactat agacttccag taacaagcct 14160
ctgtgccttc ttcttaccac taagcatgca tgggtattaa ttcctactga aagacttatg 14220
ctatcttttt tccagaaatg gaagaaaaat gaactatgaa aaaggtcatt ttataggtca 14280
gctaccacta tgagattgtt gaggaaatga tataaaaaac aatttttatc aaattatctt 14340
tagggcattt atatgtttat tttcttacta tgttgactta ggtgactata agaagttgta 14400
tcagagcaac tgattctggt gaattaaagc aagtatttct aagaacataa gtggcaactt 14460
tcagtctcaa atcaatttgg ccaccaatca gtttttgtaa gggtacaaat aggacataac 14520
atgctcagat gggacttgga taaagtgtat acaattttac atcgaggaaa ttgtgtcaat 14580
gtgttacctt caatgttaga aattcccaag ttctgacaat agttcagagc cttgttaaaa 14640
gccagagtgg aggcatgtag atccagctgg aaagagaggc attatggtct aacttaggac 14700
aaattttaaa gccagtgtta gggtctgagt ccagctttgt aaacttgagt acagtgtttg 14760
atctctgggg tttcagcctt cacttcagaa caaaatttcc accaagtgct cttttactgt 14820
gaggagtagc tgttgaagaa gaaagaagtc tacttatttg ctagagtgtt acaattgttt 14880
tgataaagct caaaacttat ctaaataagc tctctctccc taagcatgtt ttcattttta 14940
taaaaaagtt acatatactt tgcttataaa tttaaaatac ttttcacctc ctctgacttc 15000
atttaaaatt aaaataatta aagtgccaat tttaagagat gttagctccc attattggtt 15060
ctttgccata ttcttttgac aacctgctgt aattttctgc cccctttaaa gcctcaggct 15120
ataggccttc tccaccaaag gaatattaag aagtgataag gaccttctgt gagcagaagt 15180
ggcttgtttg caaagggact gcttatcttg gccactcttg aacacaagat gggaccctct 15240
actgcaaagc tctggcatgt ttttttttcc cctaagttat cctccatact actgacagtg 15300
attttcccta aataaaaaac tgcttcaaac cattcattgt ctttccactg ccttaaagat 15360
aaagtccaaa ttctagaaca tggcccacag catttggtgc ctcaccacct cttcagcctc 15420
tcagttgctg ttcacccatt tctctattcc tctccttctc acaccttgtg ctgcagccac 15480
atagataacc tgcagttttt gtaacgtgca atgatgtctc aaattccaag gcattgctgg 15540
taccacacag cctgcctggt aaaatcctag acttctttca agataaattc aaagacacct 15600
ccatgaggtc tttctacctc tccaagtaga gttgaccgct gtctcctttg tgtccccact 15660
tccaccacca tcctaaaata cttattatac ttagattaat aattgtcgct cttactgcac 15720
tggaattacc ctgaaaggaa aggccatgta ttatttatca ttgtcttcct agtacatagc 15780
ccacagccta tacctcccac cccaaaaaaa accttttgta aataattgaa caaattaaga 15840
aacacccaag gcccccagta aacatcaagg cctaaggaat gcatatctgg attctaaata 15900
atcataaggt tttacaacac catgttaagc accagggact tcagagagct tttagtctaa 15960
atcttattag agaggccagc gaagacctcc caaaggaagt ggcattgaac tgagacttga 16020
aaagccagta gttaggcaaa gatagggagg gaaatatttc agacgaaggg aggagatggc 16080
acaagattta ggacacggaa aagggtatgg tgcagtcata gagaaaacag atgtgcagaa 16140
tggctggagc cccaagaggg aagggaaggg cgaagcaatg aagatgtgag gcaagcagga 16200
ctggaccatg cagagtcttg cagatgttca caaagaaaat tgcagcaggt agtccctaac 16260
atcgtgctga acagttaggc aacttggagg aatatgtata tttgtactca tagtcaaaac 16320
cactagatgg catttacaga ctacgttttg tgtattttta ttttttactt tttgtttttt 16380
ttttcttatg ttagcaaaag tatgctcgct attgaaatgt tgaaaatatt tcattggtct 16440
taaaatgatg cttatttttc cagatgcttg cattcattct gcatgtgcta ttttgtcatg 16500
tggtttgctt aatttattaa acaattgtat taattaaata tattaattat aaattgatta 16560
atttataatt aattatgtgt tataattaag ttaaatttat taattactta aattattata 16620
ttcacattca gatgcaatct gaaaacccat ttgttctcac actgctataa agaaataact 16680
gatactgggt aatttataaa gaaaagaggt tccatttgac ccagccatcc cattactggg 16740
tatataccca aaggactata aatcatgctg ctataaagac acatggacgt gtatgtttat 16800
tgcggcacta ttcataatat caaagacttg gaaccaatcc aaatgtccaa caatgataga 16860
ctggattaag aaaatgtggc aaatatacac catggaatac tatgcagcca taaaaaatga 16920
tgagttcatg tcctttgtag gaacagggat gaaattggaa atcatcattc tcagtaaact 16980
gtcgcaagaa caaaaaacca aacaccgcat attctcactc ataggtggga attgaacagt 17040
gagaacacat ggacacagga aggggaacat cacactctgg agactgttgt ggggtggggg 17100
gaggggggag ggatagcatt aggagatata cctaatgcta aatgacgagt taatgggtgc 17160
agcacaccag catggcacat gtatacatat gtaactaacc tgcacattgt gcacaggtac 17220
ccaaaaactt aaagtataat aataataaaa taaaataaaa taaaataaaa taaaataaaa 17280
taaaataaaa taaaataaaa gaggtttaat tgcctcatgg ttctgcaggc tatacaagaa 17340
gcatagtgct tctgcttctg gggaggcctc aggaaacaat catggcaaaa gacgaaggga 17400
aagtaggcac gtcttacatg gttggaacaa gagcaagaga gagagtgggg agagagagcc 17460
ttggagcagg agcaagagag agtggggagg tgccacacac ttttaaacaa ccagatctta 17520
tgagaaatca ctatctccca gacagcatca agggggatga tgttaagcaa tgagaaacca 17580
gccccatgat tcaattacca cccaccagtc cccacttcca acattgggga ttacatttcc 17640
ccatgagatt tggatgatgc cacagatcca aaccatacca ctcacctaat tctttctacg 17700
taagaatttg tccaagcatt tataacaatt agcatttcat ttaacatctt ttatgaataa 17760
agcactattc tcatgctgag aagattcaaa ataatgggaa attgaagtcc taggaacaag 17820
ttttatgttt cagaagagcc catttggtat ccacagggct aagaaatgtg caccctaaat 17880
gtaagtggat tacactgaac tgaaaggtgt aaagaaggag tggaagatta aagggagaag 17940
cttggagagg atgaaagtta gaaatggaag tgacgagcac acctgagtga aggatgagag 18000
ctccagctgc attttccagt tgtattccca tgttgctgag ccaaaggctg atctcaagtt 18060
tattgttaca tgcccattta aggcttctgg ccattaacac ttttgatttt ttttggcttg 18120
ttgttttact agctattttc acaacacttt catagctaaa cctattttac tcagattgta 18180
tgccttttca aaaatacaat agaaggtcca tattccatta tctagaaata agccaaagct 18240
catatctaac atttattaag agagatggat tatttttgtt cattagttat ctttataaat 18300
aatttttacg tactttagtt gactcataaa gatgtttctt tctgtaattt taatcttaat 18360
atttgttgaa cttcaaaatc cctatcacca ggttattgtt taaaagcatt ggtttttata 18420
ttatcttaaa agccattata cctgagtgct gaacaactta gaaacattca gtaattgttt 18480
tgcatgctat ttagtgaatt catatggcaa tcgtttatac atacatgatg gaatcaggtg 18540
gcaggccaag ttaaagagca aggccagaaa agaacttaaa agagaagaga aaaaatagac 18600
agtttaggaa caatagatca tgtcttctcc atgatttgga ggtaaactga ttacctatca 18660
gctgataaat agaggaaggt tttagaagtc ttcagttggg tagactaatg agaggtgtca 18720
gagaagatgt tttctgttgt ttgtgggttc tccaggaaac tttgagcatt cagctgaggg 18780
gccaagttgg ctgcctctga gaagaagccc ttccacctcc actccattgc acttgggtgc 18840
cattcccctc agttgaatat ctccaagaga tgagcaaatg tacatctaca gagttcaggg 18900
tactgacttt tatcataatg atttataact ctcagaagag tgaaaaacac atgaatgcac 18960
agaataggag attgaaatat aaaccacaga acattcatac aatggaatac tctgcagtca 19020
taaaaatctt ctcatagaag aatatttgac agcataggga tatctgtggc atattaagta 19080
gaaagtcaga cttgtaaaca ttatatacat attcacgtat atttaaacac catgatccca 19140
tatttagata taacaactaa aagttcagat ggctatatat caaaatgtgt caaatgttca 19200
accttgcata ggctgactgt agatgaattt tatattattc tttgtgcttt cttgtagttc 19260
ccaaattttc tttactgaat ctatattact tttgcaattt aaagaattta atttataaaa 19320
ttttataaaa taacttataa atttgaaatg tattgcattt aagaataaaa agtgtttaat 19380
tacaaaaata attcacaatt tatttaatga gattttaaaa ggatatatgt gagtctacat 19440
tctgatttca tgtttgcatg catggttttt tttttctttt gagacagagt ctcgctctgt 19500
cgcccaggct ggagtgcagt ggcgtgatct cggctcactg caagctttgc ctcctgggtt 19560
cacacaatgt aatagtgttt tattattgtt tccattttta ttgaagaagt aagattgtcc 19620
ctagcagatg gagacactga gatatgggac agaagttttg ttctatataa ttattatgcg 19680
cttccacctt tcttagcata gacagtttcc aaaatgcaac ttcaagttac ccctttataa 19740
gcataataac aataataccc aacatatatg taatgctctt tatgtgccaa gtactatact 19800
aacacatgca cattacatac acacacacca catacacaca catatttaaa ctaatttcgt 19860
tctcacaatg acattttgag gcaagtatta ttattgtaca gatgagaaaa ccaaggcacg 19920
ctttatctgt aaacctctgc tatgcagaaa ttctggaggg gcttctggcc ccttaatttt 19980
aaaataaggc caataataca atacttacca catagcaatt ctctaaacat tatgtaagat 20040
atataccaaa gcgcttagct cagggactgg agggatgtga gggaatttgt cttttgcaat 20100
atgctttatg gtccgctcag tcacctcgtt cttaatccct ttctcaactt ctattttata 20160
cagcaattgt gagcatatca gcatcaagta ccactggtgt ggcaatgcac acttcaacct 20220
cttcttcagt cacaaagagt tacatctcat cacagacaaa tggtttgttt tcatttttat 20280
ttttaaattg tggctccgaa atcatttttg tgatgtaacc cattttaggg gacctgtcac 20340
tgcagagaaa ctgacaaaca ctgagaaatg cgagctaagt agacacagcc tactaagtag 20400
acacaattcc tactatggag gaattcttgc ctctgaaata tctcacagaa ataatactgt 20460
gagttaaaga aattaaaaca atgtggcaaa gcacagaaat gatgcacgtg accatgaaat 20520
agtgggccag ataaagggga cctaatagtg cggtggtgcg gagggtctgt gggcaaactg 20580
agttcagctc agacccgggc tcagctctat gccagctgct gacccagggt gagttgccct 20640
gcagggtttc tatcccatta attttaaaat ggggccaata acacagtact tatctcacag 20700
catttctcta aaggctaaat aagaagatgt atctaaaagt tattagctca gagcctcaca 20760
cattctcagt gactgataaa caataagcaa agctgggtgc tgagataaga gtaatctggt 20820
ggcagtctct cttgttagtt ttcaggggag aagaagaaat tctggagccg ctgctgggag 20880
ggatgtggga gagtttgtct ttcataatac gctctatgtc cacgcagtca cctcattctt 20940
gtgccctttc tcaacttctc ttatatgcag atacgcacaa acgggacaca tatgcagcca 21000
ctcctagagc tcatgaagtt tcagaaattt ctgttagaac tgtttaccct ccagaagagg 21060
aaaccggtat gttcttagtt ttaaatagtt gctctggagt cattgttgtg attgaactct 21120
atttacacga gctgtaactc atgacagttc tcaagctttc gtgacagaaa acccatctct 21180
tttactccaa agcccatata gcacccacaa ctattaactg tgaccaagaa agagaaggca 21240
agccccaatt aacctttgta cgtaaagcct aaagaatgaa aaaatatacc tgaatcctca 21300
atcatcaaac agcatagtat atactaagta atttgtaata attaaactct agaaaattgt 21360
gtggcttcgg tagtaagaga gcttcatgat gtaaaatggc aagtggagac agagacaaaa 21420
gtaggatgtg gactgagagg gaaggttagc acaggtggaa cagtaaggca accatactat 21480
caattgctgc tgacatagaa tccagagaga ctattggcaa aagctcaaat gagacacagt 21540
aacagtttag attcagacag tggctgtggc ataaatcaga aaattgatag tcgcatgatc 21600
cctctttgca tgggactggc atctgtgtgg agtaatggtt ccatatgcct cctttcttct 21660
ccttattttt aaatttttta aaaatgcatt gcttcttgtg gaagtcaata agtgattctt 21720
ccaatacttt ctcattcctt ccccctcagt tatgagacaa tttgcttatt tctcatccat 21780
gaatacttgt tgggtcatta aaagtagata ctgaaattac taatggtacg actgacatat 21840
tacctcataa atgttactag ctagatgttg aaagttgacc aacaactctc aaaatatgat 21900
taagaaaagg aaacccacag aacagtttga ttccaaaatg atttttttct ttgcacatgc 21960
cttacttatt tggacttaca ttgaaatttt gctttatagg agaaagggta caacttgccc 22020
atcatttctc tgaaccaggt atgttaatat ttgacaaaga ataaaagtca ttccatttta 22080
aactatccat tgcttgtttc aaatgcctaa gaaaatgtgt ctatcttaga agagcatatg 22140
ttgttaactt tattcacaca aaattgtaaa ggcaaagaaa atattctctt tttaaaatta 22200
aaataggcat ttcttatttt taaaaacatt ttgggggcca ggggccgtgg ctcatgccta 22260
taatcccaga actttgggag gctgagcctg gctaatcgct tgagcccagg aatttgagaa 22320
cagcctgggc aatatggcga aatccatctc tacaaaaaat acaaaaatta gctggcatgg 22380
ggcacgcacc tgtagtctca gctacttggg aggctggctg aggtgggagg atcggatcca 22440
ttgcctgagt ctgggagttt aaggctgcag tgagctatga ctgtgccact gtactctagc 22500
cttggtaaga ccctgtctca aaaacaaata cataagtaaa taaaaataaa taaaaacatt 22560
ttggaaatag aaatacataa tttggtaata gtttttctct taagttagat gttttacctt 22620
tctaaccaag cctgagtact tgaaaaaagc ctcataagag cttataaaac aaatgaactt 22680
ccctcatata aaaagcaagg catttaaaat catctaatta actggtactg tatttcaagg 22740
gtaaatctca gccttgattc atttttggcc caatgcaacc acttagggac catcttgaca 22800
acctctgctg aagggacatc ccttcccctc acttgagtat cactgtgtgt gctcatttgc 22860
tattctgcat tccaaccctc ccttcacact tggctgtgtc cacggctcac agggtaaaaa 22920
gcacatcata gaacttcatc actatcgcat acattcaagc taagtggtca agaaggctgg 22980
gcaacaccag caagaggaaa tgctactttt actttttatc aacaataggg cttttaaata 23040
ttaattaggc aaataaatga gccattttac ctttatgtct agccttccat tctatttact 23100
tcaactggaa gcactacaaa tatgctataa atatggaaat atctcttaat tgatttcaat 23160
tgtttcattc ccaacatata aatgactcaa caagcatttt tagtgactac attggagact 23220
atgcataaga atactatgga aggaataaag cttagaacat agatgacctg cattataatt 23280
ataattctac ttttaactag ttgtctgacc aaggctaagt taaccttatt cagcttcttt 23340
tcttcatttg taaactgttt ataccagttt ctttccaaaa ttatgattct atgatctgtt 23400
caatgctctt ttatacatta agacattatt ttctctcata acttccaaac tatgggagaa 23460
tttgtggttt tttccccata tctgaggaga acgtccactg agttcttatc tacagttaca 23520
ctagtgaaga acgctgggtc tggaatcaga agcttcaggt cttagttctg tcatcaacta 23580
ttttgcgacc ttggacaaaa gacttgatca ctcacagtcc cagtttccca caaggttact 23640
gtaaagcaca caatttaaaa aaagacaaaa tctacataat agtatattaa ttgtgctttc 23700
tattaaaagg caaggtgatg gtatgctgat gttatctgtc ttatttttca gttgctatat 23760
ggtcatttat ttcagacttt cataattttg ctgctctctt tatctcctgt agagataaca 23820
ctcattattt ttggggtgat ggctggtgtt attggaacga tcctcttaat ttcttacggt 23880
attcgccgac tgataaaggt gagaattcag tttttaattt tgctgtaaat accaatgtga 23940
acagctctaa gagggtttat tcctctgagt tcagttaaac tcaaaagaga aacagaactg 24000
cataaaattc catatttttc aactggacac atagaagtca ctgtgtttct ctagcagaat 24060
ttttctttgc atttgcccaa ttaaagggaa cctctaaata taaatctgtc ccccattttc 24120
ccaatgaaag atctccctaa gtttttgtct aacttgctgt cacatatttt gatggatatt 24180
gaggaaatat taagattcta cttatagtat ttaccctatt agtgtataaa atatttaaaa 24240
taatatattt acatatgttt aaaactttga gggaagccaa ggcaggagga ttgcttgagc 24300
tcaggagttt gagaccagcc tgagcaaaaa ggtgaaacct agtctataca aaaaatatga 24360
aaattagaaa ggcgtggtgg tgcacatgtg tagtatcagc tactcagggg gctgaagtgg 24420
gaggattgct tgagcctggg aaatcaaggc tgcagtgagc tgtgatcatg ctactgcact 24480
ccagcctggg caacagagtg agaccctgtc tcaataatta tataaataaa taaataaaaa 24540
taaacaaaat aaaacttttg cctttcttaa ttctcacata ttctgaaaca gatttttcaa 24600
atttccaccc atgaattctt aacatcagtg attttttttg aatcattaat gcttttttta 24660
attttttttt ttttttttga gacaagagtt tccctctgtc acccaggctc gagtgcaaag 24720
tggtgcaatc tctgctcact gcagcctctg cctccctggt ttaagtgatt ctcgtgcttc 24780
agcctccgca gtagttggga ctacaggtgc gggacaccat gcctgactaa tttttgtatt 24840
tttttaatag cagagatggg gtttcgctgt gttggccagg ctggtttcaa actcctgacc 24900
tcaagtgatc catctgccct tggcctccaa agtgctggga ttacaagcat gagccaccac 24960
gcccagccca ctaatgctat ttttacatcc atacaacaca gcttatcgaa gtgcataact 25020
tttgctatca ctttctattc acgatattta agacataata tgtgtgtgtg tatttatgat 25080
gctgtcactg tctctgtaat cctagatcag aagtacttag tcacatgaga ttggtacagt 25140
tgtgttttca ttcatcctct attcttaatc tctctttgtg atttttgaga ccataaccac 25200
tatataattc ttttaaaaag gctgagaggt gtgacagcac tgcaattgtg gggccatcag 25260
aagatatgat agtaatatct acattaagtt cctttgcctc ttttcttttt taactacttc 25320
taacagttaa cttctaccat catccaatcc tataattgat tttcagtatt ccatgtaaat 25380
atatcttcct taaataatac tttttgttaa tcaaagaaaa gtaactgaaa atgcctactc 25440
ttgtgtgaga tattttgtaa ggactttaat ataagatagc tttttttgcc tggagtataa 25500
aagagaaaag tcatcttctt acatgggcat atatggcaaa gtgggttgtc ttctctcttc 25560
gtcaatgttc taaaacctga aaaagccaag gaaatattta gttggcaaag ttcagagaat 25620
tttctaagtg tatatggatg aattttgtcc tggtcaacat gatgcagaga tcacacactt 25680
tatttttatt tttattttca ctttcactat ttattacagc agggaaatat gtaagtatca 25740
gtgtttgagg tgatatttct cctactgaaa taccaaatac tatagaggaa cacaaataca 25800
agtttaaatc aatgcttata ccagtaacta gtaacaacaa caataacaaa atctctgcaa 25860
aggggatttc aaccaaaaga aaaaaaattt tagaaaaaaa tatttttaag ctgaagcatt 25920
ttacttttta ctgtcttaag actagaaaat tgtgttatta atattttatg gtatttcttc 25980
atagaaaagc ccatctgatg taaaacctct cccctcacct gacacagacg tgcctttaag 26040
ttctgttgaa atagaaaatc caggttggtg ttaatatttg cagttccttt tgccttttag 26100
gaaaaaaaaa tcaaaccagt gagttacttc tttctgattt gagggaggag ggaaccagtt 26160
atgattcatt tctattctat ctcattaatt ctacttcttt gactttttag aaatgtctgc 26220
agcatagtga gattctcctt tggacacaaa gtgttttgtt ttgttttgtt tttttaacaa 26280
aaaaaaaaaa actcaatcaa atagtaaaag caaaagagaa aaccaagtgt acttcgtatt 26340
tcccaaactg caaagttatg tgtataggag actctatggt cagtatggtg tagcatagtg 26400
aattagcccc agatctgaaa tcagacttgg atttgaatcc atgctccaac acctattagc 26460
tgtgtaaccc tgagcaagct actaaacctc ttttaatatg gggataatga tagtatcaac 26520
ctcacaaagt ttaatgagaa ttaaatgagc tacaaccggt aaagcattta aaaccatttg 26580
tggccatcat aagtcctcat gcctgttagc tgttatcaat atagcactga catcaatgct 26640
atatcaatat agcatgttat caatatagtg tcattcccaa atgacctcct gtgcacactg 26700
gcaagccatc tggcacatgc tttcatctcc actcccaggt gctaagcaga tacaaaacat 26760
gtgaaaggcc atggatatat tttgtttatc cagaacagta ttaaaccaca tagtgctttt 26820
tgaaaagaat atttattgtc aacctttaaa agtcggaaat tgttacattt taaaaatcaa 26880
gtattgctat tcctctgggg aaaaatgtaa actcccaaaa tgctgagagc cttcatacca 26940
gcatgagacc aattcctaag agctgagtag tggctgctac ctgtactgtc tgtctaaatc 27000
cctagccaat tgcatttgtt ttattcaccg tggcccctgg tatgaactca ctaagaaagc 27060
atatagtttc tattaaactt tgcctgaagc ataaacccaa atgacatcta ttttgggaga 27120
tagttactaa gaacaagtct ctggaatgag ctttatttct caagcaaaag agatttcatt 27180
ctgccttcta caaaatcaac tgattttact cccataattt tcagaaatca tgacagatca 27240
gaggtcctgt atgcttctgg atttcgattt taaccctggg ccagtctagg ttttctagac 27300
tttagagtca cagaacacag agttttcaag atccatcaca gctacacagg ttatatgcag 27360
gatttgccac atcacattat catgtgaatt cttaaagctt aagagtaatt gttacataag 27420
tttataatcc taagacattc ctgctatgtg gaaatgaatg gcatagatat gattctcagc 27480
taaaaggatt aataaaatcc aatctgcaga tacttgaaac aacggaagtt tttgagtcat 27540
atgccagatt cacttcattt actaaggtta tcttgttatt ggactggcag ctggaacaag 27600
tatctgtaaa atattcattt tatctgcatt ctgccttgtt ccacaaaaaa gtcttgatgt 27660
agtttttcaa gtggagcaat tacaacctaa agcctatttt tcgaactgaa atttatatac 27720
atttttagct acttatttat tctagagaca aatttattgt ttagagtttc ccctgccatt 27780
tttttcatac aattttaagc atctcaaatg tttggcacaa tttaatacgc cacagtgcat 27840
caagatgtcc ttgtagttta attcagttaa gtgcaacaaa catttgctaa atgcatacag 27900
tggggtaggc accacactca cattagatat accaatatga gtcttcgtcc tttagaagct 27960
gagagactaa tggaaaaaac agaatgtcat tgcagtgaac aagttctaca gtagtggagg 28020
caatagctcc acttgtccca gagactgaga caggtatcaa aggcttctga agatgaaatc 28080
acctgggatt agccttaaaa gacagataga tattagctag ggcagggtag ttttagcaga 28140
agggcagcct gagtgagtaa aagcatggaa gacagaatat gtttacttaa agaattgtat 28200
gcatttccac attagcagga ttgctgcttt ggttctctgt tcacatctca aatatgtgta 28260
atggcagtgg aaagtcagaa gaaccaaact ttaggctcac tttatttccc cacatttgtg 28320
caagtgaagt tattaaatgt cttagtatgt tagtgagaca agttatgaat tctgactgca 28380
cctcacagaa aacataggaa aacacattat taaagattat ttaaaatgct ttatttctac 28440
ttttatagaa tatggctcta aattagttta taagccaaag gcataagagg ttaaaatgac 28500
agtaccatct caacaagaac taatgatgta aaggagtaat tagagtataa attgttttaa 28560
ccttctaaaa gtgcacatga tctgtgattg gtgaaaaatg agaataagcg aatctgagtc 28620
agctggccac tgtggcatgc atatgtgacc cactagccta tttcccacag gagaatgttt 28680
gagatgcaca gttcctgtgg tgcccaaata gaagaaggct ggaaaagctc tgcttctgga 28740
agagcaaggg ctcccctctc cctttcatgc agtttctagg agcaacataa attcaacctt 28800
ccaaccagga aaagtggagc atcgggttta ctggagaaaa ctagcccagt gcccttcttt 28860
tacaccctag aaccagagag gaacttggcc ataagctttt gtgcagactt ctccttgggg 28920
gaaaaaaaaa gtcattattt aaaaagacat gacagactta gacacatgcc ttaaatttta 28980
acatgcatat gtgattcaac ttatcattta ctggcttcac attatatttt gcctctatac 29040
aagtttggct gtttgtttct tatctctgta gaaactagga gcagagcaat tatatttatt 29100
ctttacctaa ggcttttaga atagatattc taagaaattc tgtatttttc tttacacaaa 29160
acttgacaat agagctaata tgtaaggaga gtcctttcgt ttcctactaa ttacattcaa 29220
gaacaactct gcaagaatgt agaatcctaa aatgtatact gtgcattaat ttcctgttgt 29280
gtttaaacat aactatgtct catatttcgg tcttgtattt tttttactat aatccttcta 29340
gagacaagtg atcaatgaga atctgttcac caaaccaaat gtggaaagaa cacaaagaag 29400
acataagact tcagtcaagt gaaaaattaa catgtggact ggacactcca ataaattata 29460
tacctgccta agttgtacaa tttcagaatg caattttcat tataatgagt tccagtgact 29520
caatgatggg gaaaaaaatc tctgctcatt aatatttcaa gataaagaac aaatgtttcc 29580
ttgaatgctt gcttttgtgt gttagcataa tttttagaat tgtttgagaa ttctgatcca 29640
aaactttagt tgaattcatc tacgtttgtt taatattaac ttaacctatt ctattgtatt 29700
ataatgatga ttctgtcaaa tgaaaggctt gaaataccta gatgaagttt agattttctt 29760
cctattgtaa acttttgagt ctggtttcat tgttttaaat aaattaaggg gacactaaag 29820
tcctatcatt catttccttc attgctgaac aggcaagata taatattaca tgaatgatta 29880
ctatattttg ttcacactaa taaagcttat gctcagaaat gccatacaca cacacaaaca 29940
cacacattta tcatttaatg cataaatcaa cacaaaaggt tttcccatta atatgaaata 30000
ttacatatat ataagtgcca tatttaaaat aatttgtcta acagtagaac tatgtcggag 30060
cactcactga agcttgcatt ccactgaaag agttatttgt gtaagtagag tatccggaga 30120
aggaaaagaa cttacgacct ttctttataa cagaaactca actctaaatt caacaagatg 30180
tgcaaaccgg acatgcaggt gaatatttta ataggttact ataaggttct caattaaatt 30240
ctttaatctg tccagtccca gtttctctta ttaataaaac tttggaaatt gctttaaacc 30300
atttaaagga aatttctaga tatagaaact aaggactgtg actatacagc tgtcactcat 30360
ttgtagtaaa acttaaaaag caaaaacaaa aaacaaaaaa gaccttcctg tgatacttta 30420
tttccgaact aataaaaatc tatatgactt tttattattg tgtgataacc aagtaaatgt 30480
tttctatttt gcatattttc aggcatggta acagaaattt accttttaat aaattaaaaa 30540
atctaaattt taacctactt gtatgttcgg agagtgtttt tgtactatat tgactactta 30600
aaatagagaa tgagactaag aagggaacat ttctgttgat acatgttttt taaaagaaat 30660
tttaagagca ttattaggtt aattttaatc caattaatga cccaaatgcc aaggtaattt 30720
taaatttaca tttttaataa aagcaacatg ttgaaacaag agagggtgag attaaccttt 30780
ttgctaaagt aatttacaag tcaaagacag gaagagatca gagtgaatgt gccttcttaa 30840
ccagagctac agaatttagt gaataattaa agtacaaact gctttgacct ccttgaactt 30900
ttccaagcaa tttctctgta cttctatata tgaatgtctt agccaatttt ctgctactat 30960
aacagaatac gacagactgg gtaatttaaa aagaaaagaa atttattttc ttcctagttc 31020
tggaggctgg gaaggcgaag ggcatggcac tgacatctgc cttgtaactg atgagaacct 31080
tcttactgca tgataacaaa gcagcaaggc aagcaaaagc gtaagatgaa gagagaggaa 31140
atgaagccaa acacatcctt tcatcagaag cccattccct ctataaggcg ttactacatt 31200
tatgagaatg gagtcctcat gacctaatcg tgaccttaaa ggcccctccc aacactgtta 31260
caatggcaat taaatttcaa caaaggttcc agaggtgaca ttcgaatcag caatgaaatt 31320
ttcatagtta aatttggtat tcgtggggga agaaatgacc atttcccttg tatttttata 31380
attaaatcag caaaatattg taataaagaa atctttcctg tgaagatacc atgacccc 31438
<210> 43
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 43
uguccca 7
<210> 44
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 44
augccca 7
<210> 45
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 45
gaguccc 7
<210> 46
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 46
gccaugc 7
<210> 47
<211> 6
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 47
cguaau 6
<210> 48
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 48
acuuaca 7
<210> 49
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 49
ccgguca 7
<210> 50
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 50
ugaugga 7
<210> 51
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 51
uugacug 7
<210> 52
<211> 6
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 52
aggggc 6
<210> 53
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 53
ggcauau 7
<210> 54
<211> 8
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 54
aacgugac 8
<210> 55
<211> 7
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 55
ugaaaua 7
<210> 56
<211> 80
<212> DNA
<213> 土拨鼠肝炎病毒
<400> 56
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 60
ggcactgaca attccgtggt 80
<210> 57
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> 可能存在或可能不存在
<400> 57
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 58
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> 可能存在或可能不存在
<400> 58
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 59
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> 可能存在或可能不存在
<400> 59
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 60
<211> 25
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
<220>
<221> MISC_FEATURE
<222> (1)..(3)
<223> 可能存在或可能不存在
<400> 60
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 61
<211> 7683
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 61
gtcgacggat cgggagatct cccgatcccc tatggtgcac tctcagtaca atctgctctg 60
atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc gctgagtagt 120
gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc atgaagaatc 180
tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 240
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 300
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 360
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 420
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 480
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 540
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 600
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 660
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 720
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 780
gcggtaggcg tgtacggtgg gaggtctata taagcagcgc gttttgcctg tactgggtct 840
ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 900
aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 960
tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtggc 1020
gcccgaacag ggacttgaaa gcgaaaggga aaccagagga gctctctcga cgcaggactc 1080
ggcttgctga agcgcgcacg gcaagaggcg aggggcggcg actggtgagt acgccaaaaa 1140
ttttgactag cggaggctag aaggagagag atgggtgcga gagcgtcagt attaagcggg 1200
ggagaattag atcgcgatgg gaaaaaattc ggttaaggcc agggggaaag aaaaaatata 1260
aattaaaaca tatagtatgg gcaagcaggg agctagaacg attcgcagtt aatcctggcc 1320
tgttagaaac atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga 1380
caggatcaga agaacttaga tcattatata atacagtagc aaccctctat tgtgtgcatc 1440
aaaggataga gataaaagac accaaggaag ctttagacaa gatagaggaa gagcaaaaca 1500
aaagtaagac caccgcacag caagcggccg gccgctgatc ttcagacctg gaggaggaga 1560
tatgagggac aattggagaa gtgaattata taaatataaa gtagtaaaaa ttgaaccatt 1620
aggagtagca cccaccaagg caaagagaag agtggtgcag agagaaaaaa gagcagtggg 1680
aataggagct ttgttccttg ggttcttggg agcagcagga agcactatgg gcgcagcgtc 1740
aatgacgctg acggtacagg ccagacaatt attgtctggt atagtgcagc agcagaacaa 1800
tttgctgagg gctattgagg cgcaacagca tctgttgcaa ctcacagtct ggggcatcaa 1860
gcagctccag gcaagaatcc tggctgtgga aagataccta aaggatcaac agctcctggg 1920
gatttggggt tgctctggaa aactcatttg caccactgct gtgccttgga atgctagttg 1980
gagtaataaa tctctggaac agatttggaa tcacacgacc tggatggagt gggacagaga 2040
aattaacaat tacacaagct taatacactc cttaattgaa gaatcgcaaa accagcaaga 2100
aaagaatgaa caagaattat tggaattaga taaatgggca agtttgtgga attggtttaa 2160
cataacaaat tggctgtggt atataaaatt attcataatg atagtaggag gcttggtagg 2220
tttaagaata gtttttgctg tactttctat agtgaataga gttaggcagg gatattcacc 2280
attatcgttt cagacccacc tcccaacccc gaggggaccc gacaggcccg aaggaataga 2340
agaagaaggt ggagagagag acagagacag atccattcga ttagtgaacg gatcggcact 2400
gcgtgcgcca attctgcaga caaatggcag tattcatcca caattttaaa agaaaagggg 2460
ggattggggg gtacagtgca ggggaaagaa tagtagacat aatagcaaca gacatacaaa 2520
ctaaagaatt acaaaaacaa attacaaaaa ttcaaaattt tcgggtttat tacagggaca 2580
gcagagatcc agtttggtta gtaccgggcc cgctctagcg tgaggctccg gtgcccgtca 2640
gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg tcggcaattg 2700
aaccggtgcc tagagaaggt ggcgcggggt aaactgggaa agtgatgtcg tgtactggct 2760
ccgccttttt cccgagggtg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt 2820
tctttttcgc aacgggtttg ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg 2880
gcctggcctc tttacgggtt atggcccttg cgtgccttga attacttcca cctggctgca 2940
gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt cgaggccttg 3000
cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg 3060
ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata agtctctagc 3120
catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata gtcttgtaaa 3180
tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg gcgacggggc 3240
ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc caccgagaat 3300
cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg cgccgccgtg 3360
tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt gagcggaaag 3420
atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga 3480
gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc 3540
atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct cgagcttttg 3600
gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc cccacactga 3660
gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct tggaatttgc 3720
cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc aaagtttttt 3780
tcttccattt caggtgtcgt gagcggccgc tgagttaact attctagacc cgggctagga 3840
tccgcccctc tccctccccc ccccctaacg ttactggccg aagccgcttg gaataaggcc 3900
ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc aatgtgaggg 3960
cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc cctctcgcca 4020
aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa 4080
gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct ggcgacaggt 4140
gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca caaccccagt 4200
gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca agcgtattca 4260
acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat ctggggcctc 4320
ggtacacatg ctttacatgt gtttagtcga ggttaaaaaa acgtctaggc cccccgaacc 4380
acggggacgt ggttttcctt tgaaaaacac gatgataata tggccacaac catggtgagc 4440
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 4500
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 4560
accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 4620
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 4680
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 4740
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 4800
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 4860
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4920
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4980
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 5040
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 5100
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta aagcggccgc 5160
atcgataccg tcgacctcga tcgagaccta gaaaaacatg gagcaatcac aagtagcaat 5220
acagcagcta ccaatgctga ttgtgcctgg ctagaagcac aagaggagga ggaggtgggt 5280
tttccagtca cacctcaggt acctttaaga ccaatgactt acaaggcagc tgtagatctt 5340
agccactttt taaaagaaaa ggggggactg gaagggctaa ttcactccca acgaagacaa 5400
gatatccttg atctgtggat ctaccacaca caaggctact tccctgattg gcagaactac 5460
acaccagggc cagggatcag atatccactg acctttggat ggtgctacaa gctagtacca 5520
gttgagcaag agaaggtaga agaagccaat gaaggagaga acacccgctt gttacaccct 5580
gtgagcctgc atgggatgga tgacccggag agagaagtat tagagtggag gtttgacagc 5640
cgcctagcat ttcatcacat ggcccgagag ctgcatccgg actgtactgg gtctctctgg 5700
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 5760
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 5820
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag catgtgagca 5880
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 5940
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 6000
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 6060
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 6120
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6180
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6240
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6300
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6360
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6420
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6480
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6540
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 6600
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 6660
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 6720
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 6780
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 6840
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 6900
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 6960
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 7020
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 7080
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 7140
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 7200
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 7260
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 7320
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 7380
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 7440
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 7500
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 7560
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 7620
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 7680
gac 7683
<210> 62
<211> 7503
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 62
gtcgacggat cgggagatct cccgatcccc tatggtgcac tctcagtaca atctgctctg 60
atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc gctgagtagt 120
gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc atgaagaatc 180
tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 240
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 300
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 360
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 420
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 480
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 540
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 600
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 660
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 720
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 780
gcggtaggcg tgtacggtgg gaggtctata taagcagcgc gttttgcctg tactgggtct 840
ctctggttag accagatctg agcctgggag ctctctggct aactagggaa cccactgctt 900
aagcctcaat aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac 960
tctggtaact agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtggc 1020
gcccgaacag ggacttgaaa gcgaaaggga aaccagagga gctctctcga cgcaggactc 1080
ggcttgctga agcgcgcacg gcaagaggcg aggggcggcg actggtgagt acgccaaaaa 1140
ttttgactag cggaggctag aaggagagag atgggtgcga gagcgtcagt attaagcggg 1200
ggagaattag atcgcgatgg gaaaaaattc ggttaaggcc agggggaaag aaaaaatata 1260
aattaaaaca tatagtatgg gcaagcaggg agctagaacg attcgcagtt aatcctggcc 1320
tgttagaaac atcagaaggc tgtagacaaa tactgggaca gctacaacca tcccttcaga 1380
caggatcaga agaacttaga tcattatata atacagtagc aaccctctat tgtgtgcatc 1440
aaaggataga gataaaagac accaaggaag ctttagacaa gatagaggaa gagcaaaaca 1500
aaagtaagac caccgcacag caagcggccg gccgctgatc ttcagacctg gaggaggaga 1560
tatgagggac aattggagaa gtgaattata taaatataaa gtagtaaaaa ttgaaccatt 1620
aggagtagca cccaccaagg caaagagaag agtggtgcag agagaaaaaa gagcagtggg 1680
aataggagct ttgttccttg ggttcttggg agcagcagga agcactatgg gcgcagcgtc 1740
aatgacgctg acggtacagg ccagacaatt attgtctggt atagtgcagc agcagaacaa 1800
tttgctgagg gctattgagg cgcaacagca tctgttgcaa ctcacagtct ggggcatcaa 1860
gcagctccag gcaagaatcc tggctgtgga aagataccta aaggatcaac agctcctggg 1920
gatttggggt tgctctggaa aactcatttg caccactgct gtgccttgga atgctagttg 1980
gagtaataaa tctctggaac agatttggaa tcacacgacc tggatggagt gggacagaga 2040
aattaacaat tacacaagct taatacactc cttaattgaa gaatcgcaaa accagcaaga 2100
aaagaatgaa caagaattat tggaattaga taaatgggca agtttgtgga attggtttaa 2160
cataacaaat tggctgtggt atataaaatt attcataatg atagtaggag gcttggtagg 2220
tttaagaata gtttttgctg tactttctat agtgaataga gttaggcagg gatattcacc 2280
attatcgttt cagacccacc tcccaacccc gaggggaccc gacaggcccg aaggaataga 2340
agaagaaggt ggagagagag acagagacag atccattcga ttagtgaacg gatcggcact 2400
gcgtgcgcca attctgcaga caaatggcag tattcatcca caattttaaa agaaaagggg 2460
ggattggggg gtacagtgca ggggaaagaa tagtagacat aatagcaaca gacatacaaa 2520
ctaaagaatt acaaaaacaa attacaaaaa ttcaaaattt tcgggtttat tacagggaca 2580
gcagagatcc agtttggtta gtaccgggcc cgctctagcg tgaggctccg gtgcccgtca 2640
gtgggcagag cgcacatcgc ccacagtccc cgagaagttg gggggagggg tcggcaattg 2700
aaccggtact ggcctggcca acatagtgaa accccatctc tcctaataat acaaaaatta 2760
gccaggcatg gtggcgggtg cctgtaatcc cagctactca ggagactgag gcaggataat 2820
cacttgaacc cagcaggtgg aggctgcagt gagccaagat cgtgccactg cactccagcc 2880
tgggtgacag agcaagacta catctcaaaa aaaaaaaaaa aaaaaaaaag aagatagatg 2940
accaacaagt ttatgaaaat atgctcaaca tcagtggtca cagggaaatg caaatcaaaa 3000
ccataacaag ataccacttc acacccacac ccagtaggat ggcgcgatcg cagaacccca 3060
gaagatgcca ggagggagtg agccagtcag ggaaggcttc cgagaagaga ggacattgaa 3120
gaagagtctc aaacttaggc ctgacggaga agacgcgcgg ccaggacacc ccacccccgc 3180
cctcgtctcc cccaaagcct gatctggccc cactgattcc cttatctgcc cactcccagc 3240
tgcctccttg ctggctgaac tgtcgccgca gacttctgag cctgcgcccc ctccacgggg 3300
atgggggagg gaatggggtg aggcctggcc tcacagcctc ggggtttcca gctcttgctg 3360
gaggcagggc tctggggcgc cctactcctc acccttggct tctcttcctg agcgctctgt 3420
gctctccaga gctagcatgg cgggcaagaa gttgaggcca ctgtccctgg gtgttcctac 3480
ccccacaccc tcaccccaag acagcctgtt actgcggcgc caacagccac ggtcgcctac 3540
atctgataag acttatctgc tgccccaggg caggccggag ctggcgtaag ccccagtggg 3600
gcgctaagtg agtgtgcccc tgcctcccgc cagcactggc ctggcctgca ggcttagcct 3660
gggtcatcaa ggtatcccac aggctctagt tcaaatccag cagaacctct ctgagcctca 3720
ctcttctcac ctgcaaaatg ggtacagcca catcccttct ctccctgcag ccaggaagac 3780
gcacatacac aggagtctag cccacaccgg ccccgcacaa attaagggct ttactctctg 3840
aaaagcccag tgaagtcatg aaaccatatc tgctattttc atttatcttg gtttcagcct 3900
attttgcttg tctggacact acagtccacg ggagcctagg tcgagcgagg tccaagaatc 3960
cccagggtgg gcagggaggg tggaagaggg cctccagtgc ccaagaggtg ccccacaagc 4020
atgggacccg ccccctcccc tggactgccc cacccactgg ggcaccagcc actccctggg 4080
gaggagggag gagggagaag ggagggaggg agggagggag gaagggagcc tcaaaggcca 4140
aggccagcca ggacaccccc tgggatcaca ctgagcttgc cacatcccca aggcggccga 4200
accctccgca accaccagcc cagagatcta gagttaatcc ccagaggctc catggtgagc 4260
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 4320
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 4380
accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 4440
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 4500
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 4560
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 4620
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 4680
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4740
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4800
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 4860
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 4920
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta aagcggccgc 4980
atcgataccg tcgacctcga tcgagaccta gaaaaacatg gagcaatcac aagtagcaat 5040
acagcagcta ccaatgctga ttgtgcctgg ctagaagcac aagaggagga ggaggtgggt 5100
tttccagtca cacctcaggt acctttaaga ccaatgactt acaaggcagc tgtagatctt 5160
agccactttt taaaagaaaa ggggggactg gaagggctaa ttcactccca acgaagacaa 5220
gatatccttg atctgtggat ctaccacaca caaggctact tccctgattg gcagaactac 5280
acaccagggc cagggatcag atatccactg acctttggat ggtgctacaa gctagtacca 5340
gttgagcaag agaaggtaga agaagccaat gaaggagaga acacccgctt gttacaccct 5400
gtgagcctgc atgggatgga tgacccggag agagaagtat tagagtggag gtttgacagc 5460
cgcctagcat ttcatcacat ggcccgagag ctgcatccgg actgtactgg gtctctctgg 5520
ttagaccaga tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct 5580
caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 5640
aactagagat ccctcagacc cttttagtca gtgtggaaaa tctctagcag catgtgagca 5700
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 5760
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 5820
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 5880
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 5940
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 6000
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 6060
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 6120
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 6180
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 6240
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 6300
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 6360
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 6420
tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 6480
agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 6540
tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 6600
acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 6660
tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 6720
ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 6780
agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 6840
tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 6900
acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 6960
agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 7020
actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 7080
tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 7140
gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 7200
ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 7260
tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 7320
aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 7380
tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 7440
tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 7500
gac 7503
<210> 63
<211> 592
<212> DNA
<213> 土拨鼠肝炎病毒
<400> 63
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tg 592
<210> 64
<211> 333
<212> PRT
<213> 智人
<400> 64
Met Glu Gly Ile Pro Gly Gly Ser Pro Tyr Ala Gly Trp Ala Tyr Gly
1 5 10 15
Lys Thr Gly Leu Tyr Pro Ala Ser Thr Val Cys Pro Thr Arg Glu Asp
20 25 30
Ser Pro Pro Gln Ala Val Glu Asp Leu Asp Gly Lys Gly Ser Thr Ser
35 40 45
Phe Leu Glu Thr Leu Lys Thr Glu Arg Leu Ser Pro Asp Leu Leu Thr
50 55 60
Leu Gly Pro Ala Leu Pro Ser Ser Leu Pro Val Pro Asn Ser Ala Tyr
65 70 75 80
Gly Gly Pro Asp Phe Ser Ser Thr Phe Phe Ser Pro Thr Gly Ser Pro
85 90 95
Leu Asn Ser Ala Ala Tyr Ser Ser Pro Lys Leu Arg Gly Thr Leu Pro
100 105 110
Leu Pro Pro Cys Glu Ala Arg Glu Cys Val Asn Cys Gly Ala Thr Ala
115 120 125
Thr Pro Leu Trp Arg Arg Asp Arg Thr Gly His Tyr Leu Cys Asn Ala
130 135 140
Cys Gly Leu Tyr His Lys Met Asn Gly Gln Asn Arg Pro Leu Ile Arg
145 150 155 160
Pro Lys Lys Arg Leu Ile Val Ser Lys Arg Ala Gly Thr Gln Cys Thr
165 170 175
Asn Cys Gln Thr Thr Thr Thr Thr Leu Trp Arg Arg Asn Ala Ser Gly
180 185 190
Asp Pro Val Cys Asn Ala Cys Gly Leu Tyr Tyr Lys Leu His Gln Pro
195 200 205
Pro Phe Trp Gln Val Asn Arg Pro Leu Thr Met Arg Lys Asp Gly Ile
210 215 220
Gln Thr Arg Asn Arg Lys Ala Ser Gly Lys Gly Lys Lys Lys Arg Gly
225 230 235 240
Ser Ser Leu Gly Gly Thr Gly Ala Ala Glu Gly Pro Ala Gly Gly Phe
245 250 255
Met Val Val Ala Gly Gly Ser Gly Ser Gly Asn Cys Gly Glu Val Ala
260 265 270
Ser Gly Leu Thr Leu Gly Pro Pro Gly Thr Ala His Leu Tyr Gln Gly
275 280 285
Leu Gly Pro Val Val Leu Ser Gly Pro Val Ser His Leu Met Pro Phe
290 295 300
Pro Gly Pro Leu Leu Gly Ser Pro Thr Gly Ser Phe Pro Thr Gly Pro
305 310 315 320
Met Pro Pro Thr Thr Ser Thr Thr Val Val Ala Pro Leu
325 330
<210> 65
<211> 330
<212> PRT
<213> 智人
<400> 65
Met Glu Gly Ile Pro Gly Gly Ser Pro Tyr Ala Gly Trp Ala Tyr Gly
1 5 10 15
Lys Thr Gly Leu Tyr Pro Ala Ser Thr Val Cys Pro Thr Arg Glu Asp
20 25 30
Ser Pro Pro Gln Ala Val Glu Asp Leu Asp Gly Lys Gly Ser Thr Ser
35 40 45
Phe Leu Glu Thr Leu Lys Thr Glu Arg Leu Ser Pro Asp Leu Leu Thr
50 55 60
Leu Gly Pro Ala Leu Pro Ser Ser Leu Pro Val Pro Asn Ser Ala Tyr
65 70 75 80
Gly Gly Pro Asp Phe Ser Ser Thr Phe Phe Ser Pro Thr Gly Ser Pro
85 90 95
Leu Asn Ser Ala Ala Tyr Ser Ser Pro Lys Leu Arg Gly Thr Leu Pro
100 105 110
Leu Pro Pro Cys Glu Ala Arg Glu Cys Val Asn Cys Gly Ala Thr Ala
115 120 125
Thr Pro Leu Trp Arg Arg Asp Arg Thr Gly His Tyr Leu Cys Asn Ala
130 135 140
Cys Gly Leu Tyr His Lys Met Asn Gly Gln Asn Arg Pro Leu Ile Arg
145 150 155 160
Pro Lys Lys Arg Leu Ile Val Ser Lys Arg Ala Gly Thr Gln Cys Thr
165 170 175
Asn Cys Gln Thr Thr Thr Thr Thr Leu Trp Arg Arg Asn Ala Ser Gly
180 185 190
Asp Pro Val Cys Asn Ala Cys Gly Leu Tyr Tyr Lys Leu His Gln Val
195 200 205
Asn Arg Pro Leu Thr Met Arg Lys Asp Gly Ile Gln Thr Arg Asn Arg
210 215 220
Lys Ala Ser Gly Lys Gly Lys Lys Lys Arg Gly Ser Ser Leu Gly Gly
225 230 235 240
Thr Gly Ala Ala Glu Gly Pro Ala Gly Gly Phe Met Val Val Ala Gly
245 250 255
Gly Ser Gly Ser Gly Asn Cys Gly Glu Val Ala Ser Gly Leu Thr Leu
260 265 270
Gly Pro Pro Gly Thr Ala His Leu Tyr Gln Gly Leu Gly Pro Val Val
275 280 285
Leu Ser Gly Pro Val Ser His Leu Met Pro Phe Pro Gly Pro Leu Leu
290 295 300
Gly Ser Pro Thr Gly Ser Phe Pro Thr Gly Pro Met Pro Pro Thr Thr
305 310 315 320
Ser Thr Thr Val Val Ala Pro Leu Ser Ser
325 330
<210> 66
<211> 587
<212> DNA
<213> 未知
<220>
<223> 未知的描述:
内部核糖体进入位点
<400> 66
cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat aaggccggtg 60
tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 120
gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 180
aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 240
aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 300
ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 360
cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 420
ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggta 480
cacatgcttt acatgtgttt agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aaacacgatg ataatatggc cacaacc 587
<210> 67
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 67
gagtccatct gataagactt atctgctgcc ccccagagca ggccagagct ggcgta 56
<210> 68
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 68
ccgctgattc ccttatctat gccttcccag 30
<210> 69
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 69
cggcacaccc cctcccctgc actgccccac ccactg 36

Claims (35)

1.一种核酸序列,所述核酸序列包含
a.至少一个异源调控序列,所述异源调控序列选自于造血增强子元件和用于HSC限制性miRNA的miRNA结合位点;以及
b.编码GATA结合因子1(GATA1)多肽的序列。
2.如权利要求1所述的核酸序列,所述核酸序列包含至少一个造血增强子元件。
3.如权利要求2所述的核酸序列,其中,所述增强子元件包含与选自于由以下序列所组成的组中的核苷酸序列具有至少80%同源性的序列:SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:38和/或SEQ ID NO:39。
4.如权利要求2所述的核酸序列,其中,所述增强子元件包含选自于由以下所组成的组的基因的增强子元件:
Kell金属内肽酶(KEL);5'氨基乙酰丙酸合酶2(ALAS2);和血型糖蛋白A(GYPA)。
5.如权利要求1-4中任一项所述的核酸序列,所述核酸序列包含用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
6.如权利要求1-5中任一项所述的核酸序列,其中,所述用于至少一个HSC限制性miRNA的至少一个miRNA结合位点选自于由用于以下的miR结合位点所组成的组:miR10aT、miR125、miR155、miR130aT、miR142T、miR196bT、miR99、miR126miR126、miR181、miR193、miR223T、miR542和let7e。
7.如权利要求1-6中任一项所述的核酸序列,所述核酸序列包含至少一个造血增强子元件以及用于至少一个HSC限制性miRNA的至少一个miRNA结合位点。
8.如权利要求1-7中任一项所述的核酸序列,所述核酸序列进一步包含:
a.异源5'UTR,所述异源5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列,
ii.至少20个核苷酸的序列,和/或
iii.1-25个上游密码子uAUG;和/或
b.造血增强子微小基因。
9.一种核酸序列,所述核酸序列包含:
a.5'UTR,所述5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列,
ii.至少20个核苷酸的序列,和/或
iii.1-25个上游密码子uAUG;
b.编码GATA结合因子1(GATA1)多肽的序列。
10.如权利要求1-9中任一项所述的核酸序列,其中,所述5'UTR包含选自于由以下所组成的组的基因的5'UTR:Runt相关转录因子1(RUNX1)、LIM Domain Only 2(LMO2)或ETS变体6(ETV6)。
11.如权利要求1-10中任一项所述的核酸序列,所述核酸序列进一步包含至少一个造血增强子元件、用于HSC限制性miRNA的miRNA结合位点和/或造血增强子微小基因(G1HEM)。
12.一种核酸序列,所述核酸序列包含
a.造血增强子微小基因(G1HEM);
b.编码GATA结合因子1(GATA1)多肽的序列。
13.如权利要求12所述的核酸序列,其中,所述造血增强子微小基因(mG1HEM)包含与核苷酸序列SEQ ID NO:13具有至少80%同源性的序列。
14.如权利要求12-13中任一项所述的核酸序列,所述核酸序列进一步包含5'UTR、和/或至少一个造血增强子元件、和/或用于HSC限制性miRNA的至少一个miRNA结合位点,
所述5'UTR包含:
i.除GATA1以外的造血转录因子的5'UTR序列;
ii.至少20个核苷酸的序列;和/或
iii.1-25个上游密码子uAUG。
15.如权利要求14所述的核酸序列,其中,所述除GATA1以外的造血转录因子的5'UTR序列为选自于由以下所组成的组的基因的5'UTR序列:Runt相关转录因子1(RUNX1);
至少一个造血增强子元件;
和/或用于HSC限制性miRNA的至少一个miRNA结合位点。
16.如权利要求1-15中任一项所述的核酸序列,其中,所述用于至少一个HSC限制性miRNA的结合位点包含选自于SEQ ID NO:31-SEQ ID NO:37和SEQ ID NO:43-SEQ ID NO:55的序列。
17.如权利要求1-16中任一项所述的核酸序列,其中,所述造血增强子元件包含与选自于SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:38和SEQ ID NO:39的序列具有至少80%序列同一性的序列。
18.如权利要求1-17中任一项所述的核酸序列,其中,所述5'UTR序列包含与选自于SEQID NO:14、SEQ ID NO:15和SEQ ID NO:16的序列具有至少80%序列同一性的序列。
19.如权利要求1-18中任一项所述的核酸序列,其中,所述序列包含与a和b的元件可操作地连接的启动子。
20.如权利要求19所述的核酸序列,其中,所述启动子不为GATA1启动子。
21.如权利要求20所述的核酸序列,其中,所述启动子包含延伸因子1-α1(eEF1a1)的启动子序列。
22.如权利要求1-21中任一项所述的核酸序列,其中,所述编码GATA结合因子1(GATA1)多肽的序列包含与编码人GATA1多肽的核苷酸序列具有至少60%序列同一性的序列。
23.如权利要求1-22中任一项所述的核酸序列,所述核酸序列进一步包含:
与编码所述GATA1多肽的序列可操作地连接的转录后调控元件。
24.如权利要求23所述的核酸序列,其中,所述转录后调控元件包括土拨鼠肝炎病毒转录后调控元件(WPRE)。
25.如权利要求1-24中任一项所述的核酸序列,所述核酸序列进一步包含内部核糖体进入位点。
26.如权利要求25所述的核酸序列,其中,所述内部核糖体进入位点与标志物基因可操作地连接,并且其中,所述标志物基因编码光学可见的蛋白质或酶。
27.如权利要求1-26中任一项所述的核酸序列,其中,所述序列包含选自于SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:61和SEQ ID NO:62的序列。
28.如权利要求1-27中任一项所述的核酸序列,其中,所述核酸序列为载体。
29.如权利要求28所述的核酸序列,其中,所述载体为质粒、或腺病毒载体、慢病毒载体或逆转录病毒载体。
30.一种包含如权利要求1-30中任一项所述的核酸序列的慢病毒颗粒。
31.一种组合物,所述组合物包含如权利要求1-31中任一项所述的核酸序列或颗粒以及药学上可接受的运载体。
32.一种治疗有需要的受试者中的Diamond-Blackfan贫血的方法,所述方法包括向患者给予治疗有效量的如权利要求1-31中任一项所述的核酸序列、颗粒或组合物。
33.一种恢复早期红系祖细胞细胞特异性GATA1表达的方法,所述方法包括使包含早期红系祖细胞的细胞群与如权利要求1-31中任一项所述的核酸序列、颗粒或组合物接触。
34.如权利要求33所述的方法,其中,所述早期红系祖细胞包含DBA相关的基因突变。
35.如权利要求1-31中任一项所述的核酸序列、颗粒或组合物用于治疗有需要的受试者中的Diamond-Blackfan贫血的用途。
CN202080056795.1A 2019-06-10 2020-06-08 使用gata1基因疗法用于治疗dba的组合物和方法 Pending CN114207133A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962859369P 2019-06-10 2019-06-10
US62/859,369 2019-06-10
PCT/US2020/036600 WO2020251887A1 (en) 2019-06-10 2020-06-08 Compositions and methods for the treatment of dba using gata1 gene therapy

Publications (1)

Publication Number Publication Date
CN114207133A true CN114207133A (zh) 2022-03-18

Family

ID=73782081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080056795.1A Pending CN114207133A (zh) 2019-06-10 2020-06-08 使用gata1基因疗法用于治疗dba的组合物和方法

Country Status (6)

Country Link
US (1) US20220265863A1 (zh)
EP (1) EP3980543A4 (zh)
JP (1) JP2022536481A (zh)
CN (1) CN114207133A (zh)
CA (1) CA3140685A1 (zh)
WO (1) WO2020251887A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024026257A2 (en) * 2022-07-25 2024-02-01 Modernatx, Inc. Engineered polynucleotides for cell selective expression

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10240205B2 (en) * 2017-02-03 2019-03-26 Population Bio, Inc. Methods for assessing risk of developing a viral disease using a genetic test

Also Published As

Publication number Publication date
EP3980543A1 (en) 2022-04-13
EP3980543A4 (en) 2023-11-08
JP2022536481A (ja) 2022-08-17
CA3140685A1 (en) 2020-12-17
US20220265863A1 (en) 2022-08-25
WO2020251887A1 (en) 2020-12-17

Similar Documents

Publication Publication Date Title
US20230053915A1 (en) Directed editing of cellular rna via nuclear delivery of crispr/cas9
KR101541935B1 (ko) 합성 5&#39;utr, 발현 벡터, 및 전이유전자 발현의 증가방법
KR101666228B1 (ko) 생물치료학적 분자를 발현시키기 위한 치료학적 유전자-스위치 작제물 및 생물반응기, 및 이의 용도
EA030440B1 (ru) Сопровождающая диагностика для терапии антигиалуронановым агентом и способы ее применения
KR102652494B1 (ko) 전장 t-세포 수용체 오픈 리딩 프레임의 신속한 조립 및 다양화를 위한 2-성분 벡터 라이브러리 시스템
KR102516697B1 (ko) 조작된 캐스케이드 구성성분 및 캐스케이드 복합체
JP2024037917A (ja) 組換えt細胞受容体遺伝子を用いて細胞ベースの治療薬を製造するための技法
KR20230066000A (ko) 면역자극성 박테리아-기초 백신, 치료제, 및 rna 전달 플랫폼
CN112011574B (zh) 一种慢病毒载体、构建方法及其应用
KR20220013556A (ko) 인간 만능 줄기 세포로부터 미세아교세포의 신속하고 결정적인 생성
CN113652451B (zh) 慢病毒载体、构建方法及其应用
CN114207133A (zh) 使用gata1基因疗法用于治疗dba的组合物和方法
US11814412B2 (en) Artificial proteins and compositions and methods thereof
TW202308669A (zh) 嵌合共刺激性受體、趨化激素受體及彼等於細胞免疫治療之用途
CN114058607B (zh) 一种用于c到u碱基编辑的融合蛋白及其制备方法和应用
DK2921048T3 (en) SUS SCROFA V2G: SAFE HARBOR PLACE FOR LONG-TERM EXPRESSION AND HIGH INTEGRATION OF TRANSGENERS IN A PIG
RU2774631C1 (ru) Сконструированные компоненты cascade и комплексы cascade
NL2027815B1 (en) Genomic integration
KR20090106474A (ko) 혈청-불포함 재조합 단백질의 치료제로서의 제조를 위한 표적화된 프로모터 트랩 전략을 이용한 prp 유전자 세포의 유전적 제거
KR20130078069A (ko) 도파민 뉴런의 제조 방법
TW202309288A (zh) 調節基因表現之組合物及方法
EA046478B1 (ru) Быстрая и детерминистическая генерация микроглии из плюрипотентных стволовых клеток человека
CN115247187A (zh) 表达三种人源基因的SARS-CoV-2易感模型猪的构建方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination