CN115151646A - 调节核酸序列 - Google Patents

调节核酸序列 Download PDF

Info

Publication number
CN115151646A
CN115151646A CN202080097425.2A CN202080097425A CN115151646A CN 115151646 A CN115151646 A CN 115151646A CN 202080097425 A CN202080097425 A CN 202080097425A CN 115151646 A CN115151646 A CN 115151646A
Authority
CN
China
Prior art keywords
seq
promoter
functional variant
crm
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080097425.2A
Other languages
English (en)
Inventor
乔治·奥马尔·亚尼兹库纳
胡安·曼努埃尔·伊格莱西亚斯
辛克莱·库珀
卡蒂·贝克
波利克塞妮·卡特索皮
林库·拉扬
伊利安娜·格里尼
安东尼娅·埃夫里皮奥蒂
基拉·穆拉欧
迈克尔·L·罗伯茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asklepios Biopharmaceutical Inc
Original Assignee
Asklepios Biopharmaceutical Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1919269.9A external-priority patent/GB201919269D0/en
Priority claimed from GBGB2012192.7A external-priority patent/GB202012192D0/en
Application filed by Asklepios Biopharmaceutical Inc filed Critical Asklepios Biopharmaceutical Inc
Publication of CN115151646A publication Critical patent/CN115151646A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及能够增强基因的肌肉特异性表达的调节核酸序列,特别是肌肉特异性启动子、其元件和其他此类核酸序列。本发明还涉及包含此类肌肉特异性调节核酸序列的表达构建体、载体和细胞,以及它们的使用方法。所述调节核酸序列对基因治疗应用特别有用,但也可用于其他领域,例如生物加工和生物技术。

Description

调节核酸序列
技术领域
本发明涉及能够增强基因的肌肉特异性表达的调节核酸序列,特别是肌肉特异性启动子、其元件和其他此类核酸序列。本发明还涉及包含此类肌肉特异性调节核酸序列的表达构建体、载体和细胞,以及它们的使用方法。调节核酸序列对基因治疗应用特别有用,但也可用于其他领域,例如生物加工和生物技术。
背景技术
提供以下讨论以帮助读者理解本公开,并不构成对现有技术的内容或相关性的任何承认。
在包括基因治疗在内的许多领域中,需要提供能够驱动基因表达以在所需细胞、组织或器官内产生蛋白质或核酸表达产物的调节核酸序列。
治疗性基因在肌肉中的表达对基因治疗很有吸引力。肌肉中的基因治疗有可能纠正或增强各种肌肉蛋白如肌营养不良蛋白和肌聚糖的表达。这可用于治疗肌营养不良症等病况,例如杜氏肌营养不良症(DMD)。肌肉也可以用作表达治疗性蛋白质以治疗其他病况的平台。
各种载体已用于将基因递送至肌肉细胞,例如腺病毒、逆转录病毒、慢病毒和腺相关病毒(AAV),以及非病毒载体,如质粒。腺病毒载体具有较大的克隆能力,可以有效地转导一些细胞。然而,鉴于它们往往会引发强烈的免疫反应,它们面临着巨大的挑战。逆转录病毒和慢病毒载体稳定地整合到基因组中,这既有好处也有坏处。慢病毒载体可以转导分裂细胞和非分裂细胞,但大多数常规逆转录病毒载体只能转导分裂细胞,这限制了它们在非分裂肌肉细胞中的应用。质粒DNA可用于在体外将基因转移到肌肉细胞,但它们在临床环境中的潜在用途尚不清楚。AAV载体对于肌肉中的基因治疗应用特别有吸引力。AAV载体表现出对肌肉细胞的天然趋向性,可以驱动治疗性有效载荷的长期表达,并引发最小的免疫反应。尽管一些基因治疗载体能够优先转导肌肉细胞,但确实会发生脱靶转导。已经报道了使用AAV血清型1、2和嵌合2.5治疗杜氏肌营养不良症(DMD)和α-1抗胰蛋白酶缺乏症的几项1期和2期临床试验(D.E.Bowles,S.WJ McPhee,C.Li,S.J.Gray,J.J.Samulski,A.S.Camp,J.Li,B.Wang,P.E.Monahan,J.E.Rabinowitz,J.C.Grieger,La.Govindasamy,M.Agbandje-McKenna,X.Xiao and R.J.Samulski,Molecular Therapy,20,443-455(2012);M.L.Brantly,J.D.Chulay,L.Wang,C.Mueller,M.Humphries,L.T.Spencer,F.Rouhani,T.J.Conlon,R.Calcedo,M.R.Berts,C.Spencer,B.J.Byrne,J.M.Wilson,T.R.Flotte,Sustained transgene expression despite T lymphocyte responses in a clinicaltrial of rAAVl-AAT gene therapy.Proceedings of the National Academy ofSciences of the United States of America 106,16363-16368(2009);T.R.Flotte,M.L.Brantly,L.T.Spencer,B.J.Byrne,C.T.Spencer,D.J.Baker,M.Humphries,Phase Itrial of intramuscular injection of a recombinant adeno-associated virusalpha 1-antitrypsin(rAAV2-CB-hAAT)gene vector to AAT-deficient adults.Humangene therapy 15,93-128(2004);T.R.Flotte,B.C.Trapnell,M.Humphries,B.Carey,R.Calcedo,F.Rouhani,M.Campbell-Thompson,A.T.Yachnis,R.A.Sandhaus,N.G.McElvaney,C.Mueller,L.M.Messina,J.M.Wilson,M.Brantly,D.R.Knop,G.J.Ye,J.D.Chulay,Phase 2clinical trial of a recombinant adeno-associated viralvector expressing alphal-antitrypsin:interim results.Human gene therapy 22,1239-1247(2011);C.Mueller,J.D.Chulay,B.C.Trapnell,M.Humphries,B.Carey,R.A.Sandhaus,N.G.McElvaney,L.Messina,Q.Tang,F.N.Rouhani,M.Campbell-Thompson,A.D.Fu,A.Yachnis,D.R.Knop,G.J.Ye,M.Brantly,R.Calcedo,S.Somanathan,L.P.Richman,R.H.Vonderheide,M.A.Hulme,T.M.Brusko,J.M.Wilson,T.R.Flotte,HumanTreg responses allow sustained recombinant adeno-associated virus-mediatedtransgene expression.The Journal of clinical investigation 123,5310-5318(2013))。
需要提供以肌肉特异性方式调节基因表达的系统。理想情况下,此类系统对肌肉具有高度特异性(从而避免或最小化非靶组织中的脱靶表达)并且功能强大,即它们在肌肉中驱动高表达水平。已提议使用顺式作用调节元件来提供特异性和活性。通常,这涉及顺式调节增强子序列,即以顺式作用以增加启动子活性的核酸序列。
各种肌肉特异性启动子是本领域已知的,通常从主要在肌肉中表达的基因获得,例如编码结蛋白(desmin)、骨骼肌动蛋白、心脏α-肌动蛋白、肌肉肌酸激酶(CKM)、肌球蛋白重链和轻链、和肌钙蛋白T/I。C5-12启动子代表已知的合成启动子。
需要短长度的调节序列来最小化调节序列占用的基因治疗载体的比例;这对于容量(有效载荷)有限的基因治疗载体(如AAV载体)尤为重要。此外,虽然希望提供强大的启动子,但在许多情况下,技术人员可能希望能够选择具有所需能力的合适启动子,例如来自一系列不同能力的启动子。
本领域仍然需要能够驱动肌肉特异性基因表达的调节核酸。特别地,需要肌肉特异性调节序列(例如启动子、顺式调节模块、顺式调节元件和最小或近端启动子元件),其可以并入表达构建体和载体中,用于所需基因(例如基因治疗背景下的治疗性转基因)的肌肉特异性表达。
发明内容
在本发明的第一方面,提供了:
a)合成的肌肉特异性启动子,其包含根据SEQ ID NO:1-137、342-367、424-453和478-509中任一个的序列或其功能变体,或由根据SEQ ID NO:1-137、342-367、424-453和478-509中任一个的序列或其功能变体组成;或者
b)合成的肌肉特异性启动子,其包含含有根据SEQ ID NO:138-269、369-394、454-461和510-532中任一个的序列的顺式调节模块(CRM)或其功能变体,或由含有根据SEQ IDNO:138-269、369-394、454-461和510-532中任一个的序列的顺式调节模块(CRM)或其功能变体组成。
在一些实施方案中,合成的肌肉特异性启动子包含与SEQ ID NO:1-137、342-367、424-453和478-509中任一个至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
在一些实施方案中,合成的肌肉特异性CRM包含与SEQ ID NO:138-269、369-394、454-461和510-532中任一个至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
在一些实施方案中,根据b)的合成的肌肉特异性启动子包含与启动子元件(通常是最小或近端启动子)可操作地连接的如上所述的CRM。近端启动子优选是肌肉特异性近端启动子。
因此,本发明提供了各种合成的肌肉特异性启动子及其功能变体。通常优选地,作为SEQ ID NO:1-137、342-367、424-453和478-509中任一个的变体的根据本发明的启动子保留参考启动子活性的至少25%、50%、75%、80%、85%、90%、95%或100%。适当地,使用如本文所述的实施例之一评估所述活性,但可以使用其他方法。
在本发明的另一方面,提供了一种肌肉特异性顺式调节元件(CRE),其包含根据SEQ ID NO:293-298、301-341、395-419、462-470和533-546中任一个的序列或其任何功能变体,或由根据SEQ ID NO:293-298、301-341、395-419、462-470和533-546中任一个的序列或其任何功能变体组成。在一些实施方案中,肌肉特异性CRE包含与SEQ ID NO:293-298、301-341、395-419、462-470和533-546中任一个至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
通常优选地,作为SEQ ID NO:293-298、301-341、395-419、462-470和533-546中任一个的变体的根据本发明的肌肉特异性CRE保留参考CRE活性的至少25%、50%、75%、80%、85%、90%、95%或100%。适当地,使用如本文所述的实施例之一评估所述活性,但可以使用其他方法。
CRE0033(SEQ ID NO:309)、CRE0090(SEQ ID NO:409)和CRE0096(SEQ ID NO:417)是优选的肌肉特异性CRE,并且已发现当与合适的启动子元件组合和/或当添加到合适的合成启动子时,其在心肌中提供显著的肌肉特异性增强子活性。
在本发明的另一方面,提供了包含本发明任何方面的CRE的合成启动子。
在本发明的另一方面,提供了包含根据SEQ ID NO:299的序列或其功能变体或由根据SEQ ID NO:299的序列或其功能变体组成的内含子。在本发明的另一方面,提供了包含所述内含子的合成启动子,适当地是包含所述内含子的合成的肌肉特异性启动子。适当地,功能变体包含与SEQ ID NO:299至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
在本发明的另一方面,提供了包含根据SEQ ID NO:368的序列或其功能变体或由根据SEQ ID NO:368的序列或其功能变体组成的调节元件(5’UTR和内含子)。在本发明的另一方面,提供了包含所述调节元件的合成启动子,适当地是包含所述调节元件的合成的肌肉特异性启动子。适当地,功能变体包含与SEQ ID NO:368至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
在本发明的另一方面,提供了包含根据SEQ ID NO:270-292、420-423、471-477和300中任一个的序列或其功能变体或由根据SEQ ID NO:270-292、420-423、471-477和300中任一个的序列或其功能变体组成的最小或近端启动子。在本发明的另一方面,提供了包含所述最小或近端启动子的合成启动子,适当地是包含所述最小或近端启动子的合成的肌肉特异性启动子。适当地,功能变体包含与SEQ ID NO:270-292、420-423、471-477和300至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
本发明的CRE、CRM、内含子、UTR、最小/近端启动子和启动子可以在各种肌肉组织(特别是但不仅限于骨骼肌和/或心肌)中具有活性。在至少一种肌肉组织类型或至少一种肌肉细胞类型中具有活性的CRE、CRM、启动子元件或启动子可称为“肌肉特异性”。为方便起见,肌肉特异性CRE、CRM、启动子元件或启动子可以进一步细分为亚型,具体取决于CRE、CRM、启动子元件或启动子是否主要在骨骼肌或心肌中有活性。
在一些实施方案中,本发明的顺式调节元件和启动子是骨骼肌特异性的。在一些实施方案中,本发明的顺式调节元件、CRM、启动子元件和启动子主要在骨骼肌中有活性,而在心肌中活性较低或无活性。这些CRE、CRM、启动子元件和启动子被称为“骨骼肌特异性”。
在一些实施方案中,本发明的顺式调节元件和启动子是心肌特异性的。在一些实施方案中,本发明的顺式调节元件、CRM、启动子元件和启动子主要在心肌中有活性,而在骨骼肌中活性较低或无活性。这些CRE、CRM、启动子元件和启动子被称为“心肌特异性”。
在一些实施方案中,在骨骼肌和心肌中均具有活性的肌肉特异性CRE、CRM、启动子元件和启动子是优选的。当骨骼肌和心脏(心肌)都需要启动子活性时,这些CRE、CRM、启动子元件和启动子可能是优选的。在骨骼肌和心肌中均具有活性的肌肉特异性启动子的实例包括SP0010、SP0020、SP0033、SP0038、SP0040、SP0042、SP0051、SP0057、SP0058、SP0061、SP0062、SP0064、SP0065、SP0066、SP0068、SP0070、SP0071、SP0076、SP0132、SP0133、SP0134,SP0136、SP0146、SP0147、SP0148、SP0150、SP0153、SP0155、SP0156、SP0157、SP0158、SP0159、SP0160、SP0161、SP0162、SP0163、SP0164、SP0165、SP0166、SP0169、SP0170、SP0171、SP0173、SP0228、SP0229、SP0230、SP0231、SP0232、SP0257、SP0262、SP0264、SP0265、SP0266、SP0267、SP0268、SP0270、SP0271、SP0279、SP0286、SP0305、SP0306、SP0307、SP0309、SP0310、SP0311、SP0312、SP0313、SP0314、SP0315、SP0316、SP0320、SP0322、SP0323、SP0324、SP0325、SP0326、SP0327、SP0328、SP0329、SP0330、SP0331、SP0332、SP0333、SP0334、SP0335、SP0336、SP0337、SP0338、SP0339、SP0340、SP0341、SP0343、SP0345、SP0346、SP0347、SP0348、SP0349、SP0350、SP0351、SP0352、SP0353、SP0354、SP0355、SP0356、SP0358、SP0359、SP0361、SP0362、SP0363、SP0364、SP0365、SP0366、SP0367、SP0368、SP0369、SP0370、SP0371、SP0372、SP0373、SP0374、SP0375,SP0376、SP0377、SP0378、SP0379、SP0380、SP0381、SP0382、SKM_14、SKM_18、SKM_20、SP0357、SP0437-SP0445、SP0447和SP0453-SP0471、473-474。在骨骼肌和心肌中均具有活性的优选的合成的肌肉特异性启动子的实例是SP0057、SP0134、SP0173、SP0279、SP0286、SP0310、SP0316、SP0320和SP0326。
在一些实施方案中,骨骼肌特异性CRE、CRM、启动子元件和启动子可能是优选的。当骨骼肌中需要启动子活性而心脏中(心肌中)需要很少启动子活性或不需要启动子活性时,这些CRE、CRM、启动子元件和启动子可能是优选的。合成的骨骼肌特异性启动子的实例包括SP0227、SP0069、SP0342、SP0407、SP0408、SP0409、SP0410、SP0411、SP0412、SP0413、SP0414、SP0415、SP0416、SP0417、SP0418、SP0419、SP0420、SP0421、SP0422、SP0423、SP0426、SP0427、SP0428、SP0431、SP0432、SP0060和SP0446。优选的合成的骨骼肌特异性启动子的实例是SP0227、SP0407和SP0418。骨骼肌特异性启动子可能在快速收缩的肌肉和/或缓慢收缩的肌肉中具有活性。在一些实施方案中,在快速收缩的肌肉中具有活性的骨骼肌特异性CRE、CRM、启动子元件和启动子可能是优选的。在一些实施方案中,在缓慢收缩的肌肉中具有活性的骨骼肌特异性CRE、CRM、启动子元件和启动子可能是优选的。在一些实施方案中,在缓慢收缩的肌肉和快速收缩的肌肉中均具有活性的骨骼肌特异性CRE、CRM、启动子元件和启动子可能是优选的。在快速收缩的肌肉中具有活性的骨骼肌特异性启动子的实例是SP0227、SP0419、SP0431和SP0432。在缓慢收缩的肌肉中具有活性的骨骼肌特异性启动子的实例是SP0409、SP0417和SP0418。
在一些实施方案中,心肌特异性CRE、CRM、启动子元件和启动子可能是优选的。当心脏中(心肌中)需要启动子活性而骨骼肌中需要很少启动子活性或不需要启动子活性时,这些CRE、CRM、启动子元件和启动子可能是优选的。合成的心肌特异性启动子的实例包括SP0435、SP0449、SP0450、SP0451、SP0475、SP0476、SP0477、SP0478、SP0479、SP0480、SP0481、SP0482、SP0484、SP0485、SP0486、SP0487、SP0488、SP0489、SP0490、SP0491、SP0492、SP0493、SP0494、SP0495、SP0067、SP0075、SP0424、SP0425、SP0429、SP0430、SP0433、SP0436、SP0452、SP0344、SP0483和SP0496。优选的合成的心肌特异性启动子的实例是SP0067、SP0433、SP0436、SP0452、SP0344和SP0483。
本发明的心肌特异性CRE、CRM、启动子元件和启动子可以在心脏的各种细胞中具有活性。心脏中的主要细胞类型是心脏中的心室心肌细胞、心房心肌细胞、心脏成纤维细胞或内皮细胞(EC),以及血管周围细胞和起搏细胞。此外,本发明的心肌特异性CRE、CRM、启动子元件和启动子可以在心脏的不同区域中具有活性,例如在以下心脏区域中的任何或所有区域中具有活性:主动脉弓动脉(AA);主动脉;心肌细胞(CM);内皮细胞或心内膜细胞(EC);下腔静脉(ICV);室间隔(IVS);左心房(LA);左上腔静脉(LSCV);左心室(LV);流出道(OT);肺动脉(PO);心外膜器官(PEO);肺静脉(PV);右心房(RA);右上腔静脉(RSCV);右心室(RV);上腔静脉(SCV);心肌平滑肌细胞(SM)。
在本发明的另一方面,提供了一种合成的肌肉特异性顺式调节模块(CRM),其包含两个或更多个可操作地连接的顺式调节元件(CRE),所述顺式调节元件选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体。
在一些实施方案中,合成的肌肉特异性CRM在骨骼肌和心肌中都有活性。在一些实施方案中,合成的肌肉特异性CRM在骨骼肌中有活性。在一些实施方案中,合成的肌肉特异性CRM在心肌中有活性。
在本发明的另一方面,提供了一种合成的肌肉特异性启动子,其包含:
a)肌肉特异性CRM,其包含选自CRE0035(SEQ ID NO:310)或其功能变体、CRE0071(SEQ ID NO:321)或其功能变体、CRE0020(SEQ ID NO:303)或其功能变体、CRE0031(SEQ IDNO:308)或其功能变体的组中的至少两个CRE;或
b)以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体;
可操作地连接至以下启动子元件中的至少一个:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
在一些实施方案中,合成的肌肉特异性启动子在骨骼肌和心肌中均有活性。在一些实施方案中,合成的肌肉特异性启动子在骨骼肌中有活性。在一些实施方案中,合成的肌肉特异性启动子在心肌中有活性。
在本发明的另一方面,提供了一种合成的肌肉特异性启动子,其包含两个或更多个可操作地连接的启动子元件,所述启动子元件选自由以下组成的组:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
在一些实施方案中,合成的肌肉特异性启动子在骨骼肌和心肌中均有活性。在一些实施方案中,合成的肌肉特异性启动子在骨骼肌中有活性。在一些实施方案中,合成的肌肉特异性启动子在心肌中有活性。
在本发明的另一方面,提供了一种合成的肌肉特异性顺式调节模块(CRM),其包含两个或更多个可操作地连接的顺式调节元件(CRE),所述顺式调节元件选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体。
在一些实施方案中,合成的肌肉特异性CRM在骨骼肌和心肌中都有活性。在一些实施方案中,合成的肌肉特异性CRM包含三个或更多个、四个或更多个或五个或更多个所述CRE。如下文更详细讨论的,已发现这些CRE有助于肌肉特异性启动子中存在的CRM的活性和肌肉特异性启动子的活性。
在一些实施方案中,本发明的合成的肌肉特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:CRE0035和CRE0036;CRE0035和CRE0029;CRE0035和CRE0071;CRE0035和CRE0020;CRE0035和CRE0031;CRE0036和CRE0029;CRE0036和CRE0071;CRE0020和CRE0036;CRE0036和CRE0031;CRE0029和CRE0071;CRE0029和CRE0020;CRE0029和CRE0031;CRE0020和CRE0071;CRE0071和CRE0031;以及CRE0020和CRE0031。
在本文公开的CRE或其功能变体的任何组合中,所述的CRE可以以任何顺序存在。在一些优选实施方案中,CRE以所述的顺序(即,以上游到下游的顺序,参考它们相对于可操作地连接的启动子元件或基因的位置)存在。
在本文公开的CRE或其功能变体的任何组合中,适当地一些或所有所述的CRE可以在CRM中彼此相邻放置(即,没有任何介入的CRE或其他调节元件)。CRE可以是连续的或不连续的(即它们可以彼此紧邻放置,或者它们可以被间隔区或其他序列隔开)。在一些优选实施方案中,CRE或其功能变体以所述的顺序提供并且彼此相邻。例如,合成的肌肉特异性CRM可以包括紧邻CRE0031上游的CRE0035,等等。CRE可以是连续的或不连续的。在一些实施方案中,优选一些或所有CRE是连续的。
已发现包含上述CRE组合的CRM在与合适的启动子元件组合时在骨骼肌和心肌中提供显著的肌肉特异性增强子活性。特别是,当CRE以下述顺序彼此相邻时,观察到了高活性水平:
-CRE0035和CRE0031;
-CRE0035和CRE0036;
-CRE0029和CRE0071;
-CRE0035和CRE0020;
-CRE0020和CRE0071;和
-CRE0020和CRE0036;
因此,这些代表了一些优选的CRE“基序”,它们通常与骨骼肌和心肌中高水平的肌肉特异性启动子活性相关。
在本发明的一些优选实施方案中,合成的肌肉特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:
-CRE0035和CRE0031(即来自SP0160和SP0163的CRE);
-CRE0035和CRE0036(即来自SP0159和SP0162的CRE);
-CRE0029和CRE0071(即来自SP0057的CRE);
-CRE0035和CRE0020(即来自SP0156的CRE);
-CRE0020和CRE0071(即来自SP0134的CRE);和
-CRE0020和CRE0036(即来自SP0158和SP0161的CRE)。
在一些实施方案中,合成的肌肉特异性CRM除了上述CRE之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种其他CRE或其他CRE。在一些实施方案中,另外的CRE可以是CRE0033(SEQ ID NO:309)、CRE0090(SEQ ID NO:409)和CRE0096(SEQ ID NO:417)中的任一种。
在本发明的一些实施方案中,合成的肌肉特异性CRM包含选自由以下组成的组的CRM:CRM_SP0160(SEQ ID NO:173)、CRM_SP0163(SEQ ID NO:176)、CRM_SP0159(SEQ ID NO:172)、CRM_SP0162(SEQ ID NO:175)、CRM_SP0057(SEQ ID NO:145)、CRM_SP0156(SEQ IDNO:169)、CRM_SP0134(SEQ ID NO:161)、CRM_SP0158(SEQ ID NO:171)和CRM_SP0161(SEQID NO:174),或其任何功能变体。适当地,所述CRM的任何功能变体包含与参考合成肌肉特异性CRM至少70%相同,更优选与参考合成肌肉特异性CRM至少80%、90%、95%或99%相同的序列。
在一些实施方案中,根据本发明的肌肉特异性CRM可操作地连接至启动子元件以形成合成的肌肉特异性启动子。在本发明的一些实施方案中,合成的肌肉特异性启动子包含选自由SP0160、SP0163、SP0159、SP0162、SP0057、SP0156、SP0134、SP0158和SP0161组成的组的启动子,或其功能变体。适当地,任何所述启动子的功能变体包含与参考合成肌肉特异性启动子至少70%相同,更优选与参考合成肌肉特异性启动子至少80%、90%、95%或99%相同的序列。
在本发明的另一方面,提供了一种合成的肌肉特异性启动子,其包含:
包含两个或更多个可操作地连接的CRE的CRM,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体;
可操作地连接至选自由以下组成的组的启动子元件:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011(SEQ ID NO:291)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;
-CRE0046(SEQ ID NO:276)或其功能变体。
在本发明的另一方面,提供了一种合成的肌肉特异性启动子,其包含:
来自由以下组成的组的以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体;
可操作地连接至选自由以下组成的组的启动子元件:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011(SEQ ID NO:291)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
在一些实施方案中,合成的肌肉特异性启动子在骨骼肌和心肌中具有活性。在一些实施方案中,合成的肌肉特异性启动子包含至少两个所述的CRE或其功能变体,其可操作地连接至所述的启动子元件。
如下文更详细讨论的,已发现选自CRE0035(SEQ ID NO:310)或其功能变体、CRE0036(SEQ ID NO:311)或其功能变体、CRE0029(SEQ ID NO:307)或其功能变体、CRE0071(SEQ ID NO:321)或其功能变体、CRE0020(SEQ ID NO:303)或其功能变体和CRE0031(SEQID NO:308)的至少一种CRE和选自CRE0037(SEQ ID NO:275)或其功能变体、CRE0070(SEQID NO:284)或其功能变体、SKM_18(SEQ ID NO:135)或其功能变体、CRE0010_ITGB1BP2(SEQID NO:272)或其功能变体、CRE0049(SEQ ID NO:278)或其功能变体、CRE0048(SEQ ID NO:277)或其功能变体、CRE0011(SEQ ID NO:291)或其功能变体、SKM_14(SEQ ID NO:287)或其功能变体和CRE0046(SEQ ID NO:276)或其功能变体的至少一种CRE的组合在骨骼肌和心肌中提供高水平的肌肉特异性活性。
在一些实施方案中,启动子元件位于CRE的下游,并且通常它与近端CRE相邻。启动子元件可以与相邻的CRE邻接,或者它可以被间隔区隔开。
在一些实施方案中,合成的肌肉特异性启动子除了上述CRE和/或启动子元件之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种其他CRE或其他CRE。在一些实施方案中,CRE可以选自CRE0047和DES_MT增强子_48bp。在一些实施方案中,另外的CRE可以是CRE0033(SEQ ID NO:309)、CRE0090(SEQ ID NO:409)和CRE0096(SEQ ID NO:417)中的任何一种。在一些实施方案中,一种或多种另外的调节元件可以是一种或多种启动子元件。在一些实施方案中,一种或多种另外的调节元件可以是一种或多种UTR或内含子。
在一些实施方案中,合成的肌肉特异性启动子包含与启动子元件或其功能变体可操作地连接的CRE或其功能变体的组合之一,如下表A中所列:
表A
Figure BDA0003811822590000141
Figure BDA0003811822590000151
CRE优选地以所述的顺序存在并且优选地彼此相邻。CRE可以是连续的或不连续的。启动子元件位于CRE的下游,通常与近端CRE相邻。启动子元件可以与相邻的CRE邻接,或者它可以被间隔区隔开。
在本发明的一些实施方案中,合成的肌肉特异性启动子包含选自由以下组成的组的启动子:SP0160、SP0159、SP0057、SP0156、SP0173、SP0134、SP0147、SP0066、SP0158、SP0068、SP0164、SP0042、SP0149、SP0148、SP0132、SP0136、SP0153、SP0155、SP0051和SP0154,或其任何功能变体。适当地,任何所述启动子的功能变体包含与参考合成肌肉特异性启动子至少70%相同,更优选与参考合成肌肉特异性启动子至少80%、90%、95%或99%相同的序列。
在本发明的另一方面,提供了一种合成的肌肉特异性启动子,其包含两个或更多个可操作地连接的启动子元件,所述启动子元件选自由以下组成的组:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011(SEQ ID NO:291)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
在一些实施方案中,合成的肌肉特异性启动子在骨骼肌和心肌中具有活性。如下文更详细讨论的,已发现选自CRE0037(SEQ ID NO:275)或其功能变体、CRE0070(SEQ IDNO:284)或其功能变体、SKM_18(SEQ ID NO:135)或其功能变体、CRE0010_ITGB1BP2(SEQ IDNO:272)或其功能变体、CRE0049(SEQ ID NO:278)或其功能变体、CRE0048(SEQ ID NO:277)或其功能变体、CRE0011(SEQ ID NO:291)或其功能变体、SKM_14(SEQ ID NO:287)或其功能变体和CRE0046(SEQ ID NO:276)或其功能变体的至少两个启动子元件的组合在骨骼肌和心肌中提供高水平的肌肉特异性活性。
在一些实施方案中,两个启动子元件彼此相邻。启动子元件可以与相邻的启动子元件邻接,或者它可以被间隔区隔开。在一些实施方案中,两个启动子元件被其他调节元件如一个或多个CRE隔开。
在一些实施方案中,合成的肌肉特异性启动子除了上述启动子元件之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种CRE或其他CRE。在一些实施方案中,CRE可以是CRE0035。在一些实施方案中,另外的CRE可以是CRE0033(SEQ ID NO:309)、CRE0090(SEQ ID NO:409)和CRE0096(SEQ IDNO:417)中的任何一种。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种启动子元件或其他启动子元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种UTR或内含子或其他UTR或内含子。
在一些实施方案中,合成的肌肉特异性启动子包含启动子元件或其功能变体的组合之一,如下表B中所示:
表B
合成启动子 启动子元件 CRE/启动子元件 启动子元件
SP0173 CRE0010 CRE0035 SKM_18
SP0171 CRE0010 SKM_18
启动子元件优选以所述的顺序存在。在一些实施方案中,两个启动子元件彼此相邻。启动子元件可以与相邻的启动子元件邻接,或者它可以被间隔区隔开。在一些实施方案中,两个启动子元件被其他调节元件如一个或多个CRE隔开。
在本发明的一些实施方案中,合成的肌肉特异性启动子包含选自由以下组成的组的启动子:SP0173和SP0171,或其任何功能变体。适当地,任何所述启动子的功能变体包含与参考合成肌肉特异性启动子至少70%相同,更优选与参考合成肌肉特异性启动子至少80%、90%、95%或99%相同的序列。
在本发明的另一方面,提供了一种合成的骨骼肌特异性CRM,其包含两个或更多个可操作地连接的CRE,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0050(SEQ ID NO:313)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;
-CRE0047(SEQ ID NO:312)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;和
-DES_MT_增强子_48bp(SEQ ID NO:547)或其功能变体。
在一些实施方案中,合成的骨骼肌特异性CRM主要在骨骼肌中具有活性。在一些实施方案中,合成的骨骼肌特异性CRM包含三个或更多个、四个或更多个或五个或更多个所述CRE。如下文更详细讨论的,已发现这些CRE有助于骨骼肌特异性启动子中存在的CRM的活性和骨骼肌特异性启动子的活性。
在一些实施方案中,本发明的合成的骨骼肌特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:CRE0035和CRE0050;CRE0035和CRE0020;CRE0035和CRE0031;CRE0035和CRE0047;CRE0035和CRE0071;CRE0035和DES_MT_增强子_48bp;CRE0050和CRE0020;CRE0050和CRE0031;CRE0050和CRE0047;CRE0050和CRE0071;CRE0050和DES_MT_增强子_48bp;CRE0020和CRE0031;CRE0047和CRE0020;CRE0020和CRE0071;CRE0020和DES_MT_增强子_48bp;CRE0031和CRE0047;CRE0031和CRE0071;CRE0031和DES_MT_增强子_48bp;CRE0047和CRE0071;CRE0047和DES_MT_增强子_48bp;以及CRE0035和DES_MT_增强子_48bp和DES_MT_增强子_48bp。
在本文公开的CRE或其功能变体的任何组合中,所述的CRE可以以任何顺序存在。在一些优选实施方案中,CRE以所述的顺序(即,以上游到下游的顺序,参考它们相对于可操作地连接的启动子元件或基因的位置)存在。
在本文公开的CRE或其功能变体的任何组合中,适当地一些或所有所述的CRE可以在CRM中彼此相邻放置(即,没有任何介入的CRE或其他调节元件)。CRE可以是连续的或不连续的(即它们可以彼此紧邻放置,或者它们可以被间隔区或其他序列隔开)。在一些优选实施方案中,CRE或其功能变体以所述的顺序提供并且彼此相邻。例如,合成的骨骼肌特异性CRM可以包括紧邻CRE0071上游的CRE0020,等等。CRE可以是连续的或不连续的。在一些实施方案中,优选一些或所有CRE是连续的。
已发现包含上述CRE组合的CRM在与合适的启动子元件组合时在骨骼肌中提供显著的骨骼肌特异性增强子活性。特别地,当CRE以下述顺序彼此相邻时,观察到了高水平的活性:
-CRE0035、DES_MT_增强子_48bp和DES_MT_增强子_48bp;
-CRE0035和CRE0031;
-CRE0035和CRE0020;
-CRE0047和CRE0020;
-CRE0020和CRE0071;和
-CRE0035和CRE0031;
因此,这些代表了一些优选的CRE“基序”,它们通常与骨骼肌中高水平的骨骼肌特异性启动子活性相关。
在本发明的一些优选实施方案中,合成的骨骼肌特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:
-CRE0035、DES_MT_增强子_48bp和DES_MT_增强子_48bp(即来自SP0155的CRE);
-CRE0035和CRE0031(即来自SP0160的CRE);
-CRE0035和CRE0020(即来自SP0156的CRE);
-CRE0047和CRE0020(即来自SP0164的CRE);
-CRE0020和CRE0071(即来自SP0134的CRE);和
-CRE0035和CRE0031(即来自SP0163的CRE)。
在本发明的一些实施方案中,合成的骨骼肌特异性CRM包括选自由以下组成的组的CRM:CRM_SP0155(SEQ ID NO:168)、CRM_SP0160(SEQ ID NO:173)、CRM_SP0156(SEQ IDNO:169)、CRM_SP0164(SEQ ID NO:177)、CRM_SP0134(SEQ ID NO:161)和CRM_SP0163(SEQID NO:176),或其任何功能变体。适当地,任何所述CRM的功能变体包含与参考合成骨骼肌特异性CRM至少70%相同,更优选与参考合成骨骼肌特异性CRM至少80%、90%、95%或99%相同的序列。
在一些实施方案中,根据本发明的骨骼肌特异性CRM可操作地连接至启动子元件以形成合成的骨骼肌特异性启动子。在本发明的一些实施方案中,合成的骨骼肌特异性启动子包含选自由SP0155、SP0160、SP0156、SP0164、SP0134和SP0163组成的组的启动子。适当地,任何所述启动子的功能变体包含与参考合成骨骼肌特异性启动子至少70%相同,更优选与参考合成骨骼肌特异性启动子至少80%、90%、95%或99%相同的序列。当可操作地连接至启动子元件时,根据本发明的骨骼肌特异性CRM也可以在心肌中具有活性。
在本发明的另一方面,提供了一种合成的骨骼肌特异性启动子,其包含:
包含两个或更多个可操作地连接的CRE的CRM,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0050(SEQ ID NO:313)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;
-CRE0047(SEQ ID NO:312)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;和
-DES_MT_增强子_48bp(SEQ ID NO:547)或其功能变体;
可操作地连接至选自由以下组成的组的启动子元件:
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011_RSV(SEQ ID NO:291)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
在本发明的另一方面,提供了一种合成的骨骼肌特异性启动子,其包含:
来自由以下组成的组的以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0050(SEQ ID NO:313)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;
-CRE0047(SEQ ID NO:312)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;和
-DES_MT_增强子_48bp(SEQ ID NO:547)或其功能变体;
可操作地连接至选自由以下组成的组的启动子元件:
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011_RSV(SEQ ID NO:291)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
在一些实施方案中,合成的骨骼肌特异性启动子主要在骨骼肌中具有活性。在一些实施方案中,合成的骨骼肌特异性启动子包含至少两个与所述的启动子元件可操作地连接的所述的CRE或其功能变体。
如以下更详细讨论的,已发现选自CRE0035(SEQ ID NO:310)或其功能变体、CRE0050(SEQ ID NO:313)或其功能变体、CRE0020(SEQ ID NO:303)或其功能变体、CRE0031(SEQ ID NO:308)或其功能变体、CRE0047(SEQ ID NO:312)或其功能变体、CRE0071(SEQ IDNO:321)或其功能变体和DES_MT_增强子_48bp(SEQ ID NO:547)或其功能变体的至少一种CRE和选自CRE0049(SEQ ID NO:278)或其功能变体、CRE0037(SEQ ID NO:275)或其功能变体、SKM_14(SEQ ID NO:287)或其功能变体、CRE0048(SEQ ID NO:277)或其功能变体、CRE0011_RSV(SEQ ID NO:291)或其功能变体、CRE0070(SEQ ID NO:284)或其功能变体和CRE0046(SEQ ID NO:276)或其功能变体的至少一种CRE的组合在骨骼肌中提供高水平的骨骼肌特异性活性。
在一些实施方案中,启动子元件位于CRE的下游,并且通常它与近端CRE相邻。启动子元件可以与相邻的CRE邻接,或者它可以被间隔区隔开。
在一些实施方案中,合成的骨骼肌特异性启动子除了上述CRE和/或启动子元件之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种其他CRE或其他CRE。在一些实施方案中,一种或多种CRE可以选自CRE0036和CRE0029。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种启动子元件或其他启动子元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种UTR或内含子或其他UTR或内含子。在一些实施方案中,一种或多种UTR或内含子可以是HBB内含子。
在一些实施方案中,合成的骨骼肌特异性启动子包含与启动子元件或其功能变体可操作地连接的CRE或其功能变体的组合之一,如下表C中所示:
表C
Figure BDA0003811822590000221
Figure BDA0003811822590000231
CRE优选地以所述的顺序存在并且优选地彼此相邻。CRE可以是连续的或不连续的。启动子元件位于CRE的下游,通常与近端CRE相邻。启动子元件可以与相邻的CRE邻接,或者它可以被间隔区隔开。
在本发明的一些实施方案中,合成的骨骼肌特异性启动子包含选自由以下组成的组的启动子:SP0155、SP0160、SP0156、SP0159、SP0164、SP0057、SP0158、SP0134、SP0146、SP0147、SP0148、SP0149、SP0165、SP0153、SP0051、SP0154或其任何功能变体。适当地,任何所述启动子的功能变体包含与参考合成骨骼肌特异性启动子至少70%相同,更优选与参考合成骨骼肌特异性启动子至少80%、90%、95%或99%相同的序列。在一些实施方案中,合成的骨骼肌特异性启动子也可以在心肌中具有活性。
在本发明的另一方面,提供了一种合成的心肌特异性顺式调节模块(CRM),其包含两个或更多个可操作地连接的顺式调节元件(CRE),所述顺式调节元件选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0069(SEQ ID NO:320)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0096(SEQ ID NO:417)或其功能变体;
-CRE0079(SEQ ID NO:329)或其功能变体;
-CRE0051(SEQ ID NO:314)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;和
-CRE0020(SEQ ID NO:303)或其功能变体。
在一些实施方案中,合成的心肌特异性CRM主要在心肌中具有活性。在一些实施方案中,合成的心肌特异性CRM包含三个或更多个、四个或更多个或五个或更多个所述CRE。如下文更详细讨论的,已发现这些CRE有助于心肌特异性启动子中存在的CRM的活性和心肌特异性启动子的活性。
在一些实施方案中,本发明的合成的心肌特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:-CRE0035和CRE0029;CRE0035和CRE0069;CRE0035和CRE0071;CRE0035和CRE0036;CRE0035和CRE0096;CRE0035和CRE0079;CRE0035和CRE0051;CRE0035和CRE0031;CRE0035和CRE0020;CRE0029和CRE0069;CRE0029和CRE0071;CRE0029和CRE0036;CRE0029和CRE0096;CRE0029和CRE0079;CRE0029和CRE0051;CRE0029和CRE0031;CRE0029和CRE0020;CRE0069和CRE0071;CRE0069和CRE0036;CRE0069和CRE0096;CRE0069和CRE0079;CRE0069和CRE0051;CRE0069和CRE0031;CRE0069和CRE0020;CRE0071和CRE0036;CRE0071和CRE0096;CRE0071和CRE0079;CRE0071和CRE0051;CRE0071和CRE0031;CRE0071和CRE0020;CRE0036和CRE0096;CRE0036和CRE0079;CRE0036和CRE0051;CRE0036和CRE0031;CRE0036和CRE0020;CRE0096和CRE0079;CRE0096和CRE0051;CRE0096和CRE0031;CRE0096和CRE0020;CRE0079和CRE0051;CRE0079和CRE0031;CRE0079和CRE0020;CRE0051和CRE0031;CRE0051和CRE0020;CRE0031和CRE0020;CRE0020、CRE0029和CRE0071;CRE0020、CRE0069和CRE0071;CRE0029、CRE0035和CRE0071;CRE0020、CRE0020和CRE0071;CRE0020和CRE0071;CRE0079和CRE0071;CRE0035和CRE0035;CRE0079和CRE0035;CRE0020和CRE0036;CRE0069和CRE0035;CRE0071和CRE0035;CRE0029和CRE0035;以及CRE0020和CRE0035。
在本文公开的CRE或其功能变体的任何组合中,所述的CRE可以以任何顺序存在。在一些优选实施方案中,CRE以所述的顺序(即,以上游到下游的顺序,参考它们相对于可操作地连接的启动子元件或基因的位置)存在。
在本文公开的CRE或其功能变体的任何组合中,适当地一些或所有所述的CRE可以在CRM中彼此相邻放置(即,没有任何介入的CRE或其他调节元件)。CRE可以是连续的或不连续的(即它们可以彼此紧邻放置,或者它们可以被间隔区或其他序列隔开)。在一些优选实施方案中,CRE或其功能变体以所述的顺序提供并且彼此相邻。例如,合成的肌肉特异性CRM可以包括紧邻CRE0071上游的CRE0069,等等。CRE可以是连续的或不连续的。在一些实施方案中,优选一些或所有CRE是连续的。
已发现包含上述CRE组合的CRM在与合适的启动子元件组合时主要在心肌中提供显著的心肌特异性增强子活性。特别地,当CRE以下述顺序彼此相邻时,观察到了高水平的活性:
CRE0020、CRE0029和CRE0071;CRE0020、CRE0069和CRE0071;CRE0029、CRE0035和CRE0071;CRE0020、CRE0020和CRE0071;CRE0020和CRE0071;CRE0079和CRE0071;CRE0035和CRE0071;CRE0029和CRE0071;CRE0035和CRE0036;CRE0069和CRE0051;CRE0069和CRE0071;CRE0035和CRE0031;CRE0035和CRE0035;CRE0079和CRE0035;CRE0020和CRE0036;CRE0069和CRE0035;CRE0029和CRE0071;CRE0071和CRE0035;CRE0035和CRE0020;CRE0029和CRE0035;CRE0035和CRE0036;CRE0020和CRE0035;以及CRE0071和CRE0020。
因此,这些代表了一些优选的CRE“基序”,它们通常与高水平的心肌特异性启动子活性相关。
在本发明的一些优选实施方案中,合成的肌肉特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:
-CRE0020、CRE0029和CRE0071(即来自SP0229、SP0228、SP0229A的CRE);
-CRE0020、CRE0069和CRE0071(即来自SP0328的CRE);
-CRE0029、CRE0035和CRE0071(即来自SP0349的CRE);
-CRE0020、CRE0020和CRE0071(即来自SP0230的CRE);
-CRE0020和CRE0071(即来自SP0279、SP0134、SP0345、SP0231、SP0453、SP0459、SP0458和SP0463的CRE);
-CRE0079和CRE0071(即来自SP0366的CRE);
-CRE0035和CRE0071(即来自SP0467、SP0332、SP0232的CRE);
-CRE0029和CRE0071(即来自SP0057的CRE);
-CRE0035和CRE0036(即来自SP0159的CRE);
-CRE0069和CRE0051(即来自SP0322的CRE);
-CRE0069和CRE0071(即来自SP0327、SP0346的CRE);
-CRE0035和CRE0031(即来自SP0160、SP0163的CRE);
-CRE0035和CRE0035(即来自SP0309的CRE);
-CRE0079和CRE0035(即来自SP0368的CRE);
-CRE0020和CRE0036(即来自SP0158、SP0161的CRE);
-CRE0029和CRE0071(即来自SP0364的CRE);
-CRE0071和CRE0035(即来自SP0468的CRE);
-CRE0035和CRE0020(即来自SP0156的CRE);
-CRE0029和CRE0035(即来自SP0306的CRE);
-CRE0035和CRE0036(即来自SP0162的CRE);
-CRE0020和CRE0035(即来自SP0307的CRE);和
-CRE0071和CRE0020(即来自SP0471、SP0464、SP0465的CRE)。
在一些实施方案中,合成的心肌特异性CRM除了上述CRE之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种其他CRE或其他CRE。在一些实施方案中,一种或多种另外的CRE选自以下CRE:DES_MT_增强子_72bp和CRE0055。在一些实施方案中,另外的CRE可以是CRE0033(SEQ ID NO:309)和CRE0090(SEQ ID NO:409)中的任何一种。在本发明的一些优选实施方案中,合成的肌肉特异性CRM包含选自由以下组成的组的CRE或其功能变体的组合:CRE0020、DES_MT_增强子_72bp和CRE0071;以及CRE0069、CRE0035和CRE0055。
在本发明的一些实施方案中,合成的心肌特异性CRM包含选自由以下组成的组的CRM:CRM_SP0229(SEQ ID NO:185)、CRM_SP0228(SEQ ID NO:184)、CRM_SP0328(SEQ ID NO:217)、CRM_SP0229A(SEQ ID NO:549)、CRM_SP0349(SEQ ID NO:236)、CRM_SP0230(SEQ IDNO:186)、CRM_SP0279(SEQ ID NO:198)、CRM_SP0366(SEQ ID NO:251)、CRM_SP0467(SEQ IDNO:527)、CRM_SP0332(SEQ ID NO:221)、CRM_SP0057(SEQ ID NO:145)、CRM_SP0159(SEQ IDNO:172)、CRM_SP0134(SEQ ID NO:161)、CRM_SP0322(SEQ ID NO:211)、CRM_SP0327(SEQ IDNO:216)、CRM_SP0345(SEQ ID NO:232)、CRM_SP0160(SEQ ID NO:173)、CRM_SP0350(SEQ IDNO:237)、CRM_SP0346(SEQ ID NO:233)、CRM_SP0231(SEQ ID NO:187)、CRM_SP0309(SEQ IDNO:202)、CRM_SP0368(SEQ ID NO:253)、CRM_SP0158(SEQ ID NO:171)、CRM_SP0338(SEQ IDNO:226)、CRM_SP0364(SEQ ID NO:249)、CRM_SP0468(SEQ ID NO:528)、CRM_SP0232(SEQ IDNO:188)、CRM_SP0156(SEQ ID NO:169)、CRM_SP0306(SEQ ID NO:200)、CRM_SP0453(SEQ IDNO:514)、CRM_SP0459(SEQ ID NO:520)、CRM_SP0163(SEQ ID NO:176)、CRM_SP0162(SEQ IDNO:175)、CRM_SP0307(SEQ ID NO:201)、CRM_SP0471(SEQ ID NO:530)、CRM_SP0458(SEQ IDNO:519)、CRM_SP0161(SEQ ID NO:174)、CRM_SP0464(SEQ ID NO:524)、CRM_SP0463(SEQ IDNO:523)、CRM_SP0465(SEQ ID NO:525)或任何功能变体。适当地,任何所述CRM的功能变体包含与参考合成肌肉特异性CRM至少70%相同,更优选与参考合成肌肉特异性CRM至少80%、90%、95%或99%相同的序列。
在一些实施方案中,根据本发明的心肌特异性CRM可操作地连接至启动子元件以形成合成的心肌特异性启动子。在本发明的一些实施方案中,合成的心肌特异性启动子包含选自由以下组成的组的启动子:SP0229、SP0228、SP0328、SP0229A、SP0349、SP0230、SP0279、SP0366、SP0467、SP0332、SP0057、SP0159、SP0134、SP0322、SP0327、SP0345、SP0160、SP0350、SP0346、SP0231、SP0309、SP0368、SP0158、SP0338、SP0364、SP0468、SP0232、SP0156、SP0306、SP0453、SP0459、SP0163、SP0162、SP0307、SP0471、SP0458、SP0161、SP0464、SP0463、SP0465。适当地,任何所述启动子的功能变体包含与参考合成心肌特异性启动子至少70%相同,更优选与参考合成心肌特异性启动子至少80%、90%、95%或99%相同的序列。在一些实施方案中,根据本发明的心肌特异性CRM在与启动子元件可操作地连接时也可以在骨骼肌中具有活性。
在一些实施方案中,包含根据本发明的心肌特异性CRM的合成的心肌特异性启动子包含表D中详述的CRE和启动子元件的以下组合:
表D
Figure BDA0003811822590000281
Figure BDA0003811822590000291
Figure BDA0003811822590000301
在本发明的另一方面,提供了一种合成的心肌特异性启动子,其包含:
包含两个或更多个可操作地连接的CRE的CRM,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0069(SEQ ID NO:320)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0096(SEQ ID NO:417)或其功能变体;
-CRE0079(SEQ ID NO:329)或其功能变体;
-CRE0051(SEQ ID NO:314)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;和
-CRE0020(SEQ ID NO:303)或其功能变体;
可操作地连接至选自由以下组成的组的启动子元件:
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0046(SEQ ID NO:276)或其功能变体;和
-Des_mp_V1(SEQ ID NO:292)或其功能变体。
在本发明的另一方面,提供了一种合成的心肌特异性启动子,其包含:
来自由以下组成的组的以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0069(SEQ ID NO:320)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0096(SEQ ID NO:417)或其功能变体;
-CRE0079(SEQ ID NO:329)或其功能变体;
-CRE0051(SEQ ID NO:314)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;和
-CRE0020(SEQ ID NO:303)或其功能变体;
可操作地连接至选自由以下组成的组的启动子元件:
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0046(SEQ ID NO:276)或其功能变体;和
-Des_mp_V1(SEQ ID NO:292)或其功能变体。
在一些实施方案中,合成的心肌特异性启动子主要在心肌中具有活性。在一些实施方案中,合成的心肌特异性启动子包含至少两个与所述的启动子元件可操作地连接的所述的CRE或其功能变体。
如下文更详细讨论的,已发现选自CRE0035(SEQ ID NO:310)或其功能变体、CRE0029(SEQ ID NO:307)或其功能变体、CRE0069(SEQ ID NO:320)或其功能变体、CRE0071(SEQ ID NO:321)或其功能变体、CRE0036(SEQ ID NO:311)或其功能变体、CRE0096(SEQ IDNO:417)或其功能变体、CRE0079(SEQ ID NO:329)或其功能变体、CRE0051(SEQ ID NO:314)或其功能变体、CRE0031(SEQ ID NO:308)或其功能变体和CRE0020(SEQ ID NO:303)或其功能变体的至少一种CRE和选自SKM_18(SEQ ID NO:135)或其功能变体、CRE0070(SEQ ID NO:284)或其功能变体、CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体、CRE0037(SEQ IDNO:275)或其功能变体、CRE0046(SEQ ID NO:276)或其功能变体和Des_mp_V1(SEQ ID NO:292)或其功能变体的至少一种CRE的组合在心肌中提供高水平的肌肉特异性活性。
在一些实施方案中,启动子元件位于CRE的下游,并且通常它与近端CRE相邻。启动子元件可以与相邻的CRE邻接,或者它可以被间隔区隔开。
在一些实施方案中,合成的心肌特异性启动子除了上述CRE和/或启动子元件之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种其他CRE或其他CRE。在一些实施方案中,另外的CRE可以选自CRE0033、CRE0071.5、CRE0071.13、CRE0050、CRE0093.2、CRE0094.2、DES_MT_增强子_72bp_v3(SEQ IDNO:338)、Des_MT_增强子_48bp(SEQ ID NO:547)、CNTRL_001、CRE0094、DES_MT_增强子_72bp_v4(SEQ ID NO:339)、CRE0093、CRE0094、CRE0071.19、CRE0071.5,72bp随机、DES_MT_增强子_72bp。在一些实施方案中,另外的CRE可以是CRE0033(SEQ ID NO:309)和CRE0090(SEQ ID NO:409)中的任何一种。在一些实施方案中,一种或多种另外的调节元件可以是一种或多种启动子元件。在一些实施方案中,另外的启动子元件可以是CRE0055。在一些实施方案中,一种或多种另外的调节元件可以是一种或多种UTR或内含子。在一些实施方案中,一种或多种另外的UTR或内含子可以是CMV-IE内含子。
在一些实施方案中,合成的心肌特异性启动子包含与启动子元件或其功能变体可操作地连接的CRE或其功能变体的组合之一,如下表E中所示:
表E
Figure BDA0003811822590000331
Figure BDA0003811822590000341
Figure BDA0003811822590000351
Figure BDA0003811822590000361
CRE优选地以所述的顺序存在并且优选地彼此相邻。CRE可以是连续的或不连续的。启动子元件位于CRE的下游,通常与近端CRE相邻。启动子元件可以与相邻的CRE邻接,或者它可以被间隔区隔开。
在本发明的一些实施方案中,合成的心肌特异性启动子包含选自由以下组成的组的启动子:SP0326、SP0286、SP0451、SP0042、SP0362、SP0334、SP0343、SP0066、SP0440、SP0170、SP0347、SP0469、SP0068、SP0267、SP0132、SP0310、SP0365、SP0379、SP0339、SP0136、SP0325、SP0337、SP0270、SP0457、SP0268、SP0341、SP0378、SP0380、SP0262、SP0359、SP0455、SP0381、SP0441、SP0153、SP0442、SP0154、SP0155、SP0454、SP0456、SP0305、SP0382、SP0279、SP0320、SP0366、SP0467、SP0332、SP0057、SP0159、SP0134、SP0322、SP0257、SP0327、SP0345、SP0173、SP0160、SP0350、SP0346、SP0231、SP0309、SP0368、SP0158、SP0338、SP0364、SP0468、SP0232、SP0453、SP0340、SP0471、SP0229、SP0228、SP0328、SP0349、SP0230,或其任何功能变体。适当地,任何所述启动子的功能变体包含与参考合成心肌特异性启动子至少70%相同,更优选与参考合成心肌特异性启动子至少80%、90%、95%或99%相同的序列。在一些实施方案中,心肌特异性启动子也可以在骨骼肌中具有活性。
在本发明的另一方面,提供了一种合成的心肌特异性启动子,其包含两个或更多个可操作地连接的启动子元件,所述启动子元件选自由以下组成的组:
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0046(SEQ ID NO:276)或其功能变体;和
-Des_mp_V1(SEQ ID NO:292)或其功能变体。
在一些实施方案中,合成的心肌特异性启动子主要在心肌中具有活性。如下文更详细讨论的,已发现选自以下的至少两个启动子元件的组合在心肌中提供高水平的心肌特异性活性:SKM_18(SEQ ID NO:135)或其功能变体、CRE0070(SEQ ID NO:284)或其功能变体、CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体、CRE0037(SEQ ID NO:275)或其功能变体、CRE0046(SEQ ID NO:276)或其功能变体和Des_mp_V1(SEQ ID NO:292)或其功能变体。
在一些实施方案中,两个启动子元件彼此相邻。启动子元件可以与相邻的启动子元件邻接,或者它可以被间隔区隔开。在一些实施方案中,两个启动子元件被其他调节元件如一个或多个CRE隔开。
在一些实施方案中,合成的心肌特异性启动子除了上述启动子元件之外还包含一种或多种调节元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种CRE或其他CRE。在一些实施方案中,CRE可以是CRE0035。在一些实施方案中,另外的CRE可以是CRE0033(SEQ ID NO:309)、CRE0090(SEQ ID NO:409)和CRE0096(SEQ IDNO:417)中的任何一种。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种启动子元件或其他启动子元件。在一些实施方案中,一种或多种另外的调节元件可以是根据本发明的一种或多种UTR或内含子或其他UTR或内含子。在一些实施方案中,一种或多种另外的UTR或内含子可以是CMV-IE内含子。
在一些实施方案中,合成的心肌特异性启动子包含启动子元件或其功能变体的组合之一,如下表F中所列:
表F
Figure BDA0003811822590000381
启动子元件优选以所述的顺序存在。在一些实施方案中,两个启动子元件彼此相邻。启动子元件可以与相邻的启动子元件邻接,或者它可以被间隔区隔开。在一些实施方案中,两个启动子元件被其他调节元件如一个或多个CRE隔开。
在本发明的一些实施方案中,合成的心肌特异性启动子包含选自由以下组成的组的启动子:SP0173、SP0171、SP0320、SP0257、SP0340或其任何功能变体。适当地,任何所述启动子的功能变体包含与参考合成心肌特异性启动子至少70%相同,更优选与参考合成心肌特异性启动子至少80%、90%、95%或99%相同的序列。在一些实施方案中,心肌特异性启动子也可以在骨骼肌中具有活性。
在本发明的另一方面,提供了一种表达盒,其包含与编码表达产物的序列(适当地是基因,例如转基因)可操作地连接的本发明任何方面的合成的肌肉特异性启动子、心肌特异性启动子或骨骼肌特异性启动子。在一些实施方案中,表达产物是治疗性表达产物。
治疗性表达产物可以是用于治疗心血管病况或心脏疾病和病症如心力衰竭或CHF的治疗性表达产物。治疗性表达产物可以是用于治疗其在肌肉中表达可能有用的任何病况的治疗性表达产物,例如用于治疗肌肉病症或治疗其中可能需要从肌肉分泌治疗性表达产物的病况。
治疗性表达产物可以是磷酸酶活性如1型磷酸酶活性的调节剂。调节剂可以是抑制磷酸酶活性如1型磷酸酶活性的蛋白质。调节剂可以是增加编码抑制磷酸酶活性的蛋白质的内源性核酸的表达的核酸,例如转录因子。调节剂可以是整合在编码抑制磷酸酶活性的蛋白质的内源性核酸中或附近的调节序列。调节剂可以是可以提供基因表达的核酸调节剂的核酸,例如siRNA。
治疗性表达产物可以是磷酸蛋白1(PP1)的抑制剂,例如I-1多肽。磷酸酶抑制剂-1(或“I-1”)蛋白质是1型磷酸酶的内源性抑制剂。增加I-1水平或活性可以恢复衰竭的人心肌细胞的β-肾上腺素反应性。适当地,I-1蛋白质可以是组成型活性的,例如其中苏氨酸35被谷氨酸代替而不是被天冬氨酸代替的I-1蛋白质。治疗性表达产物可以是选自以下的抑制剂中的任何一种或多种:磷酸酶抑制剂2(PP2);冈田酸或钙蛋白(caliculin);和nippl,它是蛋白磷酸酶1的内源性核抑制剂。
治疗性表达产物可以是调节心脏活性的任何蛋白质,例如1型磷酸酶抑制剂,例如I-1或sacroplasmic reticulum Ca2+ATP酶(SERCA),例如SERCA1(例如1a或1b)、SERCA2(例如,2a或2b)或SERCA3。
治疗性表达产物可以是编码磷酸酶抑制剂-1蛋白质的突变形式的核酸序列,其中该突变形式在野生型中的PKC-α磷酸化位点的位置包含至少一个氨基酸,其中所述至少一个氨基酸是组成型未磷酸化的或模拟突变形式的未磷酸化状态。治疗性表达产物可以是腺苷酸环化酶6(AC6,也称为腺苷酸环化酶VI)、S100A1、β-肾上腺素受体激酶-ct(βARKct)、sarco/内质网(SR)Ca-ATP酶(SERCA2a)、IL-18、VEGF、VEGF激活剂、尿皮质素(urocortin)和B细胞淋巴瘤2(Bcl2)相关的anthanogene-3(BAG3)。
治疗性表达产物可以是细胞因子的抑制剂,例如IL-18抑制剂。治疗性表达产物可以编码β-肾上腺素信号传导蛋白(β-ASP)(包括β-肾上腺素受体(β-Ars)、G蛋白受体激酶抑制剂(GRK抑制剂)和腺苷酸环化酶(Acs))以增强心脏功能。
治疗性表达产物可以是血管生成蛋白。血管生成蛋白促进血管的发育和分化。血管生成蛋白的实例包括成纤维细胞生长因子(FGF)家族的成员,例如aFGF(FGF-1)、bFGF(FGF-2)、FGF-4(也称为“hst/KS3”)、FGF-5和FGF-6、血管内皮生长因子(VEGF)家族、血小板衍生生长因子(PDGF)家族、胰岛素样生长因子(IGF)家族等。
在一些优选实施方案中,表达盒包含与磷酸蛋白1(PP1)抑制剂可操作地连接的心肌特异性启动子。1型磷酸酶包括但不限于PP1cα、PP1cβ、PP1cδ和PP1cγ。
在另一方面,提供了包含根据本发明的合成的肌肉特异性启动子或表达盒的载体。在一些实施方案中,所述载体是表达载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是基因治疗载体,适当地是AAV载体、腺病毒载体、逆转录病毒载体或慢病毒载体。AAV载体特别令人感兴趣。AAAV载体可以选自由AAV2、AAV6、AAV8、AAV9、BNP116、rh10、AAV2.5、AAV2i8、AAVDJ8和AAV2G9或其衍生物组成的组。已经注意到AAV血清型9(AAV9)在心肌和骨骼肌中实现有效转导,因此AAV9及其衍生物代表了合适的AAV载体的一个非限制性实例。在一些实施方案中,rAAV载体是AAV3b血清型,包括但不限于AAV3b265D病毒体、AAV3b265D549A病毒体、AAV3b549A病毒体、AAV3bQ263Y病毒体或AAV3bSASTG病毒体(即,包含含有Q263A/T265突变的AAV3b衣壳的病毒体)。在一些实施方案中,病毒体可以是合理的单倍体,或者嵌合体或任何突变体,例如可以定制衣壳以在所需位置例如心脏处增加更新。其他衣壳可以包括来自任何已知AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV7、AAV10等的衣壳。在一些优选实施方案中,AAV载体是AAV2i8。
根据本发明的载体可以是包含编码用于治疗心力衰竭的治疗性表达产物的核酸的AAV载体,其中所述核酸可操作地连接至心脏特异性启动子。
在另一方面,提供了包含根据本发明的载体(适当地为病毒载体)的病毒体(病毒颗粒)。在一些实施方案中,所述病毒体是AAV病毒体。合适的病毒体如上所述。
在另一方面,提供了包含根据本发明的合成的肌肉特异性启动子、表达盒、载体或病毒体的药物组合物。
在另一方面,提供了根据本发明的合成的肌肉特异性启动子、表达盒、载体、病毒体或药物组合物,用于治疗,即预防或治疗医学病况或疾病。适当地,用于有需要的受试者的治疗。适当地,所述病况或疾病与异常基因表达有关,任选地与肌肉细胞(肌细胞)或组织中的异常基因表达有关。适当地,所述病况或疾病与心肌细胞或心脏组织中的异常基因表达有关。适当地,所述病况或疾病与骨骼肌或组织中的异常基因表达有关。适当地,提供了根据本发明的合成的肌肉特异性启动子、表达盒、载体、病毒体或药物组合物,用于在骨骼肌和/或心肌中表达治疗性表达产物。
在一个实施方案中,所述疾病可以是心血管病况或心脏疾病和病症。在一个实施方案中,所述疾病可以是心力衰竭,例如充血性心力衰竭。在一个实施方案中,所述疾病可以选自缺血、心律失常、心肌梗塞(MI)、异常的心脏收缩力、非缺血性心肌病、外周动脉闭塞性疾病和Ca2+代谢异常及其组合。在一些实施方案中,所述疾病可以选自由以下组成的组:充血性心力衰竭、心肌病、心肌梗塞、组织缺血、心脏缺血、血管疾病、获得性心脏病、先天性心脏病、动脉粥样硬化、传导系统功能障碍、冠状动脉功能障碍、肺心性高血压。在一些实施方案中,所述疾病可以选自充血性心力衰竭、冠状动脉疾病、心肌梗塞、心肌缺血、动脉粥样硬化、心肌病、特发性心肌病、心律失常、肌营养不良症、肌肉质量异常、肌肉退化、感染性心肌炎、药物或毒素引起的肌肉异常、过敏性心肌炎、自身免疫性心内膜炎和先天性心脏病。适当地,用于基因治疗,优选用于治疗涉及异常基因表达的疾病。适当地,基因治疗涉及治疗性表达产物在肌肉细胞或组织中、适当地在心肌细胞或心脏组织中、或适当地在骨骼肌细胞或组织中的表达。
适当地,需要治疗的受试者将表现出心血管病况特征的症状,例如,如上所述的心脏疾病或心力衰竭。医学用途通常包括通过表达治疗量的治疗性产物来改善有需要的受试者表现出的症状。在一些实施方案中,表达盒包含编码PP1抑制剂的基因,其可操作地连接至心肌特异性启动子。适当地,所述治疗包括在所述受试者的心脏组织中表达治疗量的PP1抑制剂。适当地,在心脏组织中表达治疗量的PP1抑制剂可减轻受试者的心力衰竭或心脏病症的症状。适当地,在心脏组织中表达治疗量的PP1抑制剂可以减弱心脏重塑、提高运动能力或提高心脏收缩力。适当地,在心脏组织中表达治疗量的PP1抑制剂可导致心肌细胞缩短、降低舒张时间常数、加速钙信号衰减、改善收缩末期压力维度关系及其组合。
在另一方面,提供了包含本发明的合成的肌肉特异性启动子、表达盒、载体或病毒体的细胞。在一些实施方案中,所述细胞是真核细胞,任选地哺乳动物细胞,任选地人细胞。适当地,所述细胞可以是肌肉细胞,任选地其中所述细胞是人肌肉细胞。适当地是人骨骼肌细胞或人心肌细胞。合成的肌肉特异性启动子、表达盒可以是游离型的或可以在细胞的基因组中。
在另一方面,提供了如本文所述的合成的肌肉特异性CRM、合成的肌肉特异性启动子、表达盒、载体、病毒体或药物组合物,用于制备用于治疗医学病况或疾病的药物组合物。
在另一方面,提供了产生表达产物的方法,所述方法包括在肌肉细胞中提供本发明的合成的肌肉特异性表达盒并表达存在于合成的肌肉特异性表达盒中的基因。所述方法可以是体外或离体的,或者它可以是体内的。在一些实施方案中,所述方法是生物加工方法。在一个实施方案中,肌肉细胞是心肌细胞。在一个实施方案中,肌肉细胞是骨骼肌细胞。
在另一方面,提供了在肌肉细胞中表达治疗性转基因的方法,所述方法包括将本文所述的合成的肌肉特异性表达盒、载体或病毒体引入肌肉细胞。在一个实施方案中,肌肉细胞是心肌细胞。在一个实施方案中,肌肉细胞是骨骼肌细胞。
在另一方面,提供了一种治疗有需要的受试者、优选人的方法,所述方法包括:
-向受试者施用如本文所述的表达盒、载体、病毒体或药物组合物,其包含编码与根据本发明的启动子可操作地连接的治疗性产物的序列;和
-在所述受试者的肌肉中表达治疗量的治疗性产物。
在一个实施方案中,肌肉细胞是心肌细胞。在一个实施方案中,肌肉细胞是骨骼肌细胞。适当地,受试者的治疗方法包括在心肌和/或骨骼肌中表达治疗量的治疗性产物。
在一些实施方案中,所述方法包括:
-将如本文所述的表达盒、载体、病毒体或药物组合物引入受试者的肌肉中,其包含编码治疗性产物的基因;和
-在所述受试者的肌肉中表达治疗量的治疗性产物。
在一个实施方案中,肌肉细胞是心肌细胞。在一个实施方案中,肌肉细胞是骨骼肌细胞。适当地,所述方法包括在所述受试者的心肌和/或骨骼肌中表达治疗量的治疗性产物。
适当地,所述方法包括向受试者施用如本文所述的载体、病毒体或药物组合物。在一些优选实施方案中,载体是病毒基因治疗载体,优选AAV载体。
现在将在以下部分描述本发明的进一步特征和实施方案。任何部分中的任何特征或实施方案可以与任何其他特征或实施方案,或与本发明的任何方面以任何可行的组合组合。
复合启动子
在一些实施方案中,如上所列的肌肉特异性、心肌特异性或骨骼肌特异性启动子可操作地连接至一种或多种另外的调节序列。例如,与没有可操作地连接另外的调节序列的肌肉特异性、心肌特异性或骨骼肌特异性启动子相比,另外的调节序列可以增强表达。通常,优选的是另外的调节序列不会显著降低肌肉特异性、心肌特异性或骨骼肌特异性启动子的特异性。
例如,根据本发明的合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子可以与编码UTR(例如5’和/或3’UTR)和/或内含子的序列或类似的序列有可操作地连接。
在一些实施方案中,合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子可操作地连接至编码UTR如5’UTR的序列。5’UTR可以包含各种可以调节基因表达的元件。天然基因中的5’UTR从转录起始位点开始,在编码区的起始密码子前一个核苷酸结束。应当注意,本文所指的5’UTR可以是整个天然存在的5’UTR,或者它可以是天然存在的5’UTR的一部分。5’UTR也可以是部分或完全合成的。在真核生物中,5’UTR的中位长度约为150个核苷酸,但在一些情况下,它们可能会更长。可在5’UTR中找到的调节序列包括但不限于:
-蛋白质的结合位点,可能影响mRNA的稳定性或翻译;
-核糖开关;
-促进或抑制翻译起始的序列;和
-5’UTR内的内含子与基因表达和mRNA输出的调节有关。
当调节序列同时包含5’UTR和内含子时,它可以被称为5’UTR和内含子。
在一些实施方案中,如上所述的合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子可操作地连接至编码5’UTR和内含子的序列。在一些实施方案中,5’UTR和内含子源自CMV主要立即基因(CMV-IE基因)。例如,来自CMV-IE基因的5’UTR和内含子适当地包含CMV-IE基因外显子1和CMV-IE基因外显子1,或其部分。
在一些实施方案中,考虑到与5’UTR的连接,可以修饰启动子元件,例如可以去除启动子元件中转录起始位点(TSS)下游的序列(例如用5’UTR替换)。
CMV-IE 5’UTR和内含子在Simari等人,Molecular Medicine 4:700-706,1998“Requirements for Enhanced Transgene Expression by Untranslated Sequencesfrom the Human Cytomegalovirus Immediate-Early Gene”中进行了描述,该文献通过引用并入本文。CMV-IE 5’UTR和内含子序列的变体在Simari等人中进行了讨论,在WO2002/031137中也列出了,该专利通过引用并入本文,并且也可以使用其中公开的调节序列。
可以与启动子组合使用的其他调节元件,例如其他UTR,在本领域中是已知的,例如在Leppek,K.,Das,R.&Barna,M.“Functional 5’UTR mRNA structures in eukaryotictranslation regulation and how to find them”.Nat Rev Mol Cell Biol 19,158–174(2018)中,该文献通过引用并入本文。
在一些实施方案中,编码5’UTR和内含子的序列包含SEQ ID NO:368,或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。SEQ ID NO:368编码CMV-IE 5’UTR和内含子。
在一些实施方案中,5’UTR或5’UTR和内含子适当地包含用作蛋白质翻译起始位点的核酸基序,例如在产生的mRNA中定义Kozak序列的序列。例如,在一些实施方案中,编码5’UTR的序列在其3’端处或附近包含序列基序GCCACC。可以使用其他Kozak序列或其他蛋白质翻译起始位点,如本领域已知的(例如Marilyn Kozak,“Point Mutations Define aSequence Flanking the AUG Initiator Codon That Modulates Translation byEukaryotic Ribosomes”Cell,Vol.44,283-292,January 31,1986;Marilyn Kozak“AtLeast Six Nucleotides Preceding the AUG Initiator Codon Enhance Translationin Mammalian Cells”J.Mol.Rid.(1987)196,947-950;Marilyn Kozak“An analysis of5’-noncoding sequences from 699vertebrate messenger RNAs”Nucleic AcidsResearch.Vol.15(20)1987,所有这些都通过引用并入本文)。蛋白质翻译起始位点(例如Kozak序列)优选紧邻起始密码子设置。
在一些实施方案中,本文所述的任何一种启动子或其变体与编码5’UTR和/或5’UTR和内含子的序列连接以提供复合启动子。在本文中,此类复合启动子可简称为“复合启动子”,或在一些情况下简称为“启动子”。
在一些实施方案中,如上所讨论的SP0067启动子或其变体可操作地连接至编码5’UTR和内含子的序列以提供复合启动子。在一些实施方案中,复合启动子包含SEQ ID NO:432或其功能变体。这种复合启动子构建体包含可操作地连接至来自CMV-IE基因的5’UTR和内含子(SEQ ID NO:368)的SP0067。如本文所述,该复合启动子被称为SP0475。
在一些实施方案中,如上所讨论的SP0173启动子或其变体连接至编码5’UTR和内含子的序列以提供复合启动子。在一些实施方案中,复合启动子包含SEQ ID NO:75或其功能变体。这种复合启动子构建体包含可操作地连接至来自CMV-IE基因的5’UTR和内含子(SEQ ID NO:368)的SP0173。如本文所述,该复合启动子被称为SP0320。
在一些实施方案中,如上所讨论的SP0134启动子或其变体可操作地连接至编码5’UTR和内含子的序列以提供复合启动子。在一些实施方案中,复合启动子包含SEQ ID NO:62或其功能变体。这种复合启动子构建体包含可操作地连接至来自CMV-IE基因的5’UTR和内含子(SEQ ID NO:368)的SP0134。如本文所述,该复合启动子被称为SP0279。
SP0067及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是SKM_18。
CRE0033具有根据SEQ ID NO:309的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0033的功能变体是具有与CRE0033不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0033的功能变体可以被视为当在启动子中取代CRE0033时基本上保留其活性的CRE。例如,包含取代CRE0033的CRE0033的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0067为例,SP0067中的CRE0033可以被CRE0033的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0033或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:309的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:309的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE033或其功能变体具有200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18具有根据SEQ ID NO:289的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,SKM_18的功能变体基本上保留了SKM_18作为肌肉特异性启动子元件的能力。例如,当SKM_18的功能变体被替换到心肌特异性启动子SP0067中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0067活性的100%。适当地,SKM_18的功能变体包含与SEQ ID NO:289具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含SKM_18或其功能变体或由SKM_18或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:15的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:15的序列的启动子被称为SP0067。SP0067启动子在一些实施方案中是特别优选的。已发现该启动子对心肌非常特异,而且还非常短,这在某些情况下是有利的。
SP0075及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_20或其功能变体。SKM_20是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是SKM_20。
CRE0033的序列及其变体如上所述。
SKM_20具有根据SEQ ID NO:290的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,SKM_20的功能变体基本上保留了SKM_20作为肌肉特异性启动子元件的能力。例如,当SKM_20的功能变体被替换到心肌特异性启动子SP0075中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0075活性的100%。适当地,SKM_20的功能变体包含与SEQ ID NO:290具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含SKM_20或其功能变体或由SKM_20或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:20的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:20的序列的启动子被称为SP0075。SP0075启动子在一些实施方案中是特别优选的。已发现该启动子对心肌非常特异,而且还非常短,这在某些情况下是有利的。
SP0424及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0004。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0004。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0082或其功能变体。CRE0082是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0004,然后是CRE0082。
CRE0004具有根据SEQ ID NO:415的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0004的功能变体是具有与CRE0004不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0004的功能变体可以被视为当在启动子中取代CRE0004时基本上保留其活性的CRE。例如,包含取代CRE0004的CRE0004的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0424为例,SP00424中的CRE0004可以被CRE0004的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0004或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:415的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:415的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE004或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
CRE0082具有根据SEQ ID NO:422的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0082的功能变体基本上保留了CRE0082作为心肌特异性启动子元件的能力。例如,当CRE0082的功能变体被替换到心肌特异性启动子SP0424中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0424活性的100%。适当地,CRE0082的功能变体包含与SEQ ID NO:422具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0082或其功能变体或由CRE0082或其功能变体组成的启动子元件具有500个或更少、400个或更少、300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:359的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:359的序列的启动子被称为SP0424。SP0424启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0425及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0028。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0028。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0082或其功能变体。CRE0082是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0028,然后是CRE0082。
CRE0028具有根据SEQ ID NO:306的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0028的功能变体是具有与CRE0028不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0028的功能变体可以被视为当在启动子中取代CRE0028时基本上保留其活性的CRE。例如,包含取代CRE0028的CRE0028的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0425为例,SP00425中的CRE0028可以被CRE0028的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0028或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:306的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:306的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0028或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
CRE0082的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:360的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:360的序列的启动子被称为SP0425。SP0425启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0429及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0095。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0095。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0082或其功能变体。CRE0082是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0095,然后是CRE0082。
CRE0095具有根据SEQ ID NO:416的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0095的功能变体是具有与CRE0095不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0095的功能变体可以被视为当在启动子中取代CRE0095时基本上保留其活性的CRE。例如,包含取代CRE0095的CRE0095的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0429为例,SP00429中的CRE0095可以被CRE0095的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0095或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:416的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:416的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0095或其功能变体具有400个或更少的、300个或更少的、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
CRE0082的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:364的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:364的序列的启动子被称为SP0429。SP0429启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0430及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0096。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0096。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0082或其功能变体。CRE0082是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0096,然后是CRE0082。
CRE0096具有根据SEQ ID NO:417的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0096的功能变体是具有与CRE0096不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0096的功能变体可以被视为当在启动子中取代CRE0096时基本上保留其活性的CRE。例如,包含取代CRE0096的CRE0096的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0430为例,SP00430中的CRE0096可以被CRE0096的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0096或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:417的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:417的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0096或其功能变体具有500个或更少的核苷酸、300个或更少的核苷酸、300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
CRE0082的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:365的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:365的序列的启动子被称为SP0430。SP0430启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0344及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0038或其功能变体。CRE0038是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0038。CRE0033的序列及其变体如上所述。
CRE0038具有根据SEQ ID NO:471的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0038的功能变体基本上保留了CRE0038作为心肌特异性启动子元件的能力。例如,当CRE0038的功能变体被替换到心肌特异性启动子SP0344中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0344活性的100%。适当地,CRE0038的功能变体包含与SEQ ID NO:471具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0038或其功能变体或由CRE0038或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:424的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:424的序列的启动子被称为SP0344。SP0344启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0433及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含顺式调节元件CRE0033和CRE0071.3或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0033、CRE0071.3,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0071.3、CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是心肌特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0070或其功能变体。CRE0070是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0033、CRE0071.3和CRE0070,或其功能变体。CRE0033的序列及其变体如上所述。
CRE0071.3具有以下序列:SEQ ID NO:293。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0071.3的功能变体是具有与CRE0071.3不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0071.3的功能变体可以被视为当在启动子中取代CRE0071.3时基本上保留其活性的CRE。例如,包含取代CRE0071.3的CRE0071.3的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0433为例,SP00433中的CRE0071.3可以被CRE0071.3的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0071.3或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:293的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:293的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0071.3或其功能变体具有300个或更少的、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
CRE0070具有根据SEQ ID NO:284的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0070的功能变体基本上保留了CRE0070作为肌肉特异性启动子元件的能力。例如,当CRE0070的功能变体被替换到心肌特异性启动子SP0433中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0433活性的100%。适当地,CRE0070的功能变体包含与SEQ ID NO:284具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0070或其功能变体或由CRE0070或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸、85个或更少的核苷酸、75个或更少的核苷酸、或50个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:425的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:425的序列的启动子被称为SP0433。SP0433启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0435及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0082或其功能变体。CRE0082是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0082。CRE0033的序列及其变体如上所述。CRE0082的序列及其变体如上所述
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:426的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:426的序列的启动子被称为SP0435。SP0435启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0436及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含两个顺式调节元件CRE0033或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为第一CRE0033、第二CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。因此,在一个实施方案中,启动子包含以下调节元件:第一CRE0033、第二CRE0033和SKM_18,或其功能变体。
预测包含两个相同CRE的合成启动子在其靶组织或细胞中比仅包含相同CRE中的一个的等效启动子具有更高的表达。例如,与仅包含CRE0033和SKM_18的启动子SP0067相比,包含第一CRE0033、第二CRE0033和SKM_18的启动子SP0436在心肌细胞中具有更高的表达。CRE0033的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:427的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:427的序列的启动子被称为SP0436。SP0436启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0449及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含顺式调节元件CRE0004和CRE0033或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0004、CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0033、CRE0004,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0004、CRE0033和SKM_18,或其功能变体。CRE0004的序列及其变体如上所述。CRE0033的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:428的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:428的序列的启动子被称为SP0449。SP0449启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0450及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含顺式调节元件CRE0095和CRE0033或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0095、CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0033、CRE0095,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0095、CRE0033和SKM_18,或其功能变体。CRE0095的序列及其变体如上所述。CRE0033的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:429的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:429的序列的启动子被称为SP0450。SP0450启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0451及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含顺式调节元件CRE0096和CRE0033或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0096、CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0033、CRE0096,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0096、CRE0033和SKM_18,或其功能变体。CRE0096的序列及其变体如上所述。CRE0033的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:430的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:430的序列的启动子被称为SP0451。SP0451启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0452及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含心肌特异性近端启动子CRE0082和顺式调节元件CRE0033或其功能变体的组合。通常,心肌特异性近端启动子CRE0082和顺式调节元件CRE0033可操作地连接至另一个启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述近端启动子和CRE或其功能变体,顺序为CRE0082、CRE0033,然后是另一个启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
另一个启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,另一个启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,另一个启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0082、CRE0033和SKM_18,或其功能变体。该启动子包括两个串联使用的近端启动子。CRE0082的序列及其变体如上所述。CRE0033的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:431的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:431的序列的启动子被称为SP0452。SP0452启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0475及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件和调节元件如5’UTR和/或内含子的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033,随后是调节元件如5’UTR和/或内含子。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
内含子可以是任何合适的内含子。5’UTR可以是任何合适的5’UTR。一个调节元件可以包括内含子和5’UTR。在一些优选实施方案中,调节元件是CMV-IE 5’UTR和内含子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是SKM_18,然后是CMV-IE 5'UTR和内含子。CRE0033的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
CMV-IE 5’UTR和内含子具有根据SEQ ID NO:368的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
在一些实施方案中,CMV-IE 5’UTR和内含子的功能变体可以被视为当在启动子中取代CMV-IE 5’UTR和内含子时基本上保留其活性的内含子。例如,包含取代CMV-IE 5’UTR和内含子的CMV-IE 5’UTR和内含子的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0475为例,SP0475中的CMV-IE5’UTR和内含子可以被CMV-IE 5’UTR和内含子的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的内含子的其他相同启动子在等同条件下的表达来评估活性的保留。
预计包含内含子(例如CMV-IE 5’UTR和内含子)的合成启动子在其靶组织或细胞中的表达高于不包含内含子的等效启动子。例如,预测包含CRE0033、SKM_18和CMV-IE 5’UTR和内含子的启动子SP0475在心肌组织或细胞中的表达高于仅包含CRE0033和SKM_18的启动子SP0067。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:432的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:432的序列的启动子被称为SP0475。SP0475启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0476及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0105。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0105。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0105,然后是SKM_18。
CRE0105具有根据SEQ ID NO:462的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。CRE0105的功能变体是具有与CRE0105不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0105的功能变体可以被视为当在启动子中取代CRE0105时基本上保留其活性的CRE。例如,包含取代CRE0105的CRE0105的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0476为例,SP0476中的CRE0105可以被CRE0105的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0105或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:462的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:462的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0105或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:433的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:433的序列的启动子被称为SP0476。SP0476启动子在一些实施方案中是特别优选的。预测该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0477及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0106。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0106。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0106,然后是SKM_18。
CRE0106具有根据SEQ ID NO:463的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0106的功能变体是具有与CRE0106不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0106的功能变体可以被视为当在启动子中取代CRE0106时基本上保留其活性的CRE。例如,包含取代CRE0106的CRE0106的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0477为例,SP0477中的CRE0106可以被CRE0106的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0106或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:463的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:463的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0106或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:434的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:434的序列的启动子被称为SP0477。SP0477启动子在一些实施方案中是特别优选的。预测该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0478及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0107。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0107。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0107,然后是SKM_18。
CRE0107具有根据SEQ ID NO:464的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0107的功能变体是具有与CRE0107不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0107的功能变体可以被视为当在启动子中取代CRE0107时基本上保留其活性的CRE。例如,包含取代CRE0107的CRE0107的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0478为例,SP0478中的CRE0107可以被CRE0107的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0107或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:464的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:464的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0107或其功能变体具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:435的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:435的序列的启动子被称为SP0478。SP0478启动子在一些实施方案中是特别优选的。预测该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0479及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0108。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0108。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0108,然后是SKM_18。
CRE0108具有根据SEQ ID NO:465的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0108的功能变体是具有与CRE0108不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0108的功能变体可以被视为当在启动子中取代CRE0108时基本上保留其活性的CRE。例如,包含取代CRE0108的CRE0108的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0479为例,SP0479中的CRE0108可以被CRE0108的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0108或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:465的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:465的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0108或其功能变体具有250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:436的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:436的序列的启动子被称为SP0479。SP0479启动子在一些实施方案中是特别优选的。预测该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0480及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0109。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0109。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0109,然后是SKM_18。
CRE0109具有根据SEQ ID NO:466的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0109的功能变体是具有与CRE0109不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0109的功能变体可以被视为当在启动子中取代CRE0109时基本上保留其活性的CRE。例如,包含取代CRE0109的CRE0109的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0480为例,SP0480中的CRE0109可以被CRE0109的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0109或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:466的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:466的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0109或其功能变体具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:437的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:437的序列的启动子被称为SP0480。SP0480启动子在一些实施方案中是特别优选的。预测该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0481及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0110或其功能变体。CRE0110是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0110。CRE0033的序列及其变体如上所述。CRE0110具有根据SEQ ID NO:473的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0110的功能变体基本上保留了CRE0110作为心肌特异性启动子元件的能力。例如,当CRE0110的功能变体被替换到心肌特异性启动子SP0481中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0481活性的100%。适当地,CRE0110的功能变体包含与SEQ ID NO:473具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0110或其功能变体或由CRE0110或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:438的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:438的序列的启动子被称为SP0481。SP0481启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0482及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0111。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0111。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0111,然后是SKM_18。
CRE0111具有根据SEQ ID NO:467的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0111的功能变体是具有与CRE0111不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0111的功能变体可以被视为当在启动子中取代CRE0111时基本上保留其活性的CRE。例如,包含取代CRE0111的CRE0111的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0482为例,SP00482中的CRE0111可以被CRE0111的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0111或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:467的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:467的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0111或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:439的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:439的序列的启动子被称为SP0482。SP0482启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0483及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0112或其功能变体。CRE0112是心肌特异性近端启动子。在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0112。
CRE0033的序列及其变体如上所述。CRE0112具有根据SEQ ID NO:474的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0112的功能变体基本上保留了CRE0112作为心肌特异性启动子元件的能力。例如,当CRE0112的功能变体被替换到心肌特异性启动子SP0483中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0483活性的100%。适当地,CRE0112的功能变体包含与SEQ ID NO:474具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0112或其功能变体或由CRE0112或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:440的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:440的序列的启动子被称为SP0483。SP0483启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0484及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0113或其功能变体。CRE0113是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0113。CRE0033的序列及其变体如上所述。CRE0113具有根据SEQ ID NO:475的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0113的功能变体基本上保留了CRE0113作为心肌特异性启动子元件的能力。例如,当CRE0113的功能变体被替换到心肌特异性启动子SP0484中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0484活性的100%。适当地,CRE0113的功能变体包含与SEQ ID NO:475具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0113或其功能变体或由CRE0113或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:441的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:441的序列的启动子被称为SP0484。SP0484启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0485及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0114。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0114。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0114,然后是SKM_18。
CRE0114具有根据SEQ ID NO:468的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0114的功能变体是具有与CRE0114不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0114的功能变体可以被视为当在启动子中取代CRE0114时基本上保留其活性的CRE。例如,包含取代CRE0114的CRE0114的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0485为例,SP00485中的CRE0114可以被CRE0114的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0114或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:468的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:468的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0114或其功能变体具有200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:442的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:442的序列的启动子被称为SP0485。SP0485启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0486及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0115或其功能变体。CRE0115是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0115。
CRE0033的序列及其变体如上所述。CRE0115具有根据SEQ ID NO:476的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0115的功能变体基本上保留了CRE0115作为心肌特异性启动子元件的能力。例如,当CRE0115的功能变体被替换到心肌特异性启动子SP0486中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0486活性的100%。适当地,CRE0115的功能变体包含与SEQ ID NO:476具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0115或其功能变体或由CRE0115或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:443的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:443的序列的启动子被称为SP0486。SP0486启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0487及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0116或其功能变体。CRE0116是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0116。
CRE0033的序列及其变体如上所述。
CRE0116具有根据SEQ ID NO:477的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0116的功能变体基本上保留了CRE0116作为心肌特异性启动子元件的能力。例如,当CRE0116的功能变体被替换到心肌特异性启动子SP0487中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0487活性的100%。适当地,CRE0116的功能变体包含与SEQ ID NO:477具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0116或其功能变体或由CRE0116或其功能变体组成的启动子元件具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:444的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:444的序列的启动子被称为SP0487。SP0487启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0488及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0117。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0117。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0117,然后是SKM_18。
CRE0117具有根据SEQ ID NO:469的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0117的功能变体是具有与CRE0117不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0117的功能变体可以被视为当在启动子中取代CRE0117时基本上保留其活性的CRE。例如,包含取代CRE0117的CRE0117的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0488为例,SP00488中的CRE0117可以被CRE0117的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0117或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:469的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:469的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0117或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:445的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:445的序列的启动子被称为SP0488。SP0488启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0489及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0033。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0033。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0104或其功能变体。CRE0104是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0033,然后是CRE0104。CRE0033的序列及其变体如上所述。CRE0104具有根据SEQ ID NO:472的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0104的功能变体基本上保留了CRE0104作为心肌特异性启动子元件的能力。例如,当CRE0104的功能变体被替换到心肌特异性启动子SP0489中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0489活性的100%。适当地,CRE0104的功能变体包含与SEQ ID NO:472具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0104或其功能变体或由CRE0104或其功能变体组成的启动子元件具有400个或更少的核苷酸、300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:446的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:446的序列的启动子被称为SP0489。SP0489启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0490及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0106。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0106。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。在一些优选实施方案中,启动子元件是CRE0110或其功能变体。CRE0110是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0106,然后是CRE0110。CRE0106的序列及其变体如上所述。CRE0110的序列及其变体如上所述
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:447的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:447的序列的启动子被称为SP0490。SP0490启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0491及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0107。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0107。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0110或其功能变体。CRE0110是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0107,然后是CRE0110。CRE0107的序列及其变体如上所述。CRE0110的序列及其变体如上所述
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:448的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:448的序列的启动子被称为SP0491。SP0491启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0492及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0106。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0106。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0116或其功能变体。CRE0116是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0106,然后是CRE0116。CRE0106的序列及其变体如上所述。CRE0116的序列及其变体如上所述
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:449的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:449的序列的启动子被称为SP0492。SP0492启动子在一些实施方案中是特别优选的。预计该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0493及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0107。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0107。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0116或其功能变体。CRE0116是心肌特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0107,然后是CRE0116。CRE0107的序列及其变体如上所述。CRE0116的序列及其变体如上所述
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:450的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:450的序列的启动子被称为SP0493。SP0493启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0494及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含可操作地连接至启动子元件的CRE0118。在一些优选实施方案中,合成的心肌特异性启动子包含紧邻启动子元件上游的CRE0118。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0118,然后是SKM_18。
CRE0118具有根据SEQ ID NO:470的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0118的功能变体是具有与CRE0118不同但基本上保留了作为心肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0118的功能变体可以被视为当在启动子中取代CRE0118时基本上保留其活性的CRE。例如,包含取代CRE0118的CRE0118的功能变体的心肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0494为例,SP00494中的CRE0118可以被CRE0118的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0118或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:470的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:470的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0118或其功能变体具有300个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:451的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:451的序列的启动子被称为SP0494。SP0494启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0495及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含顺式调节元件CRE0106和CRE0033或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0106、CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0033、CRE0106,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0116或其功能变体。CRE0116是心肌特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0106、CRE0033和CRE0116,或其功能变体。CRE0106的序列及其变体如上所述。CRE0033的序列及其变体如上所述。CRE0116的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:452的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:452的序列的启动子被称为SP0495。SP0495启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0496及其变体
在一些实施方案中,启动子是合成的心肌特异性启动子,其包含顺式调节元件CRE0107和CRE0033或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0107、CRE0033,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,心肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0033、CRE0107,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或心肌特异性的。
在一些优选实施方案中,启动子元件是CRE0116或其功能变体。CRE0116是心肌特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0107、CRE0033和CRE0116,或其功能变体。CRE0106[qhm1]的序列及其变体如上所述。CRE0033的序列及其变体如上所述。CRE0116的序列及其变体如上所述。
在一些实施方案中,心肌特异性启动子包含根据SEQ ID NO:453的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:453的序列的启动子被称为SP0496。SP0496启动子在一些实施方案中是特别优选的。已发现该启动子对心肌具有特异性,这在某些情况下是有利的。
SP0227及其变体
在一些实施方案中,启动子是合成的骨骼肌特异性启动子,其包含可操作地连接至启动子元件的CRE0020。在一些优选实施方案中,合成的骨骼肌特异性启动子包含紧邻启动子元件上游的CRE0020。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。
在一些优选实施方案中,启动子元件是CRE0049或其功能变体。CRE0049是肌肉特异性近端启动子。
在一些实施方案中,骨骼肌特异性启动子包含以下元件(或其功能变体):CRE0020,然后是CRE0049。
CRE0020具有根据SEQ ID NO:303的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0020的功能变体是具有与CRE0020不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0020的功能变体可以被视为当在启动子中取代CRE0020时基本上保留其活性的CRE。例如,包含取代CRE0020的CRE0020的功能变体的骨骼肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0227为例,SP0227中的CRE0020可以被CRE0020的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0020或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:303的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:303的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0020或其功能变体具有300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、或100个或更少的核苷酸的长度。
CRE0049具有根据SEQ ID NO:278的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0049的功能变体基本上保留了CRE0049作为骨骼肌特异性启动子元件的能力。例如,当CRE0049的功能变体被替换到骨骼肌特异性启动子SP0227中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0227活性的100%。适当地,CRE0049的功能变体包含与SEQ IDNO:278具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0049或其功能变体或由CRE0082或其功能变体组成的启动子元件具有400个或更少的核苷酸、350个或更少的核苷酸、300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的核苷酸、110个或更少的长度核苷酸、或95个或更少的核苷酸的长度。
在一些实施方案中,骨骼肌特异性启动子包含根据SEQ ID NO:47的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:47的序列的启动子被称为SP0227。SP0227启动子在一些实施方案中是特别优选的。已发现该启动子对骨骼肌非常特异,这在某些情况下是有利的。
SP0407及其变体
在一些实施方案中,启动子是合成的骨骼肌特异性启动子,其包含顺式调节元件CRE0080和CRE0081或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,骨骼肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0080、CRE0081,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,骨骼肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0081、CRE0080,然后是启动子元件。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或骨骼肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0080、CRE0081和SKM_18,或其功能变体。
CRE0080具有根据SEQ ID NO:401的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0080的功能变体是具有与CRE0080不同但基本上保留了作为骨骼肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0080的功能变体可以被视为当在启动子中取代CRE0080时基本上保留其活性的CRE。例如,包含取代CRE0080的CRE0080的功能变体的骨骼肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0407为例,SP0407中的CRE0080可以被CRE0080的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0080或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:401的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:401的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0080或其功能变体具有150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸、90个或更少的核苷酸、或80个或更少的核苷酸的长度。
CRE0081具有根据SEQ ID NO:402的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0081的功能变体是具有与CRE0081不同但基本上保留了作为骨骼肌特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0081的功能变体可以被视为当在启动子中取代CRE0081时基本上保留其活性的CRE。例如,包含取代CRE0081的CRE0081的功能变体的骨骼肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0407为例,SP0407中的CRE0081可以被CRE0081的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0081或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:402的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:402的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方案中,CRE0081或其功能变体具有150个或更少的核苷酸、125个或更少的核苷酸、100个或更少的核苷酸、90个或更少的核苷酸、80个或更少的核苷酸、70个或更少的核苷酸、或60个或更少的核苷酸的长度。
SKM_18的序列及其变体如上所述。
在一些实施方案中,骨骼肌特异性启动子包含根据SEQ ID NO:342的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:342的序列的启动子被称为SP0407。SP0407启动子在一些实施方案中是特别优选的。已发现该启动子对骨骼肌非常特异,这在某些情况下是有利的。
SP0418及其变体
在一些实施方案中,启动子是合成的骨骼肌特异性启动子,其包含顺式调节元件CRE0083和CRE0090或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,骨骼肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0083、CRE0090,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,骨骼肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0090、CRE0083,然后是启动子元件。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或骨骼肌特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0083、CRE0090和SKM_18,或其功能变体。
CRE0083具有根据SEQ ID NO:403的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0083的功能变体是具有与CRE0083不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0083的功能变体可以被视为当在启动子中取代CRE0083时基本上保留其活性的CRE。例如,包含取代CRE0083的CRE0083的功能变体的骨骼肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0418为例,SP0418中的CRE0083可以被CRE0083的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0083或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:403的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:403的序列或其功能变体的单链核酸也落入本发明的范围内。
CRE0090具有根据SEQ ID NO:409的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0090的功能变体是具有与CRE0090不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0090的功能变体可以被视为当在启动子中取代CRE0090时基本上保留其活性的CRE。例如,包含取代CRE0090的CRE0090的功能变体的骨骼肌特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0418为例,SP0418中的CRE0090可以被CRE0090的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0090或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:409的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:409的序列或其功能变体的单链核酸也落入本发明的范围内。
SKM_18的序列及其变体如上所述。
在一些实施方案中,骨骼肌特异性启动子包含根据SEQ ID NO:353的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:353的序列的启动子被称为SP0418。SP0418启动子在一些实施方案中是特别优选的。已发现该启动子对骨骼肌非常特异,这在某些情况下是有利的。
SP0446及其变体
在一些实施方案中,启动子是合成的骨骼肌特异性启动子,其包含顺式调节元件CRE0080和CRE0081或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,骨骼肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0080、CRE0081,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,骨骼肌特异性启动子包含所述CRE或其功能变体,顺序为CRE0081、CRE0080,然后是启动子元件。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的或骨骼肌特异性的。在一些优选实施方案中,启动子元件是CRE0049或其功能变体。CRE0049是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0080、CRE0081和CRE0049,或其功能变体。CRE0080的序列及其变体如上所述。CRE0081的序列及其变体如上所述。CRE0049的序列及其变体如上所述。
在一些实施方案中,骨骼肌特异性启动子包含根据SEQ ID NO:487的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:487的序列的启动子被称为SP0446。SP0446启动子在一些实施方案中是特别优选的。已发现该启动子对骨骼肌非常特异,这在某些情况下是有利的。
SP0057及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含顺式调节元件CRE0029和CRE0071或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0029、CRE0071,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0071、CRE0029,然后是启动子元件。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。在一些优选实施方案中,启动子元件是CRE0070或其功能变体。CRE0070是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0029、CRE0071和CRE0070,或其功能变体。
CRE0029具有根据SEQ ID NO:307的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0029的功能变体是具有与CRE0029不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0029的功能变体可以被视为当在启动子中取代CRE0029时基本上保留其活性的CRE。例如,包含取代CRE0029的CRE0029的功能变体的肌肉特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0057为例,SP0057中的CRE0029可以被CRE0029的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0029或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:307的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:307的序列或其功能变体的单链核酸也落入本发明的范围内。
CRE0071具有根据SEQ ID NO:321的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0071的功能变体是具有与CRE0071不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0071的功能变体可以被视为当在启动子中取代CRE0071时基本上保留其活性的CRE。例如,包含取代CRE0071的CRE0029[qhm2]的功能变体的肌肉特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0057为例,SP0057中的CRE0071可以被CRE0071的功能变体取代,并且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0071或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:321的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:321的序列或其功能变体的单链核酸也落入本发明的范围内。
CRE0070的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:8的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:8的序列的启动子被称为SP0057。SP0057启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0134及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含顺式调节元件CRE0020和CRE0071或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0020、CRE0071,然后是启动子元件(顺序以从上游到下游方向的给出,如本领域常规的)。在一些实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0071、CRE0020,然后是启动子元件
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。在一些优选实施方案中,启动子元件是CRE0070或其功能变体。CRE0070是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0020、CRE0071和CRE0070,或其功能变体。CRE0020的序列及其变体如上所述。CRE0071的序列及其变体如上所述。CRE0070的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:24的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:24的序列的启动子被称为SP0134。SP0134启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0173及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含肌肉特异性近端启动子CRE0010和顺式调节元件CRE0035或其功能变体的组合。通常,肌肉特异性近端启动子CRE0010和顺式调节元件CRE0035可操作地连接至另一个启动子元件。在一些优选实施方案中,合成的肌肉特异性启动子包含所述近端启动子和CRE或其功能变体,顺序为CRE0010、CRE0035,然后是另一个启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些实施方案中,合成的肌肉特异性启动子包含所述近端启动子和CRE或其功能变体,顺序为CRE0035、CRE0010,然后是另一个启动子元件。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0010、CRE0035和SKM_18,或其功能变体。CRE0010(在本文中也称为CRE0010_ITGB1BP2)具有根据SEQ ID NO:272的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所讨论的,CRE0010的功能变体基本上保留了CRE0010作为肌肉特异性启动子元件的能力。例如,当CRE0010的功能变体被替换到肌肉特异性启动子SP0320中时,经修饰的启动子保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留SP0320活性的100%。适当地,CRE0010的功能变体包含与SEQ ID NO:272具有至少70%、80%、90%、95%或99%同一性的序列。
在一些优选实施方案中,包含CRE0010或其功能变体或由CRE0010或其功能变体组成的启动子元件具有400个或更少的核苷酸、300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、125个或更少的长度核苷酸、110个或更少的核苷酸、或95个或更少的核苷酸。
CRE0035具有根据SEQ ID NO:310的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0035的功能变体是具有与CRE0035不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0035的功能变体可以被视为当在启动子中取代CRE0035时基本上保留其活性的CRE。例如,包含取代CRE0035的CRE0035的功能变体的肌肉特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0173为例,SP0173中的CRE0035可以被CRE0035的功能变体取代,而且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0035或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:310的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:310的序列或其功能变体的单链核酸也落入本发明的范围内。
SKM_18的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:46的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:46的序列的启动子被称为SP0173。SP0173启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0279及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含顺式调节元件CRE0020和CRE0071或其功能变体的组合。通常,CRE可操作地连接至启动子元件。在一些优选实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0020、CRE0071,然后是启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些优选实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0071、CRE0020,然后是启动子元件。在一些优选实施方案中,肌肉特异性启动子包含所述CRE或其功能变体,顺序为CRE0020、CRE0071、启动子元件和CMV-IE 5’UTR和内含子(顺序以从上游到下游的方向给出,如本领域常规的)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。
在一些优选实施方案中,启动子元件是CRE0070或其功能变体。CRE0070是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0020、CRE0071、CRE0070和CMV-IE 5’UTR和内含子,或其功能变体。CRE0020的序列及其变体如上所述。CRE0071的序列及其变体如上所述。CRE0070的序列及其变体如上所述。CMV-IE 5’UTR和内含子的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:62的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:62的序列的启动子被称为SP0279。SP0279启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0286及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含可操作地连接至启动子元件的CRE0071。在一些优选实施方案中,合成的肌肉特异性启动子包含紧邻启动子元件上游的CRE0071。在一些优选实施方案中,合成的肌肉特异性启动子包含紧邻启动子元件上游的CRE0071和CMV-IE 5’UTR和内含子。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。
在一些优选实施方案中,启动子元件是CRE0070或其功能变体。CRE0070是肌肉特异性近端启动子。
在一些实施方案中,合成的肌肉特异性启动子包含以下元件(或其功能变体):CRE0071、CRE0070,然后是CMV-IE 5’UTR和内含子。CRE0071的序列及其变体如上所述。CRE0070的序列及其变体如上所述。CMV-IE 5’UTR和内含子的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:63的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:63的序列的启动子被称为SP0286。SP0286启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0310及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含可操作地连接至启动子元件的CRE0035。在一些优选实施方案中,合成的肌肉特异性启动子包含紧邻启动子元件上游的CRE0035。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。
在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0035,然后是SKM_18。CRE0035的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:68的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:68的序列的启动子被称为SP0310。SP0310启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0316及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含可操作地连接至启动子元件的CRE0050。在一些优选实施方案中,合成的肌肉特异性启动子包含紧邻启动子元件上游的CRE0050。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0050,然后是SKM_18。
CRE0050具有根据SEQ ID NO:313的序列。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0050的功能变体是具有与CRE0050不同但基本上保留了作为肌肉特异性CRE的活性的序列的调节元件。技术人员将理解,可以改变CRE的序列,同时保留其与必需转录因子(TF)结合和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使CRE基本上无功能。
在一些实施方案中,CRE0050的功能变体可以被视为当在启动子中取代CRE0035时基本上保留其活性的CRE。例如,包含取代CRE0050的CRE0035[qhm3]的功能变体的肌肉特异性启动子优选保留其活性的80%,更优选保留其活性的90%,更优选保留其活性的95%,还更优选保留其活性的100%。例如,以启动子SP0316为例,SP0316中的CRE0050可以被CRE0050的功能变体取代,而且启动子基本上保留其活性。可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。
应当注意,CRE0050或其功能变体可以在双链多核苷酸的任一条链上提供并且可以以任一方向提供。因此,SEQ ID NO:313的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:313的序列或其功能变体的单链核酸也落入本发明的范围内。
SKM_18的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:74的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:74的序列的启动子被称为SP0316。SP0316启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0320及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含肌肉特异性近端启动子CRE0010和顺式调节元件CRE0035或其功能变体的组合。通常,肌肉特异性近端启动子CRE0010和顺式调节元件CRE0035可操作地连接至另一个启动子元件。在一些优选实施方案中,合成的肌肉特异性启动子包含所述近端启动子和CRE或其功能变体,顺序为CRE0010、CRE0035,然后是另一个启动子元件(顺序以从上游到下游的方向给出,如本领域常规的)。在一些实施方案中,合成的肌肉特异性启动子包含所述近端启动子和CRE或其功能变体,顺序为CRE0035、CRE0010,然后是另一个启动子元件。在一些优选实施方案中,合成的肌肉特异性启动子包含所述近端启动子和CRE或其功能变体,顺序为CRE0010、CRE0035、另一个启动子元件,随后是CMV-IE 5’UTR和内含子。
另一个启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。
在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
因此,在一个实施方案中,启动子包含以下调节元件:CRE0010、CRE0035、SKM_18和CMV-IE 5’UTR和内含子,或其功能变体。CRE0010的序列及其变体如上所示。CRE0035的序列及其变体如上所述。SKM_18的序列及其变体如上所述。CMV-IE 5’UTR和内含子的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:75的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:75的序列的启动子被称为SP0320。SP0320启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
SP0326及其变体
在一些实施方案中,启动子是合成的肌肉特异性启动子,其包含可操作地连接至启动子元件的CRE0071。在一些优选实施方案中,合成的肌肉特异性启动子包含紧邻启动子元件上游的CRE0071。
启动子元件可以是任何合适的近端或最小启动子。在一些实施方案中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子是肌肉特异性的。
在一些优选实施方案中,启动子元件是SKM_18或其功能变体。SKM_18是肌肉特异性近端启动子。
在一些实施方案中,心肌特异性启动子包含以下元件(或其功能变体):CRE0071,然后是SKM_18。CRE0071的序列及其变体如上所述。SKM_18的序列及其变体如上所述。
在一些实施方案中,肌肉特异性启动子包含根据SEQ ID NO:80的序列或其功能变体。在一些实施方案中,功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:80的序列的启动子被称为SP0326。SP0326启动子在一些实施方案中是特别优选的。已发现该启动子对肌肉非常特异,这在某些情况下是有利的。
串联启动子
在一些实施方案中,合成的肌肉特异性启动子包含两个或更多个启动子元件。包含两个或更多个启动子元件的合成启动子在本文中称为“串联启动子”。例如,SP0452是串联启动子,因为它包含启动子元件CRE0082和SKM_18。SP0171是串联启动子,因为它包含启动子元件CRE0010和SKM_18。SP0173是串联启动子,因为它包含启动子元件CRE0010和SKM_18。SP0257是串联启动子,因为它包含启动子元件CRE0010和CRE0046。SP0262是串联启动子,因为它包含启动子元件CRE0010和CRE0054。SP0265是串联启动子,因为它包含启动子元件CRE0010和CRE0010_ALDOA。SP0266是串联启动子,因为它包含启动子元件CRE0010和CRE0010_ALDOA。SP0268是串联启动子,因为它包含启动子元件CRE0010和SKM_18。SP0270是串联启动子,因为它包含启动子元件CRE0055和DES_mp_v1。SP0305是串联启动子,因为它包含启动子元件CRE0010和SRL_mp。SP0320是串联启动子,因为它包含启动子元件CRE0010和SKM_18。SP0335是串联启动子,因为它包含启动子元件CRE0055和SRL_mp。SP0336是串联启动子,因为它包含启动子元件CRE0055和SRL_mp。SP0337是串联启动子,因为它包含启动子元件CRE0055和SKM_18。SP0338是串联启动子,因为它包含启动子元件CRE0055和DES_mp_v1。SP0339是串联启动子,因为它包含启动子元件CRE0055和DES_mp_v1。SP0340是串联启动子,因为它包含启动子元件CRE0046和SKM_18。SP0341是串联启动子,因为它包含启动子元件CRE0055和CRE0010。SP0452是串联启动子,因为它包含启动子元件CRE0082和SKM_18。
在一些实施方案中,串联启动子可以包含直接位于另一个启动子元件上游的启动子元件。在一些实施方案中,串联启动子可以在一个或每个启动子元件的上游包含一个或多个CRE。在一些实施方案中,串联启动子可以在启动子元件之间包含一个或多个CRE。在一些实施方案中,本文公开的任何一种合成的肌肉特异性启动子可以可操作地连接至另一个启动子元件。例如,SP0452是合成启动子SP0067可操作地连接至启动子元件CRE0082。应当理解,合成启动子SP0067可以可操作地连接至本文公开的任何其他启动子元件。类似地,本文公开的任何其他合成启动子可以可操作地连接至本文公开的任何启动子元件。
附图说明
-图1A-C显示了根据本发明实施方案的各种合成的肌肉特异性启动子在分化成骨骼肌管的C2C12细胞系和分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子RSV的活性。1的相对活性等于RSV的活性。误差线是标准偏差。
-图2显示了根据本发明实施方案的各种合成的肌肉特异性启动子在分化成骨骼肌管的C2C12细胞系和分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图3A-J显示了根据本发明实施方案的各种合成的肌肉特异性启动子在分化成骨骼肌管的H2K 2B4细胞系和分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图4显示了与已知启动子RSV的活性相比,根据本发明实施方案的各种合成的肌肉特异性启动子在胚胎肾细胞系HEK293细胞和肝细胞系Huh7(即非肌肉来源的细胞)中的平均活性。
-图5显示了与已知启动子CBA的活性相比,根据本发明实施方案的各种合成的肌肉特异性启动子在肝细胞系Huh7(即非肌肉来源的细胞)中的平均活性。图4和图5中的实验表明,根据本发明实施方案的测试的肌肉特异性启动子是肌肉特异性的,即与源自其他组织的细胞相比,它们在肌肉细胞或肌肉来源的细胞中显示出高得多的活性。
-图6A显示了图1A-C中呈现的C2C12细胞中的数据,但合成的肌肉特异性启动子已根据从C2C12细胞分化的骨骼肌管中的相对活性排列,其中具有最高相对活性的启动子在前。
-图6B显示了图1A-C中呈现的H9C2细胞中的数据,但合成的肌肉特异性启动子已根据从H9C2细胞分化的心肌管中的相对活性排列,其中具有最高相对活性的启动子在前。
-图7A显示了图2中呈现的C2C12细胞中的数据,但合成的肌肉特异性启动子已根据从C2C12细胞分化的骨骼肌管中的相对活性排列,其中具有最高相对活性的启动子在前。
-图7B显示了图2中呈现的H9C2细胞中的数据,但合成的肌肉特异性启动子已根据从H9C2细胞分化的心肌管中的相对活性排列,其中具有最高相对活性的启动子在前。
-图8A和8B显示了图3A-J中呈现的H2K 2B4细胞中的数据,但合成的肌肉特异性启动子已根据从H2K 2B4细胞分化的骨骼肌管中的相对活性排列,其中具有最高相对活性的启动子在前。
-图9A和9B显示了图3A-J中呈现的H9C2细胞中的数据,但合成的肌肉特异性启动子已根据从H9C2细胞分化的心肌管中的相对活性排列,其中具有最高相对活性的启动子在前。
-图10显示了在图1A-C所示的实验中用作对照启动子的已知启动子。
-图11A显示了在图2所示的实验中用作对照启动子的已知启动子。
-图11B显示了在图3A-J所示的实验中用作对照启动子的已知启动子。
-图12A-D显示了根据本发明实施方案的肌肉特异性启动子的示意图,其中标明了它们的顺式调节元件和最小或近端启动子。
-图13A显示了根据本发明实施方案的合成的心肌特异性启动子在分化成骨骼肌管的C2C12细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图13B显示了根据本发明实施方案的合成的心肌特异性启动子在分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图14A和B显示了根据本发明实施方案的合成的肌肉特异性启动子在分化成骨骼肌管的H2K 2B4和分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图15A、B、C、D和E显示了根据本发明实施方案的合成的肌肉特异性启动子在分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图16A显示了根据本发明实施方案的合成的心肌特异性启动子在分化成骨骼肌管的H2K细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图16B显示了根据本发明实施方案的合成的心肌特异性启动子在分化成心肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图17A显示了合成的肌肉特异性启动子、对照启动子CBA和CK8以及盐水阴性对照在心脏中的体内活性。
-图17B显示了合成的肌肉特异性启动子、对照启动子CBA和CK8以及盐水阴性对照在膈肌中的体内活性。
-图17C显示了合成的肌肉特异性启动子、对照启动子CBA和CK8以及盐水阴性对照在股四头肌中的体内活性。
-图17D显示了合成的肌肉特异性启动子、对照启动子CBA和CK8以及盐水阴性对照在肠中的体内活性。
-图17E显示了合成的肌肉特异性启动子、对照启动子CBA和CK8以及盐水阴性对照在胫骨前肌中的体内活性。
-图17F显示了合成的肌肉特异性启动子、对照启动子CBA和CK8以及盐水阴性对照在肝脏中的体内活性。
-图18A显示了合成的肌肉特异性启动子SP0173在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18B显示了合成的肌肉特异性启动子SP0270在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18C显示了合成的肌肉特异性启动子SP0268在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18D显示了合成的肌肉特异性启动子SP0320在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18E显示了合成的肌肉特异性启动子SP0279在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18F显示了合成的肌肉特异性启动子SP0134在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18G显示了合成的肌肉特异性启动子SP0057在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18H显示了合成的肌肉特异性启动子SP0229在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18I显示了合成的肌肉特异性启动子SP0067在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18J显示了合成的肌肉特异性启动子SP0310在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图18K显示了合成的肌肉特异性启动子SP0267在膈肌、心脏、肠、肝脏、股四头肌(quad)和胫骨前肌(TA)中的体内活性。
-图19A显示了与对照启动子CBA和CK8相比,启动子SP0067在小鼠心肌中的体内活性。
-图19B显示了与对照启动子CBA和CK8相比,启动子SP0067在小鼠胫骨前肌(TA)中的体内活性。
-图20A和B显示了根据本发明实施方案的合成的肌肉特异性启动子在分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。1的相对活性等于CBA的活性。误差线是标准偏差。
-图21A显示了具有特定数量的核心心脏和骨骼CRE的启动子与具有特定数量的CRE(任意CRE)的启动子相比在H9C2和C2C12细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1或2个任意CRE的启动子相比,1或2个核心心脏和骨骼CRE的存在与活性增加有关。核心心脏和骨骼CRE是由以下组成的组:CRE0035(SEQ IDNO:310)、CRE0036(SEQ ID NO:311)、CRE0029(SEQ ID NO:307)、CRE0071(SEQ ID NO:321)、CRE0020(SEQ ID NO:303)、CRE0031(SEQ ID NO:308)。图21B显示了H9C2和C2C12细胞中大量肌肉特异性启动子(组“ALL”)和包含至少两个核心骨骼和心脏CRE的启动子(“组1”)的平均活性。“组1”(n=9)的平均活性是组“ALL”(n=103)的平均活性的四倍左右。
-图22A显示了具有特定数量的核心心脏和骨骼CRE和启动子元件的启动子与具有特定数量的元件(任意CRE、启动子元件或UTR/内含子)的启动子相比在H9C2和C2C12细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1、2或3个任意元件的启动子相比,1、2或3个核心心脏和骨骼CRE和启动子元件的存在与活性增加有关。核心心脏和骨骼CRE是由以下组成的组:CRE0035(SEQ ID NO:310)、CRE0036(SEQ ID NO:311)、CRE0029(SEQ ID NO:307)、CRE0071(SEQ ID NO:321)、CRE0020(SEQ ID NO:303)、CRE0031(SEQ ID NO:308)。核心心脏和骨骼启动子元件是由以下组成的组:CRE0037、CRE0070、SKM_18、CRE0010、CRE0049、CRE0048、CRE0011、SKM_14、CRE0046。
-图22B显示了大量肌肉特异性启动子(组“ALL”)和包含至少一种核心骨骼和心脏CRE和至少一种核心骨骼和心脏启动子元件的启动子(“组2”)在H9C2和C2C12细胞中的平均活性。“组2”(n=20)的平均活性是组“ALL”(n=103)的平均活性的两倍左右。
-图23A显示了具有特定数量的核心心脏和骨骼启动子元件的启动子与具有特定数量的元件(任意CRE、启动子元件或UTR/内含子)的启动子相比在H9C2和C2C12细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1或2个任意元件的启动子相比,1或2个核心心脏和骨骼启动子元件的存在与活性增加有关。核心心脏和骨骼启动子元件是由以下组成的组:CRE0037、CRE0070、SKM_18、CRE0010、CRE0049、CRE0048、CRE0011、SKM_14、CRE0046。
-图23B显示了大量肌肉特异性启动子(组“ALL”)和包含至少两个核心骨骼和心脏启动子元件的启动子(“组3”)在H9C2和C2C12细胞中的平均活性。“组3”(n=2)的平均活性是组“ALL”(n=103)的平均活性的两倍左右。
-图24A显示了具有特定数量的核心骨骼CRE的启动子与具有特定数量的CRE(任意CRE)的启动子相比在C2C12细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1或2个任意CRE的启动子相比,1或2个核心骨骼CRE的存在与活性增加有关。核心心脏和骨骼CRE是由以下组成的组:CRE0035、CRE0050、CRE0020、CRE0031、CRE0047、CRE0071、DES_MT_增强子_48bp。
-图24B显示了大量肌肉特异性启动子(组“ALL”)和包含至少两个核心骨骼CRE的启动子(“组3”)在C2C12细胞中的平均活性。“组4”(n=6)的平均活性是组“ALL”(n=104)的平均活性的两倍左右。
-图25A显示了具有特定数量的核心骨骼CRE和启动子元件的启动子与具有特定数量的元件(任意CRE、启动子元件或UTR/内含子)的启动子相比在C2C12细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1、2或3个任意元件的启动子相比,1、2或3个核心骨骼CRE和启动子元件的存在与活性增加有关。核心骨骼CRE是由以下组成的组:CRE0035、CRE0050、CRE0020、CRE0031、CRE0047、CRE0071、DES_MT_增强子_48bp。核心骨骼启动子元件是由CRE0049、CRE0037、SKM_14_CRE0048、CRE0011_RSV、CRE0070和CRE0046组成的组。
-图25B显示了大量肌肉特异性启动子(组“ALL”)和包含至少一个核心骨骼CRE和至少一个核心骨骼启动子元件的启动子(“组5”)在C2C12细胞中的平均活性。“组5”(n=16)的平均活性是组“ALL”(n=104)的平均活性的两倍左右。
-图26A显示了具有特定数量的核心心脏CRE的启动子与具有特定数量的CRE(任意CRE)的启动子相比在H9C2细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1、2或3个任意CRE的启动子相比,1、2或3个核心心脏CRE的存在与活性增加有关。核心心脏CRE是由以下组成的组:CRE0035、CRE0029、CRE0069、CRE0071、CRE0036、CRE0096、CRE0079、CRE0051、CRE0031和CRE0020。
-图26B显示了大量肌肉特异性启动子(组“ALL”)和包含至少两个核心心脏CRE的启动子(“组6”)在H9C2细胞中的平均活性。“组6”(n=40)的平均活性是组“ALL”(n=285)的平均活性的两倍左右。
-图27A显示了具有特定数量的核心心脏CRE和启动子元件的启动子与具有特定数量的元件(任意CRE、启动子元件或UTR/内含子)的启动子相比在H9C2细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1、2或3个任意元件的启动子相比,1、2或3个核心心脏CRE和启动子元件的存在与活性增加有关。核心心脏CRE是由以下组成的组:CRE0035、CRE0029、CRE0069、CRE0071、CRE0036、CRE0096、CRE0079、CRE0051、CRE0031和CRE0020。核心心脏启动子元件是:SKM_18、CRE0070、CRE0010_ITGB1BP2、CRE0037、DES_mp_V1和CRE0046。
-图27B显示了大量肌肉特异性启动子(组“ALL”)和包含至少一个核心心脏CRE和至少一个核心心脏启动子元件的启动子(“组7”)在H9C2细胞中的平均活性。“组7”(n=73)的平均活性是组“ALL”(n=285)的平均活性的两倍左右。
-图28A显示了具有特定数量的核心心脏启动子元件的启动子与具有特定数量的元件(任意CRE、启动子元件或UTR/内含子)的启动子相比在H9C2细胞中的平均活性。已将启动子的活性标准化为已知启动子CBA或RSV的活性。与具有1或2个任意元件的启动子相比,1或2个核心心脏启动子元件的存在与活性增加有关。核心心脏和骨骼启动子元件是由以下组成的组:SKM_18、CRE0070、CRE0010_ITGB1BP2、CRE0037、DES_mp_V1和CRE0046。
-图28B显示了大量肌肉特异性启动子(组“ALL”)和包含至少两个核心心脏启动子元件的启动子(“组8”)在H9C2细胞中的平均活性。“组8”(n=5)的平均活性是组“ALL”(n=285)的平均活性的三倍左右。
-图29A显示了启动子元件SKM_18和合成的肌肉特异性启动子SP0067和SP00436在分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。与SKM_18相比,添加一个CRE0033(SP0067)或两个CRE0033(SP0436)可增加在心肌中的活性。误差线是标准偏差。
-图29B显示了合成的肌肉特异性启动子SP0409和SP00418在分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。与SP0409相比,在合成启动子SP0409中添加CRE0090(SP0418)可增加在心肌中的活性。误差线是标准偏差。
-图29C显示了合成的肌肉特异性启动子SP0067和SP00451在分化成心脏肌管的H9C2细胞系中的平均活性,其被标准化为已知启动子CBA的活性。与SP0067相比,在合成启动子SP0067中添加CRE0090(SP0451)可增加在心肌中的活性。误差线是标准偏差。
具体实施方式
CRE及其功能变体:
本文公开了可用于构建肌肉特异性启动子的各种CRE。这些CRE通常来源于基因组启动子和增强子序列,但它们在本文中用于与其天然基因组环境完全不同的环境中。一般来说,CRE构成了更大的基因组调控域的一小部分,这些调控域控制着与它们通常相关的基因的表达。令人惊讶地发现,这些CRE,其中许多非常小,可以从它们的正常环境中分离出来,并在用于构建各种合成启动子时保留肌肉特异性调节活性。这是令人惊讶的,因为从基因组中复杂的“三维”天然环境中移除调节序列通常会导致活性显著丧失,因此没有理由期望给定的CRE在从他们的天然环境中移除时保留曾经观察到的活性水平。已经测试了这些CRE的许多组合,发现当与最小和近端启动子组合时,它们在增强肌肉特异性启动子活性方面非常有效。应该注意的是,可以改变本发明的CRE的序列而不会导致活性的显著丧失。CRE的功能变体可以通过修饰CRE的序列来制备,前提是避免对CRE活性明显有害的修饰。鉴于本公开中提供的信息,修饰CRE以提供功能变体是简单的。此外,本公开提供了用于简单地评估任何给定CRE变体的功能的方法。下面讨论每个CRE的功能变体。
根据本发明的一些CRE的功能变体显示在表11中。CRE0020.2(SEQ ID NO:411)、CRE0093(SEQ ID NO:412)、CRE0094(SEQ ID NO:413)、CRE0093.2(SEQ ID NO:545)和CRE0094.2(SEQ ID NO:546)是CRE0020(SEQ ID NO:303)的功能变体,反之亦然。CRE0117(SEQ ID NO:469)是CRE0028(SEQ ID NO:306)的功能变体,反之亦然。CRE0029.2(SEQ IDNO:395)是CRE0029(SEQ ID NO:307)的功能变体,反之亦然。CRE0108(SEQ ID NO:465)是CRE0033(SEQ ID NO:309)的功能变体,反之亦然。CRE0050(SEQ ID NO:313)和CRE0099(SEQID NO:300)是CRE0035(SEQ ID NO:310)的功能变体。DES_MT_增强子_48bp(SEQ ID NO:547)、DES_MT_增强子_48bp_v2(SEQ ID NO:335)、DES_MT_增强子_48bp_v3(SEQ ID NO:336)、DES_MT_增强子_72bp(SEQ ID NO:400)、DES_MT_增强子_72bp_v2(SEQ ID NO:337)、DES_MT_增强子_72bp_v3(SEQ ID NO:338)、DES_MT_增强子_72bp_v4(SEQ ID NO:339)、DES_MT_增强子_72bp_v5(SEQ ID NO:340)、DES_MT_增强子_72bp_v6(SEQ ID NO:341)、CRE0059(SEQ ID NO:317)和CRE0060(SEQ ID NO:318)是CRE0047(SEQ ID NO:312)的功能变体。CRE0084(SEQ ID NO:404)是CRE0052(SEQ ID NO:315)的功能变体,反之亦然。CRE0069.2(SEQ ID NO:396)是CRE0069(SEQ ID NO:320)的功能变体,反之亦然。CRE0051(SEQ ID NO:314)、CRE0071.2(SEQ ID NO:323)、CRE0071.3(SEQ ID NO:293)、CRE0071.4(SEQ ID NO:294)、CRE0071.5(SEQ ID NO:537)、CRE0071.6(SEQ ID NO:295)、CRE0071.7(SEQ ID NO:331)、CRE0071.8(SEQ ID NO:296)、CRE0071.9(SEQ ID NO:297)、CRE0071.10(SEQ ID NO:332)、CRE0071.11(SEQ ID NO:333)、CRE0071.12(SEQ ID NO:334)、CRE0071.13(SEQ ID NO:397)、CRE0071.14(SEQ ID NO:398)、CRE0071.15(SEQ ID NO:399)、CRE0071.16(SEQ ID NO:533)、CRE0071.17(SEQ ID NO:534)、CRE0071.18(SEQ IDNO:535)、CRE0071.19(SEQ ID NO:536)、CRE0071.20(SEQ ID NO:538)、CRE0071.21(SEQ IDNO:539)、CRE0071.22(SEQ ID NO:540)、CRE0071.23(SEQ ID NO:541),CRE0071.24(SEQ IDNO:543)是CRE0071(SEQ ID NO:321)的功能变体,反之亦然。CRE0074(SEQ ID NO:325)和CRE0075(SEQ ID NO:326)是CRE0073(SEQ ID NO:324)的功能变体,反之亦然。CRE0077(SEQID NO:298)是CRE0076(SEQ ID NO:327)的功能变体,反之亦然。CRE0092(SEQ ID NO:420)是CRE0081(SEQ ID NO:402)的功能变体,反之亦然。CRE0091(SEQ ID NO:410)是CRE0090(SEQ ID NO:409)的功能变体,反之亦然。
根据本发明的某些CRE的相对较小的尺寸是有利的,因为它允许在载体中提供CRE,更具体地,包含它们的启动子,同时占用最小量的载体有效载荷。当CRE用于容量有限的载体如基于AAV的载体时,这一点尤其重要。
本发明的CRE包含某些肌肉特异性TFBS。通常希望在CRE的功能变体中,这些肌肉特异性TFBS保留功能。本领域技术人员非常清楚TFBS序列可以变化但仍保留功能。鉴于此,TFBS的序列通常由共有序列来说明,其中通常存在某种程度的变异。可以使用位置权重矩阵(PWM)来说明有关TFBS中发生的变异的更多信息,该矩阵表示给定核苷酸在共有序列中的给定位置处通常发现的频率。TF共有序列和相关位置权重矩阵的详细信息可以在例如Jaspar或Transfac数据库(http://jaspar.genereg.net/和http://gene-regulation.com/pub/databases.html)中找到。该信息允许技术人员以保留并且在一些情况下甚至增加CRE功能的方式修饰CRE的任何给定TFBS中的序列。鉴于此,技术人员对如何修饰任何给定TF的TFBS同时保留结合所需TF的能力有充分的指导;例如,Jaspar系统将根据其与给定PWM的相似性对推定的TFBS进行评分。此外,可以针对JASPAR数据库中的所有PWM扫描CRE,以鉴定/分析所有TFBS。技术人员当然可以在文献中找到另外的指导,此外,可以使用常规实验来确认TF与任何变体CRE中的推定TFBS的结合。很明显,即使在CRE中的TFBS内,CRE中的显著序列修饰也可以在保留功能的同时进行。
合成的肌肉特异性CRM及其功能变体:
本文公开了可用于构建合成的肌肉特异性启动子的各种合成的肌肉特异性CRM。本发明的CRM可以与范围广泛的合适的最小启动子或肌肉特异性近端启动子组合使用。
CRM的功能变体包括与参考CRM元件不同但基本上保留了作为肌肉特异性CRM的活性的序列。技术人员将理解,可以改变CRM的序列,同时保留其募集合适的肌肉特异性转录因子(TF)从而增强表达的能力。与参考CRE相比,CRM的功能变体可以包含替换、缺失和/或插入,只要它们不会使CRM基本上无功能。
在一些实施方案中,CRM的功能变体可以被视为当在启动子中取代参考CRM时基本上保留其活性的CRM。例如,包含给定CRM的功能变体的肌肉特异性启动子优选保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留其活性的100%(与包含未经修饰CRM的参考启动子相比)。
适当地,CRM的功能变体与参考CRM保持显著水平的序列同一性。适当地,功能变体包含与参考CRM至少70%相同,更优选与参考CRM至少80%、90%、95%或99%相同的序列。
可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的CRE的其他相同启动子在等同条件下的表达来评估活性的保留。用于评估肌肉特异性启动子活性的合适测定法在本文中公开,例如在实施例中。
在一些实施方案中,给定CRM的功能变体可以包含参考CRM中存在的一个或多个CRE的功能变体。例如,给定CRM的功能变体可以包含参考CRE中存在的1、2、3、4、5或6个CRE的功能变体。
在一些实施方案中,给定CRM的功能变体可以包含与参考CRM相同的组合CRE,但是CRE可以以与参考CRM不同的顺序存在。通常优选的是,CRE以与参考CRM相同的顺序存在(因此,适当地CRM的功能变体包括与参考CRE中列出的CRE相同的排列)。
在一些实施方案中,给定CRM的功能变体可以包含一个或多个另外的CRE,而不是参考CRM中存在的那些。可以在参考CRM中存在的CRE的上游、参考CRM中存在的CRE的下游和/或参考CRM中存在的CRE之间提供另外的CRE。另外的CRE可以是本文公开的CRE,或者它们可以是其他的CRE。通常,优选给定CRM的功能变体包含相同的CRE(或其功能变体)并且不包含另外的CRE。
与参考CRM相比,给定CRM的功能变体可以包含一个或多个另外的调节元件。例如,它们可以包括可诱导或可抑制元件、边界控制元件、绝缘体、基因座控制区、响应元件、结合位点、末端重复片段、响应位点、稳定元件、去稳定元件和剪接元件等,只要它们不会使CRM基本上无功能。
给定CRM的功能变体可以包含相邻CRE之间的另外的间隔区,或者,如果参考CRM中存在一个或多个间隔区,则所述一个或多个间隔区可以比参考CRM中更长或更短。
显然,本文公开的CRM或其功能变体可以与任何合适的启动子元件组合以提供根据本发明的合成的肌肉特异性启动子。
在许多情况下,较短的启动子序列是优选的,特别是在载体(例如病毒载体,如AAV)容量有限的情况下使用。因此,在一些实施方案中,合成的肌肉特异性CRM具有500个或更少的核苷酸的长度,例如450、400、350、300、250、200、150、100、75、60、50个或更少的核苷酸。
启动子元件及其功能变体:
本发明的CRE和CRM可以与广泛的合适的最小启动子或肌肉特异性近端启动子(统称为启动子元件)组合使用。
启动子元件的功能变体包括与参考启动子元件不同但基本上保留作为肌肉特异性启动子元件的活性的序列。技术人员将理解,可以改变启动子元件的序列,同时保留其促进表达的能力。与参考启动子元件相比,启动子元件的功能变体可以包含替换、缺失和/或插入,只要它们不会使启动子元件基本上无功能。
在一些实施方案中,启动子元件的功能变体可以被视为当在合成启动子中取代参考启动子元件时基本上保留其活性的启动子元件。例如,包含给定启动子的功能变体的肌肉特异性合成启动子优选保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留其活性的100%(与包含未经修饰的启动子元件的参考启动子相比)。
适当地,启动子元件的功能变体与参考启动子元件保持显著水平的序列同一性。适当地,功能变体包含与参考启动子元件至少70%相同,更优选与参考启动子元件至少80%、90%、95%或99%相同的序列。
可以通过比较合适报告基因在参考启动子控制下的表达与包含替换的启动子元件的其他相同启动子在等同条件下的表达来评估活性的保留。用于评估肌肉特异性启动子活性的合适测定法在本文中公开,例如在实施例中。
根据本发明的一些启动子元件的功能变体显示在表11中。例如,CRE0055(SEQ IDNO:282)、CRE0056(SEQ ID NO:283)和CRE0072(SEQ ID NO:286)是CRE0010_ITGB1BP2(SEQID NO:272)的功能变体,反之亦然。CRE0034(SEQ ID NO:274)是CRE0049(SEQ ID NO:278)的功能变体,反之亦然。CRE0053.2(SEQ ID NO:280)是CRE0053(SEQ ID NO:279)的功能变体,反之亦然。CRE0054(SEQ ID NO:281)和CRE0046(SEQ ID NO:276)是CRE0070(SEQ IDNO:284)的功能变体,反之亦然。
合成的肌肉特异性启动子及其功能变体:
本文公开了多种合成的肌肉特异性启动子。参考合成肌肉特异性启动子的功能变体是包含不同于参考合成肌肉特异性启动子但基本上保留肌肉特异性启动子活性的序列的启动子。技术人员将理解,可以改变合成的肌肉特异性启动子的序列,同时保持其募集合适的肌肉特异性转录因子(TF)和募集RNA聚合酶II以提供可操作地连接的序列(例如开放阅读框)的肌肉特异性表达的能力。与参考启动子相比,合成的肌肉特异性启动子的功能变体可以包含替换、缺失和/或插入,只要此类替换、缺失和/或插入不会使合成的肌肉特异性启动子与参考启动子相比基本上无功能。
因此,在一些实施方案中,合成的肌肉特异性启动子的功能变体可以被视为基本上保留参考启动子的肌肉特异性启动子活性的变体。例如,合成的肌肉特异性启动子的功能变体优选保留参考启动子活性的至少70%,更优选保留其活性的至少80%,更优选保留其活性的至少90%,更优选保留其活性的至少95%,还更优选保留其活性的100%。
合成的肌肉特异性启动子的功能变体通常与参考合成肌肉特异性启动子保持显著水平的序列相似性。在一些实施方案中,功能变体包含与参考合成肌肉特异性启动子至少70%相同,更优选与参考合成肌肉特异性启动子至少80%、90%、95%或99%相同的序列。
功能变体中的活性可以通过比较合适报告基因在参考合成肌肉特异性启动子控制下的表达与推定的功能变体在等同条件下的表达来评估。用于评估肌肉特异性启动子活性的合适测定法在本文中公开,例如在实施例中。
给定的合成肌肉特异性启动子的功能变体可以包含参考合成肌肉特异性启动子中存在的一个或多个CRE的功能变体。例如,给定CRM的功能变体可以包含参考CRM中存在的1、2、3、4、5或6个CRE。上文讨论了CRE的功能变体。
给定的合成肌肉特异性启动子的功能变体可以包含启动子元件的功能变体,或者当与参考合成肌肉特异性启动子相比时不同的启动子元件。
给定的合成肌肉特异性启动子的功能变体可以包含与参考合成肌肉特异性启动子相同的CRE,但CRE可以以与参考合成肌肉特异性启动子不同的顺序存在。
给定的合成肌肉特异性启动子的功能变体可以包含参考合成肌肉特异性启动子中存在的CRE之外的一个或多个另外的CRE。可以在参考CRM中存在的CRE上游、参考合成肌肉特异性启动子中存在的CRE下游和/或参考合成肌肉特异性启动子中存在的CRE之间提供另外的CRE。另外的CRE可以是本文公开的CRE,或者它们可以是其他的CRE。
与参考CRM相比,给定CRM的功能变体可以包含一个或多个另外的调节元件。例如,它们可以包含可诱导元件、内在元件、边界控制元件、绝缘体、基因座控制区、响应元件、结合位点、末端重复片段、响应位点、稳定元件、去稳定元件和剪接元件等,只要它们不会使启动子基本上无功能。
给定的合成肌肉特异性启动子的功能变体可以在相邻CRE和启动子元件之间包含另外的间隔区,或者,如果参考合成肌肉特异性启动子中存在一个或多个间隔区,则所述一个或多个间隔区可以比在参考合成肌肉特异性启动子中更长或更短。
显然,本发明的合成的肌肉特异性启动子可以包含本发明的CRM和另外的调节序列。例如,它们可以包含一个或多个另外的CRM、可诱导或可抑制元件、边界控制元件、绝缘体、基因座控制区、响应元件、结合位点、末端重复片段、响应位点、稳定元件、去稳定元件和剪接元件等,只要它们不会使启动子基本上无功能。
本发明优选的合成肌肉特异性启动子表现出肌肉特异性启动子活性,其为肌肉细胞中CBA或RSV启动子所表现出的活性的至少15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%。在许多情况下,优选更高水平的启动子活性,但并非总是如此;因此,在一些情况下,更适中的表达水平可能是优选的。在一些情况下,希望有一系列不同活性水平的启动子,以根据需要调整表达水平;本公开为启动子提供了这样的活性范围。通过比较报告基因在合成的肌肉特异性启动子控制下的肌肉特异性表达与相同报告基因在CBA或RSV启动子控制下的表达,可以评估本发明的给定的合成肌肉特异性启动子与CBA或RSV相比的活性,当这两个启动子以其他等同的表达构建体和在等同的条件提供时。
在一些实施方案中,本发明的合成的肌肉特异性启动子能够将受试者肌肉或肌肉细胞中基因(例如治疗性基因或目的基因)的表达相对于已知的肌肉特异性启动子(适当地SPc5-12启动子(Gene Ther.2008Nov;15(22):1489-99))增加至少20%、至少40%、至少60%、至少80%、至少100%、至少200%、至少300%、至少500%、至少1000%或更多。
本发明优选的合成肌肉特异性启动子在非肌肉细胞(例如Huh7和HEK293细胞)中表现出与CMV-IE相比为50%或更低,优选为CMV-IE的25%或更低,更优选为CMV-IE的10%或更低,并且在一些情况下为CMV-IE的5%或更低,或为CMV-IE的1%或更低的活性。
在许多情况下,较短的启动子序列是优选的,特别是在载体(例如病毒载体,如AAV)容量有限的情况下使用。因此,在一些实施方案中,合成的肌肉特异性启动子具有700个或更少的核苷酸,例如600、500、450、400、350、300、250、200、150、100、75、70、68个或更少的核苷酸的长度。
特别优选的合成的肌肉特异性启动子是那些既短又表现出高水平活性的启动子。
合成的肌肉特异性表达盒:
本发明还提供了合成的肌肉特异性表达盒,其包含本发明的合成的肌肉特异性启动子,所述合成的肌肉特异性启动子可操作地连接至编码表达产物的序列,适当地是基因(例如转基因)。
所述基因通常编码所需的基因表达产物,例如多肽(蛋白质)或RNA。所述基因可以是全长cDNA或基因组DNA序列,或其具有至少一些所需生物活性的任何片段、亚基或突变体。
在所述基因编码蛋白质的情况下,它基本上可以是任何类型的蛋白质。作为非限制性实例,所述蛋白质可以是酶、抗体或抗体片段(例如单克隆抗体)、病毒蛋白质(例如REP-CAP、REV、VSV-G或RD114)、治疗性蛋白质、或有毒蛋白质(例如半胱天冬酶3、8或9)。
在本发明的一些优选实施方案中,所述基因编码治疗性表达产物,优选适用于治疗与异常基因表达(可选地在肌肉中,可选地在心肌中)相关的疾病或病况的治疗性多肽。
在一些实施方案中,治疗性表达产物包括可用于治疗肌肉疾病的那些。原则上,术语“肌肉疾病”是技术人员所理解的。该术语涉及可通过将活性化合物施用于肌肉(特别是肌细胞)来治疗和/或预防的疾病。在一些实施方案中,所述肌肉疾病是骨骼肌疾病。在一些实施方案中,所述肌肉疾病是心肌疾病。
在一些实施方案中,所述肌肉疾病是血管疾病、肌营养不良症、心肌病、肌强直、肌萎缩、肌阵挛性肌张力障碍(受影响基因:SGCE)、线粒体肌病、横纹肌溶解症、纤维肌痛和/或肌筋膜疼痛综合征。
在一个实施方案中,所述疾病可以是心血管病况或心脏疾病和病症。在一个实施方案中,所述疾病可以是心力衰竭,例如充血性心力衰竭。在一个实施方案中,所述疾病可以选自缺血、心律失常、心肌梗塞(MI)、异常的心脏收缩力、非缺血性心肌病、外周动脉闭塞性疾病和Ca2+代谢异常及其组合。在一些实施方案中,所述疾病可以选自由以下组成的组:充血性心力衰竭、心肌病、心肌梗塞、组织缺血、心脏缺血、血管疾病、获得性心脏病、先天性心脏病、动脉粥样硬化、传导系统功能障碍、冠状动脉功能障碍、肺心性高血压。在一些实施方案中,所述疾病可以选自充血性心力衰竭、冠状动脉疾病、心肌梗塞、心肌缺血、动脉粥样硬化、心肌病、特发性心肌病、心律失常、肌营养不良症、肌肉质量异常、肌肉退化、感染性心肌炎、药物或毒素引起的肌肉异常、过敏性心肌炎、自身免疫性心内膜炎和先天性心脏病。
在一些实施方案中,心肌病是肥厚型心肌病、致心律失常性右心室发育不良、扩张型心肌病、限制性心肌病、左心室致密化不全、Takotsubo心肌病、心肌炎、嗜酸性心肌炎和缺血性心肌病。优选地,所述肥厚型心肌病是CMH1(基因:MYH7)、CMH2(基因:TNNT2)、CMH3(基因:TPM1)、CMH4(基因:MYBPC3)、CMH5、CMH6(基因:PRKAG2)、CMH7(基因:TNNI3)、CMH8(基因:MYL3)、CMH9(基因:TTN)、CMH10(基因:MYL2)、CMH11(基因:ACTC1)或CMH12(基因:CSRP3)。优选地,所述致心律失常性右心室发育不良是ARVD1(基因:TGFB3)、ARVD2(基因:RYR2)、ARVD3、ARVD4、ARVD5(基因:TMEM43)、ARVD6、ARVD7(基因:DES)、ARVD8(基因:DSP)、ARVD9(基因:PKP2)、ARVD10(基因:DSG2)、ARVD11(基因:DSC2)和/或ARVD12(基因:JUP)。
在一些实施方案中,所述肌肉疾病是血管疾病。所述血管疾病可以是冠状动脉疾病、外周动脉疾病、脑血管疾病、肾动脉狭窄或主动脉瘤。在一些实施方案中,所述肌肉疾病可以是心肌病。所述心肌病可以是高血压性心脏病、心力衰竭(如充血性心力衰竭)、肺心病、心律失常、炎性心脏病(如心内膜炎、炎性心脏肥大、心肌炎)、瓣膜性心脏病、先天性心脏病和风湿性心脏病。
在一些实施方案中,所述肌营养不良症是杜氏肌营养不良症(受影响基因:DMD)、Becker型肌营养不良症(受影响基因:DMD)、肢带型肌营养不良症(亚型和受影响基因:LGMD1A(基因:TTID)、LGMD1B(基因:LMNA)、LGMD1C(基因:CAV3)、LGMD1D(基因:DNAJB6)、LGMD1E(基因:DES)、LGMD1F(基因:TNP03)、LGMD1G(基因:HNRPDL)、LGMD1H、LGMD2A(基因:CAPN3)、LGMD2B(基因:DYSF)、LGMD2C(基因:SGCG)、LGMD2D(基因:SGCA)、LGMD2E(基因:SGCB)、LGMD2F(基因:SGCD)、LGMD2G(基因:TCAP)、LGMD2H(基因:TRIM32)、LGMD2I(基因:FKRP)、LGMD2J(基因:TTN)、LGMD2K(基因:POMT1)、LGMD2L(基因:AN05)、LGMD2M(基因:FKTN)、LGMD2N(基因:POMT2)、LGMD20(基因:POMGNT1)、LGMD2Q(基因:PLEC1))、先天性肌营养不良症、远端肌营养不良症(亚型和受影响基因:Miyoshi肌病(基因:DYSF)、前胫骨发病远端肌病(基因:DYSF)、Welander远端肌病(基因:TIA1)、Gowers-Laing远端肌病(基因:MYH7)、Nonaka远端肌病、遗传性包涵体肌炎y1型、伴有声带和咽部无力的远端肌病、ZASP相关肌病、面肩肱型肌营养不良症(亚型和受影响基因:1型(基因:DUX4)、2型(基因:SMCHD1))、眼咽部肌营养不良症(受影响基因:PABPN1)和/或肌强直性营养不良(亚型和受影响基因:DM1(基因:DMPK)和DM2(基因:ZNF9))。
在一些实施方案中,肌强直是先天性肌强直(受影响基因:CLCN1;亚型:Thomsen型、Becker型)和/或先天性副肌强直(受影响基因:SCN4A)。
在一些实施方案中,所述肌肉疾病是杜氏肌营养不良症(基因:DMD)、肌管肌病(基因:MTM1)、脊髓性肌萎缩症(基因:SMA)、II型糖原贮积病(庞贝病,基因:GAA)或心肌病。
在一些实施方案中,所述基因编码非疾病介导变体,例如至少一种选自由以下组成的组的人类基因的野生型变体:DMD GALGT2、SMA、GAA、MTM1、TTID、LMNA、CAV3、DNAJB6、DES、TNP03、HNRPDL、CAPN3、DYSF、SGCG、SGCA、SGCB、SGCD、TCAP、TRIM32、FKRP、TTN、POMT1、AN05、FKTN、POMT2、PFEC1、DYSF、TIA1、MYH7、DUX4、SMCHD、PABPN1、DMPK、ZNF9、CFCN1、SCN4A、MYH7、TNNT2、TPM1、MYBPC3、PRKAG2、TNNI3、MYF3、TTN、MYF2、ACTC1、CSRP3、TGFB3、RYR2、TMEM43、DES、DSP、PKP2、DSG2、DSC2、JUP和HYPP。
其他示例性肌肉组织相关疾病包括但不限于酸性麦芽糖酶缺乏症(AMD)、α1抗胰蛋白酶缺乏症、肌萎缩性侧索硬化症(ALS)、Andersen-Tawil综合征、Becker肌营养不良症(BMD)、Becker先天性肌强直、Bethlem肌病、肉碱缺乏症、肉碱棕榈基转移酶缺乏症(CPT缺乏症)、中枢核心疾病(CCD)、中央核肌病、腓骨肌萎缩症(CMT)、先天性肌无力综合征(CMS)、先天性肌强直性营养不良、Cori病(脱支酶缺乏症)、脱支酶缺乏症、Dejerine-Sottas病(DSD)、皮肌炎(DM)、内分泌肌病、Eulenberg病(先天性副肌强直)、Forbes病(脱支酶缺乏症)、Friedreich共济失调(FA)、10型糖原贮积、11型糖原贮积、2型糖原贮积、3型糖原贮积、5型糖原贮积、7型糖原贮积、9型糖原贮积、Gowers-Laing远端肌病、Hauptmann-ThanheuserMD(Emery-Dreifuss肌营养不良症)、遗传性包涵体肌炎、遗传性运动和感觉神经病(腓骨肌萎缩症)、甲状腺功能亢进性肌病、甲状腺功能减退性肌病、包涵体肌炎(IBM)、遗传性肌病、整合素缺陷型先天性肌营养不良症、乳酸脱氢酶缺乏症、Lambert-Eaton肌无力综合征(LEMS)、McArdle病(磷酸化酶缺乏症)、肌肉代谢疾病、线粒体肌病、Miyoshi远端肌病、运动神经元疾病、肌肉-眼-脑疾病、重症肌无力(MG)、肌腺苷酸脱氨酶缺乏症、肌原纤维肌病、肌磷酸化酶缺乏症、先天性肌强直(MC)、强直性肌营养不良症(MMD)、肌管肌病(MTM或MM)、杆状体肌病、Nonaka远端肌病、眼咽部肌营养不良症(OPMD)、先天性副肌强直、Pearson综合征、周期性瘫痪、腓骨肌萎缩症(腓骨肌萎缩症)、磷酸果糖激酶缺乏症、磷酸甘油酸激酶缺乏症、磷酸甘油酸变位酶缺乏症、磷酸化酶缺乏症、磷酸化酶缺乏症、多发性肌炎(PM)、庞贝病(酸性麦芽糖酶缺乏症)、进行性外眼肌麻痹(PEO)、杆状体病(杆状体肌病)、脊髓性肌萎缩症(SMA)、脊髓-延髓肌萎缩症(SBMA)、Steinert病(强直性肌营养不良症)、Tarui病(磷酸果糖激酶缺乏症)、Thomsen病(先天性肌强直症)、Ullrich先天性肌营养不良症、Walker-Warburg综合征(先天性肌营养不良症)、Welander远端肌病和ZASP相关肌病。
在一些优选实施方案中,所述肌肉疾病是心肌疾病。在一些优选实施方案中,所述肌肉疾病是充血性心力衰竭。
在一些实施方案中,有用的表达产物包括肌营养不良蛋白(包括微肌营养不良蛋白)、β1,4-n-乙酰半乳糖胺半乳糖基转移酶(GALGT2)、氨基甲酰合成酶I、α-1抗胰蛋白酶、鸟氨酸转氨甲酰酶、精氨基琥珀酸合成酶、精氨基琥珀酸裂合酶、精氨酸酶、富马酰乙酸水解酶、苯丙氨酸羟化酶、葡萄糖-6-磷酸酶、胆色素原脱氨酶、胱硫醚β-合酶、支链酮酸脱羧酶、白蛋白、异戊酰辅酶A脱氢酶、丙酰辅酶A羧化酶、甲基丙二酰辅酶A变位酶、戊二酰辅酶A脱氢酶、胰岛素、β-葡萄糖苷酶、丙酮酸羧酸盐、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H蛋白、T蛋白和囊性纤维化跨膜调节因子(CFTR)。
还有其他有用的表达产物包括可用于酶替代疗法的酶,并且其可用于由酶活性不足引起的多种病况。例如,含有甘露糖-6-磷酸的酶可用于溶酶体贮积病的治疗(例如,合适的基因包括编码β-葡萄糖醛酸酶(GUSB)的基因)。
在一些实施方案中,示例性多肽表达产物包括神经保护多肽和抗血管生成多肽。合适的多肽包括但不限于神经胶质源性神经营养因子(GDNF)、成纤维细胞生长因子2(FGF-2)、nurturin、睫状神经营养因子(CNTF)、神经生长因子(NGF;例如神经生长因子-.Beta.)、脑源性神经营养因子(BDNF)、神经营养因子-3(NT-3)、神经营养因子-4(NT-4)、神经营养因子-6(NT-6)、表皮生长因子(EGF)、色素上皮衍生因子(PEDF)、Wnt多肽、可溶性Fit-1、血管抑制素、内皮抑制素、VEGF、抗VEGF抗体、可溶性VEGFR、因子VIII(FVIII)、因子IX(FIX)和刺猬因子家族的成员(音猬因子、印度刺猬因子、沙漠刺猬因子等)。
在一些实施方案中,有用的治疗性表达产物包括激素和生长和分化因子,包括但不限于胰岛素、胰高血糖素、生长激素(GH)、甲状旁腺激素(PTH)、生长激素释放因子(GRF)、促卵泡激素(FSH)、黄体生成激素(LH)、人绒毛膜促性腺激素(hCG)、血管内皮生长因子(VEGF)、血管生成素、血管抑制素、粒细胞集落刺激因子(GCSF)、红细胞生成素(EPO)、结缔组织生长因子(CTGF)、碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、血小板衍生生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II),转化生长因子α超家族中的任何一种,包括TGFa.、激活素(activin)、抑制素(inhibin)或任何骨形态发生蛋白(BMP)BMP 1-15,生长因子的heregluin/神经调节素/ARIA/neu分化因子(NDF)家族中的任何一种,神经成长因子(NGF)、脑源性神经营养因子(BDNF)、神经营养因子NT-3和NT-4/5、睫状神经营养因子(CNTF)、胶质细胞源性神经营养因子(GDNF)、neurturin、集聚蛋白(agrin),信号素(semaphorins)/脑衰蛋白(collapsins)、netrin-1和netrin-2的家族中的任何一种,肝细胞生长因子(HGF)、ephrins、noggin、音猬因子和酪氨酸羟化酶。
在一些实施方案中,有用的表达产物包括调节免疫系统的蛋白质,包括但不限于细胞因子和淋巴因子,例如血小板生成素(TPO)、白细胞介素(IL)IL-1至IL-25(包括IL-2、IL-4、IL-12和IL-18)、单核细胞趋化蛋白、白血病抑制因子、粒细胞-巨噬细胞集落刺激因子、Fas配体、肿瘤坏死因子α和β、干扰素(α、β和γ)、干细胞因子、flk-2/flt3配体。免疫系统产生的基因产物也可用于本发明。这些包括但不限于免疫球蛋白IgG、IgM、IgA、IgD和IgE、嵌合免疫球蛋白、人源化抗体、单链抗体、T细胞受体、嵌合T细胞受体、单链T细胞受体、I类和II类MHC分子以及工程化的免疫球蛋白和MHC分子。有用的基因产物还包括补体调节蛋白,例如补体调节蛋白、膜辅因子蛋白(MCP)、衰变加速因子(DAF)、CR1、CF2和CD59。
在一些实施方案中,有用的表达产物包括激素、生长因子、细胞因子、淋巴因子、调节蛋白和免疫系统蛋白的受体中的任何一种。有用的异源核酸序列还包括用于胆固醇调节和/或脂质调节的受体,包括低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、极低密度脂蛋白(VLDL)受体和清道夫受体。本发明还包括使用基因产物,例如类固醇激素受体超家族的成员,包括糖皮质激素受体和雌激素受体、维生素D受体和其他核受体。此外,有用的基因产物包括转录因子如jun、fos、max、mad、血清反应因子(SRF)、AP-1、AP-2、myb、MyoD和肌细胞生成素(myogenin)、含ETS-box的蛋白质、TFE3、E2F、ATF1、ATF2、ATF3、ATF4、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT框结合蛋白、干扰素调节因子(IRF-1)、Wilms肿瘤蛋白、ETS结合蛋白、STAT、GATA框结合蛋白如GATA-3以及翼状螺旋蛋白的叉头(forkhead)家族。
在一些实施方案中,有用的表达产物包括用于治疗血友病的那些,包括血友病B(包括因子IX)和血友病A(包括因子VIII及其变体,例如异二聚体的轻链和重链以及B缺失的结构域;美国专利号6,200,560和美国专利号6,221,349)。
在一些实施方案中,有用的表达产物可以是磷酸酶活性(例如1型磷酸酶活性)的调节剂。调节剂可以是抑制磷酸酶活性(例如1型磷酸酶活性)的蛋白质。调节剂可以是增加编码抑制磷酸酶活性的蛋白质(例如转录因子)的内源性核酸的表达的核酸。调节剂可以是整合在编码抑制磷酸酶活性的蛋白质的内源性核酸中或附近的调节序列。调节剂可以是可以提供基因表达的核酸调节剂(例如siRNA)的核酸。
在一些实施方案中,有用的表达产物可以是磷酸蛋白1(PP1)的抑制剂,例如I-1多肽。磷酸酶抑制剂-1(或“I-1”)蛋白是1型磷酸酶的内源性抑制剂。增加I-1水平或活性可以恢复衰竭人心肌细胞的β-肾上腺素反应。适当地,I-1蛋白质可以是组成型活性的,例如其中苏氨酸35被谷氨酸取代而不是被天冬氨酸取代的I-1蛋白质。治疗性表达产物可以是选自以下的任何一种或多种抑制剂:磷酸酶抑制剂2(PP2);冈田酸或钙蛋白(caliculin);和nippl,它是蛋白磷酸酶1的内源性核抑制剂。
在一些实施方案中,有用的表达产物可以是调节心脏活性的任何蛋白质,例如1型磷酸酶抑制剂,例如I-1或sacroplasmic reticulum Ca2+ATP酶(SERCA),例如SERCA1(例如1a或1b)、SERCA2(例如2a或2b)或SERCA3。
在一些实施方案中,有用的表达产物可以是编码磷酸酶抑制剂1蛋白的突变形式的核酸序列,其中所述突变形式在野生型中PKC-α磷酸化位点的位置包含至少一个氨基酸,其中所述至少一个氨基酸是组成型未磷酸化的或模拟突变形式的未磷酸化状态。治疗性表达产物可以是腺苷酸环化酶6(AC6,也称为腺苷酸环化酶VI)、S100A1、β-肾上腺素受体激酶-ct(βARKct)、sarco/内质网(SR)Ca-ATP酶(SERCA2a)、IL-18、VEGF、VEGF激活剂、尿皮质素(urocortin)和B细胞淋巴瘤2(Bcl2)相关的anthanogene-3(BAG3)。
在一些实施方案中,有用的表达产物可以是细胞因子的抑制剂,例如IL-18抑制剂。治疗性表达产物可以编码β-肾上腺素信号传导传导蛋白(β-ASP)(包括β-肾上腺素受体(β-Ars)、G蛋白受体激酶抑制剂(GRK抑制剂)和腺苷酸环化酶(Acs))以增强心脏功能。
在一些实施方案中,有用的表达产物可以是血管生成蛋白。血管生成蛋白促进血管的发育和分化。血管生成蛋白的实例包括成纤维细胞生长因子(FGF)家族的成员如aFGF(FGF-1)、bFGF(FGF-2)、FGF-4(也称为“hst/KS3”)、FGF-5和FGF-6、血管内皮生长因子(VEGF)家族、血小板衍生生长因子(PDGF)家族、胰岛素样生长因子(IGF)家族等。
在一些实施方案中,有用的表达产物包括非天然存在的多肽,例如具有包含插入、缺失或氨基酸替换的非天然存在的氨基酸序列的嵌合或杂合多肽。
其他合适的表达产物包括微小RNA(miRNA)、干扰RNA、反义RNA、核酶和适体。
在一些优选实施方案中,表达产物是磷酸蛋白1(PP1)的抑制剂。
在本发明的一些实施方案中,合成的肌肉特异性表达盒包含可用于基因编辑的基因,例如,编码位点特异性核酸酶的基因,例如大范围核酸酶、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)或成簇的规则间隔短回文重复系统(CRISPR-Cas)。适当地,位点特异性核酸酶适于通过产生切口(通常是位点特异性双链断裂)来编辑所需的靶基因组基因座,然后通过非同源末端连接(NHEJ)或同源依赖修复(HDR)来修复切口,从而产生所需的编辑。所述编辑可以是部分或完全修复功能失调的基因,或者是功能基因的敲低或敲除。替代地,可以使用本领域已知的合适系统,通过碱基编辑或初始编辑进行编辑。
适当地,合成的肌肉特异性表达盒包含提供或编码核糖体结合位点、起始密码子、终止密码子和转录终止序列中的一个或多个(优选全部)的序列。适当地,所述表达盒包含编码转录后调节元件的核酸。适当地,所述表达盒包含编码聚腺苷酸元件的核酸。
载体和病毒颗粒:
本发明进一步提供了包含根据本发明的合成的肌肉特异性启动子或表达盒的载体。
在本发明的一些实施方案中,所述载体是质粒。这种质粒可以包括多种其他功能性核酸序列,例如一种或多种选择标记、一种或多种复制起点、多克隆位点等。在本发明的一些实施方案中,所述载体是病毒载体。
在本发明的一些实施方案中,所述载体是用于在真核细胞中表达的表达载体。真核表达载体的实例包括但不限于可从Stratagene获得的pW-LNEO、pSV2CAT、pOG44、pXT1和pSG;可从Amersham Pharmacia Biotech获得的pSVK3、pBPV、pMSG和pSVL;和可从Clontech获得的pCMVDsRed2-express、pIRES2-DsRed2、pDsRed2-Mito、pCMV-EGFP。许多其他载体是众所周知的并且是可商购的。对于哺乳动物细胞腺病毒载体,pSV和pCMV系列载体是特别众所周知的非限制性实例。有许多众所周知的酵母表达载体,包括但不限于酵母整合质粒(Yip)和酵母复制质粒(Yrp)。对于植物,农杆菌的Ti质粒是示例性的表达载体,植物病毒也提供合适的表达载体,例如烟草花叶病毒(TMV)、马铃薯病毒X和豇豆花叶病毒。
在一些优选实施方案中,所述载体是基因治疗载体。本领域已知各种基因治疗载体,可以提及AAV载体、腺病毒载体、逆转录病毒载体和慢病毒载体。当所述载体是基因治疗载体时,所述载体优选包含与本发明的合成的肌肉特异性启动子可操作地连接的核酸序列,所述核酸序列编码治疗性产物,适当地是治疗性蛋白质。治疗性蛋白质可以是可分泌的蛋白质。上文讨论了可分泌的蛋白质的非限制性实例,示例性的可分泌的治疗性蛋白质包括凝血因子,例如因子VIII或因子IX、胰岛素、促红细胞生成素、脂蛋白脂肪酶、抗体或纳米抗体、生长因子、细胞因子、趋化因子、血浆因子、有毒蛋白质等。
在本发明的一些实施方案中,所述载体是病毒载体,例如逆转录病毒、慢病毒、腺病毒或腺相关病毒(AAV)载体。在一些优选实施方案中,所述载体是AAV载体。在一些优选实施方案中,AAV具有适合肌肉转导的血清型。在一些实施方案中,AAV选自由以下组成的组:AAV2、AAV5、AAV6、AAV7、AAV8、AAV9 BNP116、rh10、AAV2.5、AAV2i8、AAVDJ8和AAV2G9,或其衍生物。AAV载体优选用作自互补双链AAV载体(scAAV),以克服AAV转导(即单链到双链AAV转换)中的限制步骤之一,尽管使用单链AAV载体(ssAAV)也包括在本文中。在本发明的一些实施方案中,AAV载体是嵌合的,意味着它包含来自至少两种AAV血清型的组分,例如AAV2的ITR和AAV5的衣壳蛋白。已知AAV9可以有效地转导骨骼肌和心肌,特别有效地,因此AAV9及其衍生物对于靶向骨骼肌和心肌特别有意义。还已知AAV1、AAV6、AAV7和AAV8靶向骨骼肌,因此这些AAV血清型及其衍生物对于靶向骨骼肌也特别有意义。还已知AAV1和AAV8靶向心肌,因此这些AAV血清型及其衍生物对于靶向心肌也特别有意义。在一些实施方案中,rAAV载体是AAV3b血清型,包括但不限于AAV3b265D病毒体、AAV3b265D549A病毒体、AAV3b549A病毒体、AAV3bQ263Y病毒体或AAV3bSASTG病毒体(即,包含含有Q263A/T265突变的AAV3b衣壳的病毒体)。在一些实施方案中,病毒体可以是合理的单倍体或嵌合体或任何突变体,例如可以定制衣壳以在所需位置例如心脏处增加更新。其他衣壳可包括来自任何已知AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV7、AAV10等的衣壳。
本发明进一步提供了包含上述载体的重组病毒体(病毒颗粒)。
药物组合物:
本发明的载体或病毒体可以与药学上可接受的赋形剂,即一种或多种药学上可接受的载体物质和/或添加剂,例如缓冲剂、载体、赋形剂、稳定剂等一起配制在药物组合物中。可以以试剂盒的形式提供所述药物组合物。药物组合物和适用于AAV载体的递送系统和其方法和用途是本领域已知的。
因此,本发明的另一方面提供了包含如本文所述的载体或病毒体的药物组合物。
治疗和其他方法和用途:
本发明还提供了根据本发明各个方面的合成的肌肉特异性启动子、表达盒、载体、病毒体或药物组合物,用于治疗疾病,优选与异常基因表达相关的疾病,任选地在肌肉中(例如遗传性肌肉疾病)。在一个实施方案中,本发明提供了根据本发明各个方面的合成的肌肉特异性启动子、表达盒、载体、病毒体或药物组合物,用于治疗骨骼肌疾病。在一个实施方案中,本发明还提供了根据本发明各个方面的合成的肌肉特异性启动子、表达盒、载体、病毒体或药物组合物,用于治疗心肌疾病。
上文讨论了相关病况、疾病和治疗性表达产物。
本发明还提供了根据本发明各个方面的合成的肌肉特异性启动子、表达盒、载体、病毒体,用于制备用于治疗本文提及的任何病况或疾病的药物组合物。
本发明进一步提供了包含根据本发明各个方面的合成的肌肉特异性启动子、表达盒、载体、病毒体的细胞。适当地,所述细胞是真核细胞。适当地,所述真核细胞可以是真菌细胞(例如酵母细胞)、动物(后生动物)细胞(例如哺乳动物细胞)或植物细胞。替代地,所述细胞可以是原核细胞。
在本发明的一些实施方案中,所述细胞是离体的,例如在细胞培养中。在本发明的其他实施方案中,所述细胞可以是组织或多细胞生物的一部分。
在一个优选实施方案中,所述细胞是肌肉细胞(肌细胞),其可以是离体的或体内的。在一个优选实施方案中,所述细胞是心肌细胞,其可以是离体的或体内的。在一个替代的优选实施方案中,所述细胞是骨骼肌细胞,其可以是离体的或体内的。肌肉细胞可以是原代肌肉细胞或肌源性细胞系的细胞,例如永生化的细胞系。所述细胞可以存在于肌肉组织环境中(例如动物的肌肉中)或可以从肌肉组织中分离出来,例如它可以在细胞培养中。适当地,所述细胞是人类细胞。
骨骼肌细胞可能来自快速收缩的肌肉或缓慢收缩的肌肉。
心肌细胞可以选自心脏中的心室心肌细胞、心房心肌细胞、心脏成纤维细胞或内皮细胞(EC),以及血管周围细胞和起搏细胞。
根据本发明的合成的肌肉特异性启动子、表达盒或载体可以插入到细胞的基因组中,或者它可以是游离型的(例如存在于游离型载体中)。
在另一方面,本发明提供了一种产生表达产物的方法,所述方法包括在细胞,优选肌肉细胞中提供根据本发明的合成的肌肉特异性表达盒(优选在如上所述的载体中),并表达存在于合成的肌肉特异性表达盒中的基因。适当地,所述方法包括将所述肌肉细胞维持在适合基因表达的条件下。在培养中,这可以包括在合适的培养条件下孵育细胞或包含细胞的组织。表达当然可以是体内的,例如在受试者肌肉的一个或多个细胞中。在一个实施方案中,肌肉细胞是心肌细胞。在一个实施方案中,肌肉细胞是骨骼肌细胞。
适当地,所述方法包括将合成的肌肉特异性表达盒引入肌肉细胞的步骤。多种转染肌肉细胞的方法在本领域中是众所周知的。转染肌肉细胞的优选方法是用包含合成的肌肉特异性表达盒的病毒载体(例如,AAV载体)转导细胞。
对技术人员显而易见的是,根据本发明各个方面的合成的肌肉特异性启动子、表达盒、载体或病毒体可用于基因治疗。因此,此类核酸构建体在基因治疗中的用途构成本发明的一部分。
因此,在一些实施方案中,本发明提供了根据本发明的表达盒、载体或病毒体,用于受试者的基因治疗,优选通过治疗性基因的肌肉特异性表达进行的基因治疗。适当地通过治疗性基因的心肌特异性表达和/或治疗性基因的骨骼肌特异性表达。所述治疗可以涉及通过从肌肉细胞分泌治疗性产物来治疗疾病,适当地,涉及肌肉中异常基因表达的疾病如上所述。
本发明还提供了在肌肉细胞中表达治疗性转基因的方法,所述方法包括将根据本发明的表达盒或载体引入肌肉细胞。肌肉细胞可以是体内的或离体的。在一个实施方案中,肌肉细胞是心肌细胞。在一个实施方案中,肌肉细胞是骨骼肌细胞。
本发明还提供了一种对有需要的受试者,优选人类进行基因治疗的方法,所述方法包括:
-向受试者施用(适当地引入受试者的肌肉中)本发明的合成的肌肉特异性表达盒、载体、病毒体或药物组合物,其包含编码治疗性产物的基因。
在一个实施方案中,肌肉是心肌。在一个实施方案中,肌肉是骨骼肌。
适当地,所述方法包括从所述受试者的肌肉中的基因表达治疗量的治疗性产物。上文讨论了可以治疗的各种病况和疾病。在一个实施方案中,肌肉是心肌。在一个实施方案中,肌肉是骨骼肌。
上文讨论了编码合适的治疗性产物的基因。
适当地,所述方法包括将根据本发明的载体或病毒体施用于受试者。合适地,所述载体是病毒基因治疗载体,例如AAV载体。
在一些实施方案中,所述方法包括全身施用病毒基因治疗载体。全身施用可以是肠内(例如口服、舌下和直肠)或肠胃外(例如注射)。优选的注射途径包括静脉内、肌肉内、皮下、动脉内、关节内、鞘内和皮内注射。
在一些实施方案中,所述病毒基因治疗载体可以与一种或多种另外的治疗剂或被设计用于防止载体被网状内皮系统清除的一种或多种饱和剂同时或依次施用。
当所述载体是AAV载体时,载体的剂量可以是从1x1010gc/kg到1x1015gc/kg或更多,适当地从1x1012gc/kg到1x1014gc/kg,适当地从5x1012gc/kg到5x1013gc/kg。
一般而言,有需要的受试者是哺乳动物,优选灵长类动物,更优选人。通常,有需要的受试者会表现出疾病的特征性症状。所述方法通常包括通过表达治疗量的治疗性产物来改善有需要的受试者表现出的症状。
用于在体外和体内靶细胞中的治疗性基因表达的基因治疗方案在本领域中是众所周知的,在此将不详细讨论。简而言之,它们包括肌肉注射、间质注射、气道滴注、应用于内皮、肝内实质以及质粒DNA载体(裸露的或在脂质体中)或病毒载体的静脉内或动脉内施用(例如肝内动脉、肝内静脉)。已经开发了各种装置来提高DNA对靶细胞的可用性。虽然一种简单的方法是用含有相关载体的导管或可植入材料物理接触靶细胞,但更复杂的方法可以使用喷射注射装置等。已使用离体和体内程序将基因转移到哺乳动物肌肉细胞中。离体方法通常需要收获肌肉细胞,用合适的表达载体进行体外转导,然后将转导的肌细胞重新引入肌肉。通过将DNA或病毒载体注射到肌肉中来实现体内基因转移。
根据一些优选实施方案,上述方法可用于治疗患有上文讨论的肌肉相关疾病(肌营养不良症或充血性心力衰竭)的受试者。
定义和一般要点:
尽管下面详细讨论了本发明的各种实施方案的制备和使用,但是应该理解,本发明提供了许多可以在特定上下文的各种变化中体现的可应用的发明概念。本文所讨论的具体实施方案仅用于说明制备和使用本发明的具体方式,并不限制本发明的范围。
本文包括对本发明背景的讨论以解释本发明的上下文。这不应被视为承认所提及的任何材料在任何权利要求的优先权日之前已在任何国家/地区公布、已知或为公知常识的一部分。
在整个本公开中,各种出版物、专利和公开的专利说明书通过识别引用来引用。本说明书中引用的所有文件均通过引用整体并入本文。特别地,本文特别提及的此类文件的教导或部分通过引用并入。
除非另有说明,否则本发明的实施将采用细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术,这些技术在本领域的技术范围内。这些技术在文献中有充分的解释。例如,参见Current Protocols in Molecular Biology(Ausubel,2000,Wiley and son Inc,Library of Congress,USA);Molecular Cloning:ALaboratory Manual,Third Edition,(Sambrook et al,2001,Cold Spring Harbor,NewYork:Cold Spring Harbor Laboratory Press);Oligonucleotide Synthesis(M.J.Gaited.,1984);美国专利号4,683,195;Nucleic Acid Hybridization(Harries and Higginseds.1984);Transcription and Translation(Hames and Higgins eds.1984);Cultureof Animal Cells(Freshney,Alan R.Liss,Inc.,1987);Immobilized Cells and Enzymes(IRL Press,1986);Perbal,A Practical Guide to Molecular Cloning(1984);theseries,Methods in Enzymology(Abelson and Simon,eds.-in-chief,Academic Press,Inc.,New York),特别是Vols.154-155(Wu等人编辑)和Vol.185,“Gene ExpressionTechnology”(Goeddel,ed.);Gene Transfer Vectors For Mammalian Cells(Miller andCalos eds.,1987,Cold Spring Harbor Laboratory);Immunochemical Methods in Celland Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987);Handbook of Experimental Immunology,Vols.I-IV(Weir and Blackwell,eds.,1986);和Manipulating the Mouse Embryo,(Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,1986)。
为了便于理解本发明,以下定义或解释了多个术语。本文使用的术语具有与本发明相关的领域的普通技术人员通常理解的含义。诸如“一个”、“一种”和“所述”之类的术语并非旨在仅指单个实体,而是包括可以使用特定实例来说明的一般类别。本文中的术语用于描述本发明的特定实施方案,但它们的使用并不限制本发明,除非在权利要求中概述。
术语“肌肉”为技术人员所熟知。优选地,肌肉是骨骼肌(包括膈肌)或心肌。本发明的启动子可以在骨骼肌和/或心肌中具有活性。优选地,肌肉是脊椎动物的肌肉,更优选哺乳动物的肌肉,甚至更优选人类受试者的肌肉。优选地,肌肉是横纹肌。
术语“肌肉细胞”或“肌细胞”在本文中涉及在肌肉(肌肉组织)中发现或源自肌肉组织的细胞。肌肉细胞可以是原代细胞或细胞系(例如C2C12或H2K细胞(骨骼肌细胞系)或H9C2细胞(心肌细胞系))。肌肉细胞可以在体内(例如在肌肉组织中)或在体外(例如在细胞培养物中)。在肌肉组织中发现的肌细胞通常是长的管状细胞,它们从成肌细胞发育成肌肉,这一过程称为肌生成。如本文所用,术语肌肉细胞或肌细胞包括来自骨骼肌和来自心肌的肌细胞(心肌细胞)。本发明的启动子可以在骨骼肌细胞和/或心肌细胞中具有活性。
术语“顺式调节元件”或“CRE”是技术人员熟知的术语,是指可以调节相邻基因(即顺式)的转录的核酸序列,例如增强子、启动子、绝缘子或沉默子。CRE存在于它们调节的基因附近。CRE通常通过与TF结合来调节基因转录,即它们包括TFBS。单个TF可以与许多CRE结合,从而控制许多基因的表达(多效性)。CRE通常但不总是位于它们调节的基因的转录起始位点(TSS)的上游。本文上下文中的“增强子”是增强(即上调)与它们可操作地相关的基因的转录的CRE,并且可以存在于在它们调节的基因的上游、下游甚至内含子中。多个增强子可以协同作用来调节一个基因的转录。在本文中,“沉默子”涉及与称为阻遏物的TF结合的CRE,阻遏物起到阻止或下调基因转录的作用。术语“沉默子”也可以指信使RNA的3’非翻译区域中的区域,它结合抑制该mRNA分子翻译的蛋白质,但这种用法不同于它在描述CRE时的用途。通常,本发明的CRE是肌肉特异性的、心肌特异性的或骨骼肌特异性的增强子元件(通常称为肌肉特异性、心肌特异性或骨骼肌特异性CRE,或肌肉特异性、心肌特异性或骨骼肌特异性CRE增强子等)。在本文中,优选CRE位于距转录起始位点(TSS)2500个核苷酸或更少,更优选距TSS 2000个核苷酸或更少,更优选距TSS 1500个核苷酸或更少,适当地距TSS1000、750、500、250、200、150或100个核苷酸或更少。本发明的CRE优选长度较短,优选长度为500个核苷酸或更短,例如它们的长度可以是400、300、200、175、150、90、80、70、60或50个核苷酸或更短。本发明的CRE通常与可操作地连接的启动子元件组合提供,所述启动子元件可以是最小启动子或近端启动子;本发明的CRE增强启动子元件的肌肉特异性、心肌特异性或骨骼肌特异性活性。在本文公开的CRE或其功能变体的任何组合中,适当地一些或所有所述的CRE和启动子元件可以在启动子中彼此相邻放置(即,没有任何介入的CRE或其他调节元件)。CRE可以是连续的或不连续的(即它们可以彼此紧邻放置,或者它们可以被间隔区或其他序列隔开)。CRE可以以任何顺序排列。在一些优选实施方案中,CRE或其功能变体以所述的顺序提供并且彼此相邻。例如,合成的肌肉特异性调节核酸可以包含紧邻CRE0033上游的CRE0107,等等。在一些实施方案中,优选一些或所有CRE是连续的。
术语“顺式调节模块”或“CRM”是指功能性调节核酸模块,其通常包含两个或更多个CRE;在本发明中,CRE通常是肌肉特异性、心肌特异性或骨骼肌特异性增强子,因此CRM是合成的肌肉特异性、心肌特异性或骨骼肌特异性调节核酸。因此,在本申请中,CRM通常包含多个肌肉特异性、心肌特异性或骨骼肌特异性CRE。通常,CRM中的多个CRE共同作用(例如,相加或协同)以增强与包含CRM的启动子可操作地相关的基因的转录。在CRM中对CRE进行洗牌(即重新排序)、使CRE反转(即逆转方向)和更改CRE的间距有相当大的范围。因此,本发明的CRM的功能变体尤其包括所引用的CRM的变体,其中它们中的CRE已被洗牌和/或反转,和/或CRE之间的间距已被改变。在串联启动子的情况下,CRM可用于描述启动子元件和可操作地连接至另一个启动子元件的一个或多个CRE的组合。例如,在串联启动子SP0268中,CRE0035和启动子元件CRE0010的组合可以被视为CRM。
如本文所用,短语“启动子”是指通常位于要转录的核酸序列上游的DNA区域,该区域是发生转录所需的,即其起始转录。启动子允许在其控制下正确激活或抑制编码序列的转录。启动子通常包含被多个TF识别和结合的特定序列。TF与启动子序列结合并导致RNA聚合酶的募集,RNA聚合酶是一种从基因编码区合成RNA的酶。许多不同的启动子是本领域已知的。
在一些情况下,本文使用的术语“启动子”或“复合启动子”是指启动子和另外的调节元件(例如紧邻转录起始位点(TSS)下游的调节序列,例如5’UTR和/或5’UTR和内含子)的组合。TSS下游的此类序列可有助于在转录和/或翻译阶段调节表达。在一些情况下,本文使用的术语“启动子”或“复合启动子”是指本文别处定义的“串联启动子”。
如本文所用,术语“合成启动子”涉及自然界中不存在的启动子。在本文中,它通常包含与最小(或核心)启动子或肌肉特异性、心肌特异性或骨骼肌特异性近端启动子(启动子元件)可操作地连接的本发明的CRE和/或CRM。本发明的CRE和/或CRM用于增强与合成启动子可操作地连接的基因的肌肉特异性、心肌特异性或骨骼肌特异性转录。部分合成启动子可以是天然存在的(例如最小启动子或启动子中的一个或多个CRE),但合成启动子作为一个实体不是天然存在的。
如本文所用,“最小启动子”(也称为“核心启动子”)是指通常短的DNA片段,其本身无活性或大部分无活性,但当与其他转录调节元件组合时可介导转录。最小启动子序列可以来自各种不同的来源,包括原核和真核基因。上文讨论了最小启动子的实例,包括结蛋白最小启动子、多巴胺β-羟化酶基因最小启动子、巨细胞病毒(CMV)立即早期基因最小启动子(CMV-MP)和疱疹胸苷激酶最小启动子(MinTK)。最小启动子通常包含转录起始位点(TSS)和直接上游的元件、RNA聚合酶II的结合位点和一般转录因子结合位点(通常是TATA框)。最小启动子还可以包括TSS下游的一些元件,但这些元件通常在没有另外的调节元件的情况下几乎没有功能。
如本文所用,“近端启动子”涉及最小启动子加上至少一些另外的调节序列,通常是趋向于含有初级调节元件的基因上游的近端序列。它通常在TSS上游延伸大约250个碱基对,并包括特定的TFBS。近端启动子还可以包括TSS下游的一种或多种调节元件,例如UTR或内含子。在当前情况下,适当地近端启动子可以是天然存在的肌肉特异性、心肌特异性或骨骼肌特异性近端启动子,其可以与本发明的一种或多种CRE或CRM组合。然而,近端启动子可以是合成的。
如本文所用,“启动子元件”是指如上定义的最小启动子或近端启动子。在本发明的上下文中,启动子元件通常与一种或多种CRE组合以提供本发明的合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子。
在本发明的上下文中,CRE、CRM、启动子元件、启动子或其他调节核酸的“功能变体”是参考序列的变体,其保留以与参考序列相同的方式发挥作用(例如,作为肌肉特异性、心肌特异性、骨骼肌特异性CRE,肌肉特异性、心肌特异性、骨骼肌特异性CRM,或肌肉特异性、心肌特异性、骨骼肌特异性启动子)的能力。此类功能变体的替代术语包括“生物等效物”或“等效物”。
应当理解,给定的CRE、CRM、启动子或其他调节序列作为肌肉特异性、心肌特异性或骨骼肌特异性增强子发挥作用的能力显著取决于该序列结合与参考序列结合的相同肌肉特异性、心肌特异性或骨骼肌特异性TF的能力。因此,在大多数情况下,CRE或CRM的功能变体将包含与参考CRE、CRM或启动子相同的大部分或全部TF的TFBS。优选但不是必需的,功能变体的TFBS与参考CRE、CRM或启动子处于相同的相对位置(即顺序和一般位置)。同样优选但不是必需的,功能变体的TFBS与参考序列的方向相同(应注意,TFBS在一些情况下可以反向存在,例如作为参考序列中的反向互补vis-à-vis序列)。同样优选但不是必需的,功能变体的TFBS与参考序列在同一条链上。因此,在优选实施方案中,功能变体包含与参考序列相同的TF、相同的顺序、相同的位置、相同的方向和相同的链上的TFBS。还将理解,位于TFBS之间的序列(在一些情况下称为间隔区序列等)对CRE或CRM的功能影响较小。这样的序列通常可以有很大的变化,并且它们的长度可以改变。然而,在优选实施方案中,功能变体中的间距(即相邻TFBS之间的距离)与参考序列中的间距基本上相同(例如,其变化不超过20%,优选不超过10%,更优选的是近似相同)。很明显,在一些情况下,CRE的功能变体可以以相反的方向存在,例如它可以是上述CRE的反向补体,或其变体。
功能变体和参考序列之间的序列同一性水平也可以是保留的功能的指标。CRE、CRM或启动子的TFBS中高水平的序列同一性通常比间隔区序列(其中很少需要或不需要任何序列保守性)中的序列同一性更重要。然而,应当理解,即使在TFBS内,也可以适应相当程度的序列变异,因为功能性TFBS的序列不需要与共有序列完全匹配。
一种或多种TF与给定功能变体中的TFBS结合的能力可以通过本领域已知的任何相关手段来确定,包括但不限于电迁移率测定(EMSA)、结合测定、染色质免疫沉淀(ChIP)和ChIP测序(ChIP-seq)。在一个优选实施方案中,一种或多种TF结合给定功能变体的能力由EMSA确定。执行EMSA的方法在本领域中是众所周知的。Sambrook等人(上文引用的)描述了合适的方法。许多描述此过程的相关文章都可获得,例如Hellman和Fried,NatProtoc.2007;2(8):1849–1861。
“肌肉特异性”或“肌肉特异性表达”是指顺式调节元件、顺式调节模块或启动子以与其他组织(例如肝脏、肾脏、脾脏、心脏、肺和脑)相比优先或占优势的方式增强或驱动基因在肌肉细胞(或肌肉来源的细胞)中表达的能力。基因的表达可以以mRNA或蛋白质的形式。在优选实施方案中,肌肉特异性表达使得在其他(即非肌肉)组织或细胞中的表达可以忽略不计,即表达是高度肌肉特异性的。例如,与其他细胞相比,肌肉细胞中的表达至少为75%、80%、85%、90%或95%。“心肌特异性”或“心肌特异性表达”是指顺式调节元件、顺式调节模块、启动子元件或启动子以与其他组织(例如脾脏、肝脏、肺和脑)相比以及与骨骼肌组织相比优先或占优势的方式增强或驱动基因在心肌中表达的能力。“骨骼肌特异性”或“骨骼肌特异性表达”是指顺式调节元件、顺式调节模块、启动子元件或启动子以与其他组织(例如脾脏、肝脏、肺和脑)相比以及与心肌组织相比优先或占优势的方式增强或驱动基因在骨骼肌中表达的能力。可能存在需要较低程度的特异性的情况并且其是本发明的一部分。
技术人员可以容易地评估CRE、CRM或启动子作为肌肉特异性、心肌特异性或骨骼肌特异性CRE、CRM或启动子起作用的能力。因此,技术人员可以容易地确定以上所述的特定CRE、CRM或启动子的任何变体是否保留功能(即,它是如上定义的功能变体)。例如,任何要评估的给定CRM可以与最小启动子(例如,位于CMV-MP上游)可操作地连接,并测量顺式调节元件驱动基因(通常为报告基因)的肌肉特异性、心肌特异性或骨骼肌特异性表达的能力。替代地,可以将CRE或CRM的变体替换为合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子来代替参考CRE或CRM,并且可以确定对由所述经修饰的启动子驱动的肌肉特异性、心肌特异性或骨骼肌特异性表达的影响,并与未经修饰的形式进行比较。类似地,技术人员可以容易地评估启动子驱动肌肉特异性、心肌特异性或骨骼肌特异性表达的能力(例如,如以下实施例中所述)。可以将由参考启动子的变体驱动的基因的表达水平与由参考启动子驱动的表达水平进行比较。在一些实施方案中,其中由变体启动子驱动的肌肉特异性、心肌特异性或骨骼肌特异性表达水平为由参考启动子驱动的表达水平的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%,可以说该变体保留功能。可以容易地构建用于评估肌肉特异性、心肌特异性或骨骼肌特异性表达增强的合适的核酸构建体和报告基因测定,并且下面列出的实施例给出了合适的方法学。
可以鉴定肌肉特异性、心肌特异性或骨骼肌特异性,其中基因(例如治疗性或报告基因)的表达优先或占优势地发生在肌肉来源的细胞、心肌来源的细胞或骨骼肌中。例如,可以定义优先或占优势的表达,其中肌肉来源、心肌来源或骨骼肌来源的细胞中的表达水平明显高于其他类型的细胞(即非肌肉来源的细胞、非心肌来源的细胞或非骨骼肌来源的细胞)。例如,适当地在肌肉来源、心肌来源或骨骼肌来源的细胞中的表达比在非肌肉细胞、非心肌细胞或非骨骼肌细胞中的表达高至少5倍,优选至少比非肌肉细胞、非心肌细胞或非骨骼肌细胞高至少10倍,在一些情况下可能高50倍或更多。为方便起见,适当地可以通过比较肌肉细胞系(例如肌肉来源的细胞系,如C2C12或H2K细胞(骨骼肌)或H9C2细胞(心脏))中的表达水平与肝脏来源的细胞系(例如Huh7或HepG2)、肾脏来源的细胞系(例如HEK-293)、宫颈组织来源的细胞系(例如HeLa)和/或肺来源的细胞系(例如A549)中的表达水平来证明肌肉特异性表达。适当地可以通过比较心肌细胞系(例如心肌来源的细胞系,如H9C2)或原代心肌细胞中的表达水平与肝脏来源的细胞系(例如Huh7或HepG2)、肾脏来源的细胞系(例如HEK-293)、宫颈组织来源的细胞系(例如HeLa)、肺来源的细胞系(例如A549)和/或骨骼肌来源的细胞(例如C2C12或H2K)中的表达水平来证明心肌特异性表达。适当地可以通过比较骨骼肌来源的细胞(例如C2C12或H2K)或原代骨骼肌细胞中的表达水平与肝脏来源的细胞系(例如Huh7或HepG2)、肾脏来源的细胞系(例如HEK-293)、宫颈组织来源的细胞系(例如HeLa)、肺来源的细胞系(例如A549)和/或心肌细胞系(例如H9C2)中的表达水平来证明骨骼肌特异性表达。
优选地,本发明的合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子在与非组织特异性启动子如CMV-IE相比时在非肌肉来源的细胞中(适当地在Huh7、HEK-293、HeLa和/或A549细胞中)表现出降低的表达。优选地,本发明的合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子在非肌肉来源的细胞中(适当地在Huh7、HEK-293、HeLa和/或A549细胞中)具有比CMV-IE启动子低50%或更低的活性,适当地为25%或更低、20%或更低、15%或更低、10%或更低、5%或更低或1%或更低的活性。通常,优选将非肌肉来源的细胞中的表达最小化,但在一些情况下,这可能不是必需的。即使本发明的合成启动子在例如一个或两个非肌肉细胞中具有更高的表达,只要它通常在一定范围的肌肉细胞相对于非肌肉细胞中总体上具有更高的表达,它仍然可以是肌肉特异性启动子。在一些实施方案中,肌肉特异性启动子在肌肉细胞中比在非肌肉细胞中以高出至少25%、或至少35%、或至少45%、或至少55%、或至少65%、或至少75%、或至少80%、或至少85%、或至少90%、或至少95%、或25%-95%之间的任何整数表达基因。
本发明的合成的肌肉特异性启动子优选适用于促进在受试者肌肉中的表达,例如驱动转基因的肌肉特异性表达,优选治疗性转基因的肌肉特异性表达。本发明的合成的心肌特异性启动子优选适用于促进在受试者心脏中的表达,例如驱动转基因的心肌特异性表达,优选治疗性转基因的心肌特异性表达。本发明的合成的骨骼肌特异性启动子优选适用于促进在受试者骨骼肌中的表达,例如驱动转基因的骨骼肌特异性表达,优选治疗性转基因的骨骼肌特异性表达。本发明优选的合成的肌肉特异性启动子适用于促进肌肉特异性转基因表达并且在肌肉细胞中的活性为CBA启动子的活性的至少15%、20%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%。在一些实施方案中,本发明的合成的肌肉特异性启动子适用于以CBA启动子的活性的至少100%,优选CBA或spc5-12启动子的活性的150%、200%、300%或500%的水平促进肌肉特异性转基因表达。在一些实施方案中,本发明的合成的心肌特异性启动子适用于以Tnnt2或Myl2启动子的活性的至少100%,优选Tnnt2或Myl2启动子的活性的150%、200%、300%或500%的水平促进心肌特异性转基因表达。在一些实施方案中,本发明的合成的骨骼肌特异性启动子适用于以Tnnt2或Myl2启动子的活性的至少100%,优选spc5-12启动子的活性的150%、200%、300%或500%的水平促进骨骼肌特异性转基因表达。适当地在肌肉来源的细胞(例如C2C12或H2K细胞(骨骼肌)或H9C2细胞(心脏)或原代肌肉细胞(适当地原代人类肌细胞))中确定这种肌肉特异性表达。
本发明的合成的肌肉特异性、心肌特异性或骨骼肌特异性启动子还能够以与CMV-IE相比至少50%、100%、150%或200%的水平促进基因在肌肉来源的细胞(例如c2c12或H2K细胞(骨骼肌)或h9C2细胞(心脏))中的肌肉特异性、心肌特异性或骨骼肌特异性表达。
如本文所用,术语“核酸”通常是指基本上由核苷酸组成的任何长度的低聚物或聚合物(优选线性聚合物)。核苷酸单元通常包括杂环碱基、糖基团和至少一个(例如一个、两个或三个)磷酸基团,包括修饰的或取代的磷酸基团。杂环碱基尤其可以包括嘌呤和嘧啶碱基,例如腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U),它们广泛存在于天然存在的核酸、其他天然存在的碱基(例如黄嘌呤、肌苷、次黄嘌呤)以及化学或生物化学修饰的(例如甲基化的)、非天然或衍生的碱基中。糖基团尤其可以包括戊糖(呋喃戊糖)基团,例如优选地在天然存在的核酸中常见的核糖和/或2-脱氧核糖,或阿拉伯糖、2-脱氧阿拉伯糖、苏阿糖或己糖糖基团,以及修饰或取代的糖基团。如本文所指的核酸可以包括天然存在的核苷酸、修饰的核苷酸或其混合物。修饰的核苷酸可以包括修饰的杂环碱基、修饰的糖部分、修饰的磷酸基团或其组合。可以引入磷酸基团或糖的修饰以提高稳定性、对酶降解的抗性或一些其他有用的性质。术语“核酸”进一步优选包括DNA、RNA和DNA RNA杂合分子,具体包括hnRNA、前mRNA、mRNA、cDNA、基因组DNA、扩增产物、寡核苷酸和合成的(例如化学合成的)DNA、RNA或DNA RNA杂合体。核酸可以是天然存在的,例如,存在于自然界中或从自然界中分离;或者可以是非天然存在的,例如重组的,即通过重组DNA技术产生的,和/或部分或全部化学或生化合成的。“核酸”可以是双链的、部分双链的或单链的。在单链的情况下,核酸可以是有义链或反义链。此外,核酸可以是环状的或线性的。
当提及核酸时,“分离的”是指完全或部分缺乏通常在自然界中与其相关的序列的核酸分子;或一种序列,虽然它在自然界中存在,但具有与之相关的异源序列;或与染色体分离的分子。
术语“同一性”和“相同”等是指两个聚合分子之间,例如两个核酸分子之间,例如两个DNA分子之间的序列相似性。可以进行序列比对和序列同一性的确定,例如,使用Altschul等人1990(J Mol Biol 215:403-10)最初描述的基本局部比对搜索工具(BLAST),例如Tatusova和Madden 1999(FEMS Microbiol Lett 174:247-250)描述的“Blast 2序列”算法。
用于比对序列以进行比较的方法是本领域众所周知的。各种程序和比对算法描述于,例如:Smith和Waterman(1981)Adv.Appl.Math.2:482;Needleman和Wunsch(1970)J.Mol.Biol.48:443;Pearson和Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;Higgins和Sharp(1988)Gene 73:237-44;Higgins和Sharp(1989)CABIOS5:151-3;Corpet等人(1988)Nucleic Acids Res.16:10881-90;Huang等人(1992)Comp.Appl.Biosci.8:155-65;Pearson等人(1994)Methods Mol.Biol.24:307-31;Tatiana等人(1999)FEMSMicrobiol.Lett.174:247-50中。A detailed consideration of序列比对方法和同源性计算的详细考虑可以在例如Altschul等人(1990)J.Mol.Biol.215:403-10中找到。
美国国家生物技术信息中心(NCBI)基本局部比对搜索工具(BLASTTM;Altschul等人(1990))可以从多个来源获得,包括美国国家生物技术信息中心(Bethesda,MD)和互联网,用于与多个序列分析程序结合使用。互联网上BLASTTM的“帮助”部分下提供了有关如何使用该程序确定序列同一性的说明。对于核酸序列的比较,可以使用BLASTTM(Blastn)程序的“Blast 2序列”功能使用默认参数。当通过该方法评估时,与参考序列具有更大相似性的核酸序列将显示出更高的同一性百分比。通常,在整个序列长度上计算序列同一性百分比。
例如,适当地通过Needleman-Wunsch算法使用以下评分参数找到全局最优比对:匹配得分:+2,错配得分:-3;空位罚分:空位打开5,空位延伸2。适当地,通过比对上的碱基数与比对总长度的比率计算所得最佳全局比对的同一性百分比,其中比对长度包括匹配和错配,乘以100。
术语“杂交”是指在杂交过程中与两个至少部分互补的核苷酸序列退火。为了使杂交发生,互补核酸分子通常被热或化学变性以将双链熔解成两条单链和/或从单链核酸中去除发夹结构或其他二级结构。杂交的严格性受温度、盐浓度和杂交缓冲液组成等条件的影响。常规杂交条件描述于,例如,Sambrook(2001)Molecular Cloning:a laboratorymanual,3rd Edition Cold Spring Harbor Laboratory Press,CSH,New York中,但技术人员将理解可以根据已知的或预期的核酸序列的同源性和/或长度设计出许多不同的杂交条件。杂交的高严格条件包括高温和/或低钠/盐浓度(盐包括钠,例如在氯化钠和柠檬酸钠中)和/或在杂交缓冲液中包含甲酰胺和/或降低杂交缓冲液中的化合物如SDS(十二烷基硫酸钠去污剂)的浓度和/或从杂交缓冲液中排除化合物如硫酸葡聚糖或聚乙二醇(促进分子聚集)。作为非限制性实例,用于严格杂交的代表性盐和温度条件是:1x SSC,0.5%SDS,65℃。缩写SSC是指核酸杂交溶液中使用的缓冲液。一升20X(20倍浓缩)储备SSC缓冲溶液(pH7.0)含有175.3g氯化钠和88.2g柠檬酸钠。实现杂交的代表性时间段是12小时。
术语“转录因子结合位点”(TFBS)在本领域中是众所周知的。本文公开了各种特定的TFBS序列。对技术人员来说显而易见的是,可以使用替代的TFBS序列,只要它们被预期的TF结合。本文公开的各种TFBS的共有序列在本领域中是已知的,并且技术人员可以容易地使用该信息来确定替代的TFBS。此外,TF与给定推定序列结合的能力可以容易地由技术人员通过实验确定(例如,通过EMSA和本领域熟知的和本文讨论的其他方法)。
“共有序列”的含义在本领域是众所周知的。在本申请中,除非上下文另有说明,否则以下符号用于共有序列。考虑以下示例性DNA序列:
A[CT]N{A}YR
A表示始终在该位置发现A;[CT]代表该位置为C或T;N代表该位置为任意碱基;{A}表示在该位置发现除A之外的任意碱基。Y代表任意嘧啶,R代表任意嘌呤。
本申请中的“合成的”是指自然界中不存在的核酸分子。本发明的合成核酸是人工产生的,通常通过重组技术或从头合成。此类合成核酸可以包含天然存在的序列(例如启动子、增强子、内含子和其他此类调节序列),但这些存在于非天然存在的环境中。例如,合成基因(或基因的一部分)通常包含一个或多个在性质上不连续的核酸序列(嵌合序列),和/或可以涵盖替换、插入和缺失及其组合。
如本文所用,“互补”或“互补性”是指两个核酸序列的Watson-Crick碱基配对。例如,序列5’-AGT-3’与互补序列3’-TCA-5’结合。两个核酸序列之间的互补性可能是“部分的”,其中只有一些碱基与其互补物结合,或者当序列中的每个碱基与其互补碱基结合时,它可能是完全的。核酸链之间的互补程度对核酸链之间杂交的效率和强度有显著影响。
本申请中的“转染”泛指有意将核酸引入细胞的任何过程,包括病毒和非病毒载体的引入,包括或等同于转化、转导等术语和过程。实例包括但不限于:用病毒载体转染;用质粒载体转化;电穿孔(Fromm等人(1986)Nature 319:791-3);脂转染(Feigner等人(1987)Proc.Natl.Acad.Sci.USA 84:7413-7);显微注射(Mueller等人(1978)Cell 15:579-85);农杆菌介导的转移(Fraley等人(1983)Proc.Natl.Acad.Sci.USA 80:4803-7);直接DNA吸收;晶须介导的转化;和微粒轰击(Klein等人(1987)Nature 327:70)。
如本文所用,短语“转基因”是指外源核酸序列。在一个实例中,转基因是编码工业上或药学上有用的化合物的基因,或编码所需性状的基因。在又一个实例中,转基因编码有用的核酸,例如反义核酸序列,其中反义核酸序列的表达抑制靶核酸序列的表达。转基因优选编码治疗性产物,例如蛋白质。
术语“载体”在本领域中是众所周知的,并且如本文所用,是指核酸分子,例如双链DNA,其可能已插入根据本发明的核酸序列。载体适用于将插入的核酸分子转运到合适的宿主细胞中。载体通常包含允许使插入的核酸分子转录并且优选地将转录物翻译成多肽的所有必要元件。载体通常包含所有必要元件,这样,一旦载体进入宿主细胞,载体就可以独立于宿主染色体DNA复制,或与宿主染色体DNA同时复制;可以产生数个拷贝的载体及其插入的核酸分子。本发明的载体可以是游离型载体(即,不整合到宿主细胞基因组中),或者可以是整合到宿主细胞基因组中的载体。该定义包括非病毒和病毒载体。非病毒载体包括但不限于质粒载体(例如pMA-RQ、pUC载体、bluescript载体(pBS)和pBR322或其不含细菌序列的衍生物(小环))、基于转座子的载体(例如PiggyBac(PB)载体或睡美人(SB)载体)等。较大的载体如人工染色体(细菌(BAC)、酵母(YAC)或人类(HAC))可用于容纳较大的插入片段。病毒载体来源于病毒,包括但不限于逆转录病毒、慢病毒、腺相关病毒、腺病毒、疱疹病毒、肝炎病毒载体等。通常,但不一定,病毒载体是复制缺陷型的,因为它们已经失去了在给定细胞中繁殖的能力,因为复制所必需的病毒基因已从病毒载体中消除。然而,一些病毒载体也可以适应在给定细胞如癌细胞中特异性复制,通常用于引发(癌症)细胞特异性(肿瘤)溶解。病毒体是包含病毒和非病毒元件的载体的非限制性实例,特别是它们将脂质体与灭活的HIV或流感病毒结合(Yamada等人,2003)。另一个实例包括与阳离子脂质混合的病毒载体。
如本文所用,术语“可操作地连接”或等效表达是指各种核酸元件相对于彼此的排列,使得所述元件在功能上连接并且能够以预期的方式彼此相互作用。此类元件可以包括但不限于启动子、CRE(例如增强子或其他调节元件)、启动子元件、多聚腺苷酸化序列、一个或多个内含子和/或外显子,以及待表达的目的基因的编码序列。当正确定向或可操作地连接时,核酸序列元件共同作用以调节彼此的活性,并最终可能影响表达产物的表达水平。调节是指增加、降低或维持特定元件的活性水平。每个元件相对于其他元件的位置可以用每个元件的5’末端和3’末端或它们在另一个元件或位置(例如TSS或启动子元件)上游或下游的位置来表示,并且任何特定元件之间的距离可以通过元件之间的插入核苷酸或碱基对的数量来参考。如技术人员所理解的,可操作地连接意味着功能活性,并且不一定与自然位置连接相关。实际上,当在核酸表达盒中使用时,CRE通常将位于启动子元件的紧上游(尽管通常是这种情况,但绝对不应将其解释为对核酸表达盒内位置的限制或排除),但在体内不一定是这种情况,例如,当位于启动子上游时,天然存在于基因下游的调节元件序列能够以相同的方式发挥作用,该基因的转录受其影响。因此,根据一个具体实施方案,调节元件的调节或增强效果可以是位置无关的。
如本文所用,“间隔区序列”或“间隔区”是分隔两个功能性核酸序列(例如TFBS、CRE、CRM、启动子元件等)的核酸序列。它基本上可以具有任何序列,只要它不阻止功能性核酸序列(例如顺式调节元件)按需要发挥作用(例如,如果它包括沉默子序列、阻止所需转录因子的结合等,则可能发生这种情况)。通常,它是非功能性的,因为它的存在只是为了将相邻的功能性核酸序列彼此隔开。在一些实施方案中,间隔区可以具有75、50、40、30、30或10个核苷酸或更少的长度。
如本文所用,术语“药学上可接受的”与本领域一致并且意味着与药物组合物的其他成分相容并且对其接受者无害。
“治疗有效量”和类似短语是指在受试者中提供所需特定药理作用(例如在肌肉中表达治疗性基因)的剂量或血浆浓度。治疗有效量在治疗本文所述的病况中可能并不总是有效,即使这样的剂量被本领域技术人员认为是治疗有效量。治疗有效量可以根据施用途径和剂型、受试者的年龄和体重和/或所治疗的疾病或病况而变化。
如本文所用,术语“AAV载体”为本领域所熟知,一般是指包括各种核酸序列的AAV载体核酸序列。如本文所用,AAV载体通常包含非AAV来源的异源核酸序列作为载体的一部分。所述异源核酸序列通常包含本文公开的启动子以及用于细胞遗传转化的其他目的序列。通常,所述异源核酸序列的侧翼是至少一个,通常是两个AAV反向末端重复序列(ITR)。“AAV病毒体”或“AAV病毒”或“AAV病毒颗粒”或“AAV载体颗粒”是指由至少一种AAV衣壳多肽(包括变体AAV衣壳多肽和非变体亲本衣壳多肽)组成的病毒颗粒以及包被的多核苷酸AAV载体。如果所述颗粒包含异源核酸(即除野生型AAV基因组之外的多核苷酸,例如要递送至哺乳动物细胞的转基因),它可以被称为“AAV载体颗粒”或简称为“AAV载体”。因此,AAV病毒体或AAV颗粒的产生必然包括AAV载体的产生,因为这样的载体包含在AAV病毒体或AAV颗粒中。
“小干扰”或“短干扰RNA”或siRNA是靶向目的基因(“靶基因”)的核苷酸的RNA双链体。“RNA双链体”是指由RNA分子的两个区域之间的互补配对形成的结构。siRNA被“靶向”到基因并且siRNA的双链体部分的核苷酸序列与靶向基因的核苷酸序列互补。在一些实施方案中,siRNA双链体的长度小于30个核苷酸。在一些实施方案中,双链体的长度可以是29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10个核苷酸。在一些实施方案中,双链体的长度为19-25个核苷酸。siRNA的RNA双链体部分可以是发夹结构的一部分。除了双链体部分之外,发夹结构可以包含位于形成双链体的两个序列之间的环部分。环的长度可以不同。在一些实施方案中,环的长度为5、6、7、8、9、10、11、12或13个核苷酸。发夹结构还可以包含3’或5’突出端部分。在一些实施方案中,突出端是长度为0、1、2、3、4或5个核苷酸的3’或5’突出端。
如本文所用,术语“微小RNA”是指任何类型的干扰RNA,包括但不限于内源性微小RNA和人工微小RNA(例如,合成miRNA)。内源性微小RNA是基因组中天然编码的小RNA,能够调节mRNA的生产性利用。人工微小RNA可以是除内源性微小RNA之外的能够调节mRNA活性的任何类型的RNA序列。微小RNA序列可以是由任何一种或多种这些序列组成的RNA分子。微小RNA(或“miRNA”)序列已在出版物中有所描述,例如Lim等人,2003,Genes&Development,17,991-1008;Lim等人,2003,Science,299,1540;Lee和Ambrose,2001,Science,294,862;Lau等人,2001,Science 294,858-861;Lagos-Quintana等人,2002,Current Biology,12,735-739;Lagos-Quintana等人,2001,Science,294,853-857;和Lagos-Quintana等人,2003,RNA,9,175-179。微小RNA的实例包括较大RNA的任何RNA片段,或者是miRNA、siRNA、stRNA、sncRNA、tncRNA、snoRNA、smRNA、shRNA、snRNA或其他小的非编码RNA。参见,例如,美国专利申请20050272923、20050266552、20050142581和20050075492。“微小RNA前体”(或“前miRNA”)是指具有茎环结构的核酸,其中并入了微小RNA序列。“成熟微小RNA”(或“成熟miRNA”)包括从微小RNA前体(“前miRNA”)裂解的微小RNA或为合成的(例如,通过无细胞合成在实验室中合成),长度为从约19个核苷酸到约27个核苷酸,例如,成熟微小RNA可以具有19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt或27nt的长度。成熟微小RNA可以与靶mRNA结合并抑制靶mRNA的翻译。
术语“治疗”是指减少、改善或消除疾病或病况的一种或多种体征、症状或影响。因此,如本文所用的“治疗”包括对哺乳动物,特别是人类的疾病的任何治疗,并且包括:(a)防止疾病在易患疾病或有患上疾病的风险但尚未被诊断出患有所述疾病的受试者中发生;(b)抑制所述疾病,即阻止其发展;和(c)缓解所述疾病,即导致所述疾病消退。
向受试者“施用”药剂包括将药剂引入或递送给受试者以执行其预期功能的任何途径。可以通过任何合适的途径进行施用,包括口服、鼻内、眼内、眼部、肠胃外(静脉内、肌肉内、腹膜内或皮下)或局部。施用包括自我施用和他人施用。肌肉内施用在本发明中是特别感兴趣的。
术语“个体”、“受试者”和“患者”可互换使用,是指患有需要治疗的疾病或病况的任何个体受试者。出于本公开的目的,受试者可以是灵长类动物,优选人,或另一种哺乳动物,例如狗、猫、马、猪、山羊或牛等。
实施例
根据本发明实施方案的合成的肌肉特异性启动子的强度通过将每个合成的肌肉特异性启动子可操作地连接至报告基因荧光素酶来测试。将包含待测试的肌肉特异性启动子和荧光素酶基因的表达盒插入合适的质粒中,然后将所述质粒转染到多种细胞类型中以测试合成的肌肉特异性启动子在这些细胞中的表达。
实施例1–第一代设计的体外测试
材料和方法
将DNA制备物转染到H9C2(一种大鼠BDIX心脏成肌细胞系,可从ATCC获得)、C2C12(一种永生化小鼠成肌细胞系,可从ATCC获得)、H2K 2B4(一种永生卫星细胞衍生细胞系,参见PloS One.2011;6(9):e24826)、Huh7(一种众所周知的肝癌细胞系,来源于JCRB细胞库(JCRB0403))或HEK293(一种众所周知的人胚肾细胞,ECACC细胞库)来评估转录活性。
H9C2细胞培养和转染
H9C2是大鼠BDIX心脏成肌细胞系。它们具有心肌特性,例如在汇合处形成的肌管对乙酰胆碱有反应。
细胞维持
将H9C2细胞在T-75烧瓶中在含有1%FBS(热灭火-Gibco 10270-106,批号42G2076K)、1%Glutamax(35050-038,Gibco)、1%青霉素-链霉素溶液(15140-122,Gibco)的DMEM(高葡萄糖,D6546,Sigma)中培养。细胞在亚汇合阶段(70-80%)传代以避免细胞汇合并融合形成肌管的风险。
对于细胞维持期间的传代,除去培养基,用不含CaCl2和MgCl2的5ml DPBS(14190-094,Gibco)洗涤细胞两次。通过与1ml胰蛋白酶EDTA(25200-056,Gibco)孵育约5分钟,使细胞从烧瓶中分离。然后,将4ml培养基添加到烧瓶中,轻轻上下吸移混合物以帮助将细胞从烧瓶表面分离。细胞以100g沉淀3分钟。弃去上清液,将细胞重新悬浮在3ml培养基中。在Countess自动细胞计数器上对细胞进行计数,以1:3至1:10接种,即接种1-3×10,000个细胞/cm2,并在37℃5%CO2下孵育。
细胞转染和分化
如上所述,通过用DPBS洗涤,使用1ml胰蛋白酶EDTA从烧瓶中分离,用4ml培养基洗掉烧瓶表面,并以100g沉淀3分钟,从两个大约70-80%汇合的T-75烧瓶中收集H9C2细胞。将细胞重新悬浮在45ml培养基中,并以40,000个细胞/孔的密度接种于48孔平底板(300μl/孔)(353230,Corning)中。48孔板中的细胞在37℃5%CO2下孵育。
24小时后,将细胞上的培养基替换为300μl不含抗生素的培养基(即DMEM(高葡萄糖,D6546,Sigma),该培养基含有1%FBS(热灭活-Gibco 10270-106,批号42G2076K)、1%Glutamax(35050-038,Gibco)。每孔300ng DNA用viafect(E4981,Promega)转染,总复合体积为每孔30μl。转染后将板轻轻混合并在37℃5%CO2下孵育。
24小时后,从转染的细胞中去除培养基,并用300μl分化培养基替换,该培养基由DMEM(高葡萄糖,D6546,Sigma)、1%Glutamax(35050-038,Gibco)、1%FBS(热灭活-Gibco10270-106,批号42G2076K)、1%青霉素/链霉素溶液(15140-122,Gibco)和0.1%维甲酸(Sigma-R2625)组成。将板在37℃5%CO2下孵育7天以诱导分化。分化后,观察细胞形态以确认分化成肌管。
然后用500μl DPBS洗涤细胞,并用100μl荧光素酶细胞培养裂解5X试剂(E1531,Promega)裂解,使用Milli-Q水稀释至1X。将细胞裂解试剂上下移液十次,然后将板在中等功率下涡旋30分钟以促进细胞裂解。在完成荧光素酶测定之前,将板密封并储存在-80℃。在H9C2细胞中转染后从荧光素酶测定中收集的所有数据均基于至少三个生物学重复的三个技术重复。
H2K 2B4(H2K)细胞培养和转染
细胞维持
H2K细胞在T-75烧瓶中在含有20%FBS(热灭活-Gibco 10500-064,批号08Q2771K)、1%Glutamax(35050-038,Gibco)、1%青霉素-链霉素溶液(15140-122,Gibco)、0.5%鸡胚提取物(MD-OO4E-UK,LSP,批号A20418)、0.2%小鼠IFN-γ(315-05,Peprotech,批号061798C2918)的DMEM(高葡萄糖,D6546,Sigma)中培养。当细胞达到4-6.7×104个细胞/cm2的汇合时,每3-4天对细胞传代一次。传代时,除去培养基,用不含CaCl2、不含MgCl2的5ml DPBS(14190-094,Gibco)洗涤细胞两次,并使用1ml胰蛋白酶EDTA(25200-056,Gibco)从烧瓶中分离细胞。将细胞与胰蛋白酶EDTA孵育约2分钟,然后将4ml培养基添加到烧瓶中并轻轻上下吹打以从烧瓶表面清洗细胞。细胞以100g沉淀3分钟。弃去上清液,将细胞重新悬浮在6ml培养基中。在Countess自动细胞计数器上对细胞进行计数,以4000、2700、2000或1300个细胞/cm2的4种密度接种,并在33℃10%CO2下孵育。
细胞转染和分化
通过用DPBS洗涤、使用1ml胰蛋白酶EDTA从烧瓶中分离约2分钟、用4ml培养基清洗烧瓶表面并以100g沉淀3分钟,从三个大约20-40%汇合的T-75烧瓶中收集H2K细胞。细胞以8000个细胞/100μl培养基的密度重新悬浮在45ml培养基中。然后使用BioFill SoloReagent Dispenser(Brooks Automation Ltd,Catalog#34-1000)将100μl细胞悬液分配到96孔Matrigel涂覆的(Corning,ref.354234,批号8085009)板的每个孔中。96孔板中的细胞在33℃10%CO2下孵育。
24小时后,将细胞上的培养基替换为100μl不含抗生素的培养基(即DMEM(高葡萄糖,D6546,Sigma),该培养基含有20%FBS(热灭活-Gibco 10500-064,批号08Q2771K)、1%Glutamax(35050-038,Gibco)、0.5%鸡胚提取物(MD-OO4E-UK,LSP,批号A20418)、0.2%小鼠IFN-γ(315-05,Peprotech,批号061798C2918)。每孔150ng DNA用0.3μl脂质体(Lipofectamine)3000转染,总复合体积为每孔10μl。转染后轻轻混合板并在33℃10%CO2下孵育。24小时后,从转染的细胞中去除培养基并替换为200μl由DMEM(高葡萄糖,D6546,Sigma)、0.1%Glutamax(35050-038,Gibco)、0.2%马血清(GIBCO,ref.16050-122,批号1671317)、0.02%鸡胚提取物(MD-OO4E-UK,LSP,批号A20418)、0.1%青霉素/链霉素溶液(15140-122,Gibco)组成的分化培养基。板在37℃5%CO2下孵育72小时以诱导分化。分化后,观察细胞形态以确认分化成肌管。然后用250μl DPBS洗涤细胞,然后用50μl荧光素酶细胞培养裂解5X试剂(E1531,Promega)裂解,用Milli-Q水稀释至1X。将细胞裂解试剂上下吹打十次,然后将板在中等功率下涡旋10分钟以促进细胞裂解。在完成荧光素酶测定之前,将板密封并储存在-80℃。
荧光素酶测定准备
将含有裂解细胞的96孔板在室温下解冻,在中等功率下涡旋10分钟并以2250g离心1分钟。将10μl裂解物从每个孔转移到白色Microplate FluoroNunc 96孔平底(FisherScientific,10346331)。如下所述,在BMG Labtech FLUOstar Omega读板器上使用LAR(Promega,目录号E4550)注射产生荧光素酶读数。在H2K细胞中转染后从荧光素酶测定收集的所有数据均基于四个技术重复和三个生物学重复(除了SP0346和SP0347,其只有一个生物学重复可用)。
C2C12细胞培养和转染
细胞维持
C2C12细胞在T-75烧瓶中在含有10%FBS(热灭活-Gibco 10500-064)、1%Glutamax(35050-038,Gibco)、1%青霉素-链霉素溶液(15140-122、Gibco)的DMEM(高葡萄糖,D6546,Sigma)中培养。每2-3天用新鲜培养基饲喂一次细胞,当它们达到70%汇合时进行传代。为了传代,去除培养基,用不含CaCl2、不含MgCl2的5ml DPBS(14190-094,Gibco)洗涤细胞两次,并使用1ml胰蛋白酶EDTA(25200-056,Gibco)使细胞从烧瓶(T-75)中分离。将细胞在37℃(在CO2培养箱中)孵育3至5分钟,直到在显微镜下确定细胞分离。将4ml完全培养基添加到烧瓶中以灭活胰蛋白酶,并将细胞悬液转移到15ml管中。细胞以250g沉淀3分钟。弃去上清液,将细胞重新悬浮在6ml培养基中。在Countess自动细胞计数器上对细胞进行计数,以1:10的稀释度接种并在37℃5%CO2下孵育。
细胞转染和分化
一旦C2C12细胞达到80%汇合,通过用DPBS洗涤,使用1ml胰蛋白酶EDTA从烧瓶中分离约3-5分钟,用4ml培养基清洗烧瓶表面并以250g沉淀3分钟,从T-75烧瓶中收集C2C12细胞。根据传代数以特定密度重新悬浮细胞(详见下表)。
C2C12的传代 转染前的饲养细胞密度(48孔板)
p.4,p.5,p.6 45,000个细胞/300μl培养基
p.7,p.8,p.9 40,000个细胞/300μl培养基
p.10,p.11,p.12 38,000个细胞/300μl培养基
然后将300μl适当的细胞悬液(基于传代数)分配到48孔板的每个孔中。48孔板中的细胞在37℃5%CO2下孵育。
24小时后,将细胞上的培养基替换为300μl预热的含有DMEM(高葡萄糖,D6546,Sigma)和1%Glutamax的转染培养基。300ng DNA用0.9μl Viafect(E4981,Promega)转染,总复合体积为每孔30μl。转染后将板轻轻混合并在37℃5%CO2下孵育。
24小时后,从转染的细胞中去除培养基并替换为由DMEM(高葡萄糖,无丙酮酸钠,11960-044,Gibco)、1%Glutamax、2%马血清(热灭活,16050-122,Gibco)组成的分化培养基。将板在37℃5%CO2下再孵育5.5天以诱导分化。分化后,观察细胞形态以确认分化成肌管。然后用300μl DPBS洗涤细胞,然后用100μl荧光素酶细胞培养裂解5X试剂(E1531,Promega)裂解,使用Milli-Q水稀释至1X。在完成荧光素酶测定之前,将板密封并储存在-80℃。
荧光素酶检测准备
将含有裂解细胞的48孔板在室温下解冻,在中等功率下涡旋10分钟并以2250xg离心1分钟。将10μl裂解物从每个孔转移到白色Microplate FluoroNunc 96孔平底(FisherScientific,10346331)。如下所述,在BMG Labtech FLUOstar Omega读板器上使用LAR(Promega,目录号E4550)注射产生荧光素酶读数。在C2C12细胞中转染后从荧光素酶测定收集的所有数据均基于三个技术重复和至少三个生物学重复。
Huh7细胞培养和转染
材料
-Huh7细胞,其是一种人类肝细胞系
-DPBS:不含CaCl2,不含MgCl2(Gibco,14190-094)
-DMEM(Sigma,D6546)
-FBS(Sigma,F9665)
-Pen-Strep(Sigma,P4333)
-Promega Fugene-HD(E2311)
-LARII(双荧光素酶报告基因1000测定系统,Promega,E1980)
方法
第1天
将细胞以25,000个细胞/300μl的密度接种到48孔板上。
HEK293细胞培养和转染
第2天
-在转染当天,将要转染的DNA稀释至100ng/μl储存溶液。
-每48孔转染,经45ng DNA与4.1μl Optimem培养基混合。将0.5μl Fusion HD与4μl Optimem培养基混合。将这两种溶液混合并在室温下孵育15分钟,然后逐滴加入孔中。
第3天
如下详述测量荧光素酶活性。
HEK293细胞培养和转染
HEK293-T以20%的密度接种。一旦它们达到60和80%之间的汇合,培养基用补充有10%FBS(Gibco,26140)的DMEM(#21885-025–Thermo Scientific)替换。3小时后,用转染混合物转染细胞。通过在无菌DPBS(#14190169-ThermoFisher Scientific)中以1:3的比率添加DNA(每6孔板2μg)和PEI 25kDA(#23966-1–Polyscience)来制备转染混合物。混合后,转染混合物在室温下孵育30分钟,然后直接加入细胞中。
转染后24小时,如下所述测量荧光素酶活性。
荧光素酶活性的测量
-使用LARII(双荧光素酶报告基因1000测定系统,Promega,E1980)测量荧光素酶活性
-转染后24小时,从细胞中取出培养基
-细胞在300μl DPBS中洗涤一次。
-使用100μl被动裂解缓冲液裂解细胞并摇动孵育15分钟
-通过在台式离心机中以最大速度离心板,使细胞碎片沉淀
-将10μl样品转移到白色96孔板中,并通过在BMG Labtech FLUOstar Omega读板器上注射50μl LARII底物来测量发光
这些细胞培养产生的结果如图1-11和13、14、15、16和20所示。
实施例2–体内测试
创建了包含SP0173、SP0270、SP0268、SP0320、SP0134、SP0279、SP0057、SP0229、SP0310、SP0067和SP0267中的每一个或驱动荧光素酶基因的对照启动子CBA和CK8的表达盒,并且包含这些表达盒的AAV2/9通过高效液相色谱(HPLC)进行纯化。AAV在0.9%盐水中稀释,并以1e+12vg/小鼠的剂量以200μl/小鼠通过尾静脉递送到8只8周龄雄性Balb/c(野生型)小鼠中。6周后处死小鼠,收集膈肌(骨骼肌)、心脏(心肌)、肠(骨骼肌)、肾脏(特异性对照组织)、肝脏(特异性对照组织)、肺(特异性对照组织)、股四头肌(骨骼肌)、脾脏(特异性对照组织)和胫骨前肌(骨骼肌),并分为三部分。样品在解剖后立即在液氮中速冻,并储存在-80℃。通过蛋白质定量(使用BCA Pierce蛋白质测定试剂盒;Promega 23225)和荧光素酶定量(使用ONE-Glo荧光素酶测定系统;Promega E6120)创建膈肌、心脏、肠、肝脏、股四头肌和胫骨前肌的读数。RLU值计算为pg/ml。
图17中的x轴为对数刻度。为了以对数刻度(log10)绘制数据,标准化的RLU值在转换为对数刻度之前乘以109。x轴表示标准化的RLU值乘以109的log10。图18和19中的x轴表示RLU值(pg/ml)。
如图17A-F所示,体内测试的合成启动子在心脏、膈肌、股四头肌和胫骨前肌中比在肝脏和肠中更有活性。
一些启动子如SP0270和SP0268(图18B和18C)在骨骼肌(膈肌和胫骨前肌)中比在心肌(心脏)中更有活性。其他启动子如SP0057、SP0229和SP0067(图18G、18H和图18I)在心肌(心脏)中比在骨骼肌(膈肌和胫骨前肌)中更有活性。
图19和图18I显示心肌特异性启动子SP0067在骨骼肌(膈肌、股四头肌、胫骨前肌、肠)中没有活性,但在心脏中有活性。SP0067在心肌中的活性低于对照启动子CBA和CK8,但与这些通用型对照启动子不同,与骨骼肌相比,它对心肌具有高度特异性。SP0067在肝脏中也有一些活性。
实施例3–鉴定高性能CRE和启动子元件及其组合
骨骼肌和心肌:
组装了一大组超过100个合成启动子,其包含预期可用于增强肌肉特异性基因表达的CRE和/或启动子元件的各种组合(这包括实施例1和2的合成启动子以及另外的肌肉特异性启动子)并在骨骼肌和心肌中进行了测试。这些启动子代表一大组肌肉特异性启动子,其可用于评估各种CRE、启动子元件及其组合对在心肌和骨骼肌中表达的贡献。在心肌和骨骼肌(H9C2和C2C12细胞)中测试的一大组启动子在图21-23中被称为“ALL”。
对所述组进行分析以鉴定与心肌和骨骼肌中高水平的肌肉特异性表达特别密切相关的CRE组、启动子元件组及其组合。
在所有测试的启动子组中,发现包含选自由CRE0035、CRE0036、CRE0029、CRE0071、CRE0020和CRE0031组成的组的两个或更多个可操作地连接的“核心”骨骼和心脏CRE的肌肉特异性启动子的特定子集与骨骼肌和心肌中的高水平活性特别相关。该优选的启动子组在图21B中被称为“组1”。
此外,发现包含与核心心脏和骨骼启动子元件CRE0037、CRE0070、SKM_18、CRE0010、CRE0049、CRE0048、CRE0011、SKM_14和CRE0046之一可操作地连接的上述核心心脏和骨骼CRE中的至少一种的肌肉特异性启动子的另一个子集与高活性特别相关。该优选的启动子组在图22B中被称为“组2”。
此外,发现包含选自CRE0037、CRE0070、SKM_18、CRE0010、CRE0049、CRE0048、CRE0011、SKM_14和CRE0046的两个核心心脏和骨骼启动子元件的肌肉特异性启动子的子集与高活性特别相关。该优选的启动子组在图23B中被称为“组3”。
为了说明“组1”的启动子的特别高活性,图21B显示了骨骼肌和心肌中的组“ALL”(n=103)和“组1”(n=9)的平均活性(注意,“ALL”包含“组1”的启动子加上另外的启动子)。骨骼肌中每个启动子的活性和心肌中的活性被平均以表示骨骼肌和心肌中的(平均)活性。从该图可以看出,“组1”的平均活性是组“ALL”的平均活性的两倍左右。
不希望受理论束缚,“组1”的卓越表现可能是由于一种或多种核心骨骼和心脏CRE的存在。在骨骼肌和心肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的CRE的数量进行计数。此外,对每个启动子中存在的核心骨骼和心脏CRE的数量进行计数,其中核心CRE也是CRE0035、CRE0036、CRE0029、CRE0071、CRE0020和CRE0031。计算了具有特定数量的核心CRE的启动子相对于任意CRE的平均活性,并显示在图21A中。该图显示,与具有指定数量的CRE的启动子相比,启动子中指定数量的核心骨骼和心脏CRE的存在与活性增加有关,其中所述CRE是任意CRE。
为了说明“组2”的启动子的特别高活性,图22B显示了骨骼肌和心肌中的组“ALL”(n=103)和“组2”(n=20)的平均活性(注意,“ALL”包含“组2”的启动子加上另外的启动子)。骨骼肌中每个启动子的活性和心肌中的活性被平均以表示骨骼肌和心肌中的(平均)活性。从该图可以看出,“组2”的平均活性是组“ALL”的平均活性的三倍左右。
不希望受理论束缚,“组2”的卓越表现可能是由于骨骼和心脏CRE以及核心骨骼和心脏启动子元件的存在。在心肌和骨骼肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的元件的数量进行计数,即每个启动子元件、CRE、5’UTR/内含子计为一个元件。此外,对每个启动子中存在的核心骨骼和心脏CRE以及核心骨骼和心脏启动子元件的数量进行计数。计算了具有特定数量的核心CRE和启动子元件的启动子相对于任意元件的平均活性,并显示在图22A中。该图显示,与具有指定数量的元件的启动子相比,启动子中指定数量的核心骨骼和心脏CRE以及核心骨骼和心脏启动子元件的存在与活性增加有关,其中所述元件是任意元件。
为了说明“组3”的启动子的特别高活性,图23B显示了心肌和骨骼肌中的组“ALL”(n=103)和“组3”(n=2)的平均活性(注意,“ALL”包含“组3”的启动子加上另外的启动子)。骨骼肌中每个启动子的活性和心肌中的活性被平均以表示骨骼肌和心肌中的(平均)活性。从该图可以看出,“组3”的平均活性是组“ALL”的平均活性的两倍左右。
不希望受理论束缚,“组3”的卓越表现可能是由于核心骨骼和心脏启动子元件的存在。在心肌和骨骼肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的元件的数量进行计数,即每个启动子元件、CRE、5’UTR/内含子计为1个元件。此外,对每个启动子中存在的核心骨骼和心脏启动子元件的数量进行计数。计算了具有特定数量的核心骨骼和心脏启动子元件的启动子相对于任意元件的平均活性,并显示在图23A中。该图显示,与具有指定数量的元件的启动子相比,启动子中指定数量的核心骨骼和心脏启动子元件的存在与活性增加有关,其中所述元件是任意元件。
骨骼肌:
组装了一大组超过100个合成启动子,其包含预期可用于增强肌肉特异性基因表达的CRE和/或启动子元件的各种组合(这包括实施例1和2的合成启动子以及另外的肌肉特异性启动子)并在骨骼肌中进行了测试。这些启动子代表一大组肌肉特异性启动子,其可用于评估各种CRE、启动子元件及其组合对在骨骼肌中表达的贡献。在骨骼肌(C2C12细胞)中测试的一大组启动子在图24-25中被称为“ALL”。
对所述组进行分析以鉴定与骨骼肌中高水平的肌肉特异性表达特别密切相关的CRE组和启动子元件组。
在所有测试的启动子组中,发现包含选自由RE0035、CRE0050、CRE0020、CRE0031、CRE0047、CRE0071和DES_MT_增强子_48bp组成的组的两个或更多个可操作地连接的“核心”骨骼CRE的肌肉特异性启动子的特定子集与骨骼肌中的高水平活性特别相关。该优选的启动子组在图24B中被称为“组4”。
此外,发现包含与核心骨骼启动子元件CRE0049、CRE0037、SKM_14_CRE0048、CRE0011_RSV、CRE0070、CRE0046之一可操作地连接的上述核心骨骼CRE中的至少一种的肌肉特异性启动子的另一个子集与骨骼肌中的高活性特别相关。该优选的启动子组在图25B中被称为“组5”。
为了说明“组4”的启动子的特别高活性,图24B显示了组“ALL”(n=104)和“组4”(n=6)的平均活性(注意,“ALL”包含“组4”的启动子加上另外的启动子)。从该图可以看出,“组4”的平均活性是组“ALL”的平均活性的三倍左右。
不希望受理论束缚,“组4”在骨骼肌中的卓越表现可能是由于一种或多种核心骨骼CRE的存在。在骨骼肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的CRE的数量进行计数。此外,对每个启动子中存在的核心骨骼CRE的数量进行计数,其中核心骨骼CRE也是CRE0035、CRE0050、CRE0020、CRE0031、CRE0047、CRE0071和DES_MT_增强子_48bp。计算了具有特定数量的核心骨骼CRE的启动子相对于任意CRE的平均活性,并显示在图24A中。该图显示,与具有指定数量的CRE的启动子相比,启动子中指定数量的核心骨骼CRE的存在与活性增加有关,其中所述CRE是任意CRE。
为了说明“组5”的启动子的特别高活性,图25B显示了组“ALL”(n=104)和“组5”(n=16)的平均活性(注意,指定包含“组5”的启动子加上另外的启动子)。从该图可以看出,“组5”的平均相对活性是组“ALL”的平均活性的三倍左右。
不希望受理论束缚,“组5”的卓越表现可能是由于核心骨骼CRE和核心骨骼启动子元件的存在。在骨骼肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的元件的数量进行计数,即每个启动子元件、CRE或5’UTR/内含子计为一个元件。此外,对每个启动子中存在的核心骨骼CRE和核心骨骼启动子元件的数量进行计数。计算了具有特定数量的核心骨骼CRE和启动子元件的启动子相对于任意元件的平均活性,并显示在图25A中。该图显示,与具有指定数量的元件的启动子相比,启动子中指定数量的核心骨骼CRE和核心骨骼启动子元件的存在与活性增加有关,其中所述元件是任意元件。
骨骼肌和心肌:
组装了一大组超过250个合成启动子,其包含预期可用于增强肌肉特异性基因表达的CRE和/或启动子元件的各种组合(这包括实施例1和2的合成启动子以及另外的肌肉特异性启动子)并在心肌中进行了测试。这些启动子代表一大组肌肉特异性启动子,其可用于评估各种CRE、启动子元件及其组合对在心肌中表达的贡献。在心肌(H9C2细胞)中测试的一大组启动子在图26-28中被称为“ALL”。
对所述组进行分析以鉴定与心肌中高水平的肌肉特异性表达特别密切相关的CRE组、启动子元件组及其组合。
在所有测试的启动子组中,发现包含选自由CRE0035、CRE0029、CRE0069、CRE0071、CRE0036、CRE0096、CRE0079、CRE0051、CRE0031和CRE0020组成的组的两个或更多个可操作地连接的“核心”心脏CRE的肌肉特异性启动子的特定子集与心肌中的高水平活性特别相关。该优选的启动子组在图26B中被称为“组6”。
此外,发现包含与核心心脏启动子元件SKM_18、CRE0070、CRE0010_ITGB1BP2、CRE0037、DES_mp_V1、CRE0046之一可操作地连接的上述核心心脏CRE中的至少一种的肌肉特异性启动子的另一个子集与心肌中的高活性特别相关。该优选的启动子组在图27B中被称为“组7”。
此外,发现包含选自SKM_18、CRE0070、CRE0010_ITGB1BP2、CRE0037、DES_mp_V1、CRE0046的两个核心心脏启动子元件的肌肉特异性启动子的子集与心肌中的高活性特别相关。该优选的启动子组在图28B中被称为“组8”。
为了说明“组6”的启动子的特别高活性,图26B显示了心肌中的组“ALL”(n=285)和“组6”(n=49)的平均活性(注意,“ALL”包含“组6”的启动子加上另外的启动子)。从该图可以看出,“组6”的平均活性是组“ALL”的平均活性的两倍左右。
不希望受理论束缚,“组5”的卓越表现可能是由于一种或多种核心心脏CRE的存在。在心肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的CRE的数量进行计数。此外,对每个启动子中存在的核心心脏CRE的数量进行计数,其中核心CRE也是CRE0035、CRE0029、CRE0069、CRE0071、CRE0036、CRE0096、CRE0079、CRE0051、CRE0031和CRE0020。计算了具有特定数量的核心心脏CRE的启动子相对于任意CRE的平均活性,并显示在图26A中。该图显示,与具有指定数量的CRE的启动子相比,启动子中指定数量的核心心脏CRE的存在与活性增加有关,其中所述CRE是任意CRE。
为了说明“组7”的启动子的特别高活性,图27B显示了心肌中的组“ALL”(n=285)和“组7”(n=73)的平均活性(注意,“ALL”包含“组7”的启动子加上另外的启动子)。从该图可以看出,“组7”的平均活性是组“ALL”的平均活性的两倍左右。
不希望受理论束缚,“组7”的卓越表现可能是由于心脏CRE和核心心脏启动子元件的存在。在心肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的元件数量进行计数,即每个启动子元件、CRE、5’UTR/内含子计为一个元件。此外,对每个启动子中存在的核心心脏CRE和核心心脏启动子元件的数量进行计数。计算了具有特定数量的核心心脏CRE和启动子元件的启动子相对于任意元件的平均活性,并显示在图27A中。该图显示,与具有指定数量的元件的启动子相比,启动子中特定数量的核心心脏CRE和启动子元件的存在与心肌中活性增加有关,其中所述元件是任意元件。
为了说明“组8”的启动子的特别高活性,图28B显示了心肌中的组“ALL”(n=285)和“组8”(n=2)的平均活性(注意,“ALL”包含“组8”的启动子加上另外的启动子)。从该图可以看出,“组8”的平均活性是组“ALL”的平均活性的两倍左右。
不希望受理论束缚,“组8”的卓越表现可能是由于核心心脏启动子元件的存在。在心肌中测试的所有启动子组(组“ALL”)中,对每个启动子中存在的元件数量进行计数,即每个启动子元件、CRE、5’UTR/内含子计为1个元件。此外,对每个启动子中存在的核心心脏启动子元件的数量进行计数。计算了具有特定数量的核心心脏启动子元件的启动子相对于任意元件的平均活性,并显示在图28A中。该图显示,与具有指定数量的元件的启动子相比,启动子中指定数量的核心心脏启动子元件的存在与活性增加有关,其中所述元件是任意元件。
分析:
一些合成启动子的活性已被标准化为已知的启动子CBA,而其他合成启动子的活性已被标准化为已知的启动子RSV。在我们的测定中,已知的启动子CBA和已知的启动子RSV的活性约为1:1,因此被标准化为CBA的合成启动子的活性和被标准化为RSV的合成启动子的活性已一起整理和分析,以鉴定高性能CRE和启动子元件及其组合。因此,图23-图28中所示的合成启动子的活性已被标准化为CBA或RSV。
应该注意的是,一些启动子属于“组1”、“组2”、“组3”、“组4”、“组5”、“组5”、“组7”和“组8”的不止一个组。
上述分析没有提供有助于骨骼肌和/或心肌中的活性的CRE和/或启动子元件的排他性列表。当添加到启动子元件或合成启动子中时,还有其他CRE和/或启动子元件有助于骨骼和/或心肌中的活性。
例如,与单独的SKM_18相比,将顺式调节元件CRE0033添加到启动子元件SKM_18(形成合成启动子SP0067)导致在心肌(H9C2细胞)中的活性增加,如图29A所示。此外,向总共两个CRE0033和一个SKM_18(产生合成启动子SP0436)添加另一个顺式调节元件CRE0033导致在心肌中的活性进一步增加,如图29A所示。SKM_18是核心心脏启动子元件和核心心脏和骨骼启动子元件。
类似地,将顺式调节元件CRE0090添加到合成启动子SP0409(其又由CRE0083和SKM_18组成),形成合成启动子SP0418,导致与SP0409相比在心肌(H9C2细胞)中的活性增加,如图29B所示。
此外,将顺式调节元件CRE0096添加到合成启动子SP0067(其又由CRE0033和SKM_18组成),形成合成启动子SP0451,导致与SP0067相比在心肌(H9C2细胞)中的活性增加,如图29C所示。
序列信息
表1–肌肉特异性启动子
Figure BDA0003811822590001641
Figure BDA0003811822590001651
Figure BDA0003811822590001661
Figure BDA0003811822590001671
Figure BDA0003811822590001681
Figure BDA0003811822590001691
Figure BDA0003811822590001701
Figure BDA0003811822590001711
Figure BDA0003811822590001721
Figure BDA0003811822590001731
Figure BDA0003811822590001741
Figure BDA0003811822590001751
Figure BDA0003811822590001761
Figure BDA0003811822590001771
Figure BDA0003811822590001781
Figure BDA0003811822590001791
Figure BDA0003811822590001801
Figure BDA0003811822590001811
Figure BDA0003811822590001821
Figure BDA0003811822590001831
Figure BDA0003811822590001841
Figure BDA0003811822590001851
Figure BDA0003811822590001861
Figure BDA0003811822590001871
Figure BDA0003811822590001881
Figure BDA0003811822590001891
Figure BDA0003811822590001901
Figure BDA0003811822590001911
Figure BDA0003811822590001921
Figure BDA0003811822590001931
Figure BDA0003811822590001941
Figure BDA0003811822590001951
Figure BDA0003811822590001961
Figure BDA0003811822590001971
Figure BDA0003811822590001981
Figure BDA0003811822590001991
Figure BDA0003811822590002001
Figure BDA0003811822590002011
Figure BDA0003811822590002021
Figure BDA0003811822590002031
Figure BDA0003811822590002041
表1A–另外的肌肉特异性启动子
Figure BDA0003811822590002042
Figure BDA0003811822590002051
Figure BDA0003811822590002061
Figure BDA0003811822590002071
Figure BDA0003811822590002081
Figure BDA0003811822590002091
Figure BDA0003811822590002101
Figure BDA0003811822590002111
Figure BDA0003811822590002121
表1B–另外的心肌特异性启动子
Figure BDA0003811822590002122
Figure BDA0003811822590002131
Figure BDA0003811822590002141
Figure BDA0003811822590002151
Figure BDA0003811822590002161
Figure BDA0003811822590002171
Figure BDA0003811822590002181
Figure BDA0003811822590002191
Figure BDA0003811822590002201
Figure BDA0003811822590002211
表1C–另外的肌肉特异性启动子
Figure BDA0003811822590002212
Figure BDA0003811822590002221
Figure BDA0003811822590002231
Figure BDA0003811822590002241
Figure BDA0003811822590002251
Figure BDA0003811822590002261
Figure BDA0003811822590002271
Figure BDA0003811822590002281
Figure BDA0003811822590002291
Figure BDA0003811822590002301
Figure BDA0003811822590002311
表2–来自表1的启动子的CRM
Figure BDA0003811822590002312
Figure BDA0003811822590002321
Figure BDA0003811822590002331
Figure BDA0003811822590002341
Figure BDA0003811822590002351
Figure BDA0003811822590002361
Figure BDA0003811822590002371
Figure BDA0003811822590002381
Figure BDA0003811822590002391
Figure BDA0003811822590002401
Figure BDA0003811822590002411
Figure BDA0003811822590002421
Figure BDA0003811822590002431
Figure BDA0003811822590002441
Figure BDA0003811822590002451
Figure BDA0003811822590002461
Figure BDA0003811822590002471
Figure BDA0003811822590002481
Figure BDA0003811822590002491
Figure BDA0003811822590002501
Figure BDA0003811822590002511
Figure BDA0003811822590002521
Figure BDA0003811822590002531
Figure BDA0003811822590002541
表2A–来自表1A的启动子的CRM
Figure BDA0003811822590002542
Figure BDA0003811822590002551
Figure BDA0003811822590002561
Figure BDA0003811822590002571
Figure BDA0003811822590002581
表2B–来自表1B的启动子的CRM
Figure BDA0003811822590002582
Figure BDA0003811822590002591
Figure BDA0003811822590002601
表2C–来自表1C的启动子的CRM
Figure BDA0003811822590002602
Figure BDA0003811822590002611
Figure BDA0003811822590002621
Figure BDA0003811822590002631
Figure BDA0003811822590002641
Figure BDA0003811822590002651
表3–包含在表1的启动子中的顺式调节元件
Figure BDA0003811822590002652
Figure BDA0003811822590002661
Figure BDA0003811822590002671
Figure BDA0003811822590002681
Figure BDA0003811822590002691
Figure BDA0003811822590002701
Figure BDA0003811822590002711
Figure BDA0003811822590002721
表4–包含在表1的启动子中的最小/近端启动子
Figure BDA0003811822590002722
Figure BDA0003811822590002731
Figure BDA0003811822590002741
Figure BDA0003811822590002751
表5–其他元件(例如内含子/UTR)
Figure BDA0003811822590002752
Figure BDA0003811822590002761
表6–除了表3中的CRE外,包含在表1A的启动子中的顺式调控元件。
Figure BDA0003811822590002762
Figure BDA0003811822590002771
Figure BDA0003811822590002781
表7–除了表4中的最小或近端启动子外,包含在表1A的启动子中的最小/近端启动子。
Figure BDA0003811822590002791
表8–除了表3和/或表6中的CRE外,包含在表1B和1C的启动子中的顺式调节元件。
Figure BDA0003811822590002792
Figure BDA0003811822590002801
Figure BDA0003811822590002811
Figure BDA0003811822590002821
表9–除了表4和/或表7中的最小或近端启动子外,包含在表1B和1C的启动子中的最小/近端启动子。
Figure BDA0003811822590002822
Figure BDA0003811822590002831
表10–根据本发明实施方案的心脏特异性启动子的示意图,其中标明了顺式调节元件和最小或近端启动子
Figure BDA0003811822590002832
Figure BDA0003811822590002841
Figure BDA0003811822590002851
表11
Figure BDA0003811822590002852
Figure BDA0003811822590002861
Figure BDA0003811822590002871
Figure BDA0003811822590002881
序列表
<110> 塞普洛麦克斯有限公司
阿斯克肋匹奥生物制药公司
<120> 调节核酸序列
<130> P266013WO
<150> GB1919269.9
<151> 2019-12-24
<150> GB2012192.7
<151> 2020-08-05
<160> 550
<170> PatentIn version 3.5
<210> 1
<211> 298
<212> DNA
<213> 人工序列
<220>
<223> SP0010
<400> 1
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccacc 298
<210> 2
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> SP0020
<400> 2
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtccaccg cctgctgcca 300
cggccggccg tataaataga ggcgaggagc agctgggctc tcttggcagt cacc 354
<210> 3
<211> 270
<212> DNA
<213> 人工序列
<220>
<223> SP0033
<400> 3
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgccaccg cctgctgcca cggccggccg tataaataga ggcgaggagc 240
agctgggctc tcttggcagt caccgccacc 270
<210> 4
<211> 286
<212> DNA
<213> 人工序列
<220>
<223> SP0038
<400> 4
taagtccggg cagggtcctg tccataaaag gcttttcccg ggccggctcc ccgccggcag 60
cgtgccccgc cccggcccgc tccatctcca aagcatgcag agaatgtctc ggcagccccg 120
gtagactgct ccaacttggt gtctttcccc aaatatggag cctgtgtgga gtcactgggg 180
gagccggggg tggggagcgg agccggcttc ctctagccac cgcctgctgc cacggccggc 240
cgtataaata gaggcgagga gcagctgggc tctcttggca gtcacc 286
<210> 5
<211> 315
<212> DNA
<213> 人工序列
<220>
<223> SP0040
<400> 5
ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60
tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120
ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180
cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240
aggagccacc gcctgctgcc acggccggcc gtataaatag aggcgaggag cagctgggct 300
ctcttggcag tcacc 315
<210> 6
<211> 421
<212> DNA
<213> 人工序列
<220>
<223> SP0042
<400> 6
ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60
tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120
ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180
cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240
aggagaggtc cctatatggt tgtgttagag tgaacggcca gcttcagccc gtctttgctc 300
cttgtttggg aagcgagtgg gaggggatca gagcaagggg ctatataacc cttcagcgtt 360
cagcctcccg ggacaccacc cacccagagt ggagaagccc agccagtcgc tgtcagccac 420
c 421
<210> 7
<211> 524
<212> DNA
<213> 人工序列
<220>
<223> SP0051
<400> 7
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtttctcc tctataaata 300
cccgctctgg tatttggggt tggcagctgt tgctgccagg gagatggttg ggttgacggg 360
atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420
ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480
gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524
<210> 8
<211> 601
<212> DNA
<213> 人工序列
<220>
<223> SP0057
<400> 8
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240
gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300
ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360
aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420
acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc gcattcctgg 480
gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg gcggcccacg 540
agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg cggccgccac 600
c 601
<210> 9
<211> 531
<212> DNA
<213> 人工序列
<220>
<223> SP0058
<400> 9
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaaactcgg gggccaggca ctggcgctga 300
cgcaggctag cagggcgcca ctggctggtc cccacccacc tcggtgggtt gggggatggg 360
cgcaccagcc cctcctgggt gagccctagc ctggggcttc ctatttcggg agccgggggc 420
gtgggccacg tctcctcatg tgatgcgagg gctatttaaa gcggcagccc gggcagggag 480
ccgccgtcgg agcccttgca cgcctgctct cttgtagctg cggccgccac c 531
<210> 10
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> SP0061
<400> 10
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaaataaat acccgctctg gtatttgggg 300
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcg ggatcttgca 360
gctgtcaggg gaggggaggc gggggctgat gtcaggaggg atacaaatag tgccgacggc 420
tgggggccct gtctcccctc gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc 480
ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcgg ccgccacc 528
<210> 11
<211> 454
<212> DNA
<213> 人工序列
<220>
<223> SP0062
<400> 11
ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60
tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120
gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180
tgctctgagg agctggaacc ataaataccc gctctggtat ttggggttct cctctataaa 240
tacccgctct ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg 300
ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 360
cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 420
cagcctcgcc cgcgccgtca ccgcggccgc cacc 454
<210> 12
<211> 484
<212> DNA
<213> 人工序列
<220>
<223> SP0064
<400> 12
tacatcattt acctagaaaa gaggacagct gtcctttccc aaagctccgg tgaccctgcc 60
ccgcccagtg tgactagccc aggttggtga ttctgatctg ttgccaaacc aaactggctc 120
cccggggagc catttggtaa tgttccctgg agtcatttcc ttgcgaagca ttccttttcg 180
gtgagaggac atttttttca tccctgataa acaaccacag cctgcgccag ataaataccc 240
gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300
gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360
aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420
gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 480
cacc 484
<210> 13
<211> 465
<212> DNA
<213> 人工序列
<220>
<223> SP0065
<400> 13
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg cataaatacc cgctctggta tttggggttc 240
tcctctataa atacccgctc tggtatttgg ggttggcagc tgttgcggga tcttgcagct 300
gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc cgacggctgg 360
gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg ccgcctcctc 420
cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg ccacc 465
<210> 14
<211> 484
<212> DNA
<213> 人工序列
<220>
<223> SP0066
<400> 14
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc ataaataccc 240
gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300
gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360
aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420
gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 480
cacc 484
<210> 15
<211> 443
<212> DNA
<213> 人工序列
<220>
<223> SP0067
<400> 15
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctga taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg 240
gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg 300
ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgccgc 360
atccactctc cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc 420
gcgccgtcac cgcggccgcc acc 443
<210> 16
<211> 448
<212> DNA
<213> 人工序列
<220>
<223> SP0068
<400> 16
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg ttctcctcta taaatacccg 240
ctctggtatt tggggttggc agctgttgcg ggatcttgca gctgtcaggg gaggggaggc 300
gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360
gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 420
cgcccgcgcc gtcaccgcgg ccgccacc 448
<210> 17
<211> 518
<212> DNA
<213> 人工序列
<220>
<223> SP0069
<400> 17
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaaattttt aaagactgag gaattaggca 300
cctgtcattt ttgccagctg gtgtagatgt taaaaattac tgtcactctt ccgcctgcta 360
ctttattttg cacctgctgt tacttgagtt acaggcattt cacacatggt aatttaataa 420
ggttagttcc catgacacac cgcctgctgc cacggccggc cgtataaata gaggcgagga 480
gcagctgggc tctcttggca gtcaccgcgg ccgccacc 518
<210> 18
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> SP0070
<400> 18
ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60
tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120
gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180
tgctctgagg agctggaacc atttttaaag actgaggaat taggcacctg tcatttttgc 240
cagctggtgt agatgttaaa aattactgtc actcttccgc ctgctacttt attttgcacc 300
tgctgttact tgagttacag gcatttcaca catggtaatt taataaggtt agttcccatg 360
acacaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag ctgggctctc 420
ttggcagtca ccgcggccgc cacc 444
<210> 19
<211> 404
<212> DNA
<213> 人工序列
<220>
<223> SP0071
<400> 19
gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60
cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120
ggtggggcgg ggcgggccgc gagccggaga aagagaaagc atttttaaag actgaggaat 180
taggcacctg tcatttttgc cagctggtgt agatgttaaa aattactgtc actcttccgc 240
ctgctacttt attttgcacc tgctgttact tgagttacag gcatttcaca catggtaatt 300
taataaggtt agttcccatg acacaccgcc tgctgccacg gccggccgta taaatagagg 360
cgaggagcag ctgggctctc ttggcagtca ccgcggccgc cacc 404
<210> 20
<211> 433
<212> DNA
<213> 人工序列
<220>
<223> SP0075
<400> 20
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctga tttttaaaga ctgaggaatt aggcacctgt catttttgcc agctggtgta 240
gatgttaaaa attactgtca ctcttccgcc tgctacttta ttttgcacct gctgttactt 300
gagttacagg catttcacac atggtaattt aataaggtta gttcccatga cacaccgcct 360
gctgccacgg ccggccgtat aaatagaggc gaggagcagc tgggctctct tggcagtcac 420
cgcggccgcc acc 433
<210> 21
<211> 438
<212> DNA
<213> 人工序列
<220>
<223> SP0076
<400> 21
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgattttt aaagactgag gaattaggca cctgtcattt ttgccagctg 240
gtgtagatgt taaaaattac tgtcactctt ccgcctgcta ctttattttg cacctgctgt 300
tacttgagtt acaggcattt cacacatggt aatttaataa ggttagttcc catgacacac 360
cgcctgctgc cacggccggc cgtataaata gaggcgagga gcagctgggc tctcttggca 420
gtcaccgcgg ccgccacc 438
<210> 22
<211> 538
<212> DNA
<213> 人工序列
<220>
<223> SP0132
<400> 22
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtataaat acccgctctg 300
gtatttgggg ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcg 360
ggatcttgca gctgtcaggg gaggggaggc gggggctgat gtcaggaggg atacaaatag 420
tgccgacggc tgggggccct gtctcccctc gccgcatcca ctctccggcc ggccgcctgc 480
ccgccgcctc ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcgg ccgccacc 538
<210> 23
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> SP0133
<400> 23
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtattttt aaagactgag 300
gaattaggca cctgtcattt ttgccagctg gtgtagatgt taaaaattac tgtcactctt 360
ccgcctgcta ctttattttg cacctgctgt tacttgagtt acaggcattt cacacatggt 420
aatttaataa ggttagttcc catgacacac cgcctgctgc cacggccggc cgtataaata 480
gaggcgagga gcagctgggc tctcttggca gtcaccgcgg ccgccacc 528
<210> 24
<211> 655
<212> DNA
<213> 人工序列
<220>
<223> SP0134
<400> 24
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctcggccgg ggccgcattc ctgggggccg 540
ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cacgagctac 600
ccggaggagc gggaggcgcc aagctctaga actagtggat cccgcggccg ccacc 655
<210> 25
<211> 588
<212> DNA
<213> 人工序列
<220>
<223> SP0136
<400> 25
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtgtttct tagcagctgc 300
tgctgtgtcc aaggcttgga attgctgtgg tgaatctaaa actgtctcag tagtggtgag 360
ctgacctcac ccaagttcaa agccctactc tgcctgatcc ttttttcctg agcctcagag 420
ctaaaatgcc cccgagctct ttcctattgg ctggaaagac gaattgaagt tcccttgccc 480
atgttaggag gtgtacgcct cctgaactaa agatagaaac agctggccct tccaggcagc 540
taaaagcctc cagactaaga ggtgttcccc attcgggcgg ccgccacc 588
<210> 26
<211> 660
<212> DNA
<213> 人工序列
<220>
<223> SP0146
<400> 26
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgcat gccatgttcc cggcgaaggg ccagctgtcc cccgccagct agactcagca 180
cttagtttag gaaccagtga gcaagtcagc ccttggggca gcccatacaa ggccatgggg 240
ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg cccgggcaac gagctgaaag 300
ctcatctgct ctcaggggcc cctccctggg gacagcccct cctggctagt cacaccctgt 360
aggctcctct atataaccca ggggcacagg ggctgccctc attctaccac cacctccaca 420
gcacagacag acactcagga gccagccagc caggtaggga ctgtactagc agctacaatc 480
cagctaccat tctgctttta ttttatggtt gggataaggc tggattattc tgagtccaag 540
ctaggccctt ttgctaatca tgttcatacc tcttatcttc ctcccacagc tcctgggcaa 600
cgtgctggtc tgtgtgctgg cccatcactt tggcaaagaa ttgcgatcgc ctctagaacc 660
<210> 27
<211> 806
<212> DNA
<213> 人工序列
<220>
<223> SP0147
<400> 27
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcatgtt cccggcgaag 300
ggccagctgt cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca 360
gcccttgggg cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg 420
gtgggcacgg tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg 480
gggacagccc ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca 540
ggggctgccc tcattctacc accacctcca cagcacagac agacactcag gagccagcca 600
gccaggtagg gactgtacta gcagctacaa tccagctacc attctgcttt tattttatgg 660
ttgggataag gctggattat tctgagtcca agctaggccc ttttgctaat catgttcata 720
cctcttatct tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac 780
tttggcaaag aattgcgatc gccacc 806
<210> 28
<211> 938
<212> DNA
<213> 人工序列
<220>
<223> SP0148
<400> 28
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaattc tcatgtttga 300
cagcttatca tcgcagatcc gtatggtgca ctctcagtac aatctgctct gatgccgcat 360
agttaagcca gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca 420
aaatttaagc tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg 480
ttaggcgttt tgcgctgctt cgcgatgtac gggccagata tacgcgtatc tgaggggact 540
agggtgtgtt taggcgaaaa gcggggcttc ggttgtacgc ggttaggagt cccctcagga 600
tatagtagtt tcgcttttgc atagggaggg ggaaatgtag tcttatgcaa tactcttgta 660
gtcttgcaac atggtaacga tgagttagca acatgcctta caaggagaga aaaagcaccg 720
tgcatgccga ttggtggaag taaggtggta cgatcgtgcc ttattaggaa ggcaacagac 780
gggtctgaca tggattggac gaaccactga attccgcatt gcagagatat tgtatttaag 840
tgcctagctc gatacaataa acgccatttg accattcacc acattggtgt gcacctccaa 900
gctgggtacc gcgggcccgg gatccaccgg tcgccacc 938
<210> 29
<211> 814
<212> DNA
<213> 人工序列
<220>
<223> SP0150
<400> 29
gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60
cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120
ggtggggcgg ggcgggccgc gagccggaga aagagaaagc caattctcat gtttgacagc 180
ttatcatcgc agatccgtat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 240
aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg cgagcaaaat 300
ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc ttagggttag 360
gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgtatctgag gggactaggg 420
tgtgtttagg cgaaaagcgg ggcttcggtt gtacgcggtt aggagtcccc tcaggatata 480
gtagtttcgc ttttgcatag ggagggggaa atgtagtctt atgcaatact cttgtagtct 540
tgcaacatgg taacgatgag ttagcaacat gccttacaag gagagaaaaa gcaccgtgca 600
tgccgattgg tggaagtaag gtggtacgat cgtgccttat taggaaggca acagacgggt 660
ctgacatgga ttggacgaac cactgaattc cgcattgcag agatattgta tttaagtgcc 720
tagctcgata caataaacgc catttgacca ttcaccacat tggtgtgcac ctccaagctg 780
ggtaccgcgg gcccgggatc caccggtcgc cacc 814
<210> 30
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> SP0153
<400> 30
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcccggc agacgctcct tatacggccc ggcctcgctc acctgggccg 240
cggccaggag cgccttcttt gggcagcgcc gggccggggc cgcgccgggc ccgacaccca 300
aatatggcga cggccggggc cgcattcctg ggggccgggc ggcgctcccg cccgcctcga 360
taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg aggccacc 418
<210> 31
<211> 508
<212> DNA
<213> 人工序列
<220>
<223> SP0155
<400> 31
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg cccggcagac 300
gctccttata cggcccggcc tcgctcacct gggccgcggc caggagcgcc ttctttgggc 360
agcgccgggc cggggccgcg ccgggcccga cacccaaata tggcgacggc cggggccgca 420
ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 480
gcccacgagc tacccggagg agcgggag 508
<210> 32
<211> 718
<212> DNA
<213> 人工序列
<220>
<223> SP0156
<400> 32
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggggccc cacagcagct gggggcattt atgggccttc ctataaactt 240
ctgagagggt aactttatcc tgcttctttc agccaagtat cctcctccag cagctggtca 300
caaagctggt taatctccca gagtgctcag cttaaaaccc gtgactcaca gcacagccag 360
tgtgggggag ggggtggctg cctccaatac gtggcgccca gagtcagctg ttctggggcc 420
ttctctggtt tctccaactg agtcctgagg tttggggcct tgtcttcctt cctggagttt 480
ctcctctata aatacccgct ctggtatttg gggttggcag ctgttgctgc cagggagatg 540
gttgggttga cgggatcttg cagctgtcag gggaggggag gcgggggctg atgtcaggag 600
ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc cactctccgg 660
ccggccgcct gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg ccgtcacc 718
<210> 33
<211> 202
<212> DNA
<213> 人工序列
<220>
<223> SP0157
<400> 33
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgcat gcccaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag 180
ctgggctctc ttggcagtca cc 202
<210> 34
<211> 705
<212> DNA
<213> 人工序列
<220>
<223> SP0158
<400> 34
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300
attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360
ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420
caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480
aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggaga ggtccctata 540
tggttgtgtt agagtgaacg gccagcttca gcccgtcttt gctccttgtt tgggaagcga 600
gtgggagggg atcagagcaa ggggctatat aacccttcag cgttcagcct cccgggacac 660
cacccaccca gagtggagaa gcccagccag tcgctgtcag ccacc 705
<210> 35
<211> 615
<212> DNA
<213> 人工序列
<220>
<223> SP0159
<400> 35
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240
tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300
tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360
agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420
cattcaggtt agagaggaga ggtccctata tggttgtgtt agagtgaacg gccagcttca 480
gcccgtcttt gctccttgtt tgggaagcga gtgggagggg atcagagcaa ggggctatat 540
aacccttcag cgttcagcct cccgggacac cacccaccca gagtggagaa gcccagccag 600
tcgctgtcag ccacc 615
<210> 36
<211> 586
<212> DNA
<213> 人工序列
<220>
<223> SP0160
<400> 36
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240
ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300
tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360
tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag aggtccctat 420
atggttgtgt tagagtgaac ggccagcttc agcccgtctt tgctccttgt ttgggaagcg 480
agtgggaggg gatcagagca aggggctata taacccttca gcgttcagcc tcccgggaca 540
ccacccaccc agagtggaga agcccagcca gtcgctgtca gccacc 586
<210> 37
<211> 740
<212> DNA
<213> 人工序列
<220>
<223> SP0161
<400> 37
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300
attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360
ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420
caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480
aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggagc tgagtccttt 540
tgcatacatt tttcaaatga taactcactc tacccacccc ccttccctac ccccaaggcg 600
atttattgaa aaaaccacct tatatggtaa tattgctaac acaccgtcag ctggcctttt 660
tagggacttt gtttaaagaa gatccgcctc tggggtttta tattgctctg gtattcatgc 720
caaagacaca ccaggccacc 740
<210> 38
<211> 650
<212> DNA
<213> 人工序列
<220>
<223> SP0162
<400> 38
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240
tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300
tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360
agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420
cattcaggtt agagaggagc tgagtccttt tgcatacatt tttcaaatga taactcactc 480
tacccacccc ccttccctac ccccaaggcg atttattgaa aaaaccacct tatatggtaa 540
tattgctaac acaccgtcag ctggcctttt tagggacttt gtttaaagaa gatccgcctc 600
tggggtttta tattgctctg gtattcatgc caaagacaca ccaggccacc 650
<210> 39
<211> 621
<212> DNA
<213> 人工序列
<220>
<223> SP0163
<400> 39
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240
ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300
tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360
tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag ctgagtcctt 420
ttgcatacat ttttcaaatg ataactcact ctacccaccc cccttcccta cccccaaggc 480
gatttattga aaaaaccacc ttatatggta atattgctaa cacaccgtca gctggccttt 540
ttagggactt tgtttaaaga agatccgcct ctggggtttt atattgctct ggtattcatg 600
ccaaagacac accaggccac c 621
<210> 40
<211> 764
<212> DNA
<213> 人工序列
<220>
<223> SP0164
<400> 40
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggggccccac 240
agcagctggg ggcatttatg ggccttccta taaacttctg agagggtaac tttatcctgc 300
ttctttcagc caagtatcct cctccagcag ctggtcacaa agctggttaa tctcccagag 360
tgctcagctt aaaacccgtg actcacagca cagccagtgt gggggagggg gtggctgcct 420
ccaatacgtg gcgcccagag tcagctgttc tggggccttc tctggtttct ccaactgagt 480
cctgaggttt ggggccttgt cttccttcct ggagtgactc aggggcgcag gcctcttgcg 540
ggggagctgg cctccccgcc cccacggcca cgggccgccc tttcctggca ggacagcggg 600
atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 660
ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 720
gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 764
<210> 41
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> SP0165
<400> 41
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggactcaggg 240
gcgcaggcct cttgcggggg agctggcctc cccgccccca cggccacggg ccgccctttc 300
ctggcaggac agcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 360
agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 420
ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 480
<210> 42
<211> 894
<212> DNA
<213> 人工序列
<220>
<223> SP0166
<400> 42
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
caattctcat gtttgacagc ttatcatcgc agatccgtat ggtgcactct cagtacaatc 300
tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct 360
gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg 420
aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg 480
cgtatctgag gggactaggg tgtgtttagg cgaaaagcgg ggcttcggtt gtacgcggtt 540
aggagtcccc tcaggatata gtagtttcgc ttttgcatag ggagggggaa atgtagtctt 600
atgcaatact cttgtagtct tgcaacatgg taacgatgag ttagcaacat gccttacaag 660
gagagaaaaa gcaccgtgca tgccgattgg tggaagtaag gtggtacgat cgtgccttat 720
taggaaggca acagacgggt ctgacatgga ttggacgaac cactgaattc cgcattgcag 780
agatattgta tttaagtgcc tagctcgata caataaacgc catttgacca ttcaccacat 840
tggtgtgcac ctccaagctg ggtaccgcgg gcccgggatc caccggtcgc cacc 894
<210> 43
<211> 248
<212> DNA
<213> 人工序列
<220>
<223> SP0169
<400> 43
ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60
gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 180
ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 240
ccgccacc 248
<210> 44
<211> 482
<212> DNA
<213> 人工序列
<220>
<223> SP0170
<400> 44
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 300
gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 360
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 420
ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 480
cc 482
<210> 45
<211> 534
<212> DNA
<213> 人工序列
<220>
<223> SP0171
<400> 45
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc ggataaatac 300
ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg gggttggcag 360
ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat 420
acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg 480
ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 534
<210> 46
<211> 728
<212> DNA
<213> 人工序列
<220>
<223> SP0173
<400> 46
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctgataa atacccgctc tggtatttgg ggttctcctc tataaatacc cgctctggta 540
tttggggttg gcagctgttg cgggatcttg cagctgtcag gggaggggag gcgggggctg 600
atgtcaggag ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc 660
cactctccgg ccggccgcct gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg 720
ccgtcacc 728
<210> 47
<211> 608
<212> DNA
<213> 人工序列
<220>
<223> SP0227
<400> 47
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcatgtt cccggcgaag 300
ggccagctgt cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca 360
gcccttgggg cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg 420
gtgggcacgg tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg 480
gggacagccc ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca 540
ggggctgccc tcattctacc accacctcca cagcacagac agacactcag gagccagcca 600
gcgccacc 608
<210> 48
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> SP0228
<400> 48
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300
gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360
ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420
cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480
cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540
ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600
tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660
agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720
cgccatattt gggtgtccgc cctcggccgg ggccgcattc ctgggggccg ggcggtgctc 780
ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cacgagctac ccggaggagc 840
gggaggcgcc aagctctaga actagtggat cccgcggccg ccacc 885
<210> 49
<211> 1003
<212> DNA
<213> 人工序列
<220>
<223> SP0229
<400> 49
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300
gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360
ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420
cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480
cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540
ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600
tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660
agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720
cgccatattt gggtgtccgc cctcggccga taaatacccg ctctggtatt tggggttctc 780
ctctataaat acccgctctg gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt 840
caggggaggg gaggcggggg ctgatgtcag gagggataca aatagtgccg acggctgggg 900
gccctgtctc ccctcgccgc atccactctc cggccggccg cctgcccgcc gcctcctccg 960
tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc acc 1003
<210> 50
<211> 953
<212> DNA
<213> 人工序列
<220>
<223> SP0230
<400> 50
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtatcaag cttggtacgg 300
gccccacagc agctgggggc atttatgggc cttcctataa acttctgaga gggtaacttt 360
atcctgcttc tttcagccaa gtatcctcct ccagcagctg gtcacaaagc tggttaatct 420
cccagagtgc tcagcttaaa acccgtgact cacagcacag ccagtgtggg ggagggggtg 480
gctgcctcca atacgtggcg cccagagtca gctgttctgg ggccttctct ggtttctcca 540
actgagtcct gaggtttggg gccttgtctt ccttcctgga gtcaccgcgg tggcggccgt 600
ccgccctcgg caccatcctc acgacaccca aatatggcga cgggtgagga atggtgggga 660
gttattttta gagcggtgag gaaggtgggc aggcagcagg tgttggcgct ctaaaaataa 720
ctcccgggag ttatttttag agcggaggaa tggtggacac ccaaatatgg cgacggttcc 780
tcacccgtcg ccatatttgg gtgtccgccc tcggccgggg ccgcattcct gggggccggg 840
cggtgctccc gcccgcctcg ataaaaggct ccggggccgg cggcggccca cgagctaccc 900
ggaggagcgg gaggcgccaa gctctagaac tagtggatcc cgcggccgcc acc 953
<210> 51
<211> 773
<212> DNA
<213> 人工序列
<220>
<223> SP0231
<400> 51
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctcggccga taaatacccg ctctggtatt 540
tggggttctc ctctataaat acccgctctg gtatttgggg ttggcagctg ttgcgggatc 600
ttgcagctgt caggggaggg gaggcggggg ctgatgtcag gagggataca aatagtgccg 660
acggctgggg gccctgtctc ccctcgccgc atccactctc cggccggccg cctgcccgcc 720
gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc acc 773
<210> 52
<211> 683
<212> DNA
<213> 人工序列
<220>
<223> SP0232
<400> 52
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240
caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300
gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360
aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420
cctcggccga taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg 480
gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg 540
ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgccgc 600
atccactctc cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc 660
gcgccgtcac cgcggccgcc acc 683
<210> 53
<211> 710
<212> DNA
<213> 人工序列
<220>
<223> SP0257
<400> 53
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctgcccg gcagacgctc cttatacggc ccggcctcgc tcacctgggc cgcggccagg 540
agcgccttct ttgggcagcg ccgggccggg gccgcgccgg gcccgacacc caaatatggc 600
gacggccggg gccgcattcc tgggggccgg gcggcgctcc cgcccgcctc gataaaaggc 660
tccggggccg gcggcggccc acgagctacc cggaggagcg ggaggccacc 710
<210> 54
<211> 943
<212> DNA
<213> 人工序列
<220>
<223> SP0262
<400> 54
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctgccag ctgcctgccc cctgcctggc acagcccgta cctggccgca cgctccctca 540
caggtgaagc tcgaaaactc cgtccccgta aggagccccg ctgccccccg aggcctcctc 600
cctcacgcct cgctgcgctc ccggctcccg cacggccctg ggagaggccc ccaccgcttc 660
gtccttaacg ggcccggcgg tgccggggga ttatttcggc cccggccccg ggggggcccg 720
gcagacgctc cttatacggc ccggcctcgc tcacctgggc cgcggccagg agcgccttct 780
ttgggcagcg ccgggccggg gccgcgccgg gcccgacacc caaatatggc gacggccggg 840
gccgcattcc tgggggccgg gcggcgctcc cgcccgcctc gataaaaggc tccggggccg 900
gcggcggccc acgagctacc cggaggagcg ggaggcggcc acc 943
<210> 55
<211> 724
<212> DNA
<213> 人工序列
<220>
<223> SP0264
<400> 55
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggccgcg aagaccggaa gctggggcgg ccccgggccg cgcgcgctgg 240
gcctgggagg cgaaactcag cttccttcgt ttccgacttt tccatccgcg tcctccactt 300
ccccgttccg ccctccccca ttgccaacat tctggctgag tcacggcgcc ccagagcgcg 360
ccaggctggg ggaaaggagc agaagggagg gccctagcga cccgcgggat gtggtccgag 420
tcacgtccga ggggggtggg gagggatcgt gttctcggcg cccgcccctt cctagcgcgg 480
cctctgggct gcgcctctcg ggggcggccc gtagcccagt ccgtcgcctg ccattggacg 540
ccgcccgctc ctcgtaaagg aaaaagctcg gcggagggcg gagtggtgcc tttaaaaggc 600
cgggcgccgc cttccgcctg cccgcctcct gcgccgcccc ttccgaggct aaatcggctg 660
cgttcctctc ggaacgcgcc gcagaagggg tcctggtgac gagtcccgcg ttctctccgc 720
cacc 724
<210> 56
<211> 822
<212> DNA
<213> 人工序列
<220>
<223> SP0265
<400> 56
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccgcgaa 300
gaccggaagc tggggcggcc ccgggccgcg cgcgctgggc ctgggaggcg aaactcagct 360
tccttcgttt ccgacttttc catccgcgtc ctccacttcc ccgttccgcc ctcccccatt 420
gccaacattc tggctgagtc acggcgcccc agagcgcgcc aggctggggg aaaggagcag 480
aagggagggc cctagcgacc cgcgggatgt ggtccgagtc acgtccgagg ggggtgggga 540
gggatcgtgt tctcggcgcc cgccccttcc tagcgcggcc tctgggctgc gcctctcggg 600
ggcggcccgt agcccagtcc gtcgcctgcc attggacgcc gcccgctcct cgtaaaggaa 660
aaagctcggc ggagggcgga gtggtgcctt taaaaggccg ggcgccgcct tccgcctgcc 720
cgcctcctgc gccgcccctt ccgaggctaa atcggctgcg ttcctctcgg aacgcgccgc 780
agaaggggtc ctggtgacga gtcccgcgtt ctctccgcca cc 822
<210> 57
<211> 1016
<212> DNA
<213> 人工序列
<220>
<223> SP0266
<400> 57
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctggccg cgaagaccgg aagctggggc ggccccgggc cgcgcgcgct gggcctggga 540
ggcgaaactc agcttccttc gtttccgact tttccatccg cgtcctccac ttccccgttc 600
cgccctcccc cattgccaac attctggctg agtcacggcg ccccagagcg cgccaggctg 660
ggggaaagga gcagaaggga gggccctagc gacccgcggg atgtggtccg agtcacgtcc 720
gaggggggtg gggagggatc gtgttctcgg cgcccgcccc ttcctagcgc ggcctctggg 780
ctgcgcctct cgggggcggc ccgtagccca gtccgtcgcc tgccattgga cgccgcccgc 840
tcctcgtaaa ggaaaaagct cggcggaggg cggagtggtg cctttaaaag gccgggcgcc 900
gccttccgcc tgcccgcctc ctgcgccgcc ccttccgagg ctaaatcggc tgcgttcctc 960
tcggaacgcg ccgcagaagg ggtcctggtg acgagtcccg cgttctctcc gccacc 1016
<210> 58
<211> 560
<212> DNA
<213> 人工序列
<220>
<223> SP0267
<400> 58
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240
atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300
cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360
tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg 420
gccggggccg cattcctggg ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg 480
gggccggcgg cggcccacga gctacccgga ggagcgggag gcgccaagct ctagaactag 540
tggatcccgc ggccgccacc 560
<210> 59
<211> 728
<212> DNA
<213> 人工序列
<220>
<223> SP0268
<400> 59
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggtttct tagcagctgc tgctgtgtcc aaggcttgga attgctgtgg 240
tgaatctaaa actgtctcag tagtggtgag ctgacctcac ccaagttcaa agccctactc 300
tgcctgatcc ttttttcctg agcctcagag ctaaaatgcc cccgagctct ttcctattgg 360
ctggaaagac gaattgaagt tcccttgccc atgttaggag gtgtacgcct cctgaactaa 420
agatagaaac agctggccct tccaggcagc taaaagcctc cagactaaga ggtgttcccc 480
attcggataa atacccgctc tggtatttgg ggttctcctc tataaatacc cgctctggta 540
tttggggttg gcagctgttg cgggatcttg cagctgtcag gggaggggag gcgggggctg 600
atgtcaggag ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc 660
cactctccgg ccggccgcct gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg 720
ccgtcacc 728
<210> 60
<211> 562
<212> DNA
<213> 人工序列
<220>
<223> SP0270
<400> 60
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcggcgggat cttgcagctg tcaggggagg 420
ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 480
cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 540
cagcctcgcc cgcgccgtca cc 562
<210> 61
<211> 451
<212> DNA
<213> 人工序列
<220>
<223> SP0271
<400> 61
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcggcagcca gactccttga aatacccttt 420
cagtaatcat tcaaccaacg cttccgccac c 451
<210> 62
<211> 883
<212> DNA
<213> 人工序列
<220>
<223> SP0279
<400> 62
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctcggccgg ggccgcattc ctgggggccg 540
ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cactcagatc 600
gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga ccgatccagc 660
ctccgcggcc gggaacggtg cattggaacg cggattcccc gtgccaagag tgacgtaagt 720
accgcctata gactctatag gcacacccct ttggctctta tgcatgaacg gtggagggca 780
gtgtagtctg agcagtactc gttgctgccg cgcgcgccac cagacataat agctgacaga 840
ctaacagact gttcctttcc atgggtcttt tctgcaggcc acc 883
<210> 63
<211> 616
<212> DNA
<213> 人工序列
<220>
<223> SP0286
<400> 63
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccact cagatcgcct ggagacgcca tccacgctgt tttgacctcc atagaagaca 360
ccgggaccga tccagcctcc gcggccggga acggtgcatt ggaacgcgga ttccccgtgc 420
caagagtgac gtaagtaccg cctatagact ctataggcac acccctttgg ctcttatgca 480
tgaacggtgg agggcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga 540
cataatagct gacagactaa cagactgttc ctttccatgg gtcttttctg cagtcaccgt 600
ccttgacacg gccacc 616
<210> 64
<211> 562
<212> DNA
<213> 人工序列
<220>
<223> SP0305
<400> 64
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctgccac cgcctgctgc cacggccggc cgtataaata gaggcgagga gcagctgggc 540
tctcttggca gtcaccgcca cc 562
<210> 65
<211> 500
<212> DNA
<213> 人工序列
<220>
<223> SP0306
<400> 65
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240
gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300
taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360
cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420
cctgccaccg cctgctgcca cggccggccg tataaataga ggcgaggagc agctgggctc 480
tcttggcagt caccgccacc 500
<210> 66
<211> 554
<212> DNA
<213> 人工序列
<220>
<223> SP0307
<400> 66
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtgccact acgggtctag 300
gctgcccatg taaggaggca aggcctgggg acacccgaga tgcctggtta taattaaccc 360
agacatgtgg ctgccccccc cccccaacac ctgctgcctg agcctcaccc ccaccccggt 420
gcctgggtct taggctctgt acaccatgga ggagaagctc gctctaaaaa taaccctgcc 480
accgcctgct gccacggccg gccgtataaa tagaggcgag gagcagctgg gctctcttgg 540
cagtcaccgc cacc 554
<210> 67
<211> 636
<212> DNA
<213> 人工序列
<220>
<223> SP0309
<400> 67
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggccact acgggtctag gctgcccatg taaggaggca aggcctgggg 240
acacccgaga tgcctggtta taattaaccc agacatgtgg ctgccccccc cccccaacac 300
ctgctgcctg agcctcaccc ccaccccggt gcctgggtct taggctctgt acaccatgga 360
ggagaagctc gctctaaaaa taaccctgat aaatacccgc tctggtattt ggggttctcc 420
tctataaata cccgctctgg tatttggggt tggcagctgt tgcgggatct tgcagctgtc 480
aggggagggg aggcgggggc tgatgtcagg agggatacaa atagtgccga cggctggggg 540
ccctgtctcc cctcgccgca tccactctcc ggccggccgc ctgcccgccg cctcctccgt 600
gcgcccgcca gcctcgcccg cgccgtcacc gccacc 636
<210> 68
<211> 442
<212> DNA
<213> 人工序列
<220>
<223> SP0310
<400> 68
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg ttctcctcta taaatacccg 240
ctctggtatt tggggttggc agctgttgcg ggatcttgca gctgtcaggg gaggggaggc 300
gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360
gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 420
cgcccgcgcc gtcaccgcca cc 442
<210> 69
<211> 318
<212> DNA
<213> 人工序列
<220>
<223> SP0311
<400> 69
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgccaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag ctgggctctc 300
ttggcagtca ccgccacc 318
<210> 70
<211> 501
<212> DNA
<213> 人工序列
<220>
<223> SP0312
<400> 70
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggccactacg 240
ggtctaggct gcccatgtaa ggaggcaagg cctggggaca cccgagatgc ctggttataa 300
ttaacccaga catgtggctg cccccccccc ccaacacctg ctgcctgagc ctcaccccca 360
ccccggtgcc tgggtcttag gctctgtaca ccatggagga gaagctcgct ctaaaaataa 420
ccctgccacc gcctgctgcc acggccggcc gtataaatag aggcgaggag cagctgggct 480
ctcttggcag tcaccgccac c 501
<210> 71
<211> 395
<212> DNA
<213> 人工序列
<220>
<223> SP0313
<400> 71
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcccctg ccccccacag ctcctctcct gtgccttgtt tcccagccat 240
gcgttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt gctgccaggg 300
agatggttgg gttgacatgc caccgcctgc tgccacggcc ggccgtataa atagaggcga 360
ggagcagctg ggctctcttg gcagtcaccg ccacc 395
<210> 72
<211> 334
<212> DNA
<213> 人工序列
<220>
<223> SP0314
<400> 72
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgctctat aaatacccgc tctggtattt ggggttctct ataaataccc 240
gctctggtat ttggggttcc accgcctgct gccacggccg gccgtataaa tagaggcgag 300
gagcagctgg gctctcttgg cagtcaccgc cacc 334
<210> 73
<211> 204
<212> DNA
<213> 人工序列
<220>
<223> SP0315
<400> 73
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgccc accgcctgct gccacggccg gccgtataaa tagaggcgag gagcagctgg 180
gctctcttgg cagtcaccgc cacc 204
<210> 74
<211> 376
<212> DNA
<213> 人工序列
<220>
<223> SP0316
<400> 74
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgcat aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg 180
tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc 240
tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 300
tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 360
cgccgtcacc gccacc 376
<210> 75
<211> 944
<212> DNA
<213> 人工序列
<220>
<223> SP0320
<400> 75
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctgataa atacccgctc tggtatttgg ggttctcctc tataaatacc cgctctggta 540
tttggggttg gcagctgttg cgggatcttg cagctgtcag gggaggggag gcgggggctg 600
atgtcaggag ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgctcagat 660
cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg accgatccag 720
cctccgcggc cgggaacggt gcattggaac gcggattccc cgtgccaaga gtgacgtaag 780
taccgcctat agactctata ggcacacccc tttggctctt atgcatgaac ggtggagggc 840
agtgtagtct gagcagtact cgttgctgcc gcgcgcgcca ccagacataa tagctgacag 900
actaacagac tgttcctttc catgggtctt ttctgcaggc cacc 944
<210> 76
<211> 661
<212> DNA
<213> 人工序列
<220>
<223> SP0322
<400> 76
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180
gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240
ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300
aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360
gttcctcacc cgtcgccata tttgggtgtc cgccctcggc cggggccata aatacccgct 420
ctggtatttg gggttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt 480
gcgggatctt gcagctgtca ggggagggga ggcgggggct gatgtcagga gggatacaaa 540
tagtgccgac ggctgggggc cctgtctccc ctcgccgcat ccactctccg gccggccgcc 600
tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc gccgtcaccg cggccgccac 660
c 661
<210> 77
<211> 613
<212> DNA
<213> 人工序列
<220>
<223> SP0323
<400> 77
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagcccaca ttcctttcca gaggccagct ctccatttat agcccctggg cagagcagcc 120
accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat atggcgacgg 180
gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt 240
tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca 300
aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggcca 360
taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg gtatttgggg 420
ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg ctgatgtcag 480
gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgccgc atccactctc 540
cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac 600
cgcggccgcc acc 613
<210> 78
<211> 407
<212> DNA
<213> 人工序列
<220>
<223> SP0324
<400> 78
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagcttc tcctctataa 180
atacccgctc tggtatttgg ggttggcagc tgttgctgcc agggagatgg ttgggttgac 240
gggatcttgc agctgtcagg ggaggggagg cgggggctga tgtcaggagg gatacaaata 300
gtgccgacgg ctgggggccc tgtctcccct cgccgcatcc actctccggc cggccgcctg 360
cccgccgcct cctccgtgcg cccgccagcc tcgcccgcgc cgtcacc 407
<210> 79
<211> 409
<212> DNA
<213> 人工序列
<220>
<223> SP0325
<400> 79
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagcata aatacccgct 180
ctggtatttg gggttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt 240
gcgggatctt gcagctgtca ggggagggga ggcgggggct gatgtcagga gggatacaaa 300
tagtgccgac ggctgggggc cctgtctccc ctcgccgcat ccactctccg gccggccgcc 360
tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc gccgtcacc 409
<210> 80
<211> 483
<212> DNA
<213> 人工序列
<220>
<223> SP0326
<400> 80
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgcccta taaatacccg 240
ctctggtatt tggggttctc ctctataaat acccgctctg gtatttgggg ttggcagctg 300
ttgcgggatc ttgcagctgt caggggaggg gaggcggggg ctgatgtcag gagggataca 360
aatagtgccg acggctgggg gccctgtctc ccctcgccgc atccactctc cggccggccg 420
cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc 480
acc 483
<210> 81
<211> 538
<212> DNA
<213> 人工序列
<220>
<223> SP0327
<400> 81
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180
gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240
ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300
aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360
gttcctcacc cgtcgccata tttgggtgtc cgccctcggc cggggccgca ttcctggggg 420
ccgggcggtg ctcccgcccg cctcgataaa aggctccggg gccggcggcg gcccacgagc 480
tacccggagg agcgggaggc gccaagctct agaactagtg gatcccgcgg ccgccacc 538
<210> 82
<211> 822
<212> DNA
<213> 人工序列
<220>
<223> SP0328
<400> 82
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtagactg gggcaggtgc 300
aggctggatt gggtttccag aggctatata tataaaggct gccgggagcc ccagggccgc 360
tccctgaggg cacaacactg tgggggccca gccaggccca cattcctttc cagaggccag 420
ctctccattt atagcccctg ggcagagcag ccaccgcggt ggcggccgtc cgccctcggc 480
accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 540
agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 600
tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 660
catatttggg tgtccgccct cggccggggc cgcattcctg ggggccgggc ggtgctcccg 720
cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg 780
aggcgccaag ctctagaact agtggatccc gcggccgcca cc 822
<210> 83
<211> 324
<212> DNA
<213> 人工序列
<220>
<223> SP0329
<400> 83
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
ggaggaatgg tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg 180
tccgccctcg gccggggccg cattcctggg ggccgggcgg tgctcccgcc cgcctcgata 240
aaaggctccg gggccggcgg cggcccacga gctacccgga ggagcgggag gcgccaagct 300
ctagaactag tggatcccgc cacc 324
<210> 84
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0330
<400> 84
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 85
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0331
<400> 85
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgaggtaaac gagctattag 180
ttatgaggtc cgtagattga acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 86
<211> 565
<212> DNA
<213> 人工序列
<220>
<223> SP0332
<400> 86
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240
caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300
gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360
aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420
cctcggccgg ggccgcattc ctgggggccg ggcggtgctc ccgcccgcct cgataaaagg 480
ctccggggcc ggcggcggcc cacgagctac ccggaggagc gggaggcgcc aagctctaga 540
actagtggat cccgcggccg ccacc 565
<210> 87
<211> 543
<212> DNA
<213> 人工序列
<220>
<223> SP0333
<400> 87
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggtttct tagcagctgc tgctgtgtcc aaggcttgga attgctgtgg 240
tgaatctaaa actgtctcag tagtggtgag ctgacctcac ccaagttcaa agccctactc 300
tgcctgatcc ttttttcctg agcctcagag ctaaaatgcc cccgagctct ttcctattgg 360
ctggaaagac gaattgaagt tcccttgccc atgttaggag gtgtacgcct cctgaactaa 420
agatagaaac agctggccct tccaggcagc taaaagcctc cagactaaga ggtgttcccc 480
attcggcagc cagactcctt gaaataccct ttcagtaatc attcaaccaa cgcttccgcc 540
acc 543
<210> 88
<211> 362
<212> DNA
<213> 人工序列
<220>
<223> SP0334
<400> 88
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 240
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 300
ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 360
cc 362
<210> 89
<211> 715
<212> DNA
<213> 人工序列
<220>
<223> SP0335
<400> 89
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcggccatgt tcccggcgaa gggccagctg 420
tcccccgcca gctagactca gcacttagtt taggaaccag tgagcaagtc agcccttggg 480
gcagcccata caaggccatg gggctgggca agctgcacgc ctgggtccgg ggtgggcacg 540
gtgcccgggc aacgagctga aagctcatct actctcaggg gcccctccct ggggacagcc 600
cctcctggct agtcacaccc tgtaggctcc tctatataac ccaggggcac aggggctgcc 660
cccgggtcac caccacctcc acagcacaga cagacactca ggagccagcg ccacc 715
<210> 90
<211> 521
<212> DNA
<213> 人工序列
<220>
<223> SP0336
<400> 90
tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60
ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120
gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180
aagaggtgtt ccccattcgg ccatgttccc ggcgaagggc cagctgtccc ccgccagcta 240
gactcagcac ttagtttagg aaccagtgag caagtcagcc cttggggcag cccatacaag 300
gccatggggc tgggcaagct gcacgcctgg gtccggggtg ggcacggtgc ccgggcaacg 360
agctgaaagc tcatctactc tcaggggccc ctccctgggg acagcccctc ctggctagtc 420
acaccctgta ggctcctcta tataacccag gggcacaggg gctgcccccg ggtcaccacc 480
acctccacag cacagacaga cactcaggag ccagcgccac c 521
<210> 91
<211> 618
<212> DNA
<213> 人工序列
<220>
<223> SP0337
<400> 91
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcggcccggc agacgctcct tatacggccc 420
ggcctcgctc acctgggccg cggccaggag cgccttcttt gggcagcgcc gggccggggc 480
cgcgccgggc ccgacaccca aatatggcga cggccggggc cgcattcctg ggggccgggc 540
ggcgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg 600
gaggagcggg aggccacc 618
<210> 92
<211> 729
<212> DNA
<213> 人工序列
<220>
<223> SP0338
<400> 92
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagcgcc actacgggtc 180
taggctgccc atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa 240
cccagacatg tggctgcccc ccccccccaa cacctgctgc ctgagcctca cccccacccc 300
ggtgcctggg tcttaggctc tgtacaccat ggaggagaag ctcgctctaa aaataaccct 360
gtcaaagccc tactctgcct gatccttttt tcctgagcct cagagctaaa atgcccccga 420
gctctttcct attggctgga aagacgaatt gaagttccct tgcccatgtt aggaggtgta 480
cgcctcctga actaaagata gaaacagctg gcccttccag gcagctaaaa gcctccagac 540
taagaggtgt tccccattcg gcgggatctt gcagctgtca ggggagggga ggcgggggct 600
gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 660
ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 720
gccgtcacc 729
<210> 93
<211> 610
<212> DNA
<213> 人工序列
<220>
<223> SP0339
<400> 93
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgtcaaagcc ctactctgcc tgatcctttt ttcctgagcc tcagagctaa aatgcccccg 300
agctctttcc tattggctgg aaagacgaat tgaagttccc ttgcccatgt taggaggtgt 360
acgcctcctg aactaaagat agaaacagct ggcccttcca ggcagctaaa agcctccaga 420
ctaagaggtg ttccccattc ggcgggatct tgcagctgtc aggggagggg aggcgggggc 480
tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 540
tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 600
cgccgtcacc 610
<210> 94
<211> 654
<212> DNA
<213> 人工序列
<220>
<223> SP0340
<400> 94
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcccggc agacgctcct tatacggccc ggcctcgctc acctgggccg 240
cggccaggag cgccttcttt gggcagcgcc gggccggggc cgcgccgggc ccgacaccca 300
aatatggcga cggccggggc cgcattcctg ggggccgggc ggcgctcccg cccgcctcga 360
taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg agataaatac 420
ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg gggttggcag 480
ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat 540
acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg 600
ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 654
<210> 95
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> SP0341
<400> 95
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcgggccgcg aagaccggaa gctggggcgg 420
ccccgggccg cgcgcgctgg gcctgggagg cgaaactcag cttccttcgt ttccgacttt 480
tccatccgcg tcctccactt ccccgttccg ccctccccca ttgccaacat tctggctgag 540
tcacggcgcc ccagagcgcg ccaggctggg ggaaaggagc agaagggagg gccctagcga 600
cccgcgggat gtggtccgag tcacgtccga ggggggtggg gagggatcgt gttctcggcg 660
cccgcccctt cctagcgcgg cctctgggct gcgcctctcg ggggcggccc gtagcccagt 720
ccgtcgcctg ccattggacg ccgcccgctc ctcgtaaagg aaaaagctcg gcggagggcg 780
gagtggtgcc tttaaaaggc cgggcgccgc cttccgcctg cccgcctcct gcgccgcccc 840
ttccgaggct aaatcggctg cgttcctctc ggaacgcgcc gcagaagggg tcctggtgac 900
gagtcccgcg ttctctccgc cacc 924
<210> 96
<211> 488
<212> DNA
<213> 人工序列
<220>
<223> SP0342
<400> 96
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccca tgttcccggc 180
gaagggccag ctgtcccccg ccagctagac tcagcactta gtttaggaac cagtgagcaa 240
gtcagccctt ggggcagccc atacaaggcc atggggctgg gcaagctgca cgcctgggtc 300
cggggtgggc acggtgcccg ggcaacgagc tgaaagctca tctactctca ggggcccctc 360
cctggggaca gcccctcctg gctagtcaca ccctgtaggc tcctctatat aacccagggg 420
cacaggggct gcccccgggt caccaccacc tccacagcac agacagacac tcaggagcca 480
gcgccacc 488
<210> 97
<211> 652
<212> DNA
<213> 人工序列
<220>
<223> SP0343
<400> 97
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg ttctcctcta taaatacccg 240
ctctggtatt tggggttggc agctgttgcg ggatcttgca gctgtcaggg gaggggaggc 300
gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360
gctcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 420
cgatccagcc tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt 480
gacgtaagta ccgcctatag actctatagg cacacccctt tggctcttat gcatgaacgg 540
tggagggcag tgtagtctga gcagtactcg ttgctgccgc gcgcgccacc agacataata 600
gctgacagac taacagactg ttcctttcca tgggtctttt ctgcaggcca cc 652
<210> 98
<211> 693
<212> DNA
<213> 人工序列
<220>
<223> SP0345
<400> 98
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctcgggatc ttgcagctgt caggggaggg 540
gaggcggggg ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc 600
ccctcgccgc atccactctc cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc 660
agcctcgccc gcgccgtcac cgcggccgcc acc 693
<210> 99
<211> 576
<212> DNA
<213> 人工序列
<220>
<223> SP0346
<400> 99
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180
gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240
ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300
aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360
gttcctcacc cgtcgccata tttgggtgtc cgccctcggg atcttgcagc tgtcagggga 420
ggggaggcgg gggctgatgt caggagggat acaaatagtg ccgacggctg ggggccctgt 480
ctcccctcgc cgcatccact ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc 540
gccagcctcg cccgcgccgt caccgcggcc gccacc 576
<210> 100
<211> 606
<212> DNA
<213> 人工序列
<220>
<223> SP0347
<400> 100
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc ctagactagc 240
atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt tataattaac 300
ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat aaccctgcat 360
aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg tatttggggt 420
tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 480
agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 540
ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 600
gccacc 606
<210> 101
<211> 575
<212> DNA
<213> 人工序列
<220>
<223> SP0348
<400> 101
ctctgtctcc tcaggtgcct ggctgcttcc tagctgggcc tttccttctc ctctataaat 60
accagctctg gtatttcgcc ttggcagctg ttgctgctag ggagacggct ggcttgacat 120
gcatctcctg acaaaacaca aacccgtggt gtgagtgggt gtgggcggtg tgagtagggg 180
gatgaatcag agagggggcc tagactagca tgctgcccat gtaaggaggc aaggcctggg 240
gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc cccccccaac 300
acctgctgcc tctaaaaata accctgcata aatacccgct ctggtatttg gggttctcct 360
ctataaatac ccgctctggt atttggggtt ggcagctgtt gcgggatctt gcagctgtca 420
ggggagggga ggcgggggct gatgtcagga gggatacaaa tagtgccgac ggctgggggc 480
cctgtctccc ctcgccgcat ccactctccg gccggccgcc tgcccgccgc ctcctccgtg 540
cgcccgccag cctcgcccgc gccgtcaccg ccacc 575
<210> 102
<211> 907
<212> DNA
<213> 人工序列
<220>
<223> SP0349
<400> 102
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240
gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300
taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360
cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420
cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc caaatatggc 480
gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg gcaggcagca 540
ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg aatggtggac 600
acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc cctataaata 660
cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt ggggttggca 720
gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg tcaggaggga 780
tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac tctccggccg 840
gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg tcaccgcggc 900
cgccacc 907
<210> 103
<211> 727
<212> DNA
<213> 人工序列
<220>
<223> SP0350
<400> 103
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtttctcc tctataaata 300
cccgctctgg tatttggggt tggcagctgt tgctgccagg gagatggttg ggttgacacc 360
gcggtggcgg ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg 420
aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg 480
cgctctaaaa ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat 540
atggcgacgg ttcctcaccc gtcgccatat ttgggtgtcc gccctcggcc ggggccgcat 600
tcctgggggc cgggcggtgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg 660
cccacgagct acccggagga gcgggaggcg ccaagctcta gaactagtgg atcccgcggc 720
cgccacc 727
<210> 104
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0351
<400> 104
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180
tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 105
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0352
<400> 105
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagc tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaatagct cccgggagct atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 106
<211> 568
<212> DNA
<213> 人工序列
<220>
<223> SP0353
<400> 106
tccctaacct cctgcttgcg aggcctctct ctggcctctg agagggtcag tgtcctgccc 60
caacccatga gatgacagac tataatagcc acaggattaa catagcaggc attgtctttc 120
tctgactata gggtgggtat tatgtgttca tcaaccatcc taaaaatacc cggtaaacag 180
gtgcagcccc tgtggctcca gtcccctggg atctgttggc ttctggctgg agatgaagat 240
tagggcagag gagaggtgaa ttagtctcac tgagttccag gcatgagact cgggtgtcct 300
ttggaacctg ggaaatctag attccaggaa acccatctgg agggcccggc agacgctcct 360
tatacggccc ggcctcgctc acctgggccg cggccaggag cgccttcttt gggcagcgcc 420
gggccggggc cgcgccgggc ccgacaccca aatatggcga cggccggggc cgcattcctg 480
ggggccgggc ggcgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac 540
gagctacccg gaggagcggg aggccacc 568
<210> 107
<211> 376
<212> DNA
<213> 人工序列
<220>
<223> SP0354
<400> 107
ccatcctaaa aatacccggt aaacaggtgc agcccctgtg gctccagtcc cctgggatct 60
gttggcttct ggctggagat gaagattagg gcagaggaga ggtgaattag tctcactgag 120
ttccaggcat gagactcggg tgtcctttgg aacccggcag acgctcctta tacggcccgg 180
cctcgctcac ctgggccgcg gccaggagcg ccttctttgg gcagcgccgg gccggggccg 240
cgccgggccc gacacccaaa tatggcgacg gccggggccg cattcctggg ggccgggcgg 300
cgctcccgcc cgcctcgata aaaggctccg gggccggcgg cggcccacga gctacccgga 360
ggagcgggag gccacc 376
<210> 108
<211> 296
<212> DNA
<213> 人工序列
<220>
<223> SP0355
<400> 108
agggtcagtg tcctgcccca acccatgaga tgacagacta taatagccac aggattaaca 60
tagcaggcat tgcccggcag acgctcctta tacggcccgg cctcgctcac ctgggccgcg 120
gccaggagcg ccttctttgg gcagcgccgg gccggggccg cgccgggccc gacacccaaa 180
tatggcgacg gccggggccg cattcctggg ggccgggcgg cgctcccgcc cgcctcgata 240
aaaggctccg gggccggcgg cggcccacga gctacccgga ggagcgggag gccacc 296
<210> 109
<211> 654
<212> DNA
<213> 人工序列
<220>
<223> SP0356
<400> 109
ctgaggggtg tcagagcaca ggctgaggcc tcttgcctga cgtgggaccc cttggtctgg 60
catttgtcag tgaggcaggc tgggggcagg ccccggagct tggcaggagg tgtaaaccgg 120
ccttggaagg tagggcccca caatggggac agttggatct ctgagggaga cagggaggca 180
tgatcactgc caaatgccca ccaaggacaa ggcacatccc agggagacag acgcagacct 240
ggtgccctct ggacactggc attcctggag gctgatgatg gacagatggg cctggaggtg 300
gctcttcgcc agctggtgtt tcctttggac ttcctcagtg tctttggaga agcagagccc 360
taagaataag cagctgccca taaaatctaa taccagccaa gcatctcagg aattcatgga 420
ttgtctccat cccggcagac gctccttata cggcccggcc tcgctcacct gggccgcggc 480
caggagcgcc ttctttgggc agcgccgggc cggggccgcg ccgggcccga cacccaaata 540
tggcgacggc cggggccgca ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa 600
aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc cacc 654
<210> 110
<211> 659
<212> DNA
<213> 人工序列
<220>
<223> SP0358
<400> 110
ttctgagtcc tctaaggtcc ctcactccca actcagcccc atgtcctgtc aattcccact 60
cagtgtctga tctccttctc ctcacctttc ccatctcccg tttgacccaa gcttcctgag 120
ctctcctccc attccccttt ttggagtcct cctcctctcc cagaacccag taataagtgg 180
gctcctccct ggcctggacc cccgtggtaa ccctataagg cgaggcagct gctgtctgag 240
gcagggaggg gctggtgtgg gaggctaagg gcagctgcta agtttagggt ggctccttct 300
ctcttcttag agacaacagg tggctggggc ctcagtgccc agaaaagaaa atgtcttaga 360
ggtatcggca tgggcctgga ggagggggga cagggcaggg ggaggcatct tcctcaggac 420
atcgggtcct agaggcccgg cagacgctcc ttatacggcc cggcctcgct cacctgggcc 480
gcggccagga gcgccttctt tgggcagcgc cgggccgggg ccgcgccggg cccgacaccc 540
aaatatggcg acggccgggg ccgcattcct gggggccggg cggcgctccc gcccgcctcg 600
ataaaaggct ccggggccgg cggcggccca cgagctaccc ggaggagcgg gaggccacc 659
<210> 111
<211> 332
<212> DNA
<213> 人工序列
<220>
<223> SP0359
<400> 111
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgcc cggcagacgc 120
tccttatacg gcccggcctc gctcacctgg gccgcggcca ggagcgcctt ctttgggcag 180
cgccgggccg gggccgcgcc gggcccgaca cccaaatatg gcgacggccg gggccgcatt 240
cctgggggcc gggcggcgct cccgcccgcc tcgataaaag gctccggggc cggcggcggc 300
ccacgagcta cccggaggag cgggaggcca cc 332
<210> 112
<211> 483
<212> DNA
<213> 人工序列
<220>
<223> SP0361
<400> 112
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180
tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgcccta taaatacccg 240
ctctggtatt tggggttctc ctctataaat acccgctctg gtatttgggg ttggcagctg 300
ttgcgggatc ttgcagctgt caggggaggg gaggcggggg ctgatgtcag gagggataca 360
aatagtgccg acggctgggg gccctgtctc ccctcgccgc atccactctc cggccggccg 420
cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc 480
acc 483
<210> 113
<211> 535
<212> DNA
<213> 人工序列
<220>
<223> SP0362
<400> 113
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagcaca cccaaatatg 180
gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 240
caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgag ctctataaat 300
acccgctctg gtatttgggg ttttgaaccc gtcgccatat ttgggtgtcc gccctcggga 360
tcttgcagct gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc 420
cgacggctgg gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg 480
ccgcctcctc cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg ccacc 535
<210> 114
<211> 598
<212> DNA
<213> 人工序列
<220>
<223> SP0363
<400> 114
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc acacccaaat 240
atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300
cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc gagctctata 360
aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg tccgccctcg 420
ggatcttgca gctgtcaggg gaggggaggc gggggctgat gtcaggaggg atacaaatag 480
tgccgacggc tgggggccct gtctcccctc gccgcatcca ctctccggcc ggccgcctgc 540
ccgccgcctc ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcgg ccgccacc 598
<210> 115
<211> 683
<212> DNA
<213> 人工序列
<220>
<223> SP0364
<400> 115
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240
gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300
ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360
aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420
acggttcctc acccgtcgcc atatttgggt gtccgccctc ccggcagacg ctccttatac 480
ggcccggcct cgctcacctg ggccgcggcc aggagcgcct tctttgggca gcgccgggcc 540
ggggccgcgc cgggcccgac acccaaatat ggcgacggcc ggggccgcat tcctgggggc 600
cgggcggcgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg cccacgagct 660
acccggagga gcgggaggcc acc 683
<210> 116
<211> 453
<212> DNA
<213> 人工序列
<220>
<223> SP0365
<400> 116
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ccggcagacg 240
ctccttatac ggcccggcct cgctcacctg ggccgcggcc aggagcgcct tctttgggca 300
gcgccgggcc ggggccgcgc cgggcccgac acccaaatat ggcgacggcc ggggccgcat 360
tcctgggggc cgggcggcgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg 420
cccacgagct acccggagga gcgggaggcc acc 453
<210> 117
<211> 591
<212> DNA
<213> 人工序列
<220>
<223> SP0366
<400> 117
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgca ccgcggtggc 120
ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 180
tggggagtta tttttagagc ggtgaggaag gtgggcaggc agcaggtgtt ggcgctctaa 240
aaataactcc cgggagttat ttttagagcg gaggaatggt ggacacccaa atatggcgac 300
ggttcctcac ccgtcgccat atttgggtgt ccgccctata aatacccgct ctggtatttg 360
gggttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt gcgggatctt 420
gcagctgtca ggggagggga ggcgggggct gatgtcagga gggatacaaa tagtgccgac 480
ggctgggggc cctgtctccc ctcgccgcat ccactctccg gccggccgcc tgcccgccgc 540
ctcctccgtg cgcccgccag cctcgcccgc gccgtcaccg cggccgccac c 591
<210> 118
<211> 429
<212> DNA
<213> 人工序列
<220>
<223> SP0367
<400> 118
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgcc atgttcccgg 120
cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca 180
agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt 240
ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctactctc aggggcccct 300
ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg 360
gcacaggggc tgcccccggg tcaccaccac ctccacagca cagacagaca ctcaggagcc 420
agcgccacc 429
<210> 119
<211> 550
<212> DNA
<213> 人工序列
<220>
<223> SP0368
<400> 119
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtggc cactacgggt 120
ctaggctgcc catgtaagga ggcaaggcct ggggacaccc gagatgcctg gttataatta 180
acccagacat gtggctgccc ccccccccca acacctgctg cctgagcctc acccccaccc 240
cggtgcctgg gtcttaggct ctgtacacca tggaggagaa gctcgctcta aaaataaccc 300
tgataaatac ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg 360
gggttggcag ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt 420
caggagggat acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact 480
ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt 540
caccgccacc 550
<210> 120
<211> 388
<212> DNA
<213> 人工序列
<220>
<223> SP0369
<400> 120
cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60
aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120
gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180
gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240
tttagagcgg agcggccggg gccgcattcc tgggggccgg gcggtgctcc cgcccgcctc 300
gataaaaggc tccggggccg gcggcggccc acgagctacc cggaggagcg ggaggcgcca 360
agctctagaa ctagtggatc ccgccacc 388
<210> 121
<211> 514
<212> DNA
<213> 人工序列
<220>
<223> SP0370
<400> 121
cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60
aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120
gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180
gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240
tttagagcgg agcgacaccc aaatatggcg acgggtgagg aatggtgggg agttattttt 300
agagcggtga ggaaggtggg caggcagcag gtgttggcgc tctaaaaata actcccggga 360
gttattttta gagcggagcg gccggggccg cattcctggg ggccgggcgg tgctcccgcc 420
cgcctcgata aaaggctccg gggccggcgg cggcccacga gctacccgga ggagcgggag 480
gcgccaagct ctagaactag tggatcccgc cacc 514
<210> 122
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> SP0371
<400> 122
taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180
cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggccg cattcctggg 240
ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg gggccggcgg cggcccacga 300
gctacccgga ggagcgggag gcgccaagct ctagaactag tggatcccgc cacc 354
<210> 123
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> SP0372
<400> 123
aggctaaggg cagctgctaa gtttagggtg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180
cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggccg cattcctggg 240
ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg gggccggcgg cggcccacga 300
gctacccgga ggagcgggag gcgccaagct ctagaactag tggatcccgc cacc 354
<210> 124
<211> 362
<212> DNA
<213> 人工序列
<220>
<223> SP0373
<400> 124
taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc gctctaaggt ccctcactcc caactcagcc 180
ccatgtcctg tcaattcacc cgtcgccata tttgggtgtc cgccctcggc cggggccgca 240
ttcctggggg ccgggcggtg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 300
gcccacgagc tacccggagg agcgggaggc gccaagctct agaactagtg gatcccgcca 360
cc 362
<210> 125
<211> 362
<212> DNA
<213> 人工序列
<220>
<223> SP0374
<400> 125
ctctaaggtc cctcactccc aactcagccc catgtcctgt caattcgaca cccaaatatg 60
gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 120
caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgta aggcgaggca 180
gctgctgtct gaggcagacc cgtcgccata tttgggtgtc cgccctcggc cggggccgca 240
ttcctggggg ccgggcggtg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 300
gcccacgagc tacccggagg agcgggaggc gccaagctct agaactagtg gatcccgcca 360
cc 362
<210> 126
<211> 376
<212> DNA
<213> 人工序列
<220>
<223> SP0375
<400> 126
taaggcgagg cagctgctgt ctgaggcaga ggctaagggc agctgctaag tttagggtct 60
ctaaggtccc tcactcccaa ctcagcccca tgtcctgtca attccgacac ccaaatatgg 120
cgacgggtga ggaatggtgg ggagttattt ttagagcagg cagcaggtgt tggcgctcta 180
aaaataactc ccgggagtta tttttagagc gacccgtcgc catatttggg tgtccgccct 240
cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 300
cggggccggc ggcggcccac gagctacccg gaggagcggg aggcgccaag ctctagaact 360
agtggatccc gccacc 376
<210> 127
<211> 434
<212> DNA
<213> 人工序列
<220>
<223> SP0376
<400> 127
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg tactaaaaat agaacgacta 240
tttttaggct tttctggcag ctggcccggg atcttgcagc tgtcagggga ggggaggcgg 300
gggctgatgt caggagggat acaaatagtg ccgacggctg ggggccctgt ctcccctcgc 360
cgcatccact ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg 420
cccgcgccgt cacc 434
<210> 128
<211> 436
<212> DNA
<213> 人工序列
<220>
<223> SP0377
<400> 128
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg cgaggtacta taaataccct 240
tagaggtatt ttatcttggc agctaggtcg ggatcttgca gctgtcaggg gaggggaggc 300
gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360
gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 420
cgcccgcgcc gtcacc 436
<210> 129
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> SP0378
<400> 129
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300
actattttta ggcttttctg gcagctggcc ctgccagaca gagttcctca gtaacgggat 360
cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 420
gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 480
cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca cc 522
<210> 130
<211> 524
<212> DNA
<213> 人工序列
<220>
<223> SP0379
<400> 130
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300
cccttagagg tattttatct tggcagctag gtctgccaga cagagttcct cagtaacggg 360
atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420
ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480
gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524
<210> 131
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> SP0380
<400> 131
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300
actattttta ggcttttctg gcagctggcc ctgccagaca gataaacgag ctatcgggat 360
cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 420
gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 480
cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca cc 522
<210> 132
<211> 524
<212> DNA
<213> 人工序列
<220>
<223> SP0381
<400> 132
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300
cccttagagg tattttatct tggcagctag gtctgccaga cagataaacg agctatcggg 360
atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420
ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480
gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524
<210> 133
<211> 524
<212> DNA
<213> 人工序列
<220>
<223> SP0382
<400> 133
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttaaacg agctattagt 300
tatgaggtcc gtagattgaa taaacgagct attagttatg aggtccgtag attgaacggg 360
atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420
ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480
gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524
<210> 134
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> SKM_14
<400> 134
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgct gccagggaga 60
tggttgggtt gacgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 120
agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 180
ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 240
<210> 135
<211> 242
<212> DNA
<213> 人工序列
<220>
<223> SKM_18
<400> 135
ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60
gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 180
ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 240
cc 242
<210> 136
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> SKM_20
<400> 136
atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60
aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120
gcatttcaca catggtaatt taataaggtt agttcccatg acacaccgcc tgctgccacg 180
gccggccgta taaatagagg cgaggagcag ctgggctctc ttggcagtca cc 232
<210> 137
<211> 335
<212> DNA
<213> 人工序列
<220>
<223> SP0357
<400> 137
tctgagggag acagggaggc atgatcactg ccaaatgccc accaaggaca aggcacatcc 60
cagggagaca gacgcagacc tggtgccctc tggacactgg cattcctgga gcccggcaga 120
cgctccttat acggcccggc ctcgctcacc tgggccgcgg ccaggagcgc cttctttggg 180
cagcgccggg ccggggccgc gccgggcccg acacccaaat atggcgacgg ccggggccgc 240
attcctgggg gccgggcggc gctcccgccc gcctcgataa aaggctccgg ggccggcggc 300
ggcccacgag ctacccggag gagcgggagg ccacc 335
<210> 138
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0020
<400> 138
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 139
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0033
<400> 139
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 140
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0336
<400> 140
tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60
ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120
gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180
aagaggtgtt ccccattcgg 200
<210> 141
<211> 216
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0038
<400> 141
taagtccggg cagggtcctg tccataaaag gcttttcccg ggccggctcc ccgccggcag 60
cgtgccccgc cccggcccgc tccatctcca aagcatgcag agaatgtctc ggcagccccg 120
gtagactgct ccaacttggt gtctttcccc aaatatggag cctgtgtgga gtcactgggg 180
gagccggggg tggggagcgg agccggcttc ctctag 216
<210> 142
<211> 245
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0040
<400> 142
ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60
tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120
ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180
cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240
aggag 245
<210> 143
<211> 245
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0042
<400> 143
ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60
tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120
ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180
cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240
aggag 245
<210> 144
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0051
<400> 144
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 145
<211> 459
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0057
<400> 145
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240
gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300
ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360
aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420
acggttcctc acccgtcgcc atatttgggt gtccgccct 459
<210> 146
<211> 274
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0058
<400> 146
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaa 274
<210> 147
<211> 274
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0061
<400> 147
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaa 274
<210> 148
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0062
<400> 148
ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60
tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120
gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180
tgctctgagg agctggaacc 200
<210> 149
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0064
<400> 149
tacatcattt acctagaaaa gaggacagct gtcctttccc aaagctccgg tgaccctgcc 60
ccgcccagtg tgactagccc aggttggtga ttctgatctg ttgccaaacc aaactggctc 120
cccggggagc catttggtaa tgttccctgg agtcatttcc ttgcgaagca ttccttttcg 180
gtgagaggac atttttttca tccctgataa acaaccacag cctgcgccag 230
<210> 150
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0065
<400> 150
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg c 211
<210> 151
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0066
<400> 151
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc 230
<210> 152
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0067
<400> 152
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctg 189
<210> 153
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0068
<400> 153
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 154
<211> 274
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0069
<400> 154
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaa 274
<210> 155
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0070
<400> 155
ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60
tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120
gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180
tgctctgagg agctggaacc 200
<210> 156
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0071
<400> 156
gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60
cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120
ggtggggcgg ggcgggccgc gagccggaga aagagaaagc 160
<210> 157
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0075
<400> 157
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctg 189
<210> 158
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0076
<400> 158
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 159
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0132
<400> 159
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 160
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0133
<400> 160
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 161
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0134
<400> 161
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 162
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0136
<400> 162
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 163
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0146
<400> 163
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgc 128
<210> 164
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0147
<400> 164
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 165
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0148
<400> 165
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 166
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0150
<400> 166
gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60
cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120
ggtggggcgg ggcgggccgc gagccggaga aagagaaagc 160
<210> 167
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0153
<400> 167
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 168
<211> 290
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0155
<400> 168
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 290
<210> 169
<211> 478
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0156
<400> 169
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggggccc cacagcagct gggggcattt atgggccttc ctataaactt 240
ctgagagggt aactttatcc tgcttctttc agccaagtat cctcctccag cagctggtca 300
caaagctggt taatctccca gagtgctcag cttaaaaccc gtgactcaca gcacagccag 360
tgtgggggag ggggtggctg cctccaatac gtggcgccca gagtcagctg ttctggggcc 420
ttctctggtt tctccaactg agtcctgagg tttggggcct tgtcttcctt cctggagt 478
<210> 170
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0157
<400> 170
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgc 128
<210> 171
<211> 529
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0158
<400> 171
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300
attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360
ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420
caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480
aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggag 529
<210> 172
<211> 439
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0159
<400> 172
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240
tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300
tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360
agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420
cattcaggtt agagaggag 439
<210> 173
<211> 410
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0160
<400> 173
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240
ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300
tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360
tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag 410
<210> 174
<211> 529
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0161
<400> 174
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300
attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360
ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420
caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480
aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggag 529
<210> 175
<211> 439
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0162
<400> 175
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240
tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300
tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360
agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420
cattcaggtt agagaggag 439
<210> 176
<211> 410
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0163
<400> 176
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240
ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300
tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360
tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag 410
<210> 177
<211> 515
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0164
<400> 177
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggggccccac 240
agcagctggg ggcatttatg ggccttccta taaacttctg agagggtaac tttatcctgc 300
ttctttcagc caagtatcct cctccagcag ctggtcacaa agctggttaa tctcccagag 360
tgctcagctt aaaacccgtg actcacagca cagccagtgt gggggagggg gtggctgcct 420
ccaatacgtg gcgcccagag tcagctgttc tggggccttc tctggtttct ccaactgagt 480
cctgaggttt ggggccttgt cttccttcct ggagt 515
<210> 178
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0165
<400> 178
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg g 231
<210> 179
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0166
<400> 179
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
<210> 180
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0170
<400> 180
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
<210> 181
<211> 292
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0171
<400> 181
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gg 292
<210> 182
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0173
<400> 182
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctg 486
<210> 183
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0227
<400> 183
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 184
<211> 743
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0228
<400> 184
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300
gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360
ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420
cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480
cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540
ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600
tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660
agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720
cgccatattt gggtgtccgc cct 743
<210> 185
<211> 743
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0229
<400> 185
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300
gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360
ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420
cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480
cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540
ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600
tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660
agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720
cgccatattt gggtgtccgc cct 743
<210> 186
<211> 811
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0230
<400> 186
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtatcaag cttggtacgg 300
gccccacagc agctgggggc atttatgggc cttcctataa acttctgaga gggtaacttt 360
atcctgcttc tttcagccaa gtatcctcct ccagcagctg gtcacaaagc tggttaatct 420
cccagagtgc tcagcttaaa acccgtgact cacagcacag ccagtgtggg ggagggggtg 480
gctgcctcca atacgtggcg cccagagtca gctgttctgg ggccttctct ggtttctcca 540
actgagtcct gaggtttggg gccttgtctt ccttcctgga gtcaccgcgg tggcggccgt 600
ccgccctcgg caccatcctc acgacaccca aatatggcga cgggtgagga atggtgggga 660
gttattttta gagcggtgag gaaggtgggc aggcagcagg tgttggcgct ctaaaaataa 720
ctcccgggag ttatttttag agcggaggaa tggtggacac ccaaatatgg cgacggttcc 780
tcacccgtcg ccatatttgg gtgtccgccc t 811
<210> 187
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0231
<400> 187
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 188
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0232
<400> 188
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240
caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300
gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360
aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420
cct 423
<210> 189
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0257
<400> 189
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctg 486
<210> 190
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0262
<400> 190
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctg 486
<210> 191
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0264
<400> 191
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 192
<211> 292
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0265
<400> 192
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gg 292
<210> 193
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0266
<400> 193
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctg 486
<210> 194
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0267
<400> 194
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240
atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300
cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360
tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccct 418
<210> 195
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0268
<400> 195
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggtttct tagcagctgc tgctgtgtcc aaggcttgga attgctgtgg 240
tgaatctaaa actgtctcag tagtggtgag ctgacctcac ccaagttcaa agccctactc 300
tgcctgatcc ttttttcctg agcctcagag ctaaaatgcc cccgagctct ttcctattgg 360
ctggaaagac gaattgaagt tcccttgccc atgttaggag gtgtacgcct cctgaactaa 420
agatagaaac agctggccct tccaggcagc taaaagcctc cagactaaga ggtgttcccc 480
attcgg 486
<210> 196
<211> 394
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0270
<400> 196
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcgg 394
<210> 197
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0271
<400> 197
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 198
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0279
<400> 198
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 199
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0305
<400> 199
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctg 486
<210> 200
<211> 424
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0306
<400> 200
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240
gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300
taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360
cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420
cctg 424
<210> 201
<211> 478
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0307
<400> 201
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtgccact acgggtctag 300
gctgcccatg taaggaggca aggcctgggg acacccgaga tgcctggtta taattaaccc 360
agacatgtgg ctgccccccc cccccaacac ctgctgcctg agcctcaccc ccaccccggt 420
gcctgggtct taggctctgt acaccatgga ggagaagctc gctctaaaaa taaccctg 478
<210> 202
<211> 388
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0309
<400> 202
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctggccact acgggtctag gctgcccatg taaggaggca aggcctgggg 240
acacccgaga tgcctggtta taattaaccc agacatgtgg ctgccccccc cccccaacac 300
ctgctgcctg agcctcaccc ccaccccggt gcctgggtct taggctctgt acaccatgga 360
ggagaagctc gctctaaaaa taaccctg 388
<210> 203
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0310
<400> 203
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 204
<211> 242
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0311
<400> 204
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tg 242
<210> 205
<211> 425
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0312
<400> 205
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggccactacg 240
ggtctaggct gcccatgtaa ggaggcaagg cctggggaca cccgagatgc ctggttataa 300
ttaacccaga catgtggctg cccccccccc ccaacacctg ctgcctgagc ctcaccccca 360
ccccggtgcc tgggtcttag gctctgtaca ccatggagga gaagctcgct ctaaaaataa 420
ccctg 425
<210> 206
<211> 319
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0313
<400> 206
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcccctg ccccccacag ctcctctcct gtgccttgtt tcccagccat 240
gcgttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt gctgccaggg 300
agatggttgg gttgacatg 319
<210> 207
<211> 258
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0314
<400> 207
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgctctat aaatacccgc tctggtattt ggggttctct ataaataccc 240
gctctggtat ttggggtt 258
<210> 208
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0315
<400> 208
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgc 128
<210> 209
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0316
<400> 209
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgc 128
<210> 210
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0320
<400> 210
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300
gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360
attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420
accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480
accctg 486
<210> 211
<211> 407
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0322
<400> 211
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180
gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240
ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300
aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360
gttcctcacc cgtcgccata tttgggtgtc cgccctcggc cggggcc 407
<210> 212
<211> 359
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0323
<400> 212
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagcccaca ttcctttcca gaggccagct ctccatttat agcccctggg cagagcagcc 120
accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat atggcgacgg 180
gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt 240
tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca 300
aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggcc 359
<210> 213
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0324
<400> 213
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167
<210> 214
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0325
<400> 214
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167
<210> 215
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0326
<400> 215
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 216
<211> 396
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0327
<400> 216
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180
gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240
ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300
aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360
gttcctcacc cgtcgccata tttgggtgtc cgccct 396
<210> 217
<211> 680
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0328
<400> 217
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtagactg gggcaggtgc 300
aggctggatt gggtttccag aggctatata tataaaggct gccgggagcc ccagggccgc 360
tccctgaggg cacaacactg tgggggccca gccaggccca cattcctttc cagaggccag 420
ctctccattt atagcccctg ggcagagcag ccaccgcggt ggcggccgtc cgccctcggc 480
accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 540
agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 600
tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 660
catatttggg tgtccgccct 680
<210> 218
<211> 188
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0329
<400> 218
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
ggaggaatgg tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg 180
tccgccct 188
<210> 219
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0330
<400> 219
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 220
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0331
<400> 220
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgaggtaaac gagctattag 180
ttatgaggtc cgtagattga acccgtcgcc atatttgggt gtccgccct 229
<210> 221
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0332
<400> 221
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240
caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300
gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360
aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420
cct 423
<210> 222
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0333
<400> 222
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 223
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0334
<400> 223
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 224
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0335
<400> 224
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 225
<211> 394
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0337
<400> 225
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcgg 394
<210> 226
<211> 561
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0338
<400> 226
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagcgcc actacgggtc 180
taggctgccc atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa 240
cccagacatg tggctgcccc ccccccccaa cacctgctgc ctgagcctca cccccacccc 300
ggtgcctggg tcttaggctc tgtacaccat ggaggagaag ctcgctctaa aaataaccct 360
gtcaaagccc tactctgcct gatccttttt tcctgagcct cagagctaaa atgcccccga 420
gctctttcct attggctgga aagacgaatt gaagttccct tgcccatgtt aggaggtgta 480
cgcctcctga actaaagata gaaacagctg gcccttccag gcagctaaaa gcctccagac 540
taagaggtgt tccccattcg g 561
<210> 227
<211> 442
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0339
<400> 227
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgtcaaagcc ctactctgcc tgatcctttt ttcctgagcc tcagagctaa aatgcccccg 300
agctctttcc tattggctgg aaagacgaat tgaagttccc ttgcccatgt taggaggtgt 360
acgcctcctg aactaaagat agaaacagct ggcccttcca ggcagctaaa agcctccaga 420
ctaagaggtg ttccccattc gg 442
<210> 228
<211> 412
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0340
<400> 228
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcccggc agacgctcct tatacggccc ggcctcgctc acctgggccg 240
cggccaggag cgccttcttt gggcagcgcc gggccggggc cgcgccgggc ccgacaccca 300
aatatggcga cggccggggc cgcattcctg ggggccgggc ggcgctcccg cccgcctcga 360
taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg ag 412
<210> 229
<211> 394
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0341
<400> 229
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240
aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300
gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360
aaagcctcca gactaagagg tgttccccat tcgg 394
<210> 230
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0342
<400> 230
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167
<210> 231
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0343
<400> 231
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 232
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0345
<400> 232
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 233
<211> 396
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0346
<400> 233
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180
gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240
ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300
aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360
gttcctcacc cgtcgccata tttgggtgtc cgccct 396
<210> 234
<211> 358
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0347
<400> 234
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc ctagactagc 240
atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt tataattaac 300
ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat aaccctgc 358
<210> 235
<211> 327
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0348
<400> 235
ctctgtctcc tcaggtgcct ggctgcttcc tagctgggcc tttccttctc ctctataaat 60
accagctctg gtatttcgcc ttggcagctg ttgctgctag ggagacggct ggcttgacat 120
gcatctcctg acaaaacaca aacccgtggt gtgagtgggt gtgggcggtg tgagtagggg 180
gatgaatcag agagggggcc tagactagca tgctgcccat gtaaggaggc aaggcctggg 240
gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc cccccccaac 300
acctgctgcc tctaaaaata accctgc 327
<210> 236
<211> 653
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0349
<400> 236
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240
gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300
taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360
cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420
cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc caaatatggc 480
gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg gcaggcagca 540
ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg aatggtggac 600
acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc cct 653
<210> 237
<211> 585
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0350
<400> 237
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtttctcc tctataaata 300
cccgctctgg tatttggggt tggcagctgt tgctgccagg gagatggttg ggttgacacc 360
gcggtggcgg ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg 420
aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg 480
cgctctaaaa ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat 540
atggcgacgg ttcctcaccc gtcgccatat ttgggtgtcc gccct 585
<210> 238
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0351
<400> 238
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180
tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccct 229
<210> 239
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0352
<400> 239
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagc tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaatagct cccgggagct atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 240
<211> 344
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0353
<400> 240
tccctaacct cctgcttgcg aggcctctct ctggcctctg agagggtcag tgtcctgccc 60
caacccatga gatgacagac tataatagcc acaggattaa catagcaggc attgtctttc 120
tctgactata gggtgggtat tatgtgttca tcaaccatcc taaaaatacc cggtaaacag 180
gtgcagcccc tgtggctcca gtcccctggg atctgttggc ttctggctgg agatgaagat 240
tagggcagag gagaggtgaa ttagtctcac tgagttccag gcatgagact cgggtgtcct 300
ttggaacctg ggaaatctag attccaggaa acccatctgg aggg 344
<210> 241
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0354
<400> 241
ccatcctaaa aatacccggt aaacaggtgc agcccctgtg gctccagtcc cctgggatct 60
gttggcttct ggctggagat gaagattagg gcagaggaga ggtgaattag tctcactgag 120
ttccaggcat gagactcggg tgtcctttgg aa 152
<210> 242
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0355
<400> 242
agggtcagtg tcctgcccca acccatgaga tgacagacta taatagccac aggattaaca 60
tagcaggcat tg 72
<210> 243
<211> 430
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0356
<400> 243
ctgaggggtg tcagagcaca ggctgaggcc tcttgcctga cgtgggaccc cttggtctgg 60
catttgtcag tgaggcaggc tgggggcagg ccccggagct tggcaggagg tgtaaaccgg 120
ccttggaagg tagggcccca caatggggac agttggatct ctgagggaga cagggaggca 180
tgatcactgc caaatgccca ccaaggacaa ggcacatccc agggagacag acgcagacct 240
ggtgccctct ggacactggc attcctggag gctgatgatg gacagatggg cctggaggtg 300
gctcttcgcc agctggtgtt tcctttggac ttcctcagtg tctttggaga agcagagccc 360
taagaataag cagctgccca taaaatctaa taccagccaa gcatctcagg aattcatgga 420
ttgtctccat 430
<210> 244
<211> 435
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0358
<400> 244
ttctgagtcc tctaaggtcc ctcactccca actcagcccc atgtcctgtc aattcccact 60
cagtgtctga tctccttctc ctcacctttc ccatctcccg tttgacccaa gcttcctgag 120
ctctcctccc attccccttt ttggagtcct cctcctctcc cagaacccag taataagtgg 180
gctcctccct ggcctggacc cccgtggtaa ccctataagg cgaggcagct gctgtctgag 240
gcagggaggg gctggtgtgg gaggctaagg gcagctgcta agtttagggt ggctccttct 300
ctcttcttag agacaacagg tggctggggc ctcagtgccc agaaaagaaa atgtcttaga 360
ggtatcggca tgggcctgga ggagggggga cagggcaggg ggaggcatct tcctcaggac 420
atcgggtcct agagg 435
<210> 245
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0359
<400> 245
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtg 108
<210> 246
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0361
<400> 246
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180
tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccct 229
<210> 247
<211> 355
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0362
<400> 247
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagcaca cccaaatatg 180
gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 240
caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgag ctctataaat 300
acccgctctg gtatttgggg ttttgaaccc gtcgccatat ttgggtgtcc gccct 355
<210> 248
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0363
<400> 248
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc acacccaaat 240
atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300
cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc gagctctata 360
aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg tccgccct 418
<210> 249
<211> 459
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0364
<400> 249
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240
gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300
ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360
aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420
acggttcctc acccgtcgcc atatttgggt gtccgccct 459
<210> 250
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0365
<400> 250
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 251
<211> 337
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0366
<400> 251
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgca ccgcggtggc 120
ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 180
tggggagtta tttttagagc ggtgaggaag gtgggcaggc agcaggtgtt ggcgctctaa 240
aaataactcc cgggagttat ttttagagcg gaggaatggt ggacacccaa atatggcgac 300
ggttcctcac ccgtcgccat atttgggtgt ccgccct 337
<210> 252
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0367
<400> 252
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtg 108
<210> 253
<211> 302
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0368
<400> 253
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtggc cactacgggt 120
ctaggctgcc catgtaagga ggcaaggcct ggggacaccc gagatgcctg gttataatta 180
acccagacat gtggctgccc ccccccccca acacctgctg cctgagcctc acccccaccc 240
cggtgcctgg gtcttaggct ctgtacacca tggaggagaa gctcgctcta aaaataaccc 300
tg 302
<210> 254
<211> 252
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0369
<400> 254
cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60
aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120
gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180
gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240
tttagagcgg ag 252
<210> 255
<211> 378
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0370
<400> 255
cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60
aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120
gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180
gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240
tttagagcgg agcgacaccc aaatatggcg acgggtgagg aatggtgggg agttattttt 300
agagcggtga ggaaggtggg caggcagcag gtgttggcgc tctaaaaata actcccggga 360
gttattttta gagcggag 378
<210> 256
<211> 218
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0371
<400> 256
taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180
cggttcctca cccgtcgcca tatttgggtg tccgccct 218
<210> 257
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0372
<400> 257
gacacccaaa tatggcgacg ggtgaggaat ggtggggagt tatttttaga gcggtgagga 60
aggtgggcag gcagcaggtg ttggcgctct aaaaataact cccgggagtt atttttagag 120
cggaggaatg gtggacaccc aaatatggcg acggttcctc acccgtcgcc atatttgggt 180
gtccgccct 189
<210> 258
<211> 226
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0373
<400> 258
taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc gctctaaggt ccctcactcc caactcagcc 180
ccatgtcctg tcaattcacc cgtcgccata tttgggtgtc cgccct 226
<210> 259
<211> 226
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0374
<400> 259
ctctaaggtc cctcactccc aactcagccc catgtcctgt caattcgaca cccaaatatg 60
gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 120
caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgta aggcgaggca 180
gctgctgtct gaggcagacc cgtcgccata tttgggtgtc cgccct 226
<210> 260
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0375
<400> 260
taaggcgagg cagctgctgt ctgaggcaga ggctaagggc agctgctaag tttagggtct 60
ctaaggtccc tcactcccaa ctcagcccca tgtcctgtca attccgacac ccaaatatgg 120
cgacgggtga ggaatggtgg ggagttattt ttagagcagg cagcaggtgt tggcgctcta 180
aaaataactc ccgggagtta tttttagagc gacccgtcgc catatttggg tgtccgccct 240
<210> 261
<211> 266
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0376
<400> 261
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg tactaaaaat agaacgacta 240
tttttaggct tttctggcag ctggcc 266
<210> 262
<211> 268
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0377
<400> 262
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgataaat acccgctctg gtatttgggg cgaggtacta taaataccct 240
tagaggtatt ttatcttggc agctaggt 268
<210> 263
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0378
<400> 263
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300
actattttta ggcttttctg gcagctggcc ctgccagaca gagttcctca gtaa 354
<210> 264
<211> 356
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0379
<400> 264
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300
cccttagagg tattttatct tggcagctag gtctgccaga cagagttcct cagtaa 356
<210> 265
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0380
<400> 265
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300
actattttta ggcttttctg gcagctggcc ctgccagaca gataaacgag ctat 354
<210> 266
<211> 356
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0381
<400> 266
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300
cccttagagg tattttatct tggcagctag gtctgccaga cagataaacg agctat 356
<210> 267
<211> 356
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0382
<400> 267
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttaaacg agctattagt 300
tatgaggtcc gtagattgaa taaacgagct attagttatg aggtccgtag attgaa 356
<210> 268
<211> 163
<212> DNA
<213> 人工序列
<220>
<223> CRM_SKM_20
<400> 268
atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60
aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120
gcatttcaca catggtaatt taataaggtt agttcccatg aca 163
<210> 269
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0357
<400> 269
tctgagggag acagggaggc atgatcactg ccaaatgccc accaaggaca aggcacatcc 60
cagggagaca gacgcagacc tggtgccctc tggacactgg cattcctgga g 111
<210> 270
<211> 245
<212> DNA
<213> 人工序列
<220>
<223> CRE0005
<400> 270
actcgggggc caggcactgg cgctgacgca ggctagcagg gcgccactgg ctggtcccca 60
cccacctcgg tgggttgggg gatgggcgca ccagcccctc ctgggtgagc cctagcctgg 120
ggcttcctat ttcgggagcc gggggcgtgg gccacgtctc ctcatgtgat gcgagggcta 180
tttaaagcgg cagcccgggc agggagccgc cgtcggagcc cttgcacgcc tgctctcttg 240
tagct 245
<210> 271
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> CRE0009
<400> 271
ctgagtcctt ttgcatacat ttttcaaatg ataactcact ctacccaccc cccttcccta 60
cccccaaggc gatttattga aaaaaccacc ttatatggta atattgctaa cacaccgtca 120
gctggccttt ttagggactt tgtttaaaga agatccgcct ctggggtttt atattgctct 180
ggtattcatg ccaaagacac accag 205
<210> 272
<211> 292
<212> DNA
<213> 人工序列
<220>
<223> CRE0010也被称为:CRE0010_ITGB1BP2
<400> 272
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gg 292
<210> 273
<211> 524
<212> DNA
<213> 人工序列
<220>
<223> CRE0010_ALDOA
<400> 273
gccgcgaaga ccggaagctg gggcggcccc gggccgcgcg cgctgggcct gggaggcgaa 60
actcagcttc cttcgtttcc gacttttcca tccgcgtcct ccacttcccc gttccgccct 120
cccccattgc caacattctg gctgagtcac ggcgccccag agcgcgccag gctgggggaa 180
aggagcagaa gggagggccc tagcgacccg cgggatgtgg tccgagtcac gtccgagggg 240
ggtggggagg gatcgtgttc tcggcgcccg ccccttccta gcgcggcctc tgggctgcgc 300
ctctcggggg cggcccgtag cccagtccgt cgcctgccat tggacgccgc ccgctcctcg 360
taaaggaaaa agctcggcgg agggcggagt ggtgccttta aaaggccggg cgccgccttc 420
cgcctgcccg cctcctgcgc cgccccttcc gaggctaaat cggctgcgtt cctctcggaa 480
cgcgccgcag aaggggtcct ggtgacgagt cccgcgttct ctcc 524
<210> 274
<211> 315
<212> DNA
<213> 人工序列
<220>
<223> CRE0034
<400> 274
ccatgttccc ggcgaagggc cagctgtccc ccgccagcta gactcagcac ttagtttagg 60
aaccagtgag caagtcagcc cttggggcag cccatacaag gccatggggc tgggcaagct 120
gcacgcctgg gtccggggtg ggcacggtgc ccgggcaacg agctgaaagc tcatctactc 180
tcaggggccc ctccctgggg acagcccctc ctggctagtc acaccctgta ggctcctcta 240
tataacccag gggcacaggg gctgcccccg ggtcaccacc acctccacag cacagacaga 300
cactcaggag ccagc 315
<210> 275
<211> 170
<212> DNA
<213> 人工序列
<220>
<223> CRE0037
<400> 275
aggtccctat atggttgtgt tagagtgaac ggccagcttc agcccgtctt tgctccttgt 60
ttgggaagcg agtgggaggg gatcagagca aggggctata taacccttca gcgttcagcc 120
tcccgggaca ccacccaccc agagtggaga agcccagcca gtcgctgtca 170
<210> 276
<211> 218
<212> DNA
<213> 人工序列
<220>
<223> CRE0046
<400> 276
cccggcagac gctccttata cggcccggcc tcgctcacct gggccgcggc caggagcgcc 60
ttctttgggc agcgccgggc cggggccgcg ccgggcccga cacccaaata tggcgacggc 120
cggggccgca ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa aggctccggg 180
gccggcggcg gcccacgagc tacccggagg agcgggag 218
<210> 277
<211> 249
<212> DNA
<213> 人工序列
<220>
<223> CRE0048
<400> 277
gactcagggg cgcaggcctc ttgcggggga gctggcctcc ccgcccccac ggccacgggc 60
cgccctttcc tggcaggaca gcgggatctt gcagctgtca ggggagggga ggcgggggct 120
gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 180
ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 240
gccgtcacc 249
<210> 278
<211> 318
<212> DNA
<213> 人工序列
<220>
<223> CRE0049
<400> 278
catgttcccg gcgaagggcc agctgtcccc cgccagctag actcagcact tagtttagga 60
accagtgagc aagtcagccc ttggggcagc ccatacaagg ccatggggct gggcaagctg 120
cacgcctggg tccggggtgg gcacggtgcc cgggcaacga gctgaaagct catctgctct 180
caggggcccc tccctgggga cagcccctcc tggctagtca caccctgtag gctcctctat 240
ataacccagg ggcacagggg ctgccctcat tctaccacca cctccacagc acagacagac 300
actcaggagc cagccagc 318
<210> 279
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> CRE0053 (SRL_mp)
<400> 279
caccgcctgc tgccacggcc ggccgtataa atagaggcga ggagcagctg ggctctcttg 60
gcagtcacc 69
<210> 280
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> CRE0053. 2 SRL_mp
<400> 280
ccaccgcctg ctgccacggc cggccgtata aatagaggcg aggagcagct gggctctctt 60
ggcagtcacc 70
<210> 281
<211> 451
<212> DNA
<213> 人工序列
<220>
<223> CRE0054
<400> 281
ccagctgcct gccccctgcc tggcacagcc cgtacctggc cgcacgctcc ctcacaggtg 60
aagctcgaaa actccgtccc cgtaaggagc cccgctgccc cccgaggcct cctccctcac 120
gcctcgctgc gctcccggct cccgcacggc cctgggagag gcccccaccg cttcgtcctt 180
aacgggcccg gcggtgccgg gggattattt cggccccggc cccggggggg cccggcagac 240
gctccttata cggcccggcc tcgctcacct gggccgcggc caggagcgcc ttctttgggc 300
agcgccgggc cggggccgcg ccgggcccga cacccaaata tggcgacggc cggggccgca 360
ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 420
gcccacgagc tacccggagg agcgggaggc g 451
<210> 282
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> CRE0055
<400> 282
tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60
ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120
gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180
aagaggtgtt ccccattcgg 200
<210> 283
<211> 251
<212> DNA
<213> 人工序列
<220>
<223> CRE0056
<400> 283
tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60
ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120
gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180
aagaggtgtt ccccattcgg cagccagact ccttgaaata ccctttcagt aatcattcaa 240
ccaacgcttc c 251
<210> 284
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> CRE0070
<400> 284
cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 60
cggggccggc ggcggcccac gagctacccg gaggagcggg aggcg 105
<210> 285
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> CRE0070.2
<400> 285
cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 60
cggggccggc ggcggcccac 80
<210> 286
<211> 343
<212> DNA
<213> 人工序列
<220>
<223> CRE0072
<400> 286
gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60
tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120
ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180
tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240
ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc ggcagccaga 300
ctccttgaaa taccctttca gtaatcattc aaccaacgct tcc 343
<210> 287
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> SKM_14
<400> 287
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgct gccagggaga 60
tggttgggtt gacgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 120
agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 180
ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 240
<210> 288
<211> 168
<212> DNA
<213> 人工序列
<220>
<223> SKM_18.2
<400> 288
ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60
gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgc 168
<210> 289
<211> 242
<212> DNA
<213> 人工序列
<220>
<223> SKM_18
<400> 289
ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60
gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 180
ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 240
cc 242
<210> 290
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> SKM_20
<400> 290
atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60
aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120
gcatttcaca catggtaatt taataaggtt agttcccatg acacaccgcc tgctgccacg 180
gccggccgta taaatagagg cgaggagcag ctgggctctc ttggcagtca cc 232
<210> 291
<211> 620
<212> DNA
<213> 人工序列
<220>
<223> CRE0011_RSV启动子
<400> 291
caattctcat gtttgacagc ttatcatcgc agatccgtat ggtgcactct cagtacaatc 60
tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct 120
gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg 180
aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg 240
cgtatctgag gggactaggg tgtgtttagg cgaaaagcgg ggcttcggtt gtacgcggtt 300
aggagtcccc tcaggatata gtagtttcgc ttttgcatag ggagggggaa atgtagtctt 360
atgcaatact cttgtagtct tgcaacatgg taacgatgag ttagcaacat gccttacaag 420
gagagaaaaa gcaccgtgca tgccgattgg tggaagtaag gtggtacgat cgtgccttat 480
taggaaggca acagacgggt ctgacatgga ttggacgaac cactgaattc cgcattgcag 540
agatattgta tttaagtgcc tagctcgata caataaacgc catttgacca ttcaccacat 600
tggtgtgcac ctccaagctg 620
<210> 292
<211> 168
<212> DNA
<213> 人工序列
<220>
<223> DES_mp_v1
<400> 292
cgggatcttg cagctgtcag gggaggggag gcgggggctg atgtcaggag ggatacaaat 60
agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc cactctccgg ccggccgcct 120
gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg ccgtcacc 168
<210> 293
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.3
<400> 293
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 294
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.4
<400> 294
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgaggtaaac gagctattag 180
ttatgaggtc cgtagattga acccgtcgcc atatttgggt gtccgccct 229
<210> 295
<211> 252
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.6
<400> 295
cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60
aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120
gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180
gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240
tttagagcgg ag 252
<210> 296
<211> 218
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.8
<400> 296
taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180
cggttcctca cccgtcgcca tatttgggtg tccgccct 218
<210> 297
<211> 218
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.9
<400> 297
aggctaaggg cagctgctaa gtttagggtg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180
cggttcctca cccgtcgcca tatttgggtg tccgccct 218
<210> 298
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> CRE0077
<400> 298
tctgagggag acagggaggc atgatcactg ccaaatgccc accaaggaca aggcacatcc 60
cagggagaca gacgcagacc tggtgccctc tggacactgg cattcctgga g 111
<210> 299
<211> 192
<212> DNA
<213> 人工序列
<220>
<223> HBB
<400> 299
caggtaggga ctgtactagc agctacaatc cagctaccat tctgctttta ttttatggtt 60
gggataaggc tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc 120
tcttatcttc ctcccacagc tcctgggcaa cgtgctggtc tgtgtgctgg cccatcactt 180
tggcaaagaa tt 192
<210> 300
<211> 253
<212> DNA
<213> 人工序列
<220>
<223> CRE0099
<400> 300
ccactacggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 60
ggttataatt aacccagaca tgtggctgcc cccccccccc caacacctgc tgcctctaaa 120
aataaccctg tccctggtgg atcccctgca tgcgaagatc ttcgaacaag gctgtggggg 180
actgagggca ggctgtaaca ggcttggggg ccagggctta tacgtgcctg ggactcccaa 240
agtattactg ttc 253
<210> 301
<211> 274
<212> DNA
<213> 人工序列
<220>
<223> CRE0016
<400> 301
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaa 274
<210> 302
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> CRE0018
<400> 302
ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60
tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120
gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180
tgctctgagg agctggaacc 200
<210> 303
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CRE0020
<400> 303
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284
<210> 304
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> CRE0025
<400> 304
gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60
cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120
ggtggggcgg ggcgggccgc gagccggaga aagagaaagc 160
<210> 305
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRE0027
<400> 305
tacatcattt acctagaaaa gaggacagct gtcctttccc aaagctccgg tgaccctgcc 60
ccgcccagtg tgactagccc aggttggtga ttctgatctg ttgccaaacc aaactggctc 120
cccggggagc catttggtaa tgttccctgg agtcatttcc ttgcgaagca ttccttttcg 180
gtgagaggac atttttttca tccctgataa acaaccacag cctgcgccag 230
<210> 306
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> CRE0028
<400> 306
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg c 211
<210> 307
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRE0029
<400> 307
ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60
ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120
gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180
tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc 230
<210> 308
<211> 216
<212> DNA
<213> 人工序列
<220>
<223> CRE0031
<400> 308
taagtccggg cagggtcctg tccataaaag gcttttcccg ggccggctcc ccgccggcag 60
cgtgccccgc cccggcccgc tccatctcca aagcatgcag agaatgtctc ggcagccccg 120
gtagactgct ccaacttggt gtctttcccc aaatatggag cctgtgtgga gtcactgggg 180
gagccggggg tggggagcgg agccggcttc ctctag 216
<210> 309
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> CRE0033
<400> 309
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctg 189
<210> 310
<211> 194
<212> DNA
<213> 人工序列
<220>
<223> CRE0035
<400> 310
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctg 194
<210> 311
<211> 245
<212> DNA
<213> 人工序列
<220>
<223> CRE0036
<400> 311
ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60
tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120
ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180
cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240
aggag 245
<210> 312
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> CRE0047
<400> 312
cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60
cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120
ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180
tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg g 231
<210> 313
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> CRE0050
<400> 313
ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60
tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120
aaccctgc 128
<210> 314
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> CRE0051
<400> 314
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
<210> 315
<211> 163
<212> DNA
<213> 人工序列
<220>
<223> CRE0052
<400> 315
atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60
aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120
gcatttcaca catggtaatt taataaggtt agttcccatg aca 163
<210> 316
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> HTMB ev_4
<400> 316
ataaataccc gctctggtat ttgggg 26
<210> 317
<211> 125
<212> DNA
<213> 人工序列
<220>
<223> CRE0059
<400> 317
cccctgcccc ccacagctcc tctcctgtgc cttgtttccc agccatgcgt tctcctctat 60
aaatacccgc tctggtattt ggggttggca gctgttgctg ccagggagat ggttgggttg 120
acatg 125
<210> 318
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> CRE0060
<400> 318
ctctataaat acccgctctg gtatttgggg tt 32
<210> 319
<211> 409
<212> DNA
<213> 人工序列
<220>
<223> CRE0065_短
<400> 319
gtgtgtgtgt gtgcgcccgc gtgtgcgtgt gtgcatgtat gtgtgtgtgt ggtgggtttt 60
attgttgttt tagcggggct gctccaggag tggggctgcg ccggtcagat gcagccggca 120
cggccccggg gtcgcgcgat cgccccttcc ccgccctcgg attggcctgg cccgcggcgg 180
ggctgccccg gaaccgccac ccagcagcgc acccttccgc gcccggcccg cgctcctcct 240
gcagtcgcct ccctggcttt ctctttctcc ggctcgcggc ccgccccgcc ccaccctacc 300
acggccggcc tgggcgcgcg ggaagcgcgg ctcttcgctt ccgcctggcg gcgggaagga 360
aaccgaaagg aggagccggg ggcgggcgcg ccgcgatgca tattcatca 409
<210> 320
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> CRE0069
<400> 320
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120
cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167
<210> 321
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071
<400> 321
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 322
<211> 188
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.5
<400> 322
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
gagctctata aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg 180
tccgccct 188
<210> 323
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.2
<400> 323
gacacccaaa tatggcgacg ggtgaggaat ggtggggagt tatttttaga gcggtgagga 60
aggtgggcag gcagcaggtg ttggcgctct aaaaataact cccgggagtt atttttagag 120
cggaggaatg gtggacaccc aaatatggcg acggttcctc acccgtcgcc atatttgggt 180
gtccgccct 189
<210> 324
<211> 344
<212> DNA
<213> 人工序列
<220>
<223> CRE0073
<400> 324
tccctaacct cctgcttgcg aggcctctct ctggcctctg agagggtcag tgtcctgccc 60
caacccatga gatgacagac tataatagcc acaggattaa catagcaggc attgtctttc 120
tctgactata gggtgggtat tatgtgttca tcaaccatcc taaaaatacc cggtaaacag 180
gtgcagcccc tgtggctcca gtcccctggg atctgttggc ttctggctgg agatgaagat 240
tagggcagag gagaggtgaa ttagtctcac tgagttccag gcatgagact cgggtgtcct 300
ttggaacctg ggaaatctag attccaggaa acccatctgg aggg 344
<210> 325
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> CRE0074
<400> 325
ccatcctaaa aatacccggt aaacaggtgc agcccctgtg gctccagtcc cctgggatct 60
gttggcttct ggctggagat gaagattagg gcagaggaga ggtgaattag tctcactgag 120
ttccaggcat gagactcggg tgtcctttgg aa 152
<210> 326
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> CRE0075
<400> 326
agggtcagtg tcctgcccca acccatgaga tgacagacta taatagccac aggattaaca 60
tagcaggcat tg 72
<210> 327
<211> 430
<212> DNA
<213> 人工序列
<220>
<223> CRE0076
<400> 327
ctgaggggtg tcagagcaca ggctgaggcc tcttgcctga cgtgggaccc cttggtctgg 60
catttgtcag tgaggcaggc tgggggcagg ccccggagct tggcaggagg tgtaaaccgg 120
ccttggaagg tagggcccca caatggggac agttggatct ctgagggaga cagggaggca 180
tgatcactgc caaatgccca ccaaggacaa ggcacatccc agggagacag acgcagacct 240
ggtgccctct ggacactggc attcctggag gctgatgatg gacagatggg cctggaggtg 300
gctcttcgcc agctggtgtt tcctttggac ttcctcagtg tctttggaga agcagagccc 360
taagaataag cagctgccca taaaatctaa taccagccaa gcatctcagg aattcatgga 420
ttgtctccat 430
<210> 328
<211> 435
<212> DNA
<213> 人工序列
<220>
<223> CRE0078
<400> 328
ttctgagtcc tctaaggtcc ctcactccca actcagcccc atgtcctgtc aattcccact 60
cagtgtctga tctccttctc ctcacctttc ccatctcccg tttgacccaa gcttcctgag 120
ctctcctccc attccccttt ttggagtcct cctcctctcc cagaacccag taataagtgg 180
gctcctccct ggcctggacc cccgtggtaa ccctataagg cgaggcagct gctgtctgag 240
gcagggaggg gctggtgtgg gaggctaagg gcagctgcta agtttagggt ggctccttct 300
ctcttcttag agacaacagg tggctggggc ctcagtgccc agaaaagaaa atgtcttaga 360
ggtatcggca tgggcctgga ggagggggga cagggcaggg ggaggcatct tcctcaggac 420
atcgggtcct agagg 435
<210> 329
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> CRE0079
<400> 329
cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60
gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtg 108
<210> 330
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 48 bp
<400> 330
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttg 48
<210> 331
<211> 378
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.7
<400> 331
cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60
aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120
gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180
gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240
tttagagcgg agcgacaccc aaatatggcg acgggtgagg aatggtgggg agttattttt 300
agagcggtga ggaaggtggg caggcagcag gtgttggcgc tctaaaaata actcccggga 360
gttattttta gagcggag 378
<210> 332
<211> 226
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.10
<400> 332
taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60
gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120
aaaataactc ccgggagtta tttttagagc gctctaaggt ccctcactcc caactcagcc 180
ccatgtcctg tcaattcacc cgtcgccata tttgggtgtc cgccct 226
<210> 333
<211> 226
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.11
<400> 333
ctctaaggtc cctcactccc aactcagccc catgtcctgt caattcgaca cccaaatatg 60
gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 120
caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgta aggcgaggca 180
gctgctgtct gaggcagacc cgtcgccata tttgggtgtc cgccct 226
<210> 334
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.12
<400> 334
taaggcgagg cagctgctgt ctgaggcaga ggctaagggc agctgctaag tttagggtct 60
ctaaggtccc tcactcccaa ctcagcccca tgtcctgtca attccgacac ccaaatatgg 120
cgacgggtga ggaatggtgg ggagttattt ttagagcagg cagcaggtgt tggcgctcta 180
aaaataactc ccgggagtta tttttagagc gacccgtcgc catatttggg tgtccgccct 240
<210> 335
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_48bp_v2
<400> 335
tactaaaaat agaacgacta tttttaggct tttctggcag ctggcc 46
<210> 336
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_48bp_v3
<400> 336
cgaggtacta taaataccct tagaggtatt ttatcttggc agctaggt 48
<210> 337
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_72 bp_v2
<400> 337
tactaaaaat agaacgacta tttttaggct tttctggcag ctggccctgc cagacagagt 60
tcctcagtaa 70
<210> 338
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_72 bp_v3
<400> 338
cgaggtacta taaataccct tagaggtatt ttatcttggc agctaggtct gccagacaga 60
gttcctcagt aa 72
<210> 339
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_72 bp_v4
<400> 339
tactaaaaat agaacgacta tttttaggct tttctggcag ctggccctgc cagacagata 60
aacgagctat 70
<210> 340
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_72 bp_v5
<400> 340
cgaggtacta taaataccct tagaggtatt ttatcttggc agctaggtct gccagacaga 60
taaacgagct at 72
<210> 341
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_72bp_v6
<400> 341
ttaaacgagc tattagttat gaggtccgta gattgaataa acgagctatt agttatgagg 60
tccgtagatt gaa 73
<210> 342
<211> 388
<212> DNA
<213> 人工序列
<220>
<223> SP0407
<400> 342
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120
gccctaactg gcaaacccca ataaataccc gctctggtat ttggggttct cctctataaa 180
tacccgctct ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg 240
ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 300
cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 360
cagcctcgcc cgcgccgtca ccgccacc 388
<210> 343
<211> 306
<212> DNA
<213> 人工序列
<220>
<223> SP0408
<400> 343
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaaggtgac aatccctgcc tgggatcttt tcgttctgcc 120
cttggctcct gccctaactg gcaaacccca ccccctcatc accagctttc aagtatcaga 180
ttgcgtttcc ggcctcttct ttccaaaccc ctaaaccacc agcacctgtc cccttgcttg 240
cctcattcca cagccaacag gctgaaggga agacaaaccc tagtcagtca gaggtggggg 300
gccacc 306
<210> 344
<211> 344
<212> DNA
<213> 人工序列
<220>
<223> SP0409
<400> 344
ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60
gtggcagtgg ggggtgagga gcatctaaaa atagccataa atacccgctc tggtatttgg 120
ggttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg cgggatcttg 180
cagctgtcag gggaggggag gcgggggctg atgtcaggag ggatacaaat agtgccgacg 240
gctgggggcc ctgtctcccc tcgccgcatc cactctccgg ccggccgcct gcccgccgcc 300
tcctccgtgc gcccgccagc ctcgcccgcg ccgtcaccgc cacc 344
<210> 345
<211> 588
<212> DNA
<213> 人工序列
<220>
<223> SP0410
<400> 345
agtgattctc cctcaagacc ttataaaacc actttaaccc tcaatgggat aatatctagt 60
acattgtcat gggaactaac cttattaaat taccatgtgt gaaatgcctg taactcaagt 120
aacagcaggt gcaaaataaa gtagcaggcg gaagagtgac agtaattttt aacatctaca 180
ccagctggca aaaatgacag gtgcctaatt cctcagtctt taaaaataac ttttgagaag 240
cctacacagc ataagcaaat attttcaagt ttatttttta gctatcttcg agttaccttc 300
ctgacaaaat gtaataatat acactgattt ttgcagaaaa ataaataccc gctctggtat 360
ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct gttgcgggat 420
cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 480
gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 540
cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 588
<210> 346
<211> 505
<212> DNA
<213> 人工序列
<220>
<223> SP0411
<400> 346
ataacttcag cacactgtca tgggacctaa ccttattaaa ttaccatgtg tgaagcgtcc 60
ataactcaag taacagcagg tgcaaaaatg gagctgcagg cagaagagtg gtagtcattt 120
ttacaaatcc ccaccagctg gcgaaacaac aggtgcctaa ttcctcagct tttaaaaata 180
acttttaaaa agcctgtgct gcataagcaa atattttcaa gtttgttttt aaaccatctt 240
caagttacct tggtcacata aatacccgct ctggtatttg gggttctcct ctataaatac 300
ccgctctggt atttggggtt ggcagctgtt gcgggatctt gcagctgtca ggggagggga 360
ggcgggggct gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc 420
ctcgccgcat ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag 480
cctcgcccgc gccgtcaccg ccacc 505
<210> 347
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> SP0412
<400> 347
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct ataaataccc gctctggtat 300
ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct gttgcgggat 360
cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 420
gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 480
cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 528
<210> 348
<211> 554
<212> DNA
<213> 人工序列
<220>
<223> SP0413
<400> 348
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct attattcacc tgttcgcctt 300
agatgaagaa tcaaggaaca gcagctctag ggggttggga ggagttaggg tccggccctg 360
ccccagacct ctcagtgtcc aatttctctg tgtcagctgt gtttctcagc tgtccacttt 420
cctccagccc tgtcatttca gccctgacac caaggcagga ggctaggagg tctacaaata 480
gcgactgggt agctggtgtg aacacagggg gtactggggg ggcttagccc ccaaggaaga 540
ggaccagtgc cacc 554
<210> 349
<211> 621
<212> DNA
<213> 人工序列
<220>
<223> SP0414
<400> 349
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct agactggggc aggtgcaggc 300
tggattgggt ttccagaggc tatatatata aaggctgccg ggagccccag ggccgctccc 360
tgagggcaca acactgtggg ggcccagcca ggcccacatt cctttccaga ggccagctct 420
ccatttatag cccctgggca gagcagccgg gatcttgcag ctgtcagggg aggggaggcg 480
ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg 540
ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc 600
gcccgcgccg tcaccgccac c 621
<210> 350
<211> 498
<212> DNA
<213> 人工序列
<220>
<223> SP0415
<400> 350
atggtgcttc caagtctgct cccgggacgt ttcctgttct tggaacagct gcaccagcct 60
ggggtaccct cctgctactt gatcctatag ggaggtgtcc agtggctgtg ggcaattttc 120
agatgacctt gttcgtctga cgtcattaga tcgctatttt tggctttgct gtttatgctg 180
cagaagttgg gctggaatgg gagaggagga atgaaggagg ggctgctctt ggtttcccat 240
tgttccaggg ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct 300
ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg 360
gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg 420
catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc 480
cgcgccgtca ccgccacc 498
<210> 351
<211> 618
<212> DNA
<213> 人工序列
<220>
<223> SP0416
<400> 351
actgatgtgg aaggggttat atataggaag atgtgtagga agaaaaaggt agagagctct 60
cctcagaggg tgggggatta tgggtagcca gagggagcct gggttagtgg agttgaagcc 120
ctagtcttgg gtgctttgta gcatcagaag cctctggagc ctttgctgac acctgcctga 180
tgtacggagc catctgtggg tgtctgtgtg ctggaggatt gcccacagct atgattcaga 240
gatgctcatg ttgttgccca agcaattgac agatgatgtt tcaggcttgg agatggcagg 300
atgggagcaa agagaagcca ggtcaggaaa gaacgtgccg ttctggccct agtggggaat 360
tctgggcctt ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct 420
ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg 480
gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg 540
catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc 600
cgcgccgtca ccgccacc 618
<210> 352
<211> 498
<212> DNA
<213> 人工序列
<220>
<223> SP0417
<400> 352
gggagagcca ggacattggc tgcctgtggt cttggtggtc gtggtcagtt ccctctcctg 60
ccagctgtgg aatgtgaggc ctggcctggg agatattttt gctgcacttt gagccacccc 120
gccccctgga actcagaccc tgcacagtcc atgccataac aatgacgacc acttccaatt 180
gtttcctagc tggagaggcg gggaggggag cactgtttgg gaaggggggg agcctggggg 240
aaatgcttct ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct 300
ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg 360
gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg 420
catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc 480
cgcgccgtca ccgccacc 498
<210> 353
<211> 594
<212> DNA
<213> 人工序列
<220>
<223> SP0418
<400> 353
ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60
gtggcagtgg ggggtgagga gcatctaaaa atagccggga gagccaggac attggctgcc 120
tgtggtcttg gtggtcgtgg tcagttccct ctcctgccag ctgtggaatg tgaggcctgg 180
cctgggagat atttttgctg cactttgagc caccccgccc cctggaactc agaccctgca 240
cagtccatgc cataacaatg acgaccactt ccaattgttt cctagctgga gaggcgggga 300
ggggagcact gtttgggaag ggggggagcc tgggggaaat gcttctataa atacccgctc 360
tggtatttgg ggttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 420
cgggatcttg cagctgtcag gggaggggag gcgggggctg atgtcaggag ggatacaaat 480
agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc cactctccgg ccggccgcct 540
gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg ccgtcaccgc cacc 594
<210> 354
<211> 657
<212> DNA
<213> 人工序列
<220>
<223> SP0419
<400> 354
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttccatg ccataacaat 300
gacgaccact tccaattgtt tcctagctgg ccatgttccc ggcgaagggc cagctgtccc 360
ccgccagcta gactcagcac ttagtttagg aaccagtgag caagtcagcc cttggggcag 420
cccatacaag gccatggggc tgggcaagct gcacgcctgg gtccggggtg ggcacggtgc 480
ccgggcaacg agctgaaagc tcatctactc tcaggggccc ctccctgggg acagcccctc 540
ctggctagtc acaccctgta ggctcctcta tataacccag gggcacaggg gctgcccccg 600
ggtcaccacc acctccacag cacagacaga cactcaggag ccagcgcggc cgccacc 657
<210> 355
<211> 564
<212> DNA
<213> 人工序列
<220>
<223> SP0420
<400> 355
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaatccatg ccataacaat gacgaccact 300
tccaattgtt tcctagctgg atttttaaag actgaggaat taggcacctg tcatttttgc 360
cagctggtgt agatgttaaa aattactgtc actcttccgc ctgctacttt attttgcacc 420
tgctgttact tgagttacag gcatttcaca catggtaatt taataaggtt agttcccatg 480
acacaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag ctgggctctc 540
ttggcagtca ccgcggccgc cacc 564
<210> 356
<211> 577
<212> DNA
<213> 人工序列
<220>
<223> SP0421
<400> 356
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca gcagctggtc acaaagctgg ttaatctccc 120
agagtgctca gcttaaaacc cgtgactcac agcacagcca gtgtggggga gggggtggct 180
gcctccaata cgtggcgccc agagtcagct gttctggggc cttctctggt ttctccaact 240
gagtcctgag gtttggccat gttcccggcg aagggccagc tgtcccccgc cagctagact 300
cagcacttag tttaggaacc agtgagcaag tcagcccttg gggcagccca tacaaggcca 360
tggggctggg caagctgcac gcctgggtcc ggggtgggca cggtgcccgg gcaacgagct 420
gaaagctcat ctactctcag gggcccctcc ctggggacag cccctcctgg ctagtcacac 480
cctgtaggct cctctatata acccaggggc acaggggctg cccccgggtc accaccacct 540
ccacagcaca gacagacact caggagccag cgccacc 577
<210> 357
<211> 532
<212> DNA
<213> 人工序列
<220>
<223> SP0422
<400> 357
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120
ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180
ctggtttctc caactgagtc ctgaggtttg gccatgttcc cggcgaaggg ccagctgtcc 240
cccgccagct agactcagca cttagtttag gaaccagtga gcaagtcagc ccttggggca 300
gcccatacaa ggccatgggg ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg 360
cccgggcaac gagctgaaag ctcatctact ctcaggggcc cctccctggg gacagcccct 420
cctggctagt cacaccctgt aggctcctct atataaccca ggggcacagg ggctgccccc 480
gggtcaccac cacctccaca gcacagacag acactcagga gccagcgcca cc 532
<210> 358
<211> 461
<212> DNA
<213> 人工序列
<220>
<223> SP0423
<400> 358
ggcaggcgga cctggtggtc agacctcagt gatcctcagg gaccagtgaa tatttcaggc 60
tggggctgag catcacctgc tcccttggcc ccacttatag ggcaaagggg agtctaccag 120
cctactcact gatgacaaac tggaaaagtt tgtcctgtct ctgctctggc cccacctcgc 180
cctctcccct acttggaagt tcctttcctg aaccactgac tgcattttta aagactgagg 240
aattaggcac ctgtcatttt tgccagctgg tgtagatgtt aaaaattact gtcactcttc 300
cgcctgctac tttattttgc acctgctgtt acttgagtta caggcatttc acacatggta 360
atttaataag gttagttccc atgacacacc gcctgctgcc acggccggcc gtataaatag 420
aggcgaggag cagctgggct ctcttggcag tcaccgccac c 461
<210> 359
<211> 765
<212> DNA
<213> 人工序列
<220>
<223> SP0424
<400> 359
ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60
ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120
gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180
aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240
ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300
agcagacctg gcttcatcca aatgttctat ttgtttttta ctgcagggat aaaagcagtc 360
tgggctttca catgacagca tctggggctg cggcagaggg tcgggtccga agcgctgcct 420
tatcagcgtc cccagccctg ggaggtgaca gctggctggc ttgtgtcagc ccctcgggca 480
ctcacgtatc tccgtccgac gggtttaaaa tagcaaaact ctgaggccac acaatagctt 540
gggcttatat gggctcctgt gggggaaggg ggagcacgga gggggccggg gccgctgctg 600
ccaaaatagc agctcacaag tgttgcattc ctctctgggc gccgggcaca ttcctgctgg 660
ctctgcccgc cccggggtgg gcgccggggg gaccttaaag cctctgcccc ccaaggagcc 720
cttcccagac agccgccggc acccaccgct ccgtgggacg ccacc 765
<210> 360
<211> 631
<212> DNA
<213> 人工序列
<220>
<223> SP0425
<400> 360
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg cgggataaaa gcagtctggg ctttcacatg 240
acagcatctg gggctgcggc agagggtcgg gtccgaagcg ctgccttatc agcgtcccca 300
gccctgggag gtgacagctg gctggcttgt gtcagcccct cgggcactca cgtatctccg 360
tccgacgggt ttaaaatagc aaaactctga ggccacacaa tagcttgggc ttatatgggc 420
tcctgtgggg gaagggggag cacggagggg gccggggccg ctgctgccaa aatagcagct 480
cacaagtgtt gcattcctct ctgggcgccg ggcacattcc tgctggctct gcccgccccg 540
gggtgggcgc cggggggacc ttaaagcctc tgccccccaa ggagcccttc ccagacagcc 600
gccggcaccc accgctccgt gggacgccac c 631
<210> 361
<211> 525
<212> DNA
<213> 人工序列
<220>
<223> SP0426
<400> 361
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaaactcgg gggccaggca ctggcgctga 300
cgcaggctag cagggcgcca ctggctggtc cccacccacc tcggtgggtt gggggatggg 360
cgcaccagcc cctcctgggt gagccctagc ctggggcttc ctatttcggg agccgggggc 420
gtgggccacg tctcctcatg tgatgcgagg gctatttaaa gcggcagccc gggcagggag 480
ccgccgtcgg agcccttgca cgcctgctct cttgtagctg ccacc 525
<210> 362
<211> 422
<212> DNA
<213> 人工序列
<220>
<223> SP0427
<400> 362
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcc cctgcccccc 60
acagctcctc tcctgtgcct tgtttcccag ccatgcgttc tcctctataa atacccgctc 120
tggtatttgg ggttggcagc tgttgctgcc agggagatgg ttgggttgac atggactcag 180
gggcgcaggc ctcttgcggg ggagctggcc tccccgcccc cacggccacg ggccgccctt 240
tcctggcagg acagcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 300
ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 360
ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgcca 420
cc 422
<210> 363
<211> 616
<212> DNA
<213> 人工序列
<220>
<223> SP0428
<400> 363
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgcccctgcc ccccacagct cctctcctgt gccttgtttc ccagccatgc gttctcctct 300
ataaataccc gctctggtat ttggggttgg cagctgttgc tgccagggag atggttgggt 360
tgacatggac tcaggggcgc aggcctcttg cgggggagct ggcctccccg cccccacggc 420
cacgggccgc cctttcctgg caggacagcg ggatcttgca gctgtcaggg gaggggaggc 480
gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 540
gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 600
cgcccgcgcc gccacc 616
<210> 364
<211> 806
<212> DNA
<213> 人工序列
<220>
<223> SP0429
<400> 364
aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60
agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120
aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180
aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240
caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300
cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360
acactctgga gttagacaaa gccaagggga taaaagcagt ctgggctttc acatgacagc 420
atctggggct gcggcagagg gtcgggtccg aagcgctgcc ttatcagcgt ccccagccct 480
gggaggtgac agctggctgg cttgtgtcag cccctcgggc actcacgtat ctccgtccga 540
cgggtttaaa atagcaaaac tctgaggcca cacaatagct tgggcttata tgggctcctg 600
tgggggaagg gggagcacgg agggggccgg ggccgctgct gccaaaatag cagctcacaa 660
gtgttgcatt cctctctggg cgccgggcac attcctgctg gctctgcccg ccccggggtg 720
ggcgccgggg ggaccttaaa gcctctgccc cccaaggagc ccttcccaga cagccgccgg 780
cacccaccgc tccgtgggac gccacc 806
<210> 365
<211> 842
<212> DNA
<213> 人工序列
<220>
<223> SP0430
<400> 365
gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60
tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120
gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180
aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240
ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300
cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360
aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420
atgggataaa agcagtctgg gctttcacat gacagcatct ggggctgcgg cagagggtcg 480
ggtccgaagc gctgccttat cagcgtcccc agccctggga ggtgacagct ggctggcttg 540
tgtcagcccc tcgggcactc acgtatctcc gtccgacggg tttaaaatag caaaactctg 600
aggccacaca atagcttggg cttatatggg ctcctgtggg ggaaggggga gcacggaggg 660
ggccggggcc gctgctgcca aaatagcagc tcacaagtgt tgcattcctc tctgggcgcc 720
gggcacattc ctgctggctc tgcccgcccc ggggtgggcg ccggggggac cttaaagcct 780
ctgcccccca aggagccctt cccagacagc cgccggcacc caccgctccg tgggacgcca 840
cc 842
<210> 366
<211> 648
<212> DNA
<213> 人工序列
<220>
<223> SP0431
<400> 366
gatcctctgc ctggcagggg ggtggcctta tttagcctgg cctggctcct ctgagctttc 60
ttgggaatgt ctatatatag gggaagagcg cagcccagtt gccactgtcc atctgccttc 120
cttggactct ggtccacccc tccctgaccc tgggctccat tttctttctg tgccactttc 180
ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga ccagctgcca 240
ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg ccggaggagg 300
gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc ccttcttcac 360
catcccgagt ccaaagccct gacccagatg gcctggcttg ataaataccc gctctggtat 420
ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct gttgcgggat 480
cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 540
gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 600
cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 648
<210> 367
<211> 478
<212> DNA
<213> 人工序列
<220>
<223> SP0432
<400> 367
tgccactttc ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga 60
ccagctgcca ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg 120
ccggaggagg gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc 180
ccttcttcac catcccgagt ccaaagccct gacccagatg gcctggcttg ataaataccc 240
gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300
gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360
aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420
gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 478
<210> 368
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> CMV-IE 5'UTR和内含子
<400> 368
tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 60
atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120
cgtaagtacc gcctatagac tctataggca cacccctttg gctcttatgc atgaacggtg 180
gagggcagtg tagtctgagc agtactcgtt gctgccgcgc gcgccaccag acataatagc 240
tgacagacta acagactgtt cctttccatg ggtcttttct gcag 284
<210> 369
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0407
<400> 369
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120
gccctaactg gcaaacccca 140
<210> 370
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0408
<400> 370
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaagg 86
<210> 371
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0409
<400> 371
ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60
gtggcagtgg ggggtgagga gcatctaaaa atagcc 96
<210> 372
<211> 340
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0410
<400> 372
agtgattctc cctcaagacc ttataaaacc actttaaccc tcaatgggat aatatctagt 60
acattgtcat gggaactaac cttattaaat taccatgtgt gaaatgcctg taactcaagt 120
aacagcaggt gcaaaataaa gtagcaggcg gaagagtgac agtaattttt aacatctaca 180
ccagctggca aaaatgacag gtgcctaatt cctcagtctt taaaaataac ttttgagaag 240
cctacacagc ataagcaaat attttcaagt ttatttttta gctatcttcg agttaccttc 300
ctgacaaaat gtaataatat acactgattt ttgcagaaaa 340
<210> 373
<211> 257
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0411
<400> 373
ataacttcag cacactgtca tgggacctaa ccttattaaa ttaccatgtg tgaagcgtcc 60
ataactcaag taacagcagg tgcaaaaatg gagctgcagg cagaagagtg gtagtcattt 120
ttacaaatcc ccaccagctg gcgaaacaac aggtgcctaa ttcctcagct tttaaaaata 180
acttttaaaa agcctgtgct gcataagcaa atattttcaa gtttgttttt aaaccatctt 240
caagttacct tggtcac 257
<210> 374
<211> 280
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0412
<400> 374
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct 280
<210> 375
<211> 280
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0413
<400> 375
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct 280
<210> 376
<211> 447
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0414
<400> 376
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct agactggggc aggtgcaggc 300
tggattgggt ttccagaggc tatatatata aaggctgccg ggagccccag ggccgctccc 360
tgagggcaca acactgtggg ggcccagcca ggcccacatt cctttccaga ggccagctct 420
ccatttatag cccctgggca gagcagc 447
<210> 377
<211> 250
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0415
<400> 377
atggtgcttc caagtctgct cccgggacgt ttcctgttct tggaacagct gcaccagcct 60
ggggtaccct cctgctactt gatcctatag ggaggtgtcc agtggctgtg ggcaattttc 120
agatgacctt gttcgtctga cgtcattaga tcgctatttt tggctttgct gtttatgctg 180
cagaagttgg gctggaatgg gagaggagga atgaaggagg ggctgctctt ggtttcccat 240
tgttccaggg 250
<210> 378
<211> 370
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0416
<400> 378
actgatgtgg aaggggttat atataggaag atgtgtagga agaaaaaggt agagagctct 60
cctcagaggg tgggggatta tgggtagcca gagggagcct gggttagtgg agttgaagcc 120
ctagtcttgg gtgctttgta gcatcagaag cctctggagc ctttgctgac acctgcctga 180
tgtacggagc catctgtggg tgtctgtgtg ctggaggatt gcccacagct atgattcaga 240
gatgctcatg ttgttgccca agcaattgac agatgatgtt tcaggcttgg agatggcagg 300
atgggagcaa agagaagcca ggtcaggaaa gaacgtgccg ttctggccct agtggggaat 360
tctgggcctt 370
<210> 379
<211> 250
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0417
<400> 379
gggagagcca ggacattggc tgcctgtggt cttggtggtc gtggtcagtt ccctctcctg 60
ccagctgtgg aatgtgaggc ctggcctggg agatattttt gctgcacttt gagccacccc 120
gccccctgga actcagaccc tgcacagtcc atgccataac aatgacgacc acttccaatt 180
gtttcctagc tggagaggcg gggaggggag cactgtttgg gaaggggggg agcctggggg 240
aaatgcttct 250
<210> 380
<211> 346
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0418
<400> 380
ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60
gtggcagtgg ggggtgagga gcatctaaaa atagccggga gagccaggac attggctgcc 120
tgtggtcttg gtggtcgtgg tcagttccct ctcctgccag ctgtggaatg tgaggcctgg 180
cctgggagat atttttgctg cactttgagc caccccgccc cctggaactc agaccctgca 240
cagtccatgc cataacaatg acgaccactt ccaattgttt cctagctgga gaggcgggga 300
ggggagcact gtttgggaag ggggggagcc tgggggaaat gcttct 346
<210> 381
<211> 330
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0419
<400> 381
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttccatg ccataacaat 300
gacgaccact tccaattgtt tcctagctgg 330
<210> 382
<211> 320
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0420
<400> 382
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaatccatg ccataacaat gacgaccact 300
tccaattgtt tcctagctgg 320
<210> 383
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0421
<400> 383
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca gcagctggtc acaaagctgg ttaatctccc 120
agagtgctca gcttaaaacc cgtgactcac agcacagcca gtgtggggga gggggtggct 180
gcctccaata cgtggcgccc agagtcagct gttctggggc cttctctggt ttctccaact 240
gagtcctgag gtttgg 256
<210> 384
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0422
<400> 384
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120
ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180
ctggtttctc caactgagtc ctgaggtttg g 211
<210> 385
<211> 223
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0423
<400> 385
ggcaggcgga cctggtggtc agacctcagt gatcctcagg gaccagtgaa tatttcaggc 60
tggggctgag catcacctgc tcccttggcc ccacttatag ggcaaagggg agtctaccag 120
cctactcact gatgacaaac tggaaaagtt tgtcctgtct ctgctctggc cccacctcgc 180
cctctcccct acttggaagt tcctttcctg aaccactgac tgc 223
<210> 386
<211> 345
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0424
<400> 386
ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60
ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120
gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180
aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240
ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300
agcagacctg gcttcatcca aatgttctat ttgtttttta ctgca 345
<210> 387
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0425
<400> 387
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg c 211
<210> 388
<211> 274
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0426
<400> 388
ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60
gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120
aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180
ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240
aagcttgagg gattaaataa atcatctggc ccaa 274
<210> 389
<211> 173
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0427
<400> 389
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcc cctgcccccc 60
acagctcctc tcctgtgcct tgtttcccag ccatgcgttc tcctctataa atacccgctc 120
tggtatttgg ggttggcagc tgttgctgcc agggagatgg ttgggttgac atg 173
<210> 390
<211> 367
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0428
<400> 390
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240
tgcccctgcc ccccacagct cctctcctgt gccttgtttc ccagccatgc gttctcctct 300
ataaataccc gctctggtat ttggggttgg cagctgttgc tgccagggag atggttgggt 360
tgacatg 367
<210> 391
<211> 386
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0429
<400> 391
aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60
agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120
aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180
aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240
caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300
cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360
acactctgga gttagacaaa gccaag 386
<210> 392
<211> 422
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0430
<400> 392
gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60
tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120
gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180
aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240
ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300
cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360
aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420
at 422
<210> 393
<211> 400
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0431
<400> 393
gatcctctgc ctggcagggg ggtggcctta tttagcctgg cctggctcct ctgagctttc 60
ttgggaatgt ctatatatag gggaagagcg cagcccagtt gccactgtcc atctgccttc 120
cttggactct ggtccacccc tccctgaccc tgggctccat tttctttctg tgccactttc 180
ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga ccagctgcca 240
ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg ccggaggagg 300
gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc ccttcttcac 360
catcccgagt ccaaagccct gacccagatg gcctggcttg 400
<210> 394
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0432
<400> 394
tgccactttc ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga 60
ccagctgcca ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg 120
ccggaggagg gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc 180
ccttcttcac catcccgagt ccaaagccct gacccagatg gcctggcttg 230
<210> 395
<211> 199
<212> DNA
<213> 人工序列
<220>
<223> CRE0029.2
<400> 395
ctctgtctcc tcaggtgcct ggctgcttcc tagctgggcc tttccttctc ctctataaat 60
accagctctg gtatttcgcc ttggcagctg ttgctgctag ggagacggct ggcttgacat 120
gcatctcctg acaaaacaca aacccgtggt gtgagtgggt gtgggcggtg tgagtagggg 180
gatgaatcag agagggggc 199
<210> 396
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> CRE0069.2
<400> 396
agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60
ggagcccaca ttcctttcca gaggccagct ctccatttat agcccctggg cagagcagc 119
<210> 397
<211> 188
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.13
<400> 397
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
ggaggaatgg tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg 180
tccgccct 188
<210> 398
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.14
<400> 398
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180
tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccct 229
<210> 399
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.15
<400> 399
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagc tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaatagct cccgggagct atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 400
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_72 bp
<400> 400
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgct gccagggaga 60
tggttgggtt ga 72
<210> 401
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> CRE0080
<400> 401
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaagg 86
<210> 402
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> CRE0081
<400> 402
tgcctgggat cttttcgttc tgcccttggc tcctgcccta actggcaaac ccca 54
<210> 403
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> CRE0083
<400> 403
ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60
gtggcagtgg ggggtgagga gcatctaaaa atagcc 96
<210> 404
<211> 340
<212> DNA
<213> 人工序列
<220>
<223> CRE0084
<400> 404
agtgattctc cctcaagacc ttataaaacc actttaaccc tcaatgggat aatatctagt 60
acattgtcat gggaactaac cttattaaat taccatgtgt gaaatgcctg taactcaagt 120
aacagcaggt gcaaaataaa gtagcaggcg gaagagtgac agtaattttt aacatctaca 180
ccagctggca aaaatgacag gtgcctaatt cctcagtctt taaaaataac ttttgagaag 240
cctacacagc ataagcaaat attttcaagt ttatttttta gctatcttcg agttaccttc 300
ctgacaaaat gtaataatat acactgattt ttgcagaaaa 340
<210> 405
<211> 257
<212> DNA
<213> 人工序列
<220>
<223> CRE0085
<400> 405
ataacttcag cacactgtca tgggacctaa ccttattaaa ttaccatgtg tgaagcgtcc 60
ataactcaag taacagcagg tgcaaaaatg gagctgcagg cagaagagtg gtagtcattt 120
ttacaaatcc ccaccagctg gcgaaacaac aggtgcctaa ttcctcagct tttaaaaata 180
acttttaaaa agcctgtgct gcataagcaa atattttcaa gtttgttttt aaaccatctt 240
caagttacct tggtcac 257
<210> 406
<211> 280
<212> DNA
<213> 人工序列
<220>
<223> CRE0086
<400> 406
agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60
cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120
agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180
ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240
aacccgcgcc tgagtcacag ggccctgaat tggcccctct 280
<210> 407
<211> 250
<212> DNA
<213> 人工序列
<220>
<223> CRE0088
<400> 407
atggtgcttc caagtctgct cccgggacgt ttcctgttct tggaacagct gcaccagcct 60
ggggtaccct cctgctactt gatcctatag ggaggtgtcc agtggctgtg ggcaattttc 120
agatgacctt gttcgtctga cgtcattaga tcgctatttt tggctttgct gtttatgctg 180
cagaagttgg gctggaatgg gagaggagga atgaaggagg ggctgctctt ggtttcccat 240
tgttccaggg 250
<210> 408
<211> 370
<212> DNA
<213> 人工序列
<220>
<223> CRE0089
<400> 408
actgatgtgg aaggggttat atataggaag atgtgtagga agaaaaaggt agagagctct 60
cctcagaggg tgggggatta tgggtagcca gagggagcct gggttagtgg agttgaagcc 120
ctagtcttgg gtgctttgta gcatcagaag cctctggagc ctttgctgac acctgcctga 180
tgtacggagc catctgtggg tgtctgtgtg ctggaggatt gcccacagct atgattcaga 240
gatgctcatg ttgttgccca agcaattgac agatgatgtt tcaggcttgg agatggcagg 300
atgggagcaa agagaagcca ggtcaggaaa gaacgtgccg ttctggccct agtggggaat 360
tctgggcctt 370
<210> 409
<211> 250
<212> DNA
<213> 人工序列
<220>
<223> CRE0090
<400> 409
gggagagcca ggacattggc tgcctgtggt cttggtggtc gtggtcagtt ccctctcctg 60
ccagctgtgg aatgtgaggc ctggcctggg agatattttt gctgcacttt gagccacccc 120
gccccctgga actcagaccc tgcacagtcc atgccataac aatgacgacc acttccaatt 180
gtttcctagc tggagaggcg gggaggggag cactgtttgg gaaggggggg agcctggggg 240
aaatgcttct 250
<210> 410
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> CRE0091
<400> 410
tccatgccat aacaatgacg accacttcca attgtttcct agctgg 46
<210> 411
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> CRE0020.2
<400> 411
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca gcagctggtc acaaagctgg ttaatctccc 120
agagtgctca gcttaaaacc cgtgactcac agcacagcca gtgtggggga gggggtggct 180
gcctccaata cgtggcgccc agagtcagct gttctggggc cttctctggt ttctccaact 240
gagtcctgag gtttgg 256
<210> 412
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> CRE0093
<400> 412
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca 90
<210> 413
<211> 121
<212> DNA
<213> 人工序列
<220>
<223> CRE0094
<400> 413
aaacccgtga ctcacagcac agccagtgtg ggggaggggg tggctgcctc caatacgtgg 60
cgcccagagt cagctgttct ggggccttct ctggtttctc caactgagtc ctgaggtttg 120
g 121
<210> 414
<211> 223
<212> DNA
<213> 人工序列
<220>
<223> CRE0016.1
<400> 414
ggcaggcgga cctggtggtc agacctcagt gatcctcagg gaccagtgaa tatttcaggc 60
tggggctgag catcacctgc tcccttggcc ccacttatag ggcaaagggg agtctaccag 120
cctactcact gatgacaaac tggaaaagtt tgtcctgtct ctgctctggc cccacctcgc 180
cctctcccct acttggaagt tcctttcctg aaccactgac tgc 223
<210> 415
<211> 345
<212> DNA
<213> 人工序列
<220>
<223> CRE0004
<400> 415
ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60
ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120
gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180
aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240
ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300
agcagacctg gcttcatcca aatgttctat ttgtttttta ctgca 345
<210> 416
<211> 386
<212> DNA
<213> 人工序列
<220>
<223> CRE0095
<400> 416
aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60
agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120
aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180
aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240
caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300
cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360
acactctgga gttagacaaa gccaag 386
<210> 417
<211> 422
<212> DNA
<213> 人工序列
<220>
<223> CRE0096
<400> 417
gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60
tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120
gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180
aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240
ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300
cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360
aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420
at 422
<210> 418
<211> 170
<212> DNA
<213> 人工序列
<220>
<223> CRE0097
<400> 418
gatcctctgc ctggcagggg ggtggcctta tttagcctgg cctggctcct ctgagctttc 60
ttgggaatgt ctatatatag gggaagagcg cagcccagtt gccactgtcc atctgccttc 120
cttggactct ggtccacccc tccctgaccc tgggctccat tttctttctg 170
<210> 419
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRE0098
<400> 419
tgccactttc ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga 60
ccagctgcca ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg 120
ccggaggagg gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc 180
ccttcttcac catcccgagt ccaaagccct gacccagatg gcctggcttg 230
<210> 420
<211> 214
<212> DNA
<213> 人工序列
<220>
<223> CRE0092
<400> 420
tgacaatccc tgcctgggat cttttcgttc tgcccttggc tcctgcccta actggcaaac 60
cccaccccct catcaccagc tttcaagtat cagattgcgt ttccggcctc ttctttccaa 120
acccctaaac caccagcacc tgtccccttg cttgcctcat tccacagcca acaggctgaa 180
gggaagacaa accctagtca gtcagaggtg gggg 214
<210> 421
<211> 268
<212> DNA
<213> 人工序列
<220>
<223> CRE0087
<400> 421
attattcacc tgttcgcctt agatgaagaa tcaaggaaca gcagctctag ggggttggga 60
ggagttaggg tccggccctg ccccagacct ctcagtgtcc aatttctctg tgtcagctgt 120
gtttctcagc tgtccacttt cctccagccc tgtcatttca gccctgacac caaggcagga 180
ggctaggagg tctacaaata gcgactgggt agctggtgtg aacacagggg gtactggggg 240
ggcttagccc ccaaggaaga ggaccagt 268
<210> 422
<211> 414
<212> DNA
<213> 人工序列
<220>
<223> CRE0082
<400> 422
gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60
tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120
tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180
gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240
ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300
gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360
gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg ggac 414
<210> 423
<211> 243
<212> DNA
<213> 人工序列
<220>
<223> CRE0048.1
<400> 423
gactcagggg cgcaggcctc ttgcggggga gctggcctcc ccgcccccac ggccacgggc 60
cgccctttcc tggcaggaca gcgggatctt gcagctgtca ggggagggga ggcgggggct 120
gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 180
ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 240
gcc 243
<210> 424
<211> 458
<212> DNA
<213> 人工序列
<220>
<223> SP0344
<400> 424
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgg gccccagcca ctgtctcttt aaccttgaag gcatttttgg gtctcacgtg 240
tccacccagg cgggtgtcgg actttgaacg gctcttactt cagaagaacg gcatggggtg 300
ggggggctta ggtggcctct gcctcaccta caactgccaa aagtggtcat ggggttattt 360
ttaaccccag ggaagaggta tttattgttc cacagcaggg gccggccagc aggctccttg 420
aattcttcag aggcagcagc cagcctcaga cagccacc 458
<210> 425
<211> 554
<212> DNA
<213> 人工序列
<220>
<223> SP0433
<400> 425
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240
atggcgacgg gtgaggaatg gtggggagtt atttttagag cgtaaacgag ctattagttg 300
cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360
tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg 420
gccggggccg cattcctggg ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg 480
gggccggcgg cggcccacga gctacccgga ggagcgggag gcgccaagct ctagaactag 540
tggatcccgc cacc 554
<210> 426
<211> 609
<212> DNA
<213> 人工序列
<220>
<223> SP0435
<400> 426
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgg ggataaaagc agtctgggct ttcacatgac agcatctggg gctgcggcag 240
agggtcgggt ccgaagcgct gccttatcag cgtccccagc cctgggaggt gacagctggc 300
tggcttgtgt cagcccctcg ggcactcacg tatctccgtc cgacgggttt aaaatagcaa 360
aactctgagg ccacacaata gcttgggctt atatgggctc ctgtggggga agggggagca 420
cggagggggc cggggccgct gctgccaaaa tagcagctca caagtgttgc attcctctct 480
gggcgccggg cacattcctg ctggctctgc ccgccccggg gtgggcgccg gggggacctt 540
aaagcctctg ccccccaagg agcccttccc agacagccgc cggcacccac cgctccgtgg 600
gacgccacc 609
<210> 427
<211> 632
<212> DNA
<213> 人工序列
<220>
<223> SP0436
<400> 427
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgc ccttcagatt aaaaataact gaggtaaggg cctgggtagg ggaggtggtg 240
tgagacgctc ctgtctctcc tctatctgcc catcggccct ttggggagga ggaatgtgcc 300
caaggactaa aaaaaggcca tggagccaga ggggcgaggg caacagacct ttcatgggca 360
aaccttgggg ccctgctgat aaatacccgc tctggtattt ggggttctcc tctataaata 420
cccgctctgg tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg 480
aggcgggggc tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc 540
cctcgccgca tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca 600
gcctcgcccg cgccgtcacc gcggccgcca cc 632
<210> 428
<211> 782
<212> DNA
<213> 人工序列
<220>
<223> SP0449
<400> 428
ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60
ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120
gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180
aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240
ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300
agcagacctg gcttcatcca aatgttctat ttgtttttta ctgcaccctt cagattaaaa 360
ataactgagg taagggcctg ggtaggggag gtggtgtgag acgctcctgt ctctcctcta 420
tctgcccatc ggccctttgg ggaggaggaa tgtgcccaag gactaaaaaa aggccatgga 480
gccagagggg cgagggcaac agacctttca tgggcaaacc ttggggccct gctgataaat 540
acccgctctg gtatttgggg ttctcctcta taaatacccg ctctggtatt tggggttggc 600
agctgttgcg ggatcttgca gctgtcaggg gaggggaggc gggggctgat gtcaggaggg 660
atacaaatag tgccgacggc tgggggccct gtctcccctc gccgcatcca ctctccggcc 720
ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcca 780
cc 782
<210> 429
<211> 823
<212> DNA
<213> 人工序列
<220>
<223> SP0450
<400> 429
aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60
agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120
aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180
aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240
caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300
cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360
acactctgga gttagacaaa gccaagccct tcagattaaa aataactgag gtaagggcct 420
gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 480
gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 540
cagacctttc atgggcaaac cttggggccc tgctgataaa tacccgctct ggtatttggg 600
gttctcctct ataaataccc gctctggtat ttggggttgg cagctgttgc gggatcttgc 660
agctgtcagg ggaggggagg cgggggctga tgtcaggagg gatacaaata gtgccgacgg 720
ctgggggccc tgtctcccct cgccgcatcc actctccggc cggccgcctg cccgccgcct 780
cctccgtgcg cccgccagcc tcgcccgcgc cgtcaccgcc acc 823
<210> 430
<211> 859
<212> DNA
<213> 人工序列
<220>
<223> SP0451
<400> 430
gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60
tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120
gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180
aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240
ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300
cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360
aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420
atcccttcag attaaaaata actgaggtaa gggcctgggt aggggaggtg gtgtgagacg 480
ctcctgtctc tcctctatct gcccatcggc cctttgggga ggaggaatgt gcccaaggac 540
taaaaaaagg ccatggagcc agaggggcga gggcaacaga cctttcatgg gcaaaccttg 600
gggccctgct gataaatacc cgctctggta tttggggttc tcctctataa atacccgctc 660
tggtatttgg ggttggcagc tgttgcggga tcttgcagct gtcaggggag gggaggcggg 720
ggctgatgtc aggagggata caaatagtgc cgacggctgg gggccctgtc tcccctcgcc 780
gcatccactc tccggccggc cgcctgcccg ccgcctcctc cgtgcgcccg ccagcctcgc 840
ccgcgccgtc accgccacc 859
<210> 431
<211> 851
<212> DNA
<213> 人工序列
<220>
<223> SP0452
<400> 431
gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60
tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120
tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180
gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240
ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300
gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360
gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg ggaccccttc 420
agattaaaaa taactgaggt aagggcctgg gtaggggagg tggtgtgaga cgctcctgtc 480
tctcctctat ctgcccatcg gccctttggg gaggaggaat gtgcccaagg actaaaaaaa 540
ggccatggag ccagaggggc gagggcaaca gacctttcat gggcaaacct tggggccctg 600
ctgataaata cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt 660
ggggttggca gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg 720
tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac 780
tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg 840
tcaccgccac c 851
<210> 432
<211> 647
<212> DNA
<213> 人工序列
<220>
<223> SP0475
<400> 432
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctga taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg 240
gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg 300
ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgctca 360
gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc 420
cagcctccgc ggccgggaac ggtgcattgg aacgcggatt ccccgtgcca agagtgacgt 480
aagtaccgcc tatagactct ataggcacac ccctttggct cttatgcatg aacggtggag 540
ggcagtgtag tctgagcagt actcgttgct gccgcgcgcg ccaccagaca taatagctga 600
cagactaaca gactgttcct ttccatgggt cttttctgca ggccacc 647
<210> 433
<211> 501
<212> DNA
<213> 人工序列
<220>
<223> SP0476
<400> 433
ccagcagttt catccctaga ccatcccaaa catggttgag aagctctgag gggaggaccc 60
agcactgccc ggcccctgaa gtatctaatc agcagtcctg ctcagcatat caatccaagc 120
ccactctaga cagagatgcc ggtgcccagt tttctatttt taactggtgt gaactgaagg 180
aaaagcacag cattagaagt ccaagcacta gtcaagaacc aagaatacag ggcaccccag 240
ggcaagcata aatacccgct ctggtatttg gggttctcct ctataaatac ccgctctggt 300
atttggggtt ggcagctgtt gcgggatctt gcagctgtca ggggagggga ggcgggggct 360
gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 420
ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 480
gccgtcaccg cggccgccac c 501
<210> 434
<211> 484
<212> DNA
<213> 人工序列
<220>
<223> SP0477
<400> 434
gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60
gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120
cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180
gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata ataaataccc 240
gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300
gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360
aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420
gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 480
cacc 484
<210> 435
<211> 465
<212> DNA
<213> 人工序列
<220>
<223> SP0478
<400> 435
cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60
aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120
ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180
aaaatagcag ccaacacccc ccattgtgtt gataaatacc cgctctggta tttggggttc 240
tcctctataa atacccgctc tggtatttgg ggttggcagc tgttgcggga tcttgcagct 300
gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc cgacggctgg 360
gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg ccgcctcctc 420
cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg ccacc 465
<210> 436
<211> 456
<212> DNA
<213> 人工序列
<220>
<223> SP0479
<400> 436
ccagttgttc aactcaccct tcagattaaa aataactgag gtaagggcct gggtagggga 60
ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga 120
atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc 180
atgggcaaac cttggggccc tgataaatac ccgctctggt atttggggtt ctcctctata 240
aatacccgct ctggtatttg gggttggcag ctgttgcggg atcttgcagc tgtcagggga 300
ggggaggcgg gggctgatgt caggagggat acaaatagtg ccgacggctg ggggccctgt 360
ctcccctcgc cgcatccact ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc 420
gccagcctcg cccgcgccgt caccgcggcc gccacc 456
<210> 437
<211> 496
<212> DNA
<213> 人工序列
<220>
<223> SP0480
<400> 437
tgctgagccc agaaaaactg accgccctgt gtcctgccca cctccacact ctagagctat 60
attgagaggt gacagtagat agggtgggag ctggtagcag ggagagtgtt cctgggtgtg 120
agggtgtagg ggaaagccag agcaggggag tctggctttg cctcctgaac acaatgtcta 180
cttagttata acaggcatga cctgctaaag acccaacatc tacgacctct gaaaagacag 240
caataaatac ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg 300
gggttggcag ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt 360
caggagggat acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact 420
ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt 480
caccgcggcc gccacc 496
<210> 438
<211> 456
<212> DNA
<213> 人工序列
<220>
<223> SP0481
<400> 438
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgt atgtctatat taggtgacgc agaactgccc gtcgctcctg tcatccaggc 240
ccctggccca atggcaggct gaatcccccc tactccagcc tgctcccgcc tcttctgccc 300
ctggtgctcc gcgctacctg ctgccgcgcg ccacatccag ggcagagagg cgggtgcgcg 360
ggcgggcggc gggcaccatg cggggaggct gtccccaggg gtgggcagca ccactctctg 420
ctacccacct ggcgctgtga aacctgcgtc gccacc 456
<210> 439
<211> 517
<212> DNA
<213> 人工序列
<220>
<223> SP0482
<400> 439
agcggagccg agggggcagc gcgtgacccc gagcggaagg gccccagtct gggtcctaat 60
gcgggtggcg tctctcttga caggcagcgt ttggggacaa cagcggggaa gggagataag 120
atgacatacc agagcagatt tggtgtgcgc gctgatactc ctggcccgac aggaaactcg 180
gagctattta aaaaggccct atcgattact ttatcttccc cggaggaaaa cttcttgccg 240
agagacaaaa gatgtccccc tacataaata cccgctctgg tatttggggt tctcctctat 300
aaatacccgc tctggtattt ggggttggca gctgttgcgg gatcttgcag ctgtcagggg 360
aggggaggcg ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg 420
tctcccctcg ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc 480
cgccagcctc gcccgcgccg tcaccgcggc cgccacc 517
<210> 440
<211> 453
<212> DNA
<213> 人工序列
<220>
<223> SP0483
<400> 440
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgg gccccagcca ctgactcttt aaccttgaag gcatttttgg gtctcacgtg 240
tccacccagg cgggtggccg cctttgagca gctcttactt cagaagaacg gcatggagtg 300
gggggtgggg ggcttaggtg gcctccgcct cacctacaac tgccaaaagt ggtcatgggg 360
ttatttttaa ccccagggga gaggtattta ttgttccaca gcaggggcag aggccagcag 420
gctcctcgaa ctctccagag gtggcaagcc acc 453
<210> 441
<211> 348
<212> DNA
<213> 人工序列
<220>
<223> SP0484
<400> 441
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgg actcgctgaa ttaatgaatc acttttctta tctatttttt gctgttatct 240
aattctgaga gggaagccgg gagcagaggg agttgggaga cgtagctcac aacgtctccc 300
tcccacccgg ctcaaacagg ctggaatctc tgggcctaga gggccacc 348
<210> 442
<211> 442
<212> DNA
<213> 人工序列
<220>
<223> SP0485
<400> 442
cctctagagg caggtgacct tgatgaaagg ccttcagtgt gacacaggtg taaaaatagc 60
ctctgtgctg acttaactcc ctggcttgag caaacggccc ctcacacctg tatattgttt 120
gcttggcata gacacactgc tacctgtttg caggtgtaaa tgactgttta tgtacccaga 180
gttatgagat aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg 240
tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc 300
tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 360
tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 420
cgccgtcacc gcggccgcca cc 442
<210> 443
<211> 463
<212> DNA
<213> 人工序列
<220>
<223> SP0486
<400> 443
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgg ggctggctga aaggatgtct atatgtgtat ttttatcacc catgtgtcgg 240
atgagcctga gagctgccag atagctttct cgacagcttg gcgttagtgt tgggaacagg 300
tccatgtatg gaagcgaaag ccgaaaggca cagataagct aagagccagc tatgcagcca 360
tgcttagaga cactaaggac aggctccccg ggtcctttct ttctggtcta tctggagcag 420
ccttcagagc tggtcggttt ctcatccagc ccatgcagcc acc 463
<210> 444
<211> 337
<212> DNA
<213> 人工序列
<220>
<223> SP0487
<400> 444
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctga agatacctca gctggatgga atttgtctat atttagcagg tggctagcag 240
gaggctgata agcagggctg gggagggggc agtcctcata aatagtgaga acacaggaca 300
ctgttcagtc cctccttggg tggcctgctt ggccacc 337
<210> 445
<211> 544
<212> DNA
<213> 人工序列
<220>
<223> SP0488
<400> 445
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg ccagcttgtc atctccctct tgggcttccc 240
agacactaag tctggaatga aaattcacct gcctctgaat tggccactgg ataaataccc 300
gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 360
gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 420
aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 480
gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 540
cacc 544
<210> 446
<211> 553
<212> DNA
<213> 人工序列
<220>
<223> SP0489
<400> 446
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgg tctagactct tggatttgag agaagaggga ccttgctccg ggttttccta 240
agtttgaggg aggagggagc tggggcgcta gagtcaaagg aggaggggtg tagatcctgg 300
gcaccttggt tgacccaact ggagctttgc acacggctcc cctcacaccc tgttatcgct 360
tatcctgggc aggggaggag acagcagtat atttagtctt tgtcctcgcc ccttatctca 420
gtgtcctcag tgaggcttga gcagcccaga ggaaacccaa cctctagaga cctccaaggt 480
caccagggac acccttccag gaccctccag gaatctccga tcctgttctc tgcctctgga 540
gatcatcgcc acc 553
<210> 447
<211> 497
<212> DNA
<213> 人工序列
<220>
<223> SP0490
<400> 447
gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60
gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120
cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180
gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata tatgtctata 240
ttaggtgacg cagaactgcc cgtcgctcct gtcatccagg cccctggccc aatggcaggc 300
tgaatccccc ctactccagc ctgctcccgc ctcttctgcc cctggtgctc cgcgctacct 360
gctgccgcgc gccacatcca gggcagagag gcgggtgcgc gggcgggcgg cgggcaccat 420
gcggggaggc tgtccccagg ggtgggcagc accactctct gctacccacc tggcgctgtg 480
aaacctgcgt cgccacc 497
<210> 448
<211> 478
<212> DNA
<213> 人工序列
<220>
<223> SP0491
<400> 448
cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60
aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120
ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180
aaaatagcag ccaacacccc ccattgtgtt gtatgtctat attaggtgac gcagaactgc 240
ccgtcgctcc tgtcatccag gcccctggcc caatggcagg ctgaatcccc cctactccag 300
cctgctcccg cctcttctgc ccctggtgct ccgcgctacc tgctgccgcg cgccacatcc 360
agggcagaga ggcgggtgcg cgggcgggcg gcgggcacca tgcggggagg ctgtccccag 420
gggtgggcag caccactctc tgctacccac ctggcgctgt gaaacctgcg tcgccacc 478
<210> 449
<211> 378
<212> DNA
<213> 人工序列
<220>
<223> SP0492
<400> 449
gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60
gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120
cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180
gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata aagatacctc 240
agctggatgg aatttgtcta tatttagcag gtggctagca ggaggctgat aagcagggct 300
ggggaggggg cagtcctcat aaatagtgag aacacaggac actgttcagt ccctccttgg 360
gtggcctgct tggccacc 378
<210> 450
<211> 359
<212> DNA
<213> 人工序列
<220>
<223> SP0493
<400> 450
cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60
aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120
ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180
aaaatagcag ccaacacccc ccattgtgtt gaagatacct cagctggatg gaatttgtct 240
atatttagca ggtggctagc aggaggctga taagcagggc tggggagggg gcagtcctca 300
taaatagtga gaacacagga cactgttcag tccctccttg ggtggcctgc ttggccacc 359
<210> 451
<211> 545
<212> DNA
<213> 人工序列
<220>
<223> SP0494
<400> 451
aaacttaagt gctgaagata gcacttgcct ggttctattt tagtaggtcc ctggcagcca 60
gtcagcaagt gcagttgctc aagtgtgctt ttggatcatt gagtttcgtg tactggccat 120
atcaggacaa ggagaggcca tgggaaaaaa tagtccagca tctgatagtg tcaggtagtg 180
ttatccctgt cagggtgaca gttgaagtgt ttgagtaata gcagtgtcag cagatgccca 240
gagtttaaca tgtactcact tcaaaaggga cagctgatct aagtgctgga tataaatacc 300
cgctctggta tttggggttc tcctctataa atacccgctc tggtatttgg ggttggcagc 360
tgttgcggga tcttgcagct gtcaggggag gggaggcggg ggctgatgtc aggagggata 420
caaatagtgc cgacggctgg gggccctgtc tcccctcgcc gcatccactc tccggccggc 480
cgcctgcccg ccgcctcctc cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg 540
ccacc 545
<210> 452
<211> 567
<212> DNA
<213> 人工序列
<220>
<223> SP0495
<400> 452
gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60
gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120
cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180
gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata cccttcagat 240
taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct cctgtctctc 300
ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta aaaaaaggcc 360
atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg gccctgctga 420
agatacctca gctggatgga atttgtctat atttagcagg tggctagcag gaggctgata 480
agcagggctg gggagggggc agtcctcata aatagtgaga acacaggaca ctgttcagtc 540
cctccttggg tggcctgctt ggccacc 567
<210> 453
<211> 548
<212> DNA
<213> 人工序列
<220>
<223> SP0496
<400> 453
cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60
aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120
ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180
aaaatagcag ccaacacccc ccattgtgtt gcccttcaga ttaaaaataa ctgaggtaag 240
ggcctgggta ggggaggtgg tgtgagacgc tcctgtctct cctctatctg cccatcggcc 300
ctttggggag gaggaatgtg cccaaggact aaaaaaaggc catggagcca gaggggcgag 360
ggcaacagac ctttcatggg caaaccttgg ggccctgctg aagatacctc agctggatgg 420
aatttgtcta tatttagcag gtggctagca ggaggctgat aagcagggct ggggaggggg 480
cagtcctcat aaatagtgag aacacaggac actgttcagt ccctccttgg gtggcctgct 540
tggccacc 548
<210> 454
<211> 418
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0433
<400> 454
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240
atggcgacgg gtgaggaatg gtggggagtt atttttagag cgtaaacgag ctattagttg 300
cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360
tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccct 418
<210> 455
<211> 378
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0436
<400> 455
cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60
cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120
aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180
gccctgctgc ccttcagatt aaaaataact gaggtaaggg cctgggtagg ggaggtggtg 240
tgagacgctc ctgtctctcc tctatctgcc catcggccct ttggggagga ggaatgtgcc 300
caaggactaa aaaaaggcca tggagccaga ggggcgaggg caacagacct ttcatgggca 360
aaccttgggg ccctgctg 378
<210> 456
<211> 533
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0449
<400> 456
tctgactggg tcccttacca ctgtctttgc aaatggcatt tccattaaca tttctatttc 60
tggccattag gggcacctaa agatttccca ccaagattga cagccactat tttaagaaag 120
tgcttttaaa aagccagtgc ttttgctaag tttaaatctg actttctcag gggatgctta 180
aaagaaatac acagtttgtt tgtttttttt ttaagaacct ttgcaagttc aaaataacat 240
tccagaagga gtcactagaa aaacattcaa gggaagagaa aaaaattgtt ttcgtttgta 300
gcagacctgg cttcatccaa atgttctatt tgttttttac tgcacccttc agattaaaaa 360
taactgaggt aagggcctgg gtaggggagg tggtgtgaga cgctcctgtc tctcctctat 420
ctgcccatcg gccctttggg gaggaggaat gtgcccaagg actaaaaaaa ggccatggag 480
ccagaggggc gagggcaaca gacctttcat gggcaaacct tggggccctg ctg 533
<210> 457
<211> 575
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0450
<400> 457
aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60
agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120
aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180
aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240
caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300
cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360
acactctgga gttagacaaa gccaagccct tcagattaaa aataactgag gtaagggcct 420
gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 480
gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 540
cagacctttc atgggcaaac cttggggccc tgctg 575
<210> 458
<211> 611
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0451
<400> 458
gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60
tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120
gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180
aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240
ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300
cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360
aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420
atcccttcag attaaaaata actgaggtaa gggcctgggt aggggaggtg gtgtgagacg 480
ctcctgtctc tcctctatct gcccatcggc cctttgggga ggaggaatgt gcccaaggac 540
taaaaaaagg ccatggagcc agaggggcga gggcaacaga cctttcatgg gcaaaccttg 600
gggccctgct g 611
<210> 459
<211> 603
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0452
<400> 459
gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60
tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120
tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180
gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240
ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300
gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360
gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg ggaccccttc 420
agattaaaaa taactgaggt aagggcctgg gtaggggagg tggtgtgaga cgctcctgtc 480
tctcctctat ctgcccatcg gccctttggg gaggaggaat gtgcccaagg actaaaaaaa 540
ggccatggag ccagaggggc gagggcaaca gacctttcat gggcaaacct tggggccctg 600
ctg 603
<210> 460
<211> 419
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0495
<400> 460
gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60
gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120
cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180
gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata cccttcagat 240
taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct cctgtctctc 300
ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta aaaaaaggcc 360
atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg gccctgctg 419
<210> 461
<211> 400
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0496
<400> 461
cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60
aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120
ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180
aaaatagcag ccaacacccc ccattgtgtt gcccttcaga ttaaaaataa ctgaggtaag 240
ggcctgggta ggggaggtgg tgtgagacgc tcctgtctct cctctatctg cccatcggcc 300
ctttggggag gaggaatgtg cccaaggact aaaaaaaggc catggagcca gaggggcgag 360
ggcaacagac ctttcatggg caaaccttgg ggccctgctg 400
<210> 462
<211> 247
<212> DNA
<213> 人工序列
<220>
<223> CRE0105
<400> 462
ccagcagttt catccctaga ccatcccaaa catggttgag aagctctgag gggaggaccc 60
agcactgccc ggcccctgaa gtatctaatc agcagtcctg ctcagcatat caatccaagc 120
ccactctaga cagagatgcc ggtgcccagt tttctatttt taactggtgt gaactgaagg 180
aaaagcacag cattagaagt ccaagcacta gtcaagaacc aagaatacag ggcaccccag 240
ggcaagc 247
<210> 463
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> CRE0106
<400> 463
gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60
gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120
cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180
gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata 230
<210> 464
<211> 211
<212> DNA
<213> 人工序列
<220>
<223> CRE0107
<400> 464
cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60
aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120
ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180
aaaatagcag ccaacacccc ccattgtgtt g 211
<210> 465
<211> 202
<212> DNA
<213> 人工序列
<220>
<223> CRE0108
<400> 465
ccagttgttc aactcaccct tcagattaaa aataactgag gtaagggcct gggtagggga 60
ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga 120
atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc 180
atgggcaaac cttggggccc tg 202
<210> 466
<211> 242
<212> DNA
<213> 人工序列
<220>
<223> CRE0109
<400> 466
tgctgagccc agaaaaactg accgccctgt gtcctgccca cctccacact ctagagctat 60
attgagaggt gacagtagat agggtgggag ctggtagcag ggagagtgtt cctgggtgtg 120
agggtgtagg ggaaagccag agcaggggag tctggctttg cctcctgaac acaatgtcta 180
cttagttata acaggcatga cctgctaaag acccaacatc tacgacctct gaaaagacag 240
ca 242
<210> 467
<211> 263
<212> DNA
<213> 人工序列
<220>
<223> CRE0111
<400> 467
agcggagccg agggggcagc gcgtgacccc gagcggaagg gccccagtct gggtcctaat 60
gcgggtggcg tctctcttga caggcagcgt ttggggacaa cagcggggaa gggagataag 120
atgacatacc agagcagatt tggtgtgcgc gctgatactc ctggcccgac aggaaactcg 180
gagctattta aaaaggccct atcgattact ttatcttccc cggaggaaaa cttcttgccg 240
agagacaaaa gatgtccccc tac 263
<210> 468
<211> 188
<212> DNA
<213> 人工序列
<220>
<223> CRE0114
<400> 468
cctctagagg caggtgacct tgatgaaagg ccttcagtgt gacacaggtg taaaaatagc 60
ctctgtgctg acttaactcc ctggcttgag caaacggccc ctcacacctg tatattgttt 120
gcttggcata gacacactgc tacctgtttg caggtgtaaa tgactgttta tgtacccaga 180
gttatgag 188
<210> 469
<211> 290
<212> DNA
<213> 人工序列
<220>
<223> CRE0117
<400> 469
taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60
gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120
atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180
acatttcttc ctgattcgca tacgccgcgg ccagcttgtc atctccctct tgggcttccc 240
agacactaag tctggaatga aaattcacct gcctctgaat tggccactgg 290
<210> 470
<211> 291
<212> DNA
<213> 人工序列
<220>
<223> CRE0118
<400> 470
aaacttaagt gctgaagata gcacttgcct ggttctattt tagtaggtcc ctggcagcca 60
gtcagcaagt gcagttgctc aagtgtgctt ttggatcatt gagtttcgtg tactggccat 120
atcaggacaa ggagaggcca tgggaaaaaa tagtccagca tctgatagtg tcaggtagtg 180
ttatccctgt cagggtgaca gttgaagtgt ttgagtaata gcagtgtcag cagatgccca 240
gagtttaaca tgtactcact tcaaaaggga cagctgatct aagtgctgga t 291
<210> 471
<211> 265
<212> DNA
<213> 人工序列
<220>
<223> CRE0038
<400> 471
ggccccagcc actgtctctt taaccttgaa ggcatttttg ggtctcacgt gtccacccag 60
gcgggtgtcg gactttgaac ggctcttact tcagaagaac ggcatggggt gggggggctt 120
aggtggcctc tgcctcacct acaactgcca aaagtggtca tggggttatt tttaacccca 180
gggaagaggt atttattgtt ccacagcagg ggccggccag caggctcctt gaattcttca 240
gaggcagcag ccagcctcag acacc 265
<210> 472
<211> 358
<212> DNA
<213> 人工序列
<220>
<223> CRE0104
<400> 472
gtctagactc ttggatttga gagaagaggg accttgctcc gggttttcct aagtttgagg 60
gaggagggag ctggggcgct agagtcaaag gaggaggggt gtagatcctg ggcaccttgg 120
ttgacccaac tggagctttg cacacggctc ccctcacacc ctgttatcgc ttatcctggg 180
caggggagga gacagcagta tatttagtct ttgtcctcgc cccttatctc agtgtcctca 240
gtgaggcttg agcagcccag aggaaaccca acctctagag acctccaagg tcaccaggga 300
cacccttcca ggaccctcca ggaatctccg atcctgttct ctgcctctgg agatcatc 358
<210> 473
<211> 267
<212> DNA
<213> 人工序列
<220>
<223> CRE0110
<400> 473
tatgtctata ttaggtgacg cagaactgcc cgtcgctcct gtcatccagg cccctggccc 60
aatggcaggc tgaatccccc ctactccagc ctgctcccgc ctcttctgcc cctggtgctc 120
cgcgctacct gctgccgcgc gccacatcca gggcagagag gcgggtgcgc gggcgggcgg 180
cgggcaccat gcggggaggc tgtccccagg ggtgggcagc accactctct gctacccacc 240
tggcgctgtg aaacctgcgt cgccacc 267
<210> 474
<211> 258
<212> DNA
<213> 人工序列
<220>
<223> CRE0112
<400> 474
ggccccagcc actgactctt taaccttgaa ggcatttttg ggtctcacgt gtccacccag 60
gcgggtggcc gcctttgagc agctcttact tcagaagaac ggcatggagt ggggggtggg 120
gggcttaggt ggcctccgcc tcacctacaa ctgccaaaag tggtcatggg gttattttta 180
accccagggg agaggtattt attgttccac agcaggggca gaggccagca ggctcctcga 240
actctccaga ggtggcaa 258
<210> 475
<211> 153
<212> DNA
<213> 人工序列
<220>
<223> CRE0113
<400> 475
gactcgctga attaatgaat cacttttctt atctattttt tgctgttatc taattctgag 60
agggaagccg ggagcagagg gagttgggag acgtagctca caacgtctcc ctcccacccg 120
gctcaaacag gctggaatct ctgggcctag agg 153
<210> 476
<211> 268
<212> DNA
<213> 人工序列
<220>
<223> CRE0115
<400> 476
gggctggctg aaaggatgtc tatatgtgta tttttatcac ccatgtgtcg gatgagcctg 60
agagctgcca gatagctttc tcgacagctt ggcgttagtg ttgggaacag gtccatgtat 120
ggaagcgaaa gccgaaaggc acagataagc taagagccag ctatgcagcc atgcttagag 180
acactaagga caggctcccc gggtcctttc tttctggtct atctggagca gccttcagag 240
ctggtcggtt tctcatccag cccatgca 268
<210> 477
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> CRE0116
<400> 477
aagatacctc agctggatgg aatttgtcta tatttagcag gtggctagca ggaggctgat 60
aagcagggct ggggaggggg cagtcctcat aaatagtgag aacacaggac actgttcagt 120
ccctccttgg gtggcctgct tg 142
<210> 478
<211> 340
<212> DNA
<213> 人工序列
<220>
<223> SP0437
<400> 478
caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60
gtaaacgagc tattgggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcggccacc 340
<210> 479
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0438
<400> 479
caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 480
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0439
<400> 480
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
gtaaacgagc tattgggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 481
<211> 585
<212> DNA
<213> 人工序列
<220>
<223> SP0440
<400> 481
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcggagga atggtggaca 420
cccaaatatg gcgacggttc ctcacccgtc gccatatttg ggtgtccgcc ctcggccggg 480
gccgcattcc tgggggccgg gcggtgctcc cgcccgcctc gataaaaggc tccggggccg 540
gcggcggccc acgagctacc cggaggagcg ggaggcgccg ccacc 585
<210> 482
<211> 546
<212> DNA
<213> 人工序列
<220>
<223> SP0441
<400> 482
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgcccgt cgccatattt 420
gggtgtccgc cctcggccgg ggccgcattc ctgggggccg ggcggtgctc ccgcccgcct 480
cgataaaagg ctccggggcc ggcggcggcc cacgagctac ccggaggagc gggaggcgcc 540
gccacc 546
<210> 483
<211> 585
<212> DNA
<213> 人工序列
<220>
<223> SP0442
<400> 483
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420
cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ctcggccggg 480
gccgcattcc tgggggccgg gcggtgctcc cgcccgcctc gataaaaggc tccggggccg 540
gcggcggccc acgagctacc cggaggagcg ggaggcgccg ccacc 585
<210> 484
<211> 328
<212> DNA
<213> 人工序列
<220>
<223> SP0443
<400> 484
ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60
tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120
aaatagctcc cgggagctat ttttagagcg gaggaatggt ggacacccaa atatggcgac 180
ggttcctcac ccgtcgccat atttgggtgt ccgccctcgg ccggggccgc attcctgggg 240
gccgggcggt gctcccgccc gcctcgataa aaggctccgg ggccggcggc ggcccacgag 300
ctacccggag gagcgggagg cggccacc 328
<210> 485
<211> 328
<212> DNA
<213> 人工序列
<220>
<223> SP0444
<400> 485
ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60
tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120
aaatagctcc cgggagctat ttttagagcg agctctataa atacccgctc tggtatttgg 180
ggttttgaac ccgtcgccat atttgggtgt ccgccctcgg ccggggccgc attcctgggg 240
gccgggcggt gctcccgccc gcctcgataa aaggctccgg ggccggcggc ggcccacgag 300
ctacccggag gagcgggagg cggccacc 328
<210> 486
<211> 436
<212> DNA
<213> 人工序列
<220>
<223> SP0445
<400> 486
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
gagctctata aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg 180
tccgccctat aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg 240
tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc 300
tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 360
tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 420
cgccgtcacc gccacc 436
<210> 487
<211> 464
<212> DNA
<213> 人工序列
<220>
<223> SP0446
<400> 487
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120
gccctaactg gcaaacccca catgttcccg gcgaagggcc agctgtcccc cgccagctag 180
actcagcact tagtttagga accagtgagc aagtcagccc ttggggcagc ccatacaagg 240
ccatggggct gggcaagctg cacgcctggg tccggggtgg gcacggtgcc cgggcaacga 300
gctgaaagct catctgctct caggggcccc tccctgggga cagcccctcc tggctagtca 360
caccctgtag gctcctctat ataacccagg ggcacagggg ctgccctcat tctaccacca 420
cctccacagc acagacagac actcaggagc cagccagcgc cacc 464
<210> 488
<211> 291
<212> DNA
<213> 人工序列
<220>
<223> SP0447
<400> 488
ggccgtccgc cctcgggaca cccaaatatg gcgacggggg agttattttt agagcgggca 60
ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga gcggaggaat 120
ggtggacacc caaatatggc gacggttcct cacccgtcgc catatttggg tgtccgccct 180
cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 240
cggggccggc ggcggcccac gagctacccg gaggagcggg aggcggccac c 291
<210> 489
<211> 761
<212> DNA
<213> 人工序列
<220>
<223> SP0453
<400> 489
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctataaata cccgctctgg tatttggggt 540
tctcctctat aaatacccgc tctggtattt ggggttggca gctgttgcgg gatcttgcag 600
ctgtcagggg aggggaggcg ggggctgatg tcaggaggga tacaaatagt gccgacggct 660
gggggccctg tctcccctcg ccgcatccac tctccggccg gccgcctgcc cgccgcctcc 720
tccgtgcgcc cgccagcctc gcccgcgccg tcaccgccac c 761
<210> 490
<211> 720
<212> DNA
<213> 人工序列
<220>
<223> SP0454
<400> 490
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420
cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ctataaatac 480
ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg gggttggcag 540
ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat 600
acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg 660
ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt caccgccacc 720
<210> 491
<211> 551
<212> DNA
<213> 人工序列
<220>
<223> SP0455
<400> 491
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120
ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180
ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240
accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300
agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360
tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420
catatttggg tgtccgccct cggccggggc cgcattcctg ggggccgggc ggtgctcccg 480
cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg 540
aggcggccac c 551
<210> 492
<211> 688
<212> DNA
<213> 人工序列
<220>
<223> SP0456
<400> 492
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120
ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180
ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240
accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300
agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360
tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420
catatttggg tgtccgccct ataaataccc gctctggtat ttggggttct cctctataaa 480
tacccgctct ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg 540
ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 600
cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 660
cagcctcgcc cgcgccgtca ccgccacc 688
<210> 493
<211> 621
<212> DNA
<213> 人工序列
<220>
<223> SP0457
<400> 493
ccccacagca gctgggggca tttatgggcc ttcctataaa cttctgagag ggtaacttta 60
tcctgcttct ttcagccaag tatcctcctc caaggcagtg tatactcttc cataaacgag 120
ctattagtta tgaggtcaaa cccgtgactc acagcacagc cagtgtgggg gagggggtgg 180
ctgcctccaa tacgtggcgc ccagagtcag ctgttctggg gccttctctg gtttctccaa 240
ctgagtcctg aggtttggtg acggaattcg gccgaacggg acaccgcggt ggcggccgtc 300
cgccctcggc accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag 360
ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac 420
tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct 480
cacccgtcgc catatttggg tgtccgccct cggccggggc cgcattcctg ggggccgggc 540
ggtgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg 600
gaggagcggg aggcggccac c 621
<210> 494
<211> 759
<212> DNA
<213> 人工序列
<220>
<223> SP0458
<400> 494
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctttctcct ctataaatac ccgctctggt 540
atttggggtt ggcagctgtt gctgccaggg agatggttgg gttgacggga tcttgcagct 600
gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc cgacggctgg 660
gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg ccgcctcctc 720
cgtgcgcccg ccagcctcgc ccgcgccgtc accgccacc 759
<210> 495
<211> 837
<212> DNA
<213> 人工序列
<220>
<223> SP0459
<400> 495
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctcatgttc ccggcgaagg gccagctgtc 540
ccccgccagc tagactcagc acttagttta ggaaccagtg agcaagtcag cccttggggc 600
agcccataca aggccatggg gctgggcaag ctgcacgcct gggtccgggg tgggcacggt 660
gcccgggcaa cgagctgaaa gctcatctgc tctcaggggc ccctccctgg ggacagcccc 720
tcctggctag tcacaccctg taggctcctc tatataaccc aggggcacag gggctgccct 780
cattctacca ccacctccac agcacagaca gacactcagg agccagccag cgccacc 837
<210> 496
<211> 298
<212> DNA
<213> 人工序列
<220>
<223> SP0460
<400> 496
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgcggccggg gccgcattcc 180
tgggggccgg gcggtgctcc cgcccgcctc gataaaaggc tccggggccg gcggcggccc 240
acgagctacc cggaggagcg ggaggcgcca agctctagaa ctagtggatc ccgccacc 298
<210> 497
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0461
<400> 497
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgaggcagtg tatactcttc 180
cataaacgag ctattagtta tgaggtccgt agattgaaaa gggtgacggc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 498
<211> 356
<212> DNA
<213> 人工序列
<220>
<223> SP0462
<400> 498
ctctataaat acccgctctg gtatttgggg ttacacccaa atatggcgac gggtgaggaa 60
tggtggggag ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc 120
taaaaataac tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc 180
gacggttcct cacccgtcgc catatttggg tgtccgccct cggccggggc cgcattcctg 240
ggggccgggc ggtgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac 300
gagctacccg gaggagcggg aggcgccaag ctctagaact agtggatccc gccacc 356
<210> 499
<211> 772
<212> DNA
<213> 人工序列
<220>
<223> SP0463
<400> 499
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cctccactac gggtctaggc tgcccatgta 540
aggaggcaag gcctggggac acccgagatg cctggttata attaacccag acatgtggct 600
gccccccccc ccccaacacc tgctgcctct aaaaataacc ctgtccctgg tggatcccct 660
gcatgcgaag atcttcgaac aaggctgtgg gggactgagg gcaggctgta acaggcttgg 720
gggccagggc ttatacgtgc ctgggactcc caaagtatta ctgttcgcca cc 772
<210> 500
<211> 837
<212> DNA
<213> 人工序列
<220>
<223> SP0464
<400> 500
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240
cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300
ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360
ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420
aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480
tgaggtttgg ggccttgtct tccttcctgg agtcatgttc ccggcgaagg gccagctgtc 540
ccccgccagc tagactcagc acttagttta ggaaccagtg agcaagtcag cccttggggc 600
agcccataca aggccatggg gctgggcaag ctgcacgcct gggtccgggg tgggcacggt 660
gcccgggcaa cgagctgaaa gctcatctgc tctcaggggc ccctccctgg ggacagcccc 720
tcctggctag tcacaccctg taggctcctc tatataaccc aggggcacag gggctgccct 780
cattctacca ccacctccac agcacagaca gacactcagg agccagccag cgccacc 837
<210> 501
<211> 772
<212> DNA
<213> 人工序列
<220>
<223> SP0465
<400> 501
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240
cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300
ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360
ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420
aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480
tgaggtttgg ggccttgtct tccttcctgg agtccactac gggtctaggc tgcccatgta 540
aggaggcaag gcctggggac acccgagatg cctggttata attaacccag acatgtggct 600
gccccccccc ccccaacacc tgctgcctct aaaaataacc ctgtccctgg tggatcccct 660
gcatgcgaag atcttcgaac aaggctgtgg gggactgagg gcaggctgta acaggcttgg 720
gggccagggc ttatacgtgc ctgggactcc caaagtatta ctgttcgcca cc 772
<210> 502
<211> 764
<212> DNA
<213> 人工序列
<220>
<223> SP0466
<400> 502
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc cacagcagct 240
gggggcattt atgggccttc ctataaactt ctgagagggt aactttatcc tgcttctttc 300
agccaagtat cctcctccaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt 360
ggctgcctcc aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc 420
aactgagtcc tgaggtttgg catgttcccg gcgaagggcc agctgtcccc cgccagctag 480
actcagcact tagtttagga accagtgagc aagtcagccc ttggggcagc ccatacaagg 540
ccatggggct gggcaagctg cacgcctggg tccggggtgg gcacggtgcc cgggcaacga 600
gctgaaagct catctgctct caggggcccc tccctgggga cagcccctcc tggctagtca 660
caccctgtag gctcctctat ataacccagg ggcacagggg ctgccctcat tctaccacca 720
cctccacagc acagacagac actcaggagc cagccagcgc cacc 764
<210> 503
<211> 671
<212> DNA
<213> 人工序列
<220>
<223> SP0467
<400> 503
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240
caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300
gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360
aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420
cctataaata cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt 480
ggggttggca gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg 540
tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac 600
tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg 660
tcaccgccac c 671
<210> 504
<211> 671
<212> DNA
<213> 人工序列
<220>
<223> SP0468
<400> 504
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ccactacggg 240
tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct ggttataatt 300
aacccagaca tgtggctgcc cccccccccc aacacctgct gcctgagcct cacccccacc 360
ccggtgcctg ggtcttaggc tctgtacacc atggaggaga agctcgctct aaaaataacc 420
ctgataaata cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt 480
ggggttggca gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg 540
tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac 600
tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg 660
tcaccgccac c 671
<210> 505
<211> 506
<212> DNA
<213> 人工序列
<220>
<223> SP0469
<400> 505
ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60
ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120
gttctggggc cttctctggt ttctccaact gagtcctgag gtttggcacc gcggtggcgg 180
ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg aggaatggtg 240
gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg cgctctaaaa 300
ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat atggcgacgg 360
ttcctcaccc gtcgccatat ttgggtgtcc gccctcggcc ggggccgcat tcctgggggc 420
cgggcggtgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg cccacgagct 480
acccggagga gcgggaggcg gccacc 506
<210> 506
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> SP0470
<400> 506
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggata aacgagctat gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgcata gctcgtttat cccgggataa acgagctatg cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240
gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300
gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360
ccacc 365
<210> 507
<211> 624
<212> DNA
<213> 人工序列
<220>
<223> SP0471
<400> 507
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240
cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300
ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360
ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420
aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480
tgaggtttgg ggccttgtct tccttcctgg agtcggccgg ggccgcattc ctgggggccg 540
ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cacgagctac 600
ccggaggagc gggaggcggc cacc 624
<210> 508
<211> 718
<212> DNA
<213> 人工序列
<220>
<223> SP0473
<400> 508
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420
cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ctttctcctc 480
tataaatacc cgctctggta tttggggttg gcagctgttg ctgccaggga gatggttggg 540
ttgacgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 600
aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 660
gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 718
<210> 509
<211> 465
<212> DNA
<213> 人工序列
<220>
<223> SP0474
<400> 509
ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60
ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120
gttctggggc cttctctggt ttctccaact gagtcctgag gtttggacac ccaaatatgg 180
cgacgggtga ggaatggtgg ggagttattt ttagagcggt gaggaaggtg ggcaggcagc 240
aggtgttggc gctctaaaaa taactcccgg gagttatttt tagagcgagc tctataaata 300
cccgctctgg tatttggggt tttgaacccg tcgccatatt tgggtgtccg ccctcggccg 360
gggccgcatt cctgggggcc gggcggtgct cccgcccgcc tcgataaaag gctccggggc 420
cggcggcggc ccacgagcta cccggaggag cgggaggcgg ccacc 465
<210> 510
<211> 472
<212> DNA
<213> 人工序列
<220>
<223> CRM_ SP0440
<400> 510
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcggagga atggtggaca 420
cccaaatatg gcgacggttc ctcacccgtc gccatatttg ggtgtccgcc ct 472
<210> 511
<211> 433
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0441
<400> 511
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgcccgt cgccatattt 420
gggtgtccgc cct 433
<210> 512
<211> 472
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0442
<400> 512
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420
cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ct 472
<210> 513
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0446
<400> 513
agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60
gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120
gccctaactg gcaaacccca 140
<210> 514
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0453
<400> 514
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 515
<211> 472
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0454
<400> 515
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420
cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ct 472
<210> 516
<211> 440
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0455
<400> 516
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120
ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180
ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240
accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300
agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360
tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420
catatttggg tgtccgccct 440
<210> 517
<211> 440
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0456
<400> 517
ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60
ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120
ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180
ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240
accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300
agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360
tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420
catatttggg tgtccgccct 440
<210> 518
<211> 510
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0457
<400> 518
ccccacagca gctgggggca tttatgggcc ttcctataaa cttctgagag ggtaacttta 60
tcctgcttct ttcagccaag tatcctcctc caaggcagtg tatactcttc cataaacgag 120
ctattagtta tgaggtcaaa cccgtgactc acagcacagc cagtgtgggg gagggggtgg 180
ctgcctccaa tacgtggcgc ccagagtcag ctgttctggg gccttctctg gtttctccaa 240
ctgagtcctg aggtttggtg acggaattcg gccgaacggg acaccgcggt ggcggccgtc 300
cgccctcggc accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag 360
ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac 420
tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct 480
cacccgtcgc catatttggg tgtccgccct 510
<210> 519
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0458
<400> 519
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 520
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0459
<400> 520
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 521
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0461
<400> 521
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cgaggcagtg tatactcttc 180
cataaacgag ctattagtta tgaggtccgt agattgaaaa gggtgacgg 229
<210> 522
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0462
<400> 522
ctctataaat acccgctctg gtatttgggg ttacacccaa atatggcgac gggtgaggaa 60
tggtggggag ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc 120
taaaaataac tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc 180
gacggttcct cacccgtcgc catatttggg tgtccgccct 220
<210> 523
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0463
<400> 523
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300
gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360
gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420
aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480
cctcacccgt cgccatattt gggtgtccgc cct 513
<210> 524
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0464
<400> 524
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240
cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300
ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360
ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420
aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480
tgaggtttgg ggccttgtct tccttcctgg agt 513
<210> 525
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0465
<400> 525
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240
cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300
ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360
ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420
aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480
tgaggtttgg ggccttgtct tccttcctgg agt 513
<210> 526
<211> 440
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0466
<400> 526
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc cacagcagct 240
gggggcattt atgggccttc ctataaactt ctgagagggt aactttatcc tgcttctttc 300
agccaagtat cctcctccaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt 360
ggctgcctcc aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc 420
aactgagtcc tgaggtttgg 440
<210> 527
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0467
<400> 527
gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60
tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120
tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180
taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240
caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300
gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360
aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420
cct 423
<210> 528
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0468
<400> 528
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ccactacggg 240
tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct ggttataatt 300
aacccagaca tgtggctgcc cccccccccc aacacctgct gcctgagcct cacccccacc 360
ccggtgcctg ggtcttaggc tctgtacacc atggaggaga agctcgctct aaaaataacc 420
ctg 423
<210> 529
<211> 395
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0469
<400> 529
ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60
ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120
gttctggggc cttctctggt ttctccaact gagtcctgag gtttggcacc gcggtggcgg 180
ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg aggaatggtg 240
gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg cgctctaaaa 300
ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat atggcgacgg 360
ttcctcaccc gtcgccatat ttgggtgtcc gccct 395
<210> 530
<211> 513
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0471
<400> 530
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240
cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300
ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360
ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420
aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480
tgaggtttgg ggccttgtct tccttcctgg agt 513
<210> 531
<211> 472
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0473
<400> 531
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300
acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360
gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420
cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ct 472
<210> 532
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0474
<400> 532
ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60
ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120
gttctggggc cttctctggt ttctccaact gagtcctgag gtttggacac ccaaatatgg 180
cgacgggtga ggaatggtgg ggagttattt ttagagcggt gaggaaggtg ggcaggcagc 240
aggtgttggc gctctaaaaa taactcccgg gagttatttt tagagcgagc tctataaata 300
cccgctctgg tatttggggt tttgaacccg tcgccatatt tgggtgtccg ccct 354
<210> 533
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.16
<400> 533
caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60
gtaaacgagc tattgggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 534
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.17
<400> 534
caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 535
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.18
<400> 535
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
gtaaacgagc tattgggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 536
<211> 149
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.19
<400> 536
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
gcccgtcgcc atatttgggt gtccgccct 149
<210> 537
<211> 188
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.5
<400> 537
acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60
ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120
gagctctata aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg 180
tccgccct 188
<210> 538
<211> 217
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.20
<400> 538
ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60
tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120
aaatagctcc cgggagctat ttttagagcg gaggaatggt ggacacccaa atatggcgac 180
ggttcctcac ccgtcgccat atttgggtgt ccgccct 217
<210> 539
<211> 217
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.21
<400> 539
ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60
tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120
aaatagctcc cgggagctat ttttagagcg agctctataa atacccgctc tggtatttgg 180
ggttttgaac ccgtcgccat atttgggtgt ccgccct 217
<210> 540
<211> 180
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.22
<400> 540
ggccgtccgc cctcgggaca cccaaatatg gcgacggggg agttattttt agagcgggca 60
ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga gcggaggaat 120
ggtggacacc caaatatggc gacggttcct cacccgtcgc catatttggg tgtccgccct 180
<210> 541
<211> 162
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.23
<400> 541
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgctct aaaaataact cccgggagtt atttttagag cg 162
<210> 542
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> CNTRL_001 (67 bp)
<400> 542
aggcagtgta tactcttcca taaacgagct attagttatg aggtccgtag attgaaaagg 60
gtgacgg 67
<210> 543
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> CRE0071.24
<400> 543
caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60
ggtgaggaat ggtggggata aacgagctat gcggtgagga aggtgggcag gcagcaggtg 120
ttggcgcata gctcgtttat cccgggataa acgagctatg cggaggaatg gtggacaccc 180
aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229
<210> 544
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> CNTRL_001
<400> 544
aggcagtgta tactcttcca taaacgagct attagttatg aggtc 45
<210> 545
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> CRE0093.2
<400> 545
ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60
<210> 546
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> CRE0094.2
<400> 546
ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 60
gttctggggc cttctctggt ttctccaact gagtcctgag gtttgg 106
<210> 547
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> DES_MT_增强子_48bp
<400> 547
ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttg 48
<210> 548
<211> 997
<212> DNA
<213> 人工序列
<220>
<223> SP0229A
<400> 548
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300
gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360
ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420
cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480
cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540
ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600
tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660
agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720
cgccatattt gggtgtccgc cctcggccga ccctgataaa tacccgctct ggtatttggg 780
gttctcctct ataaataccc gctctggtat ttggggttgg cagctgttgc gggatcttgc 840
agctgtcagg ggaggggagg cgggggctga tgtcaggagg gatacaaata gtgccgacgg 900
ctgggggccc tgtctcccct cgccgcatcc actctccggc cggccgcctg cccgccgcct 960
cctccgtgcg cccgccagcc tcgcccgcgc cgtcacc 997
<210> 549
<211> 743
<212> DNA
<213> 人工序列
<220>
<223> CRM_SP0229A
<400> 549
gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60
ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120
ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180
tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240
caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300
gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360
ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420
cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480
cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540
ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600
tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660
agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720
cgccatattt gggtgtccgc cct 743
<210> 550
<211> 301
<212> DNA
<213> 人工序列
<220>
<223> CMV-IE 5'UTR和内含子_v2
<400> 550
tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 60
atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120
cgtaagtacc gcctatagac tctataggca cacccctttg gctcttatgc atgaacggtg 180
gagggcagtg tagtctgagc agtactcgtt gctgccgcgc gcgccaccag acataatagc 240
tgacagacta acagactgtt cctttccatg ggtcttttct gcagtcaccg tccttgacac 300
g 301

Claims (49)

1.一种合成的肌肉特异性启动子,其包含:
根据SEQ ID NO:1-137、342-367、424-453和478-509中任一个的序列,或其功能变体;或
顺式调节模块(CRM),其包含根据SEQ ID NO:138-269、369-394、454-461和510-532中任一个的序列或其功能变体。
2.根据权利要求1所述的合成的肌肉特异性启动子,其包含与SEQ ID NO:1-137、342-367、424-453和478-509中任一个至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
3.根据权利要求1b)所述的合成的肌肉特异性启动子,其中所述CRM包含与SEQ ID NO:138-269、369-394、454-461和510-532中任一个至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
4.根据权利要求3所述的合成的肌肉特异性启动子,其包含与启动子元件可操作地连接的上述CRM。
5.根据前述权利要求中任一项所述的合成的肌肉特异性启动子,其中所述功能变体保留所述参考启动子的至少25%、50%、75%、80%、85%、90%、95%或100%的活性。
6.一种肌肉特异性顺式调节元件(CRE),其包含根据SEQ ID NO:293-298、301-341、395-419、462-470和533-546中任一个的序列,或其任何功能变体。
7.根据权利要求6所述的肌肉特异性CRE,其包含与SEQ ID NO:293-298、301-341、395-419、462-470和533-546中任一个至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
8.一种合成的肌肉特异性启动子,其包含根据权利要求6或7所述的CRE。
9.一种分离的内含子,其包含根据SEQ ID NO:299的序列或其功能变体。
10.根据权利要求9所述的分离的内含子,其包含与SEQ ID NO:299至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
11.一种合成的肌肉特异性启动子,其包含根据权利要求9或10所述的内含子。
12.一种分离的调节元件,其包含根据SEQ ID NO:368的序列或其功能变体。
13.根据权利要求12所述的分离的调节元件,其包含与SEQ ID NO:368至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
14.一种合成的肌肉特异性启动子,其包含根据权利要求12或13所述的调节元件。
15.一种分离的最小或近端启动子,其包含根据SEQ ID NO:270-292、420-423、471-477和300中任一个的序列或其功能变体。
16.根据权利要求15所述的分离的最小或近端启动子,其包含与SEQ ID NO:270-292、420-423、471-477和300至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
17.一种合成的肌肉特异性启动子,其包含根据权利要求15或16所述的最小或近端启动子。
18.一种合成的肌肉特异性CRM,其包含两个或更多个可操作地连接的CRE,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体。
19.根据权利要求18所述的合成的肌肉特异性CRM,其中所述CRM在与启动子元件可操作地连接时在心肌和骨骼肌中具有活性,并且其中所述CRM包含两个或更多个可操作地连接的CRE,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体。
20.根据权利要求19所述的合成的心肌和骨骼肌特异性CRM,其包含选自以下组的CRE或其功能变体的组合:CRE0035和CRE0031;CRE0035和CRE0036;CRE0029和CRE0071;CRE0035和CRE0020;CRE0020和CRE0071;以及CRE0020和CRE0036。
21.根据权利要求20所述的合成的心肌和骨骼肌特异性CRM,或其功能变体,其中所述CRE以所述的顺序存在于所述CRM中并且优选地彼此相邻。
22.根据权利要求19至21中任一项所述的合成的心肌和骨骼肌特异性CRM,其包含选自由以下组成的组的CRM:CRM_SP0160(SEQ ID NO:173)、CRM_SP0163(SEQ ID NO:176)、CRM_SP0159(SEQ ID NO:172)、CRM_SP0162(SEQ ID NO:175)、CRM_SP0057(SEQ ID NO:145)、CRM_SP0156(SEQ ID NO:169)、CRM_SP0134(SEQ ID NO:161)、CRM_SP0158(SEQ ID NO:171)和CRM_SP0161(SEQ ID NO:174),或其任何功能变体。
23.根据权利要求18所述的合成的肌肉特异性CRM,其中所述CRM在与启动子元件可操作地连接时在骨骼肌中具有活性,其中所述CRM包含两个或更多个可操作地连接的CRE,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0050(SEQ ID NO:313)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;
-CRE0047(SEQ ID NO:312)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;和
-DES_MT_增强子_48bp(SEQ ID NO:547)或其功能变体。
24.根据权利要求23所述的合成的骨骼肌特异性CRM,其包含选自以下组的CRE或其功能变体的组合:CRE0035、DES_MT_增强子_48bp和DES_MT_增强子_48bp;CRE0035和CRE0031;CRE0035和CRE0020;CRE0047和CRE0020;CRE0020和CRE0071;以及CRE0035和CRE0031。
25.根据权利要求24所述的合成的骨骼肌特异性CRM,或其功能变体,其中所述CRE以所述的顺序存在于所述CRM中并且优选地彼此相邻。
26.根据权利要求23至25中任一项所述的合成的骨骼肌特异性CRM,其包含选自由以下组成的组的CRM:CRM_SP0155(SEQ ID NO:168)、CRM_SP0160(SEQ ID NO:173)、CRM_SP0156(SEQ ID NO:169)、CRM_SP0164(SEQ ID NO:177)、CRM_SP0134(SEQ ID NO:161)和CRM_SP0163(SEQ ID NO:176),或其任何功能变体。
27.根据权利要求18所述的合成的肌肉特异性CRM,其中所述CRM在与启动子元件可操作地连接时在心肌中具有活性,并且其中所述CRM包含两个或更多个可操作地连接的CRE,所述CRE选自由以下组成的组:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0069(SEQ ID NO:320)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0096(SEQ ID NO:417)或其功能变体;
-CRE0079(SEQ ID NO:329)或其功能变体;
-CRE0051(SEQ ID NO:314)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;和
-CRE0020(SEQ ID NO:303)或其功能变体。
28.根据权利要求27所述的合成的心肌特异性CRM,其包含选自以下组的CRE或其功能变体的组合:CRE0020、CRE0029和CRE0071;CRE0020、CRE0069和CRE0071;CRE0029、CRE0035和CRE0071;CRE0020、CRE0020和CRE0071;CRE0020和CRE0071;CRE0079和CRE0071;CRE0035和CRE0071;CRE0029和CRE0071;CRE0035和CRE0036;CRE0069和CRE0051;CRE0069和CRE0071;CRE0035和CRE0031;CRE0035和CRE0035;CRE0079和CRE0035;CRE0020和CRE0036;CRE0069和CRE0035;CRE0029和CRE0071;CRE0071和CRE0035;CRE0035和CRE0020;CRE0029和CRE0035;CRE0035和CRE0036;CRE0020和CRE0035;以及CRE0071和CRE0020。
29.根据权利要求28所述的合成的心肌特异性CRM,或其功能变体,其中所述CRE以所述的顺序存在于所述CRM中并且优选地彼此相邻。
30.根据权利要求27至29中任一项所述的合成的心肌特异性CRM,其包含选自由以下组成的组的CRM:CRM_SP0229(SEQ ID NO:185)、CRM_SP0228(SEQ ID NO:184)、CRM_SP0328(SEQ ID NO:217)、CRM_SP0229A(SEQ ID NO:549)、CRM_SP0349(SEQ ID NO:236)、CRM_SP0230(SEQ ID NO:186)、CRM_SP0279(SEQ ID NO:198)、CRM_SP0366(SEQ ID NO:251)、CRM_SP0467(SEQ ID NO:527)、CRM_SP0332(SEQ ID NO:221)、CRM_SP0057(SEQ ID NO:145)、CRM_SP0159(SEQ ID NO:172)、CRM_SP0134(SEQ ID NO:161)、CRM_SP0322(SEQ IDNO:211)、CRM_SP0327(SEQ ID NO:216)、CRM_SP0345(SEQ ID NO:232)、CRM_SP0160(SEQ IDNO:173)、CRM_SP0350(SEQ ID NO:237)、CRM_SP0346(SEQ ID NO:233)、CRM_SP0231(SEQ IDNO:187)、CRM_SP0309(SEQ ID NO:202)、CRM_SP0368(SEQ ID NO:253)、CRM_SP0158(SEQ IDNO:171)、CRM_SP0338(SEQ ID NO:226)、CRM_SP0364(SEQ ID NO:249)、CRM_SP0468(SEQ IDNO:528)、CRM_SP0232(SEQ ID NO:188)、CRM_SP0156(SEQ ID NO:169)、CRM_SP0306(SEQ IDNO:200)、CRM_SP0453(SEQ ID NO:514)、CRM_SP0459(SEQ ID NO:520)、CRM_SP0163(SEQ IDNO:176)、CRM_SP0162(SEQ ID NO:175)、CRM_SP0307(SEQ ID NO:201)、CRM_SP0471(SEQ IDNO:530)、CRM_SP0458(SEQ ID NO:519)、CRM_SP0161(SEQ ID NO:174)、CRM_SP0464(SEQ IDNO:524)、CRM_SP0463(SEQ ID NO:523)、CRM_SP0465(SEQ ID NO:525)或其任何功能变体。
31.一种合成的肌肉特异性启动子,其包含:
a)根据权利要求18所述的肌肉特异性CRM;或
b)以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体,
可操作地连接至以下启动子元件中的至少一个:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
32.根据权利要求31所述的合成的肌肉特异性启动子,其中所述启动子在心肌和骨骼肌中具有活性并且包含:
a)根据权利要求19-22中任一项所述的CRM;或
b)以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;和
-CRE0031(SEQ ID NO:308)或其功能变体;
可操作地连接至选自以下的启动子元件:
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011(SEQ ID NO:291)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;
-CRE0046(SEQ ID NO:276)或其功能变体。
33.根据权利要求32所述的合成的心脏和骨骼启动子,其选自由以下组成的组:SP0160、SP0159、SP0057、SP0156、SP0173、SP0134、SP0147、SP0066、SP0158、SP0068、SP0164、SP0042、SP0149、SP0148、SP0132、SP0136、SP0153、SP0155、SP0051和SP0154,或其任何功能变体。
34.根据权利要求31所述的合成的肌肉特异性启动子,其中所述启动子在骨骼肌中具有活性并且其中所述启动子包含:
a)根据权利要求23-26中任一项所述的CRM;或
b)以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0050(SEQ ID NO:313)或其功能变体;
-CRE0020(SEQ ID NO:303)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;
-CRE0047(SEQ ID NO:312)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;和
-DES_MT_增强子_48bp(SEQ ID NO:547)或其功能变体。
可操作地连接至选自以下的启动子元件:
-CRE0049(SEQ ID NO:278)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-SKM_14(SEQ ID NO:287)或其功能变体;
-CRE0048(SEQ ID NO:277)或其功能变体;
-CRE0011_RSV(SEQ ID NO:291)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;和
-CRE0046(SEQ ID NO:276)或其功能变体。
35.根据权利要求34所述的合成的骨骼启动子,或其任何功能变体,其选自由以下组成的组:SP0155、SP0160、SP0156、SP0159、SP0164、SP0057、SP0158、SP0134、SP0146、SP0147、SP0148、SP0149、SP0165、SP0153、SP0051、SP0154,或其任何功能变体。
36.根据权利要求31所述的合成的肌肉特异性启动子,其中所述启动子在心肌特异性中具有活性并且其中所述启动子包含:
a)根据权利要求27-30中任一项所述的CRM;或
b)以下CRE中的至少一个:
-CRE0035(SEQ ID NO:310)或其功能变体;
-CRE0029(SEQ ID NO:307)或其功能变体;
-CRE0069(SEQ ID NO:320)或其功能变体;
-CRE0071(SEQ ID NO:321)或其功能变体;
-CRE0036(SEQ ID NO:311)或其功能变体;
-CRE0096(SEQ ID NO:417)或其功能变体;
-CRE0079(SEQ ID NO:329)或其功能变体;
-CRE0051(SEQ ID NO:314)或其功能变体;
-CRE0031(SEQ ID NO:308)或其功能变体;和
-CRE0020(SEQ ID NO:303)或其功能变体,
可操作地连接至选自以下的启动子元件:
-SKM_18(SEQ ID NO:135)或其功能变体;
-CRE0070(SEQ ID NO:284)或其功能变体;
-CRE0010_ITGB1BP2(SEQ ID NO:272)或其功能变体;
-CRE0037(SEQ ID NO:275)或其功能变体;
-CRE0046(SEQ ID NO:276)或其功能变体;和
-Des_mp_V1(SEQ ID NO:292)或其功能变体。
37.根据权利要求36所述的合成的心脏启动子,其选自由SP0326、SP0286、SP0451、SP0042、SP0362、SP0334、SP0343、SP0066、SP0440、SP0170、SP0347、SP0469、SP0068、SP0267、SP0132、SP0310、SP0365、SP0379、SP0339、SP0136、SP0325、SP0337、SP0270、SP0457、SP0268、SP0341、SP0378、SP0380、SP0262、SP0359、SP0455、SP0381、SP0441、SP0153、SP0442、SP0154、SP0155、SP0454、SP0456、SP0305、SP0382、SP0279、SP0320、SP0366、SP0467、SP0332、SP0057、SP0159、SP0134、SP0322、SP0257、SP0327、SP0345、SP0173、SP0160、SP0350、SP0346、SP0231、SP0309、SP0368、SP0158、SP0338、SP0364、SP0468、SP0232、SP0453、SP0340、SP0471、SP0229、SP0228、SP0328、SP0349、SP0230组成的组,或其任何功能变体。
38.一种表达盒,其包含根据权利要求1-5、8、11、14、17和31-37中任一项所述的合成的肌肉特异性启动子,其与编码表达产物的序列可操作地连接。
39.一种载体,其包含根据权利要求1-5、8、11、14、17和31-37中任一项所述的合成的肌肉特异性启动子或根据权利要求38所述的表达盒。
40.根据权利要求39所述的载体,其是AAV载体、腺病毒载体、逆转录病毒载体或慢病毒载体。
41.一种病毒体,其包含根据权利要求40所述的载体。
42.一种药物组合物,其包含根据权利要求1-5、8、11、14、17和31-37中任一项所述的合成的肌肉特异性启动子、根据权利要求38所述的表达盒、根据权利要求39或40所述的载体、或根据权利要求41所述的病毒体。
43.根据权利要求1-5、8、11、14、17和31-37中任一项所述的合成的肌肉特异性启动子、根据权利要求38所述的表达盒、根据权利要求39或40所述的载体、根据权利要求41所述的病毒体、或根据权利要求42所述的药物组合物用于治疗。
44.一种细胞,其包含根据权利要求1-5、8、11、14、17和31-37中任一项所述的合成的肌肉特异性启动子、根据权利要求38所述的表达盒、根据权利要求39或40所述的载体、根据权利要求41所述的病毒体。
45.根据权利要求1-5、8、11、14、17和31-37中任一项所述的合成的肌肉特异性启动子、根据权利要求38所述的表达盒、根据权利要求39或40所述的载体、根据权利要求41所述的病毒体或根据权利要求42所述的药物组合物用于制备用于治疗医学病况或疾病的药物组合物。
46.一种产生表达产物的方法,所述方法包括在肌肉细胞中提供根据权利要求38所述的合成的肌肉特异性表达盒并表达存在于所述合成的肌肉特异性表达盒中的基因。
47.一种在肌肉细胞中表达治疗性转基因的方法,所述方法包括将根据权利要求38所述的合成的肌肉特异性表达盒、根据权利要求39或40所述的载体、根据权利要求41所述的病毒体引入肌肉细胞。
48.一种治疗有需要的受试者,优选人的方法,所述方法包括:
向所述受试者施用根据权利要求38所述的表达盒、根据权利要求39或40所述的载体、根据权利要求41所述的病毒体或根据权利要求42所述的药物组合物,其包含编码治疗性产物的序列,所述序列与根据权利要求1-5、8、11、14、17和31-37中任一项所述的启动子可操作地连接;和
在所述受试者的肌肉中表达治疗量的治疗性产物。
49.根据权利要求48所述的治疗受试者的方法,其中所述治疗量的所述治疗性产物在骨骼肌和/或心肌中表达。
CN202080097425.2A 2019-12-24 2020-12-24 调节核酸序列 Pending CN115151646A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB1919269.9 2019-12-24
GBGB1919269.9A GB201919269D0 (en) 2019-12-24 2019-12-24 Regulatory nucleic acid sequences
GBGB2012192.7A GB202012192D0 (en) 2020-08-05 2020-08-05 Regulatory nucleic acid sequences
GB2012192.7 2020-08-05
PCT/GB2020/053371 WO2021130503A1 (en) 2019-12-24 2020-12-24 Regulatory nucleic acid sequences

Publications (1)

Publication Number Publication Date
CN115151646A true CN115151646A (zh) 2022-10-04

Family

ID=74130280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080097425.2A Pending CN115151646A (zh) 2019-12-24 2020-12-24 调节核酸序列

Country Status (10)

Country Link
US (1) US20230233710A1 (zh)
EP (1) EP4081643A1 (zh)
JP (1) JP2023509118A (zh)
KR (1) KR20220119703A (zh)
CN (1) CN115151646A (zh)
AU (1) AU2020412375A1 (zh)
CA (1) CA3161735A1 (zh)
IL (1) IL294238A (zh)
WO (1) WO2021130503A1 (zh)
ZA (1) ZA202207849B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024138812A1 (zh) * 2022-12-30 2024-07-04 广州派真生物技术有限公司 在哺乳动物肌肉中特异性启动基因的启动子序列及其应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022297795A1 (en) * 2021-06-23 2024-01-04 Asklepios Biopharmaceutical, Inc. Regulatory nucleic acid sequences
AR129122A1 (es) * 2022-04-22 2024-07-17 Spacecraft Seven Llc Terapia génica del gen de la proteína 2 del linfoma de células b asociado a atanogén 3 (bag3) mediante un vector aav

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102747082A (zh) * 2011-12-29 2012-10-24 华中农业大学 猪肌肉特异性itgb1bp2启动子及其应用
CN103074373A (zh) * 2011-10-26 2013-05-01 南京医科大学 肌肉组织特异性表达Follistatin以提高牛瘦肉率的转基因载体
US20170253927A1 (en) * 2016-03-01 2017-09-07 Washington State University Heritable epigenetic modifications as markers of chemotherapy exposure
CN108018311A (zh) * 2016-11-04 2018-05-11 中国科学院上海生命科学研究院 通过基因编辑特异靶向肌肉组织mstn治疗恶病质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
JP4445703B2 (ja) 2000-10-13 2010-04-07 ノバルティス バクシンズ アンド ダイアグノスティックス,インコーポレーテッド サイトメガロウイルスイントロンaフラグメント
US8106180B2 (en) 2003-08-07 2012-01-31 Whitehead Institute For Biomedical Research Methods and products for expression of micro RNAs
US20050142581A1 (en) 2003-09-04 2005-06-30 Griffey Richard H. Microrna as ligands and target molecules
US20050266552A1 (en) 2003-12-05 2005-12-01 Doench John G Reagents and methods for identification of RNAi pathway genes and chemical modulators of RNAi
KR100614827B1 (ko) 2004-05-06 2006-08-25 재단법인서울대학교산학협력재단 양방향 은닉 마코프 모델을 이용한 완숙한마이크로알엔에이 위치예측방법 및 이를 구현하기 위한컴퓨터 프로그램을 기록한 저장매체
EP2494058B1 (en) * 2009-10-29 2017-04-05 Vib Vzw Cardiac-specific nucleic acid regulatory elements and methods and use thereof
JP7162021B2 (ja) * 2017-03-17 2022-10-27 ニューカッスル ユニバーシティ 筋ジストロフィーを治療するためのマイクロジストロフィン断片のアデノ随伴ウイルスベクター送達

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103074373A (zh) * 2011-10-26 2013-05-01 南京医科大学 肌肉组织特异性表达Follistatin以提高牛瘦肉率的转基因载体
CN102747082A (zh) * 2011-12-29 2012-10-24 华中农业大学 猪肌肉特异性itgb1bp2启动子及其应用
US20170253927A1 (en) * 2016-03-01 2017-09-07 Washington State University Heritable epigenetic modifications as markers of chemotherapy exposure
CN108018311A (zh) * 2016-11-04 2018-05-11 中国科学院上海生命科学研究院 通过基因编辑特异靶向肌肉组织mstn治疗恶病质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
EUKARYOTA; METAZOA ET AL: "Homo sapiens Sharpr-MPRA regulatory region 4357 (LOC112067713) on chromosome 11", Retrieved from the Internet <URL:GENEBANK> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024138812A1 (zh) * 2022-12-30 2024-07-04 广州派真生物技术有限公司 在哺乳动物肌肉中特异性启动基因的启动子序列及其应用

Also Published As

Publication number Publication date
WO2021130503A1 (en) 2021-07-01
ZA202207849B (en) 2023-12-20
JP2023509118A (ja) 2023-03-07
IL294238A (en) 2022-08-01
US20230233710A1 (en) 2023-07-27
EP4081643A1 (en) 2022-11-02
AU2020412375A1 (en) 2022-06-30
CA3161735A1 (en) 2021-07-01
KR20220119703A (ko) 2022-08-30

Similar Documents

Publication Publication Date Title
JP7398279B2 (ja) Crispr/cas9核送達による細胞rnaの狙いを定めた編集
CN115151646A (zh) 调节核酸序列
JP7069426B2 (ja) ユートロフィン遺伝子を標的とした筋ジストロフィーの治療方法
CA3097857A1 (en) Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna
EP3129485A2 (en) Crispr/cas-related methods and compositions for treating cystic fibrosis
KR20210124969A (ko) 근이영양증의 치료를 위한 조합 요법
JP2008539698A (ja) 転写後レベルでの核酸発現調節のための方法および組成物
EP2871239A9 (en) Cell capable of producing adeno-associated virus vector
CA2925242A1 (en) Allele-specific rna silencing for the treatment of hypertrophic cardiomyopathy
CA3145309A1 (en) Rna-targeting knockdown and replacement compositions and methods for use
JP2022507402A (ja) 肝特異的ウイルスプロモーター及びその使用方法
US20240252682A1 (en) Hbb-modulating compositions and methods
JP2022513376A (ja) レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集
EP3746560A1 (en) Campaign-ready series of recombinant adeno-associated virus (raav) complementing plasmids
US20240084334A1 (en) Serpina-modulating compositions and methods
CN115044583A (zh) 用于基因编辑的rna框架和基因编辑方法
KR20240023643A (ko) 조절 핵산 서열
EP2486136B1 (en) Nucleic acid molecules and methods for exchanging exon(s) by transsplicing
EP4389899A1 (en) Regulatory nucleic acid sequences
CN117957326A (zh) 调控核酸序列
CN113227375A (zh) 合成的微小rna模拟物
WO2024060205A1 (zh) 包含基于小分子药物的可变剪接调节元件的核酸分子
US20240082429A1 (en) Pah-modulating compositions and methods
WO2023147558A2 (en) Crispr methods for correcting bag3 gene mutations in vivo
CN117402875A (zh) 利用rna剪接调节剂调控基因表达的核酸分子

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40081943

Country of ref document: HK