CN101213203A - 在转录后水平调节核酸表达的方法和组合物 - Google Patents

在转录后水平调节核酸表达的方法和组合物 Download PDF

Info

Publication number
CN101213203A
CN101213203A CNA2006800237538A CN200680023753A CN101213203A CN 101213203 A CN101213203 A CN 101213203A CN A2006800237538 A CNA2006800237538 A CN A2006800237538A CN 200680023753 A CN200680023753 A CN 200680023753A CN 101213203 A CN101213203 A CN 101213203A
Authority
CN
China
Prior art keywords
intron
rna
nucleotide sequence
nucleic acid
montage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800237538A
Other languages
English (en)
Inventor
R·J·萨穆尔斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of North Carolina at Chapel Hill
University of North Carolina System
Original Assignee
University of North Carolina at Chapel Hill
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of North Carolina at Chapel Hill filed Critical University of North Carolina at Chapel Hill
Publication of CN101213203A publication Critical patent/CN101213203A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • C12N2840/445Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor for trans-splicing, e.g. polypyrimidine tract, branch point splicing

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供分离的核酸,所述核酸包含:a)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和b)至少两个第二异源核苷酸序列,其中每个第二异源核苷酸序列都包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子。还提供使用本发明核酸调节转基因表达的方法。

Description

在转录后水平调节核酸表达的方法和组合物
相关申请
根据美国法典第35章第119(e)项,本申请要求于2005年4月29日提交的美国临时申请第60/676,139号的权益,该临时申请的完整内容在此引入作为参考。
发明领域
本发明涉及在转录后水平调节核酸表达的组合物及其使用方法。
发明背景
基因治疗的新近发展已燃起了经该方案有效治疗各种长期疾病的希望。但是,控制基因表达合乎安全和灵活治疗的需要已变得清晰起来。许多不同的调节系统已在基因治疗载体中进行了测试,并已被证实在体外和体内均调节基因表达,包括四环素效应系统、雷帕霉素调节的蛋白二聚化和许多其它系统。这些系统大部分起控制转录活化的功能,来源于内源哺乳动物基因调节途径或与转录活化结构域组合的药物响应元件的人工杂种。除转基因以外这些系统还需要表达一种或多种蛋白,并需要给予活化或抑制转录的外源药物或其它化合物。对于包装能力有限的基因治疗载体,如腺相关病毒(AAV)载体或逆转录病毒载体,掺入额外的基因可能限制转基因大小,或需要使用两种分开的载体,以传递所有的必需元件。尽管这些系统可用于有效地控制转录,但在许多情况下这些大系统不切实际或不实用。
以几种转录后水平调节内源基因表达,这几种转录后水平还可用于控制外源基因表达。RNA产生受到转录速率的控制,但功能性RNA需要正确剪接,然后可产生正确的基因产物。通过调节转基因RNA的剪接,可控制基因产物的产生。
针对基因治疗载体的免疫应答也已成为一个重要考虑因素,尤其是对于需要长期治疗的疾病而言。免疫系统不仅可对载体自身应答,而且可对载体产生的蛋白应答。因为许多最成功的调节系统包含杂种或外源蛋白,所以这些系统特别易于诱导免疫反应,已表明几个系统在啮齿动物和非人灵长类动物中诱导这样的免疫反应。
本发明通过提供用于控制基因表达而没有先前所述基因表达系统的缺陷的组合物和方法,克服了先前的本领域不足。
发明概述
本发明提供一种分离的核酸,其包含:A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和B)至少两个异源的第二核苷酸序列,其中每个异源的第二核苷酸序列包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子,其中所述异源的第二核苷酸序列选自:a)在所述第一核苷酸序列中串联的第二核苷酸序列,b)在所述第一核苷酸序列中相距至少25个碱基对的第二核苷酸序列,c)在所述第一核苷酸序列中相距至少50个碱基对的第二核苷酸序列,d)在所述第一核苷酸序列中相距至少75个碱基对的第二核苷酸序列,e)在所述第一核苷酸序列中相距至少100个碱基对的第二核苷酸序列,f)在所述第一核苷酸序列中相距至少200个碱基对的第二核苷酸序列,g)在所述第一核苷酸序列中相距至少300个碱基对的第二核苷酸序列,h)第二核苷酸序列,其中第一个(primary)第二核苷酸序列位于启动子和所述第一核苷酸序列之间,而第二个(secondary)第二核苷酸序列位于所述第一核苷酸序列中;和i)第二核苷酸序列,其中第一个第二核苷酸序列位于所述第一核苷酸序列中的可读框和聚腺苷酸尾或聚腺苷酸信号之间,而第二个第二核苷酸序列位于所述第一核苷酸序列的所述可读框中。
本文还提供一种分离的核酸,其包含:A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和B)至少一个第二异源核苷酸序列,其包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的内含子的第二组剪接元件,其中所述第二内含子通过剪接被去除,从而不产生RNA分子和/或在所述第二组剪接元件有活性时产生不赋予生物功能的第二RNA分子,其中第二核苷酸序列选自:a)SEQ IDNO:50(具有564CT突变的IVS2-654内含子);b)SEQ ID NO:51(具有657G突变的IVS2-654内含子);c)SEQ ID NO:52(具有658T突变的IVS2-654内含子);d)SEQ ID NO:20(具有657GT突变的IVS2-654内含子);e)SEQ ID NO:53(具有200bp缺失的IVS2-654内含子);f)SEQ ID NO:68(仅有197bp的IVS2-654内含子);g)SEQ ID NO:55(具有6A突变的IVS2-654内含子);h)SEQ ID NO:56(具有564C突变的IVS2-654内含子);i)SEQ ID NO:57(具有841A突变的IVS2-654内含子);j)SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQID NO:50(具有564CT突变的IVS2-654内含子)、SEQ ID NO:54(具有425bp缺失的IVS2-654内含子)、SEQ ID NO:69(仅有247bp的IVS2-654内含子)、SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQ ID NO:60(具有657G突变的IVS2-705内含子)、SEQ IDNO:61(具有658T突变的IVS2-705内含子)、SEQ ID NO:62(具有657GT突变的IVS2-705内含子)、SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)、SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)、SEQ ID NO:65(具有6A突变的IVS2-705内含子)、SEQ IDNO:66(具有564C突变的IVS2-705内含子)、SEQ ID NO:67(具有841A突变的IVS2-705内含子)及其任意组合。
本文另外提供一种生产蛋白的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生蛋白。
本文还提供一种生产赋予生物功能的RNA的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生赋予生物功能的RNA。
而且,本发明提供一种生产赋予生物功能的RNA的方法,该方法包括:a)使小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件的成员,导致第一内含子被去除,而产生第一RNA;和b)翻译第一RNA,从而产生赋予生物功能的RNA。
本文另外提供一种在受治疗者中调节赋予生物功能的异源RNA产生的方法,该方法包括:a)将本发明核酸导入到所述受治疗者中;和b)在期望异源RNA产生时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中的异源RNA产生。
在其它实施方案中,本发明提供一种在受治疗者中调节异源蛋白产生的方法,该方法包括:a)将本发明核酸导入到所述受治疗者中;和b)在期望异源蛋白产生时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中的异源蛋白产生。
本发明还提供一种鉴别化合物的方法,其中所述化合物封闭本发明核酸的第二组剪接元件成员,所述方法包括:a)使本发明核酸与所述化合物在允许剪接的条件下接触;和b)检测本发明第一RNA的产生和/或本发明第二RNA的产生,借此第一RNA的产生鉴别出封闭本发明核酸的第二组剪接元件成员的化合物。
本文还提供一种抑制赋予生物功能的异源RNA产生的方法,该方法包括:a)使小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
另外,本发明提供一种抑制异源蛋白产生的方法,该方法包括:a)使小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
在其它实施方案中,本发明提供一种抑制赋予生物功能的异源RNA产生的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
本发明另外提供一种抑制异源蛋白产生的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
本发明的前述和其它目标及方面在下文陈述的说明书中详细阐述。
附图简述
图1是本发明核酸构建物的一部分的示意图,显示了如本文所述基于外源寡核苷酸的存在与否调节萤光素酶序列表达的机制。
图2A-B显示了在门静脉注射1×1011个载体颗粒后体内的AAVLuc表达。在载体注射后1年和7天,经腹膜内注射施用25mg/kg LNA寡核苷酸(A ii;B在箭头处)。萤光素酶转基因活性使用实时成像(A)检测,并表示为随时间变化的光单位×106。B:寡核苷酸=菱形;无寡核苷酸=圆形。
图3显示了在寡核苷酸治疗后体内的AAT表达。小鼠肝脏用表达内含子调节的AAT编码序列盒的AAV载体转导,通过腹膜内注射(箭头)用0.625mg/200μl LNA寡核苷酸治疗该小鼠肝脏2天。通过血样的ELISA测定分析随时间变化的人AAT循环水平。
图4显示了基于加入不同突变至654突变体的萤光素酶表达变化。按照说明书使用QuickChangeTM定向诱变试剂盒(Stratagene),从而产生以下突变(编号基于距离IVS-654的5′剪接位点的碱基对数):6T变为A、564A变为C、564AA变为CT、657TA变为GT以及841C变为A。将新内含子克隆入萤光素酶cDNA中。用如本文所述的载体和寡核苷酸转染293细胞。
发明详述
本文使用的“a”、“an”或“the”可为单数或复数,取决于其应用范围。例如,“一种细胞”可指单一细胞,或者其可指许多细胞。
本文还使用的“和/或”指并包含一种或多种相关罗列项目的任意什么可能组合,以及在选择另一解释(“或”)时指并包括没有组合。
此外,本文使用的术语“约”在指可检测值(例如本发明组合物的量、剂量、时间、温度等)时,意味着包括指定量的±20%、±10%、±5%、±1%、±0.5%乃至±0.1%的偏差。
本发明基于以下出乎意料的发现:可以例如在体外以转录后水平调节核酸如外源核酸的表达。此调节基于与所述核酸相连的不同内含子的选择性剪接,该选择性剪接视在特定位点选择性封闭剪接活性的寡核苷酸、小分子和/或其它化合物的存在与否而定。因此,在一个实施方案中,本发明提供一种分离核酸,其包含以下几项、基本由以下几项组成和/或由以下几项组成:a)至少一个(例如1、2、3、4个或更多个)第一外源核苷酸序列,其编码目标异源核苷酸序列;和b)至少一个(例如2、3、4个或更多个)第二外源或异源核苷酸序列,其中每个第二外源或异源核苷酸序列包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子。
例如可由已知突变内含子系统获得的众多系统,可用于制备本发明的组合物和实施本发明的方法。例如,可使用引起某些地中海贫血的β-珠蛋白突变内含子(例如SEQ ID NO:58;SEQ ID NO:18;SEQID NO:19,有和/或没有本文所述的额外突变),(参见例如Suwanmanee等,“Restoration of human beta-globin gene expression in murine andhuman IVS2-654thalassemic erythroid cells by free uptake of antisenseoligonucleotides”Mol.Pharmacol.(2002)62:545-553,该文献整体在此引入作为参考)。其它系统包括囊性纤维化跨膜转导调节物(CFTR)基因的突变内含子(例如SEQ ID NO:70;SEQ ID NO:71,有和没有额外突变),(参见例如NCBI基因组功能注释的内部版本号36.1(built 36version)的核苷酸116907253-117095951,登录号NC_000007;Highsmith等,(1994)“A novel mutation in the cystic fibrosis gene inpatients with pulmonary disease but normal sweat chlorideconcentrations”New England Journal of Medicine 331:974-980,该文献整体在此引入作为参考)。
另外的系统包括肌养蛋白基因中的突变(SEQ ID NO:74;SEQ IDSNO:75,有和没有额外突变);(参见例如NCBI基因组功能注释的内部版本号36.1的核苷酸31047266-33267647,登录号NC_000023;Tuffery-Giraud等,(1999)“Point mutations in the dystrophin gene:evidence for frequent use of cryptic splice sites as a result of splicingdefects”Human Mutation 14:359-368;Aartsma-Rus等,(2004)“Antisense-induced multiexon skipping for Duchenne MuscularDystrophy makes more sense”American Journal of Human Genetics74:83-92;Chamberlain等,(1991)“PCR analysis of dystrophin genemutation and expression”J.Cell.Biochem.46:255-259;Mann等,(2001)“Antisense-induced exon skipping and synthesis of dystrophin in themdx mouse”Proc.Natl.Acad.Sci.USA 98:42-47;Lu等,(2003)“Functional amounts of dystrophin produced by skipping the mutatedexon in the mdx dystrophic mouse”Nat.Med.9:1009-1014;Kole等,(2004)“RNA modulation,repair and remodeling by splice switchingoligonucleotides”Acta Biochimica Polonica 51:373-378;以上所有文献都整体在此引入作为参考)。
可用于本发明方法和组合物的再一个系统是引起可变剪接缺陷的突变tau基因(例如SEQ ID NO:78);(参见例如Kalbfuss等,“Correction of alternative splicing in tau in frontotemporal dementia andParkinsonism linked to chromosome 17”J.Biol.Chem.276:42986-42993(2001);该文献整体在此引入作为参考),以及现在已知的或以后鉴别的产生剪接缺陷的任意其它这样的突变基因。还可按照一般技术人员众所周知的方法产生和检验导入可变剪接组的修饰型内含子。
在具体实施方案中,本发明提供一种分离的核酸,其包含:A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和B)至少两个第二异源核苷酸序列,其中每个第二异源核苷酸序列包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子,其中第二异源核苷酸序列选自:a)在所述第一核苷酸序列中串联的第二核苷酸序列,b)在所述第一核苷酸序列中相距至少25个碱基对的第二核苷酸序列,c)在所述第一核苷酸序列中相距至少50个碱基对的第二核苷酸序列,d)在所述第一核苷酸序列中相距至少75个碱基对的第二核苷酸序列,e)在所述第一核苷酸序列中相距至少100个碱基对的第二核苷酸序列,f)在所述第一核苷酸序列中相距至少200个碱基对的第二核苷酸序列,g)在所述第一核苷酸序列中相距至少300个碱基对的第二核苷酸序列,h)第二核苷酸序列,其中第一个第二核苷酸序列位于启动子和所述第一核苷酸序列之间,而第二个第二核苷酸序列位于所述第一核苷酸序列中;和i)第二核苷酸序列,其中第一个第二核苷酸序列位于所述第一核苷酸序列中的可读框和聚腺苷酸尾或聚腺苷酸信号之间,而第二个第二核苷酸序列位于所述第一核苷酸序列的所述可读框中。尽管这些是内含子间距离的具体实例,但要理解的是,两个或多个内含子可具有任意数量的碱基对来分隔它们,如本文所述的2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200个碱基对等。还要理解的是,本发明的第二核苷酸序列可包含如本文所述的任意组合的一个或多个突变。
在其它实施方案中,本发明提供一种分离的核酸,所述核酸包含:A)至少一个(例如1、2、3、4个或更多个)第一核苷酸序列,其编码目标异源核苷酸序列;和B)第二核苷酸序列,其包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的至少一个(例如1、2、3、4个或更多个)内含子的第二组剪接元件,其中与所述第一内含子不同的所述至少一个内含子通过剪接被去除,从而不产生RNA分子和/或在所述第二组剪接元件有活性时产生不赋予生物功能的第二RNA分子,其中第二核苷酸序列选自:a)SEQ ID NO:50(具有564CT突变的IVS2-654内含子);b)SEQ ID NO:51(具有657G突变的IVS2-654内含子);c)SEQ ID NO:52(具有658T突变的IVS2-654内含子);d)SEQ ID NO:20(具有657GT突变的IVS2-654内含子);e)SEQ IDNO:53(具有200bp缺失的IVS2-654内含子);f)SEQ ID NO:68(仅有197bp的IVS2-654内含子);g)SEQ ID NO:55(具有6A突变的IVS2-654内含子);h)SEQ ID NO:56(具有564C突变的IVS2-654内含子);i)SEQ ID NO:57(具有841A突变的IVS2-654内含子);j)SEQID NO:59(具有564CT突变的IVS2-705内含子);k)SEQ ID NO:60(具有657G突变的IVS2-705内含子);l)SEQ ID NO:61(具有658T突变的IVS2-705内含子);m)SEQ ID NO:62(具有657GT突变的IVS2-705内含子);n)SEQ ID NO:63(具有200bp缺失的IVS2-705内含子);o)SEQ ID NO:64(具有425bp缺失的IVS2-705内含子);p)SEQ IDNO:65(具有6A突变的IVS2-705内含子);q)SEQ ID NO:66(具有564C突变的IVS2-705内含子);r)SEQ ID NO:67(具有841A突变的IVS2-705内含子)及其任意组合,包括单独的序列。
第一核苷酸序列可编码,例如为任意组合的蛋白或肽、作为RNA具有酶活性的核苷酸序列(例如RNAi)、编码核酶的核苷酸序列、编码反义序列的核苷酸序列和/或小核RNA(snRNA)。而且,第一核苷酸序列可包含一种或多种突变,在某些实施方案中,这些突变可在限定剪接位点和/或调节剪接活性方面起作用。
还要理解的是,在本发明的分离核酸中,本发明的第一核苷酸序列和第二核苷酸序列在重复序列和/或交替序列(alternates)的任意组合方面可相同和/或不同。
本发明的第二核苷酸序列可为限定含一个或多个突变的内含子的核苷酸序列,所述突变的存在产生第一组剪接元件和第二组剪接元件。在某些实施方案中,第二核苷酸序列可为限定内含子-外显子-内含子区的序列,其中在内含子和/或外显子区任一个中的突变导致存在第一组剪接元件和第二组剪接元件。在该后一个实施方案中,当第二组剪接元件有活性时,结果是产生含内含子-外显子-内含子区的外显子的RNA。
本文还提供一种含本发明核酸的载体和含本发明核酸或载体的细胞。在某些实施方案中,载体可为但不限于非病毒载体、病毒载体和合成的生物纳颗粒。本发明病毒载体的非限制性实例包括AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。
本发明还提供使用本发明核酸的各种方法。因此,在某些实施方案中,本发明提供一种生产赋予生物功能的蛋白和/或RNA的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,从而产生第一RNA;和b)翻译第一RNA,从而产生蛋白和/或产生赋予生物功能的RNA。
本发明的封闭寡核苷酸和/或小分子和/或其它封闭化合物可导入到含本发明核酸的细胞中,此细胞可位于体外或如本文所述的本发明受治疗者(例如动物,其可为人)中。
在其它实施方案中,本发明提供一种生产赋予生物功能的蛋白和/或RNA的方法,该方法包括:a)使小分子与本发明的任一种核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件成员,导致第一内含子被去除,而产生第一RNA;和b)翻译第一RNA,从而产生产生赋予生物功能的蛋白和/或RNA。
另外,本发明提供一种在受治疗者中调节异源赋予生物功能的蛋白和/或RNA的产生的方法,该方法包括:a)将本发明核酸导入到受治疗者中;和b)在期望产生异源蛋白和/或RNA时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到受治疗者中,由此在所述受治疗者中调节RNA产生。
本文还提供筛选方法,例如鉴别化合物的方法,其中所述化合物封闭本发明核酸的第二组剪接元件的成员,所述方法包括:a)使本发明核酸与该化合物在允许剪接的条件下接触;和b)检测第一RNA的产生和/或第二RNA的产生,借此第一RNA的产生鉴别出封闭第二组剪接元件成员的化合物。
在本文描述的某些实施方案中,将转基因表达系统以OFF(关闭)位导入(例如受治疗者中),并与将所述系统转向ON(打开)位的本发明封闭寡核苷酸和/或小分子接触。本文还提供将以ON位导入(例如受治疗者中)的系统转向OFF位的方法,例如抑制异源赋予生物功能的蛋白和/或RNA的产生的方法,该方法包括:a)使封闭寡核苷酸和/或小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
内含子是介于真核DNA或RNA的编码部分或“外显子”之间的该DNA或RNA的一部分。内含子和外显子由DNA转录为RNA,称为“初级转录物、RNA前体”(或“前mRNA”)。内含子必须由前mRNA中去除,使得可产生由外显子编码的蛋白(本文使用的术语“蛋白”指天然蛋白、野生型蛋白或功能蛋白)。内含子由前mRNA中去除以及随后的外显子接合在剪接过程中进行。
剪接过程是在转录之后(即转录后)但在翻译前在RNA上进行的一系列由剪接因子介导的反应。因此,“前mRNA”是含外显子以及一个或多个内含子的RNA,“信使RNA(mRNA或RNA)”是已由其中去除了任意内含子的RNA,其中外显子随后接合在一起,使得可通过用核糖体翻译为功能蛋白或通过翻译为功能性RNA由外显子产生基因产物。
本文使用的术语“翻译”包括由核糖体引导的氨基酸链(例如肽或多肽)产生,核糖体沿着含编码氨基酸序列的密码子的信使RNA移动。本文使用的术语翻译还包括由编码RNA分子核苷酸序列的互补核苷酸序列(例如外显子)产生功能性RNA分子(例如核酶、反义RNA、RNAi、snRNA等)。
内含子的特征为一组“剪接元件”,它们是剪接机器的一部分,是剪接必需的。内含子是相对短的保守核酸区段,其结合进行剪接反应的各种剪接因子。因此,每个内含子都由5′剪接位点、3′剪接位点和位于它们之间的分支点限定。剪接元件还包含位于外显子中的外显子剪接增强子和沉默子,以及位于内含子中、与剪接位点和分支点有一段距离的内含子剪接增强子和沉默子。除了剪接位点和分支点以外,这些元件还控制可变剪接、异常剪接和组成型剪接。
按照本发明的实施方案,第一核苷酸序列可为但不限于任意组合的编码蛋白或肽的核苷酸序列、作为RNA具有酶活性的核苷酸序列(例如RNAi)、编码核酶的核苷酸序列、编码反义序列的核苷酸序列和/或编码小核RNA(snRNA)的核苷酸序列。
本文使用的术语“外源的”和/或“异源的”还可包括在包含其的核酸构建物和/或传递载体(例如病毒传递载体)中天然不存在的核苷酸序列,还可包括相对于其它核苷酸序列处于非天然环境和/或位置的核苷酸序列(例如通过与天然不与其相连的启动子或编码序列连接)。因此,在某些实施方案中,本发明的第一核苷酸序列可编码本发明的蛋白、肽和/或RNA,它们对待导入其中的细胞是外源的或异源的(即非天然的、不以天然状态存在的和/或修饰的和/或重复的)。第一核苷酸序列对其所置入的载体(例如病毒载体)而言也可为外源的或异源的。而且,第二核苷酸序列对其所置入的载体和/或相对于与其连接的作为内含子的第一核苷酸序列和/或相对于其所置入的细胞可为外源的或异源的。
或者,由第一核苷酸序列编码的蛋白、肽或RNA对细胞可为内源的(即其在该细胞中天然存在),但作为分离的核酸导入到细胞中和/或存在于细胞中。所述“分离的核酸”指大致上或基本上没有某些组分的核酸,这些组分一般被发现在其天然状态下与所述核酸结合。这些组分包括其它细胞材料、来自重组生产的培养基和/或在化学合成核酸时使用的各种化学物质。本发明的“分离的”核酸一般没有在该核酸所来源的生物体基因组DNA中邻接目标核酸的核酸序列(例如在5′或3′末端存在的编码序列)。但是,本发明的核酸可包括并不有害地影响核酸基本特征的一些额外碱基或部分。
所谓的本发明“分离的”蛋白或肽指基本上没有某些组分的蛋白或肽,这些组分一般被发现在其天然状态下与所述肽或蛋白结合。
赋予生物功能的本发明分子可为信使RNA、蛋白、肽、核酶、RNAi、snRNA、反义RNA等。因此,在某些实施方案中,赋予生物功能的RNA是被翻译成赋予生物功能的蛋白或肽的RNA,或者为被翻译成和/或直接用作如本文所述赋予生物功能的RNA的(例如核酶、RNAi、snRNA、反义RNA等)RNA。
本发明核酸的非限制性实例包括这样的核酸,其包含以下几项、基本由以下几项组成和/或由以下几项组成:任意组合的如SEQ IDNO:1(质粒TRCBA-int-luc突变型)、SEQ ID NO:2(质粒TRCBA-int-luc(野生型))、SEQ ID NO:3(质粒TRCBA-int-luc(657GT))、SEQ ID NO:4(质粒GL3-int-Luc(突变型))、SEQ ID NO:5(GL3-int-Luc(野生型))、SEQ ID NO:6(GL3-int-Luc(657GT))、SEQ ID NO:7(GL3-2int-fron-sph(突变型))、SEQ ID NO:8(GL3-3int-2fron-sph(突变型))、SEQ ID NO:9(GL3-int-Luc A(突变型))、SEQ ID NO:10(GL3-int-Luc B))、SEQ IDNO:11(GL3-int-Luc C)、SEQ ID NO:12(GL3-int-fron(突变型))、SEQID NO:13(GL3-2int-sph(突变型))、SEQ ID NO:14(GL3-2int-Sph-C)、SEQ ID NO:15(GL3-sint200-sph(突变型))、SEQ ID NO:16(GL3-sint200-sph(657GT))、SEQ ID NO:17(GL3-sint425-sph)和/或SEQ IDNO:35(TRCBA-int-AAT-654CT)陈述的核苷酸序列。
还提供如本文所述的这些序列的功能区的非限制性实例(例如SEQ ID NO:1-17的内含子和编码序列(即SEQ ID NO:21-34)、含654C-T突变的内含子(SEQ ID NO:18)、野生型内含子(SEQ IDNO:19)、含654C-T突变和657TA-GT突变的内含子(SEQ ID NO:20)以及SEQ ID NO:35的内含子和编码序列(SEQ ID NO:36)。因此,本发明的核酸可包含以下几项、基本上由以下几项组成和/或由以下几项组成:本文鉴别为第一核苷酸序列的一种或一种以上的核苷酸序列和/或其功能区。此第一核苷酸序列和/或功能区可以彼此相对和/或相对于核酸的其它组分和本发明的核酸构建物的任意组合(包括相同核苷酸序列的重复)、任意顺序和任意位置存在。
本发明核酸还可包含引导第一核苷酸序列表达的启动子。可包含在本发明核酸中并与本发明的第一核苷酸序列有效连接(operablyassocited)的启动子的实例包括但不限于组成型启动子和/或诱导型启动子,其一些非限制性实例包括病毒启动子(例如CMV、SV40)、组织特异性启动子(例如肌肉MCK)、心脏启动子(例如NSE)、眼启动子(例如MSK)和合成启动子(SP1元件)。本发明启动子的实例是如本文实施例中描述的鸡β肌动蛋白启动子(CB或CBA)。本发明的启动子可存在于本发明核酸上的任意位置,在该位置启动子与第一核苷酸序列有效连接。可相同或不同的一个或多个启动子可一起存在于同一核酸分子中,或者可彼此相对和/或相对于存在于核酸上的第一核苷酸序列和/或第二核苷酸序列定位在核酸分子上的不同位置。此外,内部核糖体进入信号(IRES)和/或其它核糖体通读元件可存在于该核酸分子上。一个或多个这样的IRES和/或核糖体通读元件可相同或不同,可一起存在于同一核酸分子中,和/或存在于核酸分子上的不同位置。当多个第一核苷酸序列存在于本发明的核酸分子上时,这样的IRES和核糖体通读元件可用于通过非帽依赖性机制来翻译信使RNA序列。
在其中启动子存在于本发明的分离核酸上的本发明实施方案中,启动子可相对于第一核苷酸序列和/或第二核苷酸序列定位于核酸分子中的任意位置。例如,第二核苷酸序列可位于启动子和第一核苷酸序列之间。此外,第二核苷酸序列可相对于第一核苷酸序列定位于核酸分子中的任意位置。例如,第二核苷酸序列可定位于第一核苷酸序列之前、之后和/或当中。在某些实施方案中,第二核苷酸序列可定位于第一核苷酸序列的5′1/3核苷酸中的任意位置、第一核苷酸序列的中间1/3核苷酸中的任意位置和/或第一核苷酸序列的3′1/3核苷酸中的任意位置。在某些实施方案中,第二核苷酸序列可定位于第一核苷酸序列的可读框和polyA位点之间的任意位置。
在其中两个或多个第二核苷酸序列存在于本发明分离核酸中的某些实施方案中,第二核苷酸序列可间隔至少约5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个核苷酸定位,包括本文未具体提及的5-1000之间的任意核苷酸数量。
本发明核酸分子的第二核苷酸序列可包含以下几项、基本由以下几项组成和/或由以下几项组成:限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和限定与第一内含子不同的第二内含子的第二组剪接元件,其中第二内含子通过剪接被去除,从而不产生RNA分子和/或在所述第二组剪接元件有活性时产生不赋予生物功能的第二RNA分子。在某些实施方案中,本发明的第二核苷酸序列可包含一个或多个突变,所述突变可为置换、添加、缺失等。
本发明的第二核苷酸序列的具体但非限制性的实例可包括但不限于SEQ ID NO:18-20、50-71、74、75和78中任一个的核苷酸。本发明的分离核酸的具体实例包括但不限于SEQ ID NO:1-17和21-36。本发明的封闭寡核苷酸的具体但非限制性的实例包括SEQ ID NO:37-49、72、73、76、79和80。
在本发明核酸中,第一内含子是功能性内含子,其通过剪接被去除,从而产生赋予生物功能的第一RNA分子。生物功能可在其中第一核苷酸序列为功能性RNA的实施方案中被直接赋予和/或通过将第一RNA分子翻译成赋予生物功能的蛋白、肽或RNA而被间接赋予。这样的生物功能可包括治疗作用,包括例如用于恢复和/或增加蛋白、肽和/或RNA的活性的基因治疗,而在其它情况下所述活性缺失和/或以不足或较低的量存在(例如修正导致疾病或障碍并对基因疗法之类的治疗有反应的遗传缺陷)。
如本文所述,当本发明核酸存在于其中可发生剪接的环境中且没有本发明的封闭分子或化合物的情况下,限定第二内含子的第二组剪接元件是有活性的,则第二内含子被去除,导致没有由该核酸产生第一RNA分子。当第二内含子被去除时,结果可为产生不赋予本发明的生物功能的第二RNA分子(即非功能性RNA)和/或根本不产生第二RNA分子。
本发明核酸的第二核苷酸序列可作为单个核苷酸序列存在于核酸分子上的任意位置,或者第二核苷酸序列可作为两个或多个可相同或不同的第二核苷酸序列存在于同一核酸分子上。因此,例如,第二核苷酸序列可以众多的两个或多个相同和/或不同的核苷酸序列存在,这些核苷酸序列可串联存在、分散于整个核酸分子中的不同位置和/或既一起(例如串联)又分散。
本发明核酸可存在于载体中,此载体可存在于细胞中。任意合适的载体都包含在本发明的实施方案中,包括但不限于非病毒载体(例如质粒、聚氧体(poloxymer)和脂质体)、病毒载体和合成生物纳颗粒(BNP)(例如由不同的腺相关病毒以及其它细小病毒综合设计)。
对本领域技术人员显而易见的是,可使用任意合适的载体来传递本发明的异源核酸。可基于本领域已知的众多因素对传递载体进行选择,所述因素包括目标宿主的年龄和物种、体外对体内传递、期望的表达水平和持续性、预期用途(例如用于治疗或多肽生产)、靶细胞或器官、传递途径、分离核酸的大小、安全性考虑,等等。
合适的载体还包括与核酸分子如质粒等一起使用的病毒载体(例如逆转录病毒、甲病毒、痘苗病毒、腺病毒、腺相关病毒或单纯疱疹病毒)、脂质载体、聚赖氨酸载体、合成多氨基聚合物载体。
本发明可使用本领域已知的任意病毒载体。此病毒载体的实例包括但不限于得自以下的载体:腺病毒科(Adenoviridae)、双RNA病毒科(Birnaviridae)、布尼亚病毒科(Bunyaviridae)、杯状病毒科(Caliciviridae)、细形病毒组(Capillovirus group)、香石竹潜病毒组(Carlavirus group)、香石竹斑驳病毒组(Carmovirus virus group)、花椰菜花叶病毒组(Group Caulimovirus)、长线形病毒组(ClosterovirusGroup)、鸭跖草黄化斑驳病毒组(Commelina yellow mottle virusgroup)、豇豆花叶病毒组(Comovirus virus group)、冠状病菌科(Coronaviridae)、PM2噬菌体组(PM2 phage group)、覆盖噬菌体科(Corcicoviridae)、潜隐病毒组(Group Cryptic virus)、隐病毒组(groupCryptovirus)、黄瓜花叶病毒组家族(Cucumovirus virus group Family)、[PHgr]6噬菌体组([PHgr]6phage group)、囊状噬菌体科(Cysioviridae)、香石竹环斑病毒组(Group Carnation ringspot)、香石竹病毒组(Dianthovirus virus group)、蚕豆枯萎病毒组(Group Broad bean wilt)、蚕豆病毒组(Fabavirus virus group)、线状病毒科(Filoviridae)、黄病毒科(Flaviviridae)、真菌传杆状病毒组(Furovirus group)、联体病毒组(Group Germinivirus)、贾第鞭毛虫病毒组(Group Giardiavirus)、嗜肝DNA病毒科(Hepadnaviridae)、疱疹病毒科(Herpesviridae)、大麦病毒组(Hordeivirus virus group)、等轴不稳定环斑病毒组(Illarvirus virusgroup)、丝杆噬菌体科(Inoviridae)、虹彩病毒科(Iridoviridae)、轻小噬菌体科(Leviviridae)、脂毛噬菌体科(Lipothrixviridae)、黄症病毒组(Luteovirus group)、玉米雷亚朵非罗病毒组(Marafivirus virus group)、玉米退绿病矮小病毒组(Maize chlorotic dwarf virus group)、微小噬茵体科(icroviridae)、肌尾噬菌体科(Myoviridae)、坏死病毒组(Necrovirusgroup)、线虫传多面体病毒组(Nepovirus virus group)、野田村病毒科(Nodaviridae)、正粘病毒科(Orthomyxoviridae)、乳头多瘤空泡病毒科(Papovaviridae)、副粘病毒科(Paramyxoviridae)、欧防风黄点病毒组(Parsnip yellow fleck virus group)、双组分双链RNA球状真菌病毒科(Partitiviridae)、细小病毒科(Parvoviridae)、豌豆耳突花叶病毒组(Peaenation mosaic virus group)、藻类DNA病毒科(Phycodnaviridae)、小RNA病毒科(Picornaviridae)、芽生噬菌体科(Plasmaviridae)、短尾病毒科(Prodoviridae)、多DNA病毒科(Polydnaviridae)、马铃薯X病毒组(Potexvirus group)、马铃薯Y病毒组(Potyvirus)、痘病毒科(Poxviridae)、呼肠孤病毒科(Reoviridae)、逆转录病毒科(Retroviridae)、弹状病毒科(Rhabdoviridae)、根前毛菌噬菌体组(GroupRhizidiovirus)、长尾噬菌体科(Siphoviridae)、南方菜豆花叶病毒组(Sobemovirus group)、SSV 1-型噬菌体(SSV 1-Type Phages)、复层噬菌体科(Tectiviridae)、纤细病毒属(Tenuivirus)、四体病毒科(Tetraviridae)、烟草花叶病毒组(Group Tobamovirus)、烟草脆裂病毒组(Group Tobravirus)、披膜病毒科(Togaviridae)、番茄丛矮病毒组(Group Tombusvirus)、环曲病毒属(Group Torovirus)、单组分双链RNA球状真菌病毒科(Totiviridae)、芜菁黄化花叶病毒组(Group Tymovirus)和植物卫星病毒(Plant virus satellites)。
产生重组病毒载体的方法和使用病毒载体进行核酸传递的方法可见于例如Current Protocols in Molecular Biology,Ausubel,F.M.等(编辑)Greene Publishing Associates,(1989)和其它标准实验室指引(例如Vectors for Gene Therapy.载于:Current Protocols in Human Genetics.John Wiley and Sons,Inc.1997)。
用于本发明方法的载体的非限制性实例包括用于传递核酸至细胞中的任意核苷酸构建物,例如质粒、非病毒载体或病毒载体,如可包装重组逆转录病毒基因组的逆转录病毒载体(参见例如Pastan等,Proc.Natl.Acad.Sci.U.S.A.85:4486(1988);Miller等,Mol.Cell.Biol.6:2895(1986))。例如,重组逆转录病毒可用于感染,并由此传递本发明核酸至感染细胞。将改变型核酸导入到哺乳动物细胞中的确切方法当然不限于使用逆转录病毒载体。其它技术普遍可用于该程序,包括使用腺病毒载体(Mitani等,Hum.Gene Ther.5:941-948,1994)、腺相关病毒(AAV)载体(Goodman等,Blood 84:1492-1500,1994)、慢病毒载体(Naldini等,Science 272:263-267,1996)、假型逆转录病毒载体(Agrawal等,Exper.Hematol.24:738-747,1996),以及目前已知或以后鉴别的任意其它载体系统。还包括本领域众所周知的嵌合病毒颗粒,其可包含来自两种或多种不同病毒的任意组合的病毒蛋白和/或核酸,以产生功能性病毒载体。本发明的嵌合病毒颗粒还可包含非病毒来源的氨基酸序列和/或核苷酸序列(例如有利于将载体靶向特定细胞或组织和/或诱导特异性免疫应答)。本发明还提供“靶向”病毒颗粒(例如含细小病毒壳体和重组AAV基因组的细小病毒载体,其中外源靶向序列已插入或替换入细小病毒壳体中)。
还可使用物理转导技术,例如脂质体传递以及受体介导的和其它的胞吞机制(参见例如Schwartzenberger等,Blood 87:472-478,1996)。本发明可与这些和/或其它常用核酸转移方法中的任一种联合使用。合适的转染工具,包括病毒载体、化学转染剂或物理-机械方法(如电穿孔)以及DNA直接扩散,描述于例如Wolff等,Science247:1465-1468,(1990);和Wolff,Nature 352:815-818,(1991)。
因此,可通过众多周知方法中的任一种实现本发明核酸的施用,这些方法例如但不限于直接转移核酸、在质粒或病毒载体中或者经由在细胞中或与诸如阳离子脂质体的载体组合转移。这样的方法在本领域众所周知,可容易地适用于本文描述的方法。而且,这些方法可利用载体的靶向特性用于靶向某些疾病和组织、器官和/或细胞类型和/或群体,这些载体应当是技术人员众所周知的。还要充分理解的是,可在本发明核酸中使用细胞和组织特异性启动子,以靶向特定组织和细胞和/或治疗特定疾病和障碍。
含本发明载体和/或核酸的细胞可为可包含本发明载体和/或核酸的任意细胞,包括但不限于得自肌肉(例如平滑肌、骨骼肌、心肌肌细胞)、肝脏(例如肝细胞)、心脏、脑(例如神经元)、眼(例如视网膜、角膜)、胰腺、肾、内皮、上皮、干细胞(例如骨髓、脐血)、组织培养细胞(例如HeLa细胞)等的细胞,它们是本领域众所周知的。
在某些实施方案中,在与其它基因表达调节系统相比时,本发明核酸具有降低水平的“泄漏性”。所谓“泄漏性”指系统处于“off”位时产生的基因产物或功能性RNA的量。例如,在本文描述的某些实施方案中,当本发明的核酸没有与本发明的封闭寡核苷酸、小分子和/或其它化合物接触时,给出的系统处于“off”位,因此,第一内含子不被剪接。泄漏性可以是这些调节系统中固有的问题,但在所给出系统的某些实施方案中,泄漏性水平可低于本领域已知的系统。因此,本发明还提供一种基因表达调节系统,其具有的泄漏性比其它基因表达调节系统低,其中所述系统包含本发明核酸和/或本发明载体。与其它系统相比,在所给出系统中泄漏性降低的程度可比在本领域已知系统中观察到的泄漏量低5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100%。
作为一个实例,可通过在系统中使用报告基因并检测系统处于“OFF”位时产生的报告基因产物量来测定系统的泄漏量。可使用众多测定来检测报告基因产物,包括但不限于蛋白检测实验,如ELISA和蛋白质印迹分析,以及核酸检测实验,例如聚合酶链反应、DNA印迹分析和RNA印迹分析。检测基因产物的其它实验可包括功能性测定,例如检测因基因产物引起的生物活性量。本发明的核酸和方法可用于对比性实验,以证实与其它已知基因调节表达系统和其中使用的核酸相比泄漏性水平降低。
本文还提供使用本发明核酸、载体和细胞的各种方法。具体地说,本文提供一种产生本发明的第一RNA的方法,该方法包括:a)使本发明的封闭寡核苷酸和/或小分子和/或其它化合物与本发明核酸在允许剪接的条件下接触,其中封闭寡核苷酸和/或小分子和/或其它化合物封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,而产生第一RNA。
另外提供一种生产蛋白的方法,该方法包括:a)使本发明的封闭寡核苷酸和/或小分子和/或其它化合物与本发明核酸在允许剪接的条件下接触,这些条件在本领域应当是众所周知的,在本文提供的实施例中有描述,其中封闭寡核苷酸封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生蛋白。
在其它实施方案中,提供一种产生赋予生物功能的RNA的方法,该方法包括:a)使本发明的封闭寡核苷酸和/或小分子和/或其它化合物与本发明核酸在允许剪接的条件下接触,其中封闭寡核苷酸和/或小分子和/或其它化合物封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生赋予生物功能的RNA。在某些实施方案中,第一RNA可直接用作赋予生物功能的RNA,在其它实施方案中,第一RNA可被翻译为赋予生物功能的RNA。
在本文描述的任一种方法中,本发明的封闭寡核苷酸和/或小分子和/或其它化合物可被导入到含本发明核酸的细胞中,这样的细胞可处于动物中,所述动物可为人、非人哺乳动物(狗、猫、马、母牛等)或其它动物。
本发明的封闭寡核苷酸是阻止特定剪接位点的剪接活性的寡核苷酸(例如RNA或DNA或二者的组合)。剪接活性被阻止的原因在于封闭寡核苷酸结合作为引导剪接事件的剪接元件组成员的核苷酸序列,由此抑制剪接元件活性,导致剪接活性被抑制。因此,封闭寡核苷酸可与剪接界(splice junction)、5′剪接元件、3′剪接元件、隐蔽剪接元件、分支点、隐蔽分支点、天然剪接元件、突变型剪接元件等互补。本发明的封闭寡核苷酸的一些非限制性实例包括对β珠蛋白内含子的654T突变特异性的GCTATTACCTTAACCCAG(SEQ IDNO:37)和对β珠蛋白内含子的657GT突变特异性的GCACTTACCTTAACCCAG(SEQ ID NO:38)。其它实例包括含以下几项、基本由以下几项组成和/或由以下几项组成的寡核苷酸:SEQ IDNO:37、38、42、49、46、47、48、39、40、41、43、44、45、72、73、76、79和80的核苷酸序列。至于在这些寡核苷酸序列背景下的“基本由……组成”,意指寡核苷酸可在寡核苷酸序列的3′末端或5′末端包括额外核苷酸(例如1、2、3、4、5、6、7、8、9或10个额外核苷酸),这些额外核苷酸并不显著地影响寡核苷酸的功能或活性(例如这些额外的核苷酸不与原寡核苷酸序列的互补性序列杂交)。
在其中封闭寡核苷酸用于本发明方法的方法中,封闭寡核苷酸在某些实施方案中可为不活化RNA酶H的寡核苷酸。不活化RNA酶H的寡核苷酸可按照已知技术制备。参见例如Pederson等的美国专利第5,149,797号。这样的寡核苷酸可为脱氧核糖核苷酸序列或核糖核苷酸序列,包含在空间上阻碍或防止RNA酶H与含所述寡核苷酸作为其一员的双链分子结合的任意结构修饰,该结构修饰基本上不阻碍或破坏双链形成。因为参与双链形成的寡核苷酸部分与参与和RNA酶H结合的那些部分显著不同,所以可获得众多不活化RNA酶H的寡核苷酸。
本发明的寡核苷酸还可为其中至少一个或全部核苷酸间桥接磷酸酯残基为修饰型磷酸酯的寡核苷酸,所述修饰型磷酸酯例如为甲基磷酸酯、甲基硫代磷酸酯、吗啉代磷酸酯(phosphoromorpholidates)、哌嗪代磷酸酯(phosphoropiperazidates)和氨基磷酸酯。作为另一个实例,每隔一个核苷酸间桥接磷酸酯残基可如所述修饰。在另一个非限制性实例中,此寡核苷酸为其中至少一个或全部核苷酸包含2′低级烷基部分(例如C1-C4直链或支链的饱和或不饱和烷基,例如甲基、乙基、乙烯基、丙基、1-丙烯基、2-丙烯基和异丙基)的寡核苷酸。例如,每隔一个核苷酸可如所述修饰。(另参见Furdon等,Nucleic AcidsRes.17:9193-9204(1989);Agrawal等,Proc.Natl.Acad.Sci.USA87:1401-1405(1990);Baker等,Nucleic Acids Res.18,3537-3543(1990);Sproat等,Nucleic Acids Res.17:3373-3386(1989);Walder和Walder,Proc.Natl.Acad.Sci.USA 85:5011-5015(1988))。因此,在某些实施方案中,本发明的封闭核苷酸可包含修饰型核苷酸间桥联磷酸酯残基,后者可为但不限于任意组合的甲基硫代磷酸酯、吗啉代磷酸酯、哌嗪代磷酸酯和/或氨基磷酸酯。在某些实施方案中,封闭寡核苷酸可包含在其2′位具有低级烷基取代基的核苷酸。
本发明的修饰型寡核苷酸的额外实例包括肽核酸(PNA)和锁定核酸(LNA)。
在PNA中,主链由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元组成。不同的碱基(嘌呤和嘧啶)通过亚甲羰基键连接至主链。与DNA或其它DNA类似物不同,PNA不包含任何戊糖部分或磷酸酯基团。PNA被描述为类似在第一个(左侧)位置具有N-末端和在右侧具有C-末端的肽。
PNA主链不带电,这赋予该聚合物在PNA/DNA链之间比PNA链之间和DNA链之间更强的结合。这是由于在PNA和DNA链之间没有电荷排斥。
采用同型嘧啶链的早期实验已表明,6聚体PNA T/DNA dA的Tm经测定为31℃,相比之下DNA dT/DNA dA 6聚体双链体在低于10℃的温度变性。
具肽主链并携带嘌呤和嘧啶碱基的PNA不是容易被核酸酶或蛋白酶识别的分子类别。因此,它们抗酶降解。PNA还在广泛的pH范围内稳定。因为它们不容易被酶降解,所以这些聚合物的寿命在体外和体内均延长。另外,它们不带电的事实有利于其穿过细胞膜,其较强的结合特性应降低调节基因表达所需的寡核苷酸量。
LNA是一类含核苷的核酸,其主要的区别特征是在核糖环的2′-O和4′-C原子之间存在亚甲基桥。该桥限制了核苷酸类似物的呋喃核糖环的屈曲性,并将其锁成刚性的双环N-型构象。而且,LNA诱导邻近的DNA碱基采用该构象,导致形成热动力学更稳定形式的A双链体LNA核苷,其包含出现在DNA中的4种普通核苷碱基(nucleobase)(A、T、G、C),这些碱基可按照标准Watson-Crick法则与其互补核苷配对。可使用标准亚磷酰胺DNA合成化学法使LNA与DNA或RNA以及其它核酸类似物混合。因此,LNA寡核苷酸可容易地用例如氨基接头、生物素、荧光团等标记。因此,在设计引物和探针方面存在非常高的自由度。其锁定构象增加了对互补序列的结合亲和力,提供了优化和精调用于核酸的敏感性和特异性检测的引物和探针的新化学方法。该差异可经实验作为LNA-NA杂双链体的热稳定性增加而观察到,取决于序列中存在的LNA核苷数以及使用的核苷碱基的化学性质这二者。该实验差异可用于调节寡核苷酸探针的特异性,其中所述探针设计用于通过标准杂交技术检测特定核酸靶。
本文使用的“第二组剪接元件成员”包括参与活化第二内含子的剪接的任意元件。例如,第二组剪接元件元件可为天然DNA和/或前mRNA中的突变结果,所述突变可为产生新剪接元件的置换突变和/添加突变和/或缺失突变。因此,新剪接元件是限定第二内含子的第二组剪接元件的一员。第二组剪接元件的其余成员还可为限定第一内含子的剪接元件组成员。例如,如果突变产生新的第二个3′剪接位点,该位点既位于第一个3′剪接位点的上游(即5′),也位于第一个分支点的下游(即3′),则第一个5′剪接位点和第一个分支点可同时用作第一组剪接元件成员和第二组剪接元件成员。
在某些情况下,导入第二组剪接元件可使一般静息或不起剪接元件作用的RNA天然区被活化,而用作剪接元件。这样的元件称为“隐蔽”元件。例如,如果导入位于第一个3′剪接位点和第一个分支点之间的新3′剪接位点,则其可活化新3′剪接位点和第一个分支点之间的隐蔽分支点。
在其它情况下,导入位于第一个分支点和第一个5′剪接位点之间的新5′剪接位点,还可活化顺序地位于新5′剪接位点上游的隐蔽3′剪接位点和隐蔽分支点。在此情况下,第一内含子被分为两个异常内含子,新外显子位于它们之间。
此外,在其中第一个剪接元件(特别是分支点)也是第二个剪接元件组成员的某些情况下,有可能封闭第一个元件,并活化隐蔽元件(即隐蔽分支点),该隐蔽元件将募集第一组剪接元件的其余成员,以迫使正确的剪接超过不正确的剪接。还要指出的是,在隐蔽剪接元件被活化时,其可位于任一个内含子中和/或邻近的一个外显子中。
因此,如上所示,根据组成“第二组剪接元件”的剪接元件组,本发明的封闭寡核苷酸、小分子和/或其它化合物可封闭各种不同的剪接元件,以实施本发明。例如,其可封闭突变元件、隐蔽元件、天然元件、5′剪接位点、3′剪接位点和/或分支点。一般来说,其将不封闭还限定第一内含子的剪接元件,当然要考虑到如上所论述的情况:封闭第一内含子的剪接元件活化隐蔽元件,然后隐蔽元件用作第一组剪接元件的替代成员,并参与正确剪接。
封闭寡核苷酸的长度(即其中核苷酸的数量)并不关键,只要其选择性结合至预期位置,并可按照常规程序测定。因此,在某些实施方案中,本发明的封闭寡核苷酸可为约5个至约100个核苷酸长。具体地说,本发明的封闭寡核苷酸可为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个核苷酸长。在某些实施方案中,本发明的封闭寡核苷酸为8-50个核苷酸长。在本发明的其它实施方案中,封闭寡核苷酸为15-25个核苷酸长,还可为18-20个核苷酸长。封闭寡核苷酸可作为相同寡核苷酸群和/或彼此之间以任意组合和/或任意比率存在的不同寡核苷酸群用于本文所述方法。
本发明的小分子是与其它小分子相比在结构上和/或功能上不同的活性化合物,其具有低分子量(例如≤5000道尔顿)。小分子可为天然或合成物质。它们可通过有机化学方法合成,和/或由天然来源如植物、真菌和微生物分离。小分子可为“药物样的”(例如阿司匹林、青霉素、化疗剂)、有毒的和/或天然的。小分子药物可为一种或多种活性化合物,通常配制为口服使用的丸剂,其与特定生物靶如受体、酶或离子通道相互作用,以提供疗效。本发明小分子的具体但非限制性的实例包括抗生素、核苷类似物(例如丰加霉素)和适体(例如RNA适体;DNA适体)。
本发明的小分子可为存在于大量小分子文库中的小分子,其中一些是商品化的。可包含本发明小分子的文库的非限制性实例包括由各个商业机构获得的小分子文库,这些商业机构例如为SPECS和BioSPEC B.V.(Rijswijk,the Netherlands)、Chembridge Corporation(SanDiego,CA)、Comgenex USA Inc.(Princeton,NJ)、Maybridge ChemicalLtd.(Cornwall,UK)和Asinex(Moscow,Russia)。一个代表性实例称为DIVERSetTM,得自ChemBridge Corporation,16981 Via Tazon,Suite G,San Diego,Calif.92127。DIVERSetTM包含10,000-50,000个人工合成的药物样小分子。预选择化合物,以形成用最少量的化合物覆盖最大药效团多样性并适于高通量或低通量筛选的“通用”文库。有关其它文库的描述,参见例如Tan等,“Stereoselective Synthesis of OverTwo Million Compounds Having Structural Features Both Reminiscent ofNatural Products and Compatible with Miniaturized Cell-Based Assays”Am.Chem Soc.120,8565-8566,1998;Floyd等,Prog Med Chem 36:91-168,1999。众多文库是商品化的,例如来自AnalytiCon USA Inc.P.O.Box 5926,Kingwood,Tex.77325;3-Dimensional Pharmaceuticals,Inc.665 Stockton Drive,Suite 104,Exton,Pa.19341-1151;Tripos,Inc.1699Hanley Rd.St.Louis,Mo.63144-2913,等等。
本发明的小分子和其它化合物可通过各种机制操作,以改变本发明核酸中的剪接事件。例如,本发明的小分子和其它化合物可干涉剪接复合物、剪接体及其组分如hnRNP、snRNP、SR-蛋白和其它剪接因子或元件的形成和/或功能和/或其它特性,导致阻止和诱导前-mRNA分子中的剪接事件。作为另一个实例,本发明的小分子和其它化合物可阻止和/或改变基因产物的转录,所述基因产物可包括例如但不限于hnRNP、snRNP、SR-蛋白和其它剪接因子,它们随后参与特定剪接体的形成和/或功能。本发明的小分子和其它化合物还可阻止和/或改变基因产物的磷酸化、糖基化和/或其它修饰,所述基因产物包括但不限于hnRNP、snRNP、SR-蛋白和其它剪接因子,它们随后参与特定剪接体的形成和/或功能。另外,本发明的小分子和其它化合物可结合和/或要不然影响特定前mRNA,使得特定剪接事件经某种机制被阻止或诱导,该机制不包括以序列特异性方式与RNA碱基配对。
本发明还提供一种在受治疗者中产生赋予生物功能的蛋白和/或RNA的方法,该方法包括:a)将本发明的核酸、载体和/或细胞导入受治疗者中;和b)将封闭第二组剪接元件成员的本发明的封闭寡核苷酸和/或小分子和/或其它化合物导入受治疗者中,由此在受治疗者中产生赋予生物功能的蛋白和/或RNA。
另外提供一种在受治疗者中调节赋予生物功能的蛋白和/或RNA的产生的方法,该方法包括:a)将本发明的核酸、载体和/或细胞导入受治疗者中;和b)在期望产生所述蛋白和/或RNA时将封闭第二组剪接元件成员的本发明的封闭寡核苷酸和/或小分子和/或其它化合物导入受治疗者中,由此在受治疗者中调节该蛋白和/或RNA的产生。可按照本领域已知方法监测随时间变化的存在于受治疗者中的蛋白和/或RNA的量,当该量落在期望水平和/或治疗水平之下时,可将封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中,以增加蛋白和/或RNA的产生,由此调节所述产生。
在其中将本发明的核酸、载体和/或细胞施用给受治疗者的本文所述方法中,所述核酸、载体和/或细胞最初可在没有封闭寡核苷酸和/或小分子和/或其它化合物的情况下存在于受治疗者中,该封闭寡核苷酸和/或小分子和/或其它化合物的存在会导致封闭第二组剪接元件成员。在此状况下,第二组剪接元件有活性,由第一核苷酸序列编码的、赋予生物功能的外源蛋白、肽和/或RNA在受治疗者中没有产生或产生非常少(不显著)。当本发明的封闭寡核苷酸、小分子和/或其它化合物存在于受治疗者中时,核酸上的第二组剪接元件成员被封闭,导致通过剪接去除第一内含子,随后在受治疗者中产生由第一核苷酸序列编码的、赋予生物功能的蛋白和/或RNA。
可在相对于将本发明的核酸、载体和/或细胞导入受治疗者中的任意时刻将封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中。例如,可在将所述核酸、载体和/或细胞导入受治疗者中之前、同时和/或之后将封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中。而且,封闭寡核苷酸、小分子和/或其它化合物可以任意时间间隔一次或多次施用,并可扩展至受治疗者的整个生命期。
因此,在某些实施方案中,本发明提供一种在受治疗者中治疗疾病或障碍的方法,该方法包括:a)将有效量的本发明核酸、载体和/或细胞导入受治疗者中;和b)将有效量的本发明封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中,由此在所述受治疗者中治疗疾病。当核酸、载体和/或细胞以及封闭寡核苷酸、小分子和/或其它化合物存在于受治疗者中时,它们在某些条件下存在,借助于这些条件,封闭寡核苷酸、小分子和/或其它化合物可接触核酸,并封闭第二组剪接元件成员,由此导致在受治疗者中产生蛋白、肽和/或赋予生物功能的RNA。
在本发明的另外实施方案中,依据本发明方法的基因表达调节可与本文描述的系统相反发生。具体地说,在本发明的某些实施方案中,在没有调节剪接介导的表达(例如不产生第一RNA,导致产生蛋白、肽和/或赋予生物功能的RNA)的封闭寡核苷酸、小分子和/或其它化合物的情况下,所述系统处于本文所述的“OFF”位。在某些其它实施方案中,在没有调节剪接介导的表达的封闭寡核苷酸、小分子和/或其它化合物的情况下,本发明的系统可处于“ON”位。在后面的这些实施方案中,可实施本发明的方法,由此在导致第一内含子被去除而产生第一RNA的条件下存在的本发明的核酸、载体和/或细胞与本发明的封闭寡核苷酸、小分子和/或其它化合物接触,导致封闭第一组剪接元件成员,由此导致第二内含子被剪接和去除,从而未产生第二RNA分子和/或产生不赋予生物功能的第二RNA分子。
本发明的核酸、载体、细胞、封闭寡核苷酸、小分子和/或其它化合物的“有效量”指无毒但足以提供期望作用的量,所述期望作用可为有益作用或治疗性作用。本领域众所周知,需要的确切量将在受治疗者之间变化,取决于受治疗者的年龄、性别、物种、身体状况、要治疗的病症的严重性、要施用的具体药剂等。在任意个体情况中适宜的“有效量”可由本领域一般技术人员参照相关教科书和文献(例如Remington′s Pharmaceutical Sciences(最新版)和/或使用常规药理学方法确定。
本文使用的“治疗”指给予受治疗者利益的任意治疗类型,其中所述受治疗者被诊断为患有疾病或障碍、处于疾病或障碍的风险之中、疑似患有和/或可能患有疾病或障碍,所述疾病或障碍以积极方式对本发明的蛋白和/或RNA起反应。利益可包括受治疗者身体状况(例如一种或多种症状)的改善、病症演进的延迟和/或逆转、疾病或障碍发作的预防或延迟,等等。
如本文所指出的,本发明提供一种治疗本发明的障碍或疾病的方法,该方法包括:a)将有效量的本发明核酸导入受治疗者中;和b)将有效量的本发明封闭寡核苷酸和/或小分子导入受治疗者中,由此治疗受治疗者中的障碍或疾病。
可通过本发明方法治疗的疾病或障碍可包括对治疗有响应的任意疾病或障碍,所述治疗包括在受治疗者中存在本发明的蛋白、肽和/或赋予生物功能的RNA和/或它们的量增加。这样的蛋白、肽和/或RNA可通过将本发明的核酸、载体和/或细胞导入到受治疗者中以及将本发明的封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中而存在于受治疗者中。
可通过本发明方法治疗的疾病和/或障碍的非限制性实例以及可由本发明的第一个核苷酸序列编码并可赋予治疗性作用的基因产物的一些实例包括:代谢性疾病,例如糖尿病(胰岛素)、生长/发育障碍(生长激素、调节生长因子的锌指蛋白)、凝血障碍(例如血友病A(VIII因子)、血友病B(IX因子))、中枢神经系统障碍(例如癫痫发作、帕金森病(胶质细胞衍生神经营养因子(GDNF)和GDNF样生长因子)、阿尔茨海默病(神经生长因子、GDNF和GDNF样生长因子)、肌萎缩性侧索硬化、脱髓鞘病)、同种异体骨移植(骨形态发生蛋白2(蛋白1-9,例如MBP2))、炎性疾病(例如关节炎、自身免疫病)、肥胖、癌症、心血管疾病(例如充血性心力衰竭(受磷蛋白和Ca++泵相关基因))、黄斑变性(色素上皮衍生因子(PDEF)、β-地中海贫血、α-地中海贫血、Tay-Sachs综合症、苯丙酮酸尿症、囊性纤维化和/或病毒感染。
其它实例包括编码可溶解CD4、用于治疗AIDS的核酸以及用于治疗由α-抗胰蛋白酶缺乏引起的肺气肿的α-胰蛋白酶。可通过本发明方法和组合物治疗的其它疾病、综合症和病症包括:例如腺苷脱氨酶缺乏症、镰状细胞缺乏症、诸如亨廷顿舞蹈病的脑病、溶酶体沉积病、高歇病、胡尔勒病、克拉伯病、诸如显性脊髓小脑型共济失调的运动神经元病(实例包括SCA1、SCA2和SCA3)、地中海贫血、血友病、苯丙酮酸尿症和心脏病(例如由胆固醇代谢改变引起的心脏病)和免疫系统缺陷。可通过这些方法治疗的其它疾病包括代谢疾病,例如肌与骨骼疾病、心血管疾病和癌症。本发明的核酸还可传递至气道上皮,以治疗遗传疾病,例如囊性纤维化、假性醛固酮减少症和纤毛不能移动综合征,以及非遗传性疾病(例如支气管炎、哮喘)。本发明的核酸还可传递至肺泡上皮,以治疗遗传性疾病(例如α-1-抗胰蛋白酶)以及肺病(例如治疗肺炎和肺气肿肺纤维化、肺水肿;传递编码表面蛋白的核酸至早产儿或ARDS患者)。
一般来说,本发明的核酸和载体可用于传递任何具有生物功能的核酸,以治疗或缓解与任意基因表达相关性疾病有关的症状。示例性病状包括但不限于:囊性纤维化(和其它肺病)、血友病A、血友病B、地中海贫血、贫血和其它血液疾病、AIDS、癌症(例如脑瘤)、糖尿病、肌营养不良(例如Duchenne、Becker)、高歇病、胡尔勒病、腺苷脱氨酶缺乏症、糖原贮积病和其它代谢缺陷、粘多糖病和实质器官(例如脑、肝、肾、心脏、肺、眼)疾病等。
在某些实施方案中,可施用本发明的传递载体,以治疗CNS病,包括遗传疾病、神经变性性疾病、精神疾病和/或肿瘤。示例性的CNS疾病包括但不限于阿尔茨海默病、帕金森病、亨廷顿舞蹈病、Rett综合症、Canavan病、Leigh病、Refsum病、Tourette综合症、原发性侧索硬化、肌萎缩性侧索硬化、进行性肌萎缩、Pick病、肌营养不良、多发性硬化、重症肌无力、Binswanger病、归因于脊髓或头部损伤的外伤、Tay Sachs病、Lesch-Nyan病、癫痫、脑梗塞、精神疾病(包括心境障碍(例如抑郁、双相情感障碍、持续性情感障碍、继发性心境障碍))、精神分裂症、药物依赖性(例如醇中毒和其它物质依赖性)、神经症(例如焦虑、强迫性障碍、身体症状性疾患(somatoformdisorder)、分离性障碍、悲恸、产后抑郁症)、精神病(例如幻觉和妄想)、痴呆、偏执狂、注意力不集中症、性心理障碍、睡眠障碍、疼痛疾病、进食或体重障碍(例如肥胖、恶病质、神经性食欲缺乏和贪食症)以及CNS癌症和肿瘤(例如垂体瘤)。
可按照本发明方法治疗的CNS疾病包括涉及视网膜、后束和视神经的眼部疾病(例如色素性视网膜炎、糖尿病视网膜病和其它视网膜变性性疾病、葡萄膜炎、年龄相关性黄斑变性、青光眼)。
即便不是全部也有大部分眼科疾病和障碍与以下三种类型适应症中的一种或多种相关:(1)血管生成,(2)炎症,和(3)变性。本发明的传递载体可用于传递抗血管生成因子;抗炎因子;延迟细胞变性、促进细胞保留或促进细胞生长的因子,以及前述的组合。
例如,糖尿病性视网膜病的特征在于血管生成。糖尿病性视网膜病可通过眼内(例如在玻璃体中)或眼周(例如在筋膜下区)传递一种或多种抗血管生成因子来治疗。还可眼内(例如玻璃体内)或眼周共传递一种或多种神经营养因子。
葡萄膜炎涉及炎症。一种或多种抗炎因子可通过眼内(例如玻璃体或前房)施用本发明的核酸来给予。
比较起来,色素性视网膜炎的特征在于视网膜变性。在示例性实施方案中,色素性视网膜炎可通过眼内(例如玻璃体)施用编码一种或多种神经营养因子的传递载体来治疗。
年龄相关性黄斑变性涉及血管生成和视网膜变性这二者。该疾病可通过眼内(例如玻璃体)施用编码一种或多种神经营养因子的本发明核酸和/或眼内或眼周(例如在筋膜下区)施用编码一种或多种抗血管生成因子的本发明核酸来治疗。
青光眼的特征在于眼压增加和视网膜神经节细胞损失。青光眼的治疗包括使用本发明的传递载体施用一种或多种保护细胞免遭兴奋毒性损伤的神经保护剂。这样的药剂包括眼内、优选玻璃体内传递的N-甲基-D-天冬氨酸(NMDA)拮抗剂、细胞因子和神经营养因子。
在其它实施方案中,本发明可用于治疗癫痫发作,例如减少癫痫的发作、发病率和/或严重性。癫痫发作的治疗性治疗的效力可通过行为(例如眼或嘴的颤动、抽搐)和/或电描记图法(大部分癫痫发作具有标记电描记图异常(signature electrographic abnormalities))来评价。因此,本发明还可用于治疗以随时间推移的多次癫痫发作为标志的癫痫。
作为又一个实例,可使用本发明的传递载体将促生长素抑制素(或其活性片段)传递至脑,以治疗垂体瘤。按照该实施方案,编码促生长素抑制素(或其活性片段)的传递载体可通过微量输注给予到垂体中。同样,此治疗可用于治疗肢端肥大症(垂体的异常生长激素分泌)。促生长素抑制素的核酸序列(例如GenBank登录号J00306)和氨基酸序列(例如GenBank登录号P01166;包含经加工的活性肽促生长素抑制素-28和促生长素抑制素-14)是本领域已知的。
本发明还提供筛选能调节本发明核酸中剪接事件的化合物的方法。因此,在另外的实施方案中,本发明提供一种鉴别化合物的方法,其中所述化合物封闭本发明核酸的第二组剪接元件成员,所述方法包括:a)使核酸与该化合物在允许剪接的条件下接触;和b)检测第一RNA的产生或第二RNA的产生,借此第一RNA的产生鉴别出封闭本发明核酸的第二组剪接元件成员的化合物,而第二RNA的产生鉴别不封闭第二组剪接元件成员的化合物。这些方法还可用于鉴别出允许增加或降低第一种和/或第二RNA的产生的化合物。由本文所述方法鉴别的化合物可用于本发明的方法,包括生产赋予生物功能的蛋白和/或RNA的方法以及治疗方法。
在其它实施方案中,可变剪接事件可通过使用本发明的寡核苷酸、小分子和/或化合物来调节。
例如,可将本发明的核酸、载体和/或细胞连同本发明的封闭寡核苷酸、小分子和/或化合物一起导入到受治疗者中,从而由于对特定组剪接组的活化而在受治疗者中产生赋予生物功能的第一种蛋白和/或RNA。可工程改造相同的核酸,以通过活化剪接组的不同组而编码在受治疗者中赋予生物功能的不同蛋白、肽和/或RNA。当将不同的本发明封闭寡核苷酸、小分子和/或化合物导入到受治疗者中时,产生不同的蛋白和/或RNA。作为实例,当存在第一种封闭寡核苷酸、小分子和/或其它化合物时,第一RNA可产生第一种目标蛋白,而在加入不同的第二种本发明封闭寡核苷酸、小分子和/或化合物后,第二RNA可导致产生第二种目标蛋白或功能RNA(例如可产生第一种蛋白的同种型(例如白介素(IL)-4及其剪接变体IL-4Δ2)。(参见例如Fletcher等,“Increased expression of mRNA encoding interleukin(IL)-4and its splice variant IL-4Δ2 in cells from contacts of Mycobacteriumtuberculosis,in the absence of in vitro stimulation”Immunology 2004年8月;112(4):669-73;Minn等,“Insulinomas and expression of an insulinsplice variant”Lancet 2004年1月31日;363(9406):363-7;Schlueter等,“Tissue-specific expression patterns of the RAGE receptor and itssoluble forms--a result of regulated alternative splicing?”Biochim BiophysActa 2003年10月20日;1630(1):1-6;Vegran等,“Implication ofalternative splice transcripts of caspase-3 and survivin inchemoresistance”Bull Cancer 2005年3月;92(3):219-26;Ren等,“Alternative splicing of vitamin D-24-hydroxylase:A novel mechanismfor the regulation of extra-renal 1,25-dihydroxyvitamin D synthesis”J BiolChem.2005年3月23日;等,“Mutant huntington protein:a substrate fortransglutaminase 1,2,and 3”J Neuropathol Exp Neurol 2005年1月;64(1):58-65;Ding和Keller.“Splice variants of the receptor for advancedglycosylation end products(RAGE)in human brain”Neurosci Lett.2005年1月3日;373(1):67-72;等,“Transcript scanning reveals novel andextensive splice variations in human 1-type voltage-gated calcium channel,Cav1.2α1 subunit”JBiol Chem 2004年10月22日;279(43):44335-43,2004年8月6日电子版。所有这些文献都整体在此引入作为参考)。
本发明还提供组合物中的本发明核酸、载体和/或细胞。因此,在另外的实施方案中,本发明提供一种组合物,其包含在药学可接受载体中的本发明核酸、本发明载体和/或本发明细胞。所谓“药学可接受载体”指与药用组合物中的其它成分相容并对受治疗者无害或无毒的载体。具体地说,意指药学可接受载体是配制用于施用给或传递至本发明受治疗者的无菌载体。
还提供含本发明组合物和药学可接受载体的药用组合物。本文描述的组合物可配制用于按照已知技术在药用载体中施用。参见例如Remington,The Science And Practice of Pharmacy(最新版)。所述载体可为固体或液体或这二者,优选与本发明组合物一起配制为单位剂量制剂,例如片剂,其可相当于所述组合物重量的约0.01或0.5%至约95%或99%。药用组合物通过任一种众所周知的药学技术制备,包括但不限于混合组分,可选地包含一种或多种助剂组分。
本发明的药用组合物包括适于口服、直肠、局部、吸入(例如通过气溶胶)、口腔含化(例如舌下)、阴道、胃肠外(例如皮下、肌内、皮内、关节内、胸膜内、腹膜内、脑内、动脉内或静脉内)、局部(即皮肤和粘膜表面,包括气管表面)和经皮施用的组合物,但如本领域众所周知的,在给定情况下最适宜的途径将取决于诸如受治疗者的物种、年龄、性别和整体身体状况、要治疗病症的性质和严重性和/或要施用的具体组合物的性质(即剂量、制剂)之类的因素。
适于口服施用的药用组合物可存在于分立单位中,例如胶囊剂、扁囊剂、锭剂或片剂,每种均含预定量的本发明组合物;作为粉剂或颗粒剂存在;作为在水性或非水性液体中的溶液或悬浮液存在;或作为水包油或油包水型乳剂存在。可通过使本发明的组合物与能够抵抗动物肠道中的消化酶降解的载体复合来实施口服传递。此类载体的实例包括本领域已知的塑料胶囊或片剂。这些制剂可通过任一种适宜的药学方法制备,所述方法包括使组合物和适宜载体(其可包含一种或多种如上指出的助剂组分)结合的步骤。一般来说,如下制备依照本发明实施方案的药用组合物:将组合物与液体或细碎固体载体或这二者均一并紧密地混合,然后,如果需要的话,将所获得的混合物定型。例如,片剂可通过压制或模制含所述组合物且可选地具有一种或多种助剂的粉剂或颗粒剂来制备。压片如下制备:在适宜的机器中压制自由流动形式的组合物,例如粉末或颗粒剂,其可选地与粘合剂、润滑剂、惰性稀释剂和/或表面活性剂/分散剂混合。模制的片剂通过在适宜的机器中模制用惰性液体粘合剂润湿的粉状化合物制备。
适于口腔含化(舌下)施用的药用组合物包括在调味基剂(通常为蔗糖和阿拉伯胶或黄蓍胶)中的含本发明组合物的锭剂;以及在惰性基剂(例如明胶和甘油或蔗糖和阿拉伯胶)中的含所述组合物的软锭剂。
适于胃肠外施用的本发明药用组合物可包含本发明组合物的无菌水性和非水性注射溶液,所述制备物优选与预期接受者的血液等渗。这些制备物可包含抗氧化剂、缓冲剂、抑菌剂和溶质,它们使组合物与预期接受者的血液等渗。水性和非水性无菌悬浮液、溶液和乳剂可包括悬浮剂和增稠剂。非水性溶剂的实例为丙二醇、聚乙二醇、植物油如橄榄油和可注射有机酯,例如油酸乙酯。水性载体包括水、醇/水性溶液、乳剂或悬浮液,包括盐水和缓冲介质。胃肠外溶媒包括氯化钠溶液、Ringer氏葡萄糖、葡萄糖和氯化钠、乳酸盐Ringer或非挥发性油。静脉内溶媒包括流体和营养补充剂、电解质补充剂(例如基于Ringer氏葡萄糖的补充剂)等。还可存在防腐剂和其它添加剂,例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
所述组合物可存在于单位剂量或多剂量容器中,例如存在于密封安瓿和管形瓶中,并可储存于冷冻干燥(冻干)条件下,其仅需要在临使用前加入无菌液体载体,例如盐水或注射用水。
临场调制的注射溶液和悬浮液可由先前描述类型的无菌粉剂、颗粒剂和片剂制备。例如,可提供在密封容器中为单位剂型的可注射的、稳定的、无菌的本发明组合物。所述组合物可以冻干品的形式提供,冻干品可用适宜的药学可接受载体复水,以形成适于注射入受治疗者中的液体组合物。单位剂型可为约1μg至约10g本发明组合物。当所述组合物基本不溶于水时,可纳入足量的生理学可接受的乳化剂,其量足以乳化在水性载体中的组合物。一种这样的有用乳化剂是磷脂酰胆碱。
适于直肠施用的药用组合物优选以单位剂量的栓剂存在。这些栓剂可如下制备:将所述组合物与一种或多种常规固体载体(例如可可脂)混合,然后将所获混合物定型。
适于局部施用于皮肤的本发明药用组合物优选采用软膏剂、霜剂、洗剂、糊剂、凝胶、喷雾剂、气溶胶或油剂的形式。可使用的载体包括但不限于凡士林、羊毛脂、聚乙二醇、醇类、透皮促进剂及其两种或多种的组合。在某些实施方案中,例如,局部传递可如下实施:将本发明的药用组合物与能够穿透皮肤的亲脂试剂(例如DMSO)混合。
适于经皮施用的药用组合物可为分立贴剂的形式,适于长时间保持与受治疗者的表皮紧密接触。适于经皮施用的组合物还可通过离子电渗疗法(参见例如Pharmaceutical Research 3:318(1986))传递,通常采用本发明组合物的任选缓冲的水溶液形式。适宜的制剂可包含柠檬酸盐或bis\tris缓冲液(pH 6)或乙醇/水,并可包含0.1-0.2M活性成分。
本发明组合物的有效量将在组合物之间和受治疗者之间变化,并取决于诸如受治疗者的年龄、物种、性别、体重、整体身体状况以及要治疗的具体疾病或障碍之类的各种因素。可按照本领域一般技术人员已知的常规药学方法确定有效量。在某些实施方案中,约0.1μg/kg至约1g/kg的剂量将具有治疗效力。在使用病毒载体传递本发明核酸的实施方案中,可检测病毒剂量,以根据使用的病毒纳入特定数量的病毒颗粒或噬菌斑形成单位(pfu)或感染颗粒。例如,在某些实施方案中,具体单位剂量可包括约103、104、105、106、107、108、109、1010、1011、1012、1013或1014pfu或感染颗粒。
本发明组合物的施用频率可为赋予期望的疗效所必需的频率。例如,组合物可每天施用1、2、3、4次或更多次,1周施用1、2、3、4次或更多次,1个月施用1、2、3、4次或更多次,1年施用1、2、3、4次或更多次和/或根据需要施用,以控制具体病症和/或实现特定作用和/或利益。在某些实施方案中,在受治疗者一生中施用1、2、3或4剂足可获得期望的疗效。施用本发明组合物的量和频率将根据要治疗或要预防的具体病症和期望的疗效而有所变化。
本发明的组合物可体内或离体(ex vivo)施用给受治疗者的细胞。对于体内施用给受治疗者的细胞以及施用给受治疗者,例如如上所述,可口服、胃肠外(例如静脉内)、肌内注射、皮内(例如通过基因枪)、腹膜内注射、皮下注射、经皮、离体、局部等施用本发明的组合物。另外,本发明的组合物可按照本领域众所周知的方法被脉冲到由受治疗者细胞分离或培养的树突细胞上,或者脉冲到受治疗者的混合PBMC或其各种细胞亚组分上。
如果使用离体方法,则可按照本领域众所周知的标准方法取出细胞或组织,并在机体外部保持,同时将本发明组合物导入到所述细胞或组织中。例如,可经任意基因转移机制,例如病毒介导的基因传递、磷酸钙介导的基因传递、电穿孔、微注射或脂蛋白体,将本发明的核酸和载体导入到细胞中。然后可按照用于所述细胞或组织类型的标准方法将转导和/或转染的细胞灌输(例如在药学可接受的载体中)或移植回受治疗者中。用于将各种细胞移植或灌输入受治疗者中的标准方法是已知的。
本发明的制剂可包含活性化合物的无菌水性和非水性注射溶液,该制备物优选与预期接受者的血液等渗,基本上无热源。这些制剂可包含抗氧化剂、缓冲剂、抑菌剂和溶质,所述溶质使制剂与预期接受者的血液等渗。水性和非水性无菌悬浮液可包括悬浮剂和增稠剂。所述制剂可存在于单位剂量或多剂量容器如密封安瓿和管形瓶中,并可储存于冷冻干燥(冻干)环境下,其仅需要在临使用前加入无菌液体载体,例如盐水或注射用水。
在一种制剂中,本发明的组合物可包含在可适用于胃肠外施用的脂质颗粒或囊泡中,例如脂质体或微晶体。所述颗粒可为任意合适的结构,例如单层或多层,只要所述化合物包含在其中。针对此颗粒和囊泡,特别优选正电荷脂质,如N-[1-(2,3-二油酰氧)丙基]-N,N,N-三甲基-铵硫酸甲酯或“DOTAP”。所述脂质颗粒的制备众所周知。参见例如Janoff等的美国专利第4,880,635号;Kurono等的美国专利第4,906,477号;Wallach的美国专利第4,911,928号;Wallach的美国专利第4,917,951号;Allen等的美国专利第4,920,016号;Wheatley等的美国专利第4,921,757号;等等。
本发明的药用组合物例如可用于生产治疗本文所述的疾病和/或障碍的药物。
以下序列包括在本发明中。
SEQ ID NO:1.质粒TRCBA-int-luc突变型。核苷酸163-2036:CBA启动子;核苷酸2739-4573:突变内含子(654C-T);核苷酸4592-4813:polyA信号。
SEQ ID NO:2.质粒TRCBA-int-luc(野生型)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:野生型内含子(654C);核苷酸2071-4573:萤光素酶中的内含子;核苷酸4592-4813:polyA信号。
SEQ ID NO:3.质粒TRCBA-int-luc(657GT)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:突变内含子(654C-T;657TA-GT);核苷酸2071-4573:萤光素酶中的内含子;核苷酸4592-4813:polyA信号。
SEQ ID NO:4.质粒GL3-int-Luc(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1797:突变型内含子(654C-T);核苷酸2814-3035:polyA信号;核苷酸280-2782:具有突变内含子的萤光素酶。
SEQ ID NO:5.质粒GL3-int-Luc(野生型)。核苷酸48-250:SV40启动子;核苷酸948-1797:野生型内含子(654C);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:6.质粒GL3-int-Luc(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1797:内含子(654C-T;657TA-GT);核苷酸280-2782:具有突变内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:7.质粒GL3-2int-fron-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸251-1100、1771-2620:突变内含子(654C-T);核苷酸1103-3635:具有突变内含子的萤光素酶;核苷酸3637-3858:polyA信号。
SEQ ID NO:8.质粒GL3-3int-2fron-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸251-1100、1106-1965、2635-3484:突变内含子(654C-T);核苷酸1967-4469:具有突变内含子的萤光素酶;核苷酸4514-4735:polyA信号。
SEQ ID NO:9.质粒GL3-int-luc A(突变型)。核苷酸48-250:SV40启动子;核苷酸673-1522:内含子(654C-T);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:10.质粒GL3-int-Luc B(突变型)。核苷酸48-250:SV40启动子;核苷酸1440-2289:内含子(654C-T);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:11.质粒GL3-int-Luc C(突变型)。核苷酸48-250:SV40启动子;核苷酸1691-2540:内含子(654C-T);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:12.质粒GL3-int-fron(突变型)。核苷酸48-250:SV40启动子;核苷酸251-1100:内含子(654C-T);核苷酸1103-2755:具有内含子的萤光素酶;核苷酸2787-3008:polyA信号。
SEQ ID NO:13.质粒GL3-2int-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1797;1798-2647:内含子(654C-T);核苷酸280-3632:具有内含子的萤光素酶;核苷酸3664-3885:polyA信号。
SEQ ID NO:14.质粒GL3-2int-sph C(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1797;2541-3390:内含子(654C-T);核苷酸280-3632:具有内含子的萤光素酶;核苷酸3664-3885:polyA信号。
SEQ ID NO:15.质粒GL3-sint200-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T);核苷酸280-2582:具有内含子的萤光素酶;核苷酸2794-2835:polyA信号。
SEQ ID NO:16.质粒GL3-sint200-sph(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T;657TA-GT);核苷酸280-2582:具有内含子的萤光素酶;核苷酸2794-2835:polyA信号。
SEQ ID NO:17.质粒GL3-sint425-sph。核苷酸48-250:SV40启动子;核苷酸948-1373:内含子(654 C-T);核苷酸280-2358:具有内含子的萤光素酶;核苷酸2569-2615:polyA信号。
SEQ ID NO:18.突变型内含子(654C-T)。
SEQ ID NO:19.野生型内含子(654C)。
SEQ ID NO:20.具有两个突变(654C-T;657TA-GT)的内含子。
SEQ ID NO:21.萤光素酶cDNA,其在核苷酸669-1518具有突变内含子(654C-T)。
SEQ ID NO:22.萤光素酶cDNA,其在核苷酸669-1518具有野生型内含子。
SEQ ID NO:23.萤光素酶cDNA,其在核苷酸669-1518具有双突变内含子(C654C-T;657TA-GT)。
SEQ ID NO:24.萤光素酶cDNA,其在核苷酸1-850具有突变内含子(654C-T),在核苷酸1521-2370具有突变内含子(654C-T)。
SEQ ID NO:25.萤光素酶cDNA,其在核苷酸1-850具有突变内含子(654C-T),在核苷酸861-1710和核苷酸2385-3234具有两个突变内含子(654C-T)。
SEQ ID NO:26.萤光素酶cDNA,其在可变位置A(核苷酸394-1243)具有突变内含子(654C-T)。
SEQ ID NO:27.萤光素酶cDNA,其在可变位置B(核苷酸1161-2010)具有突变内含子(654C-T)。
SEQ ID NO:28.萤光素酶cDNA,其在可变位置C(核苷酸1412-2261)具有突变内含子(654C-T)。
SEQ ID NO:29.萤光素酶cDNA,其在翻译位点上游(核苷酸1-850)具有突变内含子(654C-T)。
SEQ ID NO:30.萤光素酶cDNA,其在核苷酸669-1518和核苷酸1519-2368具有两个突变内含子(654C-T)。
SEQ ID NO:31.萤光素酶cDNA,其在核苷酸669-1518和核苷酸2262-3111具有两个突变内含子(654 C-T)。
SEQ ID NO:32.萤光素酶cDNA,其在核苷酸669-1318具有突变内含子(654C-T)以及具有200个碱基对缺失。
SEQ ID NO:33.萤光素酶cDNA,其在核苷酸669-1318具有双突变内含子(654C-T;657TA-GT)以及具有200个碱基对缺失。
SEQ ID NO:34.萤光素酶cDNA,其在核苷酸669-1094具有突变内含子(654C-T)以及具有425个碱基对缺失。
SEQ ID NO:35.质粒TRCBA,具有α抗胰蛋白酶cDNA和在核苷酸2866-3715的突变内含子(654C-T)。
SEQ ID NO:36.α抗胰蛋白酶cDNA,在核苷酸772-1621具有突变内含子(654C-T)。
SEQ ID NO:37.针对IVS2-654的封闭寡核苷酸GCT ATT ACCTTA ACC CAG。
SEQ ID NO:38.针对具有657GT突变的IVS2-654的封闭寡核苷酸GCA CTT ACC TTA ACC CAG。
SEQ ID NO:50(具有564CT突变的IVS2-654内含子)。
SEQ ID NO:51(具有657G突变的IVS2-654内含子)。
SEQ ID NO:52(具有658T突变的IVS2-654内含子)。
SEQ ID NO:20(具有657GT突变的IVS2-654内含子)。
SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)。
SEQ ID NO:54(具有425bp缺失的IVS2-654内含子)。
SEQ ID NO:68(仅具有197bp的IVS2-654内含子)。
SEQ ID NO:69(仅具有247bp的IVS2-654内含子)。
SEQ ID NO:55(具有6A突变的IVS2-654内含子)。
SEQ ID NO:56(具有564C突变的IVS2-654内含子)。
SEQ ID NO:57(具有841A突变的IVS2-654内含子)。
SEQ ID NO:58(IVS2-705内含子)。
SEQ ID NO:59(具有564CT突变的IVS2-705内含子)。
SEQ ID NO:60(具有657G突变的IVS2-705内含子)。
SEQ ID NO:61(具有658T突变的IVS2-705内含子)。
SEQ ID NO:62(具有657GT突变的IVS2-705内含子)。
SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)。
SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)。
SEQ ID NO:65(具有6A突变的IVS2-705内含子)。
SEQ ID NO:66(具有564C突变的IVS2-705内含子)。
SEQ ID NO:67(具有841A突变的IVS2-705内含子)。
SEQ ID NO:70(CFTR外显子19野生型序列)。
SEQ ID NO:71(CFTR外显子193849+10kb C至T突变)。
SEQ ID NO:72(CFTR外显子19野生型寡核苷酸)。
SEQ ID NO:73(CFTR外显子193849+10kb C至T突变寡核苷酸)。
SEQ ID NO:74(小鼠肌养蛋白内含子22、外显子23和内含子23野生型序列)。
SEQ ID NO:75(mdx小鼠肌养蛋白内含子22、外显子23和内含子23无义突变)。
SEQ ID NO:76(反义外显子23跳跃(skipping)诱导性寡核苷酸)。
SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)。
SEQ ID NO:40(针对IVS2-654中564C突变的寡核苷酸)。
SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)。
SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)。
SEQ ID NO:44(针对IVS2-654中657G突变的寡核苷酸)。
SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)。
SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)。
SEQ ID NO:49(针对IVS2-705的寡核苷酸)。
SEQ ID NO:46(针对IVS2-654的寡核苷酸)。
SEQ ID NO:47(针对IVS2-654的寡核苷酸)。
SEQ ID NO:48(针对IVS2-654的寡核苷酸)。
陈述以下的实施例是为了阐明本发明,不应解释为限制本发明。
实施例
实施例1:来自病毒载体的基因表达的剪接介导的控制
质粒构建
质粒pGL3购自Promega。所有引物都得自UNC-CH LCCC寡核苷酸核心实验室。所有酶都得自New England Biolabs,并按照销售商的推荐使用。为在绿色荧光蛋白(GFP)或萤光素酶(Luc)cDNA的中部插入野生型(wt)或具有隐蔽剪接位点的内含子,插入位点按照前mRNA中的共有序列选择(Luca Cartegni等,“Listening to silence andunderstanding nonsense exonic mutations that affect splicing”Nat RevGenet.2002年4月;3(4):285-98)。
将内含子插入到不同位置(基于编号为1的萤光素酶cDNA起始密码子ATG):393-394(A),668-669(B),1160-1161(C)和1411-1412(D)。在某些研究中,将内含子插入到启动子和萤光素酶cDNA之间。应用4片段连接策略。Pfu酶(Stratagen)用于通过聚合酶链反应(PCR)扩增内含子以及侧翼的具有NcoI的上游序列和具有XbaI的下游序列。GL3主链用NcoI和XbaI这二者消化,同时用NcoI或XbaI邻接PCR产物。通过平端连接插入内含子。由凝胶纯化所述区段。在1小时后,通过Fast Ligase(Epicentre)进行室温连接,然后通过电穿孔将核酸转化入DH10B细菌细胞中。
病毒制备
按照标准3质粒共转染法制备携带内含子调节的转基因表达盒的AAV2载体(Xiao等,“Efficient long-term gene transfer into muscletissue of immunocompetent mice by adeno-associated virus vector”J Virol.1996年11月;70(11):8098-108)。滴度通过斑点印迹测定。
体外萤光素酶表达测定
在某些实验中,在24孔板中转染293细胞。对于每个孔,在加入100μl 2X HeBS前将10ng质粒5μl、2.5M CaCl2 10μl和ddH2O 85μl混合在一起。在形成沉淀后在光学显微镜下将其加入到细胞中。一些细胞同时用寡核苷酸(例如0.05mM,10μl)处理。
在于37℃、5%CO2中孵育24小时后,用200μl 1×PBS清洗,之后用100μl 1×裂解缓冲液裂解每个孔中的细胞。取20μl体积至96孔不透明板,用于使用微板发光计(Tropix)进行萤光素酶测定。萤光素酶底物购自Promega。
动物处理
在病毒注射后1周,通过腹膜内(i.p.)注射2.5mM阿佛丁或异氟烷麻醉动物。i.p.给予萤光素底物(125μl,25mg/ml,Promega),以激发荧光反应。应用萤光素酶成像系统(Roper Scientific)或IVIS成像系统(Xenogen)捕获整只动物的萤光素酶萤光的“实时”图像。开始时采集图象(第0天),然后在连续两天给予寡核苷酸(i.p.25mg/kg)后采集图象。
在该实施例中,β-珠蛋白内含子中的天然突变用于开发受调节的剪接系统。这些内含子突变在具有β-地中海贫血的患者中被发现,并发现其通过建立新的5’剪接供体位点而引起疾病。新的供体位点协同隐蔽3’剪接受体一起导致在mRNA中包含携带符合读框的终止信号的一部分内含子。
具体地说,在该实施例中,已表明包含在AAV载体的绿色荧光蛋白(GFP)转基因中的突变内含子可用作完整的载体调节系统。加入针对该突变的寡核苷酸(“oligo”)校正剪接缺陷,并在体外和体内均诱导正确的基因表达。
如下构建AAV质粒载体:克隆含野生型或突变型β-珠蛋白内含子的绿色荧光蛋白(GFP)或萤光素酶报告基因,所述内含子掺入到人巨细胞病毒(CMV)启动子或杂种CMV鸡β-肌动蛋白启动子(CB或CBA)之后。将两种不同的剪接突变掺入到分离的AAV载体中:在内含子的核苷酸654处的突变(AAV-654)和在隐蔽剪接位点中具有一个额外突变的核苷酸705处的突变(AAV-705U)。将所述AAV构建物转染入HEK 293细胞中或HeLa细胞中,导致野生型内含子产生良好的基因表达,而突变内含子产生低基因表达。随后用分别针对核苷酸654突变或核苷酸705突变的2’-O-甲氧基乙基硫代磷酸酯(MOE)寡核苷酸转染细胞,分别增加654和705U突变体的基因表达。
在HEK 293细胞和HeLa细胞中产生和测试重组AAV。在AAV感染后24小时,用针对对应突变的MOE寡核苷酸转染细胞,在寡核苷酸转染后24和48小时观察报告基因表达。用AAV-654或AAV-705U感染而没用寡核苷酸感染的细胞表明在转染后24小时实际上没有GFP表达,在48小时时仅有些微的基因表达。相比之下,用寡核苷酸转染的细胞在24小时时表现出明显的基因表达,该表达在48小时时在强度上稍微增加,但细胞数量没有增加。GFP阳性细胞的计数表明,在48小时时,对于654突变体,加入寡核苷酸诱导达200倍,对于705突变体,诱导达70倍。705U突变体表明,在HeLa细胞和HEK 293细胞中几乎没有强诱导,这根据GFP荧光细胞计数的数量和全视野荧光来测定。这看起来归因于略高的基础基因表达水平以及对寡核苷酸加入几乎无强响应。
用含野生型内含子的rAAV(AAV-wt int)感染在接近100%的细胞中以和突变体相同的感染复数(MOI)始终获得强GFP表达。在寡核苷酸存在下,AAV-野生型内含子表现出明显比任一种突变体高的基因表达,表明未被寡核苷酸完全校正。半定量RT-PCR证实,在寡核苷酸存在下在AAV-654和AAV-706U感染细胞中均有正确剪接和不正确剪接的物质。但是,增加寡核苷酸剂量并不显著增加基因表达。增加病毒量的确稍微增加全视野强度,但不增加GFP阳性细胞数目。
表1显示了一个内含子在相对于萤光素酶cDNA的不同位置的校正效率。
表2显示了插入多个内含子对萤光素酶转基因表达的改变。
表3显示了内含子(SEQ ID NO:53)的转基因校正效率,所述内含子通过缺失碱基对151-350而缩短了原长度的1/4。
实施例2体内研究
还在体内用由CB启动子驱动的654突变内含子构建物(AAV-CB-654)研究了寡核苷酸对AAV介导的基因表达的诱导。通过门静脉注射将在萤光素酶报告基因中携带654突变体内含子的rAAV 2型载体(5×1010个载体颗粒)传递入小鼠肝脏中。1年后,以每日25mg/kg腹膜内给予寡核苷酸达2天。在第3天进行萤光素酶成象。当与未接受寡核苷酸治疗的动物相比时,萤光素酶表达高达8-10倍。在体内观察到的寡核苷酸诱导的上调持续超过1个月,随后回落至基线水平。给予载体达1周、之后给予寡核苷酸的第二组动物产生特征性的转基因表达上调,之后在1个月内下降。重复施用寡核苷酸还可再活化内含子调节的基因表达。此结果表明,载体特异性组成型启动子在延长的时间段内表达mRNA(与AAV介导的体内转基因表达一致),但功能性基因产物仅在施用“剪接介导的”药物(例如寡核苷酸)之后观察到。
这些结果表明,通过调节载体产生的RNA由非功能性mRNA至功能性mRNA的剪接而调节功能性基因表达。
加入寡核苷酸相当快速地诱导基因表达,在组织培养物中至24小时时产生表达,在体内于1-2天内产生表达。基因表达的持续时间受到转基因产生的蛋白的半衰期和寡核苷酸的半衰期影响。诸如2’-O-甲氧基乙基硫代磷酸酯主链的寡核苷酸具有长体内半衰期;在大鼠中于8小时后十分完整。在单次注射MOE或LNA寡核苷酸的情况下,持续的mRNA校正和蛋白表达可持续相当一段时间。通过改变寡核苷酸主链以及剂量应当有可能改变基因校正的持续时间。不同的主链已表现出明显不同的生物稳定性,并可用于更精确地控制基因表达持续时间。靶mRNA的半衰期还可通过包含顺式作用元件来控制,所述顺式作用元件将使剪接过的mRNA具有快或慢的周转率。这些元件的使用在本领域是标准的,是本领域技术人员熟知的。加入强聚腺苷酸化信号也将影响加工过的信使的半衰期。因此,“剪接介导的药物”上调功能性mRNA的能力可受到给定量、生物分布、稳定性和/或对靶序列的亲和性以及靶mRNA的丰度和稳定性的影响。所有这些参数都可按照本领域已知的方法修改,以更精确地控制“剪接介导的”调节。
通过使用内含子调节基因表达,消除了对加入转基因以外的外源蛋白的需要,因此避免了针对调节性反式激活物的严重免疫反应的可能性。另外,内含子的大小可变(1000bp或以下),并可容易地与组织特异性启动子组合,在加入寡核苷酸后在单个载体中产生组织特异性和蛋白表达调节。在更常规的调节系统中,这一般需要两种载体和两种单独的启动子(即驱动转基因表达的调节启动子和驱动反式激活物的组织特异性启动子)。
为进一步表明该系统的用途,将功能性治疗性转基因(α1-抗胰蛋白酶,AAT)克隆入具有内含子调节基因表达盒系统的AAV载体中。在门静脉注射载体颗粒后,通过ELISA测定检测随时间变化的功能性AAT转基因活性。在没有“剪接介导的”寡核苷酸的情况下,检测到低人AAT至无人AAT。但是,在存在药物(在该实施例中为LNA寡核苷酸)的情况下,可监测到血液中的转基因表达上调(100倍),动力学和持续时间与对报告基因的描述相似(在30天内)。与AAV载体相一致,在载体传递后,转基因表达将接着发生并持续,与目标组织中的基因表达盒(报告体或治疗剂)无关。对于“剪接介导的”受控载体,载体传递的所有方面都相同,功能性mRNA的表达除外。该方面仅受控于外源“剪接介导”药物的存在,仅可在选定时间给予和/或重复地给予,以获得期望的转基因mRNA的功能活性。
实施例3在图1-3中描述的研究
在本发明的某些实施方案中,如下构建AAV质粒载体:将在编码序列中含突变β-珠蛋白内含子的报告基因表达盒(绿色荧光蛋白-GFP或萤光素酶-Luc)克隆在人巨细胞病毒(CMV)启动子或杂种CMV鸡β-肌动蛋白启动子(CB)之后。AAV载体按照标准的3质粒共转染方法产生(Xiao等,Journal of Virology(1998))。基于内含子突变序列的存在,这些载体RNA表达盒的RNA表达导致形成前mRNA(图1(1))。在没有外源寡核苷酸的情况下,前mRNA将使用隐蔽剪接位点剪接。这是位于内含子的核苷酸654处的单点突变的结果,导致形成可变剪接位点(在图1(1)(i)中的前mRNA上的小三角)。由该反应产生的剪接过的mRNA在两个编码序列之间含一部分内含子序列(图1(2)(i))。该mRNA是无功能的,不表达功能性产物(图1(3)(i))。随后针对核苷酸654突变的2’-O-甲氧基乙基硫代磷酸酯(MOE)寡核苷酸的转染(在图1(1)(ii)中黑条棒的右侧)封闭可变剪接,产生正确的剪接(图1(2)(ii))和功能性基因产物(图1(3)(ii))。
产生携带以上表达盒的重组AAV载体,并测试其在人细胞(HeLa细胞)中的受调节的转基因表达。AAV感染后24小时,1/2的细胞用针对654突变的MOE寡核苷酸转染,在寡核苷酸转染后48小时观察报告基因表达。用AAV-654载体而不用寡核苷酸转染的细胞实际上没有表现出可检测的GFP表达。相比之下,用654特异性寡核苷酸转染的细胞表现出显著的基因表达。GFP阳性细胞的计数表明,在加入针对654突变的寡核苷酸的情况下达200倍诱导。
如本文所述产生携带由“剪接介导的”内含子控制的萤光素酶报告基因的AAV载体,并通过门静脉注射将其用于感染小鼠肝脏。在一组动物中,在传递寡核苷酸药物前1年施用载体(图2A)。在经腹膜内注射施用剪接特异性寡核苷酸达连续2天后,在注射萤光素底物后对动物进行实时成像,以依据光子的发射和收集检测功能性萤光素酶活性(并转变为光单位)。如在图2A中所示,与未治疗动物(图2A(i)和图2C)相比,接受寡核苷酸的小鼠(图2A(ii)和图2C)显示出增加的萤光素酶活性(暗灰色阴影和增加的表面积量)。这些结果还表明,载体特异性组成型启动子正在表达无功能mRNA,该活性持续1年以上。如图1所述,只有在加入“剪接介导的”寡核苷酸后才能将无功能mRNA转变为功能性mRNA。
在另一组用“剪接介导的”载体转基因表达盒感染的动物中,在施用寡核苷酸后诱导了调节,该调节持续达1个月以上,并稳定回落到基线。重复施用寡核苷酸(图2B箭头)表明转基因活性上调,与第一种药物的施用(图2B;菱形)一致。在未接受“剪接介导的”寡核苷酸药物的动物中未观察到上调证据(图2B;实心圆)。这些实验表明,载体传递的转基因表达盒在体内响应于寡核苷酸药物的存在,并对寡核苷酸药物的持续时间敏感。涉及药物传递的众多实验参数都可由本领域技术人员修改,以影响受调节的转基因功能的水平和持续时间(例如药物的剂量和生物分布、药物和靶mRMA的半衰期、mRNA产物的稳定性等)。
在体内研究中使用携带受调节的治疗性转基因的AAV载体(α1-抗胰蛋白酶;AAT)进行相似的实验。在该实施例中,AAV载体通过门静脉注射给予至小鼠肝脏。1周后,一部分动物通过腹膜内注射施用来给予LNA寡核苷酸,之后通过ELISA测定检测AAT蛋白的循环水平。AAT表达在约1周时达到峰值(图3;方形),并在1个月内缓慢下降。在仅接受载体的动物(图3;菱形)中,在实验过程中没有观察到基线以上的AAT表达的证据。在该实验中两个关键因素主要确定诱导的转基因的寿命;即分别是寡核苷酸和蛋白产物的半衰期。根据所使用的寡核苷酸类型(PNA对LNA等)和被靶向以便调节的转基因(AAT对生长因子对细胞因子等)可获得不同的结果。无论如何,全部这些结果都模拟了“剪接介导的”受调节报告基因的结果,表明了在经“剪接介导的”受调节机制而外部施用药物后调节体内治疗性转基因表达的能力。
实施例4.双内含子系统
应可变剪接控制体外和体内转基因表达。将人β-珠蛋白基因的异常剪接突变内含子IVS2-654插入到绿色荧光蛋白(GFP)表达盒中。IVS2-654内含子大小为850bp,含4个剪接位点。IVS2-654内含子的核苷酸序列(SEQ ID NO:19)示于以下。两个可变内含子位于核苷酸1-579和653-850。可变外显子位于核苷酸580-652。两个箭头指示可变内含子-外显子之间的接合处。4个剪接位点和4个潜在分支点分别由直线和波浪线下划线表示。5’ss 652/18 AON的靶序列以粗体浮雕表示。有效剪接和3’末端形成所需的序列为粗斜体。
1  
Figure A20068002375300581
CCCTTCTT TTCTATGGTT
     AAGTTCATGT CATAGGAAGG GGAGAAGTAA CAGGGTACAG
91   TTTAGAATGG GAAACAGACG AATGATTGCA TCAGTGTGGA   AGTCTCAGGA
     TCGTTTTAGT TTCTTTTATT TGCTGTTCAT AACAATTGTT
181  TTCTTTTGTT TAATTCTTGC TTTCTTTTTT TTTCTTCTCC   GCAATTTTTA
     CTATTATACT TAATGCCTTA ACATTGTGTA TAACAAAAGG
271  AAATATCTCT GAGATACATT AAGTAACTTA AAAAAAAACT   TTACACAGTC
     TGCCTAGTAC ATTACTATTT GGAATATATG TGTGCTTATT
361  TGCATATTCA TAATCTCCCT ACTTTATTTT CTTTTATTTT   TAATTGATAC
     ATAATCATTA TACATATTTA TGGGTTAAAG TGTAATGTTT
451  TAATATGTGT ACACATATTG ACCAAATCAG GGTAATTTTG   CATTTGTAAT
     TTTAAAAAAT GCTTTCTTCT TTTAATATAC TTTTTTGTTT
541  ATCTTATTTC TAATACTTTC CCTAATCTCT TTCTTTCAG↓G GCAATAATGA
     TACAATGTAT CATGCCTCTT TGCACCATTC TAAAGAATAA
631  CAGTGATAAT TT
Figure A20068002375300582
AATATTTCTG CATATAAATA
     TTTCTGCATA TAAATTGTAA CTGATGTAAG AGGTTTCATA
721  TTGCTAATAG CAGCTACAAT CCAGCTACCA TTCTGCTTTT   ATTTTATGGT
     TGGGATAAGG CTGGATTATT CTG
Figure A20068002375300583
811 
通过使用磷酸钙转染法将所获质粒转染入人肾上皮细胞系293细胞中。随后,将特异性AON以0.5μM终浓度加入到两组相同的转染细胞的其中一组中,以诱导GFP表达。所述特异性AON称为5’ss652/18 AON,是一种18聚体寡核苷酸,其与5’可变剪接位点互补,能够抑制异常外显子的掺入。作为阳性对照,293细胞单独地用含在GFP表达盒中的相同位置插入的野生型内含子的质粒转染。阳性对照细胞不用5’ss 652/18AON处理。在转染后24小时,使用荧光显微镜检查细胞的GFP表达。在实验组中,经转染但不用AON处理的细胞不能表达可检测水平的GFP。相反,用AON处理的细胞以和阳性对照组相似的水平表达功能性GFP。因此,可变剪接可用于控制体外转基因表达。
为确定可变剪接是否还可用于控制体内转基因表达,构建了重组AAV质粒,其携带萤光素酶表达盒(Promega),该表达盒插入了一个拷贝的850bp IVS2-654内含子。萤光素酶基因由已表明能够在小鼠中驱动组成型转基因表达的CMV增强子/鸡β-肌动蛋白启动子所驱动。AAV通过使用无腺病毒的生产流程产生,该生产流程包括用以下3种质粒转染293细胞:重组AAV质粒、提供结构性和非结构性AAV基因的AAV辅助质粒以及提供AAV载体产生的必需辅助基因的腺病毒辅助质粒。通过使用包含碘克沙醇梯度和硫酸肝素层析步骤的纯化方法纯化所产生的AAV载体。然后,将5×1010个纯化AAV颗粒施用给每只小鼠。注射后1周,通过每日腹膜内注射25mg/kg的5’ss 652/18AON达连续两天诱导萤光素酶表达。通过给予萤光素后使用萤光素酶成像系统(Roper Scientific)进行整体成像来确定萤光素酶表达水平。当通过门静脉注射将AAV靶向肝脏时,器官中的萤光素酶表达被诱导达10.4倍,在第8天达到峰值,持续超过29天。通过直接注射将AAV靶向心脏也表现出相似模式的诱导的转基因表达。还在AAV注射后1年给小鼠施用AON,肝脏中的萤光素酶表达被诱导至相似的水平,表明将所述内含子掺入AAV载体中并不影响AAV基因组的持续性。
为更精确地定量转基因表达水平和确定可变剪接是否能在体内控制其它目标基因的表达,构建了另一种携带α1-抗胰蛋白酶(AAT)表达盒的AAV载体,该表达盒插入了一个拷贝的850bp的IVS2-654内含子。获得的纯化AAV经门静脉注射给予小鼠。AAT表达通过给予5’ss 652/18 AON来诱导,并通过ELISA测定定量。与萤光素酶表达模式类似,AAT表达被诱导达8.9倍,在第8天和第29天达到峰值,持续超过43天。这些结果表明,可变剪接既可用于控制体外转基因表达,也可用于控制体内转基因表达。
优化可变剪接以控制转基因表达。为有利于可变剪接优化以控制转基因表达,使用萤火虫萤光素酶标记基因插入850bp的可变剪接内含子IVS2-654。因此,转基因表达的控制可通过测定外显子掺入和外显子跳跃(即有或没有5’ss 652/18 AON)条件下的萤光素酶表达水平便利地测定。为优化该可变剪接以控制转基因表达,进行以下三组实验:
1)在萤光素酶表达盒中插入单拷贝的IVS2-654内含子,以控制转基因表达。为确定插入位点是否影响内含子的剪接,将单拷贝的850bp IVS2-654内含子在核苷酸393-394(A)、668-669(B)、1160-1161(C)或1411-1412(D)之间以及紧邻翻译起点上游(F)插入,即在萤光素酶表达盒的A、B、C、D和F位插入。将内含子插入到编码序列上游的原因在于异常外显子自身同时含上游ATG起始密码子和下游TAA终止密码子。因此,在F位掺入异常外显子应阻止萤光素酶蛋白的合成。通过使用磷酸钙转染法将所获质粒单独转染入293细胞中。随后将游离的5’ss 652/18 AON以终浓度0.5μM加入两组相同的转染细胞的其中一组中。转染后24小时,收集细胞定量萤光素酶表达。对于A-D位的内含子插入,萤光素酶表达的实际水平在相同条件下(即在没有或有AON的情况下)显著变化达3.8倍。但是,这4种构建物的诱导水平是相似的,由4.0倍至5.7倍。构建物A-D的诱导水平的相似性提示,侧翼序列不显著影响可变剪接。在F位插入令人惊奇地产生低诱导水平的表达和相对高的背景表达水平。低诱导水平可能是因为5’可变剪接位点的识别被5’帽结构增强,导致更有效的外显子掺入。高背景水平可能归因于在正确的起始密码子开始的翻译。
因为萤光素酶表达系统能够方便地定量诱导水平和实际表达水平这二者,所以对可变剪接方法和自切割核酶方法(38)进行平行比较。将单拷贝的83bp N79核酶插入到萤光素酶表达盒的Kozak序列和ATG起始密码子上游。通过使用磷酸钙转染法将所获质粒和构建物C单独地转染入293细胞中。对于含核酶的构建物,将丰加霉素以1.5μM的终浓度加入到两组相同的转染细胞的其中一组中。对于含内含子的构建物,将游离的5’ss 652/18 AON以0.5μM的终浓度加入到两组相同的转染细胞的其中一组中。在转染后24小时,收集细胞用于定量萤光素酶表达。含内含子和核酶的构建物的诱导水平分别为5.3倍和1.8倍。另外,含核酶的构建物的实际萤光素酶表达水平是含内含子构建物表达水平的0.4%。含核酶构建物的萤光素酶表达水平较低与以下观点相一致:将含AUG的核酶置于翻译起点上游应导致抑制正确的翻译或合成突变蛋白。含内含子构建物的萤光素酶表达水平较高可能归因于在内含子序列存在下更有效的mRNA3’末端形成。应当澄清的是,对核酶法报告的约260倍萤光素酶表达诱导基于携带插入到萤光素酶表达盒中的两个拷贝的N79核酶的稳定细胞系(38)。
2)在萤光素酶表达盒中插入两个拷贝的IVS2-654内含子,以控制转基因表达。该组实验的目的是测试插入两个拷贝的内含子是否会改善转基因表达的诱导水平,以及两个内含子之间的距离是否对诱导水平具有任何影响。因此,将组合大小为1,700bp的两个拷贝的IVS2-654内含子以(AB、AC、AD、BC、BD和FB)之间不同的距离置于两个不同位点或串联置于一个位点(BB)。通过使用磷酸钙转染法将所获质粒单独转染入293细胞中。随后将游离的5’ss 652/18AON以终浓度0.5μM加入两组相同的转染细胞的其中一组中。转染后24小时,收集细胞用于定量萤光素酶表达。除了BB以外,所有构建物都产生显著降低水平的背景表达。结果,诱导水平被极大提升,在10.1倍至143.3倍的范围内。诱导水平几乎与两个内含子之间的距离成反向关联,而两个内含子串联即BB构建物的情况除外。当两个拷贝的内含子紧密邻近至一定程度时降低水平的背景表达以及由此改善的转基因表达诱导水平,可能是因为可变剪接位点的识别被增强和/或无义介导的mRNA衰变被加速。无义介导的mRNA衰变是一种通过消除编码不完整多肽的异常mRNA而减少基因表达错误的监视途径。对于BB构建物,表达的背景水平显著高于其余组别。较高水平的背景表达可能是因为上游内含子的3’剪接位点和下游内含子的5’剪接位点彼此太接近,以至于剪接位点的识别被削弱。因此,两个最外部的剪接位点可能变成被认识的显性位点。这些结果表明,插入多个拷贝的内含子可改善转基因表达的诱导水平。它们还表明,在内含子之间可能存在最佳距离,该距离会产生最高诱导水平。
3)使IVS2-654内含子的可变剪接位点突变,以调整可变剪接。使850bp IVS2-654内含子中的可变剪接位点突变,以改变其强度。第一个实验包括敲除构建物B的上游可变内含子中的两个潜在分支点中的一个。将在核苷酸564和565处的AA转变为CT,以使上游潜在分支点与共有序列的相似性较低。通过使用磷酸钙转染法将所获质粒转染入293细胞中。随后将游离的5’ss 652/18AON以终浓度0.5μM加入相同的转染细胞组中。转染后24小时,收集细胞用于定量萤光素酶表达。AA→CT突变将诱导水平由4.3倍增加至13倍,同时保留相对高水平的转基因表达诱导。这与当前使用分支点是调节可变剪接的其中一种机制的想法一致。第二个实验设计用于优化可变剪接,方法是在构建物B中将核苷酸657的T转变为G,将核苷酸658的A转变为T,或将TA同时转变为GT。突变将通过使剪接位点更类似于或等同于共有序列而增加可变5’剪接位点的强度。在剪接位点具有单碱基转变的两种构建物都产生约2倍的诱导水平增加。其间,双碱基转变导致诱导水平增加至55倍。诱导水平的增加显然是缘于转基因表达的背景水平比转基因表达的诱导水平更显著地下降。这些结果提示,通过调整分支点的使用以及可变剪接位点的强度,可优化可变剪接,以控制转基因表达。
用于可变剪接的小内含子的开发。IVS2-654内含子长为850个碱基对(bp)。该大小经证明对插入多个拷贝的内含子以控制由AAV介导的转基因表达有问题。这是因为AAV的包装限度是4.7kb。为使内含子尺寸最小化,由构建物B的内含子中缺失一个200bp的片段-核苷酸151-350,产生构建物BΔ200。还没有表明该序列在内含子剪接中起作用。在与构建物B相比时,构建物BΔ200在诱导水平方面没有降低。197bp的内含子也来源于IVS2-654,其含4个必需剪接位点和修饰型可变外显子,以及对β-珠蛋白mRNA 3’末端的有效剪接和形成所必需的5’末端上的前32bp和3’末端上的后57bp。将该197bp内含子插入萤光素酶基因中导致信使的可变剪接,虽然诱导水平与构建物B相比被降低。这些结果表明,IVS2-654内含子可被缩短,而不显著诱导水平。
产生携带含可变剪接内含子的萤光素酶表达盒的转基因小鼠。产生携带萤火虫萤光素酶表达盒的转基因小鼠,该表达盒插入单拷贝的原始850bp IVS2-654内含子。成功传递IVS2-654的特异性AON应抑制外显子掺入,并诱导外显子跳跃,因此导致功能性萤光素酶蛋白的翻译。因此,萤光素酶表达的整体成像可便利地用于监视AON的传递。因为转基因小鼠测定系统不需要标记AON或处死实验小鼠,所以应大大有利于AON传递的优化。在施用AON后于转基因小鼠中成功诱导萤光素酶表达表明了使用AON传递和调节体内转基因表达的可行性。
可变剪接内含子的进一步优化。将两个拷贝的IVS2-654内含子插入相同表达盒中显著降低了转基因表达的背景水平,并增加诱导水平。但是,因为可有效包装的AAV基因组大小被限制在4.7kb,所以插入多个拷贝的850bp IVS2-654内含子应显著降低AAV载体的克隆能力。通过缺失200bp片段缩短IVS2-645内含子产生相似的转基因表达诱导水平,由IVS2-654内含子获得小197bp内含子仍保留经历可变剪接的能力,虽然诱导水平降低。因此,似乎IVS2-654内含子的系统缺失可产生这样的可变剪接内含子,其既具有可接受的诱导水平,又具有适于掺入到AAV载体中的减小尺寸。为控制转基因表达,期望具有可变剪接内含子,其在用于外显子掺入的条件下产生低背景水平的转基因表达,在用于外显子跳跃的条件下产生高诱导水平的转基因表达。通过改变分支点的使用和微调可变剪接位点的强度有可能获得此期望的内含子。这是因为突变其中一个分支点显著增加诱导水平。另外,使剪接位点序列突变大大增加了诱导水平,但同时显著降低了转基因表达的实际水平。内含子的尺寸可最小化,可产生一系列具有修饰型分支点的最小内含子,和/或可产生文库,以筛选具有突变剪接位点的最小内含子,以便产生具有低背景水平和高诱导水平的转基因表达的优化内含子。
例如,可开发能够有效可变剪接的最小内含子。如本文所述,IVS2-654内含子的200bp片段缺失并不降低诱导水平。合成含IVS2-654内含子中所有剪接必需元件的小197bp内含子仍保留经历可变剪接的能力。但该小内含子仅有2.3倍的诱导水平,显著低于IVS2-654内含子的水平,为其水平的4.3分之一。为确定仍应具有与IVS2-654内含子相似的诱导水平的最大缺失,可对含200bp缺失的质粒作进一步缺失,以由核苷酸150至33向5’末端扩展缺失。缺失还可独立地由核苷酸350至519向3’末端扩展。还可在核苷酸660-793之间的下游可变内含子中独立地实施更多缺失。对于每个缺失区域,要缺失的片段大小均可在开始时增加约30bp,随后增加约10bp,用于进一步最大化缺失大小。通过使用例如Stratagene QuikChange多位点定向诱变试剂盒产生缺失突变体。该方法包括使用含期望突变的引物来合成突变链,用DpnI消化,以去除亲代质粒,并将所合成的单链质粒转化入细菌宿主中,以转变为双链质粒。为快速地和定量地测定转基因表达的诱导水平,将使用萤光素酶测定系统。但是,理解控制每个突变内含子作用的机制对于更好地设计控制转基因表达用的内含子应当是必需的。因此,可在独立研究中分析mRNA水平和剪接模式。将获得的构建物独立地转染入293细胞中,以测定其萤光素酶表达的诱导水平。在确定了3种当中每一种的最大缺失后,将它们组合在一种构建物中,测试所获内含子的萤光素酶表达的诱导水平。因为使用最小内含子会最大化插入多个拷贝内含子以控制转基因表达后的AAV克隆能力,所以将由该组实验产生的最小内含子用于余下的提议研究。
产生和评价具有突变分支点的修饰型最小内含子。如本文所述,使上游可变内含子中的两个潜在分支点之一突变将诱导水平由4.3倍增加至13倍。为优化用于在内含子插入后最大化AAV克隆能力的最小内含子,单独地突变4个潜在分支点,并评价其基因表达的诱导水平:上游可变内含子中的两个分支点是核苷酸520-526处的TTTTAAT以及560-566处的CCCTAAT,下游可变内含子中的两个分支点是813-819的TGCTAAT以及831-837的CTCTTAT。因为共有分支点序列是PyNPyUPuAPy,其中Py=C或U,Pu=A或G,而标下划线的A是高度保守的,所以保守的A以及上游A将转变为CT。因为在831-837处的潜在分支点CTCTTAT具有T,而不是保守A上游的保守Pu,所以仅保守的A被突变。分支点和3’剪接位点之间的距离通常为18个碱基,但变化很广。为确定该距离是否对诱导水平有影响,改变距离,以尝试进一步优化诱导水平。如所述通过使用Stratagene QuikChange多位点定向诱变试剂盒产生突变。为快速地和定量地测定转基因表达的诱导水平,将使用萤光素酶测定系统。为理解控制每个突变内含子作用的机制,以便更好地设计控制转基因表达用的内含子,在单独的研究中分析mRNA水平和剪接模式。将获得的构建物独立地转染入293细胞中,以测定其萤光素酶表达的诱导水平。用于上游和下游可变内含子的优化修饰将组合在一种构建物中,测试所获内含子的改善的诱导水平。
由具有突变剪接位点的最小内含子文库的产生和筛选具有低背景水平和高诱导水平的转基因表达的内含子。为最大化内含子插入后的AAV克隆能力,最小内含子将用作产生具有突变剪接位点的内含子的文库的模板。为有利于优化内含子的筛选,在产生文库之前将最小内含子插入到标记表达盒中。使用的标记表达盒是表达嘌呤霉素N-乙酰转移酶和截短形式的单纯疱疹病毒1型胸苷激酶之间的双功能融合蛋白(puΔtk)的表达盒。puΔtk融合蛋白已表明允许分别使用嘌呤霉素和更昔洛韦类似物1-(-2-脱氧-2-氟-1-β-D-阿拉伯呋喃糖基)-5-碘尿嘧啶(FIAU)正选择和负选择表达所述蛋白的细胞。有几种已开发的正/负选择标记,它们应可同样好地用于文库筛选。使5’可变剪接位点突变,以优化内含子的诱导水平。这是因为根据计算剪接位点强度的方法,5’可变剪接位点的强度显著弱于5’和3’剪接位点的强度以及3’可变剪接位点的强度。该选择还因为通过修饰其序列增加5’可变剪接位点的强度显著增加了其诱导水平(但同时降低其整体转基因表达水平)。因为在其中箭头标记外显子-内含子接合处的共有5’剪接位点序列-2AG↓GUPuAGU+6中,+1和+2位的GU是100%保守的,所以-2和-1以及+3至+6位的核苷酸将被突变。为产生突变内含子的文库,将使用Stratagene QuikChange多位点定向诱变试剂盒。
作为产生突变内含子文库的备选方法,在聚合酶链反应(PCR)中独立地使用一对重叠引物,一种引物跨越5’可变剪接位点,在要突变的位置具有简并碱基,另一种引物在内含子的上游或下游。两个独立反应的PCR产物将组合为模板,用于另一轮的PCR反应,以重构突变内含子。获得的PCR产物用限制酶消化,并用于替换亲代质粒中的对应片段,由此产生突变内含子文库。
使用以下策略筛选具有低背景水平和高诱导水平的转基因表达的优化内含子。为使文库的每个克隆都能独立地被表达和选择,在EB病毒(EBV)质粒的主链中产生文库。因为EBV质粒载体能作为附加体增殖,所以其传统上用于转化细胞,以便进行药物选择。将所获质粒文库转染入293细胞或HeLa细胞中。为选择由于其在特异性AON存在下能经历有效的外显子跳跃而具有高转基因表达诱导水平的突变内含子,所述细胞用AON处理,并用嘌呤霉素选择。因为文库应在与5’ss 652/18AON互补的5’可变剪接位点中含有突变,所以将另一种AON即3’ss 579/18用于文库筛选。3’ss 579/18AON是一种与3’可变剪接位点互补的18聚体寡核苷酸,能够以和5’ss 652/18AON相同的效率抑制异常外显子掺入。为消除由于在没有AON的情况下其不能经历有效的外显子掺入而具有高背景水平的转基因表达的突变内含子,嘌呤霉素选择后的抗性细胞将停止使用AON处理。然后用FIAU处理所述细胞,以选择具有低水平puΔtk表达的细胞。用于药物选择的浓度将有所变化,以允许筛选具有最高转基因表达诱导水平的内含子。为从经选择细胞中回收内含子,由细胞提取低分子量DNA,并电穿孔入细菌宿主DH5α中。将回收的内含子再插入到萤光素霉表达盒中,以允许定量其转基因表达的诱导水平。为理解每个经筛选内含子的作用机制,在独立的研究中分析mRNA水平和剪接模式。由此鉴别的具有高转基因表达诱导水平的突变内含子进行DNA测序,以鉴别其序列。
将可变剪接内含子掺入到AAV载体中,以控制动物模型中的长期转基因表达。
因为可变剪接可在体内用于控制转基因表达,所以将可变剪接内含子掺入到AAV载体中应使该载体能够在所治疗动物中长期控制转基因表达。因为插入两个拷贝的IVS2-654内含子显著增加诱导水平,并因为AAV载体的包装限度仅为4.7kb,所以将优化的最小内含子掺入到AAV载体中,以最大化插入内含子后的AAV克隆能力。已知内含子之间的距离可影响转基因表达的诱导水平(图7),构建在不同位置以不同拷贝数插入优化可变内含子的AAV质粒,评价所获AAV载体在体内的最佳转基因表达诱导。通过插入多个拷贝的内含子提升诱导水平还可容易地适用于具有较大包装能力的其它基因转移载体。因此,重要之处在于确定应对转基因表达的诱导水平具有协同作用的最佳内含子数量。
在体外构建和评价携带标记基因、插入优化的可变剪接内含子的AAV质粒。如本文所述,插入两个内含子后的诱导水平与内含子之间的距离反向关联。例外之处是串联的两个内含子仅稍微提升诱导水平。因此,在内含子之间应存在会产生最高诱导水平的最佳距离。为确定最佳距离,将两个拷贝的优化内含子以之间的不同距离插入到萤光素酶基因中。所获AAV基因组的预期大小应不超过4.0kb,其在4.7kb AAV包装限度之内(4.0kb AAV基因组=两个末端重复+启动子+萤光素酶cDNA+两个内含子+polyA=0.29+0.56+1.65+2×0.65+0.2,最小内含子应不超过650bp)。选择萤光素酶基因中的5’AGPu 3’序列(其中Pu=G或A),用于插入优化内含子中。该标准基于以下事实:压倒性多数的5’和3’剪接位点序列分别与共有-2AG↓GUPuAGU+6-4NPyAG↓PuN+2一致,其中箭头标记外显子-内含子接合处。因此,在序列5’AG和Pu 3’之间插入内含子应恢复共有的5’和3’剪接位点。因为AB构建物产生273倍的最佳诱导水平,并在内含子之间具有275bp的距离,所以通过插入两个拷贝的优化内含子开始缩减275bp距离,一个拷贝在B位,另一个拷贝在A位和B位之间的各个候选位点。该组质粒将在两个拷贝的内含子之间具有191、118、105、98、49、30和15bp的距离。为确定两个拷贝的内含子之间的序列是否影响转基因表达的诱导水平,构建另一组插入质粒,其含有在核苷酸964-965之间插入的一个内含子拷贝,另一个内含子拷贝在核苷酸988-1161之间并包括核苷酸988和1161在内的7个候选位点的每个位点处插入。因此,在两个内含子拷贝之间将具有197、153、99、69、52、40和24bp的距离。将所获构建物单独转染入293细胞中,以测定其转基因表达的诱导水平。内含子之间的距离将与诱导水平相关联。为研究插入3个拷贝的优化内含子是否进一步提升转基因表达的诱导水平,我们将使用选自以上实验的插入两个拷贝内含子的优化构建物,用于插入另一个拷贝的内含子。含有3个拷贝内含子的AAV基因组的预期大小应不超过4.65kb,其在4.7kb AAV包装限度之内(4.65kb AAV基因组=两个末端重复序列+启动子+萤光素酶cDNA+三个内含子+polyA=0.29+0.56+1.65+3×0.65+0.2,最小内含子应不超过650bp)。在不同位点插入第三个内含子,使得第三个内含子和最接近的内含子之间将有约800、600、400、200、100和50bp的距离。将所获构建物单独转染入293细胞中,以测定其转基因表达的诱导水平。在以下的萤火虫萤光素酶cDNA核苷酸序列(SEQ ID NO:77)中,将用于内含子插入的潜在位点标以下划线。A-D位由波浪下划线和左侧的相应字母表示。
     1    ATGGAAGACG CCAAAAACAT AAAGAAAGGC CCGGCGCCAT TCTATCCGCT
          GGAAGATGGA ACCGCTGGAG AGCAACTGCA TAAGGCTATG
     91   AAGAGATACG CCCTGGTTCC TGGAACAATT GCTTTTACAG ATGCACATAT
          CGAGGTGGAC ATCACTTACG CTGAGTACTT CGAAATGTCC
     181  GTTCGGTTGG CAGAAGCTAT GAAACGATAT GGGCTGAATA CAAATCACAG
          AATCGTCGTA TGCAGTGAAA ACTCTCTTCA ATTCTTTATG
     271  CCGGTGTTGG GCGCGTTATT TATCGGAGTT GCAGTTGCGC CCGCGAACGA
          CATTTATAAT GAACGTGAAT TGCTCAACAG TATGGGCATT
A    361  TCGCAGCCTA CCGTGGTGTT CGTTTCCAAA AAGGGGTTGC AAAAAATTTT
          GAACGTGCAA AAAAAGCTCC CAATCATCCA AAAAATTATT
     451  ATCATGGATT CTAAAACGGA TTACCAGGGA TTTCAGTCGA TGTACACGTT
          CGTCACATCT CATCTACCTC CCGGTTTTAA TGAATACGAT
     541  TTTGTGCCAG AGTCCTTCGA TAGGGACAAG ACAATTGCAC TGATCATGAA
          CTCCTCTGGA TCTACTGGTC TGCCTAAAGG TGTCGCTCTG
B    631  CCTCATAGAA CTGCCTGCGT GAGATTCTCG CATGCCAGAG ATCCTATTTT
          TGGCAATCAA ATCATTCCGG ATACTGCGAT TTTAAGTGTT
     721  GTTCCATTCC ATCACGGTTT TGGAATGTTT ACTACACTCG GATATTTGAT
          ATGTGGATTT CGAGTCGTCT TAATGTATAG ATTTGAAGAA
     811  GAGCTGTTTC TGAGGAGCCT TCAGGATTAC AAGATTCAAA GTGCGCTGCT
          GGTGCCAACC CTATTCTCCT TCTTCGCCAA AAGCACTCTG
     901  ATTGACAAAT ACGATTTATC TAATTTACAC GAAATTGCTT CTGGTGGCGC
          TCCCCTCTCT AAGGAAGTCG GGGAAGCGGT TGCCAAGAGG
     991  TTCCATCTGC CAGGTATCAG GCAAGGATAT GGGCTCACTG AGACTACATC
          AGCTATTCTG ATTACACCCG AGGGGGATGA TAAACCGGGC
C    1081 GCGGTCGGTA AAGTTGTTCC ATTTTTTGAA GCGAAGGTTG TGGATCTGGA
          TACCGGGAAA ACGCTGGGCG TTAATCAAAG AGGCGAACTG
     1171 TGTGTGAGAG GTCCTATGAT TATGTCCGGT TATGTAAACA ATCCGGAAGC
          GACCAACGCC TTGATTGACA AGGATGGATG GCTACATTCT
     1261 GGAGACATAG CTTACTGGGA CGAAGACGAA CACTTCTTCA TCGTTGACCG
          CCTGAAGTCT CTGATTAAGT ACAAAGGCTA TCAGGTGGCT
D    1351 CCCGCTGAAT TGGAATCCAT CTTGCTCCAA CACCCCAACA TCTTCGACGC
          AGGTGTCGCA GGTCTTCCCG ACGATGACGC CGGTGAACTT
     1441 CCCGCCGCCG TTGTTGTTTT GGAGCACGGA AAGACGATGA CGGAAAAAGA
          GATCGTGGAT TACGTCGCCA GTCAAGTAAC AACCGCGAAA
     1531 AAGTTGCGCG GAGGAGTTGT GTTTGTGGAC GAAGTACCGA AAGGTCTTAC
          CGGAAAACTC GACGCAAGAA AAATCAGAGA GATCCTCATA
     1621 AAGGCCAAGA AGGGCGGAAA GATCGCCGTG TAA
评价由所获AAV载体介导的转基因表达的长期体内控制。将如上所述确定的具有最优转基因表达控制的AAV质粒包装入病毒载体中。通过使用无腺病毒的生产流程产生载体,该流程包括用3种质粒转染293细胞:重组AAV质粒、提供结构性和非结构性AAV基因的AAV辅助质粒以及提供AAV载体产生所必需的辅助基因的腺病毒辅助质粒。获得的AAV载体将通过使用包含碘克沙醇梯度和硫酸肝素层析步骤的纯化方法纯化。然后,通过门静脉注射将纯化载体导入肝脏,以及通过本文所述的直接注射导入骨骼肌和心脏,评价AAV载体介导体内长期可控的转基因表达的能力。在用对照AON或内含子特异性AON注射动物后,通过对小鼠成像确定萤光素酶基因表达的诱导水平。作为对照载体,将携带绿色荧光蛋白(GFP)表达盒的AAV纳入该组实验。
经不同途径(例如门静脉注射、直接肌肉注射、直接心脏注射)用AAV载体注射小鼠。施用特异性AON和对照AON这二者,以调节萤光素酶基因的表达。萤光素酶表达的水平将通过整体成像确定。AAV-luc-int和AAV-GFP分别表示携带插入内含子的萤光素酶表达盒的AAV载体或携带GFP表达盒的AAV载体。
为确定长期控制萤光素酶基因表达的能力,在先前诱导的萤光素酶表达回落至背景水平后再将AON施用给小鼠。新诱导的表达通过整体成像再监测。重复该轮次诱导的表达,以评价转基因表达的长期控制。
插入第三个内含子以在第三个内含子和最近的内含子之间产生不同距离的潜在问题,在于在期望位置可能没有插入所需的5’AGPu3’序列。在此情况下,各个氨基酸的多种密码子选择将用于产生这种插入所需要的序列。例如,在序列5’(NNX)(GPuN)3’(其中各对括号标记密码子)中,核苷酸X可作为沉默突变转变为A,由此产生内含子插入所需要的5’AGPu3’序列。同样,在序列5’(NAZ)(PuNN)3’中,核苷酸Z可作为沉默突变转变为G。在20种氨基酸中,其中11种在其密码子的最后一位含G作为备选,其中12种在其密码子的最后一位含A作为备选。因此,能够在期望位置建立插入位点的可能性相对较高。在AAV感染小鼠中重复诱导萤光素酶表达应允许评价体内转基因表达的长期控制。
实施例5.RETT综合症研究
没有针对RTT的有效疗法。如果发现治疗方法,则6-18个月的生后无症状窗口期可允许在发生永久性神经元损伤之前启动干涉。使用AAV传递正常基因至CNS中是一种合理方法。理想的载体是该研究必需的。发现合适的载体可直接阐明未来治愈或缓解该疾病症状的潜力。通过使用可变剪接作为调节系统,可避免目标基因过表达或表达不足,可控制在正确的发育期表达,并可能有希望满足CNS的正常功能要求。长期目标是在代表RTT的动物模型中将脑特异性传递用的理想载体与可变剪接的可控表达相联。预期这些研究最终导致开发出在患者中安全而有效的转基因表达。
不同血清型的rAAV载体在体内的转导模式。为了确定不同血清型AAV载体在体内的向性,将血清型1-5和8AAV载体导入小鼠肝脏、肌肉和大鼠视网膜中。所测试血清型之间在不同组织中的转基因表达非常不同。AAV1和AAV8可启动在肝脏和肌肉中的最高转基因表达,但AAV5和4可比其它血清型更有效地转导视网膜细胞。在注射后的46天中,转基因(绿色荧光蛋白,GFP)表达成比例增加,这些动物在实验过程中(4个月)保持阳性。使用用于整体基因传递的公开方法在小鼠脑中进行类似分析。
转基因是具有CMV增强子的鸡β-肌动蛋白启动子(CBA)驱动的hAAT(a)和CMV立即早期启动子驱动的EGFP(b)。记分由对各组动物观察到最高蛋白水平(+++++)至各组中的最低表达水平(+)变动。
使用互补AON调节体外基因表达。通过在转基因表达盒中使用已知突变内含子(人β珠蛋白内含子2),已成功实现了在加入AON后调节报告基因表达。
使用内含子特异性GFP作为报告体和AON的校正作用。将突变人β-珠蛋白内含子2构建入GFP cDNA和质粒(pEGFP-mut-int)或病毒(AAV2/EGFP-mut-int)中,它们分别用于转染或感染293细胞。随时间变化检测AON对转基因表达的作用。在治疗后48小时使用荧光显微镜(Leitz DM IRB,Vashaw Scientific Inc)检测GFP表达。AON校正前mRNA异常剪接的效率由GFP阳性细胞指示。
将野生型或突变型内含子插入到萤光素酶cDNA中以调节转基因表达。通过将野生型或突变型人β-珠蛋白内含子2插入到质粒pGL3(Promega)的可读框中,改变萤光素酶前mRNA的剪接。然后,将重构的质粒(pGL3-int-luc)转染入293细胞中。同时,用AON处理一些细胞。在24小时时用微板发光计(Tropix)检查萤光素酶的表达,以评价前mRNA的剪接效率。数据表明,在AON存在下,具有突变内含子的质粒的表达相对于原始质粒增加2-3倍。另外,背景可降低至相当低的水平。基因表达校正表现出AON剂量依赖性关系。
使用互补AON调节体内基因表达。因为AON可非常有效地在体外调节基因表达,所以在体内测试该调节系统。因为使用组织特异性启动子,所以肝脏和肌肉用作靶器官,使用“实时”萤光素酶成像系统(Roper Scientific)易于观察表达。结果提示,AON可在体内有效校正可变剪接。
使用报告基因(例如绿色荧光蛋白GFP)鉴别特异性转导神经元的理想AAV血清型载体。尽管AAV2和其它血清型之间在壳体的氨基酸序列方面有一些差异,但AAV2基因组或邻接AAV2反向末端重复序列的转基因可被包装入不同血清型的壳体中,形成转导病毒体。这提供了一种直接对比参与体内感染的血清型壳体功能的极佳工具。
实验设计和方法。将AAV2/GFP基因组分别包装入AAV血清型1-8壳体中,从而产生用于体内测试的活AAV重组体的集合。进行以下实验:1)将相同颗粒数的不同AAV血清型给予小鼠,以便确定哪种血清型可在CNS中实现最佳表达。鸡β-肌动蛋白启动子(CBA)将用于在所有测试血清型中驱动GFP表达。这是一种组成型非组织特异性启动子。如果必要的话,将在选定血清型中使用诸如NSE启动子的其它启动子,以进一步对比神经元中转基因表达的强度和特异性。2)在最佳AAV血清型中构建由最佳启动子驱动的MeCP2cDNA,在RTT小鼠模型的CNS中测试病毒的MeCP2基因传递。以免疫组织化学以及行为表型的拯救来表征基因表达。
鉴别将转基因传递入小鼠CNS中的合适AAV血清型。制备AAV1-8载体,它们具有相同的AAV2载体基因组,该基因组携带CBA启动子和GFP报告基因(rAAV1-8/CBA-GFP)。病毒将按照3质粒共转染法制备,颗粒数通过DNA酶抗性斑点印迹技术来评价。
在iv灌输200μl甘露醇(25%)后15-20分钟,将各个血清型的约1×1012个颗粒注射入每只野生型C57BL品系小鼠脑的小脑延髓池。在注射后第14天处死小鼠。同时处死未注射的对照。沿冠状平面和旁矢状平面切成切片,如果必要的话,使用荧光显微镜(Leitz DM IRB,Vashaw Scientific Inc)、免疫组织化学(Pierce)和蛋白质印迹研究不同脑部分中的GFP表达。
测试优化载体将MeCP2转基因传递入MeCP2基因缺陷动物中的情况。MeCP2缺陷小鼠模型得自Jackson Laboratory。该模型模拟人类患者中的症状。通过使用该动物模型,可观测所传递基因在体内的作用。将MeCP2cDNA构建入选定的AAV载体(AAV/MeCP2)中,并通过脑池内注射(2×1010个颗粒数)导入小鼠脑中。如下将动物分为两组。在注射后14天测试组1的基因表达,而组2动物保持存活,以评价存活时间,并纵向观测行为和症状改变达1年。
所有动物都根据以下标准监测:1)症状的改善,例如体重、脑重量、存活时间(对比相同年龄的正常和突变动物)以及通过使用红外光束激活的移动监测腔(infrared beam-activated movement-monitoringchamber)(Opto-Varimax-MiniA,Columbus Instruments)监测运动能力。还观察其它症状,如震颤和重呼吸。可对可能由MeCP2过表达产生的症状进行特别关注(例如不能竞食、大小或拒绝交配)。2)然后通过使用兔抗MeCP2抗体(Upstate,Lake Placid)、生物素化山羊抗兔IgG(Vector Laboratories)和Vectastain Elite ABC试剂盒(VectorLaboratories)以免疫组织化学法检测脑中的转基因表达。
如Luikenhuis等(“Expression of MeCP2 in postmitotic neuronsrescues Rett syndrome in mice”PNAS USA 101(16):6033-8(2004年4月6日电子版);其整体在此引入作为参考)所述,使用最大剂量的病毒,希望拯救动物模型表型。
表征一种通过可变剪接调节小鼠脑中的转基因表达的新方法。基因缺陷可引起遗传疾病,包括RTT,而某些基因的过表达也可产生严重问题。研究已表明,在发生严重的运动障碍之前,神经元仅能耐受高至正常水平2-3倍的MeCP2表达。为此,校正水平变成一个重要问题。AAV载体太小,以至于不能携带MeCP2组织特异性启动子盒。为控制过表达,将本文所述的可变剪接调节系统导入到载体盒中。
选择萤光素酶作为报告基因有两个原因:1)底物萤光素可腹膜内注射,并穿过BBB,在那里其可受到在该区域表达的萤光素酶蛋白的作用;和2)萤光素酶成像系统(Roper)允许观察脑中的萤光素酶表达的实时变化,而不用处死动物。测试以AON剂量依赖性方式表现出来的萤光素酶表达。确定要给予的AON的频率和剂量,并与对照(仅GFP载体)相比。在用MeCP2内含子依赖性转基因盒测试前,确定该载体在CNS中的性能。
本文描述的研究已表明,AON可通过经内含子校正增加转基因表达或由于寡核苷酸被清除而降低表达起作用。这使得AON的转基因调节成为一种对目前使用的反式作用盒的有吸引力的替代,所述反式作用盒已显示出有免疫应答倾向。尽管为获得与直接颅内注射实现的表达水平相同的水平需要静脉内注射(IV)更高剂量的AON,但IV法远为便利和实用。
实验设计和方法。本文描述的研究将通过构建在萤光素酶报告基因中的野生型或突变型内含子盒而得以扩展。该内含子依赖性盒将被构建入由适宜启动子驱动的选定AAV载体中。病毒将如上所述产生,并直接注射入C57BL小鼠脑的小脑延髓池中(2×1010个颗粒/小鼠)。收集基线图象,然后给予AON,以在注射后2周诱导萤光素酶表达。评价用于拯救转基因表达的AON的给药剂量和频率。通过使用萤光素酶成像系统(Roper)每周一次直接观察结果。
为确定要注射的AON的适宜剂量,通过静脉内注射将不同剂量的AON(例如0.02μg、1μg、4μg、20μg和100μg的100μl盐水溶液)注射入小鼠中,以获得剂量依赖性转基因表达曲线。对照组仅接受相同量的盐水。这些数据应有助于确定在脑中表达内含子依赖性MeCP2转基因表达所需的AON剂量。
依据本文所述研究,AON诱导的体内转基因表达在一定时间后将逐渐降低。所以,从理论上讲,首次施用AON诱导的萤光素酶表达将在一定时间后降低。因为该降低可实时观测到,所以在表达降低至最初表达水平的一半时给予AON。使用萤光素酶表达将转基因表达保持在稳定水平,并外推至MeCP2的相似表达时间点。所述蛋白的半衰期将确定该实验方法的最终条件(例如分钟对小时)。使用采用S35标记的甲硫氨酸的经典脉冲追踪实验,确定这些蛋白在组织培养物中的半衰期。这些实验条件的建立将允许以保持MeCP2表达于恒定水平的频率施用AON。为解决有关穿越血脑屏障的效率的问题,可使用化学修饰的AON,例如硫代磷酸酯寡核苷酸。确立AAV调节的载体在脑中总体来说对基因治疗领域有重要价值,对与全脑疾病如Rett综合症有关的神经学领域更重要。
应用选定的血清型特异性载体和内含子依赖性剪接调节系统传递MeCP2转基因至小鼠脑中。将依赖于突变型人β-珠蛋白内含子2的调节系统构建入MeCP2cDNA(AAV/MeCP2-mut-int)中。将该转基因盒掺入理想的血清型载体中,并由选定启动子(NSE、CBA等)驱动。转基因小鼠由Jackson Laboratory订购。AON以上文确定的量和频率给予小鼠。在AON传递后,表征动物的转基因表达(如上所述),并如本文所述监测行为变化。
前述实施例阐述了本发明,不应解释为限制本发明。本发明由以下权利要求描述,权利要求的等同方案包含在本发明中。
本文提及的所有出版物、专利申请、专利、专利出版物和其它参考文献都整体引入作为参考,用于与其中提到参考文献的句子和/或段落相关的教导。
表1
Figure A20068002375300781
一个内含子在相对于萤光素酶cDNA的不同位置中的校正效率。
a.Pre-代表在启动子和萤光素酶cDNA之间插入的内含子;
b.与无寡核苷酸相比在寡核苷酸校正后的转基因表达的倍数增加。
c.在寡核苷酸校正后具有突变内含子的质粒的转基因表达相对于萤光素酶cDNA中具有1个野生型内含子的转基因表达的百分率。
表2
Figure A20068002375300782
插入多个内含子的校正效率。
a.Pre-代表在启动子和萤光素酶cDNA之间插入的内含子;
b.与无寡核苷酸相比在寡核苷酸校正后的转基因表达的倍数增加。
c.在寡核苷酸校正后具有突变内含子的质粒的转基因表达相对于萤光素酶cDNA中具有1个野生型内含子的转基因表达的百分率。
表3
  缩短的内含子
  倍数a   4.70±0.92
  野生型%b   191.67±48.58
缩短的内含子的转基因校正效率。
a.与无寡核苷酸相比在寡核苷酸校正后的转基因表达的倍数增加。
b.在寡核苷酸校正后具有突变内含子的质粒的转基因表达相对于萤光素酶cDNA中具有1个野生型内含子的转基因表达的百分率。
序列表
<110>University of North Carolina-Chapel Hill
Samulski,R.Jude
<120>在转录后水平调节核酸表达的方法和组合物
<130>5470-422WO
<150>US 60/676,139
<151>2005-04-29
<160>80
<170>PatentIn version 3.3
<210>1
<211>7713
<212>DNA
<213>人工序列
<220>
<223>质粒TRCBA-int-luc mut(654 C-T)
<220>
<221>内含子
<222>(2739)..(3588)
<400>1
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg   60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag  120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc  180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca  240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc  300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca  360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc  420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat  480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt  540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc  600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta  660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc  720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc  780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg     840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa     900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg     960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc    1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt    1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc    1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt    1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg    1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg    1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg    1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc    1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg    1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc    1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc    1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag    1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc    1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc    1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc    1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg    1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta    1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct    2040
tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc    2100
ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg    2160
aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac    2220
atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat    2280
gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg    2340
ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat    2400
gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa    2460
aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt    2520
atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct    2580
catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag    2640
acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg    2700
cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat    2760
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca    2820
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc    2880
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt    2940
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata    3000
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg    3060
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac    3120
tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg    3180
taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt    3240
taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc    3300
taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta    3360
aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca tataaatatt    3420
tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc    3480
agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc    3540
taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt    3600
tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt    3660
tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag    3720
atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct    3780
ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc    3840
taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt    3900
tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc    3960
agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc    4020
attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag    4080
aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc    4140
gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga    4200
cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta    4260
tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc    4320
aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt    4380
ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac    4440
aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac    4500
cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa    4560
gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt    4620
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct    4680
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt    4740
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc    4800
tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc    4860
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac    4920
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc    4980
cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca    5040
acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc    5100
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc    5160
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct    5220
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa    5280
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc    5340
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact    5400
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg    5460
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt    5520
tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata    5580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg    5640
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa    5700
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc    5760
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg    5820
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta    5880
tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt    5940
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc    6000
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa    6060
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt    6120
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt    6180
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc    6240
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg    6300
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg    6360
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac    6420
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca    6480
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta    6540
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat    6600
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa    6660
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag    6720
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat    6780
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt    6840
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg    6900
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga    6960
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta    7020
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa    7080
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact    7140
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca    7200
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt    7260
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg    7320
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag    7380
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta    7440
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat    7500
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg    7560
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc    7620
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac    7680
cgtattaccg cctttgagtg agctgatacc gct                                 7713
<210>2
<211>7713
<212>DNA
<213>人工序列
<220>
<223>质粒TRCBA-int-luc(wt)
<220>
<221>内含子
<222>(2739)..(3588)
<400>2
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg   60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag  120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc  180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca  240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc  300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca  360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc  420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat  480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt  540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc  600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta  660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc  720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc  780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg  840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa  900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg  960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg    1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc    1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc    1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag    1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc    1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc    1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc    1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg    1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta    1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct    2040
tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc    2100
ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg    2160
aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac    2220
atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat    2280
gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg    2340
ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat    2400
gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa    2460
aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt    2520
atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct    2580
catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag    2640
acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg    2700
cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat    2760
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca    2820
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc    2880
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt    2940
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata    3000
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg    3060
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac    3120
tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg    3180
taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt    3240
taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc    3300
taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta    3360
aagaataaca gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt    3420
tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc    3480
agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc    3540
taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt    3600
tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt    3660
tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag    3720
atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct    3780
ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc    3840
taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt    3900
tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc    3960
agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc    4020
attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag    4080
aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc    4140
gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga    4200
cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta    4260
tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc    4320
aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt    4380
ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac    4440
aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac    4500
cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa    4560
gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt    4620
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct    4680
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt    4740
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc    4800
tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc    4860
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac    4920
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc    4980
cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca    5040
acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc    5100
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc    5160
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct    5220
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa    5280
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc    5340
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact    5400
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg    5460
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt    5520
tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata    5580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg    5640
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa    5700
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc    5760
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg    5820
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta    5880
tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt    5940
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc    6000
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa    6060
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt    6120
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt    6180
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc    6240
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg    6300
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg    6360
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac    6420
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca    6480
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta    6540
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat    6600
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa    6660
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag    6720
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat    6780
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt    6840
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg    6900
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga    6960
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta    7020
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa    7080
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact    7140
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca    7200
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt    7260
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg    7320
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag    7380
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta    7440
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat    7500
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg    7560
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc    7620
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac    7680
cgtattaccg cctttgagtg agctgatacc gct                                 7713
<210>3
<211>7713
<212>DNA
<213>人工序列
<220>
<223>质粒TRCBA-int-luc(654 C-T,657TA-GT)
<220>
<221>内含子
<222>(2739)..(3588)
<400>3
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg     60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag    120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc    180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca    240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc    300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca    360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc     420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat     480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt     540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc     600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta     660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc     720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc     780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg     840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa     900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg     960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc    1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt    1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc    1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt    1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg    1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg    1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg    1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc    1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg    1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc    1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc    1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag    1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc    1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc    1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc    1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg    1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta    1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct    2040
tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc    2100
ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg    2160
aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac    2220
atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat    2280
gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg    2340
ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat    2400
gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa    2460
aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt    2520
atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct    2580
catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag    2640
acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg    2700
cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat    2760
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca    2820
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc    2880
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt    2940
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata    3000
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg    3060
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac    3120
tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg    3180
taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt    3240
taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc    3300
taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta    3360
aagaataaca gtgataattt ctgggttaag gcaagtgcaa tatttctgca tataaatatt    3420
tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc    3480
agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc    3540
taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt    3600
tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt    3660
tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag    3720
atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct    3780
ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc    3840
taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt    3900
tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc    3960
agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc    4020
attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag    4080
aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc    4140
gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga    4200
cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta    4260
tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc    4320
aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt    4380
ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac    4440
aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac    4500
cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa    4560
gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt    4620
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct    4680
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt    4740
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc    4800
tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc    4860
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac    4920
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc    4980
cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca    5040
acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc    5100
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc    5160
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct    5220
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa    5280
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc    5340
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact    5400
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg    5460
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt    5520
tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata    5580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg    5640
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa    5700
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc    5760
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg    5820
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta    5880
tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt    5940
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc    6000
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa    6060
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt    6120
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt    6180
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc    6240
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg    6300
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg    6360
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac    6420
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca    6480
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta    6540
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat    6600
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa    6660
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag    6720
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat    6780
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt    6840
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg    6900
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga    6960
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta    7020
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa    7080
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact    7140
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca    7200
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt    7260
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg    7320
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag    7380
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta    7440
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat    7500
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg    7560
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc    7620
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac    7680
cgtattaccg cctttgagtg agctgatacc  gct                                7713
<210>4
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc mut(654 C-T)
<220>
<221>内含子
<222>(948)..(1797)
<400>4
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac    600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc    660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa    720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc    780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat    840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt    900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga    1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt    1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa    1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca    1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta    1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa    1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg    1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat    1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa    1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc    1560
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat    1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag    1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg    1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga    1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca    1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt    1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag    1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata    2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg    2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga    2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa    2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt    2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa    2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc    2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta    2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat    2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt    2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag    2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa    2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa    2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat    2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt    2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca    2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt    3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga    3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg    3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc    3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta    3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt    3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt    4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt    4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc    4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg    4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc    4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg    4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca    4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga    4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct    4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg    4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca    4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata    4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct    4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact    4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa    4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc    4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga    5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga    5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg    5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct    5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta    5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt    5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg    5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat    5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt    5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca    5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag    5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca    5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac    5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc    5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata                          5860
<210>5
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc(wt)
<220>
<221>内含子
<222>(948)..(1797)
<400>5
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta      60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc     120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc     180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg     240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata     300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat     360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc     420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg     480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa     540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac     600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc     660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa     720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc     780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat     840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt     900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga    1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt    1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa    1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca    1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta    1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa    1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg    1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat    1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa    1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc    1560
accattctaa agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat    1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag    1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg    1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga    1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca    1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt    1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag    1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata    2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg    2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga    2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa    2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt    2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa    2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc    2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta    2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat    2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt    2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag    2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa    2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa    2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat    2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt    2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca    2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt    3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga    3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg    3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc    3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta    3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt    3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt    4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt    4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc    4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg    4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc    4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg    4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca    4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga    4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct    4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg    4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca    4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata    4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct    4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact    4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa    4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc    4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga    5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga    5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg    5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct    5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta    5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt    5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg    5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat    5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt    5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca    5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag    5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca    5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac    5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc    5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata                          5860
<210>6
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc(654 C-T,657 TA-GT)
<220>
<221>内含子
<222>(48)..(1797)
<400>6
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac    600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc     660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa     720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc     780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat     840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt     900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga    1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt    1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa    1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca    1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta    1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa    1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg    1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat    1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa    1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc    1560
accattctaa agaataacag tgataatttc tgggttaagg taagtgcaat atttctgcat    1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag    1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg    1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga    1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca    1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt    1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag    1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata    2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg    2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga    2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa    2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt    2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa    2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc    2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta    2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat    2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt    2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag    2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa    2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa    2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat    2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt    2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca    2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt    3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga    3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg    3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc    3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta    3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt    3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt    4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt    4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc    4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg    4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc    4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg    4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca    4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga    4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct    4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg    4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca    4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata    4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct    4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact    4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa    4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc    4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga    5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga    5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg    5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct    5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta    5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt    5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg    5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat    5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt    5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca    5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag    5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca    5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac    5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc    5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata                          5860
<210>7
<211>6683
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-2int-fron-sph(突变型)
<220>
<221>内含子
<222>(251)..(1100)
<220>
<221>内含子
<222>(1771)..(2620)
<400>7
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta   60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc  120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc  180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg  240
caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt  300
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg  360
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat  420
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta  480
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt  540
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg  600
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac  660
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg  720
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac  780
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga  840
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta  900
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag  960
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080
ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140
attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200
cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta    1260
cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa    1320
tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt    1380
gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga    1440
attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt    1500
gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga    1560
ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc    1620
tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc    1680
actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag    1740
aactgcctgc gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt    1800
tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag    1860
tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt    1920
ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt    1980
tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg    2040
aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac    2100
attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt    2160
cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt    2220
taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat    2280
gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct    2340
ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa    2400
cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata    2460
taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca    2520
ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct    2580
tttgctaatc atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc    2640
aaatcattcc ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt    2700
ttactacact cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag    2760
aagagctgtt tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa    2820
ccctattctc cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac    2880
acgaaattgc ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga    2940
ggttccatct gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc    3000
tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg    3060
aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac    3120
tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg    3180
ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg    3240
aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg    3300
ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg    3360
caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg    3420
gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga    3480
aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac    3540
tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg    3600
tgtaattcta gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg    3660
agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg    3720
atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt    3780
gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa    3840
acctctacaa atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc    3900
aacccagtca gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact    3960
gtcttcttta tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct    4020
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc    4080
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg    4140
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg    4200
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg    4260
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac    4320
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca    4380
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt    4440
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc    4500
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag    4560
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac    4620
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt    4680
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa    4740
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg    4800
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa    4860
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat    4920
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc    4980
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat    5040
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc    5100
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc    5160
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag    5220
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg    5280
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg    5340
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag    5400
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt    5460
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga    5520
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc    5580
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc    5640
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc    5700
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc    5760
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca    5820
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat    5880
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc    5940
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac    6000
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt    6060
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc    6120
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc    6180
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact    6240
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg    6300
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc    6360
gaattttaac aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg    6420
ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata    6480
agtaagtaat attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt    6540
tcattacatc tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat    6600
caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt    6660
gccagaacat ttctctatcg ata                                            6683
<210>8
<211>7547
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-3int-2fron-sph(突变型)
<220>
<221>内含子
<222>(251)..(1100)
<220>
<221>内含子
<222>(1111)..(1960)
<220>
<221>内含子
<222>(2635)..(3484)
<400>8
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt    300
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg    360
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat    420
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta    480
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt    540
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg    600
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac    660
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg    720
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac    780
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga    840
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta     900
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag     960
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt    1020
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac    1080
ctcttatctt cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt    1140
tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag    1200
tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt    1260
ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt    1320
tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg    1380
aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac    1440
attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt    1500
cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt    1560
taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat    1620
gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct    1680
ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa    1740
cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata    1800
taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca    1860
ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct    1920
tttgctaatc atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa    1980
aaacataaag aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca    2040
actgcataag gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc    2100
acatatcgag gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga    2160
agctatgaaa cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc    2220
tcttcaattc tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc    2280
gaacgacatt tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt    2340
ggtgttcgtt tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat    2400
catccaaaaa attattatca tggattctaa aacggattac cagggatttc agtcgatgta    2460
cacgttcgtc acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc    2520
cttcgatagg gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc    2580
taaaggtgtc gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt    2640
ctatgggacc cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg    2700
aaggggagaa gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg    2760
tggaagtctc aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt    2820
tgtttaattc ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc    2880
cttaacattg tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa    2940
aactttacac agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata    3000
ttcataatct ccctacttta ttttctttta tttttaattg atacataatc attatacata    3060
tttatgggtt aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat    3120
tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta    3180
tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc    3240
tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt    3300
tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt catattgcta    3360
atagcagcta caatccagct accattctgc ttttatttta tggttgggat aaggctggat    3420
tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc    3480
acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc    3540
cattccatca cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag    3600
tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga    3660
ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg    3720
acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg    3780
aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc    3840
tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg    3900
tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc    3960
tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg    4020
taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag    4080
acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga    4140
ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc    4200
ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg    4260
ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg    4320
tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag    4380
taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg    4440
ccaagaaggg cggaaagatc gccgtgtaat tctagagtcg gggcggccgg ccgcttcgag    4500
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa    4560
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca    4620
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt    4680
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatcgat aaggatccgt    4740
cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg    4800
actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg    4860
gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg    4920
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc    4980
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt    5040
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag    5100
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc    5160
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc    5220
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt    5280
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt    5340
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc    5400
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa    5460
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa    5520
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg    5580
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga    5640
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg    5700
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg    5760
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt    5820
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact    5880
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat    5940
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg    6000
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg    6060
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat    6120
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc    6180
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt    6240
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc    6300
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga    6360
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc    6420
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa    6480
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta    6540
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg    6600
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg    6660
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat    6720
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt    6780
tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt    6840
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt    6900
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct    6960
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg    7020
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga    7080
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc    7140
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga    7200
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca    7260
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt    7320
acgccagccc aagctaccat gataagtaag taatattaag gtacgggagg tacttggagc    7380
ggccgcaata aaatatcttt attttcatta catctgtgtg ttggtttttt gtgtgaatcg    7440
atagtactaa catacgctct ccatcaaaac aaaacgaaac aaaacaaact agcaaaatag    7500
gctgtcccca gtgcaagtgc aggtgccaga acatttctct atcgata                  7547
<210>9
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-luc A(突变型)
<220>
<221>内含子
<222>(673)..(1522)
<400>9
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta   60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc  120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc  180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg  240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata  300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat  360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc  420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg  480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa  540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac  600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc  660
gtttccaaaa aggtgagtct atgggaccct tgatgttttc tttccccttc ttttctatgg  720
ttaagttcat gtcataggaa ggggagaagt aacagggtac agtttagaat gggaaacaga  780
cgaatgattg catcagtgtg gaagtctcag gatcgtttta gtttctttta tttgctgttc  840
ataacaattg ttttcttttg tttaattctt gctttctttt tttttcttct ccgcaatttt  900
tactattata cttaatgcct taacattgtg tataacaaaa ggaaatatct ctgagataca  960
ttaagtaact taaaaaaaaa ctttacacag tctgcctagt acattactat ttggaatata 1020
tgtgtgctta tttgcatatt cataatctcc ctactttatt ttcttttatt tttaattgat 1080
acataatcat tatacatatt tatgggttaa agtgtaatgt tttaatatgt gtacacatat 1140
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 1200
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 1260
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1320
taaggtaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1380
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttatg 1440
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcatgttcat 1500
acctcttatc ttcctcccac aggggttgca aaaaattttg aacgtgcaaa aaaagctccc 1560
aatcatccaa aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 1620
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga 1680
gtccttcgat agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct    1740
gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga    1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca    1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt    1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag    1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata    2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg    2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga    2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa    2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt    2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa    2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc    2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta    2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat    2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt    2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag    2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa    2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa    2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat    2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt    2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca    2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt    3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga    3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg    3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc    3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta    3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt    3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt    4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt    4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc    4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg    4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc    4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg    4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca    4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga    4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct    4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg    4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca    4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata    4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct    4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact    4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa    4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc    4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga    5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga    5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg    5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct    5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta    5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt    5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg    5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat    5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt    5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca    5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag    5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca    5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac    5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc    5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata                          5860
<210>10
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc B
<220>
<221>内含子
<222>(1440)..(2289)
<400>10
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac    600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc     660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa     720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc     780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat     840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt     900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt     960
ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt    1020
ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga    1080
tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg    1140
gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct    1200
aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt    1260
gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca    1320
gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca    1380
ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaagg    1440
tgagtctatg ggacccttga tgttttcttt ccccttcttt tctatggtta agttcatgtc    1500
ataggaaggg gagaagtaac agggtacagt ttagaatggg aaacagacga atgattgcat    1560
cagtgtggaa gtctcaggat cgttttagtt tcttttattt gctgttcata acaattgttt    1620
tcttttgttt aattcttgct ttcttttttt ttcttctccg caatttttac tattatactt    1680
aatgccttaa cattgtgtat aacaaaagga aatatctctg agatacatta agtaacttaa    1740
aaaaaaactt tacacagtct gcctagtaca ttactatttg gaatatatgt gtgcttattt    1800
gcatattcat aatctcccta ctttattttc ttttattttt aattgataca taatcattat    1860
acatatttat gggttaaagt gtaatgtttt aatatgtgta cacatattga ccaaatcagg    1920
gtaattttgc atttgtaatt ttaaaaaatg ctttcttctt ttaatatact tttttgttta    1980
tcttatttct aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc    2040
atgcctcttt gcaccattct aaagaataac agtgataatt tctgggttaa ggtaatagca    2100
atatttctgc atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat    2160
tgctaatagc agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc    2220
tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc    2280
ctcccacaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa    2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc    2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta    2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat    2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt    2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag    2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa    2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa    2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat    2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt    2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca    2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt    3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga    3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg    3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc    3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta    3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt    3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt    4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt    4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc    4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg    4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc    4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg    4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca    4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga    4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct    4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg    4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca    4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata    4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct    4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact    4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa    4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc    4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga    5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga    5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg    5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct    5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta    5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt    5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg    5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat    5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt    5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca    5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag    5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca    5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac    5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc    5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata                          5860
<210>11
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc C
<220>
<221>内含子
<222>(1691)..(2540)
<400>11
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac    600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc    660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa    720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc    780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat    840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt    900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt    960
ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt   1020
ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga   1080
tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg   1140
gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct   1200
aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt   1260
gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca   1320
gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca    1380
ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga    1440
ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg    1500
accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac    1560
gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat    1620
caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca    1680
ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt    1740
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg    1800
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat    1860
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta    1920
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt    1980
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg    2040
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac    2100
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg    2160
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac    2220
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga    2280
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta    2340
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag    2400
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt    2460
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac    2520
ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt    2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag    2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa    2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa    2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat    2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt    2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca    2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt    3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga    3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg    3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc    3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta    3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt    3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt    4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt    4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc    4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg    4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc    4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg    4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca    4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga    4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct    4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg    4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca    4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata    4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct    4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact    4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa    4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc    4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga    5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga    5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg    5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct    5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta    5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt    5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg    5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat    5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt    5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca    5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag    5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca    5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac    5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc    5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata                          5860
<210>12
<211>5833
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-fron(突变型)
<220>
<221>内含子
<222>(251)..(1100)
<400>12
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt    300
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg    360
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat    420
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta    480
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt    540
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg    600
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac    660
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg    720
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac    780
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga    840
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta    900
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag    960
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt   1020
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac   1080
ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc   1140
attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata   1200
cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta   1260
cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa   1320
tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt   1380
gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga   1440
attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt   1500
gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga   1560
ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc   1620
tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc   1680
actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag   1740
aactgcctgc gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc   1800
ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact   1860
cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt   1920
tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc   1980
cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc   2040
ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct    2100
gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc    2160
cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt    2220
tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag    2280
aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga    2340
caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt    2400
catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga    2460
attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc    2520
cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat    2580
gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg    2640
cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag    2700
aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaattcta    2760
gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca    2820
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc    2880
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt    2940
tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa    3000
atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc aacccagtca    3060
gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta    3120
tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct cactgactcg    3180
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg    3240
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag    3300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac    3360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga    3420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt    3480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc    3540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc    3600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta    3660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat    3720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca    3780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct    3840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt    3900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct    3960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc    4020
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa    4080
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta    4140
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc    4200
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat    4260
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta    4320
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt    4380
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt    4440
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg    4500
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc    4560
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc    4620
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg    4680
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga    4740
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta    4800
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct    4860
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag    4920
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga    4980
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat    5040
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc gccctgtagc    5100
ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc    5160
gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt    5220
ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac    5280
ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag    5340
acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa    5400
actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg    5460
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac    5520
aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg    5580
cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata agtaagtaat    5640
attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt tcattacatc    5700
tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat caaaacaaaa    5760
cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt gccagaacat    5820
ttctctatcg ata                                                       5833
<210>13
<211>6710
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-2int-sph(突变型)
<220>
<221>内含子
<222>(948)..(1797)
<220>
<221>内含子
<222>(1798)..(2647)
<400>13
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac    600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc    660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa    720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc    780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat    840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt    900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga    1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt    1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa    1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca    1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta    1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa    1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg    1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat    1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa    1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc    1560
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat    1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag    1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg    1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacaggtg    1800
agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat    1860
aggaagggga gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca    1920
gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc    1980
ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa    2040
tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa    2100
aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc    2160
atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac    2220
atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt    2280
aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc    2340
ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat    2400
gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg taatagcaat    2460
atttctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg    2520
ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg    2580
gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct    2640
cccacagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg    2700
ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc    2760
gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca    2820
agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga    2880
ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta    2940
aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg    3000
ggctcactga gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg    3060
cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa    3120
cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt    3180
atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg    3240
gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc    3300
tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac    3360
accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc    3420
ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt    3480
acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg    3540
aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa    3600
aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc    3660
gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa    3720
aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct    3780
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg    3840
tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc    3900
cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc    3960
atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg    4020
ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg    4080
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa    4140
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc    4200
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc    4260
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag    4320
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct    4380
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta    4440
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc    4500
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc    4560
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt    4620
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct    4680
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc    4740
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca    4800
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta    4860
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa    4920
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg    4980
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg    5040
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc    5100
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc    5160
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa    5220
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc    5280
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg    5340
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc    5400
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat    5460
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg    5520
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc    5580
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg    5640
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat    5700
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg    5760
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg    5820
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct    5880
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac    5940
atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt    6000
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc    6060
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg    6120
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta    6180
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt    6240
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat    6300
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa    6360
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg    6420
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct    6480
attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg    6540
agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa    6600
tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa    6660
taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata               6710
<210>14
<211>6710
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-2int-Sph-C
<220>
<221>内含子
<222>(948)..(1797)
<220>
<221>内含子
<222>(2541)..(3390)
<400>14
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac    600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc    660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa     720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc     780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat     840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt     900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga    1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt    1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa    1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca    1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta    1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa    1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg    1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat    1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa    1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc    1560
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat    1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag    1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg    1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga    1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca    1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt    1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag    1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata    2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg    2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga    2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa    2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt    2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa    2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc    2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta    2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat    2520
cttcgacgca ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt    2580
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg    2640
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt    2700
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc    2760
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct    2820
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt    2880
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt    2940
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt    3000
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct    3060
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg    3120
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat    3180
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa    3240
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt    3300
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc    3360
atgttcatac ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc    3420
ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt    3480
acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg    3540
aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa    3600
aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc    3660
gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa    3720
aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct    3780
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg    3840
tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc    3900
cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc    3960
atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg    4020
ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg    4080
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa    4140
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc    4200
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc    4260
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag    4320
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct    4380
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta    4440
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc    4500
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc    4560
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt    4620
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct    4680
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc    4740
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca    4800
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta    4860
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa    4920
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg    4980
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg    5040
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc    5100
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc    5160
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa    5220
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc    5280
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg    5340
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc    5400
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat    5460
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg    5520
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc    5580
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg    5640
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat    5700
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg    5760
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg    5820
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct    5880
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac    5940
atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt    6000
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc    6060
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg    6120
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta    6180
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt    6240
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat    6300
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa    6360
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg    6420
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct    6480
attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg    6540
agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa    6600
tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa    6660
taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata               6710
<210>15
<211>5660
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-sint200-sph(突变型)
<220>
<221>内含子
<222>(948)..(1597)
<400>15
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac     600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc     660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa     720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc     780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat     840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt     900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga    1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt    1080
ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt    1140
ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa    1200
tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct    1260
ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc    1320
tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag    1380
tgataatttc tgggttaagg taatagcaat atttctgcat ataaatattt ctgcatataa    1440
attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc    1500
tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt    1560
gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa    1620
tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta    1680
ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag    1740
agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc    1800
tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg    1860
aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt    1920
tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga    1980
ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag    2040
cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt    2100
gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct    2160
tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac    2220
acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc    2280
ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag    2340
gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa    2400
agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa    2460
agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg    2520
acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt    2580
aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt    2640
ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg    2700
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca    2760
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc    2820
tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac    2880
ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc    2940
ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac    3000
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt    3060
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca    3120
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc    3180
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact    3240
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct    3300
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag    3360
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca    3420
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa    3480
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc    3540
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag    3600
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg    3660
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca    3720
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc    3780
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag    3840
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata    3900
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat    3960
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg    4020
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc    4080
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc    4140
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc    4200
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc    4260
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc    4320
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa    4380
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat    4440
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata    4500
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca    4560
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag    4620
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc    4680
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc    4740
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata    4800
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta    4860
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc    4920
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact    4980
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc    5040
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt    5100
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc    5160
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt    5220
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat    5280
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa    5340
ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg    5400
ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt    5460
aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca    5520
ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa    5580
aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc    5640
agaacatttc tctatcgata                                                5660
<210>16
<211>5660
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-sint200-sph(657 GT)
<220>
<221>内含子
<222>(948)..(1597)
<400>16
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta   60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc  120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc  180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg  240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata  300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat  360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc  420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg  480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa  540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac  600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc  660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa  720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc  780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat  840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt  900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg  960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140
ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200
tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260
ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320
tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380
tgataatttc tgggttaagg taagtgcaat atttctgcat ataaatattt ctgcatataa 1440
attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc    1500
tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt    1560
gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa    1620
tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta    1680
ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag    1740
agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc    1800
tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg    1860
aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt    1920
tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga    1980
ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag    2040
cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt    2100
gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct    2160
tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac    2220
acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc    2280
ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag    2340
gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa    2400
agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa    2460
agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg    2520
acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt    2580
aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt    2640
ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg    2700
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca    2760
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc    2820
tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac    2880
ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc    2940
ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac    3000
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt    3060
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca    3120
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc    3180
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact    3240
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct    3300
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag    3360
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca    3420
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa    3480
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc    3540
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag    3600
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg    3660
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca    3720
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc    3780
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag    3840
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata    3900
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat    3960
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg    4020
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc    4080
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc    4140
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc    4200
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc    4260
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc    4320
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa    4380
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat    4440
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata    4500
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca    4560
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag    4620
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc    4680
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc    4740
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata    4800
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta    4860
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc    4920
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact    4980
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc    5040
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt    5100
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc    5160
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt    5220
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat    5280
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa    5340
ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg    5400
ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt    5460
aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca    5520
ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa    5580
aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc    5640
agaacatttc tctatcgata                                                5660
<210>17
<211>5436
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-sint425-sph
<220>
<221>内含子
<222>(948)..(1373)
<400>17
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta     60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc    120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc    180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg    240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata    300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat    360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc    420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg    480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa    540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac     600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc     660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa     720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc     780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat     840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt     900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg     960
acccttgatg ttttctttcc tgtacacata ttgaccaaat cagggtaatt ttgcatttgt    1020
aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact    1080
ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca    1140
ttctaaagaa taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa    1200
atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac    1260
aatccagcta ccattctgct tttattttat ggttgggata aggctggatt attctgagtc    1320
caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca cagagatcct    1380
atttttggca atcaaatcat tccggatact gcgattttaa gtgttgttcc attccatcac    1440
ggttttggaa tgtttactac actcggatat ttgatatgtg gatttcgagt cgtcttaatg    1500
tatagatttg aagaagagct gtttctgagg agccttcagg attacaagat tcaaagtgcg    1560
ctgctggtgc caaccctatt ctccttcttc gccaaaagca ctctgattga caaatacgat    1620
ttatctaatt tacacgaaat tgcttctggt ggcgctcccc tctctaagga agtcggggaa    1680
gcggttgcca agaggttcca tctgccaggt atcaggcaag gatatgggct cactgagact    1740
acatcagcta ttctgattac acccgagggg gatgataaac cgggcgcggt cggtaaagtt    1800
gttccatttt ttgaagcgaa ggttgtggat ctggataccg ggaaaacgct gggcgttaat    1860
caaagaggcg aactgtgtgt gagaggtcct atgattatgt ccggttatgt aaacaatccg    1920
gaagcgacca acgccttgat tgacaaggat ggatggctac attctggaga catagcttac    1980
tgggacgaag acgaacactt cttcatcgtt gaccgcctga agtctctgat taagtacaaa    2040
ggctatcagg tggctcccgc tgaattggaa tccatcttgc tccaacaccc caacatcttc    2100
gacgcaggtg tcgcaggtct tcccgacgat gacgccggtg aacttcccgc cgccgttgtt    2160
gttttggagc acggaaagac gatgacggaa aaagagatcg tggattacgt cgccagtcaa    2220
gtaacaaccg cgaaaaagtt gcgcggagga gttgtgtttg tggacgaagt accgaaaggt    2280
cttaccggaa aactcgacgc aagaaaaatc agagagatcc tcataaaggc caagaagggc    2340
ggaaagatcg ccgtgtaatt ctagagtcgg ggcggccggc cgcttcgagc agacatgata    2400
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt    2460
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt    2520
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt    2580
taaagcaagt aaaacctcta caaatgtggt aaaatcgata aggatccgtc gaccgatgcc    2640
cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc    2700
cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctt    2760
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag    2820
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca    2880
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt    2940
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc    3000
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct    3060
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg    3120
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca    3180
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact    3240
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta    3300
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta    3360
actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct    3420
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt    3480
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga    3540
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca    3600
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat    3660
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg    3720
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt    3780
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag    3840
acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc    3900
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag    3960
ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca    4020
tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa    4080
ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga    4140
tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata    4200
attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca    4260
agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg    4320
ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg    4380
ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg    4440
cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag    4500
gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac    4560
tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca    4620
tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag    4680
tgccacctga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca    4740
gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct    4800
ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt    4860
tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac    4920
gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct    4980
ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt    5040
ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac    5100
aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttgccat tcgccattca    5160
ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagccca    5220
agctaccatg ataagtaagt aatattaagg tacgggaggt acttggagcg gccgcaataa    5280
aatatcttta ttttcattac atctgtgtgt tggttttttg tgtgaatcga tagtactaac    5340
atacgctctc catcaaaaca aaacgaaaca aaacaaacta gcaaaatagg ctgtccccag    5400
tgcaagtgca ggtgccagaa catttctcta tcgata                              5436
<210>18
<211>850
<212>DNA
<213>人工序列
<220>
<223>突变型β-珠蛋白内含子(654 C-T)
<220>
<221>misc_feature
<222>(654)..(654)
<223>β-珠蛋白内含子654 C-T突变
<400>18
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt    60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca   120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt   180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact   240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta   300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt   360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta   420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag   480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt   540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat   600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc   660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata   720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg   780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt   840
cctcccacag                                                          850
<210>19
<211>850
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(1)..(850)
<223>野生型β-珠蛋白内含子
<400>19
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>20
<211>850
<212>DNA
<213>人工序列
<220>
<223>双突变型β-珠蛋白内含子(654 C-T 657 TA-GT)
<220>
<221>misc_feature
<222>(654)..(654)
<223>β-珠蛋白内含子654 C-T突变
<220>
<221>misc_feature
<222>(657)..(658)
<223>β-珠蛋白内含子657 TA-GT突变
<400>20
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagtgc  660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata  720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg  780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt  840
cctcccacag                                                         850
<210>21
<211>2503
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<400>21
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa    720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa    780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa    840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact    900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa    960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg   1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat    1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac    1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt    1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata    1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag    1320
gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag    1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg    1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct    1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat    1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat    1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct    1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa    1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc    1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag    1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga    1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga    1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat    2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg    2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg    2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat    2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc    2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga    2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt    2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga    2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa                      2503
<210>22
<211>2503
<212>DNA
<213>人工序列
<220>
<223>具有野生型β-珠蛋白内含子的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<400>22
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa    720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa    780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa    840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact    900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa    960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg   1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat   1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac   1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt   1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata   1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag   1320
gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag   1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg   1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct   1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat   1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat    1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct    1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa    1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc    1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag    1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga    1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga    1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat    2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg    2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg    2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat    2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc    2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga    2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt    2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga    2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa                      2503
<210>23
<211>2503
<212>DNA
<213>人工序列
<220>
<223>具有双突变型β-珠蛋白内含子(654 C-T 657 TA-GT)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<400>23
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa    720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa    780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa    840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact    900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa    960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg   1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat   1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac   1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt   1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata   1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag   1320
gtaagtgcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag   1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg   1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct   1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat   1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat   1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct   1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa   1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc   1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag   1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga   1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga   1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat   2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg   2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg  2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat  2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc  2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga  2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt  2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga  2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa                    2503
<210>24
<211>3355
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)与翻译起点上游的突变型
β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1)..(850)
<220>
<221>内含子
<222>(1521)..(2370)
<400>24
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt  180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact  240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta  300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt  360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta  420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag  480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt  540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat  600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc  660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata  720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg     780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt     840
cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg     900
ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt     960
cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac    1020
ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac    1080
agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta    1140
tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac    1200
agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt    1260
ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg    1320
gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt    1380
aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg    1440
aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc    1500
gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt tccccttctt    1560
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg    1620
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt    1680
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc    1740
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct    1800
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt    1860
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt    1920
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt    1980
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct    2040
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg    2100
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat    2160
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa    2220
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt    2280
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc    2340
atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc aaatcattcc    2400
ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact    2460
cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt    2520
tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc  2580
cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc  2640
ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct  2700
gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc  2760
cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt  2820
tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag  2880
aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga  2940
caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt  3000
catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga  3060
attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc  3120
cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat  3180
gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg  3240
cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag  3300
aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa       3355
<210>25
<211>4219
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)和翻译起点上游的两个
突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1)..(850)
<220>
<221>内含子
<222>(861)..(1710)
<220>
<221>内含子
<222>(2385)..(3234)
<400>25
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt  180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt tccccttctt    900
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg    960
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt    1020
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc    1080
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct    1140
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt    1200
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt    1260
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt    1320
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct    1380
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg    1440
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat    1500
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa    1560
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt    1620
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc    1680
atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa aaacataaag    1740
aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca actgcataag    1800
gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc acatatcgag    1860
gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga agctatgaaa    1920
cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc tcttcaattc    1980
tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc gaacgacatt    2040
tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt ggtgttcgtt    2100
tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat catccaaaaa    2160
attattatca tggattctaa aacggattac cagggatttc agtcgatgta cacgttcgtc    2220
acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc cttcgatagg    2280
gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc taaaggtgtc    2340
gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt ctatgggacc    2400
cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg aaggggagaa    2460
gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg tggaagtctc    2520
aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt tgtttaattc    2580
ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc cttaacattg    2640
tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa aactttacac    2700
agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata ttcataatct    2760
ccctacttta ttttctttta tttttaattg atacataatc attatacata tttatgggtt    2820
aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat tttgcatttg    2880
taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta tttctaatac    2940
tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc tctttgcacc    3000
attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt tctgcatata    3060
aatatttctg catataaatt gtaactgatg taagaggttt catattgcta atagcagcta    3120
caatccagct accattctgc ttttatttta tggttgggat aaggctggat tattctgagt    3180
ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc acagagatcc    3240
tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc cattccatca    3300
cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag tcgtcttaat    3360
gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga ttcaaagtgc    3420
gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg acaaatacga    3480
tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg aagtcgggga    3540
agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc tcactgagac    3600
tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg tcggtaaagt    3660
tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc tgggcgttaa    3720
tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg taaacaatcc  3780
ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag acatagctta  3840
ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga ttaagtacaa  3900
aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc ccaacatctt  3960
cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg ccgccgttgt  4020
tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg tcgccagtca  4080
agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag taccgaaagg  4140
tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg ccaagaaggg  4200
cggaaagatc gccgtgtaa                                               4219
<210>26
<211>2503
<212>DNA
<213>人工序列
<220>
<223>在可变位点A具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(394)..(1243)
<400>26
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga   60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt  120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc  180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta  240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt  300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt  360
tcgcagccta ccgtggtgtt cgtttccaaa aaggtgagtc tatgggaccc ttgatgtttt  420
ctttcccctt cttttctatg gttaagttca tgtcatagga aggggagaag taacagggta  480
cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca ggatcgtttt  540
agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct tgctttcttt  600
ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt gtataacaaa  660
aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca gtctgcctag  720
tacattacta tttggaatat atgtgtgctt atttgcatat tcataatctc cctactttat     780
tttcttttat ttttaattga tacataatca ttatacatat ttatgggtta aagtgtaatg     840
ttttaatatg tgtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa     900
aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc     960
tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa    1020
taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa atatttctgc    1080
atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta    1140
ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc    1200
ccttttgcta atcatgttca tacctcttat cttcctccca caggggttgc aaaaaatttt    1260
gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga    1320
ttaccaggga tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa    1380
tgaatacgat tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa    1440
ctcctctgga tctactggtctgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt     1500
gagattctcg catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat    1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat    1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct    1680
tcaggattac aagattcaaa gtgcgctgctggtgccaacc ctattctcct tcttcgccaa     1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc    1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag    1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga    1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga    1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat    2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg    2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg    2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat    2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc    2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga    2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt    2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga    2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa                      2503
<210>27
<211>2503
<212>DNA
<213>人工序列
<220>
<223>在可变位点B具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1161)..(2010)
<400>27
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt    720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt    780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac    840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg    900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct    960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat   1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc   1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa   1140
acgctgggcg ttaatcaaag gtgagtctat gggacccttg atgttttctt tccccttctt   1200
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg   1260
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt  1320
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc  1380
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct  1440
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt  1500
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt  1560
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt  1620
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct  1680
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg  1740
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat  1800
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa  1860
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt  1920
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc  1980
atgttcatac ctcttatctt cctcccacag aggcgaactg tgtgtgagag gtcctatgat  2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg  2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg  2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat  2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc  2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga  2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt  2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga  2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa                    2503
<210>28
<211>2503
<212>DNA
<213>人工序列
<220>
<223>在可变位点C具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1412)..(2261)
<400>28
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga    60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt    720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt    780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac    840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg    900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct    960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat   1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc   1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa   1140
acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt   1200
tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct   1260
ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct   1320
ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa   1380
caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt gatgttttct   1440
ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta acagggtaca   1500
gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg atcgttttag   1560
tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg ctttcttttt   1620
ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt ataacaaaag   1680
gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt ctgcctagta   1740
cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc tactttattt   1800
tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa gtgtaatgtt  1860
ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa  1920
tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc  1980
tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata  2040
acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat atttctgcat  2100
ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc  2160
attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc  2220
ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg acgatgacgc  2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga  2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt  2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga  2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa                    2503
<210>29
<211>2505
<212>DNA
<213>人工序列
<220>
<223>具有翻译起点上游的突变型β-珠蛋白内含子的萤光素酶
<220>
<221>内含子
<222>(1)..(850)
<400>29
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt  180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact  240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta  300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt  360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta  420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag  480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt  540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat  600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc     660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata     720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg     780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt     840
cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg     900
ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt     960
cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac    1020
ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac    1080
agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta    1140
tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac    1200
agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt    1260
ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg    1320
gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt    1380
aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg    1440
aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc    1500
gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc ggatactgcg    1560
attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact cggatatttg    1620
atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt tctgaggagc    1680
cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc cttcttcgcc    1740
aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc ttctggtggc    1800
gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct gccaggtatc    1860
aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc cgagggggat    1920
gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt tgtggatctg    1980
gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg    2040
attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga caaggatgga    2100
tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt catcgttgac    2160
cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga attggaatcc    2220
atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc cgacgatgac    2280
gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa    2340
gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg cggaggagtt  2400
gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga  2460
gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa                  2505
<210>30
<211>3353
<212>DNA
<213>人工序列
<220>
<223>具有两个突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<220>
<221>内含子
<222>(1519)..(2368)
<400>30
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga   60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt  120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc  180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta  240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt  300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt  360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa  420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga  480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat  540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga  600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg  660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa  720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa  780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa  840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact  900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa  960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat    1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac    1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt    1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata    1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag    1320
gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag    1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg    1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct    1500
cttatcttcc tcccacaggt gagtctatgg gacccttgat gttttctttc cccttctttt    1560
ctatggttaa gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga    1620
aacagacgaa tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg    1680
ctgttcataa caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc    1740
aatttttact attatactta atgccttaac attgtgtata acaaaaggaa atatctctga    1800
gatacattaa gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg    1860
aatatatgtg tgcttatttg catattcata atctccctac tttattttct tttattttta    1920
attgatacat aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac    1980
acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt    2040
taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc    2100
aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt    2160
ctgggttaag gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact    2220
gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat    2280
tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat    2340
gttcatacct cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg    2400
atactgcgat tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg    2460
gatatttgat atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc    2520
tgaggagcct tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct    2580
tcttcgccaa aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt    2640
ctggtggcgc tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc    2700
caggtatcag gcaaggatat gggctcactg agactacatc agctattctg attacacccg    2760
agggggatga taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg  2820
tggatctgga taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag  2880
gtcctatgat tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca  2940
aggatggatg gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca  3000
tcgttgaccg cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat  3060
tggaatccat cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg  3120
acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga  3180
cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg  3240
gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa  3300
aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa         3353
<210>31
<211>3353
<212>DNA
<213>人工序列
<220>
<223>具有两个突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<220>
<221>内含子
<222>(2262)..(3111)
<400>31
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga   60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt  120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc  180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta  240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt  300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt  360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa  420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga  480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat  540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga  600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg     660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa     720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa     780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa     840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact     900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa     960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg    1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat    1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac    1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt    1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata    1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag    1320
gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag    1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg    1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct    1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat    1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat    1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct    1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa    1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc    1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag    1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga    1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga    1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat    2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg    2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg    2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat    2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt    2280
gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta    2340
acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg    2400
atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg    2460
ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt    2520
ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt    2580
ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc    2640
tactttattt tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa    2700
gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa    2760
ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt    2820
ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt    2880
ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat    2940
atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa    3000
tccagctacc attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca    3060
agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg    3120
acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga    3180
cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg    3240
gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa    3300
aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa           3353
<210>32
<211>2303
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T和200碱基对缺失)的萤光素酶
<220>
<221>内含子
<222>(669)..(1318)
<400>32
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa    720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa    780
tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata    840
atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg    900
ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca    960
tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta   1020
atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg   1080
caccattcta aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca   1140
tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca   1200
gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct   1260
gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag   1320
atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc   1380
atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct   1440
taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa   1500
gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat   1560
acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg   1620
gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg   1680
agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta   1740
aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg   1800
ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca   1860
atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag   1920
cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt   1980
acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca   2040
tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg  2100
ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca  2160
gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga  2220
aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga  2280
agggcggaaa gatcgccgtg taa                                          2303
<210>33
<211>2303
<212>DNA
<213>人工序列
<220>
<223>具有双突变型β-珠蛋白内含子(654 C-T 657 TA-GT和200个碱基对缺失)的
萤光素酶
<220>
<221>内含子
<222>(669)..(1318)
<400>33
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga   60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt  120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc  180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta  240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt  300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt  360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa  420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga  480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat  540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga  600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg  660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa  720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa  780
tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata  840
atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg  900
ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca  960
tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta  1020
atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg  1080
caccattcta aagaataaca gtgataattt ctgggttaag gtaagtgcaa tatttctgca  1140
tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca  1200
gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct  1260
gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag  1320
atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc  1380
atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct  1440
taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa  1500
gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat  1560
acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg  1620
gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg  1680
agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta  1740
aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg  1800
ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca  1860
atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag  1920
cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt  1980
acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca  2040
tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg  2100
ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca  2160
gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga  2220
aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga  2280
agggcggaaa gatcgccgtg taa                                          2303
<210>34
<211>2079
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T和425个碱基对缺失)的萤光素酶
<220>
<221>内含子
<222>(669)..(1094)
<400>34
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccaggt gagtctatgg gacccttgat gttttctttc ctgtacacat attgaccaaa    720
tcagggtaat tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt    780
gtttatctta tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat    840
gtatcatgcc tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa    900
tagcaatatt tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt    960
catattgcta atagcagcta caatccagct accattctgc ttttatttta tggttgggat   1020
aaggctggat tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta   1080
tcttcctccc acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta   1140
agtgttgttc cattccatca cggttttgga atgtttacta cactcggata tttgatatgt   1200
ggatttcgag tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag   1260
gattacaaga ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc   1320
actctgattg acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc   1380
ctctctaagg aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa   1440
ggatatgggc tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa   1500
ccgggcgcgg tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc   1560
gggaaaacgc tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg   1620
tccggttatg taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta   1680
cattctggag acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg  1740
aagtctctga ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg  1800
ctccaacacc ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt  1860
gaacttcccg ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc  1920
gtggattacg tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt  1980
gtggacgaag taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc  2040
ctcataaagg ccaagaaggg cggaaagatc gccgtgtaa                         2079
<210>35
<211>7449
<212>DNA
<213>人工序列
<220>
<223>具有抗胰蛋白酶和突变型β-珠蛋白内含子(654 C-T)的质粒TRCBA
<220>
<221>内含子
<222>(2866)..(3715)
<223>突变型β-珠蛋白内含子(654C-T)
<400>35
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg   60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag  120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc  180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca  240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc  300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca  360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc  420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat  480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt  540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc  600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta  660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc  720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc  780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg  840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa     900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg     960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc    1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt    1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc    1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt    1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg    1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg    1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg    1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc    1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg    1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc    1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc    1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag    1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc    1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc    1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc    1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg    1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta    1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcgat    2040
atcaagcttg gggattttca ggcaccacca ctgacctggg acagtgaatc gacaatgccg    2100
tcttctgtct cgtggggcat cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc    2160
ctggctgagg atccccaggg agatgctgcc cagaagacag atacatccca ccatgatcag    2220
gatcacccaa ccttcaacaa gatcaccccc aacctggctg agttcgcctt cagcctatac    2280
cgccagctgg cacaccagtc caacagcacc aatatcttct tctccccagt gagcatcgct    2340
acagcctttg caatgctctc cctggggacc aaggctgaca ctcacgatga aatcctggag    2400
ggcctgaatt tcaacctcac ggagattccg gaggctcaga gccatgaagg ctgccaggaa    2460
ctcctccgta ccctcaacca gccagacagc cagctccagc tgaccaccgg caatggcctg    2520
tgcctcagcg agggcctgaa gcaagtggat aagtttttgg aggatgttaa aaagttgtac    2580
cactcataag ccttcactgt caacttcggg gacaccgaag aggccaagaa acagatcaac    2640
gattacgttg agaagggtac tcaagggaaa atggtggatg tggtcaagga gcttgacaga    2700
gacacagttt ttgctctggt gaattacatc ttctttaaag gcaaatggga gagacccttt    2760
gaagtcaagg acaccgagga agaggacttc cacgtggacc aggtgaccac cgtgaaggtg    2820
cctatgatga agcgtttagt catgtttaac atccagcact gtaaggtgag tctatgggac    2880
ccttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggaga    2940
agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct    3000
caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt    3060
cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt    3120
gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca    3180
cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc    3240
tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt    3300
taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt    3360
gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata    3420
ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac    3480
cattctaaag aataacagtg ataatttctg ggttaaggta atagcaatat ttctgcatat    3540
aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct    3600
acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag    3660
tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagaagct    3720
ttccagctgg gtgctgctga tgaaatacct gggcaatgcc accgccatct tcttcctgcc    3780
tgatgagggg aaactacagc acctggaaaa tgaactcacc cacgatatca tcaccaagtt    3840
cctggaaaat gaagacagaa ggtctgccag cttacattta cccaaactgt ccattactgg    3900
aacctatgat ctgaagagcg tcctgggtca actgggcatc actaaggtct tcagcaatgg    3960
ggctgacctc tccgtggtca cagaggaggc acccctgaag ctctccaatg ccgtgcataa    4020
ggctgtgctg accatcgacg agaaagggac tgaagctgct ggggccatgt ttttagaggc    4080
catacccatg tctatccccc ccgaggtcaa ggtcaacaaa ccctttgtct tcttaatgat    4140
tgaacaaaat accaagtctc ccctcttcat gggaaaagtg gtgaatccca cccaaaaata    4200
actgcctctc gctcctcaac ccctcccctc catccctggc cccctccctg gatgacatta    4260
aagaagggtt gagctggtaa cccccccccc ccctgcaggg gccctcgacc cgggcggccg    4320
cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag    4380
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata    4440
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg    4500
gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag    4560
gatctaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac    4620
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag    4680
cgagcgagcg cgcagagagg gagtggccaa cccccccccc cccccccctg cagcctggcg    4740
taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgtagcc tgaatggcga    4800
atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag    4860
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt    4920
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt    4980
ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg    5040
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt    5100
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt    5160
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca    5220
aaaatttaac gcgaatttta acaaaatatt aacgtttaca atttcctgat gcgctatttt    5280
ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc    5340
tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga    5400
cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc    5460
atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata    5520
cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact    5580
tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaatact ttcaaatatg    5640
tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt    5700
atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct    5760
gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca    5820
cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc    5880
gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc    5940
cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg    6000
gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta    6060
tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc    6120
ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt    6180
gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg    6240
cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct    6300
tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc    6360
tcggcccttc cggctggctg gtttattgcg gataaatctg gagccggtga gcgtgggtct    6420
cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac    6480
acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc    6540
tcactgatta agcattggta actgtcagac caagtttact catatatact ttagattgat    6600
ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg    6660
accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc    6720
aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa    6780
ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag    6840
gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta    6900
ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta    6960
ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag    7020
ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg    7080
gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg    7140
cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag    7200
cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc    7260
cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa    7320
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg    7380
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct    7440
gataccgct                                                            7449
<210>36
<211>2107
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)的抗胰蛋白酶
<220>
<221>内含子
<222>(772)..(1621)
<223>突变型β-珠蛋白内含子(654 C-T)
<400>36
atgccgtctt ctgtctcgtg gggcatcctc ctgctggcag gcctgtgctg cctggtccct   60
gtctccctgg ctgaggatcc ccagggagat gctgcccaga agacagatac atcccaccat  120
gatcaggatc acccaacctt caacaagatc acccccaacc tggctgagtt cgccttcagc  180
ctataccgcc agctggcaca ccagtccaac agcaccaata tcttcttctc cccagtgagc  240
atcgctacag cctttgcaat gctctccctg gggaccaagg ctgacactca cgatgaaatc  300
ctggagggcc tgaatttcaa cctcacggag attccggagg ctcagagcca tgaaggctgc  360
caggaactcc tccgtaccct caaccagcca gacagccagc tccagctgac caccggcaat  420
ggcctgtgcc tcagcgaggg cctgaagcaa gtggataagt ttttggagga tgttaaaaag  480
ttgtaccact cataagcctt cactgtcaac ttcggggaca ccgaagaggc caagaaacag  540
atcaacgatt acgttgagaa gggtactcaa gggaaaatgg tggatgtggt caaggagctt  600
gacagagaca cagtttttgc tctggtgaat tacatcttct ttaaaggcaa atgggagaga  660
ccctttgaag tcaaggacac cgaggaagag gacttccacg tggaccaggt gaccaccgtg  720
aaggtgccta tgatgaagcg tttagtcatg tttaacatcc agcactgtaa ggtgagtcta  780
tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag  840
gggagaagta acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg  900
aagtctcagg atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt  960
ttaattcttg ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt 1020
aacattgtgt ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac 1080
tttacacagt ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc 1140
ataatctccc tactttattt tcttttattt ttaattgata cataatcatt atacatattt 1200
atgggttaaa gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt 1260
gcatttgtaa ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt 1320
ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct 1380
ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct 1440
gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata 1500
gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1560
tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1620
gaagctttcc agctgggtgc tgctgatgaa atacctgggc aatgccaccg ccatcttctt 1680
cctgcctgat gaggggaaac tacagcacct ggaaaatgaa ctcacccacg atatcatcac    1740
caagttcctg gaaaatgaag acagaaggtc tgccagctta catttaccca aactgtccat    1800
tactggaacc tatgatctga agagcgtcct gggtcaactg ggcatcacta aggtcttcag    1860
caatggggct gacctctccg tggtcacaga ggaggcaccc ctgaagctct ccaatgccgt    1920
gcataaggct gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt    1980
agaggccata cccatgtcta tcccccccga ggtcaaggtc aacaaaccct ttgtcttctt    2040
aatgattgaa caaaatacca agtctcccct cttcatggga aaagtggtga atcccaccca    2100
aaaataa                                                              2107
<210>37
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>37
gctattacct  taacccag                                                   18
<210>38
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>38
gcacttacct  taacccag                                                   18
<210>39
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>39
caagggtccc atagtctc                                                    18
<210>40
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>40
gaaagagatg agggaaag                                        18
<210>41
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>41
gaaagagaag agggaaag                                        18
<210>42
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>42
cctcttacct cagttaca                                        18
<210>43
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>43
ctgtgggagt  aagataag                                       18
<210>44
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>44
gctcttacct taacccag                                       18
<210>45
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>45
gcaattacct taacccag                                            18
<210>46
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>46
caagggtccc atagactc                                            18
<210>47
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>47
gaaagagatt agggaaag                                            18
<210>48
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>48
ctgtgggagg aagataag                                            18
<210>49
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>49
cctcttacat cagttaca                                            18
<210>50
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564 CT突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(564)..(565)
<223>564 CT突变
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<400>50
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>51
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有657G突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<220>
<221>misc_feature
<222>(657)..(657)
<223>657G突变
<400>51
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>52
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有658T突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<220>
<221>misc_feature
<222>(658)..(658)
<223>658T突变
<400>52
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt  180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact  240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta  300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt  360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta  420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag  480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt  540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat  600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaattgc  660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata  720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg  780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt  840
cctcccacag                                                         850
<210>53
<211>650
<212>DNA
<213>人工序列
<220>
<223>具有200个碱基对缺失的IVS2-654内含子
<220>
<221>misc_feature
<222>(454)..(454)
<223>C至T突变
<400>53
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct  180
actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag    240
tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat    300
tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc    360
cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc    420
taaagaataa cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata    480
tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat    540
ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa    600
gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag               650
<210>54
<211>426
<212>DNA
<213>人工序列
<220>
<223>具有425bp缺失的IVS2-654内含子
<220>
<221>misc_feature
<222>(230)..(230)
<223>C至T突变
<400>54
gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta     60
attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct    120
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg    180
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggt aatagcaata    240
tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc    300
taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg    360
attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc    420
ccacag                                                               426
<210>55
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有6A突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(6)..(6)
<223>6A突变
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<400>55
gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>56
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564C突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(564)..(564)
<223>564C突变
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<400>56
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>57
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有841A突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<220>
<221>misc_feature
<222>(841)..(841)
<223>841A突变
<400>57
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
actcccacag                                                           850
<210>58
<211>850
<212>DNA
<213>人工序列
<220>
<223>突变型β-珠蛋白内含子(705T-G)
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>58
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt  540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat  600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc  660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata  720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg  780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt  840
cctcccacag                                                         850
<210>59
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564 CT突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(564)..(565)
<223>564CT突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>59
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt  180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact  240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta  300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt  360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta  420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag  480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt  540
atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat  600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc  660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>60
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有657G突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(657)..(657)
<223>657G突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>60
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>61
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有658T突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(658)..(658)
<223>658T突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>61
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaattgc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>62
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有657GT突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(657)..(658)
<223>657GT突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>62
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagtgc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>63
<211>650
<212>DNA
<213>人工序列
<220>
<223>具有200bp缺失的IVS2-705内含子
<220>
<221>misc_feature
<222>(505)..(505)
<223>T至G突变
<400>63
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt   60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca  120
tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct  180
actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag  240
tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat  300
tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc  360
cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc  420
taaagaataa cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata  480
tttctgcata taaattgtaa ctgaggtaag aggtttcata ttgctaatag cagctacaat  540
ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa  600
gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag             650
<210>64
<211>426
<212>DNA
<213>人工序列
<220>
<223>具有425bp缺失的IVS2-705内含子
<220>
<221>misc_feature
<222>(281)..(281)
<223>T至G突变
<400>64
gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta   60
attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct  120
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg  180
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata  240
tttctgcata taaatatttc tgcatataaa ttgtaactga ggtaagaggt ttcatattgc  300
taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg  360
attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc  420
ccacag                                                             426
<210>65
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有6A突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(6)..(6)
<223>6A突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>65
gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>66
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564C突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(564)..(564)
<223>564C突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>66
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
cctcccacag                                                           850
<210>67
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有841A突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<220>
<221>misc_feature
<222>(841)..(841)
<223>841A突变
<400>67
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt     60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca    120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt    180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact    240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta    300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt    360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta    420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag    480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt    540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat    600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc    660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata    720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg    780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt    840
actcccacag                                                           850
<210>68
<211>196
<212>DNA
<213>人工序列
<220>
<223>IVS2-654内含子197bp
<400>68
gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa     60
tactttccct cttctctttc tttcaggtga ttgactgact gggttaaggt aatagcgccg    120
ttgaaaacct cagccgtata gtccaagcta ggcccttttg ctaatcatgt tcatacctct    180
tatcttcctc ccacag                                                    196
<210>69
<211>247
<212>DNA
<213>人工序列
<220>
<223>IVS-654内含子247bp
<400>69
gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa     60
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc    120
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat    180
ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct    240
cccacag                                                              247
<210>70
<211>14667
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(1)..(14667)
<223>CFTR基因外显子19
<220>
<221>misc_feature
<222>(12191)..(12191)
<223>3849+10kb C至T突变位点
<400>70
gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc     60
tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat    120
taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga    180
gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt    240
aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag    300
atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt    360
aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag    420
tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt    480
atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc    540
ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc    600
ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt    660
gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg    720
attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta     780
aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca     840
gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga     900
gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta     960
atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat    1020
catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta    1080
gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat    1140
aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc    1200
tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta    1260
aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt    1320
ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt    1380
agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta    1440
ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta    1500
tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc    1560
agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt    1620
ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca    1680
gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga    1740
caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac    1800
agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct    1860
ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac    1920
tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa    1980
tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc    2040
ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat    2100
aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat    2160
taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg    2220
aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc    2280
taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa    2340
gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt    2400
tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc    2460
tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg    2520
ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag    2580
gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac    2640
aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt    2700
cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt    2760
attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat    2820
tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc    2880
aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt    2940
gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa    3000
acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc    3060
atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa    3120
agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa    3180
tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct    3240
atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct    3300
caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg    3360
cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc    3420
caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa    3480
tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc    3540
tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct    3600
atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga    3660
gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct    3720
ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca    3780
accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc    3840
caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct    3900
ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag    3960
gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag    4020
ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac    4080
agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc    4140
agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag    4200
cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg    4260
aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca    4320
aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat    4380
tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc    4440
acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa    4500
gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca    4560
tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg    4620
ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc    4680
tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc    4740
tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag    4800
aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca    4860
atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat    4920
gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg    4980
gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc    5040
caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga    5100
aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca    5160
tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct    5220
attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa    5280
taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact    5340
gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt    5400
gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt    5460
gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt    5520
ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt    5580
tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg    5640
tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc    5700
ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg    5760
atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa    5820
cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt    5880
tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg    5940
aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt    6000
tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt    6060
ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt    6120
tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt    6180
gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca    6240
tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa    6300
aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt    6360
ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt    6420
ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt    6480
atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa    6540
gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct    6600
tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc    6660
aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa    6720
attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt    6780
atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca    6840
ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga    6900
aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt    6960
tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta    7020
attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag    7080
gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa    7140
gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg    7200
attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc    7260
cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt    7320
tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca    7380
tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt    7440
atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt    7500
ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt    7560
ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac    7620
tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt    7680
gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg    7740
ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca    7800
ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt    7860
tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa    7920
taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt    7980
ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac    8040
ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa    8100
ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa    8160
ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg    8220
acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc    8280
tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac    8340
ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac    8400
ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa    8460
ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt    8520
ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat    8580
gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct    8640
tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca    8700
aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat    8760
gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt    8820
ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc    8880
ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga    8940
atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt    9000
ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt    9060
tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct    9120
cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg    9180
ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt    9240
tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag    9300
cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat    9360
catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg    9420
ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc    9480
ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata    9540
ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta    9600
tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag   9660
tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc   9720
ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag   9780
tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc   9840
tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga   9900
gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca   9960
gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac  10020
tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc  10080
tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat  10140
ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag  10200
gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg  10260
ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta  10320
ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat  10380
tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca  10440
cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt  10500
tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg  10560
tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata  10620
agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat  10680
tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc  10740
ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct  10800
gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg  10860
gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc  10920
gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat  10980
aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag  11040
cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc  11100
aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa  11160
atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct  11220
gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta  11280
atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct  11340
gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg  11400
aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat  11460
actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac  11520
ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt  11580
ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt  11640
cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg  11700
ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga  11760
tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact  11820
taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa  11880
gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa  11940
acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg  12000
ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac  12060
acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt  12120
gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt  12180
attaaaatgg cgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt  12240
acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga  12300
tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag  12360
ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag  12420
aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag  12480
actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca  12540
ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa  12600
ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct  12660
aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt  12720
agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg  12780
atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt  12840
acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa  12900
aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt  12960
gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga  13020
ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat  13080
ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact  13140
ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt  13200
gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga  13260
ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg  13320
attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat  13380
ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt  13440
accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa  13500
acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat  13560
agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat  13620
tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga  13680
aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa  13740
aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca  13800
gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc  13860
tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc  13920
tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat  13980
ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga  14040
aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta  14100
ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc  14160
tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg  14220
tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta  14280
ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat  14340
gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag  14400
taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc  14460
tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc  14520
aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat  14580
ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga  14640
agtgatccca tcacttttac cttatag                                      14667
<210>71
<211>14667
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(1)..(14667)
<223>19含3849+10kb C至T突变的CFTR外显子
<220>
<221>misc_feature
<222>(12191)..(12191)
<223>3849+10kb C至T突变
<400>71
gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc     60
tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat    120
taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga    180
gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt    240
aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag    300
atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt    360
aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag    420
tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt    480
atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc    540
ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc    600
ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt    660
gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg    720
attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta    780
aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca    840
gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga    900
gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta    960
atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat   1020
catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta   1080
gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat   1140
aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc   1200
tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta   1260
aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt   1320
ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt   1380
agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta   1440
ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta    1500
tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc    1560
agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt    1620
ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca    1680
gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga    1740
caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac    1800
agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct    1860
ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac    1920
tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa    1980
tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc    2040
ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat    2100
aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat    2160
taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg    2220
aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc    2280
taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa    2340
gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt    2400
tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc    2460
tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg    2520
ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag    2580
gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac    2640
aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt    2700
cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt    2760
attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat    2820
tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc    2880
aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt    2940
gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa    3000
acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc    3060
atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa    3120
agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa    3180
tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct    3240
atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct    3300
caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg    3360
cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc    3420
caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa    3480
tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc    3540
tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct    3600
atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga    3660
gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct    3720
ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca    3780
accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc    3840
caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct    3900
ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag    3960
gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag    4020
ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac    4080
agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc    4140
agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag    4200
cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg    4260
aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca    4320
aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat    4380
tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc    4440
acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa    4500
gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca    4560
tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg    4620
ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc    4680
tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc    4740
tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag    4800
aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca    4860
atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat    4920
gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg    4980
gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc    5040
caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga    5100
aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca    5160
tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct    5220
attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa    5280
taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact    5340
gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt    5400
gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt    5460
gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt    5520
ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt    5580
tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg    5640
tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc    5700
ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg    5760
atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa    5820
cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt    5880
tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg    5940
aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt    6000
tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt    6060
ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt    6120
tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt    6180
gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca    6240
tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa    6300
aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt    6360
ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt    6420
ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt    6480
atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa    6540
gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct    6600
tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc    6660
aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa    6720
attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt    6780
atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca    6840
ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga    6900
aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt    6960
tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta    7020
attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag    7080
gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa    7140
gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg    7200
attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc    7260
cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt    7320
tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca    7380
tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt    7440
atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt    7500
ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt    7560
ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac    7620
tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt    7680
gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg    7740
ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca    7800
ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt    7860
tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa    7920
taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt    7980
ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac    8040
ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa    8100
ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa    8160
ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg    8220
acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc    8280
tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac    8340
ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac    8400
ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa    8460
ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt    8520
ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat    8580
gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct    8640
tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca    8700
aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat    8760
gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt    8820
ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc    8880
ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga    8940
atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt    9000
ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt    9060
tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct    9120
cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg    9180
ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt    9240
tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag    9300
cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat    9360
catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg    9420
ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc    9480
ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata    9540
ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta    9600
tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag    9660
tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc    9720
ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag    9780
tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc    9840
tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga    9900
gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca    9960
gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac   10020
tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc   10080
tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat   10140
ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag   10200
gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg   10260
ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta  10320
ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat  10380
tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca  10440
cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt  10500
tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg  10560
tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata  10620
agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat  10680
tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc  10740
ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct  10800
gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg  10860
gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc  10920
gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat  10980
aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag  11040
cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc  11100
aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa  11160
atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct  11220
gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta  11280
atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct  11340
gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg  11400
aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat  11460
actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac  11520
ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt  11580
ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt  11640
cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg  11700
ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga  11760
tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact  11820
taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa  11880
gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa  11940
acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg  12000
ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac  12060
acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt  12120
gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt  12180
attaaaatgg tgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt  12240
acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga  12300
tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag  12360
ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag  12420
aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag  12480
actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca  12540
ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa  12600
ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct  12660
aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt  12720
agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg  12780
atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt  12840
acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa  12900
aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt  12960
gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga  13020
ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat  13080
ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact  13140
ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt  13200
gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga  13260
ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg  13320
attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat  13380
ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt  13440
accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa  13500
acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat  13560
agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat  13620
tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga  13680
aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa  13740
aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca  13800
gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc  13860
tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc  13920
tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat  13980
ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga  14040
aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta  14100
ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc  14160
tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg  14220
tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta  14280
ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat  14340
gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag  14400
taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc  14460
tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc  14520
aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat  14580
ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga  14640
agtgatccca tcacttttac cttatag                                      14667
<210>72
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>72
gtcttactcg ccatttta                                                   18
<210>73
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<220>
<221>misc_feature
<222>(10)..(10)
<223>3849+10kb C至T突变
<400>73
gtcttactca ccatttta                                                18
<210>74
<211>3733
<212>DNA
<213>Mus musculus
<220>
<221>misc_feature
<222>(1)..(3733)
<223>野生型Mus musculus肌养蛋白内含子22、外显子23和内含子23的序列
<220>
<221>内含子
<222>(1)..(913)
<223>内含子22
<220>
<221>外显子
<222>(914)..(1126)
<223>外显子23
<220>
<221>内含子
<222>(1127)..(3733)
<223>内含子23
<400>74
gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca   60
tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata  120
gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt  180
ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa  240
agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag  300
tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa  360
tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa  420
caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc  480
tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt  540
ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat  600
taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc  660
acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa  720
tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat  780
atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt  840
accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct    900
atttaatttt gag gct ctg caa agt tct ttg aaa gag caa caa aat ggc       949
             Ala Leu Gln Ser Ser Leu Lys Glu Gln Gln Asn Gly
             1            5                10
ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct      997
Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro
      15               20               25
tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg     1045
Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly
   30               35               40
cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta     1093
His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu
45               50               55               60
gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt   1146
Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln
             65               70
taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta   1206
cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca   1266
acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata   1326
aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta   1386
aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca   1446
tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc   1506
actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc   1566
ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag   1626
actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca   1686
taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt   1746
caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc   1806
atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat   1866
ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt   1926
taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt   1986
tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact   2046
ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa   2106
aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct   2166
ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg   2226
ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa   2286
ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt    2346
gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta    2406
acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta    2466
atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg    2526
ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt    2586
tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc    2646
tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg    2706
tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa    2766
ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta    2826
agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt    2886
ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt    2946
ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc    3006
atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac    3066
atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat    3126
aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat    3186
ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt    3246
taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac    3306
tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg    3366
agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag    3426
ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat    3486
aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat    3546
gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac    3606
aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc    3666
atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt    3726
attccag                                                              3733
<210>75
<211>3733
<212>DNA
<213>Mus musculus
<220>
<221>misc_feature
<222>(1)..(3733)
<223>mdx Mus musculus肌养蛋白内含子22、外显子23和内含子23
     的序列
<220>
<221>内含子
<222>(1)..(913)
<223>内含子22
<220>
<221>外显子
<222>(914)..(1126)
<223>外显子23
<220>
<221>misc_feature
<222>(941)..(941)
<223>mdx C至T无义突变
<220>
<221>内含子
<222>(1127)..(3733)
<223>内含子23
<400>75
gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca   60
tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata  120
gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt  180
ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa  240
agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag  300
tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa  360
tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa  420
caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc  480
tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt  540
ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat  600
taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc  660
acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa  720
tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat  780
atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt  840
accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct  900
atttaatttt gag gct ctg caa agt tct ttg aaa gag caa taa aat ggc     949
             Ala Leu Gln Ser Ser Leu Lys Glu Gln    Asn Gly
            1             5                   10
ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct    997
Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro
          15               20               25
tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg   1045
Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly
       30               35               40
cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta   1093
His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu
   45               50               55
gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146
Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln
60               65                70
taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta    1206
cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca    1266
acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata    1326
aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta    1386
aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca    1446
tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc    1506
actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc    1566
ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag    1626
actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca    1686
taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt    1746
caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc    1806
atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat    1866
ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt    1926
taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt    1986
tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact    2046
ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa    2106
aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct    2166
ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg    2226
ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa    2286
ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt    2346
gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta    2406
acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta    2466
atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg    2526
ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt    2586
tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc    2646
tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg    2706
tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa    2766
ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta    2826
agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt    2886
ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt    2946
ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc    3006
atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac    3066
atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat    3126
aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat    3186
ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt    3246
taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac    3306
tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg    3366
agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag    3426
ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat    3486
aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat    3546
gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac    3606
aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc    3666
atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt    3726
attccag    3733
<210>76
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<220>
<221>misc_feature
<222>(1)..(25)
<223>外显子23跳跃诱导性寡核苷酸
<400>76
aacctcggct tacctgaaat tttcg                                           25
<210>77
<211>1653
<212>DNA
<213>Hotaria parvula
<400>77
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga     60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc    180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt    360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga    480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga    600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg    660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt    720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt    780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac    840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg    900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct    960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat   1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc   1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa   1140
acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt   1200
tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct   1260
ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct   1320
ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa   1380
caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt    1440
cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat    1500
tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac    1560
gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata    1620
aaggccaaga agggcggaaa gatcgccgtg taa                                 1653
<210>78
<211>17578
<212>DNA
<213>Homo sapiens
<220>
<221>内含子
<222>(1)..(13645)
<223>内含子9
<220>
<221>外显子
<222>(13646)..(13738)
<223>内含子9
<220>
<221>内含子
<222>(13739)..(17578)
<223>内含子10
<400>78
gtgagagtgg ctggctgcgc gtggaggtgt ggggggctgc gcctggaggg gtagggctgt     60
gcctggaagg gtagggctgc gcctggaggt gcgcggttga gcgtggagtc gtgggactgt    120
gcatggaggt gtggggctcc ccgcacctga gcacccccgc ataacacccc agtcccctct    180
ggaccctctt caaggaagtt cagttcttta ttgggctctc cactacactg tgagtgccct    240
cctcaggcga gagaacgttc tggctcttct cttgcccctt cagcccctgt taatcggaca    300
gagatggcag ggctgtgtct ccacggccgg aggctctcat agtcagggca cccacagcgg    360
ttccccacct gccttctggg cagaatacac tgccacccat aggtcagcat ctccactcgt    420
gggccatctg cttaggttgg gttcctctgg attctgggga gattgggggt tctgttttga    480
tcagctgatt cttctgggag caagtgggtg ctcgcgagct ctccagcttc ctaaaggtgg    540
agaagcacag acttcggggg cctggcctgg atccctttcc ccattcctgt ccctgtgccc    600
ctcgtctggg tgcgttaggg ctgacataca aagcaccaca gtgaaagaac agcagtatgc    660
ctcctcacta gccaggtgtg ggcgggtggg tttcttccaa ggcctctctg tggccgtggg    720
tagccacctc tgtcctgcac cgctgcagtc ttccctctgt gtgtgctcct ggtagctctg    780
cgcatgctca tcttcttata agaacaccat ggcagctggg cgtagtggct cacgcctata     840
atcccagcac tttgggaggc tgaggcaggc agatcacgag gtcaggagtt cgagaccaac     900
ctgaccaaca gggtgaaacc tcgtctctac taaaaataca aaaatacctg ggcgtggtgg     960
tggtgcgcgc ctataatccc agctactcag gaggctgagg caggagaatc gcttgaaccc    1020
aggaggcaga ggttgcagtg agccgagata gtgccactgc actccagttt gagcaacaga    1080
gcgagactct gtctcaaaac aaaataaaac aaaccaaaaa aacccaccat ggcttagggc    1140
ccagcctgat gacctcattt ttcacttagt cacctctcta aaggccctgt ctccaaatag    1200
agtcacattc taaggtacgg gggtgttggg gaggggggtt agggcttcaa catgtgaatt    1260
tgcggggacc acaattcagc ccaggacccc gctcccgcca cccagcactg gggagctggg    1320
gaagggtgaa gaggaggctg ggggtgagaa ggaccacagc tcactctgag gctgcagatg    1380
tgctgggcct tctgggcact gggcctcggg gagctagggg gctttctgga accctgggcc    1440
tgcgtgtcag cttgcctccc ccacgcaggc gctctccaca ccattgaagt tcttatcact    1500
tgggtctgag cctggggcat ttggacggag ggtggccacc agtgcacatg ggcaccttgc    1560
ctcaaaccct gccacctccc cccacccagg atcccccctg cccccgaaca agcttgtgag    1620
tgcagtgtca catcccatcg ggatggaaat ggacggtcgg gttaaaaggg acgcatgtgt    1680
agaccctgcc tctgtgcatc aggcctcttt tgagagtccc tgcgtgccag gcggtgcaca    1740
gaggtggaga agactcggct gtgccccaga gcacctcctc tcatcgagga aaggacagac    1800
agtggctccc ctgtggctgt ggggacaagg gcagagctcc ctggaacaca ggagggaggg    1860
aaggaagaga acatctcaga atctccctcc tgatggcaaa cgatccgggt taaattaagg    1920
tccggccttt tcctgctcag gcatgtggag cttgtagtgg aagaggctct ctggaccctc    1980
atccaccaca gtggcctggt tagagacctt ggggaaataa ctcacaggtg acccagggcc    2040
tctgtcctgt accgcagctg agggaaactg tcctgcgctt ccactgggga caatgcgctc    2100
cctcgtctcc agactttcca gtcctcattc ggttctcgaa agtcgcctcc agaagcccca    2160
tcttgggacc accgtgactt tcattctcca gggtgcctgg ccttggtgct gcccaagacc    2220
ccagaggggc cctcactggc ctttcctgcc ttttctccca ttgcccaccc atgcaccccc    2280
atcctgctcc agcacccaga ctgccatcca ggatctcctc aagtcacata acaagcagca    2340
cccacaaggt gctcccttcc ccctagcctg aatctgctgc tccccgtctg gggttccccg    2400
cccatgcacc tctgggggcc cctgggttct gccataccct gccctgtgtc ccatggtggg    2460
gaatgtcctt ctctccttat ctcttccctt cccttaaatc caagttcagt tgccatctcc    2520
tccaggaagt cttcctggat tcccctctct cttcttaaag cccctgtaaa ctctgaccac    2580
actgagcatg tgtctgctgc tccctagtct gggccatgag tgagggtgga ggccaagtct    2640
catgcatttt tgcagccccc acaagactgt gcaggtggcc ggccctcatt gaatgcgggg    2700
ttaatttaac tcagcctctg tgtgagtgga tgattcaggt tgccagagac agaaccctca    2760
gcttagcatg ggaagtagct tccctgttga ccctgagttc atctgaggtt ggcttggaag    2820
gtgtgggcac catttggccc agttcttaca gctctgaaga gagcagcagg aatggggctg    2880
agcagggaag acaactttcc attgaaggcc cctttcaggg ccagaactgt ccctcccacc    2940
ctgcagctgc cctgcctctg cccatgaggg gtgagagtca ggcgacctca tgccaagtgt    3000
agaaaggggc agacgggagc cccaggttat gacgtcacca tgctgggtgg aggcagcacg    3060
tccaaatcta ctaaagggtt aaaggagaaa gggtgacttg acttttcttg agatattttg    3120
ggggacgaag tgtggaaaag tggcagagga cacagtcaca gcctccctta aatgccagga    3180
aagcctagaa aaattgtctg aaactaaacc tcagccataa caaagaccaa cacatgaatc    3240
tccaggaaaa aagaaaaaga aaaatgtcat acagggtcca tgcacaagag cctttaaaat    3300
gacccgctga agggtgtcag gcctcctcct cctggactgg cctgaaggct ccacgagctt    3360
ttgctgagac ctttgggtcc ctgtggcctc atgtagtacc cagtatgcag taagtgctca    3420
ataaatgttt ggctacaaaa gaggcaaagc tggcggagtc tgaagaatcc ctcaaccgtg    3480
ccggaacaga tgctaacacc aaagggaaaa gagcaggagc caagtcacgt ttgggaacct    3540
gcagaggctg aaaactgccg cagattgctg caaatcattg ggggaaaaac ggaaaacgtc    3600
tgttttcccc tttgtgcttt tctctgtttt cttctttgtg cttttctctg ttttcaggat    3660
ttgctacagt gaacatagat tgctttgggg ccccaaatgg aattattttg aaaggaaaat    3720
gcagataatc aggtggccgc actggagcac cagctgggta ggggtagaga ttgcaggcaa    3780
ggaggaggag ctgggtgggg tgccaggcag gaagagcccg taggccccgc cgatcttgtg    3840
ggagtcgtgg gtggcagtgt tccctccaga ctgtaaaagg gagcacctgg cgggaagagg    3900
gaattctttt aaacatcatt ccagtgcccg agcctcctgg acctgttgtc atcttgaggt    3960
gggcctcccc tgggtgactc tagtgtgcag cctggctgag actcagtggc cctgggttct    4020
tactgctgac acctaccctc aacctcaacc actgcggcct cctgtgcacc ctgatccagt    4080
ggctcatttt ccactttcag tcccagctct atccctattt gcagtttcca agtgcctggt    4140
cctcagtcag ctcagaccca gccaggccag cccctggttc ccacatcccc tttgccaagc    4200
tcatccccgc cctgtttggc ctgcgggagt gggagtgtgt ccagacacag agacaaagga    4260
ccagctttta aaacattttg ttggggccag gtgtggtggc tcacacctaa tcccaacacc    4320
tggggaggcc aaggcagaag gatcacttga gtccaggagt tcaagaccag cctgggcaac    4380
atagggagac cctgtctcta caattttttt tttaattagc tgggcctgtt ggcactctcc    4440
tgtagttcca gctactctag aggctgaggt gggaggactg cttgagcctg ggaggtcagg    4500
gctgcaatga gccatgttca caccactgaa cgccagcctg ggcgagaccc tgtatcaaaa    4560
aagtaaagta aaatgaatcc tgtacgttat attaaggtge cccaaattgt acttagaagg    4620
atttcatagt tttaaatact tttgttattt aaaaaattaa atgactgcag catataaatt    4680
aggttcttaa tggaggggaa aaagagtaca agaaaagaaa taagaatcta gaaacaaaga    4740
taagagcaga aataaaccag aaaacacaac cttgcactcc taacttaaaa aaaaaaatga    4800
agaaaacaca accagtaaaa caacatataa cagcattaag agctggctcc tggctgggcg    4860
cggtggcgca tgcctgtaat cccaacactt tgggaggccg atgctggagg atcacttgag    4920
accaggagtt caaggttgca gtgagctatg atcataccac tacaccctag cctgggcaac    4980
acagtgagac tgagactcta ttaaaaaaaa aatgctggtt ccttccttat ttcattcctt    5040
tattcattca ttcagacaac atttatgggg cacttctgag caccaggctc tgtgctaaga    5100
gcttttgccc ccagggtcca ggccagggga caggggcagg tgagcagaga aacagggeca    5160
gtcacagcag caggaggaat gtaggatgga gagcttggcc aggcaaggac atgcaggggg    5220
agcagcctgc acaagtcagc aagccagaga agacaggcag acccttgttt gggacctgtt    5280
cagtggcctt tgaaaggaca gcccccaccc ggagtgctgg gtgcaggagc tgaaggagga    5340
tagtggaaca ctgcaacgtg gagctcttca gagcaaaagc aaaataaaca actggaggca    5400
gctggggcag cagagggtgt gtgttcagca etaaggggtg tgaagcttga gcgctaggag    5460
agttcacact ggcagaagag aggttggggc agctgcaagc ctctggacat cgcccgacag    5520
gacagagggt ggtggacggt ggccctgaag agaggctcag ttcagctggc agtggccgtg    5580
ggagtgctga agcaggcagg ctgtcggcat ctgctgggga cggttaagca ggggtgaggg    5640
cccagcctca gcagcccttc ttggggggtc gctgggaaac atagaggaga actgaagaag    5700
cagggagtcc cagggtccat gcagggcgag agagaagttg ctcatgtggg gcccaggctg    5760
caggatcagg agaactgggg accctgtgac tgccagcggg gagaaggggg tgtgcaggat    5820
catgcccagg gaagggccca ggggeccaag catggggggg cctggttggc tctgagaaga    5880
tggagctaaa gtcactttct cggaggatgt ccaggccaat agttgggatg tgaagacgtg    5940
aagcagcaca gagcctggaa gcccaggatg gacagaaacc tacctgagca gtggggcttt    6000
gaaagccttg gggcgggggg tgcaatattc aagatggcca caagatggca atagaatgct    6060
gtaactttct tggttctggg ccgcagcctg ggtggctgct tccttccctg tgtgtattga    6120
tttgtttctc ttttttgaga cagagtcttg ctgggttgcc caggctggag tgcagtggtg    6180
cgatcatagc tcactgcagc cttgaagtcc tgagctcaag agatccttcc acctcagcct    6240
cctgagtagt tgggaccaca ggcttgcacc acagtgccca actaatttct tatatttttt    6300
gtagagatgg ggtttcactg tgtcgcccag gatggtcttg aactcctggg ctcaagtgat    6360
cctcctgcct cagcctcgca aattgctggg attacaggtg tgagccacca tgcccgacct    6420
tctcttttta agggcgtgtg tgtgtgtgtg tgtgtgtggg cgcactctcg tcttcacctt    6480
cccccagcct tgctctgtct ctacccagtc acctctgccc atctctccga tctgtttctc    6540
tctcctttta cccctctttc ctccctcctc atacaccact gaccattata gagaactgag    6600
tattctaaaa atacatttta tttatttatt ttgagacaga gtctcactct gtcacccagg    6660
ctggagtgca gtggtgcaat ctcggctcac tgcaacctcc gcctcccagg ttgaagcaac    6720
tctcctgcct cagcctccct agtagctggg attacaagca cacaccacca tgcctagcaa    6780
atttttatat ttttagtaga ggaggagtgt caccatgttt gccaagctgg tctcaaactc    6840
ctggcctcag gtgatctgcc taccttggtc tcccaaagtg ctgggattac aggtgtgagc    6900
caccacgcct gcccttaaaa atacattata tttaatagca aagccccagt tgtcacttta    6960
aaaagcatct atgtagaaca tttatgtgga ataaatacag tgaatttgta cgtggaatcg    7020
tttgcctctc ctcaatcagg gccagggatg caggtgagct tgggctgaga tgtcagaccc    7080
cacagtaagt ggggggcaga gccaggctgg gaccctcctc taggacagct ctgtaactct    7140
gagaccctcc aggcatcttt tcctgtacct cagtgcttct gaaaaatctg tgtgaatcaa    7200
atcattttaa aggagcttgg gttcatcact gtttaaagga cagtgtaaat aattctgaag    7260
gtgactctac cctgttattt gatctcttct ttggccagct gacttaacag gacatagaca    7320
ggttttcctg tgtcagttcc taagctgatc accttggact tgaagaggag gcttgtgtgg    7380
gcatccagtg cccaccccgg gttaaactcc cagcagagta ttgcactggg cttgctgagc    7440
ctggtgaggc aaagcacagc acagcgagca ccaggcagtg ctggagacag gccaagtctg    7500
ggccagcctg ggagccaact gtgaggcacg gacggggctg tggggctgtg gggctgcagg    7560
cttggggcca gggagggagg gctgggctct ttggaacagc cttgagagaa ctgaacccaa    7620
acaaaaccag atcaaggtct agtgagagct tagggctgct ttgggtgctc caggaaattg    7680
attaaaccaa gtggacacac acccccagcc ccacctcacc acagcctctc cttcagggtc    7740
aaactctgac cacagacatt tctcccctga ctaggagttc cctggatcaa aattgggagc    7800
ttgcaacaca tcgttctctc ccttgatggt ttttgtcagt gtctatccag agctgaagtg    7860
taatatatat gttactgtag ctgagaaatt aaatttcagg attctgattt cataatgaca    7920
accattcctc ttttctctcc cttctgtaaa tctaagattc tataaacggt gttgacttaa    7980
tgtgacaatt ggcagtagtt caggtctgct ttgtaaatac ccttgtgtct attgtaaaat    8040
ctcacaaagg cttgttgcct tttttgtggg gttagaacaa gaaaaagcca catggaaaaa    8100
aaatttcttt tttgtttttt tgtttgcttg tttttttgag acagagtttc actctgtcgc    8160
ccaggctgga gtgcagtggt gcgatctccg cccactgcaa gctccacctc ccgggttcat    8220
gctattctcc tgtctcagcc tcccaagtag ctgggactgc aggtgcccgc caccacacct    8280
ggctaatttt tttgtatttt tagtagagac ggggtttcac cgtgttagcc aggatggtct    8340
caatctcctg acctcgtcat ctgcctgcct cggcctccca aagtgctgag attacaggcg    8400
tgagccaccg tgcccggcca gaaaaaaaca tttctaagta tgtggcagat actgaattat    8460
tgcttaatgt cctttgattc atttgtttaa tttctttaat ggattagtac agaaaacaaa    8520
gttctcttcc ttgaaaaact ggtaagtttt ctttgtcaga taaggagagt taaataaccc    8580
atgacatttc cctttttgcc tcggcttcca ggaagctcaa agttaaatgt aatgatcact    8640
cttgtaatta tcagtgttga tgcccttccc ttcttctaat gttactcttt acattttcct    8700
gctttattat tgtgtgtgtt ttctaattct aagctgttcc cactcctttc tgaaagcagg    8760
caaatcttct aagccttatc cactgaaaag ttatgaataa aaaatgatcg tcaagcctac    8820
aggtgctgag gctactccag aggctgaggc cagaggacca cttgagccca ggaatttgag    8880
acctgggctg ggcagcatag caagactcta tctccattaa aactattttt ttttatttaa    8940
aaaataatcc gcaaagaagg agtttatgtg ggattcctta aaatcggagg gtggcatgaa    9000
ttgattcaaa gacttgtgca gagggcgaca gtgactcctt gagaagcagt gtgagaaagc    9060
ctgtcccacc tccttccgca gctccagcct gggctgaggc actgtcacag tgtctccttg    9120
ctggcaggag agaatttcaa cattcaccaa aaagtagtat tgtttttatt aggtttatga    9180
ggctgtagcc ttgaggacag cccaggacaa ctttgttgtc acatagatag cctgtggcta    9240
caaactctga gatctagatt cttctgcggc tgcttctgac ctgagaaagt tgcggaacct    9300
cagcgagcct cacatggcct ccttgtcctt aacgtgggga cggtgggcaa gaaaggtgat    9360
gtggcactag agatttatcc atctctaaag gaggagtgga ttgtacattg aaacaccaga    9420
gaaggaatta caaaggaaga atttgagtat ctaaaaatgt aggtcaggcg ctcctgtgtt    9480
gattgcaggg ctattcacaa tagccaagat ttggaagcaa cccaagtgtc catcaacaga    9540
caaatggata aagaaaatgt ggtgcatata cacaatggaa tactattcag ccatgaaaaa    9600
gaatgagaat ctgtcatttg aaacaacatg gatggaactg gaggacatta tgttaagtga   9660
aataagccag acagaaggac agacttcaca tgttctcaca catttgtggg agctaaaaat   9720
taaactcatg gagatagaga gtagaaggat ggttaccaga ggctgaggag ggtggagggg   9780
agcagggaga aagtagggat ggttaatggg tacaaaaacg tagttagcat gcatagatct   9840
agtattggat agcacagcag ggtgacgaca gccaacagta atttatagta catttaaaaa   9900
caactaaaag agtgtaactg gactggctaa catggtgaaa ccccgtctct actaaaaata   9960
caaaaattag ctgggcacgg tggctcacgc ctgtaatccc agcactttgg gaggccgagg  10020
cgggccgatc acgaggtcag gagatcgaga ccatcctagc taacatggtg aaaccccgtc  10080
tctactacaa atacaaaaaa aagaaaaaat tagccgggca tggtggtggg cgcctgtagt  10140
cccagctact cgggaggctg aggcaggaga atggcgtgaa cccgggaggc ggagcttgca  10200
gtgagccgag atcgcgccac tgcactccag cctgggcgac aaggcaagat tctatctcaa  10260
aaaaataaaa ataaaataaa ataaaataat aaaataaaat aaaataaaat aaaataaaat  10320
aaataaaata aaatgtataa ttggaatgtt tataacacaa gaaatgataa atgcttgagg  10380
tgatagatac cccattcacc gtgatgtgat tattgcacaa tgtatgtctg tatctaaata  10440
tctcatgtac cccacaagta tatacaccta ctatgtaccc atataaattt aaaattaaaa  10500
aattataaaa caaaaataaa taagtaaatt aaaatgtagg ctggacaccg tggttcacgc  10560
ctgtaatccc agtgctttgt gaggctgagg tgagagaatc acttgagccc aggagtttga  10620
gaccggcctg ggtgacatag cgagacccca tcatcacaaa gaatttttaa aaattagctg  10680
ggcgtggtag cacataccgg tagttccagc tacttgggag accgaggcag gaggattgct  10740
tgagcccagg agtttaaggc tgcagtgagc tacgatggcg ccactgcatt ccagcctggg  10800
tgacagagtg agagcttgtc tctattttaa aaataataaa aagaataaat aaaaataaat  10860
taaaatgtaa atatgtgcat gttagaaaaa atacacccat cagcaaaaag ggggtaaagg  10920
agcgatttca gtcataattg gagagatgca gaataagcca gcaatgcagt ttcttttatt  10980
ttggtcaaaa aaaataagca aaacaatgtt gtaaacaccc agtgctggca gcaatgtggt  11040
gaggctggct ctctcaccag ggctcacagg gaaaactcat gcaacccttt tagaaagcca  11100
tgtggagagt tgtaccgaga ggttttagaa tatttataac tttgacccag aaattctatt  11160
ctaggactct gtgttatgaa aataacccat catatggaaa aagctccttt cagaaagagg  11220
ttcatgggag gctgtttgta tttttttttt ctttgcatca aatccagctc ctgcaggact  11280
gtttgtatta ttgaagtaca aagtggaatc aatacaaatg ttggatagca ggggaacaat  11340
attcacaaaa tggaatggga catagtatta aacatagtgc ttctgatgac cgtagaccat  11400
agacaatgct taggatatga tatcacttct tttgttgttt tttgtatttt gagacgaagt  11460
ctcattctgt cacccaggct ggagttcagt ggcgccatct cagctcactg caacctccat  11520
ctcccgggtt caagctattc tccttcctca acctcccgag tagctgggtt gcgcaccacc  11580
atgcctggct aacttttgta tttttagtac agacggggtt tcaccacgtt ggccaggctg  11640
ctcttgaact cctgacgtca ggtgatccac cagccttgac ctcccaaagt gctaggatta  11700
caggagccac tgtacccagc ctaggatatg atatcacttc ttagagcaag atacaaaatt  11760
gcatgtgcac aataattcta ccaagtatag gtatacaggg gtagttatat ataaatgaga  11820
cttcaaggaa atacaacaaa atgcaatcgt gattgtgtta gggtggtaag aaaacggttt  11880
ttgctttgat gagctctgtt ttttaaaatc gttatatttt ctaataaaaa tacatagtct  11940
tttgaaggaa cataaaagat tatgaagaaa tgagttagat attgattcct attgaagatt  12000
cagacaagta aaattaaggg gaaaaaaaac gggatgaacc agaagtcagg ctggagttcc  12060
aaccccagat ccgacagccc aggctgatgg ggcctccagg gcagtggttt ccacccagca  12120
ttctcaaaag agccactgag gtctcagtgc cattttcaag atttcggaag cggcctgggc  12180
acggctggtc cttcactggg atcaccactt ggcaattatt tacacctgag acgaatgaaa  12240
accagagtgc tgagattaca ggcatggtgg cttacgcttg taatcggctt tgggaagccg  12300
aggtgggctg attgcttgag cccaggagtt tcaaactatc ctggacaaca tagcatgacc  12360
tcgtctctac aaaaaataca aaaaatttgc caggtgtggt ggcatgtgcc tgtggtccca  12420
gctacttggg aggctgaagt aggagaatcc cctgagccct gggaagtcga ggctgcactg  12480
agccgtgatg gtgtcactgc actccagcct gggtgacaaa gtgagaccct atctcacaaa  12540
gaaaaaaaac aaaacaaaaa acccaaagca cactgtttcc actgtttcca gagttcctga  12600
gaggaaaggt caccgggtga ggaagacgtt ctcactgatc tggcagagaa aatgtccagt  12660
ttttccaact ccctaaacca tggttttcta tttcatagtt cttaggcaaa ttggtaaaaa  12720
tcatttctca tcaaaacgct gatattttca cacctccctg gtgtctgcag aaagaacctt  12780
ccagaaatgc agtcgtggga gacccatcca ggccacccct gcttatggaa gagctgagaa  12840
aaagccccac gggagcattt gctcagcttc cgttacgcac ctagtggcat tgtgggtggg  12900
agagggctgg tgggtggatg gaaggagaag gcacagcccc cccttgcagg gacagagccc  12960
tcgtacagaa gggacacccc acatttgtct tccccacaaa gcggcctgtg tcctgcctac  13020
ggggtcaggg cttctcaaac ctggctgtgt gtcagaatca ccaggggaac ttttcaaaac  13080
tagagagact gaagccagac tcctagattc taattctagg tcagggctag gggctgagat  13140
tgtaaaaatc cacaggtgat tctgatgccc ggcaggcttg agaacagccg cagggagttc  13200
tctgggaatg tgccggtggg tctagccagg tgtgagtgga gatgccgggg aacttcctat  13260
tactcactcg tcagtgtggc cgaacacatt tttcacttga cctcaggctg gtgaacgctc  13320
ccctctgggg ttcaggcctc acgatgccat ccttttgtga agtgaggacc tgcaatccca  13380
gcttcgtaaa gcccgctgga aatcactcac acttctggga tgccttcaga gcagccctct  13440
atcccttcag ctcccctggg atgtgactcg acctcccgtc actccccaga ctgcctctgc  13500
caagtccgaa agtggaggca tccttgcgag caagtaggcg ggtccagggt ggcgcatgtc  13560
actcatcgaa agtggaggcg tccttgcgag caagcaggcg ggtccagggt ggcgtgtcac  13620
tcatcctttt ttctggctac caaag gtg cag ata att aat aag aag ctg gat    13672
                        Val Gln Ile Ile Asn Lys Lys Leu Asp
                        1            5
ctt agc aac gtc cag tcc aag tgt ggc tca aag gat aat atc aaa cac    13720
Leu Ser Asn Val Gln Ser Lys Cys  Gly Ser Lys Asp Asn Ile Lys His
10               15                20               25
gtc ccg gga ggc ggc agt gtgagtacct tcacacgtcc catgcgccgt           13768
Val Pro Gly Gly Gly Ser
             30
gctgtggctt gaattattag gaagtggtgt gagtgcgtac acttgcgaga cactgcatag  13828
aataaatcct tcttgggctc tcaggatctg gctgcgacct ctgggtgaat gtagcccggc  13888
tccccacatt cccccacacg gtccactgtt cccagaagcc ccttcctcat attctaggag  13948
ggggtgtccc agcatttctg ggtcccccag cctgcgcagg ctgtgtggac agaatagggc  14008
agatgacgga ccctctctcc ggaccctgcc tgggaagctg agaataccca tcaaagtctc  14068
cttccactca tgcccagccc tgtccccagg agccccatag cccattggaa gttgggctga  14128
aggtggtggc acctgagact gggctgccgc ctcctccccc gacacctggg caggttgacg  14188
ttgagtggct ccactgtgga caggtgaccc gtttgttctg atgagcggac accaaggtct  14248
tactgtcctg ctcagctgct gctcctacac gttcaaggca ggagccgatt cctaagcctc  14308
cagcttatgc ttagcctgcg ccaccctctg gcagagactc cagatgcaaa gagccaaacc  14368
aaagtgcgac aggtccctct gcccagcgtt gaggtgtggc agagaaatgc tgcttttggc  14428
ccttttagat ttggctgcct cttgccagga gtggtggctc gtgcctgtaa ttccagcact  14488
ttgggagact aaggcgggag gttcgcttga gcccaggagt tcaagaccag cctgggcaac  14548
aatgagaccc ctgtgtctac aaaaagaatt aaaattagcc aggtgtggtg gcacgcacct  14608
gtagtcccag ctacttggga ggctgaggtg ggaggattgc ctgagtccgg gaggcggaag  14668
ttgcaaggag ccatgatcgc gccactgcac ttcaacctag gcaacagagt gagactttgt  14728
ctcaaaaaac aatcatataa taattttaaa ataaatagat ttggcttcct ctaaatgtcc  14788
ccggggactc cgtgcatctt ctgtggagtg tctccgtgag attcgggact cagatcctca  14848
agtgcaactg acccacccga taagctgagg cttcatcatc ccctggccgg tctatgtcga  14908
ctgggcaccc gaggctcctc tcccaccagctctcttggtc agctgaaagc aaactgttaa   14968
caccctgggg agctggacgt atgagaccct tggggtggga ggcgttgatt tttgagagca  15028
atcacctggc cctggctggc agtaccggga cactgctgtg gctccggggt gggctgtctc  15088
cagaaaatgc ctggcctgag gcagccaccc gcatccagcc cagagggttt attcttgcaa  15148
tgtgctgctg cttcctgccc tgagcacctg gatcccggct tctgccctga ggccccttga  15208
gtcccacagg tagcaagcgc ttgccctgcg gctgctgcat ggggctaact aacgcttcct  15268
caccagtgtc tgctaagtgt ctcctctgtc tcccacgccc tgctctcctg tccccccagt  15328
ttgtctgctg tgaggggaca gaagaggtgt gtgccgcccc cacccctgcc cgggcccttg  15388
ttcctgggat tgctgttttc agctgtttga gctttgatcc tggttctctg gcttcctcaa  15448
agtgagctcg gccagaggag gaaggccatg tgctttctgg ttgaagtcaa gtctggtgcc  15508
ctggtggagg ctgtgctgct gaggcggagc tggggagaga gtgcacacgg gctgcgtggc  15568
caacccctct gggtagctga tgcccaaaga cgctgcagtg cccaggacat ctgggacctc  15628
cctggggccc gcccgtgtgt cccgcgctgt gttcatctgc gggctagcct gtgacccgcg  15688
ctgtgctcgt ctgcgggcta gcctgtgtcc cgcgctctgc ttgtctgcgg tctagcctgt  15748
gacctggcag agagccacca gatgtcccgg gctgagcact gccctctgag caccttcaca  15808
ggaagccctt ctcctggtga gaagagatgc cagcccctgg catctggggg cactggatcc  15868
ctggcctgag ccctagcctc tccccagcct gggggcccct tcccagcagg ctggccctgc  15928
tccttctcta cctgggaccc ttctgcctcc tggctggacc ctggaagctc tgcagggcct  15988
gctgtccccc tccctgccct ccaggtatcc tgaccaccgg ccctggctcc cactgccatc  16048
cactcctctc ctttctggcc gttccctggt ccctgtccca gcccccctcc ccctctcacg  16108
agttacctca cccaggccag agggaagagg gaaggaggcc ctggtcatac cagcacgtcc  16168
tcccacctcc ctcggccctg gtccaccccc tcagtgctgg cctcagagca cagctctctc  16228
caagccaggc cgcgcgccat ccatcctccc tgtcccccaa cgtccttgcc acagatcatg  16288
tccgccctga cacacatggg tctcagccat ctctgcccca gttaactccc catccataaa  16348
gagcacatgc cagccgacac caaaataatt cgggatggtt ccagtttaga cctaagtgga  16408
aggagaaacc accacctgcc ctgcaccttg ttttttggtg accttgataa accatcttca  16468
gccatgaagc cagctgtctc ceaggaagct ccagggcggt gcttcctcgg gagctgactg  16528
ataggtggga ggtggctgcc cccttgcacc etcaggtgac cccacacaag gccactgctg  16588
gaggccctgg ggactccagg aatgtcaatc agtgacctgc cccccaggcc ccacacagcc  16648
atggctgcat agaggcctgc ctccaaggga cctgtctgtc tgccactgtg gagtccctac  16708
agcgtgcccc ccacagggga gctggttctt tgactgagat cagctggcag ctcagggtca  16768
tcattcccag agggagcggt gccctggagg ccacaggcct cctcatgtgt gtctgcgtcc  16828
gctcgagctt actgagacac taaatctgtt ggtttctgct gtgccaccta cccaccctgt  16888
tggtgttgct ttgttcctat tgctaaagac aggaatgtcc aggacactga gtgtgcaggt  16948
gcctgctggt tctcacgtcc gagctgctga actccgctgg gtcctgctta ctgatggtct  17008
ttgctctagt gctttccagg gtccgtggaa gcttttcctg gaataaagcc cacgcatcga  17068
ccctcacagc gcctcccctc tttgaggccc agcagatacc ccactcctgc ctttccagca  17128
agatttttca gatgctgtgc atactcatca tattgatcac ttttttcttc atgcctgatt  17188
gtgatctgtc aatttcatgt caggaaaggg agtgacattt ttacacttaa gcgtttgctg  17248
agcaaatgtc tgggtcttgc acaatgacaa tgggtccctg tttttcccag aggctctttt  17308
gttctgcagg gattgaagac actccagtcc cacagtcccc agctcccctg gggcagggtt  17368
ggcagaattt cgacaacaca tttttccacc ctgactagga tgtgctcctc atggcagctg  17428
ggaaccactg tccaataagg gcctgggctt acacagctgc ttctcattga gttacaccct  17488
taataaaata atcccatttt atcctttttg tctctctgtc ttcctctctc tctgcctttc  17548
ctcttctctc tcctcctctc tcatctccag                                   17578
<210>79
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>79
tatctgcacc tttggtag                                                   18
<210>80
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>80
tgaaggtact cacactgccg c                       21

Claims (35)

1.分离的核酸,所述核酸包含:
A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和
B)至少两个第二异源核苷酸序列,其中每个第二异源核苷酸序列包含:
i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和
ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子,其中所述第二异源核苷酸序列选自:
a)在所述第一核苷酸序列中串联的第二核苷酸序列,
b)在所述第一核苷酸序列中相距至少25个碱基对的第二核苷酸序列,
c)在所述第一核苷酸序列中相距至少50个碱基对的第二核苷酸序列,
d)在所述第一核苷酸序列中相距至少75个碱基对的第二核苷酸序列,
e)在所述第一核苷酸序列中相距至少100个碱基对的第二核苷酸序列,
f)在所述第一核苷酸序列中相距至少200个碱基对的第二核苷酸序列,
g)在所述第一核苷酸序列中相距至少300个碱基对的第二核苷酸序列,
h)第二核苷酸序列,其中第一个第二核苷酸序列位于启动子和所述第一核苷酸序列之间,而第二个第二核苷酸序列位于所述第一核苷酸序列中;和
i)第二核苷酸序列,其中第一个第二核苷酸序列位于所述第一核苷酸序列中的可读框和聚腺苷酸尾或聚腺苷酸信号之间,而第二个第二核苷酸序列位于所述第一核苷酸序列的所述可读框中。
2.权利要求1的核酸,其中所述第一核苷酸序列选自以下序列及其任意组合:编码蛋白或肽的核苷酸序列、作为RNA具有酶活性的核苷酸序列(例如RNAi)、编码核酶的核苷酸序列、编码反义序列的核苷酸序列和/或小核RNA(snRNA)。
3.权利要求1或2的核酸,所述核酸包含两个或多个可相同或不同的第一核苷酸序列。
4.权利要求1-3中任一项的核酸,所述核酸包含两个或多个相同的第二核苷酸序列。
5.权利要求1-3中任一项的核酸,所述核酸包含彼此不同的两个或多个第二核苷酸序列。
6.载体,所述载体包含权利要求1-5中任一项的核酸。
7.权利要求6的载体,所述载体选自:非病毒载体、病毒载体和合成生物纳颗粒。
8.权利要求6的载体,所述载体选自:AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。
9.细胞,所述细胞包含权利要求1-5中任一项的核酸。
10.细胞,所述细胞包含权利要求6-8中任一项的载体。
11.组合物,所述组合物包含权利要求1-5中任一项的核酸和药学可接受载体。
12.组合物,所述组合物包含权利要求6-8中任一项的载体和药学可接受载体。
13.组合物,所述组合物包含权利要求9-10中任一项的细胞和药学可接受载体。
14.生产蛋白的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和
b)翻译第一RNA,以生产所述蛋白。
15.产生赋予生物功能的RNA的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和
b)翻译第一RNA,以产生赋予生物功能的RNA。
16.权利要求14-15中任一项的方法,其中将所述封闭寡核苷酸导入到含所述核酸的细胞中。
17.权利要求16的方法,其中所述细胞处于动物中。
18.权利要求17的方法,其中所述动物是人。
19.权利要求14-18中任一项的方法,其中所述封闭寡核苷酸不激活RNA酶H。
20.权利要求14-19中任一项的方法,其中所述封闭寡核苷酸包含修饰型核苷酸间桥接磷酸酯残基,所述磷酸酯残基选自甲基硫代磷酸酯、吗啉代磷酸酯、哌嗪代磷酸酯和氨基磷酸酯。
21.权利要求14-20中任一项的方法,其中所述封闭寡核苷酸包含在其2′位具有低级烷基取代基的核苷酸。
22.权利要求14-21中任一项的方法,其中所述封闭寡核苷酸长8-50个核苷酸。
23.生产蛋白的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件的成员,导致第一内含子被去除,而产生第一RNA;和
b)翻译第一RNA,从而生产所述蛋白。
24.产生赋予生物功能的RNA的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件的成员,导致第一内含子被去除,而产生第一RNA;和
b)翻译第一RNA,从而产生赋予生物功能的RNA。
25.权利要求23-24中任一项的方法,其中将所述小分子导入到含所述核酸的细胞中。
26.权利要求25的方法,其中所述细胞处于动物中。
27.权利要求26的方法,其中所述动物是人。
28.在受治疗者中调节赋予生物功能的异源RNA的产生的方法,所述方法包括:
a)将权利要求1-5中任一项的核酸导入到所述受治疗者中;和
b)在期望产生所述异源RNA时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中所述RNA的产生。
29.调节受治疗者中的异源蛋白产生的方法,所述方法包括:
a)将权利要求1-5中任一项的核酸导入到所述受治疗者中;和
b)在期望产生所述异源蛋白时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中所述蛋白的产生。
30.治疗受治疗者中的疾病的方法,所述方法包括:
a)将权利要求1-5中任一项的核酸导入到所述受治疗者中;和
b)将封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此治疗所述受治疗者中的疾病。
31.鉴别化合物的方法,其中所述化合物封闭权利要求1的核酸的第二组剪接元件成员,所述方法包括:
a)使权利要求1的核酸与所述化合物在允许剪接的条件下接触;
b)检测权利要求1的第一RNA的产生和/或第二RNA的产生,借此权利要求1的第一RNA的产生鉴别出封闭权利要求1的第二组剪接元件成员的化合物。
32.抑制赋予生物功能的异源RNA产生的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
33.抑制异源蛋白产生的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
34.抑制赋予生物功能的异源RNA产生的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
35.抑制异源蛋白产生的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
CNA2006800237538A 2005-04-29 2006-04-28 在转录后水平调节核酸表达的方法和组合物 Pending CN101213203A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67613905P 2005-04-29 2005-04-29
US60/676,139 2005-04-29

Publications (1)

Publication Number Publication Date
CN101213203A true CN101213203A (zh) 2008-07-02

Family

ID=37308297

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800237538A Pending CN101213203A (zh) 2005-04-29 2006-04-28 在转录后水平调节核酸表达的方法和组合物

Country Status (8)

Country Link
US (1) US20100196335A1 (zh)
EP (1) EP1874791A4 (zh)
JP (1) JP2008539698A (zh)
CN (1) CN101213203A (zh)
AU (1) AU2006242371A1 (zh)
CA (1) CA2606362A1 (zh)
NZ (1) NZ562780A (zh)
WO (1) WO2006119137A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102625840A (zh) * 2009-04-10 2012-08-01 肌肉学研究协会 用于治疗疾病的三环dna反义寡核苷酸、组合物和方法
CN113166779A (zh) * 2018-10-09 2021-07-23 北卡罗来纳大学查佩尔希尔分校 调控的基因编辑系统
CN114127288A (zh) * 2019-05-14 2022-03-01 莫纳什大学 晚期糖基化终产物受体rna的调节剂和调节
CN114150021A (zh) * 2021-11-26 2022-03-08 武汉枢密脑科学技术有限公司 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8637478B2 (en) 2007-11-13 2014-01-28 Isis Pharmaceuticals, Inc. Compounds and methods for modulating protein expression
US8889641B2 (en) 2009-02-11 2014-11-18 The University Of North Carolina At Chapel Hill Modified virus vectors and methods of making and using the same
US20100303776A1 (en) * 2009-04-16 2010-12-02 The University Of North Carolina At Chapel Hill Methods and compositions for regulated expression of multiple nucleic acids
US8734809B2 (en) 2009-05-28 2014-05-27 University Of Massachusetts AAV's and uses thereof
EE05711B1 (et) * 2009-10-07 2014-04-15 Tartu Ülikool Meetod ja kompositsioon konditsionaalselt letaalsete viirusmutantide loomiseks ja eukarootse raku elulisuse k?rvaldamiseks
WO2011042556A1 (en) * 2009-10-08 2011-04-14 Association Institut De Myologie Nucleic acid molecules and methods for exchanging exon(s) by transsplicing
US20130035472A1 (en) * 2010-03-17 2013-02-07 Anaptysbio, Inc. Method of producing transcripts using cryptic splice sites
DK2826860T3 (en) * 2010-04-23 2018-12-03 Univ Massachusetts CNS targeting AAV vectors and methods for their use
US9409953B2 (en) 2011-02-10 2016-08-09 The University Of North Carolina At Chapel Hill Viral vectors with modified transduction profiles and methods of making and using the same
GB201103062D0 (en) * 2011-02-22 2011-04-06 Isis Innovation Method
AU2013319788B2 (en) * 2012-09-24 2019-04-11 Yissum Reasearch Development Company of the Hebrew University Of Jerusalem Ltd. Restoration of the CFTR function by splicing modulation
CA2904396A1 (en) 2013-03-15 2014-09-18 The University Of North Carolina At Chapel Hill Methods and compositions for dual glycan binding aav vectors
CN114395559A (zh) * 2014-04-25 2022-04-26 吉尼松公司 高胆红素血症的治疗
CN107073051B (zh) 2014-10-21 2021-08-24 马萨诸塞大学 重组aav变体及其用途
EP3245220B1 (en) 2015-01-14 2023-09-20 The University of North Carolina at Chapel Hill Methods and compositions for targeted gene transfer
WO2016134300A1 (en) 2015-02-20 2016-08-25 Board Of Regents, The University Of Texas System Methods and compositions for attenuated chlamydia as vaccine and vector
PL3356390T3 (pl) 2015-09-28 2021-07-05 The University Of North Carolina At Chapel Hill Sposoby i kompozycje dla wektorów wirusowych unikających przeciwciał
CA3007330A1 (en) 2015-12-14 2017-06-22 The Trustees Of The University Of Pennsylvania Composition for treatment of crigler-najjar syndrome
US11578340B2 (en) 2016-10-13 2023-02-14 University Of Massachusetts AAV capsid designs
US11702646B2 (en) * 2016-11-28 2023-07-18 Ptc Therapeutics, Inc. Methods for modulating RNA splicing
CA3054711A1 (en) 2017-03-15 2018-09-20 The University Of North Carolina At Chapel Hill Polyploid adeno-associated virus vectors and methods of making and using the same
JP7406677B2 (ja) 2018-04-03 2023-12-28 ギンコ バイオワークス インコーポレイテッド 抗体を回避するウイルスベクター
US20210371471A1 (en) 2018-04-03 2021-12-02 Stridebio, Inc. Antibody-evading virus vectors
AU2019247191A1 (en) 2018-04-03 2020-10-15 Ginkgo Bioworks, Inc. Virus vectors for targeting ophthalmic tissues
WO2020160338A1 (en) * 2019-01-30 2020-08-06 Applied Stemcell, Inc. Controllable genome editing system
CN113727992A (zh) 2019-03-21 2021-11-30 斯特里迪比奥公司 重组腺相关病毒载体
AU2020263392A1 (en) 2019-04-26 2021-10-28 The University Of North Carolina At Chapel Hill Methods and compositions for dual glycan binding AAV2.5 vector
CA3157700A1 (en) 2019-10-17 2021-04-22 Stridebio, Inc. Adeno-associated viral vectors for treatment of niemann-pick disease type c
US20220411821A1 (en) * 2019-10-28 2022-12-29 University Of Florida Research Foundation, Incorporated Gene therapy vectors
JP2023547992A (ja) 2020-10-28 2023-11-15 ザ・ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル 二重グリカン結合aav2.5ベクターのための方法および組成物
WO2022093769A1 (en) 2020-10-28 2022-05-05 The University Of North Carolina At Chapel Hill Methods and compositions for dual glycan binding aav2.5 vector
TW202242124A (zh) 2021-01-14 2022-11-01 美商史崔德生物公司 靶向t細胞之aav載體
WO2023150687A1 (en) 2022-02-04 2023-08-10 Ginkgo Bioworks, Inc. Recombinant adeno-associated virus vectors, and methods of use thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1897942A1 (en) * 1993-05-11 2008-03-12 The University Of North Carolina At Chapel Hill Antisense oligonucleotides which combat aberrant splicing and methods of using the same
WO1997014809A2 (en) * 1995-10-16 1997-04-24 Dana-Farber Cancer Institute Novel expression vectors and methods of use
JP2006500933A (ja) * 2002-09-27 2006-01-12 ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル プレmRNAのスプライシングを修飾するための方法および組成物
AU2003225410A1 (en) * 2003-03-21 2004-10-11 Academisch Ziekenhuis Leiden Modulation of exon recognition in pre-mrna by interfering with the secondary rna structure

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102625840A (zh) * 2009-04-10 2012-08-01 肌肉学研究协会 用于治疗疾病的三环dna反义寡核苷酸、组合物和方法
CN109576268A (zh) * 2009-04-10 2019-04-05 肌肉学研究协会 用于治疗疾病的三环dna反义寡核苷酸、组合物和方法
CN113166779A (zh) * 2018-10-09 2021-07-23 北卡罗来纳大学查佩尔希尔分校 调控的基因编辑系统
CN114127288A (zh) * 2019-05-14 2022-03-01 莫纳什大学 晚期糖基化终产物受体rna的调节剂和调节
CN114150021A (zh) * 2021-11-26 2022-03-08 武汉枢密脑科学技术有限公司 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用
WO2023092643A1 (zh) * 2021-11-26 2023-06-01 劲帆生物医药科技(武汉)有限公司 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用

Also Published As

Publication number Publication date
EP1874791A1 (en) 2008-01-09
AU2006242371A1 (en) 2006-11-09
JP2008539698A (ja) 2008-11-20
NZ562780A (en) 2010-03-26
US20100196335A1 (en) 2010-08-05
EP1874791A4 (en) 2009-01-07
WO2006119137A1 (en) 2006-11-09
CA2606362A1 (en) 2006-11-09

Similar Documents

Publication Publication Date Title
CN101213203A (zh) 在转录后水平调节核酸表达的方法和组合物
KR102370675B1 (ko) 표적 핵산의 변형을 위한 개선된 방법
AU2018229561B2 (en) Recombinant adenoviruses and use thereof
AU2023270322A1 (en) Compositions and methods for modifying genomes
CN111492061A (zh) 用于溶酶体障碍的基因疗法
CN1938428A (zh) 多基因表达的质粒系统
CN110835633B (zh) 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
KR20070085665A (ko) 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주
BRPI0817233A2 (pt) construções terapêuticas de gene de trca e bireatores para a expressão de moléculas bioterapêuticas, e usos das mesmas
KR20130010121A (ko) 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도
CN115011598A (zh) 杜氏肌营养不良症相关的外显子剪接增强子、sgRNA、基因编辑工具及应用
CN110913886A (zh) 包含成纤维细胞生长因子21(fgf21)编码序列的病毒表达构建体
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
AU2023270345A1 (en) Compositions and methods for nucleic acid expression and protein secretion in bacteroides
US11129890B1 (en) Non-integrating HIV-1 comprising mutant RT/IN proteins and the SARS-CoV-2 spike protein
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
AU2016378480A1 (en) Endothelium-specific nucleic acid regulatory elements and methods and use thereof
KR20230019063A (ko) C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터
CN113166779A (zh) 调控的基因编辑系统
KR20220161297A (ko) 신규 세포주
KR20240021906A (ko) 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법
CN110777147A (zh) 一种ikzf3基因沉默的t细胞及其应用
KR20150021839A (ko) 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도
JP2003503034A (ja) 核内pparレセプターを使用する発現調節システム
KR20200037750A (ko) 섬유아세포 성장 인자 21 (fgf21) 코딩 서열을 포함하는 바이러스 발현 컨스트럭트

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080702