CN101213203A - 在转录后水平调节核酸表达的方法和组合物 - Google Patents
在转录后水平调节核酸表达的方法和组合物 Download PDFInfo
- Publication number
- CN101213203A CN101213203A CNA2006800237538A CN200680023753A CN101213203A CN 101213203 A CN101213203 A CN 101213203A CN A2006800237538 A CNA2006800237538 A CN A2006800237538A CN 200680023753 A CN200680023753 A CN 200680023753A CN 101213203 A CN101213203 A CN 101213203A
- Authority
- CN
- China
- Prior art keywords
- intron
- rna
- nucleotide sequence
- nucleic acid
- montage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/33—Alteration of splicing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/44—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/44—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
- C12N2840/445—Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor for trans-splicing, e.g. polypyrimidine tract, branch point splicing
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Animal Behavior & Ethology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供分离的核酸,所述核酸包含:a)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和b)至少两个第二异源核苷酸序列,其中每个第二异源核苷酸序列都包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子。还提供使用本发明核酸调节转基因表达的方法。
Description
相关申请
根据美国法典第35章第119(e)项,本申请要求于2005年4月29日提交的美国临时申请第60/676,139号的权益,该临时申请的完整内容在此引入作为参考。
发明领域
本发明涉及在转录后水平调节核酸表达的组合物及其使用方法。
发明背景
基因治疗的新近发展已燃起了经该方案有效治疗各种长期疾病的希望。但是,控制基因表达合乎安全和灵活治疗的需要已变得清晰起来。许多不同的调节系统已在基因治疗载体中进行了测试,并已被证实在体外和体内均调节基因表达,包括四环素效应系统、雷帕霉素调节的蛋白二聚化和许多其它系统。这些系统大部分起控制转录活化的功能,来源于内源哺乳动物基因调节途径或与转录活化结构域组合的药物响应元件的人工杂种。除转基因以外这些系统还需要表达一种或多种蛋白,并需要给予活化或抑制转录的外源药物或其它化合物。对于包装能力有限的基因治疗载体,如腺相关病毒(AAV)载体或逆转录病毒载体,掺入额外的基因可能限制转基因大小,或需要使用两种分开的载体,以传递所有的必需元件。尽管这些系统可用于有效地控制转录,但在许多情况下这些大系统不切实际或不实用。
以几种转录后水平调节内源基因表达,这几种转录后水平还可用于控制外源基因表达。RNA产生受到转录速率的控制,但功能性RNA需要正确剪接,然后可产生正确的基因产物。通过调节转基因RNA的剪接,可控制基因产物的产生。
针对基因治疗载体的免疫应答也已成为一个重要考虑因素,尤其是对于需要长期治疗的疾病而言。免疫系统不仅可对载体自身应答,而且可对载体产生的蛋白应答。因为许多最成功的调节系统包含杂种或外源蛋白,所以这些系统特别易于诱导免疫反应,已表明几个系统在啮齿动物和非人灵长类动物中诱导这样的免疫反应。
本发明通过提供用于控制基因表达而没有先前所述基因表达系统的缺陷的组合物和方法,克服了先前的本领域不足。
发明概述
本发明提供一种分离的核酸,其包含:A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和B)至少两个异源的第二核苷酸序列,其中每个异源的第二核苷酸序列包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子,其中所述异源的第二核苷酸序列选自:a)在所述第一核苷酸序列中串联的第二核苷酸序列,b)在所述第一核苷酸序列中相距至少25个碱基对的第二核苷酸序列,c)在所述第一核苷酸序列中相距至少50个碱基对的第二核苷酸序列,d)在所述第一核苷酸序列中相距至少75个碱基对的第二核苷酸序列,e)在所述第一核苷酸序列中相距至少100个碱基对的第二核苷酸序列,f)在所述第一核苷酸序列中相距至少200个碱基对的第二核苷酸序列,g)在所述第一核苷酸序列中相距至少300个碱基对的第二核苷酸序列,h)第二核苷酸序列,其中第一个(primary)第二核苷酸序列位于启动子和所述第一核苷酸序列之间,而第二个(secondary)第二核苷酸序列位于所述第一核苷酸序列中;和i)第二核苷酸序列,其中第一个第二核苷酸序列位于所述第一核苷酸序列中的可读框和聚腺苷酸尾或聚腺苷酸信号之间,而第二个第二核苷酸序列位于所述第一核苷酸序列的所述可读框中。
本文还提供一种分离的核酸,其包含:A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和B)至少一个第二异源核苷酸序列,其包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的内含子的第二组剪接元件,其中所述第二内含子通过剪接被去除,从而不产生RNA分子和/或在所述第二组剪接元件有活性时产生不赋予生物功能的第二RNA分子,其中第二核苷酸序列选自:a)SEQ IDNO:50(具有564CT突变的IVS2-654内含子);b)SEQ ID NO:51(具有657G突变的IVS2-654内含子);c)SEQ ID NO:52(具有658T突变的IVS2-654内含子);d)SEQ ID NO:20(具有657GT突变的IVS2-654内含子);e)SEQ ID NO:53(具有200bp缺失的IVS2-654内含子);f)SEQ ID NO:68(仅有197bp的IVS2-654内含子);g)SEQ ID NO:55(具有6A突变的IVS2-654内含子);h)SEQ ID NO:56(具有564C突变的IVS2-654内含子);i)SEQ ID NO:57(具有841A突变的IVS2-654内含子);j)SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQID NO:50(具有564CT突变的IVS2-654内含子)、SEQ ID NO:54(具有425bp缺失的IVS2-654内含子)、SEQ ID NO:69(仅有247bp的IVS2-654内含子)、SEQ ID NO:59(具有564CT突变的IVS2-705内含子)、SEQ ID NO:60(具有657G突变的IVS2-705内含子)、SEQ IDNO:61(具有658T突变的IVS2-705内含子)、SEQ ID NO:62(具有657GT突变的IVS2-705内含子)、SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)、SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)、SEQ ID NO:65(具有6A突变的IVS2-705内含子)、SEQ IDNO:66(具有564C突变的IVS2-705内含子)、SEQ ID NO:67(具有841A突变的IVS2-705内含子)及其任意组合。
本文另外提供一种生产蛋白的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生蛋白。
本文还提供一种生产赋予生物功能的RNA的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生赋予生物功能的RNA。
而且,本发明提供一种生产赋予生物功能的RNA的方法,该方法包括:a)使小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件的成员,导致第一内含子被去除,而产生第一RNA;和b)翻译第一RNA,从而产生赋予生物功能的RNA。
本文另外提供一种在受治疗者中调节赋予生物功能的异源RNA产生的方法,该方法包括:a)将本发明核酸导入到所述受治疗者中;和b)在期望异源RNA产生时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中的异源RNA产生。
在其它实施方案中,本发明提供一种在受治疗者中调节异源蛋白产生的方法,该方法包括:a)将本发明核酸导入到所述受治疗者中;和b)在期望异源蛋白产生时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中的异源蛋白产生。
本发明还提供一种鉴别化合物的方法,其中所述化合物封闭本发明核酸的第二组剪接元件成员,所述方法包括:a)使本发明核酸与所述化合物在允许剪接的条件下接触;和b)检测本发明第一RNA的产生和/或本发明第二RNA的产生,借此第一RNA的产生鉴别出封闭本发明核酸的第二组剪接元件成员的化合物。
本文还提供一种抑制赋予生物功能的异源RNA产生的方法,该方法包括:a)使小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
另外,本发明提供一种抑制异源蛋白产生的方法,该方法包括:a)使小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
在其它实施方案中,本发明提供一种抑制赋予生物功能的异源RNA产生的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
本发明另外提供一种抑制异源蛋白产生的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
本发明的前述和其它目标及方面在下文陈述的说明书中详细阐述。
附图简述
图1是本发明核酸构建物的一部分的示意图,显示了如本文所述基于外源寡核苷酸的存在与否调节萤光素酶序列表达的机制。
图2A-B显示了在门静脉注射1×1011个载体颗粒后体内的AAVLuc表达。在载体注射后1年和7天,经腹膜内注射施用25mg/kg LNA寡核苷酸(A ii;B在箭头处)。萤光素酶转基因活性使用实时成像(A)检测,并表示为随时间变化的光单位×106。B:寡核苷酸=菱形;无寡核苷酸=圆形。
图3显示了在寡核苷酸治疗后体内的AAT表达。小鼠肝脏用表达内含子调节的AAT编码序列盒的AAV载体转导,通过腹膜内注射(箭头)用0.625mg/200μl LNA寡核苷酸治疗该小鼠肝脏2天。通过血样的ELISA测定分析随时间变化的人AAT循环水平。
图4显示了基于加入不同突变至654突变体的萤光素酶表达变化。按照说明书使用QuickChangeTM定向诱变试剂盒(Stratagene),从而产生以下突变(编号基于距离IVS-654的5′剪接位点的碱基对数):6T变为A、564A变为C、564AA变为CT、657TA变为GT以及841C变为A。将新内含子克隆入萤光素酶cDNA中。用如本文所述的载体和寡核苷酸转染293细胞。
发明详述
本文使用的“a”、“an”或“the”可为单数或复数,取决于其应用范围。例如,“一种细胞”可指单一细胞,或者其可指许多细胞。
本文还使用的“和/或”指并包含一种或多种相关罗列项目的任意什么可能组合,以及在选择另一解释(“或”)时指并包括没有组合。
此外,本文使用的术语“约”在指可检测值(例如本发明组合物的量、剂量、时间、温度等)时,意味着包括指定量的±20%、±10%、±5%、±1%、±0.5%乃至±0.1%的偏差。
本发明基于以下出乎意料的发现:可以例如在体外以转录后水平调节核酸如外源核酸的表达。此调节基于与所述核酸相连的不同内含子的选择性剪接,该选择性剪接视在特定位点选择性封闭剪接活性的寡核苷酸、小分子和/或其它化合物的存在与否而定。因此,在一个实施方案中,本发明提供一种分离核酸,其包含以下几项、基本由以下几项组成和/或由以下几项组成:a)至少一个(例如1、2、3、4个或更多个)第一外源核苷酸序列,其编码目标异源核苷酸序列;和b)至少一个(例如2、3、4个或更多个)第二外源或异源核苷酸序列,其中每个第二外源或异源核苷酸序列包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子。
例如可由已知突变内含子系统获得的众多系统,可用于制备本发明的组合物和实施本发明的方法。例如,可使用引起某些地中海贫血的β-珠蛋白突变内含子(例如SEQ ID NO:58;SEQ ID NO:18;SEQID NO:19,有和/或没有本文所述的额外突变),(参见例如Suwanmanee等,“Restoration of human beta-globin gene expression in murine andhuman IVS2-654thalassemic erythroid cells by free uptake of antisenseoligonucleotides”Mol.Pharmacol.(2002)62:545-553,该文献整体在此引入作为参考)。其它系统包括囊性纤维化跨膜转导调节物(CFTR)基因的突变内含子(例如SEQ ID NO:70;SEQ ID NO:71,有和没有额外突变),(参见例如NCBI基因组功能注释的内部版本号36.1(built 36version)的核苷酸116907253-117095951,登录号NC_000007;Highsmith等,(1994)“A novel mutation in the cystic fibrosis gene inpatients with pulmonary disease but normal sweat chlorideconcentrations”New England Journal of Medicine 331:974-980,该文献整体在此引入作为参考)。
另外的系统包括肌养蛋白基因中的突变(SEQ ID NO:74;SEQ IDSNO:75,有和没有额外突变);(参见例如NCBI基因组功能注释的内部版本号36.1的核苷酸31047266-33267647,登录号NC_000023;Tuffery-Giraud等,(1999)“Point mutations in the dystrophin gene:evidence for frequent use of cryptic splice sites as a result of splicingdefects”Human Mutation 14:359-368;Aartsma-Rus等,(2004)“Antisense-induced multiexon skipping for Duchenne MuscularDystrophy makes more sense”American Journal of Human Genetics74:83-92;Chamberlain等,(1991)“PCR analysis of dystrophin genemutation and expression”J.Cell.Biochem.46:255-259;Mann等,(2001)“Antisense-induced exon skipping and synthesis of dystrophin in themdx mouse”Proc.Natl.Acad.Sci.USA 98:42-47;Lu等,(2003)“Functional amounts of dystrophin produced by skipping the mutatedexon in the mdx dystrophic mouse”Nat.Med.9:1009-1014;Kole等,(2004)“RNA modulation,repair and remodeling by splice switchingoligonucleotides”Acta Biochimica Polonica 51:373-378;以上所有文献都整体在此引入作为参考)。
可用于本发明方法和组合物的再一个系统是引起可变剪接缺陷的突变tau基因(例如SEQ ID NO:78);(参见例如Kalbfuss等,“Correction of alternative splicing in tau in frontotemporal dementia andParkinsonism linked to chromosome 17”J.Biol.Chem.276:42986-42993(2001);该文献整体在此引入作为参考),以及现在已知的或以后鉴别的产生剪接缺陷的任意其它这样的突变基因。还可按照一般技术人员众所周知的方法产生和检验导入可变剪接组的修饰型内含子。
在具体实施方案中,本发明提供一种分离的核酸,其包含:A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和B)至少两个第二异源核苷酸序列,其中每个第二异源核苷酸序列包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子,其中第二异源核苷酸序列选自:a)在所述第一核苷酸序列中串联的第二核苷酸序列,b)在所述第一核苷酸序列中相距至少25个碱基对的第二核苷酸序列,c)在所述第一核苷酸序列中相距至少50个碱基对的第二核苷酸序列,d)在所述第一核苷酸序列中相距至少75个碱基对的第二核苷酸序列,e)在所述第一核苷酸序列中相距至少100个碱基对的第二核苷酸序列,f)在所述第一核苷酸序列中相距至少200个碱基对的第二核苷酸序列,g)在所述第一核苷酸序列中相距至少300个碱基对的第二核苷酸序列,h)第二核苷酸序列,其中第一个第二核苷酸序列位于启动子和所述第一核苷酸序列之间,而第二个第二核苷酸序列位于所述第一核苷酸序列中;和i)第二核苷酸序列,其中第一个第二核苷酸序列位于所述第一核苷酸序列中的可读框和聚腺苷酸尾或聚腺苷酸信号之间,而第二个第二核苷酸序列位于所述第一核苷酸序列的所述可读框中。尽管这些是内含子间距离的具体实例,但要理解的是,两个或多个内含子可具有任意数量的碱基对来分隔它们,如本文所述的2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200个碱基对等。还要理解的是,本发明的第二核苷酸序列可包含如本文所述的任意组合的一个或多个突变。
在其它实施方案中,本发明提供一种分离的核酸,所述核酸包含:A)至少一个(例如1、2、3、4个或更多个)第一核苷酸序列,其编码目标异源核苷酸序列;和B)第二核苷酸序列,其包含:i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和ii)限定与所述第一内含子不同的至少一个(例如1、2、3、4个或更多个)内含子的第二组剪接元件,其中与所述第一内含子不同的所述至少一个内含子通过剪接被去除,从而不产生RNA分子和/或在所述第二组剪接元件有活性时产生不赋予生物功能的第二RNA分子,其中第二核苷酸序列选自:a)SEQ ID NO:50(具有564CT突变的IVS2-654内含子);b)SEQ ID NO:51(具有657G突变的IVS2-654内含子);c)SEQ ID NO:52(具有658T突变的IVS2-654内含子);d)SEQ ID NO:20(具有657GT突变的IVS2-654内含子);e)SEQ IDNO:53(具有200bp缺失的IVS2-654内含子);f)SEQ ID NO:68(仅有197bp的IVS2-654内含子);g)SEQ ID NO:55(具有6A突变的IVS2-654内含子);h)SEQ ID NO:56(具有564C突变的IVS2-654内含子);i)SEQ ID NO:57(具有841A突变的IVS2-654内含子);j)SEQID NO:59(具有564CT突变的IVS2-705内含子);k)SEQ ID NO:60(具有657G突变的IVS2-705内含子);l)SEQ ID NO:61(具有658T突变的IVS2-705内含子);m)SEQ ID NO:62(具有657GT突变的IVS2-705内含子);n)SEQ ID NO:63(具有200bp缺失的IVS2-705内含子);o)SEQ ID NO:64(具有425bp缺失的IVS2-705内含子);p)SEQ IDNO:65(具有6A突变的IVS2-705内含子);q)SEQ ID NO:66(具有564C突变的IVS2-705内含子);r)SEQ ID NO:67(具有841A突变的IVS2-705内含子)及其任意组合,包括单独的序列。
第一核苷酸序列可编码,例如为任意组合的蛋白或肽、作为RNA具有酶活性的核苷酸序列(例如RNAi)、编码核酶的核苷酸序列、编码反义序列的核苷酸序列和/或小核RNA(snRNA)。而且,第一核苷酸序列可包含一种或多种突变,在某些实施方案中,这些突变可在限定剪接位点和/或调节剪接活性方面起作用。
还要理解的是,在本发明的分离核酸中,本发明的第一核苷酸序列和第二核苷酸序列在重复序列和/或交替序列(alternates)的任意组合方面可相同和/或不同。
本发明的第二核苷酸序列可为限定含一个或多个突变的内含子的核苷酸序列,所述突变的存在产生第一组剪接元件和第二组剪接元件。在某些实施方案中,第二核苷酸序列可为限定内含子-外显子-内含子区的序列,其中在内含子和/或外显子区任一个中的突变导致存在第一组剪接元件和第二组剪接元件。在该后一个实施方案中,当第二组剪接元件有活性时,结果是产生含内含子-外显子-内含子区的外显子的RNA。
本文还提供一种含本发明核酸的载体和含本发明核酸或载体的细胞。在某些实施方案中,载体可为但不限于非病毒载体、病毒载体和合成的生物纳颗粒。本发明病毒载体的非限制性实例包括AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。
本发明还提供使用本发明核酸的各种方法。因此,在某些实施方案中,本发明提供一种生产赋予生物功能的蛋白和/或RNA的方法,该方法包括:a)使封闭寡核苷酸与本发明核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,从而产生第一RNA;和b)翻译第一RNA,从而产生蛋白和/或产生赋予生物功能的RNA。
本发明的封闭寡核苷酸和/或小分子和/或其它封闭化合物可导入到含本发明核酸的细胞中,此细胞可位于体外或如本文所述的本发明受治疗者(例如动物,其可为人)中。
在其它实施方案中,本发明提供一种生产赋予生物功能的蛋白和/或RNA的方法,该方法包括:a)使小分子与本发明的任一种核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件成员,导致第一内含子被去除,而产生第一RNA;和b)翻译第一RNA,从而产生产生赋予生物功能的蛋白和/或RNA。
另外,本发明提供一种在受治疗者中调节异源赋予生物功能的蛋白和/或RNA的产生的方法,该方法包括:a)将本发明核酸导入到受治疗者中;和b)在期望产生异源蛋白和/或RNA时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到受治疗者中,由此在所述受治疗者中调节RNA产生。
本文还提供筛选方法,例如鉴别化合物的方法,其中所述化合物封闭本发明核酸的第二组剪接元件的成员,所述方法包括:a)使本发明核酸与该化合物在允许剪接的条件下接触;和b)检测第一RNA的产生和/或第二RNA的产生,借此第一RNA的产生鉴别出封闭第二组剪接元件成员的化合物。
在本文描述的某些实施方案中,将转基因表达系统以OFF(关闭)位导入(例如受治疗者中),并与将所述系统转向ON(打开)位的本发明封闭寡核苷酸和/或小分子接触。本文还提供将以ON位导入(例如受治疗者中)的系统转向OFF位的方法,例如抑制异源赋予生物功能的蛋白和/或RNA的产生的方法,该方法包括:a)使封闭寡核苷酸和/或小分子与本发明核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
内含子是介于真核DNA或RNA的编码部分或“外显子”之间的该DNA或RNA的一部分。内含子和外显子由DNA转录为RNA,称为“初级转录物、RNA前体”(或“前mRNA”)。内含子必须由前mRNA中去除,使得可产生由外显子编码的蛋白(本文使用的术语“蛋白”指天然蛋白、野生型蛋白或功能蛋白)。内含子由前mRNA中去除以及随后的外显子接合在剪接过程中进行。
剪接过程是在转录之后(即转录后)但在翻译前在RNA上进行的一系列由剪接因子介导的反应。因此,“前mRNA”是含外显子以及一个或多个内含子的RNA,“信使RNA(mRNA或RNA)”是已由其中去除了任意内含子的RNA,其中外显子随后接合在一起,使得可通过用核糖体翻译为功能蛋白或通过翻译为功能性RNA由外显子产生基因产物。
本文使用的术语“翻译”包括由核糖体引导的氨基酸链(例如肽或多肽)产生,核糖体沿着含编码氨基酸序列的密码子的信使RNA移动。本文使用的术语翻译还包括由编码RNA分子核苷酸序列的互补核苷酸序列(例如外显子)产生功能性RNA分子(例如核酶、反义RNA、RNAi、snRNA等)。
内含子的特征为一组“剪接元件”,它们是剪接机器的一部分,是剪接必需的。内含子是相对短的保守核酸区段,其结合进行剪接反应的各种剪接因子。因此,每个内含子都由5′剪接位点、3′剪接位点和位于它们之间的分支点限定。剪接元件还包含位于外显子中的外显子剪接增强子和沉默子,以及位于内含子中、与剪接位点和分支点有一段距离的内含子剪接增强子和沉默子。除了剪接位点和分支点以外,这些元件还控制可变剪接、异常剪接和组成型剪接。
按照本发明的实施方案,第一核苷酸序列可为但不限于任意组合的编码蛋白或肽的核苷酸序列、作为RNA具有酶活性的核苷酸序列(例如RNAi)、编码核酶的核苷酸序列、编码反义序列的核苷酸序列和/或编码小核RNA(snRNA)的核苷酸序列。
本文使用的术语“外源的”和/或“异源的”还可包括在包含其的核酸构建物和/或传递载体(例如病毒传递载体)中天然不存在的核苷酸序列,还可包括相对于其它核苷酸序列处于非天然环境和/或位置的核苷酸序列(例如通过与天然不与其相连的启动子或编码序列连接)。因此,在某些实施方案中,本发明的第一核苷酸序列可编码本发明的蛋白、肽和/或RNA,它们对待导入其中的细胞是外源的或异源的(即非天然的、不以天然状态存在的和/或修饰的和/或重复的)。第一核苷酸序列对其所置入的载体(例如病毒载体)而言也可为外源的或异源的。而且,第二核苷酸序列对其所置入的载体和/或相对于与其连接的作为内含子的第一核苷酸序列和/或相对于其所置入的细胞可为外源的或异源的。
或者,由第一核苷酸序列编码的蛋白、肽或RNA对细胞可为内源的(即其在该细胞中天然存在),但作为分离的核酸导入到细胞中和/或存在于细胞中。所述“分离的核酸”指大致上或基本上没有某些组分的核酸,这些组分一般被发现在其天然状态下与所述核酸结合。这些组分包括其它细胞材料、来自重组生产的培养基和/或在化学合成核酸时使用的各种化学物质。本发明的“分离的”核酸一般没有在该核酸所来源的生物体基因组DNA中邻接目标核酸的核酸序列(例如在5′或3′末端存在的编码序列)。但是,本发明的核酸可包括并不有害地影响核酸基本特征的一些额外碱基或部分。
所谓的本发明“分离的”蛋白或肽指基本上没有某些组分的蛋白或肽,这些组分一般被发现在其天然状态下与所述肽或蛋白结合。
赋予生物功能的本发明分子可为信使RNA、蛋白、肽、核酶、RNAi、snRNA、反义RNA等。因此,在某些实施方案中,赋予生物功能的RNA是被翻译成赋予生物功能的蛋白或肽的RNA,或者为被翻译成和/或直接用作如本文所述赋予生物功能的RNA的(例如核酶、RNAi、snRNA、反义RNA等)RNA。
本发明核酸的非限制性实例包括这样的核酸,其包含以下几项、基本由以下几项组成和/或由以下几项组成:任意组合的如SEQ IDNO:1(质粒TRCBA-int-luc突变型)、SEQ ID NO:2(质粒TRCBA-int-luc(野生型))、SEQ ID NO:3(质粒TRCBA-int-luc(657GT))、SEQ ID NO:4(质粒GL3-int-Luc(突变型))、SEQ ID NO:5(GL3-int-Luc(野生型))、SEQ ID NO:6(GL3-int-Luc(657GT))、SEQ ID NO:7(GL3-2int-fron-sph(突变型))、SEQ ID NO:8(GL3-3int-2fron-sph(突变型))、SEQ ID NO:9(GL3-int-Luc A(突变型))、SEQ ID NO:10(GL3-int-Luc B))、SEQ IDNO:11(GL3-int-Luc C)、SEQ ID NO:12(GL3-int-fron(突变型))、SEQID NO:13(GL3-2int-sph(突变型))、SEQ ID NO:14(GL3-2int-Sph-C)、SEQ ID NO:15(GL3-sint200-sph(突变型))、SEQ ID NO:16(GL3-sint200-sph(657GT))、SEQ ID NO:17(GL3-sint425-sph)和/或SEQ IDNO:35(TRCBA-int-AAT-654CT)陈述的核苷酸序列。
还提供如本文所述的这些序列的功能区的非限制性实例(例如SEQ ID NO:1-17的内含子和编码序列(即SEQ ID NO:21-34)、含654C-T突变的内含子(SEQ ID NO:18)、野生型内含子(SEQ IDNO:19)、含654C-T突变和657TA-GT突变的内含子(SEQ ID NO:20)以及SEQ ID NO:35的内含子和编码序列(SEQ ID NO:36)。因此,本发明的核酸可包含以下几项、基本上由以下几项组成和/或由以下几项组成:本文鉴别为第一核苷酸序列的一种或一种以上的核苷酸序列和/或其功能区。此第一核苷酸序列和/或功能区可以彼此相对和/或相对于核酸的其它组分和本发明的核酸构建物的任意组合(包括相同核苷酸序列的重复)、任意顺序和任意位置存在。
本发明核酸还可包含引导第一核苷酸序列表达的启动子。可包含在本发明核酸中并与本发明的第一核苷酸序列有效连接(operablyassocited)的启动子的实例包括但不限于组成型启动子和/或诱导型启动子,其一些非限制性实例包括病毒启动子(例如CMV、SV40)、组织特异性启动子(例如肌肉MCK)、心脏启动子(例如NSE)、眼启动子(例如MSK)和合成启动子(SP1元件)。本发明启动子的实例是如本文实施例中描述的鸡β肌动蛋白启动子(CB或CBA)。本发明的启动子可存在于本发明核酸上的任意位置,在该位置启动子与第一核苷酸序列有效连接。可相同或不同的一个或多个启动子可一起存在于同一核酸分子中,或者可彼此相对和/或相对于存在于核酸上的第一核苷酸序列和/或第二核苷酸序列定位在核酸分子上的不同位置。此外,内部核糖体进入信号(IRES)和/或其它核糖体通读元件可存在于该核酸分子上。一个或多个这样的IRES和/或核糖体通读元件可相同或不同,可一起存在于同一核酸分子中,和/或存在于核酸分子上的不同位置。当多个第一核苷酸序列存在于本发明的核酸分子上时,这样的IRES和核糖体通读元件可用于通过非帽依赖性机制来翻译信使RNA序列。
在其中启动子存在于本发明的分离核酸上的本发明实施方案中,启动子可相对于第一核苷酸序列和/或第二核苷酸序列定位于核酸分子中的任意位置。例如,第二核苷酸序列可位于启动子和第一核苷酸序列之间。此外,第二核苷酸序列可相对于第一核苷酸序列定位于核酸分子中的任意位置。例如,第二核苷酸序列可定位于第一核苷酸序列之前、之后和/或当中。在某些实施方案中,第二核苷酸序列可定位于第一核苷酸序列的5′1/3核苷酸中的任意位置、第一核苷酸序列的中间1/3核苷酸中的任意位置和/或第一核苷酸序列的3′1/3核苷酸中的任意位置。在某些实施方案中,第二核苷酸序列可定位于第一核苷酸序列的可读框和polyA位点之间的任意位置。
在其中两个或多个第二核苷酸序列存在于本发明分离核酸中的某些实施方案中,第二核苷酸序列可间隔至少约5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个核苷酸定位,包括本文未具体提及的5-1000之间的任意核苷酸数量。
本发明核酸分子的第二核苷酸序列可包含以下几项、基本由以下几项组成和/或由以下几项组成:限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和限定与第一内含子不同的第二内含子的第二组剪接元件,其中第二内含子通过剪接被去除,从而不产生RNA分子和/或在所述第二组剪接元件有活性时产生不赋予生物功能的第二RNA分子。在某些实施方案中,本发明的第二核苷酸序列可包含一个或多个突变,所述突变可为置换、添加、缺失等。
本发明的第二核苷酸序列的具体但非限制性的实例可包括但不限于SEQ ID NO:18-20、50-71、74、75和78中任一个的核苷酸。本发明的分离核酸的具体实例包括但不限于SEQ ID NO:1-17和21-36。本发明的封闭寡核苷酸的具体但非限制性的实例包括SEQ ID NO:37-49、72、73、76、79和80。
在本发明核酸中,第一内含子是功能性内含子,其通过剪接被去除,从而产生赋予生物功能的第一RNA分子。生物功能可在其中第一核苷酸序列为功能性RNA的实施方案中被直接赋予和/或通过将第一RNA分子翻译成赋予生物功能的蛋白、肽或RNA而被间接赋予。这样的生物功能可包括治疗作用,包括例如用于恢复和/或增加蛋白、肽和/或RNA的活性的基因治疗,而在其它情况下所述活性缺失和/或以不足或较低的量存在(例如修正导致疾病或障碍并对基因疗法之类的治疗有反应的遗传缺陷)。
如本文所述,当本发明核酸存在于其中可发生剪接的环境中且没有本发明的封闭分子或化合物的情况下,限定第二内含子的第二组剪接元件是有活性的,则第二内含子被去除,导致没有由该核酸产生第一RNA分子。当第二内含子被去除时,结果可为产生不赋予本发明的生物功能的第二RNA分子(即非功能性RNA)和/或根本不产生第二RNA分子。
本发明核酸的第二核苷酸序列可作为单个核苷酸序列存在于核酸分子上的任意位置,或者第二核苷酸序列可作为两个或多个可相同或不同的第二核苷酸序列存在于同一核酸分子上。因此,例如,第二核苷酸序列可以众多的两个或多个相同和/或不同的核苷酸序列存在,这些核苷酸序列可串联存在、分散于整个核酸分子中的不同位置和/或既一起(例如串联)又分散。
本发明核酸可存在于载体中,此载体可存在于细胞中。任意合适的载体都包含在本发明的实施方案中,包括但不限于非病毒载体(例如质粒、聚氧体(poloxymer)和脂质体)、病毒载体和合成生物纳颗粒(BNP)(例如由不同的腺相关病毒以及其它细小病毒综合设计)。
对本领域技术人员显而易见的是,可使用任意合适的载体来传递本发明的异源核酸。可基于本领域已知的众多因素对传递载体进行选择,所述因素包括目标宿主的年龄和物种、体外对体内传递、期望的表达水平和持续性、预期用途(例如用于治疗或多肽生产)、靶细胞或器官、传递途径、分离核酸的大小、安全性考虑,等等。
合适的载体还包括与核酸分子如质粒等一起使用的病毒载体(例如逆转录病毒、甲病毒、痘苗病毒、腺病毒、腺相关病毒或单纯疱疹病毒)、脂质载体、聚赖氨酸载体、合成多氨基聚合物载体。
本发明可使用本领域已知的任意病毒载体。此病毒载体的实例包括但不限于得自以下的载体:腺病毒科(Adenoviridae)、双RNA病毒科(Birnaviridae)、布尼亚病毒科(Bunyaviridae)、杯状病毒科(Caliciviridae)、细形病毒组(Capillovirus group)、香石竹潜病毒组(Carlavirus group)、香石竹斑驳病毒组(Carmovirus virus group)、花椰菜花叶病毒组(Group Caulimovirus)、长线形病毒组(ClosterovirusGroup)、鸭跖草黄化斑驳病毒组(Commelina yellow mottle virusgroup)、豇豆花叶病毒组(Comovirus virus group)、冠状病菌科(Coronaviridae)、PM2噬菌体组(PM2 phage group)、覆盖噬菌体科(Corcicoviridae)、潜隐病毒组(Group Cryptic virus)、隐病毒组(groupCryptovirus)、黄瓜花叶病毒组家族(Cucumovirus virus group Family)、[PHgr]6噬菌体组([PHgr]6phage group)、囊状噬菌体科(Cysioviridae)、香石竹环斑病毒组(Group Carnation ringspot)、香石竹病毒组(Dianthovirus virus group)、蚕豆枯萎病毒组(Group Broad bean wilt)、蚕豆病毒组(Fabavirus virus group)、线状病毒科(Filoviridae)、黄病毒科(Flaviviridae)、真菌传杆状病毒组(Furovirus group)、联体病毒组(Group Germinivirus)、贾第鞭毛虫病毒组(Group Giardiavirus)、嗜肝DNA病毒科(Hepadnaviridae)、疱疹病毒科(Herpesviridae)、大麦病毒组(Hordeivirus virus group)、等轴不稳定环斑病毒组(Illarvirus virusgroup)、丝杆噬菌体科(Inoviridae)、虹彩病毒科(Iridoviridae)、轻小噬菌体科(Leviviridae)、脂毛噬菌体科(Lipothrixviridae)、黄症病毒组(Luteovirus group)、玉米雷亚朵非罗病毒组(Marafivirus virus group)、玉米退绿病矮小病毒组(Maize chlorotic dwarf virus group)、微小噬茵体科(icroviridae)、肌尾噬菌体科(Myoviridae)、坏死病毒组(Necrovirusgroup)、线虫传多面体病毒组(Nepovirus virus group)、野田村病毒科(Nodaviridae)、正粘病毒科(Orthomyxoviridae)、乳头多瘤空泡病毒科(Papovaviridae)、副粘病毒科(Paramyxoviridae)、欧防风黄点病毒组(Parsnip yellow fleck virus group)、双组分双链RNA球状真菌病毒科(Partitiviridae)、细小病毒科(Parvoviridae)、豌豆耳突花叶病毒组(Peaenation mosaic virus group)、藻类DNA病毒科(Phycodnaviridae)、小RNA病毒科(Picornaviridae)、芽生噬菌体科(Plasmaviridae)、短尾病毒科(Prodoviridae)、多DNA病毒科(Polydnaviridae)、马铃薯X病毒组(Potexvirus group)、马铃薯Y病毒组(Potyvirus)、痘病毒科(Poxviridae)、呼肠孤病毒科(Reoviridae)、逆转录病毒科(Retroviridae)、弹状病毒科(Rhabdoviridae)、根前毛菌噬菌体组(GroupRhizidiovirus)、长尾噬菌体科(Siphoviridae)、南方菜豆花叶病毒组(Sobemovirus group)、SSV 1-型噬菌体(SSV 1-Type Phages)、复层噬菌体科(Tectiviridae)、纤细病毒属(Tenuivirus)、四体病毒科(Tetraviridae)、烟草花叶病毒组(Group Tobamovirus)、烟草脆裂病毒组(Group Tobravirus)、披膜病毒科(Togaviridae)、番茄丛矮病毒组(Group Tombusvirus)、环曲病毒属(Group Torovirus)、单组分双链RNA球状真菌病毒科(Totiviridae)、芜菁黄化花叶病毒组(Group Tymovirus)和植物卫星病毒(Plant virus satellites)。
产生重组病毒载体的方法和使用病毒载体进行核酸传递的方法可见于例如Current Protocols in Molecular Biology,Ausubel,F.M.等(编辑)Greene Publishing Associates,(1989)和其它标准实验室指引(例如Vectors for Gene Therapy.载于:Current Protocols in Human Genetics.John Wiley and Sons,Inc.1997)。
用于本发明方法的载体的非限制性实例包括用于传递核酸至细胞中的任意核苷酸构建物,例如质粒、非病毒载体或病毒载体,如可包装重组逆转录病毒基因组的逆转录病毒载体(参见例如Pastan等,Proc.Natl.Acad.Sci.U.S.A.85:4486(1988);Miller等,Mol.Cell.Biol.6:2895(1986))。例如,重组逆转录病毒可用于感染,并由此传递本发明核酸至感染细胞。将改变型核酸导入到哺乳动物细胞中的确切方法当然不限于使用逆转录病毒载体。其它技术普遍可用于该程序,包括使用腺病毒载体(Mitani等,Hum.Gene Ther.5:941-948,1994)、腺相关病毒(AAV)载体(Goodman等,Blood 84:1492-1500,1994)、慢病毒载体(Naldini等,Science 272:263-267,1996)、假型逆转录病毒载体(Agrawal等,Exper.Hematol.24:738-747,1996),以及目前已知或以后鉴别的任意其它载体系统。还包括本领域众所周知的嵌合病毒颗粒,其可包含来自两种或多种不同病毒的任意组合的病毒蛋白和/或核酸,以产生功能性病毒载体。本发明的嵌合病毒颗粒还可包含非病毒来源的氨基酸序列和/或核苷酸序列(例如有利于将载体靶向特定细胞或组织和/或诱导特异性免疫应答)。本发明还提供“靶向”病毒颗粒(例如含细小病毒壳体和重组AAV基因组的细小病毒载体,其中外源靶向序列已插入或替换入细小病毒壳体中)。
还可使用物理转导技术,例如脂质体传递以及受体介导的和其它的胞吞机制(参见例如Schwartzenberger等,Blood 87:472-478,1996)。本发明可与这些和/或其它常用核酸转移方法中的任一种联合使用。合适的转染工具,包括病毒载体、化学转染剂或物理-机械方法(如电穿孔)以及DNA直接扩散,描述于例如Wolff等,Science247:1465-1468,(1990);和Wolff,Nature 352:815-818,(1991)。
因此,可通过众多周知方法中的任一种实现本发明核酸的施用,这些方法例如但不限于直接转移核酸、在质粒或病毒载体中或者经由在细胞中或与诸如阳离子脂质体的载体组合转移。这样的方法在本领域众所周知,可容易地适用于本文描述的方法。而且,这些方法可利用载体的靶向特性用于靶向某些疾病和组织、器官和/或细胞类型和/或群体,这些载体应当是技术人员众所周知的。还要充分理解的是,可在本发明核酸中使用细胞和组织特异性启动子,以靶向特定组织和细胞和/或治疗特定疾病和障碍。
含本发明载体和/或核酸的细胞可为可包含本发明载体和/或核酸的任意细胞,包括但不限于得自肌肉(例如平滑肌、骨骼肌、心肌肌细胞)、肝脏(例如肝细胞)、心脏、脑(例如神经元)、眼(例如视网膜、角膜)、胰腺、肾、内皮、上皮、干细胞(例如骨髓、脐血)、组织培养细胞(例如HeLa细胞)等的细胞,它们是本领域众所周知的。
在某些实施方案中,在与其它基因表达调节系统相比时,本发明核酸具有降低水平的“泄漏性”。所谓“泄漏性”指系统处于“off”位时产生的基因产物或功能性RNA的量。例如,在本文描述的某些实施方案中,当本发明的核酸没有与本发明的封闭寡核苷酸、小分子和/或其它化合物接触时,给出的系统处于“off”位,因此,第一内含子不被剪接。泄漏性可以是这些调节系统中固有的问题,但在所给出系统的某些实施方案中,泄漏性水平可低于本领域已知的系统。因此,本发明还提供一种基因表达调节系统,其具有的泄漏性比其它基因表达调节系统低,其中所述系统包含本发明核酸和/或本发明载体。与其它系统相比,在所给出系统中泄漏性降低的程度可比在本领域已知系统中观察到的泄漏量低5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100%。
作为一个实例,可通过在系统中使用报告基因并检测系统处于“OFF”位时产生的报告基因产物量来测定系统的泄漏量。可使用众多测定来检测报告基因产物,包括但不限于蛋白检测实验,如ELISA和蛋白质印迹分析,以及核酸检测实验,例如聚合酶链反应、DNA印迹分析和RNA印迹分析。检测基因产物的其它实验可包括功能性测定,例如检测因基因产物引起的生物活性量。本发明的核酸和方法可用于对比性实验,以证实与其它已知基因调节表达系统和其中使用的核酸相比泄漏性水平降低。
本文还提供使用本发明核酸、载体和细胞的各种方法。具体地说,本文提供一种产生本发明的第一RNA的方法,该方法包括:a)使本发明的封闭寡核苷酸和/或小分子和/或其它化合物与本发明核酸在允许剪接的条件下接触,其中封闭寡核苷酸和/或小分子和/或其它化合物封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,而产生第一RNA。
另外提供一种生产蛋白的方法,该方法包括:a)使本发明的封闭寡核苷酸和/或小分子和/或其它化合物与本发明核酸在允许剪接的条件下接触,这些条件在本领域应当是众所周知的,在本文提供的实施例中有描述,其中封闭寡核苷酸封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生蛋白。
在其它实施方案中,提供一种产生赋予生物功能的RNA的方法,该方法包括:a)使本发明的封闭寡核苷酸和/或小分子和/或其它化合物与本发明核酸在允许剪接的条件下接触,其中封闭寡核苷酸和/或小分子和/或其它化合物封闭第二组剪接元件成员,导致第一内含子通过剪接被去除,而产生第一RNA;和b)翻译第一RNA,从而产生赋予生物功能的RNA。在某些实施方案中,第一RNA可直接用作赋予生物功能的RNA,在其它实施方案中,第一RNA可被翻译为赋予生物功能的RNA。
在本文描述的任一种方法中,本发明的封闭寡核苷酸和/或小分子和/或其它化合物可被导入到含本发明核酸的细胞中,这样的细胞可处于动物中,所述动物可为人、非人哺乳动物(狗、猫、马、母牛等)或其它动物。
本发明的封闭寡核苷酸是阻止特定剪接位点的剪接活性的寡核苷酸(例如RNA或DNA或二者的组合)。剪接活性被阻止的原因在于封闭寡核苷酸结合作为引导剪接事件的剪接元件组成员的核苷酸序列,由此抑制剪接元件活性,导致剪接活性被抑制。因此,封闭寡核苷酸可与剪接界(splice junction)、5′剪接元件、3′剪接元件、隐蔽剪接元件、分支点、隐蔽分支点、天然剪接元件、突变型剪接元件等互补。本发明的封闭寡核苷酸的一些非限制性实例包括对β珠蛋白内含子的654T突变特异性的GCTATTACCTTAACCCAG(SEQ IDNO:37)和对β珠蛋白内含子的657GT突变特异性的GCACTTACCTTAACCCAG(SEQ ID NO:38)。其它实例包括含以下几项、基本由以下几项组成和/或由以下几项组成的寡核苷酸:SEQ IDNO:37、38、42、49、46、47、48、39、40、41、43、44、45、72、73、76、79和80的核苷酸序列。至于在这些寡核苷酸序列背景下的“基本由……组成”,意指寡核苷酸可在寡核苷酸序列的3′末端或5′末端包括额外核苷酸(例如1、2、3、4、5、6、7、8、9或10个额外核苷酸),这些额外核苷酸并不显著地影响寡核苷酸的功能或活性(例如这些额外的核苷酸不与原寡核苷酸序列的互补性序列杂交)。
在其中封闭寡核苷酸用于本发明方法的方法中,封闭寡核苷酸在某些实施方案中可为不活化RNA酶H的寡核苷酸。不活化RNA酶H的寡核苷酸可按照已知技术制备。参见例如Pederson等的美国专利第5,149,797号。这样的寡核苷酸可为脱氧核糖核苷酸序列或核糖核苷酸序列,包含在空间上阻碍或防止RNA酶H与含所述寡核苷酸作为其一员的双链分子结合的任意结构修饰,该结构修饰基本上不阻碍或破坏双链形成。因为参与双链形成的寡核苷酸部分与参与和RNA酶H结合的那些部分显著不同,所以可获得众多不活化RNA酶H的寡核苷酸。
本发明的寡核苷酸还可为其中至少一个或全部核苷酸间桥接磷酸酯残基为修饰型磷酸酯的寡核苷酸,所述修饰型磷酸酯例如为甲基磷酸酯、甲基硫代磷酸酯、吗啉代磷酸酯(phosphoromorpholidates)、哌嗪代磷酸酯(phosphoropiperazidates)和氨基磷酸酯。作为另一个实例,每隔一个核苷酸间桥接磷酸酯残基可如所述修饰。在另一个非限制性实例中,此寡核苷酸为其中至少一个或全部核苷酸包含2′低级烷基部分(例如C1-C4直链或支链的饱和或不饱和烷基,例如甲基、乙基、乙烯基、丙基、1-丙烯基、2-丙烯基和异丙基)的寡核苷酸。例如,每隔一个核苷酸可如所述修饰。(另参见Furdon等,Nucleic AcidsRes.17:9193-9204(1989);Agrawal等,Proc.Natl.Acad.Sci.USA87:1401-1405(1990);Baker等,Nucleic Acids Res.18,3537-3543(1990);Sproat等,Nucleic Acids Res.17:3373-3386(1989);Walder和Walder,Proc.Natl.Acad.Sci.USA 85:5011-5015(1988))。因此,在某些实施方案中,本发明的封闭核苷酸可包含修饰型核苷酸间桥联磷酸酯残基,后者可为但不限于任意组合的甲基硫代磷酸酯、吗啉代磷酸酯、哌嗪代磷酸酯和/或氨基磷酸酯。在某些实施方案中,封闭寡核苷酸可包含在其2′位具有低级烷基取代基的核苷酸。
本发明的修饰型寡核苷酸的额外实例包括肽核酸(PNA)和锁定核酸(LNA)。
在PNA中,主链由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元组成。不同的碱基(嘌呤和嘧啶)通过亚甲羰基键连接至主链。与DNA或其它DNA类似物不同,PNA不包含任何戊糖部分或磷酸酯基团。PNA被描述为类似在第一个(左侧)位置具有N-末端和在右侧具有C-末端的肽。
PNA主链不带电,这赋予该聚合物在PNA/DNA链之间比PNA链之间和DNA链之间更强的结合。这是由于在PNA和DNA链之间没有电荷排斥。
采用同型嘧啶链的早期实验已表明,6聚体PNA T/DNA dA的Tm经测定为31℃,相比之下DNA dT/DNA dA 6聚体双链体在低于10℃的温度变性。
具肽主链并携带嘌呤和嘧啶碱基的PNA不是容易被核酸酶或蛋白酶识别的分子类别。因此,它们抗酶降解。PNA还在广泛的pH范围内稳定。因为它们不容易被酶降解,所以这些聚合物的寿命在体外和体内均延长。另外,它们不带电的事实有利于其穿过细胞膜,其较强的结合特性应降低调节基因表达所需的寡核苷酸量。
LNA是一类含核苷的核酸,其主要的区别特征是在核糖环的2′-O和4′-C原子之间存在亚甲基桥。该桥限制了核苷酸类似物的呋喃核糖环的屈曲性,并将其锁成刚性的双环N-型构象。而且,LNA诱导邻近的DNA碱基采用该构象,导致形成热动力学更稳定形式的A双链体LNA核苷,其包含出现在DNA中的4种普通核苷碱基(nucleobase)(A、T、G、C),这些碱基可按照标准Watson-Crick法则与其互补核苷配对。可使用标准亚磷酰胺DNA合成化学法使LNA与DNA或RNA以及其它核酸类似物混合。因此,LNA寡核苷酸可容易地用例如氨基接头、生物素、荧光团等标记。因此,在设计引物和探针方面存在非常高的自由度。其锁定构象增加了对互补序列的结合亲和力,提供了优化和精调用于核酸的敏感性和特异性检测的引物和探针的新化学方法。该差异可经实验作为LNA-NA杂双链体的热稳定性增加而观察到,取决于序列中存在的LNA核苷数以及使用的核苷碱基的化学性质这二者。该实验差异可用于调节寡核苷酸探针的特异性,其中所述探针设计用于通过标准杂交技术检测特定核酸靶。
本文使用的“第二组剪接元件成员”包括参与活化第二内含子的剪接的任意元件。例如,第二组剪接元件元件可为天然DNA和/或前mRNA中的突变结果,所述突变可为产生新剪接元件的置换突变和/添加突变和/或缺失突变。因此,新剪接元件是限定第二内含子的第二组剪接元件的一员。第二组剪接元件的其余成员还可为限定第一内含子的剪接元件组成员。例如,如果突变产生新的第二个3′剪接位点,该位点既位于第一个3′剪接位点的上游(即5′),也位于第一个分支点的下游(即3′),则第一个5′剪接位点和第一个分支点可同时用作第一组剪接元件成员和第二组剪接元件成员。
在某些情况下,导入第二组剪接元件可使一般静息或不起剪接元件作用的RNA天然区被活化,而用作剪接元件。这样的元件称为“隐蔽”元件。例如,如果导入位于第一个3′剪接位点和第一个分支点之间的新3′剪接位点,则其可活化新3′剪接位点和第一个分支点之间的隐蔽分支点。
在其它情况下,导入位于第一个分支点和第一个5′剪接位点之间的新5′剪接位点,还可活化顺序地位于新5′剪接位点上游的隐蔽3′剪接位点和隐蔽分支点。在此情况下,第一内含子被分为两个异常内含子,新外显子位于它们之间。
此外,在其中第一个剪接元件(特别是分支点)也是第二个剪接元件组成员的某些情况下,有可能封闭第一个元件,并活化隐蔽元件(即隐蔽分支点),该隐蔽元件将募集第一组剪接元件的其余成员,以迫使正确的剪接超过不正确的剪接。还要指出的是,在隐蔽剪接元件被活化时,其可位于任一个内含子中和/或邻近的一个外显子中。
因此,如上所示,根据组成“第二组剪接元件”的剪接元件组,本发明的封闭寡核苷酸、小分子和/或其它化合物可封闭各种不同的剪接元件,以实施本发明。例如,其可封闭突变元件、隐蔽元件、天然元件、5′剪接位点、3′剪接位点和/或分支点。一般来说,其将不封闭还限定第一内含子的剪接元件,当然要考虑到如上所论述的情况:封闭第一内含子的剪接元件活化隐蔽元件,然后隐蔽元件用作第一组剪接元件的替代成员,并参与正确剪接。
封闭寡核苷酸的长度(即其中核苷酸的数量)并不关键,只要其选择性结合至预期位置,并可按照常规程序测定。因此,在某些实施方案中,本发明的封闭寡核苷酸可为约5个至约100个核苷酸长。具体地说,本发明的封闭寡核苷酸可为约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个核苷酸长。在某些实施方案中,本发明的封闭寡核苷酸为8-50个核苷酸长。在本发明的其它实施方案中,封闭寡核苷酸为15-25个核苷酸长,还可为18-20个核苷酸长。封闭寡核苷酸可作为相同寡核苷酸群和/或彼此之间以任意组合和/或任意比率存在的不同寡核苷酸群用于本文所述方法。
本发明的小分子是与其它小分子相比在结构上和/或功能上不同的活性化合物,其具有低分子量(例如≤5000道尔顿)。小分子可为天然或合成物质。它们可通过有机化学方法合成,和/或由天然来源如植物、真菌和微生物分离。小分子可为“药物样的”(例如阿司匹林、青霉素、化疗剂)、有毒的和/或天然的。小分子药物可为一种或多种活性化合物,通常配制为口服使用的丸剂,其与特定生物靶如受体、酶或离子通道相互作用,以提供疗效。本发明小分子的具体但非限制性的实例包括抗生素、核苷类似物(例如丰加霉素)和适体(例如RNA适体;DNA适体)。
本发明的小分子可为存在于大量小分子文库中的小分子,其中一些是商品化的。可包含本发明小分子的文库的非限制性实例包括由各个商业机构获得的小分子文库,这些商业机构例如为SPECS和BioSPEC B.V.(Rijswijk,the Netherlands)、Chembridge Corporation(SanDiego,CA)、Comgenex USA Inc.(Princeton,NJ)、Maybridge ChemicalLtd.(Cornwall,UK)和Asinex(Moscow,Russia)。一个代表性实例称为DIVERSetTM,得自ChemBridge Corporation,16981 Via Tazon,Suite G,San Diego,Calif.92127。DIVERSetTM包含10,000-50,000个人工合成的药物样小分子。预选择化合物,以形成用最少量的化合物覆盖最大药效团多样性并适于高通量或低通量筛选的“通用”文库。有关其它文库的描述,参见例如Tan等,“Stereoselective Synthesis of OverTwo Million Compounds Having Structural Features Both Reminiscent ofNatural Products and Compatible with Miniaturized Cell-Based Assays”Am.Chem Soc.120,8565-8566,1998;Floyd等,Prog Med Chem 36:91-168,1999。众多文库是商品化的,例如来自AnalytiCon USA Inc.P.O.Box 5926,Kingwood,Tex.77325;3-Dimensional Pharmaceuticals,Inc.665 Stockton Drive,Suite 104,Exton,Pa.19341-1151;Tripos,Inc.1699Hanley Rd.St.Louis,Mo.63144-2913,等等。
本发明的小分子和其它化合物可通过各种机制操作,以改变本发明核酸中的剪接事件。例如,本发明的小分子和其它化合物可干涉剪接复合物、剪接体及其组分如hnRNP、snRNP、SR-蛋白和其它剪接因子或元件的形成和/或功能和/或其它特性,导致阻止和诱导前-mRNA分子中的剪接事件。作为另一个实例,本发明的小分子和其它化合物可阻止和/或改变基因产物的转录,所述基因产物可包括例如但不限于hnRNP、snRNP、SR-蛋白和其它剪接因子,它们随后参与特定剪接体的形成和/或功能。本发明的小分子和其它化合物还可阻止和/或改变基因产物的磷酸化、糖基化和/或其它修饰,所述基因产物包括但不限于hnRNP、snRNP、SR-蛋白和其它剪接因子,它们随后参与特定剪接体的形成和/或功能。另外,本发明的小分子和其它化合物可结合和/或要不然影响特定前mRNA,使得特定剪接事件经某种机制被阻止或诱导,该机制不包括以序列特异性方式与RNA碱基配对。
本发明还提供一种在受治疗者中产生赋予生物功能的蛋白和/或RNA的方法,该方法包括:a)将本发明的核酸、载体和/或细胞导入受治疗者中;和b)将封闭第二组剪接元件成员的本发明的封闭寡核苷酸和/或小分子和/或其它化合物导入受治疗者中,由此在受治疗者中产生赋予生物功能的蛋白和/或RNA。
另外提供一种在受治疗者中调节赋予生物功能的蛋白和/或RNA的产生的方法,该方法包括:a)将本发明的核酸、载体和/或细胞导入受治疗者中;和b)在期望产生所述蛋白和/或RNA时将封闭第二组剪接元件成员的本发明的封闭寡核苷酸和/或小分子和/或其它化合物导入受治疗者中,由此在受治疗者中调节该蛋白和/或RNA的产生。可按照本领域已知方法监测随时间变化的存在于受治疗者中的蛋白和/或RNA的量,当该量落在期望水平和/或治疗水平之下时,可将封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中,以增加蛋白和/或RNA的产生,由此调节所述产生。
在其中将本发明的核酸、载体和/或细胞施用给受治疗者的本文所述方法中,所述核酸、载体和/或细胞最初可在没有封闭寡核苷酸和/或小分子和/或其它化合物的情况下存在于受治疗者中,该封闭寡核苷酸和/或小分子和/或其它化合物的存在会导致封闭第二组剪接元件成员。在此状况下,第二组剪接元件有活性,由第一核苷酸序列编码的、赋予生物功能的外源蛋白、肽和/或RNA在受治疗者中没有产生或产生非常少(不显著)。当本发明的封闭寡核苷酸、小分子和/或其它化合物存在于受治疗者中时,核酸上的第二组剪接元件成员被封闭,导致通过剪接去除第一内含子,随后在受治疗者中产生由第一核苷酸序列编码的、赋予生物功能的蛋白和/或RNA。
可在相对于将本发明的核酸、载体和/或细胞导入受治疗者中的任意时刻将封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中。例如,可在将所述核酸、载体和/或细胞导入受治疗者中之前、同时和/或之后将封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中。而且,封闭寡核苷酸、小分子和/或其它化合物可以任意时间间隔一次或多次施用,并可扩展至受治疗者的整个生命期。
因此,在某些实施方案中,本发明提供一种在受治疗者中治疗疾病或障碍的方法,该方法包括:a)将有效量的本发明核酸、载体和/或细胞导入受治疗者中;和b)将有效量的本发明封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中,由此在所述受治疗者中治疗疾病。当核酸、载体和/或细胞以及封闭寡核苷酸、小分子和/或其它化合物存在于受治疗者中时,它们在某些条件下存在,借助于这些条件,封闭寡核苷酸、小分子和/或其它化合物可接触核酸,并封闭第二组剪接元件成员,由此导致在受治疗者中产生蛋白、肽和/或赋予生物功能的RNA。
在本发明的另外实施方案中,依据本发明方法的基因表达调节可与本文描述的系统相反发生。具体地说,在本发明的某些实施方案中,在没有调节剪接介导的表达(例如不产生第一RNA,导致产生蛋白、肽和/或赋予生物功能的RNA)的封闭寡核苷酸、小分子和/或其它化合物的情况下,所述系统处于本文所述的“OFF”位。在某些其它实施方案中,在没有调节剪接介导的表达的封闭寡核苷酸、小分子和/或其它化合物的情况下,本发明的系统可处于“ON”位。在后面的这些实施方案中,可实施本发明的方法,由此在导致第一内含子被去除而产生第一RNA的条件下存在的本发明的核酸、载体和/或细胞与本发明的封闭寡核苷酸、小分子和/或其它化合物接触,导致封闭第一组剪接元件成员,由此导致第二内含子被剪接和去除,从而未产生第二RNA分子和/或产生不赋予生物功能的第二RNA分子。
本发明的核酸、载体、细胞、封闭寡核苷酸、小分子和/或其它化合物的“有效量”指无毒但足以提供期望作用的量,所述期望作用可为有益作用或治疗性作用。本领域众所周知,需要的确切量将在受治疗者之间变化,取决于受治疗者的年龄、性别、物种、身体状况、要治疗的病症的严重性、要施用的具体药剂等。在任意个体情况中适宜的“有效量”可由本领域一般技术人员参照相关教科书和文献(例如Remington′s Pharmaceutical Sciences(最新版)和/或使用常规药理学方法确定。
本文使用的“治疗”指给予受治疗者利益的任意治疗类型,其中所述受治疗者被诊断为患有疾病或障碍、处于疾病或障碍的风险之中、疑似患有和/或可能患有疾病或障碍,所述疾病或障碍以积极方式对本发明的蛋白和/或RNA起反应。利益可包括受治疗者身体状况(例如一种或多种症状)的改善、病症演进的延迟和/或逆转、疾病或障碍发作的预防或延迟,等等。
如本文所指出的,本发明提供一种治疗本发明的障碍或疾病的方法,该方法包括:a)将有效量的本发明核酸导入受治疗者中;和b)将有效量的本发明封闭寡核苷酸和/或小分子导入受治疗者中,由此治疗受治疗者中的障碍或疾病。
可通过本发明方法治疗的疾病或障碍可包括对治疗有响应的任意疾病或障碍,所述治疗包括在受治疗者中存在本发明的蛋白、肽和/或赋予生物功能的RNA和/或它们的量增加。这样的蛋白、肽和/或RNA可通过将本发明的核酸、载体和/或细胞导入到受治疗者中以及将本发明的封闭寡核苷酸、小分子和/或其它化合物导入受治疗者中而存在于受治疗者中。
可通过本发明方法治疗的疾病和/或障碍的非限制性实例以及可由本发明的第一个核苷酸序列编码并可赋予治疗性作用的基因产物的一些实例包括:代谢性疾病,例如糖尿病(胰岛素)、生长/发育障碍(生长激素、调节生长因子的锌指蛋白)、凝血障碍(例如血友病A(VIII因子)、血友病B(IX因子))、中枢神经系统障碍(例如癫痫发作、帕金森病(胶质细胞衍生神经营养因子(GDNF)和GDNF样生长因子)、阿尔茨海默病(神经生长因子、GDNF和GDNF样生长因子)、肌萎缩性侧索硬化、脱髓鞘病)、同种异体骨移植(骨形态发生蛋白2(蛋白1-9,例如MBP2))、炎性疾病(例如关节炎、自身免疫病)、肥胖、癌症、心血管疾病(例如充血性心力衰竭(受磷蛋白和Ca++泵相关基因))、黄斑变性(色素上皮衍生因子(PDEF)、β-地中海贫血、α-地中海贫血、Tay-Sachs综合症、苯丙酮酸尿症、囊性纤维化和/或病毒感染。
其它实例包括编码可溶解CD4、用于治疗AIDS的核酸以及用于治疗由α-抗胰蛋白酶缺乏引起的肺气肿的α-胰蛋白酶。可通过本发明方法和组合物治疗的其它疾病、综合症和病症包括:例如腺苷脱氨酶缺乏症、镰状细胞缺乏症、诸如亨廷顿舞蹈病的脑病、溶酶体沉积病、高歇病、胡尔勒病、克拉伯病、诸如显性脊髓小脑型共济失调的运动神经元病(实例包括SCA1、SCA2和SCA3)、地中海贫血、血友病、苯丙酮酸尿症和心脏病(例如由胆固醇代谢改变引起的心脏病)和免疫系统缺陷。可通过这些方法治疗的其它疾病包括代谢疾病,例如肌与骨骼疾病、心血管疾病和癌症。本发明的核酸还可传递至气道上皮,以治疗遗传疾病,例如囊性纤维化、假性醛固酮减少症和纤毛不能移动综合征,以及非遗传性疾病(例如支气管炎、哮喘)。本发明的核酸还可传递至肺泡上皮,以治疗遗传性疾病(例如α-1-抗胰蛋白酶)以及肺病(例如治疗肺炎和肺气肿肺纤维化、肺水肿;传递编码表面蛋白的核酸至早产儿或ARDS患者)。
一般来说,本发明的核酸和载体可用于传递任何具有生物功能的核酸,以治疗或缓解与任意基因表达相关性疾病有关的症状。示例性病状包括但不限于:囊性纤维化(和其它肺病)、血友病A、血友病B、地中海贫血、贫血和其它血液疾病、AIDS、癌症(例如脑瘤)、糖尿病、肌营养不良(例如Duchenne、Becker)、高歇病、胡尔勒病、腺苷脱氨酶缺乏症、糖原贮积病和其它代谢缺陷、粘多糖病和实质器官(例如脑、肝、肾、心脏、肺、眼)疾病等。
在某些实施方案中,可施用本发明的传递载体,以治疗CNS病,包括遗传疾病、神经变性性疾病、精神疾病和/或肿瘤。示例性的CNS疾病包括但不限于阿尔茨海默病、帕金森病、亨廷顿舞蹈病、Rett综合症、Canavan病、Leigh病、Refsum病、Tourette综合症、原发性侧索硬化、肌萎缩性侧索硬化、进行性肌萎缩、Pick病、肌营养不良、多发性硬化、重症肌无力、Binswanger病、归因于脊髓或头部损伤的外伤、Tay Sachs病、Lesch-Nyan病、癫痫、脑梗塞、精神疾病(包括心境障碍(例如抑郁、双相情感障碍、持续性情感障碍、继发性心境障碍))、精神分裂症、药物依赖性(例如醇中毒和其它物质依赖性)、神经症(例如焦虑、强迫性障碍、身体症状性疾患(somatoformdisorder)、分离性障碍、悲恸、产后抑郁症)、精神病(例如幻觉和妄想)、痴呆、偏执狂、注意力不集中症、性心理障碍、睡眠障碍、疼痛疾病、进食或体重障碍(例如肥胖、恶病质、神经性食欲缺乏和贪食症)以及CNS癌症和肿瘤(例如垂体瘤)。
可按照本发明方法治疗的CNS疾病包括涉及视网膜、后束和视神经的眼部疾病(例如色素性视网膜炎、糖尿病视网膜病和其它视网膜变性性疾病、葡萄膜炎、年龄相关性黄斑变性、青光眼)。
即便不是全部也有大部分眼科疾病和障碍与以下三种类型适应症中的一种或多种相关:(1)血管生成,(2)炎症,和(3)变性。本发明的传递载体可用于传递抗血管生成因子;抗炎因子;延迟细胞变性、促进细胞保留或促进细胞生长的因子,以及前述的组合。
例如,糖尿病性视网膜病的特征在于血管生成。糖尿病性视网膜病可通过眼内(例如在玻璃体中)或眼周(例如在筋膜下区)传递一种或多种抗血管生成因子来治疗。还可眼内(例如玻璃体内)或眼周共传递一种或多种神经营养因子。
葡萄膜炎涉及炎症。一种或多种抗炎因子可通过眼内(例如玻璃体或前房)施用本发明的核酸来给予。
比较起来,色素性视网膜炎的特征在于视网膜变性。在示例性实施方案中,色素性视网膜炎可通过眼内(例如玻璃体)施用编码一种或多种神经营养因子的传递载体来治疗。
年龄相关性黄斑变性涉及血管生成和视网膜变性这二者。该疾病可通过眼内(例如玻璃体)施用编码一种或多种神经营养因子的本发明核酸和/或眼内或眼周(例如在筋膜下区)施用编码一种或多种抗血管生成因子的本发明核酸来治疗。
青光眼的特征在于眼压增加和视网膜神经节细胞损失。青光眼的治疗包括使用本发明的传递载体施用一种或多种保护细胞免遭兴奋毒性损伤的神经保护剂。这样的药剂包括眼内、优选玻璃体内传递的N-甲基-D-天冬氨酸(NMDA)拮抗剂、细胞因子和神经营养因子。
在其它实施方案中,本发明可用于治疗癫痫发作,例如减少癫痫的发作、发病率和/或严重性。癫痫发作的治疗性治疗的效力可通过行为(例如眼或嘴的颤动、抽搐)和/或电描记图法(大部分癫痫发作具有标记电描记图异常(signature electrographic abnormalities))来评价。因此,本发明还可用于治疗以随时间推移的多次癫痫发作为标志的癫痫。
作为又一个实例,可使用本发明的传递载体将促生长素抑制素(或其活性片段)传递至脑,以治疗垂体瘤。按照该实施方案,编码促生长素抑制素(或其活性片段)的传递载体可通过微量输注给予到垂体中。同样,此治疗可用于治疗肢端肥大症(垂体的异常生长激素分泌)。促生长素抑制素的核酸序列(例如GenBank登录号J00306)和氨基酸序列(例如GenBank登录号P01166;包含经加工的活性肽促生长素抑制素-28和促生长素抑制素-14)是本领域已知的。
本发明还提供筛选能调节本发明核酸中剪接事件的化合物的方法。因此,在另外的实施方案中,本发明提供一种鉴别化合物的方法,其中所述化合物封闭本发明核酸的第二组剪接元件成员,所述方法包括:a)使核酸与该化合物在允许剪接的条件下接触;和b)检测第一RNA的产生或第二RNA的产生,借此第一RNA的产生鉴别出封闭本发明核酸的第二组剪接元件成员的化合物,而第二RNA的产生鉴别不封闭第二组剪接元件成员的化合物。这些方法还可用于鉴别出允许增加或降低第一种和/或第二RNA的产生的化合物。由本文所述方法鉴别的化合物可用于本发明的方法,包括生产赋予生物功能的蛋白和/或RNA的方法以及治疗方法。
在其它实施方案中,可变剪接事件可通过使用本发明的寡核苷酸、小分子和/或化合物来调节。
例如,可将本发明的核酸、载体和/或细胞连同本发明的封闭寡核苷酸、小分子和/或化合物一起导入到受治疗者中,从而由于对特定组剪接组的活化而在受治疗者中产生赋予生物功能的第一种蛋白和/或RNA。可工程改造相同的核酸,以通过活化剪接组的不同组而编码在受治疗者中赋予生物功能的不同蛋白、肽和/或RNA。当将不同的本发明封闭寡核苷酸、小分子和/或化合物导入到受治疗者中时,产生不同的蛋白和/或RNA。作为实例,当存在第一种封闭寡核苷酸、小分子和/或其它化合物时,第一RNA可产生第一种目标蛋白,而在加入不同的第二种本发明封闭寡核苷酸、小分子和/或化合物后,第二RNA可导致产生第二种目标蛋白或功能RNA(例如可产生第一种蛋白的同种型(例如白介素(IL)-4及其剪接变体IL-4Δ2)。(参见例如Fletcher等,“Increased expression of mRNA encoding interleukin(IL)-4and its splice variant IL-4Δ2 in cells from contacts of Mycobacteriumtuberculosis,in the absence of in vitro stimulation”Immunology 2004年8月;112(4):669-73;Minn等,“Insulinomas and expression of an insulinsplice variant”Lancet 2004年1月31日;363(9406):363-7;Schlueter等,“Tissue-specific expression patterns of the RAGE receptor and itssoluble forms--a result of regulated alternative splicing?”Biochim BiophysActa 2003年10月20日;1630(1):1-6;Vegran等,“Implication ofalternative splice transcripts of caspase-3 and survivin inchemoresistance”Bull Cancer 2005年3月;92(3):219-26;Ren等,“Alternative splicing of vitamin D-24-hydroxylase:A novel mechanismfor the regulation of extra-renal 1,25-dihydroxyvitamin D synthesis”J BiolChem.2005年3月23日;等,“Mutant huntington protein:a substrate fortransglutaminase 1,2,and 3”J Neuropathol Exp Neurol 2005年1月;64(1):58-65;Ding和Keller.“Splice variants of the receptor for advancedglycosylation end products(RAGE)in human brain”Neurosci Lett.2005年1月3日;373(1):67-72;等,“Transcript scanning reveals novel andextensive splice variations in human 1-type voltage-gated calcium channel,Cav1.2α1 subunit”JBiol Chem 2004年10月22日;279(43):44335-43,2004年8月6日电子版。所有这些文献都整体在此引入作为参考)。
本发明还提供组合物中的本发明核酸、载体和/或细胞。因此,在另外的实施方案中,本发明提供一种组合物,其包含在药学可接受载体中的本发明核酸、本发明载体和/或本发明细胞。所谓“药学可接受载体”指与药用组合物中的其它成分相容并对受治疗者无害或无毒的载体。具体地说,意指药学可接受载体是配制用于施用给或传递至本发明受治疗者的无菌载体。
还提供含本发明组合物和药学可接受载体的药用组合物。本文描述的组合物可配制用于按照已知技术在药用载体中施用。参见例如Remington,The Science And Practice of Pharmacy(最新版)。所述载体可为固体或液体或这二者,优选与本发明组合物一起配制为单位剂量制剂,例如片剂,其可相当于所述组合物重量的约0.01或0.5%至约95%或99%。药用组合物通过任一种众所周知的药学技术制备,包括但不限于混合组分,可选地包含一种或多种助剂组分。
本发明的药用组合物包括适于口服、直肠、局部、吸入(例如通过气溶胶)、口腔含化(例如舌下)、阴道、胃肠外(例如皮下、肌内、皮内、关节内、胸膜内、腹膜内、脑内、动脉内或静脉内)、局部(即皮肤和粘膜表面,包括气管表面)和经皮施用的组合物,但如本领域众所周知的,在给定情况下最适宜的途径将取决于诸如受治疗者的物种、年龄、性别和整体身体状况、要治疗病症的性质和严重性和/或要施用的具体组合物的性质(即剂量、制剂)之类的因素。
适于口服施用的药用组合物可存在于分立单位中,例如胶囊剂、扁囊剂、锭剂或片剂,每种均含预定量的本发明组合物;作为粉剂或颗粒剂存在;作为在水性或非水性液体中的溶液或悬浮液存在;或作为水包油或油包水型乳剂存在。可通过使本发明的组合物与能够抵抗动物肠道中的消化酶降解的载体复合来实施口服传递。此类载体的实例包括本领域已知的塑料胶囊或片剂。这些制剂可通过任一种适宜的药学方法制备,所述方法包括使组合物和适宜载体(其可包含一种或多种如上指出的助剂组分)结合的步骤。一般来说,如下制备依照本发明实施方案的药用组合物:将组合物与液体或细碎固体载体或这二者均一并紧密地混合,然后,如果需要的话,将所获得的混合物定型。例如,片剂可通过压制或模制含所述组合物且可选地具有一种或多种助剂的粉剂或颗粒剂来制备。压片如下制备:在适宜的机器中压制自由流动形式的组合物,例如粉末或颗粒剂,其可选地与粘合剂、润滑剂、惰性稀释剂和/或表面活性剂/分散剂混合。模制的片剂通过在适宜的机器中模制用惰性液体粘合剂润湿的粉状化合物制备。
适于口腔含化(舌下)施用的药用组合物包括在调味基剂(通常为蔗糖和阿拉伯胶或黄蓍胶)中的含本发明组合物的锭剂;以及在惰性基剂(例如明胶和甘油或蔗糖和阿拉伯胶)中的含所述组合物的软锭剂。
适于胃肠外施用的本发明药用组合物可包含本发明组合物的无菌水性和非水性注射溶液,所述制备物优选与预期接受者的血液等渗。这些制备物可包含抗氧化剂、缓冲剂、抑菌剂和溶质,它们使组合物与预期接受者的血液等渗。水性和非水性无菌悬浮液、溶液和乳剂可包括悬浮剂和增稠剂。非水性溶剂的实例为丙二醇、聚乙二醇、植物油如橄榄油和可注射有机酯,例如油酸乙酯。水性载体包括水、醇/水性溶液、乳剂或悬浮液,包括盐水和缓冲介质。胃肠外溶媒包括氯化钠溶液、Ringer氏葡萄糖、葡萄糖和氯化钠、乳酸盐Ringer或非挥发性油。静脉内溶媒包括流体和营养补充剂、电解质补充剂(例如基于Ringer氏葡萄糖的补充剂)等。还可存在防腐剂和其它添加剂,例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
所述组合物可存在于单位剂量或多剂量容器中,例如存在于密封安瓿和管形瓶中,并可储存于冷冻干燥(冻干)条件下,其仅需要在临使用前加入无菌液体载体,例如盐水或注射用水。
临场调制的注射溶液和悬浮液可由先前描述类型的无菌粉剂、颗粒剂和片剂制备。例如,可提供在密封容器中为单位剂型的可注射的、稳定的、无菌的本发明组合物。所述组合物可以冻干品的形式提供,冻干品可用适宜的药学可接受载体复水,以形成适于注射入受治疗者中的液体组合物。单位剂型可为约1μg至约10g本发明组合物。当所述组合物基本不溶于水时,可纳入足量的生理学可接受的乳化剂,其量足以乳化在水性载体中的组合物。一种这样的有用乳化剂是磷脂酰胆碱。
适于直肠施用的药用组合物优选以单位剂量的栓剂存在。这些栓剂可如下制备:将所述组合物与一种或多种常规固体载体(例如可可脂)混合,然后将所获混合物定型。
适于局部施用于皮肤的本发明药用组合物优选采用软膏剂、霜剂、洗剂、糊剂、凝胶、喷雾剂、气溶胶或油剂的形式。可使用的载体包括但不限于凡士林、羊毛脂、聚乙二醇、醇类、透皮促进剂及其两种或多种的组合。在某些实施方案中,例如,局部传递可如下实施:将本发明的药用组合物与能够穿透皮肤的亲脂试剂(例如DMSO)混合。
适于经皮施用的药用组合物可为分立贴剂的形式,适于长时间保持与受治疗者的表皮紧密接触。适于经皮施用的组合物还可通过离子电渗疗法(参见例如Pharmaceutical Research 3:318(1986))传递,通常采用本发明组合物的任选缓冲的水溶液形式。适宜的制剂可包含柠檬酸盐或bis\tris缓冲液(pH 6)或乙醇/水,并可包含0.1-0.2M活性成分。
本发明组合物的有效量将在组合物之间和受治疗者之间变化,并取决于诸如受治疗者的年龄、物种、性别、体重、整体身体状况以及要治疗的具体疾病或障碍之类的各种因素。可按照本领域一般技术人员已知的常规药学方法确定有效量。在某些实施方案中,约0.1μg/kg至约1g/kg的剂量将具有治疗效力。在使用病毒载体传递本发明核酸的实施方案中,可检测病毒剂量,以根据使用的病毒纳入特定数量的病毒颗粒或噬菌斑形成单位(pfu)或感染颗粒。例如,在某些实施方案中,具体单位剂量可包括约103、104、105、106、107、108、109、1010、1011、1012、1013或1014pfu或感染颗粒。
本发明组合物的施用频率可为赋予期望的疗效所必需的频率。例如,组合物可每天施用1、2、3、4次或更多次,1周施用1、2、3、4次或更多次,1个月施用1、2、3、4次或更多次,1年施用1、2、3、4次或更多次和/或根据需要施用,以控制具体病症和/或实现特定作用和/或利益。在某些实施方案中,在受治疗者一生中施用1、2、3或4剂足可获得期望的疗效。施用本发明组合物的量和频率将根据要治疗或要预防的具体病症和期望的疗效而有所变化。
本发明的组合物可体内或离体(ex vivo)施用给受治疗者的细胞。对于体内施用给受治疗者的细胞以及施用给受治疗者,例如如上所述,可口服、胃肠外(例如静脉内)、肌内注射、皮内(例如通过基因枪)、腹膜内注射、皮下注射、经皮、离体、局部等施用本发明的组合物。另外,本发明的组合物可按照本领域众所周知的方法被脉冲到由受治疗者细胞分离或培养的树突细胞上,或者脉冲到受治疗者的混合PBMC或其各种细胞亚组分上。
如果使用离体方法,则可按照本领域众所周知的标准方法取出细胞或组织,并在机体外部保持,同时将本发明组合物导入到所述细胞或组织中。例如,可经任意基因转移机制,例如病毒介导的基因传递、磷酸钙介导的基因传递、电穿孔、微注射或脂蛋白体,将本发明的核酸和载体导入到细胞中。然后可按照用于所述细胞或组织类型的标准方法将转导和/或转染的细胞灌输(例如在药学可接受的载体中)或移植回受治疗者中。用于将各种细胞移植或灌输入受治疗者中的标准方法是已知的。
本发明的制剂可包含活性化合物的无菌水性和非水性注射溶液,该制备物优选与预期接受者的血液等渗,基本上无热源。这些制剂可包含抗氧化剂、缓冲剂、抑菌剂和溶质,所述溶质使制剂与预期接受者的血液等渗。水性和非水性无菌悬浮液可包括悬浮剂和增稠剂。所述制剂可存在于单位剂量或多剂量容器如密封安瓿和管形瓶中,并可储存于冷冻干燥(冻干)环境下,其仅需要在临使用前加入无菌液体载体,例如盐水或注射用水。
在一种制剂中,本发明的组合物可包含在可适用于胃肠外施用的脂质颗粒或囊泡中,例如脂质体或微晶体。所述颗粒可为任意合适的结构,例如单层或多层,只要所述化合物包含在其中。针对此颗粒和囊泡,特别优选正电荷脂质,如N-[1-(2,3-二油酰氧)丙基]-N,N,N-三甲基-铵硫酸甲酯或“DOTAP”。所述脂质颗粒的制备众所周知。参见例如Janoff等的美国专利第4,880,635号;Kurono等的美国专利第4,906,477号;Wallach的美国专利第4,911,928号;Wallach的美国专利第4,917,951号;Allen等的美国专利第4,920,016号;Wheatley等的美国专利第4,921,757号;等等。
本发明的药用组合物例如可用于生产治疗本文所述的疾病和/或障碍的药物。
以下序列包括在本发明中。
SEQ ID NO:1.质粒TRCBA-int-luc突变型。核苷酸163-2036:CBA启动子;核苷酸2739-4573:突变内含子(654C-T);核苷酸4592-4813:polyA信号。
SEQ ID NO:2.质粒TRCBA-int-luc(野生型)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:野生型内含子(654C);核苷酸2071-4573:萤光素酶中的内含子;核苷酸4592-4813:polyA信号。
SEQ ID NO:3.质粒TRCBA-int-luc(657GT)。核苷酸163-2036:CBA启动子;核苷酸2739-3588:突变内含子(654C-T;657TA-GT);核苷酸2071-4573:萤光素酶中的内含子;核苷酸4592-4813:polyA信号。
SEQ ID NO:4.质粒GL3-int-Luc(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1797:突变型内含子(654C-T);核苷酸2814-3035:polyA信号;核苷酸280-2782:具有突变内含子的萤光素酶。
SEQ ID NO:5.质粒GL3-int-Luc(野生型)。核苷酸48-250:SV40启动子;核苷酸948-1797:野生型内含子(654C);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:6.质粒GL3-int-Luc(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1797:内含子(654C-T;657TA-GT);核苷酸280-2782:具有突变内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:7.质粒GL3-2int-fron-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸251-1100、1771-2620:突变内含子(654C-T);核苷酸1103-3635:具有突变内含子的萤光素酶;核苷酸3637-3858:polyA信号。
SEQ ID NO:8.质粒GL3-3int-2fron-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸251-1100、1106-1965、2635-3484:突变内含子(654C-T);核苷酸1967-4469:具有突变内含子的萤光素酶;核苷酸4514-4735:polyA信号。
SEQ ID NO:9.质粒GL3-int-luc A(突变型)。核苷酸48-250:SV40启动子;核苷酸673-1522:内含子(654C-T);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:10.质粒GL3-int-Luc B(突变型)。核苷酸48-250:SV40启动子;核苷酸1440-2289:内含子(654C-T);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:11.质粒GL3-int-Luc C(突变型)。核苷酸48-250:SV40启动子;核苷酸1691-2540:内含子(654C-T);核苷酸280-2782:具有内含子的萤光素酶;核苷酸2814-3035:polyA信号。
SEQ ID NO:12.质粒GL3-int-fron(突变型)。核苷酸48-250:SV40启动子;核苷酸251-1100:内含子(654C-T);核苷酸1103-2755:具有内含子的萤光素酶;核苷酸2787-3008:polyA信号。
SEQ ID NO:13.质粒GL3-2int-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1797;1798-2647:内含子(654C-T);核苷酸280-3632:具有内含子的萤光素酶;核苷酸3664-3885:polyA信号。
SEQ ID NO:14.质粒GL3-2int-sph C(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1797;2541-3390:内含子(654C-T);核苷酸280-3632:具有内含子的萤光素酶;核苷酸3664-3885:polyA信号。
SEQ ID NO:15.质粒GL3-sint200-sph(突变型)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T);核苷酸280-2582:具有内含子的萤光素酶;核苷酸2794-2835:polyA信号。
SEQ ID NO:16.质粒GL3-sint200-sph(657GT)。核苷酸48-250:SV40启动子;核苷酸948-1597:内含子(654C-T;657TA-GT);核苷酸280-2582:具有内含子的萤光素酶;核苷酸2794-2835:polyA信号。
SEQ ID NO:17.质粒GL3-sint425-sph。核苷酸48-250:SV40启动子;核苷酸948-1373:内含子(654 C-T);核苷酸280-2358:具有内含子的萤光素酶;核苷酸2569-2615:polyA信号。
SEQ ID NO:18.突变型内含子(654C-T)。
SEQ ID NO:19.野生型内含子(654C)。
SEQ ID NO:20.具有两个突变(654C-T;657TA-GT)的内含子。
SEQ ID NO:21.萤光素酶cDNA,其在核苷酸669-1518具有突变内含子(654C-T)。
SEQ ID NO:22.萤光素酶cDNA,其在核苷酸669-1518具有野生型内含子。
SEQ ID NO:23.萤光素酶cDNA,其在核苷酸669-1518具有双突变内含子(C654C-T;657TA-GT)。
SEQ ID NO:24.萤光素酶cDNA,其在核苷酸1-850具有突变内含子(654C-T),在核苷酸1521-2370具有突变内含子(654C-T)。
SEQ ID NO:25.萤光素酶cDNA,其在核苷酸1-850具有突变内含子(654C-T),在核苷酸861-1710和核苷酸2385-3234具有两个突变内含子(654C-T)。
SEQ ID NO:26.萤光素酶cDNA,其在可变位置A(核苷酸394-1243)具有突变内含子(654C-T)。
SEQ ID NO:27.萤光素酶cDNA,其在可变位置B(核苷酸1161-2010)具有突变内含子(654C-T)。
SEQ ID NO:28.萤光素酶cDNA,其在可变位置C(核苷酸1412-2261)具有突变内含子(654C-T)。
SEQ ID NO:29.萤光素酶cDNA,其在翻译位点上游(核苷酸1-850)具有突变内含子(654C-T)。
SEQ ID NO:30.萤光素酶cDNA,其在核苷酸669-1518和核苷酸1519-2368具有两个突变内含子(654C-T)。
SEQ ID NO:31.萤光素酶cDNA,其在核苷酸669-1518和核苷酸2262-3111具有两个突变内含子(654 C-T)。
SEQ ID NO:32.萤光素酶cDNA,其在核苷酸669-1318具有突变内含子(654C-T)以及具有200个碱基对缺失。
SEQ ID NO:33.萤光素酶cDNA,其在核苷酸669-1318具有双突变内含子(654C-T;657TA-GT)以及具有200个碱基对缺失。
SEQ ID NO:34.萤光素酶cDNA,其在核苷酸669-1094具有突变内含子(654C-T)以及具有425个碱基对缺失。
SEQ ID NO:35.质粒TRCBA,具有α抗胰蛋白酶cDNA和在核苷酸2866-3715的突变内含子(654C-T)。
SEQ ID NO:36.α抗胰蛋白酶cDNA,在核苷酸772-1621具有突变内含子(654C-T)。
SEQ ID NO:37.针对IVS2-654的封闭寡核苷酸GCT ATT ACCTTA ACC CAG。
SEQ ID NO:38.针对具有657GT突变的IVS2-654的封闭寡核苷酸GCA CTT ACC TTA ACC CAG。
SEQ ID NO:50(具有564CT突变的IVS2-654内含子)。
SEQ ID NO:51(具有657G突变的IVS2-654内含子)。
SEQ ID NO:52(具有658T突变的IVS2-654内含子)。
SEQ ID NO:20(具有657GT突变的IVS2-654内含子)。
SEQ ID NO:53(具有200bp缺失的IVS2-654内含子)。
SEQ ID NO:54(具有425bp缺失的IVS2-654内含子)。
SEQ ID NO:68(仅具有197bp的IVS2-654内含子)。
SEQ ID NO:69(仅具有247bp的IVS2-654内含子)。
SEQ ID NO:55(具有6A突变的IVS2-654内含子)。
SEQ ID NO:56(具有564C突变的IVS2-654内含子)。
SEQ ID NO:57(具有841A突变的IVS2-654内含子)。
SEQ ID NO:58(IVS2-705内含子)。
SEQ ID NO:59(具有564CT突变的IVS2-705内含子)。
SEQ ID NO:60(具有657G突变的IVS2-705内含子)。
SEQ ID NO:61(具有658T突变的IVS2-705内含子)。
SEQ ID NO:62(具有657GT突变的IVS2-705内含子)。
SEQ ID NO:63(具有200bp缺失的IVS2-705内含子)。
SEQ ID NO:64(具有425bp缺失的IVS2-705内含子)。
SEQ ID NO:65(具有6A突变的IVS2-705内含子)。
SEQ ID NO:66(具有564C突变的IVS2-705内含子)。
SEQ ID NO:67(具有841A突变的IVS2-705内含子)。
SEQ ID NO:70(CFTR外显子19野生型序列)。
SEQ ID NO:71(CFTR外显子193849+10kb C至T突变)。
SEQ ID NO:72(CFTR外显子19野生型寡核苷酸)。
SEQ ID NO:73(CFTR外显子193849+10kb C至T突变寡核苷酸)。
SEQ ID NO:74(小鼠肌养蛋白内含子22、外显子23和内含子23野生型序列)。
SEQ ID NO:75(mdx小鼠肌养蛋白内含子22、外显子23和内含子23无义突变)。
SEQ ID NO:76(反义外显子23跳跃(skipping)诱导性寡核苷酸)。
SEQ ID NO:39(针对IVS2-654中6A突变的寡核苷酸)。
SEQ ID NO:40(针对IVS2-654中564C突变的寡核苷酸)。
SEQ ID NO:41(针对IVS2-654中564CT突变的寡核苷酸)。
SEQ ID NO:43(针对IVS2-654中841A突变的寡核苷酸)。
SEQ ID NO:44(针对IVS2-654中657G突变的寡核苷酸)。
SEQ ID NO:45(针对IVS2-654中658T突变的寡核苷酸)。
SEQ ID NO:42(针对IVS2-705中705G突变的寡核苷酸)。
SEQ ID NO:49(针对IVS2-705的寡核苷酸)。
SEQ ID NO:46(针对IVS2-654的寡核苷酸)。
SEQ ID NO:47(针对IVS2-654的寡核苷酸)。
SEQ ID NO:48(针对IVS2-654的寡核苷酸)。
陈述以下的实施例是为了阐明本发明,不应解释为限制本发明。
实施例
实施例1:来自病毒载体的基因表达的剪接介导的控制
质粒构建
质粒pGL3购自Promega。所有引物都得自UNC-CH LCCC寡核苷酸核心实验室。所有酶都得自New England Biolabs,并按照销售商的推荐使用。为在绿色荧光蛋白(GFP)或萤光素酶(Luc)cDNA的中部插入野生型(wt)或具有隐蔽剪接位点的内含子,插入位点按照前mRNA中的共有序列选择(Luca Cartegni等,“Listening to silence andunderstanding nonsense exonic mutations that affect splicing”Nat RevGenet.2002年4月;3(4):285-98)。
将内含子插入到不同位置(基于编号为1的萤光素酶cDNA起始密码子ATG):393-394(A),668-669(B),1160-1161(C)和1411-1412(D)。在某些研究中,将内含子插入到启动子和萤光素酶cDNA之间。应用4片段连接策略。Pfu酶(Stratagen)用于通过聚合酶链反应(PCR)扩增内含子以及侧翼的具有NcoI的上游序列和具有XbaI的下游序列。GL3主链用NcoI和XbaI这二者消化,同时用NcoI或XbaI邻接PCR产物。通过平端连接插入内含子。由凝胶纯化所述区段。在1小时后,通过Fast Ligase(Epicentre)进行室温连接,然后通过电穿孔将核酸转化入DH10B细菌细胞中。
病毒制备
按照标准3质粒共转染法制备携带内含子调节的转基因表达盒的AAV2载体(Xiao等,“Efficient long-term gene transfer into muscletissue of immunocompetent mice by adeno-associated virus vector”J Virol.1996年11月;70(11):8098-108)。滴度通过斑点印迹测定。
体外萤光素酶表达测定
在某些实验中,在24孔板中转染293细胞。对于每个孔,在加入100μl 2X HeBS前将10ng质粒5μl、2.5M CaCl2 10μl和ddH2O 85μl混合在一起。在形成沉淀后在光学显微镜下将其加入到细胞中。一些细胞同时用寡核苷酸(例如0.05mM,10μl)处理。
在于37℃、5%CO2中孵育24小时后,用200μl 1×PBS清洗,之后用100μl 1×裂解缓冲液裂解每个孔中的细胞。取20μl体积至96孔不透明板,用于使用微板发光计(Tropix)进行萤光素酶测定。萤光素酶底物购自Promega。
动物处理
在病毒注射后1周,通过腹膜内(i.p.)注射2.5mM阿佛丁或异氟烷麻醉动物。i.p.给予萤光素底物(125μl,25mg/ml,Promega),以激发荧光反应。应用萤光素酶成像系统(Roper Scientific)或IVIS成像系统(Xenogen)捕获整只动物的萤光素酶萤光的“实时”图像。开始时采集图象(第0天),然后在连续两天给予寡核苷酸(i.p.25mg/kg)后采集图象。
在该实施例中,β-珠蛋白内含子中的天然突变用于开发受调节的剪接系统。这些内含子突变在具有β-地中海贫血的患者中被发现,并发现其通过建立新的5’剪接供体位点而引起疾病。新的供体位点协同隐蔽3’剪接受体一起导致在mRNA中包含携带符合读框的终止信号的一部分内含子。
具体地说,在该实施例中,已表明包含在AAV载体的绿色荧光蛋白(GFP)转基因中的突变内含子可用作完整的载体调节系统。加入针对该突变的寡核苷酸(“oligo”)校正剪接缺陷,并在体外和体内均诱导正确的基因表达。
如下构建AAV质粒载体:克隆含野生型或突变型β-珠蛋白内含子的绿色荧光蛋白(GFP)或萤光素酶报告基因,所述内含子掺入到人巨细胞病毒(CMV)启动子或杂种CMV鸡β-肌动蛋白启动子(CB或CBA)之后。将两种不同的剪接突变掺入到分离的AAV载体中:在内含子的核苷酸654处的突变(AAV-654)和在隐蔽剪接位点中具有一个额外突变的核苷酸705处的突变(AAV-705U)。将所述AAV构建物转染入HEK 293细胞中或HeLa细胞中,导致野生型内含子产生良好的基因表达,而突变内含子产生低基因表达。随后用分别针对核苷酸654突变或核苷酸705突变的2’-O-甲氧基乙基硫代磷酸酯(MOE)寡核苷酸转染细胞,分别增加654和705U突变体的基因表达。
在HEK 293细胞和HeLa细胞中产生和测试重组AAV。在AAV感染后24小时,用针对对应突变的MOE寡核苷酸转染细胞,在寡核苷酸转染后24和48小时观察报告基因表达。用AAV-654或AAV-705U感染而没用寡核苷酸感染的细胞表明在转染后24小时实际上没有GFP表达,在48小时时仅有些微的基因表达。相比之下,用寡核苷酸转染的细胞在24小时时表现出明显的基因表达,该表达在48小时时在强度上稍微增加,但细胞数量没有增加。GFP阳性细胞的计数表明,在48小时时,对于654突变体,加入寡核苷酸诱导达200倍,对于705突变体,诱导达70倍。705U突变体表明,在HeLa细胞和HEK 293细胞中几乎没有强诱导,这根据GFP荧光细胞计数的数量和全视野荧光来测定。这看起来归因于略高的基础基因表达水平以及对寡核苷酸加入几乎无强响应。
用含野生型内含子的rAAV(AAV-wt int)感染在接近100%的细胞中以和突变体相同的感染复数(MOI)始终获得强GFP表达。在寡核苷酸存在下,AAV-野生型内含子表现出明显比任一种突变体高的基因表达,表明未被寡核苷酸完全校正。半定量RT-PCR证实,在寡核苷酸存在下在AAV-654和AAV-706U感染细胞中均有正确剪接和不正确剪接的物质。但是,增加寡核苷酸剂量并不显著增加基因表达。增加病毒量的确稍微增加全视野强度,但不增加GFP阳性细胞数目。
表1显示了一个内含子在相对于萤光素酶cDNA的不同位置的校正效率。
表2显示了插入多个内含子对萤光素酶转基因表达的改变。
表3显示了内含子(SEQ ID NO:53)的转基因校正效率,所述内含子通过缺失碱基对151-350而缩短了原长度的1/4。
实施例2体内研究
还在体内用由CB启动子驱动的654突变内含子构建物(AAV-CB-654)研究了寡核苷酸对AAV介导的基因表达的诱导。通过门静脉注射将在萤光素酶报告基因中携带654突变体内含子的rAAV 2型载体(5×1010个载体颗粒)传递入小鼠肝脏中。1年后,以每日25mg/kg腹膜内给予寡核苷酸达2天。在第3天进行萤光素酶成象。当与未接受寡核苷酸治疗的动物相比时,萤光素酶表达高达8-10倍。在体内观察到的寡核苷酸诱导的上调持续超过1个月,随后回落至基线水平。给予载体达1周、之后给予寡核苷酸的第二组动物产生特征性的转基因表达上调,之后在1个月内下降。重复施用寡核苷酸还可再活化内含子调节的基因表达。此结果表明,载体特异性组成型启动子在延长的时间段内表达mRNA(与AAV介导的体内转基因表达一致),但功能性基因产物仅在施用“剪接介导的”药物(例如寡核苷酸)之后观察到。
这些结果表明,通过调节载体产生的RNA由非功能性mRNA至功能性mRNA的剪接而调节功能性基因表达。
加入寡核苷酸相当快速地诱导基因表达,在组织培养物中至24小时时产生表达,在体内于1-2天内产生表达。基因表达的持续时间受到转基因产生的蛋白的半衰期和寡核苷酸的半衰期影响。诸如2’-O-甲氧基乙基硫代磷酸酯主链的寡核苷酸具有长体内半衰期;在大鼠中于8小时后十分完整。在单次注射MOE或LNA寡核苷酸的情况下,持续的mRNA校正和蛋白表达可持续相当一段时间。通过改变寡核苷酸主链以及剂量应当有可能改变基因校正的持续时间。不同的主链已表现出明显不同的生物稳定性,并可用于更精确地控制基因表达持续时间。靶mRNA的半衰期还可通过包含顺式作用元件来控制,所述顺式作用元件将使剪接过的mRNA具有快或慢的周转率。这些元件的使用在本领域是标准的,是本领域技术人员熟知的。加入强聚腺苷酸化信号也将影响加工过的信使的半衰期。因此,“剪接介导的药物”上调功能性mRNA的能力可受到给定量、生物分布、稳定性和/或对靶序列的亲和性以及靶mRNA的丰度和稳定性的影响。所有这些参数都可按照本领域已知的方法修改,以更精确地控制“剪接介导的”调节。
通过使用内含子调节基因表达,消除了对加入转基因以外的外源蛋白的需要,因此避免了针对调节性反式激活物的严重免疫反应的可能性。另外,内含子的大小可变(1000bp或以下),并可容易地与组织特异性启动子组合,在加入寡核苷酸后在单个载体中产生组织特异性和蛋白表达调节。在更常规的调节系统中,这一般需要两种载体和两种单独的启动子(即驱动转基因表达的调节启动子和驱动反式激活物的组织特异性启动子)。
为进一步表明该系统的用途,将功能性治疗性转基因(α1-抗胰蛋白酶,AAT)克隆入具有内含子调节基因表达盒系统的AAV载体中。在门静脉注射载体颗粒后,通过ELISA测定检测随时间变化的功能性AAT转基因活性。在没有“剪接介导的”寡核苷酸的情况下,检测到低人AAT至无人AAT。但是,在存在药物(在该实施例中为LNA寡核苷酸)的情况下,可监测到血液中的转基因表达上调(100倍),动力学和持续时间与对报告基因的描述相似(在30天内)。与AAV载体相一致,在载体传递后,转基因表达将接着发生并持续,与目标组织中的基因表达盒(报告体或治疗剂)无关。对于“剪接介导的”受控载体,载体传递的所有方面都相同,功能性mRNA的表达除外。该方面仅受控于外源“剪接介导”药物的存在,仅可在选定时间给予和/或重复地给予,以获得期望的转基因mRNA的功能活性。
实施例3在图1-3中描述的研究
在本发明的某些实施方案中,如下构建AAV质粒载体:将在编码序列中含突变β-珠蛋白内含子的报告基因表达盒(绿色荧光蛋白-GFP或萤光素酶-Luc)克隆在人巨细胞病毒(CMV)启动子或杂种CMV鸡β-肌动蛋白启动子(CB)之后。AAV载体按照标准的3质粒共转染方法产生(Xiao等,Journal of Virology(1998))。基于内含子突变序列的存在,这些载体RNA表达盒的RNA表达导致形成前mRNA(图1(1))。在没有外源寡核苷酸的情况下,前mRNA将使用隐蔽剪接位点剪接。这是位于内含子的核苷酸654处的单点突变的结果,导致形成可变剪接位点(在图1(1)(i)中的前mRNA上的小三角)。由该反应产生的剪接过的mRNA在两个编码序列之间含一部分内含子序列(图1(2)(i))。该mRNA是无功能的,不表达功能性产物(图1(3)(i))。随后针对核苷酸654突变的2’-O-甲氧基乙基硫代磷酸酯(MOE)寡核苷酸的转染(在图1(1)(ii)中黑条棒的右侧)封闭可变剪接,产生正确的剪接(图1(2)(ii))和功能性基因产物(图1(3)(ii))。
产生携带以上表达盒的重组AAV载体,并测试其在人细胞(HeLa细胞)中的受调节的转基因表达。AAV感染后24小时,1/2的细胞用针对654突变的MOE寡核苷酸转染,在寡核苷酸转染后48小时观察报告基因表达。用AAV-654载体而不用寡核苷酸转染的细胞实际上没有表现出可检测的GFP表达。相比之下,用654特异性寡核苷酸转染的细胞表现出显著的基因表达。GFP阳性细胞的计数表明,在加入针对654突变的寡核苷酸的情况下达200倍诱导。
如本文所述产生携带由“剪接介导的”内含子控制的萤光素酶报告基因的AAV载体,并通过门静脉注射将其用于感染小鼠肝脏。在一组动物中,在传递寡核苷酸药物前1年施用载体(图2A)。在经腹膜内注射施用剪接特异性寡核苷酸达连续2天后,在注射萤光素底物后对动物进行实时成像,以依据光子的发射和收集检测功能性萤光素酶活性(并转变为光单位)。如在图2A中所示,与未治疗动物(图2A(i)和图2C)相比,接受寡核苷酸的小鼠(图2A(ii)和图2C)显示出增加的萤光素酶活性(暗灰色阴影和增加的表面积量)。这些结果还表明,载体特异性组成型启动子正在表达无功能mRNA,该活性持续1年以上。如图1所述,只有在加入“剪接介导的”寡核苷酸后才能将无功能mRNA转变为功能性mRNA。
在另一组用“剪接介导的”载体转基因表达盒感染的动物中,在施用寡核苷酸后诱导了调节,该调节持续达1个月以上,并稳定回落到基线。重复施用寡核苷酸(图2B箭头)表明转基因活性上调,与第一种药物的施用(图2B;菱形)一致。在未接受“剪接介导的”寡核苷酸药物的动物中未观察到上调证据(图2B;实心圆)。这些实验表明,载体传递的转基因表达盒在体内响应于寡核苷酸药物的存在,并对寡核苷酸药物的持续时间敏感。涉及药物传递的众多实验参数都可由本领域技术人员修改,以影响受调节的转基因功能的水平和持续时间(例如药物的剂量和生物分布、药物和靶mRMA的半衰期、mRNA产物的稳定性等)。
在体内研究中使用携带受调节的治疗性转基因的AAV载体(α1-抗胰蛋白酶;AAT)进行相似的实验。在该实施例中,AAV载体通过门静脉注射给予至小鼠肝脏。1周后,一部分动物通过腹膜内注射施用来给予LNA寡核苷酸,之后通过ELISA测定检测AAT蛋白的循环水平。AAT表达在约1周时达到峰值(图3;方形),并在1个月内缓慢下降。在仅接受载体的动物(图3;菱形)中,在实验过程中没有观察到基线以上的AAT表达的证据。在该实验中两个关键因素主要确定诱导的转基因的寿命;即分别是寡核苷酸和蛋白产物的半衰期。根据所使用的寡核苷酸类型(PNA对LNA等)和被靶向以便调节的转基因(AAT对生长因子对细胞因子等)可获得不同的结果。无论如何,全部这些结果都模拟了“剪接介导的”受调节报告基因的结果,表明了在经“剪接介导的”受调节机制而外部施用药物后调节体内治疗性转基因表达的能力。
实施例4.双内含子系统
应可变剪接控制体外和体内转基因表达。将人β-珠蛋白基因的异常剪接突变内含子IVS2-654插入到绿色荧光蛋白(GFP)表达盒中。IVS2-654内含子大小为850bp,含4个剪接位点。IVS2-654内含子的核苷酸序列(SEQ ID NO:19)示于以下。两个可变内含子位于核苷酸1-579和653-850。可变外显子位于核苷酸580-652。两个箭头指示可变内含子-外显子之间的接合处。4个剪接位点和4个潜在分支点分别由直线和波浪线下划线表示。5’ss 652/18 AON的靶序列以粗体浮雕表示。有效剪接和3’末端形成所需的序列为粗斜体。
AAGTTCATGT CATAGGAAGG GGAGAAGTAA CAGGGTACAG
91 TTTAGAATGG GAAACAGACG AATGATTGCA TCAGTGTGGA AGTCTCAGGA
TCGTTTTAGT TTCTTTTATT TGCTGTTCAT AACAATTGTT
181 TTCTTTTGTT TAATTCTTGC TTTCTTTTTT TTTCTTCTCC GCAATTTTTA
CTATTATACT TAATGCCTTA ACATTGTGTA TAACAAAAGG
271 AAATATCTCT GAGATACATT AAGTAACTTA AAAAAAAACT TTACACAGTC
TGCCTAGTAC ATTACTATTT GGAATATATG TGTGCTTATT
361 TGCATATTCA TAATCTCCCT ACTTTATTTT CTTTTATTTT TAATTGATAC
ATAATCATTA TACATATTTA TGGGTTAAAG TGTAATGTTT
451 TAATATGTGT ACACATATTG ACCAAATCAG GGTAATTTTG CATTTGTAAT
TTTAAAAAAT GCTTTCTTCT TTTAATATAC TTTTTTGTTT
541 ATCTTATTTC TAATACTTTC CCTAATCTCT TTCTTTCAG↓G GCAATAATGA
TACAATGTAT CATGCCTCTT TGCACCATTC TAAAGAATAA
TTTCTGCATA TAAATTGTAA CTGATGTAAG AGGTTTCATA
721 TTGCTAATAG CAGCTACAAT CCAGCTACCA TTCTGCTTTT ATTTTATGGT
811
通过使用磷酸钙转染法将所获质粒转染入人肾上皮细胞系293细胞中。随后,将特异性AON以0.5μM终浓度加入到两组相同的转染细胞的其中一组中,以诱导GFP表达。所述特异性AON称为5’ss652/18 AON,是一种18聚体寡核苷酸,其与5’可变剪接位点互补,能够抑制异常外显子的掺入。作为阳性对照,293细胞单独地用含在GFP表达盒中的相同位置插入的野生型内含子的质粒转染。阳性对照细胞不用5’ss 652/18AON处理。在转染后24小时,使用荧光显微镜检查细胞的GFP表达。在实验组中,经转染但不用AON处理的细胞不能表达可检测水平的GFP。相反,用AON处理的细胞以和阳性对照组相似的水平表达功能性GFP。因此,可变剪接可用于控制体外转基因表达。
为确定可变剪接是否还可用于控制体内转基因表达,构建了重组AAV质粒,其携带萤光素酶表达盒(Promega),该表达盒插入了一个拷贝的850bp IVS2-654内含子。萤光素酶基因由已表明能够在小鼠中驱动组成型转基因表达的CMV增强子/鸡β-肌动蛋白启动子所驱动。AAV通过使用无腺病毒的生产流程产生,该生产流程包括用以下3种质粒转染293细胞:重组AAV质粒、提供结构性和非结构性AAV基因的AAV辅助质粒以及提供AAV载体产生的必需辅助基因的腺病毒辅助质粒。通过使用包含碘克沙醇梯度和硫酸肝素层析步骤的纯化方法纯化所产生的AAV载体。然后,将5×1010个纯化AAV颗粒施用给每只小鼠。注射后1周,通过每日腹膜内注射25mg/kg的5’ss 652/18AON达连续两天诱导萤光素酶表达。通过给予萤光素后使用萤光素酶成像系统(Roper Scientific)进行整体成像来确定萤光素酶表达水平。当通过门静脉注射将AAV靶向肝脏时,器官中的萤光素酶表达被诱导达10.4倍,在第8天达到峰值,持续超过29天。通过直接注射将AAV靶向心脏也表现出相似模式的诱导的转基因表达。还在AAV注射后1年给小鼠施用AON,肝脏中的萤光素酶表达被诱导至相似的水平,表明将所述内含子掺入AAV载体中并不影响AAV基因组的持续性。
为更精确地定量转基因表达水平和确定可变剪接是否能在体内控制其它目标基因的表达,构建了另一种携带α1-抗胰蛋白酶(AAT)表达盒的AAV载体,该表达盒插入了一个拷贝的850bp的IVS2-654内含子。获得的纯化AAV经门静脉注射给予小鼠。AAT表达通过给予5’ss 652/18 AON来诱导,并通过ELISA测定定量。与萤光素酶表达模式类似,AAT表达被诱导达8.9倍,在第8天和第29天达到峰值,持续超过43天。这些结果表明,可变剪接既可用于控制体外转基因表达,也可用于控制体内转基因表达。
优化可变剪接以控制转基因表达。为有利于可变剪接优化以控制转基因表达,使用萤火虫萤光素酶标记基因插入850bp的可变剪接内含子IVS2-654。因此,转基因表达的控制可通过测定外显子掺入和外显子跳跃(即有或没有5’ss 652/18 AON)条件下的萤光素酶表达水平便利地测定。为优化该可变剪接以控制转基因表达,进行以下三组实验:
1)在萤光素酶表达盒中插入单拷贝的IVS2-654内含子,以控制转基因表达。为确定插入位点是否影响内含子的剪接,将单拷贝的850bp IVS2-654内含子在核苷酸393-394(A)、668-669(B)、1160-1161(C)或1411-1412(D)之间以及紧邻翻译起点上游(F)插入,即在萤光素酶表达盒的A、B、C、D和F位插入。将内含子插入到编码序列上游的原因在于异常外显子自身同时含上游ATG起始密码子和下游TAA终止密码子。因此,在F位掺入异常外显子应阻止萤光素酶蛋白的合成。通过使用磷酸钙转染法将所获质粒单独转染入293细胞中。随后将游离的5’ss 652/18 AON以终浓度0.5μM加入两组相同的转染细胞的其中一组中。转染后24小时,收集细胞定量萤光素酶表达。对于A-D位的内含子插入,萤光素酶表达的实际水平在相同条件下(即在没有或有AON的情况下)显著变化达3.8倍。但是,这4种构建物的诱导水平是相似的,由4.0倍至5.7倍。构建物A-D的诱导水平的相似性提示,侧翼序列不显著影响可变剪接。在F位插入令人惊奇地产生低诱导水平的表达和相对高的背景表达水平。低诱导水平可能是因为5’可变剪接位点的识别被5’帽结构增强,导致更有效的外显子掺入。高背景水平可能归因于在正确的起始密码子开始的翻译。
因为萤光素酶表达系统能够方便地定量诱导水平和实际表达水平这二者,所以对可变剪接方法和自切割核酶方法(38)进行平行比较。将单拷贝的83bp N79核酶插入到萤光素酶表达盒的Kozak序列和ATG起始密码子上游。通过使用磷酸钙转染法将所获质粒和构建物C单独地转染入293细胞中。对于含核酶的构建物,将丰加霉素以1.5μM的终浓度加入到两组相同的转染细胞的其中一组中。对于含内含子的构建物,将游离的5’ss 652/18 AON以0.5μM的终浓度加入到两组相同的转染细胞的其中一组中。在转染后24小时,收集细胞用于定量萤光素酶表达。含内含子和核酶的构建物的诱导水平分别为5.3倍和1.8倍。另外,含核酶的构建物的实际萤光素酶表达水平是含内含子构建物表达水平的0.4%。含核酶构建物的萤光素酶表达水平较低与以下观点相一致:将含AUG的核酶置于翻译起点上游应导致抑制正确的翻译或合成突变蛋白。含内含子构建物的萤光素酶表达水平较高可能归因于在内含子序列存在下更有效的mRNA3’末端形成。应当澄清的是,对核酶法报告的约260倍萤光素酶表达诱导基于携带插入到萤光素酶表达盒中的两个拷贝的N79核酶的稳定细胞系(38)。
2)在萤光素酶表达盒中插入两个拷贝的IVS2-654内含子,以控制转基因表达。该组实验的目的是测试插入两个拷贝的内含子是否会改善转基因表达的诱导水平,以及两个内含子之间的距离是否对诱导水平具有任何影响。因此,将组合大小为1,700bp的两个拷贝的IVS2-654内含子以(AB、AC、AD、BC、BD和FB)之间不同的距离置于两个不同位点或串联置于一个位点(BB)。通过使用磷酸钙转染法将所获质粒单独转染入293细胞中。随后将游离的5’ss 652/18AON以终浓度0.5μM加入两组相同的转染细胞的其中一组中。转染后24小时,收集细胞用于定量萤光素酶表达。除了BB以外,所有构建物都产生显著降低水平的背景表达。结果,诱导水平被极大提升,在10.1倍至143.3倍的范围内。诱导水平几乎与两个内含子之间的距离成反向关联,而两个内含子串联即BB构建物的情况除外。当两个拷贝的内含子紧密邻近至一定程度时降低水平的背景表达以及由此改善的转基因表达诱导水平,可能是因为可变剪接位点的识别被增强和/或无义介导的mRNA衰变被加速。无义介导的mRNA衰变是一种通过消除编码不完整多肽的异常mRNA而减少基因表达错误的监视途径。对于BB构建物,表达的背景水平显著高于其余组别。较高水平的背景表达可能是因为上游内含子的3’剪接位点和下游内含子的5’剪接位点彼此太接近,以至于剪接位点的识别被削弱。因此,两个最外部的剪接位点可能变成被认识的显性位点。这些结果表明,插入多个拷贝的内含子可改善转基因表达的诱导水平。它们还表明,在内含子之间可能存在最佳距离,该距离会产生最高诱导水平。
3)使IVS2-654内含子的可变剪接位点突变,以调整可变剪接。使850bp IVS2-654内含子中的可变剪接位点突变,以改变其强度。第一个实验包括敲除构建物B的上游可变内含子中的两个潜在分支点中的一个。将在核苷酸564和565处的AA转变为CT,以使上游潜在分支点与共有序列的相似性较低。通过使用磷酸钙转染法将所获质粒转染入293细胞中。随后将游离的5’ss 652/18AON以终浓度0.5μM加入相同的转染细胞组中。转染后24小时,收集细胞用于定量萤光素酶表达。AA→CT突变将诱导水平由4.3倍增加至13倍,同时保留相对高水平的转基因表达诱导。这与当前使用分支点是调节可变剪接的其中一种机制的想法一致。第二个实验设计用于优化可变剪接,方法是在构建物B中将核苷酸657的T转变为G,将核苷酸658的A转变为T,或将TA同时转变为GT。突变将通过使剪接位点更类似于或等同于共有序列而增加可变5’剪接位点的强度。在剪接位点具有单碱基转变的两种构建物都产生约2倍的诱导水平增加。其间,双碱基转变导致诱导水平增加至55倍。诱导水平的增加显然是缘于转基因表达的背景水平比转基因表达的诱导水平更显著地下降。这些结果提示,通过调整分支点的使用以及可变剪接位点的强度,可优化可变剪接,以控制转基因表达。
用于可变剪接的小内含子的开发。IVS2-654内含子长为850个碱基对(bp)。该大小经证明对插入多个拷贝的内含子以控制由AAV介导的转基因表达有问题。这是因为AAV的包装限度是4.7kb。为使内含子尺寸最小化,由构建物B的内含子中缺失一个200bp的片段-核苷酸151-350,产生构建物BΔ200。还没有表明该序列在内含子剪接中起作用。在与构建物B相比时,构建物BΔ200在诱导水平方面没有降低。197bp的内含子也来源于IVS2-654,其含4个必需剪接位点和修饰型可变外显子,以及对β-珠蛋白mRNA 3’末端的有效剪接和形成所必需的5’末端上的前32bp和3’末端上的后57bp。将该197bp内含子插入萤光素酶基因中导致信使的可变剪接,虽然诱导水平与构建物B相比被降低。这些结果表明,IVS2-654内含子可被缩短,而不显著诱导水平。
产生携带含可变剪接内含子的萤光素酶表达盒的转基因小鼠。产生携带萤火虫萤光素酶表达盒的转基因小鼠,该表达盒插入单拷贝的原始850bp IVS2-654内含子。成功传递IVS2-654的特异性AON应抑制外显子掺入,并诱导外显子跳跃,因此导致功能性萤光素酶蛋白的翻译。因此,萤光素酶表达的整体成像可便利地用于监视AON的传递。因为转基因小鼠测定系统不需要标记AON或处死实验小鼠,所以应大大有利于AON传递的优化。在施用AON后于转基因小鼠中成功诱导萤光素酶表达表明了使用AON传递和调节体内转基因表达的可行性。
可变剪接内含子的进一步优化。将两个拷贝的IVS2-654内含子插入相同表达盒中显著降低了转基因表达的背景水平,并增加诱导水平。但是,因为可有效包装的AAV基因组大小被限制在4.7kb,所以插入多个拷贝的850bp IVS2-654内含子应显著降低AAV载体的克隆能力。通过缺失200bp片段缩短IVS2-645内含子产生相似的转基因表达诱导水平,由IVS2-654内含子获得小197bp内含子仍保留经历可变剪接的能力,虽然诱导水平降低。因此,似乎IVS2-654内含子的系统缺失可产生这样的可变剪接内含子,其既具有可接受的诱导水平,又具有适于掺入到AAV载体中的减小尺寸。为控制转基因表达,期望具有可变剪接内含子,其在用于外显子掺入的条件下产生低背景水平的转基因表达,在用于外显子跳跃的条件下产生高诱导水平的转基因表达。通过改变分支点的使用和微调可变剪接位点的强度有可能获得此期望的内含子。这是因为突变其中一个分支点显著增加诱导水平。另外,使剪接位点序列突变大大增加了诱导水平,但同时显著降低了转基因表达的实际水平。内含子的尺寸可最小化,可产生一系列具有修饰型分支点的最小内含子,和/或可产生文库,以筛选具有突变剪接位点的最小内含子,以便产生具有低背景水平和高诱导水平的转基因表达的优化内含子。
例如,可开发能够有效可变剪接的最小内含子。如本文所述,IVS2-654内含子的200bp片段缺失并不降低诱导水平。合成含IVS2-654内含子中所有剪接必需元件的小197bp内含子仍保留经历可变剪接的能力。但该小内含子仅有2.3倍的诱导水平,显著低于IVS2-654内含子的水平,为其水平的4.3分之一。为确定仍应具有与IVS2-654内含子相似的诱导水平的最大缺失,可对含200bp缺失的质粒作进一步缺失,以由核苷酸150至33向5’末端扩展缺失。缺失还可独立地由核苷酸350至519向3’末端扩展。还可在核苷酸660-793之间的下游可变内含子中独立地实施更多缺失。对于每个缺失区域,要缺失的片段大小均可在开始时增加约30bp,随后增加约10bp,用于进一步最大化缺失大小。通过使用例如Stratagene QuikChange多位点定向诱变试剂盒产生缺失突变体。该方法包括使用含期望突变的引物来合成突变链,用DpnI消化,以去除亲代质粒,并将所合成的单链质粒转化入细菌宿主中,以转变为双链质粒。为快速地和定量地测定转基因表达的诱导水平,将使用萤光素酶测定系统。但是,理解控制每个突变内含子作用的机制对于更好地设计控制转基因表达用的内含子应当是必需的。因此,可在独立研究中分析mRNA水平和剪接模式。将获得的构建物独立地转染入293细胞中,以测定其萤光素酶表达的诱导水平。在确定了3种当中每一种的最大缺失后,将它们组合在一种构建物中,测试所获内含子的萤光素酶表达的诱导水平。因为使用最小内含子会最大化插入多个拷贝内含子以控制转基因表达后的AAV克隆能力,所以将由该组实验产生的最小内含子用于余下的提议研究。
产生和评价具有突变分支点的修饰型最小内含子。如本文所述,使上游可变内含子中的两个潜在分支点之一突变将诱导水平由4.3倍增加至13倍。为优化用于在内含子插入后最大化AAV克隆能力的最小内含子,单独地突变4个潜在分支点,并评价其基因表达的诱导水平:上游可变内含子中的两个分支点是核苷酸520-526处的TTTTAAT以及560-566处的CCCTAAT,下游可变内含子中的两个分支点是813-819的TGCTAAT以及831-837的CTCTTAT。因为共有分支点序列是PyNPyUPuAPy,其中Py=C或U,Pu=A或G,而标下划线的A是高度保守的,所以保守的A以及上游A将转变为CT。因为在831-837处的潜在分支点CTCTTAT具有T,而不是保守A上游的保守Pu,所以仅保守的A被突变。分支点和3’剪接位点之间的距离通常为18个碱基,但变化很广。为确定该距离是否对诱导水平有影响,改变距离,以尝试进一步优化诱导水平。如所述通过使用Stratagene QuikChange多位点定向诱变试剂盒产生突变。为快速地和定量地测定转基因表达的诱导水平,将使用萤光素酶测定系统。为理解控制每个突变内含子作用的机制,以便更好地设计控制转基因表达用的内含子,在单独的研究中分析mRNA水平和剪接模式。将获得的构建物独立地转染入293细胞中,以测定其萤光素酶表达的诱导水平。用于上游和下游可变内含子的优化修饰将组合在一种构建物中,测试所获内含子的改善的诱导水平。
由具有突变剪接位点的最小内含子文库的产生和筛选具有低背景水平和高诱导水平的转基因表达的内含子。为最大化内含子插入后的AAV克隆能力,最小内含子将用作产生具有突变剪接位点的内含子的文库的模板。为有利于优化内含子的筛选,在产生文库之前将最小内含子插入到标记表达盒中。使用的标记表达盒是表达嘌呤霉素N-乙酰转移酶和截短形式的单纯疱疹病毒1型胸苷激酶之间的双功能融合蛋白(puΔtk)的表达盒。puΔtk融合蛋白已表明允许分别使用嘌呤霉素和更昔洛韦类似物1-(-2-脱氧-2-氟-1-β-D-阿拉伯呋喃糖基)-5-碘尿嘧啶(FIAU)正选择和负选择表达所述蛋白的细胞。有几种已开发的正/负选择标记,它们应可同样好地用于文库筛选。使5’可变剪接位点突变,以优化内含子的诱导水平。这是因为根据计算剪接位点强度的方法,5’可变剪接位点的强度显著弱于5’和3’剪接位点的强度以及3’可变剪接位点的强度。该选择还因为通过修饰其序列增加5’可变剪接位点的强度显著增加了其诱导水平(但同时降低其整体转基因表达水平)。因为在其中箭头标记外显子-内含子接合处的共有5’剪接位点序列-2AG↓GUPuAGU+6中,+1和+2位的GU是100%保守的,所以-2和-1以及+3至+6位的核苷酸将被突变。为产生突变内含子的文库,将使用Stratagene QuikChange多位点定向诱变试剂盒。
作为产生突变内含子文库的备选方法,在聚合酶链反应(PCR)中独立地使用一对重叠引物,一种引物跨越5’可变剪接位点,在要突变的位置具有简并碱基,另一种引物在内含子的上游或下游。两个独立反应的PCR产物将组合为模板,用于另一轮的PCR反应,以重构突变内含子。获得的PCR产物用限制酶消化,并用于替换亲代质粒中的对应片段,由此产生突变内含子文库。
使用以下策略筛选具有低背景水平和高诱导水平的转基因表达的优化内含子。为使文库的每个克隆都能独立地被表达和选择,在EB病毒(EBV)质粒的主链中产生文库。因为EBV质粒载体能作为附加体增殖,所以其传统上用于转化细胞,以便进行药物选择。将所获质粒文库转染入293细胞或HeLa细胞中。为选择由于其在特异性AON存在下能经历有效的外显子跳跃而具有高转基因表达诱导水平的突变内含子,所述细胞用AON处理,并用嘌呤霉素选择。因为文库应在与5’ss 652/18AON互补的5’可变剪接位点中含有突变,所以将另一种AON即3’ss 579/18用于文库筛选。3’ss 579/18AON是一种与3’可变剪接位点互补的18聚体寡核苷酸,能够以和5’ss 652/18AON相同的效率抑制异常外显子掺入。为消除由于在没有AON的情况下其不能经历有效的外显子掺入而具有高背景水平的转基因表达的突变内含子,嘌呤霉素选择后的抗性细胞将停止使用AON处理。然后用FIAU处理所述细胞,以选择具有低水平puΔtk表达的细胞。用于药物选择的浓度将有所变化,以允许筛选具有最高转基因表达诱导水平的内含子。为从经选择细胞中回收内含子,由细胞提取低分子量DNA,并电穿孔入细菌宿主DH5α中。将回收的内含子再插入到萤光素霉表达盒中,以允许定量其转基因表达的诱导水平。为理解每个经筛选内含子的作用机制,在独立的研究中分析mRNA水平和剪接模式。由此鉴别的具有高转基因表达诱导水平的突变内含子进行DNA测序,以鉴别其序列。
将可变剪接内含子掺入到AAV载体中,以控制动物模型中的长期转基因表达。
因为可变剪接可在体内用于控制转基因表达,所以将可变剪接内含子掺入到AAV载体中应使该载体能够在所治疗动物中长期控制转基因表达。因为插入两个拷贝的IVS2-654内含子显著增加诱导水平,并因为AAV载体的包装限度仅为4.7kb,所以将优化的最小内含子掺入到AAV载体中,以最大化插入内含子后的AAV克隆能力。已知内含子之间的距离可影响转基因表达的诱导水平(图7),构建在不同位置以不同拷贝数插入优化可变内含子的AAV质粒,评价所获AAV载体在体内的最佳转基因表达诱导。通过插入多个拷贝的内含子提升诱导水平还可容易地适用于具有较大包装能力的其它基因转移载体。因此,重要之处在于确定应对转基因表达的诱导水平具有协同作用的最佳内含子数量。
在体外构建和评价携带标记基因、插入优化的可变剪接内含子的AAV质粒。如本文所述,插入两个内含子后的诱导水平与内含子之间的距离反向关联。例外之处是串联的两个内含子仅稍微提升诱导水平。因此,在内含子之间应存在会产生最高诱导水平的最佳距离。为确定最佳距离,将两个拷贝的优化内含子以之间的不同距离插入到萤光素酶基因中。所获AAV基因组的预期大小应不超过4.0kb,其在4.7kb AAV包装限度之内(4.0kb AAV基因组=两个末端重复+启动子+萤光素酶cDNA+两个内含子+polyA=0.29+0.56+1.65+2×0.65+0.2,最小内含子应不超过650bp)。选择萤光素酶基因中的5’AGPu 3’序列(其中Pu=G或A),用于插入优化内含子中。该标准基于以下事实:压倒性多数的5’和3’剪接位点序列分别与共有-2AG↓GUPuAGU+6和-4NPyAG↓PuN+2一致,其中箭头标记外显子-内含子接合处。因此,在序列5’AG和Pu 3’之间插入内含子应恢复共有的5’和3’剪接位点。因为AB构建物产生273倍的最佳诱导水平,并在内含子之间具有275bp的距离,所以通过插入两个拷贝的优化内含子开始缩减275bp距离,一个拷贝在B位,另一个拷贝在A位和B位之间的各个候选位点。该组质粒将在两个拷贝的内含子之间具有191、118、105、98、49、30和15bp的距离。为确定两个拷贝的内含子之间的序列是否影响转基因表达的诱导水平,构建另一组插入质粒,其含有在核苷酸964-965之间插入的一个内含子拷贝,另一个内含子拷贝在核苷酸988-1161之间并包括核苷酸988和1161在内的7个候选位点的每个位点处插入。因此,在两个内含子拷贝之间将具有197、153、99、69、52、40和24bp的距离。将所获构建物单独转染入293细胞中,以测定其转基因表达的诱导水平。内含子之间的距离将与诱导水平相关联。为研究插入3个拷贝的优化内含子是否进一步提升转基因表达的诱导水平,我们将使用选自以上实验的插入两个拷贝内含子的优化构建物,用于插入另一个拷贝的内含子。含有3个拷贝内含子的AAV基因组的预期大小应不超过4.65kb,其在4.7kb AAV包装限度之内(4.65kb AAV基因组=两个末端重复序列+启动子+萤光素酶cDNA+三个内含子+polyA=0.29+0.56+1.65+3×0.65+0.2,最小内含子应不超过650bp)。在不同位点插入第三个内含子,使得第三个内含子和最接近的内含子之间将有约800、600、400、200、100和50bp的距离。将所获构建物单独转染入293细胞中,以测定其转基因表达的诱导水平。在以下的萤火虫萤光素酶cDNA核苷酸序列(SEQ ID NO:77)中,将用于内含子插入的潜在位点标以下划线。A-D位由波浪下划线和左侧的相应字母表示。
1 ATGGAAGACG CCAAAAACAT AAAGAAAGGC CCGGCGCCAT TCTATCCGCT
GGAAGATGGA ACCGCTGGAG AGCAACTGCA TAAGGCTATG
91 AAGAGATACG CCCTGGTTCC TGGAACAATT GCTTTTACAG ATGCACATAT
CGAGGTGGAC ATCACTTACG CTGAGTACTT CGAAATGTCC
181 GTTCGGTTGG CAGAAGCTAT GAAACGATAT GGGCTGAATA CAAATCACAG
AATCGTCGTA TGCAGTGAAA ACTCTCTTCA ATTCTTTATG
271 CCGGTGTTGG GCGCGTTATT TATCGGAGTT GCAGTTGCGC CCGCGAACGA
CATTTATAAT GAACGTGAAT TGCTCAACAG TATGGGCATT
A 361 TCGCAGCCTA CCGTGGTGTT CGTTTCCAAA AAGGGGTTGC AAAAAATTTT
GAACGTGCAA AAAAAGCTCC CAATCATCCA AAAAATTATT
451 ATCATGGATT CTAAAACGGA TTACCAGGGA TTTCAGTCGA TGTACACGTT
CGTCACATCT CATCTACCTC CCGGTTTTAA TGAATACGAT
541 TTTGTGCCAG AGTCCTTCGA TAGGGACAAG ACAATTGCAC TGATCATGAA
CTCCTCTGGA TCTACTGGTC TGCCTAAAGG TGTCGCTCTG
B 631 CCTCATAGAA CTGCCTGCGT GAGATTCTCG CATGCCAGAG ATCCTATTTT
TGGCAATCAA ATCATTCCGG ATACTGCGAT TTTAAGTGTT
721 GTTCCATTCC ATCACGGTTT TGGAATGTTT ACTACACTCG GATATTTGAT
ATGTGGATTT CGAGTCGTCT TAATGTATAG ATTTGAAGAA
811 GAGCTGTTTC TGAGGAGCCT TCAGGATTAC AAGATTCAAA GTGCGCTGCT
GGTGCCAACC CTATTCTCCT TCTTCGCCAA AAGCACTCTG
901 ATTGACAAAT ACGATTTATC TAATTTACAC GAAATTGCTT CTGGTGGCGC
TCCCCTCTCT AAGGAAGTCG GGGAAGCGGT TGCCAAGAGG
991 TTCCATCTGC CAGGTATCAG GCAAGGATAT GGGCTCACTG AGACTACATC
AGCTATTCTG ATTACACCCG AGGGGGATGA TAAACCGGGC
C 1081 GCGGTCGGTA AAGTTGTTCC ATTTTTTGAA GCGAAGGTTG TGGATCTGGA
TACCGGGAAA ACGCTGGGCG TTAATCAAAG AGGCGAACTG
1171 TGTGTGAGAG GTCCTATGAT TATGTCCGGT TATGTAAACA ATCCGGAAGC
GACCAACGCC TTGATTGACA AGGATGGATG GCTACATTCT
1261 GGAGACATAG CTTACTGGGA CGAAGACGAA CACTTCTTCA TCGTTGACCG
CCTGAAGTCT CTGATTAAGT ACAAAGGCTA TCAGGTGGCT
D 1351 CCCGCTGAAT TGGAATCCAT CTTGCTCCAA CACCCCAACA TCTTCGACGC
AGGTGTCGCA GGTCTTCCCG ACGATGACGC CGGTGAACTT
1441 CCCGCCGCCG TTGTTGTTTT GGAGCACGGA AAGACGATGA CGGAAAAAGA
GATCGTGGAT TACGTCGCCA GTCAAGTAAC AACCGCGAAA
1531 AAGTTGCGCG GAGGAGTTGT GTTTGTGGAC GAAGTACCGA AAGGTCTTAC
CGGAAAACTC GACGCAAGAA AAATCAGAGA GATCCTCATA
1621 AAGGCCAAGA AGGGCGGAAA GATCGCCGTG TAA
评价由所获AAV载体介导的转基因表达的长期体内控制。将如上所述确定的具有最优转基因表达控制的AAV质粒包装入病毒载体中。通过使用无腺病毒的生产流程产生载体,该流程包括用3种质粒转染293细胞:重组AAV质粒、提供结构性和非结构性AAV基因的AAV辅助质粒以及提供AAV载体产生所必需的辅助基因的腺病毒辅助质粒。获得的AAV载体将通过使用包含碘克沙醇梯度和硫酸肝素层析步骤的纯化方法纯化。然后,通过门静脉注射将纯化载体导入肝脏,以及通过本文所述的直接注射导入骨骼肌和心脏,评价AAV载体介导体内长期可控的转基因表达的能力。在用对照AON或内含子特异性AON注射动物后,通过对小鼠成像确定萤光素酶基因表达的诱导水平。作为对照载体,将携带绿色荧光蛋白(GFP)表达盒的AAV纳入该组实验。
经不同途径(例如门静脉注射、直接肌肉注射、直接心脏注射)用AAV载体注射小鼠。施用特异性AON和对照AON这二者,以调节萤光素酶基因的表达。萤光素酶表达的水平将通过整体成像确定。AAV-luc-int和AAV-GFP分别表示携带插入内含子的萤光素酶表达盒的AAV载体或携带GFP表达盒的AAV载体。
为确定长期控制萤光素酶基因表达的能力,在先前诱导的萤光素酶表达回落至背景水平后再将AON施用给小鼠。新诱导的表达通过整体成像再监测。重复该轮次诱导的表达,以评价转基因表达的长期控制。
插入第三个内含子以在第三个内含子和最近的内含子之间产生不同距离的潜在问题,在于在期望位置可能没有插入所需的5’AGPu3’序列。在此情况下,各个氨基酸的多种密码子选择将用于产生这种插入所需要的序列。例如,在序列5’(NNX)(GPuN)3’(其中各对括号标记密码子)中,核苷酸X可作为沉默突变转变为A,由此产生内含子插入所需要的5’AGPu3’序列。同样,在序列5’(NAZ)(PuNN)3’中,核苷酸Z可作为沉默突变转变为G。在20种氨基酸中,其中11种在其密码子的最后一位含G作为备选,其中12种在其密码子的最后一位含A作为备选。因此,能够在期望位置建立插入位点的可能性相对较高。在AAV感染小鼠中重复诱导萤光素酶表达应允许评价体内转基因表达的长期控制。
实施例5.RETT综合症研究
没有针对RTT的有效疗法。如果发现治疗方法,则6-18个月的生后无症状窗口期可允许在发生永久性神经元损伤之前启动干涉。使用AAV传递正常基因至CNS中是一种合理方法。理想的载体是该研究必需的。发现合适的载体可直接阐明未来治愈或缓解该疾病症状的潜力。通过使用可变剪接作为调节系统,可避免目标基因过表达或表达不足,可控制在正确的发育期表达,并可能有希望满足CNS的正常功能要求。长期目标是在代表RTT的动物模型中将脑特异性传递用的理想载体与可变剪接的可控表达相联。预期这些研究最终导致开发出在患者中安全而有效的转基因表达。
不同血清型的rAAV载体在体内的转导模式。为了确定不同血清型AAV载体在体内的向性,将血清型1-5和8AAV载体导入小鼠肝脏、肌肉和大鼠视网膜中。所测试血清型之间在不同组织中的转基因表达非常不同。AAV1和AAV8可启动在肝脏和肌肉中的最高转基因表达,但AAV5和4可比其它血清型更有效地转导视网膜细胞。在注射后的46天中,转基因(绿色荧光蛋白,GFP)表达成比例增加,这些动物在实验过程中(4个月)保持阳性。使用用于整体基因传递的公开方法在小鼠脑中进行类似分析。
转基因是具有CMV增强子的鸡β-肌动蛋白启动子(CBA)驱动的hAAT(a)和CMV立即早期启动子驱动的EGFP(b)。记分由对各组动物观察到最高蛋白水平(+++++)至各组中的最低表达水平(+)变动。
使用互补AON调节体外基因表达。通过在转基因表达盒中使用已知突变内含子(人β珠蛋白内含子2),已成功实现了在加入AON后调节报告基因表达。
使用内含子特异性GFP作为报告体和AON的校正作用。将突变人β-珠蛋白内含子2构建入GFP cDNA和质粒(pEGFP-mut-int)或病毒(AAV2/EGFP-mut-int)中,它们分别用于转染或感染293细胞。随时间变化检测AON对转基因表达的作用。在治疗后48小时使用荧光显微镜(Leitz DM IRB,Vashaw Scientific Inc)检测GFP表达。AON校正前mRNA异常剪接的效率由GFP阳性细胞指示。
将野生型或突变型内含子插入到萤光素酶cDNA中以调节转基因表达。通过将野生型或突变型人β-珠蛋白内含子2插入到质粒pGL3(Promega)的可读框中,改变萤光素酶前mRNA的剪接。然后,将重构的质粒(pGL3-int-luc)转染入293细胞中。同时,用AON处理一些细胞。在24小时时用微板发光计(Tropix)检查萤光素酶的表达,以评价前mRNA的剪接效率。数据表明,在AON存在下,具有突变内含子的质粒的表达相对于原始质粒增加2-3倍。另外,背景可降低至相当低的水平。基因表达校正表现出AON剂量依赖性关系。
使用互补AON调节体内基因表达。因为AON可非常有效地在体外调节基因表达,所以在体内测试该调节系统。因为使用组织特异性启动子,所以肝脏和肌肉用作靶器官,使用“实时”萤光素酶成像系统(Roper Scientific)易于观察表达。结果提示,AON可在体内有效校正可变剪接。
使用报告基因(例如绿色荧光蛋白GFP)鉴别特异性转导神经元的理想AAV血清型载体。尽管AAV2和其它血清型之间在壳体的氨基酸序列方面有一些差异,但AAV2基因组或邻接AAV2反向末端重复序列的转基因可被包装入不同血清型的壳体中,形成转导病毒体。这提供了一种直接对比参与体内感染的血清型壳体功能的极佳工具。
实验设计和方法。将AAV2/GFP基因组分别包装入AAV血清型1-8壳体中,从而产生用于体内测试的活AAV重组体的集合。进行以下实验:1)将相同颗粒数的不同AAV血清型给予小鼠,以便确定哪种血清型可在CNS中实现最佳表达。鸡β-肌动蛋白启动子(CBA)将用于在所有测试血清型中驱动GFP表达。这是一种组成型非组织特异性启动子。如果必要的话,将在选定血清型中使用诸如NSE启动子的其它启动子,以进一步对比神经元中转基因表达的强度和特异性。2)在最佳AAV血清型中构建由最佳启动子驱动的MeCP2cDNA,在RTT小鼠模型的CNS中测试病毒的MeCP2基因传递。以免疫组织化学以及行为表型的拯救来表征基因表达。
鉴别将转基因传递入小鼠CNS中的合适AAV血清型。制备AAV1-8载体,它们具有相同的AAV2载体基因组,该基因组携带CBA启动子和GFP报告基因(rAAV1-8/CBA-GFP)。病毒将按照3质粒共转染法制备,颗粒数通过DNA酶抗性斑点印迹技术来评价。
在iv灌输200μl甘露醇(25%)后15-20分钟,将各个血清型的约1×1012个颗粒注射入每只野生型C57BL品系小鼠脑的小脑延髓池。在注射后第14天处死小鼠。同时处死未注射的对照。沿冠状平面和旁矢状平面切成切片,如果必要的话,使用荧光显微镜(Leitz DM IRB,Vashaw Scientific Inc)、免疫组织化学(Pierce)和蛋白质印迹研究不同脑部分中的GFP表达。
测试优化载体将MeCP2转基因传递入MeCP2基因缺陷动物中的情况。MeCP2缺陷小鼠模型得自Jackson Laboratory。该模型模拟人类患者中的症状。通过使用该动物模型,可观测所传递基因在体内的作用。将MeCP2cDNA构建入选定的AAV载体(AAV/MeCP2)中,并通过脑池内注射(2×1010个颗粒数)导入小鼠脑中。如下将动物分为两组。在注射后14天测试组1的基因表达,而组2动物保持存活,以评价存活时间,并纵向观测行为和症状改变达1年。
所有动物都根据以下标准监测:1)症状的改善,例如体重、脑重量、存活时间(对比相同年龄的正常和突变动物)以及通过使用红外光束激活的移动监测腔(infrared beam-activated movement-monitoringchamber)(Opto-Varimax-MiniA,Columbus Instruments)监测运动能力。还观察其它症状,如震颤和重呼吸。可对可能由MeCP2过表达产生的症状进行特别关注(例如不能竞食、大小或拒绝交配)。2)然后通过使用兔抗MeCP2抗体(Upstate,Lake Placid)、生物素化山羊抗兔IgG(Vector Laboratories)和Vectastain Elite ABC试剂盒(VectorLaboratories)以免疫组织化学法检测脑中的转基因表达。
如Luikenhuis等(“Expression of MeCP2 in postmitotic neuronsrescues Rett syndrome in mice”PNAS USA 101(16):6033-8(2004年4月6日电子版);其整体在此引入作为参考)所述,使用最大剂量的病毒,希望拯救动物模型表型。
表征一种通过可变剪接调节小鼠脑中的转基因表达的新方法。基因缺陷可引起遗传疾病,包括RTT,而某些基因的过表达也可产生严重问题。研究已表明,在发生严重的运动障碍之前,神经元仅能耐受高至正常水平2-3倍的MeCP2表达。为此,校正水平变成一个重要问题。AAV载体太小,以至于不能携带MeCP2组织特异性启动子盒。为控制过表达,将本文所述的可变剪接调节系统导入到载体盒中。
选择萤光素酶作为报告基因有两个原因:1)底物萤光素可腹膜内注射,并穿过BBB,在那里其可受到在该区域表达的萤光素酶蛋白的作用;和2)萤光素酶成像系统(Roper)允许观察脑中的萤光素酶表达的实时变化,而不用处死动物。测试以AON剂量依赖性方式表现出来的萤光素酶表达。确定要给予的AON的频率和剂量,并与对照(仅GFP载体)相比。在用MeCP2内含子依赖性转基因盒测试前,确定该载体在CNS中的性能。
本文描述的研究已表明,AON可通过经内含子校正增加转基因表达或由于寡核苷酸被清除而降低表达起作用。这使得AON的转基因调节成为一种对目前使用的反式作用盒的有吸引力的替代,所述反式作用盒已显示出有免疫应答倾向。尽管为获得与直接颅内注射实现的表达水平相同的水平需要静脉内注射(IV)更高剂量的AON,但IV法远为便利和实用。
实验设计和方法。本文描述的研究将通过构建在萤光素酶报告基因中的野生型或突变型内含子盒而得以扩展。该内含子依赖性盒将被构建入由适宜启动子驱动的选定AAV载体中。病毒将如上所述产生,并直接注射入C57BL小鼠脑的小脑延髓池中(2×1010个颗粒/小鼠)。收集基线图象,然后给予AON,以在注射后2周诱导萤光素酶表达。评价用于拯救转基因表达的AON的给药剂量和频率。通过使用萤光素酶成像系统(Roper)每周一次直接观察结果。
为确定要注射的AON的适宜剂量,通过静脉内注射将不同剂量的AON(例如0.02μg、1μg、4μg、20μg和100μg的100μl盐水溶液)注射入小鼠中,以获得剂量依赖性转基因表达曲线。对照组仅接受相同量的盐水。这些数据应有助于确定在脑中表达内含子依赖性MeCP2转基因表达所需的AON剂量。
依据本文所述研究,AON诱导的体内转基因表达在一定时间后将逐渐降低。所以,从理论上讲,首次施用AON诱导的萤光素酶表达将在一定时间后降低。因为该降低可实时观测到,所以在表达降低至最初表达水平的一半时给予AON。使用萤光素酶表达将转基因表达保持在稳定水平,并外推至MeCP2的相似表达时间点。所述蛋白的半衰期将确定该实验方法的最终条件(例如分钟对小时)。使用采用S35标记的甲硫氨酸的经典脉冲追踪实验,确定这些蛋白在组织培养物中的半衰期。这些实验条件的建立将允许以保持MeCP2表达于恒定水平的频率施用AON。为解决有关穿越血脑屏障的效率的问题,可使用化学修饰的AON,例如硫代磷酸酯寡核苷酸。确立AAV调节的载体在脑中总体来说对基因治疗领域有重要价值,对与全脑疾病如Rett综合症有关的神经学领域更重要。
应用选定的血清型特异性载体和内含子依赖性剪接调节系统传递MeCP2转基因至小鼠脑中。将依赖于突变型人β-珠蛋白内含子2的调节系统构建入MeCP2cDNA(AAV/MeCP2-mut-int)中。将该转基因盒掺入理想的血清型载体中,并由选定启动子(NSE、CBA等)驱动。转基因小鼠由Jackson Laboratory订购。AON以上文确定的量和频率给予小鼠。在AON传递后,表征动物的转基因表达(如上所述),并如本文所述监测行为变化。
前述实施例阐述了本发明,不应解释为限制本发明。本发明由以下权利要求描述,权利要求的等同方案包含在本发明中。
本文提及的所有出版物、专利申请、专利、专利出版物和其它参考文献都整体引入作为参考,用于与其中提到参考文献的句子和/或段落相关的教导。
表1
一个内含子在相对于萤光素酶cDNA的不同位置中的校正效率。
a.Pre-代表在启动子和萤光素酶cDNA之间插入的内含子;
b.与无寡核苷酸相比在寡核苷酸校正后的转基因表达的倍数增加。
c.在寡核苷酸校正后具有突变内含子的质粒的转基因表达相对于萤光素酶cDNA中具有1个野生型内含子的转基因表达的百分率。
表2
插入多个内含子的校正效率。
a.Pre-代表在启动子和萤光素酶cDNA之间插入的内含子;
b.与无寡核苷酸相比在寡核苷酸校正后的转基因表达的倍数增加。
c.在寡核苷酸校正后具有突变内含子的质粒的转基因表达相对于萤光素酶cDNA中具有1个野生型内含子的转基因表达的百分率。
表3
缩短的内含子 | |
倍数a | 4.70±0.92 |
野生型%b | 191.67±48.58 |
缩短的内含子的转基因校正效率。
a.与无寡核苷酸相比在寡核苷酸校正后的转基因表达的倍数增加。
b.在寡核苷酸校正后具有突变内含子的质粒的转基因表达相对于萤光素酶cDNA中具有1个野生型内含子的转基因表达的百分率。
序列表
<110>University of North Carolina-Chapel Hill
Samulski,R.Jude
<120>在转录后水平调节核酸表达的方法和组合物
<130>5470-422WO
<150>US 60/676,139
<151>2005-04-29
<160>80
<170>PatentIn version 3.3
<210>1
<211>7713
<212>DNA
<213>人工序列
<220>
<223>质粒TRCBA-int-luc mut(654 C-T)
<220>
<221>内含子
<222>(2739)..(3588)
<400>1
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040
tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100
ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160
aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220
atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280
gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340
ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400
gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460
aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520
atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580
catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640
acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700
cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120
tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180
taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240
taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300
taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360
aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca tataaatatt 3420
tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480
agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540
taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600
tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660
tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720
atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780
ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840
taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900
tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960
agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020
attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080
aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140
gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200
cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260
tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320
aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380
ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440
aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500
cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560
gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800
tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980
cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040
acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520
tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880
tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680
cgtattaccg cctttgagtg agctgatacc gct 7713
<210>2
<211>7713
<212>DNA
<213>人工序列
<220>
<223>质粒TRCBA-int-luc(wt)
<220>
<221>内含子
<222>(2739)..(3588)
<400>2
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040
tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100
ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160
aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220
atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280
gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340
ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400
gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460
aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520
atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580
catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640
acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700
cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120
tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180
taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240
taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300
taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360
aagaataaca gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt 3420
tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480
agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540
taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600
tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660
tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720
atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780
ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840
taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900
tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960
agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020
attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080
aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140
gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200
cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260
tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320
aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380
ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440
aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500
cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560
gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800
tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980
cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040
acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520
tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880
tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680
cgtattaccg cctttgagtg agctgatacc gct 7713
<210>3
<211>7713
<212>DNA
<213>人工序列
<220>
<223>质粒TRCBA-int-luc(654 C-T,657TA-GT)
<220>
<221>内含子
<222>(2739)..(3588)
<400>3
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattagct 2040
tggcattccg gtactgttgg taaagccacc atggaagacg ccaaaaacat aaagaaaggc 2100
ccggcgccat tctatccgct ggaagatgga accgctggag agcaactgca taaggctatg 2160
aagagatacg ccctggttcc tggaacaatt gcttttacag atgcacatat cgaggtggac 2220
atcacttacg ctgagtactt cgaaatgtcc gttcggttgg cagaagctat gaaacgatat 2280
gggctgaata caaatcacag aatcgtcgta tgcagtgaaa actctcttca attctttatg 2340
ccggtgttgg gcgcgttatt tatcggagtt gcagttgcgc ccgcgaacga catttataat 2400
gaacgtgaat tgctcaacag tatgggcatt tcgcagccta ccgtggtgtt cgtttccaaa 2460
aaggggttgc aaaaaatttt gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt 2520
atcatggatt ctaaaacgga ttaccaggga tttcagtcga tgtacacgtt cgtcacatct 2580
catctacctc ccggttttaa tgaatacgat tttgtgccag agtccttcga tagggacaag 2640
acaattgcac tgatcatgaa ctcctctgga tctactggtc tgcctaaagg tgtcgctctg 2700
cctcatagaa ctgcctgcgt gagattctcg catgccaggt gagtctatgg gacccttgat 2760
gttttctttc cccttctttt ctatggttaa gttcatgtca taggaagggg agaagtaaca 2820
gggtacagtt tagaatggga aacagacgaa tgattgcatc agtgtggaag tctcaggatc 2880
gttttagttt cttttatttg ctgttcataa caattgtttt cttttgttta attcttgctt 2940
tctttttttt tcttctccgc aatttttact attatactta atgccttaac attgtgtata 3000
acaaaaggaa atatctctga gatacattaa gtaacttaaa aaaaaacttt acacagtctg 3060
cctagtacat tactatttgg aatatatgtg tgcttatttg catattcata atctccctac 3120
tttattttct tttattttta attgatacat aatcattata catatttatg ggttaaagtg 3180
taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca tttgtaattt 3240
taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc 3300
taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta 3360
aagaataaca gtgataattt ctgggttaag gcaagtgcaa tatttctgca tataaatatt 3420
tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc 3480
agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc 3540
taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag atcctatttt 3600
tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc atcacggttt 3660
tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct taatgtatag 3720
atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa gtgcgctgct 3780
ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat acgatttatc 3840
taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg gggaagcggt 3900
tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg agactacatc 3960
agctattctg attacacccg agggggatga taaaccgggc gcggtcggta aagttgttcc 4020
attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg ttaatcaaag 4080
aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca atccggaagc 4140
gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag cttactggga 4200
cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt acaaaggcta 4260
tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca tcttcgacgc 4320
aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg ttgttgtttt 4380
ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac 4440
aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga aaggtcttac 4500
cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga agggcggaaa 4560
gatcgccgtg taattctagg gccgcttcga gcagacatga taagatacat tgatgagttt 4620
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 4680
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 4740
cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 4800
tacaaatgtg gtaaaatcga taaggatcta ggaaccccta gtgatggagt tggccactcc 4860
ctctctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc gtcgggcgac 4920
ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg ccaacccccc 4980
cccccccccc cctgcagcct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 5040
acagttgcgt agcctgaatg gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc 5100
ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc 5160
tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct 5220
aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa 5280
acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc 5340
tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact 5400
caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg 5460
gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt 5520
tacaatttcc tgatgcgcta ttttctcctt acgcatctgt gcggtatttc acaccgcata 5580
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5640
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5700
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5760
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg 5820
gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 5880
tttttctaaa tactttcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 5940
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 6000
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 6060
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 6120
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 6180
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 6240
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 6300
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 6360
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 6420
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 6480
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6540
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6600
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgcggataaa 6660
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6720
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6780
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6840
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6900
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6960
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 7020
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 7080
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 7140
gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 7200
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 7260
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7320
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7380
cgtgagcatt gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7440
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7500
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7560
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7620
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 7680
cgtattaccg cctttgagtg agctgatacc gct 7713
<210>4
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc mut(654 C-T)
<220>
<221>内含子
<222>(948)..(1797)
<400>4
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860
<210>5
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc(wt)
<220>
<221>内含子
<222>(948)..(1797)
<400>5
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560
accattctaa agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat 1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860
<210>6
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc(654 C-T,657 TA-GT)
<220>
<221>内含子
<222>(48)..(1797)
<400>6
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560
accattctaa agaataacag tgataatttc tgggttaagg taagtgcaat atttctgcat 1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860
<210>7
<211>6683
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-2int-fron-sph(突变型)
<220>
<221>内含子
<222>(251)..(1100)
<220>
<221>内含子
<222>(1771)..(2620)
<400>7
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080
ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140
attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200
cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta 1260
cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa 1320
tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt 1380
gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga 1440
attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt 1500
gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga 1560
ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc 1620
tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc 1680
actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag 1740
aactgcctgc gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt 1800
tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag 1860
tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt 1920
ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt 1980
tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg 2040
aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac 2100
attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt 2160
cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt 2220
taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat 2280
gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 2340
ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 2400
cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata 2460
taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 2520
ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 2580
tttgctaatc atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc 2640
aaatcattcc ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt 2700
ttactacact cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag 2760
aagagctgtt tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa 2820
ccctattctc cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac 2880
acgaaattgc ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga 2940
ggttccatct gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc 3000
tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg 3060
aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac 3120
tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg 3180
ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg 3240
aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg 3300
ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg 3360
caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg 3420
gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga 3480
aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac 3540
tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg 3600
tgtaattcta gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg 3660
agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg 3720
atgctattgc tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt 3780
gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa 3840
acctctacaa atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc 3900
aacccagtca gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact 3960
gtcttcttta tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct 4020
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 4080
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 4140
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 4200
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 4260
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 4320
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 4380
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 4440
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 4500
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 4560
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 4620
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 4680
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 4740
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 4800
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 4860
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 4920
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 4980
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 5040
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 5100
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 5160
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 5220
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 5280
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 5340
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 5400
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 5460
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 5520
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 5580
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 5640
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 5700
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 5760
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 5820
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 5880
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 5940
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 6000
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 6060
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 6120
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 6180
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 6240
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 6300
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 6360
gaattttaac aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg 6420
ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata 6480
agtaagtaat attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt 6540
tcattacatc tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat 6600
caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt 6660
gccagaacat ttctctatcg ata 6683
<210>8
<211>7547
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-3int-2fron-sph(突变型)
<220>
<221>内含子
<222>(251)..(1100)
<220>
<221>内含子
<222>(1111)..(1960)
<220>
<221>内含子
<222>(2635)..(3484)
<400>8
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080
ctcttatctt cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt 1140
tccccttctt ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag 1200
tttagaatgg gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt 1260
ttcttttatt tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt 1320
tttcttctcc gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg 1380
aaatatctct gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac 1440
attactattt ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt 1500
cttttatttt taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt 1560
taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat 1620
gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct 1680
ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa 1740
cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata 1800
taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca 1860
ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct 1920
tttgctaatc atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa 1980
aaacataaag aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca 2040
actgcataag gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc 2100
acatatcgag gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga 2160
agctatgaaa cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc 2220
tcttcaattc tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc 2280
gaacgacatt tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt 2340
ggtgttcgtt tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat 2400
catccaaaaa attattatca tggattctaa aacggattac cagggatttc agtcgatgta 2460
cacgttcgtc acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc 2520
cttcgatagg gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc 2580
taaaggtgtc gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt 2640
ctatgggacc cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg 2700
aaggggagaa gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg 2760
tggaagtctc aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt 2820
tgtttaattc ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc 2880
cttaacattg tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa 2940
aactttacac agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata 3000
ttcataatct ccctacttta ttttctttta tttttaattg atacataatc attatacata 3060
tttatgggtt aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat 3120
tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta 3180
tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc 3240
tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt 3300
tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt catattgcta 3360
atagcagcta caatccagct accattctgc ttttatttta tggttgggat aaggctggat 3420
tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc 3480
acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc 3540
cattccatca cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag 3600
tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga 3660
ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg 3720
acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg 3780
aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc 3840
tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg 3900
tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc 3960
tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg 4020
taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag 4080
acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga 4140
ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc 4200
ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg 4260
ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg 4320
tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag 4380
taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg 4440
ccaagaaggg cggaaagatc gccgtgtaat tctagagtcg gggcggccgg ccgcttcgag 4500
cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 4560
aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 4620
ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt 4680
gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaatcgat aaggatccgt 4740
cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg 4800
actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg 4860
gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 4920
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 4980
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5040
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5100
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5160
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5220
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5280
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5340
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5400
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5460
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5520
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5580
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5640
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5700
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5760
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5820
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 5880
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 5940
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6000
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6060
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6120
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6180
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6240
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6300
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6360
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6420
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6480
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6540
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6600
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6660
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6720
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6780
tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 6840
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 6900
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 6960
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 7020
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 7080
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 7140
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 7200
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 7260
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7320
acgccagccc aagctaccat gataagtaag taatattaag gtacgggagg tacttggagc 7380
ggccgcaata aaatatcttt attttcatta catctgtgtg ttggtttttt gtgtgaatcg 7440
atagtactaa catacgctct ccatcaaaac aaaacgaaac aaaacaaact agcaaaatag 7500
gctgtcccca gtgcaagtgc aggtgccaga acatttctct atcgata 7547
<210>9
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-luc A(突变型)
<220>
<221>内含子
<222>(673)..(1522)
<400>9
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggtgagtct atgggaccct tgatgttttc tttccccttc ttttctatgg 720
ttaagttcat gtcataggaa ggggagaagt aacagggtac agtttagaat gggaaacaga 780
cgaatgattg catcagtgtg gaagtctcag gatcgtttta gtttctttta tttgctgttc 840
ataacaattg ttttcttttg tttaattctt gctttctttt tttttcttct ccgcaatttt 900
tactattata cttaatgcct taacattgtg tataacaaaa ggaaatatct ctgagataca 960
ttaagtaact taaaaaaaaa ctttacacag tctgcctagt acattactat ttggaatata 1020
tgtgtgctta tttgcatatt cataatctcc ctactttatt ttcttttatt tttaattgat 1080
acataatcat tatacatatt tatgggttaa agtgtaatgt tttaatatgt gtacacatat 1140
tgaccaaatc agggtaattt tgcatttgta attttaaaaa atgctttctt cttttaatat 1200
acttttttgt ttatcttatt tctaatactt tccctaatct ctttctttca gggcaataat 1260
gatacaatgt atcatgcctc tttgcaccat tctaaagaat aacagtgata atttctgggt 1320
taaggtaata gcaatatttc tgcatataaa tatttctgca tataaattgt aactgatgta 1380
agaggtttca tattgctaat agcagctaca atccagctac cattctgctt ttattttatg 1440
gttgggataa ggctggatta ttctgagtcc aagctaggcc cttttgctaa tcatgttcat 1500
acctcttatc ttcctcccac aggggttgca aaaaattttg aacgtgcaaa aaaagctccc 1560
aatcatccaa aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat 1620
gtacacgttc gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga 1680
gtccttcgat agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct 1740
gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga 1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860
<210>10
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc B
<220>
<221>内含子
<222>(1440)..(2289)
<400>10
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 960
ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 1020
ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 1080
tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 1140
gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 1200
aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 1260
gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 1320
gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1380
ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaagg 1440
tgagtctatg ggacccttga tgttttcttt ccccttcttt tctatggtta agttcatgtc 1500
ataggaaggg gagaagtaac agggtacagt ttagaatggg aaacagacga atgattgcat 1560
cagtgtggaa gtctcaggat cgttttagtt tcttttattt gctgttcata acaattgttt 1620
tcttttgttt aattcttgct ttcttttttt ttcttctccg caatttttac tattatactt 1680
aatgccttaa cattgtgtat aacaaaagga aatatctctg agatacatta agtaacttaa 1740
aaaaaaactt tacacagtct gcctagtaca ttactatttg gaatatatgt gtgcttattt 1800
gcatattcat aatctcccta ctttattttc ttttattttt aattgataca taatcattat 1860
acatatttat gggttaaagt gtaatgtttt aatatgtgta cacatattga ccaaatcagg 1920
gtaattttgc atttgtaatt ttaaaaaatg ctttcttctt ttaatatact tttttgttta 1980
tcttatttct aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc 2040
atgcctcttt gcaccattct aaagaataac agtgataatt tctgggttaa ggtaatagca 2100
atatttctgc atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat 2160
tgctaatagc agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc 2220
tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc 2280
ctcccacaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520
cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860
<210>11
<211>5860
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-Luc C
<220>
<221>内含子
<222>(1691)..(2540)
<400>11
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccagaga tcctattttt 960
ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt 1020
ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga 1080
tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg 1140
gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct 1200
aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt 1260
gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca 1320
gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca 1380
ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga 1440
ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg 1500
accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac 1560
gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat 1620
caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca 1680
ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 1740
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 1800
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 1860
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 1920
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 1980
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 2040
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 2100
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 2160
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 2220
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 2280
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 2340
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 2400
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 2460
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 2520
ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt 2580
tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt acgtcgccag 2640
tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa 2700
aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa aggccaagaa 2760
gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc gagcagacat 2820
gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt 2880
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2940
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 3000
tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc cgtcgaccga 3060
tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg 3120
tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc 3180
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 3240
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 3300
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 3360
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 3420
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 3480
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3540
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3600
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3660
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3720
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3780
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 3840
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3900
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3960
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 4020
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 4080
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 4140
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 4200
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 4260
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 4320
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 4380
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 4440
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 4500
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 4560
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 4620
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 4680
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 4740
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 4800
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 4860
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 4920
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 4980
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 5040
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 5100
aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg 5160
cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct 5220
tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta 5280
gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt 5340
tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg 5400
ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat 5460
tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt 5520
taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg ccattcgcca 5580
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 5640
cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg agcggccgca 5700
ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac 5760
taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa taggctgtcc 5820
ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 5860
<210>12
<211>5833
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-int-fron(突变型)
<220>
<221>内含子
<222>(251)..(1100)
<400>12
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt 300
aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg 360
aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat 420
aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta 480
ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt 540
aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg 600
tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt taattgatac 660
ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg 720
accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac 780
ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga 840
tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta 900
aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag 960
aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt 1020
tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac 1080
ctcttatctt cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc 1140
attctatccg ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata 1200
cgccctggtt cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta 1260
cgctgagtac ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa 1320
tacaaatcac agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt 1380
gggcgcgtta tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga 1440
attgctcaac agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt 1500
gcaaaaaatt ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga 1560
ttctaaaacg gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc 1620
tcccggtttt aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc 1680
actgatcatg aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag 1740
aactgcctgc gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc 1800
ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact 1860
cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt 1920
tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc 1980
cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc 2040
ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct 2100
gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc 2160
cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt 2220
tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag 2280
aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga 2340
caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt 2400
catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga 2460
attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc 2520
cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat 2580
gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg 2640
cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag 2700
aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaattcta 2760
gagtcggggc ggccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca 2820
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 2880
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 2940
tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa 3000
atgtggtaaa atcgataagg atccgtcgac cgatgccctt gagagccttc aacccagtca 3060
gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta 3120
tcatgcaact cgtaggacag gtgccggcag cgctcttccg cttcctcgct cactgactcg 3180
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 3240
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 3300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 3540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 3780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4020
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4080
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 4140
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 4200
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 4260
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 4320
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 4380
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 4440
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 4500
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 4560
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 4620
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 4680
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 4740
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 4800
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 4860
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 4920
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 4980
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5040
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc gccctgtagc 5100
ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 5160
gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 5220
ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 5280
ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 5340
acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 5400
actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 5460
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 5520
aaaatattaa cgcttacaat ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg 5580
cgatcggtgc gggcctcttc gctattacgc cagcccaagc taccatgata agtaagtaat 5640
attaaggtac gggaggtact tggagcggcc gcaataaaat atctttattt tcattacatc 5700
tgtgtgttgg ttttttgtgt gaatcgatag tactaacata cgctctccat caaaacaaaa 5760
cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtgcaggt gccagaacat 5820
ttctctatcg ata 5833
<210>13
<211>6710
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-2int-sph(突变型)
<220>
<221>内含子
<222>(948)..(1797)
<220>
<221>内含子
<222>(1798)..(2647)
<400>13
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacaggtg 1800
agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat 1860
aggaagggga gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca 1920
gtgtggaagt ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc 1980
ttttgtttaa ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa 2040
tgccttaaca ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa 2100
aaaaacttta cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc 2160
atattcataa tctccctact ttattttctt ttatttttaa ttgatacata atcattatac 2220
atatttatgg gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt 2280
aattttgcat ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc 2340
ttatttctaa tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat 2400
gcctctttgc accattctaa agaataacag tgataatttc tgggttaagg taatagcaat 2460
atttctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg 2520
ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg 2580
gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 2640
cccacagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg 2700
ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc 2760
gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca 2820
agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga 2880
ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta 2940
aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg 3000
ggctcactga gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg 3060
cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa 3120
cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt 3180
atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg 3240
gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc 3300
tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac 3360
accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ggtgaacttc 3420
ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt 3480
acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg 3540
aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa 3600
aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc 3660
gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 3720
aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 3780
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 3840
tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc 3900
cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 3960
atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg 4020
ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4080
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4140
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4200
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4260
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4320
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4380
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4440
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4500
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4560
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4620
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 4680
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 4740
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 4800
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 4860
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 4920
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 4980
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5040
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5100
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5160
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5220
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5280
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5340
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5400
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5460
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5520
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5580
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 5640
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 5700
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 5760
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 5820
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 5880
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 5940
atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 6000
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 6060
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 6120
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 6180
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 6240
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 6300
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 6360
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg 6420
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 6480
attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg 6540
agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa 6600
tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa 6660
taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 6710
<210>14
<211>6710
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-2int-Sph-C
<220>
<221>内含子
<222>(948)..(1797)
<220>
<221>内含子
<222>(2541)..(3390)
<400>14
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagtttc ttttatttgc tgttcataac aattgttttc ttttgtttaa 1140
ttcttgcttt cttttttttt cttctccgca atttttacta ttatacttaa tgccttaaca 1200
ttgtgtataa caaaaggaaa tatctctgag atacattaag taacttaaaa aaaaacttta 1260
cacagtctgc ctagtacatt actatttgga atatatgtgt gcttatttgc atattcataa 1320
tctccctact ttattttctt ttatttttaa ttgatacata atcattatac atatttatgg 1380
gttaaagtgt aatgttttaa tatgtgtaca catattgacc aaatcagggt aattttgcat 1440
ttgtaatttt aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa 1500
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 1560
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 1620
ataaatattt ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag 1680
ctacaatcca gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg 1740
agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagaga 1800
tcctattttt ggcaatcaaa tcattccgga tactgcgatt ttaagtgttg ttccattcca 1860
tcacggtttt ggaatgttta ctacactcgg atatttgata tgtggatttc gagtcgtctt 1920
aatgtataga tttgaagaag agctgtttct gaggagcctt caggattaca agattcaaag 1980
tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa agcactctga ttgacaaata 2040
cgatttatct aatttacacg aaattgcttc tggtggcgct cccctctcta aggaagtcgg 2100
ggaagcggtt gccaagaggt tccatctgcc aggtatcagg caaggatatg ggctcactga 2160
gactacatca gctattctga ttacacccga gggggatgat aaaccgggcg cggtcggtaa 2220
agttgttcca ttttttgaag cgaaggttgt ggatctggat accgggaaaa cgctgggcgt 2280
taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa 2340
tccggaagcg accaacgcct tgattgacaa ggatggatgg ctacattctg gagacatagc 2400
ttactgggac gaagacgaac acttcttcat cgttgaccgc ctgaagtctc tgattaagta 2460
caaaggctat caggtggctc ccgctgaatt ggaatccatc ttgctccaac accccaacat 2520
cttcgacgca ggtgtcgcag gtgagtctat gggacccttg atgttttctt tccccttctt 2580
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 2640
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 2700
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 2760
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 2820
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 2880
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 2940
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 3000
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 3060
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 3120
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 3180
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 3240
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 3300
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 3360
atgttcatac ctcttatctt cctcccacag gtcttcccga cgatgacgcc ggtgaacttc 3420
ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag atcgtggatt 3480
acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg tttgtggacg 3540
aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag atcctcataa 3600
aggccaagaa gggcggaaag atcgccgtgt aattctagag tcggggcggc cggccgcttc 3660
gagcagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 3720
aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 3780
gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 3840
tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtaaaatc gataaggatc 3900
cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg ggcgcggggc 3960
atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt aggacaggtg 4020
ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 4080
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 4140
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 4200
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 4260
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 4320
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 4380
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 4440
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 4500
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 4560
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 4620
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 4680
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 4740
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 4800
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 4860
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 4920
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 4980
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 5040
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 5100
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 5160
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 5220
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 5280
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 5340
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 5400
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 5460
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 5520
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 5580
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 5640
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 5700
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 5760
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 5820
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 5880
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 5940
atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 6000
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 6060
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 6120
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 6180
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 6240
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 6300
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 6360
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttg 6420
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 6480
attacgccag cccaagctac catgataagt aagtaatatt aaggtacggg aggtacttgg 6540
agcggccgca ataaaatatc tttattttca ttacatctgt gtgttggttt tttgtgtgaa 6600
tcgatagtac taacatacgc tctccatcaa aacaaaacga aacaaaacaa actagcaaaa 6660
taggctgtcc ccagtgcaag tgcaggtgcc agaacatttc tctatcgata 6710
<210>15
<211>5660
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-sint200-sph(突变型)
<220>
<221>内含子
<222>(948)..(1597)
<400>15
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140
ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200
tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260
ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320
tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380
tgataatttc tgggttaagg taatagcaat atttctgcat ataaatattt ctgcatataa 1440
attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc 1500
tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt 1560
gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa 1620
tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta 1680
ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag 1740
agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc 1800
tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg 1860
aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt 1920
tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga 1980
ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag 2040
cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt 2100
gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct 2160
tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac 2220
acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc 2280
ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag 2340
gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa 2400
agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa 2460
agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg 2520
acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt 2580
aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt 2640
ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2700
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2760
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 2820
tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac 2880
ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 2940
ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac 3000
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3060
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3120
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3180
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3240
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3300
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3360
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3420
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3480
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3540
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3600
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3660
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3720
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 3780
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 3840
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3900
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3960
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4020
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4080
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4140
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4200
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4260
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4320
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4380
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4440
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4500
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4560
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4620
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4680
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4740
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4800
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4860
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc 4920
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4980
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5040
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5100
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5160
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5220
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5280
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5340
ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg 5400
ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt 5460
aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca 5520
ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa 5580
aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc 5640
agaacatttc tctatcgata 5660
<210>16
<211>5660
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-sint200-sph(657 GT)
<220>
<221>内含子
<222>(948)..(1597)
<400>16
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga 1020
gaagtaacag ggtacagttt agaatgggaa acagacgaat gattgcatca gtgtggaagt 1080
ctcaggatcg ttttagttgt gcttatttgc atattcataa tctccctact ttattttctt 1140
ttatttttaa ttgatacata atcattatac atatttatgg gttaaagtgt aatgttttaa 1200
tatgtgtaca catattgacc aaatcagggt aattttgcat ttgtaatttt aaaaaatgct 1260
ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc 1320
tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag 1380
tgataatttc tgggttaagg taagtgcaat atttctgcat ataaatattt ctgcatataa 1440
attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc 1500
tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt 1560
gctaatcatg ttcatacctc ttatcttcct cccacagaga tcctattttt ggcaatcaaa 1620
tcattccgga tactgcgatt ttaagtgttg ttccattcca tcacggtttt ggaatgttta 1680
ctacactcgg atatttgata tgtggatttc gagtcgtctt aatgtataga tttgaagaag 1740
agctgtttct gaggagcctt caggattaca agattcaaag tgcgctgctg gtgccaaccc 1800
tattctcctt cttcgccaaa agcactctga ttgacaaata cgatttatct aatttacacg 1860
aaattgcttc tggtggcgct cccctctcta aggaagtcgg ggaagcggtt gccaagaggt 1920
tccatctgcc aggtatcagg caaggatatg ggctcactga gactacatca gctattctga 1980
ttacacccga gggggatgat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag 2040
cgaaggttgt ggatctggat accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt 2100
gtgtgagagg tcctatgatt atgtccggtt atgtaaacaa tccggaagcg accaacgcct 2160
tgattgacaa ggatggatgg ctacattctg gagacatagc ttactgggac gaagacgaac 2220
acttcttcat cgttgaccgc ctgaagtctc tgattaagta caaaggctat caggtggctc 2280
ccgctgaatt ggaatccatc ttgctccaac accccaacat cttcgacgca ggtgtcgcag 2340
gtcttcccga cgatgacgcc ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa 2400
agacgatgac ggaaaaagag atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa 2460
agttgcgcgg aggagttgtg tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg 2520
acgcaagaaa aatcagagag atcctcataa aggccaagaa gggcggaaag atcgccgtgt 2580
aattctagag tcggggcggc cggccgcttc gagcagacat gataagatac attgatgagt 2640
ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg 2700
ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca 2760
ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc aagtaaaacc 2820
tctacaaatg tggtaaaatc gataaggatc cgtcgaccga tgcccttgag agccttcaac 2880
ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tatgactgtc 2940
ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tcttccgctt cctcgctcac 3000
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3060
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3120
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3180
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3240
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3300
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3360
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3420
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3480
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3540
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3600
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3660
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3720
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 3780
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 3840
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 3900
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 3960
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4020
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4080
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4140
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4200
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4260
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4320
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4380
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4440
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4500
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4560
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4620
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4680
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4740
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 4800
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 4860
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgcgcc 4920
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 4980
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 5040
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 5100
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 5160
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 5220
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 5280
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 5340
ttttaacaaa atattaacgc ttacaatttg ccattcgcca ttcaggctgc gcaactgttg 5400
ggaagggcga tcggtgcggg cctcttcgct attacgccag cccaagctac catgataagt 5460
aagtaatatt aaggtacggg aggtacttgg agcggccgca ataaaatatc tttattttca 5520
ttacatctgt gtgttggttt tttgtgtgaa tcgatagtac taacatacgc tctccatcaa 5580
aacaaaacga aacaaaacaa actagcaaaa taggctgtcc ccagtgcaag tgcaggtgcc 5640
agaacatttc tctatcgata 5660
<210>17
<211>5436
<212>DNA
<213>人工序列
<220>
<223>质粒GL3-sint425-sph
<220>
<221>内含子
<222>(948)..(1373)
<400>17
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggcattccgg tactgttggt aaagccacca tggaagacgc caaaaacata 300
aagaaaggcc cggcgccatt ctatccgctg gaagatggaa ccgctggaga gcaactgcat 360
aaggctatga agagatacgc cctggttcct ggaacaattg cttttacaga tgcacatatc 420
gaggtggaca tcacttacgc tgagtacttc gaaatgtccg ttcggttggc agaagctatg 480
aaacgatatg ggctgaatac aaatcacaga atcgtcgtat gcagtgaaaa ctctcttcaa 540
ttctttatgc cggtgttggg cgcgttattt atcggagttg cagttgcgcc cgcgaacgac 600
atttataatg aacgtgaatt gctcaacagt atgggcattt cgcagcctac cgtggtgttc 660
gtttccaaaa aggggttgca aaaaattttg aacgtgcaaa aaaagctccc aatcatccaa 720
aaaattatta tcatggattc taaaacggat taccagggat ttcagtcgat gtacacgttc 780
gtcacatctc atctacctcc cggttttaat gaatacgatt ttgtgccaga gtccttcgat 840
agggacaaga caattgcact gatcatgaac tcctctggat ctactggtct gcctaaaggt 900
gtcgctctgc ctcatagaac tgcctgcgtg agattctcgc atgccaggtg agtctatggg 960
acccttgatg ttttctttcc tgtacacata ttgaccaaat cagggtaatt ttgcatttgt 1020
aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact 1080
ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca 1140
ttctaaagaa taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa 1200
atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac 1260
aatccagcta ccattctgct tttattttat ggttgggata aggctggatt attctgagtc 1320
caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca cagagatcct 1380
atttttggca atcaaatcat tccggatact gcgattttaa gtgttgttcc attccatcac 1440
ggttttggaa tgtttactac actcggatat ttgatatgtg gatttcgagt cgtcttaatg 1500
tatagatttg aagaagagct gtttctgagg agccttcagg attacaagat tcaaagtgcg 1560
ctgctggtgc caaccctatt ctccttcttc gccaaaagca ctctgattga caaatacgat 1620
ttatctaatt tacacgaaat tgcttctggt ggcgctcccc tctctaagga agtcggggaa 1680
gcggttgcca agaggttcca tctgccaggt atcaggcaag gatatgggct cactgagact 1740
acatcagcta ttctgattac acccgagggg gatgataaac cgggcgcggt cggtaaagtt 1800
gttccatttt ttgaagcgaa ggttgtggat ctggataccg ggaaaacgct gggcgttaat 1860
caaagaggcg aactgtgtgt gagaggtcct atgattatgt ccggttatgt aaacaatccg 1920
gaagcgacca acgccttgat tgacaaggat ggatggctac attctggaga catagcttac 1980
tgggacgaag acgaacactt cttcatcgtt gaccgcctga agtctctgat taagtacaaa 2040
ggctatcagg tggctcccgc tgaattggaa tccatcttgc tccaacaccc caacatcttc 2100
gacgcaggtg tcgcaggtct tcccgacgat gacgccggtg aacttcccgc cgccgttgtt 2160
gttttggagc acggaaagac gatgacggaa aaagagatcg tggattacgt cgccagtcaa 2220
gtaacaaccg cgaaaaagtt gcgcggagga gttgtgtttg tggacgaagt accgaaaggt 2280
cttaccggaa aactcgacgc aagaaaaatc agagagatcc tcataaaggc caagaagggc 2340
ggaaagatcg ccgtgtaatt ctagagtcgg ggcggccggc cgcttcgagc agacatgata 2400
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 2460
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 2520
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 2580
taaagcaagt aaaacctcta caaatgtggt aaaatcgata aggatccgtc gaccgatgcc 2640
cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc 2700
cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctt 2760
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 2820
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 2880
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2940
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 3000
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 3060
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 3120
tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 3180
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 3240
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 3300
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 3360
actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 3420
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 3480
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3540
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3600
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 3660
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 3720
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 3780
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 3840
acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 3900
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 3960
ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 4020
tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 4080
ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 4140
tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 4200
attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 4260
agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 4320
ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 4380
ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 4440
cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 4500
gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 4560
tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 4620
tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 4680
tgccacctga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 4740
gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 4800
ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 4860
tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 4920
gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct 4980
ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt 5040
ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac 5100
aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttgccat tcgccattca 5160
ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagccca 5220
agctaccatg ataagtaagt aatattaagg tacgggaggt acttggagcg gccgcaataa 5280
aatatcttta ttttcattac atctgtgtgt tggttttttg tgtgaatcga tagtactaac 5340
atacgctctc catcaaaaca aaacgaaaca aaacaaacta gcaaaatagg ctgtccccag 5400
tgcaagtgca ggtgccagaa catttctcta tcgata 5436
<210>18
<211>850
<212>DNA
<213>人工序列
<220>
<223>突变型β-珠蛋白内含子(654 C-T)
<220>
<221>misc_feature
<222>(654)..(654)
<223>β-珠蛋白内含子654 C-T突变
<400>18
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>19
<211>850
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(1)..(850)
<223>野生型β-珠蛋白内含子
<400>19
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>20
<211>850
<212>DNA
<213>人工序列
<220>
<223>双突变型β-珠蛋白内含子(654 C-T 657 TA-GT)
<220>
<221>misc_feature
<222>(654)..(654)
<223>β-珠蛋白内含子654 C-T突变
<220>
<221>misc_feature
<222>(657)..(658)
<223>β-珠蛋白内含子657 TA-GT突变
<400>20
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagtgc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>21
<211>2503
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<400>21
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320
gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503
<210>22
<211>2503
<212>DNA
<213>人工序列
<220>
<223>具有野生型β-珠蛋白内含子的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<400>22
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320
gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503
<210>23
<211>2503
<212>DNA
<213>人工序列
<220>
<223>具有双突变型β-珠蛋白内含子(654 C-T 657 TA-GT)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<400>23
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320
gtaagtgcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503
<210>24
<211>3355
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)与翻译起点上游的突变型
β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1)..(850)
<220>
<221>内含子
<222>(1521)..(2370)
<400>24
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg 900
ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 960
cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac 1020
ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 1080
agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 1140
tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 1200
agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt 1260
ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg 1320
gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 1380
aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg 1440
aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc 1500
gtgagattct cgcatgccag gtgagtctat gggacccttg atgttttctt tccccttctt 1560
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 1620
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1680
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1740
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1800
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1860
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1920
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1980
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 2040
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 2100
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 2160
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 2220
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 2280
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 2340
atgttcatac ctcttatctt cctcccacag agatcctatt tttggcaatc aaatcattcc 2400
ggatactgcg attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact 2460
cggatatttg atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt 2520
tctgaggagc cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc 2580
cttcttcgcc aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc 2640
ttctggtggc gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct 2700
gccaggtatc aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc 2760
cgagggggat gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt 2820
tgtggatctg gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag 2880
aggtcctatg attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga 2940
caaggatgga tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt 3000
catcgttgac cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga 3060
attggaatcc atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc 3120
cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat 3180
gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg 3240
cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag 3300
aaaaatcaga gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa 3355
<210>25
<211>4219
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)和翻译起点上游的两个
突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1)..(850)
<220>
<221>内含子
<222>(861)..(1710)
<220>
<221>内含子
<222>(2385)..(3234)
<400>25
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag ccatgagctt gtgagtctat gggacccttg atgttttctt tccccttctt 900
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 960
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1020
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1080
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1140
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1200
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1260
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1320
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 1380
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 1440
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 1500
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 1560
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 1620
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 1680
atgttcatac ctcttatctt cctcccacag ccatgcatgg aagacgccaa aaacataaag 1740
aaaggcccgg cgccattcta tccgctggaa gatggaaccg ctggagagca actgcataag 1800
gctatgaaga gatacgccct ggttcctgga acaattgctt ttacagatgc acatatcgag 1860
gtggacatca cttacgctga gtacttcgaa atgtccgttc ggttggcaga agctatgaaa 1920
cgatatgggc tgaatacaaa tcacagaatc gtcgtatgca gtgaaaactc tcttcaattc 1980
tttatgccgg tgttgggcgc gttatttatc ggagttgcag ttgcgcccgc gaacgacatt 2040
tataatgaac gtgaattgct caacagtatg ggcatttcgc agcctaccgt ggtgttcgtt 2100
tccaaaaagg ggttgcaaaa aattttgaac gtgcaaaaaa agctcccaat catccaaaaa 2160
attattatca tggattctaa aacggattac cagggatttc agtcgatgta cacgttcgtc 2220
acatctcatc tacctcccgg ttttaatgaa tacgattttg tgccagagtc cttcgatagg 2280
gacaagacaa ttgcactgat catgaactcc tctggatcta ctggtctgcc taaaggtgtc 2340
gctctgcctc atagaactgc ctgcgtgaga ttctcgcatg ccaggtgagt ctatgggacc 2400
cttgatgttt tctttcccct tcttttctat ggttaagttc atgtcatagg aaggggagaa 2460
gtaacagggt acagtttaga atgggaaaca gacgaatgat tgcatcagtg tggaagtctc 2520
aggatcgttt tagtttcttt tatttgctgt tcataacaat tgttttcttt tgtttaattc 2580
ttgctttctt tttttttctt ctccgcaatt tttactatta tacttaatgc cttaacattg 2640
tgtataacaa aaggaaatat ctctgagata cattaagtaa cttaaaaaaa aactttacac 2700
agtctgccta gtacattact atttggaata tatgtgtgct tatttgcata ttcataatct 2760
ccctacttta ttttctttta tttttaattg atacataatc attatacata tttatgggtt 2820
aaagtgtaat gttttaatat gtgtacacat attgaccaaa tcagggtaat tttgcatttg 2880
taattttaaa aaatgctttc ttcttttaat atactttttt gtttatctta tttctaatac 2940
tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc tctttgcacc 3000
attctaaaga ataacagtga taatttctgg gttaaggtaa tagcaatatt tctgcatata 3060
aatatttctg catataaatt gtaactgatg taagaggttt catattgcta atagcagcta 3120
caatccagct accattctgc ttttatttta tggttgggat aaggctggat tattctgagt 3180
ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc acagagatcc 3240
tatttttggc aatcaaatca ttccggatac tgcgatttta agtgttgttc cattccatca 3300
cggttttgga atgtttacta cactcggata tttgatatgt ggatttcgag tcgtcttaat 3360
gtatagattt gaagaagagc tgtttctgag gagccttcag gattacaaga ttcaaagtgc 3420
gctgctggtg ccaaccctat tctccttctt cgccaaaagc actctgattg acaaatacga 3480
tttatctaat ttacacgaaa ttgcttctgg tggcgctccc ctctctaagg aagtcgggga 3540
agcggttgcc aagaggttcc atctgccagg tatcaggcaa ggatatgggc tcactgagac 3600
tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg tcggtaaagt 3660
tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc tgggcgttaa 3720
tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg taaacaatcc 3780
ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag acatagctta 3840
ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga ttaagtacaa 3900
aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc ccaacatctt 3960
cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg ccgccgttgt 4020
tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg tcgccagtca 4080
agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag taccgaaagg 4140
tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg ccaagaaggg 4200
cggaaagatc gccgtgtaa 4219
<210>26
<211>2503
<212>DNA
<213>人工序列
<220>
<223>在可变位点A具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(394)..(1243)
<400>26
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggtgagtc tatgggaccc ttgatgtttt 420
ctttcccctt cttttctatg gttaagttca tgtcatagga aggggagaag taacagggta 480
cagtttagaa tgggaaacag acgaatgatt gcatcagtgt ggaagtctca ggatcgtttt 540
agtttctttt atttgctgtt cataacaatt gttttctttt gtttaattct tgctttcttt 600
ttttttcttc tccgcaattt ttactattat acttaatgcc ttaacattgt gtataacaaa 660
aggaaatatc tctgagatac attaagtaac ttaaaaaaaa actttacaca gtctgcctag 720
tacattacta tttggaatat atgtgtgctt atttgcatat tcataatctc cctactttat 780
tttcttttat ttttaattga tacataatca ttatacatat ttatgggtta aagtgtaatg 840
ttttaatatg tgtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa 900
aatgctttct tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc 960
tctttctttc agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa 1020
taacagtgat aatttctggg ttaaggtaat agcaatattt ctgcatataa atatttctgc 1080
atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta 1140
ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc 1200
ccttttgcta atcatgttca tacctcttat cttcctccca caggggttgc aaaaaatttt 1260
gaacgtgcaa aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga 1320
ttaccaggga tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa 1380
tgaatacgat tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa 1440
ctcctctgga tctactggtctgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt 1500
gagattctcg catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680
tcaggattac aagattcaaa gtgcgctgctggtgccaacc ctattctcct tcttcgccaa 1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503
<210>27
<211>2503
<212>DNA
<213>人工序列
<220>
<223>在可变位点B具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1161)..(2010)
<400>27
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140
acgctgggcg ttaatcaaag gtgagtctat gggacccttg atgttttctt tccccttctt 1200
ttctatggtt aagttcatgt cataggaagg ggagaagtaa cagggtacag tttagaatgg 1260
gaaacagacg aatgattgca tcagtgtgga agtctcagga tcgttttagt ttcttttatt 1320
tgctgttcat aacaattgtt ttcttttgtt taattcttgc tttctttttt tttcttctcc 1380
gcaattttta ctattatact taatgcctta acattgtgta taacaaaagg aaatatctct 1440
gagatacatt aagtaactta aaaaaaaact ttacacagtc tgcctagtac attactattt 1500
ggaatatatg tgtgcttatt tgcatattca taatctccct actttatttt cttttatttt 1560
taattgatac ataatcatta tacatattta tgggttaaag tgtaatgttt taatatgtgt 1620
acacatattg accaaatcag ggtaattttg catttgtaat tttaaaaaat gctttcttct 1680
tttaatatac ttttttgttt atcttatttc taatactttc cctaatctct ttctttcagg 1740
gcaataatga tacaatgtat catgcctctt tgcaccattc taaagaataa cagtgataat 1800
ttctgggtta aggtaatagc aatatttctg catataaata tttctgcata taaattgtaa 1860
ctgatgtaag aggtttcata ttgctaatag cagctacaat ccagctacca ttctgctttt 1920
attttatggt tgggataagg ctggattatt ctgagtccaa gctaggccct tttgctaatc 1980
atgttcatac ctcttatctt cctcccacag aggcgaactg tgtgtgagag gtcctatgat 2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc 2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503
<210>28
<211>2503
<212>DNA
<213>人工序列
<220>
<223>在可变位点C具有突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(1412)..(2261)
<400>28
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140
acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200
tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260
ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320
ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380
caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt gatgttttct 1440
ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta acagggtaca 1500
gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg atcgttttag 1560
tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg ctttcttttt 1620
ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt ataacaaaag 1680
gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt ctgcctagta 1740
cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc tactttattt 1800
tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa gtgtaatgtt 1860
ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa 1920
tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc 1980
tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt ctaaagaata 2040
acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat atttctgcat 2100
ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa tccagctacc 2160
attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca agctaggccc 2220
ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg acgatgacgc 2280
cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga 2340
gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt 2400
gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga 2460
gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 2503
<210>29
<211>2505
<212>DNA
<213>人工序列
<220>
<223>具有翻译起点上游的突变型β-珠蛋白内含子的萤光素酶
<220>
<221>内含子
<222>(1)..(850)
<400>29
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag ccatggaaga cgccaaaaac ataaagaaag gcccggcgcc attctatccg 900
ctggaagatg gaaccgctgg agagcaactg cataaggcta tgaagagata cgccctggtt 960
cctggaacaa ttgcttttac agatgcacat atcgaggtgg acatcactta cgctgagtac 1020
ttcgaaatgt ccgttcggtt ggcagaagct atgaaacgat atgggctgaa tacaaatcac 1080
agaatcgtcg tatgcagtga aaactctctt caattcttta tgccggtgtt gggcgcgtta 1140
tttatcggag ttgcagttgc gcccgcgaac gacatttata atgaacgtga attgctcaac 1200
agtatgggca tttcgcagcc taccgtggtg ttcgtttcca aaaaggggtt gcaaaaaatt 1260
ttgaacgtgc aaaaaaagct cccaatcatc caaaaaatta ttatcatgga ttctaaaacg 1320
gattaccagg gatttcagtc gatgtacacg ttcgtcacat ctcatctacc tcccggtttt 1380
aatgaatacg attttgtgcc agagtccttc gatagggaca agacaattgc actgatcatg 1440
aactcctctg gatctactgg tctgcctaaa ggtgtcgctc tgcctcatag aactgcctgc 1500
gtgagattct cgcatgccag agatcctatt tttggcaatc aaatcattcc ggatactgcg 1560
attttaagtg ttgttccatt ccatcacggt tttggaatgt ttactacact cggatatttg 1620
atatgtggat ttcgagtcgt cttaatgtat agatttgaag aagagctgtt tctgaggagc 1680
cttcaggatt acaagattca aagtgcgctg ctggtgccaa ccctattctc cttcttcgcc 1740
aaaagcactc tgattgacaa atacgattta tctaatttac acgaaattgc ttctggtggc 1800
gctcccctct ctaaggaagt cggggaagcg gttgccaaga ggttccatct gccaggtatc 1860
aggcaaggat atgggctcac tgagactaca tcagctattc tgattacacc cgagggggat 1920
gataaaccgg gcgcggtcgg taaagttgtt ccattttttg aagcgaaggt tgtggatctg 1980
gataccggga aaacgctggg cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg 2040
attatgtccg gttatgtaaa caatccggaa gcgaccaacg ccttgattga caaggatgga 2100
tggctacatt ctggagacat agcttactgg gacgaagacg aacacttctt catcgttgac 2160
cgcctgaagt ctctgattaa gtacaaaggc tatcaggtgg ctcccgctga attggaatcc 2220
atcttgctcc aacaccccaa catcttcgac gcaggtgtcg caggtcttcc cgacgatgac 2280
gccggtgaac ttcccgccgc cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa 2340
gagatcgtgg attacgtcgc cagtcaagta acaaccgcga aaaagttgcg cggaggagtt 2400
gtgtttgtgg acgaagtacc gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga 2460
gagatcctca taaaggccaa gaagggcgga aagatcgccg tgtaa 2505
<210>30
<211>3353
<212>DNA
<213>人工序列
<220>
<223>具有两个突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<220>
<221>内含子
<222>(1519)..(2368)
<400>30
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320
gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500
cttatcttcc tcccacaggt gagtctatgg gacccttgat gttttctttc cccttctttt 1560
ctatggttaa gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga 1620
aacagacgaa tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg 1680
ctgttcataa caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc 1740
aatttttact attatactta atgccttaac attgtgtata acaaaaggaa atatctctga 1800
gatacattaa gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg 1860
aatatatgtg tgcttatttg catattcata atctccctac tttattttct tttattttta 1920
attgatacat aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac 1980
acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt 2040
taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc 2100
aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt 2160
ctgggttaag gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact 2220
gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat 2280
tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat 2340
gttcatacct cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg 2400
atactgcgat tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg 2460
gatatttgat atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc 2520
tgaggagcct tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct 2580
tcttcgccaa aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt 2640
ctggtggcgc tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc 2700
caggtatcag gcaaggatat gggctcactg agactacatc agctattctg attacacccg 2760
agggggatga taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg 2820
tggatctgga taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag 2880
gtcctatgat tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca 2940
aggatggatg gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca 3000
tcgttgaccg cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat 3060
tggaatccat cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg 3120
acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga 3180
cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg 3240
gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa 3300
aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 3353
<210>31
<211>3353
<212>DNA
<213>人工序列
<220>
<223>具有两个突变型β-珠蛋白内含子(654 C-T)的萤光素酶
<220>
<221>内含子
<222>(669)..(1518)
<220>
<221>内含子
<222>(2262)..(3111)
<400>31
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa 840
caattgtttt cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact 900
attatactta atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa 960
gtaacttaaa aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg 1020
tgcttatttg catattcata atctccctac tttattttct tttattttta attgatacat 1080
aatcattata catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac 1140
caaatcaggg taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt 1200
ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc aataatgata 1260
caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag 1320
gtaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag 1380
gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg 1440
ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct 1500
cttatcttcc tcccacagag atcctatttt tggcaatcaa atcattccgg atactgcgat 1560
tttaagtgtt gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat 1620
atgtggattt cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct 1680
tcaggattac aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa 1740
aagcactctg attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc 1800
tcccctctct aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag 1860
gcaaggatat gggctcactg agactacatc agctattctg attacacccg agggggatga 1920
taaaccgggc gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga 1980
taccgggaaa acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat 2040
tatgtccggt tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg 2100
gctacattct ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg 2160
cctgaagtct ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat 2220
cttgctccaa caccccaaca tcttcgacgc aggtgtcgca ggtgagtcta tgggaccctt 2280
gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag gggagaagta 2340
acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg aagtctcagg 2400
atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt ttaattcttg 2460
ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt aacattgtgt 2520
ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac tttacacagt 2580
ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc ataatctccc 2640
tactttattt tcttttattt ttaattgata cataatcatt atacatattt atgggttaaa 2700
gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt gcatttgtaa 2760
ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt ctaatacttt 2820
ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct ttgcaccatt 2880
ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct gcatataaat 2940
atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata gcagctacaa 3000
tccagctacc attctgcttt tattttatgg ttgggataag gctggattat tctgagtcca 3060
agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca ggtcttcccg 3120
acgatgacgc cggtgaactt cccgccgccg ttgttgtttt ggagcacgga aagacgatga 3180
cggaaaaaga gatcgtggat tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg 3240
gaggagttgt gtttgtggac gaagtaccga aaggtcttac cggaaaactc gacgcaagaa 3300
aaatcagaga gatcctcata aaggccaaga agggcggaaa gatcgccgtg taa 3353
<210>32
<211>2303
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T和200碱基对缺失)的萤光素酶
<220>
<221>内含子
<222>(669)..(1318)
<400>32
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata 840
atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg 900
ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca 960
tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta 1020
atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg 1080
caccattcta aagaataaca gtgataattt ctgggttaag gtaatagcaa tatttctgca 1140
tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca 1200
gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 1260
gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag 1320
atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc 1380
atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct 1440
taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa 1500
gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat 1560
acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg 1620
gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg 1680
agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta 1740
aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg 1800
ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca 1860
atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag 1920
cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt 1980
acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca 2040
tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg 2100
ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca 2160
gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga 2220
aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga 2280
agggcggaaa gatcgccgtg taa 2303
<210>33
<211>2303
<212>DNA
<213>人工序列
<220>
<223>具有双突变型β-珠蛋白内含子(654 C-T 657 TA-GT和200个碱基对缺失)的
萤光素酶
<220>
<221>内含子
<222>(669)..(1318)
<400>33
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa 720
gttcatgtca taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa 780
tgattgcatc agtgtggaag tctcaggatc gttttagttg tgcttatttg catattcata 840
atctccctac tttattttct tttattttta attgatacat aatcattata catatttatg 900
ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg taattttgca 960
tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat cttatttcta 1020
atactttccc taatctcttt ctttcagggc aataatgata caatgtatca tgcctctttg 1080
caccattcta aagaataaca gtgataattt ctgggttaag gtaagtgcaa tatttctgca 1140
tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt gctaatagca 1200
gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct ggattattct 1260
gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc tcccacagag 1320
atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt gttccattcc 1380
atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt cgagtcgtct 1440
taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac aagattcaaa 1500
gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg attgacaaat 1560
acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct aaggaagtcg 1620
gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat gggctcactg 1680
agactacatc agctattctg attacacccg agggggatga taaaccgggc gcggtcggta 1740
aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa acgctgggcg 1800
ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt tatgtaaaca 1860
atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct ggagacatag 1920
cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct ctgattaagt 1980
acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa caccccaaca 2040
tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt cccgccgccg 2100
ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat tacgtcgcca 2160
gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac gaagtaccga 2220
aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata aaggccaaga 2280
agggcggaaa gatcgccgtg taa 2303
<210>34
<211>2079
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T和425个碱基对缺失)的萤光素酶
<220>
<221>内含子
<222>(669)..(1094)
<400>34
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccaggt gagtctatgg gacccttgat gttttctttc ctgtacacat attgaccaaa 720
tcagggtaat tttgcatttg taattttaaa aaatgctttc ttcttttaat atactttttt 780
gtttatctta tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat 840
gtatcatgcc tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggtaa 900
tagcaatatt tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt 960
catattgcta atagcagcta caatccagct accattctgc ttttatttta tggttgggat 1020
aaggctggat tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta 1080
tcttcctccc acagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta 1140
agtgttgttc cattccatca cggttttgga atgtttacta cactcggata tttgatatgt 1200
ggatttcgag tcgtcttaat gtatagattt gaagaagagc tgtttctgag gagccttcag 1260
gattacaaga ttcaaagtgc gctgctggtg ccaaccctat tctccttctt cgccaaaagc 1320
actctgattg acaaatacga tttatctaat ttacacgaaa ttgcttctgg tggcgctccc 1380
ctctctaagg aagtcgggga agcggttgcc aagaggttcc atctgccagg tatcaggcaa 1440
ggatatgggc tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa 1500
ccgggcgcgg tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc 1560
gggaaaacgc tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg 1620
tccggttatg taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta 1680
cattctggag acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg 1740
aagtctctga ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg 1800
ctccaacacc ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt 1860
gaacttcccg ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc 1920
gtggattacg tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt 1980
gtggacgaag taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc 2040
ctcataaagg ccaagaaggg cggaaagatc gccgtgtaa 2079
<210>35
<211>7449
<212>DNA
<213>人工序列
<220>
<223>具有抗胰蛋白酶和突变型β-珠蛋白内含子(654 C-T)的质粒TRCBA
<220>
<221>内含子
<222>(2866)..(3715)
<223>突变型β-珠蛋白内含子(654C-T)
<400>35
gggggggggg gggggggttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg 60
ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag 120
cgcgcagaga gggagtggcc aactccatca ctaggggttc ctagatcttc aatattggcc 180
attagccata ttattcattg gttatatagc ataaatcaat attggatatt ggccattgca 240
tacgttgtat ctatatcata atatgtacat ttatattggc tcatgtccaa tatgaccgcc 300
atgttggcat tgattattga ctagttatta atagtaatca attacggggt cattagttca 360
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 420
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 480
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 540
acatcaagtg tatcatatgc caagtccgcc ccctattgac gtcaatgacg gtaaatggcc 600
cgcctggcat tatgcccagt acatgacctt acgggacttt cctacttggc agtacatcta 660
cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct tcactctccc 720
catctccccc ccctccccac ccccaatttt gtatttattt attttttaat tattttgtgc 780
agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc ggggcgaggg 840
gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg cgctccgaaa 900
gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa gcgcgcggcg 960
ggcgggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 1020
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 1080
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 1140
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt 1200
gcgtgcgtgt gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg 1260
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1320
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1380
gtgtgtgcgt gggggggtga gcagggggta tgggcgcggc ggtcgggctg taaccccccc 1440
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 1500
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 1560
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 1620
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 1680
agggcgcagg gacttacttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 1740
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 1800
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 1860
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 1920
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 1980
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcgat 2040
atcaagcttg gggattttca ggcaccacca ctgacctggg acagtgaatc gacaatgccg 2100
tcttctgtct cgtggggcat cctcctgctg gcaggcctgt gctgcctggt ccctgtctcc 2160
ctggctgagg atccccaggg agatgctgcc cagaagacag atacatccca ccatgatcag 2220
gatcacccaa ccttcaacaa gatcaccccc aacctggctg agttcgcctt cagcctatac 2280
cgccagctgg cacaccagtc caacagcacc aatatcttct tctccccagt gagcatcgct 2340
acagcctttg caatgctctc cctggggacc aaggctgaca ctcacgatga aatcctggag 2400
ggcctgaatt tcaacctcac ggagattccg gaggctcaga gccatgaagg ctgccaggaa 2460
ctcctccgta ccctcaacca gccagacagc cagctccagc tgaccaccgg caatggcctg 2520
tgcctcagcg agggcctgaa gcaagtggat aagtttttgg aggatgttaa aaagttgtac 2580
cactcataag ccttcactgt caacttcggg gacaccgaag aggccaagaa acagatcaac 2640
gattacgttg agaagggtac tcaagggaaa atggtggatg tggtcaagga gcttgacaga 2700
gacacagttt ttgctctggt gaattacatc ttctttaaag gcaaatggga gagacccttt 2760
gaagtcaagg acaccgagga agaggacttc cacgtggacc aggtgaccac cgtgaaggtg 2820
cctatgatga agcgtttagt catgtttaac atccagcact gtaaggtgag tctatgggac 2880
ccttgatgtt ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggaga 2940
agtaacaggg tacagtttag aatgggaaac agacgaatga ttgcatcagt gtggaagtct 3000
caggatcgtt ttagtttctt ttatttgctg ttcataacaa ttgttttctt ttgtttaatt 3060
cttgctttct ttttttttct tctccgcaat ttttactatt atacttaatg ccttaacatt 3120
gtgtataaca aaaggaaata tctctgagat acattaagta acttaaaaaa aaactttaca 3180
cagtctgcct agtacattac tatttggaat atatgtgtgc ttatttgcat attcataatc 3240
tccctacttt attttctttt atttttaatt gatacataat cattatacat atttatgggt 3300
taaagtgtaa tgttttaata tgtgtacaca tattgaccaa atcagggtaa ttttgcattt 3360
gtaattttaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt atttctaata 3420
ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc ctctttgcac 3480
cattctaaag aataacagtg ataatttctg ggttaaggta atagcaatat ttctgcatat 3540
aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct aatagcagct 3600
acaatccagc taccattctg cttttatttt atggttggga taaggctgga ttattctgag 3660
tccaagctag gcccttttgc taatcatgtt catacctctt atcttcctcc cacagaagct 3720
ttccagctgg gtgctgctga tgaaatacct gggcaatgcc accgccatct tcttcctgcc 3780
tgatgagggg aaactacagc acctggaaaa tgaactcacc cacgatatca tcaccaagtt 3840
cctggaaaat gaagacagaa ggtctgccag cttacattta cccaaactgt ccattactgg 3900
aacctatgat ctgaagagcg tcctgggtca actgggcatc actaaggtct tcagcaatgg 3960
ggctgacctc tccgtggtca cagaggaggc acccctgaag ctctccaatg ccgtgcataa 4020
ggctgtgctg accatcgacg agaaagggac tgaagctgct ggggccatgt ttttagaggc 4080
catacccatg tctatccccc ccgaggtcaa ggtcaacaaa ccctttgtct tcttaatgat 4140
tgaacaaaat accaagtctc ccctcttcat gggaaaagtg gtgaatccca cccaaaaata 4200
actgcctctc gctcctcaac ccctcccctc catccctggc cccctccctg gatgacatta 4260
aagaagggtt gagctggtaa cccccccccc ccctgcaggg gccctcgacc cgggcggccg 4320
cttcgagcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 4380
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4440
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 4500
gagatgtggg aggtttttta aagcaagtaa aacctctaca aatgtggtaa aatcgataag 4560
gatctaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4620
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag 4680
cgagcgagcg cgcagagagg gagtggccaa cccccccccc cccccccctg cagcctggcg 4740
taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgtagcc tgaatggcga 4800
atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 4860
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 4920
tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 4980
ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 5040
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 5100
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 5160
tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 5220
aaaatttaac gcgaatttta acaaaatatt aacgtttaca atttcctgat gcgctatttt 5280
ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc 5340
tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga 5400
cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 5460
atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata 5520
cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact 5580
tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaatact ttcaaatatg 5640
tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 5700
atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 5760
gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 5820
cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 5880
gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 5940
cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 6000
gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 6060
tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 6120
ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 6180
gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 6240
cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 6300
tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 6360
tcggcccttc cggctggctg gtttattgcg gataaatctg gagccggtga gcgtgggtct 6420
cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 6480
acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 6540
tcactgatta agcattggta actgtcagac caagtttact catatatact ttagattgat 6600
ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg 6660
accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 6720
aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 6780
ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 6840
gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 6900
ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 6960
ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 7020
ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 7080
gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg 7140
cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 7200
cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 7260
cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 7320
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 7380
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 7440
gataccgct 7449
<210>36
<211>2107
<212>DNA
<213>人工序列
<220>
<223>具有突变型β-珠蛋白内含子(654 C-T)的抗胰蛋白酶
<220>
<221>内含子
<222>(772)..(1621)
<223>突变型β-珠蛋白内含子(654 C-T)
<400>36
atgccgtctt ctgtctcgtg gggcatcctc ctgctggcag gcctgtgctg cctggtccct 60
gtctccctgg ctgaggatcc ccagggagat gctgcccaga agacagatac atcccaccat 120
gatcaggatc acccaacctt caacaagatc acccccaacc tggctgagtt cgccttcagc 180
ctataccgcc agctggcaca ccagtccaac agcaccaata tcttcttctc cccagtgagc 240
atcgctacag cctttgcaat gctctccctg gggaccaagg ctgacactca cgatgaaatc 300
ctggagggcc tgaatttcaa cctcacggag attccggagg ctcagagcca tgaaggctgc 360
caggaactcc tccgtaccct caaccagcca gacagccagc tccagctgac caccggcaat 420
ggcctgtgcc tcagcgaggg cctgaagcaa gtggataagt ttttggagga tgttaaaaag 480
ttgtaccact cataagcctt cactgtcaac ttcggggaca ccgaagaggc caagaaacag 540
atcaacgatt acgttgagaa gggtactcaa gggaaaatgg tggatgtggt caaggagctt 600
gacagagaca cagtttttgc tctggtgaat tacatcttct ttaaaggcaa atgggagaga 660
ccctttgaag tcaaggacac cgaggaagag gacttccacg tggaccaggt gaccaccgtg 720
aaggtgccta tgatgaagcg tttagtcatg tttaacatcc agcactgtaa ggtgagtcta 780
tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 840
gggagaagta acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg 900
aagtctcagg atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt 960
ttaattcttg ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt 1020
aacattgtgt ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac 1080
tttacacagt ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc 1140
ataatctccc tactttattt tcttttattt ttaattgata cataatcatt atacatattt 1200
atgggttaaa gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt 1260
gcatttgtaa ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt 1320
ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct 1380
ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggtaatag caatatttct 1440
gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata 1500
gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 1560
tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 1620
gaagctttcc agctgggtgc tgctgatgaa atacctgggc aatgccaccg ccatcttctt 1680
cctgcctgat gaggggaaac tacagcacct ggaaaatgaa ctcacccacg atatcatcac 1740
caagttcctg gaaaatgaag acagaaggtc tgccagctta catttaccca aactgtccat 1800
tactggaacc tatgatctga agagcgtcct gggtcaactg ggcatcacta aggtcttcag 1860
caatggggct gacctctccg tggtcacaga ggaggcaccc ctgaagctct ccaatgccgt 1920
gcataaggct gtgctgacca tcgacgagaa agggactgaa gctgctgggg ccatgttttt 1980
agaggccata cccatgtcta tcccccccga ggtcaaggtc aacaaaccct ttgtcttctt 2040
aatgattgaa caaaatacca agtctcccct cttcatggga aaagtggtga atcccaccca 2100
aaaataa 2107
<210>37
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>37
gctattacct taacccag 18
<210>38
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>38
gcacttacct taacccag 18
<210>39
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>39
caagggtccc atagtctc 18
<210>40
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>40
gaaagagatg agggaaag 18
<210>41
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>41
gaaagagaag agggaaag 18
<210>42
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>42
cctcttacct cagttaca 18
<210>43
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>43
ctgtgggagt aagataag 18
<210>44
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>44
gctcttacct taacccag 18
<210>45
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>45
gcaattacct taacccag 18
<210>46
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>46
caagggtccc atagactc 18
<210>47
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>47
gaaagagatt agggaaag 18
<210>48
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>48
ctgtgggagg aagataag 18
<210>49
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>49
cctcttacat cagttaca 18
<210>50
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564 CT突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(564)..(565)
<223>564 CT突变
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<400>50
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>51
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有657G突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<220>
<221>misc_feature
<222>(657)..(657)
<223>657G突变
<400>51
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaagagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>52
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有658T突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<220>
<221>misc_feature
<222>(658)..(658)
<223>658T突变
<400>52
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaattgc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>53
<211>650
<212>DNA
<213>人工序列
<220>
<223>具有200个碱基对缺失的IVS2-654内含子
<220>
<221>misc_feature
<222>(454)..(454)
<223>C至T突变
<400>53
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct 180
actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag 240
tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat 300
tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 360
cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 420
taaagaataa cagtgataat ttctgggtta aggtaatagc aatatttctg catataaata 480
tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat 540
ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa 600
gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag 650
<210>54
<211>426
<212>DNA
<213>人工序列
<220>
<223>具有425bp缺失的IVS2-654内含子
<220>
<221>misc_feature
<222>(230)..(230)
<223>C至T突变
<400>54
gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta 60
attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct 120
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 180
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggt aatagcaata 240
tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 300
taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg 360
attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc 420
ccacag 426
<210>55
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有6A突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(6)..(6)
<223>6A突变
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<400>55
gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>56
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564C突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(564)..(564)
<223>564C突变
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<400>56
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>57
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有841A突变的IVS2-654内含子
<220>
<221>misc_feature
<222>(654)..(654)
<223>654T突变
<220>
<221>misc_feature
<222>(841)..(841)
<223>841A突变
<400>57
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggtaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgatgtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
actcccacag 850
<210>58
<211>850
<212>DNA
<213>人工序列
<220>
<223>突变型β-珠蛋白内含子(705T-G)
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>58
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>59
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564 CT突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(564)..(565)
<223>564CT突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>59
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctcttctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>60
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有657G突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(657)..(657)
<223>657G突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>60
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>61
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有658T突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(658)..(658)
<223>658T突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>61
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaattgc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>62
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有657GT突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(657)..(658)
<223>657GT突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>62
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaagtgc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>63
<211>650
<212>DNA
<213>人工序列
<220>
<223>具有200bp缺失的IVS2-705内含子
<220>
<221>misc_feature
<222>(505)..(505)
<223>T至G突变
<400>63
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt tgtgcttatt tgcatattca taatctccct 180
actttatttt cttttatttt taattgatac ataatcatta tacatattta tgggttaaag 240
tgtaatgttt taatatgtgt acacatattg accaaatcag ggtaattttg catttgtaat 300
tttaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 360
cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 420
taaagaataa cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata 480
tttctgcata taaattgtaa ctgaggtaag aggtttcata ttgctaatag cagctacaat 540
ccagctacca ttctgctttt attttatggt tgggataagg ctggattatt ctgagtccaa 600
gctaggccct tttgctaatc atgttcatac ctcttatctt cctcccacag 650
<210>64
<211>426
<212>DNA
<213>人工序列
<220>
<223>具有425bp缺失的IVS2-705内含子
<220>
<221>misc_feature
<222>(281)..(281)
<223>T至G突变
<400>64
gtgagtctat gggacccttg atgttttctt tcctgtacac atattgacca aatcagggta 60
attttgcatt tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct 120
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 180
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 240
tttctgcata taaatatttc tgcatataaa ttgtaactga ggtaagaggt ttcatattgc 300
taatagcagc tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg 360
attattctga gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc 420
ccacag 426
<210>65
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有6A突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(6)..(6)
<223>6A突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>65
gtgagactat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>66
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有564C突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(564)..(564)
<223>564C突变
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<400>66
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctcatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
cctcccacag 850
<210>67
<211>850
<212>DNA
<213>人工序列
<220>
<223>具有841A突变的IVS2-705内含子
<220>
<221>misc_feature
<222>(705)..(705)
<223>705G突变
<220>
<221>misc_feature
<222>(841)..(841)
<223>841A突变
<400>67
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacag tttagaatgg gaaacagacg aatgattgca 120
tcagtgtgga agtctcagga tcgttttagt ttcttttatt tgctgttcat aacaattgtt 180
ttcttttgtt taattcttgc tttctttttt tttcttctcc gcaattttta ctattatact 240
taatgcctta acattgtgta taacaaaagg aaatatctct gagatacatt aagtaactta 300
aaaaaaaact ttacacagtc tgcctagtac attactattt ggaatatatg tgtgcttatt 360
tgcatattca taatctccct actttatttt cttttatttt taattgatac ataatcatta 420
tacatattta tgggttaaag tgtaatgttt taatatgtgt acacatattg accaaatcag 480
ggtaattttg catttgtaat tttaaaaaat gctttcttct tttaatatac ttttttgttt 540
atcttatttc taatactttc cctaatctct ttctttcagg gcaataatga tacaatgtat 600
catgcctctt tgcaccattc taaagaataa cagtgataat ttctgggtta aggcaatagc 660
aatatttctg catataaata tttctgcata taaattgtaa ctgaggtaag aggtttcata 720
ttgctaatag cagctacaat ccagctacca ttctgctttt attttatggt tgggataagg 780
ctggattatt ctgagtccaa gctaggccct tttgctaatc atgttcatac ctcttatctt 840
actcccacag 850
<210>68
<211>196
<212>DNA
<213>人工序列
<220>
<223>IVS2-654内含子197bp
<400>68
gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60
tactttccct cttctctttc tttcaggtga ttgactgact gggttaaggt aatagcgccg 120
ttgaaaacct cagccgtata gtccaagcta ggcccttttg ctaatcatgt tcatacctct 180
tatcttcctc ccacag 196
<210>69
<211>247
<212>DNA
<213>人工序列
<220>
<223>IVS-654内含子247bp
<400>69
gtgagtctat gggacccttg atgttctttt aatatacttt tttgtttatc ttatttctaa 60
tactttccct aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc 120
accattctaa agaataacag tgataatttc tgggttaagg taatagcaat atttctgcat 180
ataaatattt agtccaagct aggccctttt gctaatcatg ttcatacctc ttatcttcct 240
cccacag 247
<210>70
<211>14667
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(1)..(14667)
<223>CFTR基因外显子19
<220>
<221>misc_feature
<222>(12191)..(12191)
<223>3849+10kb C至T突变位点
<400>70
gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc 60
tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat 120
taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga 180
gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt 240
aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag 300
atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt 360
aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag 420
tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt 480
atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc 540
ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc 600
ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt 660
gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg 720
attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta 780
aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca 840
gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga 900
gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta 960
atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat 1020
catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta 1080
gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat 1140
aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc 1200
tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta 1260
aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt 1320
ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt 1380
agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta 1440
ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta 1500
tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc 1560
agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt 1620
ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca 1680
gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga 1740
caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac 1800
agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct 1860
ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac 1920
tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa 1980
tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc 2040
ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat 2100
aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat 2160
taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg 2220
aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc 2280
taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa 2340
gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt 2400
tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc 2460
tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg 2520
ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag 2580
gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac 2640
aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt 2700
cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt 2760
attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat 2820
tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc 2880
aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt 2940
gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa 3000
acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc 3060
atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa 3120
agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa 3180
tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct 3240
atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct 3300
caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg 3360
cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc 3420
caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa 3480
tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc 3540
tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct 3600
atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga 3660
gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct 3720
ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca 3780
accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc 3840
caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct 3900
ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag 3960
gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag 4020
ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac 4080
agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc 4140
agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag 4200
cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg 4260
aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca 4320
aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat 4380
tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc 4440
acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa 4500
gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca 4560
tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg 4620
ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc 4680
tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc 4740
tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag 4800
aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca 4860
atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat 4920
gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg 4980
gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc 5040
caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga 5100
aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca 5160
tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct 5220
attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa 5280
taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact 5340
gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt 5400
gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt 5460
gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt 5520
ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt 5580
tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg 5640
tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc 5700
ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg 5760
atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa 5820
cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt 5880
tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg 5940
aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt 6000
tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt 6060
ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt 6120
tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt 6180
gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca 6240
tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa 6300
aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt 6360
ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt 6420
ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt 6480
atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa 6540
gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct 6600
tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc 6660
aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa 6720
attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt 6780
atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca 6840
ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga 6900
aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt 6960
tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta 7020
attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag 7080
gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa 7140
gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg 7200
attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc 7260
cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt 7320
tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca 7380
tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt 7440
atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt 7500
ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt 7560
ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac 7620
tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt 7680
gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg 7740
ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca 7800
ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt 7860
tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa 7920
taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt 7980
ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac 8040
ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa 8100
ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa 8160
ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg 8220
acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc 8280
tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac 8340
ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac 8400
ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa 8460
ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt 8520
ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat 8580
gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct 8640
tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca 8700
aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat 8760
gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt 8820
ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc 8880
ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga 8940
atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt 9000
ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt 9060
tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct 9120
cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg 9180
ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt 9240
tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag 9300
cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat 9360
catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg 9420
ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc 9480
ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata 9540
ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta 9600
tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag 9660
tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc 9720
ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag 9780
tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc 9840
tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga 9900
gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca 9960
gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac 10020
tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc 10080
tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat 10140
ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag 10200
gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg 10260
ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta 10320
ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat 10380
tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca 10440
cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt 10500
tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg 10560
tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata 10620
agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat 10680
tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc 10740
ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct 10800
gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg 10860
gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc 10920
gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat 10980
aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag 11040
cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc 11100
aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa 11160
atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct 11220
gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta 11280
atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct 11340
gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg 11400
aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat 11460
actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac 11520
ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt 11580
ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt 11640
cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg 11700
ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga 11760
tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact 11820
taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa 11880
gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa 11940
acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg 12000
ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac 12060
acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt 12120
gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt 12180
attaaaatgg cgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt 12240
acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga 12300
tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag 12360
ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag 12420
aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag 12480
actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca 12540
ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa 12600
ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct 12660
aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt 12720
agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg 12780
atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt 12840
acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa 12900
aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt 12960
gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga 13020
ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat 13080
ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact 13140
ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt 13200
gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga 13260
ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg 13320
attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat 13380
ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt 13440
accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa 13500
acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat 13560
agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat 13620
tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga 13680
aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa 13740
aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca 13800
gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc 13860
tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc 13920
tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat 13980
ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga 14040
aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta 14100
ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc 14160
tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg 14220
tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta 14280
ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat 14340
gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag 14400
taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc 14460
tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc 14520
aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat 14580
ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga 14640
agtgatccca tcacttttac cttatag 14667
<210>71
<211>14667
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(1)..(14667)
<223>19含3849+10kb C至T突变的CFTR外显子
<220>
<221>misc_feature
<222>(12191)..(12191)
<223>3849+10kb C至T突变
<400>71
gtgagatttg aacactgctt gctttgttag actgtgttca gtaagtgaat cccagtagcc 60
tgaagcaatg tgttagcaga atctatttgt aacattatta ttgtacagta gaatcaatat 120
taaacacaca tgttttatta tatggagtca ttatttttaa tatgaaattt aatttgcaga 180
gtcctgaacc tatataatgg gtttatttta aatgtgattg tacttgcaga atatctaatt 240
aattgctagg ttaataacta aagaagccat taaataaatc aaaattgtaa catgttttag 300
atttcccatc ttgaaaatgt cttccaaaaa tatcttattg ctgactccat ctattgtctt 360
aaattttatc taagttccat tctgccaaac aagtgatact ttttttctag cttttttcag 420
tttgtttgtt ttgtttttct ttgaagtttt aattcagaca tagattattt tttcccagtt 480
atttactata tttattaagc atgagtaatt gacattattt tgaaatcctt cttatggatc 540
ccagcactgg gctgaacaca tagaaggaac ttaatatata ctgatttctg gaattgattc 600
ttggagacag ggatggtcat tatccatata cttcaggctc cataaacata tttcttaatt 660
gccttcaaat ccctattctg gactgctcta taaatctaga caagagtatt atatattttg 720
attgatattt tttagataaa ataaaaggga gctgaaaact gaattgcaaa ctgaatttta 780
aaactttatc tctctgtggt taattgcaaa cacagataca aaaatataga gagagataca 840
gttagtaaag atgttaggtc accgttacta acactgacat agaaacagtt ttgctcatga 900
gtttcagaat atatgagttt gattttgccc atggatttta gaatatttga taaacattta 960
atgcattgta caaattctgt gaaaacatat atataggatg tgcgaaaagt ccctgtgtat 1020
catgtgaaat ggcttaaaac agaacaccat aggtattcat atcagtgaat accataggta 1080
gctgaaagtg ttttttcctg gggtcgccaa gatgaatgcc aaaagtgata tcattattat 1140
aaacaatagc cagaataggt tggtataaac ctggtagaaa gccttgataa attgactttc 1200
tctcctcctg acatcctgcc acccctttgc tttgctgatg ctcatttgtc cactaaatta 1260
aactcaagca agccctagta aagtaataga atttgtggag tcctcattag tataggaagt 1320
ttccctgatg tgagattagt aattagagat gtagcaaaat gagaaagaag taatatgctt 1380
agatatttca ttttctctga acctgtatat acaaaatagg ccatgcgtgt tcagtaacta 1440
ttcactgcaa ggcactctct aggtactttg ggggaattgg aaattactca cataaggcta 1500
tggattgtgc catttgtcaa aagacaaaat gacaacaaat ttagtttaaa gacctcagtc 1560
agctttattt tctattctag atttggacag tccttcattt cacaaattgg agtaagtgtt 1620
ccaataagtt gagcaaagga gcttggcttt atagacccaa aaaaagggcc aaaggaagca 1680
gaaacaaaga acaataagag aattggtcat ttcaaagtta cttttcttga aaggtgggga 1740
caaggagaca gaataataga aaagtcactg attggttaac attggattaa gaattaaaac 1800
agaggaaact ttaagattga agtttgaaac tgacttgttt gggaaatcag gctgtcttct 1860
ttcttgattt cttagaaggc cggataacaa ctgagttttg ctttggtgaa catgggtgac 1920
tccattttta cttttagtct ggtctgttga ggcctcgtga gagagcttaa tctaaaacaa 1980
tgacttccta taatttttgt ttgacacatc caaagaggga ctctaatatt tattgagagc 2040
ttatcatatc ttaagtactg tttaaacact tttatttgct attacatttg atcttattat 2100
aactctaaag gcagaaatga ttgcttttat tttccacaat ggaggaaact gaggttcaat 2160
taagtgagta aggaagcagg gatcttaaac ccagatacca ttgctcctct ttaaaggtgg 2220
aagaacagaa aacatggggc aggggaagag agaaagtttc tgtcccagga catgataatc 2280
taaaagggaa aacgtaagat ccactgaaac ctgaggcaga tttattgtgg caataacaaa 2340
gcttaagttt cacagacctt catttgcctg agccaacttt gaaggccatg tatctaattt 2400
tgtttttata attctataat ctttattctt gaaaagagcc ctccctccaa atttacaagc 2460
tttgggcccc caaaatcctt gaaatgccct tgaataagag atatccaggt aaatgctatg 2520
ggaattcaga ggaggaagca gttagtatca gttggcggag agttaggcta ttaagagaag 2580
gttttatata ggaagtggca tttagaatga agctttgaga actgagctgt gtatttgaac 2640
aagtaaaggt ggtgttgcag aattttgctc cttagttcta ttaaaaaccc gggttcttgt 2700
cacatgatcc ggaaaattta ggcacacaga tacattgaag catgagtaga gcaggatttt 2760
attgggcaaa aaggaaaaaa agaaaactca gcaaatcgag atggagtctt gctcacagat 2820
tgaatcccag gccaccacaa aggaactgaa gagatcgggc ttctcccctg cataaggtgc 2880
aaattcccca tggctccacc cacttcccct tagtgtgcat gtggggctcc agtccacggt 2940
gggcatgccc agacaagcct tgggcaggtt ccctcatctg tgcaaaagca tctgatgtaa 3000
acacttgagg ggtggttcgg agattctctg ggaccctttt attttcttat ctgcctaggc 3060
atttggctgt ctcagtgggt gggaaagggt gctccaggca aagggcataa catgaggcaa 3120
agggcatgca cagaaaacag tgactggttc agtcaggttg ggggatgcca aaggaagtaa 3180
tgggagacaa gattggagca agatagataa gagattgtgg attttttttc ttttttatct 3240
atataaatac agagacaggg tctcactatg ttgcccaggc tggtctcaaa ctcctggcct 3300
caagtgatcc tcccacctca tcctcccaaa gtgctaggat tacaggcatg aggcactgtg 3360
cccaacctcc aattttggat tttgagagct aaagcaatat agtcgaaaac tcagataatc 3420
caggtagatt ttgctattag gtgctatttg gttcctggta cagagctaaa acccttggaa 3480
tttcctaagt gataagagct acaggagcat cttttgttat atgtttcccc ccctagttcc 3540
tgaaatagct ctagagaaat acaggtgaat aacatccttt gttattcata tcaagcccct 3600
atcaaccata ccccagtttc tatttatgaa gtggcttttg ggaagtccct aaagacagga 3660
gtggggaaag gctggttgtc agggggatgg gttgaaactt tcatcttccc cccttgacct 3720
ccagggaggg atgagtggct gaaaattgtg taaaatcaac aatggccagt gatttaatca 3780
accatgccta tgtaatgaag ccacccgata agccttaact ggaacttttt ggagagcctc 3840
caggctggtg aagacattga ggtgctcaga aggtggtatt ccagagagag cacagaatct 3900
ctgttcccct tcccacattc attttgctat gcatctctcc catctggctg ttcttgagag 3960
gtatccgttt ataataaact ggtaacctag taagtaaact gttaccctga gttctgtgag 4020
ccattctagc aaattatcaa acctaaagag ttcatggata cgtgcaattt acagatgcac 4080
agtcagaagc acagatgaca atctgggctt gccattggca tttgaagtgt gttgggaggc 4140
agtcttacag gaatgagccc ttatcctgtg gggtctatgc taataacaga cagttgtcag 4200
cattgcttgg tgtcgaaaac ccacattgtt ggtgtcagaa gtattgtcag taggataggg 4260
aaaacagttt gttttctttt tttagtggtc tttggtcatc tttaagagca gggcttctca 4320
aagtgtggtc cttgaaccag catcacctgt accacgtaag aacttatgag aaatgttcat 4380
tcttgggccc caacaaagaa ttaaaaattc tgagggtgtg aacggggtct gagtttcagc 4440
acaacttccc gaccatgctg atgcattctt gcccaagcat gaaagccctc ccttgtttaa 4500
gaaggccatt agggccgggt gtggtggctc atgcttgtaa tcgagcactt tgagaggaca 4560
tagtgggagg atcacttgag ccctggagtt ctagacaagc ctgggcaaca tggcaaaatg 4620
ctgtctccac aaaaatcaca aaaattaggt gggcgtgtgt tgtgtgccta taggcccagc 4680
tacttaggag actgaggcag gaggatcgct tgagcccagg agattaaggc tgcagcgagc 4740
tgtgatggca ccactacagc ctggatgaca gagtgagaca ctgtctcaaa aaaaaaaaag 4800
aaaaagaaaa agaaaaaaga aaggaaaatg aaaaagaacg ccattaggta taaaggagca 4860
atggtaaaag accagttgca aaaggttagg gaatgggtgg ttactgaaat aagaagctat 4920
gtagaacact agtgttggtg gcaggaagta gaaagcaaga gcactgctct gtgggggatg 4980
gtcatagcaa atgcaatatg gaggcatttg cctctgcact gaggagaaaa ctatcttttc 5040
caagatagga ggaaaggaga taagtggaat taaagagaac ctttgagcac agagttggga 5100
aactgaaggt atttgtgttg tgctccctca atcttttaat tcaactataa gctaaaccca 5160
tgaaacttga gtagtttcag ttatctgact tttttcttct cttttgatac agtgttggct 5220
attctgggtc ttttgcctct ctttatgtac ttaagaatca gtttgccaat gtatgcaaaa 5280
taactggctg ggattttgat tgtgattggc ttgaatctat agatggagtt gggaaggact 5340
gacatcttga caatgttgaa gcttcctatt catcattatg aaatatttct ccatttgttt 5400
gattctttga tttcttttat cagaatttag ttttcctcat atagtctttt aaaatatttt 5460
gttatatttt gttcaagtat tttgtttttg aggaatgcca atgtaaatgg tattgtgatt 5520
ttaatttcaa attccaattt ttcattgctg ttatatagga aaatgatttt ttttgcatgt 5580
tagccttata tctttcaact ttgctataat caattattga tagtttcaag gattttttgg 5640
tcaattattt tgaatcttct acatagatta tcatcatctg aacttagttt tatttcttcc 5700
ttcccaatct gtataccttt atctcctttt cttatttcat tagctaggac ttccagtatg 5760
atgttgaaag tagtggtgag aggggatatc ttggtcttgt tcttgatctt agtgggaaaa 5820
cttcaagttt cttatcatta agtatgattt tagctggagg gtttttgtag aagttttttt 5880
tttttaagtt gaagaagtct ccttctattt ttagtttgct gatttttaaa aagaatcagg 5940
aatgggtgtt aaattttgtg aaatgctttt ctgcaactat tgatttgagc actttatttt 6000
tcttctttgg cttgttgatg tgaagtacat taattgattt ttgaatgctg aatcaacctt 6060
ttgtacctga gattaatccc gtttggttgt ggtatataat tatttgtata catgttgagt 6120
tcgatttgct aatacttttt gagaattttt gcattggtgt tcatgaaaaa atattggtgt 6180
gtagtttttt gtgacatctt tatctgctta tggttttaag gtaatgctgg cctcatagca 6240
tgagttaggg agtatttcct ctacttttac atttgagaag agattgcaga gaattagtaa 6300
aattcctact ttaaatattt tgtggaattc accagtgaac ccatctggac ctggtgcttt 6360
ctgttttgga aggtcattaa ttattttaaa atagatatag gcctattcag attacctatt 6420
ttttctcatg cgagttttag cagattgtct ttcaaggaat tggtctattt catttaggtt 6480
atcaaatatg tcaacgtaga gttattcata gtattctttt attatccttt taatgtgcaa 6540
gggatctgta gtgatgtccc cttttttgtt ttattgatat tagcaatttg tgtcacatct 6600
tttattttgc tttgttagcc aggctagaga tatctctatt tttgatgttt ttgatgaacc 6660
aactttttgt tttattgatt ttctctgttg atttcgtgat ttcaatttca tgatttttaa 6720
attatgctta catttgattt aatttgatct tcttttgcta gttatccaag gtggaagctt 6780
atattgttaa gatccttttg cattcttatg cattcaatga tgtaaatttc cctctaagca 6840
ctgctttttc tgcatctcac aaatattcat gagttgtatt ttcatgttca tttagtttga 6900
aatattttta aatttctctt gatatttctc ttttgaccca tgtgttactt agaagtgtgt 6960
tgtttaatca ccatttttaa aaattttcta gctatctttc tgttattgat ttctagttta 7020
attccattgt ggtctgagag catatattgt ataattttaa tttttataaa atttgttaag 7080
gtgtgattta tggcccagaa tgtggtctat cttggtgaat gttccatgta agctttggaa 7140
gactgtgtat tctgctatat ttgaatgagg tagtctatag acatcaatta tgtccagttg 7200
attgatggtg ctgttgaatt caactatgtc cttactgatt ttccacctgc tagatctgtc 7260
cattctttgc agagggacac tgaagtctcc aactctagta gtgaatattc tatttcttgt 7320
tacagtttta tcaacttctg cttcatgtct tttgatgctt tgttgctaga aacatacaca 7380
tgaagaattg gtatgtcttt tggagcatga cccatttatc ctcatataat gcccctcatt 7440
atttcctcgc cctgatgtct gttctctctg aaagaaatat agcctctcca ggtctctttt 7500
ggttggtgtt aaaatgactt aactttcttt atccccctta cttttagttt atatgtggtt 7560
ttaaatttaa agtgggtttc ttgtagacag caaatagttc agagttgttt ttcgatccac 7620
tttgacaatc tttgtctttt aattggtata tttggactat tgatatttta agtgattatt 7680
gatatagtta gataaacatc tactatattt attactgttt tctgtctgtt acactacttg 7740
ttctttgttt atatttttat tgtctactct ttttctttcc attgtggttt taatcgagca 7800
ttttatatgt ttccattttc ttttcttagc atagtaattc ttctttaaaa aaacattttt 7860
tagtggttgc ccctagagtt tgcaatatac atttacaact aatctaagtc cattttcaaa 7920
taatactaaa taatttcatg tgtagtgcaa gtacctttta ataataaaac actcccagtt 7980
ccaccttcca gtctcttgta ttatagctat aatttagttc acttacatat atgggtatac 8040
ctaagtatat acattatcat atttatgatt gaatatattg atgaaattat tttgaaaaaa 8100
ctgttatcgt taaatcaatt aagagtaaga aaaatagttc taattttatt ataaaatgaa 8160
ataccttcat ttattcattc tctaatacac tttctttctt tatgtagatc caagtttctg 8220
acctgtataa ttttcctttt ctctcttcag cttctttgaa catttcttac cagccagacc 8280
tactgacaac aattttcccc aatttttgtt tgtctgatag agactttatt tcttcttgac 8340
ttttgaagaa taattccaca gggcacagaa ctctagattg gtgatttctt cccctcaaac 8400
ccttaaatat ttcattccac tgccttcttg cttgcattgt ttctgagaag ttagatataa 8460
ttcttatctt tgcctttcta taggtaagat gttttttcct ctggcttcta tcaagatttt 8520
ttctttatga acatgatatg cctttctttt tgaacatgat atgcctttct ttttgaacat 8580
gatatgcctt tgtgtcggat tttttttggc attattctgc ttggttttct ctgagtttct 8640
tggatatgtg gtatggtatc tgacactaat ttggaaaaat tctcagtcat tattgcttca 8700
aatatttctt ctgttctttt ttttccttta ttctccttct ggtattccca ttacatgtat 8760
gttacagttt ttgtagtcat cccgctgttt tggatattct gtttttttca gttttttttt 8820
ccttcgcatt tcagtgttgg aagtttctat tgacatattc tcaacctcag agattctttc 8880
ttcagctgtg ttcagtctac caatgagtcc atcaaaggca ttttacattt ttattacaga 8940
atttttgacc tatagaattt cttttgattc catctttgaa tctccatttc tcttctgctt 9000
ttcatctgtt cttgcatgtt gcctactttt tccatgaaaa cctttagctt tttttttttt 9060
tctttttgag gtggagtctc actgttgccc aggctggagt gcagtggtgt gatcttggct 9120
cactgcaacc tctgcctcct gggttcaagt gattctcctc ctcagcctcc caagtagctg 9180
ggattacagg tgcctgccac catgcctgag taatttttgt atttttagta gagatggggt 9240
tttatcatgt tggccaggcg ggtcttgaac tcctaacctc aagtgatctg cccaccttag 9300
cctcccaaat tgctgggatt ataggtgtga gccaccatgc cctgccttta gcatgttaat 9360
catagttgtt ttaaattcct gatctgttaa ttccaacatc cctgtcatat ctgactgtgg 9420
ttctgatgct tgctctgtgt tttcaaatgg tgtttttttt tttttgcctt ttagtaagcc 9480
ttgtaatttt ttattgaaag gtggacatga tgtgctgggt aaaaggaact gtagtaaata 9540
ggcctttagt aatgtactgg taggtgtagc agagggtgag ggaagtattc tgtagtccta 9600
tgattaggtt ttagtctttt agtgagcctg tgcgcctgca gcttggaagc acttgtgaag 9660
tgttttttca ccccttttgg tgggacatag tgactagtgt gagcgggagt tgagtatttc 9720
ccttccccta ggtcagttag gctctgaaaa aaccctgata ggttaggcat ggtaaaatag 9780
tctcttttga gggcaggcat tgttataaga atagaatgct ctggggccag gtgcggtggc 9840
tcacgcctgt aatccccgca ctttgggagg ctaaggcagg tggatcacct gaggtcagga 9900
gttcgagacc agcctggcca acatggtgaa accccgtctc tactaaaaat acaaaaatca 9960
gccaggtgtg gtggcacaca cctataatcc cagctactca ggaggctgag gcaggagaac 10020
tgcttgaacc cagtaagtgg aggttacagt gacccaagat tgtgccactg cagtctagtc 10080
tgggtgacag agcaagactc cgtctcaaaa aaaaaagaat gctctggcat atttgaaaat 10140
ggttactttt cccttttttt ctctgatctt cactgtgaga acctggtaag catcctatag 10200
gcaaaattca taaaagtata gaagtcggcc agtgacttgg acccacttgg aattttcttg 10260
ctctcacatc atgcacactg aatctccagc aatttttcac ttacagttta ggttttccta 10320
ccctactact ggttctctca gaggtttctg cttattggtt tctgttttgt aagttgtgat 10380
tctctgtacc taactgcctg tctcccattt tggggggcag tggtttgccc tgtgacctca 10440
cttctctgac agatctaaga aaagttgttt atttttcagt gtgctctgct ttttacttgt 10500
tacgatgaag ccaaccactt tcagaatttc tacaaaccag atcagaatct ggaagtcctg 10560
tttttttatt ttttttatcc ctttgtttag catgttacct atcttaacac attttaaata 10620
agtgaatgca tagcttatat ctacttctag gttatatgct tccttagaat aggaattgat 10680
tcttaaaatg tcgttctgct cacgcctgta attccagcac tttgggaggc caaggcaggc 10740
ggatcacttg gggtcaggag ttcaagacca gcctggtcaa catggtaaaa ccctgtgcct 10800
gcaaaaaata caaaaattag ctgggcatgg tggtggccat ctgtaatccc agctactagg 10860
gaagctaagg catgagaatc acttgaacct gggaggtgga ggttgcagtg agctgagatc 10920
gcgccactgc actccagcct gggtgacaag agcaaaactc catctcataa ataaataaat 10980
aaataaataa ataaataata aaaataaaaa aataaaataa aacaaaaatt ttattctgag 11040
cagtctctga agaatataaa ttctactgcc ttgcctttag aacttataac agcatctcgc 11100
aaactatcac aagatgctcc aaacatactt cttatgtgct gaattaagaa gtcaactcaa 11160
atttagtata ctagtaatat ttttggatat cccaaaacac tgccagctca gctttaggct 11220
gcccttcttg ggggggaaaa aagcagttga aatttaggac ttaagtgggc atctcgttta 11280
atttttaatg gatttctatg ttgttggtta tggtgaagag gtgaaaagaa taaatattct 11340
gtgcagaaaa attattcagt cttcatgtga aaacactttg tccatagcaa ttactttatg 11400
aaaaagatgt ggtattactt tctttgctct taactgagac ctttaattta aagaacctat 11460
actttacaag tttttatttt caatgcatga aaaatgtagc agctatttca caacctttac 11520
ttttaaaatc catttttctt tttaatctca aatagttttt tcttaaaacc ttttgacttt 11580
ttatctaaat tgtaatagcc agagcacctt cccacaacta gaatatctca tcctttttgt 11640
cttttctttt tcctctcaaa atgcctactg ggaacttaat ttggagtcag attcttcatg 11700
ataaatctgg acttaatcaa aattcctcat atggtatatt gtatatatca cagtactgga 11760
tagtcctctg attaaataga tatttgatag tactttaagg tctatacttt tggatgaact 11820
taactgcttt ctccatttgt agtctcttga aaatacagaa atttcagaaa taatttataa 11880
gaatatcaag gattcaaatc atatcagcac aaacacctaa atacttgttt gctttgttaa 11940
acacatatcc cattttctat cttgataaac attggtgtaa agtagttgaa tcattcagtg 12000
ggtataagca gcatattctc aatactatgt ttcattaata attaatagag atatatgaac 12060
acataaaaga ttcaattata atcaccttgt ggatctaaat ttcagttgac ttgtcatctt 12120
gatttctgga gaccacaagg taatgaaaaa taattacaag agtcttccat ctgttgcagt 12180
attaaaatgg tgagtaagac accctgaaag gaaatgttct attcatggta caatgcaatt 12240
acagctagca ccaaattcaa cactgtttaa ctttcaacat attattttga tttatcttga 12300
tccaacattc tcagggagga ggtgcattga agttattaga aaacactgac ttagatttag 12360
ggtatgtctt aaaagcttat ttgcgggaag tactctagcc ttattcaaca gatcactgag 12420
aagcctggaa aaacaaatcc cggaaactaa ttattatgtg ccagttatat aaacaagaag 12480
actttgttgg gtacaaacca gtgattcctt gcctttgaaa aatgtgtcag atatcatgca 12540
ttaccagcag ttcaatgata taaggaaacc agagtaatag ctaaaacctt taaagctaaa 12600
ccaaagattt acaaattgcc tcttcatcca gtctttccca acctaaaaac tgagttctct 12660
aaaaatttta gtattttttt ctgaagaaaa gggaacatgg acatttatct aatcctcatt 12720
agaaatctga ctaatgataa caaggattta gacctcaagc acttcttacc aaaattcttg 12780
atatgacctt atagcaaatt actttcacct gttgaacttt cctttctttt attcccctgt 12840
acctcacctg cactgggcat attcaagttg cttatacaac actttactat tgtgttagaa 12900
aaatcatgac acatgatgaa tgtgtttgtg caacatgagc tgattcataa atgaaaatgt 12960
gcattgaaat tccacaatat tttaaaatta ggagtttatc tagcaattga acaaaattga 13020
ttaaatccat tatttgttag atcagctaaa ttacataagt tcattcatct gctcataaat 13080
ccatccattc ttccatctgg ctatccctta gtcaattcaa ataaatattt atggggcact 13140
ttgggtaagc caggtgctaa gaattcaatg caaaacaaga tagactcccc tgtccttgtt 13200
gaacttatat ttttggtaca aacaaaagca ataatcaaga aaaaataaaa aaagtactga 13260
ttgtgattaa taatatgaag aaattcaaca gagtattgta cttaacattt gattgatctg 13320
attttctcag ttgtctgaga acaaacattt gtgaaaatct cattgtagag ttcttacgat 13380
ggataggggg tcaactgtgt cattattgct tatcagctta tcccaaagac ctagtttatt 13440
accagattgc aaatagtgtt caataaatta ttcttattaa gggttgttat gtactctaaa 13500
acatttattg tggtcccttc actggttctg gtttacaaac ttacttttct atgatgacat 13560
agtatagaaa ttgagagtga atatttagaa gttcattttt attatatatt tttgaagtat 13620
tgatatgtag tgaattagaa atttaaaaag aaaacaaaac tgtccttcac tacagattga 13680
aaagcattat actaaaagac catttgctca gttatagtat ataaaggcca aatgacttaa 13740
aaacaaatta tgtaaggaga aggaaacaac catttattca gtgccactaa ctgtcagcca 13800
gttttttcag tggtcagtta atgactgcag tagtgttcta ccttgctcaa agcaccctcc 13860
tcaagttctg gcatctaagc tgacatcaga acacagagtt ggggctctct gtgggtcacc 13920
tctagcactt gatctcctca tgcagtgcat ggtgctctca cgtctatgct atgttcttat 13980
ggtctttagg taacaagaat aattttcttt cttttcctta ctatacattt tgctttctga 14040
aattcccttc tcgccaatcc aggtgaatgt cagaatgtga tttgacaact gtccaaagta 14100
ctcattcact gaggagtggt aaggccttcg cccaacctgc cttctctggg aatatactgc 14160
tgcctgaaca tatcattgtt tattgccagg cttgaacttc accaaattaa tttattaggg 14220
tcaacatcta aatattagaa ctatttcaga ttaattttta agtcgtatcc actttgggta 14280
ctagatcaaa ttgcaggtct ctgcttctgg cttgagccta tgtttagaga tgatgtgcat 14340
gaagacactc tttgcttttc ctttatgcaa aatgggcatt ttcaatcttt ttgtcattag 14400
taaaggtcag tgataaagga agtctgcatc aggggtccaa ttccttatgg ccagtttctc 14460
tattctgttc caaggttgtt tgtctccata tatcaacatt ggtcaggatt gaaagtgtgc 14520
aacaaggttt gaatgaataa gtgaaaatct tccactggtg acaggataaa atattccaat 14580
ggtttttatt gaagtacaat actgaattat gtttatggca tggtacctat atgtcacaga 14640
agtgatccca tcacttttac cttatag 14667
<210>72
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>72
gtcttactcg ccatttta 18
<210>73
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<220>
<221>misc_feature
<222>(10)..(10)
<223>3849+10kb C至T突变
<400>73
gtcttactca ccatttta 18
<210>74
<211>3733
<212>DNA
<213>Mus musculus
<220>
<221>misc_feature
<222>(1)..(3733)
<223>野生型Mus musculus肌养蛋白内含子22、外显子23和内含子23的序列
<220>
<221>内含子
<222>(1)..(913)
<223>内含子22
<220>
<221>外显子
<222>(914)..(1126)
<223>外显子23
<220>
<221>内含子
<222>(1127)..(3733)
<223>内含子23
<400>74
gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca 60
tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata 120
gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt 180
ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa 240
agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag 300
tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa 360
tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa 420
caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc 480
tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt 540
ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat 600
taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc 660
acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa 720
tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat 780
atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt 840
accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct 900
atttaatttt gag gct ctg caa agt tct ttg aaa gag caa caa aat ggc 949
Ala Leu Gln Ser Ser Leu Lys Glu Gln Gln Asn Gly
1 5 10
ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct 997
Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro
15 20 25
tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg 1045
Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly
30 35 40
cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta 1093
His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu
45 50 55 60
gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146
Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln
65 70
taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta 1206
cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca 1266
acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata 1326
aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta 1386
aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca 1446
tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc 1506
actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc 1566
ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag 1626
actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca 1686
taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt 1746
caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc 1806
atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat 1866
ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt 1926
taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt 1986
tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact 2046
ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa 2106
aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct 2166
ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg 2226
ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa 2286
ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt 2346
gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta 2406
acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta 2466
atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg 2526
ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt 2586
tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc 2646
tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg 2706
tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa 2766
ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta 2826
agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt 2886
ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt 2946
ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc 3006
atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac 3066
atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat 3126
aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat 3186
ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt 3246
taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac 3306
tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg 3366
agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag 3426
ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat 3486
aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat 3546
gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac 3606
aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc 3666
atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt 3726
attccag 3733
<210>75
<211>3733
<212>DNA
<213>Mus musculus
<220>
<221>misc_feature
<222>(1)..(3733)
<223>mdx Mus musculus肌养蛋白内含子22、外显子23和内含子23
的序列
<220>
<221>内含子
<222>(1)..(913)
<223>内含子22
<220>
<221>外显子
<222>(914)..(1126)
<223>外显子23
<220>
<221>misc_feature
<222>(941)..(941)
<223>mdx C至T无义突变
<220>
<221>内含子
<222>(1127)..(3733)
<223>内含子23
<400>75
gtctgtggac atttgaatat cataaataac aaagaacatg tcttatcagt caagagatca 60
tattgatata ttaaacttaa ggtaataatg aaaaagtaaa gataataatg aaaaatcata 120
gattatgagt tggaaaaata aacagaacaa tttgaccaaa aacatgactt tttcttattt 180
ttttctatat attattttat aaatatacag acataaatag atatatattt ttaaattaaa 240
agtactgtat taaaggaaag gtataatttc atttcatatt tagtgacata agatatgaag 300
tatgattatt aaaattaaat cacattattt tattataatt actttatttt taattcctaa 360
tttctttaag cttaggtaaa atcaatggat ttatataatt agttagaatt taaatattaa 420
caaactataa cactatgatt aaatgcttga tattgagtag ttattttaat agcctaagtc 480
tggaaattaa atactagtaa gagaaacttc tgtgatgtga ggacatataa agactaattt 540
ttttgttgat tctaaaaatc ccatgttgta tacttattct ttttaaatct gaaaatatat 600
taatcatata ttgcctaaat gtcttaataa tgtttcactg taggtaagtt aaaatgtatc 660
acatatataa taaacatagt tattaatgca tagatattca gtaaaattat gacttctaaa 720
tttctgtcta aatataatat gccctgtaat ataatagaaa ttattcataa gaatacatat 780
atattgcttt atcagatatt ctactttgtt tagatctcta aattacataa acttttattt 840
accttcttct tgatatgaat gaaactcatc aaatatgcgt gttagtgtaa atgaacttct 900
atttaatttt gag gct ctg caa agt tct ttg aaa gag caa taa aat ggc 949
Ala Leu Gln Ser Ser Leu Lys Glu Gln Asn Gly
1 5 10
ttc aac tat ctg agt gac act gtg aag gag atg gcc aag aaa gca cct 997
Phe Asn Tyr Leu Ser Asp Thr Val Lys Glu Met Ala Lys Lys Ala Pro
15 20 25
tca gaa ata tgc cag aaa tat ctg tca gaa ttt gaa gag att gag ggg 1045
Ser Glu Ile Cys Gln Lys Tyr Leu Ser Glu Phe Glu Glu Ile Glu Gly
30 35 40
cac tgg aag aaa ctt tcc tcc cag ttg gtg gaa agc tgc caa aag cta 1093
His Trp Lys Lys Leu Ser Ser Gln Leu Val Glu Ser Cys Gln Lys Leu
45 50 55
gaa gaa cat atg aat aaa ctt cga aaa ttt cag gtaagccgag gtttggcctt 1146
Glu Glu His Met Asn Lys Leu Arg Lys Phe Gln
60 65 70
taaactatat tttttcacat agcaattaat tggaaaatgt gatgggaaac agatatttta 1206
cccagagtcc ttcaaagata ttgatgatat caaaagccaa atctatttca aaggattgca 1266
acttgcctat ttttcctatg aaaacagtaa tgtgtcatac cttcttggat tgtctgtata 1326
aatgaattga ttttttttca ccaactccaa gtatacttaa cattttaaca taataattta 1386
aaatatcctt attccattat gttcattttt taagttgtag atatgattta gctcacagca 1446
tacatatata cacatgtatt acatatgcat atattatata tatggcagac atatgttttc 1506
actaccatat ttcacttttg aattatgaat atatgtttaa tttctgccat atttccttcc 1566
ctacattgac ttctattaat ttagtatttc agtagttcta acacattaat aataacctag 1626
actcaataca gtaatctaac aattatattt gtgcctgtaa ttctaagtta gttaaattca 1686
taggttgtgt ttctcatagt tggccatttg tgaaatataa taatatccga aaagaaagtt 1746
caaaaatgtc atgacttcat atagagttat tgaaacagtg cccttacttt cattctggcc 1806
atgctagtga cttgatcatt cttgtatttt acagctaaaa cactaccaaa agtgtcaaat 1866
ccatgatcta catgtttgac tgaggctagc agcacttatt ccacccttat atgaagcctt 1926
taagagaaag tatatttgtt tgctattttt aacttcttga aggaacatac aatctttgtt 1986
tcaagagctc atcctctttc atgctagtaa attttggtgg cattgcatcc atgtctgact 2046
ctgaatctgt ttctgtctat cctgctccct aacactgtac catcttcctt tttgaaaaaa 2106
aaatattgaa ttattttatt tatttacttt ccaaagttgc tcctgcctgt tcctccttct 2166
ccaagttctt cagtcccccc tgctccccac cgatgagagg gaaaggtcct gaattcactg 2226
ggctccatgg gggtcctttt gcattttctt aaccttctta ataaaatagg ccttctagaa 2286
ttatatcata tacattgtga tatgacaaat gataaagtat attgttcaga gttttacctt 2346
gttcatattt gcaatgtccc cctgtcatgc tggatattct ttgattgggt atatttgcta 2406
acagattaag tatatttatc ttcgttaagc agtataactt attaagaaag aactctatta 2466
atatgagaaa taactaatga aacaccactc cacaggtgat ttcagccact ttatgaactg 2526
ctggaagcaa aaatgagatc tttgcaacat gaagcagttg ctcagttcat taaactgtgt 2586
tcaatatttc agccataaca tacattagag aatgatttat attgttcaaa catttggtgc 2646
tctatttttg catgacgtgg gattaaacac agcaccaaca atcaaacaat tgcaaagatg 2706
tattacaagt attttttctt tttaaaacag gaaagtatac ttatatttcc attgtccaaa 2766
ccatcatgaa agggatagag attactgaca caaatttaga gaaaggattt gagtggagta 2826
agaattaaat gaaccaaaga agaattaatg tattcatcaa gaagtcatgg aggtgaaatt 2886
ggccttgaat gataccacta aggagagaat gttgagatcc ttatatttag tcaattgttt 2946
ttaaatctgt agttattaac cacattttaa tcatattgaa agggaaattt tctgtgatgc 3006
atgtattttc aatataaatt ttagaaaaga agacaattat aacttgattt tgtgaattac 3066
atggaactaa agaaatgaca gatttacatt tgaaaattga ctgaactaaa gtacataaat 3126
aaaagtcata cagaaaaatg tgggaggtgc ttgtccattt ataaaggaca aaaatgccat 3186
ttgttgccta atcattattt cttattggtc agaccaataa gaaatcaaga gctttgactt 3246
taaaggtaag aaaatcttac cttaaaatcc ccaactgaag ggactgttta aactgtcaac 3306
tgcagaaaac aagttatgga agttcaggtt tagggaaact ataaacacac cataacattg 3366
agtttatgtg catagtttgt tttatgtaca gtgagagtaa attgttagta ttatcatgag 3426
ttgttttgaa acttcaaatt tctctagagg ggtatgattt aatgttctca agaggaacat 3486
aataaaacca tatctggtat tagtttttat ttttaacaat agcagacttc atacaccaat 3546
gttcacagtg tagaccataa aatgcagtct tagtaaaaat attattctct ataaagctac 3606
aatgagacct ccctcaaaca tacattgttt ttttttttct aacttatgtt tggatatatc 3666
atcatgatga actatgttaa aaacaatcag agcttagtaa tactttcata ttgctttttt 3726
attccag 3733
<210>76
<211>25
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<220>
<221>misc_feature
<222>(1)..(25)
<223>外显子23跳跃诱导性寡核苷酸
<400>76
aacctcggct tacctgaaat tttcg 25
<210>77
<211>1653
<212>DNA
<213>Hotaria parvula
<400>77
atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60
accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120
gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180
gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240
tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300
gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360
tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420
aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480
tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540
tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600
tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660
catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720
gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780
cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840
aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900
attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960
aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag gcaaggatat 1020
gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc 1080
gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa 1140
acgctgggcg ttaatcaaag aggcgaactg tgtgtgagag gtcctatgat tatgtccggt 1200
tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct 1260
ggagacatag cttactggga cgaagacgaa cacttcttca tcgttgaccg cctgaagtct 1320
ctgattaagt acaaaggcta tcaggtggct cccgctgaat tggaatccat cttgctccaa 1380
caccccaaca tcttcgacgc aggtgtcgca ggtcttcccg acgatgacgc cggtgaactt 1440
cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat 1500
tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac 1560
gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata 1620
aaggccaaga agggcggaaa gatcgccgtg taa 1653
<210>78
<211>17578
<212>DNA
<213>Homo sapiens
<220>
<221>内含子
<222>(1)..(13645)
<223>内含子9
<220>
<221>外显子
<222>(13646)..(13738)
<223>内含子9
<220>
<221>内含子
<222>(13739)..(17578)
<223>内含子10
<400>78
gtgagagtgg ctggctgcgc gtggaggtgt ggggggctgc gcctggaggg gtagggctgt 60
gcctggaagg gtagggctgc gcctggaggt gcgcggttga gcgtggagtc gtgggactgt 120
gcatggaggt gtggggctcc ccgcacctga gcacccccgc ataacacccc agtcccctct 180
ggaccctctt caaggaagtt cagttcttta ttgggctctc cactacactg tgagtgccct 240
cctcaggcga gagaacgttc tggctcttct cttgcccctt cagcccctgt taatcggaca 300
gagatggcag ggctgtgtct ccacggccgg aggctctcat agtcagggca cccacagcgg 360
ttccccacct gccttctggg cagaatacac tgccacccat aggtcagcat ctccactcgt 420
gggccatctg cttaggttgg gttcctctgg attctgggga gattgggggt tctgttttga 480
tcagctgatt cttctgggag caagtgggtg ctcgcgagct ctccagcttc ctaaaggtgg 540
agaagcacag acttcggggg cctggcctgg atccctttcc ccattcctgt ccctgtgccc 600
ctcgtctggg tgcgttaggg ctgacataca aagcaccaca gtgaaagaac agcagtatgc 660
ctcctcacta gccaggtgtg ggcgggtggg tttcttccaa ggcctctctg tggccgtggg 720
tagccacctc tgtcctgcac cgctgcagtc ttccctctgt gtgtgctcct ggtagctctg 780
cgcatgctca tcttcttata agaacaccat ggcagctggg cgtagtggct cacgcctata 840
atcccagcac tttgggaggc tgaggcaggc agatcacgag gtcaggagtt cgagaccaac 900
ctgaccaaca gggtgaaacc tcgtctctac taaaaataca aaaatacctg ggcgtggtgg 960
tggtgcgcgc ctataatccc agctactcag gaggctgagg caggagaatc gcttgaaccc 1020
aggaggcaga ggttgcagtg agccgagata gtgccactgc actccagttt gagcaacaga 1080
gcgagactct gtctcaaaac aaaataaaac aaaccaaaaa aacccaccat ggcttagggc 1140
ccagcctgat gacctcattt ttcacttagt cacctctcta aaggccctgt ctccaaatag 1200
agtcacattc taaggtacgg gggtgttggg gaggggggtt agggcttcaa catgtgaatt 1260
tgcggggacc acaattcagc ccaggacccc gctcccgcca cccagcactg gggagctggg 1320
gaagggtgaa gaggaggctg ggggtgagaa ggaccacagc tcactctgag gctgcagatg 1380
tgctgggcct tctgggcact gggcctcggg gagctagggg gctttctgga accctgggcc 1440
tgcgtgtcag cttgcctccc ccacgcaggc gctctccaca ccattgaagt tcttatcact 1500
tgggtctgag cctggggcat ttggacggag ggtggccacc agtgcacatg ggcaccttgc 1560
ctcaaaccct gccacctccc cccacccagg atcccccctg cccccgaaca agcttgtgag 1620
tgcagtgtca catcccatcg ggatggaaat ggacggtcgg gttaaaaggg acgcatgtgt 1680
agaccctgcc tctgtgcatc aggcctcttt tgagagtccc tgcgtgccag gcggtgcaca 1740
gaggtggaga agactcggct gtgccccaga gcacctcctc tcatcgagga aaggacagac 1800
agtggctccc ctgtggctgt ggggacaagg gcagagctcc ctggaacaca ggagggaggg 1860
aaggaagaga acatctcaga atctccctcc tgatggcaaa cgatccgggt taaattaagg 1920
tccggccttt tcctgctcag gcatgtggag cttgtagtgg aagaggctct ctggaccctc 1980
atccaccaca gtggcctggt tagagacctt ggggaaataa ctcacaggtg acccagggcc 2040
tctgtcctgt accgcagctg agggaaactg tcctgcgctt ccactgggga caatgcgctc 2100
cctcgtctcc agactttcca gtcctcattc ggttctcgaa agtcgcctcc agaagcccca 2160
tcttgggacc accgtgactt tcattctcca gggtgcctgg ccttggtgct gcccaagacc 2220
ccagaggggc cctcactggc ctttcctgcc ttttctccca ttgcccaccc atgcaccccc 2280
atcctgctcc agcacccaga ctgccatcca ggatctcctc aagtcacata acaagcagca 2340
cccacaaggt gctcccttcc ccctagcctg aatctgctgc tccccgtctg gggttccccg 2400
cccatgcacc tctgggggcc cctgggttct gccataccct gccctgtgtc ccatggtggg 2460
gaatgtcctt ctctccttat ctcttccctt cccttaaatc caagttcagt tgccatctcc 2520
tccaggaagt cttcctggat tcccctctct cttcttaaag cccctgtaaa ctctgaccac 2580
actgagcatg tgtctgctgc tccctagtct gggccatgag tgagggtgga ggccaagtct 2640
catgcatttt tgcagccccc acaagactgt gcaggtggcc ggccctcatt gaatgcgggg 2700
ttaatttaac tcagcctctg tgtgagtgga tgattcaggt tgccagagac agaaccctca 2760
gcttagcatg ggaagtagct tccctgttga ccctgagttc atctgaggtt ggcttggaag 2820
gtgtgggcac catttggccc agttcttaca gctctgaaga gagcagcagg aatggggctg 2880
agcagggaag acaactttcc attgaaggcc cctttcaggg ccagaactgt ccctcccacc 2940
ctgcagctgc cctgcctctg cccatgaggg gtgagagtca ggcgacctca tgccaagtgt 3000
agaaaggggc agacgggagc cccaggttat gacgtcacca tgctgggtgg aggcagcacg 3060
tccaaatcta ctaaagggtt aaaggagaaa gggtgacttg acttttcttg agatattttg 3120
ggggacgaag tgtggaaaag tggcagagga cacagtcaca gcctccctta aatgccagga 3180
aagcctagaa aaattgtctg aaactaaacc tcagccataa caaagaccaa cacatgaatc 3240
tccaggaaaa aagaaaaaga aaaatgtcat acagggtcca tgcacaagag cctttaaaat 3300
gacccgctga agggtgtcag gcctcctcct cctggactgg cctgaaggct ccacgagctt 3360
ttgctgagac ctttgggtcc ctgtggcctc atgtagtacc cagtatgcag taagtgctca 3420
ataaatgttt ggctacaaaa gaggcaaagc tggcggagtc tgaagaatcc ctcaaccgtg 3480
ccggaacaga tgctaacacc aaagggaaaa gagcaggagc caagtcacgt ttgggaacct 3540
gcagaggctg aaaactgccg cagattgctg caaatcattg ggggaaaaac ggaaaacgtc 3600
tgttttcccc tttgtgcttt tctctgtttt cttctttgtg cttttctctg ttttcaggat 3660
ttgctacagt gaacatagat tgctttgggg ccccaaatgg aattattttg aaaggaaaat 3720
gcagataatc aggtggccgc actggagcac cagctgggta ggggtagaga ttgcaggcaa 3780
ggaggaggag ctgggtgggg tgccaggcag gaagagcccg taggccccgc cgatcttgtg 3840
ggagtcgtgg gtggcagtgt tccctccaga ctgtaaaagg gagcacctgg cgggaagagg 3900
gaattctttt aaacatcatt ccagtgcccg agcctcctgg acctgttgtc atcttgaggt 3960
gggcctcccc tgggtgactc tagtgtgcag cctggctgag actcagtggc cctgggttct 4020
tactgctgac acctaccctc aacctcaacc actgcggcct cctgtgcacc ctgatccagt 4080
ggctcatttt ccactttcag tcccagctct atccctattt gcagtttcca agtgcctggt 4140
cctcagtcag ctcagaccca gccaggccag cccctggttc ccacatcccc tttgccaagc 4200
tcatccccgc cctgtttggc ctgcgggagt gggagtgtgt ccagacacag agacaaagga 4260
ccagctttta aaacattttg ttggggccag gtgtggtggc tcacacctaa tcccaacacc 4320
tggggaggcc aaggcagaag gatcacttga gtccaggagt tcaagaccag cctgggcaac 4380
atagggagac cctgtctcta caattttttt tttaattagc tgggcctgtt ggcactctcc 4440
tgtagttcca gctactctag aggctgaggt gggaggactg cttgagcctg ggaggtcagg 4500
gctgcaatga gccatgttca caccactgaa cgccagcctg ggcgagaccc tgtatcaaaa 4560
aagtaaagta aaatgaatcc tgtacgttat attaaggtge cccaaattgt acttagaagg 4620
atttcatagt tttaaatact tttgttattt aaaaaattaa atgactgcag catataaatt 4680
aggttcttaa tggaggggaa aaagagtaca agaaaagaaa taagaatcta gaaacaaaga 4740
taagagcaga aataaaccag aaaacacaac cttgcactcc taacttaaaa aaaaaaatga 4800
agaaaacaca accagtaaaa caacatataa cagcattaag agctggctcc tggctgggcg 4860
cggtggcgca tgcctgtaat cccaacactt tgggaggccg atgctggagg atcacttgag 4920
accaggagtt caaggttgca gtgagctatg atcataccac tacaccctag cctgggcaac 4980
acagtgagac tgagactcta ttaaaaaaaa aatgctggtt ccttccttat ttcattcctt 5040
tattcattca ttcagacaac atttatgggg cacttctgag caccaggctc tgtgctaaga 5100
gcttttgccc ccagggtcca ggccagggga caggggcagg tgagcagaga aacagggeca 5160
gtcacagcag caggaggaat gtaggatgga gagcttggcc aggcaaggac atgcaggggg 5220
agcagcctgc acaagtcagc aagccagaga agacaggcag acccttgttt gggacctgtt 5280
cagtggcctt tgaaaggaca gcccccaccc ggagtgctgg gtgcaggagc tgaaggagga 5340
tagtggaaca ctgcaacgtg gagctcttca gagcaaaagc aaaataaaca actggaggca 5400
gctggggcag cagagggtgt gtgttcagca etaaggggtg tgaagcttga gcgctaggag 5460
agttcacact ggcagaagag aggttggggc agctgcaagc ctctggacat cgcccgacag 5520
gacagagggt ggtggacggt ggccctgaag agaggctcag ttcagctggc agtggccgtg 5580
ggagtgctga agcaggcagg ctgtcggcat ctgctgggga cggttaagca ggggtgaggg 5640
cccagcctca gcagcccttc ttggggggtc gctgggaaac atagaggaga actgaagaag 5700
cagggagtcc cagggtccat gcagggcgag agagaagttg ctcatgtggg gcccaggctg 5760
caggatcagg agaactgggg accctgtgac tgccagcggg gagaaggggg tgtgcaggat 5820
catgcccagg gaagggccca ggggeccaag catggggggg cctggttggc tctgagaaga 5880
tggagctaaa gtcactttct cggaggatgt ccaggccaat agttgggatg tgaagacgtg 5940
aagcagcaca gagcctggaa gcccaggatg gacagaaacc tacctgagca gtggggcttt 6000
gaaagccttg gggcgggggg tgcaatattc aagatggcca caagatggca atagaatgct 6060
gtaactttct tggttctggg ccgcagcctg ggtggctgct tccttccctg tgtgtattga 6120
tttgtttctc ttttttgaga cagagtcttg ctgggttgcc caggctggag tgcagtggtg 6180
cgatcatagc tcactgcagc cttgaagtcc tgagctcaag agatccttcc acctcagcct 6240
cctgagtagt tgggaccaca ggcttgcacc acagtgccca actaatttct tatatttttt 6300
gtagagatgg ggtttcactg tgtcgcccag gatggtcttg aactcctggg ctcaagtgat 6360
cctcctgcct cagcctcgca aattgctggg attacaggtg tgagccacca tgcccgacct 6420
tctcttttta agggcgtgtg tgtgtgtgtg tgtgtgtggg cgcactctcg tcttcacctt 6480
cccccagcct tgctctgtct ctacccagtc acctctgccc atctctccga tctgtttctc 6540
tctcctttta cccctctttc ctccctcctc atacaccact gaccattata gagaactgag 6600
tattctaaaa atacatttta tttatttatt ttgagacaga gtctcactct gtcacccagg 6660
ctggagtgca gtggtgcaat ctcggctcac tgcaacctcc gcctcccagg ttgaagcaac 6720
tctcctgcct cagcctccct agtagctggg attacaagca cacaccacca tgcctagcaa 6780
atttttatat ttttagtaga ggaggagtgt caccatgttt gccaagctgg tctcaaactc 6840
ctggcctcag gtgatctgcc taccttggtc tcccaaagtg ctgggattac aggtgtgagc 6900
caccacgcct gcccttaaaa atacattata tttaatagca aagccccagt tgtcacttta 6960
aaaagcatct atgtagaaca tttatgtgga ataaatacag tgaatttgta cgtggaatcg 7020
tttgcctctc ctcaatcagg gccagggatg caggtgagct tgggctgaga tgtcagaccc 7080
cacagtaagt ggggggcaga gccaggctgg gaccctcctc taggacagct ctgtaactct 7140
gagaccctcc aggcatcttt tcctgtacct cagtgcttct gaaaaatctg tgtgaatcaa 7200
atcattttaa aggagcttgg gttcatcact gtttaaagga cagtgtaaat aattctgaag 7260
gtgactctac cctgttattt gatctcttct ttggccagct gacttaacag gacatagaca 7320
ggttttcctg tgtcagttcc taagctgatc accttggact tgaagaggag gcttgtgtgg 7380
gcatccagtg cccaccccgg gttaaactcc cagcagagta ttgcactggg cttgctgagc 7440
ctggtgaggc aaagcacagc acagcgagca ccaggcagtg ctggagacag gccaagtctg 7500
ggccagcctg ggagccaact gtgaggcacg gacggggctg tggggctgtg gggctgcagg 7560
cttggggcca gggagggagg gctgggctct ttggaacagc cttgagagaa ctgaacccaa 7620
acaaaaccag atcaaggtct agtgagagct tagggctgct ttgggtgctc caggaaattg 7680
attaaaccaa gtggacacac acccccagcc ccacctcacc acagcctctc cttcagggtc 7740
aaactctgac cacagacatt tctcccctga ctaggagttc cctggatcaa aattgggagc 7800
ttgcaacaca tcgttctctc ccttgatggt ttttgtcagt gtctatccag agctgaagtg 7860
taatatatat gttactgtag ctgagaaatt aaatttcagg attctgattt cataatgaca 7920
accattcctc ttttctctcc cttctgtaaa tctaagattc tataaacggt gttgacttaa 7980
tgtgacaatt ggcagtagtt caggtctgct ttgtaaatac ccttgtgtct attgtaaaat 8040
ctcacaaagg cttgttgcct tttttgtggg gttagaacaa gaaaaagcca catggaaaaa 8100
aaatttcttt tttgtttttt tgtttgcttg tttttttgag acagagtttc actctgtcgc 8160
ccaggctgga gtgcagtggt gcgatctccg cccactgcaa gctccacctc ccgggttcat 8220
gctattctcc tgtctcagcc tcccaagtag ctgggactgc aggtgcccgc caccacacct 8280
ggctaatttt tttgtatttt tagtagagac ggggtttcac cgtgttagcc aggatggtct 8340
caatctcctg acctcgtcat ctgcctgcct cggcctccca aagtgctgag attacaggcg 8400
tgagccaccg tgcccggcca gaaaaaaaca tttctaagta tgtggcagat actgaattat 8460
tgcttaatgt cctttgattc atttgtttaa tttctttaat ggattagtac agaaaacaaa 8520
gttctcttcc ttgaaaaact ggtaagtttt ctttgtcaga taaggagagt taaataaccc 8580
atgacatttc cctttttgcc tcggcttcca ggaagctcaa agttaaatgt aatgatcact 8640
cttgtaatta tcagtgttga tgcccttccc ttcttctaat gttactcttt acattttcct 8700
gctttattat tgtgtgtgtt ttctaattct aagctgttcc cactcctttc tgaaagcagg 8760
caaatcttct aagccttatc cactgaaaag ttatgaataa aaaatgatcg tcaagcctac 8820
aggtgctgag gctactccag aggctgaggc cagaggacca cttgagccca ggaatttgag 8880
acctgggctg ggcagcatag caagactcta tctccattaa aactattttt ttttatttaa 8940
aaaataatcc gcaaagaagg agtttatgtg ggattcctta aaatcggagg gtggcatgaa 9000
ttgattcaaa gacttgtgca gagggcgaca gtgactcctt gagaagcagt gtgagaaagc 9060
ctgtcccacc tccttccgca gctccagcct gggctgaggc actgtcacag tgtctccttg 9120
ctggcaggag agaatttcaa cattcaccaa aaagtagtat tgtttttatt aggtttatga 9180
ggctgtagcc ttgaggacag cccaggacaa ctttgttgtc acatagatag cctgtggcta 9240
caaactctga gatctagatt cttctgcggc tgcttctgac ctgagaaagt tgcggaacct 9300
cagcgagcct cacatggcct ccttgtcctt aacgtgggga cggtgggcaa gaaaggtgat 9360
gtggcactag agatttatcc atctctaaag gaggagtgga ttgtacattg aaacaccaga 9420
gaaggaatta caaaggaaga atttgagtat ctaaaaatgt aggtcaggcg ctcctgtgtt 9480
gattgcaggg ctattcacaa tagccaagat ttggaagcaa cccaagtgtc catcaacaga 9540
caaatggata aagaaaatgt ggtgcatata cacaatggaa tactattcag ccatgaaaaa 9600
gaatgagaat ctgtcatttg aaacaacatg gatggaactg gaggacatta tgttaagtga 9660
aataagccag acagaaggac agacttcaca tgttctcaca catttgtggg agctaaaaat 9720
taaactcatg gagatagaga gtagaaggat ggttaccaga ggctgaggag ggtggagggg 9780
agcagggaga aagtagggat ggttaatggg tacaaaaacg tagttagcat gcatagatct 9840
agtattggat agcacagcag ggtgacgaca gccaacagta atttatagta catttaaaaa 9900
caactaaaag agtgtaactg gactggctaa catggtgaaa ccccgtctct actaaaaata 9960
caaaaattag ctgggcacgg tggctcacgc ctgtaatccc agcactttgg gaggccgagg 10020
cgggccgatc acgaggtcag gagatcgaga ccatcctagc taacatggtg aaaccccgtc 10080
tctactacaa atacaaaaaa aagaaaaaat tagccgggca tggtggtggg cgcctgtagt 10140
cccagctact cgggaggctg aggcaggaga atggcgtgaa cccgggaggc ggagcttgca 10200
gtgagccgag atcgcgccac tgcactccag cctgggcgac aaggcaagat tctatctcaa 10260
aaaaataaaa ataaaataaa ataaaataat aaaataaaat aaaataaaat aaaataaaat 10320
aaataaaata aaatgtataa ttggaatgtt tataacacaa gaaatgataa atgcttgagg 10380
tgatagatac cccattcacc gtgatgtgat tattgcacaa tgtatgtctg tatctaaata 10440
tctcatgtac cccacaagta tatacaccta ctatgtaccc atataaattt aaaattaaaa 10500
aattataaaa caaaaataaa taagtaaatt aaaatgtagg ctggacaccg tggttcacgc 10560
ctgtaatccc agtgctttgt gaggctgagg tgagagaatc acttgagccc aggagtttga 10620
gaccggcctg ggtgacatag cgagacccca tcatcacaaa gaatttttaa aaattagctg 10680
ggcgtggtag cacataccgg tagttccagc tacttgggag accgaggcag gaggattgct 10740
tgagcccagg agtttaaggc tgcagtgagc tacgatggcg ccactgcatt ccagcctggg 10800
tgacagagtg agagcttgtc tctattttaa aaataataaa aagaataaat aaaaataaat 10860
taaaatgtaa atatgtgcat gttagaaaaa atacacccat cagcaaaaag ggggtaaagg 10920
agcgatttca gtcataattg gagagatgca gaataagcca gcaatgcagt ttcttttatt 10980
ttggtcaaaa aaaataagca aaacaatgtt gtaaacaccc agtgctggca gcaatgtggt 11040
gaggctggct ctctcaccag ggctcacagg gaaaactcat gcaacccttt tagaaagcca 11100
tgtggagagt tgtaccgaga ggttttagaa tatttataac tttgacccag aaattctatt 11160
ctaggactct gtgttatgaa aataacccat catatggaaa aagctccttt cagaaagagg 11220
ttcatgggag gctgtttgta tttttttttt ctttgcatca aatccagctc ctgcaggact 11280
gtttgtatta ttgaagtaca aagtggaatc aatacaaatg ttggatagca ggggaacaat 11340
attcacaaaa tggaatggga catagtatta aacatagtgc ttctgatgac cgtagaccat 11400
agacaatgct taggatatga tatcacttct tttgttgttt tttgtatttt gagacgaagt 11460
ctcattctgt cacccaggct ggagttcagt ggcgccatct cagctcactg caacctccat 11520
ctcccgggtt caagctattc tccttcctca acctcccgag tagctgggtt gcgcaccacc 11580
atgcctggct aacttttgta tttttagtac agacggggtt tcaccacgtt ggccaggctg 11640
ctcttgaact cctgacgtca ggtgatccac cagccttgac ctcccaaagt gctaggatta 11700
caggagccac tgtacccagc ctaggatatg atatcacttc ttagagcaag atacaaaatt 11760
gcatgtgcac aataattcta ccaagtatag gtatacaggg gtagttatat ataaatgaga 11820
cttcaaggaa atacaacaaa atgcaatcgt gattgtgtta gggtggtaag aaaacggttt 11880
ttgctttgat gagctctgtt ttttaaaatc gttatatttt ctaataaaaa tacatagtct 11940
tttgaaggaa cataaaagat tatgaagaaa tgagttagat attgattcct attgaagatt 12000
cagacaagta aaattaaggg gaaaaaaaac gggatgaacc agaagtcagg ctggagttcc 12060
aaccccagat ccgacagccc aggctgatgg ggcctccagg gcagtggttt ccacccagca 12120
ttctcaaaag agccactgag gtctcagtgc cattttcaag atttcggaag cggcctgggc 12180
acggctggtc cttcactggg atcaccactt ggcaattatt tacacctgag acgaatgaaa 12240
accagagtgc tgagattaca ggcatggtgg cttacgcttg taatcggctt tgggaagccg 12300
aggtgggctg attgcttgag cccaggagtt tcaaactatc ctggacaaca tagcatgacc 12360
tcgtctctac aaaaaataca aaaaatttgc caggtgtggt ggcatgtgcc tgtggtccca 12420
gctacttggg aggctgaagt aggagaatcc cctgagccct gggaagtcga ggctgcactg 12480
agccgtgatg gtgtcactgc actccagcct gggtgacaaa gtgagaccct atctcacaaa 12540
gaaaaaaaac aaaacaaaaa acccaaagca cactgtttcc actgtttcca gagttcctga 12600
gaggaaaggt caccgggtga ggaagacgtt ctcactgatc tggcagagaa aatgtccagt 12660
ttttccaact ccctaaacca tggttttcta tttcatagtt cttaggcaaa ttggtaaaaa 12720
tcatttctca tcaaaacgct gatattttca cacctccctg gtgtctgcag aaagaacctt 12780
ccagaaatgc agtcgtggga gacccatcca ggccacccct gcttatggaa gagctgagaa 12840
aaagccccac gggagcattt gctcagcttc cgttacgcac ctagtggcat tgtgggtggg 12900
agagggctgg tgggtggatg gaaggagaag gcacagcccc cccttgcagg gacagagccc 12960
tcgtacagaa gggacacccc acatttgtct tccccacaaa gcggcctgtg tcctgcctac 13020
ggggtcaggg cttctcaaac ctggctgtgt gtcagaatca ccaggggaac ttttcaaaac 13080
tagagagact gaagccagac tcctagattc taattctagg tcagggctag gggctgagat 13140
tgtaaaaatc cacaggtgat tctgatgccc ggcaggcttg agaacagccg cagggagttc 13200
tctgggaatg tgccggtggg tctagccagg tgtgagtgga gatgccgggg aacttcctat 13260
tactcactcg tcagtgtggc cgaacacatt tttcacttga cctcaggctg gtgaacgctc 13320
ccctctgggg ttcaggcctc acgatgccat ccttttgtga agtgaggacc tgcaatccca 13380
gcttcgtaaa gcccgctgga aatcactcac acttctggga tgccttcaga gcagccctct 13440
atcccttcag ctcccctggg atgtgactcg acctcccgtc actccccaga ctgcctctgc 13500
caagtccgaa agtggaggca tccttgcgag caagtaggcg ggtccagggt ggcgcatgtc 13560
actcatcgaa agtggaggcg tccttgcgag caagcaggcg ggtccagggt ggcgtgtcac 13620
tcatcctttt ttctggctac caaag gtg cag ata att aat aag aag ctg gat 13672
Val Gln Ile Ile Asn Lys Lys Leu Asp
1 5
ctt agc aac gtc cag tcc aag tgt ggc tca aag gat aat atc aaa cac 13720
Leu Ser Asn Val Gln Ser Lys Cys Gly Ser Lys Asp Asn Ile Lys His
10 15 20 25
gtc ccg gga ggc ggc agt gtgagtacct tcacacgtcc catgcgccgt 13768
Val Pro Gly Gly Gly Ser
30
gctgtggctt gaattattag gaagtggtgt gagtgcgtac acttgcgaga cactgcatag 13828
aataaatcct tcttgggctc tcaggatctg gctgcgacct ctgggtgaat gtagcccggc 13888
tccccacatt cccccacacg gtccactgtt cccagaagcc ccttcctcat attctaggag 13948
ggggtgtccc agcatttctg ggtcccccag cctgcgcagg ctgtgtggac agaatagggc 14008
agatgacgga ccctctctcc ggaccctgcc tgggaagctg agaataccca tcaaagtctc 14068
cttccactca tgcccagccc tgtccccagg agccccatag cccattggaa gttgggctga 14128
aggtggtggc acctgagact gggctgccgc ctcctccccc gacacctggg caggttgacg 14188
ttgagtggct ccactgtgga caggtgaccc gtttgttctg atgagcggac accaaggtct 14248
tactgtcctg ctcagctgct gctcctacac gttcaaggca ggagccgatt cctaagcctc 14308
cagcttatgc ttagcctgcg ccaccctctg gcagagactc cagatgcaaa gagccaaacc 14368
aaagtgcgac aggtccctct gcccagcgtt gaggtgtggc agagaaatgc tgcttttggc 14428
ccttttagat ttggctgcct cttgccagga gtggtggctc gtgcctgtaa ttccagcact 14488
ttgggagact aaggcgggag gttcgcttga gcccaggagt tcaagaccag cctgggcaac 14548
aatgagaccc ctgtgtctac aaaaagaatt aaaattagcc aggtgtggtg gcacgcacct 14608
gtagtcccag ctacttggga ggctgaggtg ggaggattgc ctgagtccgg gaggcggaag 14668
ttgcaaggag ccatgatcgc gccactgcac ttcaacctag gcaacagagt gagactttgt 14728
ctcaaaaaac aatcatataa taattttaaa ataaatagat ttggcttcct ctaaatgtcc 14788
ccggggactc cgtgcatctt ctgtggagtg tctccgtgag attcgggact cagatcctca 14848
agtgcaactg acccacccga taagctgagg cttcatcatc ccctggccgg tctatgtcga 14908
ctgggcaccc gaggctcctc tcccaccagctctcttggtc agctgaaagc aaactgttaa 14968
caccctgggg agctggacgt atgagaccct tggggtggga ggcgttgatt tttgagagca 15028
atcacctggc cctggctggc agtaccggga cactgctgtg gctccggggt gggctgtctc 15088
cagaaaatgc ctggcctgag gcagccaccc gcatccagcc cagagggttt attcttgcaa 15148
tgtgctgctg cttcctgccc tgagcacctg gatcccggct tctgccctga ggccccttga 15208
gtcccacagg tagcaagcgc ttgccctgcg gctgctgcat ggggctaact aacgcttcct 15268
caccagtgtc tgctaagtgt ctcctctgtc tcccacgccc tgctctcctg tccccccagt 15328
ttgtctgctg tgaggggaca gaagaggtgt gtgccgcccc cacccctgcc cgggcccttg 15388
ttcctgggat tgctgttttc agctgtttga gctttgatcc tggttctctg gcttcctcaa 15448
agtgagctcg gccagaggag gaaggccatg tgctttctgg ttgaagtcaa gtctggtgcc 15508
ctggtggagg ctgtgctgct gaggcggagc tggggagaga gtgcacacgg gctgcgtggc 15568
caacccctct gggtagctga tgcccaaaga cgctgcagtg cccaggacat ctgggacctc 15628
cctggggccc gcccgtgtgt cccgcgctgt gttcatctgc gggctagcct gtgacccgcg 15688
ctgtgctcgt ctgcgggcta gcctgtgtcc cgcgctctgc ttgtctgcgg tctagcctgt 15748
gacctggcag agagccacca gatgtcccgg gctgagcact gccctctgag caccttcaca 15808
ggaagccctt ctcctggtga gaagagatgc cagcccctgg catctggggg cactggatcc 15868
ctggcctgag ccctagcctc tccccagcct gggggcccct tcccagcagg ctggccctgc 15928
tccttctcta cctgggaccc ttctgcctcc tggctggacc ctggaagctc tgcagggcct 15988
gctgtccccc tccctgccct ccaggtatcc tgaccaccgg ccctggctcc cactgccatc 16048
cactcctctc ctttctggcc gttccctggt ccctgtccca gcccccctcc ccctctcacg 16108
agttacctca cccaggccag agggaagagg gaaggaggcc ctggtcatac cagcacgtcc 16168
tcccacctcc ctcggccctg gtccaccccc tcagtgctgg cctcagagca cagctctctc 16228
caagccaggc cgcgcgccat ccatcctccc tgtcccccaa cgtccttgcc acagatcatg 16288
tccgccctga cacacatggg tctcagccat ctctgcccca gttaactccc catccataaa 16348
gagcacatgc cagccgacac caaaataatt cgggatggtt ccagtttaga cctaagtgga 16408
aggagaaacc accacctgcc ctgcaccttg ttttttggtg accttgataa accatcttca 16468
gccatgaagc cagctgtctc ceaggaagct ccagggcggt gcttcctcgg gagctgactg 16528
ataggtggga ggtggctgcc cccttgcacc etcaggtgac cccacacaag gccactgctg 16588
gaggccctgg ggactccagg aatgtcaatc agtgacctgc cccccaggcc ccacacagcc 16648
atggctgcat agaggcctgc ctccaaggga cctgtctgtc tgccactgtg gagtccctac 16708
agcgtgcccc ccacagggga gctggttctt tgactgagat cagctggcag ctcagggtca 16768
tcattcccag agggagcggt gccctggagg ccacaggcct cctcatgtgt gtctgcgtcc 16828
gctcgagctt actgagacac taaatctgtt ggtttctgct gtgccaccta cccaccctgt 16888
tggtgttgct ttgttcctat tgctaaagac aggaatgtcc aggacactga gtgtgcaggt 16948
gcctgctggt tctcacgtcc gagctgctga actccgctgg gtcctgctta ctgatggtct 17008
ttgctctagt gctttccagg gtccgtggaa gcttttcctg gaataaagcc cacgcatcga 17068
ccctcacagc gcctcccctc tttgaggccc agcagatacc ccactcctgc ctttccagca 17128
agatttttca gatgctgtgc atactcatca tattgatcac ttttttcttc atgcctgatt 17188
gtgatctgtc aatttcatgt caggaaaggg agtgacattt ttacacttaa gcgtttgctg 17248
agcaaatgtc tgggtcttgc acaatgacaa tgggtccctg tttttcccag aggctctttt 17308
gttctgcagg gattgaagac actccagtcc cacagtcccc agctcccctg gggcagggtt 17368
ggcagaattt cgacaacaca tttttccacc ctgactagga tgtgctcctc atggcagctg 17428
ggaaccactg tccaataagg gcctgggctt acacagctgc ttctcattga gttacaccct 17488
taataaaata atcccatttt atcctttttg tctctctgtc ttcctctctc tctgcctttc 17548
ctcttctctc tcctcctctc tcatctccag 17578
<210>79
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>79
tatctgcacc tttggtag 18
<210>80
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成寡核苷酸
<400>80
tgaaggtact cacactgccg c 21
Claims (35)
1.分离的核酸,所述核酸包含:
A)至少一个第一核苷酸序列,其编码目标异源核苷酸序列;和
B)至少两个第二异源核苷酸序列,其中每个第二异源核苷酸序列包含:
i)限定第一内含子的第一组剪接元件,在第二组剪接元件没有活性的情况下,所述第一内含子通过剪接被去除,从而产生赋予生物功能的第一RNA分子;和
ii)限定与所述第一内含子不同的一个或多个内含子的第二组剪接元件,其中在所述第二组剪接元件有活性时,与所述第一内含子不同的所述一个或多个内含子通过剪接被去除,从而不产生RNA分子和/或产生不赋予生物功能的第二RNA分子,其中所述第二异源核苷酸序列选自:
a)在所述第一核苷酸序列中串联的第二核苷酸序列,
b)在所述第一核苷酸序列中相距至少25个碱基对的第二核苷酸序列,
c)在所述第一核苷酸序列中相距至少50个碱基对的第二核苷酸序列,
d)在所述第一核苷酸序列中相距至少75个碱基对的第二核苷酸序列,
e)在所述第一核苷酸序列中相距至少100个碱基对的第二核苷酸序列,
f)在所述第一核苷酸序列中相距至少200个碱基对的第二核苷酸序列,
g)在所述第一核苷酸序列中相距至少300个碱基对的第二核苷酸序列,
h)第二核苷酸序列,其中第一个第二核苷酸序列位于启动子和所述第一核苷酸序列之间,而第二个第二核苷酸序列位于所述第一核苷酸序列中;和
i)第二核苷酸序列,其中第一个第二核苷酸序列位于所述第一核苷酸序列中的可读框和聚腺苷酸尾或聚腺苷酸信号之间,而第二个第二核苷酸序列位于所述第一核苷酸序列的所述可读框中。
2.权利要求1的核酸,其中所述第一核苷酸序列选自以下序列及其任意组合:编码蛋白或肽的核苷酸序列、作为RNA具有酶活性的核苷酸序列(例如RNAi)、编码核酶的核苷酸序列、编码反义序列的核苷酸序列和/或小核RNA(snRNA)。
3.权利要求1或2的核酸,所述核酸包含两个或多个可相同或不同的第一核苷酸序列。
4.权利要求1-3中任一项的核酸,所述核酸包含两个或多个相同的第二核苷酸序列。
5.权利要求1-3中任一项的核酸,所述核酸包含彼此不同的两个或多个第二核苷酸序列。
6.载体,所述载体包含权利要求1-5中任一项的核酸。
7.权利要求6的载体,所述载体选自:非病毒载体、病毒载体和合成生物纳颗粒。
8.权利要求6的载体,所述载体选自:AAV载体、腺病毒载体、慢病毒载体、逆转录病毒载体、疱疹病毒载体、甲病毒载体、痘病毒载体、杆状病毒载体和嵌合病毒载体。
9.细胞,所述细胞包含权利要求1-5中任一项的核酸。
10.细胞,所述细胞包含权利要求6-8中任一项的载体。
11.组合物,所述组合物包含权利要求1-5中任一项的核酸和药学可接受载体。
12.组合物,所述组合物包含权利要求6-8中任一项的载体和药学可接受载体。
13.组合物,所述组合物包含权利要求9-10中任一项的细胞和药学可接受载体。
14.生产蛋白的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和
b)翻译第一RNA,以生产所述蛋白。
15.产生赋予生物功能的RNA的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第二组剪接元件的成员,导致第一内含子通过剪接被去除,而产生第一RNA;和
b)翻译第一RNA,以产生赋予生物功能的RNA。
16.权利要求14-15中任一项的方法,其中将所述封闭寡核苷酸导入到含所述核酸的细胞中。
17.权利要求16的方法,其中所述细胞处于动物中。
18.权利要求17的方法,其中所述动物是人。
19.权利要求14-18中任一项的方法,其中所述封闭寡核苷酸不激活RNA酶H。
20.权利要求14-19中任一项的方法,其中所述封闭寡核苷酸包含修饰型核苷酸间桥接磷酸酯残基,所述磷酸酯残基选自甲基硫代磷酸酯、吗啉代磷酸酯、哌嗪代磷酸酯和氨基磷酸酯。
21.权利要求14-20中任一项的方法,其中所述封闭寡核苷酸包含在其2′位具有低级烷基取代基的核苷酸。
22.权利要求14-21中任一项的方法,其中所述封闭寡核苷酸长8-50个核苷酸。
23.生产蛋白的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件的成员,导致第一内含子被去除,而产生第一RNA;和
b)翻译第一RNA,从而生产所述蛋白。
24.产生赋予生物功能的RNA的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第二组剪接元件的成员,导致第一内含子被去除,而产生第一RNA;和
b)翻译第一RNA,从而产生赋予生物功能的RNA。
25.权利要求23-24中任一项的方法,其中将所述小分子导入到含所述核酸的细胞中。
26.权利要求25的方法,其中所述细胞处于动物中。
27.权利要求26的方法,其中所述动物是人。
28.在受治疗者中调节赋予生物功能的异源RNA的产生的方法,所述方法包括:
a)将权利要求1-5中任一项的核酸导入到所述受治疗者中;和
b)在期望产生所述异源RNA时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中所述RNA的产生。
29.调节受治疗者中的异源蛋白产生的方法,所述方法包括:
a)将权利要求1-5中任一项的核酸导入到所述受治疗者中;和
b)在期望产生所述异源蛋白时将封闭第二组剪接元件成员的封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此调节所述受治疗者中所述蛋白的产生。
30.治疗受治疗者中的疾病的方法,所述方法包括:
a)将权利要求1-5中任一项的核酸导入到所述受治疗者中;和
b)将封闭寡核苷酸和/或小分子导入到所述受治疗者中,由此治疗所述受治疗者中的疾病。
31.鉴别化合物的方法,其中所述化合物封闭权利要求1的核酸的第二组剪接元件成员,所述方法包括:
a)使权利要求1的核酸与所述化合物在允许剪接的条件下接触;
和
b)检测权利要求1的第一RNA的产生和/或第二RNA的产生,借此权利要求1的第一RNA的产生鉴别出封闭权利要求1的第二组剪接元件成员的化合物。
32.抑制赋予生物功能的异源RNA产生的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
33.抑制异源蛋白产生的方法,所述方法包括:
a)使小分子与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述小分子封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
34.抑制赋予生物功能的异源RNA产生的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
35.抑制异源蛋白产生的方法,所述方法包括:
a)使封闭寡核苷酸与权利要求1-5中任一项的核酸在允许剪接的条件下接触,其中所述封闭寡核苷酸封闭第一组剪接元件成员,导致第二内含子被去除,由此抑制第一RNA的产生。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67613905P | 2005-04-29 | 2005-04-29 | |
US60/676,139 | 2005-04-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101213203A true CN101213203A (zh) | 2008-07-02 |
Family
ID=37308297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800237538A Pending CN101213203A (zh) | 2005-04-29 | 2006-04-28 | 在转录后水平调节核酸表达的方法和组合物 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20100196335A1 (zh) |
EP (1) | EP1874791A4 (zh) |
JP (1) | JP2008539698A (zh) |
CN (1) | CN101213203A (zh) |
AU (1) | AU2006242371A1 (zh) |
CA (1) | CA2606362A1 (zh) |
NZ (1) | NZ562780A (zh) |
WO (1) | WO2006119137A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102625840A (zh) * | 2009-04-10 | 2012-08-01 | 肌肉学研究协会 | 用于治疗疾病的三环dna反义寡核苷酸、组合物和方法 |
CN113166779A (zh) * | 2018-10-09 | 2021-07-23 | 北卡罗来纳大学查佩尔希尔分校 | 调控的基因编辑系统 |
CN114127288A (zh) * | 2019-05-14 | 2022-03-01 | 莫纳什大学 | 晚期糖基化终产物受体rna的调节剂和调节 |
CN114150021A (zh) * | 2021-11-26 | 2022-03-08 | 武汉枢密脑科学技术有限公司 | 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用 |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8637478B2 (en) | 2007-11-13 | 2014-01-28 | Isis Pharmaceuticals, Inc. | Compounds and methods for modulating protein expression |
US8889641B2 (en) | 2009-02-11 | 2014-11-18 | The University Of North Carolina At Chapel Hill | Modified virus vectors and methods of making and using the same |
US20100303776A1 (en) * | 2009-04-16 | 2010-12-02 | The University Of North Carolina At Chapel Hill | Methods and compositions for regulated expression of multiple nucleic acids |
US8734809B2 (en) | 2009-05-28 | 2014-05-27 | University Of Massachusetts | AAV's and uses thereof |
EE05711B1 (et) * | 2009-10-07 | 2014-04-15 | Tartu Ülikool | Meetod ja kompositsioon konditsionaalselt letaalsete viirusmutantide loomiseks ja eukarootse raku elulisuse k?rvaldamiseks |
WO2011042556A1 (en) * | 2009-10-08 | 2011-04-14 | Association Institut De Myologie | Nucleic acid molecules and methods for exchanging exon(s) by transsplicing |
US20130035472A1 (en) * | 2010-03-17 | 2013-02-07 | Anaptysbio, Inc. | Method of producing transcripts using cryptic splice sites |
DK2826860T3 (en) * | 2010-04-23 | 2018-12-03 | Univ Massachusetts | CNS targeting AAV vectors and methods for their use |
US9409953B2 (en) | 2011-02-10 | 2016-08-09 | The University Of North Carolina At Chapel Hill | Viral vectors with modified transduction profiles and methods of making and using the same |
GB201103062D0 (en) * | 2011-02-22 | 2011-04-06 | Isis Innovation | Method |
AU2013319788B2 (en) * | 2012-09-24 | 2019-04-11 | Yissum Reasearch Development Company of the Hebrew University Of Jerusalem Ltd. | Restoration of the CFTR function by splicing modulation |
CA2904396A1 (en) | 2013-03-15 | 2014-09-18 | The University Of North Carolina At Chapel Hill | Methods and compositions for dual glycan binding aav vectors |
CN114395559A (zh) * | 2014-04-25 | 2022-04-26 | 吉尼松公司 | 高胆红素血症的治疗 |
CN107073051B (zh) | 2014-10-21 | 2021-08-24 | 马萨诸塞大学 | 重组aav变体及其用途 |
EP3245220B1 (en) | 2015-01-14 | 2023-09-20 | The University of North Carolina at Chapel Hill | Methods and compositions for targeted gene transfer |
WO2016134300A1 (en) | 2015-02-20 | 2016-08-25 | Board Of Regents, The University Of Texas System | Methods and compositions for attenuated chlamydia as vaccine and vector |
PL3356390T3 (pl) | 2015-09-28 | 2021-07-05 | The University Of North Carolina At Chapel Hill | Sposoby i kompozycje dla wektorów wirusowych unikających przeciwciał |
CA3007330A1 (en) | 2015-12-14 | 2017-06-22 | The Trustees Of The University Of Pennsylvania | Composition for treatment of crigler-najjar syndrome |
US11578340B2 (en) | 2016-10-13 | 2023-02-14 | University Of Massachusetts | AAV capsid designs |
US11702646B2 (en) * | 2016-11-28 | 2023-07-18 | Ptc Therapeutics, Inc. | Methods for modulating RNA splicing |
CA3054711A1 (en) | 2017-03-15 | 2018-09-20 | The University Of North Carolina At Chapel Hill | Polyploid adeno-associated virus vectors and methods of making and using the same |
JP7406677B2 (ja) | 2018-04-03 | 2023-12-28 | ギンコ バイオワークス インコーポレイテッド | 抗体を回避するウイルスベクター |
US20210371471A1 (en) | 2018-04-03 | 2021-12-02 | Stridebio, Inc. | Antibody-evading virus vectors |
AU2019247191A1 (en) | 2018-04-03 | 2020-10-15 | Ginkgo Bioworks, Inc. | Virus vectors for targeting ophthalmic tissues |
WO2020160338A1 (en) * | 2019-01-30 | 2020-08-06 | Applied Stemcell, Inc. | Controllable genome editing system |
CN113727992A (zh) | 2019-03-21 | 2021-11-30 | 斯特里迪比奥公司 | 重组腺相关病毒载体 |
AU2020263392A1 (en) | 2019-04-26 | 2021-10-28 | The University Of North Carolina At Chapel Hill | Methods and compositions for dual glycan binding AAV2.5 vector |
CA3157700A1 (en) | 2019-10-17 | 2021-04-22 | Stridebio, Inc. | Adeno-associated viral vectors for treatment of niemann-pick disease type c |
US20220411821A1 (en) * | 2019-10-28 | 2022-12-29 | University Of Florida Research Foundation, Incorporated | Gene therapy vectors |
JP2023547992A (ja) | 2020-10-28 | 2023-11-15 | ザ・ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル | 二重グリカン結合aav2.5ベクターのための方法および組成物 |
WO2022093769A1 (en) | 2020-10-28 | 2022-05-05 | The University Of North Carolina At Chapel Hill | Methods and compositions for dual glycan binding aav2.5 vector |
TW202242124A (zh) | 2021-01-14 | 2022-11-01 | 美商史崔德生物公司 | 靶向t細胞之aav載體 |
WO2023150687A1 (en) | 2022-02-04 | 2023-08-10 | Ginkgo Bioworks, Inc. | Recombinant adeno-associated virus vectors, and methods of use thereof |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1897942A1 (en) * | 1993-05-11 | 2008-03-12 | The University Of North Carolina At Chapel Hill | Antisense oligonucleotides which combat aberrant splicing and methods of using the same |
WO1997014809A2 (en) * | 1995-10-16 | 1997-04-24 | Dana-Farber Cancer Institute | Novel expression vectors and methods of use |
JP2006500933A (ja) * | 2002-09-27 | 2006-01-12 | ユニヴァーシティ・オヴ・ノース・キャロライナ・アト・チャペル・ヒル | プレmRNAのスプライシングを修飾するための方法および組成物 |
AU2003225410A1 (en) * | 2003-03-21 | 2004-10-11 | Academisch Ziekenhuis Leiden | Modulation of exon recognition in pre-mrna by interfering with the secondary rna structure |
-
2006
- 2006-04-28 CA CA002606362A patent/CA2606362A1/en not_active Abandoned
- 2006-04-28 CN CNA2006800237538A patent/CN101213203A/zh active Pending
- 2006-04-28 JP JP2008509220A patent/JP2008539698A/ja active Pending
- 2006-04-28 US US11/919,267 patent/US20100196335A1/en not_active Abandoned
- 2006-04-28 AU AU2006242371A patent/AU2006242371A1/en not_active Abandoned
- 2006-04-28 NZ NZ562780A patent/NZ562780A/en not_active IP Right Cessation
- 2006-04-28 EP EP06758813A patent/EP1874791A4/en not_active Withdrawn
- 2006-04-28 WO PCT/US2006/016514 patent/WO2006119137A1/en active Application Filing
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102625840A (zh) * | 2009-04-10 | 2012-08-01 | 肌肉学研究协会 | 用于治疗疾病的三环dna反义寡核苷酸、组合物和方法 |
CN109576268A (zh) * | 2009-04-10 | 2019-04-05 | 肌肉学研究协会 | 用于治疗疾病的三环dna反义寡核苷酸、组合物和方法 |
CN113166779A (zh) * | 2018-10-09 | 2021-07-23 | 北卡罗来纳大学查佩尔希尔分校 | 调控的基因编辑系统 |
CN114127288A (zh) * | 2019-05-14 | 2022-03-01 | 莫纳什大学 | 晚期糖基化终产物受体rna的调节剂和调节 |
CN114150021A (zh) * | 2021-11-26 | 2022-03-08 | 武汉枢密脑科学技术有限公司 | 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用 |
WO2023092643A1 (zh) * | 2021-11-26 | 2023-06-01 | 劲帆生物医药科技(武汉)有限公司 | 一种包含重叠开放阅读框的基因的表达盒及其在昆虫细胞中的应用 |
Also Published As
Publication number | Publication date |
---|---|
EP1874791A1 (en) | 2008-01-09 |
AU2006242371A1 (en) | 2006-11-09 |
JP2008539698A (ja) | 2008-11-20 |
NZ562780A (en) | 2010-03-26 |
US20100196335A1 (en) | 2010-08-05 |
EP1874791A4 (en) | 2009-01-07 |
WO2006119137A1 (en) | 2006-11-09 |
CA2606362A1 (en) | 2006-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101213203A (zh) | 在转录后水平调节核酸表达的方法和组合物 | |
KR102370675B1 (ko) | 표적 핵산의 변형을 위한 개선된 방법 | |
AU2018229561B2 (en) | Recombinant adenoviruses and use thereof | |
AU2023270322A1 (en) | Compositions and methods for modifying genomes | |
CN111492061A (zh) | 用于溶酶体障碍的基因疗法 | |
CN1938428A (zh) | 多基因表达的质粒系统 | |
CN110835633B (zh) | 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用 | |
KR20070085665A (ko) | 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 | |
BRPI0817233A2 (pt) | construções terapêuticas de gene de trca e bireatores para a expressão de moléculas bioterapêuticas, e usos das mesmas | |
KR20130010121A (ko) | 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도 | |
CN115011598A (zh) | 杜氏肌营养不良症相关的外显子剪接增强子、sgRNA、基因编辑工具及应用 | |
CN110913886A (zh) | 包含成纤维细胞生长因子21(fgf21)编码序列的病毒表达构建体 | |
JP2003534775A (ja) | タンパク質を不安定化する方法とその使用 | |
AU2023270345A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
US11129890B1 (en) | Non-integrating HIV-1 comprising mutant RT/IN proteins and the SARS-CoV-2 spike protein | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 | |
AU2016378480A1 (en) | Endothelium-specific nucleic acid regulatory elements and methods and use thereof | |
KR20230019063A (ko) | C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터 | |
CN113166779A (zh) | 调控的基因编辑系统 | |
KR20220161297A (ko) | 신규 세포주 | |
KR20240021906A (ko) | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 | |
CN110777147A (zh) | 一种ikzf3基因沉默的t细胞及其应用 | |
KR20150021839A (ko) | 암특이적 유전자를 표적하는 트랜스-스플라이싱 라이보자임의 조절 유도체를 포함하는 재조합 아데노바이러스 및 이의 용도 | |
JP2003503034A (ja) | 核内pparレセプターを使用する発現調節システム | |
KR20200037750A (ko) | 섬유아세포 성장 인자 21 (fgf21) 코딩 서열을 포함하는 바이러스 발현 컨스트럭트 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080702 |