CN115362000A - 使用多核苷酸沉默和替换的神经退行性病症的基因疗法 - Google Patents

使用多核苷酸沉默和替换的神经退行性病症的基因疗法 Download PDF

Info

Publication number
CN115362000A
CN115362000A CN202180023471.2A CN202180023471A CN115362000A CN 115362000 A CN115362000 A CN 115362000A CN 202180023471 A CN202180023471 A CN 202180023471A CN 115362000 A CN115362000 A CN 115362000A
Authority
CN
China
Prior art keywords
seq
polynucleotide
vector
aav
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180023471.2A
Other languages
English (en)
Inventor
K·S·加农
N·R·哈克特
M·古雷特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palos Biotech
Original Assignee
Palos Biotech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palos Biotech filed Critical Palos Biotech
Publication of CN115362000A publication Critical patent/CN115362000A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6478Aspartic endopeptidases (3.4.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/23Aspartic endopeptidases (3.4.23)
    • C12Y304/23046Memapsin 2 (3.4.23.46), i.e. beta-secretase 1 or BACE
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Public Health (AREA)
  • Virology (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本公开涉及用于治疗神经退行性病症的核酸表达盒和载体。还提供了治疗神经退行性病症如阿尔茨海默氏病、额颞叶痴呆、额颞叶变性、匹克氏病、路易体痴呆、记忆丧失、认知损害和轻度认知损害的方法。

Description

使用多核苷酸沉默和替换的神经退行性病症的基因疗法
相关申请的交叉引用
本申请根据35U.S.C.§119(e)要求2020年1月31日提交的美国临时申请号62/968,707的优先权权益,所述临时申请的全部内容以引用方式整体并入本文。
序列表的并入
随附序列表中的材料特此以引用方式并入本申请。命名为APRES1120_1WO_Sequence_Listing.txt的随附序列表文本文件创建于2021年1月29日并且大小为194,755字节。可以在使用Windows OS的计算机上使用Microsoft Word访问该文件。
技术领域
本公开一般涉及神经退行性病症的基因疗法,并且更具体地涉及用于递送治疗剂的表达盒和多核苷酸。
背景技术
阿尔茨海默氏病(Alzheimer’s disease,AD),也称为阿尔茨海默氏病(Alzheimer’s),是一种慢性神经退行性疾病,它是大多数神经退行性痴呆的原因。症状包括记忆困难、语言问题、定向障碍、情绪波动、失去动力,以及其他行为问题,如远离家庭和社会。身体机能逐渐丧失,最终导致死亡。虽然该疾病可以持续十年以上,但平均预期寿命是诊断后的三到九年。家族性AD(FAD)的特征是具有不止一名AD成员的家庭,并且通常意味着不止一代人中有多个受影响的人。早发型FAD(EOFAD)是指持续在60至65岁之前并且通常在55岁之前发病的家庭。
AD在病理学上表现为脑中的细胞外淀粉样蛋白斑块和细胞内神经原纤维缠结。尽管大多数AD病例的原因尚不清楚,但遗传因素有助于疾病的发展。早发型家族性AD的特征是常染色体显性遗传和在65岁之前发病。
需要用于治疗神经退行性疾病如AD的组合物和方法,包括有效的基因和联合疗法。
发明内容
本公开涉及用于治疗神经退行性病症的多核苷酸、表达盒以及包含此类多核苷酸和/或表达盒的载体。更具体地,本公开中使用的多核苷酸、表达盒和载体包含a)第一多核苷酸序列,其编码一个或多个短发夹RNA(shRNA)或小干扰RNA(miRNA),所述RNA与由内源性早老素1(PSEN1)或早老素2(PSEN2)基因表达的mRNA具有足够的序列互补性,以与所述mRNA杂交并抑制所编码的早老素1(PSEN1)或早老素2(PSEN2)蛋白或其组合的表达,以及b)第二多核苷酸序列,其编码野生型PSEN1或PSEN2蛋白,或其组合。与内源性控制序列相反,由第二多核苷酸编码的野生型PSEN1或PSEN2是利用表达盒和/或携带它们的载体中存在的控制序列表达的。由第二多核苷酸序列表达的mRNA必须能够抵抗通过第一多核苷酸序列编码的短发夹RNA(shRNA)或小干扰RNA(miRNA)实现的阻抑。因此,野生型PSEN1或PSEN2蛋白的同时表达导致内源性表达的PSEN1或PSEN2蛋白的替换。
早老素可以携带导致常染色体显性获得性毒性功能的突变。此类突变分布在PSEN1及其同源物PSEN2的整个编码序列中。同时阻抑常染色体显性突变早老素并表达野生型基因的能力消除了对专门靶向突变等位基因的需要。因此,本公开的多核苷酸、表达盒和载体,以及使用它们的本公开的组合物和方法可用于停止和/或改善与突变PSEN1或PSEN2或其组合相关的损伤。
替换野生型PSEN1或PSEN2避免被一个或多个shRNA或miRNA靶向和阻抑的能力将取决于shRNA或miRNA所靶向的PSEN1或PSEN2 mRNA序列上的位置以及替换野生型PSEN1或PSEN2编码序列中使用的密码子。如果所设计的所有shRNA或miRNA都靶向内源性PSEN1或PSEN2 mRNA的非编码区,则替换PSEN1或PSEN2多核苷酸序列可以是编码野生型PSEN1或PSEN2的任何序列,包括但不限于内源性人PSEN1或PSEN2编码序列,或其中一些或所有密码子基于遗传密码子的冗余性被改变以增加表达的序列,例如,完全或部分密码子优化的野生型PSEN1或PSEN2多核苷酸序列。如果一些或所有shRNA或miRNA靶向内源性PSEN1或PSEN2mRNA的编码区,则必须对替换PSEN1或PSEN2多核苷酸序列中的相应编码区进行修饰,使得所表达的mRNA不被shRNA或miRNA中的任一个靶向。这通过使用遗传密码子的冗余性修饰内源性密码子以降低所表达的mRNA与shRNA或miRNA序列的同源性/互补性来实现。
在一些实施方案中,本文公开的多核苷酸、表达盒、载体、组合物和方法可用于阻抑内源性PSEN1蛋白,同时增加野生型PSEN1蛋白的水平。内源性PSEN1蛋白的阻抑通常通过使用一种或多种反义寡核苷酸来实现,所述反义寡核苷酸与由内源性PSEN1基因表达的mRNA结合,从而降低此类mRNA的水平和/或抑制其翻译成蛋白质。在这些实施方案的一些方面,反义寡核苷酸是由作为表达盒或载体的一部分施用于受试者的DNA序列编码的反义RNA。这样的反义RNA包括shRNA、miRNA或单链反义RNA。在这些实施方案的替代方面,将反义寡核苷酸直接递送至受试者。此类反义寡核苷酸包括siRNA、反义DNA寡核苷酸、外部引导序列寡核苷酸以及可变剪接体寡核苷酸。在这些实施方案的一些方面,提供了一种无毒的双功能载体,其能够表达反义RNA和野生型PSEN1,所述野生型PSEN1的表达不受反义RNA的阻抑。在一些实施方案中,反义寡核苷酸与编码野生型PSEN1的载体同时施用,所述野生型PSEN1的表达不受所提供的反义寡核苷酸的阻抑。在这些实施方案的其他方面,包含编码反义RNA的DNA序列的第一载体与包含编码野生型PSEN1的DNA序列的第二载体同时施用,所述野生型PSEN1的表达不受反义RNA的阻抑。
在一些实施方案中,本文公开的多核苷酸、表达盒、载体、组合物和方法可用于阻抑内源性PSEN2蛋白,同时增加野生型PSEN2的水平。内源性PSEN2蛋白的阻抑通常通过使用一种或多种反义寡核苷酸来实现,所述反义寡核苷酸与由内源性PSEN2基因表达的mRNA结合,从而降低此类mRNA的水平和/或抑制其翻译成蛋白质。在这些实施方案的一些方面,反义寡核苷酸是由作为表达盒或载体的一部分施用于受试者的DNA序列编码的反义RNA。这样的反义RNA包括shRNA、miRNA或单链反义RNA。在这些实施方案的替代方面,将反义寡核苷酸直接递送至受试者。此类反义寡核苷酸包括siRNA、反义DNA寡核苷酸、外部引导序列寡核苷酸以及可变剪接体寡核苷酸。在这些实施方案的一些方面,提供了一种无毒的双功能载体,其能够表达反义RNA和野生型PSEN2,所述野生型PSEN2的表达不受反义RNA的阻抑。在一些实施方案中,反义寡核苷酸与编码野生型PSEN2的载体同时施用,所述野生型PSEN2的表达不受所提供的反义寡核苷酸的阻抑。在这些实施方案的其他方面,包含编码反义RNA的DNA序列的第一载体与包含编码野生型PSEN2的DNA序列的第二载体同时施用,所述野生型PSEN2的表达不受反义RNA的阻抑。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地靶向由人野生型和突变型早老素1(PSEN1)中的每一者或人野生型和突变型早老素2(PSEN2)中的每一者表达的内源性mRNA的编码区或非编码区,其中编码一个或多个shRNA或miRNA的多核苷酸序列中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型PSEN1或PSEN2氨基酸序列的第二多核苷酸,其中由第二多核苷酸表达的mRNA不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。第一多核苷酸可在表达盒中相对于PSEN1或PSEN2编码序列位于任何位置,只要其位置不阻碍PSEN1或PSEN2编码序列的表达即可(即,编码序列的5’、编码序列的3',或在可存在于第二启动子中的内含子内。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地靶向由人野生型和突变型早老素1(PSEN1)中的每一者衍生的内源性mRNA的编码区或非编码区,其中编码一个或多个shRNA或miRNA的多核苷酸序列中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型PSEN1氨基酸序列的第二多核苷酸,其中第二多核苷酸表达的mRNA不被第一多核苷酸编码的shRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地靶向由人野生型和突变型早老素2(PSEN2)中的每一者衍生的内源性mRNA的编码区或非编码区,其中编码一个或多个shRNA或miRNA的多核苷酸序列中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型PSEN2氨基酸序列的第二多核苷酸,其中由第二多核苷酸表达的mRNA不被第一多核苷酸编码的shRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。
在某些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:a)SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:68的448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529;b)前述SEQ ID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或
c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5’或3’端的7个或更多个连续碱基,其中19-21个碱基的核苷酸序列与内源性PSEN1mRNA的相应部分包含不超过4个错配,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型早老素1(PSEN1)蛋白的第二多核苷酸,其中第二多核苷酸不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向,并且其中第二多核苷酸可操作地连接至第二启动子。
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529以及SEQ ID NO:71的核苷酸448-529各自编码靶向PSEN1 mRNA的非编码部分中的序列的RNA。SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46和SEQ ID NO:47各自编码靶向PSEN1 mRNA的编码部分中的序列的RNA。SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529以及SEQ ID NO:71的核苷酸448-529各自编码miRNA。SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46和SEQ ID NO:47各自编码shRNA。
上述SEQ ID NO中的任一个的修饰型式中的1、2、3或4个核苷酸变化中的每一个独立地为核苷酸取代、缺失或添加,并导致与内源性野生型PSEN1 mRNA的错配。包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基的19-21个碱基的核苷酸序列所需的另外的核苷酸是能够与PSEN1 mRNA中分别紧接PSEN1 mRNA中与7个或更多个连续碱基结合的区域的5’或3’的区域杂交,同时在整个19-21个碱基的核苷酸序列中仍允许最多至4个错配的那些。例如,SEQ ID NO:1与PSEN1 mRNA的核苷酸94-115杂交(使用NM_000021.4中的编号)(参见本文表2)。因此,取自SEQ ID NO:1的5'端的19-21个碱基的核苷酸序列的实例将包含与PSEN1 mRNA完全互补的核苷酸2-8,并且其他碱基将包含1、2、3或4个核苷酸变化。
在一些实施方案中,表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型早老素1(PSEN1)蛋白的第二多核苷酸,其中第二多核苷酸不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向,并且其中第二多核苷酸可操作地连接至第二启动子。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ IDNO:18或SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:68的核苷酸448-529、SEQID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(ii)编码野生型早老素1(PSEN1)蛋白的第二多核苷酸,其中第二多核苷酸表达编码人野生型PSEN1的任何mRNA,并且其中第二多核苷酸可操作地连接至第二启动子。在这些实施方案的一些方面,第二多核苷酸表达mRNA,其中mRNA的编码部分具有与内源性的人野生型PSEN1 mRNA相同的多核苷酸序列。在这些实施方案的其他方面,第二多核苷酸表达编码野生型PSEN1的mRNA,其中mRNA的编码部分具有多核苷酸序列,其中与内源性的人野生型PSEN1 mRNA相比,一个或多个密码子已经被修饰或优化。在这些实施方案的更具体的方面,第二多核苷酸序列是SEQ ID NO:39、SEQ ID NO:48,或SEQ ID NO:68的核苷酸1906-3303。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ IDNO:35,SEQ ID NO:42、SEQ ID NO:43SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529,并且其中至少一个shRNA或miRNA包含以下中的一个:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:42或SEQ ID NO:43、SEQID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸497-517、SEQ ID NO:69的核苷酸497-517、SEQ ID NO:70的核苷酸497-517、SEQ ID NO:71的核苷酸497-517,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(ii)编码野生型早老素1(PSEN1)蛋白的第二多核苷酸,其中第二多核苷酸表达编码人野生型PSEN1并且不被shRNA或miRNA中的任一个靶向的mRNA,并且其中第二多核苷酸可操作地连接至第二启动子。在这些实施方案的一些方面,第二多核苷酸表达编码野生型PSEN1的mRNA,与内源性的人野生型PSEN1 mRNA的编码部分相比,所述mRNA是密码子修饰的。在这些实施方案的更具体的方面,第二多核苷酸表达的mRNA在被shRNA或miRNA靶向的那些编码区中包含足够数量的修饰密码子,以防止此类shRNA或miRNA靶向由第二多核苷酸表达的mRNA。通常,对第二多核苷酸的mRNA编码序列中的多于4个核苷酸进行修饰以降低与shRNA或miRNA的同源性/互补性将防止靶向。在这些实施方案的甚至更具体的方面,第二多核苷酸序列是SEQ ID NO:41。
在某些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:a)SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQ ID NO:78的核苷酸448-529;b)前述SEQ ID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基,其中19-21个碱基的核苷酸序列与内源性PSEN1 mRNA的相应部分包含不多于4个错配,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型早老素2(PSEN2)蛋白的第二多核苷酸,其中第二多核苷酸不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向,并且其中第二多核苷酸可操作地连接至第二启动子。
SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQ ID NO:78的核苷酸448-529各自编码靶向PSEN2mRNA的非编码部分中的序列的RNA。SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26和SEQ ID NO:27各自编码靶向PSEN2 mRNA的编码部分中的序列的RNA。SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQ ID NO:78的核苷酸448-529代表miRNA编码序列。上述SEQ ID NO中的任一个的修饰型式中的1、2、3或4个核苷酸变化中的每一个独立地为核苷酸取代、缺失或添加,并导致与内源性野生型PSEN2 mRNA的错配。包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基的19-21个碱基的核苷酸序列所需的另外的核苷酸是能够与PSEN2 mRNA中分别紧接PSEN2 mRNA中与7个或更多个连续碱基结合的区域的5’或3’的区域杂交,同时在整个19-21个碱基的核苷酸序列中仍允许最多至4个错配的那些。例如,SEQ ID NO:20与PSEN2 mRNA的核苷酸110-135杂交(使用NM_000447.3中的编号)(参见本文表3)。因此,取自SEQ ID NO:20的5'端的19-21个碱基的核苷酸序列的实例将包含与PSEN2 mRNA完全互补的核苷酸2-8,并且其他碱基将包含1、2、3或4个核苷酸变化。因此,取自SEQ ID NO:21的3'端的19-21个碱基的核苷酸序列的实例将包含与PSEN2mRNA完全互补的核苷酸2-8,并且其他碱基将包含1、2、3或4个核苷酸变化。
在某些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQ IDNO:78的核苷酸448-529,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(II)编码野生型早老素2(PSEN2)蛋白的第二多核苷酸,其中第二多核苷酸不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向,并且其中第二多核苷酸可操作地连接至第二启动子。SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQ ID NO:78的核苷酸448-529各自编码靶向PSEN2 mRNA的非编码部分中的序列的RNA。SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26和SEQ ID NO:27各自编码靶向PSEN2 mRNA的编码部分中的序列的RNA。SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQID NO:77的核苷酸448-529,以及SEQ ID NO:78的核苷酸448-529代表miRNA编码序列。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:20、SEQ ID NO:21、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQ IDNO:78的核苷酸448-529,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(ii)编码野生型早老素2(PSEN2)蛋白的第二多核苷酸,其中第二多核苷酸表达编码人野生型PSEN2的任何mRNA,并且其中第二多核苷酸可操作地连接至第二启动子。在这些实施方案的一些方面,第二多核苷酸表达mRNA,其中mRNA的编码部分具有与内源性的人野生型PSEN2 mRNA的相同的多核苷酸序列。在这些实施方案的其他方面,表达编码野生型PSEN2的mRNA,其中mRNA的编码部分具有多核苷酸序列,其中与内源性的人野生型PSEN2 mRNA的编码部分相比,一个或多个密码子已经被修饰或优化。在这些实施方案的更具体的方面,第二多核苷酸序列是SEQ ID NO:40。
在一些实施方案中,一种表达盒包含:(I)编码一个或多个shRNA或miRNA的第一多核苷酸,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:20、SEQ ID NO:21、SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31或SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,以及SEQID NO:78的核苷酸448-529;并且其中至少一个shRNA或miRNA包含以下中的一个:SEQ IDNO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:76的核苷酸497-517、SEQ ID NO:77的核苷酸497-517,或SEQ ID NO:78的核苷酸497-517,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(ii)编码野生型早老素2(PSEN2)蛋白的第二多核苷酸,其中第二多核苷酸表达编码人野生型PSEN2并且不被shRNA或miRNA中的任一个靶向的mRNA,并且其中第二多核苷酸可操作地连接至第二启动子。在这些实施方案的一些方面,第二多核苷酸表达编码野生型PSEN2的mRNA,与内源性的人野生型PSEN2 mRNA的编码部分相比,所述mRNA是密码子修饰的。在这些实施方案表达mRNA,所述mRNA在被shRNA或miRNA靶向的那些编码区中包含足够数量的修饰密码子,以防止此类shRNA或miRNA靶向由第二多核苷酸表达的mRNA。
一个或多个第一启动子驱动每个shRNA或miRNA编码序列的表达。每个shRNA或miRNA编码序列可由相同或不同的第一启动子驱动。当由相同的第一启动子驱动时,两个或更多个shRNA或miRNA编码序列的表达可由相同的第一启动子的不同拷贝或由所述第一启动子的单个拷贝驱动。当由第一启动子的单个拷贝驱动时,两个或更多个shRNA或miRNA编码序列将在表达盒中彼此串联定位,使得单个第一启动子可以驱动那些shRNA或miRNA编码序列中的每一个的表达。类似地,驱动替换野生型PSEN1或PSEN2的表达的第二启动子也可驱动shRNA或miRNA编码序列的表达(即,第一启动子和第二启动子是相同的)。当由单个启动子驱动时,shRNA或miRNA编码序列将与表达盒中的PSEN1或PSEN2编码序列串联定位,使得这样的单个第一启动子可以驱动shRNA或miRNA编码序列和PSEN1或PSEN2编码序列的表达。在某些方面,单个启动子可以驱动两个或更多个shRNA或miRNA和PSEN1或PSEN2的表达。在一些实施方案中,一个或多个第一启动子或第二启动子中的至少一个是RNA聚合酶III启动子或RNA聚合酶II启动子。在这些实施方案的一些更具体的方面,RNA聚合酶III启动子选自U6启动子、U61启动子、U69启动子、H1启动子,或其任何组合。在这些实施方案的一些方面,一个或多个第一启动子或第二启动子中的至少一个是RNA聚合酶II启动子,其为神经元特异性启动子。在这些实施方案的一些更具体的方面,第二启动子是RNA聚合酶II启动子,其为神经元特异性启动子。在这些实施方案的其他更具体的方面,第二启动子是RNA聚合酶II启动子,其为遍在启动子(ubiquitous promoter)。
在一些实施方案中,本公开提供了一种包含本文公开的表达盒中的任一个的载体。
在一些实施方案中,本公开提供了一种载体组,其包含(a)包含含有第一多核苷酸的表达盒的第一载体,所述多核苷酸编码靶向由人野生型和突变型早老素1(PSEN1)中的每一者或由人野生型和突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区的一个或多个shRNA或miRNA,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(b)包含第二多核苷酸的第二载体,所述第二多核苷酸编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列,其中第二多核苷酸不被第一载体编码的shRNA或miRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。
在一些实施方案中,本公开提供了一种载体组,其包含(a)包含表达盒的第一载体,所述表达盒包含(a)编码一个或多个shRNA或miRNA的第一多核苷酸,所述shRNA或miRNA靶向由人野生型和突变型早老素1(PSEN1)中的每一者翻译的mRNA的编码区或非编码区,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(b)编码野生型早老素1(PSEN1)氨基酸序列的第二多核苷酸,其中第二多核苷酸不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。
在一些实施方案中,本公开提供了一种载体组,其包含(a)包含表达盒的第一载体,所述表达盒包含(a)编码一个或多个shRNA或miRNA的第一多核苷酸,所述shRNA或miRNA靶向由人野生型和突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及(b)编码野生型早老素2(PSEN2)氨基酸序列的第二多核苷酸,其中第二多核苷酸不被第一多核苷酸编码的shRNA或miRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。
在载体组的一些实施方案中,第一载体中所编码的shRNA或miRNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ IDNO:71的核苷酸448-529;b)前述SEQ ID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基,其中19-21个碱基的核苷酸序列与内源性PSEN1mRNA的相应部分包含不多于4个错配。
在载体组的一些实施方案中,第一载体中所编码的shRNA或miRNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ IDNO:71的核苷酸448-529。在这些实施方案的一些方面,所编码的shRNA或miRNA中的每一个各自独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529。在这些实施方案的其他方面,所编码的shRNA或miRNA中的每一个各自独立地包含以下中的一个:SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:42、SEQ ID NO:43SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529;并且其中至少一个shRNA或miRNA包含以下中的一个:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:42或SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸497-517、SEQ ID NO:69的核苷酸497-517、SEQ ID NO:70的核苷酸497-517,或SEQ ID NO:71的核苷酸497-517。
在载体组的一些实施方案中,当第一载体中的shRNA或miRNA中的每一个靶向存在于内源性PSEN1 mRNA中的非编码区时,第二载体中的第二多核苷酸表达mRNA,其中mRNA的编码部分具有与内源性的人野生型PSEN1 mRNA相同的多核苷酸序列。在这些实施方案的其他方面,表达mRNA,其中mRNA的编码部分具有多核苷酸序列,其中与内源性的人野生型PSEN1 mRNA的编码部分相比,一个或多个密码子已经被修饰或优化。在这些实施方案的更具体的方面,第二多核苷酸序列是SEQ ID NO:39。在这些实施方案的其他更具体的方面,第二多核苷酸序列是SEQ ID NO:48。
在载体组的一些实施方案中,当第一载体中的shRNA或miRNA中的至少一个靶向存在于内源PSEN1 mRNA中的编码区时,第二载体中的第二多核苷酸表达与内源性的人野生型PSEN1 mRNA的编码部分相比经过密码子修饰的mRNA。在这些实施方案表达mRNA,所述mRNA在被shRNA或miRNA靶向的那些编码区中包含足够数量的修饰密码子,以防止此类shRNA或miRNA靶向由第二多核苷酸表达的mRNA。通常,对足够数量的密码子进行修饰以产生多于4个与shRNA或miRNA错配的核苷酸将阻止靶向。在这些实施方案的甚至更具体的方面,第二多核苷酸序列是SEQ ID NO:41。
在载体组的一些实施方案中,第一载体中所编码的shRNA或miRNA中的每一个独立地包含以下中的一个:SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529;b)前述SEQID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基,其中19-21个碱基的核苷酸序列与内源性PSEN2 mRNA的相应部分包含不多于4个错配。
在载体组的一些实施方案中,第一载体中所编码的shRNA或miRNA中的每一个独立地包含以下中的一个:SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529。在这些实施方案的一些方面,所编码的shRNA或miRNA中的每一个各自独立地包含以下中的一个:SEQID NO:20、SEQ ID NO:21、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529。在这些实施方案的其他方面,所编码的shRNA或miRNA中的每一个各自独立地包含以下中的一个:SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31或SEQ ID NO:32、SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529;并且其中至少一个shRNA或miRNA包含以下中的一个:SEQID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQID NO:76的核苷酸497-517、SEQ ID NO:77的核苷酸497-517,或SEQ ID NO:78的核苷酸497-517。
在载体组的一些实施方案中,当第一载体中的shRNA或miRNA中的每一个靶向存在于内源性PSEN2 mRNA中的非编码区时,第二载体中的第二多核苷酸表达mRNA,其中mRNA的编码部分具有与内源性的人野生型PSEN2 mRNA相同的多核苷酸序列。在这些实施方案的其他方面,表达mRNA,其中mRNA的编码部分具有多核苷酸序列,其中与内源性的人野生型PSEN2 mRNA的编码部分相比,一个或多个密码子已经被修饰或优化。在这些实施方案的更具体的方面,第二多核苷酸序列是SEQ ID NO:40。
在载体组的一些实施方案中,当第一载体中的shRNA或miRNA中的至少一个靶向存在于内源PSEN2 mRNA中的编码区时,第二载体中的第二多核苷酸表达与内源性的人野生型PSEN2 mRNA的编码部分相比经过密码子修饰的mRNA。在这些实施方案表达mRNA,所述mRNA在被shRNA或miRNA靶向的那些编码区中包含足够数量的修饰密码子,以防止此类shRNA或miRNA靶向由第二多核苷酸表达的mRNA。通常,对足够数量的密码子进行修饰以产生多于4个与shRNA或miRNA错配的核苷酸将防止靶向。
前述实施方案中的任一个中的各载体可以是病毒载体,如腺相关病毒(AAV)载体、逆转录病毒载体、慢病毒载体或腺病毒载体。AAV载体可以是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVDJ、AAVrh10、AAV11、AAV12、AAV2/1、AAV2/5、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2/rh10、AAV2/11或AAV2/12,以及衣壳工程改造的腺相关病毒,其所具有的混合衣壳融合了两种或更多种天然AAV的部分和/或天然AAV的点突变以改变嗜性或逃避免疫检测,如PHP.B和PHP.B衍生物[PHP.eR、PHP.S]、AAV8[K137R]、AAV-TT、rAAV-retro、AAV9.HR、AAV1 CAM突变体、AAV9[586-590]交换突变体。载体或载体组可以是具有或不具有运载体如聚胺的质粒载体。
在其他实施方案中,本文提供的是包含本文提供的载体或载体组的试剂盒。
在其他实施方案中,提供了SEQ ID NO:41的分离多核苷酸。
在其他实施方案中,提供了一种试剂盒,其包含:(a)一种或多种反义寡核苷酸,其中各反义寡核苷酸独立地靶向由人野生型和突变型早老素1(PSEN1)中的每一者、人野生型或突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区;以及(b)包含编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列的多核苷酸的载体,其中第二多核苷酸不被一种或多种反义寡核苷酸中的任一种靶向;并且其中多核苷酸可操作地连接至载体中的启动子。在这些实施方案的一些方面,一种或多种反义寡核苷酸中的每一种靶向由人野生型和突变型早老素1(PSEN1)中的每一者翻译的mRNA的编码区或非编码区;并且载体包含编码野生型早老素1(PSEN1)氨基酸序列的多核苷酸。
在前一段中描述的试剂盒的一些实施方案中,一种或多种反义寡核苷酸中的每一种独立地选自短发夹RNA(shRNA)、短干扰RNA(siRNA)、小干扰RNA(miRNA)、小时序RNA(stRNA)或内切核糖核酸酶制备的siRNA(esiRNA)。在这些实施方案的一些方面,一种或多种反义寡核苷酸中的至少一种包含一个或多个修饰核碱基。在这些实施方案的一些更具体的方面,一个或多个修饰核碱基中的每一个独立地选自非天然存在的核碱基、锁核酸(LNA)或肽核酸(PNA)。
另一个实施方案提供了治疗神经退行性疾病、病症或病状的方法,其中所述方法包括向有需要的受试者施用以下各项的步骤:
(a)以下中的任一种:
(i)一种或多种反义寡核苷酸,其中各反义寡核苷酸独立地靶向由人野生型和突变型早老素1(PSEN1)中的每一者、人野生型或突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区,或
(ii)包含第一多核苷酸的载体,所述第一多核苷酸编码靶向由人野生型和突变型早老素1(PSEN1)中的每一者或由人野生型和突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区的一个或多个shRNA或miRNA,其中一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及
(b)包含编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列的第二多核苷酸的载体,其中第二多核苷酸不被第一载体编码的shRNA或miRNA中的任一个靶向;并且其中第二多核苷酸可操作地连接至第二启动子。
在这些实施方案的一些方面,编码一个或多个shRNA或miRNA的第一多核苷酸和编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列的第二多核苷酸存在于同一载体中。此类载体在上文中被描述为包含本文公开的任何表达载体。在这些实施方案的替代方面,编码一个或多个shRNA或miRNA的第一多核苷酸和编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列的第二多核苷酸存在于不同载体(即,载体组)中。此类载体组也在本文公开。在这些实施方案的其他替代方面,靶向由人野生型和突变型早老素1(PSEN1)中的每一者、人野生型或突变型早老素2(PSEN2)中的每一者翻译的mRNA是通过施用反义RNA分子来实现的。此类反义RNA分子也在本文公开。在这些实施方案的某些方面,神经退行性疾病、病症或病状是阿尔茨海默氏病、散发性阿尔茨海默氏病、家族性阿尔茨海默氏病、额颞叶痴呆、额颞叶变性、匹克氏病(Pick’s disease)、路易体痴呆(Lewy body dementia)、记忆丧失、认知损害或轻度认知损害。
附图说明
图1是pAT049的质粒图谱。
图2是pAT050的质粒图谱。
图3是pAT051的质粒图谱。
图4是pAT052的质粒图谱。
图5是pAT053的质粒图谱。
图6是pAT054的质粒图谱。
图7是pAT055的质粒图谱。
图8是pAT056的质粒图谱。
图9是pAT057的质粒图谱。
图10是pAT058的质粒图谱。
图11是pAT059的质粒图谱。
图12是pAT060的质粒图谱。
图13是pAT061的质粒图谱。
图14是pAT062的质粒图谱。
图15是表示在用编码外源性PSEN1和与内源性PSEN1特异性杂交的miRNA靶向序列 的不同质粒转染后HEK293细胞中的内源性PSEN1(白色条柱)和质粒编码的(外源性)PSEN1转录物(黑色条柱)的水平的条形图。将外源性和内源性转录物水平与作为对照的未转染细 胞、使用空载体(EV)的处理,以及使用编码外源性PSEN1而没有任何miRNA的载体的处理相 比较。
图16A和16B是表示在用编码外源性PSEN2和与内源性PSEN2特异性杂交的miRNA靶 向序列的不同质粒转染后HEK293细胞中的内源性PSEN1(图16A)和质粒编码的(外源性) PSEN2(图16B)的水平的条形图。将外源性和内源性转录物水平与未转染细胞以及使用空载 体(EV)的处理相比较。
定义
除非另有定义,否则本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。虽然可以在本发明测试的实践中使用类似于或等效于本文所述的那些方法和材料的任何方法和材料,但本文描述优选的材料和方法。在描述和要求保护本发明时,将使用以下术语。还应理解,本文所使用的术语仅是用于描述特定实施方案的目的,并且不意图具限制性。
冠词“一个”和“一种”在本文中用于指代一个/种或多于一个/种(即,至少一个/种)该冠词的语法对象。例如,“一个/种元件”是指一个/种元件或多于一个/种元件。因此,例如“一个/种细胞”的引用包括多个/种相同类型的细胞。此外,就在具体实施方式和/或权利要求中使用术语“包括(including)”、“包括(includes)”、“具有(having)”、“具有(has)”、“具有(with)”或其变体而言,此类术语旨在为包括性的,其方式类似于术语“包含(comprising)”。
如本文所用,当提及可测量的值(如量、持续时间等)时,“约”旨在涵盖与指定值相差+/-20%、+/-10%、+/-5%、+/-1%或+/-0.1%的变型,因为此类变型适合执行所公开的方法。可替代地,特别是关于生物系统或工艺,该术语可以表示在值的5倍以内以及2倍以内的数量级内。在申请和权利要求中描述了特定值的情况下,除非另外说明,否则应假定术语“约”意指在特定值的可接受误差范围内。
如本文所用,术语“反义寡核苷酸”是指RNA或者单链或双链DNA分子,其至少一部分通过杂交与另一RNA或DNA(靶RNA、DNA)结合。与其靶标杂交的反义寡核苷酸的部分称为“反义部分”。例如,如果反义寡核苷酸是RNA寡核苷酸,则其反义部分通过RNA-RNA相互作用与另一RNA靶标结合并改变靶RNA的活性。本文所用的反义寡核苷酸下调PSEN1或PSEN2的表达。术语“反义寡核苷酸”意在包括,例如,反义RNA或DNA分子、干扰RNA(RNAi)、小干扰RNA(miRNA)、siRNA、短发夹RNA(shRNA)、外部引导序列(EGS)寡核苷酸、可变剪接体,以及包含一个或多个修饰核碱基的前述各项中的任一个。因此,这些化合物可以单链、双链、部分单链或环状寡聚化合物的形式引入。
当化合物与靶核酸的结合干扰靶核酸的正常功能以导致功能和/或活性的调节,并且存在足够程度的互补性以避免反义化合物与非靶核酸序列在期望特异性结合的条件下(即,在体内测定或治疗性治疗情况下的生理条件下,以及在体外测定情况下的进行测定的条件下)非特异性地结合时,反义寡核苷酸是“可特异性地杂交的”。
如本文所用,“互补”是指一条或两条寡聚链上的两个核苷酸之间精确配对的能力。例如,如果反义多核苷酸的某个位置上的核碱基能够与靶核酸的某个位置上的核碱基氢键合,所述靶核酸为DNA、RNA或寡核苷酸分子,那么寡核苷酸与靶核酸之间的氢键合的位置被视为互补位置。当每个分子中足够数量的互补位置被可以彼此氢键合的核苷酸占据时,寡聚寡核苷酸和另外的DNA、RNA或寡核苷酸分子是彼此互补的。因此,“可特异性地杂交”和“互补”是用于指示在足够数量的核苷酸上足够程度的精确配对或互补性使得在寡聚化合物与靶核酸之间发生稳定且特异性的结合的术语。
在本领域中应该理解,反义寡核苷酸的序列不需要与其可特异性杂交的靶核酸的序列100%互补。此外,寡核苷酸可在一个或多个区段上杂交,使得中间或相邻区段不涉及杂交事件(例如,环结构、错配或发夹结构)。本发明的反义寡核苷酸通常与其靶向的PSEN1或PSEN2核酸序列的部分含有不多于4个、不多于3个、不多于2个、不多于1个错配或不包含错配。
如本文所用,术语“错配”是指:1)反义寡核苷酸的反义部分中的核苷酸不能与其靶mRNA碱基配对或反之亦然;或2)反义寡核苷酸的反义部分中的核苷酸不能与所述反义寡核苷酸中的其有义部分碱基配对。由于核苷酸的取代、缺失或添加,反义寡核苷酸的反义部分可与其靶mRNA或有义部分具有错配。每个被取代、缺失或添加的核苷酸都被认为是单独的错配。
如本文所用,在提及项目、组合物、设备、方法、过程、系统等的所定义或所描述的要素时,术语“包括(comprising)”、“包含(comprise)”或“包含(comprised)”及其变型意在为包括性的或开放式的,允许另外的要素,从而表明所定义或所描述的项目、组合物、设备、方法、过程、系统等包括那些指定要素——或,在适当时,其等效物——并且其他要素可以被包括并且仍落入所定义的项目、组合物、设备、方法、过程、系统等的范围/定义之内。
如本文所用,术语“表达”定义为由启动子驱动的从DNA序列转录mRNA和/或从mRNA序列翻译特定氨基酸序列。
如本文所用,术语“表达盒”是指编码并能够产生一种或多种期望表达产物(RNA或蛋白质)的DNA序列。产生这种期望的表达产物需要存在与编码所述产物的DNA序列可操作地连接的各种表达控制序列。此类控制序列包括启动子以及其他非编码核苷酸序列。表达盒可不包括、包括一些或所有这些表达控制序列。如果表达盒中不存在这些表达控制序列中的一些或全部,那么它们由表达盒所插入其中的载体提供。
如本文所用,“受试者”是指人。术语“患者”、“个体”和“受试者”在本文可互换使用。受试者可以是先前已被诊断为患有或被鉴定为罹患或患有需要治疗的病状(例如,脑肿瘤)或与所述病状相关的一种或多种并发症,并且任选地,已经经历了针对所述病状或与所述病状相关的一种或多种并发症的治疗的受试者。可替代地,受试者也可以是先前未被诊断为患有病状或与所述病状相关的一种或多种并发症的受试者。例如,受试者可以是表现出病状或与所述病状相关的一种或多种并发症的一种或多种风险因素的受试者,或不表现出风险因素的受试者。“需要针对特定病状(例如神经退行性病状)的治疗的受试者”可以是疑似患有所述病状、被诊断为患有所述病状、已经针对所述病状进行治疗或正在针对所述病状进行治疗、未针对所述病状进行治疗,或有发展所述病状的风险的受试者。
如本文所用,术语“多核苷酸”是指20或更多个核苷酸的序列。多核苷酸可以是RNA、DNA或杂交RNA或DNA分子;并且可以是单链或双链。在某些实施方案中,多核苷酸是单链或双链DNA分子。
关于核酸序列,例如由PSEN1或PSEN2编码的mRNA,术语“靶向(target)”及其各种形式(例如,“靶向(targeted)”、“靶向(targeting)”)是指反义寡核苷酸被设计成与所述核酸序列的一部分特异性杂交,从而导致所述核酸序列的表达减少或消除。
关于PSEN1的术语“野生型”是指由SEQ ID NO:39编码的氨基酸序列,无论是内源性地存在于受试者体内还是由施用给受试者的多核苷酸编码。关于PSEN2的术语“野生型”是指由SEQ ID NO:40编码的氨基酸序列,无论是内源性地存在于受试者体内还是由施用给受试者的多核苷酸编码。
如本文所用,术语“内源性”是指天然存在于人受试者中的基因或mRNA的形式。编码PSEN1或PSEN2的内源性基因或mRNA包括编码野生型PSEN1或PSEN2的序列,以及编码天然存在于人受试者体内的PSEN1或PSEN2的突变形式的那些。
术语“调控元件”是指多核苷酸或载体的非编码部分,其对于所述多核苷酸的编码部分的表达是必需的和/或增强所述表达。调控元件的实例包括但不限于启动子、增强子、多聚腺苷酸化信号、染色质隔离子、翻译起始序列如强和弱Kozak信号序列以及内部核糖体进入位点、mRNA稳定性序列、影响mRNA加工如剪接和切割的序列、影响mRNA从细胞核输出和/或mRNA保留的序列、翻译后响应元件、非编码序列如内含子和非翻译区(UTR)、多聚A序列、阻遏子、沉默子、终止子等。
如本文所用,“可操作地连接(operably linked)”、“可操作地连接(operablelinkage)”、“可操作地连接(operatively linked)”或其语法等效物是指遗传元件的并置,例如通常为编码表达产物(即蛋白质或RNA)的多核苷酸和非编码调控元件,其中元件处于允许它们以预期方式操作的关系。例如,当启动子和编码期望表达产物的多核苷酸彼此并置,使得启动子可以驱动多核苷酸的表达时,所述启动子“可操作地连接”至所述多核苷酸。
如本文所用,术语“密码子修饰的”是指编码与天然存在的蛋白质(即,野生型PSEN1或野生型PSEN2)相同的氨基酸序列的DNA或RNA序列,其中,由于遗传密码子的冗余性,与编码所述蛋白质的内源性DNA或RNA相比,至少一个密码子发生了改变。
如本文所用,术语“密码子优化的”是指密码子修饰的DNA或RNA序列,其中修饰的密码子选自表1中列出的偏好密码子或最偏好密码子。
在任何氨基酸序列通过Swiss Prot.或GENBANK登录号具体提及的情况下,所述序列通过引用并入本文。与登录号相关的信息,如信号肽、细胞外结构域、跨膜结构域、启动子序列和翻译起点的鉴定,也通过引用整体并入本文。
基因:本文公开的所有基因、基因名称和基因产物旨在对应于本文公开的组合物和方法适用的人同源物或突变形式。
范围:在整个本公开中,本发明的各个方面可以以范围格式呈现。应当理解,范围格式的描述仅仅是为了方便和简洁,并且不应理解为对本发明范围的僵化限制。因此,范围的描述应被视为已经具体公开了所有可能的子范围以及所述范围内的个别数值。例如,如1至6的范围的描述应被视为具有具体公开的子范围,如1至3、1至4、1至5、2至4、2至6、3至6等,以及所述范围内的个别数字,例如1、2、2.7、3、4、5、5.3和6。无论范围的宽度如何,这都适用。
具体实施方式
本公开提供了组合物,其包含(1)用于沉默PSEN1和/或PSEN2mRNA的内源性形式的反义寡核苷酸(或编码它们的多核苷酸);和(2)编码野生型PSEN1和/或PSEN2以替换那些蛋白质的相应沉默形式的多核苷酸,以及利用此类组合物治疗神经退行性病症如阿尔茨海默氏病的方法。
多核苷酸
在某些实施方案中,反义寡核苷酸和野生型PSEN1和/或PSEN2中的每一个由多核苷酸编码。编码反义寡核苷酸的多核苷酸的长度通常比编码野生型PSEN1和/或PSEN2的多肽短,并且可以在实验室中合成,例如,使用自动合成仪,使用标准分子生物学和克隆技术或合成和克隆的组合由其他预先存在的多核苷酸产生。编码野生型PSEN1和/或PSEN2的多核苷酸也可以在实验室中合成,例如,使用自动合成仪,使用标准分子生物学和克隆技术由其他预先存在的多核苷酸产生,由存在于例如哺乳动物如人的核酸序列(例如,作为基因组片段或作为由天然存在的或合成的mRNA逆转录的cDNA)获得,或前述的任何组合。此外,最初从天然来源获得或产生的多核苷酸中的任何期望变化(即,密码子修饰)可以通过标准分子生物学技术获得,如定点诱变或原始多核苷酸的一部分的去除和替换。分子生物学领域的普通技术人员可以使用标准工具和方案在不进行过度实验的情况下产生用于本发明的多核苷酸。
本公开的多核苷酸可以在使用或插入表达盒和/或载体之前分离。分离的多核苷酸包括和与其天然相关的5'和3'侧翼基因组序列中的一者或两者不直接邻接的天然存在的多核苷酸。分离的多核苷酸可以是,例如,任何长度的重组DNA分子,条件是紧邻天然存在的基因组中的重组DNA分子的侧翼天然存在的核酸序列被去除或不存在。分离的多核苷酸还包括非天然存在的核酸分子。
除非另有说明,否则术语多核苷酸或基因包括对指定序列以及其互补序列的提及。
反义寡核苷酸
在本文公开的本发明表达盒、载体和方法中使用的反义寡核苷酸被设计为与内源性PSEN1或PSEN2 mRNA杂交并阻止其表达。如上所述,内源性PSEN1或PSEN2 mRNA包括野生型形式和天然存在的突变形式。本领域技术人员将容易认识到,与野生型PSEN1 mRNA的靶区域完全互补的反义寡核苷酸的反义部分必然将与具有发生在靶区域中的一个或多个突变的突变型PSEN1 mRNA具有一个或多个错配。虽然可以容许最多至4个错配并仍导致靶mRNA的表达降低,但完全互补性增大完全抑制mRNA表达的机会。为此,在一些实施方案中,至少一种反义寡核苷酸具有与部分野生型PSEN1 mRNA完全互补的反义区域;并且至少一种反义寡核苷酸具有与将要递送反义寡核苷酸的受试者中存在的突变型PSEN1 mRNA的一部分完全互补的反义区域。应当理解,如果反义寡核苷酸靶向PSEN1 mRNA的非内源性突变的区域,则所述反义寡核苷酸的反义部分将与在受试者中存在的野生型和突变形式的相应区域完全互补。如果反义寡核苷酸的反义部分靶向PSEN1 mRNA的包含突变的区域,则必须使用各自靶向PSEN1 mRNA的不同区域的两种或更多种反义寡核苷酸,以获得与野生型和突变型PSEN1 mRNA的完美互补。在一些实施方案中,使用两种或更多种反义寡核苷酸,即使一种能够与野生型和突变型PSEN1 mRNA完全互补。
在一些实施方案中,本公开的反义寡核苷酸由在受试者中表达的多核苷酸编码(即,使用基因疗法)。在此类实施方案中,反义寡核苷酸通过存在于施用给受试者的载体上的编码反义寡核苷酸的DNA多核苷酸的表达产生。此类所编码的反义寡核苷酸包括shRNA和miRNA。
在一些实施方案中,本公开的反义寡核苷酸离体产生并直接施用给受试者。用于直接递送此类寡核苷酸的方法是本领域已知的并且包括使用基于脂质的纳米颗粒(即,脂质体、固体脂质纳米颗粒、纳米结构脂质运载体)、基于聚合物的递送系统(即,阳离子聚合物,如天然DNA-结合蛋白、合成多肽、聚乙烯亚胺以及基于碳水化合物的聚合物如壳聚糖)、脂质-聚合物杂化纳米颗粒(lipid-polymer hybrid nanoparticle)、外泌体以及高密度脂蛋白。此类直接施用的反义寡核苷酸包括dsRNA、miRNA、dsRNA、外部引导序列(EGS)、可变剪接体,以及包含一个或多个非天然核碱基的任何反义寡核苷酸。靶向PSEN1 mRNA的此类直接递送的反义寡核苷酸的实例是包含由以下各项编码的RNA序列的那些:a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQID NO:33、SEQ ID NO:35、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529,或SEQ ID NO:71的核苷酸448-529;b)前述SEQ ID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基,其中19-21个碱基的核苷酸序列与内源性PSEN1 mRNA的相应部分包含不多于4个错配。靶向PSEN2 mRNA的此类直接递送的反义寡核苷酸的实例为包含由以下各项中的任一个编码的RNA序列的那些:a)SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529;b)前述SEQ ID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基,其中19-21个碱基的核苷酸序列与内源性PSEN1mRNA的相应部分包含不多于4个错配。
RNA干扰(RNAi)通过靶向互补mRNA使其降解来诱导基因沉默。RNAi的第一步骤涉及将较长的双链RNA加工和切割成siRNA,其通常在每条链的3'端携带2个核苷酸的突出端。负责这种加工的酶是被称为切丁酶(Dicer)的RNA酶III样酶。在形成后,siRNA与被称为RISC(RNA诱导的沉默复合物)的多蛋白组分复合物结合。在RISC复合物中,siRNA链被分离,并且具有更稳定的5'端的链(被称为引导链)通常被整合到活性RISC复合物中。RISC中的负载是不对称的,并且热力学稳定性较差的链或“过客链(passenger strand)”被丢弃。引导链理想地是反义链,并且可采用本申请中讨论的和本领域已知的各种策略来有利被选择为引导链的反义链。单链siRNA引导链接着将RISC复合物引导并排列在靶mRNA上,并且通过argonaute家族(Ago2)成员催化性RISC蛋白的作用,将mRNA切割(Dana H,Chalbatani GM,Mahmoodzadeh H等人Molecular Mechanisms and Biological Functions of siRNA.IntJ Biomed Sci.2017;13(2):48-57)。
内源性PSEN1、PSEN2或者PSEN1或PSEN2突变体的表达、功能和/或稳定性的调节剂可以是用于RNA干扰的双链RNA分子,例如shRNA或miRNA。RNA干扰(RNAi)是通过转录后RNA降解或沉默(防止翻译)实现序列特异性基因沉默的过程。RNAi是通过使用在序列上与待沉默的靶基因同源的双链RNA(dsRNA)启动的。适合用于RNAi的双链RNA(dsRNA)包含与待靶向的基因相对应的约21个连续核苷酸的有义链和反义链,其形成19个RNA碱基对,在每个3'端留下两个核苷酸的突出端(Elbashir等人,Nature 411:494-498(2001);Bass,Nature 411:428-429(2001);Zamore,Nat.Struct.Biol.8:746-750(2001))。约25-30个核苷酸的dsRNA也已成功用于RNAi(Karabinos等人,Proc.Natl.Acad.Sci.USA 98:7863-7868(2001)。dsRNA也可以在体外合成并通过本领域已知的方法引入细胞中。
在一些实施方案中,本公开的siRNA分子包含有义链和互补的反义链,其中两条链杂交在一起形成双链体结构并且其中与PSEN1 mRNA杂交的起始位点在mRNA序列(对应于GenBank NM_000021.4cDNA序列)上的核苷酸1至5999之间。
在某些实施方案中,本公开的siRNA分子包含有义链和互补的反义链,其中两条链杂交在一起形成双链体结构,并且其中杂交的起始位点在PSEN2 mRNA序列(GenBank NM_000447)上的核苷酸1至2230之间。
在一些实施方案中,反义寡核苷酸包括:核糖核酸(RNA)、脱氧核糖核酸(DNA)、合成的RNA或DNA序列、修饰的RNA或DNA序列、互补DNA(cDNA)、短向导RNA(sgRNA)、短干扰RNA(dsRNA)、双链DNA(dsDNA)、小干扰RNA(miRNA)、小时序RNA(stRNA)、短发夹RNA(shRNA)、mRNA、包含一个或多个修饰的核碱基或骨架的核酸序列,或其组合。反义分子的另一个实例是双链小干扰RNA(siRNA)或内切核糖核酸酶制备的siRNA(esiRNA)。esiRNA是siRNA寡核苷酸的混合物,由内切核糖核酸酶(如大肠杆菌(Escherichia coli)RNA酶III或切丁酶)对长双链RNA(dsRNA)的切割产生。esiRNA是使用化学合成的siRNA进行RNA干扰(RNAi)的替代概念。esiRNA是长双链RNA的体外酶促消化。
可以使用任何方法或方法的组合来降低基因或蛋白质的表达,包括例如通过诸如siRNA和反义寡核苷酸的技术进行敲低。可以使用适当保护的核糖核苷亚磷酰胺和常规RNA合成仪化学合成本公开的沉默多核苷酸分子如dsRNA、dsDNA或寡核苷酸。RNA合成试剂的供应商包括Proligo(Hamburg,Germany)、Dharmacon Research(Lafayette,Colo.,USA)、Pierce Chemical(Perbio Science的一部分,Rockford,Ill.,USA)、Glen Research(Sterling,Va.,USA)、ChemGenes(Ashland,Mass.,USA)和Cruachem(Glasgow,UK)。
在一些实施方案中,反义寡核苷酸是siRNA或siRNA的前体(例如,shRNA或miRNA)。siRNA是具有多核苷酸有义链和多核苷酸反义链的双链RNA分子。siRNA分子的每条链的长度为15至30个核苷酸。反义链的至少15个核苷酸(并非所有所述核苷酸都必须是连续的)应与内源性PSEN1或PSEN2 mRNA的一部分碱基配对。有义链的至少一部分与反义链的至少一部分互补,并且siRNA分子具有长度为15至30个核苷酸的双链体区域(并非所有所述核苷酸都必须是连续的)。在这些实施方案的一些方面,siRNA的双链体区域的长度为19-27个碱基对(例如,19-21个碱基对,例如,19个碱基对),其中每条链上具有另外的两个核苷酸的3'突出端。在这些实施方案的一些方面,反义链中的第一核苷酸是尿嘧啶(U)。在这些实施方案的一些方面,反义链的核苷酸2-8与PSEN1或PSEN2 mRNA的一部分完全互补。在这些实施方案的一些方面,反义链将与其靶向的PSEN1或PSEN2 mRNA具有1、2、3或4个错配。在这些实施方案的一些方面,那些错配位于反义链的核苷酸1、10、11和17-21中的最多四个处。反义链也可与有义链具有最多至4个错配。这有利于在有义链与反义链之间形成的双链体的体内解配对,从而释放反义链并使其能够与PSEN1或PSEN2 mRNA杂交。P Angart等人,Pharmaceuticals 2013,6,第440-68页中公开了siRNA分子的设计和与靶mRNA潜在错配的位置,其公开内容通过引用并入本文。
在一些实施方案中,反义寡核苷酸可以是分离的。在另一个实施方案中,反义寡核苷酸可以是重组的、合成的和/或修饰的,或以任何其他方式非天然的或不是天然产物。如上所述,本发明的反义寡核苷酸可通过使用非天然核苷酸进行修饰,或者可与另一化学部分缀合。例如,此类化学部分可以是赋予增加的稳定性或细胞/细胞核穿透或靶向的异源核酸,或者可以是赋予此类特性的非核酸化学部分,或者可以是标记。
反义寡核苷酸内的任何核苷酸可以通过包括与其偶联的取代基进行修饰,诸如在2'修饰中。可以用不同组的小分子和/或缀合物修饰反义寡核苷酸。本公开的反义寡核苷酸,例如dsRNA和dsDNA,可包含修饰的核苷酸,如锁核酸(LNA)。LNA核苷酸的核糖部分用连接2'氧和4'碳的额外的桥进行修饰。桥将核糖“锁定”在3'-内型(North)构象中,这在A型双链体中很常见。无论何时期望,都可以将LNA核苷酸与寡核苷酸中的DNA或RNA残基混合。此类低聚物是化学合成的并且是可商购获得的。锁定的核糖构象增强了碱基堆积和骨架预组织。这显著提高了寡核苷酸的杂交特性(解链温度)。
在某些实施方案中,反义寡核苷酸是shRNA或miRNA。在某些实施方案中,反义寡核苷酸是靶向由人野生型或突变型早老素1翻译的mRNA的编码区或非编码区的shRNA或miRNA。在某些实施方案中,反义寡核苷酸是靶向由人野生型或突变型早老素2翻译的mRNA的编码区或非编码区的shRNA或miRNA。
例如,可以将通过衍生自shRNA或miRNA的siRNA实现的敲低与任何其他方法相组合,以将基因或蛋白质表达减少期望的量。在一些实施方案中,与未处理细胞中的内源性PSEN1表达相比,内源性PSEN1的表达减少至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%。99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%。在这些实施方案的一些方面,内源性PSEN1的表达减少至少50%。在这些实施方案的一些方面,内源性PSEN1的表达减少至少90%。在这些实施方案的一些方面,内源性PSEN1表达(野生型和任何突变形式)被衍生的siRNA完全消除。
在一些实施方案中,与未处理细胞中的内源性PSEN2表达相比,内源性PSEN2的表达减少至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%。99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%。在这些实施方案的一些方面,内源性PSEN1表达(野生型和任何突变形式)被衍生的siRNA完全消除。
短发夹RNA(shRNA)。在某些实施方案中,反义寡核苷酸是短发夹RNA(shRNA)。短发夹RNA包含反义部分、基本互补的有义部分以及其间的短间隔子,所述短间隔子在形成于基本互补的反义链与有义链之间的双链体之间形成环。环(或发夹)在体内被切丁酶识别和切割,产生双链siRNA分子。
微小RNA。在一些实施方案中,本文所述的治疗组合物和方法通过改变天然的初始miRNA(pri-miRNA)或前体miRNA(pre-miRNA)簇的种子序列以靶向内源性PSEN1或PSEN2mRNA来利用miRNA途径。含有初始miRNA的发夹依次被两种RNA酶III酶(细胞核中的Drosha和细胞质中的切丁酶)切割,以分别产生~70个核苷酸的前体miRNA和21-23个核苷酸的miRNA。前体miRNA通过Exportin-5转运至细胞质,并由切丁酶进一步加工以产生短的、部分双链的siRNA,其中一条链包含反义部分并且优选用作miRNA引导链。
在某些实施方案中,沉默多核苷酸是微小RNA(miRNA)或前体微小RNA(pre-miRNA),两者在整个本申请中均称为miRNA。在一些实施方案中,第一多核苷酸编码一种、两种或三种miRNA或前体miRNA以阻抑PSEN1、PSEN2或其组合的表达。前体miRNA和miRNA包含19-25个核苷酸长的RNA序列,所述序列与PSEN1或PSEN2 mRNA中的互补序列结合,并通过降低核酸分子稳定性或抑制翻译来下调基因表达。miRNA或前体miRNA序列包含“种子”区域,即成熟微小RNA的5'端2-7位区域中的序列,所述序列与PSEN1或PSEN2 mRNA靶序列具有完美的沃森-克里克(Watson-Crick)互补性。miRNA或前体miRNA还将具有与PSEN1或PSEN2mRNA靶序列碱基配对的另外的核苷酸。miRNA介导的基因表达下调可由靶mRNA的切割、靶mRNA的翻译抑制或mRNA衰变引起。miRNA靶向序列通常位于靶mRNA的3'-UTR中。内源性PSEN1或PSEN2 mRNA可被多于一种miRNA靶向。在这些实施方案的一些方面,编码一种或多种miRNA或前体miRNA的多核苷酸位于多核苷酸序列或表达盒的内含子内。
在一些实施方案中,本文所述的治疗组合物和方法通过改变天然miRNA的种子序列以靶向内源性PSEN1或PSEN2基因来利用miRNA途径。在一个实施方案中,靶向PSEN1或PSNE2 mRNA的shRNA或miRNA包含针对引导链的miRNA种子匹配。在另一个实施方案中,靶向PSEN1或PSNE2 mRNA的siRNA双链体或所编码的dsRNA包含针对过客链的miRNA种子匹配。
在一个实施方案中,靶向PSEN1或PSEN2 mRNA的shRNA或miRNA的3'茎臂的部分可与5'茎臂中的过客链部分部分互补。
在一个实施方案中,与有义链(将有利于作为过客链)相比,与切丁酶结合并靶向PSEN1或PSEN2 mRNA的shRNA或miRNA的反义链将更高度有利地作为引导链。在一个实施方案中,shRNA或miRNA的有义链部分被工程改造为与反义部分具有1、2、3或4个错配,以便有利于将反义链加载到RISC中作为引导链。
shRNA或miRNA是具有第一区域、环或发夹区域以及第二区域的RNA分子。第一和第二区域可以彼此基本上互补。在一些实施方案中,第一和第二区域彼此完全互补。因此,shRNA和miRNA可以具有茎-环结构。如本文所用,术语“互补(complementary)”和“互补性(complementarity)”意在指多核苷酸彼此形成碱基对的能力。碱基对通常通过反平行多核苷酸链中的核苷酸之间的氢键形成。互补的多核苷酸链可以沃森-克里克方式(例如,A与T、A与U、C与G)或以允许形成双链体的任何其他方式碱基配对。如本领域技术人员所理解的,当使用RNA而不是DNA时,尿嘧啶而不是胸腺嘧啶是被认为与腺苷互补的碱基。
完全互补性或100%互补性是指一条多核苷酸链的每个核苷酸可以与反平行多核苷酸链的核苷酸氢键合的情况。不完全互补是指两条链的一些但不是全部核苷酸可以彼此氢键合的情况。例如,对于两个20聚体,如果每条链上只有两个碱基对可以彼此氢键合,则多核苷酸链表现出10%的互补性。又如,如果每条链上的20个核苷酸中的18个核苷酸可以彼此氢键合,则多核苷酸链表现出90%的互补性。“基本互补性”是指多核苷酸链表现出79%或更大的互补性,不包括经选择为非互补的多核苷酸链的区域,如突出端。因此,互补性不考虑经选择与反平行链上的核苷酸不相似或不互补的突出端,除非上下文另有明确说明。
shRNA和miRNA的环可以长约4至30个核苷酸。在一些实施方案中,环的长度可以在约4与约15个核苷酸之间。第一和第二区域的长度可以在约19与约35个核苷酸之间。在一些实施方案中,第一和第二区域的长度为19个核苷酸、20个核苷酸、21个核苷酸、22个核苷酸、23个核苷酸、24个核苷酸、25个核苷酸、26个核苷酸、27个核苷酸、28个核苷酸、29个核苷酸或30个核苷酸。第一和第二区域可以具有相同的长度或者可以具有不同的长度。第一和第二区域的长度可以相差1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸或更多。长度差异可以表现为凸起(bulge)或突出端。
shRNA和miRNA可以以5'-反义-环-有义-3'方式或5'-有义-环-反义-3'方式组织。如本文所用,术语“反义链”是指与目标靶核酸至少基本上(例如,约80%或更多)互补的多核苷酸或多核苷酸区域。反义链与目标靶核酸的互补性可以为约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、约100%,以及其间的任何数值或范围。类似地,dsRNA的反义链可以与其有义链至少基本上互补。
shRNA和miRNA反义寡核苷酸可以包括除反义区域、有义区域和环或接头区域之外的核苷酸。例如,这些反义寡核苷酸还可以包含突出端核苷酸和与其他茎核苷酸互补但与靶标不互补的另外的茎核苷酸。shRNA或miRNA的反义和有义区域可以包括错配(即不完全互补)。例如,有义和反义区域可以具有1个错配、2个错配、3个错配、4个错配、5个错配或更多错配。错配可以是连续的,或者可以位于沿有义和反义区域的任何位置。有义与反义区域之间的错配可以导致凸起。在一些实施方案中,反义区域可以与有义区域完全互补。在一些实施方案中,shRNA或miRNA的反义和有义区域具有
shRNA或miRNA的反义部分与PSEN1或PSEN2 mRNA的靶区域之间的互补性程度对于确定mRNA沉默的程度很重要。在某些实施方案中,shRNA或miRNA的反义部分与PSEN1或PSEN2 mRNA的一部分完全互补。这通常导致PSEN1或PSEN2 mRNA降解,而不产生内源性蛋白质。在某些实施方案中,shRNA或miRNA的mRNA结合部分与PSEN1或PSEN2 mRNA的靶区域包含1、2、3或4个错配。反义区域与靶mRNA之间的一个或多个错配可以导致翻译阻遏而不是靶mRNA的降解。mRNA结合靶标可以处于PSEN1或PSEN2 mRNA的任何区域。在某些实施方案中,shRNA靶向的序列包含约30%至约50%GC的GC含量。在某些实施方案中,靶向序列包含4个或更少的连续T残基。应当理解,在shRNA或miRNA中,反义区域可以与有义区域完全互补,但相对于靶mRNA则具有1、2、3或4个错配。类似地,反义区域可以与shRNA或miRNA的有义区域具有错配,而反义区域则与靶mRNA完全互补。
在一些实施方案中,本文所述的治疗组合物和方法通过将1、2、3、4、5或6个初始miRNA或前体miRNA组合在相同启动子下来在不同位点靶向内源性PSEN1或PSEN2 mRNA。靶位点序列可包含总共5-100个或更多个核苷酸,它们不必须是连续的。
shRNA的表达可以由RNA pol II或III启动子驱动。示例性的RNA pol III启动子包括U6启动子、U61启动子、U69启动子、H1启动子等。例如,来自RNA pol III启动子的转录可以终止于多聚T链段,如5Ts或6Ts。shRNA也可以使用RNA pol II启动子表达。例如,使用RNA pol II启动子可以允许特异性和诱导型表达。
在某些实施方案中,编码shRNA或miRNA的第一多核苷酸包含在SEQ ID NO:1-36或44-47中的任一个中列出的序列。在一些实施方案中,编码shRNA或miRNA的第一多核苷酸包含与SEQ ID NO:1-36或44-47中的任一个相比在反义区域中具有1、2、3或4个不同核苷酸的序列。
在某些实施方案中,编码shRNA或miRNA的第一多核苷酸包含SEQ ID NO:68的核苷酸497-517、SEQ ID NO:69的核苷酸497-517、SEQ ID NO:70的核苷酸497-517、SEQ ID NO:71的核苷酸497-517、SEQ ID NO:76的核苷酸497-517、SEQ ID NO:77的核苷酸497-517,或SEQ ID NO:78的核苷酸497-517。在一些实施方案中,编码shRNA或miRNA的第一多核苷酸包含与SEQ ID NO:68的核苷酸497-517、SEQ ID NO:69的核苷酸497-517、SEQ ID NO:70的核苷酸497-517、SEQ ID NO:71的核苷酸497-517、SEQ ID NO:76的核苷酸497-517、SEQ IDNO:77的核苷酸497-517,或SEQ ID NO:78的核苷酸497-517中的任一个相比在反义区域中具有1、2、3或4个不同核苷酸的序列。
在某些实施方案中,编码shRNA或miRNA的第一多核苷酸包含SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529、SEQ ID NO:71的核苷酸448-529、SEQ ID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529。在一些实施方案中,编码shRNA或miRNA的第一多核苷酸包含与SEQ ID NO:68的核苷酸448-529、SEQ ID NO:69的核苷酸448-529、SEQ ID NO:70的核苷酸448-529、SEQ ID NO:71的核苷酸448-529、SEQ ID NO:76的核苷酸497-517、SEQ IDNO:77的核苷酸497-517,或SEQ ID NO:78的核苷酸497-517中的任一个相比在反义区域中具有1、2、3或4个不同核苷酸的序列。
本领域技术人员应当理解,在一些实施方案中,shRNA或miRNA将在编码替换PSEN1或PSEN2的同一载体上编码。shRNA或miRNA靶编码序列在所述载体中的位置可以变化(例如,它们可以位于编码替换PSEN1或PSEN2的序列的5'或3'),只要它不破坏替换PSEN1或PSEN2的表达即可。可使用编码shRNA或miRNA靶序列的序列的多个拷贝(例如,2、3、4、5、6、7、8、9或10个拷贝)。当存在多个拷贝时,它们可串联定位或相对于所编码的PSEN1或PSEN2替换序列放置在不同位置。当使用miRNA靶编码序列时,它们可编码单一miRNA或多种miRNA(例如,2、3、4或5种不同的miRNA)的靶序列。因此,在一些实施方案中,当使用编码多种miRNA的靶向序列的miRNA靶编码序列时,可使用每个特定miRNA靶编码序列的1、2、3、4或5个拷贝。
密码子修饰
可以修饰编码替换PSEN1或PSEN2的多核苷酸以防止由其转录的mRNA被靶向内源性PSEN1或PSEN2的反义寡核苷酸靶向。这可以防止否则将发生的mRNA降解和RNA沉默或替换PSEN1或PSEN2编码序列的敲低。遗传密码子的冗余性可以用于改变反义寡核苷酸的靶序列中的密码子,同时保留由替换编码序列表达的蛋白质的氨基酸序列。
被靶向的内源性PSEN1或PSEN2 mRNA可以具有导致产生突变蛋白的突变。内源性PSEN1或PSEN2基因的一个或两个等位基因可以在受试者中发生突变。在一个实施方案中,内源性PSEN1或PSEN2基因的一个等位基因是野生型的并且一个等位基因是突变的。在另一个实施方案中,两个等位基因都是突变的。任何突变都可以存在于内源性等位基因中,包括点突变、取代、插入、缺失、倒位、错义突变、无义突变、移码突变、易位等。突变可以是单核苷酸变化(例如,一个或多个点突变)或可以是1、2、3、4、5、6、7、8、9、10或更多个核苷酸变化。
内源性等位基因的突变可以是显性负突变。显性负突变可以促成疾病、病症或病状的发展,或者可以促成对疾病、病症或病状的易感性。在一个实施方案中,内源性PSEN1基因在受试者中发生突变。例如,PSEN1基因的显性负突变可以通过抑制γ分泌酶的组装和功能来增加对阿尔茨海默氏病的易感性。编码PSEN1的密码子修饰或非密码子修饰的多核苷酸cDNA可以用于恢复野生型PSEN1表达。通过使用一种或多种小RNA,例如一种或多种shRNA,靶向内源性PSEN1 mRNA的编码区或非编码区,可以同时降低内源性突变PSEN1表达。在一个实施方案中,小RNA是衍生自shRNA的siRNA。在某些实施方案中,PSEN1基因、PSEN2基因或其组合包含一个或多个突变。编码PSEN1、PSEN2的密码子修饰或非密码子修饰的多核苷酸cDNA可以用于恢复野生型PSEN1、PSEN2或其组合的表达。
患有遗传性疾病形式的阿尔茨海默氏病(AD)患者在早老素蛋白(PSEN1-UniProtKB-P49768;PSEN2-UniProtKB-P49810)或淀粉样前体蛋白(APP)中携带突变。这些疾病相关的突变导致较长形式的β-淀粉样蛋白(AD脑中发现的淀粉样蛋白沉积物的主要组分)的产生增加。AD通常以细微的记忆障碍开始,然后变得更加严重并最终丧失行为能力。其他常见的发现包括精神错乱、判断力差、语言障碍、焦虑不安、退缩、幻觉、癫痫发作、帕金森病特征、肌张力增加、肌阵挛、大小便失禁和缄默症。家族性AD(FAD)的特征是具有不止一名AD成员的家庭,并且通常意味着不止一代人中有多个受影响的人。早发型FAD(EOFAD)是指持续在60至65岁之前且通常在55岁之前发病的家庭。基于潜在的遗传机制,EOFAD的三种临床上难以区分的亚型是:1型阿尔茨海默氏病(AD1),由APP的突变引起(EOFAD的10%-15%);3型阿尔茨海默氏病(AD3),由PSEN1的突变引起(EOFAD的30%-70%);以及4型阿尔茨海默氏病(AD4),由PSEN2的突变引起(EOFAD的<5%)。假定早老素通过其γ-分泌酶(一种切割APP的酶)功能调节APP加工。此外,人们认为早老素参与Notch受体的切割,使得它们直接调节γ-分泌酶活性或它们本身就是蛋白酶。
已发现早发型阿尔茨海默氏病受试者中的突变PSEN1包括诸如取代、插入(ins)、缺失(del)、倒位、错义、移码(fs)、外显子缺失(Δ)等突变。整个PSEN1蛋白中此类氨基酸变化的实例包括:Q15H、N32N、R35Q、N39Y、D40del(delGAC)、D40del(delACG)、R42L、E69D、A79V、V82L、I83_M84del(DelIM、ΔI83/M84、ΔI83/ΔM84)、I83T、M84T、M84V、L85P、P88H、P88L、V89L(G>C)、V89L(G>T)、C92S、V94M、V96F、V97L、T99A、F105C、F105I、F105L、F105V、R108Q、G111V、G111W、L113_I114insT、L113P、L113Q、Y115C、Y115D、Y115H、T116I、T116S、P117T、T116N、T116R、P117A、P117L、P117Q、P117R、P117S、T119I、E120D(A>C)、E120D(A>T)、E120G、E120K、T122A、E123K、H131R、S132A、L134R、N135D、N135S、N135Y、A136G、A137T、M139I(G>C)、M139I(G>A)、M139K、M139L、M139T、M139V、V142F、V142I、I143F、I143M、I143N、I143T、I143V、M146I(G>T)、M146I(G>C)、M146I(G>A)、M146L(A>C)、M146L(A>T)、M146V、T147I、T147P、L150P、L153V、Y154C、Y154N、Y156F、Y156_R157insIY、R157S、Y159F、H163P、H163R、H163Y、A164V、W165C(G>T)、W165C(G>C)、W165G、L166H、L166P、L166R、L166V、L166del、I167del(TTAdel)、I167del(TATdel)、I168T、S169del(ΔS169、Ser169del、ΔS170)、S169L、S169P、S170F、S170P、L171P、L173F(G>T)、L173F(G>C)、L173S、L173W、L174del、L174M、L174R、F175del、F175S、F176L、F177L、F177S、S178P、I180N、G183V、E184D、E184G、V191A。I202F、W203C、F205_G206del;insC、G206A、G206D、G206S、G206V、G209A、G209E、G209R、G209V、M210R、S212Y、I213F、I213L、I213T、H214D、H214N、H214R、H214Y、G217D、G217R、L219F、L219P、L219R、R220P、Q222H、Q222P、Q222R、Q223R、L226F、L226R、I227V、I229F、S230I、S230N、S230R、A231P、A231T、A231V、L232P、M233I(G>A)、M233I(G>C)、M233L(A>C)、M233L(A>T)、M233T、M233V、L235P、L235R、L235V、F237C、F237I、F237L、I238M、K239N、L241R、T245P、A246E、A246P、L248P、L248R、I249L、L250F、L250S、L250V、Y256N、Y256S、A260V、V261F、V261I、V261L、L262F、L262S、L262V、C263F、C263R、P264L、G266S、P267A、P267L、R269G、R269H、L271V、V272A、V272D、E273A、E273G、T274R、A275V、R278I、R278K、R278S、R278T、E280A、E280G、E280K、L282F、L282R、L282V、F283L、P284L、P284S、A285V、L286P、L286V、T291A、T291P、P303L、K311R、E318G、D333G、R352C、R352_S353insR、T354I、R358Q、A360T、S365A、S365Y、R377M、R377W、G378E、G378V、G378fs、L381F、L381V、G384A、F386I、F386L、F386S、F388L、S390I、S390N、V391F、V391G、L392P、L392V、V393F、G394V、A396T、N405S、I408T、A409T、C410Y、V412I、I416T、G417A、G417S、L418F、L420R、L424F、L424H、L424P、L424R、L424V、A426P、A431E、A431V、P433S、A434C、A434T、L435F、P436Q、P436S、I437V、I439S、I439V、T440del、869-2A>G、869-22_869-23ins18(ΔE9、Δ9、deltaE9)、I238_K239insI、L171_L172insY、S290C;T291_S319del(ΔE9、Δ9)、S290C;T291_S319del A>G(ΔE9、Δ9)、S290C;T291_S319del G>A(ΔE9、Δ9)、S290C;T291_S319del G>T(ΔE9、Δ9)、S290W;S291_R377del(Δ9-10、Delta9-10、p.Ser290_Arg377delinsTrp、g.73671948_73682054del)。
在家族性和散发性早发型阿尔茨海默氏病(EOAD)的基因筛查研究中,在携带c.772T>C,p.(Leu241Arg)、c.539T>A,p.(Ile180Asn)和c.710T>G,p.(Phe237Cys)取代的患者的家庭中观察到了删减效应(censoring effect),而c.331G>T,p.(Gly111Trp)、c.350C>A,p.(Pro117Gln)和c.614_616del,p.(Phe205_Gly206delinsCys)突变则从头发生。一名患者携带c.1078G>A p.(Ala360Thr)变体(Lanoiselée HM、Nicolas G、Wallon D,等人APP,PSEN1,and PSEN2 mutations in early-onset Alzheimer disease:A geneticscreening study of familial and sporadic cases.PLoS Med.2017;14(3):e1002270.2017年3月28日出版.doi:10.1371/journal.pmed.1002270)。需要筛查非家族性AD病例以及用于治疗神经退行性疾病如AD的组合物和方法,包括有效的基因和联合疗法。
PSEN2突变与可变外显率以及疾病发作年龄的宽范围(从45岁到88岁)相关(BirdTD、Levy-Lahad E、Poorkaj P等人Ann Neurol.1996;40(6):932-936.Sherrington R、Froelich S、Sorbi S等人Hum Mol Gen.1996;5(7):985-988)。PSEN2突变与EOAD和迟发型阿尔茨海默氏病(LOAD)相关。预测这38种突变中只有17种是致病突变。其中10种突变不是致病性的,其他的尚不清楚。十六种突变位于跨膜结构域内。基于细胞的研究表明,这些突变中的四种,即T122P、N141I、M239I和M239V,导致Aβ肽量的增加。发现突变T122R、S130L和M239I改变钙信号传导。大多数这些突变是在欧洲和非洲人群中发现的。到目前为止,在亚洲人群中仅描述了四种错义突变:Asn141Tyr与中国汉族家庭的EOAD相关;Gly34Ser在日本患者中发现;并且Arg62Cys和Val214Leu在韩国患者中描述(Yan Cai等人,2015,第10卷,第1163-1172页)。两种PSEN2突变,即Glu126fs和Lys306fs,是移码突变,并且其他突变是非同义取代(Larner AJ.Epilepsy&Behavior.2011;21(1):20-22)。
在某些实施方案中,编码替换PSEN1和/或PSEN2的多核苷酸是密码子优化的。密码子优化是密码子修饰的一种形式,可以用于增强异源基因表达的蛋白质表达。密码子优化是一种基因优化方法,其中合成的编码序列被修饰以匹配特定生物体的“密码子使用模式”。例如,为了优化特定氨基酸序列在特定生物体中的表达,将选择所述生物体的“最常用密码子”(从氨基酸的简并密码子列表中)。在密码子优化后,所编码的氨基酸序列保持不变,但编码氨基酸序列的DNA序列是不同的,已针对所述生物体进行了优化。PSEN1和PSEN2编码序列的优化密码子在下表示出。
表1:优选的优化密码子
Figure BDA0003858313070000441
Figure BDA0003858313070000451
在一些实施方案中,编码替换PSEN1的多核苷酸是SEQ ID NO:68的核苷酸1906-3303。
表达盒
除了编码对通过反义寡核苷酸(以及在某些实施方案中,编码此类反义寡核苷酸的多核苷酸序列)实现的沉默具有抗性的替换野生型PSEN1和/或PSEN2的多核苷酸序列之外,本文提供的表达盒可包含某些非编码区,所述非编码区对于细胞的功能(尤其是基因活性的控制)是不可或缺的。这些被称为调控元件。对本领域技术人员来说应该清楚的是,这些非编码区中的一些或甚至全部可替代地提供在其中插入表达盒的载体中。无论这些非编码序列(表达盒或载体)的位置如何,它们必须可操作地连接至编码反义寡核苷酸的多核苷酸序列和编码替换PSEN1或PSEN2编码序列的多核苷酸序列。
这些非编码序列的作用各不相同。例如,非编码DNA包含充当调控元件的序列,包括蛋白质编码序列的转录和翻译调控、DNA复制起点、着丝粒、端粒、支架附着区(SAR)、功能性RNA的基因。非编码DNA包含许多类型的调控元件,例如启动子、增强子或为阻遏转录的蛋白质提供结合位点的沉默子。与增强子一样,沉默子可以存在于它们控制或顺式作用的基因之前或之后。隔离子为以多种方式控制转录的蛋白质提供结合位点。一些隔离子阻止增强子帮助转录(增强子-阻断剂隔离子)。其他隔离子阻止阻遏基因活性的DNA的结构变化(屏障隔离子)。一些隔离子既可以用作增强子阻断剂,又可以用作屏障。非编码区可以例如包括5'非翻译区(“UTR”)、3'UTR或两者。
表达盒可以包含多核苷酸,所述多核苷酸包含PSEN1或PSEN2编码序列和任选地,处于编码序列之前(5'非编码序列)和之后(3'非编码序列)的调控元件,所述调控元件是所选基因产物的表达所必需的。因此,表达盒可以包含:1)启动子序列;2)内含子3)PSEN1或PSEN2编码序列;以及4)3'非翻译区(即终止子),在真核生物中,其通常包含多聚腺苷酸化位点。
类似地,表达盒可以包含编码一种或多种反义寡核苷酸,例如shRNA或miRNA的多核苷酸,并且可以包含处于编码shRNA或miRNA的序列之前(即,5')和之后(即,3')的表达所必需的调控元件。因此,表达盒可以包含,例如:1)启动子序列;2)内含子3)编码一个或多个shRNA或miRNA的序列;以及4)3'区域(即,终止子),其指定RNA转录的终点。每个shRNA或miRNA都可以具有其自己的启动子和内含子。可替代地,一个启动子可以与一系列2、3、4、5或更多个shRNA或miRNA可操作地连接。
一个或多个shRNA或前体miRNA可以以可操作地连接至启动子的一系列形式出现。前体miRNA或shRNA以一系列形式出现是指前体miRNA或shRNA排列在一起或靠近在一起,并且全部可操作地连接至一个或多个5'启动子。因此,第一多核苷酸可以包含一个或多个驱动miRNA或shRNA表达的5'启动子。在一个实施方案中,第一多核苷酸包含一个或多个与单个5'启动子连接的miRNA或shRNA(参见例如SEQ ID NO:37和SEQ ID NO:38)。在另一个实施方案中,第一多核苷酸包含一个或多个miRNA或shRNA,其中每个miRNA或shRNA连接至不同的5'启动子(参见例如SEQ ID NO:49)。任何数量的启动子可以驱动第一多核苷酸的任何数量的miRNA或shRNA的表达。例如,一个5'启动子可以驱动一个或多个miRNA或shRNA,而另一个5'启动子可以驱动一个或多个不同的miRNA或shRNA。驱动不同的miRNA或shRNA或不同数量的miRNA或shRNA的表达的启动子可以是相同或不同的启动子。
用于制备可操作地连接至调控元件的多核苷酸并在宿主细胞中表达多肽的方法是本领域众所周知的。参见,例如美国专利号4,366,246。当多核苷酸邻近或接近指导多核苷酸的转录和/或翻译的一种或多种调控元件定位时,多核苷酸可以是可操作地连接的。
表达盒可以是环状或线性核酸分子。在一些情况下,表达盒在载体(例如,表达载体)中被递送至细胞(例如,多种不同的细胞或细胞类型,包括靶细胞或细胞类型和/或非靶细胞类型)。
调控元件
如上所述,本文公开的表达盒可以包括一种或多种调控元件,所述调控元件可操作地连接至编码PSEN1(或PSEN2)的多核苷酸或编码反义寡核苷酸如shRNA的多核苷酸。调控元件是单独或与一种或多种另外的调控元件一起影响或调节多核苷酸或基因的表达的遗传元件或多核苷酸。调控元件可以在特定细胞类型或组织中促进多核苷酸或基因表达、增加多核苷酸或基因表达、减少多核苷酸或基因表达,和/或赋予选择性的多核苷酸或基因表达。调控元件可以在时间和/或空间上影响或调节多核苷酸或基因表达。如本文所用,术语“调控多核苷酸或基因表达”、“影响多核苷酸或基因表达”或“调节多核苷酸或基因表达”是指增加多核苷酸或基因表达、减少多核苷酸或基因表达,和/或赋予选择性的多核苷酸或基因表达。“调控多核苷酸或基因表达”、“影响多核苷酸或基因表达”或“调节多核苷酸或基因表达”可以指时间和/或空间调控。
调节或影响多核苷酸或基因表达的任何遗传元件可以是调控元件,包括例如启动子、增强子、染色质隔离子、翻译起始序列如强和弱Kozak信号序列、内部核糖体进入位点、mRNA稳定性序列、影响mRNA加工如剪接和切割的序列、影响mRNA从细胞核输出和/或mRNA保留的序列、翻译后响应元件、非编码序列如内含子和非翻译区(UTR)、多聚A序列、阻遏子、沉默子、终止子等。调控元件可以用于在转录水平、转录后水平、翻译水平或其任何组合上调节多核苷酸或基因表达。例如,调控元件可以增加RNA转录物的产生速率、增加所产生的RNA的稳定性、增加从RNA转录物合成蛋白质的速率、防止RNA降解和/或增加RNA稳定性以促进蛋白质合成。调控元件可以位于反向末端重复(ITR)序列或长末端重复(LTR)中。
本文所述的核酸表达盒可以包含在任何步骤(包括例如转录、转录后和翻译水平)调控或调节多核苷酸或基因表达的调控元件。调控元件可以在多于一个水平上调控或调节多核苷酸或基因表达,或以多于一种方式发挥作用以调控或调节多核苷酸或基因表达。因此,调控元件可以具有任何功能或上述功能的任何组合。例如,调控元件可以用作mRNA稳定元件并调节(即增加或减少)翻译。又如,调控元件可以调节转录起始和调节mRNA稳定性。调控元件还可以具有用于调节多核苷酸或基因表达的主要功能,并具有增加或减少多核苷酸或基因表达的一种或多种附加功能。调控元件可以包含位于其他调控元件内或与所述其他调控元件重叠的序列,所述其他调控元件在调节多核苷酸或基因表达方面具有相同或不同的功能,或者在相同或不同的步骤中调节多核苷酸或基因表达。
调控元件可以衍生自编码或非编码DNA序列。衍生自非编码DNA的调控元件可以与基因相关,例如,可以在基因中发现,如上游序列、内含子、3'和5'非翻译区(UTR)和/或下游区域。如本文所用,当提及核酸时,术语“上游”是指相对于另一序列的5',并且术语“下游”是指相对于另一序列的3'。当指代序列相对于彼此的位置时,术语“上游”可以与术语“5'”互换使用,除非上下文另有明确说明。当指代序列相对于彼此的位置时,术语“下游”可以与术语“3'”互换使用,除非上下文另有明确说明。
在一些实施方案中,衍生自非编码DNA序列的调控元件与基因不相关,例如,可不存在于基因中。衍生调控元件的基因组区域可以不同于衍生可操作地连接的多核苷酸的基因组区域。在一些实施方案中,调控元件衍生自相对于可操作地连接的多核苷酸(如衍生自例如内源性基因或异源基因的内源性型式的cDNA)所衍生自的基因组区域或位置的远端基因组区域或位置。在一些实施方案中,调控元件包含内含子序列。内含子序列可以包括衍生自任何基因的序列。在一些实施方案中,内含子序列衍生自可操作地连接的多核苷酸所衍生自的基因组区域。例如,本文所述的核酸表达盒可以包括来自与多核苷酸相对应或产生cDNA形式的多核苷酸的内源性基因的内含子。又如,本文所述的核酸表达盒可以包括来自不与多核苷酸相对应或不产生所述多核苷酸的内源性基因的内含子。
启动子
启动子是能够控制编码序列或基因的表达的核苷酸序列。启动子通常位于它们所调控的序列的5'。启动子可整体衍生自天然基因,或由衍生自自然界中发现的启动子的不同元件组成,和/或包含合成核苷酸区段。本领域技术人员将容易地确定,不同的启动子可响应于特定刺激,例如,以细胞或组织特异性方式,响应于不同的环境或生理条件,或响应于特定的化合物而调控编码序列或基因的表达。启动子通常分为两类:诱导型和组成型。组成型启动子是指允许受其控制的编码序列或基因连续转录的启动子。
诱导型启动子是指响应于刺激或外源性环境条件而启动受其控制的编码序列或基因的水平增大的转录的启动子。如果是诱导型的,则其中存在诱导物多核苷酸,其介导表达的调控,使得相关的多核苷酸仅在存在诱导物分子时才被转录。直接诱导型启动子是指调控区,其中调控区与编码蛋白质或多肽的基因可操作地连接,其中,在存在所述调控区的诱导物的情况下,蛋白质或多肽被表达。间接诱导型启动子是指包含两个或更多个调控区的调控系统,例如,与编码第一蛋白质、多肽或因子的第一基因可操作地连接的第一调控区,例如转录调控子,其能够调控与第二基因可操作连接的第二调控区,第二调控区可被激活或阻遏,从而激活或阻遏第二基因的表达。直接诱导型启动子和间接诱导型启动子都涵盖在诱导型启动子中。
启动子可以是在所选宿主生物体(例如,哺乳动物,如人)中表现出转录活性的任何多核苷酸。启动子可以是天然存在的,可以由各种天然存在的启动子的部分组成,或者可以是部分或完全合成的。对启动子设计的指导源自对启动子结构的研究,如Harley和Reynolds,Nucleic Acids Res.,15,2343-61(1987)的研究。此外,可以优化启动子相对于转录起点的位置。许多用于哺乳动物和哺乳动物细胞的合适启动子是本领域众所周知的,增强相关可表达多核苷酸的表达的多核苷酸也是如此。
真核启动子包括RNA pol I、RNA pol II和RNA pol III启动子。RNA pol I可以转录例如编码核糖体RNA的基因。RNA pol II可以转录例如编码mRNA、小核RNA和小干扰RNA的基因。RNA pol III可以转录例如编码tRNA、核糖体RNA以及其他小RNA的基因。例如,RNApol II启动子可以提供诱导型基因表达和选择性或组织特异性基因表达。
启动子可以是神经元特异性启动子。神经元特异性启动子可以在神经元细胞中提供多核苷酸或治疗性基因的选择性表达。限制或局限于特定细胞类型的选择性表达可以例如防止或减少通常不期望且可能导致副作用的脱靶效应。如本文所用,“选择性表达”是指与非神经元细胞相比,在神经元中显著更大的表达(即,至少2倍、至少5倍、至少10倍、至少50倍、至少100倍或更高。在一些实施方案中,在非神经元细胞中不存在表达。此外,当使用神经元特异性启动子时,与其可操作地连接的多核苷酸可以在至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%,以及其间的任何数值或范围的神经元中表达。
与可以在任何细胞类型中驱动表达的通用启动子相比或与在除靶细胞之外的一种或多种细胞类型中驱动表达的启动子相比,对特定细胞类型或靶细胞具有选择性的RNApol II启动子可以在靶细胞中提供强表达。在一些实施方案中,与由可以在任何细胞类型中驱动表达的启动子提供的表达相比,本文所述的核酸表达盒的神经元特异性启动子所提供的表达高至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%,以及其间的任何数值或范围。在一些实施方案中,与由可以在一种或多种非神经元细胞类型中驱动表达的启动子提供的表达相比,本文所述的核酸表达盒的神经元特异性启动子所提供的表达高至少5%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%,以及其间的任何数值或范围。
任何神经元特异性启动子都可以用于本文提供的核酸表达盒中。示例性启动子包括生长抑素(SST)基因启动子SEQ ID NO:63、神经肽Y(NPY)启动子SEQ ID NO:62、α-钙/钙调蛋白激酶2A启动子、突触蛋白I启动子SEQ ID NO:64或SEQ ID NO:65、神经元特异性烯醇化酶(NSE)SEQ ID NO:56、多巴胺能受体1(Drd1a)启动子、微管蛋白αI启动子等。也可以使用杂合启动子。如本文所用,术语“杂合启动子”是指包括衍生自多于一种基因的启动子序列的启动子。启动子可以来自任何物种,包括例如人、恒河猴、小鼠、大鼠和鸡。
在这些实施方案的替代方面,启动子选自CAG(SEQ ID NO:50)、CBA(SEQ ID NO:51,或SEQ ID NO:68的核苷酸941-1213)、UBC(SEQ ID NO:52)、PGK(SEQ ID NO:53)、PKC、EF1a(SEQ ID NO:54)、GUSB(SEQ ID NO:59)、CMV(SEQ ID NO:55)、PDGF、结蛋白、MCK、MeCP2(SEQ ID NO:57)、GFAP(SEQ ID NO:58)、MBP、RSV(SEQ ID NO:60)、SV40(SEQ ID NO:61)或β-珠蛋白(SEQ ID NO:66)。
染色质隔离子序列
核酸表达盒还可以包含染色质隔离子序列。将基因包装到染色质中可能使基因无法进入细胞的转录机制,从而导致很少或没有基因表达。染色质隔离子可以保护序列不被包装到不具转录活性的染色质中。在核酸表达盒中包括染色质隔离子序列可以使多核苷酸保持处于可接近状态并允许转录发生。任何染色质隔离子均可以用于本文提供的核酸表达盒中。示例性的染色质隔离子序列包括CTCF隔离子、gypsy隔离子和β-珠蛋白基因座。可以使用来自任何物种的染色质隔离子序列,包括哺乳动物和非哺乳动物以及脊椎动物和非脊椎动物。例如,可以使用来自人β珠蛋白基因座HS4的染色质隔离子序列。染色质隔离子序列的其他实例包括来自鸡和果蝇的序列。
本文所述的核酸表达盒可以包括在转录发生后发挥作用的调控元件。转录后调控元件可以调节例如RNA稳定性和降解、加工(如剪接和切割),以及从细胞核中输出。转录后调控元件还可以例如通过调节可用于翻译的mRNA的量和通过调节翻译起始来调节翻译。
mRNA稳定性元件
核酸表达盒可以包括至少一个mRNA稳定性元件。核酸表达盒中可以包括任何mRNA稳定性元件。mRNA稳定性元件可以是表达和核保留元件、5'UTR、3'UTR、UTR内的元件等。示例性的mRNA稳定性元件包括来自卡波西肉瘤相关疱疹病毒(KSHV)、恒河猴疱疹病毒(rhesus rhadinovirus,RRV)以及马疱疹病毒2(EHV2)的MALAT1mRNA稳定性元件、NEAT1稳定性元件、病毒表达和核保留元件;以及土拨鼠转录后调控元件(WPRE)、HBA1、HBA2、脂氧合酶、α(I)-胶原蛋白和酪氨酸羟化酶3'UTR的富含C的稳定性元件,例如,3'UTR的富含AU的元件(ARE)等。mRNA稳定性元件可以是例如表达和核保留元件。mRNA稳定性元件可以防止或减少mRNA的降解。例如,与不包括mRNA稳定性元件的核酸表达盒相比,当包括mRNA稳定性元件时,mRNA的降解可以减少约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%、约99%,以及其间的任何数值或范围。在一个实施方案中,不存在mRNA降解。任何防止或减少mRNA降解的序列都可以是mRNA稳定性元件。在一些实施方案中,非翻译区(UTR)是本文提供的核酸表达盒中的mRNA稳定性元件。3'UTR、5'UTR,或3'UTR和5'UTR可以包括在本文所述的核酸表达盒中。在一些实施方案中,mRNA稳定性元件是衍生自非编码序列或UTR的序列。
mRNA稳定性元件可以放置在核酸表达盒中的任何位置。例如,可以将mRNA稳定性元件放置在多核苷酸开放阅读框的3'和多聚腺苷酸化位点之前或5'。又如,可以将mRNA稳定性元件放置在多核苷酸开放阅读框的5'和多聚腺苷酸化位点的5'。
核酸表达盒可以包括非翻译区(UTR)。通常,在mRNA上的编码序列的每一侧都存在UTR,即,mRNA通常具有处于编码序列上游的5'UTR和紧随终止密码子之后的3'UTR或尾随序列。
5'UTR通常包括由核糖体识别的序列,所述序列允许核糖体结合并起始翻译。用于翻译起始的示例性序列包括Kozak起始信号序列和内部核糖体进入位点。如本文所用,术语“Kozak起始信号序列”、“Kozak共有序列”和“Kozak序列”可以互换使用,除非上下文另外明确指明。本领域技术人员将认识到,Kozak起始信号序列可以部分位于5'UTR中并且包括AUG翻译起始密码子本身和紧跟在AUG起始密码子之后或处于其下游的核苷酸,如下文所述。
mRNA的翻译起始通常发生在由核糖体识别的ATG密码子处。在其处开始翻译的ATG密码子可以不是mRNA序列中存在的第一个ATG起始密码子。被称为Kozak序列的基序可以将翻译起始引导至ATG密码子。Kozak共有序列定义为5'-(gcc)gccRccAUGG-3,其中加有下划线的AUG表示翻译起始密码子;大写字母表示保守碱基;“R”表示存在嘌呤,其中腺嘌呤更常见;小写字母表示一个位置上的最常见碱基,其可以变化;并且序列(gcc)具有不确定的意义。除了这些特征之外,其他位置和特征也可有助于翻译起始。已经描述了强和弱Kozak共有序列,其中强Kozak共有序列包括上述被认为对于翻译起始最佳的特征并且弱Kozak共有序列包括偏离或不同于强Kozak共有序列的特征。由mRNA合成的蛋白质的量可以取决于Kozak序列的强度。例如,与不同于CCACC的序列相比,紧邻AUG翻译起始密码子上游的CCACC序列可以增加翻译起始的速率。
在一些实施方案中,本文提供的核酸表达盒包含Kozak翻译起始信号。Kozak翻译起始信号可以被定位紧邻翻译起始AUG密码子的上游或5'。可以使用作为强Kozak序列的任何Kozak共有序列。在一些实施方案中,Kozak翻译起始信号包含序列CCACC。可以使用的另外的Kozak翻译起始序列包括GCCACC、CCGCC、CCACG、CCGCG、CCACA、CCGCA等。又如,可以使用任何XYRYY序列,其中“X”为C或G,“R”为嘌呤,并且“Y”为C、G或A。
转录终止区
重组构建体或表达盒的转录终止区是下游调控区,包括终止密码子和转录终止子序列。可以使用的转录终止区可以与转录起始区同源,可以与编码目标多肽的多核苷酸同源,或者可以是异源的(即,来源于另一来源)。转录终止区可以是天然存在的,或完全或部分合成的。编码转录终止区的3'非编码序列可提供于重组构建体或表达构建体中,并且可来自获得起始区的基因的3'区域或来自不同基因。大量的终止区是已知的,并且当在它们所来源的相同和不同的属和物种中使用时,它们在多种宿主中的功能令人满意。终止区还可衍生自优选宿主天然具有的各种基因。终止区的选择通常更多是为了方便而不是任何特定的特性。
3'UTR通常在翻译终止和转录后基因表达中起重要作用。例如,3'UTR中的调控区域可以影响mRNA的多聚腺苷酸化、翻译效率、定位和稳定性。3'UTR可以包含例如调控蛋白和小干扰RNA(miRNA)的结合位点。miRNA结合可以通过抑制翻译或导致转录物的降解来减少mRNA的表达。3'UTR还可以具有沉默子区域,其与阻遏蛋白结合,从而抑制mRNA的表达或翻译。3'UTR可以包含富含AU的元件(ARE)。与ARE结合的蛋白质可以以局部方式影响转录物的稳定性或衰变速率,或影响翻译起始。通常,3'UTR包含序列AAUAAA,所述序列指导将数百个被称为多聚(A)尾的腺嘌呤残基添加到mRNA转录物的末端。多聚(A)结合蛋白(PABP)可以与所述尾巴结合,从而有助于调控mRNA的翻译、稳定性和输出。例如,多聚(A)尾结合的PABP和与转录物的5'端缔合的蛋白质相互作用,从而导致促进翻译的mRNA的环化。3'UTR还可以包含吸引蛋白质以使mRNA与细胞骨架缔合、将其转运至细胞核或从细胞核转运或执行其他类型的定位的序列。3'UTR内的序列和3'UTR的物理特征,包括其长度和二级结构,可以有助于翻译调控。3'UTR还可以包括调节mRNA转录的元件,因此起到转录调控元件的作用。
在一些实施方案中,本文所述的核酸表达盒包括5'UTR序列、3'UTR序列,或5'UTR序列和3'UTR序列。可以使用衍生自任何基因的任何5'UTR序列和任何3'UTR序列。优选地,包含在本文提供的核酸表达盒中的5'UTR和3'UTR序列衍生自人基因,但是5'UTR和3'UTR序列可以来自任何基因和来自任何生物体。在一些实施方案中,本文所述的核酸表达盒包含早老素1基因的5'UTR序列、3'UTR序列,或5'UTR序列和3'UTR序列。在一些实施方案中,本文所述的核酸表达盒包含人早老素1基因的5'UTR序列、3'UTR序列,或5'UTR序列和3'UTR序列。在一些实施方案中,包含在核酸表达盒中的5'UTR和3'UTR序列用作mRNA稳定性元件,但是任何5'UTR和/或3'UTR序列可以贡献任何其他功能,包括上文描述的功能中的任一种,以调节编码PSEN1的多核苷酸或本文提供的核酸表达盒的其他治疗性基因的表达。在一些实施方案中,5'UTR序列、3'UTR序列,或5'UTR序列和3'UTR序列起到稳定mRNA的作用。
在一些实施方案中,本文所述的核酸表达盒包含内含子。内含子可以例如促进剪接和增强核输出。可以使用来自任何基因的任何内含子序列。在一些实施方案中,本文提供的核酸表达盒包括衍生自除PSEN1之外的基因的内含子序列。在一些实施方案中,内含子允许可变剪接,以产生具有不同长度和另外但重叠功能的蛋白质同种型。蛋白质同种型也可以具有不同的细胞功能和特性。可变剪接可以重新排列连结的内含子和外显子序列以改变mRNA编码序列。在一些实施方案中,本文提供的核酸表达盒包括衍生自PSEN1基因的内含子序列。例如,编码PSEN1的多核苷酸的cDNA可以包括一个或多个内含子序列。一个或多个内含子序列可以是PSEN1内含子序列或任何其他内含子序列。在一些实施方案中,本文所述的核酸表达盒中包含完整的内含子序列。在一些实施方案中,本文所述的核酸表达盒中包含部分内含子序列。在一些实施方案中,本文所述的核酸表达盒中包含完整和部分内含子序列的组合。
本文提供的核酸表达盒的调控元件和多核苷酸可以以任何方式组合。
修饰或突变的核酸序列
在一些实施方案中,可例如通过引入突变、缺失、取代、核碱基修饰、骨架等来修饰反义寡核苷酸或由天然核酸序列衍生反义寡核苷酸。核酸序列包括dsRNA、dsDNA和寡核苷酸等。设想用于本发明的一些修饰核酸序列的实例包括包含修饰骨架的那些,例如硫代磷酸酯、磷酸三酯、膦酸甲酯、短链烷基或环烷基糖间键,或短链杂原子或杂环糖间键。在一些实施方案中,修饰寡核苷酸包括具有硫代磷酸酯骨架的那些和具有杂原子骨架CH2--NH--O--CH2、CH、--N(CH3)--O--CH2[已知为亚甲基(甲基亚氨基)或MMI骨架]、CH2--O--N(CH3)--CH2、CH2--N(CH3)--N(CH3)--CH2和O--N(CH3)--CH2--CH2骨架的那些,其中天然磷酸二酯骨架表示为O--P--O--CH,)。De Mesmaeker等人Acc.Chem.Res.1995,28:366-374)所公开的酰胺骨架也体现在本文中。在一些实施方案中,核酸序列具有吗啉代骨架结构(Summerton和Weller,美国专利号5,034,506);肽核酸(PNA)骨架,其中寡核苷酸的磷酸二酯骨架被聚酰胺骨架替换,核碱基直接或间接地与聚酰胺骨架的氮杂氮原子结合(Nielsen等人Science1991,254,1497)。核酸序列还可包含一个或多个取代的糖部分。核酸序列还可具有糖模拟物,如环丁基,来代替戊呋喃糖基。
反义寡核苷酸还可包括,另外地或可替代地,核碱基(在本领域中通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然”核碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰核碱基包括在天然核酸中仅偶尔或短暂存在的核碱基,例如次黄嘌呤、6-甲基腺嘌呤、5-Me嘧啶,特别是5-甲基胞嘧啶(也称为5-甲基-2'脱氧胞嘧啶并且在本领域中通常称为5-Me-C)、5-羟甲基胞嘧啶(HMC)、糖基HMC和龙胆二糖基HMC,以及合成核碱基,例如2-氨基腺嘌呤、2-(甲基氨基)腺嘌呤、2-(咪唑基烷基)腺嘌呤、2-(氨基烷基氨基)腺嘌呤或其他杂取代的烷基腺嘌呤、2-硫尿嘧啶、2-硫胸腺嘧啶、5-溴尿嘧啶、5-羟甲基尿嘧啶、8-氮杂鸟嘌呤、7-脱氮鸟嘌呤、N6(6-氨基己基)腺嘌呤和2,6-二氨基嘌呤。Kornberg,A.,DNA Replication,W.H.Freeman&Co.,San Francisco,1980,第75-77页;Gebeyehu,G.等人Nucl.Acids Res.1987,15:4513)。可包括本领域已知的“通用”碱基,例如肌苷。5-Me-C取代已表现出将核酸双链体稳定性提高0.6-1.2℃。(Sanghvi,Y.S.,在Crooke,S.T.和Lebleu,B.编,Antisense Research and Applications,CRC Press,BocaRaton,1993,第276-278页中)。
其他修饰核碱基的实例可以见于,例如,Genes VI,第9章(“Interpreting theGenetic Code”),Lewis编(1997,Oxford University Press,New York),以及Modification and Editing of RNA,Grosjean和Benne编(1998,ASM Press,WashingtonDC)。修饰的RNA组分包括以下:2'-O-甲基胞苷;N4-甲基胞苷;N4-2'-O-二甲基胞苷;N4-乙酰胞苷;5-甲基胞苷;5,2'-O-二甲基胞苷;5-羟甲基胞苷;5-甲酰胞苷;2'-O-甲基-5-甲酰基胞苷;3-甲基胞苷;2-硫胞苷;赖胞苷;2'-O-甲基尿苷;2-硫尿苷;2-硫代-2'-O-甲基尿苷;3,2'-O-二甲基尿苷;3-(3-氨基-3-羧丙基)尿苷;4-硫尿苷;核糖基胸腺嘧啶;5,2'-O-二甲基尿苷;5-甲基-2-硫尿苷;5-羟基尿苷;5-甲氧基尿苷;尿苷5-氧乙酸;尿苷5-氧乙酸甲基酯;5-羧甲基尿苷;5-甲氧羰基甲基尿苷;5-甲氧羰基甲基-2'-O-甲基尿苷;5-甲氧羰基甲基-2'-硫尿苷;5-氨甲酰基甲基尿苷;5-氨甲酰基甲基-2'-O-甲基尿苷;5-(羧基羟甲基)尿苷;5-(羧基羟甲基)尿苷甲基酯;5-氨基甲基-2-硫尿苷;5-甲基氨基甲基尿苷;5-甲基氨基甲基-2-硫尿苷;5-甲基氨基甲基-2-硒尿苷;5-羧甲基氨基甲基尿苷;5-羧甲基氨基甲基-2'-O-甲基-尿苷;5-羧甲基氨基甲基-2-硫尿苷;二氢尿苷;二氢核糖基胸腺嘧啶;2'-甲基腺苷;2-甲基腺苷;N6N甲基腺苷;N6,N6-二甲基腺苷;N6,2'-O-三甲基腺苷;2甲硫基-N6新戊烯基腺苷;N6-(顺式-羟基异戊烯基)-腺苷;2-甲硫基-N6-(顺式--羟基异戊烯基)-腺苷;N6-甘氨酰氨甲酰基)腺苷;N6苏氨酰氨甲酰基腺苷;N6-甲基-N6-苏氨酰氨甲酰基腺苷;2-甲硫基-N6-甲基-N6-苏氨酰氨甲酰基腺苷;N6-羟基正缬氨酰氨甲酰基腺苷;2-甲硫基-N6-羟基正缬氨酰氨甲酰基腺苷;2'-O-核糖基腺苷(磷酸);肌苷;2'O-甲基肌苷;1-甲基肌苷;1,2'-O-二甲基肌苷;2'-O-甲基鸟苷;1-甲基鸟苷;N2-甲基鸟苷;N2,N2-二甲基鸟苷;N2,2'-O-二甲基鸟苷;N2,N2,2'-O-三甲基鸟苷;2'-O-核糖基鸟苷(磷酸);7-甲基鸟苷;N2,7-二甲基鸟苷;N2,N2;7-三甲基鸟苷;怀俄苷(wyosine);甲基怀俄苷;修饰不足的羟基怀丁苷;怀丁苷;羟基怀丁苷;过氧怀丁苷;辫苷(queuosine);环氧辫苷;半乳糖基-辫苷;甘露糖基-辫苷;7-氰基-7-脱氮鸟苷;古嘌苷(arachaeosine)[也称为7-甲酰氨基-7-脱氮鸟苷];以及7-氨基甲基-7-脱氮鸟苷。
本公开的反义寡核苷酸的另一修饰涉及将核酸序列化学连接至增强寡核苷酸的活性或细胞摄取的一个或多个部分或缀合物。此类部分包括但不限于:脂质部分如胆固醇部分、胆固醇基部分(Letsinger等人,Proc.Natl.Acad.Sci.USA 1989,86,6553)、胆酸(Manoharan等人Bioorg.Med.Chem.Let.1994,4,1053)、硫醚例如己基-S-三苯甲基硫醇(Manoharan等人Ann.N.Y.Acad.Sci.1992,660,306;Manoharan等人Bioorg.Med.Chem.Let.1993,3,2765)、巯基胆固醇(Oberhauser等人,Nucl.AcidsRes.1992,20,533)、脂肪链例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人EMBOJ.1991,10,111;Kabanov等人FEBS Lett.1990,259,327;Svinarchuk等人Biochimie 1993,75,49)、磷脂例如二-十六烷基-外消旋-甘油或1,2-二-O-十六烷基-外消旋-甘油-3-H-膦酸三乙基铵(Manoharan等人Tetrahedron Lett.1995,36,3651;Shea等人Nucl.AcidsRes.1990,18,3777)、多胺或聚乙二醇链(Manoharan等人Nucleosides&Nucleotides 1995,14,969)或金刚烷乙酸(Manoharan等人Tetrahedron Lett.1995,36,3651)。没有必要对给定核酸序列中的所有位置进行统一修饰,并且实际上,可将上述修饰中的多于一种并入单个核酸序列中,或者甚至并入核酸序列内的单个核苷内。
载体
载体是包含或缔合一个或多个多核苷酸(或包含一个或多个此类多核苷酸的表达载体)并且可以用于介导一个或多个多核苷酸至细胞的递送的大分子或大分子缔合物。载体的实例包括质粒、病毒载体、脂质体以及其他基因递送媒介物。载体可以与脂质、聚合物运载体或任何其他合适的运载体组合。载体可包含不由表达载体提供的调控元件,当所述调控元件或包含所述调控元件的表达载体被插入到载体中时,所述调控元件变得可操作地连接至一个或多个多核苷酸。可以对载体进行工程改造,以使其缺少一个或多个用于载体复制的元件。
在一些实施方案中,载体可以包含本文所述的核酸表达盒。在一些实施方案中,载体可以是病毒载体或质粒载体。在一些实施方案中,载体是腺相关病毒(AAV)载体、逆转录病毒载体、慢病毒载体,或与脂质或聚合物运载体复合的腺病毒载体或质粒载体。
病毒基因疗法载体或基因递送载体可以具有以下能力:可重复地和/或稳定地增殖和纯化至高滴度;介导靶向递送(例如,将多核苷酸特异性地递送至目标组织或器官,而不存在载体在其他地方的广泛传播或脱靶递送);以及介导基因递送和/或多核苷酸表达,而不引起有害的副作用或脱靶效应。
术语“AAV”是腺相关病毒的缩写,并且可用来指代病毒本身或其衍生物。该术语涵盖所有血清型、亚型,以及天然存在和重组形式,除非另有要求。缩写“rAAV”是指重组腺相关病毒,也称为重组AAV载体(或“rAAV载体”)。术语“AAV”包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV 12、rh10,以及其杂合体、禽AAV、牛AAV、犬AAV、马AAV、灵长类动物AAV、非灵长类动物AAV以及绵羊AAV。各种AAV血清型的基因组序列,以及天然反向末端重复(ITR)、Rep蛋白和衣壳亚基的序列是本领域已知的。此类序列可在文献或公共数据库如GenBank中找到。如本文所用,“rAAV载体”是指包含非AAV来源的多核苷酸序列(即,与AAV异源的多核苷酸)(通常是细胞遗传转化的目标序列)的AAV载体。通常,异源多核苷酸的侧翼是至少一个,通常是两个AAV反向末端重复序列(ITR)。术语“rAAV载体”包括rAAV载体颗粒和rAAV载体质粒。rAAV载体可以是单链的(ssAAV)或自我互补的(scAAV)。“AAV病毒”或“AAV病毒颗粒”或“rAAV载体颗粒”是指由至少一种AAV衣壳蛋白和包壳的多核苷酸rAAV载体组成的病毒颗粒。如果颗粒包含异源多核苷酸(即,除野生型AAV基因组之外的多核苷酸,如待递送至哺乳动物细胞的多核苷酸或核酸表达盒),则通常将其称为“rAAV载体颗粒””或简称为“rAAV载体”。因此,rAAV颗粒的产生必然包括rAAV载体的产生,因为这样的载体包含在rAAV颗粒内。
载体或病毒表达载体的克隆能力对于大型多核苷酸的表达来说可能是一个特别的挑战。例如,AAV载体通常具有约~4.8kb的包装容量,慢病毒通常具有~8kb的容量,腺病毒通常具有~7.5kb的容量,并且甲病毒通常具有-7.5kb的容量。一些病毒可以具有更大的包装容量,例如疱疹病毒可以具有>30kb的容量,并且牛痘可以具有~25kb的容量。使用AAV进行基因疗法的优点包括低致病性、极低的整合到宿主基因组中的频率,以及感染分裂和非分裂细胞的能力。
AAV的几种血清型(非致病性细小病毒)已被工程改造用于基因递送,已知其中的一些对某些组织或细胞类型具有嗜性。用于各种基因疗法应用的病毒可以被工程改造为复制缺陷型或在受试者或宿主中具有低毒性和低致病性。此类基于病毒的载体可以通过从病毒基因组中缺失所有或一些编码区,并使诸如将载体基因组包装到病毒衣壳中或将载体核酸(例如,DNA)整合到宿主染色质中的功能所必需的那些序列保持完整(例如,反向末端重复序列)来获得。包含多核苷酸的核酸表达盒,例如,可以克隆到病毒骨架中,如缺少病毒基因的修饰或工程改造的病毒骨架,并与另外的载体(例如,包装载体)结合使用,例如,当共转染时,可以产生重组病毒载体颗粒。
在一些情况下,用于在体内或体外将核酸表达盒递送到细胞、细胞类型或组织中的AAV载体或AAV病毒颗粒或病毒体是复制缺陷型的。在一些情况下,AAV病毒经过工程改造或基因修饰,使得其只有在辅助因子的存在下才可以复制和产生病毒体。
在一些实施方案中,核酸表达盒被设计用于通过AAV或重组AAV(rAAV)进行递送。在一些实施方案中,使用慢病毒或慢病毒载体递送核酸表达盒。在一些实施方案中,较大的多核苷酸,即超过AAV的克隆能力的基因,优选使用慢病毒或慢病毒载体递送。
在一些实施方案中,AAV载体为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVDJ、AAVrh10、AAV11、AAV12、AAV2/1、AAV2/5、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2/rh10、AAV2/11或AAV2/12、AAVPHP.A(PHP.A)、AAVG2B-26、AAVG2B-13、AAVTH1.1-32、AAVTH1.1-35、AAVPHP.B2(PHP.B2)、AAVPHP.B3(PHP.B3)、AAVPHP.N/PHP.B-DGT、AAVPHP.B-EST、AAVPHP.B-GGT、AAVPHP.B-ATP、AAVPHP.B-ATT-T、AAVPHP.B-DGT-T、AAVPHP.B-GGT-T、AAVPHP.B-SGS、AAVPHP.B-AQP、AAVPHP.B-QQP、AAVPHP.B-SNP(3)、AAVPHP.B-SNP、AAVPHP.B-QGT、AAVPHP.B-NQT、AAVPHP.B-EGS、AAVPHP.B-SGN、AAVPHP.B-EGT、AAVPHP.B-DST、AAVPHP.B-DST、AAVPHP.B-STP、AAVPHP.B-PQP、AAVPHP.B-SQP、AAVPHP.B-QLP、AAVPHP.B-TMP、AAVPHP.B-TTP、AAVPHP.S/G2A12、AAVG2A15/G2A3(G2A3)、AAVG2B4(G2B4)、AAVG2B5(G2B5)、PHP.S、AAV1、AAV2、AAV2G9、AAV3、AAV3a、AAV3b、AAV3-3、AAV4、AAV4-4、AAV5、AAV6、AAV6.1、AAV6.2、AAV6.1.2、AAV7、AAV7.2、AAV8、AAV9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84、AAV9.9、AAV10、AAV11、AAV12、AAV16.3、AAV24.1、AAV27.3、AAV42.12、AAV42-1b、AAV42-2、AAV42-3a、AAV42-3b、AAV42-4、AAV42-5a、AAV42-5b、AAV42-6b、AAV42-8、AAV42-10、AAV42-11、AAV42-12、AAV42-13、AAV42-15、AAV42-aa、AAV43-1、AAV43-12、AAV43-20、AAV43-21、AAV43-23、AAV43-25、AAV43-5、AAV44.1、AAV44.2、AAV44.5、AAV223.1、AAV223.2、AAV223.4、AAV223.5、AAV223.6、AAV223.7、AAV1-7/rh.48、AAV1-8/rh.49、AAV2-15/rh.62、AAV2-3/rh.61、AAV2-4/rh.50、AAV2-5/rh.51、AAV3.1/hu.6、AAV3.1/hu.9、AAV3-9/rh.52、AAV3-11/rh.53、AAV4-8/r11.64、AAV4-9/rh.54、AAV4-19/rh.55、AAV5-3/rh.57、AAV5-22/rh.58、AAV7.3/hu.7、AAV16.8/hu.10、AAV16.12/hu.11、AAV29.3/bb.1、AAV29.5/bb.2、AAV106.1/hu.37、AAV114.3/hu.40、AAV127.2/hu.41、AAV127.5/hu.42、AAV128.3/hu.44、AAV130.4/hu.48、AAV145.1/hu.53、AAV145.5/hu.54、AAV145.6/hu.55、AAV161.10/hu.60、AAV161.6/hu.61、AAV33.12/hu.17、AAV33.4/hu.15、AAV33.8/hu.16、AAV52/hu.19、AAV52.1/hu.20、AAV58.2/hu.25、AAVA3.3、AAVA3.4、AAVA3.5、AAVA3.7、AAVC1、AAVC2、AAVC5、AAV-DJ、AAV-DJ8、AAVF3、AAVF5、AAVH2、AAVrh.72、AAVhu.8、AAVrh.68、AAVrh.70、AAVpi.1、AAVpi.3、AAVpi.2、AAVrh.60、AAVrh.44、AAVrh.65、AAVrh.55、AAVrh.47、AAVrh.69、AAVrh.45、AAVrh.59、AAVhu.12、AAVH6、AAVLK03、AAVH-1/hu.1、AAVH-5/hu.3、AAVLG-10/rh.40、AAVLG-4/rh.38、AAVLG-9/hu.39、AAVN721-8/rh.43、AAVCh.5、AAVCh.5R1、AAVcy.2、AAVcy.3、AAVcy.4、AAVcy.5、AAVCy.5R1、AAVCy.5R2、AAVCy.5R3、AAVCy.5R4、AAVcy.6、AAVhu.1、AAVhu.2、AAVhu.3、AAVhu.4、AAVhu.5、AAVhu.6、AAVhu.7、AAVhu.9、AAVhu.10、AAVhu.11、AAVhu.13、AAVhu.15、AAVhu.16、AAVhu.17、AAVhu.18、AAVhu.20、AAVhu.21、AAVhu.22、AAVhu.23.2、AAVhu.24、AAVhu.25、AAVhu.27、AAVhu.28、AAVhu.29、AAVhu.29R、AAVhu.31、AAVhu.32、AAVhu.34、AAVhu.35、AAVhu.37、AAVhu.39、AAVhu.40、AAVhu.41、AAVhu.42、AAVhu.43、AAVhu.44、AAVhu.44R1、AAVhu.44R2、AAVhu.44R3、AAVhu.45、AAVhu.46、AAVhu.47、AAVhu.48、AAVhu.48R1、AAVhu.48R2、AAVhu.48R3、AAVhu.49、AAVhu.51、AAVhu.52、AAVhu.54、AAVhu.55、AAVhu.56、AAVhu.57、AAVhu.58、AAVhu.60、AAVhu.61、AAVhu.63、AAVhu.64、AAVhu.66、AAVhu.67、AAVhu.14/9、AAVhu.t 19、AAVrh.2、AAVrh.2R、AAVrh.8、AAVrh.8R、AAVrh.10、AAVrh.12、AAVrh.13、AAVrh.13R、AAVrh.14、AAVrh.17、AAVrh.18、AAVrh.19、AAVrh.20、AAVrh.21、AAVrh.22、AAVrh.23、AAVrh.24、AAVrh.25、AAVrh.31、AAVrh.32、AAVrh.33、AAVrh.34、AAVrh.35、AAVrh.36、AAVrh.37、AAVrh.37R2、AAVrh.38、AAVrh.39、AAVrh.40、AAVrh.46、AAVrh.48、AAVrh.48.1、AAVrh.48.1.2、AAVrh.48.2、AAVrh.49、AAVrh.51、AAVrh.52、AAVrh.53、AAVrh.54、AAVrh.56、AAVrh.57、AAVrh.58、AAVrh.61、AAVrh.64、AAVrh.64R1、AAVrh.64R2、AAVrh.67、AAVrh.73、AAVrh.74、AAVrh8R、AAVrh8R A586R突变体、AAVrh8R R533A突变体、AAAV、BAAV、山羊AAV、牛AAV、AAVhE1.1、AAVhEr1.5、AAVhER1.14、AAVhEr1.8、AAVhEr1.16、AAVhEr1.18、AAVhEr1.35、AAVhEr1.7、AAVhEr1.36、AAVhEr2.29、AAVhEr2.4、AAVhEr2.16、AAVhEr2.30、AAVhEr2.31、AAVhEr2.36、AAVhER1.23、AAVhEr3.1、AAV2.5T、AAV-PAEC、AAV-LK01、AAV-LK02、AAV-LK03、AAV-LK04、AAV-LK05、AAV-LK06、AAV-LK07、AAV-LK08、AAV-LK09、AAV-LK10、AAV-LK11、AAV-LK12、AAV-LK13、AAV-LK14、AAV-LK15、AAV-LK16、AAV-LK17、AAV-LK18、AAV-LK19、AAV-PAEC2、AAV-PAEC4、AAV-PAEC6、AAV-PAEC7、AAV-PAEC8、AAV-PAEC11、AAV-PAEC12、AAV-2-前体miRNA-101、AAV-8h、AAV-8b、AAV-h、AAV-b、AAV SM 10-2、AAVShuffle 100-1、AAV Shuffle 100-3、AAV Shuffle 100-7、AAV Shuffle 10-2、AAVShuffle 10-6、AAV Shuffle 10-8、AAV Shuffle 100-2、AAV SM 10-1、AAV SM 10-8、AAVSM 100-3、AAV SM 100-10、BNP61 AAV、BNP62 AAV、BNP63 AAV、AAVrh.50、AAVrh.43、AAVrh.62、AAVrh.48、AAVhu.19、AAVhu.11、AAVhu.53、AAV4-8/rh.64、AAVLG-9/hu.39、AAV54.5/hu.23、AAV54.2/hu.22、AAV54.7/hu.24、AAV54.1/hu.21、AAV54.4R/hu.27、AAV46.2/hu.28、AAV46.6/hu.29、AAV128.1/hu.43、理想型(true type)AAV(ttAAV)、UPENNAAV 10、日本AAV 10血清型、AAV CBr-7.1、AAV CBr-7.10、AAV CBr-7.2、AAV CBr-7.3、AAVCBr-7.4、AAV CBr-7.5、AAV CBr-7.7、AAV CBr-7.8、AAV CBr-B7.3、AAV CBr-B7.4、AAVCBr-E1、AAV CBr-E2、AAV CBr-E3、AAV CBr-E4、AAV CBr-E5、AAV CBr-e5、AAV CBr-E6、AAVCBr-E7、AAV CBr-E8、AAV CHt-1、AAV CHt-2、AAV CHt-3、AAV CHt-6.1、AAV CHt-6.10、AAVCHt-6.5、AAV CHt-6.6、AAV CHt-6.7、AAV CHt-6.8、AAV CHt-P1、AAV CHt-P2、AAV CHt-P5、AAV CHt-P6、AAV CHt-P8、AAV CHt-P9、AAV CKd-1、AAV CKd-10、AAV CKd-2、AAV CKd-3、AAVCKd-4、AAV CKd-6、AAV CKd-7、AAV CKd-8、AAV CKd-B1、AAV CKd-B2、AAV CKd-B3、AAV CKd-B4、AAV CKd-B5、AAV CKd-B6、AAV CKd-B7、AAVCKd-B8、AAV CKd-H1、AAV CKd-H2、AAV CKd-H3、AAV CKd-H4、AAV CKd-H5、AAV CKd-H6、AAV CKd-N3、AAV CKd-N4、AAV CKd-N9、AAV CLg-F1、AAV CLg-F2、AAV CLg-F3、AAV CLg-F4、AAV CLg-F5、AAV CLg-F6、AAV CLg-F7、AAV CLg-F8、AAV CLv-1、AAV CLv1-1、AAV Clv1-10、AAV CLv1-2、AAV CLv-12、AAV CLv1-3、AAV CLv-13、AAV CLv1-4、AAV Clv1-7、AAV Clv1-8、AAV Clv1-9、AAV CLv-2、AAV CLv-3、AAV CLv-4、AAV CLv-6、AAV CLv-8、AAV CLv-D1、AAV CLv-D2、AAV CLv-D3、AAV CLv-D4、AAV CLv-D5、AAV CLv-D6、AAV CLv-D7、AAV CLv-D8、AAV CLv-E1、AAV CLv-K1、AAV CLv-K3、AAV CLv-K6、AAV CLv-L4、AAV CLv-L5、AAV CLv-L6、AAV CLv-M1、AAV CLv-M11、AAV CLv-M2、AAV CLv-M5、AAV CLv-M6、AAV CLv-M7、AAV CLv-M8、AAV CLv-M9、AAV CLv-R1、AAV CLv-R2、AAV CLv-R3、AAV CLv-R4、AAV CLv-R5、AAV CLv-R6、AAV CLv-R7、AAV CLv-R8、AAV CLv-R9、AAV CSp-1、AAV CSp-10、AAV CSp-11、AAV CSp-2、AAV CSp-3、AAV CSp-4、AAV CSp-6、AAV CSp-7、AAVCSp-8、AAV CSp-8.10、AAV CSp-8.2、AAV CSp-8.4、AAV CSp-8.5、AAV CSp-8.6、AAV CSp-8.7、AAV CSp-8.8、AAV CSp-8.9、AAV CSp-9、AAV.hu.48R3、AAV.VR-355、AAV3B、AAV4、AAV5、AAVF1/HSC1、AAVF11/HSC11、AAVF12/HSC12、AAVF13/HSC13、AAVF14/HSC14、AAVF15/HSC15、AAVF16/HSC16、AAVF17/HSC17、AAVF2/HSC2、AAVF3/HSC3、AAVF4/HSC4、AAVF5/HSC5、AAVF6/HSC6、AAVF7/HSC7、AAVF8/HSC8和/或AAVF9/HSC9以及其变体。PHP.B和PHP.B衍生物[PHP.eR、PHP.S]、AAV8[K137R]AAV-TT、rAAV-retro、AAV9.HR、AAV1 CAM突变体、AAV9[586-590]交换突变体。在一些实施方案中,AAV载体是杂合或嵌合AAV血清型。在一些实施方案中,AAV是被设计用于改变嗜性或逃避免疫检测的工程改造的AAV。
在一些实施方案中,核酸表达盒可以被设计用于通过优化的治疗性逆转录病毒载体例如慢病毒载体进行递送。逆转录病毒载体可以是包含以下的慢病毒载体:左(5')LTR;有助于病毒的包装和/或核输入的序列,至少一种调控元件,任选地慢病毒Rev响应元件(RRE);任选地启动子或其活性部分;可操作地连接至一个或多个调控元件的多核苷酸;任选地隔离子;以及右(3')逆转录病毒LTR。慢病毒载体还可以包括转录后调控元件,如土拨鼠肝炎病毒转录后调控元件(WPRE)和/或本文所述的任何转录和转录后调控元件。慢病毒载体可以是自灭活(SIN)慢病毒载体。任何合适的包装系统都可以与慢病毒载体一起使用,包括例如第二代、第三代和第四代包装系统。慢病毒载体可以是假型的。任何包膜糖蛋白都可以用于假型化(pseudotyping),包括例如来自水泡性口炎病毒(VSV)、狂犬病病毒(rabies virus)、狂犬病毒(Lyssavirus)、莫科拉病毒(Mokola virus)、淋巴细胞性脉络丛脑膜炎病毒(LCMV)、拉沙热病毒(LFV)、逆转录病毒、莫洛尼鼠白血病病毒(MuLV)、线状病毒、副粘病毒、麻疹病毒、尼帕病毒(Nipah virus)、正粘病毒等的糖蛋白。慢病毒载体可以被假型化以改变嗜性。任何细胞类型都可以通过假型化来靶向,包括例如神经元细胞。
本文还提供了载体或载体组,其包含:(i)包含本文提供的表达盒的载体;(ii)载体组,其包含(a)包含本文提供的第一多核苷酸(例如,反义寡核苷酸编码序列)的第一载体,和(b)包含本文提供的第二多核苷酸(例如,对通过所编码的反义寡核苷酸实现的沉默具有抗性的野生型PSEN1或PSEN2编码序列)的第二载体。
本文预期的用于体细胞的基因疗法的技术包括通过病毒载体(例如,逆转录病毒、腺病毒、AAV、辅助依赖性腺病毒系统、杂合腺病毒系统、单纯疱疹病毒、痘病毒、慢病毒和EB病毒(Epstein-Barr virus))和非病毒系统,如物理系统(裸DNA、DNA轰击、电穿孔、流体动力学、超声和磁转染)以及化学系统(阳离子脂质、不同的阳离子聚合物和脂质聚合物)进行递送。
递送途径
在某些实施方案中,本文公开的表达盒和载体可以配制成适合特定施用途径的任何合适的制剂。各种药学上可接受的制剂是可商购获得的并且可由医生获得。
在某些实施方案中,将本文公开的表达盒和载体施用至有需要的受试者的中枢神经系统(CNS)。在某些实施方案中,中枢神经系统包括脑、脊髓和脑脊液(CSF)。在某些实施方案中,将组合物施用至哺乳动物的脑或脊髓或CSF。在某些实施方案中,将组合物施用至脑或脊髓的一部分。
在某些实施方案中,将本文公开的表达盒和载体施用至脑实质、蛛网膜下腔和/或鞘内空间。在某些实施方案中,将组合物施用至所述受试者的小脑延髓池、脑室内空间、脑室、蛛网膜下腔和/或室管膜中的一个或多个。
在进一步的实施方案中,将本文公开的表达盒和载体施用至脑室系统。在更进一步的实施方案中,将本文公开的表达盒和载体施用至吻侧脑室;和/或尾侧脑室;和/或右侧脑室;和/或左侧脑室;和/或右吻侧脑室;和/或左吻侧脑室;和/或右尾侧脑室;和/或左尾侧脑室中的一个或多个。
在某些实施方案中,将本文公开的表达盒和载体施用至与哺乳动物中的CSF接触的一个或多个细胞,例如通过使细胞与组合物接触。接触CSF的细胞的非限制性实例包括室管膜细胞、软脑膜细胞、内皮细胞和/或脑膜细胞。在某些实施方案中,将本文公开的表达盒和载体施用至室管膜细胞。在某些实施方案中,将本文公开的表达盒和载体递送至室管膜细胞,例如通过使室管膜细胞与组合物接触。
在某些实施方案中,本文公开的表达盒和载体是局部施用/递送的。“局部递送”是指直接递送至哺乳动物体内的靶位点(例如,直接递送至组织或流体)。例如,本文公开的表达盒和载体可以通过直接注射到器官、组织或指定的解剖位置来局部递送。在某些实施方案中,本文公开的表达盒和载体通过直接注射至脑、脊髓,或其组织或流体(例如CSF,如室管膜细胞、软脑膜细胞、内皮细胞和/或脑膜细胞)进行递送或施用。例如,本文公开的表达盒和载体可以通过直接注射来直接递送至CSF、小脑延髓池、脑室内空间、脑室、蛛网膜下腔和/或鞘内空间;和/或室管膜;和/或吻侧脑室;和/或尾侧脑室;和/或右侧脑室;和/或左侧脑室;和/或右吻侧脑室;和/或左吻侧脑室;和/或右尾侧脑室;和/或左尾侧脑室。
在某些实施方案中,本文公开的表达盒和载体通过直接注射到脑或脊髓的组织或流体中而递送至脑或脊髓的组织、流体或细胞。在某些实施方案中,本文公开的表达盒和载体不通过例如静脉内、皮下或肌内注射或静脉内输注进行全身递送。在某些实施方案中,本文公开的表达盒和载体通过立体定向注射递送至脑或脊髓的组织或流体。
在某些实施方案中,本文公开的表达盒和载体通过直接注射至脑、脊髓或其部分,或其组织或流体(例如,CSF如室管膜)进行递送或施用。
在某些实施方案中,方法或用途包括将本文公开的表达盒和载体施用至人的脑或脊髓或其部分。在某些实施方案中,野生型PSEN1或PSEN2多肽(以及反义寡核苷酸,在由表达载体编码时)在中枢神经组织(例如脑,例如纹状体、丘脑、髓质、小脑、枕叶皮质区、前额叶皮质区)中远离施用部位表达和/或检测到。在某些实施方案中,多肽在中枢神经组织(例如脑,例如纹状体、丘脑、髓质、小脑、枕叶皮质区和/或前额叶皮质区)中广泛存在或检测到,这反映了远离施用部位的分布,并且任选地遍布整个中枢神经组织(例如脑,例如纹状体、丘脑、髓质、小脑、枕叶皮质区和/或前额叶皮质区)。
可以凭经验确定有效量的本文公开的表达盒和载体,如表达PSEN1或PSEN2、反义寡核苷酸或两者的rAAV载体。施用可以在整个治疗过程中以一次或多次剂量、连续或间歇地实现。施用的有效剂量可以由本领域技术人员确定并且可根据AAV血清型、病毒滴度和所治疗哺乳动物的体重、状况和物种而变化。单次或多次施用(例如,1-5次或更多次)可以根据由治疗医师选择的剂量水平、目标和时间安排来执行。例如,可根据需要施用多次剂量来维持足够的酶活。
本文公开的表达盒和载体可以作为组合疗法的一部分与一种或多种另外的治疗剂一起施用,例如,患有痴呆或阿尔茨海默氏病的受试者。例如,美国食品和药物管理局(U.S.Food and Drug Administration,FDA)批准了两类药物——胆碱酯酶抑制剂
Figure BDA0003858313070000691
和美金刚(memantine)
Figure BDA0003858313070000692
——以治疗阿尔茨海默氏病的认知症状(记忆丧失、精神错乱以及思考和推理方面的问题)。对于具有多于一种活性剂的联合治疗,其中活性剂处于单独剂量制剂中,活性剂可单独或联合施用。此外,一种成分的施用可在另一剂的施用之前、同时或之后。
当与其他剂“共同施用”时,例如,当与另一药物共同施用时,第二剂的“有效量”将取决于所用药物的类型。合适的剂量对于所批准的剂是已知的并且可以由技术人员根据受试者的状况、所治疗的一种或多种病状的类型以及本文所述的化合物的使用量进行调整。
试剂盒
本文提供了包含本文所述的一种或多种载体或载体组的试剂盒。在一些实施方案中,所述试剂盒包含:a)一种或多种反义寡核苷酸,其中每一种反义寡核苷酸独立地靶向由人野生型和突变型早老素1(PSEN1)中的每一者、人野生型或突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区;以及b)包含编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列的多核苷酸的载体,其中第二多核苷酸不被一种或多种反义寡核苷酸中的任一种靶向;并且其中多核苷酸可操作地连接至载体中的启动子。在这些实施方案的一些方面,一种或多种反义寡核苷酸中的每一种独立地选自短发夹RNA(shRNA)、短干扰RNA(siRNA)、小干扰RNA(miRNA)、小时序RNA(stRNA)或内切核糖核酸酶制备的siRNA(esiRNA)。在这些实施方案的一些方面,试剂盒中的一种或多种反义寡核苷酸中的至少一种包含一个或多个修饰核碱基。在这些实施方案的一些更具体的方面,一个或多个修饰核碱基中的每一个独立地选自非天然存在的核碱基、锁核酸(LNA)或肽核酸(PNA)。
除了活性组分(例如,载体和/或反义寡核苷酸)之外,本公开的试剂盒可包含以下中的任何一种或多种:用于制备施用给受试者的活性组分的说明,用于将活性组分施用于受试者的说明、用于溶解和/或稀释和/或制备任何用于施用于受试者的活性组分的缓冲剂、稀释剂、溶剂或其他赋形剂、用于稀释或分开活性组分的额外容器、用于施用活性组分的工具,以及对在疗法中使用活性组分有用的任何其他物品。
治疗方法
本发明的多核苷酸序列、反义寡核苷酸、表达盒、载体、载体组和试剂盒可用于治疗任何通过PSEN1或PSEN2的突变形式表征的病症的方法。此类方法包括施用以下的步骤:靶向PSEN1或PSEN2的反义寡核苷酸(或编码此类反义寡核苷酸的多核苷酸);以及编码野生型PSEN1或PSEN2并且对通过反义寡核苷酸实现的沉默具有抗性的多核苷酸。在一些实施方案中,这两种组分可在施用于受试者的单个表达盒或载体中编码。在一些实施方案中,这两种组分可在以任何顺序依次施用或同时施用于受试者的单独的表达盒或载体中编码。在一些实施方案中,反义寡核苷酸可以任何顺序依次直接施用于受试者,或与编码野生型PSEN1或PSEN2蛋白的载体或表达盒同时施用于受试者。
可用于这些方法的疾病和病症包括通过PSEN1或PSEN2的突变形式表征的任何神经退行性疾病、病症或病状。在一些实施方案中,神经退行性疾病、病症或病状是阿尔茨海默氏病、家族性阿尔茨海默氏病、散发性阿尔茨海默氏病、晚发型阿尔茨海默氏病、额颞叶痴呆、额颞叶变性、匹克氏病、路易体痴呆、记忆丧失、认知损害或轻度认知损害。其他示例性的神经退行性疾病、病症或病状包括tau蛋白病、原发性年龄相关性tau蛋白病(PART)、慢性创伤性脑病(CTE)、进行性核上性麻痹(PSP)、皮质基底节变性(CBD)、与17号染色体相关的额颞叶痴呆和帕金森症(FTDP-17)、肌萎缩性侧索硬化-帕金森症-痴呆(ALS-PDC、Lytico-bodig病)、神经节胶质瘤、神经节细胞瘤、脑膜血管瘤病、脑炎后帕金森症、亚急性硬化性全脑炎(SSPE)、铅中毒脑病、结节性硬化症、泛酸激酶相关神经变性、突触核蛋白病、帕金森病、多系统萎缩(MSA)、神经轴索营养不良、帕金森样病、帕金森症、朊病毒病、运动神经元病、痴呆、传染性海绵状脑病、主要影响中枢神经系统的全身性萎缩、三核苷酸重复障碍、蛋白质构象病、淀粉样变性、神经元蜡样脂褐质沉积症、肌萎缩侧索硬化症(ALS)、溶酶体贮积病、癫痫症、截瘫、脱髓鞘疾病、亨廷顿病(Huntington’s disease)、创伤性脑损伤、中风、自闭症谱系障碍(ASD)、抑郁症、焦虑症、创伤后应激障碍(PTSD)、精神分裂症、注意力缺陷/多动障碍(ADHD)、躁郁症、强迫症(OCD)、人格障碍、疼痛等。
如本文所用,术语“治疗(treat)”、“治疗(treatment)”、“疗法(therapy)”、“治疗(therapeutic)”等是指获得期望的药理学和/或生理学效应,包括但不限于减轻、延迟或减缓疾病或病症的进展、减少其影响或症状、预防其发作、抑制、改善其发作,获得关于疾病、病症或医学病状的有益或期望结果,如治疗益处和/或预防益处。如本文所用,“治疗”涵盖哺乳动物,特别是人的疾病的任何治疗,并且包括(a)抑制疾病,即阻止其发展;以及(b)缓解疾病,即造成疾病的消退。在一些实施方案中,本文公开的方法可用于预防疾病在可能易患所述疾病或有获得所述疾病的风险但尚未被诊断为患有所述疾病的受试者,或在具有与所述疾病相关的生物标志物但尚未表现出所述疾病的任何体征的受试者中发生。
治疗益处包括正在治疗的潜在病症的根除或改善。此外,通过根除或改善与潜在病症相关的一种或多种生理症状使得在受试者中观察到改善来实现治疗益处,尽管受试者可能仍患有潜在病症。在一些情况下,对于预防益处,将组合物施用于有发展特定疾病风险的受试者,或施用于报告疾病的一种或多种生理症状的受试者,即使可能尚未作出这种疾病的诊断。本公开的方法可用于任何哺乳动物或其他动物。在一些情况下,治疗可以导致症状的减轻或停止。预防效果包括延迟或消除疾病或病状的出现、延迟或消除疾病或病状的症状的发作、减缓、停止或逆转疾病或病状的进展,或其任何组合。
受试者是对其进行本文公开的方法的任何个体或患者。术语“受试者”可以与术语“个体”或“患者”互换使用。受试者可以是人,但是受试者可以是动物,如本领域技术人员将认识到的。因此,其他动物,包括哺乳动物如啮齿动物(包括小鼠、大鼠、仓鼠和豚鼠)、猫、狗、兔、农场动物(包括牛、马、山羊、绵羊、猪等),以及灵长类动物(包括猴子、黑猩猩、猩猩和大猩猩)包括在受试者的定义内。在一些实施方案中,受试者是人。
本文提供的表达盒和载体可以以有效治疗神经退行性疾病、病症或病状的量施用,术语“有效量”或“治疗有效量”是指本文所述的组合物足以实现预期应用,包括但不限于如本文所定义的疾病治疗的量。治疗有效量可根据预期的治疗应用(体内)或所治疗的受试者和疾病状况例如受试者的体重和年龄、疾病状况的严重程度、施用方式等而变化,这可以由本领域普通技术人员很容易地确定。该术语也适用于将在靶细胞中诱导特定反应的剂量。具体剂量将根据所选择的特定组合物、待遵循的给药方案、是否与其他化合物联合施用、施用时间安排、待施用的组织以及在其中进行施用的物理递送系统而变化。
可以通过任何合适的方法递送表达盒和载体。示例性方法包括颅内注射、立体定向注射到脑灰质或白质中、注射到脑脊液中(鞘内、脑室内、小脑延髓池内)以及静脉内注射。
除非另外指出,否则本文所述的程序采用化学、分子生物学、微生物学、重组DNA、遗传学、免疫学、细胞生物学、细胞培养和转基因生物学的常规技术,这些都在本领域的技术范围内。(参见例如Maniatis等人,Molecular Cloning,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(1982);Sambrook等人,(1989);Sambrook和Russell,Molecular Cloning,第3版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.(2001);Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons(包括定期更新)(1992);Glover,DNA Cloning,IRL Press,Oxford(1985);Russell,Molecular biology of plants:a laboratory course manual,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1984);Anand,Techniquesfor the Analysis of Complex Genomes,Academic Press,NY(1992);Guthrie和Fink,Guide to Yeast Genetics and Molecular Biology,Academic Press,NY(1991);Harlow和Lane,Antibodies,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1988);Nucleic Acid Hybridization,B.D.Hames&S.J.Higgins编(1984);TranscriptionAnd Translation,B.D.Hames&S.J.Higgins编(1984);Culture Of Animal Cells,R.I.Freshney,A.R.Liss,Inc.(1987);Immobilized Cells And Enzymes,IRL Press(1986);B.Perbal,A Practical Guide To Molecular Cloning(1984);论述Methods InEnzymology,Academic Press,Inc.,NY);Methods In Enzymology,第154和155卷,Wu等人编;Immunochemical Methods In Cell And Molecular Biology,Mayer和Walker编,Academic Press,London(1987);Handbook Of Experimental Immunology,第I-IV卷,D.M.Weir和C.C.Blackwell编(1986);Riott,Essential Immunology,第6版,BlackwellScientific Publications,Oxford(1988);Fire等人,RNA Interference TechnologyFrom Basic Science to Drug Development,Cambridge University Press,Cambridge(2005);Schepers,RNA Interference in Practice,Wiley-VCH(2005);Engelke,RNAInterference(RNAi):The Nuts&Bolts of siRNA Technology,DNA Press(2003);Gott,RNA Interference,Editing,and Modification:Methods and Protocols(Methods inMolecular Biology),Human Press,Totowa,N.J.(2004);以及Sohail,Gene Silencing byRNA Interference:Technology and Application,CRC(2004))。
下文更具体地描述了组合物和方法,并且本文阐述的实施例仅旨在为说明性的,因为其中的许多修改和变化对于本领域技术人员来说将是显而易见的。如在本文的描述和随后的整个权利要求书中所使用的,“一个”、“一种”和“所述”的含义包括复数个指代物,除非上下文另有明确规定。与数值相关的术语“约”是指该值上下变化5%。例如,约100的值表示95至105(或95与105之间的任何值)。
本说明书中使用的术语在本文所述的组合物和方法的上下文中和使用每个术语的具体上下文中通常具有其在本领域中的普通含义。下面对一些术语进行更具体的定义,以为从业者提供关于组合物和方法的描述的另外指导。
本文任何地方提及的所有专利、专利申请和其他科学或技术著作均通过引用整体并入本文。本文适当地说明性地描述的实施方案可以在不存在本文具体或未具体公开的任何一个或多个要素、一个或多个限制的情况下实践。因此,例如,在本文的每个实例中,术语“包括”、“基本上由……组成”和“由……组成”中的任一个可被其他两个术语中的任一个替换,同时保留它们的普通含义。已使用的术语和表述被用作描述性而非限制性的术语,并且在使用此类术语和表述时无意排除所示出和描述的特征或其部分的任何等效物,但应认识到,在所要求保护的本发明的范围内可以进行各种修改。因此,应当理解,虽然本发明已经通过实施方案具体公开,但是本领域技术人员可采用本文公开的概念的任选特征、修改和变型,并且此类修改和变型被视为在由说明书和所附权利要求限定的本发明范围内。
每当在说明书中给出范围,例如温度范围、时间范围或者组成或浓度范围时,所有中间范围和子范围,以及包括在所给范围内的所有个别值都旨在包括在本公开中。应当理解,包括在本文的描述中的范围或子范围中的任何子范围或个别值可以被排除在本文的方面之外。应当理解,包括在本文的描述中的任何要素或步骤都可以排除在要求保护的组合物或方法之外。
此外,当本发明的特征或方面以马库什(Markush)群组或其他替代方案的分组描述时,本领域技术人员将认识到本发明也由此以马库什群组或其他群组的任何个别成员或成员子组加以描述。
提供以下内容仅用于示例目的,并且不旨在限制上文以广义术语描述的本发明的范围。
实施例1.用于沉默人中的内源性PSEN1基因表达的siRNA序列的设计。
我们设计了可以靶向内源性人PSEN1 mRNA的siRNA序列。这些siRNA序列可用于直接施用于受试者或由多核苷酸作为由施用于受试者的载体产生的shRNA或miRNA的一部分编码。
一旦使用这些siRNA抑制内源性PSEN1基因,就可以通过提供用于表达编码野生型早老素1蛋白的mRNA的PSEN1 cDNA来恢复PSEN1表达,并且通过密码子修饰或其他方式从mRNA中排除shRNA靶序列使得所述表达对通过此类siRNA实现的阻抑具有抗性。
siRNA序列是使用分子生物学中的已知技术和原理设计的,包括使用在线工具,包括Integrated DNA Technologies(IDT;biotools.idtdna.com/site/order/designtool/index/DSIRNA_CUSTOM)、siDirect(sidirect2.rnai.jp/)和Thermo Fisher(https://rnaidesigner.thermofisher.com/rnaiexpress/)的siRNA设计器。
在人PSEN1 mRNA的蛋白质编码区或非编码区中鉴定了siRNA的一组潜在靶标。编码靶向PSEN1 mRNA的相应siRNA序列的DNA序列在SEQ ID NO:1-32、42和43中列出。下表2示出所编码的siRNA将与之杂交的GenBank NM_000021.4PSEN 1cDNA序列中的PSEN1靶标位置(以及因此转录的PSEN1 mRNA中的相应位置)。处于NM_000021.4中的213-1616之间的互补位置内的序列位于PSEN1蛋白编码区内。
表2:编码靶向内源性PSEN1 mRNA的siRNA的DNA序列和在GenBank NM_000021.4cDNA序列内靶向的互补位置。
Figure BDA0003858313070000761
针对编码PSEN2特异性siRNA的DNA序列生成了类似列表(SEQ ID NO:20-32)。下表3示出所编码的siRNA将与之杂交的GenBank NM__000447.3PSEN2 cDNA序列中的PSEN2靶标位置(以及因此转录的PSEN2 mRNA中的相应位置)。互补位置在NM__000447.3中的384-1730之间的序列处于PSEN2 mRNA编码区内。
表3:编码靶向内源性PSEN2 mRNA的siRNA的DNA序列和在(Genbank NM_000447.3)cDNA序列内靶向的互补位置。
SEQ ID NO: NM_000447.3中的互补位置
20 110-135
21 143-168
22 735-760
23 736-761
24 737-762
25 819-844
26 849-874
27 1349-1374
28 1766-1791
29 1771-1796
30 1773-1798
31 1962-1987
32 2201-2226
这些PSEN1和PSEN2特异性siRNA编码序列,或其他编码与内源性PSEN2 mRNA杂交的siRNA并且包含来自此类序列的5'或3'端的至少7个或更多个连续核苷酸的DNA序列可以在编码靶向内源性PSEN1或PSEN2 mRNA的shRNA或miRNA的多核苷酸中使用。
我们接下来设计了外源性DNA分子,所述外源性DNA分子在被引入靶细胞并转录成RNA时,沉默内源性PSEN1或PSEN2 mRNA的翻译,包括由野生型等位基因和突变等位基因(如果存在的话)转录的mRNA两者。这些DNA分子包括shRNA编码分子(SEQ ID NO:44-47)和miRNA编码分子(SEQ ID NO:33-36)。参见下表4,其示出所编码的反义寡核苷酸的类型、所靶向的PSEN以及siRNA将与之杂交的相应GenBank cDNA序列中的靶标位置(以及因此所转录的PSEN mRNA中的相应位置)。
表4 miRNA序列。加有下划线的siRNA编码序列用于生成人工miRNA或前体miRNA
Figure BDA0003858313070000781
除了这些之外,在GenBank NM_000021.4和NM_000447.3cDNA序列中靶向的其他互补位置通过嵌入miRNA靶向序列并由SEQ ID NO:68-81中列出的质粒编码的siRNA序列表示。这些在下表4A中列出
表4A.另外的miRNA序列和互补靶标
Figure BDA0003858313070000782
Figure BDA0003858313070000791
1包含miRNA的两个连续拷贝。
2包含miRNA的三个连续拷贝。
编码shRNA或miRNA的多核苷酸序列中的任一个可以与还表达编码野生型PSEN1或PSEN2的mRNA的多核苷酸同时或连续递送,所述mRNA对通过共同递送的shRNA或miRNA实现的沉默具有抗性。编码PSEN1或PSEN2 mRNA的DNA和沉默子多核苷酸可作为处于单一DNA载体中的多核苷酸或作为复制缺陷型腺相关病毒(AAV)载体递送。可替代地,编码shRNA或miRNA的多核苷酸与编码PSEN1或PSEN2 mRNA的多核苷酸可在分开的DNA载体或AAV载体中递送。
所编码的shRNA包含约20-25个之间的与靶mRNA序列的一部分相同的核苷酸,然后是接头和与靶mRNA的相同部分互补的序列。shRNA由编码它们的DNA表达,所述DNA通常可操作地连接至RNA聚合酶III驱动的启动子,如U6、U61、U69或H1。各自靶向内源性PSEN1或PSEN2 mRNA的不同部分的一至四种shRNA由相同的DNA或AAV载体表达,以介导内源性PSEN1或PSEN2 mRNA的降解并降低PSEN1或PSEN2蛋白水平。
一些PSEN1靶标(被SEQ ID NO:6、11和42靶向的部分PSEN1 mRNA)也存在于小鼠PSEN1 mRNA中(参见相应的小鼠PSEN1 cDNA序列GenBank NM_001362271.1)。因此,靶向那些序列的反义寡核苷酸也将阻抑内源性小鼠PSEN1基因的表达。这些反义寡核苷酸可用作工具以在阿尔茨海默氏病小鼠模型中体内评估反义分子和载体阻抑内源性PSEN1基因同时用抗阻抑的PSEN1基因进行替换的功效。
在PSEN1缺陷的主要形式中,突变PSEN1亚基的表达抑制γ分泌酶的组装和功能。不受理论的限制,我们认为简单的基因替换方法将提供γ分泌酶的更多的野生型PSEN1亚基,但不阻抑突变亚基对组装和/或功能的抑制作用。然而,通过阻抑所有内源性PSEN1表达并用染色体外表达的野生型PSEN1替换它,可以恢复完整的γ分泌酶活性。除了治疗阿尔茨海默氏病或改善由PSEN1基因的显性突变导致的阿尔茨海默氏病易感性增加之外,沉默内源性PSEN1(或PSEN2)基因表达并用编码所述蛋白质的野生型形式并且对沉默具有抗性的基因进行替换的概念可以应用于涉及PSEN1(或PSEN2)缺陷的任何疾病。
实施例2.用以逃避通过靶向天然PSEN1 mRNA的shRNA实现的沉默的密码子改变。
我们设计了编码天然PSEN1蛋白序列,但其编码的mRNA不被靶向内源性PSEN1的shRNA识别的替换PSEN1基因,这通过以下两种方法中的一种实现:
1)如果一个或多个shRNA被设计成专门靶向蛋白质编码部分之外的PSEN1 mRNA,则替换PSEN1编码序列可以与编码野生型蛋白的内源性mRNA的部分相同。用于表达替换PSEN 1编码序列的表达载体编码将不与一个或多个shRNA杂交的来自完全不相关的来源的mRNA的上游和下游非编码部分。
2)如果一个或多个shRNA中的任一个靶向蛋白质编码区内的内源性PSEN1 mRNA,则替换PSEN1编码序列是密码子修饰的,并使用提供相同氨基酸序列的同义密码子。通过利用此类修饰密码子,一个或多个shRNA靶向由替换PSEN1编码序列表达的mRNA的能力被消除或大大降低。改变同义密码子的能力取决于mRNA内的靶序列编码的氨基酸序列。理想情况下,在shRNA靶向序列中改变足够数量的密码子以提供与shRNA的反义部分的至少50%、至少40%、至少30%或至少20%的核苷酸差异,或至少4个或至少5个错配。
密码子修饰只需要发生在编码序列中被shRNA靶向的那些部分中。因此,替换PSEN1编码序列可以与大部分编码区中的内源性核苷酸序列相同,只有少数密码子修饰区域。
相同的程序用于产生密码子修饰的PSEN2核酸序列。
实施例3.PSEN1的体外siRNA阻抑。
使用生物信息学评估在计算机上选择高度特异性的siRNA序列并使交叉反应性最小。设计并合成与PSEN1互补的寡核苷酸,以用于特异性地结合PSEN1并通过RNA干扰途径降解PSEN1 mRNA。
通过转染或直接孵育寡核苷酸,在商业细胞系(如HEK293或Hela细胞)中评估PSEN1阻抑。当细胞达到65-75%汇合时,使用转染试剂,例如LIPOFECTIN将寡核苷酸引入细胞。其他转染方法是本领域技术人员众所周知的。筛选方法不是对本发明的限制。在培养基如OPTI-MEM-1(Invitrogen Life Technologies)中将寡核苷酸与LIPOFECTIN(InvitrogenLife Technologies)混合,以达到期望的寡核苷酸浓度和LIPOFECTIN浓度。一式两份或一式三份处理细胞并获得数据。处理后,将含有转染混合物的培养基更换为新鲜培养基。在寡核苷酸处理后16-24小时收获细胞。
PSEN1 mRNA水平的定量通过实时定量PCR完成。从细胞中分离后,对RNA进行顺序逆转录酶(RT)反应和实时PCR。RT和PCR试剂可以从Invitrogen Life Technologies获得。RT、实时PCR根据制造商的说明,使用对于PSEN1具有特异性的引物和探针组进行,并且针对恒定表达的管家基因将实时PCR数据归一化。计算相对于对照杂乱(scrambled)或未处理细胞而言PSEN1 mRNA水平的抑制百分比。反义寡核苷酸对其有抑制作用的靶区域用于设计shRNA和miRNA。
实施例4.具有PSEN1沉默和替换系统以阻抑突变PSEN1的表达并表达野生型PSEN1的AAV载体。
腺病毒相关病毒(AAV)载体被构建成包含靶向并切割PSEN1mRNA的miRNA和野生型PSEN1的编码序列。包含编码miRNA和编码序列的基因组构建体的AAV病毒载体来源于可商购获得的基于质粒的表达载体。商业质粒被修饰成包含AAV2的反向末端重复(ITR)、U6聚合酶III启动子、三个靶向PSEN1基因的miRNA序列(在3'UTR中具有结合位点)、CBA聚合酶II启动子、野生型PSEN1的编码序列,然后是兔β-珠蛋白多聚腺苷酸化序列以及另一AAV2 ITR(SEQ ID NO:37、38)。
通过用AAV病毒载体基因组质粒和用以提供AAV和质粒表达病毒衣壳蛋白所必需的蛋白质的辅助质粒共转染人胚肾(HEK293)或昆虫(Sf9)细胞来实现具有PSEN1沉默和替换基因组的AAV病毒颗粒的产生。用于产生AAV颗粒的方法和细胞系是本领域技术人员众所周知的。在培养后,收获并浓缩病毒颗粒以实现在1011-1013VG/mL之间的范围内的病毒基因组拷贝数(参见例如,Chen等人,Human Gene Therapy Methods 24:270-278,2013)。
实施例5.具有PSEN2沉默和替换的AAV载体的体外和体内测试。
腺病毒相关病毒(AAV)载体被构建成包含含有靶向并切割PSEN2 mRNA的miRNA和野生型PSEN2的编码序列的元件。PSEN2沉默和替换系统的元件通过AAV载体递送,所述载体有效地转导哺乳动物组织并作为表观染色体(epichromosome)长期驻留在细胞核中。
可使用哺乳动物细胞系,例如HEK293细胞(可从American Type CultureCollection,Manassas,VA获得)在体外测试含有PSEN2沉默和替换系统的AAV颗粒。在体外用AAV载体转导哺乳动物细胞已有描述(参见例如Le Cong等人,出处同上和Sen等人,Scientific Reports 3:1832,2013;DOI:10.1038/srep01832,所述文献通过引用并入本文)。转导后,可使用已建立的方法通过定量RT-PCR(qRT-PCR)监测内源性和外源性PSEN2转录物(参见例如,Perez-Pinera等人,Nature Methods Advance Online Publication,2013年7月25日;doi:10.1038/nmeth.2600,其通过引用并入本文)。
为了评估在中枢神经系统中包含PSEN2沉默和替换系统的作用,将AAV载体直接递送至中枢神经系统是有益的,例如通过脑室内(ICV)或小脑延髓池内(ICM)施用。为了评估PSEN2沉默和替换系统在动物中枢神经系统中的作用,可以通过ICV递送向小鼠施用AAV。
选定的含有有效的shRNA或miRNA并编码PSEN2的AAV载体可以用于体内测试。制剂处理的小鼠可以用作对照动物。每个治疗组或对照组可包括4-12只动物。AAV以1010-1011个病毒基因组的剂量ICV施用。治疗期可为四周。在治疗期期间,监测小鼠的临床变化,如体重变化或异常行为。在治疗期结束时,将小鼠处死,并解剖脑。制备RNA以用于定量实时PCR分析,并且脑匀浆用于通过ELISA进行PSEN2蛋白定量并通过蛋白质印迹进行表征。
实施例6.阿尔茨海默氏病模型中的体内PSEN1沉默和替换。
为了评估PSEN1沉默和替换在AD动物模型的中枢神经系统中的作用,将编码PSEN1沉默和替换的AAV施用于携带FAD突变L435F的PSEN1敲入(KI)小鼠。KI小鼠在缺乏PSEN2、Psen1L435F/+;Psen2-/-的背景下对于任一突变都是异源的(Xia等人,Neuron.2015doi:10.1016/j.neuron.2015.02.010)。L435F突变消除了成熟PSEN1(N端和C端片段)的产生,而PSEN1 mRNA水平没有任何变化。Psen1L435F/+;Psen2-/-转基因小鼠模型表现出加快的淀粉样蛋白沉积、受损的海马突触可塑性和记忆力,以及令人联想到AD的大脑皮质神经变性。
为了评估PSEN1沉默和替换在AD动物模型中的作用,通过ICV递送将编码PSEN1沉默和替换系统的AAV施用于Psen1L435F/+;Psen2-/-转基因小鼠模型。选定的含有有效的shRNA或miRNA并编码PSEN1的AAV载体可以用于体内测试。制剂处理的小鼠可以用作对照动物。每个治疗组或对照组可包括4-12只动物。AAV以1010-1011个病毒基因组的剂量ICV施用。治疗期可为六至十八个月。在治疗期期间,监测小鼠的临床变化,如体重变化或异常行为。在治疗期结束时,将小鼠处死,并解剖脑。制备RNA以用于定量实时PCR分析,并且脑匀浆用于通过ELISA进行PSEN1蛋白定量并通过蛋白质印迹进行表征。
实施例7.PSEN1和PSEN2沉默和替换质粒
包含AAV2 ITR(SEQ ID NO:68的核苷酸1-141和4298-4438)、U6启动子(SEQ IDNO:68的核苷酸198-241)、CMV增强子(SEQ ID NO:68的核苷酸561-940)、CBA启动子(SEQ IDNO:68的核苷酸941-1213)、HA表位标签(SEQ ID NO:68的核苷酸1873-1905)、与所述CBA启动子功能性地连接的密码子优化的人PSEN1编码序列(“hPSEN1v1.5”;SEQ ID NO:68的核苷酸1906-3303)或人PSEN2编码序列(SEQ ID NO:76的核苷酸1902-3245),以及人生长激素(hGH)PolyA信号(SEQ ID NO:68的核苷酸3337-3813)的质粒用作产生人沉默和替换构建体的骨架。在那些质粒的各个位点插入一个、两个或三个拷贝的由位于与天然PSEN1或天然PSEN2的不同区域互补的siRNA序列侧翼的miR128靶向序列组成的核苷酸序列。使用标准技术将所得质粒(SEQ ID NO:68-81;图1-14)分别转染到HEK293(
Figure BDA0003858313070000841
CRL-1573TM)细胞中。转染后48小时收获HEK293细胞,使用500μL的QIAzol Lysis Reagent(Qiagen,#79306)直接裂解,并收集上清液。裂解后,使用Qiashredder(Qiagen,#79656)将样品均质化,并使用RNeasy Plus Universal Mini试剂盒(Qiagen,#74034)根据制造商的方案分离RNA。使用DeNovix DS-11FX+分光光度计/荧光计,根据制造商的说明测量每个样品的总RNA浓度。在从细胞中分离后,对RNA进行顺序逆转录酶(RT)反应和实时PCR。RT和PCR试剂获自ThermoFisher Scientific。RT和实时PCR是根据制造商的说明,使用对于以下各项具有特异性的引物和探针组进行的:(a)天然PSEN1,其不识别密码子优化的PSEN1编码质粒上存在的密码子优化的人PSEN1(正向引物=SEQ ID NO:82;探针=SEQ ID NO:83;反向引物=SEQID NO:84);(b)质粒编码的转录物(对于质粒中存在的hGHpolyA填充片段具有特异性;正向引物=SEQ ID NO:85;探针=SEQ ID NO:86;反向引物=SEQ ID NO:87),或(c)PSEN2编码质粒中不存在的天然PSEN2的非编码区(正向引物=SEQ ID NO:88;探针=SEQ ID NO:89;反向引物=SEQ ID NO:90)。将实时PCR数据针对恒定表达的管家基因归一化。缺乏(a)miRNA靶向序列和siRNA序列(例如,hPSEN1v1.5,图15),或(b)miRNA识别序列、siRNA序列和任何PSEN编码序列(空载体(“EV”),图15)的质粒用作对照。
图15示出使用携带密码子优化的人PSEN1编码序列的质粒的该实验的结果。使用正向引物SEQ ID NO:82;探针SEQ ID NO:83;以及反向引物SEQ ID NO:84检测和扩增内源性PSEN1 mRNA。使用正向引物SEQ ID NO:85;探针SEQ ID NO:86;以及反向引物SEQ ID NO:87检测和扩增外源性PSEN1 mRNA。在图15中,结果已针对在用缺乏任何miRNA靶向序列和siRNA序列但编码密码子优化的人PSEN1(hPSEN1v1.5)的质粒转化细胞时检测到的内源性和外源性水平归一化。
图16A和16B示出使用携带人PSEN2编码序列的质粒的该实验的结果。使用正向引物SEQ ID NO:88;探针SEQ ID NO:89;以及反向引物SEQ ID NO:90检测和扩增内源性PSEN2mRNA。使用正向引物SEQ ID NO:85;探针SEQ ID NO:86;以及反向引物SEQ ID NO:87检测和扩增外源性mRNA转录物。在图16A中,结果已针对检测到的内源性和外源性水平归一化
实施例8:序列
SEQ ID NO:1
GCAAAGGCTGTTGTCACTTGC
SEQ ID NO:2
ATAGAAATACTGTTTCACAGAAAACAA
SEQ ID NO:3
TCATCTTCTTCCTCATCTTGCTC
SEQ ID NO:4
ACAAAGAGCATGATCACATGC
SEQ ID NO:5
ATCATGATGGCAGCATTCAGAATTGAG
SEQ ID NO:6
ACAATGACACTGATCATGATGGC
SEQ ID NO:7
TAGTCATGACAACAATGACACTGATCA
SEQ ID NO:8
TTTCTCTCCTGAGCTGTTTCAAC
SEQ ID NO:9
CTTCTGCCATATTCACCAACCAC
SEQ ID NO:10
GGAAAGTTCCTGGACAGCAGCTC
SEQ ID NO:11
GGTTGTGTTCCAGTCTCCACTGGC
SEQ ID NO:12
AAAGAAGAAACATCCATGGGATTCTAA
SEQ ID NO:13
ATAGTCAAAGAAGAAACATCCAT
SEQ ID NO:14
GTGTCCACATCTAACAAAGTCAAGATT
SEQ ID NO:15
CATGAAATCGTCCTGTGACCACGCGT
SEQ ID NO:16
TGTGACCACGCGTCAAGCTGCTGATGG
SEQ ID NO:17
TTGACATCATTAGCTCACTGTATCCCC
SEQ ID NO:18
TCCAAGTTGCTTAGAAAGCTTCTAC
SEQ ID NO:19
ATATCTTACCAAGAATTTGAAAGGTAT
SEQ ID NO:20
TTTCTTCATCAGTAAAATTCAGAGGGG
SEQ ID NO:21
TTGGGAAAAGTCACTTTAGCTCTGTGG
SEQ ID NO:22
CAGTGAATGGCGTGTAGATGAGCTGTC
SEQ ID NO:23
TCAGTGAATGGCGTGTAGATGAGCTGT
SEQ ID NO:24
CTCAGTGAATGGCGTGTAGATGAGCTG
SEQ ID NO:25
TGGTCATAACCACGATGACGCTGATCA
SEQ ID NO:26
AGCGGTACTTGTAGAGCACCACCAAGA
SEQ ID NO:27
ACTGTCATAGGAGTCTCTTCCATCTC
SEQ ID NO:28
TATACAACTGCATCCAATGAAAATTCC
SEQ ID NO:29
AAAACTATACAACTGCATCCAATGAAA
SEQ ID NO:30
GTAAAACTATACAACTGCATCCAATGA
SEQ ID NO:31
TTCTCAGTTCATCTGGATAAACCTGCT
SEQ ID NO:32
TGATATTACTATTAAGCCACTTCCCAG
SEQ ID NO:33
GAATCCCATAGATACTTCTTCTTTAAATGTCCATACAAGAAGAAACATCCATGGGATTC
SEQ ID NO:34
ACTTTTCATCAAATGCAGGTAAGGTTTACATTTTACAACTGCATCCAATGAAAATT
SEQ ID NO:35
AGGCCTCTCTCTAGAATCCCATAGATACTTCTTCTTTAAATGTCCATACAAGAAGAAACATCCATGGGA TTCGAATGGGGCTG
SEQ ID NO:36
TGAGCTGTTGGATTACTTTTCATCAAATGCAGGTAAGGTTTACATTTTACAACTGCATCCAATGAAAAT TTTCAGCTGCTTC
SEQ ID NO:37
包含AAV2反向末端重复、U6启动子、3个拷贝的hsa-pre-mir-124a-1-hPSEN1-1631-1652、CBA启动子、PSEN1编码序列、兔多聚腺苷酸化序列以及AAV2反向末端重复的示例性AAV转基因。
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACCAGGGTAATGAAGGTCGGGCAGGAAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCAGGCCTCTCTCTAGAATCCCATAGATACTTCTTCTTTAAATGTCCATACAAGAAGAAACATCCATGGGATTCGAATGGGGCTGAGGCCTCTCTCTAGAATCCCATAGATACTTCTTCTTTAAATGTCCATACAAGAAGAAACATCCATGGGATTCGAATGGGGCTGAGGCCTCTCTCTAGAATCCCATAGATACTTCTTCTTTAAATGTCCATACAAGAAGAAACATCCATGGGATTCGAATGGGGCTGTTTTTCGCGTCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGGCCACCATGACAGAGTTACCTGCACCGTTGTCCTACTTCCAGAATGCACAGATGTCTGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAATAGAGAACGGCAGGAGCACAACGACAGACGGAGCCTTGGCCACCCTGAGCCATTATCTAATGGACGACCCCAGGGTAACTCCCGGCAGGTGGTGGAGCAAGATGAGGAAGAAGATGAGGAGCTGACATTGAAATATGGCGCCAAGCATGTGATCATGCTCTTTGTCCCTGTGACTCTCTGCATGGTGGTGGTCGTGGCTACCATTAAGTCAGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGATACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATTCTGAATGCTGCCATCATGATCAGTGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTTATTATATCATCTCTATTGTTGCTGTTCTTTTTTTCATTCATTTACTTGGGGGAAGTGTTTAAAACCTATAACGTTGCTGTGGACTACATTACTGTTGCACTCCTGATCTGGAATTTTGGTGTGGTGGGAATGATTTCCATTCACTGGAAAGGTCCACTTCGACTCCAGCAGGCATATCTCATTATGATTAGTGCCCTCATGGCCCTGGTGTTTATCAAGTACCTCCCTGAATGGACTGCGTGGCTCATCTTGGCTGTGATTTCAGTATATGATTTAGTGGCTGTTTTGTGTCCGAAAGGTCCACTTCGTATGCTGGTTGAAACAGCTCAGGAGAGAAATGAAACGCTTTTTCCAGCTCTCATTTACTCCTCAACAATGGTGTGGTTGGTGAATATGGCAGAAGGAGACCCGGAAGCTCAAAGGAGAGTATCCAAAAATTCCAAGTATAATGCAGAAAGCACAGAAAGGGAGTCACAAGACACTGTTGCAGAGAATGATGATGGCGGGTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGTCATCTAGGGCCTCATCGCTCTACACCTGAGTCACGAGCTGCTGTCCAGGAACTTTCCAGCAGTATCCTCGCTGGTGAAGACCCAGAGGAAAGGGGAGTAAAACTTGGATTGGGAGATTTCATTTTCTACAGTGTTCTGGTTGGTAAAGCCTCAGCAACAGCCAGTGGAGACTGGAACACAACCATAGCCTGTTTCGTAGCCATATTAATTGGTTTGTGCCTTACATTATTACTCCTTGCCATTTTCAAGAAAGCATTGCCAGCTCTTCCAATCTCCATCACCTTTGGGCTTGTTTTCTACTTTGCCACAGATTATCTTGTACAGCCTTTTATGGACCAATTAGCATTCCATCAATTTTATATCTAGCATAGTCGACCCCTATCCATCACACTGGCGGCCGCTCGAGGACGGGGTGAACTACGCCTGAGGATCCGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGCAATTCGTTGATCTGAATTTCGACCACCCATAATACCCATTACCCTGGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
SEQ ID NO:38-包含AAV2反向末端重复、U6启动子、3个拷贝的hsa-pre-mir-128a-hPSEN2-1766-1788、CBA启动子、PSEN2编码序列、兔多聚腺苷酸化序列以及AAV2反向末端重复的示例性AAV转基因。
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACCAGGGTAATGAAGGTCGGGCAGGAAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCATGAGCTGTTGGATTACTTTTCATCAAATGCAGGTAAGGTTTACATTTTACAACTGCATCCAATGAAAATTTTCAGCTGCTTCTGAGCTGTTGGATTACTTTTCATCAAATGCAGGTAAGGTTTACATTTTACAACTGCATCCAATGAAAATTTTCAGCTGCTTCTGAGCTGTTGGATTACTTTTCATCAAATGCAGGTAAGGTTTACATTTTACAACTGCATCCAATGAAAATTTTCAGCTGCTTCTTTTTCGCGTCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGGCCACCATGCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTGACATAGTCGACCCCTATCCATCACACTGGCGGCCGCTCGAGGACGGGGTGAACTACGCCTGAGGATCCGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGCAATTCGTTGATCTGAATTTCGACCACCCATAATACCCATTACCCTGGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
SEQ ID NO:39-NM_000021.4智人早老素1(PSEN1),编码序列
ATGACAGAGTTACCTGCACCGTTGTCCTACTTCCAGAATGCACAGATGTCTGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAATAGAGAACGGCAGGAGCACAACGACAGACGGAGCCTTGGCCACCCTGAGCCATTATCTAATGGACGACCCCAGGGTAACTCCCGGCAGGTGGTGGAGCAAGATGAGGAAGAAGATGAGGAGCTGACATTGAAATATGGCGCCAAGCATGTGATCATGCTCTTTGTCCCTGTGACTCTCTGCATGGTGGTGGTCGTGGCTACCATTAAGTCAGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGATACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATTCTGAATGCTGCCATCATGATCAGTGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTTATTATATCATCTCTATTGTTGCTGTTCTTTTTTTCATTCATTTACTTGGGGGAAGTGTTTAAAACCTATAACGTTGCTGTGGACTACATTACTGTTGCACTCCTGATCTGGAATTTTGGTGTGGTGGGAATGATTTCCATTCACTGGAAAGGTCCACTTCGACTCCAGCAGGCATATCTCATTATGATTAGTGCCCTCATGGCCCTGGTGTTTATCAAGTACCTCCCTGAATGGACTGCGTGGCTCATCTTGGCTGTGATTTCAGTATATGATTTAGTGGCTGTTTTGTGTCCGAAAGGTCCACTTCGTATGCTGGTTGAAACAGCTCAGGAGAGAAATGAAACGCTTTTTCCAGCTCTCATTTACTCCTCAACAATGGTGTGGTTGGTGAATATGGCAGAAGGAGACCCGGAAGCTCAAAGGAGAGTATCCAAAAATTCCAAGTATAATGCAGAAAGCACAGAAAGGGAGTCACAAGACACTGTTGCAGAGAATGATGATGGCGGGTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGTCATCTAGGGCCTCATCGCTCTACACCTGAGTCACGAGCTGCTGTCCAGGAACTTTCCAGCAGTATCCTCGCTGGTGAAGACCCAGAGGAAAGGGGAGTAAAACTTGGATTGGGAGATTTCATTTTCTACAGTGTTCTGGTTGGTAAAGCCTCAGCAACAGCCAGTGGAGACTGGAACACAACCATAGCCTGTTTCGTAGCCATATTAATTGGTTTGTGCCTTACATTATTACTCCTTGCCATTTTCAAGAAAGCATTGCCAGCTCTTCCAATCTCCATCACCTTTGGGCTTGTTTTCTACTTTGCCACAGATTATCTTGTACAGCCTTTTATGGACCAATTAGCATTCCATCAATTTTATATCTAG
SEQ ID NO:40-NM_000447.3智人早老素2(PSEN2),编码序列
ATGCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTGA
SEQ ID NO:41
>PSEN1密码子修饰以避开shRNA
CCCAGATCTGCCACCATGACAGAGTTACCTGCACCGTTGTCCTACTTCCAGAATGCACAGATGTCTGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAATAGAGAACGGCAGGAGCACAACGACAGACGGAGCCTTGGCCACCCTGAGCCATTATCTAATGGACGACCCCAGGGTAACTCCCGGCAGGTGGTGGAACAGGACGAAGAGGAGGACGAAGAGCTGACATTGAAATATGGCGCCAAACACGTCATAATGCTATTCGTGCCTGTGACTCTCTGCATGGTGGTGGTCGTGGCTACCATTAAGTCAGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGATACCGAGACTGTGGGCCAGAGAGCCCTGCATAGCATACTCAAGGCAGCTATTATGATTTCCGTGATCGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTTATTATATCATCTCTATTGTTGCTGTTCTTTTTTTCATTCATTTACTTGGGGGAAGTGTTTAAAACCTATAACGTTGCTGTGGACTACATTACTGTTGCACTCCTGATCTGGAATTTTGGTGTGGTGGGAATGATTTCCATTCACTGGAAAGGTCCACTTCGACTCCAGCAGGCATATCTCATTATGATTAGTGCCCTCATGGCCCTGGTGTTTATCAAGTACCTCCCTGAATGGACTGCGTGGCTCATCTTGGCTGTGATTTCAGTATATGATTTAGTGGCTGTTTTGTGTCCGAAAGGTCCACTTCGAATGCTAGTCGAGACGGCACAAGAAAGAAATGAAACGCTTTTTCCAGCTCTCATTTACTCCTCAACTATGGTATGGCTAGTCAACATGGCAGAAGGAGACCCGGAAGCTCAAAGGAGAGTATCCAAAAATTCCAAGTATAATGCAGAAAGCACAGAAAGGGAGTCACAAGACACTGTTGCAGAGAATGATGATGGCGGGTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGTCATCTAGGGCCTCATCGCTCTACACCTGAGTCACGAGCAGCGGTGCAAGAGCTGTCTTCCAGTATCCTCGCTGGTGAAGACCCAGAGGAAAGGGGAGTAAAACTTGGATTGGGAGATTTCATTTTCTACAGTGTTCTGGTTGGTAAAGCCTCAGCAACAGCGAGTGGTGATTGGAATACTACGATAGCCTGTTTCGTAGCCATATTAATTGGTTTGTGCCTTACATTATTACTCCTTGCCATTTTCAAGAAAGCATTGCCAGCTCTTCCAATCTCCATCACCTTTGGGCTTGTTTTCTACTTTGCCACAGATTATCTTGTACAGCCTTTTATGGACCAATTAGCATTCCATCAATTTTATATCTAGCATAGTCGACCCC
SEQ ID NO:42
GAAATCACAGCCAAGATGAGC
SEQ ID NO:43
ATGGAATGCTAATTGGTCCAT
SEQ ID NO:44
GGAGCAAGATGAGGAAGAAGACGAATCTTCTTCCTCATCTTGCTCCTT
SEQ ID NO:45
GCTCATCTTGGCTGTGATTTCCGAAGAAATCACAGCCAAGATGAGCTT
SEQ ID NO:46
AAAGTTCCTGGACAGCAGCTCCGAAGAGCTGCTGTCCAGGAACTTTTT
SEQ ID NO:47
GATGGAATGCTAATTGGTCCATCGAAATGGACCAATTAGCATTCCATT
SEQ ID NO:48
>所有的耐受性、非偏好密码子改变为高度偏好的同义密码子的人PSEN1。改变的密码子以小写示出:
ATGACAGAGTTACCTGCAcctTTGTCCTACTTCCAGAATGCACAGATGTCTGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAATAGAGAACGGCAGGAGCACAACGACAGACGGAGCctgGGCCACCCTGAGCCActgTCTAATGGAagaCCCCAGGGTAACTCCCGGCAGGTGGTGGAGcagGATGAGGAAGAAGATGAGGAGCTGACActgAAATATGGCGCCAAGcacGTGATCATGCTCTTTGTCCCTGTGACTCTCTGCATGGTGGTGGTCGTGGCTACCATTAAGTCAGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGATACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATTCTGAATGCTGCCATCATGATCAGTGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGctgATTATATCATCTctgTTGctgCTGTTCTTTTTTTCATTCATTTACctgGGGGAAGTGTTTAAAACCTATAACGTTGCTGTGGACTACATTACTGTTGCACTCCTGATCTGGAATTTTggcGTGGTGGGAATGATTTCCATTCACTGGAAAggcCCActgagaCTCCAGCAGGCATATCTCATTATGATTAGTGCCCTCATGGCCCTGGTGTTTATCAAGTACCTCCCTGAATGGACTgccTGGCTCATCTTGGCTGTGATTTCAGTGTATGATTTAGTGGCTGTTctgTGTcctAAAGGTCCActgCGTATGCTGgtgGAAACAGCTCAGGAGAGAAATGAAaccctgTTTCCAGCTCTCATTTACTCCTCAACAATGGTGTGGctgGTGAATATGGCAGAAGGAGACcctGAAGCTCAAAGGAGAgtgTCCAAAAATTCCAAGTATAATGCAGAAAGCACAGAAAGGGAGTCAcagGACACTGTTGCAGAGAATGATGATGGCGGGTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGTcacctgGGGCCTcacCGCTCTACACCTGAGTCAagaGCTGCTGTCCAGGAActgTCCAGCAGTATCCTCGCTggcGAAGACCCAGAGGAAAGGGGAGTAAAACTTGGATTGGGAGATTTCATTTTCTACAGTGTTCTGGTTggcAAAGCCTCAGCAACAGCCAGTGGAGACTGGAACACAACCATAGCCTGTTTCGTAGCCatcTTAATTggcctgTGCCTTACActgctgCTCctgGCCATTTTCAAGAAAGCActgCCAGCTctgCCAATCTCCATCACCTTTGGGCTTGTTTTCTACTTTGCCACAGATTATctggtgCAGCCTTTTATGGACcagctgGCATTCcaccagTTTTATATCtaaATGACAGAGTTACCTGCAcctTTGTCCTACTTCCAGAATGCACAGATGTCTGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAATAGAGAACGGCAGGAGCACAACGACAGACGGAGCctgGGCCACCCTGAGCCActgTCTAATGGAagaCCCCAGGGTAACTCCCGGCAGGTGGTGGAGcagGATGAGGAAGAAGATGAGGAGCTGACActgAAATATGGCGCCAAGcacGTGATCATGCTCTTTGTCCCTGTGACTCTCTGCATGGTGGTGGTCGTGGCTACCATTAAGTCAGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGATACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATTCTGAATGCTGCCATCATGATCAGTGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGctgATTATATCATCTctgTTGctgCTGTTCTTTTTTTCATTCATTTACctgGGGGAAGTGTTTAAAACCTATAACGTTGCTGTGGACTACATTACTGTTGCACTCCTGATCTGGAATTTTggcGTGGTGGGAATGATTTCCATTCACTGGAAAggcCCActgagaCTCCAGCAGGCATATCTCATTATGATTAGTGCCCTCATGGCCCTGGTGTTTATCAAGTACCTCCCTGAATGGACTgccTGGCTCATCTTGGCTGTGATTTCAGTGTATGATTTAGTGGCTGTTctgTGTcctAAAGGTCCActgCGTATGCTGgtgGAAACAGCTCAGGAGAGAAATGAAaccctgTTTCCAGCTCTCATTTACTCCTCAACAATGGTGTGGctgGTGAATATGGCAGAAGGAGACcctGAAGCTCAAAGGAGAgtgTCCAAAAATTCCAAGTATAATGCAGAAAGCACAGAAAGGGAGTCAcagGACACTGTTGCAGAGAATGATGATGGCGGGTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGTcacctgGGGCCTcacCGCTCTACACCTGAGTCAagaGCTGCTGTCCAGGAActgTCCAGCAGTATCCTCGCTggcGAAGACCCAGAGGAAAGGGGAGTAAAACTTGGATTGGGAGATTTCATTTTCTACAGTGTTCTGGTTggcAAAGCCTCAGCAACAGCCAGTGGAGACTGGAACACAACCATAGCCTGTTTCGTAGCCatcTTAATTggcctgTGCCTTACActgctgCTCctgGCCATTTTCAAGAAAGCActgCCAGCTctgCCAATCTCCATCACCTTTGGGCTTGTTTTCTACTTTGCCACAGATTATctggtgCAGCCTTTTATGGACcagctgGCATTCcaccagTTTTATATCtaa
SEQ ID NO:49
包含AAV2反向末端重复、U6启动子、1个拷贝的抗hPSEN1-401-421(加有下划线)、H1启动子、1个拷贝的抗hPSEN1-953-973(加有下划线)、CAG启动子、密码子修饰的PSEN1编码
序列、兔多聚腺苷酸化
序列以及AAV2反向末端重复的示例性AAV转基因。
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACCAGGGTAATGGGGATCCTCTAGAACTATGGTACCAAGGTCGGGCAGGAAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGAGCAAGATGAGGAAGAAGACGAATCTTCTTCCTCATCTTGCTCCTTTTTTCTAGAGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAATGTCTTTGGATTTGGGAATCTTATAAGTTCTGTATGAGACCACGCTCATCTTGGCTGTGATTTCCGAAGAAATCACAGCCAAGATGAGCTTTTTTCTAGTCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGCGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGATCTGCCACCATGACAGAGTTACCTGCACCGTTGTCCTACTTCCAGAATGCACAGATGTCTGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAATAGAGAACGGCAGGAGCACAACGACAGACGGAGCCTTGGCCACCCTGAGCCATTATCTAATGGACGACCCCAGGGTAACTCCCGGCAGGTGGTGGAACAGGACGAAGAGGAGGATGAGGAGCTGACATTGAAATATGGCGCCAAGCATGTGATCATGCTCTTTGTCCCTGTGACTCTCTGCATGGTGGTGGTCGTGGCTACCATTAAGTCAGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGATACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATTCTGAATGCTGCCATCATGATCAGTGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTTATTATATCATCTCTATTGTTGCTGTTCTTTTTTTCATTCATTTACTTGGGGGAAGTGTTTAAAACCTATAACGTTGCTGTGGACTACATTACTGTTGCACTCCTGATCTGGAATTTTGGTGTGGTGGGAATGATTTCCATTCACTGGAAAGGTCCACTTCGACTCCAGCAGGCATATCTCATTATGATTAGTGCCCTCATGGCCCTGGTGTTTATCAAGTACCTCCCTGAATGGACTGCGTGGCTGATTCTAGCCGTAATCTCAGTATATGATTTAGTGGCTGTTTTGTGTCCGAAAGGTCCACTTCGTATGCTGGTTGAAACAGCTCAGGAGAGAAATGAAACGCTTTTTCCAGCTCTCATTTACTCCTCAACAATGGTGTGGTTGGTGAATATGGCAGAAGGAGACCCGGAAGCTCAAAGGAGAGTATCCAAAAATTCCAAGTATAATGCAGAAAGCACAGAAAGGGAGTCACAAGACACTGTTGCAGAGAATGATGATGGCGGGTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGTCATCTAGGGCCTCATCGCTCTACACCTGAGTCACGAGCTGCTGTCCAGGAACTTTCCAGCAGTATCCTCGCTGGTGAAGACCCAGAGGAAAGGGGAGTAAAACTTGGATTGGGAGATTTCATTTTCTACAGTGTTCTGGTTGGTAAAGCCTCAGCAACAGCCAGTGGAGACTGGAACACAACCATAGCCTGTTTCGTAGCCATATTAATTGGTTTGTGCCTTACATTATTACTCCTTGCCATTTTCAAGAAAGCATTGCCAGCTCTTCCAATCTCCATCACCTTTGGGCTTGTTTTCTACTTTGCCACAGATTATCTTGTACAGCCTTTTATGGACCAATTAGCATTCCATCAATTTTATATCTAGCATAGTCGACCCCTATCCATCACACTGGCGGCCGCTCGAGGACGGGGTGAACTACGCCTGAGGATCCGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGCAATTCGTTGATCTGAATTTCGACCACCCATAATACCCATTACCCTGGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
SEQ ID NO:50
>CAG启动子
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCCCCCCCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAAAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGTTGCGCGCTGCCTTCCCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAG
SEQ ID NO:51
>CBA启动子。
TCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCG
SEQ ID NO:52
>UBC启动子
GGTGCAGCGGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGGAGCGTTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTTGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCACAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTAAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGGTTTGTCGTCTGGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAA
SEQ ID NO:53
>PGK启动子
TTCTACCGGGTAGGGGAGGCGCTTTTCCCAAGGCAGTCTGGAGCATGCGCTTTAGCAGCCCCGCTGGGCACTTGGCGCTACACAAGTGGCCTCTGGCCTCGCACACATTCCACATCCACCGGTAGGCGCCAACCGGCTCCGTTCTTTGGTGGCCCCTTCGCGCCACCTTCTACTCCTCCCCTAGTCAGGAAGTTCCCCCCCGCCCCGCAGCTCGCGTCGTGCAGGACGTGACAAATGGAAGTAGCACGTCTCACTAGTCTCGTGCAGATGGACAGCACCGCTGAGCAATGGAAGCGGGTAGGCCTTTGGGGCAGCGGCCAATAGCAGCTTTGCTCCTTCGCTTTCTGGGCTCAGAGGCTGGGAAGGGGTGGGTCCGGGGGCGGGCTCAGGGGCGGGCTCAGGGGCGGGGCGGGCGCCCGAAGGTCCTCCGGAGGCCCGGCATTCTGCACGCTTCAAAAGCGCACGTCTGCCGCGCTGTTCTCCTCTTCCTCATCTCCGGGCCTTTCGACCT
SEQ ID NO:54
>Ef1α启动子
GCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA
SEQ ID NO:55
>CMV启动子
GTCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTT
SEQ ID NO:56
>NSE启动子
AGCTCTGAGCTCCTCCTCTGCTCGCCCAATCCTTCCAACCCCCTATGGTGGTATGGCTGACACAGAAAATGTCTGCTCCTGTATGGGACATTTGCCCCTCTTCTCCAAATATAAGACAGGATGAGGCCTAGCTTTTGCTGCTCCAAAGTTTTAAAAGAACACATTGCACGGCATTTAGGGACTCTAAAGGGTGGAGGAGGAATGAGGGAATTGCATCATGCCAAGGCTGGTCCTCATCCATCACTGCTTCCAGGGCCCAGAGTGGCTTCCAGGAAGTATTCTTACAAAGGAAGCCCGATCTGTAGCTAACACTCAGAGCCCATTTTCCTGCGTTAACCCCTCCCGACCTCATATACAGGAGTAACATGATCAGTGACCTGGGGGAGCTGGCCAAACTGCGGGACCTGCCCAAGCTGAGGGCCTTGGTGCTGCTGGACAACCCCTGTGCCGATGAGACTGACTACCGCCAGGAGGCCCTGGTGCAGATGGCACACCTAGAGCGCCTAGACAAAGAGTACTATGAGGACGAGGACCGGGCAGAAGCTGAGGAGATCCGACAGAGGCTGAAGGAGGAACAGGAGCAAGAACTCGACCCGGACCAAGACATGGAACCGTACCTCCCGCCAACTTAGTGGCTCCTCTAGCCTGCAGGGACAGTAAAGGTGATGGCAGGAAGGCAGCCCCCGGAGGTCAAAGGCTGGGCACGCGGGAGGAGAGGCCAGAGTCAGAGGCTGCGGGTATCTCAGATATGAAGGAAAGATGAGAGAGGCTCAGGAAGAGGTAAGAAAAGACACAAGAGACCAGAGAAGGGAGAAGAATTAGAGAGGGAGGCAGAGGACCGCTGTCTCTACAGACATAGCTGGTAGAGACTGGGAGGAAGGGATGAACCCTGAGCGCATGAAGGGAAGGAGGTGGCTGGTGGTATATGGAGGATGTAGCTGGGCCAGGGAAAAGATCCTGCACTAAAAATCTGAAGCTAAAAATAACAGGACACGGGGTGGAGAGGCGAAAGGAGGGCAGAGTGAGGCAGAGAGACTGAGAGGCCTGGGGATGTGGGCATTCCGGTAGGGCACACAGTTCACTTGTCTTCTCTTTTTCCAGGAGGCCAAAGATGCTGACGTCAAGAACTCATAATACCCCAGTGGGGACCACCGCATTCATAGCCCTGTTACAAGAAGTGGGAGATGTTCCTTTTTGTCCCAGACTGGAAATCCGTTACATCCCGAGGCTCAGGTTCTGTGGTGGTCATCTCTGTGTGGCTTGTTCTGTGGGCCTACCTAAAGTCCTAAGCACAGCTCTCAAGCAGATCCGAGGCGACTAAGATGCTAGTAGGGGTTGTCTGGAGAGAAGAGCCGAGGAGGTGGGCTGTGATGGATCAGTTCAGCTTTCAAATAAAAAGGCGTTTTTATATTCTGTGTCGAGTTCGTGAACCCCTGTGGTGGGCTTCTCCATCTGTCTGGGTTAGTACCTGCCACTATACTGGAATAAGGGGACGCCTGCTTCCCTCGAGTTGGCTGGACAAGGTTATGAGCATCCGTGTACTTATGGGGTTGCCAGCTTGGTCCTGGATCGCCCGGGCCCTTCCCCCACCCGTTCGGTTCCCCACCACCACCCGCGCTCGTACGTGCGTCTCCGCCTGCAGCTCTTGACTCATCGGGGCCCCCGGGTCACATGCGCTCGCTCGGCTCTATAGGCGCCGCCCCCTGCCCACCCCCCGCCCGCGCTGGGAGCCGCAGCCGCCGCCACTCCTGCTCTCTCTGCGCCG
SEQ ID NO:57
>MeCP2启动子
TGCCCATTATAAACGTCTGCAAAGACCAAGGTTTGATATGTTGATTTTACTGTCAGCCTTAAGAGTGCGACATCTGCTAATTTAGTGTAATAATACAATCAGTAGACCCTTTAAAACAAGTCCCTTGGCTTGGAACAACGCCAGGCTCCTCAACAGGCAACTTTGCTACTTCTACAGAAAATGATAATAAAGAAATGCTGGTGAAGTCAAATGCTTATCACAATGGTGAACTACTCAGCAGGGAGGCTCTAATAGGCGCCAAGAGCCTAGACTTCCTTAAGCGCCAGAGTCCACAAGGGCCCAGTTAATCCTCAACATTCAAATGCTGCCCACAAAACCAGCCCCTCTGTGCCCTAGCCGCCTCTTTTTTCCAAGTGACAGTAGAACTCCACCAATCCGCAGCTGAATGGGGTCCGCCTCTTTTCCCTGCCTAAACAGACAGGAACTCCTGCCAATTGAGGGCGTCACCGCTAAGGCTCCGCCCCAGCCTGGGCTCCACAACCAATGAAGGGTAATCTCGACAAAGAGCAAGGGGTGGGGCGCGGGCGCGCAGGTGCAGCAGCACACAGGCTGGTCGGGAGGGCGGGGCGCGACGTCTGCCGTGCGGGGTCCCGGCATCGGTTGCGCGCGCGCTCCCTCCTCTCGGAGAGAGGGCTGTGGTAAAACCCGTCCGGAAAATGGCCGCCGCTGCCGCCACCGCCGCCGCCGCCGCCGCGCCGAGCGGAGGAGGAGG
SEQ ID NO:58
>GFAP启动子
GGCAACATGGCAAGACCCTATCTCTACAAAAAAAGTTAAAAAATCAGCCACGTGTGGTGACACACACCTGTAGTCCCAGCTATTCAGGAGGCTGAGGTGAGGGGATCACTTAAGGCTGGGAGGTTGAGGCTGCAGTGAGTCGTGGTTGCGCCACTGCACTCCAGCCTGGGCAACAGTGAGACCCTGTCTCAAAAGACAAAAAAAAAAAAAAAAAAAAAAAGAACATATCCTGGTGTGGAGTAGGGGACGCTGCTCTGACAGAGGCTCGGGGGCCTGAGCTGGCTCTGTGAGCTGGGGAGGAGGCAGACAGCCAGGCCTTGTCTGCAAGCAGACCTGGCAGCATTGGGCTGGCCGCCCCCCAGGGCCTCCTCTTCATGCCCAGTGAATGACTCACCTTGGCACAGACACAATGTTCGGGGTGGGCACAGTGCCTGCTTCCCGCCGCACCCCAGCCCCCCTCAAATGCCTTCCGAGAAGCCCATTGAGCAGGGGGCTTGCATTGCACCCCAGCCTGACAGCCTGGCATCTTGGGATAAAAGCAGCACAGCCCCCTAGGGGCTGCCCTTGCTGTGTGGCGCCACCGGCGGTGGAGAACAAGGCTCTATTCAGCCTGTGCCCAGGAAAGGGGATCAGGGGATGCCCAGGCATGGACAGTGGGTGGCAGGGGGGGAGAGGAGGGCTGTCTGCTTCCCAGAAGTCCAAGGACACAAATGGGTGAGGGGACTGGGCAGGGTTCTGACCCTGTGGGACCAGAGTGGAGGGCGTAGATGGACCTGAAGTCTCCAGGGACAACAGGGCCCAGGTCTCAGGCTCCTAGTTGGGCCCAGTGGCTCCAGCGTTTCCAAACCCATCCATCCCCAGAGGTTCTTCCCATCTCTCCAGGCTGATGTGTGGGAACTCGAGGAAATAAATCTCCAGTGGGAGACGGAGGGGTGGCCAGGGAAACGGGGCGCTGCAGGAATAAAGACGAGCCAGCACAGCCAGCTCATGTGTAACGGCTTTGTGGAGCTGTCAAGGCCTGGTCTCTGGGAGAGAGGCACAGGGAGGCCAGACAAGGAAGGGGTGACCTGGAGGGACAGATCCAGGGGCTAAAGTCCTGATAAGGCAAGAGAGTGCCGGCCCCCTCTTGCCCTATCAGGACCTCCACTGCCACATAGAGGCCATGATTGACCCTTAGACAAAGGGCTGGTGTCCAATCCCAGCCCCCAGCCCCAGAACTCCAGGGAATGAATGGGCAGAGAGCAGGAATGTGGGACATCTGTGTTCAAGGGAAGGACTCCAGGAGTCTGCTGGGAATGAGGCCTAGTAGGAAATGAGGTGGCCCTTGAGGGTACAGAACAGGTTCATTCTTCGCCAAATTCCCAGCACCTTGCAGGCACTTACAGCTGAGTGAGATAATGCCTGGGTTATGAAATCAAAAAGTTGGAAAGCAGGTCAGAGGTCATCTGGTACAGCCCTTCCTTCCCTTTTTTTTTTTTTTTTTTGTGAGACAAGGTCTCTCTCTGTTGCCCAGGCTGGAGTGGCGCAAACACAGCTCACTGCAGCCTCAACCTACTGGGCTCAAGCAATCCTCCAGCCTCAGCCTCCCAAAGTGCTGGGATTACAAGCATGAGCCACCCCACTCAGCCCTTTCCTTCCTTTTTAATTGATGCATAATAATTGTAAGTATTCATCATGGTCCAACCAACCCTTTCTTGACCCACCTTCCTAGAGAGAGGGTCCTCTTGCTTCAGCGGTCAGGGCCCCAGACCCATGGTCTGGCTCCAGGTACCACCTGCCTCATGCAGGAGTTGGCGTGCCCAGGAAGCTCTGCCTCTGGGCACAGTGACCTCAGTGGGGTGAGGGGAGCTCTCCCCATAGCTGGGCTGCGGCCCAACCCCACCCCCTCAGGCTATGCCAGGGGGTGTTGCCAGGGGCACCCGGGCATCGCCAGTCTAGCCCACTCCTTCATAAAGCCCTCGCATCCCAGGAGCGAGCAGAGCCAGAGCAGG
SEQ ID NO:59
>GUSB启动子
GAATTCCTGCTGGGAAAAGCAAGTGGAGGTGCTCCTTGAAGAAACAGGGGGATCCCACCGATCTCAGGGGTTCTGTTCTGGCCTGCGGCCCTGGATCGTCCAGCCTGGGTCGGGGTGGGGAGCAGACCTCGCCCTTATCGGCTGGGGCTGAGGGTGAGGGTCCCGTTTCCCCAAAGGCCTAGCCTGGGGTTCCAGCCACGAAGCCCTACCGGGAGCGCCCGGCCCCGCCCCTCCAGGCCTGGCACTCGTCCTCAACCAAGATGGCGCGGATGGCTTCAGGCGCATCACGACACCGGCGCGTCACGCGACCCGCCCTACGGGCACCTCCCGCGCTTTTCTTAGCGCCGCAGACGGTGGCCGAGCGGGGGACCGGGAAGC
SEQ ID NO:60
>RSV启动子
AATGTAGTCTTATGCAATACTCTTGTAGTCTTGCAACATGGTAACGATGAGTTAGCAACATGCCTTACAAGGAGAGAAAAAGCACCGTGCATGCCGATTGGTGGAAGTAAGGTGGTACGATCGTGCCTTATTAGGAAGGCAACAGACGGGTCTGACATGGATTGGACGAACCACTGAATTGCCGCATTGCAGAGATATTGTATTTAAGTGCCTAGCTCGATACATAAAC
SEQ ID NO:61
SV40启动子
GGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGATCGATCAAGAGACAGGATGAGGATCGTTTCGC
SEQ ID NO:62
NPY启动子
TTTTGGCCAGGGGATGTGGCTTGGACTGGAGAGAAAGGAGATAAGGATGTAAACACATGTAGGGCATATCACCCCCTATTTTTTATTCTCTGAATCCTTAACCCTCAGAATAAGTTCTTATTCTTGAGAATCAATGACATTATCTTAAGCTAAATTAATCAAGCCTCCACAGTGTTCTTCTCTCAATAGTGGTGTGGGCCTTCCTAGAAGTAATTTTTCCCAAATTCAGTGATACATTTTAAGTTCAGATTTTAATTGATATGAATCTGTGATACACTCTAAAATAAGATTATTTTATTGAAAAGTGGACTGTAACTTTCCCTTTATCTAGGAAGAGCTCTAAGTTAGAAGATGTTTTGCACTTTTACCGAAGGCTGTGTCTTGTAAGCACCCCCGAGCAACTCTGAGAGCCTTGATTTTTGTGTCCTCAGCATATGTTTGTGTAATACAGAAAGAGAAGCAGTTGCCAAGTGAAAGGGATGTTGGTCTCCAAAATTATAGTTTGATCCCACAAACACACAAACACATACATGCAAAGGATTGTTTGCTTCACGGTTTTTGATATTTAATTCAATGCTGTTGGAACAGCACAAAAACTAAGTGTCAGTTTAACAGAATCACTTGTCCTTTTAGCATTAAAATAACATGGAACTTAATGCTTTAATTTCCCAACATGCCTTTTTATTTAGAAAGATTCAGACTTTTATTTCATTTAGAAATAAAATGCCATTTTATTTAGAAAGATACAGGAGCATTCATTCACGGAACTTTCAGATCTCAGTCCACTGCATAAAATCTTGATCCTGTAATAATAGTTTCTGTATCTTGCATATTCATTCAACAGGTTTAACGCGATGAGCAAATTAATGTTCATCGTTTTTAACATGTTTCGTCTTAATCAGAACCCACATTCTCAACGTTAATTGAACGTACATAGGACTATACAAGGGTTAGTAAATAAGACAGAAACTGTTGCTCATTTAACCACCGTCACTTTGGA
SEQ ID NO:63
SST启动子
ACACTAAAATGTTAGAGTATGATGACAGATGGAGTTGTCTGGGTACATTTGTGTGCATTTAAGGGTGATAGTGTATTTGCTCTTTAAGAGCTGAGTGTTTGAGCCTCTGTTTGTGTGTAATTGAGTGTGCATGTGTGGGAGTGAAATTGTGGAATGTGTATGCTCATAGCACTGAGTGAAAATAAAAGATTGTATAAATCGTGGGGCATGTGGAATTGTGTGTGCCTGTGCGTGTGCAGTATTTTTTTTTTTTTAAGTAAGCCACTTTAGATCTTGTCACCTCCCCTGTCTTCTGTGATTGATTTTGCGAGGCTAATGGTGCGTAAAAGGGCTGGTGAGATCTGGGGGCGCCTCCTAGCCTGACGTCAGAGAGAGAGTTTAAAACAGAGGGAGACGGTTGAGAGCACACAAGCCGCTTTAGGAGCGAGGTTCGGAGCCATCGCTGCTGCCTGCTGATCCGCGCCTAGAGTTTGACCAGCC
SEQ ID NO:64
突触蛋白启动子1
ACACCACCCAAGTGTCCACCTCCGCTTGTCTGATGCTGTCTATGACGCCCCCGCTCTCTGCCTAGCTGAGCCTGTGTGGATGTGGGAGACTAATCTCCCCGCGGGCACTGCGTGTGACCTCACCCCCCTCTGTGAGGGGGTTATTTCTCTACTTTCGTGTCTCTGAGTGTGCTTCCAGTGCCCCCCTCCCCCCAAAAAATGCCTTCTGAGTTGAATATCAACACTACAAACCGAGTATCTGCAGAGGGCCCTGCGTATGAGTGCAAGTGGGTTTTAGGACCAGGATGAGGCGGGGTGGGGGTGCCTACCTGACGACCGACCCCGACCCACTGGACAAGCACCCAACCCCCATTCCCCAAATTGCGCATCCCCTATCAGAGAGGGGGAGGGGAAACAGGATGCGGCGAGGCGCGTGCGCACTGCCAGCTTCAGCACCGCGGACAGTGCCTTCGCCCCCGCCTGGCGGCGCGCGCCACCGCCGCCTCAGCACTGAAGGCGCGCTGACGTCACTCGCCGGTCCCCCGCAAACTCCCCTTCCCGGCCACCTTGGTCGCGTCCGCGCCGCCGCCGGCCCAGCCGGACCGCACCACGCGAGGCGCGAGATAGGGGGGCACGGGCGCGACCATCTGCGCTGCGGCGCCGGCGACTCAGCGCTGCCTCAGTCTGCGGTGGGCAGCGGAGGAGTCGTGTCGTGCCTGAG
SEQ ID NO:65
突触蛋白启动子2
ACACTACAAACCGAGTATCTGCAGAGGGCCCTGCGTATGAGTGCAAGTGGGTTTTAGGACCAGGATGAGGCGGGGTGGGGGTGCCTACCTGACGACCGACCCCGACCCACTGGACAAGCACCCAACCCCCATTCCCCAAATTGCGCATCCCCTATCAGAGAGGGGGAGGGGAAACAGGATGCGGCGAGGCGCGTGCGCACTGCCAGCTTCAGCACCGCGGACAGTGCCTTCGCCCCCGCCTGGCGGCGCGCGCCACCGCCGCCTCAGCACTGAAGGCGCGCTGACGTCACTCGCCGGTCCCCCGCAAACTCCCCTTCCCGGCCACCTTGGTCGCGTCCGCGCCGCCGCCGGCCCAGCCGGACCGCACCACGCGAGGCGCGAGATAGGGGGGCACGGGCGCGACCATCTGCGCTGCGGCGCCGGCGACTCAGCGCTGCCTCAGTCTGCGGTGGGCAGCGGAGGAGTCGTGTCGTGCCTGAG
SEQ ID NO:66
>β-珠蛋白启动子
GCTTTGCTTCTCAATTTCTTATTTGCATAATGAGAAAAAAAGGAAAATTAATTTTAACACCAATTCAGTAGTTGATTGAGCAAATGCGTTGCCAAAAAGGATGCTTTAGAGACAGTGTTCTCTGCACAGATAAGGACAAACATTATTCAGAGGGAGTACCCAGAGCTGAGACTCCTAAGCCAGTGAGTGGCACAGCATTCTAGGGAGAAATATGCTTGTCATCACCGAAGCCTGATTCCGTAGAGCCACACCTTGGTAAGGGCCAATCTGCTCACACAGGATAGAGAGGGCAGGAGCCAGGGCAGAGCATATAAGGTGAGGTAGGATCAGTTGCTCCTCACATTTGCTTCTGACATAGTTGTGTTG
SEQ ID NO:67(共有Kozak序列)
GCCGCCRCCAUGG
SEQ ID NO:68(pAT049)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGAATTATGTTTCGAATTTGACTTTAGAGGTTTACATTTCTAGTCAAAGAAGAAACATCCATTCAGCTGCTCCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:69(pAT050)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGATAGCACATCTTTGAAAGTCATAAGAGGTTTACATTTCTTGACTTTGTTAGATGTGGACTTCAGCTGCTTCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:70(pAT051)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:71(pAT052)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGATTCTGGTCACTACACGATTCCTCGAGGTTTACATTTCGAAATCGTCCTGTGACCACGCTTCAGCTGCTTCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:72(pAT053)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:73(pAT054)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGAATTATGTTTCGAATTTGACTTTAGAGGTTTACATTTCTAGTCAAAGAAGAAACATCCATTCAGCTGCTCCTGAGCTGTTGGAATTATGTTTCGAATTTGACTTTAGAGGTTTACATTTCTAGTCAAAGAAGAAACATCCATTCAGCTGCTCCTGAGCTGTTGGAATTATGTTTCGAATTTGACTTTAGAGGTTTACATTTCTAGTCAAAGAAGAAACATCCATTCAGCTGCTCCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:74(pAT055)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:75(pAT056)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGATATCGGTACCTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCTGAGCTGTTGGAGACTAGAAAAGCCTTTTGACTACGAGGTTTACATTTCGTTCAAAATCGTTTTCTATAGTTCAGCTGCTTCGTCGACGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTACAGAATTACCTGCCCCCTTGAGCTACTTCCAGAATGCACAGATGAGCGAGGACAACCACCTGAGCAATACTGTACGTAGCCAGAATGACAACAGAGAACGGCAGGAACACAACGACAGGCGGAGCCTGGGCCACCCTGAGCCCCTGTCTAATGGAAGACCCCAGGGTAACAGCAGACAGGTGGTGGAACAAGATGAGGAAGAGGACGAGGAGCTGACCCTGAAGTACGGCGCCAAGCACGTGATCATGCTCTTCGTGCCCGTGACTCTCTGCATGGTGGTGGTGGTGGCTACAATCAAGAGCGTCAGCTTTTATACCCGGAAGGATGGGCAGCTAATCTATACCCCATTCACAGAAGACACCGAGACTGTGGGCCAGAGAGCCCTGCACTCAATCCTGAATGCCGCCATCATGATCAGCGTCATTGTTGTCATGACTATCCTCCTGGTGGTTCTGTATAAATACAGGTGCTATAAGGTCATCCATGCCTGGCTGATCATATCATCTCTGTTGCTGCTGTTCTTTTTTAGCTTCATTTACCTGGGCGAAGTGTTTAAAACCTATAACGTTGCCGTGGACTACATTACTGTTGCCCTCCTGATCTGGAACTTCGGCGTGGTGGGCATGATTTCCATTCACTGGAAAGGCCCCCTGAGACTGCAGCAGGCATACCTCATTATGATCTCCGCCCTCATGGCCCTGGTGTTCATCAAGTACCTGCCCGAGTGGACTGCTTGGCTCATCTTGGCTGTGATCTCCGTGTATGATTTAGTGGCTGTTCTGTGTCCTAAAGGTCCACTGCGTATGCTGGTGGAAACAGCTCAGGAAAGAAATGAAACACTGTTTCCTGCTCTGATTTACTCCTCAACAATGGTGTGGCTCGTGAATATGGCCGAAGGAGACCCTGAAGCCCAACGGAGAGTGTCCAAAAACTCCAAGTATAACGCCGAGAGCACAGAAAGGGAGAGCCAGGATACAGTTGCCGAGAATGACGATGGCGGCTTCAGTGAGGAATGGGAAGCCCAGAGGGACAGCCACCTGGGGCCTCACAGAAGCACCCCTGAGTCTAGAGCCGCTGTCCAGGAACTGTCCAGCTCCATCCTGGCCGGCGAAGACCCCGAAGAAAGGGGAGTAAAACTTGGACTGGGAGATTTCATCTTCTACAGTGTTCTCGTTGGCAAAGCCAGCGCAACAGCTAGCGGAGACTGGAACACAACAATAGCCTGTTTCGTAGCCATCTTAATTGGCCTGTGCCTTACACTTCTGCTCCTGGCCATCTTCAAGAAGGCCCTGCCAGCCCTGCCTATCAGCATCACCTTCGGGCTTGTTTTCTACTTTGCCACCGATTATCTGGTGCAGCCCTTCATGGACCAGCTGGCCTTCCACCAGTTTTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:76(pAT057)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGAAGCTTGGATGGTCTTGTATTCAGGAGGTTTACATTTCCTATACAACTGCATCCAATGATTCAGCTGCTTCTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:77(pAT058)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGATTCCAGTTGTTATGTTTTATCCAGAGGTTTACATTTCTGTAAAACTATACAACTGCATTTCAGCTGCTTCTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:78(pAT059)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:79(pAT060)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:80(pAT061)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAGGTACCGTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTTTTTCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:81(pAT062)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCAATTCAGTGGATCCCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATCCGGGACGCGTCAATTGAGATCTCCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGTCGAGGCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGCAAGCTTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTGTGGTTGGGATAAGGCTGGATTATTCTGAGATATCGGTACCTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCTGAGCTGTTGGATTCGCTTAATTCGAATATCCTAAGAGGTTTACATTTCTTGATATTACTATTAAGCCACTTCAGCTGCTTCGTCGACGCTAGGCCCTTTTGCTAATCGTGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTACCGGTGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCACGCCCCAGAGCCGCCACCATGGCCTACCCATACGATGTTCCAGATTACGCTCTCACATTCATGGCCTCTGACAGCGAGGAAGAAGTGTGTGATGAGCGGACGTCCCTAATGTCGGCTGAGAGCCCCACGCCGCGCTCCTGCCAGGAGGGCAGGCAGGGCCCAGAGGATGGAGAGAACACTGCCCAGTGGAGAAGCCAGGAGAACGAGGAGGACGGTGAGGAGGACCCTGACCGCTATGTCTGTAGTGGGGTTCCCGGGCGGCCGCCAGGCCTGGAGGAAGAGCTGACCCTCAAATACGGAGCGAAGCACGTGATCATGCTGTTTGTGCCTGTCACTCTGTGCATGATCGTGGTGGTAGCCACCATCAAGTCTGTGCGCTTCTACACAGAGAAGAATGGACAGCTCATCTACACGCCATTCACTGAGGACACACCCTCGGTGGGCCAGCGCCTCCTCAACTCCGTGCTGAACACCCTCATCATGATCAGCGTCATCGTGGTTATGACCATCTTCTTGGTGGTGCTCTACAAGTACCGCTGCTACAAGTTCATCCATGGCTGGTTGATCATGTCTTCACTGATGCTGCTGTTCCTCTTCACCTATATCTACCTTGGGGAAGTGCTCAAGACCTACAATGTGGCCATGGACTACCCCACCCTCTTGCTGACTGTCTGGAACTTCGGGGCAGTGGGCATGGTGTGCATCCACTGGAAGGGCCCTCTGGTGCTGCAGCAGGCCTACCTCATCATGATCAGTGCGCTCATGGCCCTAGTGTTCATCAAGTACCTCCCAGAGTGGTCCGCGTGGGTCATCCTGGGCGCCATCTCTGTGTATGATCTCGTGGCTGTGCTGTGTCCCAAAGGGCCTCTGAGAATGCTGGTAGAAACTGCCCAGGAGAGAAATGAGCCCATATTCCCTGCCCTGATATACTCATCTGCCATGGTGTGGACGGTTGGCATGGCGAAGCTGGACCCCTCCTCTCAGGGTGCCCTCCAGCTCCCCTACGACCCGGAGATGGAAGAAGACTCCTATGACAGTTTTGGGGAGCCTTCATACCCCGAAGTCTTTGAGCCTCCCTTGACTGGCTACCCAGGGGAGGAGCTGGAGGAAGAGGAGGAAAGGGGCGTGAAGCTTGGCCTCGGGGACTTCATCTTCTACAGTGTGCTGGTGGGCAAGGCGGCTGCCACGGGCAGCGGGGACTGGAATACCACGCTGGCCTGCTTCGTGGCCATCCTCATTGGCTTGTGTCTGACCCTCCTGCTGCTTGCTGTGTTCAAGAAGGCGCTGCCCGCCCTCCCCATCTCCATCACGTTCGGGCTCATCTTTTACTTCTCCACGGACAACCTGGTGCGGCCGTTCATGGACACCCTGGCCTCCCATCAGCTCTACATCTAGTAAGCGGCCGCCCTAGGGAGCTCCTCGAGGGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGGGGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCCCCTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCCTGGGCCTAGGGCTGTGCCAGCTGCCTCGTCCCGTCACCTTCTGGCTTCTTCTCTCCCTCCATATCTTAGCTGTTTTCCTCATGAGAATGTTCCAAATTCGAAATTTCTATTTAACCATTATATATTTACTTGTTTGCTATTATCTCTGCCCCCAGTAGATTGTTAGCTCCAGAAGAGAAAGGATCATGTCTTTTGCTTATCTAGATATGCCCATCTGCCTGGTACAATCTCTGGCACATGTTACAGGCAACAACTACTTGTGGAATTGGTGAATGCATGAATAGAAGAATGAGTGAATGAATGAATAGACAATAGGCAGAAATCCAGCCTCAAAGAGCTTACAGTCTGGTAAGAGGAATAAAATGTCTGCAAATAGCCACAGGACAGGTCAAAGGAAGGAGGGGCTATTTCCAGCTGAGGGCACCCCATCAGGAAAGCACCCCAGACTTCCTTAGGGATAACAGGGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCTTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACTCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGTCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTCGATCGATCAAGAGACAGGATGAGGATCGTTTCGCATGATTGAACAAGATGGATTGCACGCAGGTTCTCCGGCCGCTTGGGTGGAGAGGCTATTCGGCTATGACTGGGCACAACAGACAATCGGCTGCTCTGATGCCGCCGTGTTCCGGCTGTCAGCGCAGGGGCGCCCGGTTCTTTTTGTCAAGACCGACCTGTCCGGTGCCCTGAATGAACTGCAAGACGAGGCAGCGCGGCTATCGTGGCTGGCCACGACGGGCGTTCCTTGCGCAGCTGTGCTCGACGTTGTCACTGAAGCGGGAAGGGACTGGCTGCTATTGGGCGAAGTGCCGGGGCAGGATCTCCTGTCATCTCACCTTGCTCCTGCCGAGAAAGTATCCATCATGGCTGATGCAATGCGGCGGCTGCATACGCTTGATCCGGCTACCTGCCCATTCGACCACCAAGCGAAACATCGCATCGAGCGAGCACGTACTCGGATGGAAGCCGGTCTTGTCGATCAGGATGATCTGGACGAAGAGCATCAGGGGCTCGCGCCAGCCGAACTGTTCGCCAGGCTCAAGGCGAGCATGCCCGACGGCGAGGATCTCGTCGTGACCCATGGCGATGCCTGCTTGCCGAATATCATGGTGGAAAATGGCCGCTTTTCTGGATTCATCGACTGTGGCCGGCTGGGTGTGGCGGATCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGAGCTTGGCGGCGAATGGGCTGACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTCTATCGCCTTCTTGACGAGTTCTTCTGAACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
SEQ ID NO:82(内源性PSEN1特异性正向引物)
CCTGACCACCTTGCACTATT
SEQ ID NO:83(内源性PSEN1特异性探针)
TGTGTCCCTCGGTGCAGAAACTAC
SEQ ID NO:84(内源性PSEN1特异性反向引物)
CAACTTCCGGGCCTATCATATC
SEQ ID NO:85(质粒编码的转录物特异性正向引物)
TGGACCAATTAGCATTCCATCA
SEQ ID NO:86(质粒编码的转录物特异性探针)
TGAACTACGCCTGAGGATCCGATCT
SEQ ID NO:87(质粒编码的转录物特异性反向引物)
GCCAGAAGTCAGATGCTCAA
SEQ ID NO:88(内源性PSEN2特异性正向引物)
GAGAAGGTCAGATTAGGGCG
SEQ ID NO:89(内源性PSEN2特异性探针)
AAAGAGTGTGCTCGGGAGTGC
SEQ ID NO:90(内源性PSEN2特异性反向引物)
TCGTAGGGAACTGGCTTTTC
整个本公开中对其他文件,如专利、专利申请、专利公布、杂志、书籍、论文、网络内容的任何和所有提及和引用均据此出于所有目的以引用方式整体并入本文。
虽然已经参考以上实施例中的本发明的某些实施方案的具体细节描述了本发明,但是应理解,修改和变化将涵盖在本发明的精神和范围内。因此,本发明仅受以下权利要求的限制。
序列表
<110> 亚普拉斯医疗公司(APRES THERAPEUTICS, INC.)
K•S•加农 (GANNON, KIMBERLEY S.)
M•古雷特 (GOULET, MARTIN)
N•R•哈克特 (HACKETT, NEIL R.)
<120> 使用多核苷酸沉默和替换的神经退行性病症的基因疗法
<130> APRES1120-1WO
<140>
<141>
<150> 62/968,707
<151> 2020-01-31
<160> 90
<170> PatentIn version 3.5
<210> 1
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 1
gcaaaggctg ttgtcacttg c 21
<210> 2
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 2
atagaaatac tgtttcacag aaaacaa 27
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 3
tcatcttctt cctcatcttg ctc 23
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 4
acaaagagca tgatcacatg c 21
<210> 5
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 5
atcatgatgg cagcattcag aattgag 27
<210> 6
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 6
acaatgacac tgatcatgat ggc 23
<210> 7
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 7
tagtcatgac aacaatgaca ctgatca 27
<210> 8
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 8
tttctctcct gagctgtttc aac 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 9
cttctgccat attcaccaac cac 23
<210> 10
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 10
ggaaagttcc tggacagcag ctc 23
<210> 11
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 11
ggttgtgttc cagtctccac tggc 24
<210> 12
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 12
aaagaagaaa catccatggg attctaa 27
<210> 13
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 13
atagtcaaag aagaaacatc cat 23
<210> 14
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 14
gtgtccacat ctaacaaagt caagatt 27
<210> 15
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 15
cagtgaaatc gtcctgtgac cacgcgt 27
<210> 16
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 16
tgtgaccacg cgtcaagctg ctgatgg 27
<210> 17
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 17
ttgacatcat tagctcactg tatcccc 27
<210> 18
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 18
tccaagttgc ttagaaagct tctac 25
<210> 19
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 19
atatcttacc aagaatttga aaggtat 27
<210> 20
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 20
tttcttcatc agtaaaattc agagggg 27
<210> 21
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 21
ttgggaaaag tcactttagc tctgtgg 27
<210> 22
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 22
cagtgaatgg cgtgtagatg agctgtc 27
<210> 23
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 23
tcagtgaatg gcgtgtagat gagctgt 27
<210> 24
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 24
ctcagtgaat ggcgtgtaga tgagctg 27
<210> 25
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 25
tggtcataac cacgatgacg ctgatca 27
<210> 26
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 26
agcggtactt gtagagcacc accaaga 27
<210> 27
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 27
actgtcatag gagtcttctt ccatctc 27
<210> 28
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 28
tatacaactg catccaatga aaattcc 27
<210> 29
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 29
aaaactatac aactgcatcc aatgaaa 27
<210> 30
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 30
gtaaaactat acaactgcat ccaatga 27
<210> 31
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 31
ttctcagttc atctggataa acctgct 27
<210> 32
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 32
tgatattact attaagccac ttcccag 27
<210> 33
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 33
gaatcccata gatacttctt ctttaaatgt ccatacaaga agaaacatcc atgggattc 59
<210> 34
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 34
acttttcatc aaatgcaggt aaggtttaca ttttacaact gcatccaatg aaaatt 56
<210> 35
<211> 83
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 35
aggcctctct ctagaatccc atagatactt cttctttaaa tgtccataca agaagaaaca 60
tccatgggat tcgaatgggg ctg 83
<210> 36
<211> 82
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 36
tgagctgttg gattactttt catcaaatgc aggtaaggtt tacattttac aactgcatcc 60
aatgaaaatt ttcagctgct tc 82
<210> 37
<211> 3169
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 37
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgaag 180
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 240
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 300
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 360
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 420
ttgtggaaag gacgaaacac caggcctctc tctagaatcc catagatact tcttctttaa 480
atgtccatac aagaagaaac atccatggga ttcgaatggg gctgaggcct ctctctagaa 540
tcccatagat acttcttctt taaatgtcca tacaagaaga aacatccatg ggattcgaat 600
ggggctgagg cctctctcta gaatcccata gatacttctt ctttaaatgt ccatacaaga 660
agaaacatcc atgggattcg aatggggctg tttttcgcgt cgacattgat tattgactag 720
ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt 780
tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac 840
gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg 900
ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 960
tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat 1020
gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 1080
gtcgaggcca cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg 1140
tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg gggcgcgcgc 1200
caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt gcggcggcag 1260
ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 1320
cctataaaaa gcgaagcgcg cggcggggcc accatgacag agttacctgc accgttgtcc 1380
tacttccaga atgcacagat gtctgaggac aaccacctga gcaatactgt acgtagccag 1440
aatgacaata gagaacggca ggagcacaac gacagacgga gccttggcca ccctgagcca 1500
ttatctaatg gacgacccca gggtaactcc cggcaggtgg tggagcaaga tgaggaagaa 1560
gatgaggagc tgacattgaa atatggcgcc aagcatgtga tcatgctctt tgtccctgtg 1620
actctctgca tggtggtggt cgtggctacc attaagtcag tcagctttta tacccggaag 1680
gatgggcagc taatctatac cccattcaca gaagataccg agactgtggg ccagagagcc 1740
ctgcactcaa ttctgaatgc tgccatcatg atcagtgtca ttgttgtcat gactatcctc 1800
ctggtggttc tgtataaata caggtgctat aaggtcatcc atgcctggct tattatatca 1860
tctctattgt tgctgttctt tttttcattc atttacttgg gggaagtgtt taaaacctat 1920
aacgttgctg tggactacat tactgttgca ctcctgatct ggaattttgg tgtggtggga 1980
atgatttcca ttcactggaa aggtccactt cgactccagc aggcatatct cattatgatt 2040
agtgccctca tggccctggt gtttatcaag tacctccctg aatggactgc gtggctcatc 2100
ttggctgtga tttcagtata tgatttagtg gctgttttgt gtccgaaagg tccacttcgt 2160
atgctggttg aaacagctca ggagagaaat gaaacgcttt ttccagctct catttactcc 2220
tcaacaatgg tgtggttggt gaatatggca gaaggagacc cggaagctca aaggagagta 2280
tccaaaaatt ccaagtataa tgcagaaagc acagaaaggg agtcacaaga cactgttgca 2340
gagaatgatg atggcgggtt cagtgaggaa tgggaagccc agagggacag tcatctaggg 2400
cctcatcgct ctacacctga gtcacgagct gctgtccagg aactttccag cagtatcctc 2460
gctggtgaag acccagagga aaggggagta aaacttggat tgggagattt cattttctac 2520
agtgttctgg ttggtaaagc ctcagcaaca gccagtggag actggaacac aaccatagcc 2580
tgtttcgtag ccatattaat tggtttgtgc cttacattat tactccttgc cattttcaag 2640
aaagcattgc cagctcttcc aatctccatc acctttgggc ttgttttcta ctttgccaca 2700
gattatcttg tacagccttt tatggaccaa ttagcattcc atcaatttta tatctagcat 2760
agtcgacccc tatccatcac actggcggcc gctcgaggac ggggtgaact acgcctgagg 2820
atccgatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct 2880
gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg 2940
tctctcactc ggaagcaatt cgttgatctg aatttcgacc acccataata cccattaccc 3000
tggtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 3060
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 3120
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 3169
<210> 38
<211> 3110
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 38
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgaag 180
gtcgggcagg aagagggcct atttcccatg attccttcat atttgcatat acgatacaag 240
gctgttagag agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat 300
acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa 360
atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc 420
ttgtggaaag gacgaaacac catgagctgt tggattactt ttcatcaaat gcaggtaagg 480
tttacatttt acaactgcat ccaatgaaaa ttttcagctg cttctgagct gttggattac 540
ttttcatcaa atgcaggtaa ggtttacatt ttacaactgc atccaatgaa aattttcagc 600
tgcttctgag ctgttggatt acttttcatc aaatgcaggt aaggtttaca ttttacaact 660
gcatccaatg aaaattttca gctgcttctt tttcgcgtcg acattgatta ttgactagtt 720
attaatagta atcaattacg gggtcattag ttcatagccc atatatggag ttccgcgtta 780
cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 840
caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 900
tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta 960
cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga 1020
ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgt 1080
cgaggccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 1140
tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gcgcgcgcca 1200
ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc 1260
aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg gcggcggccc 1320
tataaaaagc gaagcgcgcg gcggggccac catgctcaca ttcatggcct ctgacagcga 1380
ggaagaagtg tgtgatgagc ggacgtccct aatgtcggct gagagcccca cgccgcgctc 1440
ctgccaggag ggcaggcagg gcccagagga tggagagaac actgcccagt ggagaagcca 1500
ggagaacgag gaggacggtg aggaggaccc tgaccgctat gtctgtagtg gggttcccgg 1560
gcggccgcca ggcctggagg aagagctgac cctcaaatac ggagcgaagc acgtgatcat 1620
gctgtttgtg cctgtcactc tgtgcatgat cgtggtggta gccaccatca agtctgtgcg 1680
cttctacaca gagaagaatg gacagctcat ctacacgcca ttcactgagg acacaccctc 1740
ggtgggccag cgcctcctca actccgtgct gaacaccctc atcatgatca gcgtcatcgt 1800
ggttatgacc atcttcttgg tggtgctcta caagtaccgc tgctacaagt tcatccatgg 1860
ctggttgatc atgtcttcac tgatgctgct gttcctcttc acctatatct accttgggga 1920
agtgctcaag acctacaatg tggccatgga ctaccccacc ctcttgctga ctgtctggaa 1980
cttcggggca gtgggcatgg tgtgcatcca ctggaagggc cctctggtgc tgcagcaggc 2040
ctacctcatc atgatcagtg cgctcatggc cctagtgttc atcaagtacc tcccagagtg 2100
gtccgcgtgg gtcatcctgg gcgccatctc tgtgtatgat ctcgtggctg tgctgtgtcc 2160
caaagggcct ctgagaatgc tggtagaaac tgcccaggag agaaatgagc ccatattccc 2220
tgccctgata tactcatctg ccatggtgtg gacggttggc atggcgaagc tggacccctc 2280
ctctcagggt gccctccagc tcccctacga cccggagatg gaagaagact cctatgacag 2340
ttttggggag ccttcatacc ccgaagtctt tgagcctccc ttgactggct acccagggga 2400
ggagctggag gaagaggagg aaaggggcgt gaagcttggc ctcggggact tcatcttcta 2460
cagtgtgctg gtgggcaagg cggctgccac gggcagcggg gactggaata ccacgctggc 2520
ctgcttcgtg gccatcctca ttggcttgtg tctgaccctc ctgctgcttg ctgtgttcaa 2580
gaaggcgctg cccgccctcc ccatctccat cacgttcggg ctcatctttt acttctccac 2640
ggacaacctg gtgcggccgt tcatggacac cctggcctcc catcagctct acatctgaca 2700
tagtcgaccc ctatccatca cactggcggc cgctcgagga cggggtgaac tacgcctgag 2760
gatccgatct ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc 2820
tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt 2880
gtctctcact cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc 2940
ctggtagata agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag 3000
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 3060
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 3110
<210> 39
<211> 1404
<212> DNA
<213> 智人(Homo sapiens)
<400> 39
atgacagagt tacctgcacc gttgtcctac ttccagaatg cacagatgtc tgaggacaac 60
cacctgagca atactgtacg tagccagaat gacaatagag aacggcagga gcacaacgac 120
agacggagcc ttggccaccc tgagccatta tctaatggac gaccccaggg taactcccgg 180
caggtggtgg agcaagatga ggaagaagat gaggagctga cattgaaata tggcgccaag 240
catgtgatca tgctctttgt ccctgtgact ctctgcatgg tggtggtcgt ggctaccatt 300
aagtcagtca gcttttatac ccggaaggat gggcagctaa tctatacccc attcacagaa 360
gataccgaga ctgtgggcca gagagccctg cactcaattc tgaatgctgc catcatgatc 420
agtgtcattg ttgtcatgac tatcctcctg gtggttctgt ataaatacag gtgctataag 480
gtcatccatg cctggcttat tatatcatct ctattgttgc tgttcttttt ttcattcatt 540
tacttggggg aagtgtttaa aacctataac gttgctgtgg actacattac tgttgcactc 600
ctgatctgga attttggtgt ggtgggaatg atttccattc actggaaagg tccacttcga 660
ctccagcagg catatctcat tatgattagt gccctcatgg ccctggtgtt tatcaagtac 720
ctccctgaat ggactgcgtg gctcatcttg gctgtgattt cagtatatga tttagtggct 780
gttttgtgtc cgaaaggtcc acttcgtatg ctggttgaaa cagctcagga gagaaatgaa 840
acgctttttc cagctctcat ttactcctca acaatggtgt ggttggtgaa tatggcagaa 900
ggagacccgg aagctcaaag gagagtatcc aaaaattcca agtataatgc agaaagcaca 960
gaaagggagt cacaagacac tgttgcagag aatgatgatg gcgggttcag tgaggaatgg 1020
gaagcccaga gggacagtca tctagggcct catcgctcta cacctgagtc acgagctgct 1080
gtccaggaac tttccagcag tatcctcgct ggtgaagacc cagaggaaag gggagtaaaa 1140
cttggattgg gagatttcat tttctacagt gttctggttg gtaaagcctc agcaacagcc 1200
agtggagact ggaacacaac catagcctgt ttcgtagcca tattaattgg tttgtgcctt 1260
acattattac tccttgccat tttcaagaaa gcattgccag ctcttccaat ctccatcacc 1320
tttgggcttg ttttctactt tgccacagat tatcttgtac agccttttat ggaccaatta 1380
gcattccatc aattttatat ctag 1404
<210> 40
<211> 1347
<212> DNA
<213> 智人(Homo sapiens)
<400> 40
atgctcacat tcatggcctc tgacagcgag gaagaagtgt gtgatgagcg gacgtcccta 60
atgtcggctg agagccccac gccgcgctcc tgccaggagg gcaggcaggg cccagaggat 120
ggagagaaca ctgcccagtg gagaagccag gagaacgagg aggacggtga ggaggaccct 180
gaccgctatg tctgtagtgg ggttcccggg cggccgccag gcctggagga agagctgacc 240
ctcaaatacg gagcgaagca cgtgatcatg ctgtttgtgc ctgtcactct gtgcatgatc 300
gtggtggtag ccaccatcaa gtctgtgcgc ttctacacag agaagaatgg acagctcatc 360
tacacgccat tcactgagga cacaccctcg gtgggccagc gcctcctcaa ctccgtgctg 420
aacaccctca tcatgatcag cgtcatcgtg gttatgacca tcttcttggt ggtgctctac 480
aagtaccgct gctacaagtt catccatggc tggttgatca tgtcttcact gatgctgctg 540
ttcctcttca cctatatcta ccttggggaa gtgctcaaga cctacaatgt ggccatggac 600
taccccaccc tcttgctgac tgtctggaac ttcggggcag tgggcatggt gtgcatccac 660
tggaagggcc ctctggtgct gcagcaggcc tacctcatca tgatcagtgc gctcatggcc 720
ctagtgttca tcaagtacct cccagagtgg tccgcgtggg tcatcctggg cgccatctct 780
gtgtatgatc tcgtggctgt gctgtgtccc aaagggcctc tgagaatgct ggtagaaact 840
gcccaggaga gaaatgagcc catattccct gccctgatat actcatctgc catggtgtgg 900
acggttggca tggcgaagct ggacccctcc tctcagggtg ccctccagct cccctacgac 960
ccggagatgg aagaagactc ctatgacagt tttggggagc cttcataccc cgaagtcttt 1020
gagcctccct tgactggcta cccaggggag gagctggagg aagaggagga aaggggcgtg 1080
aagcttggcc tcggggactt catcttctac agtgtgctgg tgggcaaggc ggctgccacg 1140
ggcagcgggg actggaatac cacgctggcc tgcttcgtgg ccatcctcat tggcttgtgt 1200
ctgaccctcc tgctgcttgc tgtgttcaag aaggcgctgc ccgccctccc catctccatc 1260
acgttcgggc tcatctttta cttctccacg gacaacctgg tgcggccgtt catggacacc 1320
ctggcctccc atcagctcta catctga 1347
<210> 41
<211> 1432
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 41
cccagatctg ccaccatgac agagttacct gcaccgttgt cctacttcca gaatgcacag 60
atgtctgagg acaaccacct gagcaatact gtacgtagcc agaatgacaa tagagaacgg 120
caggagcaca acgacagacg gagccttggc caccctgagc cattatctaa tggacgaccc 180
cagggtaact cccggcaggt ggtggaacag gacgaagagg aggacgaaga gctgacattg 240
aaatatggcg ccaaacacgt cataatgcta ttcgtgcctg tgactctctg catggtggtg 300
gtcgtggcta ccattaagtc agtcagcttt tatacccgga aggatgggca gctaatctat 360
accccattca cagaagatac cgagactgtg ggccagagag ccctgcatag catactcaag 420
gcagctatta tgatttccgt gatcgttgtc atgactatcc tcctggtggt tctgtataaa 480
tacaggtgct ataaggtcat ccatgcctgg cttattatat catctctatt gttgctgttc 540
tttttttcat tcatttactt gggggaagtg tttaaaacct ataacgttgc tgtggactac 600
attactgttg cactcctgat ctggaatttt ggtgtggtgg gaatgatttc cattcactgg 660
aaaggtccac ttcgactcca gcaggcatat ctcattatga ttagtgccct catggccctg 720
gtgtttatca agtacctccc tgaatggact gcgtggctca tcttggctgt gatttcagta 780
tatgatttag tggctgtttt gtgtccgaaa ggtccacttc gaatgctagt cgagacggca 840
caagaaagaa atgaaacgct ttttccagct ctcatttact cctcaactat ggtatggcta 900
gtcaacatgg cagaaggaga cccggaagct caaaggagag tatccaaaaa ttccaagtat 960
aatgcagaaa gcacagaaag ggagtcacaa gacactgttg cagagaatga tgatggcggg 1020
ttcagtgagg aatgggaagc ccagagggac agtcatctag ggcctcatcg ctctacacct 1080
gagtcacgag cagcggtgca agagctgtct tccagtatcc tcgctggtga agacccagag 1140
gaaaggggag taaaacttgg attgggagat ttcattttct acagtgttct ggttggtaaa 1200
gcctcagcaa cagcgagtgg tgattggaat actacgatag cctgtttcgt agccatatta 1260
attggtttgt gccttacatt attactcctt gccattttca agaaagcatt gccagctctt 1320
ccaatctcca tcacctttgg gcttgttttc tactttgcca cagattatct tgtacagcct 1380
tttatggacc aattagcatt ccatcaattt tatatctagc atagtcgacc cc 1432
<210> 42
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 42
gaaatcacag ccaagatgag c 21
<210> 43
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 43
atggaatgct aattggtcca t 21
<210> 44
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 44
ggagcaagat gaggaagaag acgaatcttc ttcctcatct tgctcctt 48
<210> 45
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 45
gctcatcttg gctgtgattt ccgaagaaat cacagccaag atgagctt 48
<210> 46
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 46
aaagttcctg gacagcagct ccgaagagct gctgtccagg aacttttt 48
<210> 47
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 47
gatggaatgc taattggtcc atcgaaatgg accaattagc attccatt 48
<210> 48
<211> 2808
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 48
atgacagagt tacctgcacc tttgtcctac ttccagaatg cacagatgtc tgaggacaac 60
cacctgagca atactgtacg tagccagaat gacaatagag aacggcagga gcacaacgac 120
agacggagcc tgggccaccc tgagccactg tctaatggaa gaccccaggg taactcccgg 180
caggtggtgg agcaggatga ggaagaagat gaggagctga cactgaaata tggcgccaag 240
cacgtgatca tgctctttgt ccctgtgact ctctgcatgg tggtggtcgt ggctaccatt 300
aagtcagtca gcttttatac ccggaaggat gggcagctaa tctatacccc attcacagaa 360
gataccgaga ctgtgggcca gagagccctg cactcaattc tgaatgctgc catcatgatc 420
agtgtcattg ttgtcatgac tatcctcctg gtggttctgt ataaatacag gtgctataag 480
gtcatccatg cctggctgat tatatcatct ctgttgctgc tgttcttttt ttcattcatt 540
tacctggggg aagtgtttaa aacctataac gttgctgtgg actacattac tgttgcactc 600
ctgatctgga attttggcgt ggtgggaatg atttccattc actggaaagg cccactgaga 660
ctccagcagg catatctcat tatgattagt gccctcatgg ccctggtgtt tatcaagtac 720
ctccctgaat ggactgcctg gctcatcttg gctgtgattt cagtgtatga tttagtggct 780
gttctgtgtc ctaaaggtcc actgcgtatg ctggtggaaa cagctcagga gagaaatgaa 840
accctgtttc cagctctcat ttactcctca acaatggtgt ggctggtgaa tatggcagaa 900
ggagaccctg aagctcaaag gagagtgtcc aaaaattcca agtataatgc agaaagcaca 960
gaaagggagt cacaggacac tgttgcagag aatgatgatg gcgggttcag tgaggaatgg 1020
gaagcccaga gggacagtca cctggggcct caccgctcta cacctgagtc aagagctgct 1080
gtccaggaac tgtccagcag tatcctcgct ggcgaagacc cagaggaaag gggagtaaaa 1140
cttggattgg gagatttcat tttctacagt gttctggttg gcaaagcctc agcaacagcc 1200
agtggagact ggaacacaac catagcctgt ttcgtagcca tcttaattgg cctgtgcctt 1260
acactgctgc tcctggccat tttcaagaaa gcactgccag ctctgccaat ctccatcacc 1320
tttgggcttg ttttctactt tgccacagat tatctggtgc agccttttat ggaccagctg 1380
gcattccacc agttttatat ctaaatgaca gagttacctg cacctttgtc ctacttccag 1440
aatgcacaga tgtctgagga caaccacctg agcaatactg tacgtagcca gaatgacaat 1500
agagaacggc aggagcacaa cgacagacgg agcctgggcc accctgagcc actgtctaat 1560
ggaagacccc agggtaactc ccggcaggtg gtggagcagg atgaggaaga agatgaggag 1620
ctgacactga aatatggcgc caagcacgtg atcatgctct ttgtccctgt gactctctgc 1680
atggtggtgg tcgtggctac cattaagtca gtcagctttt atacccggaa ggatgggcag 1740
ctaatctata ccccattcac agaagatacc gagactgtgg gccagagagc cctgcactca 1800
attctgaatg ctgccatcat gatcagtgtc attgttgtca tgactatcct cctggtggtt 1860
ctgtataaat acaggtgcta taaggtcatc catgcctggc tgattatatc atctctgttg 1920
ctgctgttct ttttttcatt catttacctg ggggaagtgt ttaaaaccta taacgttgct 1980
gtggactaca ttactgttgc actcctgatc tggaattttg gcgtggtggg aatgatttcc 2040
attcactgga aaggcccact gagactccag caggcatatc tcattatgat tagtgccctc 2100
atggccctgg tgtttatcaa gtacctccct gaatggactg cctggctcat cttggctgtg 2160
atttcagtgt atgatttagt ggctgttctg tgtcctaaag gtccactgcg tatgctggtg 2220
gaaacagctc aggagagaaa tgaaaccctg tttccagctc tcatttactc ctcaacaatg 2280
gtgtggctgg tgaatatggc agaaggagac cctgaagctc aaaggagagt gtccaaaaat 2340
tccaagtata atgcagaaag cacagaaagg gagtcacagg acactgttgc agagaatgat 2400
gatggcgggt tcagtgagga atgggaagcc cagagggaca gtcacctggg gcctcaccgc 2460
tctacacctg agtcaagagc tgctgtccag gaactgtcca gcagtatcct cgctggcgaa 2520
gacccagagg aaaggggagt aaaacttgga ttgggagatt tcattttcta cagtgttctg 2580
gttggcaaag cctcagcaac agccagtgga gactggaaca caaccatagc ctgtttcgta 2640
gccatcttaa ttggcctgtg ccttacactg ctgctcctgg ccattttcaa gaaagcactg 2700
ccagctctgc caatctccat cacctttggg cttgttttct actttgccac agattatctg 2760
gtgcagcctt ttatggacca gctggcattc caccagtttt atatctaa 2808
<210> 49
<211> 4360
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 49
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180
atcctctaga actatggtac caaggtcggg caggaagagg gcctatttcc catgattcct 240
tcatatttgc atatacgata caaggctgtt agagagataa ttagaattaa tttgactgta 300
aacacaaaga tattagtaca aaatacgtga cgtagaaagt aataatttct tgggtagttt 360
gcagttttaa aattatgttt taaaatggac tatcatatgc ttaccgtaac ttgaaagtat 420
ttcgatttct tggctttata tatcttgtgg aaaggacgaa acaccggagc aagatgagga 480
agaagacgaa tcttcttcct catcttgctc cttttttcta gagaacgctg acgtcatcaa 540
cccgctccaa ggaatcgcgg gcccagtgtc actaggcggg aacacccagc gcgcgtgcgc 600
cctggcagga agatggctgt gagggacagg ggagtggcgc cctgcaatat ttgcatgtcg 660
ctatgtgttc tgggaaatca ccataaacgt gaaatgtctt tggatttggg aatcttataa 720
gttctgtatg agaccacgct catcttggct gtgatttccg aagaaatcac agccaagatg 780
agcttttttc tagtcgacat tgattattga ctagttatta atagtaatca attacggggt 840
cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 900
ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 960
taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 1020
acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 1080
gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 1140
agtacatcta cgtattagtc atcgctatta ccatggtcga ggtgagcccc acgttctgct 1200
tcactctccc catctccccc ccctccccac ccccaatttt gtatttattt attttttaat 1260
tattttgtgc agcgatgggg gcgggggggg ggggggggcg cgcgccaggc ggggcggggc 1320
ggggcgaggg gcggggcggg gcgaggcgga gaggtgcggc ggcagccaat cagagcggcg 1380
cgctccgaaa gtttcctttt atggcgaggc ggcggcggcg gcggccctat aaaaagcgaa 1440
gcgcgcggcg ggcgggagtc gctgcgcgct gccttcgccc cgtgccccgc tccgccgccg 1500
cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg 1560
acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc 1620
tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg gggagcggct 1680
cggggggtgc gtgcgtgtgt gtgtgcgtgg ggagcgccgc gtgcggctcc gcgctgcccg 1740
gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg 1800
ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct 1860
gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcgtcg gtcgggctgc 1920
aaccccccct gcacccccct ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc 1980
tccgtacggg gcgtggcgcg gggctcgccg tgccgggcgg ggggtggcgg caggtggggg 2040
tgccgggcgg ggcggggccg cctcgggccg gggagggctc gggggagggg cgcggcggcc 2100
cccggagcgc cggcggctgt cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat 2160
cgtgcgagag ggcgcaggga cttcctttgt cccaaatctg tgcggagccg aaatctggga 2220
ggcgccgccg caccccctct agcgggcgcg gggcgaagcg gtgcggcgcc ggcaggaagg 2280
aaatgggcgg ggagggcctt cgtgcgtcgc cgcgccgccg tccccttctc cctctccagc 2340
ctcggggctg tccgcggggg gacggctgcc ttcggggggg acggggcagg gcggggttcg 2400
gcttctggcg tgtgaccggc ggctctagag cctctgctaa ccatgttcat gccttcttct 2460
ttttcctaca gctcctgggc aacgtgctgg ttattgtgct gtctcatcat tttggcaaag 2520
aattcacgcc ccagatctgc caccatgaca gagttacctg caccgttgtc ctacttccag 2580
aatgcacaga tgtctgagga caaccacctg agcaatactg tacgtagcca gaatgacaat 2640
agagaacggc aggagcacaa cgacagacgg agccttggcc accctgagcc attatctaat 2700
ggacgacccc agggtaactc ccggcaggtg gtggaacagg acgaagagga ggatgaggag 2760
ctgacattga aatatggcgc caagcatgtg atcatgctct ttgtccctgt gactctctgc 2820
atggtggtgg tcgtggctac cattaagtca gtcagctttt atacccggaa ggatgggcag 2880
ctaatctata ccccattcac agaagatacc gagactgtgg gccagagagc cctgcactca 2940
attctgaatg ctgccatcat gatcagtgtc attgttgtca tgactatcct cctggtggtt 3000
ctgtataaat acaggtgcta taaggtcatc catgcctggc ttattatatc atctctattg 3060
ttgctgttct ttttttcatt catttacttg ggggaagtgt ttaaaaccta taacgttgct 3120
gtggactaca ttactgttgc actcctgatc tggaattttg gtgtggtggg aatgatttcc 3180
attcactgga aaggtccact tcgactccag caggcatatc tcattatgat tagtgccctc 3240
atggccctgg tgtttatcaa gtacctccct gaatggactg cgtggctgat tctagccgta 3300
atctcagtat atgatttagt ggctgttttg tgtccgaaag gtccacttcg tatgctggtt 3360
gaaacagctc aggagagaaa tgaaacgctt tttccagctc tcatttactc ctcaacaatg 3420
gtgtggttgg tgaatatggc agaaggagac ccggaagctc aaaggagagt atccaaaaat 3480
tccaagtata atgcagaaag cacagaaagg gagtcacaag acactgttgc agagaatgat 3540
gatggcgggt tcagtgagga atgggaagcc cagagggaca gtcatctagg gcctcatcgc 3600
tctacacctg agtcacgagc tgctgtccag gaactttcca gcagtatcct cgctggtgaa 3660
gacccagagg aaaggggagt aaaacttgga ttgggagatt tcattttcta cagtgttctg 3720
gttggtaaag cctcagcaac agccagtgga gactggaaca caaccatagc ctgtttcgta 3780
gccatattaa ttggtttgtg ccttacatta ttactccttg ccattttcaa gaaagcattg 3840
ccagctcttc caatctccat cacctttggg cttgttttct actttgccac agattatctt 3900
gtacagcctt ttatggacca attagcattc catcaatttt atatctagca tagtcgaccc 3960
ctatccatca cactggcggc cgctcgagga cggggtgaac tacgcctgag gatccgatct 4020
ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 4080
ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 4140
cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 4200
agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 4260
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 4320
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4360
<210> 50
<211> 1677
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 50
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480
tgggggcggg gggggggggg gggccccccc caggcggggc ggggcggggc gaggggcggg 540
gcggggcgag gcggaaaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660
gagtcgttgc gcgctgcctt ccccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840
gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080
gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260
ggccgcctcg ggccggggag ggctcggggg aaggggcgcg gcggcccccg gagcgccggc 1320
ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg 1380
cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc 1440
ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag 1500
ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg 1560
cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg 1620
accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt cctacag 1677
<210> 51
<211> 278
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 51
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278
<210> 52
<211> 1177
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 52
ggtgcagcgg cctccgcgcc gggttttggc gcctcccgcg ggcgcccccc tcctcacggc 60
gagcgctgcc acgtcagacg aagggcgcag gagcgttcct gatccttccg cccggacgct 120
caggacagcg gcccgctgct cataagactc ggccttagaa ccccagtatc agcagaagga 180
cattttagga cgggacttgg gtgactctag ggcactggtt ttctttccag agagcggaac 240
aggcgaggaa aagtagtccc ttctcggcga ttctgcggag ggatctccgt ggggcggtga 300
acgccgatga ttatataagg acgcgccggg tgtggcacag ctagttccgt cgcagccggg 360
atttgggtcg cggttcttgt ttgtggatcg ctgtgatcgt cacttggtga gttgcgggct 420
gctgggctgg ccggggcttt cgtggccgcc gggccgctcg gtgggacgga agcgtgtgga 480
gagaccgcca agggctgtag tctgggtccg cgagcaaggt tgccctgaac tgggggttgg 540
ggggagcgca caaaatggcg gctgttcccg agtcttgaat ggaagacgct tgtaaggcgg 600
gctgtgaggt cgttgaaaca aggtgggggg catggtgggc ggcaagaacc caaggtcttg 660
aggccttcgc taatgcggga aagctcttat tcgggtgaga tgggctgggg caccatctgg 720
ggaccctgac gtgaagtttg tcactgactg gagaactcgg gtttgtcgtc tggttgcggg 780
ggcggcagtt atgcggtgcc gttgggcagt gcacccgtac ctttgggagc gcgcgcctcg 840
tcgtgtcgtg acgtcacccg ttctgttggc ttataatgca gggtggggcc acctgccggt 900
aggtgtgcgg taggcttttc tccgtcgcag gacgcagggt tcgggcctag ggtaggctct 960
cctgaatcga caggcgccgg acctctggtg aggggaggga taagtgaggc gtcagtttct 1020
ttggtcggtt ttatgtacct atcttcttaa gtagctgaag ctccggtttt gaactatgcg 1080
ctcggggttg gcgagtgtgt tttgtgaagt tttttaggca ccttttgaaa tgtaatcatt 1140
tgggtcaata tgtaattttc agtgttagac tagtaaa 1177
<210> 53
<211> 511
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 53
ttctaccggg taggggaggc gcttttccca aggcagtctg gagcatgcgc tttagcagcc 60
ccgctgggca cttggcgcta cacaagtggc ctctggcctc gcacacattc cacatccacc 120
ggtaggcgcc aaccggctcc gttctttggt ggccccttcg cgccaccttc tactcctccc 180
ctagtcagga agttcccccc cgccccgcag ctcgcgtcgt gcaggacgtg acaaatggaa 240
gtagcacgtc tcactagtct cgtgcagatg gacagcaccg ctgagcaatg gaagcgggta 300
ggcctttggg gcagcggcca atagcagctt tgctccttcg ctttctgggc tcagaggctg 360
ggaaggggtg ggtccggggg cgggctcagg ggcgggctca ggggcggggc gggcgcccga 420
aggtcctccg gaggcccggc attctgcacg cttcaaaagc gcacgtctgc cgcgctgttc 480
tcctcttcct catctccggg cctttcgacc t 511
<210> 54
<211> 1182
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 54
gctccggtgc ccgtcagtgg gcagagcgca catcgcccac agtccccgag aagttggggg 60
gaggggtcgg caattgaacc ggtgcctaga gaaggtggcg cggggtaaac tgggaaagtg 120
atgtcgtgta ctggctccgc ctttttcccg agggtggggg agaaccgtat ataagtgcag 180
tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc cagaacacag gtaagtgccg 240
tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta 300
cttccacgcc cctggctgca gtacgtgatt cttgatcccg agcttcgggt tggaagtggg 360
tgggagagtt cgaggccttg cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc 420
tggcctgggc gctggggccg ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct 480
gctttcgata agtctctagc catttaaaat ttttgatgac ctgctgcgac gctttttttc 540
tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctggtatttc ggtttttggg 600
gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg 660
cgagcgcggc caccgagaat cggacggggg tagtctcaag ctggccggcc tgctctggtg 720
cctggcctcg cgccgccgtg tatcgccccg ccctgggcgg caaggctggc ccggtcggca 780
ccagttgcgt gagcggaaag atggccgctt cccggccctg ctgcagggag ctcaaaatgg 840
aggacgcggc gctcgggaga gcgggcgggt gagtcaccca cacaaaggaa aagggccttt 900
ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc gggcgccgtc caggcacctc 960
gattagttct cgagcttttg gagtacgtcg tctttaggtt ggggggaggg gttttatgcg 1020
atggagtttc cccacactga gtgggtggag actgaagtta ggccagcttg gcacttgatg 1080
taattctcct tggaatttgc cctttttgag tttggatctt ggttcattct caagcctcag 1140
acagtggttc aaagtttttt tcttccattt caggtgtcgt ga 1182
<210> 55
<211> 679
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 55
gtcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc tggctaacta 600
gagaacccac tgcttactgg cttatcgaaa ttaatacgac tcactatagg gagacccaag 660
ctggctagcg tttaaactt 679
<210> 56
<211> 1765
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 56
agctctgagc tcctcctctg ctcgcccaat ccttccaacc ccctatggtg gtatggctga 60
cacagaaaat gtctgctcct gtatgggaca tttgcccctc ttctccaaat ataagacagg 120
atgaggccta gcttttgctg ctccaaagtt ttaaaagaac acattgcacg gcatttaggg 180
actctaaagg gtggaggagg aatgagggaa ttgcatcatg ccaaggctgg tcctcatcca 240
tcactgcttc cagggcccag agtggcttcc aggaagtatt cttacaaagg aagcccgatc 300
tgtagctaac actcagagcc cattttcctg cgttaacccc tcccgacctc atatacagga 360
gtaacatgat cagtgacctg ggggagctgg ccaaactgcg ggacctgccc aagctgaggg 420
ccttggtgct gctggacaac ccctgtgccg atgagactga ctaccgccag gaggccctgg 480
tgcagatggc acacctagag cgcctagaca aagagtacta tgaggacgag gaccgggcag 540
aagctgagga gatccgacag aggctgaagg aggaacagga gcaagaactc gacccggacc 600
aagacatgga accgtacctc ccgccaactt agtggctcct ctagcctgca gggacagtaa 660
aggtgatggc aggaaggcag cccccggagg tcaaaggctg ggcacgcggg aggagaggcc 720
agagtcagag gctgcgggta tctcagatat gaaggaaaga tgagagaggc tcaggaagag 780
gtaagaaaag acacaagaga ccagagaagg gagaagaatt agagagggag gcagaggacc 840
gctgtctcta cagacatagc tggtagagac tgggaggaag ggatgaaccc tgagcgcatg 900
aagggaagga ggtggctggt ggtatatgga ggatgtagct gggccaggga aaagatcctg 960
cactaaaaat ctgaagctaa aaataacagg acacggggtg gagaggcgaa aggagggcag 1020
agtgaggcag agagactgag aggcctgggg atgtgggcat tccggtaggg cacacagttc 1080
acttgtcttc tctttttcca ggaggccaaa gatgctgacg tcaagaactc ataatacccc 1140
agtggggacc accgcattca tagccctgtt acaagaagtg ggagatgttc ctttttgtcc 1200
cagactggaa atccgttaca tcccgaggct caggttctgt ggtggtcatc tctgtgtggc 1260
ttgttctgtg ggcctaccta aagtcctaag cacagctctc aagcagatcc gaggcgacta 1320
agatgctagt aggggttgtc tggagagaag agccgaggag gtgggctgtg atggatcagt 1380
tcagctttca aataaaaagg cgtttttata ttctgtgtcg agttcgtgaa cccctgtggt 1440
gggcttctcc atctgtctgg gttagtacct gccactatac tggaataagg ggacgcctgc 1500
ttccctcgag ttggctggac aaggttatga gcatccgtgt acttatgggg ttgccagctt 1560
ggtcctggat cgcccgggcc cttcccccac ccgttcggtt ccccaccacc acccgcgctc 1620
gtacgtgcgt ctccgcctgc agctcttgac tcatcggggc ccccgggtca catgcgctcg 1680
ctcggctcta taggcgccgc cccctgccca ccccccgccc gcgctgggag ccgcagccgc 1740
cgccactcct gctctctctg cgccg 1765
<210> 57
<211> 733
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 57
tgcccattat aaacgtctgc aaagaccaag gtttgatatg ttgattttac tgtcagcctt 60
aagagtgcga catctgctaa tttagtgtaa taatacaatc agtagaccct ttaaaacaag 120
tcccttggct tggaacaacg ccaggctcct caacaggcaa ctttgctact tctacagaaa 180
atgataataa agaaatgctg gtgaagtcaa atgcttatca caatggtgaa ctactcagca 240
gggaggctct aataggcgcc aagagcctag acttccttaa gcgccagagt ccacaagggc 300
ccagttaatc ctcaacattc aaatgctgcc cacaaaacca gcccctctgt gccctagccg 360
cctctttttt ccaagtgaca gtagaactcc accaatccgc agctgaatgg ggtccgcctc 420
ttttccctgc ctaaacagac aggaactcct gccaattgag ggcgtcaccg ctaaggctcc 480
gccccagcct gggctccaca accaatgaag ggtaatctcg acaaagagca aggggtgggg 540
cgcgggcgcg caggtgcagc agcacacagg ctggtcggga gggcggggcg cgacgtctgc 600
cgtgcggggt cccggcatcg gttgcgcgcg cgctccctcc tctcggagag agggctgtgg 660
taaaacccgt ccggaaaatg gccgccgctg ccgccaccgc cgccgccgcc gccgcgccga 720
gcggaggagg agg 733
<210> 58
<211> 1968
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 58
ggcaacatgg caagacccta tctctacaaa aaaagttaaa aaatcagcca cgtgtggtga 60
cacacacctg tagtcccagc tattcaggag gctgaggtga ggggatcact taaggctggg 120
aggttgaggc tgcagtgagt cgtggttgcg ccactgcact ccagcctggg caacagtgag 180
accctgtctc aaaagacgaa catatcctgg tgtggagtag gggacgctgc tctgacagag 240
gctcgggggc ctgagctggc tctgtgagct ggggaggagg cagacagcca ggccttgtct 300
gcaagcagac ctggcagcat tgggctggcc gccccccagg gcctcctctt catgcccagt 360
gaatgactca ccttggcaca gacacaatgt tcggggtggg cacagtgcct gcttcccgcc 420
gcaccccagc ccccctcaaa tgccttccga gaagcccatt gagcaggggg cttgcattgc 480
accccagcct gacagcctgg catcttggga taaaagcagc acagccccct aggggctgcc 540
cttgctgtgt ggcgccaccg gcggtggaga acaaggctct attcagcctg tgcccaggaa 600
aggggatcag gggatgccca ggcatggaca gtgggtggca gggggggaga ggagggctgt 660
ctgcttccca gaagtccaag gacacaaatg ggtgagggga ctgggcaggg ttctgaccct 720
gtgggaccag agtggagggc gtagatggac ctgaagtctc cagggacaac agggcccagg 780
tctcaggctc ctagttgggc ccagtggctc cagcgtttcc aaacccatcc atccccagag 840
gttcttccca tctctccagg ctgatgtgtg ggaactcgag gaaataaatc tccagtggga 900
gacggagggg tggccaggga aacggggcgc tgcaggaata aagacgagcc agcacagcca 960
gctcatgtgt aacggctttg tggagctgtc aaggcctggt ctctgggaga gaggcacagg 1020
gaggccagac aaggaagggg tgacctggag ggacagatcc aggggctaaa gtcctgataa 1080
ggcaagagag tgccggcccc ctcttgccct atcaggacct ccactgccac atagaggcca 1140
tgattgaccc ttagacaaag ggctggtgtc caatcccagc ccccagcccc agaactccag 1200
ggaatgaatg ggcagagagc aggaatgtgg gacatctgtg ttcaagggaa ggactccagg 1260
agtctgctgg gaatgaggcc tagtaggaaa tgaggtggcc cttgagggta cagaacaggt 1320
tcattcttcg ccaaattccc agcaccttgc aggcacttac agctgagtga gataatgcct 1380
gggttatgaa atcaaaaagt tggaaagcag gtcagaggtc atctggtaca gcccttcctt 1440
cccttttttt tttttttttt tgtgagacaa ggtctctctc tgttgcccag gctggagtgg 1500
cgcaaacaca gctcactgca gcctcaacct actgggctca agcaatcctc cagcctcagc 1560
ctcccaaagt gctgggatta caagcatgag ccaccccact cagccctttc cttccttttt 1620
aattgatgca taataattgt aagtattcat catggtccaa ccaacccttt cttgacccac 1680
cttcctagag agagggtcct cttgcttcag cggtcagggc cccagaccca tggtctggct 1740
ccaggtacca cctgcctcat gcaggagttg gcgtgcccag gaagctctgc ctctgggcac 1800
agtgacctca gtggggtgag gggagctctc cccatagctg ggctgcggcc caaccccacc 1860
ccctcaggct atgccagggg gtgttgccag gggcacccgg gcatcgccag tctagcccac 1920
tccttcataa agccctcgca tcccaggagc gagcagagcc agagcagg 1968
<210> 59
<211> 378
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 59
gaattcctgc tgggaaaagc aagtggaggt gctccttgaa gaaacagggg gatcccaccg 60
atctcagggg ttctgttctg gcctgcggcc ctggatcgtc cagcctgggt cggggtgggg 120
agcagacctc gcccttatcg gctggggctg agggtgaggg tcccgtttcc ccaaaggcct 180
agcctggggt tccagccacg aagccctacc gggagcgccc ggccccgccc ctccaggcct 240
ggcactcgtc ctcaaccaag atggcgcgga tggcttcagg cgcatcacga caccggcgcg 300
tcacgcgacc cgccctacgg gcacctcccg cgcttttctt agcgccgcag acggtggccg 360
agcgggggac cgggaagc 378
<210> 60
<211> 229
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 60
aatgtagtct tatgcaatac tcttgtagtc ttgcaacatg gtaacgatga gttagcaaca 60
tgccttacaa ggagagaaaa agcaccgtgc atgccgattg gtggaagtaa ggtggtacga 120
tcgtgcctta ttaggaaggc aacagacggg tctgacatgg attggacgaa ccactgaatt 180
gccgcattgc agagatattg tatttaagtg cctagctcga tacataaac 229
<210> 61
<211> 351
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 61
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300
gcctaggctt ttgcaaagat cgatcaagag acaggatgag gatcgtttcg c 351
<210> 62
<211> 1000
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 62
ttttggccag gggatgtggc ttggactgga gagaaaggag ataaggatgt aaacacatgt 60
agggcatatc accccctatt ttttattctc tgaatcctta accctcagaa taagttctta 120
ttcttgagaa tcaatgacat tatcttaagc taaattaatc aagcctccac agtgttcttc 180
tctcaatagt ggtgtgggcc ttcctagaag taatttttcc caaattcagt gatacatttt 240
aagttcagat tttaattgat atgaatctgt gatacactct aaaataagat tattttattg 300
aaaagtggac tgtaactttc cctttatcta ggaagagctc taagttagaa gatgttttgc 360
acttttaccg aaggctgtgt cttgtaagca cccccgagca actctgagag ccttgatttt 420
tgtgtcctca gcatatgttt gtgtaataca gaaagagaag cagttgccaa gtgaaaggga 480
tgttggtctc caaaattata gtttgatccc acaaacacac aaacacatac atgcaaagga 540
ttgtttgctt cacggttttt gatatttaat tcaatgctgt tggaacagca caaaaactaa 600
gtgtcagttt aacagaatca cttgtccttt tagcattaaa ataacatgga acttaatgct 660
ttaatttccc aacatgcctt tttatttaga aagattcaga cttttatttc atttagaaat 720
aaaatgccat tttatttaga aagatacagg agcattcatt cacggaactt tcagatctca 780
gtccactgca taaaatcttg atcctgtaat aatagtttct gtatcttgca tattcattca 840
acaggtttaa cgcgatgagc aaattaatgt tcatcgtttt taacatgttt cgtcttaatc 900
agaacccaca ttctcaacgt taattgaacg tacataggac tatacaaggg ttagtaaata 960
agacagaaac tgttgctcat ttaaccaccg tcactttgga 1000
<210> 63
<211> 480
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 63
acactaaaat gttagagtat gatgacagat ggagttgtct gggtacattt gtgtgcattt 60
aagggtgata gtgtatttgc tctttaagag ctgagtgttt gagcctctgt ttgtgtgtaa 120
ttgagtgtgc atgtgtggga gtgaaattgt ggaatgtgta tgctcatagc actgagtgaa 180
aataaaagat tgtataaatc gtggggcatg tggaattgtg tgtgcctgtg cgtgtgcagt 240
attttttttt ttttaagtaa gccactttag atcttgtcac ctcccctgtc ttctgtgatt 300
gattttgcga ggctaatggt gcgtaaaagg gctggtgaga tctgggggcg cctcctagcc 360
tgacgtcaga gagagagttt aaaacagagg gagacggttg agagcacaca agccgcttta 420
ggagcgaggt tcggagccat cgctgctgcc tgctgatccg cgcctagagt ttgaccagcc 480
<210> 64
<211> 700
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 64
acaccaccca agtgtccacc tccgcttgtc tgatgctgtc tatgacgccc ccgctctctg 60
cctagctgag cctgtgtgga tgtgggagac taatctcccc gcgggcactg cgtgtgacct 120
cacccccctc tgtgaggggg ttatttctct actttcgtgt ctctgagtgt gcttccagtg 180
cccccctccc cccaaaaaat gccttctgag ttgaatatca acactacaaa ccgagtatct 240
gcagagggcc ctgcgtatga gtgcaagtgg gttttaggac caggatgagg cggggtgggg 300
gtgcctacct gacgaccgac cccgacccac tggacaagca cccaaccccc attccccaaa 360
ttgcgcatcc cctatcagag agggggaggg gaaacaggat gcggcgaggc gcgtgcgcac 420
tgccagcttc agcaccgcgg acagtgcctt cgcccccgcc tggcggcgcg cgccaccgcc 480
gcctcagcac tgaaggcgcg ctgacgtcac tcgccggtcc cccgcaaact ccccttcccg 540
gccaccttgg tcgcgtccgc gccgccgccg gcccagccgg accgcaccac gcgaggcgcg 600
agataggggg gcacgggcgc gaccatctgc gctgcggcgc cggcgactca gcgctgcctc 660
agtctgcggt gggcagcgga ggagtcgtgt cgtgcctgag 700
<210> 65
<211> 480
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 65
acactacaaa ccgagtatct gcagagggcc ctgcgtatga gtgcaagtgg gttttaggac 60
caggatgagg cggggtgggg gtgcctacct gacgaccgac cccgacccac tggacaagca 120
cccaaccccc attccccaaa ttgcgcatcc cctatcagag agggggaggg gaaacaggat 180
gcggcgaggc gcgtgcgcac tgccagcttc agcaccgcgg acagtgcctt cgcccccgcc 240
tggcggcgcg cgccaccgcc gcctcagcac tgaaggcgcg ctgacgtcac tcgccggtcc 300
cccgcaaact ccccttcccg gccaccttgg tcgcgtccgc gccgccgccg gcccagccgg 360
accgcaccac gcgaggcgcg agataggggg gcacgggcgc gaccatctgc gctgcggcgc 420
cggcgactca gcgctgcctc agtctgcggt gggcagcgga ggagtcgtgt cgtgcctgag 480
<210> 66
<211> 366
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 66
gctttgcttc tcaatttctt atttgcataa tgagaaaaaa aggaaaatta attttaacac 60
caattcagta gttgattgag caaatgcgtt gccaaaaagg atgctttaga gacagtgttc 120
tctgcacaga taaggacaaa cattattcag agggagtacc cagagctgag actcctaagc 180
cagtgagtgg cacagcattc tagggagaaa tatgcttgtc atcaccgaag cctgattccg 240
tagagccaca ccttggtaag ggccaatctg ctcacacagg atagagaggg caggagccag 300
ggcagagcat ataaggtgag gtaggatcag ttgctcctca catttgcttc tgacatagtt 360
gtgttg 366
<210> 67
<211> 13
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 67
gccgccrcca ugg 13
<210> 68
<211> 7345
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 68
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggaa ttatgtttcg aatttgactt 480
tagaggttta catttctagt caaagaagaa acatccattc agctgctcct tttttccggg 540
acgcgtcaat tgagatctcc gacattgatt attgactagt tattaatagt aatcaattac 600
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 660
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 720
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 780
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 840
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 900
ttggcagtac atctacgtat tagtcatcgc tattaccatg tcgaggccac gttctgcttc 960
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1020
ttttgtgcag cgatgggggc gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 1080
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 1140
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 1200
ggcgggcggg agcaagcttc gtttagtgaa ccgtcagatc gcctggagac gccatccacg 1260
ctgttttgac ctccatagaa gacaccggga ccgatccagc ctccgcggat tcgaatcccg 1320
gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct 1380
atagagtcta taggcccaca aaaaatgctt tcttctttta atatactttt ttgtttatct 1440
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 1500
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 1560
tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 1620
taatagcagc tacaatccag ctaccattct gcttttattt tgtggttggg ataaggctgg 1680
attattctga gtccaagcta ggcccttttg ctaatcgtgt tcatacctct tatcttcctc 1740
ccacagctcc tgggcaacgt gctggtctgt gtgctggccc atcactttgg caaagaatta 1800
ccggtggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttcacgcccc 1860
agagccgcca ccatggccta cccatacgat gttccagatt acgctacaga attacctgcc 1920
cccttgagct acttccagaa tgcacagatg agcgaggaca accacctgag caatactgta 1980
cgtagccaga atgacaacag agaacggcag gaacacaacg acaggcggag cctgggccac 2040
cctgagcccc tgtctaatgg aagaccccag ggtaacagca gacaggtggt ggaacaagat 2100
gaggaagagg acgaggagct gaccctgaag tacggcgcca agcacgtgat catgctcttc 2160
gtgcccgtga ctctctgcat ggtggtggtg gtggctacaa tcaagagcgt cagcttttat 2220
acccggaagg atgggcagct aatctatacc ccattcacag aagacaccga gactgtgggc 2280
cagagagccc tgcactcaat cctgaatgcc gccatcatga tcagcgtcat tgttgtcatg 2340
actatcctcc tggtggttct gtataaatac aggtgctata aggtcatcca tgcctggctg 2400
atcatatcat ctctgttgct gctgttcttt tttagcttca tttacctggg cgaagtgttt 2460
aaaacctata acgttgccgt ggactacatt actgttgccc tcctgatctg gaacttcggc 2520
gtggtgggca tgatttccat tcactggaaa ggccccctga gactgcagca ggcatacctc 2580
attatgatct ccgccctcat ggccctggtg ttcatcaagt acctgcccga gtggactgct 2640
tggctcatct tggctgtgat ctccgtgtat gatttagtgg ctgttctgtg tcctaaaggt 2700
ccactgcgta tgctggtgga aacagctcag gaaagaaatg aaacactgtt tcctgctctg 2760
atttactcct caacaatggt gtggctcgtg aatatggccg aaggagaccc tgaagcccaa 2820
cggagagtgt ccaaaaactc caagtataac gccgagagca cagaaaggga gagccaggat 2880
acagttgccg agaatgacga tggcggcttc agtgaggaat gggaagccca gagggacagc 2940
cacctggggc ctcacagaag cacccctgag tctagagccg ctgtccagga actgtccagc 3000
tccatcctgg ccggcgaaga ccccgaagaa aggggagtaa aacttggact gggagatttc 3060
atcttctaca gtgttctcgt tggcaaagcc agcgcaacag ctagcggaga ctggaacaca 3120
acaatagcct gtttcgtagc catcttaatt ggcctgtgcc ttacacttct gctcctggcc 3180
atcttcaaga aggccctgcc agccctgcct atcagcatca ccttcgggct tgttttctac 3240
tttgccaccg attatctggt gcagcccttc atggaccagc tggccttcca ccagttttac 3300
atctagtaag cggccgccct agggagctcc tcgagggggt ggcatccctg tgacccctcc 3360
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 3420
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 3480
ggggtggtat ggagcaaggg gcaagggggg aagacaacct gtagggcctg cggggtctat 3540
tgggaaccaa gctggagtgc agtggcacaa tcttggctca ctgcaatctc cgcctcctgg 3600
gttcaagcga ttctcctgcc tcagcctccc gagttgttgg gattccaggc atgcatgacc 3660
aggctcagct aatttttgtt tttttggtag agacggggtt tcaccatatt ggccaggctg 3720
gtctccccct cctaatctca ggtgatctac ccaccttggc ctcccaaatt gctgggatta 3780
caggcgtgaa ccactgctcc cttccctgtc cttcctgggc ctagggctgt gccagctgcc 3840
tcgtcccgtc accttctggc ttcttctctc cctccatatc ttagctgttt tcctcatgag 3900
aatgttccaa attcgaaatt tctatttaac cattatatat ttacttgttt gctattatct 3960
ctgcccccag tagattgtta gctccagaag agaaaggatc atgtcttttg cttatctaga 4020
tatgcccatc tgcctggtac aatctctggc acatgttaca ggcaacaact acttgtggaa 4080
ttggtgaatg catgaataga agaatgagtg aatgaatgaa tagacaatag gcagaaatcc 4140
agcctcaaag agcttacagt ctggtaagag gaataaaatg tctgcaaata gccacaggac 4200
aggtcaaagg aaggaggggc tatttccagc tgagggcacc ccatcaggaa agcaccccag 4260
acttccttag ggataacagg gtaatggcgc gggccgcagg aacccctagt gatggagttg 4320
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 4380
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg 4440
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacgtcaa 4500
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 4560
gcagcgtgac cgctacactt gccagcgcct tagcgcccgc tcctttcgct ttcttccctt 4620
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 4680
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgatttg ggtgatggtt 4740
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 4800
tctttaatag tggactcttg ttccaaactg gaacaacact caactctatc tcgggctatt 4860
cttttgattt ataagggatt ttgccgattt cggtctattg gttaaaaaat gagctgattt 4920
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttta tggtgcactc 4980
tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg 5040
ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 5100
tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa 5160
agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga 5220
cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 5280
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 5340
gaaaaaggaa gagtcgatcg atcaagagac aggatgagga tcgtttcgca tgattgaaca 5400
agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 5460
ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 5520
cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aagacgaggc 5580
agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 5640
cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 5700
atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 5760
tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 5820
acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 5880
gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg gcgaggatct 5940
cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 6000
tggattcatc gactgtggcc ggctgggtgt ggcggatcgc tatcaggaca tagcgttggc 6060
tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 6120
cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 6180
ctgaacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6240
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6300
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 6360
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6420
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6480
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6540
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6600
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6660
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 6720
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 6780
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 6840
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 6900
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 6960
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7020
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7080
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7140
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7200
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7260
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7320
ttttgctggc cttttgctca catgt 7345
<210> 69
<211> 7345
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 69
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggat agcacatctt tgaaagtcat 480
aagaggttta catttcttga ctttgttaga tgtggacttc agctgcttct tttttccggg 540
acgcgtcaat tgagatctcc gacattgatt attgactagt tattaatagt aatcaattac 600
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 660
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 720
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 780
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 840
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 900
ttggcagtac atctacgtat tagtcatcgc tattaccatg tcgaggccac gttctgcttc 960
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1020
ttttgtgcag cgatgggggc gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 1080
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 1140
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 1200
ggcgggcggg agcaagcttc gtttagtgaa ccgtcagatc gcctggagac gccatccacg 1260
ctgttttgac ctccatagaa gacaccggga ccgatccagc ctccgcggat tcgaatcccg 1320
gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct 1380
atagagtcta taggcccaca aaaaatgctt tcttctttta atatactttt ttgtttatct 1440
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 1500
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 1560
tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 1620
taatagcagc tacaatccag ctaccattct gcttttattt tgtggttggg ataaggctgg 1680
attattctga gtccaagcta ggcccttttg ctaatcgtgt tcatacctct tatcttcctc 1740
ccacagctcc tgggcaacgt gctggtctgt gtgctggccc atcactttgg caaagaatta 1800
ccggtggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttcacgcccc 1860
agagccgcca ccatggccta cccatacgat gttccagatt acgctacaga attacctgcc 1920
cccttgagct acttccagaa tgcacagatg agcgaggaca accacctgag caatactgta 1980
cgtagccaga atgacaacag agaacggcag gaacacaacg acaggcggag cctgggccac 2040
cctgagcccc tgtctaatgg aagaccccag ggtaacagca gacaggtggt ggaacaagat 2100
gaggaagagg acgaggagct gaccctgaag tacggcgcca agcacgtgat catgctcttc 2160
gtgcccgtga ctctctgcat ggtggtggtg gtggctacaa tcaagagcgt cagcttttat 2220
acccggaagg atgggcagct aatctatacc ccattcacag aagacaccga gactgtgggc 2280
cagagagccc tgcactcaat cctgaatgcc gccatcatga tcagcgtcat tgttgtcatg 2340
actatcctcc tggtggttct gtataaatac aggtgctata aggtcatcca tgcctggctg 2400
atcatatcat ctctgttgct gctgttcttt tttagcttca tttacctggg cgaagtgttt 2460
aaaacctata acgttgccgt ggactacatt actgttgccc tcctgatctg gaacttcggc 2520
gtggtgggca tgatttccat tcactggaaa ggccccctga gactgcagca ggcatacctc 2580
attatgatct ccgccctcat ggccctggtg ttcatcaagt acctgcccga gtggactgct 2640
tggctcatct tggctgtgat ctccgtgtat gatttagtgg ctgttctgtg tcctaaaggt 2700
ccactgcgta tgctggtgga aacagctcag gaaagaaatg aaacactgtt tcctgctctg 2760
atttactcct caacaatggt gtggctcgtg aatatggccg aaggagaccc tgaagcccaa 2820
cggagagtgt ccaaaaactc caagtataac gccgagagca cagaaaggga gagccaggat 2880
acagttgccg agaatgacga tggcggcttc agtgaggaat gggaagccca gagggacagc 2940
cacctggggc ctcacagaag cacccctgag tctagagccg ctgtccagga actgtccagc 3000
tccatcctgg ccggcgaaga ccccgaagaa aggggagtaa aacttggact gggagatttc 3060
atcttctaca gtgttctcgt tggcaaagcc agcgcaacag ctagcggaga ctggaacaca 3120
acaatagcct gtttcgtagc catcttaatt ggcctgtgcc ttacacttct gctcctggcc 3180
atcttcaaga aggccctgcc agccctgcct atcagcatca ccttcgggct tgttttctac 3240
tttgccaccg attatctggt gcagcccttc atggaccagc tggccttcca ccagttttac 3300
atctagtaag cggccgccct agggagctcc tcgagggggt ggcatccctg tgacccctcc 3360
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 3420
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 3480
ggggtggtat ggagcaaggg gcaagggggg aagacaacct gtagggcctg cggggtctat 3540
tgggaaccaa gctggagtgc agtggcacaa tcttggctca ctgcaatctc cgcctcctgg 3600
gttcaagcga ttctcctgcc tcagcctccc gagttgttgg gattccaggc atgcatgacc 3660
aggctcagct aatttttgtt tttttggtag agacggggtt tcaccatatt ggccaggctg 3720
gtctccccct cctaatctca ggtgatctac ccaccttggc ctcccaaatt gctgggatta 3780
caggcgtgaa ccactgctcc cttccctgtc cttcctgggc ctagggctgt gccagctgcc 3840
tcgtcccgtc accttctggc ttcttctctc cctccatatc ttagctgttt tcctcatgag 3900
aatgttccaa attcgaaatt tctatttaac cattatatat ttacttgttt gctattatct 3960
ctgcccccag tagattgtta gctccagaag agaaaggatc atgtcttttg cttatctaga 4020
tatgcccatc tgcctggtac aatctctggc acatgttaca ggcaacaact acttgtggaa 4080
ttggtgaatg catgaataga agaatgagtg aatgaatgaa tagacaatag gcagaaatcc 4140
agcctcaaag agcttacagt ctggtaagag gaataaaatg tctgcaaata gccacaggac 4200
aggtcaaagg aaggaggggc tatttccagc tgagggcacc ccatcaggaa agcaccccag 4260
acttccttag ggataacagg gtaatggcgc gggccgcagg aacccctagt gatggagttg 4320
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 4380
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg 4440
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacgtcaa 4500
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 4560
gcagcgtgac cgctacactt gccagcgcct tagcgcccgc tcctttcgct ttcttccctt 4620
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 4680
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgatttg ggtgatggtt 4740
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 4800
tctttaatag tggactcttg ttccaaactg gaacaacact caactctatc tcgggctatt 4860
cttttgattt ataagggatt ttgccgattt cggtctattg gttaaaaaat gagctgattt 4920
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttta tggtgcactc 4980
tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg 5040
ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 5100
tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa 5160
agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga 5220
cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 5280
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 5340
gaaaaaggaa gagtcgatcg atcaagagac aggatgagga tcgtttcgca tgattgaaca 5400
agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 5460
ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 5520
cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aagacgaggc 5580
agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 5640
cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 5700
atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 5760
tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 5820
acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 5880
gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg gcgaggatct 5940
cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 6000
tggattcatc gactgtggcc ggctgggtgt ggcggatcgc tatcaggaca tagcgttggc 6060
tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 6120
cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 6180
ctgaacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6240
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6300
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 6360
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6420
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6480
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6540
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6600
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6660
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 6720
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 6780
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 6840
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 6900
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 6960
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7020
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7080
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7140
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7200
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7260
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7320
ttttgctggc cttttgctca catgt 7345
<210> 70
<211> 7345
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 70
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggag actagaaaag ccttttgact 480
acgaggttta catttcgttc aaaatcgttt tctatagttc agctgcttct tttttccggg 540
acgcgtcaat tgagatctcc gacattgatt attgactagt tattaatagt aatcaattac 600
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 660
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 720
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 780
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 840
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 900
ttggcagtac atctacgtat tagtcatcgc tattaccatg tcgaggccac gttctgcttc 960
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1020
ttttgtgcag cgatgggggc gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 1080
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 1140
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 1200
ggcgggcggg agcaagcttc gtttagtgaa ccgtcagatc gcctggagac gccatccacg 1260
ctgttttgac ctccatagaa gacaccggga ccgatccagc ctccgcggat tcgaatcccg 1320
gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct 1380
atagagtcta taggcccaca aaaaatgctt tcttctttta atatactttt ttgtttatct 1440
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 1500
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 1560
tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 1620
taatagcagc tacaatccag ctaccattct gcttttattt tgtggttggg ataaggctgg 1680
attattctga gtccaagcta ggcccttttg ctaatcgtgt tcatacctct tatcttcctc 1740
ccacagctcc tgggcaacgt gctggtctgt gtgctggccc atcactttgg caaagaatta 1800
ccggtggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttcacgcccc 1860
agagccgcca ccatggccta cccatacgat gttccagatt acgctacaga attacctgcc 1920
cccttgagct acttccagaa tgcacagatg agcgaggaca accacctgag caatactgta 1980
cgtagccaga atgacaacag agaacggcag gaacacaacg acaggcggag cctgggccac 2040
cctgagcccc tgtctaatgg aagaccccag ggtaacagca gacaggtggt ggaacaagat 2100
gaggaagagg acgaggagct gaccctgaag tacggcgcca agcacgtgat catgctcttc 2160
gtgcccgtga ctctctgcat ggtggtggtg gtggctacaa tcaagagcgt cagcttttat 2220
acccggaagg atgggcagct aatctatacc ccattcacag aagacaccga gactgtgggc 2280
cagagagccc tgcactcaat cctgaatgcc gccatcatga tcagcgtcat tgttgtcatg 2340
actatcctcc tggtggttct gtataaatac aggtgctata aggtcatcca tgcctggctg 2400
atcatatcat ctctgttgct gctgttcttt tttagcttca tttacctggg cgaagtgttt 2460
aaaacctata acgttgccgt ggactacatt actgttgccc tcctgatctg gaacttcggc 2520
gtggtgggca tgatttccat tcactggaaa ggccccctga gactgcagca ggcatacctc 2580
attatgatct ccgccctcat ggccctggtg ttcatcaagt acctgcccga gtggactgct 2640
tggctcatct tggctgtgat ctccgtgtat gatttagtgg ctgttctgtg tcctaaaggt 2700
ccactgcgta tgctggtgga aacagctcag gaaagaaatg aaacactgtt tcctgctctg 2760
atttactcct caacaatggt gtggctcgtg aatatggccg aaggagaccc tgaagcccaa 2820
cggagagtgt ccaaaaactc caagtataac gccgagagca cagaaaggga gagccaggat 2880
acagttgccg agaatgacga tggcggcttc agtgaggaat gggaagccca gagggacagc 2940
cacctggggc ctcacagaag cacccctgag tctagagccg ctgtccagga actgtccagc 3000
tccatcctgg ccggcgaaga ccccgaagaa aggggagtaa aacttggact gggagatttc 3060
atcttctaca gtgttctcgt tggcaaagcc agcgcaacag ctagcggaga ctggaacaca 3120
acaatagcct gtttcgtagc catcttaatt ggcctgtgcc ttacacttct gctcctggcc 3180
atcttcaaga aggccctgcc agccctgcct atcagcatca ccttcgggct tgttttctac 3240
tttgccaccg attatctggt gcagcccttc atggaccagc tggccttcca ccagttttac 3300
atctagtaag cggccgccct agggagctcc tcgagggggt ggcatccctg tgacccctcc 3360
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 3420
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 3480
ggggtggtat ggagcaaggg gcaagggggg aagacaacct gtagggcctg cggggtctat 3540
tgggaaccaa gctggagtgc agtggcacaa tcttggctca ctgcaatctc cgcctcctgg 3600
gttcaagcga ttctcctgcc tcagcctccc gagttgttgg gattccaggc atgcatgacc 3660
aggctcagct aatttttgtt tttttggtag agacggggtt tcaccatatt ggccaggctg 3720
gtctccccct cctaatctca ggtgatctac ccaccttggc ctcccaaatt gctgggatta 3780
caggcgtgaa ccactgctcc cttccctgtc cttcctgggc ctagggctgt gccagctgcc 3840
tcgtcccgtc accttctggc ttcttctctc cctccatatc ttagctgttt tcctcatgag 3900
aatgttccaa attcgaaatt tctatttaac cattatatat ttacttgttt gctattatct 3960
ctgcccccag tagattgtta gctccagaag agaaaggatc atgtcttttg cttatctaga 4020
tatgcccatc tgcctggtac aatctctggc acatgttaca ggcaacaact acttgtggaa 4080
ttggtgaatg catgaataga agaatgagtg aatgaatgaa tagacaatag gcagaaatcc 4140
agcctcaaag agcttacagt ctggtaagag gaataaaatg tctgcaaata gccacaggac 4200
aggtcaaagg aaggaggggc tatttccagc tgagggcacc ccatcaggaa agcaccccag 4260
acttccttag ggataacagg gtaatggcgc gggccgcagg aacccctagt gatggagttg 4320
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 4380
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg 4440
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacgtcaa 4500
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 4560
gcagcgtgac cgctacactt gccagcgcct tagcgcccgc tcctttcgct ttcttccctt 4620
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 4680
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgatttg ggtgatggtt 4740
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 4800
tctttaatag tggactcttg ttccaaactg gaacaacact caactctatc tcgggctatt 4860
cttttgattt ataagggatt ttgccgattt cggtctattg gttaaaaaat gagctgattt 4920
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttta tggtgcactc 4980
tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg 5040
ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 5100
tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa 5160
agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga 5220
cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 5280
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 5340
gaaaaaggaa gagtcgatcg atcaagagac aggatgagga tcgtttcgca tgattgaaca 5400
agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 5460
ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 5520
cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aagacgaggc 5580
agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 5640
cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 5700
atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 5760
tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 5820
acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 5880
gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg gcgaggatct 5940
cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 6000
tggattcatc gactgtggcc ggctgggtgt ggcggatcgc tatcaggaca tagcgttggc 6060
tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 6120
cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 6180
ctgaacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6240
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6300
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 6360
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6420
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6480
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6540
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6600
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6660
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 6720
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 6780
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 6840
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 6900
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 6960
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7020
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7080
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7140
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7200
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7260
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7320
ttttgctggc cttttgctca catgt 7345
<210> 71
<211> 7345
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 71
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggat tctggtcact acacgattcc 480
tcgaggttta catttcgaaa tcgtcctgtg accacgcttc agctgcttct tttttccggg 540
acgcgtcaat tgagatctcc gacattgatt attgactagt tattaatagt aatcaattac 600
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 660
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 720
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 780
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 840
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 900
ttggcagtac atctacgtat tagtcatcgc tattaccatg tcgaggccac gttctgcttc 960
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 1020
ttttgtgcag cgatgggggc gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg 1080
aggggcgggg cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc 1140
gaaagtttcc ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc 1200
ggcgggcggg agcaagcttc gtttagtgaa ccgtcagatc gcctggagac gccatccacg 1260
ctgttttgac ctccatagaa gacaccggga ccgatccagc ctccgcggat tcgaatcccg 1320
gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgacgta agtaccgcct 1380
atagagtcta taggcccaca aaaaatgctt tcttctttta atatactttt ttgtttatct 1440
tatttctaat actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg 1500
cctctttgca ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata 1560
tttctgcata taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc 1620
taatagcagc tacaatccag ctaccattct gcttttattt tgtggttggg ataaggctgg 1680
attattctga gtccaagcta ggcccttttg ctaatcgtgt tcatacctct tatcttcctc 1740
ccacagctcc tgggcaacgt gctggtctgt gtgctggccc atcactttgg caaagaatta 1800
ccggtggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttcacgcccc 1860
agagccgcca ccatggccta cccatacgat gttccagatt acgctacaga attacctgcc 1920
cccttgagct acttccagaa tgcacagatg agcgaggaca accacctgag caatactgta 1980
cgtagccaga atgacaacag agaacggcag gaacacaacg acaggcggag cctgggccac 2040
cctgagcccc tgtctaatgg aagaccccag ggtaacagca gacaggtggt ggaacaagat 2100
gaggaagagg acgaggagct gaccctgaag tacggcgcca agcacgtgat catgctcttc 2160
gtgcccgtga ctctctgcat ggtggtggtg gtggctacaa tcaagagcgt cagcttttat 2220
acccggaagg atgggcagct aatctatacc ccattcacag aagacaccga gactgtgggc 2280
cagagagccc tgcactcaat cctgaatgcc gccatcatga tcagcgtcat tgttgtcatg 2340
actatcctcc tggtggttct gtataaatac aggtgctata aggtcatcca tgcctggctg 2400
atcatatcat ctctgttgct gctgttcttt tttagcttca tttacctggg cgaagtgttt 2460
aaaacctata acgttgccgt ggactacatt actgttgccc tcctgatctg gaacttcggc 2520
gtggtgggca tgatttccat tcactggaaa ggccccctga gactgcagca ggcatacctc 2580
attatgatct ccgccctcat ggccctggtg ttcatcaagt acctgcccga gtggactgct 2640
tggctcatct tggctgtgat ctccgtgtat gatttagtgg ctgttctgtg tcctaaaggt 2700
ccactgcgta tgctggtgga aacagctcag gaaagaaatg aaacactgtt tcctgctctg 2760
atttactcct caacaatggt gtggctcgtg aatatggccg aaggagaccc tgaagcccaa 2820
cggagagtgt ccaaaaactc caagtataac gccgagagca cagaaaggga gagccaggat 2880
acagttgccg agaatgacga tggcggcttc agtgaggaat gggaagccca gagggacagc 2940
cacctggggc ctcacagaag cacccctgag tctagagccg ctgtccagga actgtccagc 3000
tccatcctgg ccggcgaaga ccccgaagaa aggggagtaa aacttggact gggagatttc 3060
atcttctaca gtgttctcgt tggcaaagcc agcgcaacag ctagcggaga ctggaacaca 3120
acaatagcct gtttcgtagc catcttaatt ggcctgtgcc ttacacttct gctcctggcc 3180
atcttcaaga aggccctgcc agccctgcct atcagcatca ccttcgggct tgttttctac 3240
tttgccaccg attatctggt gcagcccttc atggaccagc tggccttcca ccagttttac 3300
atctagtaag cggccgccct agggagctcc tcgagggggt ggcatccctg tgacccctcc 3360
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 3420
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 3480
ggggtggtat ggagcaaggg gcaagggggg aagacaacct gtagggcctg cggggtctat 3540
tgggaaccaa gctggagtgc agtggcacaa tcttggctca ctgcaatctc cgcctcctgg 3600
gttcaagcga ttctcctgcc tcagcctccc gagttgttgg gattccaggc atgcatgacc 3660
aggctcagct aatttttgtt tttttggtag agacggggtt tcaccatatt ggccaggctg 3720
gtctccccct cctaatctca ggtgatctac ccaccttggc ctcccaaatt gctgggatta 3780
caggcgtgaa ccactgctcc cttccctgtc cttcctgggc ctagggctgt gccagctgcc 3840
tcgtcccgtc accttctggc ttcttctctc cctccatatc ttagctgttt tcctcatgag 3900
aatgttccaa attcgaaatt tctatttaac cattatatat ttacttgttt gctattatct 3960
ctgcccccag tagattgtta gctccagaag agaaaggatc atgtcttttg cttatctaga 4020
tatgcccatc tgcctggtac aatctctggc acatgttaca ggcaacaact acttgtggaa 4080
ttggtgaatg catgaataga agaatgagtg aatgaatgaa tagacaatag gcagaaatcc 4140
agcctcaaag agcttacagt ctggtaagag gaataaaatg tctgcaaata gccacaggac 4200
aggtcaaagg aaggaggggc tatttccagc tgagggcacc ccatcaggaa agcaccccag 4260
acttccttag ggataacagg gtaatggcgc gggccgcagg aacccctagt gatggagttg 4320
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 4380
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg 4440
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacgtcaa 4500
agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 4560
gcagcgtgac cgctacactt gccagcgcct tagcgcccgc tcctttcgct ttcttccctt 4620
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 4680
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgatttg ggtgatggtt 4740
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 4800
tctttaatag tggactcttg ttccaaactg gaacaacact caactctatc tcgggctatt 4860
cttttgattt ataagggatt ttgccgattt cggtctattg gttaaaaaat gagctgattt 4920
aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttta tggtgcactc 4980
tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg 5040
ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg 5100
tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa 5160
agggcctcgt gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga 5220
cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 5280
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt 5340
gaaaaaggaa gagtcgatcg atcaagagac aggatgagga tcgtttcgca tgattgaaca 5400
agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 5460
ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 5520
cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aagacgaggc 5580
agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 5640
cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 5700
atctcacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 5760
tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 5820
acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 5880
gctcgcgcca gccgaactgt tcgccaggct caaggcgagc atgcccgacg gcgaggatct 5940
cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 6000
tggattcatc gactgtggcc ggctgggtgt ggcggatcgc tatcaggaca tagcgttggc 6060
tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 6120
cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 6180
ctgaacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 6240
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 6300
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 6360
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 6420
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 6480
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 6540
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 6600
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 6660
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 6720
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 6780
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 6840
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 6900
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 6960
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 7020
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 7080
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 7140
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 7200
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 7260
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 7320
ttttgctggc cttttgctca catgt 7345
<210> 72
<211> 7427
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 72
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggag actagaaaag ccttttgact 480
acgaggttta catttcgttc aaaatcgttt tctatagttc agctgcttct gagctgttgg 540
agactagaaa agccttttga ctacgaggtt tacatttcgt tcaaaatcgt tttctatagt 600
tcagctgctt cttttttccg ggacgcgtca attgagatct ccgacattga ttattgacta 660
gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 720
ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 780
cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 840
gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 900
gtacgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 960
tgaccttatg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 1020
tgtcgaggcc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 1080
gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggcgcgcg 1140
ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg tgcggcggca 1200
gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg 1260
ccctataaaa agcgaagcgc gcggcgggcg ggagcaagct tcgtttagtg aaccgtcaga 1320
tcgcctggag acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca 1380
gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat tccccgtgcc 1440
aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc tttcttcttt 1500
taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc 1560
aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt 1620
ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact 1680
gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat 1740
tttgtggttg ggataaggct ggattattct gagtccaagc taggcccttt tgctaatcgt 1800
gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct gtgtgctggc 1860
ccatcacttt ggcaaagaat taccggtggc aacgtgctgg ttattgtgct gtctcatcat 1920
tttggcaaag aattcacgcc ccagagccgc caccatggcc tacccatacg atgttccaga 1980
ttacgctaca gaattacctg cccccttgag ctacttccag aatgcacaga tgagcgagga 2040
caaccacctg agcaatactg tacgtagcca gaatgacaac agagaacggc aggaacacaa 2100
cgacaggcgg agcctgggcc accctgagcc cctgtctaat ggaagacccc agggtaacag 2160
cagacaggtg gtggaacaag atgaggaaga ggacgaggag ctgaccctga agtacggcgc 2220
caagcacgtg atcatgctct tcgtgcccgt gactctctgc atggtggtgg tggtggctac 2280
aatcaagagc gtcagctttt atacccggaa ggatgggcag ctaatctata ccccattcac 2340
agaagacacc gagactgtgg gccagagagc cctgcactca atcctgaatg ccgccatcat 2400
gatcagcgtc attgttgtca tgactatcct cctggtggtt ctgtataaat acaggtgcta 2460
taaggtcatc catgcctggc tgatcatatc atctctgttg ctgctgttct tttttagctt 2520
catttacctg ggcgaagtgt ttaaaaccta taacgttgcc gtggactaca ttactgttgc 2580
cctcctgatc tggaacttcg gcgtggtggg catgatttcc attcactgga aaggccccct 2640
gagactgcag caggcatacc tcattatgat ctccgccctc atggccctgg tgttcatcaa 2700
gtacctgccc gagtggactg cttggctcat cttggctgtg atctccgtgt atgatttagt 2760
ggctgttctg tgtcctaaag gtccactgcg tatgctggtg gaaacagctc aggaaagaaa 2820
tgaaacactg tttcctgctc tgatttactc ctcaacaatg gtgtggctcg tgaatatggc 2880
cgaaggagac cctgaagccc aacggagagt gtccaaaaac tccaagtata acgccgagag 2940
cacagaaagg gagagccagg atacagttgc cgagaatgac gatggcggct tcagtgagga 3000
atgggaagcc cagagggaca gccacctggg gcctcacaga agcacccctg agtctagagc 3060
cgctgtccag gaactgtcca gctccatcct ggccggcgaa gaccccgaag aaaggggagt 3120
aaaacttgga ctgggagatt tcatcttcta cagtgttctc gttggcaaag ccagcgcaac 3180
agctagcgga gactggaaca caacaatagc ctgtttcgta gccatcttaa ttggcctgtg 3240
ccttacactt ctgctcctgg ccatcttcaa gaaggccctg ccagccctgc ctatcagcat 3300
caccttcggg cttgttttct actttgccac cgattatctg gtgcagccct tcatggacca 3360
gctggccttc caccagtttt acatctagta agcggccgcc ctagggagct cctcgagggg 3420
gtggcatccc tgtgacccct ccccagtgcc tctcctggcc ctggaagttg ccactccagt 3480
gcccaccagc cttgtcctaa taaaattaag ttgcatcatt ttgtctgact aggtgtcctt 3540
ctataatatt atggggtgga ggggggtggt atggagcaag gggcaagggg ggaagacaac 3600
ctgtagggcc tgcggggtct attgggaacc aagctggagt gcagtggcac aatcttggct 3660
cactgcaatc tccgcctcct gggttcaagc gattctcctg cctcagcctc ccgagttgtt 3720
gggattccag gcatgcatga ccaggctcag ctaatttttg tttttttggt agagacgggg 3780
tttcaccata ttggccaggc tggtctcccc ctcctaatct caggtgatct acccaccttg 3840
gcctcccaaa ttgctgggat tacaggcgtg aaccactgct cccttccctg tccttcctgg 3900
gcctagggct gtgccagctg cctcgtcccg tcaccttctg gcttcttctc tccctccata 3960
tcttagctgt tttcctcatg agaatgttcc aaattcgaaa tttctattta accattatat 4020
atttacttgt ttgctattat ctctgccccc agtagattgt tagctccaga agagaaagga 4080
tcatgtcttt tgcttatcta gatatgccca tctgcctggt acaatctctg gcacatgtta 4140
caggcaacaa ctacttgtgg aattggtgaa tgcatgaata gaagaatgag tgaatgaatg 4200
aatagacaat aggcagaaat ccagcctcaa agagcttaca gtctggtaag aggaataaaa 4260
tgtctgcaaa tagccacagg acaggtcaaa ggaaggaggg gctatttcca gctgagggca 4320
ccccatcagg aaagcacccc agacttcctt agggataaca gggtaatggc gcgggccgca 4380
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4440
cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4500
agcgcgcagc tgcctgcagg ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg 4560
tatttcacac cgcatacgtc aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc 4620
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cttagcgccc 4680
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 4740
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 4800
aaacttgatt tgggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 4860
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 4920
ctcaactcta tctcgggcta ttcttttgat ttataaggga ttttgccgat ttcggtctat 4980
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg 5040
tttacaattt tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag 5100
ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc 5160
gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca 5220
tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc 5280
atgataataa tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc 5340
cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 5400
tgataaatgc ttcaataata ttgaaaaagg aagagtcgat cgatcaagag acaggatgag 5460
gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 5520
agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 5580
tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 5640
tgaatgaact gcaagacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 5700
gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 5760
tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 5820
ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 5880
cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 5940
atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcga 6000
gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 6060
tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggatc 6120
gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 6180
ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 6240
atcgccttct tgacgagttc ttctgaacga gcgtgacacc acgatgcctg tagcaatggc 6300
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 6360
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 6420
tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc 6480
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 6540
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 6600
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 6660
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 6720
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 6780
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 6840
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 6900
cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa 6960
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 7020
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 7080
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 7140
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 7200
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 7260
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 7320
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 7380
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgt 7427
<210> 73
<211> 7509
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 73
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggaa ttatgtttcg aatttgactt 480
tagaggttta catttctagt caaagaagaa acatccattc agctgctcct gagctgttgg 540
aattatgttt cgaatttgac tttagaggtt tacatttcta gtcaaagaag aaacatccat 600
tcagctgctc ctgagctgtt ggaattatgt ttcgaatttg actttagagg tttacatttc 660
tagtcaaaga agaaacatcc attcagctgc tccttttttc cgggacgcgt caattgagat 720
ctccgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 780
agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 840
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 900
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 960
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1020
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1080
gtattagtca tcgctattac catgtcgagg ccacgttctg cttcactctc cccatctccc 1140
ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg 1200
gggcgggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc 1260
gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat 1320
ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagcaag 1380
cttcgtttag tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat 1440
agaagacacc gggaccgatc cagcctccgc ggattcgaat cccggccggg aacggtgcat 1500
tggaacgcgg attccccgtg ccaagagtga cgtaagtacc gcctatagag tctataggcc 1560
cacaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 1620
cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 1680
taaagaataa cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata 1740
tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat 1800
ccagctacca ttctgctttt attttgtggt tgggataagg ctggattatt ctgagtccaa 1860
gctaggccct tttgctaatc gtgttcatac ctcttatctt cctcccacag ctcctgggca 1920
acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga attaccggtg gcaacgtgct 1980
ggttattgtg ctgtctcatc attttggcaa agaattcacg ccccagagcc gccaccatgg 2040
cctacccata cgatgttcca gattacgcta cagaattacc tgcccccttg agctacttcc 2100
agaatgcaca gatgagcgag gacaaccacc tgagcaatac tgtacgtagc cagaatgaca 2160
acagagaacg gcaggaacac aacgacaggc ggagcctggg ccaccctgag cccctgtcta 2220
atggaagacc ccagggtaac agcagacagg tggtggaaca agatgaggaa gaggacgagg 2280
agctgaccct gaagtacggc gccaagcacg tgatcatgct cttcgtgccc gtgactctct 2340
gcatggtggt ggtggtggct acaatcaaga gcgtcagctt ttatacccgg aaggatgggc 2400
agctaatcta taccccattc acagaagaca ccgagactgt gggccagaga gccctgcact 2460
caatcctgaa tgccgccatc atgatcagcg tcattgttgt catgactatc ctcctggtgg 2520
ttctgtataa atacaggtgc tataaggtca tccatgcctg gctgatcata tcatctctgt 2580
tgctgctgtt cttttttagc ttcatttacc tgggcgaagt gtttaaaacc tataacgttg 2640
ccgtggacta cattactgtt gccctcctga tctggaactt cggcgtggtg ggcatgattt 2700
ccattcactg gaaaggcccc ctgagactgc agcaggcata cctcattatg atctccgccc 2760
tcatggccct ggtgttcatc aagtacctgc ccgagtggac tgcttggctc atcttggctg 2820
tgatctccgt gtatgattta gtggctgttc tgtgtcctaa aggtccactg cgtatgctgg 2880
tggaaacagc tcaggaaaga aatgaaacac tgtttcctgc tctgatttac tcctcaacaa 2940
tggtgtggct cgtgaatatg gccgaaggag accctgaagc ccaacggaga gtgtccaaaa 3000
actccaagta taacgccgag agcacagaaa gggagagcca ggatacagtt gccgagaatg 3060
acgatggcgg cttcagtgag gaatgggaag cccagaggga cagccacctg gggcctcaca 3120
gaagcacccc tgagtctaga gccgctgtcc aggaactgtc cagctccatc ctggccggcg 3180
aagaccccga agaaagggga gtaaaacttg gactgggaga tttcatcttc tacagtgttc 3240
tcgttggcaa agccagcgca acagctagcg gagactggaa cacaacaata gcctgtttcg 3300
tagccatctt aattggcctg tgccttacac ttctgctcct ggccatcttc aagaaggccc 3360
tgccagccct gcctatcagc atcaccttcg ggcttgtttt ctactttgcc accgattatc 3420
tggtgcagcc cttcatggac cagctggcct tccaccagtt ttacatctag taagcggccg 3480
ccctagggag ctcctcgagg gggtggcatc cctgtgaccc ctccccagtg cctctcctgg 3540
ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca 3600
ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca 3660
aggggcaagg ggggaagaca acctgtaggg cctgcggggt ctattgggaa ccaagctgga 3720
gtgcagtggc acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc 3780
tgcctcagcc tcccgagttg ttgggattcc aggcatgcat gaccaggctc agctaatttt 3840
tgtttttttg gtagagacgg ggtttcacca tattggccag gctggtctcc ccctcctaat 3900
ctcaggtgat ctacccacct tggcctccca aattgctggg attacaggcg tgaaccactg 3960
ctcccttccc tgtccttcct gggcctaggg ctgtgccagc tgcctcgtcc cgtcaccttc 4020
tggcttcttc tctccctcca tatcttagct gttttcctca tgagaatgtt ccaaattcga 4080
aatttctatt taaccattat atatttactt gtttgctatt atctctgccc ccagtagatt 4140
gttagctcca gaagagaaag gatcatgtct tttgcttatc tagatatgcc catctgcctg 4200
gtacaatctc tggcacatgt tacaggcaac aactacttgt ggaattggtg aatgcatgaa 4260
tagaagaatg agtgaatgaa tgaatagaca ataggcagaa atccagcctc aaagagctta 4320
cagtctggta agaggaataa aatgtctgca aatagccaca ggacaggtca aaggaaggag 4380
gggctatttc cagctgaggg caccccatca ggaaagcacc ccagacttcc ttagggataa 4440
cagggtaatg gcgcgggccg caggaacccc tagtgatgga gttggccact ccctctctgc 4500
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4560
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt 4620
ttctccttac gcatctgtgc ggtatttcac accgcatacg tcaaagcaac catagtacgc 4680
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 4740
acttgccagc gccttagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4800
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4860
tttacggcac ctcgacccca aaaaacttga tttgggtgat ggttcacgta gtgggccatc 4920
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4980
cttgttccaa actggaacaa cactcaactc tatctcgggc tattcttttg atttataagg 5040
gattttgccg atttcggtct attggttaaa aaatgagctg atttaacaaa aatttaacgc 5100
gaattttaac aaaatattaa cgtttacaat tttatggtgc actctcagta caatctgctc 5160
tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg 5220
ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat 5280
gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg 5340
cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt 5400
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 5460
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtcg 5520
atcgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5580
ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5640
ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5700
aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg aggcagcgcg gctatcgtgg 5760
ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5820
gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5880
gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5940
acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 6000
gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 6060
ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg atctcgtcgt gacccatggc 6120
gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6180
ggccggctgg gtgtggcgga tcgctatcag gacatagcgt tggctacccg tgatattgct 6240
gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6300
gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgaac gagcgtgaca 6360
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 6420
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 6480
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 6540
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 6600
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 6660
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 6720
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 6780
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 6840
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 6900
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 6960
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc 7020
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 7080
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 7140
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 7200
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 7260
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 7320
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 7380
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 7440
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 7500
ctcacatgt 7509
<210> 74
<211> 7509
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 74
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggag actagaaaag ccttttgact 480
acgaggttta catttcgttc aaaatcgttt tctatagttc agctgcttct gagctgttgg 540
agactagaaa agccttttga ctacgaggtt tacatttcgt tcaaaatcgt tttctatagt 600
tcagctgctt ctgagctgtt ggagactaga aaagcctttt gactacgagg tttacatttc 660
gttcaaaatc gttttctata gttcagctgc ttcttttttc cgggacgcgt caattgagat 720
ctccgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 780
agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 840
cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 900
gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 960
catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1020
gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1080
gtattagtca tcgctattac catgtcgagg ccacgttctg cttcactctc cccatctccc 1140
ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg 1200
gggcgggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc 1260
gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat 1320
ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cgggagcaag 1380
cttcgtttag tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat 1440
agaagacacc gggaccgatc cagcctccgc ggattcgaat cccggccggg aacggtgcat 1500
tggaacgcgg attccccgtg ccaagagtga cgtaagtacc gcctatagag tctataggcc 1560
cacaaaaaat gctttcttct tttaatatac ttttttgttt atcttatttc taatactttc 1620
cctaatctct ttctttcagg gcaataatga tacaatgtat catgcctctt tgcaccattc 1680
taaagaataa cagtgataat ttctgggtta aggcaatagc aatatttctg catataaata 1740
tttctgcata taaattgtaa ctgatgtaag aggtttcata ttgctaatag cagctacaat 1800
ccagctacca ttctgctttt attttgtggt tgggataagg ctggattatt ctgagtccaa 1860
gctaggccct tttgctaatc gtgttcatac ctcttatctt cctcccacag ctcctgggca 1920
acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga attaccggtg gcaacgtgct 1980
ggttattgtg ctgtctcatc attttggcaa agaattcacg ccccagagcc gccaccatgg 2040
cctacccata cgatgttcca gattacgcta cagaattacc tgcccccttg agctacttcc 2100
agaatgcaca gatgagcgag gacaaccacc tgagcaatac tgtacgtagc cagaatgaca 2160
acagagaacg gcaggaacac aacgacaggc ggagcctggg ccaccctgag cccctgtcta 2220
atggaagacc ccagggtaac agcagacagg tggtggaaca agatgaggaa gaggacgagg 2280
agctgaccct gaagtacggc gccaagcacg tgatcatgct cttcgtgccc gtgactctct 2340
gcatggtggt ggtggtggct acaatcaaga gcgtcagctt ttatacccgg aaggatgggc 2400
agctaatcta taccccattc acagaagaca ccgagactgt gggccagaga gccctgcact 2460
caatcctgaa tgccgccatc atgatcagcg tcattgttgt catgactatc ctcctggtgg 2520
ttctgtataa atacaggtgc tataaggtca tccatgcctg gctgatcata tcatctctgt 2580
tgctgctgtt cttttttagc ttcatttacc tgggcgaagt gtttaaaacc tataacgttg 2640
ccgtggacta cattactgtt gccctcctga tctggaactt cggcgtggtg ggcatgattt 2700
ccattcactg gaaaggcccc ctgagactgc agcaggcata cctcattatg atctccgccc 2760
tcatggccct ggtgttcatc aagtacctgc ccgagtggac tgcttggctc atcttggctg 2820
tgatctccgt gtatgattta gtggctgttc tgtgtcctaa aggtccactg cgtatgctgg 2880
tggaaacagc tcaggaaaga aatgaaacac tgtttcctgc tctgatttac tcctcaacaa 2940
tggtgtggct cgtgaatatg gccgaaggag accctgaagc ccaacggaga gtgtccaaaa 3000
actccaagta taacgccgag agcacagaaa gggagagcca ggatacagtt gccgagaatg 3060
acgatggcgg cttcagtgag gaatgggaag cccagaggga cagccacctg gggcctcaca 3120
gaagcacccc tgagtctaga gccgctgtcc aggaactgtc cagctccatc ctggccggcg 3180
aagaccccga agaaagggga gtaaaacttg gactgggaga tttcatcttc tacagtgttc 3240
tcgttggcaa agccagcgca acagctagcg gagactggaa cacaacaata gcctgtttcg 3300
tagccatctt aattggcctg tgccttacac ttctgctcct ggccatcttc aagaaggccc 3360
tgccagccct gcctatcagc atcaccttcg ggcttgtttt ctactttgcc accgattatc 3420
tggtgcagcc cttcatggac cagctggcct tccaccagtt ttacatctag taagcggccg 3480
ccctagggag ctcctcgagg gggtggcatc cctgtgaccc ctccccagtg cctctcctgg 3540
ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca 3600
ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca 3660
aggggcaagg ggggaagaca acctgtaggg cctgcggggt ctattgggaa ccaagctgga 3720
gtgcagtggc acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc 3780
tgcctcagcc tcccgagttg ttgggattcc aggcatgcat gaccaggctc agctaatttt 3840
tgtttttttg gtagagacgg ggtttcacca tattggccag gctggtctcc ccctcctaat 3900
ctcaggtgat ctacccacct tggcctccca aattgctggg attacaggcg tgaaccactg 3960
ctcccttccc tgtccttcct gggcctaggg ctgtgccagc tgcctcgtcc cgtcaccttc 4020
tggcttcttc tctccctcca tatcttagct gttttcctca tgagaatgtt ccaaattcga 4080
aatttctatt taaccattat atatttactt gtttgctatt atctctgccc ccagtagatt 4140
gttagctcca gaagagaaag gatcatgtct tttgcttatc tagatatgcc catctgcctg 4200
gtacaatctc tggcacatgt tacaggcaac aactacttgt ggaattggtg aatgcatgaa 4260
tagaagaatg agtgaatgaa tgaatagaca ataggcagaa atccagcctc aaagagctta 4320
cagtctggta agaggaataa aatgtctgca aatagccaca ggacaggtca aaggaaggag 4380
gggctatttc cagctgaggg caccccatca ggaaagcacc ccagacttcc ttagggataa 4440
cagggtaatg gcgcgggccg caggaacccc tagtgatgga gttggccact ccctctctgc 4500
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4560
gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt 4620
ttctccttac gcatctgtgc ggtatttcac accgcatacg tcaaagcaac catagtacgc 4680
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 4740
acttgccagc gccttagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 4800
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 4860
tttacggcac ctcgacccca aaaaacttga tttgggtgat ggttcacgta gtgggccatc 4920
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 4980
cttgttccaa actggaacaa cactcaactc tatctcgggc tattcttttg atttataagg 5040
gattttgccg atttcggtct attggttaaa aaatgagctg atttaacaaa aatttaacgc 5100
gaattttaac aaaatattaa cgtttacaat tttatggtgc actctcagta caatctgctc 5160
tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg 5220
ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat 5280
gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg 5340
cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt 5400
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 5460
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtcg 5520
atcgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5580
ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5640
ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5700
aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg aggcagcgcg gctatcgtgg 5760
ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5820
gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca ccttgctcct 5880
gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5940
acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 6000
gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 6060
ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg atctcgtcgt gacccatggc 6120
gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 6180
ggccggctgg gtgtggcgga tcgctatcag gacatagcgt tggctacccg tgatattgct 6240
gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 6300
gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgaac gagcgtgaca 6360
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 6420
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 6480
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 6540
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 6600
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 6660
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 6720
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 6780
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 6840
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 6900
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 6960
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc 7020
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 7080
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 7140
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 7200
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 7260
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 7320
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 7380
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 7440
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 7500
ctcacatgt 7509
<210> 75
<211> 7265
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 75
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatccg ggacgcgtca attgagatct ccgacattga ttattgacta 240
gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 300
ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 360
cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 420
gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 480
gtacgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 540
tgaccttatg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 600
tgtcgaggcc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 660
gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggcgcgcg 720
ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg tgcggcggca 780
gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg 840
ccctataaaa agcgaagcgc gcggcgggcg ggagcaagct tcgtttagtg aaccgtcaga 900
tcgcctggag acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca 960
gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat tccccgtgcc 1020
aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc tttcttcttt 1080
taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc 1140
aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt 1200
ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact 1260
gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat 1320
tttgtggttg ggataaggct ggattattct gagatatcgg tacctgagct gttggagact 1380
agaaaagcct tttgactacg aggtttacat ttcgttcaaa atcgttttct atagttcagc 1440
tgcttctgag ctgttggaga ctagaaaagc cttttgacta cgaggtttac atttcgttca 1500
aaatcgtttt ctatagttca gctgcttctg agctgttgga gactagaaaa gccttttgac 1560
tacgaggttt acatttcgtt caaaatcgtt ttctatagtt cagctgcttc gtcgacgcta 1620
ggcccttttg ctaatcgtgt tcatacctct tatcttcctc ccacagctcc tgggcaacgt 1680
gctggtctgt gtgctggccc atcactttgg caaagaatta ccggtggcaa cgtgctggtt 1740
attgtgctgt ctcatcattt tggcaaagaa ttcacgcccc agagccgcca ccatggccta 1800
cccatacgat gttccagatt acgctacaga attacctgcc cccttgagct acttccagaa 1860
tgcacagatg agcgaggaca accacctgag caatactgta cgtagccaga atgacaacag 1920
agaacggcag gaacacaacg acaggcggag cctgggccac cctgagcccc tgtctaatgg 1980
aagaccccag ggtaacagca gacaggtggt ggaacaagat gaggaagagg acgaggagct 2040
gaccctgaag tacggcgcca agcacgtgat catgctcttc gtgcccgtga ctctctgcat 2100
ggtggtggtg gtggctacaa tcaagagcgt cagcttttat acccggaagg atgggcagct 2160
aatctatacc ccattcacag aagacaccga gactgtgggc cagagagccc tgcactcaat 2220
cctgaatgcc gccatcatga tcagcgtcat tgttgtcatg actatcctcc tggtggttct 2280
gtataaatac aggtgctata aggtcatcca tgcctggctg atcatatcat ctctgttgct 2340
gctgttcttt tttagcttca tttacctggg cgaagtgttt aaaacctata acgttgccgt 2400
ggactacatt actgttgccc tcctgatctg gaacttcggc gtggtgggca tgatttccat 2460
tcactggaaa ggccccctga gactgcagca ggcatacctc attatgatct ccgccctcat 2520
ggccctggtg ttcatcaagt acctgcccga gtggactgct tggctcatct tggctgtgat 2580
ctccgtgtat gatttagtgg ctgttctgtg tcctaaaggt ccactgcgta tgctggtgga 2640
aacagctcag gaaagaaatg aaacactgtt tcctgctctg atttactcct caacaatggt 2700
gtggctcgtg aatatggccg aaggagaccc tgaagcccaa cggagagtgt ccaaaaactc 2760
caagtataac gccgagagca cagaaaggga gagccaggat acagttgccg agaatgacga 2820
tggcggcttc agtgaggaat gggaagccca gagggacagc cacctggggc ctcacagaag 2880
cacccctgag tctagagccg ctgtccagga actgtccagc tccatcctgg ccggcgaaga 2940
ccccgaagaa aggggagtaa aacttggact gggagatttc atcttctaca gtgttctcgt 3000
tggcaaagcc agcgcaacag ctagcggaga ctggaacaca acaatagcct gtttcgtagc 3060
catcttaatt ggcctgtgcc ttacacttct gctcctggcc atcttcaaga aggccctgcc 3120
agccctgcct atcagcatca ccttcgggct tgttttctac tttgccaccg attatctggt 3180
gcagcccttc atggaccagc tggccttcca ccagttttac atctagtaag cggccgccct 3240
agggagctcc tcgagggggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3300
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3360
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3420
gcaagggggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3480
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3540
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3600
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccccct cctaatctca 3660
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3720
cttccctgtc cttcctgggc ctagggctgt gccagctgcc tcgtcccgtc accttctggc 3780
ttcttctctc cctccatatc ttagctgttt tcctcatgag aatgttccaa attcgaaatt 3840
tctatttaac cattatatat ttacttgttt gctattatct ctgcccccag tagattgtta 3900
gctccagaag agaaaggatc atgtcttttg cttatctaga tatgcccatc tgcctggtac 3960
aatctctggc acatgttaca ggcaacaact acttgtggaa ttggtgaatg catgaataga 4020
agaatgagtg aatgaatgaa tagacaatag gcagaaatcc agcctcaaag agcttacagt 4080
ctggtaagag gaataaaatg tctgcaaata gccacaggac aggtcaaagg aaggaggggc 4140
tatttccagc tgagggcacc ccatcaggaa agcaccccag acttccttag ggataacagg 4200
gtaatggcgc gggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4260
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4320
ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcctgatgc ggtattttct 4380
ccttacgcat ctgtgcggta tttcacaccg catacgtcaa agcaaccata gtacgcgccc 4440
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 4500
gccagcgcct tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 4560
ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta 4620
cggcacctcg accccaaaaa acttgatttg ggtgatggtt cacgtagtgg gccatcgccc 4680
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 4740
ttccaaactg gaacaacact caactctatc tcgggctatt cttttgattt ataagggatt 4800
ttgccgattt cggtctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 4860
tttaacaaaa tattaacgtt tacaatttta tggtgcactc tcagtacaat ctgctctgat 4920
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4980
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 5040
cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 5100
tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 5160
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 5220
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtcgatcg 5280
atcaagagac aggatgagga tcgtttcgca tgattgaaca agatggattg cacgcaggtt 5340
ctccggccgc ttgggtggag aggctattcg gctatgactg ggcacaacag acaatcggct 5400
gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga 5460
ccgacctgtc cggtgccctg aatgaactgc aagacgaggc agcgcggcta tcgtggctgg 5520
ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 5580
ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 5640
agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 5700
gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 5760
gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 5820
tcgccaggct caaggcgagc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 5880
cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 5940
ggctgggtgt ggcggatcgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 6000
agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 6060
cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgaacgagc gtgacaccac 6120
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 6180
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 6240
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 6300
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 6360
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 6420
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 6480
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 6540
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 6600
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 6660
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 6720
gaaggtaact ggcttcagca gagcgcagat accaaatact gttcttctag tgtagccgta 6780
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 6840
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 6900
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 6960
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 7020
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 7080
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 7140
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 7200
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 7260
catgt 7265
<210> 76
<211> 7287
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 76
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggaa gcttggatgg tcttgtattc 480
aggaggttta catttcctat acaactgcat ccaatgattc agctgcttct ttttccggga 540
cgcgtcaatt gagatctccg acattgatta ttgactagtt attaatagta atcaattacg 600
gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 660
ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 720
atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 780
gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 840
gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 900
tggcagtaca tctacgtatt agtcatcgct attaccatgt cgaggccacg ttctgcttca 960
ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat 1020
tttgtgcagc gatgggggcg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 1080
ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 1140
aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 1200
gcgggcggga gcaagcttcg tttagtgaac cgtcagatcg cctggagacg ccatccacgc 1260
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggatt cgaatcccgg 1320
ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa gtaccgccta 1380
tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt 1440
atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc 1500
ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat 1560
ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct 1620
aatagcagct acaatccagc taccattctg cttttatttt gtggttggga taaggctgga 1680
ttattctgag tccaagctag gcccttttgc taatcgtgtt catacctctt atcttcctcc 1740
cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattac 1800
cggtggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcacgcccca 1860
gagccgccac catggcctac ccatacgatg ttccagatta cgctctcaca ttcatggcct 1920
ctgacagcga ggaagaagtg tgtgatgagc ggacgtccct aatgtcggct gagagcccca 1980
cgccgcgctc ctgccaggag ggcaggcagg gcccagagga tggagagaac actgcccagt 2040
ggagaagcca ggagaacgag gaggacggtg aggaggaccc tgaccgctat gtctgtagtg 2100
gggttcccgg gcggccgcca ggcctggagg aagagctgac cctcaaatac ggagcgaagc 2160
acgtgatcat gctgtttgtg cctgtcactc tgtgcatgat cgtggtggta gccaccatca 2220
agtctgtgcg cttctacaca gagaagaatg gacagctcat ctacacgcca ttcactgagg 2280
acacaccctc ggtgggccag cgcctcctca actccgtgct gaacaccctc atcatgatca 2340
gcgtcatcgt ggttatgacc atcttcttgg tggtgctcta caagtaccgc tgctacaagt 2400
tcatccatgg ctggttgatc atgtcttcac tgatgctgct gttcctcttc acctatatct 2460
accttgggga agtgctcaag acctacaatg tggccatgga ctaccccacc ctcttgctga 2520
ctgtctggaa cttcggggca gtgggcatgg tgtgcatcca ctggaagggc cctctggtgc 2580
tgcagcaggc ctacctcatc atgatcagtg cgctcatggc cctagtgttc atcaagtacc 2640
tcccagagtg gtccgcgtgg gtcatcctgg gcgccatctc tgtgtatgat ctcgtggctg 2700
tgctgtgtcc caaagggcct ctgagaatgc tggtagaaac tgcccaggag agaaatgagc 2760
ccatattccc tgccctgata tactcatctg ccatggtgtg gacggttggc atggcgaagc 2820
tggacccctc ctctcagggt gccctccagc tcccctacga cccggagatg gaagaagact 2880
cctatgacag ttttggggag ccttcatacc ccgaagtctt tgagcctccc ttgactggct 2940
acccagggga ggagctggag gaagaggagg aaaggggcgt gaagcttggc ctcggggact 3000
tcatcttcta cagtgtgctg gtgggcaagg cggctgccac gggcagcggg gactggaata 3060
ccacgctggc ctgcttcgtg gccatcctca ttggcttgtg tctgaccctc ctgctgcttg 3120
ctgtgttcaa gaaggcgctg cccgccctcc ccatctccat cacgttcggg ctcatctttt 3180
acttctccac ggacaacctg gtgcggccgt tcatggacac cctggcctcc catcagctct 3240
acatctagta agcggccgcc ctagggagct cctcgagggg gtggcatccc tgtgacccct 3300
ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa 3360
taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga 3420
ggggggtggt atggagcaag gggcaagggg ggaagacaac ctgtagggcc tgcggggtct 3480
attgggaacc aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct 3540
gggttcaagc gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga 3600
ccaggctcag ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc 3660
tggtctcccc ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat 3720
tacaggcgtg aaccactgct cccttccctg tccttcctgg gcctagggct gtgccagctg 3780
cctcgtcccg tcaccttctg gcttcttctc tccctccata tcttagctgt tttcctcatg 3840
agaatgttcc aaattcgaaa tttctattta accattatat atttacttgt ttgctattat 3900
ctctgccccc agtagattgt tagctccaga agagaaagga tcatgtcttt tgcttatcta 3960
gatatgccca tctgcctggt acaatctctg gcacatgtta caggcaacaa ctacttgtgg 4020
aattggtgaa tgcatgaata gaagaatgag tgaatgaatg aatagacaat aggcagaaat 4080
ccagcctcaa agagcttaca gtctggtaag aggaataaaa tgtctgcaaa tagccacagg 4140
acaggtcaaa ggaaggaggg gctatttcca gctgagggca ccccatcagg aaagcacccc 4200
agacttcctt agggataaca gggtaatggc gcgggccgca ggaaccccta gtgatggagt 4260
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4320
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4380
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgtc 4440
aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4500
gcgcagcgtg accgctacac ttgccagcgc cttagcgccc gctcctttcg ctttcttccc 4560
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4620
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt tgggtgatgg 4680
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4740
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaactcta tctcgggcta 4800
ttcttttgat ttataaggga ttttgccgat ttcggtctat tggttaaaaa atgagctgat 4860
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt tatggtgcac 4920
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 4980
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5040
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5100
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5160
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5220
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5280
ttgaaaaagg aagagtcgat cgatcaagag acaggatgag gatcgtttcg catgattgaa 5340
caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac 5400
tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg 5460
cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaagacgag 5520
gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt 5580
gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg 5640
tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg 5700
catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga 5760
gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag 5820
gggctcgcgc cagccgaact gttcgccagg ctcaaggcga gcatgcccga cggcgaggat 5880
ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt 5940
tctggattca tcgactgtgg ccggctgggt gtggcggatc gctatcagga catagcgttg 6000
gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt 6060
tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc 6120
ttctgaacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat 6180
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 6240
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 6300
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 6360
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 6420
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 6480
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 6540
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 6600
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 6660
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 6720
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 6780
ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 6840
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 6900
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 6960
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 7020
agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 7080
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 7140
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 7200
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 7260
ccttttgctg gccttttgct cacatgt 7287
<210> 77
<211> 7287
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 77
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggat tccagttgtt atgttttatc 480
cagaggttta catttctgta aaactataca actgcatttc agctgcttct ttttccggga 540
cgcgtcaatt gagatctccg acattgatta ttgactagtt attaatagta atcaattacg 600
gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 660
ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 720
atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 780
gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 840
gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 900
tggcagtaca tctacgtatt agtcatcgct attaccatgt cgaggccacg ttctgcttca 960
ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat 1020
tttgtgcagc gatgggggcg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 1080
ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 1140
aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 1200
gcgggcggga gcaagcttcg tttagtgaac cgtcagatcg cctggagacg ccatccacgc 1260
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggatt cgaatcccgg 1320
ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa gtaccgccta 1380
tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt 1440
atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc 1500
ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat 1560
ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct 1620
aatagcagct acaatccagc taccattctg cttttatttt gtggttggga taaggctgga 1680
ttattctgag tccaagctag gcccttttgc taatcgtgtt catacctctt atcttcctcc 1740
cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattac 1800
cggtggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcacgcccca 1860
gagccgccac catggcctac ccatacgatg ttccagatta cgctctcaca ttcatggcct 1920
ctgacagcga ggaagaagtg tgtgatgagc ggacgtccct aatgtcggct gagagcccca 1980
cgccgcgctc ctgccaggag ggcaggcagg gcccagagga tggagagaac actgcccagt 2040
ggagaagcca ggagaacgag gaggacggtg aggaggaccc tgaccgctat gtctgtagtg 2100
gggttcccgg gcggccgcca ggcctggagg aagagctgac cctcaaatac ggagcgaagc 2160
acgtgatcat gctgtttgtg cctgtcactc tgtgcatgat cgtggtggta gccaccatca 2220
agtctgtgcg cttctacaca gagaagaatg gacagctcat ctacacgcca ttcactgagg 2280
acacaccctc ggtgggccag cgcctcctca actccgtgct gaacaccctc atcatgatca 2340
gcgtcatcgt ggttatgacc atcttcttgg tggtgctcta caagtaccgc tgctacaagt 2400
tcatccatgg ctggttgatc atgtcttcac tgatgctgct gttcctcttc acctatatct 2460
accttgggga agtgctcaag acctacaatg tggccatgga ctaccccacc ctcttgctga 2520
ctgtctggaa cttcggggca gtgggcatgg tgtgcatcca ctggaagggc cctctggtgc 2580
tgcagcaggc ctacctcatc atgatcagtg cgctcatggc cctagtgttc atcaagtacc 2640
tcccagagtg gtccgcgtgg gtcatcctgg gcgccatctc tgtgtatgat ctcgtggctg 2700
tgctgtgtcc caaagggcct ctgagaatgc tggtagaaac tgcccaggag agaaatgagc 2760
ccatattccc tgccctgata tactcatctg ccatggtgtg gacggttggc atggcgaagc 2820
tggacccctc ctctcagggt gccctccagc tcccctacga cccggagatg gaagaagact 2880
cctatgacag ttttggggag ccttcatacc ccgaagtctt tgagcctccc ttgactggct 2940
acccagggga ggagctggag gaagaggagg aaaggggcgt gaagcttggc ctcggggact 3000
tcatcttcta cagtgtgctg gtgggcaagg cggctgccac gggcagcggg gactggaata 3060
ccacgctggc ctgcttcgtg gccatcctca ttggcttgtg tctgaccctc ctgctgcttg 3120
ctgtgttcaa gaaggcgctg cccgccctcc ccatctccat cacgttcggg ctcatctttt 3180
acttctccac ggacaacctg gtgcggccgt tcatggacac cctggcctcc catcagctct 3240
acatctagta agcggccgcc ctagggagct cctcgagggg gtggcatccc tgtgacccct 3300
ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa 3360
taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga 3420
ggggggtggt atggagcaag gggcaagggg ggaagacaac ctgtagggcc tgcggggtct 3480
attgggaacc aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct 3540
gggttcaagc gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga 3600
ccaggctcag ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc 3660
tggtctcccc ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat 3720
tacaggcgtg aaccactgct cccttccctg tccttcctgg gcctagggct gtgccagctg 3780
cctcgtcccg tcaccttctg gcttcttctc tccctccata tcttagctgt tttcctcatg 3840
agaatgttcc aaattcgaaa tttctattta accattatat atttacttgt ttgctattat 3900
ctctgccccc agtagattgt tagctccaga agagaaagga tcatgtcttt tgcttatcta 3960
gatatgccca tctgcctggt acaatctctg gcacatgtta caggcaacaa ctacttgtgg 4020
aattggtgaa tgcatgaata gaagaatgag tgaatgaatg aatagacaat aggcagaaat 4080
ccagcctcaa agagcttaca gtctggtaag aggaataaaa tgtctgcaaa tagccacagg 4140
acaggtcaaa ggaaggaggg gctatttcca gctgagggca ccccatcagg aaagcacccc 4200
agacttcctt agggataaca gggtaatggc gcgggccgca ggaaccccta gtgatggagt 4260
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4320
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4380
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgtc 4440
aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4500
gcgcagcgtg accgctacac ttgccagcgc cttagcgccc gctcctttcg ctttcttccc 4560
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4620
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt tgggtgatgg 4680
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4740
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaactcta tctcgggcta 4800
ttcttttgat ttataaggga ttttgccgat ttcggtctat tggttaaaaa atgagctgat 4860
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt tatggtgcac 4920
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 4980
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5040
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5100
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5160
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5220
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5280
ttgaaaaagg aagagtcgat cgatcaagag acaggatgag gatcgtttcg catgattgaa 5340
caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac 5400
tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg 5460
cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaagacgag 5520
gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt 5580
gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg 5640
tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg 5700
catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga 5760
gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag 5820
gggctcgcgc cagccgaact gttcgccagg ctcaaggcga gcatgcccga cggcgaggat 5880
ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt 5940
tctggattca tcgactgtgg ccggctgggt gtggcggatc gctatcagga catagcgttg 6000
gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt 6060
tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc 6120
ttctgaacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat 6180
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 6240
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 6300
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 6360
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 6420
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 6480
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 6540
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 6600
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 6660
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 6720
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 6780
ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 6840
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 6900
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 6960
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 7020
agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 7080
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 7140
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 7200
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 7260
ccttttgctg gccttttgct cacatgt 7287
<210> 78
<211> 7287
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 78
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggat tcgcttaatt cgaatatcct 480
aagaggttta catttcttga tattactatt aagccacttc agctgcttct ttttccggga 540
cgcgtcaatt gagatctccg acattgatta ttgactagtt attaatagta atcaattacg 600
gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 660
ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 720
atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 780
gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 840
gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 900
tggcagtaca tctacgtatt agtcatcgct attaccatgt cgaggccacg ttctgcttca 960
ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat 1020
tttgtgcagc gatgggggcg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 1080
ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 1140
aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 1200
gcgggcggga gcaagcttcg tttagtgaac cgtcagatcg cctggagacg ccatccacgc 1260
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggatt cgaatcccgg 1320
ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa gtaccgccta 1380
tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt tgtttatctt 1440
atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa tgtatcatgc 1500
ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca atagcaatat 1560
ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt tcatattgct 1620
aatagcagct acaatccagc taccattctg cttttatttt gtggttggga taaggctgga 1680
ttattctgag tccaagctag gcccttttgc taatcgtgtt catacctctt atcttcctcc 1740
cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc aaagaattac 1800
cggtggcaac gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcacgcccca 1860
gagccgccac catggcctac ccatacgatg ttccagatta cgctctcaca ttcatggcct 1920
ctgacagcga ggaagaagtg tgtgatgagc ggacgtccct aatgtcggct gagagcccca 1980
cgccgcgctc ctgccaggag ggcaggcagg gcccagagga tggagagaac actgcccagt 2040
ggagaagcca ggagaacgag gaggacggtg aggaggaccc tgaccgctat gtctgtagtg 2100
gggttcccgg gcggccgcca ggcctggagg aagagctgac cctcaaatac ggagcgaagc 2160
acgtgatcat gctgtttgtg cctgtcactc tgtgcatgat cgtggtggta gccaccatca 2220
agtctgtgcg cttctacaca gagaagaatg gacagctcat ctacacgcca ttcactgagg 2280
acacaccctc ggtgggccag cgcctcctca actccgtgct gaacaccctc atcatgatca 2340
gcgtcatcgt ggttatgacc atcttcttgg tggtgctcta caagtaccgc tgctacaagt 2400
tcatccatgg ctggttgatc atgtcttcac tgatgctgct gttcctcttc acctatatct 2460
accttgggga agtgctcaag acctacaatg tggccatgga ctaccccacc ctcttgctga 2520
ctgtctggaa cttcggggca gtgggcatgg tgtgcatcca ctggaagggc cctctggtgc 2580
tgcagcaggc ctacctcatc atgatcagtg cgctcatggc cctagtgttc atcaagtacc 2640
tcccagagtg gtccgcgtgg gtcatcctgg gcgccatctc tgtgtatgat ctcgtggctg 2700
tgctgtgtcc caaagggcct ctgagaatgc tggtagaaac tgcccaggag agaaatgagc 2760
ccatattccc tgccctgata tactcatctg ccatggtgtg gacggttggc atggcgaagc 2820
tggacccctc ctctcagggt gccctccagc tcccctacga cccggagatg gaagaagact 2880
cctatgacag ttttggggag ccttcatacc ccgaagtctt tgagcctccc ttgactggct 2940
acccagggga ggagctggag gaagaggagg aaaggggcgt gaagcttggc ctcggggact 3000
tcatcttcta cagtgtgctg gtgggcaagg cggctgccac gggcagcggg gactggaata 3060
ccacgctggc ctgcttcgtg gccatcctca ttggcttgtg tctgaccctc ctgctgcttg 3120
ctgtgttcaa gaaggcgctg cccgccctcc ccatctccat cacgttcggg ctcatctttt 3180
acttctccac ggacaacctg gtgcggccgt tcatggacac cctggcctcc catcagctct 3240
acatctagta agcggccgcc ctagggagct cctcgagggg gtggcatccc tgtgacccct 3300
ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa 3360
taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga 3420
ggggggtggt atggagcaag gggcaagggg ggaagacaac ctgtagggcc tgcggggtct 3480
attgggaacc aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct 3540
gggttcaagc gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga 3600
ccaggctcag ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc 3660
tggtctcccc ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat 3720
tacaggcgtg aaccactgct cccttccctg tccttcctgg gcctagggct gtgccagctg 3780
cctcgtcccg tcaccttctg gcttcttctc tccctccata tcttagctgt tttcctcatg 3840
agaatgttcc aaattcgaaa tttctattta accattatat atttacttgt ttgctattat 3900
ctctgccccc agtagattgt tagctccaga agagaaagga tcatgtcttt tgcttatcta 3960
gatatgccca tctgcctggt acaatctctg gcacatgtta caggcaacaa ctacttgtgg 4020
aattggtgaa tgcatgaata gaagaatgag tgaatgaatg aatagacaat aggcagaaat 4080
ccagcctcaa agagcttaca gtctggtaag aggaataaaa tgtctgcaaa tagccacagg 4140
acaggtcaaa ggaaggaggg gctatttcca gctgagggca ccccatcagg aaagcacccc 4200
agacttcctt agggataaca gggtaatggc gcgggccgca ggaaccccta gtgatggagt 4260
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4320
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4380
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgtc 4440
aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4500
gcgcagcgtg accgctacac ttgccagcgc cttagcgccc gctcctttcg ctttcttccc 4560
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4620
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt tgggtgatgg 4680
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4740
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaactcta tctcgggcta 4800
ttcttttgat ttataaggga ttttgccgat ttcggtctat tggttaaaaa atgagctgat 4860
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt tatggtgcac 4920
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 4980
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5040
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5100
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 5160
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 5220
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 5280
ttgaaaaagg aagagtcgat cgatcaagag acaggatgag gatcgtttcg catgattgaa 5340
caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac 5400
tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg 5460
cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaagacgag 5520
gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt 5580
gtcactgaag cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg 5640
tcatctcacc ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg 5700
catacgcttg atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga 5760
gcacgtactc ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag 5820
gggctcgcgc cagccgaact gttcgccagg ctcaaggcga gcatgcccga cggcgaggat 5880
ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt 5940
tctggattca tcgactgtgg ccggctgggt gtggcggatc gctatcagga catagcgttg 6000
gctacccgtg atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt 6060
tacggtatcg ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc 6120
ttctgaacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat 6180
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 6240
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 6300
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 6360
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 6420
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 6480
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 6540
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 6600
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 6660
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 6720
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 6780
ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 6840
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 6900
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 6960
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 7020
agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 7080
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 7140
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 7200
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 7260
ccttttgctg gccttttgct cacatgt 7287
<210> 79
<211> 7369
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 79
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggat tcgcttaatt cgaatatcct 480
aagaggttta catttcttga tattactatt aagccacttc agctgcttct gagctgttgg 540
attcgcttaa ttcgaatatc ctaagaggtt tacatttctt gatattacta ttaagccact 600
tcagctgctt ctttttccgg gacgcgtcaa ttgagatctc cgacattgat tattgactag 660
ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt 720
tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac 780
gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg 840
ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 900
tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat 960
gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 1020
gtcgaggcca cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg 1080
tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg gggcgcgcgc 1140
caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt gcggcggcag 1200
ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 1260
cctataaaaa gcgaagcgcg cggcgggcgg gagcaagctt cgtttagtga accgtcagat 1320
cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg accgatccag 1380
cctccgcgga ttcgaatccc ggccgggaac ggtgcattgg aacgcggatt ccccgtgcca 1440
agagtgacgt aagtaccgcc tatagagtct ataggcccac aaaaaatgct ttcttctttt 1500
aatatacttt tttgtttatc ttatttctaa tactttccct aatctctttc tttcagggca 1560
ataatgatac aatgtatcat gcctctttgc accattctaa agaataacag tgataatttc 1620
tgggttaagg caatagcaat atttctgcat ataaatattt ctgcatataa attgtaactg 1680
atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc tgcttttatt 1740
ttgtggttgg gataaggctg gattattctg agtccaagct aggccctttt gctaatcgtg 1800
ttcatacctc ttatcttcct cccacagctc ctgggcaacg tgctggtctg tgtgctggcc 1860
catcactttg gcaaagaatt accggtggca acgtgctggt tattgtgctg tctcatcatt 1920
ttggcaaaga attcacgccc cagagccgcc accatggcct acccatacga tgttccagat 1980
tacgctctca cattcatggc ctctgacagc gaggaagaag tgtgtgatga gcggacgtcc 2040
ctaatgtcgg ctgagagccc cacgccgcgc tcctgccagg agggcaggca gggcccagag 2100
gatggagaga acactgccca gtggagaagc caggagaacg aggaggacgg tgaggaggac 2160
cctgaccgct atgtctgtag tggggttccc gggcggccgc caggcctgga ggaagagctg 2220
accctcaaat acggagcgaa gcacgtgatc atgctgtttg tgcctgtcac tctgtgcatg 2280
atcgtggtgg tagccaccat caagtctgtg cgcttctaca cagagaagaa tggacagctc 2340
atctacacgc cattcactga ggacacaccc tcggtgggcc agcgcctcct caactccgtg 2400
ctgaacaccc tcatcatgat cagcgtcatc gtggttatga ccatcttctt ggtggtgctc 2460
tacaagtacc gctgctacaa gttcatccat ggctggttga tcatgtcttc actgatgctg 2520
ctgttcctct tcacctatat ctaccttggg gaagtgctca agacctacaa tgtggccatg 2580
gactacccca ccctcttgct gactgtctgg aacttcgggg cagtgggcat ggtgtgcatc 2640
cactggaagg gccctctggt gctgcagcag gcctacctca tcatgatcag tgcgctcatg 2700
gccctagtgt tcatcaagta cctcccagag tggtccgcgt gggtcatcct gggcgccatc 2760
tctgtgtatg atctcgtggc tgtgctgtgt cccaaagggc ctctgagaat gctggtagaa 2820
actgcccagg agagaaatga gcccatattc cctgccctga tatactcatc tgccatggtg 2880
tggacggttg gcatggcgaa gctggacccc tcctctcagg gtgccctcca gctcccctac 2940
gacccggaga tggaagaaga ctcctatgac agttttgggg agccttcata ccccgaagtc 3000
tttgagcctc ccttgactgg ctacccaggg gaggagctgg aggaagagga ggaaaggggc 3060
gtgaagcttg gcctcgggga cttcatcttc tacagtgtgc tggtgggcaa ggcggctgcc 3120
acgggcagcg gggactggaa taccacgctg gcctgcttcg tggccatcct cattggcttg 3180
tgtctgaccc tcctgctgct tgctgtgttc aagaaggcgc tgcccgccct ccccatctcc 3240
atcacgttcg ggctcatctt ttacttctcc acggacaacc tggtgcggcc gttcatggac 3300
accctggcct cccatcagct ctacatctag taagcggccg ccctagggag ctcctcgagg 3360
gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca 3420
gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc 3480
ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagg ggggaagaca 3540
acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg 3600
ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 3660
ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 3720
ggtttcacca tattggccag gctggtctcc ccctcctaat ctcaggtgat ctacccacct 3780
tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtccttcct 3840
gggcctaggg ctgtgccagc tgcctcgtcc cgtcaccttc tggcttcttc tctccctcca 3900
tatcttagct gttttcctca tgagaatgtt ccaaattcga aatttctatt taaccattat 3960
atatttactt gtttgctatt atctctgccc ccagtagatt gttagctcca gaagagaaag 4020
gatcatgtct tttgcttatc tagatatgcc catctgcctg gtacaatctc tggcacatgt 4080
tacaggcaac aactacttgt ggaattggtg aatgcatgaa tagaagaatg agtgaatgaa 4140
tgaatagaca ataggcagaa atccagcctc aaagagctta cagtctggta agaggaataa 4200
aatgtctgca aatagccaca ggacaggtca aaggaaggag gggctatttc cagctgaggg 4260
caccccatca ggaaagcacc ccagacttcc ttagggataa cagggtaatg gcgcgggccg 4320
caggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4380
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4440
cgagcgcgca gctgcctgca ggggcgcctg atgcggtatt ttctccttac gcatctgtgc 4500
ggtatttcac accgcatacg tcaaagcaac catagtacgc gccctgtagc ggcgcattaa 4560
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccttagcgc 4620
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 4680
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 4740
aaaaacttga tttgggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 4800
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 4860
cactcaactc tatctcgggc tattcttttg atttataagg gattttgccg atttcggtct 4920
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 4980
cgtttacaat tttatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 5040
agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat 5100
ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt 5160
catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta taggttaatg 5220
tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa 5280
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac 5340
cctgataaat gcttcaataa tattgaaaaa ggaagagtcg atcgatcaag agacaggatg 5400
aggatcgttt cgcatgattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt 5460
ggagaggcta ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt 5520
gttccggctg tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc 5580
cctgaatgaa ctgcaagacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc 5640
ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga 5700
agtgccgggg caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat 5760
ggctgatgca atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca 5820
agcgaaacat cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga 5880
tgatctggac gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc 5940
gagcatgccc gacggcgagg atctcgtcgt gacccatggc gatgcctgct tgccgaatat 6000
catggtggaa aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga 6060
tcgctatcag gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg 6120
ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt 6180
ctatcgcctt cttgacgagt tcttctgaac gagcgtgaca ccacgatgcc tgtagcaatg 6240
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6300
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6360
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6420
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6480
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6540
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 6600
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6660
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6720
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6780
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6840
agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 6900
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 6960
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 7020
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7080
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7140
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7200
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7260
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7320
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgt 7369
<210> 80
<211> 7451
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 80
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatgag ggcctatttc ccatgattcc ttcatatttg catatacgat 240
acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 300
aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 360
ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 420
atatcttgtg gaaaggacga ggtaccgtga gctgttggat tcgcttaatt cgaatatcct 480
aagaggttta catttcttga tattactatt aagccacttc agctgcttct gagctgttgg 540
attcgcttaa ttcgaatatc ctaagaggtt tacatttctt gatattacta ttaagccact 600
tcagctgctt ctgagctgtt ggattcgctt aattcgaata tcctaagagg tttacatttc 660
ttgatattac tattaagcca cttcagctgc ttctttttcc gggacgcgtc aattgagatc 720
tccgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 780
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 840
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 900
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 960
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 1020
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 1080
tattagtcat cgctattacc atgtcgaggc cacgttctgc ttcactctcc ccatctcccc 1140
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 1200
ggcggggggg gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg gggcggggcg 1260
aggcggagag gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt tccttttatg 1320
gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc gggagcaagc 1380
ttcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 1440
gaagacaccg ggaccgatcc agcctccgcg gattcgaatc ccggccggga acggtgcatt 1500
ggaacgcgga ttccccgtgc caagagtgac gtaagtaccg cctatagagt ctataggccc 1560
acaaaaaatg ctttcttctt ttaatatact tttttgttta tcttatttct aatactttcc 1620
ctaatctctt tctttcaggg caataatgat acaatgtatc atgcctcttt gcaccattct 1680
aaagaataac agtgataatt tctgggttaa ggcaatagca atatttctgc atataaatat 1740
ttctgcatat aaattgtaac tgatgtaaga ggtttcatat tgctaatagc agctacaatc 1800
cagctaccat tctgctttta ttttgtggtt gggataaggc tggattattc tgagtccaag 1860
ctaggccctt ttgctaatcg tgttcatacc tcttatcttc ctcccacagc tcctgggcaa 1920
cgtgctggtc tgtgtgctgg cccatcactt tggcaaagaa ttaccggtgg caacgtgctg 1980
gttattgtgc tgtctcatca ttttggcaaa gaattcacgc cccagagccg ccaccatggc 2040
ctacccatac gatgttccag attacgctct cacattcatg gcctctgaca gcgaggaaga 2100
agtgtgtgat gagcggacgt ccctaatgtc ggctgagagc cccacgccgc gctcctgcca 2160
ggagggcagg cagggcccag aggatggaga gaacactgcc cagtggagaa gccaggagaa 2220
cgaggaggac ggtgaggagg accctgaccg ctatgtctgt agtggggttc ccgggcggcc 2280
gccaggcctg gaggaagagc tgaccctcaa atacggagcg aagcacgtga tcatgctgtt 2340
tgtgcctgtc actctgtgca tgatcgtggt ggtagccacc atcaagtctg tgcgcttcta 2400
cacagagaag aatggacagc tcatctacac gccattcact gaggacacac cctcggtggg 2460
ccagcgcctc ctcaactccg tgctgaacac cctcatcatg atcagcgtca tcgtggttat 2520
gaccatcttc ttggtggtgc tctacaagta ccgctgctac aagttcatcc atggctggtt 2580
gatcatgtct tcactgatgc tgctgttcct cttcacctat atctaccttg gggaagtgct 2640
caagacctac aatgtggcca tggactaccc caccctcttg ctgactgtct ggaacttcgg 2700
ggcagtgggc atggtgtgca tccactggaa gggccctctg gtgctgcagc aggcctacct 2760
catcatgatc agtgcgctca tggccctagt gttcatcaag tacctcccag agtggtccgc 2820
gtgggtcatc ctgggcgcca tctctgtgta tgatctcgtg gctgtgctgt gtcccaaagg 2880
gcctctgaga atgctggtag aaactgccca ggagagaaat gagcccatat tccctgccct 2940
gatatactca tctgccatgg tgtggacggt tggcatggcg aagctggacc cctcctctca 3000
gggtgccctc cagctcccct acgacccgga gatggaagaa gactcctatg acagttttgg 3060
ggagccttca taccccgaag tctttgagcc tcccttgact ggctacccag gggaggagct 3120
ggaggaagag gaggaaaggg gcgtgaagct tggcctcggg gacttcatct tctacagtgt 3180
gctggtgggc aaggcggctg ccacgggcag cggggactgg aataccacgc tggcctgctt 3240
cgtggccatc ctcattggct tgtgtctgac cctcctgctg cttgctgtgt tcaagaaggc 3300
gctgcccgcc ctccccatct ccatcacgtt cgggctcatc ttttacttct ccacggacaa 3360
cctggtgcgg ccgttcatgg acaccctggc ctcccatcag ctctacatct agtaagcggc 3420
cgccctaggg agctcctcga gggggtggca tccctgtgac ccctccccag tgcctctcct 3480
ggccctggaa gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat 3540
cattttgtct gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag 3600
caaggggcaa ggggggaaga caacctgtag ggcctgcggg gtctattggg aaccaagctg 3660
gagtgcagtg gcacaatctt ggctcactgc aatctccgcc tcctgggttc aagcgattct 3720
cctgcctcag cctcccgagt tgttgggatt ccaggcatgc atgaccaggc tcagctaatt 3780
tttgtttttt tggtagagac ggggtttcac catattggcc aggctggtct ccccctccta 3840
atctcaggtg atctacccac cttggcctcc caaattgctg ggattacagg cgtgaaccac 3900
tgctcccttc cctgtccttc ctgggcctag ggctgtgcca gctgcctcgt cccgtcacct 3960
tctggcttct tctctccctc catatcttag ctgttttcct catgagaatg ttccaaattc 4020
gaaatttcta tttaaccatt atatatttac ttgtttgcta ttatctctgc ccccagtaga 4080
ttgttagctc cagaagagaa aggatcatgt cttttgctta tctagatatg cccatctgcc 4140
tggtacaatc tctggcacat gttacaggca acaactactt gtggaattgg tgaatgcatg 4200
aatagaagaa tgagtgaatg aatgaataga caataggcag aaatccagcc tcaaagagct 4260
tacagtctgg taagaggaat aaaatgtctg caaatagcca caggacaggt caaaggaagg 4320
aggggctatt tccagctgag ggcaccccat caggaaagca ccccagactt ccttagggat 4380
aacagggtaa tggcgcgggc cgcaggaacc cctagtgatg gagttggcca ctccctctct 4440
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4500
ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc tgatgcggta 4560
ttttctcctt acgcatctgt gcggtatttc acaccgcata cgtcaaagca accatagtac 4620
gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 4680
acacttgcca gcgccttagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 4740
ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 4800
gctttacggc acctcgaccc caaaaaactt gatttgggtg atggttcacg tagtgggcca 4860
tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 4920
ctcttgttcc aaactggaac aacactcaac tctatctcgg gctattcttt tgatttataa 4980
gggattttgc cgatttcggt ctattggtta aaaaatgagc tgatttaaca aaaatttaac 5040
gcgaatttta acaaaatatt aacgtttaca attttatggt gcactctcag tacaatctgc 5100
tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga 5160
cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc 5220
atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata 5280
cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact 5340
tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 5400
tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 5460
cgatcgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg 5520
caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 5580
tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 5640
tcaagaccga cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt 5700
ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 5760
gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc 5820
ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 5880
ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 5940
aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 6000
aactgttcgc caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg 6060
gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 6120
gtggccggct gggtgtggcg gatcgctatc aggacatagc gttggctacc cgtgatattg 6180
ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 6240
ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga acgagcgtga 6300
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 6360
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 6420
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 6480
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 6540
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 6600
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 6660
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 6720
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 6780
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 6840
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 6900
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 6960
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 7020
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 7080
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 7140
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 7200
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 7260
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 7320
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 7380
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 7440
tgctcacatg t 7451
<210> 81
<211> 7208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 81
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccaat tcagtggatc ccgataacta taacggtcct 180
aaggtagcga tttaaatccg ggacgcgtca attgagatct ccgacattga ttattgacta 240
gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 300
ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 360
cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 420
gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 480
gtacgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 540
tgaccttatg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 600
tgtcgaggcc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 660
gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggcgcgcg 720
ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg tgcggcggca 780
gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg 840
ccctataaaa agcgaagcgc gcggcgggcg ggagcaagct tcgtttagtg aaccgtcaga 900
tcgcctggag acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca 960
gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat tccccgtgcc 1020
aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc tttcttcttt 1080
taatatactt ttttgtttat cttatttcta atactttccc taatctcttt ctttcagggc 1140
aataatgata caatgtatca tgcctctttg caccattcta aagaataaca gtgataattt 1200
ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata aattgtaact 1260
gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt ctgcttttat 1320
tttgtggttg ggataaggct ggattattct gagatatcgg tacctgagct gttggattcg 1380
cttaattcga atatcctaag aggtttacat ttcttgatat tactattaag ccacttcagc 1440
tgcttctgag ctgttggatt cgcttaattc gaatatccta agaggtttac atttcttgat 1500
attactatta agccacttca gctgcttctg agctgttgga ttcgcttaat tcgaatatcc 1560
taagaggttt acatttcttg atattactat taagccactt cagctgcttc gtcgacgcta 1620
ggcccttttg ctaatcgtgt tcatacctct tatcttcctc ccacagctcc tgggcaacgt 1680
gctggtctgt gtgctggccc atcactttgg caaagaatta ccggtggcaa cgtgctggtt 1740
attgtgctgt ctcatcattt tggcaaagaa ttcacgcccc agagccgcca ccatggccta 1800
cccatacgat gttccagatt acgctctcac attcatggcc tctgacagcg aggaagaagt 1860
gtgtgatgag cggacgtccc taatgtcggc tgagagcccc acgccgcgct cctgccagga 1920
gggcaggcag ggcccagagg atggagagaa cactgcccag tggagaagcc aggagaacga 1980
ggaggacggt gaggaggacc ctgaccgcta tgtctgtagt ggggttcccg ggcggccgcc 2040
aggcctggag gaagagctga ccctcaaata cggagcgaag cacgtgatca tgctgtttgt 2100
gcctgtcact ctgtgcatga tcgtggtggt agccaccatc aagtctgtgc gcttctacac 2160
agagaagaat ggacagctca tctacacgcc attcactgag gacacaccct cggtgggcca 2220
gcgcctcctc aactccgtgc tgaacaccct catcatgatc agcgtcatcg tggttatgac 2280
catcttcttg gtggtgctct acaagtaccg ctgctacaag ttcatccatg gctggttgat 2340
catgtcttca ctgatgctgc tgttcctctt cacctatatc taccttgggg aagtgctcaa 2400
gacctacaat gtggccatgg actaccccac cctcttgctg actgtctgga acttcggggc 2460
agtgggcatg gtgtgcatcc actggaaggg ccctctggtg ctgcagcagg cctacctcat 2520
catgatcagt gcgctcatgg ccctagtgtt catcaagtac ctcccagagt ggtccgcgtg 2580
ggtcatcctg ggcgccatct ctgtgtatga tctcgtggct gtgctgtgtc ccaaagggcc 2640
tctgagaatg ctggtagaaa ctgcccagga gagaaatgag cccatattcc ctgccctgat 2700
atactcatct gccatggtgt ggacggttgg catggcgaag ctggacccct cctctcaggg 2760
tgccctccag ctcccctacg acccggagat ggaagaagac tcctatgaca gttttgggga 2820
gccttcatac cccgaagtct ttgagcctcc cttgactggc tacccagggg aggagctgga 2880
ggaagaggag gaaaggggcg tgaagcttgg cctcggggac ttcatcttct acagtgtgct 2940
ggtgggcaag gcggctgcca cgggcagcgg ggactggaat accacgctgg cctgcttcgt 3000
ggccatcctc attggcttgt gtctgaccct cctgctgctt gctgtgttca agaaggcgct 3060
gcccgccctc cccatctcca tcacgttcgg gctcatcttt tacttctcca cggacaacct 3120
ggtgcggccg ttcatggaca ccctggcctc ccatcagctc tacatctagt aagcggccgc 3180
cctagggagc tcctcgaggg ggtggcatcc ctgtgacccc tccccagtgc ctctcctggc 3240
cctggaagtt gccactccag tgcccaccag ccttgtccta ataaaattaa gttgcatcat 3300
tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg tatggagcaa 3360
ggggcaaggg gggaagacaa cctgtagggc ctgcggggtc tattgggaac caagctggag 3420
tgcagtggca caatcttggc tcactgcaat ctccgcctcc tgggttcaag cgattctcct 3480
gcctcagcct cccgagttgt tgggattcca ggcatgcatg accaggctca gctaattttt 3540
gtttttttgg tagagacggg gtttcaccat attggccagg ctggtctccc cctcctaatc 3600
tcaggtgatc tacccacctt ggcctcccaa attgctggga ttacaggcgt gaaccactgc 3660
tcccttccct gtccttcctg ggcctagggc tgtgccagct gcctcgtccc gtcaccttct 3720
ggcttcttct ctccctccat atcttagctg ttttcctcat gagaatgttc caaattcgaa 3780
atttctattt aaccattata tatttacttg tttgctatta tctctgcccc cagtagattg 3840
ttagctccag aagagaaagg atcatgtctt ttgcttatct agatatgccc atctgcctgg 3900
tacaatctct ggcacatgtt acaggcaaca actacttgtg gaattggtga atgcatgaat 3960
agaagaatga gtgaatgaat gaatagacaa taggcagaaa tccagcctca aagagcttac 4020
agtctggtaa gaggaataaa atgtctgcaa atagccacag gacaggtcaa aggaaggagg 4080
ggctatttcc agctgagggc accccatcag gaaagcaccc cagacttcct tagggataac 4140
agggtaatgg cgcgggccgc aggaacccct agtgatggag ttggccactc cctctctgcg 4200
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4260
ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga tgcggtattt 4320
tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc atagtacgcg 4380
ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4440
cttgccagcg ccttagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4500
gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 4560
ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag tgggccatcg 4620
ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4680
ttgttccaaa ctggaacaac actcaactct atctcgggct attcttttga tttataaggg 4740
attttgccga tttcggtcta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 4800
aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac aatctgctct 4860
gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc gccctgacgg 4920
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 4980
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc 5040
ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg tggcactttt 5100
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 5160
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtcga 5220
tcgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga ttgcacgcag 5280
gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg 5340
gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca 5400
agaccgacct gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg ctatcgtggc 5460
tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg 5520
actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg 5580
ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta 5640
cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag 5700
ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac 5760
tgttcgccag gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg acccatggcg 5820
atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg 5880
gccggctggg tgtggcggat cgctatcagg acatagcgtt ggctacccgt gatattgctg 5940
aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg 6000
attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgaacg agcgtgacac 6060
cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 6120
tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 6180
tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 6240
tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 6300
tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 6360
aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 6420
gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 6480
tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 6540
aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 6600
aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 6660
tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc 6720
gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 6780
cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 6840
acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 6900
cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 6960
cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 7020
aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 7080
gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 7140
atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 7200
tcacatgt 7208
<210> 82
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成引物
<400> 82
cctgaccacc ttgcactatt 20
<210> 83
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成探针
<400> 83
tgtgtccctc ggtgcagaaa ctac 24
<210> 84
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成引物
<400> 84
caacttccgg gcctatcata tc 22
<210> 85
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成引物
<400> 85
tggaccaatt agcattccat ca 22
<210> 86
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成探针
<400> 86
tgaactacgc ctgaggatcc gatct 25
<210> 87
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成引物
<400> 87
gccagaagtc agatgctcaa 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成引物
<400> 88
gagaaggtca gattagggcg 20
<210> 89
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成探针
<400> 89
aaagagtgtg ctcgggagtg c 21
<210> 90
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成引物
<400> 90
tcgtagggaa ctggcttttc 20

Claims (28)

1.一种表达盒,其包含:
a.编码一个或多个短发夹RNA或(shRNA)或微小RNA(miRNA)的第一多核苷酸,所述RNA中的每一个独立地靶向衍生自人野生型和突变型早老素1(PSEN1)中的每一者或人野生型和突变型早老素2(PSEN2)中的每一者的内源性信使RNA(mRNA)的编码区或非编码区,其中所述一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及
b.编码野生型早老素1(PSEN1)或早老素2(PSEN2)氨基酸序列的第二多核苷酸,其中所述第二多核苷酸不被所述第一多核苷酸编码的所述shRNA或miRNA中的任一个靶向;并且其中所述第二多核苷酸可操作地连接至第二启动子。
2.如权利要求1所述的表达盒,其中:
a.所述第一多核苷酸编码一个或多个shRNA或miRNA,所述RNA中的每一个独立地靶向衍生自人野生型和突变型早老素1(PSEN1)中的每一者的内源性mRNA的编码区或非编码区;并且
b.所述第二多核苷酸编码野生型早老素1(PSEN1),其中所述第二多核苷酸不被所述第一多核苷酸编码的所述shRNA或miRNA中的任一个靶向。
3.如权利要求2所述的表达盒,其中所述第一多核苷酸编码一个或多个shRNA或miRNA,所述RNA中的每一个独立地包含以下中的一个:a)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529;b)前述SEQ ID NO中的任一个的修饰型式,其中修饰是1、2、3或4个核苷酸变化;或c)19-21个碱基的核苷酸序列,其包含取自前述SEQ ID NO中的任一个或其修饰型式的5'或3'端的7个或更多个连续碱基,其中所述19-21个碱基的核苷酸序列与内源性PSEN1 mRNA的相应部分包含不多于4个错配。
4.如权利要求3所述的表达盒,其中所述第一多核苷酸编码一个或多个shRNA或miRNA,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQID NO:76的核苷酸448-529、SEQ ID NO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529。
5.如权利要求4所述的表达盒,其中所述第一多核苷酸编码一个或多个shRNA或miRNA,所述RNA中的每一个独立地包含以下中的一个:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:76的核苷酸448-529、SEQ IDNO:77的核苷酸448-529,或SEQ ID NO:78的核苷酸448-529。
6.如权利要求5所述的表达盒,其中所述第二多核苷酸包含SEQ ID NO:39,或与SEQ IDNO:39相比密码子优化或修饰的多核苷酸。
7.如权利要求6所述的表达盒,其中所述第二多核苷酸序列包含SEQ ID NO:39、SEQ IDNO:48,或SEQ ID NO:68的核苷酸1906-3303。
8.如权利要求4所述的表达盒,其中至少一个shRNA或miRNA包含以下中的一个:SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:42或SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:68的核苷酸497-517、SEQ ID NO:69的核苷酸497-517、SEQ ID NO:70的核苷酸497-517、SEQ ID NO:71的核苷酸497-517。
9.如权利要求8所述的表达盒,其中所述第二多核苷酸包含与SEQ ID NO:39相比密码子修饰的多核苷酸。
10.如权利要求9所述的表达盒,其中所述第二多核苷酸序列包含SEQ ID NO:41,或SEQID NO:68的核苷酸1906-3303。
11.如权利要求1-10中任一项所述的表达盒,其中所述一个或多个第一启动子中的至少一个是RNA聚合酶II或III启动子。
12.如权利要求11所述的表达盒,其中所述一个或多个第一启动子中的每一个是RNA聚合酶II或III启动子。
13.如权利要求11或12所述的表达盒,其中所述RNA聚合酶III启动子是U6启动子、U61启动子、U69启动子、H1启动子或其任何组合;并且所述RNA聚合酶II启动子是遍在或神经元特异性启动子。
14.如权利要求1-13中任一项所述的表达盒,其中所述第二启动子是RNA聚合酶II启动子。
15.如权利要求14所述的表达盒,其中所述RNA聚合酶II启动子是遍在或神经元特异性启动子。
16.一种载体,其包含如权利要求1-15中任一项所述的表达盒。
17.一种载体组,其包括:
a.包含含有第一多核苷酸的表达盒的第一载体,所述第一多核苷酸编码靶向由人野生型和突变型早老素1(PSEN1)中的每一者或由人野生型和突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区的一个或多个shRNA或miRNA,其中所述一个或多个shRNA或miRNA中的每一个可操作地连接至一个或多个第一启动子;以及
b.包含第二多核苷酸的第二载体,所述第二多核苷酸编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列,其中所述第二多核苷酸不被所述第一载体编码的所述shRNA或miRNA中的任一个靶向;并且其中所述第二多核苷酸可操作地连接至第二启动子。
18.如权利要求16所述的载体或如权利要求17所述的载体组,其中所述一种或多种载体是病毒载体。
19.如权利要求18所述的载体或载体组,其中所述病毒载体是腺相关病毒(AAV)载体、逆转录病毒载体、慢病毒载体或腺病毒载体。
20.如权利要求19所述的载体或载体组,其中所述AAV载体是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVDJ、AAVrh10、AAV11、AAV12、AAV2/1、AAV2/5、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2/rh10、AAV2/11、AAV2/12、PHP.B和PHP.B衍生物[PHP.eR、PHP.S]、AAV8[K137R]、AAV-TT、rAAV-retro、AAV9.HR、AAV1 CAM突变体或AAV9[586-590]交换突变体。
21.一种试剂盒,其包含如权利要求16-20中任一项所述的载体或载体组。
22.一种试剂盒,其包含:
a.一种或多种反义寡核苷酸,其中每一种反义寡核苷酸独立地靶向由人野生型和突变型早老素1(PSEN1)中的每一者、人野生型或突变型早老素2(PSEN2)中的每一者翻译的mRNA的编码区或非编码区;以及
b.包含编码野生型早老素1(PSEN1)氨基酸序列或野生型早老素2(PSEN2)氨基酸序列的多核苷酸的载体,其中所述第二多核苷酸不被所述一种或多种反义寡核苷酸中的任一种靶向;并且其中所述多核苷酸可操作地连接至所述载体中的启动子。
23.如权利要求22所述的试剂盒,其中所述一种或多种反义寡核苷酸中的每一种独立地选自短发夹RNA(shRNA)、短干扰RNA(siRNA)、小干扰RNA(miRNA)、小时序RNA(stRNA)或内切核糖核酸酶制备的siRNA(esiRNA)。
24.如权利要求23所述的试剂盒,其中所述一种或多种反义寡核苷酸中的至少一种包含一个或多个修饰核碱基。
25.如权利要求24所述的试剂盒,其中所述一个或多个修饰核碱基中的每一个独立地选自非天然存在的核碱基、锁核酸(LNA)或肽核酸(PNA)。
26.一种治疗神经退行性疾病、病症或病状的方法,其包括向有需要的受试者施用如权利要求16-20中任一项所述的载体或载体组,或如权利要求21-25中任一项所述的试剂盒的组分中的每一种。
27.如权利要求26所述的方法,其中所述神经退行性疾病、病症或病状是阿尔茨海默氏病、散发性阿尔茨海默氏病、家族性阿尔茨海默氏病、额颞叶痴呆、额颞叶变性、匹克氏病、路易体痴呆、记忆丧失、认知损害或轻度认知损害。
28.一种分离的核酸序列,其包含SEQ ID NO:41。
CN202180023471.2A 2020-01-31 2021-01-29 使用多核苷酸沉默和替换的神经退行性病症的基因疗法 Pending CN115362000A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062968707P 2020-01-31 2020-01-31
US62/968,707 2020-01-31
PCT/US2021/015911 WO2021155296A1 (en) 2020-01-31 2021-01-29 Gene therapy for neurodegenerative disorders using polynucleotide silencing and replacement

Publications (1)

Publication Number Publication Date
CN115362000A true CN115362000A (zh) 2022-11-18

Family

ID=77079829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180023471.2A Pending CN115362000A (zh) 2020-01-31 2021-01-29 使用多核苷酸沉默和替换的神经退行性病症的基因疗法

Country Status (8)

Country Link
US (1) US20230136245A1 (zh)
EP (1) EP4096786A4 (zh)
JP (1) JP2023512079A (zh)
CN (1) CN115362000A (zh)
AU (1) AU2021213253A1 (zh)
CA (1) CA3165624A1 (zh)
IL (1) IL294860A (zh)
WO (1) WO2021155296A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112022010373A2 (pt) * 2019-11-29 2022-08-16 Paros Bio Inc Terapia genética para doenças neurodegenerativas
WO2024022911A1 (en) * 2022-07-25 2024-02-01 Vico Therapeutics B.V. Antisense oligonucleotides for treating a disease or condition associated with an abnormal processing of app

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU4992099A (en) * 1998-07-16 2000-02-07 Incyte Pharmaceuticals, Inc. Human presenilin-associated protein
US6979537B2 (en) * 2000-01-10 2005-12-27 Scios, Inc. Methods for identifying inhibitors of neuronal degeneration
WO2005003350A2 (en) * 2003-06-27 2005-01-13 Sirna Therapeutics, Inc. RNA INTERFERENCE MEDIATED TREATMENT OF ALZHEIMER’S DISEASE USING SHORT INTERFERING NUCLEIC ACID (siNA)
US7498316B2 (en) * 2004-04-06 2009-03-03 University Of Massachusetts Methods and compositions for treating gain-of-function disorders using RNA interference

Also Published As

Publication number Publication date
IL294860A (en) 2022-09-01
EP4096786A4 (en) 2024-04-10
EP4096786A1 (en) 2022-12-07
JP2023512079A (ja) 2023-03-23
WO2021155296A1 (en) 2021-08-05
AU2021213253A1 (en) 2022-09-08
CA3165624A1 (en) 2021-08-05
US20230136245A1 (en) 2023-05-04

Similar Documents

Publication Publication Date Title
EP3177726B1 (en) Genome editing for the treatment of huntington&#39;s disease
KR102307280B1 (ko) Rna-가이드 유전자 편집 및 유전자 조절
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
AU2021204620A1 (en) Central nervous system targeting polynucleotides
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
JP2023036921A (ja) 蝸牛および前庭細胞に核酸を送達するための物質および方法
CN111733174B (zh) 一种分离的核酸分子及其用途
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
CN112725282A (zh) 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
JP2021515575A (ja) ウイルスベクター産生系
CN112041334A (zh) 人foxp3在经基因编辑的t细胞中的表达
CN115362000A (zh) 使用多核苷酸沉默和替换的神经退行性病症的基因疗法
KR20220130093A (ko) 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 조성물 및 방법
CN113692225B (zh) 经基因组编辑的鸟类
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
US20230391840A1 (en) Treatment of Muscular Dystrophies
KR20240004253A (ko) 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 방법
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물
CN116323942A (zh) 用于基因组编辑的组合物及其使用方法
KR20220139344A (ko) 신경변성 질환을 치료하기 위한 조성물 및 방법
NL2027815B1 (en) Genomic integration
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination