CN110637090A - 用于表达大型核酸转基因的质粒载体 - Google Patents

用于表达大型核酸转基因的质粒载体 Download PDF

Info

Publication number
CN110637090A
CN110637090A CN201780078633.6A CN201780078633A CN110637090A CN 110637090 A CN110637090 A CN 110637090A CN 201780078633 A CN201780078633 A CN 201780078633A CN 110637090 A CN110637090 A CN 110637090A
Authority
CN
China
Prior art keywords
promoter
vector
plasmid vector
nucleic acid
homology arm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780078633.6A
Other languages
English (en)
Inventor
D·基维利希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
D Jiweilixi
Original Assignee
D Jiweilixi
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by D Jiweilixi filed Critical D Jiweilixi
Publication of CN110637090A publication Critical patent/CN110637090A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2820/00Vectors comprising a special origin of replication system

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

在某些实施例中,本文提供了质粒表达载体以及使用这种载体进行真核细胞中的转基因的瞬时或稳定整合表达的方法。本文提供的质粒表达载体的大小小于3.6kb并且可以容纳转基因和同源臂的大型(>5kb)多核苷酸插入以实现稳定整合。

Description

用于表达大型核酸转基因的质粒载体
相关申请的交叉引用
本申请要求于2016年11月2日提交的美国临时申请号62/416,617的优先权,所述美国临时申请的公开内容出于所有目的整体并入本文。
对“序列表”、表格或在光盘上提交的计算机程序列表附录的引用
写入创建于2017年11月2日、字节数为137,811、机器格式为IBM-PC、采用MS-Windows操作系统的文件888888-888001WO_ST25.TXT中的序列表出于所有目的通过引用整体并入本文。
背景技术
用于表达转基因的现有质粒载体容纳大型核酸插入的能力有限。目前,如pcDNA3(英杰公司(InVitrogen))等用于真核基因表达的标准质粒载体的大小相对较大,约5.5千碱基或更大。将大型转基因(>5kb)插入到这些载体中会对载体的性能,包含细菌转化效率、载体的增殖和基因表达产生负面影响。质粒载体的大小限制限制了它们在基因疗法和基因置换应用中的使用。鉴于此,已经开发了可以容纳大型插入物的某些病毒载体系统。然而,病毒载体带有病毒感染和病毒基因不期望地整合到宿主基因组中的相关风险。另外,病毒载体仍然必须在细菌中进行组装,这由于产生效率降低而限制了插入物大小。因此,需要合适且安全的真核表达载体。
发明内容
在某些实施例中,本文提供了质粒表达载体、所述质粒表达载体的组分以及使用这种载体进行真核细胞中的转基因的瞬时或稳定整合表达的方法。通过在指定的同源臂插入位点处插入同源臂,所述质粒表达载体可以允许随机整合和靶向整合二者。本文提供的质粒表达载体的大小小于3.6kb并且可以容纳转基因和同源臂的大型(例如,大于5kb)多核苷酸插入以实现稳定整合。
在某些实施例中,本文提供了质粒载体,所述质粒载体包括:(a)原核复制起点;(b)适合于表达一个或多个转基因的真核启动子;(c)用于插入所述一个或多个转基因的多克隆位点;以及(d)编码可选择标志物的核酸,所述核酸可操作地连接到真核启动子和原核启动子,其中所述可选择标志物适合于原核选择和真核选择二者;其中所述载体的长度不大于约或3.6千碱基。
在某些实施例中,所述质粒载体包含:(a)原核复制起点;(b)适合于表达一个或多个转基因的真核启动子;(c)用于插入所述一个或多个转基因的多克隆位点;以及(d)编码可选择标志物的核酸,所述核酸可操作地连接到包含真核启动子和原核启动子的双启动子,其中所述可选择标志物适合于原核选择和真核选择二者;其中所述载体的长度不大于3.6千碱基。
在一些实施例中,所述质粒载体的长度为2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5或3.6千碱基。在一些实施例中,元件(a)-(d)在所述质粒的5到3方向上顺序布置。在一些实施例中,所述质粒载体进一步包括位于原核复制起点与所述真核启动子之间的上游同源臂插入位点并且进一步包括下游同源臂插入位点。在一些实施例中,所述下游同源臂插入位点位于编码可选择标志物的核酸之后但在所述复制起点之前。在一些实施例中,所述质粒载体进一步包括处于所述真核启动子与所述多克隆位点之间的合成剪接位点,所述合成剪接位点增强从所述真核启动子转录的RNA的稳定性。在一些实施例中,所述质粒载体进一步包括所述多克隆位点之后的poly A序列。在一些实施例中,所述质粒载体进一步包括用于体外表达所述一个或多个转基因的处于所述多克隆位点上游的另外的启动子。在一些实施例中,用于体外表达的所述另外的启动子是T7启动子。在一些实施例中,所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。在一些实施例中,所述复制起点是pBR322Ori。在一些实施例中,用于表达所述转基因的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。在一些实施例中,(b)的所述真核启动子是巨细胞病毒(CMV)启动子。在一些实施例中,所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。在一些实施例中,所述可选择标志物是抗生素抗性基因。在一些实施例中,所述可选择标志物是杀稻瘟菌素S脱氨酶。在一些实施例中,所述可选择标志物是荧光蛋白。在一些实施例中,所述荧光蛋白是近红外荧光蛋白。在一些实施例中,编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。在一些实施例中,编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。在一些实施例中,所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。在一些实施例中,所述上游同源臂插入位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。在一些实施例中,所述下游同源臂插入位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。在一些实施例中,所述载体具有SEQ ID NO:2中列出的核苷酸序列。在一些实施例中,所述质粒载体进一步包括插入在所述多克隆位点处的转基因。在一些实施例中,所述转基因编码治疗性蛋白质或治疗性RNA。在一些实施例中,所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。在一些实施例中,所述转基因核酸的长度范围为约5kb到300kb。
在一些实施例中,本文提供了用于基因表达的方法。在一些实施例中,所述方法包括:用本文提供的质粒载体转染真核细胞,所述质粒载体进一步包括插入在所述多克隆位点处的转基因;以及在适合于所述转基因表达的条件下培养所述细胞。
在某些实施例中,本文也提供了用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:(a)将以下引入到哺乳动物细胞中:(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及(ii)本文提供的质粒载体,所述质粒载体进一步包括插入在所述多克隆位点处的转基因,所述多克隆位点处于插入在所述上游同源臂插入位点处的上游同源臂和插入在所述下游同源臂处的下游同源臂的侧翼;以及(b)选择包括所述靶基因组基因座上的所述转基因的靶向哺乳动物细胞。在一些实施例中,所述细胞通过检测所述可选择标志物来选择。在一些实施例中,所述哺乳动物细胞是多能细胞。在一些实施例中,所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。在一些实施例中,所述哺乳动物细胞是人成纤维细胞。在一些实施例中,所述哺乳动物细胞是人胚肾细胞(HEK)293。在一些实施例中,所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。在一些实施例中,所述哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。在一些实施例中,所述哺乳动物细胞是永生化的非洲绿猴(COS)细胞。在一些实施例中,将所述转基因整合到所述靶基因组基因座中代替所述基因组中的所述至少一种人类疾病等位基因。在一些实施例中,所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。在一些实施例中,所述核酸酶试剂是编码核酸酶的mRNA。在一些实施例中,所述核酸酶是锌指核酸酶(ZFN)。在一些实施例中,所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。在一些实施例中,所述核酸酶是大范围核酸酶。在一些实施例中,所述核酸酶是Cas9核酸酶。在一些实施例中,所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。在一些实施例中,所述靶序列是AAV1整合位点。在一些实施例中,用于整合所述转基因的所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。在一些实施例中,所整合的所述转基因核酸的长度范围为约5kb到300kb。
在一些实施例中,本文提供的质粒载体选自pDK、pDK 9-1、pDK9-2和pDK9-3_Puro、pDK9-3_Neo。在一些实施例中,本文提供的质粒载体包括转基因。在一些实施例中,所述质粒载体包括因子VIII(FVIII)转基因、B结构域缺失的因子VIII(FVIII-BDD)转基因或苯丙氨酸羟化酶(PAH)转基因。在一些实施例中,所述质粒载体选自pDK9-2_FVIII-BDD和pDK9-2_PAH。
在一些实施例中,本文提供的质粒载体是包括用于将核酸整合到基因组中的左同源臂和右同源臂的靶向载体。在一些实施例中,作为靶向载体的所述质粒载体是pDK9-2_AAVS1Targeted。在一些实施例中,作为靶向载体的所述质粒载体包括转基因。在一些实施例中,作为靶向载体的所述质粒载体包括FVIII转基因、FVIII-BDD转基因或PAH转基因。在一些实施例中,作为靶向载体的所述质粒载体选自pDK9-2_PAH_AAVS1Targeted和pDK9-2_FVIII-BDD_AAVS1Targeted。
在一些实施例中,提供了用于产生本文提供的pDK表达载体的中间载体。在一些实施例中,中间载体选自pDK7-1和pDK8-1。
附图说明
图1展示了本文提供的载体的示意图,所述示意图示出了pDK载体技术的各种特征。
图2展示了示例载体pDK9-2的示意图。
图3展示了用与pDK-PAH相比的pcDNA-PAH转染的293T细胞中的PAH基因的瞬时表达水平。示出了用抗PAH或抗GAPDH抗体探测的细胞裂解物的Western印迹(Western blot)。
图4展示了用与pDK-PAH相比并且被选择用于稳定整合的pcDNA-PAH转染的293T细胞中的PAH基因的稳定表达水平。示出了用抗PAH或抗GAPDH抗体探测的细胞裂解物的Western印迹。
图5展示了用与pcDNA-FVIII-BDD或空质粒相比的pDK-FVIII-BDD转染的293T细胞中的FVIII-BDD基因的瞬时表达水平。示出了用抗因子VIII C-结构域抗体探测的细胞裂解物的Western印迹。
图6展示了使用Cas9系统组合靶向载体pDK-PAH-AAV1、pDK-FVIII-BDD-AAV1、pcDNA-PAH-AAV1或pcDNA-FVIII-BDD-AAV1在AAV1整合位点处使用靶向整合在293或人脂肪来源干细胞(hADSC)中得到的稳定整合克隆的数目。
图7展示了起始载体pCI-neo(普洛麦格(Promega))的示意图。
图8展示了中间载体pDK7-1的示意图。
图9展示了中间载体pDK8-1的示意图。
图10展示了中间载体pDK9-1的示意图。
图11展示了载体pDK9-2(杀稻瘟菌素)的示意图。
图12展示了载体pDK9-3_Puro的示意图。
图13展示了载体pDK9-3_Neo的示意图。
图14展示了载体pDK9-2_FVIII-BDD的示意图。
图15展示了载体pcDNA6_FVIII-BDD的示意图。
图16展示了载体pDK9-2_PAH的示意图。
图17展示了载体pcDNA6_PAH的示意图。
图18展示了载体pDK9-2_AAVS1Targeted的示意图。
图19展示了载体pDK9-2_PAH_AAVS1Targeted的示意图。
图20展示了载体pDK9-2_FVIIIBDD_AAVS1Targeted的示意图。
图21展示了载体pcDNA6-PAH_AAVS1Targeted的示意图。
图22展示了载体pcDNA6-FVIIIBDD_AAVS1Targeted的示意图。
图23展示了载体pDK-Streamline(在本文中也称为pDK)的示意图。
图24展示了载体pDK-Streamline的示意图,其中圈出了表达载体主启动子位置。
图25展示了载体pDK-Streamline的示意图,其中圈出了可选择的杂合启动子位置。
图26展示了载体pDK-Streamline的示意图,其中圈出了左同源插入位点和右同源插入位点。
图27展示了载体pDK-Streamline的示意图,其中圈出了人工剪接位点。
图28展示了载体pDK-Streamline的示意图,其中圈出了T7启动子位置。
图29展示了载体pDK-Streamline的示意图,其中圈出了载体的两个表达盒部分。
图30A-30B:图30A展示了载体pDK-Streamline的示意图,其中圈出了用于细菌和哺乳动物选择的表达盒。图30B展示了可商购自英杰公司的包含单独的细菌可选择标志物和哺乳动物可选择标志物的载体的示意图。圈出了单独的细菌可选择标志物和哺乳动物可选择标志物。应注意,所述商业载体比pDK-Streamline载体大了近2000bp。
图31是使用CRISPR技术插入(即,“敲入”)从包含同源臂的载体获得的序列的示意图。“之前”基因组中的黑色矩形表示CRISPR断裂位点的位置。一旦加入CRISPR,就会在CRISPR位点处发生双链断裂。载体的浅灰色矩形表示将插入到基因组中的序列,并且侧翼矩形与基因组中的断裂位点侧翼的区同源。新序列在断裂位点处插入到基因组中。只有在同源臂与断裂位点周围的序列相同时,此插入才有效。
图32A-32B:图32A展示了环形载体pDK-Streamline的示意图,其中箭头指向同源位点。图32B是图32A的线性表示。
图33示出了pDK-Streamline载体的线性表示,其中箭头指向可以使用酶共混物靶向的区。共混物可以用于去除或改变左臂或右臂同源结构域或者可以使用共混物来线性化环形载体。
图34展示了pDK-Streamline1-Blast(在本文中也称为pDK9-2;SEQ ID NO:2)的载体图谱。
图35展示了pDK-Streamline1-Puro(在本文中也称为pDK9-3_Puro;SEQ ID NO:4)的载体图谱。
图36展示了pDK-Streamline1-Neo(在本文中也称为pDK9-3_Neo;SEQ ID NO:3)的载体图谱。
具体实施方式
本文描述了用于通过瞬时转染或通过随机或靶向重组的稳定整合来表达一个或多个转基因的载体、组分和试剂盒。如本文所描述的,本发明技术部分基于以下观察:通过消除过量的非功能性序列可以增强传统质粒表达载体的能力和功效。通过对载体组装采取从头(de novo)方法,产生了紧凑的质粒表达载体,所述质粒表达载体以高度有序且空间高效的方式结合了进行高拷贝复制、高效基因表达、基因组整合和选择所需的元件。所述载体可以包含用于例如在原核生物和真核生物二者中具有选择功能的单个可选择标志物的原核复制、原核基因表达和真核基因表达的组分、用于细胞和无细胞环境中的一个或多个转基因的稳健表达的启动子以及如合成RNA剪接位点等用于增加蛋白质表达的其它元件。由于所述载体的碱基对大小较小——小于3.6kb,所以这些表达载体对转基因或多种转基因的较大型多核苷酸插入具有较高能力并且具有较长同源臂以实现稳定整合。本文提供的载体的一个非限制性实例是pDK9,其由SEQ ID NO:1中列出的核酸序列表示。在一些实施例中,所述载体的大小可以小于或不大于3.6kb,例如介于1.5kb与3.6kb之间,或其间的任何子值或子范围,并且可以包含端点。
I.定义
除非另外定义,否则本文使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的含义相同的含义。
本文使用的术语仅用于描述特定实施例的目的并且不旨在限制本发明。如本文所使用的,除非上下文另有明确指示,否则单数形式“一个/一种(a/an)”和“所述(the)”旨在同样包含复数形式。
如本文所使用的,术语“约”意味着值可以变化+/-20%、+/-15%、+/-10%或+/-5%并且仍处于本公开的范围内。
术语“包括”旨在意味着组合物和方法包含所叙述的元件,但不排除其它元件。当用于定义组合物和方法时,“基本上由……组成”应当意味着排除对组合具有任何重要意义的其它元件。例如,基本上由本文定义的元件组成的组合物不排除不会对所要求保护的主题的一个或多个基本特性和新颖特性产生实质影响的其它元件。“由……组成”应当意味着排除超过痕量的其它成分和所叙述大量方法步骤。由这些过渡术语中的每一个过渡术语定义的实施例处于本技术的范围内并且设想所述术语中的每个术语与本文描述的实施例中的任何实施例一起使用。
如本领域技术人员将理解的,出于任何和所有目的,特别是在提供书面描述方面,本文公开的所有范围还包含任何和所有可能的子值、子范围及其子范围的组合。任何列出的范围都可以容易地被识别为充分描述并且使得相同的范围被分解为至少相等的两份、三份、四份、五份、十份等。作为非限制性实例,本文讨论的每个范围可以容易地分解为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,如“最多”、“至少”、“大于”、“小于”等所有用语包含所引用的数字并且指的是可以随后分解成如上所讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包含每个单独的成员。因此,例如,具有1-3个细胞的组是指具有1个、2个或3个细胞的组。类似地,具有1-5个细胞的组是指具有1个、2个、3个、4个或5个细胞的组,等等。
另外,在根据马库什群组描述本公开的特征或方面的情况下,本领域技术人员将认识到,本公开也因此以马库什群组的任何单个成员或成员子群的形式进行描述。
如本文所使用的,术语“分离的”,“纯化的”或“基本上纯化的”是指如核酸分子或多肽等从其天然环境中移除、被分离或分开并且至少60%不含、优选地75%不含并且最优选地90%不含与它们天然相关的其它组分的分子。因此,分离的分子是基本上纯化的分子。
术语“同一性”和“相同的”是指序列之间的同一性程度。可以存在部分同一性或完全同一性。部分相同的序列是与另一个序列小于100%相同的序列。部分相同的序列可以具有至少70%或至少75%、至少80%或至少85%、或至少90%或至少95%的总体同一性。
如本文所使用的术语“可检测标记”是指与探针相关的分子或化合物或一组分子或一组化合物并且用于标识与核酸分子杂交的探针,如基因组核酸分子、RNA核酸分子、cDNA分子或参考核酸。
如本文所使用的,术语“检测”是指观察来自用于指示靶标的存在的可检测标记的信号。更具体地,检测用于检测靶核酸分子的具体序列的上下文中。在检测来自用于指示样品中靶核酸的存在的可检测标记的信号的上下文中使用的术语“检测”不需要所述方法提供100%灵敏度和/或100%特异性。优选至少50%的灵敏度;但更优选至少60%、至少70%、至少80%、至少90%或至少99%的灵敏度。优选至少50%的特异性;但更优选至少60%、至少70%、至少80%、至少90%或至少99%的灵敏度。检测还包含产生假阳性和假阴性的测定。假阴性率可以是1%、5%、10%、15%、20%或甚至更高。假阳性率可以是1%、5%、10%、15%、20%或甚至更高。
如本文所使用的,术语“扩增(amplification和amplify)”包含用于复制或再现具有具体序列的靶核酸分子,从而增加样品中的拷贝数目或核酸序列量的所有方法。扩增可以是指数式的或线性的。靶核酸可以是DNA或RNA。以此方式扩增的靶核酸在本文中称为“扩增子”。虽然本文所描述的说明性方法涉及使用聚合酶链式反应(PCR)进行扩增,但是本领域中已知用于扩增核酸的许多其它方法,如但不限于等温法、滚环法等。技术人员应理解,这些其它方法可以用于代替PCR方法或与PCR方法结合使用。参见例如Saiki,《PCR方案(PCRProtocols)》(编者Innis等人,美国学术出版社(Academic Press),加利福尼亚州圣地亚哥,1990,第13-20页)中的“基因组DNA的扩增(Amplification of Genomic DNA)”;Wharam等人,《核酸研究(Nucleic Acids Res.)》,2001年6月1日;29(11):E54-E54;Hafner等人,《生物技术(Biotechniques)》,2001年4月;30(4):852-6,858,860;Zhong等人,《生物技术》,2001年4月;30(4):852-6,858,860;上述文献中的每一个文献通过引用整体并入本文。
如本文所使用的,术语“寡核苷酸”是指由脱氧核糖核苷酸、核糖核苷酸或其任何组合构成的短核酸聚合物。寡核苷酸的长度通常介于约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个或30到约150个核苷酸(nt)之间,更优选地长度为约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个或30到约70个nt。根据本文所描述的和本领域中众所周知的方法,寡核苷酸可以用作引物或探针。
如本文所使用的,对核酸具有“特异性”的寡核苷酸是在适当的杂交或洗涤条件下能够与感兴趣的靶标杂交并且基本上不与不感兴趣的核酸杂交的寡核苷酸。更高水平的序列同一性是优选的并且包含至少75%、至少80%、至少85%、至少90%、至少95%并且更优选地至少98%的序列同一性。可以使用具有采用本领域公知的算法的默认设置的可商购的计算机程序来确定序列同一性。
用于核酸扩增的“引物”是特异性地退火为靶核苷酸序列并且导致在DNA或RNA聚合酶的存在下向所述引物的3'末端添加核苷酸的寡核苷酸。如本领域已知的,所述引物的3'核苷酸通常应与对应核苷酸位置处的靶核酸序列相同以实现最佳表达和扩增。如本文所用的术语“引物”包含可以合成的所有形式的引物,包含但不限于肽核酸引物、锁核酸引物、硫代磷酸酯修饰的引物、标记的引物等。引物可以是天然存在的、或从生物样品中纯化而来的或来自限制性消化(restriction digest)的或通过合成产生的。在一些实施例中,引物的长度可为约15-100个核苷酸,通常为15-25个核苷酸。引物的确切长度将取决于许多因素,包含杂交和聚合温度、引物来源和所用方法。例如,对于诊断应用,根据靶序列的复杂性,寡核苷酸引物通常包含15-25个或更多个核苷酸,但是所述引物可以包含更少或更多的核苷酸。确定引物的适当长度时涉及的因素是本领域普通技术人员容易知道的。本领域的技术人员应理解,术语“正向引物”和“反向引物”通常是指与位于靶核酸侧翼并且用于靶核酸扩增的序列互补的引物。通常,“正向引物”是与DNA的反义链互补的引物,并且“反向引物”与DNA的有义链互补。
如本文所使用的,“探针”是指具有或包含与另一种多核苷酸,例如靶多核苷酸或另一种寡核苷酸互补的序列的一类寡核苷酸。本文所描述的方法中所用的探针的理想长度为小于或等于500个核苷酸,通常介于约10个核苷酸到约100个核苷酸之间,例如约15个核苷酸到约40个核苷酸。本文所描述的方法中所用的探针通常用于通过与靶核酸特异性杂交来检测靶核酸序列。靶核酸包含例如如本文所描述的基因组核酸、经过表达的核酸、经过逆转录的核酸、重组核酸、合成核酸、扩增产物或延伸产物。
有关多核苷酸(即,如寡核苷酸或靶核酸等核苷酸序列)的术语“互补(complement)”,“互补的(complementary)”或“互补性(complementarity)”是指标准沃森/克里克配对规则(Watson/Crick pairing rules)。使得一个序列的5'末端与另一个序列的3'末端配对的核酸序列互补处于“反向平行相关”。例如,序列“5'-A-G-T-3'”与序列“3'-T-C-A-5'”互补。本文所描述的核酸中可以包含天然核酸中不常见的某些碱基;这些碱基包含例如肌苷、7-脱氮鸟嘌呤、锁核酸(LNA)和肽核酸(PNA)。互补不需要是完美的;稳定双链体可以包含错配的碱基对、简并碱基或不匹配的碱基。核酸技术领域的技术人员可以通过考虑多个变量凭经验确定双链体稳定性,所述变量包含例如寡核苷酸的长度、寡核苷酸的碱基组成和序列、离子强度和错配碱基对的发生率。
如本文所使用的,术语向受试者“施用”药剂包含将药剂引入或递送至受试者以发挥其预期功能的任何途径。可以通过任何合适的途径进行施用,包含静脉内、肌肉内、腹腔内或皮下施用。施用包含自我施用和由另一个人施用。
术语“氨基酸”是指天然存在的氨基酸和非天然存在的氨基酸,以及以与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然编码的氨基酸是20种常见氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)以及吡咯赖氨酸和硒半胱氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同基本化学结构的试剂,即,与氢、羧基、氨基和R基结合的α碳,如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。这种类似物具有经过修饰的R基(如正亮氨酸)或经过修饰的肽骨架,但保留了与天然存在的氨基酸相同的基本化学结构。在一些实施例中,形成多肽的氨基酸为D型。在一些实施例中,形成多肽的氨基酸为L型。在一些实施例中,形成多肽的第一多个氨基酸为D型,并且第二多个氨基酸为L型。
氨基酸在本文通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号来表示。同样,核苷酸通过其普遍接受的单字母代码来表示。
在本文中互换使用术语“多肽”、“肽”和“蛋白质”来指氨基酸残基的聚合物。所述术语适用于天然存在的氨基酸聚合物以及其中一个或多个氨基酸残基是非天然存在的氨基酸的氨基酸聚合物,例如,氨基酸类似物。所述术语包含任何长度的氨基酸链,包含全长蛋白质,其中通过共价肽键连接氨基酸残基。
如本文所使用的,“对照”是出于比较目的在实验中使用的替代样品。对照可以是“阳性的”或“阴性的”。例如,当实验的目的是确定治疗剂对特定类型疾病的治疗功效的相关性时,通常采用阳性对照(表现出期望的治疗效果的已知组合物)和阴性对照(未接受治疗或接受空白对照剂的受试者或样品)。
如本文所使用的,术语“有效量”或“治疗有效量”是指足以实现期望的治疗效果的药剂量。在治疗应用的上下文中,施用于受试者的治疗性肽的量可以取决于感染的类型和严重程度以及如总体健康状况、年龄、性别、体重和对药物的耐受性等个体的特性。它还可以取决于疾病的程度、严重程度和类型。本领域技术人员将能够根据这些和其它因素确定合适的剂量。
如本文所使用的,术语“表达”是指多核苷酸转录成mRNA的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸源自基因组DNA,则表达可以包含在真核细胞中剪接mRNA。可以通过测量细胞或组织样品中mRNA或蛋白质的量来确定基因的表达水平。一方面,可以将来自一个样品的基因的表达水平与来自对照样品或参照样品的那个基因的表达水平直接进行比较。另一方面,可以将来自一个样品的基因的表达水平与来自施用本文公开的组合物后的相同样品的那个基因的表达水平直接进行比较。术语“表达”还指一个或多个以下事件:(1)从细胞内的DNA序列(例如通过转录)产生RNA模板;(2)在细胞内(例如,通过剪接、编辑、5'帽形成和/或3'末端形成)处理RNA转录物;(3)在细胞内将RNA序列翻译成多肽或蛋白质;(4)在细胞内对翻译后的多肽或蛋白质进行修饰;(5)在细胞表面上呈递多肽或蛋白质;以及(6)从细胞中分泌或呈递或释放多肽或蛋白质。
术语“病患”、“受试者”,“个体”等在本文中可互换使用,并且是指动物,通常是哺乳动物。在优选的实施例中,病患、受试者或个体是哺乳动物。在特别优选的实施例中,病患、受试者或个体是人。在其它实施例中,动物可以是家畜(例如、狗、猫等)、农场动物(例如,牛、绵羊、猪、马等)或实验动物(例如,猴子、大鼠、小鼠,兔子、豚鼠等)。
如本文所使用的,术语“治疗(treating/treatment)”涵盖对如人等受试者的疾病的治疗,并且包含:(i)抑制疾病,即阻止其发展;(ii)缓解疾病,即引起疾病消退;(iii)减缓疾病的进展;和/或(iv)抑制、缓解或减缓疾病的一种或多种症状的进展。
还应了解,所描述的各种治疗或预防医学疾病和病症的方式旨在表示“基本的”,其包含完全的治疗或预防但也包含次于其的治疗或预防,并且其中实现了一些生物学或医学相关的结果。治疗可以是针对慢性疾病的连续长期治疗,或者是用于治疗急性病症的单次或几次施用。
如本文所使用的,术语“治疗的”是指治疗和/或预防。通过抑制、缓解或根除疾病状态来获得治疗效果。
II.质粒表达载体
本文提供的质粒表达载体包含质粒复制、基因表达和靶基因整合所需的核酸元件。所述质粒载体包含用于质粒增殖的细菌复制起点以及用于选择标志物和转基因的原核和/或真核基因表达的各种启动子,包含双启动子。另外的元件包含但不限于用于增加经过转录的RNA的稳定性和蛋白质表达的增强子,包含合成RNA剪接位点和polyA序列。本文提供的载体可以包含本文所描述的核酸元件中的一种或多种核酸元件。本文提供的载体的非限制性实例是pDK9。本文提供了对载体的特征的实例的非限制性描述。
在特定实施例中,本文提供了质粒载体,所述质粒载体包括:(a)原核复制起点;(b)上游同源臂插入位点;(c)适合于表达一个或多个转基因的真核启动子;(d)用于插入所述一个或多个转基因的多克隆位点;(e)编码可选择标志物的核酸,所述核酸可操作地连接到真核启动子和原核启动子,其中所述可选择标志物适合于原核选择和真核选择二者;以及(f)下游同源臂插入位点,其中元件(a)-(f)在所述质粒的5到3方向上顺序布置。
在特定实施例中,本文提供了质粒载体,所述质粒载体包括:(a)原核复制起点;(b)上游同源臂插入位点;(c)适合于表达一个或多个转基因的真核启动子;(d)用于插入所述一个或多个转基因的多克隆位点;(e)编码可选择标志物的核酸,所述核酸可操作地连接到包含真核启动子和原核启动子的双启动子,其中所述可选择标志物适合于原核选择和真核选择二者;以及(f)下游同源臂插入位点,其中元件(a)-(f)在所述质粒的5到3方向上顺序布置。
在特定实施例中,所述载体的长度不大于3.6千碱基。在一些实施例中,所述载体的长度为2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5或3.6千碱基。在一些实施例中,所述载体的长度为约2.8、约2.9、约3.0、约3.1、约3.2、约3.3、约3.4、约3.5或约3.6千碱基。
一些实施例涉及如本文阐述的载体核酸序列和载体核酸元件序列。一些实施例涉及SEQ ID NO:1-45。一些实施例涉及与本文所描述的序列中的任何序列具有70-99.9%的序列同一性的序列,包含其中的所有子范围和子值。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是70%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是75%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是80%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是85%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是90%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是91%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是92%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是93%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是94%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是95%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是96%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是97%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是98%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是99%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是99.5%。在实施例中,相比本文提供的序列中的任何序列,序列同一性可以是99.9%。在一些实施例中,与本文提供的序列具有百分比同一性的序列可以与天然序列或全长序列具有相同的功能。
用于确定序列同一性的方法是本领域所熟知的。用于确定序列同一性的非限制性实例包含具有默认参数的BLAST或BLAST 2.0序列比较算法或者通过手动比对和目视检查(参见,例如,NCBI网站ncbi.nlm.nih.gov/BLAST/等)。
在实施例中,所述原核复制起点不是F1起点。在实施例中,所述质粒载体恰好包含一个可选择标志物。例如,在一些实施例中,所述载体可以仅包含在原核或真核宿主中的任一者或两者中起作用的单个可选择标志物。
原核复制起点
通常,本文提供的载体包含如细菌复制起点等原核复制起点。用于如细菌等原核生物中的质粒增殖的复制起点的非限制性实例是本领域熟知的,包含例如pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101或pC101p-157。在特定实施例中,所述细菌复制起点是高拷贝数复制起点。在特定实施例中,所述细菌复制起点是pBR322复制起点。在一些实施例中,所述起点还可以充当用于线性化载体的方便位置。
同源臂插入位点
为了将核酸靶向整合到宿主基因组中,质粒载体通常包括与靶区同源的核酸片段。将这些核酸片段称为同源臂并且插入待插入的核酸的任一侧。在本文提供的非限制性示例性质粒表达载体中,存在同源臂插入位点,其位于包含一个或多个转基因的插入位点(即多克隆位点)的表达盒的侧翼。在特定的实施例中,所述同源臂插入位点以相反方向位于高拷贝数原核复制起点的任一侧。此配置确保在重组期间高拷贝复制起点不会整合到宿主基因组中并且因此最小化不期望的整合效应。
同源臂插入位点包括稀有限制性位点。使用稀有限制性位点有助于克隆到载体中。在非限制性实例中,同源臂插入位点包括Swa1、SbfI、AscI和/或PmeI的限制性位点。在特定实例中,上游(或左)臂插入位点包括Swa1和/或SbfI限制性位点。在特定实例中,下游(或左)臂插入位点包括AscI和/或PmeI限制性位点。包含如SwaI或PmeI等平端切割器限制位点允许在待插入序列含有限制性位点的情况下将平端片段插入所述同源臂插入位点。
在一些实施例中,上游和/或下游插入位点可以容纳长度范围为约500碱基到约4千碱基,如例如长度为约500碱基到约3千碱基;如例如长度为约500碱基到约2千碱基;如例如长度为约1千碱基到约2千碱基的同源臂。
在一个实施例中,所述上游同源臂和所述下游同源臂的总计为至少10kb。在一个实施例中,所述上游同源臂的范围为约5kb到约100kb。在一个实施例中,所述下游同源臂的范围为约5kb到约100kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约5kb到约10kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约10kb到约20kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约20kb到约30kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约30kb到约40kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约40kb到约50kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约50kb到约60kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约60kb到约70kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约70kb到约80kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约80kb到约90kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约90kb到约100kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约100kb到约110kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约110kb到约120kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约120kb到约130kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约130kb到约140kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约140kb到约150kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约150kb到约160kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约160kb到约170kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约170kb到约180kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约180kb到约190kb。在一个实施例中,所述上游同源臂和所述下游同源臂的范围为约190kb到约200kb。
在一个实施例中,所述载体的所述同源臂源自BAC文库、粘粒文库或P1噬菌体文库。在一个实施例中,所述同源臂源自人或非人动物的基因组基因座。在一个实施例中,所述同源臂源自合成DNA。
在一些实施例中,所述质粒包含替代性位点特异性重组靶序列。位点特异性重组靶序列的非限制性实例包含但不限于loxP、lox511、lox2272、lox66、lox71、loxM2、lox5171、FRT、FRT11、FRT71、attp、att、FRT、rox及其位点特异性重组靶序列的组合。
用于转基因表达的真核启动子
本文提供的质粒载体包含用于表达一个或多个转基因的真核启动子。用于表达转基因的众多真核启动子是众所周知的。在将转基因插入到多克隆位点中之后,启动子被定位在质粒中以可操作地连接到编码转基因的核酸。通常,选择强启动子,使得在各种细胞和物种中产生一致且高水平的转基因表达。在需要低表达转基因的替代性实施例中,可以使用较弱的启动子。可以采用的真核启动子的非限制性实例包含但不限于哺乳动物启动子,包含病毒启动子。在一些实施例中,所述启动子是CMV启动子、EF1a启动子、SV40启动子、PGK1启动子、Ubc启动子、人β肌动蛋白启动子、CAG启动子、TRE启动子、UAS启动子、Ac5启动子、多角体蛋白启动子、RSV启动子、CaMKIIa启动子、GAL1启动子、GAL10启动子、TEF1启动子、GDS启动子、ADH1启动子、CaMV35S启动子、Ubi启动子、HSV TK启动子、H1启动子、U6启动子、fos启动子或E2F启动子。在一些实施例中,所述真核启动子是组织特异性启动子。在表达盒中使用组织特异性启动子可以限制不想要的转基因表达并且促进持久的转基因表达。在特定实施例中,所述启动子是病毒启动子。在特定实施例中,所述启动子是巨细胞病毒(CMV)启动子。
所述启动子可以是诱导型启动子。诱导型启动子的非限制性实例是金属硫蛋白启动子、alcA启动子(乙醇控制)、四环素调节的启动子TetR和TetR*(突变形式)、基于糖皮质激素受体(GR)的启动子、基于雌激素受体(ER)的启动子、基于蜕皮激素受体的启动子、基于各种类固醇/类视黄醇/甲状腺受体超家族的启动子、基于Xba1(细胞应激转录因子)的启动子和热诱导启动子(热休克蛋白超家族)。
在一些实施例中,所述载体另外包含用于转基因的无细胞表达的启动子。在一些实施例中,所述启动子是病毒启动子。在一些实施例中,所述启动子是病毒噬菌体启动子。在一些实施例中,所述病毒噬菌体启动子是T7或SP6聚合酶启动子。另外,为了引发无细胞转录反应,T7启动子位点可以充当用于对载体进行测序的引发位点。
在一些实施例中,载体包括合成剪接位点。合成剪接位点(在本文中也称为人工剪接位点)允许剪接经过转录的RNA并且在本领域中已经显示可以增加经过转录的RNA的稳定性,从而导致蛋白质表达增加。在一些实施例中,所述剪接位点源自真核基因。在一些实施例中,所述剪接位点基于真核基因的共有供体位点和共有受体位点。
所述合成剪接位点还可以起到创建用于插入可选择标志物的空间的作用。例如,可以将细菌可选择标志物插入到所述合成剪接位点中,并且将所述细菌可选择标志物剪接在真核细胞内。因此,在一些实施例中,所述合成剪接位点包含可选择标志物。在实施例中,可选择标志物是细菌可选择标志物。
可选择标志物
本文提供的质粒载体还包含可操作地连接到双启动子(在本文中也称为杂合启动子)的可选择标志物,所述双启动子用于所述可选择标志物的真核表达和原核表达。可以采用的真核启动子的非限制性实例包含但不限于哺乳动物启动子,包含病毒启动子。在一些实施例中,所述启动子是CMV启动子、EF1a启动子、SV40启动子、PGK1启动子、Ubc启动子、人β肌动蛋白启动子、CAG启动子、TRE启动子、UAS启动子、Ac5启动子、多角体蛋白启动子、RSV启动子、CaMKIIa启动子、GAL1启动子、GAL10启动子、TEF1启动子、GDS启动子、ADH1启动子、CaMV35S启动子、Ubi启动子、HSV TK启动子、H1启动子、U6启动子、fos启动子或E2F启动子。在特定实施例中,用于表达可选择标志物的真核启动子是SV40。在一些实施例中,所述双启动子是用于真核表达和原核表达的通用启动子。可以采用的原核启动子的非限制性实例包含但不限于T7、T7lac、SP6、araBAD、trp、lac、Ptac和pL。在一些实施例中,所述原核启动子是EM7。在一些实施例中,所述原核启动子是P3细菌启动子。
可以构建双启动子,使得真核启动子的DNA序列是原核启动子的DNA序列的5'。可替代地,可以构建双启动子,使得原核启动子的DNA序列是真核启动子的DNA序列的5'。因此,在实施例中,所述双启动子包含位于原核启动子5'的真核启动子。在其它实施方案中,所述双启动子包含位于真核启动子5'的原核启动子。
在某些实例中,真核启动子DNA和原核启动子DNA可以具有同源区。可以利用这些同源区来减小双启动子的总长度,从而减小质粒载体的总大小。例如,如果真核启动子的3'末端包含与原核启动子5'末端相同的核酸序列,则真核启动子的3'末端可以用作原核启动子的5'末端,或者可替代地,原核启动子的5'末端可以用作真核启动子的3'末端。在实施例中,所述双启动子包含SEQ ID NO:45的序列。在实施例中,所述双启动子是SEQ ID NO:45的序列。
各种可选择标志物在本领域是已知的。在此处的特定实施例中,可选择标志物被选择为使得其在细菌和真核宿主系统中提供选择。在一些实施例中,可选择标志物是酶。可选择标志物的非限制性实例包含但不限于如杀稻瘟菌素S脱氨酶(bs)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰转移酶(puror)、新霉素磷酸转移酶(neor)、黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt)和单纯疱疹病毒胸苷激酶(HSV-k)等抗生素抗性基因。在实施例中,可选择标志物是杀稻瘟菌素S脱氨酶。在实施例中,可选择标志物是嘌呤霉素-N-乙酰转移酶。在实施例中,可选择标志物是新霉素磷酸转移酶。
可以向载体中添加另外的细菌抗生素抗性基因,但其并不是必需的。如上所描述的,可以将所述细菌抗生素抗性基因插入到合成剪接位点中。在一些实施例中,质粒载体包含位于例如合成剪接位点内的另外的可选择标志物。通常,质粒不包含另外的特异性细菌抗生素抗性基因以最小化抗性基因占用的序列空间的量,这可能影响载体的容量。在其它实施例中,不包括另外的可选择标志物,所述另外的可选择标志物未可操作地连接到双启动子或者位于合成剪接位点内。
在一些实施例中,所述可选择标志物包括荧光蛋白。荧光蛋白可以用于跟踪活细胞和动物中的表达。在一些实施例中,所述荧光蛋白选自由以下组成的组:近红外荧光蛋白(NirFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(EYFP)、祖母绿荧光蛋白、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(EGFP)、CyPet、青色荧光蛋白(CFP)、蔚蓝色(Cerulean)荧光蛋白和T-天蓝色(T-Sapphire)荧光蛋白。
在一些实施例中,可选择标志物是选自LacZ、荧光素酶和碱性磷酸酶的酶。包含其它荧光蛋白、生物发光蛋白和酶的其它可选择标志物是本领域已知的。可以将编码任何这些蛋白质的核酸结合到所提供的质粒表达载体中。可选择标志物的组合包含本文公开的和/或本领域已知的两种或更多种可选择标志物。在一些实施例中,在相同的转录物上编码所述两种或更多种可选择标志物,通过使用例如载体中的IRES位点或2A肽序列进行分离。在一些实施例中,所述可选择标志物是两种或更多种可选择标志物的融合蛋白。
用于插入的示例转基因
在特定实施例中,对本文提供的质粒表达载体进行修饰以包括插入上文描述的用于转基因表达的启动子下游的多克隆位点的一个或多个转基因。所述多克隆位点是包含有意聚集的限制性位点的载体序列区,所述限制性位点可用于一个或多个转基因的准备插入。在一些实施例中,通过病毒2A自切割核糖体跳跃序列或用于多顺反子核酸序列表达的内部核糖体进入位点(IRES)来分离所述两个或更多个转基因。
转基因可以是真核细胞的任何内源性或外源性多核苷酸。在一些实施例中,所述转基因编码包含多肽或RNA的基因产物。在一些实施例中,所述转基因与疾病或病症相关。在一些实施例中,所述转基因编码可用于治疗疾病或病症的治疗性蛋白质或RNA。
在一些实施例中,所述转基因插入的大小范围为约5kb到约300kb。在一个实施例中,所述转基因为约5kb到约200kb。在一个实施例中,所述转基因为约5kb到约150kb。在一个实施例中,所述转基因为约5kb到约100kb。在一个实施例中,所述转基因为约5kb到约50kb。在一个实施例中,所述转基因为约5kb到约10kb。在一个实施例中,所述转基因插入为约10kb到约20kb。在一个实施例中,所述转基因插入为约20kb到约30kb。在一个实施例中,所述转基因插入为约30kb到约40kb。在一个实施例中,所述转基因插入为约40kb到约50kb。在一个实施例中,所述转基因插入为约60kb到约70kb。在一个实施例中,所述转基因插入为约80kb到约90kb。在一个实施例中,所述转基因插入为约90kb到约100kb。在一个实施例中,所述转基因插入为约100kb到约110kb。在一个实施例中,所述转基因插入为约120kb到约130kb。在一个实施例中,所述转基因插入为约130kb到约140kb。在一个实施例中,所述转基因插入为约140kb到约150kb。在一个实施例中,所述转基因插入为约150kb到约160kb。在一个实施例中,所述转基因插入为约160kb到约170kb。在一个实施例中,所述转基因插入为约170kb到约180kb。在一个实施例中,所述转基因插入为约180kb到约190kb。在一个实施例中,所述转基因插入为约190kb到约200kb。在一个实施例中,所述转基因插入为约200kb到约210kb。在一个实施例中,所述转基因插入为约220kb到约230kb。在一个实施例中,所述转基因插入为约230kb到约240kb。在一个实施例中,所述转基因插入为约240kb到约250kb。在一个实施例中,所述转基因插入为约250kb到约260kb。在一个实施例中,所述转基因插入为约260kb到约270kb。在一个实施例中,所述转基因插入为约270kb到约280kb。在一个实施例中,所述转基因插入为约280kb到约290kb。在一个实施例中,所述转基因插入为约290kb到约300kb。
可以使用本文提供的载体表达的转基因的非限制性实例包含抗体、生长因子、转录因子、激素、免疫调节分子、抗癌基因、细胞因子、趋化因子、共刺激分子、蛋白质配体、肿瘤抑制因子、毒素和细胞抑制蛋白。在特定实施例中,所述转基因是FVIII、FVIII-BDD或PAH。在特定实施例中,所述转基因编码用2a肽分离的抗体的重链和轻链。用于插入本文提供的载体中的非限制性转基因可以在例如美国专利第8945839号、国际PCT申请公开第WO2013/163394号、第WO2013/0163394号和美国专利申请第20120192298A1号和第US20070042462号中找到,其通过引用整体并入本文。
在一些实施例中,所述转基因编码用于治疗疾病或病症的多个基因,其中用2A肽分离每个基因。在示例实施例中,所述转基因编码用于诱导多能干细胞(iPS)的多个基因。例如,在一些实施例中,所述转基因编码Oct4、Sox2、cMyc和/或Klf4中的一个或多个。
在一个实施例中,所述转基因包括编码人免疫球蛋白重链可变区氨基酸序列的基因组核酸序列。在一个实施例中,所述基因组核酸序列包括可操作地连接到免疫球蛋白重链恒定区核酸序列的未重排的人免疫球蛋白重链可变区核酸序列。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列是小鼠免疫球蛋白重链恒定区核酸序列或人免疫球蛋白重链恒定区核酸序列或其组合。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列选自由以下组成的组:CH1、铰链、CH2、CH3及其组合。在一个实施例中,所述重链恒定区核酸序列包括CH1-铰链-CH2-CH3。在一个实施例中,所述基因组核酸序列包括可操作地连接到免疫球蛋白重链恒定区核酸序列的重排的人免疫球蛋白重链可变区核酸序列。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列是小鼠免疫球蛋白重链恒定区核酸序列或人免疫球蛋白重链恒定区核酸序列或其组合。在一个实施例中,所述免疫球蛋白重链恒定区核酸序列选自由以下组成的组:CH1、铰链、CH2、CH3及其组合。在一个实施例中,所述重链恒定区核酸序列包括CH1-铰链-CH2-CH3。
在一个实施例中,所述转基因包括编码人免疫球蛋白轻链可变区氨基酸序列的基因组核酸序列。在一个实施例中,所述基因组核酸序列包括未重排的人λ和/或κ轻链可变区核酸序列。在一个实施例中,所述基因组核酸序列包括重排的人λ和/或轻链可变区核酸序列。在一个实施例中,所述未重排的或重排的λ和/或κ轻链可变区核酸序列可操作地连接到选自λ轻链恒定区核酸序和κ轻链恒定区核酸序列的小鼠或人免疫球蛋白轻链恒定区核酸序列。
在一个实施例中,所述转基因包括人核酸序列。在一个实施例中,所述人核酸序列编码胞外蛋白。在一个实施例中,所述人核酸序列编码用于受体的配体。在一个实施例中,所述配体是细胞因子。在一个实施例中,所述细胞因子是选自CCL、CXCL、CX3CL和XCL的趋化因子。在一个实施例中,所述细胞因子是肿瘤坏死因子(TNF)。在一个实施例中,所述细胞因子是白细胞介素(IL)。在一个实施例中,所述白细胞介素选自IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-19、IL-20、IL-21、IL-22、IL-23、IL-24、IL-25、IL-26、IL-27、IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35和IL-36。在一个实施例中,所述白细胞介素是IL-2。在一个实施例中,所述人基因组核酸序列编码细胞质蛋白。在一个实施例中,所述人基因组核酸序列编码膜蛋白。在一个实施例中,所述膜蛋白是受体。在一个实施例中,所述受体是细胞因子受体。在一个实施例中,所述细胞因子受体是白细胞介素受体。在一个实施例中,所述白细胞介素受体是白细胞介素2受体α。在一个实施例中,所述白细胞介素受体是白细胞介素2受体β。在一个实施例中,所述白细胞介素受体是白细胞介素2受体γ。在一个实施例中,所述人基因组核酸序列编码核蛋白。在一个实施例中,所述核蛋白是核受体。
在一个实施例中,所述转基因包括编码序列上的遗传修饰。在一个实施例中,所述遗传修饰包括编码序列的缺失突变。在一个实施例中,所述遗传修饰包括两个内源编码序列的融合。
在一个实施例中,所述转基因包括编码突变型人蛋白的人核酸序列。在一个实施例中,突变型人蛋白的特性在于改变的结合特性、改变的定位、改变的表达和/或改变的表达模式。在一个实施例中,所述人核酸序列包括至少一种人类疾病等位基因。在一个实施例中,所述人类疾病等位基因是神经疾病的等位基因。在一个实施例中,所述人类疾病等位基因是心血管疾病的等位基因。在一个实施例中,所述人类疾病等位基因是肾病的等位基因。在一个实施例中,所述人类疾病等位基因是肌肉疾病的等位基因。在一个实施例中,所述人类疾病等位基因是血液疾病的等位基因。在一个实施例中,所述人类疾病等位基因是致癌基因的等位基因。在一个实施例中,所述人类疾病等位基因是免疫系统疾病的等位基因。在一个实施例中,所述人类疾病等位基因是显性等位基因。在一个实施例中,所述人类疾病等位基因是隐性等位基因。在一个实施例中,所述人类疾病等位基因包括单核苷酸多态性(SNP)等位基因。
在一个实施例中,所述转基因包括调控序列。在一个实施例中,所述调控序列是启动子序列。在一个实施例中,所述调控序列是增强子序列。在一个实施例中,所述调控序列是转录阻遏物结合序列。在一个实施例中,所述插入核酸包括人核酸序列,其中所述人核酸序列包括非蛋白质编码序列的缺失,但不包括蛋白质编码序列的缺失。在一个实施例中,所述非蛋白质编码序列的所述缺失包括调控序列的缺失。在一个实施例中,所述调控元件的所述缺失包括启动子序列的缺失。在一个实施例中,所述调控元件的所述缺失包括增强子序列的缺失。
在原核细胞中的使用
在一些实施例中,载体可以用于细菌细胞中的蛋白质表达。一些实施例涉及本文所描述的载体和/或载体元件在原核细胞中的使用。例如,在一些实施例中,载体和/或组分可以用于转染原核细胞,包含在这类细胞中产生目的氨基酸序列。载体具有本文所描述的特征,包括例如,相对小的kb大小可以允许载体和/或组分与重组核酸序列一起使用以在原核细胞中产生氨基酸序列。可以使用任何合适的原核细胞。这类原核生物的非限制性实例包含如球菌、杆菌、螺旋体和弧菌等细菌。可以使用的细菌的非限制性实例包含大肠杆菌、假单胞菌、棒状菌(Corynebacteriaum)、乳酸菌、新月柄杆菌、亚比多球型红杆菌(Rodhobactersphaeroides)、游海假交替单胞菌、希瓦氏菌株Ac10、荧光假单胞菌、铜绿假单胞菌、伸长盐单胞菌、需盐色盐杆菌、变铅青链霉菌、灰色链霉菌、乳酸诺卡氏菌(Nocardia lactamdurans)、耻垢分枝杆菌、谷氨酸棒杆菌、产氨棒杆菌、乳酸发酵短杆菌、枯草芽孢杆菌、短芽孢杆菌、巨大芽孢杆菌、地衣芽孢杆菌、解淀粉芽孢杆菌、乳酸乳球菌、植物乳杆菌、干酪乳杆菌、罗伊氏乳杆菌和加氏乳杆菌。
III.用于同源重组的方法
在一些实施例中,本文提供的质粒表达载体用作同源重组的靶向载体。在一些实施例中,如序列特异性核酸酶等DNA结合蛋白用于在靶核酸序列中产生双链断裂。可以在靶核酸序列中产生一个或多个或多个双链断裂。在一个实施例中,从靶核酸序列中移除第一核酸序列并且将外源核酸序列(即转基因或含有转基因的表达盒)插入位于所述靶核酸序列的切割位点之间或切割末端之间的所述靶核酸序列中。根据某些方面,每个同源臂上的双链断裂如通过同源重组等增加或提高核酸序列插入或置换的效率。根据某些方面,多个双链断裂或切割位点提高了来自靶向载体的核酸序列的并入效率。
在示例实施例中,将本文提供的载体与编码核酸酶试剂的核酸序列一起引入真核细胞中,所述核酸酶试剂在靶基因座处或其附近产生单链或双链断裂。在一些实施例中,所述载体包括针对真核细胞基因组内的靶基因座的同源臂。在一个实施例中,所述同源臂源自人、非人动物、植物或真菌的基因组基因座。在一些实施例中,所述靶向载体的所述同源臂源自BAC文库、粘粒文库或P1噬菌体文库。在一个实施例中,所述同源臂源自合成DNA。在一些实施例中,通过来自靶源、寡核苷酸合成组装或从头核酸合成的同源臂的核酸扩增(例如PCR)来产生所述同源臂。
在一些实施例中,所述真核细胞是哺乳动物细胞。在一些实施例中,所述真核细胞是原代细胞。在一些实施例中,所述真核细胞是细胞系。细胞系的实例包含但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPa细胞、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRCS、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人胚胎成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalc1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因品种。
在一个实施例中,所述真核细胞是多能细胞。在一个实施例中,所述多能细胞是胚胎干(ES)细胞。在一个实施例中,所述多能细胞是非人ES细胞。在一个实施例中,所述多能细胞是诱导型多能干(iPS)细胞。在一些实施例中,所述诱导型多能(iPS)细胞源自成纤维细胞。在一些实施例中,所述诱导型多能(iPS)细胞源自人成纤维细胞。在一个实施例中,所述多能细胞是造血干细胞(HSC)。在一个实施例中,所述多能细胞是神经元干细胞(NSC)。在一个实施例中,所述多能细胞是外胚层干细胞。在一个实施例中,所述多能细胞是发育上受限的祖细胞。在一个实施例中,所述多能细胞是啮齿动物多能细胞。在一个实施例中,所述啮齿动物多能细胞是大鼠多能细胞。在一个实施例中,所述大鼠多能细胞是大鼠ES细胞。在一个实施例中,所述啮齿动物多能细胞是小鼠多能细胞。在一个实施例中,所述多能细胞是小鼠胚胎干(ES)细胞。
在一个实施例中,所述真核细胞是永生化小鼠或大鼠细胞。在一个实施例中,所述真核细胞是永生化的人细胞。在一些实施例中,所述真核细胞是人成纤维细胞。在一个实施例中,所述真核细胞是癌细胞。在一个实施例中,所述真核细胞是人癌细胞。
应理解,在一些实施例中,本文所描述的载体和组分可以用于在非哺乳类真核生物中产生氨基酸序列。这类真核生物的实例包含但不限于如酵母菌属(例如,酿酒酵母)和毕赤酵母属(例如,毕赤酵母)等酵母;如曲霉、木霉和毁丝霉(例如,嗜热毁丝霉)等真菌;如那些感染病毒的昆虫细胞(例如,如Sf9,Sf21和High Five菌株等杆状病毒感染的细胞)等。
可以通过本领域已知的用于将核酸引入细胞的任何合适方法将本文提供的载体引入细胞中。方法的实例包含但不限于转染、转导、病毒转导、显微注射、脂质转染、核转染、纳米颗粒轰击、转化、电穿孔或配合。
在一些实施例中,将核酸酶试剂与本文提供的靶向载体一起引入真核细胞中。在一个实施例中,在一段时间内将核酸酶试剂与靶向载体分开引入。在一个实施例中,在引入靶向载体之前引入核酸酶试剂。在一个实施例中,在引入靶向载体之后引入核酸酶试剂。
在一些实施例中,与单独使用靶向载体相比,组合使用靶向载体与核酸酶试剂导致靶向效率增加。在一个实施例中,与单独使用靶向载体相比,当靶向载体与核酸酶试剂结合使用时,所述靶向载体的靶向效率增加至少两倍。在一个实施例中,与单独使用靶向载体相比,当靶向载体与核酸酶试剂结合使用时,所述靶向载体的靶向效率增加至少三倍。在一个实施例中,与单独使用靶向载体相比,当靶向载体与核酸酶试剂结合使用时,靶向载体的靶向效率增加至少四倍。
在一个实施例中,所述核酸酶试剂是包括编码核酸酶的核酸序列的表达构建体,其中所述核酸序列可操作地连接到启动子。在一个实施例中,所述启动子是组成型活性启动子。在一个实施例中,所述启动子是诱导型启动子。在一个实施例中,所述核酸酶试剂是编码核酸内切酶的mRNA。
在一些实施例中,所述核酸酶试剂是锌指核酸酶(ZFN)。在一个实施例中,所述ZFN的每个单体包括3个或更多个基于锌指的DNA结合结构域,其中每个基于锌指的DNA结合结构域与3bp亚位点结合。在一个实施例中,所述ZFN是嵌合蛋白,其包括可操作地连接到独立核酸酶的基于锌指的DNA结合结构域。在一个实施例中,所述独立的核酸内切酶是Fokl核酸内切酶。在一个实施例中,所述核酸酶试剂包括第一ZFN和第二ZFN,其中所述第一ZFN和所述第二ZFN各自可操作地连接到Fokl核酸酶,其中所述第一ZFN和所述第二ZFN识别由约6bp到约40bp的切割位点分开的靶向DNA序列的每条链中的两个连续的靶向DNA序列,并且其中Fokl核酸酶二聚化并且产生双链断裂。
在一些实施例中,所述核酸酶试剂是类转录激活因子效应物核酸酶(TALEN)。在一个实施例中,TALEN的每个单体包包12-25个TAL重复,其中每个TAL重复与1bp亚位点结合。在一个实施例中,所述核酸酶试剂是嵌合蛋白,其包括可操作地连接到独立核酸酶的基于TAL重复的DNA结合结构域。在一个实施例中,所述独立的核酸酶是Fokl核酸内切酶。在一个实施例中,所述核酸酶试剂包括第一基于TAL重复的DNA结合结构域和第二基于TAL重复的DNA结合结构域,其中所述第一和所述第二基于TAL重复的DNA结合结构域各自可操作地连接到Fokl核酸酶,其中所述第一和所述第二基于TAL重复的DNA结合结构域识别由约6bp到约40bp切割位点分开的靶向DNA序列的每条链中的两个连续的靶向DNA序列,并且其中Fokl核酸酶二聚化并且在靶序列产生双链断裂。
在一些实施例中,本文提供的靶向载体与II型CRISPR系统组合使用以在宿主基因组中产生单链和/或双链断裂。在特定实施例中,如Cas9核酸酶等核酸酶由引导RNA引导到靶位点。引导RNA和核酸酶在DNA上形成共定位复合物,所述核酸酶在其上诱导靶DNA断裂。在示例实施例中,其中核酸酶是Cas9,所述Cas9通过由蛋白质中的两个催化结构域介导的过程在靶基因组中的原间隔序列临近基序(PAM)上游3bp处产生平末端双链断裂。
CRISPR酶的非限制性实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰版本。在一些实施例中,所述CRISPR酶是Cas9酶。在一些实施例中,所述Cas9酶是肺炎链球菌、化脓性链球菌或嗜热链球菌Cas9或这些生物体中的源性突变体。在一些实施例中,所述CRISPR酶经密码子优化以在真核细胞中表达。在一些实施例中,所述CRISPR酶在靶序列位置处引导一条链或两条链的切割。在一些实施例中,所述CRISPR酶缺乏DNA链切割活性。
用于使用各种核酸酶系统进行同源重组和基因编辑的方法的非限制性实例可以在例如美国专利第8945839号、国际PCT申请公开第WO2013/163394号和美国专利申请第2016/0060657号、第20120192298A1号和第US20070042462号中找到,其中的每一个通过引用整体并入本文。这些和任何其它已知的用于同源重组的方法可以与本文提供的质粒载体一起使用。
治疗应用
本文提供的表达载体可以用于转基因表达,所述转基因编码可用于治疗疾病或病症的治疗性蛋白质或RNA。在一些实施例中,所述载体用于患有基因组疾病(例如血友病A、苯丙酮尿症(PKU)、镰状细胞贫血症和β-地中海贫血、斯特格氏病(Stargardt disease)、杜氏肌营养不良症、囊胞性纤维症、尤塞氏病(Usher disease))的受试者的基因修复(例如,基因置换)或用于癌症抑制、HIV抗性、移植排斥和自身免疫的基因改变。在一些实施例中,所述载体用于表达受试者体内的治疗性蛋白质以治疗疾病或病症。例如,用于如抗体(例如,赫赛汀)、因子Xa抑制剂(例如,抗凝血剂)或用于增强愈合的生长因子(用于骨质疏松症的BGF)等治疗性蛋白质的表达盒。在一些实施例中,所述载体可以用于表达受试者体内的治疗性蛋白质构建体(例如,VEGF捕获剂;可溶性受体融合蛋白,其包括与IgG1FC片段融合的VEGF的受体1和2的用于治疗湿性AMD的膜外片段或用于治疗癌症或自身免疫疾病的抗体片段/构建体(如单链抗体))。美国专利第8945839号、国际PCT申请公开第WO2013/163394号以及美国专利申请第20120192298A1号和第US20070042462号中提供了通过基因置换和/或治疗性蛋白质及其相关基因的表达来治疗疾病和病症的非限制性实例,所述文献的每一个文献通过引用整体并入本文。在特定实施例中,本文提供的包括FVIII或FVIII-BDD转基因的质粒载体可以用于治疗血友病A;本文提供的包括苯丙氨酸羟化酶(PAH)转基因的质粒载体可以用于治疗苯丙酮尿症(PKU);本文提供的包括ABC4转基因的质粒载体可以用于治疗斯特格氏病;本文提供的包括小型肌营养不良蛋白转基因的质粒载体可以用于治疗杜氏肌营养不良症;本文提供的包括囊胞性纤维化跨膜受体(CFTR)转基因的质粒载体可以用于治疗囊胞性纤维症;本文提供的包括ABC4转基因的质粒载体可用于治疗斯特格氏病。
本文提供的载体可以通过任何合适的施用核酸的方法施用于受试者。
试剂盒
本文提供的载体或载体组分可包含于试剂盒中。在一些实施例中,设想所述试剂盒可以用于操控载体的组分(例如,改变同源臂、使载体线性化);扩增载体和/或促进同源重组。所述试剂盒可以包括例如如本文所描述的载体的各种组分中的一种或多种。通过对其合并和使用进行说明,可以一起或单独提供所述组分。所述组分的非限制性实例包含复制起点、启动子、限制性位点、poly A序列、选择启动子(包含如本文所描述的杂合启动子)、可选择标志物(包含在真核生物和原核生物中都起作用的标志物)、同源插入位点、用于促进整合或同源重组的组分(例如,CRISPR组分和材料或如本文所描述的其它材料)、RNA稳定剪接位点、T7启动子或用于无细胞表达的其它启动子等。另外的试剂盒组分可以包含但不限于本文所描述的生长培养基(例如,琼脂板);有和没有选择材料(例如,抗生素)、抗生素、原核和真核培养物(例如,细菌培养物、酵母培养物和哺乳动物细胞培养物)等。在一些方面,可以从试剂盒或载体中特异性地排除上文和本文其它处所描述的任何一种或多种组分。在一些方面,例如,试剂盒和载体可以特异性地排除一种或多种多于一种可选择标志物(例如,多于一种抗生素可选择标志物或多于一种抗生素;多于一种抗生素板或生长培养基)、F1复制起点、SV40复制起点等。
在一些实施例中,提供了包含本文提供的载体或组分的试剂盒,其包含其实施例以及含有抗生素或其它类型的可选择标志物的生长培养基。
试剂盒中提供的生长培养基可用于培养细胞(即,原核或真核细胞)并且进一步帮助确定哪些细胞通过包含抗生素或其它可选择标志物成功地摄取载体。本文提供的生长培养基(包含其实施例)可以与真核细胞一起使用。本文提供的生长培养基(包含其实施例)可以与原核细胞一起使用。
在实施例中,所述生长培养基是液体生长培养基、固体生长培养基或半固体生长培养基。在实施例中,所述生长培养基是琼脂。试剂盒可以包含预制琼脂板或含有抗生素的液体生长培养基。在实施例中,生长培养基中包含的抗生素是杀稻瘟菌素S、嘌呤霉素或新霉素。所述抗生素可以是限制或减少真核细胞和原核细胞生长的抗生素。
由于如细菌等原核细胞对某些抗生素天生更具抗性,因此试剂盒中提供的原核生长培养基中抗生素的浓度可以高于常用的浓度(例如5μg/ml的嘌呤霉素或10-20μg/ml的杀稻瘟菌素S),用于选择真核细胞以确保如果细胞未成功摄取载体,则将限制或杀死细菌宿主。在实施例中,抗生素的浓度可以在至少5μg/ml与150μg/ml之间,或其间的任何子值或子范围。例如,所述量可以是至少50μg/ml。在实施例中,所述抗生素的浓度为50μg/ml。在实施例中,所述抗生素的浓度至少为60μg/ml。在实施例中,所述抗生素的浓度为60μg/ml。在实施例中,所述抗生素的浓度至少为70μg/ml。在实施例中,所述抗生素的浓度为70μg/ml。在实施例中,所述抗生素的浓度至少为80μg/ml。在实施例中,所述抗生素的浓度为80μg/ml。在实施例中,所述抗生素的浓度至少为90μg/ml。在实施例中,所述抗生素的浓度为90μg/ml。在实施例中,所述抗生素的浓度至少为100μg/ml。在实施例中,所述抗生素的浓度为100μg/ml。
所述试剂盒还可以包含限制酶以促进复制起点的移除,从而使载体线性化或移除同源臂例如以进行置换。所述限制酶可以作为限制酶共混物提供,所述限制酶共混物靶向位于左同源臂、右同源臂的任一侧的限制性位点或位于复制起点侧翼的限制性位点。因此,在实施例中,所述试剂盒包含第一、第二和第三限制酶共混物。在实施例中,所述第一限制酶共混物可以包含例如用于限制性位点SwaI和SbfI的限制酶;所述第二限制酶共混物可以包含例如用于限制性位点AscI和PmeI的限制酶;并且所述第三限制酶共混物可以包含例如用于限制位点PmeI和SwaI的限制酶。
如上文所提及的,所述试剂盒还可以包含用于促进将载体同源重组到目的基因组位置的部分。CRISPR、TALEN和锌指核酸酶基因组编辑系统是用于在特定目的基因组区(例如,外显子、内含子、与疾病或病症相关的基因)处产生双链断裂的有用工具。
CRISPR系统(例如,II型系统)通常包含设计用于与CRISPR相关核酸内切酶(例如,Cas9)缔合的引导RNA(gRNA)并且其包含靶向(例如,结合)待修饰的基因组序列的靶核苷酸序列以及使DNA双链断裂的CRISPR相关核酸内切酶(例如,Cas9)。在实施例中,所述试剂盒进一步包含用于基因组编辑的II型CRISPR系统。
TALEN系统通常包含与FokI核酸酶融合的植物致病性黄单胞菌属的转录激活因子样(TAL)效应子。通过自定义TAL效应子中的多态性氨基酸重复来实现基因组靶向特异性。在实施例中,所述试剂盒进一步包含用于基因组编辑的TALEN系统。
锌指核酸酶系统通常包含含有两个功能结构域的锌指核酸酶。第一结构域是含有双指模块的DNA结合结构域,其中每个模块识别独特的DNA序列,并且融合形成锌指蛋白。第二结构域是包含FokI的核酸酶结构域的DNA切割结构域。所述第一结构域和所述第二结构域融合,从而产生在由锌指蛋白定义的靶基因组位置处切割双链DNA的复合物。在实施例中,所述试剂盒进一步包含用于基因组编辑的锌指核酸酶系统。
如上已经描述的,本文所描述的任何一个或多个试剂盒部分和组分可以包含在各个实施例中或明确排除在各个实施例之外。
实例
实例1、产生pDK9载体
在此实例中,提供了对用于产生示例载体pDK9的方法的描述。图2中提供了pDK9载体的示意图。pDK9载体的最终大小为3.3kb。pDK9载体的核酸序列的非限制性实例以SEQ IDNOS:1(pDK9-1)、2(pDK9-2)、3(pDK9-3_Neo)和4(pDK9-3_Puro)的形式提供。下文中描述了这些载体中的每一种载体的构建。
移除F1起点
通过PCR和切除连接来移除pCI-Neo载体(普洛麦格;SEQ ID NO:5)中的噬菌体F1复制起点。进行第一PCR以在起点的一侧扩增257碱基对产物并且包括多克隆位点的Not 1限制性位点和polyA位点,并且通过反向寡核苷酸在polyA位点后引入DraIII限制性位点。用以下引物扩增PCR产物:
正向引物:5'GACCCGGGCGGCCGCTTCCCTTTAGTGAGGGTTAA3'(SEQ ID NO:6)
反向引物:5'TGCTGCCACTCCGTGTACCACATTTGTAGAGGTTTTACTTGC3'(SEQ ID NO:7)
进行第二PCR以在起点的另一侧扩增396碱基对产物并且包括SV40启动子。通过正向寡核苷酸在SV40启动子之前引入DraIII限制性位点。所述产物还包括存在于SV40启动子末端的AvrII限制性位点。用以下引物扩增PCR产物:
正向引物:5'GTGGTACACGGAGTGGCAGCACCATGGCCTGAAATAACCTCT3'(SEQ ID NO:8)
反向引物:5'CAAAAGCCTAGGCCTCCAAAAAAGCCTCCTCAC 3'(SEQ ID NO:9)
用Not1和AvrII消化pCI-Neo;用NotI和DraIII消化PCR1产物;用DraIII和AvrII消化PCR2产物。然后进行3向连接以将PCR产物连接到切割的载体中。得到的载体移除了噬菌体F1起点并且被称为pDK7-1(SEQ ID NO:10)。
引入杀稻瘟菌素抗性基因
包含杀稻瘟菌素抗性基因的pcDNA6载体用Xma1消化、钝化并且重新连接以破坏Xma1位点。
进行第一PCR以从所得载体扩增包括AvrII位点的产物,所述AvrII位点包含引物中的EM7启动子。用以下引物扩增PCR产物:
正向引物:5'GGAGGCCTAGGCTTTTGCAAAAAGCTGAGC3'(SEQ ID NO:11)
反向引物:5'TCGTATTATACTATGCCGATATACTATGCCGATGATTAATTGTCAACACGTGCTG3'(SEQ ID NO:12)
进行第二PCR以通过杀稻瘟菌素抗性基因从寡核苷酸中的EM7启动子的重叠部分扩增到载体中的BstZ17I限制性位点。用以下引物扩增PCR产物:
正向引物:5'CAGCACGTGTTGACAATTAATCATCGGCATAGTATATCGGCATAGTATAATACGA 3'(SEQ ID NO:13)
反向引物:5'TCGACGGTATACAGACATGATAAGATACATTGATGAG 3'(SEQ ID NO:14)
将两种PCR产物连接在一起并且进行延伸以产生EM7杀稻瘟菌素插入物。
用AvrII和BsrBI消化pDK7-1,这移除新霉素抗性基因。用AvrII和BstZ17I消化EM7杀稻瘟菌素抗性插入物。然后将杀稻瘟菌素抗性插入物连接到切割的pDK7-1载体中以产生载体pDK8-1(SEQ ID NO:15)。BstZ17I和BsrBI是平端切割器,因此,将它们连接在一起会破坏这两个位点。
然后用BspHI消化pDK8-1并且重新连接以产生pDK9-1(SEQ ID NO:1)。
为同源臂添加8碱基切割器
进行PCR以在pDK9-1中从BspHI位点扩增到BglII位点,其包括pBR322复制起点。在正向寡聚引物中引入AscI和PmeI限制性位点。在反向寡聚引物中引入SwaI和SbfI限制性位点。
正向引物:5'TGAGTTTCATGAGGCGCGCCCGTCAGACCCGTTTAAACAGATCAAAGGATCTTCTTGAGA3'(SEQ ID NO:16)
反向引物:5'TATTGAAGATCTCCTGCAGGCAGGAACCGTATTTAAATCGCGTTGCTGGCGTTTTTCCAT3'(SEQ ID NO:17)
用BspHI和BglII消化pDK9-1载体和PCR产物并且进行连接以产生载体pDK9-2(SEQID NO:2)。
引入呤霉素抗性基因(杀稻瘟菌素抗性基因的替代物)
将作为杀稻瘟菌素抗性基因的替代物的嘌呤霉素抗性基因克隆到载体中
PCR用于组装嘌呤霉素抗性盒:
使用以下引物进行第一次PCR(PCR1)以通过SV40启动子/EM7启动子扩增AvrII并且包含与第二PCR(PCR2)的重叠部分:
正向引物:5'TTTGGAGGCCTAGGCTTTTGCAAAAAGCTCC3'(SEQ ID NO:18)
反向引物:5'GAGGCGCACCGTGGGCTTGTACTCGGTCATGGTGGCGTTTAGTTCCTCACCTTGTCG3'(SEQ ID NO:19)
使用以下引物进行第二PCR(PCR2)以从PCR1产物重叠部分扩增到对嘌呤霉素产生抗性的Nae1位点:
正向引物:5'GCATAGTATAATACGACAAGGTGAGGAACGCCACCATGATTGAACAAGATGGATTGCAC3'(SEQ ID NO:20)
反向引物:5'CATCCAGCCGGCTCAGGCACCGGGCTTGCGGGTC 3'(SEQ ID NO:21)
将PCR1产物和PCR2产物混合并在两端处通过PCR进行延伸以产生PCR产物3。
用AvrII和NaeI消化pDK9-2载体和PCR3的产物并且进行连接以产生载体pDK9-3Puro(SEQ ID NO:3)。
引入新霉素抗性(杀稻瘟菌素抗性基因的替代物)
将作为杀稻瘟菌素抗性基因的替代物的新霉素抗性基因克隆到载体中。
使用PCR以组装新霉素抗性盒:
使用以下引物进行第一次PCR(PCR1)以通过SV40启动子/EM7启动子扩增AvrII并且包含与第二PCR(PCR2)的重叠部分:
正向引物:5'TTTGGAGGCCTAGGCTTTTGCAAAAAGCTCC 3'(SEQ ID NO:22)
反向引物:5'GTGCAATCCATCTTGTTCAATCATGGTGGCGTTCCTCACCTTGTCGTATTATACTATGC3'(SEQ ID NO:23)
使用以下引物进行第二PCR(PCR2)以从PCR1产物重叠部分扩增到对新霉素产生抗性的Nae1位点:
正向引物:5'GCATAGTATAATACGACAAGGTGAGGAACGCCACCATGATTGAACAAGATGGATTGCAC3'(SEQ ID NO:24)
反向引物:5'CATCCAGCCGGCTCAGGCACCGGGCTTGCGGGTC 3'(SEQ ID NO:25)。
将PCR1产物和PCR2产物混合并在两端处通过PCR进行延伸以产生PCR产物3。
用AvrII和NaeI消化pDK9-2载体和PCR3的产物并且进行连接以产生载体pDK9-3Neo(SEQ ID NO:4)。
实例2、pDK-PAH载体的产生和表征
在此实例中,通过产生包括编码胞质蛋白苯丙氨酸羟化酶(PAH)(约1kb)的测试核酸的pDK9载体来评估pDK载体作为表达载体的能力。提供了对用于将编码PAH的核酸克隆到pDK9-2载体中的方法的描述。
载体构建
为了制备苯丙氨酸羟化酶(PAH)表达载体,从源自人肝脏的商业cDNA文库中通过PCR扩增PAH基因。正向引物包含EcoRI限制性位点和优化的Kozak序列并且反向引物包含终止密码子后的Not1限制性位点:
正向引物:5'AGCCTCGAGAATTCTAATAGGCCACCATGTCCACTGCGGTCCTGGAAAACCCAGGCTTGG 3'(SEQ ID NO:26)
反向引物:5'GGAAGCGGCCGCCTACTTTATTTTCTGGAGGGCACTGCAAAGGATTCCAATTTCACTG3'(SEQ ID NO:27)。
用EcoRI和NotI消化PCR产物和pDK9-2并且进行连接以产生pDK9-2-PAH。pDK-PAH质粒的最终大小为4.3kb。pDK-PAH载体的核酸序列如SEQ ID NO:28所提供的。
为了进行比较研究,将相同的PAH核酸克隆到pcDNA载体(英杰公司)中。用EcoRI和NotI消化PCR产物和pCDNA6并且进行连接以产生pCDNA6-PAH(SEQ ID NO:29)。pcDNA-PAH载体的最终大小为6.5kb。
瞬时表达研究
然后评估pDK-PAH载体在真核细胞中瞬时表达苯丙氨酸羟化酶的能力。
根据制造商的说明,使用293转染293T细胞。考虑到pcDNA-PAH比pDK-PAH大1.51倍,针对相等分子调整用于转染的DNA量。对转染1μg、2μg、5μg、10μg、20μg或25μg的pcDNA-PAH DNA和转染0.66μg、1.3μg、3.3μg、6.6μg、13.3μg或16.6μg的pDK-PAH DNA进行测定。
在转染后48小时,收取并裂解细胞。使用抗PAH和抗GAPDH对照抗体来通过Western印迹评估细胞裂解物。如图3所示,在这两种质粒的可比水平下,与pcDNA-PAH质粒相比,pDK-PAH质粒表达的PAH水平显著更高。
pDK-PAH质粒载体的稳定整合
如上所描述的转染并选择293T细胞用于PAH核酸的阳性整合。转染后48小时,转染的和未转染的(对照)细胞均以1:10的比例分裂并且置于杀稻瘟菌素S选择下(最终浓度为10μg/ml)。将细胞保持在所述选择下,直至所有对照细胞死亡(11天)。随机挑选来自每个转染群的细胞的10个抗性菌落并且在连续的杀稻瘟菌素S抗生素选择下使其扩增3周。裂解细胞并且如上所描述的测试每个克隆的标准化量用于PAH和GAPDH表达。
选择来自每次转染的十个随机整合稳定克隆用于分析PAH表达。如图4所示,与pcDNA-PAH转染细胞相比,pDK-PAH转染细胞显示出产生更一致且稳定的整合PAH核酸的能力。
实例3、pDK-因子VIII-BDD载体的产生和表征
在该实施例中,通过产生包括编码B结构域缺失的因子VIII(FVIII-BDD)的核酸的pDK9载体来评估pDK9载体作为用于大型核酸插入的表达载体的能力。提供了用于将编码FVIII-BDD(约6kb)的核酸克隆到pDK9-2载体中的方法的描述。
载体构建
pDK9-2-FVIIIBDD组装和pcDNA6-FVIIIBDD组装
从源自人肝脏的商业cDNA文库中通过PCR扩增FVIII-BDD基因(FVIII到最小B结构域)。正向引物包含Xho1限制性位点和优化的Kozak序列:
正向引物:5'AGGCTAGCCTCGAGGTAATAGGCCACCATGCAGATCGAGCTGTCCACCTGCTTTTTTCTG3'(SEQ ID NO:30)
反向引物:5'CAGGGTTGTCCGGGTGATCTCCCGCTGGTGACGCGTGCTGGACACATTCTTGCCCCAGCT3'(SEQ ID NO:31)。
使用以下引物进行第二PCR以从包含终止密码子和NotI位点(加入寡聚物中)的最小B结构域(与PCR1重叠)扩增:
正向引物:5'AGCTGGGGCAAGAATGTGTCCAGCACGCGTCACCAGCGGGAGATCACCCGGACAACCCTG 3'(SEQ ID NO:32)
反向引物:5'GGAAGCGGCCGCTCATCAGTACAGATCCTGGGCCTCACATCCCAGGACTTCCATCCTGAG3'(SEQ ID NO:33)。
将PCR1产物和PCR2产物混合并在两端处通过PCR进行延伸以产生PCR产物3。
用XhoI和NotI消化pDK9-2载体和PCR3的产物并且进行连接以产生载体pDK9-2-VFVIII-BDD。pDK-FVIII-BDD质粒载体的最终大小为9.0kb。pDK-FVIII-BDD载体的核酸序列如SEQ ID NO:34所提供的。
为了进行比较研究,将相同的FVIII-BDD核酸克隆到pcDNA载体(英杰公司)中。为了产生pCDNA6-FVIIIBDD,用Kpn1消化pCDNA6并且使其钝化。用XhoI消化PCR3的产物并且使其钝化。然后用Not1消化插入物和载体并且进行连接以产生pCDNA6-FVIIIBDD(SEQ ID NO:35)。pcDNA-FVIII-BDD载体的最终大小为11.3kb。由于尺寸大而难以产生该质粒载体。
瞬时表达研究
然后评估pDK-FVIII-BDD载体在真核细胞中瞬时表达FVIII-BDD的能力。
根据制造商的说明,使用293转染293T细胞。调整用于转染的DNA量用于相等分子的pcDNA-FVIII-BDD和pDK-FVIII-BDD。pcDNA-FVIII-BDD载体比pDK-FVIII-BDD载体大1.25倍。
在转染后5天,收取来自细胞的条件培养基。使用抗因子VIII C-结构域抗体来通过Western印迹评估条件培养基。如图5所示,在这两种质粒的可比水平下,与pcDNA-FVIII-BDD质粒相比,pDK-FVIII-BDD质粒表达的FVIIIBDD水平显著更高。
实例4、使用Cas9靶向整合稳定整合pDK-FVIII-BDD质粒载体
在此实例中,描述了使用Cas9靶向整合系统进行的稳定整合。
产生pDK-FVIIIBDD-AAV1和pDK-PAH-AAV1靶向载体
产生靶向AAV1整合位点的pDK-FVIIIBDD载体和pDK-PAH载体的同源靶向版本。
对于pDK9-2:
从293T和人脂肪来源干细胞(ADSC)制备基因组DNA。使用包含用于克隆的8个碱基限制性位点的引物从基因组DNA通过PCR扩增AAV1整合位点的同源臂。
左臂PCR:
正向引物:5'AGCAACGCGATTTAAATTGCTTTCTCTGACCAGCATTCTCTCCCCT 3'(SEQ IDNO:36)
反向引物:5'TGAAGATCTCCTGCAGGGCCCCACTGTGGGGTGGAGGGGACAGATAAAAGTA 3'(SEQ ID NO:37)。
右臂PCR:
正向引物:5'TACTCATGAGGCGCGCCACTACTAGGGACAGGATTGGTGACAGAAAAGCCCCA 3'(SEQ ID NO:38)
反向引物:5'TGATCTGTTTAAACAGAGCAGAGCCAGGAACACCTGTAGGGAAGGGGCA 3'(SEQID NO:39)。
对PCR产物进行测序并且发现其具有与所用的2种不同细胞系相同的序列。
用AscI和PmeI消化pDK9-2载体和右同源臂的PCR产物并且进行连接以产生pDK9-2_AAVS1R(中间载体)。
用SbfI和SwaI消化pDK9-2_AAVR1R载体和左同源臂的PCR产物并且进行连接以产生pDK9-2_AAVS1Targeted的载体(SEQ ID NO:40)。
为了产生pDK9-2_PAH_AAVS1Targeted载体(SEQ ID NO:41),用EcoRI和NotI消化实例2的PAH PCR产物和pDK9-2_AAVS1Targeted载体并且进行连接。
为了产生pDK9-2_FVIIIBDD_AAVS1Targeted载体(SEQ ID NO:42),用XhoI和NotI消化实例3的FVIIIBDD PCR产物和pDK9-2_AAVS1Targeted载体并且进行连接。
组装AAVS1靶向的pCDNA6-PAH载体
将左同源臂插入pcDNA6-PAH的SspI位点(实例2)。如上所描述的扩增左臂同源臂、用SbfI消化、钝化;并且然后用SwaI消化。用SspI消化pcDNA6-PAH。将消化的pcDNA6-PAH载体和左同源臂的PCR产物连接以产生pcDNA6-PAH_Left(临时载体)。
将右同源臂插入pcDNA6-PAH_Left载体的SapI位点。如上所描述的扩增左臂同源臂、用AscI消化、钝化;并且然后用PmeI消化。用SapI消化pcDNA6-PAH_Left并且使其钝化。将消化的pcDNA6-PAH_Left载体和右同源臂的PCR产物连接以产生pcDNA6-PAH_AAVS1Targeted载体(SEQ ID NO:43)。
组装AAVS1靶向的pCDNA6-FVIIIBDD载体
将左同源臂插入pcDNA6-FVIIIBDD的SspI位点(实例3)。如上所描述的扩增左臂同源臂、用SbfI消化、钝化;并且然后用SwaI消化。用SspI消化pcDNA6-FVIIIBDD。将消化的pcDNA6-FVIIIBDD载体和左同源臂的PCR产物连接以产生pcDNA6-FVIIIBDD_Left(临时载体)。
将右同源臂插入pcDNA6-FVIIIBDD_Left载体的BstZ17I位点。如上所描述的扩增左臂同源臂、用AscI消化、钝化;并且然后用PmeI消化。用BstZ17I消化pcDNA6-FVIIIBDD_Left。将消化的pcDNA6-FVIIIBDD_Left载体和右同源臂的PCR产物连接以产生pcDNA6-FVIIIBDD_AAVS1Targeted载体(SEQ ID NO:44)。
靶向载体的稳定整合
用表达Cas9的市售质粒DNA和靶向AAV1整合位点的指导RNA、来自复能基因(复能基因公司(Genecopia))的HCP-AAVS1-CG02和表达载体的同源靶向版本转染293T或人脂肪来源干细胞(hADSC)。用293CellFectin和1μg的HCP-AAVS1-CG02质粒;用或不用10μg的pcDNA-PAH_AAV1STargeted质粒或1μg的HCP-AAVS1-GC02;用或不用10μg的pcDNA-FVIIIBDD-AAVS1Targeted质粒或1μg的HCP-AAVS1-GC02以及用或不用7.7μg的pDK-PAH-AAVS1Targeted质粒或1μg的HCP-AAVS1-GC02以及用或或不用8.5μg的pDK-FVIIIBDD-AAVS1Targeted质粒转染293T细胞。
以与293T细胞类似的方式转染hADSC细胞,然而用Lipofectamine 3000代替293CellFectin。
选择细胞用于抗生素抗性并且为每个组合变体选择96个克隆。表达载体提供抗生素抗性,因此如果没有表达载,则在选择下无细胞存活。
为每个克隆制备基因组DNA并且通过在5'和3'侧的连接位点上进行聚合酶链式反应扩增(PCR)来测定整合。同源区外的一个基因组引物和来自载体源性序列的一个引物用于PCR反应。当这两侧产生指示存在靶向整合的扩增产物时,将细胞视作是阳性的。图6中提供了靶向整合的结果。如图6所示,pDK-FVIIIBDD-AAV1和pDK-PAH-AAV1比pcDNA载体产生显著更高的靶向整合成功率。
与人细胞(即真核细胞)相比,在细菌细胞中使用杂合启动子控制下的单个可选择标志物的选择需要更高水平的抗生素。对于真核细胞,1-10μg/ml的杀稻瘟菌素S足以选择成功摄取载体的细胞,并且1-5μg/ml的嘌呤霉素足以选择成功摄取载体的细胞。对于原核细胞,100μg/ml的杀稻瘟菌素S足以选择成功摄取载体的细胞,并且50-100μg/ml的嘌呤霉素足以选择成功摄取载体的细胞。
使用在杂合启动子控制下的单个可选择标志物进行的选择不同于传统的抗生素选择。如果细菌细胞没有摄取载体,则它们不会反应于抗生素而立即死亡。相反,细菌细胞的薄层或菌苔与已摄取载体的细菌细胞的强菌落一起存在。从薄层中选择的细胞不能在液体培养物中生长。该结果不依赖于所用细菌的类型。
应注意,TB培养基比LB培养基更好地用于培养。通常,成功摄取载体的细胞的产量很高。
实例5、用于在pDK9-2中交换表达启动子的方法
用HindIII和BglII消化pDK9-2载体以移除CMV增强子和启动子。可以插入任何合适的替代启动子以代替CMV增强子和启动子。非限制性实例包含:来自人、小鼠或鸡的β-肌动蛋白基因的启动子、泛素C基因的启动子或来自疱疹病毒的胸苷激酶基因的启动子。
实例6、用于在pDK9-2中交换poly A信号的方法
用NotI和TspGWI消化pDK9-2载体以移除SV40后期poly A信号。可以插入任何合适的替代Poly A信号以代替SV40后期poly A信号。非限制性实例包含:来自牛的生长激素Poly A信号和合成Poly A信号。
实例7、用于在pDK9-2中交换PBR322复制起点的方法
用AscI和SbfI消化pDK9-2载体以移除PBR322复制起点。可以插入任何合适的替代复制起点以代替PBR322复制起点。非限制性实例包含:P15A低拷贝数复制起点或pUC复制起点
实例8、pDK-Streamline载体
pDK-Streamline载体(图23)包含以下结构组分:表达载体主启动子、表达载体可选择标志物、用于同源臂的稀有8碱基限制性位点、增加蛋白质表达的RNA稳定剪接位点、用于细菌或无细胞表达的T7启动子以及用于RNA稳定性的poly A信号序列。pDK Streamline载体的主链可以是3.6kb或更小。
表达载体主启动子的非限制性实例(图24)包含CMV增强子和启动子、鸡β-肌动蛋白启动子和Ubc启动子。这些启动子各自提供独特的优势。CMV增强子和启动子是用于实现高水平蛋白质表达的病毒启动子,而鸡β-肌动蛋白启动子被视作是最强的“天然”启动子之一。Ubc启动子是表达泛素系统组分的启动子,其几乎在每种细胞类型中都具有活性。如本领域众所周知的,选择合适的启动子以驱动基因表达是细胞疗法成功的关键。pDK-Streamline载体旨在通过使用侧翼限制性位点让改变主要启动子变得容易。
表达载体可选择标志物具有较小的尺寸,部分原因是消除了细菌的单独可选择标志物。通过产生在原核生物(细菌)和真核生物(哺乳动物细胞)中都具有活性的杂合启动子(图25),在来自单个基因的两种环境中都存在抗生素抗性。pDK-Streamline载体可以包含3种可选择标志物之一:杀稻瘟菌素S脱氨酶、嘌呤霉素-N-乙酰转移酶和新霉素磷酸转移酶。设想其它可选标志物可能是有用的。
将同源臂插入表达盒的任一侧(图26)。每侧的两翼是两个8碱基限制性位点(图26)。8碱基切割器非常罕见,使得无论目的基因或同源臂如何,它们在载体中是独特的。在罕见情况下,这些位点中的一个或多个位于其它位置,每侧都有8碱基平端切割器或PCR片段,所述8碱基平端切割用于插入来自带有平端酶的限制性消化的平端片段,限制性消化之后是末端抛光。左臂位于主启动子(例如CMV)的正前方,一侧具有SwaI(平端)并且另一侧具有SbfI。右臂一侧具有AscI并且在Poly A信号之后具有PmeI(平端)(图26)。该组构允许在pDK-Streamline载体中容易地交换同源臂。
同源臂插入位点在(高拷贝数)细菌复制起点的任一侧上的放置确该起点不会作为插入基因组的模板的一部分包含于细胞中,从而使意外影响最小化。如果需要的话,起点也可以充当线性化载体的方便位置。
已经证明允许剪接RNA可以增加RNA的稳定性。RNA本身就不稳定并且其保持完整的时间越长,可表达的蛋白质的量就越多。大多数蛋白质表达开放阅读框(ORF)来自cDNA或DNA序列,其中已经移除所有内含子,主要是为了减小序列的大小。添加人工剪接位点可以增强RNA稳定性。pDK-Streamline包含人工剪接位点,所述人工剪接位点增强RNA稳定性并且允许增加蛋白质表达(图27)。
此外,如果需要的话,人工剪接位点还为另外的细菌表达盒创建空间。例如,可以将更传统的细菌抗性标志物插入人工剪接位点中并且所述标志物将作为“填充序列”,当处于真核细胞内部时,所述填充序列将从消息中拼接出来。
pDK-Streamline载体包含恰好位于多克隆位点上游的T7启动子(图28)。T7启动子的存在有几点益处。第一,T7启动子为测序提供了方便的引发位点。第二,它允许体外转录和翻译(无细胞蛋白质表达)。第三,它允许在不使用分离载体的情况下的目的蛋白质的细菌表达。
实例9、pDK-Streamline载体的产生和使用
制备用于蛋白质表达的DNA载体有两个主要步骤:1)用表达盒产生载体以及2)通常通过使用细菌宿主来扩增新载体。“表达盒”是允许蛋白质表达所需的所有片段。通常,表达盒将包含:1)启动子;2)kozac起始序列;3)待表达基因的cDNA;4)和多腺苷酸化信号序列。图29示出了pDK-Streamline载体的两个表达盒部分。一旦组装好载体,就将DNA载体在细菌中扩增并且纯化以供使用。
为了扩增,载体需要复制起点(驱动细菌DNA复制的序列)和通常表达对抗生素(可选择标志物)的抗性的基因。为了扩增,DNA载体被迫进入合适的细菌宿主,这可以使用本领域众所周知的方法来完成。然后用选择的抗生素(LB琼脂)将细菌在营养固体培养基上扩散。只有摄取了载体并且因此能够表达对抗生素的抗性的细菌才能生长。大约24小时后,将有带有载体的细菌克隆“菌落”。将一个或多个菌落分别转移到液体培养基中,也用抗生素进行继续扩增。大约24小时后,细菌被裂解并且DNA载体被纯化用于其它用途。
该一般方法还用于选择已用这种载体转染或编辑的哺乳动物细胞。第一,将具有可选择标志物的载体引入哺乳动物细胞中。第二,添加抗生素以杀死不摄取载体的细胞。第三,扩增在选择下存活的细胞。
传统载体(例如,英杰公司的pcDNA3-1)将具有单独的、仅细菌的可选择标志物,其通常对氨苄青霉素、卡那霉素、四环素等具有抗性(图30B)。遗传载体具有用于哺乳动物细胞的单独的可选择标志物,如对嘌呤霉素、杀稻瘟菌素S、新霉素等具有抗性(图30B)。标志物将表达为单独的表达盒(图30B)。由于需要两个单独的表达盒,这些载体本身就大于pDK-Streamline载体(图30A-30B)。
pDK-Streamline载体通过产生能够在细菌细胞和哺乳动物中起作用的启动子将用于这两者的可选择标志物组合成一个表达盒(图30A)。启动子仅限于在细菌或如哺乳动物细胞等真核细胞中起作用。通过将两个单独的启动子排列并融合到一个表达盒中,pDK-Streamline载体能够在细菌和真核细胞中使用单个可选择标志物。
以前从未将细菌和哺乳动物选择物置于一个表达盒下,因此如嘌呤霉素和杀稻瘟菌素S等抗生素通常不用于细菌选择物。部分的试剂盒可以包含生长培养基,例如已含有嘌呤霉素或杀稻瘟菌素S的LB琼脂板或液体培养基。例如,带有pDK-SL1Blast的试剂盒可以具有含有杀稻瘟菌素S的LB琼脂板,或者带有pDK-SL1Puro的试剂盒可以具有含有嘌呤霉素的LB琼脂板等。抗生素选择板可以包含在试剂盒中的pDK-Streamline载体中。可以特别配制生长培养基(例如,抗生素选择板(例如琼脂板)或液体培养基)用于原核细胞的生长和选择。可以特别配制生长培养基(例如,抗生素选择板(例如,琼脂板)或液体培养基)用于真核细胞的生长和选择。
pDK-Streamline载体具有的另一个特征是能够在表达盒之前和之后插入同源臂。当您想要将表达盒插入特定基因组位点,例如与CRISPR组合时,需要同源臂。
包含CRISPR的基因组编辑的典型过程如下进行:(1)CRISPR复合物在基因组中的特定位点处产生双链断裂;(2a)细胞识别基因组损伤并且对它进行修复,或者通过移除断裂周围的少量序列并且然后将它连接在一起;或者(2b)细胞使用另一个染色体作为模板来修复断裂以具有与该染色体相同的序列。
因为序列将被破坏并且可能超出框架,所以上文的2a导致基因敲除。可以利用上文的2b将序列改变为优选的序列。如果细胞中充满了在双链断裂的任一侧具有同源性(相同序列)的替代序列,则细胞可以在修复期间将其用作模板并且反而引入该序列(图31A-31B)。这被称为“敲入”(对比当基因序列被破坏并且失去功能时的“敲除”)。
同源臂插入位点恰好被放置在用于目的基因和可选择标志物的表达盒之前和之后(图32)。这些位点与用于稀有切割酶的限制性位点结合,使得同源臂可以容易且定向地插入(同源臂必须与基因组在同一方向上)。精心放置的限制性位点可以轻松插入并且轻松改变同源臂。
每个同源臂的酶共混物以及甚至通过切除细菌复制起点使载体线性化的共混物可以包括在包含pDK-Streamline载体的试剂盒中。载体经常被“线性化”或用限制酶切割以增加整合的机会以及移除任何插入后可能有害的序列。
设想可能存在三种不同的共混物:一种用于左臂,一种用于右臂以及一种具有切割最接近复制起点的两种酶(图33)。如上所描述的,虽然用于切割限制性位点的酶已经上市销售,但是无法获得可商购的限制酶的共混物。因为这种共混物可以减少误差(仅添加一种酶将打开载体但是将不允许插入)并且使其更方便,所以它对用户具有吸引力。
实例9证明了pDK-Streamline载体的技术优势和易用性。此外,此实例展示了将pDK-Streamline载体与用于扩增载体的其它组分(例如包含预制的抗生素琼脂板)包含在一起或者对例如试剂盒中的载体进行修饰(例如,使用酶共混物改变同源臂)的潜力。
本发明不限于本申请中描述的特定实施例,所述实施例旨在作为本公开的各个方面的单一说明。本文将不描述本公开的所有各个实施例。在不脱离本公开的精神和范围的情况下,可以对本公开进行许多修改和变化,这对本领域技术人员而言是显而易见的。除了本文列举的那些之外,根据前述描述,本公开的范围内的功能等效方法和设备对于本领域技术人员而言是显而易见的。这种修改和变化旨在落入所附权利要求书的范围内。本公开仅受所附权利要求的条款与这些权利要求所赋予的等同物的全部范围的限制。
应理解,本公开不限于当然可以变化的特定用途、方法、试剂、化合物、组合物或生物系统。还应理解,本文所使用的术语仅出于描述特定实施例的目的,而不旨在是限制性的。
P实施例
实施例P1.一种质粒载体,其包括:
(a)原核复制起点;
(b)适合于表达一个或多个转基因的真核启动子;
(c)用于插入所述一个或多个转基因的多克隆位点;以及
(d)编码可选择标志物的核酸,所述核酸可操作地连接到真核启动子和原核启动子,其中所述可选择标志物适合于原核选择和真核选择二者;
其中所述载体的长度小于3.6千碱基。
实施例P2.根据实施例P1所述的质粒载体,其中元件(a)-(d)在所述质粒的5到3方向上顺序布置。
实施例P3.根据实施例P1或P2所述的质粒载体,其进一步包括位于元件(a)与元件(b)之间的上游同源臂插入位点以及下游同源臂插入位点。
实施例P4.根据实施例P3所述的质粒载体,所述下游同源臂插入位点位于元件(d)之后。
实施例P5.根据实施例P1到P4中任一项所述的质粒载体,其进一步包括处于元件(b)与元件(c)之间的合成剪接位点,所述合成剪接位点增强从(b)的所述真核启动子转录的RNA的稳定性。
实施例P6.根据实施例P1到P5中任一项所述的质粒载体,其进一步包括处于(d)的所述多克隆位点之后的poly A序列。
实施例P7.根据实施例P1到P6中任一项所述的质粒载体,其进一步包括用于体外表达所述一个或多个转基因的处于(d)的所述多克隆位点上游的另外的启动子。
实施例P8.根据实施例P7所述的质粒载体,其中所述用于体外表达的另外的启动子是T7启动子。
实施例P9.根据实施例P1到P8中任一项所述的质粒载体,其中(a)的所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。
实施例P10.根据实施例P9所述的质粒载体,其中(a)的所述复制起点是pBR322Ori。
实施例P11.根据实施例P1到P10中任一项所述的质粒载体,其中(b)的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。
实施例P12.根据实施例P11所述的质粒载体,其中(b)的所述真核启动子是巨细胞病毒(CMV)启动子。
实施例P13.根据实施例P1到P12中任一项所述的质粒载体,其中所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。
实施例P14.根据实施例P13所述的质粒载体,其中所述可选择标志物是抗生素抗性基因。
实施例P15.根据实施例P13所述的质粒载体,其中所述可选择标志物是杀稻瘟菌素S脱氨酶。
实施例P16.根据实施例P13所述的质粒载体,其中所述可选择标志物是荧光蛋白。
实施例P17.根据实施例P16所述的质粒载体,其中所述荧光蛋白是近红外荧光蛋白。
实施例P18.根据实施例P1到P17中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。
实施例P19.根据实施例P1到P18中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。
实施例P20.根据实施例P1到P19中任一项所述的质粒载体,其中所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。
实施例P21.根据实施例P3到P20中任一项所述的质粒载体,其中所述上游同源臂插入位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。
实施例P22.根据实施例P3到P21中任一项所述的质粒载体,其中所述下游同源臂插入位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。
实施例P23.根据实施例P1到P22中任一项所述的质粒载体,其中所述载体具有SEQID NO:2中列出的核苷酸序列。
实施例P24.根据实施例P1所述的质粒载体,其进一步包括插入在所述多克隆位点处的转基因。
实施例P25.根据实施例P24所述的质粒载体,其中所述转基因编码治疗性蛋白质或治疗性RNA。
实施例P26.根据实施例P3到P25中任一项所述的质粒载体,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。
实施例P27.根据实施例P1到P26中任一项所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。
实施例P28.一种用于基因表达的方法,所述方法包括:用根据实施例P1到P27中任一项所述的载体转染真核细胞,所述载体进一步包括插入在所述多克隆位点处的转基因;以及在适合于表达所述转基因的条件下培养所述细胞。
实施例P29.一种用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:
(a)将以下引入到哺乳动物细胞中:
(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及
(ii)根据实施例P1到P27中任一项所述的载体,所述载体进一步包括插入在所述多克隆位点处的转基因,所述多克隆位点处于插入在所述上游同源臂插入位点处的上游同源臂和插入在所述下游同源臂处的下游同源臂的侧翼;以及
(b)选择包括所述靶基因组基因座上的所述转基因的靶向哺乳动物细胞。
实施例P30.根据实施例P29所述的方法,其中所述细胞通过检测所述可选择标志物来选择。
实施例P31.根据实施例P29或P30所述的方法,其中所述哺乳动物细胞是多能细胞。
实施例P32.根据实施例P31所述的方法,其中所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。
实施例P33.根据实施例P29或P30所述的方法,其中所述哺乳动物细胞是人成纤维细胞。
实施例P34.根据实施例P29或P30所述的方法,其中所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。
实施例P35.根据实施例P34所述的方法,其中将所述转基因整合到所述靶基因组基因座中代替所述基因组中的所述至少一种人类疾病等位基因。
实施例P36.根据实施例P29或P30所述的方法,其中所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。
实施例P37.根据实施例P36所述的方法,其中所述核酸酶试剂是编码核酸酶的mRNA。
实施例P38.根据实施例P36所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)。
实施例P39.根据实施例P36所述的方法,其中所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。
实施例P40.根据实施例P36所述的方法,其中所述核酸酶是大范围核酸酶。
实施例P41.根据实施例P36所述的方法,其中所述核酸酶是Cas9核酸酶。
实施例P42.根据实施例P36到P41中任一项所述的方法,其中所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。
实施例P43.根据实施例P42所述的方法,其中所述靶序列是AAV1整合位点。
实施例P44.根据实施例P36到P43中任一项所述的方法,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。
实施例P45.根据实施例P36到P44中任一项所述的方法,其中所述转基因核酸的长度范围为约5kb到300kb。
实施例
实施例1.一种质粒载体,其包括:
(a)原核复制起点;
(b)适合于表达一个或多个转基因的真核启动子;
(c)用于插入所述一个或多个转基因的多克隆位点;以及
(d)编码可选择标志物的核酸,所述核酸可操作地连接到包含真核启动子和原核启动子的双启动子,其中所述可选择标志物适核于原核选择和真核选择二者;
其中所述载体的长度小于3.6千碱基。
实施例2.根据实施例1所述的质粒载体,其中元件(a)-(d)在所述质粒的5到3方向上顺序布置。
实施例3.根据实施例1或2所述的质粒载体,其进一步包括位于元件(a)与元件(b)之间的上游同源臂插入位点以及下游同源臂插入位点。
实施例4.根据实施例3所述的质粒载体,所述下游同源臂插入位点位于元件(d)之后。
实施例5.根据实施例1到4中任一项所述的质粒载体,其进一步包括处于元件(b)与元件(c)之间的合成剪接位点,所述合成剪接位点增强从(b)的所述真核启动子转录的RNA的稳定性。
实施例6.根据实施例1到5中任一项所述的质粒载体,其进一步包括处于(d)的所述多克隆位点之后的poly A序列。
实施例7.根据实施例1到6中任一项所述的质粒载体,其进一步包括用于体外表达所述一个或多个转基因的处于(d)的所述多克隆位点上游的另外的启动子。
实施例8.根据实施例7所述的质粒载体,其中所述用于体外表达的另外的启动子是T7启动子。
实施例9.根据实施例1到8中任一项所述的质粒载体,其中(a)的所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。
实施例10.根据实施例9所述的质粒载体,其中(a)的所述复制起点是pBR322Ori。
实施例11.根据实施例1到10中任一项所述的质粒载体,其中(b)的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。
实施例12.根据实施例11所述的质粒载体,其中(b)的所述真核启动子是巨细胞病毒(CMV)启动子。
实施例13.根据实施例1到12中任一项所述的质粒载体,其中所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。
实施例14.根据实施例13所述的质粒载体,其中所述可选择标志物是抗生素抗性基因。
实施例15.根据实施例13所述的质粒载体,其中所述可选择标志物是杀稻瘟菌素S脱氨酶。
实施例16.根据实施例13所述的质粒载体,其中所述可选择标志物是嘌呤霉素-N-乙酰转移酶。
实施例17.根据实施例13所述的质粒载体,其中所述可选择标志物是新霉素磷酸转移酶。
实施例18.根据实施例13所述的质粒载体,其中所述可选择标志物是荧光蛋白。
实施例19.根据实施例16所述的质粒载体,其中所述荧光蛋白是近红外荧光蛋白。
实施例20.根据实施例1到19中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。
实施例21.根据实施例1到20中任一项所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。
实施例22.根据实施例1到21中任一项所述的质粒载体,其中所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。
实施例23.根据实施例3到22中任一项所述的质粒载体,其中所述上游同源臂插入位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。
实施例24.根据实施例3到23中任一项所述的质粒载体,其中所述下游同源臂插入位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。
实施例25.根据实施例1到24中任一项所述的质粒载体,其中所述载体具有SEQ IDNO:2中列出的核苷酸序列。
实施例26.根据实施例1所述的质粒载体,其进一步包括插入在所述多克隆位点处的转基因。
实施例27.根据实施例26所述的质粒载体,其中所述转基因编码治疗性蛋白质或治疗性RNA。
实施例28.根据实施例3到27中任一项所述的质粒载体,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。
实施例29.根据实施例1到28中任一项所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。
实施例30.根据实施例1到29中任一项所述的质粒载体,其中所述原核复制起点不是F1起点。
实施例31.根据实施例1到30中任一项所述的质粒载体,其中所述质粒载体恰好包括一个可选择标志物。
实施例32.一种用于基因表达的方法,所述方法包括用根据实施例1到31中任一项所述的载体转染真核细胞,所述载体进一步包括插入在所述多克隆位点处的转基因;以及在适合于表达所述转基因的条件下培养所述细胞。
实施例33.一种用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:
(a)将以下引入到哺乳动物细胞中:
(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及
(ii)根据实施例1到31中任一项所述的载体,所述载体进一步包括插入在所述多克隆位点处的转基因,所述多克隆位点处于插入在所述上游同源臂插入位点处的上游同源臂和插入在所述下游同源臂处的下游同源臂的侧翼;以及
(b)选择包括所述靶基因组基因座上的所述转基因的靶向哺乳动物细胞。
实施例34.根据实施例33所述的方法,其中所述细胞通过检测所述可选择标志物来选择。
实施例35.根据实施例33或34所述的方法,其中所述哺乳动物细胞是多能细胞。
实施例36.根据实施例35所述的方法,其中所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。
实施例37.根据实施例33或34所述的方法,其中所述哺乳动物细胞是人成纤维细胞。
实施例38.根据实施例33或34所述的方法,其中所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。
实施例39.根据实施例38所述的方法,其中将所述转基因整合到所述靶基因组基因座中代替所述基因组中的所述至少一种人类疾病等位基因。
实施例40.根据实施例33或34所述的方法,其中所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。
实施例41.根据实施例40所述的方法,其中所述核酸酶试剂是编码核酸酶的mRNA。
实施例42.根据实施例40所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)。
实施例43.根据实施例40所述的方法,其中所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。
实施例44.根据实施例40所述的方法,其中所述核酸酶是大范围核酸酶。
实施例45.根据实施例40所述的方法,其中所述核酸酶是Cas9核酸酶。
实施例46.根据实施例40到45中任一项所述的方法,其中所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。
实施例47.根据实施例46所述的方法,其中所述靶序列是AAV1整合位点。
实施例48.根据实施例40到47中任一项所述的方法,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。
实施例49.根据实施例40到48中任一项所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。
实施例50.一种试剂盒,其包括根据实施例1到31中任一项所述的载体和包含抗生素的生长培养基。
实施例51.根据实施例50所述的试剂盒,其中所述抗生素是杀稻瘟菌素S、嘌呤霉素或新霉素。
实施例52.根据实施例50或51所述的试剂盒,其中所述生长培养基是液体生长培养基、固体生长培养基或半固体生长培养基。
实施例53.根据实施例50或52所述的试剂盒,其中所述固体生长培养基是琼脂。
实施例54.根据实施例50到53中任一项所述的试剂盒,其进一步包括第一、第二和第三限制酶共混物。
实施例55.根据实施例54所述的试剂盒,所述第一限制酶共混物包括用于限制位点SwaI和SbfI的限制酶;其中所述第二限制酶共混物包括用于限制位点AscI和PmeI的限制酶;并且其中所述第三限制酶共混物包括用于限制位点PmeI和SwaI的限制酶。
实施例56.根据实施例50到55中任一项所述的试剂盒,其进一步包括用于基因组编辑的II型CRISPR系统。
实施例57.根据实施例50到55中任一项所述的试剂盒,其进一步包括用于基因组编辑的TALEN系统。
实施例58.根据实施例50到55中任一项所述的试剂盒,其进一步包括用于基因组编辑的锌指核酸酶系统。
实施例59.一种质粒载体,其包括双启动子和在真核细胞和原核细胞二者中起作用的单个可选择标志物,所述载体不包含另外的可选择标志物。
序列表
<110> D·基维利希
<120> 用于表达大型核酸转基因的质粒载体
<130> 888888-888001WO
<150> US 62/416,617
<151> 2016-11-02
<160> 45
<170> PatentIn版本3.5
<210> 1
<211> 3349
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 1
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660
cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720
agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780
agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840
gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900
ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960
cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020
aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080
ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140
cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320
tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380
atgtggtaca cggagtggca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt 1440
taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa 1500
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 1560
ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 1620
attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 1680
gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 1740
ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 1800
tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcag cacgtgttga 1860
caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac 1920
catggccaag cctttgtctc aagaagaatc caccctcatt gaaagagcaa cggctacaat 1980
caacagcatc cccatctctg aagactacag cgtcgccagc gcagctctct ctagcgacgg 2040
ccgcatcttc actggtgtca atgtatatca ttttactggg ggaccttgtg cagaactcgt 2100
ggtgctgggc actgctgctg ctgcggcagc tggcaacctg acttgtatcg tcgcgatcgg 2160
aaatgagaac aggggcatct tgagcccctg cggacggtgc cgacaggtgc ttctcgatct 2220
gcatcctggg atcaaagcca tagtgaagga cagtgatgga cagccgacgg cagttgggat 2280
tcgtgaattg ctgccctctg gttatgtgtg ggagggctaa gcacttcgtg gccgaggagc 2340
aggactgaca cgtgctacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 2400
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 2460
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2520
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2580
aactcatcaa tgtatcttat catgtctgta ctcatgacca aaatccctta acgtgagttt 2640
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 2700
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 2760
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 2820
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 2880
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 2940
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 3000
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 3060
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 3120
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 3180
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 3240
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 3300
cggttcctgg ccttttgctg gccttttgct cacatggctc gacagatct 3349
<210> 2
<211> 3295
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 2
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 60
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 120
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 180
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 240
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 300
cagcaacgcg atttaaatac ggttcctgcc tgcaggagat cttcaatatt ggccattagc 360
catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt 420
gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg 480
gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 540
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 600
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 660
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 720
agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 780
gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt 840
agtcatcgct attaccatgg tgatgcggtt ttggcagtac accaatgggc gtggatagcg 900
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 960
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tgcgatcgcc cgccccgttg 1020
acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc tcgtttagtg 1080
aaccgtcaga tcactagaag ctttattgcg gtagtttatc acagttaaat tgctaacgca 1140
gtcagtgctt ctgacacaac agtctcgaac ttaagctgca gtgactctct taaggtagcc 1200
ttgcagaagt tggtcgtgag gcactgggca ggtaagtatc aaggttacaa gacaggttta 1260
aggagaccaa tagaaactgg gcttgtcgag acagagaaga ctcttgcgtt tctgataggc 1320
acctattggt cttactgaca tccactttgc ctttctctcc acaggtgtcc actcccagtt 1380
caattacagc tcttaaggct agagtactta atacgactca ctataggcta gcctcgagaa 1440
ttcacgcgtg gtacctctag agtcgacccg ggcggccgct tccctttagt gagggttaat 1500
gcttcgagca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 1560
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 1620
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 1680
ggagatgtgg gaggtttttt aaagcaagta aaacctctac aaatgtggta cacggagtgg 1740
cagcaccatg gcctgaaata acctctgaaa gaggaacttg gttaggtacc ttctgaggcg 1800
gaaagaacca gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 1860
caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 1920
caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 1980
tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 2040
cccatggctg actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc 2100
tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg 2160
gagcttgtat atccattttc ggatctgatc agcacgtgtt gacaattaat catcggcata 2220
gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca agcctttgtc 2280
tcaagaagaa tccaccctca ttgaaagagc aacggctaca atcaacagca tccccatctc 2340
tgaagactac agcgtcgcca gcgcagctct ctctagcgac ggccgcatct tcactggtgt 2400
caatgtatat cattttactg ggggaccttg tgcagaactc gtggtgctgg gcactgctgc 2460
tgctgcggca gctggcaacc tgacttgtat cgtcgcgatc ggaaatgaga acaggggcat 2520
cttgagcccc tgcggacggt gccgacaggt gcttctcgat ctgcatcctg ggatcaaagc 2580
catagtgaag gacagtgatg gacagccgac ggcagttggg attcgtgaat tgctgccctc 2640
tggttatgtg tgggagggct aagcacttcg tggccgagga gcaggactga cacgtgctac 2700
gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg 2760
acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca 2820
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2880
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 2940
atcatgtctg tactcatgag gcgcgcccgt cagacccgtt taaacagatc aaaggatctt 3000
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 3060
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 3120
tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact 3180
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 3240
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttacc 3295
<210> 3
<211> 3592
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 3
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360
ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420
taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480
tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840
cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900
cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020
aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080
ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140
ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200
cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260
gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320
tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380
tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440
acttaatacg actcactata ggctagcctc gagaattcac gcgtggtacc tctagagtcg 1500
acccgggcgg ccgcttccct ttagtgaggg ttaatgcttc gagcagacat gataagatac 1560
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 1620
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 1680
aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt tttttaaagc 1740
aagtaaaacc tctacaaatg tggtacacgg agtggcagca ccatggcctg aaataacctc 1800
tgaaagagga acttggttag gtaccttctg aggcggaaag aaccagctgt ggaatgtgtg 1860
tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1920
tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat 1980
gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc 2040
gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat 2100
ttatgcagag gccgaggccg cctcggcctc tgagctattc cagaagtagt gaggaggctt 2160
ttttggaggc ctaggctttt gcaaaaagct cccggccggg agcttgtata tccattttcg 2220
gatctgatca gcacgtgttg acaattaatc atcggcatag tatatcggca tagtataata 2280
cgacaaggtg aggaacgcca ccatgattga acaagatgga ttgcacgcag gttctccggc 2340
cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 2400
tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 2460
gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg ctatcgtggc tggccacgac 2520
gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 2580
attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 2640
atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 2700
cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 2760
cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 2820
gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt 2880
gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 2940
tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 3000
cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 3060
catcgccttc tatcgccttc ttgacgagtt cttcgccggc tggatgatcc tccagcgcgg 3120
ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt ataatggtta 3180
caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 3240
ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtactcatg aggcgcgccc 3300
gtcagacccg tttaaacaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 3360
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 3420
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 3480
tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 3540
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cg 3592
<210> 4
<211> 3405
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 4
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360
ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420
taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480
tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840
cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900
cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020
aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080
ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140
ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200
cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260
gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320
tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380
tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440
acttaatacg actcactata ggctagcctc gagaattcac gcgtggtacc tctagagtcg 1500
acccgggcgg ccgcttccct ttagtgaggg ttaatgcttc gagcagacat gataagatac 1560
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 1620
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 1680
aacaattgca ttcattttat gtttcaggtt cagggggaga tgtgggaggt tttttaaagc 1740
aagtaaaacc tctacaaatg tggtacacgg agtggcagca ccatggcctg aaataacctc 1800
tgaaagagga acttggttag gtaccttctg aggcggaaag aaccagctgt ggaatgtgtg 1860
tcagttaggg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1920
tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat 1980
gcaaagcatg catctcaatt agtcagcaac catagtcccg cccctaactc cgcccatccc 2040
gcccctaact ccgcccagtt ccgcccattc tccgccccat ggctgactaa ttttttttat 2100
ttatgcagag gccgaggccg cctcggcctc tgagctattc cagaagtagt gaggaggctt 2160
ttttggaggc ctaggctttt gcaaaaagct cccggccggg agcttgtata tccattttcg 2220
gatctgatca gcacgtgttg acaattaatc atcggcatag tatatcggca tagtataata 2280
cgacaaggtg aggaactaaa cgccaccatg accgagtaca agcccacggt gcgcctcgcc 2340
acccgcgacg acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 2400
gccacgcgcc acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa 2460
ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 2520
gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 2580
ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 2640
ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 2700
cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 2760
gagcgcgccg gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac 2820
gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 2880
tgcatgaccc gcaagcccgg tgcctgagcc ggctggatga tcctccagcg cggggatctc 2940
atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg ttacaaataa 3000
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 3060
ttgtccaaac tcatcaatgt atcttatcat gtctgtactc atgaggcgcg cccgtcagac 3120
ccgtttaaac agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc 3180
ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca 3240
actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta 3300
gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct 3360
ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcg 3405
<210> 5
<211> 5472
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 5
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660
cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720
agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780
agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840
gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900
ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960
cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020
aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080
ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140
cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320
tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380
atgtggtaaa atccgataag gatcgatccg ggctggcgta atagcgaaga ggcccgcacc 1440
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggacgcgccc tgtagcggcg 1500
cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 1560
tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 1620
gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 1680
accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 1740
tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 1800
gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 1860
cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 1920
tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 1980
acaccgcata cgcggatctg cgcagcacca tggcctgaaa taacctctga aagaggaact 2040
tggttaggta ccttctgagg cggaaagaac cagctgtgga atgtgtgtca gttagggtgt 2100
ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca 2160
gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat 2220
ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg 2280
cccagttccg cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc 2340
gaggccgcct cggcctctga gctattccag aagtagtgag gaggcttttt tggaggccta 2400
ggcttttgca aaaagcttga ttcttctgac acaacagtct cgaacttaag gctagagcca 2460
ccatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg gagaggctat 2520
tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg ttccggctgt 2580
cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc ctgaatgaac 2640
tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct tgcgcagctg 2700
tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa gtgccggggc 2760
aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg gctgatgcaa 2820
tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa gcgaaacatc 2880
gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat gatctggacg 2940
aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg cgcatgcccg 3000
acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc atggtggaaa 3060
atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac cgctatcagg 3120
acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg gctgaccgct 3180
tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc tatcgccttc 3240
ttgacgagtt cttctgagcg ggactctggg gttcgaaatg accgaccaag cgacgcccaa 3300
cctgccatca cgatggccgc aataaaatat ctttattttc attacatctg tgtgttggtt 3360
ttttgtgtga atcgatagcg ataaggatcc gcgtatggtg cactctcagt acaatctgct 3420
ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 3480
gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 3540
tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 3600
gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt 3660
ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 3720
atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 3780
tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 3840
tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 3900
gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 3960
aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 4020
gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 4080
ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 4140
gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 4200
gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 4260
atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 4320
ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 4380
cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 4440
cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 4500
gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 4560
cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 4620
cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 4680
taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 4740
ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 4800
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 4860
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 4920
taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag 4980
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 5040
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 5100
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 5160
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 5220
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 5280
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 5340
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 5400
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgg 5460
ctcgacagat ct 5472
<210> 6
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 6
gacccgggcg gccgcttccc tttagtgagg gttaa 35
<210> 7
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 7
tgctgccact ccgtgtacca catttgtaga ggttttactt gc 42
<210> 8
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 8
gtggtacacg gagtggcagc accatggcct gaaataacct ct 42
<210> 9
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 9
caaaagccta ggcctccaaa aaagcctcct cac 33
<210> 10
<211> 4852
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 10
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660
cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720
agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780
agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840
gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900
ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960
cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020
aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080
ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140
cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320
tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380
atgtggtaca cggagtggca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt 1440
taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa 1500
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 1560
ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 1620
attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 1680
gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 1740
ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 1800
tttgcaaaga tcgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga 1860
ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa 1920
cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt 1980
ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg 2040
ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa 2100
gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac 2160
cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt 2220
gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact 2280
cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg 2340
ccagccgaac tgttcgccag gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg 2400
acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc 2460
atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt 2520
gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc 2580
gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg 2640
ggactctggg gttcgaaatg accgaccaag cgacgcccaa cctgccatca cgatggccgc 2700
aataaaatat ctttattttc attacatctg tgtgttggtt ttttgtgtga atcgatagcg 2760
ataaggatcc gcgtatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 2820
cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 2880
tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 2940
tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 3000
gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 3060
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 3120
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 3180
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 3240
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 3300
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 3360
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 3420
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 3480
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 3540
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 3600
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 3660
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 3720
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 3780
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 3840
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 3900
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 3960
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 4020
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 4080
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 4140
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 4200
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 4260
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 4320
cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct 4380
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 4440
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 4500
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 4560
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 4620
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 4680
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 4740
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 4800
ttacggttcc tggccttttg ctggcctttt gctcacatgg ctcgacagat ct 4852
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 11
ggaggcctag gcttttgcaa aaagctgagc 30
<210> 12
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 12
tcgtattata ctatgccgat atactatgcc gatgattaat tgtcaacacg tgctg 55
<210> 13
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 13
cagcacgtgt tgacaattaa tcatcggcat agtatatcgg catagtataa tacga 55
<210> 14
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 14
tcgacggtat acagacatga taagatacat tgatgag 37
<210> 15
<211> 4357
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 15
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg 480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac 540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactg 660
cgatcgcccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 720
agcagagctc gtttagtgaa ccgtcagatc actagaagct ttattgcggt agtttatcac 780
agttaaattg ctaacgcagt cagtgcttct gacacaacag tctcgaactt aagctgcagt 840
gactctctta aggtagcctt gcagaagttg gtcgtgaggc actgggcagg taagtatcaa 900
ggttacaaga caggtttaag gagaccaata gaaactgggc ttgtcgagac agagaagact 960
cttgcgtttc tgataggcac ctattggtct tactgacatc cactttgcct ttctctccac 1020
aggtgtccac tcccagttca attacagctc ttaaggctag agtacttaat acgactcact 1080
ataggctagc ctcgagaatt cacgcgtggt acctctagag tcgacccggg cggccgcttc 1140
cctttagtga gggttaatgc ttcgagcaga catgataaga tacattgatg agtttggaca 1200
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1260
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1320
tatgtttcag gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa 1380
atgtggtaca cggagtggca gcaccatggc ctgaaataac ctctgaaaga ggaacttggt 1440
taggtacctt ctgaggcgga aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa 1500
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 1560
ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc atgcatctca 1620
attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta actccgccca 1680
gttccgccca ttctccgccc catggctgac taattttttt tatttatgca gaggccgagg 1740
ccgcctcggc ctctgagcta ttccagaagt agtgaggagg cttttttgga ggcctaggct 1800
tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcag cacgtgttga 1860
caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac 1920
catggccaag cctttgtctc aagaagaatc caccctcatt gaaagagcaa cggctacaat 1980
caacagcatc cccatctctg aagactacag cgtcgccagc gcagctctct ctagcgacgg 2040
ccgcatcttc actggtgtca atgtatatca ttttactggg ggaccttgtg cagaactcgt 2100
ggtgctgggc actgctgctg ctgcggcagc tggcaacctg acttgtatcg tcgcgatcgg 2160
aaatgagaac aggggcatct tgagcccctg cggacggtgc cgacaggtgc ttctcgatct 2220
gcatcctggg atcaaagcca tagtgaagga cagtgatgga cagccgacgg cagttgggat 2280
tcgtgaattg ctgccctctg gttatgtgtg ggagggctaa gcacttcgtg gccgaggagc 2340
aggactgaca cgtgctacga gatttcgatt ccaccgccgc cttctatgaa aggttgggct 2400
tcggaatcgt tttccgggac gccggctgga tgatcctcca gcgcggggat ctcatgctgg 2460
agttcttcgc ccaccccaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2520
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2580
aactcatcaa tgtatcttat catgtctgta ctcatgagac aataaccctg ataaatgctt 2640
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 2700
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 2760
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 2820
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 2880
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 2940
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3000
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3060
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3120
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3180
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3240
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3300
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3360
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3420
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3480
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 3540
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 3600
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 3660
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 3720
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 3780
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 3840
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 3900
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 3960
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4020
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4080
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4140
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4200
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4260
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4320
ttttgctggc cttttgctca catggctcga cagatct 4357
<210> 16
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 16
tgagtttcat gaggcgcgcc cgtcagaccc gtttaaacag atcaaaggat cttcttgaga 60
<210> 17
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 17
tattgaagat ctcctgcagg caggaaccgt atttaaatcg cgttgctggc gtttttccat 60
<210> 18
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 18
tttggaggcc taggcttttg caaaaagctc c 31
<210> 19
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 19
gaggcgcacc gtgggcttgt actcggtcat ggtggcgttt agttcctcac cttgtcg 57
<210> 20
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 20
cgacaaggtg aggaactaaa cgccaccatg accgagtaca agcccacggt gcgcctc 57
<210> 21
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 21
catccagccg gctcaggcac cgggcttgcg ggtc 34
<210> 22
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 22
tttggaggcc taggcttttg caaaaagctc c 31
<210> 23
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 23
gtgcaatcca tcttgttcaa tcatggtggc gttcctcacc ttgtcgtatt atactatgc 59
<210> 24
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 24
gcatagtata atacgacaag gtgaggaacg ccaccatgat tgaacaagat ggattgcac 59
<210> 25
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 25
catccagccg gctcaggcac cgggcttgcg ggtc 34
<210> 26
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 26
agcctcgaga attctaatag gccaccatgt ccactgcggt cctggaaaac ccaggcttgg 60
<210> 27
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 27
ggaagcggcc gcctacttta ttttctggag ggcactgcaa aggattccaa tttcactg 58
<210> 28
<211> 4642
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 28
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360
ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420
taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480
tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840
cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900
cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020
aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080
ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140
ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200
cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260
gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320
tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380
tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440
acttaatacg actcactata ggctagcctc gagaattcta ataggccacc atgtccactg 1500
cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag gaaacaagct 1560
atattgaaga caactgcaat caaaatggtg ccatatcgct gatcttctca ctcaaagaag 1620
aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta aacctgaccc 1680
acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc acccatttgg 1740
ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat gacattggtg 1800
ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg ttcccaagaa 1860
ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg gaactggatg 1920
ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag tttgctgaca 1980
ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg gaggaaggaa 2040
agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc catgcttgct 2100
atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat gaagataaca 2160
ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc cgcctccgac 2220
ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc cgagtcttcc 2280
actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa cctgacatct 2340
gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc cagttttccc 2400
aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag ctcgccacaa 2460
tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata aaggcatatg 2520
gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag aagccaaagc 2580
ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg gagttccagc 2640
ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg aactttgctg 2700
ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg attgaggtct 2760
tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa attggaatcc 2820
tttgcagtgc cctccagaaa ataaagtagg cggccgcttc cctttagtga gggttaatgc 2880
ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt 2940
gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa 3000
gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg 3060
agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaca cggagtggca 3120
gcaccatggc ctgaaataac ctctgaaaga ggaacttggt taggtacctt ctgaggcgga 3180
aagaaccagc tgtggaatgt gtgtcagtta gggtgtggaa agtccccagg ctccccagca 3240
ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca 3300
ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc 3360
ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 3420
catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc ctctgagcta 3480
ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggcc 3540
gggagcttgt atatccattt tcggatctga tcagcacgtg ttgacaatta atcatcggca 3600
tagtatatcg gcatagtata atacgacaag gtgaggaact aaaccatggc caagcctttg 3660
tctcaagaag aatccaccct cattgaaaga gcaacggcta caatcaacag catccccatc 3720
tctgaagact acagcgtcgc cagcgcagct ctctctagcg acggccgcat cttcactggt 3780
gtcaatgtat atcattttac tgggggacct tgtgcagaac tcgtggtgct gggcactgct 3840
gctgctgcgg cagctggcaa cctgacttgt atcgtcgcga tcggaaatga gaacaggggc 3900
atcttgagcc cctgcggacg gtgccgacag gtgcttctcg atctgcatcc tgggatcaaa 3960
gccatagtga aggacagtga tggacagccg acggcagttg ggattcgtga attgctgccc 4020
tctggttatg tgtgggaggg ctaagcactt cgtggccgag gagcaggact gacacgtgct 4080
acgagatttc gattccaccg ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg 4140
ggacgccggc tggatgatcc tccagcgcgg ggatctcatg ctggagttct tcgcccaccc 4200
caacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 4260
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc 4320
ttatcatgtc tgtactcatg aggcgcgccc gtcagacccg tttaaacaga tcaaaggatc 4380
ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 4440
accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 4500
cttcagcaga gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca 4560
cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 4620
tgctgccagt ggcgataagt cg 4642
<210> 29
<211> 6473
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 29
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900
taagcttggt accgagctcg gatccactag tccagtgtgg tggaattcta ataggccacc 960
atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 1020
gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcgct gatcttctca 1080
ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 1140
aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 1200
acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 1260
gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 1320
ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 1380
gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 1440
tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 1500
gaggaaggaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 1560
catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 1620
gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 1680
cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 1740
cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 1800
cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 1860
cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 1920
ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1980
aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 2040
aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 2100
gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 2160
aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 2220
attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 2280
attggaatcc tttgcagtgc cctccagaaa ataaagtagg cggccgctcg aggtcaccca 2340
ttcgaacaaa aactcatctc agaagaggat ctgaatatgc ataccggtca tcatcaccat 2400
caccattgag tttaaacccg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 2460
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 2520
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 2580
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 2640
gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 2700
ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 2760
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 2820
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 2880
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 2940
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 3000
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 3060
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 3120
tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 3180
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3240
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3300
ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 3360
ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 3420
ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 3480
tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca attaatcatc 3540
ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagcc 3600
tttgtctcaa gaagaatcca ccctcattga aagagcaacg gctacaatca acagcatccc 3660
catctctgaa gactacagcg tcgccagcgc agctctctct agcgacggcc gcatcttcac 3720
tggtgtcaat gtatatcatt ttactggggg accttgtgca gaactcgtgg tgctgggcac 3780
tgctgctgct gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa atgagaacag 3840
gggcatcttg agcccctgcg gacggtgccg acaggtgctt ctcgatctgc atcctgggat 3900
caaagccata gtgaaggaca gtgatggaca gccgacggca gttgggattc gtgaattgct 3960
gccctctggt tatgtgtggg agggctaagc acttcgtggc cgaggagcag gactgacacg 4020
tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 4080
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 4140
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 4200
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 4260
tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 4320
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 4380
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 4440
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4500
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 4560
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 4620
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 4680
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 4740
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 4800
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 4860
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4920
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4980
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 5040
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 5100
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 5160
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 5220
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 5280
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 5340
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 5400
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 5460
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 5520
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 5580
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 5640
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 5700
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 5760
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 5820
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 5880
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5940
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 6000
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 6060
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 6120
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 6180
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 6240
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 6300
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 6360
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 6420
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtc 6473
<210> 30
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 30
aggctagcct cgaggtaata ggccaccatg cagatcgagc tgtccacctg cttttttctg 60
<210> 31
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 31
cagggttgtc cgggtgatct cccgctggtg acgcgtgctg gacacattct tgccccagct 60
<210> 32
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 32
agctggggca agaatgtgtc cagcacgcgt caccagcggg agatcacccg gacaaccctg 60
<210> 33
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 33
ggaagcggcc gctcatcagt acagatcctg ggcctcacat cccaggactt ccatcctgag 60
<210> 34
<211> 8340
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 34
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aatacggttc 360
ctgcctgcag gagatcttca atattggcca ttagccatat tattcattgg ttatatagca 420
taaatcaata ttggctattg gccattgcat acgttgtatc tatatcataa tatgtacatt 480
tatattggct catgtccaat atgaccgcca tgttggcatt gattattgac tagttattaa 540
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa 600
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata 660
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 720
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtccgccc 780
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 840
cgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg 900
cggttttggc agtacaccaa tgggcgtgga tagcggtttg actcacgggg atttccaagt 960
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca 1020
aaatgtcgta acaactgcga tcgcccgccc cgttgacgca aatgggcggt aggcgtgtac 1080
ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagatcact agaagcttta 1140
ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgcttctgac acaacagtct 1200
cgaacttaag ctgcagtgac tctcttaagg tagccttgca gaagttggtc gtgaggcact 1260
gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcttg 1320
tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac tgacatccac 1380
tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta aggctagagt 1440
acttaatacg actcactata ggctagcctc gaggtaatag gccaccatgc agatcgagct 1500
gtccacctgc ttttttctgt gcctgctgcg gttctgcttc agcgccaccc ggcggtacta 1560
cctgggcgcc gtggagctgt cctgggacta catgcagagc gacctgggcg agctgcccgt 1620
ggacgcccgg ttccccccca gagtgcccaa gagcttcccc ttcaacacca gcgtggtgta 1680
caagaaaacc ctgttcgtgg agttcaccga ccacctgttc aatatcgcca agcccaggcc 1740
cccctggatg ggcctgctgg gccccaccat ccaggccgag gtgtacgaca ccgtggtgat 1800
caccctgaag aacatggcca gccaccccgt gagcctgcac gccgtgggcg tgagctactg 1860
gaaggccagc gagggcgccg agtacgacga ccagaccagc cagcgggaga aagaagatga 1920
caaggtgttc cctggcggca gccacaccta cgtgtggcag gtgctgaaag aaaacggccc 1980
catggcctcc gaccccctgt gcctgaccta cagctacctg agccacgtgg acctggtgaa 2040
ggacctgaac agcggcctga tcggcgctct gctcgtctgc cgggagggca gcctggccaa 2100
agagaaaacc cagaccctgc acaagttcat cctgctgttc gccgtgttcg acgagggcaa 2160
gagctggcac agcgagacaa agaacagcct gatgcaggac cgggacgccg cctctgccag 2220
agcctggccc aagatgcaca ccgtgaacgg ctacgtgaac agaagcctgc ccggcctgat 2280
tggctgccac cggaagagcg tgtactggca cgtgatcggc atgggcacca cacccgaggt 2340
gcacagcatc tttctggaag ggcacacctt tctggtccgg aaccaccggc aggccagcct 2400
ggaaatcagc cctatcacct tcctgaccgc ccagacactg ctgatggacc tgggccagtt 2460
cctgctgttt tgccacatca gctctcacca gcacgacggc atggaagcct acgtgaaggt 2520
ggactcttgc cccgaggaac cccagctgcg gatgaagaac aacgaggaag ccgaggacta 2580
cgacgacgac ctgaccgaca gcgagatgga cgtggtgcgg ttcgacgacg acaacagccc 2640
cagcttcatc cagatcagaa gcgtggccaa gaagcacccc aagacctggg tgcactatat 2700
cgccgccgag gaagaggact gggactacgc ccccctggtg ctggcccccg acgacagaag 2760
ctacaagagc cagtacctga acaatggccc ccagcggatc ggccggaagt acaagaaagt 2820
gcggttcatg gcctacaccg acgagacatt caagacccgg gaggccatcc agcacgagag 2880
cggcatcctg ggccccctgc tgtacggcga agtgggcgac acactgctga tcatcttcaa 2940
gaaccaggct agccggccct acaacatcta cccccacggc atcaccgacg tgcggcccct 3000
gtacagcagg cggctgccca agggcgtgaa gcacctgaag gacttcccca tcctgcccgg 3060
cgagatcttc aagtacaagt ggaccgtgac cgtggaggac ggccccacca agagcgaccc 3120
cagatgcctg acccggtact acagcagctt cgtgaacatg gaacgggacc tggcctccgg 3180
gctgatcgga cctctgctga tctgctacaa agaaagcgtg gaccagcggg gcaaccagat 3240
catgagcgac aagcggaacg tgatcctgtt cagcgtgttc gatgagaacc ggtcctggta 3300
tctgaccgag aacatccagc ggtttctgcc caaccctgcc ggcgtgcagc tggaagatcc 3360
cgagttccag gccagcaaca tcatgcactc catcaatggc tacgtgttcg actctctgca 3420
gctctccgtg tgtctgcacg aggtggccta ctggtacatc ctgagcatcg gcgcccagac 3480
cgacttcctg agcgtgttct tcagcggcta caccttcaag cacaagatgg tgtacgagga 3540
caccctgacc ctgttccctt tcagcggcga gacagtgttc atgagcatgg aaaaccccgg 3600
cctgtggatt ctgggctgcc acaacagcga cttccggaac cggggcatga ccgccctgct 3660
gaaggtgtcc agctgcgaca agaacaccgg cgactactac gaggacagct acgaggatat 3720
cagcgcctac ctgctgtcca agaacaacgc catcgaaccc cggagcttca gccagaaccc 3780
ccccgtgctg acgcgtagct tcagccagaa cagccggcac cccagcaccc ggcagaagca 3840
gttcaacgcc accaccatcc ccgagaacga catcgagaaa accgaccctt ggtttgccca 3900
ccggaccccc atgcccaaga tccagaacgt gtccagcagc gacctgctga tgctgctgcg 3960
gcagagcccc acccctcacg gcctgagcct gagcgacctg caggaagcca agtacgagac 4020
attcagcgac gaccccagcc ctggcgccat cgacagcaac aacagcctgt ccgagatgac 4080
ccacttccgg ccccagctgc accacagcgg cgacatggtg ttcacccccg agagcggcct 4140
gcagctgcgg ctgaacgaga agctgggcac caccgccgcc accgagctga agaagctgga 4200
cttcaaggtc tccagcacca gcaacaacct gatcagcacc atccccagcg acaacctggc 4260
cgctggcacc gacaacacca gcagcctggg ccctcccagc atgcccgtgc actacgacag 4320
ccagctggac accaccctgt tcggcaagaa gtccagcccc ctgaccgagt ccggcggacc 4380
cctgtccctg agcgaggaaa acaacgacag caagctgctg gaaagcggcc tgatgaacag 4440
ccaggaaagc agctggggca agaatgtgtc cagcacgcgt caccagcggg agatcacccg 4500
gacaaccctg cagtccgacc aggaagagat cgattacgac gacaccatca gcgtggagat 4560
gaagaaagag gatttcgata tctacgacga ggacgagaac cagagcccca gaagcttcca 4620
gaagaaaacc cggcactact tcattgccgc cgtggagagg ctgtgggact acggcatgag 4680
ttctagcccc cacgtgctgc ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa 4740
agtggtgttc caggaattca cagacggcag cttcacccag cctctgtata gaggcgagct 4800
gaacgagcac ctggggctgc tggggcccta catcagggcc gaagtggagg acaacatcat 4860
ggtgaccttc cggaatcagg ccagcagacc ctactccttc tacagcagcc tgatcagcta 4920
cgaagaggac cagcggcagg gcgccgaacc ccggaagaac ttcgtgaagc ccaacgaaac 4980
caagacctac ttctggaaag tgcagcacca catggccccc accaaggacg agttcgactg 5040
caaggcctgg gcctacttca gcgacgtgga tctggaaaag gacgtgcact ctggactgat 5100
tggcccactc ctggtctgcc acactaacac cctcaacccc gcccacggcc gccaggtgac 5160
cgtgcaggaa ttcgccctgt tcttcaccat cttcgacgag acaaagtcct ggtacttcac 5220
cgagaatatg gaacggaact gcagagcccc ctgcaacatc cagatggaag atcctacctt 5280
caaagagaac taccggttcc acgccatcaa cggctacatc atggacaccc tgcctggcct 5340
ggtgatggcc caggaccaga gaatccggtg gtatctgctg tccatgggca gcaacgagaa 5400
tatccacagc atccacttca gcggccacgt gttcaccgtg cggaagaaag aagagtacaa 5460
gatggccctg tacaacctgt accccggcgt gttcgagaca gtggagatgc tgcccagcaa 5520
ggccggcatc tggcgggtgg agtgtctgat cggcgagcac ctgcacgctg gcatgagcac 5580
cctgtttctg gtgtacagca acaagtgcca gaccccactg ggcatggcct ctggccacat 5640
ccgggacttc cagatcaccg cctccggcca gtacggccag tgggccccca agctggccag 5700
actgcactac agcggcagca tcaacgcctg gtccaccaaa gagcccttca gctggatcaa 5760
ggtggacctg ctggccccta tgatcatcca cggcattaag acccagggcg ccaggcagaa 5820
gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg 5880
gcagacctac cggggcaaca gcaccggcac cctgatggtg ttcttcggca atgtggacag 5940
cagcggcatc aagcacaaca tcttcaaccc ccccatcatt gcccggtaca tccggctgca 6000
ccccacccac tacagcatta gatccacact gagaatggaa ctgatgggct gcgacctgaa 6060
ctcctgcagc atgcctctgg gcatggaaag caaggccatc agcgacgccc agatcacagc 6120
cagcagctac ttcaccaaca tgttcgccac ctggtccccc tccaaggcca ggctgcacct 6180
gcagggccgg tccaacgcct ggcggcctca ggtcaacaac cccaaagaat ggctgcaggt 6240
ggactttcag aaaaccatga aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct 6300
gaccagcatg tacgtgaaag agtttctgat cagcagctct caggatggcc accagtggac 6360
cctgttcttt cagaacggca aggtgaaagt gttccagggc aaccaggact ccttcacccc 6420
cgtggtgaac tccctggacc cccccctgct gacccgctac ctgagaatcc acccccagtc 6480
ttgggtgcac cagatcgccc tcaggatgga agtcctggga tgtgaggccc aggatctgta 6540
ctgatgagcg gccgcttccc tttagtgagg gttaatgctt cgagcagaca tgataagata 6600
cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga 6660
aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa 6720
caacaattgc attcatttta tgtttcaggt tcagggggag atgtgggagg ttttttaaag 6780
caagtaaaac ctctacaaat gtggtacacg gagtggcagc accatggcct gaaataacct 6840
ctgaaagagg aacttggtta ggtaccttct gaggcggaaa gaaccagctg tggaatgtgt 6900
gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 6960
atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca ggcagaagta 7020
tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact ccgcccatcc 7080
cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta atttttttta 7140
tttatgcaga ggccgaggcc gcctcggcct ctgagctatt ccagaagtag tgaggaggct 7200
tttttggagg cctaggcttt tgcaaaaagc tcccggccgg gagcttgtat atccattttc 7260
ggatctgatc agcacgtgtt gacaattaat catcggcata gtatatcggc atagtataat 7320
acgacaaggt gaggaactaa accatggcca agcctttgtc tcaagaagaa tccaccctca 7380
ttgaaagagc aacggctaca atcaacagca tccccatctc tgaagactac agcgtcgcca 7440
gcgcagctct ctctagcgac ggccgcatct tcactggtgt caatgtatat cattttactg 7500
ggggaccttg tgcagaactc gtggtgctgg gcactgctgc tgctgcggca gctggcaacc 7560
tgacttgtat cgtcgcgatc ggaaatgaga acaggggcat cttgagcccc tgcggacggt 7620
gccgacaggt gcttctcgat ctgcatcctg ggatcaaagc catagtgaag gacagtgatg 7680
gacagccgac ggcagttggg attcgtgaat tgctgccctc tggttatgtg tgggagggct 7740
aagcacttcg tggccgagga gcaggactga cacgtgctac gagatttcga ttccaccgcc 7800
gccttctatg aaaggttggg cttcggaatc gttttccggg acgccggctg gatgatcctc 7860
cagcgcgggg atctcatgct ggagttcttc gcccacccca acttgtttat tgcagcttat 7920
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 7980
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg tactcatgag 8040
gcgcgcccgt cagacccgtt taaacagatc aaaggatctt cttgagatcc tttttttctg 8100
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 8160
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 8220
aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 8280
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 8340
<210> 35
<211> 10141
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 35
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900
taagcttgtc gaggtaatag gccaccatgc agatcgagct gtccacctgc ttttttctgt 960
gcctgctgcg gttctgcttc agcgccaccc ggcggtacta cctgggcgcc gtggagctgt 1020
cctgggacta catgcagagc gacctgggcg agctgcccgt ggacgcccgg ttccccccca 1080
gagtgcccaa gagcttcccc ttcaacacca gcgtggtgta caagaaaacc ctgttcgtgg 1140
agttcaccga ccacctgttc aatatcgcca agcccaggcc cccctggatg ggcctgctgg 1200
gccccaccat ccaggccgag gtgtacgaca ccgtggtgat caccctgaag aacatggcca 1260
gccaccccgt gagcctgcac gccgtgggcg tgagctactg gaaggccagc gagggcgccg 1320
agtacgacga ccagaccagc cagcgggaga aagaagatga caaggtgttc cctggcggca 1380
gccacaccta cgtgtggcag gtgctgaaag aaaacggccc catggcctcc gaccccctgt 1440
gcctgaccta cagctacctg agccacgtgg acctggtgaa ggacctgaac agcggcctga 1500
tcggcgctct gctcgtctgc cgggagggca gcctggccaa agagaaaacc cagaccctgc 1560
acaagttcat cctgctgttc gccgtgttcg acgagggcaa gagctggcac agcgagacaa 1620
agaacagcct gatgcaggac cgggacgccg cctctgccag agcctggccc aagatgcaca 1680
ccgtgaacgg ctacgtgaac agaagcctgc ccggcctgat tggctgccac cggaagagcg 1740
tgtactggca cgtgatcggc atgggcacca cacccgaggt gcacagcatc tttctggaag 1800
ggcacacctt tctggtccgg aaccaccggc aggccagcct ggaaatcagc cctatcacct 1860
tcctgaccgc ccagacactg ctgatggacc tgggccagtt cctgctgttt tgccacatca 1920
gctctcacca gcacgacggc atggaagcct acgtgaaggt ggactcttgc cccgaggaac 1980
cccagctgcg gatgaagaac aacgaggaag ccgaggacta cgacgacgac ctgaccgaca 2040
gcgagatgga cgtggtgcgg ttcgacgacg acaacagccc cagcttcatc cagatcagaa 2100
gcgtggccaa gaagcacccc aagacctggg tgcactatat cgccgccgag gaagaggact 2160
gggactacgc ccccctggtg ctggcccccg acgacagaag ctacaagagc cagtacctga 2220
acaatggccc ccagcggatc ggccggaagt acaagaaagt gcggttcatg gcctacaccg 2280
acgagacatt caagacccgg gaggccatcc agcacgagag cggcatcctg ggccccctgc 2340
tgtacggcga agtgggcgac acactgctga tcatcttcaa gaaccaggct agccggccct 2400
acaacatcta cccccacggc atcaccgacg tgcggcccct gtacagcagg cggctgccca 2460
agggcgtgaa gcacctgaag gacttcccca tcctgcccgg cgagatcttc aagtacaagt 2520
ggaccgtgac cgtggaggac ggccccacca agagcgaccc cagatgcctg acccggtact 2580
acagcagctt cgtgaacatg gaacgggacc tggcctccgg gctgatcgga cctctgctga 2640
tctgctacaa agaaagcgtg gaccagcggg gcaaccagat catgagcgac aagcggaacg 2700
tgatcctgtt cagcgtgttc gatgagaacc ggtcctggta tctgaccgag aacatccagc 2760
ggtttctgcc caaccctgcc ggcgtgcagc tggaagatcc cgagttccag gccagcaaca 2820
tcatgcactc catcaatggc tacgtgttcg actctctgca gctctccgtg tgtctgcacg 2880
aggtggccta ctggtacatc ctgagcatcg gcgcccagac cgacttcctg agcgtgttct 2940
tcagcggcta caccttcaag cacaagatgg tgtacgagga caccctgacc ctgttccctt 3000
tcagcggcga gacagtgttc atgagcatgg aaaaccccgg cctgtggatt ctgggctgcc 3060
acaacagcga cttccggaac cggggcatga ccgccctgct gaaggtgtcc agctgcgaca 3120
agaacaccgg cgactactac gaggacagct acgaggatat cagcgcctac ctgctgtcca 3180
agaacaacgc catcgaaccc cggagcttca gccagaaccc ccccgtgctg acgcgtagct 3240
tcagccagaa cagccggcac cccagcaccc ggcagaagca gttcaacgcc accaccatcc 3300
ccgagaacga catcgagaaa accgaccctt ggtttgccca ccggaccccc atgcccaaga 3360
tccagaacgt gtccagcagc gacctgctga tgctgctgcg gcagagcccc acccctcacg 3420
gcctgagcct gagcgacctg caggaagcca agtacgagac attcagcgac gaccccagcc 3480
ctggcgccat cgacagcaac aacagcctgt ccgagatgac ccacttccgg ccccagctgc 3540
accacagcgg cgacatggtg ttcacccccg agagcggcct gcagctgcgg ctgaacgaga 3600
agctgggcac caccgccgcc accgagctga agaagctgga cttcaaggtc tccagcacca 3660
gcaacaacct gatcagcacc atccccagcg acaacctggc cgctggcacc gacaacacca 3720
gcagcctggg ccctcccagc atgcccgtgc actacgacag ccagctggac accaccctgt 3780
tcggcaagaa gtccagcccc ctgaccgagt ccggcggacc cctgtccctg agcgaggaaa 3840
acaacgacag caagctgctg gaaagcggcc tgatgaacag ccaggaaagc agctggggca 3900
agaatgtgtc cagcacgcgt caccagcggg agatcacccg gacaaccctg cagtccgacc 3960
aggaagagat cgattacgac gacaccatca gcgtggagat gaagaaagag gatttcgata 4020
tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaaaacc cggcactact 4080
tcattgccgc cgtggagagg ctgtgggact acggcatgag ttctagcccc cacgtgctgc 4140
ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caggaattca 4200
cagacggcag cttcacccag cctctgtata gaggcgagct gaacgagcac ctggggctgc 4260
tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc cggaatcagg 4320
ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac cagcggcagg 4380
gcgccgaacc ccggaagaac ttcgtgaagc ccaacgaaac caagacctac ttctggaaag 4440
tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg gcctacttca 4500
gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggcccactc ctggtctgcc 4560
acactaacac cctcaacccc gcccacggcc gccaggtgac cgtgcaggaa ttcgccctgt 4620
tcttcaccat cttcgacgag acaaagtcct ggtacttcac cgagaatatg gaacggaact 4680
gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac taccggttcc 4740
acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc caggaccaga 4800
gaatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc atccacttca 4860
gcggccacgt gttcaccgtg cggaagaaag aagagtacaa gatggccctg tacaacctgt 4920
accccggcgt gttcgagaca gtggagatgc tgcccagcaa ggccggcatc tggcgggtgg 4980
agtgtctgat cggcgagcac ctgcacgctg gcatgagcac cctgtttctg gtgtacagca 5040
acaagtgcca gaccccactg ggcatggcct ctggccacat ccgggacttc cagatcaccg 5100
cctccggcca gtacggccag tgggccccca agctggccag actgcactac agcggcagca 5160
tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggccccta 5220
tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc ctgtacatca 5280
gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac cggggcaaca 5340
gcaccggcac cctgatggtg ttcttcggca atgtggacag cagcggcatc aagcacaaca 5400
tcttcaaccc ccccatcatt gcccggtaca tccggctgca ccccacccac tacagcatta 5460
gatccacact gagaatggaa ctgatgggct gcgacctgaa ctcctgcagc atgcctctgg 5520
gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca 5580
tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg tccaacgcct 5640
ggcggcctca ggtcaacaac cccaaagaat ggctgcaggt ggactttcag aaaaccatga 5700
aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg tacgtgaaag 5760
agtttctgat cagcagctct caggatggcc accagtggac cctgttcttt cagaacggca 5820
aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac tccctggacc 5880
cccccctgct gacccgctac ctgagaatcc acccccagtc ttgggtgcac cagatcgccc 5940
tcaggatgga agtcctggga tgtgaggccc aggatctgta ctgatgagcg gccgctcgag 6000
gtcacccatt cgaacaaaaa ctcatctcag aagaggatct gaatatgcat accggtcatc 6060
atcaccatca ccattgagtt taaacccgct gatcagcctc gactgtgcct tctagttgcc 6120
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 6180
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 6240
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 6300
atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc tggggctcta 6360
gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 6420
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 6480
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 6540
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 6600
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 6660
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 6720
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 6780
aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt gtggaaagtc 6840
cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccag 6900
gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta 6960
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 7020
cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg ccgaggccgc 7080
ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 7140
caaaaagctc ccgggagctt gtatatccat tttcggatct gatcagcacg tgttgacaat 7200
taatcatcgg catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg 7260
gccaagcctt tgtctcaaga agaatccacc ctcattgaaa gagcaacggc tacaatcaac 7320
agcatcccca tctctgaaga ctacagcgtc gccagcgcag ctctctctag cgacggccgc 7380
atcttcactg gtgtcaatgt atatcatttt actgggggac cttgtgcaga actcgtggtg 7440
ctgggcactg ctgctgctgc ggcagctggc aacctgactt gtatcgtcgc gatcggaaat 7500
gagaacaggg gcatcttgag cccctgcgga cggtgccgac aggtgcttct cgatctgcat 7560
cctgggatca aagccatagt gaaggacagt gatggacagc cgacggcagt tgggattcgt 7620
gaattgctgc cctctggtta tgtgtgggag ggctaagcac ttcgtggccg aggagcagga 7680
ctgacacgtg ctacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 7740
aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 7800
cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 7860
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 7920
catcaatgta tcttatcatg tctgtatacc gtcgacctct agctagagct tggcgtaatc 7980
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 8040
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 8100
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 8160
aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 8220
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 8280
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 8340
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 8400
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 8460
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 8520
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 8580
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 8640
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 8700
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8760
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8820
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8880
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8940
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 9000
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 9060
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 9120
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 9180
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 9240
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 9300
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 9360
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 9420
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 9480
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 9540
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 9600
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 9660
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9720
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9780
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9840
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9900
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9960
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 10020
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 10080
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 10140
c 10141
<210> 36
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 36
agcaacgcga tttaaattgc tttctctgac cagcattctc tcccct 46
<210> 37
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 37
tgaagatctc ctgcagggcc ccactgtggg gtggagggga cagataaaag ta 52
<210> 38
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 38
tactcatgag gcgcgccact actagggaca ggattggtga cagaaaagcc cca 53
<210> 39
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 39
tgatctgttt aaacagagca gagccaggaa cacctgtagg gaaggggca 49
<210> 40
<211> 4923
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 40
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aattgctttc 360
tctgaccagc attctctccc ctgggcctgt gccgctttct gtctgcagct tgtggcctgg 420
gtcacctcta cggctggccc agatccttcc ctgccgcctc cttcaggttc cgtcttcctc 480
cactccctct tccccttgct ctctgctgtg ttgctgccca aggatgctct ttccggagca 540
cttccttctc ggcgctgcac cacgtgatgt cctctgagcg gatcctcccc gtgtctgggt 600
cctctccggg catctctcct ccctcaccca accccatgcc gtcttcactc gctgggttcc 660
cttttccttc tccttctggg gcctgtgcca tctctcgttt cttaggatgg ccttctccga 720
cggatgtctc ccttgcgtcc cgcctcccct tcttgtaggc ctgcatcatc accgtttttc 780
tggacaaccc caaagtaccc cgtctccctg gctttagcca cctctccatc ctcttgcttt 840
ctttgcctgg acaccccgtt ctcctgtgga ttcgggtcac ctctcactcc tttcatttgg 900
gcagctcccc tacccccctt acctctctag tctgtgctag ctcttccagc cccctgtcat 960
ggcatcttcc aggggtccga gagctcagct agtcttcttc ctccaacccg ggcccctatg 1020
tccacttcag gacagcatgt ttgctgcctc cagggatcct gtgtccccga gctgggacca 1080
ccttatattc ccagggccgg ttaatgtggc tctggttctg ggtactttta tctgtcccct 1140
ccaccccaca gtggggccct gcaggagatc ttcaatattg gccattagcc atattattca 1200
ttggttatat agcataaatc aatattggct attggccatt gcatacgttg tatctatatc 1260
ataatatgta catttatatt ggctcatgtc caatatgacc gccatgttgg cattgattat 1320
tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 1380
tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 1440
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 1500
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 1560
tgccaagtcc gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 1620
agtacatgac cttacgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 1680
ttaccatggt gatgcggttt tggcagtaca ccaatgggcg tggatagcgg tttgactcac 1740
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 1800
aacgggactt tccaaaatgt cgtaacaact gcgatcgccc gccccgttga cgcaaatggg 1860
cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 1920
cactagaagc tttattgcgg tagtttatca cagttaaatt gctaacgcag tcagtgcttc 1980
tgacacaaca gtctcgaact taagctgcag tgactctctt aaggtagcct tgcagaagtt 2040
ggtcgtgagg cactgggcag gtaagtatca aggttacaag acaggtttaa ggagaccaat 2100
agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc 2160
ttactgacat ccactttgcc tttctctcca caggtgtcca ctcccagttc aattacagct 2220
cttaaggcta gagtacttaa tacgactcac tataggctag cctcgagaat tcacgcgtgg 2280
tacctctaga gtcgacccgg gcggccgctt ccctttagtg agggttaatg cttcgagcag 2340
acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag tgaaaaaaat 2400
gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata 2460
aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg gagatgtggg 2520
aggtttttta aagcaagtaa aacctctaca aatgtggtac acggagtggc agcaccatgg 2580
cctgaaataa cctctgaaag aggaacttgg ttaggtacct tctgaggcgg aaagaaccag 2640
ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 2700
atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 2760
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 2820
actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 2880
ctaatttttt ttatttatgc agaggccgag gccgcctcgg cctctgagct attccagaag 2940
tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agctcccggc cgggagcttg 3000
tatatccatt ttcggatctg atcagcacgt gttgacaatt aatcatcggc atagtatatc 3060
ggcatagtat aatacgacaa ggtgaggaac taaaccatgg ccaagccttt gtctcaagaa 3120
gaatccaccc tcattgaaag agcaacggct acaatcaaca gcatccccat ctctgaagac 3180
tacagcgtcg ccagcgcagc tctctctagc gacggccgca tcttcactgg tgtcaatgta 3240
tatcatttta ctgggggacc ttgtgcagaa ctcgtggtgc tgggcactgc tgctgctgcg 3300
gcagctggca acctgacttg tatcgtcgcg atcggaaatg agaacagggg catcttgagc 3360
ccctgcggac ggtgccgaca ggtgcttctc gatctgcatc ctgggatcaa agccatagtg 3420
aaggacagtg atggacagcc gacggcagtt gggattcgtg aattgctgcc ctctggttat 3480
gtgtgggagg gctaagcact tcgtggccga ggagcaggac tgacacgtgc tacgagattt 3540
cgattccacc gccgccttct atgaaaggtt gggcttcgga atcgttttcc gggacgccgg 3600
ctggatgatc ctccagcgcg gggatctcat gctggagttc ttcgcccacc ccaacttgtt 3660
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc 3720
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt 3780
ctgtactcat gaggcgcgcc actactaggg acaggattgg tgacagaaaa gccccatcct 3840
taggcctcct ccttcctagt ctcctgatat tgggtctaac ccccacctcc tgttaggcag 3900
attccttatc tggtgacaca cccccatttc ctggagccat ctctctcctt gccagaacct 3960
ctaaggtttg cttacgatgg agccagagag gatcctggga gggagagctt ggcagggggt 4020
gggagggaag ggggggatgc gtgacctgcc cggttctcag tggccaccct gcgctaccct 4080
ctcccagaac ctgagctgct ctgacgcggc tgtctggtgc gtttcactga tcctggtgct 4140
gcagcttcct tacacttccc aagaggagaa gcagtttgga aaaacaaaat cagaataagt 4200
tggtcctgag ttctaacttt ggctcttcac ctttctagtc cccaatttat attgttcctc 4260
cgtgcgtcag ttttacctgt gagataaggc cagtagccag ccccgtcctg gcagggctgt 4320
ggtgaggagg ggggtgtccg tgtggaaaac tccctttgtg agaatggtgc gtcctaggtg 4380
ttcaccaggt cgtggccgcc tctactccct ttctctttct ccatccttct ttccttaaag 4440
agtccccagt gctatctggg acatattcct ccgcccagag cagggtcccg cttccctaag 4500
gccctgctct gggcttctgg gtttgagtcc ttggcaagcc caggagaggc gctcaggctt 4560
ccctgtcccc cttcctcgtc caccatctca tgcccctggc tctcctgccc cttccctaca 4620
ggtgttcctg gctctgctct gtttaaacag atcaaaggat cttcttgaga tccttttttt 4680
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 4740
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 4800
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 4860
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 4920
tcg 4923
<210> 41
<211> 6266
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 41
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aattgctttc 360
tctgaccagc attctctccc ctgggcctgt gccgctttct gtctgcagct tgtggcctgg 420
gtcacctcta cggctggccc agatccttcc ctgccgcctc cttcaggttc cgtcttcctc 480
cactccctct tccccttgct ctctgctgtg ttgctgccca aggatgctct ttccggagca 540
cttccttctc ggcgctgcac cacgtgatgt cctctgagcg gatcctcccc gtgtctgggt 600
cctctccggg catctctcct ccctcaccca accccatgcc gtcttcactc gctgggttcc 660
cttttccttc tccttctggg gcctgtgcca tctctcgttt cttaggatgg ccttctccga 720
cggatgtctc ccttgcgtcc cgcctcccct tcttgtaggc ctgcatcatc accgtttttc 780
tggacaaccc caaagtaccc cgtctccctg gctttagcca cctctccatc ctcttgcttt 840
ctttgcctgg acaccccgtt ctcctgtgga ttcgggtcac ctctcactcc tttcatttgg 900
gcagctcccc tacccccctt acctctctag tctgtgctag ctcttccagc cccctgtcat 960
ggcatcttcc aggggtccga gagctcagct agtcttcttc ctccaacccg ggcccctatg 1020
tccacttcag gacagcatgt ttgctgcctc cagggatcct gtgtccccga gctgggacca 1080
ccttatattc ccagggccgg ttaatgtggc tctggttctg ggtactttta tctgtcccct 1140
ccaccccaca gtggggccct gcaggagatc ttcaatattg gccattagcc atattattca 1200
ttggttatat agcataaatc aatattggct attggccatt gcatacgttg tatctatatc 1260
ataatatgta catttatatt ggctcatgtc caatatgacc gccatgttgg cattgattat 1320
tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 1380
tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 1440
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 1500
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 1560
tgccaagtcc gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 1620
agtacatgac cttacgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 1680
ttaccatggt gatgcggttt tggcagtaca ccaatgggcg tggatagcgg tttgactcac 1740
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 1800
aacgggactt tccaaaatgt cgtaacaact gcgatcgccc gccccgttga cgcaaatggg 1860
cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 1920
cactagaagc tttattgcgg tagtttatca cagttaaatt gctaacgcag tcagtgcttc 1980
tgacacaaca gtctcgaact taagctgcag tgactctctt aaggtagcct tgcagaagtt 2040
ggtcgtgagg cactgggcag gtaagtatca aggttacaag acaggtttaa ggagaccaat 2100
agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc 2160
ttactgacat ccactttgcc tttctctcca caggtgtcca ctcccagttc aattacagct 2220
cttaaggcta gagtacttaa tacgactcac tataggctag cctcgagaat tctaataggc 2280
caccatgtcc actgcggtcc tggaaaaccc aggcttgggc aggaaactct ctgactttgg 2340
acaggaaaca agctatattg aagacaactg caatcaaaat ggtgccatat cgctgatctt 2400
ctcactcaaa gaagaagttg gtgcattggc caaagtattg cgcttatttg aggagaatga 2460
tgtaaacctg acccacattg aatctagacc ttctcgttta aagaaagatg agtatgaatt 2520
tttcacccat ttggataaac gtagcctgcc tgctctgaca aacatcatca agatcttgag 2580
gcatgacatt ggtgccactg tccatgagct ttcacgagat aagaagaaag acacagtgcc 2640
ctggttccca agaaccattc aagagctgga cagatttgcc aatcagattc tcagctatgg 2700
agcggaactg gatgctgacc accctggttt taaagatcct gtgtaccgtg caagacggaa 2760
gcagtttgct gacattgcct acaactaccg ccatgggcag cccatccctc gagtggaata 2820
catggaggaa ggaaagaaaa catggggcac agtgttcaag actctgaagt ccttgtataa 2880
aacccatgct tgctatgagt acaatcacat ttttccactt cttgaaaagt actgtggctt 2940
ccatgaagat aacattcccc agctggaaga cgtttctcag ttcctgcaga cttgcactgg 3000
tttccgcctc cgacctgtgg ctggcctgct ttcctctcgg gatttcttgg gtggcctggc 3060
cttccgagtc ttccactgca cacagtacat cagacatgga tccaagccca tgtatacccc 3120
cgaacctgac atctgccatg agctgttggg acatgtgccc ttgttttcag atcgcagctt 3180
tgcccagttt tcccaggaaa ttggccttgc ctctctgggt gcacctgatg aatacattga 3240
aaagctcgcc acaatttact ggtttactgt ggagtttggg ctctgcaaac aaggagactc 3300
cataaaggca tatggtgctg ggctcctgtc atcctttggt gaattacagt actgcttatc 3360
agagaagcca aagcttctcc ccctggagct ggagaagaca gccatccaaa attacactgt 3420
cacggagttc cagcccctct attacgtggc agagagtttt aatgatgcca aggagaaagt 3480
aaggaacttt gctgccacaa tacctcggcc cttctcagtt cgctacgacc catacaccca 3540
aaggattgag gtcttggaca atacccagca gcttaagatt ttggctgatt ccattaacag 3600
tgaaattgga atcctttgca gtgccctcca gaaaataaag taggcggccg cttcccttta 3660
gtgagggtta atgcttcgag cagacatgat aagatacatt gatgagtttg gacaaaccac 3720
aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt 3780
tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc attttatgtt 3840
tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct acaaatgtgg 3900
tacacggagt ggcagcacca tggcctgaaa taacctctga aagaggaact tggttaggta 3960
ccttctgagg cggaaagaac cagctgtgga atgtgtgtca gttagggtgt ggaaagtccc 4020
caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 4080
gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4140
cagcaaccat agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg 4200
cccattctcc gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct 4260
cggcctctga gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca 4320
aaaagctccc ggccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca 4380
attaatcatc ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca 4440
tggccaagcc tttgtctcaa gaagaatcca ccctcattga aagagcaacg gctacaatca 4500
acagcatccc catctctgaa gactacagcg tcgccagcgc agctctctct agcgacggcc 4560
gcatcttcac tggtgtcaat gtatatcatt ttactggggg accttgtgca gaactcgtgg 4620
tgctgggcac tgctgctgct gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa 4680
atgagaacag gggcatcttg agcccctgcg gacggtgccg acaggtgctt ctcgatctgc 4740
atcctgggat caaagccata gtgaaggaca gtgatggaca gccgacggca gttgggattc 4800
gtgaattgct gccctctggt tatgtgtggg agggctaagc acttcgtggc cgaggagcag 4860
gactgacacg tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 5040
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 5100
ctcatcaatg tatcttatca tgtctgtact catgaggcgc gccactacta gggacaggat 5160
tggtgacaga aaagccccat ccttaggcct cctccttcct agtctcctga tattgggtct 5220
aacccccacc tcctgttagg cagattcctt atctggtgac acacccccat ttcctggagc 5280
catctctctc cttgccagaa cctctaaggt ttgcttacga tggagccaga gaggatcctg 5340
ggagggagag cttggcaggg ggtgggaggg aaggggggga tgcgtgacct gcccggttct 5400
cagtggccac cctgcgctac cctctcccag aacctgagct gctctgacgc ggctgtctgg 5460
tgcgtttcac tgatcctggt gctgcagctt ccttacactt cccaagagga gaagcagttt 5520
ggaaaaacaa aatcagaata agttggtcct gagttctaac tttggctctt cacctttcta 5580
gtccccaatt tatattgttc ctccgtgcgt cagttttacc tgtgagataa ggccagtagc 5640
cagccccgtc ctggcagggc tgtggtgagg aggggggtgt ccgtgtggaa aactcccttt 5700
gtgagaatgg tgcgtcctag gtgttcacca ggtcgtggcc gcctctactc cctttctctt 5760
tctccatcct tctttcctta aagagtcccc agtgctatct gggacatatt cctccgccca 5820
gagcagggtc ccgcttccct aaggccctgc tctgggcttc tgggtttgag tccttggcaa 5880
gcccaggaga ggcgctcagg cttccctgtc ccccttcctc gtccaccatc tcatgcccct 5940
ggctctcctg ccccttccct acaggtgttc ctggctctgc tctgtttaaa cagatcaaag 6000
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6060
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6120
ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 6180
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6240
tggctgctgc cagtggcgat aagtcg 6266
<210> 42
<211> 9964
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 42
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 60
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 120
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 180
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 240
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 300
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcgattta aattgctttc 360
tctgaccagc attctctccc ctgggcctgt gccgctttct gtctgcagct tgtggcctgg 420
gtcacctcta cggctggccc agatccttcc ctgccgcctc cttcaggttc cgtcttcctc 480
cactccctct tccccttgct ctctgctgtg ttgctgccca aggatgctct ttccggagca 540
cttccttctc ggcgctgcac cacgtgatgt cctctgagcg gatcctcccc gtgtctgggt 600
cctctccggg catctctcct ccctcaccca accccatgcc gtcttcactc gctgggttcc 660
cttttccttc tccttctggg gcctgtgcca tctctcgttt cttaggatgg ccttctccga 720
cggatgtctc ccttgcgtcc cgcctcccct tcttgtaggc ctgcatcatc accgtttttc 780
tggacaaccc caaagtaccc cgtctccctg gctttagcca cctctccatc ctcttgcttt 840
ctttgcctgg acaccccgtt ctcctgtgga ttcgggtcac ctctcactcc tttcatttgg 900
gcagctcccc tacccccctt acctctctag tctgtgctag ctcttccagc cccctgtcat 960
ggcatcttcc aggggtccga gagctcagct agtcttcttc ctccaacccg ggcccctatg 1020
tccacttcag gacagcatgt ttgctgcctc cagggatcct gtgtccccga gctgggacca 1080
ccttatattc ccagggccgg ttaatgtggc tctggttctg ggtactttta tctgtcccct 1140
ccaccccaca gtggggccct gcaggagatc ttcaatattg gccattagcc atattattca 1200
ttggttatat agcataaatc aatattggct attggccatt gcatacgttg tatctatatc 1260
ataatatgta catttatatt ggctcatgtc caatatgacc gccatgttgg cattgattat 1320
tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 1380
tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 1440
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 1500
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 1560
tgccaagtcc gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 1620
agtacatgac cttacgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 1680
ttaccatggt gatgcggttt tggcagtaca ccaatgggcg tggatagcgg tttgactcac 1740
ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 1800
aacgggactt tccaaaatgt cgtaacaact gcgatcgccc gccccgttga cgcaaatggg 1860
cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 1920
cactagaagc tttattgcgg tagtttatca cagttaaatt gctaacgcag tcagtgcttc 1980
tgacacaaca gtctcgaact taagctgcag tgactctctt aaggtagcct tgcagaagtt 2040
ggtcgtgagg cactgggcag gtaagtatca aggttacaag acaggtttaa ggagaccaat 2100
agaaactggg cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc 2160
ttactgacat ccactttgcc tttctctcca caggtgtcca ctcccagttc aattacagct 2220
cttaaggcta gagtacttaa tacgactcac tataggctag cctcgaggta ataggccacc 2280
atgcagatcg agctgtccac ctgctttttt ctgtgcctgc tgcggttctg cttcagcgcc 2340
acccggcggt actacctggg cgccgtggag ctgtcctggg actacatgca gagcgacctg 2400
ggcgagctgc ccgtggacgc ccggttcccc cccagagtgc ccaagagctt ccccttcaac 2460
accagcgtgg tgtacaagaa aaccctgttc gtggagttca ccgaccacct gttcaatatc 2520
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 2580
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 2640
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgg 2700
gagaaagaag atgacaaggt gttccctggc ggcagccaca cctacgtgtg gcaggtgctg 2760
aaagaaaacg gccccatggc ctccgacccc ctgtgcctga cctacagcta cctgagccac 2820
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ctctgctcgt ctgccgggag 2880
ggcagcctgg ccaaagagaa aacccagacc ctgcacaagt tcatcctgct gttcgccgtg 2940
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggaccgggac 3000
gccgcctctg ccagagcctg gcccaagatg cacaccgtga acggctacgt gaacagaagc 3060
ctgcccggcc tgattggctg ccaccggaag agcgtgtact ggcacgtgat cggcatgggc 3120
accacacccg aggtgcacag catctttctg gaagggcaca cctttctggt ccggaaccac 3180
cggcaggcca gcctggaaat cagccctatc accttcctga ccgcccagac actgctgatg 3240
gacctgggcc agttcctgct gttttgccac atcagctctc accagcacga cggcatggaa 3300
gcctacgtga aggtggactc ttgccccgag gaaccccagc tgcggatgaa gaacaacgag 3360
gaagccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcggttcgac 3420
gacgacaaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc 3480
tgggtgcact atatcgccgc cgaggaagag gactgggact acgcccccct ggtgctggcc 3540
cccgacgaca gaagctacaa gagccagtac ctgaacaatg gcccccagcg gatcggccgg 3600
aagtacaaga aagtgcggtt catggcctac accgacgaga cattcaagac ccgggaggcc 3660
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaagtggg cgacacactg 3720
ctgatcatct tcaagaacca ggctagccgg ccctacaaca tctaccccca cggcatcacc 3780
gacgtgcggc ccctgtacag caggcggctg cccaagggcg tgaagcacct gaaggacttc 3840
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc 3900
accaagagcg accccagatg cctgacccgg tactacagca gcttcgtgaa catggaacgg 3960
gacctggcct ccgggctgat cggacctctg ctgatctgct acaaagaaag cgtggaccag 4020
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgttcagcgt gttcgatgag 4080
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaaccc tgccggcgtg 4140
cagctggaag atcccgagtt ccaggccagc aacatcatgc actccatcaa tggctacgtg 4200
ttcgactctc tgcagctctc cgtgtgtctg cacgaggtgg cctactggta catcctgagc 4260
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 4320
atggtgtacg aggacaccct gaccctgttc cctttcagcg gcgagacagt gttcatgagc 4380
atggaaaacc ccggcctgtg gattctgggc tgccacaaca gcgacttccg gaaccggggc 4440
atgaccgccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac 4500
agctacgagg atatcagcgc ctacctgctg tccaagaaca acgccatcga accccggagc 4560
ttcagccaga acccccccgt gctgacgcgt agcttcagcc agaacagccg gcaccccagc 4620
acccggcaga agcagttcaa cgccaccacc atccccgaga acgacatcga gaaaaccgac 4680
ccttggtttg cccaccggac ccccatgccc aagatccaga acgtgtccag cagcgacctg 4740
ctgatgctgc tgcggcagag ccccacccct cacggcctga gcctgagcga cctgcaggaa 4800
gccaagtacg agacattcag cgacgacccc agccctggcg ccatcgacag caacaacagc 4860
ctgtccgaga tgacccactt ccggccccag ctgcaccaca gcggcgacat ggtgttcacc 4920
cccgagagcg gcctgcagct gcggctgaac gagaagctgg gcaccaccgc cgccaccgag 4980
ctgaagaagc tggacttcaa ggtctccagc accagcaaca acctgatcag caccatcccc 5040
agcgacaacc tggccgctgg caccgacaac accagcagcc tgggccctcc cagcatgccc 5100
gtgcactacg acagccagct ggacaccacc ctgttcggca agaagtccag ccccctgacc 5160
gagtccggcg gacccctgtc cctgagcgag gaaaacaacg acagcaagct gctggaaagc 5220
ggcctgatga acagccagga aagcagctgg ggcaagaatg tgtccagcac gcgtcaccag 5280
cgggagatca cccggacaac cctgcagtcc gaccaggaag agatcgatta cgacgacacc 5340
atcagcgtgg agatgaagaa agaggatttc gatatctacg acgaggacga gaaccagagc 5400
cccagaagct tccagaagaa aacccggcac tacttcattg ccgccgtgga gaggctgtgg 5460
gactacggca tgagttctag cccccacgtg ctgcggaacc gggcccagag cggcagcgtg 5520
ccccagttca agaaagtggt gttccaggaa ttcacagacg gcagcttcac ccagcctctg 5580
tatagaggcg agctgaacga gcacctgggg ctgctggggc cctacatcag ggccgaagtg 5640
gaggacaaca tcatggtgac cttccggaat caggccagca gaccctactc cttctacagc 5700
agcctgatca gctacgaaga ggaccagcgg cagggcgccg aaccccggaa gaacttcgtg 5760
aagcccaacg aaaccaagac ctacttctgg aaagtgcagc accacatggc ccccaccaag 5820
gacgagttcg actgcaaggc ctgggcctac ttcagcgacg tggatctgga aaaggacgtg 5880
cactctggac tgattggccc actcctggtc tgccacacta acaccctcaa ccccgcccac 5940
ggccgccagg tgaccgtgca ggaattcgcc ctgttcttca ccatcttcga cgagacaaag 6000
tcctggtact tcaccgagaa tatggaacgg aactgcagag ccccctgcaa catccagatg 6060
gaagatccta ccttcaaaga gaactaccgg ttccacgcca tcaacggcta catcatggac 6120
accctgcctg gcctggtgat ggcccaggac cagagaatcc ggtggtatct gctgtccatg 6180
ggcagcaacg agaatatcca cagcatccac ttcagcggcc acgtgttcac cgtgcggaag 6240
aaagaagagt acaagatggc cctgtacaac ctgtaccccg gcgtgttcga gacagtggag 6300
atgctgccca gcaaggccgg catctggcgg gtggagtgtc tgatcggcga gcacctgcac 6360
gctggcatga gcaccctgtt tctggtgtac agcaacaagt gccagacccc actgggcatg 6420
gcctctggcc acatccggga cttccagatc accgcctccg gccagtacgg ccagtgggcc 6480
cccaagctgg ccagactgca ctacagcggc agcatcaacg cctggtccac caaagagccc 6540
ttcagctgga tcaaggtgga cctgctggcc cctatgatca tccacggcat taagacccag 6600
ggcgccaggc agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg 6660
gacggcaaga agtggcagac ctaccggggc aacagcaccg gcaccctgat ggtgttcttc 6720
ggcaatgtgg acagcagcgg catcaagcac aacatcttca acccccccat cattgcccgg 6780
tacatccggc tgcaccccac ccactacagc attagatcca cactgagaat ggaactgatg 6840
ggctgcgacc tgaactcctg cagcatgcct ctgggcatgg aaagcaaggc catcagcgac 6900
gcccagatca cagccagcag ctacttcacc aacatgttcg ccacctggtc cccctccaag 6960
gccaggctgc acctgcaggg ccggtccaac gcctggcggc ctcaggtcaa caaccccaaa 7020
gaatggctgc aggtggactt tcagaaaacc atgaaggtga ccggcgtgac cacccagggc 7080
gtgaaaagcc tgctgaccag catgtacgtg aaagagtttc tgatcagcag ctctcaggat 7140
ggccaccagt ggaccctgtt ctttcagaac ggcaaggtga aagtgttcca gggcaaccag 7200
gactccttca cccccgtggt gaactccctg gacccccccc tgctgacccg ctacctgaga 7260
atccaccccc agtcttgggt gcaccagatc gccctcagga tggaagtcct gggatgtgag 7320
gcccaggatc tgtactgatg agcggccgct tccctttagt gagggttaat gcttcgagca 7380
gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 7440
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 7500
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg 7560
gaggtttttt aaagcaagta aaacctctac aaatgtggta cacggagtgg cagcaccatg 7620
gcctgaaata acctctgaaa gaggaacttg gttaggtacc ttctgaggcg gaaagaacca 7680
gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 7740
tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 7800
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 7860
aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 7920
actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa 7980
gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcccgg ccgggagctt 8040
gtatatccat tttcggatct gatcagcacg tgttgacaat taatcatcgg catagtatat 8100
cggcatagta taatacgaca aggtgaggaa ctaaaccatg gccaagcctt tgtctcaaga 8160
agaatccacc ctcattgaaa gagcaacggc tacaatcaac agcatcccca tctctgaaga 8220
ctacagcgtc gccagcgcag ctctctctag cgacggccgc atcttcactg gtgtcaatgt 8280
atatcatttt actgggggac cttgtgcaga actcgtggtg ctgggcactg ctgctgctgc 8340
ggcagctggc aacctgactt gtatcgtcgc gatcggaaat gagaacaggg gcatcttgag 8400
cccctgcgga cggtgccgac aggtgcttct cgatctgcat cctgggatca aagccatagt 8460
gaaggacagt gatggacagc cgacggcagt tgggattcgt gaattgctgc cctctggtta 8520
tgtgtgggag ggctaagcac ttcgtggccg aggagcagga ctgacacgtg ctacgagatt 8580
tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 8640
gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt 8700
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 8760
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 8820
tctgtactca tgaggcgcgc cactactagg gacaggattg gtgacagaaa agccccatcc 8880
ttaggcctcc tccttcctag tctcctgata ttgggtctaa cccccacctc ctgttaggca 8940
gattccttat ctggtgacac acccccattt cctggagcca tctctctcct tgccagaacc 9000
tctaaggttt gcttacgatg gagccagaga ggatcctggg agggagagct tggcaggggg 9060
tgggagggaa gggggggatg cgtgacctgc ccggttctca gtggccaccc tgcgctaccc 9120
tctcccagaa cctgagctgc tctgacgcgg ctgtctggtg cgtttcactg atcctggtgc 9180
tgcagcttcc ttacacttcc caagaggaga agcagtttgg aaaaacaaaa tcagaataag 9240
ttggtcctga gttctaactt tggctcttca cctttctagt ccccaattta tattgttcct 9300
ccgtgcgtca gttttacctg tgagataagg ccagtagcca gccccgtcct ggcagggctg 9360
tggtgaggag gggggtgtcc gtgtggaaaa ctccctttgt gagaatggtg cgtcctaggt 9420
gttcaccagg tcgtggccgc ctctactccc tttctctttc tccatccttc tttccttaaa 9480
gagtccccag tgctatctgg gacatattcc tccgcccaga gcagggtccc gcttccctaa 9540
ggccctgctc tgggcttctg ggtttgagtc cttggcaagc ccaggagagg cgctcaggct 9600
tccctgtccc ccttcctcgt ccaccatctc atgcccctgg ctctcctgcc ccttccctac 9660
aggtgttcct ggctctgctc tgtttaaaca gatcaaagga tcttcttgag atcctttttt 9720
tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 9780
gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 9840
accaaatact gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 9900
accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 9960
gtcg 9964
<210> 43
<211> 8134
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 43
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900
taagcttggt accgagctcg gatccactag tccagtgtgg tggaattcta ataggccacc 960
atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 1020
gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcgct gatcttctca 1080
ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 1140
aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 1200
acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 1260
gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 1320
ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 1380
gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 1440
tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 1500
gaggaaggaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 1560
catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 1620
gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 1680
cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 1740
cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 1800
cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 1860
cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 1920
ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1980
aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 2040
aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 2100
gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 2160
aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 2220
attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 2280
attggaatcc tttgcagtgc cctccagaaa ataaagtagg cggccgctcg aggtcaccca 2340
ttcgaacaaa aactcatctc agaagaggat ctgaatatgc ataccggtca tcatcaccat 2400
caccattgag tttaaacccg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 2460
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 2520
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 2580
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 2640
gatgcggtgg gctctatggc ttctgaggcg gaaagaacca gctggggctc tagggggtat 2700
ccccacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg 2760
accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc 2820
gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga 2880
tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt 2940
gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat 3000
agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat 3060
ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa 3120
tttaacgcga attaattctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 3180
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3240
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3300
ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 3360
ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 3420
ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 3480
tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgttgaca attaatcatc 3540
ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagcc 3600
tttgtctcaa gaagaatcca ccctcattga aagagcaacg gctacaatca acagcatccc 3660
catctctgaa gactacagcg tcgccagcgc agctctctct agcgacggcc gcatcttcac 3720
tggtgtcaat gtatatcatt ttactggggg accttgtgca gaactcgtgg tgctgggcac 3780
tgctgctgct gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa atgagaacag 3840
gggcatcttg agcccctgcg gacggtgccg acaggtgctt ctcgatctgc atcctgggat 3900
caaagccata gtgaaggaca gtgatggaca gccgacggca gttgggattc gtgaattgct 3960
gccctctggt tatgtgtggg agggctaagc acttcgtggc cgaggagcag gactgacacg 4020
tgctacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc ggaatcgttt 4080
tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag ttcttcgccc 4140
accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 4200
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 4260
tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa tcatggtcat 4320
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 4380
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 4440
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 4500
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc ccgcgccact actagggaca 4560
ggattggtga cagaaaagcc ccatccttag gcctcctcct tcctagtctc ctgatattgg 4620
gtctaacccc cacctcctgt taggcagatt ccttatctgg tgacacaccc ccatttcctg 4680
gagccatctc tctccttgcc agaacctcta aggtttgctt acgatggagc cagagaggat 4740
cctgggaggg agagcttggc agggggtggg agggaagggg gggatgcgtg acctgcccgg 4800
ttctcagtgg ccaccctgcg ctaccctctc ccagaacctg agctgctctg acgcggctgt 4860
ctggtgcgtt tcactgatcc tggtgctgca gcttccttac acttcccaag aggagaagca 4920
gtttggaaaa acaaaatcag aataagttgg tcctgagttc taactttggc tcttcacctt 4980
tctagtcccc aatttatatt gttcctccgt gcgtcagttt tacctgtgag ataaggccag 5040
tagccagccc cgtcctggca gggctgtggt gaggaggggg gtgtccgtgt ggaaaactcc 5100
ctttgtgaga atggtgcgtc ctaggtgttc accaggtcgt ggccgcctct actccctttc 5160
tctttctcca tccttctttc cttaaagagt ccccagtgct atctgggaca tattcctccg 5220
cccagagcag ggtcccgctt ccctaaggcc ctgctctggg cttctgggtt tgagtccttg 5280
gcaagcccag gagaggcgct caggcttccc tgtccccctt cctcgtccac catctcatgc 5340
ccctggctct cctgcccctt ccctacaggt gttcctggct ctgctctgtt ttcctcgctc 5400
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 5460
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 5520
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 5580
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 5640
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 5700
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 5760
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 5820
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5880
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 5940
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 6000
agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 6060
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 6120
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 6180
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 6240
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 6300
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 6360
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 6420
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 6480
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 6540
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 6600
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 6660
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 6720
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 6780
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 6840
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 6900
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 6960
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 7020
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 7080
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 7140
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 7200
taaattgctt tctctgacca gcattctctc ccctgggcct gtgccgcttt ctgtctgcag 7260
cttgtggcct gggtcacctc tacggctggc ccagatcctt ccctgccgcc tccttcaggt 7320
tccgtcttcc tccactccct cttccccttg ctctctgctg tgttgctgcc caaggatgct 7380
ctttccggag cacttccttc tcggcgctgc accacgtgat gtcctctgag cggatcctcc 7440
ccgtgtctgg gtcctctccg ggcatctctc ctccctcacc caaccccatg ccgtcttcac 7500
tcgctgggtt cccttttcct tctccttctg gggcctgtgc catctctcgt ttcttaggat 7560
ggccttctcc gacggatgtc tcccttgcgt cccgcctccc cttcttgtag gcctgcatca 7620
tcaccgtttt tctggacaac cccaaagtac cccgtctccc tggctttagc cacctctcca 7680
tcctcttgct ttctttgcct ggacaccccg ttctcctgtg gattcgggtc acctctcact 7740
cctttcattt gggcagctcc cctacccccc ttacctctct agtctgtgct agctcttcca 7800
gccccctgtc atggcatctt ccaggggtcc gagagctcag ctagtcttct tcctccaacc 7860
cgggccccta tgtccacttc aggacagcat gtttgctgcc tccagggatc ctgtgtcccc 7920
gagctgggac caccttatat tcccagggcc ggttaatgtg gctctggttc tgggtacttt 7980
tatctgtccc ctccacccca cagtggggcc ctgcaattat tgaagcattt atcagggtta 8040
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 8100
gcgcacattt ccccgaaaag tgccacctga cgtc 8134
<210> 44
<211> 11805
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 44
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900
taagcttgtc gaggtaatag gccaccatgc agatcgagct gtccacctgc ttttttctgt 960
gcctgctgcg gttctgcttc agcgccaccc ggcggtacta cctgggcgcc gtggagctgt 1020
cctgggacta catgcagagc gacctgggcg agctgcccgt ggacgcccgg ttccccccca 1080
gagtgcccaa gagcttcccc ttcaacacca gcgtggtgta caagaaaacc ctgttcgtgg 1140
agttcaccga ccacctgttc aatatcgcca agcccaggcc cccctggatg ggcctgctgg 1200
gccccaccat ccaggccgag gtgtacgaca ccgtggtgat caccctgaag aacatggcca 1260
gccaccccgt gagcctgcac gccgtgggcg tgagctactg gaaggccagc gagggcgccg 1320
agtacgacga ccagaccagc cagcgggaga aagaagatga caaggtgttc cctggcggca 1380
gccacaccta cgtgtggcag gtgctgaaag aaaacggccc catggcctcc gaccccctgt 1440
gcctgaccta cagctacctg agccacgtgg acctggtgaa ggacctgaac agcggcctga 1500
tcggcgctct gctcgtctgc cgggagggca gcctggccaa agagaaaacc cagaccctgc 1560
acaagttcat cctgctgttc gccgtgttcg acgagggcaa gagctggcac agcgagacaa 1620
agaacagcct gatgcaggac cgggacgccg cctctgccag agcctggccc aagatgcaca 1680
ccgtgaacgg ctacgtgaac agaagcctgc ccggcctgat tggctgccac cggaagagcg 1740
tgtactggca cgtgatcggc atgggcacca cacccgaggt gcacagcatc tttctggaag 1800
ggcacacctt tctggtccgg aaccaccggc aggccagcct ggaaatcagc cctatcacct 1860
tcctgaccgc ccagacactg ctgatggacc tgggccagtt cctgctgttt tgccacatca 1920
gctctcacca gcacgacggc atggaagcct acgtgaaggt ggactcttgc cccgaggaac 1980
cccagctgcg gatgaagaac aacgaggaag ccgaggacta cgacgacgac ctgaccgaca 2040
gcgagatgga cgtggtgcgg ttcgacgacg acaacagccc cagcttcatc cagatcagaa 2100
gcgtggccaa gaagcacccc aagacctggg tgcactatat cgccgccgag gaagaggact 2160
gggactacgc ccccctggtg ctggcccccg acgacagaag ctacaagagc cagtacctga 2220
acaatggccc ccagcggatc ggccggaagt acaagaaagt gcggttcatg gcctacaccg 2280
acgagacatt caagacccgg gaggccatcc agcacgagag cggcatcctg ggccccctgc 2340
tgtacggcga agtgggcgac acactgctga tcatcttcaa gaaccaggct agccggccct 2400
acaacatcta cccccacggc atcaccgacg tgcggcccct gtacagcagg cggctgccca 2460
agggcgtgaa gcacctgaag gacttcccca tcctgcccgg cgagatcttc aagtacaagt 2520
ggaccgtgac cgtggaggac ggccccacca agagcgaccc cagatgcctg acccggtact 2580
acagcagctt cgtgaacatg gaacgggacc tggcctccgg gctgatcgga cctctgctga 2640
tctgctacaa agaaagcgtg gaccagcggg gcaaccagat catgagcgac aagcggaacg 2700
tgatcctgtt cagcgtgttc gatgagaacc ggtcctggta tctgaccgag aacatccagc 2760
ggtttctgcc caaccctgcc ggcgtgcagc tggaagatcc cgagttccag gccagcaaca 2820
tcatgcactc catcaatggc tacgtgttcg actctctgca gctctccgtg tgtctgcacg 2880
aggtggccta ctggtacatc ctgagcatcg gcgcccagac cgacttcctg agcgtgttct 2940
tcagcggcta caccttcaag cacaagatgg tgtacgagga caccctgacc ctgttccctt 3000
tcagcggcga gacagtgttc atgagcatgg aaaaccccgg cctgtggatt ctgggctgcc 3060
acaacagcga cttccggaac cggggcatga ccgccctgct gaaggtgtcc agctgcgaca 3120
agaacaccgg cgactactac gaggacagct acgaggatat cagcgcctac ctgctgtcca 3180
agaacaacgc catcgaaccc cggagcttca gccagaaccc ccccgtgctg acgcgtagct 3240
tcagccagaa cagccggcac cccagcaccc ggcagaagca gttcaacgcc accaccatcc 3300
ccgagaacga catcgagaaa accgaccctt ggtttgccca ccggaccccc atgcccaaga 3360
tccagaacgt gtccagcagc gacctgctga tgctgctgcg gcagagcccc acccctcacg 3420
gcctgagcct gagcgacctg caggaagcca agtacgagac attcagcgac gaccccagcc 3480
ctggcgccat cgacagcaac aacagcctgt ccgagatgac ccacttccgg ccccagctgc 3540
accacagcgg cgacatggtg ttcacccccg agagcggcct gcagctgcgg ctgaacgaga 3600
agctgggcac caccgccgcc accgagctga agaagctgga cttcaaggtc tccagcacca 3660
gcaacaacct gatcagcacc atccccagcg acaacctggc cgctggcacc gacaacacca 3720
gcagcctggg ccctcccagc atgcccgtgc actacgacag ccagctggac accaccctgt 3780
tcggcaagaa gtccagcccc ctgaccgagt ccggcggacc cctgtccctg agcgaggaaa 3840
acaacgacag caagctgctg gaaagcggcc tgatgaacag ccaggaaagc agctggggca 3900
agaatgtgtc cagcacgcgt caccagcggg agatcacccg gacaaccctg cagtccgacc 3960
aggaagagat cgattacgac gacaccatca gcgtggagat gaagaaagag gatttcgata 4020
tctacgacga ggacgagaac cagagcccca gaagcttcca gaagaaaacc cggcactact 4080
tcattgccgc cgtggagagg ctgtgggact acggcatgag ttctagcccc cacgtgctgc 4140
ggaaccgggc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caggaattca 4200
cagacggcag cttcacccag cctctgtata gaggcgagct gaacgagcac ctggggctgc 4260
tggggcccta catcagggcc gaagtggagg acaacatcat ggtgaccttc cggaatcagg 4320
ccagcagacc ctactccttc tacagcagcc tgatcagcta cgaagaggac cagcggcagg 4380
gcgccgaacc ccggaagaac ttcgtgaagc ccaacgaaac caagacctac ttctggaaag 4440
tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg gcctacttca 4500
gcgacgtgga tctggaaaag gacgtgcact ctggactgat tggcccactc ctggtctgcc 4560
acactaacac cctcaacccc gcccacggcc gccaggtgac cgtgcaggaa ttcgccctgt 4620
tcttcaccat cttcgacgag acaaagtcct ggtacttcac cgagaatatg gaacggaact 4680
gcagagcccc ctgcaacatc cagatggaag atcctacctt caaagagaac taccggttcc 4740
acgccatcaa cggctacatc atggacaccc tgcctggcct ggtgatggcc caggaccaga 4800
gaatccggtg gtatctgctg tccatgggca gcaacgagaa tatccacagc atccacttca 4860
gcggccacgt gttcaccgtg cggaagaaag aagagtacaa gatggccctg tacaacctgt 4920
accccggcgt gttcgagaca gtggagatgc tgcccagcaa ggccggcatc tggcgggtgg 4980
agtgtctgat cggcgagcac ctgcacgctg gcatgagcac cctgtttctg gtgtacagca 5040
acaagtgcca gaccccactg ggcatggcct ctggccacat ccgggacttc cagatcaccg 5100
cctccggcca gtacggccag tgggccccca agctggccag actgcactac agcggcagca 5160
tcaacgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggccccta 5220
tgatcatcca cggcattaag acccagggcg ccaggcagaa gttcagcagc ctgtacatca 5280
gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac cggggcaaca 5340
gcaccggcac cctgatggtg ttcttcggca atgtggacag cagcggcatc aagcacaaca 5400
tcttcaaccc ccccatcatt gcccggtaca tccggctgca ccccacccac tacagcatta 5460
gatccacact gagaatggaa ctgatgggct gcgacctgaa ctcctgcagc atgcctctgg 5520
gcatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca 5580
tgttcgccac ctggtccccc tccaaggcca ggctgcacct gcagggccgg tccaacgcct 5640
ggcggcctca ggtcaacaac cccaaagaat ggctgcaggt ggactttcag aaaaccatga 5700
aggtgaccgg cgtgaccacc cagggcgtga aaagcctgct gaccagcatg tacgtgaaag 5760
agtttctgat cagcagctct caggatggcc accagtggac cctgttcttt cagaacggca 5820
aggtgaaagt gttccagggc aaccaggact ccttcacccc cgtggtgaac tccctggacc 5880
cccccctgct gacccgctac ctgagaatcc acccccagtc ttgggtgcac cagatcgccc 5940
tcaggatgga agtcctggga tgtgaggccc aggatctgta ctgatgagcg gccgctcgag 6000
gtcacccatt cgaacaaaaa ctcatctcag aagaggatct gaatatgcat accggtcatc 6060
atcaccatca ccattgagtt taaacccgct gatcagcctc gactgtgcct tctagttgcc 6120
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 6180
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 6240
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 6300
atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc tggggctcta 6360
gggggtatcc ccacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 6420
gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 6480
cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 6540
ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 6600
cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 6660
tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 6720
cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 6780
aacaaaaatt taacgcgaat taattctgtg gaatgtgtgt cagttagggt gtggaaagtc 6840
cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccag 6900
gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc atctcaatta 6960
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 7020
cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg ccgaggccgc 7080
ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 7140
caaaaagctc ccgggagctt gtatatccat tttcggatct gatcagcacg tgttgacaat 7200
taatcatcgg catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg 7260
gccaagcctt tgtctcaaga agaatccacc ctcattgaaa gagcaacggc tacaatcaac 7320
agcatcccca tctctgaaga ctacagcgtc gccagcgcag ctctctctag cgacggccgc 7380
atcttcactg gtgtcaatgt atatcatttt actgggggac cttgtgcaga actcgtggtg 7440
ctgggcactg ctgctgctgc ggcagctggc aacctgactt gtatcgtcgc gatcggaaat 7500
gagaacaggg gcatcttgag cccctgcgga cggtgccgac aggtgcttct cgatctgcat 7560
cctgggatca aagccatagt gaaggacagt gatggacagc cgacggcagt tgggattcgt 7620
gaattgctgc cctctggtta tgtgtgggag ggctaagcac ttcgtggccg aggagcagga 7680
ctgacacgtg ctacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 7740
aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 7800
cttcgcccac cccaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 7860
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact 7920
catcaatgta tcttatcatg tctgtacgcg ccactactag ggacaggatt ggtgacagaa 7980
aagccccatc cttaggcctc ctccttccta gtctcctgat attgggtcta acccccacct 8040
cctgttaggc agattcctta tctggtgaca cacccccatt tcctggagcc atctctctcc 8100
ttgccagaac ctctaaggtt tgcttacgat ggagccagag aggatcctgg gagggagagc 8160
ttggcagggg gtgggaggga agggggggat gcgtgacctg cccggttctc agtggccacc 8220
ctgcgctacc ctctcccaga acctgagctg ctctgacgcg gctgtctggt gcgtttcact 8280
gatcctggtg ctgcagcttc cttacacttc ccaagaggag aagcagtttg gaaaaacaaa 8340
atcagaataa gttggtcctg agttctaact ttggctcttc acctttctag tccccaattt 8400
atattgttcc tccgtgcgtc agttttacct gtgagataag gccagtagcc agccccgtcc 8460
tggcagggct gtggtgagga ggggggtgtc cgtgtggaaa actccctttg tgagaatggt 8520
gcgtcctagg tgttcaccag gtcgtggccg cctctactcc ctttctcttt ctccatcctt 8580
ctttccttaa agagtcccca gtgctatctg ggacatattc ctccgcccag agcagggtcc 8640
cgcttcccta aggccctgct ctgggcttct gggtttgagt ccttggcaag cccaggagag 8700
gcgctcaggc ttccctgtcc cccttcctcg tccaccatct catgcccctg gctctcctgc 8760
cccttcccta caggtgttcc tggctctgct ctgttttacc gtcgacctct agctagagct 8820
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 8880
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 8940
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 9000
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 9060
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 9120
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 9180
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 9240
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 9300
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 9360
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 9420
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 9480
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 9540
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 9600
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 9660
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 9720
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 9780
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 9840
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 9900
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 9960
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 10020
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 10080
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 10140
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 10200
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 10260
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 10320
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 10380
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 10440
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 10500
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 10560
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 10620
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 10680
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 10740
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 10800
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 10860
tcctttttca ataaattgct ttctctgacc agcattctct cccctgggcc tgtgccgctt 10920
tctgtctgca gcttgtggcc tgggtcacct ctacggctgg cccagatcct tccctgccgc 10980
ctccttcagg ttccgtcttc ctccactccc tcttcccctt gctctctgct gtgttgctgc 11040
ccaaggatgc tctttccgga gcacttcctt ctcggcgctg caccacgtga tgtcctctga 11100
gcggatcctc cccgtgtctg ggtcctctcc gggcatctct cctccctcac ccaaccccat 11160
gccgtcttca ctcgctgggt tcccttttcc ttctccttct ggggcctgtg ccatctctcg 11220
tttcttagga tggccttctc cgacggatgt ctcccttgcg tcccgcctcc ccttcttgta 11280
ggcctgcatc atcaccgttt ttctggacaa ccccaaagta ccccgtctcc ctggctttag 11340
ccacctctcc atcctcttgc tttctttgcc tggacacccc gttctcctgt ggattcgggt 11400
cacctctcac tcctttcatt tgggcagctc ccctaccccc cttacctctc tagtctgtgc 11460
tagctcttcc agccccctgt catggcatct tccaggggtc cgagagctca gctagtcttc 11520
ttcctccaac ccgggcccct atgtccactt caggacagca tgtttgctgc ctccagggat 11580
cctgtgtccc cgagctggga ccaccttata ttcccagggc cggttaatgt ggctctggtt 11640
ctgggtactt ttatctgtcc cctccacccc acagtggggc cctgcaatta ttgaagcatt 11700
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 11760
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtc 11805
<210> 45
<211> 506
<212> DNA
<213> 人工序列
<220>
<223> 人工多核苷酸
<400> 45
gcagcaccat ggcctgaaat aacctctgaa agaggaactt ggttaggtac cttctgaggc 60
ggaaagaacc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 120
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 180
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 240
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 300
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 360
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagctcccg 420
ggagcttgta tatccatttt cggatctgat cagcacgtgt tgacaattaa tcatcggcat 480
agtatatcgg catagtataa tacgac 506

Claims (59)

1.一种质粒载体,其包括:
(a)原核复制起点;
(b)适合于表达一个或多个转基因的真核启动子;
(c)用于插入所述一个或多个转基因的多克隆位点;以及
(d)编码可选择标志物的核酸,所述核酸可操作地连接到包括真核启动子和原核启动子的双启动子,其中所述可选择标志物适合于原核选择和真核选择二者;
其中所述载体的长度小于3.6千碱基。
2.根据权利要求1所述的质粒载体,其中元件(a)到(d)在所述质粒的5’到3’方向上顺序布置。
3.根据权利要求1所述的质粒载体,其进一步包括:位于元件(a)与元件(b)之间的上游同源臂插入位点以及下游同源臂插入位点。
4.根据权利要求3所述的质粒载体,所述下游同源臂插入位点位于元件(d)之后。
5.根据权利要求1所述的质粒载体,其进一步包括:处于元件(b)与元件(c)之间的合成剪接位点,所述合成剪接位点增强从(b)的所述真核启动子转录的RNA的稳定性。
6.根据权利要求1所述的质粒载体,其进一步包括:处于(d)的所述多克隆位点之后的poly A序列。
7.根据权利要求1所述的质粒载体,其进一步包括:用于体外表达所述一个或多个转基因的处于(d)的所述多克隆位点上游的另外的启动子。
8.根据权利要求7所述的质粒载体,其中所述用于体外表达的另外的启动子是T7启动子。
9.根据权利要求1所述的质粒载体,其中(a)的所述复制起点选自由以下组成的组:pBR322、pMB1、p15A、pACYC184、pACYC177、ColE1、pBR3286、pl、pBR26、pBR313、pBR327、pBR328、pPIGDM1、pPVUI、pF、pSC101和pC101p-157。
10.根据权利要求9所述的质粒载体,其中(a)的所述复制起点是pBR322Ori。
11.根据权利要求1所述的质粒载体,其中(b)的所述真核启动子选自由以下组成的组:巨细胞病毒(CMV)启动子;来自人、鼠或鸡的β-肌动蛋白基因的启动子;泛素C基因的启动子;和来自疱疹病毒的胸苷激酶基因的启动子。
12.根据权利要求11所述的质粒载体,其中(b)的所述真核启动子是巨细胞病毒(CMV)启动子。
13.根据权利要求1所述的质粒载体,其中所述可选择标志物选自由抗生素抗性基因、荧光蛋白和酶组成的组。
14.根据权利要求13所述的质粒载体,其中所述可选择标志物是抗生素抗性基因。
15.根据权利要求13所述的质粒载体,其中所述可选择标志物是杀稻瘟菌素S脱氨酶。
16.根据权利要求13所述的质粒载体,其中所述可选择标志物是嘌呤霉素-N-乙酰转移酶。
17.根据权利要求13所述的质粒载体,其中所述可选择标志物是新霉素磷酸转移酶。
18.根据权利要求13所述的质粒载体,其中所述可选择标志物是荧光蛋白。
19.根据权利要求18所述的质粒载体,其中所述荧光蛋白是近红外荧光蛋白。
20.根据权利要求1所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到SV40启动子。
21.根据权利要求1所述的质粒载体,其中编码所述可选择标志物的所述核酸可操作地连接到EM7启动子。
22.根据权利要求1所述的质粒载体,其中所述多克隆位点包括SEQ ID NO:2的核苷酸1427到1479中列出的序列。
23.根据权利要求3所述的质粒载体,其中所述上游同源臂插入位点包括SEQ ID NO:2的核苷酸311到336中列出的序列。
24.根据权利要求2所述的质粒载体,其中所述下游同源臂插入位点包括SEQ ID NO:2的核苷酸2960到2985中列出的序列。
25.根据权利要求1所述的质粒载体,其中所述载体具有SEQ ID NO:2中列出的核苷酸序列。
26.根据权利要求1所述的质粒载体,其进一步包括:插入在所述多克隆位点处的转基因。
27.根据权利要求26所述的质粒载体,其中所述转基因编码治疗性蛋白质或治疗性RNA。
28.根据权利要求3所述的质粒载体,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。
29.根据权利要求1所述的质粒载体,其中所述转基因核酸的长度范围为约5kb到300kb。
30.根据权利要求1所述的质粒载体,其中所述原核复制起点不是F1起点。
31.根据权利要求1所述的质粒载体,其中所述质粒载体恰好包括一个可选择标志物。
32.一种用于基因表达的方法,所述方法包括:用根据权利要求1到31中任一项所述的载体转染真核细胞,所述载体进一步包括插入在所述多克隆位点处的转基因;以及在适合于表达所述转基因的条件下培养所述细胞。
33.一种用于修饰哺乳动物细胞中的靶基因组基因座的方法,所述方法包括:
(a)将以下引入到哺乳动物细胞中:
(i)核酸酶试剂,所述核酸酶试剂在靶基因组基因座处或附近产生单链或双链断裂,以及
(ii)根据权利要求1到31中任一项所述的载体,所述载体进一步包括插入在所述多克隆位点处的转基因,所述多克隆位点处于插入在所述上游同源臂插入位点处的上游同源臂和插入在所述下游同源臂处的下游同源臂的侧翼;以及
(b)选择包括所述靶基因组基因座中的所述转基因的靶向哺乳动物细胞。
34.根据权利要求33所述的方法,其中所述细胞通过检测所述可选择标志物来选择。
35.根据权利要求33所述的方法,其中所述哺乳动物细胞是多能细胞。
36.根据权利要求35所述的方法,其中所述多能细胞是诱导多能干(iPS)细胞、胚胎干(ES)细胞、成体干细胞、造血干细胞、神经元干细胞。
37.根据权利要求33所述的方法,其中所述哺乳动物细胞是人成纤维细胞。
38.根据权利要求33所述的方法,其中所述哺乳动物细胞是从患有疾病的患者分离的人细胞,并且其中所述人细胞在其基因组中包括至少一种人类疾病等位基因。
39.根据权利要求38所述的方法,其中将所述转基因整合到所述靶基因组基因座中代替所述基因组中的至少一种人类疾病等位基因。
40.根据权利要求33所述的方法,其中所述核酸酶试剂是表达构建体,所述表达构建体包括编码核酸酶的核酸序列,并且其中所述核酸可操作地连接到在所述哺乳动物细胞中具有活性的启动子。
41.根据权利要求40所述的方法,其中所述核酸酶试剂是编码核酸酶的mRNA。
42.根据权利要求40所述的方法,其中所述核酸酶是锌指核酸酶(ZFN)。
43.根据权利要求40所述的方法,其中所述核酸酶是类转录激活因子效应物核酸酶(TALEN)。
44.根据权利要求40所述的方法,其中所述核酸酶是大范围核酸酶。
45.根据权利要求40所述的方法,其中所述核酸酶是Cas9核酸酶。
46.根据权利要求40所述的方法,其中所述核酸酶试剂的靶序列位于所述靶基因组基因座中的内含子、外显子、启动子、启动子调节区或增强子区中。
47.根据权利要求46所述的方法,其中所述靶序列是AAV1整合位点。
48.根据权利要求40所述的方法,其中所述上游同源臂和/或所述下游同源臂的长度为约500碱基到约4千碱基。
49.根据权利要求40所述的方法,其中所述转基因核酸的长度范围为约5kb到300kb。
50.一种试剂盒,其包括根据权利要求1到31中任一项所述的质粒载体和包括抗生素的生长培养基。
51.根据权利要求50所述的试剂盒,其中所述抗生素是杀稻瘟菌素S、嘌呤霉素或新霉素。
52.根据权利要求50所述的试剂盒,其中所述生长培养基是液体生长培养基、固体生长培养基或半固体生长培养基。
53.根据权利要求50所述的试剂盒,其中所述固体生长培养基是琼脂。
54.根据权利要求50所述的试剂盒,其进一步包括第一、第二和第三限制酶共混物。
55.根据权利要求54所述的试剂盒,其中所述第一限制酶共混物包括用于限制位点SwaI和SbfI的限制酶;其中所述第二限制酶共混物包括用于限制位点AscI和PmeI的限制酶;并且其中所述第三限制酶共混物包括用于限制位点PmeI和SwaI的限制酶。
56.根据权利要求50所述的试剂盒,其进一步包括用于基因组编辑的II型CRISPR系统。
57.根据权利要求50所述的试剂盒,其进一步包括用于基因组编辑的TALEN系统。
58.根据权利要求50所述的试剂盒,其进一步包括用于基因组编辑的锌指核酸酶系统。
59.一种质粒载体,其包括双启动子和在真核细胞和原核细胞二者中起作用的单个可选择标志物,所述载体不包含另外的可选择标志物。
CN201780078633.6A 2016-11-02 2017-11-02 用于表达大型核酸转基因的质粒载体 Pending CN110637090A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662416617P 2016-11-02 2016-11-02
US62/416,617 2016-11-02
PCT/US2017/059786 WO2018085586A1 (en) 2016-11-02 2017-11-02 Plasmid vectors for expression of large nucleic acid transgenes

Publications (1)

Publication Number Publication Date
CN110637090A true CN110637090A (zh) 2019-12-31

Family

ID=62076322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780078633.6A Pending CN110637090A (zh) 2016-11-02 2017-11-02 用于表达大型核酸转基因的质粒载体

Country Status (4)

Country Link
US (1) US20190390221A1 (zh)
EP (1) EP3535400A4 (zh)
CN (1) CN110637090A (zh)
WO (1) WO2018085586A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112750498A (zh) * 2020-12-30 2021-05-04 同济大学 靶向逆转录引物结合位点从而抑制hiv病毒复制的方法
CN117384277A (zh) * 2023-12-05 2024-01-12 中国人民解放军军事科学院军事医学研究院 一种人源IgA抗体重链表达质粒及应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019157239A1 (en) * 2018-02-08 2019-08-15 David Kiewlich Plasmid vectors for expression of large nucleic acid transgenes
CN110438138A (zh) * 2019-07-04 2019-11-12 深圳市深研生物科技有限公司 质粒载体
WO2023234903A1 (en) * 2022-06-03 2023-12-07 Izmir Biyotip Ve Genom Merkezi Plasmid for the production of recombinant protein in mammalian cell

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998044141A2 (en) * 1997-03-27 1998-10-08 The University Of British Columbia Insect expression vectors
WO2001005961A1 (en) * 1999-07-14 2001-01-25 Clontech Laboratories, Inc. Recombinase-based methods for producing expression vectors and compositions for use in practicing the same
US20010016351A1 (en) * 1997-10-31 2001-08-23 Joseph A. Sorge Novel vector for gene expression in prokaryotic and eukaryotic systems
US20020116723A1 (en) * 1997-03-27 2002-08-22 Grigliatti Tom A. Insect expression vectors
US20140335063A1 (en) * 2013-05-10 2014-11-13 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2015154006A1 (en) * 2014-04-03 2015-10-08 The Regents Of The University Of California Genetically encoded infrared fluorescent protease reporters

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1068338A2 (en) * 1998-03-06 2001-01-17 Oxford Biomedica (UK) Limited Enhanced prodrug activation
AU8337701A (en) * 2000-08-14 2002-02-25 Us Health Enhanced homologous recombination mediated by lambda recombination proteins
EP2021795A4 (en) * 2006-05-04 2009-05-13 Abmaxis Inc CROSS SPECIES AND MULTI-SPECIAL PRESENTATION SYSTEMS
WO2013009825A1 (en) * 2011-07-11 2013-01-17 Cellular Dynamics International, Inc. Methods for cell reprogramming and genome engineering
MX2016007654A (es) * 2013-12-11 2017-08-15 Regeneron Pharma Metodos y composiciones para la modificacion dirigida de un genoma.

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998044141A2 (en) * 1997-03-27 1998-10-08 The University Of British Columbia Insect expression vectors
US20020116723A1 (en) * 1997-03-27 2002-08-22 Grigliatti Tom A. Insect expression vectors
US20010016351A1 (en) * 1997-10-31 2001-08-23 Joseph A. Sorge Novel vector for gene expression in prokaryotic and eukaryotic systems
WO2001005961A1 (en) * 1999-07-14 2001-01-25 Clontech Laboratories, Inc. Recombinase-based methods for producing expression vectors and compositions for use in practicing the same
US20140335063A1 (en) * 2013-05-10 2014-11-13 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
WO2015154006A1 (en) * 2014-04-03 2015-10-08 The Regents Of The University Of California Genetically encoded infrared fluorescent protease reporters

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112750498A (zh) * 2020-12-30 2021-05-04 同济大学 靶向逆转录引物结合位点从而抑制hiv病毒复制的方法
CN112750498B (zh) * 2020-12-30 2022-06-24 同济大学 靶向逆转录引物结合位点从而抑制hiv病毒复制的方法
CN117384277A (zh) * 2023-12-05 2024-01-12 中国人民解放军军事科学院军事医学研究院 一种人源IgA抗体重链表达质粒及应用

Also Published As

Publication number Publication date
EP3535400A4 (en) 2020-07-01
US20190390221A1 (en) 2019-12-26
WO2018085586A1 (en) 2018-05-11
EP3535400A1 (en) 2019-09-11

Similar Documents

Publication Publication Date Title
AU2020289750B2 (en) Engineered meganucleases with recognition sequences found in the human T cell receptor alpha constant region gene
AU775988B2 (en) Ligand activated transcriptional regulator proteins
AU2021204620A1 (en) Central nervous system targeting polynucleotides
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
AU2021200863A1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
CN110637090A (zh) 用于表达大型核酸转基因的质粒载体
CN101024845B (zh) 编码gag和pol蛋白的核苷酸序列的用途、生产复制缺陷逆转录病毒的方法、病毒系统及其用途
US20040005564A1 (en) Methods of identifying synthetic transcriptonal and translational regulatory elements, and compositions relating to same
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR20180020202A (ko) T 세포 수용체 특이적 항체
US11129890B1 (en) Non-integrating HIV-1 comprising mutant RT/IN proteins and the SARS-CoV-2 spike protein
AU782960B2 (en) Conditional gene trapping construct for the disruption of genes
PT1984512T (pt) Sistema de expressão génica utilizando excisão-união em insetos
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
AU2016273214B2 (en) Method for generating antibodies against T cell receptor
CN112877292A (zh) 产生人抗体的细胞
KR20240037185A (ko) 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도
CN108707626B (zh) 一种可检测热原的单克隆细胞系的制备方法
CN101238214A (zh) 使用改进的调节表达系统治疗疾病
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
KR20160003691A (ko) Opa1 단상부족에 의해 원인이 되는 질병 치료를 위한 인공전사인자
US20210130818A1 (en) Compositions and Methods for Enhancement of Homology-Directed Repair Mediated Precise Gene Editing by Programming DNA Repair with a Single RNA-Guided Endonuclease
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물
CN112852884B (zh) 一种环形rna敲低载体快速构建试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191231