CN110684806A - Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 - Google Patents

Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 Download PDF

Info

Publication number
CN110684806A
CN110684806A CN201910657212.XA CN201910657212A CN110684806A CN 110684806 A CN110684806 A CN 110684806A CN 201910657212 A CN201910657212 A CN 201910657212A CN 110684806 A CN110684806 A CN 110684806A
Authority
CN
China
Prior art keywords
dna
plant
gene
sequence
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910657212.XA
Other languages
English (en)
Inventor
N·科根
J·福斯特
M·海登
T·索布里奇
G·斯潘根贝格
S·R·韦布
M·古朴塔
W·M·安利
M·J·亨利
J·C·米勒
D·Y·古斯钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangamo Therapeutics Inc
Corteva Agriscience LLC
Original Assignee
Dow AgroSciences LLC
Sangamo Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dow AgroSciences LLC, Sangamo Biosciences Inc filed Critical Dow AgroSciences LLC
Publication of CN110684806A publication Critical patent/CN110684806A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/822Reducing position variability, e.g. by the use of scaffold attachment region/matrix attachment region (SAR/MAR); Use of SAR/MAR to regulate gene expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/04Plant cells or tissues
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/54Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
    • A01H6/542Glycine max [soybean]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Nutrition Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Botany (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本公开涉及FAD2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白。公开了一种在FAD2基因座中进行基因编辑或基因堆叠的方法,其是通过以定点的方式剪切细胞FAD2基因中的一个位置,从而在FAD2基因中产生断裂(break),然后在该断裂中接入与一种或多种感兴趣性状相关的核酸分子。

Description

FAD2性能基因座及相应的能够诱导靶向断裂的靶位点特异性 结合蛋白
本申请是2013年9月5日提交的申请号为201380058051.3(PCT申请号为PCT/US2013/058283)、发明名称为“FAD2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白症”的发明专利申请的分案申请。
相关申请交叉引用
本申请要求获得于2012年9月7日提交的美国临时专利申请No.61/697,886的优先权,本文通过提述并入其全部内容。
公开领域
本公开一般地涉及用于植物重组技术(例如,用于产生转基因植物)的组合物和方法。更具体地,本公开涉及植物细胞和植物,它们的基因组中包含可用于位点特异性地引入任何感兴趣核酸的基因座。
背景
许多植物被外源核酸(例如转基因)遗传转化以引入期望的性状,例如提高农业价值。可以通过遗传转化提高农业价值的实例包括:提高营养品质,提高产量,害虫或疾病抗性,干旱和胁迫耐受性,提高园艺品质(例如,改善色素沉着和/或生长),除草剂抗性,从植物产生工业上有用的化合物和/或材料,和/或生产药物。将克隆的基因引入到植物细胞中并回收稳定可育的转基因植物,可用于制造在多个世代中稳定的植物遗传修饰,借此实现对作物的遗传工程化。
在用于遗传转化和产生转基因植物的方法中,通常将外源DNA随机引入到真核植物细胞的细胞核或质体DNA中,随后分离含有被整合的外源DNA的细胞,然后再生被稳定转化的植物。转基因植物通常通过土壤杆菌介导的转化技术产生。这些技术的成功刺激了其他用于将感兴趣核酸分子引入到植物基因组内的方法的发展,例如PEG介导的原生质体DNA摄取,基因枪(微粒轰击),和晶须硅介导的转化。
然而,在所有这些植物转化方法中,引入到植物基因组中的外源核酸被随机整合到植物细胞的基因组中,并且拷贝数可不预测。Terada et al.(2002)Nat Biotechnol 20(10):1030;Terada et al.(2007)Plant Physiol 144(2):846;D'Halluin et al.(2008)Plant Biotechnology J.6(1):93。例如,转基因经常以重复序列的形式被整合,或者是整个转基因或是其部分。这种复杂的整合模式通常会对整合核酸的表达水平具有不利的影响(例如,由于转录后基因沉默机制破坏转录的RNA,或者由于诱导整合DNA的甲基化)。同时,整合位点的位置通常也会影响被整合核酸的表达水平。而且,外源DNA的整合可能对发生整合的基因组区域产生破坏性影响,由此影响或干扰靶区域的正常功能,从而产生不良的副作用。上述因素的组合导致转基因或外源DNA的表达水平(和整体农艺品质)在不同的转基因植物细胞和植物系之间发生很大的变异,即便是它们是通过相同方法创建的。因为整合是随机的,所以在从业者试图产生具有期望特征的新植物时,这些影响不能够人为控制。
上述考虑因素致使人们无论在任何时候研究将特定的外源核酸引入到植物中的效应时,都必须产生和分析大量的转基因植物品系以获得显著的结果。类似地,在产生含有特定整合核酸的转基因植物以提供具有期望表型的转基因植物时,必须创建独立创建的转基因植物品系的大群体,以便选择具有最佳核酸表达并对转基因植物的整体表型和性能具有最小或者没有副作用的植物品系。在通过插入多个外源核酸(即,基因堆叠)创建转基因植物时,这些实际的考虑因素具有更大的重要性。在这样的植物中,转录后基因沉默等现象会增多。
为了控制植物中的转基因插入,已经开发出了多种方法。见例如Kumar andFladung(2001)Trends Plant Sci.6:155-9。这些方法依赖基于同源重组的转基因整合,同源重组的转基因整合已经被成功地应用于原核生物和低等真核生物。Paszkowski et al.(1988)EMBO J.7:4021-6。然而,直到最近,在植物中,转基因整合的主导机制仍然依赖于非常规重组(illegitimate recombination),其几乎不涉及重组DNA链之间的同源性。因此,这个领域中的主要挑战是检测和选择性产生罕见的同源重组事件,其会被效率高得多的通过非常规重组实现的整合事件所掩盖。而且,即使实现了对靶向的同源重组事件的选择性产生和检测,该事件也必须被靶向到宿主基因组的期望位置处方可实现这一策略的最大利益。
例如,靶向遗传转化的一个推定的好处是,与通过随机整合获得的转化事件相比,转基因表达在事件与事件之间的变异性降低。另一个推定的好处是,显著减少在筛选引入核酸、分选转化构建体、和产生有助于在所得转基因植物中获得期望整体特征的事件中所需的事件数目。实现这些好处所需要的一个关键因素是鉴定基因组中这样的特定位置,在该位置上转基因性能是一致的,并且如果可能的话,在该位置上对宿主植物的不利影响被消除或最小化。
最近,已经有人描述了用于靶向剪切基因组DNA的方法和组合物。这些靶向剪切事件能够用于,例如,诱导靶向突变,诱导细胞DNA序列的靶向删除,和促进在预定染色体基因座处的靶向重组和整合。见例如,Urnov et al.(2010)Nature 435(7042):646-51;美国专利公开20030232410;20050208489;20050026157;20050064474;20060188987;20090263900;20090117617;20100047805;20110207221;20110301073;2011089775;20110239315;20110145940;和国际公开WO 2007/014275,本文通过提述并入其全部内容用于所有目的。剪切可以通过使用特异性核酸酶,例如工程化的锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN),或者使用具有引导特异性剪切的工程化crRNA/tracr RNA(‘单向导RNA’(single guide RNA))的CRISPR/Cas系统而发生。美国专利公开No.20080182332描述了使用非规范(non-canonical)的锌指核酸酶(ZFNs)靶向修饰植物基因组;美国专利公开No.20090205083描述了植物EPSPS基因座的ZFN介导靶向修饰;美国专利公开No.20100199389描述了靶向修饰植物Zp15基因座,美国专利公开No.20110167521描述了靶向修饰参与脂肪酸生物合成的植物基因。此外,Moehle et al.(2007)Proc.Natl.Acad,Sci.USA 104(9):3055-3060描述了使用设计的ZFN在特定的基因座处靶向添加基因。美国专利公开20110041195描述了制造纯合二倍体生物的方法。
然而,仍然需要有用于修饰和/或调节植物FAD2基因表达的组合物和方法,包括产生在FAD2基因座处靶向插入期望转基因的植物。
公开概述
本公开描述了用于调节FAD2基因表达(例如在植物、藻类和真菌中)的组合物和方法,和这些基因座作为将感兴趣的核酸序列(例如外源核酸序列)靶向整合到宿主细胞内的位点的用途。在一些实施方案中,宿主细胞可能含有一个或多个基因组,所述基因组具有一个或多个FAD2序列(例如,同源物和/或旁系同源物),其中任何一个或全部序列均可被选择性修饰和/或破坏。在具体的实施例中,本公开描述了欧洲油菜(Brassica napus)(即欧洲油菜品系DH12075)中的FAD2A,FAD2A’,FAD2C和FAD2C’基因,以及相应的同源物或旁系同源物,和它们作为靶向整合感兴趣核酸序列的基因座的用途。如本文所述,尽管FAD2基因在宿主中参与脂肪酸生物合成,但是它们的修饰或破坏(例如,通过在FAD2的编码序列中整合外源核酸)出人意料地可能对所得的宿主生物体没有或者仅有极小的不利影响。
本文还描述了与能够造成FAD2基因座内特定核酸序列的剪切和/或整合的多肽串联的一个或多个特定FAD2基因座的用途。与能够造成FAD2基因座内特定核酸序列的剪切和/或整合的多肽串联的一个或多个特定FAD2基因座的用途的实例包括选自下组的多肽:锌指蛋白,大范围核酸酶,TAL结构域,RNA引导的CRISPR-Cas9,重组酶,亮氨酸拉链,CRISPr/Cas,和其他本领域已知的序列。特定的实例包括含有位点特异性DNA结合结构域多肽和剪切结构域多肽(例如核酸酶)的嵌合(“融合”)蛋白,例如含有锌指多肽和FokI核酸酶多肽的ZFN蛋白。例如,本文描述了被设计用于结合和诱导FAD2A,FAD2A’,FAD2C和FAD2C’及其组合中的双链断裂、但不剪切相应的同源物或旁系同源物的特定ZFN在体外和体内的效力与特异性的演示。在一些实施方案中,特定的FAD2基因座可以和任何前述多肽一起使用,以造成感兴趣核酸的位点特异性整合,感兴趣核酸随后在宿主内表达,同时对宿主的农艺性能的不利影响极小。
在某些方面中,本文描述包括与FAD2基因特异性结合的DNA结合结构域的多肽。在一些实施方案中,这样的多肽还可以包含核酸酶(剪切)结构域或半结构域(例如ZFN、重组酶、转座酶或归巢核酸内切酶,包括具有经过修饰的DNA结合结构域、TAL结构域、TALEN、RNA引导的CRISPR-Cas9的归巢核酸内切酶),和/或连接酶结构域,使该多肽可以诱导靶向双链断裂,和/或易化感兴趣核酸在断裂位点的重组。在特定的实施方案中,靶向FAD2基因座的DNA结合结构域可以是DNA剪切功能结构域。前述的多肽可以在一些实施方案中用于将外源核酸引入到宿主生物体(例如植物或动物物种)基因组的一个或多个FAD2基因座处。在某些实施方案中,DNA结合结构域包括具有一个或多个锌指(例如2,3,4,5,6,7,8,9或更多个锌指)的锌指蛋白,并可以被工程化(是非天然出现的),从而结合FAD2基因内的任何序列。本文所述的任何锌指蛋白均可以结合靶基因编码序列内或相邻序列内(例如启动子或其他表达元件)的靶位点。在某些实施方案中,锌指蛋白结合FAD2基因内的靶位点,例如表5所示。示例FAD2-结合性锌指的识别螺旋区如表4所示。锌指蛋白的一个或多个组分锌指结合结构域可以是规范的(C2H2)锌指或非规范的(例如,C3H)锌指(例如,N端和/或C-端锌指可以是非规范的指)。
本文还描述了用于破坏或编辑FAD2基因的方法。此外本文还描述了通过根据本发明实施方案的方法产生的遗传修饰的宿主生物体(例如转基因植物)。在特定的实施例中,通过根据本发明实施方案的方法产生的转基因生物体可以是,但不限于,藻类、真菌、单子叶植物、双子叶植物,等。
本文公开的FAD2基因可包括在任何具有一种或多种FAD2基因的植物、藻类、或真菌中发现的那些。
通过参考附图对多个实施方案的详细描述,前述和其他的特征将变得更加显而易见。
具体地,本公开提供下述内容:
1.一种修饰细胞的基因组的方法,该方法包括:
以位点特异性方式剪切细胞中的FAD2基因中的靶位点,从而在该FAD2基因中产生断裂;
其中该FAD2基因在剪切之后被修饰。
2.项1的方法,其中该方法进一步包括向该断裂中整合感兴趣的核酸序列。
3.根据项1或项2的方法,其中所述FAD2基因是FAD2A,FAD2A’,FAD2C和/或FAD2C’基因。
4.根据项1-3中任一项的方法,其中位点特异性方式的剪切包括向细胞内引入融合蛋白或编码融合蛋白的多核苷酸,所述融合蛋白包含DNA结合结构域以及剪切结构域或剪切半结构域,其中该融合蛋白与所述靶位点特异性结合,并在靶位点处或其附近进行剪切从而产生断裂。
5.根据项4的方法,其中该DNA结合结构域选自下组:大范围核酸酶DNA结合结构域,亮氨酸拉链DNA结合结构域,转录激活因子样(TAL)DNA结合结构域,RNA指导的CRISPR-Cas9,重组酶,锌指蛋白DNA结合结构域,和前述者的任何嵌合组合。
6.根据项4或项5的方法,其中该剪切结构域或剪切半结构域选自下组:来自IIS型限制性核酸内切酶的剪切半结构域,来自FokI核酸内切酶的剪切半结构域,来自StsI核酸内切酶的剪切半结构域,和归巢核酸内切酶。
7.根据项4-6中任一项的方法,其中该融合蛋白是锌指核酸酶。
8.根据项7的方法,其中该锌指核酸酶包括3-6个锌指结构域,每个锌指结构域包括识别螺旋区,其中该锌指蛋白包括在表3的单一行中排序并显示的识别螺旋区。
9.根据项1-8中任一项的方法,其中位点特异性方式的剪切是对FAD2A,FAD2A’,FAD2C和/或FAD2C’的一些拷贝但非所有拷贝特异性的。
10.根据项1-9中任一项的方法,其中该靶位点选自下组:SEQ ID NO:22-26,和SEQID NO:28-33和SEQ ID NO:35-38。
11.根据项1-10中任一项的方法,其中该细胞是植物、真菌、细菌或藻类细胞。
12.根据项11的方法,其中该植物细胞是单子叶植物细胞或双子叶植物细胞。
13.根据项12的方法,其中该植物细胞选自下组:芸苔属(Brassica sp.),欧洲油菜(Brassica napus);芜菁(Brassica rapa);芥菜(Brassica juencea);甘蓝(Brassicaoleracea);黑芥(Brassica nigra);玉米属(Zea sp.);玉米(Zea mays);大豆属(Glycinesp.);大豆(Glycine max);小麦属(Triticum sp);普通小麦(Triticum aestivum);稻属(Oryza sp.);水稻(Oryza sativa);Triticae sp.;Triticae triticum;向日葵属(Heliantheae sp.);向日葵(Heliantheae helianthus);棉属(Gossypium sp.);陆地棉(Gossypium hirsutum);和大麦(Hordeum vulgar)。
14.根据项2-13中任一项的方法,其中感兴趣的核酸序列选自下组:包含DNA结合结构域结合靶位点的序列,一个或多个杀虫剂抗性基因,一个或多个除草剂抗性基因,一个或多个氮使用效率基因,一个或多个水使用效率基因,一个或多个营养品质基因,一个或多个DNA结合基因,一个或多个可选择标志物基因,及其组合。
15.一种细胞、种子或植物,其包括根据项1-14中任一项的方法修饰的细胞。
16.根据项15的细胞、种子或植物,其中该细胞、种子或植物是转基因的细胞、种子或植物,其包含整合到FAD2A,FAD2A’,FAD2C和/或FAD2C’基因的一个或多个拷贝中的感兴趣核苷酸序列。
17.项16的细胞、种子或植物,其中所述核苷酸序列对所述细胞而言是异源或同源的。
18.项14的细胞、种子或植物,其中该同源序列包含至少一个单核苷酸多态性。
19.根据项16-18中任一项的细胞、种子或植物,其中该核酸序列整合到选自下组的靶位点处或其附近:SEQ ID NO:22-26,和SEQ ID NO:28-33和SEQ ID NO:35-38。
20.一种适用于修饰FAD2基因的位点特异性锌指核酸酶,其中该锌指核酸酶在选自下组的核酸靶位点处或其附近进行剪切:SEQ ID NO:22-26,和SEQ ID NO:28-33和SEQID NO:35-38。
21.项20的锌指核酸酶,其中该锌指核酸酶包括3-6个锌指结构域,每个锌指结构域包含识别螺旋区,其中该锌指蛋白包含在表3的单一行中排序并显示的识别螺旋区。
附图简述
图1,子图(panel)A-E,显示了使用
Figure BDA0002137215980000071
生成的FAD2基因序列(SEQ ID NO:5-8)的序列比对。
图2示意性描绘了使用Jalview v 2.3根据邻接距离生成的FAD2基因序列的系统进化树。
图3显示了pDAB104010的质粒图,其是一个代表性的锌指核酸酶表达盒。该构建体的布局与其他ZFN表达盒相似,其中锌指结构域24828和24829与上述的备选锌指结构域相互交换。
图4是一幅实例多线图,显示了每10,000个序列读取中在靶ZFN位点具有缺失的序列的数目。图上的X轴指示缺失的碱基数目,Y轴指示序列读取的数目,Z轴指示用颜色编码的样品身份,如图的右侧所述。所示的具体实例是FAD2基因家族的基因座1的,其含有3个靶ZFN位点A、B和C,具有4个基因家族成员和两个对照转染,作为对照样品A和B进行评价。图中从上到下列出的线(A_对照_FADA’,位于图例顶部,到C_样品_FAD2C,位于图例的底部)是以从最接近标记的X轴(A_对照_FADA’)到最远离标记的X轴(C_样品_FAD2C)显示的。
图5,子图A和B,显示了FAD2基因的ZFN靶定。图5A是描述来自FAD2基因家族ZFN靶定基因座4的数据的曲线图。该基因座含有两个ZFN位点和两个必需的对照转染。图5B显示了在ZFN靶位点周围的具体序列背景(SEQ ID NO:471-480),鉴定了含有C、T和G三核苷酸重复的FAD2A和C,导致通过FAD2A和C基因座测序观察到的单碱基缺失的增加。
图6显示了pDAS000130的质粒图。
图7显示了pDAS000031的质粒图。
图8示意性显示了用于转基因拷贝数测定的转基因靶引物和探针的结合位点。
图9显示的是一个Sequencher文件,显示了FAD2A ZFN DNA识别结构域(bc12075_Fad2a-r272a2和bc12075_Fad2a-278a2),以及ZFN特异性引物(FAD2A.UnE.F1和FAD2A.UnE.R1)和内源引物(FAD2A/2C.RB.UnE.F1和FAD2A/2C.RB.UnE.R1)的结合位点。
图10显示的是一个示意图,其显示了内源和转基因靶引物的结合位点,这些引物用于检测FAD2A处通过完美HDR实现的转基因整合。
图11是一个示意图,显示了在完美编辑的FAD2A基因座中Kpn1限制性内切酶位点可能出现的位置,和FAD2a 5’,hph和FAD2A 3’Southern探针可以结合的位置。
图12显示了Kpn1片段、FAD2A 5’、hph、FAD2A 3’探针的位置和尺寸,和对通过HDR在FAD2A基因座处整合了ETIP的植物进行Southern分析的预期结果。
图13显示了拷贝数估计qPCR的代表性数据输出。左手的列代表了从已知的具有单一随机转基因插入物的T0转基因植物获得的数据,并用作校准样品,供所有其它样品对其“标准化”。右手的列是已知的具有5个转基因整合的T0转基因植物。两个植物的插入物拷贝数均使用Southern分析加以确定。其余的列提供了推定转基因植物的拷贝数估计。这些列标记为:1拷贝对照,310420,311819,311821,311822,311823,311824,311827,312524,312525,312526,312527,312529,312530,312532,313810,313811,313905,313941,313942,313944,和5拷贝对照。这些列可用于确定每个转基因植物的估计拷贝数。当使用软件估计拷贝数时,野生型植物、非转化的对照植物、和仅含质粒的对照不会产生拷贝数,因为它们并不针对hph和HMG I/Y靶标二者均具有Cq。
图14显示了pDAS000129的质粒图。
图15显示了pDAS000129整合到FAD2A基因座内的示意图。
图16显示了pDAS000097的质粒图。
图17显示了pDAS000389的质粒图。
图18显示了pDAS000391的质粒图。
图19显示了pDAS000392的质粒图。
图20显示了pDAS000393的质粒图。
图21显示了pDAS000394的质粒图。
图22显示了pDAS000395的质粒图。
图23显示了pDAS000396的质粒图。
图24显示了pDAS000397的质粒图。
序列
所示的核酸序列使用核苷酸碱基的标准字母缩写,如37C.F.R.§1.822所定义的。仅显示了每个核酸序列的一条链,但是可以理解,当提到所示的链时总是包括了互补链在内。
详细说明
1.若干实施方案的概述
本发明的实施方案建立了一种将外源核酸(例如转基因)靶向整合到宿主基因组内的方法,该方法除了被整合的核酸所影响的表型之外不会严重不利地影响宿主的其它表型。一些实施方案可用于将多个核酸“堆叠”在单个宿主基因组中。这种方法利用了四种相互联系的技术的开发与部署:靶向技术,其可以用来在特定的基因组DNA位置处引入双链断裂(见,例如Puchta et al.(1993)Nucleic Acids Res.21:5034-40;Siebert and Puchta(2002)Plant Cell 14:1121-31;D'Halluin et al.(2008)Plant Biotechnol.J.6(1):93-102;Cai et al.(2009)Plant Mol.Biol.69(6):699-709;Shukla et al.(2009)Nature459(7245):437-41);Shan et al.(2103)Nature Biotechnol.31:686-680;Le et al.(2013)Nature Biotechnol 31:688-691;Nekrasov et al.(2013)Nature Biotechnol.31:691-693,Ainely et al.(2013)Plant Biotechnol.J.(8月19日在线发表));递送技术,其可以用来递送优化的外源(供体)核酸(Bibikova et al.(2003)Science 300(5620):764);涉及修饰宿主基因(位于同源重组或NHEJ通路中)以增加靶向供体DNA整合的HDR或NHEJ频率的整合技术;分析工具,用以富集和表征靶向整合事件;和特定的期望宿主基因组位置(“性能基因座”),它们在遗传上良好定义并支持基因跨世代的稳定表达,而不会严重不利影响被转化的宿主生物体。另见美国专利公开20030232410;20050208489;20050026157;20050064474;20060188987;20090263900;20090117617;20100047805;20110207221;20110301073;2011089775;20110239315;20110145940;20080182332;20090205083;20100199389;20110167521。例如,在植物中,性能基因座是这样的基因座:对该基因座处整合了转基因的植物的农艺或品质性质的不利影响可以忽略或者不存在。
本文所述的实施方案利用了如下的出人意料的发现,即植物FAD2基因是靶向整合外源核酸(例如基因;非编码DNA序列,如工程化着陆垫(Engineered Landing Pad)(ELPs)(美国专利申请12/011,735)和工程化转基因插入平台(ETIP)(待审美国专利申请No:61/697882);和植物转化单元)的性能基因座。FAD2基因座在植物中普遍存在的性质,以及在芥花(canola)、玉米、向日葵、小麦、棉花和大豆中改变或敲除FAD2不会造成农艺学或品质损失的证据,说明FAD2基因座是多种有商业意义的植物物种中的一大类性能基因座。
一些实施方案利用FAD2基因座处的位点特异性双链DNA剪切,例如通过递送并表达靶位点特异性DNA识别和剪切蛋白造成的。在具体的实施方案中,这种FAD2特异性DNA识别和剪切蛋白可以是,例如但不仅限于,ZFN;TALEN;RNA引导的CRISPR-Cas9,重组酶(例如Cre,Hin,RecA,Tre,和FLP重组酶);大范围核酸酶,和源自上述任一种或其等同物的工程化蛋白。剪切还可以使用CRISPR/Cas系统实现,其用工程化的crRNA/tracr RNA(“单向导RNA”)来引导特异性剪切。在一些实施方案中,这种双链断裂可以通过供体核酸整合在FAD3性能基因座内的剪切位点处,例如通过同源介导的修复(HDR)或非同源末端连接(NHEJ),而被修复。
本公开举例说明了FAD2基因座作为性能基因座的用处,例如,通过描述芥花(欧洲油菜)中的FAD2A,2A’,2C或2C’基因座,和可用于将外源核酸整合在FAD2A,2A’,2C或2C’基因座处的相应的FAD2特异性ZFN。
本发明的实施方案致力于解决本领域许多尚未解决的问题。例如,本文所述的靶向整合方法的选择性可以减少或者不需要用于消除不良转基因事件所需要的重复田间试验,这些试验由于所涉及的资源和该区域中繁重的监管要求而成本高昂。而且,本文所述的靶向DNA整合方法在转基因堆叠过程中可能特别有益。
尽管可以利用内源FAD2基因座处的固有(native)核苷酸序列来直接靶定感兴趣的核酸,但是在一些实施方案中,可以首先将核酸靶向到宿主的至少一个FAD2基因座处,使得其他感兴趣的核酸分子整合到宿主中变得容易。在其它实例中,可以使用这样的核苷酸序列:其与宿主生物体的位于DNA识别位点(例如锌指识别位点)之侧翼的固有序列不同源(例如,基本上随机生成的核酸序列)。
II.术语
如本申请,包括权利要求中使用的,除非上下文中清楚地另有说明,否则单数和单数形式的术语,例如“一”、“一个”和“该”,包括复数指代物。因此,例如,称“植物”、“该植物”或“一个植物”也指示多个植物。而且,根据上下文,使用术语“植物”还指示该植物的在遗传上相似或相同的后代。类似地,术语“核酸”可以指核酸分子的许多拷贝。类似地,术语“探针”可以指许多相似或相同的探针分子。
数字范围包括限定该范围的数字,并明确地包括所限定的范围内的每个整数和非整数分数。除非另外指出,否则本文所用的全部技术和科学术语具有与本领域普通技术人员所普遍理解的相同的含义。
为了方便审阅本公开所述的各种实施方案,提供了具体术语的如下解释:
分离的:“分离的”生物组分(例如核酸或蛋白质)是与该组分天然存在的生物体细胞中的其他生物组分(即其它染色体、染色体外DNA和RNA,和蛋白质)实质分离的、与上述组分分开产生的、或者是从上述组分中纯化出来的,同时导致组分的化学或功能变化(例如,可以通过断裂将核酸与染色体的其余DNA连接在一起的化学键从染色体分离该核酸)。被“分离的”核酸分子和蛋白质包括通过标准纯化方法纯化的核酸分子和蛋白质。该术语还包括通过在宿主细胞中重组表达而制备的核酸和蛋白质,以及化学合成的核酸分子、蛋白质和肽。
杂交:如本文关于植物使用的,术语“杂交”或“杂交的”是指通过授粉产生后代(例如细胞、种子和植物)实现配子融合。该术语既包括有性杂交(即,一个植物被另一个授粉)也包括自交(即,自花授粉,例如使用来自相同植物的花粉和胚珠)。
回交:回交方法可用于将核酸序列引入到植物中。这种技术已经被广泛使用了数十年,用于向植物中引入新的性状。Jensen,N.,Ed.Plant Breeding Methodology,JohnWiley&Sons,Inc.,1988。在典型的回交方案中,感兴趣的原始栽培品种(轮回亲本)与携带待转染的感兴趣核酸序列的第二栽培品种(非回轮亲本)杂交。然后将此次杂交所得的后代再次与轮回亲本进行杂交,重复这个过程,直至获得如下的植物,其中被转化的植物中除了从非轮回亲本转移的核酸序列之外,还恢复了轮回植物几乎全部的期望形态和生理特征。
基因渗入:如本文所使用的,术语“(基因)渗入”是指等位基因(或者包含外源核酸的经修饰等位基因)被传送到某个遗传背景的特定基因座处。在一些实施方案中,可以通过相同物种的两个亲本之间的有性杂交,其中至少一个亲本的基因组中具有特定的等位基因形式,来将该特定等位基因传送到至少一个后代中,从而将该特定等位基因渗入基因座。包含该特定等位基因的后代可以和具有期望遗传背景的品系反复回交。可以对回交后代选择特定等位基因形式,从而产生新的品种,其中特定的等位基因形式已被固定在该遗传背景中。在一些实施方案中,可以通过两个供体基因组之间的重组(例如,在融合的原生质体中),其中至少一个供体基因组在其基因组中具有特定的等位基因形式,来实现该特定等位基因的基因渗入。基因渗入可能涉及传送特定的等位基因形式,其可以是,例如但不仅限于,被破坏的或经过修饰的等位基因;转基因;PTU;和ELP。
种质:如本文所使用的,术语“种质”是指植物个体、植物群体(例如,植物品系、品种和家族)、和来自植物或植物群体的克隆的遗传材料。种质可以是生物体或细胞的一部分,或者它可以从生物体或细胞分出(例如,分离的)。一般地,种质提供具有特定的分子组成(makeup)的遗传材料,这是植物遗传性质的基础。如本文所用的,“种质”是指特定植物的细胞;种子;特定植物的组织(例如,可以生长出新植物的组织);和特定植物的非种子部分(例如,叶,茎,花粉,和细胞)。如本文所用的,术语“种质”与“遗传材料”同义,并可用于指代可以繁殖出植物的种子(或其他植物材料)。“种质库”可以指代不同种子或其它遗传材料(其中每种基因型被唯一地标识)的有序集合,从它们可以培养出已知的栽培种或者可以产生新的栽培种。
基因:如本文所用的,术语“基因”(或“遗传元件”)可以指具有功能性意义的可遗传的基因组DNA序列。基因可以是天然核酸,或者整合到基因组中的核酸。术语“基因”也可用于指,例如但不仅限于,由可遗传的基因组DNA序列编码的cDNA和/或mRNA。
核酸分子:如本文所用的,术语“核酸分子“可以指核苷酸(即,核糖核苷酸,脱氧核糖核苷酸,和/或前述任一者的修饰形式)的聚合物形式。本文所使用的“核酸分子”与“核酸”和“多核苷酸”是同义的。该术语包括RNA、cDNA、基因组DNA的有义链和反义链,及其合成形式和混合聚合物。该术语包括任何拓扑构象,包括单链,双链,部分双链体化,三链体化,发夹化,环形和挂锁构象。核酸分子可以包括天然存在的和经过修饰的核苷酸的任一种或两种。这样的核苷酸也可以通过天然存在的和/或非天然存在的核苷酸键连接在一起。
核酸分子可以被化学或生物化学修饰,或者可以含有衍生的核苷酸碱基,这是本领域技术人员容易理解的。这样的修饰包括,例如但不仅限于:标记;甲基化;一个或多个天然存在的核苷酸被类似物取代;和核苷酸间修饰(例如,不带电的连接,例如,甲基膦酸酯,磷酸三酯,氨基磷酸酯,和氨基甲酸酯;带电荷的连接,例如硫代磷酸酯和二硫代磷酸酯;悬垂部分(pedant moieties),例如,肽;插层剂,例如,吖啶和补骨脂;螯合剂;烷化剂;和经过修饰的连接,例如,α-异头核酸)。
外源的:“外源的”分子是指这样的分子:就多核苷酸而言,其核苷酸序列和/或基因组位置(即基因座)(且就多肽而言,其氨基酸序列和/或细胞定位而言)不是规定的系统(例如种质、品种、优良品种、和/或植物)所固有的。在实施方案中,外源的或异源的多核苷酸或多肽可以是人为提供给生物系统(例如,植物细胞,植物基因,特定的植物物种或栽培品种,和/或植物染色体)的分子,并且不是该特定生物系统固有的。因此,称某个核酸为“外源的”,可以表示该核酸来自天然存在的来源之外的来源,或者可以表示该核酸具有非天然的构型、遗传位置、或者元件布置。
相反,例如,“天然”或“内源”的核酸是这样的核酸(例如,基因),其不包含除了该核酸通常天然出现的染色体或其他遗传材料中通常存在的那些核酸元件之外的核酸元件。内源的基因转录本由处于天然染色体基因座处的核苷酸序列编码,而不是人为提供给细胞的。
可操作地连接:当第一核酸序列与第二核酸序列处于功能关系中时,则第一核酸序列与第二核酸序列可操作地连接。例如,当启动子影响编码序列的转录或表达时,启动子与编码序列可操作地连接。当重组产生时,可操作地连接的核酸序列一般是邻接的,并且在需要连接两个蛋白编码区时,处于同一阅读框内。然而,可操作地连接的元件不必是邻接的。
启动子:启动子是DNA的某个区域,其一般位于核酸的上游(朝向5'区域),可增强该核酸的转录。启动子允许适当地激活或抑制与之可操作地连接的核酸。启动子含有被转录因子识别的特定的序列。这些因子与启动子DNA序列结合,导致RNA聚合酶的招募,这种酶从核酸的编码区合成RNA。转化:当载体将核酸分子转移到细胞内时,该载体“转化“或“转导”细胞。当核酸分子被细胞稳定复制时,无论是通过将该核酸分子纳入到细胞的基因组中还是通过游离型复制(episomal replication),细胞被核酸分子“转化“。如本文所使用的,术语”转化“包括所有能够将核酸分子引入到细胞内的技术。实例包括但不仅限于:病毒载体转染;质粒载体转化;电穿孔(Fromm et al.(1986)Nature 319:791-3);脂质体转染(Felgner et al.(1987)Proc.Natl.Acad.Sci.USA 84:7413-7);显微注射(Mueller etal.(1978)Cell 15:579-85);土壤杆菌介导的转移(Fraley et al.(1983)Proc.Natl.Acad.Sci.USA 80:4803-7);直接DNA摄取;和微粒轰击(Klein et al.(1987)Nature 327:70)。
引入:如本文所使用的,术语“引入“在指外源核酸转位到细胞内时,是指使用本领域可得的任何方法将核酸纳入到细胞内。该术语包括核酸引入方法,包括例如但不仅限于,转染;转化;和转导。
转基因:如本文所使用的,术语“转基因“是指感兴趣的外源核酸编码序列。例如,转基因可以编码工业上或药学上有用的化合物,或者有利于期望农艺性状(例如除草剂抗性或害虫抗性)的表达产物。在进一步的实例中,转基因可以是反义核酸,其中该反义核酸的表达会抑制靶核酸序列的表达。转基因可以包括与该转基因可操作地连接的调节序列(例如,启动子)。在一些实施方案中,通过位点特异性靶向引入到FAD2基因座处的感兴趣核酸分子是转基因。然而,在其他实施方案中,感兴趣的核酸分子可以是PTU,ELP,ETIP,或者内源核酸序列(例如,其中内源核酸序列的额外外源基因组拷贝是期望的)。
元件还可以包括编码结构RNA,例如shRNA,的DNA。这种RNA能够修饰外源或内源基因,包括但不仅限于,影响功能发挥(posting)或赋予除草剂抗性。
重组:如本文所使用的,术语“重组”是指通过人为干预而改变的材料(例如,核酸、基因、多核苷酸、和/或多肽)。例如,重组分子的部分或元件的布置可能不是固有的布置,和/或重组分子的一级序列可能已自其固有序列被改变,例如为了优化其表达和/或活性。材料可以被改变,从而产生处于其天然环境或状态中或从其天然环境或状态脱离的重组材料。举一例子,如果某个核酸的开放阅读框的核苷酸序列已经脱离其天然背景且被克隆到人工的核酸分子(例如,载体)中,则该开放阅读框是重组的。用于产生重组分子(例如,重组核酸)的方案和试剂是本领域常见的,并且被常规地使用。术语“重组”在本文中还可以指包含重组材料的细胞或生物体(例如,含有重组核酸的植物和/或植物细胞)。在一些实例中,重组生物体是转基因生物体。
载体:如本文所使用的,术语“载体”是指能够将至少一个核酸节段转移到细胞内的多核苷酸或其他分子。载体可以任选地包含介导载体维持和/或实现其预期用途的组分/元件(例如,复制必需的序列,赋予药物或抗生素抗性的基因,多克隆位点,和/或可操作地连接的实现克隆基因表达的启动子/增强子元件)。载体可以源自,例如质粒、噬菌体,或植物或动物病毒。“克隆载体”、“穿梭载体”或“亚克隆载体”一般包括易化克隆或亚克隆步骤的可操作地连接的元件(例如,含有多个限制性核酸内切酶位点的多克隆位点)。
表达载体:如本文所使用的,术语“表达载体”是指这样的载体,其包含可以易化编码序列在特定宿主生物体中表达的可操作地连接的多核苷酸序列。例如,细菌表达载体可以易化编码序列在细菌中的表达。类似地,植物表达载体可以易化编码序列在植物细胞中的表达。易化在原核生物中表达的多核苷酸序列可以包括,例如但不仅限于:启动子;操纵基因;和核糖体结合位点。真核表达载体(例如,植物表达载体)可包括,例如,启动子;增强子;终止信号;和多腺苷酸化信号(以及其它序列),它们一般与在原核表达载体中所使用的不同。
序列同一性:如本文在两个核酸或多肽序列内容中所使用的,术语“序列同一性”或“同一性”是指当经过比对两个序列从而在特定的比较窗口上获得最大的对应度时,两个序列中相同的残基。序列同一性的数值可以通过比较两个在比较窗口上最佳比对的序列(例如,核酸序列和氨基酸序列)加以确定,其中与参考序列(其不含有添加或缺失)相比,序列在比较窗口中的部分可以包含添加或缺失(即,缺口)以实现两个序列的最佳比对。序列同一性可以被计算为百分比,通过确定两个序列中存在的相同核苷酸或氨基酸残基的位置的数目,用匹配位置的数目除以比较窗口中的位置的总数,并将结果乘以100,产生序列同一性的百分比。
用于比对比较序列的方法是本领域众所周知的。在下列文献中描述了各种程序和比对算法,例如:Smith and Waterman(1981)Adv.Appl.Math.2:482;Needleman andWunsch(1970)J.Mol.Biol.48:443;Pearson and Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;Higgins and Sharp(1988)Gene 73:237-44;Higgins and Sharp(1989)CABIOS 5:151-3;Corpet et al.(1988)Nucleic AcidsRes.16:10881-90;Huang et al.(1992)Comp.Appl.Biosci.8:155-65;Pearson et al.(1994)Methods Mol.Biol.24:307-31;Tatiana et al.(1999)FEMS Microbiol.Lett.174:247-50。序列比对方法和同源性计算的详细描述可以在Altschul et al.(1990)J.Mol.Biol.215:403-10中找到。
美国国家生物技术信息中心(NCBI)的基本局部比对搜索工具(BLASTTM;Altschulet al.(1990))可以用于比对序列,它可以从多个来源获得,包括美国国家生物技术信息中心(Bethesda,MD),和互联网上,用于和多种序列分析程序联合使用。关于如何使用这一程序确定序列同一性的描述可以在互联网上在BLASTTM的“帮助”一节中获得。对于核酸序列的比较,可以采用BLASTTM(Blastn)程序的“Blast 2sequences”功能,使用默认参数。当通过这一方法进行评估时,与参考序列具有越大相似性的核酸序列将显示越高的百分比同一性。
如本文所使用的,术语“基本上相同的”可以指核苷酸序列超过80%相同。例如,基本上相同的核苷酸序列可以和参考序列至少85%,至少86%;至少87%;至少88%;至少89%;至少90%;至少91%;至少92%;至少93%;至少94%;至少95%;至少96%;至少97%;至少98%;至少99%;或至少99.5%相同。
基因座:如本文所使用的,术语“基因座“是指基因组上与可测量特征(例如,性状)相应的位置。在一些实施方案中,特别感兴趣的基因座是FAD2基因的基因组位置,在该处基因的破坏可降低或消除从野生型基因转录的mRNA的表达。基因座可以用在Southern杂交或PCR中与该基因座中含有的独特核苷酸序列杂交的探针来定义。
标志物:如本文所使用的,“标志物”是指这样的基因或核苷酸序列,其能够用于鉴定可能具有特定等位基因和/或显示特定性状或表型的植物。标志物可以被描述为给定基因组座位处的变异。遗传标志物可以是短DNA序列,例如围绕单碱基对变化的序列(单核苷酸多态性,或“SNP”),或者是长序列,例如微卫星/简单序列重复(“SSR”)。“标志物等位基因”是指特定植物中存在的标志物版本。如本文所使用的,术语“标志物”可以指植物染色体DNA的克隆节段(例如,包含FAD2基因座,或经过修饰和/或被破坏的FAD2基因座的节段),还/或者可以指与植物染色体DNA克隆节段互补的DNA分子。本领域的普通技术人员会认识到,可以将获得额外的连续核苷酸序列包含在标志物中的过程重复几乎无限多次(仅受限于染色体的长度),借此沿着该染色体鉴定其他的标志物。上述标志物的任何变化均可使用在本发明的某些实施方案中。
在一些实施方案中,种质中转基因或标志物的存在(用“靶”序列表征)可以通过使用核酸探针(例如寡核苷酸)进行检测。探针可以是DNA分子或RNA分子。寡核苷酸探针可以合成制备或者通过克隆制备。合适的克隆载体是本领域技术人员所熟知的。RNA探针可以通过本领域已知的手段合成,例如使用DNA分子模板。
寡核苷酸探针可以是带标记的或者无标记的。用于标志物核酸分子的技术有很多,包括例如但不仅限于,通过切口平移的放射标记;随机引发;和用末端脱氧转移酶(terminal deoxytransferase)加尾(tailing),其中所用的核苷酸是带标记的,例如带放射性32P标记。其他可以使用的标记物包括,例如但不仅限于,荧光团;酶;酶底物;酶的辅助因子;和酶抑制剂。或者,作为使用自身提供或者与其它反应试剂联合提供可检测信号的标记物的替代手段,可以使用能结合受体的配体,其中受体被标记(例如,被上述的标记物所标记),从而自身提供或者与其他试剂一起提供可检测信号。参见,例如,Leary et al.(1983)Proc.Natl.Acad.Sci.USA80:4045-9。
探针可以是被检测的转基因或标志物的精确拷贝。探针也可以是这样的核酸分子,其包含与包含待检测的转基因或标志物的染色体DNA克隆节段基本上相同的核苷酸序列,或者由这样的核苷酸序列构成。探针可以进一步包括额外的核酸序列,例如启动子;转录信号;和/或载体序列。
探针可以包含靶核苷酸序列的全部或一部分和来自基因组的额外的邻接核苷酸序列。这在本文中被称作“邻接探针”。上述额外的邻接核苷酸序列是指原始靶的“上游”或“下游”,这取决于来自染色体的邻接核苷酸序列位于原始靶的5’侧还是3’侧,如常规上所理解的。探针还可以包含不与原始靶邻接的核苷酸序列;这种探针在本文中被称作“非邻接探针”。非邻接探针可以定位于和染色体上的原始靶序列足够接近的位置,使得该非邻接探针与原始标志物或转基因连接。
在一些实施方案中,探针是与待检测的靶的精确拷贝“能够特异性杂交”或“特异性互补”的核酸分子。术语“能够特异性杂交”和“特异性互补”表示有足够程度的互补性,使得核酸分子和靶之间发生稳定而特异的结合。核酸分子不需要与其靶序列100%互补才能特异性杂交。当存在足够程度的互补性从而避免在期望特异性结合的条件下,例如在严格的杂交条件下,发生核酸与非靶序列的非特异性结合时,核酸分子是能够特异性杂交的。
导致特定严格度的杂交条件将随着所选杂交方法的性质和杂交核酸序列的组成和长度而改变。一般地,杂交温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg++浓度)将决定杂交的严格度,尽管清洗时间也会影响严格度。获得特定严格程度所需的杂交条件的计算是本领域普通技术人员已知的,并且在下列文献中有讨论,例如,Sambrook et al.(ed.)Molecular Cloning:A Laboratory Manual,2nd ed.,vol.1-3,Cold Spring HarborLaboratory Press,Cold Spring Harbor NY.,1989,第9和11章;和Hames and Higgins(eds.)Nucleic Acid Hybridization,IRL Press,Oxford,1985年。关于核酸杂交更详细的说明和指导可以在下列文献中找到,例如,Tijssen,“Overview of principles ofhybridization and the strategy of nucleic acid probe assays,”其汇编在Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第I部分,第2章中,Elsevier,NY,1993;和Ausubel等人编辑,Current Protocols in Molecular Biology,第2章,Greene Publishing and Wiley-Interscience,NY,1995。
如本文所使用的,“严格条件”包括只有当杂交分子与DNA靶之间的错配小于25%时才会发生杂交的条件。“严格条件”包括更具体水平的严格度。因此,如本文所使用的,“温和(moderate)严格”条件是序列错配超过25%的分子不会杂交的条件;“中等(medium)严格”条件是序列错配超过15%的分子不会杂交的条件;“高严格”条件是序列错配超过10%的分子不会杂交的条件。“极高严格”条件是序列错配超过6%的分子不会杂交的条件。
在特定的实施方案中,严格条件是在如下条件下杂交:65℃于6x盐-柠檬酸钠(SSC)缓冲液,5x Denhardt溶液,0.5%SDS和100μg剪切的鲑鱼精DNA,接着在下列缓冲液中顺次清洗15-30分钟:65℃于2x SSC缓冲液和0.5%SDS,随后是1x SSC缓冲液和0.5%SDS,最后是0.2x SSC缓冲液和0.5%SDS。
连锁(不)平衡:如本文所使用的,术语“连锁平衡”是指这样的情况,其中标志物和第二核酸(例如,转基因,PTU,和第二标志物)独立地分离;即,标志物和第二核酸在后代中随机地组合(sort)。显示连锁平衡的核酸被认为是不连锁的(无论它们是否位于同一染色体上)。如本文所使用的,术语“连锁不平衡”是指如下情况,其中标志物和第二核酸以非随机的方式分离;即,核酸的重组频率小于50%(因此,根据定义,在同一连锁群上的距离小于50cM)。在一些实施例中,显示连锁不平衡的核酸被认为是连锁的。
连锁,紧密连锁,和极紧密连锁:如本文所使用的,标志物与第二核酸(例如,转基因,PTU,和第二标志物)之间的连锁可以指这样的现象,其中染色体上的核酸显示出可测量的一起传递到下一代的个体中的概率。因此,一个标志物与第二核酸的连锁可以用重组频率来度量和/或表示。两个核酸越彼此接近,这个概率越接近“1”。因此,术语“连锁”可以指一个或多个基因或标志物与第二核酸以大于0.5的概率一起传递(这是根据标志物/基因在不同染色体上的位置的自由组合(independent assortment)而预期的)。当基因(例如,转基因)的存在有助于个体中的表型时,与该基因连锁的标志物可以被称作与该表型连锁。因此,术语“连锁”可以指标志物和基因或者标志物和表型之间的关系。
相对遗传距离(通过杂交频率确定,并以厘摩(cM))度量)通常与两个连锁标志物或基因在染色体上彼此分离的物理距离(用碱基对度量)成比例。一厘摩被定义为显示1%重组频率(即,两个标志物在每100次细胞分裂中发生一次交换事件)的两个遗传标志物之间的距离。一般地,一个标志物与另一个标志物或基因越接近(无论它们之间的距离是按照遗传距离还是物理距离度量的),它们连锁得越紧密。因为染色体距离与性状间重组事件的频率大致成比例,因此存在与重组频率相关的近似物理距离。在这种关联是众所周知的,或者在主要作物和许多其他生物中可以容易地确定(Helentjaris and Burr(eds.)(1989)Development and Application of Molecular Markers to Problems in Plant Genetics.Cold Spring Harbor Laboratory,Cold Spring Harbor,NY;Gresshoff(ed.)(1994)Plant Genome Analysis.CRC Press,Boca Raton,FL;Lander et al.(1987)Genomics 1:174-81;Tanksley et al.(1988)“Molecular mapping of plantchromosomes,”In Chromosome Structure and Function.Gustafson and Appels(eds.)Plenum Press,NY,pp.157-73)。例如,1cM在酵母中对应于大约2.5-3.0kb,在拟南芥中对应于大约140kb,在向日葵中对应于大约400kb,在桉树中对应于约350kb。
术语“连锁的”在本文中可以指一个或多个显示重组频率小于50%(即,小于50cM)的核酸。例如,“连锁”的核酸的重组频率可以为大约45%或更低,大约40%或更低,大约35%或更低,大约30%或更低,大约25%或更低,大约20%或更低,大约15%或更低,和大约10%或更低。这些核酸在同一染色体上的物理距离(位于不同染色体上的核酸预期是连锁平衡的)对应于前述的重组频率,依赖于宿主基因组,并且可以按照上文所提出的容易地进行计算。
如本文所使用的,术语“紧密连锁”可以指显示大约20%或更低的重组频率(即,大约20cM或更小)的一个或多个核酸。例如,“紧密连锁的”核酸可以以22%或更低,大约18%或更低,大约16%或更低,大约14%或更低,大约12%或更低,大约10%或更低,大约8%或更低,大约6%或更低,大约4%或更低,和大约2%或更低的频率重组。
如本文所使用的,术语“极紧密连锁”可以指显示大约10%或更低的重组频率(即,大约10cM或更小)的一个或多个核酸。例如,“极紧密连锁的”核酸可以以11%或更低,大约9%或更低,大约8%或更低,大约7%或更低,大约6%或更低,大约5%或更低,大约4%或更低,大约3%或更低,大约2%或更低,和大约1%或更低的频率的重组。
特定核酸与编码贡献于特定表型的多肽的基因越接近(无论是用遗传距离还是用物理距离测量),该特定核酸与该表型越紧密连锁。鉴于上述情况可以理解,与特定基因或表型连锁的核酸包括那些与该基因或表型紧密连锁的核酸,和那些与该基因或表型极紧密连锁的核酸。在一些实施方案中,特定核酸与FAD2基因座(例如,经过修饰或被破坏的FAD2基因座)越接近,无论是用遗传距离还是用物理距离测量,该特定核酸与由整合在该FAD2基因座处的外源核酸所赋予的任何性状/表型(或者在基因座未修饰的情况下,与野生型FAD2的表型)的连锁越紧密。因此,与包含整合的外源核酸的FAD2基因座相连锁、紧密连锁、和/或极紧密连锁的遗传标志物可在MAS程序中用于鉴定包含整合核酸的生物体(例如,植物或植物品种),鉴定包含由整合核酸赋予的表型的生物体,和将这种整合核酸和/或由该整合核酸赋予的表型培育到其他相容的生物体中。
标志物辅助育种:如本文所使用的,术语“标志物辅助育种”可以指直接针对一个或多个性状(例如多基因性状)培育植物的方法。在当前的实践中,植物育种者试图鉴定容易检测的性状,例如花的颜色,种皮外观,或者与农艺上期望的性状相连锁的同工酶变体。然后,植物育种者通过跟踪该容易检测的性状的分离,在分离和育种群体中跟踪农艺学性状。然而,只有非常少的这些感兴趣性状与容易检测的性状之间的连锁关系可供用于植物育种。在本发明的一些实施方案中,标志物辅助育种包括鉴定一个或多个与FAD2基因座连锁的遗传标志物(例如,SNP,同工酶和/或SSR标志物),其中有利于感兴趣性状的外源核酸整合在该FAD3基因座中,并通过跟踪该一个或多个遗传标志物的分离,在分离的育种群体中跟踪感兴趣的性状。在一些实例中,一个或多个遗传标志物的分离可以用该一个或多个遗传标志物的探针通过测定来自后代植物的遗传样品中是否存在该一个或多个遗传标志物加以确定。标志物辅助育种可以为植物栽培品种的改良提供时间上和成本上高效率的过程。
性状或表型:术语“性状”和“表型”在本文中可互换使用。为本公开的目的,特别感兴趣的性状包括农艺上重要的性状,例如可以在例如作物植物中表达的,和转基因表达产物自靶向整合事件的产生。术语“分子表型”可以指这样的表型,其可以在(一个或多个)分子的群体的水平上被检测到。在一些实例中,该分子表型可以仅能在分子水平上被检测到。表型的可检测分子可以是核酸(例如,基因组DNA或RNA);蛋白质;和/或代谢物。例如,分子表型可以是一个或多个基因产物(例如,在植物发育的特定阶段、或响应于环境条件或胁迫)的表达谱。
数量性状基因座:由于遗传(加性、显性和上位性)和环境影响而连续变化的性状通常被称为“数量性状”。数量性状可以根据两个因素区别于“定性”或“不连续”性状:对基因表达的环境影响,其导致表型的连续分布;和由多基因遗传产生的复杂分离模式。与数量性状表达相连锁的一个或多个基因组区域的鉴定将这样的区域定义为数量性状基因座(“QTL”)。
植物:如本文所使用的,术语“植物”是指全植物,来自植物的细胞或组织培养物,和/或任一前述的任何部分。因此,术语“植物”包括,例如但不仅限于,全植物;植物组分和/或器官(例如,叶、茎和根);植物组织;种子;和植物细胞。植物细胞可以是,例如但不仅限于,植物中和/或属于植物的细胞,从植物分离的细胞,和通过培养分离自植物的细胞而获得的细胞。
“转基因植物”是在其至少一个细胞中包含外源多核苷酸的植物。术语“转基因”在本文中用于指任何基因型由于外源核酸的存在而被改变的细胞,细胞系,愈伤组织,组织,植物部分或植物。因此,该术语包括最初被改变从而包含外源多核苷酸的转基因生物体和细胞,和通过最初的转基因生物体或细胞的杂交或无性繁殖产生的那些生物体和细胞。如本文所使用的,术语“转基因”不包括通过常规植物育种方法(例如,单纯非转基因生物体的杂交)或通过天然出现的事件(例如随机杂交授粉,非重组病毒感染,非重组细菌转化,非重组转座,和自发突变)引入的基因组(染色体或染色体外)改变。
植物“品系”,“品种”或“株”是一群具有相同家系(parentage)的个体植物。一个品系的植物在一定程度是近交的,并且一般在大多数遗传基因座(例如,FAD2基因座)上是纯合的且均质的。“亚系”可以指来自共同祖先的后代的近交子集,它们在遗传上与来自相同祖先的其他相似的近交子集的后代不同。在一些实施方案中,“亚系”可以通过这样产生:使在F3-F5代选出的个体转基因植物的种子近交,直至残余的分离中的基因座(segregatinglocus)在大多数或全部基因座处均是纯合的。
“结合蛋白”是能够与另一个分子结合的蛋白。结合蛋白能够结合,例如,DNA分子(DNA结合蛋白),RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。在蛋白质结合蛋白的情况下,它能够与自身结合(形成同二聚体,同三聚体,等),和/或它能够与其他不同蛋白的一个或多个分子结合。结合蛋白可以具有不止一种类型的结合活性。例如,锌指蛋白具有DNA结合,RNA结合和蛋白结合活性。
“锌指DNA结合蛋白”(或结合结构域)是通过一个或多个锌指(这是结合结构域内的氨基酸序列区,其结构通过锌离子配位加以稳定)以序列特异性的方式结合DNA的蛋白质或较大蛋白内的结构域。术语锌指DNA结合蛋白通常被缩写为锌指蛋白或ZFP。
“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。该重复结构域参与TALE与其关联靶DNA序列的结合。单一“重复单元”(也称为“重复”)通常长度为33-35个氨基酸,并与天然存在的TALE蛋白内的其他TALE重复序列显示至少一些序列同源性。
锌指和TALE结合结构域可以被“工程化”以结合预定的核苷酸序列,例如通过将天然存在的锌指或TALE蛋白的识别螺旋区工程化(改变一个或多个氨基酸)。因此,工程化的DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。用于工程化DNA结合蛋白的方法的非限制性实例是设计和选择。设计的DNA结合蛋白不是天然存在的蛋白,其设计/组成主要来自合理的标准。用于设计的合理标准包括采用替换规则和计算机化算法来处理现有ZFP和/或TALE设计和结合数据的数据库分选信息中的信息。参见,例如,美国专利6140081;6453242;和6534261;另见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496和美国公开No.20110301073。
“选定的”锌指蛋白或TALE是未在自然界中发现的蛋白,其产生主要来自经验性方法,例如噬菌体展示,相互作用捕获(interaction trap)或杂交选择。参加例如US 5,789,538;US 5,925,523;US 6,007,988;US 6,013,453;US 6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970WO 01/88197,WO 02/099084和美国公开号No.20110301073。
“剪切”是指DNA分子共价骨架的断裂。剪切可以通过多种方法触发,包括但不仅限于,磷酸二酯键的酶或化学水解。单链剪切和双链剪切均是可能的,并且双链剪切可以作为两个迥异的单链剪切事件的结果而发生。DNA剪切可导致产生平末端或粘末端。在某些实施方案中,融合多肽被用于靶向的双链DNA剪切。
“剪切半结构域”是这样的多肽序列,其与第二多肽(相同的或不同的)一道形成具有剪切活性(优选地,双链剪切活性)的复合体。术语“第一和第二剪切半结构域”、“+和-剪切半结构域”和“右和左剪切半结构域”可互换使用,指示可二聚体化的剪切半结构域对。
“工程化的剪切半结构域”是指已经被修饰,使其与另一个剪切半结构域(例如另一个被工程化的剪切半结构域)形成专性(obligate)异二聚体的剪切半结构域。另见美国专利公开号2005/0064474,20070218528,2008/0131962和2011/0201055,本文引用其全部内容作为参考。
用于产生双链DNA断裂的手段:如本文所使用的,术语“用于产生双链DNA断裂的手段”意在援引美国法典第35编第112条(35U.S.C.§112)第六款中美国国会授权的特殊权利要求规定。具体地,“用于产生双链DNA断裂的手段”是指一种分子结构,其能够剪切双链DNA分子的两条链。这样的结构包括在许多已知的核酸酶蛋白中含有的多肽结构域,例如,FokI核酸酶结构域,选自下组蛋白的催化结构域:Mmel,大肠杆菌素-E7(CEA7_ECOLX),大肠杆菌素-E9,APFL,EndA,Endo I(END1_EC0LI),人Endo G(NUCG_HUMAN),牛Endo G(NUCG_BOVIN),R.HinPll,l-Basl,l-Bmol,l-Hmul,l-Tevl,l-Tevll,l-Tevlll,l-Twol,R.Mspl,R.Mval,NucA,NucM,Vvn,Vvn_CLS,葡萄球菌核酸酶(NUC_STAAU),葡萄球菌核酸酶(NUC_STAHY),微球菌核酸酶(NUC_SHIFL),核酸内切酶yncB,脱氧核糖核酸内切酶(Endodeoxyribonuclease)I(ENRN_BPT7),Metnase,Nb.BsrDI,BsrDI A,Nt.BspD6l(R.BspD6l大亚基),ss.BspD6l(R.BspD6l小亚基),R.PIel,Mlyl,Alwl,Mval269l,Bsrl,Bsml,Nb.BtsCI,Nt.BtsCI,Rl.Btsl,R2.Btsl,BbvCI亚基1,BbvCI亚基2,BpulOIα亚基,BpulOIβ亚基,Bmrl,Bfil,l-Crel,hExol(EX01JHUMAN),酵母Exol(EX01_YEAST),大肠杆菌Exol,人TREX2,小鼠TREX1,人TREX1,牛TREX1,大鼠TREX1,人DNA2,酵母DNA2(DNA2_YEAST)。
用于修复双链DNA断裂的手段:如本文所使用的,术语“修复双链DNA断裂的装置”意在援引美国法典第35编第112条第六款中美国国会授权的特殊权利要求规定。具体地,“修复双链DNA断裂的手段”是指一种分子结构,其能够易化/催化双链DNA分子末端的接合,例如通过接合由单条双链DNA分子剪切产生的末端,或者通过接合由单条双链DNA分子剪切产生的一个末端与一个外源双链DNA分子的末端。这样的结构包括许多已知的连接酶蛋白,例如Cre重组酶中含有的多肽结构域。在一些实例中,同一分子结构可以同时作为用于产生双链DNA断裂的手段,又作为用于修复双链DNA断裂的手段,其中同一结构既易化双链DNA分子的剪切,又易化双链DNA分子的修复(例如,Hin重组酶)。
基因组中位点特异性双链断裂的诱发可诱导宿主植物细胞DNA修复通路,其通过同源性介导的修复(HDR)或者非同源末端连接(NHEJ)修复恢复双链断裂。在植物中,科学文献报道,基因或供体DNA到固有基因组位置中或预先工程化的位置的精确整合涉及这样的输入(incoming)供体DNA构建体,它们包含不同量的与靶定的双链断裂的侧翼序列同源的序列。此类供体到特定的靶基因座中的整合可以认为是依赖HDR通路。植物中完全依赖HDR方法的基因打靶可能是受限的,因为已有报道,与NHEJ相比,HDR修复通路不是占主导地位的DNA修复通路。在已经出版的利用靶特异性DNA断裂(ZFN,TALeN,或工程化的大范围核酸酶,等)的植物科学文献中,NHEJ通路已经被报道用作向基因组中引入特定点突变(插入或删除)的方法。本文中我们报道,在植物中,在设计为具有0到<10bp的各种同源区域的供体DNA设计的存在下,可以通过NHEJ修复通路在靶断裂处特异性插入位点特异性双链断裂(通过ZFN,TALeN等诱导)。多种不同的DNA供体设计具有零同源性到小的1–10bp范围,从线性到环形,从单链到双链,均可以使用NHEJ通路被靶向到特定的位置。基于NHEJ的供体DNA的植物基因组靶向可以是基于“粘末端捕捉”,其中基因组中的由Fok1(或其它II型核酸内切酶结构域)产生的靶向双链断裂和相应的粘末端在NHEJ供体DNA设计上。粘末端供体DNA可以作为具有预定突出端的线性供体DNA被直接递送给细胞。一种替代方法是通过共递送宿主靶ZFN和含有至少一个与靶识别位点相同的ZFN识别位点的环形DNA供体分子,在体内产生供体DNA粘末端。至少一个ZFN的表达会切割宿主基因组DNA(固有的或预先工程化的)和环形供体DNA,从而产生粘末端,粘末端使用宿主的NHEJ修复通路解析(resolve)。
在供体分子上可能具有一个或多个ZFN切割位点(单独一个ZFN切割位点用来使整个供体分子线性化,2个同样的ZFN位点用来释放较小的供体DNA片段,或者2个不同的ZFN位点用来从供体释放一个片段、并从宿主基因组DNA释放一个对应的片段(DNA替换))。
因此,供体多核苷酸可以是DNA或RNA,单链和/或双链,并能够以线性或环形形式被引入到细胞中。参见,例如,美国专利公开Nos.20100047805和20110207221。在本发明的某些实施方案中,还可以包括线性外源(供体)核酸,包含这些核酸的组合物,和用于制造和使用这些线性供体分子的方法。在某些实施方案中,线性供体分子在引入线性供体分子的细胞中稳定保持。在其它实施方案中,线性供体分子被修饰成抵抗外切性核酸切割(exonucleolytic cleavage),例如通过在供体分子末端的一个或多个碱基对之间放置一个或多个硫代磷酸酯磷酸二酯键。该线性外源核酸还可以包括单链的特异DNA。
III.FAD2性能基因座
命名为FAD2(脂肪酸去饱和酶2)的基因座包含在涉及植物中脂肪酸含量复杂多基因性状遗传的QTL中。FAD2编码负责将油酸(18:1)去饱和为亚油酸(C18:2)的酶。Tanhuanpaa et al.(1998)Mol.Breed.4:543-50;Schierholt et al.(2001)Crop Sci.41:1444-9。
在植物油生物合成通路中,脂肪酸去饱和酶(FAD)在植物脂质生物合成中发挥关键作用,并且它们的活性显著影响脂肪酸组成。FAD在植物中丰富,并且表达分析提示FADmRNA以过量丰度产生。而且,FAD基因在各种组织和细胞类型,以及包括质体和内质网在内的亚细胞区室中表达。
植物的脂肪酸组成,以及由其产生的油在许多应用中的性能,是由主要脂肪酸组分——油酸、亚油酸和亚麻酸(C18:3)的相对浓度决定的。这些脂肪酸的浓度主要受到酶FAD2和FAD3的功能的调节。在植物中,油酸根据下述过程被转变成亚油酸和亚麻酸:
Figure BDA0002137215980000261
FAD2基因已经在主要植物和藻类物种中被鉴定,包括但不仅限于,玉米、大豆、棉花、拟南芥、小麦、牧草、水稻、向日葵和芸苔属(Brassica),并且FAD2表达的修饰可导致这些生物体中的脂肪酸谱的改变。而且,包含经过修饰的FAD2基因的植物已经被商业化,并且已经有人显示,破坏FAD2基因能够改良由宿主植物产生的油的营养和功能性质,但不会对宿主植物的造成农艺学上的损失。例如,已经以商品名
Figure BDA0002137215980000262
(Dow AgroSciences,LLC)被商业化的芥花(canola)和向日葵品种的特征在于,与野生型芥花和向日葵谱相比,具有较高的油酸、较低的亚油酸和较低的亚麻酸(和较低的饱和脂肪酸)组成。
在欧洲、北美和澳大利亚种植的主导芥花物种是欧洲油菜,它是一种被认为是通过甘蓝(B.oleracea)(具有二倍体C基因组)与芜菁(B.rapa)(具有二倍体A基因组)杂交产生的多倍体油菜物种。细胞基因组研究显示,AA和CC基因组显示一定程度的亲缘性,彼此部分同源。A和C基因组均含有高百分比的同源或旁系同源基因。因此,有人认为,AA和CC基因组来自共同的祖先基因组。Prakash and Hinata(1980)Opera Botanica 55:1-57。尽管两个祖先物种的基因组在技术上均被归类为二倍体,但是这些基因组含有高百分比的彼此重复的区域。Song et al.(1991)Theor.Appl.Genet.82:296-304。详细的细胞器和细胞核RFLP分析显示,芜菁的AA基因组向油菜贡献10个染色体,而甘蓝从其作为母本供体的CC基因组贡献了9个染色体。Song et al.(1992)Genome 35:992-1001。通过两个祖先基因组中基因组重复的数目,以及A、B和C基因组之间高百分比的相似性,已经出现了FAD2和FAD3基因的数个拷贝。实际上,这个事实使得培育具有这些基因的修饰和/或破坏拷贝的芥花以产生特定的脂肪酸谱变得特别具有挑战性。
芥花中FAD2的已知的功能性基因拷贝均位于A基因组的连锁群N4上。Scheffleret al.(1997)TAG 94(5):583-91;Schierholt et al.(2000)TAG 101(5-6):897-901。更近些时候,已经将芥花的高油酸性状与位于A基因组上的修饰和破坏的FAD2基因联系起来。美国专利申请公开No.US 2006/0248611 A1;Hu et al.(2006)“Identification andMapping of FAD2 and FAD3Mutations and Development of Allele-specific Markersfor High Oleic and Low Linolenic Acid Contents in Canola(Brassica napus L.),”Plant&Animal Genomes XIV Conference,2006年1月14-18日,2006,San Diego,CA。失活性的FAD2等位基因通过减少亚油酸去饱和为亚麻酸而贡献于对油酸含量的控制。这种高油酸和FAD3性状在欧洲油菜品种(DMS100)中被鉴定,其具有大约77%的特征性油酸含量。见美国申请No.10/545,100。此外,FAD2基因新近被定位在A5染色体上,且有人声称它是高C18:1含量的原因。见,Yang et al.,“Brassica napus genome”Theor Appl Genet(2012 125:715-729。进一步,已经开发出了用于辅助将Fad2和高油酸性状基因渗入到芥花中的遗传标志物。
可以在植物中修饰和/或破坏FAD2基因座而不会不利地影响植物价值,而且对于许多目的而言,实际上可以增加其价值,包括改变FAD2表达,改变油含量/比例,和/或整合和表达期望的转基因。而且,根据FAD基因座在植物中普遍存在的性质,可以为了至少某些目的在许多物种中修饰和/或破坏FAD2基因座而不会造成损害,这些物种包括,例如但不仅限于:芥花;大豆;玉米;小麦;牧草;芸苔属植物;水稻;番茄;大麦;燕麦;高粱;棉花;和向日葵,以及真菌和藻类。本发明的实施方案包括FAD2基因座,及其作为性能基因座用于整合外源核酸的用途。已经发现在FAD2基因用作性能基因座的背景中有数种特征是理想的,在实例中FAD2基因表现出其中至少一种,包括,例如但不限于:在宿主生物体整个生命周期中具有大体一致的表达水平;以及,令人惊讶地,供体DNA整合到FAD2基因座处不会诱发宿主的品质或健康(fitness)损失。
在本发明的一些实施方案中,至少一个FAD2基因座(例如,FAD2A,FAD2A’,FAD2C,和/或FAD2C’基因座)被用作外源核酸(例如,包含编码感兴趣多肽的核苷酸序列的核酸)的位点特异性整合的靶位点。在特定的实施方案中,外源核酸的整合产生修饰的基因座。例如,外源核酸的整合可以修饰基因座,从而产生被破坏的(即,失活的)FAD2基因。
在一些实施方案中,FAD2基因座可以包括与选自下组的核苷酸序列的互补物能够特异性杂交的核苷酸序列:SEQ ID NO:22-26,SEQ ID NO:28-33和SEQ ID NO:35-38。例如,FAD2基因座可以包括选自下组的核苷酸序列:SEQ ID NO:22-26,SEQ ID NO:28-33和SEQID NO:35-38。在一些实施方案中,FAD3基因座可以包括与选自下组的核苷酸序列基本上相同的核苷酸序列:SEQ ID NO:22-26,SEQ ID NO:28-33和SEQ ID NO:35-38。例如,在一些实施方案中,FAD2基因座是包含与选自下组的核苷酸序列具有至少大约85%的同一性的核苷酸序列的FAD3同源物(例如,直系同源物或旁系同源物):SEQ ID NO:22-26,SEQ ID NO:28-33和SEQ ID NO:35-38。FAD2同源物可包含这样的核苷酸序列,其与选自下组的核苷酸序列例如但不仅限于至少80%;至少85%;至少约90%;至少约91%;至少约92%;至少约93%;至少约94%;至少约95%;至少约96%;至少约97%;至少约98%;至少约99%;至少约99.5%;99.6%,99.7%,99.8%和/或至少约99.9%相同:SEQ ID NO:22-26,SEQ ID NO:28-33和SEQ ID NO:35-38。这样的FAD2同源物对于多种生物而言,可以容易地识别并从本领域技术人员容易获得的任何完整或部分基因组中分离。
IV.核酸在FAD2基因座处的靶向整合
外源核酸在FAD2基因座处的位点特异性整合可以通过本领域技术人员已知的任何技术实现。在一些实施方案中,在FAD2基因座处整合外源核酸包括使细胞(例如,分离的细胞或组织或生物体中的细胞)与包含外源核酸的核酸分子接触。在实例中,这样的核酸分子可以包括位于外源核酸侧翼的、易化该核酸分子与至少一个FAD2基因座之间的同源重组的核苷酸序列。在特定实例中,位于外源核酸侧翼的易化同源重组的核苷酸序列可以和FAD2基因座的内源核苷酸互补。在特定的实例中,位于外源核酸侧翼的易化同源重组的核苷酸序列可以和既往整合的外源核苷酸互补。在一些实施方案中,多个外源核酸可以被整合在一个FAD2基因座处,如在基因堆叠中。
在一些实施方案中,可以通过宿主细胞的内源细胞机构,例如但不仅限于,内源DNA和内源重组酶,来易化(例如催化)FAD2基因座处的核酸整合。在一些实施方案中,FAD2基因座处的核酸整合可以被一种或多种提供给宿主细胞的因子(例如,多肽)所易化。例如,可以提供核酸酶,重组酶和/或连接酶多肽(或是独立的,或是作为嵌合多肽的一部分),通过使该多肽与宿主细胞接触或者通过在宿主细胞内表达该多肽来提供。因此,在一些实例中,可以向宿主细胞中引入包含编码至少一种核酸酶,重组酶和/或连接酶多肽的核苷酸序列的核酸,该核酸可以与要位点特异性整合到FAD2基因座处的核酸同时或顺次引入,其中在宿主细胞中,该至少一种核酸酶,重组酶,和/或连接酶多肽自该核苷酸序列表达。
A.DNA-结合多肽
在一些实施方案中,位点特异性整合可以利用能够识别并结合特定核苷酸序列(例如宿主生物体基因组中的特定核苷酸序列)的因子来实现。例如,许多蛋白质包含能够识别并以位点特异性的方式与DNA结合的多肽结构域。被DNA结合多肽识别的DNA序列可被称为“靶”序列。能够识别DNA并以位点特异性的方式与之结合的多肽结构域一般可正确折叠并独立地发挥功能,从而以位点特异性的方式结合DNA,即使是当它表达在与最初分离出该结构域的蛋白质不同的多肽中也是如此。类似地,被DNA结合多肽识别和结合的靶序列一般能够被这样的多肽识别并结合,即使是存在于大DNA结构中(例如,染色体)也是如此,特别是当靶序列所处的位点是已知可溶性细胞蛋白质可以达到的位点(例如,基因)时。
尽管从自然界中存在的蛋白质中鉴定的DNA结合多肽通常与离散的核苷酸序列或基序(例如,共有识别序列)结合,但是在本领域中存在并且知晓有方法来修饰许多这样的DNA结合多肽从而识别不同的核苷酸序列或基序。DNA结合多肽包括,例如但不仅限于:锌指DNA结合结构域;亮氨酸拉链;UPADNA结合结构域;GAL4;TAL;LexA;Tet抑制子;LacR;和类固醇激素受体。
在一些实例中,DNA结合多肽是锌指。单独的锌指基序可以被设计成靶向并特异性结合多种多样的DNA位点中的任何种。规范的Cys2His2(以及非规范的Cys3His)锌指多肽通过将α-螺旋插入到靶DNA双螺旋的大沟中来结合DNA。锌指识别DNA是模块性的;每个指主要与靶中的三个连续碱基对接触,并由多肽中的少数关键残基介导识别。通过在靶向性核酸内切酶中包含多个锌指DNA结合结构域,靶向性核酸内切酶的DNA结合特异性可以被进一步提高(因此,由其赋予的任何基因调节效应的特异性也被提高)。见例如Urnov et al.(2005)Nature 435:646-51。因此,可以工程构建并使用一个或多个锌指DNA结合多肽,使得引入到宿主细胞中的靶向性核酸内切酶与宿主细胞基因组内独特的DNA序列相互作用。
优选地,锌指蛋白是非天然存在的,即其是被工程构建为结合所选的靶位点的。参见,例如Beerli et al.(2002)Nature Biotechnol.20:135-141;Pabo et al.(2001)Ann.Rev.Biochem.70:313-340;Isalan et al.(2001)Nature Biotechnol.19:656-660;Segal et al.(2001)Curr.Opin.Biotechnol.12:632-637;Choo et al.(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利Nos.6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;和美国专利公开Nos.2005/0064474;2007/0218528;2005/0267061,本文引用其全部内容作为参考。
与天然存在的锌指蛋白相比,工程化的锌指结合结构域可以具有新的结合特异性。工程化方法包括,但不仅限于,合理设计和各种类型的选择。合理设计包括,例如,使用包含三链体(或四链体)核苷酸序列和单个锌指氨基酸序列的数据库,其中每个三链体或四链体核苷酸序列与结合该特定三链体或四链体序列的一个或多个锌指氨基酸序列相关。参见,例如共同拥有的美国专利6,453,242和6,534,261,本文引用其全部内容作为参考。
示例性选择方法,包括噬菌体展示和双杂交系统,在下列文献中被公开:美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237。此外,例如,在共同拥有的WO 02/077227中描述了增强锌指结合结构域的结合特异性。
此外,如这些和其他参考文献所公开的,锌指结构域和/或多指(multi-fingered)锌指蛋白可以使用任何合适的接头序列,包括例如,长度为5个或更多个氨基酸的接头,连接在一起。示例性的长度为6个或更多个氨基酸的接头序列可另见美国专利Nos.6,479,626;6,903,185;和7,153,949。本文所述的蛋白质可以包含该蛋白的各个锌指之间的合适接头的任意组合。
靶位点的选择;ZFP和用于设计和构建融合蛋白(和编码它们的多核苷酸)的方法是本领域技术人员已知的,并且在下列文献中有详述:美国专利Nos.6,140,0815;789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;WO 95/19431;WO96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
此外,如这些和其他参考文献所公开的,锌指结构域和/或多指锌指蛋白可以使用任何合适的接头序列,包括例如长度为5个或更多个氨基酸的接头,连接在一起。关于长度为6个或更多个氨基酸的示例性接头序列可另见美国专利Nos.6,479,626;6,903,185;和7,153,949。本文所述的蛋白质可以包含该蛋白的各个锌指之间的合适接头的任意组合。
在一些实例中,DNA结合多肽是来自GAL4的DNA结合结构域。GAL4是酿酒酵母中的模块性反式激活因子,但它也可以在许多其他生物体中充当反式激活因子。参见,例如Sadowski et al.(1988)Nature 335:563-4。在这种调节系统中,编码酿酒酵母半乳糖代谢通路中的酶的基因的表达受到可得的碳源的严格调节。Johnston(1987)Microbiol.Rev.51:458-76。这些代谢酶的转录控制由正调节蛋白GAL4和GAL4特异性结合的17bp对称DNA序列(UAS)之间的相互作用介导。
天然的GAL4包括881个氨基酸残基,分子量为99kDa。GAL4包括功能性的自主结构域,它们的总活性是GAL4的体内活性的原因。Ma and Ptashne(1987)Cell 48:847-53);Brent and Ptashne(1985)Cell 43(3Pt 2):729-36。GAL4的N端65个氨基酸包括GAL4DNA结合结构域。Keegan et al.(1986)Science 231:699-704;Johnston(1987)Nature 328:353-5。序列特异性结合要求与DNA结合结构域中的6个Cys残基配位的二价阳离子的存在。含有配位阳离子的结构域通过与DNA螺旋的大沟直接接触与17bp UAS每端的保守CCG三链体相互作用并识别。Marmorstein et al.(1992)Nature 356:408-14。该蛋白的DNA结合功能使得C端转录激活结构域定位于启动子附近,从而使该激活结构域能够指导转录。
其他在某些实施方案中可以使用的DNA结合多肽包括,例如但不仅限于,来自AVRBS3可诱导基因的结合序列;来自AVRBS3可诱导基因或从其工程化的合成结合序列的共有结合序列(例如UPA DNA结合结构域);TAL;LexA蛋白(见,例如,Brent&Ptashne(1985),同上);LacR(见,例如,Labow et al.(1990)Mol.Cell.Biol.10:3343-56;Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88(12):5072-6);类固醇激素受体(Elllistonet al.(1990)J.Biol.Chem.265:11517-121);Tet抑制子(美国专利6271341)和突变的Tet抑制子,其在四环素(Tc)存在下可结合tet操纵基因序列,但在没有四环素(Tc)时则不结合;NF-κB的DNA结合结构域;和Wang et al.(1994)Proc.Natl.Acad.Sci.USA 91(17):8180-4中描述的调节系统的组分,其利用GAL4、激素受体以及VP16的融合物。
在某些实施方案中,在本文所述的方法和组合物中使用的一种或多种核酸酶的DNA结合结构域包括天然存在的或工程化的(非天然存在)TAL效应物DNA结合结构域。参见,例如,美国专利公开号20110301073,本文引用其全部内容作为参考。黄单胞菌属(Xanthomonas)的植物病原细菌已知会在重要的作用植物中导致多种疾病。黄单胞菌的致病性取决于一个保守的III型分泌(T3S)系统,该系统向植物细胞内注入超过25种不同的效应物蛋白。这些注入的蛋白质包括转录激活因子样(TAL)效应物,其模拟植物转录激活因子并操纵植物转录组(见Kay et al(2007)Science 318:648-651)。这些蛋白质包含DNA结合结构域和转录激活结构域。其中一种最良好表征的TAL效应物是来自野油菜黄单胞菌叶斑致病亚型(Xanthomonas campestgris pv.Vesicatoria)的AvrBs3(见Bonas et al(1989)Mol Gen Genet 218:127-136和WO2010079430)。TAL效应物含有一个由串联重复构成的集中(centralized)结构域,每个重复含有大约34个氨基酸,其对于这些蛋白质的DNA结合特异性是关键的。此外,它们含有核定位序列和酸性转录激活结构域(综述见Schornack S,etal(2006)J Plant Physiol 163(3):256-272)。此外,在植物病原细菌青枯雷尔氏菌(Ralstonia solanacearum)中,两个被命名为brg11和hpx17的基因被发现与青枯雷尔氏菌生物型1菌株GMI1000和生物型4菌株RS1000中的黄单胞菌AvrBs3家族同源(见Heuer et al(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因的核苷酸序列彼此具有98.9%相同,差异在于在hpx17的重复结构域中有一个1,575bp的缺失。然而,这两种基因产物与黄单胞菌AvrBs3家族蛋白的序列同一性小于40%。见例如美国专利Nos.,8,420,782和8,440,431和美国专利公开No.20110301073。
在其他实施方案中,核酸酶包括CRISPR/Cas系统。CRISPR(成簇的、规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeats))基因座编码系统的RNA组件,和cas(CRISPR-相关)基因座,其编码蛋白质(Jansen et al.,2002.Mol.Microbiol.43:1565-1575;Makarova et al.,2002.Nucleic Acids Res.30:482-496;Makarova et al.,2006.Biol.Direct 1:7;Haft et al.,2005.PLoSComput.Biol.1:e60),构成CRISPR/Cas核酸酶系统的基因序列。微生物宿主中的CRISPR基因座含有CRISPR-相关(Cas)基因以及能够编程CRISPR介导的核酸切割特异性的非编码RNA分子元件的组合。
II型CRISPR是最良好表征的系统之一,并以四个顺序的步骤实施靶向DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA,前-crRNA阵列和tracrRNA。第二,tracrRNA与前-crRNA的重复区域杂交,并且介导将前-crRNA加工成含有单独间隔序列的成熟crRNAs。第三,成熟的crRNA:tracrRNA复合体指导Cas9靶向DNA,其中靶向DNA通过crRNA上的间隔子与靶DNA上紧邻前间隔子邻近基序(PAM)的原间隔子(protospacer)之间的Wastson-Crick碱基配对来实现,这是靶向识别的额外要求。最后,Cas9介导靶DNA的剪切,从而在前间隔子内产生双链断裂。CRISPR/Cas系统的活性包括三个步骤:(i)外源DNA序列插入到CRISPR阵列中,以防止将来的攻击,这个过程称作“适应”,(ii)相关蛋白质的表达,以及阵列的表达和加工,随后是(iii)对外来核酸的RNA介导的干扰。这样,在细菌细胞中,多个所谓的‘Cas’蛋白质参与CRISPR/Cas系统的天然功能,并在功能中发挥作用,例如外源DNA的插入等。
在某些实施方案中,Cas蛋白质可以是天然存在的Cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”是指具有与天然序列多肽共同的定性生物学性质的化合物。“功能性衍生物”包括,但不仅限于,天然序列的片段,以及天然序列多肽及其片段的衍生物,只要它们具有与相应的天然序列多肽一样的生物学活性即可。本文构想的生物学活性是功能衍生物将DNA底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变异体、共价修饰、及其融合体。Cas多肽或其片段的合适衍生物包括,但不仅限于:Cas多肽或其片段的突变体、融合体、共价修饰。Cas蛋白,包括Cas蛋白质或其片段,以及Cas蛋白或其片段的衍生物,可以从细胞获得或者化学合成或者通过这两种方法的组合获得。细胞可以是天然产生Cas蛋白的细胞,或者天然产生Cas蛋白并被遗传工程化从而以更高的表达水平产生内源Cas蛋白的细胞,或者天然产生Cas蛋白并被遗传工程化从而从外源引入的核酸产生Cas蛋白的细胞,其中该核酸编码与内源Cas相同或不同的Cas。在一些情况下,细胞不天然产生Cas蛋白,并且被遗传工程化从而产生Cas蛋白。
在特定的实施方案中,DNA结合多肽特异性识别并结合包含在宿主生物体基因组核酸内的靶核苷酸序列。在一些实例中,在宿主基因组中可以发现靶核苷酸序列的任何数量的离散实例。靶核苷酸序列在生物体的基因组中可以是罕见的(例如,在基因组中可能存在靶序列的小于约10,约9,约8,约7,约6,约5,约4,约3,约2,或约1个拷贝)。例如,靶核苷酸序列可以位于生物体基因组内的独特的位点。各靶核苷酸序列可以,例如但不仅限于,相对于彼此随机分散在整个基因组中;位于基因组的不同连锁群中;位于相同连锁群中;位于不同染色体上;位于相同染色体上;位于基因组中在生物体的相似条件下表达(例如,在同一种,或者在功能上基本上相同的调节因子的控制之下)的位点处;和位于在基因组中彼此紧邻的位置(例如,靶序列可以包含在作为串联体被整合到基因座中的核酸内)。
B.靶向核酸内切酶
在特定的实施方案中,特异性识别并结合靶核苷酸序列的DNA结合多肽可以包含在嵌合多肽中,从而赋予嵌合多肽对靶序列的特异性结合。在实例中,这样的嵌合多肽可以包括,例如但不仅限于,核酸酶,重组酶,和/或连接酶多肽,这些多肽如上文所述。包含DNA结合多肽与核酸酶,重组酶,和/或连接酶多肽的嵌合多肽还可以包括其它的功能性多肽基序和/或结构域,例如但不仅限于:位于嵌合蛋白中的功能性多肽之间的间隔子序列;前导肽;将融合蛋白导向到细胞器(例如,细胞核)的肽;被细胞酶剪切的多肽;肽标签(例如Myc,His等);和其它不干扰嵌合多肽功能的氨基酸序列。
嵌合多肽中的功能多肽(例如,DNA结合多肽和核酸酶多肽)可以是可操作地连接的。在一些实施方案中,嵌合多肽的各个功能多肽可以通过从这样的单个多核苷酸表达而可操作地连接,该多核苷酸至少编码彼此对框连接的各功能多肽,从而产生编码嵌合蛋白的嵌合基因。在替代实施方案中,嵌合多肽的各个功能多肽可以通过其它方式可操作地连接,例如通过各个独立表达的多肽的交联。
在一些实施方案中,特异性识别并结合靶核苷酸序列的DNA结合多肽可以包含在天然的分离的蛋白质(或其突变体)中,其中天然的分离的蛋白质或其突变体还包括核酸酶多肽(并且还可以包括重组酶和/或连接酶多肽)。这样的分离的蛋白质的实例包括TALEN,重组酶(例如,Cre,Hin,Tre,和FLP重组酶),RNA指导的CRISPR-Cas9,和大范围核酸酶。
如本文所使用的,术语“靶向核酸内切酶”(targeting endonuclease)是指包含DNA结合多肽与核酸酶多肽的分离的天然或工程化蛋白质及其突变体,以及包含DNA结合多肽与核酸酶多肽的嵌合多肽。任何包含特异性识别并结合FAD2基因座内包含的靶核苷酸序列(例如,或者是因为该靶序列包含在该基因座处的天然序列中,或者是因为该靶序列被引入到该基因座中,例如,通过重组)的DNA结合多肽的靶向核酸内切酶均可以在某些实施方案中使用。
可以在本发明的特定实施方案中使用的嵌合多肽的一些实例包括,但不仅限于,下述多肽的组合:锌指DNA结合多肽;FokⅠ核酸酶多肽;TALE结构域;亮氨酸拉链;转录因子的DNA结合基序;以及从例如但不仅限于下述各项分离的DNA识别和/或剪切结构域:TALEN,重组酶(例如,Cre,Hin,RecA,Tre,和FLP重组酶),RNA指导的CRISPR-Cas9,大范围核酸酶;和其他本领域技术人员已知者。具体的实例包括嵌合蛋白,其包含位点特异性DNA结合多肽和核酸酶多肽。嵌合多肽可以通过本领域技术人员已知的方法进行工程化,从而改变该嵌合多肽内包含的DNA结合多肽的识别序列,以便将该嵌合多肽靶向到感兴趣的特定核苷酸序列。
在某些实施方案中,嵌合多肽包含DNA结合结构域(例如,锌指,TAL-效应物结构域,等)和核酸酶(剪切)结构域。剪切结构域可以是相对DNA结合结构域为异源的,例如锌指DNA结合结构域与来自核酸酶的剪切结构域,或者TALEN DNA结合结构域与剪切结构域,或者大范围核酸酶DNA结合结构域与来自不同核酸酶的剪切结构域。异源的剪切结构域可以从任何核酸内切酶或核酸外切酶获得。可以衍生该剪切结构域的示例性核酸内切酶包括,但不仅限于,限制性核酸内切酶和归巢核酸内切酶。参见,例如,2002-2003年目录,NewEngland Biolabs,Beverly,MA;和Belfort et al.(1997)Nucleic Acids Res.25:3379-3388。其他可切割DNA的酶是已知的(例如,S1核酸;绿豆核酸酶;胰DNA酶I;微球菌核酸酶;酵母HO核酸内切酶;另见Linn等人(编辑)Nucleases,Cold Spring Harbor LaboratoryPress,1993)。这些酶(或其功能片段)中的一种或多种可以用作剪切结构域和剪切半结构域的来源。
类似地,剪切半结构域可以从如上所述的任何其剪切活性需要二聚体化的核酸酶或其部分产生。一般地,如果融合蛋白包含剪切半结构域,则需要两个融合蛋白用于剪切。或者,可以使用包含两个剪切半结构域的单一蛋白。两个剪切半结构域可以来自同一核酸内切酶(或其功能片段),或者每个剪切半结构域可以来自不同的核酸内切酶(或其功能片段)。此外,两个融合蛋白的靶位点优选地相对彼此如下布置,使得两个融合蛋白与其各自靶位点的结合将剪切半结构域彼此置于一定的空间取向,该空间取向允许剪切半结构域形成功能性的剪切结构域(例如通过二聚体化)。因此,在某些实施方案中,靶位点的邻近边缘被5-8个核苷酸或者15-18个核苷酸所分开。然而,在两个靶位点之间可以介入任意整数的核苷酸或核苷酸对(例如,2-50个核苷酸对或者更多)。一般地,剪切位点位于靶位点之间。
限制性核酸内切酶(限制酶)存在于许多物种中,并且能够序列特异性结合DNA(在识别位点处),并在结合位点处或其附近剪切DNA,从而例如使一个或多个外源序列(供体/转基因)被整合在该结合(靶)位点处或其附近。某些限制酶(例如,IIS型)在远离识别位点的地方剪切DNA,并具有可分开的结合和剪切结构域。例如,IIS型酶FokⅠ催化DNA的双链剪切,剪切位点在一条链上位于距其识别点位点达9个核苷酸处,而在另一条链上位于距其识别位点13个核苷酸处。参见,例如,美国专利5,356,802;5,436,150和5,487,994;以及Li etal.(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li et al.(1993)Proc.Natl.Acad.Sci USA90:2764-2768;Kim et al.(1994a)Proc.Natl.Acad.Sci.USA91:883-887;Kim et al.(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一个实施方案中,融合蛋白包括来自至少一种IIS型限制酶的剪切结构域(或剪切半结构域)和一个或多个锌指结合结构域,其可以是或者不是被工程化的。
具有可以分开的剪切结构域与结合结构域的示例性IIS型限制酶是Fok I。这种酶作为二聚体发挥作用。Bitinaite et al.(1998)Proc.Natl.Acad.Sci.USA95:10,570-10,575。因此,为本公开的目的,在被公开的融合蛋白中使用的Fok I酶的部分视为剪切半结构域。因此,对于使用锌指-Fok I融合物的细胞序列的靶向双链剪切和/或靶向替换,可以使用两个融合蛋白,每一个融合蛋白都包含Fok I剪切半结构域,来重建具有催化活性的剪切结构域。或者,也可以使用含有DNA结合结构域和两个Fok I剪切半结构域的单一多肽分子。
剪切结构域或剪切半结构域可以是蛋白质的保留剪切活性、或者保留多聚体化形成功能性剪切结构域的能力的任何部分。
IIS型限制酶的实例在美国专利公开No.20070134796中有描述,本文引用其全部内容作为参考。额外的限制酶也还有可分开的结合和剪切结构域,并且是本公开所构想的。参见,例如,Roberts et al.(2003)Nucleic Acids Res.31:418-420。
在某些实施方案中,剪切结构域包括一个或多个工程化的剪切半结构域(也称作二聚体化结构域突变体),其最小化或阻止同二聚体化(homodimerization),如例如美国专利公开Nos.20050064474;20060188987和20080131962所述,本文引用其全部内容作为参考。位于Fok I位置446,447,479,483,484,486,487,490,491,496,498,499,500,531,534,537,和538的氨基酸残基均是供用于影响Fok I剪切半结构域二聚体化的靶点。
可形成专性异二聚体的Fok I的示例性工程化剪切半结构域包括这样的一对,其中第一剪切半结构域在Fok I的位置490和538的氨基酸残基处包括突变,第二剪切半结构域在氨基酸残基486和499处包括突变。
因此,在一个实施方案中,490处的突变用Lys(K)代替Glu(E);538处的突变用Lys(K)代替Iso(I);486处的突变用Glu(E)代替Gln(Q);499处的突变用Lys(K)代替Iso(I)。具体地,本文所述的工程化剪切半结构域是通过使一个剪切半结构域中的位置490(E→K)和538(I→K)突变产生命名为“E490K:I538K”的工程化剪切半结构域,并将另一个剪切半结构域中的位置486(Q→E)和499(I→L)突变产生命名为“Q486E:I499L”的工程化剪切半结构域而制备的。本文所述的工程化剪切半结构域是专性异源二聚体突变体,其中异常的剪切被最小化或消除。参见,例如美国专利公开号No.2008/0131962,本文出于所有目的引用其全部公开内容作为参考。
在某些实施方案中,工程化的剪切半结构域包括位置486、499和496处的突变(相对于野生型Fok I编号),例如用Glu(E)残基代替位置486处的野生型Gln(Q)残基的突变,用Leu(L)残基代替位置499处的野生型残基Iso(I)的突变,用Asp(D)或Glu(E)残基代替位置496处的野生型Asn(N)残基的突变(亦分别称作“ELD”和“ELE”结构域)。在其他实施方案中,工程化的剪切半结构域包括位置490、538和537处的突变(相对于野生型Fok I编号),例如用Lys(K)残基代替位置490处的野生型Glu(E)残基的突变,用Lys(K)残基代替位置538处的野生型Iso(I)残基的突变,用Lys(K)或Arg(R)残基代替位置537处的野生型His(H)残基的突变(亦分别被称作“KKK”和“KKR”结构域)。在其他实施方案中,工程化的剪切半结构域包括位置490和537处的突变(相对于野生型Fok I编号),例如用Lys(K)残基代替位置490处的野生型Glu(E)残基的突变,用Lys(K)或Arg(R)残基代替位置537处的野生型His(H)残基的突变(亦分别被称作“KIK”和“KIR”结构域)。(参见美国专利公开No.20110201055)。本文所述的工程化剪切半结构域可以使用任何合适的方法制备,例如通过野生型剪切半结构域(Fok I)的定点诱变,如美国专利公开Nos.20050064474;20080131962;和20110201055所述。
或者,可以使用所谓的“分割(split)-酶”技术(参见,例如美国专利公开No.20090068164)在核酸靶位点处体内组装核酸酶。这样的分割酶的组分或者可以在各别的表达构建体上表达,或者可以将它们连接在一个开放阅读框中,其中各个组件被分隔开,例如,被自剪切性2A肽或IRES序列分隔开。组件可以是单独的锌指结合结构域,或者是大范围核酸酶的核酸结合结构域的结构域。
C.锌指核酸酶
在具体的实施方案中,嵌合多肽是定制设计的锌指核酸酶(ZFN),其可以被设计成递送靶位点特异性的双链DNA断裂,该断裂中可以整合外源核酸或供体DNA(见共同拥有的美国专利公开20100257638,本文引用其内容作为参考)。ZFN是嵌合多肽,其包含来自限制性核酸内切酶(例如FokⅠ)的非特异性剪切结构域,和锌指DNA结合结构域多肽。见,例如Huang et al.(1996)J.Protein Chem.15:481-9;Kim et al.(1997a)Proc.Natl.Acad.Sci.USA 94:3616-20;Kim et al.(1996)Proc.Natl.Acad.Sci.USA 93:1156-60;Kim et al.(1994)Proc Natl.Acad.Sci.USA 91:883-7;Kim et al.(1997b)Proc.Natl.Acad.Sci.USA94:12875-9;Kim et al.(1997c)Gene 203:43-9;Kim et al.(1998)Biol.Chem.379:489-95;Nahon and Raveh(1998)Nucleic Acids Res.26:1233-9;Smith et al.(1999)Nucleic Acids Res.27:674-81。在一些实施方案中,ZFN包括非规范的锌指DNA结合结构域(参见共同拥有的美国专利公开20080182332,本文引用其内容作为参考)。FokⅠ限制性内切酶必须通过核酸酶结构域二聚体化,以便切割DNA和引入双链断裂。因此,含有来自这类核酸内切酶的核酸酶结构域的ZFN也需要核酸酶结构域的二聚体化,以便切割靶DNA。Mani et al.(2005)Biochem.Biophys.Res.Commun.334:1191-7;Smith etal.(2000)Nucleic Acids Res.28:3361-9。ZFN的二聚体化可以被两个相邻的、方向相反的DNA结合位点所易化。同上。
ZFN系统的灵活性和特异性提供了先前通过已知的重组酶介导基因编辑策略所不能实现的控制水平。作为一个实例,ZFN可以容易地工程化,以便,例如,识别特定的核酸序列。Wu et al.(2007)Cell.Mol.Life Sci.64:2933-44。(见,美国专利公开20090205083,20110189775,20110167521和20100199389,本文引用其全部内容作为参考)。对锌指识别残基的密码子的随机化有助于选择对任意选定的DNA序列具有高亲和性的新的指。而且,锌指是天然的DNA结合分子,并且已经显示工程化的锌指可在活细胞中对其设计的靶具有作用。因此,基于锌指的核酸酶可以靶向到特定的而非任意的识别位点。
在特定的实例中,用于将外源核酸位点特异性地整合到宿主的至少一个FAD2性能基因座中的方法包括将ZFN引入到宿主的细胞中,其中该ZFN识别并结合靶核苷酸序列,其中该靶核苷酸序列包含在宿主至少一个FAD2基因座内。在某些实例中,靶核苷酸序列并非包含在宿主基因组除所述至少一个FAD2基因座之外的任何其他位置处。例如,ZFN的DNA结合多肽可以被工程化以识别并结合在所述至少一个FAD2基因座内被鉴定(例如通过测序FAD2基因座)的靶核苷酸序列。对于包括将ZFN引入到宿主细胞中、用于位点特异性地将外源核酸整合到宿主的至少一个FAD2性能基因座中的方法,其还可以包括将外源核酸引入到细胞内,其中ZFN对靶序列的位点特异性识别和结合(和随后对包含FAD2基因座的核酸的剪切)使得该外源核酸更容易重组到宿主的包含所述至少一个FAD2基因座的核酸之中。
V.用于整合在FAD2基因座处的外源核酸
本发明的实施方案可以包括一个或多个选自下组的核酸:用于位点特异性整合在至少一个FAD2基因座处的外源核酸,例如但不仅限于,PTU,ELP,ETIP或ORF;包含编码靶向核酸内切酶的核苷酸序列的核酸;和包含前述的至少一者或两者的载体。因此,用于一些实施方案的特定核酸包括编码多肽的核苷酸序列,结构核苷酸序列,和/或DNA结合多肽识别与结合位点。
A.用于位点特异性整合的外源核酸分子
如上文指出的,提供了外源序列(也称作“供体序列”或“供体”或“转基因”)的整合,用于例如表达多肽,修正突变基因,或用于增加野生型基因的表达。可以显见,供体序列通常与其被置于的基因组序列不相同。供体序列可以包含非同源序列,其侧翼是两个具有同源性的区域,用于在感兴趣的位置处实现高效的HDR。此外,供体序列可以包括载体分子,其含有与细胞染色质中感兴趣的区域不同源的序列。供体分子可以包含多个不连续的与细胞染色质具有同源性的区域。例如,为了靶向整合通常不存在于感兴趣区域内的序列,所述序列可以存在于供体核酸分子中,并且被与感兴趣区域内的序列具有同源性的序列所侧翼。
供体多核苷酸可以是DNA或RNA,单链或双链的,并且可以以线性或环形形式引入到细胞内。见例如,美国专利公开Nos.20100047805,20110281361,20110207221和美国专利申请No.13/889,162。如果以线性形式引入,则供体序列的末端可以通过本领域技术人员已知的方法被保护(例如,保护免于核酸外切酶降解)。例如,将一个或更多个双脱氧核苷酸残基添加到线性分子的3'端和/或将自互补的寡核苷酸与一个或两个末端连接。参见,例如,Chang et al.(1987)Proc.Natl.Acad.Sci.USA84:4959-4963;Nehls et al.(1996)Science272:886-889。其它用于保护外源多核苷酸免于降解的方法包括,但不仅限于,添加末端氨基和使用经过修饰的核苷酸间连接键,例如硫代磷酸酯,氨基磷酸酯和O-甲基核糖或脱氧核糖残基。
多核苷酸可以作为具有额外序列(例如复制起点、启动子和编码抗生素抗性的基因)的载体的一部分被引入到细胞内。而且,供体多核苷酸可以作为裸核酸,作为与脂质体或泊洛沙姆等作用剂复合的核酸被引入,或者可以通过病毒(例如,腺病毒,腺伴随病毒,疱疹病毒,逆转录病毒,慢病毒和整合缺陷的慢病毒(IDLV))被递送。
供体一般被整合,使得其表达被整合位点处的内源启动子,即驱动整合了该供体的内源基因(例如FAD3)的表达的启动子所驱动。然而,容易想到的是,供体可以包含启动子和/或增强子,例如组成型启动子,或可诱导的或组织特异性的启动子。
而且,尽管不是表达必需的,但是外源序列还可以包含转录或转录调节序列,例如启动子、增强子、绝缘子(insulators)、内部核糖体进入位点、编码2A肽和/或多腺苷酸化信号的序列。
可以在实施方案中位点特异性方式整合到至少一个FAD2基因座中从而修饰该FAD2基因座的外源核酸包括,例如但不仅限于,包含编码感兴趣多肽的核苷酸序列的核酸;包含农艺学基因的核酸;包含编码RNAi分子的核苷酸序列的核酸;或破坏FAD2基因的核酸。
在一些实施方案中,外源核酸被整合在FAD2基因座处,以便修饰该FAD2基因座,其中该核酸包括农艺学基因或编码感兴趣多肽的核苷酸序列,使得该农艺学基因或核苷酸序列在宿主中从该FAD2基因座表达。在一些实例中,感兴趣的多肽(例如,外来蛋白质)以商业量从编码该感兴趣多肽的核苷酸序列表达。在这样的实例中,感兴趣的多肽可以从宿主细胞、组织或生物量提取。在一些实施方案中,宿主是植物,并且被提供用于商业生产感兴趣多肽的植物材料可以是植物,植物部分,植物组织或植物细胞。在一些实例中,该植物部分可以是植物种子。从植物生物量提取蛋白质可以通过已知的方法实现,其在例如Heney andOrr(1981)Anal.Biochem.114:92-6中有讨论。
类似地,农艺学基因可以在被转化的植物细胞、植物和/或其后代中表达。例如,植物可以通过特定实施方案的方法被遗传工程化,从而从至少一个FAD2基因座表达各种感兴趣的农艺学表型。
在一些实施方案中,包含农艺学基因或编码感兴趣多肽的核苷酸序列的核酸可以包括,例如但不仅限于:赋予对害虫或疾病的抗性的基因(见例如,Jones et al.(1994)Science 266:789(用于抵抗叶霉病菌的番茄Cf-9基因的克隆);Martin et al.(1993)Science 262:1432;Mindrinos et al.(1994)Cell 78:1089(用于丁香假单胞菌抗性的RSP2基因);PCT国际专利公开No.WO 96/30517(对大豆胞囊线虫的抗性);PCT国际专利公开No.WO 93/19181);编码苏云金芽孢杆菌蛋白的基因、其衍生物、或以其为模型的合成多肽(见例如Geiser et al.(1986)Gene 48:109(Btδ-内毒素基因的克隆和核苷酸序列;而且编码δ-内毒素基因的DNA分子可以从美国典型培养物保藏中心(Manassas,VA)以例如ATCC登录号Nos.40098;67136;31995;和31998购买));编码凝集素的基因(见例如Van Damme etal.(1994)Plant Molec.Biol.24:25(多种君子兰甘露糖结合凝集素基因的核苷酸序列);编码维生素结合蛋白的基因,例如链霉亲和素(见PCR国际专利公开No.US93/06487(使用链霉亲和素和链霉亲和素同系物作为针对昆虫害虫的杀幼虫剂));编码酶抑制剂,例如蛋白酶(protease,proteinase)抑制剂、或淀粉酶抑制剂,的基因(见例如Abe et al.(1987)J.Biol.Chem.262:16793(水稻半胱氨酸蛋白酶抑制剂的核苷酸序列);Huub et al.(1993)Plant Molec.Biol.21:985(编码番茄蛋白酶抑制剂I的cDNA的核苷酸序列);Sumitani etal.(1993)Biosci.Biotech.Biochem.57:1243(硝孢链霉菌(Streptomyces nitrosporeus)α-淀粉酶抑制剂的核苷酸序列)和美国专利5,494,813);编码昆虫特异性激素或信息素(pheromone)的基因,例如蜕皮激素或保幼激素,其变异体,基于它的模拟物,或其拮抗剂或激动剂(见例如Hammock et al.(1990)Nature 344:458(杆状病毒表达克隆的保幼激素酯酶,一种保幼激素去活剂);编码在表达时会破坏受影响害虫的生理的昆虫特异性肽或神经肽的基因(见例如Regan(1994)J.Biol.Chem.269:9(表达克隆产生编码昆虫利尿激素受体的DNA);Pratt et al.(1989)Biochem.Biophys.Res.Comm.163:1243(太平洋折翅蠊(Diploptera puntata)中的咽侧体抑制素(allostatin));和美国专利5,266,317(编码昆虫特异性瘫痪神经毒素的基因);天然由蛇、黄蜂或其他生物产生的编码昆虫特异性毒液的基因(见例如Pang et al.(1992)Gene 116:165(在植物中异源表达编码蝎子昆虫毒性肽的基因));编码负责单萜、倍半萜烯、类固醇、羟肟酸、苯丙衍生物(phenylproanoidderivative)或其它具有杀虫活性的分子的超积累的酶的基因;编码参与生物活性分子(例如糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶或葡聚糖酶)的修饰(包括翻译后修饰)的酶的基因,无论是天然的还是合成的(见,例如PCT国际专利公开No.WO 93/02197(callase基因的核苷酸序列);而且,含有几丁质酶编码序列的DNA分子可以从例如ATCC按照登录号39637和67152获得;Kramer et al.(1993)Insect Biochem.Molec.Biol.23:691(编码烟草天蛾几丁质酶的cDNA的核苷酸序列);和Kawalleck et al.(1993)Plant Molec.Biol.21:673(欧芹ubi4-2多聚泛素基因的核苷酸序列));编码刺激信号转导的分子的基因(见,例如Botella et al.(1994)Plant Molec.Biol.24:757(绿豆钙调蛋白cDNA克隆的核苷酸序列);和Griess et al.(1994)Plant Physiol.104:1467(玉米钙调蛋白cDNA克隆的核苷酸序列));编码疏水性moment肽的基因(见例如PCT国际专利公开No.WO 95/16776(抑制真菌植物病原体的鲎素(Tachyplesin)的肽衍生物);和PCT国际专利公开No.WO 95/18855(赋予疾病抗性的合成抗微生物肽));编码膜通透酶、通道构成物(former)或通道阻断剂的基因(见例如Jaynes et al.(1993)Plant Sci 89:43(异源表达天蚕杀菌肽(cecropin)-β裂解肽类似物,赋予转基因烟草植物对青枯假单胞菌的抗性));编码病毒侵入蛋白或从其衍生的复合体毒素的基因(见例如Beachy et al.(1990)Ann.rev.Phytopathol.28:451);编码昆虫特异性抗体或从其衍生的免疫毒素的基因(见例如,Taylor et al.,Abstract#497,Seventh Int'l Symposium on Molecular Plant-Microbe Interactions(Edinburgh,Scotland)(1994)(通过产生单链抗体片段在转基因烟草中的酶去活));编码病毒特异性抗体的基因(见例如Tavladoraki et al.(1993)Nature 366:469(表达重组抗体基因的转基因植物被保护免于病毒攻击));编码由病原体或寄生虫自然产生的发育阻断蛋白的基因(见例如,Lamb et al.(1992)Bio/Technology 10:1436(真菌内切α-1,4-D-多聚半乳糖醛酸酶通过溶解植物细胞壁均聚-α-1,4-D-半乳糖醛酸而易化真菌定植(colonization)和植物营养素释放);Toubart et al.(1992)Plant J.2:367(克隆和表征编码豆类内切多聚半乳糖醛酸酶抑制蛋白的基因);编码自然界中由植物产生的发育阻断蛋白的基因(见例如Logemann et al.(1992)Bio/Technology 10:305(表达大麦核糖体失活基因的转基因植物具有更高的针对真菌疾病的抗性))。
在一些实施方案中,包含农艺学基因或编码感兴趣多肽的核苷酸序列的核酸还可以和/或可选择地包括,例如但不仅限于:赋予对除草剂(例如抑制生长点或分生组织的除草剂,例如咪唑啉酮或磺酰脲)的抗性的基因(这类示例性基因编码突变的ALS和AHAS酶,例如分别如Lee et al.(1988)EMBO J.7:1241,和Miki et al.(1990)Theor.Appl.Genet.80:449所述);草甘膦抗性,如由例如突变的5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSP)所赋予的(通过引入重组核酸和/或天然EPSP基因(包括但不仅限于CP4,DMMG,和DGT-28)的各种形式的体内突变)、aroA基因、和草甘膦乙酰转移酶(GAT)基因);其它膦化合物,例如来自链霉属物种,包括吸水链霉菌和Streptomyces viridichromogenes的草铵膦膦丝菌素乙酰转移酶(PAT)基因;和吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。见例如,美国专利4940835和6248876(能够赋予植物草甘膦抗性的各种形式EPSP的核苷酸序列)。编码突变体aroA基因的DNA分子能够根据ATCC登录号39256获得。另见美国专利No.4,769,061(突变体aroA基因的核苷酸序列)。欧洲专利申请No.0 333 033和美国专利No.4,975,374公开了谷氨酰胺合成酶基因的核苷酸序列,其可以赋予对除草剂例如L-膦丝菌素的抗性。示例性PAT基因的核苷酸序列在欧洲专利申请No.0 242 246,和DeGreef et al.(1989)Bio/Technology 7:61(产生表达编码PAT活性的嵌合bar基因的转基因植物)中提供。赋予对苯氧基丙酸和环己酮(例如稀禾定和盖草)的抗性的示例性基因包括ACC1-S1,ACC1-S2和ACC1-S3基因,如Marshall et al.(1992)Theor.Appl.Genet.83:435所述。能够赋予草甘膦抗性的GAT基因在例如WO 2005012515中被描述。赋予对2,4-D、苯氧基丙酸和吡啶氧基生长素除草剂抗性的基因在例如WO 2005107437和WO 2007053482中被描述。
包含农艺学基因或编码感兴趣多肽的核苷酸序列的核酸还可以包括,例如但不仅限于:赋予对抑制光合作用的除草剂的抗性的基因,例如三嗪(psbA和gs+基因)或苄腈(腈水解酶基因)。见例如Przibila et al.(1991)Plant Cell 3:169(用编码突变体psbA基因的质粒转化衣藻)。腈水解酶基因的核苷酸序列在美国专利4,810,648中被公开,含有这些基因的DNA分子可以根据ATCC登录号Nos.53435;67441;和67442获得。另见Hayes et al.(1992)Biochem.J.285:173(克隆和表达编码谷胱甘肽S转移酶的DNA)。
在一些实施方案中,包含农艺学基因或编码感兴趣多肽的核苷酸序列的核酸还可以和/或可选择地包括赋予或者有助于增值性状的基因,增值性状例如但不仅限于:经过修饰的脂肪酸代谢,例如,通过用硬脂酰-ACP去饱和酶的反义基因转化植物以增加植物的硬脂酸含量(见例如Knultzon et al.(1992)Proc.Natl.Acad.Sci.U.S.A.89:2624);减少植酸盐/酯含量,例如,引入植酸酶编码基因可以提高植酸盐/酯的裂解,向被转化植物增加更多的游离磷酸盐(参见,例如,Van Hartingsveldt et al.(1993)Gene 127:87(黑曲霉植酸酶基因的核苷酸序列);可以被引入到玉米中以降低植酸含量的基因,例如,这可以通过克隆然后再次引入与可能负责低植酸水平的玉米突变体特征的单等位基因相关的DNA实现(见Raboy et al.(1990)Maydica 35:383));和经过修饰的碳水化合物组成,其通过例如用编码可以改变淀粉分支模式的酶的基因转化植物来实现(见例如Shiroza et al.(1988)J.Bacteol.170:810(链球菌突变体果糖转移酶基因的核苷酸序列);Steinmetz et al.(1985)Mol.Gen.Genet.20:220(果聚糖蔗糖酶基因);Pen et al.(1992)Bio/Technology10:292(α-淀粉酶);Elliot et al.(1993)Plant Molec.Biol.21:515(西红柿转化酶基因的核苷酸序列);Sogaard et al.(1993)J.Biol.Chem.268:22480(大麦α-淀粉酶基因);和Fisher et al.(1993)Plant Physiol.102:1045(玉米胚乳淀粉分支酶II))。
在一些实施方案中,外源核酸被整合在FAD2基因座处以修饰FAD2基因座,其中该核酸包括PTU或ELP,使得,例如,随后的第二外源核酸易于位点特异性整合在PTU或ELP的位点处。另见美国专利No.13/889,162。
为了通过靶向整合在靶向性核酸内切酶的介导下将感兴趣的核酸分子靶向整合到植物基因组中,需要递送靶向性核酸内切酶或者靶向性核酸内切酶编码核酸分子,随后在宿主内表达功能性的靶向性核酸内切酶蛋白。在靶向性核酸内切酶被递送到宿主细胞中或在宿主细胞中表达时,外源核酸也优选地存在于宿主细胞中,从而使该功能性靶向性核酸内切酶蛋白在至少一个FAD2基因座中的靶位点处诱导双链断裂,这些断裂随后被修复,例如通过同源性驱动的外源核酸整合到基因座中而被修复。本领域的技术人员可以预见,功能性靶向性核酸内切酶蛋白的表达可以通过数种方法实现,包括但不仅限于,编码靶向性核酸内切酶的构建体的基因转移,和编码靶向性核酸内切酶的构建体的瞬时表达。在这两种情况下,均可以同时实现宿主细胞中功能性靶向性核酸内切酶的表达和外源核酸的递送,以便驱动FAD2基因座处的靶向整合。
在利用ZFN作为靶向性核酸内切酶的实施方案中获得的一个特别优势在于,对嵌合锌指核酸酶剪切结构域二聚体化的需要赋予高水平的序列特异性,且因此赋予高水平的剪切特异性。因为每个3个指的组结合9个连续的碱基对,所以如果每个锌指结构域具有完美的特异性,则2个嵌合核酸酶实际上要求一个18bp的靶点。任何给定的这种长度的序列均可预期在单各基因组(推定大约109bp)中是唯一的。Bibikova et al.(2001)Mol.Cell.Biol.21(1):289-97;Wu et al.(2007),前文。而且,额外的指可以提供更高的特异性,Beerli et al.(1998)Proc.Natl.Acad.Sci.USA 95:14628-33;Kim and Pabo(1998)Proc.Natl.Acad.Sci.USA 95:2812-7;Liu et al.(1997)Proc.Natl.Acad.Sci.USA 94:5525-30,因此可以增加每个DNA结合结构域中的锌指数目以提供更高的特异性。例如,通过使用一对可识别24bp序列的4指、5指、6指或更多指的ZFN,可以进一步提高特异性。Urnovet al.(2005)Nature 435:646-51。因此,可以使用ZFN,使得被引入到宿主植物基因组中的识别序列在基因组中是唯一的。
B.包含编码靶向性核酸内切酶的核苷酸序列的核酸分子
在一些实施方案中,编码靶向性核酸内切酶的核苷酸序列可以通过操作(例如连接)编码该靶向性核酸内切酶中包含的多肽的天然核苷酸序列而工程化。例如,可以对编码包含DNA结合多肽的蛋白质的基因的核苷酸序列进行检查,以鉴定对应于该DNA结合多肽的基因的核苷酸序列,并可以使用该核苷酸序列作为编码包含该DNA结合多肽的靶向性核酸内切酶的核苷酸序列的元件。或者,可以利用靶向性核酸内切酶的氨基酸序列来推导编码该靶向性核酸内切酶的核苷酸序列,例如,根据遗传密码的简并性。
在包含编码靶向性核酸内切酶的核苷酸序列的示例性核酸分子中,编码核酸酶多肽的第一多核苷酸序列的最后一个密码子与编码DNA结合多肽的第二多核苷酸序列的第一个密码子可以相隔任意数量的核苷酸三联体,例如不编码内含子或“停止(STOP)”。类似地,编码DNA结合多肽的第一多核苷酸序列的最后一个密码子与编码核酸内切酶的第二多核苷酸序列的第一个密码子可以相隔任意数量的核苷酸三联体。在这些和进一步的实施方案中,编码核酸酶多肽的第一多核苷酸序列与编码DNA结合多肽的第二多核苷酸序列的最后一个(即,核酸序列的最3’)的最后一个密码子可以和与之直接邻接、或者仅相隔短肽序列(例如由合成的核苷酸接头(例如可能已被用于实现融合的核苷酸接头)编码的短肽序列)的其他多核苷酸编码序列的第一个密码子相位对准地(phase-register)融合。其他多核苷酸序列的实例包括,例如但不仅限于,标签、靶向肽、和酶剪切位点。类似地,第一和第二多核苷酸序列的最5’(在核酸序列中)的第一个密码子可以和与之直接邻接、或者仅相隔短肽序列的其他多核苷酸编码序列的最后一个密码子相位对准地融合。
将编码靶向性核酸内切酶中的功能性多肽(例如,DNA结合多肽和核酸酶多肽)的各多核苷酸序列分隔开来的序列可以,例如,包括任何序列,使得所编码的氨基酸序列不太可能显著改变靶向性核酸内切酶的翻译。由于已知的核酸酶多肽和已知的DNA结合多肽的自主性质,在实例中,间插序列不会干扰这些结构的各自功能。
C.载体和表达构建体
在一些实施方案中,可以将包含至少一个编码感兴趣多肽和/或靶向性核酸内切酶的外源多核苷酸序列的至少一个核酸分子引入到细胞、组织、或生物体中,用于在其中表达。例如,可以将包含编码特异性识别至少一个FAD2基因座内包含的核苷酸序列的靶向性核酸内切酶的多核苷酸序列的核酸分子引入到细胞中,使得编码该感兴趣多肽的多核苷酸序列整合到至少一个FAD2基因座中(这可以通过例如被表达的靶向性核酸内切酶在该基因座处引入双链断裂后进行同源重组而实现),并从整合的多核苷酸序列表达该感兴趣的多肽。
在一些实施方案中,核酸分子,例如前述的其中一个,可以是例如载体系统,其包括例如但不仅限于,线性质粒或闭环质粒。在特定的实例中,载体可以是表达载体。根据特定实施方案的核酸序列可以,例如,被整合到载体中,使得该核酸序列与一个或多个调节序列可操作地连接。可以获得许多载体用于这一目的,并且特定载体的选择可能取决于,例如,待插入在载体中的核酸的大小,待用该载体转化的特定宿主细胞,和/或任何编码多肽期望被表达的量。载体通常包含各种组件,它们的身份取决于载体的功能(例如,DNA扩增或DNA表达),和与载体相容的特定宿主细胞。
在一些实施方案中,与一个或多个编码序列可操作地连接的调节序列可以是在宿主细胞中,如在细菌细胞、藻类细胞、真菌细胞或植物细胞中发挥功能的启动子序列,在该细胞中该核酸分子被扩增或表达。一些实施方案可以包括植物转化载体,其包括含有至少一个调节序列的核苷酸序列,该调节序列与一个或多个编码感兴趣多肽或靶向性核酸内切酶的核苷酸序列可操作地连接,其中该一个或多个核苷酸序列可以在该调节序列的控制下在植物细胞、组织或生物体中表达,从而产生感兴趣的多肽或靶向性核酸内切酶。
根据一些实施方案,适用于核酸分子的启动子包括可诱导的、组织特异性的、病毒、合成或组成型启动子,它们都是本领域众所周知的。可用于本发明实施方案的启动子的非限制性实例在下列文献中提供:美国专利Nos.6,437,217(玉米RS81启动子);5,641,876(水稻肌动蛋白启动子);6,426,446(玉米RS324启动子);6,429,362(玉米PR-1启动子);6,232,526(玉米A3启动子);6,177,611(组成型玉米启动子);5,322,938,5,352,605,5,359,142,和5,530,196(35S启动子);6,433,252(玉米L3油质蛋白启动子);6,429,357(水稻肌动蛋白2启动子,和水稻激动蛋白2内含子);6,294,714(光诱导的启动子);6,140,078(盐诱导的启动子);6,252,138(病原体诱导的启动子);6,175,060(磷缺乏诱导的启动子);6,388,170(双向启动子);6,635,806(γ-薏苡辛(coixin)启动子);5,447,858(大豆热激蛋白启动子);和美国专利申请系列No.09/757,089(玉米叶绿体醛缩酶启动子)。
额外的示例性启动子包括胭脂碱合成酶(NOS)启动子(Ebert et al.(1987)Proc.Natl.Acad.Sci.USA 84(16):5745-9);章鱼碱合成酶(OCS)启动子(其由根癌土壤杆菌的肿瘤诱导质粒携带);花椰菜花叶病毒属启动子,例如花椰菜花叶病毒(CaMV)19S启动子(Lawton et al.(1987)Plant Mol.Biol.9:315-24);CaMV 35S启动子(Odell et al.(1985)Nature 313:810-2;玄参花叶病毒35S启动子(Walker et al.(1987)Proc.Natl.Acad.Sci.USA 84(19):6624-8);蔗糖合酶启动子(Yang and Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-8);R基因复合物启动子(Chandler et al.(1989)Plant Cell 1:1175-83);叶绿素a/b结合蛋白基因启动子;CaMV35S(美国专利Nos.5,322,938,5,352,605,5,359,142,和5,530,196);FMV35S(美国专利Nos.6,051,753,和5,378,619);PC1SV启动子(美国专利No.5,850,019);SCP1启动子(美国专利No.6,677,503);和AGRtu.nos启动子(GenBank登录号No.V00087;Depicker et al.(1982)J.Mol.Appl.Genet.1:561-73;Bevan et al.(1983)Nature 304:184-7)。
在特定的实施方案中,核酸分子可以包括组织特异性启动子。组织特异性启动子是指导可操作地连接的核苷酸序列在该启动子特异的组织中以相对于生物体的其它组织更高的水平进行转录的核苷酸序列。组织特异性启动子的实例包括,但不仅限于;绒毡层特异性启动子;花药特异性启动子;花粉特异性启动子(见例如美国专利No.7,141,424和国际PCT公开No.WO 99/042587);胚珠特异性启动子;(见例如,美国专利申请No.2001/047525A1);果实特异性启动子(见例如,美国专利Nos.4,943,674,和5,753,475);和种子特异性启动子(见例如,美国专利Nos.5,420,034,和5,608,152)。在一些实施方案中,可以使用发育阶段特异性启动子(例如,在发育晚期有活性的启动子)。
其他在一些实施方案中可以和核酸分子可操作地连接的调节序列包括位于启动子序列和编码序列之间的5’UTR,其作为翻译前导序列。该翻译前导序列存在于完全加工好的mRNA中,并且可以影响初级转录本的加工,和/或RNA稳定性。翻译前导序列的实例包括玉米和矮牵牛热激蛋白前导(美国专利No.5,362,865),植物病毒外被蛋白前导,植物核酮糖-1,5-二磷酸羧化酶/加氧酶前导,和其他。参见,例如,Turner and Foster(1995)MolecularBiotech.3(3):225-36。下面提供了5’UTR的非限制性实例:GmHsp(美国专利NO.5,659,122);PhDnaK(美国专利NO.5,362,865);AtAnt1;TEV(Carrington and Freed(1990)J.Virol.64:1590-7);和AGRinos(GenBank登录号NO.V00087;和Bevan et al.(1983),同上)。
其他在一些实施方案中可以和核酸分子可操作地连接的调节序列还包括3’非翻译序列,3’转录终止区,或多腺苷酸化区。这些都是位于核苷酸序列下游的遗传元件,并且包括这样的多核苷酸,其提供多腺苷酸化信号,和/或其他能够影响转录或mRNA加工的调节信号。植物中多腺苷酸化信号的功能是向mRNA前体的3'末端添加聚腺苷酸核苷酸。多腺苷酸化序列可以来自多种植物基因或来自T-DNA的基因。3’转录终止区的非限制性实例是胭脂碱合成酶3'区(nos 3’;Fraley et al.(1983)Proc.Natl.Acad.Sci.USA 80:4803-7)。在Ingelbrecht et al.(1989)Plant Cell 1:671-80中提供了使用不同3’非翻译区的实例。多腺苷酸化信号的非限制性实例包括来自豌豆RbcS2基因(Ps.RbcS2-E9;Coruzzi et al.(1984)EMBO J.3:1671-9)和AGRtu.nos(GenBank登录号E01312)的多腺苷酸化信号。
关于可能用于特定实施方案的调节序列的额外信息在,例如Goeddel(1990)“GeneExpression Technology,”Methods Enzymol.185,Academic Press,San Diego,CA中有描述。
重组核酸分子或载体可以包括可选择标志物,其给被转化的细胞,例如植物细胞,赋予可选择的表型。可选择标志物还可用于选择包含含有可选择标志物的核酸分子的细胞或生物体。标志物可以编码杀生物剂抗性,抗生素抗性(例如,卡那霉素,遗传霉素(G418),博来霉素,和潮霉素),或除草剂抗性(例如,草甘膦)。可选择标志物的实例包括,但不仅限于:neo基因,其赋予卡那霉素抗性并可以使用例如卡那霉素和G418进行选择;bar基因,其赋予双丙氨膦抗性;突变的EPSP合酶基因,其赋予草甘膦抗性;腈水解酶基因,其赋予对溴苯腈的抗性;突变的乙酰乳酸合酶基因(ALS),其赋予咪唑啉酮或磺酰脲抗性;和氨甲蝶呤抗性DHFR基因。可以获得多种可选择标志物,其赋予对化学剂的抗性,包括例如但不仅限于,氨苄青霉素;博莱霉素;氯霉素;庆大霉素;潮霉素;卡那霉素;林可霉素;甲氨蝶呤;膦丝菌素;嘌呤霉素;壮观霉素;利福平;链霉素;和四环素。这样的可选择标志物的实例在例如,美国专利5,550,318;5,633,435;5,780,708和6,118,04中被举例。
核酸分子或载体还可以或者可选择地包括可筛选标志物。可筛选标志物可用于监测表达。示例性的可筛选标志物包括β-葡糖醛酸酶或uidA基因(GUS),其编码一种酶,该酶的各种生色底物已知的(Jefferson et al.(1987)Plant Mol.Biol.Rep.5:387-405);R-基因座基因,其编码可调节植物组织中花青素色素(红色)生产的产物(Dellaporta et al.(1988)“Molecular cloning of the maize R-nj allele by transposon tagging withAc.”In 18th Stadler Genetics Symposium,P.Gustafson and R.Appels,eds.,Plenum,NY(263-82页);β-内酰胺酶基因(Sutcliffe et al.(1978)Proc.Natl.Acad.Sci.USA 75:3737-41);编码各种生色底物已知的酶的基因(例如,PADAC,发色头孢菌素);荧光素酶基因(Ow et al.(1986)Science 234:856-9);xylE基因,其编码可以转化显色儿茶酚的儿茶酚双加氧酶(Zukowski et al.(1983)Gene 46(2-3):247-55);淀粉酶基因(Ikatu et al.(1990)Bio/Technol.8:241-2);酪氨酸酶基因,其编码能够氧化酪氨酸为DOPA和多巴醌的酶,其进一步可缩合成黑色素(Katz et al.(1983)J.Gen.Microbiol.129:2703-14);和α-半乳糖苷酶。
编码例如感兴趣的特定多肽或特定靶向性核酸内切酶的所有核苷酸序列,可以被本领域的技术人员立即识别。遗传密码子的简并性为特定的氨基酸序列提供了有限数目的编码序列。根据本发明的实施方案选择编码多肽的特定序列在从业者的判断力之内。在不同的应用中可能期望不同的编码序列。
在一些实施方案中,可能期望修饰核酸的核苷酸,例如提高该核酸中包含的多核苷酸序列在特定宿主中的表达。遗传密码子是冗余的,具有64种可能的密码子,但是大多数生物体优先使用这些密码子的子集。在物种中最经常使用的密码子被称作最佳密码子,不是非常经常使用的密码子被归类为稀有或低使用率密码子。Zhang et al.(1991)Gene105:61-72。密码子可以被取代,以反映特定宿主的优选密码子使用,这个过程有时被称作“密码子优化”。含有特定原始生物或真核生物宿主优选的密码子的优化编码序列可以被制备,以提高翻译速度或产生具有期望性质的重组RNA转录本(例如,与从非优化序列产生的转录本相比,具有更长的半衰期)。
在本发明的实施方案中,核酸可以用本领域技术人员已知的任何方法引入到宿主细胞中,包括例如但不仅限于:原生质体转化(见例如美国专利5,508,184);干燥/抑制介导的DNA摄取(见例如,Potrykus et al.(1985)Mol.Gen.Genet.199:183-8);电穿孔(见例如,美国专利5,384,253);用碳化硅纤维搅拌(见例如,美国专利5,302,523和5,464,765);土壤杆菌介导的转化(见例如,美国专利5,563,055,5,591,616,5,693,512,5,824,877,5,981,840,和6,384,301);并通过DNA涂覆的颗粒加速(见例如,美国专利5,015,580,5,550,318,5,538,880,6,160,208,6,399,861,和6,403,865)。通过诸如这些技术的应用,几乎任何种类的细胞均可以稳定地转化。在一些实施方案中,转化DNA被整合到宿主细胞的基因组中。在多细胞物种的情况下,转基因细胞可以再生为转基因生物。任何这些技术均可用于产生转基因植物,例如,在该转基因植物的基因组中包含一个或多个本发明的核酸序列。
用于将表达载体导入到植物中的最广泛使用的方法是基于土壤杆菌的天然转化系统。根癌土壤杆菌和发根土壤杆菌是植物致病性土壤细菌,其可以遗传转化植物细胞。根瘤土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责植物遗传转化的基因。Ti(肿瘤诱导)质粒含有一个大片段,被称为T-DNA,其可被转移到被转化的植物。Ti质粒的另一个片段,vir区域,负责T-DNA转移。T-DNA区被左手和右手边界包围,其每一个由末端重复核苷酸序列构成。在一些经过修饰的二元载体中,肿瘤诱导的基因已被删除,并使用vir区域的功能转移被T-DNA边界序列包围的外源DNA。T区还可以含有,例如,用于高效回收转基因植物和细胞的可选择标志物,用于插入转移序列的多克隆位点,例如编码本发明融合蛋白的核酸。
因此,在一些实施方案中,植物转化载体来自根癌土壤杆菌的Ti质粒(见例如,美国专利Nos.4,536,475,4,693,977,4,886,937,和5,501,967;和欧洲专利EP 0 122 791),或发根土壤杆菌的Ri质粒。额外的植物转化载体包括,例如但不仅限于,下列文献中描述的那些:Herrera-Estrella et al.(1983)Nature 303:209-13;Bevan et al.(1983),上文;Klee et al.(1985)Bio/Technol.3:637-42;和欧洲专利EP 0 120 516,和从上述任意一种衍生的那些。其它细菌,例如中华根瘤菌,根瘤菌,和中慢生根瘤菌,其与植物自然相互作用,可以被修饰从而介导向大量不同植物转移基因。这些植物相关的共生细菌可以被制成感受态,通过获取卸甲(disarmed)的Ti质粒和合适的二元载体进行基因转移。
向受体细胞提供外源DNA以后,一般对被转化细胞进行鉴定,用于进一步的培养和植株再生。为了提高鉴定转化细胞的能力,可能期望在用于产生转化体的载体中采用可选择或可筛选的标志物基因,如前所述。在使用可选择标志物的情况下,通过将细胞暴露于一种或多种选择剂,在潜在的被转化细胞中鉴定出被转化的细胞。在使用可筛选标志物的情况下,可以根据期望的标志物基因性状对细胞进行筛选。
暴露于选择剂后存活的细胞或者在筛选试验中被评定为阳性的细胞,可以在支持植物再生的培养基中进行培养。在一些实施方案中,可以通过包含其它物质,例如生长调节剂,对任何合适的植物组织培养基(例如MS和N6培养基)进行修饰。组织可以保持在具有生长调节剂的基本培养基中,直到获得足够的组织来开始再生植物的工作,或者进行反复多轮的手动选择,直到组织的形态适合于再生(例如,至少2周),然后转移到有利于芽(shoot)形成的培养基中。培养物被周期性地转移,直到产生足够的芽苗。一旦芽苗形成,便将它们转移到有利于根形成的培养基中。一旦形成足够的根,便将植物转移到土壤中,用于进一步的生长和成熟。
为了确认在再生植物中存在感兴趣的核酸分子(例如,编码含有至少一个本发明融合蛋白的多肽的核苷酸序列),可以执行各种测定。这样的测定包括,例如:分子生物学测定,例如Southern和Northern印迹,PCR和核酸测序;生物化学测定,例如检测蛋白质产物的存在,例如,通过免疫学手段(ELISA和/或Western印迹)或通过酶促功能;植物部分测定,例如叶或根测定;和整个再生植物的表型分析。
整合事件可以通过,例如,PCR扩增进行分析,使用例如特异针对感兴趣核苷酸序列的寡核苷酸引物。PCR基因分型被理解为包括,但不仅限于,对来自预测含有被整合到基因组内的感兴趣核酸分子的分离宿主植物组织的基因组DNA进行聚合酶链反应(PCR),随后对PCR扩增产物进行标准克隆和序列分析。PCR基因分型的方法已经得到了很好的描述(参见,例如,Rios,G.et al.(2002)Plant J.32:243-53),并且可应用于来自任何植物物种或组织类型(包括细胞培养物)的基因组DNA。
使用土壤杆菌依赖的转化方法形成的转基因植物通常含有重组DNA的单个到多个拷贝。单个重组DNA序列被称作一个“转基因事件”或“整合事件”。这类转基因植物就插入的DNA序列而言是杂合的。在一些实施方案中,转基因的转基因植物纯合子可以通过含有单个外源基因序列的独立分离的转基因植物与自身(例如F0植物)的有性结合(自交)产生Fl种子而获得。四分之一的所产Fl种子就转基因而言是纯合的。令Fl种子萌发可产生能够用于测试杂合性的植物,这通常使用SNP测定或热扩增测定,其能够区分杂合子和纯合子(即,接合性测定)。
除了在一些实施方案中用核酸分子直接转化植物或植物细胞之外,在特定的实施方案中,可以通过使具有至少一个转基因事件的第一植物与缺少这种事件的第二植物杂交,来制备转基因植物。例如,可以向适于转化的第一植物品系中引入包含至少一个经过修饰的FAD2基因座的核酸,其中外源核酸已经以位点特异性的方式被整合,从而产生转基因植物,该转基因植物可以和第二植物品系杂交,从而将至少一个经过修饰的FAD2基因座(以及因此导致的外源核酸)基因渗入到第二植物品系中。
为了确认在再生植物中存在感兴趣的核酸分子,可以实施多种测定。这样的测定包括,例如:分子生物学测定,例如Southern和Northern印迹和PCR;生物化学测定,例如检测蛋白质产物的存在,例如,通过免疫学手段(ELISA和/或Western印迹)或通过酶促功能;植物部分测定,例如叶或根测定;和整个再生植物的表型分析。
靶向整合事件可以通过例如PCR扩增进行筛选,使用例如特异针对感兴趣核酸分子的寡核苷酸引物。PCR基因分型被理解为包括,但不仅限于,对来自预测含有被整合到基因组内的感兴趣核酸的分离宿主植物愈伤组织的基因组DNA进行聚合酶链反应(PCR)扩增,随后对PCR扩增产物进行标准克隆和序列分析。PCR基因分型的方法已经有很多描述(例如,Rios,G.et al.(2002)Plant J.32:243-53),并且可以应用于来自任何植物物种或组织类型(包括细胞培养物)的基因组DNA。结合靶序列和被引入的序列二者的寡核苷酸引物的组合可以顺次使用或复用于PCR扩增反应。设计成退火至靶位点、引入的核酸序列、和/或两者的组合的寡核苷酸引物是可行的。因此,PCR基因分型策略可以包括(但不仅限于)扩增植物基因组中的特定序列,扩增植物基因组中的多个特定序列,扩增植物基因组中的非特异性的序列,或其组合。本领域的技术人员可以设计出额外的引物和扩增反应的组合来查询基因组。例如,一组正向和反向寡核苷酸引物可以被设计为与被引入的核酸序列的边界之外的靶标所特有的核酸序列退火。
正向和反向寡核苷酸引物可以被设计成与引入的感兴趣核酸分子特异性退火,例如,与对应于感兴趣核酸分子编码区的序列或感兴趣核酸分子其它部分的序列退火。这些引物可以和上述的引物一起使用。寡核苷酸引物可以根据期望的序列来合成,并且可以商购获得(例如,从Integrated DNA Technologies,Inc.,Coralville,IA)。扩增之后可以进行克隆和测序,或者对扩增产物进行直接序列分析。本领域技术人员可以想到替代方法,用于对在PCR基因分型期间产生的扩增产物进行分析。在一个实施方案中,在PCR扩增中使用特异针对靶基因的寡核苷酸引物。
VI.包含整合在FAD2性能基因座处的核酸的转基因植物和植物材料
在一些实施方案中,提供了转基因植物,其中该植物包括含有至少一个经过修饰的FAD2基因座(例如,被破坏和/或靶向整合了外源序列的FAD2基因座)。在特定的实施方案中,这样的植物可以通过转化植物组织或植物细胞,然后再生整株植物来产生。在进一步的实施方案中,这样的植物可以通过以位点特异性的方式在至少一个FAD2基因座处引入外源核酸,或者通过将经过修饰的FAD2基因座基因渗入到种质中而获得。还提供了包含这样的植物细胞的植物材料。这样的植物材料可从从包含该植物细胞的植物获得。
在一些实施方案中,包含含有至少一个经过修饰的FAD2基因座的植物细胞的转基因植物或植物材料可以表现出这样的一个或多个特征:在植物细胞内表达靶向性核酸内切酶;在植物细胞内(或者在其中的质体内)表达感兴趣的多肽;在植物细胞的细胞核内表达靶向性核酸内切酶;靶向性核酸内切酶定位在植物细胞内;整合在植物细胞基因组中的FAD2基因座处;编码感兴趣多肽的核苷酸序列或农艺学基因整合在植物细胞基因组中的FAD2基因座处;和/或存在与整合在植物细胞基因组FAD2基因座处的编码序列对应的RNA转录本。这样的植物可以额外具有一个或多个期望的性状,包括例如但不仅限于,通过内源或转基因核苷酸序列表达产生的性状,表达受到感兴趣多肽或整合在植物细胞基因组FAD2基因座处的农艺学基因调节的性状;抗昆虫、其它害虫和致病剂;抗除草剂;增加稳定性、产量或保质期;环境耐受;药物生产;工业产品生产;和营养增强。
根据本发明的转基因植物可以是任何能够根据本文所述的方法被核酸转化、该核酸随后整合到至少一个FAD2基因座中的植物。因此,植物可以是双子叶植物或单子叶植物。可用于本方法的双子叶植物的非限制性实例包括拟南芥,紫花苜蓿,豆类,西兰花(broccoli),卷心菜,芥花,胡萝卜,花椰菜(cauliflower),芹菜,大白菜,棉花,黄瓜,茄子,莴苣,甜瓜,豌豆,胡椒,花生,马铃薯,南瓜(pumpkin),萝卜,油菜,菠菜,大豆,倭瓜(squash),甜菜,向日葵,烟草,番茄,和西瓜。可用于本方法的单子叶植物的非限制性实例包括玉米,大麦,洋葱,水稻,高粱,小麦,黑麦,粟,甘蔗,燕麦,黑小麦,稷,和草坪草。根据本发明的转基因植物可以用任何方式使用或培养。
一些实施方案还提供了由本发明的转基因植物生产的商业产品。商业产品包括,例如但不仅限于:含有一个或多个整合在至少一个FAD2基因座处的核苷酸序列的植物的食品、谷物粗粉(meal)、油,或压碎的或全谷粒或种子。在一种或多种商品或商业产品中检测到一个或多个这样的核苷酸序列事实上证明该商品或商品产物的至少一部分是由根据本发明的实施方案产生的转基因植物产生的。在一些实施方案中,包含在基因组中含有至少一个经过修饰的FAD2基因座的植物细胞的转基因植物或种子,可能在其基因组中含有至少一个其它的转基因事件,包括但不限于:RNAi分子被转录的转基因事件;编码杀虫蛋白(例如,苏云金芽孢杆菌杀虫蛋白)的基因;除草剂抗性基因(例如,提供对草甘膦抗性的基因);和有助于转基因植物的期望表型的基因(例如,增加产量,改变脂肪酸代谢,或恢复细胞质雄性不育)。
包含含有至少一个经过修饰的FAD2基因座的植物细胞的转基因植物可以具有一种或多种期望的性状。这样的性状可以包括,例如:抗昆虫、其它害虫和致病剂;抗除草剂;增加稳定性、产量或保质期;环境耐受;药物生产;工业产品生产;和营养增强。期望的性状可以由一个或多个通过靶向重组被整合在FAD2基因座处的核酸分子赋予,这些核酸分子在显示该期望表型的植物中表达。因此,在一些实施方案中,期望的性状可能是由于植物中存在转基因,该转基因被引入在植物基因组中至少一个经过修饰的FAD2基因座位置处。在另外的实施方案中,期望的性状可以通过常规育种获得,该性状可以由一个或多个通过靶向重组被整合在至少一个经过修饰的FAD2基因座处的核酸分子赋予。
根据本发明的转基因植物可以按照任何方式加以使用和培养,其中至少一个经过修饰的FAD2基因座的存在是期望的。因此,植物可以如下所述工程化而(除其他事项外)具有一种或多种期望的性状:用核酸分子进行转化,该核酸分子随后根据本发明以位点特异性的方式被整合在至少一个FAD2基因座处,并按照本领域技术人员已知的任何方法进行种植(crop)和培养。
VII.包含整合在FAD2性能基因座处的核酸的转基因植物的标志物辅助育种
提供了与芸苔属植物中的fad2连锁(例如,紧密连锁)的分子标志物。例如,鉴定了含有涉及HO性状(fad2)的序列的DNA片段。这些片段位于和基因连锁群中突变等位基因连锁(例如,紧密连锁)的标志物的周围和所述标志物之间。因此,还提供了包含具有失活突变的突变体FAD2基因的核酸分子。所鉴定的片段及其标志物被包含在本主题中,这部分是由于它们在欧洲油菜基因组连锁群中的位置。例如,FAD2和与之连锁的分子标志物可以位于连锁群N5和N1中。
本文引用在这里引用的全部参考文献,包括出版物、专利和专利申请,的内容作为参考,它们与本公开的具体细节没有冲突,因此在这里引用它们的内容就如同每一篇参考文献被单独且具体地引用并且在本文中阐述了其全部内容一样。提供本文所讨论的参考文献仅仅是由于它们在本申请的申请日期之前被公开。本文的任何内容均不应被理解为由于先前发明而承认本发明人没有资格先于这些公开内容。提供了这样的实施例以举例说明某些特定的特征和/或实施方案。这些实施例不应被理解为将本公开限制于所举例的这些特定的特征或实施方案。
实施例
实施例1:从细菌人工染色体文库鉴定FAD2靶序列
BAC文库构建
细菌人工染色体(BAC)文库来自商业供应商(Amplicon Express,Pullman,WA)。BAC文库包含110,592个BAC克隆,其含有从欧洲油菜L.var.DH10275分离的高分子量基因组DNA(gDNA)片段。gDNA用BamHI或HindIII限制酶消化。将大约135Kbp的分离gDNA片段连接到pCC1BAC载体(Epicentre,Madison,WI)中,并转化进入大肠杆菌DH10B株(Invitrogen)。BAC文库由相同数目的用两种不同限制酶构建的BAC克隆构成。这样,Hind III构建的BAC文库包含在144个单独的384孔板中。类似地,BamHI构建的BAC文库包含在144个单独的384孔板中。总共分离了110,592个BAC克隆,并排列在288个单独的384孔板中。288个单独的384孔板的每一个均由供应商作为用于快速PCR筛选的单个DNA提取体系提供。最终的BAC文库覆盖大约15Gbp的gDNA,其对应于欧洲油菜L.var.DH10275基因组的12倍基因组覆盖(欧洲油菜L.的基因组估计为大约1.132Gbp,如Johnston et al.(2005)Annals of Botany 95:229-235所述)。
从BAC文库分离的FAD2编码序列的序列分析
使用构建的BAC文库分离FAD2基因编码序列。进行测序实验从欧洲油菜L.var.DH10275中鉴定4个FAD2基因同源和旁系同源物的特定基因序列。
FAD2基因序列最初是在模式物种拟南芥中被鉴定的。该基因序列收录在Genbank中,基因座标签为At3g12120。模式植物物种拟南芥与二倍体芜菁(其是四倍体欧洲油菜的一个祖先)之间的比较基因组关系先前已有描述(Schranz et al.(2006)Trends in PlantScience 11(11):535-542)。具体就FAD2基因而言,比较分析预测在二倍体欧洲油菜基因组中可能存在该基因的3-4个拷贝。Scheffler et al.(1997)Theoretical and AppliedGenetics 94;583-591完成了进一步的基因定位研究。这些基因定位研究的结果表明,欧洲油菜中存在FAD3基因的4个拷贝。
从欧洲油菜L.var.DH10275构建的BAC文库的测序分析结果分离了4个BAC序列(SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,和SEQ ID NO:4),从中确定了FAD2A(SEQ IDNO:5),FAD2-1(SEQ ID NO:6),FAD2-2(SEQ ID NO:7),和FAD2-3(SEQ ID NO:8)基因的编码序列。FAD2A,FAD2-1,FAD2-2,和FAD2-3的基因序列被鉴定和基因定位。4个FAD2基因的序列分析使用序列比对程序和邻接树利用同一性百分比加以实施。序列比对使用Vector NTIAdvance 11.0计算机程序(Life Technologies,Carlsbad,CA)的
Figure BDA0002137215980000582
程序实施,如图1所示。
Figure BDA0002137215980000583
使用经过修改的Clustal W算法生成蛋白质或核酸序列的多个序列比对结果,用于相似性比较和注释。。
邻接树用Jalview
Figure BDA0002137215980000584
软件产生,并如图2所示。(Waterhouse et al.(2009)Bioinformatics 25(9)1189-1191)。如图2所示,分离序列的分析表明,FAD2A和FAD2-3序列具有高水平的序列相似性,并且,类似地,FAD2-1和FAD2-2具有高水平的序列相似性。这四个序列可以分成2个进化枝(clade),其中FAD2A和FAD2-3构成第一枝,FAD2-1和FAD2-2构成第二枝。
接着,使用从欧洲油菜新分离的FAD2序列对从芜菁基因组BAC文库和甘蓝鸟枪基因组序列读取分离的基因组文库进行BLAST。芜菁和甘蓝均是欧洲油菜的二倍体祖先,欧洲油菜是双二倍体物种(AC基因组,n=19)。欧洲油菜源自芜菁(A亚基因组,n=10)和甘蓝(C亚基因组,n=9)之间的一次新近杂交事件。使用BLASTn分析将二倍体祖先序列与从欧洲油菜分离的4个不同FAD2编码序列进行比较。这种序列分析从芜菁和甘蓝中鉴定了特异性的、经过注释的基因序列,它们与新近发现的欧洲油菜FAD2序列具有最高的序列相似性。表1列举了新近鉴定的FAD2编码序列和相应的祖先参考序列登录号和源生物体。
表1:来自欧洲油菜的FAD2序列和相应的祖先生物和相关FAD序列登录号
Figure BDA0002137215980000591
FAD2基因存在于欧洲油菜基因组中,每个基因在每个亚基因组中具有2个拷贝。每个基因的一个拷贝位于A亚基因组,类似地,每个基因的一个拷贝位于C亚基因组。描述了新的命名规则来指示每个基因位于哪个亚基因组上。从欧洲油菜BAC基因组DNA文库分离的4个不同FAD2编码序列与祖先序列数据之间的高水平的序列相似性提示FAD2-3是来自C亚基因组的FAD2序列的复制品,并可以重新标记为FAD2C;FAD2-1是来自A亚基因组的FAD2序列的复制品,因此可以标记为FAD2A’;最后,FAD2-2是第二个从C亚基因组的FAD2序列复制的拷贝,并可以标记为FAD2C’。
基于PCR的筛选
设计了一系列PCR引物用于筛选前述的BAC文库。引物或者被设计成通用引物,其可扩增该基因家族的所有成员,或者被设计成基因特异性引物,用于靶向等位基因扩增。PCR引物被设计成20bp长(+/-1bp),并且G/C含量为50%(+/-8%)。表2列举了设计并合成的引物。汇集BAC文库的克隆,并通过聚合酶链式反应(PCR)进行筛选。
表2:设计用于BAC文库筛选以进行FAD2基因鉴定的PCR引物序列
引物名称 SEQ ID NO: 序列
D_UnivF2_F1 SEQ ID NO:9 ATGGGTGCAGGTGGAAGAATG
D_UnivF2_F2 SEQ ID NO:10 AGCGTCTCCAGATATACATC
D_UnivF2_R1 SEQ ID NO:11 ATGTATATCTGGAGACGCTC
D_UnivF2_R2 SEQ ID NO:12 TAGATACACTCCTTCGCCTC
D_SpecificF2_F3 SEQ ID NO:13 TCTTTCTCCTACCTCATCTG
D_SpecificF2_R3 SEQ ID NO:14 TTCGTAGCTTCCATCGCGTG
D_UnivF2_F4 SEQ ID NO:15 GACGCCACCATTCCAACAC
D_UnivF2_R4 SEQ ID NO:16 ACTTGCCGTACCACTTGATG
使用两组不同的条件进行聚合酶链式反应(PCR)。第一组PCR反应条件包括:1XPCR缓冲液(含有dNTPs);1.5mM MgCl2;200μM的0.25U
Figure BDA0002137215980000592
DNA聚合酶(Bioline,London,UK);250nM每种引物;和大约5-10ng模板DNA。第二组PCR反应条件被开发用于扩增基因组DNA,并且包括:5-10ng基因组DNA,1X PCR缓冲液,2mM dNTPs,0.4μM正向和反向引物,和0.25U
Figure BDA0002137215980000602
DNA聚合酶(Bioline,London,UK)。将扩增物汇集至终体积为13μL,并使用MJ
Figure BDA0002137215980000603
热循环仪(BioRad,Hercules,CA)或ABI 9700Gene Amp
Figure BDA0002137215980000604
(Life Technologies,Carlsbad,CA)进行扩增。对特定平板的基于PCR的筛选使用4维筛选方法实施,其是基于Bryan等人(Scottish Crops Research Institute annual report:2001-2002)所述的系统并使用上述PCR条件。在对汇集的BAC文库进行基于PCR的筛选之后,使用直接Sanger测序方法对扩增的PCR产物进行测序。扩增的产物用乙醇、乙酸钠和EDTA按照v3.1方案(Applied Biosystems)进行纯化,并在
Figure BDA0002137215980000606
自动毛细管电泳平台上进行电泳。
在基于PCR的筛选和构象Sanger测序之后,鉴定含有各种不同FAD2基因家族成员的平板集合。总共鉴定了4个独特的FAD2旁系同源基因序列(表2)。每个FAD2旁系同源物基因序列的总共2个平板被选择进行平板筛选,以鉴定平板内含有FAD2基因的特定孔和克隆(表3)。为两个平板均鉴定特定的孔,并为FAD2基因家族的每个成员选择一个单独的克隆。
表3:鉴定与精细(detailed)PCR引物组合具有阳性反应的BAC克隆平板和继续用于在平板内进行克隆鉴定的两个平板的身份
通过测序对每个已鉴定的FAD基因家族成员的单个BAC克隆进行进一步的分析。使用Large Construct
Figure BDA0002137215980000607
(Qiagen,Valencia,CA)按照制造商的使用说明为BAC克隆分离DNA并准备用于测序。使用GS-FLX Titanium
Figure BDA0002137215980000611
(Roche,Indianapolis,IN)按照制造商的使用说明准备用于测序的提取BAC DNA。测序反应使用物理分区的(sectored)GS-FLX TI Pico-
Figure BDA0002137215980000613
利用成对收集的BAC实施,用于优化数据输出。成对合并BAC,其中FAD3基因与FAD3基因配对。产生的全部序列数据用Newbler v2.0.01.
Figure BDA0002137215980000614
(454Life Sciences,Branford,CT)组装。组装的重叠群(contig)使用Sequencher
Figure BDA0002137215980000615
(GeneCodes,Ann Arbor,MI)手动分析相应FAD基因重叠群的存在。
在鉴定并完全表征了所有4个FAD2基因的全基因组序列之后,设计锌指核酸酶用于结合每个特定基因家族成员的序列。
实施例2:特异针对FAD2基因的锌指结合结构域的设计
针对编码FAD2基因座各种功能序列的DNA序列的新颖锌指蛋白的设计基本上如前所述。参见例如Urnov et al.(2005)Nature 435:646-651。示例性靶序列和识别螺旋如表4(识别螺旋区设计)和表5(靶位点)所示。在表5中,与ZFP识别螺旋接触的靶位点的核苷酸用大写字母指示;非接触的核苷酸用小写字母指示。
锌指核酸酶(ZFN)靶位点被设计成结合FAD2A的5个靶位点。FAD2A锌指设计被合并在锌指表达载体中,其编码具有至少一个具有CCHC结构的锌指的蛋白质。参见,美国专利公开No.2008/0182332。特别地,每个蛋白的最后一个指具有用于识别螺旋的CCHC骨架。非规范的锌指编码序列通过一个四氨基酸ZC接头和来自玉米的opaque-2核定位信号与IIS型限制酶FokI的核酸酶结构域(Wah et al.,(1998)Proc.Natl.Acad.Sci.USA95:10564-10569的序列的氨基酸384-579)融合,形成FAD2A锌指核酸酶(ZFNs)。融合蛋白的表达受到相对较强的组成型启动子驱动,例如来自木薯脉花叶病毒(CsVMV)启动子的启动子,并且侧翼是根癌土壤杆菌ORF23 3’非翻译区(AtuORF23 3’UTR v1)。在克隆到构建体中的两个锌指核酸酶融合蛋白之间添加来自明脉扁刺蛾(Thosea asigna)病毒的自水解2A编码核苷酸序列(Szymczak et al.,2004)。示例性载体或质粒如下文表5所述。
使用先前显示用于鉴定活性核酸酶的基于出芽酵母的系统验证最优的FAD2锌指核酸酶的剪切活性。参见例如美国专利公开No.20090111119;Doyon et al.(2008)NatBiotechnol.26:702–708;Geurts et al.(2009)Science 325:433。用于多种功能性结构域的锌指被选择用于体内使用。在被设计、产生和测试与推定FAD基因组多核苷酸靶位点结合的大量ZFN中,有11个ZFN被鉴定具有高水平的体内活性,并被选择用于进一步的实验。这些ZFN被表征为能够高效结合和剪切植物内的独特FAD2基因组多核苷酸靶位点。
表4:FAD2锌指设计
Figure BDA0002137215980000621
Figure BDA0002137215980000641
表5:FAD2锌指的靶位点
实施例3:锌指核酸酶剪切FAD3基因的评估
构建体组装
含有使用如实施例2所述的酵母测定法而鉴定的示例性锌指核酸酶的ZFN表达构建体的质粒载体使用本领域公知的技术设计并制成。每个锌指编码序列与位于锌指核酸酶的上游的编码opaque-2核定位信号(Maddaloni et al.(1989)Nuc.Acids Res.17(18):7532)的序列融合。
接着,将opaque-2核定位信号::锌指核酸酶融合序列与互补的opaque-2核定位信号::锌指核酸酶融合序列配对。这样,每个构建体含有由两个opaque-2核定位信号::锌指核酸酶融合序列构成的单个开放阅读框,两个融合序列被来自明脉扁刺蛾(Thoseaasigna)病毒的2A序列(Mattion et al.(1996)J.Virol.70:8124-8127)分隔。融合蛋白的表达受到相对较强的组成型启动子驱动,例如来自木薯叶脉花叶病毒(CsVMV)启动子的启动子,并且侧翼是根癌土壤杆菌ORF23 3’非翻译区(AtuORF23 3’UTR)。
载体用In-FusionTMAdvantage Technology(Clontech,Mountain View,CA)组装。限制性核酸内切酶从New England BioLabs(NEB;Ipswich,MA)获得,并使用T4DNA连接酶(Invitrogen)进行DNA连接。质粒制备使用
Figure BDA0002137215980000652
质粒试剂盒(Macherey-NagelInc.,Bethlehem,PA)或Plasmid Midi试剂盒(Qiagen)按照制造商的使用说明进行。DNA片段在琼脂糖Tris-乙酸凝胶电泳之后使用QIAquick凝胶提取试剂盒TM(Qiagen)进行分离。所有已组装质粒的菌落通过微量制备的DNA的限制性消化进行最初筛选。对选出的克隆的质粒DNA通过商业测序载体(Eurofins MWG Operon,Huntsville,AL)进行测序。序列数据使用SequencherTM软件(Gene Codes Corp.,Ann Arbor,MI)进行组装和分析。在递送到欧洲油菜原生质体之前,使用Pure Yield Plasmid Maxiprep (Promega Corporation,Madison,WI)或Plasmid Maxi
Figure BDA0002137215980000654
(Qiagen,Valencia,CA)按照供应商的使用说明从大肠杆菌培养物制备质粒DNA。
通过限制酶消化和通过DNA测序确认了所得的11个质粒构建体:pDAB104008(含有ZFN24845和ZFN24844构建体),pDAB104009(含有ZFN24820和ZFN24821构建体),pDAB104010(含有ZFN24828和ZFN24829构建体)(图3),pDAB104003(含有ZFN24810和ZFN24811构建体),pDAB104011(含有ZFN24832和ZFN24833构建体),pDAB104002(含有ZFN24794和ZFN24795构建体),pDAB104006(含有ZFN24796和ZFN24797构建体),pDAB104004(含有ZFN24814和ZFN24815构建体),pDAB104001(含有ZFN24800和ZFN24801构建体),pDAB104005(含有ZFN24818和ZFN24819构建体),和pDAB104007(含有ZFN24836和ZFN24837构建体)。表6列举了不同的构建体和每个ZFN被设计用于剪切和结合的特定FAD2A序列。
表6:列出锌指蛋白结合基序和相应的构建体编号。每个锌指被设计成结合并剪切表中所述的FAD2A
Figure BDA0002137215980000661
用于转染的DNA的制备
上述载体的质粒DNA通过沉淀,在100%(v/v)乙醇中清洗,并在层流净化罩内干燥进行灭菌。将DNA沉淀(pellet)重悬于30μL无菌双蒸水中,终浓度为0.7μg/μl,用于如下所述地转染进入原生质体细胞中。进行质粒DNA制备,产生用于瞬时转染的超螺旋质粒DNA和用于稳定转染的线性化质粒DNA。对于原生质体细胞的瞬时转染,不需要向转化质粒中添加载体DNA(例如,鱼精DNA)。对于瞬时研究,每次转染中,每106个原生质体使用大约30μg质粒DNA。
转染
欧洲油菜L.var.DH10275的转染如Spangenberg et al.,(1986)PlantPhysiology 66:1-8所述实施,培养基配方如pangenberg G.and Protrykus I.(1995)Polyethylene Glycol-Mediated Direct Gene Transfer in Tobacco Protoplasts,其集录于:Gene Transfer to Plants.(Protrykus I.and Spangenberg G.Eds.)Springer-Verlag,Berlin所述。欧洲油菜的种子用70%乙醇表面灭菌。将种子浸没在12mL 70%乙醇溶液中,并通过轻柔摇动该混合物(cocktail)10分钟进行混合。通过倾倒溶液除去70%乙醇溶液,并用由1%w/v次氯酸钙和0.1%v/v吐温-20组成的种子灭菌溶液进行交换。将种子浸没在种子灭菌溶液中,并通过轻柔摇动该混合物(cocktail)25分钟进行混合。倾倒种子灭菌溶液,并将经过灭菌的种子在50mL无菌水中漂洗3次。最后,将种子转移到无菌80mmWhatman
Figure BDA0002137215980000671
(Fisher-Scientific,St.Louis,MO)上,其置于培养皿(Petri dish)中,并用无菌水将种子稍微饱和。培养皿用(Fisher-Scientific,St.Louis,MO)密封,并将平板在25℃下完全黑暗温育1-2天。在可以从种子观察到幼苗萌发迹象之后,将幼苗转移到含有凝固的GEM培养基的培养皿中,以易化进一步的种子萌发。幼苗在GEM培养基上25℃温育4-5天。
向无菌培养皿中倾倒一定体积的液体PS培养基(大约10mL)。使用无菌镊子和手术刀除去并丢弃处于生长和发育4叶期的4-5日龄幼苗的地上部分。确定长度为20-40mm的下胚轴节段产生的富含细胞质的小原生质体的群体最高。将下胚轴节段无菌切下并转移到液体PS培养基中。将切下的下胚轴节段合在一起,横切成5-10mm节段。接着,将下胚轴节段转移到新鲜PS培养基中,并在室温下温育1小时。将质壁分离的下胚轴转移到含有酶溶液的培养皿中。将全部下胚轴节段小心地浸没在溶液中。用
Figure BDA0002137215980000681
密封培养皿,并在轻柔摇动下20-22℃过夜温育16-18小时。
原生质体细胞从下胚轴节段释放。轻轻搅拌下胚轴的过夜消化物,使原生质体释放到酶溶液中。将培养皿略微倾斜,以帮助转移酶溶液和植物碎片的消化悬液。使用10mL移液管将消化悬液转移到无菌的原生质体过滤单元(100微米网筛滤器)中,进一步分离原生质体和植物碎片。轻扣过滤单元,以释放被筛网捕获的多余液体。轻柔混合大约8-9mL的原生质体悬液,并分配到14mL无菌塑料圆底离心管中。每个悬液用1.5mL W5溶液覆盖。将W5溶液小心置于原生质体悬液上,以一定的角度并逐滴添加,以便使扰动最小化。向原生质体悬液添加W5溶液导致产生富含原生质体的界面。这个界面用移液管进行收集。接着,将收集的原生质体转移到一个新的14mL离心管中,并轻轻混合。将所产生或获得的原生质体用血细胞计数器进行检测,以确定每毫升中原生质体的数量。重复本方法,其中消化叶片组织以产生叶肉原生质体。
接着,添加W5溶液到10mL的体积,并在70g离心原生质体,然后除去W5溶液。通过轻轻摇晃将剩余的原生质体悬浮液重新悬浮。含有原生质体悬浮液的每个管中填充5mL W5溶液,并在室温下温育1-4小时。在70g离心原生质体悬液,并除去全部的W5溶液。接着,向每个含有分离的原生质体的沉淀原生质体悬液中添加300μL转化缓冲液。向每个管中添加10μg质粒DNA到原生质体悬液中。质粒DNA含有如上所述的锌指核酸酶构建体(例如pDAB104010)。接着,向原生质体悬液中添加300μL预热的PEG4000溶液,并轻轻叩击管。将原生质体悬液和转化混合物在室温下温育15分钟,不进行任何搅拌。以每份1mL,1mL,1mL,2mL,2mL和3mL的量向每个管中顺序添加额外的10mL W5溶液,并在每次添加W5溶液之间将管轻轻颠倒。通过70g离心沉淀原生质体。除去全部的W5溶液,留下纯的原生质体悬液。
接着,向离心沉淀的原生质体细胞添加0.5mL K3培养基,并将细胞重悬浮。将重悬的原生质体细胞置于培养皿的中心,和1:1浓度的5mL K3和0.6mL Sea PlaqueTM琼脂糖(Cambrex,East Rutherford,NJ)。单次轻柔涡旋运动摇动培养皿,并在室温下温育20-30分钟。培养皿用
Figure BDA0002137215980000682
密封,并将原生质体在完全黑暗下培养24小时。在黑暗中温育后,将培养皿在昏暗光(Osram L36W/21Lumilux日光灯(white tube),5μMol m-2s-1)下培养6天。在培养步骤后,使用无菌刮刀将含有原生质体的琼脂糖切分成四份。将分离的四等分物置于含有20mL A培养基的250毫升塑料培养容器中,并在旋转摇床上以80rpm和1.25cm冲程(throw)在24℃下在连续昏暗的灯光下温育14天,然后分析确定每个锌指核酸酶构建体的活性水平。
从芥花原生质体分离基因组DNA
将经转染的原生质体置于在单独的1.5或2.0mL微离心管中。将细胞离心沉淀在含有缓冲溶液的管的底部。DNA提取如下实施:将细胞在液氮中速冻,然后在LabconcoFreezone
Figure BDA0002137215980000691
(Labconco,Kansas City,MO)中在-40℃和大约133x 10-3mBar压强下冷冻干燥细胞大约48小时。使用
Figure BDA0002137215980000692
(QIAGEN,Carlsbad,CA)植物试剂盒对冻干的细胞进行DNA提取,按照制造商的使用说明进行,只是不需要组织破坏,而是将原生质体细胞直接添加到裂解缓冲液中。
用于在芥花原生质体中进行基因组DNA序列剪切的FAD2A ZFN的测试
将FAD2A基因座中的ZFN靶位点的设计进行聚类,从而设计出覆盖靶位点的多对ZFN。ZFN靶位点的聚类使得人们能够设计PCR引物,使之能够从所有FAD2A基因家族成员扩增100bp窗口内的周围基因组序列,从而涵盖全部的覆盖ZFN靶位点。这样,Illumina短读取序列技术可用于评估被转染的原生质体中靶ZFN位点的完整性。此外,设计的PCR引物需要包括这样的特定核苷酸碱基,其可将序列读取归结于FAD2A家族的特定基因成员。因此,需要全部的PCR引物在距离任何ZFN靶切割位点5-10个核苷酸处结合,因为已知非同源末端连接(NHEJ)活性可导致小的缺失,这些小的缺失能够除去引发位点,抑制扩增,从而干扰NHEJ活性的评估。
引物被设计成结合FAD2A基因家族全部的ZFN靶基因座(表7),并通过对PCR扩增产物进行基于Sanger的测序,经验性地测试它们对全部基因家族成员的扩增。在若干情况下,无法建立能够区分全部基因家族成员的引物(表8),然而,在所有情况下,FAD2A的靶基因序列可以被区分。在PCR引物设计之后,将定制的DNA条码(barcode)序列纳入到PCR引物中,这些条码序列可用于区分不同的ZFN靶基因座,并鉴定对转染和ZFN的特定序列读取(表7和8)。
表7:设计用于评估FAD2ZFN活性的引物序列。引物包括定制条码(custombarcode),连同两个必要的用于构建Illumina文库的Illumina衔接子序列用于测序-合成分析。所购引物是所给出的全部三个列的总和。
Figure BDA0002137215980000701
表8显示了所设计的PCR引物对FAD2基因家族的扩增性能。“X”表示基因拷贝检测特异性,灰色阴影和“+”表示在讨论的特定基因座由两个引物设计的序列读取无法区分。
表8:FAD2A和FAD2C基因座处的剪切结果
Figure BDA0002137215980000711
在对被ZFN转染的芥花原生质体进行DNA提取之后,对靶ZFN基因座进行PCR扩增,以便以正确的格式产生必需的基因座特异性DNA分子,用于通过合成技术的基于Illumina的测序。每个测定经过优化以便在25ng起始DNA(欧洲油菜基因组的大约12,500个细胞的当量)上工作。为每个样品进行多个反应,以提供以合适的水平评估NHEJ效率和特异性所需的覆盖率,大约16个PCR反应相当于从单个原生质体获得的欧洲油菜基因组的200,000个拷贝。为所有使用相同的测定的待测试的样品制备PCR扩增主预混物(master-mixes);用曾被用于确定要对靶组织实施的最佳循环数的定量PCR方法测定一个3个重复的反应,以确保PCR扩增未受到试剂限制,并且仍然处于指数扩增阶段。实验以及必要的阴性对照反应以96孔格式使用MX3000P
Figure BDA0002137215980000712
(Stratagene,LaJolla,CA)实施。
根据从定量PCR平台收集的输出对荧光的逐循环相对增加描点作图,并为每个测定确定能够输送足够的扩增同时又不会使反应受到试剂限制的循环数,以试图减少过度循环和共有转录本或分子的扩增。将未使用的主预混物保持在冰上直至定量PCR分析完成且循环数得以确定,然后分装到期望数目的反应管中(每个ZFN测定大约16个),并进行PCR反应。
扩增后,将单个ZFN基因座的样品汇集在一起,并使用MinElute PCR纯化(Qiagen)按照制造商的使用说明对每个ZFN的200μL汇集产物进行清洁。为了使样品能够用Illumina短读取技术进行测序,需要通过扩增将额外的配对末端引物附接到已产生的片段上。这通过PCR扩增实现,PCR扩增使用的引物与在第一轮扩增中添加的序列部分互补,但还含有所需的配对末端序列。使用经过了如前所述的定量PCR循环分析的样品,再次确定要实施的PCR循环的最佳数目,PCR循环的最佳数目能够向模板添加配对末端引物但不会过度扩增共有片段。
在PCR扩增之后,使用MinElute
Figure BDA0002137215980000721
(Qiagen)按照制造商的使用说明对所产生的产物进行清洁,并在2.5%琼脂糖凝胶上进行分离。DNA片段用
Figure BDA0002137215980000722
Safe(LifeTechnologies,Carlsbad,CA)可视化,对具有正确大小的条带进行凝胶提取,除去任何残余的PCR产生的引物二聚体和其它假片段,使用MinElute凝胶提取
Figure BDA0002137215980000723
(Qiagen)按照制造商的使用说明从凝胶片提取DNA。在完成凝胶提取后,使用AMPure
Figure BDA0002137215980000724
(Beckman-Coulter,Brea,CA)对DNA进行额外的清洁,DNA与珠子比例为1:1.7。然后,使用基于定量PCR的文库定量试剂盒估测DNA浓度,以1/40,000和1/80,000稀释用于Illumina测序(KAPA),反应实施三个重复。根据定量PCR结果,将DNA稀释成2nM的标准浓度,并合并所有的文库用于DNA测序。使用cBot cluster generation
Figure BDA0002137215980000725
(Illumina,San Diego,CA)制备用于测序的样品,并在Illumina
Figure BDA0002137215980000726
上按照制造商的使用说明进行测序,实施100bp配对末端测序读取。
用于检测靶锌指位点处非同源末端连接的数据分析方法
在完成测序反应并使用用于碱基识别(base calling)的Illumina生物信息管道(pipeline)进行原始数据读出之后,实施完全分析来鉴定每种情况下靶ZFN位点处缺失的碱基。设计定制的PERL脚本(script)从DNA序列中根据一系列输入序列用计算机提取和分选条码。条码必须以大于30的Phred得分与参考序列相匹配,以减少错误指认(misattributing)的序列读取。在序列读取被分选到所用的不同条码组中之后,对所有序列进行质量过滤。质量过滤是第二种定制开发的PERL脚本。如果有三个碱基被读出为“N”,或者如果中位数Phred得分小于20,或者有三个连续碱基的Phred得分小于20,或者序列读取的长度小于40bp,则排除该序列读取。使用
Figure BDA0002137215980000727
(SoftGenetics,StateCollege,PA)软件包合并剩余的序列,其中两个配对序列读取均可获得。然后,使用第三种定制的PERL脚本将剩余的合并序列读取减小为一组唯一的序列读取,将被鉴定的冗余序列的数目计数记录在剩余序列识别器的末端。然后,使用
Figure BDA0002137215980000728
软件将唯一的序列读取与FAD2参考序列进行比对,产生有缺口的FASTA比对文件。
使用该带缺口的FASTA文件,使用第四种定制的PERL脚本将有缺口的碱基位置编号转换成输入参考。这能够在组装的数据中鉴定这样的碱基,其可以区分不同的基因家族成员(不同基因家族成员之间的同源或旁系同源序列变异)。一旦实施了碱基编号的转换,便有可能为每个唯一的序列读取产生单倍型报告,并将该读取指派到特定的基因家族成员。一旦读取被基因分组,便可以在ZFN靶位点周围鉴定并评估一个10bp的窗口。记录每个基因具有缺失的序列数目和错配碱基的数目。
然后,将数据图形显示为多线图,图上有每10,000个序列读取中在靶ZFN位点处具有1-10个碱基缺失的序列的数目。为所有ZFN转染以及对照转染实施这种分析。在几种情况下,天然DNA序列中的重复导致靶ZFN位点中的测序错误增加,这种错误可以一般性地视为在所有样品中(包括被ZFN转染的和被对照转染的)被报告的单碱基缺失的普遍增加(图5)。
从这些结果可知,在FAD2靶位点处的最高水平的ZFN活性,如根据更大的NHEJ活性确定的,在位点E被鉴定。选择质粒pDAB104010(即ZFN24828和24829)上编码的ZFN用于在植物内靶向工程化的转基因整合平台(ETIP),这是考虑到它具有显著的基因组DNA剪切活性和最小的非靶活性等特征。
实施例4:用于工程化的转基因整合平台(ETIP)芥花植物品系的DNA构建体
下面描述的质粒载体是使用本领域技术人员公知的方法和技术构建的。本段所描述的具体试剂和技术的应用是本领域技术人员容易知道的,并且容易和其它试剂和技术交换,以实现构建质粒载体构建体的理想目的。限制性核酸内切酶从New England BioLabs(NEB;Ipswich,MA)获得。连接用T4DNA连接酶(Invitrogen,Carlsbad,CA)完成。Gateway反应使用
Figure BDA0002137215980000731
LR
Figure BDA0002137215980000732
酶预混物(Invitrogen)实施,用于将一个进入载体(entryvector)组装到单个目的载体中。In-FusionTM反应使用In-FusionTMAdvantage Technology(Clontech,Mountain View,CA)实施,用于将一个进入载体组装到单个目的载体中。质粒制备使用
Figure BDA0002137215980000733
质粒试剂盒(Macherey-Nagel Inc.,Bethlehem,PA)或Plasmid Midi
Figure BDA0002137215980000734
(Qiagen)按照供应商的使用说明实施。DNA片段在琼脂糖Tris-乙酸凝胶电泳之后使用QIAquick凝胶提取试剂盒TM(Qiagen)提取。所选克隆的质粒DNA通过商业测序供应商(Eurofins MWG Operon,Huntsville,AL)进行测序。序列数据用SEQUENCHERTM软件(GeneCodes Corp.,Ann Arbor,MI)组装和分析。
用于精确整合ETIP到芥花FAD2基因座中的直接投送载体
使用标准克隆方法构建含有ETIP的载体pDAS000130(图6,T链插入物为SEQ IDNO:61),用于特异整合到欧洲油菜的FAD2A基因中。这种构建体设计为被投送到具有锌指核酸酶构建体pDAB104010的芥花原生质体中。锌指核酸酶构建体将切割FAD2A基因座,然后pDAS000130构建体将通过同源性介导的或非同源末端连接修复机制整合到芥花基因组中。ETIP包括4个表达盒(两个是不完整的),它们被额外的ZFN识别序列分隔,和一个工程化的登录垫(Engineered Landing Pad)(ELP),其含有另一个ZFN识别序列。这些额外的ZFN识别序列是独特的,被设计作为靶标用于将多核苷酸序列引入到ETIP和ELP转基因插入物中。类似地,ZFN识别序列可以用于切出多核苷酸序列。第一表达盒是一个不完整的dsRED表达盒,并且包含来自拟南芥多聚泛素(polyubiquitin)10(AtUbi启动子)基因的启动子,5'非翻译区和内含子(Callis,et al.,(1990)J.Biol.Chem.,265:12486-12493),随后是210bp的来自珊瑚礁珊瑚(reef coral Discosoma sp.)(Clontech,Mountain View,CA)的dsRed基因,其被密码子优化用于在双子叶植物中表达(dsRED(双子叶植物优化的)外显子1),随后是来自拟南芥硫还原酶样基因(thioreductase-like gene)的内含子(来自拟南芥硫还原酶的内含子1:登录号No:NC_00374)和包含玉米Viviparous-1(Vp1)基因转录终止子和聚腺苷酸化位点的3'非翻译区(Zmlip终止子:Paek et al.,(1998)Mole cules and Cells,8(3):336-342)。第二个表达盒含有19S启动子,其包括来自花椰菜花叶病毒的5’UTR(CaMV 19S:Cook and Penon(1990)Plant Molecular Biology 14(3):391-405),随后是来自大肠杆菌的hph基因,其被密码子优化用于在双子叶植物中表达(hph(HygR):Kaster et al.,(1983)Nucleic Acids Research 11(19):6895-6911),和包含根癌土壤杆菌pTi15955开放阅读框1的转录终止子和聚腺苷酸化位点的3’UTR(At-ORF1终止子:Barker et al.,(1983)PlantMolecular Biology 2(6):335-50)。第三个表达盒是完整的PAT表达盒,包含来自拟南芥4-香豆酰-CoA合酶的第一内含子(内含子#2 4-香豆酰-CoA合酶v:登录号At3g21320/NC003074),随后是从绿色产色链霉菌(Streptomyces viridochromogenes)分离的膦丝菌素乙酰转移酶基因的一个合成、植物优化版本的最后256bp,其编码赋予对谷氨酰胺合成酶抑制剂,包括膦丝菌素、草铵膦和双丙氨膦的抗性的蛋白质(PAT(v6)3’端:Wohlleben etal.,(1988)Gene70(1):25-37)。这个盒终止于3'UTR,其包括根癌土壤杆菌pTi15955开放阅读框23的转录终止子和聚腺苷酸化位点(AtuORF23终止子:Barker et al.,(1983)PlantMolecular Biology 2(6):335-50)。第四个表达盒是ipt基因盒,包含来自拟南芥DNA结合蛋白MYB32基因(U26933)的启动子和5’UTR的588bp截短形式(AtMYB32(T)启动子:Li etal.,(1999)Plant Physiology 121:313),随后是来自根癌土壤杆菌的异戊二烯基转移酶(ipt)基因和35s终止子,其包含来自花椰菜花叶病毒的转录终止子和聚腺苷酸化位点(CaMV 35S终止子:Chenault et al.,(1993)Plant Physiology 101(4):1395-1396)。为了投送到FAD2A,ETIP序列的每个末端侧翼有1kb的FAD2A基因组序列,该基因组序列来自通过向欧洲油菜的FAD2A基因中投送pDAB104010中编码的ZFN而诱导的双链断裂的任一侧。
ETIP序列由商业基因合成供应商(GeneArt,Life Technologies)合成。使用Qiagen DNeasy plant mini
Figure BDA0002137215980000754
(Qiagen,Hilden),按照制造商提供的使用说明,从自欧洲油菜DH12075的叶片组织纯化的基因组DNA中扩增FAD2A基因组序列的1kb节段。使用T4连接酶(NEB,Ipswich,MA)将这些1kb FAD2A序列连接到ETIP中。所有组装质粒的菌落通过微量制备DNA的限制性消化进行初始筛选。限制性核酸内切酶从New England BioLabs(NEB,Ipswich,MA)和Promega(Promega Corporation,WI)获得。质粒制备用QIAprep SpinMiniprep
Figure BDA0002137215980000751
(Qiagen)或Pure Yield Plasmid Maxiprep
Figure BDA0002137215980000752
(PromegaCorporation,WI)按照供应商的使用说明进行。所选克隆的质粒DNA用ABI Sanger测序和Big Dye Terminator v3.1cycle sequencing (Applied Biosystems,LifeTechnologies)进行测序。使用SEQUENCHERTM软件评估和分析序列数据(Gene Codes Corp.,Ann Arbor,MI)。
对照载体
使用对照载体开发基于荧光激活细胞分选(FACS)的细胞分选方法。使用标准克隆方法构建包含两个基因表达盒的对照质粒pDAS000031(图7:T-链插入物为SEQ ID NO:62)。第一个基因表达盒包含花椰菜花叶病毒19S启动子(CaMV 19S启动子;Shillito,et al.,(1985)Bio/Technology 3;1099-1103)::潮霉素抗性基因(hph(HygR);美国专利No.4,727,028)::和根癌土壤杆菌开放阅读框1的3'非翻译区(AtORF1终止子;Huang et al.,(1990)J.Bacteriol.1990 172:1814-1822)。第二个基因表达盒包含拟南芥泛素10启动子(AtUbi10启动子;Callis,et al.,(1990)J.Biol.Chem.,265:12486-12493)::dsRED(dsRED(D);美国专利No.6,852,849)和来自拟南芥的内含子(内含子#1;GenBank:AB025639.1)::根癌土壤杆菌开放阅读框23的3'非翻译区(AtORF23终止子;美国专利No.5,428,147),以反方向(例如,头对头方向)对框融合。质粒载体的组装使用In-FusionTMAdvantage技术(Clontech,Mountain View,CA)。
实施例5:ETIP芥花植物系的产生
欧洲油菜的转化
FAD2A位点特异性整合利用ETIP构建体(pDAS000130),连同锌指核酸酶(pDAB104010),和如实施例4所述的DS-Red对照构建体(pDAS000031)。将二元载体转化到根癌土壤杆菌菌株GV3101:PM90中。欧洲油菜原生质体细胞的转化使用实施例3所述的转染规程完成,并具有一些修改。
该方案的修改包括使用海藻酸钠代替Sea PlaqueTM琼脂糖。将锌指核酸酶构建体pDAB104010和ETIP构建体pDAS000130共投送到欧洲油菜原生质体细胞内的转染实验,用摩尔比为5:1和12:1的DNA浓度完成,其中pDAS000130的浓度为27.8μg质粒DNA,pDAB104010的浓度为2.2μg质粒DNA。对照质粒构建体用30μg质粒DNA的浓度转化。
该方案的其他修改包括在含有1.5mg/mL潮霉素的培养基中从被转化的原生质体细胞繁殖整株植物。整株植物的繁殖要求每2周更换一次A培养基,并对原生质体来源的集落的生长进行监视。在原生质体来源的集落生长至直径大约2-3mm后,将集落转移到含有凝固MS morpho培养基的12孔
Figure BDA0002137215980000761
平板(Fisher Scientific,St.Louis,MO)的各个孔中。平板在连续的昏暗光下24℃温育1-2周,直至愈伤组织的尺寸扩增到直径为8-10mm。在原生质体细胞达到直径1-2cm后,将原生质体细胞转移到含有MS morpho培养基的单个250mL培养容器中。该容器在16小时光照(20μMol m-2s-1,Osram L36W/21Lumilux白光灯管)和8小时黑暗的条件下24℃温育。在1-2周内,可以见到多个芽。在芽长度达到3-4cm后,将芽转移到含有MS培养基的250mL培养容器中。将250mL培养容器在16小时光照(20μMol m-2s-1,OsramL36W/21Lumilux白光灯管)和8小时黑暗的条件下24℃温育。芽保持在该培养容器中,直至它们发育成小植株,此时将它们转移到温室中生长至成熟。
实施例6:含有ETIP的T-DNA整合在芥花中的分子确认
使用DNeasy Plant Mini试剂盒KitTM(Qiagen)按照制造商的使用说明从所有推定的转基因植物叶片组织中提取基因组DNA,所不同的是组织用80μl AE缓冲液洗脱。将30毫克来自再生植物的嫩叶组织在液氮中速冻,之后研磨成粉。
FAD2A基因座的分子表征使用三种独立的测定法执行。这些测定法使用如下的对照设计和优化:已表征的包含单个随机整合转基因的转基因事件,具有5个随机整合转基因的已表征转基因事件,野生型芥花栽培种DH12075植株和无模板对照反应。将下列三个分子分析的结果在一起进行考虑,以提供ETIP通过HDR整合在FAD2A处的证据。
通过实时聚合酶链式反应鉴定转基因整合
使用下列引物对每个植物的四个重复样品进行分析,其特异针对hph(也称作hpt)靶基因(SEQ ID NO:63,hpt F791 5'CTTACATGCTTAGGATCGGACTTG 3';SEQ ID NO:64,hptR909 5'AGTTCCAGCACCAGATCTAACG 3';SEQ ID NO:65,hpt Taqman 872 5'CCCTGAGCCCAAGCAGCATCATCG 3'FAM)(图8)和编码高迁移率族蛋白I/Y的基因(HMG I/Y)(SEQ ID NO:66,F 5'CGGAGAGGGCGTGGAAGG 3';SEQ ID NO:67,
R 5'TTCGATTTGCTACAGCGTCAAC 3';SEQ ID NO:68,探针5'AGGCACCATCGCAGGCTTCGCT 3'HEX)。使用如下的条件扩增反应:95℃10分钟,随后是40个循环的95℃ 30秒,60℃ 1分钟,扩增数据在每个退火步骤结束时捕获。拷贝数的计算使用ΔCq方法,其中ΔCq=Cq(靶基因)–Cq(参考基因)。Livak,K.J.and T.D.Schmittgen,Analysis of relative gene expression data using real-time quantitative PCRand the 2(-Delta Delta C(T))Method.Methods,2001.25(4):p.402-8。具有hph和HMGI/Y扩增并且拷贝数为0.5或更高的植株被看作是转基因的,并且拷贝数≥0.5和≤1.2的植株被评定为推定单拷贝。扩增在具有FastStart Universal Probe Master(ROX),(Roche,Basel,Switzerland)的BioRad CFX96TouchTMReal-Time PCR检测系统上进行。
被破坏的FAD2A ZFN位点的检测
在破坏基因座测试(disrupted locus test)中,对每个植物分析内源靶标的扩增存在与否。破坏基因座测试是一种显性测定(dominant assay)。该测定是一种
Figure BDA0002137215980000782
Green I qPCR测定,并且是单重式(singleplex),但是每个反应在同一PCR平板上同时运行,靶定内源基因座(FAD2A/2C.RB.UnE.F1,SEQ ID NO:69,5’CTTCCACTCCTTCCTCCTCGT*C3’和FAD2A/2C.RB.UnE.R1,5’SEQ ID NO:70,GCGTCCCAAAGGGTTGTTGA*G 3’)和ZFN基因座(在该基因座处ZFN pDAB104010结合并切割基因组)(FAD2A.UnE.F1,SEQ ID NO:71,5’TCTCTACTGGGCCTGCCAGGG*C 3’和FAD2A.UnE.R1,SEQ ID NO:72,5’CCCCGAGACGTTGAAGGCTAAGTACAA*A 3’)(图9)。两个引物对均使用如下的条件进行扩增:98℃ 30秒,随后是35个循环(98℃ 10秒,65℃ 20秒,72℃ 90秒),然后是95℃ 10秒,随后进行50℃-95℃的熔解分析,增量为每0.05秒0.5℃,并在每次增量时进行平板读取。反应条件如表9所列。
表9:用于PCR扩增的单一反应试剂组分和浓度
Figure BDA0002137215980000781
Figure BDA0002137215980000791
具有内源靶标扩增但没有ZFN靶标扩增的植株评定为破坏基因座测试阳性,并被考虑为具有被破坏的ZFN基因座。当FAD2A基因座处两个等位基因上的ZFN结合位点均被破坏时,这一测定被认为是阳性的。
对FAD2A处通过同源性介导的修复的转基因整合的PCR检测
利用终点法(endpoint)对每个推定的植物转化子进行分析,其使用被设计成扩增如下转基因靶的PCR引物:hph(hph_ExoDigPC_F1,SEQ ID NO:73,5’TTGCGCTGACGGATTCTACAAGGA 3’和hph_ExoDigPC_R1,SEQ ID NO:74,5’TCCATCAGTCCAAACAGCAGCAGA 3’),FAD2A内源基因座(FAD2A.Out.F1,SEQ ID NO:75,5’CATAGCAGTCTCACGTCCTGGT*C 3’和FAD2A.Out.Rvs3,SEQ ID NO:76,5’GGAAGCTAAGCCATTACACTGTTCA*G 3’),跨越任何通过HDR被整合到FAD2A基因座中的转基因的5’端的区域,位于进入FAD2A基因座内的转基因的上游(FAD2A.Out.F1,SEQ ID NO:77,5’CATAGCAGTCTCACGTCCTGGT*C 3’和QA520,SEQ ID NO:78,5’CCTGATCCGTTGACCTGCAG 3’)和跨越任何通过HDR整合到FAD2A基因座中的转基因的3’端、延伸到转基因的下游的FAD2A基因座内的区域(QA558,SEQ ID NO:79,5’GTGTGAGGTGGCTAGGCATC 3’和FAD2A.Out.Rvs3,SEQID NO:80,5’GGAAGCTAAGCCATTACACTGTTCA*G 3’)(图3)。所有引物对用如下的条件进行扩增:98℃ 30秒,随后是35个循环(98℃ 10秒,65℃ 20秒,72℃ 90秒)。反应试剂条件如表10所列。
表10:用于PCR扩增的单一反应试剂组分和浓度
Figure BDA0002137215980000792
靶侧翼的5’转基因-基因组的扩增和/或靶侧翼的3’转基因-基因组的扩增指示推定的插入事件。必须注意,由于pDAS000130盒中大约1,000bp的FAD2A同源臂(包含与ZFN切割位点直接上游和下游的FAD2A区域具有100%序列同一性的多核苷酸序列),PCR反应可能产生假阳性PCR产物扩增,这是由于脱靶ETIP整合事件的扩增产生的PCR嵌合。hph靶的扩增确认发生了转基因整合。FAD2A靶的扩增提示,FAD2A基因座是完整的,或者仅含有部分插入。由于ETIP的尺寸(ETIP盒为11,462bp,或者包含FAD2A同源臂和ETIP盒为13,472bp),可以预期,当完整的ETIP被整合到FAD2A基因组中时,FAD2A引物不会扩增产物。
FAD2A编辑的Southern检测
将扩增出了5’基因组-转基因侧翼靶产物和/或扩增出了的3’转基因-基因组侧翼靶产物、或者没有扩增出ZFN基因座靶标、或者两者的植株进行Southern分析,检测转基因在FAD2A基因座处的整合。使用经过修改的CTAB法从5g叶片组织中纯化基因组DNA(Maguire,T.L.,G.G.Collins,and M.Sedgley A modified CTAB DNA extractionprocedure for plants belonging to the family proteaceae.Plant MolecularBiology Reporter,1994.12(2):p.106-109)。接着,用Kpn1-HF(New England BioLabs)消化12μg基因组DNA,并在0.8%琼脂糖凝胶上通过电泳分离消化片段,随后用标准Southern印迹方案转移到膜上。使用针对如下基因的引物产生探针:FAD2A 5’靶区域(F,SEQ ID NO:81,5'AGAGAGGAGACAGAGAGAGAGT 3'和R,SEQ ID NO:82,5'AGACAGCATCAAGATTTCACACA 3'),FAD2A 3’靶区域(F,SEQ ID NO:83,5'CAACGGCGAGCGTAATCTTAG 3'和R,SEQ ID NO:84,5'GTTCCCTGGAATTGCTGATAGG 3')和hph(F,SEQ ID NO:85,5'TGTTGGTGGAAGAGGATACG 3'和R,SEQ ID NO:86,5'ATCAGCAGCAGCGATAGC 3'),使用DIG Easy Hyb
Figure BDA0002137215980000811
(Roche,SouthSan Francisco,CA)按照制造商的使用说明检测FAD2A基因座内ETIP的存在(图11)。执行杂交的温度为:42℃用于FAD2A 5’区、45℃用于FAD2A 3’区,42℃用于检测hph。
膜结合的基因组DNA用特定的顺序进行探测:首先,探测FAD2A 5’序列,然后探测FAD2A 3’序列,最后探测hph序列(图12)。这样做的理由如下。第一探针(FAD2A 5’)是诊断探针,如果ETIP通过完美的HDR被整合到FAD2A中,则在膜上可以见到一个5,321bp片段。所得条带大小容易在电泳过程中被区分,并且会位于DIG标记的Roche DNA分子量Marker
Figure BDA0002137215980000812
(Roche,Indianapolis,IN)中的5,148bp片段附近。膜的第二探针是FAD2A 3’探针,被编辑的植株会具有一个22,433bp片段,而未被编辑的植株会有一个16,468bp片段。用FAD2A3’探针鉴定的相同22,433bp片段也应当可以被hph探针结合和鉴定。这些片段难以在凝胶上区分,因为它们极其大,并且可能难以确定在DIG标记的Roche DNA分子量Marker
Figure BDA0002137215980000813
中最大的21,226bp片段之上或下面显现的片段之间的任何差异。因此,这些探针通过使用FAD2A5’探针显现一条5kb片段,提供可能强化ETIP通过同源性介导的修复(HDR)整合到FAD2A中的鉴定的证据。限制酶KpnI是唯一适用于本测定的限制性核酸内切酶,因为KpnI位点在ETIP盒中以单基因座出现,以单基因座切割ETIP盒,并且在FAD2AZFN基因座中的两个位点存在。一个位点位于FAD2A同源臂的上游,第二个位点位于其下游。此外,KpnI是甲基化不敏感的,可以作为具有更高保真度的重组酶供使用(New England Biolabs)。
分子和Southern分析的结果
在转染、培养和选择之后,将转基因植株转移到土壤中。该过程的结果有139株植物存活,对它们进行组织采样用于gDNA提取和分析。对全部139株植物进行分析,估计拷贝数。这139株植物中,56株对ETIP阳性,56株阳性植物中的11株具有推定的单拷贝整合(图13)(表11)。在56株对ETIP整合呈阳性的植物中,有7株植物发生了FAD2A5’-基因组-转基因侧翼序列的扩增。在这56株对ETIP整合呈阳性的植株中均没有发生FAD2A 3’-转基因-基因组侧翼序列的扩增。此外,在56株对ETIP整合呈阳性的植株中,有11株植物对破坏的基因座qPCR测试呈阳性。对于14株对FAD2A 5’-基因组-转基因侧翼序列扩增呈阳性和/或对破坏的基因座qPCR测试呈阳性的植株,使用上述的3个探针进行了Southern分析。对于这14株进行了Southern分析的植株,所有的植株均显示在FAD2A基因座内具有部分整合,但是当用FAD2A 5’探针、FAD2A 3’和hph探针进行探测时,这些植株均没有显示出完整的全长ETIP通过HDR整合在FAD2A基因座处的证据。没有出现如下的条带:i)大于WT,和ii)与这些样品用FAD2A 3’探针进行探测时所观察到的条带相同(表11)。
表11:ETIP整合分析结果概览
土壤中存活的植物数目 139
采样植物数目 139
完成qPCR拷贝数分析的植物数目 139
ETIP整合阳性的植物数目 56
包含推定单拷贝插入物的植物数目 11
ETIP/FAD2入-出5'反应的数目 7(自56个)
ETIP/FAD2入-出3'反应的数目 0(自56个)
基因座破坏qPCR测试的数目 9(自56个)
ETIP中靶(on-target)(Southern) 0(自14个)
用PDAS000130和PDAB104010转化的ETIP转基因芥花的结果
通过pDAS000130和pDAB104010转化产生的欧洲油菜转基因事件导致来自pDAS000130的ETIP多核苷酸序列的单拷贝、全长T链插入物被整合在FAD2A基因座内。对3-4个事件进行了完全表征,并确认含有被整合的ETIP。确认是使用入-出PCR扩增方法,并进一步通过Southern印迹进行验证。使选出的T0事件生长至T1发育阶段。对T1植物进行再次筛选,以确定所整合T-链的接合性。将所筛选的事件分类为纯合子、半合子或空。
通过前述的方法使用纯合子事件产生原生质体。随后用至少一个锌指核酸酶和供体质粒共转染原生质体,该锌指核酸酶被设计成靶向纳入在ETIP序列内的结合位点,该供体质粒与ETIP的特定区域具有同源性,其中该供体通过HDR机制被整合在ETIP内。类似地,随后用至少一个锌指核酸酶和供体质粒共转染原生质体,该锌指核酸酶被设计成靶向纳入在ETIP序列内的结合位点,该供体质粒与ETIP的特定区域不具有同源性,其中该供体通过非同源末端连接机制被整合在ETIP内。ZFN剪切ETIP基因座,并且供体质粒通过同源性介导的修复或非同源末端连接被整合在欧洲油菜细胞的基因组内。
作为该供体质粒整合的结果,部分DS-red转基因被修复成全长DS-red转基因。利用此时功能齐全DS-red转基因的表达来在FACS方法中分选原生质体细胞。用实施例7中所述的FACS方法分选推定的转基因植株,并将分离的原生质体再生成成熟植株。使用分子确认方法,确认供体质粒被整合在ETIP靶向的植株中。这样,ETIP基因座发挥位点特异性基因座的作用,用于供体多核苷酸序列的基因靶向整合。
实施例7:基于FACS的原生质体细胞分选
对于用DS-Red对照构建体pDAS000031转染的欧洲油菜原生质体,使用BDBiosciences Influx-Cell sorterTM(San Jose,CA),通过FACS介导的细胞分选法进行分选。原生质体细胞的分离和转染如实施例3所述。在细胞用pDAS000031转染之后,使用FACS分选器利用表7所述的条件对细胞进行分选。
表7:用于分选被pDAS000031转染的原生质体细胞的调节
Figure BDA0002137215980000831
Figure BDA0002137215980000841
分选和分离表达DS-red转基因的原生质体。FACS分离的原生质体用分选器进行计数。在FACS分离后的第一天,将大约1x105-1.8x105个细胞置于24孔微滴定板的孔内。将细胞转移至珠子培养历时5-20天。测试相似的条件,其中在FACS分离后的第二天,将大约1x104个细胞置于24孔微滴定板的孔内。测试的各种条件导致回收了具有一定活力的细胞,或者95-98%的总分离原生质体细胞。将FACS分选的原生质体细胞转移到珠子培养历时3-20天。在含有1.5mg/mL潮霉素的培养基上使用上述的实验方案将FACS分选的原生质体细胞再生成植株。推定的转基因植株通过分子确认方案被确认含有来自pDAS000031的完整T链插入物。
FACS分选方法可直接用于筛选任何荧光转基因序列,并用于分离一部分被用荧光转基因打靶的欧洲油菜原生质体细胞,所述荧光转基因通过同源性介导的修复被靶向在基因组基因座中ETIP区的特定位点内。
实施例8:欧洲油菜ω-3脂肪酸去饱和酶(FAD2)通过同源性介导的修复的靶向整合和破坏
特异针对FAD2的锌指结合结构域的选择
鉴定并表征同源FAD2基因的被转录区域,设计结合并剪切这些位点的锌指核酸酶用于供体序列的NHEJ介导的打靶。如上所述地设计针对来自FAD2序列同源物的DNA序列的锌指蛋白(ZFN)并进行测试。从显示中靶(on-target)活性的ZFN中,选择一个可高效切割FAD2靶标的锌指蛋白:ZFP 24828-2A-24829识别SEQ ID NO:355’-agGCCCAGtAGAGAGGCCaggcgaagta-3’和SEQ ID NO:365’-ccAGGGCTGCGTCCTAACCGgcgtctgg-3’。这个ZFN显示可特异性结合并剪切FAD2A基因座。
用于HDR指导的DNA修复的“供体”载体的设计和构建
为了通过HDR整合供体序列,构建了单个载体。该载体编码潮霉素(hph或hpt)抗性基因表达盒。该潮霉素抗性基因表达盒包括含有来自花椰菜花叶病毒(CaMV)5'UTR的19S启动子(Cook and Penon Plant Molecular Biology 1990 14(3),391-405),随后是潮霉素磷酸转移酶(hph)基因(Kaster et al Nucleic Acids Research 1983 11(19),6895-6911)。hph基因被密码子优化,用于在双子叶植物中表达,并且侧翼是含有根癌土壤杆菌pTi15955开放阅读框1(ORF1)的转录终止子和聚腺苷酸化位点的3’UTR(Barker et al,Plant Molecular Biology 1983,2(6),335-50)。表达盒由商业基因合成供应商(GeneArt,Life Technologies,Regensberg,Germany)合成。侧翼FAD2A序列添加在该基因表达盒的上游和下游。将潮霉素抗性盒克隆在每个载体的特定限制酶位点中,产生“供体”载体:SEQ IDNO:87(图14)。
通过对从大肠杆菌过夜培养物纯化的DNA的限制性核酸内切酶消化,对组装好的质粒的菌落进行初始筛选。限制性核酸内切酶从NEW ENGLAND BIOLABSTM(NEB,Ipswich,MA)和PROMEGATM(Promega Corporation,WI)获得。质粒制备使用QIAPREP SPIN MINIPREPKITTM(Qiagen,Hilden,Germany)或PURE YIELD PLASMID MAXIPREP SYSTEMTM(PromegaCorporation,WI)按照供应商的使用说明进行。在通过对所得片段的琼脂糖凝胶电泳确认了限制性片段之后,使用ABI Sanger测序和BIG DYE TERMINATOR V3.1TM循环测序方案(Applied Biosystems,Life Technologies)对所选克隆的质粒DNA进行测序。序列数据的组装和分析使用SEQUENCHERTM软件(Gene Codes,Ann Arbor,MI)。
欧洲油菜的转化
PEG-介导的原生质体转染和靶向到FAD2a和FAD2a ZFN的ETIP(精确事件)的再生
叶肉来源的原生质体从欧洲油菜(DH10275)3周龄无菌芽培养物中分离。使相应的种子萌发。种子用70%乙醇表面灭菌1分钟,温柔震荡,随后在无菌双蒸水中漂洗3-4次,随后用20%漂白剂和10μl吐温20TM进行灭菌;种子在摇床(台式旋转摇床大约100RPM)上以用漂白剂处理15分钟,然后在无菌双蒸水中漂洗3-4次。将种子小心转移到无菌滤纸上,以除去多余的水分,并铺在种子萌发培养基上(1/2强度的MS/B5维生素+1%蔗糖+0.8%琼脂;pH5.8,每个PetriTM培养皿(15X 100mm)倾倒50-60ML培养基,用支撑物将平板以微小的角度放置)。每个平板上放置大约50粒种子。将平板在16h/d光照(20μmol m-2s-1)下的22℃直立温育6天。从6天龄幼苗切下0.5cm大小的下胚轴段,并培养在芽诱导培养基上(MS/B5维生素+3%蔗糖+500mg/L MES+BAP(13μm)+玉米素(5μm)+硝酸银(5mg/L)+0.8%琼脂(pH 5.8),倾倒到100x 20mm无菌PETRITM培养皿内),在每个平板上放置大约20个外植体。将3-4周后出现的芽分生组织转移到芽伸长培养基上(MS/B5维生素+2%蔗糖+500mg/L MES+BAP(2μm)+GA-3(0.1μm)+0.8%琼脂(pH 5.8),并倾倒在250mL培养容器中),在一轮亚培养期间,将培养物保持在这一培养基中达4周。然后,将2-3cm高的芽转移到发根培养基上(1/2强度MS/B5维生素+1%蔗糖+500mg/L MES+IBA(2.5μm)+0.6%琼脂(pH 5.8),并倾倒在700mL培养容器中),用于根系发育。将发根的芽亚培养在新鲜的发根培养基中,以3-4周间隔进行枝条扦插,经过2-3轮后使用。在整个期间,将培养物保持在22℃,16h/d光照(30μmol m-2s-1)。
原生质体的分离和纯化
体外生长的DH12075欧洲油菜植株用作分离叶肉原生质体的外植体源。使用锋利的手术刀将3-4周龄小植株的上面第3-第4片完全伸展的叶片切成小条(0.5-1mm)。酶消化如下实施:用25mL消化缓冲液(1.2%(w/v)纤维素酶"Onozuka"
Figure BDA0002137215980000861
和0.2%(w/v)
Figure BDA0002137215980000862
R10溶于K4培养基(Spangenberg et al.1998)中)处理250-500mg叶片材料。用ParafilmTM密封含有叶片材料和消化缓冲液的PETRITM培养皿,并在室温下黑暗温育12-15h。过夜温育后,通过
Figure BDA0002137215980000863
细胞过滤网(网眼尺寸为70μm)过滤消化物。将原生质体悬液(5-6mL)收集在14mL圆底管中,并用1mL清洗液W5缓冲液(154mM NaCl,125mM CaCl2,5mMKCl和5mM蔗糖;pH 5.8Menzel et al.1981)覆于上层,以400RPM离心10min。离心后,取出浮在中间相中的原生质体,并通过400RPM离心10min用10mL W5缓冲液进行清洗。最后一次清洗后,将分离的原生质体重悬,密度为每毫升W5缓冲1X 106个原生质体,并在转染之前温育1小时。
原生质体产量和活力的评估
原生质体产量用血细胞计数仪按照Sambrook and Russel,2006所述进行评估,活力用埃文斯蓝染色(400mg/L埃文斯蓝染料溶解于0.5M甘露醇中)按照Huang et al.1996所述方案进行测试,进行了很少的次要修改。
PEG 4000介导的稳定DNA投送
使用Pure Yield Plasmid Maxiprep SystemTM(Promega Corporation,WI)或Plasmid Maxi KitTM(Qiagen,Hilden)按照供应商的使用说明从大肠杆菌培养物中分离含有ETIP的载体pDAS000129和靶向FAD2A基因座的ZFN载体(pDAB104010)的质粒DNA。将质粒DNA以0.7μg/μL的密度溶解在无菌双蒸水中。向悬浮在100μl转化缓冲液(15mM MgCl2,0.1%(w/v)吗啉代乙磺酸(MES)和0.5M甘露醇;pH 5.8)中的100万个原生质体(活力≥95)施加总共30微克(30μg)质粒DNA(pDAS000129和pDAB104010摩尔比为5:1),随后是150μlPEG溶液(40%(w/v)PEG 4000溶于0.4M甘露醇和0.1M Ca(NO3)2(pH 6-7),Spangenbergand Potrykus(1995))。对照转化包括总共30微克(30μg)pDAS000129或pDAB104010的质粒DNA。在室温下温育10-15分钟后,以逐滴方式加入5ml W5缓冲液,轻轻混合原生质体,并将另外的5ml W5缓冲液缓慢流加到原生质体混悬液中。轻轻混合原生质体,并以400RPM离心10分钟,小心除去W5上清液,留下沉淀饼形式的原生质体。然后将被转染的原生质体在1mlW5缓冲液中在室温下进行温育,直至它们将包埋在珠子型培养物中。在转染后即刻,用构建体pDAS000129和pDAB104010共转染的原生质体样品显示了60-80%范围的细胞活力。按照seaplaque琼脂糖或海藻酸钠法包埋被转染的原生质体。
培养叶肉来源的原生质体以回收活的微愈伤组织(microcalli)
在包埋前,将被转染的原生质体以400RPM离心10min,并小心除去W5缓冲液。然后,将原生质体重悬在0.5ml K3培养基(Spangenberg et al.1998)中。将精确的0.5ml被转染原生质体混悬液(约5x 105个原生质体)置于6cm培养皿中,向其中添加4.5ml预热的(在微波炉中熔化,并在40-45℃水浴中温育)K3:H培养基(Spangenberg et al.1998)1:1混合物,其含有0.6%Sea PlaqueTM琼脂糖。轻轻混合琼脂糖和原生质体悬液,并使其凝固。凝固后(20-30min后),用
Figure BDA0002137215980000881
密封培养皿,并将原生质体在24℃黑暗培养24h,随后在连续的昏暗灯光下(5-10μmol m-2s-1)培养6天,其中发生第一次和多次细胞分裂。6天后,将包埋在琼脂糖内的原生质体切成四等份,并置于700ml培养容器内的100ml A培养基中(Spangenberg et al.1998)。液体A培养基补充了1.5mg/l潮霉素。培养物在连续昏暗灯光下在旋转摇床上以80-100RPM在24℃下进行温育。在Sea-plaque琼脂糖和藻酸钠法的情况下,抗性菌落分别于原生质体涂板后5-6周和3-4周后出现。通过轻柔破碎琼脂糖珠子,将大小为2-3mm直径的微愈伤组织转移到B1培养基上(MS/MS维生素+3.5%蔗糖+500mg/L MES+BAP(5μm)+NAA(5μm)+2,4-D(5μm)+1.5mg/L潮霉素+0.7%I型琼脂糖(pH 6.0),并倾倒在100x 20mm无菌培养皿中)。将这样获得的微愈伤组织重悬在足够量的液体A中(50ml液体A用于1毫升沉降细胞体积(SCV:这是在将全部释放的愈伤组织转移到50或15ml falcon管中并使之沉降5min之后测量的)。在将微愈伤组织均匀混合后,将0.5ml悬浮在液体A中的微愈伤组织转移到B1平板上,并使用1-2ml额外的液体A培养基将微愈伤组织均匀分布在B培养基中,并从每个平板小心除去多余的液体A。平板用微孔带密封,其可增强胚成熟。
海藻酸钠法
在包埋前,将被转染的原生质体以400RPM离心10min,并小心除去W5缓冲液。然后,将原生质体重悬在1.0ml 0.5M甘露醇中,并在冰上温育。向其添加等体积的1.0%海藻酸钠,并轻轻混合。将原生质体悬液在冰上温育,直至其被包埋。用血清吸管将成珠溶液(0.4M甘露醇+50mM CaCl2(pH 5.8))转移到无菌的6孔板中(每孔3-4mL)。使用1mL移液管将精确的1.0mL原生质体悬液逐滴添加到成珠溶液中,并且每个孔包埋每一个被转染样品(大约5x105个原生质体)。原生质体悬液在室温下温育1-2小时以形成海藻酸钠珠子。温育期之后,小心除去成珠溶液,并更换为补充有1.5mg/L潮霉素的4-5mL K3+H:A培养基(Spangenberget al.1998)的1:2混合物。将原生质体在摇床上(50RPM)22℃黑暗培养3-4周。3-4周后,用解聚缓冲液(0.3M甘露醇+20mM柠檬酸钠(pH 5.8))处理来释放抗性的微愈伤组织(0.5-1.0mm)。除去液体培养基之后,向含有珠子型培养物的每个孔添加3-4mL解聚缓冲液,并在室温下温育2小时。使用无菌镊子轻轻混合珠子,以提高微愈伤组织的高效释放。使用无菌的1.0mL移液管轻轻混合并除去在解聚缓冲液中释放的胶凝剂(gelling agent)。微愈伤组织用5mL液体A培养基清洗2次,并将微愈伤组织重悬浮在足量的液体A中(50mL液体A用于1毫升沉降细胞体积(SCV:这是在将全部释放的愈伤组织转移到50或15mL falcon管中并使之沉降5min之后测量的)。在将微愈伤组织均匀混合后,将0.5mL悬浮在液体A培养基中的微愈伤组织转移到B1培养基(MS/MS维生素+3.5%蔗糖+500mg/L MES+BAP(5μm)+NAA(5μm)+2,4-D(5μm)+1.5mg/L潮霉素+0.7%I型琼脂糖(pH 6.0),并倾倒在100x 20mm无菌Petri培养皿中),并使用1-2mL额外的液体A培养基将微愈伤组织均匀分布在B1培养基中,并从每个平板小心除去多余的液体A培养基。平板用微孔胶带密封,其可增强胚成熟。将培养物保持在22℃,16h/d光照(30μmol m-2s-1)。
从叶肉原生质体分离基因组DNA
将被转染的原生质体从3cm PETRITM皿转移到2mL微离心管中。通过70g离心沉淀细胞,并除去上清液。为了最大限度回收被转染的原生质体,PETRITM皿用1mL清洗缓冲液漂洗3次。每次漂洗将PETRITM皿中的清洗缓冲液涡旋1分钟,随后将液体转移到相同的2mL微离心管中。在每次漂洗结束时,通过70g离心沉淀细胞,并除去上清液。将沉淀的原生质体在液氮中速冻,随后在Labconco Freezone
Figure BDA0002137215980000891
(Labconco,Kansas City,MO)中在-40℃和133x10-3mBar压力下进行冷冻干燥24h。使用
Figure BDA0002137215980000892
植物DNA微量提取试剂盒(Qiagen)按照制造商的说明对冻干细胞进行DNA提取,只是不要求组织破坏而是将原生质体细胞直接加入到裂解缓冲液中。
从愈伤组织分离基因组DNA
将单个愈伤组织在液氮中速冻,随后在Labconco Freezone
Figure BDA0002137215980000894
(Labconco,Kansas City,MO)中在-40℃和133x 10-3mBar压力下进行冷冻干燥24h。使用
Figure BDA0002137215980000893
植物DNA微量提取试剂盒(Qiagen,Hilden,Germany)按照制造商的说明对冻干的愈伤组织进行DNA提取。
在繁殖的愈伤组织中检测通过同源性介导的修复添加到FAD2A的基因
从原生质体池(每个池含有100万个原生质体)提取基因组DNA,其中在24小时前已经向原生质体池投送了编码功能性HGH报告盒(pDAS000129)的供体DNA,ZFN DNA(pDAB104010),或供体和ZFN DNA的混合物。用于转化的DNA投送量如上文所述。将PCR产物克隆到质粒载体中。在每个细胞中独立发生基因组编辑,产生若干不同的插入事件,通过克隆到质粒载体中,可以对每个基因组编辑进行无歧义的测序。在
Figure BDA0002137215980000902
自动毛细管电泳平台上对几个克隆进行了测序。基因序列分析使用SEQUENCHER SOFTWARE V5.0TM(GeneCodes,Ann Arbor,MI)完成。
使用表13所述的引物从提取自原生质体的基因组DNA中同时扩增出5'和3'FAD2A盒和接点提供了通过同源性介导的修复添加基因到FAD2A基因座中的证据。从单独投送了ZFN质粒或供体质粒的原生质体中没有观察到扩增。所有接点序列均可指示hgh盒通过HDR介导的修复途径插入到Fad2A基因座处。观察到了基因组和盒子中任一个或两个的各种长度的缺失,以及来自载体骨架(或是来自供体,或是来自ZFN)的额外序列被插入在基因组和盒子之间(图15)。
表13:用于FAD2A基因座内供体整合的构建体的列表
Figure BDA0002137215980000901
实施例9:通过非同源末端连接实现欧洲油菜Ω-3脂肪酸去饱和酶(FAD2)的靶向整合和破坏
特异针对FAD2A的锌指结合结构域的选择
鉴定并表征了同源FAD2基因的被转录区域,设计结合并剪切这些位点的锌指核酸酶,用于供体序列的NHEJ介导的靶向。如上所述地设计导向针对来自FAD2序列同源物的DNA序列的锌指蛋白(ZFN),并进行测试。从显示中靶(on-target)活性的ZFN中,选择一个可高效切割FAD2靶标的锌指蛋白:ZFP 24828-2A-24829识别SEQ ID NO:355’-agGCCCAGtAGAGAGGCCaggcgaagta-3’和SEQ ID NO:365’-ccAGGGCTGCGTCCTAACCGgcgtctgg-3’。这个ZFN显示可特异性结合并剪切FAD2A基因组基因座。构建了在前文中有描述的质粒构建体pDAB104010,并用于转化实验。
设计和构建编码锌指核酸酶的表达载体和特异针对FAD2A的供体载体
为了通过NHEJ整合供体序列,构建了单个供体载体。该载体编码yige dsRED报告基因表达盒。该dsRED报告基因表达盒包括拟南芥泛素10启动子(Callis,et al.,1990,J.Biol.Chem.,265:12486-12493),随后是dsRED基因(Dietrich et al.(2002)Biotechniques 2(2):286-293)。dsRED基因被密码子优化用于在双子叶植物中表达,并且侧翼是含有根癌土壤杆菌pTi15955开放阅读框23(ORF23)的转录终止子和聚腺苷酸化位点的3’UTR(Barker et al,Plant Molecular Biology 1983,2(6),335-50)。可选择标记盒包括与pat转基因融合的CsVMV启动子。pat转基因终止于根癌土壤杆菌pTi15955开放阅读框1(ORF1)(Barker et al,Plant Molecular Biology 1983,2(6),335-50)。dsRED抗性盒被克隆到每个载体的特异限制酶位点,产生“供体”载体:pDAS000097(SEQ ID NO:88,图16)。pDAS00097供体被设计为作为线性DNA或环状DNA投送到植物细胞中,并在ZFN pDAB104010剪切FAD2A基因座时整合在FAD2A基因座内。线性DNA介导的整合是线性化pDAS000097质粒在转化过程中整合到植物细胞中的结果。该质粒可以通过独特限制位点处的剪切被线性化。环状DNA介导的整合是环化PDA000097质粒在转化过程中整合到植物细胞中的结果。pDAS000097被修饰成含有能够被ZFP24828-2A-24829锌指核酸酶切割的锌指结合位点。环状质粒pDAS000097在植物细胞中被pDAB104010编码的锌指核酸酶切割,并且dsRED基因盒被整合到FAD2A基因组基因座中。
通过对从大肠杆菌过夜培养物纯化的DNA的限制性核酸内切酶消化,对组装质粒的菌落进行初始筛选。限制性核酸内切酶从NEW ENGLAND BIOLABSTM(NEB,Ipswich,MA)和PROMEGATM(Promega Corporation,WI)获得。质粒制备使用QIAPREP SPIN MINIPREP KITTM(Qiagen,Hilden,Germany)或PURE YIELD PLASMID MAXIPREP SYSTEMTM(PromegaCorporation,WI)按照供应商的使用说明实施。在通过对所得片段的琼脂糖凝胶电泳确认了限制性片段之后,使用ABI Sanger测序和BIG DYE TERMINATOR V3.1TM周期测序方案(Applied Biosystems,Life Technologies)对所选克隆的质粒DNA进行测序。序列数据的组装和分析使用SEQUENCHERTM软件(Gene Codes,Ann Arbor,MI)。
欧洲油菜的转化
如上所述地从欧洲油菜(DH10275)植株分离和制备叶肉来源的原生质体。原生质体用纯合的质粒DNA转染。等份的供体和ZFN质粒DNA制备成三个摩尔比:1:1(30μg每种质粒),5:1(供体质粒与ZFN质粒,总共30μg质粒DNA)和10:1(供体质粒与ZFN质粒,总共30μg质粒DNA)。此外,制备仅有供体和仅有ZFN的等份(30μg)作为对照。表14总结了通过PEG4000介导的转化被投送到欧洲油菜原生质体中的DNA的量。被转化的原生质体细胞被如前所述地培养,其中选择培养基是草铵膦选择培养基,对推定的转化子通过qPCR分析测定转基因插入。
表14:投送到原生质体的ZFN和供体DNA的量
Figure BDA0002137215980000921
Figure BDA0002137215980000931
在原生质体中检测通过非同源末端连接添加到FAD2A的基因
从原生质体池(每个池含有100万个原生质体)提取基因组DNA,其中在24小时前已经向原生质体池投送了编码功能性dsRFP报告盒(pDAS000097)的供体DNA,ZFN DNA(pDAB104010),或供体与ZFN DNA的混合物。用于转化的DNA投送量如上文所述。将PCR产物克隆到质粒载体中。在每个细胞中独立发生基因组编辑,产生若干不同的插入事件,通过克隆到质粒载体中,可以对每个基因组编码进行无歧义测序。就几个克隆在
Figure BDA0002137215980000932
自动毛细管电泳平台上被测序。基因序列分析使用SEQUENCHER SOFTWARE V5.0TM(GeneCodes,Ann Arbor,MI)完成。
从提取自原生质体的基因组DNA中扩增出5'和3'FAD2A-盒接点二者,提供了基因通过编辑或剪切被添加到FAD2A基因座中的证据。从单独投送了ZFN质粒或供体质粒的原生质体中没有观察到扩增。所有接点序列均可指示dsRED盒通过NHEJ介导的修复途径插入到FAD2A基因座处。观察到基因组和盒子中任一个或两个的各种长度的缺失,以及来自载体骨架(来自供体或ZFN)的序列被添加插入到基因组和盒子之间。
在从原生质体再生的愈伤组织中检测通过非同源末端连接添加到FAD2A的基因
从自接受选择的原生质体再生的愈伤组织获得了FAD2A基因座被剪切和编辑的进一步的证据,其中向原生质体中投送了编码dsRED盒的供体DNA(pDAS000097),仅ZFN DNA(pDAB104010),或供体和ZFN DNA。对于每个比例,从大约80个愈伤组织中提取了DNA。
通过TAQMANTMqPCR使用特异针对供体插入物和基因组侧翼序列的引物和探针确认了dsRED盒被整合到欧洲油菜基因组中。相对定量的计算是根据2-ΔΔCt方法(Livak andSchmittgen,2001),其估算被插入到基因组中的dsRED盒的拷贝数。通过用一个特异针对FAD2A的引物和特异针对dsRED盒的启动子或终止子的第二引物进行PCR测定,获得了FAD2A被NHEJ介导的剪切和编辑的证据。PCR产物用QIAQUICK MINIELUTE PCR PURIFICATIONKITTM(Qiagen)进行凝胶纯化,并用直接Sanger测序方法进行测序。测序产物用乙醇、乙酸钠和EDTA按照
Figure BDA0002137215980000941
v3.1方案(Applied Biosystems)进行纯化,并如上所述地进行测序和分析。
确定了每个实验中含有供体盒的愈伤组织的数目。通过跨越ZFN切割位点和5'和3'FAD2A-dsRED盒接点的PCR扩增,提供了供体基因通过编辑和/或剪切添加到FAD2A基因座的证据。对从仅用dsRED质粒(pDAS000097)或仅用ZFN质粒(pDAB104010)转化的对照原生质体回收的愈伤组织中分离的基因组DNA进行PCR扩增,没有产生PCR扩增产物。
从琼脂糖凝胶纯化从5'和3'FAD2A-dsRED盒接点扩增产生的PCR扩增子,并测序以确认FAD2A基因组基因座内的整合特异性。PCR产物测序分析结果表明,从各个被转化原生质体产生的每个分离愈伤组织仅产生了单一PCR扩增产物,不含有具有混合基因型的细胞。
植物中通过非同源末端连接添加到FAD2A的基因的检测
从自原生质体再生并转移到盆栽培养基(potting medium)中的植株提取DNA。估计所回收的大部分植株仅含有供体DNA编码的dsRED盒的1-2个拷贝。使用与愈伤组织所述相同序列的测定对植株进行分析,并通过测定确定盒子是否已经插入在FAD2A基因座中。
使用上述的PCR测定确定中靶剪接(其中dsRED盒被插入在FAD2A基因座中)的频率。对所得扩增子条带进行测序,以确定侧翼序列。此外,筛选植株的脱靶插入,以确定dsRED盒整合在FAD2A之外的位点处的频率。
实施例10:欧洲油菜Ω-3脂肪酸去饱和酶(FAD2)和农艺学重要基因的靶向整合
设计并构建含有赋予对除草剂草甘膦的抗性的DGT-28转基因的构建体(国际专利申请No.WO/2013/116700,本文引用其内容作为参考)用于整合在欧洲油菜的FAD2A基因组基因座中。示例性供体构建体包括pDAS000389(图17,SEQ ID NO:89),用于NHEJ整合在FAD2A基因座内,pDAS000391(图18,SEQ ID NO:90),用于NHEJ整合在FAD2A基因座内,pDAS000392(图19,SEQ ID NO:91),用于NHEJ整合在FAD2A基因座内,pDAS000393(图20,SEQID NO:92),用于NHEJ整合在FAD2A基因座内,pDAS000394(图21,SEQ ID NO:93),用于HDR整合在FAD2A基因座的ETIP位点内,pDAS000395(图22,SEQ ID NO:208),用于HDR整合在FAD2A基因座内,pDAS000396(图23,SEQ ID NO:209),用于HDR整合在FAD2A基因座内,和pDAS000397(图24,SEQ ID NO:210),用于HDR整合在FAD2A基因座内。如上所述地,将构建体和相关锌指核酸酶构建体(例如,pDAB104010)转化到欧洲油菜细胞中。通过如前文所述的分子确认测定对转化子进行鉴定和确认。分离包含被整合dgt-28转基因的FAD2A染色体整合子。dgt-28转基因整合在FAD2A基因座内的实例是通过NHEJ介导的整合和HDR介导的整合。整合在FAD2A基因座内可以被导向到FAD2A内源序列中,或者导向到先前所述的、被稳定整合在FAD2A基因座内的ETIP(pDAS000130)中。通过NHEJ介导的机制整合在FAD2A基因座内,能够使用线性化供体或环状供体DNA设计实现。获得被转化的DGT-28欧洲油菜事件,并测试DGT-28的强表达和因此导致的对除草剂草甘膦的抗性。
尽管本文描述了某些示例性实施方案,但是本领域普通技术人员将认识并意识到,可以在不背离下述权利要求的范围下对示例性实施方案进行许多添加、缺失和修改。此外,来自一个实施方案的特征可以和另一个实施方案的特征相结合。
序列表
<110>美国陶氏益农公司
   桑格摩生物科学股份有限公司
<120> FAD2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
<130> 8326-4010.40
<140> PCT/US2013/058283
<141> 2013-09-05
<150> 61/697,886
<151> 2012-09-07
<160> 480
<170> PatentIn version 3.5
<210> 1
<211> 47493
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 1
ttcccaaaca acacaataag ttattgtcaa taactaatct tatgtccaaa gaatataaaa 60
cattaggtcc agtcttttta ataacttttt atttatattt tttaaattat ttgatttaaa 120
tccactcaaa taatttatac gaagttgaaa ataactataa ctatttttgc gggtttagat 180
actacagaaa agcatttaac ttgaaattaa ttaaattaaa attttatttt gtttgtattt 240
tcagaaataa aaaatcgaat tccttttaac ttaataaata ttagattgtt ctttgtaaat 300
tatttttatt aattcataag aacatattat tatatatgct atattatgct tggtttaagt 360
taaaattaaa tagttttata gaaataaaat gttagaatca ataaattaac atcaaataag 420
ttttataatt aaaattttat caaataagca tatattaaaa atttaatcca acaaattaaa 480
gatgttttct taaaacctcg taatgataca ggttgaagta attaaaaaaa aattaagtaa 540
tattttagat aattttcctc tttaataaaa taatttatta tgtatgttta aatacactaa 600
aataaaaatg ttaaaacatt acttatataa taatgttaaa atatattgat attataaatt 660
agattttttt ttaaagatat tttcgcacat ttaatcgtgg gttatagtct agtatatttt 720
aaaacctaac tattaaatgc tgaattttat gaagttataa cataaagtga ttaatgaaca 780
aacgtcttat caattaatta tgcttccgca aagcatcatg ttcattgccc tataaaatca 840
tctctcgttc actgatacca atcaaacatc aaccaatatc aaaaactaaa gcaaatatgg 900
caaagtctct ttacattgca atgtttgtat ctatagtaat gttcttcatg gcaaattcaa 960
tttcttccaa ggaaattggt caatattcac aagaggcacc aggagatgta aagatatctc 1020
ccacatcgga ttttgatatt tacgtcgaat ctcccgatga atctctattt gaagaagtcg 1080
attcacccgc aatggaatat gagatgaagt ctggacatca ttacacacac aaacaacttg 1140
gttttcttga ggcttgcttt caaaatctaa actcattaga ctgtggagat aatattttca 1200
agaacatgtt agatgaggca gcacaagtat tatcaaatga atgttgtcat gatctattaa 1260
agattagcaa agattgttac ctaggaatga ctcaaagcat tttatcgagt tatgagtata 1320
gatttattgc gtctaaggct attcccaaaa gtaaacagac atggaatgat tgtgttctta 1380
gagttgggaa cctgattggt agcccaatcg cttttgagga actacactaa ttgatgttcc 1440
ggtgtgctga tgttttatat atgtgatttt gtaactcagg cgttatgaga cttaccatta 1500
tataaataaa gctaaagatc ttttacagat cttatattag tatacgagac tcattagagt 1560
aacatgaaag ctgaatcaac tatcaacatt ggtggtattt gtctttaggt ttctttaatg 1620
gatatagatg tttggggaca acgctagcag ctcttagtaa ttccgcatat ttatggacta 1680
tgagctcttc gctctaaatt acacaatccg acccaccatt tcagatatca atactcgcaa 1740
acccagtaga gttacagtct ctattgtact tctccttgca ttccttcagc ctgattctct 1800
tatccacaat ggttatactt gtctctgaca acgatcatgt tcctcaagag caaaaaacca 1860
tctaggtctc cgcagctcag tggcgagcct ctcacacaac cattgaacac atctaccaaa 1920
gcaaatgacg tggcattctt gggaatgaaa cctttgatac agttacatgt cagtatcgtg 1980
ctaatgttat agtaaacatt ttattatcat atttttaata ctaatgaggc atgatttgat 2040
tttaatttgc atattttatc tcttaatcct ggattatata tagttttcag cagacaagaa 2100
aatgttattt ccacattcta tgacttgttt ttagactttc atcaattcat tacaacatat 2160
tattgttatt agtcgataac tttgacttaa ccacgtgaat tttatcccaa aaaaaactta 2220
accacctaaa atctaatttt ttttataaag aaattagttt ttgatccgcg ttttgcagat 2280
ttatttttca tttttatatg tttatatctt tgagaatgcc atgaaattga ccgtgtgttt 2340
ctattgtgtt tagtttttgg tctttctaat ttttgagatt attttttctt taaacgatgc 2400
ccgggttatt attaatttta tttgataaat taaacattga aatataatta gaattcgaag 2460
tatactttta ggttttatca gttttaaaga tggtcatttg atttgaaatt tgtataaaaa 2520
ttccaacttt tattttggaa tttttaaaag aaatatatgt ttactgatgt gtggtatatt 2580
ttaataagat aaatatatta atataatatg gcatagtatt atgtagataa ttaaaattta 2640
tatttacaat tatgtaatat aaaactatag atattattga aaactataat atttgttgta 2700
atatgaatta gtttaaatta tgtacaacta tctgtgcaaa attacgtagt ttgtaaatgt 2760
gtatatgtga taaaactata ataatacata ctatatttta actaatattg gtttatatat 2820
ctaatatatt taattgtgta tttcatatta atcaaaaata taaaagattt aaattagaca 2880
gaaaccgttc aaaaataaat atagtttttc atttgacccg caatttcaaa atgcgagatg 2940
ttttataaat aattaacata atctttaatt ttggaaatga tatatgtttt tgaattattt 3000
tacgtttttt atattaccat taacatttat tttaaatttt aaatgagaaa tgattttgta 3060
attgtaacta aaatttatat aaatgtaact tatgaaaatt aaaaaaaatg taaccaggat 3120
aattaccaaa aatagcattt tgaatatacc acttttcact tctactttat tcaactttgc 3180
cattaaactt ttaattggca aatgactatt atatccctaa ttaattgaac ctaaactatt 3240
caattagata ggttatatat tcttcctcca tgtgagatcc ggcgagctcc ggcaaaggac 3300
gatgattgga gattattggg gatactgtga acaagaacga ggaacatatc tggaaatatg 3360
taaatgggaa gagatttcta cacagattag attaatgaac atgatatcag attcattgac 3420
atcttgtact gattccaatt ttgtctcgtg cttgttattc ctggctttta atgttttggt 3480
gttgatgtat ctgatagagc aagtggaaag aggagctgga acaagcggaa agaccgagaa 3540
aataaaagta accaataaac atggacacgt taaggaagaa actgactcca atgattcaga 3600
gttttggatg cttaagtcaa gttttggttc agagtcagag taggagagtg atgaagaaaa 3660
ctgcaaaggt acctcttttt ggtgtttttt gttggttcta ctttcatctt tctatcgaaa 3720
cttaaactag atttgtgtct gatcttggta caggttctca ttgtgatgcc agataatatg 3780
aggagctctc agaaaggtaa aggtaaatgt atacatttac tcttatttct gtgtatttct 3840
tacaaaattg cggattggtt ttgatgttca cctctagttg ttttgtctct tctacagagc 3900
aaagaggatg tcaatagaga ttggaccaag tatgatcatt acggcagcgc cactatgatc 3960
atgaggcagt ctttggaaga gcagatgagt tctgttacgg agaagagtgc taagtatgct 4020
cagattgctg ctgaggaagt gcccaagagt ctttactgcc ttggtgttcg tctcactact 4080
gagtgatttc agaactcgag ttttagggga agctcgcgga gagaatctat gttgtggctt 4140
ctaagctcac cgataacagt ctttaccatg tctatgtgtt ttctaataac attgttgcta 4200
cttcggttgt ggttaactcc actgctctca aatccaaggc ccctgagaaa ttcgtccttc 4260
atcttgtcac taatgcgatg aagtcatggt ttgctatgaa tatgaacttc ttaattgatt 4320
ccggcttggt tgattcagta tgtggaaatt gcaggtgacg agtgtgcaat cttcgctgtt 4380
tttagaagca gcatttgcgt caaatgatat gcagcatttg gctgcaatgt taagggtctt 4440
gtcggaattg attccaggat tcaaagaaac taccgagtat tacacattct aaggtcttct 4500
taatgagacc agttccccag ttgctgtctg agatttaaca tctcttacct tatttatgtt 4560
caataactta gataataaga aatttcgttg ataatatttc aatttatgta tgtttcattc 4620
aaagaaaaca atgattagtt ttctcaaatc agtcttctta tttgtttgag ttaagatctt 4680
ccaaacttat gtttttttgt aattcaggag taacaaaatg aatatagtct aaatctggat 4740
ctaattttga aattttttta actggatttt ctttcaaatt aaatccttat ttactcttta 4800
agaatttttt taaaagttta ggtttgacat ctctaaccta tacgttgcga acttggacaa 4860
aaccaaaaca agattaagca ttgttttcag aatatttaat ttttaatttt gttgggtttg 4920
atttggatct ttccagtgta catatgttta aacaccatcc tcttcaaaac ggttgtttaa 4980
gtgttcattt ttgggtaggt ccaagacgtg actgggacaa ttcaaagcgc tagttatctc 5040
cgtaacacat catatttccc cttacattaa gataaagtat actcgtgaat ctcaattgga 5100
tgcaataaat aaaaacaaaa tcccttccca tcaaggcatc aaactgccaa agtcaattct 5160
agaaaaatat taaaaactat tcttttttta ttttatttta gagacttctc ttccttttta 5220
ttctgtagga agaaaaaaca aaaaaagaag aagaagagga gaatcgtctc tttctttctc 5280
ttagaccatc tacaatgcta cgctaaaatt tactctatat ttcactctaa aatagagtaa 5340
ctctattata gagtgaaata tagagtaaat tttagtgttg cattggagat gcccttaact 5400
gtatccgtga aggcaaaaag atacgtataa acaaatacat ttacacataa atatgtatat 5460
gtatgtattt atactcttct agctctctct ctctcacctg tacctttaat atggtgtttc 5520
tgtttacgag aaaccaaacc cacaccaatt gaaaacgcga cttgttgtta ttcaatcgca 5580
atcaacgagt aatctgctac ctcgtctcct ctctgagatc tctcttcctc ccattagatt 5640
cgcctgagga ggtactcatt cttattcctt ttttctctgt ctttttatgg aattttctaa 5700
aaatgctgta aggtttcaga catatccggt aataactgga ctctgaacta atgacttgtt 5760
caagtgttcc agctcttatt acatagtacc gatttggatt gtgttttttt ttttgtttga 5820
ccttcttgca attgtgatgc tctgatttgt tttcacgttc gtagcttatg ctttaatttt 5880
tttttgtcat ttatcttctt ttccccctaa tttttttttg tttaattgca aacctttttg 5940
tgtgtgcttc ggcatgaact taggggccct actactggcg taagtttagg cttctttttt 6000
ggtgcttttt tagctttact gcttgttggt ggaattcact tttcttttta agttaatttc 6060
agagacatcc ttattgtaac tgctcacttt tcagtgttgt tagtttaagg aatgatgaaa 6120
gaaagaaagc tttctataac tgcttgattt agcttcagtt gttagtaata tgggttagaa 6180
ctgttagcct tgagtagata tcactgtctt tattttttgg tttattgttg atttattttt 6240
gtggtcttgt tttgattcag tgttctcgag gttttgactt cgacttgtga tgatggcatc 6300
atctaaacaa ggatcaaagt cgagaaaaac agggtttagc aatttcaagg gtgctgattc 6360
tactgcttcc tcaacaacct cttcttcaaa gctttatcaa gagacatcta tcgatgatgg 6420
acatagctct cctgcttctt catctgctca aagcaagcag cacttcttct caccggactc 6480
cgcaccgcaa agtgctcagc gttctaaaga gaacgtcaca gtgacagttc gctttcgtcc 6540
actcaggttc acagtgatgt gcttttttat tagggcttgc aaatattagg ttgcctgttt 6600
gttctgtgaa tttgaaataa cttttccgtg acagtccaag ggaaatccgc caaggggagg 6660
aggttgcttg gtatgcagat ggcgaaacaa tcgtacggaa tgagtataat ccgacgatag 6720
cttatgcata tggttagtct taatagtttc attaatgtca cagtggttcc ataatcatct 6780
taaatattgt atgtcggcat atcactcgag aataacaaac taaggatgat agtgttgttc 6840
ttatgtggta taatcttcct tttttgatgt ctgggtctct atgtctgtta acgattggtt 6900
ctctttatga cagatcgtgt ctttggacct acaaccacaa cacgcaatgt ctacgatgtt 6960
gctgcacacc atgttgttaa tggggctatg gaggggatta acggtatgaa gtgaccatat 7020
ttaatggcag tctattttgt atttagaact caatttatga tatcaactct tttatcgaaa 7080
agcatacttt cttccaaact ctatcaacaa ggctgactgt tcctaattta tgatgaattc 7140
gtcagaacca attttgactt tcgatgtact taccagttga tttgtatata actttgaatg 7200
ttaatccatc tacagggacc atttttgcat atggagtgac aagcagtgga aagactcaca 7260
ctatgcatgt aagatacctt catctggata gcttttggct tgttttgtac gatgtagttc 7320
aatttgtcat aaagatatag tgctttgtca gagaatcatg tatttctttt aatttcaact 7380
ccacaagctt aactaacaca tgtaagaatc tttctgcaat agttatagat aaacaacctt 7440
gcgatagata agttttctac cctaatactg ttaggtttct gtgcacccta ctgttgaaac 7500
catatctgat agatttcgat tgggtttttt tttgggttca aatgtcaggg tgaccagaga 7560
tctcctggta ttataccatt agcagtgaaa gatgctttca gcattatcca agaggtactt 7620
cttaggatat tgattttgtc agattccgtg gcctaagtac tagcaacctc acatatctat 7680
tttcttacag acaccaagcc gagaatttct cctgcgtatt tcctacatgg aaatttataa 7740
tgaggtgcta ttatttatcc actttctttc tctgctccat tacctatatt cagcttcaag 7800
agtagtggag tgatagaata ctctgccttt aaaatcttcc tttgagatta attcccttaa 7860
gatccaccgt atttcaggtt gtcaatgatt tattgaatcc agcaggacat aatttgagga 7920
tcagagaaga taaacaggta tgtgtttcag cttcagatca tcttttgatt acacgggctg 7980
ctgctctcac ttacttgtaa tattttcttt tattacattg ctcgtctaaa atcccaaaat 8040
gtttacatca tattcttaaa ttagtaggaa cccatgtcta ggcttgtttg gtacctgaaa 8100
actatactgg ttccattttt ttcttgtgaa atttgatctc tctgagaact ctgctgttac 8160
aatgatgata tgtgggtcac attgctttca agcagacttg tagatgatcg ctatgagttc 8220
ttttcttcca tgtgttttaa ttgaacgcat ccttttaatt tattctaggg aacctttgtc 8280
gaagggatta aagaagaagt tgttttatca cctgctcatg cgctttctct tatagcagct 8340
ggagaaggta tgtggtgctt ccacttttcc ctttagctaa agaaataggt ttactataca 8400
tcctcataac gccagcaaag actgttgcag tcattgtaca tttgttaaag atattgtcat 8460
caggaaagtg gttctcctct acctgcttgg ggctgtacaa aacgttaaaa attgtgtttg 8520
ttttttcttt tatttaatat gagagagtag ttctctctct ctcatgattc cagtatacat 8580
atatcatcct taaaatttgt catgatctag taaatttaca tttaattcaa ttcacattga 8640
ttggagtttt gtccttatga cagagcaacg ccatgttgga tccacgaact ataatctgct 8700
cagcagccgg agccatacaa tatttacgtt ggtatgtaaa tactctcttt gaaatattgg 8760
tagctatatc ctttttcttt ctccgcacgt atatacactt gtattgtgga tggatgcacg 8820
caaaaccaac gttcttttct attactataa ttggttaaaa ggtaaaaatg atagtttttt 8880
gtcttataat cacgatagta tttgaaaata gaataccgaa attctatttc ttattcagaa 8940
taagttgtgg accacgttct tcttttcacg tgttttcttc cgttcaagga atttctgttt 9000
gtcttttatt ctaattctag ttgtttagtc gtgtcaagtg ttccaccggt tatggtacta 9060
ctttcttttc attgtaactc atatagctgt accgtttcta aaagatgata aactcatttg 9120
gatgcagaca atagagagta gtcccttagg caacaagatt aaaggtgaag ctgttcacct 9180
ctctcagctg gtaagcttct cctgtgccag tgatattatg tatggttatg atcaacactt 9240
tcttcaacac taagagcaac tgacattaac tacccataat ctcttccgca cccgcagaac 9300
ctcgttgatc tggcaggttc cgagagttca aaggttgaaa ccagtggttt aagacgcaag 9360
gaaggatcat acataaataa aagtttgctg acattaggca ctgtgagttt tttcttacca 9420
cagttttctc ttagtcaaca ataagttttg gagtcagtta aatcgaagga cttcattttc 9480
ttttaaatcc ggtcaatctg tgcttgtcca aacctaaagt taaatagttg tctattcttg 9540
tttatattct ggtcctgttt gaacattctc ctgttggctc aattcaggta attctgttgt 9600
gatattgtag gtgatatcaa agctcacgga tgtgaaggct tcgcatgtac catacagaga 9660
ctctaagtta accaggatcc ttcagtcctc attgagtggc catgaccgag tatctgtaag 9720
ttattagatc ttttctccat cctcttgcta ctataaatat aaaatccaca acatgatcat 9780
cagcagagtg atgtacttta ctgattagtt gtcccttctg gatatggtag ctcatttgta 9840
cagtgactcc tgcatcaagc agctcggaag aaacacacaa cacattgaaa tttgctcatc 9900
gtgcaaaaca tattgagatt caagccgaac aaaacaaggt ttgcctcata tcttcttcta 9960
tcagacctta ttttattgta ctaaagttct tgcttggttt ctaaatctat attactgcag 10020
atacttgatg agaaatcatt aatcaagaag taccaacacg agattcggca gctgaaggag 10080
gagttggaac agattaaaca ggacattgta ccaattcctc agctgaatga tattggcaca 10140
gatgatatcg ttctcctgaa acagaaggta tgagttatat gctcgattag acaagtggaa 10200
ggatgttttg tgtctttaca ttgagagaat ctgtagtaac cttgtctttt tttttgtttc 10260
tggctatata acgtgatgat attagctaga agatggtcaa gtgaaactgc aatccagact 10320
cgaagaagag gaagaagcta aagcagctct attgagtcga atccaacggt tgacgaaatt 10380
aattttggtg tcgactaaaa cttcacaaac atctcgatta cctcatcgct ttgagcctcg 10440
gaggagacat tcatttgggg aagaagaggt agaatcactg attatagcct tgatattata 10500
aattgtttcc atggtcgttt ctgagaatat tttgctggag caagtacaca aaattgctag 10560
ttttgtttgg ctaatcttgg ttgataatat gcgtgtgcag cttgcttacc taccatacaa 10620
gaggcgggac atgatggacg atgagcacct tgatctgtat gtctctgcgg agggaaataa 10680
tgagattaga gatattgcgt ttagagaaga aaagaagacc aggaagcatg gattgttaaa 10740
ctggttaaag cctaaggtat gcaaacgatt gaattttctt attagcactg tggtttattc 10800
tggttcgttt cagaactgca cctagcaact ataggtttgt actattgcgc actatagatt 10860
tatagagttc tcatgttctt caaagaacaa tgatataagt aaagagtgct aatcatatga 10920
ccttgtgtgc ttatttgatt atttggtgcc tctcttgtcc ccttttttgt aacaatctta 10980
tttttctcct atcagaaaag agataacagt tcaagtgcca gcgaccagtc gagtgtggta 11040
aaatccaaca gcacaccatc gactcctcaa ggaggaggaa ataatctgca tgcagagtca 11100
agattttcag aaggatcgcc tttgatggaa caattctcag agcctaagga agacagagaa 11160
gctctagagg acacttccca tgaaatggag acgccagagg tacgaagaga cattttcaca 11220
tatgttatgg ttccaaagta actacatctt tatcttttcc acttcctgcc ctgttcccag 11280
actagcaata aagtgatcga tgagttggat cttctgaggg aacagaaaaa gattttatct 11340
gaggaggcgg cgttgcaatc aagttcatta aaacggctat tagatgaagc tgcaaagtct 11400
cctgaaaatg aagagattaa agtaatataa ccacttggtt catgatttgt atctagcttc 11460
cgtttaaatc taccaaacat tcactttcct ggttatctgt gttacttagg aggagatcaa 11520
agtcctcaat gatgacatca aggctaagaa tgacgagatt gcaacgttgg agaaacaaat 11580
cttggacttt gttatcacat cacatgaggc gttggacaaa tccgacatcg tgcaggtaag 11640
ttcattgtta agtattatgc agtgactttt tttttctgtg gttcatttct caagctattt 11700
ctctataaat atcttcaggc acttgctgag ctgagagatc aagttaatga gaagtctttt 11760
gaactcgagg taaagaattg tttctgctac agcacctaga gatgtcttgc tactgcgtgg 11820
atgataatta tttctcttag ctccagtata atatctactc atgcctgcat aaagttgctt 11880
ctctgcaaat aatgatgaaa gctaattgca tctataacgt ttttttttct ttctcattct 11940
tgatcttgtt tacaggttaa agctgcagat aataacatca ttcaggaaca actcaatcaa 12000
aaggttgaga gattttttct tttatcgatt tgtcttaagt ttataatctg taaataattt 12060
aataaccaac gaagtatttt gctgcagaca tgtgaatgtg aagcgtttca agaagaagtt 12120
gcaaacctaa agcaggaact ctctaatgcc ctggaactag cacaggttct caaacttttt 12180
atatgaaaaa agcaacacct aatagctaaa tgattctcaa actaaagtca cttgcctttc 12240
tgacatgaca ggaaaccaag atcgaagagc tgaaacagaa agctaaggag ctaagtgaat 12300
cgaaggagca attagaacat cgtaacagga aactcgcaga agagagttca tatgcaaaag 12360
gtcttgcatc agcagctgca gttgagctca aggcattatc tgaagaagtc gcaaaactca 12420
tgaatcacaa cgaacgacta gcatctgagc tagcaacact caagagctca gtcccacagc 12480
acggtaataa gccaggaaca acaacaacaa ccaatgcaag gaacaatggg agaagagaga 12540
gtcttgcaaa gagacaacaa gagcaagaga gctcgtcgat cgagctgaag agagaactga 12600
ggatgagcaa agagcgggaa cgatcatacg aagctgcact tgttgataga gaccaaagag 12660
aagccgagct tgtgaggata gtagaagaat cgaagcagag agaagcgtat ttggagaacg 12720
agcttgctag tatgtgggtt cttgtttcta agctgagaag gtctcaagaa ggtggttctg 12780
agatctctga ttctgtatcg gagacgctac agaccgatcg atcgttttga gacgtgaagt 12840
agtaggatat gtttgtgcag tgattccaag agtttgtgtt tgtgtaagta tgataaaaca 12900
taaagtaatg atttatttga aaatcatcag attgtttaaa attcaagaaa aaaaaacact 12960
gtttaaatta agaggtaaga gaagtgaaaa gtgggtaaaa gaagaaaata atgatagttc 13020
tggggagctt agagcatgat gattatcccg gtctcttata actcatgatt ttaatatatt 13080
ttttttacac tttttggtta aaaaacatct cttatatatt ttatttaaaa aatgttctta 13140
gttttttaat taaaaactaa gaaacgatta gctaaaaaac tcagttaaga aaccagggtt 13200
aatcatggtc ttagtaaagt tcttaaaatt ttcactttca cccaatacct ttccactaat 13260
ccacatttgc cccaattgat ttccttcttt gtgtatacaa cccaaattaa taattgttaa 13320
caaaacagta aaacactata caaacaccaa gaagtgtact caatcagatg tctgaaaaca 13380
agaagtgcaa ctgaagagtc ttggattgaa gttagagagg cttaagagtg ttcttaggag 13440
cacttatcca cggagtgtct ccaatggcaa atctccacaa ggcattgaca tgttgaggca 13500
atgcgtaatc tattccaacg cgaggaccaa ctagtacttt ctccacatct tctcctccat 13560
ccagaacctc caatcctcct gtttttcata catcatttat tacaacaaag cttaaactct 13620
cttaaagaat cagaaaaaac cagaaactcc attaactgat tttggtttat ttgtctgact 13680
aacccggaga atagagggga tgatgagacc actctgttga aagtccaagc gcctgcccga 13740
cctgcaagag gcacatatga acagatttca tgcattgtgg atttgcaagg tgcattctgt 13800
ttgatgcaga tcagactaac ctttcctggt ccatttagaa gaacaggttt gtcggttttc 13860
tggccacgac gctcctgtat ggtctccagc cctgcaatac catcacaccc ttttaagcca 13920
acgtaagatc tatgtaatca ttcttaacgc aaaaacagta tcaataaagc aattatttaa 13980
gtagaaacat gcatcgataa gagagagtgt aatgaacagt ctcacagaac tgatgtggag 14040
agattattac cggtaacagg agaacaagat cgtatcaaaa cagcagctcc aactccatcc 14100
ttatcagcaa caatattgag catcatatga agaccgtaac aaagataaac atatgcatgt 14160
cctcctggtc caaactaata aacaaaaaaa acacacattt tagagaatgt tatcatgtgt 14220
atttaactaa atgataacaa agcagaatga agaaactcac aataggtgcg gtccgtgggg 14280
tattcccgaa ccgtccatgg caagctgagt catttggtct ataagcttcc acctgccaaa 14340
ggaggaacaa tgttagagag tattaacttc gttaatccaa aatcaaaaat tttttaccaa 14400
caattatagt cagaatatca aaaatcccaa gaaaacaaca aaaaaaacta aattctttta 14460
atgaggaaac aagaacaaaa ctttgtatct gacctctgtg atccgtagga caacattgtc 14520
tctcctcagg aacttcccga gcaaacgtgg cgctagatca agcgcgtcta tttgaaagaa 14580
ctcaggaggc attatcttca tctcgggggt ggagcgggtc agtgggtact cgggtctgac 14640
ccgaaccgcc cgagccttgg aacagtgctt cttctctcgt gctgcacgta gagccactgg 14700
agttgtaacc ttgggtagtt ccgattcctg atcaactcgt ttggaacgac gaggcggcgt 14760
tttcattgac ggacagaacc aaaagatttt tgactttttc gaatgtgttc gactctttga 14820
cttttcttcg ttttgttatt tggcgggtga ctgttacgct gtccgaaggt taagccttaa 14880
acataaactt tccttattat gaccgtcata tcaatttttt cctccgtttt tcaatatttg 14940
gcgttttaaa aaaaaatttg agaaaaattg attttttttt gtttatccga tttaaattat 15000
atggttacta ataatccggt taaaacttaa aagtaaaact atagtttata gataattaag 15060
tttgtaattc tcaatttgaa gagaaataaa ataatttatg gagagctagc ctgaaattat 15120
aatcggtgga gatattttga ctttatatga tagtggggaa ataaaacaca aaataaataa 15180
tgttttcaaa taaacattta ttaattttat attaattcct attctgtaat tttgaattat 15240
ttttgaaatt attaatgaat aaatgattaa gaatattttt ttaaaagaaa aattagatat 15300
accactctaa aataatactt cctccatttc agaataaatg atgttttata aagtttttgt 15360
tgtttcataa tagattgatg atgttttgat atatttatgt tatttttaat tttattgaaa 15420
aattgtgtaa ctaattagat attagagtaa tttatgtagt tggttgaatg atttttaaat 15480
tatattctta aaactaactt ttagttataa aagtaaaatt tttaaaacat catgtgaaat 15540
agatggagta ggatttaaca taatttgtac gttctagaca cttccaaagc gtttcaaaag 15600
ttaattagtt tttctttttc tggcataagt attattttat atttttccat ttttcagtag 15660
gaaaaaaata aataaaaaaa aaacattttc tagaggcttc gtttacatat atctaggttt 15720
acctcctctg cttcttccca cacatctcat cgaattcgac tagctcccca ctcaatcact 15780
cctcgttagt tcaatctcga atccctaatc cactcaccat ggcgaagttc ggcgaaggcg 15840
acaagcgatg gatcgtcgaa gaccgccccg acggcaccaa cgtccacaac tggcactggg 15900
ccgaaaccaa ctgcctcgag tggtcccgca gcttcttcac caaccaattc tccaacgccg 15960
tcatcctctc cggcgaaggc aacctcttca tcaaaatcaa gaaactggag aagctcgaag 16020
gcgaggcgta cgtgaacgtg cgcaagggga agatcatccc cggctacgag ctcagcgtct 16080
ctctctcctg ggaaggcgag gcgaaggatt cggaagggaa gacgatctcg aaggcggagg 16140
gggccgtgga tatgccgtat atctccgatg agaatgcgga tgaggatccg gaggttaggg 16200
tttcggttaa ggacgagggg gcggttggga aggcgttgaa ggaggcgatg gtgaagaagg 16260
ggaagggggt tgttttggag aaggttaggg tttttgtgga ggctatggcg aaaggagggc 16320
cttgtaggga tgaattggag aataagaagg tggctcctaa gtgggtggcg gcggcggcag 16380
cggctgtgga gaagactagt gttttgcctg ctgtggtggt gaaggagaag aagaaggtga 16440
agacgaagga ggggttcaag acgattagta tgactgagaa gttcagttgt agagctaagg 16500
acttgtatga gatcttgatg gatgagaata ggtggaaggg attcacgcag agcaatgcta 16560
agattagtaa agatgtgaat gggcctatta gtgtttttga tgggtcggtt actggggtga 16620
atgtggagct ggaggaaggg aagttgattg tgcagaagtg gaggtttggg agttggtctg 16680
atggtcttga ttctacggtt agtttagttg ttatttttct ttgtgacctt tggtttctat 16740
gtcattgtgg ctgatgtatt gtgctttgac attttcaggt gaagataact tttgaggaac 16800
ctgaaccagg agtcaccatt gtcaatctta ctcacaccga cgtccctgaa gaagacaggt 16860
tagtgtcact gcttgaaatc tttcttataa tagtatggta gtatgcaatg aatatttatg 16920
gtgtttggag tgcttgatag cttggtctta tatataactt tcatattgat gtactatctt 16980
gagggaattg taaccacctt tagcctgttt tgttctcaat gacagacact aattctgacc 17040
ttagtatctg tgctaatcct tgcgactgtt tagcttgctg tatgtagttg ttggactcat 17100
ccagtctttg ttctagtgaa tgaactcttt tggaatttgg gttttgcttt atttgttaat 17160
atatgataga acatttctat ctctaaatcg ctcaatggcc tacacgtctt taaatcttct 17220
acctatgcta cctttccact aactagcttt aggttatgct gatagagcgc ttctttgttc 17280
cttgtgaaca cctgttggct tattcctgaa agtatttgtt tgtccacatt ctcttactcg 17340
tcctgttgtg aagtgatttt gtccgttact ggatgtgact tatttttctc tgacgtttct 17400
actggctgat gcaggtatgg gaatgcgact gtggtggaaa acacggagag aggatggaga 17460
gacctgatct tccataggat ccgtgctgtt ttcgggtttg gaatgtgatt tgtgattttg 17520
attatcaagt aatcaaaatc agcattgctt catccataag ttcgattatg atttcaattc 17580
acaaggagac ataaagacga tgcagaaatt tggtttttac ttgtagttta tgcattttcc 17640
atgaactctt tggtcttttg ttaacactat ttggattaat ggcacacaac aaactattca 17700
catgagaata agttgtttta agtgttttat tctaaaagtg gtgtccatag tcaaccacgg 17760
catcaagatt gcctaaggaa cattgtctaa agactgatga aaactaggaa caagaagctt 17820
tggtttggaa ctataagctt tttgctaatc gcaatgccta accaacaagt tacacatcaa 17880
ccggtaatta accagttacc agaacctgct ttgaccaaaa tattacacat cacagcaagc 17940
tctttggatc gtttatctaa aagggttttg gtttagcctg gaaccacgtg gatgaaatat 18000
ttattaacca caacatcaac agaaacgttt ttactagctt tgtcaggtat agacgtgggc 18060
acaaacaaga cctacttgaa atcagcacct acaaaataaa accaaaaaac atcttactct 18120
taatgtatgg cggtctttaa gacaacaaaa atttcttcta ccacttttaa tcatcaagaa 18180
gagacttgaa atgttacaga ttaaggtatc aagctcagac tcttaaaatg tcatattgtc 18240
agtgcatatg atttgaacta gattgtaata tttaacatta agaatttagt tatggtatac 18300
agagtataac ggtttgtgga tctgtcattg tgttatcatt aagctttgta aagatagtca 18360
ttgttttggt tttgttaaaa tgatgttagg tagaaaatag taataatttc aaatcagcat 18420
ttagtataat tatgaaactt cacaaaatcg tgtggaaaac tattaaagac gagttttaaa 18480
tatggttgac cggatagtta attttcttac atcagatcca agattagtat tccgaagatt 18540
gttgcggtta ctggtatcaa tttcctggaa gatttaaaat atcatcatgt cacgtacttc 18600
attactagta accttcgttg tttaaagcgg aaatgtcgca actcgtttgc ttcattttgt 18660
tttctttttg gatccttcaa atgatccgca acacttccgt tggagttgat gccatagaga 18720
gtgcgtcgag ttatttaacg tataataaat attcttgcgt ccttgtacac atcatacgtt 18780
aattaagcca tcaagatgta gcattactgg cgttgtttca gtaaaaaaaa ttattggtaa 18840
aatattaaat tttaattacg cagaaacaac aaagaagaca ggaaaaaaaa ctacaaccag 18900
agactatgtt acaacgaatt caaagagaaa aagaactgag aagaaaagca cacatcttcg 18960
tcattcaaaa attaaaccgt ttattgacaa agaaattaat cgtgactaat aagctccttt 19020
gtcggcccca tgtaacccat cttttacgtg taatctgatg cttgcttcca cggttccacc 19080
ccgacttaac tgccacatat acactttggt cattcaaact taccaaacac aaagcgaatt 19140
cgtttttgtt tcatgctttt aagaatcaca atctcaacat tccaaatata tataaaacac 19200
aatctcaaca ttccaagcat ggggtggcat tctcgtagtt atctccatga caaggggcac 19260
tttacaatag aaaacactcg ggatactttt ttatcgacga ttcctaagca aaatattacc 19320
gaacagacac ctctctgtct gtctctttta tatgtcttct caaaaacgaa aaagtctctt 19380
ctccgtcaac atttcacttt ccctctttcc ctcttgttaa tctctctctc tctctctaca 19440
ctcaaagaaa acacagagac tcttcacgcg ccaaaaaaaa aaactcacca ccttcctctc 19500
tcccttacca tgacttcaga ctctgtcaag catacttcta tccacggcgg aacaaccatc 19560
tccgccgcat ccttcgaatt aaaaagcttt atctccgccg cgaaaccaag aaaagcctcg 19620
acttttgtat acgccttcgt cataagcttc gttgccttca ctgttctctt agtcttcaca 19680
ccttctccca tcaccgtctc tcattccatt ccttcataca tcctccctaa tgtcactgcc 19740
tccttgactt caccgtccag tttcaccgga aacaccccat tgccggaaaa tctcactccg 19800
gcgccggaaa atctcgctcc ggctactaaa aacgcaacct ttgagtctcc catcgctaat 19860
ggagcaaatt cacttgcttc tcagccccgg accgaccatg cattggacaa catgttgtct 19920
ccggacaaca agactaatga tactgctcca agttccgaca aacttggatc cgcggaagca 19980
cctctgtccg aaaatctaac cgtcaattcc tctgctttaa agaagagaaa acagaggagg 20040
aagtcgtgga tgagacgaga gataaagtct ttaaagaact gcgagtttta cgagggagag 20100
tgggtgaaag acgattcgta tccgctttac aaacccggtt cgtgtaatct catcgatgaa 20160
cagtttactt gtatctccaa cgggagacct gacgctgagt ttcagaaact caagtggaag 20220
ccaaagcaat gcactttacc acggtaaagg ataaaacttt gctttttaat tttgacttta 20280
aaatctattt ctttgtctta tatggttggt tgatgttttt ttttttttga aaaattataa 20340
aaggttgaat ggaggcaaat tgctggagat gattagagga agaagacttg cgtttgttgg 20400
agattcactg aacaggaaca tgtgggagtc tttggtttgt attctcaaag gatcagtgaa 20460
agatgagagt caagtctttg aagctcatgg acggcatcag ttccgttggg aggctgagta 20520
ctctttcgtc ttcaaagtag gtttctttta gtaatctaaa tcagtttcat tagttgttgt 20580
ctctcgggac ttgatttgta tgtggttgat aggattataa ctgcactgtg gagttctttg 20640
catcaccttt cttggttcaa gaatgggaac ttacggacaa gaacgggact aagaaggaga 20700
ctttgaggtt agatgtggtc gggaagtcgt ctgagcagta caagggagct gatattcttg 20760
tgttcaatac aggacattgg tggactcatg acaaaacttc caaagggtaa tagagttctg 20820
tcagctactt tgatccttga tttgagggat ctgtctcatt tgttatgttt ggatgctttc 20880
attagggagg attactatca agaaggaagc aatgtacacc cgaaactcga cgtggatgaa 20940
gcttttaaga aagcattaac aacttggggt cgatgggttg ataagaatgt gaatccaaag 21000
aagtctcttg tcttcttccg tggatactca ccttcacatt tcaggtatat acagatctca 21060
ttttgtttca taatataggt agttgtaggc ttgtagctaa aagcacaaag attaagaacg 21120
ttattatttt ttttaaagta tcatctaatt ttatagttta gatatatctt aaaccaatca 21180
taaactagtc tatataattt gactggtcac actatatcca ataattcaat aaatataaaa 21240
gttaagtaga aatgtaaaaa ctacataatc ttgaaaagaa aaaaaatatt cactaaaact 21300
acttataata tgtgaaatag agggagtata aaaagagtgt ttctaaaagt tggtttggtt 21360
tggttgcagt ggagggcaat ggaatgcagg aggggcatgt gatgatgaaa cagaaccgat 21420
caagaacgag acttacctaa cgccttaccc ttctaaaatg ttaatacttg aaacagttct 21480
aaagggaatg aaaacgccgg tcacgtatct caacatcacg aggctaacag attacaggaa 21540
ggacgctcac ccatctgttt ataggaaaca taaactatct gcaaaagaaa ggaaatcacc 21600
attgttgtac caagactgta gtcactggtg cctcccaggt gtgcctgatt cttggaacga 21660
gattctctat gctgagatgc ttgtaaagct ccaccagctt cgtggcaata gaaggcggaa 21720
acctaaaagt ttataggagt tagaatcctt ttcttaagat gatgaataca gatcttttag 21780
gaaacactta gaatcaattt tcacttttca gatttgtgcc actgaaggtg tagagaaagt 21840
aagagatggg agtcacatta gtgtttcatg atgtacgtac gtaagagatg agttaatcac 21900
cttatgttgc tgcatttgta gtcaactaca actagtgact catttttttg tgaaaataaa 21960
agattgagcc aacatttgta taaattccaa tgcatacccc tttacttata ataatgatca 22020
atcgattggt caaacgaata catttagaat taagaaccct gcaacgactt tggatttaaa 22080
ttgacacaga tcttttgctt caaagtaaca gtttgagcta agaacataaa gaatgcacca 22140
gtcctttaat tacagtatta tgataaaact cactagagcc atctagatac aatctgaatg 22200
ataatgtcac aggtggaaag aaagcatgaa catactcagt cgtccttcat gagactcctc 22260
cggtcctctt ggtgtgcaac caaaaccacc accatccacg tctttcgtat ctcacaatgt 22320
tatcagcagc cttatccaag tcctcctcct tcgcgtcagt tccctctctc tttctttctt 22380
tctttctttc tttctttctt tcttgagatt gcaagtttga aattaagctc ttatagattg 22440
tttattttga tgttgttatg tcggtctctg tgtaaatgtt tagttatttt tttcgattct 22500
ttctcagaaa agtgtctcga ccttaagtat tttcttgtta gagacttaga gctgctactc 22560
tttgattctc gtaagattta gtttcctcag ttattgcttt aagcaagcga gagactactc 22620
tcttgactgt tttggccttc tgatttgttg aatccatggc aatatttgtg gtttttgtct 22680
cctgctctct ctctctctct ctatgtggat gggctttgtt tcatgttact attattagct 22740
ccaccttcga gattattatt cttttttttt ttttttttga atgaatgtta aattttattc 22800
aatccaaaaa aacccttgtt acatttacaa tgtttcctac tccaattgtt ttataacatt 22860
atcaccccta tttgaattta tctactcaag aaactggtct tgtggagaac cagtgttgta 22920
aaccctcctg ccatctatca tcccctgctc tttgaataga cagaaatcta ttcctcactc 22980
ctctatcaat cagccttatc atcgtagtag tcggctgggg agcttcacca tgccttctac 23040
cattcctctc caaccacagc ccatgtatag tagcttggaa cacatacttc aatgtgaatg 23100
tcttgatagt attctggttt gtagatatca gagctactat ttctgaccag tcacaagtaa 23160
actcatttcc catcaagcct ctcaccaagt ttccccaaac ttctgccgaa tatccacaat 23220
caaagaataa atggtttctg gtttccaatg gatcaccgca gagagagcat gctgtattta 23280
cacttcctcc ccatccttgc attctctctc ccgttgataa tctgttcttg attgtaaccc 23340
acgcaagaaa agcaaactta ggtgtcgcaa aagtgaacca gattccttta ctccactcac 23400
agcttactcc tctagttcgc aattgactcc atgtttgctt agtagaaaac ttccgcttga 23460
atttgtcttc cttatacctc cataatccaa catcatcttc ccttgatgcc atcattttac 23520
atttatctat ctcatcctca atcaagttca aaacagggat tctatgtctt ctccttcgat 23580
gagtgctcat tacttcctct acagtagcgt ctttatggat ccccatatcc atgtatcctc 23640
tttcaccagc tctttctacc agacaaccca aatctgacca agcttcatgc caaaacgaag 23700
tttgcttccc actcttcacc ctcaccttat agaaaccttt tgccttgtct caaagagatt 23760
attatctctt ccatatggtt cagtactgtt tagtttgact tgctttgtcc gttgatattg 23820
ttagctagct aggttagagg actaatttat aacccccaca tctttaactg ttttctctac 23880
aaactgttat ataggcctgg ccataatatc cgtaacccga aatccgaacc gaacccgaac 23940
cgaaaaacac gatccgtatc cggtccgaaa tgtaaaaaat atctgaatga gtcttgtaag 24000
gtggcacaaa acatatccga acccgaagtg ttattaaccg aacccgaacg gataacccga 24060
aaaactgaaa aaaccgaaaa ttccgaaaaa tatccaaaaa aaccgatctg aatgtccaaa 24120
ataatataca atataattat ataaaacatg aatatatact tcaaatattc aatttcatat 24180
ttattttgat atgttatcta acaataagta tttaaaattt aaataactac cttaaatact 24240
tgattatata taaataaata tatattttta tatttacctt taaattttag attttatttc 24300
gggtatatcc gaaccgatcc gatataaccc gaatccgaat gatatatgat tactttatgg 24360
gttgtgatac aaaaccgacc cgaacccgat gtgttatatc agaacccgac cgtacttgca 24420
aatttactag aatggaacct aagaagtatt ataagagaga accaaaatcc gaaaaacccg 24480
atccgaacgc caacgggtac ccgaacgccc aggcctactg ttatatatca ataatttccg 24540
ctttcaaatt tttgtttgat gcagatgaat ttgaaatttc tttgccttac gactccaaaa 24600
cggtgactgg atttgttgga ttaatcaaca atcaatgtgg tgaaaacgca tatgcgagtg 24660
ctctcattca aatgatgttt cacattccat gcttttgaaa agctatctta gaaattccag 24720
agactatccc tgtcaagagt ctcttccact gtcttgagag cagcaagact actgtttcat 24780
tagagagccc agacataacc agtaataccc tgaaaaaggg tttattttga aacagtgaat 24840
gacaagatga aagtaagtta ttttttgcat aaccttatag ttcacactgt agatgctttg 24900
atgtaaatta ttttgtaatt acaaggctca cattggaaga tttgtaattc tcggtttgag 24960
tgaaatatgt gtattttctg caactaatga ctactccaaa actaatactt tgtgtccaac 25020
ttgtgcacaa tgtaatggta attagtcgtt gaaaactaac atatgtgatt taacaataaa 25080
ttcatatatt aacaattcaa aattaattta aagctttcgg atcccaaact atgctgtcaa 25140
taatcatgtc caagtcatca atccatttgc gtaaggttaa tgagatatca agaaaaatca 25200
aattcgtaaa tttttttaaa atatggttgt tacttctcac acactagagc atcgtccaca 25260
aattccttag aaaaatttag tgttctgatc gtaatttgag tctcattgca atcaggaaca 25320
agctgaaatc tacttatttt ttattgatgc tacctcatgt acttcatttt gtttggcagg 25380
tgaaccagat gtatgagtgt atccttatga aatagatctc gagaagtttc ttctaaccac 25440
tgatgctgat gggacaaatc atttcactta caaattgaaa aggtaaactg tgtgttttgt 25500
ttgatgtggt tgagaaatag tagacacgca ccagattcat tctcaagaca cagcttcatc 25560
ttcagaaaca gcttccctag aaagtctaat gtggtcatcg agagtattca ccattagttc 25620
tcagatgatt gatccatcat cacaaactca atcaaaactc tcttctttgt ttctggcatg 25680
ttgatataaa ccaaaacaag agactgaaaa ggaaaaaatt caaatgccag ctatagtgaa 25740
catagacaag agcatgagga agttgaatga tatagctttg tagcatattt tctgccatca 25800
gaatgtaccg gacatgcttg cctgccatca tatcatcagc attttaattt agacccaact 25860
tgcttcacac cagactctct tccacatgat ttttatatat atcttctaac caaaaaatag 25920
gacagaacaa attaaaaaaa aagtttcatc gggctgttct tgttaaatgc aatgaaaaca 25980
acaaaatcta acagttcccc attgtcactc tttaaggtga cttgtttagc ctttactcac 26040
ctgaaggaaa aaaacaacta ctataacggt gatgaagcaa gttggataaa caaaaaaaag 26100
attggaaaag ggcaaaactt atagtgaaca ttgcacccaa aaaaaaaaag ttatagtgaa 26160
catagacact aaaatgaagt atctagcttt cttacctttt ctaccgttag aatgtacggg 26220
acagcttgtc agctacgagc ttgtctgcca aactttacaa tgtatcgttc tattggttac 26280
ataacatata aaaatgaata gacagagaga catagaaccg agcatatgaa gatgagagaa 26340
acgaactaac ctaaattaaa ccagaatgtt aataaatata atccaggaaa aacccgaact 26400
aaactaaatt gaaccggtag agaactcaaa aaccagaaac cccgagttta tggaaactta 26460
accggatgaa tcgaatccgg ttcggtataa taaaacccag aagaagaaga taaacctttt 26520
cgcagtttgc ttctttctct gctcaaacac gaacaatggc gagtctactt gactcactca 26580
caaccagaaa cttcttctct aaacccataa tctctaggat ctcctctcct tcatcttcct 26640
ttgcttcttc ttcttcttcg aatatctcac ccttttctcc tccctccgtt ctctcttact 26700
ctcacaaaag gtcgcattct cgcttccctt accctgtcgc agcaactctc gatggtccct 26760
ccgttgaaga agacgagcta gagttcgagg aatccgaaga agacagctac cctgatgagt 26820
cggatgaaga agatgacctc tccatagata tctcaattct tgagaaagaa gcgagagata 26880
tcgttagaga ctacgctact actctgtctc gcgagctcaa actcggtaaa agattgtgtc 26940
tttctttttg cattatgctc cattgactgt tgaataatga tcgtagcttg atgttttaca 27000
gaggatgatg tagttgaagg gaaggagtca cgtagaaagg ggaagaggca agccaaaaat 27060
gttagtcttt tttcagtaaa gtctagtcct ttgagcttga gatcttcttt aagtagataa 27120
agttttgatt ttttttgttt ggttactgac atttactcta aaaaaaaaag aaccagacgc 27180
agataccaga gcatcttctc caaagagttg ctatcgttgg aaggcccaat gtgggcaaat 27240
cagcattgtt caaccgtctt gttggggtaa aagagtttga ctgttttctc cttacccatt 27300
caagttttag agagttgtta acttgtcctt aatataattg caggagaata aagcaatagt 27360
ggtggatgag cctggagtta ctagggatag actgtacggt agatcctact ggggcgacca 27420
agagtttgtg gtggtggaca ctggtggtgt tatgactgtt tctaagtcgc cagctggtgt 27480
tatggaagag cttaacgttt cgaccaccat tggcatggaa ggtataccat taagctccag 27540
ggaggcagct gttgcgagaa tgccttccat gattgagaag caagctacag cggctgttga 27600
agagtcagat gttattgttt tcgttgttga tggccaggtt cggttcttat cttcaatctt 27660
ctctacgttt atgtctttgg cttattaatt attttggctg tcatgcaatg ttgttgatgg 27720
gtggtaatga ttttttggta ctcgatcaat acgcagacag ggcctacagg tgctgatgtg 27780
gagattgcag actggttgcg gaagtattac tcacataaga atatcatcct cgcggtgaac 27840
aaatgtgaat cgccacgtaa aggactcatg caggcttcag agttttggtc tcttgggtaa 27900
tttcactttc atcctaccct cagaatcatg tttgtgcaca ttcatagttt tcattgatat 27960
ttcagttgcc tacaaaaata aaactcatgg ataaacgtca tttggtactt ttttatcaga 28020
tgatttgaat atttgttgct ttgttgtgtt cacatttaac aaaaaatttg ttctaatttt 28080
acggatttag tattgttatt ttgatgagtt tgtagacctg acgatacttg taagcatcat 28140
aaaatacttt cctccgttgc tatacatttc tttgtcaatt ttggagatta tttggcattg 28200
agcttaacaa gcatgtcatg atggaacttc caggttttca cccatcccta tttccgcatt 28260
gtcgggaact ggaacaggag agctacttga tcttgtttgt tctggactaa acaaactcga 28320
ggtttgtatg taacctttta gtatgttcaa ctggcatcag tttaccaatt atatatcaaa 28380
accaatgatt ttttttttct agatcatgga gaccatggaa gaggaggaag aagaaaacta 28440
catacctgcc attgcaatta taggcaggcc aaatgttggg aaaagtagca ttttgaatgc 28500
acttgtccga gaggatagaa caattgttag ccctgttagt ggcactaccc gtgatgctat 28560
cgatgctgag tttaccggac cagatggaga ggttagttca attttttctc gtgtttgttg 28620
agctgcttag ttttcttgcg gcttctatga tacagtgcct gctgtttcgc tatatgctaa 28680
ttggcatcta tttgatgcgc tttccatgtt aactcctacc attttttctc aatttggttt 28740
ggctactatc atcaatgact agcattgtcc aagttgaata ttgctgaact ctgaatatga 28800
gcagtgttca aaggtgcatt ggatccgtat aacactgaaa atgatttatg aactgtgttg 28860
cagaagttta ggctaataga tacggctggg atcaggaaaa aggcagctgt ggcgtcatca 28920
gggagcacta cagaggccat gtcagtgaac cgtgcattcc gagcaattcg tcgttctgat 28980
gtggttgctc ttgtcattga agccatggca tgcataacag agcaggtatc tcactagttc 29040
taaacaatgt gggaaacgaa ctcatctttc tctccttcct taatggtttc ttatttggaa 29100
acacaggaca tgaagatcgc agaaagaata gaaagagaag ggaaaggatg tctggtagta 29160
gtaaacaaat gggatacaat accaaacaaa aaccaacaga ctgcagcaca ctacgaggat 29220
gatgttaggg agaagctccg ttccctcaaa tgggcaccca ttgtttattc tactgctata 29280
actggccata gcgttgacaa gtacgtctcc ttccaaagtt ttataaacta attcaacctt 29340
tacattttta actttattct gttggagaaa aatgtagtat tgtggttgct gctgcgacgg 29400
ttcaaaagga gagatcaaga agacttagta ctgctacatt gaaccaagtg attagagaag 29460
ctgttgcgtt taaatcccct ccaagaaccc gaggaggcaa acgaggccgc gtttattatt 29520
gcactcaggt gaataacgat aagatctccc aatgtttttt tttattagca gtgaaggcaa 29580
atctttggag actaattgat gtgattaatg caggcagcaa taaggccacc gacatttgtg 29640
ttctttgtaa acgatgcaaa gctgttttcg gatacgtaca ggagatatat ggagaagcag 29700
ctacgcactg atgcaggctt tgctgggact cctattcggc ttctttggcg cagccgtaag 29760
agatctgaca aaaatggagg aggtacgtgt tttgctagcg taaacttgtg attcattttg 29820
aaaaatatga caatgttttg tatgtataac tttaaatgaa atttgcaggt ggaggtacaa 29880
tgagaatgtc aagtctttca cgtgagagaa atcttgcaac aaaaaggtca taatgttaag 29940
tcatctactc atctttgtta aattttgtgt attttttgag aaataatgta ttgaaattcg 30000
atattatata aattcatagt ttgttcaaaa aaaaaaataa attcatagtc tctgactctc 30060
cattgatctt ccatgtatgt tccattttgt ttctttctga gaatcaaaac aagatattac 30120
taatcttctt gacagtttat agaaaacaga actacaacgt ttctttatgt ttatgttttc 30180
ttaatctcaa gctgataaaa aaaagataaa cagaccaaag cacaggcgat gagtctctta 30240
gtaaagctgc tctttctttt catgccacca tctccacctg taatagaaca aagaaacacg 30300
aaactatctt tgtcaaaaac attagaaata ttcatttttg tcagaagaaa aaagtgaaat 30360
gagatgatat atgataatga tataagtcta cgtagtatac gtaccagtaa tagtcccaac 30420
gaggacggac tttcgtcatg cggttatcat cagaaggatg ataaggatga gcggcgtggc 30480
gagtgttgtg gaaggcgcag caaccagctg catagacagc gatgaggagg acaaggacca 30540
gaatattaac gaccgacaac tttttccagt caagacggat ctcctcaaga acaccagctt 30600
tgcaagcatc acactcgtag cataacgttt caataccatt gttccatcta tagcaatctt 30660
ctcctcctac tattactccg gtaacgtacg tgcacgccgt cggtggctta caacatcccg 30720
actataaatc aaacacacac atacaaagtt gatgaagatg ctagcttaca ccatagggca 30780
atgaatatga gaaaatatta atgaggatca tggcagtctt ttagcatgtg taaatggaaa 30840
gattgaaaat ggtttgattt tttttttaat gtataaattg gagtaaaatt taaaatttaa 30900
aatatattta taaattaata cttataattt caaaaaaata acatatataa atggagttat 30960
taatacttat aaaaaaaatc tacagttaat aattttattg aacatggttc taggcactga 31020
aaatggtacc tgaacagaag tcatgtctct ttggaagtaa tcaagtgtag tccaagattc 31080
aatctgagca caagtcttgg aactcaagat acagcttctt atagagatcc aatactgagg 31140
atctctaact ctctctctca accatggatg ataatcaccg agcctatact ctttataaac 31200
cctccctggt acttccacac cgcctccttg gctcgtcacc accaggccaa acagagttag 31260
acccataaga gtcgcgatga ggaagatcat gaccactagg taaacccaaa gagcccatgc 31320
cacgttgaaa caggctccta tgaatccggc gagagatact aagagtatga tgaaacctat 31380
aacgagtaga ggagtctgga ggaagttttc gcaagttgtg ctgcttcttg ccttccatag 31440
agcggctcct atgattggta ttgaagctag taagctgagg aggtttaaga ctccaatcac 31500
tgtgttgctg aatctgtaca tagtagtagt gttatcaaga agaaaccaga gacttagcag 31560
tgccttctct tatatctcgc tcttttgtaa taagcagatt ctcttcttgc aatgtgaact 31620
tcatcagctt tatcttacaa tcttctttgt tttttagtta ttatattggt taactctacc 31680
ttttttttgc ttttgattct ctcttatcaa ttgggaattt tttaagcgaa aaagtttaga 31740
gttaatggtt tgatgattca tgctcatatt ctctggtcgt ctcttgattt gaatcatcca 31800
aacaataaca ttagaaatag tatttttttc aaataaaagt gtctttttgg acaattggtt 31860
cttgtttatt attctatttt atacgtttaa ctaacaataa agcagaccaa aagtagtgcc 31920
ttaattaaaa tatgatatac catattatta gatacatttt tctagcttag agtccaaaaa 31980
atgcaatcat ggattatata gtggatcata tcatatgtgg gtattgtata ctttgaaatt 32040
gttgactcgt tacgggaaat aattgagata ctttttatat atactagatc ctttctccgc 32100
gctacgcgcg gataatatat ttaaatttgt tacatttatc atttttattt gtatgtaaat 32160
ttttctatat taaattatat ataactaatt tttaaatttg agttttttta tatttttagt 32220
ttgaagtaaa tatttctatt atatgtaaca caattaacta ataaaatatg aagaatcaag 32280
tctgagattt taaagttatg taaaaaatat ataattatgt atagaacaca aattatctta 32340
gtttaaaaga tcggaatctc atctcgaata aatttacgaa aaaaaaagta ctccaataac 32400
ctacttaaaa tataaaaact ccttttaaaa aaaaagcgta cttaataata tttttttaca 32460
tgtaatagtt gaaaactaac aattgaatat cgatctagaa tattatttta atatatctaa 32520
tgtaaaatat taattgtaat aaacaaattt tgaattttgt aatattacat gaattagaag 32580
tctttaaaat ctaaaatcta ttttattaac atactatatt ttttattcat ttattatttt 32640
gacgttacaa aatattgctt tagttttatt tgtatattat ttttttaata atttagtttc 32700
tttttaagta attttaaaat tatcaagaat gtaatatatt taaaattatt tatttaaata 32760
tatccaaata taatgtctca tttttatgtg tgtttgcgtt gagcatattt aatttgtaat 32820
ttgtatattt aataacacct tattgcgtgt cgttctatgg ttttaataaa tgtgttgtca 32880
tctcattttt attactacta acatgatttt ttagtgatca atgataatgt attttaaacg 32940
ttatgtatta tattttattg tatatttttt aactcttcgt gctggcactt tttttagaat 33000
cattttaatt agataatagg ttttaagatg taaataaaac tgtgtatgtt gtaaatttag 33060
acttcttagt gtagctgagc actatcaatt atggaaatta tattatgatt ttattttaca 33120
aaatcttttt ttctgtgtat tttttttgtt ttattttgta tttttaaaat tttattgcat 33180
tattctttaa ctgcagagaa ttgatatttc taatttttgt ttcatatacc ttaaaagtct 33240
tcggttgatt tttgtttgtt ttctttctcc aattataatg tatagttcga ccgtttcttc 33300
tttttttttg gatcaaacta ctaatatcat cagatagaaa agcttaaact ctaagaattg 33360
agtgaatatt tgtgttagag aaaactgatt taaccaataa tatagtgaga tattataata 33420
ttagaaggta tggaaactct tctatgttgt cctacgctgg acataattaa gttgttgtca 33480
attgatttta tatttgtgat aactggaaat gcatctttat gtcttcctta catcatcctt 33540
aattggtttg cggttcgact atttctaata tactgagagt aacataaaat tagatgttga 33600
ttatctcctc ccaattagga atgcacagaa tgagagaaat tcaagatgag accagtttac 33660
aattttgtcc tcatatctat atagagttag tttatagatt actctatttg tttcaaaatg 33720
taatcaattt ttattaaaat atgtaatatt taaaaattat tactttagaa atctgtcatt 33780
taatatataa atttaatcaa ttacacagta atttacataa tttaattggc tacacaatat 33840
ccaataaata taaagttaca ttgaaatata aaaataattt atatagtgaa acaaaaaata 33900
cttttaaacc attattatat tataaaacaa agagaatatt taaattatat tgaacattag 33960
aatagtaaaa atcagaaaag ctgaaatctc aacgtcgatc atttacgttg gctatgttat 34020
taactttgaa gataacgtga atgatcaaga acaaaaaagt taattttagc ttcagtcatt 34080
tttttataat cattttacca aaaagaaaaa aataacagga agatgactaa taaaaaaaga 34140
tacaaacaga gtactgtaaa aaggtgttga tcataatagc aaacattata gtctcaaaaa 34200
ttgtcaactt tatattaaat attagtcaaa aataataaaa tatataatat taataaattt 34260
tattttaaat ataatttaac ttttaaaaat tttatcatta cacatggtgc agaaaagcac 34320
ctagtattat ttgaatttca aaaactatct gatgcactaa ctttttgtga caaatcaaat 34380
ttaaggaact gggcaagaga ttgagaagag ggatgtggag aggtacaaag agtcttcact 34440
tgatgagtta taatggagca ttgaagtgcc attgttgtag tcgtaagagt tacaccggtg 34500
aagttgggta gacgaacaga tttggagtcg ctggagacgt ctgaggcaag taggctaaag 34560
aaaaggaagc tataagttat acaatgggct ggctattttg atggttttag atggttcgag 34620
acccatcatc taaacattcg cgatgacgtg gcagtttgat tggtagagaa tattttatcc 34680
tatgtggcat tcctaagaag cttcaaaatt agtagctttt atatagtagg atcttgtgtt 34740
ttaatttagt taaatccaaa aatttatttt caagttccat taataatgtt catgtgcatg 34800
tagtcaatta gtaaactaag ttacaatttt gtatgcttac taattgacaa tatgtttacc 34860
aattttgtgt aacgtttagt aaactacgtt aaatttacaa tgacccatga agcgaacgag 34920
ggtaagcaaa gaataataga catggacgga tgaatttgct ttttaagatg cttgtgctgt 34980
cccatcccca taactttcag aatattaggt tttgtaggtt gatgagcaca atatgatctt 35040
tgattcctcc acttcgcttt tttgtgtaag caagaagaac aaaaaaatct tgtttcagct 35100
gacaatttta cgtaccaccg ttttgatttt acattttgca gatgattttt tgacaggaaa 35160
aagggttttt ttttaaaaca acatttgagc caaaagacac acaaacttga aaggctaaaa 35220
gagtttacaa agattgtggt ccttgtgtgt gtggttcaaa agacaaacgg gaaaaggaaa 35280
ataaaatgct aaataagagt ataacaagaa aatcgcaagc ttgaaacaaa gtgttatctt 35340
cctatagaac cataatctct actagtatac atccaaaatc ctcagtattt gaagacatag 35400
aagcagatgc tgctcagttg tactcagttt gcaaggtcaa gtcttgtaca cccaagtcat 35460
ggtatacatc atacacatat tgcagtaaag gcctttcatc tatcccgctc ttcacctaaa 35520
cacaaatacc cgaaataacc aactcaacat cagtgccgtt cttattgagt actcatgttt 35580
taaccgataa gaaaacagga aggaagctag tacctggatt ctgagtgagc caacagtgtg 35640
accaggcaca acctcccaaa aacgagcctg taaaacctct atgacatcct ctcgagaagt 35700
aatctgtaaa taaagagagt tgaagagaaa cccagcttga tcgatctata tgtacacgtt 35760
caggaaacac tttatggaac agagcgaacc tgacgcaagc atttacttaa tgcggaagaa 35820
ggaatgtttg gaggtgccat ctgaagcaag acaccaccgg tggctttgaa gagtggcata 35880
acaagcataa acactgtaac agataccaat cccaaacata ggacctcagc attttcaacc 35940
ctgaaaaatc caaagaccgg aggagaaaaa tggaaaatgt aagaggtcag gtactaagac 36000
atttttattc attttgttcc ttttaaagga agcgagcatt acccgagaga gaggagccag 36060
gatgccagta tcagacctgc actgaaaaga cagaagcaaa gaatatgtca tgtgggatgt 36120
atataagttt catgcaaaga gaaacatttt tccagctagc tctccgcggc tctgcttgag 36180
ataaagaaag ccaaagagaa tatcacacct gcggatggaa tctgatatga catgcaagca 36240
aacggagtgg tagttcatat cttctgcttt tctgtacact gcatcatttt acgaatttaa 36300
gaaacacatt caagaaaaat gcaatatgta cgaagggaac aattcttggc cagatcagtt 36360
gctttcatgc tgtctctctg ttttcactaa tcctcctact tattctatct taattggaaa 36420
cccttgcttc tttgtggctt tacattgaca ggggtggcca gtttttacaa tgaaatatag 36480
caaagccgcc aaacaaggct ataccatata aagcaccagt atcggtatta gttaattcaa 36540
gtctaaccag aacttaagca taataataaa acagagaata cataccaata ttcatacgag 36600
cataattccg gaagaaccaa acaccaagta ggttcaccag cagatttgtt accgctgata 36660
caataagata atgcctgcat gaagtcgatt tcagtacatc atattaatgc aaagaactta 36720
gtgtaaactt agtaagtgct agagaaataa ctacaagctc ttaggcatgt cacttgtgga 36780
aagaaactta cttgtgctct gattcatctt gaacaaatgc atgaagagct tccacagcta 36840
aggagaacga catgaacata agaaacagct gtctacacat atgtcaatac tgaacatatc 36900
aatgtgttaa cccaaaagat aaaatgaatg agacagtgaa ggcaaaatga aaagataatc 36960
aacattttaa acgagctgta agattattct attctatcaa caacagtaaa ggaaagtgtg 37020
caaacactat cgacactatt ttctgaaaga tattaagcca gttttattgc atggcacatc 37080
agccattaga ccctcaaatt aaaaccggaa atgacatcca acaaacttaa agaacatact 37140
tacagcatta gtgaaagcag aaagaacttc aagtcttttg tacctggaag aaaagccaac 37200
gattactaag tcacaactga ttcagcatta tgcaatgtca gtatcagcag caaagaagca 37260
aacagacaag gtttcatatt tagtaattat aaaaactgga tcctatgaaa acaacggcgg 37320
atctacttta ggaatgctcc agagaaagaa aagaaaaagt aatttaacaa attgggaaat 37380
caaccgtaaa gtaccacaaa ccatgcattc caacatatat ctccagcaaa tacaagcacc 37440
aactaatcgg atcaaatttg aaaaatttct cacccgtatg agtaagcatg atcaggcttc 37500
ttccttgaag tcgccattgc aaataaagaa aacgtcagga gaccacatcc aaatgtcaaa 37560
tggaatgcat cagaaaccaa acctgcaaga gtcacatcaa acatcaaaca tcaaaaaaga 37620
gagcaagtaa acaacaacag taaacatggg aatctaaaca aatctcaaac caattttgat 37680
atttacaaaa cctcagctgc aacagaagac aatatcttaa aaattaaaac tccataacca 37740
aaaggtctct acatacgcat aggatctact atccatgcgg tttagttccc aaatttaaaa 37800
gattatatta accaaaaaaa aatcaacttt agctgttttg tttcatctaa atctctagtc 37860
actacccgaa gtaaggatgt gaagctcaca tcgacctgga gtcttattcc tccaacaaat 37920
ccaactctct ccctctaaca aagttatcaa gaactaaaac caagcaacaa ccaaatcgta 37980
cctacacgcc cagtcaatag cccaatcaac agctctgtag tagagtacgc cacgttaagc 38040
gaaatcaaca taaacaatct cttcatctgc cgatttccat ttctcagcac cccaaaaacc 38100
accaaaacca tacgcaaaac cgacaccttc ccaatcgccg ccgccgcttt cccttccccg 38160
aagaaaacat catccccgtc gacagagtat atctccggcg gcatatcgat ggtggagacc 38220
gtcctatcga gaaaaggctt agccgccggc gttcgcgggc cgtgggagtg gtgaaaggag 38280
cgggagtaag cgagcctccg atcattggcg gcgtatccga cgtcgctgct ccgatcattc 38340
gggagttcgt tatcgccgcg aagatcgaag gaaacggatc tctccatact tagctttctg 38400
tttgctcctc aaatgtgtaa ttcaacgagt cttaaaagta cactgcgtct actagaatga 38460
ccttaatggg ccactgatgt aagcccatat aagagctcaa gtcatgaagc gttgaccgca 38520
tttaacgcct tattggactt gattgcctct cgagtagggc ttttaacgcc ttattggact 38580
tgattgcctc tcgagtaggg ctgggacttt taaccgaacc cgaaccggat ccgactcgaa 38640
atagaccagt tcggttcggt tttggacatg gccatattat ccaatagatc attgcttcta 38700
atatcacggg tcggttccgg ttattaccca aaacctgatc aggtatttat ttaaaccaaa 38760
atggatagtg taaaacctag aatattttaa aaagtattat caccacgact caaacccggg 38820
taaaagtggc tatgttacca ccagaccact tcaacttata tgtattcttc tatattgtaa 38880
atatctatag tatttcaata ttatttttta taaaattaat attttagaga ttttgaatcc 38940
gggttggcca cactacaaat agagtatgta accactgaac catttcaatt tacacgtaat 39000
tattttattt aaaaaatatg tatatgattt acataataaa tgagtacccg aaactgactt 39060
ggaatcagag atatccgatc cgaaacctga accgaaattt atctagtacc tattggatag 39120
ataattcatt tatctgaaag atccagaccc gaatggatct tacccgacct gatccggata 39180
accgaagtcc cggatctact ctcgagtctt gtgatatgtt ttctcccata acaacaaaaa 39240
tacagtatag tataatactt cagataaata aactttatta aaattagtag ggttaacata 39300
tcacattcaa gcatttttca gcccgttaat atcaataatt aactttttat tcaagcattt 39360
ttcagcccgt taatattaat aactaatttt tggttggatt tgtctcttta aggaggattt 39420
gtctcatgat ttacaaataa caatattcat atttttagtc tcgtaagatt ttatactaca 39480
aaatattaac tattataatt tataaataat acattattta ttattataat ataattatct 39540
agactgtttg taaggtaatc acctagagct ttagaacact ttcatagtga tgtggaatca 39600
ttgtttcagg cattgtgttg gattctggag atggtgtgag tcacactgtt ccaatctacg 39660
aaggatatgc tctcccacac gccattctgc gtcttgatct cgcaggtcgt gacctcactg 39720
attacctcat gaagatctta accgaacgtg gttactcatt caccaccaca gcagagcgtg 39780
agatcgtgag agacgtgaaa gagaaactcg cttacatagc acttgactac gagcaagaga 39840
tggagacggc aaacactagc tcatcggtcg acaagagcta cgagttgcct gatggacagg 39900
tgatcaccat cggaggggag aggttcaggt gtcccgaggt tcttttccag ccgtctttgg 39960
tcggaatgga agctgctggt atccacgaga cgacttacaa ttcgatcatg aagtgtgatg 40020
ttgatatcag gaaggatttg tatggaaaca ttgtgcttag tggtggaacc acgatgttcc 40080
ctggaattgc tgataggatg agtaaagaga ttactgctct tgctccaagt agtatgaaga 40140
ttaaggtggt tgctccaccg gagaggaagt atagtgtctg gatcggagga tccattctag 40200
catcactcag taccttccaa caggtaaatc atcttttctg cttgttactc gttttgtaag 40260
ctgactatga tacacaatgt tggtattgca gatgtggata gcaaaggctg agtatgatga 40320
ggcagggcca tcgatagtcc acaggaaatg cttctaagat tacgctcgcc gttggatgaa 40380
agattttttc gtattatttt atatgttcaa cgagttggtt tcagacaatt ttttttcttt 40440
ggtttttcct cactacaatt gtttcttgtt gtcacactct ctttggttgt ttctgccatt 40500
aatgagaaaa aaaaagattc atttgtctta ttttcttttg ttccctcaca aatctgaaag 40560
caaataaata tgaagaaatg aatttggctt atgttgacag gtttctacaa attaaaagag 40620
aagaatagag ttttttacaa agagactgaa ccacatgagt agtaaaggtg atctgccaac 40680
caaacaacgc aataactcaa actaacttaa ctgtaacgaa gattagattt atggttcact 40740
tcaggtgagt aaaacatttt tcttaaagca ttggtatgtc ttgaaacgac aagttgcttt 40800
atgtcaagat tcactagaac ataatagtag tttcagagga agctaagcca ttacactgtt 40860
cagggatcca cattaagata gttcgagaac aagagttcac tagtccgaaa gtcacatttc 40920
aacgatccca aacataacag cgatgagaag aagaacaata cagacacaag acattttaga 40980
cactaacttc caacatcaca taattttagc caaaatgtca gaaaacacaa caaaatggat 41040
aattaaagat tattgaaaca gaaacatagc ttcttaaaac aaagacaatc atagatgaga 41100
aaggttcagt ttcttctttg cttcataact tattgttgta ccagaacaca cctttcttct 41160
caccttgcct gtccggttcc acatagatac actccttcgc ctccctccac atcgccttaa 41220
ccaccggcgt cccatcgaac tgataatact ctcccagtat cggctttatc gccttcgtag 41280
cttccatcgc gtgataatgc ggcatggtcg agaacaggtg atgcgccacg tgcgtgtccg 41340
tgatattgtg gaagaccttg ttcaagattc cgtagtctct gtcaacggtg gccaaagctc 41400
ccctcaacca atcccactca gacgagtcat agtgaggcag ggaaggatgc gtgtgctgca 41460
agtaagtgat caaaactaag aacccgttga caatcagaag aggaactccg tagaagcaga 41520
ccatcgaggc aactccttgg acagcagcgt agcggtagag accgtagcag acggcgagga 41580
tgccagcgtc ggagatgtat atctggagac gctcacggtc gttgtagatg ggagcgttgg 41640
ggtggaaatg gcaagcgaag ccgccgtcgt aaggtctccc cgagacgttg aaggctaagt 41700
acaaaggcca gccgagagtg aactgaaccg ttaacatcac ggtgcgtccc aaagggttgt 41760
tgaggtactt gccgtaccac ttgatgtctg acttcttctt ggggacaaac acttcgtctc 41820
tctcgaggga gccagtgttg gaatggtggc gtcgatgact gtacttccag gagaagtaag 41880
ggacgaggag gaaggagtgg aagatgaggc cgacggtgtc gtccagccac tggtagtcgc 41940
tgaaggcgtg gtggccgcac tcgtgggcta tgacccagac gccggttagg acgcagccct 42000
ggcaggccca gtagagaggc caggcgaagt aggagagagg gtgagggagg agagggaagt 42060
aagtggtggc gacgtagtag aagcaggagg ctatgatgat gtcccagatg aggtaggaga 42120
aagagcgagg gatcgagcgt ttgaaacagt gcggtgggat tgctttcttg agttctccga 42180
cagtgaaggg cggtgtctcg cagggtacgc gcttgatgtt gtcggtttca gactttttgg 42240
agggaggaga cacttgcatt cttccacctg cacccatgtt tctgcataaa ccaaaagcaa 42300
agactcaaag ttaattaaac caacaaatta atattcagtg ttacgttatt aaagtttcaa 42360
aaaaatggac taccacaaaa aaaatggata gtacgtggga taaagagcag agaagcggca 42420
tatagtggca aaccaaagaa agaaataaac gatagcgttg agaatactac tagttattaa 42480
tgagatttga tacgttacag cttacatctc tttcttgtgg atatcaattt ctttcgtctt 42540
ttattactaa actacgttag agaagacaag tcataatcac aatgtctctt agaataagca 42600
acttgacaaa aacataaacc taaatgaaac agttgatagc aactctattg tcaacatata 42660
gacttttaaa cataaacaaa caaacaaaaa tacaatcttt ttactatcat gaatcctatt 42720
attttcttca tgcaaatcta ttgcatctga atctatgaag gagcatctaa tccaattaat 42780
ttgcaagaaa aagtttataa gcatgaagtg agcataggcc aaatgaaact ttttcatgta 42840
ttaggtaact acagaatcca gagccaatag gaatcggtca aatctctcag caaattttac 42900
ccagagacat aagtttttac ccaaagattc aacaaatatg tacttacatg tctcaggtcc 42960
agatctaaaa caaaagtaaa caaatatata taactttgaa taggaaggat atttctaaga 43020
ccaggacgtg agactgctat ggtgattttt caactccacc aacccatcaa aaatatatat 43080
ataattttaa aaacgattga aagtcaaaca gtttgtattc ggacaaatga aaatgcaaca 43140
tttcatattc tccacggtat agacaatata atcagattaa tggttaagac agcatcaaga 43200
tttcacacat gaaaacagag aatcaagacc agatctatag tttaatgcaa taaatattaa 43260
cagatctaga aataaatcga ctgaaatgca aaaatgatag atagaacaga aaagcgataa 43320
gaaaagaaca gaccaagatt gaaaacaacg taaaaatgag aagaaatgga agaagaaagg 43380
gaccttgagc tggctgacgt agggggggat gaagatttaa cgttaataac gatgaaccct 43440
acgaagaagc tcctcctcaa actctctctc tgtctcctct ctttctctct ctctctatct 43500
ctttggtaat gaatctctct ggttctggta agatgcgatt gggcagaagg caggccgttt 43560
aaattgacgg gggcccgtgt gagacgattg agtgacatct cttttctttc tttttttaca 43620
agtgggcccc tccattattt cctctcttca tatttctttt ttttttatta tttttctact 43680
ccaaatatct gatatttaca ccacttatat atatttacgg aaaagtgaaa aagatgccgt 43740
gatcatataa ttgcttttat aaagtttatc acgtttcttt ttgtattttg tttttaaaat 43800
gtaaatattg gtttacccaa tcctaatgtt cacaaagact agtttgggtt atgttataga 43860
actcatccgt tacgttaatt agcattaaga ttatggtatt tgatgtcttt actttaatat 43920
gaggaaacgt ccttgccgac tcacaagtag aactgtagaa gttagtggta gccggaaaga 43980
aaagaaaaaa atgctataaa gttgaggatg gaggatcgtg cttggcttct tcttctccca 44040
tgtgagaaga aaacttaaaa aaatatctgc agacattgtg gttgagatca cgtgaatagc 44100
cccgagtgtg tgtgatgtac tttggagatt cgtcatatat tataataaat taatttaggt 44160
ggtacacaag taggcagcga ctgccgacta gtaattaatt taagtacttt attaaagcta 44220
tcgctctctc ttatgttaag atgattagag tttttctatg cattaccgct tataacgaca 44280
cacattattt ttaacattct ttaaagatca tcacctacca tgatttcatt tcatttattc 44340
agctgttact atcagcgacg gctattaata acatgaattt ttcgttatat agtctatcaa 44400
acattataag agaactataa catcgacaac gattagttat acagtctagc atactcacaa 44460
aataatctaa gctgataatc acacacacat cagagaaaca catgaacttg ctgaccaaaa 44520
taaagcagag aaaacatgaa gtattaagta gagacagcac acaaatccta tccactgttt 44580
tgccaatcat tcatcaagcc tgccccatct caaattcaaa ctagattcta aaaaaacacc 44640
aaatggggaa aacttacact gacaatgaaa actaaacatt gtagtttcaa aaaacaaaga 44700
caactaaaaa caagtaggag aagatgatat taggaatcac cacaacaaat gaaagagact 44760
tgtttcacca gtaactctag gagcaattca tgacctgcgt agctctgctt ccccgtgagc 44820
aaagtgacat ctatcaccaa atgtacagct tcctttagag aatctctcac acatcttcgt 44880
cttgaagttg cttcctggat gtggtttccc ttcagaacca agcccacccc cgccaccacc 44940
gccaccaggt ggtctcctag atgcggaatt aagcctccca atcagctctc taaccattgc 45000
gctcgcttcg tttatctgct cgaatgttcc ttcaagctca atgttcttca ggttgggatc 45060
tctctcgtga tcttggatcg atagctttgc tcctgtctga cgacatatct gtttcgaaca 45120
gactccacct tttccaatga ttgcgccggc caaggaagca tccacactga tcttggctgt 45180
ggctgaggca ccaaagctag agacatggcc aggccctgac tctcctctcc ccgaaaaccg 45240
acctccacca ccaccaccac cagatccttg catgtttctg gaaacttgag acatgggtga 45300
tcccatgttt gtcatctgtg ccataggatt gtatcctccg ggaacaaagt gcaagaaatg 45360
gcagttctca ccaaaaggac agccagaagt gctgcaacag acgcataata aatatgtcaa 45420
gagagttaaa aaccattggc attgagaaga cacaagagaa caaacagttg aaacacagaa 45480
gaaatggcac atagcaacta tgctaactgc ttgtctatga cggacatgtt caccagtatt 45540
cagtaatgca acaaccttac tagacactat atgaccatga tgagacaacc ccaaaataac 45600
taatatctta ccaccaaaca gagaattaca acacatatct ttactgccac agctcaaaca 45660
aaaggtgtgg attgattttc tacgctataa tcaccagttg aggctaatat atttctaaat 45720
ttataatcga atatcatatt tgttatattg aaactttttt ttaactggtt cagcatgaat 45780
aataatacat acctgtaata agagctaatc acttacatta gcatacattt tttagttgtc 45840
aatttgaagc tcagactata aataacaatt ttgaatatta atttagttaa gaaaaaggat 45900
tataacctga aaaattttgt gcatggcttc gatttgcttc ctaaaccaga ttccatctct 45960
gttccaaaga ttaagtgttt ttctttagtt aagactttgc tgatgttcaa taataattgc 46020
ttttagaatc atacatatca ttcataaatt ctcatctata tggaacttca cacttaaatc 46080
aaagctgcta ctctagaatt ttcaggatta tttaccaaca actaccacat gaataactaa 46140
cacataaaaa agctaattca atcacagcaa actcaagctt tgggcatggt gataatatgt 46200
tacaagaggg actaaactaa agcaataatt aaaactcaag ataactataa gcttgattta 46260
actttaagat cacttatcaa aagctcatcc atcattaaac tgaaaaatta atggacttta 46320
gatttgcatc agatcaaaga ctgcagcaat ctctctactt agccagagaa gtgagcacga 46380
aagaaagatc caaacttgaa tttactagag aatacgaagc tcgaattgaa gaaatcatcg 46440
ctaccccaaa tcaaattgac aacaaaggaa ctattcatcc atcaattaag atctaaagtt 46500
tcaaccttta acagagcaag tgaagcaaaa cagaaactgt aacagctaaa acactctttc 46560
gagacaataa agtaagagga agagcgaaag agctaacctt gcttcgactt cttgaatccg 46620
ccgccattgg agttgaatga gccagcttca ggccgtcccc tcttacgagc atccatggct 46680
aaaggtgtac agatccgaat tagaaaccct actgtgtgag tgtctagaga gcgaatcgga 46740
gaagacaaat cgaaatcgga attaaaggga gaaggaacga gtagagagaa gagaataata 46800
ataagataaa taaaaccttt ttaaccctaa gggtggtgtt gtcttgtcgt cgagggggtg 46860
agatgagatt ttcctttttt tcctaactct tcccgatttt tttttaattc gatttaaacc 46920
ggagtggcgt aacaaataaa caaaaaggta aaccggaatg tcctgaaaaa aggataaaag 46980
ataaccggat tcgcaagatg aggctgtttc gattcctttg atacggttaa catgtataat 47040
gacgttgatt gttccttatt cgacatctta cgacgtaaga cgaaaaataa attgcgtacc 47100
ggtctagtaa gttcggattc tattatgttt tccataccga ggagacagac acacaaccaa 47160
tgtttatcat ttaccttaag gctgggcgtt tttaacttaa accggtgtcc acaccttaaa 47220
ccgaaccaaa ataatgagtc cggttcggta acgggaccat gcaaataccg aatgggtttt 47280
tagctctaag cacttcggac accgggtcgg tttggttagg taccaaacca aaaaatttta 47340
aaagaggaaa atcatcttac aaaattactg tatatttatg tagaaactaa attattttgt 47400
tgaaaacgaa gcggtgaaag tcagtataaa tattatatat atatatatat atatatatat 47460
atcttacaag aaataataat tgttctaagt aca 47493
<210> 2
<211> 40174
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 2
gggggtgggg tatagatttt ggagtttttt ataatttggg tagactttgg aagttgttta 60
aacgattttg gtgaagtttt gaaaatacat ttaaacaaca ccattgttgc ttctgagtta 120
tctctaacat tatgaattct aatgatatta tcacctccta ggatgcttac agtaaaagaa 180
acaacagttt taattttttt cttactggtc ttaataagcc cattcagaaa tatctcccaa 240
taatctcttc actgaaggtc cctacaggca cacgagacac tgctatatgc ttctgcatat 300
ctttggcgaa tatagagctc atcacataaa aacaaaaaga tgatgaacct aaatcttcaa 360
attgcaatgc gatctctcgc ggaagaatca aaaccttgaa gttgctgtac ttttcttttc 420
tgtatggttc tctgagtggg actaagtatt atttataata tttttttgta attactacta 480
tttttatttt ttattttttt tattttaaaa acataatata acttgataat attttgtttc 540
tttttataaa agatatcaaa tttgaaataa cacaatccta ttggttggtg aacctaaaga 600
ttcaaaataa acccaagaat aagtcaataa agaacaacaa tatttatttg atatatgttt 660
tcataaatta tatgtagata aaatacaaag cacaacggtg cacaccagca tatgcaacgt 720
taaagtttag attttaaaat aataaaaaac cataatacat ttttaaccgt agattttaag 780
ttacataggg ccggcccgct gcggaagcaa cgtaagcgac ggcgtagggc acacaacgtg 840
tttcaatttt tttttacagc taaatttgtt cactaacttt taaaaaaaaa tcatccagct 900
gattaaaatg cacattttaa ttttggatta gggcatctaa tagtaatgga actcgtacga 960
tgaaactttg aattttgtga aagaaaactc caataagtta atataatcat gttattggat 1020
aatgtacata aattttaaag gtgactgttt atgaggaaac aaatcagata tgcacgattt 1080
tgtttcctac aaatggctaa ttttaccaat ttatatttaa gttgtttaga ttgttttcct 1140
tcgagtgtgt attaaaaatt tattcaaaag tatgtggttc attgaatatt gatatttaca 1200
atgaacacgt ttcatacata gatgaaatat agatattaac ctaaaataac cttaacaaaa 1260
attaaaatac aataactttc aaatcaatat tcatattatt agtatatata ataatactta 1320
gtcccactca catttacaat cggctttcca aaactttgtg ctacattatg tttcatcttt 1380
caatggccaa cactaaacaa aaaccagttt caatcttatt gcttactaca ttttgcttct 1440
tgtcgttata ctttgtgaaa aatcaagcct tctcaaaagt ctcatatcca tctaccttag 1500
gtctaaacca agagaaacta acacatcttc acttttactt ccacgacatg tatggttaca 1560
acccaacatc agtggaagta gcagaagccg cacaaacaaa cacatctaaa acatattttg 1620
gttccatgtt cgtaatggat tgtcctataa ctacacttcc taatataagc tccaatataa 1680
tagggtatgc acagggtatg acagcatctg catctcaaac cgaattggga ttgttgatga 1740
ttctccattt tgtgtttacg gaaagagaat ataatggaag cacgattagc attcttggac 1800
gtaaccttgt gtttgagaat gttagggaga tgcctgttgt tggaggcagt ggcctgtttc 1860
gattcgctag aggatatgct gagggaaaga cgtattcatt agatgtgaaa tctggaaatg 1920
caactcttga atataatgta tttatcttgc atccttgatg tattatacaa taatgttaaa 1980
gctaaactat tttattatcg ttgattccgc taattttttt gataattaca gtgatgatat 2040
ttcataattt ataaatttgt tttacgtaaa ttaatgtcac tatgtcctaa tttggagaac 2100
aatagtcaca ttgagaaaat gtagatcaac ttttttacta cagagttaaa ccgcaatata 2160
agaactacca catgtaatgt gagagactca aagtttagaa tccaaatgtt tttcgattaa 2220
tttgtttgtt ttgatatgga tctttacaat acaatttctt aaacactaat catttacaaa 2280
actggttgtt aacttttcat tttttgttgg tccaagatgt gaccgagaca cttcaaatct 2340
ctacttatat atctctttaa atttttgtaa tcaaccaagt tttagctatc tttgtaatac 2400
aattttcact tcatgaatat tcgcattctc gtgaatcttg attggttgca ataaaataaa 2460
aacaaaatcc ttggcatcaa ctgccaaagt cgatgttaga aaataatttt ttttttttaa 2520
acgctagaat tttatagaag gataacagaa caaaggttct acaaggatca tcttcaatca 2580
aaagagacaa agagaggtag aaatattgac ctaacaaaat aggtaactaa gccaacatgg 2640
atatcctcta gcaatataag attgaaaaaa atcctcctgg atcacacttt ttgcaataag 2700
tgttgctcct ttaatgttat gataagagtg gaattgagtc ttccaatccg ggaattcatt 2760
cagtaatggt aagacctttg aagagtagaa ccttatagaa ggccatgcag atggtttaga 2820
gatggcgcca atcaggtcat gatcatcact agcaaagatg atggagctga aatggagagt 2880
cttcaatatc tcaataggcc atctctagtt ttctagagag gcatcctgtt tgcacgaagt 2940
gtcagagaag gatcttcttc catggaggag aattttacct tcgctgctac gaagaatcct 3000
agagtaacct tgagtcgtca gtaggtatca ctgcttcttt gtgtgttgat tgatttttgt 3060
actcatcttc ttcattcatt gttctggagg tttaacttcg actttgtgat ggcatctaga 3120
aaaggatcaa agctgaggaa agcagggtat accaatttaa agggtgctga ttctactgct 3180
tcctcagcga cctcgtcttc aaagctttat caggagacat ctattgatga tggccatagc 3240
tcccctgctt cttcatctgc tcaaagcaag cagcagttct tctcatcaga ttcgtttcca 3300
caaagctcta agccttctaa agaaaacgtc acagtgacag ttcgctttcg cccactcagg 3360
ttcagagtga aatacttgta tatgcttgca aatataaggt tgatgtttgt tctgtgaatt 3420
tgacatatat tttttccttg acgtagtcca agggaaatcc gcaatgggga ggaggttgca 3480
tggtatgcag atggggaaac aatcgtaaga aatgagaata atccgacaat agcttatgcc 3540
tatggttagt ctttaacaat ttaattagtg tcatggtgaa cacatcactc aaaaacaaca 3600
aaactaagga caaatagtat tgttcttatg tgatattcat tttcacttgt aatcatgtct 3660
taaaatagga ggactaagat taaattggat attctttttt ttttgatatt ttgatttccc 3720
atgttgtttt cttgaagttg tctttcaatc tgttaatgat tgattctctt tctggcagat 3780
cgtgtctttg gacctacgac cacaacacgc aatgtctacg atgttgctgc acaccaagtt 3840
gttaatggag ctatggaggg gattaacggt atgaagtgac cagttttaat gataagtcta 3900
ttttaaaata gaagaaacga agagcagcga cacttgccgg cggcaattct gtaacaacac 3960
tccactgtaa ttcctctctc atgcttgtta ttttttggtc gctgttctct gacgcgcgtt 4020
agagaaacga acagggcttt tgtatttttt tttgtcacag attatttgtt gaaagactgt 4080
tcttagtgtg ttattcttca gaacagttga tttgaatata atgacatcaa tgttaatcca 4140
ctacagggac catttttgca tatggagtga caagcagtgg aaagactcac acgatgcatg 4200
taagattccc taataccgtt tgatttcaac acaccctact gttgaaaact tgaaaccatg 4260
tttgcattta actttagaat gtccatgact tacgattaat attatctgat agttttggtt 4320
aattttttgg ttcaaatgtc agggtgacca aagatctcct ggtattatac cgttagcagt 4380
gaaagatgct ttcagcatta tccaagaggt acttttgtag gatattggtt cgtccagatt 4440
ccttggctta agtactagca gcctgacata ttaatctttt acagacacca aatcgagagt 4500
ttctcctgcg tatctcctac ttggaacttt ataatgaggt gctattattt acctattgtc 4560
ttgtctgctt tatattcatt ttcaatagta gcagagagtg atagaaataa ttttcctttg 4620
agattactat ctttaaggtc caccttattt caggttgtca atgatttatt gaatccagaa 4680
ggacacaatt tgaggatcag agaagacaaa caggtatgtg actcactttc agatcacctt 4740
ttgatacatg caactacttc tcttgttgac tcgtaatata tttgttgtgt ttacgagtaa 4800
tatattttgc ttatcataga atcttttatt gggaaccatg gttaggctat ttggtacctg 4860
aaaatatata ttggttccat tatgaggact ctgctattag aatgctttca tatgtggccc 4920
tttgtttcat tgcaatgctc tatgtcacaa tgttttcaag cacatttgaa gttgatcctc 4980
ctaattatca tttgaaatga gaattgtata atgagcttct catggctttt attcaatttt 5040
ttttaattga acccattttt gttgattcca gggaactttt gtagaaggga taaaataact 5100
tcctctttaa gatatttcgt ccttcaactc tgtcatgatt tggtaaattt ccatattatt 5160
caatgcatgc ttagtaaatc tttttcctca tgacagagca acgccatgtt ggatcaacaa 5220
actttaattt gctcagcagc cggagtcata caatattaac gttggtatgt taataatctc 5280
tttgaagcaa gggagaaatt gctatctgtg tgcagttgat atatcatttt tttctcctga 5340
caagattaaa agtgaagctg tacacctctc acagctggta agctactctt ataaccagtg 5400
atatagttag ttatgattag ctctttcgtc tacgctaaag cgaattcaaa taatattaac 5460
tacccataat ttctctcata tttgcagaac ctcgttgatc tggcaggttc cgagagttca 5520
aaggttgaaa ctagtggctt aagacgcaag gaaggatcat atataaataa aagtttgctg 5580
actttagaaa ctgtgagttt ttttcttacc acacagtttt ctcttagtca acaataggtt 5640
ttggagtcaa ttcagatagt acttttgtga tgttgtaggt gatacaaagc tcagggatgt 5700
gaaggcttcg catgtaccat acagagactc taagctaact aggatccttc actcctcact 5760
gagtggtcat ggccgagtat ctgtaagtcc ttttagatct gttctcaatc ccctttctta 5820
tgaaatccac aacatgatta aaaacatctt gataacctta agcacatact ttgctagtta 5880
tgtactttac tgattagttg tccctttgtg gatatggtag ctcatttgta cagtaactcc 5940
tgcatcaaga agttcggaag aaacacacaa cacattgaaa tttggtcatc gtgcaaagca 6000
tattgagatt cagcccgaac aaaacaaggt tttactcgca tatcttctac ctgcctttat 6060
ttttttggta ctaacactac aaaactgcag ataactgatg agaaatcact aatcaagaag 6120
taccaacatg agattcggcg actgagggag gagttggaac agcttaaaca ggacattgta 6180
ccagttcctc cactgaagga tatgggtgca catgatacta ttctcctgaa ccagaaggta 6240
tgctcgaaag ataccttcca tccccattta tacttttgta gtgattaagg gatgtttttt 6300
ttctgaatag agttccaatt ttgaaaactt aaaatcttgt ttttaattgt cattcatgca 6360
ttttcctgtc agtgataaaa gtttaatatg aactgataat agttgaaacc cacttatacg 6420
ttggattaga caagtaggag gacattttgt gtcattgtgt tttagttaca atcacgcatt 6480
tgagagaatc tgtagtaatt ttgttgtttc ctttttttgg ctatataacg tgataataga 6540
agctagaaga tggtcaagcc aagctataat caagactaga ggaagaggaa gaagctagag 6600
cagctctctc gagccgaatc caacagttga cgaaactaat attggtgtct actaaaactt 6660
cactgacata tcgcttacct catcgcttta atcctcggag aaaacactca tttgaggaag 6720
aagaggtaga atcactgata tagcttgaat agtataaatt gtttacacgt tcctgtggag 6780
ggaagtcctg agattagaga tgttccatgt agagaagaaa agaagagccg gaagcatggg 6840
ttgttaaatt ggctaaagcc taaggtatac aaatgtctga ctttttgttt aaagaataat 6900
gctataagta atagtagaaa tcaccacaca gccttgtctc ctcttaggtg cagtttcttc 6960
ttttaattat tctctggtca actccccttt gttgatccga gcttactttt acctatcaga 7020
aaagggataa cagttcaagt gctagcgacc agtcgagtgt ggtaaaatcc aacagcacgc 7080
catcgactcc tcaaggggga ggaagttatc tttacacaga atcaagactt tcagaaggat 7140
ggcctttgat ggaaggaaca actctcagag tctagagaag acagagaagc tcctgaagac 7200
atggagactc tggaggtaca taagagatac tttcacatct gtaatggcgc caaagtaact 7260
aaatcattca tatgtgctct tgttcccaga ctagcaataa aatcatcgat gagttggatc 7320
ttatgagagt gcagaaaaag attttatctg agggggtggc gcttcaatca agttcattga 7380
aaaggttgtc agatgaagct gtgctttaaa tctaccaaat attcaccttc ttggttctct 7440
aatgttactt aggaggagat taatgcccta catgatggca tcaaggcaaa gagtgaccag 7500
attgccacct tggagaaatt aacaaatctt ggattatgtt atgacaacac atgaggcatt 7560
ggataaatct gacatcctga aggtaggttg ttgacattgc aaagtattat gcagtgagtt 7620
ctttttccgt tgctcatttc acaagcggtg ctctattatc ttcaggcagt tgctgagctg 7680
agggatcaac ttaatgagaa atcttttgaa ttcgaggtga tcgaattgtt tatgtgttta 7740
catacaatac ttcttcatct attgatccag cacctagagc tagctttgct attgattaga 7800
taatatatgt tcacacctta gtaaagttgt ttctctgcaa atattagtgg tcaaatgcca 7860
gactatttaa cgaagaagcc aaatcatatg ctctacgttt cgactcatca ttacatcttg 7920
tttacaggtt aaaagctgca gaaaatcgca tcattcgggg aaaactcaat caaaaggtca 7980
gaggctttgt ctttggagaa gcttgtaaac taggtttgta atgtgtagtg gaattgaata 8040
actgatgaat tattttccgc agacatgtga acgtgaagta ttgcaagaag aagttagaaa 8100
cctaaagcag cagctctcta attcccgcaa actagcacag gtctatctac atacatttta 8160
ttcacgcctt acaccaatct tctagcttaa tagcttcatg actctcaaca taaaatctct 8220
ctactttctg ttatgaaagg aaacaaagat cgaagagctg aaatggaaaa cttaaggaac 8280
taaacgaatc taaggagcaa ctagaacacc gtaacaagaa actcgcggaa gagagctcat 8340
attcaaaacg ccttgcatca gcagccgcag ttgagctcag ctcaaggcat tagccgaaga 8400
agttgcaaaa ctaatgaatc aaaacgagag actatcagct gagctagcaa cacagaagaa 8460
ctcagtcaca cagcgaagca acaagacagg aacaacaaca acaaatgtaa ggaacggacg 8520
aagagagagt cttgcaaaga gaaatgaaca agacaactcg tgggagctaa agaaagaact 8580
aagaatgagc aaagagcgtg aactatcata cgaagccgca ctcgttgata aagatcaaag 8640
agaagctgag cttgaaagaa tcgtaaaaga ctcaaaacat agagaacgag ctcgctagca 8700
tgtggattct tgtttcctgt gttttaaaag gcgatcgcct tttgcgccaa ggcgcaaggc 8760
gcaccggggc gatggcccta atgcctcagt cctctaaggc gagccctagt tactcaaggc 8820
gctcgccatg gtgcgccatt ggcttaaata taagcgcctt tgaacctctt aaggcgcttg 8880
tagtttccgt taaacactac tttgacggaa tccttaaaac atcttggaac tctatcacta 8940
ctttgtcgac catttaaata tcctaaaaac ataatgctta gatcttcaga gttataggtt 9000
ttgttggatt tgagcaattg aatttagctt tttagtttca agttctttgt tttgatttga 9060
tgttttcggg tttatatatg tgtacatagc tgactatatt agtgtgcatg actaactcgt 9120
tgctgactat attagtgtgt ataaataaga cagtttggta tagctgactg tactagtgtt 9180
atatacgagt ctactctata acttatcttc tgtacgtaac catagaaata gttacacgtc 9240
tgtagcttac acatacactt ctaacctaag aacatctatc aatgcatatc taagttcctc 9300
taaagctgta tataactaaa ccacgtttga atgcatccta accataaggc gagcgccttg 9360
gagcgccatg gcgcaaggcg catggctcca acctcctcgc cttagagcgc catgcgccat 9420
ttaaaacaca gcttgtttct aagctgagaa gatcacaaag aagctgattc tgttaccata 9480
tcagagacac cgccacaaaa acttaacaaa gacgaatcca aacaaataca taatcatcac 9540
aactttaaat tgtttcttat tccgaagaat taaaaataaa acaaaaggat agaacaatga 9600
tcaatactaa cggatcagtc agttagtctt gggatcaggc atggggaaca aaccagcacc 9660
agcagcgcca cgtggcggag aaaaccctag aaacttctgc agattcgtcc ttatactaat 9720
cgaacacagc aaatacaaaa acgccatgga acaatccgtg gcatcatctc ccttcaaccc 9780
cctgtgactc atcttcttca cgatcgcgat cggatggaac gggagcttcg cgacgacctt 9840
accttcgaag agcgagttca acagcccgaa gacgacgaag aggacgaggg ccacgacggc 9900
gccggatttg aacttgaaga gggacagatc tcggctcgac tccttgaggc tcgtctcgac 9960
gcggtccatc ttcttggtct tcgatttctt gacggtgagc ttggaggaag ggttctcggt 10020
cttcatcgtc tccagcttct tggcggcttt gtcgattgag tattttaggg atttgtagga 10080
ggtggtgcgg tagattagga tccacgagat ggcttcgcag actagcgccg tgcagaagga 10140
gatgccgacg acggttaggc tgtcggcgta cttgaaggag gcgaagagtg ggatcgtcgt 10200
cgccattggg atttagtttc ttctgctttc gcttctgttc tctctctctc actgtggaga 10260
tctgattagg aattgggtaa aataaaagtc aatagagggt acaataagta aataaggaaa 10320
agtttggggg acttttagaa atacttttta attttacttg taaccaatac ctttcgaatt 10380
attagaattt accccagctg ttttttttat tccttgctat gcaaaaccca aattacaatt 10440
tttaacatta gcataaacac tgtggtgcac atcaaatagt gtaaacttgt aatcatgcag 10500
atgtatgttt ttactcacag aaaagaagaa gcaagggaaa aaaagattgg taagtttgta 10560
ccaaactcat tagttgtatg ggttttatgt actagattat tttttctagg tttgatttga 10620
atcagagttt atttgggttt tgattagaaa aatgtggagt aaaagagagt aaataataaa 10680
gtggaaaatg gagaaaactt tggaaattga aatgaaaaga gaacaaaaaa ttagaataaa 10740
actcgtttca cttataaatc ccaaaataaa tatgtgagtg ttttttttta atttcatccc 10800
tcaacttaat gatgctacat agttaacatc acgaatttat tttcattcat ctaaaaattg 10860
atgtagattt tagaaaccgt ttaaatctta tgtttttatt aattaaaata tgatgtacat 10920
ggcggtaatt taactaaata tgaaagttac ataagatatt atttaatttt ggttttcaat 10980
tattttaata tgttttctta ttaactctta ataaaatttt tgtaatttat ttgattaatt 11040
gtgtggaata tacttatttg atcatttttt ttattataaa acttatttca tgtcaaatta 11100
ctgactctaa cattttattt gtttgatata aaattaaata actaatgaat tattttattt 11160
atatattcat aaaaaaaaat tgcatacatt ttaaaatgta tcaaataagt atatatcaga 11220
caattaatca aatgaattac atatttttta ttaaaatttc ataagaaaat ggattaaaat 11280
aatttaaaaa caaaattaca taatatctta tagaattttc atatttaata taaataaaaa 11340
taatataata atatattttc atatacacaa aaataaaaat gttaaaacac tacttataaa 11400
aaaatgttaa aacatattga ttttgtaaaa tcaattatgt taaaaatatt cttacacttt 11460
taaaatgtgg gtcaaaatct catttagtta aattacggcc gggtcggtca tattttaatt 11520
gatgaaacga gatatttaaa cggtttctaa catttacatc aatttttgga tgaacgaaat 11580
taaacttatg atgttaatga gatatgttat catgcataat atataattcg cgtagctagg 11640
tatacattag tttagtttgc atggttaacc atgtgaatga ctaatacttc aggtagttag 11700
caaatatttt tttccttctt ttaatcaatg aacctaaatc cggattgaaa tcctgataat 11760
tgaattcaac ccaatagaac aatagtgtta tcatagttac aactaaaaaa aaacttaaca 11820
gacaaatcta aaatttagaa atggaaatat gagaaggaat ggaaaaactt aacagacaaa 11880
gcgtttcaag aagaaaaaaa aattctagag gcttcgtttt gcgttagttc attataatgc 11940
aagtagagcg aattcgatga tttatttatt ttgaagtacc atctcattag atggtatttg 12000
tttctagtgg attttgtatg taaaatcaac taggtgatta tccactcaca tgtgtggagt 12060
aaaatgtata tattctaata attgttgaat atgaactttg tccgtataac cataattata 12120
ttattcataa gcctatatat gtattaattt gaatatctat taaatgttag tttactcgta 12180
tggtttttat gatcatttat attttattat aataaaaaat ttaaactata gatcataaaa 12240
ttttcagtgt gagagtttta acaattttca ttatttatag tcgtttttaa acattcaaaa 12300
tataatatat acgaaaaatc tattttttat tatatggtta atatgattgt ttaatttatt 12360
ttaatactat aacattaaaa aataatgaag atatgtgaat tgttgtcaag tctttattat 12420
taaaattatt aattgtcaaa tatatatttt agtcacgttt ggtaattccg taaattttat 12480
ttaagaaaaa aaaacaataa ttatatattg ttaattaatt tcatggttat tctaagtaga 12540
agtatataat acatgtttaa tagaccaaaa tatttcttta gagactttaa gaaacattat 12600
agtgatgaca cgtgttatag ttaaaatgtt gtaatgctta tcttttaata tatagaagat 12660
tatctaataa tttccaataa ctcttgataa atactaggaa aagaacccgt gcgatatcgc 12720
acggtaactc attttgtaaa aaatacaata caaataaaat tacaataatt tttgaagata 12780
atttttttaa attctttata agagtgtata tatatatata tgaaaataaa tgaaaagcca 12840
atttcatata ttttgataaa aaatttaaaa acaaaggcaa tttcatgtag tgatctttga 12900
tgatctaaat aatgaatctc tttctttttt agtttatttg tgattgttgt gattttctaa 12960
ttttatttgg tgtttattgt ggttgttatt tgtcattttc gacaactatt tatatatatg 13020
actaaggatt gcaatagttg acaatcaacc tttgcaaagg tttaactaag ggttacactg 13080
gttaacacca aaagttgcaa cagttcacaa ctaaaaacaa taatcactaa taattgtaat 13140
ttttttatca tcaaagaatg taatggttca acactaacag ttgcatcatc taaccaattg 13200
taactattca ctaagacaac atactccact taaacagtct caaagattca cttaaatctc 13260
taacaattat ttcttattta attattatca gagattcaca aaataaatat cactcgtatc 13320
aaactcatgc acgaataaaa atgtacgtaa catcaattcg aaaaacatca taaatgtcta 13380
tttatttgat agataacaaa atggatcata tatttttata aaaaaatagg atcatatatg 13440
cgttgtacgt atataatttg acatatcatt aaaccttgta tcagatgtga tgtcaaagtt 13500
actaatatgg tagatagatt attctttgaa aaagtatttg taaaatggga tgaccgatga 13560
ttaatagtag cttaacagat ctctcttcac aaaaataaat aaattaatag actatttaga 13620
agaaataaaa tatcagatgt aaaagttgga atcttcgatg tataaatgtt ttcaaagagg 13680
tgtctttgga agaggtttaa gccgttttga tttgaaggaa tgcattgatt cgagaaaggc 13740
aaaagcgttc tttggtttaa taaatgatga tgtcatctat ttaaaggaaa tctaattttt 13800
aaccattaga ttattataaa ataaagcaaa tctaacagtt agatatatct ttttttccta 13860
taaaaaatga tgatattatc agttaacaaa aaaacaggtt tcctattatg tatagaaaat 13920
ttaaaaaaga agtaagaaaa acttgctttg atagtagcaa atgtcatttt atttgcataa 13980
cttcttgtat atctgccaag aagaagcaag gttggtttca aggtgactct ttaataaaaa 14040
caaataaaca cgaaccaaaa acaaaaaatc agtttaatac ccagcgagtt gattattgat 14100
catccatggt ctccagttat caataaccga atagttgaga gatcttatcc aagcttgagt 14160
cccaatgtaa ggtactgtca tatcgtgatc accaatgttc acacaaaacc acacaaatat 14220
ttacataaag attttgaatc ttggtgggag aaaaaaactc tgacctgaag atgagagaac 14280
gatagccatt gatgctatta tccatatggt aaggtacatt acttataatg tcgttactgt 14340
aaggaatatc caaattacat cgtatccatc tccctatgct ctactacaat tatagatctt 14400
cttaaaaaac ttgacagcgc ttctttacta aactctttga aatgaacagt cttatatacc 14460
ttcttgattt gaagagcttt gcgtacgctt tcgctttcgt catttgccca gtaggtagct 14520
agcaaatacc tataaatctg caaaagcaac cttatatatg ctttgtttcc tgaatggttt 14580
aacggtaaag aaagaaggtt aaaaatttat aacagtagtt attttaaaat tatacttata 14640
ataatagtca caacttttca ctttttaaaa gatatctata cataatagca aactccacat 14700
tctgtgtttg atgacatcaa cattttttat agcaaaataa aattgaaatc ggacggttga 14760
gattattgcg gttatgtaat ctagtggata ttatttaagt ttcatttagt atatgatgtc 14820
atccgttatt atatctaaac gatgtctttt tctttttgaa acgttgcatt tttgaaacat 14880
tgcttctgaa gagacacgac cctctcaaaa taataattct tatatctaac ggtgtcttgt 14940
ttttgaaacg ttgcattttt gaaacgttgc atttttgaaa agatacgacc ctctcaaaat 15000
aatagttctt aaatcttaac aaatttatat attcattctt tatgacttcc ctacttcccg 15060
tcatcattgt tcttttttct ccttcactta ccatggattt cttttgttct ggaaataacc 15120
gtctctctct aagaattttc atgtctgttt tcaccaccac cgccatcctc ttttctgttt 15180
gttatgttaa tctccatcct cattttctgt ctccccaacc cactactata ttaatttact 15240
cataaccgtt gaaatattag aacatgtgtt gtcctcatga aaccatttga tgatatttta 15300
accgggagat tcaagagact gaaatttata aaagggaaat atgatttcat gtttcaagaa 15360
ggaactgaca atcataatca atttaactta caaattagcg agaaaagctt tagcgagaga 15420
attccgatga ttctccctcc actgtttcca ggccttatga gaatataatc catcctagga 15480
aaattaattg taccaaaaat ttaacaaaaa aattcaccga gcatctttcc acaaatcctg 15540
tatatctgaa gaaaataata attgtgttga attctttata attgtgtttt ttcacaattc 15600
tttttgcacc atcaaatcat catatatcac tctcactaat acgcatctct tcgctctcaa 15660
ctggctattt tcagccaatt gttaaacaat ttttttgatt tccggctgac attgatccta 15720
gcactggttg ttttctcttt ttatttactt ttgtttttaa tacatttaga tctcggttta 15780
ctaccattaa aatcagtgga agagacttat aattgaaaaa tgcatggcgg agactattta 15840
tagattttta aaatctattt gaatagtcac atcccttcaa tctgaatagt tgcattcttc 15900
taatactcac aacttttcac tttttaaaaa atacttatga atagtcacaa cttttaaaca 15960
atttttagaa aagacacaac cttacaacat agaactttta gaaaagacac aaccctttac 16020
acatcttttt caaaagatac aacctttcaa tataagtgag attcacaacc tttggaatta 16080
atgaggattg ctattattag tagattatga gtgaaatctt tgttttccag taaggagaga 16140
ttcgaaagag ttttaataaa tgattaattc aataagagtg gatttgatag aacttttata 16200
aatactaaga ggagatttga acaaaaacta gaattctctt aaatcataag ccccctttgt 16260
tcctatctgt tttttggtca ccattccatt ccagaaaatg cttttaaaga taacaatcac 16320
aacattccaa atgtagaaaa ggcacaatct caacattcta aacctgcgtc cacctaacaa 16380
aaaacaattg ccttctcgta gtttactcca aatacaaagg gtgtaatata acaacagaaa 16440
cactcaacac tttaccgaac acacacgttg ccttctctcc taactcctta aagttcaatc 16500
ttcataatct ctctctgtct ctctctctct ctctctctct ctctgacaac agagagactc 16560
ttcacgtgcc aacaaaaaaa aactgagcac cttcctctcg cccatggcca cggactccgt 16620
caagcacgtg cctacattcg gcggcgcagc catctctgaa atgaaaagct tcttctccgc 16680
catgaaacca agaaaaacga tcataacttt tgtctacgcc ttcgtcataa cctttgttgc 16740
cttcactgtt tacttagcct tcgccccttc cctcatcact atctctaatt cagtttcttc 16800
ctatatcctc cctaatgtca gtgccgtgac ttcagcgtcc agtaacatca cattacaagc 16860
aaccacgccg gaaagtctca ctccggctgt tataaacaca acctttgagc ctcccctagg 16920
taatgaaaca aacccacatt ctagaaacaa cgcttcacgg tctcatgcaa gtgtacactt 16980
atgtcctaac aacaacactg ctcgaaattc ggacaaacaa gcacctctgt ccgtgaattc 17040
aagtgcttct tctccgatga gaaaacaaag taggaagtca ggggctaaac gagagatcaa 17100
gtctctgaag gactgcgatt ttttccaagg agaatgggtc aaagacgaat cctacccgct 17160
ttacaaaccc ggcacgtgta atctcatcga cgaacagttt agctgtttaa ccaacggaag 17220
accagacgtt gagttttaca aactgaagtg gaaacctaaa gaatgcactt taccaaggct 17280
gaacggaggc aagttgctgg agatgattag aggaagaagg ctcgtgttcg ttggagactc 17340
gctgaataga aacatgtggg agtctttggt ttgtattctt aaaggatcag ttaaagatga 17400
gagacaagtc tttgaagctc atggaaggca tcagtttcgt cgggaagctg agtacacttt 17460
ggtcttcaaa gtaagtttgc aatctgtttc ggtgaggcct gcgggtttgg ctagtttggg 17520
ctgggtcgtt cggttcgacc aaaatatcgc ccaactgaac cgaacagagt ttggttcggt 17580
ttaggtagtt cggtttttca acttctttta ccgaaactaa tcaaagtttt tggtttcaat 17640
tatatgttgg tttaaaattt ctttaaattc ggggtaattt ggttaattcg gtttgtcggt 17700
tattttgatt cgaatttttg attagtttag ttagcttttt tttggaaaac ccgagctaac 17760
caattactga agtgaaaacc gaagtatttt ataagcttgc cgaattgaac caaactaacc 17820
aaaaattttc gttcggttcg gttatcaacg aggcctagtt tgactaccta gttgttattg 17880
gagacttgat ttgtgtggtt gatatgatag gaatataatt gcactgtgga gttctttgcg 17940
tctcctttct tggttcgaga atgggaagtt acggacaaga acgggacgaa gaaggaaact 18000
ttgcgtctag atatgatggg aagctcatca aagcagtaca taggagcgga tgtacttgtg 18060
ttcaataccg gagcttggtg gactgatgac ataacatcca aagggtagag ttctgtcagc 18120
tattttttat ttttttatat ggaggatttg tctcattggc tttttggtgt ttggatggtt 18180
ttgattagtg aggactattt tcaagaaaga agcactgttt acccgaaact caacgttgat 18240
gaagctttta gaaaagcatt gactacttgg ggtcgatggg ttgataagta tgtgaatcca 18300
aagaagtctc ttgtcttctt ccgcggattc tccctgtcac atttcaggta tgtacagttc 18360
tttcatggta gtcttaagat tctgtttaaa aaaataaata aatgggtttg gtctggttgc 18420
atgcagtggt gggcgatgga atgcgggagg ggcgtgcgat gatgaaacag aaccgatcaa 18480
gaacgaggca tacctaatgc cttacccttc caagatggag attcttgaaa gagttctaag 18540
gggaatgaag acaccggtca cgtatctcaa catcacgagg ttaacagatt acaggaagga 18600
tgctcacccg tctgtttata ggaaacagaa atttactgca gaagaaagca aatcaccgtt 18660
gttgtaccaa gactgcagtc actggtgcct cccaggtgta cctgattctt ggaacgagat 18720
tctctatgcc gagatgctgg taaagctcga ccagctccgt ggcaacagac ggcggaaacc 18780
tgaagggcta ctataggagg agttgaatca tattcttgtt ttagatgaaa tacacaatat 18840
atattttcaa tggatgaaaa gaaaagaaac acttagaagc aattatatgt tttcaaaggc 18900
atagagaaag taagagatga gaatcatatt actgccttgc tcatcacttt tcttggttgt 18960
aaactatgtt catgggagag gtttgagatt gtaaatggtt aatttttatt ttactcaatt 19020
taatagtaag gtttgtcaaa tcataactga accggaaatg gaagcaatca tttggttaaa 19080
agaatccggt tgatgacatc gactggcaaa gcataggcag gatcaatttg gtttgactcc 19140
aggatactcc agccctgcac cagttttgga tcattaagtt ctctttagct ttgaagacct 19200
taacagtatg tactaatgag acgcaaattt tagtcacctg caactccaaa gtaagtgtga 19260
aagatatcaa cagcatcgtc aggtccattc tccatatctt attcaaatta cacctgaaac 19320
tcagggaagg ctctaaagag atgtgagttt tatcaaccaa tgtttgagaa aaacctgaca 19380
gtccaagatg aactttacaa gctttgattt gtcaatccaa tggactctgt tggtcatgat 19440
aaaactcgat aaaacccacc aagagtggca aacctggtga taattaagca agaacaatca 19500
gtgtggtaag tgttaggata atgacgtatc attatagaga taatcatagt ttaagataac 19560
tgttgtattt atcttataga taactatgag catgtgataa gatcaacttg actctatcac 19620
atgatctcga cttgtataaa tagagagctg cagacatcaa taaacttaag ctttccacaa 19680
tacaaatctt atatggtatc agagcaattc tcgatccaaa tcgtttaaat ttttcttttc 19740
tcttcacgca aacacaaaca tcgttaacat gtctgatcaa aacagctctc tcacaactgc 19800
cactgctaca cgcaccgcag tctatgatcc cgcaaaccct gcaaactcgc ttcttgcggt 19860
taacatgtcg aacgttacac gtttgacaaa caccaattac ctcatgtgga gcagaaaaat 19920
tcaagccctc cttgaaggtc atgaactcca cacttttctt gagaaaacag aatccactcc 19980
agaggcggtc ctcatcaaca atggcctcgc agaacctaac ccggcgtatc taccgtggag 20040
acgtcaggac aggctcctat acagtgccat cattggtgct atatcccttc cagttcaacc 20100
actcgttgca agtgctacaa ccactcatga agtctggagc acacccaatc tcatctttgg 20160
cacaccaact cgcggacaca tcaaacaatt gaagttccaa gtcaagagct gcaccaaagg 20220
aacaaaaacc atcagtgagt atctgcgtct tatcaagacc aaagcagatg aactagcact 20280
ccttggcaag cccattgacc ctgaagatct gatagagcag attctagcgg gtctctctga 20340
ggaatacaaa gccgaagttg atgcaatcaa cggccgagat catctgatct ccttctctga 20400
acttacagag aaacttctta accgagaagc catgattgtc tgcgatcaac cagcaacacc 20460
gacgtttcca gttacagcta acaacaccac aagaagcaac accaacaaca ataaccgcaa 20520
taacaacaac aactggcgtc catcctttgt cccacgacaa ggcaacaact cgcctcgccc 20580
atctcgtccc taccttggaa gatgtcaggc ctgcggaatt caaggacata gcgcccaacg 20640
gtgtccatca ttcaaagtca ttgcaaccaa ctcaatgcag caaaacaccc aacacgctca 20700
gtggcgacca catgccaatg caacgtacat gacaaaccaa caccctgatg cttggcttat 20760
ggacagtgca gcctctcacc atgtcacgag tgatctcaac aacatggctg cacacatgcc 20820
atatgcagga ccagatggca tagtgattgg gaatggagcc aatcttccca tcacacacac 20880
cggttcactt tctcttccaa cttcatctaa aagtttcaat cttaatgatg ttctttatgc 20940
tccatctatg caaaagaatt tgatctctgt taaccggttc tgtaaaacta acaatgcctc 21000
tgtggaattc tttccaacta tgtttcaggt gaaggatctt ccaacgggga caccggtgct 21060
gaccgcgcca gttaatggca acctctatga atggcctacc aatgactcac gcactcctct 21120
tgctttctct gctgtatcat catcgtcctt agactggcat cacagactag gacatccggc 21180
ttttccgatt ttacagcata tttcttcttg tttttctcct ggtttttctt gtcgttctcc 21240
aaactctctt cattgcaatg cttgttctat taataagagt cacaaattgc cattccataa 21300
aacatctatt acttcctctc gtccgttaca aattcttttc tcagatgttt ggtcctctcc 21360
catcttttct tttgatggtt acaaatacta tttactcata gttgaccact atacaagata 21420
tatgtggttc tttcctttga aactaaagtc acaggtcgca gccacattca ccagatttaa 21480
ggagctcgtc gaaacacagt tccaaacaaa gatcacaaca ctctatagcg acactggcgg 21540
tgaatacatt gcactccgac cattccttgc gcagcacggc atctctcacc tcacaacacc 21600
accacacaca cctgaacaca atggcctatc cgagagacga catcgacaca ttgtagagac 21660
aggtctttcg cttctcactc acgcttccat ccctactgaa tattggacat atgcctttgc 21720
tgcagctgta tacctgatca ataggatgcc aacgaaagta ctttcaatgg acacccctta 21780
caatcggctc tttggaactg ctcccaacta ctccaaactg aagatctttg ggtgtctctg 21840
ctacccgtgg ctgcgaccgt acacatccaa taagttggaa ccacgctcca ctccatgtgt 21900
ctttcttggt tattctctta ctcaaagtgc ttatttctgt tttgatccct ccacttctcg 21960
agtctttgtc tcacgacatg taacttttgt tgaacataag ttttcctttg tttctttaag 22020
tgccaatgtc tcttccactc cagcaacaga ggagctagcg tgggttccta cggtggaacc 22080
tttaggtcag caacaggtac tcgtggagga gccctcaccg gaaactggac ctgcaccaac 22140
aacggcatct ccaacaccaa cagcacctgc ttcaccaaca gcacctgctt caccaacagc 22200
gcttgctcag tccacagctg cccctcctgc tacaagctct cagccaacac aacatgccat 22260
gacaacacga tcacgcaaca acattgtcaa acccaaccca aagtatggct tgacaacagc 22320
acttgccccg tacgttgagc cacatacaat cacacaagct ctggctgatg agcgctggcg 22380
gaagtctgca actgcagagt tcaatgctca ggttgtcaac aacacatggg atctagttcc 22440
agctgaagaa gcgacaaacc tagttggcaa caggtggatc ttccggtaca aatacaaccc 22500
tgatgggact gagaaatcac tgaaatccag actggtagca aagggatatc atcaacgtcc 22560
aggaatagat tatcatgaaa cattcagtcc agttatcaag tctccaacaa tccgacttct 22620
acttgggctc gcagcaaaat atgactggcc tcttaagcaa ctagacatca acaatgcctt 22680
cctccaaggg actctcaatg aagatgtcta catggtccaa ccagcaggct tcatcgacaa 22740
ggacaaacca aatcatgtgt gcaaactcaa caaagccctc tatggcttga aacaggcgcc 22800
acgtgcttgg tacacggagt taaaaacata tcttctcagc cttggattca aaaattctgt 22860
tgcagatgca tctctgttct ttttacatga tcgagggatc gtcatcttca tgctaattta 22920
tgtcgatgac attgtggtta ctggtaactc tctttctcgg atccgtgaca tcatcaacaa 22980
cttgtctagg cgattctctc ttaaagacct cgatgacttg ggatacttct taggcattga 23040
ggtcatgcgc tcgtctcagg gtattgatct ctctcagaga aagtacattg ctgacctact 23100
tcatcggacc aacatgacac acgccaagcc agtaccaact cccatgtgcg cctccacgtc 23160
gctctctata cgagatggta ctaccttgga taatccttca gagtacagaa atgttgtcgg 23220
cagcctacaa tatcttcttc tcacgcgacc tgatattgca cttgctgtca acaaactctc 23280
acaattcatg cacaagccct cagatactca ttggatggcg gctaagagag tgctacgtta 23340
cttggctggc acgtatacct ctggcatctt cctctctcgt cagtgttctc tctccctcca 23400
tgcctattct gatgcggatt gggctggcaa caaggatgat tatacctcca ctggtgcgta 23460
tgtcgtcttc tttggtcaac accctatatc atggtctgct aagaaacaaa cgggaatagc 23520
acgatcgtca actgaggctg aatatcgagc tgtctcagct gctgctgctg aggtacgttg 23580
gctctactcg ttactgcgag aactacacat tccaatcatc tccaccccga cgatctactg 23640
cgacaacgtt ggagctacct accttagtgc caaccctgtg tttcattcac gcatgaaaca 23700
tctagcactt gactttcatt tcatacgtga acaagtgcag aatggagaca cgtctcatca 23760
aaggatcagc ttgctgatgg tttaaccaaa ccgctaccaa ggaaccggtt tcaactcctc 23820
tttaccaaga tcggcctcaa taaccgtgct ccgtcttgag gggggatgtt aggataatga 23880
cgtatcatta tagagataat catagtttaa gataactgtt gtgttttcac tctctaactc 23940
cagttcgccc tagctggttc tctctcaggc acggagtcca aggcagccgc acagcttgca 24000
tctccgccag aatgaaggtc tctttccggt gcagctcctc ctgtcctaat cacgagcctc 24060
tcttccgctg ctgatgacgt ttcgctcacc atcccgaagc tctccctctt ctcctccaat 24120
gggttcctct gcaactgtcc cgtttggttc tcctcccctg ccgcctgaac caccagatcc 24180
ggatcttgtc gtggtgtttc cgataaatcc tccagaccct ccaccggtcc tgctggtttg 24240
tccctttctc cgccagttct cgccgtctta caccgctcct ctcaatcaaa aggaaatcga 24300
atctcttatg ccatgggatc tctgcttttc aaccggttgc ttgctcaagc ctctctgccc 24360
agacgtcgat gtgctatcca cgcagcctgc tctgctgcat ctttcgttgg ctggaatttc 24420
tccctccgga gctctcaact ctggcctgag ttactcctcc tttcgacatt atcccgtttc 24480
aaagccgata attattacct cttgtgtgga acatgttttg ttaaagtcag ccttaagggc 24540
atcaacgatt tatcatcaag agtcgtgtgt ggtttcctta tctgttgcaa gattattggt 24600
atcaatagct gagtgcaagc tgacttccct tcattactca tctcttcaaa gtcttgagga 24660
ctgggcttgg aaggttgaaa tattggtggt gattttctct ctgttggcag ctcttaatac 24720
cgcaatgcag cattttgaag tggagctctc tactgcttta tgcagttctc agtcaaggcc 24780
tatcttctct tgcttcaagc tctcgcaagg tatggtgttt ttaatttgct ggagtgagtc 24840
acgattgttc gatccttgcc tcctagtaga tcttagttat ctcaatacga accccatttt 24900
aattcggaat gaagaggtaa tgctatcctg gattagctct gtacctcttt ttgaggatgt 24960
tacactccct ttgagtttca ggttgaagct ctctttacct cagtatgagg aagttactcg 25020
ttgtgatact actttgttac ctcagtgtga ggattttatt tggactgctg tctctgtgga 25080
catggtttca cttatctcag gcgtgtttag gctatggtgg ttctcctcac agctctcagt 25140
ctcttcaaag aggtgtttgg tcgcctttga gcttgtagct gggtctttcc caattggtta 25200
ctttcagatt tgcccggcaa agggaatgtg gatgcaaggc cgtgtcctcc atcgcttatt 25260
gagtagagtg ggctctggac acgtcgtcaa agcggtgatg attcacaaag cctctcaacc 25320
agcaatatca actggactct caagacttca gattcttccg gactcaatcg tccccttctg 25380
ttccctgcgc ttagggatgg acttgaatga gattacaggt ttcttgagct tcaaaaacct 25440
tgttcctctc ttcactccgt tatcatgtgt ttataatcta cgcacagcat tatgtttagc 25500
tgttgctttt gcaaagggtg ttgtacccag actttgtatt tcaagtactc tgctttgagt 25560
tggatatgaa ataaaattgt tgacaaaaaa aaaaaagata actgttgtat ttatcttata 25620
gataactatg agcatgtgat aagatcaact tgactctatc acatgatctc gacttgtata 25680
aatagagagc tgcagacatc aataaactta agctttccac aatacaaatc ttatagtaag 25740
aacaattgga ataatgtttt gtgtttgtag agagaagctc cgttccctca aatggacacc 25800
tattgtttat tcatctgcga taaactggtc atggcgttga caagtacgtt tccttacctt 25860
tacagttttg ttttaactta ttctatttga tgttatatat gaacatttat acatgtagta 25920
ttgtggttgc tgctgcgact gttcaaaagg agagatcaag aagactttgt acagccatat 25980
taaaccaagt gataagagaa ttagctgttg catttaaacc aagtgatatg aaattattct 26040
cttcttctct cttttgttct tcacattctt cagtttccag caagtaaaaa agctcatatt 26100
ctcacactcc tattcgtctt ctttggctca gcccttaaaa gatcgacaag aatggaggag 26160
gtacatagtt ttttagcact aaaactatta ttcttagttt gtattgaaaa aaaaatgttg 26220
ctggtgaagg aacaatgtca agtctttcac gtgagagaaa tcttgcaacc aaaggggggg 26280
cataataaac tgagactata taagtttcgt ttagttatgt atttcttgag aaataatgta 26340
attctttgtt tttttttttg ttaaagggtt ttataattca cgtttgtgtg ttgagcgtaa 26400
ataaaaggga ccgctttata cgattcagtg atgtttttag tttaatttca gcttctttct 26460
tttcatgaaa ttcaagctac ttcacaaatc aaagatgcat gcatatttgc gtggggaact 26520
acatagacac ccattcaaca agaactctat ttataatcac gtcctaatga atcggtcatt 26580
tgaacaaaaa aaaaccactt cctaatgaat cggtcatact tttattttta aaatagatac 26640
aaagacaccc attcaacaag aactctattt ataatcacgt ccttatgaat cggtcatttg 26700
aacaaaaaaa aatcacttcc taatgaatcg gtcatacttt tattttggag attaatgttt 26760
cataaccaag ttgctttggt ctagtggtat aggagctcca gctggagtgc ccgcccctgg 26820
gttcgagcct tggccactgc ggaatttaac atatgggctg cagcatccga gaccgaaaac 26880
cgttacacgg tgagccacat ggtgacgccc tggcagcgtc catgctcact tcggtctcta 26940
gtctggacca cctcggtgga gccaggatac tcggttagca aaaaaaaaat gtttcataaa 27000
taaaaacaga tatcagtgta cgtagtatcc tcccttatct ttaggattcg attcccacct 27060
tcaacattcc acttttttct catttcagtt tgttatttaa agggtttcaa aacatacaac 27120
aattatccaa aactagattg tttcaaattt ctcaaaagat atttaattcg aagctaatta 27180
tcacgagaac tacaaattaa ttccaaaaat gaagttaatt tcattgatgt gcatcgcctt 27240
tgtcatactc ttgacatcat tcccggctac ggctattacg ttcaaccctg cttgcattaa 27300
aaatcatgat acctgcggcc ccctagttgc tgtaaagggc cggcggtgga gacccgaatg 27360
ttgtaaaatt tggagcggga atgtacttcc agaaacaaga caatgtgcat gttatgtact 27420
gaaacattct ttatttggca atggtgttct tccccttatt ttagctaagt gtaaattagg 27480
tggtatcgaa caattcaaat gttcggaggt ggaaacataa aatagttaac taaccagaat 27540
cgtgaaaacc aaactggaga taataagata aagtaatcaa ttgggtattt ctttatttct 27600
ttctaatcat tttaataatg ttactgttca ataaggagag agaaatggtt tgtttttgtt 27660
catgctcgtg tgaattacga ttccatgttt ttttgtttcc atgtattttc ttatatattt 27720
agtaaaaaaa tgaaaaggta taatctagtc tggattaagt accataaata aatatttgtt 27780
cttaatctta gtgctttgga cttgtaacac caactttatg cgtaataagc atggggagaa 27840
gaagcaaatg aagaattctt cttattcacc aagttttgta atataataat tttcattcta 27900
ccaaaaaagc ctctctctag tattttctct aacttctttc taaaaaagct tccgaccaaa 27960
tagatttgct catgtggcca gtgggctctt tgctgccggt cacccataat ctttttgttt 28020
ttgtttttgc tttgtattat atttcttctc ttcgcggtgg cgataaaccg tggcaaattt 28080
ttgttgtgta ttcaaaatct taattgaagc aaaacttgat gattgtgttg tgttattctt 28140
cgattgagat tgatctttta tgtatgcttc tcctctttca cagttgctct ttaaatcccg 28200
ttcgctttaa tggagttttc ttcttctcta ttggattcgc atgtactctt ttcttaaggg 28260
agtcaatttt cactctttaa aagatgaagc cgatgaatag gctcttaggt ggaggtgatg 28320
ttagagtaat ctcgatgaag atttagatga atcggcatcc tctcggagat ggtccgataa 28380
agatctttaa ttttattgga ttgattgagt aatcccagag ttattaccca atgaagttga 28440
tggtggctct cattgaagcg acagccggat gaaagatagc agatcgcagt ctcatcccat 28500
gtcagatcca gaagtttaaa gactcatgca aaggaggatg agggcgcgtg tcacgtcttt 28560
cccgtgcatg gaactcgaag agcctaatgg accacgaatt aggcctaata aaatttattt 28620
tatgatgatg agtttcaagc ttgttgcttc tcttgtaatg ttcattggta ggcatggaca 28680
ttcggggtcc caatcgggtt tcgattttat ccattcgggt ttcggttttt cgggtttatc 28740
aaaatcaacc ccattcgggt tatataaaag ttcggttcgt gaccggttcg ggttctatcg 28800
ggttcgggtc ggggttagta aatcttcaaa gaaccggtat aacccattgt actttcgggt 28860
tcgggtccca atcggttctt cagtttaaaa atacatgatt tgtacctatt ttgtaactaa 28920
aacataaata aaatcggttc ttcggattta aaatacatga tttgtacata ttttaatagc 28980
caaaacataa gtaaaatcga ttcaaaaata agaaaaaaca tcaaacgtga tcattcaaaa 29040
tcaaacgaaa gataaacata gttagtgata taaaaaaaac cttataaatg aaatcataaa 29100
acaaaatata agttctcatg aaatgagaaa cattattcaa taaaaacaaa accaaaatct 29160
aaaaactcca ggcatcaacc gccacattcc accatcaacc ttcatgtaac agataattat 29220
tttagaagtt caataatatc ttaaagtatt ttggatacat attaagaatt aagatcatat 29280
ttggtagaag ttctttttgt gattttaaat gtttcgggtt ctatcggata tccatttagg 29340
tccgggttcg gttcggataa tacccataac ccaaaatacc aaaaaacagg atccattcgg 29400
tatttatgtc gggttcggat cggttcggat tcatttttat cggatcgggt tcggttcgga 29460
ttttcgggtt cggtttattt gcccagccct attcattggg cctttctaaa ggaaagaaac 29520
agttgacaaa aaaaaaagaa aaaaattcta cctacttagg cccttcttaa ttcctcaaat 29580
ccctcttttt ccaatattac aatttcttcc tcttgactat caacaacaga cctcaatggg 29640
ttcatatcct atggcctctt gggagtcttt tttggatagt catccatact gtgaaggagc 29700
attggggtgt gataaggaaa ccaaatccct ttgtaccagt caactgctga atggttagct 29760
tccatgtgag ctaatcatta ctcatcctcg caagttttta gatgactgct tctttttatc 29820
aggtggttga gtataatcta ttttgaatta gcctgttgga ctagtttctc ttattcaaga 29880
aatccacttg ctcagtgaca caagagcagc taagcgggtc cgtaactttg ttggtaatat 29940
aaagggaaaa ctcagatctt ctgttttgat ctttgcttgt gcgcgtctca gacatgtatt 30000
gcacatcttt gtttcttaca agcgtcaaat cgtttataca tttttagtga aacaaaggtg 30060
agcaggtagc caggtagtac ctttccttgc aactcacgca tgaatataat aaatcaacta 30120
tttcattgtt gatgactgga tgattcacaa tcaagttgct gggtatagta tttacactaa 30180
attttttttt cttttgttta ctcgtgagat catcaaagat gttttagata tatgaaaagc 30240
acatttcata gtctatattc atcttccatg tatgtttctt tgatgattta aaaaaaacag 30300
aagtacatca acacttctta tctttgtgtt ttcttaatct caagttggta aatagaaaaa 30360
aatgatgaaa agaagaagaa aaacaaatta ctacgaggct ctcagtaaag ctgttctttc 30420
ttttcatgcc accatctcca cctgtaaaca caaaattgct agaaacatta gtgaactttt 30480
atataatttt atataatata aaaaatatat aaaaaattat tttaaaaaat gaattttaat 30540
ataattttgt gccaaatctt gcattctgag atcatcaagt caatgtagta tacgtaccag 30600
taatattccc aacgaggacg gactttggtc atgcggttat catcagatgg gtgataagga 30660
tgagcagcgt ggtgagtgtt gtggaaagcg cagcaacctg cagcgtagac ggatgttgac 30720
aaccgataac tttctccagt caagacggat ctcttcaaga acaccagctt tacaagcatc 30780
acactcgtag cataacgttt caataccatt gttccatcta tagcaatctt ctcctccgac 30840
tattactcca gtctcgtacg tgcacgccgt tggtggctta caacatcccg actacaatca 30900
aagacaggtt agttactaaa caaactgatg aagatgctag ttcatatcat aggacacaag 30960
cggagtttat aaccaaaccg gaaaaaaaaa caaaatccga tatgaacagt tatacaaaaa 31020
tacctgaacg gacctaaaat cattagatat ttttggattc cgaaataata tctgaaatta 31080
gctaaatttg ttaaactttt acatatttaa ggtaatttag atattatcga aagataagga 31140
tgatgatacc tgaacagaag tcatatccct ttggaaataa tcaagtgtgg tccaagattc 31200
aatcttagaa caagtctttg aagtcaagat acagcttcta atggagttcc aatactcttg 31260
atctctaact cttgatctca gccacggatg ataatctcca agtctatact ctttgtaaac 31320
ccacaccacc tccttggcta gtcaccacaa gaccaaagag cgttagaccc atgagagtcg 31380
ctatgaggaa gatcatgaca actaagtaca cccacagagc ccatgccacg ttgaaacaag 31440
ctcctatgaa accagcaagg gatactaaca gtatgatgaa tcctatcacg agaagcggtg 31500
tctggaggaa gttctcgcaa gttttactgc ttcttgcctt ccatagagca gttcctttga 31560
ttggtattga agctagtaag ctgagaaggt ttatgacccc aatcactgtg ttgctgaacc 31620
tgtacatagt aggattgtta tcaagaagaa accagagaac tttgcagtgt ttctcttctc 31680
taatcagatt ctctcttatc aattaggaat cccctggact atatttgcga agtgattttg 31740
ccacaagtca tttctacaat caatttcaca aaacaagtat gacattgcta ctgaaattga 31800
tgatatgtct tatagcttaa tatgacatgg acaattgcat ttaatgttaa tttatatttt 31860
tggtaaactt tttaaaatat ggtaataact catataatac atttaatgtc aatttatatt 31920
ttagaaattt ttttagaata tgaaaataac tcataaatca tcattaaaat aaatatattc 31980
aaatatgaca ttataaattt cgaaatataa tataattata tatttttaaa ttatataatt 32040
ttattactaa aattttcaaa aatgtatata atttttttag aaaattataa aaatttaatc 32100
gtaaaatcat tattttctta tatatctaca aattttataa atattgttta attttaattg 32160
ttggtgatta tgcaactttt acaaatgtat ttaatatatt taattaaaat aaatagatag 32220
aaaaatctat ctaagattat aatttcaaat ataaacatgc atatttttaa atataatttt 32280
tatgtttaat taaatcaaat ttatattaaa atattgatac gaaaaagaaa atttacaata 32340
ttaaaaaaac ttattttaaa atataattta tatttatctg ttaaaaaata ttttaatttt 32400
ttttactgca catggtgcag gaagacacct agttttaatt aagggaaaaa gttaagagtt 32460
aattgtttaa tgattcatgc tcatattctc ttgtcgtttc ttgatttatt tttatttttg 32520
tcaagaggtc gtttcttgat ttgaatcaac taaacaacaa cattaaaatt gtattttttt 32580
tcaaataaaa gcgtcttttt ggacaattgt ttcttgttta atagtatttt atacgcttat 32640
gtcgtttaaa ccagaccaca agtagtgcct tgaataaaat atgtacataa aattaaacta 32700
tattgtatat agaatcagat aaattcacaa tgatcaatga aaggtaagca aagaataata 32760
tagaggacgg atggtgaatt ttctttttaa gatgctttta ctggccccat aacttggcat 32820
attaggttct gtaggtagag cacaatatga tgtttgattc ccacattcac tattttttaa 32880
gcaagaaaaa tgctaaaaca tacttaattt aagccaaaat gtcataaaac aacaaaataa 32940
gacaataata acattactgc aacaaataca tagtttttaa taccgaaagc tagatcgaat 33000
caaaataaaa aaaacatgag tggcaactct aaggttttgg cgaatggtga gaatagggtt 33060
caaaagtcgg gagatcagga tgtgaccatg atggatgtgg gggagagagc gagaccaccc 33120
ggagaccctc cggacatagg gctttcatgg gtagccaagg tagcgggtac gagtgaaggg 33180
ggtatgtcgg taccagagag cttgattgat gatgctttcg tgtcggaaag gctccgagtc 33240
gagttcccga atggagagga tggtgaaccg tgtatcacga tcgagacaga ggttttggaa 33300
gcgatgaacg ggatgtggaa gcagtgcatg atcgttaggg tgttgggaag gagtgttgcg 33360
atctctgcct tgagcaagaa gttacgagag ttatgggatc cgaagggagc aatgtatgtg 33420
atggacctgc ccaggcagtt tttcatggtc tgtttcgaga aagaggatga atacttaggg 33480
gcactgacag gaggcccatg gagagtcttt ggcagttacc tcatggtgag ggcttggtcg 33540
tcggagtttg atcctttaag agatgacatt gtcacaacac cggtttggtg ggttagatta 33600
acaaatatac cagtgaatct ctatcatcga tcgatcctta tgggaatcgc caagggattg 33660
gggcagccag ttcgagtaga catgaccaca ctgaagtttg aaagagcgag gtttgcaaga 33720
atctgtgtgg aggttaatct agcaaagccg ttgaaaggga cagtgctaat taatggtgag 33780
agatacttcg tagcttatga agggttatct gaaatctgtt caaggtgtag aatttacggg 33840
catttggttc atggatgccc aaaaacgatt gcggagaagg tggctaactt ggcaatacag 33900
acggagacgc cgacacttac caatccagtg cctaaacaag tcccaccaag gcaggaagat 33960
ggttttactc aagcaaaggg atcaagaaga ggaacgcaag ccccgcgatc ggtgaatgtt 34020
gtgaccggag aatcaaatgg ggtgactaat cggaagctcc aagagattct taattttaaa 34080
gaggctaatg agattgcact atcgaataag tatggaagtc tggagatggc tacgaatgtg 34140
gatggatcaa aggaggatgt ggttgctggt gaagagaata aggagaatca tgatatgaat 34200
atccagaaca gtaagggaaa gggtctcccg caaggaaaag aagctttaat ctttagtggg 34260
aaaacaagta cgtcgactag cttgaaaggg atgactaagg agaagtgggc tgcgaacaag 34320
agaataatgg agggaggtag aggaaagccc aaaagggtaa ataacaggcc cattaggggc 34380
ttggtgttta gtccgacgaa gggtgaaatc agtccggtaa aagactgaga gtggataaca 34440
ttgatgcagg gagatccagg ggtgtgttta gtgatggtgt ggaggaagtc agaagtatgt 34500
ctaaacctct gctactacga gatgaagcgt tggacaacct gatggagagt actatcagcg 34560
aggtggatca gagagtggct gatatacaga cgagctcaca aggagatggt aggatcgtgc 34620
cccttgcatg acagcgtgcc ccggtaattc gtatagacct taacagatta attatgatga 34680
attgcttatt ctggaattgc cggggggcaa aaaaactcaa tttcagacgc tctattcgat 34740
acatattgaa gaagtttaat actgatgttc ttgcactttt tgagactcat gcgggtggag 34800
aaaaaacgag aaggatttgc cagaatttgg ggtttgagta ctcctttcgg gtagatgccg 34860
ttggtcaaag tggtggaatt tggctcttgt ggagagacca agcgggcgtg attacggttt 34920
tggaatcgtc agagcagttt gttcatgcta gggtggttaa tgggacagag actatccatc 34980
tcatcgccgt atacgcagca cctacagtta gtcgtagaag tagactttgg gggcagctaa 35040
aaaggatatt ggagtatata gatgaaccgg tgctggttgg tggagacttt aatactatct 35100
tgaggttgga tgagaggaca tgggggaatg ggaggctttc atcagactct ctggactttg 35160
gggaatggat taatgagatt gccttggtgg atatgggttt taaaggcaat acatttacat 35220
ggaaacgagg aaaagagacg cggaactttg tggcgaagca tttggacagg gttttatgta 35280
atgcacaggc gcgggttaga tggcaggagg cggtggtgtc ccaccttccg ttcctagcgt 35340
ctgatcatgc accactctat atgcaactaa aacctgagca gagaagtaac ccaaggagga 35400
gaccgtttag atttgaggca gcgtggctga agcatgaagg atttaaagag ctgttattgg 35460
cttcctggaa tggtcaaatg cgtactcctg atgcattggt atctctacaa ctgaaactta 35520
aaaaatggaa taaagagatt tttggaaatg tgattcaacg taaagaaaaa cttctcggtg 35580
agatcaaggg tattcaggag cagttggaaa ggaatccgaa tgatgatcta ctgtcgaggg 35640
agggggtgct tcagaaggag cttgatgtgg tcctagaaca agaggaagta ttatggtatc 35700
agaagtctcg ggaaaaatgg atagttcttg gagacaggaa tacgaactat tatcatacga 35760
gtactatagt gaggcggaag agaaatagga ttgagatgct gaaagacgac gatggccgtt 35820
ggatagatca gtcggaagag ctggagaagc tagcaataaa ctattacaag agactgtatt 35880
caaccgagga cctcaaccta gacacggaaa agctcccccc gcaaggcttt accgagctgg 35940
agattttgaa tgaacctttc tcgaaactag atatcgagac ttctgttcga tctatgtgga 36000
aatataagtc ccctgggcca gatggctttc aacctgtttt ctatcaagat tcatgggatg 36060
tggtggggga gtcggtaact aggttcgggt tggagttctt tgaatcggga gttctaccgg 36120
aaggcacgaa tgatgcaatg ttagtcctca taccgaaggt tcttaaacct gaaagaataa 36180
tgcagttccg gcctataagt ctatgtaatg ttcttttcaa gatcataaca aaggccatgg 36240
tgttgagact gaagaaacta atgctgaagc tcataggccc agcgcaagca agttttatcc 36300
ttggtcgact caattctgat aatattgtta ttgttcaaga agcggttcac tcaatgagaa 36360
ggaagaaagg acgaagagga cggatgctcc ttaaactaga cctcgagaaa gcttatgata 36420
gaatcaggtg ggacttctta gaggatacac tctatgcagc aaagctacca cggagttgga 36480
ttaaatggat tatggaatgt gtcacaaatc cgggaatgag tctattggaa tggagagaga 36540
acataggcgt ttacgcctca acgtggactt cgacagggtg atcctctgtc cccgtaccta 36600
tttgtgctat gcatggagag actatgtcac caaattgaat tttcggtggc aaacaaggag 36660
tggaagccga tcagattatc tagaggtgga ccggctctat cacatgtttg tttcatggat 36720
gatctaattt tgtttgttga ggcctcacta tcgcaaattc gtgtaatacg cagggtactt 36780
gagtggtttt gtggagcttc tcggcagaaa gttaatctgg agaaatctgt tatcttcttc 36840
tctgagaatg ttcatcggga cctagtgaac ttaataagca atgagagtgg cattaaagga 36900
actaaggagt tgggaaaata cctgggtatg ccgatcctgc aaaagaggat taataaggag 36960
acttttggag aagtgattga gaaggtttcc tcaaaacttg ctggatggaa gaagagattc 37020
ttgagtttgg cgggaagaat cactctcacc aaatctgttc tctcatctat cccagtccac 37080
acgatgagta ctatagctct gccggcgtca actctaaacc aactggataa gattgctcga 37140
gcttttatct ggggcagtag cgaaggtaac agaaagcagc atttggtttc ttgggataaa 37200
atttgcaaac ctaaaagaga aggggggctt ggtataaggt tggaaaagga aatgaatgtt 37260
gctttattag caaaacttag atggagattg ctgaatacat atgatactct atgggtcaag 37320
gtgctgcgga aaaagttccg agtggggagc tatatgaccc aacatggttg atagtccagg 37380
ggacctggtc accgacttgg agaagcctag tggtgggtat cagagaagtt gttattctgg 37440
gaacgtgttg gatcttgggg gacggccgcc gggttcgttt ctggaaagac aattggttgt 37500
tgaacgagcc cctatacgaa tcaagtatgg tgcatatccc agagccgatc ttagaagcaa 37560
gggcccgaga cttatggcag aatggaacca gttggctact tcaagctatt gagccgtata 37620
tgtcagtata gaatcagtta agactagctg aagtagtgat tgatgatgtt actggagtcc 37680
gagatagaat gtcgtgggaa gagagcaaag atggattgtt ttctgttaaa tatgcgtatg 37740
ccttactgac tagagatgaa gtactgagac caaacatgga atccctatac agcctggtgt 37800
ggtgtctagt tgctccagaa cgagtccgag tcttcttatg gttggtaaca catcaggtta 37860
tcatgacgaa catggaacgg aagcgtagac atttgagtga taatgttgtg tgcccgttgt 37920
gtagagatgg agacgaaacc attctccatg ttcttcgaga ctgtcaggca gcagttggaa 37980
tatgggtgaa aatcatgatt ccgagtagac aacagcattt ctttagctta cctctattgc 38040
aatggctcta cgagaatctg gggagggaca agccgggtaa tggagaccaa tggccaacac 38100
tttttgcctt cactgtgtgg tggtgctgga aatggtgatg tggctatgta tttggtgaaa 38160
caaggacatg tcgagacaga gtgcagtttg ttaaagaaaa gtccagagaa gtgttggaag 38220
caaataagca tttgcgagat cgttcttgtg ctaggggccg ggtggagaag caaatcgcat 38280
ggcagcgacc cgttaatggc tggcttaaat tgaacattga tggagcatct aggggtaacc 38340
ctggactggc cacagcggga ggagctgtgc gagacgaatt tggaatgtgg aaaggaggtt 38400
ttgcgattaa tataggtatt tgtttggctc cgttggcaga actgtggggt gtttactatg 38460
gactgtgcat agcatgagat tgtggtattc ggaggctaga ggtggaagtt gattcagaga 38520
gtgtggcggg ttttcttcag acagggattc atgattctca tcccatatcc ttcctagtac 38580
gtttgtgcta tgacttcatt tcaagagact ggatagtcaa aatttctcac gtgtataggg 38640
aggctaattg tctagcagat ggattagcta actatgcgtt ttctttaccg tttggtttac 38700
attattttga gtcggctcca gagcatgttg cttcagtttt gttagaagat tgtaacggag 38760
tgtccagaac tcgacaaatt tgcctgtagt tgttttgttt ttgatttgaa taaaaagtag 38820
gcctgcagcc taccaaaaaa atacatagtt tctaattaga acaaagacta aaccagacca 38880
agagaaaagt cgacaacatc ttttaactct gtccttccac tatcatcatc atcatcatca 38940
tcctcataac ttattgttgt accagaacac acctttcttc tcaccttgcc tatccggttc 39000
aacatagata cactccttcg cctccctcca catcgcctta accgccggcg ttccatcaaa 39060
ctggtaatac tctccaaagt atcggcttta tcgccttggt cgcttccatc gcgttataat 39120
gcggcatcgt cgagaacaga tgatgcgcca cgtgcgtgtc cgtgatgtta tggaacacct 39180
tgttcaagat tccatagtct ctatccacag tagccaaagc tcctctcaac caatcccact 39240
cggaagaatc atagtgaggc agcgaagggt gcgtgtgctg caagtaagtg atcaagacga 39300
ggaaacagtt gacaattaga agcggaactc cgtagacaca gaccacagag gctactcctc 39360
gcgaagcagc gtaacggtag agaccgtaac atacggagag gacgccagcg tcagagatgt 39420
atatctggag acgctcgcgg tcgttgtaga tgggagcgtt cgggtggaaa tggcaagcga 39480
aaccgtcgct gtaaggtctt cccgagacgt tgaaggctaa gtacaacggc cagccgagct 39540
tgaactggac ggttagcatc accgtgcgtc ctagcgggtt gttgaggtac ttgccgtacc 39600
acttgatgtc ggatttcttc ttggggacga acacttcgtc cctatcgagg gatccggtgt 39660
tggaatggtg gcgtcatgga tgtacttcca ggagaagtac gggacgagga ggaaggagtg 39720
gaagacgagg ccggcggcgt cgtccagcca ctggtggtcg ctgaaggcgt ggtggccgca 39780
ctcgtgggct atgacccaga ggcccgttag gacgcagcct tggcaggccc agtagagggg 39840
tcaggcgagg taagggagag ggaagtaggc tgtggagagg tggtagaggg aggagccgag 39900
gaggagatga tgatgtcgaa gaggagaagg agcgtgggat ggagcgtttg aagcagtgag 39960
gtgggattgc tttcttgagg tctccgagag tgaatggtgg tgtctcgcag gggacgcgtt 40020
tgagggtgtt ggttccgggg gagctggagg gaggagagac ttgcattctt ccacctgcgc 40080
ccatgtttgt ttctgtagag aaaaccaaaa aaaaagaaaa gaaagtaata agttagttag 40140
taggaagaac ggaaggggta aggttttttt taac 40174
<210> 3
<211> 28527
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 3
acacaagtat ttgaaatatt cgaaatctta gatttatcta gtaaaacatt acatacacaa 60
ttccaaatta tcttaaagta cttaaaacca aaaaactggt atgaaaataa ttcaaattta 120
taaaatttat aaaatattca aaatatataa atcatgaaaa ctgaataaaa attgggaaat 180
tctcctaaat tgatcatttt caagttttgg tcacaaaaat agaccacagg gaggaaaatg 240
accaaaatgt tttatttaat aggtaaaaag accttaatac actggatata taaaaaataa 300
aaaaagtaaa aaataaaaaa atcataaaaa aatttatagt tttagattat atgttttcaa 360
attcgaaatt tttataaaaa attatttttt ttgaattttt tttcgaaatt ttcttttttt 420
tcaaatttta tttttgtaat tcgaaaatat tttttgaaac tattttaaaa atttttattt 480
ttaaattttt aacatttatt ttttatttta taaaatttta aacctcaatc ccaaatctct 540
atcccttaac tctaaaccct aaagtttgaa ttagttaacc atacgtgtat aaatgtatat 600
ttacctcttt catgaaacag tttggtcatt ttgatcatta gagtctatat ttgtgacaaa 660
ataaaattag tgctatcctc tggtatttct cataaaaatt taataaattt atttaattta 720
attttttaat attagtttga gtttagaatc ttatccaaaa gccgaattat catattattt 780
aaatatttcg taaaatcaga tgaatcaact ttttttgtat ggattttggg ttctaaatat 840
tgtcgcccaa gttgacaaaa aaaaaagtat tgtcgcccaa tccacatgac acaatagtat 900
tcttttaatc aatgaaccct aaatcccgat tgaaatccta ataattgaat tcaacccaat 960
agaacaatag taggcctgcg atttcggttt tccgaaaccg aaccgaacca atttttcggt 1020
tttcggttaa acggtttttt ttggaaaaaa ctccgaagaa aaccgaattt gaattcggtt 1080
cagtttttgg ttatttccga tttttgattt tattccaaaa aaatcgaaat caaacatttt 1140
caataaaaaa atcggatcac acgattaatt tcgggtattt acggttactg ttgggtttcg 1200
gttacctaag gttgtttcgg ttatgcctct attttcacct gccaaatcaa ataatcatgc 1260
aatcaacaac ggaaaaataa tctccaacat caaaaccaat ttataatcga ttcaccaagt 1320
taaaacattt aaaagagatc actctcaaac atgaaaatcc aaaaaaagat aacaatctga 1380
atctatattt cttttgcaaa tatcagactt tgaaagatac attcatacat agattcatga 1440
agttcaaaaa gataagttgt ccaaaagaga gtgataggct aagttggttt tggcttcctc 1500
gacattccaa cctacaagtt tatgaagtaa gaaaatcagt aaaaacaggg agaagaacaa 1560
actacaagaa actatacaaa taatagagca acaaattacc tttaatgatc ggattcactc 1620
ggaatttgca aagactctac ataatgtcaa aggcagttag gaatatatga ctgtggacat 1680
ataaaaattg aaggaaaata gttaaatgat tacctaatga ctcatgaaaa tcgagttctt 1740
caaacatctg aaccaagctt gcaaccttct cagcctggat gttgtttcga agccactgtt 1800
gtaggcagac aagagcttca atcatgtatg gagtcagaca actacgaaac ggatctaaaa 1860
tcctaccact tgtactgaat gctgactctg aagcaacaaa ggagacttga acagctagca 1920
catcttctgc tagttcagac aagattggaa acttacaaga gttcttcctc caccaagata 1980
acacattgta atccaagccg aagttgtttg agcctcgtgg tactggtttt tccatcaagt 2040
agatgtcaag ttcactgctt ccttcttcat ttgctgcctc tgaaaccatc tttgaataca 2100
aagaatctct cctctcaaag tcttcatcat cgtcatcaga gatatcaaac atggttccaa 2160
cttcaccttc cccattatca ataacgttgc tgagactatc accttgagat gaagagccga 2220
gcttgctcac atactcctca tacaacgatt tcatcagtgc cctgattgat gttctgagat 2280
gaccactctc cagactatcc ttcccgtaca gcttatcaaa acatatagaa gcaaattgca 2340
tcttgttcct tggatcgaac acacttgcaa tgatgaccag tgggttcata ttgataagcc 2400
catcccagta tttctcaaat ttgttcctca tctcctttgc ttgaatctgt agaatcccat 2460
ctttgctatt gctcaatgca atcaagttcc tctcgataat cacaatctca ttctaacaaa 2520
tggtggacgt gactgtcttc gatgctgaga acgctaaagt gcagccaaag aagattttca 2580
gaaacttcac taacctctgc acctcttccc acccttccgt agtaggaggt ccaactctct 2640
tctgtccatt ctcctcttct tccagaaaat aatcattata caacatgtct tcggctttga 2700
gcttctcaaa agcaacctta aacttcaaag cggcagacaa catgagatat gtggagttcc 2760
aacgagttat gcagtccaaa gacaagctcc ctctactaac cattcttgtc agcaccctta 2820
actgaaacga ctgcaatctt gtacccgatg atctaacata cttcacagca tttctaatag 2880
ccattacact atctttgacc tcagataaac catccctaac tatcaagttg agaatatggg 2940
cacagcaacg catatgcaac aatgcaccat ccttaactaa tgcatttggt cctatctccc 3000
tacatgtttc tgtaaacagc cgtagggcct tgtcattcgc cttagcattg tctactgtaa 3060
ccgtaaagac cttctatatt ccccaatcag agagacatag actcaaatgc tcagaaatat 3120
tgtcaccttt atgatccgtg ataggtttga agctgatgat tctcttctgc atattccagt 3180
ttcgatcaat ccaatgagct gtgacgacca tgtagctgta ggatgttgta ggagcaaccc 3240
aaatattggt ggtaagagac actctctgct tctcagaatt aaacaactgc tttaagctag 3300
ctttctccct tagaaacatt ccaaatatgt cttttgttgt tgttctcctg cagtgaactg 3360
tgtacatagg caagacgttg tgacagaacc tcctaaaccc ttcagattcg acaaaagaaa 3420
atggctcctc attcagcact atcatctcat tcactgatct cctaaacaag gcagcatcat 3480
acttaatggt tgtcaataca ccactactat ctccacctag cacctgctgt tttccaaatt 3540
ctttgtagag ctggtacatc ttacatcgag caatgtgatt cttcatcgca ctcgtcccac 3600
tcttcttcga gtcacatcca atcccttggg cacaataatg gcagttgctg atgcttggat 3660
catcttctct ttgaatgaaa tgttgccaaa cttctgctct gtgagcttgc tttttctttg 3720
caacaggagg catatcagtg cttgatctct cagaagcaga tcttttcttt cccccacctt 3780
gatctatata tgcttcaacg tcttctgcga ggaagttacc attatcttca caagctgaca 3840
tctacaaata caatcagaaa ataaacactt aagatcagac aaatatatat acaaaacgaa 3900
ccaaatgaac acaaaatcat acgctatttc agaaaactca ttcgctaaac tctgttcaaa 3960
atcaacagaa atcgttccta accaaagctg ataaattgat aaactataac tgactcatta 4020
agcgacacac acacaaaccc taacaattaa aatcccaatt cgattatcac acaaagtcac 4080
aaaccctaaa ttcgatttac acataaactt agaaagaaga gaagacatat acgaaaacta 4140
accttctacc ttgtgctcca aattatgtaa ggaagaagag aaattggtct ggtctgagaa 4200
tcagacaagg attgatcgga gatcgtattt gagaaagaga gattaagaga ggcgattagg 4260
gtaaaccgtt tacgacttta ggtttgtcgg cacttaggtt aaggatgact taggttaggc 4320
atacatagtt aggttaaaat ttcggttatc cgttcggtta tcacgaaccg aaccgaggaa 4380
aaaaccgata tatttgaaaa cttgtaccga tcgatttctc tgttatttct gaatcataac 4440
cgatatccga cgtttttggt tcggttcgga tcggaccgat cggttcggtt cggaatacca 4500
ggcctaaaaa atagtgttat catagttaca actaaaaaga aagttaacag acgccgtaaa 4560
aaaagaaaaa aagaaaaaaa agaaaaaaaa gttaacagac aagtctaaaa catagaaaag 4620
gaaatacgag aaggagacta gacgcttcct ctactaaagc gttttaagag catgtacaac 4680
ggtataaatc aggaaatcct taggaaagat ccttaatgct ttttgattaa agaaatatta 4740
aaagaggagg gcaaagttaa ggatgatcct taattaagga ttaaaatacc gaagtcctta 4800
tcgtgcttgc acactttgat tggtccgttt tgtgttgtct ctcgttaggg gagagaaaaa 4860
acacgggacc caacctcatt gtatctcgaa cccgaaaaaa aagcagagga gaaggagagg 4920
cgacagagag gcgatttgcg atcccgactt gtgaaggtaa aatccgatct taatcttttt 4980
tttccttctc gagtttatgc atgttgattt catcacgttt tagggttcga ttgaggtgtt 5040
ttataaaatc tagggtttga aatcagattg gggattttta tcgatttagg gttttcgtct 5100
tggtttgatt tttttttgca ttttcgcatc ggttctttgt tgttatcgtc tggattagag 5160
gttctggatt gagttcacaa tcgatttagg gttttggttc ttgatttcaa ttttttttta 5220
ataagaatcg tctcggtttg tttttttttc atttttgctt tggttgtttg ttgttaacgt 5280
ctcgattaga ggtttaatca attgagttca caatcgatta aggttttggt tcttgatttg 5340
aaattttttt ttaataagaa tcgtctcggt ttttttttca tttttgcttc ggttgtttgt 5400
tgtgatcgtc tcgattagag gtttaatcga ttgagttcac aatcgattaa ggttttggtt 5460
cttgatttga attttttttt ttgcaggttc tgaaatggat gaagaacagc gagatatgaa 5520
agcacacaaa gcatactacc aaagggttga tttcgtatca aattcgctgc aggggattcc 5580
ccaactgtgc ccctgtggat caatcacgaa ggaaattgta gatgaagagg atacacatga 5640
ctacctccct gggaaaacat acttcatctg caaagacttc gaggtatgaa ctttgtttct 5700
atctctttca tttattacgg gttatatgtt tgctatttga caattttttt ccctttggca 5760
gaatgacggt ctgcattaca ggaaaccatg ggttattggt gtgcaagaag aggttgagag 5820
gctcaaactg aaagttctcc gccatgagaa ccttcttaga gagtgagagg cacttaaggt 5880
gagtttattt tttttcggta tcataaaaat tgtgtttcta ctatctttct aaccaatgtg 5940
ttttggtttg tcttatgtct gttaaggaac atgttaaaat gttggtcaag cgggtttctg 6000
aacttgaggt tagtcttaaa actcaaccgc aatagtttcc tggttagaga acatagctgt 6060
tagaattgaa acggatagga ctgtcggtaa ctgtgtagtt aggaaaaaat tacttcatta 6120
aatagaccct aactgcattt tggatagtaa aacttcatta aattgtttgt agctgttctg 6180
ataagacagt tttctactag gattcaatgt agaatctctt atttaatcct agtagaatac 6240
tagtagagaa tcacacttca tcttaaatgg caagctctag ttttgttaat ctcttagcga 6300
gccaagggtc agttgacctt aactctgcag agactccatt gtttagtacc caaactccta 6360
cccaaactcc gcaagaacca agtgtcaaag agaggagaaa gtggtctgtg aaggaggatt 6420
taatcctggt gggtgtttgg ctcaacacta gcaaagattc aatcgttggt aacgaacaaa 6480
aaggtgttgc cttctggaag aggattgtag agtactacaa ctccagtcct cttctcgttg 6540
ggacagtgcc aagagaacta gggcaatgca agcaaagatg ggctaggatc aatgatttgg 6600
tctgcaagtt tgctggctgc tacgacacga cattgaggga gcacagaagt ggtcaaaatg 6660
acaacgatgt gatgaaggct gccttggata tcttcaacag tgaccagaac atgaagttca 6720
acttggaaca tgcgtggagg gagcttaggc atgatgtgaa atggtgctcc acctatcagg 6780
agaaggacaa ggataagcgc aaaaccgcgg atacttcggt tgcagaacca gaagatagac 6840
caatatgggt taaggctgcg ggtaagagga agaaaacagg aaaagatgaa gaattaacca 6900
agcttgaagg gctggtggac attaaaaagc aaatctcaag gcaaagtttg cttgaaagtt 6960
tgcttgcaaa gcctgagcca ctgtctgata tggaattagc actgaaaaca aaactgttgt 7020
ctgaaatgtt gtcttgatgg tttgttagct ttagattaac ttgtttgctt tattactttg 7080
ctttgtttac tttactgact cgtttggttg ttgctttgtt tcaggatcag taaagacatg 7140
tgcaagatga agacaaaaga tggtgtccct tcctttttca gtcactggtc atttcgtttg 7200
ctttttctgt atgttggatg tgtcacgggt tgtatgtgtc acgggttgct ttgtttttgt 7260
tgttgctttc tattttgaac ttctatttat aagtcagtgt ctgttgcttt gtaatttgaa 7320
cttcccttgt atcatttcat caatgaaatc tctttcctct tattccaagc tttgaagcaa 7380
acttcccttg tatcatctcc aagcttttct cctcttctac ttccataaat gtcacgaaca 7440
taaaaccaac aagtgaagaa agttaaacca ttctccaatc tttcctcctc ttctacttct 7500
ctaaattcac gacaataaaa ccaacaattc aagacacttc aaccattctc caagctctcc 7560
tctacttcaa gtaatttttt tattctaaaa ttagtaattt ttttatattc taaaacgtga 7620
ttagtaattt tttttattct aaaattattc taaaacctga ttagtatttt ttttttggca 7680
gtatgggaga tgaagtcgat cgaagattga atgcggcatt ggataaggct gtcgatgaat 7740
attttgaaga cacatacaac aacatcgtca agaaccaaac aaagaaacaa accaaacgtg 7800
catatgtcga acgaaacagc gaagagggcc acagaagtct atggaattac tacttcagtg 7860
aaaatcctac atttctgcct catttattca gacgacgttt ccgcatgaac aaggcggtgt 7920
tcatgcgtat cgtcgatcgc ctctcaaaaa attttccctc ctttcaacaa agaaaagatg 7980
caactgggag gttaggtcta tctccactac aaaagtgtac ggcggctctt cgtatgcttg 8040
cttatggttg tgctgttgac gccgttgacg agtatctccg acttggagaa agcacaacac 8100
tttcatgttt aaccaatttc acagaaggtg taatacagtt atttggagat gagtatctac 8160
gaaggcccac tctagaggat cttcaacgac tactcgatat tggagagata cgcggctttc 8220
ctgggatgat aggaagcatc gactgtatgc attgggagtg gaaaaattgc ccaaccgcct 8280
ggaaaggaca gtacacacgt ggatcaggaa agccaaccat tgtcttggag gctgtagctt 8340
cacaagatct ttggatatga cacgtttttt ttgtcctcca ggtaccttaa acgatattaa 8400
cgtcctcgat cggtctcctg tttttgatga cattttacaa ggtcgagctc caagggtaca 8460
atatgtggtc aacgggcacc agtatgattt ggtgtactac ctcacagacg acatatatcc 8520
aaaatggtaa acatttatcc aatctatctc aaaccctcaa ggtcctgaag cagaattatt 8580
tgctaaagtt caagaagaaa tccgaaaaaa tgtggagcgt gcttttggag ttttgcaaac 8640
tcgatttgca atagtgaaaa acccggctat tttgtgggac aagagacaaa tagggatgat 8700
tatgcgaaca tgtatcatac tgcacaatat gatagtagaa aatgaacgca atggatacac 8760
tcagtatgat acatcagagt ttgaagaagg agagtcgagt agaagttcac aggtggatat 8820
gtcatattat ctgaagcctt caaatctcct tactatgctt gacatacgaa gtcgtgtgcg 8880
tgacccgcac atacatagac aattgaaata tgatttgatt caaaatattt gtaacaagtt 8940
tggtaatgat gaagatgttt aattattgta tgtttacatt ttgtttttca ataaatgaaa 9000
attttaaatt tcaaatttta aaattttaaa tttttaagat taaaaaaaaa aaaatcaaag 9060
tactccttgt tggataacac aattggacct atggttatgt taaaagtcct taactattga 9120
agaaaaaaga aattataata taactaagga ttccataccc accattggag ttgctataag 9180
aagaagaaaa aaaattgtct agaggcttcg ttttgcgtta cttcatcata taggtaagta 9240
gagaaccaca tcttatcgaa ttcgacctct ctgcttcgct ctcagtactt gaaagctcaa 9300
tcaaccctct cttgtagtag gcaatttcaa atccacggac atggcaaagt tcgtcgaagg 9360
cgacaagcga tggatcgtgg aagacagacc cgacggcacc aacgtccaca actggcactg 9420
ggccgaaaca aactgcctcg aatggtctcg caacttcttc aacaaccaat tctccgacgc 9480
cgtgatcctc tccggcgagt ccaacctctt cctcaaaatc aacaaggtgg agaagctcga 9540
aggcgaggcc tacgtgaacg tgcgcaaggg gaagatcatc cccggctacg agctcaacgt 9600
ctctctatcg tggcaaggcg aggcgaagga ctctgaagga agacgatctc gaaggcggaa 9660
gggttggtgg agatgccgta catctccgat gagaatgccg atgagaatcc agagattagg 9720
tattagacgg tacttatagg tgtaattcgg tttagtatat accggtagtt atggtggttt 9780
aagtttactt tagtatatta cggtacatat aggtttaatc cggtttatta tatacagatg 9840
gttatggtgg ttaagattcc tttagtatat ttcggcatag gtttaatccg gtttagtata 9900
tacaggtagt tatggtggtt aagtttactt tagtatatta cggtacatat aggtttaatc 9960
cggtttagta tgtaccggta gttatggtgg ttaagtttcc tttagtatat tacggtacat 10020
ataggtttaa tccggtttag tatatacagg tggttatggt ggttaagttt cctttagctt 10080
tccacttgta tttaaacttt gatgtgtaca tttgagaaat atatacattt caatgttagg 10140
gtttcggtta aggacgacgg ggagattggg aagacgttga aggaagcgat ggtgacaaaa 10200
gggaaggtgg ttgttcagga gaaggttagg gtttacgtgg aggcgatggc tagaggtggg 10260
ccgtgtaggg atgagttgga gtttaagaag gttgcgccaa aggcaaagga gaagtctagt 10320
ggtttaccgg ttgtatctga tgcgaaggag agtaaggtag tgaaagagaa gaaggggaag 10380
acgaaggaag ggtttaagat gattagtatg accgagaagt ttagttgtag agtgaaagat 10440
ttgtatgaga ttctgatgga tgagaatcgt tggaaggggt ttactcaaga gtaatgccaa 10500
gattagtaga gatgtgagtg gtgcgattag tttgtttgat gggtcggtta ctgggatgaa 10560
tttggagttg gaagaaggga agttgattgt tcagaagtgg aggtttggga gcaggcctga 10620
tggtcttgat ttaacggttg gtttactgat tgtttttgtt gtggttcaga aacatggtgc 10680
tttgatttgg atctggttgc gattgatgtg ttggctttct ttgctttgac attttaggtg 10740
agaatcactt tcgaggaacc tgaaccagga gtcaccattg ttaatcttac ccagtgacat 10800
tcctgaagaa gataggttag tctcacttac cgaattgatg tatgtagttg ttcgactcat 10860
taagtctttg ctttagtgaa tggattcttt ggaatttggg tgtgctgtat tggttagtag 10920
tatatgatat agaatactca acgcacaggc cgagaaccat tggactatta gagattagag 10980
aggatcttaa atatcttagc cgcccaaacg tctttgacta tctatgttaa tcatttcctc 11040
taattgactc ttagtatttg ctgcgcattt ggagcttatt tgtttgtcca tgcgctcgtt 11100
ttcttctttt ttgttaagca aatatactta agagttattc gctcgatatt ggctcctttg 11160
atgttatctg atgggtttcc attgacatac gggaatgcga ctgtggtgga aaacacggag 11220
agaggatgga gagaccttat attccacatg atccgtgctg tttttgggtt tggaatatga 11280
tatgtgattc taattttcaa acaaacaaaa ccagcattgc ttttatctat ggttatgatt 11340
tcaattccaa aacaaggggg actagtgaca agcagcgcaa atgtatgatt tctaagtttt 11400
ttgtttatgc attttcatgt aactatttgc tcacttctat atttatttag gaatggacaa 11460
ttatccgtaa attttgattc gattttttgt ttcgatctga aaaatcttga tataatcaag 11520
caaaaaacta aaatattata tccgtaaaaa aatgaaacaa atcacaaata ctatttgtaa 11580
tatatatata tatatatata attatatctt tttctaaatt ttataatatt tttaaagtaa 11640
ctatttagtt attaattttt taaataatag gtaatttttt aaaaaatcgt aataaaatat 11700
tattatttat atcagatttt tttattattc ttttttcgga tcaatcggac attcatgtcc 11760
cgtaaaatac agatttttca gatatctgaa aagttacaga ttaaattgaa tctgaaaatc 11820
gattatctgt acggagtaga atggatatct taaaaaaatt atatctgatt tgcgccgacc 11880
ctacttttgt tgagattgtt tagatcaatg gcacacaccg atctatgtta aaactgttgt 11940
tatcagtatt ctatcaatca ttaaattcag atgggacaag aacttccagt gtaataatac 12000
tgcaggtcaa ctacgttgaa ataatctatg ctcaaaagat atagttataa accccacaat 12060
ttgacatgta agagcatatg taagagcatg ttcaacgcag acatggaacc atatgtaact 12120
ttttttgttt tagtattatt tttttagttt gaaaaaaaaa ttaatttaaa accgaaccaa 12180
tcgcgggtcg ccacgtgtca gtgaagtccg caaacagtga taaaaacaga gaaagatcga 12240
tctttatttg cttacttttg tgatcggttt taaaagtttt ggtgggactc ttgcattaag 12300
aaacccagtt ataaccatgg ataaacatgg tctaagcata tgagcctgat gccttgctaa 12360
ttattagcat taatttgtta aacctgtagg ttgggcagaa attaagtact ttacaattat 12420
catatttatt gaaactagca ataaattagt taaacatcgt tcaccaaata atttaatttt 12480
ctaacatcag atcccaaaat tcaaatttcg aagattataa cctctgtcgg tttcgtgctt 12540
ccgcgccaga ctaaacagcc acatacacaa atactttgtg gagcttgttg gaatagagat 12600
ttggaaaaat gttaaaagat ttcatatatg atagaattta gctgaatcta tttagattta 12660
aggatttaac agagattttg atgagaaatt tggtagattt tggtcatttt ggtctccctc 12720
tataacctag ctaaagggag tgaactatcc ctaatactaa gcattcacgt tacaacttct 12780
cttgatcagg aaatagcaaa tatcaaagtt agaagacgat gtttacagtt tcagattgat 12840
tcttccacaa gctatcgttg gtccgtcagt ttcggcaaga gaagaagcat ttcttcgaga 12900
gaattggtag gaggttcttt cacaagatca catactttaa tcatgtgtaa gaaaaatttg 12960
tgatatttgt ctctgttttg tttcaaccat cgttggagag tgaggaagga agataattgt 13020
tttatttatt ttgaaatacc atctaggtga ttatccgttc acatgcacga aatgaaatgt 13080
atattctaat aattgttgaa tatgaacttt gtccgtataa ccataattat atcattcata 13140
agcctatata tattaatttg aatatctatt aaatgttatt ttactcatat ggtttttatt 13200
atcatttata ttttattata acaaaaaatt taaactatag atcataaaat tttcagtgtg 13260
agagttttaa caattttcgt tatttatagt catttttaaa cattcaaaat ataatatata 13320
tatgaaaatc tattttttat tatatggtta atatgattgt ttaatttatt ttaataatat 13380
aacattaaaa aataatgaag atatgtgaat tgttgtcaaa tctttattat taaaatcatt 13440
aattgtcaaa tatatatttt attcacgttt ggtaattccg taaattttat ttaagaaaag 13500
aaagaaaaac aataattgta gattgttaat taatttcatg gttagtccaa gtagaagtat 13560
ataatatatg tttaatggac caacatattt ctttagagac tttaagaaac attttattga 13620
tgacacgtgt caaagttaaa atgttgtaat gcttatcttt taatatatag atgattatct 13680
aataattcca ataactcttg ataaatatta tgagtgaaat ctttgttttc caataaggag 13740
aaatttgaaa gagttttaat aaatgattaa ttcaataata gtggatttga tagaactttt 13800
ataaatacta agaggagatt tgaacaaaaa ctagaatttt cttaaatcat aagcctccta 13860
taagccccct ttgttcctat ctctttttgg tcaccattcc attccagaaa atgcttttaa 13920
agataacaat cacaacattc caaatgtaga aaagtcacaa tctcaacatt ctaaacctgc 13980
ttccacctaa caaaaaacaa ttgccttctc gtagtttact ccaaatacaa agggtgtaat 14040
ataacagaaa cactcgacac tttaccgaac acacacattg ccttctcttc taaataagtt 14100
caatcttcct aatctctctc tgtctctctc tgacaacaga gagactcttc acgtgccaaa 14160
caaaaaaaac tgagcacctt cctctcgcca tggccacgga ctccgtcaag cacgtgccta 14220
cattcggcgg ggcagccatc tccgccgaaa tgaaaagctt cttctccgcc gtgcctactt 14280
ttgtctacgc cttcgtcgta acctttgttg ccttcactgt ttacttagcc ttcgcccctt 14340
ctctcatcac tgtctctaat tcagtttctt cctatatcct ccctaatgtc agtgccgtga 14400
cttcagcgtc cagtaacatc acattacaag caaccacgcc ggaaagtctc actccggctg 14460
ttataaacac aacctttgag cctcccctag gtaatgaaac aaacccactt tctagaaaca 14520
acgcttcacg ggatcatgca agtgtacact tatgtcctaa caacaatact gctcgaaatt 14580
cggacaaaca agcacctctg tccgtgaatt caagtgcttc ttctccgatg agaaaacaaa 14640
gtaggaagtc aggggctaaa cgagagatca agtctctgaa ggactgcaat tttttcgaag 14700
gagaatgggt caaagacgaa tcctacccgc tttacaaacc cggcacgtgt aatctcatcg 14760
acgaacagtt tagctgttta accaacggaa gaccagacgt tgagttttac aaactgaagt 14820
ggaaacctaa agaatgcact ttaccaaggc tgaacggagg caagttgctg gagatgatta 14880
gaggaagaag gctcgtgttc gttggagact cgctgaatag aaacatgtgg gagtctttgg 14940
tttgtattct taaaggatca gttaaagatg agagacaagt ctttgaagct catggaaggc 15000
atcagtttcg tcgggaagct gagtacactt tggtcttcaa agtaagtttg caatctgttt 15060
tggtgaggcc tgcgggttcg ggtagtttgg gctgggtcgt tcggttcgac caaaatattg 15120
cccaactgaa ccgaacagag tttggttcgg tttaggtagt tcggtttttc aacttctttt 15180
accgaaacta atcaaagttt ttggtttcaa ttatatgttg gtttaaaatt tctttaaatt 15240
cagggtaatt ttggttagtt cggtttgtca gttattttga tttgaatttt tgattaattt 15300
agttagcttt tttttgaaaa cccgagctaa ccaattactg aagtgaaaac cgaagtattt 15360
tataaacttg ccgaattgaa ccaaactaac caaaaaaatt tggttcggtt cggttatcaa 15420
cgcaggccta gtttgactac ctagttgtta ttggagactt gatttgtgtg gttgatatga 15480
taggaatata attgcactgt ggagttcttt gcgtctcctt tcttggttcg agaatgggaa 15540
gttacggata agagcgggac gaagaaggaa actttgcgtc tagatatgat gggaagctca 15600
tcaaagcagt acataggagc ggatgtactt gtgttcaata ccggagcttg gtggactgat 15660
gacataacat ccaaagggta gagttctgtc agctattttt tgtttttttt atatggagga 15720
tttgtctcat tggctttttg gtgtttaaat ggttttgatt agtgaggatt attttcaaga 15780
aagaagcact gtttacccga aactcaacgt tgatgaagct tttagaaaag cattgactac 15840
ttggggtcga tgggttgata agtatgtgaa tccaaagaag tctcttgtct tcttccgcgg 15900
attctccctg tcacatttca ggtatgtaca gttctttcat ggtagtctta agattctgtt 15960
taaaaaaata aataaatggg tttggtctgg ttgcatgcag tggtgggcga tggaatgcgg 16020
gaggggcgtg cgatgatgaa acagaaccga tcaagaacga ggcataccta atgccttacc 16080
cttccaagat ggagattctt gaaagagttc taaggggaat gaagacaccg gtcacgtatc 16140
tcaacatcac gaggttaaca gattacagga aggatgctca cccgtctgtt tataggaaac 16200
agaaatttac tgcagaagaa agcaaatcac cgttgttgca ccaagactgc agtcactggt 16260
gcctcccagg tgtacctgat tcttggaacg agattctcta tgccgagatg ctggtaaagc 16320
tcgaccagct ccgtggcaac agacggcgga aacctaaagg gctactatag gaggagttaa 16380
atcagatttt tgttttagat gaaatacact atatatattt tcaatggatg aaaagaaaag 16440
aaacacttag aagcaattat atgttttcaa aggcatagag aaagtaagag gtgagaatca 16500
tattagtgcc ttgctcatca cttttctagt ttttagattg taaatggtta atttttattt 16560
tactcaattt aatagtaaag gtttgtcaaa tcataactga accggaaatg gaagcaatca 16620
tttggttaaa agaatccagt tgatgacatc gactggcaaa gcataggcag gatcaatttg 16680
gtttgactcc aggatactcc agccctgcac acagttttgg atcattaagt tctctttagc 16740
tttgaagacc tgaacagtat gaactaatga gaagcaaatt ttagtcacct gcaactccaa 16800
agtaagtgtg aaagatatca acagcatcgt caggtccatt ctccatatct tattcaaatt 16860
acacctgaaa ctcaggaaag actctaaaga gatgtgagct ttataaacca atgtttgaga 16920
aaaacctgac agtccaagat gaactttaca agctttgatt tgtcaatcca atgtactcta 16980
ttggtcatga taaagctcga taaaacccac caagagtggc aaacctggtg ataattaagc 17040
aagaacaatc agtgtggtaa gaacaattgg aataatgttt tgtgtttgta gagagaagct 17100
ccgttccctc aaatggacac ctattgttta ttcaactgcg ataaactggt catggcgttg 17160
acaagtacgt ttccttacct ttacagtttt gttttaactt attctatttg atgttatata 17220
tgaacattta tacatgtagt attgtggttg ctgctgcgac tgttcaaaag gagagatcaa 17280
gaagactttg tacagccata ttaaaccaag tgataagaga actagctgtt gcatttaaac 17340
caagtgatat gaaattattc tctccttctc tcttttgttc ttcacattct tcagtttcca 17400
gcaagtaaaa aagctcatat tctcacactc ctattcgtct tctttggctc agcccttaaa 17460
agatcgacaa gaatggagga ggtacatagt tttttagcac taaaactatt attcttagtt 17520
tgtattgaaa aaaaatgttg ctggtgaagg aacaatgtca agtctttcac gtgagagaaa 17580
tcttgcaacc aaaggggggg gcataataaa ctgagactat ataagtttcg tttagttatg 17640
tatttcttga gaaataatgt aattctttga tttttttttt tggttaaagg gttttataat 17700
tcacttttgt gtgttgagcg taaataaaag ggaccgcttt atacgattca gtgatgtttt 17760
tagtttaatt tcagcttctt tcttttcatg aaattcaagc tacttcacaa ataaagatgc 17820
atgcatattt gcgtggggaa ctacatagac acccattcaa caagaactct atttataatc 17880
acgtcctaat gaatcggtca tttgaacaaa aaaaaaacca cttcctaatg aatcggtcat 17940
acttttattt ttaaaataga tacaaagaca cccattcaac aagaactcta tttataatca 18000
cgtccttatg aatcggtcat ttgaacaaaa aaaaaatcac ttcctaatga atcggtcata 18060
cttttatttt ggagattaat gtttcataaa taaaaacaga tatcagtgta cgtagtatcc 18120
tcccttatct ttaggattgg attcccacct tcaacattcc acttttttct catttcagtt 18180
tgttatttaa gggtttcaaa acatacaaca attatccaaa actagattgt ttcaaatttc 18240
tcaaaagata tttaattcga agctaattat cacgagaact acaaattaat tccaaaaatg 18300
aagttaattt cattgatgtg catcgccttt gtcatactct tgacatcatt cccggctacg 18360
gctattacgt tcaatacttc gttcaaccct acagattgcc ttaaaaatca tgatacctgc 18420
ggccccctag ctgctgtaaa gggccggcgg tggagacccg aatgttgtaa attttggagc 18480
gggaatgtac ttccagaaac aagacaatgt gcatgttatg tactgaaata ttctcttggc 18540
gatggttatc ttccccttat tttaggtaag tgtaaattag gtggtatcga acaattcaaa 18600
tgttgggagc tgcgaacata taactaacca gaatcgtgaa aaccaaactg gagataataa 18660
gataaagtaa tcaattgggt atttctttat ttctttctaa tcattttaat aatgttactg 18720
ttcaataagg agagagaaat ggttttgttt ttgttcatgc tcgtgtgaat tacgattcca 18780
tgtttttttg tttccatata ttttcttata tatttagtaa aaaaaatgaa aaggtataat 18840
ctactctgga ttaagtacca taaataaata tttgttctta attaatctta gtgctttgga 18900
cttctaacac caactttatg cgtaataagc atggggagaa gaagcaaatg aagaattctt 18960
cttattcacc aagttttgta atataagaat tttcattcta ccaaaaaagc ctgtctctag 19020
tattttccct aacctctttc taaaaaagct tccgaccaaa tagatttgct catgtggcca 19080
gtgggctctt tacagccggt caccataatc tttttgtttt tgtttttgct ttgtattata 19140
tttcttctct tcgcagtggc gattatgtta tgattatgtt attcgcggtg ccgataaacc 19200
gtggcaaatt tttgttgtgt attcaatctt aattgaagca aaacttcatg attgtgttct 19260
gttattcttc gattgagatt gatcttttat gtatgcttct cctctttcac agtttttttt 19320
ttttggtaat ccagggttcc cagtttcgcg ggtcattccc tgggtccggt caggcagcgg 19380
gtcggcttca cccgggaggg tatgtcctga gcccgaaggt ccagtacccg cttcgtgaca 19440
tggatgagca gttcggctcc ggctggcgtc gaacccgcaa gcatgacaat tggccctcaa 19500
ggttctaact agtagaactg actcatcccg tctcctcttt cacagttgct ctttaaatcc 19560
cgttcgcttt aatggagttt tcttcttctc tattggattc gcatgtactc ttttcttaag 19620
ggagtcaatt ttcactcttt aaaagatgaa gccgccgatg aataggctct gagtgaagtt 19680
tcctggatag aaaggtggag taatctcgat ttgatttgat gaagatttag atgaatcggc 19740
atcctctcgg agatggtccg ataaagatct ttaattttat tgagtaatcc cagagttatt 19800
acccaatgaa gttgatggtg gctctcattg aagcgacagc cggatgaaag atagcagatc 19860
gagaagttca aagcttgttc ggtgaccatg agcagtctct gccgccggcg aggtgtaccg 19920
acttcctctc atcccatgcg ttggtgcgac agatgcatgt cagatccaga agtttaaaga 19980
ctcatgcaaa ggaggatgag ggcgcgtgtc acgtctttcc cgtgatgaag acacatgcac 20040
tattaggcct aataaaattt attttatgtc gagttgtatg atgagtttca agcctgttgc 20100
ttctcttgta atgttcattg ggcctttcta aaggaaagaa acatttgaca aaaaaaagaa 20160
aaaaattcta cctttaggcc cttcttatca acaactttga caacagacct caatgggttc 20220
atatcctatg gcctcttggg actctttttt ggatagtcat ccatactgtg aaggagtatt 20280
cggggtgtga taaggaaacc aaatcccttt gtaccagtca actgctgaat ggttagcttc 20340
catgtgagct aatcattact catcctcgca agtttttaga tgattgcttc tttttgatca 20400
gatggttgag tataatctat tttgaattag cctgttggac tagtttctct tattcaagaa 20460
atccacttgc tcagtgacac aagagcagct aagcgggtcc gtaactttgt tggtaatata 20520
aagggaaaac tcagatcttc tgttttgatc tttgcttgcg tctcagacat gtattgcaca 20580
tctttgtttc ttacaagcgt caaatcgttt atacattttt agtgaaacaa tggtgagcag 20640
gtagccaggt agtacctttc cttgcaactc acgcatgaat ataataaatc aactatttca 20700
ttgttgatga ctggatgatt cacaatcaag ttgctgggta tagtatttac actaattttt 20760
tttcttttgt ttactcgtga gatcatcaaa gatgttttag atatatgaaa agcatatttc 20820
atagtctata ttcatcttcc atgtatgttt ctttgatgat ttaaaaaaaa acagaagtac 20880
atcaacactt cttatctttg tgttttctta atctcaagtt ggtaaataga aaaaaatgat 20940
gaaaagaaga agaaaaacaa attactacga ggctctcagt aaagctgttc tttcttttca 21000
tgccaccatc tccacctgta aacacaaaat tgctagaaac attagtgaac ttttatataa 21060
ttttatataa tataaaaaac atataaaaaa ttattttaaa aatgaatttt aatataattt 21120
tgtgccaaat cttgcattct gagatcatca agtcaatgta gtatacgtac cagtaatagt 21180
cccaacgagg acggactttg gtcatgcggt tatcatcaga tgggtgataa ggatgagcag 21240
cgtggtgagt gttatggaaa gcgcagcaac ctgcagcgta gactgtgatg aggaggacta 21300
ggactagaat gttgacaacc gataactttc tccagtcaag acggatctct tcaagaacac 21360
cagctttaca agcatcacac tcgtagcata acgtttcaat accattgttc catctatagc 21420
aatcttctcc tccgactatt actccagtct cgtacgtgca cgccgttggt ggcttacaac 21480
atcccgacta caatcaaaga caggttagtt actaaacaaa ctgatgaaga tgctagttca 21540
tatcatagga cacaagggga gtttataacc aaaccggaaa aaaaaacaaa atccgatatg 21600
aacgggccta aaatcagata tttttggatt ccgaaataat atctgaaatt agctaaattt 21660
gttaaacttt tacatattta aggtaattta gatattatcg aaagataagg atgatgatac 21720
ctgaacagaa gtcatatccc tttggaaata atcaagtgta gtccaagatt caatcttaga 21780
acaagtcttt gaagtcaaga tacagcttct aatggagttc caatactctt gatctctaac 21840
tctctctctc agccacggat gataatctcc aagtctatat tctttgtaaa ccctccctgg 21900
tacttccaca ccacctcctt ggctagtcac cacaagacca aagagcgtta gacccatgag 21960
agtcgctatg aggaagatca tgacaactaa gtacacccac agagcccatg ccacgttgaa 22020
acaagctcct atgaaaccag caagggatac taacagtatg atgaatccta tcacgagaag 22080
cggtgtctgg aggaagttct cgcaagtttt actgcttctt gccttccata gagcagttcc 22140
tttgattggt attgaagcta gtaagctgag aaggtttatg accccaatca ctgtgttgct 22200
gaacctgtac atactaggat tgttatcaag aagaaaccag agaactttgc agtgtcttct 22260
ctcttctcta agcagattct ctcttatcaa ttaggaatct attggactat atttgcgaag 22320
tgattttgcc acatgttctt tctacaatca atttcacaaa acaaatatga cattgctact 22380
gaaattgatg acatgtatta tagcttaata tgacatggac aattgcattt aatgttaatt 22440
tatatttttg gtaaattttt taaaatatgg taataactca tatagtacat ttaatgtcaa 22500
tttatatttt agaaattttt tagaatatga aaataactca taaatcatca ttagaataaa 22560
tatattcaaa tatggcatta taaatttcga aatataatat aattatatat tttaaaatta 22620
tacaatttta ttactaaaat tttcaaaaat gtatacaatt ttcttagaaa attataaaaa 22680
tttaatcgta aaatcattat tttcttatat atctataaat tttataaata ttgtttaatt 22740
ttaattgttg gtgattatgc aacttttaca aatttattta atatatttaa ttaaaataaa 22800
tagatagaaa aatctatcta agattataat ttcaaatata tacaagcata ttcttaaata 22860
taatttttat gtttaattaa attaaattta tattaaaatg ttgatacgaa aaaagaaaat 22920
ttacaatatt aaaaaaaaaa tttaaaatat aatttatatt tatctgttaa aaaatatttt 22980
aattttttta cacacctagt tttaattaag ggaaaaggtt aagagttaat tgtttaatga 23040
ttcatgctca tattctcttg tcgtttcttg atttattttt atttttgtca agaggtcgtt 23100
tcttgatttg aatcaactaa acaacaacat taaaattgta tatttttttt caaataaaag 23160
cgtctttttg gacaattgtt tcttgtttaa tagtatttta tacgcttatg tcgtttaaac 23220
cagaccacaa gtagtgcctt gaataaaata tgtacttaaa attaaactat attgtatata 23280
tagtggaaca tatcatatat agaatcagat aaattcacaa tgatcaatga aaggtaagca 23340
aagaataata tagaggacgg atggtgaatt ttctttttaa gatgctttta ctggccccat 23400
aacttagcat attaggttct gtaggtagag cacaatatga tctttgattc ccccattcac 23460
attttttttg gtttaagcaa gaaaaatgct aaaacatact taatttaagc caaaatgtca 23520
taacacaaca aaatgagaca ataataacat tactgtaaca aatacatagt ttctaattag 23580
aacaaagact aaaccagacc aagagaaaag tcgacaacaa cttttaactc tgtccttcca 23640
ccatcatcat catcatcatc atcatcatca tcatcatcat catcctcata acttattgtt 23700
gtaccagaac acacctttct tctcaccttg cctatccggt tcaacataga tacactcctt 23760
cgcctccctc cacatcgcct taaccaccgg cgttccatca aactggtaat actctccaag 23820
tatcggcttt atcgccttgg tcgcttccat cgcgttataa tgcggcatcg tcgagaacag 23880
atgatgcgcc acgtgcgtgt ccgtgatgtt atgaaacacc ttgttcaaga ttccatagtc 23940
tctatccaca gtagccaaag ctcctctcaa ccaatcccac tccgaagaat catagtgagg 24000
cagcgaaggg tgcgtgtgct gcaagtaagt gatcaagacg aggaaacagt tgacaatcat 24060
aagcggaact ccgtagacac agaccatcga ggccactcct cgcgaaccag cgtagcggta 24120
gagaccgtaa catacggaga ggacgccagc gtcagagatg tatatctgga gacgctcgcg 24180
gtcgttgtag atgggagcgt tcgggtggaa atggcaagcg aaaccgtcgc tgtaaggtct 24240
tccagagacg ttgaaggcta agtacaacgg ccagccgagc gtgaactgga cggttagcat 24300
caccgtgcgt cctagcgggt tgttgaggta ctttccgtac cacttgatgt cggatttctt 24360
cttggggacg aacacttcat ccctctcgag ggatccggtg ttggaatggt ggcgtcgatg 24420
gctgtacttc caggagaagt aagggacgag gaggaaggag tggaagacga ggcccacggc 24480
gtcgtccagc cactggtggt cgctgaaggc gtggtggccg cattcgtggg cgatgaccca 24540
gaggcccgtt aggacgcagc cttggcaggc ccagtagagg ggccaggcga ggtaagggag 24600
agggtggggg aggagaggga agtaggctgt ggagaggtgg tagagggagg aggagacgag 24660
gatgtcgaag aggaggtagg agaaggagcg agggatggag cgtttgaagc agtgaggtgg 24720
gattgctttc ttgaggtctc cgagagtgaa gggtggtgtc tcgcagggga cgcgtttgag 24780
ggttttggtt tcgggggagc tggagggagg agagacttgc attcttccac ctgcgcccat 24840
gtttgtttct gtagagaaaa ccaaaaaata ataataatgt tatggaggac ggagactttt 24900
tatcctttaa tcaaagttgt atatgcaact cttcatgcat ttgaatctat aaaagaacat 24960
ctaaaccctg aagtacctac ctactttaaa tcatccgttt tatttgtaca aagttgatga 25020
gcttataagt caatgaaacg ttcttccatt tattaagaaa taacagtagc aagaaccagt 25080
aggaatcggt caaatctatc aaaggttcaa caataagtga tttttatatt gaaaaaaaac 25140
aaaaatagca ctaaaccaag tttttgttcc caaactagca ctcaaggtca aaagtcacaa 25200
aaatatcact taatatttta tcaaaagtca caaacttatg gtttagagtt aaagggtggg 25260
gtttagggtt tagggtttag ggtttagagt ttagggttta gggtttatgg ttcagagttt 25320
agggtttaga gttgagaaat gaggttttgg ggataagatt tcaaattttg aaaaataaaa 25380
aattaaaatt ttcaaaagat aaaataatat tttggtcatt ttaatttttg agtgctattt 25440
ttgtgatata aacttagaaa gttgctattt tggagatttg accttttcta tttcaccaac 25500
ctattgaata aaaagatttc tgaatagata gaaagttgca acatttcata tgctagacca 25560
tagacagtaa tcattattta acggtgagat gaaagaaaca tgacacaaga tttgtcaaat 25620
ggaaacagag gaacagatct ttagttgaat gcaataaaga ctggcagatc tatcgattta 25680
aatgccaaat gctagactgc tagagagatg gacgagatga acacagacca ggaattcata 25740
aaaataagag gaaaatgaga agaagaagaa gaagaagggg accctgaaag ctgctgacgt 25800
agggtggggg gagagagatt ttacgttaat aacgatgaac cctacaatga agctcctcca 25860
aagaatctat ctctctctct tctctttctc tctctctctc tcttgtctcg gcacttctct 25920
caatctgttg tggtttgtct ggtcagatgc gagtggcaat aggcagggcc gtttttaaat 25980
tgatgagaga caggaaggca tttgaatgac atctcttatt cttacaactg gcccctcttt 26040
tctcttattt ttacaactgg gcccctctgt tcaaaatatc tgatatttaa ctcaaggaac 26100
gaccattaat ttagaattta ccaaaatgta aaagttagag tgatgaaaag gtgatattac 26160
tacgacgttc tctctttttc tcgtccacgt tatcttggtt atgtatgtaa tgtaataaaa 26220
aaggtcgtat catgttattg acttaatcac tttggaacgc aatgacacat gcggtacttg 26280
tttgaatcag tttttctcta cgtaagtcaa tcatgtatca tttcttaata tgacattaga 26340
aacaacttga taaagaagaa gaagaagaag atggtagttg atgcctgaaa atggagtatc 26400
gtgtttggct tcttctcact tttgcccatg tgaacacaca agaacttaca gaaatatgta 26460
acagacaaat tgtggtgatg ctcacgtgag gatttctctc tcttttcttt ttcttattac 26520
aatttgttat gtatgtgtaa tcatctttga tacttataat aatcaaattt gttggcagac 26580
gaaaagaaac tagtaattga ttagattgag atctcttgta ttatactaga cttagaagat 26640
gattagagtt tgatttgtct aagcattacc tctaacaaca acacactttt ctttcaaaat 26700
tttttgttta agatcacaca cccaccatta ggaatgttat atttattcag ctgattgtta 26760
ctaccagtga cgggttttat aacatgtttt tttggtatca aagatgatgt gtctgactca 26820
cgcacaacag acaaatcaga gcaagcatga ctgtaagaaa attaaggcag catacaaatc 26880
ctaaccaccg tctgtcaatc catccaccaa gtctctcatc aattcaaact caatttaaca 26940
gcaaaaaaac tatattctaa gaatcaccac acagagagaa agaaaactta caaagacaat 27000
gaaactaaca ttgtattttc ataaaacaaa agcaaaatag atgaagaaga tggatgatat 27060
tagagatcac caccacacac aaaagaaaag acagcaaact ccacaaacag caacttaggc 27120
aattcctgac ctgcgcagct ctgcttcccc gtgcgcaaag tgacacctat ccccaaacgt 27180
acagttccct ttcgcgaacc tctcacacat cttcgtcttg aagttgctcc ctggatgtgg 27240
tttcccttcc gaaccaaccc caccaccaat cccaccacca ccaccaggtg gtctcctact 27300
agctgcagag ttaagcctcc caatcagctc tctaaccatc acactcgctt cgtttatctg 27360
ctcaaacgtc ccttcaagct caatgttctt caggttcggg tccctctcgt gatcttgaat 27420
cgacagcttc gcccccgtct gacgacatat ctgcttcgaa ctgactcctc ctttaccgat 27480
gatggctccg gccaacgaag cgtccacgct gattttcgca gtggctgagg cgccaaagct 27540
agacacatgg ccaggtccag actctcctcc tctccctgag aatctccctc ctccaccacc 27600
accaggtcct tgcatgtttc tggaagcttg aggcatgggt agtgccatgt ttgtcagctg 27660
tgctacagca ttgtatcctc cgggtacata gtgcaagaag tggcagttat ctccaaaagg 27720
acagccagaa gtgctgcaat agagcataat aaagacatca gatagttaaa accatttccc 27780
ttaagatgac acaagagaag ttgagaacaa acggttaaaa tacagaggaa gtatcaattg 27840
ctatacacaa ggaaccaatt agtcaccacc agtaatgtaa taaacttacc tgaacctgac 27900
catatatgac catgttataa acacaacatc actaacacct taccaccaaa cagaaaatta 27960
tagcaatttt ctaaacaagt tatagtttga tttcgaacgt tatgatcacc aattgagttg 28020
aacgtttcta tgattataat ccagatgcac ttatctctta ttgaaacttt tttttaactt 28080
gtttaggatc aatgatttat aagtacctgt aataacaatt aaccacttca ttagcataca 28140
gttttacttg ttaatttgac aattaacaat tttcaatatt aatccagtta agaaaaaaaa 28200
ggattataaa tttataacct gaaaaattta gtgcaaggct tggatttgct gcctaaacca 28260
gttgaatatg attccatctc tgttccaaac atttaagtgt gtttttattc tttagttaag 28320
agttttctca agttcaataa tatgacacca ttcatacttt tcatccatat gaaacttgag 28380
acttaagaat taaagctgca tgataccttc tgtaaatttt caggacacat caatccgaca 28440
aaggaaaaga catgggctgt cttactcaac tgaacatggt ttactaaaag caaaattgga 28500
actaaagtaa cttcgaaaaa aaaacat 28527
<210> 4
<211> 26095
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 4
acatcttcct cggaatatac cgagggacac ctttccttgg aatataccga gggacatgtt 60
cctcggaata ttttgaggaa gatgtccctc ggtatatttc gaacgttttt ttataaacgg 120
atcgatcgat ggatatatgt ccaaaaacgc atcgatcgat gaacttccga ggaaatatcc 180
cgacgaagtt ctccctcggt atattccgag gagattttcg acaaactagt gatcctcgga 240
atttcctcgg aaatttgttt cctcggaatt ccgtcggaaa attccgaggg atttccgagg 300
aaagaagaaa ttccgaggaa ttatttccga ggacttgttt cgtcggtatg tcgtcggaat 360
aacgttattc cgacgaaatt ccgacgattt tttccctcag tatccttgct gttttcttgt 420
agtgcaagaa agctaataga tattagcaag taagaagaca taagtacttg atggccaagc 480
aaaagcctag aattggaata tcacgacatt caagcaaaag gagaagacat attccaacag 540
agccagagcc atgttcaaga tgagacaaac aaatgtgggt ctataagggg acataaagca 600
aaaactcaat aaaaagttag gctagtgcct atatcagctg gacacatggg agaaccaggt 660
ccatgctata taacaatatt atcaaaagca gtgttttcat ataagtagga gtaactttct 720
tccctagtcc actctgtggt ctaaataacc accagaggca ctacacagga tacaaacaaa 780
agttgaaaac acacacagaa tctatgtata gagagtgaca aagaaaagga taagaaggta 840
cttccattga aagtacggag tgtctgatat atattgaatg tataactatt gtaattatca 900
gtcaacaaag tcctcacaaa gtcaagcctt tccatagagt cttttttcgg tagactcttg 960
ttagcaatgg atgaatcttc caagtgccct ggcgcaatat gtttcgagat cgcttgccaa 1020
acccaacact ccagctgatc caccatgact ctctccatcc tccactctac aaccctacaa 1080
cccgctcgac accgtctccg acgttctcaa cgccgctttc ttccgttaaa tctcccgttc 1140
ccgtctttac ccaaccaaaa gcaatctcaa gtgctgtcca atctcaaacg gaggcgaata 1200
cttcatgagt atctcaatcg gtactcgacc aacagccttc agatcgtcaa ataacataag 1260
agagttagac gacgcttgga ttaagccgct tctatcatgt tctatgcttg gactcagaca 1320
gagtatatga cgactatttc ttatcaatac atataggccc aaacaattta aactcaacaa 1380
ctgagcccaa taaaaaactt cgaataaatg aaacgatgag tttcataata ctgggacacg 1440
tggcacaatg atgtaaagtg actttcctaa ctggaatcct atgtgtcaca atgaggaggg 1500
agtaaaacac ttatttatat aattagataa ctatgtatat aacacataat cggttgaatc 1560
gaatgttttg gttcagatct cagtacataa ccaaaccgac ccggtgtccg aagtgcttag 1620
agctaaaaac ccattcggta tttgcctggt cccgttaccg aaccggaccc attattttgg 1680
ttcggtttaa ggtgtggact ccggtttaag ttaaaacccc cagccctagg gtaaatgata 1740
aaacatttgg ttgtgtatct cctcggtggt atggaaaacg taatagaatc cgaacttact 1800
agaccggtac gcgatttatt tttcgtctta cgtcgtaaga tgtcgaataa ggaaaaagca 1860
acgtcattat acatgttaat ccggttatct ttgatccttt tcgaggacat ttcggtttac 1920
ctttttgttt gttcaatacg ccactccggt ttaaaaaaaa aatcgggaag agttaggaaa 1980
aaaggaaaat ctcatctcac cccctcgacg acaagacaac caccaccctt agggttaaaa 2040
aggtttattt atctgattat tattctctct actcgttcgt tctcccttta attccgattt 2100
cgatttcgat ttgtcttctc cgatttgctc tctagacact cacagtaggg tttctaattc 2160
ggatctgtac accttttgcc atggatgctc gtaagagagg acggcctgaa gctggctcat 2220
tcaactccaa tggcggtgga ttcaagaagt cgaagcaagg ttagctcttt cgcctcgtcc 2280
tcttactttt ctatctcaaa agagtgttat agttctgttg tgcttcactt gctctgttaa 2340
aggttgaaac tttagatctt tattgcttga tggatagttt ctctgtgtca attggatttg 2400
gggtagcgat gatttcttca attcgagctt cgtaatattt tttgctcaac aaaagttttt 2460
gtttttagtt atgagattct ctaggattca agtttggatc tttctttcgt gctcacttgc 2520
tgcagtcttt gatctgatgc aaatctaaag tcaattaatt tttcagttta attgtggatg 2580
agcttttgat aagtgatgtt aaagttagtt tgagtgctgt tcgtagcaag cttattgtta 2640
tttgactttc tcttgagttt cattattgct ttagtttaat cccttttgca ttagctagta 2700
acatcttatc accatgccca aagcttgagt ttgctgtgat tgaattagcc tttttatgtg 2760
ttagttattc atgtgtctag ttgttggtaa ataatcctga aaattctaga gaatatatct 2820
tgcagctttg atttatgtgt gaagttacat atagatgaat ttgatatgta tgattctaaa 2880
agcaaatatt attgaacatc agcaaagtct taactaaaga aaaacactta atctttggaa 2940
cagagatgga atctggttta ggaagcaaat cgaagccatg cacaaaattt ttcaggttat 3000
aatccttttc ttaactaaat taatatttaa aattgttatt tatagtctga gctttaaatt 3060
gacaagtaaa aatgtatgct aatgaagtag ttagttgtta ttacaggtat gcatcatcct 3120
tcatgctaaa caagttaaaa aaaagtttca gtataacaaa tatgatattc actaggaacg 3180
gaaaaacaaa tctggattat aaatttagaa atattaagct caactggtga ttatagctta 3240
gaaaatcaat ccacaccttt tgtttgagct gtggcagtag ttaagatatg tgttgtaatt 3300
ctctgtttgg tggtaagata ttagttattg tgtttgtatc atcatggtca tatagtgtct 3360
agtaaggttg ttgcattact gaatactggt gaacatgtcc gtcatagaca agcagttagc 3420
atagttgcta tgtgccaatt cttctgtgtt tcaactgttt gttctcttgt gtcttctcaa 3480
tgccaatggt ttttaacttt ctgacgtatt tgttatcctt cttttgcagc acttctggct 3540
gtccttttgg tgagaactgc catttcttgc actttgttcc cggaggatac aatcctatgg 3600
cacagatgac aaacatggga tcacccatgt ctcaagtttc cagaaacatg caaggtggtg 3660
gtggtggtgg gggccgattt tcggggagag gagagtctgg acctggccac gtctctagct 3720
ttggtgcctc agccacagcc aaaatcagtg tggatgcttc cttggcaggc gcaatcattg 3780
gaaaaggtgg agtctgttcg aaacagatat gtcgtcaaac aggagcaaag ctatcgatcc 3840
aagaccacga gagagatccc aacctgaaga acattgagct tgaaggaaca ttcgagcaga 3900
tcaacgaagc gagcgcaatg gttagagagc tgattgggag gcttaattct gcatctagga 3960
gaccacctgg tggtggtggc ggtggacttg gttcagaagg gaaaccgcat ccagggagca 4020
acttcaaaac gaagatgtgt gagagattct cgaaaggaag ctgtacattt ggtgatagat 4080
gtcactttgc acacggggaa gcagagctac gcaggtcatg aattgcgcct agagttgctg 4140
gtggagttag agagtttgct ggcgaaacaa gtctctttca tttgttgtgg tgattcctaa 4200
tatcatcttc tcctacttgt ttttagttgt ctttgttttt tgagactaca atgtttagtt 4260
ttcattgtca gtgtaagttt tccccatttg gtgttttttt agaatctagt ttgaatttga 4320
gatgggggga tgcttgatga atgattgaca aaacagtggt taggatttgt atgctgtttc 4380
tacttaatat ttcatgtttt ctctgcttta ttttggtcag taagttcatg tgtttctctg 4440
acatgtgtgt gattatcagc tttgattatt ttccgagtat gtagatgtta tagttctctt 4500
atgatagaca atataactaa aaattcatgt taataatagc cgtcgctgat agtaacagct 4560
gaataaatga aatgaaatca tggtaggtga tgatcttaaa aaaaatgttg aaaataatgt 4620
gcgttgttac aatagcatct cctaaccact tttatatatg tctctataat agcatttaga 4680
tttagaagta aaatcactgc aatcctactt tatttcttcc tctaaaataa aaattgttat 4740
tttcacggaa atacattcct ttataataaa aacatacttt tttattcaca aaataatctt 4800
ttaatttttt attttaacaa ttataaccaa aataaatatt ttttaatgaa aatgtactgt 4860
ttatataaat atataatcat actttttatt tacataatag tttctataaa aatattcagt 4920
ataaataata tcatagtttt atgaatgtta cactaaattg gattggtttt caactttcac 4980
aaataaaaag tactatttat aaaattagaa aaaaatatat caagactatt cttttttaga 5040
ggaagaaata gaagaataca ttggaaacaa atctatctct attatatagt tttcctattt 5100
tagaaaaaaa aatagagaaa tacattggag atggtttaag cggtagtaac acaaagaaaa 5160
actctaaata tcttaagagc atctctaatg tacacttctg taatttcttc taaaatagag 5220
atctctatta tagaggtgaa aatgctccaa tgtatgcctc tataatagaa ttcatctatt 5280
ttaaaagaaa atatagagaa aaattacttt ttgcttttat atttaaaggt ggaaataaaa 5340
tatctctata taaataaata aactctatta tacatgtata cattggagca ttttcacttt 5400
tataatagag tttttttatt ttaagaaaaa atatagagat agaaatagaa atagaaatag 5460
agatgagttg gagattagaa atagagatga gtttgagatg ttgttacgta agaaagagct 5520
agagctttaa taaagtactt aaattaatta ctagtcggca gtcgctgcct acttgtttac 5580
cacctaaatt aatttattat aatatatatt acgaatctcc aaagtacaca tcacacacac 5640
tctactcacg tgatctcaac cacaatgtct gcagatattt tttatagttt tttctcacat 5700
gggagagaag aagccaagca cgatcctcca tcctcaactt tatagcattt ttttcttttc 5760
tttccggcta ccacttgtga gtcgagtcgg caagggcgtt tccttatatt aaagtaaaga 5820
catcaaatac catcgtctta atgctaatta acgtaattga tgagttctat aacataatcc 5880
aaactagtct ttgtgaacat taggattggg taaaccaata tttacatttt aaaaacaaaa 5940
tacaaaaaga aacgtgataa actttataaa agcaattata tgatcactgc atcttttcca 6000
cttttccgta aataaataca taaaagtgcc gtaaatatca gatatttgga gtagaaaagt 6060
aataaagaaa agaaatatga ggagagggaa taatggaggg ggcccacttg taaaaaagaa 6120
agaaaagaga tgtcactcaa tcgtctccca cgggcccccg tcaatttaaa cggcctgcct 6180
tctgcccaat cgcatcttat cagaaccaga cagattcatt accaaagaga tagagaagag 6240
agagagagag agagagagag agagtgagtt tgaggaggag cttcttcgta gggttcatcg 6300
ttattaacgt taaatcttca ccccctacgt cagccagctc aaggtccctt tcttcttcca 6360
tttcttttca ttctacgttg ttttcaatct tatgaaactt tctggtctgt gcttttctta 6420
tcgcttttct attctatcta tcatttttgc atttcagtcg atttaattct agatctgtta 6480
atattaaact atagatctgt tcttgattct ctgttttcat gtgtgaaatc tgatgctgta 6540
ttaatctgat tatattgtct ataccgtgga gaatatcaaa tgttgcattt tcatttgtcc 6600
gaatacaaag tgtttgactt tcaatcgttt ttaattatat atatatatat attttttgat 6660
gggttggtgg agttgaaaaa tcaccatagc agtctcacgt cctggtttta gaaatatcct 6720
attcaaaatt atatatttgt ttacttgttt tagatctgga cctgagacat ataagtacct 6780
atttgttgaa tctttgggta aaaacttatg tctctgggta aaatttgctg ggagatttga 6840
ccgattccta ttggctcttg attctgtagt tacgtaatac atgaaaaagt ttcatttggc 6900
ctatgctcac ttcatgctta taaacgtttt cttgcaaatt aattggatta gatgttattt 6960
catagattca gtcattcaga tacaatggag ttgcatgaag aaaataatag aattcgtgac 7020
agtaaaaaag attgtatttt tgtttgtttg tttatgttta aaagtctata tgttgacaat 7080
agagttgctc tcaactgttt catttagctt ctttttttgt caagttgctt attcttagag 7140
acattgtgat tatgacttgt cttctttaac gtagtttagt aataaaagac gaaagaaatt 7200
gatatccaca agaaagagat gtgagctgta gcgtatcaaa tctcgttcat ttactagtag 7260
tattctcaac gctatcgttt atttattttt ctttcgttgg tttgccacta tatgccactt 7320
ctctcctctt tgtcccacgt actatccatt ttttttgtgg tagtccattt tcttgtaact 7380
tataataacg taactctgaa tcttttgtct gtagattaat ttgttggttt aattaacttt 7440
taagtctttg cttttggctt atgcagaaac atgggtgcag gtggaagaat gcaagtgtct 7500
cctccctcca agaagtctga aaccgacacc atcaagcgcg taccctgcga gacaccgccc 7560
ttcactgtcg gagaactcaa gaaagcaatc ccaccgcact gtttcaaacg ctcgatccct 7620
cgctctttct cctacctcat ctgggacatc atcatagcct cctgcttcta ctacgtcgcc 7680
accacttact tccctctcct ccctcaccct ctctcctact tcgcctggcc tctctactgg 7740
gcctgccaag ggtgcgtcct aaccggcgtc tgggtcatag cccacgagtg cggccaccac 7800
gccttcagcg actaccagtg gcttgacgac accgtcggtc tcatcttcca ctccttcctc 7860
ctcgtccctt acttctcctg gaagtacagt catcgacgcc accattccaa cactggctcc 7920
ctcgagagag acgaagtgtt tgtccccaag aagaagtcag acatcaagtg gtacggcaag 7980
tacctcaaca accctttggg acgcaccgtg atgttaacgg ttcagttcac tctcggctgg 8040
ccgttgtact tagccttcaa cgtctcggga agaccttacg acggcggctt cgcttgccat 8100
ttccacccca acgctcccat ctacaacgac cgcgagcgtc tccagatata catctccgac 8160
gctggcatcc tcgccgtctg ctacggtctc ttccgttacg ccgccgcgca gggagtggcc 8220
tcgatggtct gcttctacgg agtcccgctt ctgattgtca atggtttcct cgtgttgatc 8280
acttacttgc agcacacgca tccttccctg cctcactacg attcgtccga gtgggattgg 8340
ttgaggggag ctttggctac cgttgacaga gactacggaa tcttgaacaa ggtcttccac 8400
aatattaccg acacgcacgt ggcgcatcat ctgttctcca cgatgccgca ttatcacgcg 8460
atggaagcta ccaaggcgat aaagccgata ctgggagagt attatcagtt cgatgggacg 8520
ccggtggtta aggcgatgtg gagggaggcg aaggagtgta tctatgtgga accggacagg 8580
caaggtgaga agaaaggtgt gttctggtac aacaataagt tatgaggata tgatgatggt 8640
gaaagaacaa agaagatatt gtcacgaacc tttctcttgc tgtctctggt cgtctttgtt 8700
ttaagaagct atgttttcgt ttcaataatc ttaactatcc attttgttgt gttttctgac 8760
attttggcta agttatgtga tgtgggacac gttagtgtct aaaatgtctc tgtgtctgta 8820
ttgttcttct catctgtgac tttcggacaa ctaaactctt gttctcgaac tacctcaatg 8880
tggcattaat gaaagtgtta ttgttgattt taatctgaaa ctgctattat ttagtgaatt 8940
tttacatcag ccaacttgtt tgtttaagac ctaccaatgg tataagaagg tttgtgtact 9000
aatgttcacc atgtccatag tgttaagaca taaccatgat cttctgtcca attaatttgc 9060
gtcgagttat cgtgttattt ggcaccttta ctatgttttt ttgtaaagaa ctccttacag 9120
aatagctttt tgtaaagaac tacgttttat ctttttgtaa gaacctttta acaaaagcca 9180
aattcattat tacctggcac aagaaaaaac tctggtttct tcctctttct ctgtttttag 9240
atttgaggag gaacatgaag atgaagaaaa agaaacaaat aaataacaaa tctctttttt 9300
tccattaacg gcagaaacac caaaacagag tgacaacaag aaacaaatgt agtgaggaaa 9360
aaccaaagaa aaaagaatat tctgaaacca actcgttgaa catattcaaa tacgaaacaa 9420
tctttcatcc aacggcgagc gtaatctaga agcatttcct gtggactatc gatggccctg 9480
cctcatcata ctcagccttt gctatccaca tctgcaagac caacattgtg tatcatagtc 9540
agcttaaaaa cgagtaacaa gcagaatcga caattttacc tgttggaagg tactgagtga 9600
tgctagaata gatcctccaa tccaaacact atacttcctc tccggtggag caaccacctt 9660
aatcttcata ctactcggag ccaaagcagt aatctcctta ctcatcctat cagcaatccc 9720
agggaacatc gtggtaccac cactaagcac aatgtttcca tacaaatctt tcctaatatc 9780
cacatcacat ttcatgatcg aattgtaagt cgtctcgtgg ataccagcag cttccattcc 9840
gaccaaagac ggctggaaaa gaacctcagg acacctgaac ctctcccctc cgatggtgat 9900
cacctgtcca tcaggcaact cgtagctctt gtcgacggat gagctagtgt tcgccgtctc 9960
catctcttgc tcgtagtcaa gtgctatgta agcgagtttc tctttcacgt ctctcacgat 10020
ctcacgctct gctgttgttg tgaacgagta gccacgctcg gttaaaatct tcatgaggta 10080
gtcagtgagg tcacgacctg cgagatcaag acgcagaatg gcgtgtggaa gagcatatcc 10140
ttcgtagatt ggaacagtgt gactcacacc atctccagag tccaatacaa tacctgaaac 10200
aatgattcca catcaataaa agtgttctac ctttttttta tcaacaaaag tgttcttcta 10260
ccttataaac tctctagata attataacat aataataata aataatttat aattataata 10320
attaatattt tttagtataa aatcttatga gaataaacaa tataaatatt attatttgta 10380
aatatttaaa ctcttatatt attatttttt tccaaccact acactcttat attacatata 10440
ttgttataat tggtaaacaa ctaggtcgaa gataggcatt gagttaccgt ctcagcgcta 10500
aaatgtctac taaaattata ttacattaca ttgagaaagc taagatgaac atcataaacc 10560
aatggtgttt gaagatctta ccagtagtac gaccactggc gtagagggac aaaacagctt 10620
ggatagcgac atacatagcg ggggtgttga acgtttcaaa cataatctga gtcattttct 10680
cacgattagc tttaggattg agaggagcct ctgtgagaag aacgggatgc tcttcaggtg 10740
caacacgcag ctcgttgtag aaagtgtgat gccaaatctt ctccatgtca tcccagttgc 10800
tgacaatacc atgctcaata gggtacttga gagtcaagat acctctcttt gactgagcct 10860
cgtcaccaac gtaagcatct ttttgcccca taccaaccat cacaccagtg tgacgtggtc 10920
taccaacaat gcttgggaac acagctcttg gtgcatcgtc tcccgcgaat ccagcctttc 10980
atatagagat ttggaggtaa gaaaattaaa agattttcag acagcattat attaaacaaa 11040
gttgttacgt ttatgattga ttaccttaac cattcctgtt ccattgtcac acactagtgg 11100
ctgaatgtcc tctccatctg ccattttcta atgattctga aactatatat atatatatat 11160
atatatatat atgtcaatga ttcaattgat tacaaaaaca caataacatt cttgaaaaaa 11220
atcaaatgaa catgaactca aacaaagatc tctgattcac tcacattgtt acaaaataca 11280
aaaaatcaat ttaacatttt accaaagaaa aacaaaaaat cgagaaaagt ctggtaattt 11340
atttttacct gatagtttgc gaggagagga aaaatagtac gaagagaaca aagagaagag 11400
cgaacgaaga agagaatata taggaagagt ctttctgaga aaagaagttt tattttattt 11460
taatggtgga agaagatccg agccgttgat atttgtaaga tgtgaccgaa gaaggacccc 11520
acgacgagtc atgttgatgg tggatacagc tgtctcataa agagtaacga cactccattt 11580
aattatttta ttaatctttc gaaatttggt aacgtaactg aaagtatcta ctctgtaaag 11640
tattaaatgg gctggaaaat gttccttaag ggacaaatcc aaccaaaaat tagttattaa 11700
tattaacggg ctgaaaaatg cttgaataaa aagttaatta ttaatattaa cgggctgaaa 11760
aatgcttgaa tgtgatatgt taaccctact aattttaata aagtttacta gattctgcca 11820
gtatatttgt ttttattcag aaactagggc tggcccgccc tacggacgga atgaatattt 11880
aaaaataatt taaattgtta aaataagtat ttaatgaaaa tttttattaa ttaaaaatat 11940
aaatattagt tatatttctt tttcttgggg tggcattaca tataataact tatgtggtgc 12000
attattaata ttgtgtaagt tgtgattgag atgtaagagt gaagttgtga tcgagaagtt 12060
attaatattg tgtaagtgag aagttattaa tattgataat ttatattatt tatttaaaat 12120
cttagggggt tttaacttgt ttttgttttt tccatttttg ttatgttttt aactttaaaa 12180
gtgtttataa attataaact gctaaattcc cattgaaatt ttgtgattga aatttaaata 12240
tttataacaa aatacaaata attacaaaaa catacgtaag atatatttgt attgtatttt 12300
ttaataacat ataccatata aaaccaacta attatttaaa tttagatttt aatagctgca 12360
ttgtattttt taataacaat tatgaattac taaaaacata tactatttga atttttatta 12420
atatatagtg atttccaaca gaatatgcga atgattattt ttatctgaaa atgagaaaca 12480
ttttgactaa aatattgtgt ctcgatacat gtgaccacgt caatttaata tatcggatca 12540
ttaagtgtcc aaatattttg taatgttatt ttctcagttt cataagataa tttgaatata 12600
taactttatt tctaatgtta ttggttagtg tattttaata gatttagaaa tccaaattaa 12660
atatattatt attagttata taattgtaaa atatatattg aaatcatgtg ttactggtgg 12720
catgatttaa aaattctaat tcaaaacaag tgttattcaa tcatactatt tattaataga 12780
tttgatttca taatggattt gaatagattt gtatatattt ctttgttaaa atataaattc 12840
tcaaatctga aggtaacccg aaagaaaacc atcggatttg taaatactaa tttttttttt 12900
ttttttgaca gcaagaaatt tacagactca tgttgactct gtaaaccata ttggtaactc 12960
cgcatccatg tgaacgacaa aggacagttg cttgcgtgca ctacgtgcta agctatccgc 13020
ccgaaggttc gccgtccgag gtacatggac gatgtctgag ttgaggaagt ttcctttgag 13080
gagtttgata tcttccaagt agcttccaaa tgctggccat tcttctggtt ccgaaaccat 13140
cttcaccaat tgagaacaat ccgttgcaaa cgtaacctgg acctgtctta aattcctcat 13200
acatttcatt gcccaaatca aagcctctat ctccgaatgc aggggagaga ggcatgccct 13260
tacattcctt gcccccagta gaccctcgaa ccccggtaaa gtactatgcc agccttgccc 13320
tgacattaat tctttatcct tccatgatcc atcaataaaa caccatcgac ctgatgtctc 13380
taaaggagga atggtttgta ccgaaagccc cctccttggt tcatttctca cttgtgcgtc 13440
tgcccagagt gatgattcca cttcagccaa tttaagagta tcccgcggat caatatccaa 13500
attactataa actttgttat ttcgggcttt ccatatatac cataaaatcc atgcaaaatg 13560
gtggtcatcc atttgcggtt gtactctcca aaaaagatga tccatattaa caaataaaga 13620
gctgataggg aagatattat gcggtgaagg aatcttggat agtgcccaca cttgacgtgc 13680
aggaggacat tcaaaaaata catgatttat tgattcttcc ggatctccac aacgagcaca 13740
acatatatct cctctgatcc ctcgtgcctt taaatttttc atcaccgata tacatcctga 13800
taccatttgc cacaagaaat gccgtatctt tggtggacac cgcactttcc agcagaaagc 13860
tttaagtata tccactgtgg ggccattaaa aacaggaggt tttaacctat cagggtaaat 13920
acgttcaacc tgataacctg attggaccga atattttcca ttattagtaa aatgccatcc 13980
atccttatcc tccatctgaa tcctacttaa agggatactt tcaataattc ttacatcctt 14040
cggatccact agagccctga ttgcctgtat attccatgaa cgagattcct gattgatgag 14100
ggaatccact gtgagttccg gataaaagtt gtgaaatttt ttatttgctg gtctcgggcg 14160
agtggctggg atccaaggat cattccatac agagatagat gatcctgttc ccaccctttt 14220
aattagtcct ttacaaacca gagatctagc agaagtaata ctcttccagc catatgacgg 14280
ggagtaagat cggatcggtt ccaggggtga agcattcctg taataccgtc ctttgaaaac 14340
tcttgaaaaa agagtatttg gtttctcaat tagcctccat agttgcttac caagcattgc 14400
tgtattaaaa tccataagat ccttaaagcc caaaccacca ttatctttgg tttcacacac 14460
tttatcccat gatttccaat gcatacctct tgcactaccc cctggactcc accaaaattg 14520
tgctacagca cccgtcagct tcttaactgt agcttttggt aacctataca cagacatcac 14580
atggtttggt aaggccgtaa tcaccgattt aataatcacc tcctttccac cttttgtaaa 14640
aaaacgaaag gtccatccat taaccctttt attcaaccgc tcttgaacaa atccaaacac 14700
ttgtaccttt atgtatattt aaatttgata ctaatttaaa tttgtatatt aaattttaac 14760
tttatgaaca aatccaaata ctaatttaaa tttgtatatt aaattttaac atatgtatat 14820
tttactttga tttgtaaata ttatttggat ttctgaatca actaaaatac ataaactaaa 14880
taataatata ttttctttgg aaattttaaa tgtatggact attaaatcat gcaaatacta 14940
tgaaaaacaa attgatctac aattggtata aaactatttc catgtatgag atacaatatt 15000
gttacgaacc taaaattata gtttattata ctatcaccta ttactgttat ttttgtaaaa 15060
caatatttta attttagata gaacttcaag attactcttt tggtaactgt tgccttaata 15120
ttcccggttc tattacatca gccattgaaa taaaatgtta ctaataaagt aagttactgc 15180
tggtaactaa aattcagaaa ccgagatgac ttaactcttc tattataacg tagatttata 15240
catttataaa acagatctta cataatcaac ttcttcacat cagactcact tacgtgacct 15300
ttttctagga tttccttgtg agattgggtt tgttcagttc ctagactcag tttcttcgcc 15360
tttgaccctt ctattcttct tccataaatt ctcctttcca ttttctcaac tcttgttcta 15420
cgcctaactc ttcttcttta gctttctcaa tttcttctgc aagtgttttt tgcttcttcc 15480
tctccaagtt accttgtcta tttctctagc ttcctcgatc tcagaacaac tgttgcaacc 15540
attgtattgg cttcttcttc agcatcatga gcacgctagc taagcagacg gcggctaatg 15600
ccaacctctc tgaaccctta gcagccttag tttattccta agttgcaaat aaaatggtct 15660
ccattgtact tgccccagcc tttgcttgct ctgcttcttc ttgagacttt cgaagctctt 15720
cagtgaatga ttttgcactg tgacagtgaa aattttttct tcatcagcct ttgtgttgct 15780
ttctgcggct gcttcggtag ctccgctatt tatcttatgg cttcttttcc ttggactcag 15840
aaatagctat tctcatgtta tacgaccatc actcgccagc aaaacaaacc tggataaaca 15900
taaggcattg tttactaaaa gcatgagaaa tgaaactaaa aatcatcttt cttggctttt 15960
tttcaaaaaa aaatatggta acaaaaccat aaactccgaa ttatcacaat atgcttaatt 16020
ctatggaggg acatcaagag aatctacgaa tgatatcttt tttgaattct ctgtaatccg 16080
taaccataag ctatcagtat tgtgaaacac taacatctaa caacctaaaa tcagacaaca 16140
accccacaaa gttgtagttt tatgacaata caatgaagca tttctctccc accaaccatc 16200
aaagagtatg caaacctaaa gccaactgaa gcatacacct taagattaaa acttgggaga 16260
actgtaaagt agacctctgg ttttggggtg actttaacag caacctcctg acccttgagc 16320
tctctttctt gaacttaggc tagcagagca agtgcaacca aaatgacctc tcccgagctc 16380
tcccatctga aactgcatac ctctgtattc agaaaacata ctgacaacac gttagtttgt 16440
agtaactaaa ataaagagag cccagcaaat aattattatt ttacagaacc agacaacatc 16500
aaaatcagat atattttttt gttaggtaga acttgttgca gttttgaaaa atagtaataa 16560
gaatttgctc actctttatg atgaagatgt actaagacac cgtccctctg caaactgctg 16620
ttgatgtcca taatacttgt attgtatcca tccttcaccg tgaagtttgt ttatgtttgg 16680
cagaatgacg gttagaatgg aaaagtgttt ggttattcaa actctaaggc agctgtatct 16740
tctttttagg cttgttgagc tttttcttct tctttctaca aaaacatgtc acagactcag 16800
agttagccaa gttcggtatt actaaagcaa gaggcctaaa caacacagaa ctgcagataa 16860
gttaattgac ccaccaactt ccactcatct gcctagcact cctcatcctt tactcgtgtg 16920
tagcttcttc agcctatgcc agacagtatg aagaaatttt tattaggaaa acgttgccac 16980
gtactaacgc tacaatctta aactttcaca gttagggcct gtaactgttc gactgatatt 17040
catgtagttt cccatccttg ctacttggtt acatatgtga attagataga acaatcaaca 17100
aacaaataaa taatcaacaa aaaaataaaa aatctgtaaa acttggttaa atgattcaac 17160
acaacgcata agttcaataa cataatcaag gataaaaaaa gttggtaagt ggattcacac 17220
ggcggagtcg ttacaaatat aatcaaattt tttttaatag attgatagga tgctttagat 17280
tgtagggatg ctaaccttat tatagtggaa cctccactga ttgatttcta gattggatca 17340
gtaggaaaaa gatgaataaa ttgctccaaa ctctagattc gctactgcgc agattgattg 17400
atggatcagt gaatggatag aaactttaga atttcttact gcggagaaga gagagcgtga 17460
aacgataaaa taagaaaagc ggcgtttcaa acccatcata ttatgcttta tatcgatatg 17520
ggctttaata aagtaaaata cacatacgaa gccaagccca acggaatccg atgaaaaaac 17580
aaatgaaacg gagcgtttaa taaggtggac acatgttaac gcgagagagc tcgactttcc 17640
tagctggaat ctgacgtgga gccctcagga gtgaggtgac tctactttat atataaagat 17700
ttagaaattt aattttcatg tttgtctttt tctttgtaat catatttgtg tttttctttg 17760
agatcatatt tgtgtataaa ttttaatcaa aatctattta taaaataata tcaatttaaa 17820
agttgatctg acatacgctc gtatttttgt aatcatatat gttcgtatgc tcgttttttt 17880
gtaaccatct gtgtctattc tagattttga tctccacttt taaagtgtat atttatttgc 17940
taaacaaatc aaatttattt gatataaatt tgtatttttg atttttaatt acatttaaat 18000
gttacaaata aagcattata attgtgcaga ttgtaatatg ttttctaata gaaataattt 18060
tgatgatgaa atatgtaacc aagttttact aaaatcaaga tatttttgca tttttagtat 18120
tttgaattat taacgtaatt tataatattt gtactcgaaa acctatgtag catctacctg 18180
taagtctagc cccgaatccg attaaatacg acctatatac tcaaaaatat tggtttcttg 18240
tattgatcta aattttgcta aatttaattt ataatataat tttcatatat tttctcgcta 18300
tttttatatt tgatcataat ccacgataaa aatggtaaat taagtgatct gcatataatt 18360
tatctcagat tttggattaa attataaaat ttatttttaa aaactccata aaattcggtt 18420
aaacccaaaa aaaattattg acatgtgatc cgataatggt tgacccgaaa aaaactagat 18480
aaatctaatg gtcacctata tgaaaatatt atcactacaa gaaaacataa cattaacgac 18540
ggcgaaattc gtagtaaatt cgtcgtaaaa caggttttac gaggaattag cgaggaaaca 18600
agtttcgtcg ttattcgttc gtcgtaacgc atatttcctc gctaattcgt cgtaaaatag 18660
cgagaaacac aattcgtcgt aaagacgaag aacaatattc gtcgtaaaaa ccatgtaacc 18720
tttccacgta aggaggacgc tagatttcct cgtaaatacc tcgaaagtaa ttcctcgtaa 18780
attacacata aacctttcca cgtaatatac tcgttaagct ttcctcgtag tgttgccgta 18840
aaagttttcc tcgtaacttc ttcgcaaact ttccacgtaa cgtagtcgtg ctttaggcgg 18900
atttgaatgc taccagcaaa tttatagatt ttaagtgttg ttatacatac gtagacatgt 18960
tctctattta ttaaataaat agtaacaatg tcaattaggt atagaccatg gccatatttt 19020
tagctaacag ataaaaaaaa tatttgagaa aaataatata tatgtatttc tggtcatgag 19080
aaaataatat gtgggttaaa tcatttatca tatagtagaa gggagtgggt tccgccggtt 19140
acaaggaaaa tgatcacctc gtttgtttcg agtaaaaaag ttaggtaact gtcatacctt 19200
ttataatgtg gtggttacat tcggaaatta aaaaaaggtt gcagttatca tataaaaatg 19260
tatgtgttgt tgaaataata gtttgaccct acgtttatca attggttaca ctaatagaat 19320
agatttatca agagtagtat actgtatttt tgttgttacg tttgtttccc gacaaactta 19380
aattttatta atacgaaagc ataatatctg aatacaaagt tggagttaac cacttaggtg 19440
gataaacttt acaattttca aaaatagaat ttgttggaca atgtcgaaca attttatgga 19500
cggcttgatt tccattacgt ttgacaaaaa aaaatgttgt tgtagaaaac ttattcctca 19560
agctagtaat ttcttcaaga agattttgaa tggttgaatt cgttagttga gcattgatca 19620
ttttaaccaa gatttctgag tctccttcga aaatcatatt gctatatcct cctatccaaa 19680
cattctgcat tgccacaagt aaagccaact aaactggaat tagagaaccc caaattagct 19740
gaaccccaca tataaggatg accataacag ttccaaataa tccatgcacc tcgaacttgg 19800
ttcgaattta aatcatatgc tgcatcgtaa ttacatttta gaaaaccttg atctcgtcgt 19860
gtccatgacg ataaagcagg aaaagaagaa attgtgcttg tattgcttac attaggagat 19920
gataaacata aatgagatat ccattctcta acgtcagcac aagcattgtc cactgtgaca 19980
tttgggggca gtatttgttt cctaaagaga agaaaattcc tctttttcca tatacgccat 20040
agcaaccaaa aaggtaacaa ccgttgataa agcgaaagag attgtatgct ttgaatatgc 20100
agcagaaacc gattttattg tccatataat catttgttaa taatggagcc gtaaaaggta 20160
gatatgaaaa tctccaaata catattgaat ctgagcacgt acaaaaacaa tggtcaattg 20220
tctcttctgc caaactacat ctctgacaaa tagaatctaa attcattcct cttgaattta 20280
gtcgtgtagt tgttccaata gcctttgata gaatacgcca aaaaaatggt taagtttggg 20340
cattatattt aatttcctaa tcttatcctt tagaatagga tcaccataag gaattggagg 20400
agcttcaatc aaaaactctg gtgcatgcct agcaacctta tatccagaag acacaggata 20460
gttttcatct cgtgtatgac tccaaatcaa cttatcttct ttttttgttt ggcttaaata 20520
tatctggctt acgagacgtt gatcctcatc gcataaataa gactgtagcg ccaccgtatt 20580
ccaatgtttg taaggtgata ctgtaatcat attactaaca cgtaaatcac aattaattgt 20640
tgtagaagca ggtcgaggtg gaataacagg taaccaatta tctttggaag ctcgtatatt 20700
tttgccattt cccacaatat agctacatcc tttctttaaa acctcaatac cagcgagcag 20760
agttgcctat ccatatgact gcttgcgaca tgtttttcct tctagaaatt gttttccttt 20820
aagatatcga gctttataaa gtttggaaaa gaggcaattt ggttttgagt agattcacca 20880
tgcttgtttg gcaagcaaag catcattaaa ttttggtaaa tctttgaatc caaatcttcc 20940
ttcttttttc gtatactgta gtttttttca agtcatccat ggtaaacctt taagatcatt 21000
tttaccccac cagaatccca ttaagatggc atctatcttt tgtgttgttg caacagggag 21060
tttaaaatgt gacatagaat agataggggt tgatacagca accgatttga tcgtaacttc 21120
tttaccagct gatgaaaaca tacataatta caagactcga gagccaatca agtccaataa 21180
ggcgtttaat gcggtcaacg cttcttgact tgaggctctt atatgggctt acatcagtgg 21240
cccattaagg tgattcttgt gtacttttaa gacttgttga atttacacat ttgaggatca 21300
aacagaaagc taagtatgga gagatccgtt tccttcgatc ttagcggcga taacgaactc 21360
ccgaatgatc ggagcagcga cgtcggatac accgccaatg atcggaggct cgcttactcc 21420
cgctcctttc accactccca ctcccacggc ccgcgaacgc ccgcagctaa gccttttctc 21480
gataggacgg tctccaccat cgatatgccg ccggagatat actctgtcga cggggatgat 21540
gttttcttcg gggaagggaa agcggcggcg attgggaaag cgtcggcttt gcgtatggtt 21600
ttggtggttt ttggggtgct gagaaatgga aatcggcaga tgaagagatt gtttctgctg 21660
atttcgctta acgtggcgta ttctaccaca gagctgttga ttgggttatt gactgggcgt 21720
gtaggtacga tttggttcca gcttttaaca ttttgttaca cttagttttt agttcgtggt 21780
aactttgtgt gtgtgggaga gacttttgga tttgttgaag aactaaggtt ttagtagtgg 21840
ctagagatat agatggaaag tgaaatgaat cagctaaagc cccaagattt tgattccaag 21900
tcttaatttg atataatctg aatcatgaaa ctaaaccacc acatggatag tagatcttgt 21960
gcgtgtatcc agggaacttg gctatgcagc tgtaatttct gattatttat taaccttact 22020
ctcttttttt ggctgtttta tttgactctt acaggtttgg tttccgatgc attccatttg 22080
acatttggat gtggtctctt gacgttttct ttgtttgcaa tggcgacttc aaggaagaag 22140
cctgatcatg cttactcgta cgggtaagaa atatgtaaaa tttgatccgc ttagtttgtt 22200
ttgtattagg gatataggtt ggaatgcatg ctttgtggta gttaacggtt gatttctcaa 22260
tttgtcaaat tattttttct tttctttctc tctggagcaa ttcctaaagt agattcgcta 22320
atgttttcgt aggatatagt atttatagtt gctgaatatg aaaccttttc tgtttgattt 22380
ttttgctgct aatactgtaa ttgcataatg ctgaattggt tggaacttag aaatcgttgc 22440
cttttttggt taccaggtac aaaagacttg aagttctatc tgctttcact aatgctgtaa 22500
gtatgttctt aaagtttgtt ggatcatgga tgtcatttcc agttttaatt tgaaggtcta 22560
atggctgatg tgccatgcaa taaaactggt ttaatatcgt atagaaatta gtgtcctgag 22620
cttatctcag tgtttgcaca ctttccttta ctgttgttgg tagaatagaa taatcttaca 22680
gctcgttaaa aatgttgatt atcttttcat tttgccttca tcactgtctc attcatttta 22740
tcttttgggt taacacattg atatgttcag tattgacata tgtgtagaca gctgtttctt 22800
atgttcatgt cgttctcctt agctgtggaa gctcttcatg catttgttca agatgaatca 22860
gagcacaagt aagtttcttt ccccaagtga catgcctaag agagctcgta gttatttctc 22920
tagcacttac taagtttaca ctaagttctt tgcattaata tgatgtattg aaattgactt 22980
catgcaggca ttatcttatt gtatcagcgg taacaaatct gctggtgaac ctacttggtg 23040
tttggttctt ccggaattat gctcgtatga atattggtat gtattctctg ttttataatt 23100
atgcttaagt tctggttaga cttgaatgaa ctgatgccaa tactggtgat ttatatcata 23160
tagccctgtt tggcggcttt ggtatatttc gtttgtaaaa actggccacc cctgtcaatg 23220
taaagcaaca aagaagcaaa gggtttctaa ttaagataga ataagtagga ggattagtta 23280
aaatagagag acagaagcat gatgactgaa tctggccttc tgtacatatt caaaactcac 23340
atttttcttg aatgtgtttc ttaaattcat aaaatgatgc agtgtacaga aaagcagaag 23400
atatgaacta ccactccgtt tgcttgcatg tcatatcaga ttccatccgc aggtgtgata 23460
ttctttttgg ctttctttat ctcaagcaga gccgcagata gctagataga aaaatgtttc 23520
tctttgcatg gaatttacat acatcccaca tgacatattc gctgcttctg tcttttcagt 23580
gcaggtctga tactggcatc ctggctcctc tctctggggt aatgctcact tcctttaaaa 23640
ggaacaaaat gaataaaaat gtcttattac ctgacctctt acattttcca tttttctcct 23700
ccggtctttg gatttttcag ggttgaaaat gcagaggtcc tatgtttggg attggtatca 23760
gttacagtgt ttatgcttgt tatgccactc ttcaaagcca ctggtggcgt tttgcttcag 23820
atggcacctc caaacattcc ttcttccgca ttaagtaaat gcttgcgtca ggttcgctct 23880
gttccataaa gtgtttcctg aacgtgtaca tatagatcga tcaacctggg tttctcttca 23940
actatcttta tttacagatt acttctcgag aggatgtcat agaggtttta caggcacgtt 24000
tctgggaggt tgtgcccggt cacactgttg gctcactcag aatccaggta ctagcttcct 24060
tactgttttc atatcggtta aaacacgaat ccataataag aattgtactg attttgagct 24120
ggttatttgt gtttaggtga agagcgggat agatgaaagg cctttactgc aatatgtgta 24180
tgatgtatac catgatttgg gtgtacaaga cttgacgctg caaacagact acagctgagc 24240
tgcatctact tctatgtttt caaatactga ggactttgga tgtatactag tagagattat 24300
ggttctataa gaagatagca cttggtttca agcttgcgag tttcttgtta catttgttta 24360
gttttatttt ttttaattcc ttttcccatt cgtcttttga accacacaca caaggaccac 24420
aatctttgta aactctttta gtctttcaag tttgtgcgtc tttttggctc aaattctcct 24480
ttttaatcct ttttcatgta aaaaaatcat ctgcaaaatg taaaatcaaa acggtagcac 24540
gtaaaattgt cagctgaaac aagattttat tgttcttctt gtttacacag aaaaaactaa 24600
gtggaggaat caaagatcat attgtgctcc tcaacctaca cagcctaata ttctgcaagt 24660
tatggggaca gtacaagcat cttaaaaagc aaattcatcc gtccatgtct atgttattct 24720
ttgcttaccc ccgtttgctt cgttgatcat tgtaaattta acatagttta ctaaacgata 24780
caaaaatttg taaacataaa aaaaatgata caaaaattta atatagttta ctaattgact 24840
acgtgcacat gacaaaggaa tttttattaa tggaacttga aaatatattt tggatttaac 24900
tgaactacaa aaacgcaaga tatatatgaa aagtatctca attatttccc gtaacgagtc 24960
aacaatttca aagtatacaa tacccacata tgatacgatc cattatataa tccatgattg 25020
cgttttttgg actctaagct agaaaaatgt atattaataa tatggtatat catatttaat 25080
taaggcacta cttgtgtggt ctgctttatt gttagttaaa cgtataaaat agaataataa 25140
acaagaacca attgtccaaa aagacacttt tatttgaaaa aatactattt ttaatgttat 25200
tgtttggatg attcaaatca agagacgacc agagaatatg agcatgaatc atcaaaccat 25260
taactcttaa cctttcccct taaaaaaaat tcccagttga taagatagaa tcaaaagcag 25320
aaaaaaggta gagttaaaca atataataac taaaaaacaa agaagattgt aagataaagc 25380
tgatgaagtt cacattacaa gaagagaatc tgcttattac aaaagagaga gatataagag 25440
aatacactgc taagtctctg gtttcttctt gataacactt tcactatgta cagattcagc 25500
aacacagtga ttggagtctt aaacctcctc agcttactag cttcaatacc aatcatagga 25560
gccgctctat ggaaggcaag aagcagcaca acttgcgaaa acttcctcca gactcctcta 25620
ctcgttatag gtttcatcat actcttagta tctctcgccg gattcatagg agcctgtttc 25680
aacgtggcat gggctctttg ggtttactta gtggtcatga tcttcctcat cgcgactctt 25740
atgggtctaa ctctgtttgg tctggtggtg acgagccaag gaggcggtgt ggaagtacca 25800
gggagggttt ataaagagta taggcttggt gattatcatc catggttgag agagagagtt 25860
agagatcctc agtattggat ctctataaga agctgtatct tgagttccaa gacttgtgct 25920
aagattgaat cttggactac acttgattat ttccaaagag acatgacttc tgttcaggta 25980
tcatcctcag tgcctagagc catgttaaaa aaaattaacc gtagattttt atatatgtct 26040
aaagttttta ttgatttata agtattaata actccagtta tatatgtttt ttttt 26095
<210> 5
<211> 1161
<212> DNA
<213> Brassica napus
<400> 5
atgggtgcag gtggaagaat gcaagtgtct cctccctcca aaaagtctga aaccgacaac 60
atcaagcgcg taccctgcga gacaccgccc ttcactgtcg gagaactcaa gaaagcaatc 120
ccaccgcact gtttcaaacg ctcgatccct cgctctttct cctacctcat ctgggacatc 180
atcatagcct cctgcttcta ctacgtcgcc accacttact tccctctcct ccctcaccct 240
ctctcctact tcgcctggcc tctctactgg gcctgccagg gctgcgtcct aaccggcgtc 300
tgggtcatag cccacgagtg cggccaccac gccttcagcg actaccagtg gctggacgac 360
accgtcggcc tcatcttcca ctccttcctc ctcgtccctt acttctcctg gaagtacagt 420
catcgacgcc accattccaa cactggctcc ctcgagagag acgaagtgtt tgtccccaag 480
aagaagtcag acatcaagtg gtacggcaag tacctcaaca accctttggg acgcaccgtg 540
atgttaacgg ttcagttcac tctcggctgg cctttgtact tagccttcaa cgtctcgggg 600
agaccttacg acggcggctt cgcttgccat ttccacccca acgctcccat ctacaacgac 660
cgtgagcgtc tccagatata catctccgac gctggcatcc tcgccgtctg ctacggtctc 720
taccgctacg ctgctgtcca aggagttgcc tcgatggtct gcttctacgg agttcctctt 780
ctgattgtca acgggttctt agttttgatc acttacttgc agcacacgca tccttccctg 840
cctcactatg actcgtctga gtgggattgg ttgaggggag ctttggccac cgttgacaga 900
gactacggaa tcttgaacaa ggtcttccac aatatcacgg acacgcacgt ggcgcatcac 960
ctgttctcga ccatgccgca ttatcacgcg atggaagcta cgaaggcgat aaagccgata 1020
ctgggagagt attatcagtt cgatgggacg ccggtggtta aggcgatgtg gagggaggcg 1080
aaggagtgta tctatgtgga accggacagg caaggtgaga agaaaggtgt gttctggtac 1140
aacaataagt tatcttgcta a 1161
<210> 6
<211> 1134
<212> DNA
<213> Brassica napus
<400> 6
atgggtgcag gtggaagaat gcaagtctct cctccctcca gctcccccgg aaccaacacc 60
ctcaaacgcg tcccctgcga gacaccacca ttcactctcg gagacctcaa gaaagcaatc 120
ccacctcact gcttcaaacg ctccatccca cgctccttct cctcttcgac atcatcatct 180
cctcctcggc tcctccctct accacctctc cacagcctac ttccctctcc cttacctcgc 240
ctgacccctc tactgggcct gccaaggctg cgtcctaacg ggcctctggg tcatagccca 300
cgagtgcggc caccacgcct tcagcgacca ccagtggctg gacgacgccg ccggcctcgt 360
cttccactcc ttcctcctcg tcccgtactt ctcctggaag tacatccatg acgccaccat 420
tccaacaccg gatccctcga tagggacgaa gtgttcgtcc ccaagaagaa atccgacatc 480
aagtggtacg gcaagtacct caacaacccg ctaggacgca cggtgatgct aaccgtccag 540
ttcaagctcg gctggccgtt gtacttagcc ttcaacgtct cgggaagacc ttacagcgac 600
ggtttcgctt gccatttcca cccgaacgct cccatctaca acgaccgcga gcgtctccag 660
atatacatct ctgacgctgg cgtcctctcc gtatgttacg gtctctaccg ttacgctgct 720
tcgcgaggag tagcctctgt ggtctgtgtc tacggagttc cgcttctaat tgtcaactgt 780
ttcctcgtct tgatcactta cttgcagcac acgcaccctt cgctgcctca ctatgattct 840
tccgagtggg attggttgag aggagctttg gctactgtgg atagagacta tggaatcttg 900
aacaaggtgt tccataacat cacggacacg cacgtggcgc atcatctgtt ctcgacgatg 960
ccgcattata acgcgatgga agcgaccaag gcgataaagc cgatactttg gagagtatta 1020
ccagtttgat ggaacgccgg cggttaaggc gatgtggagg gaggcgaagg agtgtatcta 1080
tgttgaaccg gataggcaag gtgagaagaa aggtgtgttc tggtacaaca ataa 1134
<210> 7
<211> 1161
<212> DNA
<213> Brassica napus
<400> 7
atgggcgcag gtggaagaat gcaagtctct cctccctcca gctcccccga aaccaaaacc 60
ctcaaacgcg tcccctgcga gacaccaccc ttcactctcg gagacctcaa gaaagcaatc 120
ccacctcact gcttcaaacg ctccatccct cgctccttct cctacctcct cttcgacatc 180
ctcgtctcct cctccctcta ccacctctcc acagcctact tccctctcct cccccaccct 240
ctcccttacc tcgcctggcc cctctactgg gcctgccaag gctgcgtcct aacgggcctc 300
tgggtcatcg cccacgaatg cggccaccac gccttcagcg accaccagtg gctggacgac 360
gccgtgggcc tcgtcttcca ctccttcctc ctcgtccctt acttctcctg gaagtacagc 420
catcgacgcc accattccaa caccggatcc ctcgagaggg atgaagtgtt cgtccccaag 480
aagaaatccg acatcaagtg gtacggaaag tacctcaaca acccgctagg acgcacggtg 540
atgctaaccg tccagttcac gctcggctgg ccgttgtact tagccttcaa cgtctctgga 600
agaccttaca gcgacggttt cgcttgccat ttccacccga acgctcccat ctacaacgac 660
cgcgagcgtc tccagatata catctctgac gctggcgtcc tctccgtatg ttacggtctc 720
taccgctacg ctggttcgcg aggagtggcc tcgatggtct gtgtctacgg agttccgctt 780
atgattgtca actgtttcct cgtcttgatc acttacttgc agcacacgca cccttcgctg 840
cctcactatg attcttcgga gtgggattgg ttgagaggag ctttggctac tgtggataga 900
gactatggaa tcttgaacaa ggtgtttcat aacatcacgg acacgcacgt ggcgcatcat 960
ctgttctcga cgatgccgca ttataacgcg atggaagcga ccaaggcgat aaagccgata 1020
cttggagagt attaccagtt tgatggaacg ccggtggtta aggcgatgtg gagggaggcg 1080
aaggagtgta tctatgttga accggatagg caaggtgaga agaaaggtgt gttctggtac 1140
aacaataagt tatgaggatg a 1161
<210> 8
<211> 1137
<212> DNA
<213> Brassica napus
<400> 8
atgggtgcag gtggaagaat gcaagtgtct cctccctcca agaagtctga aaccgacacc 60
atcaagcgcg taccctgcga gacaccgccc ttcactgtcg gagaactcaa gaaagcaatc 120
ccaccgcact gtttcaaacg ctcgatccct cgctctttct cctacctcat ctgggacatc 180
atcatagcct cctgcttcta ctacgtcgcc accacttact tccctctcct ccctcaccct 240
ctctcctact tcgcctggcc tctctactgg gcctgccaag ggtgcgtcct aaccggcgtc 300
tgggtcatag cccacgagtg cggccaccac gccttcagcg actaccagtg gcttgacgac 360
accgtcggtc tcatcttcca ctccttcctc ctcgtccctt acttctcctg gaagtacagt 420
catcgacgcc accattccaa cactggctcc ctcgagagag acgaagtgtt tgtccccaag 480
aagaagtcag acatcaagtg gtacggcaag tacctcaaca accctttggg acgcaccgtg 540
atgttaacgg ttcagttcac tctcggctgg ccgttgtact tagccttcaa cgtctcggga 600
agaccttacg acggcggctt cgcttgccat ttccacccca acgctcccat ctacaacgac 660
cgcgagcgtc tccagatata catctccgac gctggcatcc tcgccgtctg ctacggtctc 720
ttccgttacg ccgccgcgca gggagtggcc tcgatggtct gcttctacgg agtcccgctt 780
ctgattgtca atggtttcct cgtgttgatc acttacttgc agcacacgca tccttccctg 840
cctcactacg attcgtccga gtgggattgg ttgaggggag ctttggctac cgttgacaga 900
gactacggaa tcttgaacaa ggtcttccac aatattaccg acacgcacgt ggcgcatcat 960
ctgttctcca cgatgccgca ttatcacgcg atggaagcta ccaaggcgat aaagccgata 1020
ctgggagagt attatcagtt cgatgggacg ccggtggtta aggcgatgtg gagggaggcg 1080
aaggagtgta tctatgtgga accggacagg caaggtgaga agaaaggtgt gttctgg 1137
<210> 9
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 9
atgggtgcag gtggaagaat g 21
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 10
agcgtctcca gatatacatc 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 11
atgtatatct ggagacgctc 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 12
tagatacact ccttcgcctc 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 13
tctttctcct acctcatctg 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 14
ttcgtagctt ccatcgcgtg 20
<210> 15
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 15
gacgccacca ttccaacac 19
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 16
acttgccgta ccacttgatg 20
<210> 17
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 17
cccaaagggt tgttgaggta cttgccgt 28
<210> 18
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 18
cgcaccgtga tgttaacggt tcagttca 28
<210> 19
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 19
taagggacga ggaggaagga gtggaaga 28
<210> 20
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 20
ttctcctgga agtacagtca tcgacgcc 28
<210> 21
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 21
gtcgctgaag gcgtggtggc cgcactcg 28
<210> 22
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 22
cagtggctgg acgacaccgt cggcctca 28
<210> 23
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 23
gagaagtaag ggacgaggag gaaggagt 28
<210> 24
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 24
gaagtacagt catcgacgcc accattcc 28
<210> 25
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 25
tcccaaaggg ttgttgaggt acttgccg 28
<210> 26
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 26
accgtgatgt taacggttca gttcactc 28
<210> 27
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 27
gagaagtaag ggacgaggag gaaggagt 28
<210> 28
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 28
tggaagtaca gtcatcgacg ccaccatt 28
<210> 29
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 29
gtagagaccg tagcagacgg cgaggatg 28
<210> 30
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 30
gctacgctgc tgtccaagga gttgcctc 28
<210> 31
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 31
gaggccaggc gaagtaggag agagggtg 28
<210> 32
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 32
actgggcctg ccagggctgc gtcctaac 28
<210> 33
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 33
gagaggccag gcgaagtagg agagaggg 28
<210> 34
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 34
actgggcctg ccagggctgc gtcctaac 28
<210> 35
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 35
aggcccagta gagaggccag gcgaagta 28
<210> 36
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 36
ccagggctgc gtcctaaccg gcgtctgg 28
<210> 37
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 37
tagtcgctga aggcgtggtg gccgcact 28
<210> 38
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 38
agtggctgga cgacaccgtc ggcctcat 28
<210> 39
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 39
acactctttc cctacacgac gctcttccga tctacgtacc ctctcycyta cytcgcc 57
<210> 40
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 40
acactctttc cctacacgac gctcttccga tctcgtaccc ctctcycyta cytcgcc 57
<210> 41
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 41
acactctttc cctacacgac gctcttccga tctgtacgcc ctctcycyta cytcgcc 57
<210> 42
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 42
acactctttc cctacacgac gctcttccga tcttacgtgt catagcccac gagtgcggc 59
<210> 43
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 43
acactctttc cctacacgac gctcttccga tctctgacgt catagcccac gagtgcggc 59
<210> 44
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 44
acactctttc cctacacgac gctcttccga tcttgactgt cggcctcatc ttccactcc 59
<210> 45
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 45
acactctttc cctacacgac gctcttccga tctgactggt cggcctcatc ttccactcc 59
<210> 46
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 46
acactctttc cctacacgac gctcttccga tctactgagt cggcctcatc ttccactcc 59
<210> 47
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 47
acactctttc cctacacgac gctcttccga tctgctagca gacatcaagt ggtacggc 58
<210> 48
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 48
acactctttc cctacacgac gctcttccga tctctagcca gacatcaagt ggtacggc 58
<210> 49
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 49
acactctttc cctacacgac gctcttccga tcttagctat ctccgacgct ggcatcctc 59
<210> 50
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 50
cggtctcggc attcctgctg aaccgctctt ccgatctacg tactggtagt cgctgaaggc 60
gt 62
<210> 51
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 51
cggtctcggc attcctgctg aaccgctctt ccgatctcgt acctggtagt cgctgaaggc 60
gt 62
<210> 52
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 52
cggtctcggc attcctgctg aaccgctctt ccgatctgta cgctggtagt cgctgaaggc 60
gt 62
<210> 53
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 53
cggtctcggc attcctgctg aaccgctctt ccgatcttac gtggacgagg aggaaggagt 60
gga 63
<210> 54
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 54
cggtctcggc attcctgctg aaccgctctt ccgatctctg acggacgagg aggaaggagt 60
gga 63
<210> 55
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 55
cggtctcggc attcctgctg aaccgctctt ccgatcttga ctagtgttgg aatggtggcg 60
tcg 63
<210> 56
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 56
cggtctcggc attcctgctg aaccgctctt ccgatctgac tgagtgttgg aatggtggcg 60
tcg 63
<210> 57
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 57
cggtctcggc attcctgctg aaccgctctt ccgatctact gaagtgttgg aatggtggcg 60
tcg 63
<210> 58
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 58
cggtctcggc attcctgctg aaccgctctt ccgatctgct agcccgagac gttgaaggct 60
aag 63
<210> 59
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 59
cggtctcggc attcctgctg aaccgctctt ccgatctcta gccccgagac gttgaaggct 60
aag 63
<210> 60
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 60
cggtctcggc attcctgctg aaccgctctt ccgatcttag ctgaaggatg cgtgtgctgc 60
aag 63
<210> 61
<211> 13472
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 61
gaaatatcct tcctattcaa agttatatat atttgtttac ttttgtttta gatctggacc 60
tgagacatgt aagtacatat ttgttgaatc tttgggtaaa aacttatgtc tctgggtaaa 120
atttgctgag agatttgacc gattcctatt ggctctggat tctgtagtta cctaatacat 180
gaaaaagttt catttggcct atgctcactt catgcttata aactttttct tgcaaattaa 240
ttggattaga tgctccttca tagattcaga tgcaatagat ttgcatgaag aaaataatag 300
gattcatgat agtaaaaaga ttgtattttt gtttgtttgt ttatgtttaa aagtctatat 360
gttgacaata gagttgctat caactgtttc atttaggttt atgtttttgt caagttgctt 420
attctaagag acattgtgat tatgacttgt cttctctaac gtagtttagt aataaaagac 480
gaaagaaatt gatatccaca agaaagagat gtaagctgta acgtatcaaa tctcattaat 540
aactagtagt attctcaacg ctatcgttta tttctttctt tggtttgcca ctatatgccg 600
cttctctgct ctttatccca cgtactatcc attttttttg tggtagtcca tttttttgaa 660
actttaataa cgtaacactg aatattaatt tgttggttta attaactttg agtctttgct 720
tttggtttat gcagaaacat gggtgcaggt ggaagaatgc aagtgtctcc tccctccaaa 780
aagtctgaaa ccgacaacat caagcgcgta ccctgcgaga caccgccctt cactgtcgga 840
gaactcaaga aagcaatccc accgcactgt ttcaaacgct cgatccctcg ctctttctcc 900
tacctcatct gggacatcat catagcctcc tgcttctact acgtcgccac cacttacttc 960
cctctcctcc ctcaccctct ctcctacttc gcctggcctc tctactgggc cggtaccgcc 1020
ttttgcagtt tatctctatg cccgggacaa gtggagtcca tgctcaacac cgtgcaggat 1080
gaggatgacc accgcggtag cgacttcgtg ggcgaggaaa gcctttcgtc caaggtggtc 1140
cctcctcgca atcttgttgg atggtgaata ttataaaagc ctgcccttct cgcgggtgtt 1200
taaacgtcga cctgcaggtc aacggatcag gatattcttg tttaagatgt tgaactctat 1260
ggaggtttgt atgaactgat gatctaggac cggataagtt cccttcttca tagcgaactt 1320
attcaaagaa tgttttgtgt atcattcttg ttacattgtt attaatgaaa aaatattatt 1380
ggtcattgga ctgaacacga gtgttaaata tggaccaggc cccaaataag atccattgat 1440
atatgaatta aataacaaga ataaatcgag tcaccaaacc acttgccttt tttaacgaga 1500
cttgttcacc aacttgatac aaaagtcatt atcctatgca aatcaataat catacaaaaa 1560
tatccaataa cactaaaaaa ttaaaagaaa tggataattt cacaatatgt tatacgataa 1620
agaagttact tttccaagaa attcactgat tttataagcc cacttgcatt agataaatgg 1680
caaaaaaaaa caaaaaggaa aagaaataaa gcacgaagaa ttctagaaaa tacgaaatac 1740
gcttcaatgc agtgggaccc acggttcaat tattgccaat tttcagctcc accgtatatt 1800
taaaaaataa aacgataatg ctaaaaaaat ataaatcgta acgatcgtta aatctcaacg 1860
gctggatctt atgacgaccg ttagaaattg tggttgtcga cgagtcagta ataaacggcg 1920
tcaaagtggt tgcagccggc acacacgagt cgtgtttatc aactcaaagc acaaatactt 1980
ttcctcaacc taaaaataag gcaattagcc aaaaacaact ttgcgtgtaa acaacgctca 2040
atacacgtgt cattttatta ttagctattg cttcaccgcc ttagctttct cgtgacctag 2100
tcgtcctcgt cttttcttct tcttcttcta taaaacaata cccaaagagc tcttcttctt 2160
cacaattcag atttcaattt ctcaaaatct taaaaacttt ctctcaattc tctctaccgt 2220
gatcaaggta aatttctgtg ttccttattc tctcaaaatc ttcgattttg ttttcgttcg 2280
atcccaattt cgtatatgtt ctttggttta gattctgtta atcttagatc gaagacgatt 2340
ttctgggttt gatcgttaga tatcatctta attctcgatt agggtttcat agatatcatc 2400
cgatttgttc aaataatttg agttttgtcg aataattact cttcgatttg tgatttctat 2460
ctagatctgg tgttagtttc tagtttgtgc gatcgaattt gtcgattaat ctgagttttt 2520
ctgattaaca gatggcttca tctgagaacg ttatcactga gttcatgagg ttcaaggtga 2580
ggatggaagg tactgttaac ggacatgagt tcgagatcga gggtgagggt gaaggtagac 2640
cttacgaggg acataacacc gttaagctta aggttacaaa gggtggacct cttcctttcg 2700
cttgggatat cctttctcct caattccaat acggaagcaa ggtaagtttg tggattcttc 2760
gtccatgtga tctttgagtt tctttagagc ttgtgaggga ttagtaagta acaatgcttg 2820
agttttttgc tgctgggctt cgaaaagttt gtcacttgtt ggtttgatcc acaaggtctt 2880
cttctccata gctactagac atgttttagc ttaagattca agtttatata tgccttgtgg 2940
attaatcatt gcctgattct tccgtgtcat ctctgagttt atttagagct tggaagtggt 3000
gtagtaataa ctaacaatac tcttgataag ttgtagcaat gctcttgatt agtggatgta 3060
atatgatgtt gataagatat atgaggcaca gaaccaaaag tggtgcttcc actagacccg 3120
tttttagcct aaggttcaag tttatacctt gtagatgttt ctgtattgtc tgattcttcc 3180
ctgtgatatt tgaatttctt agagctttgg aagtgatata ggaacaatgc tcttgtgtgt 3240
ttgtctctat gaagattatc gctgtcgtgt ttcatccgag tgtgcgggat tttttgctgc 3300
tgggtttagc ctttcttcaa aaagttatta cttgttagtt ttattgtttt ggtcttgata 3360
agagatgtta ggacagacat ggtgcttctt gtctatagcc actagaccta ttttagcata 3420
aggttaacga aattctctct acataccttg tggatttgtt tacattgcct gatctttcct 3480
gtgatcgctg tcatgtttct ttggaatgat tgatgtttat aaatggaaaa atctttgtgc 3540
agaagactcc cgcccatctc tctatgcccg ggacaagtgc caccccacag tggggcagga 3600
tgaggatgac caccatgggg tcgcagcgtg tgcgtgtccg tcgtacgttc tggccggccg 3660
ggccttgggc gcgcgatcag aagcgttgcg ttggcgtgtg tgtgcttctg gtttgcttta 3720
attttaccaa gtttgtttca aggtggatcg cgtggtcaag gcccgtgtgc tttaaagacc 3780
caccggcact ggcagtgagt gttgctgctt gtgtaggctt tggtacgtat gggctttatt 3840
tgcttctgga tgttgtgtac tacttgggtt tgttgaatta ttatgagcag ttgcgtattg 3900
taattcagct gggctacctg gacattgtta tgtattaata aatgctttgc tttcttctaa 3960
agatctttaa gtgctgttta aacaaccgac aaccactttg cggacttcct ttcaagagaa 4020
ttcaataagg ttaattccta attgaaatcc gaagataaga ttcccacaca cttgtggctg 4080
atatcaaaag gctactgcct atttaaacac atctctggag actgagaaaa tcagacctcc 4140
aagcatgaag aagcctgagc ttactgctac ttctgttgag aagttcctca tcgagaagtt 4200
cgattctgtg tctgatctta tgcagctctc tgagggtgag gaatcaagag ctttctcttt 4260
cgatgttggt ggaagaggat acgttctcag agttaactct tgcgctgacg gattctacaa 4320
ggatagatac gtgtacagac acttcgcttc agctgctctc cctatccctg aagttcttga 4380
tatcggagag ttctctgagt ctcttaccta ctgtatctca agaagggctc agggtgttac 4440
tcttcaagat cttcctgaga ctgagcttcc tgctgttctt caacctgttg ctgaggctat 4500
ggatgctatc gctgctgctg atctttctca aacttctgga ttcggacctt tcggtcctca 4560
gggaatcgga cagtacacta cttggagaga tttcatctgc gctatcgctg atcctcatgt 4620
ttaccattgg cagaccgtta tggatgatac cgtttctgct tctgttgctc aagctcttga 4680
tgagcttatg ctttgggctg aggattgtcc tgaggttaga catcttgttc acgctgattt 4740
cggatctaac aacgttctca ccgataacgg aagaatcacc gctgttatcg attggtctga 4800
ggctatgttc ggagattctc aatacgaggt ggccaacata ttcttttgga ggccttggct 4860
tgcttgtatg gaacaacaga ctagatactt cgagagaagg catcctgagc ttgctggatc 4920
tcctagactt agagcttaca tgcttaggat cggacttgat cagctttacc agtctctcgt 4980
tgatggaaac ttcgatgatg ctgcttgggc tcagggaaga tgtgatgcta tcgttagatc 5040
tggtgctgga actgttggaa gaactcaaat cgctagaaga tctgctgctg tttggactga 5100
tggatgtgtt gaagttctcg ctgattctgg aaacagaagg ccttctacta gacctagagc 5160
caagaagtga agatcggcgg caatagcttc ttagcgccat cccgggttga tcctatctgt 5220
gttgaaatag ttgcggtggg caaggctctc tttcagaaag acaggcggcc aaaggaaccc 5280
aaggtgaggt gggctatggc tctcagttcc ttgtggaagc gcttggtcta aggtgcagag 5340
gtgttagcgg gatgaagcaa aagtgtccga ttgtaacaag atatgttgat cctacgtaag 5400
gatattaaag tatgtattca tcactaatat aatcagtgta ttccaatatg tactacgatt 5460
tccaatgtct ttattgtcgc cgtatgtaat cggcgtcaca aaataatccc cggtgacttt 5520
cttttaatcc aggatgaaat aatatgttat tataattttt gcgatttggt ccgttatagg 5580
aattgaagtg tgcttgcggt cgccaccact cccatttcat aattttacat gtatttgaaa 5640
aataaaaatt tatggtattc aatttaaaca cgtatacttg taaagaatga tatcttgaaa 5700
gaaatatagt ttaaatattt attgataaaa taacaagtca ggtattatag tccaagcaaa 5760
aacataaatt tattgatgca agtttaaatt cagaaatatt tcaataactg attatatcag 5820
ctggtacatt gccgtagatg aaagactgag tgcgatatta tggtgtaata catagtttaa 5880
acgggcccaa gactcccgcc catctctcta tgcccgggac aagtgccacc ccacagtggg 5940
gcaggatgag gatgaccagt cagttttact tcccttaatt ttctatgtac tttcataatt 6000
acttatgtta ttttcttcat gagttttaat gcaaattact atatggactc tagtgaaaac 6060
gttcagaatc ctataaacat gactactgag acgaacttga gagtagtttt gatcatacac 6120
acgtttcatg tggtacttga gagttactaa tttttgtcat cttcgtataa gtagtaaaag 6180
atactacaag aatagtttag tagaaaatac tagcggtagg tgaagatttg tcgctatgta 6240
ctattattgt ctagtaactt gagtaacaat ttcgtggtct aaatatcaaa taaaaatgga 6300
tgagtggttc accaaatcta ggcatcaaaa ctattaatgt cattgtctag atcttaggtg 6360
acaccacatt tcgaatattt attggtaatt gagatgttaa agtaccaata tttgacttaa 6420
taaactaaaa gattttggct ttatcaaatg tagacattga tgacatatcg ttgtcattat 6480
cttgagtata tacaagtcga tcaattaggt gaaagtttag tgtctcgtgg ttggtaaacg 6540
attaatacag tagtatattt tatccaaaga caaaatccaa atcatttcac cagtatgaat 6600
agtattattt tatcttaaaa gctaaaatct taaaaaccaa ggtagcaccc acgttgagct 6660
agacgatcaa atcgatttct gctttgtcca atttaccaag ctatttaaag ccaaataatt 6720
gaaatatagg taggtcgtta tattaggcta agatttatct caaatgctta actaaaggaa 6780
taacaaggga ttctagttgt gtggttttat aagattggtc caatttcact taagtttgtt 6840
tattgtagaa ttttatatgt gaataatttg aattccaatt gaaaagatat tatagtaaaa 6900
gaaaaaatag tgcgaacaaa aaactttaat cccataaaaa gaaaaagaaa aatgaaaagt 6960
tcttctaaca tccatatttt gcatcatatc ataaagataa gaaagataca tatcatagac 7020
gtacagataa acaaacatat catcatttgt gaaatacata gtacaataat ttgcttttaa 7080
atagagttta agtcacacac actgacacac acgataaaac gataatgtct gcaaaaacac 7140
tttaatccca ttgcctagag gacagcttct ccactttgtc tttaaggttg gttttgccgt 7200
gttgttttta tctttatata atgatctatt ttttggatta tgaaatgaat tcacacattt 7260
taattattta agaagatcca tatacaggtt tataacagta ctaagtgatg attatttttt 7320
gtttttgcat agtttagttt attgggtaaa cattcattac gtgtctcttt atacgaatca 7380
cccatccaaa atttcaagta gtcttttagt tcatttatta tttcataact atttgactta 7440
ttgatttgac aagaaacaac aaaagtgttg acttattgat agattgtggg atcataaaag 7500
taattaagcg tcaaccacga cccacaacaa caaagcacat gttatacatt aatatctcgt 7560
ttacttaatt acagttttca gaatgccgtt tcatgtcttg tcactggcga tgttattatc 7620
atgttggaca atattcgact gttgtcgttt ttacattttc gtattgacta aaactaaaaa 7680
aacaaaactc tgtttcaggt tgggcctagg atccacattg tacacacatt tgcttaagtc 7740
tatggaggcg caaggtttta agtctgtggt tgctgttata ggccttccaa acgatccatc 7800
tgttaggttg catgaggctt tgggatacac agcccggggt acattgcgcg cagctggata 7860
caagcatggt ggatggcatg atgttggttt ttggcaaagg gattttgagt tgccagctcc 7920
tccaaggcca gttaggccag ttacccagat ctaatatcaa aatctattta gaaatacaca 7980
atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta caaaaaaatt 8040
ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt tgtcgggtca 8100
ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta ctatcgataa 8160
tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac aatacaaaga 8220
cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg agtaagatca 8280
cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga aatactcaaa 8340
ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg ccaacatggg 8400
agtccaaggt tgtttaaaca tttaaatacc ctgccaagct tgaggtagcc tccaatttga 8460
cggtgccgcc agcgacgccg tctggaactg tcctttttga ggaccactcc gtttgtggag 8520
atcatgagag tccatgctca acaccgtgca ctagggacag gattgaagac tcccgcccat 8580
ctcactaggg acaggattgc caccccacag tggggcctag aaagactgga gttgcagagt 8640
ttgtgtcttc tagattaatc ctccaaactt ttgattaacc aaaaaaatta tcaaactaac 8700
atgttctcct tttttcttta gaaattctaa cgaatttatc tttatactga tttgaatata 8760
cttaatttgg tcatttggat gccctttaca acctccttac caaactattg atcacagttt 8820
ctattgctaa aatcaccaac aaaacgcatg tcgccattca taattatggt ttcacaccta 8880
caactaggct aataagtaaa taagtagaca actagactca ggtttgaaaa aaccataaaa 8940
gccatatagc gttttctcat tgaaactgcg aacacgatcg tgtgaatgtt gcagtttcta 9000
gttttgatac aaacaaacaa aaacacaatt taatcttaga ttaaaaagaa aaaagagaac 9060
ggagcccact agccactcct tcaaacgtgt cttaccaact ctcttctaga aacaaattag 9120
gcttcacctt cctcttccaa cctctctctc tctctctctc tctttttctc aaaccatctc 9180
tccataaagc cctaatttct tcatcacaag aatcagaaga agaaagatgg acctgcatct 9240
aattttcggt ccaacttgca caggaaagac gacgaccgcg atagctcttg cccagcagac 9300
agggcttcca gtcctttcgc ttgatcgggt ccaatgctgt cctcaactat caaccggaag 9360
cggacgacca acagtggaag aactgaaagg aacgacgcgt ctctaccttg atgatcggcc 9420
tctggtggag ggtatcatcg cagccaagca agctcatcat aggctgatcg aggaggtgta 9480
taatcatgag gccaacggcg ggcttattct tgagggagga tccacctcgt tgctcaactg 9540
catggcgcga aacagctatt ggagtgcaga ttttcgttgg catattattc gccacaagtt 9600
acccgaccaa gagaccttca tgaaagcggc caaggccaga gttaagcaga tgttgcaccc 9660
cgctgcaggc cattctatta ttcaagagtt ggtttatctt tggaatgaac ctcggctgag 9720
gcccattctg aaagagatcg atggatatcg atatgccatg ttgtttgcta gccagaacca 9780
gatcacggca gatatgctat tgcagcttga cgcaaatatg gaaggtaagt tgattaatgg 9840
gatcgctcag gagtatttca tccatgcgcg ccaacaggaa cagaaattcc cccaagttaa 9900
cgcagccgct ttcgacggat tcgaaggtca tccgttcgga atgtattaga aatcaccagt 9960
ctctctctac aaatctatct ctctctattt ttctccagaa taatgtgtga gtagttccca 10020
gataagggaa ttagggttct tatagggttt cgctcatgtg ttgagcatat aagaaaccct 10080
tagtatgtat ttgtatttgt aaaatacttc tatcaataaa atttctaatt cctaaaacca 10140
aaatccagtg tttaaacgag tccatgctca acaccgtgca ctagggacag gattgaagac 10200
tcccgcccat ctcactaggg acaggattgc caccccacag tggggcctag aaagactgga 10260
gttgcagaca ttaaggatga ccagttcgta aaggtcctgc ggtgtctatt gcttttcata 10320
ggttaataag tgtttgctag actgtggtga aaggcctatc cgaagtaagg ccggccggat 10380
ccttcatctt tggacaaggg aataaagact ccccacttgc tactaagaac aatacctaag 10440
ttgcccagac atgactgtac ccattcagag acctaccacc cattagggct atgacactaa 10500
cactagcccc tggaggttga ccatgctagg cagtgggggt ctcacctatg acccactcag 10560
ataggggttt aaaccagtgg gtgggatctc agcctcatat aggtgtttgt ggtgagcttt 10620
ctcctagaca agagaaccct gaagaacagc aagaaccagc taatatgata tgtagacata 10680
gtgggttgct caaattttgt gtttagtcat attagaattg acctcagtga ccactcagaa 10740
agtgcccaag cccatctata ggggccaaag tgctattgac tggtgtgtct gtgaattgtt 10800
cctccctaca gagttggtgc tgatatatcc tagcattctt tggaaaacct agctagggac 10860
tgtcaagtgt aagatacctc ctgaattgga gggaacacta gctgccctgt accttctggc 10920
tagtacctta caccctgaat gggttagggg gtctattatt tgctggaaat ataccagttt 10980
cagtagggct gctgccttag gtcccacaag gtgtaacatg tgctcaatag ttgcactacc 11040
acatgcacgt gaacttaatg atgttatagc cacaacacca accttggttt gcagtttgac 11100
atccctctgg aatgggtgta gtcatcttgc tctggatctg cctgaatcat tggggctgta 11160
tgcagcctgg gcttaaagtg aagaatggga tgtcccagaa atattttggg tgagaagaat 11220
cctggagtag atggtgacct gactatccct gtcctatggg cacaatctat catcagatat 11280
tgcattcaaa gggctatcat gggatcaagt cctaagtcaa ctgttgttta cctggcagac 11340
attcatctag gagttctctt ttatgccacc ccacagtgat ccgccttttg cagtttatcc 11400
actagggaca ggattgccac cccacagtgg ggcctctatg cccgggacaa gtgtaaaata 11460
tagagtatag gggttatcat cacagagaag ctattgctgg agggcctctg ttatttcctc 11520
tccatgccac tcccattttt aacctaccaa ctgaaatccc aagggagact ccaccctgta 11580
actagagtcc tcagaggtga gccatcccat attaacaaat gggcattagg gctaggatgc 11640
caagggatac ctgaaatggg aagttgtggg gctgagtcct cctgggaatc agagataata 11700
tgtaaacagt ttgttgagag attgatgaga gctgactttg agaggtggcc atgctccctg 11760
gtcctcaata gggaaggcac tacacaagaa acctgggttt gatcaactgc actgtgtcct 11820
actcacacat tgtgtgcctg gaaaaatgtt acttagtatt tggagggcct ccagaacccc 11880
cctgggtgca agactgggtg ctagtgactg ggtgaatgag tcttggacac agtggccttg 11940
tctaggttgt gtgaggtggc taggcatcat ggcaatacct cataattgat gagtgaggaa 12000
acaagactaa gtccttgact cctcttatta catgacctgg tggatattat gtttaaactc 12060
tgcaagctgg aatgagtact gggtgcagat cccctgggat tctggctaca aaggtgaatg 12120
atagctagtc tgtttattag tagccaaaaa agtcagtgag gggtgagtgc cctgggatgt 12180
tgttaagttc acattgcaca cttggagacc ctctccatcc agtaacatac cagagaaaac 12240
tgaccaagcc ctcatgggtg tatgggaaca acaaacctcc tggctacttc aagggcacat 12300
aacaccagca aggagcctgt cataaccacc atctcaaaca atagaacttc ctaagtgaag 12360
caatgacttc aaatctactt gaaggcatgg agtataagcc atgttccttt cagaggggac 12420
tgtacttctg tagattactt tccctcatta accagatctg gccggccgca tgccagggct 12480
gcgtcctaac cggcgtctgg gtcatagccc acgagtgcgg ccaccacgcc ttcagcgact 12540
accagtggct ggacgacacc gtcggcctca tcttccactc cttcctcctc gtcccttact 12600
tctcctggaa gtacagtcat cgacgccacc attccaacac tggctccctc gagagagacg 12660
aagtgtttgt ccccaagaag aagtcagaca tcaagtggta cggcaagtac ctcaacaacc 12720
ctttgggacg caccgtgatg ttaacggttc agttcactct cggctggcct ttgtacttag 12780
ccttcaacgt ctcggggaga ccttacgacg gcggcttcgc ttgccatttc caccccaacg 12840
ctcccatcta caacgaccgt gagcgtctcc agatatacat ctccgacgct ggcatcctcg 12900
ccgtctgcta cggtctctac cgctacgctg ctgtccaagg agttgcctcg atggtctgct 12960
tctacggagt tcctcttctg attgtcaacg ggttcttagt tttgatcact tacttgcagc 13020
acacgcatcc ttccctgcct cactatgact cgtctgagtg ggattggttg aggggagctt 13080
tggccaccgt tgacagagac tacggaatct tgaacaaggt cttccacaat atcacggaca 13140
cgcacgtggc gcatcacctg ttctcgacca tgccgcatta tcacgcgatg gaagctacga 13200
aggcgataaa gccgatactg ggagagtatt atcagttcga tgggacgccg gtggttaagg 13260
cgatgtggag ggaggcgaag gagtgtatct atgtggaacc ggacaggcaa ggtgagaaga 13320
aaggtgtgtt ctggtacaac aataagttat gaagcaaaga agaaactgaa cctttctcat 13380
ctatgattgt ctttgtttta agaagctatg tttctgtttc aataatcttt aattatccat 13440
tttgttgtgt tttctgacat tttggctaaa at 13472
<210> 62
<211> 5521
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 62
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attgaattcg agctcggtac cggggacaac 120
tttgtataga aaagttgggt ggtttaaact atgtattaca ccataatatc gcactcagtc 180
tttcatctac ggcaatgtac cagctgatat aatcagttat tgaaatattt ctgaatttaa 240
acttgcatca ataaatttat gtttttgctt ggactataat acctgacttg ttattttatc 300
aataaatatt taaactatat ttctttcaag atatcattct ttacaagtat acgtgtttaa 360
attgaatacc ataaattttt atttttcaaa tacatgtaaa attatgaaat gggagtggtg 420
gcgaccgcaa gcacacttca attcctataa cggaccaaat cgcaaaaatt ataataacat 480
attatttcat cctggattaa aagaaagtca ccggggatta ttttgtgacg ccgattacat 540
acggcgacaa taaagacatt ggaaatcgta gtacatattg gaatacactg attatattag 600
tgatgaatac atactttaat atccttacgt aggatcaaca tatcttgtta caatcggaca 660
cttttgcttc atcccgctaa cacctctgca ccttagacca agcgcttcca caaggaactg 720
agagccatag cccacctcac cttgggttcc tttggccgcc tgtctttctg aaagagagcc 780
ttgcccaccg caactatttc aacacagata ggatcaaccc gggatggcgc taagaagcta 840
ttgccgccga tcttcacttc ttggctctag gtctagtaga aggccttctg tttccagaat 900
cagcgagaac ttcaacacat ccatcagtcc aaacagcagc agatcttcta gcgatttgag 960
ttcttccaac agttccagca ccagatctaa cgatagcatc acatcttccc tgagcccaag 1020
cagcatcatc gaagtttcca tcaacgagag actggtaaag ctgatcaagt ccgatcctaa 1080
gcatgtaagc tctaagtcta ggagatccag caagctcagg atgccttctc tcgaagtatc 1140
tagtctgttg ttccatacaa gcaagccaag gcctccaaaa gaatatgttg gccacctcgt 1200
attgagaatc tccgaacata gcctcagacc aatcgataac agcggtgatt cttccgttat 1260
cggtgagaac gttgttagat ccgaaatcag cgtgaacaag atgtctaacc tcaggacaat 1320
cctcagccca aagcataagc tcatcaagag cttgagcaac agaagcagaa acggtatcat 1380
ccataacggt ctgccaatgg taaacatgag gatcagcgat agcgcagatg aaatctctcc 1440
aagtagtgta ctgtccgatt ccctgaggac cgaaaggtcc gaatccagaa gtttgagaaa 1500
gatcagcagc agcgatagca tccatagcct cagcaacagg ttgaagaaca gcaggaagct 1560
cagtctcagg aagatcttga agagtaacac cctgagccct tcttgagata cagtaggtaa 1620
gagactcaga gaactctccg atatcaagaa cttcagggat agggagagca gctgaagcga 1680
agtgtctgta cacgtatcta tccttgtaga atccgtcagc gcaagagtta actctgagaa 1740
cgtatcctct tccaccaaca tcgaaagaga aagctcttga ttcctcaccc tcagagagct 1800
gcataagatc agacacagaa tcgaacttct cgatgaggaa cttctcaaca gaagtagcag 1860
taagctcagg cttcttcatg cttggaggtc tgattttctc agtctccaga gatgtgttta 1920
aataggcagt agccttttga tatcagccac aagtgtgtgg gaatcttatc ttcggatttc 1980
aattaggaat taaccttatt gaattctctt gaaaggaagt ccgcaaagtg gttgtcggtt 2040
gtttaaacca acttttgtat acaaagttgt cccctctaga gtcgacctgc aggcatgcaa 2100
gcttagcttg agcttggatc agattgtcgt ttcccgcctt cagtttatca caagtttgta 2160
caaaaaagca ggctgtcgac ctgcaggtca acggatcagg atattcttgt ttaagatgtt 2220
gaactctatg gaggtttgta tgaactgatg atctaggacc ggataagttc ccttcttcat 2280
agcgaactta ttcaaagaat gttttgtgta tcattcttgt tacattgtta ttaatgaaaa 2340
aatattattg gtcattggac tgaacacgag tgttaaatat ggaccaggcc ccaaataaga 2400
tccattgata tatgaattaa ataacaagaa taaatcgagt caccaaacca cttgcctttt 2460
ttaacgagac ttgttcacca acttgataca aaagtcatta tcctatgcaa atcaataatc 2520
atacaaaaat atccaataac actaaaaaat taaaagaaat ggataatttc acaatatgtt 2580
atacgataaa gaagttactt ttccaagaaa ttcactgatt ttataagccc acttgcatta 2640
gataaatggc aaaaaaaaac aaaaaggaaa agaaataaag cacgaagaat tctagaaaat 2700
acgaaatacg cttcaatgca gtgggaccca cggttcaatt attgccaatt ttcagctcca 2760
ccgtatattt aaaaaataaa acgataatgc taaaaaaata taaatcgtaa cgatcgttaa 2820
atctcaacgg ctggatctta tgacgaccgt tagaaattgt ggttgtcgac gagtcagtaa 2880
taaacggcgt caaagtggtt gcagccggca cacacgagtc gtgtttatca actcaaagca 2940
caaatacttt tcctcaacct aaaaataagg caattagcca aaaacaactt tgcgtgtaaa 3000
caacgctcaa tacacgtgtc attttattat tagctattgc ttcaccgcct tagctttctc 3060
gtgacctagt cgtcctcgtc ttttcttctt cttcttctat aaaacaatac ccaaagagct 3120
cttcttcttc acaattcaga tttcaatttc tcaaaatctt aaaaactttc tctcaattct 3180
ctctaccgtg atcaaggtaa atttctgtgt tccttattct ctcaaaatct tcgattttgt 3240
tttcgttcga tcccaatttc gtatatgttc tttggtttag attctgttaa tcttagatcg 3300
aagacgattt tctgggtttg atcgttagat atcatcttaa ttctcgatta gggtttcata 3360
gatatcatcc gatttgttca aataatttga gttttgtcga ataattactc ttcgatttgt 3420
gatttctatc tagatctggt gttagtttct agtttgtgcg atcgaatttg tcgattaatc 3480
tgagtttttc tgattaacag atggcttcat ctgagaacgt tatcactgag ttcatgaggt 3540
tcaaggtgag gatggaaggt actgttaacg gacatgagtt cgagatcgag ggtgagggtg 3600
aaggtagacc ttacgaggga cataacaccg ttaagcttaa ggttacaaag ggtggacctc 3660
ttcctttcgc ttgggatatc ctttctcctc aattccaata cggaagcaag gtaagtttgt 3720
ggattcttcg tccatgtgat ctttgagttt ctttagagct tgtgagggat tagtaagtaa 3780
caatgcttga gttttttgct gctgggcttc gaaaagtttg tcacttgttg gtttgatcca 3840
caaggtcttc ttctccatag ctactagaca tgttttagct taagattcaa gtttatatat 3900
gccttgtgga ttaatcattg cctgattctt ccgtgtcatc tctgagttta tttagagctt 3960
ggaagtggtg tagtaataac taacaatact cttgataagt tgtagcaatg ctcttgatta 4020
gtggatgtaa tatgatgttg ataagatata tgaggcacag aaccaaaagt ggtgcttcca 4080
ctagacccgt ttttagccta aggttcaagt ttataccttg tagatgtttc tgtattgtct 4140
gattcttccc tgtgatattt gaatttctta gagctttgga agtgatatag gaacaatgct 4200
cttgtgtgtt tgtctctatg aagattatcg ctgtcgtgtt tcatccgagt gtgcgggatt 4260
ttttgctgct gggtttagcc tttcttcaaa aagttattac ttgttagttt tattgttttg 4320
gtcttgataa gagatgttag gacagacatg gtgcttcttg tctatagcca ctagacctat 4380
tttagcataa ggttaacgaa attctctcta cataccttgt ggatttgttt acattgcctg 4440
atctttcctg tgatcgctgt catgtttctt tggaatgatt gatgtttata aatggaaaaa 4500
tctttgtgca ggtttacgtt aagcaccctg ctgatatccc tgattacaag aagctttcat 4560
tccctgaggg attcaagtgg gagagagtta tgaacttcga ggatggtggt gttgctactg 4620
ttactcagga ttcttcactt caggacggat gcttcatcta caaggttaag ttcatcggag 4680
tgaacttccc ttctgatgga cctgttatgc agaaaaagac tatgggatgg gaggcttcta 4740
ccgagagact ttaccctaga gatggtgttc ttaagggtga gactcacaag gctcttaagc 4800
ttaaagatgg tggacactac ctcgtcgagt tcaagtctat ctacatggct aagaagcctg 4860
ttcagcttcc tggttactac tacgttgacg ctaagcttga tatcacctct cacaacgagg 4920
actacactat cgttgagcaa tacgagagaa ctgagggtag acatcacttg ttcctctgat 4980
atcaaaatct atttagaaat acacaatatt ttgttgcagg cttgctggag aatcgatctg 5040
ctatcataaa aattacaaaa aaattttatt tgcctcaatt attttaggat tggtattaag 5100
gacgcttaaa ttatttgtcg ggtcactacg catcattgtg attgagaaga tcagcgatac 5160
gaaatattcg tagtactatc gataatttat ttgaaaattc ataagaaaag caaacgttac 5220
atgaattgat gaaacaatac aaagacagat aaagccacgc acatttagga tattggccga 5280
gattactgaa tattgagtaa gatcacggaa tttctgacag gagcatgtct tcaattcagc 5340
ccaaatggca gttgaaatac tcaaaccgcc ccatatgcag gagcggatca ttcattgttt 5400
gtttggttgc ctttgccaac atgggagtcc aaggtttacc cagctttctt gtacaaagtg 5460
gtgataaact atcagtgttt gacaggatat attggcgggt aaacctaaga gaaaagagcg 5520
t 5521
<210> 63
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 63
cttacatgct taggatcgga cttg 24
<210> 64
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 64
agttccagca ccagatctaa cg 22
<210> 65
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 65
ccctgagccc aagcagcatc atcg 24
<210> 66
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 66
cggagagggc gtggaagg 18
<210> 67
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 67
ttcgatttgc tacagcgtca ac 22
<210> 68
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成探针
<400> 68
aggcaccatc gcaggcttcg ct 22
<210> 69
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 69
cttccactcc ttcctcctcg tc 22
<210> 70
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 70
gcgtcccaaa gggttgttga g 21
<210> 71
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 71
tctctactgg gcctgccagg gc 22
<210> 72
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 72
ccccgagacg ttgaaggcta agtacaaa 28
<210> 73
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 73
ttgcgctgac ggattctaca agga 24
<210> 74
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 74
tccatcagtc caaacagcag caga 24
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 75
catagcagtc tcacgtcctg gtc 23
<210> 76
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 76
ggaagctaag ccattacact gttcag 26
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 77
catagcagtc tcacgtcctg gtc 23
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 78
cctgatccgt tgacctgcag 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 79
gtgtgaggtg gctaggcatc 20
<210> 80
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 80
ggaagctaag ccattacact gttcag 26
<210> 81
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 81
agagaggaga cagagagaga gt 22
<210> 82
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 82
agacagcatc aagatttcac aca 23
<210> 83
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 83
caacggcgag cgtaatctta g 21
<210> 84
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 84
gttccctgga attgctgata gg 22
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 85
tgttggtgga agaggatacg 20
<210> 86
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成引物
<400> 86
atcagcagca gcgatagc 18
<210> 87
<211> 6342
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 87
agcttcaggg ctgcgtccta accggcgtct gggtcatagc ccacgagtgc ggccaccacg 60
ccttcagcga ctaccagtgg ctggacgaca ccgtcggcct catcttccac tccttcctcc 120
tcgtccctta cttctcctgg aagtacagtc atcgacgcca ccattccaac actggctccc 180
tcgagagaga cgaagtgttt gtccccaaga agaagtcaga catcaagtgg tacggcaagt 240
acctcaacaa ccctttggga cgcaccgtga tgttaacggt tcagttcact ctcggctggc 300
ctttgtactt agccttcaac gtctcgggga gaccttacga cggcggcttc gcttgccatt 360
tccaccccaa cgctcccatc tacaacgacc gtgagcgtct ccagatatac atctccgacg 420
ctggcatcct cgccgtctgc tacggtctct accgctacgc tgctgtccaa ggagttgcct 480
cgatggtctg cttctacgga gttcctcttc tgattgtcaa cgggttctta gttttgatca 540
cttacttgca gcacacgcat ccttccctgc ctcactatga ctcgtctgag tgggattggt 600
tgaggggagc tttggccacc gttgacagag actacggaat cttgaacaag gtcttccaca 660
atatcacgga cacgcacgtg gcgcatcacc tgttctcgac catgccgcat tatcacgcga 720
tggaagctac gaaggcgata aagccgatac tgggagagta ttatcagttc gatgggacgc 780
cggtggttaa ggcgatgtgg agggaggcga aggagtgtat ctatgtggaa ccggacaggc 840
aaggtgagaa gaaaggtgtg ttctggtaca acaataagtt atgaagcaaa gaagaaactg 900
aacctttctc atctatgatt gtctttgttt taagaagcta tgtttctgtt tcaataatct 960
ttaattatcc attttgttgt gttttctgac attttggcta aaatggcgcc acccagcttt 1020
cttgtacaaa gtggtcccct taattaactg ggcctcatgg gccttccgct cactgcccgc 1080
tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct gtttccttgc 1140
gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa 1200
gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 1260
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 1320
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 1380
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 1440
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 1500
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 1560
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 1620
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 1680
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 1740
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 1800
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 1860
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 1920
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 1980
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 2040
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 2100
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 2160
atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 2220
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 2280
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 2340
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 2400
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 2460
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 2520
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 2580
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 2640
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 2700
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 2760
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 2820
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 2880
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 2940
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 3000
tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa ttcgcgttaa 3060
atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata 3120
aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc ccattcgcca 3180
ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc tattacgcca 3240
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 3300
gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca ctatagggcg 3360
aattggcgga aggccgtcaa ggccgcatgg cgcgccgggg acaagtttgt acaaaaaagc 3420
aggctgcggc cgcgaaatat ccttcctatt caaagttata tatatttgtt tacttttgtt 3480
ttagatctgg acctgagaca tgtaagtaca tatttgttga atctttgggt aaaaacttat 3540
gtctctgggt aaaatttgct gagagatttg accgattcct attggctctg gattctgtag 3600
ttacctaata catgaaaaag tttcatttgg cctatgctca cttcatgctt ataaactttt 3660
tcttgcaaat taattggatt agatgctcct tcatagattc agatgcaata gatttgcatg 3720
aagaaaataa taggattcat gatagtaaaa agattgtatt tttgtttgtt tgtttatgtt 3780
taaaagtcta tatgttgaca atagagttgc tatcaactgt ttcatttagg tttatgtttt 3840
tgtcaagttg cttattctaa gagacattgt gattatgact tgtcttctct aacgtagttt 3900
agtaataaaa gacgaaagaa attgatatcc acaagaaaga gatgtaagct gtaacgtatc 3960
aaatctcatt aataactagt agtattctca acgctatcgt ttatttcttt ctttggtttg 4020
ccactatatg ccgcttctct gctctttatc ccacgtacta tccatttttt ttgtggtagt 4080
ccattttttt gaaactttaa taacgtaaca ctgaatatta atttgttggt ttaattaact 4140
ttgagtcttt gcttttggtt tatgcagaaa catgggtgca ggtggaagaa tgcaagtgtc 4200
tcctccctcc aaaaagtctg aaaccgacaa catcaagcgc gtaccctgcg agacaccgcc 4260
cttcactgtc ggagaactca agaaagcaat cccaccgcac tgtttcaaac gctcgatccc 4320
tcgctctttc tcctacctca tctgggacat catcatagcc tcctgcttct actacgtcgc 4380
caccacttac ttccctctcc tccctcaccc tctctcctac ttcgcctggc ctctctactg 4440
ggccaagctt aaccgacaac cactttgcgg acttcctttc aagagaattc aataaggtta 4500
attcctaatt gaaatccgaa gataagattc ccacacactt gtggctgata tcaaaaggct 4560
actgcctatt taaacacatc tctggagact gagaaaatca gacctccaag catgaagaag 4620
cctgagctta ctgctacttc tgttgagaag ttcctcatcg agaagttcga ttctgtgtct 4680
gatcttatgc agctctctga gggtgaggaa tcaagagctt tctctttcga tgttggtgga 4740
agaggatacg ttctcagagt taactcttgc gctgacggat tctacaagga tagatacgtg 4800
tacagacact tcgcttcagc tgctctccct atccctgaag ttcttgatat cggagagttc 4860
tctgagtctc ttacctactg tatctcaaga agggctcagg gtgttactct tcaagatctt 4920
cctgagactg agcttcctgc tgttcttcaa cctgttgctg aggctatgga tgctatcgct 4980
gctgctgatc tttctcaaac ttctggattc ggacctttcg gtcctcaggg aatcggacag 5040
tacactactt ggagagattt catctgcgct atcgctgatc ctcatgttta ccattggcag 5100
accgttatgg atgataccgt ttctgcttct gttgctcaag ctcttgatga gcttatgctt 5160
tgggctgagg attgtcctga ggttagacat cttgttcacg ctgatttcgg atctaacaac 5220
gttctcaccg ataacggaag aatcaccgct gttatcgatt ggtctgaggc tatgttcgga 5280
gattctcaat acgaggtggc caacatattc ttttggaggc cttggcttgc ttgtatggaa 5340
caacagacta gatacttcga gagaaggcat cctgagcttg ctggatctcc tagacttaga 5400
gcttacatgc ttaggatcgg acttgatcag ctttaccagt ctctcgttga tggaaacttc 5460
gatgatgctg cttgggctca gggaagatgt gatgctatcg ttagatctgg tgctggaact 5520
gttggaagaa ctcaaatcgc tagaagatct gctgctgttt ggactgatgg atgtgttgaa 5580
gttctcgctg attctggaaa cagaaggcct tctactagac ctagagccaa gaagtgaaga 5640
tcggcggcaa tagcttctta gcgccatccc gggttgatcc tatctgtgtt gaaatagttg 5700
cggtgggcaa ggctctcttt cagaaagaca ggcggccaaa ggaacccaag gtgaggtggg 5760
ctatggctct cagttccttg tggaagcgct tggtctaagg tgcagaggtg ttagcgggat 5820
gaagcaaaag tgtccgattg taacaagata tgttgatcct acgtaaggat attaaagtat 5880
gtattcatca ctaatataat cagtgtattc caatatgtac tacgatttcc aatgtcttta 5940
ttgtcgccgt atgtaatcgg cgtcacaaaa taatccccgg tgactttctt ttaatccagg 6000
atgaaataat atgttattat aatttttgcg atttggtccg ttataggaat tgaagtgtgc 6060
ttgcggtcgc caccactccc atttcataat tttacatgta tttgaaaaat aaaaatttat 6120
ggtattcaat ttaaacacgt atacttgtaa agaatgatat cttgaaagaa atatagttta 6180
aatatttatt gataaaataa caagtcaggt attatagtcc aagcaaaaac ataaatttat 6240
tgatgcaagt ttaaattcag aaatatttca ataactgatt atatcagctg gtacattgcc 6300
gtagatgaaa gactgagtgc gatattatgg tgtaatacat aa 6342
<210> 88
<211> 5103
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 88
tatgtattac acataatatc gcactcagtc tttcatctac ggcaatgtac cagctgatat 60
aatcagttat tgaaatattt ctgaatttaa acttgcatca ataaatttat gtttttgctt 120
ggactataat acctgacttg ttattttatc aataaatatt taaactatat ttctttcaag 180
atatcattct ttacaagtat acgtgtttaa attgaatacc ataaattttt atttttcaaa 240
tacatgtaaa attatgaaat gggagtggtg gcgaccgagc tcaagcacac ttcaattcct 300
ataacggacc aaatcgcaaa aattataata acatattatt tcatcctgga ttaaaagaaa 360
gtcaccgggg attattttgt gacgccgatt acatacggcg acaataaaga cattggaaat 420
cgtagtacat attggaatac actgattata ttaatgatga atacatactt taatatcctt 480
acgtaggatc aacatatctt gttacaatcg gacacttttg cttcatcccc gctaacacct 540
ctgcacctta gaccaagcgc ttccacaagg aactgagagc catagcccac ctcaccttgg 600
gttcctttgg ccgcctgtct ttctgaaaga gagccttgcc caccgcaact atttcaacac 660
agataggatc aacccgggat ggcgctaaga agctattgcc gccgatcttc agatctgggt 720
aactggccta actggccttg gaggagctgg caactcaaaa tccctttgcc aaaaaccaac 780
atcatgccat ccaccatgct tgtatccagc tgcgcgcaat gtaccccggg ctgtgtatcc 840
caaagcctca tgcaacctaa cagatggatc gtttggaagg cctataacag caaccacaga 900
cttaaaacct tgcgcctcca tagacttaag caaatgtgtg tacaatgtgg atcctaggcc 960
caacctttga tgcctatgtg acacgtaaac agtactctca actgtccaat cgtaagcgtt 1020
cctagccttc cagggcccag cgtaagcaat accagccaca acaccctcaa cctcagcaac 1080
caaccaaggg tatctatctt gcaacctctc gagatcatca atccactctt gtggtgtttg 1140
tggctctgtc ctaaagttca ctgtagacgt ctcaatgtaa tggttaacga tatcacaaac 1200
cgcggccata tcagctgctg tagctggcct aatctcaact ggtctcctct ccggagacat 1260
tacaaactta caaatttctc tgaagttgta tcctcagtac ttcaaagaaa atagcttaca 1320
ccaaattttt tcttgttttc acaaatgccg aacttggttc cttatatagg aaaactcaag 1380
ggcaaaaatg acacggaaaa atataaaagg ataagtagtg ggggataaga ttcctttgtg 1440
ataaggttac tttccgccct tacattttcc accttacatg tgtcctctat gtctctttca 1500
caatcaccga ccttatcttc ttcttttcat tgttgtcgtc agtgcttacg tcttcaagat 1560
tcttttcttc gcctggttct tctttttcaa tttctacgta ttcttcttcg tattctggca 1620
gtataggatc ttgtatctgt acattcttca tttttgaaca taggttgcat atgtgccgca 1680
tattgatctg cttcttgctg agcttacata atacttccat agtttttccc gtaaacattg 1740
gattcttgat gctacatctt ggataattac cttctggtct agagtcgaat cacaagtttg 1800
tacaaaaaag caggctgtcg acctgcaggt caacggatca ggatattctt gtttaagatg 1860
ttgaactcta tggaggtttg tatgaactga tgatctagga ccggataagt tcccttcttc 1920
atagcgaact tattcaaaga atgttttgtg tatcattctt gttacattgt tattaatgaa 1980
aaaatattat tggtcattgg actgaacacg agtgttaaat atggaccagg ccccaaataa 2040
gatccattga tatatgaatt aaataacaag aataaatcga gtcaccaaac cacttgcctt 2100
ttttaacgag acttgttcac caacttgata caaaagtcat tatcctatgc aaatcaataa 2160
tcatacaaaa atatccaata acactaaaaa attaaaagaa atggataatt tcacaatatg 2220
ttatacgata aagaagttac ttttccaaga aattcactga ttttataagc ccacttgcat 2280
tagataaatg gcaaaaaaaa acaaaaagga aaagaaataa agcacgaaga attctagaaa 2340
atacgaaata cgcttcaatg cagtgggacc cacggttcaa ttattgccaa ttttcagctc 2400
caccgtatat ttaaaaaata aaacgataat gctaaaaaaa tataaatcgt aacgatcgtt 2460
aaatctcaac ggctggatct tatgacgacc gttagaaatt gtggttgtcg acgagtcagt 2520
aataaacggc gtcaaagtgg ttgcagccgg cacacacgag tcgtgtttat caactcaaag 2580
cacaaatact tttcctcaac ctaaaaataa ggcaattagc caaaaacaac tttgcgtgta 2640
aacaacgctc aatacacgtg tcattttatt attagctatt gcttcaccgc cttagctttc 2700
tcgtgaccta gtcgtcctcg tcttttcttc ttcttcttct ataaaacaat acccaaagag 2760
ctcttcttct tcacaattca gatttcaatt tctcaaaatc ttaaaaactt tctctcaatt 2820
ctctctaccg tgatcaaggt aaatttctgt gttccttatt ctctcaaaat cttcgatttt 2880
gttttcgttc gatcccaatt tcgtatatgt tctttggttt agattctgtt aatcttagat 2940
cgaagacgat tttctgggtt tgatcgttag atatcatctt aattctcgat tagggtttca 3000
tagatatcat ccgatttgtt caaataattt gagttttgtc gaataattac tcttcgattt 3060
gtgatttcta tctagatctg gtgttagttt ctagtttgtg cgatcgaatt tgtcgattaa 3120
tctgagtttt tctgattaac agatggcttc atctgagaac gttatcactg agttcatgag 3180
gttcaaggtg aggatggaag gtactgttaa cggacatgag ttcgagatcg agggtgaggg 3240
tgaaggtaga ccttacgagg gacataacac cgttaagctt aaggttacaa agggtggacc 3300
tcttcctttc gcttgggata tcctttctcc tcaattccaa tacggaagca aggtaagttt 3360
gtggattctt cgtccatgtg atctttgagt ttctttagag cttgtgaggg attagtaagt 3420
aacaatgctt gagttttttg ctgctgggct tcgaaaagtt tgtcacttgt tggtttgatc 3480
cacaaggtct tcttctccat agctactaga catgttttag cttaagattc aagtttatat 3540
atgccttgtg gattaatcat tgcctgattc ttccgtgtca tctctgagtt tatttagagc 3600
ttggaagtgg tgtagtaata actaacaata ctcttgataa gttgtagcaa tgctcttgat 3660
tagtggatgt aatatgatgt tgataagata tatgaggcac agaaccaaaa gtggtgcttc 3720
cactagaccc gtttttagcc taaggttcaa gtttatacct tgtagatgtt tctgtattgt 3780
ctgattcttc cctgtgatat ttgaatttct tagagctttg gaagtgatat aggaacaatg 3840
ctcttgtgtg tttgtctcta tgaagattat cgctgtcgtg tttcatccga gtgtgcggga 3900
ttttttgctg ctgggtttag cctttcttca aaaagttatt acttgttagt tttattgttt 3960
tggtcttgat aagagatgtt aggacagaca tggtgcttct tgtctatagc cactagacct 4020
attttagcat aaggttaacg aaattctctc tacatacctt gtggatttgt ttacattgcc 4080
tgatctttcc tgtgatcgct gtcatgtttc tttggaatga ttgatgttta taaatggaaa 4140
aatctttgtg caggtttacg ttaagcaccc tgctgatatc cctgattaca agaagctttc 4200
attccctgag ggattcaagt gggagagagt tatgaacttc gaggatggtg gtgttgctac 4260
tgttactcag gattcttcac ttcaggacgg atgcttcatc tacaaggtta agttcatcgg 4320
agtgaacttc ccttctgatg gacctgttat gcagaaaaag actatgggat gggaggcttc 4380
taccgagaga ctttacccta gagatggtgt tcttaagggt gagactcaca aggctcttaa 4440
gcttaaagat ggtggacact acctcgtcga gttcaagtct atctacatgg ctaagaagcc 4500
tgttcagctt cctggttact actacgttga cgctaagctt gatatcacct ctcacaacga 4560
ggactacact atcgttgagc aatacgagag aactgagggt agacatcact tgttcctctg 4620
atatcaaaat ctatttagaa atacacaata ttttgttgca ggcttgctgg agaatcgatc 4680
tgctatcata aaaattacaa aaaaatttta tttgcctcaa ttattttagg attggtatta 4740
aggacgctta aattatttgt cgggtcacta cgcatcattg tgattgagaa gatcagcgat 4800
acgaaatatt cgtagtacta tcgataattt atttgaaaat tcataagaaa agcaaacgtt 4860
acatgaattg atgaaacaat acaaagacag ataaagccac gcacatttag gatattggcc 4920
gagattactg aatattgagt aagatcacgg aatttctgac aggagcatgt cttcaattca 4980
gcccaaatgg cagttgaaat actcaaaccg ccccatatgc aggagcggat cattcattgt 5040
ttgtttggtt gcctttgcca acatgggagt ccaaggttta cccagctttc ttgtacaaag 5100
tgg 5103
<210> 89
<211> 8802
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 89
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgggga caagtttgta caaaaaagca ggcttacttc gcctggcctc tctactgggc 420
ctgccagggc tgcgtcctaa ccggcgtctg gggtaccgtc gacaagcttc ttgcctcaat 480
tccggaggtg tttctagtgt tcaacatgac aaacaaaacc catctctttc agtatatgtc 540
tctcagttgt gcttaattca aatttcaact cagagaactt cttggcatac ttatccagat 600
tatctaatga tctcatctaa tggtaattca actttcagta tatgtctcgc agcaaactat 660
ctttacatca aatttttaac aactcaatgc acaaaatact tttcctcaac ctaaaaataa 720
ggcaattagc caaaaacaac tttgcgtgtg aacaacgcgt tacacgtccc tacacatacg 780
tgtcaattta taattggcta ttgcttccac gccttagctt tctcgtgacc gaccgagtcg 840
tcctcgtctt ttttgcttct ataaatcaaa tacccaaaga gctcttcttc ttcacaattc 900
agattccaat tttctcaaac tctaaaatca atctctcaaa tctctcaacc gtgatcaagg 960
tagatttctg agttcttatt gtatttcttc gatttgtttc gttcgatcgc aatttaggct 1020
ctgttctttg attttgatct cgttaatctc tgatcggagg caaattacat agtttcatcg 1080
ttagatctct tcttatttct cgattagggt tcgtattttt cgcagatctg tttattttct 1140
tgttgtttcc ttgtatttga tccgatttgt tgaaagaatt tgtgtgttct cgattattta 1200
cgctttgatc tgtgattttt atctagattt ggtgttagtt tcttgtttgt gcgatcgaat 1260
ttgtcgatta atctcggttt ttctgattaa cagatggctc aatctagcag aatctgccac 1320
ggtgtgcaga acccatgtgt gatcatttcc aatctctcca aatccaacca gaacaaatct 1380
cctttctcag tcagcctcaa gactcaccag cagcagcgtc gtgcttacca gatatctagc 1440
tggggattga agaagtcaaa caacgggtcc gtgattcgtc cggttaaggc agctgcaaga 1500
gggatgccag ccttgtcttt acctggatca aagagtatca cagctagggc actctttctt 1560
gctgctgctg ctgatggggt tactactttg gtgaggccat tgagaagtga cgacacagaa 1620
ggattcgctg aggggttagt tcgtttaggc tatcgtgtag ggaggacacc cgatacttgg 1680
caagtcgatg gcagaccaca aggaccagca gtggctgagg ctgacgtcta ctgtagagac 1740
ggagcaacca ccgctagatt cttgccaacc ttagcagctg ctggtcacgg aacatacaga 1800
tttgatgctt caccacagat gaggagacgt cctcttttgc ccttaagcag agccttgagg 1860
gatttgggtg tcgatcttag acacgaagaa gctgaaggtc atcaccctct gactgtccgt 1920
gctgctgggg ttgaaggagg agaggttact ttggatgctg gtcagtcaag tcagtatctc 1980
actgccttgt tgctccttgg tccccttaca agacaaggac tgaggataag ggttactgat 2040
ttggtgtcag caccatacgt ggagattacg cttgcaatga tgagggcttt cggagttgaa 2100
gtggcaaggg agggagatgt gttcgttgtt ccacctggtg gatatcgtgc aactacgtat 2160
gctatagaac ccgacgcaag tactgcttct tacttcttcg cagctgctgc tttgactcct 2220
ggagctgaag tgactgtacc tgggttaggc acgggagcac ttcaaggaga tttgggattt 2280
gtagatgtct taaggagaat gggagccgag gtgtccgtag gagctgatgc aaccactgtt 2340
agaggaactg gtgaattgcg tggccttaca gccaacatga gagacataag tgatacgatg 2400
ccgaccctcg ctgcaatagc accctttgct agtgctccag ttagaatcga ggatgttgcc 2460
aacactcgtg tcaaagaatg tgacagactt gaggcttgtg cagagaacct taggaggttg 2520
ggagtaaggg ttgcaacggg tccggactgg attgagatac accctggtcc agctactggt 2580
gctcaagtca caagctatgg tgatcacaga attgtgatgt catttgcagt gactggactt 2640
cgtgtgcctg ggatcagctt cgacgaccct ggctgtgttc gtaagacttt tcctgggttt 2700
cacgaggctt tcgcagaatt gaggcgtggc attgggagct gatgagtagt tagcttaatc 2760
acctaagatc ggcggcaata gcttcttagc gccatcccgg gttgatccta tctgtgttga 2820
aatagttgcg gtgggcaagg ctctctttca gaaagacagg cggccaaagg aacccaaggt 2880
gaggtgggct atggctctca gttccttgtg gaagcgcttg gtctaaggtg cagaggtgtt 2940
agcgggatga agcaaaagtg tccgattgta acaagatatg ttgatcctac gtaaggatat 3000
taaagtatgt attcatcact aatataatca gtgtattcca atatgtacta cgatttccaa 3060
tgtctttatt gtcgccgtat gtaatcggcg tcacaaaata atccccggtg actttctttt 3120
aatccaggat gaaataatat gttattataa tttttgcgat ttggtccgtt ataggaattg 3180
aagtgtgctt gcggtcgcca ccactcccat ttcataattt tacatgtatt tgaaaaataa 3240
aaatttatgg tattcaattt aaacacgtat acttgtaaag aatgatatct tgaaagaaat 3300
atagtttaaa tatttattga taaaataaca agtcaggtat tatagtccaa gcaaaaacat 3360
aaatttattg atgcaagttt aaattcagaa atatttcaat aactgattat atcagctggt 3420
acattgccgt agatgaaaga ctgagtgcga tattatggtg taatacatac ggccgccaga 3480
aggtaattat ccaagatgta gcatcaagaa tccaatgttt acgggaaaaa ctatggaagt 3540
attatgtaag ctcagcaaga agcagatcaa tatgcggcac atatgcaacc tatgttcaaa 3600
aatgaagaat gtacagatac aagatcctat actgccagaa tacgaagaag aatacgtaga 3660
aattgaaaaa gaagaaccag gcgaagaaaa gaatcttgaa gacgtaagca ctgacgacaa 3720
caatgaaaag aagaagataa ggtcggtgat tgtgaaagag acatagagga cacatgtaag 3780
gtggaaaatg taagggcgga aagtaacctt atcacaaagg aatcttatcc cccactactt 3840
atccttttat atttttccgt gtcatttttg cccttgagtt ttcctatata aggaaccaag 3900
ttcggcattt gtgaaaacaa gaaaaaattt ggtgtaagct attttctttg aagtactgag 3960
gatacaactt cagagaaatt tgtaagtttg taatgtctcc ggagaggaga ccagttgaga 4020
ttaggccagc tacagcagct gatatggccg cggtttgtga tatcgttaac cattacattg 4080
agacgtctac agtgaacttt aggacagagc cacaaacacc acaagagtgg attgatgatc 4140
tcgagaggtt gcaagataga tacccttggt tggttgctga ggttgagggt gttgtggctg 4200
gtattgctta cgctgggccc tggaaggcta ggaacgctta cgattggaca gttgagagta 4260
ctgtttacgt gtcacatagg catcaaaggt cagttttact tcccttaatt ttctatgtac 4320
tttcataatt acttatgtta ttttcttcat gagttttaat gcaaattact atatggactc 4380
tagtgaaaac gttcagaatc ctataaacat gactactgag acgaacttga gagtagtttt 4440
gatcatacac acgtttcatg tggtacttga gagttactaa tttttgtcat cttcgtataa 4500
gtagtaaaag atactacaag aatagtttag tagaaaatac tagcggtagg tgaagatttg 4560
tcgctatgta ctattattgt ctagtaactt gagtaacaat ttcgtggtct aaatatcaaa 4620
taaaaatgga tgagtggttc accaaatcta ggcatcaaaa ctattaatgt cattgtctag 4680
atcttaggtg acaccacatt tcgaatattt attggtaatt gagatgttaa agtaccaata 4740
tttgacttaa taaactaaaa gattttggct ttatcaaatg tagacattga tgacatatcg 4800
ttgtcattat cttgagtata tacaagtcga tcaattaggt gaaagtttag tgtctcgtgg 4860
ttggtaaacg attaatacag tagtatattt tatccaaaga caaaatccaa atcatttcac 4920
cagtatgaat agtattattt tatcttaaaa gctaaaatct taaaaaccaa ggtagcaccc 4980
acgttgagct agacgatcaa atcgatttct gctttgtcca atttaccaag ctatttaaag 5040
ccaaataatt gaaatatagg taggtcgtta tattaggcta agatttatct caaatgctta 5100
actaaaggaa taacaaggga ttctagttgt gtggttttat aagattggtc caatttcact 5160
taagtttgtt tattgtagaa ttttatatgt gaataatttg aattccaatt gaaaagatat 5220
tatagtaaaa gaaaaaatag tgcgaacaaa aaactttaat cccataaaaa gaaaaagaaa 5280
aatgaaaagt tcttctaaca tccatatttt gcatcatatc ataaagataa gaaagataca 5340
tatcatagac gtacagataa acaaacatat catcatttgt gaaatacata gtacaataat 5400
ttgcttttaa atagagttta agtcacacac actgacacac acgataaaac gataatgtct 5460
gcaaaaacac tttaatccca ttgcctagag gacagcttct ccactttgtc tttaaggttg 5520
gttttgccgt gttgttttta tctttatata atgatctatt ttttggatta tgaaatgaat 5580
tcacacattt taattattta agaagatcca tatacaggtt tataacagta ctaagtgatg 5640
attatttttt gtttttgcat agtttagttt attgggtaaa cattcattac gtgtctcttt 5700
atacgaatca cccatccaaa atttcaagta gtcttttagt tcatttatta tttcataact 5760
atttgactta ttgatttgac aagaaacaac aaaagtgttg acttattgat agattgtggg 5820
atcataaaag taattaagcg tcaaccacga cccacaacaa caaagcacat gttatacatt 5880
aatatctcgt ttacttaatt acagttttca gaatgccgtt tcatgtcttg tcactggcga 5940
tgttattatc atgttggaca atattcgact gttgtcgttt ttacattttc gtattgacta 6000
aaactaaaaa aacaaaactc tgtttcaggt tgggcctagg atccacattg tacacacatt 6060
tgcttaagtc tatggaggcg caaggtttta agtctgtggt tgctgttata ggccttccaa 6120
acgatccatc tgttaggttg catgaggctt tgggatacac agcccggggt acattgcgcg 6180
cagctggata caagcatggt ggatggcatg atgttggttt ttggcaaagg gattttgagt 6240
tgccagctcc tccaaggcca gttaggccag ttacccagat ctaatatcaa aatctattta 6300
gaaatacaca atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta 6360
caaaaaaatt ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt 6420
tgtcgggtca ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta 6480
ctatcgataa tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac 6540
aatacaaaga cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg 6600
agtaagatca cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga 6660
aatactcaaa ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg 6720
ccaacatggg agtccaaggt tgcatgctac ttcgcctggc ctctctactg ggcctgccag 6780
ggctgcgtcc taaccggcgt ctggacccag ctttcttgta caaagtggtc cccggcctca 6840
tgggccttcc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 6900
catggtcata gctgtttcct tgcgtattgg gcgctctccg cttcctcgct cactgactcg 6960
ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg agcaaaaggc cagcaaaagg 7020
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 7080
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 7140
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 7200
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 7260
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 7320
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7380
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 7440
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 7500
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 7560
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 7620
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 7680
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 7740
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 7800
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 7860
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 7920
taccatctgg ccccagtgct gcaatgatac cgcgagaacc acgctcaccg gctccagatt 7980
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 8040
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 8100
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 8160
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 8220
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 8280
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 8340
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 8400
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 8460
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 8520
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 8580
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 8640
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 8700
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 8760
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc ac 8802
<210> 90
<211> 10272
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 90
ttgtacaaag tggtgattcg acctgcaggc atgcaagctt ggcgtaatca tggtcatagc 60
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 120
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 180
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 240
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 300
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 360
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 420
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 480
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 540
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 600
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 660
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 720
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 780
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 840
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 900
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 960
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 1020
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 1080
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 1140
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 1200
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 1260
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 1320
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 1380
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 1440
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 1500
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 1560
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 1620
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 1680
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 1740
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 1800
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 1860
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 1920
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 1980
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 2040
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 2100
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 2160
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 2220
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 2280
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 2340
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 2400
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 2460
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 2520
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 2580
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 2640
agtcacgacg ttgtaaaacg acggccagtg aattcgagct cggtacccgg ggatcctcta 2700
gagtcgaatc acaagtttgt acaaaaaagc aggctgtaag tttgtggatt cttcgtccat 2760
gtgatctttg agtttcttta gagcttgtga gggattagta agtaacaatg cttgagtttt 2820
ttgctgctgg gcttcgaaaa gtttgtcact tgttggtttg atccacaagg tcttcttctc 2880
catagctact agacatgttt tagcttaaga ttcaagttta tatatgcctt gtggattaat 2940
cattgcctga ttcttccgtg tcatctctga gtttatttag agcttggaag tggtgtagta 3000
ataactaaca atactcttga taagttgtag caatgctctt gattagtgga tgtaatatga 3060
tgttgataag atatatgagg cacagaacca aaagtggtgc ttccactaga cccgttttta 3120
gcctaaggtt caagtttata ccttgtagat gtttctgtat tgtctgattc ttccctgtga 3180
tatttgaatt tcttagagct ttggaagtga tataggaaca atgctcttgt gtgtttgtct 3240
ctatgaagat tatcgctgtc gtgtttcatc cgagtgtgcg ggattttttg ctgctgggtt 3300
tagcctttct tcaaaaagtt attacttgtt agttttattg ttttggtctt gataagagat 3360
gttaggacag acatggtgct tcttgtctat agccactaga cctattttag cataaggtta 3420
acgaaattct ctctacatac cttgtggatt tgtttacatt gcctgatctt tcctgtgatc 3480
gctgtcatgt ttctttggaa tgattgatgt ttataaatgg aaaaatcttt gtgcaggttt 3540
aaacgtttac gttaagcacc ctgctgatat ccctgattac aagaagcttt cattccctga 3600
gggattcaag tgggagagag ttatgaactt cgaggatggt ggtgttgcta ctgttactca 3660
ggattcttca cttcaggacg gatgcttcat ctacaaggtt aagttcatcg gagtgaactt 3720
cccttctgat ggacctgtta tgcagaaaaa gactatggga tgggaggctt ctaccgagag 3780
actttaccct agagatggtg ttcttaaggg tgagactcac aaggctctta agcttaaaga 3840
tggtggacac tacctcgtcg agttcaagtc tatctacatg gctaagaagc ctgttcagct 3900
tcctggttac tactacgttg acgctaagct tgatatcacc tctcacaacg aggactacac 3960
tatcgttgag caatacgaga gaactgaggg tagacatcac ttgttcctct gatatcaaaa 4020
tctatttaga aatacacaat attttgttgc aggcttgctg gagaatcgat ctgctatcat 4080
aaaaattaca aaaaaatttt atttgcctca attattttag gattggtatt aaggacgctt 4140
aaattatttg tcgggtcact acgcatcatt gtgattgaga agatcagcga tacgaaatat 4200
tcgtagtact atcgataatt tatttgaaaa ttcataagaa aagcaaacgt tacatgaatt 4260
gatgaaacaa tacaaagaca gataaagcca cgcacattta ggatattggc cgagattact 4320
gaatattgag taagatcacg gaatttctga caggagcatg tcttcaattc agcccaaatg 4380
gcagttgaaa tactcaaacc gccccatatg caggagcgga tcattcattg tttgtttggt 4440
tgcctttgcc aacatgggag tccaaggttg ccttttgcag tttatctcta tgcccgggac 4500
aagtgaagac tcccgcccat ctcactaggg acaggattgg agtccatgct caacaccgtg 4560
caggatgagg atgaccaaca actttgtata caaaagttgt atccgaagta aataaaacca 4620
tcggactctc gtataagact gtcgacaagc ttcttgcctc aattccggag gtgtttctag 4680
tgttcaacat gacaaacaaa acccatctct ttcagtatat gtctctcagt tgtgcttaat 4740
tcaaatttca actcagagaa cttcttggca tacttatcca gattatctaa tgatctcatc 4800
taatggtaat tcaactttca gtatatgtct cgcagcaaac tatctttaca tcaaattttt 4860
aacaactcaa tgcacaaaat acttttcctc aacctaaaaa taaggcaatt agccaaaaac 4920
aactttgcgt gtgaacaacg cgttacacgt ccctacacat acgtgtcaat ttataattgg 4980
ctattgcttc cacgccttag ctttctcgtg accgaccgag tcgtcctcgt cttttttgct 5040
tctataaatc aaatacccaa agagctcttc ttcttcacaa ttcagattcc aattttctca 5100
aactctaaaa tcaatctctc aaatctctca accgtgatca aggtagattt ctgagttctt 5160
attgtatttc ttcgatttgt ttcgttcgat cgcaatttag gctctgttct ttgattttga 5220
tctcgttaat ctctgatcgg aggcaaatta catagtttca tcgttagatc tcttcttatt 5280
tctcgattag ggttcgtatt tttcgcagat ctgtttattt tcttgttgtt tccttgtatt 5340
tgatccgatt tgttgaaaga atttgtgtgt tctcgattat ttacgctttg atctgtgatt 5400
tttatctaga tttggtgtta gtttcttgtt tgtgcgatcg aatttgtcga ttaatctcgg 5460
tttttctgat taacagatgg ctcaatctag cagaatctgc cacggtgtgc agaacccatg 5520
tgtgatcatt tccaatctct ccaaatccaa ccagaacaaa tctcctttct cagtcagcct 5580
caagactcac cagcagcagc gtcgtgctta ccagatatct agctggggat tgaagaagtc 5640
aaacaacggg tccgtgattc gtccggttaa ggcagctgca agagggatgc cagccttgtc 5700
tttacctgga tcaaagagta tcacagctag ggcactcttt cttgctgctg ctgctgatgg 5760
ggttactact ttggtgaggc cattgagaag tgacgacaca gaaggattcg ctgaggggtt 5820
agttcgttta ggctatcgtg tagggaggac acccgatact tggcaagtcg atggcagacc 5880
acaaggacca gcagtggctg aggctgacgt ctactgtaga gacggagcaa ccaccgctag 5940
attcttgcca accttagcag ctgctggtca cggaacatac agatttgatg cttcaccaca 6000
gatgaggaga cgtcctcttt tgcccttaag cagagccttg agggatttgg gtgtcgatct 6060
tagacacgaa gaagctgaag gtcatcaccc tctgactgtc cgtgctgctg gggttgaagg 6120
aggagaggtt actttggatg ctggtcagtc aagtcagtat ctcactgcct tgttgctcct 6180
tggtcccctt acaagacaag gactgaggat aagggttact gatttggtgt cagcaccata 6240
cgtggagatt acgcttgcaa tgatgagggc tttcggagtt gaagtggcaa gggagggaga 6300
tgtgttcgtt gttccacctg gtggatatcg tgcaactacg tatgctatag aacccgacgc 6360
aagtactgct tcttacttct tcgcagctgc tgctttgact cctggagctg aagtgactgt 6420
acctgggtta ggcacgggag cacttcaagg agatttggga tttgtagatg tcttaaggag 6480
aatgggagcc gaggtgtccg taggagctga tgcaaccact gttagaggaa ctggtgaatt 6540
gcgtggcctt acagccaaca tgagagacat aagtgatacg atgccgaccc tcgctgcaat 6600
agcacccttt gctagtgctc cagttagaat cgaggatgtt gccaacactc gtgtcaaaga 6660
atgtgacaga cttgaggctt gtgcagagaa ccttaggagg ttgggagtaa gggttgcaac 6720
gggtccggac tggattgaga tacaccctgg tccagctact ggtgctcaag tcacaagcta 6780
tggtgatcac agaattgtga tgtcatttgc agtgactgga cttcgtgtgc ctgggatcag 6840
cttcgacgac cctggctgtg ttcgtaagac ttttcctggg tttcacgagg ctttcgcaga 6900
attgaggcgt ggcattggga gctgatgagt agttagctta atcacctaag atcggcggca 6960
atagcttctt agcgccatcc cgggttgatc ctatctgtgt tgaaatagtt gcggtgggca 7020
aggctctctt tcagaaagac aggcggccaa aggaacccaa ggtgaggtgg gctatggctc 7080
tcagttcctt gtggaagcgc ttggtctaag gtgcagaggt gttagcggga tgaagcaaaa 7140
gtgtccgatt gtaacaagat atgttgatcc tacgtaagga tattaaagta tgtattcatc 7200
actaatataa tcagtgtatt ccaatatgta ctacgatttc caatgtcttt attgtcgccg 7260
tatgtaatcg gcgtcacaaa ataatccccg gtgactttct tttaatccag gatgaaataa 7320
tatgttatta taatttttgc gatttggtcc gttataggaa ttgaagtgtg cttgcggtcg 7380
ccaccactcc catttcataa ttttacatgt atttgaaaaa taaaaattta tggtattcaa 7440
tttaaacacg tatacttgta aagaatgata tcttgaaaga aatatagttt aaatatttat 7500
tgataaaata acaagtcagg tattatagtc caagcaaaaa cataaattta ttgatgcaag 7560
tttaaattca gaaatatttc aataactgat tatatcagct ggtacattgc cgtagatgaa 7620
agactgagtg cgatattatg gtgtaataca tacggccgac gcataggttc atttgaagct 7680
gctattctat ttagattgaa gtttaaaccc agaaggtaat tatccaagat gtagcatcaa 7740
gaatccaatg tttacgggaa aaactatgga agtattatgt aagctcagca agaagcagat 7800
caatatgcgg cacatatgca acctatgttc aaaaatgaag aatgtacaga tacaagatcc 7860
tatactgcca gaatacgaag aagaatacgt agaaattgaa aaagaagaac caggcgaaga 7920
aaagaatctt gaagacgtaa gcactgacga caacaatgaa aagaagaaga taaggtcggt 7980
gattgtgaaa gagacataga ggacacatgt aaggtggaaa atgtaagggc ggaaagtaac 8040
cttatcacaa aggaatctta tcccccacta cttatccttt tatatttttc cgtgtcattt 8100
ttgcccttga gttttcctat ataaggaacc aagttcggca tttgtgaaaa caagaaaaaa 8160
tttggtgtaa gctattttct ttgaagtact gaggatacaa cttcagagaa atttgtaagt 8220
ttgtaatgtc tccggagagg agaccagttg agattaggcc agctacagca gctgatatgg 8280
ccgcggtttg tgatatcgtt aaccattaca ttgagacgtc tacagtgaac tttaggacag 8340
agccacaaac accacaagag tggattgatg atctcgagag gttgcaagat agataccctt 8400
ggttggttgc tgaggttgag ggtgttgtgg ctggtattgc ttacgctggg ccctggaagg 8460
ctaggaacgc ttacgattgg acagttgaga gtactgttta cgtgtcacat aggcatcaaa 8520
ggtcagtttt acttccctta attttctatg tactttcata attacttatg ttattttctt 8580
catgagtttt aatgcaaatt actatatgga ctctagtgaa aacgttcaga atcctataaa 8640
catgactact gagacgaact tgagagtagt tttgatcata cacacgtttc atgtggtact 8700
tgagagttac taatttttgt catcttcgta taagtagtaa aagatactac aagaatagtt 8760
tagtagaaaa tactagcggt aggtgaagat ttgtcgctat gtactattat tgtctagtaa 8820
cttgagtaac aatttcgtgg tctaaatatc aaataaaaat ggatgagtgg ttcaccaaat 8880
ctaggcatca aaactattaa tgtcattgtc tagatcttag gtgacaccac atttcgaata 8940
tttattggta attgagatgt taaagtacca atatttgact taataaacta aaagattttg 9000
gctttatcaa atgtagacat tgatgacata tcgttgtcat tatcttgagt atatacaagt 9060
cgatcaatta ggtgaaagtt tagtgtctcg tggttggtaa acgattaata cagtagtata 9120
ttttatccaa agacaaaatc caaatcattt caccagtatg aatagtatta ttttatctta 9180
aaagctaaaa tcttaaaaac caaggtagca cccacgttga gctagacgat caaatcgatt 9240
tctgctttgt ccaatttacc aagctattta aagccaaata attgaaatat aggtaggtcg 9300
ttatattagg ctaagattta tctcaaatgc ttaactaaag gaataacaag ggattctagt 9360
tgtgtggttt tataagattg gtccaatttc acttaagttt gtttattgta gaattttata 9420
tgtgaataat ttgaattcca attgaaaaga tattatagta aaagaaaaaa tagtgcgaac 9480
aaaaaacttt aatcccataa aaagaaaaag aaaaatgaaa agttcttcta acatccatat 9540
tttgcatcat atcataaaga taagaaagat acatatcata gacgtacaga taaacaaaca 9600
tatcatcatt tgtgaaatac atagtacaat aatttgcttt taaatagagt ttaagtcaca 9660
cacactgaca cacacgataa aacgataatg tctgcaaaaa cactttaatc ccattgccta 9720
gaggacagct tctccacttt gtctttaagg ttggttttgc cgtgttgttt ttatctttat 9780
ataatgatct attttttgga ttatgaaatg aattcacaca ttttaattat ttaagaagat 9840
ccatatacag gtttataaca gtactaagtg atgattattt tttgtttttg catagtttag 9900
tttattgggt aaacattcat tacgtgtctc tttatacgaa tcacccatcc aaaatttcaa 9960
gtagtctttt agttcattta ttatttcata actatttgac ttattgattt gacaagaaac 10020
aacaaaagtg ttgacttatt gatagattgt gggatcataa aagtaattaa gcgtcaacca 10080
cgacccacaa caacaaagca catgttatac attaatatct cgtttactta attacagttt 10140
tcagaatgcc gtttcatgtc ttgtcactgg cgatgttatt atcatgttgg acaatattcg 10200
actgttgtcg tttttacatt ttcgtattga ctaaaactaa aaaaacaaaa ctctgtttca 10260
gacccagctt tc 10272
<210> 91
<211> 9958
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 91
ttgtacaaag tggtgattcg acctgcaggc atgcaagctt ggcgtaatca tggtcatagc 60
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 120
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 180
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 240
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 300
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 360
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 420
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 480
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 540
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 600
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 660
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 720
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 780
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 840
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 900
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 960
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 1020
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 1080
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 1140
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 1200
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 1260
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 1320
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 1380
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 1440
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 1500
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 1560
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 1620
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 1680
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 1740
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 1800
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 1860
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 1920
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 1980
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 2040
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 2100
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 2160
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 2220
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc 2280
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 2340
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 2400
ggtgtcgggg ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata 2460
tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc 2520
cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc 2580
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 2640
agtcacgacg ttgtaaaacg acggccagtg aattcgagct cggtacccgg ggatcctcta 2700
gagtcgaatc acaagtttgt acaaaaaagc aggctgtaag tttgtggatt cttcgtccat 2760
gtgatctttg agtttcttta gagcttgtga gggattagta agtaacaatg cttgagtttt 2820
ttgctgctgg gcttcgaaaa gtttgtcact tgttggtttg atccacaagg tcttcttctc 2880
catagctact agacatgttt tagcttaaga ttcaagttta tatatgcctt gtggattaat 2940
cattgcctga ttcttccgtg tcatctctga gtttatttag agcttggaag tggtgtagta 3000
ataactaaca atactcttga taagttgtag caatgctctt gattagtgga tgtaatatga 3060
tgttgataag atatatgagg cacagaacca aaagtggtgc ttccactaga cccgttttta 3120
gcctaaggtt caagtttata ccttgtagat gtttctgtat tgtctgattc ttccctgtga 3180
tatttgaatt tcttagagct ttggaagtga tataggaaca atgctcttgt gtgtttgtct 3240
ctatgaagat tatcgctgtc gtgtttcatc cgagtgtgcg ggattttttg ctgctgggtt 3300
tagcctttct tcaaaaagtt attacttgtt agttttattg ttttggtctt gataagagat 3360
gttaggacag acatggtgct tcttgtctat agccactaga cctattttag cataaggtta 3420
acgaaattct ctctacatac cttgtggatt tgtttacatt gcctgatctt tcctgtgatc 3480
gctgtcatgt ttctttggaa tgattgatgt ttataaatgg aaaaatcttt gtgcaggttt 3540
aaacgtttac gttaagcacc ctgctgatat ccctgattac aagaagcttt cattccctga 3600
gggattcaag tgggagagag ttatgaactt cgaggatggt ggtgttgcta ctgttactca 3660
ggattcttca cttcaggacg gatgcttcat ctacaaggtt aagttcatcg gagtgaactt 3720
cccttctgat ggacctgtta tgcagaaaaa gactatggga tgggaggctt ctaccgagag 3780
actttaccct agagatggtg ttcttaaggg tgagactcac aaggctctta agcttaaaga 3840
tggtggacac tacctcgtcg agttcaagtc tatctacatg gctaagaagc ctgttcagct 3900
tcctggttac tactacgttg acgctaagct tgatatcacc tctcacaacg aggactacac 3960
tatcgttgag caatacgaga gaactgaggg tagacatcac ttgttcctct gatatcaaaa 4020
tctatttaga aatacacaat attttgttgc aggcttgctg gagaatcgat ctgctatcat 4080
aaaaattaca aaaaaatttt atttgcctca attattttag gattggtatt aaggacgctt 4140
aaattatttg tcgggtcact acgcatcatt gtgattgaga agatcagcga tacgaaatat 4200
tcgtagtact atcgataatt tatttgaaaa ttcataagaa aagcaaacgt tacatgaatt 4260
gatgaaacaa tacaaagaca gataaagcca cgcacattta ggatattggc cgagattact 4320
gaatattgag taagatcacg gaatttctga caggagcatg tcttcaattc agcccaaatg 4380
gcagttgaaa tactcaaacc gccccatatg caggagcgga tcattcattg tttgtttggt 4440
tgcctttgcc aacatgggag tccaaggttg ccttttgcag tttatctcta tgcccgggac 4500
aagtgaagac tcccgcccat ctcactaggg acaggattgg agtccatgct caacaccgtg 4560
caggatgagg atgaccaaca actttgtata caaaagttgt atccgaagta aataaaacca 4620
tcggactctc gtataagact gtcgacgaga tttttcaaat cagtgcgcta gacgtgacgt 4680
aagtatccga gtcagttttt atttttctac taatttggtc gtttatttcg gcgtgtagga 4740
catggcaacc gggcctgaat ttcgcgggta ttctgtttct attccaactt tttcttgatc 4800
cgcagccatt aacgactttt gaatagatac gtctagggtc gaggggggat ccgtcgaggg 4860
ggtccaccaa aaacgtaagc gcttacgtac atggtcgagg gggtccacca aaaacgtaag 4920
cgcttacgta catggtcgag ggggtccacc aaaaacgtaa gcgcttacgt acatggtcga 4980
gggggtccac caaaaacgta agcgcttacg tacatgctcg actagagcgt gacgctcgcg 5040
gtgacgccat ttcgcctttt cagaaatgga taaatagcct tgcttcctat tatatcttcc 5100
caaattacca atacattaca ctagcatctg aatttcataa ccaatctcga tacaccaaat 5160
cgatggctca atctagcaga atctgccacg gtgtgcagaa cccatgtgtg atcatttcca 5220
atctctccaa atccaaccag aacaaatctc ctttctcagt cagcctcaag actcaccagc 5280
agcagcgtcg tgcttaccag atatctagct ggggattgaa gaagtcaaac aacgggtccg 5340
tgattcgtcc ggttaaggca gctgcaagag ggatgccagc cttgtcttta cctggatcaa 5400
agagtatcac agctagggca ctctttcttg ctgctgctgc tgatggggtt actactttgg 5460
tgaggccatt gagaagtgac gacacagaag gattcgctga ggggttagtt cgtttaggct 5520
atcgtgtagg gaggacaccc gatacttggc aagtcgatgg cagaccacaa ggaccagcag 5580
tggctgaggc tgacgtctac tgtagagacg gagcaaccac cgctagattc ttgccaacct 5640
tagcagctgc tggtcacgga acatacagat ttgatgcttc accacagatg aggagacgtc 5700
ctcttttgcc cttaagcaga gccttgaggg atttgggtgt cgatcttaga cacgaagaag 5760
ctgaaggtca tcaccctctg actgtccgtg ctgctggggt tgaaggagga gaggttactt 5820
tggatgctgg tcagtcaagt cagtatctca ctgccttgtt gctccttggt ccccttacaa 5880
gacaaggact gaggataagg gttactgatt tggtgtcagc accatacgtg gagattacgc 5940
ttgcaatgat gagggctttc ggagttgaag tggcaaggga gggagatgtg ttcgttgttc 6000
cacctggtgg atatcgtgca actacgtatg ctatagaacc cgacgcaagt actgcttctt 6060
acttcttcgc agctgctgct ttgactcctg gagctgaagt gactgtacct gggttaggca 6120
cgggagcact tcaaggagat ttgggatttg tagatgtctt aaggagaatg ggagccgagg 6180
tgtccgtagg agctgatgca accactgtta gaggaactgg tgaattgcgt ggccttacag 6240
ccaacatgag agacataagt gatacgatgc cgaccctcgc tgcaatagca ccctttgcta 6300
gtgctccagt tagaatcgag gatgttgcca acactcgtgt caaagaatgt gacagacttg 6360
aggcttgtgc agagaacctt aggaggttgg gagtaagggt tgcaacgggt ccggactgga 6420
ttgagataca ccctggtcca gctactggtg ctcaagtcac aagctatggt gatcacagaa 6480
ttgtgatgtc atttgcagtg actggacttc gtgtgcctgg gatcagcttc gacgaccctg 6540
gctgtgttcg taagactttt cctgggtttc acgaggcttt cgcagaattg aggcgtggca 6600
ttgggagctg atgagtagtt agcttaatca cctaagatcg gcggcaatag cttcttagcg 6660
ccatcccggg ttgatcctat ctgtgttgaa atagttgcgg tgggcaaggc tctctttcag 6720
aaagacaggc ggccaaagga acccaaggtg aggtgggcta tggctctcag ttccttgtgg 6780
aagcgcttgg tctaaggtgc agaggtgtta gcgggatgaa gcaaaagtgt ccgattgtaa 6840
caagatatgt tgatcctacg taaggatatt aaagtatgta ttcatcacta atataatcag 6900
tgtattccaa tatgtactac gatttccaat gtctttattg tcgccgtatg taatcggcgt 6960
cacaaaataa tccccggtga ctttctttta atccaggatg aaataatatg ttattataat 7020
ttttgcgatt tggtccgtta taggaattga agtgtgcttg cggtcgccac cactcccatt 7080
tcataatttt acatgtattt gaaaaataaa aatttatggt attcaattta aacacgtata 7140
cttgtaaaga atgatatctt gaaagaaata tagtttaaat atttattgat aaaataacaa 7200
gtcaggtatt atagtccaag caaaaacata aatttattga tgcaagttta aattcagaaa 7260
tatttcaata actgattata tcagctggta cattgccgta gatgaaagac tgagtgcgat 7320
attatggtgt aatacatacg gccgacgcat aggttcattt gaagctgcta ttctatttag 7380
attgaagttt aaacccagaa ggtaattatc caagatgtag catcaagaat ccaatgttta 7440
cgggaaaaac tatggaagta ttatgtaagc tcagcaagaa gcagatcaat atgcggcaca 7500
tatgcaacct atgttcaaaa atgaagaatg tacagataca agatcctata ctgccagaat 7560
acgaagaaga atacgtagaa attgaaaaag aagaaccagg cgaagaaaag aatcttgaag 7620
acgtaagcac tgacgacaac aatgaaaaga agaagataag gtcggtgatt gtgaaagaga 7680
catagaggac acatgtaagg tggaaaatgt aagggcggaa agtaacctta tcacaaagga 7740
atcttatccc ccactactta tccttttata tttttccgtg tcatttttgc ccttgagttt 7800
tcctatataa ggaaccaagt tcggcatttg tgaaaacaag aaaaaatttg gtgtaagcta 7860
ttttctttga agtactgagg atacaacttc agagaaattt gtaagtttgt aatgtctccg 7920
gagaggagac cagttgagat taggccagct acagcagctg atatggccgc ggtttgtgat 7980
atcgttaacc attacattga gacgtctaca gtgaacttta ggacagagcc acaaacacca 8040
caagagtgga ttgatgatct cgagaggttg caagatagat acccttggtt ggttgctgag 8100
gttgagggtg ttgtggctgg tattgcttac gctgggccct ggaaggctag gaacgcttac 8160
gattggacag ttgagagtac tgtttacgtg tcacataggc atcaaaggtc agttttactt 8220
cccttaattt tctatgtact ttcataatta cttatgttat tttcttcatg agttttaatg 8280
caaattacta tatggactct agtgaaaacg ttcagaatcc tataaacatg actactgaga 8340
cgaacttgag agtagttttg atcatacaca cgtttcatgt ggtacttgag agttactaat 8400
ttttgtcatc ttcgtataag tagtaaaaga tactacaaga atagtttagt agaaaatact 8460
agcggtaggt gaagatttgt cgctatgtac tattattgtc tagtaacttg agtaacaatt 8520
tcgtggtcta aatatcaaat aaaaatggat gagtggttca ccaaatctag gcatcaaaac 8580
tattaatgtc attgtctaga tcttaggtga caccacattt cgaatattta ttggtaattg 8640
agatgttaaa gtaccaatat ttgacttaat aaactaaaag attttggctt tatcaaatgt 8700
agacattgat gacatatcgt tgtcattatc ttgagtatat acaagtcgat caattaggtg 8760
aaagtttagt gtctcgtggt tggtaaacga ttaatacagt agtatatttt atccaaagac 8820
aaaatccaaa tcatttcacc agtatgaata gtattatttt atcttaaaag ctaaaatctt 8880
aaaaaccaag gtagcaccca cgttgagcta gacgatcaaa tcgatttctg ctttgtccaa 8940
tttaccaagc tatttaaagc caaataattg aaatataggt aggtcgttat attaggctaa 9000
gatttatctc aaatgcttaa ctaaaggaat aacaagggat tctagttgtg tggttttata 9060
agattggtcc aatttcactt aagtttgttt attgtagaat tttatatgtg aataatttga 9120
attccaattg aaaagatatt atagtaaaag aaaaaatagt gcgaacaaaa aactttaatc 9180
ccataaaaag aaaaagaaaa atgaaaagtt cttctaacat ccatattttg catcatatca 9240
taaagataag aaagatacat atcatagacg tacagataaa caaacatatc atcatttgtg 9300
aaatacatag tacaataatt tgcttttaaa tagagtttaa gtcacacaca ctgacacaca 9360
cgataaaacg ataatgtctg caaaaacact ttaatcccat tgcctagagg acagcttctc 9420
cactttgtct ttaaggttgg ttttgccgtg ttgtttttat ctttatataa tgatctattt 9480
tttggattat gaaatgaatt cacacatttt aattatttaa gaagatccat atacaggttt 9540
ataacagtac taagtgatga ttattttttg tttttgcata gtttagttta ttgggtaaac 9600
attcattacg tgtctcttta tacgaatcac ccatccaaaa tttcaagtag tcttttagtt 9660
catttattat ttcataacta tttgacttat tgatttgaca agaaacaaca aaagtgttga 9720
cttattgata gattgtggga tcataaaagt aattaagcgt caaccacgac ccacaacaac 9780
aaagcacatg ttatacatta atatctcgtt tacttaatta cagttttcag aatgccgttt 9840
catgtcttgt cactggcgat gttattatca tgttggacaa tattcgactg ttgtcgtttt 9900
tacattttcg tattgactaa aactaaaaaa acaaaactct gtttcagacc cagctttc 9958
<210> 92
<211> 10735
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 92
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatg gcgcgccggg gacaagtttg tacaaaaaag caggctgcgg ccgcgaaata 420
tccttcctat tcaaagttat atatatttgt ttacttttgt tttagatctg gacctgagac 480
atgtaagtac atatttgttg aatctttggg taaaaactta tgtctctggg taaaatttgc 540
tgagagattt gaccgattcc tattggctct ggattctgta gttacctaat acatgaaaaa 600
gtttcatttg gcctatgctc acttcatgct tataaacttt ttcttgcaaa ttaattggat 660
tagatgctcc ttcatagatt cagatgcaat agatttgcat gaagaaaata ataggattca 720
tgatagtaaa aagattgtat ttttgtttgt ttgtttatgt ttaaaagtct atatgttgac 780
aatagagttg ctatcaactg tttcatttag gtttatgttt ttgtcaagtt gcttattcta 840
agagacattg tgattatgac ttgtcttctc taacgtagtt tagtaataaa agacgaaaga 900
aattgatatc cacaagaaag agatgtaagc tgtaacgtat caaatctcat taataactag 960
tagtattctc aacgctatcg tttatttctt tctttggttt gccactatat gccgcttctc 1020
tgctctttat cccacgtact atccattttt tttgtggtag tccatttttt tgaaacttta 1080
ataacgtaac actgaatatt aatttgttgg tttaattaac tttgagtctt tgcttttggt 1140
ttatgcagaa acatgggtgc aggtggaaga atgcaagtgt ctcctccctc caaaaagtct 1200
gaaaccgaca acatcaagcg cgtaccctgc gagacaccgc ccttcactgt cggagaactc 1260
aagaaagcaa tcccaccgca ctgtttcaaa cgctcgatcc ctcgctcttt ctcctacctc 1320
atctgggaca tcatcatagc ctcctgcttc tactacgtcg ccaccactta cttccctctc 1380
ctccctcacc ctctctccta cttcgcctgg cctctctact gggccggtac cgtcgacaag 1440
cttcttgcct caattccgga ggtgtttcta gtgttcaaca tgacaaacaa aacccatctc 1500
tttcagtata tgtctctcag ttgtgcttaa ttcaaatttc aactcagaga acttcttggc 1560
atacttatcc agattatcta atgatctcat ctaatggtaa ttcaactttc agtatatgtc 1620
tcgcagcaaa ctatctttac atcaaatttt taacaactca atgcacaaaa tacttttcct 1680
caacctaaaa ataaggcaat tagccaaaaa caactttgcg tgtgaacaac gcgttacacg 1740
tccctacaca tacgtgtcaa tttataattg gctattgctt ccacgcctta gctttctcgt 1800
gaccgaccga gtcgtcctcg tcttttttgc ttctataaat caaataccca aagagctctt 1860
cttcttcaca attcagattc caattttctc aaactctaaa atcaatctct caaatctctc 1920
aaccgtgatc aaggtagatt tctgagttct tattgtattt cttcgatttg tttcgttcga 1980
tcgcaattta ggctctgttc tttgattttg atctcgttaa tctctgatcg gaggcaaatt 2040
acatagtttc atcgttagat ctcttcttat ttctcgatta gggttcgtat ttttcgcaga 2100
tctgtttatt ttcttgttgt ttccttgtat ttgatccgat ttgttgaaag aatttgtgtg 2160
ttctcgatta tttacgcttt gatctgtgat ttttatctag atttggtgtt agtttcttgt 2220
ttgtgcgatc gaatttgtcg attaatctcg gtttttctga ttaacagatg gctcaatcta 2280
gcagaatctg ccacggtgtg cagaacccat gtgtgatcat ttccaatctc tccaaatcca 2340
accagaacaa atctcctttc tcagtcagcc tcaagactca ccagcagcag cgtcgtgctt 2400
accagatatc tagctgggga ttgaagaagt caaacaacgg gtccgtgatt cgtccggtta 2460
aggcagctgc aagagggatg ccagccttgt ctttacctgg atcaaagagt atcacagcta 2520
gggcactctt tcttgctgct gctgctgatg gggttactac tttggtgagg ccattgagaa 2580
gtgacgacac agaaggattc gctgaggggt tagttcgttt aggctatcgt gtagggagga 2640
cacccgatac ttggcaagtc gatggcagac cacaaggacc agcagtggct gaggctgacg 2700
tctactgtag agacggagca accaccgcta gattcttgcc aaccttagca gctgctggtc 2760
acggaacata cagatttgat gcttcaccac agatgaggag acgtcctctt ttgcccttaa 2820
gcagagcctt gagggatttg ggtgtcgatc ttagacacga agaagctgaa ggtcatcacc 2880
ctctgactgt ccgtgctgct ggggttgaag gaggagaggt tactttggat gctggtcagt 2940
caagtcagta tctcactgcc ttgttgctcc ttggtcccct tacaagacaa ggactgagga 3000
taagggttac tgatttggtg tcagcaccat acgtggagat tacgcttgca atgatgaggg 3060
ctttcggagt tgaagtggca agggagggag atgtgttcgt tgttccacct ggtggatatc 3120
gtgcaactac gtatgctata gaacccgacg caagtactgc ttcttacttc ttcgcagctg 3180
ctgctttgac tcctggagct gaagtgactg tacctgggtt aggcacggga gcacttcaag 3240
gagatttggg atttgtagat gtcttaagga gaatgggagc cgaggtgtcc gtaggagctg 3300
atgcaaccac tgttagagga actggtgaat tgcgtggcct tacagccaac atgagagaca 3360
taagtgatac gatgccgacc ctcgctgcaa tagcaccctt tgctagtgct ccagttagaa 3420
tcgaggatgt tgccaacact cgtgtcaaag aatgtgacag acttgaggct tgtgcagaga 3480
accttaggag gttgggagta agggttgcaa cgggtccgga ctggattgag atacaccctg 3540
gtccagctac tggtgctcaa gtcacaagct atggtgatca cagaattgtg atgtcatttg 3600
cagtgactgg acttcgtgtg cctgggatca gcttcgacga ccctggctgt gttcgtaaga 3660
cttttcctgg gtttcacgag gctttcgcag aattgaggcg tggcattggg agctgatgag 3720
tagttagctt aatcacctaa gatcggcggc aatagcttct tagcgccatc ccgggttgat 3780
cctatctgtg ttgaaatagt tgcggtgggc aaggctctct ttcagaaaga caggcggcca 3840
aaggaaccca aggtgaggtg ggctatggct ctcagttcct tgtggaagcg cttggtctaa 3900
ggtgcagagg tgttagcggg atgaagcaaa agtgtccgat tgtaacaaga tatgttgatc 3960
ctacgtaagg atattaaagt atgtattcat cactaatata atcagtgtat tccaatatgt 4020
actacgattt ccaatgtctt tattgtcgcc gtatgtaatc ggcgtcacaa aataatcccc 4080
ggtgactttc ttttaatcca ggatgaaata atatgttatt ataatttttg cgatttggtc 4140
cgttatagga attgaagtgt gcttgcggtc gccaccactc ccatttcata attttacatg 4200
tatttgaaaa ataaaaattt atggtattca atttaaacac gtatacttgt aaagaatgat 4260
atcttgaaag aaatatagtt taaatattta ttgataaaat aacaagtcag gtattatagt 4320
ccaagcaaaa acataaattt attgatgcaa gtttaaattc agaaatattt caataactga 4380
ttatatcagc tggtacattg ccgtagatga aagactgagt gcgatattat ggtgtaatac 4440
atacggccgc cagaaggtaa ttatccaaga tgtagcatca agaatccaat gtttacggga 4500
aaaactatgg aagtattatg taagctcagc aagaagcaga tcaatatgcg gcacatatgc 4560
aacctatgtt caaaaatgaa gaatgtacag atacaagatc ctatactgcc agaatacgaa 4620
gaagaatacg tagaaattga aaaagaagaa ccaggcgaag aaaagaatct tgaagacgta 4680
agcactgacg acaacaatga aaagaagaag ataaggtcgg tgattgtgaa agagacatag 4740
aggacacatg taaggtggaa aatgtaaggg cggaaagtaa ccttatcaca aaggaatctt 4800
atcccccact acttatcctt ttatattttt ccgtgtcatt tttgcccttg agttttccta 4860
tataaggaac caagttcggc atttgtgaaa acaagaaaaa atttggtgta agctattttc 4920
tttgaagtac tgaggataca acttcagaga aatttgtaag tttgtaatgt ctccggagag 4980
gagaccagtt gagattaggc cagctacagc agctgatatg gccgcggttt gtgatatcgt 5040
taaccattac attgagacgt ctacagtgaa ctttaggaca gagccacaaa caccacaaga 5100
gtggattgat gatctcgaga ggttgcaaga tagataccct tggttggttg ctgaggttga 5160
gggtgttgtg gctggtattg cttacgctgg gccctggaag gctaggaacg cttacgattg 5220
gacagttgag agtactgttt acgtgtcaca taggcatcaa aggtcagttt tacttccctt 5280
aattttctat gtactttcat aattacttat gttattttct tcatgagttt taatgcaaat 5340
tactatatgg actctagtga aaacgttcag aatcctataa acatgactac tgagacgaac 5400
ttgagagtag ttttgatcat acacacgttt catgtggtac ttgagagtta ctaatttttg 5460
tcatcttcgt ataagtagta aaagatacta caagaatagt ttagtagaaa atactagcgg 5520
taggtgaaga tttgtcgcta tgtactatta ttgtctagta acttgagtaa caatttcgtg 5580
gtctaaatat caaataaaaa tggatgagtg gttcaccaaa tctaggcatc aaaactatta 5640
atgtcattgt ctagatctta ggtgacacca catttcgaat atttattggt aattgagatg 5700
ttaaagtacc aatatttgac ttaataaact aaaagatttt ggctttatca aatgtagaca 5760
ttgatgacat atcgttgtca ttatcttgag tatatacaag tcgatcaatt aggtgaaagt 5820
ttagtgtctc gtggttggta aacgattaat acagtagtat attttatcca aagacaaaat 5880
ccaaatcatt tcaccagtat gaatagtatt attttatctt aaaagctaaa atcttaaaaa 5940
ccaaggtagc acccacgttg agctagacga tcaaatcgat ttctgctttg tccaatttac 6000
caagctattt aaagccaaat aattgaaata taggtaggtc gttatattag gctaagattt 6060
atctcaaatg cttaactaaa ggaataacaa gggattctag ttgtgtggtt ttataagatt 6120
ggtccaattt cacttaagtt tgtttattgt agaattttat atgtgaataa tttgaattcc 6180
aattgaaaag atattatagt aaaagaaaaa atagtgcgaa caaaaaactt taatcccata 6240
aaaagaaaaa gaaaaatgaa aagttcttct aacatccata ttttgcatca tatcataaag 6300
ataagaaaga tacatatcat agacgtacag ataaacaaac atatcatcat ttgtgaaata 6360
catagtacaa taatttgctt ttaaatagag tttaagtcac acacactgac acacacgata 6420
aaacgataat gtctgcaaaa acactttaat cccattgcct agaggacagc ttctccactt 6480
tgtctttaag gttggttttg ccgtgttgtt tttatcttta tataatgatc tattttttgg 6540
attatgaaat gaattcacac attttaatta tttaagaaga tccatataca ggtttataac 6600
agtactaagt gatgattatt ttttgttttt gcatagttta gtttattggg taaacattca 6660
ttacgtgtct ctttatacga atcacccatc caaaatttca agtagtcttt tagttcattt 6720
attatttcat aactatttga cttattgatt tgacaagaaa caacaaaagt gttgacttat 6780
tgatagattg tgggatcata aaagtaatta agcgtcaacc acgacccaca acaacaaagc 6840
acatgttata cattaatatc tcgtttactt aattacagtt ttcagaatgc cgtttcatgt 6900
cttgtcactg gcgatgttat tatcatgttg gacaatattc gactgttgtc gtttttacat 6960
tttcgtattg actaaaacta aaaaaacaaa actctgtttc aggttgggcc taggatccac 7020
attgtacaca catttgctta agtctatgga ggcgcaaggt tttaagtctg tggttgctgt 7080
tataggcctt ccaaacgatc catctgttag gttgcatgag gctttgggat acacagcccg 7140
gggtacattg cgcgcagctg gatacaagca tggtggatgg catgatgttg gtttttggca 7200
aagggatttt gagttgccag ctcctccaag gccagttagg ccagttaccc agatctaata 7260
tcaaaatcta tttagaaata cacaatattt tgttgcaggc ttgctggaga atcgatctgc 7320
tatcataaaa attacaaaaa aattttattt gcctcaatta ttttaggatt ggtattaagg 7380
acgcttaaat tatttgtcgg gtcactacgc atcattgtga ttgagaagat cagcgatacg 7440
aaatattcgt agtactatcg ataatttatt tgaaaattca taagaaaagc aaacgttaca 7500
tgaattgatg aaacaataca aagacagata aagccacgca catttaggat attggccgag 7560
attactgaat attgagtaag atcacggaat ttctgacagg agcatgtctt caattcagcc 7620
caaatggcag ttgaaatact caaaccgccc catatgcagg agcggatcat tcattgtttg 7680
tttggttgcc tttgccaaca tgggagtcca aggttgcatg ccagggctgc gtcctaaccg 7740
gcgtctgggt catagcccac gagtgcggcc accacgcctt cagcgactac cagtggctgg 7800
acgacaccgt cggcctcatc ttccactcct tcctcctcgt cccttacttc tcctggaagt 7860
acagtcatcg acgccaccat tccaacactg gctccctcga gagagacgaa gtgtttgtcc 7920
ccaagaagaa gtcagacatc aagtggtacg gcaagtacct caacaaccct ttgggacgca 7980
ccgtgatgtt aacggttcag ttcactctcg gctggccttt gtacttagcc ttcaacgtct 8040
cggggagacc ttacgacggc ggcttcgctt gccatttcca ccccaacgct cccatctaca 8100
acgaccgtga gcgtctccag atatacatct ccgacgctgg catcctcgcc gtctgctacg 8160
gtctctaccg ctacgctgct gtccaaggag ttgcctcgat ggtctgcttc tacggagttc 8220
ctcttctgat tgtcaacggg ttcttagttt tgatcactta cttgcagcac acgcatcctt 8280
ccctgcctca ctatgactcg tctgagtggg attggttgag gggagctttg gccaccgttg 8340
acagagacta cggaatcttg aacaaggtct tccacaatat cacggacacg cacgtggcgc 8400
atcacctgtt ctcgaccatg ccgcattatc acgcgatgga agctacgaag gcgataaagc 8460
cgatactggg agagtattat cagttcgatg ggacgccggt ggttaaggcg atgtggaggg 8520
aggcgaagga gtgtatctat gtggaaccgg acaggcaagg tgagaagaaa ggtgtgttct 8580
ggtacaacaa taagttatga agcaaagaag aaactgaacc tttctcatct atgattgtct 8640
ttgttttaag aagctatgtt tctgtttcaa taatctttaa ttatccattt tgttgtgttt 8700
tctgacattt tggctaaaat ggcgccaccc agctttcttg tacaaagtgg tccccttaat 8760
taactgggcc tcatgggcct tccgctcact gcccgctttc cagtcgggaa acctgtcgtg 8820
ccagctgcat taacatggtc atagctgttt ccttgcgtat tgggcgctct ccgcttcctc 8880
gctcactgac tcgctgcgct cggtcgttcg ggtaaagcct ggggtgccta atgagcaaaa 8940
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 9000
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 9060
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 9120
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 9180
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 9240
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 9300
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 9360
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 9420
actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 9480
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 9540
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 9600
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 9660
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 9720
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 9780
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 9840
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga accacgctca 9900
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 9960
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 10020
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 10080
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 10140
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 10200
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 10260
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 10320
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 10380
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 10440
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 10500
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 10560
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 10620
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 10680
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccac 10735
<210> 93
<211> 10421
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 93
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatg gcgcgccggg gacaagtttg tacaaaaaag caggctgcgg ccgcgaaata 420
tccttcctat tcaaagttat atatatttgt ttacttttgt tttagatctg gacctgagac 480
atgtaagtac atatttgttg aatctttggg taaaaactta tgtctctggg taaaatttgc 540
tgagagattt gaccgattcc tattggctct ggattctgta gttacctaat acatgaaaaa 600
gtttcatttg gcctatgctc acttcatgct tataaacttt ttcttgcaaa ttaattggat 660
tagatgctcc ttcatagatt cagatgcaat agatttgcat gaagaaaata ataggattca 720
tgatagtaaa aagattgtat ttttgtttgt ttgtttatgt ttaaaagtct atatgttgac 780
aatagagttg ctatcaactg tttcatttag gtttatgttt ttgtcaagtt gcttattcta 840
agagacattg tgattatgac ttgtcttctc taacgtagtt tagtaataaa agacgaaaga 900
aattgatatc cacaagaaag agatgtaagc tgtaacgtat caaatctcat taataactag 960
tagtattctc aacgctatcg tttatttctt tctttggttt gccactatat gccgcttctc 1020
tgctctttat cccacgtact atccattttt tttgtggtag tccatttttt tgaaacttta 1080
ataacgtaac actgaatatt aatttgttgg tttaattaac tttgagtctt tgcttttggt 1140
ttatgcagaa acatgggtgc aggtggaaga atgcaagtgt ctcctccctc caaaaagtct 1200
gaaaccgaca acatcaagcg cgtaccctgc gagacaccgc ccttcactgt cggagaactc 1260
aagaaagcaa tcccaccgca ctgtttcaaa cgctcgatcc ctcgctcttt ctcctacctc 1320
atctgggaca tcatcatagc ctcctgcttc tactacgtcg ccaccactta cttccctctc 1380
ctccctcacc ctctctccta cttcgcctgg cctctctact gggccggtac cgtcgacgag 1440
atttttcaaa tcagtgcgct agacgtgacg taagtatccg agtcagtttt tatttttcta 1500
ctaatttggt cgtttatttc ggcgtgtagg acatggcaac cgggcctgaa tttcgcgggt 1560
attctgtttc tattccaact ttttcttgat ccgcagccat taacgacttt tgaatagata 1620
cgtctagggt cgagggggga tccgtcgagg gggtccacca aaaacgtaag cgcttacgta 1680
catggtcgag ggggtccacc aaaaacgtaa gcgcttacgt acatggtcga gggggtccac 1740
caaaaacgta agcgcttacg tacatggtcg agggggtcca ccaaaaacgt aagcgcttac 1800
gtacatgctc gactagagcg tgacgctcgc ggtgacgcca tttcgccttt tcagaaatgg 1860
ataaatagcc ttgcttccta ttatatcttc ccaaattacc aatacattac actagcatct 1920
gaatttcata accaatctcg atacaccaaa tcgatggctc aatctagcag aatctgccac 1980
ggtgtgcaga acccatgtgt gatcatttcc aatctctcca aatccaacca gaacaaatct 2040
cctttctcag tcagcctcaa gactcaccag cagcagcgtc gtgcttacca gatatctagc 2100
tggggattga agaagtcaaa caacgggtcc gtgattcgtc cggttaaggc agctgcaaga 2160
gggatgccag ccttgtcttt acctggatca aagagtatca cagctagggc actctttctt 2220
gctgctgctg ctgatggggt tactactttg gtgaggccat tgagaagtga cgacacagaa 2280
ggattcgctg aggggttagt tcgtttaggc tatcgtgtag ggaggacacc cgatacttgg 2340
caagtcgatg gcagaccaca aggaccagca gtggctgagg ctgacgtcta ctgtagagac 2400
ggagcaacca ccgctagatt cttgccaacc ttagcagctg ctggtcacgg aacatacaga 2460
tttgatgctt caccacagat gaggagacgt cctcttttgc ccttaagcag agccttgagg 2520
gatttgggtg tcgatcttag acacgaagaa gctgaaggtc atcaccctct gactgtccgt 2580
gctgctgggg ttgaaggagg agaggttact ttggatgctg gtcagtcaag tcagtatctc 2640
actgccttgt tgctccttgg tccccttaca agacaaggac tgaggataag ggttactgat 2700
ttggtgtcag caccatacgt ggagattacg cttgcaatga tgagggcttt cggagttgaa 2760
gtggcaaggg agggagatgt gttcgttgtt ccacctggtg gatatcgtgc aactacgtat 2820
gctatagaac ccgacgcaag tactgcttct tacttcttcg cagctgctgc tttgactcct 2880
ggagctgaag tgactgtacc tgggttaggc acgggagcac ttcaaggaga tttgggattt 2940
gtagatgtct taaggagaat gggagccgag gtgtccgtag gagctgatgc aaccactgtt 3000
agaggaactg gtgaattgcg tggccttaca gccaacatga gagacataag tgatacgatg 3060
ccgaccctcg ctgcaatagc accctttgct agtgctccag ttagaatcga ggatgttgcc 3120
aacactcgtg tcaaagaatg tgacagactt gaggcttgtg cagagaacct taggaggttg 3180
ggagtaaggg ttgcaacggg tccggactgg attgagatac accctggtcc agctactggt 3240
gctcaagtca caagctatgg tgatcacaga attgtgatgt catttgcagt gactggactt 3300
cgtgtgcctg ggatcagctt cgacgaccct ggctgtgttc gtaagacttt tcctgggttt 3360
cacgaggctt tcgcagaatt gaggcgtggc attgggagct gatgagtagt tagcttaatc 3420
acctaagatc ggcggcaata gcttcttagc gccatcccgg gttgatccta tctgtgttga 3480
aatagttgcg gtgggcaagg ctctctttca gaaagacagg cggccaaagg aacccaaggt 3540
gaggtgggct atggctctca gttccttgtg gaagcgcttg gtctaaggtg cagaggtgtt 3600
agcgggatga agcaaaagtg tccgattgta acaagatatg ttgatcctac gtaaggatat 3660
taaagtatgt attcatcact aatataatca gtgtattcca atatgtacta cgatttccaa 3720
tgtctttatt gtcgccgtat gtaatcggcg tcacaaaata atccccggtg actttctttt 3780
aatccaggat gaaataatat gttattataa tttttgcgat ttggtccgtt ataggaattg 3840
aagtgtgctt gcggtcgcca ccactcccat ttcataattt tacatgtatt tgaaaaataa 3900
aaatttatgg tattcaattt aaacacgtat acttgtaaag aatgatatct tgaaagaaat 3960
atagtttaaa tatttattga taaaataaca agtcaggtat tatagtccaa gcaaaaacat 4020
aaatttattg atgcaagttt aaattcagaa atatttcaat aactgattat atcagctggt 4080
acattgccgt agatgaaaga ctgagtgcga tattatggtg taatacatac ggccgccaga 4140
aggtaattat ccaagatgta gcatcaagaa tccaatgttt acgggaaaaa ctatggaagt 4200
attatgtaag ctcagcaaga agcagatcaa tatgcggcac atatgcaacc tatgttcaaa 4260
aatgaagaat gtacagatac aagatcctat actgccagaa tacgaagaag aatacgtaga 4320
aattgaaaaa gaagaaccag gcgaagaaaa gaatcttgaa gacgtaagca ctgacgacaa 4380
caatgaaaag aagaagataa ggtcggtgat tgtgaaagag acatagagga cacatgtaag 4440
gtggaaaatg taagggcgga aagtaacctt atcacaaagg aatcttatcc cccactactt 4500
atccttttat atttttccgt gtcatttttg cccttgagtt ttcctatata aggaaccaag 4560
ttcggcattt gtgaaaacaa gaaaaaattt ggtgtaagct attttctttg aagtactgag 4620
gatacaactt cagagaaatt tgtaagtttg taatgtctcc ggagaggaga ccagttgaga 4680
ttaggccagc tacagcagct gatatggccg cggtttgtga tatcgttaac cattacattg 4740
agacgtctac agtgaacttt aggacagagc cacaaacacc acaagagtgg attgatgatc 4800
tcgagaggtt gcaagataga tacccttggt tggttgctga ggttgagggt gttgtggctg 4860
gtattgctta cgctgggccc tggaaggcta ggaacgctta cgattggaca gttgagagta 4920
ctgtttacgt gtcacatagg catcaaaggt cagttttact tcccttaatt ttctatgtac 4980
tttcataatt acttatgtta ttttcttcat gagttttaat gcaaattact atatggactc 5040
tagtgaaaac gttcagaatc ctataaacat gactactgag acgaacttga gagtagtttt 5100
gatcatacac acgtttcatg tggtacttga gagttactaa tttttgtcat cttcgtataa 5160
gtagtaaaag atactacaag aatagtttag tagaaaatac tagcggtagg tgaagatttg 5220
tcgctatgta ctattattgt ctagtaactt gagtaacaat ttcgtggtct aaatatcaaa 5280
taaaaatgga tgagtggttc accaaatcta ggcatcaaaa ctattaatgt cattgtctag 5340
atcttaggtg acaccacatt tcgaatattt attggtaatt gagatgttaa agtaccaata 5400
tttgacttaa taaactaaaa gattttggct ttatcaaatg tagacattga tgacatatcg 5460
ttgtcattat cttgagtata tacaagtcga tcaattaggt gaaagtttag tgtctcgtgg 5520
ttggtaaacg attaatacag tagtatattt tatccaaaga caaaatccaa atcatttcac 5580
cagtatgaat agtattattt tatcttaaaa gctaaaatct taaaaaccaa ggtagcaccc 5640
acgttgagct agacgatcaa atcgatttct gctttgtcca atttaccaag ctatttaaag 5700
ccaaataatt gaaatatagg taggtcgtta tattaggcta agatttatct caaatgctta 5760
actaaaggaa taacaaggga ttctagttgt gtggttttat aagattggtc caatttcact 5820
taagtttgtt tattgtagaa ttttatatgt gaataatttg aattccaatt gaaaagatat 5880
tatagtaaaa gaaaaaatag tgcgaacaaa aaactttaat cccataaaaa gaaaaagaaa 5940
aatgaaaagt tcttctaaca tccatatttt gcatcatatc ataaagataa gaaagataca 6000
tatcatagac gtacagataa acaaacatat catcatttgt gaaatacata gtacaataat 6060
ttgcttttaa atagagttta agtcacacac actgacacac acgataaaac gataatgtct 6120
gcaaaaacac tttaatccca ttgcctagag gacagcttct ccactttgtc tttaaggttg 6180
gttttgccgt gttgttttta tctttatata atgatctatt ttttggatta tgaaatgaat 6240
tcacacattt taattattta agaagatcca tatacaggtt tataacagta ctaagtgatg 6300
attatttttt gtttttgcat agtttagttt attgggtaaa cattcattac gtgtctcttt 6360
atacgaatca cccatccaaa atttcaagta gtcttttagt tcatttatta tttcataact 6420
atttgactta ttgatttgac aagaaacaac aaaagtgttg acttattgat agattgtggg 6480
atcataaaag taattaagcg tcaaccacga cccacaacaa caaagcacat gttatacatt 6540
aatatctcgt ttacttaatt acagttttca gaatgccgtt tcatgtcttg tcactggcga 6600
tgttattatc atgttggaca atattcgact gttgtcgttt ttacattttc gtattgacta 6660
aaactaaaaa aacaaaactc tgtttcaggt tgggcctagg atccacattg tacacacatt 6720
tgcttaagtc tatggaggcg caaggtttta agtctgtggt tgctgttata ggccttccaa 6780
acgatccatc tgttaggttg catgaggctt tgggatacac agcccggggt acattgcgcg 6840
cagctggata caagcatggt ggatggcatg atgttggttt ttggcaaagg gattttgagt 6900
tgccagctcc tccaaggcca gttaggccag ttacccagat ctaatatcaa aatctattta 6960
gaaatacaca atattttgtt gcaggcttgc tggagaatcg atctgctatc ataaaaatta 7020
caaaaaaatt ttatttgcct caattatttt aggattggta ttaaggacgc ttaaattatt 7080
tgtcgggtca ctacgcatca ttgtgattga gaagatcagc gatacgaaat attcgtagta 7140
ctatcgataa tttatttgaa aattcataag aaaagcaaac gttacatgaa ttgatgaaac 7200
aatacaaaga cagataaagc cacgcacatt taggatattg gccgagatta ctgaatattg 7260
agtaagatca cggaatttct gacaggagca tgtcttcaat tcagcccaaa tggcagttga 7320
aatactcaaa ccgccccata tgcaggagcg gatcattcat tgtttgtttg gttgcctttg 7380
ccaacatggg agtccaaggt tgcatgccag ggctgcgtcc taaccggcgt ctgggtcata 7440
gcccacgagt gcggccacca cgccttcagc gactaccagt ggctggacga caccgtcggc 7500
ctcatcttcc actccttcct cctcgtccct tacttctcct ggaagtacag tcatcgacgc 7560
caccattcca acactggctc cctcgagaga gacgaagtgt ttgtccccaa gaagaagtca 7620
gacatcaagt ggtacggcaa gtacctcaac aaccctttgg gacgcaccgt gatgttaacg 7680
gttcagttca ctctcggctg gcctttgtac ttagccttca acgtctcggg gagaccttac 7740
gacggcggct tcgcttgcca tttccacccc aacgctccca tctacaacga ccgtgagcgt 7800
ctccagatat acatctccga cgctggcatc ctcgccgtct gctacggtct ctaccgctac 7860
gctgctgtcc aaggagttgc ctcgatggtc tgcttctacg gagttcctct tctgattgtc 7920
aacgggttct tagttttgat cacttacttg cagcacacgc atccttccct gcctcactat 7980
gactcgtctg agtgggattg gttgagggga gctttggcca ccgttgacag agactacgga 8040
atcttgaaca aggtcttcca caatatcacg gacacgcacg tggcgcatca cctgttctcg 8100
accatgccgc attatcacgc gatggaagct acgaaggcga taaagccgat actgggagag 8160
tattatcagt tcgatgggac gccggtggtt aaggcgatgt ggagggaggc gaaggagtgt 8220
atctatgtgg aaccggacag gcaaggtgag aagaaaggtg tgttctggta caacaataag 8280
ttatgaagca aagaagaaac tgaacctttc tcatctatga ttgtctttgt tttaagaagc 8340
tatgtttctg tttcaataat ctttaattat ccattttgtt gtgttttctg acattttggc 8400
taaaatggcg ccacccagct ttcttgtaca aagtggtccc cttaattaac tgggcctcat 8460
gggccttccg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaac 8520
atggtcatag ctgtttcctt gcgtattggg cgctctccgc ttcctcgctc actgactcgc 8580
tgcgctcggt cgttcgggta aagcctgggg tgcctaatga gcaaaaggcc agcaaaaggc 8640
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 8700
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 8760
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 8820
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 8880
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 8940
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 9000
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 9060
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 9120
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 9180
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 9240
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 9300
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 9360
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 9420
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 9480
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 9540
accatctggc cccagtgctg caatgatacc gcgagaacca cgctcaccgg ctccagattt 9600
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 9660
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 9720
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 9780
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 9840
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 9900
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 9960
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 10020
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 10080
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 10140
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 10200
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 10260
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 10320
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 10380
acaaataggg gttccgcgca catttccccg aaaagtgcca c 10421
<210> 94
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 94
Arg Ser Asp Asn Leu Ser Thr
1 5
<210> 95
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 95
His Ser His Ala Arg Ile Lys
1 5
<210> 96
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 96
His Arg Ser Ser Leu Arg Arg
1 5
<210> 97
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 97
Arg Ser Asp His Leu Ser Glu
1 5
<210> 98
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 98
Gln Asn Ala Asn Arg Ile Thr
1 5
<210> 99
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 99
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 100
<400> 100
000
<210> 101
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 101
Thr Ser Gly Asn Leu Thr Arg
1 5
<210> 102
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 102
Met Ser His His Leu Arg Asp
1 5
<210> 103
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 103
Asp Gln Ser Asn Leu Arg Ala
1 5
<210> 104
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 104
Gln Ser Gly Asn Leu Ala Arg
1 5
<210> 105
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 105
Arg Ser Asp Asn Leu Ser Arg
1 5
<210> 106
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 106
Asp Asn Asn Ala Arg Ile Asn
1 5
<210> 107
<400> 107
000
<210> 108
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 108
Arg Ser Asp His Leu Thr Gln
1 5
<210> 109
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 109
Arg Ser Asp Asn Leu Arg Glu
1 5
<210> 110
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 110
Gln Ser Gly Ala Leu Ala Arg
1 5
<210> 111
<400> 111
000
<210> 112
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 112
Arg Ser Asp Val Leu Ser Glu
1 5
<210> 113
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 113
Ser Pro Ser Ser Arg Arg Thr
1 5
<210> 114
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 114
Arg Ser Asp Ser Leu Ser Arg
1 5
<210> 115
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 115
Arg Lys Asp Ala Arg Ile Thr
1 5
<210> 116
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 116
Arg Ser Asp His Leu Ser Ala
1 5
<210> 117
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 117
Trp Ser Ser Ser Leu Tyr Tyr
1 5
<210> 118
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 118
Asn Ser Arg Asn Leu Arg Asn
1 5
<210> 119
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 119
Asp Gln Ser Thr Leu Arg Asn
1 5
<210> 120
<400> 120
000
<210> 121
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 121
Asp Arg Ser Asn Leu Trp Arg
1 5
<210> 122
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 122
Asp Arg Ser Ala Leu Ser Arg
1 5
<210> 123
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 123
Arg Ser Asp Ala Leu Ala Arg
1 5
<210> 124
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 124
Arg Ser Asp Ala Leu Ser Arg
1 5
<210> 125
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 125
Asp Arg Ser Asp Leu Ser Arg
1 5
<210> 126
<400> 126
000
<210> 127
<400> 127
000
<210> 128
<400> 128
000
<210> 129
<400> 129
000
<210> 130
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 130
Asp Ser Ser Ala Arg Asn Thr
1 5
<210> 131
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 131
Asp Arg Ser Ser Arg Lys Arg
1 5
<210> 132
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 132
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 133
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 133
Leu Ala His His Leu Val Gln
1 5
<210> 134
<400> 134
000
<210> 135
<400> 135
000
<210> 136
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 136
Thr Ser Gly His Leu Ser Arg
1 5
<210> 137
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 137
Arg Ser Asp Asn Leu Ser Val
1 5
<210> 138
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 138
Ile Arg Ser Thr Leu Arg Asp
1 5
<210> 139
<400> 139
000
<210> 140
<400> 140
000
<210> 141
<400> 141
000
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<400> 144
000
<210> 145
<400> 145
000
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<400> 148
000
<210> 149
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 149
Arg Ser Ala Val Leu Ser Glu
1 5
<210> 150
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 150
Thr Asn Ser Asn Arg Ile Thr
1 5
<210> 151
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 151
Leu Lys Gln His Leu Asn Glu
1 5
<210> 152
<400> 152
000
<210> 153
<400> 153
000
<210> 154
<400> 154
000
<210> 155
<400> 155
000
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 158
Gln Arg Thr His Leu Thr Gln
1 5
<210> 159
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 159
Arg Ser Asp Asn Leu Ser Asn
1 5
<210> 160
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 160
Thr Asn Ser Asn Arg Ile Lys
1 5
<210> 161
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 161
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 162
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 162
Gln Ser Ser Asp Leu Arg Arg
1 5
<210> 163
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 163
Asp Arg Ser Asn Arg Ile Lys
1 5
<210> 164
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 164
Arg Ser Ala Asn Leu Ala Arg
1 5
<210> 165
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 165
Arg Ser Asp Asn Leu Thr Thr
1 5
<210> 166
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 166
Gln Ser Gly Glu Leu Ile Asn
1 5
<210> 167
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 167
Arg Ser Ala Asp Leu Ser Arg
1 5
<210> 168
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 168
Arg Ser Asp Asn Leu Ser Glu
1 5
<210> 169
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 169
Asp Arg Ser His Leu Ala Arg
1 5
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 172
Ser Lys Gln Tyr Leu Ile Lys
1 5
<210> 173
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 173
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 174
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 174
Arg Ser Asp His Leu Thr Thr
1 5
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 179
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 189
Ala Ser Lys Thr Arg Lys Asn
1 5
<210> 190
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 190
Arg Ser Asp Thr Leu Ser Glu
1 5
<210> 191
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 191
Gln Ser His Asn Arg Thr Lys
1 5
<210> 192
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 192
Gln Ser Asp His Leu Thr Gln
1 5
<210> 193
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 193
Arg Ser Ser Asp Leu Ser Arg
1 5
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 198
Asp Arg Ser His Leu Ser Arg
1 5
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 201
Asp Arg Ser Ala Leu Ala Arg
1 5
<210> 202
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 202
Arg Ser Asp Asp Leu Ser Lys
1 5
<210> 203
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 203
Arg Ser Asp Thr Arg Lys Thr
1 5
<210> 204
<400> 204
000
<210> 205
<400> 205
000
<210> 206
<400> 206
000
<210> 207
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列描述:合成肽
<400> 207
Asn Asn Asp His Arg Lys Thr
1 5
<210> 208
<211> 10272
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 208
acaagtttgt acaaaaaagc aggctgtaag tttgtggatt cttcgtccat gtgatctttg 60
agtttcttta gagcttgtga gggattagta agtaacaatg cttgagtttt ttgctgctgg 120
gcttcgaaaa gtttgtcact tgttggtttg atccacaagg tcttcttctc catagctact 180
agacatgttt tagcttaaga ttcaagttta tatatgcctt gtggattaat cattgcctga 240
ttcttccgtg tcatctctga gtttatttag agcttggaag tggtgtagta ataactaaca 300
atactcttga taagttgtag caatgctctt gattagtgga tgtaatatga tgttgataag 360
atatatgagg cacagaacca aaagtggtgc ttccactaga cccgttttta gcctaaggtt 420
caagtttata ccttgtagat gtttctgtat tgtctgattc ttccctgtga tatttgaatt 480
tcttagagct ttggaagtga tataggaaca atgctcttgt gtgtttgtct ctatgaagat 540
tatcgctgtc gtgtttcatc cgagtgtgcg ggattttttg ctgctgggtt tagcctttct 600
tcaaaaagtt attacttgtt agttttattg ttttggtctt gataagagat gttaggacag 660
acatggtgct tcttgtctat agccactaga cctattttag cataaggtta acgaaattct 720
ctctacatac cttgtggatt tgtttacatt gcctgatctt tcctgtgatc gctgtcatgt 780
ttctttggaa tgattgatgt ttataaatgg aaaaatcttt gtgcaggttt aaacgtttac 840
gttaagcacc ctgctgatat ccctgattac aagaagcttt cattccctga gggattcaag 900
tgggagagag ttatgaactt cgaggatggt ggtgttgcta ctgttactca ggattcttca 960
cttcaggacg gatgcttcat ctacaaggtt aagttcatcg gagtgaactt cccttctgat 1020
ggacctgtta tgcagaaaaa gactatggga tgggaggctt ctaccgagag actttaccct 1080
agagatggtg ttcttaaggg tgagactcac aaggctctta agcttaaaga tggtggacac 1140
tacctcgtcg agttcaagtc tatctacatg gctaagaagc ctgttcagct tcctggttac 1200
tactacgttg acgctaagct tgatatcacc tctcacaacg aggactacac tatcgttgag 1260
caatacgaga gaactgaggg tagacatcac ttgttcctct gatatcaaaa tctatttaga 1320
aatacacaat attttgttgc aggcttgctg gagaatcgat ctgctatcat aaaaattaca 1380
aaaaaatttt atttgcctca attattttag gattggtatt aaggacgctt aaattatttg 1440
tcgggtcact acgcatcatt gtgattgaga agatcagcga tacgaaatat tcgtagtact 1500
atcgataatt tatttgaaaa ttcataagaa aagcaaacgt tacatgaatt gatgaaacaa 1560
tacaaagaca gataaagcca cgcacattta ggatattggc cgagattact gaatattgag 1620
taagatcacg gaatttctga caggagcatg tcttcaattc agcccaaatg gcagttgaaa 1680
tactcaaacc gccccatatg caggagcgga tcattcattg tttgtttggt tgcctttgcc 1740
aacatgggag tccaaggttg ccttttgcag tttatctcta tgcccgggac aagtgaagac 1800
tcccgcccat ctcactaggg acaggattgg agtccatgct caacaccgtg caggatgagg 1860
atgaccaaca actttgtata caaaagttgt atccgaagta aataaaacca tcggactctc 1920
gtataagact gtcgacaagc ttcttgcctc aattccggag gtgtttctag tgttcaacat 1980
gacaaacaaa acccatctct ttcagtatat gtctctcagt tgtgcttaat tcaaatttca 2040
actcagagaa cttcttggca tacttatcca gattatctaa tgatctcatc taatggtaat 2100
tcaactttca gtatatgtct cgcagcaaac tatctttaca tcaaattttt aacaactcaa 2160
tgcacaaaat acttttcctc aacctaaaaa taaggcaatt agccaaaaac aactttgcgt 2220
gtgaacaacg cgttacacgt ccctacacat acgtgtcaat ttataattgg ctattgcttc 2280
cacgccttag ctttctcgtg accgaccgag tcgtcctcgt cttttttgct tctataaatc 2340
aaatacccaa agagctcttc ttcttcacaa ttcagattcc aattttctca aactctaaaa 2400
tcaatctctc aaatctctca accgtgatca aggtagattt ctgagttctt attgtatttc 2460
ttcgatttgt ttcgttcgat cgcaatttag gctctgttct ttgattttga tctcgttaat 2520
ctctgatcgg aggcaaatta catagtttca tcgttagatc tcttcttatt tctcgattag 2580
ggttcgtatt tttcgcagat ctgtttattt tcttgttgtt tccttgtatt tgatccgatt 2640
tgttgaaaga atttgtgtgt tctcgattat ttacgctttg atctgtgatt tttatctaga 2700
tttggtgtta gtttcttgtt tgtgcgatcg aatttgtcga ttaatctcgg tttttctgat 2760
taacagatgg ctcaatctag cagaatctgc cacggtgtgc agaacccatg tgtgatcatt 2820
tccaatctct ccaaatccaa ccagaacaaa tctcctttct cagtcagcct caagactcac 2880
cagcagcagc gtcgtgctta ccagatatct agctggggat tgaagaagtc aaacaacggg 2940
tccgtgattc gtccggttaa ggcagctgca agagggatgc cagccttgtc tttacctgga 3000
tcaaagagta tcacagctag ggcactcttt cttgctgctg ctgctgatgg ggttactact 3060
ttggtgaggc cattgagaag tgacgacaca gaaggattcg ctgaggggtt agttcgttta 3120
ggctatcgtg tagggaggac acccgatact tggcaagtcg atggcagacc acaaggacca 3180
gcagtggctg aggctgacgt ctactgtaga gacggagcaa ccaccgctag attcttgcca 3240
accttagcag ctgctggtca cggaacatac agatttgatg cttcaccaca gatgaggaga 3300
cgtcctcttt tgcccttaag cagagccttg agggatttgg gtgtcgatct tagacacgaa 3360
gaagctgaag gtcatcaccc tctgactgtc cgtgctgctg gggttgaagg aggagaggtt 3420
actttggatg ctggtcagtc aagtcagtat ctcactgcct tgttgctcct tggtcccctt 3480
acaagacaag gactgaggat aagggttact gatttggtgt cagcaccata cgtggagatt 3540
acgcttgcaa tgatgagggc tttcggagtt gaagtggcaa gggagggaga tgtgttcgtt 3600
gttccacctg gtggatatcg tgcaactacg tatgctatag aacccgacgc aagtactgct 3660
tcttacttct tcgcagctgc tgctttgact cctggagctg aagtgactgt acctgggtta 3720
ggcacgggag cacttcaagg agatttggga tttgtagatg tcttaaggag aatgggagcc 3780
gaggtgtccg taggagctga tgcaaccact gttagaggaa ctggtgaatt gcgtggcctt 3840
acagccaaca tgagagacat aagtgatacg atgccgaccc tcgctgcaat agcacccttt 3900
gctagtgctc cagttagaat cgaggatgtt gccaacactc gtgtcaaaga atgtgacaga 3960
cttgaggctt gtgcagagaa ccttaggagg ttgggagtaa gggttgcaac gggtccggac 4020
tggattgaga tacaccctgg tccagctact ggtgctcaag tcacaagcta tggtgatcac 4080
agaattgtga tgtcatttgc agtgactgga cttcgtgtgc ctgggatcag cttcgacgac 4140
cctggctgtg ttcgtaagac ttttcctggg tttcacgagg ctttcgcaga attgaggcgt 4200
ggcattggga gctgatgagt agttagctta atcacctaag atcggcggca atagcttctt 4260
agcgccatcc cgggttgatc ctatctgtgt tgaaatagtt gcggtgggca aggctctctt 4320
tcagaaagac aggcggccaa aggaacccaa ggtgaggtgg gctatggctc tcagttcctt 4380
gtggaagcgc ttggtctaag gtgcagaggt gttagcggga tgaagcaaaa gtgtccgatt 4440
gtaacaagat atgttgatcc tacgtaagga tattaaagta tgtattcatc actaatataa 4500
tcagtgtatt ccaatatgta ctacgatttc caatgtcttt attgtcgccg tatgtaatcg 4560
gcgtcacaaa ataatccccg gtgactttct tttaatccag gatgaaataa tatgttatta 4620
taatttttgc gatttggtcc gttataggaa ttgaagtgtg cttgcggtcg ccaccactcc 4680
catttcataa ttttacatgt atttgaaaaa taaaaattta tggtattcaa tttaaacacg 4740
tatacttgta aagaatgata tcttgaaaga aatatagttt aaatatttat tgataaaata 4800
acaagtcagg tattatagtc caagcaaaaa cataaattta ttgatgcaag tttaaattca 4860
gaaatatttc aataactgat tatatcagct ggtacattgc cgtagatgaa agactgagtg 4920
cgatattatg gtgtaataca tacggccgac gcataggttc atttgaagct gctattctat 4980
ttagattgaa gtttaaaccc agaaggtaat tatccaagat gtagcatcaa gaatccaatg 5040
tttacgggaa aaactatgga agtattatgt aagctcagca agaagcagat caatatgcgg 5100
cacatatgca acctatgttc aaaaatgaag aatgtacaga tacaagatcc tatactgcca 5160
gaatacgaag aagaatacgt agaaattgaa aaagaagaac caggcgaaga aaagaatctt 5220
gaagacgtaa gcactgacga caacaatgaa aagaagaaga taaggtcggt gattgtgaaa 5280
gagacataga ggacacatgt aaggtggaaa atgtaagggc ggaaagtaac cttatcacaa 5340
aggaatctta tcccccacta cttatccttt tatatttttc cgtgtcattt ttgcccttga 5400
gttttcctat ataaggaacc aagttcggca tttgtgaaaa caagaaaaaa tttggtgtaa 5460
gctattttct ttgaagtact gaggatacaa cttcagagaa atttgtaagt ttgtaatgtc 5520
tccggagagg agaccagttg agattaggcc agctacagca gctgatatgg ccgcggtttg 5580
tgatatcgtt aaccattaca ttgagacgtc tacagtgaac tttaggacag agccacaaac 5640
accacaagag tggattgatg atctcgagag gttgcaagat agataccctt ggttggttgc 5700
tgaggttgag ggtgttgtgg ctggtattgc ttacgctggg ccctggaagg ctaggaacgc 5760
ttacgattgg acagttgaga gtactgttta cgtgtcacat aggcatcaaa ggtcagtttt 5820
acttccctta attttctatg tactttcata attacttatg ttattttctt catgagtttt 5880
aatgcaaatt actatatgga ctctagtgaa aacgttcaga atcctataaa catgactact 5940
gagacgaact tgagagtagt tttgatcata cacacgtttc atgtggtact tgagagttac 6000
taatttttgt catcttcgta taagtagtaa aagatactac aagaatagtt tagtagaaaa 6060
tactagcggt aggtgaagat ttgtcgctat gtactattat tgtctagtaa cttgagtaac 6120
aatttcgtgg tctaaatatc aaataaaaat ggatgagtgg ttcaccaaat ctaggcatca 6180
aaactattaa tgtcattgtc tagatcttag gtgacaccac atttcgaata tttattggta 6240
attgagatgt taaagtacca atatttgact taataaacta aaagattttg gctttatcaa 6300
atgtagacat tgatgacata tcgttgtcat tatcttgagt atatacaagt cgatcaatta 6360
ggtgaaagtt tagtgtctcg tggttggtaa acgattaata cagtagtata ttttatccaa 6420
agacaaaatc caaatcattt caccagtatg aatagtatta ttttatctta aaagctaaaa 6480
tcttaaaaac caaggtagca cccacgttga gctagacgat caaatcgatt tctgctttgt 6540
ccaatttacc aagctattta aagccaaata attgaaatat aggtaggtcg ttatattagg 6600
ctaagattta tctcaaatgc ttaactaaag gaataacaag ggattctagt tgtgtggttt 6660
tataagattg gtccaatttc acttaagttt gtttattgta gaattttata tgtgaataat 6720
ttgaattcca attgaaaaga tattatagta aaagaaaaaa tagtgcgaac aaaaaacttt 6780
aatcccataa aaagaaaaag aaaaatgaaa agttcttcta acatccatat tttgcatcat 6840
atcataaaga taagaaagat acatatcata gacgtacaga taaacaaaca tatcatcatt 6900
tgtgaaatac atagtacaat aatttgcttt taaatagagt ttaagtcaca cacactgaca 6960
cacacgataa aacgataatg tctgcaaaaa cactttaatc ccattgccta gaggacagct 7020
tctccacttt gtctttaagg ttggttttgc cgtgttgttt ttatctttat ataatgatct 7080
attttttgga ttatgaaatg aattcacaca ttttaattat ttaagaagat ccatatacag 7140
gtttataaca gtactaagtg atgattattt tttgtttttg catagtttag tttattgggt 7200
aaacattcat tacgtgtctc tttatacgaa tcacccatcc aaaatttcaa gtagtctttt 7260
agttcattta ttatttcata actatttgac ttattgattt gacaagaaac aacaaaagtg 7320
ttgacttatt gatagattgt gggatcataa aagtaattaa gcgtcaacca cgacccacaa 7380
caacaaagca catgttatac attaatatct cgtttactta attacagttt tcagaatgcc 7440
gtttcatgtc ttgtcactgg cgatgttatt atcatgttgg acaatattcg actgttgtcg 7500
tttttacatt ttcgtattga ctaaaactaa aaaaacaaaa ctctgtttca gacccagctt 7560
tcttgtacaa agtggtgatt cgacctgcag gcatgcaagc ttggcgtaat catggtcata 7620
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 7680
cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 7740
ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 7800
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 7860
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 7920
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 7980
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8040
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8100
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8160
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8220
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8280
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8340
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8400
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac 8460
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8520
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8580
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 8640
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 8700
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 8760
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 8820
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 8880
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 8940
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9000
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9060
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9120
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9180
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9240
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9300
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9360
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9420
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9480
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9540
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9600
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 9660
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 9720
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 9780
cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc 9840
gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc 9900
ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg 9960
cgggtgtcgg ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca 10020
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 10080
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 10140
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 10200
ccagtcacga cgttgtaaaa cgacggccag tgaattcgag ctcggtaccc ggggatcctc 10260
tagagtcgaa tc 10272
<210> 209
<211> 8774
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 209
ggggacaagt ttgtacaaaa aagcaggctg cggccgcgaa atatccttcc tattcaaagt 60
tatatatatt tgtttacttt tgttttagat ctggacctga gacatgtaag tacatatttg 120
ttgaatcttt gggtaaaaac ttatgtctct gggtaaaatt tgctgagaga tttgaccgat 180
tcctattggc tctggattct gtagttacct aatacatgaa aaagtttcat ttggcctatg 240
ctcacttcat gcttataaac tttttcttgc aaattaattg gattagatgc tccttcatag 300
attcagatgc aatagatttg catgaagaaa ataataggat tcatgatagt aaaaagattg 360
tatttttgtt tgtttgttta tgtttaaaag tctatatgtt gacaatagag ttgctatcaa 420
ctgtttcatt taggtttatg tttttgtcaa gttgcttatt ctaagagaca ttgtgattat 480
gacttgtctt ctctaacgta gtttagtaat aaaagacgaa agaaattgat atccacaaga 540
aagagatgta agctgtaacg tatcaaatct cattaataac tagtagtatt ctcaacgcta 600
tcgtttattt ctttctttgg tttgccacta tatgccgctt ctctgctctt tatcccacgt 660
actatccatt ttttttgtgg tagtccattt ttttgaaact ttaataacgt aacactgaat 720
attaatttgt tggtttaatt aactttgagt ctttgctttt ggtttatgca gaaacatggg 780
tgcaggtgga agaatgcaag tgtctcctcc ctccaaaaag tctgaaaccg acaacatcaa 840
gcgcgtaccc tgcgagacac cgcccttcac tgtcggagaa ctcaagaaag caatcccacc 900
gcactgtttc aaacgctcga tccctcgctc tttctcctac ctcatctggg acatcatcat 960
agcctcctgc ttctactacg tcgccaccac ttacttccct ctcctccctc accctctctc 1020
ctacttcgcc tggcctctct actgggccgg taccgtcgac tgactgactg aatctcgagg 1080
ggtgtggaag atatgaattt ttttgagaaa ctagataaga ttaatgaata tcggtgtttt 1140
ggttttttct tgtggccgtc tttgtttata ttgagatttt tcaaatcagt gcgcaagacg 1200
tgacgtaagt atccgagtca gtttttattt ttctactaat ttggtcgttt atttcggcgt 1260
gtaggacatg gcaaccgggc ctgaatttcg cgggtattct gtttctattc caactttttc 1320
ttgatccgca gccattaacg acttttgaat agatacgtct agggtcgagg ggggatccgt 1380
cgagggggtc caccaaaaac gtaagcgctt acgtacatgg tcgagggggt ccaccaaaaa 1440
cgtaagcgct tacgtacatg gtcgaggggg tccaccaaaa acgtaagcgc ttacgtacat 1500
ggtcgagggt agagcgtgac gctcgcggtg acgccatttc gccttttcag aaatggataa 1560
atagccttgc ttcctattat atcttcccaa attaccaata cattacacta gcatctgaat 1620
ttcataacca atctcgatac accaaatcgc ggatcagatc ttagtagcca tggctcaatc 1680
tagcagaatc tgccacggtg tgcagaaccc atgtgtgatc atttccaatc tctccaaatc 1740
caaccagaac aaatctcctt tctcagtcag cctcaagact caccagcagc agcgtcgtgc 1800
ttaccagata tctagctggg gattgaagaa gtcaaacaac gggtccgtga ttcgtccggt 1860
taaggcagct gcaagaggga tgccagcctt gtctttacct ggatcaaaga gtatcacagc 1920
tagggcactc tttcttgctg ctgctgctga tggggttact actttggtga ggccattgag 1980
aagtgacgac acagaaggat tcgctgaggg gttagttcgt ttaggctatc gtgtagggag 2040
gacacccgat acttggcaag tcgatggcag accacaagga ccagcagtgg ctgaggctga 2100
cgtctactgt agagacggag caaccaccgc tagattcttg ccaaccttag cagctgctgg 2160
tcacggaaca tacagatttg atgcttcacc acagatgagg agacgtcctc ttttgccctt 2220
aagcagagcc ttgagggatt tgggtgtcga tcttagacac gaagaagctg aaggtcatca 2280
ccctctgact gtccgtgctg ctggggttga aggaggagag gttactttgg atgctggtca 2340
gtcaagtcag tatctcactg ccttgttgct ccttggtccc cttacaagac aaggactgag 2400
gataagggtt actgatttgg tgtcagcacc atacgtggag attacgcttg caatgatgag 2460
ggctttcgga gttgaagtgg caagggaggg agatgtgttc gttgttccac ctggtggata 2520
tcgtgcaact acgtatgcta tagaacccga cgcaagtact gcttcttact tcttcgcagc 2580
tgctgctttg actcctggag ctgaagtgac tgtacctggg ttaggcacgg gagcacttca 2640
aggagatttg ggatttgtag atgtcttaag gagaatggga gccgaggtgt ccgtaggagc 2700
tgatgcaacc actgttagag gaactggtga attgcgtggc cttacagcca acatgagaga 2760
cataagtgat acgatgccga ccctcgctgc aatagcaccc tttgctagtg ctccagttag 2820
aatcgaggat gttgccaaca ctcgtgtcaa agaatgtgac agacttgagg cttgtgcaga 2880
gaaccttagg aggttgggag taagggttgc aacgggtccg gactggattg agatacaccc 2940
tggtccagct actggtgctc aagtcacaag ctatggtgat cacagaattg tgatgtcatt 3000
tgcagtgact ggacttcgtg tgcctgggat cagcttcgac gaccctggct gtgttcgtaa 3060
gacttttcct gggtttcacg aggctttcgc agaattgagg cgtggcattg ggagctgatg 3120
agtagttagc ttaatcacct aagatcggcg gcaatagctt cttagcgcca tcccgggttg 3180
atcctatctg tgttgaaata gttgcggtgg gcaaggctct ctttcagaaa gacaggcggc 3240
caaaggaacc caaggtgagg tgggctatgg ctctcagttc cttgtggaag cgcttggtct 3300
aaggtgcaga ggtgttagcg ggatgaagca aaagtgtccg attgtaacaa gatatgttga 3360
tcctacgtaa ggatattaaa gtatgtattc atcactaata taatcagtgt attccaatat 3420
gtactacgat ttccaatgtc tttattgtcg ccgtatgtaa tcggcgtcac aaaataatcc 3480
ccggtgactt tcttttaatc caggatgaaa taatatgtta ttataatttt tgcgatttgg 3540
tccgttatag gaattgaagt gtgcttgcgg tcgccaccac tcccatttca taattttaca 3600
tgtatttgaa aaataaaaat ttatggtatt caatttaaac acgtatactt gtaaagaatg 3660
atatcttgaa agaaatatag tttaaatatt tattgataaa ataacaagtc aggtattata 3720
gtccaagcaa aaacataaat ttattgatgc aagtttaaat tcagaaatat ttcaataact 3780
gattatatca gctggtacat tgccgtagat gaaagactga gtgcgatatt atggtgtaat 3840
acatacggcc gccagaaggt aattatccaa gatgtagcat caagaatcca atgtttacgg 3900
gaaaaactat ggaagtatta tgtaagctca gcaagaagca gatcaatatg cggcacatat 3960
gcaacctatg ttcaaaaatg aagaatgtac agatacaaga tcctatactg ccagaatacg 4020
aagaagaata cgtagaaatt gaaaaagaag aaccaggcga agaaaagaat cttgaagacg 4080
taagcactga cgacaacaat gaaaagaaga agataaggtc ggtgattgtg aaagagacat 4140
agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt aaccttatca caaaggaatc 4200
ttatccccca ctacttatcc ttttatattt ttccgtgtca tttttgccct tgagttttcc 4260
tatataagga accaagttcg gcatttgtga aaacaagaaa aaatttggtg taagctattt 4320
tctttgaagt actgaggata caacttcaga gaaatttgta agtttgtaat gtctccggag 4380
aggagaccag ttgagattag gccagctaca gcagctgata tggccgcggt ttgtgatatc 4440
gttaaccatt acattgagac gtctacagtg aactttagga cagagccaca aacaccacaa 4500
gagtggattg atgatctcga gaggttgcaa gatagatacc cttggttggt tgctgaggtt 4560
gagggtgttg tggctggtat tgcttacgct gggccctgga aggctaggaa cgcttacgat 4620
tggacagttg agagtactgt ttacgtgtca cataggcatc aaaggttggg cctaggatcc 4680
acattgtaca cacatttgct taagtctatg gaggcgcaag gttttaagtc tgtggttgct 4740
gttataggcc ttccaaacga tccatctgtt aggttgcatg aggctttggg atacacagcc 4800
cggggtacat tgcgcgcagc tggatacaag catggtggat ggcatgatgt tggtttttgg 4860
caaagggatt ttgagttgcc agctcctcca aggccagtta ggccagttac ccagatctaa 4920
tatcaaaatc tatttagaaa tacacaatat tttgttgcag gcttgctgga gaatcgatct 4980
gctatcataa aaattacaaa aaaattttat ttgcctcaat tattttagga ttggtattaa 5040
ggacgcttaa attatttgtc gggtcactac gcatcattgt gattgagaag atcagcgata 5100
cgaaatattc gtagtactat cgataattta tttgaaaatt cataagaaaa gcaaacgtta 5160
catgaattga tgaaacaata caaagacaga taaagccacg cacatttagg atattggccg 5220
agattactga atattgagta agatcacgga atttctgaca ggagcatgtc ttcaattcag 5280
cccaaatggc agttgaaata ctcaaaccgc cccatatgca ggagcggatc attcattgtt 5340
tgtttggttg cctttgccaa catgggagtc caaggttgca tgccagggct gcgtcctaac 5400
cggcgtctgg gtcatagccc acgagtgcgg ccaccacgcc ttcagcgact accagtggct 5460
ggacgacacc gtcggcctca tcttccactc cttcctcctc gtcccttact tctcctggaa 5520
gtacagtcat cgacgccacc attccaacac tggctccctc gagagagacg aagtgtttgt 5580
ccccaagaag aagtcagaca tcaagtggta cggcaagtac ctcaacaacc ctttgggacg 5640
caccgtgatg ttaacggttc agttcactct cggctggcct ttgtacttag ccttcaacgt 5700
ctcggggaga ccttacgacg gcggcttcgc ttgccatttc caccccaacg ctcccatcta 5760
caacgaccgt gagcgtctcc agatatacat ctccgacgct ggcatcctcg ccgtctgcta 5820
cggtctctac cgctacgctg ctgtccaagg agttgcctcg atggtctgct tctacggagt 5880
tcctcttctg attgtcaacg ggttcttagt tttgatcact tacttgcagc acacgcatcc 5940
ttccctgcct cactatgact cgtctgagtg ggattggttg aggggagctt tggccaccgt 6000
tgacagagac tacggaatct tgaacaaggt cttccacaat atcacggaca cgcacgtggc 6060
gcatcacctg ttctcgacca tgccgcatta tcacgcgatg gaagctacga aggcgataaa 6120
gccgatactg ggagagtatt atcagttcga tgggacgccg gtggttaagg cgatgtggag 6180
ggaggcgaag gagtgtatct atgtggaacc ggacaggcaa ggtgagaaga aaggtgtgtt 6240
ctggtacaac aataagttat gaagcaaaga agaaactgaa cctttctcat ctatgattgt 6300
ctttgtttta agaagctatg tttctgtttc aataatcttt aattatccat tttgttgtgt 6360
tttctgacat tttggctaaa atggcgccac ccagctttct tgtacaaagt ggtcccctta 6420
attaactggg cctcatgggc cttccgctca ctgcccgctt tccagtcggg aaacctgtcg 6480
tgccagctgc attaacatgg tcatagctgt ttccttgcgt attgggcgct ctccgcttcc 6540
tcgctcactg actcgctgcg ctcggtcgtt cgggtaaagc ctggggtgcc taatgagcaa 6600
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 6660
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 6720
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 6780
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 6840
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 6900
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 6960
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 7020
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 7080
acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 7140
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 7200
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 7260
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 7320
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 7380
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 7440
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 7500
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gaaccacgct 7560
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 7620
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 7680
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 7740
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 7800
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 7860
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 7920
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 7980
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 8040
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 8100
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 8160
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 8220
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 8280
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 8340
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccaccta 8400
aattgtaagc gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt 8460
ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat 8520
agggttgagt ggccgctaca gggcgctccc attcgccatt caggctgcgc aactgttggg 8580
aagggcgttt cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 8640
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 8700
gccagtgagc gcgacgtaat acgactcact atagggcgaa ttggcggaag gccgtcaagg 8760
ccgcatggcg cgcc 8774
<210> 210
<211> 9491
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 210
ggggacaagt ttgtacaaaa aagcaggctg cggccgcgaa atatccttcc tattcaaagt 60
tatatatatt tgtttacttt tgttttagat ctggacctga gacatgtaag tacatatttg 120
ttgaatcttt gggtaaaaac ttatgtctct gggtaaaatt tgctgagaga tttgaccgat 180
tcctattggc tctggattct gtagttacct aatacatgaa aaagtttcat ttggcctatg 240
ctcacttcat gcttataaac tttttcttgc aaattaattg gattagatgc tccttcatag 300
attcagatgc aatagatttg catgaagaaa ataataggat tcatgatagt aaaaagattg 360
tatttttgtt tgtttgttta tgtttaaaag tctatatgtt gacaatagag ttgctatcaa 420
ctgtttcatt taggtttatg tttttgtcaa gttgcttatt ctaagagaca ttgtgattat 480
gacttgtctt ctctaacgta gtttagtaat aaaagacgaa agaaattgat atccacaaga 540
aagagatgta agctgtaacg tatcaaatct cattaataac tagtagtatt ctcaacgcta 600
tcgtttattt ctttctttgg tttgccacta tatgccgctt ctctgctctt tatcccacgt 660
actatccatt ttttttgtgg tagtccattt ttttgaaact ttaataacgt aacactgaat 720
attaatttgt tggtttaatt aactttgagt ctttgctttt ggtttatgca gaaacatggg 780
tgcaggtgga agaatgcaag tgtctcctcc ctccaaaaag tctgaaaccg acaacatcaa 840
gcgcgtaccc tgcgagacac cgcccttcac tgtcggagaa ctcaagaaag caatcccacc 900
gcactgtttc aaacgctcga tccctcgctc tttctcctac ctcatctggg acatcatcat 960
agcctcctgc ttctactacg tcgccaccac ttacttccct ctcctccctc accctctctc 1020
ctacttcgcc tggcctctct actgggccgg taccgtcgac gacgacctgc aggtcaacgg 1080
atcaggatat tcttgtttaa gatgttgaac tctatggagg tttgtatgaa ctgatgatct 1140
aggaccggat aagttccctt cttcatagcg aacttattca aagaatgttt tgtgtatcat 1200
tcttgttaca ttgttattaa tgaaaaaata ttattggtca ttggactgaa cacgagtgtt 1260
aaatatggac caggccccaa ataagatcca ttgatatatg aattaaataa caagaataaa 1320
tcgagtcacc aaaccacttg ccttttttaa cgagacttgt tcaccaactt gatacaaaag 1380
tcattatcct atgcaaatca ataatcatac aaaaatatcc aataacacta aaaaattaaa 1440
agaaatggat aatttcacaa tatgttatac gataaagaag ttacttttcc aagaaattca 1500
ctgattttat aagcccactt gcattagata aatggcaaaa aaaaacaaaa aggaaaagaa 1560
ataaagcacg aagaattcta gaaaatacga aatacgcttc aatgcagtgg gacccacggt 1620
tcaattattg ccaattttca gctccaccgt atatttaaaa aataaaacga taatgctaaa 1680
aaaatataaa tcgtaacgat cgttaaatct caacggctgg atcttatgac gaccgttaga 1740
aattgtggtt gacgacgagt cagtaataaa cggcgtcaaa gtggttgcag ccggcacaca 1800
cgagtcgtgt ttatcaactc aaagcacaaa tacttttcct caacctaaaa ataaggcaat 1860
tagccaaaaa caactttgcg tgtaaacaac gctcaataca cgtgtcattt tattattagc 1920
tattgcttca ccgccttagc tttctcgtga cctagtcgtc ctcgtctttt cttcttcttc 1980
ttctataaaa caatacccaa agagctcttc ttcttcacaa ttcagatttc aatttctcaa 2040
aatcttaaaa actttctctc aattctctct accgtgatca aggtaaattt ctgtgttcct 2100
tattctctca aaatcttcga ttttgttttc gttcgatccc aatttcgtat atgttctttg 2160
gtttagattc tgttaatctt agatcgaaga cgattttctg ggtttgatcg ttagatatca 2220
tcttaattct cgattagggt ttcatagata tcatccgatt tgttcaaata atttgagttt 2280
tgtcgaataa ttactcttcg atttgtgatt tctatctaga tctggtgtta gtttctagtt 2340
tgtgcgatcg aatttgtcga ttaatctgag tttttctgat taacagatgg ctcaatctag 2400
cagaatctgc cacggtgtgc agaacccatg tgtgatcatt tccaatctct ccaaatccaa 2460
ccagaacaaa tctcctttct cagtcagcct caagactcac cagcagcagc gtcgtgctta 2520
ccagatatct agctggggat tgaagaagtc aaacaacggg tccgtgattc gtccggttaa 2580
ggcagctgca agagggatgc cagccttgtc tttacctgga tcaaagagta tcacagctag 2640
ggcactcttt cttgctgctg ctgctgatgg ggttactact ttggtgaggc cattgagaag 2700
tgacgacaca gaaggattcg ctgaggggtt agttcgttta ggctatcgtg tagggaggac 2760
acccgatact tggcaagtcg atggcagacc acaaggacca gcagtggctg aggctgacgt 2820
ctactgtaga gacggagcaa ccaccgctag attcttgcca accttagcag ctgctggtca 2880
cggaacatac agatttgatg cttcaccaca gatgaggaga cgtcctcttt tgcccttaag 2940
cagagccttg agggatttgg gtgtcgatct tagacacgaa gaagctgaag gtcatcaccc 3000
tctgactgtc cgtgctgctg gggttgaagg aggagaggtt actttggatg ctggtcagtc 3060
aagtcagtat ctcactgcct tgttgctcct tggtcccctt acaagacaag gactgaggat 3120
aagggttact gatttggtgt cagcaccata cgtggagatt acgcttgcaa tgatgagggc 3180
tttcggagtt gaagtggcaa gggagggaga tgtgttcgtt gttccacctg gtggatatcg 3240
tgcaactacg tatgctatag aacccgacgc aagtactgct tcttacttct tcgcagctgc 3300
tgctttgact cctggagctg aagtgactgt acctgggtta ggcacgggag cacttcaagg 3360
agatttggga tttgtagatg tcttaaggag aatgggagcc gaggtgtccg taggagctga 3420
tgcaaccact gttagaggaa ctggtgaatt gcgtggcctt acagccaaca tgagagacat 3480
aagtgatacg atgccgaccc tcgctgcaat agcacccttt gctagtgctc cagttagaat 3540
cgaggatgtt gccaacactc gtgtcaaaga atgtgacaga cttgaggctt gtgcagagaa 3600
ccttaggagg ttgggagtaa gggttgcaac gggtccggac tggattgaga tacaccctgg 3660
tccagctact ggtgctcaag tcacaagcta tggtgatcac agaattgtga tgtcatttgc 3720
agtgactgga cttcgtgtgc ctgggatcag cttcgacgac cctggctgtg ttcgtaagac 3780
ttttcctggg tttcacgagg ctttcgcaga attgaggcgt ggcattggga gctgatgagt 3840
agttagctta atcacctaag atcggcggca atagcttctt agcgccatcc cgggttgatc 3900
ctatctgtgt tgaaatagtt gcggtgggca aggctctctt tcagaaagac aggcggccaa 3960
aggaacccaa ggtgaggtgg gctatggctc tcagttcctt gtggaagcgc ttggtctaag 4020
gtgcagaggt gttagcggga tgaagcaaaa gtgtccgatt gtaacaagat atgttgatcc 4080
tacgtaagga tattaaagta tgtattcatc actaatataa tcagtgtatt ccaatatgta 4140
ctacgatttc caatgtcttt attgtcgccg tatgtaatcg gcgtcacaaa ataatccccg 4200
gtgactttct tttaatccag gatgaaataa tatgttatta taatttttgc gatttggtcc 4260
gttataggaa ttgaagtgtg cttgcggtcg ccaccactcc catttcataa ttttacatgt 4320
atttgaaaaa taaaaattta tggtattcaa tttaaacacg tatacttgta aagaatgata 4380
tcttgaaaga aatatagttt aaatatttat tgataaaata acaagtcagg tattatagtc 4440
caagcaaaaa cataaattta ttgatgcaag tttaaattca gaaatatttc aataactgat 4500
tatatcagct ggtacattgc cgtagatgaa agactgagtg cgatattatg gtgtaataca 4560
tacggccgcc agaaggtaat tatccaagat gtagcatcaa gaatccaatg tttacgggaa 4620
aaactatgga agtattatgt aagctcagca agaagcagat caatatgcgg cacatatgca 4680
acctatgttc aaaaatgaag aatgtacaga tacaagatcc tatactgcca gaatacgaag 4740
aagaatacgt agaaattgaa aaagaagaac caggcgaaga aaagaatctt gaagacgtaa 4800
gcactgacga caacaatgaa aagaagaaga taaggtcggt gattgtgaaa gagacataga 4860
ggacacatgt aaggtggaaa atgtaagggc ggaaagtaac cttatcacaa aggaatctta 4920
tcccccacta cttatccttt tatatttttc cgtgtcattt ttgcccttga gttttcctat 4980
ataaggaacc aagttcggca tttgtgaaaa caagaaaaaa tttggtgtaa gctattttct 5040
ttgaagtact gaggatacaa cttcagagaa atttgtaagt ttgtaatgtc tccggagagg 5100
agaccagttg agattaggcc agctacagca gctgatatgg ccgcggtttg tgatatcgtt 5160
aaccattaca ttgagacgtc tacagtgaac tttaggacag agccacaaac accacaagag 5220
tggattgatg atctcgagag gttgcaagat agataccctt ggttggttgc tgaggttgag 5280
ggtgttgtgg ctggtattgc ttacgctggg ccctggaagg ctaggaacgc ttacgattgg 5340
acagttgaga gtactgttta cgtgtcacat aggcatcaaa ggttgggcct aggatccaca 5400
ttgtacacac atttgcttaa gtctatggag gcgcaaggtt ttaagtctgt ggttgctgtt 5460
ataggccttc caaacgatcc atctgttagg ttgcatgagg ctttgggata cacagcccgg 5520
ggtacattgc gcgcagctgg atacaagcat ggtggatggc atgatgttgg tttttggcaa 5580
agggattttg agttgccagc tcctccaagg ccagttaggc cagttaccca gatctaatat 5640
caaaatctat ttagaaatac acaatatttt gttgcaggct tgctggagaa tcgatctgct 5700
atcataaaaa ttacaaaaaa attttatttg cctcaattat tttaggattg gtattaagga 5760
cgcttaaatt atttgtcggg tcactacgca tcattgtgat tgagaagatc agcgatacga 5820
aatattcgta gtactatcga taatttattt gaaaattcat aagaaaagca aacgttacat 5880
gaattgatga aacaatacaa agacagataa agccacgcac atttaggata ttggccgaga 5940
ttactgaata ttgagtaaga tcacggaatt tctgacagga gcatgtcttc aattcagccc 6000
aaatggcagt tgaaatactc aaaccgcccc atatgcagga gcggatcatt cattgtttgt 6060
ttggttgcct ttgccaacat gggagtccaa ggttgcatgc cagggctgcg tcctaaccgg 6120
cgtctgggtc atagcccacg agtgcggcca ccacgccttc agcgactacc agtggctgga 6180
cgacaccgtc ggcctcatct tccactcctt cctcctcgtc ccttacttct cctggaagta 6240
cagtcatcga cgccaccatt ccaacactgg ctccctcgag agagacgaag tgtttgtccc 6300
caagaagaag tcagacatca agtggtacgg caagtacctc aacaaccctt tgggacgcac 6360
cgtgatgtta acggttcagt tcactctcgg ctggcctttg tacttagcct tcaacgtctc 6420
ggggagacct tacgacggcg gcttcgcttg ccatttccac cccaacgctc ccatctacaa 6480
cgaccgtgag cgtctccaga tatacatctc cgacgctggc atcctcgccg tctgctacgg 6540
tctctaccgc tacgctgctg tccaaggagt tgcctcgatg gtctgcttct acggagttcc 6600
tcttctgatt gtcaacgggt tcttagtttt gatcacttac ttgcagcaca cgcatccttc 6660
cctgcctcac tatgactcgt ctgagtggga ttggttgagg ggagctttgg ccaccgttga 6720
cagagactac ggaatcttga acaaggtctt ccacaatatc acggacacgc acgtggcgca 6780
tcacctgttc tcgaccatgc cgcattatca cgcgatggaa gctacgaagg cgataaagcc 6840
gatactggga gagtattatc agttcgatgg gacgccggtg gttaaggcga tgtggaggga 6900
ggcgaaggag tgtatctatg tggaaccgga caggcaaggt gagaagaaag gtgtgttctg 6960
gtacaacaat aagttatgaa gcaaagaaga aactgaacct ttctcatcta tgattgtctt 7020
tgttttaaga agctatgttt ctgtttcaat aatctttaat tatccatttt gttgtgtttt 7080
ctgacatttt ggctaaaatg gcgccaccca gctttcttgt acaaagtggt ccccttaatt 7140
aactgggcct catgggcctt ccgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 7200
cagctgcatt aacatggtca tagctgtttc cttgcgtatt gggcgctctc cgcttcctcg 7260
ctcactgact cgctgcgctc ggtcgttcgg gtaaagcctg gggtgcctaa tgagcaaaag 7320
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7380
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7440
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7500
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 7560
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 7620
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 7680
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 7740
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 7800
ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 7860
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 7920
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 7980
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 8040
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 8100
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 8160
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 8220
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagaa ccacgctcac 8280
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 8340
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 8400
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 8460
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 8520
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 8580
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 8640
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 8700
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 8760
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 8820
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 8880
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 8940
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 9000
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9060
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctaaat 9120
tgtaagcgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt 9180
taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg 9240
gttgagtggc cgctacaggg cgctcccatt cgccattcag gctgcgcaac tgttgggaag 9300
ggcgtttcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca 9360
aggcgattaa gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggcc 9420
agtgagcgcg acgtaatacg actcactata gggcgaattg gcggaaggcc gtcaaggccg 9480
catggcgcgc c 9491
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<400> 215
000
<210> 216
<400> 216
000
<210> 217
<400> 217
000
<210> 218
<400> 218
000
<210> 219
<400> 219
000
<210> 220
<400> 220
000
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<400> 230
000
<210> 231
<400> 231
000
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<400> 300
000
<210> 301
<400> 301
000
<210> 302
<400> 302
000
<210> 303
<400> 303
000
<210> 304
<400> 304
000
<210> 305
<400> 305
000
<210> 306
<400> 306
000
<210> 307
<400> 307
000
<210> 308
<400> 308
000
<210> 309
<400> 309
000
<210> 310
<400> 310
000
<210> 311
<400> 311
000
<210> 312
<400> 312
000
<210> 313
<400> 313
000
<210> 314
<400> 314
000
<210> 315
<400> 315
000
<210> 316
<400> 316
000
<210> 317
<400> 317
000
<210> 318
<400> 318
000
<210> 319
<400> 319
000
<210> 320
<400> 320
000
<210> 321
<400> 321
000
<210> 322
<400> 322
000
<210> 323
<400> 323
000
<210> 324
<400> 324
000
<210> 325
<400> 325
000
<210> 326
<400> 326
000
<210> 327
<400> 327
000
<210> 328
<400> 328
000
<210> 329
<400> 329
000
<210> 330
<400> 330
000
<210> 331
<400> 331
000
<210> 332
<400> 332
000
<210> 333
<400> 333
000
<210> 334
<400> 334
000
<210> 335
<400> 335
000
<210> 336
<400> 336
000
<210> 337
<400> 337
000
<210> 338
<400> 338
000
<210> 339
<400> 339
000
<210> 340
<400> 340
000
<210> 341
<400> 341
000
<210> 342
<400> 342
000
<210> 343
<400> 343
000
<210> 344
<400> 344
000
<210> 345
<400> 345
000
<210> 346
<400> 346
000
<210> 347
<400> 347
000
<210> 348
<400> 348
000
<210> 349
<400> 349
000
<210> 350
<400> 350
000
<210> 351
<400> 351
000
<210> 352
<400> 352
000
<210> 353
<400> 353
000
<210> 354
<400> 354
000
<210> 355
<400> 355
000
<210> 356
<400> 356
000
<210> 357
<400> 357
000
<210> 358
<400> 358
000
<210> 359
<400> 359
000
<210> 360
<400> 360
000
<210> 361
<400> 361
000
<210> 362
<400> 362
000
<210> 363
<400> 363
000
<210> 364
<400> 364
000
<210> 365
<400> 365
000
<210> 366
<400> 366
000
<210> 367
<400> 367
000
<210> 368
<400> 368
000
<210> 369
<400> 369
000
<210> 370
<400> 370
000
<210> 371
<400> 371
000
<210> 372
<400> 372
000
<210> 373
<400> 373
000
<210> 374
<400> 374
000
<210> 375
<400> 375
000
<210> 376
<400> 376
000
<210> 377
<400> 377
000
<210> 378
<400> 378
000
<210> 379
<400> 379
000
<210> 380
<400> 380
000
<210> 381
<400> 381
000
<210> 382
<400> 382
000
<210> 383
<400> 383
000
<210> 384
<400> 384
000
<210> 385
<400> 385
000
<210> 386
<400> 386
000
<210> 387
<400> 387
000
<210> 388
<400> 388
000
<210> 389
<400> 389
000
<210> 390
<400> 390
000
<210> 391
<400> 391
000
<210> 392
<400> 392
000
<210> 393
<400> 393
000
<210> 394
<400> 394
000
<210> 395
<400> 395
000
<210> 396
<400> 396
000
<210> 397
<400> 397
000
<210> 398
<400> 398
000
<210> 399
<400> 399
000
<210> 400
<400> 400
000
<210> 401
<400> 401
000
<210> 402
<400> 402
000
<210> 403
<400> 403
000
<210> 404
<400> 404
000
<210> 405
<400> 405
000
<210> 406
<400> 406
000
<210> 407
<400> 407
000
<210> 408
<400> 408
000
<210> 409
<400> 409
000
<210> 410
<400> 410
000
<210> 411
<400> 411
000
<210> 412
<400> 412
000
<210> 413
<400> 413
000
<210> 414
<400> 414
000
<210> 415
<400> 415
000
<210> 416
<400> 416
000
<210> 417
<400> 417
000
<210> 418
<400> 418
000
<210> 419
<400> 419
000
<210> 420
<400> 420
000
<210> 421
<400> 421
000
<210> 422
<400> 422
000
<210> 423
<400> 423
000
<210> 424
<400> 424
000
<210> 425
<400> 425
000
<210> 426
<400> 426
000
<210> 427
<400> 427
000
<210> 428
<400> 428
000
<210> 429
<400> 429
000
<210> 430
<400> 430
000
<210> 431
<400> 431
000
<210> 432
<400> 432
000
<210> 433
<400> 433
000
<210> 434
<400> 434
000
<210> 435
<400> 435
000
<210> 436
<400> 436
000
<210> 437
<400> 437
000
<210> 438
<400> 438
000
<210> 439
<400> 439
000
<210> 440
<400> 440
000
<210> 441
<400> 441
000
<210> 442
<400> 442
000
<210> 443
<400> 443
000
<210> 444
<400> 444
000
<210> 445
<400> 445
000
<210> 446
<400> 446
000
<210> 447
<400> 447
000
<210> 448
<400> 448
000
<210> 449
<400> 449
000
<210> 450
<400> 450
000
<210> 451
<400> 451
000
<210> 452
<400> 452
000
<210> 453
<400> 453
000
<210> 454
<400> 454
000
<210> 455
<400> 455
000
<210> 456
<400> 456
000
<210> 457
<400> 457
000
<210> 458
<400> 458
000
<210> 459
<400> 459
000
<210> 460
<400> 460
000
<210> 461
<400> 461
000
<210> 462
<400> 462
000
<210> 463
<400> 463
000
<210> 464
<400> 464
000
<210> 465
<400> 465
000
<210> 466
<400> 466
000
<210> 467
<400> 467
000
<210> 468
<400> 468
000
<210> 469
<400> 469
000
<210> 470
<400> 470
000
<210> 471
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 471
gacatcaagt ggtacggcaa gtacctcaac aacccgctag gacgcacggt gatgctaacc 60
gtccagttca agctcggctg gccgttgtac ttagccttca acgtctcggg aagacctta 119
<210> 472
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 472
gacatcaagt ggtacggaaa gtacctcaac aacccgctag gacgcacggt gatgctaacc 60
gtccagttca cgctcggctg gccgttgtac ttagccttca acgtctctgg aagacctta 119
<210> 473
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 473
gacatcaagt ggtacggcaa gtacctcaac aaccctttgg gacgcaccgt gatgttaacg 60
gttcagttca ctctcggctg gcctttgtac ttagccttca acgtctcggg gagacctta 119
<210> 474
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成多核苷酸
<400> 474
gacatcaagt ggtacggcaa gtacctcaac aaccctttgg gacgcaccgt gatgttaacg 60
gttcagttca ctctcggctg gccgttgtac ttagccttca acgtctcggg aagacctta 119
<210> 475
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 475
cagacatcaa gtggtacggc 20
<210> 476
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 476
acggcaagta cctcaacaac cctttggg 28
<210> 477
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 477
cgcaccgtga tgttaacggt tcagttca 28
<210> 478
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 478
cggcaagtac ctcaacaacc ctttggga 28
<210> 479
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 479
accgtgatgt taacggttca gttcactc 28
<210> 480
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述:合成寡核苷酸
<400> 480
cttagccttc aacgtctcgg g 21
1

Claims (10)

1.一种修饰细胞的基因组的方法,该方法包括:
以位点特异性方式剪切细胞中的FAD2基因中的靶位点,从而在该FAD2基因中产生断裂;
其中该FAD2基因在剪切之后被修饰。
2.权利要求1的方法,其中该方法进一步包括向该断裂中整合感兴趣的核酸序列。
3.根据权利要求1或权利要求2的方法,其中所述FAD2基因是FAD2A,FAD2A’,FAD2C和/或FAD2C’基因。
4.根据权利要求1-3中任一项的方法,其中位点特异性方式的剪切包括向细胞内引入融合蛋白或编码融合蛋白的多核苷酸,所述融合蛋白包含DNA结合结构域以及剪切结构域或剪切半结构域,其中该融合蛋白与所述靶位点特异性结合,并在靶位点处或其附近进行剪切从而产生断裂。
5.根据权利要求4的方法,其中该DNA结合结构域选自下组:大范围核酸酶DNA结合结构域,亮氨酸拉链DNA结合结构域,转录激活因子样(TAL)DNA结合结构域,RNA指导的CRISPR-Cas9,重组酶,锌指蛋白DNA结合结构域,和前述者的任何嵌合组合。
6.根据权利要求4或权利要求5的方法,其中该剪切结构域或剪切半结构域选自下组:来自IIS型限制性核酸内切酶的剪切半结构域,来自FokI核酸内切酶的剪切半结构域,来自StsI核酸内切酶的剪切半结构域,和归巢核酸内切酶。
7.根据权利要求4-6中任一项的方法,其中该融合蛋白是锌指核酸酶。
8.根据权利要求7的方法,其中该锌指核酸酶包括3-6个锌指结构域,每个锌指结构域包括识别螺旋区,其中该锌指蛋白包括在表3的单一行中排序并显示的识别螺旋区。
9.根据权利要求1-8中任一项的方法,其中位点特异性方式的剪切是对FAD2A,FAD2A’,FAD2C和/或FAD2C’的一些拷贝但非所有拷贝特异性的。
10.根据权利要求1-9中任一项的方法,其中该靶位点选自下组:SEQ ID NO:22-26,和SEQ ID NO:28-33和SEQ ID NO:35-38。
CN201910657212.XA 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 Pending CN110684806A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261697886P 2012-09-07 2012-09-07
US61/697,886 2012-09-07
CN201380058051.3A CN105025702A (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380058051.3A Division CN105025702A (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白

Publications (1)

Publication Number Publication Date
CN110684806A true CN110684806A (zh) 2020-01-14

Family

ID=50237761

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201910657212.XA Pending CN110684806A (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
CN201380058037.3A Active CN104780756B (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
CN201810150784.4A Active CN108610408B (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
CN201380058051.3A Pending CN105025702A (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN201380058037.3A Active CN104780756B (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
CN201810150784.4A Active CN108610408B (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
CN201380058051.3A Pending CN105025702A (zh) 2012-09-07 2013-09-05 Fad2性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白

Country Status (20)

Country Link
US (5) US9963711B2 (zh)
EP (4) EP3431600B1 (zh)
JP (4) JP6704251B2 (zh)
KR (2) KR102147006B1 (zh)
CN (4) CN110684806A (zh)
AR (2) AR092481A1 (zh)
AU (2) AU2013312465B2 (zh)
BR (1) BR112015004980B1 (zh)
CA (2) CA2884084C (zh)
CL (2) CL2015000563A1 (zh)
HK (2) HK1212153A1 (zh)
IL (2) IL237537B (zh)
MX (2) MX352081B (zh)
NZ (1) NZ705742A (zh)
RU (2) RU2656158C2 (zh)
TW (1) TWI667348B (zh)
UA (1) UA118090C2 (zh)
UY (3) UY35021A (zh)
WO (2) WO2014039702A2 (zh)
ZA (2) ZA201501397B (zh)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
UA116097C2 (uk) 2011-12-11 2018-02-12 Зе Стейт Оф Ізраел, Міністрі Оф Агрікалче Енд Руерал Девелопмент, Агрікалчерал Рісьоч Організейшн, (А.Р.О.), Волкані Сентре Спосіб модуляції провідності устячка рослини
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
US20150225734A1 (en) 2012-06-19 2015-08-13 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
CN105264067B (zh) 2012-09-07 2020-11-10 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
CN116064533A (zh) * 2012-10-23 2023-05-05 基因工具股份有限公司 用于切割靶dna的组合物及其用途
CN104968193B (zh) 2012-11-01 2021-02-09 塞尔克蒂斯股份有限公司 用于生成治疗性蛋白质的植物
KR101844123B1 (ko) 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
WO2014096972A2 (en) 2012-12-21 2014-06-26 Cellectis Potatoes with reduced cold-induced sweetening
ES2901396T3 (es) 2013-03-14 2022-03-22 Caribou Biosciences Inc Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico
BR112015022778B1 (pt) * 2013-03-15 2023-04-11 Cellectis Método para a produção de uma planta de soja, método para a obtenção de óleo de soja apresentando teor de ácido oleico aumentado e teor de ácido linoleico reduzido e método para gerar uma planta de soja
US10113162B2 (en) 2013-03-15 2018-10-30 Cellectis Modifying soybean oil composition through targeted knockout of the FAD2-1A/1B genes
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
CN106459995B (zh) 2013-11-07 2020-02-21 爱迪塔斯医药有限公司 使用统治型gRNA的CRISPR相关方法和组合物
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
CA2952906A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
SG11201701245QA (en) 2014-08-27 2017-03-30 Caribou Biosciences Inc Methods for increasing cas9-mediated engineering efficiency
CA2969619A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
CN113388670B (zh) * 2015-01-09 2024-02-02 生物辐射实验室股份有限公司 检测基因组编辑
EP3280803B1 (en) 2015-04-06 2021-05-26 The Board of Trustees of the Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
WO2016174119A1 (en) * 2015-04-28 2016-11-03 Bayer Cropscience Nv Brassica plants with modified seed oil composition
US10837024B2 (en) 2015-09-17 2020-11-17 Cellectis Modifying messenger RNA stability in plant transformations
IL258821B (en) 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
EP3410843A1 (en) 2016-02-02 2018-12-12 Cellectis Modifying soybean oil composition through targeted knockout of the fad3a/b/c genes
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
IL263595B2 (en) * 2016-06-20 2023-11-01 Keygene Nv A method for targeted modification of DNA in plant cells
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018045321A1 (en) * 2016-09-02 2018-03-08 North Carolina State University Methods and compositions for modification of plastid genomes
GB2573062A (en) 2016-10-14 2019-10-23 Harvard College AAV delivery of nucleobase editors
WO2018081978A1 (zh) * 2016-11-03 2018-05-11 深圳华大基因研究院 提高基因编辑效率的方法和系统
CA3042857A1 (en) 2016-11-16 2018-05-24 Cellectis Methods for altering amino acid content in plants through frameshift mutations
EA202091316A1 (ru) * 2016-12-22 2020-08-18 Тулджин Инкорпорейтид Обогащенный олеиновой кислотой растительный организм, имеющий генетически модифицированный fad2, и способ его получения
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2018198049A1 (en) 2017-04-25 2018-11-01 Cellectis Alfalfa with reduced lignin composition
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN107217070A (zh) * 2017-05-22 2017-09-29 广东省农业科学院作物研究所 一种基于TALENs基因编辑花生育种方法
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN107502621B (zh) * 2017-09-22 2021-04-13 福建农林大学 一种快速检测体内dna末端连接的方法
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
WO2019173125A1 (en) * 2018-03-09 2019-09-12 Pioneer Hi-Bred International, Inc. Compositions and methods for modification of fatty acids in soybean
EP3829292A4 (en) * 2018-06-01 2022-06-08 Pioneer Hi-Bred International, Inc. BRASSICA GENOME EDITING SYSTEMS AND METHODS
CN109182373B (zh) * 2018-09-18 2020-10-09 武汉市农业科学院 一种利用基因编辑技术获得高油酸油菜的方法
AU2019369418A1 (en) * 2018-10-31 2021-03-18 Pioneer Hi-Bred International, Inc. Compositions and methods for Ochrobactrum-mediated gene editing
WO2020097026A1 (en) * 2018-11-05 2020-05-14 University Of Tennessee Research Foundation High throughput protoplast isolation and transformation of plant cells from a novel leaf-based cell culture-derived system
WO2020191153A2 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN110004173B (zh) * 2019-04-08 2023-03-14 天津吉诺沃生物科技有限公司 一种获得非转基因耐储存鲜食枸杞的方法
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
US11884915B2 (en) 2021-09-10 2024-01-30 Agilent Technologies, Inc. Guide RNAs with chemical modification for prime editing
WO2023163946A1 (en) * 2022-02-22 2023-08-31 Peter Biotherapeutics, Inc. Technologies for genetic modification

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003060092A2 (en) * 2002-01-14 2003-07-24 Brookhaven Science Associates, Llc Modified fatty acid hydroxylase protein and genes
WO2004070035A2 (en) * 2003-02-03 2004-08-19 Sungene Gmbh & Co. Kgaa Method for increasing efficiency of homologous recombination in plants
US20110167521A1 (en) * 2009-10-22 2011-07-07 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
US20110301073A1 (en) * 2010-05-17 2011-12-08 Sangamo Biosciences, Inc. Novel DNA-binding proteins and uses thereof

Family Cites Families (167)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US789538A (en) 1904-11-11 1905-05-09 Colin E Ham Dumb-bell.
US1173508A (en) 1913-10-27 1916-02-29 Oscar F Heartwell Jr Ironing-board.
US4178330A (en) 1977-08-29 1979-12-11 Velsicol Chemical Corporation Haloaryl halobenzenesulfonate flame retardants
US4179475A (en) 1978-05-11 1979-12-18 Phillips Petroleum Company Olefin feed in HF alkylation of isoparaffin with olefin
US4727028A (en) 1981-06-22 1988-02-23 Eli Lilly And Company Recombinant DNA cloning vectors and the eukaryotic and prokaryotic transformants thereof
US4693977A (en) 1982-08-23 1987-09-15 Queen's University At Kingston Enzyme immobilization for producing cephalosporin antibiotics
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5428147A (en) 1983-04-15 1995-06-27 Mycogen Plant Science, Inc. Octopine T-DNA promoters
NZ207765A (en) 1983-04-15 1987-03-06 Lubrizol Genetics Inc Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp
US5447858A (en) 1984-04-13 1995-09-05 Mycogen Plant Sciences, Inc. Heat shock promoter and gene
US4943674A (en) 1987-05-26 1990-07-24 Calgene, Inc. Fruit specific transcriptional factors
US5753475A (en) 1985-01-17 1998-05-19 Calgene, Inc. Methods and compositions for regulated transcription and expression of heterologous genes
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
US4886937A (en) 1985-05-20 1989-12-12 North Carolina State University Method for transforming pine
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
DE3765449D1 (de) 1986-03-11 1990-11-15 Plant Genetic Systems Nv Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
EP0270496B1 (de) 1986-12-05 1993-03-17 Ciba-Geigy Ag Verbessertes Verfahren zur Transformation von pflanzlichen Protoplasten
US5359142A (en) 1987-01-13 1994-10-25 Monsanto Company Method for enhanced expression of a protein
US5322938A (en) 1987-01-13 1994-06-21 Monsanto Company DNA sequence for enhancing the efficiency of transcription
EP0333033A1 (en) 1988-03-09 1989-09-20 Meiji Seika Kaisha Ltd. Glutamine synthesis gene and glutamine synthetase
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US6051753A (en) 1989-09-07 2000-04-18 Calgene, Inc. Figwort mosaic virus promoter and uses
DK0426641T3 (da) 1989-10-31 2000-10-23 Monsanto Co Promotor til transgene planter
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5266317A (en) 1990-10-04 1993-11-30 University Of Georgia Research Foundation, Inc. Insect-specific paralytic neurotoxin genes for use in biological insect control: methods and compositions
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
GB9104617D0 (en) 1991-03-05 1991-04-17 Nickerson Int Seed Pest control
GB9115909D0 (en) 1991-07-23 1991-09-04 Nickerson Int Seed Recombinant dna
DK39692D0 (da) 1992-03-25 1992-03-25 Danisco Biologisk materiale
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
ATE398679T1 (de) 1992-07-07 2008-07-15 Japan Tobacco Inc Verfahren zur transformation einer monokotyledon pflanze
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5607914A (en) 1993-01-13 1997-03-04 Pioneer Hi-Bred International, Inc. Synthetic antimicrobial peptides
US6118047A (en) 1993-08-25 2000-09-12 Dekalb Genetic Corporation Anthranilate synthase gene and method of use thereof for conferring tryptophan overproduction
US5362865A (en) 1993-09-02 1994-11-08 Monsanto Company Enhanced expression in plants using non-translated leader sequences
US5580852A (en) 1993-12-17 1996-12-03 Pioneer Hi-Bred International, Inc. Derivatives of tachyplesin having inhibitory activity towards plant pathogenic fungi
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
WO1995019431A1 (en) 1994-01-18 1995-07-20 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
JP4118327B2 (ja) 1994-08-20 2008-07-16 ゲンダック・リミテッド Dna認識のための結合タンパク質におけるまたはそれに関連する改良
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5994627A (en) 1995-03-31 1999-11-30 Common Wealth Scientific And Industrial Research Organisation Genetic sequences conferring nematode resistance in plants and uses therefor
US5639463A (en) 1995-05-23 1997-06-17 The Mennen Company Clear cosmetic stick composition
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
US5850019A (en) 1996-08-06 1998-12-15 University Of Kentucky Research Foundation Promoter (FLt) for the full-length transcript of peanut chlorotic streak caulimovirus (PCLSV) and expression of chimeric genes in plants
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
CA2236770A1 (en) 1996-09-05 1998-03-12 Unilever Plc Salt-inducible promoter derivable from a lactic acid bacterium, and its use in a lactic acid bacterium for production of a desired protein
WO1998027878A1 (en) 1996-12-20 1998-07-02 Fundação E.J. Zerbini A prosthesis for thoracostomy and method for its implantation
AU720780B2 (en) 1997-01-20 2000-06-15 Plant Genetic Systems N.V. Pathogen-induced plant promoters
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
US5922564A (en) 1997-02-24 1999-07-13 Performance Plants, Inc. Phosphate-deficiency inducible promoter
US5925521A (en) 1997-03-31 1999-07-20 Incyte Pharmaceuticals, Inc. Human serine carboxypeptidase
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
WO1998056239A1 (en) * 1997-06-12 1998-12-17 Cargill, Incorporated Fatty acid desaturases and mutant sequences thereof
US6087166A (en) 1997-07-03 2000-07-11 Basf Aktiengesellschaft Transcriptional activators with graded transactivation potential
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
HUP0100787A3 (en) 1998-02-20 2003-04-28 Syngenta Ltd Pollen specific promoter
CA2315549A1 (en) 1998-02-26 1999-09-02 Pioneer Hi-Bred International, Inc. Family of maize pr-1 genes and promoters
ES2273127T3 (es) 1998-02-26 2007-05-01 Pioneer Hi-Bred International, Inc. Promotor alfa-tubulin 3-18 del maiz.
ATE466952T1 (de) 1998-03-02 2010-05-15 Massachusetts Inst Technology Poly-zinkfinger-proteine mit verbesserten linkern
US6635806B1 (en) 1998-05-14 2003-10-21 Dekalb Genetics Corporation Methods and compositions for expression of transgenes in plants
US6307123B1 (en) 1998-05-18 2001-10-23 Dekalb Genetics Corporation Methods and compositions for transgene identification
US6140815A (en) 1998-06-17 2000-10-31 Dover Instrument Corporation High stability spin stand platform
JP2000083680A (ja) 1998-07-16 2000-03-28 Nippon Paper Industries Co Ltd 光誘導型プロモ―タ―の制御下に置かれた不定芽再分化遺伝子を選抜マ―カ―遺伝子とする植物への遺伝子導入方法及びこれに用いる植物への遺伝子導入用ベクタ―
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6534261B1 (en) * 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US6232526B1 (en) 1999-05-14 2001-05-15 Dekalb Genetics Corp. Maize A3 promoter and methods for use thereof
US6207879B1 (en) 1999-05-14 2001-03-27 Dekalb Genetics Corporation Maize RS81 promoter and methods for use thereof
US6194636B1 (en) 1999-05-14 2001-02-27 Dekalb Genetics Corp. Maize RS324 promoter and methods for use thereof
US6429357B1 (en) 1999-05-14 2002-08-06 Dekalb Genetics Corp. Rice actin 2 promoter and intron and methods for use thereof
US6677503B1 (en) 1999-06-23 2004-01-13 Pioneer Hi-Bred International, Inc. Sunflower anti-pathogene proteins and genes and their uses
DE60023936T2 (de) 1999-12-06 2006-05-24 Sangamo Biosciences Inc., Richmond Methoden zur verwendung von randomisierten zinkfingerprotein-bibliotheken zur identifizierung von genfunktionen
MXPA02007130A (es) 2000-01-21 2002-12-13 Pioneer Hi Bred Int Elementos promotores novedosos preferidos de raiz y metodos de uso..
AU5077401A (en) 2000-02-08 2001-08-20 Sangamo Biosciences Inc Cells for drug discovery
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
US6388170B1 (en) 2000-04-07 2002-05-14 University Of Kentucky Research Foundation Bidirectional promoters and methods related thereto
AU2001263155A1 (en) 2000-05-16 2001-11-26 Massachusetts Institute Of Technology Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
US6586251B2 (en) * 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
US7022826B2 (en) 2001-02-26 2006-04-04 The Regents Of The University Of California Non-oligomerizing fluorescent proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
US20040224385A1 (en) 2001-08-20 2004-11-11 Barbas Carlos F Zinc finger binding domains for cnn
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
CN100575485C (zh) 2002-01-23 2009-12-30 犹他大学研究基金会 使用锌指核酸酶的定向染色体诱变
US20060080750A1 (en) * 2002-03-21 2006-04-13 Fillatti Joanne J Nucleic acid constructs and methods for producing altered seed oil compositions
EP2368982A3 (en) 2002-03-21 2011-10-12 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
US9447434B2 (en) 2002-09-05 2016-09-20 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
WO2004099367A2 (en) * 2002-10-23 2004-11-18 The General Hospital Corporation Methods for producing zinc finger proteins that bind to extended dna target sequences
WO2004072259A2 (en) * 2003-02-11 2004-08-26 Dow Agrosciences Llc Altered fad2 and fad3 genes in brassica and the molecular marker-assisted detection thereof
BRPI0409816B8 (pt) 2003-04-29 2022-12-06 Pioneer Hi Bred Int Genes de glifosato-n-acetiltransferase (gat), construtos os compreendendo, célula bacteriana, polipeptídeo tendo atividade de gat, bem como método para a produção de uma planta transgênica resistente ao glifosato e métodos para controlar ervas daninhas em um campo contendo uma safra
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
WO2005028620A2 (en) 2003-09-16 2005-03-31 The Rockefeller University Histone modifications as binary switches controlling gene expression
CA2539439C (en) 2003-09-19 2012-10-23 Sangamo Biosciences, Inc. Engineered zinc finger proteins for regulation of gene expression
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
JP2008506359A (ja) 2004-04-08 2008-03-06 サンガモ バイオサイエンシズ インコーポレイテッド ジンクフィンガータンパク質による神経因性疼痛の処置
JP4903689B2 (ja) 2004-04-08 2012-03-28 サンガモ バイオサイエンシズ インコーポレイテッド 神経障害および神経変性症状を治療するための方法と組成物
CA2897475C (en) 2004-04-30 2018-07-10 Dow Agrosciences Llc Novel herbicide resistance genes
US20080168586A1 (en) * 2005-01-28 2008-07-10 Bayer Bioscience N.V. Brassica Plant Comprising a Mutant Fatty Acid Desaturase
EP1877583A2 (en) 2005-05-05 2008-01-16 Arizona Board of Regents on behalf of the Unversity of Arizona Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences
EP1913149A4 (en) 2005-07-26 2009-08-05 Sangamo Biosciences Inc TARGETED INTEGRATION AND EXPRESSION OF EXOGENOUS NUCLEIC ACID SEQUENCES
WO2009134714A2 (en) * 2008-04-28 2009-11-05 Precision Biosciences, Inc. Fusion molecules of rationally-designed dna-binding proteins and effector domains
AU2006308959B2 (en) 2005-10-28 2012-09-06 Corteva Agriscience Llc Novel herbicide resistance genes
EP1806398A1 (en) 2006-01-04 2007-07-11 Monsanto S.A.S. Fad-2 mutants and high oleic plants
EP2213731B1 (en) 2006-05-25 2013-12-04 Sangamo BioSciences, Inc. Variant foki cleavage half-domains
EP1862551A1 (en) * 2006-05-29 2007-12-05 Institut National De La Recherche Agronomique (Inra) Genetic markers for high oleic acid content in plants
SI2049663T1 (sl) 2006-08-11 2015-12-31 Dow Agrosciences Llc Homologna rekombinacija, posredovana z nukleazo s cinkovim prstom
WO2008076290A2 (en) 2006-12-14 2008-06-26 Dow Agrosciences Llc Optimized non-canonical zinc finger proteins
EP1944375A1 (en) 2007-01-11 2008-07-16 Monsanto S.A.S. FAD2 mutants and high oleic acid plants
EP2171052B1 (en) 2007-07-12 2014-08-27 Sangamo BioSciences, Inc. Methods and compositions for inactivating alpha 1,6 fucosyltransferase (fut 8) gene expression
CA2700231C (en) 2007-09-27 2018-09-18 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
DK2205749T3 (en) 2007-09-27 2016-08-22 Dow Agrosciences Llc MODIFIED PROTEINS zinc finger, which target the 5-enolpyruvylshikimate-3-phosphate synthase genes
WO2009054985A1 (en) 2007-10-25 2009-04-30 Sangamo Biosciences, Inc. Methods and compositions for targeted integration
US9418219B2 (en) 2008-04-11 2016-08-16 Microsoft Technology Licensing, Llc Inter-process message security
AU2009238629C1 (en) 2008-04-14 2015-04-30 Sangamo Therapeutics, Inc. Linear donor constructs for targeted integration
EP2313515B1 (en) 2008-08-22 2015-03-04 Sangamo BioSciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration
AR074783A1 (es) 2008-12-17 2011-02-09 Dow Agrosciences Llc Metodos y composiciones para expresar uno o mas productos de un acido nucleico exogeno integrado al locus zp15 de una celula vegetal
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
CA2765560C (en) * 2009-06-22 2017-10-31 Saga University Mutation that increases the oleic acid content in soybean oil and responsible gene thereof
CN105557503A (zh) 2009-07-08 2016-05-11 密苏里大学管委会 利用传统大豆育种技术培育高油酸大豆的方法
CA2770312A1 (en) 2009-08-11 2011-02-17 Sangamo Biosciences, Inc. Organisms homozygous for targeted modification
US10340778B2 (en) 2009-10-19 2019-07-02 Qm Power, Inc. Parallel magnetic circuit motor
EP2510096B2 (en) 2009-12-10 2018-02-07 Regents of the University of Minnesota Tal effector-mediated dna modification
CN102812034B (zh) 2010-01-22 2016-08-03 陶氏益农公司 靶向基因组改造
WO2011091317A2 (en) 2010-01-22 2011-07-28 Dow Agrosciences Llc Engineered landing pads for gene targeting in plants
JP6137596B2 (ja) 2010-02-08 2017-05-31 サンガモ セラピューティクス, インコーポレイテッド 遺伝子操作された切断ハーフドメイン
WO2011100058A1 (en) 2010-02-09 2011-08-18 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
EP2572192A4 (en) 2010-05-17 2013-12-11 Uab Research Foundation GENERAL MASS SPECTROMETRY ASSAY WITH CONTINUOUS ELIMINATION OF CO-FRACTIONATIVE REPORTERS BY MASS SPECTROMETRIC DETECTION EFFICIENCY
CA3039432A1 (en) 2010-05-28 2011-12-01 Corbion Biotech, Inc. Tailored oils produced from recombinant heterotrophic microorganisms
WO2013116700A1 (en) 2012-02-01 2013-08-08 Dow Agrosciences Llc Glyphosate resistant plants and associated methods
WO2013169802A1 (en) * 2012-05-07 2013-11-14 Sangamo Biosciences, Inc. Methods and compositions for nuclease-mediated targeted integration of transgenes
US8897552B2 (en) * 2012-08-01 2014-11-25 Microsoft Corporation Setting an operating-system color using a photograph
US10536934B2 (en) * 2012-08-03 2020-01-14 Telefonaktiebolaget Lm Ericsson (Publ) EPDCCH search space design
UA118090C2 (uk) * 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
BR112015022778B1 (pt) 2013-03-15 2023-04-11 Cellectis Método para a produção de uma planta de soja, método para a obtenção de óleo de soja apresentando teor de ácido oleico aumentado e teor de ácido linoleico reduzido e método para gerar uma planta de soja
US9417070B1 (en) 2013-04-01 2016-08-16 Nextgen Aerosciences, Inc. Systems and methods for continuous replanning of vehicle trajectories
JP5937635B2 (ja) 2014-03-28 2016-06-22 ファナック株式会社 電磁接触器の溶着検出機能を有するモータ駆動装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003060092A2 (en) * 2002-01-14 2003-07-24 Brookhaven Science Associates, Llc Modified fatty acid hydroxylase protein and genes
WO2004070035A2 (en) * 2003-02-03 2004-08-19 Sungene Gmbh & Co. Kgaa Method for increasing efficiency of homologous recombination in plants
US20110167521A1 (en) * 2009-10-22 2011-07-07 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
US20110301073A1 (en) * 2010-05-17 2011-12-08 Sangamo Biosciences, Inc. Novel DNA-binding proteins and uses thereof

Also Published As

Publication number Publication date
EP3404099A1 (en) 2018-11-21
AR092481A1 (es) 2015-04-22
EP3431600B1 (en) 2024-02-14
US10287595B2 (en) 2019-05-14
CA2883846A1 (en) 2014-03-13
CL2015000561A1 (es) 2015-10-02
JP2020096611A (ja) 2020-06-25
EP3404099B1 (en) 2024-01-10
KR20150043538A (ko) 2015-04-22
EP3431600A1 (en) 2019-01-23
ZA201501397B (en) 2016-06-29
JP2015527082A (ja) 2015-09-17
EP2892321A2 (en) 2015-07-15
AR092480A1 (es) 2015-04-22
US10577616B2 (en) 2020-03-03
UY39946A (es) 2022-10-31
TWI667348B (zh) 2019-08-01
RU2656158C2 (ru) 2018-05-31
MX352081B (es) 2017-11-08
BR112015004948A2 (pt) 2017-11-21
JP6792943B2 (ja) 2020-12-02
HK1212153A1 (zh) 2016-06-10
KR102147006B1 (ko) 2020-08-21
CN108610408B (zh) 2023-04-07
KR20150043539A (ko) 2015-04-22
JP6704251B2 (ja) 2020-06-03
US10844389B2 (en) 2020-11-24
WO2014039702A2 (en) 2014-03-13
UY35020A (es) 2014-03-31
WO2014039702A3 (en) 2014-07-24
EP2893023A4 (en) 2016-09-21
UA118090C2 (uk) 2018-11-26
WO2014039692A2 (en) 2014-03-13
US20170044559A1 (en) 2017-02-16
UY35021A (es) 2014-03-31
AU2013312465A1 (en) 2015-03-12
AU2013312465B2 (en) 2018-08-09
CN108610408A (zh) 2018-10-02
CA2883846C (en) 2021-10-19
US20180223297A1 (en) 2018-08-09
NZ705742A (en) 2018-11-30
CL2015000563A1 (es) 2015-10-02
HK1213736A1 (zh) 2016-07-15
JP2015529464A (ja) 2015-10-08
AU2013312455A1 (en) 2015-03-12
US9493779B2 (en) 2016-11-15
BR112015004980B1 (pt) 2023-04-11
IL237536A0 (en) 2015-04-30
BR112015004980A2 (pt) 2017-11-21
EP2893023B1 (en) 2018-08-15
JP2020110150A (ja) 2020-07-27
US9963711B2 (en) 2018-05-08
AU2013312455B2 (en) 2018-12-13
US20190316141A1 (en) 2019-10-17
RU2015112583A (ru) 2016-10-27
EP2892321A4 (en) 2016-03-02
EP2893023A2 (en) 2015-07-15
CN104780756B (zh) 2018-10-02
CA2884084C (en) 2021-10-26
RU2015112584A (ru) 2016-10-27
AU2013312455A2 (en) 2018-12-13
MX2015002990A (es) 2015-09-28
RU2656159C2 (ru) 2018-05-31
ZA201501396B (en) 2016-06-29
KR102147005B1 (ko) 2020-08-21
CN105025702A (zh) 2015-11-04
US20140090112A1 (en) 2014-03-27
TW201414838A (zh) 2014-04-16
CN104780756A (zh) 2015-07-15
CA2884084A1 (en) 2014-03-13
WO2014039692A3 (en) 2015-07-16
IL237537B (en) 2020-05-31
IL237536B (en) 2019-02-28
EP2892321B1 (en) 2018-10-24
AU2013312465A2 (en) 2015-03-12
MX369701B (es) 2019-11-19
IL237537A0 (en) 2015-04-30
US20140090116A1 (en) 2014-03-27

Similar Documents

Publication Publication Date Title
KR102147005B1 (ko) Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN111295449B (zh) 腺病毒载体及其用途
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
CN108368517B (zh) 用于快速植物转化的方法和组合物
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
KR102147007B1 (ko) Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
CA2683497C (en) .delta.8 desaturases and their use in making polyunsaturated fatty acids
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
CN101827938A (zh) 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物
CN101646766B (zh) △17去饱和酶及其用于制备多不饱和脂肪酸的用途
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20070085665A (ko) 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
CN112204147A (zh) 基于Cpf1的植物转录调控系统
KR20220012327A (ko) 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포
CN101918560B (zh) 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法
CN101868545B (zh) 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法
CN101883843A (zh) 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量
KR20230031929A (ko) 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도
BRPI0616533A2 (pt) polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas
KR20220161297A (ko) 신규 세포주
CN101848931B (zh) 具有改变的根构造的植物、涉及编码exostosin家族多肽及其同源物的基因的相关的构建体和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: U.S.A.

Address after: indiana

Applicant after: Kedihua Agricultural Technology Co.,Ltd.

Applicant after: SANGAMO BIOSCIENCES, Inc.

Address before: indiana

Applicant before: DOW AGROSCIENCES LLC

Country or region before: U.S.A.

Applicant before: SANGAMO BIOSCIENCES, Inc.

CB02 Change of applicant information