CN112512311A - 多核苷酸 - Google Patents

多核苷酸 Download PDF

Info

Publication number
CN112512311A
CN112512311A CN201980042933.8A CN201980042933A CN112512311A CN 112512311 A CN112512311 A CN 112512311A CN 201980042933 A CN201980042933 A CN 201980042933A CN 112512311 A CN112512311 A CN 112512311A
Authority
CN
China
Prior art keywords
anopheles
gene
sequence
polynucleotide
arthropod
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980042933.8A
Other languages
English (en)
Inventor
安德里亚·克里斯蒂安
托尼·诺兰
安德鲁·哈蒙德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Imperial Institute of Technology Innovation Co.,Ltd.
Original Assignee
Imperial College of Science Technology and Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Imperial College of Science Technology and Medicine filed Critical Imperial College of Science Technology and Medicine
Publication of CN112512311A publication Critical patent/CN112512311A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/033Rearing or breeding invertebrates; New breeds of invertebrates
    • A01K67/0333Genetically modified invertebrates, e.g. transgenic, polyploid
    • A01K67/0337Genetically modified Arthropods
    • A01K67/0339Genetically modified insects, e.g. Drosophila melanogaster, medfly
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/15Animals comprising multiple alterations of the genome, by transgenesis or homologous recombination, e.g. obtained by cross-breeding
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/20Animal model comprising regulated expression system
    • A01K2217/206Animal model comprising tissue-specific expression system, e.g. tissue specific expression of transgene, of Cre recombinase
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/70Invertebrates
    • A01K2227/706Insects, e.g. Drosophila melanogaster, medfly
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Environmental Sciences (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Microbiology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Insects & Arthropods (AREA)
  • Mycology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及多核苷酸,特别是涉及代表启动子序列的新型多核苷酸。本发明尤其涉及在生殖细胞表达中使用的新型启动子,因为它们仅在生殖细胞中基本上有效。特别地,启动子在节肢动物的生殖细胞中启动基因的转录,并且可以用于基因驱动中。本发明还涉及包含本发明的多核苷酸的载体和基因驱动构建体。本发明还涉及生产节肢动物的方法,该节肢动物包含含有此类启动子的载体。

Description

多核苷酸
本发明涉及多核苷酸,特别是涉及代表启动子序列的新型多核苷酸。本发明尤其涉及在生殖细胞表达中使用的新型启动子,因为它们仅在生殖细胞中基本上有效。特别地,启动子在节肢动物的生殖细胞中启动基因的转录,并且可以用于基因驱动中。本发明还涉及包含本发明的多核苷酸的载体和基因驱动构建体。本发明还涉及生产节肢动物的方法,该节肢动物包含含有此类启动子的载体。
基因驱动是一种遗传工程方法,可以在目标种群中传播特定的一组基因。已经提出基因驱动来提供基因修饰特定种群甚至整个物种的有力且有效的方法。例如,基因驱动的应用包括消灭携带病原体的昆虫(例如传播疟疾、登革热和寨卡病原体的蚊子)、控制入侵物种或消除除草剂或杀虫剂抗性。
CRISPR-Cas9核酸酶最近已在基因驱动系统中用于靶向人疟疾媒介冈比亚按蚊(Anopheles gambiae)和斯氏按蚊(Anopheles stephensi)的内源序列,目的是开发遗传媒介控制措施1,2。这些初步的原理证明实验已经表明基因驱动方法的潜力,并将理论假设转化为强大的遗传工具,有可能通过抑制物种的繁殖力或永久改变蚊子与其传播的疟疾寄生虫相互作用的结果,来改变物种的遗传构成并改变其进化命运。
最近的原理证明表明将基因驱动应用于人疟疾蚊子的媒介控制,这已经将理论假设转化为最强大的遗传工具,有可能改变物种的遗传组成并改变其进化命运。基因驱动技术广泛应用于控制害虫以及包括啮齿类动物在内的许多入侵物种,这已经引起了全世界的科学努力,旨在开发更有效、更安全的技术。开发有效且安全的基因驱动技术的关键因素是调控性启动子序列的可用性,以在减数分裂时专有地限制雌性和雄性蚊子生殖细胞中驱动核酸酶的表达,以避免对体组织的不需要的毒性作用,同时尽量减少抗驱动突变体的产生。
组织特异性启动子是将转基因表达限制在特定细胞或组织类型中的有力工具。组织特异性启动子的使用可以限制不需要的转基因表达,并促进持续的转基因表达。因此,非常需要在给定组织中起作用的新型启动子序列。
如实施例中所述,发明人已经鉴定了三个新型的调控序列(也称为“启动子”),在本文中被称为矮小(nanos)(nos)、零种群(zpg)和繁荣(exuperentia)(exu),它们各自调控转基因在宿主生殖细胞中的表达,因此可用于基因驱动方法,例如在蚊子中。这些在蚊子生殖细胞中表达转基因的序列克服了目前基因驱动设计中因为难以充分限制Cas9核酸内切酶在生殖细胞中表达的主要障碍。核酸酶活性在体组织中的漏表达代表了适应度降低的主要来源和功能性抗驱动核酸酶靶序列产生的主要来源。为此,发明人已经验证并表征了三种新型的调控DNA序列的使用,它们能够在疟疾蚊子冈比亚按蚊和其他密切相关的物种中产生改良的生殖细胞限制的转基因表达。
这三个调控序列分别命名为“zpg”、“nos”和“exu”,每个调控序列分别由两个约2kb和0.5-1kb的DNA序列组成,并与冈比亚按蚊基因组分离(调控序列来自基因zpg/零种群生长–AGAP006241、nos/nanos–AGAP006098和exu/exuperantia–AGAP007365)。
因此,在本发明的第一方面,提供了一种分离的多核苷酸,其包含基本上如SEQ IDNo:1、2或3中任一项所述的核酸序列,或其与SEQ ID No:1、2或3具有至少50%序列同一性的变体或片段。
有利地,发明人已经示出第一方面的多核苷酸充当仅在生殖细胞中驱动组织特异性基因表达的启动子。因此,如实施例中所述,在基因驱动方法中,使用本发明的启动子限制了Cas9核酸内切酶在生殖细胞中的表达,并因此通过减少末端连接突变的胚胎来源来减轻和防止抗性等位基因的出现。
在一个优选的实施方案中,多核苷酸序列可被称为“零种群”或“zpg”,其在本文中以SEQ ID No:1提供,如下:
cagcgctggcggtggggacagctccggctgtggctgttcttgCgagtcCtcttcctgcggcacatccctctcgtcgaccagttcagtttgctgagcgtaagcctgctgctgttcgtcctgcatcatcgggaccatttgtaTgggccatccgccaccaccaccatcaccaccgccgtccatttctaggggcatacccatcagcatctccgcgggcgccattggcggtggtgccaaggtgccattcgtttgttgctgaaagcaaaagaaagcaaattagtgttgtttctgctgcacacgataAttttcgtttcttgccgctagacacaaacaacactgcatctggagggagaaatttgacgcctagctgtataacttacctcaaagttattgtccatcgtggtataatggacctaccgagcccggttacactacacaaagcaagattatgcgacaaaatcacagcgaaaactagtaattttcatctatcgaaagcggccgagcagagagttgtttggtattgcaacttgacattctgctgCgggataaaccgcgacgggctaccatggcgcacctgtcagatggctgtcaaatttggcccggtttgcgatatggagtgggtgaaattatatcccactcgctgatcgtgaaaatagacacctgaaaacaataattgttgtgttaattttacattttgaagaacagcacaagttttgctgacaatatttaattacgtttcgttatcaacggcacggaaagattatctcgctgattatccctctcgctctctctgtctatcatgtcctggtcgttctcgcgtcaccccggataatcgagagacgccatttttaatttgaactactacaccgacaagcatgccgtgagctctttcaagttcttctgtccgaccaaagaaacagagaataccgcccggacagtgcccggagtgatcgatccatagaaaatcgcccatcatgtgccactgaGgcgaaccggcgtagcttgttccgaatttccaagtgcttccccgtaacatccgcatataacaaAcagcccaacaacaaatacagcatcgag
[SEQ ID No:1]
因此,优选地,多核苷酸包含基本上如SEQ ID No:1所示的核酸序列或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
在另一个优选的实施方案中,多核苷酸序列可被称为“nanos”或“nos”,并在本文中以SEQ ID No:2提供,如下:
gtgaacttccatggaattacgtgctttttcggaatggagttgggctggtgaaaaacacctatcagcaccgcacttttcccccggcatttcaggttatacgcagagacagagactaaatattcacccattcatcacgcactaacttcgcaatagattgatattccaaaactttcttcacctttgccgagttggattctggattctgagactgtaaaaagtcgtacgagctatcatagggtgtaaaacggaaaacaaacaaacgtttaatggactgctccaactgtaatcgcttcacgcaaacaaacacacacgcgctgggagcgttcctggcgtcacctttgcacgatgaaaactgtagcaaaactcgcacgaccgaaggctctccgtccctgctggtgtgtgtttttttcttttctgcagcaaaattagaaaacatcatcatttgacgaaaacgtcaactgcgcgagcagagtgaccagaaataccgatgtatctgtatagtagaacgtcggttatccgggggcggattaaccgtgcgcacaaccagttttttgtgcagctttgtagtgtctagtggtattttcgaaattcatttttgttcattaacagttgttaaacctatagttattgattaaaataatattctactaacgattaaccgatggattcaaagtgaataaattatgaaactagtgatttttttaaatttttatatgaatttgacatttcttggaccattatcatcttggtctcgagctgcccgaataatcgacgttctactgtattcctaccgattttttatatgcctaccgacacacaggtgggccccctaaaactaccgatttttaatttatcctaccgaaaatcacagattgtttcataatacagaccaaaaagtcatgtaaccatttcccaaatcacttaatgtattaaactccatatggaaatcgctagcaaccagaaccagaagttcaacagagacaaccaatttccgtgtatgtacttcatgagatgagattggacgcgctggtaaaattttatatgggatttgacagataatgtaaggcgtgcgatttttttcatacgatggaatcaattcaagagtcaattgtgcaggatttatagaaacaatctcttatttatgttttgttatcgttacagttacagccctgtcctaagcggccgcgtgaaggcccaaaaaaaagggagtccccaacgctcagtagcaaatgtgcttctctatcattcgttgggttagaaaagcctcatgtgacttctatgaacaaaatctaaactatctcctttaaatagagaatggatgtattttttcgtgccactgaactttcgttgggaagattagatacctctccctccccccccctccctttcaacacttcaaaacctaccgaaaactaccgatacaatttgatgtacctaccgaagaccgccaaaataatctggccacactggctagatctgatgttttgaaacatcgccaaattttactaaataatgcacttgcgcgttggtgaagctgcacttaaacagattagttgaattacgctttctgaaatgtttttattaaacacttgttttttttaatacttcaatttaaagctacttcttggaatgataattctacccaaaaccaaaaccactttacaaagagtgtgtggttggtgatcgcgccggctactgcgacctgtggtcatcgctcatctcacgcacacatacgcacacatctgtcatttgaaaagctgcacacaatcgtgtgttgtgcaaaaaaccgttcgcgcacaaacagttcgcacatgtttgcaagccgtgcagcaaagggcttttgatggtgatccgcagtgtttggtcagctttttaatgtgttttcgcttaatcgcttttgtttgtgtaatgttttgtcggaataatttttatgcgtcgttacaaatgaaatgtacaatcctgcgatgctagtgtaaaacattgctaattcccggtaagaacgttcattacgctcggatatcatcttacgaagcgTGTGTATGTGCGCTAGTACATTGACCTTTAAAGTgatccttttgttctagaaagcaag
[SEQ ID No:2]
因此,优选地,多核苷酸序列包含基本上如SEQ ID No:2所示的核酸序列或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
在又一个优选的实施方案中,第二启动子序列可以被称为“exuperantia”或“exu”,并在本文中以SEQ ID No:3提供,如下:
ggaaggtgattgcgattccatgttgatgccaatatatgatgattttgttgcatattaatagttgttgttatgttttattcaaatttcaaagataatttactttacattacagttagtgagcatattatctactacataaacacatagatCaaactggtttacataaattcaaaaagtttgGattaaAatcgcagcaattggttatgaaaaaatatgtgCAtaacgtaaatatcaagtaaatttttgcattgcatatttatagaCtcctgttacaatttcggaaaaatgaaaaatgttaattaatcaaagaagaaaaaacaaagAaattaaatcattaggtAgcacaaccacaagtacatatttttatggcatgaatattccTctacactaacatattttatagcaattctattgatcgccttaGtatagcGgaattaccagaacggcactatagttgtctctgtttggcacacgcaatcatttttcatcccagggttgccatagcagtttggcgacggtcacgtagcatgcgaaggatttcgTtcgcacaggatcacttttattctaacgtttgaagaagGcacatctcagtgcaagcgctctggaagctgcttttaccgaacgaactaacttttcaagtaacctcaaaaacttgtctctaacgacaccacgtgctatccgcgagttTcatttcccgtgcaaagttccccgatttagctatcattcgtgaacatttcgtagtgcctctaccctcaggtaagaccattcgaGgtttaccaagttttgtgcaaagaaCGTGCacagtaattttCgttctggtgaaaccttctcttgtgtagcttgtacaaa
[SEQ ID No:3]
因此,优选地,多核苷酸序列包含基本上如SEQ ID No:3所示的核酸序列或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
优选地,多核苷酸仅在生殖细胞中引发与其可操作连接的编码序列的基因表达。优选地,多核苷酸在节肢动物细胞中是起作用的。优选地,多核苷酸序列是仅在节肢动物的生殖细胞中基本上有效的启动子序列。更优选地,多核苷酸是在减数分裂时在雄性和雌性蚊子性腺细胞中基本上有效的启动子序列。
对于“基本上有效”,本领域技术人员将认识到,由本发明的多核苷酸控制的基因表达可能存在一定程度的“渗漏”,使得其可以在其他组织中起作用(例如节肢动物)。例如,优选地,由本发明的多核苷酸引发的基因表达的至少60%、70%、80%、90%、95%、96%、97%、98%或99%限于目的细胞和/或组织,即生殖细胞。优选地,序列可以仅在期望的细胞中起作用。
本发明的多核苷酸可以对其起作用的合适的节肢动物包括昆虫类、蛛形类、多足类或甲壳类。优选地,节肢动物是昆虫。优选地,节肢动物(最优选昆虫)是携带疾病的媒介或害虫(例如农业害虫),它们可以感染、伤害或杀死具有农业价值的动物或植物,例如按蚊种、伊蚊种(作为疾病媒介)、地中海实蝇(Ceratitis capitata)或果蝇种(作为农业害虫)。
优选地,昆虫是蚊子。优选地,蚊子是按蚊(Anophelinae)亚科的。优选地,蚊子选自由以下组成的群组:冈比亚按蚊(Anopheles gambiae);科鲁兹按蚊(Anophelescoluzzi);拇鲁斯按蚊(Anopheles merus);阿拉伯按蚊(Anopheles arabiensis);四环按蚊(Anopheles quadriannulatus);斯氏按蚊(Anopheles stephensi);阿拉伯按蚊(Anopheles arabiensis);不吉按蚊(Anopheles funestus);以及密拉斯疟蚊(Anophelesmelas)。
最优选地,蚊子是冈比亚按蚊。
优选地,将多核苷酸置于表达盒中。优选地,表达盒包含第一方面的多核苷酸(即启动子)、开放阅读框和任选地3’非翻译区,其可以包含多腺苷酸化位点。
因此,在第二方面,提供了一种表达盒,其包含与转基因可操作地连接的根据第一方面的多核苷酸。
盒可以进一步包含与调控转基因表达有关的3’非翻译区。优选地,3’非翻译区包含3’-多腺苷酸化序列。
“转基因”可以指任何外源核酸序列,特别是需要生殖细胞表达的外源核酸序列。优选地,转基因是当在节肢动物的细胞中表达时修饰节肢动物基因组的核酸。
优选地,转基因选自由以下组成的群组:CRISPR核酸酶、锌指核酸酶、TALEN来源的核酸酶、背跨式(piggyback)转座酶、Cre重组酶或
Figure BDA0002851107610000061
整合酶。
优选地,转基因编码CRISPR核酸酶,更优选地Cpf1或Cas9。最优选地,转基因编码Cas9。
优选将本发明的多核苷酸置于重组载体中,例如用于递送到目的宿主细胞中的重组载体。
因此,在第三方面,提供了一种重组载体,其包含根据第一方面的多核苷酸或根据第二方面的表达盒。
载体可以例如是质粒、粘粒、噬菌体和/或病毒载体。此类重组载体在将转基因递送至宿主细胞中非常有用。重组载体还可以包括其他功能元件。例如,它们可以进一步包含多种其他功能元件,包括在将载体引入宿主细胞后用于控制转基因表达的合适的调控序列。例如,载体优选地能够在宿主细胞的细胞核中自主复制。在这种情况下,重组载体中可能需要诱导或调控DNA复制的元件。可替代地,可以设计重组载体,使得其整合到宿主细胞的基因组中。在这种情况下,设想了有利于靶向整合(例如,通过同源重组)的DNA序列。盒或载体还可以包含终止子,诸如β球蛋白、SV40多腺苷酸化序列或合成的多腺苷酸化序列。重组载体还可以根据需要进一步包含调控子或增强子以控制核酸的表达。除本文所述的多核苷酸序列外,可使用组织特异性增强子元件来进一步调控核酸在生殖细胞(优选节肢动物)中的表达。
载体还可以包含编码基因的DNA,该基因可以在克隆过程中用作选择标记,即,使得能够选择已经被转染或转化的宿主细胞,并且使得能够选择带有掺入了异源DNA的载体的细胞。例如,设想氨苄青霉素、新霉素、嘌呤霉素或氯霉素抗性。可替代地,可选择的标记基因可以在不同的载体中,以与含有多核苷酸和转基因的载体同时使用。盒或载体还可以进一步包含其他与调控转基因表达有关的DNA。
可以通过合适的方法,如直接内吞摄取,将纯化的载体直接插入宿主细胞。可以通过转染、感染、电穿孔、显微注射、细胞融合、原生质体融合或弹道轰击,将载体直接引入宿主节肢动物(例如蚊子)的细胞中。可替代地,可以使用粒子枪将本发明的载体直接引入宿主细胞。
核酸分子可以(但不一定)是一种被并入受处理对象细胞DNA中的物质。未分化的细胞可以被稳定地转化,从而导致基因修饰的子细胞的产生(在这种情况下,可能需要例如用特定的转录因子或基因激活子来调控在对象中的表达)。可替代地,可以将载体设计成有利于受处理对象中分化细胞的不稳定或瞬时转化。在这种情况下,表达的调控可能不太重要,因为当转化的细胞死亡或停止表达蛋白质时,DNA分子的表达将停止。
可通过转染、感染、显微注射、细胞融合、原生质体融合或弹道轰击将多核苷酸、表达盒或载体转移至宿主细胞。例如,转移可以通过用包被的金颗粒、含有核酸分子的脂质体、病毒载体(例如腺病毒)进行弹道转染,以及通过直接施加核酸分子来提供直接核酸摄取(例如内吞作用)的手段。
在第四方面,提供了一种宿主细胞,其包含第二方面的表达盒或第三方面的重组载体。
宿主细胞可以是原核的。然而,优选地,宿主细胞是真核的。优选地,如关于第一方面所述,宿主细胞是节肢动物细胞。优选地,节肢动物细胞是昆虫细胞。优选地,节肢动物细胞(最优选昆虫细胞)是携带疾病的媒介或害虫(例如农业害虫)的细胞,其可以感染、伤害或杀死具有农业价值的动物或植物,例如按蚊种、伊蚊种(作为疾病媒介)、地中海实蝇或果蝇种(作为农业害虫)。
优选地,昆虫细胞是蚊子细胞。优选地,蚊子是按蚊亚科的。优选地,蚊子细胞选自由以下组成的群组:冈比亚按蚊(Anopheles gambiae);科鲁兹按蚊(Anopheles coluzzi);拇鲁斯按蚊(Anopheles merus);阿拉伯按蚊(Anopheles arabiensis);四环按蚊(Anopheles quadriannulatus);以及密拉斯疟蚊(Anopheles melas)。最优选地,蚊子细胞是冈比亚按蚊细胞。
在第五方面,提供了一种产生基因修饰的宿主细胞的方法,该方法包含将第二方面的表达盒或根据第三方面的载体引入宿主细胞。
优选地,宿主细胞如第四方面所述。
在第六方面,提供了一种基因修饰的宿主细胞,其通过第五方面的方法获得或可通过第五方面的方法获得。
优选地,宿主细胞如第四方面所述。
本发明的多核苷酸对于驱动基因驱动构建体的生殖细胞特异性表达特别有用。
有利地,本文描述的zpg(SEQ ID No:1)、nos(SEQ ID No:2)和exu(SEQ ID No:3)的调控序列提供了优于目前可用的最佳系统的明显优势(即,vasa2启动子,其也被称为vas2)用于为疟疾蚊子设计的基因驱动中的生殖细胞核酸酶表达,显示:(1)雄性蚊子和雌性蚊子向后代的偏向传播率都很高,(2)基本上降低了适应度成本,(3)减少了末端连接突变,该末端连接突变是对基因驱动产生抗性的主要原因,以及(4)在驱动的速度、持久性和最大频率方面大大提高了笼养实验中的传播。
出人意料的是,基于本文公开的多核苷酸序列的基因驱动远远优于所有先前测试的基因驱动,并且可用于种群替代和种群抑制策略。基因驱动效力的改善可归因于核酸酶表达的时空调控的极大改善,优选Cas 9,这是通过使用这些新型的调控序列而引起的,特别是对生殖细胞的限制的改善。
为了说明改善的程度,发明人观察到雌性的相对适应度超过80%,而使用vasa2启动子的相对适应度仅为7%。基因驱动技术的最终目标是从低初始释放频率开始,对整个种群进行修饰,使用与先前发表的研究相同的方法,发明人已经观察到,使用zpg启动子首次将其传播到笼养种群中>99%的个体,相比之下,先前基于vasa2启动子的最佳测试基因驱动的最高频率80%。当从50%的初始频率(与先前的研究相吻合)以及也从10%的初始频率(与媒介控制更相关)释放时,发明人已经证明这种传播。活性的改善完全可以归因于改良生殖细胞启动子的使用,因为基因驱动在其他方面是相同的,并且观察到的传播改善是基于转基因品系的观察特征通过数学模型预测的,该转基因品系基于这些启动子。出人意料的是,发明人已经证明,使用这些启动子构建的基因驱动不需要进一步的改善就可以入侵整个蚊子种群,并且满足针对种群替换的基因驱动系统的要求。
因此,在本发明的第七方面,提供了一种基因驱动遗传构建体,其包含根据第一方面的多核苷酸、第二方面的表达盒或根据第三方面的载体。
技术人员将理解,本发明的基因驱动构建体可以涉及包含一种或多种遗传元件的构建体,该遗传元件使其遗传性偏向于孟德尔遗传学之上,并因此在经历许多代的种群中其频率增加。
优选地,多核苷酸序列基本上限制了基因驱动遗传构建体在节肢动物中的构建体生殖细胞中表达的活性。
优选地,节肢动物如第一方面所述。
优选地,多核苷酸基本上将基因驱动遗传构建体的活性限制于节肢动物的生殖细胞。更优选地,在减数分裂时,多核苷酸基本上将基因驱动遗传构建体的活性限制于雄性和雌性蚊子性腺。
优选地,基因驱动构建体靶向与雌性节肢动物的生殖能力相关的基因序列,使得基因驱动构建体对基因序列的靶向导致雌性抑生殖能力的制。技术人员会理解,抑制雌性的生殖能力可能与降低生殖能力或完全不育有关。
可替代地,启动子序列可用于传播赋予对病原体定殖媒介能力的抗性的基因,从而产生对疾病免疫的媒介。
应当理解,雌性生殖能力的抑制可能与雌性特有生殖能力降低或雌性完全不育有关。优选地,与相应的野生型雌性相比,对于构建体,雌性纯合子的生殖能力降低了至少5%、10%、20%或30%。更优选地,与相应的野生型雌性相比,对于构建体,雌性纯合子的生殖能力降低了至少40%、50%或60%。最优选地,与相应的野生型雌性相比,对于构建体,雌性纯合子的生殖能力降低了至少70%、80%或90%。最优选地,抑制雌性生殖导致雌性完全不育。
基因驱动遗传构建体的概念是本领域技术人员已知的。优选地,基因驱动遗传构建体是基于核酸酶的遗传构建体。基因驱动遗传构建体可以选自由以下组成的群组:转录激活因子样效应因子核酸酶(TALEN)遗传构建体;锌指核酸酶(ZFN)遗传构建体;以及基于CRISPR的基因驱动遗传构建体。优选地,遗传构建体是基于CRISPR的基因驱动构建体,最优选地是基于CRISPR-Cpf1或基于CRISPR-Cas9的基因驱动遗传构建体。
优选地,通过基因驱动遗传基因驱动构建体对基因的靶向导致:
i)单性不育;
ii)双性不育;或
iii)双性致死。
优选地,遗传基因驱动构建体靶向的基因是来自冈比亚按蚊的雌性致育基因。
优选地,遗传基因驱动构建体靶向的基因选自由以下组成的群组:AGAP005958、AGAP007280、AGAP0011377和AGAP004050、或其直系同源物。
最优选地,遗传基因驱动构建体靶向的基因是双性(doublesex)(dsx)基因。在一个实施方案中,doublesex基因来自冈比亚按蚊(称为AGAP004050)。有利地,该doublesex基因在严格的序列限制下高度保守,因此是优选的靶基因。
因此,在其中遗传构建体是基于CRISPR的基因驱动遗传构建体的实施方案中,遗传构建体进一步包含第一多核苷酸序列,该第一多核苷酸序列编码能够与待靶向基因的序列杂交的多核苷酸序列。优选地,第一多核苷酸序列是向导RNA。
优选地,基于CRISPR的基因驱动遗传构建体进一步包含第二多核苷酸序列,其编码CRISPR核酸酶,优选Cpf1或Cas9核酸酶,最优选Cas9核酸酶。优选的核酸酶和编码核苷酸的序列是本领域已知的。优选地,编码核酸酶的第二多核苷酸序列位于第一核苷酸序列的5’端,该第一核苷酸序列编码能够与待靶向的基因的序列杂交的多核苷酸序列。
优选地,将基本上如SEQ ID Nos:1、2或3中的任一个所述的多核苷酸序列或其片段或变体可操作地连接至第二核苷酸序列,并且将第二启动子序列可操作地连接至第一核苷酸序列。
第二启动子序列可以是适合在节肢动物中表达并且为本领域技术人员已知的任何启动子序列。
在一个实施方案中,第一核苷酸序列可以通过自切割RNA元件(诸如tRNA、Cys4或核酶序列(诸如锤头状核酶和肝炎三角洲病毒核酶))来产生。此类方法是本领域技术人员已知的。
在其中第一核苷酸序列通过自切割RNA元件产生的实施方案中,第二启动子序列可以是基本上如SEQ ID No:1、2或3中的任一个所述的多核苷酸序列,或其片段或变体。
优选地,第二启动子是聚合酶III启动子,优选不增加5’帽或3’聚多A尾巴的聚合酶III启动子。更优选地,启动子是U6。
技术人员将理解,能够与待靶向的基因的序列杂交的多核苷酸序列可以进一步包含CRISPR核酸酶结合序列,优选Cpf1或Cas9核酸酶结合序列,最优选Cas9核酸酶结合序列。
优选地,当被转录时,与内含子-外显子边界杂交的第一多核苷酸序列将核酸酶靶向doublesex基因的内含子-外显子边界,并且核酸酶在内含子-外显子边界处切割doublesex基因,从而使基因驱动构建体通过同源性定向修复被整合到破坏的内含子-外显子边界中。技术人员将理解,一旦将基因驱动插入节肢动物的基因组中,它将使用在其插入基因组中的位点处发现的天然同源性。
应当理解,gRNA不一定针对doublesex基因,并且本发明的启动子可用于开发靶向不同基因的驱动以用于种群抑制或种群替代。
可以通过合适的方式,例如直接内吞摄取,将基因驱动遗传构建体直接插入宿主细胞。可通过转染、感染、电穿孔、显微注射、细胞融合、原生质体融合或弹道轰击将构建体直接引入宿主对象的细胞(例如蚊子)。可替代地,可以使用粒子枪将本发明的构建体直接引入宿主细胞。
优选地,通过显微注射节肢动物胚胎,优选昆虫胚胎,最优选蚊子胚胎,将构建体引入宿主细胞。优选地,蚊子是按蚊亚科的,并且更优选地,蚊子是以下的任何一种:冈比亚按蚊(Anopheles gambiae)、科鲁兹按蚊(Anopheles coluzzi)、斯氏按蚊(Anophelesstephensi)、阿拉伯按蚊(Anopheles arabiensis)、密拉斯疟蚊(Anopheles melas)和不吉按蚊(Anopheles funestus)。最优选地,蚊子是冈比亚按蚊。
因此,发明人已经开发出调控性启动子序列,以在减数分裂时仅限制雄性和雌性蚊子性腺中驱动核酸酶的表达,以避免对体组织的有害毒性作用,同时使驱动抗性突变体的产生最小化。
有利地,本发明人已经使用这些序列在疟疾蚊子中的基因驱动的情况下表达Cas9核酸内切酶,并且证明了其与先前使用的最佳替代物vasa2启动子相比具有出人意料的优越性(https://www.nature.com/articles/nbt.3439)。
这些新颖的启动子序列的技术效果包括:1)改善了雌性蚊子向后代的传播,从而导致了基因驱动的更高的净传播;2)降低了适应度成本;3)减少了可导致对基因驱动具有抗性的末端连接突变的产生,以及4)在驱动的速度、持续性和最大频率方面提高了笼养实验的传播。最重要的是,发明人证明了基于零种群生长(Zero Population Growth)(zpg)启动子的基因驱动可以在整个蚊子种群中传播,这是基因驱动系统前所未有的最终目的。使用本文所述的调控序列,发明人已经证明,现在有可能构建针对疟疾蚊子中的种群替换的基因驱动。发明人还证明了这些序列已成功用于基于CRISPR的同源性定向修复的蚊子转化,并且尽管不希望受限于任何特定理论,但假设这些调控序列也可更普遍用于蚊子转化的其他方法(例如使用这些调控序列来表达背跨式转座酶、Cre重组酶或
Figure BDA0002851107610000121
整合酶)和更通常的蚊子转基因。
发明人使用生物信息学分析来鉴定这些序列、翻译起始和终止位点、以及未翻译区,该未翻译区可通过限制翻译到生殖细胞来进一步限制源自母本或父本的转录的表达(这是vasa2启动子的主要缺点)。重要的是,核酸酶在胚胎中的沉积被认为是对基因驱动产生抗性的主要来源(http://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1007039),发明人设计了这些调控序列,以使该活性最小化。
这些序列不是用于基因驱动的明显选择。实际上,“据信冈比亚按蚊中的nos(也称为nanos)zpg和exu不足以实现双性基因驱动表达,因为它被认为是雌性特异性的”(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321024/、https:// www.ncbi.nlm.nih.gov/pmc/articles/PMC4321024/和https://www.sciencedirect.com/ science/article/pii/S0965174805000603?via%3Dihubb)。
在进行这项工作之前,另一个研究小组发表了从不相关的蚊子物种埃及伊蚊(Aedes aegypti)的exererantia基因分离的相似命名的调控序列的使用(https://www.nature.com/articles/srep03954)。这些序列被用来驱动该物种的生殖细胞转基因蚊子,即黄热蚊埃及伊蚊。然而,它们与从冈比亚按蚊中分离出的目前公开的序列没有相似之处(24.4%的序列同一性,相比于仅偶然地预测为25%),也未显示在疟疾蚊子中可用于转基因表达或用于基因驱动中。
基因驱动构建体可以例如是质粒、粘粒或噬菌体和/或病毒载体。此类重组载体在用于转化细胞的本发明的递送系统中非常有用。核酸序列可以优选是DNA序列。基因驱动构建体可以进一步包含多种其他功能元件,包括合适的调控序列,用于在将构建体引入宿主细胞后控制遗传基因驱动构建体的表达。构建体可进一步包含调控子或增强子,以控制所需构建体的元件的表达。可以使用组织特异性增强子元件(例如启动子序列)来进一步调控构建体在节肢动物生殖细胞中的表达。
在本发明的第八方面,提供了一种生产转基因的节肢动物的方法,其包含将根据第七方面的基因驱动遗传构建体引入节肢动物基因中。
优选地,节肢动物如第一方面中所定义。
可以通过合适的方式,例如直接内吞摄取,将基因驱动遗传构建体直接引入节肢动物宿主细胞中,优选地存在于节肢动物胚胎中的节肢动物宿主细胞。可以通过转染、感染、电穿孔、显微注射、细胞融合、原生质体融合或弹道轰击,将构建体直接引入节肢动物(例如蚊子)的宿主细胞中。可替代地,可以使用粒子枪将本发明的构建体直接引入宿主细胞。
优选地,通过显微注射节肢动物胚胎,优选昆虫胚胎,最优选蚊子胚胎,将构建体引入宿主细胞中。
优选地,使用本领域的标准方法,在沉积的2小时内,通过显微注射将基因驱动遗传构建体引入新鲜产下的卵中。更优选地,在黑化作用开始时,将基因驱动遗传构建体引入节肢动物胚胎中,本领域技术人员将理解这发生在产卵后30分钟之内。
优选地,蚊子是按蚊亚科的。优选地,蚊子选自由以下组成的群组:冈比亚按蚊(Anopheles gambiae);科鲁兹按蚊(Anopheles coluzzi);拇鲁斯按蚊(Anophelesmerus);阿拉伯按蚊(Anopheles arabiensis);四环按蚊(Anopheles quadriannulatus);斯氏按蚊(Anopheles stephensi);阿拉伯按蚊(Anopheles arabiensis);不吉按蚊(Anopheles funestus);以及密拉斯疟蚊(Anopheles melas)。
在本发明的第九方面,提供了一种通过第八方面的方法获得或可获得的转基因节肢动物。
优选地,节肢动物如第一方面中所定义。
在本发明的第十方面,提供了一种转基因的节肢动物,其包含第七方面的基因驱动遗传构建体。
优选地,节肢动物如第一方面中所定义。
在本发明的第十一方面,提供了一种抑制野生型节肢动物种群的方法,该方法包含将转基因的节肢动物与该节肢动物的野生型种群繁育,该转基因的节肢动物包含能够破坏与雌性生殖能力有关的基因的基因驱动构建体,其中基因驱动构建体包含第一方面的分离的多核苷酸、第二方面的表达盒或根据第三方面的载体。
优选地,节肢动物如第一方面中所定义。优选地,基因驱动遗传构建体如第七方面中所定义。
在本发明的第十二方面,提供了包含第一方面的多核苷酸序列、第二方面的表达盒或根据第三方面的载体的基因驱动遗传构建体在抑制野生型节肢动物种群中的用途。
优选地,节肢动物如第一方面中所定义。优选地,基因驱动遗传构建体如第七方面中所定义。
应当理解,本发明扩展到任何核酸或肽或其变体、衍生物或类似物,其基本上包含本文所指的任何序列的氨基酸或核酸序列,包括其变体或片段。术语“基本上氨基酸/核苷酸/肽序列”、“变体”和“片段”可以是与本文所提到的任何序列的氨基酸/核苷酸/肽序列具有至少40%序列同一性的序列,例如与如SEQ ID No:1至90所示的序列具有40%的同一性,等等。
还设想氨基酸/多核苷酸/多肽序列与所提及的任何序列具有大于65%、更优选大于70%、甚至更优选大于75%、并且还更优选大于80%的序列同一性。优选地,氨基酸/多核苷酸/多肽序列与所提及的任何序列具有至少85%的同一性,与本文中提及的任何序列相比,更优选至少90%的同一性,甚至更优选至少92%的同一性,甚至更优选至少95%的同一性,甚至更优选至少97%的同一性,甚至更优选至少98%的同一性,最优选至少99%的同一性。
技术人员将理解如何计算两个氨基酸/多核苷酸/多肽序列之间的百分比同一性。为了计算两个氨基酸/多核苷酸/多肽序列之间的百分比同一性,必须首先准备两个序列的比对,然后计算序列同一性值。两个序列的百分比同一性可能取不同的值,具体取决于:-(i)用于比对序列的方法,例如ClustalW、BLAST、FASTA、史密斯-沃特曼算法(Smith-Waterman)(在不同程序中实现)或3D比较中的结构比对;以及(ii)比对方法所使用的参数,例如局部比对与整体比对、所使用的成对得分矩阵(例如BLOSUM62、PAM250、Gonnet等)以及空位-罚分,例如功能形式和常数。
进行比对后,有许多不同的方法可以计算两个序列之间的百分比同一性。例如,可以将同一性的数除以:(i)最短序列的长度;(ii)比对的长度;(iii)序列的平均长度;(iv)非空位位置的数量;或(v)不包括突出部分(overhang)的等效位置的数量。此外,将理解,百分比同一性也强烈地依赖于长度。因此,一对序列越短,可能期望偶然发生的序列同一性就越高。
因此,应当理解,蛋白质或DNA序列的准确比对是复杂的过程。受欢迎的多重比对程序ClustalW(Thompson等人,1994,核酸研究(Nucleic Acids Research),22,4673-4680;Thompson等人,1997,核酸研究(Nucleic Acids Research),24,4876-4882)是生成根据本发明的蛋白质或DNA的多重比对的优选方法。ClustalW的合适参数如下:对于DNA比对:空位开放罚分=15.0,空位扩展罚分=6.66,矩阵=同一性(Identity)。对于蛋白质比对:空位开放罚分=10.0,空位扩展罚分=0.2,矩阵=贡内特(Gonnet)。对于DNA和蛋白质比对:ENDGAP=-1,GAPDIST=4。本领域技术人员将意识到,可能需要改变这些参数和其他参数以实现最佳序列比对。
优选地,然后可以根据如(N/T)*100的比对来计算两个氨基酸/多核苷酸/多肽序列之间的百分比同一性,其中N是序列共享相同残基的位置数,而T是比较的位置总数,包括空位,以及包括或不包括突出部分。优选地,在计算中包括突出部分。因此,用于计算两个序列之间的百分比同一性的最优选方法包含:(i)使用ClustalW程序,使用一组合适的参数,例如,如上所述,准备序列比对;以及(ii)将N和T的值插入下式:-序列同一性=(N/T)*100。
鉴定相似序列的替代方法是本领域技术人员已知的。例如,基本上相似的核苷酸序列将由在严格条件下与DNA序列或其互补序列杂交的序列编码。在严格条件下,发明人意指核苷酸在约45℃的3倍氯化钠/柠檬酸钠(SSC)中与结合滤膜的DNA或RNA杂交,然后在约20-65℃的0.2倍SSC/0.1%SDS中至少洗涤一次。可替代地,基本相似的多肽与例如SEQ IDNo:1至90中所示的序列可以相差至少1个但少于5个、10个、20个、50个或100个氨基酸。
由于遗传密码的简并性,很明显,本文所述的任何核酸序列可以被改变或变化而基本上不影响由此编码的蛋白质的序列,以提供其功能性变体。合适的核苷酸变体是那些具有被编码该序列内相同氨基酸的不同密码子的替换所改变的序列,从而产生了沉默的(同义的)变化。其他合适的变体是那些具有同源核苷酸序列但包含全部或部分由不同密码子的替换而改变的序列,该密码子编码的氨基酸带有与其替代的氨基酸生物物理特性相似的侧链,从而产生保守的改变。例如小的非极性疏水氨基酸包括甘氨酸、丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸和蛋氨酸。大的非极性疏水氨基酸包括苯丙氨酸、色氨酸和酪氨酸。极性中性氨基酸包括丝氨酸、苏氨酸、半胱氨酸、天冬酰胺和谷氨酰胺。带正电的(碱性)氨基酸包括赖氨酸、精氨酸和组氨酸。带负电的(酸性)氨基酸包括天冬氨酸和谷氨酸。因此,将理解哪些氨基酸可以被具有相似生物物理特性的氨基酸替代,并且技术人员将知道编码这些氨基酸的核苷酸序列。
本文描述的所有特征(包括任何所附权利要求、摘要和附图)和/或如此公开的任何方法或过程的所有步骤,可以以任何组合与上述方面中的任何一个进行组合,除了这些特征和/或步骤中的至少一些互斥的组合之外。
为了更好地理解本发明,并示出如何实施本发明的实施方案,现在将以举例的方式参考附图,其中:
图1显示了靶向雌性特异性doublesex异构体。(a)雄性和雌性特异性dsx转录物和用于靶向该基因的gRNA序列(灰色阴影)的示意图。gRNA跨越内含子4-外显子5边界。gRNA的PAM以浅灰色突出显示。比例尺指示200bp的片段。外显子的编码区域以黑色阴影显示,非编码区域以白色阴影显示。内含子未按比例绘制。(b)来自冈比亚按蚊复合物的6个物种中dsx内含子4-外显子5边界的序列比对。该序列在复合物中高度保守,表明在dsx基因的该区域处存在严格的功能限制。带下划线的是用于靶向基因的gRNA,PAM以灰色突出显示。(c)专门识别外显子5和相应靶基因座的HDR基因敲除构建体的示意图。(d)使用引物组(图(c)中的箭头)的诊断PCR,以区分纯合子(dsxF-/-)、杂合子(dsxF+/-)和野生型(wt)个体中的野生型和dsxF等位基因。
图2显示了纯合dsxF-/-突变体的形态分析。(a)外显子5无效等位基因杂合性(dsxF+/-)或纯合性(dsxF-/-)的遗传雄性和雌性的形态学外观。该测定是在含有与Y染色体连锁的显性RFP标记的品系中进行的,其存在可以明确确定雄性或雌性的基因型。仅在dsxF-/-遗传雌性蚊子中观察到性形态异常。这组XX个体表现出雄性特有的特征,包括羽状触角和抱握器(箭头)。该组还发现长喙畸形,因此它们不能叮咬和吸血。显示了每种基因型的代表性样品。(b)外生殖器的放大图。所有dsxF-/-雌性都携带抱握器,这是雄性特有的特征。抱握器朝背侧旋转,而不是以正常的腹侧位置。
图3显示了dsxF突变体的生殖表型。雄性和雌性dsxF-/-和dsxF+/-个体与相应的野生型性别交配。使雌性获得血粉,随后允许其单独产卵。通过计算每胎幼虫后代的数目(n≥43)来调查生殖力。使用野生型(wt)作为比较物,发明人发现除dsxF-/-雌性以外的其他任何基因型均无显著差异(‘ns’),它们不能吸血,因此无法产下单个卵(****,p<0.0001;克鲁斯卡尔-沃利斯检验(Kruskal-Wallis))。竖线指示平均值和平均标准误差。
图4显示了dsxFCRISPRh驱动等位基因的传播速率以及杂合的雄性和雌性蚊子的繁殖力分析。与野生型蚊子杂交,分析了dsxFCRISPRh等位基因(a)(dsxFCRISPRh/+)杂合的雄性和雌性蚊子,以评估dsxFCRISPRh驱动构建体的遗传偏向(b)以及该构建体对其生殖表型的影响(c)。(b)在与野生型个体杂交的dsxFCRISPRh/+雌性或雄性蚊子(n≥42)的后代中观察到的转基因率的散点图。每个点代表源自单只雌性的后代。雄性和雌性dsxFCRISPRh/+均显示dsxFCRISPRh等位基因高达100%的向后代的高传播率。通过视觉评分后代中的与dsxFCRISPRh等位基因连锁的RFP标记确定传播率。虚线表示预期的孟德尔遗传。(c)散点图显示了平均传播率(±平均标准误差),并显示了在一次食血粉后,由dsxFCRISPRh/+蚊子与野生型个体杂交而由单只雌性产下的幼虫数目。显示了平均后代计数(±平均标准误差)。(****,p<0.0001;克鲁斯卡尔-沃利斯检验)。
图5显示了dsxFCRISPRh等位基因传播的动态及其对种群繁殖能力的影响。设置两个笼,初始种群为300只野生型雌性、150只野生型雄性和150只dsxFCRISPRh/+雄性,每个笼的dsxFCRISPRh等位基因频率为12.5%繁殖。对每一代的dsxFCRISPRh蚊子的频率进行评分(a)。在第2代和第11代笼2(灰色)和笼1(黑色)中,驱动等位基因均普遍达到100%,与确定性模型(虚线)一致,该模型考虑了从繁殖力测定中获得的参数值。假设最大种群为650只,则进行了20次随机模拟(浅灰线)。(b)测量每个笼的总卵产量,并相对于第一代的产量进行归一化。每个笼的繁殖产量受到抑制,导致种群在第8代(笼2)或第12代(笼1)之前完全崩溃(黑色箭头)。表1中提供了模型中包括的参数估计。
图6显示了HDR介导的事件正确整合以生成dsxF-的分子确认。进行PCR以验证dsx
Figure BDA0002851107610000181
敲入整合的位置。设计引物(箭头)以结合
Figure BDA0002851107610000182
构建体的内部和供体质粒K101中所包括的用于同源性定向修复(HDR)的区域(灰色虚线)的外部。只有在正确HDR整合的情况下,才应当生产预期大小的扩增子。凝胶显示了在dsx
Figure BDA0002851107610000191
敲入品系(dsxF-)3个个体的5’(左)和3’(右)进行的PCR反应,以野生型(wt)作为阴性对照。
图7显示了dsxF-/-内部生殖器官的形态。(a)3日龄雌性dsxF-/-个体的睾丸样性腺。细胞之间没有分层,也没有精子的迹象。(b)对dsxF-/-遗传雌性进行的解剖显示存在类似于副腺(箭头)的器官,副腺是典型的雄性内部生殖器官。
图8显示了dsxFCRISPRh驱动构建体的发展及其预测的归巢过程和基因座的分子确认。(a)驱动构建体(CRISPRh盒)含有受生殖细胞限制性zpg启动子控制的经过人密码子优化的Cas9的转录单位、在神经元3xP3启动子控制下的RFP基因以及在组成型U6启动子控制下的gRNA,全部封闭在两个attB序列内。使用重组酶介导的盒式交换(RMCE),通过将含有该盒的质粒和含有
Figure BDA0002851107610000192
重组转录单位的质粒注射入胚胎,将该盒插入靶基因座。在减数分裂过程中,Cas9/gRNA复合物在靶基因座(DSB)处切割野生型等位基因,并且在此过程中通过HDR(归巢)破坏外显子5将构建体复制到野生型等位基因。(b)成功RMCE事件的分子确认的代表性实例。结合CRISPRh盒组件的引物(箭头)与结合构建体周围基因组区域的引物组合在一起。在多个个体以及野生型对照(wt)的CRISPRh盒两侧(5’和3’)上进行PCR。
图9显示了设计为在zpg的启动子和终止子区域的调控下表达Cas9的基因驱动,与vasa2启动子相比,它们显示出高比例的偏向传播率和基本上提高的繁殖力。进行表型分析,以测定基于vasa和zpg启动子的每个基因驱动的繁殖力和传播率。确定与野生型杂交的单个驱动杂合子的幼虫产量(左),以及就连锁至构建体的DsRed的存在对其后代进行评分(右)。还显示了平均后代计数和传播率(±平均标准误差)。
图10显示了dsxFCRISPRh驱动等位基因的母本或父本遗传影响杂合子的繁殖力和传播偏向。遗传了母本或父本驱动等位基因拷贝的雄性和雌性dsxFCRISPRh杂合子(dsxFCRISPRh/+)与野生型杂交,并评估了构建体的遗传偏向(a)和生殖表型(b)。(a)从单交系(n≥15)的后代中筛选出与dsxFCRISPRh驱动等位基因连锁的DsRed标记基因的部分(例如G1♂→G2♀代表从父本那里获得驱动等位基因的杂合雌性)。无论等位基因是母本遗传还是父本遗传,雄性和雌性的归巢水平同样都很高。虚线表示预期的孟德尔遗传。显示了平均传播率(±平均标准误差)。(b)个体杂交的孵化幼虫计数显示,雌性dsxFCRISPRh杂合子的繁殖力成本在等位基因是父系遗传时更强。显示了平均后代计数(±平均标准误差)。(***,p<0.001;****,p<0.0001;克鲁斯卡尔-沃利斯检验)。
图11显示了驱动随机丢失的概率与雄性驱动杂合子初始数目的函数关系。为了在笼养实验设置中计算驱动随机损失的概率,对于雄性驱动杂合体个体的每个初始数目(h0),在随机笼养模型的1000个模拟中,发明人记录了40代中驱动不出现的次数(因此并没有消除种群)。每个数据点代表随机笼养模型的1000个单独模拟。
图12A至C显示了序列中的变体和缺失的抗性图。来自笼养实验的第4代(第2、3、4和5代)的靶位点的合并(pooled)扩增子测序揭示了靶位点(a)处的一系列非常低频率的插入缺失,没有一个显示出任何正向选择的迹象。从两个笼的深度测序分析中,计算出每个核苷酸位置的插入、缺失和取代频率,作为所有非驱动等位基因的分数。对于每个笼,显示了扩增子中插入和缺失(b)的分布。显示了来自不同代的插入和缺失的贡献。对于两个笼,在切割位点周围的区域(虚线区域±20bp)中观察到总插入缺失频率的显著变化(p<0.01)。与其余扩增子相比,切割位点(阴影区域±20bp)周围的取代频率(c)没有观察到显著变化,这证实了基因驱动在目标基因座上没有产生任何取代活性,并且实验室种群在整个扩增子中没有SNP形式的任何持续变异(standing variation)。
图13显示了按蚊属成员的dsx雌性特异性外显子5的序列比较以及从非洲冈比亚按蚊获得的SNP数据。(a)16种按蚊属物种中dsx内含子4-外显子5边界与dsx雌性特异性外显子5的序列比较16。内含子4-外显子5边界的序列在形成冈比亚按蚊物种复合体(以粗体显示)的六个物种中完全保守。带下划线的是用于靶向基因的gRNA,以灰色突出显示PAM。(b)从非洲捕获的765只冈比亚按蚊获得的SNP频率17。在dsx雌性特异性外显子5上,只有2个SNP变体(以箭头显示)的频率为2.9%(gRNA互补序列中的SNP)和0.07%(SEQ ID No:59)。
图14显示了体外切割试验,测试了dsxFCRISPRh基因驱动中gRNA切割dsx外显子5靶位点(其具有在非洲野生种群中发现的SNP)的效率。针对在dsx外显子5(SEQ ID No:60)中含有野生型(WT)靶位点或在相同位点含有在野外捕获种群(SNP)中发现的单个SNP(SEQ IDNo:61)的线性化质粒,使用Cas9酶与该研究所用的gRNA的RNP复合物,进行体外切割试验。纯化体外切割试验的产物,并在凝胶上进行分析。WT和含有SNP的靶位点均对RNP复合物的切割活性敏感,如减小的高分子量带和预期大小的两个切割产物的存在所示。含有与gRNA互补的WT序列但没有PAM序列的dsx外显子5靶位点被用作对照(‘无PAM’)(SEQ ID No:62)。
图15A至D。与vas2启动子相比,设计用于在zpg、nos和exu生殖细胞启动子调控下表达Cas9的基因驱动显示出高比例的偏向传播和显著改善的繁殖力。(a)单倍剂量充足的雌性育性基因AGAP007280及其在外显子6中的靶位点(灰色突出显示)显示了与前间区序列(protospacer)邻近基序(蓝绿色突出显示)和切割位点(红色虚线)。(b)使用
Figure BDA0002851107610000211
重组酶介导的盒式交换(RCME)将CRISPRh等位基因插入AGAP007280中的靶。每个CRISPRh RCME载体均设计为含有在nos、zpg或exu生殖细胞启动子转录控制下的Cas9、在普遍存在的U6PolIII启动子控制下靶向AGAP007280的gRNA以及3xP3::DsRed标记。(c)进行表型测定,以测量三个驱动中每个驱动的繁殖力和传播率。确定与野生型杂交的单个驱动杂合子的幼虫产量(左),并就与该构建体连接的DsRed的存在对其后代进行评分(右)。通过从雄性或雌性亲本继承CRISPRh构建体,进一步将雄性和雌性分开。例如,♂→♀表示已经从杂合雄性继承了驱动等位基因的杂合CRISPRh雌性的后代和传播率。还显示了平均后代计数和传播率(±平均标准误差)。在zpg-CRISPRh和nos-CRISPRh雄性和雌性的生殖细胞中观察到高水平的归巢,但是exu启动子在雄性的生殖细胞中仅产生中等水平的归巢,而雌性没有。单个杂交的孵化幼虫计数显示,与vas2启动子相比,基于zpg、nos和exu启动子的含有CRISPRh等位基因的杂合雌性的繁殖力有所提高。在每种情况下,孵化幼虫的平均数目均相对于野生型对照或同等的CRISPRh杂合雄性有所提高(由此预计没有繁殖力成本)。对于zpg,对G2和G3进行表型分析,对于nos,对G3和G4进行表型分析,对于exu,对
Figure BDA0002851107610000221
进行表型分析。♀*表示具有抗性(R1)等位基因的杂合vas2-CRISPRh雌性,使用这些是因为杂合vas2-CRISPRh雌性通常是不育的。
图16A至B显示了基于zpg启动子的CRISPRh基因驱动在整个疟疾蚊子的笼养种群中传播,并导致生殖产量的显著下降。(a)相等数量的CRISPRh/+和WT个体用于启动重复的笼养种群,并且通过筛选幼虫后代中是否存在与CRISPRh构建体连锁的DsRed来记录驱动修饰的蚊子的频率。实线显示来自zpg的两个重复笼的结果(黑色)和vas2的先前结果(灰色)。根据观察到的雄性归巢参数值(zpg=83.6%,vas2=98.4%)、雌性归巢(zpg=93.4%,vas2=98.4%)、杂合雌性适应度(zpg=83%,vas2=9.3%),纯合雌性完全不育,以及假设雄性中无适应度成本,针对zpg(黑色虚线)和vas2(灰色虚线)给出确定性预测。(b)使用较低的10%CRISPRh/+释放率来引发另外两个的重复种群,其中驱动修饰的蚊子的频率(实线)和整个卵后代的计数(虚线)按照每一代被记录下来。
图17显示了笼养释放中基于vas2和zpg的基因驱动传播过程中野生型、抗性和非抗性等位基因的频率变化。在整个笼养种群的合并(pooled)样本中,通过跨靶位点的扩增子测序,确定了早期和后代的野生型和突变等位基因的性质和频率。在任何代中频率均高于1%的等位基因被识别为野生型(灰色)、R1(红色和粉红色交替)和R2(蓝色和紫色交替),各代中频率分别低于1%的其余等位基因归为一类(黄色)。最左边的列显示了以前发表的以50%频率释放的基于vas2的驱动的重复笼中的等位基因频率数据(Hammond和Kyrou等人,2017),中间和最右边的列显示了分别以50%和10%释放的基于zpg的驱动的重复笼中的新等位基因频率数据。已在50%释放的第2代中(虚线框内),在vas2笼中14种不同突变等位基因以超过1%的频率存在,相比之下,每个zpg笼中只有两个等位基因。先前已确认在zpg笼中突出显示的所有R1等位基因都可以恢复繁殖力,而在vas2笼中突出显示的R1等位基因包括所有整码突变,无论它们是否已被证实可以恢复繁殖力。
实施例
本文描述的本发明依赖于将位点特异性核酸酶基因插入选择的基因座中,其信息既赋予个体一些目的性状又导致该性状的遗传偏向。该方法依靠“归巢”导致抑制。本发明集中于种群抑制,其中基因驱动构建体被设计成以破坏基因产物或其特异性异构体的方式插入靶基因内。为了构建本发明的基于核酸酶的基因驱动,将核酸酶基因插入基因组中其自身的识别序列内,使得含有核酸酶基因的染色体不能被切割,但是缺少该核酸酶基因的染色体被切割。当个体同时含有携带核酸酶的染色体和未修饰的染色体(即基因驱动的杂合子)时,未修饰的染色体会被核酸酶切割。通常使用含有核酸酶的染色体作为模板修复断裂的染色体,并通过同源重组过程将核酸酶复制到靶向的染色体中。如果允许此过程(称为“归巢”)在生殖细胞中进行,那么它将导致核酸酶基因的遗传偏向及其相关的破坏,因为生殖细胞中产生的精子或卵子可以从原始的携带核酸酶的染色体或新近修饰的染色体继承该基因。
由于基因驱动施加了负的繁殖负荷,因此有望针对抗性等位基因进行选择。这种抗性的最可能来源是靶位点处的序列变异,该变异可阻止核酸酶切割,但同时又允许靶基因产生功能性产物。此类变异可以预先存在于种群中,或可以由核酸酶本身的活性产生——一小部分切割的染色体(而不是使用同源染色体作为模板)可以通过末端连接(EJ)进行修复,这可以在修复靶位点时引入小的插入或缺失(“indels”)或碱基取代。预期在存在基因驱动的情况下,框内插入缺失或保守取代会显示出选择。发明人先前已经在笼养实验中观察到靶点抗性(数据未显示),并且发现由于亲本沉积的核酸酶,早期胚胎染色体中的末端连接很可能是靶点处抗性等位基因的主要来源。
在减轻和预防抗性等位基因的出现中,发明人正在研究的策略涉及通过表达来自启动子的核酸酶来减少末端连接突变的胚胎来源,该启动子显示出更严格的、生殖细胞限制的表达以及更少的母本和父本沉积,例如nanos(nos)、零种群(zpg)和exuperentia(exu)。
材料和方法
笼养实验的合并扩增子测序
如之前Hammond和Kyrou(2017)6所述进行合并扩增子测序。从第0、2、5和8代的笼养试验中将多达600只成蚊匀浆,并使用Wizard Genomic DNA纯化试剂盒(Promega)在合并的组中提取。使用KAPA HiFi HotStart Ready Mix PCR试剂盒(Kapa Biosystems),在50μl反应中,从90ng的每个基因组样品中扩增跨越靶位点的332bp基因座。引物被设计为包括Illumina Nextera转座酶接头(带下划线),7280-Illumina-F(TCGTCGGCAGCGTCAGATGTGTA TAAGAGACAGGGAGAAGGTAAATGCGCCAC–SEQ ID No:63)和7280-Illumina-R(GTCTCGTGG GCTC GGAGATGTGTATAAGAGACAGGCGCTTCTACACTCGCTTCT–SEQ ID No:64)用于下游文库制备和测序。将引物在68℃退火20秒,以最大程度地减少靶扩增。为了保持靶位点处等位基因频率的准确代表,在20个循环时移除25μL PCR反应物,同时使反应物不饱和并保存在-20℃。剩余的25μL进行额外的20个循环,以在琼脂糖凝胶上验证反应。非饱和样品用AMPure XP珠子(Beckman Coulter)纯化并用于第二个PCR反应中,在该第二PCR反应中,根据Illumina 16S元基因组测序文库制备规程(Illumina 16S Metagenomic Sequencing LibraryPreparation protocol#15044223),添加了Nextera XT Index Kit的双重标记体和Illumina测序接头。再次使用AMPure XP珠子纯化PCR,并用Agilent Bioanalyzer 2100进行验证。使用Illumina MiSeq仪器,以2x250 bp配对末端运行,在Illumina Nano流动池v2上以10pM的浓度在合并反应物中进行标准化的文库测序。
使用zpg启动子驱动了基因驱动构建体中的Cas9表达
靶向dsxF的基因驱动构建体在设计上与Hammond等人所述的相同。除了围绕Cas9基因的启动子和3’UTR(以前来自vasa直系同源基因(AGAP008578))外,在当前的构建体中,这些被生殖细胞特异性基因AGAP006241的上游1074bp和下游的1034bp取代,零种群生长(zpg)的假设直系同源物。发明人对AGAP007280中完全相同的靶基因座上杂合的vasa和zpg驱动的基因CRISPRh构建体中的个体的繁殖力和归巢率进行了比较,先前在Hammond等人中进行了描述(图9)。单个杂交的孵化幼虫计数显示,杂合雌性的繁殖力有所提高,这些雌性含有基于zpg的CRISPRh等位基因,其中幼虫产量为野生型对照的50-53%,相比之下vasa仅为8.4%。在雄性中未观察到繁殖力效应。为了评估归巢水平,将驱动杂合子杂交至野生型,使其单独产卵,并就与该构建体连锁的DsRed的存在对它们的后代进行评分。雄性的zpg构建体传播率超过91.9%,雌性超过98.7%——对于先前观察到的vasa构建体的传播率,雄性为99.6%,雌性为97.7%。
驱动随机丢失的概率与雄性驱动杂合子的初始数目的函数关系
为了计算笼养实验设置中的驱动随机损失的概率,对于雄性驱动杂合个体的每个初始数目(h0),在随机笼养模型的1000个模拟中,发明人记录了在40代中驱动不出现的次数(因此并没有消除种群)。每个数据点代表随机笼养模型的1000个单独模拟(图11)。
针对野生型和SNP变异靶位点的体外切割试验
发明人进行了体外切割试验,以检测本研究中使用的gRNA切割靶位点的能力,该靶位点并入非洲野生种群中发现的SNP(图14)。使用金门(Golden Gate)克隆和经修饰的引物以携带合适的突出端,发明人将两个靶序列分别引入到2kb质粒中。作为对照,发明人还制备了质粒,其携带dsx靶位点的修饰形式,而没有SNP,该SNP缺少Cas9切割所必需的PAM序列。在切割试验之前,将所有三个载体线性化并在凝胶上验证。对于切割试验,发明人使用了由Synthego(美国)提供的现成的sgRNA和酶形式的化脓性链球菌(S.pyogenes)Cas9核酸酶(NEB)。为了形成核糖核蛋白颗粒(RNP),发明人将相同摩尔比的sgRNA和Cas9蛋白混合到40μl反应物中至终浓度400nM,并在室温下孵育10分钟。以终浓度为40mM将线性化底物加入到反应物中,终体积为50μl,并在37℃下孵育30分钟。添加蛋白酶K以终止反应,20μl在凝胶上验证。
启动子和终止子序列的扩增
使用Vectorbase(Giraldo-Calderon等人,2015)中提供的已发表的冈比亚按蚊基因组序列作为设计引物的参考,以扩增三个冈比亚按蚊的基因的启动子和终止子:AGAP006098(nanos)、AGAP006241(零种群生长)和AGAP007365(exuperantia)。
使用表3中提供的引物,发明人使用Wizard Genomic DNA纯化试剂盒(Promega)对从G3品系的野生型蚊子中提取的40ng基因组材料进行PCR。修饰引物以含有合适的吉普生(Gibson)组装突出部分(带下划线),用于随后的载体组装。用于nos的启动子和终止子片段分别为2092bp和601bp,用于zpg的启动子和终止子片段分别为分别为1074bp和1034bp,用于exu的启动子和终止子片段分别为分别为849和1173bp。所有调控片段的序列见表4。
CRISPRh驱动构建体的生成
发明人修饰了先前在Hammond等人(2016)2中使用的可获得的模板质粒,以替代并测试了在蚊子生殖细胞中表达Cas9蛋白的可替代的启动子和终止子。在该研究中使用的p16501携带了在vas22启动子和终止子的控制下人类优化的Cas9(hCas9),在神经元3xP3启动子控制下的RFP盒,以及在冈比亚按蚊中靶向AGAP007280基因的U6:sgRNA盒。
分别使用限制酶XhoI+PacI和AscI+AgeI,从质粒p16501切下hCas9片段和骨架(含有3xP3::RFP和U6::gRNA盒的序列)。凝胶电泳片段随后通过Gibson组装与zpg、nos或exu的PCR扩增的启动子和终止子序列进行重组,以创建名为p17301(nos)、p17401(zpg)和p17501(exu)的新CRISPRh载体。
在AGAP007280处将驱动构建体转化到基因组中
将含有在zpg、nos和exu启动子控制下的Cas9的CRISPRh构建体插入到先前在AGAP007280的靶位点产生的hdrGFP对接位点处(Hammond等人,2016)。
在80%相对湿度和28℃的标准条件下饲养hdrGFP-7280品系的冈比亚按蚊,并如前所述将新鲜产下的胚胎用于显微注射(Fuchs等人,2013)。如前所述(Fuchs等人,2013),对新鲜产下的胚胎进行显微注射。重组酶介导的盒式交换(RCME)反应是通过将每个新的CRISPRh构建体注射到先前在AGAP007280的靶位点产生的hdrGFP对接系的胚胎中来进行的(Hammond等人,2016)。对于每种构建体,向胚胎注射含有CRISPRh(400ng/μl)和vas2::整合酶辅助质粒(400ng/μl)的溶液(Volohonsky等人,2015)。存活的G0幼虫与野生型转化子杂交,通过从GFP(存在于hdrGFP对接位点)到连锁到CRISPRh构建体的DsRed改变鉴定了野生型转化体,这表明RCME成功。
基因靶向和盒整合的分子确认
使用基因组DNA(该基因组DNA使用Wizard Genomic DNA纯化试剂盒(Promega)提取)通过PCR证实了成功将CRISPRh构建体RMCE整合到基因组中位于AGAP007280处。结合整合盒的引物(hCas9-F7和RFP2qF)与结合AGAP007280中相邻基因组整合位点的引物(Seq-7280-F和Seq-7280-R)一起使用,以验证CRISPRh盒的存在以及方向。引物序列可在(补充表S2)中找到。
笼养实验
笼养试验是按照Hammond等人(2016)之前描述的相同原理进行的。简而言之,已从母本遗传了驱动的杂合zpg-CRISPRh与年龄匹配的野生型在L1以10%或50%的杂合子频率混合。在蛹阶段,对于每个初始释放频率,选择600只启动复制笼。将成蚊交配5天后,再用麻醉的小鼠为它们喂血。两天后,将蚊子放在装满水并衬有滤纸的300ml产卵碗(egg bowl)中。每代,将所有卵孵化两天,筛选随机选择的600只幼虫以通过DsRed的存在确定转基因率,然后将其用于产卵下一代。从第4代开始,第二次给成蚊喂血,并使用JMicroVisionV1.27对整个产卵进行拍照和计数。将幼虫放在2L托盘中在500ml水中饲养,每个托盘的密度为200只幼虫。重新获得后代后,收集整个成年种群并将来自第0、2、5和8代的全部样品用于合并的扩增子序列分析。
表型化验以测量繁殖力和归巢率
将来自三个新品系zpg-CRISPRh、nos-CRISPRh、zpg-CRISPRh的杂合CRISPRh/+蚊子与相等数量的野生型蚊子在雄性和雌性杂交中交配5天。在第六天,用麻醉小鼠的血饲喂雌性,并在三天后,将至少40只允许单独在装有水并衬有滤纸的25-ml杯子中产卵。对每只个体的所有幼虫后代进行计数,并筛选至少50只幼虫以使用尼康倒置荧光显微镜(EclipseTE200)来确定与CRISPRh等位基因连锁的DsRed的频率。分析排除了未产生后代且其受精囊无精子迹象的雌性。使用克鲁斯卡沃利斯检验(Kruskal-Wallis)评估基因型之间的统计差异。
种群遗传模型
为了对笼养实验的结果进行建模,发明人对基因型频率使用了离散生成递归方程,分别对雄性和雌性进行了处理。F_ij(t)和M_ij(t)表示在总雌性(或雄性)种群中,基因型为i/j的雌性(或雄性)的频率。发明人考虑了三个等位基因,W(野生型)、D(驱动)和R(非功能抗性),因此是六个基因型。
归巢
W/D基因型的成蚊在减数分裂时产生配子的比例为W:D:R,如下所示:
(1-df)(1-uf):df:(1-df)uf雌性中
(1-dm)(1-um):dm:(1-dm)um雄性中
此处,d_f和d_m是两个性别中的驱动等位基因的传播率,u_f和u_m是减数分裂末端连接中非功能抗性(R等位基因)的非驱动配子的分数。在所有其他基因型中,遗传是孟德尔遗传。
适应度。令w_ij≤1表示基因型i/j相对于野生型纯合子w_WW=1的适应度。发明人假设对雄性没有适应度效果。雌性的适应度效果表现为基因型参与交配和繁殖的相对能力的差异。发明人假设靶基因是雌性繁殖力所需要的,因此D/D、D/R和R/R雌性是不育的;仅仅一份拷贝的靶基因(W/D、W/R)的雌性的适应度不会降低。
亲本效应
发明人认为,如果存在核酸酶,则W等位基因的进一步切割和修复可在胚胎中发生,这是由于源自具有一个或两个驱动等位基因的亲本的一个或两个贡献配子。亲本核酸酶的存在被认为会影响体细胞,因此影响雌性适应度,但对会改变基因传递的生殖细胞没有影响。以前,胚胎EJ效应(仅母本)被建模为在合子中立即起作用[1,2]。在此,发明人认为,对不同基因型和起源的雌性个体的实验测量显示出一定的适应度,表明个体可能是具有中间表型的嵌合体。因此,本发明人将具有亲本核酸酶的基因型W/X(X=W、D、R)建模为具有中等降低适应度
Figure BDA0002851107610000281
Figure BDA0002851107610000282
的个体,取决于核酸酶是否源自转基因母本、父本或二者。发明人假设,无论亲本具有一个或两个驱动等位基因,亲本效应是相同的。为简单起见,基线降低的适应度W10、W01、W11分别对应于具有母本、父本和母本/父本效应的所有基因型W/X(X=W、D、R),其适应度估计为确定性模型中表1中对于野生型的平均产卵值与孵化率的乘积相。在该模型的随机版本中,对具有不同血统的雌性个体的产卵从实验值中进行了替换采样。
表1-随机笼养模型的参数
Figure BDA0002851107610000291
Figure BDA0002851107610000301
递归方程
发明人首先考虑了每种基因型的配子贡献,包括亲本对适应度的影响。除了源自无驱动等位基因并因此没有沉积核酸酶的亲本的W和R配子外,来自W/D雌性和W/D、D/R和D/D雄性的配子还携带被传递给合子的核酸酶,这些被表示为W^*、D^*、R^*。按以下雄性和雌性基因型频率给出了由参与繁殖的雌性产生的卵中i型等位基因的比例。上标10、01或11表示由于母本、父本或二者的核酸酶而产生亲本效应(即适应度降低)的嵌合个体的频率。
Figure BDA0002851107610000302
Figure BDA0002851107610000303
Figure BDA0002851107610000304
Figure BDA0002851107610000305
Figure BDA0002851107610000306
i型等位基因在精子中的比例si是:
Figure BDA0002851107610000311
Figure BDA0002851107610000312
Figure BDA0002851107610000313
Figure BDA0002851107610000314
Figure BDA0002851107610000315
以上,
Figure BDA0002851107610000316
Figure BDA0002851107610000317
是平均的雌性和雄性适应度:
Figure BDA0002851107610000318
Figure BDA0002851107610000319
为了对笼养实验进行建模,发明人以雄性和雌性的数目相等开始,在雌性种群中,野生型雌性的初始频率F_WW=1,在雄性种群中,野生型雄性的初始频率MWW=1/2,继承来自父本的驱动的杂合子驱动雄性
Figure BDA00028511076100003110
假设后代中雌性和雌性之比为50:50,则在初始代后,下一代(t+1)中i/j型的基因型频率在雄性和雌性中是相同的,Fij(t+1)=Mij(t+1)。假设随机交配,则根据上一代的配子比例,在以下方程组中,两者均由Gij(t+1)给出:
GWW(t+1)=eWsW
Figure BDA00028511076100003111
Figure BDA00028511076100003112
Figure BDA00028511076100003113
Figure BDA00028511076100003114
Figure BDA00028511076100003115
Figure BDA00028511076100003116
GWR(t+1)=eWsR+eRsW
Figure BDA00028511076100003117
Figure BDA00028511076100003118
Figure BDA00028511076100003119
Figure BDA00028511076100003120
Figure BDA0002851107610000321
Figure BDA0002851107610000322
可以将转基因个体的频率与实验进行比较(RFP+个体的分数):
Figure BDA0002851107610000323
所有计算均使用沃尔夫勒姆23(Wolfram Mathematic)进行。
PCR
使用Phusion高保真预混液(Phusion High Fidelity Master Mix)进行PCR反应。初始变性在98℃下进行30秒。引物退火是在60-72℃的温度范围进行30秒,而延伸是在72℃的温度下进行30秒/kb。
表2-本研究中使用的引物
Figure BDA0002851107610000324
Figure BDA0002851107610000331
表3-用于扩增启动子的引物
Figure BDA0002851107610000332
Figure BDA0002851107610000341
表4-用于组装载体和验证插入序列的引物
Figure BDA0002851107610000342
Figure BDA0002851107610000351
结果
为了调查dsx是否代表旨在抑制种群繁殖能力的基因驱动方法的合适靶,发明人破坏了dsx的内含子4-外显子5边界,目的是防止功能性AgdsxF的形成,同时使AgdsxM转录物不受影响。发明人向冈比亚按蚊胚胎注射设计用于选择性地切割内含子4-外显子5边界的Cas9和gRNA源和同源定向修复(HDR)模板(图1c),以插入eGFP转录单位。转化的个体进行杂交,以在后代中产生纯合和杂合突变体。通过使用跨越插入位点的引物的诊断PCR证实了HDR介导的整合,产生了对于HDR事件的预期大小的较大扩增子以及对于野生型等位基因的较小的扩增子,因此可以轻松确认基因型(图1d)。
eGFP构建体的敲入导致外显子5(dsxF-)编码序列的完全破坏,并已通过PCR和染色体整合的基因组测序得到证实(图6)。产生的杂合子个体、野生型、dsxF-等位基因的杂合和纯合个体的杂交的预期孟德尔比率为1:2:1,表明在发育过程中没有明显的与突变相关的致死性(表4)。
表4-通过杂合dsxΦC31敲入蚊子杂交收获的幼虫比例
GFP强(dsxF-/-) GFP弱(dsxF-/+) 无GFP(+/+) 总计
262(24.9%) 523(49.7%) 268(25.5%) 1053
外显子5破坏的杂合子幼虫发展为成年的雄性和雌性蚊子,性别比接近1:1。相反,一半的dsxF-/-个体发展为正常雄性,而另一半则表现出雄性和雌性二者的形态特征以及内部和外部生殖器官(雌雄间性)中的多种发育异常。
为了确定这些dsxF-/-雌雄间性的性别基因型,发明人将突变体渗入了含有Y连锁可见标记(RFP)的品系中,并使用该标记的存在明确地将性别基因型分配给了无效突变的杂合子和纯合子。该方法表明,仅在对无效突变纯合的基因型雌性中观察到雌雄间性表型。发明人发现杂合突变体没有起作用,表明dsx的雌性特异性是单倍剂量充足的。
对dsxF-/-基因型雌性的外部性二态结构的检查显示出一些表型异常,包括:向背侧旋转的雄性抱握器(和雌性尾须缺失)的发展、与雄性的羽状触角相关的更长的鞭小节(图2)。对这些个体的内部生殖器官进行的分析未能显示出卵巢和精子囊完全发育的情况。取而代之的是,它们被雄性附件腺(MAG)所取代,在某些情况下
Figure BDA0002851107610000361
被未充分发育的类似于无结构睾丸的基本梨形器官所替代(图7)。
在杂合性或纯合性中带有dsxF-无效突变的雄性显示出野生型的繁殖力水平,如通过每个交配雌性的窝大小和幼体孵化所测量,杂合的dsxF-雌性蚊子也是如此。相反,雌雄间性XX dsxF-/-雌性蚊子虽然被麻醉的老鼠吸引,却无法食用血餐并且无法产生卵子(图3)。
dsxF-/-在雌性中出人意料的强烈表型证明了dsx外显子5在知之甚少冈比亚按蚊的性别分化途径中的关键功能作用,并表明其序列可以作为旨在抑制种群数量的基因驱动方法的合适靶。
发明人采用重组酶介导的盒式交换(RMCE)来用dsxFCRISPRh基因驱动构建体替换3xP3::GFP转录单元,该构建体包括RFP标记基因、表达靶向dsxF的gRNA的转录单元,以及在零种群增长(zpg)生殖细胞启动子及其终止子序列的控制下的Cas9基因(图8)。与以前的基因驱动构建体中使用的vasa启动子相比,zpg启动子显示出了更好的生殖细胞表达和特异性的限制(Hammond和Crisanti未发表)。将dsxFCRISPRh整合到其目标基因座中的成功RMCE事件已在那些将GFP换成RFP标记的个体中得到证实。在减数分裂过程中,Cas9/gRNA复合物在靶序列处切割野生型等位基因,并且dsxFCRISPRh盒通过HDR(“归巢”)复制到wt基因座,其在这个过程中破坏了外显子5。
通过对与野生型蚊子杂交的杂合亲本(后文称为dsxFCRISPRh/+)后代的RFP遗传率进行评分,分析了dsxFCRISPRh构建体归巢和绕过孟德尔遗传的能力。出人意料之外的是,杂合dsxFCRISPRh/+雄性和雌性蚊子的后代均观察到高达100%的高dsxFCRISPRh传播率(图4a)。还评估了dsxFCRISPRh系的繁殖力,以揭示由于核酸酶在体细胞中异位表达和/或核酸酶在新受精的胚胎中的亲本沉积所致的潜在负面影响(图4b)。这些实验表明,虽然杂合dsxFCRISPRh/+雄性的繁殖力(以每个受精雌性的幼虫后代评估)与野生型雄性没有区别,但是杂合dsxFCRISPRh/+雌性的繁殖力总体降低(平均繁殖力49.8%+/-6.3%标准误差,p<0.001)。
出人意料的是,发明人注意到,当驱动等位基因是从父本(平均产卵力为21.7%+/-8.6%)而不是从母本(64.9%+/-6.9%)遗传而来时,杂合雌性的繁殖力更加严重降低(图10)。不希望受任何特定理论的束缚,发明人相信这可以被解释为假设活性Cas9核酸酶在父本中沉积到新受精的受精卵中,该受精子在大量细胞中通过末端连接或HDR随机诱导从dsx转化为dsxF-,会导致雌性繁殖力降低。与此假设相一致,一些杂合雌性接受父本的dsxFCRISPRh等位基因显示出体细胞镶嵌表型,包括不同的外显率,不存在受精囊和/或形成不完整的抱握器对。考虑到构建体的遗传偏好、杂合子个体的繁殖力、雌雄间性表型以及核酸酶对雌性繁殖力的父系沉积而建立的数学模型表明,dsxFCRISPRh在笼养种群中具有达到100%频率的潜力在9到13代之间取决于起始频率和随机性(图5a)。
为了检验该假设,将笼养的野生型蚊子种群与携带dsxFCRISPRh等位基因的个体混合,随后在每一代进行监测,以评估驱动力的传播并量化其对生殖产量的影响。为了模拟假设的释放情况,发明人在两个同样的笼中开始实验,将300只野生型雌性蚊子与150只wt雄性蚊子和150只dsxFCRISPRh/+雄性个体放在一起,使其交配。计算从整个笼中产生的卵,并随机选择650个卵以繁育下一代。筛选从卵中孵出的存在RFP标记的幼虫,以对每一代中包含dsxFCRISPRh等位基因的后代进行计数。在前三代中,发明人在两个笼养种群中观察到驱动等位基因从25%增加到
Figure BDA0002851107610000381
Figure BDA0002851107610000382
此后它们出现了分歧。在笼2中,驱动在第7代达到了100%的频率。在下一代中,没有卵产生,种群崩溃了。在笼1中,驱动等位基因在两代中漂移约65%之后在第11代达到了100%的频率。该笼种群也未能在下一代中产卵。尽管两个笼在传播动力学上都表现出一些明显的差异,但两条曲线都落入了模型的预测范围内(图5b)。表6显示了笼养试验的汇总。
本发明人还监测了不同代在靶位点处的突变的发生,以鉴定核酸酶抗性功能变体的发生。从在第2、3、4和5代收集的合并种群样本中靶序列的扩增子测序表明,在切割位点存在几个低频插入缺失,这些缺失似乎均未编码功能性AgdsxF转录物(图10A至C)。因此,随着驱动的频率随着代逐渐增加,鉴定出的变体均未显示出任何正向选择的迹象,从而表明所选择的靶序列具有严格的功能和结构约束。冈比亚按蚊中外显子5的高度保守性16,17以及对蚊子生殖生物学至关重要的高度调控的剪接位点为这一观点提供了支持。
根据敲除等位基因中GFP转录单位提供的荧光强度分离dsxF-等位基因的杂合和纯合个体。以预期的孟德尔比率1:2:1回收,可区分纯合突变体,这表明在L1幼虫阶段,Agdsx的雌性特异性异构体的破坏不是致命的。
表5-携带雄性特异性特征的插入纯合的遗传雌性
Figure BDA0002851107610000383
Figure BDA0002851107610000391
发明人假设对具有来自一个或两个亲本的核酸酶的非驱动(W/W、W/R)雌性的适应度(卵产量和孵化率)的亲本效应与具有亲本效应的驱动杂合子(W/D)雌性的观察值相同。对于组合的母本和父本效应(核酸酶来自亲本双方),假设母本和父本效应的观察值中的最小值。
表6-由笼养试验获得的值汇总
Figure BDA0002851107610000392
Figure BDA0002851107610000401
在笼养实验中,每一代的转基因率、孵化率、产卵量和繁殖负荷。繁殖负荷表明与第一代相比,每一代的产卵量均受到抑制。
进行了表型分析,以同时测量三个驱动中每个驱动的繁殖力和传播率(图15c)。为了评估归巢水平,将驱动杂合子与野生型杂交,使其单独产卵,并对它们存在连锁至构建体的DsRed的后代进行评分(图15c)。
母本或父本沉积的Cas9可以在胚胎中引起抗性突变,这可能会降低下一代的归巢率(Hammond和Kyrou等人,2017)。为了测试这种效应,发明人通过雄性和雌性驱动杂合子是否从母本或父本那里继承了驱动,来分离雄性和雌性驱动杂合子,并对其后代中的驱动的遗传进行评分(图15c)。不论驱动遗传如何,所有三个启动子均在雄性中诱导归巢,而zpg-CRISPRh和nos-CRISPRh在雌性中也显示出有偏向的传播。zpg-CRISPRh在雄性中的传播率超过90.6%,在雌性中超过97.8%,仅略低于先前观察到的vas2-CRISPRh在雄性中为99.6%,在雌性中为97.7%(Hammond等人,2016)。nos启动子还显示出高传播,在雄性中超过83.6%,在雌性中超过85.1%。当驱动是从雄性亲本那里继承来的时,这些比例显著更高(在雄性中为99.1%,在雌性中为99.6%),表明nos::Cas9是母本沉积的。exu启动子允许在雄性中的偏向传播率(64%),而在雌性(51%)中则无偏向。这些归巢率经过20多代后仍保持相似,表明驱动非常稳定。
进行繁殖力测定以测量驱动杂合子与野生型的各个杂交中的幼虫产量(图15c)。与野生型对照相比,所有新驱动均显示出相对繁殖力的显著改善。其中vas-CRISPRh雌性的相对雌性繁殖力约为8.4%,zpg-CRISPRh(50-58.3%)、nos-CRISPRh(40.2-55.9%)和exu-CRISPRh(75.5-77.4%)的相对繁殖力都极大改善。此外,nos-CRISPRh和exu-CRISPRh雄性幼虫产量的减少可能代表了因为不同的饲养和产卵条件而不是核酸酶活性本身带来的随机变异。野生型对照之间的巨大差异支持了这一假设。因此,以上值仅用作对繁殖力的粗略估计,可证明其相对于vas2有了显著改善。
为了测试zpg-CRISPRh在整个疟原虫种群中传播的潜力,用10%或50%的驱动杂合子启动了两个重复笼,并监测了16代。值得注意的是,该驱动在所有四个重复样本中均扩散到超过97%的种群(图16),并且仅在四代之后就在两个50%释放笼之一中实现了种群的完全修饰。在所有四个释放中,该驱动至少在3代内就保持了超过95%的频率,然后逐渐选择了抗驱动等位基因来逆转其传播。值得注意的是,发明人观察到了类似的传播动力学,无论是以50%还是10%释放,表明初始释放频率对扩散的可能性几乎没有影响。与靶向AGAP007280处完全相同的基因座的vas2驱动的CRISPRh相比,这些结果更加出人意料。此处,驱动的传播较慢,并且在种群中达到80%的频率之前就产生了抗性。(Hammond等人,2016)。
当靶位点序列发生变化时会产生抗性突变,这种变化可阻止核酸酶进一步识别或切割,但还会编码可拯救不育敲除表型的基因产物。尽管这些可能早已存在于种群中,但它们是由基因驱动自身产生的,它们是由很小一部分被切割的染色体(其未通过生殖细胞中的归巢修复,或在母系或父系沉积的核酸酶切割后的胚胎中)中容易出错的非同源末端连接(NHEJ)或微同源介导的末端连接(MMEJ)产生的(Hammond和Kyrou等人,2017)。
为了研究zpg-CRISPRh释放笼中抗性的性质和频率,发明人在第0、2、5和8代抗性出现之前、期间和之后收集的合并个体的样本中,通过靶基因座进行了扩增子测序(图17)。与基于vas2的驱动形成鲜明对比的是,使用zpg启动子可减少抗性突变的产生和选择。在整个笼养实验中,发明人仅在非驱动等位基因中鉴定出以超过1%的频率存在的2个突变等位基因,并且两个均存在于每个zpg-CRISPRh笼中。两个突变均为靶位点处的3bp(203-GAG-SEQ ID No:65)或6bp(203-GAGGAG–SEQ ID No:66)的框内缺失,并且先前已证实对基于vas2的基因驱动具有抗性(Hammond和Kyrou等人,2017)。到第8代,两个突变之一在非驱动等位基因中的频率已达到90%以上,但每个笼都选择了一个不同的等位基因——这表明对一个或另一个抗性突变的选择是随机的,而不是因为一个更有效重新获得繁殖力。与此相反,vas2-CRISPRh在早期世代和后期世代的每个重复中都产生了频率高于1%的6至12个突变等位基因,尽管对那些赋予的抗性进行了强烈的分层,但是这种变异等位基因的高的变化随时间推移都保持着(Hammond和Kyrou等人,2017年)。
结论
本文所述的zpg、nos和exu调控序列相比于目前用于疟疾蚊子的基因驱动中用于生殖细胞核酸酶表达的最佳系统(即vasa2启动子)具有明显优势,显示出:
1)出人意料的雄性和雌性蚊子向后代的高偏向传播率;
2)大大降低的适应度成本;
3)减少的末端连接突变,其是导致基因驱动抗性的主要原因;以及
4)在笼养实验中,在速度、持久性和最大驱动频率方面极大地改善了传播。
基于这些启动子序列的基因驱动远远优于以前测试过的所有基因驱动,可用于种群替代和种群抑制策略。基因驱动功效的改善可归因于Cas9核酸酶表达的时空调控,这是由于使用了这些新的调控序列所带来的,尤其是对生殖细胞的限制的改善。
为了说明改善的程度,发明人观察到雌性的相对适应度超过80%,而使用vasa2启动子则仅为7%,如图15D所示。基因驱动技术的最终目标是从低初始释放频率开始修饰整个种群。使用与以前发表的研究相同的方法,发明人已经观察到,使用zpg启动子有史以来第一次扩散到笼养种群中>99%的个体,相比之下,以前基于vasa2启动子的最佳测试基因驱动的最大频率为80%。当从50%的初始频率(与先前的研究相吻合)以及也从10%的初始频率(与媒介控制更相关)释放时,发明人已经证明了这种扩散。活性的提高完全可以归因于改良生殖细胞启动子的使用,因为基因驱动在其他方面是相同的,并且观察到的传播改善是基于转基因品系(其基于这些启动子)的观察特征通过数学模型预测的。
发明人已经证明,使用这些启动子构建的基因驱动不需要进一步的改善就可以入侵整个蚊子种群,并且满足针对种群替代的基因驱动系统的要求。本文所述的调控序列可用于当前正在开发的一系列技术,包括对蚊子转化的改善、驱动核酸内切酶基因以及其他依赖于蚊子生殖细胞中表达的基因驱动技术。
参考文献
1.Gantz,V.M.等人.用于疟疾媒介蚊斯氏按蚊的种群改变的高效Cas9介导的基因驱动(Highly efficient Cas9-mediated gene drive for population modification ofthe malaria vector mosquito Anopheles stephensi).美国国家科学院院报(Proc NatlAcad Sci U S A)112,E6736-6743(2015)。
2.Hammond,A.等人.靶向疟疾蚊子媒介冈比亚按蚊中雌性繁殖的CRISPR-Cas9基因驱动系统(A CRISPR-Cas9 gene drive system targeting female reproduction inthe malaria mosquito vector Anopheles gambiae).国家生物技术(Nat Biotechnol)34,78-83(2016)。
3.Burt,A.作为自然种群的控制和基因工程工具的位点特异性的自私基因(Site-specific selfish genes as tools for the control and genetic engineering ofnatural populations).生物科学进展(Proc Biol Sci)270,921-928(2003)。
4.Deredec,A.,Godfray,H.C.和Burt,A.用寻靶核酸内切酶基因有效控制疟疾的要求(Requirements for effective malaria control with homing endonucleasegenes).国国家科学院院报(Proc Natl Acad Sci U S A)108,E874-880(2011).
5.Hamilton,W.D.极高的性别比例。用于六种连锁和近交的性别比例理论对细胞遗传学和昆虫学具有新的意义(Extraordinary sex ratios.A sex-ratio theory forsex linkage and inbreeding has new implications in cytogenetics andentomology).科学(Science)156,477-488(1967)。
6.Galizi,R.等人.用于控制人类疟疾蚊子的合成性别比例失真系统(Asynthetic sex ratio distortion system for the control of the human malariamosquito).自然通讯(Nat Commun)5,3977(2014)。
7.Magnusson,K.等人.第10号染色体上按蚊的去雄性化(Demasculinization ofthe Anopheles gambiae X chromosome).BMC进化生物学(BMC Evol Biol)12,69(2012)。
8.Champer,J.等人.新型CRISPR/Cas9基因驱动构建体揭示了抗性等位基因的机制和遗传多样化种群中的驱动效率(Novel CRISPR/Cas9 gene drive constructs revealinsights into mechanisms of resistance allele formation and drive efficiencyin genetically diverse populations).美国科学公共图书馆遗传学(PLoS Genet)13,e1006796(2017)。
9.Hammond,A.M.等人.经历疟疾蚊子中多个世代的基因驱动的抗性突变的产生和选择(The creation and selection of mutations resistant to a gene drive overmultiple generations in the malaria mosquito).美国科学公共图书馆遗传学(PLoSGenet)13,e1007039(2017)。
10.Marshall,J.M.,Buchman,A.,Sanchez,C.H.和Akbari,O.S.克服对抑制种群的基于寻靶的基因驱动的进化抗性(Overcoming evolved resistance to population-suppressing homing-based gene drives).科学报告(Sci Rep)7,3776(2017)。
11.Unckless,R.L.,Clark,A.G.和Messer,P.W.抗CRISPR/Cas9基因驱动的进化(Evolution of Resistance Against CRISPR/Cas9 Gene Drive).遗传学(Genetics)205,827-841(2017)。
12.Burtis,K.C.和Baker,B.S.果蝇doublesex基因通过产生编码相关性别特异性多肽的交替剪接的mRNA来控制体细胞性别分化(Drosophila doublesex gene controlssomatic sexual differentiation by producing alternatively spliced mRNAsencoding related sex-specific polypeptides).细胞(Cell)56,997-1010(1989)。
13.Graham,P.,Penn,J.K.和Schedl,P.主人改变,奴隶留下(Masters change,slaves remain).生物论文(Bioessays)25,1-4(2003)。
14.Krzywinska,E.,Dennison,N.J.,Lycett,G.J.和Krzywinski,J.疟疾蚊子冈比亚按蚊中的雄性基因(A maleness gene in the malaria mosquito Anophelesgambiae).科学(Science)353,67-69(2016)。
15.Scali,C.,Catteruccia,F.,Li,Q.和Crisanti,A.冈比亚按蚊doublesex基因的性别特异性转录物的鉴定(dentification of sex-specific transcripts of theAnopheles gambiae gene).实验生物学期刊(J Exp Biol)208,3701-3709(2005)。
16.Neafsey,D.E.等人.蚊子基因组学。高度进化的疟疾媒介:16种按蚊的基因组(Mosquito genomics.Highly evolvable malaria vectors:the genomes of16Anopheles mosquitoes).科学(Science)347,1258522(2015)。
17.冈比亚按蚊基因组,C.等人.非洲疟疾媒介冈比亚按蚊的遗传多样性(Geneticdiversity of the African malaria vector Anopheles gambiae).自然(Nature)552,96-100(2017)。
18.Murray,S.M.,Yang,S.Y.和Van Doren,M.生殖细胞性别决定:体细胞与生殖细胞之间的合作(Germ cell sex determination:a collaboration between soma andgermline).细胞生物学最新观点(Curr Opin Cell Biol)22,722-729(2010)。
19.Curtis,C.F.可能使用易位固定害虫种群中的所需基因(Possible use oftranslocations to fix desirable genes in insect pest populations).自然(Nature)218,368-369(1968)。
20.国家科学院,工程与医学,地平线上的基因驱动:推进科学,应对不确定性以及使研究与公共价值保持一致(Gene Drives on the Horizon:Advancing Science,Navigating Uncertainty,and Aligning Research with Public Values).(国家科学院出版社,哥伦比亚特区华盛顿;2016)。
21.Papathanos,P.A.,Windbichler,N.,Menichelli,M.,Burt,A.和Crisanti,A.vasa调控区域介导了疟疾蚊子冈比亚按蚊中蛋白质的生殖细胞表达和母本传播:遗传控制策略的通用工具(The vasa regulatory region mediates germline expression andmaternal transmission of proteins in the malaria mosquito Anopheles gambiae:aversatile tool for genetic control strategies).BMC分子生物学(BMC Mol Biol)10,65,(2009).
22Hammond,A.M.等人.经历疟疾蚊子中多个世代的基因驱动的抗性突变的产生和选择(The creation and selection of mutations resistant to a gene drive overmultiple generations in the malaria mosquito).美国科学公共图书馆遗传学(PLoSGenet)13,e1007039(2017)。
23.沃尔夫勒姆(Wolfram)研究公司,2017Mathematica 11.2,伊利诺伊州香槟。
序列表
<110> 帝国科学技术与医学学院
<120> 多核苷酸
<130> 87576PCT1
<150> GB 1810256.6
<151> 2018-06-22
<160> 90
<170> PatentIn version 3.5
<210> 1
<211> 1074
<212> DNA
<213> 冈比亚按蚊
<400> 1
cagcgctggc ggtggggaca gctccggctg tggctgttct tgcgagtcct cttcctgcgg 60
cacatccctc tcgtcgacca gttcagtttg ctgagcgtaa gcctgctgct gttcgtcctg 120
catcatcggg accatttgta tgggccatcc gccaccacca ccatcaccac cgccgtccat 180
ttctaggggc atacccatca gcatctccgc gggcgccatt ggcggtggtg ccaaggtgcc 240
attcgtttgt tgctgaaagc aaaagaaagc aaattagtgt tgtttctgct gcacacgata 300
attttcgttt cttgccgcta gacacaaaca acactgcatc tggagggaga aatttgacgc 360
ctagctgtat aacttacctc aaagttattg tccatcgtgg tataatggac ctaccgagcc 420
cggttacact acacaaagca agattatgcg acaaaatcac agcgaaaact agtaattttc 480
atctatcgaa agcggccgag cagagagttg tttggtattg caacttgaca ttctgctgcg 540
ggataaaccg cgacgggcta ccatggcgca cctgtcagat ggctgtcaaa tttggcccgg 600
tttgcgatat ggagtgggtg aaattatatc ccactcgctg atcgtgaaaa tagacacctg 660
aaaacaataa ttgttgtgtt aattttacat tttgaagaac agcacaagtt ttgctgacaa 720
tatttaatta cgtttcgtta tcaacggcac ggaaagatta tctcgctgat tatccctctc 780
gctctctctg tctatcatgt cctggtcgtt ctcgcgtcac cccggataat cgagagacgc 840
catttttaat ttgaactact acaccgacaa gcatgccgtg agctctttca agttcttctg 900
tccgaccaaa gaaacagaga ataccgcccg gacagtgccc ggagtgatcg atccatagaa 960
aatcgcccat catgtgccac tgaggcgaac cggcgtagct tgttccgaat ttccaagtgc 1020
ttccccgtaa catccgcata taacaaacag cccaacaaca aatacagcat cgag 1074
<210> 2
<211> 2092
<212> DNA
<213> 冈比亚按蚊
<400> 2
gtgaacttcc atggaattac gtgctttttc ggaatggagt tgggctggtg aaaaacacct 60
atcagcaccg cacttttccc ccggcatttc aggttatacg cagagacaga gactaaatat 120
tcacccattc atcacgcact aacttcgcaa tagattgata ttccaaaact ttcttcacct 180
ttgccgagtt ggattctgga ttctgagact gtaaaaagtc gtacgagcta tcatagggtg 240
taaaacggaa aacaaacaaa cgtttaatgg actgctccaa ctgtaatcgc ttcacgcaaa 300
caaacacaca cgcgctggga gcgttcctgg cgtcaccttt gcacgatgaa aactgtagca 360
aaactcgcac gaccgaaggc tctccgtccc tgctggtgtg tgtttttttc ttttctgcag 420
caaaattaga aaacatcatc atttgacgaa aacgtcaact gcgcgagcag agtgaccaga 480
aataccgatg tatctgtata gtagaacgtc ggttatccgg gggcggatta accgtgcgca 540
caaccagttt tttgtgcagc tttgtagtgt ctagtggtat tttcgaaatt catttttgtt 600
cattaacagt tgttaaacct atagttattg attaaaataa tattctacta acgattaacc 660
gatggattca aagtgaataa attatgaaac tagtgatttt tttaaatttt tatatgaatt 720
tgacatttct tggaccatta tcatcttggt ctcgagctgc ccgaataatc gacgttctac 780
tgtattccta ccgatttttt atatgcctac cgacacacag gtgggccccc taaaactacc 840
gatttttaat ttatcctacc gaaaatcaca gattgtttca taatacagac caaaaagtca 900
tgtaaccatt tcccaaatca cttaatgtat taaactccat atggaaatcg ctagcaacca 960
gaaccagaag ttcaacagag acaaccaatt tccgtgtatg tacttcatga gatgagattg 1020
gacgcgctgg taaaatttta tatgggattt gacagataat gtaaggcgtg cgattttttt 1080
catacgatgg aatcaattca agagtcaatt gtgcaggatt tatagaaaca atctcttatt 1140
tatgttttgt tatcgttaca gttacagccc tgtcctaagc ggccgcgtga aggcccaaaa 1200
aaaagggagt ccccaacgct cagtagcaaa tgtgcttctc tatcattcgt tgggttagaa 1260
aagcctcatg tgacttctat gaacaaaatc taaactatct cctttaaata gagaatggat 1320
gtattttttc gtgccactga actttcgttg ggaagattag atacctctcc ctcccccccc 1380
ctccctttca acacttcaaa acctaccgaa aactaccgat acaatttgat gtacctaccg 1440
aagaccgcca aaataatctg gccacactgg ctagatctga tgttttgaaa catcgccaaa 1500
ttttactaaa taatgcactt gcgcgttggt gaagctgcac ttaaacagat tagttgaatt 1560
acgctttctg aaatgttttt attaaacact tgtttttttt aatacttcaa tttaaagcta 1620
cttcttggaa tgataattct acccaaaacc aaaaccactt tacaaagagt gtgtggttgg 1680
tgatcgcgcc ggctactgcg acctgtggtc atcgctcatc tcacgcacac atacgcacac 1740
atctgtcatt tgaaaagctg cacacaatcg tgtgttgtgc aaaaaaccgt tcgcgcacaa 1800
acagttcgca catgtttgca agccgtgcag caaagggctt ttgatggtga tccgcagtgt 1860
ttggtcagct ttttaatgtg ttttcgctta atcgcttttg tttgtgtaat gttttgtcgg 1920
aataattttt atgcgtcgtt acaaatgaaa tgtacaatcc tgcgatgcta gtgtaaaaca 1980
ttgctaattc ccggtaagaa cgttcattac gctcggatat catcttacga agcgtgtgta 2040
tgtgcgctag tacattgacc tttaaagtga tccttttgtt ctagaaagca ag 2092
<210> 3
<211> 849
<212> DNA
<213> 冈比亚按蚊
<400> 3
ggaaggtgat tgcgattcca tgttgatgcc aatatatgat gattttgttg catattaata 60
gttgttgtta tgttttattc aaatttcaaa gataatttac tttacattac agttagtgag 120
catattatct actacataaa cacatagatc aaactggttt acataaattc aaaaagtttg 180
gattaaaatc gcagcaattg gttatgaaaa aatatgtgca taacgtaaat atcaagtaaa 240
tttttgcatt gcatatttat agactcctgt tacaatttcg gaaaaatgaa aaatgttaat 300
taatcaaaga agaaaaaaca aagaaattaa atcattaggt agcacaacca caagtacata 360
tttttatggc atgaatattc ctctacacta acatatttta tagcaattct attgatcgcc 420
ttagtatagc ggaattacca gaacggcact atagttgtct ctgtttggca cacgcaatca 480
tttttcatcc cagggttgcc atagcagttt ggcgacggtc acgtagcatg cgaaggattt 540
cgttcgcaca ggatcacttt tattctaacg tttgaagaag gcacatctca gtgcaagcgc 600
tctggaagct gcttttaccg aacgaactaa cttttcaagt aacctcaaaa acttgtctct 660
aacgacacca cgtgctatcc gcgagtttca tttcccgtgc aaagttcccc gatttagcta 720
tcattcgtga acatttcgta gtgcctctac cctcaggtaa gaccattcga ggtttaccaa 780
gttttgtgca aagaacgtgc acagtaattt tcgttctggt gaaaccttct cttgtgtagc 840
ttgtacaaa 849
<210> 4
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> dsxgRNA-F引物
<400> 4
tgctgtttaa cacaggtcaa gcgg 24
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> dsxgRNA-R引物
<400> 5
aaacccgctt gacctgtgtt aaac 24
<210> 6
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> dsx?31L-F
<400> 6
gctcgaatta accattgtgg accggtcttg tgtttagcag gcagggga 48
<210> 7
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> dsx?31L-R引物
<400> 7
tccacctcac ccatgggacc cacgcgtggt gcgggtcacc gagatgttc 49
<210> 8
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> dsx?31R-F引物
<400> 8
caccaagaca gttaacgtat ccgttacctt gacctgtgtt aaacataaat 50
<210> 9
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> dsx?31R-R引物
<400> 9
ggtggtagtg ccacacagag agcttcgcgg tggtcaacga atactcacg 49
<210> 10
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> zpgprCRISPR-F引物
<400> 10
gctcgaatta accattgtgg accggtcagc gctggcggtg ggga 44
<210> 11
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> zpgprCRISPR-R引物
<400> 11
tcgtggtcct tatagtccat ctcgagctcg atgctgtatt tgttgt 46
<210> 12
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> zpgteCRISPR-F引物
<400> 12
aggcaaaaaa gaaaaagtaa ttaattaaga ggacggcgag aagtaatcat 50
<210> 13
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> zpgteCRISPR-R引物
<400> 13
ttcaagcgca cgcatacaaa ggcgcgcctc gcataatgaa cgaaccaaag g 51
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> dsxin3-F引物
<400> 14
ggcccttcaa cccgaagaat 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> dsxex6-R
<400> 15
ctttttgtac agcggtacac 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> GFP-F引物
<400> 16
gccctgagca aagaccccaa 20
<210> 17
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> dsxex4-F引物
<400> 17
gcacaccagc ggatcgacga ag 22
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> dsxex5-R引物
<400> 18
cccacataca aagatacgga cag 23
<210> 19
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> dsxex6-R引物
<400> 19
gaatttggtg tcaaggttca gg 22
<210> 20
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 3xP3引物
<400> 20
tatactccgg cggtcgaggg tt 22
<210> 21
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> hCas9-F
<400> 21
ccaagagagt gatcctggcc ga 22
<210> 22
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> dsxex5-R1引物
<400> 22
cttatcggca tcagttgcgc ac 22
<210> 23
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> dsxin4-F引物
<400> 23
ggtgttatgc cacgttcact ga 22
<210> 24
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> RFP-R引物
<400> 24
caagtgggag cgcgtgatga ac 22
<210> 25
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子4边界1
<400> 25
ttatgtttaa cacaggtcaa gcggtggtca 30
<210> 26
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 内含子4 外显子5边界2
<400> 26
aatacaaatt gtgtccagtt cgccaccagt 30
<210> 27
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 6个物种中的dsx内含子4-外显子5边界
<400> 27
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctca 54
<210> 28
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 28
gtttaacaca ggtcaagcgg tggtcaacga atactca 37
<210> 29
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 内含子4 外显子5边界
<400> 29
gtttaacaca ggtcaacgaa tactca 26
<210> 30
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 内含子4 外显子5边界
<400> 30
gtttaacaca ggtcggtggt caacgaatac tca 33
<210> 31
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 31
gtttaacacg gtggtcaacg aatactca 28
<210> 32
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 32
gtttaacggt ggtcaacgaa tactca 26
<210> 33
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 33
gtttaacaca ggtcaacggt ggtcaacgaa tactca 36
<210> 34
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 34
gtttaacaca ggtccggtgg tcaacgaata ctca 34
<210> 35
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 35
gtttaacacc ggtggtcaac gaatactca 29
<210> 36
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 36
gtttaaccgg tggtcaacga atactca 27
<210> 37
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 37
gtttaacaca ggtcataagc ggtggtcaac gaatactca 39
<210> 38
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 内含子4外显子5边界
<400> 38
gtttaacaca ggtcaaggac ggtggtcaac gaatactca 39
<210> 39
<211> 129
<212> DNA
<213> 冈比亚按蚊
<400> 39
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 40
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 40
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 41
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 41
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 42
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 42
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 43
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 43
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 44
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 44
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgtaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 45
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 45
cctttccatt catttatgtt taacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 46
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 46
cctttccatt catttatgtt caacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 47
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 47
cctttccatt catttatgtt caacacaggt caaacggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgtggag ttacgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 48
<211> 128
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 48
cctttccatt catttatgtt caacacaggt caaacggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgtggag ttacgcaata ccacccgtca gagtggatga 120
taaacttt 128
<210> 49
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 49
cctttccatt catttatgtt caacacaggt caagcggtgg tcaacgaata ctcaagattg 60
cataatctga acatgttcga tggcgtggag ttacgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 50
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 50
cctttccatt catttatgtt caacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgtggag ttacgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 51
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 51
ccttaccatg catttatgtt caacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgtggag ttacgcaaca ccacccgtca gagtggatga 120
taaactttc 129
<210> 52
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 52
cctttccatt catttatgtt caacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgcggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 53
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 53
cctttccatt catttatgtt caacacaggt caagcggtgg tcaacgaata ctcacgattg 60
cataatctga acatgttcga tggcgcggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 54
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 54
cctttccatt catttatgct caacacaggt caggccgtgg tcaacgaata ctcacgattg 60
cacaatctga acatgttcga tggcgtggag ttgcgcaaca ccacccgtca gagtggatga 120
taaactttc 129
<210> 55
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 55
cctttccatt catttatgct caacacaggt caggccgtgg tcaacgaata ctcacgattg 60
cacaatctga acatgttcga tggcgtggag ttgcgcaaca ccacccgtca gagtggatga 120
taaactttc 129
<210> 56
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx内含子4-外显子5边界
<400> 56
ctttgccatt tatttatgcc caacacaggt caggccgtgg tcaacgaata ctcacgattg 60
cacaatctga acatgttcga tggcgtagag ttgcgcaacg ccacccgcca gagcggatga 120
taaacttcc 129
<210> 57
<211> 37
<212> DNA
<213> 未知
<220>
<223> AGAP007280,及其在外显子6中的靶位点
<400> 57
cgaggtgagg aagaaagtga ggaggagggt ggtagtg 37
<210> 58
<211> 37
<212> DNA
<213> 未知
<220>
<223> AGAP007280,及其在外显子6中的靶位点
<400> 58
gctccactcc ttctttcact cctcctccca ccatcac 37
<210> 59
<211> 129
<212> DNA
<213> 未知
<220>
<223> dsx具有SNP变体的雌性特异性外显子5
<400> 59
cctttccatt catttatgtt taacacaggt caagcagtgg tcaacgaata ttcacgattg 60
cataatctga acatgtttga tggcgtggag ttgcgcaata ccacccgtca gagtggatga 120
taaactttc 129
<210> 60
<211> 23
<212> DNA
<213> 未知
<220>
<223> dsx外显子5中的野生型(WT)靶位点
<400> 60
gtttaacaca ggtcaagcgg tgg 23
<210> 61
<211> 23
<212> DNA
<213> 未知
<220>
<223> 含有在野生捕获群体中发现的单个SNP的dsx外显子5中的靶位点
<400> 61
gtttaacaca ggtcaagcag tgg 23
<210> 62
<211> 20
<212> DNA
<213> 未知
<220>
<223> 无PAM'对照
<400> 62
gtttaacaca ggtcaagcgg 20
<210> 63
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 63
tcgtcggcag cgtcagatgt gtataagaga cagggagaag gtaaatgcgc cac 53
<210> 64
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
gtctcgtggg ctcggagatg tgtataagag acaggcgctt ctacactcgc ttct 54
<210> 65
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 靶位点处的抗性突变
<400> 65
gag 3
<210> 66
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 靶位点处的抗性突变
<400> 66
gaggag 6
<210> 67
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> nos-pr-F引物
<400> 67
gtgaacttcc atggaattac gt 22
<210> 68
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> nos-pr-R引物
<400> 68
cttgctttct agaacaaaag gatc 24
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> nos-ter-F引物
<400> 69
gacagagtcg ttcgttcatt 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> nos-ter-R引物
<400> 70
gtaattagtg ttcattttag 20
<210> 71
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> zpg-pr-F引物
<400> 71
cagcgctggc ggtgggga 18
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> zpg-pr-R引物
<400> 72
ctcgatgctg tatttgttgt 20
<210> 73
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> zpg-ter-F
<400> 73
gaggacggcg agaagtaatc at 22
<210> 74
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> zpg-ter-R引物
<400> 74
tcgcataatg aacgaaccaa agg 23
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> exu-pr-F引物
<400> 75
ggaaggtgat tgcgattcca tgt 23
<210> 76
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> exu-pr-R引物
<400> 76
tttgtacaag ctacacaaga gaagg 25
<210> 77
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> exu-ter-F
<400> 77
gcgtgagccg gagaaagc 18
<210> 78
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> exu-ter-R引物
<400> 78
actgctactg tgcaacacat c 21
<210> 79
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> nos-pr-CRISPR-F引物
<400> 79
gctcgaatta accattgtgg accggtgtga acttccatgg aattacgt 48
<210> 80
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> nos-pr-CRISPR-R引物
<400> 80
tcgtggtcct tatagtccat ctcgagcttg ctttctagaa caaaaggatc 50
<210> 81
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> nos-ter-CRISPR-F引物
<400> 81
gccggccagg caaaaaagaa aaagtaatta attaagacag agtcgttcgt tcatt 55
<210> 82
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> nos-ter-CRISPR-r引物
<400> 82
tcaacccttc aagcgcacgc atacaaaggc gcgccgtaat tagtgttcat tttag 55
<210> 83
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> exu-pr-CRISPR-F引物
<400> 83
gctcgaatta accattgtgg accggtggaa ggtgattgcg attccatgt 49
<210> 84
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> exu-pr-CRISPR-R引物
<400> 84
tcgtggtcct tatagtccat ctcgagtttg tacaagctac acaagagaag g 51
<210> 85
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> exu-ter-CRISPR-F引物
<400> 85
aggcaaaaaa gaaaaagtaa ttaattaagc gtgagccgga gaaagc 46
<210> 86
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> exu-ter-CRISPR-r引物
<400> 86
ttcaagcgca cgcatacaaa ggcgcgccac tgctactgtg caacacatc 49
<210> 87
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> hCas9-F7
<400> 87
cggcgaactg cagaagggaa 20
<210> 88
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> RFP2qF
<400> 88
gtgctgaagg gcgagatcca ca 22
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Seq-7280-F
<400> 89
gcacaaatcc gatcgtgaca 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> Seq-7280-R
<400> 90
cagtggcagt tccgtagaga 20

Claims (33)

1.一种分离的多核苷酸,其包含基本上如SEQ ID No:1、2或3中任一项所述的核酸序列,或其与SEQ ID No:1、2或3具有至少50%的序列同一性的变体或片段。
2.根据权利要求1所述的分离的多核苷酸,其中所述多核苷酸包含与SEQ ID No:1具有至少80%或90%序列同一性的核酸序列,或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
3.根据权利要求1所述的分离的多核苷酸,其中所述多核苷酸包含与SEQ ID No:1具有至少95%或99%序列同一性的核酸序列,或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
4.根据权利要求1所述的分离的多核苷酸,其中所述多核苷酸序列包含与SEQ ID No:2具有至少80%或90%序列同一性的核酸序列,或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
5.根据权利要求1所述的分离的多核苷酸,其中所述多核苷酸序列包含与SEQ ID No:2具有至少95%或99%序列同一性的核酸序列,或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
6.根据权利要求1所述的分离的多核苷酸,其中所述多核苷酸序列包含与SEQ ID No:3具有至少80%或90%序列同一性的核酸序列,或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
7.根据权利要求1所述的分离的多核苷酸,其中所述多核苷酸序列包含与SEQ ID No:3具有至少95%或99%序列同一性的核酸序列,或其变体或片段,或由所述核酸序列、所述核酸序列变体或片段组成。
8.根据前述权利要求中任一项所述的分离的多核苷酸,其中所述多核苷酸仅在生殖细胞中启动与其有效连接的编码序列的基因表达。
9.根据前述权利要求中任一项所述的分离的多核苷酸,其中所述多核苷酸序列是仅在节肢动物的生殖细胞中基本上有效的启动子序列,任选地,其中所述多核苷酸是在减数分裂时在雄性和雌性蚊子性腺细胞中基本上有效的启动子序列。
10.一种表达盒,其包含与转基因操作连接的根据前述权利要求中任一项所述的多核苷酸。
11.根据权利要求10所述的表达盒,其中所述转基因选自由以下组成的群组:CRISPR核酸酶、锌指核酸酶、TALEN来源的核酸酶、Cre重组酶、背跨式转座酶;以及
Figure FDA0002851107600000021
整合酶。
12.根据权利要求10或11所述的表达盒,其中所述转基因是CRISPR核酸酶,任选地其中所述转基因是Cpf1或Cas9。
13.一种重组载体,其包含根据权利要求1至9中任一项所述的多核苷酸或根据权利要求10至12中任一项所述的表达盒。
14.一种宿主细胞,其包含根据权利要求10至12中任一项所述的表达盒或根据权利要求13所述的重组载体。
15.根据权利要求14所述的宿主细胞,其中所述细胞是节肢动物细胞,任选地其中所述节肢动物细胞是昆虫细胞。
16.根据权利要求15所述的宿主细胞,其中所述昆虫细胞是蚊子细胞,任选地其中所述蚊子是按蚊亚科的。
17.根据权利要求16所述的宿主细胞,其中所述蚊子选自由以下组成的群组:冈比亚按蚊;科鲁兹按蚊;拇鲁斯按蚊;阿拉伯按蚊;四环按蚊;斯氏按蚊;不吉按蚊;以及密拉斯疟蚊。
18.一种产生转基因的宿主细胞的方法,所述方法包含将根据权利要求10中12中任一项所述的表达盒或根据权利要求13所述的载体引入宿主细胞。
19.根据权利要求18的方法,其中宿主细胞如权利要求14至17中任一项所定义。
20.通过权利要求18或权利要求19所述的方法获得或可获得的转基因的宿主细胞。
21.一种基因驱动遗传构建体,其包含根据权利要求1至9中任一项所述的多核苷酸、根据权利要求10至12中任一项所述的表达盒或根据权利要求13所述的重组载体。
22.根据权利要求21所述的基因驱动遗传构建体,其中所述多核苷酸序列基本上限制了所述基因驱动遗传构建体对所述构建体在节肢动物中的生殖细胞表达的活性。
23.根据权利要求22所述的基因驱动基因构建体,其中所述节肢动物是昆虫,任选地其中所述昆虫是蚊子。
24.根据权利要求23的基因驱动基因构建体,其中所述蚊子是按蚊亚科的,任选地其中所述蚊子选自由以下组成的群组:冈比亚按蚊;科鲁兹按蚊;拇鲁斯按蚊;阿拉伯按蚊;四环按蚊;斯氏按蚊;不吉按蚊;以及密拉斯疟蚊。
25.一种生产转基因的节肢动物的方法,其包含将根据权利要求21至24中任一项所述的基因驱动遗传构建体引入节肢动物基因中。
26.通过权利要求25所述的方法获得或可获得的转基因的节肢动物。
27.一种转基因节肢动物,其包含根据权利要求21至24中任一项所述的基因驱动遗传构建体。
28.一种抑制野生型节肢动物种群的方法,其包含与所述节肢动物的野生型种群一起繁育转基因节肢动物,所述转基因节肢动物包含能够破坏与雌性生殖能力相关的基因的基因驱动构建体,其中所述基因驱动构建体包含根据权利要求1至9中任一项所述的分离的多核苷酸、根据权利要求10至12中任一项所述的表达盒或根据权利要求13所述的重组载体。
29.根据权利要求28的方法,其中所述节肢动物是昆虫,任选地其中所述昆虫是蚊子。
30.根据权利要求29所述的方法,其中所述蚊子是按蚊亚科的,任选地,其中所述蚊子选自由以下组成的群组:冈比亚按蚊;科鲁兹按蚊;拇鲁斯按蚊;阿拉伯按蚊;四环按蚊;斯氏按蚊;不吉按蚊;以及密拉斯疟蚊。
31.包含根据权利要求1至9中任一项所述的多核苷酸序列、根据权利要求10至12中任一项所述的表达盒或根据权利要求13所述的重组载体的基因驱动遗传构建体用于抑制野生型节肢动物种群的用途。
32.根据权利要求31所述的用途,其中所述节肢动物是昆虫,任选地其中所述昆虫是蚊子。
33.根据权利要求32所述的用途,其中所述蚊子是按蚊亚科的,任选地,其中所述蚊子选自由以下组成的群组:冈比亚按蚊;科鲁兹按蚊;拇鲁斯按蚊;阿拉伯按蚊;四环按蚊;斯氏按蚊;不吉按蚊;以及密拉斯疟蚊。
CN201980042933.8A 2018-06-22 2019-06-21 多核苷酸 Pending CN112512311A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1810256.6A GB201810256D0 (en) 2018-06-22 2018-06-22 Polynucleotide
GB1810256.6 2018-06-22
PCT/GB2019/051749 WO2019243837A1 (en) 2018-06-22 2019-06-21 Polynucleotide

Publications (1)

Publication Number Publication Date
CN112512311A true CN112512311A (zh) 2021-03-16

Family

ID=63042588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980042933.8A Pending CN112512311A (zh) 2018-06-22 2019-06-21 多核苷酸

Country Status (6)

Country Link
US (1) US20210251203A1 (zh)
EP (1) EP3809839A1 (zh)
CN (1) CN112512311A (zh)
CA (1) CA3103643A1 (zh)
GB (1) GB201810256D0 (zh)
WO (1) WO2019243837A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB202109133D0 (en) * 2021-06-24 2021-08-11 Imperial College Innovations Ltd Anti-crispr construct and its use to counteract a crispr-based gene-drive in an arthropod population

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020168670A1 (en) * 1998-11-25 2002-11-14 Isis Pharmaceuticals, Inc. Identification of disease predictive nucleic acids
US20040019922A1 (en) * 1997-10-16 2004-01-29 Avigenics, Inc. Exogenous proteins expressed in avians and their eggs
CN101421408A (zh) * 2006-02-10 2009-04-29 奥西泰克有限公司 昆虫中利用可变剪接的基因表达系统
CN104271747A (zh) * 2012-03-05 2015-01-07 奥西泰克有限公司 生物防治
WO2017132207A1 (en) * 2016-01-25 2017-08-03 The Regents Of The University Of California Use of medea elements for biocontrol of d. suzukii populations
WO2017196858A1 (en) * 2016-05-09 2017-11-16 Massachusetts Institute Of Technology Methods to design and use gene drives
GB201803940D0 (en) * 2018-03-12 2018-04-25 Imperial Innovations Ltd Methods and systems for analysis
CN112334004A (zh) * 2018-06-22 2021-02-05 帝国科学、技术与医学学院 在节肢动物中基因驱动靶向雌性双性剪接

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040019922A1 (en) * 1997-10-16 2004-01-29 Avigenics, Inc. Exogenous proteins expressed in avians and their eggs
US20020168670A1 (en) * 1998-11-25 2002-11-14 Isis Pharmaceuticals, Inc. Identification of disease predictive nucleic acids
CN101421408A (zh) * 2006-02-10 2009-04-29 奥西泰克有限公司 昆虫中利用可变剪接的基因表达系统
CN104271747A (zh) * 2012-03-05 2015-01-07 奥西泰克有限公司 生物防治
WO2017132207A1 (en) * 2016-01-25 2017-08-03 The Regents Of The University Of California Use of medea elements for biocontrol of d. suzukii populations
WO2017196858A1 (en) * 2016-05-09 2017-11-16 Massachusetts Institute Of Technology Methods to design and use gene drives
GB201803940D0 (en) * 2018-03-12 2018-04-25 Imperial Innovations Ltd Methods and systems for analysis
CN112334004A (zh) * 2018-06-22 2021-02-05 帝国科学、技术与医学学院 在节肢动物中基因驱动靶向雌性双性剪接

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
ANDRE HAMMOND等: ""A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector anopheles gambiae"", 《NATURE BIOTECHNOLOGY》 *
BM595700: ""17000687477208 A.Gam.ad.cDNA.blood Anopheles gambiae cDNA clone 196004497345105,mRNA sequence"", 《DATABASE EMBL》 *
CALVO,E.等: "Anopheles gambiae NOS protein mRNA, complete cds", 《GENBANK DATABASE》 *
CALVO.E.等: ""Anopheles gambiae nanos(nos)gene,complete cds"", 《GENEBANK》 *
HOLT R.A.等: "Anopheles gambiae Afun004371 mRNA sequence", 《EMBL》 *
MONGIN,E.等: "Anopheles gambiae str. PEST AGAP006241-RA (AgaP_AGAP006241), mRNA", 《GENBANK DATABASE》 *
VANESSA M MACIAS等: "nanos-Driven expression of piggyBac transposase induces mobilization of a synthetic autonomous transposon in the malaria vector mosquito, Anopheles stephensi", 《INSECT BIOCHEMISTRY AND MOLECULAR BIOLOGY》 *
WILLIAM T GARROOD等: "Analysis of off-target effects in CRISPR-based gene drives in the human malaria mosquito", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA》 *
童晓玲等: "CRISPR/Cas9系统在昆虫中的应用", 《遗传》 *
童晓玲等: "昆虫启动子的研究及应用", 《昆虫学报》 *
赵国力等: "家蚕生殖细胞相关基因nanos的克隆表达及在胚胎发育中的表达模式", 《昆虫学报》 *

Also Published As

Publication number Publication date
WO2019243837A1 (en) 2019-12-26
CA3103643A1 (en) 2019-12-26
GB201810256D0 (en) 2018-08-08
EP3809839A1 (en) 2021-04-28
US20210251203A1 (en) 2021-08-19

Similar Documents

Publication Publication Date Title
AU2020286315B2 (en) Efficient non-meiotic allele introgression
US20220256822A1 (en) Genetic modification non-human organism, egg cells, fertilized eggs, and method for modifying target genes
KR20150105475A (ko) 유각의 가축
US20190223417A1 (en) Genetically modified animals having increased heat tolerance
Hammond et al. Improved CRISPR-based suppression gene drives mitigate resistance and impose a large reproductive load on laboratory-contained mosquito populations
JP2018531003A6 (ja) 向上した耐暑性を有する遺伝子改変動物
US20210127651A1 (en) Gene drive targeting female doublesex splicing in arthropods
CN112512311A (zh) 多核苷酸
US20200352143A1 (en) Method to Implement a CRISPR Gene Drive in Mammals
Lai et al. Skeletal Genetics: From Gene Identification to Murine Models of Disease
Wong et al. Generation of adenylyl cyclase knockout mice
NZ718194B2 (en) Efficient non-meiotic allele introgression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220216

Address after: London

Applicant after: Imperial Institute of Technology Innovation Co.,Ltd.

Address before: London

Applicant before: Imperial College of science technology and medicine

TA01 Transfer of patent application right
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210316