CN114836475A - 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具 - Google Patents

对未孵化卵中的禽类胚胎进行性别确定的方法及其用具 Download PDF

Info

Publication number
CN114836475A
CN114836475A CN202210492538.3A CN202210492538A CN114836475A CN 114836475 A CN114836475 A CN 114836475A CN 202210492538 A CN202210492538 A CN 202210492538A CN 114836475 A CN114836475 A CN 114836475A
Authority
CN
China
Prior art keywords
nucleic acid
reporter gene
seq
acid sequence
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210492538.3A
Other languages
English (en)
Inventor
D·奥芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eggxyt Ltd
Original Assignee
Eggxyt Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=62716101&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN114836475(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Eggxyt Ltd filed Critical Eggxyt Ltd
Publication of CN114836475A publication Critical patent/CN114836475A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/30Bird
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0393Animal model comprising a reporter system for screening tests
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及在禽类受试对象中确定与鉴定受精和性别的方法。更具体地,本发明提供了使用包含整合到至少一个性染色体Z或W中的至少一种报告基因(特别是RFP)的转基因禽类动物的非侵入性的方法。本发明的转基因禽类动物用于在未孵化的禽卵中确定性别和选择胚胎。

Description

对未孵化卵中的禽类胚胎进行性别确定的方法及其用具
相关申请的交叉引用
本申请是申请号为CN201880042292.1的中国专利申请的分案申请。
发明领域
本发明涉及在禽类受试对象中进行性别确定和鉴定的方法。更具体而言,本发明提供用于对未孵化的禽类的卵中的胚胎进行性别确定和选择的非侵入性方法和转基因禽类动物。
背景技术
以下列出了被认为与本公开的主题相关的参考文献:
·WO 2010/103111
·WO 2014/0296707
·US 6244214
·06124456A2
·US2014069336A
·WO16005539
·WO 96/39505
·WO 97/49806
·Quansah,E.,Long,J.A.,Donovan,D.M.,Becker,S.C.,Telugu,B.,FosterFrey,J.A.,Urwin,N.(2014).Sperm-mediated transgenesis in chicken using aPiggyBac transposon system.Poultry Science Association Meeting Abstract.BARCPoster Day.
·Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,&Charpentier,E.(2012).A programmable dual-RNA–guided DNAendonuclease in adaptive bacterialimmunity.Science,337(6096),816-821.
·Cong,L.,&Zhang,F.(2015).Genome engineering using CRISPR-Cas9system.Chromosomal Mutagenesis,197-217.
·US Patent 6,244,214.
·WO 2014/0296707.
·WO 06124456A2;
·WO16005539.
·Véron N.,Qu Z.,Kipen PA.,Hirst CE.,Marcelle C.(2015).CRISPRmediated somatic cell genome engineering in the chicken.Dev.Biol.407(1):68-74.doi:10.1016/j.ydbio.2015.08.007.Epub 2015年8月13日.
·CA2264450.
·Niu,Y.,B.Shen,Y.Cui,Y.Chen,J.Wang等人,(2014).Generation ofgenemodified cynomolgus monkey via cas9/rna-mediated gene targeting in one-cell embryos.Cell,156(4):836–843.
·Hwang,W.Y.,Y.Fu,D.Reyon,M.L.Maeder,S.Q.Tsai等人,(2013).Efficientgenome editing in zebrafish using a CRISPR-Cas system.Nat.Biotechnol.31(3):227–229.
·Nadège,V.,Q.Zhengdong,P.A.S.Kipen,C.E.Hirst,M.Christophe等人,(2015).CRISPR mediated somatic cell genome engineering in thechicken.Dev.Biol.407(1):68–74.
·Bai,Y.,L.He,P.Li,K.Xu,S.Shao等人,(2016).Efficient genome editing inchicken DF-1cells using the CRISPR/Cas9 system.G3(Bethesda)pii:g3.116.027706.
·Doran T.等人,(2016).Sex selection in layer chickens.ASAP AnimalProduction,Adelaide.
·Tizard M.and Doran T.(2014).Precision genome engineering in thechicken:Th gap between science and market place.在IWRAB-II上的演讲,巴西利亚.
本文对上述参考文献的引用不应被推断为意味着它们以任何方式与当前公开的主题的可专利性相关。
本发明的背景
在食品工业中,每天通过窒息或绞碎剔除数十亿只鸡。雄性被终结,因为它们无法用于产卵或用作肉类培育,并且弱的或不健康的雌性也被终结。出于伦理和经济方面的考虑,非常需要在孵化之前进行卵内或胚胎性别确定的方法。
具体而言,目视鉴定家禽的受精卵对于以下方面是重要的:去除未受精卵以节约孵化成本(通过防止孵化未受精卵),以及降低这些易污染的未受精卵继续与受精卵一起孵化的生物安全风险。
目视鉴定当在未孵化卵内时处于胚胎早期的卵的生育力(fertility)包括外部光源验卵,并且可能很难,在早期胚胎阶段几乎不可能。一个更大的挑战是鉴定胚胎的性别,目前尚无可用的方法来区分发现受精的未孵化卵中的雄性和雌性。然而,在早期胚胎阶段鉴定生育力以及确定家禽的性别对于养禽业、科学研究和保护而言至关重要。通过形态特征确定幼鸟的性别对大多数物种来说极具有挑战性。性别可以通过个体排泄孔性别鉴定来确定,其涉及手动挤出雏鸡的粪便,这样轻微地打开雏鸡的肛门排泄孔,从而允许查看雏鸡是否具有小的“凸起”,具有凸起将表明鸡是雄性。然而,该方法代表了鸟类伤害和性别确定错误的高风险,并且需要受过训练的人员手动进行繁琐的工作。
排泄孔性别鉴定或雏鸡性别鉴定是区分雏鸡和其它幼体的性别的方法,通常由被称为雏鸡性别鉴别师或小鸡性别鉴别师的受过培训的人进行。雏鸡的性别鉴定主要是由大型商业孵化场实行,他们必须了解两性之间的差异,以便将它们分成不同的性别群体,并将其纳入不同的计划,其中包括培养所需要的群体生长而淘汰不需要的不满足商业需求的群体。例如,从来自商业饲养线的产卵者的卵孵化出的雄性。该雄性不会有良好的肉产量,并且不会产卵;因此它会在性别鉴定后被剔除。性别鉴定后,相关的性别将继续其生涯,以用于其目的,而其它性别或其大部分由于与产卵无关而将在孵化后几天内被淘汰。
在产卵的农场中,雄鸡是不受欢迎的,并且性别不合需要的雏鸡几乎立即被杀死以降低饲养者的成本。将雏鸡沿着传送带移动,其中雏鸡性别鉴定师将雄性分出,并将它们扔进一个滑槽通常在绞肉机中被活着绞碎。
在其孵化之前鉴定和确定卵的生育力和卵中胚胎的性别,可以消除未受精卵和卵中不想要的胚胎类型,从而极大地降低孵化成本(这包括能源和效率成本以及空气污染和能源消耗)。此外,雏鸡的痛苦将会停止,并且防止淘汰导致的污染。另外,自动化的性别鉴定装置将通过消除对雏鸡性别鉴定师的需求来降低卵生产成本,同时减少所需孵化场的规模,因为在早期阶段,会从工艺中减少50%的鸡卵,从而减少孵化这些卵的费用,并减少之后对任何复杂的杀灭程序的费用。
在用于饲养、产卵或肉类生产的所有商业类型的鸟类中,都需要确定生育力和胚胎的性别。在下述方面有很大的经济回报:节能,减少生物安全风险,垃圾处理,性别鉴定劳动力成本和性别鉴定错误,剔除成本和处置以及动物福利。
WO 2010/103111公开了一种侵入性方法,其包括一系列步骤,其中包括向卵中引入经标记的抗体,所述经标记的抗体特别设计用于匹配胚胎上的性别特异性抗原。
WO 2014/0296707公开了设计用作定量或评价注射到鸟卵中的接种效率的生物标志物的发光组合物。在该公开内容中没有公开甚至暗示性别确定。美国专利6244214公开了卵内注射设备和检测方法。
WO 06124456A2公开了通过确定来自禽卵的胚液(例如,尿囊液或血液)样品中雌激素类固醇化合物的存在来进行对禽类胚胎进行卵内性别确定的侵入性方法。利用荧光显微镜通过竞争性免疫测定法测量从所述禽类卵获得的样品中的分析物来确定化合物的存在。
还公开了光谱方法,其中US2014069336A基于筛选禽类胚胎羽毛颜色(预孵化)并基于羽毛颜色确定禽类胚胎的性别,或者WO16005539公开了对入射光信号获得壳特异性光谱响应的装置。
针对卵内性别问题的其它遗传方法包括对从受精卵获得的DNA样品进行DNA测序以检测位于鸟类的Z和W染色体上的两个特定基因(WO 96/39505),或使用与雌性W染色体的特异性序列杂交的寡核苷酸探针(WO 97/49806)。这些方法是侵入性的,因此未提供安全策略。
成簇的规则间隔的短回文重复(CRISPR)/CRISPR相关(Cas)系统是现有技术的基因编辑系统,允许简单的构建体设计,成功率高(M.Jinek,2012)。
Niu等(2014)将向导RNA(gRNA)和Cas9 RNA注入猴卵母细胞以修饰三个靶基因,并且Hwang等(2013)修改了斑马鱼胚胎中的drd3和gsk3b基因以获得双基因座突变体。Cong和Zhang(2015)修改了CRISPR系统以编辑活细胞中的任何基因。
Veron及其同事(2015年)证明,通过针对PAX7转录因子的CRISPR gRNA质粒的电穿孔而修饰鸡胚中体细胞的表达水平(Nadège等2015),Bai和同事编辑了PPAR-g、ATP合成酶ε亚基(ATP5E)。
Quansah,E.等公开了使用PiggyBac转座子系统在鸡中进行精子介导的转基因。具体而言,他们公开了aGFP质粒和Lipofectamine LTXTM 9LPX)组合对鸡精子的生活力、运动性或生育力没有影响。
CA2264450公开了多能细胞,该多能细胞包含编码荧光蛋白标记的核酸序列,该核酸序列选择性地整合入细胞胚胎的异源性染色体中以及使用该多能细胞产生的转基因动物,以及此类细胞、胚胎和动物的用途。该公开物特别涉及哺乳动物细胞中的GFP。
Doran T.等在ASAP Animal Production 2016(阿德莱德)一般性地描述了通过在性染色体上添加生物标志物GFP报告基因,在孵化前将雄性和雌性区分开的策略。2014年在巴西利亚IWRAB-II的演讲中也描述了使用CRISPR技术将GFP报告基因整合到雏鸡的性染色体中。但是,正如该一般性出版物所公开的那样,由于卵的自发荧光作用,通过将卵暴露在紫外光下,在卵内可以看到标记的染色体,预期无可检测信号。
因此,目前没有可用的在孵化雏鸡之前的卵的阶段进行性别鉴定的有效和非侵入性方法。所以,长期以来需要一种能够对未孵化卵中的胚胎进行准确和安全的性别鉴定的方法。
发明内容
本发明的第一方面涉及一种对未孵化卵(特别是受精的未孵化卵)中的禽类或者禽类胚胎进行性别确定的方法。在一些具体实施方案中,所述方法可以包括以下步骤:
首先,在步骤(a)中,提供或获得至少一个转基因禽类受试对象或动物,其包含整合到性别染色体Z和W中至少一者中的至少一个位置或部位(本文也称为基因座)上的至少一种外源报告基因。因此,在第二步骤(b)中,从所述转基因禽类受试对象或其任何细胞获得至少一个受精卵。
下一步骤(c)包括确定在所述卵中是否检测到至少一种可检测信号。在更具体的实施方案中,检测到至少一种可检测信号表明所述至少一种报告基因的表达,从而表明在禽类胚胎中存在W染色体或Z染色体。在一些具体的实施方案中,整合的报告基因可以编码红色荧光蛋白(RFP)。
在第二方面,本发明涉及一种禽类转基因动物,在其至少一个细胞中包含至少一种外源报告基因,所述外源报告基因整合在性别染色体Z和W中的至少一者中的至少一个位置或部位处。在一些实施方案中,整合的报告基因可以编码RFP。
在又一方面,本发明涉及一种细胞,其包含至少一种外源报告基因,所述外源报告基因整合在性别染色体Z和W中的至少一者中的至少一个位置或基因座处。
在另又一方面,本发明提供一种试剂盒,其包含:
(a)至少一种Cas9蛋白或其任何片段或衍生物,或至少一种第一核酸序列,所述第一核酸序列包含编码所述至少一种Cas9蛋白的至少一种核酸序列;和编码至少一种向导RNA(gRNA)的至少一种核酸序列,所述向导RNA靶向位于所述性别染色体Z或W中的原间隔序列(protospacer);和(b)至少一种第二核酸序列,其包含至少一种所述报告基因。
更进一步,本发明提供了一种用于确定和检测未孵化卵中的受精(fertilization)的方法。更具体地,该方法包括以下步骤:首先,在步骤(a)中,提供或获得至少一个转基因禽类受试对象或动物,该受试对象或动物包含整合到两个性别染色体Z和W(雌性受试对象的情况)中的至少一者中或整合到两个性别染色体Z中的至少一者中(雄性受试对象的情况)的至少一个位置或部位的至少一种外源报告基因。在第二步骤(b)中,从转基因禽类受试动物或其任何细胞中获得至少一个受精卵。下一步骤(c)涉及确定在卵中是否检测到至少一种可检测信号。在更具体的实施方案中,至少一种可检测信号的检测表明所述至少一种报告基因的表达,从而表明在所述禽类胚胎中标记的母本W染色体或Z染色体(在雌性的情况下,或标记的父系Z染色体)的存在。
通过以下附图,本发明的这些和其他实施方案将变得显而易见。
附图说明
为了更好地理解本文公开的主题并举例说明如何在实践中进行实施,现在将仅通过非限制性示例的方式,参照附图来描述实施例,其中:
图1A-1B。评估卵荧光的完整设置
图1A示出了本发明的方法用于卵内性别确定的装置的照片。完整的设置包括一个激光源(h),一个激光源支架(g),一个卵支架(e),一个卵(f),一个透镜(d),一个滤光器(c),一个检测器支架(b)和一个检测器(a)。将不同的组成部分置于一个固体支持物(i)上。
图1B示出了图1A所示的本发明的装置的示意图。该设备包括一个激光源(h),一个激光源支架(g),一个卵支架(e),一个卵(f),一个透镜(d),一个滤光器(c),一个检测器支架(b)和一个检测器(a)。将不同的组成部分置于固体支持物(i)上。
图2。使用具有或不具有荧光素的蓝色激光(473nm)的荧光强度
当一个完整的卵在具有或不具有100μM或1mM荧光素(fl)的情况下经蓝色激光照射时,检测器上接收到的荧光强度[Pout],该强度表示为光源强度[Pin]的函数。
图3。使用具有或不具有罗丹明的绿色激光(532nm)的荧光强度
当一个完整的卵在具有或不具有罗丹明的情况下经绿色激光照射时,检测器上接收到的荧光强度[Pout],该强度表示为光源强度[Pin]的函数。
图4。使用具有或不具有dir的绿色激光(532nm)的荧光强度
当一个完整的卵在具有或不具有dir的情况下经绿色激光照射时,检测器上接收到的荧光强度[Pout],该强度表示为光源强度[Pin]的函数。
图5。使用具有或不具有dir的红色激光(632.8nm)的荧光强度
当一个完整的卵在具有或不具有dir的情况下经红色激光照射时,检测器上接收到的荧光强度[Pout],该强度表示为光源强度[Pin]的函数。
图6。表达GFP的细胞
该图提供了用表达GFP的GFP载体转染的荧光信号HEK细胞。
图7。表达RFP的细胞
该图提供了用表达RFP的RFP载体转染的荧光信号HEK细胞。
图8。对照测量
使用绿色激光和红色滤光片在卵的不同位置的荧光强度。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。
图9。RFP测量
使用绿色激光和红色滤光片在注射了不同浓度的RFP表达细胞的卵的荧光强度的测量。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。
图10。RFP角度
使用绿色激光和红色滤光片在确定的最佳卵位置上激发卵的RFP荧光强度测量。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。
图11A-11B。具有PBS或甘油的RFP表达细胞
图中显示了对注射PBS或甘油的不同浓度的RFP表达细胞注射的卵使用绿色激光的荧光强度。
图11A显示了在PBS中含有不同浓度RFP表达细胞的卵的荧光强度。图11B显示了甘油中含有不同浓度的RFP表达细胞的卵的荧光强度。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。
图12。具有PBS或甘油的GFP表达细胞
图中显示了对注射了30,000个GFP表达细胞并注入PBS或甘油的卵使用蓝色激光的荧光强度。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。
图13。RFP与GFP
图显示了来自GFP表达细胞或RFP表达细胞的荧光蛋白强度与自发荧光强度之间的比率。
描述荧光和自发荧光之比的参数R表示为光源强度[Pin]的函数。
图14。将RFP整合入雌性Z染色体
图显示了使用具有鸡ChZ左右臂(Left&Right arms)和CMV-hspCas9-H1-gRNA的pDsRed的RFP转染的雌性鸡细胞系。
图15A-15B。进入雌性鸡细胞系Z染色体的整合序列的示意图
粗体序列代表Z染色体的侧接的左右臂,分别由SEQ ID NO:60和SEQ ID NO:61表示。用斜体标记的序列(1017bp)代表左臂,如SEQ ID NO:62所示;带下划线的序列(629bp)代表CMV增强子、启动子和MCS,如SEQ ID NO:63所示;粗斜体序列(714bp)代表dsRED2报告基因,如SEQ ID NO:64所示;无颜色的3332bp的序列代表dsRED质粒内容。带下划线的斜体序列(1026bp)代表右臂,如SEQ ID NO:65所示。序列的左侧部分由SEQ ID NO.66表示(载体序列的所有5'部分,如图15A所示),序列的右侧部分由SEQ ID NO.67表示(载体序列的所有3'部分,如图15B所示)。
具体实施方式
每天数十亿只雄性小鸡通过窒息或磨碎而被终结,因为它们不能用于产卵或培育用作肉类。在孵化前确定胚胎的性别的能力在伦理和经济上都是非常重要的。在鸡中,性染色体的遗传构成是雄性为ZZ,雌性为ZW。这意味着W染色体决定了雌性性别。这与人类不同,在人类中来自父系的Y决定了男性性别。
本发明提供一种用于性别确定的非侵入性有效方法,其使用整合在转基因禽类受试对象的性别特异性染色体中的报告基因。该报告基因在未孵化卵的胚胎中的表达清楚且准确地鉴定了所述胚胎的性别。
因此,本发明的第一方面涉及一种性别确定以及可选地选择未孵化卵(特别是受精的未孵化卵)中的禽类或禽类胚胎的方法。在一些具体实施方案中,该方法可以包括以下步骤:
第一,在步骤(a)中,提供或获得至少一个转基因禽类受试对象或动物,其包含整合在性别染色体Z和W中至少之一中的至少一个位置或部位(position and location)处的至少一种外源报告基因。在第二步骤(b)中,从所述转基因禽类受试对象、特别是动物或其任何细胞获得至少一个受精卵。
下一步骤(c)包括确定在所述卵中是否检测到至少一种可检测信号。在更具体的实施方案中,检测到至少一种可检测信号表明所述至少一种报告基因的表达,从而表明在所述禽类胚胎中存在所述W染色体或Z染色体。因此,在报告基因已整合在雌性转基因禽类的Z染色体中的情况下,在所检查的卵中鉴定出可检测信号表明包含于其中的该胚胎具有其内整合有报告基因的母本Z染色体,并且胚胎由此被鉴定为雄性。在又一些其他实施方案中,在报告基因已整合在雌性转基因禽类的W染色体中的情况下,在所检查的卵中鉴定出可检测信号表明该包含于其中的胚胎携带母本W染色体并因此确定为雌性,从而提供该胚胎的性别确定。
应该理解,如下文中更详细描述的,本发明提供的转基因禽类可以是雌性或雄性。在另外一些特定的实施方案中,转基因动物可以是具有两种不同的性别染色体(特别是异配体(heterogametic subject))的性别。在一些特定的实施方案中,异配动物可以是雌性。在更具体的实施方案中,在转基因禽类受试对象是雌性时,通过本发明的方法鉴定的卵由本发明提供的转基因雌性禽类产下。在更具体的实施方案中,转基因雌性可以通过转基因雄性或在一些其他实施方案中通过野生型禽类雄性受精。更进一步,受精可以通过交配或通过将转基因禽类雌性用获自转基因或野生型禽类雄性的精子授精而发生。在又一些其它实施方案中,在转基因禽类是雄性时,通过本发明的方法鉴定的卵可以由与本发明提供的转基因雄性交配的野生型或转基因雌性产下,或者通过其任何细胞(具体而言,包含整合在其性别染色体中的本发明的外源报告基因的精子细胞)受精。
因此,本发明提供了用于检测未孵化的受精卵内禽类胚胎的性别的方法。应该意识到,本发明的方法可适用于禽类胚胎的任何胚胎期的未孵化卵。
应该注意的是,本文所用的“禽类胚胎的胚胎发育阶段或步骤”是指:第1天的阶段,其中胚盘处于囊胚阶段并且分裂腔呈现暗环的形状;第2天的阶段,其中第一凹槽出现在囊胚的中心并且出现卵黄膜;第3天的阶段,其中血液循环开始,可以辨别头部和躯干,以及脑和开始搏动的心脏结构;第4天的阶段,其中羊膜腔正在发育以围绕胚胎并出现尿囊;第5天的阶段,其中胚胎呈C形并且四肢延伸;第6天的阶段,其中上肢和下肢的手指变得不同;第7天的阶段,其中颈部清楚地将头部与身体分开,形成喙并且大脑逐渐进入头部区域;第8天的阶段,其中容易看见眼睛色素沉着,能区分翅膀和腿并且外耳道打开;第9天的阶段,其中出现爪,并且第一羽囊出芽;第10天的阶段,其中存在鼻孔,眼睑长出并且出现卵齿;第11天的阶段,其中眼睑孔具有椭圆形并且胚胎具有鸡的形态;第12天的阶段,其中羽囊围绕外耳道并覆盖上眼睑,而下眼睑覆盖角膜的大部分;第13天的阶段,其中尿囊变成绒毛膜尿囊膜,而爪和腿鳞变得明显;第14-16天的阶段,其中全身生长迅速,卵黄收缩加速,卵白逐渐消失;第17天的阶段,其中肾系统产生尿酸盐,喙点指向气囊并且卵白被完全吸收;第18天的阶段,其中卵黄内化和羊水量减少;第19天的阶段,其中卵黄质再吸收加速并且喙准备刺穿内壳膜;在第20天的阶段中,卵黄被完全再吸收,脐带闭合,鸡刺穿内壳膜,呼吸进入气囊并准备孵化;第21天的阶段,其中鸡通过其卵齿以圆形方式刺穿卵壳,在12到18小时内自己从卵壳中脱离出来,并使其下垂干燥。
更具体而言,本发明的方法可适用于在卵内在胚胎发育过程的每个阶段在卵内确定禽类胚胎的性别。更具体而言,从第1天、第2天、第3天、第4天、第5天、第6天、第7天、第8天、第9天、第10天、第11天、第12天、从第13天、从第14天、从第15天、从第16天、从第17天、从第18天、从第19天、从第20天和从第21天起。更具体而言,本发明的方法可适用于胚胎性别的早期检测,特别是从第1天至第10天。在一些实施方案中,本发明的方法可以使得能够在胚胎发育的第1天确定胚胎的性别。在一些进一步的实施方案中,本发明的方法可以使得能够在第2天确定胚胎的性别。在一些进一步的实施方案中,本发明的方法可以使得能够在第3天确定胚胎的性别。在进一步的实施方案中,本发明的方法可以使得能够在第4天确定胚胎的性别。在又一些其他实施方案中,本发明的方法可以使得能够在第5天确定胚胎的性别。在进一步的实施方案中,本发明的方法可以使得能够在第6天确定胚胎的性别。在进一步的实施方案中,本发明的方法可以使得能够在第7天确定胚胎的性别,在进一步的实施方案中,本发明的方法可以使得能够在第8天确定胚胎的性别。在一些其他实施方案中,本发明的方法可以使得能够在第9天确定胚胎的性别。在又一些其他实施方案中,本发明的方法可以使得能够在第10天确定胚胎的性别。在某些特定的情况下,本发明的方法可以使得能够在胚胎发育的第1至5天之间确定胚胎的性别。
如上所述,本发明的方法可适用于未孵化的受精卵。术语“受精卵”在本文中指在两周内与公鸡交配过的母鸡所产的卵,其允许雄性精子沉积到雌性输卵管漏斗中并且在卵子从卵巢释放时发生受精事件。如本文所用,“未孵化的卵”涉及在结构上完整(而非破碎)且壳内含胚胎的卵(本文中也称为可育卵)。
本发明的方法基于确定由报告基因形成的可检测信号,所述报告基因被整合于产下所检查的卵的转基因禽类雌性或雄性的特定基因座。
如本文所用的“将外来或外源DNA/基因整合在染色体中”,在本文中是指生物体染色体的核苷酸序列的永久修饰。该修饰在细胞分裂过程中进一步传递,并且如果发生在生殖细胞系中,它也会传递给后代。在这种情况下,整合的报告基因可以转移到未孵化卵内的胚胎中。如本文所用的术语“外源”是指从生物体外部利用特异性操作的载体、病毒或任何其它载质(vehicle)通过转化或转染引入生物体内。根据某些实施方案的整合的外源基因可以是报告基因。术语“报告基因”是指编码多肽的基因,所述多肽表达可以以多种已知测定检测到,并且其中所检测的信号的水平指示所述报告基因的存在。
如上所述,外源报告基因可以整合在禽类性别染色体Z或W中。如本文所用的禽类“性别染色体Z或W”是指鸡中决定后代的性别的染色体系统,其中雄性是同配性别(ZZ),而雌性是异配性别(ZW)。卵子中W染色体的存在决定了后代的性别,而已知Z染色体更大,并拥有更多的基因。
本发明的方法基于可检测信号的检测,该可检测信号指示并反映了报告基因的存在并由此指示并反映了特定的性别染色体的存在。“可检测信号”在下文中是指通过观察或仪器可察觉的改变。不旨在限制,信号可以直接检测。在一些实施方案中,可检测的响应是光学信号。
应该意识到,在一些具体实施方案中,由本发明的方法提供的至少一个转基因禽类受试对象可以包含至少两种不同的报告基因,每个报告基因可以整合在性别染色体Z或W的至少一个位置或部位。在至少两个不同的报告基因的情况下,在一些实施例中,每个性别染色体可以被不同地标记。形成的可检测信号的评估可以指示所检查胚胎的性别。
在又一些具体实施方案中,本发明的转基因禽类体内包含的报告基因可以是至少一种荧光报告基因。因此,在一些实施方案中,所表达的多肽是荧光蛋白,因此该测定测量激发时发出的光的水平,特别是用合适的光源。
术语“荧光”是指已被照明、吸收光或其他电磁辐射的物质所发出的光。它是一种发光形式,即不是由热量产生的物质发出的光。
“荧光蛋白”是指当暴露于光时显示出明亮的荧光的蛋白。荧光蛋白对于照明激发强度的峰具有特定的波长,并且对于荧光发射强度的峰具有特定的波长。激发是指荧光蛋白的照射。在一些实施例中,激发可以由激光提供。在又一些实施例中,可以在使用适当的滤光器时检测到信号。
在某些实施方案中,荧光报告基因可以是红色荧光蛋白(RFP),青色荧光蛋白(CFP),黄色荧光蛋白(YFP)和包括蓝色荧光蛋白(BFP)的自身荧光蛋白。
应当注意,在一些其他具体实施方案中,任何荧光蛋白均可适用于本发明。更具体地,原始维多利亚水母绿色荧光蛋白中的诱变努力已经产生了颜色范围从蓝色到黄色的新的荧光探针,其可以根据本发明的一些实施方案应用。从海葵Discosoma striata和属于珊瑚纲类的造礁珊瑚中开发出来的较长波长的荧光蛋白在橙色和红色光谱区域发射。还开发其他物种以产生具有青色、绿色、黄色、橙色和深红色荧光发射的类似蛋白质。
在一些实施方案中,可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是黄色荧光蛋白。更具体地,该黄色荧光蛋白家族开始于绿色荧光蛋白的晶体结构显示苏氨酸残基203(Thr203)在发色团附近之后。引入该残基突变为酪氨酸以稳定发色团的激发态偶极矩,并导致激发和发射光谱向更长的波长偏移20纳米。进一步的改进导致增强型黄色荧光蛋白(EYFP)的开发,它是最亮且使用最广泛的荧光蛋白之一。
相对于EYFP,黄色荧光蛋白的柠檬色变体非常亮,并且也可应用于本发明的一些实施方案中。另一种名为Venus的衍生物是成熟最快、也是迄今为止开发的最亮的黄色变体之一。最初从印度洋和太平洋原生的Zoanthus物种克隆的珊瑚蛋白ZsYellow1产生纯色黄光发射,也可用于本发明。
在另一些实施方案中,可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是蓝色荧光蛋白。绿色荧光蛋白的蓝色和青色变体来自天然荧光团中位置66处酪氨酸残基(Tyr66)的直接修饰。该氨基酸向组氨酸的转化导致最大波长为450纳米的蓝色发射,而向色胺的转化导致在480纳米附近出现主荧光峰以及在500纳米附近出现肩峰。更具体地说,在已引入的改进的青色荧光蛋白中,AmCyan1和称为Cerulean的增强型青色变体显示出最大的希望。源自造礁珊瑚Ammonia majano的AmCyan1荧光蛋白变体也可适用于本发明。在一些特定的实施方案中,可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是红色荧光蛋白。第一个被广泛利用的珊瑚来源的荧光蛋白来自Discosoma striata,通常被称为DsRed。一旦完全成熟,DsRed的荧光发射光谱将在583纳米处出现一个峰,而激发光谱在558纳米处出现一个主峰,在500纳米附近出现一个次峰。更进一步,可适用于本发明的其他变体包括但不限于DsRed2、DsRed-Express和RedStar。已从造礁珊瑚生物中分离出了几种显示出可观前景的其他红色荧光蛋白。可以在本发明中应用的这些蛋白质之一可以是HcRed1,其是从Heteractis crispa中分离出来的,并且现在可以商购。HcRed1最初源自非荧光色蛋白,该蛋白通过诱变吸收红光以产生弱荧光专性二聚体,其最大吸收在588纳米,最大发射在618纳米。更进一步,在一些实施方案中,可适用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒的报告基因可以是任何荧光蛋白,条件是该蛋白不是GFP,并且在某些更特异性实施方案中不是野生型GFP。然而,在一些实施方案中,形成在555和585nm具有激发和发射最大值的红色发射光谱物质的GFP的数个突变体和变体也可适用于本发明。在又一些其他具体实施方案中,此类突变体或变体可包含丝氨酸65和/或天冬酰胺68残基。在又一些其他实施方案中,GFP的此类突变体或变体可包含F46L、V163A和1167V中至少之一的突变。在另一些实施方案中,该变体可以包含Ser65、Asn68、F46L、V163A和I167V的任何组合。
应当理解,在又一些其他实施方案中,可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是下文表1中公开的任何荧光蛋白。在另一些实施方案中,可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是表1中公开的任何荧光蛋白,条件是所述荧光蛋白不是野生型GFP。在另一些其他实施方案中,可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是表1中公开的任何荧光蛋白,条件是该报告基因不是表1公开的绿色荧光蛋白中的任何一种,更具体地讲,指EGFP、Emerald、Superfolder GFP、Azami Green、mWasabi、TagGFP、TurboGFP、AcGFP、ZsGreen、T-Sapphire中的任何一种。
表1:荧光蛋白:
Figure BDA0003631629220000161
Figure BDA0003631629220000171
Figure BDA0003631629220000181
如实施例1和2令人惊讶地显示的,本发明揭示的卵的自发荧光性质仅允许检测携带表达RFP的细胞的胚胎。
因此,在更具体的实施方案中,报告基因可以是红色荧光蛋白(RFP)。下文中,术语“红色荧光蛋白”或“RFP”是指发出橙色、红色和远红色荧光的荧光蛋白,该荧光蛋白已从珊瑚纲动物(珊瑚)和海葵及其任何变体中分离出来。RFP蛋白有两种主要类型,DsRed和Kaede。类DsRed的RFP衍生自Discosoma striata,包括但不限于mCherry、zFP538、mKO、mOrange、mRouge、E2-Crimson、mNeptune、TagRFP657、Keima、mKate、mStrawberry、mBanana、mHoneydew、niTangerine、mRaspberry、mPlum、mRFPmars和mRFPruby。另一方面,Kaede是在石质珊瑚Trachyphyllia geoffroyi中发现的天然荧光蛋白,在约400nm照射后,其发射波长不可逆地从绿色(518nm)变为红色(582nm)。Kaede家族成员包括例如EosFP、dendFP、mcavRFP和rfloRFP,分别发现于珊瑚Lobophyllia hemprichii、Dendronephthya、Monastrea cavernosa、以及Ricordea florida中。
应当理解,本文所述的任何RFP,本领域已知的任何来源,均可适用于本发明的方法、转基因动物、细胞、试剂盒和装置。
在又一些特定的实施方案中,可以由本发明的方法使用的RFP可以是在pDsRed1-N1中使用的RFP,其编码新的红色荧光蛋白[RFP;Matz,M.V.等,(1999)Nature Biotech.17:969–973],该蛋白已针对哺乳动物细胞中的高表达进行了优化(最大激发光=558nm;最大发射光=583nm)。RFP是从印度洋海葵亲缘种Discosoma sp.中分离得到的。DsRed1的编码序列包含144个沉默碱基对的变化,这对应于在哺乳动物细胞中高表达的人密码子使用偏好。
在一些实施方案中,本发明的方法和试剂盒所使用的RFP可以由包含SEQ IDNO.20所示序列的核酸序列编码。在另外一些实施方案中,此类RFP可包含如SEQ ID NO.21所示的氨基酸序列,或其任何同源物、变体、突变体或衍生物。
在又一些替代的具体实施方案中,本发明使用的RFP可以是由GenBank:AF272711.1公开的核酸序列编码的RFP,其具有GenBank:AAG16242.1公开的氨基酸序列。在又一些其他具体实施方案中,本发明的方法和试剂盒使用的RFP可以由包含SEQ ID NO.22所示序列的核酸序列编码。在另外一些实施方案中,此类RFP可包含如SEQ ID NO.23所示的氨基酸序列,或其任何同源物、突变体或衍生物。应当注意,在一些实施方案中,本发明的方法使用的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说,在一些特定的实施方案中,通过本发明的方法提供的整合到转基因动物的性别染色体中的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是GFP。
更进一步,在一些特定和特定的实施方案中,当报告基因是RFP时,应注意在一些实施方案中,RFP的激发波长为约500-650nm,而发射波长可为约550-650nm。
在一些其他实施例中,通过本发明的方法检测可检测信号可以进一步包括使所述卵经受适当光源的步骤。在又一些实施方案中,将卵暴露于波长在约400至约650之间的合适光源中。在又一些实施例中,可以使用任何波长的光,条件是所述光源不是紫外线(UV)光(波长10-400nm)。
在一些具体的实施方案中,使所述卵经受光源的步骤是激发荧光蛋白。在一些特定实施例中,激发波长在约500nm与约650nm之间。在一些其他实施例中,激发波长为大约510、515、520、525、530、535、540、545、550、555、560、565、570、575、580、585、590、590、595、600、605、610、615、620、625、630、635、640nm。在一些更具体的实施例中,激发波长可以在大约515至大约555之间的范围内。在又一些其他实施例中,波长可以是532nm。在一些特定且非限制性的实施例中,光源可以由激光器提供。
如本文所用,术语“激光”是指通过辐射的受激发射而放大的任何频率的电磁辐射。激光还指通过称为受激发射的过程发射电磁辐射的设备。激光通常在空间上是相干的,这意味着该光要么以窄的低发散光束发射,要么可以借助光学组件(如透镜)转换成激光。
在一些其他实施例中,激光器可以是蓝色激光器或红色激光器。在更具体的实施例中,光源是绿色激光器。
在某些实施例中,激光器可以与滤光器一起使用。
如本文所用,术语“滤光器”是指“光学滤光器”,其对应于选择性地透射不同波长的光的装置,通常在光路上被实现为平板玻璃或塑料装置,其被染成块状或具有干涉涂层。
在一些实施例中,滤光器可以是在500nm以上透射的绿色滤光器,或者是在540nm和580nm之间透射的深绿色滤光器,或者是在590nm和650nm之间透射的红色滤光器,或者是在650nm以上或660nm以上透射的红色滤光器。
在一些特定实施例中,光源可以是波长为532nm的绿色激光器。在一些其他实施例中,这种激光器可以设置有在650nm以上透射的红色滤光片。
鸡种系从少数原始生殖细胞发育而来,从性腺外部位迁移到生殖生殖脊,同时经历了主动迁移和血液被动循环的阶段。PGC位于未产卵的未放置卵的表皮细胞中心,发育阶段称为X阶段。在孵育过程中,PGC向前迁移并积累在10HH阶段的胚芽新月形(大约孵化33-38小时),被认为是血管内渗入的主要部位。之后,可以在阶段12HH至17HH(大约45至64小时的孵育)的循环中发现PGC,在阶段14HH(大约50-53小时的孵育)中达到峰值浓度。PGC在中胚层中性腺肛门附近的部位离开循环,最早在15HH阶段(孵化55-55小时)就可以发现。PGC通过沿背肠系膜的主动迁移到达生殖脊,并定居两个性腺,之后它们分化为精原细胞或卵原细胞。
胚胎位于卵黄囊的顶部。蛋黄在蛋中自由旋转,而胚胎始终面向蛋黄的上侧。在孵化过程中,卵的钝端(气囊所在的位置)朝上,偶尔卵会旋转90°。随着胚胎的发育,胚外组织的形成使胚胎从蛋壳中退缩,并且胚胎难以接近。
因此,在一些特定的实施例中,卵被暴露于所述光源。在又一些实施方案中,将卵放置在有利于胚胎在任何阶段暴露于光源的位置。在又一些实施方案中,在卵的阶段X处包含蛋黄的上表面的区域被光源激发。
在一些进一步的实施例中,使所述卵经受光源的所述步骤由系统、装置或设备提供,所述系统、设备或设备可以包括激光源、卵支架、透镜、滤光器、检测器支架和检测器。
如本文所使用的,术语“检测器”是指检测和/或测量光的任何类型的设备。在一些实施例中,应注意的是,可检测信号,具体而言是合适的荧光信号,可使用合适的荧光手段来检测。在一些实施例中,可由RFP报告基因形成的可检测信号可以由光敏装置例如改良的光学显微镜或电荷耦合器件(CCD)、高灵敏度光子检测器检测。
在又一些实施方案中,本发明的方法可以使用提供至少一个光源、至少一个检测器、至少一个滤光器和至少一个将卵放置在促进表达本发明的受体基因的细胞暴露于所述光源的保持臂的任何设备、装置或系统来执行。在一些特定且非限制性的实施例中,本发明的方法可以使用如图1所示的设备。在又一些实施例中,卵支架与透镜和/或透镜与检测器之间的距离可以在大约1至100cm之间的范围内,具体地,为1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95和100厘米之间的距离,特别是大约5到25厘米之间,更特别地为大约20厘米。
因此,应当理解,在一些实施例中,本发明的方法可以进一步包括提供例如如本文所述的用于确定在被检查的卵中是否存在可检测信号的系统或设备的步骤。具体地,一种设备或装置,其包括激光源、卵支架、透镜、滤光器、检测器支架和检测器。如上所述,在这种装置的一些实施例中,可以使用显示约532nm的激发波长的绿色激光源。在又一些其他实施例中,可以使用在650nm以上透射的滤光片,特别是红色滤光器。
在另外的实施方案中,通过本发明的方法提供的至少一种转基因禽类受试对象或动物可以是雌性禽类受试对象或动物。在更具体的实施方案中,在至少一种报告基因被整合到雌性染色体Z的至少一个位置中的情况下,对可检测信号的检测表明未孵化的卵中的胚胎是雄性的。更具体地,包含父本未标记的Z性别染色体并且进一步包含母本标记的Z染色体的胚胎,包含两个Z染色体,因此是雄性的。
在又一些进一步的实施方案中,通过本发明的方法提供的至少一种转基因禽类受试对象或动物可以是雌性禽类受试对象或动物。在更具体的实施方案中,当至少一种报告基因整合在雌性染色体W的至少一个位置中时,检测到可检测信号表明未孵化卵中的胚胎是雌性。更具体地,胚胎包含未标记的亲本Z性染色体,而标记的母本W染色体是包含雌性的WZ染色体的异配子胚胎。
在又一些进一步的实施方案中,通过本发明的方法提供的转基因动物可以是具有整合在其Z染色体中的报告基因的雄性受试对象。在这种情况下,在由这种转基因雄性或其任何精子受精的卵中确定的可检测信号,表明胚胎携带包含转基因报告基因的亲本Z染色体,因此是雄性。在更进一步的实施方案中,检测由转基因雄性禽类受精的转基因雌性禽类(均携带整合在其Z染色体中的本发明的报告基因)产下的卵中的可检测信号,在强烈信号的情况下,可以表明胚胎携带整合在其雌性和雄性Z染色体中的报告基因的两个拷贝。在信号不太强烈的情况下,例如,信号具有约50%的降低的强度,卵可能会被确定为雌性。
如前所述,本发明的方法涉及提供转基因禽类动物。转基因禽类动物的制备需要使用可能利用特定基因编辑化合物或组分的基因工程方法。在一些实施方案中,基因编辑组分的非限制性实例可包括核酸酶的使用。
在一些具体的实施方案中,适用于本发明方法的核酸酶可以是RNA引导的DNA结合蛋白核酸酶。
如本文所用,RNA引导的DNA结合蛋白核酸酶是被RNA分子引导至其切割位点(或可替代地,用于任何其他替代活性的位点)的核酸酶。该RNA分子称为向导RNA。
因此,在更具体的实施方案中,可以使用至少一种可编程工程化核酸酶(PEN)将所述至少一种报告基因整合在由本发明的方法提供的转基因禽类受试对象或动物的性别染色体中。如本文所用的术语“可编程工程化核酸酶(PEN)”是指切割特定DNA序列的合成型酶,其源自涉及双链DNA损伤的DNA修复的天然存在的核酸酶并且能够进行直接的基因组编辑。
在一些更具体的实施方案中,本发明的方法使用的PEN可以是成簇的规律间隔的短回文重复(CRISPR)的类别2或类别1系统中的任何一种。
成簇的规律间隔的短回文重复(CRISPR)II型系统是一种细菌免疫系统,其已被修改用于基因组工程化。
然而,应该意识到,本文也可以适用其它基因组工程化方法,例如锌指核酸酶(ZFN)或转录激活子样效应核酸酶(TALEN),其依赖于使用可定制的DNA结合蛋白核酸酶,该核酸酶需要设计和产生特定的核酸酶-对,以用于每个基因组靶。
CRISPR-Cas系统分为两类。类别1系统使用多种Cas蛋白复合物降解外来核酸。类别2系统出于同一目的使用单个大Cas蛋白。更具体地,类别1可以分为I、III和IV型,类别2可以分为II、V和VI型。
如本文所用,也称为SPIDR(间隔序列散布直接重复序列)的CRISPR阵列构成最近描述的DNA基因座家族,其通常对特定细菌物种具有特异性。CRISPR阵列是首次在大肠杆菌中识别的独特类型的散布短序列重复序列(SSR)。在随后的几年中,在结核分枝杆菌(Mycobacterium tuberculosis)、地中海富盐菌(Haloferax mediterranei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、海栖热袍菌(Thermotoga maritima)和其它细菌和古细菌中发现了类似的CRISPR阵列。应该理解,本发明考虑使用任何已知的CRISPR系统,特别是本文公开的CRISPR系统。CRISPR-Cas系统在原核生物中进化,以通过靶向外来DNA或RNA来防止噬菌体攻击和不希望的质粒复制。CRISPR-Cas系统基于短同源DNA序列(存在于重复序列之间,称为间隔序列)靶向DNA分子。这些间隔序列指导CRISPR相关(Cas)蛋白与被称为原间隔序列(proto-spacer)的外来DNA内的序列匹配(和/或互补),原间隔序列(proto-spacer)随后被切割。间隔序列可以合理设计以靶向任何DNA序列。而且,该识别元件可以被分开设计以识别和靶向任何期望的目标。对于CRISPR系统,如本领域技术人员将认识到的,天然存在的CRISPR基因座的结构包括通常被称为“重复序列”的许多短重复序列。重复序列成簇出现,并且通常由被称为“间隔序列”的独特间插序列间隔开。通常,CRISPR重复序列长度在约24至47个碱基对(bp)之间变化并且部分回文。间隔序列位于两个重复序列之间,并且通常每个间隔序列具有长度为约20以下至72以上bp的独特序列。因此,在某些实施方案中,在编码本发明方法和试剂盒中的至少一种gRNA的序列中使用的CRISPR间隔序列可以各自包含10至75个核苷酸(nt)。更具体而言,包含约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75或更多个核苷酸(nt)。在一些具体实施方案中,间隔序列包含约20至25个核苷酸,更具体而言约20个核碱基。
除了至少一个重复序列和至少一个间隔序列之外,CRISPR基因座还包括前导序列,以及可选的编码至少一个tracrRNA的序列。前导序列通常是与第一重复的5'末端直接连接的长达550bp的富含AT的序列。
在一些具体的实施方案中,本发明所使用的PEN可以是CRISPR类别2系统。在又一些进一步的具体的实施方案中,该类别2系统可以是CRISPR II型系统。
更具体而言,描述了三种主要类型的CRISPR-Cas系统:I型、II型和III型。
II型CRISPR-Cas系统包括“HNH”型系统(链球菌样;也被称为Nmeni亚型,用于脑膜炎奈瑟氏菌(Neisseria meningitidis)血清群A品系Z2491或CASS4),其中除了普遍存在的Cas1和Cas2外,Cas9(一种单一的非常大的蛋白质)似乎足以产生crRNA并切割靶DNA。Cas9含有至少两个核酸酶结构域,靠近氨基末端的RuvC样核酸酶结构域和在蛋白质中间的HNH(或McrA样)核酸酶结构域,但是这些结构域的功能仍有待阐明。然而,由于HNH核酸酶结构域在限制性酶中是丰富的并且具有负责靶标切割的内切核酸酶活性。
II型系统通过不寻常的机制切割pre-crRNA,该机制涉及tracrRNA和pre-crRNA中一部分重复之间的双链体形成;pre-crRNA加工途径中的第一次切割随后发生在该重复区域中。更进一步,应该注意的是,II型系统包含cas9、cas1、cas2、csn2和cas4基因中的至少一个。应该意识到,任何II型的CRISPR-Cas系统可以适用于本发明,特别是II-A或B型中的任何一种。
因此,在又一些进一步的替代性实施方案中,本发明的方法和试剂盒中使用的至少一种cas基因可以是II型的CRISPR系统(II-A型或II-B型)的至少一种cas基因。在更具体的实施方案中,本发明的方法和试剂盒所使用的至少一种II型CRISPR系统的cas基因可以是cas9基因。应该意识到,这种系统可以还包含cas1、cas2、csn2和cas4基因中的至少一个。
双链DNA(dsDNA)被Cas9切割是“II型CRISPR-Cas”免疫系统的标志。CRISPR相关蛋白Cas9是RNA导向的DNA内切核酸酶,其使用RNA:DNA互补性来鉴定序列特异性双链DNA(dsDNA)切割的靶位点,产生HDR所需的双链制动(DSB),这引起报告基因在特定的靶序列(例如在禽类性别染色体W和Z内的特定靶标)中的整合。靶向DNA序列由CRISPR阵列指定,CRISPR阵列是由短回文重复序列分隔的一系列约30至40bp间隔序列。该阵列被转录为pre-crRNA,并被加工成与Cas蛋白复合物相结合的较短的crRNA,从而靶向被称为原间隔序列的互补DNA序列。这些原间隔序列靶标还必须具有额外的邻近序列,其被称为靶标识别所需的原间隔序列邻接基序(PAM)。结合之后,Cas蛋白复合物充当DNA内切核酸酶以切割靶标上的两条链,随后通过外切核酸酶活性发生DNA降解。
如本文所用的CRISPR II型系统需要包含两个基本组分:“向导”RNA(gRNA)和非特异性CRISPR相关内切核酸酶(Cas9)。gRNA是由Cas9结合所需的“支架”序列和定义待修饰的基因组靶标的约20个核苷酸长的“间隔”或“靶向”序列组成的短合成RNA。因此,可以通过简单地改变gRNA中存在的靶向序列来改变Cas9的基因组靶标。如本文所用的向导RNA(gRNA)是指内源性细菌crRNA和tracrRNA的合成融合体,为Cas9核酸酶提供靶向特异性和支架/结合能力。其也被称为“单一向导RNA(single guide RNA)”或“sgRNA”。CRISPR最初用于“敲除”各种细胞类型和生物体中的靶基因,但对Cas9酶的修饰已经将CRISPR的应用扩展到“敲入”靶基因,选择性激活或抑制靶基因,纯化DNA的特定区域,甚至使用荧光显微镜观察活细胞中的DNA图像。此外,产生gRNA的容易程度使得CRISPR成为最可扩展的基因组编辑技术之一,并且最近已被用于全基因组筛选。
其中将整合本发明的报告基因的待编辑基因组内的靶标,特别是性别染色体Z或W内的特定靶标基因座,应该紧邻原间隔序列邻接基序(Protospacer Adjacent Motif,PAM)的上游存在。
PAM序列对于靶标结合是绝对必需的,并且确切的序列取决于Cas9的物种(对于酿脓链球菌(Streptococcus pyogenes)Cas9而言为5'GNG 3')。在某些实施方案中,来自酿脓链球菌的Cas9用于本发明的方法和试剂盒中。尽管如此,应该意识到,任何已知的Cas9都可以适用。本发明中有用的Cas9的非限制性实例包括但不限于:酿脓链球菌(SP),本文也表示为SpCas9;金黄色葡萄球菌(Staphylococcus aureus,SA),本文也表示为SaCas9;脑膜炎奈瑟氏菌(Neisseria meningitidis,NM),本文也表示为NmCas9;嗜热链球菌(Streptococcusthermophilus,ST),本文也表示为StCas9;和齿垢密螺旋体(Treponemadenticola,TD),本文也表示为TdCas9。在一些具体实施方案中,酿脓链球菌M1GAS的Cas9,特别是蛋白质ID:AAK33936.1的Cas9可以适用于本发明的方法和试剂盒中。在一些实施方案中,Cas9蛋白可由如SEQ ID NO.24所示的核酸序列编码。在进一步的具体和非限制性实施方案中,Cas9蛋白可以包含如SEQ ID NO.25所示的氨基酸序列,或其任何衍生物,突变体或变体。一旦表达,Cas9蛋白和gRNA通过gRNA“支架”结构域和Cas9上表面暴露的带正电荷的沟槽之间的相互作用形成核糖蛋白复合物。Cas9在gRNA结合时发生构象变化,使分子从无活性的非DNA结合构象转变为活性的DNA结合构象。重要的是,gRNA的“间隔序列”序列仍然自由地与靶DNA相互作用。Cas9-gRNA复合物与结合具有PAM的任何基因组序列,但gRNA间隔序列与靶DNA匹配的程度决定了Cas9是否会切割。一旦Cas9-gRNA复合物结合推定的DNA靶标,gRNA靶向序列3'末端的“种子”序列开始与靶DNA退火。如果种子和目标DNA序列匹配,则gRNA继续以3'至5'方向与靶DNA退火。
如果gRNA间隔序列和靶序列之间存在足够的同源性,则Cas9将只切割靶标。此外,Cas9核酸酶具有两个功能性内切核酸酶结构域:RuvC和HNH。Cas9在靶标结合后发生第二次构象变化,其定位核酸酶结构域以切割靶DNA的相反链。Cas9介导的DNA切割的最终结果是在靶DNA内的双链断裂(DSB),其发生在PAM序列上游约3至4个核苷酸处。
然后所得到的DSB可以通过两种一般修复途径之一修复,所述两种一般修复途径是有效但容易出错的非同源末端连接(NHEJ)途径和效率较低但高保真度的同源性定向修复(HDR)途径。在一些实施方案中,导致本发明的报告基因与性别染色体W或Z内的特定靶基因座的特异性整合的插入,是修复由Cas9引起的DSB的结果。在一些具体实施方案中,本发明的报告基因通过HDR整合或敲入靶基因座。
如本文所用的术语“同源性定向修复(HDR)”是指在细胞中修复双链DNA损伤的机制。HDR最常见的形式是同源重组。HDR修复机制只能在细胞核中存在DNA的同源碎片(homologue piece)时(主要在细胞周期的G2和S期)被细胞利用。当同源DNA碎片不存在时,可以替代地发生被称为非同源末端连接(NHEJ)的另一过程。用于基因组编辑的可编程工程化核酸酶(PEN)策略基于特定双链DNA切割后HDR机制的细胞激活。
如前所讨论的,Cas9通过两个核酸酶结构域RuvC和HNH的组合活性而产生双链断裂(DSB)。每个核酸酶结构域内对于内切核酸酶活性至关重要的确切氨基酸残基是已知的(在酿脓链球菌Cas9中对于HNH而言为D10A,对于RuvC而言为H840A),并且已经生成仅含有一个活性催化结构域的Cas9酶的修饰形式(称为“Cas9切口酶”)。Cas9切口酶仍然基于gRNA特异性结合DNA,但切口酶仅能够切割DNA链之一,产生“缺口”或单链断裂而不是DSB。使用完整的互补DNA链作为模板,通过HDR(同源性定向修复)快速修复DNA切口。因此,需要靶向相反链的两个切口酶在靶DNA内产生DSB(通常称为“双切口”或“双切口酶”CRISPR系统)。该要求显著地提高了靶标特异性,因为不太可能两个脱靶切口会产生地足够近以致于导致DSB。因此应该理解,本发明进一步包括使用双切口酶方法来产生双切口诱导的DSB以增加特异性并减少脱靶效应。
因此,在某些实施方案中,所述至少一种报告基因可通过至少一种CRISPR/CRISPR相关内切核酸酶9(Cas9)系统介导的同源性定向修复(HDR)而整合在转基因禽类受试对象(特别是动物)的性别染色体中。
如上所述,CRISPR II型系统包含至少两个元件,核酸酶,特别是Cas9和向导RNA。因此,除了Cas9或编码Cas9的任何核酸序列之外,为了将本发明所使用的报告基因掺入并整合到转基因禽类受试对象的性别染色体中,本发明还提供了向导RNA或编码这种gRNA的任何核酸序列,由此将Cas9定位到特定性别染色体内的目标位点。在一些其他实施方案中,本发明的试剂盒的gRNA可以包含至少一种CRISPR RNA(crRNA)和至少一种反式激活crRNA(tracrRNA)。
在一些替代性实施方案中,本发明的试剂盒可以包含编码至少一种gRNA的核酸序列。此类核酸序列可以包含CRISPR阵列,其包含至少一个间隔序列序列,所述间隔序列序列靶向目标基因组DNA序列中的至少一个原间隔序列并因此与其同一。应该注意,核酸序列还包含编码至少一种tracrRNA的序列。
更进一步,在一些实施方案中,可以通过使禽类受试对象或动物的至少一种细胞或引入禽类受试对象或动物的至少一种细胞接触或共转染:(a)CRISPR Cas9系统的元件,具体地为至少一种Cas9蛋白或至少一种第一核酸序列,所述第一核酸序列包含编码所述至少一种Cas9蛋白的至少一种核酸序列;和至少一种靶向于性染色体Z或W内的原间隔序列(protospacer)的向导RNA(gRNA);和(b)至少一种第二核酸序列,其包含至少一种所述报告基因。应当注意,在一些实施方案中,如果以核酸序列的形式提供(a)的CRISPR Cas9系统的元件,则它们可以以包含不同元件的一个核酸分子提供(称为在本文中作为“第一核酸序列”),或在两个或更多个核酸分子中,每个均包含上述元件之一,特别是编码gRNA和Cas9的序列。
因此,为了制备用于本发明方法的转基因禽类动物,应提供至少两个核酸分子。
更进一步,“gRNA”或“向导RNA”是这样的RNA,当从编码它的CRISPR系统的部分转录时,该RNA包含至少一个与靶基因组DNA中的DNA序列相同(在RNA的情况下除了使用U代替T)或互补(并因此“靶向”)的RNA序列片段,在本文称为原间隔序列(protospacer)。本公开内容的CRISPR系统可以任选地编码一个以上的向导RNA,并且所述向导RNA针对基因组DNA中的一个或多个靶序列。如本文所用,“原间隔序列”是指靶染色体内的靶序列。这些原间隔序列包含与由CRISPR间隔序列编码的向导RNA具有足够互补性的核酸序列,所述CRISPR间隔序列包含在编码本发明的方法和试剂盒的gRNA的核酸序列内。
本发明的方法以及下文所述的试剂盒提供了核酸序列。如本文所用,“核酸或核酸分子”与术语“多核苷酸”可互换,且其通常指任何多核糖核苷酸或多脱氧核糖核苷酸,它们可为未修饰的RNA或DNA或经修饰的RNA或DNA或其任何组合。“核酸”包括但不限于单链和双链核酸。如本文所用,术语“核酸”还包括如上所述的含有一个或多个经修饰碱基的DNA或RNA。如本文所用,术语“寡核苷酸”定义为由两个或更多个脱氧核糖核苷酸和/或核糖核苷酸组成的分子,并且优选多于三个。其确切的大小取决于许多因素,而这进而取决于寡核苷酸的最终功能和用途。寡核苷酸长度可以是约8至约1,000个核苷酸。更具体而言,本发明的试剂盒所使用的寡核苷酸分子可以包含长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000个或更多个碱基中的任一种。
核酸分子可以由天然存在的核苷酸(例如DNA和RNA)的单体或天然存在的核苷酸的类似物(例如天然存在的核苷酸的α-对映体形式)或经修饰的核苷酸或其任何组合组成。在本文中该术语还包括cDNA,即通过逆转录酶(RNA-依赖性DNA聚合成酶)的作用从RNA模板产生的互补或复制DNA。
就此而言,“分离的多核苷酸”是从生物体的基因组中分离出的核酸分子。例如,已经从细胞的基因组DNA分离出的、编码本发明方法和试剂盒所使用的报告基因或其任何衍生物或同系物的DNA分子,以及编码本发明方法和试剂盒的CRISPR/Cas9和gRNA的序列,是分离的DNA分子。分离的核酸分子的另一实例是化学合成的核酸分子,其未整合在生物体的基因组中。从特定物种分离出的核酸分子小于该物种染色体的完整DNA分子。在一些实施方案中,本发明的方法和试剂盒(在下文中描述)所使用的核酸序列,具体而言,包含编码Cas9和gRNA的序列的核酸序列,或者本发明的报告基因,可以构建在载体、表达盒或任何其他载体内提供。因此本发明进一步涉及包含本发明的多核苷酸的重组DNA构建体,以及可选地与本发明的核酸序列可操作连接的另外的附加元件,例如启动子、调节控制元件,翻译、表达和其它信号。本发明提供的载体的非限制性实例可以是包含编码Cas9的核酸序列和对于将报告基因整合到靶性别染色体中所需的特异性gRNA的任何载体。在一些具体的实施方案中,本发明提供了DNA构建体或载体,其包含编码如SEQ ID NO.25所示的Cas9的核酸序列以及SEQ ID NO.26所示的gRNA7,其将报告基因靶向性别染色体Z。在又一些实施方案中,本发明进一步提供了载体或任何DNA构建体,其包含编码本发明报告基因的核酸序列,特别是RFP,通过重组和整合入性别染色体(特别是性别染色体Z)内的靶基因座所需的左臂和右臂位于侧翼。这种载体的非限制性实例可以是包含图15中公开的核酸序列的载体。在又一些其他实施方案中,该核酸序列包含由SEQ ID NO.66和/或SEQ ID NO.67中的至少一个表示的核酸序列。
更进一步,本发明进一步涵盖包含和/或表达本发明的载体和DNA构建体的任何宿主细胞,特别是本发明描述的任何载体。
如本文所用,术语“重组DNA”、“重组核酸序列”或“重组基因”是指包含编码本发明的一种CRISPR系统,特别是CRISPR/Cas9 II型的开放阅读框的核酸,连同将Cas9靶向禽染色体Z和/或W内的特定基因座中的相应原间隔序列(protospacer)的本发明的gRNA。在又一些其他实施方案中,本文所用的重组DNA进一步指包含编码本发明的报告基因(特别是转基因)的开放阅读框的核酸。
如本文所提到的,术语“基因”或“转基因”是指编码蛋白质产物的核酸,其是天然存在的或合成的。术语“核酸”旨在表示天然和/或合成的线性、环状的有序阵列,例如cDNA、基因组DNA(gDNA)、mRNA和RNA、寡核苷酸、寡核苷及其衍生物。
短语“可操作地连接”意在表示以允许转基因转录的方式连接。如上所述,通过提供编码将要掺入性别染色体Z或W中的转基因的核酸序列,特别是报告基因,以及基因编辑系统(例如,CRISPR/Cas9系统),制备本发明的方法中使用的转基因。术语“编码”旨在表示,例如当主题核酸与合适的控制序列(例如启动子和增强子元件)在合适的载体(例如表达载体)中连接时以及当将载体引入合适的系统或细胞中时,主题核酸可以在合适的表达系统中转录并翻译成期望的多肽或主题蛋白质。
应该理解的是,在一些实施方案中,由本发明的方法和试剂盒所提供和使用的第一和第二核酸序列中的至少一个可以被构建并包含在载体内。如本文所用,“载体”或“载质”包括载体,例如质粒、噬菌粒、病毒,可整合的DNA片段和其它载质,它们能够使DNA片段整合在宿主的基因组中,或者能够表达未整合的遗传元件。载体通常是自我复制的DNA或RNA构建体,其含有所需核酸序列以及可操作连接的遗传控制元件,所述遗传控制元件在合适的宿主细胞中被识别并影响所需间隔序列的翻译。通常,遗传控制元件可以包括原核启动子系统或真核启动子表达控制系统。此类系统通常包括转录启动子、转录增强子以提高RNA表达水平。载体通常含有允许载体独立于宿主细胞复制的复制起点。在又一些替代性实施方案中,本发明所使用的表达载体可以包含将本发明的所需报告基因整合在禽类性别特异性染色体W和/或Z中所需的元件。
因此,术语“控制和调节元件”包括启动子、终止子和其它表达控制元件。此类调节元件描述于Goeddel;[Goeddel.,等,Gene Expression Technology:MethodsinEnzymology 185,Academic Press,San Diego,Calif.(1990)]。例如,在这些载体中可以使用当与DNA序列可操作连接时控制DNA序列的表达的各种表达控制序列中的任一种,以使用本发明的方法表达编码任何所需蛋白质的DNA序列。
载体可另外包含适当的限制性位点、抗生素抗性或用于选择含载体细胞的其它标记。质粒是最常用的载体形式,但是本领域已知或者将已知的具有等效功能的其它形式的载体,适合在本文使用。参见例如Pouwels等,Cloning Vectors:a Laboratory Manual(1985及其增刊),Elsevier,N.Y.;以及Rodriquez等(编辑)Vectors:a SurveyofMolecular Cloning Vectors and their Uses,Buttersworth,Boston,Mass(1988),通过引用将其并入本文。
为了产生由本发明方法所使用的转基因禽类动物,必须制备包含整合在性别染色体Z或W内的特定基因座中的报告基因的禽类细胞。在一些实施方案中,此类细胞可以通过用本发明的方法和试剂盒提供的第一和第二核酸序列或包含其的任何构建体、载体、载质接触、引入或共转染禽类受试对象的细胞或引入所述对象的任何细胞来制备。本文使用的“转染”是指将遗传物质如DNA和双链RNA插入哺乳动物细胞中的过程。将DNA插入细胞能够使用细胞自己的机制来表达或生产蛋白质。因此,本文所用的共转染是指将至少两种不同的核酸分子或包含其的任何载体同时转染至各个单细胞。更进一步而言,待转染的核酸序列可以在短时间内瞬时表达,或者引入到基因组DNA中,其中变化在细胞分裂时从细胞传递到细胞。
因此,本发明提供了基于整合在其性染色体(具体地是Z和/或W)中的报告基因特别是红色荧光蛋白(RFP)的表达在卵内对禽类胚胎进行卵内性别确定的方法。“表达”通常是指将基因编码信息转化为细胞中存在和操作的结构的过程。因此,根据本发明,报告基因的“表达”具体地可以指转录成多核苷酸,翻译成蛋白质,或者甚至蛋白质的翻译后修饰。
在一些实施方案中,报告基因向转基因禽类受试对象的性别染色体内的特定靶基因座的插入和特异性整合可以包括提供CRISPR/Cas9系统,该系统包括特异性gRNA和应该被整合的报告基因的核酸序列。为了促进和实现整合,在一些实施方案中,报告基因必须位于侧翼,其序列可以与靶向整合位点侧接的序列同源,从而实现重组。因此,在又一些其他具体的实施方案中,第二核酸序列中的至少一种报告基因可以在其5'和3'的侧翼具有同源臂。应当理解,在一些实施方案中,这些臂是必需的,因此有助于整合位点的报告基因的HDR。
在更具体的实施方案中,由本发明方法所使用的第二核酸序列中的报告基因可以侧接有两个臂,所述两个臂是同源的,或者与包含在性别染色体Z或W内的目标基因座内的全部、整体或完全的至少一个核酸序列显示约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同源性或同一性,其充当整合位点以促进经由HDR的特异性整合。在某些实施方案中,靶序列在本文中也称为至少一个由“间隔序列”序列识别的“原间隔序列”,所述“间隔序列”序列是由本发明使用的并由第一核酸序列提供的gRNA的一部分。
本文所用的术语“同源臂”是指引入到特定载体或病毒中的HDR模板,其用于产生特定突变或将新元件插入到基因中,其具有一定量的围绕待修饰靶序列的同源性(取决于使用哪种PEN)。在又一些具体的实施方案中,在CRISPR用作PEN时,臂序列(左侧,上游和右侧,下游)可以包含约10-5000bp,特别约50-1000bp,100-500bp,特别50、100、200、300、400、500、600、700、800、900、1000bp。
在又一些进一步的实施方案中,由本发明的方法和试剂盒所提供的第一核酸序列编码的gRNA内的靶向序列(在本文中也称为“间隔序列”序列)与包含在性别染色体Z或W内的靶基因座内的全部、整体或完全的至少一个核酸序列(在本文中称为“原间隔序列”)显示约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同源性或同一性。
在一些实施方案中,第二核酸序列中的至少一种报告基因可以与性别特异性启动子、胚胎特异性启动子(例如α-珠蛋白启动子)和诱导型启动子(例如衍生自大豆SSU基因的光诱导型启动子,或者衍生自欧芹查耳酮合成酶CHS启动子的光诱导型启动子,或EL222的工程化版本,当用蓝光照射时激活表达的细菌光-氧-电压蛋白)可操作地连接。在更具体的实施方案中,报告基因可处于胚启动子的控制下,由此限制了转基因报告基因在胚胎期表达,而在成体鸡中不表达。在此类实施方案中,为了诊断目的,可使用报告转基因并且其仅在胚胎期表达。
更具体而言,本文使用的“启动子”是指具有控制置于下游的基因表达的能力的DNA的特定区域。
因此,“鸡中的性别特异性启动子”在下文中是指仅在特定鸡性别(即雄性或雌性)中才激活基因表达的启动子。更进一步而言,“鸡中的发育特异性启动子”是指仅在鸡发育的特定阶段激活基因表达的启动子。
在一些具体实施方案中,可以将所述至少一种报告基因插入并由此整合在目标性别染色体的至少一个非编码区中。此类方法避免了未孵化胚胎发育和成熟可能需要的基因的破坏。
如本文所用,“非编码区”是指不编码蛋白质序列的生物体DNA的组分。一些非编码DNA区域被转录成功能性非编码RNA分子,非编码DNA区的其它功能包括蛋白编码序列的转录和翻译调节,支架附着区域,DNA复制起点,着丝粒和端粒。假设的非功能部分(或未知功能的DNA)通常被称为“垃圾DNA”。
在又一些特定的实施方案中,可以将本发明的方法用于制备转基因禽类动物中使用的至少一种报告基因整合到性别Z染色体的至少一个位点中。在更具体的实施方案中,Z染色体中的特定基因座可以是如由SEQ ID NO:15表示的区域9156874-9161874、如由SEQID NO:16表示的27764943-27769943、SEQ ID NO:17表示的42172748-42177748、SEQ IDNO:18表示的63363656-63368656以及SEQ ID NO:19表示的78777477-78782477的雌性鸡的Z染色体中的至少一个。
在一些具体的实施方案中,至少一种报告基因可以被整合到性别Z染色体基因座42172748-42177748的至少一个位点中,具体地,如SEQ ID NO.17所示。在又一些其他具体实施方案中,适于整合到Z染色体内的特定基因座中的gRNA序列可以包括但不限于针对位于Z染色体基因座chrZ_42174515_1中的原间隔序列的gRNA7。在一些具体的实施方案中,gRNA可以是命名为gRNA7的gRNA。在更具体的实施方案中,此类gRNA7可包含核酸序列GTAATACAGAGCTAAACCAG,也由SEQ ID NO:26表示。在又一些实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,编码本发明的报告基因的序列,特别是RFP,可以在其5'端的左臂侧翼,以及3'的右臂侧翼。在又一些其他具体实施方案中,左臂可包含如SEQ ID NO.31所示的核酸序列,包含如SEQ ID NO.32所示的核酸序列的右臂可以用于通过将本发明的报告基因整合入通过SEQ ID NO:26的gRNA7引导的特定基因座上。
在又一些进一步具体的实施方案中,将报告基因靶向Z染色体内地此类特定位置所需的所述至少一种gRNA可以包含以下任一种所示的核酸序列:如SEQ ID NO.11所示的gRNA3:ACAGACCTATGATATGT;如SEQ ID NO.12所示的gRNA4:CGATTATCACTCACAAG;如SEQ IDNO.13所示的gRNA5:CTGGTTAGCATGGGGAC;如SEQ ID NO.14所示的gRNA6:GTAAAGAGTCAGATACA。
在又一些实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.41所示的核酸序列的左臂和包含如SEQ ID NO.42所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:11的gRNA3指导的特定基因座。在进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.43所示的核酸序列的左臂和包含如SEQ ID NO.44所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:12的gRNA4指导的特定基因座。在更进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.45所示的核酸序列的左臂和包含如SEQ ID NO.46所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:13的gRNA5指导的特定基因座。在一些进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.47所示的核酸序列的左臂和包含如SEQ ID NO.48所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:14的gRNA6指导的特定基因座。
适合于整合在Z染色体内的特定基因座中的gRNA序列的其它非限制性实例可以包括但不限于Z染色体基因座chrZ_9157091_11的gRNA8,其包含核酸序列ACAGACCTATGATATGTGAG,也如SEQ ID NO:27所示;Z染色体基因座chrZ_27767602_-1的gRNA9,其包含核酸序列GAGCTTGTGAGTGATAATCG,也如SEQ ID NO:28所示;Z染色体基因座chrZ_78779927_1的gRNA10,其包含核酸序列GTAAAGAGTCAGATACACAG,也如SEQ ID NO:29所示;和Z染色体基因座chrZ_63364946_-1的gRNA11,其包含核酸序列CAGTGGGTACTGAAGCTGTG,也如SEQ ID NO:30所示。
在进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.33所示的核酸序列的左臂和包含如SEQ ID NO.34所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:27的gRNA8指导的特定基因座。在更进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.35所示的核酸序列的左臂和包含如SEQ ID NO.36所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:28的gRNA9指导的特定基因座。在进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.37所示的核酸序列的左臂和包含如SEQ ID NO.38所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:29的gRNA10指导的特定基因座。在进一步的实施方案中,为了将本发明的报告基因整合在Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.39所示的核酸序列的左臂和包含如SEQ ID NO.40所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO:30的gRNA11指导的特定基因座。
在另一些实施方案中,所述至少一种报告基因可以整合到性别W染色体上的至少一个位点。在更具体的实施方案中,W染色体中的特定基因座可以是位置1022859-1024215。在一些具体的实施方案中,靶基因座可包含如SEQ ID NO.3所示的核酸序列。
在更具体的实施方案中,将报告基因靶向与W染色体内这样的特定位置所需的至少一种gRNA可以包含如SEQ ID NO.1和2所示的核酸序列,这些gRNA在本文中分别称为gRNA1和gRNA2。
在又一些更具体的实施方案中,本发明的方法使用的用于制备转基因禽类雌性的gRNA可以包含如SEQ ID NO.1(gRNAl)所示的核酸序列。在这种情况下,包含在所述第二核酸序列中的所述至少一种报告基因可以在其5'和3'侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂,它们分别促进其整合到W染色体中的所述特定基因座。应当理解,这些臂在本文中也分别称为左臂和右臂。
在另一些实施方案中,本发明的方法使用的用于制备本发明的转基因禽类雌性的gRNA可以包含如SEQ ID NO.2(gRNA2)所示的核酸序列。在这种情况下,包含在所述第二核酸序列中的所述至少一种报告基因可以在其5'和3'侧接包含分别由SEQ ID NO.6和7所示氨基酸序列的同源臂。应当理解,这些臂在本文中也分别称为左臂和右臂。
当已经用外源序列,特别是本发明使用的报告基因靶向和/或转染禽类宿主的合子细胞的基因座时,可能需要使用此类细胞来产生转基因动物。对于这样的程序,在将靶向构建体引入胚胎干(ES)细胞中之后,可以将细胞铺在适当的培养基中的饲养层上,例如补充有生长因子和细胞因子、胎牛血清和抗生素的DMEM。胚胎干细胞可以具有单个靶向基因座(杂合子)或两个靶向基因座(纯合子)。可以通过使用选择性培养基来检测含有构建体的细胞,并且在集落生长足够的时间后,可以挑选集落并分析基因靶向的发生。在一些具体实施方案中,可以使用构建体序列内外的引物,应用PCR来验证所需外源序列在靶基因座中的整合。显示基因靶向的集落然后可以用于注射到禽类胚胎中。然后ES细胞可以被胰蛋白酶消化,并且经修饰的细胞可以通过卵侧面形成的开口注射。将卵密封后,可以在适当的条件下孵育卵,直到孵化。可以例如通过检查其生物学样品,例如血液样品来测试新孵化的禽类是否存在靶构建序列。在禽类成熟后,繁育它们并检查其子代以确定外源整合序列是否通过种系传递。
产生嵌合禽类,其部分源自能够将遗传修饰通过种系传递的经修饰胚胎干细胞或合子细胞。将含有外源序列,特别是本发明所用的报告基因或其部分的禽类品系与其中恢复了禽类野生型基因座或其部分的品系交配,应该产生表现出卵内可检测性别的后代。
更进一步地,转基因禽类也可以通过其它方法产生,其中一些在下面讨论。在适合转化以产生转基因动物的禽类细胞中有原始生殖细胞(PGC)、精细胞和合子细胞(包括胚胎干细胞)。精子细胞可以通过任何合适的方法用DNA构建体转化,所述方法包括电穿孔、微粒轰击,脂质转染等。精子可以用于禽类的人工授精。如上所述,可以检查授精的禽类的子代的外源序列。
作为选择,原始生殖细胞可以从禽类卵中分离,通过任何适当的方法用本发明的外源报告基因转染,并转移或插入到新胚胎中,在胚胎中它们可以引入发育中的性腺中。如本发明所述,可以检查孵化的禽类及其子代的外源报告基因序列。
在另一种方法中,可以通过任何合适的手段将分离自卵的分散的胚盘细胞用外源报告基因序列或其部分转染,整合在性别特异性染色体Z或W,然后将完整卵注射到胚盘下腔中。如上所述,可以检查孵化的禽类受试对象及其子代的外源报告基因。
鸡原始生殖细胞(PGC)是卵子和精子的前体。因此,在其一些方面,本发明提供了通过种系传递系统生产转基因鸡,所述系统使用与报告基因构建体以及与指导报告基因整合在性别特异性染色体W和/或Z中的CRISPR/Cas9gRNA构建体共转染的PGC。将PGC分选并转移到2.5天受体胚胎的血流中以进行种系传递。
与哺乳动物相比,PGC是配子(gamete)的前体,在鸟类早期胚胎发生过程中表现出独特的迁移活性。在禽类胚胎中,PGC首先起源于上皮细胞,并在孵化后约18-19h进入第4阶段(HH)的生发新月体的下胚层。在第10阶段和第12阶段(HH)之间,PGC从生新月形进入血液,并通过循环系统迁移,直到到达生殖器脊并定居发育中的性腺。这与哺乳动物中的PGC通过胚胎组织迁移到达发育中的性腺相反。禽PGC通过血流迁移的这一独特特征促进了鸡的基因改造的重大进展。
因此,在一些具体实施方案中,“转基因禽类动物的制备”是指涉及用于生产具有基因组修饰的鸡的基因工程技术的多步骤方法,其中a)从两日龄鸡胚的血液中分离原始生殖细胞(PGC);b)例如通过使用慢病毒系统,Piggybac转座子载体,TALENS或CRISPR/Cas9技术将转基因构建体整合在培养的PGC中;(c)鉴定转基因PGCs并其注射到胚胎的循环系统并迁移到发育中的性腺;d)将受体胚胎在37℃下温育直至孵化;(d)孵化的雄性被饲养至性成熟并且与野生型母鸡杂交;(e)筛选后代以鉴定来自转基因PGC的那些。
因此,在第二方面,本发明涉及一种禽类转基因动物或对象,其在其至少一个细胞中包含整合在性别染色体Z和W中至少一个的至少一个位置或部位(本文中也称为基因座)中的至少一种外源报告基因。
术语“禽类”涉及来源于鸟类的任何物种,其特征在于羽毛、无齿的喙、产硬壳卵、高代谢率、四腔心脏,以及轻量但强壮的骨骼。禽类包括但不限于鸡、鹌鹑、火鸡、鸭、雉(Gallinacea sp)、鹅、野鸡和其它家禽。术语“母鸡”包括禽类物种的所有雌性。“转基因禽类”通常是指下述禽类,其已经具有异源DNA序列,或者一个或多个另外的DNA序列,所述另外的序列对于禽类正常是内源的(本文统称为“转基因”),但是染色体整合在禽类的生殖细胞中。作为这种转移和整合的结果,转移的序列可以通过生殖细胞传递给转基因禽类的后代。转基因禽类(包括其子代)也具有整合在体细胞性染色体中的转基因。
在一些具体的实施方案中,本发明的至少一种转基因动物可以包含至少两种不同的报告基因。在这种情况下,每个报告基因可以被整合在性别染色体Z和/或W之一中的至少一个位置或部位中。在又一些实施方案中,每个报告基因可以被整合到性别Z和/或W染色体之一中的至少2个、至少3个、至少4个、至少5个,至少6个,至少7个,至少8个,至少9个,至少10个或更多个的位置或部位。
在另一些实施方案中,本发明的转基因动物中包含的报告基因可以是至少一种荧光报告基因。应当理解,与本发明的其他方面有关的本发明公开的任何报告基因,特别是本发明(特别是在本文之前的表1中)公开的任何荧光报告基因,也可以与本发明提供的转基因禽类受试对象有关。
在更具体的实施方案中,这样的荧光报告基因可以包含或可以是至少一种红色荧光蛋白(RFP)。然而,应注意,在一些实施方案中,由本发明的转基因禽类受试对象表达为转基因的报告基因可以是任何荧光蛋白,例如RFP、YFP、BFP等,只要所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说,在一些特定的实施方案中,整合到本发明提供的转基因动物的性别染色体中的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是GFP。
在某些实施方案中,本发明提供的至少一种转基因禽类动物可以是雌性。在更具体的实施方案中,此类转基因禽鸟雌性中的至少一种报告基因可以整合在雌性染色体Z的至少一个位置中。
在又一些替代性实施方案中,所述至少一种转基因禽类动物可以是雌性,具有整合在雌性染色体W的至少一个位置中的至少一种报告基因。
在又一些替代实施方案中,本发明提供的转基因动物可以是携带整合入其两个性别Z染色体中至少一种的转基因报告基因的转基因雄性受试对象。在一些其他实施方案中,本发明提供的转基因动物可以是携带整合到其两个性别Z染色体之一中的转基因报告基因的转基因雄性受试对象。在其他替代实施方案中,本发明提供的转基因动物可以是携带整合入其两个性别Z染色体中的两个的转基因报告基因的转基因雄性受试对象。
在一些具体的实施方案中,可以使用至少一种PEN将至少一种报告基因整合到本发明的转基因动物的性别染色体中。如以上结合本发明的方法所指出的,可以使用任何基因工程系统或任何PEN,特别是任何RNA引导的系统,例如CRISPR、TALEN、ZFN等中的一种。
更具体地,在某些实施例中,这种PEN可以是CRISPR系统。在更具体的实施方案中,CRISPR的2类系统可用于产生本发明的转基因动物。在又一些其他具体实施方案中,可以使用CRISPR II型系统。
在更具体的实施方案中,至少一种报告基因可以通过由至少一种CRISPR Cas9系统介导的HDR整合到本发明的转基因禽类动物的性别染色体中。
在更具体的实施方案中,可以通过用至少两个核酸序列接触或共转染禽类动物/受试对象的至少一个细胞或待导入所述禽类动物的至少一个细胞,从而将所述至少一种报告基因整合在本发明的转基因禽类动物的性别染色体中。更具体而言,此类细胞可以接触或共转染(a)基因编辑系统的至少一种组分,例如至少一个第一核酸序列,其包含:编码至少一个Cas9蛋白的至少一个核酸序列和靶向至少一个性染色体Z或W内的至少一个原间隔序列的至少一种gRNA,或者编码所述至少一个gRNA的至少一个核酸序列,从而提供CRISPR介导的整合;和(b)至少一个第二核酸序列,其包含:至少一种报告基因或其任何片段。
在更具体的实施方案中,第二核酸序列中的至少一种报告基因可以在其5'和3'侧接有同源臂。这些臂与靶性别染色体内的整合靶位点显示同源性,从而促进整合位点的HDR。
在还更具体的实施方案中,第二核酸序列中的至少一种报告基因可以与性别特异性启动子、胚胎特异性启动子和诱导型启动子中的任何一个可操作地连接。在一些实施方案中,此类启动子将本发明的报告基因的表达限制为特定的期望性别(在性别特异性启动子的情况下)、特定的胚胎期(胚胎特异性启动子)或特定条件(诱导性条件)。
在又一些进一步的具体实施方案中,包含在本发明的转基因禽类动物内的至少一种报告基因可以整合在其性别染色体之一的至少一个非编码区中。
在另一些替代实施方案中,本发明的转基因禽类动物可以包含整合到性别Z染色体的至少一个位点中的至少一种报告基因。在一些特定的和非限制性的实施方案中,这种禽转基因动物可以是雌性,其携带整合入Z染色体的转基因报告基因。在更具体的实施方案中,Z染色体中的特异性基因座可以是雌性鸡Z染色体的如下区域中的任何一个:如SEQ IDNO:15表示的9156874-9161874、如SEQ ID NO:16表示的27764943-27769943、如SEQ ID NO:17表示的42172748-42177748、如SEQ ID NO:18表示的63363656-63368656和如SEQ ID NO:19表示的78777477-78782477。
在一些具体的实施方案中,至少一种报告基因可以被整合到性别Z染色体基因座42172748-42177748的至少一个位点中,具体地,如SEQ ID NO.17所示。在又一些其他具体实施方案中,适于整合到Z染色体内的特定基因座中的gRNA序列可以包括但不限于针对位于Z染色体基因座chrZ_42174515_-1中的原间隔序列的gRNA7。在一些具体的实施方案中,gRNA可以是命名为gRNA7的gRNA。在更具体的实施方案中,此类gRNA7可包含核酸序列GTAATACAGAGCTAAACCAG,其也由SEQ ID NO:26表示。在又一些实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,本发明提供的编码报告基因(特别是RFP)的序列可以在其5'左臂侧翼,以及在其3'的右臂侧翼。在又一些其他具体实施方案中,左臂可包含如SEQ ID NO.31所示的核酸序列,并且包含如SEQ ID NO.32所示的核酸序列的右臂可以用于将本发明的报告基因整合到由SEQ ID NO:26的gRNA7引导的特定基因座上。
在又一些更具体的实施方案中,将报告基因靶向到转基因禽类受试对象的Z染色体内的这样的特定位置所需的至少一种gRNA,可以包含由以下任何一种所表示的核酸序列:gRNA3:ACAGACCTATGATATGT,如SEQ ID NO.11所示;gRNA4:CGATTATCACTCACAAG,如SEQID NO.12所示;gRNA5:CTGGTTAGCATGGGGAC,如SEQ ID NO.13所示;gRNA6:GTAAAGAGTCAGATACA,如SEQ ID NO.14所示。
在又一些实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可使用包含如SEQ ID NO.41所示的核酸序列的左臂以及包含SEQ ID NO.42所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO:11的gRNA3引导的特定基因座。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可使用包含如SEQ ID NO.43所示的核酸序列的左臂以及包含SEQ ID NO.44所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO:12的gRNA4引导的特定基因座。在另外的实施方案中,为了将本发明的报告基因整合到转基因禽类受试对象的Z染色体内的特定基因座中,可使用包含如SEQ ID NO.45所示的核酸序列的左臂以及包含SEQ ID NO.46所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO:13的gRNA5引导的特定基因座。在一些另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可使用包含如SEQ ID NO.47所示的核酸序列的左臂以及包含SEQ ID NO.48所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO:14的gRNA6引导的特定基因座。
适用于整合入本发明转基因禽类受试对象的Z染色体内的特定基因座中的gRNA序列的其他非限制性实例可以包括但不限于Z染色体基因座chrZ_9157091_1的gRNA8,其包含核酸序列ACAGACCTATGATATGTGAG(也由SEQ ID NO:27表示);Z染色体基因座chrZ_27767602_-1的gRNA9,其包含核酸序列GAGCTTGTGAGTGATAATCG(也由SEQ ID NO:28表示);Z染色体基因座chrZ_78779927_1的gRNA10,其包含核酸序列GTAAAGAGTCAGATACACAG(也由SEQ ID NO:29表示);Z染色体基因座chrZ_63364946_-1的gRNA11,其包含核酸序列CAGTGGGTACTGAAGCTGTG(也由SEQ ID NO:30表示)。
在进一步的实施方案中,为了将本发明的报告基因整合到本发明的转基因禽类受试对象的Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.33所示的核酸序列的左臂和包含SEQ ID NO.34所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO:27的gRNA8引导的特定基因座上。在另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.35所示的核酸序列的左臂和包含SEQ ID NO.36所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO:28的gRNA9引导的特定基因座上。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.37所示的核酸序列的左臂和包含SEQ IDNO.38所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO:29的gRNA10引导的特定基因座上。在又一个实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.39所示的核酸序列的左臂和包含SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO:30的gRNA11引导的特定基因座上。
在又一些替代实施方案中,可以将至少一种报告基因整合到本发明的转基因禽类受试对象的性别W染色体上的至少一个位点中。在一些特定的实施方案中,整合位点可以位于W染色体上的基因座1022859-1024215,特别是W染色体:1022859-1024215的galGal5_dna范围。在另一些其他具体实施方案中,此类基因座包含如SEQ ID NO.3所示的核酸序列。
为了在上述基因座内的任何位置特异性整合本发明的报告基因,可能需要特异性gRNA。因此,在一些特定且非限制性的实施方案中,用于制备本发明的转基因禽类动物的合适的gRNA可以包含如SEQ ID NO.1和2所示的核酸序列。在一些特定的实施方案中,这些gRNA在本文分别称为gRNA1和gRNA2。
在一些特定的实施方案中,本发明提供的转基因禽类动物已经使用了包含如SEQID NO.1所示的核酸序列的gRNA1来制备。为了能够在这样的特定位置整合本发明的报告基因,在某些实施方案中,应被整合的报告基因必须携带特定的臂,以促进其掺入所用gRNA引导的靶整合位点。因此,在一些特定的实施方案中,至少一种报告基因可以包含在第二核酸序列内,其中该报告基因在其5'和3'侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂。
在另一些替代实施方案中,本发明提供的转基因禽类动物可以使用gRNA2制备,该gRNA2包含如SEQ ID NO.2所示的核酸序列。在这种情况下,为了使本发明的报告基因能够在所述gRNA2识别的特定位点整合,第二核酸序列中包含的至少一种报告基因可以根据具体实施方案在其5'和3'侧接包含SEQ ID NO.6和7所示的氨基酸序列的同源臂。
应当进一步理解,本发明进一步包括用于本发明的任何方法、特别是用于本文所述的卵内性别确定的方法的本文所述的任何转基因禽类受试对象。在又一些另外的实施方案中,本发明进一步包括由本发明提供的任何转基因禽类受试对象(特别是如上所述的)产下的任何卵用于本发明的任何方法中的用途。在另一方面,本发明涉及一种细胞,其包含整合到性别染色体Z和W中至少一个的至少一个位置或部位中的至少一种外源报告基因。
在一些具体的实施方案中,本发明提供的细胞可以是禽细胞。在一些特定的实施方案中,本发明提供的禽细胞可以是原始生殖细胞(PGC)。
术语“生殖细胞”是指与其他生殖细胞结合后发育成配子的胚胎细胞。如本文所用,“原始生殖细胞(PGC)”涉及种系干细胞,其充当配子的祖细胞并产生多能胚胎干细胞。胚化胚胎中的细胞在胚胎发生过程中被信号化为PGC,迁移到生殖腺中成为生殖腺,并分化为成熟配子。
在一些实施方案中,整合在本发明细胞的至少一个性别染色体中的报告基因可以是荧光蛋白,具体地是RFP、YFP、BFP等,或表1公开的任何荧光蛋白。在另一些实施方案中,整合在本发明细胞中的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说,在一些特定的实施方案中,整合到本发明提供的转基因细胞的性别染色体中的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是GFP。
在更具体的实施方案中,可以使用至少一种可编程的工程核酸酶(PEN)将至少一种报告基因整合到由本发明的细胞提供的转基因禽类受试对象或动物的性别染色体中。如本文所用,术语“可编程工程核酸酶(PEN)”是指切割特定DNA序列的合成酶,所述特定的DNA序列产生于参与双链DNA损伤的DNA修复并能够直接进行基因组编辑的天然存在的核酸酶。在更具体的实施方案中,PEN可以是成簇的规律间隔的短回文重复(CRISPR)第2类,特别是II型系统。
在另一些实施方案中,本发明提供的细胞可以包含至少一种整合入该细胞性别染色体的报告基因。在更具体的实施方案中,报告基因的这种特异性整合可以通过使细胞与以下接触或共转染来实现:(a)至少一种基因编辑系统,其包含至少一种Cas9蛋白或至少一种第一核酸序列,所述第一核酸序列包含编码所述至少一种Cas9蛋白的至少一种核酸序列;和至少一种靶向至少一个性别染色体Z和/或W内的至少一个原间隔序列的gRNA,或编码所述至少一种gRNA的至少一种核酸序列;(b)至少一种第二核酸序列,其包含至少一种所述报告基因。
在某些实施方案中,共转染至本发明细胞的第二核酸序列中的至少一种报告基因可以通过在整合位点的HDR的同源臂位于其5'和3'的侧翼。
在又一些特定的实施方案中,本发明提供的细胞可以通过将本发明的至少一种报告基因整合到细胞的Z染色体中来制备。在某些实施方案中,为了制备本发明的细胞,可以将至少一种报告基因整合入性别Z染色体的至少一个位点。在更具体的实施方案中,Z染色体中的特定基因座可以是雌性鸡Z染色体的如下区域:如由SEQ ID NO:15表示的9156874-9161874、如由SEQ ID NO:16表示的27764943-27769943、如由SEQ ID NO:17表示的42172748-42177748、如由SEQ ID NO:18表示的63363656-63368656和如由SEQ ID NO:19表示的78777477-78782477。
在又一些替代实施方案中,本发明提供的细胞可以通过使用促进整合入性别Z染色体基因座42172748-42177748(具体为SEQ ID NO.17)的至少一个位点的gRNA制备。在又一些其他具体实施方案中,适于整合到Z染色体内的特定基因座中的gRNA序列可以包括但不限于Z染色体基因座chrZ_42174515_-1的gRNA7,其包含核酸序列GTAATACAGAGCTAAACCAG,也由SEQ ID NO:26表示。在又一些其他实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.31所示的核酸序列的左臂以及包含如SEQ ID NO.32所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:26的gRNA7引导的特定基因座上。
在更具体的实施方案中,将报告基因靶向本发明的细胞的Z染色体内的这样的特定位置所需的至少一种gRNA可以包含由以下任何一种表示的核酸序列:gRNA3:ACAGACCTATGATATGT,如SEQ ID NO.11所示;gRNA4:CGATTATCACTCACAAG,如SEQ ID NO.12所示;gRNA5:CTGGTTAGCATGGGGAC,如SEQ ID NO.13所示;gRNA6:GTAAAGAGTCAGATACA,如SEQID NO.14所示。
在又一些实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.41所示的核酸序列的左臂以及包含如SEQ ID NO.42所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:11的gRNA3引导的特定基因座上。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.43所示的核酸序列的左臂以及包含如SEQ ID NO.44所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:12的gRNA4引导的特定基因座上。在另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.45所示的核酸序列的左臂以及包含如SEQ ID NO.46所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:13的gRNA5引导的特定基因座上。在一些另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.47所示的核酸序列的左臂以及包含如SEQ ID NO.48所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:14的gRNA6引导的特定基因座上。
适用于整合入Z染色体内特定基因座的gRNA序列的其他非限制性实例可以包括但不限于:Z染色体基因座chrZ_9157091_1的gRNA8,包含核酸序列ACAGACCTATGATATGTGAG,也如SEQ ID NO:27表示;Z染色体基因座chrZ_27767602_-1的gRNA9,包含核酸序列GAGCTTGTGAGTGATAATCG,也如SEQ ID NO:28表示;Z染色体基因座chrZ_78779927_1的gRNA10,包含核酸序列GTAAAGAGTCAGATACACAG,也如SEQ ID NO:29所示;以及Z染色体基因座chrZ_63364946_-1的gRNA11,包含核酸序列CAGTGGGTACTGAAGCTGTG,也如SEQ ID NO:30表示。
在进一步的实施方案中,为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.33所示的核酸序列的左臂以及包含如SEQID NO.34所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:27的gRNA8引导的特定基因座上。在另外的实施方案中,为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.35所示的核酸序列的左臂以及包含如SEQ ID NO.36所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:28的gRNA9引导的特定基因座上。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.37所示的核酸序列的左臂以及包含如SEQ IDNO.38所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:29的gRNA10引导的特定基因座上。在又一个实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.39所示的核酸序列的左臂以及包含如SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:30的gRNA11引导的特定基因座上。
在一些特定的实施方案中,为了将报告基因整合到本发明提供的细胞中的W染色体上,应该使用特异性的gRNA。在另外的特定实施方案中,gRNA可以包含如SEQ ID NO.1所示的核酸序列,其在本文中称为gRNA1。在这种情况下,包含在第二核酸序列中的至少一种报告基因可以在其5'和3'分别侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂。
在又一些替代实施方案中,可以通过使用在本文中称为gRNA2的gRNA来制备本发明提供的细胞。在某些实施方案中,gRNA2可包含如SEQ ID NO.2所示的核酸序列。在这样的具体实施方案中,第二核酸序列中包含的至少一种报告基因可以在其5'和3'分别侧接具有包含如SEQ ID NO.6和7所示的氨基酸序列的同源臂。
更进一步,本发明提供了一种用于检测未孵化的受精卵的方法。在一些具体的实施方案中,这样的方法可以包括以下步骤(a),提供或获得至少一种转基因禽类受试对象或动物,该受试对象或动物在所提供的转基因动物是雌性的情况下包含整合到性染色体Z和W两者的至少一个的位置或部位中的至少一种外源报告基因,并且在所提供的转基因动物是雄性的情况下包含整合到两个性染色体Z的至少一个位置或部位中的至少一种外源报告基因。在第二步骤(b)中,从转基因禽类受试对象,特别是动物或其任何细胞中获得至少一个受精卵。下一步(c)涉及确定在卵中是否检测到至少一种可检测信号。在更具体的实施方案中,至少一种可检测信号的检测指示所述至少一种报告基因的表达,从而指示在禽类中标记的母本W染色体或Z染色体(雌性情况)或者标记的父本Z染色体的存在。
在又一些其他实施方案中,通过本发明的方法提供的转基因动物可以是具有整合入其两个Z染色体的报告基因的雄性受试对象。在这种情况下,在由这样的转基因雄性或其任何精子受精的卵中确定的可检测信号表明胚胎带有包含转基因报告基因的父本Z染色体,因此卵是可育的。在其他实施方案中,由本发明的方法提供的转基因动物可以是雌性受试对象,其报告基因整合到其Z和W染色体中。在这种情况下,在由这种转基因雌性携带的卵中确定的可检测信号表明该胚胎带有包含转基因报告基因的母体Z或W染色体,因此该卵是可育的。应当理解,在其他实施方案中,为了检测受精卵,可以将报告基因,特别是RFP基因插入任何染色体的两个拷贝中,以产生纯合的转基因禽类受试对象,特别是雄性受试对象。将检测到受精卵带有RFP报告基因。
在另一方面,本发明提供了一种试剂盒,其包括:
(a)至少一个基因编辑系统、特别是CRSPR/Cas9系统的至少一个组成部分,其可以包含至少一个Cas9蛋白或至少一个第一核酸序列,该第一核酸序列包括至少一个编码所述至少一个Cas9蛋白的核酸序列;靶向至少一个性染色体Z和/或W内的至少一个原间隔序列的至少一种gRNA,或编码所述至少一种gRNA的至少一种核酸序列;(b)至少一种第二核酸序列,其包含至少一个所述报告基因。
在一些进一步的实施方案中,本发明的方法以及本发明的试剂盒使用的gRNA(在下文中描述)可包含至少一种CRISPR RNA(crRNA)和至少一种反式激活crRNA(tracrRNA)。
在一些替代实施方案中,本发明的试剂盒可包含编码至少一种gRNA的核酸序列。此类核酸序列可包含CRISPR阵列,该CRISPR阵列包含至少一个间隔序列,其靶向并因此与靶基因组DNA序列中的至少一个间隔序列同源或相同。应当注意,核酸序列可以进一步包含编码至少一个tracrRNA的序列。
在一些实施方案中,根据本公开内容的CRISPR阵列包含至少一个间隔序列和至少一个重复序列。在又一个实施方案中,本发明还涵盖了提供pre-crRNA的选择,该pre-crRNA能够加工成可以靶向相同或不同靶标的数种最终gRNA产物。
在又一些更具体的实施方案中,包含在本发明的gRNA内的crRNA可以是与靶基因组DNA序列互补的单链核糖核酸(ssRNA)序列。在一些具体实施方案中,靶基因组DNA序列可以位于紧邻原间隔序列邻接基序(PAM)序列的上游或更上游。
如本文所述,本发明的试剂盒和方法的gRNA可以至少部分地与靶基因组DNA互补,在这种情况下,是性别染色体Z或W内的靶基因座,在本文中称为“原间隔序列”。在某些实施方案中,“互补性”是指各自遵循锁钥原理的两个结构之间的关系。实质上互补性是DNA复制和转录的基本原理,因为它是两个DNA或RNA序列之间共有的性质,从而当它们彼此反向平行比对时,序列中每个位置上的核苷酸碱基将是互补的(例如,A和T,或者U、C和G)。
如上所述,由本发明试剂盒的gRNA靶向的基因组DNA序列位于紧邻PAM序列的上游。在一些实施方案中,此类PAM序列可以是核酸序列NGG。
在某些实施方案中,本发明所指的PAM序列可以包含N,即任何核苷酸,特别是腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)或胸腺嘧啶(T)中的任何一个。在另一些实施方案中,根据本发明的PAM序列由A,G,C或T和两个鸟嘌呤组成。
根据一个实施方案,编码本发明的gRNA的多核苷酸可包含至少一个间隔序列和任选地至少一个重复序列。在另外一些实施方案中,编码本发明的gRNA的DNA可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个,特别是110、120、130、140、150、160、170、180、190、200个或更多个间隔序列。在一些实施方案中,每个间隔序列位于两个重复之间。应当进一步理解,编码本发明的gRNA的核酸序列的间隔序列可以是相同或不同的间隔序列。在更多的实施方案中,这些间隔序列可以靶向相同或不同的靶基因组DNA。在又一些其他实施例中,这样的间隔序列可以靶向至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个靶基因组DNA序列。这些靶序列可以来自单个基因座或可选地来自数个靶基因座。
如本文所用,术语“间隔序列”(spacer)是指被设计为靶向特定序列并且位于CRISPR阵列的多个短的直接重复序列(即,CRISPR重复序列)之间的非重复间隔序列。在一些具体的实施方案中,间隔区可包含约15至约30个核苷酸,具体地,约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多的核苷酸。更具体地说,约20-25个核苷酸。
由本发明的CRISPR系统编码的向导或向导RNA可以包含CRISPR RNA(crRNA)和反式激活RNA(tracrRNA)。由CRISPR间隔序列编码的向导RNA的序列没有特别限制,除了要求将其定向(即具有与禽类基因组DNA中的靶序列相同或互补的片段)外,具体地,在性别染色体Z或W内的靶基因座中,在本文中也称为“原间隔序列”(proto-spacer)。此类原间隔序列包含与由CRISPR间隔序列编码的向导RNA具有足够互补性的核酸序列,所述CRISPR间隔序列包含在编码本发明的方法和试剂盒的gRNA的核酸序列内。
在一些实施方案中,crRNA包含20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40nt的间隔区(靶向)序列或由其组成,然后是19-36nt的重复序列。在具体的和非限制性的实施方案中,靶向间隔序列可以包含靶向基因组DNA序列中的任何一个的片段或由其组成,在本文中代表性间隔序列序列指示了所述所述片段。
应当注意,在一些具体实施方案中,本发明的CRISPR系统的间隔序列可以编码靶向指导RNA(gRNA)。“gRNA”或“向导RNA”是这样的一种RNA,当从编码它的CRISPR系统的一部分转录时,它包含与靶基因组DNA中的DNA序列相同(在RNA序列的情况下除了用U代替T之外)或互补(并因此“靶向”)的RNA序列的至少一个片段。本公开内容的CRISPR系统可以任选地编码一个以上的向导RNA,并且所述向导RNA针对基因组DNA中的一个或多个靶序列。
在一些实施方案中,由本发明的试剂盒提供的Cas9蛋白可以由如SEQ ID NO.24所示的核酸序列编码。在另外的特定和非限制性实施方案中,Cas9蛋白可包含如SEQ IDNO.25所示的氨基酸序列,或其任何衍生物、突变体或变体。
应当注意,“氨基酸序列”或“肽序列”是通过肽键连接的氨基酸残基位于肽和蛋白质的链中的顺序。通常从含有游离氨基的N-末端到含有酰胺的C-末端报告该序列。氨基酸序列通常称为肽,如果它代表蛋白质的一级结构,则称为蛋白质序列,然而,必须在术语“氨基酸序列”或“肽序列”和“蛋白质”之间进行区分,因为蛋白质被定义为被折叠成具体的三维构象并通常经历翻译后的修饰(例如磷酸化、乙酰化、糖基化、甘露糖基化、酰胺化、羧化、巯基键形成、切割等)的氨基酸序列。
“肽片段”是指所述Cas9或RFP(下文描述)分子的一部分。分子的“片段”,例如本发明的任何氨基酸序列,是指Cas9或RFP分子的任何氨基酸子集。这也可以包括其“变体”或“衍生物”。“肽”是指具有功能性的特定氨基酸亚组。“功能性”是指具有相同的生物学功能,例如具有与Cas9一样进行基因编辑或与RFP一样产生可检测信号的能力。
应当理解,本发明涵盖本发明的RFP或Cas9分子的任何变体或衍生物以及基本上相同或同源的任何多肽。术语“衍生物”用于定义这样的氨基酸序列(多肽),其具有不改变原始多肽的活性的针对该氨基酸序列(多肽)的任何插入、缺失、取代和修饰。就此而言,本发明的Cas9或RFP分子的衍生物或片段可以是Cas9或RFP分子的任何衍生物或片段,特别是如SEQ ID NO.25、21、23所示的,其不会降低或改变Cas9或RFP分子的活性。术语“衍生物”也指其同源物、变体和类似物。与根据本发明的目的蛋白质具有序列同源性或同一性的蛋白质直系同源物或同源物,特别是可以共享至少50%、至少60%并且特别是65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或更高,特别是与根据本发明的感兴趣的蛋白质的完整序列相比,例如,包含由SEQ ID NO.25、21、23表示的氨基酸序列的任何蛋白质。具体而言,针对SEQ ID NO.25、21、23,具有至少50%、至少60%以及更具体地65%、70%、75%、80%、85%、90%、91%、92%、93%,94%,95%,96%,97%,98%,99%或更高地相同的氨基酸序列或由其组成的同源物。具体地,如SEQ IDNO.25、21、23所示的整个序列。
在一些实施方案中,衍生物是指多肽,其通过氨基酸残基的插入、缺失或取代而与本发明中具体定义的多肽不同。应当理解,如本文所用,术语“插入”、“缺失”或“取代”是指分别向由本发明公开的多肽添加、缺失或置换氨基酸残基,添加、缺失或置换1至50个氨基酸残基、20至1个氨基酸残基、特别是1至10个氨基酸残基。更特别地,插入、缺失或取代可以是1、2、3、4、5、6、7、8、9或10中的任何一个的氨基酸。应当注意,本发明涵盖的插入、缺失或取代可以在修饰的肽的任何位置以及在其N'或C'末端的任何位置发生。
关于氨基酸序列,本领域技术人员将认识到,对核酸、肽、多肽或蛋白质序列的单个取代、缺失或添加会改变、添加或删除氨基酸序列中的单个氨基酸或一小部分氨基酸。编码的序列是“保守修饰的变体”,其中该改变导致氨基酸被化学相似的氨基酸取代。提供功能上相似的氨基酸的保守取代表是本领域众所周知的。此类保守修饰的变体补充并且不排除本发明的多态变体、种间同源物和等位基因。例如,可以进行取代,其中脂族氨基酸(G、A、I、L或V)被组内的另一成员取代,或诸如一个极性残基被另一个所取代,例如用精氨酸取代赖氨酸、用谷氨酸取代天冬氨酸或用谷氨酰胺取代天冬酰胺。以下八个组中的每一个都包含其他示例性氨基酸,它们是彼此的保守取代:
1)丙氨酸(A),甘氨酸(G);
2)天冬氨酸(D),谷氨酸(E);
3)天冬酰胺(N),谷氨酰胺(Q);
4)精氨酸(R),赖氨酸(K);
5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V);
6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);
7)丝氨酸(S),苏氨酸(T);和
8)半胱氨酸(C),蛋氨酸(M)。
因此,在一些实施方案中,本发明涵盖Cas9或RFP分子或其任何衍生物,特别是相对于如SEQ ID NO.21、23、25中的任何一个所示的氨基酸序列包含至少1、2、3、4,5、6、7、8、9、10个或更多个保守取代的衍生物。更具体地说,氨基酸“取代”是用具有相似结构和/或化学性质的另一种氨基酸替换一个氨基酸的结果,即保守氨基酸替换。可以基于极性、电荷、溶解性、疏水性、亲水性和/或所涉及残基的两亲性质的相似性来进行氨基酸取代。例如,非极性“疏水”氨基酸选自缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、苯丙氨酸(F)、色氨酸(W)、半胱氨酸(C)、丙氨酸(A)、酪氨酸(Y)、组氨酸(H)、苏氨酸(T)、丝氨酸(S)、脯氨酸(P)、甘氨酸(G)、精氨酸(R)和赖氨酸(K);“极性”氨基酸选自精氨酸(R)、赖氨酸(K)、天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷氨酰胺(Q);“带正电荷”的氨基酸选自精氨酸(R)、赖氨酸(K)和组氨酸(H),并且其中“酸性”氨基酸选自天冬氨酸(D)、天冬酰胺(N)、谷氨酸(E)和谷氨酰胺(Q)。
本发明的多肽的变体与感兴趣的蛋白(例如本发明的各种多肽)在氨基酸水平可以具有至少80%的序列相似性或同一性,通常具有至少85%的序列相似性或同一性,具有90%的序列相似性或同一性,或至少95%、96%、97%、98%、99%的序列相似性或同一性。
在一些实施方案中,本发明试剂盒中包含的第二核酸序列中的至少一种报告基因可以在整合位点的HDR同源臂的5'和3'侧翼。
在又一些其他具体实施方案中,本发明试剂盒的第二核酸序列中的至少一种报告基因可以可操作地连接至性别特异性启动子、胚胎特异性启动子和诱导型启动子中的任何一个。
在另一些替代实施方案中,所述至少一种报告基因可以整合到性别Z染色体的至少一个位点中。在更具体的实施方案中,Z染色体中的特异性基因座可以是雌鸡的染色体Z的以下区域中的任何一个:如由SEQ ID NO:15所表示的9156874-9161874、如由SEQ ID NO:16所表示的27764943-27769943、如由SEQ ID NO:17所表示的42172748-42177748、如由SEQID NO:18所表示的63363656-63368656、如由SEQ ID NO:19所表示的78777477-78782477。
在一些具体的实施方案中,至少一种报告基因可以被整合到性别Z染色体基因座42172748-42177748的至少一个位点中。本发明试剂盒的第一核酸序列的非限制性实例可以包含gRNA,其为至少一个Z染色体基因座chrZ_42174515_-1的gRNA7,包含核酸序列GTAATACAGAGCTAAACCAG,也由SEQ ID NO.26表示。更具体地,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.31所示的核酸序列的左臂以及包含如SEQ ID NO.32所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:26的gRNA7引导的特定基因座上。
因此,在更具体的实施方案中,本发明的试剂盒的第一核酸序列可包含gRNA,其为如下中的至少一个:如SEQ ID NO.11所示的gRNA3:ACAGACCTATGATATGT;如SEQ ID NO.12所示的gRNA4:CGATTATCACTCACAAG;如SEQ ID NO.13所示的gRNA5:CTGGTTAGCATGGGGAC;如SEQID NO.14所示的gRNA6:GTAAAGAGTCAGATACA。
在进一步的实施方案中,包含在本发明试剂盒的第二核酸序列内的至少一种报告基因可以在其5'和3'侧接有包含由SEQ ID NO:41至48中的任一项所示的氨基酸序列的同源臂。更具体地,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.41所示的核酸序列的左臂以及包含如SEQ ID NO.42所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:11的gRNA3引导的特定基因座上。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.43所示的核酸序列的左臂以及包含如SEQ ID NO.44所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:12的gRNA4引导的特定基因座上。在另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ IDNO.45所示的核酸序列的左臂以及包含如SEQ ID NO.46所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:13的gRNA5引导的特定基因座上。在一些另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ IDNO.47所示的核酸序列的左臂以及包含如SEQ ID NO.48所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:14的gRNA6引导的特定基因座上。
本发明试剂盒的第一核酸序列的其他非限制性实例可以包含gRNA,其是如下中的至少一个:Z染色体基因座chrZ_9157091_1的gRNA8,包含核酸序列ACAGACCTATGATATGTGAG,也如SEQ ID NO:27表示;Z染色体基因座chrZ_27767602_-1的gRNA9,包含核酸序列GAGCTTGTGAGTGATAATCG,也如SEQ ID NO:28表示;Z染色体基因座chrZ_78779927_1的gRNA10,包含核酸序列GTAAAGAGTCAGATACACAG,也如SEQ ID NO:29所示;以及Z染色体基因座chrZ_63364946_-1的gRNA11,包含核酸序列CAGTGGGTACTGAAGCTGTG,也如SEQ ID NO:30表示。
在进一步的实施方案中,包含在本发明试剂盒的第二核酸序列内的至少一种报告基因可以在其5'和3'侧接有包含由SEQ ID NO:31至40所示的氨基酸序列的同源臂。更具体地,为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.33所示的核酸序列的左臂以及包含如SEQ ID NO.34所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:27的gRNA8引导的特定基因座上。在另外的实施方案中,为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.35所示的核酸序列的左臂以及包含如SEQ ID NO.36所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:28的gRNA9引导的特定基因座上。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.37所示的核酸序列的左臂以及包含如SEQ ID NO.38所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:29的gRNA10引导的特定基因座上。在又一个实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQ ID NO.39所示的核酸序列的左臂以及包含如SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:30的gRNA11引导的特定基因座上。
在某些实施方案中,可以将本发明的试剂盒提供的至少一种报告基因整合到性别染色体(特别是染色体W)的至少一个非编码区中。在这种情况下,本发明的试剂盒可以编码至少一种包含如SEQ ID NO.1和2所示的核酸序列的gRNA,在本文中也分别称为gRNA1和gRNA2。
在一些具体的实施方案中,本发明的试剂盒的第一核酸序列可以包含gRNA,其为gRNA1。在一些实施方案中,此类gRNA1可包含如SEQ ID NO.1所示的核酸序列。在这种情况下,包含在本发明试剂盒的所述第二核酸序列中的报告基因可以在其5'和3'分别侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂。
在另一些替代实施方案中,本发明的试剂盒可在其第一核酸序列中包含编码gRNA2的序列。在一些具体的实施方案中,这样的序列编码为如SEQ ID NO.2所示的核酸序列。在另外一些实施方案中,包含在本发明试剂盒的第二核酸序列内的至少一种报告基因可以在其5'和3'侧接有包含分别如SEQ ID NO.6和7所示的氨基酸序列的同源臂。
在一些实施方案中,本发明的试剂盒的第二核酸序列中包含的报告基因可以是至少一种荧光报告基因。更进一步,在一些实施方案中,本发明的试剂盒提供的报告基因可以是任何荧光蛋白,具体地为RFP、YFP和本发明公开的任何荧光蛋白或表1公开的任何荧光蛋白。在一些实施方案中,本发明的试剂盒使用的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说,在一些特定的实施方案中,由本发明的试剂盒提供的整合到转基因动物的性别染色体中的报告基因可以是任何荧光蛋白,条件是所述荧光蛋白不是GFP。在另一些实施方案中,报告基因可以是RFP。在更具体的实施方案中,这种RFP可以包含如SEQ ID NO.21所示的氨基酸序列,或其任何同源物、变体、突变体或衍生物。在另一些替代具体实施方案中,本发明使用的RFP可以是包含如SEQ ID NO.23所示的氨基酸序列的RFP,或其任何同源物、突变体或衍生物。
在又一些其他实施方案中,本发明的试剂盒可适合用于制备转基因禽类动物,该转基因禽类动物包含整合到性别染色体Z和W中至少一个的至少一个位置或部位中的至少一种外源报告基因。
在一些实施方案中,本发明的方法可以使用本文所述的本发明的任何试剂盒。
更进一步,必须理解,本发明的试剂盒可以进一步包含制备本发明的转基因禽类动物所需的任何试剂、缓冲液、培养基或材料。本发明的试剂盒可以进一步包括说明书以及用于其不同组分的容器。
在一些实施方案中,本发明的试剂盒可用于制备本发明的任何转基因禽类受试对象或其根据本发明的任何细胞。在又一些其他实施方案中,使用本发明的试剂盒制备的转基因禽类受试对象和细胞可以使用本文公开的任何系统和装置通过本发明的任何方法使用。更进一步,在一些实施方案中,本发明的试剂盒可进一步包括适于确定通过本发明的方法检查的卵内胚胎中报告基因的存在的任何装置、系统和/或装置。在一些特定实施例中,这样的装置或设备可以是本发明公开的任何设备,具体地,如图1所示。
在本发明的另一方面,本发明提供了一种系统、装置或设备,其特别适于检测卵内胚胎内的报告基因。在一些实施例中,本发明的装置可以包括激光源、卵支架、透镜、滤光器、检测器支架和检测器。在一些实施例中,本发明的装置可以可选地包括固体支持物,其固持本发明的系统的所有元件,例如,如图1所示。如本文所使用的,术语“检测器”是指检测和/或测量光的任何类型的设备。
在一些实施例中,应该注意的是,可使用合适的荧光手段通过本发明的装置检测可检测信号,具体地为荧光信号。在一些实施例中,可由RFP报告基因形成的可检测信号可以由光敏装置例如改良的光学显微镜或电荷耦合器件(CCD)、高灵敏度光子检测器检测。
在又一些实施方案中,本发明的装置、设备或系统可以包括至少一个光源、至少一个检测器、至少一个滤光器和至少一个将卵放置保持适当位置以促进向所述光源暴露表达本发明的报告基因的细胞的保持臂。在一些实施方案中,此类卵可以是未孵化的受精禽卵。在另外一些实施方案中,这种卵可以由本发明的任何转基因禽类受试对象产下。在一些特定的和非限制性的实施例中,本发明的这种设备可以如图1所示。在又一些实施例中,蛋保持器与透镜和/或透镜与检测器之间的距离可以在大约1至100cm之间的范围内,具体地,为1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95和100厘米,特别是大约5到25厘米之间,更特别是大约20厘米。
因此,应当理解,在一些实施例中,本发明的系统或设备可以适于执行本发明公开的任何方法。
在一些具体的实施方案中,本发明的装置可以包括合适的光源,该光源能够检测被检卵中的报告基因。在又一些其他实施例中,光源可以包括在大约400到大约650之间的波长。在又一些实施例中,可以使用任何波长的光,条件是所述光源不是紫外线(UV)(波长10-400nm)。
在一些特定的实施方案中,合适的光源适合于激发荧光蛋白。在一些特定实施例中,激发波长可以在约500nm与约650nm之间。在一些其他实施例中,激发波长为大约510、515、520、525、530、535、540、545、550、555、560、565、570、575、580、585、590、595、600、605、610、615、620、625、630、635、640nm。在一些更具体的实施例中,激发波长可以在大约515至大约555之间的范围内。在又一些其他实施例中,波长可以是532nm。在一些特定且非限制性的实施例中,光源可以由激光器提供。在一些其他实施例中,本发明的装置的激光器可以是蓝色激光器或红色激光器。在更具体的实施例中,光源是绿色激光器。在某些实施例中,激光器可以与滤光器一起使用。在一些实施例中,滤光器可以是在500nm以上透射的绿色滤光器,或者是在540nm和580nm之间透射的深绿色滤光器,或者是在590nm和650nm之间透射的红色滤光器,或者是650nm以上或660nm以上透射的红色滤光器。
在一些特定实施例中,光源可以是波长为532nm的绿色激光器。在一些其他实施例中,这种激光器可以设置有在650nm以上透射的红色滤光片。
因此,应该进一步理解,本发明还包括如本文所述的用于本发明的任何方法、特别是用于本文所述的卵内性别确定的方法的装置,所述方法使用本发明的任何转基因禽类受试对象。
应该意识到,在某些实施方案中,本发明的试剂盒和方法使用的寡核苷酸或多核苷酸是分离的和/或纯的分子。如本文所用,当用于指核酸时,“分离的”或“纯的”是指天然存在的序列已从其正常细胞(例如染色体)环境中移除或在非天然环境中合成(例如,人工合成)。因此,“分离的”或“纯的”序列可以在无细胞溶液中或置于不同的细胞环境中。术语“纯的”并不意味着该序列是唯一存在的核苷酸,而是它基本上不含(约90-95%纯度)与其天然相关的非核苷酸材料,因此与分离的染色体区分开。
除非另有说明,否则本文使用的所有科技术语具有本领域通常使用的含义。本文提供的定义是为了便于理解本文经常使用的某些术语,并不意味着限制本公开的范围
在详细描述本发明的具体方面和实施方案之前,应该理解的是,本发明不限于所描述的特定方法和实验条件,因为这些方法和条件可以变化。还应该理解的是,本文使用的术语仅用于描述特定实施方案的目的,而不是限制性的,因为本发明的范围将仅由所附权利要求限制。
如在本说明书和所附权利要求中所使用的,除非上下文另外明确指出,否则单数形式“一种”、“一个”和“该”包括复数指代。因此,例如,提及“一种方法”包括本文所述类型的一种或多种方法和/或步骤,和/或在阅读本公开内容时对于本领域技术人员而言将变得显而易见的那些,等等。
除非另外定义,否则本文使用的所有科技术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管在本发明的实践或测试时可以使用与本文所述相似或等同的任何方法和材料,但现在描述优选的方法和材料。
在整个说明书和随后的权利要求书中,除非上下文另有要求,否则词语“包括”以及诸如“包含”和“含有”的变化将被理解为暗示包含所述整数或步骤或整数组或步骤组,但不排除任何其它整数或步骤或整数组或步骤组。更具体而言,术语“包括”、“包含”、“含有”、“带有”、“具有”及其缀合词意味着“包括但不限于”。该术语包括术语“由……组成”和“基本上由……组成”。短语“基本上由……组成”是指组合物或方法可以包括另外的成分和/或步骤,但条件是另外的成分和/或步骤不实质上改变所要求保护的组合物或方法的基本和新颖特征。
如本文所使用的术语“约”表示可能偏离所提及的值至多1%,特别是5%,更特别是10%,更特别是15%,并且在一些情况下至多20%的值,偏离范围包括整数值,并且如果适用,非整数值也构成连续范围。如本文所用,术语“约”是指±10%。
应该注意的是,本发明的各种实施方案可以以范围的形式呈现。应该理解的是,范围格式的描述仅仅是为了方便和简洁,并且不应该被解释为对本发明范围的不灵活的限制。因此,范围的描述应被认为已经具体公开了所有可能的子范围以及该范围内的单个数值。例如,诸如1至6的范围的描述应该被认为已经具体公开了子范围,例如1至3,1至4,1至5,2至4,2至6,3至6等,以及该范围内的单个数值,例如1、2、3、4、5和6。不管范围的宽度如何,这都适用。无论在本文何时指出数值范围,其意图包括在所指范围内的任何引用的数值(分数或整数)。第一指示数值和第二指示数值之间的“范围/范围之间”和“范围/从……起的范围”第一指示数值“至”第二指示数值在本文中可互换使用,并且意在包括第一和第二指示数值以及它们之间的所有分数和整数数值。
提出以下实施例以便为本领域普通技术人员提供关于如何制造和使用本发明的方法和组合物的完整公开和描述,并且不旨在限制发明人所认为的其发明的范围。已经致力于确保所用数值(例如数量,温度等)的准确性,但是应该考虑到一些实验误差和偏差。除非另有说明,否则份数是重量份,分子量是平均分子量,温度是摄氏度,压力是在大气压或接近大气压。
实例是在实施本发明的各方面时发明人所采用的技术的代表。应该理解的是,尽管这些技术是用于实践本发明的优选实施方案的实例,但根据本公开内容,本领域技术人员将意识到可以进行许多修改而不脱离本发明的精神和预期范围。
应该意识到,为了清楚起见,在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为了简洁起见,在单个实施方案的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合提供,或者适合于在本发明的任何其它描述的实施方案中提供。在各种实施方案的上下文中描述的某些特征不被认为是那些实施方案的必要特征,除非该实施方案在没有那些元件的情况下不起作用。
如上文所描述的以及如以下权利要求部分所要求保护的本发明的各种实施方案和方面在以下实例中找到实验支持。
尽管已经公开和描述,但是应该理解,本发明不限于本文公开的具体实例、方法步骤和组合物,因为这样的方法步骤和组成可以稍微变化。还应该理解的是,这里使用的术语仅用于描述特定实施方案的目的,而不旨在限制,因为本发明的范围将仅由所附权利要求及其等同物限制。
必须注意的是,如在本说明书和所附权利要求中所使用的,除非内容另有明确规定,否则单数形式“一种”、“一个”和“该”包括复数指代物。
实施例
无需进一步详述,相信本领域技术人员可以使用前面的描述最大限度地利用本发明。因此,以下优选的具体实施方案应被解释为仅仅是说明性的,而不是以任何方式限制所要求保护的发明。
本文中未具体描述的本领域已知的标准分子生物学方案通常基本上按照Sambrook等,Molecular cloning:A laboratory manual,Cold SpringsHarborLaboratory,New-York(1989,1992)和Ausubel等,Current Protocols inMolecularBiology,John Wiley and Sons,Baltimore,Maryland(1988)进行。
试剂
动物:
商业白色来亨鸡从Hendrix ISA和明尼苏达州获得。
标记线鸡(Marker Line chickens)来自加拿大不列颠哥伦比亚省Agassiz的Pacific Agri-Food Research Centre。
严格按照IACUC批准的方案进行动物实验,并在Crystal Bioscience IACUC委员会的监督下进行,以确保动物在实验过程中不患病或死亡。
载体:
PrecisionXTM Cas9 SmartNuclease Vector System订购于System BioscienceInc.,目录号为CAS8/9xx系列。
来自Clontech#6921-l的pDsRed1-N1。
GFP质粒-FUGW-H1-GFP-新霉素(Addgene),目录号37632。
细胞系:雌性细胞是Gattus gallus,淋巴母细胞雌性细胞系Con A-C1-VICK,从
Figure BDA0003631629220000651
编号:CRL-12135TM订购。在鸡细胞培养实验中,使用了来自ATCC的鸡成纤维细胞雌性细胞系UMNSAH/DF-1(
Figure BDA0003631629220000653
CRL-12203TM)。雄性细胞是Gattus gallus,上皮雄性细胞系LMH/2A,购自
Figure BDA0003631629220000652
编号:CRL-2118TM
原始生殖细胞(PGC)系。
人胚胎肾293(HEK-293)细胞系(ATTC)。
制备禽类转基因受试对象所需的试剂和材料
PGC分离
1.微电极拉制仪(Shutter Instrument Co.)。
2.微型研磨机(NARISHIGE)。
3.小直径(25μm)玻璃微量移液器。
4.口控移液器(Sigma-Aldrich)。
5. 1x Hank平衡盐溶液(HBSS),不含CaCl2或MgCl2(Hyclone,Logan,UT)。
6. 1x Dulbecco磷酸盐缓冲液(PBS),不含Ca2或Mg2(Hyclone)。
7.胰蛋白酶/乙二胺四乙酸(EDTA)(Gibco)。
8.Hamburger和Hamilton(HH)阶段14-17的鸡胚。
9.磁激活细胞分选(MACS)缓冲液,补充0.5%牛血清白蛋白(BSA)和2mM EDTA的1xPBS。
10.MiniMACS柱(Miltenyi Biotec)。
11.阶段特异性胚胎抗原1(SSEA-1)抗体(Santa Cruz Biotechnology,SantaCruz,CA)。
12.抗小鼠IgM微珠(Miltenyi Biotec)。
PGC培养
1.PBS(Hyclone)。
2.HBSS(Hyclone)。
3.PGC培养基(50mL)。3.75mL胎牛血清(FBS,Hyclone),1.25mL鸡血清(Sigma-Aldrich,St.Louis,MO),500μL GlutaMAX-I补充剂(100x,Invitrogen),500μL核苷(100x,Millipore),500μL抗生素/抗真菌药(ABAM;100x,Invitrogen),500μL胰岛素-转铁蛋白-硒补充剂(100x,Gibco),500个非必需氨基酸(NEAA;100x,Invitrogen),50μLβ-巯基乙醇(1000x,Sigma-Aldrich),10μL的50ng/μL人碱性成纤维细胞生长因子(bFGF,Sigma-Aldrich),并加入多达50mL的敲除Dulbecco改良的Eagle培养基(DMEM;Invitrogen)。储存在4℃。
4.Accutase(Millipore)。
生殖系嵌合体的产生和转基因
基因转移到鸡PGC中
1.Lipofectamine 2000(Invitrogen)。
2.Opti-MEM培养基(Invitrogen)。
3.转染培养基(不含ABAM的PGC培养基;50mL):3.75mL FBS(Hyclone),1.25mL鸡血清(Sigma-Aldrich),500μL GlutaMAX-I补充剂(100x,Invitrogen),500μL核苷(100x,Millipore),500μL胰岛素转铁蛋白硒补充剂(100x,Gibco),500μL NEAA(100x,Invitrogen),50μLβ-巯基乙醇(1000x,Sigma-Aldrich)和10μL 50ng/μL bFGF(Sigma-Aldrich),并添加敲除DMEM(Invitrogen)至50mL。储存在4℃。
4.PBS,不含Ca2或Mg2。
5.HBSS,不含Ca2或Mg2。
6.制备1μg/μL的质粒DNA。
转基因PGC的体外增殖和选择
1.HBSS,不含Ca2或Mg2(Hyclone)。
2.血细胞计数器。
3.台盼蓝,0.4%(Invitrogen)。
4.倒置荧光显微镜(Leica Microsystems)。
5.
Figure BDA0003631629220000671
选择性抗生素(Gibco)。
PGC移植入接受卵中
1.小直径(25μm)玻璃微量移液器(由微电极拉制仪(Shutter Instrument Co.)和微型研磨机(NARISHIGE)制成)。
2.口控移液器。
3.HBSS,不含CaCl2或MgCl2(Hyclone)。
4.HH阶段14-17的接受鸡胚。
5.不含Ca2或Mg2的PBS(Hyclone)。
6.移液器清洗液。0.1%高压灭菌蒸馏水中的过氧化氢(Sigma-Aldrich)。
7.钳子。
8.带照明器的体视显微镜。
9.热熔胶棒和胶枪。
10.封口膜。
11.供体PGC在HBSS中以3_103个细胞/μL制备。
测试交叉
1.野生型韩国Ogye(KO)雌性鸡。
2. 1mL注射器。
3.PBS,不含Ca2或Mg2(Hyclone)。
供体衍生后代和转基因鸡验证
1.DNeasy血液和组织试剂盒(Qiagen)。
2.供体PGC特异性引物组。
3.转基因特异性引物组。
4.PCR机。
5.PCR试剂:PCR缓冲液,dNTP,Taq聚合酶。
6.琼脂糖
7.TAE缓冲区。
8.电泳机。
实验步骤
荧光测定
实验的完整设置包括一个激光源、一个能够将卵定位在允许卵中表达报告基因的细胞暴露于所述激光源的适当位置的保持器或支架,透镜,滤光器,检测器支架和检测器,如图1所示。样品与透镜之间以及透镜与检测器之间的距离约为20厘米。透镜的焦平面约为10厘米,滤光器放置在此处。
通过将滤光片放置在检测器之前并覆盖检测器的所有周围区域,以确保散射光不会绕过滤光器,可以检测出最佳条件。
使用了三种类型的激光器,其初始功率为I0,并且滤光器如下表2所示:
表2:使用的光源:
Figure BDA0003631629220000691
将转染的GFP或RFP表达细胞注射到卵中
将HEK细胞维持在DMEM培养基中,该培养基补充有1%的L-谷氨酰胺,10%胎牛血清(FBS)和1%PenStrep(青霉素+链霉素)(Biological industries,以色列)。细胞在37℃,5%CO2的潮湿培养箱中生长。每周更新培养基2-3次,并且细胞计数保持在1×105至3×105细胞/mL之间。将细胞传代培养并重悬于新鲜培养基中,如下所示:
1.从烧瓶中除去上清液,使细胞粘附到烧瓶表面。
2.将移出的细胞重悬于5mL新鲜培养基中
第二次继代培养后,根据制造商规程,使用PolyJetTM体外DNA转染试剂(SignaGenLaboratories,MD,USA),用2μg质粒DNA转染细胞。将两个质粒分别转染到细胞中。如上所述的GFP质粒和RFP质粒。
随后,以106细胞/ml的浓度制备转染的细胞(RFP)。然后根据表3和表4将总体积为100μl的细胞注射到中心的新鲜鸡卵中。
表3:RFP注入
Figure BDA0003631629220000692
Figure BDA0003631629220000701
在第二个实验中,细胞如前所述培养并转染。然后将细胞转移至PBS或50%甘油中(以控制分散),并注入中心的新鲜卵中。表4公开了不同的注入卵。
表4:RFP或GFP注射
Figure BDA0003631629220000702
雄性鸡细胞系
雄性细胞,特别是鸡的鸡鸡(肝脏;化学诱导;用鸡雌激素受体基因转染),在添加了1%L-谷氨酰胺,10%胎牛血清(FBS)的Waymouth MB 752/1培养基中生长,以及1%的PenStrep(青霉素+链霉素)(以色列生物产业)。培养瓶(T25)用0.1%明胶包被。每3天更新一次培养基。使细胞在37℃,5%CCh的潮湿培养箱中生长。
雌性鸡细胞系
使用了来自ATCC的鸡成纤维细胞雌性细胞系UMNSAH/DF-1(
Figure BDA0003631629220000711
CRL-12203TM)。表5给出了有关该单元的更多详细信息:
表5:雌性鸡细胞系
生物 Gallus gallus,鸡
细胞类型 自发转化的成纤维细胞
产品形式 冷冻
形态学 成纤维细胞
培养特点 贴壁
年龄 妊娠10天
性别 雌性
雌性细胞在补充有1%L-谷氨酰胺、10%胎牛血清(FBS)和1%PenStrep(青霉素+链霉素)(Biological industries,以色列)的DMEM培养基中培养。细胞在加有5%CO2的37℃的湿润培养箱中生长。培养基每周更新2-3次。
PGC细胞培养
在孵化6.5天后从白来亨鸡(WL)胚胎中获取胚胎性腺,然后用磁活化细胞分选仪(MACS)处理回收的性腺细胞,以分离总胚胎性腺细胞中的PGC。PGC在KO-DMEM(LifeTechnologies)中生长,其中40%在水牛大鼠肝细胞(BRL,ATCC)上预处理,并补充7.5%胎牛血清(Hyclone)、2.5%辐照鸡血清、1X非必需氨基酸、2mM谷氨酰胺、1mM丙酮酸钠、0.1mMβ-巯基乙醇(均来自Life Technologies)、4ng/ml重组人成纤维细胞生长因子、6ng/ml重组小鼠干细胞因子(均来自R&D Systems),并在BRL细胞的辐射饲养层。每周将细胞传代3次到新鲜的饲养层上。
无限制(RF)克隆
gRNA插入Cas9-SmartNucleaseTM载体通过应用无限制性方法进行(Peleg Y等,J.Struct.Biol.172(1):34-44(2010)2010)。引物购自Sigma-Genosys(Rehovot,以色列),随后的RF反应使用Phusion聚合酶(Thermo Scientific,Hudson,NH,美国)进行。分别使用MEGAspin试剂盒和DNA-spin质粒DNA纯化试剂盒(Intron Biotechnology,Daejoen,韩国)进行质粒纯化。
转染鸡的W或Z染色体
使用PolyJetTM将细胞与每种质粒的2μg DNA共转染(请参见下面的详细信息)。根据制造商的说明,进行体外DNA转染试剂(SignaGen Laboratories,MD,USA)。两种质粒的共转染如下:
1.pDsRed带有鸡Z染色体左右臂或W染色体左右臂和CMV-hspCas9-H1-gRNA(测定)。
2.pCMVGluc带有鸡Z染色体左右臂或W染色体左右臂和CMV-hspCas9-H1-gRNA(对照)。
然后将细胞用新霉素抗性接种,并以每孔105个细胞的密度接种在48孔板中。3天后,添加40μl N1新霉素以选择具有报告基因的稳定整合的细胞。
DNA分析以整合入Z或W染色体
为了验证染色体整合,使用了以下策略。分离细胞,提取其中一半的DNA,并在琼脂凝胶(1%)上电泳。切割并清洗基因组DNA(将质粒DNA留在凝胶上)。使用以下引物进行PCR测定。产物在凝胶上分离,然后测序。由于插入片段太长,无法通过PCR测定法检测到,因此设计了滑动窗口PCR测定法,可用于初始PCR产物。
a.具有插入物的细胞系的测定(包括左臂的一部分、CMV增强子、启动子和MCS以及dsRED2的一部分):
左引物-TTGGTGTGTGCTAATAGGCAGT,如SEQ ID NO.49所示;右引物-TAGTCCTCGTTGTGGGAGGT,如SEQ ID NO.50所示,产物大小:1489bp。
b.具有插入物的细胞系的测定(包括侧接Z染色体的一部分(到臂)、左臂、以及CMV增强子的一部分、启动子):
左引物-GCATTGATCTGTCCAGTTGC,如SEQ ID NO.51所示,右引物-TACTGCCAAAACCGCATCAC,如SEQ ID NO.52所示,产物大小:1462bp。
转基因鸡的制备
将浓缩的载体(可以是滴度为约107MOI的慢病毒或质粒DNA)注射到新产卵的25个胚胎中。每周进行三次注射。注射的胚胎在注射后3周孵化。这些是G0鸟。孵化后,立即从孵化雏鸡的CAM样品中提取DNA,并通过半定量PCR检测载体DNA的存在与否。2-3周龄的血样G0小鸡,并重复PCR筛选。G0小鸡的性成熟期为雄性16-20周,雌性20-24周。从大约16周开始对雄性鸡进行精液生产测试。雌性鸡每天都受精,育卵。将G1雏鸡孵化3周后,将每只雏鸡的翅带捆扎,并从壳中取出雏鸡绒膜尿囊膜(CAM)样品。从CAM样品中提取DNA并进行PCR筛选,以发现转基因的存在,预计该基因为单拷贝水平。重复筛查以确认并在2-3周后对血样DNA上的雏鸡进行交配。
在几周龄时,从G1禽类采集血液样品以制备用于PCR分析的基因组DNA。G1禽类用于繁殖G2。
PGC分离
1.将新鲜的卵(EGK阶段X)(例如,韩国Ogye(KO))在37℃下孵育50-54h(HH阶段14-17)以分离血液PGC。将已孵化的卵水平放置在蛋板上,并使用含70%乙醇的消毒棉轻轻擦拭蛋壳。
2.用尖锐的镊子小心地打碎蛋壳(直径小于1厘米)以分离全血细胞。
3.使用25μm细磨玻璃针头和移液管从胚胎背主动脉中收集约2-3μL全血细胞。与500μL PBS混合。对于PGC的微量注射,可以使用口移液器和直径为20-25μL的玻璃微量移液器。玻璃微量移液器由微电极移液器(Shutter Instrument Co.)制成,并使用微型研磨机(NARISHIGE)以25度研磨。
4.将全血细胞转移至1.5mL无菌管中,离心(250x g,5分钟),然后除去上清液。
5.对于性腺PGC分离,将新鲜的卵在37℃下孵育5.5天(HH 20-26)。用尖锐的镊子从HH阶段20-26的胚胎中提取胚胎性腺,并在37℃的培养箱中与500μL的0.05%胰蛋白酶EDTA一起孵育5分钟。
6.加入50μL FBS进行灭活,并离心(250x g,5分钟)并除去上清液。
7.将全血细胞或分离的性腺细胞重悬于1mL PBS中,并以1:200稀释度应用抗SSEA-1抗体(Santa Cruz Biotechnology,SC-21702),然后在室温(ST)下孵育混合物15分钟。
8.每107个总细胞加入5mL MACS缓冲液(PBS中的0.5%BSA和2mM EDTA,pH 7.2),洗涤细胞以除去未结合的一抗,并离心(250x g,5分钟)。
9.完全吸出上清液,并将细胞沉淀重悬于每107总细胞80μL MACS缓冲液中。
10.每107总细胞添加20μL大鼠抗小鼠IgM微珠(Miltenyi Biotec.130-047-301)。对于更高的细胞数量,相应地扩大缓冲液的体积。
11.在2-8℃下用抗体孵育细胞20分钟。
12.通过每107总细胞中加入2mL MACS缓冲液洗涤细胞并离心(250x g,5min)。
13.完全吸出上清液,并在500μL MACS缓冲液中重悬最多108个细胞。
14.将色谱柱放在合适的MACS分离器的磁场中。
15.通过用500μL MACS缓冲液冲洗来准备色谱柱。
16.将细胞悬液加到柱子上,并用500μL缓冲液洗涤柱子3次。当柱子储库为空时,添加新的缓冲区。
17.从分离器中取出色谱柱,并将其放在合适的收集管上。
18.将1mL MACS缓冲液添加到色谱柱中,然后通过将柱塞牢固地推入色谱柱中,立即冲洗出磁性标记的细胞。
19.将含有PGC的分离的细胞转移到预热的PGC培养基中(每1x 105纯化的PGC含1mL PGC培养基)。
PGC培养
1.将含有PGC的分离的细胞转移至预热的PGC培养基(每1×105纯化的PGC 1mLPGC培养基)中,并在37℃下孵育。
2.生长7-14天后,大多数原代培养的PGC会形成菌落并失去细胞菌落的聚集体。
3.轻轻移液并离心(200x g,5分钟)后,可以用培养基轻轻移出悬浮的PGC菌落。
4.用Accutase(每约5x105个PGC使用1mL Accutase溶液)分解细胞沉淀。
5.离心(200x g,5分钟),然后将细胞沉淀重悬于PGC培养基中。
6.将悬浮的PGC接种到12孔板中(12孔板的每孔中在1mL PGC培养基中含1x 105培养的PGC)。
7.PGC可以每3-4天进行常规传代培养。
基因转移到鸡PGC中,种胚嵌合体生产和转基因
基因转移到鸡PGC中
1.将包含CAGG-PBase(pCyL43B)的4μg辅助质粒和包含报告基因(RFP)和可选的可选标记物(例如新霉素抗性基因)的6μg piggyBac转座子(pCyL50)与100μL Opti-MEM(Gibco)和在室温下孵育5分钟。对于CRISPR/Cas转染,将2.5μg CMVRFP表达质粒载体,2.5μg Cas9和向导RNA表达质粒载体与100μL Opti-MEM(Gibco)混合,并在室温下孵育5分钟。
2.将10μL Lipofectamine 2000试剂(Thermo Fisher-Invitrogen)与100μLOpti-MEM混合,并在室温下孵育5分钟。
3.将质粒与Opti-MEM混合,将Lipofectamine 2000试剂与Opti-MEM混合,并在室温下孵育20分钟。
4.在孵育过程中,收获培养的PGC并离心(200x g,5分钟)。丢弃上清液。
5.向收获的PGC中加入1mL Accutase(Millipore),并在37℃孵育10分钟。
6.使用血细胞计数器(Marienfeld)确定PGC的数量,并在具有1mL不含抗生素的PGC培养基的12孔板中接种5×105个PGC。
7.将DNA-Lipofectamine复合物应用于PGC,并在CO2培养箱中于37℃孵育1天。
8.收获转染的PGC并离心(200x g,5分钟)。除去上清液。
9.用1mL HBSS洗涤PGC三次,并用含有抗生素的PGC培养基悬浮。
转基因PGC的体外增殖和选择
1.转染后第二天,在含有100μg/mL G418(用于新霉素抗性基因)的PGC培养基中选择转染的PGC。
2.使用荧光显微镜监测报告基因的表达。
3.每3-4天对PGC进行继代培养。一个完整的选择期最多需要3周。
4.如果转染的质粒载体中没有药物选择标记,则可以通过FACS对表达荧光蛋白的PGC进行分类。
PGC移植到接受卵中
1.在相对湿度为60-70%的空气中,在37℃的温度下将受精卵孵化至HH14-17阶段。
2.收获转染的PGC并离心(200x g,5分钟)并除去上清液。
3.向收获的PGC中加入1mL Accutase(Millipore),并在37℃下孵育10分钟。
4.离心(200x g,5分钟)。丢弃上清液。
5.将PGCS悬浮在HBSS(Hyclone)中。
6.在接受卵的尖端上做一个小窗口,然后用微量移液管将2μL等分试样(含超过3,000个PGC)微量注入接受者胚胎的背主动脉中。
7.使用胶枪用石蜡膜密封受体胚胎的卵窗口,将卵的尖端朝下孵育,直到在相对湿度为60-70%的空气中于37℃孵化。
监测胚胎性腺中的基因修饰的PGC
1.在相对湿度为60-70%的空气中,在37℃下孵化达HH 28-30阶段的接受卵。
2.在胚胎第6天解剖性腺。
3.使用荧光显微镜监测胚胎性腺中的荧光蛋白表达。
测试交叉
1.1周内从性成熟受体和野生型(WT)鸡中收集两次精液。
2.从成年雄性接受者和野生型雄鸡中分别引入50μL精液至野生型产蛋母鸡和成熟雌性接受者。
3.人工授精后第二天,从野生型产蛋母鸡和成年雌性接受者的卵中收集卵,将卵的尖端朝下孵化直至在相对湿度为60-70%的空气中于37℃孵化。
实施例1
使用不同颜色的激光和滤光器进行荧光分析以鉴定家禽的性别
光学荧光系统
为了证明在视觉上识别卵内家禽性别的可行性,与蓝色荧光或红色荧光报告基因相比,评估了绿色荧光的使用。
使用蓝色激光、绿色激光或红色激光确定完整卵或分离为蛋清、蛋黄和壳的卵的自发荧光。空蛋(壳)和完整蛋的比较表明自发荧光水平无显著差异(数据未显示)。
表6描述了卵的不同组成部分所产生的散射和自发荧光强度。
重要的是,注意到背景噪声(不带激光)约为4nW,而在存在激光(532nm)的情况下,由于绕过滤光片(通过660nm以上的低通滤光器)的光散射,背景噪声约为12nW。
表6使用3种不同的荧光激光对卵各部分的散射和自发荧光强度
Figure BDA0003631629220000781
分析了将蓝色激光(473nm)与绿色(+500nm)或红色滤光器(590-650nm)结合使用在向完整卵中添加或不添加不同浓度的荧光素(1μM,10mM)的情况。总结在图2中。看起来绿色自发荧光较大,但是使用高浓度的荧光素可以检测到荧光强度。
分析了将绿色激光(532nm)与深绿色(540-580nm)或红色滤光器(+660nm)结合使用并向完整的卵中添加或不添加罗丹明B(10μM)的情况,并且总结在图3中。看起来在40mW以上时绿色滤光片可检测到染料的荧光发射(大了将近2倍)。但是,使用红色滤光器无法观察到差异。
分析了将绿色激光(532nm)与红色滤光器A(590-650nm)或红色滤光片B(+660nm)结合使用并在整个卵中添加或不添加dir(10μM)的情况。总结在图4中。看起来在80mW以上,使用红色滤光器A可以检测到染料的荧光发射,而通过使用红色滤光器B(+660nm),只能观察到适度的差异。
分析了将红色激光(632.8nm)与红色滤光片(+660nm)或绿色滤光片(540-580nm)结合使用并向整个卵添加或不添加dir(10μM)的情况,并总结在图5中。有或没有荧光染料几乎没有显示出强度差异。
仅使用蛋壳重复所有实验。观察到相似的结果(数据未显示)。
这些观察结果证明了通过卵壳检测RFP的可行性。
实施例2
加入卵内的RFP或GFP转染的细胞的荧光
为了说明卵内检测RFP表达细胞的可行性,本发明人接下来检查了在将荧光蛋白(特别是RFP或GFP)转染的细胞注射入完整的卵后是否可以检测到该细胞。
更具体地说,如实验程序中所述,用GFP或RFP载体转染HEK细胞。激发后检查GFP和RFP转染的细胞的荧光。图6(GFP)和图7(RFP)清楚地表明,GFP和RFP均由转染的细胞表达,并且可以观察到荧光信号。然后按照实验步骤中所述将HEK转染的细胞注入新鲜卵中,并检测卵的荧光强度。
首先,有或没有表达红色荧光蛋白RFP的细胞的卵的荧光强度的特征是用绿色激光(532nm)和+650nm的红色滤光片激发卵。图8显示,在卵的五个不同位置上测得的没有RFP的卵的荧光强度非常相似。图9显示了当卵在中心被激发时,使用不同浓度的表达RFP的细胞测得的荧光强度。清楚观察到RFP浓度与检测器强度之间的相关性。
为了检查在RFP表达细胞的存在下的卵的位置,即由激光提供的激发的确切位置,是否影响荧光强度,进行了数次测试。似乎在激发过程中,检测器上的强度随着卵的位置而大大改变。这是可以预料的,因为在将表达RFP的细胞注射到卵中后,RFP分布不均匀。图10显示了在激发过程中在卵的特定位置观察到的最大强度,该强度对应于表达RFP的细胞浓度最高的位置。该图表明可以检测到最少约3000个细胞。
在胚胎中,在本领域中已知性别细胞,PGC位于卵的发育阶段X处在新产卵的表皮细胞的中心。应当指出,胚胎总是面对蛋黄袋的上侧。
上面揭示的结果表明,在位于蛋后几毫米并靠近蛋黄的区域激发时,可以检测到最大的RFP发射。
在卵中注入表达RFP的细胞后,重复一周的实验。结果相似,表明RFP染料未在卵内扩散。
在有或没有RFP表达细胞的情况下,使用绿色激光(532nm)和+650nm红色滤光片检查了PBS和甘油对卵荧光强度的影响。如图11A和11B所示,似乎甘油和PBS均不影响表达RFP的细胞进入卵的荧光强度测量。
随后,在有或没有GFP表达细胞的情况下,使用蓝色激光(483nm)和+500nm的滤光器检查了PBS和甘油对卵荧光强度的影响。似乎在任何给定的浓度(1000、3000、10,000和30,000细胞)中都无法检测到表达GFP的细胞,如图12所示,例如具有30,000个表达GFP的细胞。使用三种不同的滤光器(+500nm、530-550nm和540-580nm)可获得相同的结果。
为了进一步评估使用RFP作为报告基因的令人惊讶的优势,最终比较了GFP和表达RFP的细胞的荧光,如图13所示。参数R被定义为表示荧光蛋白(FP)强度(IFP)和自发荧光强度(I自发荧光)之间的比率。
Figure BDA0003631629220000801
针对不同浓度的GFP和RFP表达细胞计算R参数。如图所示,似乎在任何给定浓度下都无法检测到表达GFP的细胞(如图13所示的1000和30,000个细胞)。
另一方面,即使在低浓度下,表达RFP的细胞(1000个表达RFP的细胞)也提供了显著的R参数值。在高浓度的RFP表达细胞(30000个表达RFP的细胞)下,R值达到3,从而清楚地表明可以容易地在激活的卵中检测到RFP报告基因。
主要发现总结如下:
1.蓝色有很强的自发荧光,而绿色和红色没有自发荧光。
2.主要的自发荧光来自蛋壳。
3.该系统可以检测浓度相对较低且激发功率较低的绿色和红色荧光染料。
4.由于自发荧光,几乎检测不到蓝色荧光(仅在mM的染料浓度下)。
5.卵内的RFP很容易检测到。
6.在此系统中无法检测到GFP类型。
7.卵内RFP表达细胞的确切位置对于确定激发区域很重要。
8.注射后14天内,RFP染料未扩散到卵中。
9.PBS或甘油也不会影响RFP检测。
这些结果清楚地表明,可以在早期发育阶段检测到表达整合在性别染色体中的RFP基因的胚胎,其中约有1000个细胞表达RFP。
实施例3
向导RNA载体的设计
为了将RFP报告基因掺入性别染色体W或Z,选择了CRISPR Cas9介导的HDR方法。然后从两个性别染色体中寻找相关的gRNA位点。
雌性Z染色体整合
对雌性鸡Z染色体的SEQ ID NO:15表示的区域9156874-9161874,SEQ ID NO:16表示的区域27764943-27769943,SEQ ID NO:17表示的区域42172748-42177748,SEQ ID NO:18表示的区域63363656-63368656和SEQ ID NO:19表示的区域78777477-78782477进行向导RNA的分析。更具体地,为了引导RFP整合入Z染色体,接下来制备了称为Z染色体基因座chrZ_42174515_-1的gRNA7的gRNA,其包含核酸序列GTAATACAGAGCTAAACCAG,也由SEQ IDNO:26表示。
该步骤根据“PrecisionV Cas9 SmartNuclease Vector System”用户手册进行。更具体地说,设计了两种用于克隆的引物:ChZgRNA_正向:TGTATGAGACCACGTAATACAGAGCTAAACCAG,如SEQ ID NO.53所示,ChZgRNA_反向:AAACCTGGTTTAGCTCTGTATTACGTGGTCTCA,如SEQ ID NO.54所示。使引物退火以在包含5μM的每种引物的反应混合物中产生双链体。将混合物在95℃下孵育5分钟,将其移出以冷却至RT。
之后,通过如下设置的连接反应将双链体克隆到所提供的线性Cas9载体中:1μl线性化载体,3μl退火寡核苷酸混合物,1μl连接缓冲液和0.25μl Fast连接酶。将混合物在25℃温育5-7分钟。
将混合物转化入DH5α感受态细胞,并将细胞在含有50μg/ml卡那霉素的LB平板上培养,并在37℃下孵育过夜。
第二天,随机选择两个菌落,并使其在LB/卡那霉素培养基中于37℃摇动过夜。
第二天,使用Qiagen mini-prep试剂盒制备质粒DNA,并使用提供的测序引物进行测序。
在又一些其他实施方案中,通过无限制克隆方案选择如下四个另外的向导RNA,分别合成并克隆到包含野生型Cas9核酸酶的Cas9 SmartNuclease载体(Horizon)中:gRNA3:ACAGACCTATGATATGT,如SEQ ID NO.11所示;gRNA4:CGATTATCACTCACAAG,如SEQ ID NO.12所示;gRNA5:CTGGTTAGCATGGGGAC,如SEQ ID NO.13所示;gRNA6:GTAAAGAGTCAGATACA,如SEQID NO.14所示。
适用于整合入Z染色体内特定基因座的gRNA序列的其他非限制性实例可以包括但不限于:Z染色体基因座chrZ_9157091_1的gRNA8,其包含核酸序列ACAGACCTATGATATGTGAG,也由SEQ ID NO:27表示;Z染色体基因座chrZ_27767602_-1的gRNA9,也包含核酸序列GAGCTTGTGAGTGATAATCG,也由SEQ ID NO:28表示;Z染色体基因座chrZ_78779927_1的gRNA10,包含核酸序列GTAAAGAGTCAGATACACAG,也如SEQ ID NO:29所示;以及Z染色体基因座chrZ_63364946_-1的gRNA 11,包含核酸序列CAGTGGGTACTGAAGCTGTG,也由SEQ ID NO:30表示。
这些gRNA几乎没有预测的脱靶位点,其中没有一个在已知的编码序列中。
雌性W染色体整合
雌性鸡的W染色体的1022859-1024215区域,其包含如SEQ ID NO.3所示的核酸序列,分析指导RNA的设计。通过无限制克隆方案选择两个合成的指导RNA,分别合成并克隆到包含野生型Cas9核酸酶的Cas9 SmartNuclease载体(Horizon)中:gRNA1:GCACTAGGAACCAGCAGCAG,如SEQ ID NO.1所示,和gRNA2:GTAGCCCCAAGAGGGCTAGG,如SEQ IDNO.2所示。
表7列出了这两种gRNA的预测参数:
表7
gRNA参数 gRNA1 gRNA2
sgRNA设计工具 0.506 0.63
sscore 0.8677 0.5323
sgRNA得分 94.8 99.9
实施例4
RFP靶向载体的设计
将与雌性W染色体或雌性Z染色体基因座的上述合适侧翼序列同源的侧翼序列引入表达RFP的载体,特别是pDsRed1-N1质粒。
为了将本发明的报告基因整合到Z染色体内的特定基因座中,可以使用包含如SEQID NO.31所示的核酸序列的左臂以及包含如SEQ ID NO.32所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:26的gRNA7引导的特定基因座上。
更具体地,为了将本发明的报告基因整合到由gRNA7(具体地,如GTAATACAGAGCTAAACCAG,如SEQ ID NO:26所示)引导的特定基因座,使用RF方法,在pDsRed1-N1质粒中CMV增强子的上游克隆了“左臂”。
使用了以下引物:
正向引物:
ACGGGGTCATTAGTTCATAGCCCATATATGGTGAACGGATAGGCAGCAAGC,如SEQ ID NO.55所示(在质粒中包含5'左臂序列和整合位点的30个核苷酸)。
反向引物:
GGCGGGCCATTTACCGTAAGTTATGTAACGTGAGGAAGGGTCTGTTACTGGA,如SEQ ID NO.56所示。
使用以下引物将右臂克隆到Neo抗性基因的下游。
正向引物:
TTCTATCGCCTTCTTGACGAGTTCTTCTGAGTCATGTCGGTGGAGGAGAAA,如SEQ ID NO.57所示(3'Neo抗性序列以绿色标记)
反向引物:
GTGATGGCAGGTTGGGCGTCGCTTGGTCGGGCATGGGATGTTAAAGAGAAGCT,如SEQ ID NO.58所示(在橙色载体中的序列3'至Neo基因)。
通过测序验证克隆以确保正确整合。
注意,由于在整合位点侧翼的增强子区域中16个核苷酸(CGGTAAATGGCCCGCC,如SEQ ID NO.59所示)的重复,从CMV增强子中缺失了193个核苷酸。
在另一些实施方案中,也可以使用如下gRNA克隆RFP报告基因:gRNA3,如SEQ IDNO.11所示的;gRNA4,如SEQ ID NO.12所示;gRNA5,如SEQ ID NO.13所示;gRNA6,如SEQ IDNO.14所示。
为了使用gRNA3进行克隆,提供了包含由SEQ ID NO.41表示的核酸序列的“左臂”和包含如SEQ ID NO.42所示的核酸序列的“右臂”。为了使用gRNA4进行克隆,提供了包含由SEQ ID NO.43表示的核酸序列的“左臂”和包含如SEQ ID NO.44所示的核酸序列的“右臂”。为了使用gRNA5进行克隆,提供了包含由SEQ ID NO.45表示的核酸序列的“左臂”和包含如SEQ ID NO.46所示的核酸序列的“右臂”。为了使用gRNA6进行克隆,提供了包含由SEQ IDNO.47表示的核酸序列的“左臂”和包含如SEQ ID NO.48所示的核酸序列的“右臂”。
在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,使用包含如SEQ ID NO.33所示的核酸序列的左臂和包含如SEQ ID NO.34所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:27的gRNA8引导的特定基因座上。在另外的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,使用包含如SEQ ID NO.34所示的核酸序列的左臂和包含如SEQ ID NO.35所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:28的gRNA9引导的特定基因座上。在进一步的实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,使用包含如SEQ ID NO.37所示的核酸序列的左臂和包含如SEQ ID NO.38所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:29的gRNA10引导的特定基因座上。在又一个实施方案中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,为了将本发明的报告基因整合到Z染色体内的特定基因座中,使用包含如SEQ ID NO.39所示的核酸序列的左臂和包含如SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO:30的gRNA11引导的特定基因座上。
对于雌性W染色体,可以使用如SEQ ID NO.1所示的向导1(gRNA1)或者如SEQ IDNO.2所示的向导2(gRNA2)克隆报告基因,特别是克隆RFP。对于使用gRNA1进行克隆,提供了包含如SEQ ID NO.4所示的核酸序列的“左臂”以及包含如SEQ ID NO.5所示的核酸序列的“右臂”。为了使用gRNA2进行克隆,提供了包含如SEQ ID NO.6所示的核酸序列的“左臂”以及包含如SEQ ID NO.7所示的核酸序列的“右臂”。
更进一步,CMV启动子上游区域的“左臂”包含如SEQ ID NO.8所示的核酸序列,并且“右臂”在新霉素抗性下游区域可包含如SEQ ID NO.9所示的核酸序列,或在polyA位点下游区域可包含SEQ ID NO.10。
实施例5
将RFP报告基因整合到雌性鸡细胞系的Z染色体中
用两种质粒,即含有鸡Z染色体左右臂的pDsRed和含有CMV-hspCas9-H1-gRNA的质粒共转染雌性鸡细胞系,具体如实验步骤部分所述。
所用的gRNA序列是由SEQ ID NO:26表示的gRNA 7。表8提供了有关所用引导RNA的更多详细信息。
表8所用gRNA 7的特征
Figure BDA0003631629220000861
然后用红色荧光激发转染的细胞。如图14所示,转染是阳性的。收集照明细胞,提取基因组DNA,并进行滑动PCR测定(如实验程序中所述)。然后将PCR片段进行SANGER测序,并获得如图15所示的整合序列,表明RFP基因已成功整合到Z染色体中。
总结来说,这些结果表明:
·建立了成功的雌性鸡细胞系培养程序
·建立了将RFP报告基因和CRISPR Cas9系统成功转染至雌性鸡细胞系的方法
·红色激发产生强烈的荧光信号
·建立了将RFP报告基因成功点整合(point integration)到Z染色体
实施例6
CRISPR处理的细胞的生殖系传播
利用原始生殖细胞(PGC)生产转基因鸡在动物生物技术和生物建模方面具有许多优势。因为鸡胚是卵生的,所以早期的PGC很容易获得,可以在体外进行实际应用,包括遗传材料的恢复,基因组编辑和转基因研究。为建立来自不同胚胎来源的鸡PGC的培养系统,已经做出了巨大的努力,并且已经证明,只有鸡PGC可以在体外无限期地保持而不丧失其性能。
更具体地说,在鸡中,PGC首先在Eyal-Giladi和Kochav(EGK)的X期胚胎的上皮细胞中分离,然后向下移至透明带区域的亚胚层,然后进入生发新月并进入血流。通过循环系统迁移后,它们到达生殖器脊。
基因型发育中的这些独特特征使其可以通过将遗传操纵的PGC注射到受体卵的血管中而用于生产转基因鸡。
如实验程序中所详述,将上述两种载体,特别是gRNA/Cas9载体和报告基因载体共转染至PGC。鉴定出稳定的克隆后,扩增细胞并通过PCR确认RFP整合。在第14-16阶段(H&H)将已确认的克隆注射到受体鸡胚中。将注射的胚胎转移到替代壳中,并孵育直至在37℃孵化。孵化后通过W或Z染色体的PCR确定小鸡的性别。
雌性和雄性嵌合体生长到性成熟,并繁殖成野生型雄性和雌性鸡。评估孵化的小鸡的RFP表达,并通过PCR确认种系后代携带目标RFP。
序列表
<110> 艾吉伊特有限公司
<120> 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具
<130> 2562455
<150> US 62/510,921
<151> 2017-05-25
<160> 67
<170> PatentIn 版本 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于W染色体的向导1
<400> 1
gcactaggaa ccagcagcag 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于W染色体的向导2
<400> 2
gtagccccaa gagggctagg 20
<210> 3
<211> 1460
<212> DNA
<213> 人工序列
<220>
<223> galGal5_dna范围=chrW:1022859-1024215
<400> 3
tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60
gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120
ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180
gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240
gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300
ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360
cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420
tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480
ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540
ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600
aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660
ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720
aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780
cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840
aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900
gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960
tagtagcccc aagagggcta gggggcctca aaatcatgga acccaactcc ctggagtaga 1020
agggtcaggt aatgagtcca aaagagggac tataggaacc atgccagtaa cagagaggac 1080
tcacagccag catagggtcg tgctgtaagc cctgttgagg cagttggaaa tgacagttcg 1140
gtagtagtta aggtaccctt ttaaattaca gatttaaaca tttggaaagc agctgctggc 1200
agctaccgtg atgatcctaa acgggtagct aatgcttttg aaatgatgat taaaactcag 1260
gaactggata ggaaagatat ggaatttatt atgcacatgt tgtttgatag tacagaaaaa 1320
taaatgattc actagaccac acggacccaa gtggaggatc aggtaatggc aggggttttg 1380
cttggatgta atgctggaaa ggacaagagt cctttcctgt cctggggagg atttagaggt 1440
ggttagacct tggggaggag 1460
<210> 4
<211> 592
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA1进行克隆,W染色体,“左臂”
<400> 4
tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60
gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120
ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180
gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240
gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300
ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360
cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420
tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480
ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540
ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc ag 592
<210> 5
<211> 848
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA1进行克隆,W染色体,“右臂”
<400> 5
tggcagattt gtgatcatgg aaagaattgg tgggagcata cggcaccagg actcagataa 60
gatagctagc taaggtgatg aattgtagat ggtgtcagat aacgaaagaa gaaaaacaaa 120
tgtaataaag tgttaaatgc caatatgttt tttataatga ggcaatatcc tgaatggcat 180
tagtgtggga tcaatttggc ccagatgacc ctctgatttt aatggtagaa aatgataaga 240
gagagaggga gaaaggaaga gagtgtaaaa cgtgttgttc agcatgtagt attggactga 300
gatgcttcaa gcgaaacaag aatgagcagg aggaggattt agagatgcta gtagccccaa 360
gagggctagg gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa 420
tgagtccaaa agagggacta taggaaccat gccagtaaca gagaggactc acagccagca 480
tagggtcgtg ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag 540
gtaccctttt aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat 600
gatcctaaac gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg 660
aaagatatgg aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac 720
tagaccacac ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat 780
gctggaaagg acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg 840
gggaggag 848
<210> 6
<211> 962
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA2进行克隆,W染色体,“左臂”
<400> 6
tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60
gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120
ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180
gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240
gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300
ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360
cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420
tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480
ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540
ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600
aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660
ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720
aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780
cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840
aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900
gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960
ta 962
<210> 7
<211> 478
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA2进行克隆,W染色体,“右臂”
<400> 7
gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa tgagtccaaa 60
agagggacta taggaaccat gccagtaaca gagaggactc acagccagca tagggtcgtg 120
ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag gtaccctttt 180
aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat gatcctaaac 240
gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg aaagatatgg 300
aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac tagaccacac 360
ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat gctggaaagg 420
acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg gggaggag 478
<210> 8
<211> 669
<212> DNA
<213> 人工序列
<220>
<223> 用于CMV启动子的上游的“左臂”
<400> 8
aggcaaggct tgaccgacaa ttgcatgaag tcgggctaac attagacccg ttgtgtctta 60
atcctgccgt cgggtataca tatactaaaa gaacctcctt tccctcctat aaatcggagc 120
gagacaaggc attctttttt tattattatt ttggttgcct gcccatcaga tgtaatgaaa 180
gttgcacagg gtagggctaa gaaggtaaag gagttaaatt cccccgggag gttagagatt 240
ccctgtattg tggttgcctg cccattagac gtaacaaaag ttgtgaaggg taggactaag 300
gatccaggta aagaggttag tcccccaggg ttagagtccc tcctcagaag taaatgtaaa 360
acataaccac ggtaattgtc gttgagtgcg cttgtttgat tgttaattgt ttgtgctgtt 420
attgtatgct gattgtttgt gttgttatta tacaaagagc tcacatgcat cgttaaaatg 480
ggcattggat cacctagggg tgagggaatt ttgaaaaagt cacttttggg ctgtgtttta 540
agtcattgga aagaaatagc tggatcccct ggtggggttg cacagaagga tgatttaagt 600
acgatggatg cctttgaggc aggcactagg aaccagcagc gatgtacggg ccagatatac 660
gcgttgaca 669
<210> 9
<211> 911
<212> DNA
<213> 人工序列
<220>
<223> 用于抗新霉素下游区域的“右臂”
<400> 9
ttctatcgcc ttcttgacga gttcttctga cagtggcaga tttgtgatca tggaaagaat 60
tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120
gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180
ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240
accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300
aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360
aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420
aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480
catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540
gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600
atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660
gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720
ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780
caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840
tcctggggag gatttagagg tggttagacc ttggggagga gggttcgaaa tgaccgacca 900
agcgacgccc a 911
<210> 10
<211> 911
<212> DNA
<213> 人工序列
<220>
<223> 用于polyA位点下游区域的“右臂”
<400> 10
atctgtgtgt tggttttttg tgtgtctaga cagtggcaga tttgtgatca tggaaagaat 60
tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120
gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180
ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240
accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300
aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360
aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420
aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480
catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540
gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600
atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660
gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720
ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780
caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840
tcctggggag gatttagagg tggttagacc ttggggagga gcaagtaaga tgcttttctg 900
tgctgcaata g 911
<210> 11
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体的向导3
<400> 11
acagacctat gatatgt 17
<210> 12
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体的向导4
<400> 12
cgattatcac tcacaag 17
<210> 13
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体的向导5
<400> 13
ctggttagca tggggac 17
<210> 14
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体的向导6
<400> 14
gtaaagagtc agataca 17
<210> 15
<211> 4980
<212> DNA
<213> 人工序列
<220>
<223> ENSGALG00000025945_ENSGALG00000023622|chrZ:9156874-9161874
<400> 15
cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60
gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120
ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180
caatgtgggc attgccgacc acagacctat gatatgtgag tggtgagtgg ggccaggaga 240
gcaggacagg agtgtggact cggaggcgcg ggcagaggag gtagctcaga gcatgagata 300
tattcgccag gtgtcagtgg acttctggca gtgcatactg cagagagctt tggttgctgg 360
ccatctggat gatgacaaaa tctcagccac agaccatgtg ggttggaaga gtcctcagga 420
gatcaccttt ccacctcctg ctaaagcaca ttccctacag tatgtttcac atgacaccgt 480
gctggcagat ttttaatatc atcagagaat gacactccat atcctctctg ggcagccttt 540
ttcagtgctc tgtcacccac aaagtaaagt atttgctcat gttctaatgg aacttcctat 600
gttctagttt gtgaccattg aaccttgttc tgtcactgga cagtgctgaa ggagcctggc 660
cctatccact tgactcccac actttacata tttacaagca tcgataagac ccccctcagt 720
cttctccaga ctagatagcc ccaggtctcc caaccattcc ttttatggga gatgcttcag 780
gcccctcatc acctctgtgg ccctctgctg gactgcctgc agtagttcca ggtttttttt 840
tttgaactgg ggagcccaga acttgacacg gtattccaga tgtggcctca ccagcgcaga 900
ggagagggga aggctcacct ccctcgacct ggtggccatg ttttttttaa cagacctcag 960
gataccactg gccttcttgg cccaagggca cactgctggc tcatggccca tgggttggct 1020
tccaggactc tcaggtcctt ctccgtagag ctcctctcaa gcaggacaac cctcagcctg 1080
tactgatgtg tgcggtgcgg ttattcctcc ccacgtgcaa gactctacat ctgccattgt 1140
taaatctcat aagcttcctc tctgcccaac tctccactgt gtacgggcct tagtgaatgg 1200
cagcacagac ttctggtgtg aggatagcat tcagaacaag ctgctgtacc ttcccagtca 1260
cagaggtgag ggtgactggc ttgtactttc ccagctttgc cttcttgccc ttttggaaga 1320
ctggagcgac attggccttc tggaggaaac ggtcctcagg cacccctcct gttctccatg 1380
acctttgaaa gatgatcgag agcaccttgg cagtcacttc tgccagctcc ttcagcacgc 1440
atgagtgcat cccgccagtg cccatggatt tgtgttcatt gaattagcct aggtgacctc 1500
tgatcagatc cttcttgacc aaggggaaga cttcctttcc ccaggttctt atctccaggg 1560
cctgggattc ccaaggggca atcttagcag gaaaggatga agtaaaggag gtgtgcagtt 1620
acagtgcttt catggtgtcc tccattactc caatgaggtc acccacctca ttcagcagca 1680
gacatacatt ctcccagtct tcctttttct actgccatac taaagtagtc cttcatgttg 1740
tccttgactg aaggtcaccc aacttgattt ccagtgagcc ttagcattcc ttgtagcatt 1800
catgcatgtc ctgacaacat tcctattttc ttcccaagtg gccagagacc ttttccacac 1860
tccagaggct ttgttcttcc attactgcct ttccatgagc ttcttgctca tctctgcagg 1920
tctcatgcca cctttgcccg atttcttagt cttagagatg caccgatctt gaatttggaa 1980
gaagtggtgc ttgaatgaca accagctctc ttggtccccc ttgctttcca aagctctaac 2040
ccatggaatg cctccatgta tgtctgtgaa gaggtcaaag tcagctctcc tgaagtcgtg 2100
gttgcaatcc tacaaactgc ctgatttctc ccatgggaga tcccgaactc cactatctca 2160
cagtcactgc actcaaggct tcccccagcc ttcacatccc cagctacagg aagagaagag 2220
gctcgaggct acttgcagct gtctgcggaa ggcttctcca gcttcctcct cttcatcagg 2280
cggcctgttg taaacaccca caacagcgtc acccatcata gcctgtccct tagtcctcac 2340
ccataaactt tctactcatt catcatgcat cccttggcag agctctgtac attccagctg 2400
ttccctcaca taaagagcaa ctccaccacc tcacaccgac gtctgtctgt cctaaaaagt 2460
acagagccat ccctgagagc attccagtca tgcgagctgc cccaccacgt ccctctgctg 2520
atcgcactga gatcgcggcc ctacgaccat ccatggatct atgactcttc ctgtttactc 2580
cccgcactgt gtgtgatgtt acacaggcac ttcagagaag aaaagagagc acaggatgcc 2640
gatttccctt ggcaggaccc caggggccgc acgcagcccc cacctctatc agcaggtctg 2700
agcaggactg gagctgcagg cagagcacag ctcagccctg agacacctcc atgctgcctc 2760
ctgcacagcc tcggccccac agcccccggg aaggagagca cgggtggggt gccgggagcc 2820
acgctgcgct ctgacacact gcgtgtcccc tgctcccagc gcgagctgca gggcccgtgc 2880
aggaacgagc tgggccccaa cgtgaccctc ggccccggtc actgctgaac gacagcgttc 2940
agctctccag gctgcaaaga gcgagccgtg aaatggagca acacgcggga ttcccgggtg 3000
tgaattccta aacggattcg aaggtgccca acaggcagcc actgcgtccg cagctgtgct 3060
tcggtacctg gagacccgcg agcccgtctg ttcccaccag cctccagcag ccggtgctcg 3120
cggatcaaaa gaccgccgtg aaggccgcag ggccgtccct gggacggagc gccgcccgct 3180
tccgccgcca gccgcggctc cgccctcccc gccgagctga cgctggcagc gcgcagagcg 3240
cggagcggag ccgcggcgct ttccggcggc agcgcccgca cggggctcgc cgagggccgc 3300
gcagagcgct gtgcccggcg ggccgcgtcg ccgctccggc ggcaccgcga ttccggcacg 3360
gagcgcaacg agcgcccgct gcccggctgc aggacgcggt cggggccaca ccgcggcggg 3420
gccgcagcct gccttccgcg ggaccgcacg tccggcctcc ccgaatttgg ccccgcagcc 3480
cccgggctgt caccgtgctg tcaccgtgcc gttcacggtt tacgggctgg ttcggcccgg 3540
ttcggcccgg ttccgtgact ggcgggacag agggattcgt ggatccgcgc ctccgggaag 3600
ggaaacggga ccccgaataa ttaaaaacag cggccacgat ctgaggggtt acaaatgtac 3660
taaaacgtac taaaaacaaa cagctgctta acacctccta ttccaaaggc ccatcgacac 3720
cccttggcac cctcaaagta tccccttctg aggtaatggg taccaagaat gcacggagcc 3780
cctgggccag tcacagcagg gtgcttttgc cagtctgtac cggtgaggcc tatttcggcc 3840
acaaacacag tcaattcttg ggaaccccca ttcaccccat gaatataagt tgattctgtc 3900
ccttggtgac tcgagggcgt gacagtgcac tgtgcaccag ggtccaccag ggcctcgtat 3960
tcctgaggtt ctgatgtgcc acaccacgaa cccacacggt tcaatacact ccatcatcct 4020
ttccccccat ggtgggggca gggtccctct atttgttacc tctgtcgttc ttagagcggt 4080
tgccatgtcc tgcagcaatg ggagcgatca cctctttggg gattaatctt ggtggttaat 4140
ctgccttgta attattttac ctgtgcttga aaatgcccct ccaggtgaaa gcaaactgca 4200
gcctgcattc tgtggccaaa ggaatggaaa agaaggcgtt agcaatgcca gtggtggcat 4260
accacttggc ttcttttgac tccagttcat actggagttc taacatgtcc agaacagcag 4320
cgctcagtgg gggtgtgact tcattctggc catggtagtc tactgtcagc ctccattctg 4380
cactggcttt atgcactgga gcacagggct tatggggagc ggcggaggga gctgggatgg 4440
ttcagtctgc agatgaggag gctcagggga gaccttattg ctctctgtaa ctccatgaag 4500
ggaggttgta gtgagctggg ggtcggtctc ttctctcatg tgactagtgg taggactaga 4560
gggaatggcc tccagttgca gcaggggaga ttcaggctgg atgttaggaa atgggctgga 4620
gtgggctgcc cggggaggtg gtggagtcac cgaccctgga ggtgctcaag gaatgtttag 4680
acaccgtgtt tagggacatg gtatagtgag aactgttggt gatgggtgga cagttgggct 4740
ggatgatctt gtaggtcttt ttaaagcttg gtgattcttt gattcgataa gtgcaaagtg 4800
ttgcatttgg gtcagagcaa tctcacgggt gtgcacaggc tgggagaaga actcctggga 4860
gaagaagaga gcagccctgc agagaaggac ttgacatgaa agacttaacg tcagccagac 4920
tccctctgct ctgccctcat gagcctctcc tactctgtaa aggtttgggc ccccagcaca 4980
<210> 16
<211> 4980
<212> DNA
<213> 人工序列
<220>
<223> ENSGALG00000015036_ENSGALG00000000438|chrZ:27764943-27769943
<400> 16
aggagtggct tctgaggctg gaaacaaggt gctcccctct tgtcaaacag ccaattccat 60
ctagctccaa cccatcctcc actggccaaa gctgagccca tcgctgatgg tgatagcatc 120
tgtaatagca tctcagaaag gctaaaagca ctgcgcagca gctgagagaa aagagtgagg 180
gaaaatggga cagaaacagc tctgcagccc tcagaggcaa tgcagaggag aggcaggagg 240
tgctccaggc atggagcatt agtttcttgc agtccaggag ttacaggtga tggtgcaggc 300
tctgtgcagc ccagtgatga ctgtttcagg atccatgctg cagcctgtgc cagagccagg 360
ggataggctt ggctgcttag tgcaggacgt ggagagccca tgctgagtgc aagctcccaa 420
aaggctagga cagaacaggt gtagtggagt agatcttgta ctgtggagca gtcttttcct 480
ggaggactaa cctgtgaaga ggaggactgc gctgaagcgg ttcatgaaga atgaaacctt 540
gtgggaggga ccccacactg aaaaaggaga aaaccacgat gaggaaggag cagcagagag 600
ctccccagcc ctgtgtgcac tgccaggaga gaaggaagta gaaaacgtgg gaatgtgcag 660
gtgtaaagct gagtctggga aaaaggtggg ggtggaataa aggtattttt agtcctatac 720
ctttctcatc aacctacttt aattgtagat tggccataaa ttaaatgttt tccccaggtc 780
aagtctgttt cttgcttgtg atggtggatg atctccctgt cctcatccca atcctgaagc 840
tatttcatca tatattctct ccctgccctg tttcaggaca gggagtgcaa gcagtttggc 900
agccagacga ggttaaccca gcaccagagg tttagtcaca tgcaagtgag agctattgcc 960
tcaacttaaa tgggagaaaa cattttagca ggttgagtct caccttgttt atccagatta 1020
tacagccatg ccagcacatg ggctgcatgc agcctggccc aacccatcct ctagccaccc 1080
cctgccccat actgaaaatg cagcggctct gccctgccaa gctgccaagc ctggctccag 1140
gcactcaccc attgcttaca aacaacaaaa cgtcagcgtg tgagcgcgcc ctgtgagctg 1200
caactggcat ggggagggca cagtcagcac aaatacatga cctgcaaatt ttcacatgga 1260
atgtatggag ttgcaatcag atactcagct caaaaaattt aatcatggct ccttacctgt 1320
ctttttttta acctttctct tagctcagag aggtatacct cacttcacaa tcatgccgta 1380
ttcatgtcat tgctttctgg cagtacgtac gtttgtgaac agctgttttc aagggtgatg 1440
cacaggaaga gtaaaatttc attaaaaaat ctccaaggag cacatggaga gctcactcag 1500
aagcctcacc gctgccactg aacaagactg atgcattagt ttcatgaaat caaggctatg 1560
tgtcccactg gtttcattat tttgttactc tttctttaaa acaaaaaaat tgttttattg 1620
cttatataca tcaactatgt tgttatatat tttccaaagg ccgctccaaa agtaatgcct 1680
cctgtttcat tctgttggcc caccgtgtca gaggcagatg gtggtacggc agtagagatg 1740
gaaccttccc accaatattc cattacatgt tgccatgtga tagacagcag cagatgggca 1800
ctctgacaga atggtatctg acatggaagc gtggatggag caaagttgtg tcactgaatt 1860
cctccataag gaaatgagca cccactaaca ttcactgatg cttgctgaac atttctggag 1920
accaaacagt ggatgtgagc acagtgaggt ggtgggtggt gcatttcagc agtggtgaca 1980
atgacgttgg gtcacctctg ctggtgcagg ttttgatgag tgcagcctgt gaggtcttgt 2040
tcatcaatgg agaaaatgca caactaatgg tggtgactgc tgaaaaatag tgttttgtag 2100
ctgagaattt tctctgtcaa acagtgctaa ttgtgctctt tgtatctgtt gtagtttcca 2160
tgggaataaa taggaggcat tacttgcaga ctgacctaca tatatgtggc cccaggcaag 2220
tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 2280
acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 2340
atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 2400
tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 2460
gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 2520
gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 2580
tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 2640
ccaccagact ggtccccgat tatcactcac aagctctcaa accgattgtg gctgtttctc 2700
agaggcaact ctttgcgctc tagcccctct ataacatggg gcaacttccc ctgccccacc 2760
ttcccttcct gtatcttctg aaaagcttgt agccctcaat tgtcacgctc cagccatatg 2820
aatcatccca ccacgtccct gtgttcacaa ttaccttcta gtcttctaat tgcaccatgg 2880
cttccaattc ctcctgttta tcacccacgt tgcatccatt gatgtagagg cacttcagtc 2940
gggctatcag caatgttacc acctgtgagg agccctcttg agatctttta ggacaattta 3000
gaggttttcc ccactgtttc ctaaaattac agcattccct gtcccttctt agtgatatag 3060
aactccatcc ccttccacca tcaaacctag cttaagctct ggtaaatgat ccagccagtc 3120
tgcttcccaa aactcttgct cagttgcatt ctatctgatg cctacatgcc caacaccttc 3180
aaggcctgtc caagatcata gaacacaaag gcttgatcat gacaacatcc atgcagccaa 3240
tcattcacat gacccattcc tctcctcctt tccaggtccc aacggccaac tgagagttgt 3300
gctctgagct cttcagtgtc cttccgaggg atgtaaagtc ccttttaatg ttctgcattt 3360
tctttgtcac agccttctga gacccaactt gaatgtggag gagtggagag taatcatccc 3420
gctctgatta tcagatacat tagcctcttc ttggcacctc tggcagacag aagacttccc 3480
tggagagatt acctggatga taactggggg cctcagtgcc tcacagcagc aagtccccag 3540
ttactaagac tctacacctc tttggtggcg ctagttctga tgtagttctt cagttgctta 3600
acatgcttgt tgtttcccaa gatttgactg ctatctgcac cctccctttc ttccagcccc 3660
agagccttat atcatgagct gagaacattc tgtgttcaaa atacaagaca catttatgca 3720
atttcgtatt ctctacccat atttttgtga tagaaattag ggctacttat ttcccatagt 3780
gatttccatg ctgcctacca ggttctaagt caggtcaccc tgccagcttc ttccaaacca 3840
tgctcaggag tgcatcaaat cacacgcaga cccaaggaaa aaatgtacca aacaatatta 3900
ccacgcatgc aaactcctca gtagctctgt cccatatgct acaattaggt ctgtataggc 3960
ttgttagatc ttgtctactt gattagtgtt ttccagcagg cctacaatcc aacctaaact 4020
gaacagacat taaagacatg tttcactaat acaaaacaac tccacctagt tcaacagtct 4080
gctcttttgt gtatggtacc tgaaactctt ctgttcactg aacttatccc aacatttttc 4140
ctcctaatgc atactttttc tagacgtgat gtgaaagtac agtgttatac cctggtgctg 4200
cattaatttg cataaccaca gcacacaaag cataatcata acacacaaag gcctcctatg 4260
aaaacatctg cttaaagtca taggtcactt atttattctc cctctagtta tgtaccagaa 4320
tgatgtatgt taataaataa tagattatta aatccatcaa aaattaggga agagctctag 4380
cacaaaggca aagcaaagaa gctttgaaga agtgcaagta aaatgaatta tttccaaaca 4440
actagcttct cactgtccca ctaagaacaa agactattct tatgcactgc tgtccttaaa 4500
attatcagct gctttgtgtt tatttcatgg agtaacacat gcaatatttt ttacaagaaa 4560
taagaaacca cagcagcaga agacgaatct gcttttattg aacgcagaaa tagatggaca 4620
ctgaaacaac agaagtttct accatgtttt gctgctgtga gagcaaatct gctgttgatc 4680
aactattagt tttgaaaagt atatgcaact ctgctatcaa ctccttcccc acatcacatc 4740
tcgtttcaag gagaaccttc ctgtccaggc aactagccag ggattttaat tttaacattt 4800
gctatctcag ataatctttt aatatttcta ggccgtgcac ataacccaca tagccctaac 4860
tccagatgtt cccagcatca cttagcagta gttccacttg aagcataaat acagcactgg 4920
cacaacaaat gaagacaatt caagcacgcc tttaacaagc atacagaaca tacagtttta 4980
<210> 17
<211> 4980
<212> DNA
<213> 人工序列
<220>
<223> ENSGALG00000012629_ENSGALG00000012628|chrZ:42172748-42177748
<400> 17
acaaattaaa tgtattttct cttgatacta ttttgattat aagctattaa cttgatttgt 60
aaaagcaccg atattatggt taatgtatgt atggtaactg ttgagtcaca gcctgaacct 120
ctgattgacc acctgcggaa aggtctgggt gagccctggg agcacaggca aaaacaattc 180
agttgtgcaa ctggaaggcc tctcttagac ctcatttaag ggctgactgt cactggggaa 240
ggatctgatt ctggagatcc cttattggtg aagctttccc ctgcaaacct agaatcttct 300
gatgcaagtg agcaatcttc ttcccttccc tagcagctct ctgttgcacc agtccttcca 360
tccttgcacc tttgttgtaa tgcttttccc atggcattga tctgtccagt tgctacagtg 420
tagaaacaag aaagtgtttt ctcaaaacat tatacatgct tactatcaga tcttacttaa 480
cattgataag aagtacacct ttcattacaa cagtgaacgg ataggcagca agcattcaga 540
acaatgaaaa agatctgcgt tctattgtaa agcaaacaaa ggtgatgacg gaacgtttat 600
ttgagataca ggcaccatag tacaagatat caaagaggaa ttaattcaac cctcccaaca 660
acagttggga aaaaaaaagg ataagctgag gaatgcagcc ttctccgatt tttactctgg 720
tgccggaagg aggaggagga gcgggggaaa acccagcgga ctcagactgc atacgcactc 780
tcggaagtac ctctgaggcg gggtgagagg aagggtggat ctaggctccc cccgctccac 840
acactcacgt gctcgtgtac tggttcaggc tgtgacttgg caactcctct acatctatcc 900
atctagttag actcaacaag accatcgtga ttcaggagtc tgaagatgct taactctctc 960
agaacgtcta gttctcctgg cctggtaaat gctatgtttc tcatactgcc tctctgaaga 1020
atgcttcgaa tgcttctagt gatgctctaa agttctaaac agaaaaatct ggagacagtt 1080
ctggtcttta gatagaaaaa atgccaacat gccaaaggat ggttacatcc ttcaagcaac 1140
cttgttgcat gctgtacaat agactcatgt aataacttag ccgtagtcat cgtatctctt 1200
atttacctgt tcgttattac attttcctgg tactgcttta tatttagtca gttgtccttt 1260
taagacaaat tttttggtgt gtgctaatag gcagttacca aatgttctag agggagggaa 1320
tataatcagt gagtatgtag atgtatatag atgtataacc agtaagtata cagagaagtt 1380
agggtggtct tttgagagca tatagctgga aagattatca catgggaaaa ggtaatcaga 1440
aataaatgga aaaatgctca ccagtgtcat aggctcacaa gaaaactccc caaggagcaa 1500
tctccagtaa cagacccttc ctcagtggca gtcagccctt aaatggcatc taggagaggt 1560
gtagccaggc accacccctt ctgtcacata ggtgaattgc cttcagctgt gctcctgcag 1620
ctgactcagt gttcacctca ggtgatcaat cagaggtcca gaccatgatt caacatttcc 1680
catgcggagg gagatgaaac aagactgtca tctcatcttc tgaagctgat aggagaatgg 1740
ttacaataag taggtcccct tccactggtt tagctctgta ttactcagtt taaaacttta 1800
tgtagttaat ggagttccat agaatcacat cgctggaaaa tgtatgtgat agctataccc 1860
aaaaagtgac acagcatcac agcctctacc aggtcctctg cctccagaca ggaccttgag 1920
ctgtgtgatc cctttgggat gtttctgttt aagacagggg acacttacac attaggaaac 1980
tggagtcatg tcggtggagg agaaagtggc tgtagaaaag gtaacggaca agaaatccct 2040
cactggctta gctgtaaagg tcagaggaaa atcatcttct gttctccata cacatctcct 2100
gtaattaggc acctgtgccc tttaaaaaag taaagtaatc aaagagtcat ttggtgaaaa 2160
tagaagccaa acagttacaa aatttagtta atattcaaag acaaaacaac tctggttcca 2220
aatataaaac cctttgtgta aacactgcgg gaaggtgcca aagagccacc tacacaaaga 2280
gatgccacag agtaatttgc gtaccccaac aataggatca tatatgggca aaccaaaaga 2340
ccaacaaaga ccccttgcaa taatcccttg attggcagaa gcaagtgcag cgttagattt 2400
agtatgtgtg acaattctga gaataggaag gaatttcact gaaactgtgt gaagatttgt 2460
atgttaaata catataatga gggttattta gctctggggt gtgcatgcta tgtggagaga 2520
tccccatgtg cccagcactg caatagacta atgtcagctt tttaaaccat catttggttt 2580
gaagagttta ttatgatttt cagaaacaga attatgtatt cagtgtctgt acattcttac 2640
aagcctgctg ttctgtacac atgaaaaagc tacttatggt gcaaatcagt atagagaagc 2700
agttttgaca tacagtggtc atgactgggt gatctgctgt cagaaggtaa gacactggta 2760
tacagaattg caaacgtgag atgaagacct caagtgcaac tctgtcatca taccacttct 2820
cttgctatta tctattcagt gtttgttcta aatattcagg cagaaggctt ggtttcacat 2880
caggtgttac atttaagtat tctttgccca ttttttgctg tttgtatgtg taacttcaga 2940
ttctcacatt gactgtgtag tgtaaatttg caaatagatg taacagcttc tctttaacat 3000
cccatgccaa acttttaatc actttcaatc aatgttggaa atctgcagta cataaatttt 3060
attttgattc attattcaga gaatcagaga aataaggact tttttagagg tttatgttta 3120
ttttagaaaa tataaataaa tcttgtatac atagatttcc aactagtaaa atttttagct 3180
atcgctgtag catttctatg aggagtttta ctttttactg tctcttatga aacttagtgg 3240
aaacaaagct aggtttcata aaacgtctaa tctcatattc atctctctcc aaaatatggt 3300
gaccttcaaa acaagaacag tttgcttatg taaacatttc ttacattgta ttctattaca 3360
ttatcatatt catgaagata ctttagaatt ttgttgctgt tagttctgtt gtgactggct 3420
gcttttctca gcttaagagc tctgcagaag tgatgataat atatattctc tttgctgagt 3480
tacaggaatt tcctgctttc ctctactgta cgttggagcc caggagatca gatccaacta 3540
ccagaatttt atatagctct ttgtgatcag tccttcctta gttgctgtta ttcctattga 3600
tgcaaaccta tttatggtgt attaaatgaa gaagatataa tgaggacagt ctaataatca 3660
aagttttttt ctgcagccag tagtacaggt agggtgacat gccttgcata aacagatcca 3720
gatgaaaggt gtgggtgagg caataagtct tcaggccctg ggctaaggca ggacctgttt 3780
tgtttcatga gatatgccta ggcctctcta tagacagggg gagatgtcag agaattctga 3840
agcatcagca gaggctatct tggttttcag gccctgtgct aagtatgaga ggaagttgag 3900
aacagataat gtgtgcaaca aagttagcaa catgcttttt caaaacagag gaaacgatcc 3960
ataaatactg gaacagaaca acctcacaga aatcactgac tgtccctttg ctggccatgg 4020
catcctgaag gttgtgctgg tagcactcat tgggttgctg tagctgataa ggcagtgcaa 4080
ggacattggg tctgcacctg ctatgaacag gcactggggc ctccaggagc tgctggtatt 4140
agtcatgggc atcagaggtg aagaaggcac ttgtagttct cacagctctg gcactgaccg 4200
atatttctgc tgtagttaat gggattattt gcatgtagtc aacagtttac aggctgattt 4260
ggctctgctc cgcaactagc aggacagagg gacccacaga tccatgtcct ggaaggggat 4320
aagggaaaag gatagagaga tgggcctaaa acaaaacaga agcaacgatc tgaggataaa 4380
caaagtaatt tactaaataa gatagtggaa tgcatgataa cacactatag tacaacataa 4440
tgcaatgtaa ttagaactgg agctaataaa tcaaatataa agagagtgtc tgaaagccaa 4500
aggccttact ctaatgctgt gatgagatgg cacccacaaa agagacgagc cagatgattg 4560
aaagggatgt atggtggtct accaaggcct gttatctgtt tgccctgagc agaaatgata 4620
gcagaacagc aaacagtcct ctggggaatg tagtagttct tctcttctgg gacaggtagc 4680
tggacctaga gcattaactc tttaaccccc agtacactac atgatgttat gatgtggaat 4740
accaataacc aaacatcata aaaccatgac atagtcttat gtcgctgtgt tgtaactgga 4800
agctgaggat ctccactcag tatttctgct gaatgaagca gatctttcag ttgaaggaga 4860
ccaacttaat catccacttc caacccctta ctatggacag gttcaccgtt cactagatca 4920
agctgcccag ggccccatcc aacctagcct tgaatgcctc cagggatgag gcatccacca 4980
<210> 18
<211> 4980
<212> DNA
<213> 人工序列
<220>
<223> ENSGALG00000015617_ENSGALG00000027714|chrZ:63363656-63368656
<400> 18
gaaaatctct gccactgatt gttttgcagc ttagttgtct agttattcgt gagatgttga 60
ttcaaacctt tgctcagatc aggcacagaa gcagtgctga actttgtttt tccgtagcct 120
tgctagtgtt gtaactgctg tcttagtgaa aacctgctta tttgcatccc cttcccaact 180
ttgggaaagt tgctgtctgt gattccagaa ttaggactcc ctcggttgca acatgactca 240
gattttcaga ccttggcttc agaggcacag tggtctttgg tgcagagaaa aatgaggctg 300
agaagaccag ggccatgatg agtgaggaag atgcaacaga acaagataga gaagagggaa 360
gagtttttta ggagctccac cagacatact gtagaagcag tgtagatgca cagtaccagt 420
aatgtactcc agccaaccac tcggtgaaga cccatgaaaa cctaatgagg ttcagtaagg 480
ccaagtgcag ggtgctgtac ttgggtcggg gcaatcccag gtatttatac aaactagggg 540
aagatctcct tgagagcagc cctgcagaga aggacttggg ggtcctggtg gatgagaagc 600
tggacgtgag ccagcagtgt gcacctgcag cccggaaggc caactgtgtt ctgggctgca 660
ttaaagaagg ggtgaccagc agggagaggg aggtgattgt ccccctctac tcagctcttg 720
tgaggcccca tctggagtac tgcatccagg cctggagccc ccagtacagg aaggacgtgg 780
agctcttgga gcgggtccag aggaagacca ctaagatgat cagagggctg gagcacctct 840
cctatgagga aaggttgagg gaactgtcct tgtttagctt agagaagaga aggcttcagg 900
gaaacctcag tgcagctttc cagtacttgg aaggagcaca taaacaggaa ggggaatggc 960
tgtttacgag ggtggatagt gacaggataa gggggaatgg ttttaaactg agacgggaga 1020
gttttaggtt agatattagg aggaagtttt tcacacagag ggtggtgacg cactggaaca 1080
ggttgcccaa ggaggttgtg gatgccccat ccctggaggc attcaaggcc aggctggatg 1140
tggctctggg cagcctgctc tggtggctgg caaccctcca catagcaggg gggttgaaac 1200
tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg aagactctgt 1260
aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca ccacattttt 1320
actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg ttaactgctg 1380
gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt cacccaaaat 1440
tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt acagcctcac 1500
atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg tatattatgc 1560
actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt aagcccagaa 1620
atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga cacagatgtg 1680
ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa tctctgaaat 1740
ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat agaattggtt 1800
gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag gtaaacaggt 1860
gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt gtttgttgtt 1920
tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca ttagcagacc 1980
agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt tctgtggaag 2040
aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac aaataatgtt 2100
atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag caaactgagt 2160
cttatcgttc ctactgtgct ttgcttttct tgcttagcaa aacatatcag aaaggttttc 2220
agttaaaaaa aaaaaaaaaa aaaaaggatt atactgcagc catcaaagag ttctgttaaa 2280
gaagttgtgg ttcatattct tttcaagttc tgaagacaat ctgacaatag aggagatgag 2340
ggtttagtgg aggtaaatgg agctgtttct gaaagtaggg caccgtcgtg aggtaatctc 2400
accactagat gttgctgtaa gcatgatgag gggagaagct ggagcacaaa aggtgtaaac 2460
ccaatggttg atcatgcgca ctcggacaga ggaaatcttc aaaatgggaa agttagcttt 2520
gaactgattt ggtgggttcc cattaaaaat gggggactta ctgccttatt gtctttatgt 2580
acccatttgg gggatagatg ccatacagaa acaccagagc ttacggtgtg aattcattgc 2640
acatcttatt agatcaacaa aatggaataa aagaatacag aagattacta ctccattggg 2700
catgtggacg ttttacaggc ctggataaat tagatcttaa aaacaaacaa acaaacaaac 2760
aaaaaaactc cttgcaaaga taatgttatg taatattagt tgcaagaagt aagcaaacac 2820
acagaactgg gagcagaagc aaagcactaa gttattaaag caagttgcac attttgagtt 2880
gcattttgcc actggtttta taaacatgtt tagcatgtct ggtcagaatt tgggcaccag 2940
gatgctttta agatgtctgt ctatggaacc tgtcagtgct caagaataac ttctgttatt 3000
tggatgctgc accaaagaat tcagaggaag acgagccaag ccagacgtta tcatagtcac 3060
tagtaaagtg gttctaagcc taattaagac atgtcagaac tatgtgttgt gcaaccaaat 3120
cctccaaaag agaaatcaga ggtgaacttg tgcaataaat atagaagaca cgtaaatcct 3180
gaggcagtta gctaaccata tgaagccaat catacctgac tgctggacgc aggagactga 3240
accttacaga ccctggagaa tcactgtttg gcctagttag gcctgaatgg aatttaccaa 3300
gattcatgac tttaacatgg atcaggtgca aagaaaagaa ggctcagtta gttcctacag 3360
gctaccagat ctttttccac ctctgctcag cctggagctg tgggctctac ctgcccctga 3420
agtgaagtgg catcaactgc aacacttttt gcagaggcaa aaatcatcaa gtcgtgcctc 3480
tgcattttaa ggtgatggat tccaagagat agattccaaa cccaacactg agattcctct 3540
ggtgatgcag atgactgctt actgggatcc ttctctctct atagcctaat cccatgcagc 3600
accaaaagtt gggcacctga atactatcta tcttcctcca tctgacctct gctgctggct 3660
catcacgcat ggctcctgag cctgacagag ccatggggaa agacatggcc tgaccttttc 3720
agacagcacg acttcctcca gtgtgctgca ctaacgacaa tattaaaaat aacactgcag 3780
gaaaacatgc tgttttctag caggctggag gaaaaaaaag gtgttcaagg tgagactcta 3840
taagatcact ctttccaaac acagcagtta actcttttct cacttgaagc tgaaattcat 3900
cttcagtagg tgacggttac aagcagctct ccaccggtaa gtgaaagttt gctgggtttt 3960
tttcaggcac ttcaagacac gaaggtaatt gctgcaacac cttcctagct cttcctgagt 4020
actcagccca aagctacact cttcagggct actctcctag cacggctctc tgtaattagc 4080
ctggctttct aacttatgaa ttaacgctgc agctactcaa cagggcagct ttgcagctat 4140
gaactttatg catacacttt ttattctggg tggtacaaat tcattgctaa gaaatcttat 4200
aaactctatg gaacactttt aaaagcctac atgtgattaa aaacaaaaaa acaaaaaaca 4260
ctgatatcac atgctatatt ctctagaaaa gagtattttg gaaacaattg taattcacag 4320
ctcaggagaa agagcaattg ttttcctttg tgctggagct ggaattctat gcagtataaa 4380
tacagatgtc caaacaaact cattaaatgg tagtcatagc aaatggagga aaaaaaaagg 4440
gggggggggg gggaactgaa gacactgaag aaattctgct gaaattcatg gagctgcaac 4500
aagaattgat attgattact tcaccatatt ccgctctaat taactagcac aacactgact 4560
gttgtgaaaa caagcatgtg atttgaccca ataagtgttt cttttagtaa ccaaaaccaa 4620
acaacaacaa accttctggc tgaccagatg gaggataaat tctaacctga tcattctgac 4680
acaaatgagg aattatgtag gttggaactg cattccaaag caaagcatgt ttttggctta 4740
gttgaacaca cagaattcat ttttcttgct gattcttgta actaagggca ggtatgaatt 4800
ggttccctta aaagaagtcc ccagaagcca tggtcctcaa caagtcttct cagattagca 4860
aggatgaacg actgagaaat caaaacccaa attcagatct aagagccttc aacagatttg 4920
ctaaatgaaa ctagcaaata ctgtagaagt taacttgatt ttgaaataaa acaggatttc 4980
<210> 19
<211> 4980
<212> DNA
<213> 人工序列
<220>
<223> ENSGALG00000008188_ENSGALG00000008197|chrZ:78777477-78782477
<400> 19
aaaggagttt cttgcctgaa accccttaag attttgtgta ttgttgttgc cctggtttca 60
gctgggacag gactgatatc cttcacagta tctggtatga tgctgtgttt tggttttagg 120
agaaaaccag tgctgatggc acaccgaggt tgtagttgcg actgagcagt gctgcacaga 180
gccaaggatg tttcagctgc ccacactggc cttcctctaa gggggtgtga gggcacatgg 240
agctggaggg aaccaaaggg gtattccaca ccatatgtca ctgagcaaag acattgctgc 300
ccaggcagag aatacagtgg tagaaatacg tcacataggt gcccatctac cccagaactg 360
ggccagcgaa gaacatcaga acaacaagca tgcgaatcag gctgctcaga ttgatgtggc 420
tcaggtagat ctcaactgtc aactgtcacc cataaaatgg atgagacagg agcaaggcct 480
gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 540
gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 600
aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 660
gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 720
acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 780
agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 840
atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 900
ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 960
ggcatggcat ggtcagtgac acccactggt tagcatgggg acaaactgcc agagcagagg 1020
gctgctgaaa cgccgagtgc caactgacac tgttcagctg acagcctcac gagagtgctg 1080
cgagggttaa gtgaggcaac aaaatacaag tactcaaaaa tagaatggaa tggaatggaa 1140
taacagaggg aatggggaac aggctgcagt gagaaggaaa cccccgtgca ccgaccaacc 1200
cgctcccagt agcctggtcc ctaccttgcc ccactccagc agctccacga ggtactcgaa 1260
gtgcccatgt ccggccatcc ccagcatggc acagctgtca cctgggagca gcgggggtcc 1320
ggcaggcatc gccggcaccc acagcctggg ctgggctgag gatgggcttg gtgggcagct 1380
gggtgctgcc gtggcagctg agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc 1440
acggctcggg acccgtggtg ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc 1500
cagagcaggg tgcatgatgt gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca 1560
ccacccggtc tgatgaaatt ccaggttttg tttaagatga aaatgcatgt gggcatacat 1620
ttgcacatga gaacacctgc taatgaaaca cacagagttg tatgtgcagt ctccctggct 1680
ggtggcatgt ctgtgggggc agttaggcag gaagaaaagc tccaccatct gtttctgtgt 1740
cccgggcttg gtgctgccac tagagatggg atgcacacag catgcctgcg tgctgccgag 1800
gcagctcagt acctgctgct gggggagagc agccctcagg gagctgctgc aaagaccccg 1860
tgggatggct ggtgaacagt gctggagaca tggcagatgt cgcacccctg ctccacacca 1920
ccctccgctg cagctgcctg cacgatgcca tttcagcgtg ccacggcttg tttcttcctc 1980
ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 2040
cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 2100
atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 2160
ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 2220
tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 2280
gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 2340
atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 2400
ttcccacact gcttttctgc aaatggatta ggagtaaaga gtcagataca caggggacca 2460
tcactcactt cctaggccat gcttcgtagt ttaactccat gcaaggtatt ttcttgctct 2520
gatctaactc tagatcacta aatggcactt gtgcaggaca cttttccact gtcattttgg 2580
ggggtagaag tgtggtcaga gccagggagg cttgcagggc ccacaccagc tgtggcccaa 2640
gcagctgctg tacaatggct gtatggcagt atcgatgtga acttcctgat aataaacaga 2700
actcagcagc aaataaaccc agattgttct gatcagtaac gagaggctgt gcaaaaagct 2760
gagaaatgta cagcccttcc tgctcaccac tacagccctt catgcagcgg cctgctgcac 2820
tagggcctgc ttggccagag gcagggctgc agcttgagat acgcagcacc cagtacccca 2880
gcaggctgcc atgtgcttct gtcaggccat gaattgcaca agttggtata gttttataca 2940
gtgtcatgca gaagcacaac tcttaccttg gcacactgat atggaaagca aagtgtaaag 3000
gaactgtatg tttcttggct tgtgagttcc attggttctc ccaggacagc agtgacagct 3060
ctagattttc tggttgatct cttccatcta agtttttact tctgaataca tctgtgcagc 3120
aaagcctgat gctttttttt ttccccctcc cctgggatcg tgaaatatta ttttcccatc 3180
tccataatac agatgatcca ctcaaacatg catcctcagt cgcagtcctc agaagggcct 3240
tttcccacca tacacctaca cgctacacca gactttattg gtcaccatgc cttgagggat 3300
tctgcctaac acaggcacac aggaagggct gataccagta attcattgct gaggagagaa 3360
ggggcacttc ttttatagta gagccacaga atcaccagga ttggaaaaca cctccaagat 3420
catccaatcc aaccacccac ctaccaccag tatttcccac taaaccatgc cccttggtac 3480
cacatctaaa agcatcttct gcaccttcac agcttcattg cctttctcag gacgtgctcc 3540
agggccttgg tgtctttctt gtattgagtg gcccaaaatt gaacacaata ctcgaggtgc 3600
agcttcacca aagctgagtg cagaggggtg atcacctcta ctaggccttg ttttacccct 3660
tccccctgca tacctagttt aaagcccttt cagcgagccc taccagctcc tgggctagga 3720
tccatttccc cctttaagag aggtgaaacc cacccgcagg catcaggcca ggcactgagt 3780
taaactgctc catcagctaa ccaccccaat gccctgatgt cccttctgat agtcctcagg 3840
cttctctcag cgacttcatc actgccagcc tgagctatcc gtaatggata acaaccagag 3900
ggctgaacca gactagggag tctcctggta atgtccctaa gtaatgaatt catgggggaa 3960
atggatctgt gcagatgcac tgccatctca cagggctcaa ctgtcacaga cagttgtcac 4020
aaaccagagc agcagagaga gcagcaaagg agatatcata aatagtggaa aagggtgcca 4080
gtgtttgtta ttgactgctt cactgtgtgt ttggaaatca caaagaaaac aacaaaaaaa 4140
ccccacagaa tacacatttc caagcatgca tgcttcaggt aaggactgcg gcccgcttta 4200
attcccctgg aagcgtccag aggcctacac acaaatcagg ccacaacaaa caggttccgt 4260
gcaagcagtt tgtgagttgt atgaaaatag ctttcttcca taaagcgtgg cattgatggg 4320
aactgttact agcagatgaa aatctgccat gcacgacacc cttaatggtt ggagtggttc 4380
gactgagttt tgcattcctc attctgatgg atgctggcaa aaccaagatc acccaacacg 4440
taacactgaa tatagctcac caacagcaac gagccacacc agatactgag gcatctccaa 4500
ggctacgtct ggtggaaaga agagacagtc tcaccctgca gtgcaaaagc atcagggctt 4560
ctgcgtaagg tttattgatc ccaaagatag gcaagttaat attcatcagt ttaatagaca 4620
ggtactcaca ttactggaga tggcatgcca ggagagcctc tgccaagtgc tcactgccag 4680
tggcagccgg ccagtgcaca gcttcttggt gctgtggcca tctatataac agaaggaagc 4740
aattaagcat cacctatcaa gataagcaag atcattcaaa gagaataagg gtacttggtt 4800
agagctgcag agcacttcct cacgaatgag tttcttccag ctacatgcag atgttacagg 4860
cagtttgctt gtgttctagg gataacacaa acccctcctc atgggctagc tgcctgctca 4920
ggctgtggtc tgtatttttg cacgtgcact gctagccttt acttcacatt tccctttact 4980
<210> 20
<211> 681
<212> DNA
<213> 人工序列
<220>
<223> pDsRed1
<400> 20
atggtgcgct cctccaagaa cgtcatcaag gagttcatgc gcttcaaggt gcgcatggag 60
ggcaccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggccacaaca ccgtgaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcca gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc 240
cccgactaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gcgtggtgac cgtgacccag gactcctccc tgcaggacgg ctgcttcatc 360
tacaaggtga agttcatcgg cgtgaacttc ccctccgacg gccccgtaat gcagaagaag 420
accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccaca aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagtcc 540
atctacatgg ccaagaagcc cgtgcagctg cccggctact actacgtgga ctccaagctg 600
gacatcacct cccacaacga ggactacacc atcgtggagc agtacgagcg caccgagggc 660
cgccaccacc tgttcctgta g 681
<210> 21
<211> 226
<212> PRT
<213> 人工序列
<220>
<223> pDsRed1
<400> 21
Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys
1 5 10 15
Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys
35 40 45
Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
50 55 60
Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile
65 70 75 80
Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg
85 90 95
Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser
100 105 110
Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val
115 120 125
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp
130 135 140
Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly
145 150 155 160
Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val
165 170 175
Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly
180 185 190
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp
195 200 205
Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu
210 215 220
Phe Leu
225
<210> 22
<211> 876
<212> DNA
<213> 香菇珊瑚
<220>
<221> 尚未归类的特征
<222> (1)..(876)
<223> 红色荧光蛋白 (FP593)
GenBank: AF272711.1
<400> 22
agtttcagcc agtgacaggg tgagctgcca ggtattctaa caagatgagt tgttccaaga 60
atgtgatcaa ggagttcatg aggttcaagg ttcgtatgga aggaacggtc aatgggcacg 120
agtttgaaat aaaaggcgaa ggtgaaggga ggccttacga aggtcactgt tccgtaaagc 180
ttatggtaac caagggtgga cctttgccat ttgcttttga tattttgtca ccacaatttc 240
agtatggaag caaggtatat gtcaaacacc ctgccgacat accagactat aaaaagctgt 300
catttcctga gggatttaaa tgggaaaggg tcatgaactt tgaagacggt ggcgtggtta 360
ctgtatccca agattccagt ttgaaagacg gctgtttcat ctacgaggtc aagttcattg 420
gggtgaactt tccttctgat ggacctgtta tgcagaggag gacacggggc tgggaagcca 480
gctctgagcg tttgtatcct cgtgatgggg tgctgaaagg agacatccat atggctctga 540
ggctggaagg aggcggccat tacctcgttg aattcaaaag tatttacatg gtaaagaagc 600
cttcagtgca gttgccaggc tactattatg ttgactccaa actggatatg acgagccaca 660
acgaagatta cacagtcgtt gagcagtatg aaaaaaccca gggacgccac catccgttca 720
ttaagcctct gcagtgaact cggctcagtc atggattagc ggtaatggcc acaaaaggca 780
cgatgatcgt tttttaggaa tgcagccaaa aattgaaggt tatgacagta gaaatacaag 840
caacaggctt tgcttattaa acatgtaatt gaaaac 876
<210> 23
<211> 230
<212> PRT
<213> 香菇珊瑚
<220>
<221> 尚未归类的特征
<222> (1)..(230)
<223> 红色荧光蛋白 D. GenBank: AAG16224.1
<400> 23
Met Ser Cys Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys Val
1 5 10 15
Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Lys Gly Glu
20 25 30
Gly Glu Gly Arg Pro Tyr Glu Gly His Cys Ser Val Lys Leu Met Val
35 40 45
Thr Lys Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ser Pro Gln
50 55 60
Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro
65 70 75 80
Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
85 90 95
Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Ser Ser
100 105 110
Leu Lys Asp Gly Cys Phe Ile Tyr Glu Val Lys Phe Ile Gly Val Asn
115 120 125
Phe Pro Ser Asp Gly Pro Val Met Gln Arg Arg Thr Arg Gly Trp Glu
130 135 140
Ala Ser Ser Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Asp
145 150 155 160
Ile His Met Ala Leu Arg Leu Glu Gly Gly Gly His Tyr Leu Val Glu
165 170 175
Phe Lys Ser Ile Tyr Met Val Lys Lys Pro Ser Val Gln Leu Pro Gly
180 185 190
Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Met Thr Ser His Asn Glu Asp
195 200 205
Tyr Thr Val Val Glu Gln Tyr Glu Lys Thr Gln Gly Arg His His Pro
210 215 220
Phe Ile Lys Pro Leu Gln
225 230
<210> 24
<211> 4107
<212> DNA
<213> 化脓性链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(4107)
<223> M1 GAS
Cas9蛋白质id: AAK33936.1
<400> 24
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 25
<211> 1368
<212> PRT
<213> 化脓性链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(1368)
<223> M1 GAS
Cas9蛋白质id: AAK33936.1
<400> 25
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体基因座chrZ_42174515_-1的gRNA7
<400> 26
gtaatacaga gctaaaccag 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体基因座chrZ_9157091_1的gRNA8
<400> 27
acagacctat gatatgtgag 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体基因座chrZ_27767602_-1的gRNA9
<400> 28
gagcttgtga gtgataatcg 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体基因座chrZ_78779927_1的gRNA10
<400> 29
gtaaagagtc agatacacag 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于Z染色体基因座chrZ_63364946_-1的gRNA11
<400> 30
cagtgggtac tgaagctgtg 20
<210> 31
<211> 1012
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA7整合至染色体Z的左臂
ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_
-1
<400> 31
gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60
caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120
aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180
atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240
ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300
gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360
tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420
caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480
tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540
ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600
caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660
taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720
ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780
agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840
gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900
gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960
gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct ca 1012
<210> 32
<211> 1023
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA7整合至染色体Z的右臂
ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_
-1
<400> 32
gtcatgtcgg tggaggagaa agtggctgta gaaaaggtaa cggacaagaa atccctcact 60
ggcttagctg taaaggtcag aggaaaatca tcttctgttc tccatacaca tctcctgtaa 120
ttaggcacct gtgcccttta aaaaagtaaa gtaatcaaag agtcatttgg tgaaaataga 180
agccaaacag ttacaaaatt tagttaatat tcaaagacaa aacaactctg gttccaaata 240
taaaaccctt tgtgtaaaca ctgcgggaag gtgccaaaga gccacctaca caaagagatg 300
ccacagagta atttgcgtac cccaacaata ggatcatata tgggcaaacc aaaagaccaa 360
caaagacccc ttgcaataat cccttgattg gcagaagcaa gtgcagcgtt agatttagta 420
tgtgtgacaa ttctgagaat aggaaggaat ttcactgaaa ctgtgtgaag atttgtatgt 480
taaatacata taatgagggt tatttagctc tggggtgtgc atgctatgtg gagagatccc 540
catgtgccca gcactgcaat agactaatgt cagcttttta aaccatcatt tggtttgaag 600
agtttattat gattttcaga aacagaatta tgtattcagt gtctgtacat tcttacaagc 660
ctgctgttct gtacacatga aaaagctact tatggtgcaa atcagtatag agaagcagtt 720
ttgacataca gtggtcatga ctgggtgatc tgctgtcaga aggtaagaca ctggtataca 780
gaattgcaaa cgtgagatga agacctcaag tgcaactctg tcatcatacc acttctcttg 840
ctattatcta ttcagtgttt gttctaaata ttcaggcaga aggcttggtt tcacatcagg 900
tgttacattt aagtattctt tgcccatttt ttgctgtttg tatgtgtaac ttcagattct 960
cacattgact gtgtagtgta aatttgcaaa tagatgtaac agcttctctt taacatccca 1020
tgc 1023
<210> 33
<211> 1014
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA8整合至染色体Z的左臂
ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ
_9157091_1
<400> 33
ctctgcatgg tcacaacggc cccaacagcc tcccatcccg atgtcaccaa tcagttcact 60
attactggtg agcaaccagt ccagcactgc atccccctgg tggggctgtc tgttacgtgg 120
ctcaggaagt tatcctcagt gcattccagg tgctcctgga tcgcctgtag ctcaccgtgc 180
tacttttcca gcaggtgtca gggtggtaga agtcccccag caggacgaga gcctgcgatt 240
gtgacagctt ctgtagctgg agggagaatg cttcatcaac aggctccgct tgatcagtgt 300
ccctgtactg ataccacaag gcttcttttg ctgctcccat cttaactctc accccatcgt 360
ggtgttatac gtgcataaca tcatgcagtg cactaagagt taaagagtta atgctccagt 420
tccgtcgatt gtcaataatt ccaggtgtac ctttctcaga agagaagaac tacaaatccc 480
ttaagatctt actgttccat tttcattctc cattcagaag gaaaggtaaa actgcagtgt 540
gtgctcccta gcattagagt aatttctccc ttagctcgtt gccaccattt tgtttttagg 600
cccacctcct taccttttcc ctacacccct cctgtgtctc tgagacgtgg gtccatgggt 660
ccctcaacca tagtagacac aaactcagat caaaccaagc cagagctttg acaaccccta 720
agctttcagc ttactcaggg ttgctctgca gggactgctc ttcacactct attccttcct 780
tgatatagag ggcaatgtct cctctcctcc ttccttacct gtccctcctc atctgcctgt 840
tgctgtcagt ggccacactt cagccatggg aatcatccca ccctgctttt gtgaaggaaa 900
ctacattatg gttctcaggt agcacagtgg cttccatcac ctcctgtttg cttcccaagc 960
tgtgtgtgtt ggtgtagagg cacttcagct gggcagctga agaactggac gcac 1014
<210> 34
<211> 1032
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA8整合至染色体Z的右臂
ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ
_9157091_1
<400> 34
cacctttcca cctcctgcta aagcacattc cctacagtat gtttcacatg acaccgtgct 60
ggcagatttt taatatcatc agagaatgac actccatatc ctctctgggc agcctttttc 120
agtgctctgt cacccacaaa gtaaagtatt tgctcatgtt ctaatggaac ttcctatgtt 180
ctagtttgtg accattgaac cttgttctgt cactggacag tgctgaagga gcctggccct 240
atccacttga ctcccacact ttacatattt acaagcatcg ataagacccc cctcagtctt 300
ctccagacta gatagcccca ggtctcccaa ccattccttt tatgggagat gcttcaggcc 360
cctcatcacc tctgtggccc tctgctggac tgcctgcagt agttccaggt tttttttttt 420
gaactgggga gcccagaact tgacacggta ttccagatgt ggcctcacca gcgcagagga 480
gaggggaagg ctcacctccc tcgacctggt ggccatgttt tttttaacag acctcaggat 540
accactggcc ttcttggccc aagggcacac tgctggctca tggcccatgg gttggcttcc 600
aggactctca ggtccttctc cgtagagctc ctctcaagca ggacaaccct cagcctgtac 660
tgatgtgtgc ggtgcggtta ttcctcccca cgtgcaagac tctacatctg ccattgttaa 720
atctcataag cttcctctct gcccaactct ccactgtgta cgggccttag tgaatggcag 780
cacagacttc tggtgtgagg atagcattca gaacaagctg ctgtaccttc ccagtcacag 840
aggtgagggt gactggcttg tactttccca gctttgcctt cttgcccttt tggaagactg 900
gagcgacatt ggccttctgg aggaaacggt cctcaggcac ccctcctgtt ctccatgacc 960
tttgaaagat gatcgagagc accttggcag tcacttctgc cagctccttc agcacgcatg 1020
agtgcatccc gc 1032
<210> 35
<211> 1025
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA9整合至染色体Z的左臂
RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1
<400> 35
gcagtacgta cgtttgtgaa cagctgtttt caagggtgat gcacaggaag agtaaaattt 60
cattaaaaaa tctccaagga gcacatggag agctcactca gaagcctcac cgctgccact 120
gaacaagact gatgcattag tttcatgaaa tcaaggctat gtgtcccact ggtttcatta 180
ttttgttact ctttctttaa aacaaaaaaa ttgttttatt gcttatatac atcaactatg 240
ttgttatata ttttccaaag gccgctccaa aagtaatgcc tcctgtttca ttctgttggc 300
ccaccgtgtc agaggcagat ggtggtacgg cagtagagat ggaaccttcc caccaatatt 360
ccattacatg ttgccatgtg atagacagca gcagatgggc actctgacag aatggtatct 420
gacatggaag cgtggatgga gcaaagttgt gtcactgaat tcctccataa ggaaatgagc 480
acccactaac attcactgat gcttgctgaa catttctgga gaccaaacag tggatgtgag 540
cacagtgagg tggtgggtgg tgcatttcag cagtggtgac aatgacgttg ggtcacctct 600
gctggtgcag gttttgatga gtgcagcctg tgaggtcttg ttcatcaatg gagaaaatgc 660
acaactaatg gtggtgactg ctgaaaaata gtgttttgta gctgagaatt ttctctgtca 720
aacagtgcta attgtgctct ttgtatctgt tgtagtttcc atgggaataa ataggaggca 780
ttacttgcag actgacctac atatatgtgg ccccaggcaa gtcaacagct gtacgaaaag 840
tccatgcttc ctcattataa acggaggaaa aaaagttgtt tacagctgta atgggattat 900
aaaaggcaaa tggggatagt acagtggtga gaaccagatc tatgaaggaa aagccctaag 960
aaaaagagag tgcacagata ctcttaacca tctaataact gtttcctcca tcctacagct 1020
cagag 1025
<210> 36
<211> 1040
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA9整合至染色体Z的右臂
RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1
<400> 36
tggcttccaa ttcctcctgt ttatcaccca cgttgcatcc attgatgtag aggcacttca 60
gtcgggctat cagcaatgtt accacctgtg aggagccctc ttgagatctt ttaggacaat 120
ttagaggttt tccccactgt ttcctaaaat tacagcattc cctgtccctt cttagtgata 180
tagaactcca tccccttcca ccatcaaacc tagcttaagc tctggtaaat gatccagcca 240
gtctgcttcc caaaactctt gctcagttgc attctatctg atgcctacat gcccaacacc 300
ttcaaggcct gtccaagatc atagaacaca aaggcttgat catgacaaca tccatgcagc 360
caatcattca catgacccat tcctctcctc ctttccaggt cccaacggcc aactgagagt 420
tgtgctctga gctcttcagt gtccttccga gggatgtaaa gtccctttta atgttctgca 480
ttttctttgt cacagccttc tgagacccaa cttgaatgtg gaggagtgga gagtaatcat 540
cccgctctga ttatcagata cattagcctc ttcttggcac ctctggcaga cagaagactt 600
ccctggagag attacctgga tgataactgg gggcctcagt gcctcacagc agcaagtccc 660
cagttactaa gactctacac ctctttggtg gcgctagttc tgatgtagtt cttcagttgc 720
ttaacatgct tgttgtttcc caagatttga ctgctatctg caccctccct ttcttccagc 780
cccagagcct tatatcatga gctgagaaca ttctgtgttc aaaatacaag acacatttat 840
gcaatttcgt attctctacc catatttttg tgatagaaat tagggctact tatttcccat 900
agtgatttcc atgctgccta ccaggttcta agtcaggtca ccctgccagc ttcttccaaa 960
ccatgctcag gagtgcatca aatcacacgc agacccaagg aaaaaatgta ccaaacaata 1020
ttaccacgca tgcaaactcc 1040
<210> 37
<211> 1024
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA10整合至染色体Z的左臂
TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927
_1Chromosome Z
<400> 37
ctaccttgcc ccactccagc agctccacga ggtactcgaa gtgcccatgt ccggccatcc 60
ccagcatggc acagctgtca cctgggagca gcgggggtcc ggcaggcatc gccggcaccc 120
acagcctggg ctgggctgag gatgggcttg gtgggcagct gggtgctgcc gtggcagctg 180
agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc acggctcggg acccgtggtg 240
ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc cagagcaggg tgcatgatgt 300
gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca ccacccggtc tgatgaaatt 360
ccaggttttg tttaagatga aaatgcatgt gggcatacat ttgcacatga gaacacctgc 420
taatgaaaca cacagagttg tatgtgcagt ctccctggct ggtggcatgt ctgtgggggc 480
agttaggcag gaagaaaagc tccaccatct gtttctgtgt cccgggcttg gtgctgccac 540
tagagatggg atgcacacag catgcctgcg tgctgccgag gcagctcagt acctgctgct 600
gggggagagc agccctcagg gagctgctgc aaagaccccg tgggatggct ggtgaacagt 660
gctggagaca tggcagatgt cgcacccctg ctccacacca ccctccgctg cagctgcctg 720
cacgatgcca tttcagcgtg ccacggcttg tttcttcctc ttgcagtctc aggttgccgc 780
agcagcagct gcctgaggtc tggtggcaaa gggcagagca cccagcccac tgctctccat 840
gagtgagcgg gtagggggca cgccgtgctt cgcttctggt atcgggtggc ctgtggagca 900
catcacccct ggacagtgaa aacatgtcaa agggtgtttt ataacagtat agcatatccc 960
tttgaggctg aatttcctga gcttatggat atggtagtaa tgctatacca ggctctctct 1020
gcag 1024
<210> 38
<211> 1022
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA10整合至染色体Z的右臂
TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927
_1Chromosome Z
<400> 38
cagctgctgt acaatggctg tatggcagta tcgatgtgaa cttcctgata ataaacagaa 60
ctcagcagca aataaaccca gattgttctg atcagtaacg agaggctgtg caaaaagctg 120
agaaatgtac agcccttcct gctcaccact acagcccttc atgcagcggc ctgctgcact 180
agggcctgct tggccagagg cagggctgca gcttgagata cgcagcaccc agtaccccag 240
caggctgcca tgtgcttctg tcaggccatg aattgcacaa gttggtatag ttttatacag 300
tgtcatgcag aagcacaact cttaccttgg cacactgata tggaaagcaa agtgtaaagg 360
aactgtatgt ttcttggctt gtgagttcca ttggttctcc caggacagca gtgacagctc 420
tagattttct ggttgatctc ttccatctaa gtttttactt ctgaatacat ctgtgcagca 480
aagcctgatg cttttttttt tccccctccc ctgggatcgt gaaatattat tttcccatct 540
ccataataca gatgatccac tcaaacatgc atcctcagtc gcagtcctca gaagggcctt 600
ttcccaccat acacctacac gctacaccag actttattgg tcaccatgcc ttgagggatt 660
ctgcctaaca caggcacaca ggaagggctg ataccagtaa ttcattgctg aggagagaag 720
gggcacttct tttatagtag agccacagaa tcaccaggat tggaaaacac ctccaagatc 780
atccaatcca accacccacc taccaccagt atttcccact aaaccatgcc ccttggtacc 840
acatctaaaa gcatcttctg caccttcaca gcttcattgc ctttctcagg acgtgctcca 900
gggccttggt gtctttcttg tattgagtgg cccaaaattg aacacaatac tcgaggtgca 960
gcttcaccaa agctgagtgc agaggggtga tcacctctac taggccttgt tttacccctt 1020
cc 1022
<210> 39
<211> 1003
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA11整合至染色体Z的左臂
RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_-
1
<400> 39
gggttgaaac tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg 60
aagactctgt aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca 120
ccacattttt actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg 180
ttaactgctg gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt 240
cacccaaaat tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt 300
acagcctcac atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg 360
tatattatgc actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt 420
aagcccagaa atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga 480
cacagatgtg ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa 540
tctctgaaat ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat 600
agaattggtt gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag 660
gtaaacaggt gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt 720
gtttgttgtt tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca 780
ttagcagacc agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt 840
tctgtggaag aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac 900
aaataatgtt atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag 960
caaactgagt cttatcgttc ctactgtgct ttgcttttct tgc 1003
<210> 40
<211> 1003
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA11整合至染色体Z的右臂
RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_-
1
<400> 40
cagaaacacc agagcttacg gtgtgaattc attgcacatc ttattagatc aacaaaatgg 60
aataaaagaa tacagaagat tactactcca ttgggcatgt ggacgtttta caggcctgga 120
taaattagat cttaaaaaca aacaaacaaa caaacaaaaa aactccttgc aaagataatg 180
ttatgtaata ttagttgcaa gaagtaagca aacacacaga actgggagca gaagcaaagc 240
actaagttat taaagcaagt tgcacatttt gagttgcatt ttgccactgg ttttataaac 300
atgtttagca tgtctggtca gaatttgggc accaggatgc ttttaagatg tctgtctatg 360
gaacctgtca gtgctcaaga ataacttctg ttatttggat gctgcaccaa agaattcaga 420
ggaagacgag ccaagccaga cgttatcata gtcactagta aagtggttct aagcctaatt 480
aagacatgtc agaactatgt gttgtgcaac caaatcctcc aaaagagaaa tcagaggtga 540
acttgtgcaa taaatataga agacacgtaa atcctgaggc agttagctaa ccatatgaag 600
ccaatcatac ctgactgctg gacgcaggag actgaacctt acagaccctg gagaatcact 660
gtttggccta gttaggcctg aatggaattt accaagattc atgactttaa catggatcag 720
gtgcaaagaa aagaaggctc agttagttcc tacaggctac cagatctttt tccacctctg 780
ctcagcctgg agctgtgggc tctacctgcc cctgaagtga agtggcatca actgcaacac 840
tttttgcaga ggcaaaaatc atcaagtcgt gcctctgcat tttaaggtga tggattccaa 900
gagatagatt ccaaacccaa cactgagatt cctctggtga tgcagatgac tgcttactgg 960
gatccttctc tctctatagc ctaatcccat gcagcaccaa aag 1003
<210> 41
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA3进行克隆,Z染色体,“左臂”
<400> 41
cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60
gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120
ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180
caatgtgggc attgccgacc 200
<210> 42
<211> 258
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA3进行克隆,Z染色体,“右臂”
<400> 42
tggtgagtgg ggccaggaga gcaggacagg agtgtggact cggaggcgcg ggcagaggag 60
gtagctcaga gcatgagata tattcgccag gtgtcagtgg acttctggca gtgcatactg 120
cagagagctt tggttgctgg ccatctggat gatgacaaaa tctcagccac agaccatgtg 180
ggttggaaga gtcctcagga gatcaccttt ccacctcctg ctaaagcaca ttccctacag 240
tatgtttcac atgacacc 258
<210> 43
<211> 436
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA4进行克隆,Z染色体,“左臂”
<400> 43
tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 60
acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 120
atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 180
tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 240
gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 300
gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 360
tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 420
ccaccagact ggtccc 436
<210> 44
<211> 521
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA4进行克隆,Z染色体,“右臂”
<400> 44
tcaaaccgat tgtggctgtt tctcagaggc aactctttgc gctctagccc ctctataaca 60
tggggcaact tcccctgccc caccttccct tcctgtatct tctgaaaagc ttgtagccct 120
caattgtcac gctccagcca tatgaatcat cccaccacgt ccctgtgttc acaattacct 180
tctagtcttc taattgcacc atggcttcca attcctcctg tttatcaccc acgttgcatc 240
cattgatgta gaggcacttc agtcgggcta tcagcaatgt taccacctgt gaggagccct 300
cttgagatct tttaggacaa tttagaggtt ttccccactg tttcctaaaa ttacagcatt 360
ccctgtccct tcttagtgat atagaactcc atccccttcc accatcaaac ctagcttaag 420
ctctggtaaa tgatccagcc agtctgcttc ccaaaactct tgctcagttg cattctatct 480
gatgcctaca tgcccaacac cttcaaggcc tgtccaagat c 521
<210> 45
<211> 505
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA5进行克隆,Z染色体,“左臂”
<400> 45
gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 60
gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 120
aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 180
gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 240
acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 300
agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 360
atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 420
ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 480
ggcatggcat ggtcagtgac accca 505
<210> 46
<211> 599
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA5进行克隆,Z染色体,“右臂”
<400> 46
ctgccagagc agagggctgc tgaaacgccg agtgccaact gacactgttc agctgacagc 60
ctcacgagag tgctgcgagg gttaagtgag gcaacaaaat acaagtactc aaaaatagaa 120
tggaatggaa tggaataaca gagggaatgg ggaacaggct gcagtgagaa ggaaaccccc 180
gtgcaccgac caacccgctc ccagtagcct ggtccctacc ttgccccact ccagcagctc 240
cacgaggtac tcgaagtgcc catgtccggc catccccagc atggcacagc tgtcacctgg 300
gagcagcggg ggtccggcag gcatcgccgg cacccacagc ctgggctggg ctgaggatgg 360
gcttggtggg cagctgggtg ctgccgtggc agctgagtgc cgtcgtgcag gtgggctcgg 420
tgctctctgc agcccacggc tcgggacccg tggtgggcat actgctgggc aaggggacgg 480
ctcggatgtg catcccagag cagggtgcat gatgtgtgcg cagcggcaca cagcagcgca 540
cttgtccccg aggcaccacc cggtctgatg aaattccagg ttttgtttaa gatgaaaat 599
<210> 47
<211> 453
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA6进行克隆,Z染色体,“左臂”
<400> 47
ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 60
cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 120
atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 180
ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 240
tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 300
gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 360
atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 420
ttcccacact gcttttctgc aaatggatta gga 453
<210> 48
<211> 439
<212> DNA
<213> 人工序列
<220>
<223> 使用gRNA6进行克隆,Z染色体,“右臂”
<400> 48
gggaccatca ctcacttcct aggccatgct tcgtagttta actccatgca aggtattttc 60
ttgctctgat ctaactctag atcactaaat ggcacttgtg caggacactt ttccactgtc 120
attttggggg gtagaagtgt ggtcagagcc agggaggctt gcagggccca caccagctgt 180
ggcccaagca gctgctgtac aatggctgta tggcagtatc gatgtgaact tcctgataat 240
aaacagaact cagcagcaaa taaacccaga ttgttctgat cagtaacgag aggctgtgca 300
aaaagctgag aaatgtacag cccttcctgc tcaccactac agcccttcat gcagcggcct 360
gctgcactag ggcctgcttg gccagaggca gggctgcagc ttgagatacg cagcacccag 420
taccccagca ggctgccat 439
<210> 49
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 左引物
<400> 49
ttggtgtgtg ctaataggca gt 22
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 右引物
<400> 50
tagtcctcgt tgtgggaggt 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 左引物
<400> 51
gcattgatct gtccagttgc 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 右引物
<400> 52
tactgccaaa accgcatcac 20
<210> 53
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> ChZgRNA_正向引物
<400> 53
tgtatgagac cacgtaatac agagctaaac cag 33
<210> 54
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> ChZgRNA_反向引物
<400> 54
aaacctggtt tagctctgta ttacgtggtc tca 33
<210> 55
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA7的“左臂”的克隆的正向引物
<400> 55
acggggtcat tagttcatag cccatatatg gtgaacggat aggcagcaag c 51
<210> 56
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA7的“左臂”的克隆的反向引物
<400> 56
ggcgggccat ttaccgtaag ttatgtaacg tgaggaaggg tctgttactg ga 52
<210> 57
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA7的“右臂”的克隆的正向引物
<400> 57
ttctatcgcc ttcttgacga gttcttctga gtcatgtcgg tggaggagaa a 51
<210> 58
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于gRNA7的“右臂”的克隆的反向引物
<400> 58
gtgatggcag gttgggcgtc gcttggtcgg gcatgggatg ttaaagagaa gct 53
<210> 59
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 16个核苷酸的重复
<400> 59
cggtaaatgg cccgcc 16
<210> 60
<211> 261
<212> DNA
<213> 人工序列
<220>
<223> Z染色体的左侧接臂
<400> 60
tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60
gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120
ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180
aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240
agtacacctt tcattacaac a 261
<210> 61
<211> 245
<212> DNA
<213> 人工序列
<220>
<223> Z染色体的右侧接臂
<400> 61
caaactttta atcactttca atcaatgttg gaaatctgca gtacataaat tttattttga 60
ttcattattc agagaatcag agaaataagg acttttttag aggtttatgt ttattttaga 120
aaatataaat aaatcttgta tacatagatt tccaactagt aaaattttta gctatcgctg 180
tagcatttct atgaggagtt ttacttttta ctgtctctta tgaaacttag tggaaacaaa 240
gctag 245
<210> 62
<211> 1014
<212> DNA
<213> 人工序列
<220>
<223> Z染色体的左臂
<400> 62
gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60
caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120
aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180
atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240
ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300
gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360
tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420
caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480
tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540
ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600
caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660
taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720
ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780
agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840
gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900
gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960
gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct cagt 1014
<210> 63
<211> 629
<212> DNA
<213> 人工序列
<220>
<223> CMV增强子
<400> 63
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 60
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 120
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 180
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 240
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 300
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 360
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 420
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 480
gtaggcgtgt acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatcc 540
gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 600
gcgggcccgg gatccaccgg tcgccacca 629
<210> 64
<211> 714
<212> DNA
<213> 人工序列
<220>
<223> dsRED2报告基因
<400> 64
tggcctcctc cgagaacgtc atcaccgagt tcatgcgctt caaggtgcgc atggagggca 60
ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggcc 120
acaacaccgt gaagctgaag gtgaccaagg gcggccccct gcccttcgcc tgggacatcc 180
tgtcccccca gttccagtac ggctccaagg tgtacgtgaa gcaccccgcc gacatccccg 240
actacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg 300
acggcggcgt ggcgaccgtg acccaggact cctccctgca ggacggctgc ttcatctaca 360
aggtgaagtt catcggcgtg aacttcccct ccgacggccc cgtgatgcag aagaagacca 420
tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg aagggcgaga 480
cccacaaggc cctgaagctg aaggacggcg gccactacct ggtggagttc aagtccatct 540
acatggccaa gaagcccgtg cagctgcccg gctactacta cgtggacgcc aagctggaca 600
tcacctccca caacgaggac tacaccatcg tggagcagta cgagcgcacc gagggccgcc 660
accacctgtt cctgtagcgg ccgcgactct agatcataat cagccatacc acat 714
<210> 65
<211> 1026
<212> DNA
<213> 人工序列
<220>
<223> Z染色体的右臂
<400> 65
gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60
ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120
aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180
gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240
tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300
tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360
aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420
tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480
gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540
cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600
agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660
gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720
ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780
cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840
tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900
ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960
ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020
catgca 1026
<210> 66
<211> 2618
<212> DNA
<213> 人工序列
<220>
<223> 图15的Z染色体的右臂
<400> 66
tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60
gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120
ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180
aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240
agtacacctt tcattacaac agtgaacgga taggcagcaa gcattcagaa caatgaaaaa 300
gatctgcgtt ctattgtaaa gcaaacaaag gtgatgacgg aacgtttatt tgagatacag 360
gcaccatagt acaagatatc aaagaggaat taattcaacc ctcccaacaa cagttgggaa 420
aaaaaaagga taagctgagg aatgcagcct tctccgattt ttactctggt gccggaagga 480
ggaggaggag cgggggaaaa cccagcggac tcagactgca tacgcactct cggaagtacc 540
tctgaggcgg ggtgagagga agggtggatc taggctcccc ccgctccaca cactcacgtg 600
ctcgtgtact ggttcaggct gtgacttggc aactcctcta catctatcca tctagttaga 660
ctcaacaaga ccatcgtgat tcaggagtct gaagatgctt aactctctca gaacgtctag 720
ttctcctggc ctggtaaatg ctatgtttct catactgcct ctctgaagaa tgcttcgaat 780
gcttctagtg atgctctaaa gttctaaaca gaaaaatctg gagacagttc tggtctttag 840
atagaaaaaa tgccaacatg ccaaaggatg gttacatcct tcaagcaacc ttgttgcatg 900
ctgtacaata gactcatgta ataacttagc cgtagtcatc gtatctctta tttacctgtt 960
cgttattaca ttttcctggt actgctttat atttagtcag ttgtcctttt aagacaaatt 1020
ttttggtgtg tgctaatagg cagttaccaa atgttctaga gggagggaat ataatcagtg 1080
agtatgtaga tgtatataga tgtataacca gtaagtatac agagaagtta gggtggtctt 1140
ttgagagcat atagctggaa agattatcac atgggaaaag gtaatcagaa ataaatggaa 1200
aaatgctcac cagtgtcata ggctcacaag aaaactcccc aaggagcaat ctccagtaac 1260
agacccttcc tcagttggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 1320
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 1380
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 1440
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 1500
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 1560
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 1620
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 1680
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 1740
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 1800
tgaaccgtca gatccgctag cgctaccgga ctcagatctc gagctcaagc ttcgaattct 1860
gcagtcgacg gtaccgcggg cccgggatcc accggtcgcc accatggcct cctccgagaa 1920
cgtcatcacc gagttcatgc gcttcaaggt gcgcatggag ggcaccgtga acggccacga 1980
gttcgagatc gagggcgagg gcgagggccg cccctacgag ggccacaaca ccgtgaagct 2040
gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc cccagttcca 2100
gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc cccgactaca agaagctgtc 2160
cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggcgac 2220
cgtgacccag gactcctccc tgcaggacgg ctgcttcatc tacaaggtga agttcatcgg 2280
cgtgaacttc ccctccgacg gccccgtgat gcagaagaag accatgggct gggaggcctc 2340
caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc gagacccaca aggccctgaa 2400
gctgaaggac ggcggccact acctggtgga gttcaagtcc atctacatgg ccaagaagcc 2460
cgtgcagctg cccggctact actacgtgga cgccaagctg gacatcacct cccacaacga 2520
ggactacacc atcgtggagc agtacgagcg caccgagggc cgccaccacc tgttcctgta 2580
gcggccgcga ctctagatca taatcagcca taccacat 2618
<210> 67
<211> 1271
<212> DNA
<213> 人工序列
<220>
<223> 图15的Z染色体的左臂
<400> 67
gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60
ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120
aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180
gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240
tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300
tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360
aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420
tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480
gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540
cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600
agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660
gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720
ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780
cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840
tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900
ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960
ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020
catgcacaaa cttttaatca ctttcaatca atgttggaaa tctgcagtac ataaatttta 1080
ttttgattca ttattcagag aatcagagaa ataaggactt ttttagaggt ttatgtttat 1140
tttagaaaat ataaataaat cttgtataca tagatttcca actagtaaaa tttttagcta 1200
tcgctgtagc atttctatga ggagttttac tttttactgt ctcttatgaa acttagtgga 1260
aacaaagcta g 1271

Claims (15)

1.一种在未孵化的卵中对禽类胚胎进行性别确定的方法,所述卵在结构完整的壳内包含胚胎,所述方法包括以下步骤:
(a)提供至少一个转基因禽类受试对象,其包含整合到性别染色体Z和W中至少一者内的至少一个位置或部位中的至少一种外源报告基因,其中所述报告基因是红色荧光蛋白(RFP);
(b)从所述转基因禽类受试对象获得至少一个在结构完整的壳内包含胚胎的未孵化的卵;以及
(c)确定所述未孵化的卵中所述结构上完整的壳内的所述胚胎中是否检测到至少一种可检测信号,其中检测到所述至少一种可检测信号则表明所述未孵化的卵中所述结构上完整的壳内的胚胎中的所述至少一种报告基因的表达,从而表明在所述胚胎中存在所述Z染色体或W染色体,
从而确定在结构完整的壳内包含胚胎的未孵化的卵中的禽类胚胎的性别。
2.根据权利要求1所述的方法,其中所述报告基因编码具有500-650nm激发波长和550-650nm发射波长的RFP蛋白。
3.根据权利要求1或2所述的方法,其中确定是否检测到可检测信号包括将所述在结构完整的壳内包含胚胎的未孵化的卵置于光源下的步骤。
4.根据权利要求1至3中任一项所述的方法,其中所述至少一个转基因禽类受试对象是雌性禽类受试对象,并且其中所述至少一种报告基因被整合到以下至少一个位置中:(a)雌性染色体Z,从而检测到可检测信号表明在所述未孵化的卵中的所述胚胎是雄性;或(b)雌性染色体W,从而检测到可检测信号表明在所述在结构完整的壳内包含胚胎的未孵化的卵中的所述胚胎是雌性。
5.根据权利要求1至4中任一项所述的方法,其中使用至少一种可编程的工程化核酸酶(PEN)将所述至少一种报告基因整合到所述转基因禽类动物的所述性别染色体中,其中所述PEN是成簇的规律间隔的短回文重复(CRISPR)II型系统。
6.根据权利要求1至5中任一项所述的方法,其中通过使所述禽类受试对象的至少一种细胞或引入所述禽类动物的至少一种细胞与以下接触或共转染:
(a)至少一种Cas9蛋白或包含编码所述至少一种Cas9蛋白的至少一种核酸序列的至少一种第一核酸序列;以及靶向在至少一个性别染色体Z和/或W中的至少一个原间隔序列的向导RNA(gRNA),或编码所述至少一种gRNA的至少一种核酸序列;和
(b)包含至少一种所述报告基因的至少一种第二核酸序列。
7.根据权利要求1至6中任一项所述的方法,其中将所述至少一种报告基因整合到以下至少一个位点中:性别Z染色体基因座42172748-42177748或性别W染色体基因座1022859-1024215。
8.根据权利要求7所述的方法,其中将所述至少一种报告基因整合到以下至少一个位点中:(a)性别Z染色体基因座42172748-42177748,其中所述至少一种gRNA包含如SEQ IDNO.26所示的核酸序列并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'处分别侧接有包含由SEQ ID NO.31和32所示的核酸序列的同源臂;或(b)性别W染色体基因座1022859-1024215,其中以下至少一者:
(i)所述gRNA包含SEQ ID NO.1所示的核酸序列,并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.4和5所示的核酸序列的同源臂;和
(ii)所述gRNA包含SEQ ID NO.2所示的核酸序列,并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.6和7所示的核酸序列的同源臂。
9.一种禽类转基因受试对象,其包含整合到性别染色体Z和W中至少一者的至少一个基因座中的至少一种外源报告基因,其中所述报告基因是红色荧光蛋白(RFP),并且其中所述至少一种报告基因的表达适用于鉴定在结构完整的壳内包含胚胎的未孵化的卵中的禽类胚胎的性别。
10.根据权利要求9所述的禽类转基因受试对象,其中所述报告基因编码具有500-650nm激发波长和550-650nm发射波长的RFP蛋白。
11.根据权利要求9或10所述的禽类转基因受试对象,其中所述至少一种转基因禽类动物是雌性,并且其中所述至少一种报告基因被整合到以下至少一个位置中:雌性Z染色体或雌性W染色体。
12.根据权利要求9至11中任一项所述的禽类转基因受试对象,其中将所述至少一种报告基因整合到性别Z染色体基因座42172748-42177748的至少一个位点中,其中所述至少一种gRNA包含如SEQ ID NO.26所示的核酸序列并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'处分别侧接有包含由SEQ ID NO.31和32所示的核酸序列的同源臂。
13.根据权利要求9至11中任一项所述的禽类转基因受试对象,其中将所述至少一种报告基因整合到性别W染色体基因座1022859-1024215中的至少一个位点,其中以下至少一者:
(a)所述gRNA包含SEQ ID NO.1所示的核酸序列,并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.4和5所示的核酸序列的同源臂;和
(b)所述gRNA包含SEQ ID NO.2所示的核酸序列,并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.6和7所示的核酸序列的同源臂。
14.一种试剂盒,其包含:
a.至少一种Cas9蛋白或包含编码所述至少一种Cas9蛋白的至少一种核酸序列的至少一种第一核酸序列;以及靶向在至少一个性别染色体Z和/或W中的至少一个原间隔序列的至少一种gRNA,或编码所述至少一种gRNA的至少一种核酸序列;和
b.包含至少一种所述报告基因的至少一种第二核酸序列,其中所述报告基因是红色荧光蛋白(RFP),并且其中所述至少一种报告基因的表达适用于鉴定在结构完整的壳内包含胚胎的未孵化的卵中的禽类胚胎的性别,
其中所述至少一种报告基因整合到以下至少一个位点中:(a)性别Z染色体基因座42172748-42177748,其中所述至少一种gRNA包含如SEQ ID NO.26所示的核酸序列并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'处分别侧接有包含由SEQID NO.31和32所示的核酸序列的同源臂;或(b)性别W染色体基因座1022859-1024215,其中以下至少一者:(i)所述gRNA包含SEQ ID NO.1所示的核酸序列,并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.4和5所示的核酸序列的同源臂;和(ii)所述gRNA包含SEQ ID NO.2所示的核酸序列,并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.6和7所示的核酸序列的同源臂。
15.根据权利要求14所述的试剂盒,其中所述至少一种报告基因编码具有500-650nm激发波长和550-650nm发射波长的RFP蛋白。
CN202210492538.3A 2017-05-25 2018-05-24 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具 Pending CN114836475A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762510921P 2017-05-25 2017-05-25
US62/510,921 2017-05-25
PCT/IL2018/050573 WO2018216022A1 (en) 2017-05-25 2018-05-24 Methods for gender determination of avian embryos in unhatched eggs and means thereof
CN201880042292.1A CN110891418B (zh) 2017-05-25 2018-05-24 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880042292.1A Division CN110891418B (zh) 2017-05-25 2018-05-24 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

Publications (1)

Publication Number Publication Date
CN114836475A true CN114836475A (zh) 2022-08-02

Family

ID=62716101

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201880042292.1A Active CN110891418B (zh) 2017-05-25 2018-05-24 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具
CN202210492538.3A Pending CN114836475A (zh) 2017-05-25 2018-05-24 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201880042292.1A Active CN110891418B (zh) 2017-05-25 2018-05-24 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

Country Status (25)

Country Link
US (1) US20200283849A1 (zh)
EP (1) EP3629719B1 (zh)
JP (1) JP7179776B2 (zh)
KR (1) KR20200018486A (zh)
CN (2) CN110891418B (zh)
AU (2) AU2018274769B2 (zh)
BR (1) BR112019024642A2 (zh)
CA (1) CA3064825A1 (zh)
CL (1) CL2019003414A1 (zh)
CO (1) CO2019014075A2 (zh)
CR (1) CR20190569A (zh)
CU (1) CU20190094A7 (zh)
DO (1) DOP2019000298A (zh)
EA (1) EA201992582A1 (zh)
EC (1) ECSP19087406A (zh)
IL (1) IL270903B2 (zh)
MA (1) MA48783A (zh)
NI (1) NI201900121A (zh)
PE (1) PE20200692A1 (zh)
PH (1) PH12019502663A1 (zh)
PL (1) PL3629719T3 (zh)
SG (1) SG11201911686YA (zh)
UA (1) UA128365C2 (zh)
WO (1) WO2018216022A1 (zh)
ZA (1) ZA201907822B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112522315B (zh) * 2020-12-08 2023-04-11 广东省农业科学院动物科学研究所 一种鸡原始生殖细胞转染方法
CN112956427B (zh) * 2021-01-29 2022-06-24 四川省畜牧科学研究院 一种便捷式雏禽性别鉴定肛笔
CN114568343B (zh) * 2022-03-11 2023-04-07 成都合拓创展生物科技有限公司 制备眼病模型的头具及其应用
CN114793988B (zh) * 2022-04-19 2023-01-17 中国科学院海洋研究所 一种基于形态学鉴定孔鳐受精卵的方法
WO2024201467A1 (en) * 2023-03-27 2024-10-03 Eggxyt Ltd. Method for gender determination of chicken embryos

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761756A (zh) * 2003-01-16 2006-04-19 北卡罗来纳州大学 禽类物种中内源性原生殖细胞的耗减
EP3080279A1 (en) * 2013-12-11 2016-10-19 Regeneron Pharmaceuticals, Inc. Methods and compositions for the targeted modification of a genome

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9511439D0 (en) 1995-06-06 1995-08-02 Isis Innovation Gene product and method
AUPO060996A0 (en) 1996-06-21 1996-07-18 University Of Melbourne, The Sexing gene
CA2264450A1 (en) * 1998-03-05 1999-09-05 Andras Nagy Methods for monitoring heterologous sex chromosomes
US6244214B1 (en) 1999-01-06 2001-06-12 Embrex, Inc. Concurrent in ovo injection and detection method and apparatus
JP2008541090A (ja) 2005-05-11 2008-11-20 エンブレクス,インコーポレイテッド 蛍光顕微鏡検査を利用する競合的微粒子イムノアッセイ法
EP2405740B1 (en) * 2009-03-13 2015-12-23 Van de Ven Beheer B.V. Method for avian sex determination
FR2969497B1 (fr) 2010-12-27 2013-06-28 Ceva Sante Animale Composition luminescente comme biomarqueur dans un oeuf aviaire, dispositif et procede correspondants.
AU2013204327B2 (en) * 2012-04-20 2016-09-01 Aviagen Cell transfection method
EP3757552A1 (en) 2012-08-31 2020-12-30 Agri Advanced Technologies GmbH Spectrophotometric analysis of embryonic chick feather color
FR3023617B1 (fr) 2014-07-11 2018-06-15 Tronico Dispositif non invasif de determination de la fertilite et/ou du sexe d’un oeuf, et procede correspondant.
CA3007066A1 (en) * 2015-12-03 2017-06-08 Eggxyt Ltd Methods for gender determination of avian embryos in unhatched eggs and means thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761756A (zh) * 2003-01-16 2006-04-19 北卡罗来纳州大学 禽类物种中内源性原生殖细胞的耗减
EP3080279A1 (en) * 2013-12-11 2016-10-19 Regeneron Pharmaceuticals, Inc. Methods and compositions for the targeted modification of a genome

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MARK TIARD 等: "Precision genome engineering in the chicken: The gap between science and market place", 《IWRAB-Ⅱ》, pages 1 - 21 *
T.M. SHAFEY等: "Effects of eggshell pigmentation and egg size on the spectral properties and characteristics of eggshell of meat and layer breeder eggs", 《ASIAN-AUSTRALASIAN JOURNAL OF ANIMAL SCIENCES》, vol. 15, no. 2, pages 297 - 302, XP055501008, DOI: 10.5713/ajas.2002.297 *
贾存灵等: "鸡性别决定机制的研究进展", 《中国家禽》, vol. 32, no. 12, pages 43 - 46 *

Also Published As

Publication number Publication date
PH12019502663A1 (en) 2020-09-28
AU2018274769B2 (en) 2024-05-02
UA128365C2 (uk) 2024-06-26
PL3629719T3 (pl) 2023-11-27
MA48783A (fr) 2020-04-08
NI201900121A (es) 2020-02-14
SG11201911686YA (en) 2020-01-30
US20200283849A1 (en) 2020-09-10
EP3629719A1 (en) 2020-04-08
CO2019014075A2 (es) 2020-04-01
ZA201907822B (en) 2024-07-31
CA3064825A1 (en) 2018-11-29
DOP2019000298A (es) 2020-09-30
CN110891418A (zh) 2020-03-17
EP3629719C0 (en) 2023-08-23
KR20200018486A (ko) 2020-02-19
CU20190094A7 (es) 2020-10-20
AU2024204892A1 (en) 2024-09-05
BR112019024642A2 (pt) 2020-06-23
CR20190569A (es) 2020-04-19
CN110891418B (zh) 2022-05-27
AU2018274769A1 (en) 2019-12-19
WO2018216022A1 (en) 2018-11-29
JP7179776B2 (ja) 2022-11-29
EP3629719B1 (en) 2023-08-23
IL270903A (en) 2020-01-30
ECSP19087406A (es) 2020-01-31
CL2019003414A1 (es) 2020-08-07
IL270903B1 (en) 2024-03-01
IL270903B2 (en) 2024-07-01
PE20200692A1 (es) 2020-06-11
EA201992582A1 (ru) 2020-05-19
JP2020520669A (ja) 2020-07-16

Similar Documents

Publication Publication Date Title
CN110891418B (zh) 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具
CN108486152B (zh) 转基因猪的培育方法和应用
KR20180099704A (ko) 부화되지 않은 알에서 조류 배아의 성별 결정 방법 및 이의 수단
US7145057B2 (en) Chimeric bird from embryonic stem cells
JP2014064584A (ja) トランスジェニックニワトリにおける外因性タンパク質の組織特異的発現
JP2004248505A (ja) 移植抗原の一部または全てを欠除したes細胞由来の未分化な体細胞融合細胞およびその製造
CN101861391A (zh) 通过翻译调控基因表达系统检测和调节细胞死亡的组合物和方法
WO2015199225A1 (ja) 家禽始原生殖細胞の遺伝子改変方法、遺伝子改変された家禽始原生殖細胞、遺伝子改変家禽の生産方法及び家禽卵
JP2021166551A (ja) 鳥類および卵
CA2620294A1 (en) Ocular gene therapy using avalanche-mediated transfection
US20200149063A1 (en) Methods for gender determination and selection of avian embryos in unhatched eggs
KR102427400B1 (ko) 알러지 주요유전자 Fel d 1 타켓 고양이 셀라인 구축
OA19682A (en) Methods for gender determination of avian embryos in unhatched eggs and means thereof.
US7332647B2 (en) Fish produced by nuclear transfer from cultured cells
CN110431227A (zh) 新型整合位点及其用途
KR101202996B1 (ko) 적색 형광단백질을 발현하는 형질전환 고양이 및 그 생산방법
JPWO2006075671A1 (ja) 所望の染色体を除去する方法およびそれを利用したテイラーメイド医療
JP2016529916A (ja) 蛍光タンパク質に特異的なt細胞受容体を有する遺伝子導入動物の作製方法
WO2003106651A2 (en) Spermatogonial cell line
WO2024201467A1 (en) Method for gender determination of chicken embryos

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40068784

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220802

WD01 Invention patent application deemed withdrawn after publication