CN114836475A

CN114836475A - 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

Info

Publication number: CN114836475A
Application number: CN202210492538.3A
Authority: CN
Inventors: D·奥芬
Original assignee: Eggxyt Ltd
Current assignee: Eggxyt Ltd
Priority date: 2017-05-25
Filing date: 2018-05-24
Publication date: 2022-08-02
Also published as: PH12019502663A1; AU2018274769B2; UA128365C2; PL3629719T3; MA48783A; NI201900121A; SG11201911686YA; US20200283849A1; EP3629719A1; CO2019014075A2; ZA201907822B; CA3064825A1; DOP2019000298A; CN110891418A; EP3629719C0; KR20200018486A; CU20190094A7; AU2024204892A1; BR112019024642A2; CR20190569A

Abstract

本发明涉及在禽类受试对象中确定与鉴定受精和性别的方法。更具体地，本发明提供了使用包含整合到至少一个性染色体Z或W中的至少一种报告基因(特别是RFP)的转基因禽类动物的非侵入性的方法。本发明的转基因禽类动物用于在未孵化的禽卵中确定性别和选择胚胎。

Description

对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

相关申请的交叉引用

本申请是申请号为CN201880042292.1的中国专利申请的分案申请。

发明领域

本发明涉及在禽类受试对象中进行性别确定和鉴定的方法。更具体而言，本发明提供用于对未孵化的禽类的卵中的胚胎进行性别确定和选择的非侵入性方法和转基因禽类动物。

背景技术

以下列出了被认为与本公开的主题相关的参考文献：

·WO 2010/103111

·WO 2014/0296707

·US 6244214

·06124456A2

·US2014069336A

·WO16005539

·WO 96/39505

·WO 97/49806

·Quansah,E.,Long,J.A.,Donovan,D.M.,Becker,S.C.,Telugu,B.,FosterFrey,J.A.,Urwin,N.(2014).Sperm-mediated transgenesis in chicken using aPiggyBac transposon system.Poultry Science Association Meeting Abstract.BARCPoster Day.

·Jinek,M.,Chylinski,K.,Fonfara,I.,Hauer,M.,Doudna,J.A.,&Charpentier,E.(2012).A programmable dual-RNA–guided DNAendonuclease in adaptive bacterialimmunity.Science,337(6096),816-821.

·Cong,L.,&Zhang,F.(2015).Genome engineering using CRISPR-Cas9system.Chromosomal Mutagenesis,197-217.

·US Patent 6,244,214.

·WO 2014/0296707.

·WO 06124456A2；

·WO16005539.

·Véron N.,Qu Z.,Kipen PA.,Hirst CE.,Marcelle C.(2015).CRISPRmediated somatic cell genome engineering in the chicken.Dev.Biol.407(1):68-74.doi:10.1016/j.ydbio.2015.08.007.Epub 2015年8月13日.

·CA2264450.

·Niu,Y.,B.Shen,Y.Cui,Y.Chen,J.Wang等人,(2014).Generation ofgenemodified cynomolgus monkey via cas9/rna-mediated gene targeting in one-cell embryos.Cell,156(4):836–843.

·Hwang,W.Y.,Y.Fu,D.Reyon,M.L.Maeder,S.Q.Tsai等人,(2013).Efficientgenome editing in zebrafish using a CRISPR-Cas system.Nat.Biotechnol.31(3):227–229.

·Nadège,V.,Q.Zhengdong,P.A.S.Kipen,C.E.Hirst,M.Christophe等人,(2015).CRISPR mediated somatic cell genome engineering in thechicken.Dev.Biol.407(1):68–74.

·Bai,Y.,L.He,P.Li,K.Xu,S.Shao等人,(2016).Efficient genome editing inchicken DF-1cells using the CRISPR/Cas9 system.G3(Bethesda)pii:g3.116.027706.

·Doran T.等人,(2016).Sex selection in layer chickens.ASAP AnimalProduction,Adelaide.

·Tizard M.and Doran T.(2014).Precision genome engineering in thechicken:Th gap between science and market place.在IWRAB-II上的演讲,巴西利亚.

本文对上述参考文献的引用不应被推断为意味着它们以任何方式与当前公开的主题的可专利性相关。

本发明的背景

在食品工业中，每天通过窒息或绞碎剔除数十亿只鸡。雄性被终结，因为它们无法用于产卵或用作肉类培育，并且弱的或不健康的雌性也被终结。出于伦理和经济方面的考虑，非常需要在孵化之前进行卵内或胚胎性别确定的方法。

具体而言，目视鉴定家禽的受精卵对于以下方面是重要的：去除未受精卵以节约孵化成本(通过防止孵化未受精卵)，以及降低这些易污染的未受精卵继续与受精卵一起孵化的生物安全风险。

目视鉴定当在未孵化卵内时处于胚胎早期的卵的生育力(fertility)包括外部光源验卵，并且可能很难，在早期胚胎阶段几乎不可能。一个更大的挑战是鉴定胚胎的性别，目前尚无可用的方法来区分发现受精的未孵化卵中的雄性和雌性。然而，在早期胚胎阶段鉴定生育力以及确定家禽的性别对于养禽业、科学研究和保护而言至关重要。通过形态特征确定幼鸟的性别对大多数物种来说极具有挑战性。性别可以通过个体排泄孔性别鉴定来确定，其涉及手动挤出雏鸡的粪便，这样轻微地打开雏鸡的肛门排泄孔，从而允许查看雏鸡是否具有小的“凸起”，具有凸起将表明鸡是雄性。然而，该方法代表了鸟类伤害和性别确定错误的高风险，并且需要受过训练的人员手动进行繁琐的工作。

排泄孔性别鉴定或雏鸡性别鉴定是区分雏鸡和其它幼体的性别的方法，通常由被称为雏鸡性别鉴别师或小鸡性别鉴别师的受过培训的人进行。雏鸡的性别鉴定主要是由大型商业孵化场实行，他们必须了解两性之间的差异，以便将它们分成不同的性别群体，并将其纳入不同的计划，其中包括培养所需要的群体生长而淘汰不需要的不满足商业需求的群体。例如，从来自商业饲养线的产卵者的卵孵化出的雄性。该雄性不会有良好的肉产量，并且不会产卵；因此它会在性别鉴定后被剔除。性别鉴定后，相关的性别将继续其生涯，以用于其目的，而其它性别或其大部分由于与产卵无关而将在孵化后几天内被淘汰。

在产卵的农场中，雄鸡是不受欢迎的，并且性别不合需要的雏鸡几乎立即被杀死以降低饲养者的成本。将雏鸡沿着传送带移动，其中雏鸡性别鉴定师将雄性分出，并将它们扔进一个滑槽通常在绞肉机中被活着绞碎。

在其孵化之前鉴定和确定卵的生育力和卵中胚胎的性别，可以消除未受精卵和卵中不想要的胚胎类型，从而极大地降低孵化成本(这包括能源和效率成本以及空气污染和能源消耗)。此外，雏鸡的痛苦将会停止，并且防止淘汰导致的污染。另外，自动化的性别鉴定装置将通过消除对雏鸡性别鉴定师的需求来降低卵生产成本，同时减少所需孵化场的规模，因为在早期阶段，会从工艺中减少50％的鸡卵，从而减少孵化这些卵的费用，并减少之后对任何复杂的杀灭程序的费用。

在用于饲养、产卵或肉类生产的所有商业类型的鸟类中，都需要确定生育力和胚胎的性别。在下述方面有很大的经济回报：节能，减少生物安全风险，垃圾处理，性别鉴定劳动力成本和性别鉴定错误，剔除成本和处置以及动物福利。

WO 2010/103111公开了一种侵入性方法，其包括一系列步骤，其中包括向卵中引入经标记的抗体，所述经标记的抗体特别设计用于匹配胚胎上的性别特异性抗原。

WO 2014/0296707公开了设计用作定量或评价注射到鸟卵中的接种效率的生物标志物的发光组合物。在该公开内容中没有公开甚至暗示性别确定。美国专利6244214公开了卵内注射设备和检测方法。

WO 06124456A2公开了通过确定来自禽卵的胚液(例如，尿囊液或血液)样品中雌激素类固醇化合物的存在来进行对禽类胚胎进行卵内性别确定的侵入性方法。利用荧光显微镜通过竞争性免疫测定法测量从所述禽类卵获得的样品中的分析物来确定化合物的存在。

还公开了光谱方法，其中US2014069336A基于筛选禽类胚胎羽毛颜色(预孵化)并基于羽毛颜色确定禽类胚胎的性别，或者WO16005539公开了对入射光信号获得壳特异性光谱响应的装置。

针对卵内性别问题的其它遗传方法包括对从受精卵获得的DNA样品进行DNA测序以检测位于鸟类的Z和W染色体上的两个特定基因(WO 96/39505)，或使用与雌性W染色体的特异性序列杂交的寡核苷酸探针(WO 97/49806)。这些方法是侵入性的，因此未提供安全策略。

成簇的规则间隔的短回文重复(CRISPR)/CRISPR相关(Cas)系统是现有技术的基因编辑系统，允许简单的构建体设计，成功率高(M.Jinek,2012)。

Niu等(2014)将向导RNA(gRNA)和Cas9 RNA注入猴卵母细胞以修饰三个靶基因，并且Hwang等(2013)修改了斑马鱼胚胎中的drd3和gsk3b基因以获得双基因座突变体。Cong和Zhang(2015)修改了CRISPR系统以编辑活细胞中的任何基因。

Veron及其同事(2015年)证明，通过针对PAX7转录因子的CRISPR gRNA质粒的电穿孔而修饰鸡胚中体细胞的表达水平(Nadège等2015)，Bai和同事编辑了PPAR-g、ATP合成酶ε亚基(ATP5E)。

Quansah,E.等公开了使用PiggyBac转座子系统在鸡中进行精子介导的转基因。具体而言，他们公开了aGFP质粒和Lipofectamine LTXTM 9LPX)组合对鸡精子的生活力、运动性或生育力没有影响。

CA2264450公开了多能细胞，该多能细胞包含编码荧光蛋白标记的核酸序列，该核酸序列选择性地整合入细胞胚胎的异源性染色体中以及使用该多能细胞产生的转基因动物，以及此类细胞、胚胎和动物的用途。该公开物特别涉及哺乳动物细胞中的GFP。

Doran T.等在ASAP Animal Production 2016(阿德莱德)一般性地描述了通过在性染色体上添加生物标志物GFP报告基因，在孵化前将雄性和雌性区分开的策略。2014年在巴西利亚IWRAB-II的演讲中也描述了使用CRISPR技术将GFP报告基因整合到雏鸡的性染色体中。但是，正如该一般性出版物所公开的那样，由于卵的自发荧光作用，通过将卵暴露在紫外光下，在卵内可以看到标记的染色体，预期无可检测信号。

因此，目前没有可用的在孵化雏鸡之前的卵的阶段进行性别鉴定的有效和非侵入性方法。所以，长期以来需要一种能够对未孵化卵中的胚胎进行准确和安全的性别鉴定的方法。

发明内容

本发明的第一方面涉及一种对未孵化卵(特别是受精的未孵化卵)中的禽类或者禽类胚胎进行性别确定的方法。在一些具体实施方案中，所述方法可以包括以下步骤：

首先，在步骤(a)中，提供或获得至少一个转基因禽类受试对象或动物，其包含整合到性别染色体Z和W中至少一者中的至少一个位置或部位(本文也称为基因座)上的至少一种外源报告基因。因此，在第二步骤(b)中，从所述转基因禽类受试对象或其任何细胞获得至少一个受精卵。

下一步骤(c)包括确定在所述卵中是否检测到至少一种可检测信号。在更具体的实施方案中，检测到至少一种可检测信号表明所述至少一种报告基因的表达，从而表明在禽类胚胎中存在W染色体或Z染色体。在一些具体的实施方案中，整合的报告基因可以编码红色荧光蛋白(RFP)。

在第二方面，本发明涉及一种禽类转基因动物，在其至少一个细胞中包含至少一种外源报告基因，所述外源报告基因整合在性别染色体Z和W中的至少一者中的至少一个位置或部位处。在一些实施方案中，整合的报告基因可以编码RFP。

在又一方面，本发明涉及一种细胞，其包含至少一种外源报告基因，所述外源报告基因整合在性别染色体Z和W中的至少一者中的至少一个位置或基因座处。

在另又一方面，本发明提供一种试剂盒，其包含：

(a)至少一种Cas9蛋白或其任何片段或衍生物，或至少一种第一核酸序列，所述第一核酸序列包含编码所述至少一种Cas9蛋白的至少一种核酸序列；和编码至少一种向导RNA(gRNA)的至少一种核酸序列，所述向导RNA靶向位于所述性别染色体Z或W中的原间隔序列(protospacer)；和(b)至少一种第二核酸序列，其包含至少一种所述报告基因。

更进一步，本发明提供了一种用于确定和检测未孵化卵中的受精(fertilization)的方法。更具体地，该方法包括以下步骤：首先，在步骤(a)中，提供或获得至少一个转基因禽类受试对象或动物，该受试对象或动物包含整合到两个性别染色体Z和W(雌性受试对象的情况)中的至少一者中或整合到两个性别染色体Z中的至少一者中(雄性受试对象的情况)的至少一个位置或部位的至少一种外源报告基因。在第二步骤(b)中，从转基因禽类受试动物或其任何细胞中获得至少一个受精卵。下一步骤(c)涉及确定在卵中是否检测到至少一种可检测信号。在更具体的实施方案中，至少一种可检测信号的检测表明所述至少一种报告基因的表达，从而表明在所述禽类胚胎中标记的母本W染色体或Z染色体(在雌性的情况下，或标记的父系Z染色体)的存在。

通过以下附图，本发明的这些和其他实施方案将变得显而易见。

附图说明

为了更好地理解本文公开的主题并举例说明如何在实践中进行实施，现在将仅通过非限制性示例的方式，参照附图来描述实施例，其中：

图1A-1B。评估卵荧光的完整设置

图1A示出了本发明的方法用于卵内性别确定的装置的照片。完整的设置包括一个激光源(h)，一个激光源支架(g)，一个卵支架(e)，一个卵(f)，一个透镜(d)，一个滤光器(c)，一个检测器支架(b)和一个检测器(a)。将不同的组成部分置于一个固体支持物(i)上。

图1B示出了图1A所示的本发明的装置的示意图。该设备包括一个激光源(h)，一个激光源支架(g)，一个卵支架(e)，一个卵(f)，一个透镜(d)，一个滤光器(c)，一个检测器支架(b)和一个检测器(a)。将不同的组成部分置于固体支持物(i)上。

图2。使用具有或不具有荧光素的蓝色激光(473nm)的荧光强度

当一个完整的卵在具有或不具有100μM或1mM荧光素(fl)的情况下经蓝色激光照射时，检测器上接收到的荧光强度[Pout]，该强度表示为光源强度[Pin]的函数。

图3。使用具有或不具有罗丹明的绿色激光(532nm)的荧光强度

当一个完整的卵在具有或不具有罗丹明的情况下经绿色激光照射时，检测器上接收到的荧光强度[Pout]，该强度表示为光源强度[Pin]的函数。

图4。使用具有或不具有dir的绿色激光(532nm)的荧光强度

当一个完整的卵在具有或不具有dir的情况下经绿色激光照射时，检测器上接收到的荧光强度[Pout]，该强度表示为光源强度[Pin]的函数。

图5。使用具有或不具有dir的红色激光(632.8nm)的荧光强度

当一个完整的卵在具有或不具有dir的情况下经红色激光照射时，检测器上接收到的荧光强度[Pout]，该强度表示为光源强度[Pin]的函数。

图6。表达GFP的细胞

该图提供了用表达GFP的GFP载体转染的荧光信号HEK细胞。

图7。表达RFP的细胞

该图提供了用表达RFP的RFP载体转染的荧光信号HEK细胞。

图8。对照测量

使用绿色激光和红色滤光片在卵的不同位置的荧光强度。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。

图9。RFP测量

使用绿色激光和红色滤光片在注射了不同浓度的RFP表达细胞的卵的荧光强度的测量。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。

图10。RFP角度

使用绿色激光和红色滤光片在确定的最佳卵位置上激发卵的RFP荧光强度测量。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。

图11A-11B。具有PBS或甘油的RFP表达细胞

图中显示了对注射PBS或甘油的不同浓度的RFP表达细胞注射的卵使用绿色激光的荧光强度。

图11A显示了在PBS中含有不同浓度RFP表达细胞的卵的荧光强度。图11B显示了甘油中含有不同浓度的RFP表达细胞的卵的荧光强度。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。

图12。具有PBS或甘油的GFP表达细胞

图中显示了对注射了30,000个GFP表达细胞并注入PBS或甘油的卵使用蓝色激光的荧光强度。检测器上接收到的荧光强度[Pout]表示为光源强度[Pin]的函数。

图13。RFP与GFP

图显示了来自GFP表达细胞或RFP表达细胞的荧光蛋白强度与自发荧光强度之间的比率。

描述荧光和自发荧光之比的参数R表示为光源强度[Pin]的函数。

图14。将RFP整合入雌性Z染色体

图显示了使用具有鸡ChZ左右臂(Left&Right arms)和CMV-hspCas9-H1-gRNA的pDsRed的RFP转染的雌性鸡细胞系。

图15A-15B。进入雌性鸡细胞系Z染色体的整合序列的示意图

粗体序列代表Z染色体的侧接的左右臂，分别由SEQ ID NO：60和SEQ ID NO：61表示。用斜体标记的序列(1017bp)代表左臂，如SEQ ID NO：62所示；带下划线的序列(629bp)代表CMV增强子、启动子和MCS，如SEQ ID NO：63所示；粗斜体序列(714bp)代表dsRED2报告基因，如SEQ ID NO：64所示；无颜色的3332bp的序列代表dsRED质粒内容。带下划线的斜体序列(1026bp)代表右臂，如SEQ ID NO：65所示。序列的左侧部分由SEQ ID NO.66表示(载体序列的所有5'部分，如图15A所示)，序列的右侧部分由SEQ ID NO.67表示(载体序列的所有3'部分，如图15B所示)。

具体实施方式

每天数十亿只雄性小鸡通过窒息或磨碎而被终结，因为它们不能用于产卵或培育用作肉类。在孵化前确定胚胎的性别的能力在伦理和经济上都是非常重要的。在鸡中，性染色体的遗传构成是雄性为ZZ，雌性为ZW。这意味着W染色体决定了雌性性别。这与人类不同，在人类中来自父系的Y决定了男性性别。

本发明提供一种用于性别确定的非侵入性有效方法，其使用整合在转基因禽类受试对象的性别特异性染色体中的报告基因。该报告基因在未孵化卵的胚胎中的表达清楚且准确地鉴定了所述胚胎的性别。

因此，本发明的第一方面涉及一种性别确定以及可选地选择未孵化卵(特别是受精的未孵化卵)中的禽类或禽类胚胎的方法。在一些具体实施方案中，该方法可以包括以下步骤：

第一，在步骤(a)中，提供或获得至少一个转基因禽类受试对象或动物，其包含整合在性别染色体Z和W中至少之一中的至少一个位置或部位(position and location)处的至少一种外源报告基因。在第二步骤(b)中，从所述转基因禽类受试对象、特别是动物或其任何细胞获得至少一个受精卵。

下一步骤(c)包括确定在所述卵中是否检测到至少一种可检测信号。在更具体的实施方案中，检测到至少一种可检测信号表明所述至少一种报告基因的表达，从而表明在所述禽类胚胎中存在所述W染色体或Z染色体。因此，在报告基因已整合在雌性转基因禽类的Z染色体中的情况下，在所检查的卵中鉴定出可检测信号表明包含于其中的该胚胎具有其内整合有报告基因的母本Z染色体，并且胚胎由此被鉴定为雄性。在又一些其他实施方案中，在报告基因已整合在雌性转基因禽类的W染色体中的情况下，在所检查的卵中鉴定出可检测信号表明该包含于其中的胚胎携带母本W染色体并因此确定为雌性，从而提供该胚胎的性别确定。

应该理解，如下文中更详细描述的，本发明提供的转基因禽类可以是雌性或雄性。在另外一些特定的实施方案中，转基因动物可以是具有两种不同的性别染色体(特别是异配体(heterogametic subject))的性别。在一些特定的实施方案中，异配动物可以是雌性。在更具体的实施方案中，在转基因禽类受试对象是雌性时，通过本发明的方法鉴定的卵由本发明提供的转基因雌性禽类产下。在更具体的实施方案中，转基因雌性可以通过转基因雄性或在一些其他实施方案中通过野生型禽类雄性受精。更进一步，受精可以通过交配或通过将转基因禽类雌性用获自转基因或野生型禽类雄性的精子授精而发生。在又一些其它实施方案中，在转基因禽类是雄性时，通过本发明的方法鉴定的卵可以由与本发明提供的转基因雄性交配的野生型或转基因雌性产下，或者通过其任何细胞(具体而言，包含整合在其性别染色体中的本发明的外源报告基因的精子细胞)受精。

因此，本发明提供了用于检测未孵化的受精卵内禽类胚胎的性别的方法。应该意识到，本发明的方法可适用于禽类胚胎的任何胚胎期的未孵化卵。

应该注意的是，本文所用的“禽类胚胎的胚胎发育阶段或步骤”是指：第1天的阶段，其中胚盘处于囊胚阶段并且分裂腔呈现暗环的形状；第2天的阶段，其中第一凹槽出现在囊胚的中心并且出现卵黄膜；第3天的阶段，其中血液循环开始，可以辨别头部和躯干，以及脑和开始搏动的心脏结构；第4天的阶段，其中羊膜腔正在发育以围绕胚胎并出现尿囊；第5天的阶段，其中胚胎呈C形并且四肢延伸；第6天的阶段，其中上肢和下肢的手指变得不同；第7天的阶段，其中颈部清楚地将头部与身体分开，形成喙并且大脑逐渐进入头部区域；第8天的阶段，其中容易看见眼睛色素沉着，能区分翅膀和腿并且外耳道打开；第9天的阶段，其中出现爪，并且第一羽囊出芽；第10天的阶段，其中存在鼻孔，眼睑长出并且出现卵齿；第11天的阶段，其中眼睑孔具有椭圆形并且胚胎具有鸡的形态；第12天的阶段，其中羽囊围绕外耳道并覆盖上眼睑，而下眼睑覆盖角膜的大部分；第13天的阶段，其中尿囊变成绒毛膜尿囊膜，而爪和腿鳞变得明显；第14-16天的阶段，其中全身生长迅速，卵黄收缩加速，卵白逐渐消失；第17天的阶段，其中肾系统产生尿酸盐，喙点指向气囊并且卵白被完全吸收；第18天的阶段，其中卵黄内化和羊水量减少；第19天的阶段，其中卵黄质再吸收加速并且喙准备刺穿内壳膜；在第20天的阶段中，卵黄被完全再吸收，脐带闭合，鸡刺穿内壳膜，呼吸进入气囊并准备孵化；第21天的阶段，其中鸡通过其卵齿以圆形方式刺穿卵壳，在12到18小时内自己从卵壳中脱离出来，并使其下垂干燥。

更具体而言，本发明的方法可适用于在卵内在胚胎发育过程的每个阶段在卵内确定禽类胚胎的性别。更具体而言，从第1天、第2天、第3天、第4天、第5天、第6天、第7天、第8天、第9天、第10天、第11天、第12天、从第13天、从第14天、从第15天、从第16天、从第17天、从第18天、从第19天、从第20天和从第21天起。更具体而言，本发明的方法可适用于胚胎性别的早期检测，特别是从第1天至第10天。在一些实施方案中，本发明的方法可以使得能够在胚胎发育的第1天确定胚胎的性别。在一些进一步的实施方案中，本发明的方法可以使得能够在第2天确定胚胎的性别。在一些进一步的实施方案中，本发明的方法可以使得能够在第3天确定胚胎的性别。在进一步的实施方案中，本发明的方法可以使得能够在第4天确定胚胎的性别。在又一些其他实施方案中，本发明的方法可以使得能够在第5天确定胚胎的性别。在进一步的实施方案中，本发明的方法可以使得能够在第6天确定胚胎的性别。在进一步的实施方案中，本发明的方法可以使得能够在第7天确定胚胎的性别，在进一步的实施方案中，本发明的方法可以使得能够在第8天确定胚胎的性别。在一些其他实施方案中，本发明的方法可以使得能够在第9天确定胚胎的性别。在又一些其他实施方案中，本发明的方法可以使得能够在第10天确定胚胎的性别。在某些特定的情况下，本发明的方法可以使得能够在胚胎发育的第1至5天之间确定胚胎的性别。

如上所述，本发明的方法可适用于未孵化的受精卵。术语“受精卵”在本文中指在两周内与公鸡交配过的母鸡所产的卵，其允许雄性精子沉积到雌性输卵管漏斗中并且在卵子从卵巢释放时发生受精事件。如本文所用，“未孵化的卵”涉及在结构上完整(而非破碎)且壳内含胚胎的卵(本文中也称为可育卵)。

本发明的方法基于确定由报告基因形成的可检测信号，所述报告基因被整合于产下所检查的卵的转基因禽类雌性或雄性的特定基因座。

如本文所用的“将外来或外源DNA/基因整合在染色体中”，在本文中是指生物体染色体的核苷酸序列的永久修饰。该修饰在细胞分裂过程中进一步传递，并且如果发生在生殖细胞系中，它也会传递给后代。在这种情况下，整合的报告基因可以转移到未孵化卵内的胚胎中。如本文所用的术语“外源”是指从生物体外部利用特异性操作的载体、病毒或任何其它载质(vehicle)通过转化或转染引入生物体内。根据某些实施方案的整合的外源基因可以是报告基因。术语“报告基因”是指编码多肽的基因，所述多肽表达可以以多种已知测定检测到，并且其中所检测的信号的水平指示所述报告基因的存在。

如上所述，外源报告基因可以整合在禽类性别染色体Z或W中。如本文所用的禽类“性别染色体Z或W”是指鸡中决定后代的性别的染色体系统，其中雄性是同配性别(ZZ)，而雌性是异配性别(ZW)。卵子中W染色体的存在决定了后代的性别，而已知Z染色体更大，并拥有更多的基因。

本发明的方法基于可检测信号的检测，该可检测信号指示并反映了报告基因的存在并由此指示并反映了特定的性别染色体的存在。“可检测信号”在下文中是指通过观察或仪器可察觉的改变。不旨在限制，信号可以直接检测。在一些实施方案中，可检测的响应是光学信号。

应该意识到，在一些具体实施方案中，由本发明的方法提供的至少一个转基因禽类受试对象可以包含至少两种不同的报告基因，每个报告基因可以整合在性别染色体Z或W的至少一个位置或部位。在至少两个不同的报告基因的情况下，在一些实施例中，每个性别染色体可以被不同地标记。形成的可检测信号的评估可以指示所检查胚胎的性别。

在又一些具体实施方案中，本发明的转基因禽类体内包含的报告基因可以是至少一种荧光报告基因。因此，在一些实施方案中，所表达的多肽是荧光蛋白，因此该测定测量激发时发出的光的水平，特别是用合适的光源。

术语“荧光”是指已被照明、吸收光或其他电磁辐射的物质所发出的光。它是一种发光形式，即不是由热量产生的物质发出的光。

“荧光蛋白”是指当暴露于光时显示出明亮的荧光的蛋白。荧光蛋白对于照明激发强度的峰具有特定的波长，并且对于荧光发射强度的峰具有特定的波长。激发是指荧光蛋白的照射。在一些实施例中，激发可以由激光提供。在又一些实施例中，可以在使用适当的滤光器时检测到信号。

在某些实施方案中，荧光报告基因可以是红色荧光蛋白(RFP)，青色荧光蛋白(CFP)，黄色荧光蛋白(YFP)和包括蓝色荧光蛋白(BFP)的自身荧光蛋白。

应当注意，在一些其他具体实施方案中，任何荧光蛋白均可适用于本发明。更具体地，原始维多利亚水母绿色荧光蛋白中的诱变努力已经产生了颜色范围从蓝色到黄色的新的荧光探针，其可以根据本发明的一些实施方案应用。从海葵Discosoma striata和属于珊瑚纲类的造礁珊瑚中开发出来的较长波长的荧光蛋白在橙色和红色光谱区域发射。还开发其他物种以产生具有青色、绿色、黄色、橙色和深红色荧光发射的类似蛋白质。

在一些实施方案中，可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是黄色荧光蛋白。更具体地，该黄色荧光蛋白家族开始于绿色荧光蛋白的晶体结构显示苏氨酸残基203(Thr203)在发色团附近之后。引入该残基突变为酪氨酸以稳定发色团的激发态偶极矩，并导致激发和发射光谱向更长的波长偏移20纳米。进一步的改进导致增强型黄色荧光蛋白(EYFP)的开发，它是最亮且使用最广泛的荧光蛋白之一。

相对于EYFP，黄色荧光蛋白的柠檬色变体非常亮，并且也可应用于本发明的一些实施方案中。另一种名为Venus的衍生物是成熟最快、也是迄今为止开发的最亮的黄色变体之一。最初从印度洋和太平洋原生的Zoanthus物种克隆的珊瑚蛋白ZsYellow1产生纯色黄光发射，也可用于本发明。

在另一些实施方案中，可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是蓝色荧光蛋白。绿色荧光蛋白的蓝色和青色变体来自天然荧光团中位置66处酪氨酸残基(Tyr66)的直接修饰。该氨基酸向组氨酸的转化导致最大波长为450纳米的蓝色发射，而向色胺的转化导致在480纳米附近出现主荧光峰以及在500纳米附近出现肩峰。更具体地说，在已引入的改进的青色荧光蛋白中，AmCyan1和称为Cerulean的增强型青色变体显示出最大的希望。源自造礁珊瑚Ammonia majano的AmCyan1荧光蛋白变体也可适用于本发明。在一些特定的实施方案中，可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是红色荧光蛋白。第一个被广泛利用的珊瑚来源的荧光蛋白来自Discosoma striata，通常被称为DsRed。一旦完全成熟，DsRed的荧光发射光谱将在583纳米处出现一个峰，而激发光谱在558纳米处出现一个主峰，在500纳米附近出现一个次峰。更进一步，可适用于本发明的其他变体包括但不限于DsRed2、DsRed-Express和RedStar。已从造礁珊瑚生物中分离出了几种显示出可观前景的其他红色荧光蛋白。可以在本发明中应用的这些蛋白质之一可以是HcRed1，其是从Heteractis crispa中分离出来的，并且现在可以商购。HcRed1最初源自非荧光色蛋白，该蛋白通过诱变吸收红光以产生弱荧光专性二聚体，其最大吸收在588纳米，最大发射在618纳米。更进一步，在一些实施方案中，可适用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒的报告基因可以是任何荧光蛋白，条件是该蛋白不是GFP，并且在某些更特异性实施方案中不是野生型GFP。然而，在一些实施方案中，形成在555和585nm具有激发和发射最大值的红色发射光谱物质的GFP的数个突变体和变体也可适用于本发明。在又一些其他具体实施方案中，此类突变体或变体可包含丝氨酸65和/或天冬酰胺68残基。在又一些其他实施方案中，GFP的此类突变体或变体可包含F46L、V163A和1167V中至少之一的突变。在另一些实施方案中，该变体可以包含Ser65、Asn68、F46L、V163A和I167V的任何组合。

应当理解，在又一些其他实施方案中，可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是下文表1中公开的任何荧光蛋白。在另一些实施方案中，可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是表1中公开的任何荧光蛋白，条件是所述荧光蛋白不是野生型GFP。在另一些其他实施方案中，可用于本发明的方法、转基因禽类受试对象、构建体、细胞和试剂盒中的报告基因可以是表1中公开的任何荧光蛋白，条件是该报告基因不是表1公开的绿色荧光蛋白中的任何一种，更具体地讲，指EGFP、Emerald、Superfolder GFP、Azami Green、mWasabi、TagGFP、TurboGFP、AcGFP、ZsGreen、T-Sapphire中的任何一种。

表1：荧光蛋白：

如实施例1和2令人惊讶地显示的，本发明揭示的卵的自发荧光性质仅允许检测携带表达RFP的细胞的胚胎。

因此，在更具体的实施方案中，报告基因可以是红色荧光蛋白(RFP)。下文中，术语“红色荧光蛋白”或“RFP”是指发出橙色、红色和远红色荧光的荧光蛋白，该荧光蛋白已从珊瑚纲动物(珊瑚)和海葵及其任何变体中分离出来。RFP蛋白有两种主要类型，DsRed和Kaede。类DsRed的RFP衍生自Discosoma striata，包括但不限于mCherry、zFP538、mKO、mOrange、mRouge、E2-Crimson、mNeptune、TagRFP657、Keima、mKate、mStrawberry、mBanana、mHoneydew、niTangerine、mRaspberry、mPlum、mRFPmars和mRFPruby。另一方面，Kaede是在石质珊瑚Trachyphyllia geoffroyi中发现的天然荧光蛋白，在约400nm照射后，其发射波长不可逆地从绿色(518nm)变为红色(582nm)。Kaede家族成员包括例如EosFP、dendFP、mcavRFP和rfloRFP，分别发现于珊瑚Lobophyllia hemprichii、Dendronephthya、Monastrea cavernosa、以及Ricordea florida中。

应当理解，本文所述的任何RFP，本领域已知的任何来源，均可适用于本发明的方法、转基因动物、细胞、试剂盒和装置。

在又一些特定的实施方案中，可以由本发明的方法使用的RFP可以是在pDsRed1-N1中使用的RFP，其编码新的红色荧光蛋白[RFP；Matz,M.V.等,(1999)Nature Biotech.17:969–973]，该蛋白已针对哺乳动物细胞中的高表达进行了优化(最大激发光＝558nm；最大发射光＝583nm)。RFP是从印度洋海葵亲缘种Discosoma sp.中分离得到的。DsRed1的编码序列包含144个沉默碱基对的变化，这对应于在哺乳动物细胞中高表达的人密码子使用偏好。

在一些实施方案中，本发明的方法和试剂盒所使用的RFP可以由包含SEQ IDNO.20所示序列的核酸序列编码。在另外一些实施方案中，此类RFP可包含如SEQ ID NO.21所示的氨基酸序列，或其任何同源物、变体、突变体或衍生物。

在又一些替代的具体实施方案中，本发明使用的RFP可以是由GenBank：AF272711.1公开的核酸序列编码的RFP，其具有GenBank：AAG16242.1公开的氨基酸序列。在又一些其他具体实施方案中，本发明的方法和试剂盒使用的RFP可以由包含SEQ ID NO.22所示序列的核酸序列编码。在另外一些实施方案中，此类RFP可包含如SEQ ID NO.23所示的氨基酸序列，或其任何同源物、突变体或衍生物。应当注意，在一些实施方案中，本发明的方法使用的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说，在一些特定的实施方案中，通过本发明的方法提供的整合到转基因动物的性别染色体中的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是GFP。

更进一步，在一些特定和特定的实施方案中，当报告基因是RFP时，应注意在一些实施方案中，RFP的激发波长为约500-650nm，而发射波长可为约550-650nm。

在一些其他实施例中，通过本发明的方法检测可检测信号可以进一步包括使所述卵经受适当光源的步骤。在又一些实施方案中，将卵暴露于波长在约400至约650之间的合适光源中。在又一些实施例中，可以使用任何波长的光，条件是所述光源不是紫外线(UV)光(波长10-400nm)。

在一些具体的实施方案中，使所述卵经受光源的步骤是激发荧光蛋白。在一些特定实施例中，激发波长在约500nm与约650nm之间。在一些其他实施例中，激发波长为大约510、515、520、525、530、535、540、545、550、555、560、565、570、575、580、585、590、590、595、600、605、610、615、620、625、630、635、640nm。在一些更具体的实施例中，激发波长可以在大约515至大约555之间的范围内。在又一些其他实施例中，波长可以是532nm。在一些特定且非限制性的实施例中，光源可以由激光器提供。

如本文所用，术语“激光”是指通过辐射的受激发射而放大的任何频率的电磁辐射。激光还指通过称为受激发射的过程发射电磁辐射的设备。激光通常在空间上是相干的，这意味着该光要么以窄的低发散光束发射，要么可以借助光学组件(如透镜)转换成激光。

在一些其他实施例中，激光器可以是蓝色激光器或红色激光器。在更具体的实施例中，光源是绿色激光器。

在某些实施例中，激光器可以与滤光器一起使用。

如本文所用，术语“滤光器”是指“光学滤光器”，其对应于选择性地透射不同波长的光的装置，通常在光路上被实现为平板玻璃或塑料装置，其被染成块状或具有干涉涂层。

在一些实施例中，滤光器可以是在500nm以上透射的绿色滤光器，或者是在540nm和580nm之间透射的深绿色滤光器，或者是在590nm和650nm之间透射的红色滤光器，或者是在650nm以上或660nm以上透射的红色滤光器。

在一些特定实施例中，光源可以是波长为532nm的绿色激光器。在一些其他实施例中，这种激光器可以设置有在650nm以上透射的红色滤光片。

鸡种系从少数原始生殖细胞发育而来，从性腺外部位迁移到生殖生殖脊，同时经历了主动迁移和血液被动循环的阶段。PGC位于未产卵的未放置卵的表皮细胞中心，发育阶段称为X阶段。在孵育过程中，PGC向前迁移并积累在10HH阶段的胚芽新月形(大约孵化33-38小时)，被认为是血管内渗入的主要部位。之后，可以在阶段12HH至17HH(大约45至64小时的孵育)的循环中发现PGC，在阶段14HH(大约50-53小时的孵育)中达到峰值浓度。PGC在中胚层中性腺肛门附近的部位离开循环，最早在15HH阶段(孵化55-55小时)就可以发现。PGC通过沿背肠系膜的主动迁移到达生殖脊，并定居两个性腺，之后它们分化为精原细胞或卵原细胞。

胚胎位于卵黄囊的顶部。蛋黄在蛋中自由旋转，而胚胎始终面向蛋黄的上侧。在孵化过程中，卵的钝端(气囊所在的位置)朝上，偶尔卵会旋转90°。随着胚胎的发育，胚外组织的形成使胚胎从蛋壳中退缩，并且胚胎难以接近。

因此，在一些特定的实施例中，卵被暴露于所述光源。在又一些实施方案中，将卵放置在有利于胚胎在任何阶段暴露于光源的位置。在又一些实施方案中，在卵的阶段X处包含蛋黄的上表面的区域被光源激发。

在一些进一步的实施例中，使所述卵经受光源的所述步骤由系统、装置或设备提供，所述系统、设备或设备可以包括激光源、卵支架、透镜、滤光器、检测器支架和检测器。

如本文所使用的，术语“检测器”是指检测和/或测量光的任何类型的设备。在一些实施例中，应注意的是，可检测信号，具体而言是合适的荧光信号，可使用合适的荧光手段来检测。在一些实施例中，可由RFP报告基因形成的可检测信号可以由光敏装置例如改良的光学显微镜或电荷耦合器件(CCD)、高灵敏度光子检测器检测。

在又一些实施方案中，本发明的方法可以使用提供至少一个光源、至少一个检测器、至少一个滤光器和至少一个将卵放置在促进表达本发明的受体基因的细胞暴露于所述光源的保持臂的任何设备、装置或系统来执行。在一些特定且非限制性的实施例中，本发明的方法可以使用如图1所示的设备。在又一些实施例中，卵支架与透镜和/或透镜与检测器之间的距离可以在大约1至100cm之间的范围内，具体地，为1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95和100厘米之间的距离，特别是大约5到25厘米之间，更特别地为大约20厘米。

因此，应当理解，在一些实施例中，本发明的方法可以进一步包括提供例如如本文所述的用于确定在被检查的卵中是否存在可检测信号的系统或设备的步骤。具体地，一种设备或装置，其包括激光源、卵支架、透镜、滤光器、检测器支架和检测器。如上所述，在这种装置的一些实施例中，可以使用显示约532nm的激发波长的绿色激光源。在又一些其他实施例中，可以使用在650nm以上透射的滤光片，特别是红色滤光器。

在另外的实施方案中，通过本发明的方法提供的至少一种转基因禽类受试对象或动物可以是雌性禽类受试对象或动物。在更具体的实施方案中，在至少一种报告基因被整合到雌性染色体Z的至少一个位置中的情况下，对可检测信号的检测表明未孵化的卵中的胚胎是雄性的。更具体地，包含父本未标记的Z性别染色体并且进一步包含母本标记的Z染色体的胚胎，包含两个Z染色体，因此是雄性的。

在又一些进一步的实施方案中，通过本发明的方法提供的至少一种转基因禽类受试对象或动物可以是雌性禽类受试对象或动物。在更具体的实施方案中，当至少一种报告基因整合在雌性染色体W的至少一个位置中时，检测到可检测信号表明未孵化卵中的胚胎是雌性。更具体地，胚胎包含未标记的亲本Z性染色体，而标记的母本W染色体是包含雌性的WZ染色体的异配子胚胎。

在又一些进一步的实施方案中，通过本发明的方法提供的转基因动物可以是具有整合在其Z染色体中的报告基因的雄性受试对象。在这种情况下，在由这种转基因雄性或其任何精子受精的卵中确定的可检测信号，表明胚胎携带包含转基因报告基因的亲本Z染色体，因此是雄性。在更进一步的实施方案中，检测由转基因雄性禽类受精的转基因雌性禽类(均携带整合在其Z染色体中的本发明的报告基因)产下的卵中的可检测信号，在强烈信号的情况下，可以表明胚胎携带整合在其雌性和雄性Z染色体中的报告基因的两个拷贝。在信号不太强烈的情况下，例如，信号具有约50％的降低的强度，卵可能会被确定为雌性。

如前所述，本发明的方法涉及提供转基因禽类动物。转基因禽类动物的制备需要使用可能利用特定基因编辑化合物或组分的基因工程方法。在一些实施方案中，基因编辑组分的非限制性实例可包括核酸酶的使用。

在一些具体的实施方案中，适用于本发明方法的核酸酶可以是RNA引导的DNA结合蛋白核酸酶。

如本文所用，RNA引导的DNA结合蛋白核酸酶是被RNA分子引导至其切割位点(或可替代地，用于任何其他替代活性的位点)的核酸酶。该RNA分子称为向导RNA。

因此，在更具体的实施方案中，可以使用至少一种可编程工程化核酸酶(PEN)将所述至少一种报告基因整合在由本发明的方法提供的转基因禽类受试对象或动物的性别染色体中。如本文所用的术语“可编程工程化核酸酶(PEN)”是指切割特定DNA序列的合成型酶，其源自涉及双链DNA损伤的DNA修复的天然存在的核酸酶并且能够进行直接的基因组编辑。

在一些更具体的实施方案中，本发明的方法使用的PEN可以是成簇的规律间隔的短回文重复(CRISPR)的类别2或类别1系统中的任何一种。

成簇的规律间隔的短回文重复(CRISPR)II型系统是一种细菌免疫系统，其已被修改用于基因组工程化。

然而，应该意识到，本文也可以适用其它基因组工程化方法，例如锌指核酸酶(ZFN)或转录激活子样效应核酸酶(TALEN)，其依赖于使用可定制的DNA结合蛋白核酸酶，该核酸酶需要设计和产生特定的核酸酶-对，以用于每个基因组靶。

CRISPR-Cas系统分为两类。类别1系统使用多种Cas蛋白复合物降解外来核酸。类别2系统出于同一目的使用单个大Cas蛋白。更具体地，类别1可以分为I、III和IV型，类别2可以分为II、V和VI型。

如本文所用，也称为SPIDR(间隔序列散布直接重复序列)的CRISPR阵列构成最近描述的DNA基因座家族，其通常对特定细菌物种具有特异性。CRISPR阵列是首次在大肠杆菌中识别的独特类型的散布短序列重复序列(SSR)。在随后的几年中，在结核分枝杆菌(Mycobacterium tuberculosis)、地中海富盐菌(Haloferax mediterranei)、詹氏甲烷球菌(Methanocaldococcus jannaschii)、海栖热袍菌(Thermotoga maritima)和其它细菌和古细菌中发现了类似的CRISPR阵列。应该理解，本发明考虑使用任何已知的CRISPR系统，特别是本文公开的CRISPR系统。CRISPR-Cas系统在原核生物中进化，以通过靶向外来DNA或RNA来防止噬菌体攻击和不希望的质粒复制。CRISPR-Cas系统基于短同源DNA序列(存在于重复序列之间，称为间隔序列)靶向DNA分子。这些间隔序列指导CRISPR相关(Cas)蛋白与被称为原间隔序列(proto-spacer)的外来DNA内的序列匹配(和/或互补)，原间隔序列(proto-spacer)随后被切割。间隔序列可以合理设计以靶向任何DNA序列。而且，该识别元件可以被分开设计以识别和靶向任何期望的目标。对于CRISPR系统，如本领域技术人员将认识到的，天然存在的CRISPR基因座的结构包括通常被称为“重复序列”的许多短重复序列。重复序列成簇出现，并且通常由被称为“间隔序列”的独特间插序列间隔开。通常，CRISPR重复序列长度在约24至47个碱基对(bp)之间变化并且部分回文。间隔序列位于两个重复序列之间，并且通常每个间隔序列具有长度为约20以下至72以上bp的独特序列。因此，在某些实施方案中，在编码本发明方法和试剂盒中的至少一种gRNA的序列中使用的CRISPR间隔序列可以各自包含10至75个核苷酸(nt)。更具体而言，包含约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75或更多个核苷酸(nt)。在一些具体实施方案中，间隔序列包含约20至25个核苷酸，更具体而言约20个核碱基。

除了至少一个重复序列和至少一个间隔序列之外，CRISPR基因座还包括前导序列，以及可选的编码至少一个tracrRNA的序列。前导序列通常是与第一重复的5'末端直接连接的长达550bp的富含AT的序列。

在一些具体的实施方案中，本发明所使用的PEN可以是CRISPR类别2系统。在又一些进一步的具体的实施方案中，该类别2系统可以是CRISPR II型系统。

更具体而言，描述了三种主要类型的CRISPR-Cas系统：I型、II型和III型。

II型CRISPR-Cas系统包括“HNH”型系统(链球菌样；也被称为Nmeni亚型，用于脑膜炎奈瑟氏菌(Neisseria meningitidis)血清群A品系Z2491或CASS4)，其中除了普遍存在的Cas1和Cas2外，Cas9(一种单一的非常大的蛋白质)似乎足以产生crRNA并切割靶DNA。Cas9含有至少两个核酸酶结构域，靠近氨基末端的RuvC样核酸酶结构域和在蛋白质中间的HNH(或McrA样)核酸酶结构域，但是这些结构域的功能仍有待阐明。然而，由于HNH核酸酶结构域在限制性酶中是丰富的并且具有负责靶标切割的内切核酸酶活性。

II型系统通过不寻常的机制切割pre-crRNA，该机制涉及tracrRNA和pre-crRNA中一部分重复之间的双链体形成；pre-crRNA加工途径中的第一次切割随后发生在该重复区域中。更进一步，应该注意的是，II型系统包含cas9、cas1、cas2、csn2和cas4基因中的至少一个。应该意识到，任何II型的CRISPR-Cas系统可以适用于本发明，特别是II-A或B型中的任何一种。

因此，在又一些进一步的替代性实施方案中，本发明的方法和试剂盒中使用的至少一种cas基因可以是II型的CRISPR系统(II-A型或II-B型)的至少一种cas基因。在更具体的实施方案中，本发明的方法和试剂盒所使用的至少一种II型CRISPR系统的cas基因可以是cas9基因。应该意识到，这种系统可以还包含cas1、cas2、csn2和cas4基因中的至少一个。

双链DNA(dsDNA)被Cas9切割是“II型CRISPR-Cas”免疫系统的标志。CRISPR相关蛋白Cas9是RNA导向的DNA内切核酸酶，其使用RNA：DNA互补性来鉴定序列特异性双链DNA(dsDNA)切割的靶位点，产生HDR所需的双链制动(DSB)，这引起报告基因在特定的靶序列(例如在禽类性别染色体W和Z内的特定靶标)中的整合。靶向DNA序列由CRISPR阵列指定，CRISPR阵列是由短回文重复序列分隔的一系列约30至40bp间隔序列。该阵列被转录为pre-crRNA，并被加工成与Cas蛋白复合物相结合的较短的crRNA，从而靶向被称为原间隔序列的互补DNA序列。这些原间隔序列靶标还必须具有额外的邻近序列，其被称为靶标识别所需的原间隔序列邻接基序(PAM)。结合之后，Cas蛋白复合物充当DNA内切核酸酶以切割靶标上的两条链，随后通过外切核酸酶活性发生DNA降解。

如本文所用的CRISPR II型系统需要包含两个基本组分：“向导”RNA(gRNA)和非特异性CRISPR相关内切核酸酶(Cas9)。gRNA是由Cas9结合所需的“支架”序列和定义待修饰的基因组靶标的约20个核苷酸长的“间隔”或“靶向”序列组成的短合成RNA。因此，可以通过简单地改变gRNA中存在的靶向序列来改变Cas9的基因组靶标。如本文所用的向导RNA(gRNA)是指内源性细菌crRNA和tracrRNA的合成融合体，为Cas9核酸酶提供靶向特异性和支架/结合能力。其也被称为“单一向导RNA(single guide RNA)”或“sgRNA”。CRISPR最初用于“敲除”各种细胞类型和生物体中的靶基因，但对Cas9酶的修饰已经将CRISPR的应用扩展到“敲入”靶基因，选择性激活或抑制靶基因，纯化DNA的特定区域，甚至使用荧光显微镜观察活细胞中的DNA图像。此外，产生gRNA的容易程度使得CRISPR成为最可扩展的基因组编辑技术之一，并且最近已被用于全基因组筛选。

其中将整合本发明的报告基因的待编辑基因组内的靶标，特别是性别染色体Z或W内的特定靶标基因座，应该紧邻原间隔序列邻接基序(Protospacer Adjacent Motif，PAM)的上游存在。

PAM序列对于靶标结合是绝对必需的，并且确切的序列取决于Cas9的物种(对于酿脓链球菌(Streptococcus pyogenes)Cas9而言为5'GNG 3')。在某些实施方案中，来自酿脓链球菌的Cas9用于本发明的方法和试剂盒中。尽管如此，应该意识到，任何已知的Cas9都可以适用。本发明中有用的Cas9的非限制性实例包括但不限于：酿脓链球菌(SP)，本文也表示为SpCas9；金黄色葡萄球菌(Staphylococcus aureus，SA)，本文也表示为SaCas9；脑膜炎奈瑟氏菌(Neisseria meningitidis，NM)，本文也表示为NmCas9；嗜热链球菌(Streptococcusthermophilus，ST)，本文也表示为StCas9；和齿垢密螺旋体(Treponemadenticola，TD)，本文也表示为TdCas9。在一些具体实施方案中，酿脓链球菌M1GAS的Cas9，特别是蛋白质ID：AAK33936.1的Cas9可以适用于本发明的方法和试剂盒中。在一些实施方案中，Cas9蛋白可由如SEQ ID NO.24所示的核酸序列编码。在进一步的具体和非限制性实施方案中，Cas9蛋白可以包含如SEQ ID NO.25所示的氨基酸序列，或其任何衍生物，突变体或变体。一旦表达，Cas9蛋白和gRNA通过gRNA“支架”结构域和Cas9上表面暴露的带正电荷的沟槽之间的相互作用形成核糖蛋白复合物。Cas9在gRNA结合时发生构象变化，使分子从无活性的非DNA结合构象转变为活性的DNA结合构象。重要的是，gRNA的“间隔序列”序列仍然自由地与靶DNA相互作用。Cas9-gRNA复合物与结合具有PAM的任何基因组序列，但gRNA间隔序列与靶DNA匹配的程度决定了Cas9是否会切割。一旦Cas9-gRNA复合物结合推定的DNA靶标，gRNA靶向序列3'末端的“种子”序列开始与靶DNA退火。如果种子和目标DNA序列匹配，则gRNA继续以3'至5'方向与靶DNA退火。

如果gRNA间隔序列和靶序列之间存在足够的同源性，则Cas9将只切割靶标。此外，Cas9核酸酶具有两个功能性内切核酸酶结构域：RuvC和HNH。Cas9在靶标结合后发生第二次构象变化，其定位核酸酶结构域以切割靶DNA的相反链。Cas9介导的DNA切割的最终结果是在靶DNA内的双链断裂(DSB)，其发生在PAM序列上游约3至4个核苷酸处。

然后所得到的DSB可以通过两种一般修复途径之一修复，所述两种一般修复途径是有效但容易出错的非同源末端连接(NHEJ)途径和效率较低但高保真度的同源性定向修复(HDR)途径。在一些实施方案中，导致本发明的报告基因与性别染色体W或Z内的特定靶基因座的特异性整合的插入，是修复由Cas9引起的DSB的结果。在一些具体实施方案中，本发明的报告基因通过HDR整合或敲入靶基因座。

如本文所用的术语“同源性定向修复(HDR)”是指在细胞中修复双链DNA损伤的机制。HDR最常见的形式是同源重组。HDR修复机制只能在细胞核中存在DNA的同源碎片(homologue piece)时(主要在细胞周期的G2和S期)被细胞利用。当同源DNA碎片不存在时，可以替代地发生被称为非同源末端连接(NHEJ)的另一过程。用于基因组编辑的可编程工程化核酸酶(PEN)策略基于特定双链DNA切割后HDR机制的细胞激活。

如前所讨论的，Cas9通过两个核酸酶结构域RuvC和HNH的组合活性而产生双链断裂(DSB)。每个核酸酶结构域内对于内切核酸酶活性至关重要的确切氨基酸残基是已知的(在酿脓链球菌Cas9中对于HNH而言为D10A，对于RuvC而言为H840A)，并且已经生成仅含有一个活性催化结构域的Cas9酶的修饰形式(称为“Cas9切口酶”)。Cas9切口酶仍然基于gRNA特异性结合DNA，但切口酶仅能够切割DNA链之一，产生“缺口”或单链断裂而不是DSB。使用完整的互补DNA链作为模板，通过HDR(同源性定向修复)快速修复DNA切口。因此，需要靶向相反链的两个切口酶在靶DNA内产生DSB(通常称为“双切口”或“双切口酶”CRISPR系统)。该要求显著地提高了靶标特异性，因为不太可能两个脱靶切口会产生地足够近以致于导致DSB。因此应该理解，本发明进一步包括使用双切口酶方法来产生双切口诱导的DSB以增加特异性并减少脱靶效应。

因此，在某些实施方案中，所述至少一种报告基因可通过至少一种CRISPR/CRISPR相关内切核酸酶9(Cas9)系统介导的同源性定向修复(HDR)而整合在转基因禽类受试对象(特别是动物)的性别染色体中。

如上所述，CRISPR II型系统包含至少两个元件，核酸酶，特别是Cas9和向导RNA。因此，除了Cas9或编码Cas9的任何核酸序列之外，为了将本发明所使用的报告基因掺入并整合到转基因禽类受试对象的性别染色体中，本发明还提供了向导RNA或编码这种gRNA的任何核酸序列，由此将Cas9定位到特定性别染色体内的目标位点。在一些其他实施方案中，本发明的试剂盒的gRNA可以包含至少一种CRISPR RNA(crRNA)和至少一种反式激活crRNA(tracrRNA)。

在一些替代性实施方案中，本发明的试剂盒可以包含编码至少一种gRNA的核酸序列。此类核酸序列可以包含CRISPR阵列，其包含至少一个间隔序列序列，所述间隔序列序列靶向目标基因组DNA序列中的至少一个原间隔序列并因此与其同一。应该注意，核酸序列还包含编码至少一种tracrRNA的序列。

更进一步，在一些实施方案中，可以通过使禽类受试对象或动物的至少一种细胞或引入禽类受试对象或动物的至少一种细胞接触或共转染：(a)CRISPR Cas9系统的元件，具体地为至少一种Cas9蛋白或至少一种第一核酸序列，所述第一核酸序列包含编码所述至少一种Cas9蛋白的至少一种核酸序列；和至少一种靶向于性染色体Z或W内的原间隔序列(protospacer)的向导RNA(gRNA)；和(b)至少一种第二核酸序列，其包含至少一种所述报告基因。应当注意，在一些实施方案中，如果以核酸序列的形式提供(a)的CRISPR Cas9系统的元件，则它们可以以包含不同元件的一个核酸分子提供(称为在本文中作为“第一核酸序列”)，或在两个或更多个核酸分子中，每个均包含上述元件之一，特别是编码gRNA和Cas9的序列。

因此，为了制备用于本发明方法的转基因禽类动物，应提供至少两个核酸分子。

更进一步，“gRNA”或“向导RNA”是这样的RNA，当从编码它的CRISPR系统的部分转录时，该RNA包含至少一个与靶基因组DNA中的DNA序列相同(在RNA的情况下除了使用U代替T)或互补(并因此“靶向”)的RNA序列片段，在本文称为原间隔序列(protospacer)。本公开内容的CRISPR系统可以任选地编码一个以上的向导RNA，并且所述向导RNA针对基因组DNA中的一个或多个靶序列。如本文所用，“原间隔序列”是指靶染色体内的靶序列。这些原间隔序列包含与由CRISPR间隔序列编码的向导RNA具有足够互补性的核酸序列，所述CRISPR间隔序列包含在编码本发明的方法和试剂盒的gRNA的核酸序列内。

本发明的方法以及下文所述的试剂盒提供了核酸序列。如本文所用，“核酸或核酸分子”与术语“多核苷酸”可互换，且其通常指任何多核糖核苷酸或多脱氧核糖核苷酸，它们可为未修饰的RNA或DNA或经修饰的RNA或DNA或其任何组合。“核酸”包括但不限于单链和双链核酸。如本文所用，术语“核酸”还包括如上所述的含有一个或多个经修饰碱基的DNA或RNA。如本文所用，术语“寡核苷酸”定义为由两个或更多个脱氧核糖核苷酸和/或核糖核苷酸组成的分子，并且优选多于三个。其确切的大小取决于许多因素，而这进而取决于寡核苷酸的最终功能和用途。寡核苷酸长度可以是约8至约1,000个核苷酸。更具体而言，本发明的试剂盒所使用的寡核苷酸分子可以包含长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000个或更多个碱基中的任一种。

核酸分子可以由天然存在的核苷酸(例如DNA和RNA)的单体或天然存在的核苷酸的类似物(例如天然存在的核苷酸的α-对映体形式)或经修饰的核苷酸或其任何组合组成。在本文中该术语还包括cDNA，即通过逆转录酶(RNA-依赖性DNA聚合成酶)的作用从RNA模板产生的互补或复制DNA。

就此而言，“分离的多核苷酸”是从生物体的基因组中分离出的核酸分子。例如，已经从细胞的基因组DNA分离出的、编码本发明方法和试剂盒所使用的报告基因或其任何衍生物或同系物的DNA分子，以及编码本发明方法和试剂盒的CRISPR/Cas9和gRNA的序列，是分离的DNA分子。分离的核酸分子的另一实例是化学合成的核酸分子，其未整合在生物体的基因组中。从特定物种分离出的核酸分子小于该物种染色体的完整DNA分子。在一些实施方案中，本发明的方法和试剂盒(在下文中描述)所使用的核酸序列，具体而言，包含编码Cas9和gRNA的序列的核酸序列，或者本发明的报告基因，可以构建在载体、表达盒或任何其他载体内提供。因此本发明进一步涉及包含本发明的多核苷酸的重组DNA构建体，以及可选地与本发明的核酸序列可操作连接的另外的附加元件，例如启动子、调节控制元件，翻译、表达和其它信号。本发明提供的载体的非限制性实例可以是包含编码Cas9的核酸序列和对于将报告基因整合到靶性别染色体中所需的特异性gRNA的任何载体。在一些具体的实施方案中，本发明提供了DNA构建体或载体，其包含编码如SEQ ID NO.25所示的Cas9的核酸序列以及SEQ ID NO.26所示的gRNA7，其将报告基因靶向性别染色体Z。在又一些实施方案中，本发明进一步提供了载体或任何DNA构建体，其包含编码本发明报告基因的核酸序列，特别是RFP，通过重组和整合入性别染色体(特别是性别染色体Z)内的靶基因座所需的左臂和右臂位于侧翼。这种载体的非限制性实例可以是包含图15中公开的核酸序列的载体。在又一些其他实施方案中，该核酸序列包含由SEQ ID NO.66和/或SEQ ID NO.67中的至少一个表示的核酸序列。

更进一步，本发明进一步涵盖包含和/或表达本发明的载体和DNA构建体的任何宿主细胞，特别是本发明描述的任何载体。

如本文所用，术语“重组DNA”、“重组核酸序列”或“重组基因”是指包含编码本发明的一种CRISPR系统，特别是CRISPR/Cas9 II型的开放阅读框的核酸，连同将Cas9靶向禽染色体Z和/或W内的特定基因座中的相应原间隔序列(protospacer)的本发明的gRNA。在又一些其他实施方案中，本文所用的重组DNA进一步指包含编码本发明的报告基因(特别是转基因)的开放阅读框的核酸。

如本文所提到的，术语“基因”或“转基因”是指编码蛋白质产物的核酸，其是天然存在的或合成的。术语“核酸”旨在表示天然和/或合成的线性、环状的有序阵列，例如cDNA、基因组DNA(gDNA)、mRNA和RNA、寡核苷酸、寡核苷及其衍生物。

短语“可操作地连接”意在表示以允许转基因转录的方式连接。如上所述，通过提供编码将要掺入性别染色体Z或W中的转基因的核酸序列，特别是报告基因，以及基因编辑系统(例如，CRISPR/Cas9系统)，制备本发明的方法中使用的转基因。术语“编码”旨在表示，例如当主题核酸与合适的控制序列(例如启动子和增强子元件)在合适的载体(例如表达载体)中连接时以及当将载体引入合适的系统或细胞中时，主题核酸可以在合适的表达系统中转录并翻译成期望的多肽或主题蛋白质。

应该理解的是，在一些实施方案中，由本发明的方法和试剂盒所提供和使用的第一和第二核酸序列中的至少一个可以被构建并包含在载体内。如本文所用，“载体”或“载质”包括载体，例如质粒、噬菌粒、病毒，可整合的DNA片段和其它载质，它们能够使DNA片段整合在宿主的基因组中，或者能够表达未整合的遗传元件。载体通常是自我复制的DNA或RNA构建体，其含有所需核酸序列以及可操作连接的遗传控制元件，所述遗传控制元件在合适的宿主细胞中被识别并影响所需间隔序列的翻译。通常，遗传控制元件可以包括原核启动子系统或真核启动子表达控制系统。此类系统通常包括转录启动子、转录增强子以提高RNA表达水平。载体通常含有允许载体独立于宿主细胞复制的复制起点。在又一些替代性实施方案中，本发明所使用的表达载体可以包含将本发明的所需报告基因整合在禽类性别特异性染色体W和/或Z中所需的元件。

因此，术语“控制和调节元件”包括启动子、终止子和其它表达控制元件。此类调节元件描述于Goeddel；[Goeddel.,等，Gene Expression Technology:MethodsinEnzymology 185,Academic Press,San Diego,Calif.(1990)]。例如，在这些载体中可以使用当与DNA序列可操作连接时控制DNA序列的表达的各种表达控制序列中的任一种，以使用本发明的方法表达编码任何所需蛋白质的DNA序列。

载体可另外包含适当的限制性位点、抗生素抗性或用于选择含载体细胞的其它标记。质粒是最常用的载体形式，但是本领域已知或者将已知的具有等效功能的其它形式的载体，适合在本文使用。参见例如Pouwels等，Cloning Vectors:a Laboratory Manual(1985及其增刊),Elsevier,N.Y.；以及Rodriquez等(编辑)Vectors:a SurveyofMolecular Cloning Vectors and their Uses,Buttersworth,Boston,Mass(1988)，通过引用将其并入本文。

为了产生由本发明方法所使用的转基因禽类动物，必须制备包含整合在性别染色体Z或W内的特定基因座中的报告基因的禽类细胞。在一些实施方案中，此类细胞可以通过用本发明的方法和试剂盒提供的第一和第二核酸序列或包含其的任何构建体、载体、载质接触、引入或共转染禽类受试对象的细胞或引入所述对象的任何细胞来制备。本文使用的“转染”是指将遗传物质如DNA和双链RNA插入哺乳动物细胞中的过程。将DNA插入细胞能够使用细胞自己的机制来表达或生产蛋白质。因此，本文所用的共转染是指将至少两种不同的核酸分子或包含其的任何载体同时转染至各个单细胞。更进一步而言，待转染的核酸序列可以在短时间内瞬时表达，或者引入到基因组DNA中，其中变化在细胞分裂时从细胞传递到细胞。

因此，本发明提供了基于整合在其性染色体(具体地是Z和/或W)中的报告基因特别是红色荧光蛋白(RFP)的表达在卵内对禽类胚胎进行卵内性别确定的方法。“表达”通常是指将基因编码信息转化为细胞中存在和操作的结构的过程。因此，根据本发明，报告基因的“表达”具体地可以指转录成多核苷酸，翻译成蛋白质，或者甚至蛋白质的翻译后修饰。

在一些实施方案中，报告基因向转基因禽类受试对象的性别染色体内的特定靶基因座的插入和特异性整合可以包括提供CRISPR/Cas9系统，该系统包括特异性gRNA和应该被整合的报告基因的核酸序列。为了促进和实现整合，在一些实施方案中，报告基因必须位于侧翼，其序列可以与靶向整合位点侧接的序列同源，从而实现重组。因此，在又一些其他具体的实施方案中，第二核酸序列中的至少一种报告基因可以在其5'和3'的侧翼具有同源臂。应当理解，在一些实施方案中，这些臂是必需的，因此有助于整合位点的报告基因的HDR。

在更具体的实施方案中，由本发明方法所使用的第二核酸序列中的报告基因可以侧接有两个臂，所述两个臂是同源的，或者与包含在性别染色体Z或W内的目标基因座内的全部、整体或完全的至少一个核酸序列显示约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同源性或同一性，其充当整合位点以促进经由HDR的特异性整合。在某些实施方案中，靶序列在本文中也称为至少一个由“间隔序列”序列识别的“原间隔序列”，所述“间隔序列”序列是由本发明使用的并由第一核酸序列提供的gRNA的一部分。

本文所用的术语“同源臂”是指引入到特定载体或病毒中的HDR模板，其用于产生特定突变或将新元件插入到基因中，其具有一定量的围绕待修饰靶序列的同源性(取决于使用哪种PEN)。在又一些具体的实施方案中，在CRISPR用作PEN时，臂序列(左侧，上游和右侧，下游)可以包含约10-5000bp，特别约50-1000bp，100-500bp，特别50、100、200、300、400、500、600、700、800、900、1000bp。

在又一些进一步的实施方案中，由本发明的方法和试剂盒所提供的第一核酸序列编码的gRNA内的靶向序列(在本文中也称为“间隔序列”序列)与包含在性别染色体Z或W内的靶基因座内的全部、整体或完全的至少一个核酸序列(在本文中称为“原间隔序列”)显示约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同源性或同一性。

在一些实施方案中，第二核酸序列中的至少一种报告基因可以与性别特异性启动子、胚胎特异性启动子(例如α-珠蛋白启动子)和诱导型启动子(例如衍生自大豆SSU基因的光诱导型启动子，或者衍生自欧芹查耳酮合成酶CHS启动子的光诱导型启动子，或EL222的工程化版本，当用蓝光照射时激活表达的细菌光-氧-电压蛋白)可操作地连接。在更具体的实施方案中，报告基因可处于胚启动子的控制下，由此限制了转基因报告基因在胚胎期表达，而在成体鸡中不表达。在此类实施方案中，为了诊断目的，可使用报告转基因并且其仅在胚胎期表达。

更具体而言，本文使用的“启动子”是指具有控制置于下游的基因表达的能力的DNA的特定区域。

因此，“鸡中的性别特异性启动子”在下文中是指仅在特定鸡性别(即雄性或雌性)中才激活基因表达的启动子。更进一步而言，“鸡中的发育特异性启动子”是指仅在鸡发育的特定阶段激活基因表达的启动子。

在一些具体实施方案中，可以将所述至少一种报告基因插入并由此整合在目标性别染色体的至少一个非编码区中。此类方法避免了未孵化胚胎发育和成熟可能需要的基因的破坏。

如本文所用，“非编码区”是指不编码蛋白质序列的生物体DNA的组分。一些非编码DNA区域被转录成功能性非编码RNA分子，非编码DNA区的其它功能包括蛋白编码序列的转录和翻译调节，支架附着区域，DNA复制起点，着丝粒和端粒。假设的非功能部分(或未知功能的DNA)通常被称为“垃圾DNA”。

在又一些特定的实施方案中，可以将本发明的方法用于制备转基因禽类动物中使用的至少一种报告基因整合到性别Z染色体的至少一个位点中。在更具体的实施方案中，Z染色体中的特定基因座可以是如由SEQ ID NO：15表示的区域9156874-9161874、如由SEQID NO：16表示的27764943-27769943、SEQ ID NO：17表示的42172748-42177748、SEQ IDNO：18表示的63363656-63368656以及SEQ ID NO：19表示的78777477-78782477的雌性鸡的Z染色体中的至少一个。

在一些具体的实施方案中，至少一种报告基因可以被整合到性别Z染色体基因座42172748-42177748的至少一个位点中，具体地，如SEQ ID NO.17所示。在又一些其他具体实施方案中，适于整合到Z染色体内的特定基因座中的gRNA序列可以包括但不限于针对位于Z染色体基因座chrZ_42174515_1中的原间隔序列的gRNA7。在一些具体的实施方案中，gRNA可以是命名为gRNA7的gRNA。在更具体的实施方案中，此类gRNA7可包含核酸序列GTAATACAGAGCTAAACCAG，也由SEQ ID NO：26表示。在又一些实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，编码本发明的报告基因的序列，特别是RFP，可以在其5'端的左臂侧翼，以及3'的右臂侧翼。在又一些其他具体实施方案中，左臂可包含如SEQ ID NO.31所示的核酸序列，包含如SEQ ID NO.32所示的核酸序列的右臂可以用于通过将本发明的报告基因整合入通过SEQ ID NO：26的gRNA7引导的特定基因座上。

在又一些进一步具体的实施方案中，将报告基因靶向Z染色体内地此类特定位置所需的所述至少一种gRNA可以包含以下任一种所示的核酸序列：如SEQ ID NO.11所示的gRNA3：ACAGACCTATGATATGT；如SEQ ID NO.12所示的gRNA4：CGATTATCACTCACAAG；如SEQ IDNO.13所示的gRNA5：CTGGTTAGCATGGGGAC；如SEQ ID NO.14所示的gRNA6：GTAAAGAGTCAGATACA。

在又一些实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.41所示的核酸序列的左臂和包含如SEQ ID NO.42所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：11的gRNA3指导的特定基因座。在进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.43所示的核酸序列的左臂和包含如SEQ ID NO.44所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：12的gRNA4指导的特定基因座。在更进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.45所示的核酸序列的左臂和包含如SEQ ID NO.46所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：13的gRNA5指导的特定基因座。在一些进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.47所示的核酸序列的左臂和包含如SEQ ID NO.48所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：14的gRNA6指导的特定基因座。

适合于整合在Z染色体内的特定基因座中的gRNA序列的其它非限制性实例可以包括但不限于Z染色体基因座chrZ_9157091_11的gRNA8，其包含核酸序列ACAGACCTATGATATGTGAG，也如SEQ ID NO:27所示；Z染色体基因座chrZ_27767602_-1的gRNA9，其包含核酸序列GAGCTTGTGAGTGATAATCG，也如SEQ ID NO:28所示；Z染色体基因座chrZ_78779927_1的gRNA10，其包含核酸序列GTAAAGAGTCAGATACACAG，也如SEQ ID NO:29所示；和Z染色体基因座chrZ_63364946_-1的gRNA11，其包含核酸序列CAGTGGGTACTGAAGCTGTG，也如SEQ ID NO:30所示。

在进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.33所示的核酸序列的左臂和包含如SEQ ID NO.34所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：27的gRNA8指导的特定基因座。在更进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.35所示的核酸序列的左臂和包含如SEQ ID NO.36所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：28的gRNA9指导的特定基因座。在进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.37所示的核酸序列的左臂和包含如SEQ ID NO.38所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：29的gRNA10指导的特定基因座。在进一步的实施方案中，为了将本发明的报告基因整合在Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.39所示的核酸序列的左臂和包含如SEQ ID NO.40所示的核酸序列的右臂来将本发明的报告基因整合在如SEQ ID NO：30的gRNA11指导的特定基因座。

在另一些实施方案中，所述至少一种报告基因可以整合到性别W染色体上的至少一个位点。在更具体的实施方案中，W染色体中的特定基因座可以是位置1022859-1024215。在一些具体的实施方案中，靶基因座可包含如SEQ ID NO.3所示的核酸序列。

在更具体的实施方案中，将报告基因靶向与W染色体内这样的特定位置所需的至少一种gRNA可以包含如SEQ ID NO.1和2所示的核酸序列，这些gRNA在本文中分别称为gRNA1和gRNA2。

在又一些更具体的实施方案中，本发明的方法使用的用于制备转基因禽类雌性的gRNA可以包含如SEQ ID NO.1(gRNAl)所示的核酸序列。在这种情况下，包含在所述第二核酸序列中的所述至少一种报告基因可以在其5'和3'侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂，它们分别促进其整合到W染色体中的所述特定基因座。应当理解，这些臂在本文中也分别称为左臂和右臂。

在另一些实施方案中，本发明的方法使用的用于制备本发明的转基因禽类雌性的gRNA可以包含如SEQ ID NO.2(gRNA2)所示的核酸序列。在这种情况下，包含在所述第二核酸序列中的所述至少一种报告基因可以在其5'和3'侧接包含分别由SEQ ID NO.6和7所示氨基酸序列的同源臂。应当理解，这些臂在本文中也分别称为左臂和右臂。

当已经用外源序列，特别是本发明使用的报告基因靶向和/或转染禽类宿主的合子细胞的基因座时，可能需要使用此类细胞来产生转基因动物。对于这样的程序，在将靶向构建体引入胚胎干(ES)细胞中之后，可以将细胞铺在适当的培养基中的饲养层上，例如补充有生长因子和细胞因子、胎牛血清和抗生素的DMEM。胚胎干细胞可以具有单个靶向基因座(杂合子)或两个靶向基因座(纯合子)。可以通过使用选择性培养基来检测含有构建体的细胞，并且在集落生长足够的时间后，可以挑选集落并分析基因靶向的发生。在一些具体实施方案中，可以使用构建体序列内外的引物，应用PCR来验证所需外源序列在靶基因座中的整合。显示基因靶向的集落然后可以用于注射到禽类胚胎中。然后ES细胞可以被胰蛋白酶消化，并且经修饰的细胞可以通过卵侧面形成的开口注射。将卵密封后，可以在适当的条件下孵育卵，直到孵化。可以例如通过检查其生物学样品，例如血液样品来测试新孵化的禽类是否存在靶构建序列。在禽类成熟后，繁育它们并检查其子代以确定外源整合序列是否通过种系传递。

产生嵌合禽类，其部分源自能够将遗传修饰通过种系传递的经修饰胚胎干细胞或合子细胞。将含有外源序列，特别是本发明所用的报告基因或其部分的禽类品系与其中恢复了禽类野生型基因座或其部分的品系交配，应该产生表现出卵内可检测性别的后代。

更进一步地，转基因禽类也可以通过其它方法产生，其中一些在下面讨论。在适合转化以产生转基因动物的禽类细胞中有原始生殖细胞(PGC)、精细胞和合子细胞(包括胚胎干细胞)。精子细胞可以通过任何合适的方法用DNA构建体转化，所述方法包括电穿孔、微粒轰击，脂质转染等。精子可以用于禽类的人工授精。如上所述，可以检查授精的禽类的子代的外源序列。

作为选择，原始生殖细胞可以从禽类卵中分离，通过任何适当的方法用本发明的外源报告基因转染，并转移或插入到新胚胎中，在胚胎中它们可以引入发育中的性腺中。如本发明所述，可以检查孵化的禽类及其子代的外源报告基因序列。

在另一种方法中，可以通过任何合适的手段将分离自卵的分散的胚盘细胞用外源报告基因序列或其部分转染，整合在性别特异性染色体Z或W，然后将完整卵注射到胚盘下腔中。如上所述，可以检查孵化的禽类受试对象及其子代的外源报告基因。

鸡原始生殖细胞(PGC)是卵子和精子的前体。因此，在其一些方面，本发明提供了通过种系传递系统生产转基因鸡，所述系统使用与报告基因构建体以及与指导报告基因整合在性别特异性染色体W和/或Z中的CRISPR/Cas9gRNA构建体共转染的PGC。将PGC分选并转移到2.5天受体胚胎的血流中以进行种系传递。

与哺乳动物相比，PGC是配子(gamete)的前体，在鸟类早期胚胎发生过程中表现出独特的迁移活性。在禽类胚胎中，PGC首先起源于上皮细胞，并在孵化后约18-19h进入第4阶段(HH)的生发新月体的下胚层。在第10阶段和第12阶段(HH)之间，PGC从生新月形进入血液，并通过循环系统迁移，直到到达生殖器脊并定居发育中的性腺。这与哺乳动物中的PGC通过胚胎组织迁移到达发育中的性腺相反。禽PGC通过血流迁移的这一独特特征促进了鸡的基因改造的重大进展。

因此，在一些具体实施方案中，“转基因禽类动物的制备”是指涉及用于生产具有基因组修饰的鸡的基因工程技术的多步骤方法，其中a)从两日龄鸡胚的血液中分离原始生殖细胞(PGC)；b)例如通过使用慢病毒系统，Piggybac转座子载体，TALENS或CRISPR/Cas9技术将转基因构建体整合在培养的PGC中；(c)鉴定转基因PGCs并其注射到胚胎的循环系统并迁移到发育中的性腺；d)将受体胚胎在37℃下温育直至孵化；(d)孵化的雄性被饲养至性成熟并且与野生型母鸡杂交；(e)筛选后代以鉴定来自转基因PGC的那些。

因此，在第二方面，本发明涉及一种禽类转基因动物或对象，其在其至少一个细胞中包含整合在性别染色体Z和W中至少一个的至少一个位置或部位(本文中也称为基因座)中的至少一种外源报告基因。

术语“禽类”涉及来源于鸟类的任何物种，其特征在于羽毛、无齿的喙、产硬壳卵、高代谢率、四腔心脏，以及轻量但强壮的骨骼。禽类包括但不限于鸡、鹌鹑、火鸡、鸭、雉(Gallinacea sp)、鹅、野鸡和其它家禽。术语“母鸡”包括禽类物种的所有雌性。“转基因禽类”通常是指下述禽类，其已经具有异源DNA序列，或者一个或多个另外的DNA序列，所述另外的序列对于禽类正常是内源的(本文统称为“转基因”)，但是染色体整合在禽类的生殖细胞中。作为这种转移和整合的结果，转移的序列可以通过生殖细胞传递给转基因禽类的后代。转基因禽类(包括其子代)也具有整合在体细胞性染色体中的转基因。

在一些具体的实施方案中，本发明的至少一种转基因动物可以包含至少两种不同的报告基因。在这种情况下，每个报告基因可以被整合在性别染色体Z和/或W之一中的至少一个位置或部位中。在又一些实施方案中，每个报告基因可以被整合到性别Z和/或W染色体之一中的至少2个、至少3个、至少4个、至少5个，至少6个，至少7个，至少8个，至少9个，至少10个或更多个的位置或部位。

在另一些实施方案中，本发明的转基因动物中包含的报告基因可以是至少一种荧光报告基因。应当理解，与本发明的其他方面有关的本发明公开的任何报告基因，特别是本发明(特别是在本文之前的表1中)公开的任何荧光报告基因，也可以与本发明提供的转基因禽类受试对象有关。

在更具体的实施方案中，这样的荧光报告基因可以包含或可以是至少一种红色荧光蛋白(RFP)。然而，应注意，在一些实施方案中，由本发明的转基因禽类受试对象表达为转基因的报告基因可以是任何荧光蛋白，例如RFP、YFP、BFP等，只要所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说，在一些特定的实施方案中，整合到本发明提供的转基因动物的性别染色体中的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是GFP。

在某些实施方案中，本发明提供的至少一种转基因禽类动物可以是雌性。在更具体的实施方案中，此类转基因禽鸟雌性中的至少一种报告基因可以整合在雌性染色体Z的至少一个位置中。

在又一些替代性实施方案中，所述至少一种转基因禽类动物可以是雌性，具有整合在雌性染色体W的至少一个位置中的至少一种报告基因。

在又一些替代实施方案中，本发明提供的转基因动物可以是携带整合入其两个性别Z染色体中至少一种的转基因报告基因的转基因雄性受试对象。在一些其他实施方案中，本发明提供的转基因动物可以是携带整合到其两个性别Z染色体之一中的转基因报告基因的转基因雄性受试对象。在其他替代实施方案中，本发明提供的转基因动物可以是携带整合入其两个性别Z染色体中的两个的转基因报告基因的转基因雄性受试对象。

在一些具体的实施方案中，可以使用至少一种PEN将至少一种报告基因整合到本发明的转基因动物的性别染色体中。如以上结合本发明的方法所指出的，可以使用任何基因工程系统或任何PEN，特别是任何RNA引导的系统，例如CRISPR、TALEN、ZFN等中的一种。

更具体地，在某些实施例中，这种PEN可以是CRISPR系统。在更具体的实施方案中，CRISPR的2类系统可用于产生本发明的转基因动物。在又一些其他具体实施方案中，可以使用CRISPR II型系统。

在更具体的实施方案中，至少一种报告基因可以通过由至少一种CRISPR Cas9系统介导的HDR整合到本发明的转基因禽类动物的性别染色体中。

在更具体的实施方案中，可以通过用至少两个核酸序列接触或共转染禽类动物/受试对象的至少一个细胞或待导入所述禽类动物的至少一个细胞，从而将所述至少一种报告基因整合在本发明的转基因禽类动物的性别染色体中。更具体而言，此类细胞可以接触或共转染(a)基因编辑系统的至少一种组分，例如至少一个第一核酸序列，其包含：编码至少一个Cas9蛋白的至少一个核酸序列和靶向至少一个性染色体Z或W内的至少一个原间隔序列的至少一种gRNA，或者编码所述至少一个gRNA的至少一个核酸序列，从而提供CRISPR介导的整合；和(b)至少一个第二核酸序列，其包含：至少一种报告基因或其任何片段。

在更具体的实施方案中，第二核酸序列中的至少一种报告基因可以在其5'和3'侧接有同源臂。这些臂与靶性别染色体内的整合靶位点显示同源性，从而促进整合位点的HDR。

在还更具体的实施方案中，第二核酸序列中的至少一种报告基因可以与性别特异性启动子、胚胎特异性启动子和诱导型启动子中的任何一个可操作地连接。在一些实施方案中，此类启动子将本发明的报告基因的表达限制为特定的期望性别(在性别特异性启动子的情况下)、特定的胚胎期(胚胎特异性启动子)或特定条件(诱导性条件)。

在又一些进一步的具体实施方案中，包含在本发明的转基因禽类动物内的至少一种报告基因可以整合在其性别染色体之一的至少一个非编码区中。

在另一些替代实施方案中，本发明的转基因禽类动物可以包含整合到性别Z染色体的至少一个位点中的至少一种报告基因。在一些特定的和非限制性的实施方案中，这种禽转基因动物可以是雌性，其携带整合入Z染色体的转基因报告基因。在更具体的实施方案中，Z染色体中的特异性基因座可以是雌性鸡Z染色体的如下区域中的任何一个：如SEQ IDNO：15表示的9156874-9161874、如SEQ ID NO：16表示的27764943-27769943、如SEQ ID NO：17表示的42172748-42177748、如SEQ ID NO：18表示的63363656-63368656和如SEQ ID NO：19表示的78777477-78782477。

在一些具体的实施方案中，至少一种报告基因可以被整合到性别Z染色体基因座42172748-42177748的至少一个位点中，具体地，如SEQ ID NO.17所示。在又一些其他具体实施方案中，适于整合到Z染色体内的特定基因座中的gRNA序列可以包括但不限于针对位于Z染色体基因座chrZ_42174515_-1中的原间隔序列的gRNA7。在一些具体的实施方案中，gRNA可以是命名为gRNA7的gRNA。在更具体的实施方案中，此类gRNA7可包含核酸序列GTAATACAGAGCTAAACCAG，其也由SEQ ID NO：26表示。在又一些实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，本发明提供的编码报告基因(特别是RFP)的序列可以在其5'左臂侧翼，以及在其3'的右臂侧翼。在又一些其他具体实施方案中，左臂可包含如SEQ ID NO.31所示的核酸序列，并且包含如SEQ ID NO.32所示的核酸序列的右臂可以用于将本发明的报告基因整合到由SEQ ID NO：26的gRNA7引导的特定基因座上。

在又一些更具体的实施方案中，将报告基因靶向到转基因禽类受试对象的Z染色体内的这样的特定位置所需的至少一种gRNA，可以包含由以下任何一种所表示的核酸序列：gRNA3：ACAGACCTATGATATGT，如SEQ ID NO.11所示；gRNA4：CGATTATCACTCACAAG，如SEQID NO.12所示；gRNA5：CTGGTTAGCATGGGGAC，如SEQ ID NO.13所示；gRNA6：GTAAAGAGTCAGATACA，如SEQ ID NO.14所示。

在又一些实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可使用包含如SEQ ID NO.41所示的核酸序列的左臂以及包含SEQ ID NO.42所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO：11的gRNA3引导的特定基因座。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可使用包含如SEQ ID NO.43所示的核酸序列的左臂以及包含SEQ ID NO.44所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO：12的gRNA4引导的特定基因座。在另外的实施方案中，为了将本发明的报告基因整合到转基因禽类受试对象的Z染色体内的特定基因座中，可使用包含如SEQ ID NO.45所示的核酸序列的左臂以及包含SEQ ID NO.46所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO：13的gRNA5引导的特定基因座。在一些另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可使用包含如SEQ ID NO.47所示的核酸序列的左臂以及包含SEQ ID NO.48所示的核酸序列的右臂将本发明的报告基因整合至由SEQ ID NO：14的gRNA6引导的特定基因座。

适用于整合入本发明转基因禽类受试对象的Z染色体内的特定基因座中的gRNA序列的其他非限制性实例可以包括但不限于Z染色体基因座chrZ_9157091_1的gRNA8，其包含核酸序列ACAGACCTATGATATGTGAG(也由SEQ ID NO：27表示)；Z染色体基因座chrZ_27767602_-1的gRNA9，其包含核酸序列GAGCTTGTGAGTGATAATCG(也由SEQ ID NO：28表示)；Z染色体基因座chrZ_78779927_1的gRNA10，其包含核酸序列GTAAAGAGTCAGATACACAG(也由SEQ ID NO：29表示)；Z染色体基因座chrZ_63364946_-1的gRNA11，其包含核酸序列CAGTGGGTACTGAAGCTGTG(也由SEQ ID NO：30表示)。

在进一步的实施方案中，为了将本发明的报告基因整合到本发明的转基因禽类受试对象的Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.33所示的核酸序列的左臂和包含SEQ ID NO.34所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO：27的gRNA8引导的特定基因座上。在另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.35所示的核酸序列的左臂和包含SEQ ID NO.36所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO：28的gRNA9引导的特定基因座上。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.37所示的核酸序列的左臂和包含SEQ IDNO.38所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO：29的gRNA10引导的特定基因座上。在又一个实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.39所示的核酸序列的左臂和包含SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合入由SEQ ID NO：30的gRNA11引导的特定基因座上。

在又一些替代实施方案中，可以将至少一种报告基因整合到本发明的转基因禽类受试对象的性别W染色体上的至少一个位点中。在一些特定的实施方案中，整合位点可以位于W染色体上的基因座1022859-1024215，特别是W染色体：1022859-1024215的galGal5_dna范围。在另一些其他具体实施方案中，此类基因座包含如SEQ ID NO.3所示的核酸序列。

为了在上述基因座内的任何位置特异性整合本发明的报告基因，可能需要特异性gRNA。因此，在一些特定且非限制性的实施方案中，用于制备本发明的转基因禽类动物的合适的gRNA可以包含如SEQ ID NO.1和2所示的核酸序列。在一些特定的实施方案中，这些gRNA在本文分别称为gRNA1和gRNA2。

在一些特定的实施方案中，本发明提供的转基因禽类动物已经使用了包含如SEQID NO.1所示的核酸序列的gRNA1来制备。为了能够在这样的特定位置整合本发明的报告基因，在某些实施方案中，应被整合的报告基因必须携带特定的臂，以促进其掺入所用gRNA引导的靶整合位点。因此，在一些特定的实施方案中，至少一种报告基因可以包含在第二核酸序列内，其中该报告基因在其5'和3'侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂。

在另一些替代实施方案中，本发明提供的转基因禽类动物可以使用gRNA2制备，该gRNA2包含如SEQ ID NO.2所示的核酸序列。在这种情况下，为了使本发明的报告基因能够在所述gRNA2识别的特定位点整合，第二核酸序列中包含的至少一种报告基因可以根据具体实施方案在其5'和3'侧接包含SEQ ID NO.6和7所示的氨基酸序列的同源臂。

应当进一步理解，本发明进一步包括用于本发明的任何方法、特别是用于本文所述的卵内性别确定的方法的本文所述的任何转基因禽类受试对象。在又一些另外的实施方案中，本发明进一步包括由本发明提供的任何转基因禽类受试对象(特别是如上所述的)产下的任何卵用于本发明的任何方法中的用途。在另一方面，本发明涉及一种细胞，其包含整合到性别染色体Z和W中至少一个的至少一个位置或部位中的至少一种外源报告基因。

在一些具体的实施方案中，本发明提供的细胞可以是禽细胞。在一些特定的实施方案中，本发明提供的禽细胞可以是原始生殖细胞(PGC)。

术语“生殖细胞”是指与其他生殖细胞结合后发育成配子的胚胎细胞。如本文所用，“原始生殖细胞(PGC)”涉及种系干细胞，其充当配子的祖细胞并产生多能胚胎干细胞。胚化胚胎中的细胞在胚胎发生过程中被信号化为PGC，迁移到生殖腺中成为生殖腺，并分化为成熟配子。

在一些实施方案中，整合在本发明细胞的至少一个性别染色体中的报告基因可以是荧光蛋白，具体地是RFP、YFP、BFP等，或表1公开的任何荧光蛋白。在另一些实施方案中，整合在本发明细胞中的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说，在一些特定的实施方案中，整合到本发明提供的转基因细胞的性别染色体中的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是GFP。

在更具体的实施方案中，可以使用至少一种可编程的工程核酸酶(PEN)将至少一种报告基因整合到由本发明的细胞提供的转基因禽类受试对象或动物的性别染色体中。如本文所用，术语“可编程工程核酸酶(PEN)”是指切割特定DNA序列的合成酶，所述特定的DNA序列产生于参与双链DNA损伤的DNA修复并能够直接进行基因组编辑的天然存在的核酸酶。在更具体的实施方案中，PEN可以是成簇的规律间隔的短回文重复(CRISPR)第2类，特别是II型系统。

在另一些实施方案中，本发明提供的细胞可以包含至少一种整合入该细胞性别染色体的报告基因。在更具体的实施方案中，报告基因的这种特异性整合可以通过使细胞与以下接触或共转染来实现：(a)至少一种基因编辑系统，其包含至少一种Cas9蛋白或至少一种第一核酸序列，所述第一核酸序列包含编码所述至少一种Cas9蛋白的至少一种核酸序列；和至少一种靶向至少一个性别染色体Z和/或W内的至少一个原间隔序列的gRNA，或编码所述至少一种gRNA的至少一种核酸序列；(b)至少一种第二核酸序列，其包含至少一种所述报告基因。

在某些实施方案中，共转染至本发明细胞的第二核酸序列中的至少一种报告基因可以通过在整合位点的HDR的同源臂位于其5'和3'的侧翼。

在又一些特定的实施方案中，本发明提供的细胞可以通过将本发明的至少一种报告基因整合到细胞的Z染色体中来制备。在某些实施方案中，为了制备本发明的细胞，可以将至少一种报告基因整合入性别Z染色体的至少一个位点。在更具体的实施方案中，Z染色体中的特定基因座可以是雌性鸡Z染色体的如下区域：如由SEQ ID NO：15表示的9156874-9161874、如由SEQ ID NO：16表示的27764943-27769943、如由SEQ ID NO：17表示的42172748-42177748、如由SEQ ID NO：18表示的63363656-63368656和如由SEQ ID NO：19表示的78777477-78782477。

在又一些替代实施方案中，本发明提供的细胞可以通过使用促进整合入性别Z染色体基因座42172748-42177748(具体为SEQ ID NO.17)的至少一个位点的gRNA制备。在又一些其他具体实施方案中，适于整合到Z染色体内的特定基因座中的gRNA序列可以包括但不限于Z染色体基因座chrZ_42174515_-1的gRNA7，其包含核酸序列GTAATACAGAGCTAAACCAG，也由SEQ ID NO：26表示。在又一些其他实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.31所示的核酸序列的左臂以及包含如SEQ ID NO.32所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：26的gRNA7引导的特定基因座上。

在更具体的实施方案中，将报告基因靶向本发明的细胞的Z染色体内的这样的特定位置所需的至少一种gRNA可以包含由以下任何一种表示的核酸序列：gRNA3：ACAGACCTATGATATGT，如SEQ ID NO.11所示；gRNA4：CGATTATCACTCACAAG，如SEQ ID NO.12所示；gRNA5：CTGGTTAGCATGGGGAC，如SEQ ID NO.13所示；gRNA6：GTAAAGAGTCAGATACA，如SEQID NO.14所示。

在又一些实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.41所示的核酸序列的左臂以及包含如SEQ ID NO.42所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：11的gRNA3引导的特定基因座上。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.43所示的核酸序列的左臂以及包含如SEQ ID NO.44所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：12的gRNA4引导的特定基因座上。在另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.45所示的核酸序列的左臂以及包含如SEQ ID NO.46所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：13的gRNA5引导的特定基因座上。在一些另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.47所示的核酸序列的左臂以及包含如SEQ ID NO.48所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：14的gRNA6引导的特定基因座上。

适用于整合入Z染色体内特定基因座的gRNA序列的其他非限制性实例可以包括但不限于：Z染色体基因座chrZ_9157091_1的gRNA8，包含核酸序列ACAGACCTATGATATGTGAG，也如SEQ ID NO:27表示；Z染色体基因座chrZ_27767602_-1的gRNA9，包含核酸序列GAGCTTGTGAGTGATAATCG，也如SEQ ID NO：28表示；Z染色体基因座chrZ_78779927_1的gRNA10，包含核酸序列GTAAAGAGTCAGATACACAG，也如SEQ ID NO：29所示；以及Z染色体基因座chrZ_63364946_-1的gRNA11，包含核酸序列CAGTGGGTACTGAAGCTGTG，也如SEQ ID NO：30表示。

在进一步的实施方案中，为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.33所示的核酸序列的左臂以及包含如SEQID NO.34所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：27的gRNA8引导的特定基因座上。在另外的实施方案中，为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.35所示的核酸序列的左臂以及包含如SEQ ID NO.36所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：28的gRNA9引导的特定基因座上。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.37所示的核酸序列的左臂以及包含如SEQ IDNO.38所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：29的gRNA10引导的特定基因座上。在又一个实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.39所示的核酸序列的左臂以及包含如SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：30的gRNA11引导的特定基因座上。

在一些特定的实施方案中，为了将报告基因整合到本发明提供的细胞中的W染色体上，应该使用特异性的gRNA。在另外的特定实施方案中，gRNA可以包含如SEQ ID NO.1所示的核酸序列，其在本文中称为gRNA1。在这种情况下，包含在第二核酸序列中的至少一种报告基因可以在其5'和3'分别侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂。

在又一些替代实施方案中，可以通过使用在本文中称为gRNA2的gRNA来制备本发明提供的细胞。在某些实施方案中，gRNA2可包含如SEQ ID NO.2所示的核酸序列。在这样的具体实施方案中，第二核酸序列中包含的至少一种报告基因可以在其5'和3'分别侧接具有包含如SEQ ID NO.6和7所示的氨基酸序列的同源臂。

更进一步，本发明提供了一种用于检测未孵化的受精卵的方法。在一些具体的实施方案中，这样的方法可以包括以下步骤(a)，提供或获得至少一种转基因禽类受试对象或动物，该受试对象或动物在所提供的转基因动物是雌性的情况下包含整合到性染色体Z和W两者的至少一个的位置或部位中的至少一种外源报告基因，并且在所提供的转基因动物是雄性的情况下包含整合到两个性染色体Z的至少一个位置或部位中的至少一种外源报告基因。在第二步骤(b)中，从转基因禽类受试对象，特别是动物或其任何细胞中获得至少一个受精卵。下一步(c)涉及确定在卵中是否检测到至少一种可检测信号。在更具体的实施方案中，至少一种可检测信号的检测指示所述至少一种报告基因的表达，从而指示在禽类中标记的母本W染色体或Z染色体(雌性情况)或者标记的父本Z染色体的存在。

在又一些其他实施方案中，通过本发明的方法提供的转基因动物可以是具有整合入其两个Z染色体的报告基因的雄性受试对象。在这种情况下，在由这样的转基因雄性或其任何精子受精的卵中确定的可检测信号表明胚胎带有包含转基因报告基因的父本Z染色体，因此卵是可育的。在其他实施方案中，由本发明的方法提供的转基因动物可以是雌性受试对象，其报告基因整合到其Z和W染色体中。在这种情况下，在由这种转基因雌性携带的卵中确定的可检测信号表明该胚胎带有包含转基因报告基因的母体Z或W染色体，因此该卵是可育的。应当理解，在其他实施方案中，为了检测受精卵，可以将报告基因，特别是RFP基因插入任何染色体的两个拷贝中，以产生纯合的转基因禽类受试对象，特别是雄性受试对象。将检测到受精卵带有RFP报告基因。

在另一方面，本发明提供了一种试剂盒，其包括：

(a)至少一个基因编辑系统、特别是CRSPR/Cas9系统的至少一个组成部分，其可以包含至少一个Cas9蛋白或至少一个第一核酸序列，该第一核酸序列包括至少一个编码所述至少一个Cas9蛋白的核酸序列；靶向至少一个性染色体Z和/或W内的至少一个原间隔序列的至少一种gRNA，或编码所述至少一种gRNA的至少一种核酸序列；(b)至少一种第二核酸序列，其包含至少一个所述报告基因。

在一些进一步的实施方案中，本发明的方法以及本发明的试剂盒使用的gRNA(在下文中描述)可包含至少一种CRISPR RNA(crRNA)和至少一种反式激活crRNA(tracrRNA)。

在一些替代实施方案中，本发明的试剂盒可包含编码至少一种gRNA的核酸序列。此类核酸序列可包含CRISPR阵列，该CRISPR阵列包含至少一个间隔序列，其靶向并因此与靶基因组DNA序列中的至少一个间隔序列同源或相同。应当注意，核酸序列可以进一步包含编码至少一个tracrRNA的序列。

在一些实施方案中，根据本公开内容的CRISPR阵列包含至少一个间隔序列和至少一个重复序列。在又一个实施方案中，本发明还涵盖了提供pre-crRNA的选择，该pre-crRNA能够加工成可以靶向相同或不同靶标的数种最终gRNA产物。

在又一些更具体的实施方案中，包含在本发明的gRNA内的crRNA可以是与靶基因组DNA序列互补的单链核糖核酸(ssRNA)序列。在一些具体实施方案中，靶基因组DNA序列可以位于紧邻原间隔序列邻接基序(PAM)序列的上游或更上游。

如本文所述，本发明的试剂盒和方法的gRNA可以至少部分地与靶基因组DNA互补，在这种情况下，是性别染色体Z或W内的靶基因座，在本文中称为“原间隔序列”。在某些实施方案中，“互补性”是指各自遵循锁钥原理的两个结构之间的关系。实质上互补性是DNA复制和转录的基本原理，因为它是两个DNA或RNA序列之间共有的性质，从而当它们彼此反向平行比对时，序列中每个位置上的核苷酸碱基将是互补的(例如，A和T，或者U、C和G)。

如上所述，由本发明试剂盒的gRNA靶向的基因组DNA序列位于紧邻PAM序列的上游。在一些实施方案中，此类PAM序列可以是核酸序列NGG。

在某些实施方案中，本发明所指的PAM序列可以包含N，即任何核苷酸，特别是腺嘌呤(A)，鸟嘌呤(G)，胞嘧啶(C)或胸腺嘧啶(T)中的任何一个。在另一些实施方案中，根据本发明的PAM序列由A，G，C或T和两个鸟嘌呤组成。

根据一个实施方案，编码本发明的gRNA的多核苷酸可包含至少一个间隔序列和任选地至少一个重复序列。在另外一些实施方案中，编码本发明的gRNA的DNA可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个，特别是110、120、130、140、150、160、170、180、190、200个或更多个间隔序列。在一些实施方案中，每个间隔序列位于两个重复之间。应当进一步理解，编码本发明的gRNA的核酸序列的间隔序列可以是相同或不同的间隔序列。在更多的实施方案中，这些间隔序列可以靶向相同或不同的靶基因组DNA。在又一些其他实施例中，这样的间隔序列可以靶向至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个靶基因组DNA序列。这些靶序列可以来自单个基因座或可选地来自数个靶基因座。

如本文所用，术语“间隔序列”(spacer)是指被设计为靶向特定序列并且位于CRISPR阵列的多个短的直接重复序列(即，CRISPR重复序列)之间的非重复间隔序列。在一些具体的实施方案中，间隔区可包含约15至约30个核苷酸，具体地，约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多的核苷酸。更具体地说，约20-25个核苷酸。

由本发明的CRISPR系统编码的向导或向导RNA可以包含CRISPR RNA(crRNA)和反式激活RNA(tracrRNA)。由CRISPR间隔序列编码的向导RNA的序列没有特别限制，除了要求将其定向(即具有与禽类基因组DNA中的靶序列相同或互补的片段)外，具体地，在性别染色体Z或W内的靶基因座中，在本文中也称为“原间隔序列”(proto-spacer)。此类原间隔序列包含与由CRISPR间隔序列编码的向导RNA具有足够互补性的核酸序列，所述CRISPR间隔序列包含在编码本发明的方法和试剂盒的gRNA的核酸序列内。

在一些实施方案中，crRNA包含20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40nt的间隔区(靶向)序列或由其组成，然后是19-36nt的重复序列。在具体的和非限制性的实施方案中，靶向间隔序列可以包含靶向基因组DNA序列中的任何一个的片段或由其组成，在本文中代表性间隔序列序列指示了所述所述片段。

应当注意，在一些具体实施方案中，本发明的CRISPR系统的间隔序列可以编码靶向指导RNA(gRNA)。“gRNA”或“向导RNA”是这样的一种RNA，当从编码它的CRISPR系统的一部分转录时，它包含与靶基因组DNA中的DNA序列相同(在RNA序列的情况下除了用U代替T之外)或互补(并因此“靶向”)的RNA序列的至少一个片段。本公开内容的CRISPR系统可以任选地编码一个以上的向导RNA，并且所述向导RNA针对基因组DNA中的一个或多个靶序列。

在一些实施方案中，由本发明的试剂盒提供的Cas9蛋白可以由如SEQ ID NO.24所示的核酸序列编码。在另外的特定和非限制性实施方案中，Cas9蛋白可包含如SEQ IDNO.25所示的氨基酸序列，或其任何衍生物、突变体或变体。

应当注意，“氨基酸序列”或“肽序列”是通过肽键连接的氨基酸残基位于肽和蛋白质的链中的顺序。通常从含有游离氨基的N-末端到含有酰胺的C-末端报告该序列。氨基酸序列通常称为肽，如果它代表蛋白质的一级结构，则称为蛋白质序列，然而，必须在术语“氨基酸序列”或“肽序列”和“蛋白质”之间进行区分，因为蛋白质被定义为被折叠成具体的三维构象并通常经历翻译后的修饰(例如磷酸化、乙酰化、糖基化、甘露糖基化、酰胺化、羧化、巯基键形成、切割等)的氨基酸序列。

“肽片段”是指所述Cas9或RFP(下文描述)分子的一部分。分子的“片段”，例如本发明的任何氨基酸序列，是指Cas9或RFP分子的任何氨基酸子集。这也可以包括其“变体”或“衍生物”。“肽”是指具有功能性的特定氨基酸亚组。“功能性”是指具有相同的生物学功能，例如具有与Cas9一样进行基因编辑或与RFP一样产生可检测信号的能力。

应当理解，本发明涵盖本发明的RFP或Cas9分子的任何变体或衍生物以及基本上相同或同源的任何多肽。术语“衍生物”用于定义这样的氨基酸序列(多肽)，其具有不改变原始多肽的活性的针对该氨基酸序列(多肽)的任何插入、缺失、取代和修饰。就此而言，本发明的Cas9或RFP分子的衍生物或片段可以是Cas9或RFP分子的任何衍生物或片段，特别是如SEQ ID NO.25、21、23所示的，其不会降低或改变Cas9或RFP分子的活性。术语“衍生物”也指其同源物、变体和类似物。与根据本发明的目的蛋白质具有序列同源性或同一性的蛋白质直系同源物或同源物，特别是可以共享至少50％、至少60％并且特别是65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％或更高，特别是与根据本发明的感兴趣的蛋白质的完整序列相比，例如，包含由SEQ ID NO.25、21、23表示的氨基酸序列的任何蛋白质。具体而言，针对SEQ ID NO.25、21、23，具有至少50％、至少60％以及更具体地65％、70％、75％、80％、85％、90％、91％、92％、93％，94％，95％，96％，97％，98％，99％或更高地相同的氨基酸序列或由其组成的同源物。具体地，如SEQ IDNO.25、21、23所示的整个序列。

在一些实施方案中，衍生物是指多肽，其通过氨基酸残基的插入、缺失或取代而与本发明中具体定义的多肽不同。应当理解，如本文所用，术语“插入”、“缺失”或“取代”是指分别向由本发明公开的多肽添加、缺失或置换氨基酸残基，添加、缺失或置换1至50个氨基酸残基、20至1个氨基酸残基、特别是1至10个氨基酸残基。更特别地，插入、缺失或取代可以是1、2、3、4、5、6、7、8、9或10中的任何一个的氨基酸。应当注意，本发明涵盖的插入、缺失或取代可以在修饰的肽的任何位置以及在其N'或C'末端的任何位置发生。

关于氨基酸序列，本领域技术人员将认识到，对核酸、肽、多肽或蛋白质序列的单个取代、缺失或添加会改变、添加或删除氨基酸序列中的单个氨基酸或一小部分氨基酸。编码的序列是“保守修饰的变体”，其中该改变导致氨基酸被化学相似的氨基酸取代。提供功能上相似的氨基酸的保守取代表是本领域众所周知的。此类保守修饰的变体补充并且不排除本发明的多态变体、种间同源物和等位基因。例如，可以进行取代，其中脂族氨基酸(G、A、I、L或V)被组内的另一成员取代，或诸如一个极性残基被另一个所取代，例如用精氨酸取代赖氨酸、用谷氨酸取代天冬氨酸或用谷氨酰胺取代天冬酰胺。以下八个组中的每一个都包含其他示例性氨基酸，它们是彼此的保守取代：

1)丙氨酸(A)，甘氨酸(G)；

2)天冬氨酸(D)，谷氨酸(E)；

3)天冬酰胺(N)，谷氨酰胺(Q)；

4)精氨酸(R)，赖氨酸(K)；

5)异亮氨酸(I)，亮氨酸(L)，蛋氨酸(M)，缬氨酸(V)；

6)苯丙氨酸(F)，酪氨酸(Y)，色氨酸(W)；

7)丝氨酸(S)，苏氨酸(T)；和

8)半胱氨酸(C)，蛋氨酸(M)。

因此，在一些实施方案中，本发明涵盖Cas9或RFP分子或其任何衍生物，特别是相对于如SEQ ID NO.21、23、25中的任何一个所示的氨基酸序列包含至少1、2、3、4，5、6、7、8、9、10个或更多个保守取代的衍生物。更具体地说，氨基酸“取代”是用具有相似结构和/或化学性质的另一种氨基酸替换一个氨基酸的结果，即保守氨基酸替换。可以基于极性、电荷、溶解性、疏水性、亲水性和/或所涉及残基的两亲性质的相似性来进行氨基酸取代。例如，非极性“疏水”氨基酸选自缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、苯丙氨酸(F)、色氨酸(W)、半胱氨酸(C)、丙氨酸(A)、酪氨酸(Y)、组氨酸(H)、苏氨酸(T)、丝氨酸(S)、脯氨酸(P)、甘氨酸(G)、精氨酸(R)和赖氨酸(K)；“极性”氨基酸选自精氨酸(R)、赖氨酸(K)、天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷氨酰胺(Q)；“带正电荷”的氨基酸选自精氨酸(R)、赖氨酸(K)和组氨酸(H)，并且其中“酸性”氨基酸选自天冬氨酸(D)、天冬酰胺(N)、谷氨酸(E)和谷氨酰胺(Q)。

本发明的多肽的变体与感兴趣的蛋白(例如本发明的各种多肽)在氨基酸水平可以具有至少80％的序列相似性或同一性，通常具有至少85％的序列相似性或同一性，具有90％的序列相似性或同一性，或至少95％、96％、97％、98％、99％的序列相似性或同一性。

在一些实施方案中，本发明试剂盒中包含的第二核酸序列中的至少一种报告基因可以在整合位点的HDR同源臂的5'和3'侧翼。

在又一些其他具体实施方案中，本发明试剂盒的第二核酸序列中的至少一种报告基因可以可操作地连接至性别特异性启动子、胚胎特异性启动子和诱导型启动子中的任何一个。

在另一些替代实施方案中，所述至少一种报告基因可以整合到性别Z染色体的至少一个位点中。在更具体的实施方案中，Z染色体中的特异性基因座可以是雌鸡的染色体Z的以下区域中的任何一个：如由SEQ ID NO：15所表示的9156874-9161874、如由SEQ ID NO：16所表示的27764943-27769943、如由SEQ ID NO：17所表示的42172748-42177748、如由SEQID NO：18所表示的63363656-63368656、如由SEQ ID NO：19所表示的78777477-78782477。

在一些具体的实施方案中，至少一种报告基因可以被整合到性别Z染色体基因座42172748-42177748的至少一个位点中。本发明试剂盒的第一核酸序列的非限制性实例可以包含gRNA，其为至少一个Z染色体基因座chrZ_42174515_-1的gRNA7，包含核酸序列GTAATACAGAGCTAAACCAG，也由SEQ ID NO.26表示。更具体地，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.31所示的核酸序列的左臂以及包含如SEQ ID NO.32所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：26的gRNA7引导的特定基因座上。

因此，在更具体的实施方案中，本发明的试剂盒的第一核酸序列可包含gRNA，其为如下中的至少一个：如SEQ ID NO.11所示的gRNA3：ACAGACCTATGATATGT；如SEQ ID NO.12所示的gRNA4：CGATTATCACTCACAAG；如SEQ ID NO.13所示的gRNA5：CTGGTTAGCATGGGGAC；如SEQID NO.14所示的gRNA6：GTAAAGAGTCAGATACA。

在进一步的实施方案中，包含在本发明试剂盒的第二核酸序列内的至少一种报告基因可以在其5'和3'侧接有包含由SEQ ID NO：41至48中的任一项所示的氨基酸序列的同源臂。更具体地，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.41所示的核酸序列的左臂以及包含如SEQ ID NO.42所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：11的gRNA3引导的特定基因座上。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.43所示的核酸序列的左臂以及包含如SEQ ID NO.44所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：12的gRNA4引导的特定基因座上。在另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ IDNO.45所示的核酸序列的左臂以及包含如SEQ ID NO.46所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：13的gRNA5引导的特定基因座上。在一些另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ IDNO.47所示的核酸序列的左臂以及包含如SEQ ID NO.48所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：14的gRNA6引导的特定基因座上。

本发明试剂盒的第一核酸序列的其他非限制性实例可以包含gRNA，其是如下中的至少一个：Z染色体基因座chrZ_9157091_1的gRNA8，包含核酸序列ACAGACCTATGATATGTGAG，也如SEQ ID NO:27表示；Z染色体基因座chrZ_27767602_-1的gRNA9，包含核酸序列GAGCTTGTGAGTGATAATCG，也如SEQ ID NO：28表示；Z染色体基因座chrZ_78779927_1的gRNA10，包含核酸序列GTAAAGAGTCAGATACACAG，也如SEQ ID NO：29所示；以及Z染色体基因座chrZ_63364946_-1的gRNA11，包含核酸序列CAGTGGGTACTGAAGCTGTG，也如SEQ ID NO：30表示。

在进一步的实施方案中，包含在本发明试剂盒的第二核酸序列内的至少一种报告基因可以在其5'和3'侧接有包含由SEQ ID NO：31至40所示的氨基酸序列的同源臂。更具体地，为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.33所示的核酸序列的左臂以及包含如SEQ ID NO.34所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：27的gRNA8引导的特定基因座上。在另外的实施方案中，为了将本发明的报告基因整合到本发明细胞的Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.35所示的核酸序列的左臂以及包含如SEQ ID NO.36所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：28的gRNA9引导的特定基因座上。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.37所示的核酸序列的左臂以及包含如SEQ ID NO.38所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：29的gRNA10引导的特定基因座上。在又一个实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQ ID NO.39所示的核酸序列的左臂以及包含如SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：30的gRNA11引导的特定基因座上。

在某些实施方案中，可以将本发明的试剂盒提供的至少一种报告基因整合到性别染色体(特别是染色体W)的至少一个非编码区中。在这种情况下，本发明的试剂盒可以编码至少一种包含如SEQ ID NO.1和2所示的核酸序列的gRNA，在本文中也分别称为gRNA1和gRNA2。

在一些具体的实施方案中，本发明的试剂盒的第一核酸序列可以包含gRNA，其为gRNA1。在一些实施方案中，此类gRNA1可包含如SEQ ID NO.1所示的核酸序列。在这种情况下，包含在本发明试剂盒的所述第二核酸序列中的报告基因可以在其5'和3'分别侧接包含如SEQ ID NO.4和5所示的氨基酸序列的同源臂。

在另一些替代实施方案中，本发明的试剂盒可在其第一核酸序列中包含编码gRNA2的序列。在一些具体的实施方案中，这样的序列编码为如SEQ ID NO.2所示的核酸序列。在另外一些实施方案中，包含在本发明试剂盒的第二核酸序列内的至少一种报告基因可以在其5'和3'侧接有包含分别如SEQ ID NO.6和7所示的氨基酸序列的同源臂。

在一些实施方案中，本发明的试剂盒的第二核酸序列中包含的报告基因可以是至少一种荧光报告基因。更进一步，在一些实施方案中，本发明的试剂盒提供的报告基因可以是任何荧光蛋白，具体地为RFP、YFP和本发明公开的任何荧光蛋白或表1公开的任何荧光蛋白。在一些实施方案中，本发明的试剂盒使用的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是绿色荧光蛋白(GFP)。换句话说，在一些特定的实施方案中，由本发明的试剂盒提供的整合到转基因动物的性别染色体中的报告基因可以是任何荧光蛋白，条件是所述荧光蛋白不是GFP。在另一些实施方案中，报告基因可以是RFP。在更具体的实施方案中，这种RFP可以包含如SEQ ID NO.21所示的氨基酸序列，或其任何同源物、变体、突变体或衍生物。在另一些替代具体实施方案中，本发明使用的RFP可以是包含如SEQ ID NO.23所示的氨基酸序列的RFP，或其任何同源物、突变体或衍生物。

在又一些其他实施方案中，本发明的试剂盒可适合用于制备转基因禽类动物，该转基因禽类动物包含整合到性别染色体Z和W中至少一个的至少一个位置或部位中的至少一种外源报告基因。

在一些实施方案中，本发明的方法可以使用本文所述的本发明的任何试剂盒。

更进一步，必须理解，本发明的试剂盒可以进一步包含制备本发明的转基因禽类动物所需的任何试剂、缓冲液、培养基或材料。本发明的试剂盒可以进一步包括说明书以及用于其不同组分的容器。

在一些实施方案中，本发明的试剂盒可用于制备本发明的任何转基因禽类受试对象或其根据本发明的任何细胞。在又一些其他实施方案中，使用本发明的试剂盒制备的转基因禽类受试对象和细胞可以使用本文公开的任何系统和装置通过本发明的任何方法使用。更进一步，在一些实施方案中，本发明的试剂盒可进一步包括适于确定通过本发明的方法检查的卵内胚胎中报告基因的存在的任何装置、系统和/或装置。在一些特定实施例中，这样的装置或设备可以是本发明公开的任何设备，具体地，如图1所示。

在本发明的另一方面，本发明提供了一种系统、装置或设备，其特别适于检测卵内胚胎内的报告基因。在一些实施例中，本发明的装置可以包括激光源、卵支架、透镜、滤光器、检测器支架和检测器。在一些实施例中，本发明的装置可以可选地包括固体支持物，其固持本发明的系统的所有元件，例如，如图1所示。如本文所使用的，术语“检测器”是指检测和/或测量光的任何类型的设备。

在一些实施例中，应该注意的是，可使用合适的荧光手段通过本发明的装置检测可检测信号，具体地为荧光信号。在一些实施例中，可由RFP报告基因形成的可检测信号可以由光敏装置例如改良的光学显微镜或电荷耦合器件(CCD)、高灵敏度光子检测器检测。

在又一些实施方案中，本发明的装置、设备或系统可以包括至少一个光源、至少一个检测器、至少一个滤光器和至少一个将卵放置保持适当位置以促进向所述光源暴露表达本发明的报告基因的细胞的保持臂。在一些实施方案中，此类卵可以是未孵化的受精禽卵。在另外一些实施方案中，这种卵可以由本发明的任何转基因禽类受试对象产下。在一些特定的和非限制性的实施例中，本发明的这种设备可以如图1所示。在又一些实施例中，蛋保持器与透镜和/或透镜与检测器之间的距离可以在大约1至100cm之间的范围内，具体地，为1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95和100厘米，特别是大约5到25厘米之间，更特别是大约20厘米。

因此，应当理解，在一些实施例中，本发明的系统或设备可以适于执行本发明公开的任何方法。

在一些具体的实施方案中，本发明的装置可以包括合适的光源，该光源能够检测被检卵中的报告基因。在又一些其他实施例中，光源可以包括在大约400到大约650之间的波长。在又一些实施例中，可以使用任何波长的光，条件是所述光源不是紫外线(UV)(波长10-400nm)。

在一些特定的实施方案中，合适的光源适合于激发荧光蛋白。在一些特定实施例中，激发波长可以在约500nm与约650nm之间。在一些其他实施例中，激发波长为大约510、515、520、525、530、535、540、545、550、555、560、565、570、575、580、585、590、595、600、605、610、615、620、625、630、635、640nm。在一些更具体的实施例中，激发波长可以在大约515至大约555之间的范围内。在又一些其他实施例中，波长可以是532nm。在一些特定且非限制性的实施例中，光源可以由激光器提供。在一些其他实施例中，本发明的装置的激光器可以是蓝色激光器或红色激光器。在更具体的实施例中，光源是绿色激光器。在某些实施例中，激光器可以与滤光器一起使用。在一些实施例中，滤光器可以是在500nm以上透射的绿色滤光器，或者是在540nm和580nm之间透射的深绿色滤光器，或者是在590nm和650nm之间透射的红色滤光器，或者是650nm以上或660nm以上透射的红色滤光器。

因此，应该进一步理解，本发明还包括如本文所述的用于本发明的任何方法、特别是用于本文所述的卵内性别确定的方法的装置，所述方法使用本发明的任何转基因禽类受试对象。

应该意识到，在某些实施方案中，本发明的试剂盒和方法使用的寡核苷酸或多核苷酸是分离的和/或纯的分子。如本文所用，当用于指核酸时，“分离的”或“纯的”是指天然存在的序列已从其正常细胞(例如染色体)环境中移除或在非天然环境中合成(例如，人工合成)。因此，“分离的”或“纯的”序列可以在无细胞溶液中或置于不同的细胞环境中。术语“纯的”并不意味着该序列是唯一存在的核苷酸，而是它基本上不含(约90-95％纯度)与其天然相关的非核苷酸材料，因此与分离的染色体区分开。

除非另有说明，否则本文使用的所有科技术语具有本领域通常使用的含义。本文提供的定义是为了便于理解本文经常使用的某些术语，并不意味着限制本公开的范围

在详细描述本发明的具体方面和实施方案之前，应该理解的是，本发明不限于所描述的特定方法和实验条件，因为这些方法和条件可以变化。还应该理解的是，本文使用的术语仅用于描述特定实施方案的目的，而不是限制性的，因为本发明的范围将仅由所附权利要求限制。

如在本说明书和所附权利要求中所使用的，除非上下文另外明确指出，否则单数形式“一种”、“一个”和“该”包括复数指代。因此，例如，提及“一种方法”包括本文所述类型的一种或多种方法和/或步骤，和/或在阅读本公开内容时对于本领域技术人员而言将变得显而易见的那些，等等。

除非另外定义，否则本文使用的所有科技术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管在本发明的实践或测试时可以使用与本文所述相似或等同的任何方法和材料，但现在描述优选的方法和材料。

在整个说明书和随后的权利要求书中，除非上下文另有要求，否则词语“包括”以及诸如“包含”和“含有”的变化将被理解为暗示包含所述整数或步骤或整数组或步骤组，但不排除任何其它整数或步骤或整数组或步骤组。更具体而言，术语“包括”、“包含”、“含有”、“带有”、“具有”及其缀合词意味着“包括但不限于”。该术语包括术语“由……组成”和“基本上由……组成”。短语“基本上由……组成”是指组合物或方法可以包括另外的成分和/或步骤，但条件是另外的成分和/或步骤不实质上改变所要求保护的组合物或方法的基本和新颖特征。

如本文所使用的术语“约”表示可能偏离所提及的值至多1％，特别是5％，更特别是10％，更特别是15％，并且在一些情况下至多20％的值，偏离范围包括整数值，并且如果适用，非整数值也构成连续范围。如本文所用，术语“约”是指±10％。

应该注意的是，本发明的各种实施方案可以以范围的形式呈现。应该理解的是，范围格式的描述仅仅是为了方便和简洁，并且不应该被解释为对本发明范围的不灵活的限制。因此，范围的描述应被认为已经具体公开了所有可能的子范围以及该范围内的单个数值。例如，诸如1至6的范围的描述应该被认为已经具体公开了子范围，例如1至3，1至4，1至5，2至4，2至6，3至6等，以及该范围内的单个数值，例如1、2、3、4、5和6。不管范围的宽度如何，这都适用。无论在本文何时指出数值范围，其意图包括在所指范围内的任何引用的数值(分数或整数)。第一指示数值和第二指示数值之间的“范围/范围之间”和“范围/从……起的范围”第一指示数值“至”第二指示数值在本文中可互换使用，并且意在包括第一和第二指示数值以及它们之间的所有分数和整数数值。

提出以下实施例以便为本领域普通技术人员提供关于如何制造和使用本发明的方法和组合物的完整公开和描述，并且不旨在限制发明人所认为的其发明的范围。已经致力于确保所用数值(例如数量，温度等)的准确性，但是应该考虑到一些实验误差和偏差。除非另有说明，否则份数是重量份，分子量是平均分子量，温度是摄氏度，压力是在大气压或接近大气压。

实例是在实施本发明的各方面时发明人所采用的技术的代表。应该理解的是，尽管这些技术是用于实践本发明的优选实施方案的实例，但根据本公开内容，本领域技术人员将意识到可以进行许多修改而不脱离本发明的精神和预期范围。

应该意识到，为了清楚起见，在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反，为了简洁起见，在单个实施方案的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合提供，或者适合于在本发明的任何其它描述的实施方案中提供。在各种实施方案的上下文中描述的某些特征不被认为是那些实施方案的必要特征，除非该实施方案在没有那些元件的情况下不起作用。

如上文所描述的以及如以下权利要求部分所要求保护的本发明的各种实施方案和方面在以下实例中找到实验支持。

尽管已经公开和描述，但是应该理解，本发明不限于本文公开的具体实例、方法步骤和组合物，因为这样的方法步骤和组成可以稍微变化。还应该理解的是，这里使用的术语仅用于描述特定实施方案的目的，而不旨在限制，因为本发明的范围将仅由所附权利要求及其等同物限制。

必须注意的是，如在本说明书和所附权利要求中所使用的，除非内容另有明确规定，否则单数形式“一种”、“一个”和“该”包括复数指代物。

实施例

无需进一步详述，相信本领域技术人员可以使用前面的描述最大限度地利用本发明。因此，以下优选的具体实施方案应被解释为仅仅是说明性的，而不是以任何方式限制所要求保护的发明。

本文中未具体描述的本领域已知的标准分子生物学方案通常基本上按照Sambrook等，Molecular cloning:A laboratory manual,Cold SpringsHarborLaboratory,New-York(1989,1992)和Ausubel等，Current Protocols inMolecularBiology,John Wiley and Sons,Baltimore,Maryland(1988)进行。

试剂

动物：

商业白色来亨鸡从Hendrix ISA和明尼苏达州获得。

标记线鸡(Marker Line chickens)来自加拿大不列颠哥伦比亚省Agassiz的Pacific Agri-Food Research Centre。

严格按照IACUC批准的方案进行动物实验，并在Crystal Bioscience IACUC委员会的监督下进行，以确保动物在实验过程中不患病或死亡。

载体:

PrecisionX^TM Cas9 SmartNuclease Vector System订购于System BioscienceInc.，目录号为CAS8/9xx系列。

来自Clontech#6921-l的pDsRed1-N1。

GFP质粒-FUGW-H1-GFP-新霉素(Addgene)，目录号37632。

细胞系：雌性细胞是Gattus gallus，淋巴母细胞雌性细胞系Con A-C1-VICK，从

编号：CRL-12135^TM订购。在鸡细胞培养实验中，使用了来自ATCC的鸡成纤维细胞雌性细胞系UMNSAH/DF-1(

CRL-12203^TM)。雄性细胞是Gattus gallus，上皮雄性细胞系LMH/2A，购自

编号：CRL-2118^TM。

原始生殖细胞(PGC)系。

人胚胎肾293(HEK-293)细胞系(ATTC)。

制备禽类转基因受试对象所需的试剂和材料

PGC分离

1.微电极拉制仪(Shutter Instrument Co.)。

2.微型研磨机(NARISHIGE)。

3.小直径(25μm)玻璃微量移液器。

4.口控移液器(Sigma-Aldrich)。

5. 1x Hank平衡盐溶液(HBSS)，不含CaCl₂或MgCl₂(Hyclone，Logan，UT)。

6. 1x Dulbecco磷酸盐缓冲液(PBS)，不含Ca2或Mg2(Hyclone)。

7.胰蛋白酶/乙二胺四乙酸(EDTA)(Gibco)。

8.Hamburger和Hamilton(HH)阶段14-17的鸡胚。

9.磁激活细胞分选(MACS)缓冲液，补充0.5％牛血清白蛋白(BSA)和2mM EDTA的1xPBS。

10.MiniMACS柱(Miltenyi Biotec)。

11.阶段特异性胚胎抗原1(SSEA-1)抗体(Santa Cruz Biotechnology，SantaCruz，CA)。

12.抗小鼠IgM微珠(Miltenyi Biotec)。

PGC培养

1.PBS(Hyclone)。

2.HBSS(Hyclone)。

3.PGC培养基(50mL)。3.75mL胎牛血清(FBS，Hyclone)，1.25mL鸡血清(Sigma-Aldrich，St.Louis，MO)，500μL GlutaMAX-I补充剂(100x，Invitrogen)，500μL核苷(100x，Millipore)，500μL抗生素/抗真菌药(ABAM；100x，Invitrogen)，500μL胰岛素-转铁蛋白-硒补充剂(100x，Gibco)，500个非必需氨基酸(NEAA；100x，Invitrogen)，50μLβ-巯基乙醇(1000x，Sigma-Aldrich)，10μL的50ng/μL人碱性成纤维细胞生长因子(bFGF，Sigma-Aldrich)，并加入多达50mL的敲除Dulbecco改良的Eagle培养基(DMEM；Invitrogen)。储存在4℃。

4.Accutase(Millipore)。

生殖系嵌合体的产生和转基因

基因转移到鸡PGC中

1.Lipofectamine 2000(Invitrogen)。

2.Opti-MEM培养基(Invitrogen)。

3.转染培养基(不含ABAM的PGC培养基；50mL)：3.75mL FBS(Hyclone)，1.25mL鸡血清(Sigma-Aldrich)，500μL GlutaMAX-I补充剂(100x，Invitrogen)，500μL核苷(100x，Millipore)，500μL胰岛素转铁蛋白硒补充剂(100x，Gibco)，500μL NEAA(100x，Invitrogen)，50μLβ-巯基乙醇(1000x，Sigma-Aldrich)和10μL 50ng/μL bFGF(Sigma-Aldrich)，并添加敲除DMEM(Invitrogen)至50mL。储存在4℃。

4.PBS，不含Ca2或Mg2。

5.HBSS，不含Ca2或Mg2。

6.制备1μg/μL的质粒DNA。

转基因PGC的体外增殖和选择

1.HBSS，不含Ca2或Mg2(Hyclone)。

2.血细胞计数器。

3.台盼蓝，0.4％(Invitrogen)。

4.倒置荧光显微镜(Leica Microsystems)。

5.

选择性抗生素(Gibco)。

PGC移植入接受卵中

1.小直径(25μm)玻璃微量移液器(由微电极拉制仪(Shutter Instrument Co.)和微型研磨机(NARISHIGE)制成)。

2.口控移液器。

3.HBSS，不含CaCl₂或MgCl₂(Hyclone)。

4.HH阶段14-17的接受鸡胚。

5.不含Ca2或Mg2的PBS(Hyclone)。

6.移液器清洗液。0.1％高压灭菌蒸馏水中的过氧化氢(Sigma-Aldrich)。

7.钳子。

8.带照明器的体视显微镜。

9.热熔胶棒和胶枪。

10.封口膜。

11.供体PGC在HBSS中以3_103个细胞/μL制备。

测试交叉

1.野生型韩国Ogye(KO)雌性鸡。

2. 1mL注射器。

3.PBS，不含Ca2或Mg2(Hyclone)。

供体衍生后代和转基因鸡验证

1.DNeasy血液和组织试剂盒(Qiagen)。

2.供体PGC特异性引物组。

3.转基因特异性引物组。

4.PCR机。

5.PCR试剂：PCR缓冲液，dNTP，Taq聚合酶。

6.琼脂糖

7.TAE缓冲区。

8.电泳机。

实验步骤

荧光测定

实验的完整设置包括一个激光源、一个能够将卵定位在允许卵中表达报告基因的细胞暴露于所述激光源的适当位置的保持器或支架，透镜，滤光器，检测器支架和检测器，如图1所示。样品与透镜之间以及透镜与检测器之间的距离约为20厘米。透镜的焦平面约为10厘米，滤光器放置在此处。

通过将滤光片放置在检测器之前并覆盖检测器的所有周围区域，以确保散射光不会绕过滤光器，可以检测出最佳条件。

使用了三种类型的激光器，其初始功率为I₀，并且滤光器如下表2所示：

表2：使用的光源：

将转染的GFP或RFP表达细胞注射到卵中

将HEK细胞维持在DMEM培养基中，该培养基补充有1％的L-谷氨酰胺，10％胎牛血清(FBS)和1％PenStrep(青霉素+链霉素)(Biological industries，以色列)。细胞在37℃，5％CO₂的潮湿培养箱中生长。每周更新培养基2-3次，并且细胞计数保持在1×10⁵至3×10⁵细胞/mL之间。将细胞传代培养并重悬于新鲜培养基中，如下所示：

1.从烧瓶中除去上清液，使细胞粘附到烧瓶表面。

2.将移出的细胞重悬于5mL新鲜培养基中

第二次继代培养后，根据制造商规程，使用PolyJet^TM体外DNA转染试剂(SignaGenLaboratories，MD，USA)，用2μg质粒DNA转染细胞。将两个质粒分别转染到细胞中。如上所述的GFP质粒和RFP质粒。

随后，以10⁶细胞/ml的浓度制备转染的细胞(RFP)。然后根据表3和表4将总体积为100μl的细胞注射到中心的新鲜鸡卵中。

表3：RFP注入

在第二个实验中，细胞如前所述培养并转染。然后将细胞转移至PBS或50％甘油中(以控制分散)，并注入中心的新鲜卵中。表4公开了不同的注入卵。

表4：RFP或GFP注射

雄性鸡细胞系

雄性细胞，特别是鸡的鸡鸡(肝脏；化学诱导；用鸡雌激素受体基因转染)，在添加了1％L-谷氨酰胺，10％胎牛血清(FBS)的Waymouth MB 752/1培养基中生长，以及1％的PenStrep(青霉素+链霉素)(以色列生物产业)。培养瓶(T25)用0.1％明胶包被。每3天更新一次培养基。使细胞在37℃，5％CCh的潮湿培养箱中生长。

雌性鸡细胞系

使用了来自ATCC的鸡成纤维细胞雌性细胞系UMNSAH/DF-1(

CRL-12203^TM)。表5给出了有关该单元的更多详细信息：

表5：雌性鸡细胞系

生物	Gallus gallus,鸡
		细胞类型	自发转化的成纤维细胞
产品形式	冷冻
		形态学	成纤维细胞
培养特点	贴壁
		年龄	妊娠10天
性别	雌性

雌性细胞在补充有1％L-谷氨酰胺、10％胎牛血清(FBS)和1％PenStrep(青霉素+链霉素)(Biological industries，以色列)的DMEM培养基中培养。细胞在加有5％CO₂的37℃的湿润培养箱中生长。培养基每周更新2-3次。

PGC细胞培养

在孵化6.5天后从白来亨鸡(WL)胚胎中获取胚胎性腺，然后用磁活化细胞分选仪(MACS)处理回收的性腺细胞，以分离总胚胎性腺细胞中的PGC。PGC在KO-DMEM(LifeTechnologies)中生长，其中40％在水牛大鼠肝细胞(BRL，ATCC)上预处理，并补充7.5％胎牛血清(Hyclone)、2.5％辐照鸡血清、1X非必需氨基酸、2mM谷氨酰胺、1mM丙酮酸钠、0.1mMβ-巯基乙醇(均来自Life Technologies)、4ng/ml重组人成纤维细胞生长因子、6ng/ml重组小鼠干细胞因子(均来自R&D Systems)，并在BRL细胞的辐射饲养层。每周将细胞传代3次到新鲜的饲养层上。

无限制(RF)克隆

gRNA插入Cas9-SmartNuclease^TM载体通过应用无限制性方法进行(Peleg Y等,J.Struct.Biol.172(1):34-44(2010)2010)。引物购自Sigma-Genosys(Rehovot，以色列)，随后的RF反应使用Phusion聚合酶(Thermo Scientific，Hudson，NH，美国)进行。分别使用MEGAspin试剂盒和DNA-spin质粒DNA纯化试剂盒(Intron Biotechnology，Daejoen，韩国)进行质粒纯化。

转染鸡的W或Z染色体

使用PolyJet^TM将细胞与每种质粒的2μg DNA共转染(请参见下面的详细信息)。根据制造商的说明，进行体外DNA转染试剂(SignaGen Laboratories,MD,USA)。两种质粒的共转染如下：

1.pDsRed带有鸡Z染色体左右臂或W染色体左右臂和CMV-hspCas9-H1-gRNA(测定)。

2.pCMVGluc带有鸡Z染色体左右臂或W染色体左右臂和CMV-hspCas9-H1-gRNA(对照)。

然后将细胞用新霉素抗性接种，并以每孔10⁵个细胞的密度接种在48孔板中。3天后，添加40μl N1新霉素以选择具有报告基因的稳定整合的细胞。

DNA分析以整合入Z或W染色体

为了验证染色体整合，使用了以下策略。分离细胞，提取其中一半的DNA，并在琼脂凝胶(1％)上电泳。切割并清洗基因组DNA(将质粒DNA留在凝胶上)。使用以下引物进行PCR测定。产物在凝胶上分离，然后测序。由于插入片段太长，无法通过PCR测定法检测到，因此设计了滑动窗口PCR测定法，可用于初始PCR产物。

a.具有插入物的细胞系的测定(包括左臂的一部分、CMV增强子、启动子和MCS以及dsRED2的一部分)：

左引物-TTGGTGTGTGCTAATAGGCAGT，如SEQ ID NO.49所示；右引物-TAGTCCTCGTTGTGGGAGGT，如SEQ ID NO.50所示，产物大小：1489bp。

b.具有插入物的细胞系的测定(包括侧接Z染色体的一部分(到臂)、左臂、以及CMV增强子的一部分、启动子)：

左引物-GCATTGATCTGTCCAGTTGC，如SEQ ID NO.51所示，右引物-TACTGCCAAAACCGCATCAC,如SEQ ID NO.52所示，产物大小：1462bp。

转基因鸡的制备

将浓缩的载体(可以是滴度为约10⁷MOI的慢病毒或质粒DNA)注射到新产卵的25个胚胎中。每周进行三次注射。注射的胚胎在注射后3周孵化。这些是G0鸟。孵化后，立即从孵化雏鸡的CAM样品中提取DNA，并通过半定量PCR检测载体DNA的存在与否。2-3周龄的血样G0小鸡，并重复PCR筛选。G0小鸡的性成熟期为雄性16-20周，雌性20-24周。从大约16周开始对雄性鸡进行精液生产测试。雌性鸡每天都受精，育卵。将G1雏鸡孵化3周后，将每只雏鸡的翅带捆扎，并从壳中取出雏鸡绒膜尿囊膜(CAM)样品。从CAM样品中提取DNA并进行PCR筛选，以发现转基因的存在，预计该基因为单拷贝水平。重复筛查以确认并在2-3周后对血样DNA上的雏鸡进行交配。

在几周龄时，从G1禽类采集血液样品以制备用于PCR分析的基因组DNA。G1禽类用于繁殖G2。

PGC分离

1.将新鲜的卵(EGK阶段X)(例如，韩国Ogye(KO))在37℃下孵育50-54h(HH阶段14-17)以分离血液PGC。将已孵化的卵水平放置在蛋板上，并使用含70％乙醇的消毒棉轻轻擦拭蛋壳。

2.用尖锐的镊子小心地打碎蛋壳(直径小于1厘米)以分离全血细胞。

3.使用25μm细磨玻璃针头和移液管从胚胎背主动脉中收集约2-3μL全血细胞。与500μL PBS混合。对于PGC的微量注射，可以使用口移液器和直径为20-25μL的玻璃微量移液器。玻璃微量移液器由微电极移液器(Shutter Instrument Co.)制成，并使用微型研磨机(NARISHIGE)以25度研磨。

4.将全血细胞转移至1.5mL无菌管中，离心(250x g，5分钟)，然后除去上清液。

5.对于性腺PGC分离，将新鲜的卵在37℃下孵育5.5天(HH 20-26)。用尖锐的镊子从HH阶段20-26的胚胎中提取胚胎性腺，并在37℃的培养箱中与500μL的0.05％胰蛋白酶EDTA一起孵育5分钟。

6.加入50μL FBS进行灭活，并离心(250x g，5分钟)并除去上清液。

7.将全血细胞或分离的性腺细胞重悬于1mL PBS中，并以1：200稀释度应用抗SSEA-1抗体(Santa Cruz Biotechnology，SC-21702)，然后在室温(ST)下孵育混合物15分钟。

8.每10⁷个总细胞加入5mL MACS缓冲液(PBS中的0.5％BSA和2mM EDTA，pH 7.2)，洗涤细胞以除去未结合的一抗，并离心(250x g，5分钟)。

9.完全吸出上清液，并将细胞沉淀重悬于每10⁷总细胞80μL MACS缓冲液中。

10.每10⁷总细胞添加20μL大鼠抗小鼠IgM微珠(Miltenyi Biotec.130-047-301)。对于更高的细胞数量，相应地扩大缓冲液的体积。

11.在2-8℃下用抗体孵育细胞20分钟。

12.通过每10⁷总细胞中加入2mL MACS缓冲液洗涤细胞并离心(250x g，5min)。

13.完全吸出上清液，并在500μL MACS缓冲液中重悬最多10⁸个细胞。

14.将色谱柱放在合适的MACS分离器的磁场中。

15.通过用500μL MACS缓冲液冲洗来准备色谱柱。

16.将细胞悬液加到柱子上，并用500μL缓冲液洗涤柱子3次。当柱子储库为空时，添加新的缓冲区。

17.从分离器中取出色谱柱，并将其放在合适的收集管上。

18.将1mL MACS缓冲液添加到色谱柱中，然后通过将柱塞牢固地推入色谱柱中，立即冲洗出磁性标记的细胞。

19.将含有PGC的分离的细胞转移到预热的PGC培养基中(每1x 10⁵纯化的PGC含1mL PGC培养基)。

PGC培养

1.将含有PGC的分离的细胞转移至预热的PGC培养基(每1×10⁵纯化的PGC 1mLPGC培养基)中，并在37℃下孵育。

2.生长7-14天后，大多数原代培养的PGC会形成菌落并失去细胞菌落的聚集体。

3.轻轻移液并离心(200x g，5分钟)后，可以用培养基轻轻移出悬浮的PGC菌落。

4.用Accutase(每约5x10⁵个PGC使用1mL Accutase溶液)分解细胞沉淀。

5.离心(200x g，5分钟)，然后将细胞沉淀重悬于PGC培养基中。

6.将悬浮的PGC接种到12孔板中(12孔板的每孔中在1mL PGC培养基中含1x 10⁵培养的PGC)。

7.PGC可以每3-4天进行常规传代培养。

基因转移到鸡PGC中，种胚嵌合体生产和转基因

基因转移到鸡PGC中

1.将包含CAGG-PBase(pCyL43B)的4μg辅助质粒和包含报告基因(RFP)和可选的可选标记物(例如新霉素抗性基因)的6μg piggyBac转座子(pCyL50)与100μL Opti-MEM(Gibco)和在室温下孵育5分钟。对于CRISPR/Cas转染，将2.5μg CMVRFP表达质粒载体，2.5μg Cas9和向导RNA表达质粒载体与100μL Opti-MEM(Gibco)混合，并在室温下孵育5分钟。

2.将10μL Lipofectamine 2000试剂(Thermo Fisher-Invitrogen)与100μLOpti-MEM混合，并在室温下孵育5分钟。

3.将质粒与Opti-MEM混合，将Lipofectamine 2000试剂与Opti-MEM混合，并在室温下孵育20分钟。

4.在孵育过程中，收获培养的PGC并离心(200x g，5分钟)。丢弃上清液。

5.向收获的PGC中加入1mL Accutase(Millipore)，并在37℃孵育10分钟。

6.使用血细胞计数器(Marienfeld)确定PGC的数量，并在具有1mL不含抗生素的PGC培养基的12孔板中接种5×10⁵个PGC。

7.将DNA-Lipofectamine复合物应用于PGC，并在CO₂培养箱中于37℃孵育1天。

8.收获转染的PGC并离心(200x g，5分钟)。除去上清液。

9.用1mL HBSS洗涤PGC三次，并用含有抗生素的PGC培养基悬浮。

转基因PGC的体外增殖和选择

1.转染后第二天，在含有100μg/mL G418(用于新霉素抗性基因)的PGC培养基中选择转染的PGC。

2.使用荧光显微镜监测报告基因的表达。

3.每3-4天对PGC进行继代培养。一个完整的选择期最多需要3周。

4.如果转染的质粒载体中没有药物选择标记，则可以通过FACS对表达荧光蛋白的PGC进行分类。

PGC移植到接受卵中

1.在相对湿度为60-70％的空气中，在37℃的温度下将受精卵孵化至HH14-17阶段。

2.收获转染的PGC并离心(200x g，5分钟)并除去上清液。

3.向收获的PGC中加入1mL Accutase(Millipore)，并在37℃下孵育10分钟。

4.离心(200x g，5分钟)。丢弃上清液。

5.将PGCS悬浮在HBSS(Hyclone)中。

6.在接受卵的尖端上做一个小窗口，然后用微量移液管将2μL等分试样(含超过3,000个PGC)微量注入接受者胚胎的背主动脉中。

7.使用胶枪用石蜡膜密封受体胚胎的卵窗口，将卵的尖端朝下孵育，直到在相对湿度为60-70％的空气中于37℃孵化。

监测胚胎性腺中的基因修饰的PGC

1.在相对湿度为60-70％的空气中，在37℃下孵化达HH 28-30阶段的接受卵。

2.在胚胎第6天解剖性腺。

3.使用荧光显微镜监测胚胎性腺中的荧光蛋白表达。

测试交叉

1.1周内从性成熟受体和野生型(WT)鸡中收集两次精液。

2.从成年雄性接受者和野生型雄鸡中分别引入50μL精液至野生型产蛋母鸡和成熟雌性接受者。

3.人工授精后第二天，从野生型产蛋母鸡和成年雌性接受者的卵中收集卵，将卵的尖端朝下孵化直至在相对湿度为60-70％的空气中于37℃孵化。

实施例1

使用不同颜色的激光和滤光器进行荧光分析以鉴定家禽的性别

光学荧光系统

为了证明在视觉上识别卵内家禽性别的可行性，与蓝色荧光或红色荧光报告基因相比，评估了绿色荧光的使用。

使用蓝色激光、绿色激光或红色激光确定完整卵或分离为蛋清、蛋黄和壳的卵的自发荧光。空蛋(壳)和完整蛋的比较表明自发荧光水平无显著差异(数据未显示)。

表6描述了卵的不同组成部分所产生的散射和自发荧光强度。

重要的是，注意到背景噪声(不带激光)约为4nW，而在存在激光(532nm)的情况下，由于绕过滤光片(通过660nm以上的低通滤光器)的光散射，背景噪声约为12nW。

表6使用3种不同的荧光激光对卵各部分的散射和自发荧光强度

分析了将蓝色激光(473nm)与绿色(+500nm)或红色滤光器(590-650nm)结合使用在向完整卵中添加或不添加不同浓度的荧光素(1μM，10mM)的情况。总结在图2中。看起来绿色自发荧光较大，但是使用高浓度的荧光素可以检测到荧光强度。

分析了将绿色激光(532nm)与深绿色(540-580nm)或红色滤光器(+660nm)结合使用并向完整的卵中添加或不添加罗丹明B(10μM)的情况，并且总结在图3中。看起来在40mW以上时绿色滤光片可检测到染料的荧光发射(大了将近2倍)。但是，使用红色滤光器无法观察到差异。

分析了将绿色激光(532nm)与红色滤光器A(590-650nm)或红色滤光片B(+660nm)结合使用并在整个卵中添加或不添加dir(10μM)的情况。总结在图4中。看起来在80mW以上，使用红色滤光器A可以检测到染料的荧光发射，而通过使用红色滤光器B(+660nm)，只能观察到适度的差异。

分析了将红色激光(632.8nm)与红色滤光片(+660nm)或绿色滤光片(540-580nm)结合使用并向整个卵添加或不添加dir(10μM)的情况，并总结在图5中。有或没有荧光染料几乎没有显示出强度差异。

仅使用蛋壳重复所有实验。观察到相似的结果(数据未显示)。

这些观察结果证明了通过卵壳检测RFP的可行性。

实施例2

加入卵内的RFP或GFP转染的细胞的荧光

为了说明卵内检测RFP表达细胞的可行性，本发明人接下来检查了在将荧光蛋白(特别是RFP或GFP)转染的细胞注射入完整的卵后是否可以检测到该细胞。

更具体地说，如实验程序中所述，用GFP或RFP载体转染HEK细胞。激发后检查GFP和RFP转染的细胞的荧光。图6(GFP)和图7(RFP)清楚地表明，GFP和RFP均由转染的细胞表达，并且可以观察到荧光信号。然后按照实验步骤中所述将HEK转染的细胞注入新鲜卵中，并检测卵的荧光强度。

首先，有或没有表达红色荧光蛋白RFP的细胞的卵的荧光强度的特征是用绿色激光(532nm)和+650nm的红色滤光片激发卵。图8显示，在卵的五个不同位置上测得的没有RFP的卵的荧光强度非常相似。图9显示了当卵在中心被激发时，使用不同浓度的表达RFP的细胞测得的荧光强度。清楚观察到RFP浓度与检测器强度之间的相关性。

为了检查在RFP表达细胞的存在下的卵的位置，即由激光提供的激发的确切位置，是否影响荧光强度，进行了数次测试。似乎在激发过程中，检测器上的强度随着卵的位置而大大改变。这是可以预料的，因为在将表达RFP的细胞注射到卵中后，RFP分布不均匀。图10显示了在激发过程中在卵的特定位置观察到的最大强度，该强度对应于表达RFP的细胞浓度最高的位置。该图表明可以检测到最少约3000个细胞。

在胚胎中，在本领域中已知性别细胞，PGC位于卵的发育阶段X处在新产卵的表皮细胞的中心。应当指出，胚胎总是面对蛋黄袋的上侧。

上面揭示的结果表明，在位于蛋后几毫米并靠近蛋黄的区域激发时，可以检测到最大的RFP发射。

在卵中注入表达RFP的细胞后，重复一周的实验。结果相似，表明RFP染料未在卵内扩散。

在有或没有RFP表达细胞的情况下，使用绿色激光(532nm)和+650nm红色滤光片检查了PBS和甘油对卵荧光强度的影响。如图11A和11B所示，似乎甘油和PBS均不影响表达RFP的细胞进入卵的荧光强度测量。

随后，在有或没有GFP表达细胞的情况下，使用蓝色激光(483nm)和+500nm的滤光器检查了PBS和甘油对卵荧光强度的影响。似乎在任何给定的浓度(1000、3000、10,000和30,000细胞)中都无法检测到表达GFP的细胞，如图12所示，例如具有30,000个表达GFP的细胞。使用三种不同的滤光器(+500nm、530-550nm和540-580nm)可获得相同的结果。

为了进一步评估使用RFP作为报告基因的令人惊讶的优势，最终比较了GFP和表达RFP的细胞的荧光，如图13所示。参数R被定义为表示荧光蛋白(FP)强度(I_FP)和自发荧光强度(I_自发荧光)之间的比率。

针对不同浓度的GFP和RFP表达细胞计算R参数。如图所示，似乎在任何给定浓度下都无法检测到表达GFP的细胞(如图13所示的1000和30,000个细胞)。

另一方面，即使在低浓度下，表达RFP的细胞(1000个表达RFP的细胞)也提供了显著的R参数值。在高浓度的RFP表达细胞(30000个表达RFP的细胞)下，R值达到3，从而清楚地表明可以容易地在激活的卵中检测到RFP报告基因。

主要发现总结如下：

1.蓝色有很强的自发荧光，而绿色和红色没有自发荧光。

2.主要的自发荧光来自蛋壳。

3.该系统可以检测浓度相对较低且激发功率较低的绿色和红色荧光染料。

4.由于自发荧光，几乎检测不到蓝色荧光(仅在mM的染料浓度下)。

5.卵内的RFP很容易检测到。

6.在此系统中无法检测到GFP类型。

7.卵内RFP表达细胞的确切位置对于确定激发区域很重要。

8.注射后14天内，RFP染料未扩散到卵中。

9.PBS或甘油也不会影响RFP检测。

这些结果清楚地表明，可以在早期发育阶段检测到表达整合在性别染色体中的RFP基因的胚胎，其中约有1000个细胞表达RFP。

实施例3

向导RNA载体的设计

为了将RFP报告基因掺入性别染色体W或Z，选择了CRISPR Cas9介导的HDR方法。然后从两个性别染色体中寻找相关的gRNA位点。

雌性Z染色体整合

对雌性鸡Z染色体的SEQ ID NO：15表示的区域9156874-9161874，SEQ ID NO：16表示的区域27764943-27769943，SEQ ID NO：17表示的区域42172748-42177748，SEQ ID NO：18表示的区域63363656-63368656和SEQ ID NO：19表示的区域78777477-78782477进行向导RNA的分析。更具体地，为了引导RFP整合入Z染色体，接下来制备了称为Z染色体基因座chrZ_42174515_-1的gRNA7的gRNA，其包含核酸序列GTAATACAGAGCTAAACCAG，也由SEQ IDNO：26表示。

该步骤根据“PrecisionV Cas9 SmartNuclease Vector System”用户手册进行。更具体地说，设计了两种用于克隆的引物：ChZgRNA_正向：TGTATGAGACCACGTAATACAGAGCTAAACCAG，如SEQ ID NO.53所示，ChZgRNA_反向：AAACCTGGTTTAGCTCTGTATTACGTGGTCTCA，如SEQ ID NO.54所示。使引物退火以在包含5μM的每种引物的反应混合物中产生双链体。将混合物在95℃下孵育5分钟，将其移出以冷却至RT。

之后，通过如下设置的连接反应将双链体克隆到所提供的线性Cas9载体中：1μl线性化载体，3μl退火寡核苷酸混合物，1μl连接缓冲液和0.25μl Fast连接酶。将混合物在25℃温育5-7分钟。

将混合物转化入DH5α感受态细胞，并将细胞在含有50μg/ml卡那霉素的LB平板上培养，并在37℃下孵育过夜。

第二天，随机选择两个菌落，并使其在LB/卡那霉素培养基中于37℃摇动过夜。

第二天，使用Qiagen mini-prep试剂盒制备质粒DNA，并使用提供的测序引物进行测序。

在又一些其他实施方案中，通过无限制克隆方案选择如下四个另外的向导RNA，分别合成并克隆到包含野生型Cas9核酸酶的Cas9 SmartNuclease载体(Horizon)中：gRNA3：ACAGACCTATGATATGT，如SEQ ID NO.11所示；gRNA4：CGATTATCACTCACAAG，如SEQ ID NO.12所示；gRNA5：CTGGTTAGCATGGGGAC，如SEQ ID NO.13所示；gRNA6：GTAAAGAGTCAGATACA，如SEQID NO.14所示。

适用于整合入Z染色体内特定基因座的gRNA序列的其他非限制性实例可以包括但不限于：Z染色体基因座chrZ_9157091_1的gRNA8，其包含核酸序列ACAGACCTATGATATGTGAG，也由SEQ ID NO：27表示；Z染色体基因座chrZ_27767602_-1的gRNA9，也包含核酸序列GAGCTTGTGAGTGATAATCG，也由SEQ ID NO：28表示；Z染色体基因座chrZ_78779927_1的gRNA10，包含核酸序列GTAAAGAGTCAGATACACAG，也如SEQ ID NO：29所示；以及Z染色体基因座chrZ_63364946_-1的gRNA 11，包含核酸序列CAGTGGGTACTGAAGCTGTG，也由SEQ ID NO：30表示。

这些gRNA几乎没有预测的脱靶位点，其中没有一个在已知的编码序列中。

雌性W染色体整合

雌性鸡的W染色体的1022859-1024215区域，其包含如SEQ ID NO.3所示的核酸序列，分析指导RNA的设计。通过无限制克隆方案选择两个合成的指导RNA，分别合成并克隆到包含野生型Cas9核酸酶的Cas9 SmartNuclease载体(Horizon)中：gRNA1：GCACTAGGAACCAGCAGCAG，如SEQ ID NO.1所示，和gRNA2：GTAGCCCCAAGAGGGCTAGG，如SEQ IDNO.2所示。

表7列出了这两种gRNA的预测参数：

表7

gRNA参数	gRNA1	gRNA2
			sgRNA设计工具	0.506	0.63
sscore	0.8677	0.5323
			sgRNA得分	94.8	99.9

实施例4

RFP靶向载体的设计

将与雌性W染色体或雌性Z染色体基因座的上述合适侧翼序列同源的侧翼序列引入表达RFP的载体，特别是pDsRed1-N1质粒。

为了将本发明的报告基因整合到Z染色体内的特定基因座中，可以使用包含如SEQID NO.31所示的核酸序列的左臂以及包含如SEQ ID NO.32所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：26的gRNA7引导的特定基因座上。

更具体地，为了将本发明的报告基因整合到由gRNA7(具体地，如GTAATACAGAGCTAAACCAG，如SEQ ID NO：26所示)引导的特定基因座，使用RF方法，在pDsRed1-N1质粒中CMV增强子的上游克隆了“左臂”。

使用了以下引物：

正向引物：

ACGGGGTCATTAGTTCATAGCCCATATATGGTGAACGGATAGGCAGCAAGC，如SEQ ID NO.55所示(在质粒中包含5'左臂序列和整合位点的30个核苷酸)。

反向引物：

GGCGGGCCATTTACCGTAAGTTATGTAACGTGAGGAAGGGTCTGTTACTGGA，如SEQ ID NO.56所示。

使用以下引物将右臂克隆到Neo抗性基因的下游。

正向引物：

TTCTATCGCCTTCTTGACGAGTTCTTCTGAGTCATGTCGGTGGAGGAGAAA，如SEQ ID NO.57所示(3'Neo抗性序列以绿色标记)

反向引物：

GTGATGGCAGGTTGGGCGTCGCTTGGTCGGGCATGGGATGTTAAAGAGAAGCT，如SEQ ID NO.58所示(在橙色载体中的序列3'至Neo基因)。

通过测序验证克隆以确保正确整合。

注意，由于在整合位点侧翼的增强子区域中16个核苷酸(CGGTAAATGGCCCGCC，如SEQ ID NO.59所示)的重复，从CMV增强子中缺失了193个核苷酸。

在另一些实施方案中，也可以使用如下gRNA克隆RFP报告基因：gRNA3，如SEQ IDNO.11所示的；gRNA4，如SEQ ID NO.12所示；gRNA5，如SEQ ID NO.13所示；gRNA6，如SEQ IDNO.14所示。

为了使用gRNA3进行克隆，提供了包含由SEQ ID NO.41表示的核酸序列的“左臂”和包含如SEQ ID NO.42所示的核酸序列的“右臂”。为了使用gRNA4进行克隆，提供了包含由SEQ ID NO.43表示的核酸序列的“左臂”和包含如SEQ ID NO.44所示的核酸序列的“右臂”。为了使用gRNA5进行克隆，提供了包含由SEQ ID NO.45表示的核酸序列的“左臂”和包含如SEQ ID NO.46所示的核酸序列的“右臂”。为了使用gRNA6进行克隆，提供了包含由SEQ IDNO.47表示的核酸序列的“左臂”和包含如SEQ ID NO.48所示的核酸序列的“右臂”。

在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，使用包含如SEQ ID NO.33所示的核酸序列的左臂和包含如SEQ ID NO.34所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：27的gRNA8引导的特定基因座上。在另外的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，使用包含如SEQ ID NO.34所示的核酸序列的左臂和包含如SEQ ID NO.35所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：28的gRNA9引导的特定基因座上。在进一步的实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，使用包含如SEQ ID NO.37所示的核酸序列的左臂和包含如SEQ ID NO.38所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：29的gRNA10引导的特定基因座上。在又一个实施方案中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，为了将本发明的报告基因整合到Z染色体内的特定基因座中，使用包含如SEQ ID NO.39所示的核酸序列的左臂和包含如SEQ ID NO.40所示的核酸序列的右臂将本发明的报告基因整合到由SEQ ID NO：30的gRNA11引导的特定基因座上。

对于雌性W染色体，可以使用如SEQ ID NO.1所示的向导1(gRNA1)或者如SEQ IDNO.2所示的向导2(gRNA2)克隆报告基因，特别是克隆RFP。对于使用gRNA1进行克隆，提供了包含如SEQ ID NO.4所示的核酸序列的“左臂”以及包含如SEQ ID NO.5所示的核酸序列的“右臂”。为了使用gRNA2进行克隆，提供了包含如SEQ ID NO.6所示的核酸序列的“左臂”以及包含如SEQ ID NO.7所示的核酸序列的“右臂”。

更进一步，CMV启动子上游区域的“左臂”包含如SEQ ID NO.8所示的核酸序列，并且“右臂”在新霉素抗性下游区域可包含如SEQ ID NO.9所示的核酸序列，或在polyA位点下游区域可包含SEQ ID NO.10。

实施例5

将RFP报告基因整合到雌性鸡细胞系的Z染色体中

用两种质粒，即含有鸡Z染色体左右臂的pDsRed和含有CMV-hspCas9-H1-gRNA的质粒共转染雌性鸡细胞系，具体如实验步骤部分所述。

所用的gRNA序列是由SEQ ID NO：26表示的gRNA 7。表8提供了有关所用引导RNA的更多详细信息。

表8所用gRNA 7的特征

然后用红色荧光激发转染的细胞。如图14所示，转染是阳性的。收集照明细胞，提取基因组DNA，并进行滑动PCR测定(如实验程序中所述)。然后将PCR片段进行SANGER测序，并获得如图15所示的整合序列，表明RFP基因已成功整合到Z染色体中。

总结来说，这些结果表明：

·建立了成功的雌性鸡细胞系培养程序

·建立了将RFP报告基因和CRISPR Cas9系统成功转染至雌性鸡细胞系的方法

·红色激发产生强烈的荧光信号

·建立了将RFP报告基因成功点整合(point integration)到Z染色体

实施例6

CRISPR处理的细胞的生殖系传播

利用原始生殖细胞(PGC)生产转基因鸡在动物生物技术和生物建模方面具有许多优势。因为鸡胚是卵生的，所以早期的PGC很容易获得，可以在体外进行实际应用，包括遗传材料的恢复，基因组编辑和转基因研究。为建立来自不同胚胎来源的鸡PGC的培养系统，已经做出了巨大的努力，并且已经证明，只有鸡PGC可以在体外无限期地保持而不丧失其性能。

更具体地说，在鸡中，PGC首先在Eyal-Giladi和Kochav(EGK)的X期胚胎的上皮细胞中分离，然后向下移至透明带区域的亚胚层，然后进入生发新月并进入血流。通过循环系统迁移后，它们到达生殖器脊。

基因型发育中的这些独特特征使其可以通过将遗传操纵的PGC注射到受体卵的血管中而用于生产转基因鸡。

如实验程序中所详述，将上述两种载体，特别是gRNA/Cas9载体和报告基因载体共转染至PGC。鉴定出稳定的克隆后，扩增细胞并通过PCR确认RFP整合。在第14-16阶段(H&H)将已确认的克隆注射到受体鸡胚中。将注射的胚胎转移到替代壳中，并孵育直至在37℃孵化。孵化后通过W或Z染色体的PCR确定小鸡的性别。

雌性和雄性嵌合体生长到性成熟，并繁殖成野生型雄性和雌性鸡。评估孵化的小鸡的RFP表达，并通过PCR确认种系后代携带目标RFP。

序列表

<110> 艾吉伊特有限公司

<120> 对未孵化卵中的禽类胚胎进行性别确定的方法及其用具

<130> 2562455

<150> US 62/510,921

<151> 2017-05-25

<160> 67

<170> PatentIn 版本 3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于W染色体的向导1

<400> 1

gcactaggaa ccagcagcag 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于W染色体的向导2

<400> 2

gtagccccaa gagggctagg 20

<210> 3

<211> 1460

<212> DNA

<213> 人工序列

<220>

<223> galGal5_dna范围=chrW:1022859-1024215

<400> 3

tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60

gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120

ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180

gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240

gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300

ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360

cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420

tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480

ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540

ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600

aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660

ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720

aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780

cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840

aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900

gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960

tagtagcccc aagagggcta gggggcctca aaatcatgga acccaactcc ctggagtaga 1020

agggtcaggt aatgagtcca aaagagggac tataggaacc atgccagtaa cagagaggac 1080

tcacagccag catagggtcg tgctgtaagc cctgttgagg cagttggaaa tgacagttcg 1140

gtagtagtta aggtaccctt ttaaattaca gatttaaaca tttggaaagc agctgctggc 1200

agctaccgtg atgatcctaa acgggtagct aatgcttttg aaatgatgat taaaactcag 1260

gaactggata ggaaagatat ggaatttatt atgcacatgt tgtttgatag tacagaaaaa 1320

taaatgattc actagaccac acggacccaa gtggaggatc aggtaatggc aggggttttg 1380

cttggatgta atgctggaaa ggacaagagt cctttcctgt cctggggagg atttagaggt 1440

ggttagacct tggggaggag 1460

<210> 4

<211> 592

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA1进行克隆，W染色体，“左臂”

<400> 4

tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60

gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120

ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180

gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240

gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300

ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360

cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420

tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480

ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540

ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc ag 592

<210> 5

<211> 848

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA1进行克隆，W染色体，“右臂”

<400> 5

tggcagattt gtgatcatgg aaagaattgg tgggagcata cggcaccagg actcagataa 60

gatagctagc taaggtgatg aattgtagat ggtgtcagat aacgaaagaa gaaaaacaaa 120

tgtaataaag tgttaaatgc caatatgttt tttataatga ggcaatatcc tgaatggcat 180

tagtgtggga tcaatttggc ccagatgacc ctctgatttt aatggtagaa aatgataaga 240

gagagaggga gaaaggaaga gagtgtaaaa cgtgttgttc agcatgtagt attggactga 300

gatgcttcaa gcgaaacaag aatgagcagg aggaggattt agagatgcta gtagccccaa 360

gagggctagg gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa 420

tgagtccaaa agagggacta taggaaccat gccagtaaca gagaggactc acagccagca 480

tagggtcgtg ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag 540

gtaccctttt aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat 600

gatcctaaac gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg 660

aaagatatgg aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac 720

tagaccacac ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat 780

gctggaaagg acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg 840

gggaggag 848

<210> 6

<211> 962

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA2进行克隆，W染色体，“左臂”

<400> 6

tcgggctaac attagacccg ttgtgtctta atcctgccgt cgggtataca tatactaaaa 60

gaacctcctt tccctcctat aaatcggagc gagacaaggc attctttttt tattattatt 120

ttggttgcct gcccatcaga tgtaatgaaa gttgcacagg gtagggctaa gaaggtaaag 180

gagttaaatt cccccgggag gttagagatt ccctgtattg tggttgcctg cccattagac 240

gtaacaaaag ttgtgaaggg taggactaag gatccaggta aagaggttag tcccccaggg 300

ttagagtccc tcctcagaag taaatgtaaa acataaccac ggtaattgtc gttgagtgcg 360

cttgtttgat tgttaattgt ttgtgctgtt attgtatgct gattgtttgt gttgttatta 420

tacaaagagc tcacatgcat cgttaaaatg ggcattggat cacctagggg tgagggaatt 480

ttgaaaaagt cacttttggg ctgtgtttta agtcattgga aagaaatagc tggatcccct 540

ggtggggttg cacagaagga tgatttaagt acgatggatg cctttgaggc aggcactagg 600

aaccagcagc agtggcagat ttgtgatcat ggaaagaatt ggtgggagca tacggcacca 660

ggactcagat aagatagcta gctaaggtga tgaattgtag atggtgtcag ataacgaaag 720

aagaaaaaca aatgtaataa agtgttaaat gccaatatgt tttttataat gaggcaatat 780

cctgaatggc attagtgtgg gatcaatttg gcccagatga ccctctgatt ttaatggtag 840

aaaatgataa gagagagagg gagaaaggaa gagagtgtaa aacgtgttgt tcagcatgta 900

gtattggact gagatgcttc aagcgaaaca agaatgagca ggaggaggat ttagagatgc 960

ta 962

<210> 7

<211> 478

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA2进行克隆，W染色体，“右臂”

<400> 7

gggcctcaaa atcatggaac ccaactccct ggagtagaag ggtcaggtaa tgagtccaaa 60

agagggacta taggaaccat gccagtaaca gagaggactc acagccagca tagggtcgtg 120

ctgtaagccc tgttgaggca gttggaaatg acagttcggt agtagttaag gtaccctttt 180

aaattacaga tttaaacatt tggaaagcag ctgctggcag ctaccgtgat gatcctaaac 240

gggtagctaa tgcttttgaa atgatgatta aaactcagga actggatagg aaagatatgg 300

aatttattat gcacatgttg tttgatagta cagaaaaata aatgattcac tagaccacac 360

ggacccaagt ggaggatcag gtaatggcag gggttttgct tggatgtaat gctggaaagg 420

acaagagtcc tttcctgtcc tggggaggat ttagaggtgg ttagaccttg gggaggag 478

<210> 8

<211> 669

<212> DNA

<213> 人工序列

<220>

<223> 用于CMV启动子的上游的“左臂”

<400> 8

aggcaaggct tgaccgacaa ttgcatgaag tcgggctaac attagacccg ttgtgtctta 60

atcctgccgt cgggtataca tatactaaaa gaacctcctt tccctcctat aaatcggagc 120

gagacaaggc attctttttt tattattatt ttggttgcct gcccatcaga tgtaatgaaa 180

gttgcacagg gtagggctaa gaaggtaaag gagttaaatt cccccgggag gttagagatt 240

ccctgtattg tggttgcctg cccattagac gtaacaaaag ttgtgaaggg taggactaag 300

gatccaggta aagaggttag tcccccaggg ttagagtccc tcctcagaag taaatgtaaa 360

acataaccac ggtaattgtc gttgagtgcg cttgtttgat tgttaattgt ttgtgctgtt 420

attgtatgct gattgtttgt gttgttatta tacaaagagc tcacatgcat cgttaaaatg 480

ggcattggat cacctagggg tgagggaatt ttgaaaaagt cacttttggg ctgtgtttta 540

agtcattgga aagaaatagc tggatcccct ggtggggttg cacagaagga tgatttaagt 600

acgatggatg cctttgaggc aggcactagg aaccagcagc gatgtacggg ccagatatac 660

gcgttgaca 669

<210> 9

<211> 911

<212> DNA

<213> 人工序列

<220>

<223> 用于抗新霉素下游区域的“右臂”

<400> 9

ttctatcgcc ttcttgacga gttcttctga cagtggcaga tttgtgatca tggaaagaat 60

tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120

gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180

ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240

accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300

aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360

aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420

aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480

catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540

gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600

atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660

gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720

ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780

caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840

tcctggggag gatttagagg tggttagacc ttggggagga gggttcgaaa tgaccgacca 900

agcgacgccc a 911

<210> 10

<211> 911

<212> DNA

<213> 人工序列

<220>

<223> 用于polyA位点下游区域的“右臂”

<400> 10

atctgtgtgt tggttttttg tgtgtctaga cagtggcaga tttgtgatca tggaaagaat 60

tggtgggagc atacggcacc aggactcaga taagatagct agctaaggtg atgaattgta 120

gatggtgtca gataacgaaa gaagaaaaac aaatgtaata aagtgttaaa tgccaatatg 180

ttttttataa tgaggcaata tcctgaatgg cattagtgtg ggatcaattt ggcccagatg 240

accctctgat tttaatggta gaaaatgata agagagagag ggagaaagga agagagtgta 300

aaacgtgttg ttcagcatgt agtattggac tgagatgctt caagcgaaac aagaatgagc 360

aggaggagga tttagagatg ctagtagccc caagagggct agggggcctc aaaatcatgg 420

aacccaactc cctggagtag aagggtcagg taatgagtcc aaaagaggga ctataggaac 480

catgccagta acagagagga ctcacagcca gcatagggtc gtgctgtaag ccctgttgag 540

gcagttggaa atgacagttc ggtagtagtt aaggtaccct tttaaattac agatttaaac 600

atttggaaag cagctgctgg cagctaccgt gatgatccta aacgggtagc taatgctttt 660

gaaatgatga ttaaaactca ggaactggat aggaaagata tggaatttat tatgcacatg 720

ttgtttgata gtacagaaaa ataaatgatt cactagacca cacggaccca agtggaggat 780

caggtaatgg caggggtttt gcttggatgt aatgctggaa aggacaagag tcctttcctg 840

tcctggggag gatttagagg tggttagacc ttggggagga gcaagtaaga tgcttttctg 900

tgctgcaata g 911

<210> 11

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体的向导3

<400> 11

acagacctat gatatgt 17

<210> 12

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体的向导4

<400> 12

cgattatcac tcacaag 17

<210> 13

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体的向导5

<400> 13

ctggttagca tggggac 17

<210> 14

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体的向导6

<400> 14

gtaaagagtc agataca 17

<210> 15

<211> 4980

<212> DNA

<213> 人工序列

<220>

<223> ENSGALG00000025945_ENSGALG00000023622|chrZ:9156874-9161874

<400> 15

cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60

gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120

ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180

caatgtgggc attgccgacc acagacctat gatatgtgag tggtgagtgg ggccaggaga 240

gcaggacagg agtgtggact cggaggcgcg ggcagaggag gtagctcaga gcatgagata 300

tattcgccag gtgtcagtgg acttctggca gtgcatactg cagagagctt tggttgctgg 360

ccatctggat gatgacaaaa tctcagccac agaccatgtg ggttggaaga gtcctcagga 420

gatcaccttt ccacctcctg ctaaagcaca ttccctacag tatgtttcac atgacaccgt 480

gctggcagat ttttaatatc atcagagaat gacactccat atcctctctg ggcagccttt 540

ttcagtgctc tgtcacccac aaagtaaagt atttgctcat gttctaatgg aacttcctat 600

gttctagttt gtgaccattg aaccttgttc tgtcactgga cagtgctgaa ggagcctggc 660

cctatccact tgactcccac actttacata tttacaagca tcgataagac ccccctcagt 720

cttctccaga ctagatagcc ccaggtctcc caaccattcc ttttatggga gatgcttcag 780

gcccctcatc acctctgtgg ccctctgctg gactgcctgc agtagttcca ggtttttttt 840

tttgaactgg ggagcccaga acttgacacg gtattccaga tgtggcctca ccagcgcaga 900

ggagagggga aggctcacct ccctcgacct ggtggccatg ttttttttaa cagacctcag 960

gataccactg gccttcttgg cccaagggca cactgctggc tcatggccca tgggttggct 1020

tccaggactc tcaggtcctt ctccgtagag ctcctctcaa gcaggacaac cctcagcctg 1080

tactgatgtg tgcggtgcgg ttattcctcc ccacgtgcaa gactctacat ctgccattgt 1140

taaatctcat aagcttcctc tctgcccaac tctccactgt gtacgggcct tagtgaatgg 1200

cagcacagac ttctggtgtg aggatagcat tcagaacaag ctgctgtacc ttcccagtca 1260

cagaggtgag ggtgactggc ttgtactttc ccagctttgc cttcttgccc ttttggaaga 1320

ctggagcgac attggccttc tggaggaaac ggtcctcagg cacccctcct gttctccatg 1380

acctttgaaa gatgatcgag agcaccttgg cagtcacttc tgccagctcc ttcagcacgc 1440

atgagtgcat cccgccagtg cccatggatt tgtgttcatt gaattagcct aggtgacctc 1500

tgatcagatc cttcttgacc aaggggaaga cttcctttcc ccaggttctt atctccaggg 1560

cctgggattc ccaaggggca atcttagcag gaaaggatga agtaaaggag gtgtgcagtt 1620

acagtgcttt catggtgtcc tccattactc caatgaggtc acccacctca ttcagcagca 1680

gacatacatt ctcccagtct tcctttttct actgccatac taaagtagtc cttcatgttg 1740

tccttgactg aaggtcaccc aacttgattt ccagtgagcc ttagcattcc ttgtagcatt 1800

catgcatgtc ctgacaacat tcctattttc ttcccaagtg gccagagacc ttttccacac 1860

tccagaggct ttgttcttcc attactgcct ttccatgagc ttcttgctca tctctgcagg 1920

tctcatgcca cctttgcccg atttcttagt cttagagatg caccgatctt gaatttggaa 1980

gaagtggtgc ttgaatgaca accagctctc ttggtccccc ttgctttcca aagctctaac 2040

ccatggaatg cctccatgta tgtctgtgaa gaggtcaaag tcagctctcc tgaagtcgtg 2100

gttgcaatcc tacaaactgc ctgatttctc ccatgggaga tcccgaactc cactatctca 2160

cagtcactgc actcaaggct tcccccagcc ttcacatccc cagctacagg aagagaagag 2220

gctcgaggct acttgcagct gtctgcggaa ggcttctcca gcttcctcct cttcatcagg 2280

cggcctgttg taaacaccca caacagcgtc acccatcata gcctgtccct tagtcctcac 2340

ccataaactt tctactcatt catcatgcat cccttggcag agctctgtac attccagctg 2400

ttccctcaca taaagagcaa ctccaccacc tcacaccgac gtctgtctgt cctaaaaagt 2460

acagagccat ccctgagagc attccagtca tgcgagctgc cccaccacgt ccctctgctg 2520

atcgcactga gatcgcggcc ctacgaccat ccatggatct atgactcttc ctgtttactc 2580

cccgcactgt gtgtgatgtt acacaggcac ttcagagaag aaaagagagc acaggatgcc 2640

gatttccctt ggcaggaccc caggggccgc acgcagcccc cacctctatc agcaggtctg 2700

agcaggactg gagctgcagg cagagcacag ctcagccctg agacacctcc atgctgcctc 2760

ctgcacagcc tcggccccac agcccccggg aaggagagca cgggtggggt gccgggagcc 2820

acgctgcgct ctgacacact gcgtgtcccc tgctcccagc gcgagctgca gggcccgtgc 2880

aggaacgagc tgggccccaa cgtgaccctc ggccccggtc actgctgaac gacagcgttc 2940

agctctccag gctgcaaaga gcgagccgtg aaatggagca acacgcggga ttcccgggtg 3000

tgaattccta aacggattcg aaggtgccca acaggcagcc actgcgtccg cagctgtgct 3060

tcggtacctg gagacccgcg agcccgtctg ttcccaccag cctccagcag ccggtgctcg 3120

cggatcaaaa gaccgccgtg aaggccgcag ggccgtccct gggacggagc gccgcccgct 3180

tccgccgcca gccgcggctc cgccctcccc gccgagctga cgctggcagc gcgcagagcg 3240

cggagcggag ccgcggcgct ttccggcggc agcgcccgca cggggctcgc cgagggccgc 3300

gcagagcgct gtgcccggcg ggccgcgtcg ccgctccggc ggcaccgcga ttccggcacg 3360

gagcgcaacg agcgcccgct gcccggctgc aggacgcggt cggggccaca ccgcggcggg 3420

gccgcagcct gccttccgcg ggaccgcacg tccggcctcc ccgaatttgg ccccgcagcc 3480

cccgggctgt caccgtgctg tcaccgtgcc gttcacggtt tacgggctgg ttcggcccgg 3540

ttcggcccgg ttccgtgact ggcgggacag agggattcgt ggatccgcgc ctccgggaag 3600

ggaaacggga ccccgaataa ttaaaaacag cggccacgat ctgaggggtt acaaatgtac 3660

taaaacgtac taaaaacaaa cagctgctta acacctccta ttccaaaggc ccatcgacac 3720

cccttggcac cctcaaagta tccccttctg aggtaatggg taccaagaat gcacggagcc 3780

cctgggccag tcacagcagg gtgcttttgc cagtctgtac cggtgaggcc tatttcggcc 3840

acaaacacag tcaattcttg ggaaccccca ttcaccccat gaatataagt tgattctgtc 3900

ccttggtgac tcgagggcgt gacagtgcac tgtgcaccag ggtccaccag ggcctcgtat 3960

tcctgaggtt ctgatgtgcc acaccacgaa cccacacggt tcaatacact ccatcatcct 4020

ttccccccat ggtgggggca gggtccctct atttgttacc tctgtcgttc ttagagcggt 4080

tgccatgtcc tgcagcaatg ggagcgatca cctctttggg gattaatctt ggtggttaat 4140

ctgccttgta attattttac ctgtgcttga aaatgcccct ccaggtgaaa gcaaactgca 4200

gcctgcattc tgtggccaaa ggaatggaaa agaaggcgtt agcaatgcca gtggtggcat 4260

accacttggc ttcttttgac tccagttcat actggagttc taacatgtcc agaacagcag 4320

cgctcagtgg gggtgtgact tcattctggc catggtagtc tactgtcagc ctccattctg 4380

cactggcttt atgcactgga gcacagggct tatggggagc ggcggaggga gctgggatgg 4440

ttcagtctgc agatgaggag gctcagggga gaccttattg ctctctgtaa ctccatgaag 4500

ggaggttgta gtgagctggg ggtcggtctc ttctctcatg tgactagtgg taggactaga 4560

gggaatggcc tccagttgca gcaggggaga ttcaggctgg atgttaggaa atgggctgga 4620

gtgggctgcc cggggaggtg gtggagtcac cgaccctgga ggtgctcaag gaatgtttag 4680

acaccgtgtt tagggacatg gtatagtgag aactgttggt gatgggtgga cagttgggct 4740

ggatgatctt gtaggtcttt ttaaagcttg gtgattcttt gattcgataa gtgcaaagtg 4800

ttgcatttgg gtcagagcaa tctcacgggt gtgcacaggc tgggagaaga actcctggga 4860

gaagaagaga gcagccctgc agagaaggac ttgacatgaa agacttaacg tcagccagac 4920

tccctctgct ctgccctcat gagcctctcc tactctgtaa aggtttgggc ccccagcaca 4980

<210> 16

<211> 4980

<212> DNA

<213> 人工序列

<220>

<223> ENSGALG00000015036_ENSGALG00000000438|chrZ:27764943-27769943

<400> 16

aggagtggct tctgaggctg gaaacaaggt gctcccctct tgtcaaacag ccaattccat 60

ctagctccaa cccatcctcc actggccaaa gctgagccca tcgctgatgg tgatagcatc 120

tgtaatagca tctcagaaag gctaaaagca ctgcgcagca gctgagagaa aagagtgagg 180

gaaaatggga cagaaacagc tctgcagccc tcagaggcaa tgcagaggag aggcaggagg 240

tgctccaggc atggagcatt agtttcttgc agtccaggag ttacaggtga tggtgcaggc 300

tctgtgcagc ccagtgatga ctgtttcagg atccatgctg cagcctgtgc cagagccagg 360

ggataggctt ggctgcttag tgcaggacgt ggagagccca tgctgagtgc aagctcccaa 420

aaggctagga cagaacaggt gtagtggagt agatcttgta ctgtggagca gtcttttcct 480

ggaggactaa cctgtgaaga ggaggactgc gctgaagcgg ttcatgaaga atgaaacctt 540

gtgggaggga ccccacactg aaaaaggaga aaaccacgat gaggaaggag cagcagagag 600

ctccccagcc ctgtgtgcac tgccaggaga gaaggaagta gaaaacgtgg gaatgtgcag 660

gtgtaaagct gagtctggga aaaaggtggg ggtggaataa aggtattttt agtcctatac 720

ctttctcatc aacctacttt aattgtagat tggccataaa ttaaatgttt tccccaggtc 780

aagtctgttt cttgcttgtg atggtggatg atctccctgt cctcatccca atcctgaagc 840

tatttcatca tatattctct ccctgccctg tttcaggaca gggagtgcaa gcagtttggc 900

agccagacga ggttaaccca gcaccagagg tttagtcaca tgcaagtgag agctattgcc 960

tcaacttaaa tgggagaaaa cattttagca ggttgagtct caccttgttt atccagatta 1020

tacagccatg ccagcacatg ggctgcatgc agcctggccc aacccatcct ctagccaccc 1080

cctgccccat actgaaaatg cagcggctct gccctgccaa gctgccaagc ctggctccag 1140

gcactcaccc attgcttaca aacaacaaaa cgtcagcgtg tgagcgcgcc ctgtgagctg 1200

caactggcat ggggagggca cagtcagcac aaatacatga cctgcaaatt ttcacatgga 1260

atgtatggag ttgcaatcag atactcagct caaaaaattt aatcatggct ccttacctgt 1320

ctttttttta acctttctct tagctcagag aggtatacct cacttcacaa tcatgccgta 1380

ttcatgtcat tgctttctgg cagtacgtac gtttgtgaac agctgttttc aagggtgatg 1440

cacaggaaga gtaaaatttc attaaaaaat ctccaaggag cacatggaga gctcactcag 1500

aagcctcacc gctgccactg aacaagactg atgcattagt ttcatgaaat caaggctatg 1560

tgtcccactg gtttcattat tttgttactc tttctttaaa acaaaaaaat tgttttattg 1620

cttatataca tcaactatgt tgttatatat tttccaaagg ccgctccaaa agtaatgcct 1680

cctgtttcat tctgttggcc caccgtgtca gaggcagatg gtggtacggc agtagagatg 1740

gaaccttccc accaatattc cattacatgt tgccatgtga tagacagcag cagatgggca 1800

ctctgacaga atggtatctg acatggaagc gtggatggag caaagttgtg tcactgaatt 1860

cctccataag gaaatgagca cccactaaca ttcactgatg cttgctgaac atttctggag 1920

accaaacagt ggatgtgagc acagtgaggt ggtgggtggt gcatttcagc agtggtgaca 1980

atgacgttgg gtcacctctg ctggtgcagg ttttgatgag tgcagcctgt gaggtcttgt 2040

tcatcaatgg agaaaatgca caactaatgg tggtgactgc tgaaaaatag tgttttgtag 2100

ctgagaattt tctctgtcaa acagtgctaa ttgtgctctt tgtatctgtt gtagtttcca 2160

tgggaataaa taggaggcat tacttgcaga ctgacctaca tatatgtggc cccaggcaag 2220

tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 2280

acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 2340

atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 2400

tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 2460

gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 2520

gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 2580

tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 2640

ccaccagact ggtccccgat tatcactcac aagctctcaa accgattgtg gctgtttctc 2700

agaggcaact ctttgcgctc tagcccctct ataacatggg gcaacttccc ctgccccacc 2760

ttcccttcct gtatcttctg aaaagcttgt agccctcaat tgtcacgctc cagccatatg 2820

aatcatccca ccacgtccct gtgttcacaa ttaccttcta gtcttctaat tgcaccatgg 2880

cttccaattc ctcctgttta tcacccacgt tgcatccatt gatgtagagg cacttcagtc 2940

gggctatcag caatgttacc acctgtgagg agccctcttg agatctttta ggacaattta 3000

gaggttttcc ccactgtttc ctaaaattac agcattccct gtcccttctt agtgatatag 3060

aactccatcc ccttccacca tcaaacctag cttaagctct ggtaaatgat ccagccagtc 3120

tgcttcccaa aactcttgct cagttgcatt ctatctgatg cctacatgcc caacaccttc 3180

aaggcctgtc caagatcata gaacacaaag gcttgatcat gacaacatcc atgcagccaa 3240

tcattcacat gacccattcc tctcctcctt tccaggtccc aacggccaac tgagagttgt 3300

gctctgagct cttcagtgtc cttccgaggg atgtaaagtc ccttttaatg ttctgcattt 3360

tctttgtcac agccttctga gacccaactt gaatgtggag gagtggagag taatcatccc 3420

gctctgatta tcagatacat tagcctcttc ttggcacctc tggcagacag aagacttccc 3480

tggagagatt acctggatga taactggggg cctcagtgcc tcacagcagc aagtccccag 3540

ttactaagac tctacacctc tttggtggcg ctagttctga tgtagttctt cagttgctta 3600

acatgcttgt tgtttcccaa gatttgactg ctatctgcac cctccctttc ttccagcccc 3660

agagccttat atcatgagct gagaacattc tgtgttcaaa atacaagaca catttatgca 3720

atttcgtatt ctctacccat atttttgtga tagaaattag ggctacttat ttcccatagt 3780

gatttccatg ctgcctacca ggttctaagt caggtcaccc tgccagcttc ttccaaacca 3840

tgctcaggag tgcatcaaat cacacgcaga cccaaggaaa aaatgtacca aacaatatta 3900

ccacgcatgc aaactcctca gtagctctgt cccatatgct acaattaggt ctgtataggc 3960

ttgttagatc ttgtctactt gattagtgtt ttccagcagg cctacaatcc aacctaaact 4020

gaacagacat taaagacatg tttcactaat acaaaacaac tccacctagt tcaacagtct 4080

gctcttttgt gtatggtacc tgaaactctt ctgttcactg aacttatccc aacatttttc 4140

ctcctaatgc atactttttc tagacgtgat gtgaaagtac agtgttatac cctggtgctg 4200

cattaatttg cataaccaca gcacacaaag cataatcata acacacaaag gcctcctatg 4260

aaaacatctg cttaaagtca taggtcactt atttattctc cctctagtta tgtaccagaa 4320

tgatgtatgt taataaataa tagattatta aatccatcaa aaattaggga agagctctag 4380

cacaaaggca aagcaaagaa gctttgaaga agtgcaagta aaatgaatta tttccaaaca 4440

actagcttct cactgtccca ctaagaacaa agactattct tatgcactgc tgtccttaaa 4500

attatcagct gctttgtgtt tatttcatgg agtaacacat gcaatatttt ttacaagaaa 4560

taagaaacca cagcagcaga agacgaatct gcttttattg aacgcagaaa tagatggaca 4620

ctgaaacaac agaagtttct accatgtttt gctgctgtga gagcaaatct gctgttgatc 4680

aactattagt tttgaaaagt atatgcaact ctgctatcaa ctccttcccc acatcacatc 4740

tcgtttcaag gagaaccttc ctgtccaggc aactagccag ggattttaat tttaacattt 4800

gctatctcag ataatctttt aatatttcta ggccgtgcac ataacccaca tagccctaac 4860

tccagatgtt cccagcatca cttagcagta gttccacttg aagcataaat acagcactgg 4920

cacaacaaat gaagacaatt caagcacgcc tttaacaagc atacagaaca tacagtttta 4980

<210> 17

<211> 4980

<212> DNA

<213> 人工序列

<220>

<223> ENSGALG00000012629_ENSGALG00000012628|chrZ:42172748-42177748

<400> 17

acaaattaaa tgtattttct cttgatacta ttttgattat aagctattaa cttgatttgt 60

aaaagcaccg atattatggt taatgtatgt atggtaactg ttgagtcaca gcctgaacct 120

ctgattgacc acctgcggaa aggtctgggt gagccctggg agcacaggca aaaacaattc 180

agttgtgcaa ctggaaggcc tctcttagac ctcatttaag ggctgactgt cactggggaa 240

ggatctgatt ctggagatcc cttattggtg aagctttccc ctgcaaacct agaatcttct 300

gatgcaagtg agcaatcttc ttcccttccc tagcagctct ctgttgcacc agtccttcca 360

tccttgcacc tttgttgtaa tgcttttccc atggcattga tctgtccagt tgctacagtg 420

tagaaacaag aaagtgtttt ctcaaaacat tatacatgct tactatcaga tcttacttaa 480

cattgataag aagtacacct ttcattacaa cagtgaacgg ataggcagca agcattcaga 540

acaatgaaaa agatctgcgt tctattgtaa agcaaacaaa ggtgatgacg gaacgtttat 600

ttgagataca ggcaccatag tacaagatat caaagaggaa ttaattcaac cctcccaaca 660

acagttggga aaaaaaaagg ataagctgag gaatgcagcc ttctccgatt tttactctgg 720

tgccggaagg aggaggagga gcgggggaaa acccagcgga ctcagactgc atacgcactc 780

tcggaagtac ctctgaggcg gggtgagagg aagggtggat ctaggctccc cccgctccac 840

acactcacgt gctcgtgtac tggttcaggc tgtgacttgg caactcctct acatctatcc 900

atctagttag actcaacaag accatcgtga ttcaggagtc tgaagatgct taactctctc 960

agaacgtcta gttctcctgg cctggtaaat gctatgtttc tcatactgcc tctctgaaga 1020

atgcttcgaa tgcttctagt gatgctctaa agttctaaac agaaaaatct ggagacagtt 1080

ctggtcttta gatagaaaaa atgccaacat gccaaaggat ggttacatcc ttcaagcaac 1140

cttgttgcat gctgtacaat agactcatgt aataacttag ccgtagtcat cgtatctctt 1200

atttacctgt tcgttattac attttcctgg tactgcttta tatttagtca gttgtccttt 1260

taagacaaat tttttggtgt gtgctaatag gcagttacca aatgttctag agggagggaa 1320

tataatcagt gagtatgtag atgtatatag atgtataacc agtaagtata cagagaagtt 1380

agggtggtct tttgagagca tatagctgga aagattatca catgggaaaa ggtaatcaga 1440

aataaatgga aaaatgctca ccagtgtcat aggctcacaa gaaaactccc caaggagcaa 1500

tctccagtaa cagacccttc ctcagtggca gtcagccctt aaatggcatc taggagaggt 1560

gtagccaggc accacccctt ctgtcacata ggtgaattgc cttcagctgt gctcctgcag 1620

ctgactcagt gttcacctca ggtgatcaat cagaggtcca gaccatgatt caacatttcc 1680

catgcggagg gagatgaaac aagactgtca tctcatcttc tgaagctgat aggagaatgg 1740

ttacaataag taggtcccct tccactggtt tagctctgta ttactcagtt taaaacttta 1800

tgtagttaat ggagttccat agaatcacat cgctggaaaa tgtatgtgat agctataccc 1860

aaaaagtgac acagcatcac agcctctacc aggtcctctg cctccagaca ggaccttgag 1920

ctgtgtgatc cctttgggat gtttctgttt aagacagggg acacttacac attaggaaac 1980

tggagtcatg tcggtggagg agaaagtggc tgtagaaaag gtaacggaca agaaatccct 2040

cactggctta gctgtaaagg tcagaggaaa atcatcttct gttctccata cacatctcct 2100

gtaattaggc acctgtgccc tttaaaaaag taaagtaatc aaagagtcat ttggtgaaaa 2160

tagaagccaa acagttacaa aatttagtta atattcaaag acaaaacaac tctggttcca 2220

aatataaaac cctttgtgta aacactgcgg gaaggtgcca aagagccacc tacacaaaga 2280

gatgccacag agtaatttgc gtaccccaac aataggatca tatatgggca aaccaaaaga 2340

ccaacaaaga ccccttgcaa taatcccttg attggcagaa gcaagtgcag cgttagattt 2400

agtatgtgtg acaattctga gaataggaag gaatttcact gaaactgtgt gaagatttgt 2460

atgttaaata catataatga gggttattta gctctggggt gtgcatgcta tgtggagaga 2520

tccccatgtg cccagcactg caatagacta atgtcagctt tttaaaccat catttggttt 2580

gaagagttta ttatgatttt cagaaacaga attatgtatt cagtgtctgt acattcttac 2640

aagcctgctg ttctgtacac atgaaaaagc tacttatggt gcaaatcagt atagagaagc 2700

agttttgaca tacagtggtc atgactgggt gatctgctgt cagaaggtaa gacactggta 2760

tacagaattg caaacgtgag atgaagacct caagtgcaac tctgtcatca taccacttct 2820

cttgctatta tctattcagt gtttgttcta aatattcagg cagaaggctt ggtttcacat 2880

caggtgttac atttaagtat tctttgccca ttttttgctg tttgtatgtg taacttcaga 2940

ttctcacatt gactgtgtag tgtaaatttg caaatagatg taacagcttc tctttaacat 3000

cccatgccaa acttttaatc actttcaatc aatgttggaa atctgcagta cataaatttt 3060

attttgattc attattcaga gaatcagaga aataaggact tttttagagg tttatgttta 3120

ttttagaaaa tataaataaa tcttgtatac atagatttcc aactagtaaa atttttagct 3180

atcgctgtag catttctatg aggagtttta ctttttactg tctcttatga aacttagtgg 3240

aaacaaagct aggtttcata aaacgtctaa tctcatattc atctctctcc aaaatatggt 3300

gaccttcaaa acaagaacag tttgcttatg taaacatttc ttacattgta ttctattaca 3360

ttatcatatt catgaagata ctttagaatt ttgttgctgt tagttctgtt gtgactggct 3420

gcttttctca gcttaagagc tctgcagaag tgatgataat atatattctc tttgctgagt 3480

tacaggaatt tcctgctttc ctctactgta cgttggagcc caggagatca gatccaacta 3540

ccagaatttt atatagctct ttgtgatcag tccttcctta gttgctgtta ttcctattga 3600

tgcaaaccta tttatggtgt attaaatgaa gaagatataa tgaggacagt ctaataatca 3660

aagttttttt ctgcagccag tagtacaggt agggtgacat gccttgcata aacagatcca 3720

gatgaaaggt gtgggtgagg caataagtct tcaggccctg ggctaaggca ggacctgttt 3780

tgtttcatga gatatgccta ggcctctcta tagacagggg gagatgtcag agaattctga 3840

agcatcagca gaggctatct tggttttcag gccctgtgct aagtatgaga ggaagttgag 3900

aacagataat gtgtgcaaca aagttagcaa catgcttttt caaaacagag gaaacgatcc 3960

ataaatactg gaacagaaca acctcacaga aatcactgac tgtccctttg ctggccatgg 4020

catcctgaag gttgtgctgg tagcactcat tgggttgctg tagctgataa ggcagtgcaa 4080

ggacattggg tctgcacctg ctatgaacag gcactggggc ctccaggagc tgctggtatt 4140

agtcatgggc atcagaggtg aagaaggcac ttgtagttct cacagctctg gcactgaccg 4200

atatttctgc tgtagttaat gggattattt gcatgtagtc aacagtttac aggctgattt 4260

ggctctgctc cgcaactagc aggacagagg gacccacaga tccatgtcct ggaaggggat 4320

aagggaaaag gatagagaga tgggcctaaa acaaaacaga agcaacgatc tgaggataaa 4380

caaagtaatt tactaaataa gatagtggaa tgcatgataa cacactatag tacaacataa 4440

tgcaatgtaa ttagaactgg agctaataaa tcaaatataa agagagtgtc tgaaagccaa 4500

aggccttact ctaatgctgt gatgagatgg cacccacaaa agagacgagc cagatgattg 4560

aaagggatgt atggtggtct accaaggcct gttatctgtt tgccctgagc agaaatgata 4620

gcagaacagc aaacagtcct ctggggaatg tagtagttct tctcttctgg gacaggtagc 4680

tggacctaga gcattaactc tttaaccccc agtacactac atgatgttat gatgtggaat 4740

accaataacc aaacatcata aaaccatgac atagtcttat gtcgctgtgt tgtaactgga 4800

agctgaggat ctccactcag tatttctgct gaatgaagca gatctttcag ttgaaggaga 4860

ccaacttaat catccacttc caacccctta ctatggacag gttcaccgtt cactagatca 4920

agctgcccag ggccccatcc aacctagcct tgaatgcctc cagggatgag gcatccacca 4980

<210> 18

<211> 4980

<212> DNA

<213> 人工序列

<220>

<223> ENSGALG00000015617_ENSGALG00000027714|chrZ:63363656-63368656

<400> 18

gaaaatctct gccactgatt gttttgcagc ttagttgtct agttattcgt gagatgttga 60

ttcaaacctt tgctcagatc aggcacagaa gcagtgctga actttgtttt tccgtagcct 120

tgctagtgtt gtaactgctg tcttagtgaa aacctgctta tttgcatccc cttcccaact 180

ttgggaaagt tgctgtctgt gattccagaa ttaggactcc ctcggttgca acatgactca 240

gattttcaga ccttggcttc agaggcacag tggtctttgg tgcagagaaa aatgaggctg 300

agaagaccag ggccatgatg agtgaggaag atgcaacaga acaagataga gaagagggaa 360

gagtttttta ggagctccac cagacatact gtagaagcag tgtagatgca cagtaccagt 420

aatgtactcc agccaaccac tcggtgaaga cccatgaaaa cctaatgagg ttcagtaagg 480

ccaagtgcag ggtgctgtac ttgggtcggg gcaatcccag gtatttatac aaactagggg 540

aagatctcct tgagagcagc cctgcagaga aggacttggg ggtcctggtg gatgagaagc 600

tggacgtgag ccagcagtgt gcacctgcag cccggaaggc caactgtgtt ctgggctgca 660

ttaaagaagg ggtgaccagc agggagaggg aggtgattgt ccccctctac tcagctcttg 720

tgaggcccca tctggagtac tgcatccagg cctggagccc ccagtacagg aaggacgtgg 780

agctcttgga gcgggtccag aggaagacca ctaagatgat cagagggctg gagcacctct 840

cctatgagga aaggttgagg gaactgtcct tgtttagctt agagaagaga aggcttcagg 900

gaaacctcag tgcagctttc cagtacttgg aaggagcaca taaacaggaa ggggaatggc 960

tgtttacgag ggtggatagt gacaggataa gggggaatgg ttttaaactg agacgggaga 1020

gttttaggtt agatattagg aggaagtttt tcacacagag ggtggtgacg cactggaaca 1080

ggttgcccaa ggaggttgtg gatgccccat ccctggaggc attcaaggcc aggctggatg 1140

tggctctggg cagcctgctc tggtggctgg caaccctcca catagcaggg gggttgaaac 1200

tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg aagactctgt 1260

aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca ccacattttt 1320

actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg ttaactgctg 1380

gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt cacccaaaat 1440

tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt acagcctcac 1500

atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg tatattatgc 1560

actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt aagcccagaa 1620

atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga cacagatgtg 1680

ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa tctctgaaat 1740

ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat agaattggtt 1800

gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag gtaaacaggt 1860

gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt gtttgttgtt 1920

tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca ttagcagacc 1980

agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt tctgtggaag 2040

aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac aaataatgtt 2100

atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag caaactgagt 2160

cttatcgttc ctactgtgct ttgcttttct tgcttagcaa aacatatcag aaaggttttc 2220

agttaaaaaa aaaaaaaaaa aaaaaggatt atactgcagc catcaaagag ttctgttaaa 2280

gaagttgtgg ttcatattct tttcaagttc tgaagacaat ctgacaatag aggagatgag 2340

ggtttagtgg aggtaaatgg agctgtttct gaaagtaggg caccgtcgtg aggtaatctc 2400

accactagat gttgctgtaa gcatgatgag gggagaagct ggagcacaaa aggtgtaaac 2460

ccaatggttg atcatgcgca ctcggacaga ggaaatcttc aaaatgggaa agttagcttt 2520

gaactgattt ggtgggttcc cattaaaaat gggggactta ctgccttatt gtctttatgt 2580

acccatttgg gggatagatg ccatacagaa acaccagagc ttacggtgtg aattcattgc 2640

acatcttatt agatcaacaa aatggaataa aagaatacag aagattacta ctccattggg 2700

catgtggacg ttttacaggc ctggataaat tagatcttaa aaacaaacaa acaaacaaac 2760

aaaaaaactc cttgcaaaga taatgttatg taatattagt tgcaagaagt aagcaaacac 2820

acagaactgg gagcagaagc aaagcactaa gttattaaag caagttgcac attttgagtt 2880

gcattttgcc actggtttta taaacatgtt tagcatgtct ggtcagaatt tgggcaccag 2940

gatgctttta agatgtctgt ctatggaacc tgtcagtgct caagaataac ttctgttatt 3000

tggatgctgc accaaagaat tcagaggaag acgagccaag ccagacgtta tcatagtcac 3060

tagtaaagtg gttctaagcc taattaagac atgtcagaac tatgtgttgt gcaaccaaat 3120

cctccaaaag agaaatcaga ggtgaacttg tgcaataaat atagaagaca cgtaaatcct 3180

gaggcagtta gctaaccata tgaagccaat catacctgac tgctggacgc aggagactga 3240

accttacaga ccctggagaa tcactgtttg gcctagttag gcctgaatgg aatttaccaa 3300

gattcatgac tttaacatgg atcaggtgca aagaaaagaa ggctcagtta gttcctacag 3360

gctaccagat ctttttccac ctctgctcag cctggagctg tgggctctac ctgcccctga 3420

agtgaagtgg catcaactgc aacacttttt gcagaggcaa aaatcatcaa gtcgtgcctc 3480

tgcattttaa ggtgatggat tccaagagat agattccaaa cccaacactg agattcctct 3540

ggtgatgcag atgactgctt actgggatcc ttctctctct atagcctaat cccatgcagc 3600

accaaaagtt gggcacctga atactatcta tcttcctcca tctgacctct gctgctggct 3660

catcacgcat ggctcctgag cctgacagag ccatggggaa agacatggcc tgaccttttc 3720

agacagcacg acttcctcca gtgtgctgca ctaacgacaa tattaaaaat aacactgcag 3780

gaaaacatgc tgttttctag caggctggag gaaaaaaaag gtgttcaagg tgagactcta 3840

taagatcact ctttccaaac acagcagtta actcttttct cacttgaagc tgaaattcat 3900

cttcagtagg tgacggttac aagcagctct ccaccggtaa gtgaaagttt gctgggtttt 3960

tttcaggcac ttcaagacac gaaggtaatt gctgcaacac cttcctagct cttcctgagt 4020

actcagccca aagctacact cttcagggct actctcctag cacggctctc tgtaattagc 4080

ctggctttct aacttatgaa ttaacgctgc agctactcaa cagggcagct ttgcagctat 4140

gaactttatg catacacttt ttattctggg tggtacaaat tcattgctaa gaaatcttat 4200

aaactctatg gaacactttt aaaagcctac atgtgattaa aaacaaaaaa acaaaaaaca 4260

ctgatatcac atgctatatt ctctagaaaa gagtattttg gaaacaattg taattcacag 4320

ctcaggagaa agagcaattg ttttcctttg tgctggagct ggaattctat gcagtataaa 4380

tacagatgtc caaacaaact cattaaatgg tagtcatagc aaatggagga aaaaaaaagg 4440

gggggggggg gggaactgaa gacactgaag aaattctgct gaaattcatg gagctgcaac 4500

aagaattgat attgattact tcaccatatt ccgctctaat taactagcac aacactgact 4560

gttgtgaaaa caagcatgtg atttgaccca ataagtgttt cttttagtaa ccaaaaccaa 4620

acaacaacaa accttctggc tgaccagatg gaggataaat tctaacctga tcattctgac 4680

acaaatgagg aattatgtag gttggaactg cattccaaag caaagcatgt ttttggctta 4740

gttgaacaca cagaattcat ttttcttgct gattcttgta actaagggca ggtatgaatt 4800

ggttccctta aaagaagtcc ccagaagcca tggtcctcaa caagtcttct cagattagca 4860

aggatgaacg actgagaaat caaaacccaa attcagatct aagagccttc aacagatttg 4920

ctaaatgaaa ctagcaaata ctgtagaagt taacttgatt ttgaaataaa acaggatttc 4980

<210> 19

<211> 4980

<212> DNA

<213> 人工序列

<220>

<223> ENSGALG00000008188_ENSGALG00000008197|chrZ:78777477-78782477

<400> 19

aaaggagttt cttgcctgaa accccttaag attttgtgta ttgttgttgc cctggtttca 60

gctgggacag gactgatatc cttcacagta tctggtatga tgctgtgttt tggttttagg 120

agaaaaccag tgctgatggc acaccgaggt tgtagttgcg actgagcagt gctgcacaga 180

gccaaggatg tttcagctgc ccacactggc cttcctctaa gggggtgtga gggcacatgg 240

agctggaggg aaccaaaggg gtattccaca ccatatgtca ctgagcaaag acattgctgc 300

ccaggcagag aatacagtgg tagaaatacg tcacataggt gcccatctac cccagaactg 360

ggccagcgaa gaacatcaga acaacaagca tgcgaatcag gctgctcaga ttgatgtggc 420

tcaggtagat ctcaactgtc aactgtcacc cataaaatgg atgagacagg agcaaggcct 480

gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 540

gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 600

aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 660

gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 720

acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 780

agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 840

atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 900

ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 960

ggcatggcat ggtcagtgac acccactggt tagcatgggg acaaactgcc agagcagagg 1020

gctgctgaaa cgccgagtgc caactgacac tgttcagctg acagcctcac gagagtgctg 1080

cgagggttaa gtgaggcaac aaaatacaag tactcaaaaa tagaatggaa tggaatggaa 1140

taacagaggg aatggggaac aggctgcagt gagaaggaaa cccccgtgca ccgaccaacc 1200

cgctcccagt agcctggtcc ctaccttgcc ccactccagc agctccacga ggtactcgaa 1260

gtgcccatgt ccggccatcc ccagcatggc acagctgtca cctgggagca gcgggggtcc 1320

ggcaggcatc gccggcaccc acagcctggg ctgggctgag gatgggcttg gtgggcagct 1380

gggtgctgcc gtggcagctg agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc 1440

acggctcggg acccgtggtg ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc 1500

cagagcaggg tgcatgatgt gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca 1560

ccacccggtc tgatgaaatt ccaggttttg tttaagatga aaatgcatgt gggcatacat 1620

ttgcacatga gaacacctgc taatgaaaca cacagagttg tatgtgcagt ctccctggct 1680

ggtggcatgt ctgtgggggc agttaggcag gaagaaaagc tccaccatct gtttctgtgt 1740

cccgggcttg gtgctgccac tagagatggg atgcacacag catgcctgcg tgctgccgag 1800

gcagctcagt acctgctgct gggggagagc agccctcagg gagctgctgc aaagaccccg 1860

tgggatggct ggtgaacagt gctggagaca tggcagatgt cgcacccctg ctccacacca 1920

ccctccgctg cagctgcctg cacgatgcca tttcagcgtg ccacggcttg tttcttcctc 1980

ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 2040

cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 2100

atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 2160

ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 2220

tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 2280

gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 2340

atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 2400

ttcccacact gcttttctgc aaatggatta ggagtaaaga gtcagataca caggggacca 2460

tcactcactt cctaggccat gcttcgtagt ttaactccat gcaaggtatt ttcttgctct 2520

gatctaactc tagatcacta aatggcactt gtgcaggaca cttttccact gtcattttgg 2580

ggggtagaag tgtggtcaga gccagggagg cttgcagggc ccacaccagc tgtggcccaa 2640

gcagctgctg tacaatggct gtatggcagt atcgatgtga acttcctgat aataaacaga 2700

actcagcagc aaataaaccc agattgttct gatcagtaac gagaggctgt gcaaaaagct 2760

gagaaatgta cagcccttcc tgctcaccac tacagccctt catgcagcgg cctgctgcac 2820

tagggcctgc ttggccagag gcagggctgc agcttgagat acgcagcacc cagtacccca 2880

gcaggctgcc atgtgcttct gtcaggccat gaattgcaca agttggtata gttttataca 2940

gtgtcatgca gaagcacaac tcttaccttg gcacactgat atggaaagca aagtgtaaag 3000

gaactgtatg tttcttggct tgtgagttcc attggttctc ccaggacagc agtgacagct 3060

ctagattttc tggttgatct cttccatcta agtttttact tctgaataca tctgtgcagc 3120

aaagcctgat gctttttttt ttccccctcc cctgggatcg tgaaatatta ttttcccatc 3180

tccataatac agatgatcca ctcaaacatg catcctcagt cgcagtcctc agaagggcct 3240

tttcccacca tacacctaca cgctacacca gactttattg gtcaccatgc cttgagggat 3300

tctgcctaac acaggcacac aggaagggct gataccagta attcattgct gaggagagaa 3360

ggggcacttc ttttatagta gagccacaga atcaccagga ttggaaaaca cctccaagat 3420

catccaatcc aaccacccac ctaccaccag tatttcccac taaaccatgc cccttggtac 3480

cacatctaaa agcatcttct gcaccttcac agcttcattg cctttctcag gacgtgctcc 3540

agggccttgg tgtctttctt gtattgagtg gcccaaaatt gaacacaata ctcgaggtgc 3600

agcttcacca aagctgagtg cagaggggtg atcacctcta ctaggccttg ttttacccct 3660

tccccctgca tacctagttt aaagcccttt cagcgagccc taccagctcc tgggctagga 3720

tccatttccc cctttaagag aggtgaaacc cacccgcagg catcaggcca ggcactgagt 3780

taaactgctc catcagctaa ccaccccaat gccctgatgt cccttctgat agtcctcagg 3840

cttctctcag cgacttcatc actgccagcc tgagctatcc gtaatggata acaaccagag 3900

ggctgaacca gactagggag tctcctggta atgtccctaa gtaatgaatt catgggggaa 3960

atggatctgt gcagatgcac tgccatctca cagggctcaa ctgtcacaga cagttgtcac 4020

aaaccagagc agcagagaga gcagcaaagg agatatcata aatagtggaa aagggtgcca 4080

gtgtttgtta ttgactgctt cactgtgtgt ttggaaatca caaagaaaac aacaaaaaaa 4140

ccccacagaa tacacatttc caagcatgca tgcttcaggt aaggactgcg gcccgcttta 4200

attcccctgg aagcgtccag aggcctacac acaaatcagg ccacaacaaa caggttccgt 4260

gcaagcagtt tgtgagttgt atgaaaatag ctttcttcca taaagcgtgg cattgatggg 4320

aactgttact agcagatgaa aatctgccat gcacgacacc cttaatggtt ggagtggttc 4380

gactgagttt tgcattcctc attctgatgg atgctggcaa aaccaagatc acccaacacg 4440

taacactgaa tatagctcac caacagcaac gagccacacc agatactgag gcatctccaa 4500

ggctacgtct ggtggaaaga agagacagtc tcaccctgca gtgcaaaagc atcagggctt 4560

ctgcgtaagg tttattgatc ccaaagatag gcaagttaat attcatcagt ttaatagaca 4620

ggtactcaca ttactggaga tggcatgcca ggagagcctc tgccaagtgc tcactgccag 4680

tggcagccgg ccagtgcaca gcttcttggt gctgtggcca tctatataac agaaggaagc 4740

aattaagcat cacctatcaa gataagcaag atcattcaaa gagaataagg gtacttggtt 4800

agagctgcag agcacttcct cacgaatgag tttcttccag ctacatgcag atgttacagg 4860

cagtttgctt gtgttctagg gataacacaa acccctcctc atgggctagc tgcctgctca 4920

ggctgtggtc tgtatttttg cacgtgcact gctagccttt acttcacatt tccctttact 4980

<210> 20

<211> 681

<212> DNA

<213> 人工序列

<220>

<223> pDsRed1

<400> 20

atggtgcgct cctccaagaa cgtcatcaag gagttcatgc gcttcaaggt gcgcatggag 60

ggcaccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120

ggccacaaca ccgtgaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac 180

atcctgtccc cccagttcca gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc 240

cccgactaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300

gaggacggcg gcgtggtgac cgtgacccag gactcctccc tgcaggacgg ctgcttcatc 360

tacaaggtga agttcatcgg cgtgaacttc ccctccgacg gccccgtaat gcagaagaag 420

accatgggct gggaggcctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480

gagatccaca aggccctgaa gctgaaggac ggcggccact acctggtgga gttcaagtcc 540

atctacatgg ccaagaagcc cgtgcagctg cccggctact actacgtgga ctccaagctg 600

gacatcacct cccacaacga ggactacacc atcgtggagc agtacgagcg caccgagggc 660

cgccaccacc tgttcctgta g 681

<210> 21

<211> 226

<212> PRT

<213> 人工序列

<220>

<223> pDsRed1

<400> 21

Met Val Arg Ser Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys

1 5 10 15

Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly

20 25 30

Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys

35 40 45

Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro

50 55 60

Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile

65 70 75 80

Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg

85 90 95

Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser

100 105 110

Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val

115 120 125

Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp

130 135 140

Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly

145 150 155 160

Glu Ile His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val

165 170 175

Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly

180 185 190

Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Ile Thr Ser His Asn Glu Asp

195 200 205

Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu

210 215 220

Phe Leu

225

<210> 22

<211> 876

<212> DNA

<213> 香菇珊瑚

<220>

<221> 尚未归类的特征

<222> (1)..(876)

<223> 红色荧光蛋白 (FP593)

GenBank: AF272711.1

<400> 22

agtttcagcc agtgacaggg tgagctgcca ggtattctaa caagatgagt tgttccaaga 60

atgtgatcaa ggagttcatg aggttcaagg ttcgtatgga aggaacggtc aatgggcacg 120

agtttgaaat aaaaggcgaa ggtgaaggga ggccttacga aggtcactgt tccgtaaagc 180

ttatggtaac caagggtgga cctttgccat ttgcttttga tattttgtca ccacaatttc 240

agtatggaag caaggtatat gtcaaacacc ctgccgacat accagactat aaaaagctgt 300

catttcctga gggatttaaa tgggaaaggg tcatgaactt tgaagacggt ggcgtggtta 360

ctgtatccca agattccagt ttgaaagacg gctgtttcat ctacgaggtc aagttcattg 420

gggtgaactt tccttctgat ggacctgtta tgcagaggag gacacggggc tgggaagcca 480

gctctgagcg tttgtatcct cgtgatgggg tgctgaaagg agacatccat atggctctga 540

ggctggaagg aggcggccat tacctcgttg aattcaaaag tatttacatg gtaaagaagc 600

cttcagtgca gttgccaggc tactattatg ttgactccaa actggatatg acgagccaca 660

acgaagatta cacagtcgtt gagcagtatg aaaaaaccca gggacgccac catccgttca 720

ttaagcctct gcagtgaact cggctcagtc atggattagc ggtaatggcc acaaaaggca 780

cgatgatcgt tttttaggaa tgcagccaaa aattgaaggt tatgacagta gaaatacaag 840

caacaggctt tgcttattaa acatgtaatt gaaaac 876

<210> 23

<211> 230

<212> PRT

<213> 香菇珊瑚

<220>

<221> 尚未归类的特征

<222> (1)..(230)

<223> 红色荧光蛋白 D. GenBank: AAG16224.1

<400> 23

Met Ser Cys Ser Lys Asn Val Ile Lys Glu Phe Met Arg Phe Lys Val

1 5 10 15

Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Lys Gly Glu

20 25 30

Gly Glu Gly Arg Pro Tyr Glu Gly His Cys Ser Val Lys Leu Met Val

35 40 45

Thr Lys Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ser Pro Gln

50 55 60

Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro

65 70 75 80

Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val

85 90 95

Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Ser Ser

100 105 110

Leu Lys Asp Gly Cys Phe Ile Tyr Glu Val Lys Phe Ile Gly Val Asn

115 120 125

Phe Pro Ser Asp Gly Pro Val Met Gln Arg Arg Thr Arg Gly Trp Glu

130 135 140

Ala Ser Ser Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Asp

145 150 155 160

Ile His Met Ala Leu Arg Leu Glu Gly Gly Gly His Tyr Leu Val Glu

165 170 175

Phe Lys Ser Ile Tyr Met Val Lys Lys Pro Ser Val Gln Leu Pro Gly

180 185 190

Tyr Tyr Tyr Val Asp Ser Lys Leu Asp Met Thr Ser His Asn Glu Asp

195 200 205

Tyr Thr Val Val Glu Gln Tyr Glu Lys Thr Gln Gly Arg His His Pro

210 215 220

Phe Ile Lys Pro Leu Gln

225 230

<210> 24

<211> 4107

<212> DNA

<213> 化脓性链球菌

<220>

<221> 尚未归类的特征

<222> (1)..(4107)

<223> M1 GAS

Cas9蛋白质id: AAK33936.1

<400> 24

atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60

atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120

cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180

gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240

tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300

cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360

aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420

aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480

atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540

gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600

attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660

cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720

ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780

gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840

caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900

ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960

atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020

caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080

ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140

gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200

aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260

gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320

gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380

cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440

gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500

aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560

tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620

tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680

gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740

tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800

attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860

ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920

cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980

cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040

gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100

agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160

catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220

gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280

attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340

atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400

gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460

gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520

attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580

gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640

aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700

acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760

ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820

actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880

aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940

taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000

tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060

atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120

aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180

cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240

gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300

cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360

gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420

tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480

aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540

tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600

tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660

caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720

cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780

cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840

attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900

ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960

cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020

gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080

gatttgagtc agctaggagg tgactga 4107

<210> 25

<211> 1368

<212> PRT

<213> 化脓性链球菌

<220>

<221> 尚未归类的特征

<222> (1)..(1368)

<223> M1 GAS

Cas9蛋白质id: AAK33936.1

<400> 25

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体基因座chrZ_42174515_-1的gRNA7

<400> 26

gtaatacaga gctaaaccag 20

<210> 27

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体基因座chrZ_9157091_1的gRNA8

<400> 27

acagacctat gatatgtgag 20

<210> 28

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体基因座chrZ_27767602_-1的gRNA9

<400> 28

gagcttgtga gtgataatcg 20

<210> 29

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体基因座chrZ_78779927_1的gRNA10

<400> 29

gtaaagagtc agatacacag 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于Z染色体基因座chrZ_63364946_-1的gRNA11

<400> 30

cagtgggtac tgaagctgtg 20

<210> 31

<211> 1012

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA7整合至染色体Z的左臂

ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_

-1

<400> 31

gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60

caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120

aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180

atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240

ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300

gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360

tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420

caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480

tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540

ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600

caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660

taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720

ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780

agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840

gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900

gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960

gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct ca 1012

<210> 32

<211> 1023

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA7整合至染色体Z的右臂

ZNF367_HABP4_ENSGALG00000012629_ENSGALG00000012628_chrZ_42174515_

-1

<400> 32

gtcatgtcgg tggaggagaa agtggctgta gaaaaggtaa cggacaagaa atccctcact 60

ggcttagctg taaaggtcag aggaaaatca tcttctgttc tccatacaca tctcctgtaa 120

ttaggcacct gtgcccttta aaaaagtaaa gtaatcaaag agtcatttgg tgaaaataga 180

agccaaacag ttacaaaatt tagttaatat tcaaagacaa aacaactctg gttccaaata 240

taaaaccctt tgtgtaaaca ctgcgggaag gtgccaaaga gccacctaca caaagagatg 300

ccacagagta atttgcgtac cccaacaata ggatcatata tgggcaaacc aaaagaccaa 360

caaagacccc ttgcaataat cccttgattg gcagaagcaa gtgcagcgtt agatttagta 420

tgtgtgacaa ttctgagaat aggaaggaat ttcactgaaa ctgtgtgaag atttgtatgt 480

taaatacata taatgagggt tatttagctc tggggtgtgc atgctatgtg gagagatccc 540

catgtgccca gcactgcaat agactaatgt cagcttttta aaccatcatt tggtttgaag 600

agtttattat gattttcaga aacagaatta tgtattcagt gtctgtacat tcttacaagc 660

ctgctgttct gtacacatga aaaagctact tatggtgcaa atcagtatag agaagcagtt 720

ttgacataca gtggtcatga ctgggtgatc tgctgtcaga aggtaagaca ctggtataca 780

gaattgcaaa cgtgagatga agacctcaag tgcaactctg tcatcatacc acttctcttg 840

ctattatcta ttcagtgttt gttctaaata ttcaggcaga aggcttggtt tcacatcagg 900

tgttacattt aagtattctt tgcccatttt ttgctgtttg tatgtgtaac ttcagattct 960

cacattgact gtgtagtgta aatttgcaaa tagatgtaac agcttctctt taacatccca 1020

tgc 1023

<210> 33

<211> 1014

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA8整合至染色体Z的左臂

ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ

_9157091_1

<400> 33

ctctgcatgg tcacaacggc cccaacagcc tcccatcccg atgtcaccaa tcagttcact 60

attactggtg agcaaccagt ccagcactgc atccccctgg tggggctgtc tgttacgtgg 120

ctcaggaagt tatcctcagt gcattccagg tgctcctgga tcgcctgtag ctcaccgtgc 180

tacttttcca gcaggtgtca gggtggtaga agtcccccag caggacgaga gcctgcgatt 240

gtgacagctt ctgtagctgg agggagaatg cttcatcaac aggctccgct tgatcagtgt 300

ccctgtactg ataccacaag gcttcttttg ctgctcccat cttaactctc accccatcgt 360

ggtgttatac gtgcataaca tcatgcagtg cactaagagt taaagagtta atgctccagt 420

tccgtcgatt gtcaataatt ccaggtgtac ctttctcaga agagaagaac tacaaatccc 480

ttaagatctt actgttccat tttcattctc cattcagaag gaaaggtaaa actgcagtgt 540

gtgctcccta gcattagagt aatttctccc ttagctcgtt gccaccattt tgtttttagg 600

cccacctcct taccttttcc ctacacccct cctgtgtctc tgagacgtgg gtccatgggt 660

ccctcaacca tagtagacac aaactcagat caaaccaagc cagagctttg acaaccccta 720

agctttcagc ttactcaggg ttgctctgca gggactgctc ttcacactct attccttcct 780

tgatatagag ggcaatgtct cctctcctcc ttccttacct gtccctcctc atctgcctgt 840

tgctgtcagt ggccacactt cagccatggg aatcatccca ccctgctttt gtgaaggaaa 900

ctacattatg gttctcaggt agcacagtgg cttccatcac ctcctgtttg cttcccaagc 960

tgtgtgtgtt ggtgtagagg cacttcagct gggcagctga agaactggac gcac 1014

<210> 34

<211> 1032

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA8整合至染色体Z的右臂

ENSGALG00000025945_AVD_ENSGALG00000025945_ENSGALG00000023622_chrZ

_9157091_1

<400> 34

cacctttcca cctcctgcta aagcacattc cctacagtat gtttcacatg acaccgtgct 60

ggcagatttt taatatcatc agagaatgac actccatatc ctctctgggc agcctttttc 120

agtgctctgt cacccacaaa gtaaagtatt tgctcatgtt ctaatggaac ttcctatgtt 180

ctagtttgtg accattgaac cttgttctgt cactggacag tgctgaagga gcctggccct 240

atccacttga ctcccacact ttacatattt acaagcatcg ataagacccc cctcagtctt 300

ctccagacta gatagcccca ggtctcccaa ccattccttt tatgggagat gcttcaggcc 360

cctcatcacc tctgtggccc tctgctggac tgcctgcagt agttccaggt tttttttttt 420

gaactgggga gcccagaact tgacacggta ttccagatgt ggcctcacca gcgcagagga 480

gaggggaagg ctcacctccc tcgacctggt ggccatgttt tttttaacag acctcaggat 540

accactggcc ttcttggccc aagggcacac tgctggctca tggcccatgg gttggcttcc 600

aggactctca ggtccttctc cgtagagctc ctctcaagca ggacaaccct cagcctgtac 660

tgatgtgtgc ggtgcggtta ttcctcccca cgtgcaagac tctacatctg ccattgttaa 720

atctcataag cttcctctct gcccaactct ccactgtgta cgggccttag tgaatggcag 780

cacagacttc tggtgtgagg atagcattca gaacaagctg ctgtaccttc ccagtcacag 840

aggtgagggt gactggcttg tactttccca gctttgcctt cttgcccttt tggaagactg 900

gagcgacatt ggccttctgg aggaaacggt cctcaggcac ccctcctgtt ctccatgacc 960

tttgaaagat gatcgagagc accttggcag tcacttctgc cagctccttc agcacgcatg 1020

agtgcatccc gc 1032

<210> 35

<211> 1025

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA9整合至染色体Z的左臂

RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1

<400> 35

gcagtacgta cgtttgtgaa cagctgtttt caagggtgat gcacaggaag agtaaaattt 60

cattaaaaaa tctccaagga gcacatggag agctcactca gaagcctcac cgctgccact 120

gaacaagact gatgcattag tttcatgaaa tcaaggctat gtgtcccact ggtttcatta 180

ttttgttact ctttctttaa aacaaaaaaa ttgttttatt gcttatatac atcaactatg 240

ttgttatata ttttccaaag gccgctccaa aagtaatgcc tcctgtttca ttctgttggc 300

ccaccgtgtc agaggcagat ggtggtacgg cagtagagat ggaaccttcc caccaatatt 360

ccattacatg ttgccatgtg atagacagca gcagatgggc actctgacag aatggtatct 420

gacatggaag cgtggatgga gcaaagttgt gtcactgaat tcctccataa ggaaatgagc 480

acccactaac attcactgat gcttgctgaa catttctgga gaccaaacag tggatgtgag 540

cacagtgagg tggtgggtgg tgcatttcag cagtggtgac aatgacgttg ggtcacctct 600

gctggtgcag gttttgatga gtgcagcctg tgaggtcttg ttcatcaatg gagaaaatgc 660

acaactaatg gtggtgactg ctgaaaaata gtgttttgta gctgagaatt ttctctgtca 720

aacagtgcta attgtgctct ttgtatctgt tgtagtttcc atgggaataa ataggaggca 780

ttacttgcag actgacctac atatatgtgg ccccaggcaa gtcaacagct gtacgaaaag 840

tccatgcttc ctcattataa acggaggaaa aaaagttgtt tacagctgta atgggattat 900

aaaaggcaaa tggggatagt acagtggtga gaaccagatc tatgaaggaa aagccctaag 960

aaaaagagag tgcacagata ctcttaacca tctaataact gtttcctcca tcctacagct 1020

cagag 1025

<210> 36

<211> 1040

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA9整合至染色体Z的右臂

RIC1_ERMP1_ENSGALG00000015036_ENSGALG00000000438_chrZ_27767602_-1

<400> 36

tggcttccaa ttcctcctgt ttatcaccca cgttgcatcc attgatgtag aggcacttca 60

gtcgggctat cagcaatgtt accacctgtg aggagccctc ttgagatctt ttaggacaat 120

ttagaggttt tccccactgt ttcctaaaat tacagcattc cctgtccctt cttagtgata 180

tagaactcca tccccttcca ccatcaaacc tagcttaagc tctggtaaat gatccagcca 240

gtctgcttcc caaaactctt gctcagttgc attctatctg atgcctacat gcccaacacc 300

ttcaaggcct gtccaagatc atagaacaca aaggcttgat catgacaaca tccatgcagc 360

caatcattca catgacccat tcctctcctc ctttccaggt cccaacggcc aactgagagt 420

tgtgctctga gctcttcagt gtccttccga gggatgtaaa gtccctttta atgttctgca 480

ttttctttgt cacagccttc tgagacccaa cttgaatgtg gaggagtgga gagtaatcat 540

cccgctctga ttatcagata cattagcctc ttcttggcac ctctggcaga cagaagactt 600

ccctggagag attacctgga tgataactgg gggcctcagt gcctcacagc agcaagtccc 660

cagttactaa gactctacac ctctttggtg gcgctagttc tgatgtagtt cttcagttgc 720

ttaacatgct tgttgtttcc caagatttga ctgctatctg caccctccct ttcttccagc 780

cccagagcct tatatcatga gctgagaaca ttctgtgttc aaaatacaag acacatttat 840

gcaatttcgt attctctacc catatttttg tgatagaaat tagggctact tatttcccat 900

agtgatttcc atgctgccta ccaggttcta agtcaggtca ccctgccagc ttcttccaaa 960

ccatgctcag gagtgcatca aatcacacgc agacccaagg aaaaaatgta ccaaacaata 1020

ttaccacgca tgcaaactcc 1040

<210> 37

<211> 1024

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA10整合至染色体Z的左臂

TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927

_1Chromosome Z

<400> 37

ctaccttgcc ccactccagc agctccacga ggtactcgaa gtgcccatgt ccggccatcc 60

ccagcatggc acagctgtca cctgggagca gcgggggtcc ggcaggcatc gccggcaccc 120

acagcctggg ctgggctgag gatgggcttg gtgggcagct gggtgctgcc gtggcagctg 180

agtgccgtcg tgcaggtggg ctcggtgctc tctgcagccc acggctcggg acccgtggtg 240

ggcatactgc tgggcaaggg gacggctcgg atgtgcatcc cagagcaggg tgcatgatgt 300

gtgcgcagcg gcacacagca gcgcacttgt ccccgaggca ccacccggtc tgatgaaatt 360

ccaggttttg tttaagatga aaatgcatgt gggcatacat ttgcacatga gaacacctgc 420

taatgaaaca cacagagttg tatgtgcagt ctccctggct ggtggcatgt ctgtgggggc 480

agttaggcag gaagaaaagc tccaccatct gtttctgtgt cccgggcttg gtgctgccac 540

tagagatggg atgcacacag catgcctgcg tgctgccgag gcagctcagt acctgctgct 600

gggggagagc agccctcagg gagctgctgc aaagaccccg tgggatggct ggtgaacagt 660

gctggagaca tggcagatgt cgcacccctg ctccacacca ccctccgctg cagctgcctg 720

cacgatgcca tttcagcgtg ccacggcttg tttcttcctc ttgcagtctc aggttgccgc 780

agcagcagct gcctgaggtc tggtggcaaa gggcagagca cccagcccac tgctctccat 840

gagtgagcgg gtagggggca cgccgtgctt cgcttctggt atcgggtggc ctgtggagca 900

catcacccct ggacagtgaa aacatgtcaa agggtgtttt ataacagtat agcatatccc 960

tttgaggctg aatttcctga gcttatggat atggtagtaa tgctatacca ggctctctct 1020

gcag 1024

<210> 38

<211> 1022

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA10整合至染色体Z的右臂

TRIM36_PGGT1B_ENSGALG00000008188_ENSGALG00000008197_chrZ_78779927

_1Chromosome Z

<400> 38

cagctgctgt acaatggctg tatggcagta tcgatgtgaa cttcctgata ataaacagaa 60

ctcagcagca aataaaccca gattgttctg atcagtaacg agaggctgtg caaaaagctg 120

agaaatgtac agcccttcct gctcaccact acagcccttc atgcagcggc ctgctgcact 180

agggcctgct tggccagagg cagggctgca gcttgagata cgcagcaccc agtaccccag 240

caggctgcca tgtgcttctg tcaggccatg aattgcacaa gttggtatag ttttatacag 300

tgtcatgcag aagcacaact cttaccttgg cacactgata tggaaagcaa agtgtaaagg 360

aactgtatgt ttcttggctt gtgagttcca ttggttctcc caggacagca gtgacagctc 420

tagattttct ggttgatctc ttccatctaa gtttttactt ctgaatacat ctgtgcagca 480

aagcctgatg cttttttttt tccccctccc ctgggatcgt gaaatattat tttcccatct 540

ccataataca gatgatccac tcaaacatgc atcctcagtc gcagtcctca gaagggcctt 600

ttcccaccat acacctacac gctacaccag actttattgg tcaccatgcc ttgagggatt 660

ctgcctaaca caggcacaca ggaagggctg ataccagtaa ttcattgctg aggagagaag 720

gggcacttct tttatagtag agccacagaa tcaccaggat tggaaaacac ctccaagatc 780

atccaatcca accacccacc taccaccagt atttcccact aaaccatgcc ccttggtacc 840

acatctaaaa gcatcttctg caccttcaca gcttcattgc ctttctcagg acgtgctcca 900

gggccttggt gtctttcttg tattgagtgg cccaaaattg aacacaatac tcgaggtgca 960

gcttcaccaa agctgagtgc agaggggtga tcacctctac taggccttgt tttacccctt 1020

cc 1022

<210> 39

<211> 1003

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA11整合至染色体Z的左臂

RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_-

1

<400> 39

gggttgaaac tgcgtgatca ttgtagtctt tttcaaccca ggccattcta tgattccatg 60

aagactctgt aaggacccca atgccatcag ctgtccccac agcttcagta cccactgcca 120

ccacattttt actgagatag gtagtttggt agccttcctc ccatcttgga taggggaggg 180

ttaactgctg gcatttttgt tctttcctgc aatatgtgtt ttctgcatgc attctctttt 240

cacccaaaat tttaatgtgg acggactttg aggatattct gcatctgccc aatatttctt 300

acagcctcac atctactgat ttatgcacag tatcttatat ataatgtata ttatattatg 360

tatattatgc actgaatcac atctactgtg tatgcacagt aacttctcct atggtactgt 420

aagcccagaa atcccagata tgtcactaca acgtgtctgc tatgtattgc ttctgtgaga 480

cacagatgtg ataatcagag gctgtacaca gtagaaatgc atacatatcc tactgtgaaa 540

tctctgaaat ctagccttaa tcttggaaca gaaatgaata tggtgacatc ttgatctgat 600

agaattggtt gccagtagca cagctgtaat catccatgat atgaatcaaa ccaagcacag 660

gtaaacaggt gagagaaatc atgaacaatt acatgcaaac ggaccagcta aaatgtgttt 720

gtttgttgtt tttttttttt caggtgattc ttgattacag taagatcaga agctgctaca 780

ttagcagacc agccactgca ctcaaggctg tgattcacag cttgcagacc tgacagcagt 840

tctgtggaag aggcaggtcc ctgtcaacca gtttaatcaa taaatcagtc tcgtgtacac 900

aaataatgtt atcctgcacc actgctggtg ttacactatt tcacccaagt ttatcaccag 960

caaactgagt cttatcgttc ctactgtgct ttgcttttct tgc 1003

<210> 40

<211> 1003

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA11整合至染色体Z的右臂

RPS23_ATG10_ENSGALG00000015617_ENSGALG00000027714_chrZ_63364946_-

1

<400> 40

cagaaacacc agagcttacg gtgtgaattc attgcacatc ttattagatc aacaaaatgg 60

aataaaagaa tacagaagat tactactcca ttgggcatgt ggacgtttta caggcctgga 120

taaattagat cttaaaaaca aacaaacaaa caaacaaaaa aactccttgc aaagataatg 180

ttatgtaata ttagttgcaa gaagtaagca aacacacaga actgggagca gaagcaaagc 240

actaagttat taaagcaagt tgcacatttt gagttgcatt ttgccactgg ttttataaac 300

atgtttagca tgtctggtca gaatttgggc accaggatgc ttttaagatg tctgtctatg 360

gaacctgtca gtgctcaaga ataacttctg ttatttggat gctgcaccaa agaattcaga 420

ggaagacgag ccaagccaga cgttatcata gtcactagta aagtggttct aagcctaatt 480

aagacatgtc agaactatgt gttgtgcaac caaatcctcc aaaagagaaa tcagaggtga 540

acttgtgcaa taaatataga agacacgtaa atcctgaggc agttagctaa ccatatgaag 600

ccaatcatac ctgactgctg gacgcaggag actgaacctt acagaccctg gagaatcact 660

gtttggccta gttaggcctg aatggaattt accaagattc atgactttaa catggatcag 720

gtgcaaagaa aagaaggctc agttagttcc tacaggctac cagatctttt tccacctctg 780

ctcagcctgg agctgtgggc tctacctgcc cctgaagtga agtggcatca actgcaacac 840

tttttgcaga ggcaaaaatc atcaagtcgt gcctctgcat tttaaggtga tggattccaa 900

gagatagatt ccaaacccaa cactgagatt cctctggtga tgcagatgac tgcttactgg 960

gatccttctc tctctatagc ctaatcccat gcagcaccaa aag 1003

<210> 41

<211> 200

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA3进行克隆，Z染色体，“左臂”

<400> 41

cctgcaggac atgtggacac tctgccaggt actgggggag gatcccctcc actgctccct 60

gggagatggc aaacatctag agagggacac tgcagggatg ctgcatgaac acctccagcc 120

ttctgcaggc tgtgatgggg tcagggctga aggtcaacac aagcaatgac tgcttgctga 180

caatgtgggc attgccgacc 200

<210> 42

<211> 258

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA3进行克隆，Z染色体，“右臂”

<400> 42

tggtgagtgg ggccaggaga gcaggacagg agtgtggact cggaggcgcg ggcagaggag 60

gtagctcaga gcatgagata tattcgccag gtgtcagtgg acttctggca gtgcatactg 120

cagagagctt tggttgctgg ccatctggat gatgacaaaa tctcagccac agaccatgtg 180

ggttggaaga gtcctcagga gatcaccttt ccacctcctg ctaaagcaca ttccctacag 240

tatgtttcac atgacacc 258

<210> 43

<211> 436

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA4进行克隆，Z染色体，“左臂”

<400> 43

tcaacagctg tacgaaaagt ccatgcttcc tcattataaa cggaggaaaa aaagttgttt 60

acagctgtaa tgggattata aaaggcaaat ggggatagta cagtggtgag aaccagatct 120

atgaaggaaa agccctaaga aaaagagagt gcacagatac tcttaaccat ctaataactg 180

tttcctccat cctacagctc agagttaaga cttacagagg actctagtac ttagtaagat 240

gaatacgagc taatagtggc aaaaataatc ccagtgcctc aacactgacc tgggaaaaag 300

gggcatgtat agaccttctg atattgtgat gctgtgtttg tacacttatt atctacattt 360

tcagaaatta ggttaaactt cagaaaactg aagatctcca gggcttgtag cagaccctga 420

ccaccagact ggtccc 436

<210> 44

<211> 521

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA4进行克隆，Z染色体，“右臂”

<400> 44

tcaaaccgat tgtggctgtt tctcagaggc aactctttgc gctctagccc ctctataaca 60

tggggcaact tcccctgccc caccttccct tcctgtatct tctgaaaagc ttgtagccct 120

caattgtcac gctccagcca tatgaatcat cccaccacgt ccctgtgttc acaattacct 180

tctagtcttc taattgcacc atggcttcca attcctcctg tttatcaccc acgttgcatc 240

cattgatgta gaggcacttc agtcgggcta tcagcaatgt taccacctgt gaggagccct 300

cttgagatct tttaggacaa tttagaggtt ttccccactg tttcctaaaa ttacagcatt 360

ccctgtccct tcttagtgat atagaactcc atccccttcc accatcaaac ctagcttaag 420

ctctggtaaa tgatccagcc agtctgcttc ccaaaactct tgctcagttg cattctatct 480

gatgcctaca tgcccaacac cttcaaggcc tgtccaagat c 521

<210> 45

<211> 505

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA5进行克隆，Z染色体，“左臂”

<400> 45

gcctgtccaa actgaccttg gggccccggg cacagctgct cccgagcaag gagaggcaga 60

gaattgtgga ggaaaccctc ttccacctag ctccaagggt gcacgctcaa tgcttggatg 120

aagattcaag ttctcaatga agaactgcat tcaaagacat ctttggaggt gacccagact 180

gcctctggga tgaatccaga acaaacagaa tcttcccagc aacacctttg tttatcatac 240

acgttcagaa atgcagtgcc tgcctggtat ttttttaaac tcatcacaga ggaatctctg 300

agtggagcag aggagtgttt cctcttgctt ttttcttccc cctttctgta agaaatgcat 360

atgccagttt ccccctaaat gttttcaaac tccaaattgt ttcctgctgg tgacattctc 420

ctctccagca ctgcctacac cccagctgcg tctgatagga aaagcaccca gtaccatgct 480

ggcatggcat ggtcagtgac accca 505

<210> 46

<211> 599

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA5进行克隆，Z染色体，“右臂”

<400> 46

ctgccagagc agagggctgc tgaaacgccg agtgccaact gacactgttc agctgacagc 60

ctcacgagag tgctgcgagg gttaagtgag gcaacaaaat acaagtactc aaaaatagaa 120

tggaatggaa tggaataaca gagggaatgg ggaacaggct gcagtgagaa ggaaaccccc 180

gtgcaccgac caacccgctc ccagtagcct ggtccctacc ttgccccact ccagcagctc 240

cacgaggtac tcgaagtgcc catgtccggc catccccagc atggcacagc tgtcacctgg 300

gagcagcggg ggtccggcag gcatcgccgg cacccacagc ctgggctggg ctgaggatgg 360

gcttggtggg cagctgggtg ctgccgtggc agctgagtgc cgtcgtgcag gtgggctcgg 420

tgctctctgc agcccacggc tcgggacccg tggtgggcat actgctgggc aaggggacgg 480

ctcggatgtg catcccagag cagggtgcat gatgtgtgcg cagcggcaca cagcagcgca 540

cttgtccccg aggcaccacc cggtctgatg aaattccagg ttttgtttaa gatgaaaat 599

<210> 47

<211> 453

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA6进行克隆，Z染色体，“左臂”

<400> 47

ttgcagtctc aggttgccgc agcagcagct gcctgaggtc tggtggcaaa gggcagagca 60

cccagcccac tgctctccat gagtgagcgg gtagggggca cgccgtgctt cgcttctggt 120

atcgggtggc ctgtggagca catcacccct ggacagtgaa aacatgtcaa agggtgtttt 180

ataacagtat agcatatccc tttgaggctg aatttcctga gcttatggat atggtagtaa 240

tgctatacca ggctctctct gcaggttgct cactgaaaca atataccctt tctttctcaa 300

gaaatgggac tcatgaatag ctaccaggcc tttctgctac tagatactgt agaattacat 360

atatcagatg gctcattaat cacatagctt gttattggga cagaggcagg ttttcagcat 420

ttcccacact gcttttctgc aaatggatta gga 453

<210> 48

<211> 439

<212> DNA

<213> 人工序列

<220>

<223> 使用gRNA6进行克隆，Z染色体，“右臂”

<400> 48

gggaccatca ctcacttcct aggccatgct tcgtagttta actccatgca aggtattttc 60

ttgctctgat ctaactctag atcactaaat ggcacttgtg caggacactt ttccactgtc 120

attttggggg gtagaagtgt ggtcagagcc agggaggctt gcagggccca caccagctgt 180

ggcccaagca gctgctgtac aatggctgta tggcagtatc gatgtgaact tcctgataat 240

aaacagaact cagcagcaaa taaacccaga ttgttctgat cagtaacgag aggctgtgca 300

aaaagctgag aaatgtacag cccttcctgc tcaccactac agcccttcat gcagcggcct 360

gctgcactag ggcctgcttg gccagaggca gggctgcagc ttgagatacg cagcacccag 420

taccccagca ggctgccat 439

<210> 49

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 左引物

<400> 49

ttggtgtgtg ctaataggca gt 22

<210> 50

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 右引物

<400> 50

tagtcctcgt tgtgggaggt 20

<210> 51

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 左引物

<400> 51

gcattgatct gtccagttgc 20

<210> 52

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 右引物

<400> 52

tactgccaaa accgcatcac 20

<210> 53

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> ChZgRNA_正向引物

<400> 53

tgtatgagac cacgtaatac agagctaaac cag 33

<210> 54

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> ChZgRNA_反向引物

<400> 54

aaacctggtt tagctctgta ttacgtggtc tca 33

<210> 55

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA7的“左臂”的克隆的正向引物

<400> 55

acggggtcat tagttcatag cccatatatg gtgaacggat aggcagcaag c 51

<210> 56

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA7的“左臂”的克隆的反向引物

<400> 56

ggcgggccat ttaccgtaag ttatgtaacg tgaggaaggg tctgttactg ga 52

<210> 57

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA7的“右臂”的克隆的正向引物

<400> 57

ttctatcgcc ttcttgacga gttcttctga gtcatgtcgg tggaggagaa a 51

<210> 58

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 用于gRNA7的“右臂”的克隆的反向引物

<400> 58

gtgatggcag gttgggcgtc gcttggtcgg gcatgggatg ttaaagagaa gct 53

<210> 59

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 16个核苷酸的重复

<400> 59

cggtaaatgg cccgcc 16

<210> 60

<211> 261

<212> DNA

<213> 人工序列

<220>

<223> Z染色体的左侧接臂

<400> 60

tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60

gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120

ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180

aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240

agtacacctt tcattacaac a 261

<210> 61

<211> 245

<212> DNA

<213> 人工序列

<220>

<223> Z染色体的右侧接臂

<400> 61

caaactttta atcactttca atcaatgttg gaaatctgca gtacataaat tttattttga 60

ttcattattc agagaatcag agaaataagg acttttttag aggtttatgt ttattttaga 120

aaatataaat aaatcttgta tacatagatt tccaactagt aaaattttta gctatcgctg 180

tagcatttct atgaggagtt ttacttttta ctgtctctta tgaaacttag tggaaacaaa 240

gctag 245

<210> 62

<211> 1014

<212> DNA

<213> 人工序列

<220>

<223> Z染色体的左臂

<400> 62

gtgaacggat aggcagcaag cattcagaac aatgaaaaag atctgcgttc tattgtaaag 60

caaacaaagg tgatgacgga acgtttattt gagatacagg caccatagta caagatatca 120

aagaggaatt aattcaaccc tcccaacaac agttgggaaa aaaaaaggat aagctgagga 180

atgcagcctt ctccgatttt tactctggtg ccggaaggag gaggaggagc gggggaaaac 240

ccagcggact cagactgcat acgcactctc ggaagtacct ctgaggcggg gtgagaggaa 300

gggtggatct aggctccccc cgctccacac actcacgtgc tcgtgtactg gttcaggctg 360

tgacttggca actcctctac atctatccat ctagttagac tcaacaagac catcgtgatt 420

caggagtctg aagatgctta actctctcag aacgtctagt tctcctggcc tggtaaatgc 480

tatgtttctc atactgcctc tctgaagaat gcttcgaatg cttctagtga tgctctaaag 540

ttctaaacag aaaaatctgg agacagttct ggtctttaga tagaaaaaat gccaacatgc 600

caaaggatgg ttacatcctt caagcaacct tgttgcatgc tgtacaatag actcatgtaa 660

taacttagcc gtagtcatcg tatctcttat ttacctgttc gttattacat tttcctggta 720

ctgctttata tttagtcagt tgtcctttta agacaaattt tttggtgtgt gctaataggc 780

agttaccaaa tgttctagag ggagggaata taatcagtga gtatgtagat gtatatagat 840

gtataaccag taagtataca gagaagttag ggtggtcttt tgagagcata tagctggaaa 900

gattatcaca tgggaaaagg taatcagaaa taaatggaaa aatgctcacc agtgtcatag 960

gctcacaaga aaactcccca aggagcaatc tccagtaaca gacccttcct cagt 1014

<210> 63

<211> 629

<212> DNA

<213> 人工序列

<220>

<223> CMV增强子

<400> 63

tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 60

cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 120

attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 180

atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 240

atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 300

tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 360

actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 420

aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 480

gtaggcgtgt acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatcc 540

gctagcgcta ccggactcag atctcgagct caagcttcga attctgcagt cgacggtacc 600

gcgggcccgg gatccaccgg tcgccacca 629

<210> 64

<211> 714

<212> DNA

<213> 人工序列

<220>

<223> dsRED2报告基因

<400> 64

tggcctcctc cgagaacgtc atcaccgagt tcatgcgctt caaggtgcgc atggagggca 60

ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggcc 120

acaacaccgt gaagctgaag gtgaccaagg gcggccccct gcccttcgcc tgggacatcc 180

tgtcccccca gttccagtac ggctccaagg tgtacgtgaa gcaccccgcc gacatccccg 240

actacaagaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg 300

acggcggcgt ggcgaccgtg acccaggact cctccctgca ggacggctgc ttcatctaca 360

aggtgaagtt catcggcgtg aacttcccct ccgacggccc cgtgatgcag aagaagacca 420

tgggctggga ggcctccacc gagcgcctgt acccccgcga cggcgtgctg aagggcgaga 480

cccacaaggc cctgaagctg aaggacggcg gccactacct ggtggagttc aagtccatct 540

acatggccaa gaagcccgtg cagctgcccg gctactacta cgtggacgcc aagctggaca 600

tcacctccca caacgaggac tacaccatcg tggagcagta cgagcgcacc gagggccgcc 660

accacctgtt cctgtagcgg ccgcgactct agatcataat cagccatacc acat 714

<210> 65

<211> 1026

<212> DNA

<213> 人工序列

<220>

<223> Z染色体的右臂

<400> 65

gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60

ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120

aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180

gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240

tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300

tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360

aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420

tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480

gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540

cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600

agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660

gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720

ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780

cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840

tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900

ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960

ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020

catgca 1026

<210> 66

<211> 2618

<212> DNA

<213> 人工序列

<220>

<223> 图15的Z染色体的右臂

<400> 66

tggagatccc ttattggtga agctttcccc tgcaaaccta gaatcttctg atgcaagtga 60

gcaatcttct tcccttccct agcagctctc tgttgcacca gtccttccat ccttgcacct 120

ttgttgtaat gcttttccca tggcattgat ctgtccagtt gctacagtgt agaaacaaga 180

aagtgttttc tcaaaacatt atacatgctt actatcagat cttacttaac attgataaga 240

agtacacctt tcattacaac agtgaacgga taggcagcaa gcattcagaa caatgaaaaa 300

gatctgcgtt ctattgtaaa gcaaacaaag gtgatgacgg aacgtttatt tgagatacag 360

gcaccatagt acaagatatc aaagaggaat taattcaacc ctcccaacaa cagttgggaa 420

aaaaaaagga taagctgagg aatgcagcct tctccgattt ttactctggt gccggaagga 480

ggaggaggag cgggggaaaa cccagcggac tcagactgca tacgcactct cggaagtacc 540

tctgaggcgg ggtgagagga agggtggatc taggctcccc ccgctccaca cactcacgtg 600

ctcgtgtact ggttcaggct gtgacttggc aactcctcta catctatcca tctagttaga 660

ctcaacaaga ccatcgtgat tcaggagtct gaagatgctt aactctctca gaacgtctag 720

ttctcctggc ctggtaaatg ctatgtttct catactgcct ctctgaagaa tgcttcgaat 780

gcttctagtg atgctctaaa gttctaaaca gaaaaatctg gagacagttc tggtctttag 840

atagaaaaaa tgccaacatg ccaaaggatg gttacatcct tcaagcaacc ttgttgcatg 900

ctgtacaata gactcatgta ataacttagc cgtagtcatc gtatctctta tttacctgtt 960

cgttattaca ttttcctggt actgctttat atttagtcag ttgtcctttt aagacaaatt 1020

ttttggtgtg tgctaatagg cagttaccaa atgttctaga gggagggaat ataatcagtg 1080

agtatgtaga tgtatataga tgtataacca gtaagtatac agagaagtta gggtggtctt 1140

ttgagagcat atagctggaa agattatcac atgggaaaag gtaatcagaa ataaatggaa 1200

aaatgctcac cagtgtcata ggctcacaag aaaactcccc aaggagcaat ctccagtaac 1260

agacccttcc tcagttggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 1320

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 1380

caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 1440

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 1500

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 1560

tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 1620

gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 1680

gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 1740

tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 1800

tgaaccgtca gatccgctag cgctaccgga ctcagatctc gagctcaagc ttcgaattct 1860

gcagtcgacg gtaccgcggg cccgggatcc accggtcgcc accatggcct cctccgagaa 1920

cgtcatcacc gagttcatgc gcttcaaggt gcgcatggag ggcaccgtga acggccacga 1980

gttcgagatc gagggcgagg gcgagggccg cccctacgag ggccacaaca ccgtgaagct 2040

gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc cccagttcca 2100

gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc cccgactaca agaagctgtc 2160

cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg gcgtggcgac 2220

cgtgacccag gactcctccc tgcaggacgg ctgcttcatc tacaaggtga agttcatcgg 2280

cgtgaacttc ccctccgacg gccccgtgat gcagaagaag accatgggct gggaggcctc 2340

caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc gagacccaca aggccctgaa 2400

gctgaaggac ggcggccact acctggtgga gttcaagtcc atctacatgg ccaagaagcc 2460

cgtgcagctg cccggctact actacgtgga cgccaagctg gacatcacct cccacaacga 2520

ggactacacc atcgtggagc agtacgagcg caccgagggc cgccaccacc tgttcctgta 2580

gcggccgcga ctctagatca taatcagcca taccacat 2618

<210> 67

<211> 1271

<212> DNA

<213> 人工序列

<220>

<223> 图15的Z染色体的左臂

<400> 67

gagtcatgtc ggtggaggag aaagtggctg tagaaaaggt aacggacaag aaatccctca 60

ctggcttagc tgtaaaggtc agaggaaaat catcttctgt tctccataca catctcctgt 120

aattaggcac ctgtgccctt taaaaaagta aagtaatcaa agagtcattt ggtgaaaata 180

gaagccaaac agttacaaaa tttagttaat attcaaagac aaaacaactc tggttccaaa 240

tataaaaccc tttgtgtaaa cactgcggga aggtgccaaa gagccaccta cacaaagaga 300

tgccacagag taatttgcgt accccaacaa taggatcata tatgggcaaa ccaaaagacc 360

aacaaagacc ccttgcaata atcccttgat tggcagaagc aagtgcagcg ttagatttag 420

tatgtgtgac aattctgaga ataggaagga atttcactga aactgtgtga agatttgtat 480

gttaaataca tataatgagg gttatttagc tctggggtgt gcatgctatg tggagagatc 540

cccatgtgcc cagcactgca atagactaat gtcagctttt taaaccatca tttggtttga 600

agagtttatt atgattttca gaaacagaat tatgtattca gtgtctgtac attcttacaa 660

gcctgctgtt ctgtacacat gaaaaagcta cttatggtgc aaatcagtat agagaagcag 720

ttttgacata cagtggtcat gactgggtga tctgctgtca gaaggtaaga cactggtata 780

cagaattgca aacgtgagat gaagacctca agtgcaactc tgtcatcata ccacttctct 840

tgctattatc tattcagtgt ttgttctaaa tattcaggca gaaggcttgg tttcacatca 900

ggtgttacat ttaagtattc tttgcccatt ttttgctgtt tgtatgtgta acttcagatt 960

ctcacattga ctgtgtagtg taaatttgca aatagatgta acagcttctc tttaacatcc 1020

catgcacaaa cttttaatca ctttcaatca atgttggaaa tctgcagtac ataaatttta 1080

ttttgattca ttattcagag aatcagagaa ataaggactt ttttagaggt ttatgtttat 1140

tttagaaaat ataaataaat cttgtataca tagatttcca actagtaaaa tttttagcta 1200

tcgctgtagc atttctatga ggagttttac tttttactgt ctcttatgaa acttagtgga 1260

aacaaagcta g 1271

Claims

1.一种在未孵化的卵中对禽类胚胎进行性别确定的方法，所述卵在结构完整的壳内包含胚胎，所述方法包括以下步骤：

(a)提供至少一个转基因禽类受试对象，其包含整合到性别染色体Z和W中至少一者内的至少一个位置或部位中的至少一种外源报告基因，其中所述报告基因是红色荧光蛋白(RFP)；

(b)从所述转基因禽类受试对象获得至少一个在结构完整的壳内包含胚胎的未孵化的卵；以及

(c)确定所述未孵化的卵中所述结构上完整的壳内的所述胚胎中是否检测到至少一种可检测信号，其中检测到所述至少一种可检测信号则表明所述未孵化的卵中所述结构上完整的壳内的胚胎中的所述至少一种报告基因的表达，从而表明在所述胚胎中存在所述Z染色体或W染色体，

从而确定在结构完整的壳内包含胚胎的未孵化的卵中的禽类胚胎的性别。

2.根据权利要求1所述的方法，其中所述报告基因编码具有500-650nm激发波长和550-650nm发射波长的RFP蛋白。

3.根据权利要求1或2所述的方法，其中确定是否检测到可检测信号包括将所述在结构完整的壳内包含胚胎的未孵化的卵置于光源下的步骤。

4.根据权利要求1至3中任一项所述的方法，其中所述至少一个转基因禽类受试对象是雌性禽类受试对象，并且其中所述至少一种报告基因被整合到以下至少一个位置中：(a)雌性染色体Z，从而检测到可检测信号表明在所述未孵化的卵中的所述胚胎是雄性；或(b)雌性染色体W，从而检测到可检测信号表明在所述在结构完整的壳内包含胚胎的未孵化的卵中的所述胚胎是雌性。

5.根据权利要求1至4中任一项所述的方法，其中使用至少一种可编程的工程化核酸酶(PEN)将所述至少一种报告基因整合到所述转基因禽类动物的所述性别染色体中，其中所述PEN是成簇的规律间隔的短回文重复(CRISPR)II型系统。

6.根据权利要求1至5中任一项所述的方法，其中通过使所述禽类受试对象的至少一种细胞或引入所述禽类动物的至少一种细胞与以下接触或共转染：

(a)至少一种Cas9蛋白或包含编码所述至少一种Cas9蛋白的至少一种核酸序列的至少一种第一核酸序列；以及靶向在至少一个性别染色体Z和/或W中的至少一个原间隔序列的向导RNA(gRNA)，或编码所述至少一种gRNA的至少一种核酸序列；和

(b)包含至少一种所述报告基因的至少一种第二核酸序列。

7.根据权利要求1至6中任一项所述的方法，其中将所述至少一种报告基因整合到以下至少一个位点中：性别Z染色体基因座42172748-42177748或性别W染色体基因座1022859-1024215。

8.根据权利要求7所述的方法，其中将所述至少一种报告基因整合到以下至少一个位点中：(a)性别Z染色体基因座42172748-42177748，其中所述至少一种gRNA包含如SEQ IDNO.26所示的核酸序列并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'处分别侧接有包含由SEQ ID NO.31和32所示的核酸序列的同源臂；或(b)性别W染色体基因座1022859-1024215，其中以下至少一者：

(i)所述gRNA包含SEQ ID NO.1所示的核酸序列，并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.4和5所示的核酸序列的同源臂；和

(ii)所述gRNA包含SEQ ID NO.2所示的核酸序列，并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.6和7所示的核酸序列的同源臂。

9.一种禽类转基因受试对象，其包含整合到性别染色体Z和W中至少一者的至少一个基因座中的至少一种外源报告基因，其中所述报告基因是红色荧光蛋白(RFP)，并且其中所述至少一种报告基因的表达适用于鉴定在结构完整的壳内包含胚胎的未孵化的卵中的禽类胚胎的性别。

10.根据权利要求9所述的禽类转基因受试对象，其中所述报告基因编码具有500-650nm激发波长和550-650nm发射波长的RFP蛋白。

11.根据权利要求9或10所述的禽类转基因受试对象，其中所述至少一种转基因禽类动物是雌性，并且其中所述至少一种报告基因被整合到以下至少一个位置中：雌性Z染色体或雌性W染色体。

12.根据权利要求9至11中任一项所述的禽类转基因受试对象，其中将所述至少一种报告基因整合到性别Z染色体基因座42172748-42177748的至少一个位点中，其中所述至少一种gRNA包含如SEQ ID NO.26所示的核酸序列并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'处分别侧接有包含由SEQ ID NO.31和32所示的核酸序列的同源臂。

13.根据权利要求9至11中任一项所述的禽类转基因受试对象，其中将所述至少一种报告基因整合到性别W染色体基因座1022859-1024215中的至少一个位点，其中以下至少一者：

(a)所述gRNA包含SEQ ID NO.1所示的核酸序列，并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.4和5所示的核酸序列的同源臂；和

(b)所述gRNA包含SEQ ID NO.2所示的核酸序列，并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.6和7所示的核酸序列的同源臂。

14.一种试剂盒，其包含：

a.至少一种Cas9蛋白或包含编码所述至少一种Cas9蛋白的至少一种核酸序列的至少一种第一核酸序列；以及靶向在至少一个性别染色体Z和/或W中的至少一个原间隔序列的至少一种gRNA，或编码所述至少一种gRNA的至少一种核酸序列；和

b.包含至少一种所述报告基因的至少一种第二核酸序列，其中所述报告基因是红色荧光蛋白(RFP)，并且其中所述至少一种报告基因的表达适用于鉴定在结构完整的壳内包含胚胎的未孵化的卵中的禽类胚胎的性别，

其中所述至少一种报告基因整合到以下至少一个位点中：(a)性别Z染色体基因座42172748-42177748，其中所述至少一种gRNA包含如SEQ ID NO.26所示的核酸序列并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'处分别侧接有包含由SEQID NO.31和32所示的核酸序列的同源臂；或(b)性别W染色体基因座1022859-1024215，其中以下至少一者：(i)所述gRNA包含SEQ ID NO.1所示的核酸序列，并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.4和5所示的核酸序列的同源臂；和(ii)所述gRNA包含SEQ ID NO.2所示的核酸序列，并且包含在所述第二核酸序列中的所述至少一种报告基因在其5'和3'分别侧接有包含由SEQ ID NO.6和7所示的核酸序列的同源臂。

15.根据权利要求14所述的试剂盒，其中所述至少一种报告基因编码具有500-650nm激发波长和550-650nm发射波长的RFP蛋白。