CN115247180A

CN115247180A - 试剂盒及其在构建毛囊组织特异表达人源II型5α-还原酶基因的重组猪细胞中的应用

Info

Publication number: CN115247180A
Application number: CN202210535262.2A
Authority: CN
Inventors: 牛冬; 汪滔; 陶裴裴; 王磊; 曾为俊; 程锐; 赵泽英
Original assignee: Nanjing Qizhen Genetic Engineering Co Ltd
Current assignee: Nanjing Qizhen Genetic Engineering Co Ltd
Priority date: 2022-05-17
Filing date: 2022-05-17
Publication date: 2022-10-28

Abstract

本发明公开了试剂盒及其在构建毛囊组织特异表达人源II型5α‑还原酶基因的重组猪细胞中的应用。本发明提供的试剂盒采用CRISPR/Cas9系统及同源重组技术，制备在基因组的特定位置整合特异DNA分子的重组猪细胞，所述特异DNA分子中由KAP6.1启动子驱动人源II型5α‑还原酶基因表达。本发明提供了一种制备重组猪细胞的方法，包括如下步骤：将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA，得到重组猪细胞；所述DNA分子甲中具有KAP6.1启动子和人II型5α‑还原酶基因，且由KAP6.1启动子驱动人II型5α‑还原酶基因的表达。重组猪细胞可作为核移植细胞供体克隆生产脱发模型猪，将有助于研究并揭示雄激素性脱发的发病机制，并可用于进行药物筛选、药效检测、基因及细胞治疗等研究。

Description

试剂盒及其在构建毛囊组织特异表达人源II型5α-还原酶基因的重组猪细胞中的应用

技术领域

本发明属于生物技术领域，涉及试剂盒及其在构建毛囊组织特异表达人源II型5α-还原酶基因的重组猪细胞中的应用。本发明提供的试剂盒采用CRISPR/Cas9系统及同源重组技术，制备在基因组的特定位置整合特异DNA分子的重组猪细胞，所述特异DNA分子中由KAP6.1启动子驱动人源II型5α-还原酶基因表达。所述重组细胞可作为核移植供体细胞制备克隆猪，该克隆猪可用作脱发模型猪。

背景技术

脱发有很多种类型，其中雄激素性脱发(androgeneticalopecia,AGA)是一种最常见的脱发类型，是起始于青春期或青春后期的一种进行性毛囊微小化的脱发疾病。男女均可罹患，但表现为不同的脱发模式和患病率。目前的研究表明，雄激素是AGA发病的决定性因素，其他包括毛囊周围炎症、生活压力的增大、紧张和焦虑、不良的生活和饮食习惯等因素均可加重AGA的症状。

男性体内的雄激素主要来源于睾丸所分泌的睾酮；女性体内的雄激素主要由肾上腺皮质合成，卵巢也可少量分泌。雄激素主要为雄烯二醇，可被代谢为睾酮和二氢睾酮。虽然雄激素是AGA发病的关键因素，但几乎所有AGA患者血液循环的雄激素都维持在正常的水平。研究表明，由于脱发区毛囊内雄激素受体基因表达升高和/或Ⅱ型5α-还原酶基因表达升高，从而导致雄激素对易感毛囊的作用增大。对于AGA而言，易感毛囊中真皮区细胞内含有特定的Ⅱ型5α-还原酶，可以将血液中循环至该区域的睾酮转化为二氢睾酮，通过与细胞内的雄激素受体结合引起一系列反应，进而使毛囊出现进展性的微型化和脱发直至秃发。

脱发患者常由于自身形象的损伤而导致心理问题如焦虑症、抑郁症甚至逃避厌世情绪，故对该病的治疗也越来越多地引起人们的重视。现阶段的治疗手段因其副作用较大或花费较高，仍无法被大众普遍接受，故探索新型治疗方法对促进大众认知并接受治疗有重大意义，而这需要以相关动物疾病模型作为实验工具。目前，常见的动物模型为小鼠模型，然而小鼠不论从体型、器官大小、生理、病理等方面都与人相差巨大，不能真实地模拟人类正常的生理、病理状态。猪作为大动物，是人类长期以来主要的肉食供应动物，其体型大小和生理功能与人类近似，易于大规模繁殖饲养，而且在伦理道德及动物保护等方面要求较低，是理想的人类疾病模型动物。

基因编辑是近年来不断取得重大发展的一种生物技术，其包括从基于同源重组的基因编辑到基于核酸酶的ZFN、TALEN、CRISPR/Cas9等编辑技术，其中CRISPR/Cas9技术是当前最先进的基因编辑技术。目前，基因编辑技术被越来越多地应用到动物模型的制作上。

发明内容

本发明涉及试剂盒及其在构建毛囊组织特异表达人源II型5α-还原酶基因的重组猪细胞中的应用。本发明提供的试剂盒采用CRISPR/Cas9系统及同源重组技术，制备在基因组的特定位置整合特异DNA分子的重组猪细胞，所述特异DNA分子中由KAP6.1启动子驱动人源II型5α-还原酶基因表达。所述重组细胞可作为核移植供体细胞制备克隆猪，该克隆猪可用作脱发模型猪。

本发明提供了一种制备重组猪细胞的方法，包括如下步骤：将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA，得到重组猪细胞；所述DNA分子甲中具有KAP6.1启动子和人II型5α-还原酶基因，且由KAP6.1启动子驱动人II型5α-还原酶基因的表达。

具体的，人II型5α-还原酶(hSRD5A2蛋白)如SEQ ID NO：19所示。

KAP6.1启动子属于毛囊组织特异性启动子，驱动下游基因在毛囊组织中特异性表达。

KAP6.1启动子为绵羊毛发角蛋白结合蛋白启动子。

具体的，KAP6.1启动子如SEQ ID NO：20中第1088-2139位核苷酸所示。

人SRD5A2基因(hSRD5A2基因)信息：位于人2号染色体；GeneID为6716。

具体的，人II型5α-还原酶基因(hSRD5A2基因)如SEQ ID NO：20中第2140-2904位核苷酸所示。

具体的，所述DNA分子甲中，具有hSRD5A2基因表达盒。

hSRD5A2基因表达盒中，由KAP6.1启动子驱动hSRD5A2基因的表达。

hSRD5A2基因表达盒中，在hSRD5A2基因下游具有Poly(A)。

具体的，所述Poly(A)为EF1αPoly(A)。

具体的，EF1αPoly(A)如SEQ ID NO：20中第2905-3477位核苷酸所示。

具体的，hSRD5A2基因表达盒如SEQ ID NO：20中第1088-3477位核苷酸所示。

具体的，所述DNA分子甲中，具有抗性筛选基因表达盒。

所述抗性筛选基因可为编码抗性筛选蛋白的基因。

所述抗性筛选蛋白具体为Neomycin抗性蛋白。

具体的，抗性筛选基因表达盒如SEQ ID NO：20中第3605-5247位核苷酸所示。

所述DNA分子甲中还包括LoxP序列。

所述DNA分子甲中具体包括2个LoxP序列，分别如SEQ ID NO：20中第3507-3540位核苷酸、第5304-5337位核苷酸所示。

所述DNA分子甲中还包括绝缘子。

所述DNA分子甲中具体包括2个绝缘子，分别如SEQ ID NO：20中第887-1087位核苷酸、第5358-5559位核苷酸所示。

所述DNA分子甲自上游至下游依次包括如下区段：KAP6.1启动子、hSRD5A2基因、EF1αPoly(A)、LoxP序列、pGK启动子，编码Neomycin抗性蛋白的核苷酸、bGH Poly(A)、LoxP序列。

所述DNA分子甲自上游至下游依次包括如下区段：绝缘子1、KAP6.1启动子、hSRD5A2基因、EF1αPoly(A)、LoxP序列、pGK启动子，编码Neomycin抗性蛋白的核苷酸、bGHPoly(A)、LoxP序列、绝缘子5。

具体的，所述DNA分子甲如SEQ ID NO：20中第887-5559位核苷酸所示。

具体的，所述DNA分子甲如SEQ ID NO：20中第881-5559位核苷酸所示。

所述“将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA”的实现方式为：将命名为DNA分子乙的DNA分子导入猪细胞或者将具有所述DNA分子乙的重组质粒导入猪细胞；所述DNA分子乙中，具有所述DNA分子甲且在所述DNA分子甲的上游具有上游同源臂且在所述DNA分子甲的下游具有下游同源臂，所述上游同源臂和所述下游同源臂用于将所述DNA分子甲整合至猪细胞的基因组DNA。

所述同源臂为针对COL1A1基因的同源臂，上游同源臂为SH4左臂，下游同源臂为SH4右臂。SH4左臂如SEQ ID NO：20中第9-880位核苷酸所示，SH4右臂如SEQ ID NO：20中第5560-6286位核苷酸所示。

所述DNA分子乙自上游至下游依次包括如下区段：上游同源臂、绝缘子1、KAP6.1启动子、hSRD5A2基因、EF1αPoly(A)、LoxP序列、pGK启动子，编码Neomycin抗性蛋白的核苷酸、bGH Poly(A)、LoxP序列、绝缘子5、下游同源臂。

具体的，所述DNA分子乙如SEQ ID NO：20中第9-6286位核苷酸所示。

具体的，具有所述DNA分子乙的重组质粒如SEQ ID NO：20所示。

具体的，DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因中。

具体的，DNA分子甲整合至猪细胞的基因组DNA的COL1A1安全港插入位点中。

DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因中指的是将DNA分子甲插入至基因组DNA中SH4左臂和SH4右臂之间；SH4左臂如SEQ ID NO：20中第9-880位核苷酸所示，SH4右臂如SEQ ID NO：20中第5560-6286位核苷酸所示。

所述方法中，具有所述DNA分子乙的重组质粒与两种gRNA(COL1A1-gRNA1和COL1A1-gRNA3)以及NCN蛋白共同导入猪细胞。

具有所述DNA分子乙的重组质粒、COL1A1-gRNA1、COL1A1-gRNA3和NCN蛋白的质量配比具体可为3：1：1：4。

猪细胞、具有所述DNA分子乙的重组质粒、COL1A1-gRNA1、COL1A1-gRNA3和NCN蛋白的配比具体可为：10万个猪原代成纤维细胞：3μg重组质粒：1μg COL1A1-gRNA1：1μgCOL1A1-gRNA3：4μg NCN蛋白。

具体的，猪基因组中所述COL1A1安全港插入位点及其周边区域如SEQ ID NO：25所示。

所述重组猪细胞为纯合重组(即DNA分子甲分别整合至两条同源染色体的相同位置)。

所述重组猪细胞为杂合重组(即DNA分子甲整合至一条同源染色体)。

本发明还保护一种试剂盒，包括以上任一所述DNA分子乙。

本发明还保护一种试剂盒，包括具有以上任一所述DNA分子乙的重组质粒。

所述试剂盒还包括两种gRNA(COL1A1-gRNA1和COL1A1-gRNA3)。

所述试剂盒还包括NCN蛋白。

所述试剂盒还包括PRONCN蛋白。

所述试剂盒还包括特异质粒。

所述试剂盒还包括猪细胞。

本发明还保护以上任一所述DNA分子乙在制备试剂盒中的应用。

本发明还保护具有以上任一所述DNA分子乙的重组质粒在制备试剂盒中的应用。

本发明还保护具有以上任一所述DNA分子乙的重组质粒、两种gRNA(COL1A1-gRNA1和COL1A1-gRNA3)以及NCN蛋白在制备试剂盒中的应用。

以上任一所述试剂盒的用途为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

本发明还保护以上任一所述DNA分子乙、具有以上任一所述DNA分子乙的重组质粒或以上任一所述试剂盒的应用，为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

gRNA又称为sgRNA。

COL1A1-gRNA1的靶序列结合区如SEQ ID NO：23中第3-22位核苷酸所示。具体的，COL1A1-gRNA1如SEQ ID NO：23所示。

COL1A1-gRNA3的靶序列结合区如SEQ ID NO：24中第3-22位核苷酸所示。具体的，COL1A1-gRNA3如SEQ ID NO：24所示。

靶序列结合区指的是sgRNA中的与靶序列(靶序列位于目标基因的目标区域)相结合的区域。

所述NCN蛋白为Cas9蛋白或具有Cas9蛋白的融合蛋白。

本发明还保护以上任一所述方法制备得到的重组猪细胞。

具体的，所述重组猪细胞可为如下重组猪细胞：与猪细胞相比，重组猪细胞的基因组DNA的差异仅在于：在细胞基因组DNA中SH4左臂和SH4右臂之间插入了SEQ ID NO：20中第881-5559位核苷酸所示的DNA分子。

所述重组猪细胞为纯合重组(即两条同源染色体的SH4左臂和SH4右臂之间均插入了SEQ ID NO：20中第881-5559位核苷酸所示的DNA分子)。

所述重组猪细胞为杂合重组(即一条同源染色体的SH4左臂和SH4右臂之间插入SEQ ID NO：20中第881-5559位核苷酸所示的DNA分子)。

本发明还保护所述重组猪细胞在制备脱发模型猪中的应用。

将所述重组猪细胞作为核移植供体细胞进行体细胞克隆，可以得到克隆猪，即为脱发模型猪。该模型猪可用于下一步的药物筛选及药效评价、基因及细胞治疗、脱发机制的研究等生物医药领域。该模型猪可为研究人类AGA发病机制或探索相关治疗方法提供有力工具。

具体的，所述NCN蛋白如SEQ ID NO：3所示。

所述NCN蛋白的制备方法包括如下步骤：

(1)将质粒pKG-GE4导入大肠杆菌BL21(DE3)，得到重组菌；

(2)采用液体培养基30℃培养所述重组菌，然后加入IPTG并进行25℃诱导培养，然后收集菌体；

(3)将收集的菌体进行菌体破碎，收集粗蛋白溶液；

(4)采用亲和层析从所述粗蛋白溶液中纯化具有His₆标签的融合蛋白；

(5)采用具有His₆标签的肠激酶酶切具有His₆标签的融合蛋白，然后采用Ni-NTA树脂去除具有His₆标签的蛋白，得到纯化的NCN蛋白；

质粒pKG-GE4中具有SEQ ID NO：1中第5209-9852位核苷酸所示的融合基因。

所述NCN蛋白的制备方法具体包括如下步骤：

(1)将质粒pKG-GE4导入大肠杆菌BL21(DE3)，得到重组菌。

(2)将步骤(1)得到的重组菌接种至含氨苄青霉素的液体LB培养基，振荡培养；

(3)将步骤(2)得到的菌液接种至液体LB培养基，30℃、230rpm振荡培养至OD_600nm值＝1.0，然后加入IPTG并使其在体系中的浓度为0.5mM，然后25℃、230rpm振荡培养12小时，然后离心收集菌体；

(4)取步骤(3)得到的菌体，用PBS缓冲液洗涤；

(5)取步骤(4)得到的菌体，加入粗提缓冲液并悬浮菌体，然后进行菌体破碎，然后离心收集上清液，采用0.22μm孔径滤膜过滤，收集滤液；

(6)采用亲和层析从步骤(5)得到的滤液中纯化具有His₆标签的融合蛋白(SEQ IDNO：2所示的融合蛋白)；

(7)取步骤(6)收集的过柱后溶液，使用超滤管浓缩，然后用25mM Tris-HCl(pH8.0)稀释；

(8)将具有His₆标签的重组牛肠激酶加入到步骤(7)得到的溶液中，酶切；

(9)将完成步骤(8)的溶液与Ni-NTA树脂混匀，孵育，然后离心收集上清液；

(10)取步骤(9)得到的上清液，使用超滤管浓缩，然后加入酶贮存液中，即为NCN蛋白溶液。

采用亲和层析从步骤(5)得到的滤液中纯化具有His₆标签的融合蛋白的具体方法如下：

首先采用5个柱体积的平衡液平衡Ni-NTA琼脂糖柱(流速为1ml/min)；然后上样50ml步骤(5)得到的滤液(流速为0.5-1ml/min)；然后用5个柱体积的平衡液洗涤柱子(流速为1ml/min)；然后用5个柱体积的缓冲液洗涤柱子(流速为1ml/min)，以去除杂蛋白；然后用10个柱体积的洗脱液以0.5-1ml/min的流速洗脱，收集过柱后溶液(90-100ml)。

以上任一所述PRONCN蛋白自上游至下游依次包括如下元件：信号肽、分子伴侣蛋白、蛋白标签、蛋白酶酶切位点、核定位信号、Cas9蛋白、核定位信号。

所述信号肽的功能为促进蛋白分泌表达。所述信号肽可选自大肠杆菌碱性磷酸酶(phoA)信号肽、金黄色葡萄球菌蛋白A信号肽、大肠杆菌外膜蛋白(ompa)信号肽或任何其他原核基因的信号肽，优选为碱性磷酸酶信号肽(phoA signal peptide)。碱性磷酸酶信号肽用来引导目的蛋白分泌表达至细菌周质腔中，从而与细菌胞内蛋白分离，且分泌到细菌周质腔中的目的蛋白为可溶性表达，可被细菌周质腔中的信号肽酶裂解。

所述分子伴侣蛋白的功能为增加蛋白的可溶性。所述分子伴侣可为任何帮助形成二硫键的蛋白，优选为硫氧还原蛋白(TrxA蛋白)。硫氧还原蛋白，其能作为分子伴侣帮助所共表达的目的蛋白(例如Cas9蛋白)形成二硫键，提高蛋白的稳定性、折叠的正确性，增加目的蛋白的溶解性及活性。

所述蛋白标签的功能为用于蛋白纯化。所述标签可为His标签(His-Tag，His₆蛋白标签)、GST标签、Flag标签、HA标签、c-Myc标签或其他任何蛋白标签，进一步优选为His标签。His标签能与Ni柱结合，可以通过一步法Ni柱亲和层析纯化目的蛋白，可极大地简化目的蛋白的纯化流程。

所述蛋白酶酶切位点的功能为纯化后用于切除非功能区段，以释放天然形式Cas9蛋白。所述蛋白酶可选自肠激酶(Enterokinase)、因子Xa(Factor Xa)、凝血酶(Thrombin)、TEV蛋白酶(TEV protease)、HRV 3C蛋白酶(HRV 3C protease)、WELQut蛋白酶或任何其他内切蛋白酶，进一步优选为肠激酶。EK为肠激酶酶切位点，便于使用肠激酶切除所融合的TrxA-His区段，得到天然形式的Cas9蛋白。本申请使用带His标签的商品肠激酶酶切融合蛋白后，可通过一次亲和层析除去TrxA-His区段及带His标签的肠激酶，得到天然形式的Cas9蛋白，避免了多次纯化透析对目的蛋白的伤害和损耗。

所述核定位信号可为任何核定位信号，优选为SV40核定位信号和/或nucleoplasmin核定位信号。NLS为核定位信号，在Cas9的N端及C端分别设计了一个NLS位点，使Cas9能更有效地进入细胞核进行基因编辑。

所述Cas9蛋白可为saCas9或spCas9,优选为spCas9蛋白。

PRONCN蛋白具体如SEQ ID NO：2所示。

以上任一所述特异质粒自上游至下游依次包括如下元件：启动子、操纵子、核糖体结合位点、PRONCN蛋白的编码基因、终止子。

所述启动子具体可为T7启动子。T7启动子为原核表达强启动子，能高效驱动外源基因的表达。

所述操纵子具体可为Lac操纵子。Lac操纵子为乳糖诱导表达的调控元件，可在细菌生长至一定数量后，再用IPTG在低温下诱导目的蛋白的表达，可避免目的蛋白过早表达对宿主菌生长的影响，低温下诱导表达也显著提高所表达的目的蛋白的可溶性。

所述核糖体结合位点是蛋白翻译时的核糖体结合位点，对蛋白质的翻译是必要的。

所述终止子具体可为T7终止子。T7终止子可在目的基因的末端有效终止基因转录，避免目的基因之外的其他下游序列得到转录和翻译。

对于spCas9蛋白的密码子，本申请对其密码子进行了优化，使之完全适应本申请所选用的大肠杆菌高效表达菌株E.coli BL21(DE3)的密码子偏好，从而提高Cas9蛋白的表达水平。

T7启动子如SEQ ID NO：1中第5121-5139位核苷酸所示。

Lac操纵子如SEQ ID NO：1中第5140-5164位核苷酸所示。

核糖体结合位点如SEQ ID NO：1中第5178-5201位核苷酸所示。

碱性磷酸酶信号肽的编码序列如SEQ ID NO：1中第5209-5271位核苷酸所示。

TrxA蛋白的编码序列如SEQ ID NO：1中第5272-5598位核苷酸所示。

His-Tag的编码序列如SEQ ID NO：1中第5620-5637位核苷酸所示。

肠激酶酶切位点的编码序列如SEQ ID NO：1中第5638-5652位核苷酸所示。

核定位信号的编码序列如SEQ ID NO：1中第5656-5670位核苷酸所示。

spCas9蛋白的编码序列如SEQ ID NO：1中第5701-9801位核苷酸所示。

核定位信号的编码序列如SEQ ID NO：1中第9802-9849位核苷酸所示。

T7终止子如SEQ ID NO：1中第9902-9949位核苷酸。

具体的，所述特异质粒为质粒pKG-GE4。

质粒pKG-GE4中具有SEQ ID NO：1中第5121-9949位核苷酸所示的DNA分子。

具体的，以上任一所述质粒pKG-GE4如SEQ ID NO：1所示。

所述猪细胞为源自雄性猪的细胞。

所述猪细胞为源自雄性猪的体细胞。

所述猪细胞为猪原代成纤维细胞。

所述猪细胞为源自雄性猪的原代成纤维细胞。

所述猪可为任何品种的猪，优选的，所述猪可为从江香猪。

所述猪具体可为初生猪。

与现有技术相比，本发明至少具有如下有益效果：

(1)本发明研究对象(猪)比其他动物(大小鼠、灵长类)具有更好的应用性。

大小鼠等啮齿类动物不论从体型、器官大小、生理、病理等方面都与人相差巨大，无法真实地模拟人类正常的生理、病理状态。研究表明，95％以上在大小鼠中验证有效的药物在人类临床试验中是无效的。就大动物而言，灵长类是与人亲缘关系最近的动物，但其体型小、性成熟晚(6-7岁开始交配)，且为单胎动物，群体扩繁速度极慢，饲养成本很高。另外，灵长类动物克隆效率低、难度大、成本高。

而猪作为模型动物就没有上述缺点，猪是除灵长类外与人亲缘关系最近的动物，其体型、体重、器官大小等与人相近，在解剖学、生理学、免疫学、营养代谢、疾病发病机制等方面与人类极为相似。同时，猪的性成熟早(4-6个月)，繁殖力高，一胎多仔，在2-3年内即可形成一个较大群体。另外，猪的克隆技术非常成熟，克隆及饲养成本也较灵长类低得多。

(2)本发明针对猪基因组进行了4个安全港位点基因敲入后表达情况的摸索，从中筛选出了最佳的供外源基因插入的猪基因组安全港位点，可有效改善基因敲入后目的基因的表达情况。

(3)利用本发明所得到的KAP6.1-hSRD5A2纯合敲入的单细胞克隆株进行体细胞核移植动物克隆可直接得到KAP6.1-hSRD5A2纯合敲入的克隆猪，并且该纯合插入基因可稳定遗传。进一步的，可用于AGA下一步的药物筛选及药效评价、基因及细胞治疗、发病机制的研究等生物医药领域。

在小鼠模型制作中，通常采用受精卵显微注射基因编辑材料后再进行胚胎移植，因其直接获得纯合突变后代的概率非常低(低于5％)，需要进行后代的杂交选育，这不太适用于妊娠期较长的大动物(如猪)模型制作。因此，本发明采用技术难度大、挑战性高的原代细胞体外编辑并筛选阳性编辑单细胞克隆的方法，后期再通过体细胞核移植动物克隆技术直接获得相应模型猪，可大大缩短模型猪制作周期，并节省人力、物力、财力。

(4)本发明系首次将人II型5α-还原酶基因整合入猪基因组并在毛囊中进行特异性表达，且经过验证获得了纯合敲入的单细胞克隆。

本发明通过基因编辑技术获得了可在毛囊组织特异性表达人源II型5α-还原酶的猪重组细胞，后期该重组细胞可作为核移植细胞供体克隆生产脱发模型猪，将有助于研究并揭示AGA的发病机制，并可用于进行药物筛选、药效检测、基因及细胞治疗等研究，能够为进一步的临床应用提供有效的实验数据，进而为预防和治疗人类AGA提供有力的实验手段。本发明对于人类AGA发病机制的研究、药物的研发及临床前试验均具有重大应用价值。

附图说明

图1为质粒pET-32a的结构示意图。

图2为质粒pKG-GE4的结构示意图。

图3为实施例1中gRNA与NCN蛋白用量配比优化的电泳图。

图4为实施例1中NCN蛋白与商品Cas9蛋白的基因编辑效率比较的电泳图。

图5为质粒PB-1G 2R 3-puro-ROSA26的结构示意图。

图6为不同安全港位点调控GFP绿色荧光表达图。

图7为不同安全港位点调控GFP基因转录水平荧光定量PCR结果。

图8为不同安全港位点调控GFP蛋白表达的FACS检测结果。

图9为质粒KAP6.1-hSRD5A2的结构示意图。

图10为COL1A1基因序列与绝缘子1的衔接序列的测序结果。

图11为绝缘子1与EF1α启动子的衔接序列的测序结果。

图12为EF1α启动子与人源SRD5A2基因的衔接序列的测序结果。

图13为人源SRD5A2基因与EF1αPoly(A)的衔接序列的测序结果。

图14为EF1αPoly(A)与LoxP的衔接序列的测序结果。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。实施例中构建的重组质粒，均已进行测序验证。完全培养液(％为体积比)：15％胎牛血清(Gibco)+83％DMEM培养基(Gibco)+1％Penicillin-Streptomycin(Gibco)+1％HEPES(Solarbio)。细胞培养条件：37℃，5％CO₂、5％O₂的恒温培养箱。

实施例1和实施例2中采用的猪原代成纤维细胞是用初生从江香猪耳组织制备得到的。实施例3中采用的猪原代成纤维细胞是用初生从江香猪(雄性)的耳组织制备得到的。制备猪原代成纤维细胞的方法：①取猪耳组织0.5g，去除毛发及骨组织，然后用75％酒精浸泡30-40s，然后用含5％(体积比)Penicillin-Streptomycin(Gibco)的PBS缓冲液洗涤5次，然后用PBS缓冲液洗涤一次；②用剪刀将组织剪碎，采用5mL 0.1％胶原酶溶液(Sigma)，37℃消化1h，然后500g离心5min，弃上清；③将沉淀用1mL完全培养液重悬，然后铺入含10mL完全培养液并已用0.2％明胶(VWR)封盘的直径为10cm的细胞培养皿中，培养至细胞长满皿底60％左右；④完成步骤③后，采用胰蛋白酶消化并收集细胞，然后重悬于完全培养液。用于进行后续电转实验。

质粒pKG-GE3，为环形质粒，如专利申请202010084343.6中的SEQ ID NO：2所示。专利申请202010084343.6中的SEQ ID NO：2中，第395-680位核苷酸组成CMV增强子，第682-890位核苷酸组成EF1a启动子，第986-1006位核苷酸编码核定位信号(NLS)，第1016-1036位核苷酸编码核定位信号(NLS)，第1037-5161位核苷酸编码Cas9蛋白，第5162-5209位核苷酸编码核定位信号(NLS)，第5219-5266位核苷酸编码核定位信号(NLS)，第5276-5332位核苷酸编码自剪切多肽P2A(自剪切多肽P2A的氨基酸序列为“ATNFSLLKQAGDVEENPGP”，发生自剪切的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)，第5333-6046位核苷酸编码EGFP蛋白，第6056-6109位核苷酸编码自裂解多肽T2A(自裂解多肽T2A的氨基酸序列为“EGRGSLLTCGDVEENPGP”，发生自裂解的断裂位置为C端开始第一个氨基酸残基和第二个氨基酸残基之间)，第6110-6703位核苷酸编码Puromycin蛋白(简称Puro蛋白)，第6722-7310位核苷酸组成WPRE序列元件，第7382-7615位核苷酸组成3’LTR序列元件，第7647-7871位核苷酸组成bGH poly(A)signal序列元件。专利申请202010084343.6中的SEQ ID NO：2中，第911-6706位核苷酸形成融合基因，表达融合蛋白。由于自剪切多肽P2A和自裂解多肽T2A的存在，融合蛋白自发形成如下三个蛋白：具有Cas9蛋白的蛋白、具有EGFP蛋白的蛋白和具有Puro蛋白的蛋白。

pKG-U6gRNA载体即质粒pKG-U6gRNA，为环形质粒，如专利申请202010084343.6中的SEQ ID NO：3所示。专利申请202010084343.6中的SEQ ID NO：3中，第2280-2539位核苷酸组成hU6启动子，第2558-2637位核苷酸用于转录形成gRNA骨架。使用时，将20bp左右的DNA分子(用于转录形成gRNA的靶序列结合区)插入质粒pKG-U6gRNA，形成重组质粒，在细胞中重组质粒转录得到gRNA。

实施例1、NCN蛋白的制备、纯化和性能

一、原核Cas9高效表达载体的构建

质粒pET-32a的结构示意图见图1。

质粒pKG-GE4是以质粒pET-32a为出发质粒进行改造得到的。质粒pET32a-T7lac-phoA:SP-TrxA-His-EK-NLS-spCas9-NLS-T7ter(简称质粒pKG-GE4)，如SEQ ID NO：1所示，为环形质粒，结构示意图见图2。

SEQ ID NO：1中，第5121-5139位核苷酸组成T7启动子，第5140-5164位核苷酸编码Lac操纵子(lac operator)，第5178-5201位核苷酸组成核糖体结合位点(RBS),第5209-5271位核苷酸编码碱性磷酸酶信号肽(phoA signal peptide)，第5272-5598位核苷酸编码TrxA蛋白，第5620-5637位核苷酸编码His-Tag(又称为His₆标签)，第5638-5652位核苷酸编码肠激酶酶切位点(EK酶切位点)，第5656-5670位核苷酸编码核定位信号，第5701-9801位核苷酸编码spCas9蛋白，第9802-9849位核苷酸编码核定位信号，第9902-9949位核苷酸组成T7终止子。编码spCas9蛋白的核苷酸已进行针对大肠杆菌BL21(DE3)菌株的密码子优化。

质粒pKG-GE4的主要改造如下：①保留了TrxA蛋白的编码区域，TrxA蛋白可以帮助所表达的目的蛋白形成二硫键、增加目的蛋白的溶解性及活性；在TrxA蛋白的编码区域之前加入碱性磷酸酶信号肽的编码序列，碱性磷酸酶信号肽可以引导所表达的目的蛋白分泌至细菌的膜周质腔中并可被原核周质信号肽酶酶切；②在TrxA蛋白的编码序列之后增加His-Tag的编码序列，His-Tag可用于所表达的目的蛋白的富集；③在His-Tag的编码序列下游增加肠激酶酶切位点DDDDK(Asp-Asp-Asp-Asp-Lys)的编码序列，纯化出的蛋白将在肠激酶作用下去除His-Tag和上游所融合的TrxA蛋白；④插入密码子优化后的适宜大肠杆菌BL21(DE3)菌株表达的Cas9基因，同时在该基因的上游和下游均增加核定位信号编码序列，增加后期纯化出的Cas9蛋白的核定位能力。

质粒pKG-GE4中的融合基因如SEQ ID NO：1中第5209-9852位核苷酸所示，编码SEQID NO：2所示的融合蛋白(融合蛋白TrxA-His-EK-NLS-spCas9-NLS，简称为PRONCN蛋白)。由于碱性磷酸酶信号肽以及肠激酶酶切位点的存在，融合蛋白被肠激酶酶切后形成SEQ IDNO：3所示的蛋白质，将SEQ ID NO：3所示的蛋白质命名为NCN蛋白。

二、诱导表达

1、将质粒pKG-GE4导入大肠杆菌BL21(DE3)，得到重组菌。

2、将步骤1得到的重组菌接种至含100μg/ml氨苄青霉素的液体LB培养基，37℃、200rpm振荡培养过夜。

3、将步骤2得到的菌液接种至液体LB培养基，30℃、230rpm振荡培养至OD_600nm值＝1.0，然后加入异丙基硫代半乳糖苷(IPTG)并使其在体系中的浓度为0.5mM，然后25℃、230rpm振荡培养12小时，然后4℃、10000g离心15分钟，收集菌体。

4、取步骤3得到的菌体，用PBS缓冲液洗涤。

三、融合蛋白TrxA-His-EK-NLS-spCas9-NLS的纯化

1、取步骤二得到的菌体，加入粗提缓冲液并悬浮菌体，然后采用均质机进行菌体破碎(1000par循环三次)，然后4℃、15000g离心30min，收集上清液，上清液采用0.22μm孔径滤膜过滤，收集滤液。本步骤中，每g湿重的菌体配比10ml粗提缓冲液。

粗提缓冲液：含20mM Tris-HCl(pH8.0)、0.5M NaCl、5mM Imidazole、1mM PMSF，余量为ddH₂O。

2、采用亲和层析纯化融合蛋白。

首先采用5个柱体积的平衡液平衡Ni-NTA琼脂糖柱(流速为1ml/min)；然后上样50ml步骤1得到的滤液(流速为0.5-1ml/min)；然后用5个柱体积的平衡液洗涤柱子(流速为1ml/min)；然后用5个柱体积的缓冲液洗涤柱子(流速为1ml/min)，以去除杂蛋白；然后用10个柱体积的洗脱液以0.5-1ml/min的流速洗脱，收集过柱后溶液(90-100ml)。

Ni-NTA琼脂糖柱：金斯瑞，L00250/L00250-C，填料为10ml。

平衡液：含20mM Tris-HCl(pH 8.0)、0.5M NaCl、5mM Imidazole，余量为ddH₂O。

缓冲液：含20mM Tris-HCl(pH 8.0)、0.5M NaCl、50mM Imidazole，余量为ddH₂O。

洗脱液：含20mM Tris-HCl(pH 8.0)、0.5M NaCl、500mM Imidazole，余量为ddH₂O。

四、融合蛋白TrxA-His-EK-NLS-spCas9-NLS的酶切与NCN蛋白的纯化

1、取15ml步骤三收集的过柱后溶液，使用Amicon超滤管(Sigma,UFC9100，容量为15ml)将其浓缩至200μl，然后用25mM Tris-HCl(pH8.0)稀释至1ml。采用6个超滤管，共得到6ml。

2、将商品来源的具有His₆标签的重组牛肠激酶(生工生物，C620031，重组牛肠激酶轻链，带His₆标签，Recombinant Bovine Enterokinase Light Chain,His)加入到步骤1得到的溶液(约6ml)中，25℃酶切16小时。每50μg蛋白量配比加入2个单位的肠激酶。

3、取完成步骤2的溶液(约6ml)，与480μl Ni-NTA树脂(金斯瑞，L00250/L00250-C)混匀，在室温下旋转混匀15min，然后7000g离心3min，收集上清液(4-5.5ml)。

4、取步骤3得到的上清液，使用Amicon超滤管(Sigma,UFC9100，容量为15ml)将其浓缩至200μl，然后加入酶贮存液中，调整蛋白浓度为5mg/ml，即为NCN蛋白溶液。

经测序，NCN蛋白溶液中的蛋白质，N端15个氨基酸残基如SEQ ID NO：3第1至15位所示，即NCN蛋白。

用于后续步骤以及后续实施例的NCN蛋白由NCN蛋白溶液提供。

酶贮存液(pH7.4)：含10mM Tris,300mM NaCl,0.1mM EDTA,1mM DTT,50％(体积比)甘油，余量为ddH₂O。

五、NCN蛋白的性能

选择靶向TTN基因的2个gRNA靶点如下：

TTN-gRNA1：AGAGCACAGTCAGCCTGGCG；

TTN-gRNA2：CTTCCAGAATTGGATCTCCG。

用于鉴定包含TTN基因中gRNA的靶点片段的引物如下：

TTN-F55：TACGGAATTGGGGAGCCAGCGGA；

TTN-R560：CAAAGTTAACTCTCTGTGTCT。

1、制备gRNA

(1)制备TTN-T7-gRNA1转录模板和TTN-T7-gRNA2转录模板

TTN-T7-gRNA1转录模板为双链DNA分子，如SEQ ID NO：4所示。

TTN-T7-gRNA2转录模板为双链DNA分子，如SEQ ID NO：5所示。

(2)体外转录得到gRNA

取TTN-T7-gRNA1转录模板，采用Transcript Aid T7 High Yield TranscriptionKit(Fermentas，K0441)进行体外转录，然后用MEGA clear^TM Transcription Clean-Up Kit(Thermo，AM1908)进行回收纯化，得到TTN-gRNA1。TTN-gRNA1为单链RNA，如SEQ ID NO：6所示。

取TTN-T7-gRNA2转录模板，采用Transcript Aid T7 High Yield TranscriptionKit(Fermentas，K0441)进行体外转录，然后用MEGA clear^TM Transcription Clean-Up Kit(Thermo，AM1908)进行回收纯化，得到TTN-gRNA2。TTN-gRNA2为单链RNA，如SEQ ID NO：7所示。

2、gRNA与NCN蛋白用量配比优化

(1)共转染猪原代成纤维细胞

第一组：将TTN-gRNA1、TTN-gRNA2和NCN蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：0.5μg TTN-gRNA1：0.5μg TTN-gRNA2：4μg NCN蛋白。

第二组：将TTN-gRNA1、TTN-gRNA2和NCN蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：0.75μg TTN-gRNA1：0.75μg TTN-gRNA2：4μg NCN蛋白。

第三组：将TTN-gRNA1、TTN-gRNA2和NCN蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-gRNA1：1μg TTN-gRNA2：4μg NCN蛋白。

第四组：将TTN-gRNA1、TTN-gRNA2和NCN蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1.25μg TTN-gRNA1：1.25μg TTN-gRNA2：4μg NCN蛋白。

第五组：将TTN-gRNA1和TTN-gRNA2共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-gRNA1：1μg TTN-gRNA2。

共转染采用电击转染的方式，采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为：1450V、10ms、3pulse)。

(2)完成步骤(1)后，采用完全培养液培养12-18小时，然后更换新的完全培养液进行培养。电转后培养总时间为48小时。

(3)完成步骤(2)后，采用胰蛋白酶消化并收集细胞，提取基因组DNA，采用TTN-F55和TTN-R560组成的引物对进行PCR扩增，然后进行1％琼脂糖凝胶电泳。

电泳图见图3。505bp条带为野生型条带(WT)，254bp左右(野生型条带505bp理论缺失251bp)为缺失突变条带(MT)。

基因缺失突变效率＝(MT灰度/MT条带bp数)/(WT灰度/WT条带bp数+MT灰度/MT条带bp数)×100％。第一组基因缺失突变效率为19.9％，第二组基因缺失突变效率为39.9％，第三组基因缺失突变效率为79.9％，第四组基因缺失突变效率为44.3％。第五组未发生突变。

结果表明，当两个gRNA与NCN蛋白的质量配比为1：1：4，实际用量为1μg：1μg：4μg时基因编辑效率最高。因此，确定两个gRNA与NCN蛋白的最适用量为1μg：1μg：4μg。

3、NCN蛋白与商品Cas9蛋白的基因编辑效率比较

(1)共转染猪原代成纤维细胞

Cas9-A组：将TTN-gRNA1、TTN-gRNA2和商品Cas9-A蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-gRNA1：1μg TTN-gRNA2：4μg Cas9-A蛋白。

pKG-GE4组：将TTN-gRNA1、TTN-gRNA2和NCN蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-gRNA1：1μg TTN-gRNA2：4μg NCN蛋白。

Cas9-B组：将TTN-gRNA1、TTN-gRNA2和商品Cas9-B蛋白共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-gRNA1：1μg TTN-gRNA2：4μg Cas9-B蛋白。

Control组：将TTN-gRNA1、TTN-gRNA2共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg TTN-gRNA1：1μg TTN-gRNA2。

电泳图见图4。采用商品Cas9-A蛋白的基因缺失突变效率为28.5％，采用NCN蛋白的基因缺失突变效率为85.6％，采用商品Cas9-B蛋白的基因缺失突变效率为16.6％。

结果表明，与采用商品的Cas9蛋白相比，采用本发明制备的NCN蛋白使得基因编辑效率显著提高。

实施例2、筛选供外源基因定点插入的猪基因组最佳安全港位点

一、构建含GFP基因的不同安全港位点Donor载体

构建质粒PB-1G 2R 3-puro-ROSA26、质粒PB-1G 2R 3-puro-AAVS1、质粒PB-1G2R3-puro-H11和质粒PB-1G 2R 3-puro-COL1A1。四个质粒均为环形质粒。

质粒PB-1G 2R 3-puro-ROSA26如SEQ ID NO：8所示，结构示意图见图5。SEQ IDNO：8中，第9-339位核苷酸组成ROSA26安全港插入位点5’端猪基因组区域(SH1左臂)，第9184-10195位核苷酸组成ROSA26安全港插入位点3’端猪基因组区域(SH1右臂)。SEQ IDNO：8中，第346-546、3132-3531、6506-6706、8975-9175位核苷酸分别组成4个不同的绝缘子区域。SEQ ID NO：8中，第637-1209位核苷酸组成EF-1αpoly(A)信号,第1216-1935位核苷酸编码EGFP蛋白，第1954-3131位核苷酸组成EF-1α启动子，第3543-4042位核苷酸组成PGK启动子，第4059-4769位核苷酸编码mCherry蛋白，第4791-5015位核苷酸组成bGH poly(A)信号，第5054-6504位核苷酸为loxP-puro-loxP表达框区域，第6969-7233位核苷酸组成β-globin poly(A)信号，第7259-8974位核苷酸组成pCAG启动子。

质粒PB-1G 2R 3-puro-AAVS1与质粒PB-1G 2R 3-puro-ROSA26的差异仅在于：将SH1左臂替换为AAVS1安全港插入位点5’端猪基因组区域(SH2左臂，SH2左臂如SEQ ID NO：9所示)并且将SH1右臂替换为AAVS1安全港插入位点3’端猪基因组区域(SH2右臂，SH2右臂如SEQ ID NO：10所示)。

质粒PB-1G 2R 3-puro-H11与质粒PB-1G 2R 3-puro-ROSA26的差异仅在于：将SH1左臂替换为H11安全港插入位点5’端猪基因组区域(SH3左臂，SH3左臂如SEQ ID NO：11所示)并且将SH1右臂替换为H11安全港插入位点3’端猪基因组区域(SH3右臂，SH3右臂如SEQID NO：12所示)。

质粒PB-1G 2R 3-puro-COL1A1与质粒PB-1G 2R 3-puro-ROSA26的差异仅在于：将SH1左臂替换为COL1A1安全港插入位点5’端猪基因组区域(SH4左臂，SH4左臂如SEQ ID NO：13所示)并且将SH1右臂替换为COL1A1安全港插入位点3’端猪基因组区域(SH4右臂，SH4右臂如SEQ ID NO：14所示)。

二、猪ROSA26、AAVS1、H11、COL1A1基因组安全港位点的高效切割靶点筛选

通过前期筛选，ROSA26安全港位点的高效切割靶点为sgRNA_ROSA26-g3(切割效率38％)，AAVS1安全港位点的高效切割靶点为sgRNA_AAVS1-g4(切割效率30％)、H11安全港位点的高效切割靶点为sgRNA_H11-g1(切割效率60％)，COL1A1安全港位点的高效切割靶点为sgRNA_COL1A1-g3(切割效率56％)。

靶点序列如下：

sgRNA_ROSA26-g3靶点：5’-GAAGGAGCAAACTGACATGG-3’；

sgRNA_AAVS1-g4靶点：5’-TGCAGTGGGTCTTTGGGGAC-3’；

sgRNA_H11-g1靶点：5’-TTCCAGGAACATAAGAAAGT-3’；

sgRNA_COL1A1-g3靶点：5’-GCAGTCTCAGCAACCACTGA-3’。

三、制备安全港位点gRNA重组载体

取质粒pKG-U6gRNA，用限制性内切酶BbsI进行酶切，回收载体骨架(约3kb的线性大片段)。

分别合成ROSA26-g3-S和ROSA26-g3-A，然后混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接，得到质粒pKG-U6gRNA(ROSA26-g3)。质粒pKG-U6gRNA(ROSA26-g3)表达SEQ ID NO：15所示的sgRNA_ROSA26-g3。

分别合成AAVS1-g4-S和AAVS1-g4-A，然后混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接，得到质粒pKG-U6gRNA(AAVS1-g4)。质粒pKG-U6gRNA(AAVS1-g4)表达SEQ ID NO：16所示的sgRNA_AAVS1-g4。

分别合成H11-g1-S和H11-g1-A，然后混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接，得到质粒pKG-U6gRNA(H11-g1)。质粒pKG-U6gRNA(H11-g1)表达SEQ ID NO：17所示的sgRNA_H11-g1。

分别合成COL1A1-g3-S和COL1A1-g3-A，然后混合并进行退火，得到具有粘性末端的双链DNA分子。将具有粘性末端的双链DNA分子和载体骨架连接，得到质粒pKG-U6gRNA(COL1A1-g3)。质粒pKG-U6gRNA(COL1A1-g3)表达SEQ ID NO：18所示的sgRNA_COL1A1-g3。

ROSA26-g3-S、ROSA26-g3-A、AAVS1-g4-S、AAVS1-g4-A、H11-g1-S、H11-g1-A、COL1A1-g3-S和COL1A1-g3-A均为单链DNA分子。

ROSA26-g3-S：caccGAAGGAGCAAACTGACATGG；

ROSA26-g3-A：aaacCCATGTCAGTTTGCTCCTTC。

AAVS1-g4-S：caccgTGCAGTGGGTCTTTGGGGAC；

AAVS1-g4-A：aaacGTCCCCAAAGACCCACTGCAc。

H11-g1-S：caccgTTCCAGGAACATAAGAAAGT；

H11-g1-A：aaacACTTTCTTATGTTCCTGGAAc。

COL1A1-g3-S：caccGCAGTCTCAGCAACCACTGA；

COL1A1-g3-A：aaacTCAGTGGTTGCTGAGACTGC。

sgRNA_ROSA26-g3(SEQ ID NO：15)：

GAAGGAGCAAACUGACAUGGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。

sgRNA_AAVS1-g4(SEQ ID NO：16)：

UGCAGUGGGUCUUUGGGGACguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。

sgRNA_H11-g1(SEQ ID NO：17)：

UUCCAGGAACAUAAGAAAGUguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。

sgRNA_COL1A1-g3(SEQ ID NO：18)：

GCAGUCUCAGCAACCACUGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu。

四、含不同安全港插入位点两侧同源臂的荧光Donor载体(即包含外源基因GFP的不同安全港位点载体)、sgRNA载体和Cas9载体(即质粒pKG-GE3)混合电转猪原代成纤维细胞及细胞GFP荧光强度检测

1、共转染

第一组(ROSA26组)：将质粒PB-1G 2R 3-puro-ROSA26、质粒pKG-U6gRNA(ROSA26-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G 2R 3-puro-ROSA26：0.82μg质粒pKG-U6gRNA(ROSA26-g3)：0.92μg质粒pKG-GE3；即3种质粒的摩尔配比依次为：1：3：1。

第二组(AAVS1组)：将质粒PB-1G 2R 3-puro-AAVS1、质粒pKG-U6gRNA(AAVS1-g4)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G 2R 3-puro-AAVS1：0.82μg质粒pKG-U6gRNA(AAVS1-g4)：0.92μg质粒pKG-GE3；即3种质粒的摩尔配比依次为：1：3：1。

第三组(H11组)：将质粒PB-1G 2R 3-puro-H11、质粒pKG-U6gRNA(H11-g1)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G2R3-puro-H11：0.82μg质粒pKG-U6gRNA(H11-g1)：0.92μg质粒pKG-GE3；即3种质粒的摩尔配比依次为：1：3：1。

第四组(COL1A1组)：将质粒PB-1G 2R 3-puro-COL1A1、质粒pKG-U6gRNA(COL1A1-g3)和质粒pKG-GE3共转染猪原代成纤维细胞。配比：约20万个猪原代成纤维细胞：1.26μg质粒PB-1G 2R 3-puro-COL1A1：0.82μg质粒pKG-U6gRNA(COL1A1-g3)：0.92μg质粒pKG-GE3；即3种质粒的摩尔配比依次为：1：3：1。

第五组：猪原代成纤维细胞，同等电转参数不加任何质粒进行电转操作。

共转染采用电击转染的方式，采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为：1450V、10ms、3pulse)进行转染。

2、完成步骤1后，采用完全培养液培养12-24小时，然后更换新的完全培养液进行培养。培养总时间为48小时。

3、完成步骤2后，更换为含1.5μg/mL嘌呤霉素的完全培养液培养3周(每2天更换新的含1.5μg/mL嘌呤霉素的完全培养液)，持续观察并对GFP绿色荧光进行拍照，通过GFP荧光表达的强弱判断安全港位点表达外源基因效率的高低。

嘌呤霉素筛选一周后，ROSA26、COL1A1安全港位点试验组荧光强度明显强于AAVS1、H11试验组。嘌呤霉素筛选两周后，荧光强度由强到弱依次为：COL1A1>ROSA26>H11>AAVS1，其中H11组荧光强度不太均一，ROSA26组整体荧光强度较均一且荧光强度较高，AAVS1组细胞荧光表达最弱,COL1A1组荧光细胞数最多且荧光最强。嘌呤霉素继续筛选三周后，荧光强度由强到弱依次为：COL1A1>ROSA26>H11>AAVS1，照片见如图6。

五、GFP基因转录水平检测

为了比较GFP基因整合入四个不同安全港位点后mRNA转录水平的差异性，能否参与GFP的表达调控及对表达量的影响。在GFP基因外显子处设计一对引物，取步骤四中嘌呤霉素筛选三周后的细胞，提取总RNA,反转录成cDNA,检测原代细胞在四个不同安全港位点整合GFP基因后的转录水平，同时用第五组的细胞(无质粒的对照电转组)所得到的定量结果作为对照。以GAPDH基因为内参基因按照2^-ΔCt法进行计算。

用于检测GFP基因的引物：F:AGATCCGCCACAACATCGAG；R:GTCCATGCCGAGAGTGATCC。

用于检测GAPDH基因的引物：F:GGTCGGAGTGAACGGATTTG；R:CCATTTGATGTTGGCGGGAT。

用SPSS统计学软件进行数据分析，以(平均数±标准差)表示，采用双因素方差分析进行统计学分析。2^-ΔCt值结果显示嘌呤霉素筛选三周后AAVS1、H11组GFP表达量较低，ROSA26、COL1A1组GFP表达量较高，且COL1A1组和ROSA26组相对于AAVS1和H11组GFP转录水平差异极显著(P<0.01)。2^-ΔCt值见表1，差异显著性分析结果见图7。

表1 2^-ΔCt值信息

综上，根据培养细胞三周后的荧光信号强度与GFP基因实时荧光定量PCR的结果，可以得出如下结论，在ROSA26、AAVS1、H11、COL1A1这四个基因组安全港位点中，COL1A1位点插入外源基因后表达效果最好。

六、GFP基因的蛋白表达水平FACS检测

为了比较GFP基因整合入四个不同安全港位点后GFP蛋白的表达情况。分别用胰蛋白酶消化步骤四中嘌呤霉素筛选三周后的电转细胞，400g离心4min，弃上清。以1mL完全培养液重悬细胞，并将细胞悬液分别转移至流式管内。在BD FACSMelody流式细胞仪的FITC通道内检测GFP信号，收集5×10⁴个细胞进行分析，结果见图8。

结果显示，GFP荧光信号强度COL1A1>ROSA26>H11>AAVS1。

因此，综合上述结果，COL1A1位点是ROSA26、AAVS1、H11、COL1A1四个安全港位点中最高效表达外源基因的猪原代细胞安全港位点。

实施例3、制备在基因组COL1A1安全港位点定点插入hSRD5A2基因表达盒的单细胞克隆

人SRD5A2基因(hSRD5A2基因)信息：编码II型5α-还原酶(5-alpha reductasetype 2)；Homo sapiens；位于人2号染色体；GeneID为6716。人II型5α-还原酶的氨基酸序列如SEQ ID NO：19所示。

发明人经多次试验研究表明，相比实施例2中pKG-GE3质粒和gRNA质粒组合电转的方式，采用NCN蛋白和gRNA组合即RNP电转后能够使细胞的活性更好，因此本实施例采用RNP电转方式制备在基因组COL1A1安全港位点定点插入hSRD5A2基因表达盒的单细胞克隆。

一、构建KAP6.1-hSRD5A2 Donor载体

KAP6.1-hSRD5A2 Donor载体即质粒KAP6.1-hSRD5A2。

质粒KAP6.1-hSRD5A2如SEQ ID NO：20所示，为环形质粒，结构示意图见图9。SEQID NO：20中，第9-880位核苷酸为COL1A1安全港插入位点5’端猪基因组区域(SH4左臂)，第887-1087位核苷酸为绝缘子(命名为绝缘子1，Insulator 1)，第1088-2139位核苷酸为KAP6.1启动子，第2140-2904位核苷酸为hSRD5A2基因，第2905-3477位核苷酸为EF1αPoly(A)，第3507-3540位核苷酸为LoxP序列，第3605-4104位核苷酸为pGK启动子，第4182-4985位核苷酸编码Neomycin抗性蛋白(简称Neo^R蛋白)，第5023-5247位核苷酸为bGH Poly(A)，第5304-5337位核苷酸为LoxP序列，第5358-5559位核苷酸为绝缘子(命名为绝缘子5，Insulator 5)，第5560-6286位核苷酸为COL1A1安全港插入位点3’端猪基因组区域(SH4右臂)。Neomycin抗性蛋白为新霉素抗性蛋白。新霉素(Geneticin)，又称为G418或遗传霉素。

二、制备gRNA

选用前期筛选中获得的COL1A1安全港位点的两个高效切割靶点sgRNA_COL1A1-g1(切割效率50％)和sgRNA_COL1A1-g3(切割效率56％)。

两个靶点的信息如下：

sgRNA_COL1A1-g1靶点：5’-CTACCAAGAGAGTGACCAGC-3’；

sgRNA_COL1A1-g3靶点：5’-GCAGTCTCAGCAACCACTGA-3’。

1、制备COL1A1-T7-gRNA1转录模板和COL1A1-T7-gRNA3转录模板

COL1A1-T7-gRNA1转录模板为双链DNA分子，如SEQ ID NO：21所示。

COL1A1-T7-gRNA3转录模板为双链DNA分子，如SEQ ID NO：22所示。

2、体外转录得到gRNA

取COL1A1-T7-gRNA1转录模板，采用Transcript Aid T7 High YieldTranscription Kit(Fermentas，K0441)进行体外转录，然后用MEGA clear^TMTranscription Clean-Up Kit(Thermo，AM1908)进行回收纯化，得到COL1A1-gRNA1。COL1A1-gRNA1为单链RNA，如SEQ ID NO：23所示。

取COL1A1-T7-gRNA3转录模板，采用Transcript Aid T7 High YieldTranscription Kit(Fermentas，K0441)进行体外转录，然后用MEGA clear^TMTranscription Clean-Up Kit(Thermo，AM1908)进行回收纯化，得到COL1A1-gRNA3。COL1A1-gRNA3为单链RNA，如SEQ ID NO：24所示。

COL1A1-gRNA1(SEQ ID NO：23)：

GGCUACCAAGAGAGUGACCAGCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU。

COL1A1-gRNA3(SEQ ID NO：24)：

GGGCAGUCUCAGCAACCACUGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU。

三、共转染

将COL1A1-gRNA1、COL1A1-gRNA3、NCN蛋白和质粒KAP6.1-hSRD5A2共转染猪原代成纤维细胞。配比：约10万个猪原代成纤维细胞：1μg COL1A1-gRNA1：1μg COL1A1-gRNA3：4μgNCN蛋白：3μg质粒KAP6.1-hSRD5A2。共转染采用电击转染的方式，采用哺乳动物核转染试剂盒(Neon kit,Thermofisher)与Neon TM transfection system电转仪(参数设置为：1450V、10ms、3pulse)。

COL1A1-gRNA1、COL1A1-gRNA3和NCN蛋白发挥的功能为在猪基因组DNA中制造DNA双链断裂，以提高同源重组率。质粒KAP6.1-hSRD5A2与猪基因组DNA发生同源重组，将猪基因组DNA中SH4左臂和SH4右臂之间插入外源靶基因片段(外源靶基因片段即SEQ ID NO：20中第881-5559位核苷酸所示的DNA分子)。

四、新霉素加压筛选

1、筛选插入外源靶基因片段的阳性细胞

(1)完成步骤三后，采用完全培养液培养电转后的细胞16-18小时，然后更换新的完全培养液进行培养。培养总时间为48小时。

(2)完成步骤(1)后，更换为含1.5mg/mL G418的完全培养液进行筛选培养(每天更换新的含1.5mg/mL G418的完全培养液)，筛选培养的时间为3周。

筛选培养1周时，细胞出现大量死亡。

筛选培养2周时，细胞只有零星死亡，部分阳性克隆开始分裂增殖，细胞数不断增多。

筛选培养第3周的目的是使细胞内质粒降解完全以排除假阳性细胞克隆。

(3)完成步骤(2)后，收集细胞，采用不含G418的完全培养液恢复培养2代(每2天1代)，让细胞恢复至良好状态以用于下一步的单细胞分选。

2、单细胞分选，放大培养

(1)完成步骤1后，收集细胞，使用胰蛋白酶进行消化，然后采用完全培养液中和，然后500g离心5min，弃除上清，将沉淀用1mL完全培养液重悬并适当稀释，用口吸管挑取单细胞转移到96孔板中(每孔预先加入100μl完全培养液)(每组细胞一个96孔板，每孔一个细胞)，进行培养，培养2天后更换为含1.5mg/mL G418的完全培养液，之后每2～3天更换新的含1.5mg/mL G418的完全培养液，期间用显微镜观察每孔细胞生长情况，排除无细胞及非单细胞克隆的孔。

(2)待步骤(1)中的96孔板的孔中细胞长满孔底(大约2周左右)，使用胰蛋白酶消化并收集细胞，其中2/3细胞接种到含有完全培养液的6孔板中，剩余的1/3细胞收集在1.5mL离心管中。

(3)待步骤(2)中的6孔板的孔中细胞长至50％丰满度时使用0.25％(Gibco)的胰蛋白酶消化并收集细胞，使用细胞冻存液(90％完全培养液+10％DMSO，体积比)将细胞冻存。

五、COL1A1安全港位点定点插入外源靶基因片段的基因组水平鉴定

为了检测细胞基因组的COL1A1安全港位点是否成功定点插入了外源靶基因片段。取步骤四的2的(2)中的离心管，提取细胞基因组DNA，采用特异引物对(特异引物对分别为：sh4-Lr-JDF1414和sh4-Lr-JDR5965组成的引物对、sh4-Rr-JDF282和sh4-Rr-JDR4723组成的引物对、sh4-wt-JDF1085和sh4-wt-JDR1560组成的引物对)进行PCR扩增，然后进行电泳。将猪原代成纤维细胞作为野生型对照(WT)。

sh4-Lr-JDF1414和sh4-Lr-JDR5965组成的引物对用来鉴定猪COL1A1安全港插入位点5’端外源靶基因片段是否重组成功(靶序列为4552bp，获得约4552bp的扩增产物表示重组成功)；sh4-Rr-JDF282和sh4-Rr-JDR4723组成的引物对用来鉴定猪COL1A1安全港插入位点3’端外源靶基因片段是否重组成功(靶序列为4442bp，获得约4442bp的扩增产物表示重组成功)；sh4-wt-JDF1085和sh4-wt-JDR1560组成的引物对用来鉴定猪COL1A1安全港位点定点插入的外源靶基因片段为纯合型还是杂合型(野生型对照的基因组DNA可扩增出476bp片段，重组细胞由于插入的外源靶基因片段太大无法实现扩增；因此，如果不显示扩增产物，说明细胞为插入外源靶基因片段的纯合型；如果显示476bp扩增产物，说明细胞为插入外源靶基因片段的杂合型或者是野生型)。

sh4-Lr-JDF1414：CCTGCTGTAAGTGCCGTAGT；

sh4-Lr-JDR5965：CTAGGGGCACAGCACGTC。

sh4-Rr-JDF282：AAGTTATTAGGTCTGAAGAGGAGTTT；

sh4-Rr-JDR4723：CCCATCATTCCGTCCCAGAG。

sh4-wt-JDF1085：TGCTGAGTTCTGGCTTCCTG；

sh4-wt-JDR1560：TCTACCAAGAGAGTGACCAGCAG。

根据鉴定结果，编号为1-3、5-15、17-55号的单细胞克隆均为成功在COL1A1安全港位点定点插入外源靶基因片段的克隆，其中编号为29、44的单细胞克隆为纯合定点插入，其他单细胞克隆为杂合定点插入。见表2。

表2单细胞克隆的基因型

表2中编号为1的重组细胞(杂合定点插入型)命名为1#重组细胞。经全基因组测序,与同一来源的猪原代成纤维细胞相比，1#重组细胞的基因组DNA的差异仅在于：基因组DNA中SH4左臂和SH4右臂之间插入了外源靶基因片段(外源靶基因片段即SEQ ID NO：20中第881-5559位核苷酸所示的DNA分子)，且为杂合型(即一对同源染色体中，一条染色体发生了插入，另一条染色体未发生插入)。

表2中编号为29的重组细胞(纯合定点插入型)命名为29#重组细胞。表2中编号为44的重组细胞(纯合定点插入型)命名为44#重组细胞。经全基因组测序,与同一来源的猪原代成纤维细胞相比，29#重组细胞(或者44#重组细胞)的基因组DNA的差异仅在于：基因组DNA中SH4左臂和SH4右臂之间插入了外源靶基因片段(外源靶基因片段即SEQ ID NO：20中第881-5559位核苷酸所示的DNA分子)，且为纯合型(即两条同源染色体发生了相同插入)。关键衔接序列的测序结果见图10至图14。

综上，本发明成功获得了将人源SRD5A2基因定点整合入猪基因组并进行毛囊组织特异表达的重组细胞，该重组细胞可作为核移植细胞供体克隆生产脱发模型猪。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

序列表

<110> 南京启真基因工程有限公司

<120> 试剂盒及其在构建毛囊组织特异表达人源II型5α-还原酶基因的重组猪细胞中的应用

<130> GNCYX221773

<160> 25

<170> SIPOSequenceListing 1.0

<210> 1

<211> 9974

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 600

gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 660

ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 720

agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 780

agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 840

tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 900

tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 960

cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1020

aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1080

tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1140

tgcagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1200

ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1260

ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1320

cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1380

gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1440

actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1500

aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 1560

caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1620

aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1680

accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1740

aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1800

ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1860

agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1920

accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1980

gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2040

tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2100

cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2160

cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2220

cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2280

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2340

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2400

gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatatgg 2460

tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 2520

cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 2580

gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 2640

gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct 2700

catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt 2760

tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg 2820

ttttttcctg tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa 2880

tgataccgat gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc 2940

ggttactgga acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa 3000

aaatcactca gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta 3060

gccagcagca tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg 3120

tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 3180

acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 3240

cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 3300

cccgtggggc cgccatgccg gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg 3360

gaccagtgac gaaggcttga gcgagggcgt gcaagattcc gaataccgca agcgacaggc 3420

cgatcatcgt cgcgctccag cgaaagcggt cctcgccgaa aatgacccag agcgctgccg 3480

gcacctgtcc tacgagttgc atgataaaga agacagtcat aagtgcggcg acgatagtca 3540

tgccccgcgc ccaccggaag gagctgactg ggttgaaggc tctcaagggc atcggtcgag 3600

atcccggtgc ctaatgagtg agctaactta cattaattgc gttgcgctca ctgcccgctt 3660

tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3720

gcggtttgcg tattgggcgc cagggtggtt tttcttttca ccagtgagac gggcaacagc 3780

tgattgccct tcaccgcctg gccctgagag agttgcagca agcggtccac gctggtttgc 3840

cccagcaggc gaaaatcctg tttgatggtg gttaacggcg ggatataaca tgagctgtct 3900

tcggtatcgt cgtatcccac taccgagatg tccgcaccaa cgcgcagccc ggactcggta 3960

atggcgcgca ttgcgcccag cgccatctga tcgttggcaa ccagcatcgc agtgggaacg 4020

atgccctcat tcagcatttg catggtttgt tgaaaaccgg acatggcact ccagtcgcct 4080

tcccgttccg ctatcggctg aatttgattg cgagtgagat atttatgcca gccagccaga 4140

cgcagacgcg ccgagacaga acttaatggg cccgctaaca gcgcgatttg ctggtgaccc 4200

aatgcgacca gatgctccac gcccagtcgc gtaccgtctt catgggagaa aataatactg 4260

ttgatgggtg tctggtcaga gacatcaaga aataacgccg gaacattagt gcaggcagct 4320

tccacagcaa tggcatcctg gtcatccagc ggatagttaa tgatcagccc actgacgcgt 4380

tgcgcgagaa gattgtgcac cgccgcttta caggcttcga cgccgcttcg ttctaccatc 4440

gacaccacca cgctggcacc cagttgatcg gcgcgagatt taatcgccgc gacaatttgc 4500

gacggcgcgt gcagggccag actggaggtg gcaacgccaa tcagcaacga ctgtttgccc 4560

gccagttgtt gtgccacgcg gttgggaatg taattcagct ccgccatcgc cgcttccact 4620

ttttcccgcg ttttcgcaga aacgtggctg gcctggttca ccacgcggga aacggtctga 4680

taagagacac cggcatactc tgcgacatcg tataacgtta ctggtttcac attcaccacc 4740

ctgaattgac tctcttccgg gcgctatcat gccataccgc gaaaggtttt gcgccattcg 4800

atggtgtccg ggatctcgac gctctccctt atgcgactcc tgcattagga agcagcccag 4860

tagtaggttg aggccgttga gcaccgccgc cgcaaggaat ggtgcatgca aggagatggc 4920

gcccaacagt cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat 4980

gagcccgaag tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc 5040

aaccgcacct gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat 5100

cgatctcgat cccgcgaaat taatacgact cactataggg gaattgtgag cggataacaa 5160

ttcccctcta gaaataattt tgtttaactt taagaaggag atatacatat gaaacaaagc 5220

actattgcac tggcactctt accgttactg tttacccctg tgacaaaagc catgagcgat 5280

aaaattattc acctgactga cgacagtttt gacacggatg tactcaaagc ggacggggcg 5340

atcctcgtcg atttctgggc agagtggtgc ggtccgtgca aaatgatcgc cccgattctg 5400

gatgaaatcg ctgacgaata tcagggcaaa ctgaccgttg caaaactgaa catcgatcaa 5460

aaccctggca ctgcgccgaa atatggcatc cgtggtatcc cgactctgct gctgttcaaa 5520

aacggtgaag tggcggcaac caaagtgggt gcactgtcta aaggtcagtt gaaagagttc 5580

ctcgacgcta acctggccgg ttctggttct ggccatatgc accatcatca tcatcatgac 5640

gatgacgata agatgcccaa aaagaaacga aaggtgggta tccacggagt cccagcagcc 5700

gacaaaaaat atagcatcgg cctggacatc ggtaccaaca gcgttggctg ggcagtgatc 5760

actgatgaat acaaagttcc atccaaaaaa tttaaagtac tgggcaacac cgaccgtcac 5820

tctatcaaaa aaaacctgat tggtgctctg ctgtttgaca gcggcgaaac tgctgaggct 5880

acccgtctga aacgtacggc tcgccgtcgc tacactcgtc gtaaaaaccg catctgttat 5940

ctgcaggaaa ttttctctaa cgaaatggca aaagttgatg atagcttctt tcatcgtctg 6000

gaagagagct tcctggtgga agaagataaa aaacacgaac gtcacccgat tttcggtaac 6060

attgtggatg aggttgccta ccacgagaaa tatccgacca tctaccatct gcgtaaaaaa 6120

ctggttgata gcactgacaa agcggatctg cgtctgatct acctggctct ggcacacatg 6180

atcaaattcc gtggtcactt cctgatcgaa ggtgatctga accctgataa ctccgacgtg 6240

gacaaactgt tcattcagct ggttcagacc tataaccagc tgttcgaaga aaacccgatc 6300

aacgcgtccg gtgtagacgc taaggcaatt ctgtctgcgc gtctgtctaa gtctcgtcgt 6360

ctggaaaacc tgattgcgca actgccaggt gaaaagaaaa acggcctgtt cggcaatctg 6420

atcgccctgt ccctgggtct gactccgaac tttaaatcca actttgacct ggcggaagat 6480

gccaagctgc agctgagcaa agatacctat gacgatgacc tggataacct gctggcacag 6540

atcggtgatc agtatgccga tctgttcctg gccgcgaaaa acctgtctga tgcgattctg 6600

ctgtctgata tcctgcgcgt taacactgaa attactaaag cgccgctgag cgcatccatg 6660

attaaacgtt acgatgaaca ccaccaggat ctgaccctgc tgaaagcgct ggtgcgtcag 6720

cagctgccgg aaaaatacaa ggagatcttc ttcgaccaga gcaaaaacgg ttacgcgggc 6780

tacattgatg gtggtgcatc tcaggaggaa ttctacaaat tcattaaacc gatcctggaa 6840

aaaatggatg gtactgaaga gctgctggtt aaactgaatc gtgaagatct gctgcgcaaa 6900

cagcgtacct tcgataacgg ttccatcccg catcagattc atctgggcga actgcacgct 6960

atcctgcgcc gtcaggaaga cttttatccg ttcctgaaag acaaccgtga gaaaattgaa 7020

aaaatcctga ccttccgtat tccgtactat gtaggtccgc tggcgcgtgg taactcccgt 7080

ttcgcttgga tgacccgcaa aagcgaagaa accatcaccc cgtggaattt cgaagaagtc 7140

gttgacaaag gcgcgtccgc gcagtctttc atcgaacgca tgacgaactt cgacaaaaac 7200

ctgccgaacg agaaagtgct gccgaaacac tctctgctgt acgagtactt cactgtgtac 7260

aacgaactga ccaaagtgaa atacgtcacc gaaggtatgc gtaaaccggc attcctgtcc 7320

ggtgagcaaa aaaaagcaat cgtggatctg ctgttcaaaa ccaaccgtaa agtaaccgtg 7380

aaacagctga aggaagacta tttcaagaaa atcgaatgtt ttgattctgt tgaaatctcc 7440

ggcgtggaag atcgcttcaa tgcgtccctg ggtacgtatc acgacctgct gaaaattatc 7500

aaagacaaag attttctgga caacgaggaa aacgaagaca tcctggagga tattgtactg 7560

accctgaccc tgttcgaaga ccgtgagatg atcgaagaac gcctgaaaac ctacgcccac 7620

ctgttcgatg acaaggtaat gaagcagctg aaacgtcgtc gttataccgg ctggggtcgt 7680

ctgtcccgta aactgatcaa tggcatccgt gataaacagt ctggcaaaac catcctggac 7740

ttcctgaaat ccgacggttt cgcgaatcgt aacttcatgc aactgattca tgacgattct 7800

ctgactttca aagaagacat ccagaaagca caggtttccg gccagggtga ctctctgcac 7860

gagcacattg ccaatctggc tggttctccg gctattaaaa agggtattct gcagactgtg 7920

aaagtagttg atgagctggt caaagtaatg ggccgtcaca agccggaaaa cattgtgatc 7980

gaaatggcac gtgaaaacca gacgacccag aaaggtcaga aaaactctcg tgaacgcatg 8040

aaacgtatcg aagaaggcat caaagaactg ggctctcaga tcctgaagga acaccctgta 8100

gaaaataccc agctgcagaa cgaaaagctg tatctgtatt acctgcagaa cggccgcgat 8160

atgtatgtgg accaggaact ggatatcaac cgcctgtccg attacgatgt agatcacatc 8220

gtgccgcaaa gcttcctgaa agacgacagc attgacaaca aagtactgac ccgttctgat 8280

aagaaccgtg gcaaatccga taacgtcccg tctgaagaag ttgttaaaaa aatgaaaaac 8340

tattggcgtc agctgctgaa cgcgaaactg atcacccagc gtaagttcga caatctgact 8400

aaagctgagc gcggtggtct gtccgaactg gataaagcgg gttttatcaa acgccagctg 8460

gttgaaaccc gtcagatcac gaagcacgtt gcgcagattc tggactctcg tatgaacacc 8520

aaatacgacg aaaacgacaa actgatccgc gaggttaagg ttatcaccct gaaaagcaaa 8580

ctggtatccg attttcgtaa agactttcag ttctacaaag tgcgcgaaat taacaactat 8640

caccacgctc acgatgcata tctgaatgca gttgttggca cggcgctgat caaaaagtat 8700

ccgaaactgg aatctgaatt cgtatacggc gattacaaag tgtatgacgt tcgtaagatg 8760

atcgcaaaat ccgagcagga aattggtaag gcgacggcga aatacttctt ttattccaat 8820

attatgaact ttttcaaaac cgaaatcacc ctggcgaatg gtgaaattcg taaacgcccg 8880

ctgatcgaaa ccaacggtga aactggtgaa atcgtttggg acaaaggccg cgacttcgcg 8940

accgtgcgta aagttctgtc tatgccgcaa gtgaacatcg tcaagaagac cgaagtacaa 9000

accggcggtt ttagcaaaga gagcattctg ccaaaacgta actccgacaa actgatcgcg 9060

cgcaagaaag actgggatcc gaaaaaatac ggtggtttcg attctccaac cgttgcttat 9120

tccgttctgg tggtagccaa agttgagaaa ggtaaaagca aaaaactgaa atccgtaaag 9180

gaactgctgg gtattactat catggagcgt agctccttcg aaaaaaaccc gatcgatttt 9240

ctggaagcga aaggctataa agaagtcaaa aaggacctga tcatcaaact gccaaaatac 9300

agcctgttcg agctggaaaa cggccgtaaa cgtatgctgg catctgcggg cgaactgcag 9360

aaaggcaacg agctggctct gccgtccaaa tacgtgaact ttctgtacct ggcctctcac 9420

tacgaaaaac tgaaaggttc cccggaagac aacgaacaga aacagctgtt cgtagagcag 9480

cacaaacact acctggacga gatcatcgaa cagatttctg aattttctaa acgtgtgatt 9540

ctggctgatg cgaatctgga taaagttctg tctgcctata acaagcatcg tgacaaaccg 9600

atccgcgaac aggctgagaa catcatccac ctgttcactc tgactaacct gggcgcgcca 9660

gcggctttca agtactttga taccaccatt gaccgcaagc gttacacctc cactaaagaa 9720

gtgctggacg cgactctgat ccaccagtcc atcaccggtc tgtacgagac ccgtatcgat 9780

ctgagccagc tgggcggtga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 9840

aagaaaaagt gacaaagccc gaaaggaagc tgagttggct gctgccaccg ctgagcaata 9900

actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc tgaaaggagg 9960

aactatatcc ggat 9974

<210> 2

<211> 1547

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr

1 5 10 15

Pro Val Thr Lys Ala Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp

20 25 30

Ser Phe Asp Thr Asp Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp

35 40 45

Phe Trp Ala Glu Trp Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu

50 55 60

Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu

65 70 75 80

Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly

85 90 95

Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys

100 105 110

Val Gly Ala Leu Ser Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn

115 120 125

Leu Ala Gly Ser Gly Ser Gly His Met His His His His His His Asp

130 135 140

Asp Asp Asp Lys Met Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly

145 150 155 160

Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr

165 170 175

Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser

180 185 190

Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys

195 200 205

Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala

210 215 220

Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn

225 230 235 240

Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val

245 250 255

Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu

260 265 270

Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu

275 280 285

Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys

290 295 300

Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala

305 310 315 320

Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp

325 330 335

Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val

340 345 350

Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly

355 360 365

Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg

370 375 380

Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu

385 390 395 400

Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys

405 410 415

Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp

420 425 430

Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln

435 440 445

Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu

450 455 460

Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu

465 470 475 480

Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr

485 490 495

Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu

500 505 510

Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly

515 520 525

Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu

530 535 540

Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp

545 550 555 560

Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln

565 570 575

Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe

580 585 590

Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr

595 600 605

Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg

610 615 620

Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn

625 630 635 640

Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu

645 650 655

Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro

660 665 670

Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr

675 680 685

Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser

690 695 700

Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg

705 710 715 720

Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu

725 730 735

Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala

740 745 750

Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp

755 760 765

Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu

770 775 780

Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys

785 790 795 800

Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg

805 810 815

Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly

820 825 830

Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser

835 840 845

Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser

850 855 860

Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly

865 870 875 880

Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile

885 890 895

Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys

900 905 910

Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg

915 920 925

Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met

930 935 940

Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys

945 950 955 960

Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu

965 970 975

Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp

980 985 990

Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser

995 1000 1005

Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp

1010 1015 1020

Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys

1025 1030 1035 1040

Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr

1045 1050 1055

Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser

1060 1065 1070

Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg

1075 1080 1085

Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr

1090 1095 1100

Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr

1105 1110 1115 1120

Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr

1125 1130 1135

Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu

1140 1145 1150

Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu

1155 1160 1165

Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met

1170 1175 1180

Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe

1185 1190 1195 1200

Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1205 1210 1215

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr

1220 1225 1230

Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys

1235 1240 1245

Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln

1250 1255 1260

Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp

1265 1270 1275 1280

Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly

1285 1290 1295

Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1300 1305 1310

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly

1315 1320 1325

Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe

1330 1335 1340

Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys

1345 1350 1355 1360

Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met

1365 1370 1375

Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro

1380 1385 1390

Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu

1395 1400 1405

Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln

1410 1415 1420

His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser

1425 1430 1435 1440

Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1445 1450 1455

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile

1460 1465 1470

Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys

1475 1480 1485

Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu

1490 1495 1500

Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu

1505 1510 1515 1520

Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala

1525 1530 1535

Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1540 1545

<210> 3

<211> 1399

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Met Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala

1 5 10 15

Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly

20 25 30

Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys

35 40 45

Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly

50 55 60

Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys

65 70 75 80

Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr

85 90 95

Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe

100 105 110

Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His

115 120 125

Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His

130 135 140

Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser

145 150 155 160

Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met

165 170 175

Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp

180 185 190

Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn

195 200 205

Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys

210 215 220

Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu

225 230 235 240

Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu

245 250 255

Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp

260 265 270

Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp

275 280 285

Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu

290 295 300

Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile

305 310 315 320

Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met

325 330 335

Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala

340 345 350

Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp

355 360 365

Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln

370 375 380

Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly

385 390 395 400

Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys

405 410 415

Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly

420 425 430

Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu

435 440 445

Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro

450 455 460

Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met

465 470 475 480

Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val

485 490 495

Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn

500 505 510

Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu

515 520 525

Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr

530 535 540

Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys

545 550 555 560

Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val

565 570 575

Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser

580 585 590

Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr

595 600 605

Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn

610 615 620

Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu

625 630 635 640

Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His

645 650 655

Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr

660 665 670

Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys

675 680 685

Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala

690 695 700

Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys

705 710 715 720

Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His

725 730 735

Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile

740 745 750

Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg

755 760 765

His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr

770 775 780

Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu

785 790 795 800

Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val

805 810 815

Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln

820 825 830

Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu

835 840 845

Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp

850 855 860

Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly

865 870 875 880

Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn

885 890 895

Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe

900 905 910

Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys

915 920 925

Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys

930 935 940

His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu

945 950 955 960

Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys

965 970 975

Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu

980 985 990

Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val

995 1000 1005

Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val

1010 1015 1020

Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser

1025 1030 1035 1040

Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn

1045 1050 1055

Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile

1060 1065 1070

Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val

1075 1080 1085

Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1090 1095 1100

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe

1105 1110 1115 1120

Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala

1125 1130 1135

Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro

1140 1145 1150

Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys

1155 1160 1165

Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met

1170 1175 1180

Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys

1185 1190 1195 1200

Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr

1205 1210 1215

Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala

1220 1225 1230

Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1235 1240 1245

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro

1250 1255 1260

Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr

1265 1270 1275 1280

Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile

1285 1290 1295

Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His

1300 1305 1310

Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe

1315 1320 1325

Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1330 1335 1340

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala

1345 1350 1355 1360

Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp

1365 1370 1375

Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala

1380 1385 1390

Gly Gln Ala Lys Lys Lys Lys

1395

<210> 4

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

ataggagagc acagtcagcc tggcggtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 5

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

ataggcttcc agaattggat ctccggtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 6

<211> 102

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 6

ggagagcaca gucagccugg cgguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60

uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102

<210> 7

<211> 102

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 7

ggcuuccaga auuggaucuc cgguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60

uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102

<210> 8

<211> 14138

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ggcgcgccct ctacctgctc tcggacccgt gggggtgggg ggtggaggaa ggagtggggg 60

gtcggtcctg ctggcttgtg ggtgggaggc gcatgttctc caaaaacccg cgcgagctgc 120

aatcctgagg gagctgcagt ggaggaggcg gagagaaggc cgcacccttc tccgcagggg 180

gaggggagtg ccgcaatacc tttatgggag ttctctgctg cctccttttc ctaaggaccg 240

ccctgggcct agaaaaatcc ctccctcccc cgcgatctcg tcatcgcctc catgtcagtt 300

tgctccttct cgattatggg cgggattctt ttgccctggc gcgccccaga cccgggcctg 360

gggggcaagt cggggggcgg ggggaggtcg ggcagggtcc cctgggagga tggggacgtg 420

ctgtgcccct agcggccacc agagggcacc aggacaccac tgcggtcggc tcagcggctc 480

ctgccctggt cagggggcgc caggtcctgc ccctcctggg gagggcgggg ggcgagaagg 540

gcgattttaa ttaacccacg tttcaacatg cacatcccag taatttggaa acattttgtt 600

tccaaagatt cacttaacat tggtttagca acatgaagct ttctatgcaa cccaaggact 660

cagtttttgg cctgttttag tgacaggcaa tcagcaacat gctgcatttc tctccagtgt 720

tgtaatcaaa gaaaccctcc catagcttta aatgatattc cttccccttc caattatgtg 780

gggggaaaac aaccctattc tccacccaga agtgttaact caagaattac attttcaaga 840

agtttccaga ttcgtaaaac cagaattaga tgtctttcac ctaaatgtct cggtgttgac 900

caaaggaaca cacaggtttc tcatttaact tttttaatgg gtctcaaaat tctgtgacaa 960

atttttggtc aagttgtttc cattaaaaag tactgatttt aaaaactaat aacttaaaac 1020

tgccacacgc aaaaaagaaa accaaagtgg tccacaaaac attctccttt ccttctgaag 1080

gttttacgat gcattgttat cattaaccag tcttttacta ctaaacttaa atggccaatt 1140

gaaacaaaca gttctgagac cgttcttcca ccactgatta agagtggggt ggcaggtatt 1200

agggataatg ctagcttact tgtacagctc gtccatgccg agagtgatcc cggcggcggt 1260

cacgaactcc agcaggacca tgtgatcgcg cttctcgttg gggtctttgc tcagggcgga 1320

ctgggtgctc aggtagtggt tgtcgggcag cagcacgggg ccgtcgccga tgggggtgtt 1380

ctgctggtag tggtcggcga gctgcacgct gccgtcctcg atgttgtggc ggatcttgaa 1440

gttcaccttg atgccgttct tctgcttgtc ggccatgata tagacgttgt ggctgttgta 1500

gttgtactcc agcttgtgcc ccaggatgtt gccgtcctcc ttgaagtcga tgcccttcag 1560

ctcgatgcgg ttcaccaggg tgtcgccctc gaacttcacc tcggcgcggg tcttgtagtt 1620

gccgtcgtcc ttgaagaaga tggtgcgctc ctggacgtag ccttcgggca tggcggactt 1680

gaagaagtcg tgctgcttca tgtggtcggg gtagcggctg aagcactgca cgccgtaggt 1740

cagggtggtc acgagggtgg gccagggcac gggcagcttg ccggtggtgc agatgaactt 1800

cagggtcagc ttgccgtagg tggcatcgcc ctcgccctcg ccggacacgc tgaacttgtg 1860

gccgtttacg tcgccgtcca gctcgaccag gatgggcacc accccggtga acagctcctc 1920

gcccttgctc accatggtgg cgtcgaccgt acgtcacgac acctgaaatg gaagaaaaaa 1980

actttgaacc actgtctgag gcttgagaat gaaccaagat ccaaactcaa aaagggcaaa 2040

ttccaaggag aattacatca agtgccaagc tggcctaact tcagtctcca cccactcagt 2100

gtggggaaac tccatcgcat aaaacccctc cccccaacct aaagacgacg tactccaaaa 2160

gctcgagaac taatcgaggt gcctggacgg cgcccggtac tccgtggagt cacatgaagc 2220

gacggctgag gacggaaagg cccttttcct ttgtgtgggt gactcacccg cccgctctcc 2280

cgagcgccgc gtcctccatt ttgagctccc tgcagcaggg ccgggaagcg gccatctttc 2340

cgctcacgca actggtgccg accgggccag ccttgccgcc cagggcgggg cgatacacgg 2400

cggcgcgagg ccaggcacca gagcaggccg gccagcttga gactaccccc gtccgattct 2460

cggtggccgc gctcgcaggc cccgcctcgc cgaacatgtg cgctgggacg cacgggcccc 2520

gtcgccgccc gcggccccaa aaaccgaaat accagtgtgc agatcttggc ccgcatttac 2580

aagactatct tgccagaaaa aaagcgtcgc agcaggtcat caaaaatttt aaatggctag 2640

agacttatcg aaagcagcga gacaggcgcg aaggtgccac cagattcgca cgcggcggcc 2700

ccagcgccca ggccaggcct caactcaagc acgaggcgaa ggggctcctt aagcgcaagg 2760

cctcgaactc tcccacccac ttccaacccg aagctcggga tcaagaatca cgtactgcag 2820

ccagtggaag taattcaagg cacgcaaggg ccataacccg taaagaggcc aggcccgcgg 2880

gaaccacaca cggcacttac ctgtgttctg gcggcaaacc cgttgcgaaa aagaacgttc 2940

acggcgacta ctgcacttat atacggttct cccccaccct cgggaaaaag gcggagccag 3000

tacacgacat cactttccca gtttaccccg cgccaccttc tctaggcacc ggttcaattg 3060

ccgacccctc cccccaactt ctcggggact gtgggcgatg tgcgctctgc ccactgacgg 3120

gcaccggagc cctagattcg attccctttg gggcaaaact caccgcctaa tcccctataa 3180

ctctaccggg gagcccggtg gagagcagac gggctgacgc tgccacctgc cggccatccc 3240

aggataggac cgccgtattc aagtcgccct caggaaggac cctcggggca ccagaggcct 3300

tcgaagcccc aatgagtgag gcaactgagg gtcgcgggtg ccattacaag gcccagccaa 3360

ggcctagagc caaggcttga accgtggggg acccccaagc cccacctgcc caggaacagc 3420

agacactggg acactttgtt tcaggtcctg cccaggcccc tcccactgtg aggctgggat 3480

ttgtcgccca gggtgcagat gagaagagtg gggaaagcag tcctgagcca ggaaattcta 3540

ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag cagccccgct 3600

gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat ccaccggtag 3660

gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc ctcccctagt 3720

caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc 3780

acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc gggtaggcct 3840

ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga ggctgggaag 3900

gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc 3960

ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc 4020

ttcctcatct ccgggccttt cgacctccta gggccaccat ggtgagcaag ggcgaggacg 4080

acaacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag ggctccgtga 4140

acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag ggcacccaga 4200

ccgccaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc 4260

ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact 4320

tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc gaggacggcg 4380

gcgtggtgac cgtgacccag gactcctccc tgcaggacgg cgagttcatc tacaaggtga 4440

agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag accatgggct 4500

gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcaagc 4560

agaggctgaa gctgaaggac ggcggccact acgacgccga ggtcaagacc acctacaagg 4620

ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagctg gacatcacct 4680

cccacaacga ggactacacc atcgtggaac agtacgagcg cgccgagggc cgccactcca 4740

ccggcggcat ggacgagctg tacaagtgag gatccgctga tcagcctcga ctgtgccttc 4800

tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 4860

cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 4920

tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 4980

tagcaggcat gctggggatg cggtgggctc tatggcttct gaggcggaaa gaacccttct 5040

gaggcggaaa gaaccagctg ccttaatata acttcgtata atgtatgcta tacgaagtta 5100

ttaggtctga agaggagttt acgtccagcc aattctgtgg aatgtgtgtc agttagggtg 5160

tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 5220

agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 5280

tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 5340

gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 5400

cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5460

aggcttttgc aaaaagctcc cgggagcttg tatatccatt ttcggcggcc gcgccaccat 5520

gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac gacgtcccca gggccgtacg 5580

caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc cacaccgtcg atccggaccg 5640

ccacatcgag cgggtcaccg agctgcaaga actcttcctc acgcgcgtcg ggctcgacat 5700

cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg gtctggacca cgccggagag 5760

cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc atggccgagt tgagcggttc 5820

ccggctggcc gcgcagcaac agatggaagg cctcctggcg ccgcaccggc ccaaggagcc 5880

cgcgtggttc ctggccaccg tcggagtctc gcccgaccac cagggcaagg gtctgggcag 5940

cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc ggggtgcccg ccttcctgga 6000

gacctccgcg ccccgcaacc tccccttcta cgagcggctc ggcttcaccg tcaccgccga 6060

cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc cgcaagcccg gtgcctgaga 6120

attcgcggga ctctggggtt cgaaatgacc gaccaagcga cgcccaacct gccatcacga 6180

gatttcgatt ccaccgccgc cttctatgaa aggttgggct tcggaatcgt tttccgggac 6240

gccggctgga tgatcctcca gcgcggggat ctcatgctgg agttcttcgc ccaccccaac 6300

ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6360

aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6420

catgtctgta taccgctcga ctagagcttg cggaaccctt aatataactt cgtataatgt 6480

atgctatacg aagttattag gtccgctggc catctacgag ccaaagactt tcaaatcttt 6540

ggctgccttg gccagtagga ggcgacacga aggatttgct gctgccttgg gggatgggaa 6600

ggaacctgaa ggcatttttt ccagagtggt gcagtaccac tgaggactgt tgctgtattg 6660

attaggaaaa gagacagagt aatttgcagt ttgtttgatt tatactgggc tgcaggtcga 6720

gggatcttca taagagaaga gggacagcta tgactgggag tagtcaggag aggaggaaaa 6780

atctggctag taaaacatgt aaggaaaatt ttagggatgt taaagaaaaa aataacacaa 6840

aacaaaatat aaaaaaaatc taacctcaag tcaaggcttt tctatggaat aaggaatgga 6900

cagcaggggg ctgtttcata tactgatgac ctctttatag ccacctttgt tcatggcagc 6960

cagcatatgg catatgttgc caaactctaa accaaatact cattctgatg ttttaaatga 7020

tttgccctcc catatgtcct tccgagtgag agacacaaaa aattccaaca cactattgca 7080

atgaaaataa atttccttta ttagccagaa gtcagatgct caaggggctt catgatgtcc 7140

ccataatttt tggcagaggg aaaaagatct cagtggtatt tgtgagccag ggcattggcc 7200

acaccagcca ccaccttctg ataggcagcc tgcggtacct tacatggtgg cgaattcgtt 7260

tgccaaaatg atgagacagc acaataacca gcacgttgcc caggagctgt aggaaaaaga 7320

agaaggcatg aacatggtta gcagaggctc tagagccgcc ggtcacacgc cagaagccga 7380

accccgccct gccccgtccc ccccgaaggc agccgtcccc ctgcggcagc cccgaggctg 7440

gagatggaga aggggacggc ggcgcggcga cgcacgaagg ccctccccgc ccatttcctt 7500

cctgccggcg ccgcaccgct tcgcccgcgc ccgctagagg gggtgcggcg gcgcctccca 7560

gatttcggct ccgccagatt tgggacaaag gaagtccctg cgccctctcg cacgattacc 7620

ataaaaggca atggctgcgg ctcgccgcgc ctcgacagcc gccggcgctc cggggccgcc 7680

gcgcccctcc cccgagccct ccccggcccg aggcggcccc gccccgcccg gcacccccac 7740

ctgccgccac cccccgcccg gcacggcgag ccccgcgcca cgccccgcac ggagccccgc 7800

acccgaagcc gggccgtgct cagcaactcg gggagggggg tgcagggggg ggttacagcc 7860

cgaccgccgc gcccacaccc cctgctcacc cccccacgca cacaccccgc acgcagcctt 7920

tgttcccctc gcagcccccc cgcaccgcgg ggcaccgccc ccggccgcgc tcccctcgcg 7980

cacacgcgga gcgcacaaag ccccgcgccg cgcccgcagc gctcacagcc gccgggcagc 8040

gcgggccgca cgcggcgctc cccacgcaca cacacacgca cgcacccccc gagccgctcc 8100

cccccgcaca aagggccctc ccggagccct ttaaggcttt cacgcagcca cagaaaagaa 8160

acgagccgtc attaaaccaa gcgctaatta cagcccggag gagaagggcc gtcccgcccg 8220

ctcacctgtg ggagtaacgc ggtcagtcag agccggggcg ggcggcgcga ggcggcgcgg 8280

agcggggcac ggggcgaagg caacgcagcg actcccgccc gccgcgcgct tcgcttttta 8340

tagggccgcc gccgccgccg cctcgccata aaaggaaact ttcggagcgc gccgctctga 8400

ttggctgccg ccgcacctct ccgcctcgcc ccgccccgcc cctcgccccg ccccgccccg 8460

cctggcgcgc gccccccccc cccccgcccc catcgctgca caaaataatt aaaaaataaa 8520

taaatacaaa attgggggtg gggagggggg ggagatgggg agagtgaagc agaacgtggg 8580

gctcacctcg acccatggta atagcgatga ctaatacgta gatgtactgc caagtaggaa 8640

agtcccataa ggtcatgtac tgggcataat gccaggcggg ccatttaccg tcattgacgt 8700

caataggggg cgtacttggc atatgataca cttgatgtac tgccaagtgg gcagtttacc 8760

gtaaatagtc cacccattga cgtcaatgga aagtccctat tggcgttact atgggaacat 8820

acgtcattat tgacgtcaat gggcgggggt cgttgggcgg tcagccaggc gggccattta 8880

ccgtaagtta tgtaacgcgg aactccatat atgggctatg aactaatgac cccgtaattg 8940

attactatta ataactagtc aataatcaat gtcgtaaatg tcgtaaatgt ctcagctagt 9000

caggtagtaa aaggtgtcaa ctaggcagtg gcagagcagg attcaaattc agggctgttg 9060

tgatgcctcc gcagactctg agcgccacct ggtggtaatt tgtctgtgcc tcttctgacg 9120

tggaagaaca gcaactaaca cactaacacg gcatttacta tgggccagcc attgtacgcg 9180

ttgcttaacc tgattcttgg gcgttgtcct gcaggggatt gagcaggtgt acgaggacga 9240

gcccaatttc tctatattcc cacagtcttg agtttgtgtc acaaaataat tatagtgggg 9300

tggagatggg aaatgagtcc aggcaacacc taagcctgat tttatgcatt gagactgcgt 9360

gttattacta aagatctttg tgtcgcaatt tcctgatgaa gggagatagg ttaaaaagca 9420

cggatctact gagttttaca gtcatcccat ttgtagactt ttgctacacc accaaagtat 9480

agcatctgag attaaatatt aatctccaaa ccttaggccc cctcacttgc atccttacgg 9540

tcagataact ctcactcata ctttaagccc attttgtttg ttgtacttgc tcatccagtc 9600

ccagacatag cattggcttt ctcctcacct gttttaggta gccagcaagt catgaaatca 9660

gataagttcc accaccaatt aacactaccc atcttgagca taggcccaac agtgcattta 9720

ttcctcattt actgatgttc gtgaatattt accttgattt tcattttttt ctttttctta 9780

agctgggatt ttactcctga ccctattcac agtcagatga tcttgactac cactgcgatt 9840

ggacctgagg ttcagcaata ctccccttta tgtcttttga atacttttca ataaatctgt 9900

ttgtattttc attagttagt aactgagctc agttgccgta atgctaatag cttccaaact 9960

agtgtctctg tctccagtat ctgataaatc ttaggtgttg ctgggacagt tgtcctaaaa 10020

ttaagataaa gcatgaaaat aactgacaca actccattac tggctcctaa ctacttaaac 10080

aatgcattct atcatcacaa atgtgaaaaa ggagttccct cagtggacta accttatctt 10140

ttctcaacac ctttttcttt gcacaatttt ccacacatgc ctacaaaaag tacttatgcg 10200

gccgccataa aagttttgtt actttataga agaaattttg agtttttgtt ttttttaata 10260

aataaataaa cataaataaa ttgtttgttg aatttattat tagtatgtaa gtgtaaatat 10320

aataaaactt aatatctatt caaattaata aataaacctc gatatacaga ccgataaaac 10380

acatgcgtca attttacaca tgattatctt taacgtacgt cacaatatga ttatctttct 10440

agggttaatc tagctgcgtg ttctgcagcg tgtcgagcat cttcatctgc tccatcacgc 10500

tgtaaaacac atttgcaccg cgagtctgcc cgtcctccac gggttcaaaa acgtgaatga 10560

acgaggcgcg ctcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta 10620

cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg 10680

cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg gacgcgccct 10740

gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 10800

ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 10860

gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 10920

ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 10980

gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 11040

tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 11100

tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 11160

ttaacaaaat attaacgctt acaatttagg tggcactttt cggggaaatg tgcgcggaac 11220

ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 11280

ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 11340

cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 11400

ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 11460

tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 11520

cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 11580

actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 11640

aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 11700

tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 11760

ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 11820

tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 11880

gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 11940

gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 12000

tattgctgat aaatctggag ccggtgagcg tggttcacgc ggtatcattg cagcactggg 12060

gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 12120

ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 12180

gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 12240

aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 12300

ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 12360

ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 12420

tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 12480

gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 12540

agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 12600

taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 12660

gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 12720

gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 12780

caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 12840

aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 12900

tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 12960

acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 13020

ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 13080

gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 13140

tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 13200

agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg caccccaggc 13260

tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca 13320

cacaggaaac agctatgacc atgattacgc caagcgcgcc cgccgggtaa ctcacggggt 13380

atccatgtcc atttctgcgg catccagcca ggatacccgt cctcgctgac gtaatatccc 13440

agcgccgcac cgctgtcatt aatctgcaca ccggcacggc agttccggct gtcgccggta 13500

ttgttcgggt tgctgatgcg cttcgggctg accatccgga actgtgtccg gaaaagccgc 13560

gacgaactgg tatcccaggt ggcctgaacg aacagttcac cgttaaaggc gtgcatggcc 13620

acaccttccc gaatcatcat ggtaaacgtg cgttttcgct caacgtcaat gcagcagcag 13680

tcatcctcgg caaactcttt ccatgccgct tcaacctcgc gggaaaaggc acgggcttct 13740

tcctccccga tgcccagata gcgccagctt gggcgatgac tgagccggaa aaaagacccg 13800

acgatatgat cctgatgcag ctagattaac cctagaaaga tagtctgcgt aaaattgacg 13860

catgcattct tgaaatattg ctctctcttt ctaaatagcg cgaatccgtc gctgtgcatt 13920

taggacatct cagtcgccgc ttggagctcc cgtgaggcgt gcttgtcaat gcggtaagtg 13980

tcactgattt tgaactataa cgaccgcgtg agtcaaaatg acgcatgatt atcttttacg 14040

tgacttttaa gatttaactc atacgataat tatattgtta tttcatgttc tacttacgtg 14100

ataacttatt atatatatat tttcttgtta tagatatc 14138

<210> 9

<211> 1069

<212> DNA

<213> Sus scrofa

<400> 9

gtgctgagtc cttttcccat cccacccacc tggagctccc ctcttccagt cctgagccac 60

ttgaactggc ctggtttttg ccatcctgcg ctgccctctc tccggactcg agccactgct 120

gagggcctca ggccagtcca tcctcgtctt gtctctttcg ccctgctctt tccccacctt 180

gagcgctctt aaccagcctg gcccgtgcca cctctactct gccatcgaat gctgccccac 240

tttctcgagt ccgccacttc tcccagcttc accggtaccc actgtttccc ctagtccagg 300

caggtaccac tttccctgag cgtcctcctc ctctctcctg ggcctgtgct gcttcttttc 360

ccgctctctg gcctgggccg tttcttcggc cagcccccga gccttccatg ccctttcctt 420

caggtttctg ctcttcatcc ttggtctctg ccatctgttg ccatgtaagg gtgctctttc 480

ctgagccatc gccctcaagg cgctctgctc ctcaagtgga tgcttccctc gcctggctca 540

cctcctgctc tctctcctgc ccccttcacc tgcgtgccct cctcattctc cctctgtgcc 600

acctctggcc ttgcactgta ggctctctct tggggatgtt tctccttctc cacacacttc 660

tctttcactc tgtcctcttg ctttgtgtgg gcctgcagcg ttaccctttt ttctgggcac 720

actcagagca ccctcctctt tctggttctg ggccacctgt ctgtcctcgg gtcatcttgc 780

tctctctgcc tggatgccct cctgtggctt tgggcagctt ctccctcctt cagagtgcac 840

cgccagttct cctaggcccg gtcacttccc cttcccaggg gacctagagc cctgctaggt 900

cctctctctc cacaacctgg gcccccaaac ctttccaaaa caccttgctt tctgcctcca 960

ttggtcttgt gttccagagc cagagtcact atatgtccca gaaccaggat tccctctggt 1020

tctgagggct tttatcgcat cccctgcctg gctgcagtgg gtctttggg 1069

<210> 10

<211> 260

<212> DNA

<213> Sus scrofa

<400> 10

gacaggccac agaagagcct ctactcctcc ctctgtcccc gaggctgtct ccctcccagt 60

cttcccagct caggccagtc cccaggcctc tcttccctgc cagagcccgt caggttcggt 120

tactttgggg cccagagagg accctgtgaa ggaagcgtgg gtaggggcac gggaatgggg 180

aggatgcctg aagaggcccc cttagccaga agaggagcag aagaggagca ggtacccaga 240

agaggagcag ttcagggaaa 260

<210> 11

<211> 540

<212> DNA

<213> Sus scrofa

<400> 11

aaatacccac gtttattggg acaaaagttg ttagggaaaa tggggcctca gagttatgat 60

tcaagtcata attctttcca tttataattt cactcgagac tctgttaact gattccttgt 120

gtgttgtatc ttactcctca gctcacaatt acttttagtt attcacctta actgtatgaa 180

taacagtgga gaaaaggatt ctaccagaat actctaatta tggttttgag tcccctttcc 240

agactgaaga tttttcagtc tttttgatct gaggtgattt ttcagtcttt tcgatctgag 300

gtgacagtct caagctcctc aattcaccca gtctcttgat acttgtccat ttagggccac 360

caaagctact ttgacttcat actagagagt caattaatga ggccattctc tgatggacag 420

gtgaagcagg caaggtgact atattttgac taaacggtag aaaacagcct gagtgttaac 480

agtgtagcct ataaaaccca gagctgccca ccctgatcta aacttccagg aacataagaa 540

<210> 12

<211> 1009

<212> DNA

<213> Sus scrofa

<400> 12

agtaggtcac atttcagtaa aacctggctt tgtggattga gcatggtctg tctcttcctg 60

gtacttcatt agtcccctaa gtgggatttg ctgagcaaga ctcctcaatt acagaaatac 120

tccagtttag aattctcgca aaggcttttt gtttccacaa gtagaatcta gaaagcaatc 180

tcaagtaaca acagcagaga cctgaatccc aatccatctt tcctgtgtgt cctcttttac 240

ctccttccct ttcatgttga accaacagtc ctttttcagt ctagaagcta gtacgaaaga 300

aatgtacaga tgtaggtacc aagcaaagcc attagccaat aactggtgag atggagctaa 360

gaggaaataa aagtgttcct aagaatagca cagcagaagc tagatccaca gatcttaaaa 420

caattttggt tgagtaagag tagaggcaaa agaggaagct aataatgcag tttttaggag 480

ctaagagcca gataaagggt aagggcagga ggaagtgcta tctcagctaa cgagatacat 540

gaaacaacgg tggaagtcca gcaggcacaa gatgagttga gaagcaatca gggccagaag 600

gatgtgcaag gcctcaaaat aaaaaagcac agggccacag ggaaccttat ggaaattaaa 660

aggaagagga tgcagtcagg agaggaaaaa atagtgctcc ctcccccatg cccaaggaag 720

cagctgagca gccagtactt gggaagttag tagtaataag ttggtaagag ggagttctgt 780

tcgtggctca atggttaaca aatcagacta gaaaccgtga ggttgcgggt ttgatccctg 840

gccttgctca gtgggttaag gatccggcat tgccgtgacc tgtggtgtag gtcacagacg 900

tggctcagtt cccgcattcc tgtggctctg gtgtaggctg gtggctacag ctctgattag 960

acccctaggc tgggaacctc catatgccct ggaagtggcc gtagaaaag 1009

<210> 13

<211> 872

<212> DNA

<213> Sus scrofa

<400> 13

ggatggggac tcatgtgaat tttctaaagg tgctatttaa acggggggca cgagtgccgg 60

ctttggacag ggccgctcgc tctccaccct ttcttcttcc ccctcggccg cctctcaccc 120

cctgaggcct ctctcccccc acgacctcct ctctctcctc tgaaaccctc tcctcctcag 180

ctgcatccca ccctcgtggc ctctctctct ctctgtctgt cctgtgtcct ctctcactgg 240

gtttcagagc acagatgccc aaagcacaaa agcagttttc ccctggggtg ggaggaagca 300

agagactttg tacctatttt gtatgtgtat aataatttga gatgttttta attattttga 360

ttgctggaat aaagcatgtg gaaatgaccc aaaccaatct tgcactggcc tcctgatttc 420

cttccttgga gacggaggga gggggagacc tgggggaggg cgcttggggg ggggtgggct 480

ctcttctttc tgcgctcccc ccccccacct ccaacacctt gacgacccct cctgcttccg 540

cttgcctttc tcaggcttta acactttctc ctcgccctct cagcatgcgc atgcgcgtgc 600

ctctacctcc cccgcacatc ctggcctgcc caccctgaat ggcctggccc agcgatgcca 660

ccaactctct cgctccgtcc acggctgggg aggggggcac tctgcagggt tggggggcac 720

tgggaggctg ggttgggtga gggaggggtg cctgggcccc caccccccag caagttctct 780

ccctaggcga actggagggt cgtctggcct cttgagcctt gttgctggct ctgagctcta 840

ccaagagagt gaccagcagg accgcaccat ca 872

<210> 14

<211> 727

<212> DNA

<213> Sus scrofa

<400> 14

gtggttgctg agactgcgtg ggggcccaag gagacctgga gaaaggaatg cttcctgctc 60

cttcttctgg ggccccagga gagccttccc agggccttgg agaggtgctg tccagggact 120

aaccctgtgc tctaggaagg ctgcaggccc tgaccagctg ggcaggtcct gggtccctcc 180

tggccttcta agttccccaa acatgagacc tctgggtgtg gggtggcctg gggaggtcat 240

tttgcccagg ccctacctcc tgcccattcc taaccctttt taaaaatctg tgcgtcctct 300

tcttccttct tctccctccc ttcccttttc gctcaccctc tgctgctggc ctgagagccg 360

gaggccccca gggggaaggc gactggtctc ctccccagtc tcagggaagg gagacagaga 420

atccaggaag ccagaactca gcagacgaag cacccaggga cctagagatg ggttgaaaag 480

ttgacagctg tcccacctgc ctcccaaggt ctcagggcct aaacctccaa ggcaggaaag 540

gcccctgtcc ctccctgggg tccatagaaa gagggacaag tctgcacgga ccatttgctg 600

taatattaac accttggctg tcattaggta gtcttggctg ttaattatgt cctgtgataa 660

tgtattatta gcacgccgac cacatagggt agggaactgc agctagtaaa caaaagtttg 720

ttcctat 727

<210> 15

<211> 100

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 15

gaaggagcaa acugacaugg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 16

<211> 100

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 16

ugcagugggu cuuuggggac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 17

<211> 100

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 17

uuccaggaac auaagaaagu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 18

<211> 100

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 18

gcagucucag caaccacuga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 19

<211> 254

<212> PRT

<213> Homo sapiens

<400> 19

Met Gln Val Gln Cys Gln Gln Ser Pro Val Leu Ala Gly Ser Ala Thr

1 5 10 15

Leu Val Ala Leu Gly Ala Leu Ala Leu Tyr Val Ala Lys Pro Ser Gly

20 25 30

Tyr Gly Lys His Thr Glu Ser Leu Lys Pro Ala Ala Thr Arg Leu Pro

35 40 45

Ala Arg Ala Ala Trp Phe Leu Gln Glu Leu Pro Ser Phe Ala Val Pro

50 55 60

Ala Gly Ile Leu Ala Arg Gln Pro Leu Ser Leu Phe Gly Pro Pro Gly

65 70 75 80

Thr Val Leu Leu Gly Leu Phe Cys Leu His Tyr Phe His Arg Thr Phe

85 90 95

Val Tyr Ser Leu Leu Asn Arg Gly Arg Pro Tyr Pro Ala Ile Leu Ile

100 105 110

Leu Arg Gly Thr Ala Phe Cys Thr Gly Asn Gly Val Leu Gln Gly Tyr

115 120 125

Tyr Leu Ile Tyr Cys Ala Glu Tyr Pro Asp Gly Trp Tyr Thr Asp Ile

130 135 140

Arg Phe Ser Leu Gly Val Phe Leu Phe Ile Leu Gly Met Gly Ile Asn

145 150 155 160

Ile His Ser Asp Tyr Ile Leu Arg Gln Leu Arg Lys Pro Gly Glu Ile

165 170 175

Ser Tyr Arg Ile Pro Gln Gly Gly Leu Phe Thr Tyr Val Ser Gly Ala

180 185 190

Asn Phe Leu Gly Glu Ile Ile Glu Trp Ile Gly Tyr Ala Leu Ala Thr

195 200 205

Trp Ser Leu Pro Ala Leu Ala Phe Ala Phe Phe Ser Leu Cys Phe Leu

210 215 220

Gly Leu Arg Ala Phe His His His Arg Phe Tyr Leu Lys Met Phe Glu

225 230 235 240

Asp Tyr Pro Lys Ser Arg Lys Ala Leu Ile Pro Phe Ile Phe

245 250

<210> 20

<211> 10229

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

ggcgcgccgg atggggactc atgtgaattt tctaaaggtg ctatttaaac ggggggcacg 60

agtgccggct ttggacaggg ccgctcgctc tccacccttt cttcttcccc ctcggccgcc 120

tctcaccccc tgaggcctct ctccccccac gacctcctct ctctcctctg aaaccctctc 180

ctcctcagct gcatcccacc ctcgtggcct ctctctctct ctgtctgtcc tgtgtcctct 240

ctcactgggt ttcagagcac agatgcccaa agcacaaaag cagttttccc ctggggtggg 300

aggaagcaag agactttgta cctattttgt atgtgtataa taatttgaga tgtttttaat 360

tattttgatt gctggaataa agcatgtgga aatgacccaa accaatcttg cactggcctc 420

ctgatttcct tccttggaga cggagggagg gggagacctg ggggagggcg cttggggggg 480

ggtgggctct cttctttctg cgctcccccc ccccacctcc aacaccttga cgacccctcc 540

tgcttccgct tgcctttctc aggctttaac actttctcct cgccctctca gcatgcgcat 600

gcgcgtgcct ctacctcccc cgcacatcct ggcctgccca ccctgaatgg cctggcccag 660

cgatgccacc aactctctcg ctccgtccac ggctggggag gggggcactc tgcagggttg 720

gggggcactg ggaggctggg ttgggtgagg gaggggtgcc tgggccccca ccccccagca 780

agttctctcc ctaggcgaac tggagggtcg tctggcctct tgagccttgt tgctggctct 840

gagctctacc aagagagtga ccagcaggac cgcaccatca cgcgccccag acccgggcct 900

ggggggcaag tcggggggcg gggggaggtc gggcagggtc ccctgggagg atggggacgt 960

gctgtgcccc tagcggccac cagagggcac caggacacca ctgcggtcgg ctcagcggct 1020

cctgccctgg tcagggggcg ccaggtcctg cccctcctgg ggagggcggg gggcgagaag 1080

ggcgattagc ctggtaggct gcagttcatg gggtcactaa gagtcgggca tgactgagcg 1140

acttcacttt catgtatcac tttcatgcat tggagaagga aatggcaacg cactccagtg 1200

ttcttgcctg gagaatccca gggctggggg agcctggtgc actgccatct ctggggtcgc 1260

acagagtcgg acatgactga agagacttag cagcagcagt agcagcatgt tgataaggga 1320

cttggtttag cacattaata aacataaata tgttagtata ttggatattt tcttagaata 1380

taaatctaac actaatgaac agactagttt gtataactgt atattcaatt tagaaaaaca 1440

agtggagaaa tcagatttca agaaataact cctttttgca gtccttcaat agaaattgag 1500

cataaatgtg aattagtcat tggcatagac agaaaaatat aatgcatttt gctcagactt 1560

ggtttactgg aaactttaac tggttggatt atgatcaaca tcatgggaat aaaagataca 1620

ttgtagtttc aatataggaa agaaactgaa tcactgaaga agataatttg gatcaagaag 1680

ataagaatct ttgagtaaaa aggagttgtt agtcttaaga aaaaaatttt aacgtttggt 1740

gaaacaaact gaggtcaaga gcaaataaga ttaagaccaa caaatatatt tctcactata 1800

ctgaaggtgc taggtggtta aaataaaatg tgtgatctgg gacaggactg tgtaggtgtg 1860

agtctgcatc tcctctcatt caattcctta actggataag aggaatctaa actgagatgt 1920

caacacagca agcctgctga atttctctga ggtttcatct ttggttgtga acaacaagct 1980

aattagtcca gtcataaagt tagccaatgg catgaaggtg tggtgggtca cacccacact 2040

gagagcatac aaaaggccct ctgcagggag aaatgtccac actcaagtga cacttctact 2100

ctcattctct acccgagaac aacctcaaca agcaacacca tgcaggttca gtgccagcag 2160

agcccagtgc tggcaggcag cgccactttg gtcgcccttg gggcactggc cttgtacgtc 2220

gcgaagccct ccggctacgg gaagcacacg gagagcctga agccggcggc tacccgcctg 2280

ccagcccgcg ccgcctggtt cctgcaggag ctgccttcct tcgcggtgcc cgcggggatc 2340

ctcgcccggc agcccctctc cctcttcggg ccacctggga cggtacttct gggcctcttc 2400

tgcctacatt acttccacag gacatttgtg tactcactgc tcaatcgagg gaggccttat 2460

ccagctatac tcattctcag aggcactgcc ttctgcactg gaaatggagt ccttcaaggc 2520

tactatctga tttactgtgc tgaataccct gatgggtggt acacagacat acggtttagc 2580

ttgggtgtct tcttatttat tttgggaatg ggaataaaca ttcatagtga ctatatattg 2640

cgccagctca ggaagcctgg agaaatcagc tacaggattc cacaaggtgg cttgtttacg 2700

tatgtttctg gagccaattt cctcggtgag atcattgaat ggatcggcta tgccctggcc 2760

acttggtccc tcccagcact tgcatttgca tttttctcac tttgtttcct tgggctgcga 2820

gcttttcacc accataggtt ctacctcaag atgtttgagg actaccccaa atctcggaaa 2880

gcccttattc cattcatctt ttaaattatc cctaatacct gccaccccac tcttaatcag 2940

tggtggaaga acggtctcag aactgtttgt ttcaattggc catttaagtt tagtagtaaa 3000

agactggtta atgataacaa tgcatcgtaa aaccttcaga aggaaaggag aatgttttgt 3060

ggaccacttt ggttttcttt tttgcgtgtg gcagttttaa gttattagtt tttaaaatca 3120

gtacttttta atggaaacaa cttgaccaaa aatttgtcac agaattttga gacccattaa 3180

aaaagttaaa tgagaaacct gtgtgttcct ttggtcaaca ccgagacatt taggtgaaag 3240

acatctaatt ccggttttac gaatctggaa acttcttgaa aatgtaattc ttgagttaac 3300

acttctgggt ggagaatagg gttgttttcc ccccacataa ttggaagggg aaggaatatc 3360

atttaaagct atgggagggt ttctttgatt acaacactgg agagaaatgc agcatgttgc 3420

tgattgcctg tcactaaaac aggccaaaaa ctgagtcctt gggttgcata gaaagctgtt 3480

tccgatcata ttcaataacc cttaatataa cttcgtataa tgtatgctat acgaagttat 3540

taggtctgaa gaggagttta cgtccagcca agctagcttg gctgcaggtc gtcgaaattc 3600

taccgggtag gggaggcgct tttcccaagg cagtctggag catgcgcttt agcagccccg 3660

ctgggcactt ggcgctacac aagtggcctc tggcctcgca cacattccac atccaccggt 3720

aggcgccaac cggctccgtt ctttggtggc cccttcgcgc caccttctac tcctccccta 3780

gtcaggaagt tcccccccgc cccgcagctc gcgtcgtgca ggacgtgaca aatggaagta 3840

gcacgtctca ctagtctcgt gcagatggac agcaccgctg agcaatggaa gcgggtaggc 3900

ctttggggca gcggccaata gcagctttgc tccttcgctt tctgggctca gaggctggga 3960

aggggtgggt ccgggggcgg gctcaggggc gggctcaggg gcggggcggg cgcccgaagg 4020

tcctccggag gcccggcatt ctgcacgctt caaaagcgca cgtctgccgc gctgttctcc 4080

tcttcctcat ctccgggcct ttcgacctgc agcctgttga caattaatca tcggcatagt 4140

atatcggcat agtataatac gacaaggtga ggaactaaac catgggatcg gccattgaac 4200

aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact 4260

gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc 4320

gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg 4380

cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg 4440

tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt 4500

catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc 4560

atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag 4620

cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg 4680

ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgatgatc 4740

tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt 4800

ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg 4860

ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt 4920

acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct 4980

tctgagggga tcaattctct agagctcgct gatcagcctc gactgtgcct tctagttgcc 5040

agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 5100

ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 5160

ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 5220

atgctgggga tgcggtgggc tctatggctt ctgaggcgga aagaaccagc tggggctcga 5280

ctagagcttg cggaaccctt aatataactt cgtataatgt atgctatacg aagttattag 5340

gtccctcgag gggatccctc tctccggtct gcaggcattg gcgggtacat gcggatcata 5400

accaccagat ggcgctgttg gcctaagctc gagcacagtc cacagcctgg aggtcctggg 5460

aaagcctgac ctgaatctaa aacttctcta aactccctaa tttgattcaa aagcaaaaca 5520

gtagaatact tctgcacatc ccagcgaggt cagagtatag tggttgctga gactgcgtgg 5580

gggcccaagg agacctggag aaaggaatgc ttcctgctcc ttcttctggg gccccaggag 5640

agccttccca gggccttgga gaggtgctgt ccagggacta accctgtgct ctaggaaggc 5700

tgcaggccct gaccagctgg gcaggtcctg ggtccctcct ggccttctaa gttccccaaa 5760

catgagacct ctgggtgtgg ggtggcctgg ggaggtcatt ttgcccaggc cctacctcct 5820

gcccattcct aacccttttt aaaaatctgt gcgtcctctt cttccttctt ctccctccct 5880

tcccttttcg ctcaccctct gctgctggcc tgagagccgg aggcccccag ggggaaggcg 5940

actggtctcc tccccagtct cagggaaggg agacagagaa tccaggaagc cagaactcag 6000

cagacgaagc acccagggac ctagagatgg gttgaaaagt tgacagctgt cccacctgcc 6060

tcccaaggtc tcagggccta aacctccaag gcaggaaagg cccctgtccc tccctggggt 6120

ccatagaaag agggacaagt ctgcacggac catttgctgt aatattaaca ccttggctgt 6180

cattaggtag tcttggctgt taattatgtc ctgtgataat gtattattag cacgccgacc 6240

acatagggta gggaactgca gctagtaaac aaaagtttgt tcctatatgc ggccgccata 6300

aaagttttgt tactttatag aagaaatttt gagtttttgt tttttttaat aaataaataa 6360

acataaataa attgtttgtt gaatttatta ttagtatgta agtgtaaata taataaaact 6420

taatatctat tcaaattaat aaataaacct cgatatacag accgataaaa cacatgcgtc 6480

aattttacac atgattatct ttaacgtacg tcacaatatg attatctttc tagggttaat 6540

ctagctgcgt gttctgcagc gtgtcgagca tcttcatctg ctccatcacg ctgtaaaaca 6600

catttgcacc gcgagtctgc ccgtcctcca cgggttcaaa aacgtgaatg aacgaggcgc 6660

gctcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 6720

atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 6780

atcgcccttc ccaacagttg cgcagcctga atggcgaatg ggacgcgccc tgtagcggcg 6840

cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 6900

tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 6960

gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 7020

accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 7080

tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 7140

gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 7200

cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 7260

tattaacgct tacaatttag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 7320

tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 7380

gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 7440

tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 7500

aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 7560

cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 7620

agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 7680

ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 7740

tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 7800

tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 7860

caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 7920

accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 7980

attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 8040

ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 8100

taaatctgga gccggtgagc gtggttcacg cggtatcatt gcagcactgg ggccagatgg 8160

taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 8220

aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 8280

agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 8340

ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 8400

ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 8460

cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 8520

tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 8580

tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 8640

tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 8700

tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 8760

ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 8820

acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 8880

ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 8940

gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 9000

ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 9060

ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 9120

taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 9180

cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 9240

gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag 9300

tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt 9360

tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 9420

cagctatgac catgattacg ccaagcgcgc ccgccgggta actcacgggg tatccatgtc 9480

catttctgcg gcatccagcc aggatacccg tcctcgctga cgtaatatcc cagcgccgca 9540

ccgctgtcat taatctgcac accggcacgg cagttccggc tgtcgccggt attgttcggg 9600

ttgctgatgc gcttcgggct gaccatccgg aactgtgtcc ggaaaagccg cgacgaactg 9660

gtatcccagg tggcctgaac gaacagttca ccgttaaagg cgtgcatggc cacaccttcc 9720

cgaatcatca tggtaaacgt gcgttttcgc tcaacgtcaa tgcagcagca gtcatcctcg 9780

gcaaactctt tccatgccgc ttcaacctcg cgggaaaagg cacgggcttc ttcctccccg 9840

atgcccagat agcgccagct tgggcgatga ctgagccgga aaaaagaccc gacgatatga 9900

tcctgatgca gctagattaa ccctagaaag atagtctgcg taaaattgac gcatgcattc 9960

ttgaaatatt gctctctctt tctaaatagc gcgaatccgt cgctgtgcat ttaggacatc 10020

tcagtcgccg cttggagctc ccgtgaggcg tgcttgtcaa tgcggtaagt gtcactgatt 10080

ttgaactata acgaccgcgt gagtcaaaat gacgcatgat tatcttttac gtgactttta 10140

agatttaact catacgataa ttatattgtt atttcatgtt ctacttacgt gataacttat 10200

tatatatata ttttcttgtt atagatatc 10229

<210> 21

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

ataggctacc aagagagtga ccagcgtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 22

<211> 225

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

ggcttgtcgg actcttcgct attacgccag ctggcgaagg gggatgtgct gcaaggcgat 60

taagttgggt aacgccaggg ttttcccagt cacgacgtta ggaaattaat acgactcact 120

atagggcagt ctcagcaacc actgagtttt agagctagaa atagcaagtt aaaataaggc 180

tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttt 225

<210> 23

<211> 102

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 23

ggcuaccaag agagugacca gcguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60

uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102

<210> 24

<211> 102

<212> RNA

<213> 人工序列(Artificial Sequence)

<400> 24

gggcagucuc agcaaccacu gaguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60

uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102

<210> 25

<211> 1089

<212> DNA

<213> Sus scrofa

<400> 25

actttgtacc tattttgtat gtgtataata atttgagatg tttttaatta ttttgattgc 60

tggaataaag catgtggaaa tgacccaaac caatcttgca ctggcctcct gatttccttc 120

cttggagacg gagggagggg gagacctggg ggagggcgct tggggggggg tgggctctct 180

tctttctgcg ctcccccccc ccacctccaa caccttgacg acccctcctg cttccgcttg 240

cctttctcag gctttaacac tttctcctcg ccctctcagc atgcgcatgc gcgtgcctct 300

acctcccccg cacatcctgg cctgcccacc ctgaatgtcc tggcccagcg atgccaccaa 360

ctctctcgct ccgtccacgg ctggggaggg gggcactctg cagggttggg gggcactggg 420

aggctgggtt gggtgaggga ggggtgcctg ggcccccacc ccccagcaag ttctctccct 480

aggcgaactg gagggtcgtc tggcctcttg agccttgttg ctggctctga gctctaccaa 540

gagagtgacc agcaggaccg caccatcagt ggttgctgag actgcgtggg ggcccaagga 600

gacctggaga aaggaatgct tcctgctcct tcttctgggg ccccaggaga gccttcccag 660

ggccttggag agttgctgtc cagggactaa ccctgtgctc taggaaggct gcaggccctg 720

accagctggg caggtcctgg gtccctcctg gccttctaag ttccccaaac atgagacctc 780

tgggtgtggg gtggcctggg gaggtcattt tgcccaggcc ctacctcctg cccattccta 840

acccttttta aaaatctgtg cgtcctcttc ttccttcttc tccctccctt cccttttcgc 900

tcaccctctg ctgctggcct gagagccgga ggcccccagg gggaaggcga ctggtctcct 960

ccccagtctc agggaaggga gacagagaat ccaggaagcc agaactcagc agacgaagca 1020

cccagggacc tagagatggg ttgaaaagtt gacagctgtc ccacctgcct cccaaggtct 1080

cagggccta 1089

Claims

1.一种制备重组猪细胞的方法，包括如下步骤：将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA，得到重组猪细胞；所述DNA分子甲中具有KAP6.1启动子和人II型5α-还原酶基因，且由KAP6.1启动子驱动人II型5α-还原酶基因的表达。

2.如权利要求1所述的方法，其特征在于：所述DNA分子甲整合至猪细胞的基因组DNA的COL1A1基因中。

3.如权利要求1或2所述的方法，其特征在于：所述“将命名为DNA分子甲的DNA分子整合至猪细胞的基因组DNA”的实现方式为：将命名为DNA分子乙的DNA分子导入猪细胞或者将具有所述DNA分子乙的重组质粒导入猪细胞；所述DNA分子乙中，具有所述DNA分子甲且在所述DNA分子甲的上游具有上游同源臂且在所述DNA分子甲的下游具有下游同源臂，所述上游同源臂和所述下游同源臂用于将所述DNA分子甲整合至猪细胞的基因组DNA。

4.如权利要求3所述的方法，其特征在于：所述方法中，具有所述DNA分子乙的重组质粒与两种gRNA以及NCN蛋白共同导入猪细胞；

第一种gRNA的靶序列结合区如SEQ ID NO：23中第3-22位核苷酸所示；

第二种gRNA的靶序列结合区如SEQ ID NO：24中第3-22位核苷酸所示；

所述NCN蛋白为Cas9蛋白或具有Cas9蛋白的融合蛋白。

5.一种试剂盒，包括权利要求3中所述的DNA分子乙；所述试剂盒的用途为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

6.一种试剂盒，包括具有权利要求3中所述的DNA分子乙的重组质粒；所述试剂盒的用途为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

7.如权利要求5或6所述的试剂盒，其特征在于：所述试剂盒还包括两种gRNA以及NCN蛋白；所述两种gRNA为权利要求4中所述的两种gRNA；所述NCN蛋白为权利要求4中所述的NCN蛋白。

8.权利要求3中所述的DNA分子乙在制备试剂盒中的应用；所述试剂盒的用途为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

9.具有权利要求3中所述的DNA分子乙的重组质粒在制备试剂盒中的应用；所述试剂盒的用途为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

10.具有权利要求3中所述的DNA分子乙的重组质粒、两种gRNA以及NCN蛋白在制备试剂盒中的应用；所述两种gRNA为权利要求4中所述的两种gRNA；所述NCN蛋白为权利要求4中所述的NCN蛋白；所述试剂盒的用途为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

11.权利要求3中所述的DNA分子乙、具有权利要求3中所述的DNA分子乙的重组质粒、权利要求5所述的试剂盒、权利要求6所述的试剂盒或权利要求7所述的试剂盒的应用，为如下(a)或(b)：(a)制备毛囊组织特异表达人II型5α-还原酶基因的重组猪细胞；(b)制备脱发模型猪。

12.权利要求1至4中任一所述方法制备得到的重组猪细胞。

13.权利要求12所述重组猪细胞在制备脱发模型猪中的应用。