发明概述
为了解决上述问题,本申请发明人惊奇的发现利用创造性劳动筛选设计独特的sgRNA序列,使非人动物PD-L1基因的特定片段被人PD-L1基因特定片段替换,本申请发明人成果得到世界首例PD-L1基因人源化小鼠。成功制备PD-L1基因人源化的模式动物,该模型体内可正常表达PD-L1蛋白,可用于PD-L1基因功能研究、人源PD-L1抗体的筛选和评价。
利用本发明的制备方法成功制备PD-L1基因人源化的模式动物,该模型体内可正常表达PD-L1蛋白,可用于PD-L1基因功能研究、人源PD-L1抗体的筛选和评价利用本发明制备的动物模型可用于针对人PD-L1靶位点的药物筛选、药效研究,免疫相关疾病和肿瘤治疗等应用,加快新药研发过程,节约时间和成本,降低药物开发风险。综合来说,对于研究PD-L1蛋白的功能和肿瘤药物筛选提供了有力工具。
另外,本发明得到了PD-L1基因敲除的小鼠,同时本发明的小鼠可与PD-1人源小鼠交配或直接进行基因编辑/修饰,得到双人源化鼠。可用于联合用药情况下筛选抗体及联合用药的药效评价。
发明的详细说明
本发明涉及一种导入人PD-L1基因的非人动物或其子代的制备方法,导入人PD-L1基因、使得该人PD-L1基因在非人动物或其子代细胞中表达并且促进该细胞产生人源化的PD-L1蛋白,同时降低或消除了非人动物或其子代的体内内源/动物来源的Pd-l1基因的表达。
本发明涉及一种制备非人动物的方法,所述非人动物在其种系基因组中插入一段外源PD-L1基因,所述方法包括:
(a)构建含有人PD-L1基因的载体,通过基因工程方法将所述人PD-L1基因的载体导入非人动物的基因组,使得非人动物基因组中的内源/动物来源的Pd-l1基因缺失或使得内源/动物来源的Pd-l1基因不具有功能;并且
(b)在所述非人动物体内表达人源PD-L1基因。
本发明涉及一种制备基因修饰/改造的非人动物的方法,修饰/改造后的非人动物包含内源/动物来源的PD-L1基因的人源化序列或片段,其中所述人源化序列或片段包含在内源/动物来源的Pd-l1基因座,用人PD-L1胞外域编码序列取代内源/动物来源的Pd-l1胞外域编码序列的部分或全部。
本发明涉及一种人源化动物模型构建的方法,所述动物模型基因组中包括PD-L1基因,PD-L1基因的组成包括胞外区、跨膜区以及胞内参与信号传导的区域,其中PD-L1基因的胞内参与信号传导的部分为动物来源,PD-L1基因的胞外区域包含人PD-L1基因的部分片段,同时该动物来源部分和人源部分通过序列拼接连接于动物模型内源的Pd-l1启动子后;优选的,PD-L1基因的跨膜区为动物来源。
本发明还涉及一种人源化动物模型构建的方法,其中所述动物来源的PD-L1包括动物来源Pd-l1基因的第1号外显子的全部、第2号外显子的全部、第3号外显子的部分序列、第4号外显子及其后所有外显子的全部序列;和/或人PD-L1基因部分为编码人类PD-L1多肽的氨基酸的第3号外显子的部分或全部序列。
在本发明的一个实施例中,涉及一种人源化动物模型构建的方法,其中,所述动物来源的Pd-l1基因为啮齿类动物来源的Pd-l1基因;优选的,所述啮齿类动物为小鼠;更优选的,所述小鼠Pd-l1的mRNA序列的全部或部分片段如SEQ ID NO:26中的全部或部分片段所示。
在本发明的一个实施例中,其中,小鼠Pd-l1的蛋白序列的全部或部分片段如SEQID NO:27中的全部或部分片段所示。
在本发明的另一个实施例中,所述人PD-L1基因的全部或部分片段的人PD-L1mRNA序列如SEQ ID NO:28中的全部或部分片段所示。
优选的,人PD-L1全部或部分片段的蛋白序列如SEQ ID NO:29中的全部或部分片段所示。
本发明所述的方法,其中,动物模型基因组中包括嵌合PD-L1基因,所述嵌合PD-L1基因包括小鼠来源的Pd-l1基因部分和人源的PD-L1基因部分,所述嵌合PD-L1基因mRNA序列与SEQ ID NO:32所示的全部或部分序列具有至少80%、或至少90%、或至少95%、或至少99%、或至少99.9%的同源性。
在本发明中,所述动物模型基因组中包括嵌合PD-L1基因,所述嵌合PD-L1基因包括动物来源的Pd-l1基因部分和人源的PD-L1基因部分,所述嵌合PD-L1基因的嵌合mRNA序列如SEQ ID NO:32的全部或部分所示。
在本发明的一个实施例中,所述动物模型基因组中包括嵌合PD-L1基因,所述嵌合PD-L1基因包括动物来源的Pd-l1基因部分和人源的PD-L1基因部分,编码所述嵌合PD-L1基因的蛋白序列与SEQ ID NO:33所示的序列的部分或全部具有至少80%、或至少90%、或至少95%、或至少99%、或至少99.9%的同源性。
优选的,所述动物模型基因组中包括嵌合PD-L1基因,所述嵌合PD-L1基因包括动物来源的Pd-l1基因部分和人源的PD-L1基因部分,所述嵌合PD-L1基因的蛋白序列如SEQID NO:33的部分或全部所示。
本发明还涉及一种人源化动物模型构建的方法,将动物来源的Pd-l1的第3号外显子全部或部分序列替换为人源PD-L1的第3号外显子全部或部分序列,其中,使用sgRNA靶向的5’端靶位点序列如SEQ ID NO:1-7任一项所示,3’端靶位点序列如SEQ ID NO:8-16任一项所示。
优选的,使用的sgRNA靶位点序列为SEQ ID NO:1和/或SEQ ID NO:10。
本发明还涉及一种Pd-l1敲除动物模型构建的方法,将动物体内的Pd-l1的第3号外显子全部或部分敲除,使得内源Pd-l1蛋白失活;其中,使用sgRNA靶向的5’端靶位点如SEQ ID NO:1-7任一项所示,3’端靶位点的序列如SEQ ID NO:8-16任一项所示。
优选的,使用的sgRNA靶位点序列为SEQ ID NO:1和/或SEQ ID NO:10。
本发明还涉及一种制备sgRNA载体的方法,包括以下步骤:
(1)将序列如SEQ ID NO:1-7所示的任一项sgRNA靶序列和/或SEQ ID NO:8-16所示的任一项sgRNA靶序列,制备获得正向寡核苷酸序列和反向寡核苷酸序列;
优选的,所述sgRNA靶序列为SEQ ID NO:1和SEQ ID NO:10,获得的正向寡核苷酸序列如SEQ ID NO:18或SEQ ID NO:22所示;反向寡核苷酸序列如SEQ ID NO:20或SEQ IDNO:24所示,其中SEQ ID NO:18和SEQ ID NO:20为A组,SEQ ID NO:22和SEQ ID NO:24为B组;
(2)合成含有T7启动子及sgRNA scaffold的片段DNA,其中含有T7启动子及sgRNAscaffold的片段DNA如SEQ ID NO:25所示,将上述片段通过EcoRI和BamHI酶切连接至骨架载体上,经测序验证,获得pT7-sgRNA载体;
(3)分别合成步骤1中所述的正向寡核苷酸和反向寡核苷酸,优选为A组和B组中的正向寡核苷酸和反向寡核苷酸,将合成的sgRNA寡聚核苷酸变性、退火,形成可以连入步骤2所述的pT7-sgRNA载体的双链;
(4)将步骤3中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNA载体进行链接,筛选获得sgRNA载体。
本发明还涉及一种Pd-l1基因敲除动物模型的制备方法,包括以下步骤:第一步:按照上述所述的步骤1-4,获得sgRNA载体;
第二步:将sgRNA载体的体外转录产物和Cas9mRNA进行混合,获得混合液,将混合液注射至小鼠受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体母鼠的输卵管中发育,得到F0代小鼠;
第三步:将F0代小鼠利用PCR技术进行检验,验证细胞中的Pd-l1基因被敲除,获得Pd-l1基因敲除阳性小鼠;
第四步:将第三步筛选的阳性小鼠通过杂交和自交的方式,扩大种群数量,建立稳定的Pd-l1-/-小鼠;
优选的,所述第三步中使用的PCR检测引物对序列如SEQ ID NO:45-48所示。
本发明涉及一种靶向载体,其包含:a)与待改变的转换区5’端同源的DNA片段(5’臂),其选自Pd-l1基因基因组DNA的100-10000个长度的核苷酸;b)期望的/供体DNA序列,其编码供体转换区;和c)与待改变的转换区3’端同源的第二个DNA片段(3’臂),其选自Pd-l1基因基因组DNA的100-10000个长度的核苷酸。
优选的,a)与待改变的转换区5’端同源的DNA片段(5’臂)选自与NCBI登录号为NC_000085.6至少具有90%同源性的核苷酸;c)与待改变的转换区3’端同源的第二个DNA片段(3’臂)选自NCBI登录号为NC_000085.6至少具有90%同源性的核苷酸。
更优选的,a)与待改变的转换区5’端同源的DNA片段(5’臂)选自NCBI登录号为NC_000085.6的第29371941-29373565位核苷酸;c)与待改变的转换区3’端同源的第二个DNA片段(3’臂)选自NCBI登录号为NC_000085.6的第29373890-29375042位核苷酸。
在本发明的一个实施例中,靶向载体中选择的基因组核苷酸的长度为1.5kb和1.2kb。
优选的,所述5’臂长度为1625bp;
更优选的,3’臂长度为1153bp;
优选的,待改变的转换区为PD-L1基因第3外显子。
更优选的,靶向载体还包括可选择的基因标记。
在本发明的一个实施例中,5’臂序列如SEQ ID NO:34所示;3’臂序列如SEQ IDNO:42所示。
在本发明的一个实施例中期望的转换区来自人。
优选的,靶向载体中期望的转换区为人源PD-L1的核苷酸序列部分或全部,优选的,所述核苷酸序列如人源PD-L1DNA序列的第一外显子、第二外显子、第三外显子、第四外显子或第五外显子所示;在本发明的一个实施例中,核苷酸序列编码NCBI登录号NP_054862.1所示人源PD-L1蛋白;更优选的,期望的转换区序列如SEQ ID NO:37所示。
本发明还涉及一种包含上述靶向载体的细胞。
此外,本发明还涉及一种用于构建人源化动物模型的sgRNA序列,所述sgRNA序列靶向PD-L1基因,同时所述sgRNA在待改变的PD-L1基因上的靶序列上是唯一的,且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则;优选的,所述sgRNA在小鼠Pd-l1基因的靶位点位于小鼠PD-l1基因的第3外显子上。
优选的,sgRNA序列的上游序列如SEQ ID NO:17所示,下游序列如SEQ ID NO:19所示,sgRNA序列识别5’端靶位点;更优选的,在SEQ ID NO:17的5’端加上TAGG得到正向寡核苷酸,其SEQ ID NO:19的5’端加上AAAC得到反向寡核苷酸。
或者
sgRNA序列的上游序列如SEQ ID NO:21所示,下游序列如SEQ ID NO:23所示,所述sgRNA序列识别3’端靶位点;更优选的,在SEQ ID NO:21的5’端加上TAGG得到正向寡核苷酸,其SEQ ID NO:23的5’端加上AAAC得到反向寡核苷酸。
在本发明的一个实施例中涉及含有sgRNA序列的构建体。
在本发明的另一个实施例中涉及含有所述构建体的细胞。
本发明还涉及一种Pd-l1基因缺失细胞株,使用本发明中能够特异的靶向PD-L1基因的sgRNA敲除第3外显子的部分或全部制备获得。
本发明还涉及一种PD-L1基因人源化细胞株,使用本发明中能够特异的靶向PD-L1基因的sgRNA、以及所述的载体通过对第3外显子的部分或全部进行替换制备获得。
另外,本发明还涉及一种非人类哺乳动物细胞,其包括上述任一种靶向载体、一种或多种本发明所述的sgRNA构建体的体外转录产物;优选的,该细胞还包括Cas9mRNA或其体外转录产物。
在本发明的一个实施例中所述细胞中的基因是杂合的。
在本发明的另一个实施例中所述细胞中的基因是纯合的。
优选的,非人类哺乳动物细胞是小鼠细胞。
更优选的,所述细胞为受精卵细胞。
此外,本发明还涉及一种建立PD-L1基因人源化动物模型的方法,包括如下步骤:
(a)提供根据上述任一项所述的细胞,优选的所述细胞为受精卵细胞;
(b)将所述细胞在培养液中进行培养;
(c)将培养后细胞移植至受体雌性非人类哺乳动物的输卵管内,允许所述细胞在所述雌性非人类哺乳动物的子宫中发育;
(d)鉴定步骤(c)的怀孕雌性的后代基因改造人源化非人类哺乳动物中的种系传递。
优选的,本方法中的非人类哺乳动物是小鼠。
更优选的,本方法中的小鼠为C57BL/6小鼠。
在本发明的一个实施例中,步骤c中的非人类哺乳动物为假孕雌性。
此外,本发明还涉及一种建立双人源化小鼠基因改造动物模型的方法,包括如下步骤:
(a)利用建立PD-L1基因人源化动物模型的方法获得PD-L1基因人源化的基因改造人源化小鼠;
(b)将步骤(a)获得的基因改造人源化小鼠与其他人源化小鼠交配或直接进行基因编辑/修饰,并进行筛选,得到双人源化小鼠模型。
优选的,在建立双人源化小鼠基因改造动物模型的方法中的步骤(b)为:将步骤(a)获得的基因改造人源化小鼠与PD-1人源化小鼠交配得到PD-L1和PD-1双人源化小鼠模型。
本发明还涉及一种制备多基因人源化动物模型的方法,
(a)利用本发明所述方法获得动物模型;
(b)将步骤(a)获得的动物模型与其他人源化动物交配或直接进行基因编辑/修饰,并进行筛选,得到多基因人源化动物模型。
优选的,所述多基因人源化动物可以是双基因人源化动物、三基因人源化动物、四基因人源化动物、五基因人源化动物、六基因人源化动物、七基因人源化动物、八基因人源化动物或九基因人源化动物。
本发明还涉及由上述方法产生的非人类哺乳动物。
优选的,基因组中含有人源基因。
在一个实施例中所述非人类哺乳动物是啮齿动物,优选的是小鼠。
在另一个实施例中,非人类哺乳动物表达人源化PD-L1基因编码的蛋白质。
此外,本发明进一步涉及一种非人类动物在制备荷瘤动物模型中的用途,其通过包括本发明所述的方法制备获得;优选的,所述非人类动物是啮齿动物;更优选的为小鼠。
本发明还涉及来源于非人类哺乳动物或其后代或荷瘤非人类哺乳动物的细胞或细胞系或原代细胞培养物;来源于非人类哺乳动物或其后代或荷瘤非人类哺乳动物的组织或器官或其培养物;以及来源于非人类哺乳动物或其后代或荷瘤非人类哺乳动物荷瘤后的瘤组织。
本发明涉及一种嵌合PD-L1蛋白,选自下列组中的一种:
a)嵌合PD-L1蛋白序列中编码人PD-L1蛋白的mRNA序列如SEQ ID NO:28所示的序列的部分或全部所示;b)嵌合PD-L1蛋白序列中编码人PD-L1蛋白的mRNA序列与SEQ ID NO:28所示的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;c)嵌合PD-L1蛋白序列中编码人PD-L1蛋白的mRNA序列与SEQ ID NO:28所示的核苷酸序列杂交;d)嵌合PD-L1蛋白序列中编码人PD-L1蛋白的mRNA序列与SEQ ID NO:28所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合PD-L1蛋白序列中编码人PD-L1蛋白的mRNA序列具有与SEQ ID NO:28所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或
f)嵌合PD-L1蛋白序列中人PD-L1的蛋白序列如SEQ ID NO:29部分或全部序列所示;g)嵌合PD-L1蛋白序列中人PD-L1的蛋白序列与SEQ ID NO:29所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;h)嵌合PD-L1蛋白序列中编码人PD-L1的蛋白序列的核酸序列在严格条件下,与SEQ ID NO:29所示的蛋白序列的核苷酸序列杂交;i)嵌合PD-L1蛋白序列中人PD-L1的蛋白序列与SEQ ID NO:29所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;g)嵌合PD-L1蛋白序列中人PD-L1的蛋白序列具有SEQ ID NO:29所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列;或k)嵌合PD-L1蛋白的核苷酸编码序列为SEQ ID NO:31所示的序列的部分或全部;l)嵌合PD-L1蛋白的核苷酸编码序列与SEQ ID NO:31所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;m)嵌合PD-L1蛋白的核苷酸编码序列在严格条件下,与SEQ ID NO:31所示的核苷酸序列杂交;n)嵌合PD-L1蛋白的核苷酸编码序列与SEQ ID NO:31所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;p)嵌合PD-L1蛋白的核苷酸编码序列具有SEQ IDNO:31所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或q)嵌合PD-L1的mRNA序列为SEQ ID NO:32所示的序列的部分或全部;r)嵌合PD-L1的mRNA序列与SEQ IDNO:32所示的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;s)嵌合PD-L1的mRNA序列与SEQ ID NO:32所示的核苷酸序列杂交;t)嵌合PD-L1的mRNA序列与SEQ ID NO:32所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;u)嵌合PD-L1的mRNA序列具有与SEQ ID NO:32所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;或v)嵌合PD-L1的蛋白序列为SEQ ID NO:33的部分或全部;w)嵌合PD-L1的序列与SEQ ID NO:33所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;x)编码嵌合PD-L1蛋白的核酸序列在严格条件下,与编码SEQ ID NO:33所示的蛋白的核苷酸序列杂交;y)嵌合PD-L1的蛋白序列与SEQ ID NO:33所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;z)嵌合PD-L1的蛋白序列具有SEQ ID NO:33所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列;或A1)嵌合PD-L1蛋白中编码嵌合PD-L1蛋白的核苷酸的部分序列为SEQ ID NO:30所示的序列的部分或全部;B1)嵌合PD-L1蛋白中编码嵌合PD-L1蛋白的核苷酸部分序列与SEQ ID NO:30所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;C1)嵌合PD-L1蛋白中编码嵌合PD-L1蛋白的核苷酸部分序列在严格条件下,与SEQ ID NO:30所示的核苷酸序列杂交;
D1)嵌合PD-L1蛋白中编码嵌合PD-L1蛋白的核苷酸部分序列与SEQ ID NO:30所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;E1)嵌合PD-L1蛋白中编码嵌合PD-L1蛋白的核苷酸部分序列具有SEQ ID NO:30所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
同时,本发明涉及一种编码嵌合PD-L1蛋白的基因,其中所述基因序列选自:
a)所述基因编码上述所述嵌合小鼠PD-L1的蛋白序列;b)嵌合PD-L1的mRNA序列如SEQ ID NO:32所示;c)嵌合PD-L1的mRNA序列在严格条件下,与SEQ ID NO:32所示的核苷酸杂交的基因序列;d)嵌合PD-L1的mRNA序列与SEQ ID NO:32所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列;和/或e)编码嵌合PD-L1的蛋白的基因序列,所述蛋白与SEQ ID NO:33所示的氨基酸的同一性程度为至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;f)编码嵌合PD-L1的蛋白的基因序列,所述蛋白的序列与SEQ ID NO:33的差异不超过10、9、8、7、6、5、4、3、2或1个氨基酸残基;g)编码嵌合PD-L1的蛋白的基因序列,所述蛋白具有SEQ ID NO:33所示的,包括取代、缺失和/或插入一个或多个氨基酸的氨基酸序列。和/或h)嵌合PD-L1的基因序列如SEQ ID NO:30所示;i)嵌合PD-L1的基因序列在严格条件下,与SEQ ID NO:30所示的核苷酸杂交的基因序列;j)嵌合PD-L1的基因序列与SEQ ID NO:30所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列;和/或k)嵌合PD-L1的基因序列如SEQ ID NO:31所示;l)嵌合PD-L1的基因序列在严格条件下,与SEQ ID NO:31所示的核苷酸杂交的基因序列;m)嵌合PD-L1的基因序列与SEQ ID NO:31所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列;
本发明还涉及一种编码嵌合PD-L1蛋白的基因,其中嵌合小鼠PD-L1DNA的非模板链、编码链或有义链包含序列SEQ ID NO:30或SEQ ID NO:31。
本发明还涉及人源化小鼠PD-L1的基因组DNA,所述基因组DNA序列转录获得的mRNA逆转录后得到的DNA序列,与上述所述的基因序列一致或互补。
本发明还涉及一种表达人源化小鼠PD-L1嵌合蛋白的构建体。
本发明还涉及一种包含所述构建体的细胞。
本发明还涉及一种包含所述细胞的组织。
以及能够特异的靶向PD-L1基因的sgRNA序列在替换或敲除PD-L1基因中的应用。
本发明还涉及一段人源化小鼠PD-L1氨基酸序列,氨基酸序列选自:
a)所述氨基酸序列如序列33所示;
b)所述氨基酸序列与序列33所示的氨基酸序列具有至少90%的同一性程度;
c)由核酸序列编码的氨基酸序列,所述核酸序列在低严谨条件下,与编码序列33所示的氨基酸的核苷酸序列杂交;
d)所述氨基酸序列与序列33所示的氨基酸的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
e)所述氨基酸序列与序列33所示的氨基酸的差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
和/或
f)所述氨基酸序列具有序列33所示的,包括取代、缺失和/或插入一个或多个氨基酸的氨基酸序列。
此外,本发明还涉及一段人源化小鼠PD-L1的DNA序列,具体的,DNA序列选自:
a)所述DNA编码序列33或其同源序列的人源化小鼠PD-L1氨基酸序列;
b)所述DNA序列如序列32所示;
c)在低严谨条件下,与序列32所示的核苷酸杂交的DNA序列;
d)与序列32所示的核苷酸具有至少90%同一性程度的DNA序列;
e)编码氨基酸的DNA序列,所述氨基酸与序列33所示的氨基酸具有至少90%的同一性程度;
f)编码氨基酸的DNA序列,所述氨基酸的序列33所示的氨基酸的同一性程度为至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;g)编码氨基酸的DNA序列,所述氨基酸的序列与序列33的差异不超过10、9、8、7、6、5、4、3、2或1个氨基酸;
和/或
h)编码氨基酸的DNA序列,所述氨基酸具有序列33所示的,包括取代、缺失和/或插入一个或多个氨基酸的氨基酸序列。
本发明涉及一段人源化小鼠PD-L1的基因组DNA序列,其转录获得的mRNA逆转录后得到的DNA序列,与序列32或其同源序列的DNA序列一致或互补。
本发明的任何一个方面的氨基酸序列,其与序列33具有例如至少大约90%的同一性程度,并且其具有蛋白活性。在具体的实施方案中,与序列33的同一性程度为至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。在替换的实施方案中,所述同一性程度为至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%或至少大约59%。
在具体的实施方案中,本发明的氨基酸i)具有氨基酸序列;或ii)由氨基酸序列组成,所述氨基酸序列具有如上所述的任何的同一性程度。
本发明的任何一个方面的核苷酸序列,其与序列32具有例如至少大约90%的同一性程度。在具体的实施方案中,与序列32的同一性程度为至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%。在替换的实施方案中,所述同一性程度为至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%或至少大约59%。
本发明还涉及一种荷瘤非人类哺乳动物在制备动物模型中的用途,所述荷瘤非人类哺乳动物通过本发明的方法获得的。
本发明还涉及所述方法产生的非人动物或其后代在制备动物模型中的用途。
本发明还涉及所述获得非人动物或其后代在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用。
本发明还涉及所述的方法获得非人动物或其后代在需要涉及人类细胞的免疫过程的生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用。
本发明还涉及所述的方法获得非人动物或其后代在体内研究、人PD-L1信号通路调节剂的筛选、药效检测、筛选文库、疗效评估、在筛选、验证、评价或研究PD-L1基因功能研究、人源PD-L1抗体、针对人PD-L1靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤药物方面的用途。
优选的用于如上描述的方法的受精卵是C57BL/6受精卵。也可用于本发明方法中的本领域所使用的受精卵包括但不限于FVB/N受精卵、BALB/c受精卵、DBA/1受精卵和DBA/2受精卵。
受精卵可以来源于任何非人类动物。优选受精卵细胞来源于啮齿类。可以通过DNA的微注射来向受精卵引入遗传构建体。例如,可以通过微注射后培养受精卵、将培养的受精卵转移到假孕的非人类动物中并生育非人类哺乳动物来产生上文所述方法的非人类哺乳动物。
这里使用的术语“基因改造”描述人工引入并整合进生物的DNA产生的特定基因的蛋白质。
这里使用的术语“基因改造动物”描述基因组中含有外源DNA的动物。此基因改造DNA可能整合在基因组的某处。
本发明还提供由以上描述的任何方法所产生的非人类哺乳动物。在本发明的一个实施方案中,提供非人类哺乳动物,所述基因改造动物基因组中含有编码人源PD-L1的DNA。
在一个优选的实施方案中,非人类哺乳动物含有如图2所描述的遗传构建体。在另一实施方案中,提供表达基因改造人源PD-L1的非人类哺乳动物。在一个优选的实施方案中,组织特异性表达人源PD-L1蛋白。
在另一实施方案中,基因改造动物中的人源PD-L1的表达是可控的,如通过加入特异的诱导物或阻遏物物质。
非人类哺乳动物可以是任何本领域已知的、可以用于本发明方法的非人类动物。优选的非人类哺乳动物是哺乳动物,更优选的非人类哺乳动物是啮齿动物。本发明最优选的动物是小鼠。
可以对上文描述的非人类哺乳动物进行遗传、分子和行为分析。本发明也涉及本发明提供的非人类哺乳动物与相同或其它基因型交配后产生的后代。
本发明还提供来源于本发明提供的非人类哺乳动物或其后代的细胞系或原代细胞培养物。可以通过两种方法制备基于细胞培养的模型。可以从非人类哺乳动物中分离细胞培养物,或从使用同样的构建体、经标准的细胞转染技术建立的细胞培养物中制备细胞培养物。可以通过多种方法检测含有编码人源PD-L1蛋白的DNA序列的遗传构建体的整合。对于本领域技术人员而言,显然存在许多可以用来检测外源DNA表达的分析方法,包括在RNA水平的方法(包括通过逆转录酶聚合酶链式反应(RT-PCR)或通过Southern印迹、原位杂交的mRNA定量)和在蛋白质水平的方法(包括组织化学、免疫印迹分析和体外结合研究)。此外,可以通过本领域技术人员众所周知的ELISA技术来定量目的基因的表达水平。可以使用许多标准分析来完成定量测量。例如,可使用RT-PCR和包括RNA酶保护、Southern印迹分析、RNA斑点(RNAdot)分析在内的杂交方法测量转录水平。也可以使用免疫组织化学染色、流式细胞检测和Western印迹分析来评估是否存在人源PD-L1蛋白质。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:MolecularCloningALaboratoryManual,2ndEd.,ed.BySambrook,FritschandManiatis(ColdSpringHarborLaboratoryPress:1989);DNACloning,VolumesIandII(D.N.Glovered.,1985);OligonucleotideSynthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;NucleicAcidHybridization(B.D.Hames&S.J.Higginseds.1984);TranscriptionAndTranslation(B.D.Hames&S.J.Higginseds.1984);CultureOfAnimalCells(R.I.Freshney,AlanR.Liss,Inc.,1987);ImmobilizedCellsAndEnzymes(IRLPress,1986);B.Perbal,APracticalGuideToMolecularCloning(1984);theseries,MethodsInENZYMOLOGY(J.AbelsonandM.Simon,eds.-in-chief,AcademicPress,Inc.,NewYork),specifically,Vols.154and155(Wuetal.eds.)andVol.185,″ndVol.185.155Simonlecular(D.Goeddel,ed.);GeneTransferVectorsForMammalianCells(J.H.MillerandM.P.Caloseds.,1987,ColdSpringHarborLaboratory);ImmunochemicalMethodsInCellAndMolecularBiology(MayerandWalker,eds.,AcademicPress,London,1987);HandbookOfExperimentalImmunology,VolumesV(D.M.WeirandC.C.Blackwell,eds.,1986);andManipulatingtheMouseEmbryo,(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
实施例9基于胚胎干细胞的制备方法
采用其它基因编辑系统和制备方法也可以得到本发明的非人哺乳动物,包括但不限于基于胚胎干细胞(embryonic stem cell,ES)的基因同源重组技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。本实施例以传统的ES细胞基因同源重组技术为例,阐述如何采用其它方法制备获得PD-L1基因人源化小鼠。
根据本发明的基因编辑策略和人源化小鼠PD-L1基因示意图(图4),发明人设计了图20所示的打靶策略,图20中还显示了重组载体的设计。鉴于本发明的目的之一是将小鼠Pd-l1基因的3号外显子全部或部分用人PD-L1基因片段替换,为此,发明人设计了包含5’同源臂(4208bp)、3’同源臂(5113bp)和人源化基因片段(324bp)的重组载体,并在重组载体上构建了用于阳性克隆筛选的抗性基因,如新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统,如Frt或LoxP重组位点。进一步的,还在重组载体3’同源臂下游构建了具有负筛选标记的编码基因,如白喉毒素A亚基的编码基因(DTA)。载体构建可采用常规方法进行,如酶切连接等。将构建正确的重组载体转染小鼠胚胎干细胞,如C57BL/6小鼠的胚胎干细胞,利用阳性克隆筛选标记基因对得到的重组载体转染细胞进行筛选,并利用Southern Blot技术进行DNA重组鉴定。
将筛选出的正确阳性克隆按照《小鼠胚胎操作实验手册(第三版)》中的方法将阳性克隆细胞(黑色鼠)通过显微注射进入已分离好的囊胚中(白色鼠),注射后的嵌合囊胚转移至培养液中短暂培养,然后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。通过提取鼠尾基因组和PCR检测,挑选基因正确重组的F0代嵌合鼠用于后续繁殖和鉴定。将F0代嵌合鼠与野生型鼠交配获得F1代鼠,通过提取鼠尾基因组和PCR检测,挑选可以稳定遗传的基因重组阳性F1代杂合子小鼠。再将F1代杂合小鼠互相交配即可获得基因重组阳性F2代纯合子鼠。此外,可将F1代杂合鼠与Flp或Cre工具鼠交配去除阳性克隆筛选标记基因(neo等)后,再通过互相交配即可得到PD-L1基因人源化纯合子小鼠。对获得的F1代杂合或F2代纯合鼠进行基因型和表型检测的方法与前述实施例5一致。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 北京百奥赛图基因生物技术有限公司
<120> 人源化基因改造动物模型的制备方法及应用
<160> 68
<170> SIPOSequenceListing 1.0
<210> 1
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gtatggcagc aacgtcacga tgg 23
<210> 2
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gcttgcgtta gtggtgtact ggg 23
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gctggacctg cttgcgttag tgg 23
<210> 4
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aggtccagct cccgttctac agg 23
<210> 5
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtttactatc acggctccaa agg 23
<210> 6
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggctccaaag gacttgtacg tgg 23
<210> 7
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cgtgatagta aacgctgaaa agg 23
<210> 8
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
attccctgta gaacgggagc tgg 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gacttgtacg tggtggagta tgg 23
<210> 10
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tgctgcataa tcagctacgg tgg 23
<210> 11
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cataatcagc tacggtggtg cgg 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gacgtcaagc tgcaggacgc agg 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tactgctgca taatcagcta cgg 23
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gatcacagac gtcaagctgc agg 23
<210> 15
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gcttgacgtc tgtgatctga agg 23
<210> 16
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
cagcatttcc cttcaaaagc tgg 23
<210> 17
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tatggcagca acgtcacga 19
<210> 18
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
taggtaggta tggcagcaac gtcacga 27
<210> 19
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tcgtgacgtt gctgccata 19
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaactcgtga cgttgctgcc ata 23
<210> 21
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctgcataatc agctacgg 18
<210> 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
taggctgcat aatcagctac gg 22
<210> 23
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ccgtagctga ttatgcag 18
<210> 24
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aaacccgtag ctgattatgc ag 22
<210> 25
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttaaaggat cc 132
<210> 26
<211> 3653
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 26
gaaatcgtgg tccccaagcc tcatgccagg ctgcacttgc acgtcgcggg ccagtctcct 60
cgcctgcaga tagttcccaa aacatgagga tatttgctgg cattatattc acagcctgct 120
gtcacttgct acgggcgttt actatcacgg ctccaaagga cttgtacgtg gtggagtatg 180
gcagcaacgt cacgatggag tgcagattcc ctgtagaacg ggagctggac ctgcttgcgt 240
tagtggtgta ctgggaaaag gaagatgagc aagtgattca gtttgtggca ggagaggagg 300
accttaagcc tcagcacagc aacttcaggg ggagagcctc gctgccaaag gaccagcttt 360
tgaagggaaa tgctgccctt cagatcacag acgtcaagct gcaggacgca ggcgtttact 420
gctgcataat cagctacggt ggtgcggact acaagcgaat cacgctgaaa gtcaatgccc 480
cataccgcaa aatcaaccag agaatttccg tggatccagc cacttctgag catgaactaa 540
tatgtcaggc cgagggttat ccagaagctg aggtaatctg gacaaacagt gaccaccaac 600
ccgtgagtgg gaagagaagt gtcaccactt cccggacaga ggggatgctt ctcaatgtga 660
ccagcagtct gagggtcaac gccacagcga atgatgtttt ctactgtacg ttttggagat 720
cacagccagg gcaaaaccac acagcggagc tgatcatccc agaactgcct gcaacacatc 780
ctccacagaa caggactcac tgggtgcttc tgggatccat cctgttgttc ctcattgtag 840
tgtccacggt cctcctcttc ttgagaaaac aagtgagaat gctagatgtg gagaaatgtg 900
gcgttgaaga tacaagctca aaaaaccgaa atgatacaca attcgaggag acgtaagcag 960
tgttgaaccc tctgatcgtc gattggcagc ttgtggtctg tgaaagaaag ggcccatggg 1020
acatgagtcc aaagactcaa gatggaacct gagggagaga accaagaaag tgttgggaga 1080
ggagcctgga acaacggaca ttttttccag ggagacactg ctaagcaagt tgcccatcag 1140
tcgtcttggg aaatggattg agggttcctg gcttagcagc tggtccttgc acagtgacct 1200
tttcctctgc tcagtgccgg gatgagagat ggagtcatga gtgttgaaga ataagtgcct 1260
tctatttatt ttgagtctgt gtgttctcac tttgggcatg taattatgac tggtgaattc 1320
tgacgacatg atagatctta agatgtagtc accaaactca actgctgctt agcatcctcc 1380
gtaactactg atacaagcag ggaacacaga ggtcacctgc ttggtttgac aggctcttgc 1440
tgtctgactc aaataatctt tatttttcag tcctcaaggc tcttcgatag cagttgttct 1500
gtatcagcct tataggtgtc aggtatagca ctcaacatct catctcatta caatagcaac 1560
cctcatcacc atagcaacag ctaacctctg ttatcctcac ttcatagcca ggaagctgag 1620
cgactaagtc acttgcccac agagtatcag ctctcagatt tctgttcttc agccactgtc 1680
ctttcaggat agaatttgtc gttaagaaat taatttaaaa actgattatt gagtagcatt 1740
gtatatcaat cacaacatgc cttgtgcact gtgctggcct ctgagcataa agatgtacgc 1800
cggagtaccg gtcggacatg tttatgtgtg ttaaatactc agagaaatgt tcattaacaa 1860
ggagcttgca ttttagagac actggaaagt aactccagtt cattgtctag cattacattt 1920
acctcatttg ctatccttgc catacagtct cttgttctcc atgaagtgtc atgaatcttg 1980
ttgaatagtt cttttatttt ttaaatgttt ctatttaaat gatattgaca tctgaggcga 2040
tagctcagtt ggtaaaaccc tttcctcaca agtgtgaaac cctgagtctt atccctagaa 2100
cccacataaa aaacagttgc gtatgtttgt gcatgctttt gatcccagca ctagggaggc 2160
agaggcaggc agatcctgag ctctcattga ccacccagcc tagcctacat ggttagctcc 2220
aggcctacag gagctggcag agcctgaaaa acgatgccta gacacacaca cacacacaca 2280
cacacacaca cacacacaca cacaccatgt actcatagac ctaagtgcac cctcctacac 2340
atgcacacac atacaattca aacacaaatc aacagggaat tgtctcagaa tggtccccaa 2400
gacaaagaag aagaaaaaca ccaaaccagc tctattccct cagcctatcc tctctactcc 2460
ttcctagaag caactactat tgtttttgta tataaattta cccaacgaca gttaatatgt 2520
agaatatata ttaaagtgtc tgtcaatata tattatctct ttctttcttt cttcctttct 2580
ttctttcttt ctttctttct ttctttcttt ctttctttct ttcttccttc cttccttcct 2640
tccttccttc cttccttcct ttctttcttt ctttcttttt ttctgtctat ctgtacctaa 2700
atggttgctc actatgcatt ttctgtgctc ttcgcccttt ttatttaatg tatggatatt 2760
tatgctgctt ccagaatgga tctaaagctc tttgtttcta ggttttctcc cccatccttc 2820
taggcatctc tcacactgtc taggccagac accatgtctg ctgcctgaat ctgtagacac 2880
catttataaa gcacgtactc accgagtttg tatttggctt gttctgtgtc tgattaaagg 2940
gagaccatga gtccccaggg tacactgagt taccccagta ccaaggggga gccttgtttg 3000
tgtctccatg gcagaagcag gcctggagcc attttggttt cttccttgac ttctctcaaa 3060
cacagacgcc tcacttgctc attacaggtt ctcctttggg aatgtcagca ttgctccttg 3120
actgctggct gccctggaag gagcccatta gctctgtgtg agcccttgac agctactgcc 3180
tctccttacc acaggggcct ctaagatact gttacctaga ggtcttgagg atctgtgttc 3240
tctgggggga ggaaaggagg aggaacccag aactttctta cagttttcct tgttctgtca 3300
catgtcaaga ctgaaggaac aggctgggct acgtagtgag atcctgtctc aaaggaaaga 3360
cgagcatagc cgaacccccg gtggaacccc ctctgttacc tgttcacaca agcttattga 3420
tgagtctcat gttaatgtct tgtttgtatg aagtttaaga aaatatcggg ttgggcaaca 3480
cattctattt attcatttta tttgaaatct taatgccatc tcatggtgtt ggattggtgt 3540
ggcactttat tcttttgtgt tgtgtataac cataaatttt attttgcatc agattgtcaa 3600
tgtattgcat taatttaata aatattttta tttattaaaa aaaaaaaaaa aaa 3653
<210> 27
<211> 290
<212> PRT
<213> 小鼠(Mouse)
<400> 27
Met Arg Ile Phe Ala Gly Ile Ile Phe Thr Ala Cys Cys His Leu Leu
1 5 10 15
Arg Ala Phe Thr Ile Thr Ala Pro Lys Asp Leu Tyr Val Val Glu Tyr
20 25 30
Gly Ser Asn Val Thr Met Glu Cys Arg Phe Pro Val Glu Arg Glu Leu
35 40 45
Asp Leu Leu Ala Leu Val Val Tyr Trp Glu Lys Glu Asp Glu Gln Val
50 55 60
Ile Gln Phe Val Ala Gly Glu Glu Asp Leu Lys Pro Gln His Ser Asn
65 70 75 80
Phe Arg Gly Arg Ala Ser Leu Pro Lys Asp Gln Leu Leu Lys Gly Asn
85 90 95
Ala Ala Leu Gln Ile Thr Asp Val Lys Leu Gln Asp Ala Gly Val Tyr
100 105 110
Cys Cys Ile Ile Ser Tyr Gly Gly Ala Asp Tyr Lys Arg Ile Thr Leu
115 120 125
Lys Val Asn Ala Pro Tyr Arg Lys Ile Asn Gln Arg Ile Ser Val Asp
130 135 140
Pro Ala Thr Ser Glu His Glu Leu Ile Cys Gln Ala Glu Gly Tyr Pro
145 150 155 160
Glu Ala Glu Val Ile Trp Thr Asn Ser Asp His Gln Pro Val Ser Gly
165 170 175
Lys Arg Ser Val Thr Thr Ser Arg Thr Glu Gly Met Leu Leu Asn Val
180 185 190
Thr Ser Ser Leu Arg Val Asn Ala Thr Ala Asn Asp Val Phe Tyr Cys
195 200 205
Thr Phe Trp Arg Ser Gln Pro Gly Gln Asn His Thr Ala Glu Leu Ile
210 215 220
Ile Pro Glu Leu Pro Ala Thr His Pro Pro Gln Asn Arg Thr His Trp
225 230 235 240
Val Leu Leu Gly Ser Ile Leu Leu Phe Leu Ile Val Val Ser Thr Val
245 250 255
Leu Leu Phe Leu Arg Lys Gln Val Arg Met Leu Asp Val Glu Lys Cys
260 265 270
Gly Val Glu Asp Thr Ser Ser Lys Asn Arg Asn Asp Thr Gln Phe Glu
275 280 285
Glu Thr
290
<210> 28
<211> 3691
<212> DNA/RNA
<213> 人(human)
<400> 28
ggcgcaacgc tgagcagctg gcgcgtcccg cgcggcccca gttctgcgca gcttcccgag 60
gctccgcacc agccgcgctt ctgtccgcct gcagggcatt ccagaaagat gaggatattt 120
gctgtcttta tattcatgac ctactggcat ttgctgaacg catttactgt cacggttccc 180
aaggacctat atgtggtaga gtatggtagc aatatgacaa ttgaatgcaa attcccagta 240
gaaaaacaat tagacctggc tgcactaatt gtctattggg aaatggagga taagaacatt 300
attcaatttg tgcatggaga ggaagacctg aaggttcagc atagtagcta cagacagagg 360
gcccggctgt tgaaggacca gctctccctg ggaaatgctg cacttcagat cacagatgtg 420
aaattgcagg atgcaggggt gtaccgctgc atgatcagct atggtggtgc cgactacaag 480
cgaattactg tgaaagtcaa tgccccatac aacaaaatca accaaagaat tttggttgtg 540
gatccagtca cctctgaaca tgaactgaca tgtcaggctg agggctaccc caaggccgaa 600
gtcatctgga caagcagtga ccatcaagtc ctgagtggta agaccaccac caccaattcc 660
aagagagagg agaagctttt caatgtgacc agcacactga gaatcaacac aacaactaat 720
gagattttct actgcacttt taggagatta gatcctgagg aaaaccatac agctgaattg 780
gtcatcccag aactacctct ggcacatcct ccaaatgaaa ggactcactt ggtaattctg 840
ggagccatct tattatgcct tggtgtagca ctgacattca tcttccgttt aagaaaaggg 900
agaatgatgg atgtgaaaaa atgtggcatc caagatacaa actcaaagaa gcaaagtgat 960
acacatttgg aggagacgta atccagcatt ggaacttctg atcttcaagc agggattctc 1020
aacctgtggt ttaggggttc atcggggctg agcgtgacaa gaggaaggaa tgggcccgtg 1080
ggatgcaggc aatgtgggac ttaaaaggcc caagcactga aaatggaacc tggcgaaagc 1140
agaggaggag aatgaagaaa gatggagtca aacagggagc ctggagggag accttgatac 1200
tttcaaatgc ctgaggggct catcgacgcc tgtgacaggg agaaaggata cttctgaaca 1260
aggagcctcc aagcaaatca tccattgctc atcctaggaa gacgggttga gaatccctaa 1320
tttgagggtc agttcctgca gaagtgccct ttgcctccac tcaatgcctc aatttgtttt 1380
ctgcatgact gagagtctca gtgttggaac gggacagtat ttatgtatga gtttttccta 1440
tttattttga gtctgtgagg tcttcttgtc atgtgagtgt ggttgtgaat gatttctttt 1500
gaagatatat tgtagtagat gttacaattt tgtcgccaaa ctaaacttgc tgcttaatga 1560
tttgctcaca tctagtaaaa catggagtat ttgtaaggtg cttggtctcc tctataacta 1620
caagtataca ttggaagcat aaagatcaaa ccgttggttg cataggatgt cacctttatt 1680
taacccatta atactctggt tgacctaatc ttattctcag acctcaagtg tctgtgcagt 1740
atctgttcca tttaaatatc agctttacaa ttatgtggta gcctacacac ataatctcat 1800
ttcatcgctg taaccaccct gttgtgataa ccactattat tttacccatc gtacagctga 1860
ggaagcaaac agattaagta acttgcccaa accagtaaat agcagacctc agactgccac 1920
ccactgtcct tttataatac aatttacagc tatattttac tttaagcaat tcttttattc 1980
aaaaaccatt tattaagtgc ccttgcaata tcaatcgctg tgccaggcat tgaatctaca 2040
gatgtgagca agacaaagta cctgtcctca aggagctcat agtataatga ggagattaac 2100
aagaaaatgt attattacaa tttagtccag tgtcatagca taaggatgat gcgaggggaa 2160
aacccgagca gtgttgccaa gaggaggaaa taggccaatg tggtctggga cggttggata 2220
tacttaaaca tcttaataat cagagtaatt ttcatttaca aagagaggtc ggtacttaaa 2280
ataaccctga aaaataacac tggaattcct tttctagcat tatatttatt cctgatttgc 2340
ctttgccata taatctaatg cttgtttata tagtgtctgg tattgtttaa cagttctgtc 2400
ttttctattt aaatgccact aaattttaaa ttcatacctt tccatgattc aaaattcaaa 2460
agatcccatg ggagatggtt ggaaaatctc cacttcatcc tccaagccat tcaagtttcc 2520
tttccagaag caactgctac tgcctttcat tcatatgttc ttctaaagat agtctacatt 2580
tggaaatgta tgttaaaagc acgtattttt aaaatttttt tcctaaatag taacacattg 2640
tatgtctgct gtgtactttg ctatttttat ttattttagt gtttcttata tagcagatgg 2700
aatgaatttg aagttcccag ggctgaggat ccatgccttc tttgtttcta agttatcttt 2760
cccatagctt ttcattatct ttcatatgat ccagtatatg ttaaatatgt cctacatata 2820
catttagaca accaccattt gttaagtatt tgctctagga cagagtttgg atttgtttat 2880
gtttgctcaa aaggagaccc atgggctctc cagggtgcac tgagtcaatc tagtcctaaa 2940
aagcaatctt attattaact ctgtatgaca gaatcatgtc tggaactttt gttttctgct 3000
ttctgtcaag tataaacttc actttgatgc tgtacttgca aaatcacatt ttctttctgg 3060
aaattccggc agtgtacctt gactgctagc taccctgtgc cagaaaagcc tcattcgttg 3120
tgcttgaacc cttgaatgcc accagctgtc atcactacac agccctccta agaggcttcc 3180
tggaggtttc gagattcaga tgccctggga gatcccagag tttcctttcc ctcttggcca 3240
tattctggtg tcaatgacaa ggagtacctt ggctttgcca catgtcaagg ctgaagaaac 3300
agtgtctcca acagagctcc ttgtgttatc tgtttgtaca tgtgcatttg tacagtaatt 3360
ggtgtgacag tgttctttgt gtgaattaca ggcaagaatt gtggctgagc aaggcacata 3420
gtctactcag tctattccta agtcctaact cctccttgtg gtgttggatt tgtaaggcac 3480
tttatccctt ttgtctcatg tttcatcgta aatggcatag gcagagatga tacctaattc 3540
tgcatttgat tgtcactttt tgtacctgca ttaatttaat aaaatattct tatttatttt 3600
gttacttggt acaccagcat gtccattttc ttgtttattt tgtgtttaat aaaatgttca 3660
gtttaacatc ccagtggaga aagttaaaaa a 3691
<210> 29
<211> 290
<212> PRT
<213> 人(human)
<400> 29
Met Arg Ile Phe Ala Val Phe Ile Phe Met Thr Tyr Trp His Leu Leu
1 5 10 15
Asn Ala Phe Thr Val Thr Val Pro Lys Asp Leu Tyr Val Val Glu Tyr
20 25 30
Gly Ser Asn Met Thr Ile Glu Cys Lys Phe Pro Val Glu Lys Gln Leu
35 40 45
Asp Leu Ala Ala Leu Ile Val Tyr Trp Glu Met Glu Asp Lys Asn Ile
50 55 60
Ile Gln Phe Val His Gly Glu Glu Asp Leu Lys Val Gln His Ser Ser
65 70 75 80
Tyr Arg Gln Arg Ala Arg Leu Leu Lys Asp Gln Leu Ser Leu Gly Asn
85 90 95
Ala Ala Leu Gln Ile Thr Asp Val Lys Leu Gln Asp Ala Gly Val Tyr
100 105 110
Arg Cys Met Ile Ser Tyr Gly Gly Ala Asp Tyr Lys Arg Ile Thr Val
115 120 125
Lys Val Asn Ala Pro Tyr Asn Lys Ile Asn Gln Arg Ile Leu Val Val
130 135 140
Asp Pro Val Thr Ser Glu His Glu Leu Thr Cys Gln Ala Glu Gly Tyr
145 150 155 160
Pro Lys Ala Glu Val Ile Trp Thr Ser Ser Asp His Gln Val Leu Ser
165 170 175
Gly Lys Thr Thr Thr Thr Asn Ser Lys Arg Glu Glu Lys Leu Phe Asn
180 185 190
Val Thr Ser Thr Leu Arg Ile Asn Thr Thr Thr Asn Glu Ile Phe Tyr
195 200 205
Cys Thr Phe Arg Arg Leu Asp Pro Glu Glu Asn His Thr Ala Glu Leu
210 215 220
Val Ile Pro Glu Leu Pro Leu Ala His Pro Pro Asn Glu Arg Thr His
225 230 235 240
Leu Val Ile Leu Gly Ala Ile Leu Leu Cys Leu Gly Val Ala Leu Thr
245 250 255
Phe Ile Phe Arg Leu Arg Lys Gly Arg Met Met Asp Val Lys Lys Cys
260 265 270
Gly Ile Gln Asp Thr Asn Ser Lys Lys Gln Ser Asp Thr His Leu Glu
275 280 285
Glu Thr
290
<210> 30
<211> 344
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gcgtttactg tcacggttcc caaggaccta tatgtggtag agtatggtag caatatgaca 60
attgaatgca aattcccagt agaaaaacaa ttagatctgg ctgcactaat tgtctattgg 120
gaaatggagg ataagaacat tattcaattt gtgcatggag aggaagacct gaaggttcag 180
catagtagct acagacagag ggcccggctg ttgaaggacc agctctccct gggaaatgct 240
gcacttcaga tcacagatgt gaaattgcag gatgcagggg tgtaccgctg catgatcagc 300
tatggtggtg ccgactacaa gcgaattact gtgaaagtca atgg 344
<210> 31
<211> 873
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 31
atgaggatat ttgctggcat tatattcaca gcctgctgtc acttgctacg ggcgtttact 60
gtcacggttc ccaaggacct atatgtggta gagtatggta gcaatatgac aattgaatgc 120
aaattcccag tagaaaaaca attagatctg gctgcactaa ttgtctattg ggaaatggag 180
gataagaaca ttattcaatt tgtgcatgga gaggaagacc tgaaggttca gcatagtagc 240
tacagacaga gggcccggct gttgaaggac cagctctccc tgggaaatgc tgcacttcag 300
atcacagatg tgaaattgca ggatgcaggg gtgtaccgct gcatgatcag ctatggtggt 360
gccgactaca agcgaattac tgtgaaagtc aatgccccat accgcaaaat caaccagaga 420
atttccgtgg atccagccac ttctgagcat gaactaatat gtcaggccga gggttatcca 480
gaagctgagg taatctggac aaacagtgac caccaacccg tgagtgggaa gagaagtgtc 540
accacttccc ggacagaggg gatgcttctc aatgtgacca gcagtctgag ggtcaacgcc 600
acagcgaatg atgttttcta ctgtacgttt tggagatcac agccagggca aaaccacaca 660
gcggagctga tcatcccaga actgcctgca acacatcctc cacagaacag gactcactgg 720
gtgcttctgg gatccatcct gttgttcctc attgtagtgt ccacggtcct cctcttcttg 780
agaaaacaag tgagaatgct agatgtggag aaatgtggcg ttgaagatac aagctcaaaa 840
aaccgaaatg atacacaatt cgaggagacg taa 873
<210> 32
<211> 3653
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 32
gaaatcgtgg tccccaagcc tcatgccagg ctgcacttgc acgtcgcggg ccagtctcct 60
cgcctgcaga tagttcccaa aacatgagga tatttgctgg cattatattc acagcctgct 120
gtcacttgct acgggcgttt actgtcacgg ttcccaagga cctatatgtg gtagagtatg 180
gtagcaatat gacaattgaa tgcaaattcc cagtagaaaa acaattagat ctggctgcac 240
taattgtcta ttgggaaatg gaggataaga acattattca atttgtgcat ggagaggaag 300
acctgaaggt tcagcatagt agctacagac agagggcccg gctgttgaag gaccagctct 360
ccctgggaaa tgctgcactt cagatcacag atgtgaaatt gcaggatgca ggggtgtacc 420
gctgcatgat cagctatggt ggtgccgact acaagcgaat tactgtgaaa gtcaatgccc 480
cataccgcaa aatcaaccag agaatttccg tggatccagc cacttctgag catgaactaa 540
tatgtcaggc cgagggttat ccagaagctg aggtaatctg gacaaacagt gaccaccaac 600
ccgtgagtgg gaagagaagt gtcaccactt cccggacaga ggggatgctt ctcaatgtga 660
ccagcagtct gagggtcaac gccacagcga atgatgtttt ctactgtacg ttttggagat 720
cacagccagg gcaaaaccac acagcggagc tgatcatccc agaactgcct gcaacacatc 780
ctccacagaa caggactcac tgggtgcttc tgggatccat cctgttgttc ctcattgtag 840
tgtccacggt cctcctcttc ttgagaaaac aagtgagaat gctagatgtg gagaaatgtg 900
gcgttgaaga tacaagctca aaaaaccgaa atgatacaca attcgaggag acgtaagcag 960
tgttgaaccc tctgatcgtc gattggcagc ttgtggtctg tgaaagaaag ggcccatggg 1020
acatgagtcc aaagactcaa gatggaacct gagggagaga accaagaaag tgttgggaga 1080
ggagcctgga acaacggaca ttttttccag ggagacactg ctaagcaagt tgcccatcag 1140
tcgtcttggg aaatggattg agggttcctg gcttagcagc tggtccttgc acagtgacct 1200
tttcctctgc tcagtgccgg gatgagagat ggagtcatga gtgttgaaga ataagtgcct 1260
tctatttatt ttgagtctgt gtgttctcac tttgggcatg taattatgac tggtgaattc 1320
tgacgacatg atagatctta agatgtagtc accaaactca actgctgctt agcatcctcc 1380
gtaactactg atacaagcag ggaacacaga ggtcacctgc ttggtttgac aggctcttgc 1440
tgtctgactc aaataatctt tatttttcag tcctcaaggc tcttcgatag cagttgttct 1500
gtatcagcct tataggtgtc aggtatagca ctcaacatct catctcatta caatagcaac 1560
cctcatcacc atagcaacag ctaacctctg ttatcctcac ttcatagcca ggaagctgag 1620
cgactaagtc acttgcccac agagtatcag ctctcagatt tctgttcttc agccactgtc 1680
ctttcaggat agaatttgtc gttaagaaat taatttaaaa actgattatt gagtagcatt 1740
gtatatcaat cacaacatgc cttgtgcact gtgctggcct ctgagcataa agatgtacgc 1800
cggagtaccg gtcggacatg tttatgtgtg ttaaatactc agagaaatgt tcattaacaa 1860
ggagcttgca ttttagagac actggaaagt aactccagtt cattgtctag cattacattt 1920
acctcatttg ctatccttgc catacagtct cttgttctcc atgaagtgtc atgaatcttg 1980
ttgaatagtt cttttatttt ttaaatgttt ctatttaaat gatattgaca tctgaggcga 2040
tagctcagtt ggtaaaaccc tttcctcaca agtgtgaaac cctgagtctt atccctagaa 2100
cccacataaa aaacagttgc gtatgtttgt gcatgctttt gatcccagca ctagggaggc 2160
agaggcaggc agatcctgag ctctcattga ccacccagcc tagcctacat ggttagctcc 2220
aggcctacag gagctggcag agcctgaaaa acgatgccta gacacacaca cacacacaca 2280
cacacacaca cacacacaca cacaccatgt actcatagac ctaagtgcac cctcctacac 2340
atgcacacac atacaattca aacacaaatc aacagggaat tgtctcagaa tggtccccaa 2400
gacaaagaag aagaaaaaca ccaaaccagc tctattccct cagcctatcc tctctactcc 2460
ttcctagaag caactactat tgtttttgta tataaattta cccaacgaca gttaatatgt 2520
agaatatata ttaaagtgtc tgtcaatata tattatctct ttctttcttt cttcctttct 2580
ttctttcttt ctttctttct ttctttcttt ctttctttct ttcttccttc cttccttcct 2640
tccttccttc cttccttcct ttctttcttt ctttcttttt ttctgtctat ctgtacctaa 2700
atggttgctc actatgcatt ttctgtgctc ttcgcccttt ttatttaatg tatggatatt 2760
tatgctgctt ccagaatgga tctaaagctc tttgtttcta ggttttctcc cccatccttc 2820
taggcatctc tcacactgtc taggccagac accatgtctg ctgcctgaat ctgtagacac 2880
catttataaa gcacgtactc accgagtttg tatttggctt gttctgtgtc tgattaaagg 2940
gagaccatga gtccccaggg tacactgagt taccccagta ccaaggggga gccttgtttg 3000
tgtctccatg gcagaagcag gcctggagcc attttggttt cttccttgac ttctctcaaa 3060
cacagacgcc tcacttgctc attacaggtt ctcctttggg aatgtcagca ttgctccttg 3120
actgctggct gccctggaag gagcccatta gctctgtgtg agcccttgac agctactgcc 3180
tctccttacc acaggggcct ctaagatact gttacctaga ggtcttgagg atctgtgttc 3240
tctgggggga ggaaaggagg aggaacccag aactttctta cagttttcct tgttctgtca 3300
catgtcaaga ctgaaggaac aggctgggct acgtagtgag atcctgtctc aaaggaaaga 3360
cgagcatagc cgaacccccg gtggaacccc ctctgttacc tgttcacaca agcttattga 3420
tgagtctcat gttaatgtct tgtttgtatg aagtttaaga aaatatcggg ttgggcaaca 3480
cattctattt attcatttta tttgaaatct taatgccatc tcatggtgtt ggattggtgt 3540
ggcactttat tcttttgtgt tgtgtataac cataaatttt attttgcatc agattgtcaa 3600
tgtattgcat taatttaata aatattttta tttattaaaa aaaaaaaaaa aaa 3653
<210> 33
<211> 290
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 33
Met Arg Ile Phe Ala Gly Ile Ile Phe Thr Ala Cys Cys His Leu Leu
1 5 10 15
Arg Ala Phe Thr Val Thr Val Pro Lys Asp Leu Tyr Val Val Glu Tyr
20 25 30
Gly Ser Asn Met Thr Ile Glu Cys Lys Phe Pro Val Glu Lys Gln Leu
35 40 45
Asp Leu Ala Ala Leu Ile Val Tyr Trp Glu Met Glu Asp Lys Asn Ile
50 55 60
Ile Gln Phe Val His Gly Glu Glu Asp Leu Lys Val Gln His Ser Ser
65 70 75 80
Tyr Arg Gln Arg Ala Arg Leu Leu Lys Asp Gln Leu Ser Leu Gly Asn
85 90 95
Ala Ala Leu Gln Ile Thr Asp Val Lys Leu Gln Asp Ala Gly Val Tyr
100 105 110
Arg Cys Met Ile Ser Tyr Gly Gly Ala Asp Tyr Lys Arg Ile Thr Val
115 120 125
Lys Val Asn Ala Pro Tyr Arg Lys Ile Asn Gln Arg Ile Ser Val Asp
130 135 140
Pro Ala Thr Ser Glu His Glu Leu Ile Cys Gln Ala Glu Gly Tyr Pro
145 150 155 160
Glu Ala Glu Val Ile Trp Thr Asn Ser Asp His Gln Pro Val Ser Gly
165 170 175
Lys Arg Ser Val Thr Thr Ser Arg Thr Glu Gly Met Leu Leu Asn Val
180 185 190
Thr Ser Ser Leu Arg Val Asn Ala Thr Ala Asn Asp Val Phe Tyr Cys
195 200 205
Thr Phe Trp Arg Ser Gln Pro Gly Gln Asn His Thr Ala Glu Leu Ile
210 215 220
Ile Pro Glu Leu Pro Ala Thr His Pro Pro Gln Asn Arg Thr His Trp
225 230 235 240
Val Leu Leu Gly Ser Ile Leu Leu Phe Leu Ile Val Val Ser Thr Val
245 250 255
Leu Leu Phe Leu Arg Lys Gln Val Arg Met Leu Asp Val Glu Lys Cys
260 265 270
Gly Val Glu Asp Thr Ser Ser Lys Asn Arg Asn Asp Thr Gln Phe Glu
275 280 285
Glu Thr
290
<210> 34
<211> 1625
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 34
atcatgtgga ataggtgcga ggcagaggtg agattttaat ggggaggaag cattgaaaag 60
tgaaagtgaa aattggatgc tctttgcttt gaagctttgc ctaaagcagg ttttagcttt 120
caaatacgtt tcaatgttga aagaacgcat gatacatatg gaggggggcc tggggggggt 180
ccttggctga gtttgaatgt acattaacaa tctggggggc taataactca atgtaaagct 240
gctgatccca tcatactgac ttctttccac ttggttctac atggctttga gttacaaaat 300
gaaagcattg aattttgaac tgttcagctg tgtttccaca cttgcaaatc ggttgttggc 360
cagccctcag aattgcttca gttacagctg gctcgtctgc tctttccaga ctggctttta 420
gggcttatgt atatatgaga aggacacatt tactagtgtc tccttgctct gctattgaaa 480
ttaagcagac ctctctgtgt ttcccgttac tagatagttc ccaaaacatg aggatatttg 540
ctggcattat attcacagcc tgctgtcact tgctacgggg taagtcacca aatcttttca 600
gtgggttcta tattttcaat attttagcta tgaattaaaa atggaagtaa tttgtggggt 660
gtgtatgtgt gtgtatatgt gtgtgtagag gggggtctgt gtgtatgtgc agttgctagg 720
cacacataaa gcgttcatag gacaacctag agcttagtcc tcaccttcta ccttgtttga 780
gacaaggtct cttatttgtt gtacattgct gagtcctgta gttcggctag ctcagaacct 840
cctgggggct ctcctgtctc cacctcccag tccactgaga ttgtaggcac atgctactgc 900
acctggcttc tacctggtct ctggggattt gaacttgggt ccatgggcta cacagcaagt 960
cgtttactta ctgggcaatc actccatccc ctaagataat tataaggaat ataccttgct 1020
tatccaaaca cattctcatt ctcctttgcc ataaataagt tacttggcaa atatattgta 1080
tgtattttta ataaataaat aaaatcttaa aaataaataa aattatttgt gaagacaaaa 1140
aaaataagtt acttggaaag gatgaaggaa aatactggag ctttgggtgt ggtttagtag 1200
tagaacactt ggctgatgta aaaaaaaagc cctaggtgca atcccaacac cagaaacaaa 1260
tgaaggaatg aacaacaacc gcccccaccc cccaggggat gaatataaaa atatcaggta 1320
atacagaact aacaggtgat ccgtttccta tgaataacta ctgaacattc ccagggaggt 1380
ggcccactga taatatattt ttatttattg gttcctttta aacaagactg ggaatatatt 1440
atctagcttg catcaccacc accacccccc acccccgccc catgaagtta tttcaaagaa 1500
gaattttagt gttcatgtga ttccctaaat aaaatgatag taacctttta cccaggtttt 1560
cagatgtgtt tggaggagtt ttctgtcttc tgagggctgg tcctctttcc ttttcagcgt 1620
ttact 1625
<210> 35
<211> 53
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 35
gaataccttt aagaaggaga tatacatgat catgtggaat aggtgcgagg cag 53
<210> 36
<211> 39
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 36
gaaccgtgac agtaaacgct gaaaaggaaa gaggaccag 39
<210> 37
<211> 324
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 37
gtcacggttc ccaaggacct atatgtggta gagtatggta gcaatatgac aattgaatgc 60
aaattcccag tagaaaaaca attagatctg gctgcactaa ttgtctattg ggaaatggag 120
gataagaaca ttattcaatt tgtgcatgga gaggaagacc tgaaggttca gcatagtagc 180
tacagacaga gggcccggct gttgaaggac cagctctccc tgggaaatgc tgcacttcag 240
atcacagatg tgaaattgca ggatgcaggg gtgtaccgct gcatgatcag ctatggtggt 300
gccgactaca agcgaattac tgtg 324
<210> 38
<211> 51
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 38
ctctttcctt ttcagcgttt actgtcacgg ttcccaagga cctatatgtg g 51
<210> 39
<211> 54
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 39
cccaatagac aattagtgca gccagatcta attgtttttc tactgggaat ttgc 54
<210> 40
<211> 35
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 40
caattagatc tggctgcact aattgtctat tggga 35
<210> 41
<211> 43
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 41
cttaccattg actttcacag taattcgctt gtagtcggca cca 43
<210> 42
<211> 1153
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 42
aaagtcaatg gtaagaatta ccctggatgg ggaaggcttc atccgtattt aaaacagctc 60
cctaatgttg agagctcttc attcttgaga gttcgcacgc acttctcaca gaacaacagc 120
agcctgttct tctcgctcgt ttgttcattc gttcgttcac acacttcacc agtgaaaaag 180
cctagcactg tgtgtttgat agtaacttga gattcagtac cagataatac tcagccatgc 240
tttgcagtca gtaccatgat cttgcaaagg tgaaatgcca ggtgtttgtt tcttatcata 300
aatgcaatat ataatatatt acatagatgt atagatataa ctgtgtaaca tgcaataaga 360
tataatatgc atatatttca tataacataa tgtataatat ataatgtata ataatatata 420
ctacaatata tagttatatg catagttata tattgcattt atgataaaaa gcaaacacct 480
ggcatttcac ttttgcaagc tttttgaatt acttgtaaat atatatacat gcaaacatac 540
atacacacac atgttttttt acaagtaatt tgaatgtcat ggaaagaaat agaatcataa 600
aaatgtccct cctccctaac taccatcttc taagcataaa tatacagtaa ctactatttg 660
tacatccctc catgactttt tgattggatt actgtttata tttaatctat caggcttagc 720
acattttctt tcctttgaat acctccatac aaaattcaat gtgtgtttat atatatatgt 780
atatatatag ttatatcata tcatatatca tacaaagttt tatatatgta tacatatata 840
aacacacata tctacacata catacacatt ttttatatat atacacaata tataatgtat 900
atgtgtgtgt gtgtgcatat acctctatat ctatctatct atctatctat ctatctatct 960
atctatctat ctatctatag cttctactgt aagggtcact ttttaaaaaa ttaaggttaa 1020
tctatgaagg atgagaagtg aagatcttaa gtgtagaaga agccgttctt ccacagagat 1080
ggtacaggct acactcagca ggcatgcatt cattttcagg gcctgcatct ctgggagtgc 1140
tgaggaggaa cta 1153
<210> 43
<211> 45
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 43
gcgaattact gtgaaagtca atggtaagaa ttaccctgga tgggg 45
<210> 44
<211> 53
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 44
gcgtcggttg ttagcagccg gatctcagta gttcctcctc agcactccca gag 53
<210> 45
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 45
tggaagaatg gctcctgttt cccac 25
<210> 46
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 46
cacccctgca tcctgcaatt tcaca 25
<210> 47
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 47
attagatctg gctgcactaa ttgtc 25
<210> 48
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 48
atgagtgaag ctctcaggtc tatgc 25
<210> 49
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 49
atcatgtgga ataggtgcga ggcag 25
<210> 50
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 50
gaaagagcag acgagccagc tgtaa 25
<210> 51
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 51
cagactaaca ctcactccct gctgc 25
<210> 52
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 52
aaacatcatt cgctgtggcg ttgac 25
<210> 53
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 53
ctggacctgc ttgcgttagt 20
<210> 54
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 54
cgtctgtgat ctgaagggca 20
<210> 55
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 55
ttagatctgg ctgcactaat 20
<210> 56
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 56
agtgcagcat ttcccaggga 20
<210> 57
<211> 45
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 57
gcatcaagct tggtaccgat aggtgcaatc ccaacaccag aaaca 45
<210> 58
<211> 45
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 58
acttaatcgt ggaggatgat agtgcgtgcg aactctcaag aatga 45
<210> 59
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 59
ccagggaggt ggcccactga taata 25
<210> 60
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 60
actaacgcaa gcaggtccag ctccc 25
<210> 61
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 61
cttccacatg agcgtggtca gggcc 25
<210> 62
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 62
ccaagggact attttagatg ggcag 25
<210> 63
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 63
gaagctacaa gctcctaggt aggggg 26
<210> 64
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 64
acgggttggc tcaaaccatt aca 23
<210> 65
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 65
cctggctcac agtgtcagag 20
<210> 66
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 66
cagggctctc ctcgattttt 20
<210> 67
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 67
ccctgctcgt ggtgaccgaa 20
<210> 68
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 68
gcaggctctc tttgatctgc 20