发明内容
为了解决上述问题,本发明利用创造性劳动筛选设计独特的sgRNA序列,使非人动物BTLA基因的特定片段被人BTLA基因特定片段替换,本发明成果得到世界首例BTLA基因人源化小鼠。成功制备BTLA基因人源化的模式动物,该模型体内可正常表达BTLA嵌合蛋白,可用于BTLA基因功能研究、靶向BTLA人源抗体的筛选和评价。
利用本发明制备的动物模型可用于针对人BTLA靶位点的药物筛选、药效研究,免疫相关疾病和肿瘤治疗等应用,加快新药研发过程,节约时间和成本,降低药物开发风险。对于研究BTLA蛋白的功能和肿瘤药物筛选等提供了有力工具。
同时还得到基因敲除动物模型,以及利用本模型可以与其它人源化动物模型(包括但不限于,人源化PD-1动物模型)交配得到双基因人源化动物模型或多基因人源化动物模型,可用于联合用药情况下筛选抗体及联合用药的药效评价等。
本发明的第一方面,涉及一种靶向载体,其包含:a)与待改变的转换区5’端同源的DNA片段(5’臂/受体),其选自BTLA基因基因组DNA的100-10000个长度的核苷酸;b)期望的供体DNA序列,其编码供体转换区;和c)与待改变的转换区3’端同源的第二个DNA片段(3’臂/受体),其选自BTLA基因基因组DNA的100-10000个长度的核苷酸。
优选的,所述的靶向载体,其中a)与待改变的转换区5’端同源的DNA片段(5’臂/受体)选自与NCBI登录号为NC_000082.6至少具有90%同源性的核苷酸,更优选的,所述与待改变的转换区5’端同源的DNA片段(5’臂/受体)选自NCBI登录号为NC_000082.6的第45237539-45239051位核苷酸;c)与待改变的转换区3’端同源的第二个DNA片段(3’臂/受体)选自NCBI登录号为NC_000082.6至少具有90%同源性的核苷酸,更优选的,所述与待改变的转换区3’端同源的第二个DNA片段(3’臂/受体)选自NCBI登录号为NC_000082.6的第45239358-45240854位核苷酸。
优选的,所述的靶向载体,其中,a)与c)中选择的基因组核苷酸的长度分别为500-1500bp。优选的,长度大约为1.5kb。更优选的,分别为1513bp和1497bp。
优选的,所述的靶向载体,所述的待改变的转换区分别位于BTLA基因第2外显子。
优选的,所述的靶向载体,其中5’臂序列如SEQ ID NO:32所示。
优选的,所述的靶向载体,其中3’臂序列如SEQ ID NO:38所示。
优选的,所述的靶向载体,所述靶向载体还包括可选择的基因标记。
优选的,所述期望的供体DNA序列来自人。优选的,所述期望的供体DNA序列为人BTLA基因的核苷酸序列部分或全部。进一步优选的,所述人BTLA基因的核苷酸序列包括人BTLA基因DNA序列的第一外显子、第二外显子、第三外显子、第四外显子和/或第五外显子中的一个或多个。
优选的,所述的靶向载体,其中所述人源BTLA的核苷酸序列编码NCBI登录号NM_181780.3和NM_001085357.1所示人源BTLA蛋白的部分或全部序列;人源DNA片段选自NCBI登录号为NC_000003.12的第112479758-112479462位核苷酸。
优选的,所述的靶向载体,其中期望的转换区序列如SEQ ID NO:35所示。
本发明的第二方面,涉及一种用于构建人源化非人动物的sgRNA序列,所述sgRNA序列靶向非人动物Btla基因,同时所述sgRNA在待改变的非人动物Btla基因上的靶序列上是唯一的,且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则。
优选的,所述非人动物为啮齿动物。更优选的,所述啮齿动物为小鼠。
优选的,所述sgRNA在小鼠Btla基因的靶位点位于小鼠Btla基因的第2外显子上。
更优选的,sgRNA靶向的5’端靶位点的序列如SEQ ID NO:1-8任一项所示,sgRNA靶向的3’端靶位点的序列如SEQ ID NO:9-14任一项所示。
进一步优选的,sgRNA靶向的5’端靶位点的序列如SEQ ID NO:1所示,sgRNA靶向的3’端靶位点的序列如SEQ ID NO:14所示。
本发明进一步涉及一种用于构建人源化动物模型的sgRNA序列,其上游序列如SEQID NO:15所示,下游序列如SEQ ID NO:17所示,所述sgRNA序列识别5’端靶位点。
本发明进一步涉及一种用于构建人源化动物模型的sgRNA序列,其上游序列如SEQID NO:16所示,其由在SEQ ID NO:15的5’端加上TAGG得到,下游序列如SEQ ID NO:18所示,其由在SEQ ID NO:17的5’端加上AAAC得到,所述sgRNA序列识别5’端靶位点。
本发明进一步涉及一种用于构建人源化动物模型的sgRNA序列,其上游序列如SEQID NO:19所示,下游序列如SEQ ID NO:21所示,所述sgRNA序列识别3’端靶位点。
本发明进一步涉及一种用于构建人源化动物模型的sgRNA序列,其上游序列如SEQID NO:20所示,其由在SEQ ID NO:19的5’端加上TAGG得到,下游序列如SEQ ID NO:22所示,其由在SEQ ID NO:21的5’端加上AAAC得到,所述sgRNA序列识别3’端靶位点。
本发明第三方面提供一种包含上述所述的sgRNA序列的构建体。
本发明第四方面提供一种制备sgRNA载体的方法,包括以下步骤:
(1)提供一种sgRNA序列,制备获得正向寡核苷酸序列和反向寡核苷酸序列,所述sgRNA序列靶向非人动物Btla基因,同时所述sgRNA在待改变的非人动物Btla基因上的靶序列上是唯一的,且符合5’-NNN(20)-NGG3’或5’-CCN-N(20)-3’的序列排列规则;
(2)合成含有T7启动子及sgRNA scaffold的片段DNA,并将所述片段DNA通过EcoRI和BamHI酶切连接至骨架载体上,经测序验证,获得pT7-sgRNA载体;
(3)将步骤(1)获得的正向寡核苷酸和反向寡核苷酸变性、退火,形成可以连入步骤(2)所述的pT7-sgRNA载体的双链;
(4)将步骤(3)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNA载体进行链接,筛选获得sgRNA载体。
优选的,所述制备sgRNA载体的方法,包括以下步骤:
(1)将序列如SEQ ID NO:1-8所示的任一项sgRNA靶序列和/或SEQ ID NO:9-14所示的任一项sgRNA靶序列,制备获得正向寡核苷酸序列和反向寡核苷酸序列;
优选的,所述sgRNA靶序列为SEQ ID NO:1和SEQ ID NO:14,获得的正向寡核苷酸序列如SEQ ID NO:16或SEQ ID NO:20所示;反向寡核苷酸序列如SEQ ID NO:18或SEQ IDNO:22所示,其中SEQ ID NO:16和SEQ ID NO:18为A组,SEQ ID NO:20和SEQ ID NO:22为B组;
(2)合成含有T7启动子及sgRNA scaffold的片段DNA,其中含有T7启动子及sgRNAscaffold的片段DNA如SEQ ID NO:23所示,将上述片段通过EcoRI和BamHI酶切连接至骨架载体上,经测序验证,获得pT7-sgRNA载体;
(3)分别合成步骤(1)中所述的正向寡核苷酸和反向寡核苷酸,优选为A组和B组中的正向寡核苷酸和反向寡核苷酸,将合成的sgRNA寡聚核苷酸变性、退火,形成可以连入步骤(2)所述的pT7-sgRNA载体的双链;
(4)将步骤(3)中退火的双链sgRNA寡聚核苷酸分别与pT7-sgRNA载体进行链接,筛选获得sgRNA载体。
本发明第五方面提供一种细胞,所述细胞包含上述任一所述的靶向载体、一种或多种上述任一的构建体和/或一种或多种上述构建体的体外转录产物。
优选的,所述细胞包含上述任一所述的靶向载体和一种或多种上述任一构建体的体外转录产物。
本发明进一步涉及所述的细胞,该细胞包括Cas9mRNA或其体外转录产物。
本发明进一步涉及所述的细胞,其中,所述细胞中的基因是杂合的。
本发明进一步涉及所述的细胞,其中,所述细胞中的基因是纯合的。
本发明进一步涉及所述的细胞,其中,所述非人动物细胞是啮齿类动物,进一步优选为小鼠。
本发明进一步涉及所述的细胞,其中,所述细胞为受精卵细胞;优选的,所述受精卵来源于任何非人类动物;进一步优选的,所述受精卵细胞来源于啮齿类动物;最优选的,所述受精卵选自C57BL/6受精卵、FVB/N受精卵、129受精卵、BALB/c受精卵、DBA/1受精卵或DBA/2受精卵。
本发明第六方面提供一种上述的靶向载体、上述的sgRNA序列、上述的构建体或上述的细胞在构建包含BTLA基因人源化的非人动物或其子代中的应用。
本发明的第七方面,提供一种构建BTLA基因人源化的非人动物或其子代的方法,所述方法包括导入人BTLA基因、使得该人BTLA基因在非人动物或其子代细胞中表达并且促进该细胞产生人源化的BTLA蛋白,同时降低或消除了非人动物或其子代的体内内源/动物来源的Btla基因的表达。
优选的,所述方法包括:
(a)构建含有人BTLA基因的载体,通过基因工程方法将所述人BTLA基因的载体导入非人动物的基因组,使得非人动物基因组中的内源/动物来源的Btla基因缺失或使得内源/动物来源的Btla蛋白不表达或不具有功能;并且
(b)在所述非人动物或其子代体内表达人源化BTLA蛋白。
优选的,所述动物基因组中包括人源化BTLA基因,所述人源化BTLA基因编码的蛋白包括胞外区、跨膜区以及胞内参与信号传导的区域,其中编码胞内参与信号传导的人源化BTLA基因的区域为动物来源,编码胞外区的人源化BTLA基因的区域包含人BTLA基因的全部或部分片段,同时该动物来源部分和人源部分通过序列拼接连接于动物内源的Btla启动子后。优选的,编码跨膜区的人源化BTLA基因的区域为动物来源。
优选的,修饰/改造后的非人动物包含内源/动物来源的BTLA基因的人源化序列或片段,其中所述人源化序列或片段包含内源/动物来源的Btla基因座,用人BTLA胞外域编码序列取代内源/动物来源的Btla胞外域编码序列的部分或全部。
本发明所述的方法中,动物来源的BTLA包括动物来源Btla基因的第1号外显子的全部序列、第2号外显子的部分序列、第3号外显子及其后所有外显子的全部序列;和/或人BTLA基因部分为编码人类BTLA多肽的氨基酸的第2号外显子的部分或全部序列;
优选的,所述的动物来源的BTLA基因为啮齿类动物来源的Btla基因;进一步优选的,所述啮齿类动物为小鼠;最优选的,所述小鼠Btla的mRNA序列的全部或部分片段如SEQID NO:24中的全部或部分片段所示,所述小鼠Btla的蛋白序列的全部或部分片段如SEQ IDNO:25中的全部或部分片段所示。
优选的,所述的人BTLA基因的全部或部分片段的人BTLA mRNA序列如SEQ ID NO:26或SEQ ID NO:67中的全部或部分片段所示,所述人BTLA蛋白全部或部分片段的序列如SEQ ID NO:27或SEQ ID NO:68中的全部或部分片段所示。
优选的,所述人源化BTLA基因包括将动物来源的Btla的第2号外显子全部或部分序列替换为人源BTLA的第2号外显子全部或部分序列,其中,使用sgRNA靶向动物的的Btla基因,所述用sgRNA靶向的5’端靶位点序列如SEQ ID NO:1-8任一项所示,3’端靶位点序列如SEQ ID NO:9-14任一项所示。
优选的,所述动物为啮齿类动物。进一步优选的,所述啮齿类动物为小鼠。
本发明还涉及一种Btla敲除动物模型构建的方法,将动物体内的Btla的第2号外显子全部或部分敲除,使得内源Btla蛋白失活;其中,使用sgRNA靶向动物的Btla基因,所述sgRNA靶向的5’端靶位点如SEQ ID NO:1-8任一项所示,3’端靶位点的序列如SEQ ID NO:9-14任一项所示。
优选的,所述动物用作动物模型。优选的,所述动物模型为荷瘤非人类哺乳动物模型。
本发明所述的Btla基因敲除动物模型的制备方法,包括以下步骤:
第一步:按照上述所述的步骤(1)-(4),获得sgRNA载体;
第二步:将sgRNA载体的体外转录产物和Cas9mRNA进行混合,获得混合液,将混合液注射至小鼠受精卵细胞质或细胞核中,将注射后的受精卵转移至培养液中进行培养,然后移植至受体母鼠的输卵管中发育,得到F0代小鼠;
第三步:将F0代小鼠利用PCR技术进行检验,验证细胞中的Btla基因被敲除,获得Btla基因敲除阳性小鼠;
第四步:将第三步筛选的阳性小鼠通过杂交和自交的方式,扩大种群数量,建立稳定的Btla-/-小鼠;
优选的,所述第三步中使用的PCR检测引物对序列如SEQ ID NO:41-44所示。
优选的,本发明所述人源化动物的构建方法包括如下步骤:
(a)提供一种上述的细胞,优选的所述细胞为受精卵细胞;
(b)将所述细胞在培养液中进行培养;
(c)将培养后细胞移植至受体雌性非人类哺乳动物的输卵管内,允许所述细胞在所述雌性非人类哺乳动物的子宫中发育;优选的,所述步骤(c)中的非人类哺乳动物为假孕雌性。
(d)鉴定步骤(c)的怀孕雌性的后代基因改造人源化非人类哺乳动物中的种系传递。
优选的,所述非人类哺乳动物是啮齿类动物;所述非人类哺乳动物细胞是啮齿类动物细胞。进一步优选的,所述啮齿类动物细胞是小鼠细胞;更优选的,所述小鼠为C57BL/6小鼠。
优选的,使用基因编辑技术进行BTLA基因人源化动物模型的建立,所述基因编辑技术包括但不限于基于胚胎干细胞的基因同源重组技术、CRISPR/Cas9、锌指核酸酶技术、转录激活子样效应因子核酸酶技术、归巢核酸内切酶或其他分子生物学技术。进一步优选的,使用基于CRISPR/Cas9的基因编辑技术进行BTLA基因人源化动物模型的建立。
本发明第八方面提供一种人源化BTLA蛋白,所述选自下列组中的一种:
a)所述氨基酸序列如SEQ ID NO:31所示;
b)由核酸序列编码的氨基酸序列,所述核酸序列在低严谨条件下,与编码SEQ IDNO:31所示的氨基酸的核苷酸序列杂交;
c)所述氨基酸序列与SEQ ID NO:31所示的氨基酸的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
d)所述氨基酸序列与SEQ ID NO:31所示的氨基酸的差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
e)所述氨基酸序列具有SEQ ID NO:31所示的,包括取代、缺失和/或插入一个或多个氨基酸的氨基酸序列。
本发明所述的嵌合BTLA蛋白,选自下列组中的一种:
a)嵌合BTLA蛋白序列中编码人BTLA蛋白的mRNA序列如SEQ ID NO:26或SEQ IDNO:67所示的序列的部分或全部所示;
b)嵌合BTLA蛋白序列中编码人BTLA蛋白的mRNA序列与SEQ ID NO:26或SEQ IDNO:67所示的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
c)嵌合BTLA蛋白序列中编码人BTLA蛋白的mRNA序列与SEQ ID NO:26或SEQ IDNO:67所示的核苷酸序列杂交;
d)嵌合BTLA蛋白序列中编码人BTLA蛋白的mRNA序列与SEQ ID NO:26或SEQ IDNO:67所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
e)嵌合BTLA蛋白序列中编码人BTLA蛋白的mRNA序列具有与SEQ ID NO:26或SEQID NO:67所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
f)嵌合BTLA蛋白序列中人BTLA的蛋白序列如SEQ ID NO:27或SEQ ID NO:68部分或全部序列所示;
g)嵌合BTLA蛋白序列中人BTLA的蛋白序列与SEQ ID NO:27或SEQ ID NO:68所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)嵌合BTLA蛋白序列中编码人BTLA的蛋白序列的核酸序列在严格条件下,与SEQID NO:27或SEQ ID NO:68所示的蛋白序列的核苷酸序列杂交;
i)嵌合BTLA蛋白序列中人BTLA的蛋白序列与SEQ ID NO:27或SEQ ID NO:68所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
g)嵌合BTLA蛋白序列中人BTLA的蛋白序列具有SEQ ID NO:27或SEQ ID NO:68所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列;
或
k)嵌合BTLA蛋白的核苷酸编码序列为SEQ ID NO:29所示的序列的部分或全部;
l)嵌合BTLA蛋白的核苷酸编码序列与SEQ ID NO:29所示的核苷酸序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
m)嵌合BTLA蛋白的核苷酸编码序列在严格条件下,与SEQ ID NO:29所示的核苷酸序列杂交;
n)嵌合BTLA蛋白的核苷酸编码序列与SEQ ID NO:29所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
p)嵌合BTLA蛋白的核苷酸编码序列具有SEQ ID NO:29所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
q)嵌合BTLA的mRNA序列为SEQ ID NO:30所示的序列的部分或全部;
r)嵌合BTLA的mRNA序列与SEQ ID NO:30所示的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
s)嵌合BTLA的mRNA序列与SEQ ID NO:30所示的核苷酸序列杂交;
t)嵌合BTLA的mRNA序列与SEQ ID NO:30所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
u)嵌合BTLA的mRNA序列具有与SEQ ID NO:30所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列;
或
v)嵌合BTLA的蛋白序列为SEQ ID NO:31的部分或全部;
w)嵌合BTLA的蛋白序列与SEQ ID NO:31所示氨基酸的序列同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
x)编码嵌合BTLA蛋白的核酸序列在严格条件下,与编码SEQ ID NO:31所示的蛋白的核苷酸序列杂交;
y)嵌合BTLA的蛋白序列与SEQ ID NO:31所示的氨基酸的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个氨基酸;
z)嵌合BTLA的蛋白序列具有SEQ ID NO:31所示的,包括取代、缺失和/或插入一个或多个氨基酸残基的氨基酸序列;
或
A1)嵌合BTLA蛋白中编码嵌合BTLA蛋白的核苷酸的部分序列为SEQ ID NO:28所示的序列的部分或全部;
B1)嵌合BTLA蛋白中编码嵌合BTLA蛋白的核苷酸部分序列与SEQ ID NO:28所示的核苷酸序列的部分或全部的同一性程度为至少大约为90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
C1)嵌合BTLA蛋白中编码嵌合BTLA蛋白的核苷酸部分序列在严格条件下,与SEQID NO:28所示的核苷酸序列杂交;
D1)嵌合BTLA蛋白中编码嵌合BTLA蛋白的核苷酸部分序列与SEQ ID NO:28所示的序列差异不超过10、9、8、7、6、5、4、3、2或不超过1个核苷酸;
E1)嵌合BTLA蛋白中编码嵌合BTLA蛋白的核苷酸部分序列具有SEQ ID NO:28所示的,包括取代、缺失和/或插入一个或多个核苷酸的核苷酸序列。
本发明进一步涉及一种表达所述蛋白序列的构建体。
本发明进一步涉及一种包含所述构建体的细胞。
本发明进一步涉及一种包含所述细胞的组织。
本发明第九方面提供一种人源化的BTLA基因,所述基因选自下列组中的一种:
a)所述基因编码上述所述嵌合小鼠BTLA的蛋白序列;
b)嵌合BTLA的mRNA序列如SEQ ID NO:30所示;
c)嵌合BTLA的mRNA序列在严格条件下,与SEQ ID NO:30所示的核苷酸杂交的基因序列;
d)嵌合BTLA的mRNA序列与SEQ ID NO:30所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列;
和/或
e)编码嵌合BTLA的蛋白的基因序列,所述蛋白与SEQ ID NO:31所示的氨基酸的同一性程度为至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
f)编码嵌合BTLA的蛋白的基因序列,所述蛋白的序列与SEQ ID NO:31的差异不超过10、9、8、7、6、5、4、3、2或1个氨基酸残基;
g)编码嵌合BTLA的蛋白的基因序列,所述蛋白具有SEQ ID NO:31所示的,包括取代、缺失和/或插入一个或多个氨基酸的氨基酸序列;
和/或
h)嵌合BTLA的基因序列如SEQ ID NO:28所示;
i)嵌合BTLA的基因序列在严格条件下,与SEQ ID NO:28所示的核苷酸杂交的基因序列;
j)嵌合BTLA的基因序列与SEQ ID NO:28所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列;
和/或
k)嵌合BTLA的基因序列如SEQ ID NO:29所示;
l)嵌合BTLA的基因序列在严格条件下,与SEQ ID NO:29所示的核苷酸杂交的基因序列;
m)嵌合BTLA的基因序列与SEQ ID NO:29所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列。
本发明所述基因选自下列组中的一种:
a)所述基因编码上述所述人源化BTLA蛋白序列;
b)所述基因序列转录的mRNA序列如SEQ ID NO:30所示;
c)所述基因的CDS编码序列如SEQ ID NO:29所示;
d)在低严谨条件下,与SEQ ID NO:30或SEQ ID NO:29所示的核苷酸杂交的基因序列;
e)所述基因序列转录的mRNA序列与SEQ ID NO:30或SEQ ID NO:29所示的核苷酸具有至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性程度的基因序列。
更优选的,所述的编码嵌合BTLA蛋白的基因,其中嵌合小鼠BTLA DNA的非模板链、编码链或有义链包含序列SEQ ID NO:35。
优选的,所述基因序列选自:
a)所述DNA编码前述人源化小鼠BTLA氨基酸序列;
b)所述DNA序列如SEQ ID NO:30所示;
c)所述DNA的CDS编码序列如SEQ ID NO:29所示;
d)在低严谨条件下,与SEQ ID NO:30或SEQ ID NO:29所示的核苷酸杂交的DNA序列;
e)与SEQ ID NO:30或SEQ ID NO:29所示的核苷酸具有至少90%同一性程度的DNA序列;
f)编码氨基酸的DNA序列,所述氨基酸与SEQ ID NO:31所示的氨基酸具有至少90%的同一性程度;
g)编码氨基酸的DNA序列,所述氨基酸的SEQ ID NO:31所示的氨基酸的同一性程度为至少大约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%;
h)编码氨基酸的DNA序列,所述氨基酸的序列与SEQ ID NO:31的差异不超过10、9、8、7、6、5、4、3、2或1个氨基酸;
和/或
i)编码氨基酸的DNA序列,所述氨基酸具有SEQ ID NO:31所示的,包括取代、缺失和/或插入一个或多个氨基酸的氨基酸序列;
更优选的,SEQ ID NO:35所示序列为人源化小鼠BTLA DNA的非模板链,又被称为编码链或有义链。
上述人源化小鼠BTLA的基因组DNA序列,其转录获得的mRNA逆转录后得到的DNA序列,与前述基因序列一致或互补。
上述人源化的BTLA蛋白或基因亦可是构建方法中的人源化蛋白或基因DNA。
本发明第十方面提供一种由上述所述方法产生的非人哺乳动物或其子代。
本发明的第十一方面,提供一种制备多基因人源化动物模型的方法,包括如下步骤:
(a)利用上述所述构建BTLA基因人源化的非人动物或其子代的方法获得非人动物或其子代;
(b)将步骤(a)获得的动物与其他人源化动物交配或直接进行基因编辑/修饰,并进行筛选,得到多基因人源化动物模型。
优选的,所述多基因人源化动物可以是双基因人源化动物、三基因人源化动物、四基因人源化动物、五基因人源化动物、六基因人源化动物、七基因人源化动物、八基因人源化动物或九基因人源化动物。更优选的,所述多基因人源化动物可以是双基因人源化动物。
优选的,所述其他人源化动物可以为PD-1、PD-L1、OX-40人源化小鼠。
在本发明的一个实施例中,所述多基因人源化动物是双基因人源化动物,所述双人源化小鼠基因改造动物模型建立的方法,包括如下步骤:
(a)利用前述的一种建立BTLA基因人源化动物模型的方法获得BTLA基因基因改造人源化小鼠;
(b)将步骤(a)获得的基因改造人源化小鼠与其他人源化小鼠交配或直接进行基因编辑/修饰,,并进行筛选,得到双人源化小鼠模型。
优选的,将步骤(a)获得的基因改造人源化小鼠与PD-1人源化小鼠交配得到BTLA和PD-1双人源化小鼠模型。
本发明第十二方面提供上述方法产生的多基因人源化非人类哺乳动物或其后代。
本发明进一步涉及非人类哺乳动物,其基因组中含有人源基因。
本发明进一步涉及一种非人类哺乳动物,其中非人类哺乳动物是啮齿动物。
本发明进一步涉及一种非人类哺乳动物,其中非人类哺乳动物是小鼠。
本发明进一步涉及一种非人类哺乳动物,所述非人类哺乳动物表达人源化BTLA基因编码的蛋白质。
本发明还涉及根据上述所述的方法产生的非人类哺乳动物或其子代。
本发明第十三方面提供一种通过上述所述的任一方法制备获得的一种非人类动物在制备荷瘤动物模型中的用途。
本发明进一步涉及一种荷瘤非人类哺乳动物模型,通过包括前述任一所述的方法制备获得。优选的,所述非人类哺乳动物是啮齿动物。进一步优选的,所述非人类哺乳动物是小鼠。
本发明的第十四方面,提供一种细胞或细胞系或原代细胞培养物,所述细胞或细胞系或原代细胞培养物来源于上述所述的方法制备得到的非人动物或其子代。
本发明的第十五方面,提供一种组织或器官,所述组织或器官来源于上述所述的方法制备得到的非人动物或其子代。优选的,所述组织或器官为脾脏、肿瘤或其培养物。
本发明进一步涉及一种来源于前述任一项的非人类哺乳动物或其后代或荷瘤非人类哺乳动物荷瘤后的瘤组织。
本发明的第十六方面,提供一种来源于上述所述的嵌合BTLA蛋白、上述所述的编码嵌合BTLA蛋白的基因、上述所述的方法产生的动物及子代、上述所述的细胞或细胞系或原代细胞培养物、上述所述的组织或器官在制备动物模型中的用途。
本发明的第十七方面,涉及一种来源于上述所述的嵌合BTLA蛋白、上述所述的编码嵌合BTLA蛋白的基因、上述所述的方法产生的动物及子代、上述所述的细胞或细胞系或原代细胞培养物、上述所述的组织或器官在与BTLA基因或者蛋白相关的领域中的应用。
优选的,所述应用包括但不仅限于在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用或在需要涉及人类细胞的免疫过程的生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用或在体内研究、人BTLA信号通路调节剂的筛选、药效检测、筛选文库、疗效评估、筛选、验证、评价或研究BTLA基因功能研究、人源BTLA抗体、针对人BTLA靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤药物方面的用途。
本发明进一步涉及一种前述任一项的非人类哺乳动物或其后代或荷瘤非人类哺乳动物、前述方法产生的动物模型在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用。
本发明进一步涉及一种前述的非人类哺乳动物或其后代或荷瘤非人类哺乳动物、前述任一项中的方法产生的动物模型在需要涉及人类细胞的免疫过程的生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用。
本发明进一步涉及一种前述任一项的非人类哺乳动物或其后代或荷瘤非人类哺乳动物、前述任一项中的方法产生的动物模型在筛选、验证、评价或研究BTLA基因功能研究、BTLA抗体、针对BTLA靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤药物方面的用途。
本发明还涉及使用上述方法产生的动物模型在需要涉及人类细胞的免疫过程的产品开发,制造人类抗体,或者作为药理学、免疫学、微生物学和医学研究的模型系统中的应用。
优选的,涉及使用上述方法产生的动物模型在需要涉及人类细胞的免疫过程的生产和利用动物实验疾病模型,用于病原学研究和/或用于开发新的诊断策略和/或治疗策略中的应用。
更优选的,涉及使用上述方法产生的动物模型在筛选、验证、评价或研究BTLA基因功能研究、BTLA抗体、针对人BTLA靶位点的药物、药效研究,免疫相关疾病药物以及抗肿瘤药物方面的用途。
优选的用于如上描述的方法的受精卵是C57BL/6受精卵。也可用于本发明方法中的本领域所使用的受精卵包括但不限于FVB/N受精卵、129受精卵、BALB/c受精卵、DBA/1受精卵和DBA/2受精卵。
受精卵可以来源于任何非人类动物。优选受精卵细胞来源于啮齿类。可以通过DNA的显微注射来向受精卵引入遗传构建体。例如,可以通过显微注射后培养受精卵、将培养的受精卵转移到假孕的非人类动物中并生育非人类哺乳动物来产生上文所述方法的非人类哺乳动物。
这里使用的术语“基因改造”描述人工引入并整合进生物的DNA产生的特定基因的蛋白质。这里使用的术语“基因改造动物”描述基因组中含有外源DNA的动物。此基因改造DNA可能整合在基因组的某处。
本发明还提供由以上描述的任何方法所产生的非人类哺乳动物。在本发明的一个实施方案中,提供非人类哺乳动物,所述基因改造动物基因组中含有编码人源BTLA的DNA。
在一个优选的实施方案中,本发明还涉及非人类哺乳动物的基因改造动物,所述动物基因组中含有外源DNA,所述DNA为上述所述的DNA或基因组DNA。其中所述基因改造可以是人工引入并整合进所述DNA表达特定基因的蛋白质。所述基因改造动物基因组中含有编码人源BTLA的DNA。所述DNA还包括特异的诱导物或阻遏物物质。
在另一个优选的实施方案中,本发明还涉及一种可稳定传代的人源化基因工程非人类哺乳动物,所述非人类哺乳动物能够表达人BTLA蛋白的细胞,所述蛋白为前述人源化小鼠BTLA蛋白。在另一个优选的实施方案中,非人类哺乳动物含有上述所描述的遗传构建体。在另一实施方案中,提供表达基因改造人源BTLA的非人类哺乳动物。在一个优选的实施方案中,组织特异性表达人源BTLA蛋白。
在另一实施方案中,基因改造动物中的人源BTLA的表达是可控的,如通过加入特异的诱导物或阻遏物物质。
非人类哺乳动物可以是任何本领域已知的、可以用于本发明方法的非人类动物。优选的非人类哺乳动物是哺乳动物,更优选的非人类哺乳动物是啮齿动物。本发明最优选的动物是小鼠。
本发明所述“治疗(treating)”(或“治疗(treat)”或“治疗(treatment)”)表示减缓、中断、阻止、控制、停止、减轻、或逆转一种体征、症状、失调、病症、或疾病的进展或严重性,但不一定涉及所有疾病相关体征、症状、病症、或失调的完全消除。术语“治疗(treating)”等是指在疾病已开始发展后改善疾病或病理状态的体征、症状等等的治疗干预。
本发明所述“同源性”,是指在使用蛋白序列或核苷酸序列的方面,本领域技术人员可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同源性。
本领域的技术人员能够确定并比较序列元件或同一性程度,以区分另外的小鼠和人序列。
在一个方面,所述非人动物是哺乳动物。在一个方面,所述非人动物是小型哺乳动物,例如跳鼠科或鼠总科超家族。在一个实施方式中,所述基因修饰的动物是啮齿动物。在一个实施方式中,所述啮齿动物选自小鼠、大鼠和仓鼠。在一个实施方式中,所述啮齿动物选自鼠家族。在一个实施方式中,所述基因修饰的动物来自选自丽仓鼠科(例如小鼠样仓鼠)、仓鼠科(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠总科(真小鼠和大鼠、沙鼠、刺毛鼠、冠毛大鼠)、马岛鼠科(登山小鼠、岩小鼠、有尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(例如多刺睡鼠)和鼹形鼠科(例如摩尔大鼠、竹大鼠和鼢鼠)家族。在一个特定实施方式中,所述基因修饰的啮齿动物选自真小鼠或大鼠(鼠总科)、沙鼠、刺毛鼠和冠毛大鼠。在一个实施方式中,所述基因修饰的小鼠来自鼠科家族成员。在一个实施方式中,所述动物是啮齿动物。在一个特定实施方式中,所述啮齿动物选自小鼠和大鼠。在一个实施方式中,所述非人动物是小鼠。
在一个特定实施方式中,所述非人动物是啮齿动物,其为选自BALB/c、A、A/He、A/J、A/WySN、AKR、AKR/A、AKR/J、AKR/N、TA1、TA2、RF、SWR、C3H、C57BR、SJL、C57L、DBA/2、KM、NIH、ICR、CFW、FACA、C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL、C58、CBA/Br、CBA/Ca、CBA/J、CBA/st、CBA/H品系的小鼠。
本发明所述“癌”选自下组,该组由以下各项组成:白血病、淋巴瘤、卵巢癌、乳腺癌、子宫内膜癌、结肠癌、直肠癌、胃癌、膀胱癌、肺癌、支气管癌、骨癌、前列腺癌、胰腺癌、肝和胆管癌、食管癌、肾癌、甲状腺癌、头颈部癌、睾丸癌、胶质母细胞瘤、星形细胞瘤、黑色素瘤、骨髓增生异常综合征、以及肉瘤。其中,所述的白血病选自下组,该组由以下各项组成:急性淋巴细胞性(成淋巴细胞性)白血病、急性骨髓性白血病、髓性白血病、慢性淋巴细胞性白血病、多发性骨髓瘤、浆细胞白血病、以及慢性骨髓性白血病;所述淋巴瘤选自下组,该组由以下各项组成:霍奇金淋巴瘤和非霍奇金淋巴瘤,包括B细胞淋巴瘤、弥漫性大B细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、边缘区B细胞淋巴瘤、T细胞淋巴瘤、和瓦尔登斯特伦巨球蛋白血症;并且所述肉瘤选自下组,该组由以下各项组成:骨肉瘤、尤文肉瘤、平滑肌肉瘤、滑膜肉瘤、腺泡状软组织肉瘤、血管肉瘤、脂肪肉瘤、纤维肉瘤、横纹肌肉瘤、以及软骨肉瘤。可以对上文描述的非人类哺乳动物进行临床表型分析和分子遗传学研究。本发明也涉及本发明提供的非人类哺乳动物与相同或其它基因型交配后产生的后代。
本发明还提供来源于本发明提供的非人类哺乳动物或其后代的细胞系或原代细胞培养物。可以通过两种方法制备基于细胞培养的模型。可以从非人类哺乳动物中分离细胞培养物,或从使用同样的构建体、经标准的细胞转染技术建立的细胞培养物中制备细胞培养物。可以通过多种方法检测含有编码人源BTLA蛋白的DNA序列的遗传构建体的整合。对于本领域技术人员而言,显然存在许多可以用来检测外源DNA表达的分析方法,包括在RNA水平的方法(包括通过逆转录酶聚合酶链式反应(RT-PCR)或通过Southern印迹、原位杂交的mRNA定量)和在蛋白质水平的方法(包括组织化学、免疫印迹分析和体外结合研究)。此外,可以通过本领域技术人员众所周知的ELISA技术来定量目的基因的表达水平。可以使用许多标准分析来完成定量测量。例如,可使用RT-PCR和包括RNA酶保护、Southern印迹分析、RNA斑点(RNAdot)分析在内的杂交方法测量转录水平。也可以使用免疫组织化学染色、细胞流式检测和Western印迹分析来评估是否存在人源BTLA蛋白质。
除非特别说明,本发明的实践将采取细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的传统技术。这些技术在以下文献中进行了详细的解释。例如:MolecularCloningALaboratoryManual,2ndEd.,ed.BySambrook,FritschandManiatis(ColdSpringHarborLaboratoryPress:1989);DNACloning,VolumesIandII(D.N.Glovered.,1985);OligonucleotideSynthesis(M.J.Gaited.,1984);Mullisetal.U.S.Pat.No.4,683,195;NucleicAcidHybridization(B.D.Hames&S.J.Higginseds.1984);TranscriptionAndTranslation(B.D.Hames&S.J.Higginseds.1984);CultureOfAnimalCells(R.I.Freshney,AlanR.Liss,Inc.,1987);ImmobilizedCellsAndEnzymes(IRLPress,1986);B.Perbal,APracticalGuideToMolecularCloning(1984);theseries,MethodsInENZYMOLOGY(J.AbelsonandM.Simon,eds.-in-chief,AcademicPress,Inc.,NewYork),specifically,Vols.154and155(Wuetal.eds.)andVol.185,″GeneExpressionTechnology″(D.Goeddel,ed.);GeneTransferVectorsForMammalianCells(J.H.MillerandM.P.Caloseds.,1987,ColdSpringHarborLaboratory);ImmunochemicalMethodsInCellAndMolecularBiology(MayerandWalker,eds.,AcademicPress,London,1987);HandbookOfExperimentalImmunology,VolumesV(D.M.WeirandC.C.Blackwell,eds.,1986);andManipulatingtheMouseEmbryo,(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1986)。
以上只是概括了本发明的一些方面,不是也不应该认为是在任何方面限制本发明。
本说明书提到的所有专利和出版物都是通过参考文献作为整体而引入本发明的。本领域的技术人员应认识到,对本发明可作某些改变并不偏离本发明的构思或范围。下面的实施例进一步详细说明本发明,不能认为是限制本发明或本发明所说明的具体方法的范围。
实施例9基于胚胎干细胞的制备方法
采用其它基因编辑系统和制备方法也可以得到本发明的非人哺乳动物,包括但不限于基于胚胎干细胞(embryonic stem cell,ES)的基因同源重组技术、锌指核酸酶(ZFN)技术、转录激活子样效应因子核酸酶(TALEN)技术、归巢核酸内切酶(兆碱基大范围核酶)或其他分子生物学技术。本实施例以传统的ES细胞基因同源重组技术为例,阐述如何采用其它方法制备获得BTLA基因人源化小鼠。
根据本发明的基因编辑策略和人源化小鼠BTLA基因示意图(图4),发明人设计了图24所示的打靶策略,图24中还显示了重组载体的设计。鉴于本发明的目的之一是将小鼠Btla基因的2号外显子全部或部分用人BTLA基因片段替换,为此,发明人设计了包含5’同源臂(3812bp)、3’同源臂(4169bp)和人源化基因片段(297bp)的重组载体,在重组载体上构建了用于阳性克隆筛选的抗性基因,如新霉素磷酸转移酶编码序列Neo,并在抗性基因的两侧装上两个同向排列的位点特异性重组系统,如Frt或LoxP重组位点。进一步的,还在重组载体3’同源臂下游构建了具有负筛选标记的编码基因,如白喉毒素A亚基的编码基因(DTA)。载体构建可采用常规方法进行,如酶切连接等。将构建正确的重组载体转染小鼠胚胎干细胞,如C57BL/6小鼠的胚胎干细胞,利用阳性克隆筛选标记基因对得到的重组载体转染细胞进行筛选,并利用Southern Blot技术进行DNA重组鉴定。将筛选出的正确阳性克隆按照《小鼠胚胎操作实验手册(第三版)》中的方法将阳性克隆细胞(黑色鼠)通过显微注射进入已分离好的囊胚中(白色鼠),注射后的嵌合囊胚转移至培养液中短暂培养,然后移植至受体母鼠(白色鼠)的输卵管,可生产F0代嵌合体鼠(黑白相间)。通过提取鼠尾基因组和PCR检测,挑选基因正确重组的F0代嵌合鼠用于后续繁殖和鉴定。将F0代嵌合鼠与野生型鼠交配获得F1代鼠,通过提取鼠尾基因组和PCR检测,挑选可以稳定遗传的基因重组阳性F1代杂合子小鼠。再将F1代杂合小鼠互相交配即可获得基因重组阳性F2代纯合子鼠。此外,可将F1代杂合鼠与Flp或Cre工具鼠交配去除阳性克隆筛选标记基因(neo等)后,再通过互相交配即可得到基因人源化纯合子小鼠。对获得的F1代杂合或F2代纯合鼠进行基因型和表型检测的方法与前述实施例5一致。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
序列表
<110> 北京百奥赛图基因生物技术有限公司
<120> 人源化基因改造动物模型的制备方法及应用
<130> 1
<160> 68
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cagtgcaact tactattacg 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ctcgtaatag taagttgcac 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtgacttggt gtaagcacaa 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tccaaacagt ctgccaggac 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ttcatagacc taatgtgact 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggaattccaa acagtctgcc 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tcctgtcctg gcagactgtt 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tttaaataac tctcctgtcc 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
tcagtaacca tccatgtgac 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tcacatggat ggttactgaa 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ccattatcac tgagatgtat 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
caatacatct cagtgataat 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ccaatacatc tcagtgataa 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tgagatgtat tggtttaaag 20
<210> 15
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tgcaacttac tattacg 17
<210> 16
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
taggtgcaac ttactattac g 21
<210> 17
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cgtaatagta agttgca 17
<210> 18
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aaaccgtaat agtaagttgc a 21
<210> 19
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
agatgtattg gtttaaag 18
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
taggagatgt attggtttaa ag 22
<210> 21
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctttaaacca atacatct 18
<210> 22
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aaacctttaa accaatacat ct 22
<210> 23
<211> 132
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60
agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
tttaaaggat cc 132
<210> 24
<211> 3235
<212> DNA/RNA
<213> 小鼠(Mouse)
<400> 24
ctgacacgtg ctgggaatga agacagtgcc tgccatgctt gggactcctc ggttatttag 60
ggaattcttc atcctccatc tgggcctctg gagcatcctt tgtgagaaag ctactaagag 120
gaatgatgaa gagtgtccag tgcaacttac tattacgagg aattccaaac agtctgccag 180
gacaggagag ttatttaaaa ttcaatgtcc tgtgaaatac tgtgttcata gacctaatgt 240
gacttggtgt aagcacaatg gaacaatctg tgtacccctt gaggttagcc ctcagctata 300
cactagttgg gaagaaaatc aatcagttcc ggtttttgtt ctccacttta aaccaataca 360
tctcagtgat aatgggtcgt atagctgttc tacaaacttc aattctcaag ttattaatag 420
ccattcagta accatccatg tgacagaaag gactcaaaac tcttcagaac acccactaat 480
aacagtatct gacatcccag atgccaccaa tgcctcagga ccatccacca tggaagagag 540
gccaggcagg acttggctgc tttacacctt gcttcctttg ggggcattgc ttctgctcct 600
tgcctgtgtc tgcctgctct gctttctgaa aaggatccaa gggaaagaaa agaagccttc 660
tgacttggca ggaagggaca ctaacctggt tgatattcca gccagttcca ggacaaatca 720
ccaagcactg ccatcaggaa ctggaattta tgataatgat ccctggtcta gcatgcagga 780
tgaatctgaa ttgacaatta gcttgcaatc agagagaaac aaccagggca ttgtttatgc 840
ttctttgaac cattgtgtta ttggaaggaa tccaagacag gaaaacaaca tgcaggaggc 900
acccacagaa tatgcatcca tttgtgtgag aagttaaacc tgccactgag ccaggcagcc 960
tacactgcat gagtgcctgt caatacctct gtctggacct tcagtttcaa ataaccttca 1020
acctggaaag tttcaattaa gatgctctgt gctggtgctg cgtcttaaag gtccatgaag 1080
tatttagtta aaatttctcc tgaaaacttt gggagagttt tgtacaagac agactcttcc 1140
ctgggaaaac tcatattacg aatagcagaa taatagggct tttaaaattg accatgtcgc 1200
accatgtcgt acccaatgtg tgaattcaat attttctttg gaactaccaa acagacttac 1260
aggggagaaa gaagcgtgtt atttggatct gctcactaca cattctagaa aaagaatggc 1320
ccagtttgac taactagtca taaatatagt aatgattgta tgctctcagt cagtcatgat 1380
aagacaatta cccatgtcaa tctatataga taatgcttta ttattttttt taatgtgaaa 1440
gaaaaattat cttggactca attcagaaaa agattagaaa gggtaattgg tataatacag 1500
atatagcata tgccagatag atgtggtgcc aacgatcctt atccccacca gtgagatgct 1560
caccttcagc tggcttgatt gagaaagtaa ggtaggtagt aaagggctca tccacatata 1620
gtgagtggat ttgcaatcag cgtggtagtg tttggatcaa gattaacgca catgaatgtg 1680
attcaatgct gctggattaa tatacatatg gtacgtatgg gcctatgaac aagtgtccat 1740
gggaatggat atattatcaa tctagagcga acttttagcc caccttttgc tttacgtgag 1800
agcaagctca aagggcaatt tatgaaagga gaatcttgaa tattgagttg atccgtaggg 1860
actggcatgc attcattaat gcctgtttct tgattctgag gaagtgaatc agaaaaaatc 1920
atatgtaatg aagtagggcc tatggagatc actcaggttt aaattctgac attgcagctg 1980
ttcaagaaga tgattatcag gtgttctgaa tttccggatt gagtctaatt acttaaaaat 2040
agctcataat tttattcatc agcttgaggc ttgagttctc agaccctaaa actgaataat 2100
ggcatagtct tagtatacag cagattgggc ctgagttaga agccactgga gcaaacacat 2160
aaactgtcta tgtaattgca tgcatatatg tgggtgtgcc tgtgcatgtg tgtgctagca 2220
tgcaaatgca agatgtgacg cctggaaata agacaagaga aaccagtcct tttgctgtgc 2280
tttttttagt ttgcttagaa ggtgcaaagt actagagaaa atgagtcatt tatagaaaat 2340
aacacgtaga ctggtgagaa tggaagggag ttgagaatgt atccataaac agtgaataaa 2400
gaggccttac tacacagctt ttctcaccta ctgctcacct cgggttccag ttccctgaat 2460
ctagaacaac aaacaatgtt ttcagacatg ttacaaccac ttctagttaa gcttgttcag 2520
gcaggtgcat ttgtgggaat ttatgcaaaa aagaccttag aatagctgct catcttcaaa 2580
atagaaacag gaaggatggg agggggatga gtactgcact ctgtctctct tatcagatca 2640
acaggcaact taagcaaatc tttcagaatt gtctccggct ttaaaaggaa aatacttcgc 2700
tctactctgt ttaaaacaat cttttaaaaa cgttgtgtgt acatgtatat ttgggtatgc 2760
atgtatgtgt gtatatggtg tatgtgcgtg gtgtacacac atgtgtatgc aggagccaga 2820
agagaaagtc aggcaccctt ttctattgca ctccacttta ttctgttaag ggaaggtctc 2880
tcattgaacc tggagctctg ctagcaagca gcaagccagc gatggatcct cccatccctg 2940
acccccacat tgctagacta tatttgctca tgcccagctt tttacaagga tgtggagaac 3000
tgaaattcag gtcctcatga ttgcataaca agcactctca cttactaagc atgttctaat 3060
atgttttaca atgaaagacg ctgctcaaga tttcacctca atgaatgatc aattctgttt 3120
gtaccttgtt tgccaatcac atagcattta tgctcttatt cctacttagt aaatatgtat 3180
gttgtagctc ctcaaataaa tttgttccag cattattttc atggttacct aactc 3235
<210> 25
<211> 306
<212> PRT
<213> 小鼠(Mouse)
<400> 25
Met Lys Thr Val Pro Ala Met Leu Gly Thr Pro Arg Leu Phe Arg Glu
1 5 10 15
Phe Phe Ile Leu His Leu Gly Leu Trp Ser Ile Leu Cys Glu Lys Ala
20 25 30
Thr Lys Arg Asn Asp Glu Glu Cys Pro Val Gln Leu Thr Ile Thr Arg
35 40 45
Asn Ser Lys Gln Ser Ala Arg Thr Gly Glu Leu Phe Lys Ile Gln Cys
50 55 60
Pro Val Lys Tyr Cys Val His Arg Pro Asn Val Thr Trp Cys Lys His
65 70 75 80
Asn Gly Thr Ile Cys Val Pro Leu Glu Val Ser Pro Gln Leu Tyr Thr
85 90 95
Ser Trp Glu Glu Asn Gln Ser Val Pro Val Phe Val Leu His Phe Lys
100 105 110
Pro Ile His Leu Ser Asp Asn Gly Ser Tyr Ser Cys Ser Thr Asn Phe
115 120 125
Asn Ser Gln Val Ile Asn Ser His Ser Val Thr Ile His Val Thr Glu
130 135 140
Arg Thr Gln Asn Ser Ser Glu His Pro Leu Ile Thr Val Ser Asp Ile
145 150 155 160
Pro Asp Ala Thr Asn Ala Ser Gly Pro Ser Thr Met Glu Glu Arg Pro
165 170 175
Gly Arg Thr Trp Leu Leu Tyr Thr Leu Leu Pro Leu Gly Ala Leu Leu
180 185 190
Leu Leu Leu Ala Cys Val Cys Leu Leu Cys Phe Leu Lys Arg Ile Gln
195 200 205
Gly Lys Glu Lys Lys Pro Ser Asp Leu Ala Gly Arg Asp Thr Asn Leu
210 215 220
Val Asp Ile Pro Ala Ser Ser Arg Thr Asn His Gln Ala Leu Pro Ser
225 230 235 240
Gly Thr Gly Ile Tyr Asp Asn Asp Pro Trp Ser Ser Met Gln Asp Glu
245 250 255
Ser Glu Leu Thr Ile Ser Leu Gln Ser Glu Arg Asn Asn Gln Gly Ile
260 265 270
Val Tyr Ala Ser Leu Asn His Cys Val Ile Gly Arg Asn Pro Arg Gln
275 280 285
Glu Asn Asn Met Gln Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val
290 295 300
Arg Ser
305
<210> 26
<211> 3216
<212> DNA/RNA
<213> 人(human)
<400> 26
gtctttctgt tcactttttt tcacaaaatc atccaggctc ttcctactct cctctcttac 60
cacctctctc ttcttttttt ttttttttta gttatttcac agatgccact ggggtaggta 120
aactgaccca actctgcagc actcagaaga cgaagcaaag ccttctactt gagcagtttt 180
tccatcactg atatgtgcag gaaatgaaga cattgcctgc catgcttgga actgggaaat 240
tattttgggt cttcttctta atcccatatc tggacatctg gaacatccat gggaaagaat 300
catgtgatgt acagctttat ataaagagac aatctgaaca ctccatctta gcaggagatc 360
cctttgaact agaatgccct gtgaaatact gtgctaacag gcctcatgtg acttggtgca 420
agctcaatgg aacaacatgt gtaaaacttg aagatagaca aacaagttgg aaggaagaga 480
agaacatttc atttttcatt ctacattttg aaccagtgct tcctaatgac aatgggtcat 540
accgctgttc tgcaaatttt cagtctaatc tcattgaaag ccactcaaca actctttatg 600
tgacagatgt aaaaagtgcc tcagaacgac cctccaagga cgaaatggca agcagaccct 660
ggctcctgta tagtttactt cctttggggg gattgcctct actcatcact acctgtttct 720
gcctgttctg ctgcctgaga aggcaccaag gaaagcaaaa tgaactctct gacacagcag 780
gaagggaaat taacctggtt gatgctcacc ttaagagtga gcaaacagaa gcaagcacca 840
ggcaaaattc ccaagtactg ctatcagaaa ctggaattta tgataatgac cctgaccttt 900
gtttcaggat gcaggaaggg tctgaagttt attctaatcc atgcctggaa gaaaacaaac 960
caggcattgt ttatgcttcc ctgaaccatt ctgtcattgg accgaactca agactggcaa 1020
gaaatgtaaa agaagcacca acagaatatg catccatatg tgtgaggagt taagtctgtt 1080
tctgactcca acagggacca ttgaatgatc agcatgttga catcattgtc tgggctcaac 1140
aggatgtcaa ataatatttc tcaatttgag aatttttact ttagaaatgt tcatgttagt 1200
gcttgggtct taagggtcca taggataaat gattaaaatt tctctcagaa acttatttgg 1260
gagcttttta tattatagcc ttgaataaca aaatctctcc aaaactggtt gacatcatga 1320
gtagcagaat agtagaacgt ttaaacttag ctacatttta cccaatatac aaactcgatc 1380
ttgcctttga agctattgga aagacttgta gggaaaagag gtttgtgtta cctgcatcag 1440
ttcactacac actcttgaaa acaaaatgtc ccaatttgac taaccaacca taaatacagt 1500
aatgattgta tatttcaagt cagtcttcca aaataagaaa tttttgctgt gtcagtctaa 1560
gaatggtgtt tcttaaatgc aaaggagaaa tcattttagg cttgatgtaa gaaaatgaaa 1620
ataataaatg gtgcaataaa aatatagaat ataccaattg gatatagggt agatgttcca 1680
catacctggc aaacaaatgc ttatatctac tctgttagat tgataagcaa atataggtat 1740
taatggagca gtcaacgtat agcacattta tgaggaaagt agagactcac tgggtcacat 1800
agactaatgg ataggaatgt gacataatgc tgctgaatta atatacttat gggcatctga 1860
atagtttaaa agttagtcag aataggtatc actgggcaag tgaagatagc ttaaactgct 1920
tcatgcttga cttgatagca agttaaagtg caattaatgg aatggaggaa aacccagaat 1980
atttaattgg tctgtagggg tcaatttgct ttcattcacc acatctgcat cttgctgttc 2040
ttcttactaa ggaatcaggg caaatcatct gtagtgacat attttagttt gctaatcatt 2100
tattttaaaa tactgaggtt gcagccactt aagagtatag caaaagatgg attcagattt 2160
ttggactttc caaagtactt gagttaaact atttcaaaaa tagcctataa ttttattcaa 2220
cagtttgagg ctattcgaat tctcaggtgc tgctactgaa taatgtaata gtcttcatac 2280
aaagtggata gcaaaggtta aaatccattt caacaaatat gtgagctgag ctgctgcaca 2340
aaggaatgtg atgtgtgtgt gtgtgtgtgt gtgtgtgtgt gttaggtggg gtgggtgaca 2400
acagaaatgg tgcacgagaa actgatcaaa ttgacattat attttcagtt tgcttatgaa 2460
gctcaaaata ctagagtaaa tgggtcatta aagaaaataa tatgtgaaat tatggagttt 2520
agaatacaag tggggtatat atacaaaaag acaaaactga ggttttgtgg tggagagatt 2580
ttcttaagta acactggcat taagttttag ctccttagat ttgggggtgc aaatattctt 2640
ttgagtcact gttattttgc caattacacc tagaatttca agcaaccaat tcgagatagg 2700
ctgttttagc caggctgcat ttgtggacaa cttatgtaag aaagacatgt tagaatagct 2760
gcttgtggta ttcttaaaaa tagaaacagg aaatatgggg aggatacatt tagctgtcct 2820
cttatcagat gaacacacga aattgaacag ttccttcatg attctctcaa acttaaaagc 2880
aaaatatttc tgtcttattt aaaatatcct tagtatgtct tatagtaaag ataatgctga 2940
taatgatttc atctctaaga tgtattaata tatttgtact gtttgccaaa atcacaaatc 3000
atttatgttt ttattccttt tcaaaatggt gtcagagaca tacatgcatt ttcccaaatg 3060
actctacttc actattattt acatggctta tttcattagt ttatagaggg tttgagaaaa 3120
agaatatgta gataatttaa tggtttttca caaattttaa gcttgtgatt gtgctcaatg 3180
agaaggtaaa gttattaaaa cttatttgaa atcaaa 3216
<210> 27
<211> 289
<212> PRT
<213> 人(human)
<400> 27
Met Lys Thr Leu Pro Ala Met Leu Gly Thr Gly Lys Leu Phe Trp Val
1 5 10 15
Phe Phe Leu Ile Pro Tyr Leu Asp Ile Trp Asn Ile His Gly Lys Glu
20 25 30
Ser Cys Asp Val Gln Leu Tyr Ile Lys Arg Gln Ser Glu His Ser Ile
35 40 45
Leu Ala Gly Asp Pro Phe Glu Leu Glu Cys Pro Val Lys Tyr Cys Ala
50 55 60
Asn Arg Pro His Val Thr Trp Cys Lys Leu Asn Gly Thr Thr Cys Val
65 70 75 80
Lys Leu Glu Asp Arg Gln Thr Ser Trp Lys Glu Glu Lys Asn Ile Ser
85 90 95
Phe Phe Ile Leu His Phe Glu Pro Val Leu Pro Asn Asp Asn Gly Ser
100 105 110
Tyr Arg Cys Ser Ala Asn Phe Gln Ser Asn Leu Ile Glu Ser His Ser
115 120 125
Thr Thr Leu Tyr Val Thr Asp Val Lys Ser Ala Ser Glu Arg Pro Ser
130 135 140
Lys Asp Glu Met Ala Ser Arg Pro Trp Leu Leu Tyr Ser Leu Leu Pro
145 150 155 160
Leu Gly Gly Leu Pro Leu Leu Ile Thr Thr Cys Phe Cys Leu Phe Cys
165 170 175
Cys Leu Arg Arg His Gln Gly Lys Gln Asn Glu Leu Ser Asp Thr Ala
180 185 190
Gly Arg Glu Ile Asn Leu Val Asp Ala His Leu Lys Ser Glu Gln Thr
195 200 205
Glu Ala Ser Thr Arg Gln Asn Ser Gln Val Leu Leu Ser Glu Thr Gly
210 215 220
Ile Tyr Asp Asn Asp Pro Asp Leu Cys Phe Arg Met Gln Glu Gly Ser
225 230 235 240
Glu Val Tyr Ser Asn Pro Cys Leu Glu Glu Asn Lys Pro Gly Ile Val
245 250 255
Tyr Ala Ser Leu Asn His Ser Val Ile Gly Pro Asn Ser Arg Leu Ala
260 265 270
Arg Asn Val Lys Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val Arg
275 280 285
Ser
<210> 28
<211> 317
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gatgaagagt gtgatgtaca gctttatata aagagacaat ctgaacactc catcttagca 60
ggagatccct ttgaactaga atgccctgtg aaatactgtg ctaacaggcc tcatgtgact 120
tggtgcaagc tcaatggaac aacatgtgta aaacttgaag atagacaaac aagttggaag 180
gaagagaaga acatttcatt tttcattcta cattttgaac cagtgcttcc taatgacaat 240
gggtcatacc gctgttctgc aaattttcag tctaatctca ttgaaagcca ctcaacaact 300
ctttatgtga caggtaa 317
<210> 29
<211> 912
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 29
atgaagacag tgcctgccat gcttgggact cctcggttat ttagggaatt cttcatcctc 60
catctgggcc tctggagcat cctttgtgag aaagctacta agaggaatga tgaagagtgt 120
gatgtacagc tttatataaa gagacaatct gaacactcca tcttagcagg agatcccttt 180
gaactagaat gccctgtgaa atactgtgct aacaggcctc atgtgacttg gtgcaagctc 240
aatggaacaa catgtgtaaa acttgaagat agacaaacaa gttggaagga agagaagaac 300
atttcatttt tcattctaca ttttgaacca gtgcttccta atgacaatgg gtcataccgc 360
tgttctgcaa attttcagtc taatctcatt gaaagccact caacaactct ttatgtgaca 420
gaaaggactc aaaactcttc agaacaccca ctaataacag tatctgacat cccagatgcc 480
accaatgcct caggaccatc caccatggaa gagaggccag gcaggacttg gctgctttac 540
accttgcttc ctttgggggc attgcttctg ctccttgcct gtgtctgcct gctctgcttt 600
ctgaaaagga tccaagggaa agaaaagaag ccttctgact tggcaggaag ggacactaac 660
ctggttgata ttccagccag ttccaggaca aatcaccaag cactgccatc aggaactgga 720
atttatgata atgatccctg gtctagcatg caggatgaat ctgaattgac aattagcttg 780
caatcagaga gaaacaacca gggcattgtt tatgcttctt tgaaccattg tgttattgga 840
aggaatccaa gacaggaaaa caacatgcag gaggcaccca cagaatatgc atccatttgt 900
gtgagaagtt aa 912
<210> 30
<211> 3226
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 30
ctgacacgtg ctgggaatga agacagtgcc tgccatgctt gggactcctc ggttatttag 60
ggaattcttc atcctccatc tgggcctctg gagcatcctt tgtgagaaag ctactaagag 120
gaatgatgaa gagtgtgatg tacagcttta tataaagaga caatctgaac actccatctt 180
agcaggagat ccctttgaac tagaatgccc tgtgaaatac tgtgctaaca ggcctcatgt 240
gacttggtgc aagctcaatg gaacaacatg tgtaaaactt gaagatagac aaacaagttg 300
gaaggaagag aagaacattt catttttcat tctacatttt gaaccagtgc ttcctaatga 360
caatgggtca taccgctgtt ctgcaaattt tcagtctaat ctcattgaaa gccactcaac 420
aactctttat gtgacagaaa ggactcaaaa ctcttcagaa cacccactaa taacagtatc 480
tgacatccca gatgccacca atgcctcagg accatccacc atggaagaga ggccaggcag 540
gacttggctg ctttacacct tgcttccttt gggggcattg cttctgctcc ttgcctgtgt 600
ctgcctgctc tgctttctga aaaggatcca agggaaagaa aagaagcctt ctgacttggc 660
aggaagggac actaacctgg ttgatattcc agccagttcc aggacaaatc accaagcact 720
gccatcagga actggaattt atgataatga tccctggtct agcatgcagg atgaatctga 780
attgacaatt agcttgcaat cagagagaaa caaccagggc attgtttatg cttctttgaa 840
ccattgtgtt attggaagga atccaagaca ggaaaacaac atgcaggagg cacccacaga 900
atatgcatcc atttgtgtga gaagttaaac ctgccactga gccaggcagc ctacactgca 960
tgagtgcctg tcaatacctc tgtctggacc ttcagtttca aataaccttc aacctggaaa 1020
gtttcaatta agatgctctg tgctggtgct gcgtcttaaa ggtccatgaa gtatttagtt 1080
aaaatttctc ctgaaaactt tgggagagtt ttgtacaaga cagactcttc cctgggaaaa 1140
ctcatattac gaatagcaga ataatagggc ttttaaaatt gaccatgtcg caccatgtcg 1200
tacccaatgt gtgaattcaa tattttcttt ggaactacca aacagactta caggggagaa 1260
agaagcgtgt tatttggatc tgctcactac acattctaga aaaagaatgg cccagtttga 1320
ctaactagtc ataaatatag taatgattgt atgctctcag tcagtcatga taagacaatt 1380
acccatgtca atctatatag ataatgcttt attatttttt ttaatgtgaa agaaaaatta 1440
tcttggactc aattcagaaa aagattagaa agggtaattg gtataataca gatatagcat 1500
atgccagata gatgtggtgc caacgatcct tatccccacc agtgagatgc tcaccttcag 1560
ctggcttgat tgagaaagta aggtaggtag taaagggctc atccacatat agtgagtgga 1620
tttgcaatca gcgtggtagt gtttggatca agattaacgc acatgaatgt gattcaatgc 1680
tgctggatta atatacatat ggtacgtatg ggcctatgaa caagtgtcca tgggaatgga 1740
tatattatca atctagagcg aacttttagc ccaccttttg ctttacgtga gagcaagctc 1800
aaagggcaat ttatgaaagg agaatcttga atattgagtt gatccgtagg gactggcatg 1860
cattcattaa tgcctgtttc ttgattctga ggaagtgaat cagaaaaaat catatgtaat 1920
gaagtagggc ctatggagat cactcaggtt taaattctga cattgcagct gttcaagaag 1980
atgattatca ggtgttctga atttccggat tgagtctaat tacttaaaaa tagctcataa 2040
ttttattcat cagcttgagg cttgagttct cagaccctaa aactgaataa tggcatagtc 2100
ttagtataca gcagattggg cctgagttag aagccactgg agcaaacaca taaactgtct 2160
atgtaattgc atgcatatat gtgggtgtgc ctgtgcatgt gtgtgctagc atgcaaatgc 2220
aagatgtgac gcctggaaat aagacaagag aaaccagtcc ttttgctgtg ctttttttag 2280
tttgcttaga aggtgcaaag tactagagaa aatgagtcat ttatagaaaa taacacgtag 2340
actggtgaga atggaaggga gttgagaatg tatccataaa cagtgaataa agaggcctta 2400
ctacacagct tttctcacct actgctcacc tcgggttcca gttccctgaa tctagaacaa 2460
caaacaatgt tttcagacat gttacaacca cttctagtta agcttgttca ggcaggtgca 2520
tttgtgggaa tttatgcaaa aaagacctta gaatagctgc tcatcttcaa aatagaaaca 2580
ggaaggatgg gagggggatg agtactgcac tctgtctctc ttatcagatc aacaggcaac 2640
ttaagcaaat ctttcagaat tgtctccggc tttaaaagga aaatacttcg ctctactctg 2700
tttaaaacaa tcttttaaaa acgttgtgtg tacatgtata tttgggtatg catgtatgtg 2760
tgtatatggt gtatgtgcgt ggtgtacaca catgtgtatg caggagccag aagagaaagt 2820
caggcaccct tttctattgc actccacttt attctgttaa gggaaggtct ctcattgaac 2880
ctggagctct gctagcaagc agcaagccag cgatggatcc tcccatccct gacccccaca 2940
ttgctagact atatttgctc atgcccagct ttttacaagg atgtggagaa ctgaaattca 3000
ggtcctcatg attgcataac aagcactctc acttactaag catgttctaa tatgttttac 3060
aatgaaagac gctgctcaag atttcacctc aatgaatgat caattctgtt tgtaccttgt 3120
ttgccaatca catagcattt atgctcttat tcctacttag taaatatgta tgttgtagct 3180
cctcaaataa atttgttcca gcattatttt catggttacc taactc 3226
<210> 31
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 31
Met Lys Thr Val Pro Ala Met Leu Gly Thr Pro Arg Leu Phe Arg Glu
1 5 10 15
Phe Phe Ile Leu His Leu Gly Leu Trp Ser Ile Leu Cys Glu Lys Ala
20 25 30
Thr Lys Arg Asn Asp Glu Glu Cys Asp Val Gln Leu Tyr Ile Lys Arg
35 40 45
Gln Ser Glu His Ser Ile Leu Ala Gly Asp Pro Phe Glu Leu Glu Cys
50 55 60
Pro Val Lys Tyr Cys Ala Asn Arg Pro His Val Thr Trp Cys Lys Leu
65 70 75 80
Asn Gly Thr Thr Cys Val Lys Leu Glu Asp Arg Gln Thr Ser Trp Lys
85 90 95
Glu Glu Lys Asn Ile Ser Phe Phe Ile Leu His Phe Glu Pro Val Leu
100 105 110
Pro Asn Asp Asn Gly Ser Tyr Arg Cys Ser Ala Asn Phe Gln Ser Asn
115 120 125
Leu Ile Glu Ser His Ser Thr Thr Leu Tyr Val Thr Glu Arg Thr Gln
130 135 140
Asn Ser Ser Glu His Pro Leu Ile Thr Val Ser Asp Ile Pro Asp Ala
145 150 155 160
Thr Asn Ala Ser Gly Pro Ser Thr Met Glu Glu Arg Pro Gly Arg Thr
165 170 175
Trp Leu Leu Tyr Thr Leu Leu Pro Leu Gly Ala Leu Leu Leu Leu Leu
180 185 190
Ala Cys Val Cys Leu Leu Cys Phe Leu Lys Arg Ile Gln Gly Lys Glu
195 200 205
Lys Lys Pro Ser Asp Leu Ala Gly Arg Asp Thr Asn Leu Val Asp Ile
210 215 220
Pro Ala Ser Ser Arg Thr Asn His Gln Ala Leu Pro Ser Gly Thr Gly
225 230 235 240
Ile Tyr Asp Asn Asp Pro Trp Ser Ser Met Gln Asp Glu Ser Glu Leu
245 250 255
Thr Ile Ser Leu Gln Ser Glu Arg Asn Asn Gln Gly Ile Val Tyr Ala
260 265 270
Ser Leu Asn His Cys Val Ile Gly Arg Asn Pro Arg Gln Glu Asn Asn
275 280 285
Met Gln Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val Arg Ser
290 295 300
<210> 32
<211> 1513
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
atacagcaac gacctcgtta agactttaaa gtctcaaatt tcttaattaa tagcatataa 60
tcatgggtat tctcttcagt atttcaacat catctgtaaa ataggattta tgatattata 120
ttttgggaaa gcatgaaatt gtttgtttgt ttgtttgttt gtttgaggca gtgcttctct 180
ttgtatccct cgctgtccta gaacttactc tgtagatcag gctggccttg aactcagaga 240
tctgcctgcc tctgcttcca gagatcttgg attaaaggca ttcaccacca tcacccagta 300
aaataatttt ttaaaaatat ttttattagg tattttcctc atttacattt ccaatgctat 360
cccaaaagtc ccccataccc tccaccccca ctcccctacc cactcactcc cactttttgg 420
ccctggtgtt cccctgtact ggggcatata aagtttgtgt gtccaatggg cctctctttc 480
caatgatggc tgactaggcc atcttttgat acatatgcag ctagagtcaa gagctcaggg 540
gtactggtta gatcataatg ttgttccatc tatagggttg cagatccctt tagctccttg 600
ggtactttct ctagctcctc cattgggggc cctgtgatcc atccaatagc tgactgtgag 660
catccacttc tgtgtttgct aggccccagc atagtctcac aagagtcagc tctatctggg 720
tcctttcagc aaaatcttgc tagtgtgtac aatggtgtca gtgtttggaa gctgattatg 780
ggatggatcc ctggagatgg cagtctctag atggtccatc cttttgtcac agctccaaac 840
attgtctctg taactccttc catgggtgtt ttgttcccaa ttctaagaag gggcaaagtg 900
tccacacttc agtcttcgtt cttcttgagt ttcatgcgtt tagcaaattg tatcttatat 960
cttgggtatc ctacgttcct gggctaatat ccacttatca gtgagcacat attgcgtgag 1020
tttttttgtg attgggttac ctcactcagg atgatgccct ccaggtccat ccatttgcct 1080
aggaatttca taaattcatt ctttttaata gctgagtagt actccattgt gtagatgtac 1140
cacattttct gtatccattc ctctgttgag gggcatctgg gttctttcca gcttctggct 1200
attataaata aggctgctat gaacatagtg gagcatgtgt ccttcttacc agttgggaca 1260
tcttctggat atatgcccag gagaggtatt gtgggatcct ctggtaaaat aatttatttt 1320
ttaaggcaag catttattac gtgacagttg tgtaccacac tggaatactg aaggtaaagt 1380
atagttaaga aaattgaagc aaattataga attaaacatg agaaaaactt tagtgaaaat 1440
tattgcaatg atacctatgg tccttctaag agtgaacact gattccagtt ttgtttttgt 1500
tttagatgaa gag 1513
<210> 33
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tttaagaagg agatatacat ggatatcata cagcaacgac ctcgttaaga ct 52
<210> 34
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
taaagctgta catcacactc ttcatctaaa acaaaaacaa aactgg 46
<210> 35
<211> 297
<212> DNA
<213> 人(human)
<400> 35
tgtgatgtac agctttatat aaagagacaa tctgaacact ccatcttagc aggagatccc 60
tttgaactag aatgccctgt gaaatactgt gctaacaggc ctcatgtgac ttggtgcaag 120
ctcaatggaa caacatgtgt aaaacttgaa gatagacaaa caagttggaa ggaagagaag 180
aacatttcat ttttcattct acattttgaa ccagtgcttc ctaatgacaa tgggtcatac 240
cgctgttctg caaattttca gtctaatctc attgaaagcc actcaacaac tctttat 297
<210> 36
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gttttagatg aagagtgtga tgtacagctt tatataaaga gacaa 45
<210> 37
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
atcacttacc tgtcacataa agagttgttg agtggctttc aatg 44
<210> 38
<211> 1497
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gtgacaggta agtgatctac cccagaccaa tctatagctt tttattttta tcatgttttt 60
ctgtgaagga gacaattcag acttttgggt gcttcagtta gaagttggaa cacttttgtc 120
acatccacag tccaccacat ccccccagat cagaacagtc ataagcacat aaaatagggg 180
agaagactgt gaagccaaga acagtagaag aaaaataatg gaaatcacta gtctcttggg 240
agaaaggttt acttgtataa ccctgtctgt cctggaactc acgttgtaga ccaggctagc 300
cttgaattca cagagatctg tctaccgctg cctcctgagt gcttggatta aaagcacgta 360
tcaacatacc agatgaagtt actgactgtt ttgtagagat taaaacattt atttgattat 420
ttgacaagtt caaaaataga tcacaagtat tattttcttt tttgtattca tttttttctg 480
ttgttgactt ttattgatta gagtttatag aagttatgtt tggatgctct gatgggcaca 540
cactttttaa agtactgatt catactttgc tcacaggacg aagaacatgc aaataagtgc 600
atgttttgat tccttgttga gttttaggga ataggcagag tttccacgtc ctcccattcc 660
ctgagttttt ccattggttc taggagcaaa gacaagacag gcaggtagta agctgggaac 720
actcaaggtg aacaaaacct agacaagtaa aaatgaaaag gcaggaataa tagagggtaa 780
caatcagctt atggacatct atctccaata ctatactccc tgctgagaaa ctggttccct 840
aaagaatgga aacttccatt catcactgag ctggaagctc caactagaaa aatttgacaa 900
gactaagaaa taaaaggtac tgaaaatgga atgggagtaa aagaatctct tttcatgcat 960
gaaatgacct tatatttaga agaaaatgta taaatgtcca taaaactact aacattaata 1020
tatgagttca attttaggaa actgtattaa cacataagaa ctaatgggct ctacatacta 1080
gcaatggata atctgaaaag gttgttaagc aaacaattcc acttataaca gatcaaaaag 1140
tacaaggtac ttataagcaa cagacttgta gacagaacca ataaagcatg aattaacaaa 1200
gaaattaagg aagatataaa aatatcatat tgtcatcagt ttcaaagact taactgttat 1260
ggagatgaca gtccccaaaa tccaacatca tttttatcaa ctcatacttc tgaaaccttt 1320
taaaagagat gtaagagcta attctagaat tcacatcata ttggaataga ccagaatagt 1380
caaaataaac ttgataaaga tgggaattgg aagagctctc tatttcaaaa cttattatta 1440
aaatatagct acttaaatac tgtggtgaga tcaacatggt agaattgata gtctagc 1497
<210> 39
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
cactcaacaa ctctttatgt gacaggtaag tgatctaccc cag 43
<210> 40
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ttgttagcag ccggatctca ggtcgacgct agactatcaa ttctaccatg ttgat 55
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
acttagtgga ctgtaggagt gctgg 25
<210> 42
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
cagcggtatg acccattgtc attagga 27
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
ccatcttagc aggagatccc tttga 25
<210> 44
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
tagacatgag acaaggttgg gcctg 25
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
tgatttgctt gctgtttaag gtcat 25
<210> 46
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ctcagaaaga gatttcaagg gggta 25
<210> 47
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ggatgctctg atgggcacac acttt 25
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ttagggaacc agtttctcag caggg 25
<210> 49
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
accccttgag gttagccct 19
<210> 50
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ttgtagaaca gctatacgac cca 23
<210> 51
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
atactgtgct aacaggcctc a 21
<210> 52
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
acccattgtc attaggaagc act 23
<210> 53
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
tgaagagtgt ccagtgcaac ttact 25
<210> 54
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
tgtggtggac tgtggatgtg acaaa 25
<210> 55
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
attgcaatga tacctatggt ccttctaaga gt 32
<210> 56
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ccggaactga ttgattttct tccca 25
<210> 57
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
gctgaccgtg aacgatacag gg 22
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
gaatcggctg gttgtttctg gaacg 25
<210> 59
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
cttccacatg agcgtggtca gggcc 25
<210> 60
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
ccaagggact attttagatg ggcag 25
<210> 61
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gaagctacaa gctcctaggt aggggg 26
<210> 62
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
acgggttggc tcaaaccatt aca 23
<210> 63
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
cctggctcac agtgtcagag 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
cagggctctc ctcgattttt 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ccctgctcgt ggtgaccgaa 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
gcaggctctc tttgatctgc 20
<210> 67
<211> 3072
<212> DNA/RNA
<213> 人(human)
<400> 67
gtctttctgt tcactttttt tcacaaaatc atccaggctc ttcctactct cctctcttac 60
cacctctctc ttcttttttt ttttttttta gttatttcac agatgccact ggggtaggta 120
aactgaccca actctgcagc actcagaaga cgaagcaaag ccttctactt gagcagtttt 180
tccatcactg atatgtgcag gaaatgaaga cattgcctgc catgcttgga actgggaaat 240
tattttgggt cttcttctta atcccatatc tggacatctg gaacatccat gggaaagaat 300
catgtgatgt acagctttat ataaagagac aatctgaaca ctccatctta gcaggagatc 360
cctttgaact agaatgccct gtgaaatact gtgctaacag gcctcatgtg acttggtgca 420
agctcaatgg aacaacatgt gtaaaacttg aagatagaca aacaagttgg aaggaagaga 480
agaacatttc atttttcatt ctacattttg aaccagtgct tcctaatgac aatgggtcat 540
accgctgttc tgcaaatttt cagtctaatc tcattgaaag ccactcaaca actctttatg 600
tgacaggaaa gcaaaatgaa ctctctgaca cagcaggaag ggaaattaac ctggttgatg 660
ctcaccttaa gagtgagcaa acagaagcaa gcaccaggca aaattcccaa gtactgctat 720
cagaaactgg aatttatgat aatgaccctg acctttgttt caggatgcag gaagggtctg 780
aagtttattc taatccatgc ctggaagaaa acaaaccagg cattgtttat gcttccctga 840
accattctgt cattggaccg aactcaagac tggcaagaaa tgtaaaagaa gcaccaacag 900
aatatgcatc catatgtgtg aggagttaag tctgtttctg actccaacag ggaccattga 960
atgatcagca tgttgacatc attgtctggg ctcaacagga tgtcaaataa tatttctcaa 1020
tttgagaatt tttactttag aaatgttcat gttagtgctt gggtcttaag ggtccatagg 1080
ataaatgatt aaaatttctc tcagaaactt atttgggagc tttttatatt atagccttga 1140
ataacaaaat ctctccaaaa ctggttgaca tcatgagtag cagaatagta gaacgtttaa 1200
acttagctac attttaccca atatacaaac tcgatcttgc ctttgaagct attggaaaga 1260
cttgtaggga aaagaggttt gtgttacctg catcagttca ctacacactc ttgaaaacaa 1320
aatgtcccaa tttgactaac caaccataaa tacagtaatg attgtatatt tcaagtcagt 1380
cttccaaaat aagaaatttt tgctgtgtca gtctaagaat ggtgtttctt aaatgcaaag 1440
gagaaatcat tttaggcttg atgtaagaaa atgaaaataa taaatggtgc aataaaaata 1500
tagaatatac caattggata tagggtagat gttccacata cctggcaaac aaatgcttat 1560
atctactctg ttagattgat aagcaaatat aggtattaat ggagcagtca acgtatagca 1620
catttatgag gaaagtagag actcactggg tcacatagac taatggatag gaatgtgaca 1680
taatgctgct gaattaatat acttatgggc atctgaatag tttaaaagtt agtcagaata 1740
ggtatcactg ggcaagtgaa gatagcttaa actgcttcat gcttgacttg atagcaagtt 1800
aaagtgcaat taatggaatg gaggaaaacc cagaatattt aattggtctg taggggtcaa 1860
tttgctttca ttcaccacat ctgcatcttg ctgttcttct tactaaggaa tcagggcaaa 1920
tcatctgtag tgacatattt tagtttgcta atcatttatt ttaaaatact gaggttgcag 1980
ccacttaaga gtatagcaaa agatggattc agatttttgg actttccaaa gtacttgagt 2040
taaactattt caaaaatagc ctataatttt attcaacagt ttgaggctat tcgaattctc 2100
aggtgctgct actgaataat gtaatagtct tcatacaaag tggatagcaa aggttaaaat 2160
ccatttcaac aaatatgtga gctgagctgc tgcacaaagg aatgtgatgt gtgtgtgtgt 2220
gtgtgtgtgt gtgtgtgtta ggtggggtgg gtgacaacag aaatggtgca cgagaaactg 2280
atcaaattga cattatattt tcagtttgct tatgaagctc aaaatactag agtaaatggg 2340
tcattaaaga aaataatatg tgaaattatg gagtttagaa tacaagtggg gtatatatac 2400
aaaaagacaa aactgaggtt ttgtggtgga gagattttct taagtaacac tggcattaag 2460
ttttagctcc ttagatttgg gggtgcaaat attcttttga gtcactgtta ttttgccaat 2520
tacacctaga atttcaagca accaattcga gataggctgt tttagccagg ctgcatttgt 2580
ggacaactta tgtaagaaag acatgttaga atagctgctt gtggtattct taaaaataga 2640
aacaggaaat atggggagga tacatttagc tgtcctctta tcagatgaac acacgaaatt 2700
gaacagttcc ttcatgattc tctcaaactt aaaagcaaaa tatttctgtc ttatttaaaa 2760
tatccttagt atgtcttata gtaaagataa tgctgataat gatttcatct ctaagatgta 2820
ttaatatatt tgtactgttt gccaaaatca caaatcattt atgtttttat tccttttcaa 2880
aatggtgtca gagacataca tgcattttcc caaatgactc tacttcacta ttatttacat 2940
ggcttatttc attagtttat agagggtttg agaaaaagaa tatgtagata atttaatggt 3000
ttttcacaaa ttttaagctt gtgattgtgc tcaatgagaa ggtaaagtta ttaaaactta 3060
tttgaaatca aa 3072
<210> 68
<211> 241
<212> PRT
<213> 人(human)
<400> 68
Met Lys Thr Leu Pro Ala Met Leu Gly Thr Gly Lys Leu Phe Trp Val
1 5 10 15
Phe Phe Leu Ile Pro Tyr Leu Asp Ile Trp Asn Ile His Gly Lys Glu
20 25 30
Ser Cys Asp Val Gln Leu Tyr Ile Lys Arg Gln Ser Glu His Ser Ile
35 40 45
Leu Ala Gly Asp Pro Phe Glu Leu Glu Cys Pro Val Lys Tyr Cys Ala
50 55 60
Asn Arg Pro His Val Thr Trp Cys Lys Leu Asn Gly Thr Thr Cys Val
65 70 75 80
Lys Leu Glu Asp Arg Gln Thr Ser Trp Lys Glu Glu Lys Asn Ile Ser
85 90 95
Phe Phe Ile Leu His Phe Glu Pro Val Leu Pro Asn Asp Asn Gly Ser
100 105 110
Tyr Arg Cys Ser Ala Asn Phe Gln Ser Asn Leu Ile Glu Ser His Ser
115 120 125
Thr Thr Leu Tyr Val Thr Gly Lys Gln Asn Glu Leu Ser Asp Thr Ala
130 135 140
Gly Arg Glu Ile Asn Leu Val Asp Ala His Leu Lys Ser Glu Gln Thr
145 150 155 160
Glu Ala Ser Thr Arg Gln Asn Ser Gln Val Leu Leu Ser Glu Thr Gly
165 170 175
Ile Tyr Asp Asn Asp Pro Asp Leu Cys Phe Arg Met Gln Glu Gly Ser
180 185 190
Glu Val Tyr Ser Asn Pro Cys Leu Glu Glu Asn Lys Pro Gly Ile Val
195 200 205
Tyr Ala Ser Leu Asn His Ser Val Ile Gly Pro Asn Ser Arg Leu Ala
210 215 220
Arg Asn Val Lys Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val Arg
225 230 235 240
Ser