CN114128676A

CN114128676A - 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

Info

Publication number: CN114128676A
Application number: CN202111210808.9A
Authority: CN
Inventors: L·麦克唐纳; J·麦克沃克; A·J·莫菲
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2016-01-13
Filing date: 2017-01-12
Publication date: 2022-03-04
Also published as: SG10201914034WA; EP3402326A1; KR102482103B1; IL260526A; JP6979955B2; SG11201805973WA; JP2023024619A; AU2023201372A1; AU2017206785B2; US20190037816A1; WO2017123804A1; RU2018129169A; KR20230006929A; WO2017123804A9; BR112018014250A2; CN108777951A; JP2024091951A; EP4257599A2; AU2017206785A1; EP4257599A3

Abstract

本发明提供了非人动物以及用于制备和使用非人动物的方法和组合物，其中所述非人动物具有包含在免疫球蛋白重链可变区内的经改造的或重组多样性簇的基因组，所述经改造的或重组多样性簇包含目的非免疫球蛋白多肽的一个或多个编码序列的插入。本文所述的非人动物表达特征在于互补决定区(CDR)，特别是具有指导与特定抗原的结合的多样性的CDR3的抗体。本发明还提供了用于从非人动物产生抗体的方法，所述抗体含有人可变区和小鼠恒定区。

Description

具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

本申请是申请号为201780014326.1、申请日为2017年1月12日、发明名称为“具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途”的中国发明专利申请的分案申请，原申请为国际申请号为PCT/US2017/013247的国家阶段申请，该国际申请要求申请日为2016年1月13日，申请号为62/278,127的美国申请的优先权。

背景技术

基于抗体的治疗剂为多种疾病的治疗提供了显著前景。正在开发各种形式，包括单克隆、鼠、嵌合、人源化的、人、全长、Fab、聚乙二醇化、放射性标记的、药物缀合的、多特异性等(参见例如Reichert,J.M.,2012,mAbs 4:3,413-415；Nixon,A.E.等人，2014,mAbs 6:1,73-85；以引用的方式并入本文)。已在美国或欧洲获得上市许可的超过40种治疗性抗体试剂中，全部都用依赖通过体外(例如噬菌体展示)或体内(例如经遗传改造的动物)系统的、来自人和/或非人(例如小鼠)源的传统抗体基因的装配的技术生成。然而，结合顽固性靶的特别有效的抗体试剂的开发仍然是个挑战。

发明内容

本文公开了以下认识：期望改造非人动物以允许用于鉴定和开发基于抗体的新治疗剂的改进体内系统，并且在一些实施例中，可用于治疗特征在于顽固性疾病靶的各种疾病的抗体试剂(例如单克隆抗体和/或其片段)。进一步地，本文公开了以下认识：期望在免疫球蛋白重链可变区(例如异源免疫球蛋白重链可变区)内具有经改造的重链多样性(D_H)簇/区，特别是经改造的D_H簇(或D_H区)的非人动物，所述重链多样性簇/区含有并非天然存在于免疫球蛋白重链可变区内的核苷酸编码序列，和/或以其它方式表达、含有或产生含有互补决定区(CDR)的抗体，所述互补决定区的特征在于指导与特定抗原结合的多样性，例如用于鉴定和开发基于抗体的治疗剂，其可靶向例如跨膜多肽或细胞质多肽。在一些实施例中，本文公开的非人动物是用于开发用于施用于人的抗体和/或基于抗体的治疗剂的体内系统。

在一些实施例中，提供了非人动物,其基因组(例如种系基因组)包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分。

在另一个方面，其基因组例如种系基因组被修饰以包含免疫球蛋白重链可变区(其包括经改造的D_H区)的非人动物，可被进一步修饰以表达单一重排轻链，例如共同轻链(ULC)，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分。

可操作地连接到轻链恒定区(也称为共同或通用轻链(ULC))的单个重排的轻链可变基因序列，可由包含单个重排的V_L:J_L基因序列的轻链基因座编码。在一些实施例中，轻链基因座包含单个重排的V_L:J_L基因序列，其中V_L序列是Vκ基因序列。在一些方面，Vκ序列选自Vκ1-39或Vκ3-20。在一些方面，J_L序列是Jκ基因序列，例如Jκ1序列、Jκ2序列、Jκ3序列、Jκ4序列或Jκ5序列等。在一些实施例中，轻链基因座包含选自Vκ1-39Jκ5和Vκ3 20Jκ1的单个重排的Vκ:Jκ序列。在一个实施例中，轻链基因座包含Vκ1-39Jκ5的单个重排的Vκ:Jκ序列。在另一个实施例中，轻链基因座包含Vκ3-20Jκ1的单个重排的Vκ:Jκ序列。在一些实施例中，单个重排的可变基因序列可操作地连接至非人轻链恒定区基因，例如内源性非人轻链恒定区基因。在另一个实施例中，单个重排的可变基因序列可操作地连接至人轻链恒定区基因。在一些方面，单个重排的可变基因序列是插入内源性免疫球蛋白轻链基因座的人V:J序列，使得所得到的非人动物在一个或多个轻链基因座中不包含功能性未重排的V和/或J基因区段。

在一些实施例中，提供了分离的非人细胞或组织，其基因组包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同或通用轻链，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中，细胞来自淋巴或骨髓谱系。在一些实施例中，细胞为淋巴细胞。在一些实施例中，细胞选自B细胞、树突状细胞、巨噬细胞、单核细胞和T细胞。在一些实施例中，组织选自脂肪、膀胱、大脑、乳房、骨髓、眼、心、肠、肾、肝、肺、淋巴结、肌肉、胰腺、血浆、血清、皮肤、脾、胃、胸腺、睾丸、卵子以及它们的组合。

在一些实施例中，提供了如本文所述的由分离的非人细胞制备的永生化细胞。

在一些实施例中，提供了非人胚胎干(ES)细胞，其基因组包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同轻链，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中，非人胚胎干细胞是啮齿类动物胚胎干细胞。在某些实施例中，啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且来自129品系、C57BL品系或它们的混合物。在某些实施例中，啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且是129和C57BL品系的混合物。

在一些实施例中，提供了非人生殖细胞，其基因组包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同轻链，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分。在一些实施例中，非人生殖细胞是啮齿类动物生殖细胞。在一些特定实施例中，啮齿类动物生殖细胞是小鼠生殖细胞，并且来自129品系、C57BL品系或其混合物。在一些特定实施例中，啮齿类动物生殖细胞是小鼠生殖细胞，并且是129和C57BL品系的混合物。

在一些实施例中，提供了如本文所述的非人胚胎干细胞或生殖细胞制备非人动物的用途。在一些特定实施例中，非人胚胎干细胞或生殖细胞是小鼠胚胎干细胞或生殖细胞，并且用于制备如本文所述包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同轻链的小鼠。在一些特定实施例中，非人胚胎干细胞或生殖细胞是大鼠胚胎干细胞或生殖细胞，并且用于制备如本文所述包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同轻链的大鼠。

在一些实施例中，提供了包含本文所述的非人胚胎干细胞、由其制备、由其获得或由其产生的非人胚胎。在某些实施例中，非人胚胎为啮齿类动物胚胎；在一些实施例中，为小鼠胚胎；在一些实施例中，为大鼠胚胎。

在一些实施例中，提供了本文描述的非人胚胎用于制备非人动物的用途。在一些特定实施例中，非人胚胎是小鼠胚胎，并且用于制备如本文所述包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同轻链基因座的小鼠。在一些特定实施例中，非人胚胎是大鼠胚胎，并且用于制备如本文所述包含包括经改造的D_H区的免疫球蛋白重链可变区以及任选的共同轻链基因座的大鼠。

在一些实施例中，提供了试剂盒，其包含如本文所述的分离的非人细胞或组织、如本文所述的永生化细胞、如本文所述的非人胚胎干细胞、如本文所述的非人胚胎、或如本文所述的非人动物。

在一些实施例中，提供了如本文所述的试剂盒，用于制造和/或开发用于治疗或诊断的药物(例如，抗体或其抗原结合片段)。

在一些实施例中，提供了如本文所述的试剂盒，用于制备和/或开发用于治疗、预防或改善疾病、病症或状况的药物(例如，抗体或其抗原结合片段)。

在一些实施例中，提供了本文所述的转基因、核酸构建体、DNA构建体或靶向载体。在一些特定实施例中，转基因、核酸构建体、DNA构建体或靶向载体包含如本文所述的经改造的D_H区。在一些特定实施例中，转基因、核酸构建体、DNA构建体或靶向载体包含DNA片段，其包括本文所述的一个或多个核苷酸编码序列。在一些实施例中，转基因、核酸构建体、DNA构建体或靶向载体包含经改造的D_H区，其包含选自表3或表4的一个或多个核苷酸编码序列，其中一个或多个核苷酸编码序列各自侧翼为选自图2的重组信号序列。在某些实施例中，转基因、核酸构建体、DNA构建体或靶向载体还包含一个或多个选择性标记。在一些特定实施例中，转基因、核酸构建体、DNA构建体或靶向载体还包含一个或多个位点特异性重组位点(例如lox、Frt或其组合)。在一些特定实施例中，转基因、核酸构建体、DNA构建体或靶向载体在图3A、3B、4A、4B、7A、7B、8A和8B中的任何一个中描绘。

在一些实施例中，提供了本文所述的转基因、核酸构建体、DNA构建体或靶向载体用于制备非人胚胎干细胞、非人细胞、非人胚胎和/或非人动物的用途。

在一些实施例中，目的非免疫球蛋白多肽是趋化因子受体。在一些实施例中，趋化因子受体选自CC-趋化因子受体(或β-趋化因子受体)、CXC-趋化因子受体、CX3C-趋化因子受体和XC-趋化因子受体。在一些实施例中，趋化因子受体是非典型趋化因子受体(ACKR)。在一些实施例中，ACKR选自ACKR1、ACKR2、ACKR3和ACKR4。在一些特定实施例中，ACKR是ACKR2或D6趋化因子诱饵受体。

在一些实施例中，目的非免疫球蛋白多肽是毒素。在一些实施例中，毒素是在狼蛛、蜘蛛、蝎子或海葵的毒液中发现的毒素。

在一些实施例中，目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。在一些实施例中，芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。在一些特定实施例中，芋螺毒素是μ-芋螺毒素。在一些特定实施例中，狼蛛毒素是ProTxI、ProTxII、虎纹捕鸟蛛毒素-IV(HWTX-IV)或其组合。

在一些实施例中，经改造的D_H区包含5、10、15、20、25个或更多个核苷酸序列，其各自编码D6趋化因子诱饵受体的细胞外部分，或各自编码芋螺毒素(例如μ-芋螺毒素)的一部分，或各自编码狼蛛毒素(例如ProTxI、ProTxII等)的一部分或其组合。

在一些实施例中，经改造的D_H区包括各自编码D6趋化因子诱饵受体的细胞外部分的25个核苷酸序列，或包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如ProTxI、ProTxII等)的一部分的26个核苷酸序列。

在一些实施例中，D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。

在一些实施例中，如本文所述的芋螺毒素的一部分包括包含一个或多个二硫键的序列。在一些实施例中，如本文所述的芋螺毒素的一部分包括与自然界中出现的芋螺毒素序列(例如参考或亲本芋螺毒素序列)相比，缺乏一个或多个二硫键的序列。在一些实施例中，如本文所述的芋螺毒素的一部分包括与自然界中出现的芋螺毒素序列(例如参考或亲本芋螺毒素序列)相比，显示出相同或不同的二硫键数目和/或模式的序列。

在一些实施例中，如本文所述的狼蛛毒素的一部分包括包含半胱氨酸结基序的序列，所述半胱氨酸结基序在自然界中发现的狼蛛毒素序列中出现。在一些实施例中，如本文所述的狼蛛毒素的一部分包含其为或包含半胱氨酸结肽的序列。在一些实施例中，如本文所述的狼蛛毒素的一部分包括与自然界出现的狼蛛毒素序列(例如参考或亲本狼蛛毒素序列)相比，缺乏一个或多个二硫键的序列。在一些实施例中，如本文所述的狼蛛毒素的一部分包括与自然界出现的狼蛛毒素序列(例如参考或亲本狼蛛毒素序列)相比，显示出相同或不同的二硫键数目和/或模式的序列。

在一些实施例中，经改造的D_H区包含25或26个核苷酸序列，其与表3或表4中出现的核苷酸序列至少50％、60％、70％、80％、90％、95％或至少98％相同，和/或编码表3或表4中出现的氨基酸序列。在一些实施例中，经改造的D_H区包含25或26个核苷酸序列，其各自编码与表3或表4中出现的氨基酸序列基本上相同或相同的氨基酸序列，或者具有与表3或4中出现的氨基酸序列相同的功能。

在一些实施例中，一个或多个核苷酸序列包含增加一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。

在一些实施例中，经改造的D_H区还包括侧接一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。在一些特定实施例中，第一重组信号序列包含与图2中出现的第一重组信号序列至少50％、60％、70％、80％、90％、95％或至少98％相同的序列。在一些特定实施例中，第一重组信号序列包含与图2中出现的第一重组信号序列基本上相同或相同的序列。在一些特定实施例中，第二重组信号序列包含与图2中出现的第二重组信号序列至少50％、60％、70％、80％、90％、95％或至少98％相同的序列。在一些特定实施例中，第二重组信号序列包含与图2中出现的第二重组信号序列基本上相同或相同的序列。在一些实施例中，第一重组信号序列和第二重组信号序列选自图2。

在一些实施例中，所提供的非人动物的基因组缺少一个或多个野生型内源性D_H基因区段。在一些特定实施例中，所提供的非人动物的基因组缺少全部或基本上全部野生型内源性D_H基因区段。在一些实施例中，所提供的非人动物的基因组缺少一个或多个野生型内源性重组信号序列。

在一些实施例中，经改造的D_H区包含一个或多个野生型人D_H基因区段。在一些特定实施例中，经改造的D_H区包含人D_H6-25基因区段。在一些特定实施例中，经改造的D_H区缺少人D_H6-25基因区段。

在一些实施例中，免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。

在一些实施例中，免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。

在一些实施例中，免疫球蛋白重链可变区是未重排的人免疫球蛋白重链可变区，例如包含侧接经改造的(e)D_H区的至少一个人(h)未重排的V_H基因区段和/或至少一个人(h)未重排的J_H基因区段。在一些实施例中，免疫球蛋白重链可变区包含侧接经改造的(e)D_H区的多个人(h)未重排的V_H基因区段和/或多个人(h)未重排的J_H基因区段。在一些实施例中，未重排的人免疫球蛋白重链可变区例如在内源性非人重链基因座处可操作地连接至免疫球蛋白重链恒定区，例如非人免疫球蛋白重链恒定区。

在一些实施例中，人免疫球蛋白重链可变区包含重排的人免疫球蛋白重链可变区，其中所述重排的人免疫球蛋白重链包含与经改造的(e)D_H区重组的至少一个人(h)未重排的V_H基因区段和/或至少一个人(h)未重排的J_H基因区段，以形成重排的(h)V_H/(e)D_H/(h)J_H基因序列，其可与重链恒定区可操作地连接。在一些实施例中，这种重组在B细胞发育期间在B细胞中发生。

相应地，本文所述的非人动物可包含

(i)包含未重排的人重链可变区的生殖细胞，

(a)至少一个或多个人(h)未重排的V_H基因区段，

(b)至少一个或多个人(h)未重排的J_H基因区段，和

(c)侧翼为(a)和(b)的经改造的(e)D_H区，其中(a)、(b)和(c)重组以形成重排的人重链可变区hV_H/eD_H/hJ_H序列；和

(ii)包含重排的人hV_H/eD_H/hJ_H基因序列的体细胞，例如B细胞，其中所述重排的hV_H/eD_H/hJ_H基因序列包含含有一个或多个核苷酸序列的CDR3编码序列，所述一个或多个核苷酸序列编码目的非免疫球蛋白多肽或其一部分、或其体细胞超突变的变体。在一些实施例中，人未重排或重排的人重链可变区例如在非人内源性重链基因座处可操作地连接至重链恒定区，其可为非人重链恒定区。在一些实施例中，免疫球蛋白重链可变区是人免疫球蛋白重链可变区。在一些实施例中，B细胞还将与重链恒定区可操作地连接的重排的hV_H/eD_H/hJ_H基因序列表达为包含CDR3的免疫球蛋白重链样多肽，所述CDR3包含含有目的非免疫球蛋白多肽、其一部分或其体细胞超突变的变体。

在一些实施例中，如本文所述的非人动物还包含人源化轻链基因座。在一些实施例中，如本文公开的非人动物包含

(i)在生殖细胞中：

(a)包含未重排的免疫球蛋白重链可变区和免疫球蛋白重链恒定区的免疫球蛋白重链基因座，其中所述未重排的免疫球蛋白重链可变区包含至少一个未重排的V_H基因区段(其可为人未重排的V_H基因区段，例如hV_H)、经改造的D_H区(其可包括人D_H基因区段和/或经改造的D_H基因区段，例如hD_H)和至少一个未重排的，任选地人J_H基因区段，其中所述V_H基因区段、经改造的D_H区和J_H基因区段可操作地连接，使得它们可例如在B细胞发育过程中在B细胞中重组，以形成与免疫球蛋白重链恒定区可操作地连接的重排的免疫球蛋白重链hV_H/eD_H/hJ_H可变区基因序列，和

(b)包含人V_L和/或J_L基因区段并且可编码(人)共同轻链的免疫球蛋白轻链基因座；和

(ii)在体细胞例如B细胞中，

(a)与免疫球蛋白重链恒定区可操作地连接的重排的免疫球蛋白重链hV_H/eD_H/hJ_H可变区基因序列，其中所述经改造的D_H区包含编码目的非免疫球蛋白多肽或一其部分的序列，并且其中重排的hV_H/eD_H/hJ_H基因序列包含含有一个或多个核苷酸序列的CDR3编码序列，所述一个或多个核苷酸序列编码目的非免疫球蛋白多肽、或其一部分或其体外超突变的变体，和

(b)人源化和/或共同的免疫球蛋白轻链基因座或其体细胞超突变的变体。在一些实施例中，人未重排或重排的人重链可变区例如在非人内源性重链基因座处可操作地连接至重链恒定区，其可为非人重链恒定区。在一些实施例中，免疫球蛋白重链可变区是人免疫球蛋白重链可变区。在一些实施例中，B细胞还将与重链恒定区可操作地连接的重排的hV_H/eD_H/hJ_H基因序列表达为包含CDR3的免疫球蛋白重链样多肽，其包含目的非免疫球蛋白多肽、其一部分或其体外超突变的变体，并且将人(源化)和/或共同轻链表达为四聚体免疫球蛋白样抗原结合蛋白，其中所述四聚体包含免疫球蛋白重链样多肽的二聚体，其各自共价结合至人(源化)和/或共同轻链。

在一些实施例中，提供了制备其基因组含有免疫球蛋白重链可变区的非人动物的方法，所述免疫球蛋白重链可变区包括经改造的D_H区，所述方法包括(a)将DNA片段插入非人胚胎干细胞内，所述DNA片段包含一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分；(b)获得(a)中生成的非人胚胎干细胞；并且(c)使用(b)的胚胎干细胞产生非人。

在一个实施例中，如本文公开的制备非人动物的方法包括(a)获得其基因组含有免疫球蛋白重链可变区的第一非人动物，所述免疫球蛋白重链可变区包括如本文所公开的经改造的D_H区，并且(b)用第二非人动物交配(a)的第一非人动物，所述第二非人动物在一个方面可为与第一非人动物不同的品系，其中所述第二非人动物表达通用轻链，并且其中所述交配导致后代，所述后代产生(例如包含)例如在CDR3中包含非免疫球蛋白蛋白质(或其一部分)的氨基酸序列的经遗传改造的重链、以及经遗传改造的重排的轻链(单一重排的轻链；ULC)。

在一些实施例中，DNA片段包括5、10、15、20、25个或更多个核苷酸序列，其各自编码D6趋化因子诱饵受体的细胞外部分，或者各自编码芋螺毒素(例如μ-芋螺毒素)的一部分、狼蛛毒素或其组合。在一些特定实施例中，DNA片段包括各自编码D6趋化因子诱饵受体的细胞外部分的25个核苷酸序列，或包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如ProTxI、ProTxII等)的一部分的26个核苷酸序列。在一些特定实施例中，DNA片段还包含侧接25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。

在一些实施例中，提供了制备其基因组含有免疫球蛋白重链可变区的非人动物的方法，所述免疫球蛋白重链可变区包括经改造的D_H区，所述方法包括修饰非人动物的基因组，使得它包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，所述经改造的D_H区包含一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分，由此制备所述非人动物。

在一些实施例中，非人动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列，其各自编码D6趋化因子诱饵受体的细胞外部分，或者各自编码芋螺毒素(例如μ-芋螺毒素)的一部分、狼蛛毒素或其组合。在一些特定实施例中，非人动物的基因组被修饰为包括各自编码D6趋化因子诱饵受体的细胞外部分的25个核苷酸序列，或被修饰为包括各自编码芋螺毒素(例如μ-芋螺毒素)和/或狼蛛毒素(例如ProTxI、ProTxII等)的一部分的26个核苷酸序列。在一些特定实施例中，非人动物的基因组被修饰为还包括侧接25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。

在一些实施例中，提供了在非人动物中产生抗体的方法，所述方法包括以下步骤：(a)用抗原免疫非人动物，所述非人动物具有包含免疫球蛋白重链可变区的基因组，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分；(b)将所述非人动物维持在足以使所述非人动物对抗原产生免疫应答的条件下；并且(c)从非人动物或非人动物细胞中回收结合抗原的抗体。在一些特定实施例中，非人细胞是B细胞。在一些特定实施例中，非人细胞是杂交瘤。

在一些实施例中，提供了非人动物，其生殖细胞基因组包含(a)人免疫球蛋白重链可变区，其包含一个或多个未重排的人V_H基因区段、经改造的D_H区和一个或多个未重排的人J_H基因区段，所述经改造的D_H区包括(i)各自编码非典型趋化因子受体(ACKR)的细胞外部分的一个或多个核苷酸序列；和(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列，使得所述一个或多个未重排的人V_H基因区段、经改造的D_H区和一个或多个未重排的人J_H基因区段例如在B细胞中重组，使得所述非人动物包含B细胞基因组，所述B细胞基因组包含含有重排的hV_H/eD_H/hJ_H基因序列的人免疫球蛋白重链可变区；其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白重链恒定区基因，使得所述非人动物的特征在于当它用抗原免疫时，与免疫球蛋白重链恒定区基因可操作地连接的所述重排的hV_H/eD_H/hJ_H基因序列编码抗体，所述抗体包含由人V_H基因区段之一(或其一部分)编码的人重链可变结构域、经改造的D_H区(或其一部分)、以及由一个或多个内源性免疫球蛋白恒定区基因编码的与非人动物重链恒定结构域可操作地连接的人J_H基因区段之一(或其一部分)，并且其中所述抗体显示与抗原的特异性结合。在一些实施例中，非人动物的生殖细胞和例如B细胞还包含编码共同轻链的免疫球蛋白轻链基因座，使得该抗体还包含共同轻链。

在一些实施例中，提供了非人动物，其生殖细胞基因组包含人免疫球蛋白重链可变区，其包含一个或多个未重排的人(h)V_H基因区段、经改造的(e)D_H区和一个或多个(h)人J_H基因区段，所述经改造的D_H区包括(i)各自编码毒素(例如，μ-芋螺毒素、狼蛛毒素或其组合)的一部分的一个或多个核苷酸序列；和(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列，使得所述一个或多个未重排的人V_H基因区段、经改造的D_H区和一个或多个未重排的人J_H基因区段例如在B细胞中重组，使得所述非人动物包含B细胞基因组，所述B细胞基因组包含含有重排的hV_H/eD_H/hJ_H基因序列的人免疫球蛋白重链可变区；其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白重链恒定区基因，使得所述非人动物的特征在于当它用抗原免疫时，与免疫球蛋白重链恒定区基因可操作地连接的所述重排的hV_H/eD_H/hJ_H基因序列编码抗体，所述抗体包含由人V_H基因区段之一(或其一部分)编码的人重链可变结构域、经改造的D_H区(或其一部分)、以及由一个或多个内源性免疫球蛋白恒定区基因编码的与一个或多个重链恒定结构域可操作地连接的人J_H基因区段之一(或其一部分)，并且其中所述抗体显示与抗原的特异性结合。在一些实施例中，非人动物的生殖细胞和例如B细胞还包含编码共同轻链的免疫球蛋白轻链基因座，使得该抗体还包含共同轻链。

在一些实施例中，所提供的非人动物还包含将一个或多个人V_L基因区段和一个或多个人J_L基因区段插入内源性轻链基因座内。在一些实施例中，人V_L和J_L区段是Vκ和Jκ基因区段，并且插入内源性κ轻链基因座内。在一些实施例中，人Vκ和Jκ基因区段与啮齿类动物Cκ基因(例如小鼠或大鼠Cκ基因)可操作地连接。在一些实施例中，人V_L和J_L区段是Vλ和Jλ基因区段，并且插入内源性λ轻链基因座内。在一些实施例中，人Vλ和Jλ基因区段与啮齿类动物Cλ基因(例如小鼠或大鼠Cλ基因)可操作地连接。在一些实施例中，单个重排的人轻链可变区基因序列可操作地连接至内源非人轻链恒定区基因。在一些实施例中，单个重排的人Vκ/Jκ基因序列可操作地连接至内源性Cκ基因(例如小鼠或大鼠Cκ基因)。在一些实施例中，单个重排的Vλ/Jλ基因序列可操作地连接至内源Cλ基因。

在一些实施例中，所提供的非人动物对于如本文所述的经改造的D_H区是纯合的、杂合的或半合子的。在一些实施例中，所提供的非人动物对于如本文所述的经改造的D_H区是转基因的。

本文还公开了细胞，例如B细胞或通过与骨髓瘤细胞融合由其衍生的杂交瘤，所述细胞各自包含重排的(h)V_H/eD_H/(h)J_H序列，其可以可操作地连接至包含一个或多个重链恒定区基因的人或非人重链恒定区。这样的细胞例如B细胞可从如本文所述的非人动物，例如啮齿类动物(例如大鼠、小鼠等)中分离。

本文还描述了包含重排的可变(h)V_H/eD_H/(h)J_H序列的核苷酸序列，其可以可操作地连接至包含一个或多个重链恒定区基因的人或非人重链恒定区。这样的核苷酸序列可从如本文所述的非人动物，例如啮齿类动物(例如大鼠、小鼠等)或非人细胞中分离。

在一些实施例中，提供了如本文所述的非人动物在制造和/或开发用于医学中的药物或疫苗中，例如用作药剂的用途。

在一些实施例中，提供了如本文所述的非人动物在制造用于治疗疾病、病症或状况的药剂中的用途。

在一些实施例中，提供了如本文所述的非人动物在制造和/或开发抗体中的用途，所述抗体结合趋化因子或电压-门控钠(Na_V)通道。

在一些实施例中，提供了如本文所述的非人动物在制造用于治疗或检测疾病的药剂中的用途，所述疾病的特征在于趋化因子或电压门控钠(Na_V)通道表达或功能(例如，异常表达或功能)。

在一些实施例中，提供了如本文所述的非人动物用于制造和/或开发用于治疗或诊断的药物。

在一些实施例中，提供了如本文所述的非人动物用于制造用于治疗、预防或改善疾病、病症或状况的药物。

在一些实施例中，提供了如本文所述的非人动物用于制造和/或开发结合趋化因子或电压门控钠(Na_V)通道的抗体。

在一些实施例中，疾病、病症或状况是炎性疾病、病症或状况。在一些实施例中，疾病、病症或状况的特征在于趋化因子表达或功能(例如，异常趋化因子表达或功能)。

在一些实施例中，疾病、病症或状况是疼痛疾病、病症或状况。在一些实施例中，疾病、病症或状况的特征在于离子通道表达或功能(例如，异常Na_V通道表达或功能)。

在许多实施例中，本文提供的非人动物是啮齿类动物；在一些实施例中，是小鼠；在一些实施例中，是大鼠。

如本申请中所用，术语"约"和"大约"可等同使用。本申请中与或不与约/大约一起使用的任何数字意在涵盖由相关领域普通技术人员所理解的任何正常波动。

本文公开的非人动物、细胞、核酸和组合物的其它特点、目的和优点在下述某些实施例的详细描述中是显而易见的。然而，应该理解，尽管指出了某些实施例，但详细描述仅作为说明而不是限制给出。

附图说明

本文中包括的由以下各图组成的附图仅用于举例说明目的而非用于限制。

图1A-1D显示了所选择的D6趋化因子诱饵受体编码序列的示例性优化，以包括体细胞超突变热点。图1A：具有天然(虚线填充)和人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的D6趋化因子诱饵受体的优化的Nterm结构域；图1B：具有天然(虚线填充)和人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的D6趋化因子诱饵受体的优化的EC1结构域；图1C：具有天然(虚线填充)和人工(对角线填充)RGYW AID热点位置的D6趋化因子诱饵受体的优化的EC2结构域；图1D：具有天然(虚线填充)和人工(对角线填充)RGYW AID热点位置的D6趋化因子诱饵受体的优化的EC3结构域。

图2显示了针对每个核苷酸编码序列设计的示例性优化的5'和3'重组信号序列(RSS)的表，以允许在V(D)J重组期间核苷酸编码序列的有效重组频率和相等使用。总体RSS共有序列5’RSS(SEQ ID NO:51)；总体RSS共有序列3’RSS(SEQ ID NO:52)；人D_H共有序列5’RSS(SEQ ID NO:53)；人D_H共有序列3’RSS(SEQ ID NO:54)；小鼠D_H共有序列5’RSS(SEQ IDNO:55)；小鼠D_H共有序列3’RSS(SEQ ID NO:56)；优化的RSS 5’RSS(SEQ ID NO:57)；优化的RSS 3’RSS(SEQ ID NO:58)；1-1 opt 5’RSS(SEQ ID NO:59)；1-1 opt 3’RSS(SEQ ID NO:60)；1-7 opt 5’RSS(SEQ ID NO:61)；1-7 opt 3’RSS(SEQ ID NO:62)；1-14 ORF opt 5’RSS(SEQ ID NO:63)；1-14 ORF opt 3’RSS(SEQ ID NO:64)；1-20 opt 5’RSS(SEQ ID NO:65)；1-20 opt 3’RSS(SEQ ID NO:66)；1-26 opt 5’RSS(SEQ ID NO:67)；1-26 opt 3’RSS(SEQ ID NO:68)；2-2*02 opt 5’RSS(SEQ ID NO:69)；2-2*02 opt 3’RSS(SEQ ID NO:70)；2-8*01 opt 5’RSS(SEQ ID NO:71)；2-8*01 opt 3’RSS(SEQ ID NO:72)；2-15 opt 5’RSS(SEQ ID NO:73)；2-15 opt 3’RSS(SEQ ID NO:74)；2-21*02 opt 5’RSS(SEQ ID NO:75)；2-21*02 opt 3’RSS(SEQ ID NO:76)；3-3*01 opt 5’RSS(SEQ ID NO:77)；3-3*01 opt 3’RSS(SEQ ID NO:78)；3-9 opt 5’RSS(SEQ ID NO:79)；3-9 opt 3’RSS(SEQ ID NO:80)；3-10*01 opt 5’RSS(SEQ ID NO:81)；3-10*01 opt 3’RSS(SEQ ID NO:82)；3-16*02 opt 5’RSS(SEQ ID NO:83)；3-16*02 opt 3’RSS(SEQ ID NO:84)；3-22 opt 5’RSS(SEQ ID NO:85)；3-22 opt 3’RSS(SEQ ID NO:86)；4-4 opt 5’RSS(SEQ ID NO:87)；4-4 opt 3’RSS(SEQ ID NO:88)；4-11 ORF opt 5’RSS(SEQ ID NO:89)；4-11 ORF opt 3’RSS(SEQ ID NO:90)；4-17 opt 5’RSS(SEQ ID NO:91)；4-17 opt 3’RSS(SEQ ID NO:92)；4-23 ORF opt 5’RSS(SEQ ID NO:93)；4-23 ORF opt 3’RSS(SEQ ID NO:94)；5-5 opt 5’RSS(SEQ ID NO:95)；5-5 opt 3’RSS(SEQ ID NO:96)；5-12 opt 5’RSS(SEQ ID NO:97)；5-12 opt 3’RSS(SEQ ID NO:98)；5-18 opt 5’RSS(SEQ ID NO:99)；5-18 opt 3’RSS(SEQ ID NO:100)；5-24 ORF opt 5’RSS(SEQ ID NO:101)；5-24 ORF opt 3’RSS(SEQ ID NO:102)；6-6 opt 5’RSS(SEQ ID NO:103)；6-6 opt 3’RSS(SEQ ID NO:104)；6-13 opt 5’RSS(SEQ ID NO:105)；6-13 opt 3’RSS(SEQ ID NO:106)；6-19 opt 5’RSS(SEQ ID NO:107)；6-19 opt 3’RSS(SEQ ID NO:108)；6-25(未优化的)5’RSS(SEQ ID NO:109)；6-25(未优化的)3’RSS(SEQID NO:110)；7-27(未优化的)5’RSS(SEQ ID NO:111)；7-27(未优化的)3’RSS(SEQ ID NO:112)。用于总体RSS共有序列以及7-27的粗体和斜体字体指示基于来自免疫球蛋白和T细胞受体V、D和J基因区段的啮齿类动物和人RSS与总体RSS共有序列的匹配；用于小鼠D_H共有序列的粗体字体指示与小鼠免疫球蛋白D_H共有序列的匹配；用于人D_H共有序列、优化的RSS和所有剩余的RSS(例如，1-1 opt、1-7 opt、1-20 opt等)的粗体字体指示与人免疫球蛋白D_H共有序列的匹配。

图3A-3B显示了用于构建靶向载体的示例性策略的不按照比例的图示，所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述免疫球蛋白重链可变区包括经改造的多样性簇(即D_H区)，所述多样性簇包括各自编码非免疫球蛋白多肽的一部分(例如D6趋化因子诱饵受体的细胞外部分)的一个或多个核苷酸序列。图3A：突出显示了四个初始步骤(1)D6编码序列的从头合成，(2)选择盒(例如新霉素)和D6 DNA片段的AgeI/EcoRI消化和连接，(3)D6 DNA片段的SnaBI消化和BAC载体(pBacE3.6)的NotI/AscI消化，和(4)消化的DNA片段的一步等温装配，以产生D6趋化因子诱饵受体编码序列的连续经改造的多样性簇代替传统D_H区段；图3B：用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的另外步骤，(5)25个合成的D6趋化因子诱饵受体编码序列的PI-SceI/I-CeuI消化和连接到BAC克隆内，以悬挂分别含有人免疫球蛋白V_H DN A和J_H DNA的5'和3'同源臂。对于每个描绘的DNA片段指出了各种限制酶识别位点。lp：loxP位点；neo：由泛素启动子驱动的新霉素选择盒；cm：氯霉素选择盒；frt：翻转酶识别靶序列；hyg：潮霉素选择盒；Ei：鼠重链内含子增强子；IgM：鼠免疫球蛋白M恒定区基因；lox：pBACe3.6载体的loxP位点序列。

图4A-4B显示了通过顺序连接用于构建靶向载体，以装配D6趋化因子诱饵受体编码序列的替代示例性策略的不按照比例的图示，所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述免疫球蛋白重链可变区包括经改造的多样性簇(即经改造的D_H区)，所述多样性簇包括各自编码D6趋化因子诱饵受体的细胞外部分的一个或多个核苷酸序列。图4A：突出显示了四个初始步骤(1)D6编码序列的从头合成，(2)选择盒(例如新霉素)和D6DNA片段的AgeI/EcoRI消化和连接，(3)D6 DNA片段的NotI/AscI消化和连接到BAC载体(pBacE3.6)内，和(4)D6片段的PacI/Nsi消化和连接到BAC载体主链内；图4B：用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的两个另外步骤，(5)另外的D6 DNA片段的PI-SceI/I-CeuI消化和连接到BAC载体主链内，和(6)最终的D6 DNA片段的NsiI/I-CeuI消化和连接，以产生在BAC载体主链内的25个合成的D6趋化因子诱饵受体编码序列。对于每个描绘的DNA片段指出了各种限制酶识别位点；lp：loxP位点序列；neo：由泛素启动子驱动的新霉素选择盒；cm：氯霉素选择盒。

图5显示了通过

筛选的电穿孔和核型分析后，使用抗药性克隆的遗传材料的示例性筛选策略。各种引物/探针组(参见表7)的名称和大致位置(由椭圆形包围的线)(不按照比例)在显示的各种等位基因下方指出。hyg：由泛素启动子驱动的潮霉素选择盒；neo：由泛素启动子驱动的新霉素选择盒；L：loxP位点序列；Frt：翻转酶识别靶序列。

图6A-6L显示了所选择的μ-芋螺毒素和狼蛛毒素编码序列的示例性优化，以包括体细胞超突变热点。图6A：具有人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的μ-芋螺毒素的优化的KIIIA fl；图6B：具有人工(对角线填充)RGYW活化诱导胞苷脱氨酶(AID)热点位置的μ-芋螺毒素的优化的KIIIA mini(上)和KIIIA midi(下)；图6C：具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的PIIIA fl；图6D：具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的PIIIA mini(上)和PIIIA midi(下)；图6E：具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的SMIIIA fl；图6F：具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的SmIIIA mini(上)和SmIIIAmidi(下)；图6G：具有人工(对角线填充)RGYW AID热点位置的优化的ProTxII狼蛛毒素；图6H：具有人工(对角线填充)RGYW AID热点位置的优化的狼蛛毒素Pro TxII C1SC4S(上)、ProTxII C2SC5S(中)和ProTxII C3SC6S(下)；图6I：具有人工(对角线填充)RGYW AID热点位置的μ-芋螺毒素的优化的SmIIIA SSRW环(左)、SmIIIA SSKW环(中)和PIIIA RSRQ环(右)；图6J：具有人工(对角线填充)RGYW AID热点位置的D_H3区段位置中，μ-芋螺毒素的优化的KIIIA或SmIIIA mini/midi；图6K：具有人工(对角线填充)RGYW AID热点位置的D_H3或D_H1区段位置中，μ-芋螺毒素的优化的SmIIIA或PIIIA mini/midi；图6L：具有人工(对角线填充)RGYW AID热点位置的D_H2区段位置中，μ-芋螺毒素的优化的SSRW或RSRQ环。

图7A-7B显示了用于构建靶向载体的示例性策略的不按照比例的图示，所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述包括免疫球蛋白重链可变区经改造的多样性簇(即经改造的D_H区)，所述多样性簇包括各自编码非免疫球蛋白多肽的一部分(例如，μ-芋螺毒素和/或狼蛛毒素的一部分)的一个或多个核苷酸序列。图7A：突出显示了四个初始步骤(1)毒素编码序列的从头合成，(2)选择盒(例如新霉素)和毒素DNA片段(TX-DH1166)的AgeI/EcoRI消化和连接，(3)毒素DNA片段的SnaBI消化和BAC载体(pBac E3.6)的NotI/AscI消化，和(4)消化的DNA片段的一步等温装配，以产生经改造的多样性簇，所述经改造的多样性簇包含连续毒素编码序列代替一个或多个和任选地，所有功能性D_H基因区段；图7B：用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的另外步骤，(5)26个合成毒素编码序列的PI-SceI/I-CeuI消化和连接到BAC克隆内，以悬挂分别含有人免疫球蛋白V_H DNA和J_H DNA的5'和3'同源臂。对于每个描绘的DNA片段指出了各种限制酶识别位点；lp：loxP位点；neo：由泛素启动子驱动的新霉素选择盒；cm：氯霉素选择盒；frt：翻转酶识别靶序列；hyg：潮霉素选择盒；Ei：鼠重链内含子增强子；IgM：鼠免疫球蛋白M恒定区基因；lox：pBA Ce3.6载体的loxP。

图8A-8B显示了通过顺序连接用于构建靶向载体，以装配毒素(例如，μ-芋螺毒素和狼蛛毒素)的编码序列的替代示例性策略的不按照比例的图示，所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述免疫球蛋白重链可变区包括经改造的多样性簇(即D_H区)，所述多样性簇包括各自编码毒素肽(例如，μ-芋螺毒素和狼蛛毒素ProTxII)的一部分的一个或多个核苷酸序列。图8A：突出显示了四个初始步骤(1)毒素编码序列的从头合成，(2)选择盒(例如新霉素)和毒素DNA片段(TX-DH1166)的AgeI/EcoRI消化和连接，(3)毒素DNA片段的NotI/AscI消化和连接到BAC载体(pBacE3.6)内，和(4)毒素DNA片段的PacI/Nsi消化和连接到BAC载体主链内；图8B：用于产生用于整合到啮齿类动物ES细胞的基因组内的靶向载体的两个另外步骤，(5)另外的毒素DNA片段的PI-SceI/I-CeuI消化和连接到BAC载体主链内，和(6)最终的毒素DNA片段的NsiI/I-CeuI消化和连接，以产生在BAC载体主链内的26个合成的毒素编码序列。对于每个描绘的DNA片段指出了各种限制酶识别位点；lp：loxP位点；neo：由泛素启动子驱动的新霉素选择盒；cm：氯霉素选择盒。

图9A-9D显示了从

(VI)和小鼠中收获，并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图，所述小鼠对于含有毒素编码序列的经改造的D_H区是纯合的(6579ho/1293ho，“TX-D_H ho”；具有基因组的啮齿类动物品系，所述基因组包含纯合的免疫球蛋白重链基因座，其含有多个人V_H、包括毒素编码序列代替传统D_H区段的经改造的D_H区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]；以及纯合的免疫球蛋白κ轻链基因座，其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图9A：对于单峰门控的来自脾的淋巴细胞的代表性等高线图，示出了CD19(y轴)和CD3(x轴)的表达。图9B：对于CD19⁺门控的来自脾单峰的淋巴细胞的代表性等高线图，示出了免疫球蛋白D(IgD，y轴)和免疫球蛋白M(IgM，x轴)的表达；在每个点图上指出了成熟(CD19⁺IgD⁺IgM^int)和过渡(CD19⁺IgD^int IgM)B细胞。图9C：对于CD19⁺门控的来自脾单峰的淋巴细胞的代表性等高线图，示出了Igλ(y轴)或Igκ(x轴)轻链的表达。图9D：显示了B细胞成熟的代表性等高线图，示出了对于CD19⁺门控的来自脾单峰的淋巴细胞，并且显示了CD93(y轴)和B220(x轴)、IgM(y轴)和CD23(x轴)；CD21/35(y轴)和IgM(x轴)、B220(y轴)和CD23(x轴)、以及IgD(y轴)和IgM(x轴)[从左到右]的表达。顶部行：

小鼠；底部行：TX-D_H ho(6579ho/1293ho)小鼠。每个点图上指出了特异性B细胞群体：未成熟(CD19⁺CD93⁺B220⁺)、成熟(CD19⁺CD93^-B220⁺)、T1(CD19⁺CD93⁺B220⁺IgM⁺CD23^-)、T2(CD19⁺CD93⁺B220⁺IgM⁺CD23⁺)、T3(CD19⁺CD93⁺B220⁺IgM^int CD23⁺)、MZ(CD19⁺CD93^-B220⁺CD21/35⁺IgM⁺CD23^-)、MZ前体(CD19⁺CD93^-B220⁺CD21/35⁺IgM⁺CD23⁺)、Fol I(CD19⁺CD93^-B220⁺CD21/35^intIgM^int IgD⁺)、以及Fol II(CD19⁺CD93^-B220⁺CD21/35^int IgM⁺IgD⁺)

图10A-10D显示了从

(VI)和小鼠中收获，并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图，所述小鼠对于含有毒素编码序列的经改造的D_H区是纯合的(6579ho/1293ho，“TX-D_H ho”；具有基因组的啮齿类动物品系，所述基因组包含纯合的免疫球蛋白重链基因座，其含有多个人V_H、包括毒素编码序列代替传统D_H区段的经改造的D_H区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]；以及纯合的免疫球蛋白κ轻链基因座，其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图10A：对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图，示出了CD19(y轴)和CD3(x轴)的表达。图10B：对于CD19⁺IgM^-/lowIgD^–门控的来自骨髓的淋巴细胞的代表性等高线图，示出了c-kit(y轴)和CD43(x轴)的表达；在每个点图上指出了前(c-kit^-CD43^-)和原B(c-kit⁺CD43⁺)细胞。图10C：对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图，示出了IgM(y轴)和B220(x轴)的表达；在每个点图上指出了未成熟(IgM^{int to+}B220^int)和成熟(IgM^{int to+}B220⁺)B细胞。图10D：对于CD19⁺IgM^{int to+}B220^int(顶部行)和CD19⁺IgM^int/+B220⁺(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图，示出了Igλ(y轴)或Igκ(x轴)轻链的表达。

图11A-11D显示了从

(VI)和小鼠中收获，并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图，所述小鼠对于含有D6编码序列的经改造的D_H区是杂合的(6590het，“D6-D_H het”；具有基因组的啮齿类动物品系，所述基因组包含杂合的免疫球蛋白重链基因座，其含有多个人V_H、包括D6趋化因子诱饵受体编码序列代替传统D_H区段的经改造的D_H区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940])。图11A：对于单峰门控的来自脾的淋巴细胞的代表性等高线图，示出了CD19(y轴)和CD3(x轴)的表达。图11B：对于CD19⁺单峰门控的来自脾的淋巴细胞的代表性等高线图，示出了IgD(y轴)和IgM(x轴)的表达；在每个点图上指出了成熟(CD19⁺IgD⁺IgM^int)和过渡(CD19⁺IgD^int IgM⁺)B细胞。图11C：对于CD19⁺单峰门控的来自脾的淋巴细胞的代表性等高线图，示出了Igλ(y轴)或Igκ(x轴)轻链的表达。图11D：显示了B细胞成熟的代表性等高线图，示出了对于CD19⁺单峰门控的来自脾的淋巴细胞，并且显示了CD93(y轴)和B220(x轴)、IgM(y轴)和CD23(x轴)；CD21/35(y轴)和IgM(x轴)、B220(y轴)和CD23(x轴)、以及IgD(y轴)和IgM(x轴)[从左到右]的表达。顶部行：

小鼠；底部行：D6-D_H het(6590het)小鼠。每个点图上指出了特异性B细胞群体：未成熟(CD19⁺CD93⁺B220⁺)、成熟(CD19⁺CD93^-B220⁺)、T1(CD19⁺CD93⁺B220⁺IgM⁺CD23^-)、T2(CD19⁺CD93⁺B220⁺IgM⁺CD23⁺)、T3(CD19⁺CD93⁺B220⁺IgM^int CD23⁺)、MZ(CD19⁺CD93^-B220⁺CD21/35⁺IgM⁺CD23^-)、MZ前体(CD19⁺CD93^-B220⁺CD21/35⁺IgM⁺CD23⁺)、Fol I(CD19⁺CD93^-B220⁺CD21/35^int IgM^int IgD⁺)、以及Fol II(CD19⁺CD93^-B220⁺CD21/35^int IgM⁺IgD⁺)

图12Α-12D显示了从

(VI)和小鼠中收获，并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图，所述小鼠对于含有D6编码序列的经改造的D_H区是杂合的(6590het，“D6-D_H het”；具有基因组的啮齿类动物品系，所述基因组包含杂合的免疫球蛋白重链基因座，其含有多个人V_H、包括D6趋化因子诱饵受体编码序列代替传统D_H区段的经改造的D_H区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940])。图12A：对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图，示出了CD19(y轴)和CD3(x轴)的表达。图12B：对于CD19⁺IgΜ^{-to low} IgD^–门控的来自骨髓的淋巴细胞的代表性等高线图，示出了c-kit(y轴)和CD43(x轴)的表达；在每个点图上指出了前B(c-kit^-CD43^-)和原B(c-kit⁺CD43⁺)细胞。图12C：对于CD19⁺门控的来自骨髓的淋巴细胞的代表性等高线图，示出了IgM(y轴)和B220(x轴)的表达；在每个点图上指出了未成熟(IgM^{int to+}B220^int)和成熟(IgM^{int to+}B220⁺)B细胞、前和原B细胞(IgΜ^{-to low} B220^int)。图12D：对于CD19⁺IgM^{int to+}B220^int(顶部行)和CD19⁺IgM^{int to+}B220⁺(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图，示出了Igλ(y轴)或Igκ(x轴)轻链的表达。

图13Α-13D显示了从

(VI)和小鼠中收获，并且就各种细胞标记物的细胞表面表达染色的脾中的淋巴细胞的代表性等高线图，所述小鼠对于含有D6编码序列的经改造的D_H区是纯合的(6590ho/1293ho，“D6-D_H ho”；具有基因组的啮齿类动物品系，所述基因组包含纯合的免疫球蛋白重链基因座，其含有多个人V_H、包括D6趋化因子诱饵受体编码序列代替传统D_H区段的经改造的D_H区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]；以及纯合的免疫球蛋白κ轻链基因座，其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图13A：对于单峰门控的来自脾的淋巴细胞的代表性等高线图，示出了CD19(y轴)和CD3(x轴)的表达。图13B：对于CD19⁺门控的来自脾的淋巴细胞的代表性等高线图，示出了IgD(y轴)和IgM(x轴)的表达；在每个点图上指出了成熟(CD19⁺IgD⁺IgM^int)和过渡(CD19⁺IgD^int IgM⁺)B细胞。图13C：对于CD19⁺门控的来自脾的淋巴细胞的代表性等高线图，示出了Igλ(y轴)或Igκ(x轴)轻链的表达。图13D：显示了B细胞成熟的代表性等高线图，示出了对于CD19⁺单峰门控的来自脾的淋巴细胞，并且显示了CD93(y轴)和B220(x轴)、IgM(y轴)和CD23(x轴)；CD21/35(y轴)和IgM(x轴)、B220(y轴)和CD23(x轴)、以及IgD(y轴)和IgM(x轴)[从左到右]的表达。顶部行：

小鼠；底部行：D6-D_H ho(6590ho)小鼠。每个点图上指出了特异性B细胞群体：未成熟(CD19⁺CD93⁺B220⁺)、成熟(CD19⁺CD93^-B220⁺)、T1(CD19⁺CD93⁺B220⁺IgM⁺CD23^-)、T2(CD19⁺CD93⁺B220⁺IgM⁺CD23⁺)、T3(CD19⁺CD93⁺B220⁺IgM^int CD23⁺)、MZ(CD19⁺CD93^-B220⁺CD21/35⁺IgM⁺CD23^-)、MZ前体(CD19⁺CD93^-B220⁺CD21/35⁺IgM⁺CD23⁺)、Fol I(CD19⁺CD93^-B220⁺CD21/35^int IgM^int IgD⁺)、以及FolII(CD19⁺CD93^-B220⁺CD21/35^int IgM⁺IgD⁺)

图14Α-14D显示了从

(VI)和小鼠中收获，并且就各种细胞标记物的细胞表面表达染色的骨髓中的淋巴细胞的代表性等高线图，所述小鼠对于含有D6编码序列的经改造的DD_H区是杂合的(6590ho/1293ho，“D6-DD_H ho”；具有基因组的啮齿类动物品系，所述基因组包含纯合的免疫球蛋白重链基因座，其含有多个人VD_H、包括D6趋化因子诱饵受体编码序列代替传统DD_H区段的经改造的DD_H区段、以及与包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区可操作地连接的JD_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]；以及纯合的免疫球蛋白κ轻链基因座，其含有与包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因可操作地连接的人Vκ和Jκ基因区段)。图14A：对于单峰门控的来自骨髓的淋巴细胞的代表性等高线图，示出了C D19(y轴)和CD3(x轴)的表达。图14B：对于CD19⁺IgΜ^{-to low}IgD^–门控的来自骨髓的淋巴细胞的代表性等高线图，示出了c-kit(y轴)和CD43(x轴)的表达；在每个点图上指出了前B(c-kit^-CD43^-)和原B(c-kit⁺CD43⁺)细胞。图14C：对于CD19⁺门控的来自骨髓的淋巴细胞的代表性等高线图，示出了IgM(y轴)和B220(x轴)的表达；在每个点图上指出了未成熟(IgM^{int to+}B220^int)和成熟(IgM^{int to+}B220⁺)B细胞、前和原B细胞(IgΜ^{-to low}B220^int)。图14D：对于CD19⁺IgM^{int to+}B220^int(顶部行)和CD19⁺IgM^{int to+}B220⁺(底部行)门控的来自骨髓的淋巴细胞的代表性等高线图，示出了Igλ(y轴)或Igκ(x轴)轻链的表达。

图15显示了来自三只6579ho/1293ho小鼠(“TX-D_H ho”，同上)的脾和骨髓(组合的所有V_H家族，不反映定量V_H使用)的扩增RNA中的经改造的D_H区中的毒素编码序列的代表性使用频率。y轴指出了经改造的D_H区内每个毒素编码序列的名称。x轴指出了在分析的序列读数中每个毒素编码序列的频率(序列的百分比)。

图16显示了来自三只6579ho/1293ho小鼠(“TX-D_H ho”，同上)的脾和骨髓(组合的所有V_H家族，不反映定量V_H使用)的扩增RNA中的人V_H基因区段的代表性百分比使用。x轴指出了人源化的重链可变区内的每个人V_H基因区段的名称。

图17显示了来自三只6579ho/1293ho小鼠(“TX-D_H ho”，同上)的脾和骨髓(组合的所有V_H家族，不反映定量J_H使用)的扩增RNA中的人J_H基因区段的代表性百分比使用。x轴指出了在人源化的重链可变区内的每个人J_H基因区段的名称。

图18显示了来自三只6590het小鼠(“D6-D_H het”，同上)的脾和骨髓(组合的所有V_H家族，不反映定量V_H使用)的扩增RNA中的经改造的D_H区中所选择的D6编码序列的代表性使用频率。y轴指出了经改造的D_H区内所选择的D6编码序列的名称。x轴指出了在分析的序列读数中D6编码序列的频率(序列的百分比)。BM：骨髓。

图19显示了来自三只6590het小鼠(“D6-D_H het”，同上)的脾和骨髓(组合的所有V_H家族，不反映定量V_H使用)的扩增RNA中的人V_H基因区段的代表性百分比使用。x轴指出了人源化的重链可变区内的每个人V_H基因区段的名称。BM：骨髓。

图20显示了来自三只6590het小鼠(“D6-D_H het”，同上)的脾和骨髓(组合的所有V_H家族，不反映定量J_H使用)的扩增RNA中的人J_H基因区段的代表性百分比使用。x轴指出了在人源化的重链可变区内的每个人J_H基因区段的名称。BM：骨髓。

图21显示了用经改造的可溶形式的细胞表面蛋白免疫后，来自对照和6579HO/1634动物(x轴)的超过本底的滴度(y轴)。

定义

阅读本公开内容的本领域技术人员将意识到可能与这些所描述的实施例等价或另外在本公开内容的范围内的各种修改。一般而言，除非另外明确说明，否则本文使用的术语根据其在本领域中理解的含义。本文和下文提供了某些术语的明确定义；这些和其它术语在说明书自始至终在特定情况下的含义根据上下文对于本领域技术人员是明确的。下述术语和其它术语的另外定义在说明书各处阐述。本说明书中引用的参考文献或其相关部分以引用的方式并入本文。

施用：指将组合物施用于受试者或系统(例如细胞、器官、组织、生物、或相关组分或其组分组)。本领域普通技术人员将了解，施用途径可根据例如组合物待施用于其的受试者或系统、组合物的性质、施用目的等而变化。例如，在一些实施例中，对动物受试者(例如人或啮齿类动物)的施用可为支气管(包括通过支气管滴注)、颊、肠、皮间(interdermal)、动脉内、皮内、胃内、髓内、肌内、鼻内、腹膜内、鞘内、静脉内、心室内、粘膜、鼻腔、口腔、直肠、皮下、舌下、局部、气管(包括通过气管内滴注)、透皮、阴道和/或玻璃体。在一些实施例中，施用可涉及间歇给药。在一些实施例中，施用可涉及连续给药(例如，灌注)至少所选择的时间段。

术语“抗体”包括通常的免疫球蛋白分子，其包含四条多肽链，通过二硫键互连的两条重链(H)(其各自可包含由经改造的D_H簇编码的氨基酸序列)和两条轻链(L)(其可为共同轻链)。该术语还包括对抗原或其片段具有反应性的免疫球蛋白。合适的抗体包括但不限于人抗体、灵长类化抗体、嵌合抗体、单克隆抗体、单特异性抗体、多克隆抗体、多特异性抗体、非特异性抗体、双特异性抗体、多重特异性抗体、人源化抗体、合成抗体、重组抗体、杂交抗体、突变抗体、移植缀合抗体(即与其它蛋白质、放射性标记、细胞毒素缀合或融合的抗体)和体外生成的抗体。技术人员将容易地识别常见抗体同种型，例如具有选自IgG、IgA、IgM、IgD和IgE及其任何亚类(例如IgG1、IgG2、IgG3和IgG4)的重链恒定区的抗体)。

大约：当应用于一个或多个目的值时，指与所述参考值相似的值。在某些实施例中，除非另有所指或根据上下文明显不同，否则术语“大约”或“约”是指在任一方向(大于或小于)上落在所述参考值的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％或更小内的值的范围(除了这样的数字将超过可能值的100％的情况外)。

生物学活性：指在生物系统中、在体外或体内(例如在生物中)具有活性的任何试剂的特征。例如，当存在于生物中时，在该生物内具有生物效应的试剂视为生物活性的。在特定实施例，当蛋白质或多肽具有生物活性时，所述该蛋白质或多肽的共享所述蛋白质或多肽的至少一种生物活性的部分通常被称为“生物活性”部分。

可比较的：指两个或更多个试剂、实体、情况、条件组等，其可彼此不相同，但足够相似以允许在其间的比较，使得可基于观察到的差异或相似性合理地得出结论。本领域普通技术人员在上下文中将理解，在任何给定的情况下，对于两种或更多种这样的药剂、实体、情形、条件组等需要多大程度的同一性来被认为是可比较的。

短语“互补决定区”或术语“CDR”包括由生物的免疫球蛋白基因的核酸序列编码的氨基酸序列，其通常(即在野生型动物中)出现在免疫球蛋白分子(例如抗体或T细胞受体)的轻链或重链的可变区中的两个构架区之间。CDR可由例如种系序列或者重排或未重排序列，以及例如天然或成熟的B细胞或T细胞编码。CDR可为体细胞突变的(例如，不同于动物的种系中编码的序列)、人源化的和/或用氨基酸取代、添加或缺失修饰的。在一些情况下(例如对于CDR3)，CDR可由两个或更多个序列(例如，种系序列)编码，所述两个或更多个序列是不邻接的(例如，未重排的核酸序列中)，但在B细胞核酸序列中是邻接的，例如由于剪接或连接序列(例如，V-D-J重组以形成重链CDR3)。

保守：提及保守氨基酸取代，指氨基酸残基由具有含有相似化学性质(例如电荷或疏水性)的侧链R基团的另一个氨基酸残基的取代。一般来讲，保守氨基酸取代基本上不会改变蛋白质的所关注的功能性质，例如，受体结合配体的能力。具有含有相似化学性质的侧链的氨基酸组的例子包括：脂肪族侧链如甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；脂肪族-羟基侧链如丝氨酸和苏氨酸；含酰胺侧链如天冬酰胺和谷氨酰胺；芳香族侧链如苯丙氨酸、酪氨酸和色氨酸；碱性侧链如赖氨酸、精氨酸和组氨酸；酸性侧链如天冬氨酸和谷氨酸；以及含硫侧链如半胱氨酸和甲硫氨酸。保守氨基酸取代组包括例如缬氨酸/亮氨酸/异亮氨酸、苯丙氨酸/酪氨酸、赖氨酸/精氨酸、丙氨酸/缬氨酸、谷氨酸/天冬氨酸以及天冬酰胺/谷氨酰胺。在一些实施例中，保守氨基酸取代可为丙氨酸对蛋白质中的任何天然残基的取代，如例如丙氨酸扫描诱变中所使用的。在一些实施例中，制备保守取代，其在Gonnet,G.H.等人，1992,Science 256:1443-1445中公开的PAM250对数似然矩阵中具有正值，所述参考文献以引用的方式并入本文。在一些实施例中，取代是中等保守取代，其中所述取代在PAM250对数似然矩阵中具有非负值。

对照：指“对照”是结果针对其进行比较的标准的本领域理解的含义。通常，对照通过分离变量以得出有关此类变量的结论而用于增进实验完整性。在一些实施例中，对照是与测试反应或测定同时进行以提供对比物的反应或测定。“对照”可指“对照动物”。“对照动物”可具有如本文所述的修饰，与本文所述的修饰不同的修饰或不具有修饰(即，野生型动物)。在一个实验中，应用"测试"(即，待测试的变量)。在第二个实验中，不应用“对照”，待测试的变量。在一些实施例中，对照是历史对照(即，此前进行的测试或测定，或此前已知的量或结果)。在一些实施例中，对照是或包括印刷或以其他方式保存的记录。对照可为阳性对照或阴性对照。

破坏：指与DNA分子(例如，与内源同源序列如基因或基因基因座)的同源重组事件的结果。在一些实施例中，破坏可实现或代表插入、缺失、取代、替换、错义突变或DNA序列移码或它们的组合。插入可包括插入整个基因、基因片段例如外显子(其可具有除内源序列外的起源(例如，异源序列))、或者从特定目的基因衍生或分离的编码序列。在一些实施例中，破坏可提高基因或基因产物的(例如由基因编码的蛋白质的)表达和/或活性。在一些实施例中，破坏可降低基因或基因产物的表达和/或活性。在一些实施例中，破坏可改变基因或编码的基因产物(例如编码的蛋白质)的序列。在一些实施例中，破坏可截短基因或编码的基因产物(例如编码的蛋白质)或使其片段化。在一些实施例中，破坏可延伸基因或编码的基因产物。在一些这样的实施例中，破坏可实现融合蛋白的装配。在一些实施例中，破坏可影响基因或基因产物的水平，但不影响其活性。在一些实施例中，破坏可影响基因或基因产物的活性，但不影响其水平。在一些实施例中，破坏可对基因或基因产物的水平没有显著影响。在一些实施例中，破坏可对基因或基因产物的活性没有显著影响。在一些实施例中，破坏可对基因或基因产物的水平或活性都没有显著影响。

确定、测量、评估、评价、测定和分析：可互换使用以指任何形式的测量，并且包括确定元素是否存在。这些术语包括定量和/或定性测定。测定可为相对的或绝对的。“测定...的存在”包括确定存在的某物的量和/或确定其是否存在。

内源性基因座或内源性基因：指在引入如本文所述的改变、破坏、缺失、插入、修饰、取代或替换之前，在亲本或参考生物中发现的遗传基因座。在一些实施例中，内源基因座全部或部分包含在自然界中发现的序列。在一些实施例中，内源性基因座为野生型基因座。在一些实施例中，参考生物是野生型生物。在一些实施例中，参考生物是经改造的生物。在一些实施例中，参考生物是实验室繁殖的生物(无论是野生型还是经改造的)。

内源启动子指例如在野生型生物中与内源基因天然相关的启动子。

经改造的：一般而言，指已通过人为操纵的方面。例如，在一些实施例中，当不以自然界中的顺序连接在一起的两个或更多个序列通过人为操纵而在经改造的多核苷酸中直接彼此连接时，多核苷酸可被视为“经改造的”。在一些具体的此类实施例中，经改造的多核苷酸可以包含自然界中存在的与第一编码序列可操作地结合但不与第二编码序列可操作地结合的调控序列，该调控序列通过人为连接而使得其与第二编码序列可操作地结合。可替代地或另外地，在一些实施例中，各自编码在自然界中彼此不连接的多肽元件或结构域的第一核酸序列和第二核酸序列可在单个经改造的多核苷酸中彼此连接。相比之下，在一些实施例中，如果细胞或生物已被操纵而使得其遗传信息被改变(例如，先前不存在的新遗传物质已经被引入，或者先前存在的遗传物质已被改变或移除)，则该细胞或生物可以被视为“经改造的”。如通常实践并且由本领域的技术人员所理解的，即使实际的操作是对先前的实体进行的，经改造的多核苷酸或细胞的子代通常仍然被称为“经改造的”。此外，本领域的技术人员将认识到，可以通过多种可用的方法来实现本文所述的“改造”。例如，在一些实施例中，“改造”可以涉及通过使用计算机系统进行选择或设计(例如，核酸序列、多肽序列、细胞、组织和/或生物)，所述计算机系统经编程以执行分析或比较，或者分析、推荐和/或选择序列、改变等)。可替代地或另外地，在一些实施例中，“改造”可涉及使用体外化学合成方法和/或重组核酸技术，例如核酸扩增(例如，经由聚合酶链反应)、杂交、突变、转化、转染等、和/或各种受控交配方法中的任一种。如本领域技术人员了解的，各种已建立的此类技术(例如用于重组DNA、寡核苷酸合成和组织培养和转化(例如电穿孔、脂转染等)是本领域众所周知的，并且在本说明书自始至终引用和/或讨论的各种一般和更具体的参考文献中描述。参见例如Sambrook等人,Molecular Cloning:A La boratory Manual(第2版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989)。

基因：指编码产物(例如，RNA产物和/或多肽产物)的染色体中的DNA序列。在一些实施例中，基因包括编码序列(即，编码特定产物的序列)。在一些实施例中，基因包括非编码序列。在一些特定实施例中，基因可以包括编码(例如，外显子)和非编码(例如，内含子)序列二者。在一些实施例中，基因可包括一个或多个调控序列(例如启动子、增强子等)和/或内含子序列，其例如可控制或影响基因表达的一个或多个方面(例如细胞类型特异性表达、诱导型表达等)。为了清楚起见，我们注意到，如在本专利申请中使用的，术语“基因”一般指编码多肽的核酸的一部分；该术语可任选涵盖调控序列，如根据上下文对于本领域的普通技术人员将明确的。该定义并非预期排除将术语“基因”应用于非蛋白质编码表达单元，而是为了阐明在大多数情况下，如本文件中使用的该术语指编码多肽的核酸。

短语“基因区段”或“区段”包括提及V(轻或重)或者D或J(轻或重)免疫球蛋白基因区段，其包括在免疫球蛋白基因座处(例如在人和小鼠中)的未重排序列，所述未重排序列可参与重排(由例如内源性重组酶介导的)，以形成重排的V/J(轻)或V/D/J(重)序列。除非另有说明，否则V、D和J区段包含允许根据12/23规则的V/J重组或V/D/J重组的重组信号序列(RSS)。除非另有说明，否则区段还包含它们在自然界中与之结合的序列或其功能等价物(例如，对于V区段，启动子和前导序列)。

提及免疫球蛋白核酸序列的术语“种系”包括可传递给后代的核酸序列，例如可在生殖细胞中发现的种系基因组。

短语“重链”或“免疫球蛋白重链”包括来自任何生物的免疫球蛋白重链序列，包括免疫球蛋白重链恒定区序列。除非另有说明，否则重链可变结构域包括三个重链互补决定区(CDR)和四个FR区。重链片段包括CDR、CDR和FR及其组合。典型的重链在可变结构域之后具有(从N末端到C末端)C_H1结构域、铰链、C_H2结构域、C_H3结构域和C_H-4结构域(在IgM或IgE的情况下)。重链的功能片段包括能够特异性识别表位(例如，以在微摩尔、纳摩尔或皮摩尔范围内的KD识别表位)的片段，其能够由细胞表达且分泌，以及包含至少一个CDR。重链可变结构域由可变区基因序列编码，所述可变区基因序列一般包含源自存在于种系中的V_H、D_H和J_H区段储库的V_H、D_H和J_H区段。可在www.imgt.org处发现的国际免疫遗传学信息系统(International Immunogenetics Information System)(IMGT)网站上查看各种生物的V、D和J重链区段的序列、位置和命名。

短语“轻链”包括来自任何生物的免疫球蛋白轻链序列，并且除非另有说明，否则包括人κ和λ轻链和VpreB以及替代轻链。除非另有说明，否则轻链可变结构域通常包括三个轻链互补决定区(CDR)和四个构架(FR)区。一般地，全长轻链从氨基末端到羧基末端包括可变结构域和轻链恒定区，所述可变结构域包括FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4。轻链可变结构域由轻链可变区基因序列编码，所述轻链可变区基因序列一般包含源自种系中存在的V_L和J_L基因区段储库的V_L和J_L基因区段。可在ww w.imgt.org处发现的国际免疫遗传学信息系统(IMGT)网站上查看各种生物的V和J轻链区段的序列、位置和命名。轻链包括例如不选择性结合由它们在其中出现的表位结合蛋白选择性结合的第一表位或第二表位的那些轻链。轻链还包括结合并识别、或帮助重链结合并识别由它们在其中出现的表位结合蛋白选择性结合的一个或多个表位的那些轻链。短语轻链包括“共同轻链”，也被称为“通用轻链”(ULC)。

共同或通用轻链(ULC)包括源自免疫球蛋白轻链基因座的那些，所述免疫球蛋白轻链基因座包含与轻链恒定区可操作地连接的单个重排的免疫球蛋白轻链可变区编码序列，其中所述免疫球蛋白轻链基因座的表达仅产生源自可操作性连接至轻链恒定区的单个重排的免疫球蛋白轻链可变区的轻链，不管在免疫球蛋白轻链基因座中是否包括其它核酸序列，例如其它轻链基因区段。通用轻链包括人Vκ1-39Jκ基因(例如Vκ1-39Jκ5基因)或人Vκ3-20Jκ基因(例如Vκ3-20Jκ1基因)，并且包括其体细胞突变的(例如，亲和力成熟的)形式。

异源的：指来自不同来源的试剂或实体。例如，当用于提及存在于特定细胞或生物中的多肽、基因或基因产物时，该术语阐明相关多肽或其片段、基因或其片段、或者基因产物或其片段：1)被人为改造；2)被人为(例如，经由遗传改造)引入细胞或生物(或其前体)中；和/或3)是由相关细胞或生物(例如，相关细胞类型或生物类型)非天然地产生或非天然地存在于所述细胞或生物中。如本文使用的，术语“异源”还包括这样的多肽或其片段、基因或其片段、或者基因产物或其片段，其通常存在于特定天然细胞或生物中，但已例如通过突变或置于非天然结合以及在一些实施例中非内源性调节元件(例如启动子)的控制下进行修饰。

宿主细胞：指异源(例如外源)核酸或蛋白质已引入其内的细胞。本领域技术人员在阅读本公开内容后将理解，此类术语不仅指特定的主题细胞，而且还用于指该细胞的子代。因为某些修饰可因突变或环境影响而在后续世代中发生，所以这样的子代事实上可不等同于亲本细胞，但仍包括在如本文中使用的术语“宿主细胞”的范围内。在一些实施例中，宿主细胞为原核或真核细胞或包含原核或真核细胞。一般来讲，宿主细胞是适于接受和/或产生异源核酸或蛋白质的任何细胞，而与所述细胞被指定所属的生命界无关。示例性细胞包括原核生物和真核生物(单细胞或多细胞)的那些、细菌细胞(例如大肠杆菌(Escherichia coli)、芽孢杆菌属物种(Bacillus spp.)、链霉菌属物种(Streptomycesspp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichiapastoris)、甲醇毕赤酵母(Pichia methanolica)等)、植物细胞、昆虫细胞(例如SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人动物细胞、人细胞或细胞融合物，例如杂交瘤或四源杂交瘤。在一些实施例中，细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施例中，细胞为真核细胞并且选自以下细胞：CHO(例如CHO K1、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾(例如HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60、(例如BHK21)、Jurkat、Daudi、A431(表皮的)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT060562、Sertoli细胞、BRL 3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施例中，细胞包含一个或多个病毒基因，例如表达病毒基因的视网膜细胞(例如PER.

细胞)。在一些实施例中，宿主细胞为分离的细胞或包含分离的细胞。在一些实施例中，宿主细胞为组织的一部分。在一些实施例中，宿主细胞为生物的一部分。

同一性：与序列比较结合使用指如通过本领域已知的可用于测量核苷酸和/或氨基酸序列同一性的多种不同算法确定的同一性。在一些实施例中，使用ClustalW v.1.83(慢)比对(利用10.0的开放缺口罚分、0.1的延伸缺口罚分)和使用Gonnet相似性矩阵(MACVECTOR^TM10.0.2,MacVector Inc.,2008)来确定本文所述的同一性。

在体外：指在人工环境中，例如在试管或反应容器中，在细胞培养等中，而不是在多细胞生物内发生的事件。

在体内：指在多细胞生物例如人和非人动物内发生的事件。在基于细胞的系统的背景下，该术语可用于指在活细胞内(与例如体外系统相反)发生的事件。

分离的：指在最初生产时(无论在自然界中和/或在实验环境中)，已(1)与它结合的至少一些组分分开，和/或(2)通过人为设计、产生、制备和/或制造的物质和/或实体。分离的物质和/或实体可与约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或超过约99％的最初与其关联的其他组分分离。在一些实施例中，分离的药剂为约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或超过约99％纯的。如本文所用，如果物质基本上不含其他组分，则其是“纯的”。在一些实施例中，如将被本领域技术人员所理解的，物质在与某些其他组分例如一种或多种载体或赋形剂(例如，缓冲液、溶剂、水等)组合后，仍可被认为是“分离的”或甚至“纯的”；在此类实施例中，计算物质在不包括此类载体或赋形剂情况下的分离百分比或纯度。只是给出一个实例，在一些实施例中，天然存在的生物聚合物诸如多肽或多核苷酸a)在因其衍生的起源或来源而不与在其天然状态下天然伴随其的一些或全部组分关联时；b)在其基本上不含与天然产生其的物种相同的物种的其他多肽或核酸时；c)当由不是天然产生其的物种的细胞或其他表达系统表达或以其他方式与来自所述细胞或其他表达系统的组分关联时，被认为是“分离的”。因此，例如，在一些实施例中，化学合成的或在与天然产生其的细胞系统不同的细胞系统中合成的多肽被认为是"分离的"多肽。可替代地或另外地，在一些实施例中，已历经一种或多种纯化技术的多肽在其已与a)在自然界中与其关联的；和/或b)当最初产生时与其关联的其他组分分离的程度上可被认为是“分离的”多肽。

非人动物：指并非人的任何脊椎动物生物。在一些实施例中，非人动物为圆口纲脊椎动物、硬骨鱼、软骨鱼(例如，鲨鱼或鳐)、两栖动物、爬行动物、哺乳动物或鸟。在一些实施例中，非人哺乳动物为灵长类动物、山羊、绵羊、猪、狗、牛或啮齿类动物。在一些实施例中，非人动物为诸如大鼠或小鼠的啮齿动物。

核酸：在其最广泛的意义上，指掺入或可掺入寡核苷酸链内的任何化合物和/或物质。在一些实施例中，“核酸”是通过磷酸二酯键联被掺入到或可被掺入到寡核苷酸链中的化合物和/或物质。从上下文可以看出，在一些实施例中，“核酸”是指单个核酸残基(例如核苷酸和/或核苷)；在一些实施例中，“核酸”是指含有含单个核酸残基的寡核苷酸链。在一些实施例中，“核酸”为RNA或包含RNA；在一些实施例中，“核酸”为DNA或包含DNA。在一些实施例中，“核酸”为一个或多个天然核酸残基、包含一个或多个天然核酸残基或由一个或多个天然核酸残基组成。在一些实施例中，“核酸”为一个或多个核酸类似物、包含一个或多个核酸类似物或由一个或多个核酸类似物组成。在一些实施例中，核酸类似物与“核酸”的差别在于其不利用磷酸二酯主链。例如，在一些实施例中，“核酸”为一个或多个“肽核酸”、包含一个或多个肽核酸、或者由一个或多个“肽核酸”组成，所述“肽核酸”是本领域已知的，并且在主链中具有肽键代替磷酸二酯键。可替代地或另外地，在一些实施例中，“核酸”具有一个或多个硫代磷酸酯和/或5’-N-亚磷酰胺键而不是磷酸二酯键。在一些实施例中，“核酸”为一个或多个天然核苷(例如，腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)、包含一个或多个天然核苷、或由一个或多个天然核苷组成。在一些实施例中，“核酸”为一个或多个核苷类似物(例如，2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入型碱基及其组合)、包含一个或多个核苷类似物或由一个或多个核苷类似物组成。在一些实施例中，与天然核酸中的糖相比，“核酸”包含一个或多个经修饰的糖(例如，2'-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖)。在一些实施例中，“核酸”具有编码功能性基因产物诸如RNA或蛋白质的核苷酸序列。在一些实施例中，“核酸”具有编码多肽片段(例如肽)的核苷酸序列。在一些实施例中，“核酸”包括一个或多个内含子。在一些实施例中，“核酸”包括一个或多个外显子。在一些实施例中，“核酸”包括一个或多个编码序列。在一些实施例中，“核酸”通过下述方式中的一种或多种来制备：从天然来源分离、通过基于互补模板的聚合(体内或体外)进行的酶促合成、在重组细胞或系统中的复制、化学合成及其组合。在一些实施例中，“核酸”的长度为至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基。在一些实施例中，“核酸”为单链的；在一些实施例中，“核酸”为双链的。在一些实施例中，“核酸”具有包含至少一个元件的核苷酸序列，所述至少一个元件编码多肽或其片段，或者是编码多肽或其片段的序列的互补体。在一些实施例中，“核酸”具有酶促活性。

可操作地连接：指其中所述组分处于允许它们以其预期方式起作用的关系中的并列。与编码序列"可操作地连接"的控制序列以这样的方式连接，使得在与控制序列相容的条件下获得编码序列的表达。"可操作地连接"序列包括与所关注的基因相邻的表达控制序列和以反式方式作用或远距离作用以控制所关注的基因的表达控制序列。如本文使用的，术语“表达控制序列”指多核苷酸序列，其是影响它们与之连接的编码序列的表达和加工所必要的多核苷酸序列。“表达控制序列”包括合适的转录起始、终止、启动子和增强子序列；有效的RNA加工信号例如剪接和多聚腺苷酸化信号；使细胞质mRNA稳定的序列；增强翻译效率的序列(即Kozak共有序列)；增强蛋白稳质定性的序列；以及当需要时，增强蛋白分质泌的序列。这种控制序列的性质取决于宿主生物而不同。例如，在原核生物中，这种控制序列一般包括启动子、核糖体结合位点和转录终止序列，而在真核生物中，通常地，这种控制序列包括启动子和转录终止序列。术语"控制序列"旨在包括其存在对于表达和加工来说是必需的组分，并且还可包括额外的组分，其存在是有利的，例如，前导序列和融合配偶体序列。

生理条件：包括细胞或生物在其下生存和/或繁殖的其领域理解含义的参考条件。在一些实施例中，该术语指对于生物或细胞系统在自然界可发生的外部或内部环境的条件。在一些实施例中，生理条件是存在于人或非人动物体内的那些条件，尤其是存在于手术部位处和/或手术部位内的那些条件。生理条件通常包括例如20-40℃的温度范围、大气压力1、pH 6-8、1-20mM的葡萄糖浓度、以大气水平的氧浓度和如它在地球上遇到的重力。在一些实施例中，实验室中的条件在生理条件下操纵和/或维持。在一些实施例中，生理条件在生物(例如，非人动物)中遇到。

多肽：指氨基酸的任何聚合链。在一些实施例中，多肽具有天然存在的氨基酸序列。在一些实施例中，多肽具有非天然存在的氨基酸序列。在一些实施例中，多肽具有氨基酸序列，其包含彼此单独天然存在的部分(即，来自两种或更多种不同的生物，例如，人和非人部分)。在一些实施例中，多肽具有通过人为行为进行设计和/或产生的被改造的氨基酸序列。在一些实施例中，多肽可包含多个片段或由多个片段组成，所述片段各自相对于彼此以与目的多肽中发现的那种不同的空间排列在相同亲本多肽中发现(例如在亲本中直接连接的片段可在目的多肽中在空间上分开，或反之亦然，和/或片段可在目的多肽中以与在亲本中不同的次序存在)，使得目的多肽是其亲本多肽的衍生物。

重组体：指通过重组手段设计、改造、制备、表达、产生或分离的多肽，例如使用转染到宿主细胞内的重组表达载体表达的多肽，从重组组合的人多肽文库分离的多肽(Hoogenboom H.R.,1997 TIB Tech.15:62-70；Hoogenboom H.和Chames P.，2000,Immunology Today 21:371-378；Azzazy H.和Highsmith W.E.，2002,Clin.Biochem.35:425-445；Gavilondo J.V.和Larrick J.W.，2002,BioTechniques 29:128-145)，从对于人免疫球蛋白基因是转基因的动物(例如小鼠)中分离的抗体(参见例如Taylor,L.D.等人，1992,Nucl.Acids Res.20:6287-6295；Little M.等人，2000,Im munology Today 21:364-370；Kellermann S.A.和Green L.L.，2002,Current Opini on in Biotechnology 13:593-597；Murphy,A.J.等人，2014,Proc.Natl.Acad.Sci.U.S.A.111(14):5153-5158)，或者通过涉及将所选序列元件彼此剪接的任何其它手段制备、表达、产生或分离的多肽。在一些实施例中，此类选定的序列元件中的一个或多个是天然存在的。在一些实施例中，此类选定的序列元件中的一个或多个是在计算机芯片上(in silico)设计的。在一些实施例中，一个或多个此类选定的序列元件由已知序列元件的诱变(例如体内或体外)产生，所述已知序列元件例如来自天然来源或合成来源。例如，在一些实施例中，重组多肽包含在目的源生物(例如人、小鼠等)的基因组(或多肽)中发现的序列。在一些实施例中，重组多肽包含在两种不同生物(例如人和非人生物)中，在自然界中彼此分开存在的序列(即，来自两种或更多种不同生物，例如人和非人部分)。在一些实施例中，重组多肽具有来源于诱变(例如在体外或体内，例如在非人动物中)的氨基酸序列，使得重组多肽的氨基酸序列是这样的序列，其虽然源于多肽序列且与多肽序列相关，但可能并非天然存在于非人动物体内的基因组内。

参考：预期描述试剂、动物、群组、个体、群体、样品、序列或目的值针对其进行比较的标准或对照试剂、动物、群组、个体、群体、样品、序列或值。在一些实施例中，参考试剂、动物、群组、个体、群体、样品、序列或值与试剂、动物、群组、个体、群体、样品、序列或目的值的测试或确定基本上同时进行测试和/或确定。在一些实施例中，参考试剂、动物、群组、个体、群体、样品、序列或值是历史参考，任选在有形介质中体现。在一些实施例中，参考可指对照。如本文所用，“参考”可以指“参考动物”。“参考动物”可具有如本文所述的修饰，与本文所述的修饰不同的修饰或不具有修饰(即，野生型动物)。通常，本领域内的技术人员将理解，参考药剂、动物、群组、个体、群体、样品、序列或值一定的条件下进行测定或表征，所述条件与用来测定或表征所关注的药剂、动物(例如哺乳动物)、群组、个体、群体、样品、序列或值的条件类似。

免疫球蛋白参与称为体细胞超突变的细胞机制，其产生特征在于对其靶的高亲和力的亲和力成熟的抗体变体。尽管体细胞超突变在很大程度上在抗体可变区的CDR内发生，但突变优先靶向称为热点的某些序列基序，例如RGYW活化诱导胞苷脱氨酶(AID)热点(参见例如Li,Z.等人，2004,Genes Dev.18:1-11；Teng,G.和F.N.Papavasiliou,2007,Annu.Rev.Genet.41:107-20；在此以引用的方式并入)。本文公开的可用于生成经改造的D_H区的目的非免疫球蛋白肽或其一部分可包含一个或多个天然和/或人工热点。短语“体细胞突变的”包括对来自已经历类别转换的B细胞的核酸序列的提及，其中所述类别转换的B细胞中的免疫球蛋白可变区的核酸序列(例如，编码重链可变结构域或者包括重链CDR或FR序列的核苷酸序列)与类别转换之前的B细胞中的核酸序列不同，例如没有经历类别转换的B细胞和已经历类别转换的B细胞之间的CDR或构架核酸序列中的差异。“体细胞突变的”包括对来自亲和力成熟的B细胞的核酸序列的提及，所述核酸序列与并非亲和力成熟的B细胞中的相应免疫球蛋白可变区序列(即，种系细胞的基因组中的序列)不同。短语“体细胞突变的”还包括对B细胞暴露于目的表位之后来自B细胞的免疫球蛋白可变区核酸序列的提及，其中所述核酸序列不同于B细胞暴露于目的表位之前的相应核酸序列。短语“体细胞突变的”指来自结合蛋白的序列，所述结合蛋白响应免疫原攻击在动物(例如，具有人免疫球蛋白可变区核酸序列的小鼠)中生成，并且来源于在此类动物中固有地运转的选择过程。

基本上：指显示出目的特征或性质的总体或接近总体程度或范围的定性条件。生物学领域的普通技术人员将理解，生物和化学现象很少(如果有的话)进行至完成和/或进行至完全，或实现或避免绝对的结果。因此术语“基本上”用于捕捉潜在的在许多生物和化学现象中固有的完全性的缺乏。

基本同源性：指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的，如果两个序列在对应的位置上含有同源残基，则它们通常被认为是“基本上同源的”。同源残基可为相同的残基。可替代地，同源残基可为具有适当相似的结构和/或功能特征的非相同的残基。例如，如由本领域的普通技术人员所熟知的，某些氨基酸通常被归类为“疏水性”或“亲水性”氨基酸，和/或归类为具有“极性”或“非极性”侧链。一个氨基酸对另一个相同类型的氨基酸的取代可通常被认为是“同源”取代。通常的氨基酸分类在下文概括。

如本领域中所熟知的，氨基酸或核酸序列可使用多种算法中的任意算法来进行比较，所述算法包括商业计算机程序中可获得的那些算法如用于核苷酸序列的BLASTN以及用于氨基酸序列的BLASTP、空位BLAST和PSI-BLAST。示例性的这种程序在以下中描述：Altschul,S.F.等人，1990,J.Mol.Biol.,215(3):403-410；Altschul,S.F.等人，1997,Methods in Enzymology；Altschul,S.F.等人，1997,Nucleic Acids Res.,25:3389-3402；Baxevanis,A.D.和B.F.F.Ouellette(编辑)Bioinformatics:A Pract ical Guide to theAnalysis of Genes and Proteins,Wiley,1998；以及Misener等人(编辑)BioinformaticsMethods and Protocols(Methods in Molecular Biology，第132卷)，Humana Press,1998。除了鉴定同源序列以外，上文提及的程序通常还提供同源性程度的指示。在一些实施例中，如果两个序列的至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的相应残基在相关的残基序列段(stretch)上是同源的，则这两个序列被认为是基本上同源的。在一些实施例中，相关序列段为完全序列。在一些实施例中，相关序列段为至少9个、10个、11个、12个、13个、14个、15个、16个、17个或更多个残基。在一些实施例中，相关序列段包括沿着完全序列的连续残基。在一些实施例中，相关序列段包括沿着完全序列的不连续残基，例如通过多肽或其一部分的折叠构象结合在一起的非连续残基。在一些实施例中，相关序列段为至少10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个残基。

基本同一性：指氨基酸或核酸序列之间的比较。如本领域普通技术人员将理解的，如果两个序列在对应的位置上含有相同残基，则它们通常被认为是“基本上相同的”。如本领域中所熟知的，氨基酸或核酸序列可使用多种算法中的任意算法来进行比较，所述算法包括商业计算机程序中可获得的那些算法如用于核苷酸序列的BLASTN以及用于氨基酸序列的BLASTP、空位BLAST和PSI-BLAST。示例性的这种程序在以下中描述：Altschul,S.F.等人，1990,J.Mol.Biol.,215(3):403-410；Altschul,S.F.等人，1997,Methods inEnzymology；Altschul,S.F.等人，1997,Nucleic Acids Res.,25:3389-3402；Baxevanis,A.D.和B.F.F.Ouellette(编辑)Bioinformatics:A Pract ical Guide to the Analysisof Genes and Proteins,Wiley,1998；以及Misener等人(编辑)Bioinformatics Methodsand Protocols(Methods in Molecular Biology，第132卷)，Humana Press,1998。除了鉴定相同的序列以外，上文提及的程序通常还提供同一性程度的指示。在一些实施例中，如果两个序列的至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的相应残基在相关的残基序列段上是相同的，则这两个序列被认为是基本上相同的。在一些实施例中，相关序列段为完全序列。在一些实施例中，相关序列段为至少10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个残基。

转化：指通过其将外源DNA引入宿主细胞内的任何过程。转化可使用本领域众所周知的各种方法在天然或人工条件下发生。转化可依赖用于将外源核酸序列插入原核或真核宿主细胞内的任何已知方法。在一些实施例中，特定的转化方法基于待转化的宿主细胞选择，并且可包括但不限于病毒感染、电穿孔、交配、脂转染。在一些实施例中，“经转化的”细胞被稳定转化，因为插入的DNA能够作为自主复制质粒或作为宿主染色体的部分复制。在一些实施例中，经转化的细胞瞬时表达引入的核酸有限的时间段。

靶向载体或靶向构建体：指包含靶向区域的多核苷酸分子。靶向区域包含与靶细胞、组织或动物中的序列相同或基本上相同并且提供靶向构建体经由同源重组至所述细胞、组织或动物的基因组内的位置中的整合的序列。还包括使用位点特异性重组酶识别位点(例如，loxP或Frt位点)靶向的靶向区域。在一些实施例中，如本文所述的靶向构建体还包含特定目的核酸序列或基因、可选择标记物、对照和/或调控序列、以及允许通过外源添加蛋白质介导的重组的其它核酸序列，所述蛋白质帮助或促进涉及此类序列的重组。在一些实施例中，靶向构建体还包含全部或部分的目的基因，其中所述目的基因是编码全部或部分多肽的异源基因，所述多肽具有与由内源序列编码的蛋白质相似的功能。在一些实施例中，靶向构建体还包含全部或部分的目的人源化基因，其中所述目的人源化基因编码全部或部分多肽，所述多肽具有与由内源序列编码的多肽相似的功能。在一些实施例中，靶向构建体(或靶向载体)可包含由人为操纵的核酸序列。例如，在一些实施例中，可构建靶向构建体(或靶向载体)，以包含含有两个或更多个序列的经改造的或重组多核苷酸，所述两个或更多个序列在自然界中未以该次序连接在一起，而是由人为操纵在经改造的或重组多核苷酸中彼此直接相互连接。

转基因或转基因构建体：指例如通过本文所述的方法由人为引入细胞内的核酸序列(编码例如全部或部分目的多肽)。转基因对于它引入其内的转基因动物或细胞可为部分或完全异源的，即外源的。转基因可包括一个或多个转录调控序列和任何其它核酸，如内含子或启动子，这对于所选择的核酸序列的表达可能是必要的。

转基因动物、转基因非人动物或Tg⁺：可互换使用，并且指任何非天然存在的非人动物，其中非人动物的一种或多种细胞含有全部或部分异源核酸和/或编码目的多肽的基因。在一些实施例中，通过有意的遗传操纵，例如通过显微注射或通过用重组病毒感染，通过引入前体细胞内，将异源核酸和/或基因直接或间接地引入细胞内。术语遗传操作不包括经典育种技术，而是针对重组DNA分子的引入。该分子可整合到染色体内，或者它可为染色体外复制的DNA。术语“Tg⁺”包括对于异源核酸和/或基因为杂合或纯合的动物，和/或具有异源核酸和/或基因的单拷贝或多拷贝的动物。

变体：指这样的实体，其显示与参考实体显著的结构同一性，但与参考实体相比在一种或多种化学部分的存在或水平下在结构上参考实体。在许多实施例中，“变体”还在功能上与其参考实体不同。一般来讲，特定实体是否被适当地认为是参考实体的“变体”是基于其与参考实体的结构同一性的程度。如本领域技术人员将理解的，任何生物或化学参考实体具有某些特征性结构元件。根据定义，“变体”是共享一个或多个此类特征性结构元件的不同的化学实体。只是给出一些实例，小分子可具有特征性核结构元件(例如，大环核)和/或一个或多个特征性侧链部分，以使得小分子的变体是共享核结构元件和特征性侧链部分，但在其他侧链部分上和/或在存在于核内的键的类型(单键相对于双键，E相对于Z，等)上不同的分子，多肽可具有包含在线性或三维空间中相对于彼此具有指定的位置和/或促成特定生物功能的多个氨基酸的特征性序列元件，核酸可具有包含在线性或三维空间中相对于彼此具有指定的位置的多个核苷酸残基的特征性序列元件。例如，“变体多肽”可由于氨基酸序列中的一个或多个差异和/或共价附接于多肽主链的化学部分(例如，碳水化合物、脂质等)中的一个或多个差异而与参考多肽不同。在一些实施例中，“变体多肽”显示出与参考多肽具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％或99％的总体序列同一性。替代地或另外地，在一些实施例中，“变体多肽”不与参考多肽共享至少一个特征性序列元件。在一些实施例中，参考多肽具有一种或多种生物活性。在一些实施例中，“变体多肽”共享参考多肽的一种或多种生物活性。在一些实施例中，“变体多肽”缺乏参考多肽的一种或多种生物活性。在一些实施例中，“变体多肽”显示出相较于参考多肽降低水平的一种或多种生物活性。在许多实施例中，如果所关注的多肽具有与亲代的氨基酸序列相同但在特定位置上具有少数序列改变的氨基酸序列，则所关注的多肽被认为是亲代或参考多肽的“变体”。通常，与亲本相比，变体中少于20％、15％、10％、9％、8％、7％、6％、5％、4％、3％或2％的残基被取代。在一些实施例中，“变体”变体相较于亲代具有10个、9个、8个、7个、6个、5个、4个、3个、2个或1个取代的残基。通常，“变体”具有极少数目(例如，少于5个、4个、3个、2个或1个)的取代的功能残基(即，参与特定生物活性的残基)。此外，相较于亲代，“变体”通常具有不超过5个、4个、3个、2个或1个添加或缺失，并且通常不具有添加或缺失。此外，任何添加或缺失通常少于约25个、约20个、约19个、约18个、约17个、约16个、约15个、约14个、约13个、约10个、约9个、约8个、约7个、约6个残基，并且通常少于约5个、约4个、约3个或约2个残基。在一些实施例中，亲代或参考多肽是天然发现的多肽。如将由本领域普通技术人员所理解的，所关注的特定多肽的多个变体通常可为天然存在的，特别是当所关注的多肽为传染原多肽时。

载体：指能够转运它与之结合的另一种核酸的核酸分子。在一些实施例中，载体能够在宿主细胞诸如真核和/或原核细胞中进行染色体外复制和/或表达与它们连接的核酸。能够指导可操作地连接的基因表达的载体在本文中被称为“表达载体”。

野生型：包括其领域理解的含义，其指具有如在自然界中在“正常”(与突变体、患病的、改变的等相比)状态或背景下发现的结构和/或活性的实体。本领域普通技术人员将了解，野生型基因和多肽经常以多种不同的形式(例如，等位基因)存在。

具体实施方式

本文尤其公开了具有编码目的多肽的一个或多个部分(功能片段、结合部分等)的异源遗传材料的转基因非人动物，所述异源遗传材料被插入免疫球蛋白重链可变区的多样性簇(即D_H区)内，使得异源遗传材料与重链可变(VH_H)和连接(J_H)区段可操作地连接。考虑此类非人动物证实生成针对难治性疾病靶的抗体的能力。还考虑此类非人动物证实这样的抗体群体，其特征在于与具有由传统免疫球蛋白D_H基因区段(或自然界中出现的免疫球蛋白D_H基因区段)生成的免疫球蛋白重链可变CDR3多样性的抗体群体相比，具有CDR3多样性中的增加的重链可变区。因此，本文所述的非人动物可用于开发基于抗体的治疗剂，其结合特定抗原，特别是与低免疫原性和/或弱免疫原性有关的抗原。特别地，本文公开的是将示例性核苷酸编码序列引入免疫球蛋白重链可变区的D_H区内，所述核苷酸编码序列各自编码目的多肽的一部分(例如，非典型趋化因子受体的细胞外部分、芋螺毒素的一部分或狼毒毒素的一部分)，导致具有由涉及插入的核苷酸编码序列的V(D)J重组生成的重链可变区，且特别是CDR3区的抗体的表达。在一些实施例中，目的多肽(例如非典型趋化因子受体(ACKR)、芋螺毒素、狼蛛毒素或其组合)的插入的核苷酸编码序列替换在如本文所述的免疫球蛋白重链多样性簇(即，D_H区)内的全部或基本上全部的传统D_H区段(即野生型D_H区段)。在一些实施例中，目的多肽(例如非典型趋化因子受体(ACKR)、芋螺毒素、狼蛛毒素或其组合)的插入的核苷酸编码序列部分替换在如本文所述的免疫球蛋白重链多样性簇(即D_H区)内的一个或多个传统D_H区段。在一些实施例中，目的多肽(例如非典型趋化因子受体(ACKR)、芋螺毒素、狼蛛毒素或其组合)的核苷酸编码序列插入如本文所述的免疫球蛋白重链多样性簇(即D_H区)内的一个或多个传统D_H区段内，使得所述核苷酸编码序列侧翼为在一个或多个传统D_H区段通常或天然发现、或者与一个或多个传统DH区段结合的序列。在一些实施例中，一个或多个传统D_H区段在如本文所述的免疫球蛋白重链多样性簇内保持完整。在一些实施例中，一个或多个传统D_H区段从如本文所述的免疫球蛋白重链多样性簇中缺失、去除或以其它方式致使无功能。在一些特定实施例中，如本文所述的免疫球蛋白重链多样性簇缺乏全部或基本上全部的传统D_H区段。在一些特定实施例中，如本文所述的免疫球蛋白重链多样性簇包含使用本文所述的核苷酸编码序列制备或生成的合成D_H区段。这种转基因非人动物提供了用于鉴定和开发抗体和/或基于抗体的治疗剂的体内系统，所述抗体和/或基于抗体的治疗剂结合疾病靶超出已建立的药物发现技术的靶向能力。此外，此类转基因非人动物提供了用于开发抗体和/或基于抗体的治疗剂的有用动物模型系统，所述抗体和/或基于抗体的治疗剂集中于或设计用于破坏对于影响人的各种疾病和/或疾病病理学关键的蛋白质-蛋白质相互作用。

在一些实施例中，本文所述的非人动物包含免疫球蛋白重链可变区，其含有经改造的多样性簇(即经改造的D_H区)，其特征在于对应于目的多肽的一部分的一个或多个核苷酸编码序列的存在，所述目的多肽例如ACKR(例如D6趋化因子诱饵受体)的细胞外结构域、毒素(例如离子通道阻断剂，例如芋螺毒素、蜘蛛毒素、狼蛛毒素、海葵毒素或蝎毒素)、G蛋白偶联受体、选择抗体的长重链CDR(例如结合病毒包括例如HIV、HCV、HPV、流感等的中和抗体)、胰高血糖素样肽1受体激动剂(例如艾塞那肽、利拉鲁肽、利西拉肽、阿必鲁肽、杜拉鲁肽(dulaglutide)、他司鲁泰等)、来自非人物种(例如鸟、鸡、牛、兔、猪等)的重链多样性(D_H)基因区段等。在这样的实施例中，含有由涉及这种核苷酸编码序列的重组生成的CDR3的抗体可表征为具有增加的多样性，以指导与特定抗原(例如跨膜多肽)的结合。在一些实施例中，由本文所述的非人动物产生的抗体具有免疫球蛋白重链可变区序列，其含有对应于由一个或多个核苷酸编码序列编码的肽的CDR3区。在一些实施例中，本文所述的非人动物包含与一个或多个核苷酸编码序列可操作地连接的重链可变(V_H)和连接(J_H)基因区段，使得V(D)J重组发生在所述V_H、J_H和一个或多个核苷酸编码序列之间，以产生结合目的抗原的重链可变区。在一些实施例中，本文所述的非人动物包含在非人动物的基因组中的免疫球蛋白重链可变区处，与5、10、15、20、25个或更多个(例如多个)核苷酸编码序列可操作地连接的多个V_H和J_H基因区段。在许多实施例中，V_H和J_H区段是人V_H和人J_H基因区段。在一些实施例中，本文所述的非人动物还包含人或人源化的免疫球蛋白轻链基因座(例如κ和/或λ)，使得非人动物产生包含人可变区(即重和轻)的抗体和非人恒定区的抗体。在一些特定实施例中，所述人或人源化的免疫球蛋白轻链基因座包含与啮齿类动物轻链恒定区(例如啮齿类动物Cκ或Cλ)可操作地连接的人V_L和J_L基因区段。在一些实施例中，本文所述的非人动物还包含如以下中描述的免疫球蛋白轻链基因座：美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0185821 A1、2013-0198880A1、2013-0302836 A1、2015-0059009 A1；国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202；所有这些在此以引用的方式并入)。

下述节段中详细描述组合物和方法的各个方面。节段的使用不意味着限制任何实施例。每个节段可应用于具体描述的任何实施例。在本申请中，除非另有说明，"或"的使用意指"和/或"。

V(D)J重组

涉及几种遗传组分的一系列重组事件作用于从基因区段(例如V、D和J)的有序排列装配免疫球蛋白。已知基因区段的这种装配是不精确的，并且因此，通过组合不同基因区段和经由不精确连接形成独特连接两者实现免疫球蛋白多样性。通过称为体细胞超突变的过程生成进一步的多样性，其中改变所述免疫球蛋白的可变区序列，以增加对于抗原的亲和力和特异性。免疫球蛋白是由两个相同的重链和两个相同的轻链组成的Y形多肽，所述链各自具有两个结构组分：一个可变结构域和一个恒定结构域。它是由基因区段装配形成的重链和轻链的可变结构域，而恒定结构域通过RNA剪接与可变结构域融合。尽管装配(或连接)基因区段的机制对于重链和轻链是相似的，但轻链只需要一个连接事件(即V与J)，而重链需要两个连接事件(即D与J和V与DJ)。

用于重链和轻链可变区的基因区段的装配由保守的非编码DNA序列引导，所述非编码DNA序列侧接每个基因区段，称为重组信号序列(RSS)，其确保在相对于V、D和J编码序列的精确位置处的DNA重排(参见例如Ramsden,D.A.等人，1994,Nuc.Acids Res.22(10):1785-96)。每个RSS由以下组成：与编码序列(例如V区段)邻接的七个核苷酸(七聚体)的保守嵌段，随后为保守间隔物(12或23bp)和九个核苷酸(九聚体)的第二保守嵌段。尽管个体中相当大的序列趋异是耐受的，但这些序列的长度通常不改变。免疫球蛋白基因区段之间的重组遵循通常称为12/23规则的规则，其中侧翼为具有12bp间隔物的RSS的基因区段通常连接至侧翼为23bp间隔物的基因区段(参见例如Hiom,K.和M.Gellert，1998,Mol.Cell.1(7):1011-9)。RSS的序列已报道影响与特定基因区段重组的效率和/或频率(参见例如Ramsden,D.A和G.E.Wu，1991,Proc.Natl.Acad.Sci.U.S.A.88:10721-5；Boubnov,N.V.等人，1995,Nuc.Acids Res.23:1060-7；Ezekiel,U.R.等人，1995,Immunity 2:381-9；Sadofsky,M.等人，1995,Genes Dev.9:2193-9；Cuomo,C.A.等人，1996,Mol.Cell Biol.16:5683-90；Ramsden,D.A.等人，1996,EMBO J 15:3197-3206)。事实上，许多报告指出个体中的基因区段，特别是D_H区段的高度偏差和可变的使用。

在一些实施例中，本文所述的非人动物包含一个或多个RSS侧接编码序列，其对于与V和/或J基因区段重组进行优化。在各种实施例中，将编码序列插入免疫球蛋白重链基因座内的传统D_H基因区段(或自然界中出现的D_H基因区段)的位置中。可使用本领域已知的标准技术来实现RSS的优化，所述标准技术例如已知RSS序列的定点诱变、或合成的RSS序列的计算机芯片生成随后为从头合成。仅举一个例子，通过与和高或最佳重组效率和/或频率相关的RSS比较，可优化与低或弱重组效率和/或频率相关的RSS。在一些实施例中，重组效率和/或频率可通过抗体序列群体中基因区段的使用频率来确定(例如来自个体或个体组；参见例如Arnaout,R.等人，2011,PLoS One 6(8):e22365；Glanville,J.等人，2011,Proc.Natl.Acad.Sci.U.S.A.108(50):20066-71)。因此，在一些实施例中，本文所述的非人动物可包含一个或多个优化的RSS侧接编码序列(或基因区段)，使得编码序列(或基因区段)的重组以相等或大约相等的频率发生。示例性的优化RSS在图2中阐述。

基因区段装配以形成重链和轻链可变区导致形成免疫球蛋白的抗原结合区(或位点)。这样的抗原结合区部分特征在于高变区的存在，所述高变区通常被称为互补决定区(CDR)。对于重链和轻链两者存在三个CDR(即总共六个CDR)，其中CDR1和CDR2两者完全由V基因区段编码。然而，CDR3由来源于对于轻链的V和J区段，以及对于重链的V、D和J区段连接的序列编码。因此，在重组期间采用的另外的基因区段以形成重链可变区编码序列显著增加了重链的抗原结合位点的多样性。

趋化因子和趋化因子受体

免疫和炎症应答是涉及几种类型的免疫细胞和分子组分的复杂生物学过程。白细胞迁移已报道为免疫和炎症应答起始、维持和解决中的重要因素，其中一些通过趋化因子及其受体的作用来实现。事实上，已报道了几种趋化因子和相应的受体。趋化因子受体具有特征在于七次跨膜结构域的结构，所述七次跨膜结构域与G蛋白偶联用于在细胞内区室中的信号转导，并且分成对应于它们结合的趋化因子亚组的多个不同家族：CC-趋化因子受体(β-趋化因子受体)、CXC-趋化因子受体、CX3C-趋化因子受体和XC-趋化因子受体。除这些传统的趋化因子受体之外，已报道了其它趋化因子受体(称为非典型趋化因子受体或ACKR)，其共享相似结构，但缺乏响应配体结合而起始信号传导的能力)(参见例如Bonecchi,R.等人，2010,Curr.Top.Microbiol.Immuno l.341:15-36；Nibbs,R.J.B.和G.J.Graham,2013,Nature Rev.13:815-29)。

在ACKR中，ACKR2(也称为CCBP2和D6趋化因子诱饵受体)是与其它G蛋白偶联受体相似，且由CCBP2基因编码的七次跨膜蛋白受体(Nibbs,R.J.B.等人，1997,J.Biol.Chem.272(51):32078-83)。与其它趋化因子受体相反，ACKR2在第二个细胞内环中含有DKYLEIV基序代替经典DRYLAIV基序，并且不能通过Gα_i蛋白质信号传导。ACKR2在皮肤、肠和肺的淋巴管内皮细胞以及B细胞和树突状细胞上表达。ACKR是许多促炎β-趋化因子(CC-趋化因子)的混杂受体，但不结合组成性CCL趋化因子。已提出ACKR2是清道夫受体，其内化CC-趋化因子并靶向其用于溶酶体降解，从而经由CC-趋化因子的清除来限制炎症应答(Jamieson,T.等人，2005,Nature Immunol.6(4):403-11；Bonecchi,R.等人，同上；Hansell,C.A.H.等人，2011,Immunol.Cell Biol.89(2):197-206；Nibbs,R.J.B.和G.J.Graham，同上)。

肽毒素

毒素是在植物和动物中发现的可对人有毒的天然存在的物质。例如，芋螺在其毒液中产生称为芋螺毒素的神经毒性肽，其调节人中各种受体的活性。特别地，几种芋螺毒素已显示调节离子通道(例如Na_V通道)。通常，芋螺毒素是长度10至30个氨基酸的肽，其包括一个或多个二硫键，并且基于它们作用于其的靶来表征：α-芋螺毒素(乙酰胆碱受体)、δ-芋螺毒素(电压门控钠通道)、κ-芋螺毒素(钾通道)、μ-芋螺毒素(电压门控钠通道)和ω-芋螺毒素(电压门控钙通道)。已知芋螺毒素在蜗牛物种中是高度多态性的，并且因此编码它们的基因不是保守的(参见例如Terlau,H.和B.M.Olivera，2004,Physiol.Rev.84(1):41-68；Biggs,J.S.等人，2010,Mol.Phylogenet.Evol.56(1):1-12；Olivera,B.M.等人，2012,Ann.N.Y.Acad.Sci.1267(1):61-70；Wong,E.S.和K.Belov，2012,Gene 496(1):1-7)。

在芋螺毒素中，μ-芋螺毒素已报道具有两种类型的半胱氨酸模式，并作用于肌肉组织中的电压门控钠通道(Cruz,L.J.等人，1985,J.Biol.Chem.260(16):9280-8；Zeikus,R.D.等人，1985,J.Biol.Chem.260(16):9280-8；McIntosh,J.M.和R.M.Jones，2001,Toxicon.39(10):1447-51；Nielsen,K.J.等人，2002,J.Biol.Chem.277(30):27247-55；Floresca,C.Z.,2003,Toxicol.Appl.Pharmacol.190(2):95-101；Priest,B.T.等人，2007,Toxicon.49(2):194-201；Schmalhofer,W.A.等人，2008,Mol.Pharmacol.74(5):1476-84；Ekberg,J.等人，2008,Int.J.Biochem.Cell Biol.40(11):2363-8)。实际上，μ-芋螺毒素已因其潜在药理学用途而成为研究对象(参见例如Olivera,B.M.和R.W.Teichert,2007,Mol.Interv.7(5):251-60；Stevens,M.等人，2012,J.Biol.Chem.287(37):31382-92)。尽管已进行了几项研究来阐明各种μ-芋螺毒素的作用机制，但许多仍是未知的。

毒素的其它例子包括海葵、蝎子、蜘蛛和狼蛛的毒液，其已报道通过抑制活化并阻断神经元传递而作用于离子通道。事实上，已鉴定了几种蝎毒素并分辨了它们的结构(参见例如Rochat,H.和J.Gregoire,1983,Toxicon.21(1):153-62；Zhou,X.H.等人，1989,Biochem.J.257(2):509-17；Granier,C.等人，1990,FEBS Lett.261(2):423-6)。此外，使用来自蝎子毒液的毒素已开发了用于钾通道的基于神经毒素的文库(参见例如Takacs,Z.等人，2009,Proc.Natl.Acad.Sci.U.S.A.106(52):22211-6)。再举另外一个例子，来自狼蛛毒液的肽已报道特别作用于电压门控钠通道如Na_V1.5和Na_V1.7(参见例如Priest,B.T.等人，2007,Toxicon.49(2):194-201；Xiao,Y.等人，2010,Mol.Pharmacol.78(6):1124-34)。本文描述了以下发现：用于构建经改造的D_H区的特别有用的一组核苷酸编码序列是或包含来自狼蛛毒素和μ-芋螺毒素序列的核苷酸编码序列(参见例如表4)。本文公开了作用于电压门控钠通道(例如，Na_V1.7)的毒素编码序列用于构建经改造的D_H区的用途。根据需要，本文所述的方法可用于利用源自任何所需毒素肽的编码序列的任何集合、或来自多重(即二、三、四、五等)毒素肽的毒素肽(或毒素肽序列片段)的组合。

提供体内系统

本文描述了以下认识：特定抗原与低免疫原性和/或弱免疫原性相关，并且因此是基于抗体的治疗剂的弱靶。事实上，许多疾病靶(例如跨膜蛋白)已表征为难治性或不可成药的。因此，本文公开了用于开发抗体和基于抗体的治疗剂的体内系统的产生，其克服了与已建立的药物发现技术相关的缺陷。本公开内容具体证实了其基因组包含免疫球蛋白重链可变区的转基因啮齿类动物的构建，所述免疫球蛋白重链可变区包括经改造的D_H区，所述经改造的D_H区包括一个或多个异源核苷酸编码序列，其各自编码目的异源多肽或肽的一部分(例如细胞外部分、结合部分、功能片段等)。本文所述的方法可适于采用一组异源核苷酸编码序列，其各自编码任何目的多肽或肽(例如跨膜蛋白、毒素、G蛋白偶联受体等)的一部分用于产生经改造的D_H区。一旦整合到免疫球蛋白重链可变区(即置于与V和J基因区段和/或一个或多个恒定区可操作地连接)内，经改造的D_H区就提供了基因区段(即V和J)与一个或多个异源核苷酸编码序列的重组，以生成特征在于具有增加的多样性(即CDR3多样性)以指导与特定抗原结合的重链的抗体。

本文描述了以下认识：由其设计一组核苷酸编码序列(或核苷酸编码序列的组合)用于构建如本文所述的经改造的D_H区的特别有用的目的异源多肽包括趋化因子受体、芋螺毒素、狼蛛毒素和/或其组合。

在一些实施例中，趋化因子受体包括CC-趋化因子受体、CXC-趋化因子受体、CX3C-趋化因子受体、XC-趋化因子受体及其组合。

在一些实施例中，CC-趋化因子受体(也称为β-趋化因子受体)包括CCR1、CCR2、CCR3、CCR4、CCR5、CCR6、CCR7、CCR8、CCR9、CCR10和CCR11。

在一些实施例中，CXC-趋化因子受体包括CXCR1、CXCR2、CXCR3、CXCR4、CXCR5、CXCR6和CXCR7。

在一些实施例中，CX3C-趋化因子受体包括CX3CR1。

在一些实施例中，XC-趋化因子受体包括XCR1。

在一些实施例中，芋螺毒素包括α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。

在一些实施例中，芋螺毒素是或包含μ-芋螺毒素。

在一些实施例中，狼蛛毒素包括ProTxI、ProTxII、虎纹捕鸟蛛毒素-IV(HWTX-IV)及其组合。

不希望受任何特定理论束缚，我们注意到，本文提供的数据证实，在一些实施例中，其基因组包含包括经改造的D_H区的免疫球蛋白重链可变基因座的啮齿类动物，特征在于包括源自异源非典型趋化因子受体(例如ACKR2，也称为D6趋化因子诱饵受体)的细胞外部分的一个或多个异源核苷酸编码序列，有效地生成免疫球蛋白重链可变区基因座，其产生特征在于具有增加的多样性以结合异源非典型趋化因子受体(例如异源D6趋化因子诱饵受体)的配体的CDR3的抗体。我们还注意到，本文提供的数据证实，在一些实施例中，其基因组包含包括经改造的D_H区的免疫球蛋白重链可变基因座的啮齿类动物，特征在于包括源自一种或多种毒素(例如μ-芋螺毒素和/或ProTxII)的一部分的一个或多个异源核苷酸编码序列，有效地生成免疫球蛋白重链可变区基因座，其产生特征在于具有增加的多样性以结合异源电压门控钠通道(例如，异源Na_V通道)的CDR3的抗体。

特别地，本公开内容尤其具体证实来自人非典型趋化因子受体(ACKR)，例如ACKR2(即，D6趋化因子诱饵受体)的示例性核苷酸编码序列，可特别用于整合到免疫球蛋白重链基因座的D_H区内，用于生成特征在于具有多样性的CDR3的抗体，所述多样性来源于核苷酸编码序列与V_H和J_H区段的重组，并且阻断几种炎性细胞因子(例如，CCL2、CCL3、CCL4、CCL5、CCL7、CCL8、CCL11、CCL12、CCL13、CCL14、CCL17、CCL22和CCL3L1)。本公开内容还证实来自芋螺毒素(例如μ-芋螺毒素)和狼蛛毒素(例如ProTxII)的示例性核苷酸编码序列，可特别用于整合到免疫球蛋白重链基因座的D_H区内，用于生成特征在于具有多样性的CDR3的抗体，所述多样性来源于核苷酸编码序列与V_H和J_H区段的重组，并且阻断和/或抑制电压门控钠通道(例如Na_V1.7)的激活和/或功能。因此，在至少一些实施例中，本公开内容包括开发体内系统用于生成针对治疗难治性疾病靶的抗体和/或基于抗体的治疗剂。

示例性人ACKR(连同其相关配体)在表1中阐述(参见例如Nibbs,R.J.B.和G.J.Graham,2013,Nature Reviews 13:815-29)。示例性毒素(连同其相关靶)在表2中阐述(参见例如Terlau,H.和B.M.Olivera,2004,Physiol.Rev.84(1):41-68)。

表1

表2

ACKR2(D6趋化因子诱饵受体)编码序列

表3中阐述了用于构建如本文所述的经改造的D_H区的人ACKR2(D6趋化因子诱饵受体)的示例性核苷酸编码序列(DNA和氨基酸(AA))。表3中阐述的人ACKR2核苷酸编码序列组的特征在于四个细胞外结构域、具有Cys至Ser取代以去除二硫键的四个细胞外结构域、四个Cys交换(Nterm-EC3、EC3-Nterm、EC1-EC2、EC2-EC1)、具有Cys至Ser取代以去除二硫键的四个Cys交换、两个环融合(具有Cys保留；Nterm+EC3，EC1+EC2)和七个部分结构域。

表3

下文提供了用于构建经改造的D_H区、含有人ACKR2(D6趋化因子诱饵受体)核苷酸编码序列的示例性DNA片段。

D6-DH1166(SEQ ID NO:131)包括在对应于D_H1-1至D_H6-6的位置中插入的D6编码序列：

TACGTAGCCGTTTCGATCCTCCCGAATTGACTAGTGGGTAGGCCTGGCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATACCGGTGGATTCGAATTCTCCCCGTTGAAGCTGACCTGCCCAGAGGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTACAGGCCCCGGTCTCTGTGGGTGTTCCGCTAACTGGGGCTCCCAGTGCTCACCCCACAACTAAAGCGAGCCCCAGCCTCCAGAGCCCCCGAAGGAGATGCCGCCCACAAGCCCAGCCCCCATCCAGGAGGCCCCAGAGCTCAGGGCGCCGGGGCGGATTTTGTACAGCCCCGAGTCACTGTGCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGAGAAAAACTGTGTCAAAAACCGTCTCCTGGCCCCTGCTGGAGGCCGCGCCAGAGAGGGGAGCAGCCGCCCCGAACCTAGGTCCTGCTCAGCTCACACGACCCCCAGCACCCAGAGCACAACGGAGTCCCCATTGAATGGTGAGGACGGGGACCAGGGCTCCAGGGGGTCATGGAAGGGGCTGGACCCCATCCTACTGCTATGGTCCCAGTGCTCCTGGCCAGAACTGACCCTACCACCGACAAGAGTCCCTCAGGGAAACGGGGGTCACTGGCACCTCCCAGCATCAACCCCAGGCAGCACAGGCATAAACCCCACATCCAGAGCCGACTCCAGGAGCAGAGACACCCCAGTACCCTGGGGGACACCGACCCTGATGACTCCCCACTGGAATCCACCCCAGAGTCCACCAGGACCAAAGACCCCGCCCCTGTCTCTGTCCCTCACTCAGGACCTGCTGCGGGGCGGGCCATGAGACCAGACTCGGGCTTAGGGAACACCACTGTGGCCCCAACCTCGACCAGGCCACAGGCCCTTCCTTCCTGCCCTGCGGCAGCACAGACTTTGGGGTCTGTGCAGAGAGGAATCACAGAGGCCCCAGGCTGAGGTGGTGGGGGTGGAAGACCCCCAGGAGGTGGCCCACTTCCCTTCCTCCCAGCTGGAACCCACCATGACCTTCTTAAGATAGGGGTGTCATCCGAGGCAGGTCCTCCATGGAGCTCCCTTCAGGCTCCTCCCCGGTCCTCACTAGGCCTCAGTCCCGGCTGCGGGAATGCAGCCACCACAGGCACACCAGGCAGCCCAGACCCAGCCAGCCTGCAGTGCCCAAGCCCACATTCTGGAGCAGAGCAGGCTGTGTCTGGGAGAGTCTGGGCTCCCCACCGCCCCCCCGCACACCCCACCCACCCCTGTCCAGGCCCTATGCAGGAGGGTCAGAGCCCCCCATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCCTCCTGGGTGAAGGGGTCTCATGCCCAGATCCCCACAGCAGAGCTGGTCAAAGGTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGACCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGACTCCACCAGACCACAGGTCCAGGGCACCGCCCATAGGTGCTGCCCACACTCAGTTCACAGGAAGAAGATAAGCTCCAGACCCCCAAGACTGGGACCTGCCTTCCTGCCACCGCTTGTAGCTCCAGACCTCCGTGCCTCCCCCGACCACTTACACACGGGCCAGGGAGCTGTTCCACAAAGATCAACCCCAAACCGGGACCGCCTGGCACTCGGGCCGCTGCCACTTCCCTCTCCATTTGTTCCCAGCACCTCTGTGCTCCCTCCCTCCTCCCTCCTTCAGGGGAACAGCCTGTGCAGCCCCTCCCTGCACCCCACACCCTGGGGAGGCCCAACCCTGCCTCCAGCCCTTTCTCCCCCGCTGCTCTTCCTGCCCATCCAGACAACCCTGGGGTCCCATCCCTGCAGCCTACACCCTGGTCTCCACCCAGACCCCTGTCTCTCCCTCCAGACACCCCTCCCAGGCCAACCCTGCACATGCAGGCCCTCCCCTTTTCTGCTGCCAGAGCCTCAGTTTCTACCCTCTGTGCCTACCCCCTGCCTCCTCCTGCCCACAACTCGAGCTCTTCCTCTCCTGGGGCCCCTGAGCCATGGCACTGACCGTGCACTCCCACCCCCACACTGCCCATGCCCTCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCTTGGACCCAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCCGGTTACACGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCCTGATGCACGTCCGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTGTAAAGACGAGGGATCCAGGCAGCAACATCATGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGCCCGCTGGATAGTAACTGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCAGACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCGCGTGGAAACAGAACAGACCCACATTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCTGAGAAACACCAGGCAACGGCATCAGAGGGGGCTCCTGAGAAAGAAAGGAGGGGAGGTCTCCTTCACCAGCAAGTACTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCCCACACACCCTGAGTTTCAGACAAAAACCCCCTGGAAATCATAGTATCAGCAGGAGAACTAGCCAGAGACAGCAAGAGGGGACTCAGTGACTCCCGCGGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGACACAGCCCCATTCAAAAACCCCTGCTGTAAACGCTTCCACTTCTGGAGCTGAGGGGCTGGGGGGAGCGTCTGGGAAGTAGGGCCTAGGGGTGGCCATCAATGCCCAAAACGCACCAGACTCCCCCCCAGACATCACCCCACTGGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGATAGTTCCATAAACTGGTGTTCAAGATCGATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGGGCACAGGGAAGGAGAAGCAGCCGCTATCCTACACTGTCATCTTTCAAGAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCCACACAGAAGCAAGCACAAGGAAAGTGCCTGATGCAAGGGCAAAGTACAGTGTGTACCTTCAGGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGAACTCCCTGCAACAAAGCAGAGCCCTGCAGGCAATGCCAGCTCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAATGAAGCAAACAGCCATCTGAAGGAAAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCAGAAGGACAACAGTGAGGGTTACAGGTGACTCTGTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGGAAAGTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACAGCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCACTAGGAAAACTATAAGGAAAATCAAGAAAAGGATGATCACATAAACACAGTGGTCGTTACTTCTACTGGGGAAGGAAGAGGGTATGAACTGAGACACACAGGGTTGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAAATTCTAAATTGCAAGAAGAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAACGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATTGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATATGTGGTGGCACTCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCCGTATCCCCCCGAGGACATATACCCCCAAGGACGGCACAGTTGGTACATTCCGGAGACAAGCAACTCAGCCACACTCCCAGGCCAGAGCCCGAGAGGGACGCCCATGCACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCAGCAGCACCCGTGCAGGGGCCGCCATCTGGCAGGCACAGAGCATGGGCTGGGAGGAGGGGCAGGGACACCAGGCAGGGTTGGCACCAACTGAAAATTACAGAAGTCTCATACATCTACCTCAGCCTTGCCTGACCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGACCTCACCTGGCCTAGACCTCACCTCTGGGCTTCACCTGAGCTCGGCCTCACCTGACTTGGACCTTGCCTGTCCTGAGCTCACATGATCTGGGCCTCACCTGACCTGGGTTTCACCTGACCTGGGCTTCACCTGACCTGGGCCTCATCTGACCTGGGCCTCACTGGCCTGGACCTCACCTGGCCTGGGCTTCACCTGGCCTCAGGCCTCATCTGCACCTGCTCCAGGTCTTGCTGGAACCTCAGTAGCACTGAGGCTGCAGGGGCTCATCCAGGGTTGCAGAATGACTCTAGAACCTCCCACATCTCAGCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCTGAATGATGCCTGCGTGATTTGGGGGCAATTTATAAACCCAAAAGGACATGGCCATGCAGCGGGTAGGGACAATACAGACAGATATCAGCCTGAAATGGAGCCTCAGGGCACAGGTGGGCACGGACACTGTCCACCTAAGCCAGGGGCAGACCCGAGTGTCCCCGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTACCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAACCTTCTGCCACAGCCCTCCCTGTGGGGCACCGCCGCGTGCCATGTTAGGATTTTGACTGAGGACACAGCACCATGGGTATGGTGGCTACCGCAGCAGTGCAGCCCGTGACCCAAACACACAGGGCAGCAGGCACAACAGACAAGCCCACAAGTGACCACCCTGAGCTCCTGCCTGCCAGCCCTGGAGACCATGAAACAGATGGCCAGGATTATCCCATAGGTCAGCCAGACCTCAGTCCAACAGGTCTGCATCGCTGCTGCCCTCCAATACCAGTCCGGATGGGGACAGGGCTGGCCCACATTACCATTTGCTGCCATCCGGCCAACAGTCCCAGAAGCCCCTCCCTCAAGGCTGGGCCACATGTGTGGACCCTGAGAGCCCCCCATGTCTGAGTAGGGGCACCAGGAAGGTGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGGGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCCAGGACAGCTGGAGCTGGGAGTCCATCATCCTGCCTGGCCGTCCTGAGTCCTGCGCCTTTCCAAACCTCACCCGGGAAGCCAACAGAGGAATCACCTCCCACAGGCAGAGACAAAGACCTTCCAGAAATCTCTGTCTCTCTCCCCAGTGGGCACCCTCTTCCAGGGCAGTCCTCAGTGATATCACAGTGGGAACCCACATCTGGATCGGGACTGCCCCCAGAACACAAGATGGCCCACAGGGACAGCCCCACAGCCCAGCCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCATCTGCCCCAGGGCTCAAACTCCAGGAGGACTGACTCCTGCACACCCTCCTGCCAGACATCACCTCAGCCCCTCCTGGAAGGGACAGGAGCGCGCAAGGGTGAGTCAGACCCTCCTGCCCTCGATGGCAGGCGGAGAAGATTCAGAAAGGTCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGGCACACTCAGGGGGATTTTGTGAAGGGTCCTCCCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGATGAACCCAGCATCAAAAACCGACCGGACTCCCAAGGTTTATGCACACTTCTCCGCTCAGAGCTCTCCAGGATCAGAAGAGCCGGGCCCAAGGGTTTCTGCCCAGACCCTCGGCCTCTAGGGACATCTTGGCCATGACAGCCCATGGGCTGGTGCCCCACACATCGTCTGCCTTCAAACAAGGGCTTCAGAGGGCTCTGAGGTGACCTCACTGATGACCACAGGTGCCCTGGCCCCTTCCCCACCAGCTGCACCAGACCCCGTCATGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGGCCAGGAATCGCTGTAGACACCAGCCTCCTTCCAACACCTCCTGCCAATTGCCTGGATTCCCATCCCGGTTGGAATCAAGAGGACAGCATCCCCCAGGCTCCCAACAGGCAGGACTCCCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGTAGGGCCAGGCTGCAGACAGTCCCCCTCACCTGCCACTAGACAAATGCCTGCTGTAGATGTCCCCACCTGGAAAATACCACTCATGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCTCTGAGGCCCCTAAGAAGTAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCTGACAGGAGTGGACGCTGGAGCTGGGCCCATACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCTCTATTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGCAGCTTCTTGTGCAAGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTTTTCTGCACTCTCCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGATCTGTTCTCAACATCCCACGGCCTCATTCCTGCAAGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGACAGGACATCCTGCTGGGGTATCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTTGCCAAAATCCCCACGGCCTCCCCCGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGCAGGTGACCAGGGCAGGAAATGGCCTGAACACAGGGATAACCGGGCCATCCCCCAACAGAGTCCACCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGCCCATGACATCCGACAACCCCACACCAGAGTCACTGCCCGGTGCTGCCCTAGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTGGGGAGGACAGGACACGCCCTCTCCTTATGGTTCCCCCACCTGGCTCTGGCTGGGACCCTTGGGGTGTGGACAGAAAGGACGCTTGCCTGATTGGCCCCCAGGAGCCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAGGGAGGAAGTGGGGCCACTGCACCACCAGGCAGGAGGCTCTGTCTTTGTGAACCCAGGGAGGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTATGGCTCCCACAGTGGCAGGCTGCAGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCCGCGGGTGCTCCATCTTGGATGAGCCTATCTCTCTCACCCACGGACTCGCCCACCTCCTCTTCACCCTGGCCACACGTCGTCCACACCATCCTAAGTCCCACCTACACCAGAGCCGGCACAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGACTGGGCAGCTTCGGGGAGGGAGGAATGGAGGAAGGGGAGTTCAGTGAAGAGGCCCCCCTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCTGGGCCTGGGGGCAGCCGCTCCCACACAGGATGAACCCAGCACCCCGAGGATGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAGGATATGGGACCCCCGATACAGGCACAGACCTCAGCTCCATTCAGGACTGCCACGTCCTGCCCTGGGAGGAACCCCTTTCTCTAGTCCCTGCAGGCCAGGAGGCAGCTGACTCCTGACTTGGACGCCTATTCCAGACACCAGACAGAGGGGCAGGCCCCCCAGAACCAGGGATGAGGACGCCCCGTCAAGGCCAGAAAAGACCAAGTTGCGCTGAGCCCAGCAAGGGAAGGTCCCCAAACAAACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGACACTCGCCAGGTCAAAAACCCCATCCCAAGTCAGCGGAATGCAGAGAGAGCAGGGAGGACATGTTTAGGATCTGAGGCCGCACCTGACACCCAGGCCAGCAGACGTCTCCTGTCCACGGCACCCTGCCATGTCCTGCATTTCTGGAAGAACAAGGGCAGGCTGAAGGGGGTCCAGGACCAGGAGATGGGTCCGCTCTACCCAGAGAAGGAGCCAGGCAGGACACAAGCCCCCACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTACGTA

D6-D17613(SEQ ID NO:132)包括在对应于D_H1-7至D_H6-13的位置中插入的D6编码序列：

GCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATTACGTAACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTCCCCATTGAGGCTGACCTGCCCAGAGGGTCCTGGGCCCACCCAACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAACGAGCCACAGCCTCCGGAGCCCCTGAAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCACAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGCAGCTTCTTGCACAGTGAGAAAAGCTTCGTCAAAAACCGTCTCCTGGCCACAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCACCCCAAACCCATGTTCTGCCGGCTCCCATGACCCCGTGCACCTGGAGCCCCACGGTGTCCCCACTGGATGGGAGGACAAGGGCCGGGGGCTCCGGCGGGTCGGGGCAGGGGCTTGATGGCTTCCTTCTGCCGTGGCCCCATTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGTCAGGGATCAGTGGCACCTCCCAACATCAACCCCACGCAGCCCAGGCACAAACCCCACATCCAGGGCCAACTCCAGGAACAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTCCCGTCCCATCTCTGTCCCTCACTTGGGGCCTGCTGCGGGGCGAGCACTTGGGAGCAAACTCAGGCTTAGGGGACACCACTGTGGGCCTGACCTCGAGCAGGCCACAGACCCTTCCCTCCTGCCCTGGTGCAGCACAGACTTTGGGGTCTGGGCAGGGAGGAACTTCTGGCAGGTCACCAAGCACAGAGCCCCCAGGCTGAGGTGGCCCCAGGGGGAACCCCAGCAGGTGGCCCACTACCCTTCCTCCCAGCTGGACCCCATGTCTTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGGCTCCTCTCCAGACCCCACTGGGCCTCAGTCCCCACTCTAGGAATGCAGCCACCACGGGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCCCACACCCTGGAGGAGAGCAGGGTGCGTCTGGGAGGGGCTGGGCTCCCCACCCCCACCCCCACCTGCACACCCCACCCACCCTTGCCCGGGCCCCCTGCAGGAGGGTCAGAGCCCCCATGGGATATGGACTTAGGGTCTCACTCACGCACCTCCCCTCCTGGGAGAAGGGGTCTCATGCCCAGATCCCCCCAGCAGCGCTGGTCACAGGTAGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCCCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCTAGGGCACCGCCCACACTGGGGCCGCCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGCCCGGGACCTGCCTTGCTGCTACGACTTCCTGCCCCAGACCTCGTTGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGACCAACCCCAGACGGGGACCACCTGGCACTCAGGTCACTGCCATTTCCTTCTCCATTCACTTCCAATGCCTCTGTGCTTCCTCCCTCCTCCTTCCTTCGGGGGAGCACCCTGTGCAGCTCCTCCCTGCAGTCCACACCCTGGGGAGACCCGACCCTGCAGCCCACACCCTGGGGAGACCTGACCCTCCTCCAGCCCTTTCTCCCCCGCTGCTCTTGCCACCCACCAAGACAGCCCTGGGGTCCTGTCCCTACAGCCCCCACCCAGTTCTCTACCTAGACCCGTCTTCCTCCCTCTAAACACCTCTCCCAGGCCAACCCTACACCTGCAGGCCCTCCCCTCCACTGCCAAAGACCCTCAGTTTCTCCTGCCTGTGCCCACCCCCGTGCTCCTCCTGCCCACAGCTCGAGCTCTTCCTCTCCTAGGGCCCCTGAGGGATGGCATTGACCGTGCCCTCGCACCCACACACTGCCCATGCCCTCACATTCCTCCTGGCCACTCCAGCCCCACTCCCCTCTCAGGCCTGGCTCTGGTATTTCTGGGACAAAGCCTTACCCAAGTCTTTCCCATGCAGGCCTGGGCCCTTACCCTCACTGCCCGGTTACAGGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCGCCTTGACACACGTCTGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTCTAAAGACGAGGGATCCAGGCAGCAGCATCACAGGAGAATGCAGGGCTACCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGAAGACGCCCAGTCAACGGAGTCTAACACCAAACCTCCCTGGAGGCCGATGGGTAGTAACGGAGTCATTGCCAGACCTGGAGGCAGGGGAGCAGTGAGCCCGAGCCCACACCATAGGGCCAGAGGACAGCCACTGACATCCCAAGCCACTCACTGGTGGTCCCACAACACCCCATGGAAAGAGGACAGACCCACAGTCCCACCTGGACCAGGGCAGAGACTGCTGAGACCCAGCACCAGAACCAACCAAGAAACACCAGGCAACAGCATCAGAGGGGGCTCTGGCAGAACAGAGGAGGGGAGGTCTCCTTCACCAGCAGGCGCTTCCCTTGACCGAAGACAGGATCCATGCAACTCCCCCAGGACAAAGGAGGAGCCCCTTGTTCAGCACTGGGCTCAGAGTCCTCTCCAAGACACCCAGAGTTTCAGACAAAAACCCCCTGGAATGCACAGTCTCAGCAGGAGAGCCAGCCAGAGCCAGCAAGATGGGGCTCAGTGACACCCGCAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGACACAGCCCCATTCAAAAACCCCTACTGCAAACGCATTCCACTTCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAATAGGGCTCAGGGGTGTCCATCAATGCCCAAAACGCACCAGACTCCCCTCCATACATCACACCCACCAGCCAGCGAGCAGAGTAAACAGAAAATGAGAAGCAAGCTGGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGTAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCGAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGCGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCGAAAGTTTGCCTTGTGCCCACACTGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCCTGGCAGGAACTCCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAGCAAAGCAAACGTCCATCTGAAGGAGAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCACAAGCACAAAAGTACAGGGTTATAAGCGACTCTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGTAAACTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACACCCTGCAAAATGAACTGTCTTCTTAAGGGATACATTTCCCAGTTAGAAAACCATAAAGAAAACCAAGAAAAGGATGATCACATAAACACAGTGGTGGTTACTTCTGCTGGGGAAGGAAGAGGGTATGAACTGAGATACACAGGGTGGGCAAGTCTCCTAACAAGAACAGAACGAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATTGCAAGAAGAGGAAAATGCACACAGTTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTCGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATATATTTAGTATATGAGACATCGATGATGTATCCCCAAATAAACGACTTTAAAGAGATAAAGGGCTGATGTGTGGTGGCATTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCTCACTGTGCAGCAGGGCAGGCGGGTACCTGCTGGCAGTTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCCATATATCCCGGAGGACGGCACAGTCAGTGAATTCCAGAGAGAAGCAACTCAGCCACACTCCCCAGGCAGAGCCCGAGAGGGACGCCCACGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCAGCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGACGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACTGGCCTGGGCCTCACTTAACCTGGGCTTCACCTGACCTTGGCCTCACCTGACTTGGACCTCGCCTGTCCCAAGCTTTACCTGACCTGGGCCTCAACTCACCTGAACGTCTCCTGACCTGGGTTTAACCTGTCCTGGAACTCACCTGGCCTTGGCTTCCCCTGACCTGGACCTCATCTGGCCTGGGCTTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCATCTGGCCTGGACCTCACCTGGCCTGGACTTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGGTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTAGAAGTCTCCCACATCTGACCTTTCTGGGTGGAGGCAGCTGGTGGCCCTGGGAATATAAAAATCTCCAGAATGATGACTCTGTGATTTGTGGGCAACTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGGTGGGCACGGACACTATCCACATAAGCGAGGGATAGACCCGAGTGTCCCCACAGCAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCAGAGCCCTGCTGCCTCCTCCGGTCAGCCCTGGACATCCCAGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGAAGCTTCCCGCCACAGCCCTCCCCATGGGGCCCTGCTGCCTCCTCAGGTCAGCCCCGGACATCCCGGGTTTCCCCAGGCTGGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCCAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAGCCTCCCGCCACAGCCCTCCCTGCAGGGGACCGGTACGTGCCATGTTAGGATTTTGATCGAGGAGACAGCACCATGGGTATGGTGGCTACCACAGCAGTGCAGCCTGTGACCCAAACCCGCAGGGCAGCAGGCACGATGGACAGGCCCGTGACTGACCACGCTGGGCTCCAGCCTGCCAGCCCTGGAGATCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCGAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAGTCCAAATGGGACAGGGACGGCCTCACAGCACCATCTGCTGCCATCAGGCCAGCGATCCCAGAAGCCCCTCCCTCAAGGCTGGGCACATGTGTGGACACTGAGAGCCCTCATATCTGAGTAGGGGCACCAGGAGGGAGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCTGGGGACAGCCGGAGCTGGGCGTCGCTCATCCTGCCCGGCCGTCCTGAGTCCTGCTCATTTCCAGACCTCACCGGGGAAGCCAACAGAGGACTCGCCTCCCACATTCAGAGACAAAGAACCTTCCAGAAATCCCTGCCTCTCTCCCCAGTGGACACCCTCTTCCAGGACAGTCCTCAGTGGCATCACAGCGGCCTGAGATCCCCAGGACGCAGCACCGCTGTCAATAGGGGCCCCAAATGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGCCACACTCGGGGATTTTGTGAAGGGCCCTCCCACTGTGCCAGCTTCTTGAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGATGAACCCAGTGTCAAAAACCGGCTGGAAACCCAGGGGCTGTGTGCACGCCTCAGCTTGGAGCTCTCCAGGAGCACAAGAGCCGGGCCCAAGGATTTGTGCCCAGACCCTCAGCCTCTAGGGACACCTGGGTCATCTCAGCCTGGGCTGGTGCCCTGCACACCATCTTCCTCCAAATAGGGGCTTCAGAGGGCTCTGAGGTGACCTCACTCATGACCACAGGTGACCTGGCCCTTCCCTGCCAGCTATACCAGACCCTGTCTTGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGACCCTGAATAGCTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAAGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGACAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGAGACACTGTGCATGTCTGGTACCTAAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCTCAGCTGTCTGGGCCCTCCCTGCTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGCGATGTCACACTGTGCAGCTTCTTGAGCAAGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGCGCAGCCCCAGGCATCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGTCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGATTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACGGAGCCACGGAGTCACAGAGCCACGGAGCCCCCATTGTGGGCATTTGAGAGTGCTGTGCCCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGTCCCATCCCACAGCCCGGGTCCCACGGGCAGCGGGCACAGAAGCTGCCAGGTTGTCCTCTATGATCCTCATCCCTCCAGCAGCATCCCCTCCACAGTGGGGAAACTGAGGCTTGGAGCACCACCCGGCCCCCTGGAAATGAGGCTGTGAGCCCAGACAGTGGGCCCAGAGCACTGTGAGTACCCCGGCAGTACCTGGCTGCAGGGATCAGCCAGAGATGCCAAACCCTGAGTGACCAGCCTACAGGAGGATCCGGCCCCACCCAGGCCACTCGATTAATGCTCAACCCCCTGCCCTGGAGACCTCTTCCAGTACCACCAGCAGCTCAGCTTCTCAGGGCCTCATCCCTGCAAGGAAGGTCAAGGGCTGGGCCTGCCAGAAACACAGCACCCTCCCTAGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGTGGACGGGACATATTGCTGGGGCATTTCTCACTGTCACTTCTGGGTGGTAGCTCTGACAAAAACGCAGACCCTGCCAAAATCCCCACTGCCTCCCGCTAGGGGCTGGCCTGGAATCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGCCCTTGCCGGGGTTGAATGCAGGTGCCCAAGGCAGGAAATGGCATGAGCACAGGGATGACCGGGACATGCCCCACCAGAGTGCGCCCCTTCCTGCTCTGCACCCTGCACCCCCCAGGCCAGCCCACGACGTCCAACAACTGGGCCTGGGTGGCAGCCCCACCCAGACAGGACAGACCCAGCACCCTGAGGAGGTCCTGCCAGGGGGAGCTAAGAGCCATGAAGGAGCAAGATATGGGGCCCCCGATACAGGCACAGATGTCAGCTCCATCCAGGACCACCCAGCCCACACCCTGAGAGGAACGTCTGTCTCCAGCCTCTGCAGGTCGGGAGGCAGCTGACCCCTGACTTGGACCCCTATTCCAGACACCAGACAGAGGCGCAGGCCCCCCAGAACCAGGGTTGAGGGACGCCCCGTCAAAGCCAGACAAAACCAAGGGGTGTTGAGCCCAGCAAGGGAAGGCCCCCAAACAGACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCCACAGTGACACTCACCCAGTCAAAAACCCCATTCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGACTGCACCTGACACCCAGGCCAGCAGACGTCTCCCCTCCAGGGCACCCCACCCTGTCCTGCATTTCTGCAAGATCAGGGGCGGCCTGAGGGGGGGTCTAGGGTGAGGAGATGGGTCCCCTGTACACCAAGGAGGAGTTAGGCAGGTCCCGAGCACTCTTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTACGTAATGCATTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCC

D6-DH114619(SEQ ID NO:133)包括在对应于D_H1-14至D_H6-19的位置中插入的D6编码序列：

TACGTATTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTCCCCATTGAGGCTGACCTGCCCAGAGAGTCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAATGAGCCACAGCCTCCGGAGCCCCCGCAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACCACAGTGAGAATAGCTACGTCAAAAACCGTCCAGTGGCCACTGCCGGAGGCCCCGCCAGAGAGGGCAGCAGCCACTCTGATCCCATGTCCTGCCGGCTCCCATGACCCCCAGCACGCGGAGCCCCACAGTGTCCCCACTGGATGGGAGGACAAGAGCTGGGGATTCCGGCGGGTCGGGGCAGGGGCTTGATCGCATCCTTCTGCCGTGGCTCCAGTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGACAGGCATCACCGGCGCCTCCCAACATCAACCCCAGGCAGCACAGGCACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTTCCCACTGGAATTCGCCGTAGAGTCCACCAGGACCAAAGACCCTGCCTCTGCCTCTGTCCCTCACTCAGGACCTGCTGCCGGGCGAGGCCTTGGGAGCAGACTTGGGCTTAGGGGACACCAGTGTGACCCCGACCTTGACCAGGACGCAGACCTTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCCAGGAGGAACTTCTGGCAGGTCGCCAAGCACAGAGGCCACAGGCTGAGGTGGCCCTGGAAAGACCTCCAGGAGGTGGCCACTCCCCTTCCTCCCAGCTGGACCCCATGTCCTCCCCAAGATAAGGGTGCCATCCAAGGCAGGTGCTCCTTGGAGCCCCATTCAGACTCCTCCCTGGACCCCACTGGGCCTCAGTCCCAGCTCTGGGGATGAAGCCACCACAAGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCACACACTCTGGAGCAGAGCAGGGTGCCTCTGGGAGGGGCTGAGCTCCCCACCCCACCCCCACCTGCACACCCCACCCACCCCTGCCCAGCGGCTCTGCAGGAGGGTCAGAGCCCCACATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCATCATGAGTGAAGGGGCCTCAAGCCCAGGTTCCCACAGCAGCGCCTGTCGCAAGTGGAGGCAGAGGCCCGAGGGCCACCCTGACCTGGTCCCTGAGGTTCCTGCAGCCCAGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACCGGGTGCAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGGCCAGAACCTGCCTTCCTGCTACTGCTTCCTGCCCCAGACCTGGGCGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGAACAACCCCAAACCAGGACCGCCTGGCACTCAGGTGGCTGCCATTTCCTTCTCCATTTGCTCCCAGCGCCTCTGTCCTCCCTGGTTCCTCCTTCGGGGGAACAGCCTGTGCAGCCAGTCCCTGCAGCCCACACCCTGGGGAGACCCAACCCTGCCTGGGGCCCTTCCAACCCTGCTGCTCTTACTGCCCACCCAGAAAACTCTGGGGTCCTGTCCCTGCAGTCCCTACCCTGGTCTCCACCCAGACCCCTGTGTATCACTCCAGACACCCCTCCCAGGCAAACCCTGCACCTGCAGGCCCTGTCCTCTTCTGTCGCTAGAGCCTCAGTTTCTCCCCCCTGTGCCCACACCCTACCTCCTCCTGCCCACAACTCTAACTCTTCTTCTCCTGGAGCCCCTGAGCCATGGCATTGACCCTGCCCTCCCACCACCCACAGCCCATGCCCTCACCTTCCTCCTGGCCACTCCGACCCCGCCCCCTCTCAGGCCAAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTTCCCAGGCAGGCCTGGGCTCTTGCCCTCACTTCCCGGTTACACGGGAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCTTGACACACGTCCGCCCGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGACAAGGGATCCAGGCAGCAGCATCACGGGAGAATGCAGGGCTCCCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACCAAACAGCCACAGAGGCTGCTGGATAGTAACTGAGTCAATGACCGACCTGGAGGGCAGGGGAGCAGTGAGCCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCTCCTCAATGGTGGCCCCATAACACACCTAGGAAACATAACACACCCACAGCCCCACCTGGAACAGGGCAGAGACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACCAGGCAACAGTATCAGAGGGGGCTCCCGAGAAAGAGAGGAGGGGAGATCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTATACAGCACTGGGCTCAGAGTCCTCTCTGAGACACCCTGAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAACAGACCAAAGCCAGCAAAAGGGACCTCGGTGACACCAGTAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCAAGCACAGTGACACAGACCCATTCAAAAACCCCTACTGCAAACACACCCACTCCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAGTAGGGTCCAGGGGTGTCTATCAATGTCCAAAATGCACCAGACTCCCCGCCAAACACCACCCCACCAGCCAGCGAGCAGGGTAAACAGAAAATGAGAGGCTCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCAGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCAAGATCAGTGGCTGGGAATGAGCCCAGGAGGGCAGTCTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCAAAAGTTTGCCTTGTGACCACACTATTGCATCATGGGATGCTTAAGAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGAATTTGCAGCATAGATCTGAATAAACTCTCCAGAATGTGGAGCAGTACAGAAGCAAACACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGATCTCCCTGCGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCGTCATGGGGAAAGATGTGCAGAACAGCTGATTATCATAGACTCAAACTGAGAACAGAGCAAACGTCCATCTGAAGAACAGTCAAATAAGCAATGGTAGGTTCATGCAATGCAAACCCAGACAGCCAGGGGACAACAGTAGAGGGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCAGGCAAAATGAACTGTCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTACAAGGAAAATTAAGAAAACGATGATCACATAAACACAGTTGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCAAGCAAGCACAGAACGAATACATTACAGTACCTTGAATACAGCAGTTAAACTTCTAAATCGCAAGAACAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTATTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAATGATGACACAGGCAATTGCACAATGATACAGACATACATTTAGTACATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCACTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACATGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCTGTATACCCCCAAGGATGGCACAGTCAGTGAATTCCAGAGAGAAGCAGCTCAGCCACACTGCCCAGGCAGAGCCCGAGAGGGACGCCCACGTACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCACCACCACCTGTGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACCTGGTCTGGACCTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCCGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAACCTGAGTAGCACTGAGGCTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTGGAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCATCTGGTGGCCCTGGGAATATAAAAAGCCCCAGAATGGTGCCTGCGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGTTGGACGCGGACACTATCCACATAAGCGAGGGACAGACCCGAGTGTTCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCAGATGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGTCACACGGTCCATCAAAAACCCATGCCACAGCCCTCCCCGCAGGGGACCGCCGCGTGCCATGTTACGATTTTGATCGAGGACACAGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACAGGGCAGCAGGCACAATGGACAGGCCTGTGAGTGACCATGCTGGGCTCCAGCCCGCCAGCCCCGGAGACCATGAAACAGATGGCCAAGGTCACCCCACAGTTCAGCCAGACATGGCTCCGTGGGGTCTGCATCGCTGCTGCCCTCTAACACCAGCCCAGATGGGGACAAGGCCAACCCCACATTACCATCTCCTGCTGTCCACCCAGTGGTCCCAGAAGCCCCTCCCTCATGGCTGAGCCACATGTGTGAACCCTGAGAGCACCCCATGTCAGAGTAGGGGCAGCAGAAGGGCGGGGCTGGCCCTGTGCACTGTCCCTGCACCCATGGTCCCTCGCCTGCCTGGCCCTGACACCTGAGCCTCTTCTGAGTCATTTCTAAGATAGAAGACATTCCCGGGGACAGCCGGAGCTGGGCGTCGCTCATCCCGCCCGGCCGTCCTGAGTCCTGCTTGTTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAAAGAACCTTCCAGAAATCCCTGTCTCACTCCCCAGTGGGCACCTTCTTCCAGGACATTCCTCGGTCGCATCACAGCAGGCACCCACATCTGGATCAGGACGGCCCCCAGAACACAAGATGGCCCATGGGGACAGCCCCACAACCCAGGCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCACCTGCCCCAGGGCTAAAAATCCAGGAGGCTTGACTCCCGCATACCCTCCAGCCAGACATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCGATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCGCTGGGCACACTCAGGGGGATTTTGTGAAGGCCCCTCCCACTGTGCAGCTTCTTGTGCAAGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGATGAAACTAGCATCAAAAACCGGCCGGACACCCAGGGACCATGCACACTTCTCAGCTTGGAGCTCTCCAGGACCAGAAGAGTCAGGTCTGAGGGTTTGTAGCCAGACCCTCGGCCTCTAGGGACACCCTGGCCATCACAGCGGATGGGCTGGTGCCCCACATGCCATCTGCTCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGCCCCTTCCCCGCCAGCTACACCGAACCCTGTCCCAACAGCTGCCCCAGTTCCAACAGCCAATTCCTGGGGCCCAGAATTGCTGTAGACACCAGCCTCGTTCCAGCACCTCCTGCCAATTGCCTGGATTCACATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGACTCCCCGAGGGATCTAAGAAGGAGCCATGCGCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACACTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGTCACTGTTGTCTGTACTCTGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTTCTCAACATCCCAGGGCCTCATGTCTGCACGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGGACAGTACATACTGCTGGGGTGTCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTCGCCAAAATCCCCACAGCCTCCCCTGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGTCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGGAGGTGACCAAGGTAGGAAATGGCCTTAACACAGGGATGACTGCGCCATCCCCCAACAGAGTCAGCCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGTCCACGAAAACCAGGGCCCCACATCAGAGTCACTGCCTGGCCCGGCCCTGGGGCGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTTGGGGGGACAGGACACAGGCCCTCTCCTTATGGTTCCCCCACCTGCCTCCGGCCGGGACCCTTGGGGTGTGGACAGAAAGGACACCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCGGTATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCGGGTGCTCCTCCATCTTCGGTGAGCCTCCCCCTTCACCCACCGTCCCGCCCACCTCCTCTCCACCCTGGCTGCACGTCTTCCACACCATCCTGAGTCCTACCTACACCAGAGCCAGCAAAGCCAGTGCAGACAAAGGCTGGGGTGCAGGGGGGCTGCCAGGGCAGCTTCGGGGAGGGAAGGATGGAGGGAGGGGAGGTCAGTGAAGAGGCCCCCTTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCTGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATATCCCCACAGCGGCTCAGGCCAGACCCAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTCCTGGGCCTGGGTAGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAAGAGCAGGATATGGGGTCCCCGATACAGGCACAGACCTCAGCTCCATCCAGGCCCACCGGGACCCACCATGGGAGGAACACCTGTCTCCGGGTTGTGAGGTAGCTGGCCTCTGTCTCGGACCCCACTCCAGACACCAGACAGAGGGGCAGGCCCCCCAAAACCAGGGTTGAGGGATGATCCGTCAAGGCAGACAAGACCAAGGGGCACTGACCCCAGCAAGGGAAGGCTCCCAAACAGACGAGGAGGATTTTGTAGCTGTCTGTATCACTGTGCAGCTTCTTGTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGACACTCGCCAGGTCAAAAACCCCGTCCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGGCCGCACCTGACACCCAGGGCAGCAGACGTCTCCCCTCCAGGGCACCCTCCACCGTCCTGCGTTTCTTCAAGAATAGGGGCGGCCTGAGGGGGTCCAGGGCCAGGCGATAGGTCCCCTCTACCCCAAGGAGGAGCCAGGCAGGACCCGAGCACCGATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTACGTA

D6-DH120126(SEQ ID NO:134)包括在对应于D_H1-20至D_H1-26的位置中插入的D6编码序列：

TACGTAATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTCCCCATTGAGGCTGACCTGCCCAGACGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCCCAGTCTCTGTGGGTGTTCCGCTAGCTGGGGCCCCCAGTGCTCACCCCACACCTAAAGCGAGCCCCAGCCTCCAGAGCCCCCTAAGCATTCCCCGCCCAGCAGCCCAGCCCCTGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGTCGGATTTTGTACAGCCCCGAGTCACTGTGCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGAGAAAAACTGTGTCAAAAACCGACTCCTGGCAGCAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCGGCCTGAACCCATGTCCTGCCGGTTCCCATGACCCCCAGCACCCAGAGCCCCACGGTGTCCCCGTTGGATAATGAGGACAAGGGCTGGGGGCTCCGGTGGTTTGCGGCAGGGACTTGATCACATCCTTCTGCTGTGGCCCCATTGCCTCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAAAGACAGGGATCACCGGCACCTCCCAATATCAACCCCAGGCAGCACAGACACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAACACTCTGGGGGACCCCAACCGTGATAACTCCCCACTGGAATCCGCCCCAGAGTCTACCAGGACCAAAGGCCCTGCCCTGTCTCTGTCCCTCACTCAGGGCCTCCTGCAGGGCGAGCGCTTGGGAGCAGACTCGGTCTTAGGGGACACCACTGTGGGCCCCAACTTTGATGAGGCCACTGACCCTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCAGGGAAGAACTACTGGCTGGTGGCCAATCACAGAGCCCCCAGGCCGAGGTGGCCCCAAGAAGGCCCTCAGGAGGTGGCCACTCCACTTCCTCCCAGCTGGACCCCAGGTCCTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGACTCCTCCCGGGACCCCACTGGACCTCAGTCCCTGCTCTGGGAATGCAGCCACCACAAGCACACCAGGAAGCCCAGGCCCAGCCACCCTGCAGTGGGCAAGCCCACACTCTGGAGCAGAGCAGGGTGCGTCTGGGAGGGGCTAACCTCCCCACCCCCCACCCCCCATCTGCACACAGCCACCTACCACTGCCCAGACCCTCTGCAGGAGGGCCAAGCCACCATGGGGTATGGACTTAGGGTCTCACTCACGTGCCTCCCCTCCTGGGAGAAGGGGCCTCATGCCCAGATCCCTGCAGCACTAGACACAGCTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCATCTAAGGCTGCTCCAGCCCAGACAGCACTGCCGTTCCTGGGAAGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACAGCCCACAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCAGGGCGGGACCTGCCTTCCTGCCACCACTTACACACAGGCCAGGGAGCTGTTCCCACACAGATCAACCCCAAACCGGGACTGCCTGGCACTAGGGTCACTGCCATTTCCCTCTCCATTCCCTCCCAGTGCCTCTGTGCTCCCTCCTTCTGGGGAACACCCTGTGCAGCCCCTCCCTGCAGCCCACACGCTGGGGAGACCCCACCCTGCCTCGGGCCTTTTCTACCTGCTGCACTTGCCGCCCACCCAAACAACCCTGGGTACGTGACCCTGCAGTCCTCACCCTGATCTGCAACCAGACCCCTGTCCCTCCCTCTAAACACCCCTCCCAGGCCAACTCTGCACCTGCAGGCCCTCCGCTCTTCTGCCACAAGAGCCTCAGGTTTTCCTACCTGTGCCCACCCCCTAACCCCTCCTGCCCACAACTTGAGTTCTTCCTCTCCTGGAGCCCTTGAGCCATGGCACTGACCCTACACTCCCACCCACACACTGCCCATGCCATCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCCCTCTCAGACCCGGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCTGGTTACACGGGAGCCTCCTGTGCGCAGAAGCAGGGAGCTCAGCTCTTCCACAGGCAGAAGGCACTGAAAGAAATCAGCCTCCAGTGCCTTGACACACGTCCGCCTGTGTCTCTCACTGCCTGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGATGAGGGATCCAGGCAGCAACATCACGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGGTCGCTGGATAGTAACCGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTAACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCCCGTGGAAAGAGAACAGACCCACAGTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACTAGGCAACAGCATCAGAGGGGGCTCCTGAGAAAGAGAGGAGGGGAGGTCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCTGAGACAGGCTCAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAGCCAGGCCAGAGCCAGCAAGAGGAGACTCGGTGACACCAGTCTCCTGTAGGGACAGGAGGATTTTGTGGGGGTTCGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCAAGCACAGTGACACAACCCCATTCAAAAACCCCTACTGCAAACGCACCCACTCCTGGGACTGAGGGGCTGGGGGAGCGTCTGGGAAGTATGGCCTAGGGGTGTCCATCAATGCCCAAAATGCACCAGACTCTCCCCAAGACATCACCCCACCAGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCAGGTGTGCAAGAGGGGATGTGGGCAGAGCCTCAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTATTCAAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTTGAAAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATCCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCCAAGGCAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCACTGGCAGGAACTGCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCTAGAGCCCTTCCTGAGAACCTCATGGGCAAAGATGTGCAGAACAGCTGTTTGTCATAGCCCCAAACTATGGGGCTGGACAAAGCAAACGTCCATCTGAAGGAGAACAGACAAATAAACGATGGCAGGTTCATGAAATGCAAACTAGGACAGCCAGAGGACAACAGTAGAGAGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTATAAGGAAAATCAAGAAAACGATGATCACATAAACACAGTGGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATCGCAAGAAGAGGAAAATGCACACACCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCAATCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCTCACTGTGTGGCAGGGCAGGCAGGCACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCTGTATATCCCCAAGGAAGGTACAGTCAGTGCATTCCAGAGAGAAGCAACTCAGCCACACTCCCTGGCCAGAACCCAAGATGCACACCCATGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCACCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGCTGTAGGGACTCATCCAGGGTTGGGGAATGACTCTGCAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCCCAGAATGATGCCTGTGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACAGTAGGGACAGATGTCAGCCTGAGGTGAAGCCTCAGGACACAGGTGGGCATGGACAGTGTCCACCTAAGCGAGGGACAGACCCGAGTGTCCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGGGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGGAGCCTCCCACCACAGCCCTCCCTGCGGGGGACCGCTGCATGCCGTGTTAGGATTTTGATCGAGGACACGGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACGGGGCAGCAGAAACAATGGACAGGCCCACAAGTGACCATGATGGGCTCCAGCCCACCAGCCCCAGAGACCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCAAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAAACCAGATGGAGACAGGGCCGGCCCCATAGCACCATCTGCTGCCGTCCACCCAGCAGTCCCGGAAGCCCCTCCCTGAACGCTGGGCCACGTGTGTGAACCCTGCGAGCCCCCCATGTCAGAGTAGGGGCAGCAGGAGGGCGGGGCTGGCCCTGTGCACTGTCACTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACATTCCCAGGGACAGCCGGAGCTGGGAGTCGCTCATCCTGCCTGGCTGTCCTGAGTCCTGCTCATTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAACGAACCTTCCAGAAATCCCTGTTTCTCTCCCCAGTGAGAGAAACCCTCTTCCAGGGTTTCTCTTCTCTCCCACCCTCTTCCAGGACAGTCCTCAGCAGCATCACAGCGGGAACGCACATCTGGATCAGGACGGCCCCCAGAACACGCGATGGCCCATGGGGACAGCCCAGCCCTTCCCAGACCCCTAAAAGGTATCCCCACCTTGCACCTGCCCCAGGGCTCAAACTCCAGGAGGCCTGACTCCTGCACACCCTCCTGCCAGATATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCAATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGTGTGGGAAAGGCCTCTGGCCACACTCAGGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGATGAAACCAGCATCAAAAACCGACCGGACTCGCAGGGTTTATGCACACTTCTCGGCTCGGAGCTCTCCAGGAGCACAAGAGCCAGGCCCGAGGGTTTGTGCCCAGACCCTCGGCCTCTAGGGACACCCGGGCCATCTTAGCCGATGGGCTGATGCCCTGCACACCGTGTGCTGCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGTCCCTTCACTGCCAGCTGCACCAGACCCTGTTCCGAGAGATGCCCCAGTTCCAAAAGCCAATTCCTGGGGCCGGGAATTACTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCACACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCGCAGACAGTTCCCCTCACCTGCCCATGTAGAAACACCTGCCATTGTCGTCCCCACCTGGCAAAGACCACTTGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGACCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACAGTGCATGTCTGGTCCCTGAGCAGCCCCCAGGCTCTCTAGCACTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGCCACACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGACCCCTGCCACGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGCCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGACTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACAGAGCCATGGAGTCACAGAGCCACGGAGCCCCCAGTGTGGGCGTGTGAGGGTGCTGGGCTCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGCCCCGTCCCACAGCCCAGGTCCCCAGGGGCAGCAGGCACAGAAGCTGCCAAGCTGTGCTCTACGATCCTCATCCCTCCAGCAGCATCCACTCCACAGTGGGGAAACTGAGCCTTGGAGAACCACCCAGCCCCCTGGAAACAAGGCGGGGAGCCCAGACAGTGGGCCCAGAGCACTGTGTGTATCCTGGCACTAGGTGCAGGGACCACCCGGAGATCCCCATCACTGAGTGGCCAGCCTGCAGAAGGACCCAACCCCAACCAGGCCGCTTGATTAAGCTCCATCCCCCTGTCCTGGGAACCTCTTCCCAGCGCCACCAACAGCTCGGCTTCCCAGGCCCTCATCCCTCCAAGGAAGGCCAAAGGCTGGGCCTGCCAGGGGCACAGTACCCTCCCTTGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGCAGATAGGACATATTGCTGGGGCATCTTGCTCTGTGACTACTGGGTACTGGCTCTCAACGCAGACCCTACCAAAATCCCCACTGCCTCCCCTGCTAGGGGCTGGCCTGGTCTCCTCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTTCTGTCCCCAGTTCTAGGGCCAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGTCCTTGCCGAGGTTCAGTGCAGGCACCCAGGACAGGAAATGGCCTGAACACAGGGATGACTGTGCCATGCCCTACCTAAGTCCGCCCCTTTCTACTCTGCAACCCCCACTCCCCAGGTCAGCCCATGACGACCAACAACCCAACACCAGAGTCACTGCCTGGCCCTGCCCTGGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGAGTTGGGGGGACAGGACACAGGCTCTCTCCTTATGGTTCCCCCACCTGGCTCCTGCCGGGACCCTTGGGGTGTGGACAGAAAGGACGCCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACTCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGCTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCAGGTGCTCCATCTTGGATGAGCCCATCCCTCTCACCCACCGACCCGCCCACCTCCTCTCCACCCTGGCCACACGTCGTCCACACCATCCTGAGTCCCACCTACACCAGAGCCAGCAGAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGCCAGGGCAGCTTTGGGGAGGGAGGAATGGAGGAAGGGGAGGTCAGTGAAGAGGCCCCCCTCCCCTGGGTCTAGGATCCACCTTTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGATTCTGTGCAGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCAGGGCCTGGGGGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAAGATATGGGGACCCCAATACTGGCACAGACCTCAGCTCCATCCAGGCCCACCAGGACCCACCATGGGTGGAACACCTGTCTCCGGCCCCTGCTGGCTGTGAGGCAGCTGGCCTCTGTCTCGGACCCCCATTCCAGACACCAGACAGAGGGACAGGCCCCCCAGAACCAGTGTTGAGGGACACCCCTGTCCAGGGCAGCCAAGTCCAAGAGGCGCGCTGAGCCCAGCAAGGGAAGGCCCCCAAACAAACCAGGAGGTTTCTGAAGCTGTCTGTGTCACAGTCGGGCATAGCCACGGCTACCACAATGACACTGGGCAGGACAGAAACCCCATCCCAAGTCAGCCGAAGGCAGAGAGAGCAGGCAGGACACATTTAGGATCTGAGGCCACACCTGACACTCAAGCCAACAGATGTCTCCCCTCCAGGGCGCCCTGCCCTGTTCAGTGTTCCTGAGAAAACAGGGGCAGCCTGAGGGGATCCAGGGCCAGGAGATGGGTCCCCTCTACCCCGAGGAGGAGCCAGGCGGGAATCCCAGCCCCCTCCCCATTGAGGCCATCCTGCCCAGAGGGGCCCGGACCCACCCCACACACCCAGGCAGAATGTGTGCAGGCCTCAGGCTCTGTGGGTGCCGCTAGCTGGGGCTGCCAGTCCTCACCCCACACCTAAGGTGAGCCACAGCCGCCAGAGCCTCCACAGGAGACCCCACCCAGCAGCCCAGCCCCTACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGGTGGATTTTGTACAGCCCCGAGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACCACAGTGAGAAAAGCTATGTCAAAAACCGTCTCCCGGCCACTGCTGGAGGCCCAGCCAGAGAAGGGACCAGCCGCCCGAACATACGACCTTCCCAGACCTCATGACCCCCAGCACTTGGAGCTCCACAGTGTCCCCATTGGATGGTGAGGATGGGGGCCGGGGCCATCTGCACCTCCCAACATCACCCCCAGGCAGCACAGGCACAAACCCCAAATCCAGAGCCGACACCAGGAACACAGACACCCCAATACCCTGGGGGACCCTGGCCCTGGTGACTTCCCACTGGGATCCACCCCCGTGTCCACCTGGATCAAAGACCCCACCGCTGTCTCTGTCCCTCACTCAGGGCCTGCTGAGGGGCGGGTGCTTTGGAGCAGACTCAGGTTTAGGGGCCACCATTGTGGGGCCCAACCTCGACCAGGACACAGATTTTTCTTTCCTGCCCTGGGGCAACACAGACTTTGGGGTCTGTGCAGGGAGGACCTTCTGGAAAGTCACCAAGCACAGAGCCCTGACTGAGGTGGTCTCAGGAAGACCCCCAGGAGGGGGCTTGTGCCCCTTCCTCTCATGTGGACCCCATGCCCCCCAAGATAGGGGCATCATGCAGGGCAGGTCCTCCATGCAGCCACCACTAGGCAACTCCCTGGCGCCGGTCCCCACTGCGCCTCCATCCCGGCTCTGGGGATGCAGCCACCATGGCCACACCAGGCAGCCCGGGTCCAGCAACCCTGCAGTGCCCAAGCCCTTGGCAGGATTCCCAGAGGCTGGAGCCCACCCCTCCTCATCCCCCCACACCTGCACACACACACCTACCCCCTGCCCAGTCCCCCTCCAGGAGGGTTGGAGCCGCCCATAGGGTGGGGGCTCCAGGTCTCACTCACTCGCTTCCCTTCCTGGGCAAAGGAGCCTCGTGCCCCGGTCCCCCCTGACGGCGCTGGGCACAGGTGTGGGTACTGGGCCCCAGGGCTCCTCCAGCCCCAGCTGCCCTGCTCTCCCTGGGAGGCCTGGGCACCACCAGACCACCAGTCCAGGGCACAGCCCCAGGGAGCCGCCCACTGCCAGCTCACAGGAAGAAGATAAGCTTCAGACCCTCAGGGCCGGGAGCTGCCTTCCTGCCACCCCTTCCTGCCCCAGACCTCCATGCCCTCCCCCAACCACTTACACACAAGCCAGGGAGCTGTTTCCACACAGTTCAACCCCAAACCAGGACGGCCTGGCACTCGGGTCACTGCCATTTCTGTCTGCATTCGCTCCCAGCGCCCCTGTGTTCCCTCCCTCCTCCCTCCTTCCTTTCTTCCTGCATTGGGTTCATGCCGCAGAGTGCCAGGTGCAGGTCAGCCCTGAGCTTGGGGTCACCTCCTCACTGAAGGCAGCCTCAGGGTGCCCAGGGGCAGGCAGGGTGGGGGTGAGGCTTCCAGCTCCAACCGCTTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCCGTCGACCAATTCTCATGTTTGACAGCTTATCATCGAATTTCTACGTA

毒素编码序列

表4中阐述了用于构建如本文所述的经改造的D_H区的毒素(例如μ-芋螺毒素和狼蛛毒素ProTxII)的示例性核苷酸编码序列(DNA和氨基酸(AA))。

表4

下文提供了用于构建经改造的D_H区、包含毒素核苷酸编码序列的示例性DNA片段。

TX-DH1166(SEQ ID NO:232)包括在对应于D_H1-1至D_H6-6的位置中插入的毒素编码序列：

TACGTAGCCGTTTCGATCCTCCCGAATTGACTAGTGGGTAGGCCTGGCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATACCGGTGGATTCGAATTCTCCCCGTTGAAGCTGACCTGCCCAGAGGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTACAGGCCCCGGTCTCTGTGGGTGTTCCGCTAACTGGGGCTCCCAGTGCTCACCCCACAACTAAAGCGAGCCCCAGCCTCCAGAGCCCCCGAAGGAGATGCCGCCCACAAGCCCAGCCCCCATCCAGGAGGCCCCAGAGCTCAGGGCGCCGGGGCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGAAGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGAGCCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAACTGTGTCAAAAACCGTCTCCTGGCCCCTGCTGGAGGCCGCGCCAGAGAGGGGAGCAGCCGCCCCGAACCTAGGTCCTGCTCAGCTCACACGACCCCCAGCACCCAGAGCACAACGGAGTCCCCATTGAATGGTGAGGACGGGGACCAGGGCTCCAGGGGGTCATGGAAGGGGCTGGACCCCATCCTACTGCTATGGTCCCAGTGCTCCTGGCCAGAACTGACCCTACCACCGACAAGAGTCCCTCAGGGAAACGGGGGTCACTGGCACCTCCCAGCATCAACCCCAGGCAGCACAGGCATAAACCCCACATCCAGAGCCGACTCCAGGAGCAGAGACACCCCAGTACCCTGGGGGACACCGACCCTGATGACTCCCCACTGGAATCCACCCCAGAGTCCACCAGGACCAAAGACCCCGCCCCTGTCTCTGTCCCTCACTCAGGACCTGCTGCGGGGCGGGCCATGAGACCAGACTCGGGCTTAGGGAACACCACTGTGGCCCCAACCTCGACCAGGCCACAGGCCCTTCCTTCCTGCCCTGCGGCAGCACAGACTTTGGGGTCTGTGCAGAGAGGAATCACAGAGGCCCCAGGCTGAGGTGGTGGGGGTGGAAGACCCCCAGGAGGTGGCCCACTTCCCTTCCTCCCAGCTGGAACCCACCATGACCTTCTTAAGATAGGGGTGTCATCCGAGGCAGGTCCTCCATGGAGCTCCCTTCAGGCTCCTCCCCGGTCCTCACTAGGCCTCAGTCCCGGCTGCGGGAATGCAGCCACCACAGGCACACCAGGCAGCCCAGACCCAGCCAGCCTGCAGTGCCCAAGCCCACATTCTGGAGCAGAGCAGGCTGTGTCTGGGAGAGTCTGGGCTCCCCACCGCCCCCCCGCACACCCCACCCACCCCTGTCCAGGCCCTATGCAGGAGGGTCAGAGCCCCCCATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCCTCCTGGGTGAAGGGGTCTCATGCCCAGATCCCCACAGCAGAGCTGGTCAAAGGTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGACCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGACTCCACCAGACCACAGGTCCAGGGCACCGCCCATAGGTGCTGCCCACACTCAGTTCACAGGAAGAAGATAAGCTCCAGACCCCCAAGACTGGGACCTGCCTTCCTGCCACCGCTTGTAGCTCCAGACCTCCGTGCCTCCCCCGACCACTTACACACGGGCCAGGGAGCTGTTCCACAAAGATCAACCCCAAACCGGGACCGCCTGGCACTCGGGCCGCTGCCACTTCCCTCTCCATTTGTTCCCAGCACCTCTGTGCTCCCTCCCTCCTCCCTCCTTCAGGGGAACAGCCTGTGCAGCCCCTCCCTGCACCCCACACCCTGGGGAGGCCCAACCCTGCCTCCAGCCCTTTCTCCCCCGCTGCTCTTCCTGCCCATCCAGACAACCCTGGGGTCCCATCCCTGCAGCCTACACCCTGGTCTCCACCCAGACCCCTGTCTCTCCCTCCAGACACCCCTCCCAGGCCAACCCTGCACATGCAGGCCCTCCCCTTTTCTGCTGCCAGAGCCTCAGTTTCTACCCTCTGTGCCTACCCCCTGCCTCCTCCTGCCCACAACTCGAGCTCTTCCTCTCCTGGGGCCCCTGAGCCATGGCACTGACCGTGCACTCCCACCCCCACACTGCCCATGCCCTCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCTTGGACCCAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCCGGTTACACGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCCTGATGCACGTCCGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTGTAAAGACGAGGGATCCAGGCAGCAACATCATGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGCCCGCTGGATAGTAACTGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCAGACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCGCGTGGAAACAGAACAGACCCACATTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCTGAGAAACACCAGGCAACGGCATCAGAGGGGGCTCCTGAGAAAGAAAGGAGGGGAGGTCTCCTTCACCAGCAAGTACTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCCCACACACCCTGAGTTTCAGACAAAAACCCCCTGGAAATCATAGTATCAGCAGGAGAACTAGCCAGAGACAGCAAGAGGGGACTCAGTGACTCCCGCGGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTAGCAGCAGATGGTGCTATACCCACAGTGACACAGCCCCATTCAAAAACCCCTGCTGTAAACGCTTCCACTTCTGGAGCTGAGGGGCTGGGGGGAGCGTCTGGGAAGTAGGGCCTAGGGGTGGCCATCAATGCCCAAAACGCACCAGACTCCCCCCCAGACATCACCCCACTGGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGATAGTTCCATAAACTGGTGTTCAAGATCGATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGGGCACAGGGAAGGAGAAGCAGCCGCTATCCTACACTGTCATCTTTCAAGAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCCACACAGAAGCAAGCACAAGGAAAGTGCCTGATGCAAGGGCAAAGTACAGTGTGTACCTTCAGGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGAACTCCCTGCAACAAAGCAGAGCCCTGCAGGCAATGCCAGCTCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAATGAAGCAAACAGCCATCTGAAGGAAAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCAGAAGGACAACAGTGAGGGTTACAGGTGACTCTGTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGGAAAGTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACAGCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCACTAGGAAAACTATAAGGAAAATCAAGAAAAGGATGATCACATAAACACAGTGGTCGTTACTTCTACTGGGGAAGGAAGAGGGTATGAACTGAGACACACAGGGTTGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAAATTCTAAATTGCAAGAAGAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAACGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATTGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATATGTGGTGGCACTCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCCGTATCCCCCCGAGGACATATACCCCCAAGGACGGCACAGTTGGTACATTCCGGAGACAAGCAACTCAGCCACACTCCCAGGCCAGAGCCCGAGAGGGACGCCCATGCACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCAGCAGCACCCGTGCAGGGGCCGCCATCTGGCAGGCACAGAGCATGGGCTGGGAGGAGGGGCAGGGACACCAGGCAGGGTTGGCACCAACTGAAAATTACAGAAGTCTCATACATCTACCTCAGCCTTGCCTGACCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGACCTCACCTGGCCTAGACCTCACCTCTGGGCTTCACCTGAGCTCGGCCTCACCTGACTTGGACCTTGCCTGTCCTGAGCTCACATGATCTGGGCCTCACCTGACCTGGGTTTCACCTGACCTGGGCTTCACCTGACCTGGGCCTCATCTGACCTGGGCCTCACTGGCCTGGACCTCACCTGGCCTGGGCTTCACCTGGCCTCAGGCCTCATCTGCACCTGCTCCAGGTCTTGCTGGAACCTCAGTAGCACTGAGGCTGCAGGGGCTCATCCAGGGTTGCAGAATGACTCTAGAACCTCCCACATCTCAGCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCTGAATGATGCCTGCGTGATTTGGGGGCAATTTATAAACCCAAAAGGACATGGCCATGCAGCGGGTAGGGACAATACAGACAGATATCAGCCTGAAATGGAGCCTCAGGGCACAGGTGGGCACGGACACTGTCCACCTAAGCCAGGGGCAGACCCGAGTGTCCCCGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTACCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACGATTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCTATTATACCCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAACCTTCTGCCACAGCCCTCCCTGTGGGGCACCGCCGCGTGCCATGTTAGGATTTTGACTGAGGACACAGCACCATGGGTATGGTGGCTACCGCAGCAGTGCAGCCCGTGACCCAAACACACAGGGCAGCAGGCACAACAGACAAGCCCACAAGTGACCACCCTGAGCTCCTGCCTGCCAGCCCTGGAGACCATGAAACAGATGGCCAGGATTATCCCATAGGTCAGCCAGACCTCAGTCCAACAGGTCTGCATCGCTGCTGCCCTCCAATACCAGTCCGGATGGGGACAGGGCTGGCCCACATTACCATTTGCTGCCATCCGGCCAACAGTCCCAGAAGCCCCTCCCTCAAGGCTGGGCCACATGTGTGGACCCTGAGAGCCCCCCATGTCTGAGTAGGGGCACCAGGAAGGTGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGGGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCCAGGACAGCTGGAGCTGGGAGTCCATCATCCTGCCTGGCCGTCCTGAGTCCTGCGCCTTTCCAAACCTCACCCGGGAAGCCAACAGAGGAATCACCTCCCACAGGCAGAGACAAAGACCTTCCAGAAATCTCTGTCTCTCTCCCCAGTGGGCACCCTCTTCCAGGGCAGTCCTCAGTGATATCACAGTGGGAACCCACATCTGGATCGGGACTGCCCCCAGAACACAAGATGGCCCACAGGGACAGCCCCACAGCCCAGCCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCATCTGCCCCAGGGCTCAAACTCCAGGAGGACTGACTCCTGCACACCCTCCTGCCAGACATCACCTCAGCCCCTCCTGGAAGGGACAGGAGCGCGCAAGGGTGAGTCAGACCCTCCTGCCCTCGATGGCAGGCGGAGAAGATTCAGAAAGGTCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGGCACACTCAGGGGGATTTTGTGAAGGGTCCTCCCACTGTGGAGAGGCTTAGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAAAGCAAGCCTCACAGATGCTGCCACAGTGATGAACCCAGCATCAAAAACCGACCGGACTCCCAAGGTTTATGCACACTTCTCCGCTCAGAGCTCTCCAGGATCAGAAGAGCCGGGCCCAAGGGTTTCTGCCCAGACCCTCGGCCTCTAGGGACATCTTGGCCATGACAGCCCATGGGCTGGTGCCCCACACATCGTCTGCCTTCAAACAAGGGCTTCAGAGGGCTCTGAGGTGACCTCACTGATGACCACAGGTGCCCTGGCCCCTTCCCCACCAGCTGCACCAGACCCCGTCATGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGGCCAGGAATCGCTGTAGACACCAGCCTCCTTCCAACACCTCCTGCCAATTGCCTGGATTCCCATCCCGGTTGGAATCAAGAGGACAGCATCCCCCAGGCTCCCAACAGGCAGGACTCCCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGTAGGGCCAGGCTGCAGACAGTCCCCCTCACCTGCCACTAGACAAATGCCTGCTGTAGATGTCCCCACCTGGAAAATACCACTCATGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCTCTGAGGCCCCTAAGAAGTAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCTGACAGGAGTGGACGCTGGAGCTGGGCCCATACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCTCTATTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGTACAGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCAGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTTTTCTGCACTCTCCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGATCTGTTCTCAACATCCCACGGCCTCATTCCTGCAAGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGACAGGACATCCTGCTGGGGTATCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTTGCCAAAATCCCCACGGCCTCCCCCGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGCAGGTGACCAGGGCAGGAAATGGCCTGAACACAGGGATAACCGGGCCATCCCCCAACAGAGTCCACCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGCCCATGACATCCGACAACCCCACACCAGAGTCACTGCCCGGTGCTGCCCTAGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTGGGGAGGACAGGACACGCCCTCTCCTTATGGTTCCCCCACCTGGCTCTGGCTGGGACCCTTGGGGTGTGGACAGAAAGGACGCTTGCCTGATTGGCCCCCAGGAGCCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAGGGAGGAAGTGGGGCCACTGCACCACCAGGCAGGAGGCTCTGTCTTTGTGAACCCAGGGAGGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTATGGCTCCCACAGTGGCAGGCTGCAGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCCGCGGGTGCTCCATCTTGGATGAGCCTATCTCTCTCACCCACGGACTCGCCCACCTCCTCTTCACCCTGGCCACACGTCGTCCACACCATCCTAAGTCCCACCTACACCAGAGCCGGCACAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGACTGGGCAGCTTCGGGGAGGGAGGAATGGAGGAAGGGGAGTTCAGTGAAGAGGCCCCCCTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCTGGGCCTGGGGGCAGCCGCTCCCACACAGGATGAACCCAGCACCCCGAGGATGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAGGATATGGGACCCCCGATACAGGCACAGACCTCAGCTCCATTCAGGACTGCCACGTCCTGCCCTGGGAGGAACCCCTTTCTCTAGTCCCTGCAGGCCAGGAGGCAGCTGACTCCTGACTTGGACGCCTATTCCAGACACCAGACAGAGGGGCAGGCCCCCCAGAACCAGGGATGAGGACGCCCCGTCAAGGCCAGAAAAGACCAAGTTGCGCTGAGCCCAGCAAGGGAAGGTCCCCAAACAAACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGAGCTGCAACTGCAGCAGCAAATGGAGCCGCGACCATAGCAGGTGCTGCCACAGTGACACTCGCCAGGTCAAAAACCCCATCCCAAGTCAGCGGAATGCAGAGAGAGCAGGGAGGACATGTTTAGGATCTGAGGCCGCACCTGACACCCAGGCCAGCAGACGTCTCCTGTCCACGGCACCCTGCCATGTCCTGCATTTCTGGAAGAACAAGGGCAGGCTGAAGGGGGTCCAGGACCAGGAGATGGGTCCGCTCTACCCAGAGAAGGAGCCAGGCAGGACACAAGCCCCCACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTACGTA

TX-DH17613(SEQ ID NO:233)包括在对应于D_H1-7至D_H6-13的位置中插入的毒素编码序列：

GCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATTACGTAACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTCCCCATTGAGGCTGACCTGCCCAGAGGGTCCTGGGCCCACCCAACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAACGAGCCACAGCCTCCGGAGCCCCTGAAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCACAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAGCTTCGTCAAAAACCGTCTCCTGGCCACAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCACCCCAAACCCATGTTCTGCCGGCTCCCATGACCCCGTGCACCTGGAGCCCCACGGTGTCCCCACTGGATGGGAGGACAAGGGCCGGGGGCTCCGGCGGGTCGGGGCAGGGGCTTGATGGCTTCCTTCTGCCGTGGCCCCATTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGTCAGGGATCAGTGGCACCTCCCAACATCAACCCCACGCAGCCCAGGCACAAACCCCACATCCAGGGCCAACTCCAGGAACAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTCCCGTCCCATCTCTGTCCCTCACTTGGGGCCTGCTGCGGGGCGAGCACTTGGGAGCAAACTCAGGCTTAGGGGACACCACTGTGGGCCTGACCTCGAGCAGGCCACAGACCCTTCCCTCCTGCCCTGGTGCAGCACAGACTTTGGGGTCTGGGCAGGGAGGAACTTCTGGCAGGTCACCAAGCACAGAGCCCCCAGGCTGAGGTGGCCCCAGGGGGAACCCCAGCAGGTGGCCCACTACCCTTCCTCCCAGCTGGACCCCATGTCTTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGGCTCCTCTCCAGACCCCACTGGGCCTCAGTCCCCACTCTAGGAATGCAGCCACCACGGGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCCCACACCCTGGAGGAGAGCAGGGTGCGTCTGGGAGGGGCTGGGCTCCCCACCCCCACCCCCACCTGCACACCCCACCCACCCTTGCCCGGGCCCCCTGCAGGAGGGTCAGAGCCCCCATGGGATATGGACTTAGGGTCTCACTCACGCACCTCCCCTCCTGGGAGAAGGGGTCTCATGCCCAGATCCCCCCAGCAGCGCTGGTCACAGGTAGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCCCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCTAGGGCACCGCCCACACTGGGGCCGCCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGCCCGGGACCTGCCTTGCTGCTACGACTTCCTGCCCCAGACCTCGTTGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGACCAACCCCAGACGGGGACCACCTGGCACTCAGGTCACTGCCATTTCCTTCTCCATTCACTTCCAATGCCTCTGTGCTTCCTCCCTCCTCCTTCCTTCGGGGGAGCACCCTGTGCAGCTCCTCCCTGCAGTCCACACCCTGGGGAGACCCGACCCTGCAGCCCACACCCTGGGGAGACCTGACCCTCCTCCAGCCCTTTCTCCCCCGCTGCTCTTGCCACCCACCAAGACAGCCCTGGGGTCCTGTCCCTACAGCCCCCACCCAGTTCTCTACCTAGACCCGTCTTCCTCCCTCTAAACACCTCTCCCAGGCCAACCCTACACCTGCAGGCCCTCCCCTCCACTGCCAAAGACCCTCAGTTTCTCCTGCCTGTGCCCACCCCCGTGCTCCTCCTGCCCACAGCTCGAGCTCTTCCTCTCCTAGGGCCCCTGAGGGATGGCATTGACCGTGCCCTCGCACCCACACACTGCCCATGCCCTCACATTCCTCCTGGCCACTCCAGCCCCACTCCCCTCTCAGGCCTGGCTCTGGTATTTCTGGGACAAAGCCTTACCCAAGTCTTTCCCATGCAGGCCTGGGCCCTTACCCTCACTGCCCGGTTACAGGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCGCCTTGACACACGTCTGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTCTAAAGACGAGGGATCCAGGCAGCAGCATCACAGGAGAATGCAGGGCTACCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGAAGACGCCCAGTCAACGGAGTCTAACACCAAACCTCCCTGGAGGCCGATGGGTAGTAACGGAGTCATTGCCAGACCTGGAGGCAGGGGAGCAGTGAGCCCGAGCCCACACCATAGGGCCAGAGGACAGCCACTGACATCCCAAGCCACTCACTGGTGGTCCCACAACACCCCATGGAAAGAGGACAGACCCACAGTCCCACCTGGACCAGGGCAGAGACTGCTGAGACCCAGCACCAGAACCAACCAAGAAACACCAGGCAACAGCATCAGAGGGGGCTCTGGCAGAACAGAGGAGGGGAGGTCTCCTTCACCAGCAGGCGCTTCCCTTGACCGAAGACAGGATCCATGCAACTCCCCCAGGACAAAGGAGGAGCCCCTTGTTCAGCACTGGGCTCAGAGTCCTCTCCAAGACACCCAGAGTTTCAGACAAAAACCCCCTGGAATGCACAGTCTCAGCAGGAGAGCCAGCCAGAGCCAGCAAGATGGGGCTCAGTGACACCCGCAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTACTAATCGGAGCAGGCAGGGTGTATGCTATACCCACAGTGACACAGCCCCATTCAAAAACCCCTACTGCAAACGCATTCCACTTCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAATAGGGCTCAGGGGTGTCCATCAATGCCCAAAACGCACCAGACTCCCCTCCATACATCACACCCACCAGCCAGCGAGCAGAGTAAACAGAAAATGAGAAGCAAGCTGGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGTAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCGAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGCGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCGAAAGTTTGCCTTGTGCCCACACTGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCCTGGCAGGAACTCCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAGCAAAGCAAACGTCCATCTGAAGGAGAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCACAAGCACAAAAGTACAGGGTTATAAGCGACTCTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGTAAACTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACACCCTGCAAAATGAACTGTCTTCTTAAGGGATACATTTCCCAGTTAGAAAACCATAAAGAAAACCAAGAAAAGGATGATCACATAAACACAGTGGTGGTTACTTCTGCTGGGGAAGGAAGAGGGTATGAACTGAGATACACAGGGTGGGCAAGTCTCCTAACAAGAACAGAACGAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATTGCAAGAAGAGGAAAATGCACACAGTTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTCGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATATATTTAGTATATGAGACATCGATGATGTATCCCCAAATAAACGACTTTAAAGAGATAAAGGGCTGATGTGTGGTGGCATTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCTCACTGTGCAGCAGGGCAGGCGGGTACCTGCTGGCAGTTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCCATATATCCCGGAGGACGGCACAGTCAGTGAATTCCAGAGAGAAGCAACTCAGCCACACTCCCCAGGCAGAGCCCGAGAGGGACGCCCACGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCAGCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGACGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACTGGCCTGGGCCTCACTTAACCTGGGCTTCACCTGACCTTGGCCTCACCTGACTTGGACCTCGCCTGTCCCAAGCTTTACCTGACCTGGGCCTCAACTCACCTGAACGTCTCCTGACCTGGGTTTAACCTGTCCTGGAACTCACCTGGCCTTGGCTTCCCCTGACCTGGACCTCATCTGGCCTGGGCTTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCATCTGGCCTGGACCTCACCTGGCCTGGACTTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGGTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTAGAAGTCTCCCACATCTGACCTTTCTGGGTGGAGGCAGCTGGTGGCCCTGGGAATATAAAAATCTCCAGAATGATGACTCTGTGATTTGTGGGCAACTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGGTGGGCACGGACACTATCCACATAAGCGAGGGATAGACCCGAGTGTCCCCACAGCAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCAGAGCCCTGCTGCCTCCTCCGGTCAGCCCTGGACATCCCAGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACGATTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCTATTATAACCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGAAGCTTCCCGCCACAGCCCTCCCCATGGGGCCCTGCTGCCTCCTCAGGTCAGCCCCGGACATCCCGGGTTTCCCCAGGCTGGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACTATGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCTATTATAACCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAGCCTCCCGCCACAGCCCTCCCTGCAGGGGACCGGTACGTGCCATGTTAGGATTTTGATCGAGGAGACAGCACCATGGGTATGGTGGCTACCACAGCAGTGCAGCCTGTGACCCAAACCCGCAGGGCAGCAGGCACGATGGACAGGCCCGTGACTGACCACGCTGGGCTCCAGCCTGCCAGCCCTGGAGATCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCGAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAGTCCAAATGGGACAGGGACGGCCTCACAGCACCATCTGCTGCCATCAGGCCAGCGATCCCAGAAGCCCCTCCCTCAAGGCTGGGCACATGTGTGGACACTGAGAGCCCTCATATCTGAGTAGGGGCACCAGGAGGGAGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCTGGGGACAGCCGGAGCTGGGCGTCGCTCATCCTGCCCGGCCGTCCTGAGTCCTGCTCATTTCCAGACCTCACCGGGGAAGCCAACAGAGGACTCGCCTCCCACATTCAGAGACAAAGAACCTTCCAGAAATCCCTGCCTCTCTCCCCAGTGGACACCCTCTTCCAGGACAGTCCTCAGTGGCATCACAGCGGCCTGAGATCCCCAGGACGCAGCACCGCTGTCAATAGGGGCCCCAAATGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGCCACACTCGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCCACAGTGATGAACCCAGTGTCAAAAACCGGCTGGAAACCCAGGGGCTGTGTGCACGCCTCAGCTTGGAGCTCTCCAGGAGCACAAGAGCCGGGCCCAAGGATTTGTGCCCAGACCCTCAGCCTCTAGGGACACCTGGGTCATCTCAGCCTGGGCTGGTGCCCTGCACACCATCTTCCTCCAAATAGGGGCTTCAGAGGGCTCTGAGGTGACCTCACTCATGACCACAGGTGACCTGGCCCTTCCCTGCCAGCTATACCAGACCCTGTCTTGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGACCCTGAATAGCTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAAGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGACAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGAGACACTGTGCATGTCTGGTACCTAAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCTCAGCTGTCTGGGCCCTCCCTGCTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGCGATGTCACACTGTGTACTGCCAGAAGTGGATGTGGACTAGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTAAGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGCGCAGCCCCAGGCATCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGTCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGATTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACGGAGCCACGGAGTCACAGAGCCACGGAGCCCCCATTGTGGGCATTTGAGAGTGCTGTGCCCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGTCCCATCCCACAGCCCGGGTCCCACGGGCAGCGGGCACAGAAGCTGCCAGGTTGTCCTCTATGATCCTCATCCCTCCAGCAGCATCCCCTCCACAGTGGGGAAACTGAGGCTTGGAGCACCACCCGGCCCCCTGGAAATGAGGCTGTGAGCCCAGACAGTGGGCCCAGAGCACTGTGAGTACCCCGGCAGTACCTGGCTGCAGGGATCAGCCAGAGATGCCAAACCCTGAGTGACCAGCCTACAGGAGGATCCGGCCCCACCCAGGCCACTCGATTAATGCTCAACCCCCTGCCCTGGAGACCTCTTCCAGTACCACCAGCAGCTCAGCTTCTCAGGGCCTCATCCCTGCAAGGAAGGTCAAGGGCTGGGCCTGCCAGAAACACAGCACCCTCCCTAGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGTGGACGGGACATATTGCTGGGGCATTTCTCACTGTCACTTCTGGGTGGTAGCTCTGACAAAAACGCAGACCCTGCCAAAATCCCCACTGCCTCCCGCTAGGGGCTGGCCTGGAATCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGCCCTTGCCGGGGTTGAATGCAGGTGCCCAAGGCAGGAAATGGCATGAGCACAGGGATGACCGGGACATGCCCCACCAGAGTGCGCCCCTTCCTGCTCTGCACCCTGCACCCCCCAGGCCAGCCCACGACGTCCAACAACTGGGCCTGGGTGGCAGCCCCACCCAGACAGGACAGACCCAGCACCCTGAGGAGGTCCTGCCAGGGGGAGCTAAGAGCCATGAAGGAGCAAGATATGGGGCCCCCGATACAGGCACAGATGTCAGCTCCATCCAGGACCACCCAGCCCACACCCTGAGAGGAACGTCTGTCTCCAGCCTCTGCAGGTCGGGAGGCAGCTGACCCCTGACTTGGACCCCTATTCCAGACACCAGACAGAGGCGCAGGCCCCCCAGAACCAGGGTTGAGGGACGCCCCGTCAAAGCCAGACAAAACCAAGGGGTGTTGAGCCCAGCAAGGGAAGGCCCCCAAACAGACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCCACAGTGACACTCACCCAGTCAAAAACCCCATTCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGACTGCACCTGACACCCAGGCCAGCAGACGTCTCCCCTCCAGGGCACCCCACCCTGTCCTGCATTTCTGCAAGATCAGGGGCGGCCTGAGGGGGGGTCTAGGGTGAGGAGATGGGTCCCCTGTACACCAAGGAGGAGTTAGGCAGGTCCCGAGCACTCTTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTACGTAATGCATTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCC

TX-DH114619(SEQ ID NO:234)包括在对应于D_H1-14至D_H6-19的位置中插入的毒素编码序列：

TACGTATTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTCCCCATTGAGGCTGACCTGCCCAGAGAGTCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAATGAGCCACAGCCTCCGGAGCCCCCGCAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGATGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGTGCCGCGATCATAGCAGGTGCTGCCACAGTGAGAATAGCTACGTCAAAAACCGTCCAGTGGCCACTGCCGGAGGCCCCGCCAGAGAGGGCAGCAGCCACTCTGATCCCATGTCCTGCCGGCTCCCATGACCCCCAGCACGCGGAGCCCCACAGTGTCCCCACTGGATGGGAGGACAAGAGCTGGGGATTCCGGCGGGTCGGGGCAGGGGCTTGATCGCATCCTTCTGCCGTGGCTCCAGTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGACAGGCATCACCGGCGCCTCCCAACATCAACCCCAGGCAGCACAGGCACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTTCCCACTGGAATTCGCCGTAGAGTCCACCAGGACCAAAGACCCTGCCTCTGCCTCTGTCCCTCACTCAGGACCTGCTGCCGGGCGAGGCCTTGGGAGCAGACTTGGGCTTAGGGGACACCAGTGTGACCCCGACCTTGACCAGGACGCAGACCTTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCCAGGAGGAACTTCTGGCAGGTCGCCAAGCACAGAGGCCACAGGCTGAGGTGGCCCTGGAAAGACCTCCAGGAGGTGGCCACTCCCCTTCCTCCCAGCTGGACCCCATGTCCTCCCCAAGATAAGGGTGCCATCCAAGGCAGGTGCTCCTTGGAGCCCCATTCAGACTCCTCCCTGGACCCCACTGGGCCTCAGTCCCAGCTCTGGGGATGAAGCCACCACAAGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCACACACTCTGGAGCAGAGCAGGGTGCCTCTGGGAGGGGCTGAGCTCCCCACCCCACCCCCACCTGCACACCCCACCCACCCCTGCCCAGCGGCTCTGCAGGAGGGTCAGAGCCCCACATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCATCATGAGTGAAGGGGCCTCAAGCCCAGGTTCCCACAGCAGCGCCTGTCGCAAGTGGAGGCAGAGGCCCGAGGGCCACCCTGACCTGGTCCCTGAGGTTCCTGCAGCCCAGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACCGGGTGCAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGGCCAGAACCTGCCTTCCTGCTACTGCTTCCTGCCCCAGACCTGGGCGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGAACAACCCCAAACCAGGACCGCCTGGCACTCAGGTGGCTGCCATTTCCTTCTCCATTTGCTCCCAGCGCCTCTGTCCTCCCTGGTTCCTCCTTCGGGGGAACAGCCTGTGCAGCCAGTCCCTGCAGCCCACACCCTGGGGAGACCCAACCCTGCCTGGGGCCCTTCCAACCCTGCTGCTCTTACTGCCCACCCAGAAAACTCTGGGGTCCTGTCCCTGCAGTCCCTACCCTGGTCTCCACCCAGACCCCTGTGTATCACTCCAGACACCCCTCCCAGGCAAACCCTGCACCTGCAGGCCCTGTCCTCTTCTGTCGCTAGAGCCTCAGTTTCTCCCCCCTGTGCCCACACCCTACCTCCTCCTGCCCACAACTCTAACTCTTCTTCTCCTGGAGCCCCTGAGCCATGGCATTGACCCTGCCCTCCCACCACCCACAGCCCATGCCCTCACCTTCCTCCTGGCCACTCCGACCCCGCCCCCTCTCAGGCCAAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTTCCCAGGCAGGCCTGGGCTCTTGCCCTCACTTCCCGGTTACACGGGAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCTTGACACACGTCCGCCCGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGACAAGGGATCCAGGCAGCAGCATCACGGGAGAATGCAGGGCTCCCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACCAAACAGCCACAGAGGCTGCTGGATAGTAACTGAGTCAATGACCGACCTGGAGGGCAGGGGAGCAGTGAGCCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCTCCTCAATGGTGGCCCCATAACACACCTAGGAAACATAACACACCCACAGCCCCACCTGGAACAGGGCAGAGACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACCAGGCAACAGTATCAGAGGGGGCTCCCGAGAAAGAGAGGAGGGGAGATCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTATACAGCACTGGGCTCAGAGTCCTCTCTGAGACACCCTGAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAACAGACCAAAGCCAGCAAAAGGGACCTCGGTGACACCAGTAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTAGTGGTAGCAGCAGATGGGGTAGCTGCTACTCCCACAGTGACACAGACCCATTCAAAAACCCCTACTGCAAACACACCCACTCCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAGTAGGGTCCAGGGGTGTCTATCAATGTCCAAAATGCACCAGACTCCCCGCCAAACACCACCCCACCAGCCAGCGAGCAGGGTAAACAGAAAATGAGAGGCTCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCAGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCAAGATCAGTGGCTGGGAATGAGCCCAGGAGGGCAGTCTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCAAAAGTTTGCCTTGTGACCACACTATTGCATCATGGGATGCTTAAGAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGAATTTGCAGCATAGATCTGAATAAACTCTCCAGAATGTGGAGCAGTACAGAAGCAAACACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGATCTCCCTGCGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCGTCATGGGGAAAGATGTGCAGAACAGCTGATTATCATAGACTCAAACTGAGAACAGAGCAAACGTCCATCTGAAGAACAGTCAAATAAGCAATGGTAGGTTCATGCAATGCAAACCCAGACAGCCAGGGGACAACAGTAGAGGGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCAGGCAAAATGAACTGTCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTACAAGGAAAATTAAGAAAACGATGATCACATAAACACAGTTGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCAAGCAAGCACAGAACGAATACATTACAGTACCTTGAATACAGCAGTTAAACTTCTAAATCGCAAGAACAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTATTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAATGATGACACAGGCAATTGCACAATGATACAGACATACATTTAGTACATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCACTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACATGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCTGTATACCCCCAAGGATGGCACAGTCAGTGAATTCCAGAGAGAAGCAGCTCAGCCACACTGCCCAGGCAGAGCCCGAGAGGGACGCCCACGTACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCACCACCACCTGTGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACCTGGTCTGGACCTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCCGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAACCTGAGTAGCACTGAGGCTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTGGAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCATCTGGTGGCCCTGGGAATATAAAAAGCCCCAGAATGGTGCCTGCGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGTTGGACGCGGACACTATCCACATAAGCGAGGGACAGACCCGAGTGTTCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCAGATGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTATGATTACGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCTATCGTTATACCCACAGTGTCACACGGTCCATCAAAAACCCATGCCACAGCCCTCCCCGCAGGGGACCGCCGCGTGCCATGTTACGATTTTGATCGAGGACACAGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACAGGGCAGCAGGCACAATGGACAGGCCTGTGAGTGACCATGCTGGGCTCCAGCCCGCCAGCCCCGGAGACCATGAAACAGATGGCCAAGGTCACCCCACAGTTCAGCCAGACATGGCTCCGTGGGGTCTGCATCGCTGCTGCCCTCTAACACCAGCCCAGATGGGGACAAGGCCAACCCCACATTACCATCTCCTGCTGTCCACCCAGTGGTCCCAGAAGCCCCTCCCTCATGGCTGAGCCACATGTGTGAACCCTGAGAGCACCCCATGTCAGAGTAGGGGCAGCAGAAGGGCGGGGCTGGCCCTGTGCACTGTCCCTGCACCCATGGTCCCTCGCCTGCCTGGCCCTGACACCTGAGCCTCTTCTGAGTCATTTCTAAGATAGAAGACATTCCCGGGGACAGCCGGAGCTGGGCGTCGCTCATCCCGCCCGGCCGTCCTGAGTCCTGCTTGTTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAAAGAACCTTCCAGAAATCCCTGTCTCACTCCCCAGTGGGCACCTTCTTCCAGGACATTCCTCGGTCGCATCACAGCAGGCACCCACATCTGGATCAGGACGGCCCCCAGAACACAAGATGGCCCATGGGGACAGCCCCACAACCCAGGCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCACCTGCCCCAGGGCTAAAAATCCAGGAGGCTTGACTCCCGCATACCCTCCAGCCAGACATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCGATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCGCTGGGCACACTCAGGGGGATTTTGTGAAGGCCCCTCCCACTGTGGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCCACAGTGATGAAACTAGCATCAAAAACCGGCCGGACACCCAGGGACCATGCACACTTCTCAGCTTGGAGCTCTCCAGGACCAGAAGAGTCAGGTCTGAGGGTTTGTAGCCAGACCCTCGGCCTCTAGGGACACCCTGGCCATCACAGCGGATGGGCTGGTGCCCCACATGCCATCTGCTCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGCCCCTTCCCCGCCAGCTACACCGAACCCTGTCCCAACAGCTGCCCCAGTTCCAACAGCCAATTCCTGGGGCCCAGAATTGCTGTAGACACCAGCCTCGTTCCAGCACCTCCTGCCAATTGCCTGGATTCACATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGACTCCCCGAGGGATCTAAGAAGGAGCCATGCGCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACACTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGTACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGAGCTGTGAGGGTATGGTATGCCGGCTGTGGAGTAAGAAGAAGCTCTGGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGTCACTGTTGTCTGTACTCTGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTTCTCAACATCCCAGGGCCTCATGTCTGCACGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGGACAGTACATACTGCTGGGGTGTCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTCGCCAAAATCCCCACAGCCTCCCCTGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGTCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGGAGGTGACCAAGGTAGGAAATGGCCTTAACACAGGGATGACTGCGCCATCCCCCAACAGAGTCAGCCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGTCCACGAAAACCAGGGCCCCACATCAGAGTCACTGCCTGGCCCGGCCCTGGGGCGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTTGGGGGGACAGGACACAGGCCCTCTCCTTATGGTTCCCCCACCTGCCTCCGGCCGGGACCCTTGGGGTGTGGACAGAAAGGACACCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCGGTATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCGGGTGCTCCTCCATCTTCGGTGAGCCTCCCCCTTCACCCACCGTCCCGCCCACCTCCTCTCCACCCTGGCTGCACGTCTTCCACACCATCCTGAGTCCTACCTACACCAGAGCCAGCAAAGCCAGTGCAGACAAAGGCTGGGGTGCAGGGGGGCTGCCAGGGCAGCTTCGGGGAGGGAAGGATGGAGGGAGGGGAGGTCAGTGAAGAGGCCCCCTTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCTGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATATCCCCACAGCGGCTCAGGCCAGACCCAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTCCTGGGCCTGGGTAGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAAGAGCAGGATATGGGGTCCCCGATACAGGCACAGACCTCAGCTCCATCCAGGCCCACCGGGACCCACCATGGGAGGAACACCTGTCTCCGGGTTGTGAGGTAGCTGGCCTCTGTCTCGGACCCCACTCCAGACACCAGACAGAGGGGCAGGCCCCCCAAAACCAGGGTTGAGGGATGATCCGTCAAGGCAGACAAGACCAAGGGGCACTGACCCCAGCAAGGGAAGGCTCCCAAACAGACGAGGAGGATTTTGTAGCTGTCTGTATCACTGTGTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCCACAGTGACACTCGCCAGGTCAAAAACCCCGTCCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGGCCGCACCTGACACCCAGGGCAGCAGACGTCTCCCCTCCAGGGCACCCTCCACCGTCCTGCGTTTCTTCAAGAATAGGGGCGGCCTGAGGGGGTCCAGGGCCAGGCGATAGGTCCCCTCTACCCCAAGGAGGAGCCAGGCAGGACCCGAGCACCGATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTACGTA

TX-DH120126(SEQ ID NO:235)包括在对应于D_H1-20至D_H1-26的位置中插入的毒素编码序列：

TACGTAATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTCCCCATTGAGGCTGACCTGCCCAGACGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCCCAGTCTCTGTGGGTGTTCCGCTAGCTGGGGCCCCCAGTGCTCACCCCACACCTAAAGCGAGCCCCAGCCTCCAGAGCCCCCTAAGCATTCCCCGCCCAGCAGCCCAGCCCCTGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAACTGTGTCAAAAACCGACTCCTGGCAGCAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCGGCCTGAACCCATGTCCTGCCGGTTCCCATGACCCCCAGCACCCAGAGCCCCACGGTGTCCCCGTTGGATAATGAGGACAAGGGCTGGGGGCTCCGGTGGTTTGCGGCAGGGACTTGATCACATCCTTCTGCTGTGGCCCCATTGCCTCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAAAGACAGGGATCACCGGCACCTCCCAATATCAACCCCAGGCAGCACAGACACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAACACTCTGGGGGACCCCAACCGTGATAACTCCCCACTGGAATCCGCCCCAGAGTCTACCAGGACCAAAGGCCCTGCCCTGTCTCTGTCCCTCACTCAGGGCCTCCTGCAGGGCGAGCGCTTGGGAGCAGACTCGGTCTTAGGGGACACCACTGTGGGCCCCAACTTTGATGAGGCCACTGACCCTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCAGGGAAGAACTACTGGCTGGTGGCCAATCACAGAGCCCCCAGGCCGAGGTGGCCCCAAGAAGGCCCTCAGGAGGTGGCCACTCCACTTCCTCCCAGCTGGACCCCAGGTCCTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGACTCCTCCCGGGACCCCACTGGACCTCAGTCCCTGCTCTGGGAATGCAGCCACCACAAGCACACCAGGAAGCCCAGGCCCAGCCACCCTGCAGTGGGCAAGCCCACACTCTGGAGCAGAGCAGGGTGCGTCTGGGAGGGGCTAACCTCCCCACCCCCCACCCCCCATCTGCACACAGCCACCTACCACTGCCCAGACCCTCTGCAGGAGGGCCAAGCCACCATGGGGTATGGACTTAGGGTCTCACTCACGTGCCTCCCCTCCTGGGAGAAGGGGCCTCATGCCCAGATCCCTGCAGCACTAGACACAGCTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCATCTAAGGCTGCTCCAGCCCAGACAGCACTGCCGTTCCTGGGAAGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACAGCCCACAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCAGGGCGGGACCTGCCTTCCTGCCACCACTTACACACAGGCCAGGGAGCTGTTCCCACACAGATCAACCCCAAACCGGGACTGCCTGGCACTAGGGTCACTGCCATTTCCCTCTCCATTCCCTCCCAGTGCCTCTGTGCTCCCTCCTTCTGGGGAACACCCTGTGCAGCCCCTCCCTGCAGCCCACACGCTGGGGAGACCCCACCCTGCCTCGGGCCTTTTCTACCTGCTGCACTTGCCGCCCACCCAAACAACCCTGGGTACGTGACCCTGCAGTCCTCACCCTGATCTGCAACCAGACCCCTGTCCCTCCCTCTAAACACCCCTCCCAGGCCAACTCTGCACCTGCAGGCCCTCCGCTCTTCTGCCACAAGAGCCTCAGGTTTTCCTACCTGTGCCCACCCCCTAACCCCTCCTGCCCACAACTTGAGTTCTTCCTCTCCTGGAGCCCTTGAGCCATGGCACTGACCCTACACTCCCACCCACACACTGCCCATGCCATCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCCCTCTCAGACCCGGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCTGGTTACACGGGAGCCTCCTGTGCGCAGAAGCAGGGAGCTCAGCTCTTCCACAGGCAGAAGGCACTGAAAGAAATCAGCCTCCAGTGCCTTGACACACGTCCGCCTGTGTCTCTCACTGCCTGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGATGAGGGATCCAGGCAGCAACATCACGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGGTCGCTGGATAGTAACCGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTAACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCCCGTGGAAAGAGAACAGACCCACAGTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACTAGGCAACAGCATCAGAGGGGGCTCCTGAGAAAGAGAGGAGGGGAGGTCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCTGAGACAGGCTCAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAGCCAGGCCAGAGCCAGCAAGAGGAGACTCGGTGACACCAGTCTCCTGTAGGGACAGGAGGATTTTGTGGGGGTTCGTGTCACTGTGAGCATATTGTCGGAGCAGGCAGTGCTATTCCCACAGTGACACAACCCCATTCAAAAACCCCTACTGCAAACGCACCCACTCCTGGGACTGAGGGGCTGGGGGAGCGTCTGGGAAGTATGGCCTAGGGGTGTCCATCAATGCCCAAAATGCACCAGACTCTCCCCAAGACATCACCCCACCAGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCAGGTGTGCAAGAGGGGATGTGGGCAGAGCCTCAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTATTCAAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTTGAAAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATCCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCCAAGGCAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCACTGGCAGGAACTGCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCTAGAGCCCTTCCTGAGAACCTCATGGGCAAAGATGTGCAGAACAGCTGTTTGTCATAGCCCCAAACTATGGGGCTGGACAAAGCAAACGTCCATCTGAAGGAGAACAGACAAATAAACGATGGCAGGTTCATGAAATGCAAACTAGGACAGCCAGAGGACAACAGTAGAGAGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTATAAGGAAAATCAAGAAAACGATGATCACATAAACACAGTGGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATCGCAAGAAGAGGAAAATGCACACACCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCAATCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCTCACTGTGTGGCAGGGCAGGCAGGCACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCTGTATATCCCCAAGGAAGGTACAGTCAGTGCATTCCAGAGAGAAGCAACTCAGCCACACTCCCTGGCCAGAACCCAAGATGCACACCCATGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCACCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGCTGTAGGGACTCATCCAGGGTTGGGGAATGACTCTGCAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCCCAGAATGATGCCTGTGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACAGTAGGGACAGATGTCAGCCTGAGGTGAAGCCTCAGGACACAGGTGGGCATGGACAGTGTCCACCTAAGCGAGGGACAGACCCGAGTGTCCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGGGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACTATGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCTATTACTACCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGGAGCCTCCCACCACAGCCCTCCCTGCGGGGGACCGCTGCATGCCGTGTTAGGATTTTGATCGAGGACACGGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACGGGGCAGCAGAAACAATGGACAGGCCCACAAGTGACCATGATGGGCTCCAGCCCACCAGCCCCAGAGACCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCAAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAAACCAGATGGAGACAGGGCCGGCCCCATAGCACCATCTGCTGCCGTCCACCCAGCAGTCCCGGAAGCCCCTCCCTGAACGCTGGGCCACGTGTGTGAACCCTGCGAGCCCCCCATGTCAGAGTAGGGGCAGCAGGAGGGCGGGGCTGGCCCTGTGCACTGTCACTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACATTCCCAGGGACAGCCGGAGCTGGGAGTCGCTCATCCTGCCTGGCTGTCCTGAGTCCTGCTCATTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAACGAACCTTCCAGAAATCCCTGTTTCTCTCCCCAGTGAGAGAAACCCTCTTCCAGGGTTTCTCTTCTCTCCCACCCTCTTCCAGGACAGTCCTCAGCAGCATCACAGCGGGAACGCACATCTGGATCAGGACGGCCCCCAGAACACGCGATGGCCCATGGGGACAGCCCAGCCCTTCCCAGACCCCTAAAAGGTATCCCCACCTTGCACCTGCCCCAGGGCTCAAACTCCAGGAGGCCTGACTCCTGCACACCCTCCTGCCAGATATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCAATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGTGTGGGAAAGGCCTCTGGCCACACTCAGGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGAGGCTTTGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAATGCAAGCCTCACAGATGCTGCCACAGTGATGAAACCAGCATCAAAAACCGACCGGACTCGCAGGGTTTATGCACACTTCTCGGCTCGGAGCTCTCCAGGAGCACAAGAGCCAGGCCCGAGGGTTTGTGCCCAGACCCTCGGCCTCTAGGGACACCCGGGCCATCTTAGCCGATGGGCTGATGCCCTGCACACCGTGTGCTGCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGTCCCTTCACTGCCAGCTGCACCAGACCCTGTTCCGAGAGATGCCCCAGTTCCAAAAGCCAATTCCTGGGGCCGGGAATTACTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCACACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCGCAGACAGTTCCCCTCACCTGCCCATGTAGAAACACCTGCCATTGTCGTCCCCACCTGGCAAAGACCACTTGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGACCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACAGTGCATGTCTGGTCCCTGAGCAGCCCCCAGGCTCTCTAGCACTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGCCACACTGTGTACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGACCCCTGCCACGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGCCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGACTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACAGAGCCATGGAGTCACAGAGCCACGGAGCCCCCAGTGTGGGCGTGTGAGGGTGCTGGGCTCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGCCCCGTCCCACAGCCCAGGTCCCCAGGGGCAGCAGGCACAGAAGCTGCCAAGCTGTGCTCTACGATCCTCATCCCTCCAGCAGCATCCACTCCACAGTGGGGAAACTGAGCCTTGGAGAACCACCCAGCCCCCTGGAAACAAGGCGGGGAGCCCAGACAGTGGGCCCAGAGCACTGTGTGTATCCTGGCACTAGGTGCAGGGACCACCCGGAGATCCCCATCACTGAGTGGCCAGCCTGCAGAAGGACCCAACCCCAACCAGGCCGCTTGATTAAGCTCCATCCCCCTGTCCTGGGAACCTCTTCCCAGCGCCACCAACAGCTCGGCTTCCCAGGCCCTCATCCCTCCAAGGAAGGCCAAAGGCTGGGCCTGCCAGGGGCACAGTACCCTCCCTTGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGCAGATAGGACATATTGCTGGGGCATCTTGCTCTGTGACTACTGGGTACTGGCTCTCAACGCAGACCCTACCAAAATCCCCACTGCCTCCCCTGCTAGGGGCTGGCCTGGTCTCCTCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTTCTGTCCCCAGTTCTAGGGCCAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGTCCTTGCCGAGGTTCAGTGCAGGCACCCAGGACAGGAAATGGCCTGAACACAGGGATGACTGTGCCATGCCCTACCTAAGTCCGCCCCTTTCTACTCTGCAACCCCCACTCCCCAGGTCAGCCCATGACGACCAACAACCCAACACCAGAGTCACTGCCTGGCCCTGCCCTGGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGAGTTGGGGGGACAGGACACAGGCTCTCTCCTTATGGTTCCCCCACCTGGCTCCTGCCGGGACCCTTGGGGTGTGGACAGAAAGGACGCCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACTCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGCTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCAGGTGCTCCATCTTGGATGAGCCCATCCCTCTCACCCACCGACCCGCCCACCTCCTCTCCACCCTGGCCACACGTCGTCCACACCATCCTGAGTCCCACCTACACCAGAGCCAGCAGAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGCCAGGGCAGCTTTGGGGAGGGAGGAATGGAGGAAGGGGAGGTCAGTGAAGAGGCCCCCCTCCCCTGGGTCTAGGATCCACCTTTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGATTCTGTGCAGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCAGGGCCTGGGGGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAAGATATGGGGACCCCAATACTGGCACAGACCTCAGCTCCATCCAGGCCCACCAGGACCCACCATGGGTGGAACACCTGTCTCCGGCCCCTGCTGGCTGTGAGGCAGCTGGCCTCTGTCTCGGACCCCCATTCCAGACACCAGACAGAGGGACAGGCCCCCCAGAACCAGTGTTGAGGGACACCCCTGTCCAGGGCAGCCAAGTCCAAGAGGCGCGCTGAGCCCAGCAAGGGAAGGCCCCCAAACAAACCAGGAGGTTTCTGAAGCTGTCTGTGTCACAGTCTGCTGCAACTGCAGCAGCAAATGGTGCCGCGACCATAGCAGGTGCTGCCACAATGACACTGGGCAGGACAGAAACCCCATCCCAAGTCAGCCGAAGGCAGAGAGAGCAGGCAGGACACATTTAGGATCTGAGGCCACACCTGACACTCAAGCCAACAGATGTCTCCCCTCCAGGGCGCCCTGCCCTGTTCAGTGTTCCTGAGAAAACAGGGGCAGCCTGAGGGGATCCAGGGCCAGGAGATGGGTCCCCTCTACCCCGAGGAGGAGCCAGGCGGGAATCCCAGCCCCCTCCCCATTGAGGCCATCCTGCCCAGAGGGGCCCGGACCCACCCCACACACCCAGGCAGAATGTGTGCAGGCCTCAGGCTCTGTGGGTGCCGCTAGCTGGGGCTGCCAGTCCTCACCCCACACCTAAGGTGAGCCACAGCCGCCAGAGCCTCCACAGGAGACCCCACCCAGCAGCCCAGCCCCTACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGGTGGATTTTGTACAGCCCCGAGTCACTGTGGGTATAGTGGGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCAGCTACTACCACAGTGAGAAAAGCTATGTCAAAAACCGTCTCCCGGCCACTGCTGGAGGCCCAGCCAGAGAAGGGACCAGCCGCCCGAACATACGACCTTCCCAGACCTCATGACCCCCAGCACTTGGAGCTCCACAGTGTCCCCATTGGATGGTGAGGATGGGGGCCGGGGCCATCTGCACCTCCCAACATCACCCCCAGGCAGCACAGGCACAAACCCCAAATCCAGAGCCGACACCAGGAACACAGACACCCCAATACCCTGGGGGACCCTGGCCCTGGTGACTTCCCACTGGGATCCACCCCCGTGTCCACCTGGATCAAAGACCCCACCGCTGTCTCTGTCCCTCACTCAGGGCCTGCTGAGGGGCGGGTGCTTTGGAGCAGACTCAGGTTTAGGGGCCACCATTGTGGGGCCCAACCTCGACCAGGACACAGATTTTTCTTTCCTGCCCTGGGGCAACACAGACTTTGGGGTCTGTGCAGGGAGGACCTTCTGGAAAGTCACCAAGCACAGAGCCCTGACTGAGGTGGTCTCAGGAAGACCCCCAGGAGGGGGCTTGTGCCCCTTCCTCTCATGTGGACCCCATGCCCCCCAAGATAGGGGCATCATGCAGGGCAGGTCCTCCATGCAGCCACCACTAGGCAACTCCCTGGCGCCGGTCCCCACTGCGCCTCCATCCCGGCTCTGGGGATGCAGCCACCATGGCCACACCAGGCAGCCCGGGTCCAGCAACCCTGCAGTGCCCAAGCCCTTGGCAGGATTCCCAGAGGCTGGAGCCCACCCCTCCTCATCCCCCCACACCTGCACACACACACCTACCCCCTGCCCAGTCCCCCTCCAGGAGGGTTGGAGCCGCCCATAGGGTGGGGGCTCCAGGTCTCACTCACTCGCTTCCCTTCCTGGGCAAAGGAGCCTCGTGCCCCGGTCCCCCCTGACGGCGCTGGGCACAGGTGTGGGTACTGGGCCCCAGGGCTCCTCCAGCCCCAGCTGCCCTGCTCTCCCTGGGAGGCCTGGGCACCACCAGACCACCAGTCCAGGGCACAGCCCCAGGGAGCCGCCCACTGCCAGCTCACAGGAAGAAGATAAGCTTCAGACCCTCAGGGCCGGGAGCTGCCTTCCTGCCACCCCTTCCTGCCCCAGACCTCCATGCCCTCCCCCAACCACTTACACACAAGCCAGGGAGCTGTTTCCACACAGTTCAACCCCAAACCAGGACGGCCTGGCACTCGGGTCACTGCCATTTCTGTCTGCATTCGCTCCCAGCGCCCCTGTGTTCCCTCCCTCCTCCCTCCTTCCTTTCTTCCTGCATTGGGTTCATGCCGCAGAGTGCCAGGTGCAGGTCAGCCCTGAGCTTGGGGTCACCTCCTCACTGAAGGCAGCCTCAGGGTGCCCAGGGGCAGGCAGGGTGGGGGTGAGGCTTCCAGCTCCAACCGCTTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCCGTCGACCAATTCTCATGTTTGACAGCTTATCATCGAATTTCTACGTA

DNA构建体

通常，将含有一个或多个核苷酸编码序列(其各自编码目的非免疫球蛋白多肽或其一部分(例如，ACKR2多肽的细胞外部分或毒素肽的一部分))的多核苷酸分子插入载体，优选DNA载体内，以便在合适的宿主细胞中复制多核苷酸分子。

由于其大小，一个或多个核苷酸编码序列可直接由可得自商业供应商的cDNA源克隆，或基于可得自GenBank的公开序列在计算机芯片上设计。可替代地，细菌人工染色体(BAC)文库可提供来自目的基因(例如，异源ACKR2基因或毒素编码序列)的异源核苷酸编码序列。BAC文库含有100-150kb的平均插入片段大小，并且能够携带高达300kb的插入片段(Shizuya等人，1992,Proc.Natl.Acad.Sci.,USA 89:8794-8797；Swiatek等人，1993,Genesand Development 7:2071-2084；Kim等人，1996,Genomics 34 213-218；以引用的方式并入本文)。例如，已构建人和小鼠基因组BAC文库，并且这些文库可商购获得(例如，Invitrogen,Carlsbad Calif.)。基因组BAC文库也可充当异源编码序列以及转录控制区域源。

可替代地，可从酵母人染色体(YAC)分离、克隆和/或转移异源核苷酸编码序列。整个异源基因或基因座可以被克隆并包含在一个或几个YAC内。如果使用多个YAC并且它们含有重叠同源性区域，则它们可以在酵母宿主菌株内重组以产生代表整个基因座的单一构建体。YAC臂可以通过改造用哺乳动物选择盒进一步修饰，以帮助通过本领域已知的和/或本文所述的方法将构建体引入胚胎干细胞或胚胎。

如上所述，用于构建免疫球蛋白重链基因座的经改造的D_H区的示例性DNA和氨基酸序列分别在表3和4中提供。其它异源核苷酸编码序列也可在GenBank数据库或本领域已知的其它序列数据库中找到。例如，人ACKR2的mRNA和氨基酸序列可分别在GenBank登录号NM_001296.4和NP_001287.2处找到，并且在此以引用的方式并入。另外，例如，α-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号JX177132.1和AFR68318.1处找到；δ-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号KR013220.1和AKD43185.1处找到；κ-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号DQ311073.1和ABD33865.1处找到；μ-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号AY207469.1和AAO48588.1处找到；和/或ω-芋螺毒素的DNA和氨基酸序列可分别在GenBank登录号M84612.1和AAA81590.1处找到；所有这些在此以引用的方式并入。进一步地，例如，来自狼蛛(智利捕鸟蛛(GrammostolaSpatulata))的毒素的序列可在GenBank登录号1TYK_A和1LUP_A处找到，SGTX-I的序列可在GenBank登录号1LA4_A处找到，虎纹捕鸟蛛毒素-IV(HWTX-IV)的序列可在GenBank登录号P83303.2处找到，原毒素-I(ProTxI)的序列可在GenBank登录号2M9L_A处找到，原毒素-2(ProTxII)的序列可在GenBank登录号P83476.1处找到；所有这些在此以引用的方式并入。

在一些实施例中，含有如本文所述的一个或多个核苷酸编码序列的DNA构建体包含与重组信号序列(RSS，即侧翼为5'RSS和3’RSS)可操作地连接的人ACKR2DNA序列，所述人ACKR2 DNA序列编码人ACKR2多肽的细胞外部分，用于在转基因非人动物中与免疫球蛋白基因区段(例如V_H和J_H)重组。在一些实施例中，含有如本文所述的一个或多个核苷酸编码序列的DNA构建体包含与重组信号序列(RSS，即侧翼为5'RSS和3’RSS)可操作地连接的毒素DNA序列，所述毒素DNA序列编码μ-芋螺毒素和/或狼蛛毒素肽的一部分，用于在转基因非人动物中与免疫球蛋白基因区段(例如V_H和J_H)重组。重组信号序列可与自然界(例如基因组)中发现的重组信号序列相同或基本上相同，或者可通过人为改造(例如优化)。在一些实施例中，RSS在起源中是基因组的，并且包括在自然界中发现的免疫球蛋白重链基因座(例如人或啮齿类动物免疫球蛋白重链基因座)中发现的一个或多个序列。例如，DNA构建体可包括位于核苷酸编码序列的5'-侧翼区和/或3'-侧翼区中的重组信号序列，所述核苷酸编码序列编码目的非免疫球蛋白多肽或其一部分(例如，异源ACKR2多肽的细胞外部分或毒素肽的一部分)，以能够将核苷酸编码序列与V_H和/或J_H基因区段重组的方式可操作地连接至核苷酸编码序列。在一些实施例中，重组信号序列包含与传统D_H基因区段(即，自然界中发现的RSS)天然结合的序列。在一些实施例中，重组信号序列包含与传统D_H基因区段天然不结合的序列。在一些实施例中，重组信号序列包含对于与V_H和J_H基因区段重组而优化的序列。在一些实施例中，与一个或多个核苷酸编码序列(其各自编码目的非免疫球蛋白多肽或其一部分(例如，ACKR2多肽的细胞外部分或毒素肽的一部分))可操作地连接的重组信号序列提供处于与由其获得该序列的动物中的重组水平相似、或更高或更低的水平的重组。如果另外的侧翼序列可用于优化一个或多个核苷酸编码序列的重组，则可使用现有序列作为探针来克隆此类序列。取决于所需结果，可从基因组序列或其它源获得用于使含有非免疫球蛋白多肽(例如，ACKR2或毒素)的核苷酸编码序列的重链可变区的重组和/或表达最大化所需的另外序列。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自通过优化的RSS侧接5'和/或3'。可使用的示例性的优化RSS在图2中提供并且在实例1中描述。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5'侧接，所述优化的RSS具有与图2中出现的5’RSS至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5'侧接，所述优化的RSS具有与图2中出现的5’RSS基本上相同或相同的序列。

在各种实施例中，一个或多个核苷酸编码序列各自由优化的RSS 3’侧接，所述优化的RSS具有与图2中出现的3’RSS至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 3’侧接，所述优化的RSS具有与图2中出现的5’RSS基本上相同或相同的序列。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5’和3’侧接，每个5’和3’RSS具有与图2中出现的5’和3’RSS至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自由优化的RSS 5’和3’侧接，每个5’和3’RSS具有与图2中出现的5’和3’RSS基本上相同或相同的序列。

在各种实施例中，如本文所述的一个或多个核苷酸编码序列各自由选自图2的5’和3’RSS侧接。

DNA构建体可以使用本领域已知的方法制备。例如，DNA构建体可以制备为较大质粒的一部分。这种制备允许以本领域已知的有效方式克隆和选择正确的构建体。含有本文所述的一个或多个核苷酸编码序列的DNA片段可以定位于质粒上的简便限制性位点之间，使得它们可易于从其余的质粒序列分离，以掺入所需的动物。

本领域已知用于制备质粒和转化宿主生物的各种方法。对于用于原核和真核细胞二者的其他合适的表达系统，以及一般重组步骤，参见Molecular Cloning:A LaboratoryManual，第2版，Sambrook,J.等人编，Cold Spring Harbor Laboratory Press:1989。

具有经改造的D_H区的非人动物的生产

本发明提供了非人动物，其表达特征在于重链CDR3多样性的抗体，所述重链CDR3多样性指导与特定抗原的结合，来源于一个或多个核苷酸编码序列的整合，各自编码目的非免疫球蛋白多肽或其一部分(例如非典型趋化因子受体例如ACKR2的细胞外部分、或毒素肽的一部分)的所述一个或多个核苷酸编码序列整合到非人动物的基因组中的免疫球蛋白重链可变区内。本文描述的合适的实例包括啮齿类动物，具体地讲，小鼠。

在一些实施例中，一个或多个异源核苷酸编码序列包含来自异源物种(例如人、蜘蛛、蝎子、蜗牛、狼蛛、海葵等)的遗传材料，其中所述异源核苷酸编码序列各自编码目的非免疫球蛋白多肽或其一部分(例如，ACKR多肽的细胞外部分或毒素肽的一部分)，其包含来自异源物种的遗传材料的编码部分。在一些实施例中，本文所述的异源核苷酸编码序列包含编码目的非免疫球蛋白多肽或其一部分(例如，异源ACKR多肽的细胞外部分或毒素肽的一部分)的异源物种的核苷酸编码序列，目的非免疫球蛋白多肽的所述部分出现在免疫球蛋白重链，特别是重链CDR3中，其由如本文所述的非人动物的B细胞表达。还提供了非人动物、胚胎、用于制备非人动物的细胞和靶向构建体、非人胚胎和含有所述异源核苷酸编码序列的细胞。

在各种实施例中，将一个或多个异源核苷酸编码序列插入非人动物的基因组内的免疫球蛋白重链可变区的D_H区内。在一些实施例中，免疫球蛋白重链可变区的D_H区(或其一部分)不是缺失的(即完整的)。{在一些实施例中，免疫球蛋白重链可变区的D_H区(或其一部分)被改变、破坏、缺失或替换为一个或多个异源核苷酸编码序列(例如，一个或多个异源ACKR2或者一个或多个异源毒素核苷酸编码序列)。在一些实施例中，全部或基本上全部D_H区被替换为一个或多个异源核苷酸编码序列；在一些特定实施例中，一个或多个传统D_H基因区段在免疫球蛋白重链可变区的D_H区中不被缺失或替换。在一些实施例中，如本文所述的D_H区是合成D_H区，所述合成D_H区包含如本文所述的一个或多个异源核苷酸编码序列。在一些实施例中，D_H区是人D_H区。在一些实施例中，D_H区是鼠D_H区。在一些实施例中，将如本文所述的经改造的D_H区(或其一部分)插入免疫球蛋白重链可变区内，使得所述经改造的D_H区(或其一部分)与一个或多个V_H基因区段和/或一个或多个J_H基因区段可操作地连接。在一些实施例中，将一个或多个异源核苷酸编码序列插入免疫球蛋白重链可变区的两个拷贝之一内，产生就一个或多个异源核苷酸编码序列(即，经改造的D_H区)而言是杂合的非人动物。在一些实施例中，提供了对于一个或多个异源核苷酸编码序列(即，经改造的D_H区)是纯合的非人动物。在一些实施例中，提供了对于一个或多个异源核苷酸编码序列(即，经改造的D_H区)是杂合的非人动物。

在一些实施例中，本文所述的非人动物含有人免疫球蛋白重链可变区，其包括在其基因组中含有(例如随机整合)一个或多个异源核苷酸编码序列的_H区。因此，此类非人动物可被描述为具有含有经改造的D_H区的人免疫球蛋白重链转基因。可使用各种方法检测经改造的D_H区，所述方法包括例如PCR、蛋白质印迹、RNA印迹、限制性片段长度多态性(RFLP)、或者等位基因获得或丧失测定。在一些实施例中，本文所述的非人动物就如本文所述的经改造的D_H区而言是杂合的。在一些实施例中，本文所述的非人动物就如本文所述的经改造的D_H区而言是纯合的。在一些实施例中，本文所述的非人动物就如本文所述的经改造的D_H区而言是半合子的。在一些实施例中，本文所述的非人动物含有如本文所述的经改造的D_H区的一个或多个拷贝。

在一些实施例中，本文公开的一个或多个异源ACKR核苷酸编码序列是异源ACKR2核苷酸编码序列。在一些实施例中，一个或多个异源ACKR2核苷酸编码序列是人。

在一些实施例中，本文所述的一个或多个异源毒素核苷酸编码序列是异源μ-芋螺毒素核苷酸编码序列、异源狼蛛毒素核苷酸编码序列和/或其组合。

在各种实施例中，本文所述的一个或多个异源核苷酸编码序列包括一个或多个核苷酸编码序列，其各自具有与表3或表4中出现的一个或多个核苷酸编码序列至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，本文所述的一个或多个异源核苷酸编码序列包括一个或多个核苷酸编码序列，其各自具有与表3或表4中出现的一个或多个核苷酸编码序列基本上相同或相同的序列。

在各种实施例中，本文所述的一个或多个异源核苷酸编码序列选自表3和/或表4。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个异源核苷酸编码序列，其各自具有与表3或表4中出现的一个或多个核苷酸编码序列至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个异源核苷酸编码序列，其各自具有与表3或表4中出现的一个或多个核苷酸编码序列基本上相同或相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含5、10、15、20或25个异源ACKR2核苷酸编码序列，其各自具有与表3中出现的5、10、15、20或25个ACKR2核苷酸编码序列相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含5、10、15、20、25或26个异源毒素核苷酸编码序列，其各自具有与表4中出现的5、10、15、20、25或26个毒素核苷酸编码序列相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个异源核苷酸编码序列，其各自侧翼为5'重组信号序列(5’RSS)和3'重组信号序列(3’RSS)，所述5’RSS和3’RSS各自具有与图2中出现的5’RSS和3’RSS至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个异源核苷酸编码序列，其各自侧翼为5'重组信号序列(5’RSS)和3'重组信号序列(3’RSS)，所述5’RSS和3’RSS各自具有与图2中出现的5’RSS和3’RSS基本上相同或相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个异源核苷酸编码序列，其各自侧翼为5'重组信号序列(5’RSS)和3'重组信号序列(3’RSS)，所述5’RSS和3’RSS选自图2。

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:59 5'侧接且由SEQ ID NO:60 3'侧接的SEQ ID NO:39；

(b)由SEQ ID NO:69 5'侧接且由SEQ ID NO:70 3'侧接的SEQ ID NO:7；

(c)由SEQ ID NO:77 5'侧接且由SEQ ID NO:78 3'侧接的SEQ ID NO:1；

(d)由SEQ ID NO:87 5'侧接且由SEQ ID NO:88 3'侧接的SEQ ID NO:33；

(e)由SEQ ID NO:95 5'侧接且由SEQ ID NO:96 3'侧接的SEQ ID NO:3；和

(f)由SEQ ID NO:103 5'侧接且由SEQ ID NO:104 3'侧接的SEQ ID NO:5。

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:61 5'侧接且由SEQ ID NO:62 3'侧接的SEQ ID NO:41；

(b)由SEQ ID NO:71 5'侧接且由SEQ ID NO:72 3'侧接的SEQ ID NO:15；

(c)由SEQ ID NO:79 5'侧接且由SEQ ID NO:80 3'侧接的SEQ ID NO:37；

(d)由SEQ ID NO:81 5'侧接且由SEQ ID NO:82 3'侧接的SEQ ID NO:13；

(e)由SEQ ID NO:89 5'侧接且由SEQ ID NO:90 3'侧接的SEQ ID NO:29；

(f)由SEQ ID NO:97 5'侧接且由SEQ ID NO:98 3'侧接的SEQ ID NO:11；和

(g)由SEQ ID NO:105 5'侧接且由SEQ ID NO:106 3'侧接的SEQ ID NO:9；

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:63 5'侧接且由SEQ ID NO:64 3'侧接的SEQ ID NO:43；

(b)由SEQ ID NO:73 5'侧接且由SEQ ID NO:74 3'侧接的SEQ ID NO:23；

(c)由SEQ ID NO:83 5'侧接且由SEQ ID NO:84 3'侧接的SEQ ID NO:17；

(d)由SEQ ID NO:91 5'侧接且由SEQ ID NO:92 3'侧接的SEQ ID NO:35；

(e)由SEQ ID NO:99 5'侧接且由SEQ ID NO:100 3'侧接的SEQ ID NO:19；和

(f)由SEQ ID NO:107 5'侧接且由SEQ ID NO:108 3'侧接的SEQ ID NO:21。

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:65 5'侧接且由SEQ ID NO:66 3'侧接的SEQ ID NO:45；

(b)由SEQ ID NO:75 5'侧接且由SEQ ID NO:76 3'侧接的SEQ ID NO:31；

(c)由SEQ ID NO:85 5'侧接且由SEQ ID NO:86 3'侧接的SEQ ID NO:25；

(d)由SEQ ID NO:93 5'侧接且由SEQ ID NO:94 3'侧接的SEQ ID NO:49；

(e)由SEQ ID NO:101 5'侧接且由SEQ ID NO:102 3'侧接的SEQ ID NO:27；和

(f)由SEQ ID NO:67 5'侧接且由SEQ ID NO:68 3'侧接的SEQ ID NO:47。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个DNA片段，其各自具有与选自SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134及其组合的DNA片段至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个DNA片段，其各自具有与选自SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133、SEQ ID NO:134及其组合的DNA片段基本上相同或相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133和SEQ ID NO:134中的任何一个。

在各种实施例中，本文所述的经改造的D_H区包含SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133和SEQ ID NO:134。在一些特定实施例中，本文所述的经改造的D_H区从5'到3'包含SEQ ID NO:131、SEQ ID NO:132、SEQ ID NO:133和SEQ ID NO:134。

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:59 5'侧接且由SEQ ID NO:60 3'侧接的SEQ ID NO:180；

(b)由SEQ ID NO:69 5'侧接且由SEQ ID NO:70 3'侧接的SEQ ID NO:182；

(c)由SEQ ID NO:77 5'侧接且由SEQ ID NO:78 3'侧接的SEQ ID NO:184；

(d)由SEQ ID NO:87 5'侧接且由SEQ ID NO:88 3'侧接的SEQ ID NO:186；

(e)由SEQ ID NO:95 5'侧接且由SEQ ID NO:96 3'侧接的SEQ ID NO:188；和

(f)由SEQ ID NO:103 5'侧接且由SEQ ID NO:104 3'侧接的SEQ ID NO:190。

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:61 5'侧接且由SEQ ID NO:62 3'侧接的SEQ ID NO:192；

(b)由SEQ ID NO:71 5'侧接且由SEQ ID NO:72 3'侧接的SEQ ID NO:194；

(c)由SEQ ID NO:79 5'侧接且由SEQ ID NO:80 3'侧接的SEQ ID NO:196；

(d)由SEQ ID NO:81 5'侧接且由SEQ ID NO:82 3'侧接的SEQ ID NO:198；

(e)由SEQ ID NO:89 5'侧接且由SEQ ID NO:90 3'侧接的SEQ ID NO:200；

(f)由SEQ ID NO:97 5'侧接且由SEQ ID NO:98 3'侧接的SEQ ID NO:202；和

(g)由SEQ ID NO:105 5'侧接且由SEQ ID NO:106 3'侧接的SEQ ID NO:204；

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:63 5'侧接且由SEQ ID NO:64 3'侧接的SEQ ID NO:206；

(b)由SEQ ID NO:73 5'侧接且由SEQ ID NO:74 3'侧接的SEQ ID NO:208；

(c)由SEQ ID NO:83 5'侧接且由SEQ ID NO:84 3'侧接的SEQ ID NO:210；

(d)由SEQ ID NO:91 5'侧接且由SEQ ID NO:92 3'侧接的SEQ ID NO:212；

(e)由SEQ ID NO:99 5'侧接且由SEQ ID NO:100 3'侧接的SEQ ID NO:214；和

(f)由SEQ ID NO:107 5'侧接且由SEQ ID NO:108 3'侧接的SEQ ID NO:216。

在各种实施例中，本文所述的经改造的D_H区包含

(a)由SEQ ID NO:65 5'侧接且由SEQ ID NO:66 3'侧接的SEQ ID NO:218；

(b)由SEQ ID NO:75 5'侧接且由SEQ ID NO:76 3'侧接的SEQ ID NO:220；

(c)由SEQ ID NO:85 5'侧接且由SEQ ID NO:86 3'侧接的SEQ ID NO:222；

(d)由SEQ ID NO:93 5'侧接且由SEQ ID NO:94 3'侧接的SEQ ID NO:224；

(e)由SEQ ID NO:101 5'侧接且由SEQ ID NO:102 3'侧接的SEQ ID NO:226；

(f)由SEQ ID NO:109 5'侧接且由SEQ ID NO:110 3'侧接的SEQ ID NO:228；和

(g)由SEQ ID NO:67 5'侧接且由SEQ ID NO:68 3'侧接的SEQ ID NO:230。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个DNA片段，其各自具有与选自SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235及其组合的DNA片段至少50％(例如50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含一个或多个DNA片段，其各自具有与选自SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234、SEQ ID NO:235及其组合的DNA片段基本上相同或相同的序列。

在各种实施例中，本文所述的经改造的D_H区包含SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234和SEQ ID NO:235中的任何一个。

在各种实施例中，本文所述的经改造的D_H区包含SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234和SEQ ID NO:235。在一些特定实施例中，本文所述的经改造的D_H区从5'到3'包含SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:234和SEQ ID NO:235。

在各种实施例中，由本文所述的非人动物产生的抗体包含重链可变区，所述重链可变区包括具有氨基酸序列的CDR3，所述氨基酸序列是或包含与表3或表4中出现的氨基酸序列至少50％(例如，50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多)相同的氨基酸序列。

在各种实施例中，由本文所述的非人动物产生的抗体包含重链可变区，所述重链可变区包括具有氨基酸序列的CDR3，所述氨基酸序列是或包含与表3或表4中出现的氨基酸序列基本上相同或相同的氨基酸序列。

在各种实施例中，由本文所述的非人动物产生的抗体包含重链可变区，所述重链可变区包括具有氨基酸序列的CDR3，所述氨基酸序列是氨基酸序列的变体(即，其体细胞突变的变体)，所述氨基酸序列是或包含表3或表4中出现的氨基酸序列。

本发明提供了用于制备其基因组包含免疫球蛋白重链可变区的非人动物的组合物和方法，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸编码序列，其各自编码目的多肽的一部分，包括目的多肽的特定多态性形式的核苷酸编码序列、目的多肽的等位基因变体(例如单个氨基酸差异)或目的多肽的可变剪接同种型，包括用于制备表达包含重链可变区的抗体的非人动物的组合物和方法，所述重链可变区包括CDR3，所述CDR3具有由来自免疫球蛋白重链基因座的此类核苷酸编码序列编码的氨基酸序列，所述免疫球蛋白重链基因座含有与一个或多个非人重链恒定区基因可操作地连接的人V_H和J_H基因区段。在一些实施例中，还提供了用于制备处于内源增强子和/或内源调控序列的控制下，表达此类抗体的非人动物的组合物和方法。在一些实施例中，还提供了用于制备处于异源增强子和/或异源调节序列的控制下，表达此类抗体的非人动物的组合物和方法。方法包括将一个或多个核苷酸编码序列(其各自编码目的多肽的一部分)或一个或多个DNA片段(其各自含有多个核苷酸编码序列，所述多个核苷酸编码序列各自编码目的多肽的一部分)插入非人动物的基因组中，使得包括目的多肽的所述部分的抗体被表达。

在一些实施例中，方法包括插入约10,050bp的DNA(其包括对应于异源ACKR2多肽的细胞外部分的六个核苷酸编码序列)、约9,768bp的DNA(其包括对应于异源ACKR2的细胞外部分的七个核苷酸编码序列)、约9,788bp的DNA(其包括对应于异源ACKR2多肽的细胞外部分的六个核苷酸编码序列)、和/或约11,906bp的DNA(其包括对应于异源ACKR2多肽的细胞外部分的六个核苷酸编码序列)。总之，这种DNA包括对应于异源ACKR2多肽的细胞外部分的25个编码序列。在一些实施例中，方法包括插入还包含重组信号序列的DNA，所述重组信号序列侧接对应于异源ACKR2多肽的细胞外部分的每个核苷酸编码序列。包括对应于异源ACKR2多肽的细胞外部分的核苷酸编码序列和上述侧翼重组信号序列的遗传材料可插入非人动物的基因组内，从而产生具有经改造的DH区的非人动物，所述经改造的D_H区含有对应于异源ACKR2多肽的细胞外部分的核苷酸编码序列和必要的重组信号序列，以允许与相邻的V_H和J_H基因区段的重组。

在一些实施例中，方法包括插入约9,812bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的六个核苷酸编码序列)、约9,512bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的七个核苷酸编码序列、约9,691bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的六个核苷酸编码序列)、和/或约11,896bp的DNA(其包括对应于一种或多种毒素(例如μ-芋螺毒素和/或狼蛛毒素)的一部分的七个核苷酸编码序列)。总之，这种DNA包括对应于一种或多种毒素肽的一部分的26个编码序列。在一些实施例中，方法包括插入还包含重组信号序列的DNA，所述重组信号序列侧接对应于一种或多种毒素肽的一部分的每个核苷酸编码序列。包括对应于一种或多种毒素肽的一部分的核苷酸编码序列和上述侧翼重组信号序列的遗传材料可插入非人动物的基因组内，从而产生具有经改造的D_H区的非人动物，所述经改造的DH区含有对应于一种或多种毒素肽的一部分的核苷酸编码序列和必要的重组信号序列，以允许与相邻的V_H和J_H基因区段的重组。

适当时，对应于目的异源多肽的一部分的核苷酸编码序列可被修饰，以包括对于在非人动物中的表达进行优化的密码子(例如参见美国专利号5,670,356和5,874,304)。密码子优化的序列是合成序列，并且优选编码由非密码子优化的亲本多核苷酸编码的相同多肽(或具有与全长多肽基本上相同的活性的全长多肽的生物活性片段)。在一些实施例中，对应于目的异源多肽的一部分的核苷酸编码序列可包括改变的序列，以优化对于特定细胞类型(例如啮齿类动物细胞)的密码子使用。例如，对应于待插入非人动物(例如啮齿类动物)的基因组内的目的异源多肽的异部分的核苷酸编码序列的密码子可被优化用于在非人动物的细胞中表达。此序列可描述为密码子优化序列。

将对应于目的异源多肽的一部分的核苷酸编码序列插入D_H区内使得所述核苷酸编码序列可操作地连接至V_H和J_H基因区段(例如，多个V_H和J_H基因区段)，采用基因组的相对最低限度的修饰，并且导致包含特征在于CDR3的重链的抗体在非人动物中的表达，所述CDR3具有对应于目的异源多肽的一部分的氨基酸序列。

用于产生转基因非人动物的方法，包括敲除和敲入，是本领域熟知的(参见例如Gene Targeting:A Practical Approach,Joyner编,Oxford University Press,Inc.(2000))。例如，转基因啮齿类动物的生成可任选地涉及破坏一种或多种内源性啮齿类动物基因(或基因区段)的基因座，并且将一种或多种异源基因(或基因区段或核苷酸编码序列)引入啮齿类动物基因组内，在一些实施例中，在与内源性啮齿类动物基因(或基因区段)相同的位置处。在一些实施例中，将对应于目的异源多肽的一部分的核苷酸编码序列引入啮齿类动物的基因组中随机插入的免疫球蛋白重链基因座的D_H区内。在一些实施例中，将对应于目的异源多肽的一部分的核苷酸编码序列引入啮齿类动物的基因组中的内源性免疫球蛋白重链基因座的D_H区内；在一些实施例中，内源性免疫球蛋白重链基因座被改变、修饰或改造，以含有与一个或多个恒定区基因(例如人或鼠)可操作地连接的人基因区段(例如V和/或J)。

图3A和3B中提供了用于构建靶向载体的示例性策略的示意图(不按照比例)，所述靶向载体用于整合到啮齿类动物胚胎干(ES)细胞内，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述免疫球蛋白重链可变区包括经改造的多样性簇(即D_H区)，所述多样性簇包括各自编码异源ACKR2多肽的一部分(例如D6趋化因子诱饵受体的细胞外部分)的一个或多个核苷酸编码序列，或图7A和7B中提供了各自编码毒素肽的一部分(例如，μ-芋螺毒素和/或狼蛛毒素肽的一部分)。如所示的，各自含有各种数目的核苷酸编码序列的DNA片段使用等温装配连同侧翼为位点特异性重组识别位点(例如loxP)的选择盒(例如新霉素)装配在一起，所述核苷酸编码序列各自编码异源ACKR2多肽的细胞外部分(图3A-3B)，或各自编码毒素肽的一部分(图7A-7B)。图4A和4B(对于ACKR2核苷酸编码序列)以及8A和8B(对于毒素核苷酸编码序列)中分别示出了采用DNA片段的序贯连接的替代策略。DNA片段包括重组信号序列，其侧接(5'和3')每个核苷酸编码序列，以允许一旦整合到免疫球蛋白重链基因座内，就与V_H和J_H基因区段重组。重组信号序列可从基因组源获得，或者可替代地，它们可如本文所述进行优化，以提供核苷酸编码序列与可操作地连接的V_H和J_H基因区段的有效重组。核苷酸编码序列本身可被优化，使得在抗体序列的亲和力成熟过程中的体细胞超突变发生的水平为、接近或高于在野生型非人动物(其包含包括传统D_H基因区段的免疫球蛋白重链基因座)或非人动物(其对于包括传统人D_H基因区段的人免疫球蛋白重(和/或轻链)基因座是转基因的)中观察到的体细胞超突变的水平。一旦装配，就将装配的DNA片段(即，经改造的D_H区)连接到BAC载体内，所述BAC载体含有基因组重链可变区DNA(例如人)，以产生用于整合到免疫球蛋白重链基因座内的靶向载体。执行连接使得经改造的D_H区由V_H基因组DNA 5'侧接，且由J_H基因组DNA和非人(例如啮齿类动物)基因组重链恒定区DNA(例如内含子增强子和IgM恒定区基因)3'侧接。用于掺入非人细胞(例如啮齿类动物胚胎干细胞)的基因组内的最终靶向载体含有V_H基因组DNA(例如，含有一个或多个V_H基因区段)、经改造的D_H区、3'J_H基因组DNA和非人(例如啮齿类动物)基因组重链恒定区DNA，所有这些都可操作地连接，以允许一旦整合到非人动物的基因组内，V_H基因区段、经改造的D_H区内的核苷酸编码序列和J_H基因区段之间的重组。

将靶向载体引入啮齿类动物(例如小鼠)胚胎干细胞内，使得靶向载体中所含的序列(即，经改造的D_H区)导致非人细胞或非人动物(例如小鼠)表达含有CDR3的抗体的能力，所述CDR3具有由插入的核苷酸编码序列编码的氨基酸。

如本文所述，当经改造的D_H区已引入啮齿类动物基因组的内源性免疫球蛋白重链基因座(例如，经改造以含有人可变区基因区段的内源性免疫球蛋白重链基因座)内时，生成转基因啮齿类动物。免疫球蛋白在鼠细胞上表达，所述免疫球蛋白具有含有氨基酸的CDR3，所述氨基酸由来自经改造的D_H区的核苷酸编码序列编码。免疫球蛋白还包含鼠恒定区，并且因此为啮齿类动物的免疫系统中的各种免疫细胞提供必要的效应子功能。当啮齿类动物基因组的内源性免疫球蛋白重链基因座不被靶向载体靶向时，优选将经改造的D_H区插入免疫球蛋白重链基因座内的除内源性鼠免疫球蛋白重链基因座外的位置处(例如，随机插入)。在这种情况下，内源性鼠免疫球蛋白重链基因座可被缺失或以其它方式致使无功能(例如通过靶向缺失、插入、倒转等)，使得由非人动物产生的抗体利用来自含有插入的经改造的D_H区的免疫球蛋白重链基因座的基因区段和序列。

在一些实施例中，本文所述的非人动物的基因组还包含一种或多种人免疫球蛋白重链和/或轻链基因(参见例如美国专利号8,502,018；美国专利号8,642,835；美国专利号8,697,940；美国专利号：8,791,323；以及美国专利申请公开号2013/0096287 A1；以引用的方式并入本文)。可替代地，可将经改造的D_H区引入不同修饰的品系，例如

品系(参见例如美国专利号8,502,018或美国专利号8,642,835；以引用的方式并入本文)的胚胎干细胞内。在一些实施例中，可将经改造的D_H区引入修饰品系的胚胎干细胞内，如美国专利号8,697,940和8,642,835中所述；以引用的方式并入本文。

在一些实施例中，本文所述的非人动物的基因组还包含(例如，经由交叉育种或多重靶向策略)一种或多种人免疫球蛋白轻链基因或基因座(例如转基因的、内源的等)，如美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492A1、2013-0185821 A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202中所述；所有这些在此以引用的方式并入。

已描述了单个重排轻链，例如包含重排轻链可变区的轻链的遗传改造。例如，在这些小鼠中生成包含单个重排的可变基因序列V_L:J_L的通用轻链小鼠(ULC)和生成抗原特异性抗体在例如美国专利申请号13/022,759、13/093,156、13/412,936、13/488,628、13/798,310和13/948,818(分别为公开号2011/0195454、2012/0021409、2012/0192300、2013/0045492、US20130185821和US20130302836)中描述，所述专利各自以引用的方式并入本文。美国申请公开号2011/0195454、2012/0021409、2012/0192300和2013/0045492中描述的经改造的共同轻链小鼠包含的核酸序列编码轻链选项的有限储库，例如共同或通用轻链“ULC”，其包含不超过两个VL基因区段或单个重排的人免疫球蛋白轻链可变区序列。为了实现这种有限储库，将小鼠改造成使其制备或重排天然小鼠轻链可变结构域的能力无功能或基本上无功能。在一个方面，这例如通过缺失小鼠的轻链可变区基因区段来实现。如先前所述，内源性小鼠基因座然后可通过选择的外源性合适的轻链可变区基因区段(优选人轻链可变区基因区段)修饰，任选可操作地连接至内源性小鼠轻链恒定区，其方式使得外源性可变区基因区段可与内源性小鼠轻链恒定区基因组合，并形成重排的反向嵌合轻链基因(人可变，小鼠恒定)。在各种实施例中，轻链可变区能够体细胞突变。在各种实施例中，为了使轻链可变区获得体细胞突变的能力最大化，适当的增强子保留在小鼠中。在一个方面，在用人κ轻链基因区段修饰小鼠κ轻链基因座以替换内源性小鼠κ轻链基因区段中，小鼠κ内含子增强子和小鼠κ3'增强子在功能上得到维持或未被破坏。

因此，本发明提供了经遗传改造的小鼠，其表达与包含由如本文所述的经遗传改造的D_H区(或其一部分)编码的氨基酸的反向嵌合(人可变，小鼠恒定)重链多样性相关的反向嵌合(人可变，小鼠恒定)轻链的有限储库。在各种实施例中，缺失内源性小鼠κ轻链基因区段，并且替换为与内源性小鼠Cκ基因可操作地连接的单个(或两个)重排的人轻链区。在用于使重排的人轻链区的体细胞超突变最大化的实施例中，维持小鼠κ内含子增强子和小鼠κ3'增强子。在各种实施例中，小鼠还包含无功能的κ轻链基因座或其缺失、或致使基因座不能制备κ轻链的缺失。

因此，在一个实施例中，本文提供了非人动物(例如啮齿类动物，例如小鼠或大鼠)，其在其基因组中例如在其种系中包含来自优选人轻链可变基因区段的有限储库的优选人轻链可变区、或单个重排的人轻链可变区的有限储库，其中所述非人动物在其基因组中例如在其种系中还包含免疫球蛋白重链可变区，其包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分。

本发明提供了经遗传改造的动物，其从人轻链可变区基因序列的有限储库表达人轻链可变结构域或单个人轻链可变结构域的有限储库。在一个实施例中，单个重排的V/J人轻链序列选自Vκ1-39Jκ和Vκ3-20Jκ，例如Vκ1-39Jκ5和Vκ3-20Jκ1。在一些实施例中，如本文公开的非人动物包含经修饰的轻链基因座，所述经修饰的轻链基因座包含所有内源性功能V_L和所有内源性功能J_L基因区段由单个重排的V/J轻链序列的替换，其中所述单个重排的V/J轻链序列可操作地连接至内源性轻链恒定区基因。在一些实施例中，经修饰的轻链基因座位于非人动物的种系基因组中。在一个实施例中，非人动物在其种系基因组中包含与轻链恒定区基因序列可操作地连接的单个重排的轻链可变区基因序列，其中所述单个重排的轻链可变区基因序列包含人种系V_L和人种系J_L基因区段，例如人种系Vκ1-39和人种系Jκ5或人种系Vκ3-20和Jκ1。在一些实施例中，如本文公开的非人动物包含B细胞，例如仍未经历类别转换的B细胞，其在其基因组中包含与内源性轻链恒定区可操作地连接的单个重排的V/J轻链序列，其中与非人动物的种系基因组中发现的可操作地连接至内源性轻链恒定区基因的单个重排的V/J轻链序列相比，单个重排的V/J轻链不包含体细胞突变。在其它实施例中，如本文公开的非人动物包含B细胞，例如已经历类别转换的B细胞，其在其基因组中包含与内源性轻链恒定区可操作地连接的单个重排的V/J轻链序列，其中与非人动物的种系基因组中发现的可操作地连接至内源性轻链恒定区基因的单个重排的V/J轻链序列相比，单个重排的V/J轻链包含体细胞突变。

因此，本发明提供了经遗传修饰的非人动物，连同用于制备该动物的方法和组合物，其中所述遗传修饰包含经改造的D_H区和单个重排的轻链基因座，并且其中所述动物还表达经遗传改造的单个重排轻链，例如经改造的共同轻链(ULC)，其可与非人动物的组织或细胞中含有由经改造的D_H区编码的氨基酸的重链结合。

基于在其基因组中经改造的D_H区的存在和/或非人动物的组织或细胞中含有由核苷酸编码序列编码的氨基酸的抗体的表达，可鉴定转基因建立者非人动物。转基因建立者非人动物然后可用于育种携带经改造的D_H区的另外非人动物，从而产生各自携带经改造的D_H区的一个或多个拷贝的一系列非人动物。此外，根据需要，携带经改造的D_H区的转基因非人动物还可与携带其它转基因(例如人免疫球蛋白基因)的其它转基因非人动物育种。

还可产生转基因非人动物，以含有允许转基因的调控或定向表达的选择系统。示例性系统包括细菌噬菌体P1的Cre/loxP重组酶系统(参见例如Lakso,M.等人，1992,Proc.Natl.Acad.Sci.USA 89:6232-6236)、以及酿酒酵母的FLP/Frt重组酶系统(O’Gorman,S.等人，1991,Science 251:1351-1355)。可通过构建“双重”转基因动物来提供此类动物，例如通过使两种转基因动物交配，一种含有包含选择修饰(例如经改造的D_H区)的转基因，并且另一种含有编码重组酶(例如Cre重组酶)的转基因。

本文所述的非人动物可如上所述或使用本领域已知的方法制备，以包含另外的人或人源化基因，经常取决于非人动物的预期用途。此类另外的人或人源化基因的遗传物质可通过进一步改变具有上述遗传修饰的细胞(例如，胚胎干细胞)的基因组，或通过本领域已知的繁育技术利用所需的其他基因修饰品系引入。在一些实施例中，制备本文所述的非人动物以进一步包含转基因人免疫球蛋白重链和轻链基因(参见例如Murphy,A.J.等人，(2014)Proc.Natl.Acad.Sci.U.S.A.111(14):5153-5158；美国专利号8,502,018；美国专利号8,642,835；美国专利号8,697,940；美国专利号：8,791,323；和美国专利申请公开号2013/0096287 A1；以引用的方式并入本文)。在一些实施例中，制备本文所述的非人动物，以进一步包含一个或多个人免疫球蛋白轻链基因或基因座(例如，转基因的、内源的等)，如美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0185821 A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1；国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202中所述；所有这些专利在此以引用的方式并入。

在一些实施例中，本文所述的非人动物可通过将如本文所述的靶向载体引入来自经修饰的品系的细胞内来制备。仅举一个例子，如上所述的靶向载体可引入VELOCI

小鼠内。

小鼠表达具有完全人可变区和小鼠恒定区的抗体。在一些实施例中，制备本文所述的非人动物，以进一步包含人免疫球蛋白基因(可变区和/或恒定区基因)。在一些实施例中，本文所述的非人动物包含如本文所述的经改造的D_H区和来自异源物种(例如人)的遗传材料，其中所述遗传材料全部或部分编码一个或多个人重链和/或轻链可变区。

例如，如本文所述，包含经改造的D_H区的非人动物还可包含(例如，经由交叉育种或多重基因靶向策略)一种或多种修饰，如Murphy,A.J.等人，(2014)Proc.Natl.Acad.Sci.U.S.A.111(14):5153-5158；美国专利号8,502,018；美国专利号8,642,835；美国专利号8,697,940；美国专利号：8,791,323；美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0096287 A1、2013-0185821A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1；国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179或WO 2014/160202中所述，所有这些申请以引用的方式全文并入本文。在一些实施例中，将包含如本文所述的经改造的D_H区的啮齿类动物与包含人源化的免疫球蛋白重链和/或轻链可变区基因座的啮齿类动物杂交(参见例如美国专利号8,502,018或美国专利号8,642,835；以引用的方式并入本文)。在一些实施例中，将如本文所述的包含经改造的D_H区的啮齿类动物与包含人源化的免疫球蛋白轻链基因或基因座的啮齿类动物杂交，如美国专利申请公开号2011-0195454 A1、2012-0021409 A1、2012-0192300 A1、2013-0045492 A1、2013-0185821 A1、2013-0198880 A1、2013-0302836 A1、2015-0059009 A1；国际专利申请公开号WO 2011/097603、WO 2012/148873、WO 2013/134263、WO 2013/184761、WO 2014/160179、WO 2014/160202中所述；所有这些专利在此以引用的方式并入。

尽管本文广泛讨论了在小鼠中使用经改造的D_H区的实施例(即，具有与人V_H和J_H基因区段可操作地连接的经改造的D_H区的小鼠，所有这些与一个或多个鼠重链恒定区基因可操作地连接)，但还提供了包含经改造的D_H区的其它非人动物。在一些实施例中，此类非人动物包含与内源性V_H和J_H基因区段可操作地连接的经改造的D_H区。在一些实施例中，此类非人动物包含与人源化的V_H和J_H基因区段可操作地连接的经改造的D_H区。此类非人动物包括可被遗传修饰以表达具有CDR3的抗体的那些中的任一种，所述CDR3包括由对应于如本文公开的目的多肽的一部分的核苷酸编码序列编码的氨基酸，所述非人动物包括例如哺乳动物，例如小鼠、大鼠、兔、猪、牛族动物(例如奶牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、狗、雪貂、灵长类动物(例如、绒猴、恒河猴)等。例如，对于那些适当的可经遗传修饰的ES细胞不容易获得的非人动物，采用其他方法来制备包含遗传修饰的非人动物。此类方法包括例如修饰非ES细胞基因组(例如成纤维细胞或诱导的多能细胞)并利用体细胞核转移(SCNT)来将遗传修饰的基因组转移至合适的细胞，例如去核卵母细胞，以及在适于形成胚胎的条件下在非人动物中孕育所述修饰的细胞(例如修饰的卵母细胞)。

用于修饰非人动物基因组(例如，猪、奶牛、啮齿类动物、鸡等)的方法包括例如采用锌指核酸酶(ZFN)、转录激活物样效应物核酸酶(TALEN)或Cas蛋白(即CRISPR/Cas系统)修饰基因组，以包括如本文所述的经改造的D_H区。用于修饰非人动物的种系基因组的方法的指导可在例如美国专利申请公开号2015-0376628 A1、US 2016-0145646 A1和US 2016-0177339 A1中找到；所述专利以引用的方式并入本文。

在一些实施例中，本文所述的非人动物是哺乳动物。在一些实施例中，本文所述的非人动物是小型哺乳动物，例如跳鼠总科(Dipodoidea)或鼠总科(Muroidea)的小型哺乳动物。在一些实施例中，本文所述的经遗传修饰的动物是啮齿类动物。在一些实施例中，本文所述的啮齿类动物选自小鼠、大鼠和仓鼠。在一些实施例中，本文所述的啮齿类动物选自鼠总科。在一些实施例中，本文所述的经遗传修饰的动物来自选自以下的科：丽仓鼠科(Calomyscidae)(例如，鼠样仓鼠)、仓鼠科(Cricetidae)(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(Muridae)(真小鼠和大鼠、沙鼠、棘鼠、冠鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、具尾大鼠、马达加斯加大鼠和小鼠)、刺睡鼠科(Platacanthomyidae)(例如多刺睡鼠)和鼹形鼠科(Spalacidae)(例如鼹鼠、竹鼠和鼢鼠)。在一些特定实施例中，本文所述的经遗传修饰的啮齿类动物选自真小鼠或大鼠(鼠科)、沙鼠、棘鼠和冠鼠。在一些特定实施例中，本文所述的经遗传修饰的小鼠来自鼠科成员。在一些实施例中，本文所述的非人动物是啮齿类动物。在一些特定实施例中，本文所述的啮齿类动物选自小鼠和大鼠。在一些实施例中，本文所述的非人动物是小鼠。

在一些实施例中，本文所述的非人动物是啮齿类动物，其为选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL品系的小鼠。在一些特定实施例中，本文所述的小鼠是选自其为129P1、129P2、129P3、129X1、129S1(例如129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129/Sv Jae、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2(参见例如Festing等人，1999,Mammalian Genome 10:836；Auerbach,W.等人，2000,Biotechniques 29(5):1024-1028,1030,1032)品系的129品系。在一些特定实施例中，本文所述的经遗传修饰的小鼠是前述129品系和前述C57BL/6品系的混合物。在一些特定实施例中，本文所述的小鼠是前述129品系的混合物、或前述BL/6品系的混合物。在某些实施例中，如本文所述的混合物的129品系为129S6(129/SvEvTac)品系。在一些实施例中，本文所述的小鼠是BALB品系，例如BALB/c品系。在一些实施例中，本文所述的小鼠是BALB品系和另一种前述品系的混合物。

在一些实施例中，本文所述的非人动物是大鼠。在一些特定实施例中，本文所述的大鼠选自Wistar大鼠、LEA品系、Sprague Dawley品系、Fischer品系、F344、F6和DarkAgouti。在某些实施例中，本文所述的大鼠品系为选自Wistar、LEA、Sprague Dawley、Fischer、F344、F6和Dark Agouti的两个或更多个品系的混合物。

采用具有经改造的多样性簇的非人动物的方法

已开发了用于生产基于抗体的治疗剂的几种体外和体内技术。特别地，体内技术的特征在于产生含有人免疫球蛋白基因的转基因动物(即啮齿类动物)，所述人免疫球蛋白基因随机掺入动物的基因组内(例如参见美国专利号5,569,825)或精确地置于内源性免疫球蛋白基因座处，与动物的内源性免疫球蛋白恒定区可操作地连接(例如参见美国专利号8,502,018；8,642,835；8,697,940；和8,791,323)。这两种方法在生产用于人中使用的有希望的抗体治疗候选物方面均具有成效。进一步地，这两种方法均具有超过体外方法的优点，因为抗体候选物选自体内生成的抗体储库，其包括在宿主的免疫系统的内部环境内对于抗原的亲和力和特异性选择。以这种方式，抗体结合天然存在的抗原(在相关生物表位和表面内)，而不是可伴随体外技术的人工环境或计算机芯片预测。尽管从体内技术产生的强大的抗体储库，但针对复合物(例如跨膜多肽)或细胞质抗原的抗体仍是困难的。进一步地，由于免疫耐受性，生成针对在物种(例如，人和小鼠)之间共享高度序列同一性的多肽的抗体仍是挑战。

因此，本文尤其描述了以下认识：使用各自编码目的多肽的一部分的一个或多个核苷酸编码序列(即，合成序列)可制备体内系统的构建，所述体内系统的特征在于产生在CDR中具有增加的多样性的抗体，特别是由非传统序列生成的CDR3(即不是传统D_H基因区段或自然界中出现的D_H基因区段)。这种增加的多样性可指导与特定抗原(例如跨膜多肽)的结合。例如，如本文所述，可通过改造为含有免疫球蛋白重链基因座的非人动物生成阻断一种或多种炎性细胞因子(例如β-趋化因子)的抗体，所述免疫球蛋白重链基因座含有经改造的D_H区，所述经改造的D_H区包括一个或多个核苷酸编码序列，其各自编码细胞因子受体(例如β-趋化因子受体)的细胞外部分。本文还描述了可通过改造为含有免疫球蛋白重链基因座的非人动物生成阻断或抑制离子通道(例如，Na_V通道)的活性和/或功能的抗体，所述免疫球蛋白重链基因座含有经改造的D_H区，所述经改造的D_H区包括一个或多个核苷酸编码序列，其各自编码毒素(例如，μ-芋螺毒素和/或狼蛛毒素)的一部分。在V_H基因区段、核苷酸编码序列和J_H基因区段重组后，形成重链可变编码序列，其含有具有部分由核苷酸编码序列编码的序列的CDR3区，并且由此指导与核苷酸编码序列相关的特定抗原的结合。

本文所述的非人动物可用于制备人抗体，所述人抗体包含源自通过如本文所述的非人动物细胞的遗传材料编码的一个或多个可变区核酸序列的可变结构域。例如，本文所述的非人动物用β-趋化因子(或Na_V通道多肽，全部或部分)在一定条件下免疫一段时间，所述时间足以使非人动物发展针对所述β-趋化因子(或Na_V通道多肽，全部或部分)的免疫应答。从非人动物(或者一个或多个细胞，例如一个或多个B细胞)中分离抗体，并且使用各种测定进行表征，所述测定测量例如亲和力、特异性、表位作图、阻断配体-受体相互作用的能力、抑制性受体活化等。在各种实施例中，由本文所述的非人动物产生的抗体包含一个或多个人可变结构域，其源自从非人动物中分离的一个或多个人可变区核苷酸序列。在一些实施例中，抗药物抗体(例如抗独特型抗体)可在本文所述的非人动物中产生。

本文所述的非人动物提供了用于产生可用于各种测定的人抗体的改进的体内系统和生物材料(例如细胞)源。在各种实施例中，本文所述的非人动物用于开发靶向一种或多种细胞因子和/或调节细胞因子活性和/或调节与其它结合配偶体(例如细胞因子受体)的细胞因子相互作用的治疗剂。在各种实施例中，本文所述的非人动物用于开发靶向一种或多种离子通道和/或调节离子通道活性和/或调节与其它结合配偶体的离子通道相互作用的治疗剂。在各种实施例中，本文所述的非人动物用于鉴定、筛选和/或开发候选治疗剂(例如抗体、siRNA等)，所述候选治疗剂结合一种或多种人细胞因子多肽或离子通道(例如钾通道、钙通道或钠通道)。在各种实施例中，本文所述的非人动物用于筛选和开发候选治疗剂(例如抗体、siRNA等)，所述候选治疗剂阻断一种或多种人β-趋化因子多肽的活性或者阻断一种或多种人电压门控钠(Na_V)通道的活性。在各种实施例中，本文所述的非人动物用于确定一种或多种人β-趋化因子多肽或者一种或多种人Na_V通道的拮抗剂和/或激动剂的结合概况。在一些实施例中，本文所述的非人动物用于确定一种或多种候选治疗性抗体的一个或多个表位，所述一种或多种候选治疗性抗体结合一种或多种人β-趋化因子多肽或者结合一种或多种人Na_V通道。

在各种实施例中，本文所述的非人动物用于确定抗β-趋化因子或抗Na_V抗体的药代动力学概况。在各种实施例中，本文所述的一种或多种非人动物和一种或多种对照或参考非人动物各自暴露于以各种剂量(例如0.1mg/kg、0.2mg/kg、0.3mg/kg、0.4mg/kg、0.5mg/kg、1mg/kg、2mg/kg、3mg/kg、4mg/kg、5mg/mg、7.5mg/kg、10mg/kg、15mg/kg、20mg/kg、25mg/kg、30mg/kg、40mg/kg、或50mg/kg或更多)的一种或多种候选治疗性抗β-趋化因子或抗Na_V抗体。候选治疗性抗体可经由各种所需的施用途径(包括肠胃外和非肠胃外施用途径)来给药。肠胃外途径包括例如静脉内、动脉内、门静脉内、肌内、皮下、腹膜内、脊柱内、鞘内、脑室内、颅内、胸膜内或其他注射途径。非肠胃外途径包括例如经服、经鼻、经皮、经肺、经直肠、经颊面、经阴道、经眼。施用还可通过连续输注、局部施用、从植入物(凝胶、膜等)持续释放和/或静脉内注射来进行。在多个时间点(例如0hr、6hr、1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天或最多30或更多天)从非人动物(人源化和对照组)分离血液。可使用得自如文中所述的非人动物的样品进行各种测定以确定施用的候选治疗性抗体的药代动力学性质，包括但不限于总IgG、抗-治疗性抗体应答、凝集等。

在各种实施例中，本文所述的非人动物用于测量阻断或调节β-趋化因子活性(或β-趋化因子信号转导、或β-趋化因子介导的相互作用)的疗效，以及对基因表达的作用，由于如本文所述的非人动物的细胞变化或细胞的β-趋化因子受体密度。在各种实施例中，本文所述的非人动物或由其分离的细胞暴露于结合人β-趋化因子多肽(或人β-趋化因子多肽的一部分)的候选治疗剂，并且在随后的一段时间后，分析对β-趋化因子依赖性过程(或相互作用)，例如配体-受体相互作用或β-趋化因子信号传导的作用。

在各种实施例中，本文所述的非人动物用于测量阻断或调节Na_V通道活性(或Na_V通道信号传导、或Na_V介导的相互作用或Na_V通道动作电位)的疗效，以及对基因表达的作用，由于如本文所述的非人动物的细胞变化或细胞的Na_V通道密度。在各种实施例中，本文所述的非人动物或由其分离的细胞暴露于结合人Na_V通道(或人Na_V通道的一部分)的候选治疗剂，并且在随后的一段时间后，分析对Na_V通道依赖性过程(或相互作用)，例如配体-受体相互作用或Na_V通道动作电位的作用。

在各种实施例中，本文所述的非人动物可用于制备作用于电压门控钠通道(例如Na_V1.7)的人抗体。此类人抗体可在非人动物中进行测试和/或开发，所述非人动物具有不同于本文所述那种的修饰，例如如美国专利号8,871,996和8,486,647中描述的修饰，所述专利以引用的方式并入本文。

本文所述的非人动物表达结合一种或多种β-趋化因子(或Na_V通道)的抗体，因此可生成细胞、细胞系和细胞培养物，以充当用于结合和功能测定中的抗β-趋化因子(或抗Na_V)抗体源，例如以测定人β-趋化因子(或Na_V通道)拮抗剂或激动剂的结合或功能，特别是当拮抗剂或激动剂对于人β-趋化因子序列(或人Na_V通道序列)或表位特异性，或者可替代地，对于在配体-受体相互作用(结合)中起作用的人β-趋化因子序列(或人Na_V通道序列)或表位特异性时。在各种实施例中，可使用从本文所述的非人动物中分离的细胞来测定由候选治疗性抗体或siRNA结合的β-趋化因子表位(或Na_V通道表位)。

来自本文所述的非人动物的细胞可分离并且在特定目的基础上使用，或者可在培养中维持许多代。在各种实施例中，来自本文所述的非人动物的细胞永生化(例如，经由病毒的使用)，并且在培养中(例如，在连续培养中)无限期地维持。

本文所述的非人动物提供了用于生成抗体变体的体内系统，所述抗体结合一种或多种β-趋化因子多肽(或Na_V通道)。此类变体包括具有所需功能性、特异性、与由两种或更多种β-趋化因子多肽(或Na_V通道)共享的共同表位的低交叉反应性的抗体。在一些实施例中，本文所述的非人动物用于生成抗体实验对象组，以生成筛选所需或改进功能性的一系列变体抗体。

本文所述的非人动物提供了用于生成抗β-趋化因子(或抗Na_V)抗体文库的体内系统。此类文库提供了重链和轻链可变区序列源，其可基于所需效应子功能移植到不同的Fc区上和/或使用本领域已知的技术(例如定点诱变、易错PCR等)用作可变区序列的亲和力成熟的来源。

本文所述的非人动物提供了用于分析和测试药物或疫苗的体内系统。在各种实施例中，可将候选药物或疫苗递送至本文所述的一种或多种非人动物，随后监测非人动物，以确定对药物或疫苗的免疫应答、药物或疫苗的安全性概况、或者对疾病或状况和/或疾病或状况的一种或多种症状的作用中的一种或多种。用于确定安全性概况的示例性方法包括测量毒性、最佳剂量浓度、抗体(即抗药物)应答、药物或疫苗的功效以及可能的危险因素。此类药物或疫苗可在此类非人动物中进行改进和/或开发。

疫苗功效可以多种方式确定。简言之，使用本领域已知的方法疫苗接种本文所述的非人动物，然后用疫苗攻击或将疫苗施用于已经感染的非人动物。非人动物对疫苗的应答可通过监测人动物(或由其分离的细胞)和/或对非人动物(或由其分离的细胞)执行一种或多种测定来测量，以确定疫苗的功效。然后使用本领域已知的和/或本文所述的一种或多种测量，将非人动物对疫苗的应答与对照动物进行比较。

疫苗功效还可通过病毒中和测定来确定。简言之，免疫本文所述的非人动物，并且在免疫后的不同日收集血清。连续稀释的血清与病毒预温育，在此期间血清中对于病毒特异性的抗体将与其结合。然后将病毒/血清混合物加入允许细胞中，以通过噬斑测定或微量中和测定来确定感染性。如果血清中的抗体中和病毒，则存在与对照组相比较少的噬斑或较低的相对荧光素酶单位。

本文所述的非人动物提供了用于开发和表征基于抗体的治疗剂的改进的体内系统，所述基于抗体的治疗剂用于癌症和/或炎性疾病中。炎症长期以来已与癌症相关(例如在Grivennikov,S.I.等人，2010,Cell 140:883-99；Rakoff-Nahoum,S.,2006,YaleJ.Biol.Med.79:123-30中综述)。事实上，发展中的肿瘤环境的特征部分在于各种炎症介质的浸润。此外，持续的炎症可导致发展中的癌症的更高概率。因此，在一些实施例中，本文所述的非人动物提供了用于开发和/或鉴定抗癌和/或抗炎治疗剂的体内系统。在各种实施例中，可用肿瘤(或肿瘤细胞)植入本文所述的非人动物或对照非人动物(例如，具有不同于本文所述的遗传修饰或不具有遗传修饰，即野生型)，随后施用一种或多种候选治疗剂。在一些实施例中，候选治疗剂可包括多特异性抗体(例如双特异性抗体)或抗体混合物。在一些实施例中，候选治疗剂包括组合疗法，例如，序贯或同时给药的两种或更多种单特异性抗体的施用。在一种或多种候选治疗剂施用之前，可允许肿瘤在非人动物内的一个或多个位置中建立足够的时间。可在施用候选治疗之前和之后测量肿瘤细胞增殖、生长、存活等。也可根据需要在非人动物中测量候选治疗剂的细胞毒性。

本文所述的非人动物提供了用于开发和表征基于抗体的治疗剂的改进的体内系统，所述基于抗体的治疗剂用于治疗疼痛(例如，神经性)或用作止痛剂。在一些实施例中，本文所述的非人动物提供了用于开发和/或鉴定抗疼痛治疗剂的体内系统。在各种实施例中，本文所述的非人动物或对照非人动物(例如具有不同于本文所述的遗传修饰[例如，如美国专利号8,871,996和8,486,647中所述的修饰；所述专利以引用的方式并入本文]或不具有遗传修饰，即野生型)可经受疼痛刺激(例如切口、化学诱导等；参见例如Recognitionand Alleviation of Pain in Laboratory Animals.Washingto n D.C.:NationalAcademies Press,2009.Print)，随后施用一种或多种候选治疗剂。在一些实施例中，候选治疗剂可包括多特异性抗体(例如双特异性抗体)或抗体混合物。在一些实施例中，候选治疗剂包括组合疗法，例如，序贯或同时给药的两种或更多种单特异性抗体的施用。在一种或多种候选治疗剂施用之前，可允许足够的时间段。可在用候选治疗剂施用之前和用候选治疗剂施用之后，记录通常与疼痛管理和/或疼痛治疗效果评价相关的各种测量和/或测试。

试剂盒

本文还描述了包含一个或多个容器的包装或试剂盒，所述一个或多个容器填充有如本文所述的至少一种非人动物、非人细胞、DNA片段和/或靶向载体。试剂盒可以用于任何适用的方法(例如，研究方法)。任选地与一个或多个此类容器相关的可以是由政府机构规定形式的注意事项，该注意事项规定药物或生物产品的制造、使用或销售，该注意事项反映了(a)机构关于用于人类施用的制造、使用或销售的批准，(b)使用说明或它们二者，或管理两个或更多个实体之间的材料和/或生物产品(例如，本文所述的非人动物或非人细胞)的转移的合约。

所述实施例的其它特点将在示例性实施例的下述描述的过程中将变得显而易见，所述示例性实施例为了说明而给出，并且不预期是其限制。

其他实施例如下：

1.一种啮齿类动物，其基因组包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。

2.根据权利要求1所述的啮齿类动物，其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。

3.根据权利要求1或2所述的啮齿类动物，其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。

4.根据权利要求3所述的啮齿类动物，其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。

5.根据前述权利要求中任一项所述的啮齿类动物，其中所述目的非免疫球蛋白多肽是趋化因子受体。

6.根据权利要求5所述的啮齿类动物，其中所述趋化因子受体是非典型趋化因子受体(ACKR)。

7.根据权利要求6所述的啮齿类动物，其中所述ACKR是D6趋化因子诱饵受体。

8.根据权利要求7所述的啮齿类动物，其中所述经改造的D_H区包括5、10、15、20、25个或更多个核苷酸序列，所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

9.根据权利要求8所述的啮齿类动物，其中所述经改造的D_H区包括25个核苷酸序列，所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

10.根据权利要求8或9所述的啮齿类动物，其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。

11.根据权利要求9所述的啮齿类动物，其中所述25个核苷酸序列各自编码与表3中出现的序列至少95％相同的序列。

12.根据权利要求9所述的啮齿类动物，其中所述25个核苷酸序列各自编码与表3中出现的序列基本上相同的序列。

13.根据权利要求9所述的啮齿类动物，其中所述25个核苷酸序列各自编码与表3中出现的序列相同的序列。

14.根据前述权利要求中任一项所述的啮齿类动物，其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。

15.根据权利要求1-4中任一项所述的啮齿类动物，其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。

16.根据权利要求15所述的啮齿类动物，其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。

17.根据权利要求16所述的啮齿类动物，其中所述芋螺毒素是μ-芋螺毒素。

18.根据权利要求17所述的啮齿类动物，其中所述经改造的D_H区包括5、10、15、20、25个或更多个核苷酸序列，其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。

19.根据权利要求18所述的啮齿类动物，其中所述经改造的D_H区包括26个核苷酸序列，其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。

20.根据权利要求19所述的啮齿类动物，其中所述26个核苷酸序列各自编码与表4中出现的序列至少95％相同的序列。

21.根据权利要求19所述的啮齿类动物，其中所述26个核苷酸序列各自编码与表4中出现的序列基本上相同的序列。

22.根据权利要求19所述的啮齿类动物，其中所述26个核苷酸序列各自编码与表4中出现的序列相同的序列。

23.根据权利要求15-22中任一项所述的啮齿类动物，其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。

24.根据前述权利要求中任一项所述的啮齿类动物，其中所述经改造的D_H区还包括侧接所述一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。

25.根据权利要求24所述的啮齿类动物，其中所述第一重组信号序列包含与图2中出现的第一重组信号序列至少95％相同的序列。

26.根据权利要求24所述的啮齿类动物，其中所述第一重组信号序列包含与图2中出现的第一重组信号序列基本上相同的序列。

27.根据权利要求24所述的啮齿类动物，其中所述第一重组信号序列包含与图2中出现的第一重组信号序列相同的序列。

28.根据权利要求24所述的啮齿类动物，其中所述第二重组信号序列包含与图2中出现的第二重组信号序列至少95％相同的序列。

29.根据权利要求24所述的啮齿类动物，其中所述第二重组信号序列包含与图2中出现的第二重组信号序列基本上相同的序列。

30.根据权利要求24所述的啮齿类动物，其中所述第二重组信号序列包含与图2中出现的第二重组信号序列相同的序列。

31.根据权利要求24所述的啮齿类动物，其中所述第一重组信号序列和第二重组信号序列选自图2。

32.根据前述权利要求中任一项所述的啮齿类动物，其中所述啮齿类动物的基因组缺乏一个或多个野生型内源性D_H基因区段。

33.根据前述权利要求中任一项所述的啮齿类动物，其中所述啮齿类动物的基因组缺乏一个或多个野生型内源性重组信号序列。

34.根据权利要求1-33中任一项所述的啮齿类动物，其中所述啮齿类动物是大鼠或小鼠。

35.一种分离的啮齿类动物细胞或组织，其基因组包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。

36.一种永生化细胞，其由根据权利要求35所述的分离的啮齿类动物细胞制备。

37.一种啮齿类动物胚胎干细胞，其基因组包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分。

38.一种啮齿类动物胚胎，其由根据权利要求37所述的啮齿类动物胚胎干细胞生成。

39.一种制备啮齿类动物的方法，所述啮齿类动物的基因组含有免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，所述方法包括

(a)将DNA片段插入啮齿类动物胚胎干细胞内，所述DNA片段包含一个或多个核苷酸序列，所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分；

(b)获得(a)中生成的所述啮齿类动物胚胎干细胞；和

(c)使用(b)的胚胎干细胞产生啮齿类动物。

40.根据权利要求39所述的方法，其中所述目的非免疫球蛋白多肽是趋化因子受体。

41.根据权利要求40所述的方法，其中所述趋化因子受体是非典型趋化因子受体(ACKR)。

42.根据权利要求41所述的方法，其中所述ACKR是D6趋化因子诱饵受体。

43.根据权利要求42所述的方法，其中所述DNA片段包括5、10、15、20、25个或更多个核苷酸序列，所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

44.根据权利要求43所述的方法，其中所述DNA片段包括25个核苷酸序列，所述25个核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

45.根据权利要求43或44所述的方法，其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。

46.根据权利要求39所述的方法，其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。

47.根据权利要求46所述的方法，其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。

48.根据权利要求47所述的方法，其中所述芋螺毒素是μ-芋螺毒素。

49.根据权利要求48所述的方法，其中所述DNA片段包括5、10、15、20、25个或更多个核苷酸序列，所述核苷酸序列各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。

50.根据权利要求49所述的方法，其中所述DNA片段包括26个核苷酸序列，所述26个核苷酸序列各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。

51.根据权利要求44或50所述的方法，其中所述DNA片段还包含侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。

52.一种制备啮齿类动物的方法，所述啮齿类动物的基因组含有免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，所述方法包括

修饰所述啮齿类动物的基因组，使得它包含免疫球蛋白重链可变区，所述免疫球蛋白重链可变区包括经改造的D_H区，所述经改造的D_H区包含一个或多个核苷酸序列，所述一个或多个核苷酸序列各自编码目的非免疫球蛋白多肽或其一部分，由此制备所述啮齿类动物。

53.根据权利要求52所述的方法，其中所述目的非免疫球蛋白多肽是趋化因子受体。

54.根据权利要求53所述的方法，其中所述趋化因子受体是非典型趋化因子受体(ACKR)。

55.根据权利要求54所述的方法，其中所述ACKR是D6趋化因子诱饵受体。

56.根据权利要求55所述的方法，其中所述啮齿类动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列，所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

57.根据权利要求56所述的方法，其中所述啮齿类动物的基因组被修饰为包括25个核苷酸序列，所述25个核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

58.根据权利要求56或57所述的方法，其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。

59.根据权利要求52所述的方法，其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。

60.根据权利要求59所述的方法，其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。

61.根据权利要求60所述的方法，其中所述芋螺毒素是μ-芋螺毒素。

62.根据权利要求61所述的方法，其中所述啮齿类动物的基因组被修饰为包括5、10、15、20、25个或更多个核苷酸序列，其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。

63.根据权利要求62所述的方法，其中所述啮齿类动物的基因组被修饰为包括26个核苷酸序列，其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。

64.根据权利要求57或63所述的方法，其中所述啮齿类动物的基因组被修饰为还包括侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。

65.根据权利要求39-64中任一项所述的方法，其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。

66.根据权利要求39-64中任一项所述的方法，其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。

67.根据权利要求66所述的方法，其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。

68.一种在啮齿类动物中产生抗体的方法，所述方法包括以下步骤：

(a)用抗原免疫啮齿类动物，所述啮齿类动物具有包含免疫球蛋白重链可变区的基因组，所述免疫球蛋白重链可变区包括经改造的D_H区，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码目的非免疫球蛋白多肽或其一部分；

(b)将所述啮齿类动物维持在足以使所述啮齿类动物对所述抗原产生免疫应答的条件下；和

(c)从所述啮齿类动物或啮齿类动物细胞中回收结合所述抗原的抗体。

69.根据权利要求68所述的方法，其中所述啮齿类动物细胞是B细胞。

70.根据权利要求68所述的方法，其中所述啮齿类动物细胞是杂交瘤。

71.根据权利要求68-70中任一项所述的方法，其中所述目的非免疫球蛋白多肽是趋化因子受体。

72.根据权利要求71所述的方法，其中所述趋化因子受体是非典型趋化因子受体(ACKR)。

73.根据权利要求72所述的方法，其中所述ACKR是D6趋化因子诱饵受体。

74.根据权利要求73所述的方法，其中所述经改造的D_H区包括5、10、15、20、25个或更多个核苷酸序列，其各自编码D6趋化因子诱饵受体的细胞外部分。

75.根据权利要求74所述的方法，其中所述经改造的D_H区包括25个核苷酸序列，其各自编码D6趋化因子诱饵受体的细胞外部分。

76.根据权利要求74或75所述的方法，其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。

77.根据权利要求68-70中任一项所述的方法，其中所述目的非免疫球蛋白多肽是芋螺毒素或狼蛛毒素。

78.根据权利要求77所述的方法，其中所述芋螺毒素选自α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素、ω-芋螺毒素及其组合。

79.根据权利要求78所述的方法，其中所述芋螺毒素是μ-芋螺毒素。

80.根据权利要求79所述的方法，其中所述经改造的D_H区包括5、10、15、20、25个或更多个核苷酸序列，其各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。

81.根据权利要求80所述的方法，其中所述经改造的D_H区包括26个核苷酸序列，其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。

82.根据权利要求75或81所述的方法，其中所述经改造的D_H区还包含侧接所述25或26个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列。

83.根据权利要求68-82中任一项所述的方法，其中所述免疫球蛋白重链可变区是人免疫球蛋白重链可变区。

84.根据权利要求68-83中任一项所述的方法，其中所述免疫球蛋白重链可变区可操作地连接至免疫球蛋白重链恒定区。

85.根据权利要求84所述的方法，其中所述免疫球蛋白重链恒定区是内源性免疫球蛋白重链恒定区。

86.根据权利要求39-85中任一项所述的方法，其中所述啮齿类动物是大鼠或小鼠。

87.一种啮齿类动物，其基因组包含

人免疫球蛋白重链可变区，所述人免疫球蛋白重链可变区包含一个或多个人V_H基因区段、经改造的D_H区和一个或多个人J_H基因区段，所述经改造的D_H区包括

(i)各自编码非典型趋化因子受体(ACKR)的细胞外部分的一个或多个核苷酸序列；和

(ii)侧接(i)的一个或多个核苷酸序列中的每一个的第一重组信号序列和第二重组信号序列；

其中所述人免疫球蛋白重链可变区可操作地连接至一个或多个内源性免疫球蛋白恒定区基因，使得所述啮齿类动物的特征在于当它用抗原免疫时，它生成的抗体包含由所述一个或多个人V_H基因区段编码的人重链可变结构域、经改造的D_H区、以及可操作地连接至由一个或多个内源性免疫球蛋白恒定区基因编码的啮齿类动物重链恒定结构域的一个或多个人J_H基因区段，并且其中所述抗体显示与所述抗原的特异性结合。

88.根据权利要求87所述的啮齿类动物，其中所述ACKR是D6趋化因子诱饵受体。

89.根据权利要求88所述的啮齿类动物，其中所述经改造的D_H区包括25个核苷酸序列，所述核苷酸序列各自编码D6趋化因子诱饵受体的细胞外部分。

90.根据权利要求89所述的啮齿类动物，其中所述D6趋化因子诱饵受体的细胞外部分选自N末端区域、细胞外环及其组合。

91.一种啮齿类动物，其基因组包含

(i)各自编码毒素的一部分的一个或多个核苷酸序列；和

92.根据权利要求91所述的啮齿类动物，其中所述一个或多个核苷酸序列各自编码μ-芋螺毒素、狼蛛毒素或其组合的一部分。

93.根据权利要求92所述的啮齿类动物，其中所述经改造的D_H区包括26个核苷酸序列，其各自编码μ-芋螺毒素和/或狼蛛毒素的一部分。

94.根据权利要求87或91所述的啮齿类动物，其中所述一个或多个核苷酸序列包含增加所述一个或多个核苷酸序列的体细胞超突变的一个或多个核苷酸取代。

95.根据权利要求87-94中任一项所述的啮齿类动物，其还包含将一个或多个人V_L基因区段和一个或多个人J_L基因区段插入内源性轻链基因座内。

96.根据权利要求95所述的啮齿类动物，其中所述人V_L和J_L区段是Vκ和Jκ基因区段，并且插入内源性κ轻链基因座内。

97.根据权利要求96所述的啮齿类动物，其中所述人Vκ和Jκ基因区段与啮齿类动物Cκ基因可操作地连接。

98.根据权利要求95所述的啮齿类动物，其中所述人V_L和J_L区段是Vλ和Jλ基因区段，并且插入内源性λ轻链基因座内。

99.根据权利要求98所述的啮齿类动物，其中所述人Vλ和Jλ基因区段与啮齿类动物Cλ基因可操作地连接。

100.根据权利要求87-99中任一项所述的啮齿类动物，其中所述啮齿类动物是大鼠或小鼠。

实例

提供下述实例以便向本领域普通技术人员描述如何制备和使用本文公开的方法和组合物，并且不预期限制发明人视为其发明的范围。除非另外指明，否则所给出的温度为摄氏度，压力是大气压或接近大气压。

实例1.经改造的多样性簇的构建，所述经改造的多样性簇包括在免疫球蛋白重链可变区内的D6趋化因子诱饵受体的核苷酸编码序列

本实例示出了构建用于插入非人动物如啮齿类动物(例如小鼠)的基因组内的靶向载体的示例性方法。特别地，本实例中描述的方法证实了用于插入啮齿类动物(例如小鼠)胚胎干(ES)细胞的基因组内的靶向载体的产生，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述免疫球蛋白重链可变区包括经改造的重链多样性(D_H)区，所述经改造的D_H区包括各自编码非免疫球蛋白多肽或其一部分的一个或多个核苷酸序列。在本实例中，非典型趋化因子受体(ACKR)例如D6趋化因子诱饵受体的细胞外结构域的编码序列，用于构建用于整合到免疫球蛋白重链可变区内的靶向载体。如下所述，将编码序列置于与重链可变(V_H)和重链连接(J_H)区段的可操作地连接中，代替传统D_H基因区段，使得在VDJ重组后，表达具有由编码序列生成的V_H CDR3的抗体。

使用

技术(参见例如美国专利号6,586,251和Valenzuela等人，2003,Nature Biotech.21(6):652-659；以引用的方式并入本文)和本领域已知的分子生物学技术，产生含有来自D6趋化因子诱饵受体的细胞外结构域的编码序列的靶向载体，所述编码序列用于插入免疫球蛋白重链可变区内。根据需要，本实例中描述的方法可用于利用源自任何所需多肽的编码序列的任何集合、或编码序列(或编码序列片段)的组合。在图3和4中阐述了使用来自D6趋化因子诱饵受体的细胞外结构域的编码序列，用于构建靶向载体的可替代和非限制性的示例性策略。

简言之，通过从头DDNA合成制备一系列四种DNA片段(D₆-DH1116、D₆-DH17613、D₆-DH114619和D₆DH120126)，所述DNA片段各自含有几个D6编码序列(表5；Blue HeronBiotech,Bothell,WA))。在每种DNA片段的末端处包括各种限制性酶位点和/或重叠区(～40bp，其包括多重限制性酶位点)，以允许随后的串联克隆(参见下文)。单个人D_H区段(即D_H6-25)在D_H区中保持完整，所述DH区改造为含有对应于D6诱饵趋化因子受体的细胞外结构域一部分的核苷酸编码序列。在一些实施例中，免疫球蛋白基因区段(例如D_H区段)可与亚最佳或缺陷的重组信号序列(例如七聚体和/或九聚体序列)结合，使得此类D_H区段的使用基本上小于与表征为野生型、正常和/或无缺陷的重组信号序列结合的D_H区段的使用。因此，当改造D_H区以含有各自编码目的非免疫球蛋白多肽或其一部分(例如，D6趋化因子诱饵受体)的核苷酸编码序列时，此类D_H区段(例如图2中显示的D_H6-25，RSS序列)可保持完整或缺失。

免疫球蛋白参与称为体细胞超突变的细胞机制，其产生特征在于对其靶的高亲和力的亲和力成熟的抗体变体。尽管体细胞超突变在很大程度上在抗体可变区的CDR内发生，但突变优先靶向称为热点的某些序列基序，例如RGYW活化诱导胞苷脱氨酶(AID)热点(参见例如Li,Z.等人，2004,Genes Dev.18:1-11；Teng,G.和F.N.Papavasiliou,2007,Annu.Rev.Genet.41:107-20；在此以引用的方式并入)。每个D6编码序列的核酸序列天然含有此类热点序列，然而，将人工热点引入选择的D6编码序列内，以优化在B细胞受体的克隆选择期间的体细胞超突变的潜力。在从头合成之前，将用于SHM的人工热点引入计算机芯片上的D6编码序列内。图1阐述了本文所述的D6编码序列中采用的天然和人工热点的示例性分析。

V(D)J重组由称为重组信号序列(RSS)的侧翼DNA序列引导，所述侧翼DNA序列确保在相对于V、D和J编码序列的精确位置处的DNA重排。每个RSS由以下组成：与编码序列邻接的七个核苷酸(七聚体)的保守嵌段，随后为非保守的间隔物(12或23bp)和九个核苷酸(九聚体)的第二保守嵌段。每个D6编码序列都设计有优化的RSS，以允许更好的重组频率和相等的使用。简言之，D_H RSS序列中的所有七聚体和九聚体都替换为共有序列(图2)。修复非功能性“仅ORF”D_H区段的RSS序列，以允许与D6编码序列一起使用。如本文所述，“仅ORF”是包括编码序列的D_H区段，所述编码序列可在至少一个开放读码框中翻译，但具有至少一个非功能性RSS序列(不被RAG重组酶识别)。本发明人认识到，优化的七聚体和九聚体无法确保所有的D6编码序列都以相等的频率使用，至少部分是由于来自间隔物、编码末端序列、侧翼基因间序列等的不可预测的影响。如上文对于体细胞超突变热点所述，在D6 DNA片段的从头合成之前，在计算机芯片上设计优化的RSS。

制备D6 DNA片段用于串联装配在一起，采用设计到每个片段内的限制性酶位点和重叠区。通过使用AgeI和EcoRI的限制性消化，制备D6-DH1166片段和携带新霉素盒的质粒用于连接(图3A，上)。根据制造商的说明书，使用DNA连接酶将AgeI/EcoRI消化的质粒和D6-DH1166片段连接在一起。用SnaBI消化连接产物和剩余的D6DNA片段。将BAC载体(pBACE3.6)分别用NotI和AscI消化，以接受D6 DNA片段(图3A，中)。如先前所述，使用一步等温装配来装配D6-DH1166/新霉素盒连接产物和剩余的D6 DNA片段(图3A，下；Barnes,W.M.,1994,Proc.Natl.Acad.Sci.91(6):2216-20；Gibson,D.G.等人，2009,Nat.Methods 6(5):343-5；Gibson,D.G.等人，2010,Nat.Methods 7(11):901-3)。然后将装配的D6 DNA片段(图3B，上)用PI-SceI和I-CeuI消化，并且经由相容性末端，与含有5'和3'同源臂的BAC克隆连接在一起，所述5'和3'同源臂分别含有～50kb的人可变区基因组DNA和人J_H簇(图3B，中)。最终的靶向载体从5'到3'含有～50kb的5'同源臂(其含有人可变区DNA)、新霉素盒、含有D6趋化因子诱饵受体的25个细胞外编码序列的～41kb DNA片段、人J_H簇、小鼠重链内含子增强子(Ei)、小鼠IgM恒定区基因和lox位点(图3B，下)。

可替代地，上述D6 DNA片段可通过使用分子技术来装配，所述分子技术不同于上述那些，仍为本领域已知的。例如，因为D6 DNA片段串联排列，所以根据需要通过使用设计到片段末端内的不同限制性位点/重叠区，可实现各种不同的设计(例如编码序列的次序)。图4A和4B中阐述了通过序贯连接装配上述D6 DNA片段的示例性替代方法。

将上述D6-D_H靶向载体引入小鼠胚胎干(ES)细胞内，用于产生含有免疫球蛋白重链基因座的经修饰的ES细胞，所述免疫球蛋白重链基因座含有经改造的多样性簇，例如经改造的D_H区。

表5

实例2.具有经改造的多样性簇的啮齿类动物的生成，所述经改造的多样性簇包括在免疫球蛋白重链可变区内的D6趋化因子诱饵受体的核苷酸编码序列

本实例证实了其基因组包含免疫球蛋白重链可变区的非人动物(例如啮齿类动物)的产生，所述免疫球蛋白重链可变区包括经改造的重链多样性(D_H)区，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码非免疫球蛋白多肽的一部分，特别是非典型趋化因子受体(ACKR)，例如D6趋化因子诱饵受体的细胞外部分。

通过使用表6中阐述的引物的测序和在靶向载体的构建自始至终的聚合酶链反应，证实了实例1中描述的D6-D_H靶向载体的正确装配和D6 DNA片段靶向插入BAC DNA的多样性簇内。然后经由电穿孔，将通过聚合酶链反应证实的靶向BAC DNA引入F1杂种(129S6SvEvTac/C57BL6NTac)小鼠胚胎干(ES)细胞内，随后为在选择培养基中的培养。用于电穿孔的ES细胞具有基因组，其包括与啮齿类动物免疫球蛋白重链恒定区(例如IgM)可操作地连接的人V_H和J_H基因区段，缺少人D_H区的全部或部分(即缺失)，并且含有编码一种或多种鼠Adam6基因的插入序列(参见例如美国专利号8,642,835和8,697,940)。如先前所述(Valenzuela等人，同上；Frendewey,D.等人，2010,Methods Enzymol.476:295-307)，使用检测D6编码序列正确整合到免疫球蛋白可变区的多样性簇内的引物/探针组(表7[F：正向引物，P：探针，R：反向引物]和图5)，在电穿孔后10天挑选抗药性集落，并且通过

和核型分型筛选正确靶向。

使用

方法(DeChiara,T.M.等人，2010,Methods Enzymol.476:285-294；Dechiara,T.M.,2009,Methods Mol.Biol.530:311-324；Poueymirou等人，2007,Nat.Biotechnol.25:91-99)，其中将靶向ES细胞注射到未压实的8细胞期Swiss Webster胚胎内，以产生健康的完全ES细胞来源的F0代小鼠，其对于经改造的D_H区是杂合的并且表达含有重链可变区的抗体，所述重链可变区包括由D6编码序列的重组生成的CDR3区。将F0代杂合子雄性与C57Bl6/NTac雌性杂交，以生成F1杂合体，所述F1杂合体互交，以产生F2代纯合体和野生型小鼠用于表型分析。

药物选择盒可任选通过随后添加重组酶(例如通过Cre处理)或通过与Cre缺失者小鼠品系育种(参见例如国际专利申请公开号WO 2009/114400)来去除，以便去除通过靶向构建体引入的任何loxed选择的盒，所述loxed选择的盒例如在ES细胞期时或在胚胎中未被去除。任选地，选择盒保留在小鼠中。

总之，本实例示出了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)的生成，所述免疫球蛋白重链可变区包括经改造的重链多样性(D_H)区，所述经改造的D_H区的特征在于包括一个或多个核苷酸序列，其各自编码非典型趋化因子受体(ACKR)，例如D6趋化因子诱饵受体的细胞外部分。本文所述的用于将D6编码序列插入传统D_H区段内的策略使得能够构建表达多种抗体的啮齿类动物，所述抗体各自包含由D6编码序列的重组生成的重链CDR3。利用人V_H和J_H区段的存在，本文所述的啮齿类动物提供了用于产生基于人抗体的治疗剂的体内系统，所述基于人抗体的治疗剂的特征在于结合一种或多种CCL的多样性，并且在一些实施例中，提供了用于人使用的基于抗体的消炎药。

表6

表7

实例3.经改造的多样性簇的构建，所述经改造的多样性簇包括在免疫球蛋白重链可变区内的一种或多种毒素肽的核苷酸编码序列

本实例示出了构建用于插入非人动物如啮齿类动物(例如小鼠)的基因组内的靶向载体的示例性方法。特别地，本实例中描述的方法证实了用于插入啮齿类动物(例如小鼠)胚胎干(ES)细胞的基因组内的靶向载体的产生，以产生其基因组包含免疫球蛋白重链可变区的啮齿类动物，所述免疫球蛋白重链可变区包括经改造的重链多样性(D_H)区，所述经改造的D_H区包括各自编码非免疫球蛋白多肽的一部分的一个或多个核苷酸序列。在本实例中，两种毒素(例如芋螺毒素，例如μ-芋螺毒素和狼蛛毒素，例如ProTxII)的编码序列，用于构建用于整合到免疫球蛋白重链可变区内的靶向载体。如下所述，将编码序列置于与重链可变(V_H)和重链连接(J_H)区段的可操作地连接中，代替传统D_H基因区段，使得在VDJ重组后，表达具有由编码序列生成的CDR3的抗体。

如上文实例1中所述，产生含有来自μ-芋螺毒素和狼蛛毒素(例如ProTxII)的编码序列的靶向载体，所述编码序列用于插入免疫球蛋白重链可变区内。根据需要，本文所述的方法可用于利用源自任何所需芋螺毒素(例如α-芋螺毒素、δ-芋螺毒素、κ-芋螺毒素、μ-芋螺毒素和/或ω-芋螺毒素)、狼蛛毒素(例如ProTxI、ProTxII、虎纹捕鸟蛛毒素-IV[HWTX-IV]等)的编码序列的任何集合、或编码序列(或编码序列片段)的组合。在图7A和7B中阐述了使用来自μ-芋螺毒素和狼蛛毒素的编码序列用于构建靶向载体的示例性策略。

简言之，通过从头DNA合成制备一系列四种DNA片段，所述DNA片段各自含有几个μ-芋螺毒素(μCTX)和狼蛛毒素(ProTxII)编码序列(表8；Blue Heron Biotech,Bothell,WA)。实例1中所述，在每种DNA片段的末端处包括各种限制性酶位点和/或重叠区，以允许随后的串联克隆。总共26个毒素编码序列用于构建经改造的D_H区，其包括整个D_H编码序列的替换和插入D_H编码序列内(即，仅部分替换D_H)。用相应的毒素编码序列在D_H位置1-26、2-2、2-8、2-15、2-21、3-3、3-9、3-10、3-16和3-22处进行毒素编码序列的插入，而用毒素编码序列替换D_H序列在D_H位置1-1、1-7、1-14、1-20、4-4、4-11、4-17、4-23、5-5、5-12、5-18、5-24、6-6、6-13、6-19和6-25处进行(参见表8)。在插入的情况下，将毒素序列插入开放读码框二(ORF2)中，并且侧翼为D_H共有序列(例如参见图2)。保留天然侧翼D_H序列提供天然的柔性接头序列和/或使用D_H2区段中的二硫键来环化编码的毒素肽。与实例1中描述的使用D6编码序列构建的经改造的D_H区相比，在构建包括毒素编码序列的D_H区中，D_H6-25被替换为全长μCTXKIIIA(μCTX-KIIIA fl；SEQ ID NO:228，参见表8)。

如实例1中所述，每个毒素编码序列的核酸序列天然含有此类热点序列，然而，在从头合成之前，在计算机芯片上将人工热点引入选择的毒素编码序列内，以优化在B细胞受体的克隆选择期间的体细胞超突变的潜力(参见图6A-6L)。进一步地，在从头合成之前，每个毒素编码序列在计算机芯片上设计有优化的RSS，以允许更好的重组频率和相等的使用(图2)。如实例1所述制备毒素DNA片段的装配(参见图7A和7B)。

可替代地，上述毒素DNA片段可通过使用分子技术来装配，所述分子技术不同于上述那些，仍为本领域已知的。例如，因为毒素DNA片段串联排列，所以根据需要通过使用设计到片段末端内的不同限制性位点/重叠区，可实现各种不同的设计(例如编码序列的次序)。图8A和8B中阐述了通过序贯连接装配上述毒素DNA片段的示例性替代方法。

将上述TX-D_H靶向载体引入小鼠胚胎干(ES)细胞内，用于产生含有免疫球蛋白重链基因座的经修饰的ES细胞，所述免疫球蛋白重链基因座含有经改造的多样性簇。

表8

实例4.具有经改造的多样性簇的啮齿类动物的生成，所述经改造的多样性簇包括在免疫球蛋白重链可变区内的一种或多种毒素肽的核苷酸编码序列

本实例证实了其基因组包含免疫球蛋白重链可变区的非人动物(例如啮齿类动物)的产生，所述免疫球蛋白重链可变区包括经改造的重链多样性(_H)区，其中所述经改造的_H区包括一个或多个核苷酸序列，其各自编码非免疫球蛋白多肽的一部分，特别是毒素，例如芋螺毒素(例如μ-芋螺毒素)、狼蛛毒素(例如ProTxII)或其组合。

通过使用表6中阐述的引物的测序和在靶向载体的构建自始至终的聚合酶链反应，证实了实例3中描述的TX-D_H靶向载体的正确装配和毒素DNA片段靶向插入BAC DNA的多样性簇内。然后经由电穿孔，将通过聚合酶链反应证实的靶向BAC DNA引入F1杂种(129S6SvEvTac/C57BL6NTac)小鼠胚胎干(ES)细胞内，随后为在选择培养基中的培养。用于电穿孔的ES细胞具有基因组，其包括与啮齿类动物免疫球蛋白重链恒定区(例如IgM)可操作地连接的人V_H和J_H基因区段，缺少人D_H区(即缺失)，并且含有编码一种或多种鼠Adam6基因的插入序列(参见例如美国专利号8,642,835和8,697,940)。如先前所述(Valenzuela等人，同上；Frendewey,D.等人，2010,Methods Enzymol.476:295-307)，使用检测毒素编码序列正确整合到免疫球蛋白可变区的多样性簇内的引物/探针组(表7和图5)，在电穿孔后10天挑选抗药性集落，并且通过

和核型分型筛选正确靶向。

使用

方法(DeChiara,T.M.等人，2010,Methods Enzymol.476:285-294；Dechiara,T.M.,2009,Methods Mol.Biol.530:311-324；Poueymirou等人，2007,Nat.Biotechnol.25:91-99)，其中将靶向ES细胞注射到未压实的8细胞期Swiss Webster胚胎内，以产生健康的完全ES细胞来源的F0代小鼠，其对于经改造的D_H区是杂合的并且表达含有重链可变区的抗体，所述重链可变区包括由毒素编码序列的重组生成的CDR3区。将F0代杂合子雄性与C57Bl6/NTac雌性杂交，以生成F1杂合体，所述F1杂合体互交，以产生F2代纯合体和野生型小鼠用于表型分析。

总之，本实例示出了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)的生成，所述免疫球蛋白重链可变区包括经改造的重链多样性(D_H)区，所述经改造的D_H区的特征在于包括一个或多个核苷酸序列，其各自编码毒素肽的一部分，例如μ-芋螺毒素、ProTxII或其组合。本文所述的用于将毒素编码序列插入传统D_H区段内的策略使得能够构建表达抗体的啮齿类动物，所述抗体被配置为使得它们含有由毒素编码序列的重组生成的重链CDR3。利用人V_H和J_H区段的存在，本文所述的啮齿类动物提供了用于产生基于人抗体的治疗剂的体内系统，所述基于人抗体的治疗剂的特征在于指导与离子通道(例如电压门控钠通道，例如Na_V1.7)结合的多样性，并且在一些实施例中，提供了用于人使用的基于抗体的抗疼痛药物。

实例5.具有经改造的多样性簇的啮齿类动物的表型评价

本实例证实了其基因组包含免疫球蛋白重链可变区的啮齿类动物(例如小鼠)中的各种免疫细胞群的表征，所述免疫球蛋白重链可变区包括经改造的重链多样性(D_H)区，其中所述经改造的D_H区包括一个或多个核苷酸序列，其各自编码非免疫球蛋白多肽的一部分。在本实例中，如实例3中所述的对于包括毒素编码序列(例如μ-芋螺毒素和狼蛛毒素)的经改造的D_H区纯合的啮齿类动物，通过流式细胞术进行分析，用于鉴定在收获的脾和骨髓中的免疫细胞，使用几种荧光标记的抗体。本实例还证实了对于经改造的D_H区杂合的小鼠所收获的脾和骨髓中的免疫细胞的鉴定，所述经改造的DH区如实例1中所述包括ACKR2(也称为D6趋化因子诱饵受体)的细胞外部分的编码序列。如下文所述，与对照经改造的小鼠相比，如本文所述含有经改造的D_H区的小鼠证实在脾和骨髓区室中相似水平的B细胞。重要的是，本实例还证实，如本文所述的含有经改造的D_H区的小鼠证实B细胞的发育和成熟不含B细胞免疫应答中的任何缺陷或不足，并且产生含有由插入的编码序列重排生成的CDR3区和相邻的免疫球蛋白基因区段(即人V_H和J_H)的抗体。

简言之，从

小鼠(n＝3，26％C57BL/6 22％129S6/SvEvTac50％Balb/cAnNTac；参见例如美国专利号8,502,018和8,642,835)和6579ho/1293ho小鼠(“TX-D_H ho”，n＝3；38％C57BL/6NTac 36％129S6/SvEvTac 25％Balb/cAn NTac；对于免疫球蛋白重链基因座纯合的小鼠，所述免疫球蛋白重链基因座含有多个人V_H，代替传统D_H区段的包括毒素编码序列的经改造的D_H区段，以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]；并且对于免疫球蛋白κ轻链基因座纯合，所述免疫球蛋白κ轻链基因座含有可操作地连接至包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因的人Vκ和Jκ基因区段)中收获脾和股骨。通过离心从股骨中收集骨髓。用ACK裂解缓冲液(Gibco)裂解来自脾和骨髓制备物的红血细胞，随后用含2％FBS的1xPBS洗涤。将分离的细胞(1x10⁶)与选择的抗体混合物在+4℃下温育30分钟：染色1：大鼠抗小鼠CD43-FITC(Biolegend 121206，克隆1B11)，大鼠抗小鼠c-kit-PE(Biolegend 105808，克隆2B8)，大鼠抗小鼠IgM-PeCy(eBiosciences 25-5790-82，克隆II/41)，大鼠抗小鼠IgD-PerCP-Cy5.5(Biolegend 405710，克隆11-26c.2a)，大鼠抗小鼠CD3-PB(Biolegend 100214，克隆17-A2)，大鼠抗小鼠B220-APC(eBiosciences 17-0452-82，克隆RA3-6B2)，以及大鼠抗小鼠CD19-APC-H7(BD 560143克隆1D3)。染色2：大鼠抗小鼠κ-FITC(BD 550003，克隆187.1)，大鼠抗小鼠λ-PE(Biolegend 407308，克隆RML-42)，大鼠抗小鼠IgM-PeCy(eBiosciences 25-5790-82，克隆II/41)，大鼠抗小鼠IgD-PerCP-Cy5.5(Biolegend 405710，克隆11-26c.2a)，大鼠抗小鼠CD3-PB(Biolegend 100214，克隆17-A2)，大鼠抗小鼠B220-APC(eBiosciences 17-0452-82，克隆RA3-6B2)，以及大鼠抗小鼠CD19-APC-H7(BD 560143克隆1D3)。染色3：大鼠抗小鼠CD23-FITC(Biolegend 101606克隆B3B4)，大鼠抗小鼠CD93(Biolegend136504，克隆AA4.1)，大鼠抗小鼠IgM-PeCy(eBiosciences 25-5790-82，克隆II/41)，大鼠抗小鼠IgD-PerCP-Cy5.5(Biolegend405710，克隆11-26c.2a)，大鼠抗小鼠CD19-V450(BD 560375，克隆1D3)，大鼠抗小鼠CD21/35-APC(BD 558658，克隆7G6)，以及大鼠抗小鼠B220-APC-eFl780(eBioscences 47-0452-82，克隆RA3-6B2)。在染色后，将细胞洗涤并在2％甲醛中固定。数据采集在BD

流式细胞仪上执行，并且用

软件进行分析。代表性结果在图9A-9D和图10A-10D中阐述。

在类似的实验中，从

小鼠(n＝3，26％C57BL/6 23％129SvEvTac 51％Balb/cAnNTac；参见例如美国专利号8,502,018和8,642,835)和6590het小鼠(“D6-D_H het”，n＝3；75％C57BL/6 25％129SvEvTac；对于免疫球蛋白重链基因座杂合的小鼠，所述免疫球蛋白重链基因座含有多个人V_H，代替传统D_H区段的包括D6趋化因子诱饵受体编码序列的经改造的D_H区段，以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]中收获脾和股骨；并且通过流式细胞术分析(如上所述)。代表性结果在图11A-11D和图12A-12D中阐述。

在另一个类似的实验中，从

小鼠(n＝3，38％C57BL/6 36％129SvEvTac 25％Balb/cAnNTac；参见例如美国专利号8,502,018和8,642,835)和6590ho/1293ho小鼠(“D6-D_H ho”，n＝3；38％C57BL/6 36％129SvEvTac 25％Balb/c AnNTac)中收获脾和股骨，所述6590ho/1293ho小鼠是对于免疫球蛋白重链基因座纯合的小鼠，所述免疫球蛋白重链基因座含有多个人V_H，代替一个或多个传统D_H区段的包括D6趋化因子诱饵受体编码序列的经改造的D_H区段，以及可操作地连接至包括啮齿类动物重链增强子和调控区的啮齿类动物免疫球蛋白重链恒定区的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]；并且对于免疫球蛋白κ轻链基因座纯合，所述免疫球蛋白κ轻链基因座含有可操作地连接至包括啮齿类动物κ轻链增强子的啮齿类动物Cκ区基因的人Vκ和Jκ基因区段)，并且通过流式细胞术分析(如上所述)。代表性结果在图13A-13D和图14A-14D中阐述。

结果显示与对照经改造的小鼠相比，TX-D_H ho小鼠证实在脾和骨髓区室中相似百分比的B细胞。对于一些TX-D_H ho小鼠，观察到更高百分比的Igλ阳性细胞(例如参见图9C和图10D)。总的来说，与对照经改造的小鼠相比，脾中的B细胞成熟证实在TX-D_H ho小鼠中的正常进展。

D6-D_H het小鼠也证实脾和骨髓区室两者中相似的B细胞百分比(图11A-12D)。与对照小鼠相比，D6-D_H het小鼠看起来也具有相似的轻链比率(图11C和12D)。D6-D_H也证实了B细胞的总体正常发育和成熟。

实例6.经改造的D_H区中的人基因使用和编码序列的重排

本实例使用下一代测序(NGS)-抗体储库分析来证实如本文所述的含有经改造的D_H区的啮齿类动物中的人V(D)J基因区段使用。特别地，对从小鼠(其对于含有毒素编码序列的经改造的D_H区纯合)和小鼠(其对于含有ACKR2编码序列的经改造的D_H区杂合)的分选的脾和未分选的骨髓中分离的RNA进行RT-PCR测序。如下所述，在来自具有经改造的D_H区的小鼠的分析序列中观察到所有经改造的D_H区段，所述经改造的DH区含有毒素编码序列代替传统D_H区段。还在下文中描述，在来自具有经改造的D_H区的小鼠的分析序列中观察到大部分(即25个中的16个)经改造的D_H区段，所述经改造的DH区含有ACKR2(D6趋化因子诱饵受体)的细胞外部分的编码序列。

简言之，从6579ho/1293ho小鼠(“TX-D_H ho”，n＝3；同上)中收获脾和骨髓，并且通过使用小鼠抗CD19磁珠和

柱(Miltenyi Biotech)的磁性细胞分选，从总脾细胞中积极富集B细胞。根据制造商的说明书，使用RNeasy Plus RNA分离试剂盒(Qiagen)，从分选的脾细胞和未分选的总骨髓中的富集B细胞中分离总RNA。然后根据制造商的说明书，使用SuperScript III逆转录酶(Thermo Fisher Scientific)和小鼠IgM恒定区引物(表9，IgMRT)，从总RNA合成免疫球蛋白重链(μ链，IgM)cDNA。使用多路PCR策略扩增IgM cDNA，所述多路PCR策略采用设计为与V_H前导序列退火的V_H家族特异性引物(表9，VH多-1、2、3、4、5和6)的混合物和设计为与IgM恒定区退火的引物(表9，IgM PCR1)。使用Pippin Prep(SAGEScience)分离范围为～450-800bp的PCR产物，然后执行使用PCR2引物(表9，PCR2-F和PCR2-R，“XXXXXX”是6nt指数，以区分测序文库且允许同时测序多重文库)的第二PCR，以附着测序衔接子和指数。在加载到MiSeq测序仪(Illumina)上用于使用MiSeq Reagent Kits v3(2x300个循环)测序之前，将范围为～490bp-800bp的PCR产物分离，纯化且通过使用KAPALibrary Quantification Kit(KAPA Biosystems)的qPCR定量。表9阐述了用于储库文库构建的所选引物的序列。

对于生物信息学分析，将Raw Illumina序列去多路化，并且基于质量、长度以及与相应的恒定区基因引物的匹配来过滤。使用定制的内部管道合并且分析重叠的配对末端读数。该管道使用IgBLAST(NCBI，v2.2.25+)的本地安装，以将重排的轻链序列与人种系V_H和J_H基因区段数据库进行比对，并且指示生产性和非生产性连接连同终止密码子的存在。使用如国际免疫遗传学信息系统(IMGT)中定义的边界，提取CDR3序列和预期的非模板核苷酸。代表性结果在表10(使用每种V_H家族特异性引物混合物在序列读数中与毒素编码序列的总匹配)和图15-17中阐述。

结果证实大部分分析的序列含有在V_H区序列的CDR3区内的毒素序列。特别地，在具有经改造的D_H区的小鼠中对应于生产性重排的约87％序列含有在CDR3区内的毒素氨基酸序列，所述经改造的DH区含有多重毒素编码序列代替传统D_H区段。另外，在这些小鼠中位于传统D_H区段的位置内的所有26个毒素编码序列以各种频率检测到。观察到的最高度利用的毒素编码序列是短的μCTX四(4)-氨基酸环SmIIIa(D_H位置D_H2-15)、μCTX-SmIIIA midi插入片段(D_H位置D_H3-16)和μCTX-PIIIA midi(D_H位置D_H3-22)。

在类似的实验中，使用如上所述的下一代测序(NGS)-抗体储库分析，在6590het小鼠(“D6-D_H het”，n＝3；同上)中分析人V_H、经改造的D_H和人J_H区段使用。使用如上所述的多路PCR策略，对从分选的脾和未分选的骨髓中分离的RNA进行RT-PCR测序。代表性结果在表11中(由骨髓和脾扩增的RNA中的核苷酸(NT)序列读数中的框内氨基酸(AA)序列的数目)、表12(来自脾和骨髓的扩增RNA中的选择D6编码序列的百分比[合并所有V_H家族，不反映定量V_H使用])和图18-20中阐述。

结果证实从骨髓和脾扩增的RNA中使用的大部分D6编码序列长度为约30至40个核苷酸。特别地，在从D6-D_H het小鼠分析的序列中最初没有观察到最长(例如Nterm+EC3(216nt))和最短(例如EC1-N(9nt))的D6编码序列。当评价来自经改造的D_H区的D6编码序列的使用时，本发明人观察到某些限制。例如，本发明人注意到，由于凝胶大小选择步骤(参见上文)，含有全长(或长于全长)更长的D6编码序列(例如，D6 Nterm+EC3，D_H位置D_H4-4；SEQID NO:33)的IgM序列可能从序列中排除，并且由于修整选择步骤，较短的D6编码序列(例如，D6EC1，D_H位置D_H5-5；SEQ ID NO:3)可能被排除。然而，对于较短的D6编码序列，序列的手动检查指示这些D6编码序列事实上存在于从扩增的RNA获得的序列中。进一步地，由于所选J_H区段(例如，J_H1)和D6编码序列之间的相似性，在与数据库比较时，本发明人观察到序列的不正确比对。此类序列相似性导致了较短D_H序列的鉴定以及通过某些数据库的模糊注释的可能性。因此，几个序列需要使用人为进行的比对的个别分析。在从D6-D_H het小鼠分析的所有序列中，约50-60％的氨基酸序列在框内，并且利用在扩增重链的CDR3区内的D6编码序列。进一步地，在来自RNA的扩增序列中检测到25个D6经改造的D_H区段中的16个(表12)，而D6 Nterm(D_H3-3)、D6 Nterm+EC3(D_H4-4)、D6 EC1(D_H5-5)、D6 EC1-N(D_H1-7)、D6 EC1-S(D_H5-12)、D6 Nterm-S(D_H6-13)、D6 Nterm-EC3(D_H3-16)、D6 EC1+EC2(D_H4-17)和D6 EC3-C(D_H4-23)在分析的序列中未检测到。如上所述，这些D6编码序列中的一些，特别是较长的D6编码序列的使用在所分析的序列集合中无法被证实。总的来说，并未观察到在骨髓和脾来源的样品之间D6编码序列的使用中的重大差异。此外，在分析的序列中，看起来不存在针对D6编码序列的重排的负选择偏倚。

总之，本实例证实了具有经改造的免疫球蛋白重链基因座的小鼠，特征在于含有非免疫球蛋白多肽(例如，D6趋化因子诱饵受体或者一种或多种毒素)的编码序列代替传统D_H区段的经改造的D_H区的存在，能够将经改造的编码序列与相邻的人V_H和J_H区段重排，以形成功能性重链。进一步地，所提供的经改造的小鼠证实利用在几个人V_H和J_H区段家族的背景下改造到合成D_H区内的多重编码序列的强大抗体储库。

表9

表10

表11

表12

实例7.在含有经改造的D_H区的啮齿类动物中的抗体生产

本实例证实了其基因组中包含免疫球蛋白重链可变区的啮齿类动物中的抗体生产，所述免疫球蛋白重链可变区包括如本文所述的经改造的D_H区。根据需要，本实例中描述的方法和/或本领域众所周知的免疫方法，可用于用多肽或其片段(例如，源自所需表位的肽)或者多肽或其片段的组合免疫含有如本文所述的经改造的D_H区的啮齿类动物。

简言之，使用本领域已知的免疫方法，用目的抗原攻击包括如本文所述的经改造的D_H区的小鼠群组。通过ELISA免疫测定(即血清滴度)监测抗体免疫应答。

包含单个重排的可变基因序列V:J的共同轻链小鼠(也称为通用轻链或ULC小鼠)(例如，Vκ1-39Jκ5或Vκ3-20Jκ1共同轻链小鼠)的生成、以及这些小鼠中抗原特异性抗体的生成，在例如美国专利申请号13/022,759、13/093,156、13/412,936、13/488,628、13/798,310和13/948,818(分别为公开号2011/0195454、2012/0021409、2012/0192300、2013/0045492、US20130185821和US20130302836)中描述，所述专利各自以引用的方式全文并入本文。具体地，制备在其种系中表达经遗传改造的Vκ1-39Jκ5κ轻链(1633HO或1634HO)或经遗传改造的Vκ3-20Jκ1κ轻链(1635HO或1636HO)的小鼠。

将含有单个重排的人种系轻链区(ULC Vκ1-39Jκ5；1633或1634)或(ULC Vκ3-20Jκ1；1635或1636)的

小鼠与携带经修饰的IgG恒定区的小鼠育种。具体地，将此类ULC小鼠与具有包含纯合的免疫球蛋白重链基因座的基因组的小鼠育种，所述纯合的免疫球蛋白重链基因座含有多个人V_H、包括毒素编码序列代替传统D_H区段的经改造的D_H区段、以及与包括小鼠重链增强子和调控区的小鼠免疫球蛋白重链恒定区可操作地连接的J_H区段，并且含有编码一种或多种鼠Adam6基因的插入核苷酸序列[例如美国专利号8,642,835和8,697,940]，以获得对于包含毒素编码序列的重链基因座杂合或纯合，并且对于通用轻链杂合或纯合的后代小鼠。如图21中所示，对于含有毒素编码序列的经改造的D_H区纯合并且对于通用轻链纯合的小鼠(6579HO/1634HO)，在用可溶性蛋白质免疫后具有与对照动物(1460/1634)可比较的抗体应答。

实例8.分离表达和/或编码在含有经改造的D_H区的啮齿类动物中产生的抗体的核酸的细胞

当获得所需免疫应答时，收获脾细胞(和/或其它淋巴组织)并且与小鼠骨髓瘤细胞融合，以保存其活力并形成永生的杂交瘤细胞系。杂交瘤细胞系进行筛选(例如通过ELISA测定)并选择，以鉴定产生抗原特异性抗体的杂交瘤细胞系。可根据需要进一步表征杂交瘤的相对结合亲和力和同种型。使用这种技术，获得几种抗原特异性嵌合抗体(即，具有人可变结构域和啮齿类动物恒定结构域的抗体)。

编码重链和轻链可变区的DNA可被分离并连接至重链和轻链的期望同种型(恒定区)，用于制备全人抗体。此类抗体蛋白质可在细胞例如CHO细胞中产生。全人抗体然后就目的抗原的相对结合亲和力和/或中和活性进行表征。

编码抗原特异性嵌合抗体或轻链和重链的可变结构域的DNA可直接从抗原特异性淋巴细胞中分离。最初，分离具有人可变区和啮齿类动物恒定区的高亲和力嵌合抗体，并且针对期望特征(包括亲和力、选择性、表位等)进行表征且选择。用所需人恒定区替换啮齿类动物恒定区，以生成全人抗体。尽管所选恒定区可根据具体用途而变化，但高亲和力抗原结合和靶特异性特征存在于可变区中。还从抗原阳性B细胞(来自免疫小鼠)中直接分离抗原特异性抗体，而不融合至骨髓瘤细胞，如例如美国专利号7,582,298中所述，所述专利特别以引用的方式全文并入本文。使用这种方法，制备了几种全人抗原特异性抗体(即，具有人可变结构域和人恒定结构域的抗体)。

等同物

在如此地描述了本发明的至少一个实施例的若干方面后，本领域技术人员将理解，各种改变、修改和改进对于本领域技术人员来说将是容易进行的。此类改变、修改和改进旨在是本公开内容的一部分，并且旨在处于本发明的精神和范围之内。因此，上述描述和附图仅仅作为举例的方式，并且本发明通过下面的权利要求进行详细描述。

在权利要求中使用序数术语如"第一"、"第二"、"第三"等来修饰权利要求元素，其本身并不意味着一个权利要求要素相对于另一个要素的任何优先性、优先级或顺序或者其中执行方法行为的时间顺序，而是仅用作区分具有某一名称的一个权利要求元素与具有同一名称的另一个元素(但使用序数术语)的标记，以区分权利要求元素。

除非明确指出相反，否则说明书和权利要求书中的冠词“一个”和“一种”应该理解为包括复数指示物。在组的一个或多个成员之间包括"或"的权利要求或描述应当被视为是满足以下情况，即组成员中的一个、多于一个或全部存在于、被应用于给定的产品或方法中，或以其他方式与给定的产品或方法相关，除非指出相反或根据上下文明显不同。本发明包括这样的实施例，其中组中的一个确切成员存在于、被应用于给定的产品或方法中，或以其他方式与给定的产品或方法相关。本发明还包括这样的实施例，其中多于一个组成员或全部组成员存在于、被应用于给定的产品或方法中，或以其他方式与给定的产品或方法相关。此外，应当理解，本发明包括涵盖所有的变型、组合和取代，其中来自一条或多条所列权利要求的一个或多个限制、要素、子句、描述性用语被引入从属于同一基础权利要求的另一个权利要求(或者相关的任何其他权利要求)中，除非另外指出或除非对于本领域普通技术人员来说明显会引起矛盾或不一致。当要素以列表的形式(例如以马库什组或类似形式)呈现时，应当理解这些要素的每个亚组也被公开，并且任何要素可从该组中去除。应当理解，通常，当本发明或本发明的方面被称为包含特定的要素、特征等时，本发明的某些实施例或本发明的方面由此类要素、特征等组成或基本上由它们组成。为了简化的目的，这些实施例并不是在每种情况下都明确用本文陈述的那么多用词来具体描述。应当理解，本发明的任何实施例或方面可明确地从权利要求排除，不管在说明书中是否描述了此类具体排除。

本领域技术人员将理解可归因于本文中所述的测定或其他方法中获得的值的典型标准偏差或误差。

本文引用的用以描述本发明背景以及用以提供与其实施有关的其他细节的出版物、网站和其他参考材料均据此以引用方式并入。

序列表

<110> 瑞泽恩制药公司

<120> 具有包括改造的多样性簇的免疫球蛋白重链可变区的非人动物及其用途

<130> 017283.1066/10150WO01

<140> TBD

<141> 2017-01-12

<150> US 62/278,127

<151> 2016-01-13

<160> 245

<170> PatentIn version 3.5

<210> 1

<211> 150

<212> DNA

<213> 智人

<400> 1

atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60

agcttctact actatgacta cctggatgaa gtagctttca tgctctgccg gaaggatgct 120

gtggttagct ttggcaaagt tttcctgcca 150

<210> 2

<211> 50

<212> PRT

<213> 智人

<400> 2

Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp

1 5 10 15

Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala

20 25 30

Phe Met Leu Cys Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe

35 40 45

Leu Pro

50

<210> 3

<211> 15

<212> DNA

<213> 智人

<400> 3

agcttcttgt gcaag 15

<210> 4

<211> 5

<212> PRT

<213> 智人

<400> 4

Ser Phe Leu Cys Lys

1 5

<210> 5

<211> 102

<212> DNA

<213> 智人

<400> 5

caaacccatg aaaaccccaa gggagtttgg aactgccatg ccgatttcgg cgggcatggc 60

accatttgga agctcttcct ccggttccag cagaacctgc ta 102

<210> 6

<211> 34

<212> PRT

<213> 智人

<400> 6

Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Cys His Ala Asp Phe

1 5 10 15

Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg Phe Gln Gln Asn

20 25 30

Leu Leu

<210> 7

<211> 66

<212> DNA

<213> 智人

<400> 7

ctgcataccc tgctggacct gcaagtattc ggcaactgtg aggttagcca gcatctagac 60

tatgcc 66

<210> 8

<211> 22

<212> PRT

<213> 智人

<400> 8

Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Glu Val Ser

1 5 10 15

Gln His Leu Asp Tyr Ala

20

<210> 9

<211> 150

<212> DNA

<213> 智人

<400> 9

atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60

agcttctact actatgacta cctggatgaa gtagctttca tgctcagccg gaaggatgct 120

gtggttagct ttggcaaagt tttcctgcca 150

<210> 10

<211> 50

<212> PRT

<213> 智人

<400> 10

Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp

1 5 10 15

Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala

20 25 30

Phe Met Leu Ser Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe

35 40 45

Leu Pro

50

<210> 11

<211> 15

<212> DNA

<213> 智人

<400> 11

agcttcttga gcaag 15

<210> 12

<211> 5

<212> PRT

<213> 智人

<400> 12

Ser Phe Leu Ser Lys

1 5

<210> 13

<211> 102

<212> DNA

<213> 智人

<400> 13

caaacccatg aaaaccccaa gggagtttgg aacagccatg ccgatttcgg cgggcatggc 60

accatttgga agctcttcct ccggttccag cagaacctgc ta 102

<210> 14

<211> 34

<212> PRT

<213> 智人

<400> 14

Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Ser His Ala Asp Phe

1 5 10 15

Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg Phe Gln Gln Asn

20 25 30

Leu Leu

<210> 15

<211> 66

<212> DNA

<213> 智人

<400> 15

ctgcataccc tgctggacct gcaagtattc ggcaacagtg aggttagcca gcatctagac 60

tatgcc 66

<210> 16

<211> 22

<212> PRT

<213> 智人

<400> 16

Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Ser Glu Val Ser

1 5 10 15

Gln His Leu Asp Tyr Ala

20

<210> 17

<211> 135

<212> DNA

<213> 智人

<400> 17

atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60

agcttctact actatgacta cctggatgaa gtagctttca tgctctgcga ggttagccag 120

catctagact atgcc 135

<210> 18

<211> 45

<212> PRT

<213> 智人

<400> 18

Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp

1 5 10 15

Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala

20 25 30

Phe Met Leu Cys Glu Val Ser Gln His Leu Asp Tyr Ala

35 40 45

<210> 19

<211> 81

<212> DNA

<213> 智人

<400> 19

ctgcataccc tgctggacct gcaagtattc ggcaactgtc ggaaggatgc tgtggttagc 60

tttggcaaag ttttcctgcc a 81

<210> 20

<211> 27

<212> PRT

<213> 智人

<400> 20

Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Arg Lys Asp

1 5 10 15

Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro

20 25

<210> 21

<211> 78

<212> DNA

<213> 智人

<400> 21

agcttcttgt gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg 60

ttccagcaga acctgcta 78

<210> 22

<211> 26

<212> PRT

<213> 智人

<400> 22

Ser Phe Leu Cys His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys

1 5 10 15

Leu Phe Leu Arg Phe Gln Gln Asn Leu Leu

20 25

<210> 23

<211> 39

<212> DNA

<213> 智人

<400> 23

caaacccatg aaaaccccaa gggagtttgg aactgcaag 39

<210> 24

<211> 13

<212> PRT

<213> 智人

<400> 24

Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Cys Lys

1 5 10

<210> 25

<211> 135

<212> DNA

<213> 智人

<400> 25

atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60

agcttctact actatgacta cctggatgaa gtagctttca tgctcagcga ggttagccag 120

catctagact atgcc 135

<210> 26

<211> 45

<212> PRT

<213> 智人

<400> 26

Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp

1 5 10 15

Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala

20 25 30

Phe Met Leu Ser Glu Val Ser Gln His Leu Asp Tyr Ala

35 40 45

<210> 27

<211> 81

<212> DNA

<213> 智人

<400> 27

ctgcataccc tgctggacct gcaagtattc ggcaacagtc ggaaggatgc tgtggttagc 60

tttggcaaag ttttcctgcc a 81

<210> 28

<211> 27

<212> PRT

<213> 智人

<400> 28

Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Ser Arg Lys Asp

1 5 10 15

Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro

20 25

<210> 29

<211> 78

<212> DNA

<213> 智人

<400> 29

agcttcttga gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg 60

ttccagcaga acctgcta 78

<210> 30

<211> 26

<212> PRT

<213> 智人

<400> 30

Ser Phe Leu Ser His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys

1 5 10 15

Leu Phe Leu Arg Phe Gln Gln Asn Leu Leu

20 25

<210> 31

<211> 39

<212> DNA

<213> 智人

<400> 31

caaacccatg aaaaccccaa gggagtttgg aacagcaag 39

<210> 32

<211> 13

<212> PRT

<213> 智人

<400> 32

Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Ser Lys

1 5 10

<210> 33

<211> 216

<212> DNA

<213> 智人

<400> 33

atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60

agcttctact actatgacta cctggatgaa gtagctttca tgctctgccg gaaggatgct 120

gtggttagct ttggcaaagt tttcctgcca ctgcataccc tgctggacct gcaagtattc 180

ggcaactgtg aggttagcca gcatctagac tatgcc 216

<210> 34

<211> 72

<212> PRT

<213> 智人

<400> 34

Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp

1 5 10 15

Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala

20 25 30

Phe Met Leu Cys Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe

35 40 45

Leu Pro Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Glu

50 55 60

Val Ser Gln His Leu Asp Tyr Ala

65 70

<210> 35

<211> 117

<212> DNA

<213> 智人

<400> 35

agcttcttgt gcaagcaaac ccatgaaaac cccaagggag tttggaactg ccatgccgat 60

ttcggcgggc atggcaccat ttggaagctc ttcctccggt tccagcagaa cctgcta 117

<210> 36

<211> 39

<212> PRT

<213> 智人

<400> 36

Ser Phe Leu Cys Lys Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn

1 5 10 15

Cys His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu

20 25 30

Arg Phe Gln Gln Asn Leu Leu

35

<210> 37

<211> 105

<212> DNA

<213> 智人

<400> 37

atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60

agcttctact actatgacta cctggatgaa gtagctttca tgctc 105

<210> 38

<211> 35

<212> PRT

<213> 智人

<400> 38

Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp

1 5 10 15

Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala

20 25 30

Phe Met Leu

35

<210> 39

<211> 42

<212> DNA

<213> 智人

<400> 39

cggaaggatg ctgtggttag ctttggcaaa gttttcctgc ca 42

<210> 40

<211> 14

<212> PRT

<213> 智人

<400> 40

Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro

1 5 10

<210> 41

<211> 9

<212> DNA

<213> 智人

<400> 41

agcttcttg 9

<210> 42

<211> 3

<212> PRT

<213> 智人

<400> 42

Ser Phe Leu

1

<210> 43

<211> 33

<212> DNA

<213> 智人

<400> 43

caaacccatg aaaaccccaa gggagtttgg aac 33

<210> 44

<211> 11

<212> PRT

<213> 智人

<400> 44

Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn

1 5 10

<210> 45

<211> 66

<212> DNA

<213> 智人

<400> 45

catgccgatt tcggcgggca tggcaccatt tggaagctct tcctccggtt ccagcagaac 60

ctgcta 66

<210> 46

<211> 22

<212> PRT

<213> 智人

<400> 46

His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg

1 5 10 15

Phe Gln Gln Asn Leu Leu

20

<210> 47

<211> 36

<212> DNA

<213> 智人

<400> 47

ctgcataccc tgctggacct gcaagtattc ggcaac 36

<210> 48

<211> 12

<212> PRT

<213> 智人

<400> 48

Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn

1 5 10

<210> 49

<211> 27

<212> DNA

<213> 智人

<400> 49

gaggttagcc agcatctaga ctatgcc 27

<210> 50

<211> 9

<212> PRT

<213> 智人

<400> 50

Glu Val Ser Gln His Leu Asp Tyr Ala

1 5

<210> 51

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (10)..(21)

<223> n是a、c、g或t

<400> 51

acaaaaaccn nnnnnnnnnn ncacagtg 28

<210> 52

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (8)..(19)

<223> n是a、c、g或t

<400> 52

cacagtgnnn nnnnnnnnna caaaaacc 28

<210> 53

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (10)..(21)

<223> n是a、c、g或t

<400> 53

ggwtwytgwn nnnnnnnnnn ncactgtg 28

<210> 54

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (8)..(19)

<223> n是a、c、g或t

<400> 54

cacagtgnnn nnnnnnnnnb cmrmaacy 28

<210> 55

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (10)..(21)

<223> n是a、c、g或t

<400> 55

gatttttgtn nnnnnnnnnn ntactgtg 28

<210> 56

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (8)..(19)

<223> n是a、c、g或t

<400> 56

cacagtgnnn nnnnnnnnna caaaaacc 28

<210> 57

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (10)..(21)

<223> n是a、c、g或t

<400> 57

ggattttgtn nnnnnnnnnn ncactgtg 28

<210> 58

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<220>

<221> misc_feature

<222> (8)..(19)

<223> n是a、c、g或t

<400> 58

cacagtgnnn nnnnnnnnnt caaaaacc 28

<210> 59

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 59

ggattttgta cagccccgag tcactgtg 28

<210> 60

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 60

cacagtgaga aaaactgtgt caaaaacc 28

<210> 61

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 61

ggattttgta cagccccgag tcactgtg 28

<210> 62

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 62

cacagtgaga aaagcttcgt caaaaacc 28

<210> 63

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 63

ggattttgta cagccccgag tcactgtg 28

<210> 64

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 64

cacagtgaga atagctacgt caaaaacc 28

<210> 65

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 65

ggattttgta cagccccgag tcactgtg 28

<210> 66

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 66

cacagtgaga aaaactgtgt caaaaacc 28

<210> 67

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 67

ggattttgta cagccccgag tcactgtg 28

<210> 68

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 68

cacagtgaga aaagctatgt caaaaacc 28

<210> 69

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 69

ggattttgtg ggggctcgtg tcactgtg 28

<210> 70

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 70

cacagtgaca cagccccatt caaaaacc 28

<210> 71

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 71

ggattttgtg ggggctcgtg tcactgtg 28

<210> 72

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> optimized RSS

<400> 72

cacagtgaca cagccccatt caaaaacc 28

<210> 73

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 73

ggattttgtg ggggctcgtg tcactgtg 28

<210> 74

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 74

cacagtgaca cagacccatt caaaaacc 28

<210> 75

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 75

ggattttgtg ggggttcgtg tcactgtg 28

<210> 76

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 76

cacagtgaca caaccccatt caaaaacc 28

<210> 77

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 77

ggattttgtt gaggtctgtg tcactgtg 28

<210> 78

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 78

cacagtgtca cagagtccat caaaaacc 28

<210> 79

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 79

ggattttgtt gaggtctgtg tcactgtg 28

<210> 80

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 80

cacagtgtca cagagtccat caaaaacc 28

<210> 81

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 81

ggattttgtt gaggtctgtg tcactgtg 28

<210> 82

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 82

cacagtgtca cagagtccat caaaaacc 28

<210> 83

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 83

ggattttgtt gaggtctgtg tcactgtg 28

<210> 84

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 84

cacagtgtca cacggtccat caaaaacc 28

<210> 85

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 85

ggattttgtt gaggtctgtg tcactgtg 28

<210> 86

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 86

cacagtgtca cagagtccat caaaaacc 28

<210> 87

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 87

ggattttgtg aagggtcctc ccactgtg 28

<210> 88

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 88

cacagtgatg aacccagcat caaaaacc 28

<210> 89

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 89

ggattttgtg aagggccctc ccactgtg 28

<210> 90

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 90

cacagtgatg aacccagtgt caaaaacc 28

<210> 91

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 91

ggattttgtg aaggcccctc ccactgtg 28

<210> 92

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 92

cacagtgatg aaactagcat caaaaacc 28

<210> 93

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 93

ggattttgtg aagggccctc ccactgtg 28

<210> 94

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 94

cacagtgatg aaaccagcat caaaaacc 28

<210> 95

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 95

ggattttgtc agggggtgtc acactgtg 28

<210> 96

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 96

cacagtggtg ctgcccatat caaaaacc 28

<210> 97

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 97

ggattttgtc aggcgatgtc acactgtg 28

<210> 98

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 98

cacagtggtg ccgcccatat caaaaacc 28

<210> 99

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 99

ggattttgtc agggggtgtc acactgtg 28

<210> 100

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 100

cacagtggtg ctgcccatat caaaaacc 28

<210> 101

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 101

ggattttgtc agggggtgcc acactgtg 28

<210> 102

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 102

cacagtggtg ccgcccatat caaaaacc 28

<210> 103

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 103

ggattttgta ggtgtctgtg tcactgtg 28

<210> 104

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 104

cacagtgaca ctcgccaggt caaaaacc 28

<210> 105

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 105

ggattttgta ggtgtctgtg tcactgtg 28

<210> 106

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 106

cacagtgaca ctcacccagt caaaaacc 28

<210> 107

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 107

ggattttgta gctgtctgta tcactgtg 28

<210> 108

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 108

cacagtgaca ctcgccaggt caaaaacc 28

<210> 109

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 109

ggtttctgaa gctgtctgtg tcacagtc 28

<210> 110

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 110

cacaatgaca ctgggcagga cagaaacc 28

<210> 111

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 111

gggtttggct gagctgagaa ccactgtg 28

<210> 112

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 优化的RSS

<400> 112

cacagtgatt ggcagctcta caaaaacc 28

<210> 113

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 113

cacaggaaac agctatgacc 20

<210> 114

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 114

ccagtgccct agagtcaccc a 21

<210> 115

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 115

ctcccactca tgatctatag a 21

<210> 116

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 116

ctggggctcg ctttagttg 19

<210> 117

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 117

tgatagccgt tgtattcagc 20

<210> 118

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 118

ccagtgccct agagtcaccc a 21

<210> 119

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 119

gccatttctg tctgcattcg 20

<210> 120

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 120

ggttcatcat gccgtttgtg a 21

<210> 121

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 121

tgggctcgta gtttgacgtg 20

<210> 122

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 122

ttacccacac ttcacgcacg 20

<210> 123

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 123

ttaaacgacg cctcgaatg 19

<210> 124

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 124

gcaaccattc gttgtagtag 20

<210> 125

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 125

ctaacgcagt catgtaatgc 20

<210> 126

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 126

gactgtcacc cagcattac 19

<210> 127

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 127

cgtcgcctct acgggaaatc 20

<210> 128

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 128

ccagtgccct agagtcaccc a 21

<210> 129

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 129

gccatttctg tctgcattcg 20

<210> 130

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 130

aaacaccacg taggatttac gc 22

<210> 131

<211> 10213

<212> DNA

<213> 人工序列

<220>

<223> D6-DH1166

<400> 131

tacgtagccg tttcgatcct cccgaattga ctagtgggta ggcctggcgg ccgctgccat 60

ttcattacct ctttctccgc acccgacata gataccggtg gattcgaatt ctccccgttg 120

aagctgacct gcccagaggg gcctgggccc accccacaca ccggggcgga atgtgtacag 180

gccccggtct ctgtgggtgt tccgctaact ggggctccca gtgctcaccc cacaactaaa 240

gcgagcccca gcctccagag cccccgaagg agatgccgcc cacaagccca gcccccatcc 300

aggaggcccc agagctcagg gcgccggggc ggattttgta cagccccgag tcactgtgcg 360

gaaggatgct gtggttagct ttggcaaagt tttcctgcca ccacagtgag aaaaactgtg 420

tcaaaaaccg tctcctggcc cctgctggag gccgcgccag agaggggagc agccgccccg 480

aacctaggtc ctgctcagct cacacgaccc ccagcaccca gagcacaacg gagtccccat 540

tgaatggtga ggacggggac cagggctcca gggggtcatg gaaggggctg gaccccatcc 600

tactgctatg gtcccagtgc tcctggccag aactgaccct accaccgaca agagtccctc 660

agggaaacgg gggtcactgg cacctcccag catcaacccc aggcagcaca ggcataaacc 720

ccacatccag agccgactcc aggagcagag acaccccagt accctggggg acaccgaccc 780

tgatgactcc ccactggaat ccaccccaga gtccaccagg accaaagacc ccgcccctgt 840

ctctgtccct cactcaggac ctgctgcggg gcgggccatg agaccagact cgggcttagg 900

gaacaccact gtggccccaa cctcgaccag gccacaggcc cttccttcct gccctgcggc 960

agcacagact ttggggtctg tgcagagagg aatcacagag gccccaggct gaggtggtgg 1020

gggtggaaga cccccaggag gtggcccact tcccttcctc ccagctggaa cccaccatga 1080

ccttcttaag ataggggtgt catccgaggc aggtcctcca tggagctccc ttcaggctcc 1140

tccccggtcc tcactaggcc tcagtcccgg ctgcgggaat gcagccacca caggcacacc 1200

aggcagccca gacccagcca gcctgcagtg cccaagccca cattctggag cagagcaggc 1260

tgtgtctggg agagtctggg ctccccaccg cccccccgca caccccaccc acccctgtcc 1320

aggccctatg caggagggtc agagcccccc atggggtatg gacttagggt ctcactcacg 1380

tggctcccct cctgggtgaa ggggtctcat gcccagatcc ccacagcaga gctggtcaaa 1440

ggtggaggca gtggccccag ggccaccctg acctggaccc tcaggctcct ctagccctgg 1500

ctgccctgct gtccctggga ggcctggact ccaccagacc acaggtccag ggcaccgccc 1560

ataggtgctg cccacactca gttcacagga agaagataag ctccagaccc ccaagactgg 1620

gacctgcctt cctgccaccg cttgtagctc cagacctccg tgcctccccc gaccacttac 1680

acacgggcca gggagctgtt ccacaaagat caaccccaaa ccgggaccgc ctggcactcg 1740

ggccgctgcc acttccctct ccatttgttc ccagcacctc tgtgctccct ccctcctccc 1800

tccttcaggg gaacagcctg tgcagcccct ccctgcaccc cacaccctgg ggaggcccaa 1860

ccctgcctcc agccctttct cccccgctgc tcttcctgcc catccagaca accctggggt 1920

cccatccctg cagcctacac cctggtctcc acccagaccc ctgtctctcc ctccagacac 1980

ccctcccagg ccaaccctgc acatgcaggc cctccccttt tctgctgcca gagcctcagt 2040

ttctaccctc tgtgcctacc ccctgcctcc tcctgcccac aactcgagct cttcctctcc 2100

tggggcccct gagccatggc actgaccgtg cactcccacc cccacactgc ccatgccctc 2160

accttcctcc tggacactct gaccccgctc ccctcttgga cccagccctg gtatttccag 2220

gacaaaggct cacccaagtc ttccccatgc aggcccttgc cctcactgcc cggttacacg 2280

gcagcctcct gtgcacagaa gcagggagct cagcccttcc acaggcagaa ggcactgaaa 2340

gaaatcggcc tccagcaccc tgatgcacgt ccgcctgtgt ctctcactgc ccgcacctgc 2400

agggaggctc ggcactccct gtaaagacga gggatccagg cagcaacatc atgggagaat 2460

gcagggctcc cagacagccc agccctctcg caggcctctc ctgggaagag acctgcagcc 2520

accactgaac agccacggag cccgctggat agtaactgag tcagtgaccg acctggaggg 2580

caggggagca gtgaaccgga gcccagacca tagggacaga gaccagccgc tgacatcccg 2640

agcccctcac tggcggcccc agaacaccgc gtggaaacag aacagaccca cattcccacc 2700

tggaacaggg cagacactgc tgagccccca gcaccagccc tgagaaacac caggcaacgg 2760

catcagaggg ggctcctgag aaagaaagga ggggaggtct ccttcaccag caagtacttc 2820

ccttgaccaa aaacagggtc cacgcaactc ccccaggaca aaggaggagc cccctgtaca 2880

gcactgggct cagagtcctc tcccacacac cctgagtttc agacaaaaac cccctggaaa 2940

tcatagtatc agcaggagaa ctagccagag acagcaagag gggactcagt gactcccgcg 3000

gggacaggag gattttgtgg gggctcgtgt cactgtgctg cataccctgc tggacctgca 3060

agtattcggc aactgtgagg ttagccagca tctagactat gcccacagtg acacagcccc 3120

attcaaaaac ccctgctgta aacgcttcca cttctggagc tgaggggctg gggggagcgt 3180

ctgggaagta gggcctaggg gtggccatca atgcccaaaa cgcaccagac tcccccccag 3240

acatcacccc actggccagt gagcagagta aacagaaaat gagaagcagc tgggaagctt 3300

gcacaggccc caaggaaaga gctttggcgg gtgtgcaaga ggggatgcgg gcagagcctg 3360

agcagggcct tttgctgttt ctgctttcct gtgcagatag ttccataaac tggtgttcaa 3420

gatcgatggc tgggagtgag cccaggagga cagtgtggga agggcacagg gaaggagaag 3480

cagccgctat cctacactgt catctttcaa gagtttgccc tgtgcccaca atgctgcatc 3540

atgggatgct taacagctga tgtagacaca gctaaagaga gaatcagtga aatggatttg 3600

cagcacagat ctgaataaat tctccagaat gtggagccac acagaagcaa gcacaaggaa 3660

agtgcctgat gcaagggcaa agtacagtgt gtaccttcag gctgggcaca gacactctga 3720

aaagccttgg caggaactcc ctgcaacaaa gcagagccct gcaggcaatg ccagctccag 3780

agccctccct gagagcctca tgggcaaaga tgtgcacaac aggtgtttct catagcccca 3840

aactgagaat gaagcaaaca gccatctgaa ggaaaacagg caaataaacg atggcaggtt 3900

catgaaatgc aaacccagac agccagaagg acaacagtga gggttacagg tgactctgtg 3960

gttgagttca tgacaatgct gagtaattgg agtaacaaag gaaagtccaa aaaatacttt 4020

caatgtgatt tcttctaaat aaaatttaca gccggcaaaa tgaactatct tcttaaggga 4080

taaactttcc actaggaaaa ctataaggaa aatcaagaaa aggatgatca cataaacaca 4140

gtggtcgtta cttctactgg ggaaggaaga gggtatgaac tgagacacac agggttggca 4200

agtctcctaa caagaacaga acaaatacat tacagtacct tgaaaacagc agttaaaatt 4260

ctaaattgca agaagaggaa aatgcacaca gctgtgttta gaaaattctc agtccagcac 4320

tgttcataat agcaaagaca ttaacccagg ttggataaat aaacgatgac acaggcaatt 4380

gcacaatgat acagacatac attcagtata tgagacattg atgatgtatc cccaaagaaa 4440

tgactttaaa gagaaaaggc ctgatatgtg gtggcactca cctccctggg catccccgga 4500

caggctgcag gcacactgtg tggcagggca ggctggtacc tgctggcagc tcctggggcc 4560

tgatgtggag caggcacaga gccgtatccc cccgaggaca tataccccca aggacggcac 4620

agttggtaca ttccggagac aagcaactca gccacactcc caggccagag cccgagaggg 4680

acgcccatgc acagggaggc agagcccagc tcctccacag ccagcagcac ccgtgcaggg 4740

gccgccatct ggcaggcaca gagcatgggc tgggaggagg ggcagggaca ccaggcaggg 4800

ttggcaccaa ctgaaaatta cagaagtctc atacatctac ctcagccttg cctgacctgg 4860

gcctcacctg acctggacct cacctggcct ggacctcacc tggcctagac ctcacctctg 4920

ggcttcacct gagctcggcc tcacctgact tggaccttgc ctgtcctgag ctcacatgat 4980

ctgggcctca cctgacctgg gtttcacctg acctgggctt cacctgacct gggcctcatc 5040

tgacctgggc ctcactggcc tggacctcac ctggcctggg cttcacctgg cctcaggcct 5100

catctgcacc tgctccaggt cttgctggaa cctcagtagc actgaggctg caggggctca 5160

tccagggttg cagaatgact ctagaacctc ccacatctca gctttctggg tggaggcacc 5220

tggtggccca gggaatataa aaagcctgaa tgatgcctgc gtgatttggg ggcaatttat 5280

aaacccaaaa ggacatggcc atgcagcggg tagggacaat acagacagat atcagcctga 5340

aatggagcct cagggcacag gtgggcacgg acactgtcca cctaagccag gggcagaccc 5400

gagtgtcccc gcagtagacc tgagagcgct gggcccacag cctcccctcg gtgccctgct 5460

acctcctcag gtcagccctg gacatcccgg gtttccccag gcctggcggt aggattttgt 5520

tgaggtctgt gtcactgtgc atggcagcta ctgccagccc gcagccactg gctactgagg 5580

atgccgattc tgagaatagc agcttctact actatgacta cctggatgaa gtagctttca 5640

tgctctgccg gaaggatgct gtggttagct ttggcaaagt tttcctgcca ccacagtgtc 5700

acagagtcca tcaaaaaccc atccctggga accttctgcc acagccctcc ctgtggggca 5760

ccgccgcgtg ccatgttagg attttgactg aggacacagc accatgggta tggtggctac 5820

cgcagcagtg cagcccgtga cccaaacaca cagggcagca ggcacaacag acaagcccac 5880

aagtgaccac cctgagctcc tgcctgccag ccctggagac catgaaacag atggccagga 5940

ttatcccata ggtcagccag acctcagtcc aacaggtctg catcgctgct gccctccaat 6000

accagtccgg atggggacag ggctggccca cattaccatt tgctgccatc cggccaacag 6060

tcccagaagc ccctccctca aggctgggcc acatgtgtgg accctgagag ccccccatgt 6120

ctgagtaggg gcaccaggaa ggtggggctg gccctgtgca ctgtccctgc ccctgtggtc 6180

cctggcctgc ctggccctga cacctgggcc tctcctgggt catttccaag acagaagaca 6240

ttcccaggac agctggagct gggagtccat catcctgcct ggccgtcctg agtcctgcgc 6300

ctttccaaac ctcacccggg aagccaacag aggaatcacc tcccacaggc agagacaaag 6360

accttccaga aatctctgtc tctctcccca gtgggcaccc tcttccaggg cagtcctcag 6420

tgatatcaca gtgggaaccc acatctggat cgggactgcc cccagaacac aagatggccc 6480

acagggacag ccccacagcc cagcccttcc cagaccccta aaaggcgtcc caccccctgc 6540

atctgcccca gggctcaaac tccaggagga ctgactcctg cacaccctcc tgccagacat 6600

cacctcagcc cctcctggaa gggacaggag cgcgcaaggg tgagtcagac cctcctgccc 6660

tcgatggcag gcggagaaga ttcagaaagg tctgagatcc ccaggacgca gcaccactgt 6720

caatgggggc cccagacgcc tggaccaggg cctgcgtggg aaaggcctct gggcacactc 6780

agggggattt tgtgaagggt cctcccactg tgcatggcag ctactgccag cccgcagcca 6840

ctggctactg aggatgccga ttctgagaat agcagcttct actactatga ctacctggat 6900

gaagtagctt tcatgctctg ccggaaggat gctgtggtta gctttggcaa agttttcctg 6960

ccactgcata ccctgctgga cctgcaagta ttcggcaact gtgaggttag ccagcatcta 7020

gactatgccc acagtgatga acccagcatc aaaaaccgac cggactccca aggtttatgc 7080

acacttctcc gctcagagct ctccaggatc agaagagccg ggcccaaggg tttctgccca 7140

gaccctcggc ctctagggac atcttggcca tgacagccca tgggctggtg ccccacacat 7200

cgtctgcctt caaacaaggg cttcagaggg ctctgaggtg acctcactga tgaccacagg 7260

tgccctggcc ccttccccac cagctgcacc agaccccgtc atgacagatg ccccgattcc 7320

aacagccaat tcctggggcc aggaatcgct gtagacacca gcctccttcc aacacctcct 7380

gccaattgcc tggattccca tcccggttgg aatcaagagg acagcatccc ccaggctccc 7440

aacaggcagg actcccacac cctcctctga gaggccgctg tgttccgtag ggccaggctg 7500

cagacagtcc ccctcacctg ccactagaca aatgcctgct gtagatgtcc ccacctggaa 7560

aataccactc atggagcccc cagccccagg tacagctgta gagagagtct ctgaggcccc 7620

taagaagtag ccatgcccag ttctgccggg accctcggcc aggctgacag gagtggacgc 7680

tggagctggg cccatactgg gccacatagg agctcaccag tgagggcagg agagcacatg 7740

ccggggagca cccagcctcc tgctgaccag aggcccgtcc cagagcccag gaggctgcag 7800

aggcctctcc agggggacac tgtgcatgtc tggtccctga gcagcccccc acgtccccag 7860

tcctgggggc ccctggcaca gctgtctgga ccctctctat tccctgggaa gctcctcctg 7920

acagccccgc ctccagttcc aggtgtggat tttgtcaggg ggtgtcacac tgtgcagctt 7980

cttgtgcaag cacagtggtg ctgcccatat caaaaaccag gccaagtaga caggcccctg 8040

ctgtgcagcc ccaggcctcc agctcacctg cttctcctgg ggctctcaag gctgctgttt 8100

tctgcactct cccctctgtg gggagggttc cctcagtggg agatctgttc tcaacatccc 8160

acggcctcat tcctgcaagg aaggccaatg gatgggcaac ctcacatgcc gcggctaaga 8220

tagggtgggc agcctggcgg ggacaggaca tcctgctggg gtatctgtca ctgtgcctag 8280

tggggcactg gctcccaaac aacgcagtcc ttgccaaaat ccccacggcc tcccccgcta 8340

ggggctggcc tgatctcctg cagtcctagg aggctgctga cctccagaat ggctccgtcc 8400

ccagttccag ggcgagagca gatcccaggc cggctgcaga ctgggaggcc accccctcct 8460

tcccagggtt cactgcaggt gaccagggca ggaaatggcc tgaacacagg gataaccggg 8520

ccatccccca acagagtcca ccccctcctg ctctgtaccc cgcacccccc aggccagccc 8580

atgacatccg acaaccccac accagagtca ctgcccggtg ctgccctagg gaggacccct 8640

cagcccccac cctgtctaga ggactgggga ggacaggaca cgccctctcc ttatggttcc 8700

cccacctggc tctggctggg acccttgggg tgtggacaga aaggacgctt gcctgattgg 8760

cccccaggag cccagaactt ctctccaggg accccagccc gagcaccccc ttacccagga 8820

cccagccctg cccctcctcc cctctgctct cctctcatca ccccatggga atccagaatc 8880

cccaggaagc catcaggaag ggctgaggga ggaagtgggg ccactgcacc accaggcagg 8940

aggctctgtc tttgtgaacc cagggaggtg ccagcctcct agagggtatg gtccaccctg 9000

cctatggctc ccacagtggc aggctgcagg gaaggaccag ggacggtgtg ggggagggct 9060

cagggccccg cgggtgctcc atcttggatg agcctatctc tctcacccac ggactcgccc 9120

acctcctctt caccctggcc acacgtcgtc cacaccatcc taagtcccac ctacaccaga 9180

gccggcacag ccagtgcaga cagaggctgg ggtgcagggg ggccgactgg gcagcttcgg 9240

ggagggagga atggaggaag gggagttcag tgaagaggcc cccctcccct gggtccagga 9300

tcctcctctg ggacccccgg atcccatccc ctccaggctc tgggaggaga agcaggatgg 9360

gagaatctgt gcgggaccct ctcacagtgg aatacctcca cagcggctca ggccagatac 9420

aaaagcccct cagtgagccc tccactgcag tgctgggcct gggggcagcc gctcccacac 9480

aggatgaacc cagcaccccg aggatgtcct gccaggggga gctcagagcc atgaaggagc 9540

aggatatggg acccccgata caggcacaga cctcagctcc attcaggact gccacgtcct 9600

gccctgggag gaaccccttt ctctagtccc tgcaggccag gaggcagctg actcctgact 9660

tggacgccta ttccagacac cagacagagg ggcaggcccc ccagaaccag ggatgaggac 9720

gccccgtcaa ggccagaaaa gaccaagttg cgctgagccc agcaagggaa ggtccccaaa 9780

caaaccagga ggattttgta ggtgtctgtg tcactgtgca aacccatgaa aaccccaagg 9840

gagtttggaa ctgccatgcc gatttcggcg ggcatggcac catttggaag ctcttcctcc 9900

ggttccagca gaacctgcta ccacagtgac actcgccagg tcaaaaaccc catcccaagt 9960

cagcggaatg cagagagagc agggaggaca tgtttaggat ctgaggccgc acctgacacc 10020

caggccagca gacgtctcct gtccacggca ccctgccatg tcctgcattt ctggaagaac 10080

aagggcaggc tgaagggggt ccaggaccag gagatgggtc cgctctaccc agagaaggag 10140

ccaggcagga cacaagcccc cacgcgtggg ctcgtagttt gacgtgcgtg aagtgtgggt 10200

aagaaagtac gta 10213

<210> 132

<211> 9828

<212> DNA

<213> 人工序列

<220>

<223> D6-D17613

<400> 132

gcggccgctg ccatttcatt acctctttct ccgcacccga catagattac gtaacgcgtg 60

ggctcgtagt ttgacgtgcg tgaagtgtgg gtaagaaagt ccccattgag gctgacctgc 120

ccagagggtc ctgggcccac ccaacacacc ggggcggaat gtgtgcaggc ctcggtctct 180

gtgggtgttc cgctagctgg ggctcacagt gctcacccca cacctaaaac gagccacagc 240

ctccggagcc cctgaaggag accccgccca caagcccagc ccccacccag gaggccccag 300

agcacagggc gccccgtcgg attttgtaca gccccgagtc actgtgcagc ttcttgcaca 360

gtgagaaaag cttcgtcaaa aaccgtctcc tggccacagt cggaggcccc gccagagagg 420

ggagcagcca ccccaaaccc atgttctgcc ggctcccatg accccgtgca cctggagccc 480

cacggtgtcc ccactggatg ggaggacaag ggccgggggc tccggcgggt cggggcaggg 540

gcttgatggc ttccttctgc cgtggcccca ttgcccctgg ctggagttga cccttctgac 600

aagtgtcctc agagagtcag ggatcagtgg cacctcccaa catcaacccc acgcagccca 660

ggcacaaacc ccacatccag ggccaactcc aggaacagag acaccccaat accctggggg 720

accccgaccc tgatgactcc cgtcccatct ctgtccctca cttggggcct gctgcggggc 780

gagcacttgg gagcaaactc aggcttaggg gacaccactg tgggcctgac ctcgagcagg 840

ccacagaccc ttccctcctg ccctggtgca gcacagactt tggggtctgg gcagggagga 900

acttctggca ggtcaccaag cacagagccc ccaggctgag gtggccccag ggggaacccc 960

agcaggtggc ccactaccct tcctcccagc tggaccccat gtcttcccca agataggggt 1020

gccatccaag gcaggtcctc catggagccc ccttcaggct cctctccaga ccccactggg 1080

cctcagtccc cactctagga atgcagccac cacgggcaca ccaggcagcc caggcccagc 1140

caccctgcag tgcccaagcc cacaccctgg aggagagcag ggtgcgtctg ggaggggctg 1200

ggctccccac ccccaccccc acctgcacac cccacccacc cttgcccggg ccccctgcag 1260

gagggtcaga gcccccatgg gatatggact tagggtctca ctcacgcacc tcccctcctg 1320

ggagaagggg tctcatgccc agatcccccc agcagcgctg gtcacaggta gaggcagtgg 1380

ccccagggcc accctgacct ggcccctcag gctcctctag ccctggctgc cctgctgtcc 1440

ctgggaggcc tgggctccac cagaccacag gtctagggca ccgcccacac tggggccgcc 1500

cacacacagc tcacaggaag aagataagct ccagaccccc aggcccggga cctgccttgc 1560

tgctacgact tcctgcccca gacctcgttg ccctcccccg tccacttaca cacaggccag 1620

gaagctgttc ccacacagac caaccccaga cggggaccac ctggcactca ggtcactgcc 1680

atttccttct ccattcactt ccaatgcctc tgtgcttcct ccctcctcct tccttcgggg 1740

gagcaccctg tgcagctcct ccctgcagtc cacaccctgg ggagacccga ccctgcagcc 1800

cacaccctgg ggagacctga ccctcctcca gccctttctc ccccgctgct cttgccaccc 1860

accaagacag ccctggggtc ctgtccctac agcccccacc cagttctcta cctagacccg 1920

tcttcctccc tctaaacacc tctcccaggc caaccctaca cctgcaggcc ctcccctcca 1980

ctgccaaaga ccctcagttt ctcctgcctg tgcccacccc cgtgctcctc ctgcccacag 2040

ctcgagctct tcctctccta gggcccctga gggatggcat tgaccgtgcc ctcgcaccca 2100

cacactgccc atgccctcac attcctcctg gccactccag ccccactccc ctctcaggcc 2160

tggctctggt atttctggga caaagcctta cccaagtctt tcccatgcag gcctgggccc 2220

ttaccctcac tgcccggtta cagggcagcc tcctgtgcac agaagcaggg agctcagccc 2280

ttccacaggc agaaggcact gaaagaaatc ggcctccagc gccttgacac acgtctgcct 2340

gtgtctctca ctgcccgcac ctgcagggag gctcggcact ccctctaaag acgagggatc 2400

caggcagcag catcacagga gaatgcaggg ctaccagaca tcccagtcct ctcacaggcc 2460

tctcctggga agagacctga agacgcccag tcaacggagt ctaacaccaa acctccctgg 2520

aggccgatgg gtagtaacgg agtcattgcc agacctggag gcaggggagc agtgagcccg 2580

agcccacacc atagggccag aggacagcca ctgacatccc aagccactca ctggtggtcc 2640

cacaacaccc catggaaaga ggacagaccc acagtcccac ctggaccagg gcagagactg 2700

ctgagaccca gcaccagaac caaccaagaa acaccaggca acagcatcag agggggctct 2760

ggcagaacag aggaggggag gtctccttca ccagcaggcg cttcccttga ccgaagacag 2820

gatccatgca actcccccag gacaaaggag gagccccttg ttcagcactg ggctcagagt 2880

cctctccaag acacccagag tttcagacaa aaaccccctg gaatgcacag tctcagcagg 2940

agagccagcc agagccagca agatggggct cagtgacacc cgcagggaca ggaggatttt 3000

gtgggggctc gtgtcactgt gctgcatacc ctgctggacc tgcaagtatt cggcaacagt 3060

gaggttagcc agcatctaga ctatgcccac agtgacacag ccccattcaa aaacccctac 3120

tgcaaacgca ttccacttct ggggctgagg ggctggggga gcgtctggga aatagggctc 3180

aggggtgtcc atcaatgccc aaaacgcacc agactcccct ccatacatca cacccaccag 3240

ccagcgagca gagtaaacag aaaatgagaa gcaagctggg gaagcttgca caggccccaa 3300

ggaaagagct ttggcgggtg tgtaagaggg gatgcgggca gagcctgagc agggcctttt 3360

gctgtttctg ctttcctgtg cagagagttc cataaactgg tgttcgagat caatggctgg 3420

gagtgagccc aggaggacag cgtgggaaga gcacagggaa ggaggagcag ccgctatcct 3480

acactgtcat ctttcgaaag tttgccttgt gcccacactg ctgcatcatg ggatgcttaa 3540

cagctgatgt agacacagct aaagagagaa tcagtgagat ggatttgcag cacagatctg 3600

aataaattct ccagaatgtg gagcagcaca gaagcaagca cacagaaagt gcctgatgca 3660

aggacaaagt tcagtgggca ccttcaggca ttgctgctgg gcacagacac tctgaaaagc 3720

cctggcagga actccctgtg acaaagcaga accctcaggc aatgccagcc ccagagccct 3780

ccctgagagc ctcatgggca aagatgtgca caacaggtgt ttctcatagc cccaaactga 3840

gagcaaagca aacgtccatc tgaaggagaa caggcaaata aacgatggca ggttcatgaa 3900

atgcaaaccc agacagccac aagcacaaaa gtacagggtt ataagcgact ctggttgagt 3960

tcatgacaat gctgagtaat tggagtaaca aagtaaactc caaaaaatac tttcaatgtg 4020

atttcttcta aataaaattt acaccctgca aaatgaactg tcttcttaag ggatacattt 4080

cccagttaga aaaccataaa gaaaaccaag aaaaggatga tcacataaac acagtggtgg 4140

ttacttctgc tggggaagga agagggtatg aactgagata cacagggtgg gcaagtctcc 4200

taacaagaac agaacgaata cattacagta ccttgaaaac agcagttaaa cttctaaatt 4260

gcaagaagag gaaaatgcac acagttgtgt ttagaaaatt ctcagtccag cactgttcat 4320

aatagcaaag acattaaccc aggtcggata aataagcgat gacacaggca attgcacaat 4380

gatacagaca tatatttagt atatgagaca tcgatgatgt atccccaaat aaacgacttt 4440

aaagagataa agggctgatg tgtggtggca ttcacctccc tgggatcccc ggacaggttg 4500

caggctcact gtgcagcagg gcaggcgggt acctgctggc agttcctggg gcctgatgtg 4560

gagcaagcgc agggccatat atcccggagg acggcacagt cagtgaattc cagagagaag 4620

caactcagcc acactcccca ggcagagccc gagagggacg cccacgcaca gggaggcaga 4680

gcccagcacc tccgcagcca gcaccacctg cgcacgggcc accaccttgc aggcacagag 4740

tgggtgctga gaggaggggc agggacacca ggcagggtga gcacccagag aaaactgcag 4800

acgcctcaca catccacctc agcctcccct gacctggacc tcactggcct gggcctcact 4860

taacctgggc ttcacctgac cttggcctca cctgacttgg acctcgcctg tcccaagctt 4920

tacctgacct gggcctcaac tcacctgaac gtctcctgac ctgggtttaa cctgtcctgg 4980

aactcacctg gccttggctt cccctgacct ggacctcatc tggcctgggc ttcacctggc 5040

ctgggcctca cctgacctgg acctcatctg gcctggacct cacctggcct ggacttcacc 5100

tggcctgggc ttcacctgac ctggacctca cctggcctcg ggcctcacct gcacctgctc 5160

caggtcttgc tggagcctga gtagcactga gggtgcagaa gctcatccag ggttggggaa 5220

tgactctaga agtctcccac atctgacctt tctgggtgga ggcagctggt ggccctggga 5280

atataaaaat ctccagaatg atgactctgt gatttgtggg caacttatga acccgaaagg 5340

acatggccat ggggtgggta gggacatagg gacagatgcc agcctgaggt ggagcctcag 5400

gacacaggtg ggcacggaca ctatccacat aagcgaggga tagacccgag tgtccccaca 5460

gcagacctga gagcgctggg cccacagcct cccctcagag ccctgctgcc tcctccggtc 5520

agccctggac atcccaggtt tccccaggcc tggcggtagg attttgttga ggtctgtgtc 5580

actgtgcatg gcagctactg ccagcccgca gccactggct actgaggatg ccgattctga 5640

gaatagcagc ttctactact atgactacct ggatgaagta gctttcatgc tccacagtgt 5700

cacagagtcc atcaaaaacc catgcctgga agcttcccgc cacagccctc cccatggggc 5760

cctgctgcct cctcaggtca gccccggaca tcccgggttt ccccaggctg ggcggtagga 5820

ttttgttgag gtctgtgtca ctgtgccaaa cccatgaaaa ccccaaggga gtttggaaca 5880

gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg ttccagcaga 5940

acctgctacc cacagtgtca cagagtccat caaaaaccca tccctgggag cctcccgcca 6000

cagccctccc tgcaggggac cggtacgtgc catgttagga ttttgatcga ggagacagca 6060

ccatgggtat ggtggctacc acagcagtgc agcctgtgac ccaaacccgc agggcagcag 6120

gcacgatgga caggcccgtg actgaccacg ctgggctcca gcctgccagc cctggagatc 6180

atgaaacaga tggccaaggt caccctacag gtcatccaga tctggctccg aggggtctgc 6240

atcgctgctg ccctcccaac gccagtccaa atgggacagg gacggcctca cagcaccatc 6300

tgctgccatc aggccagcga tcccagaagc ccctccctca aggctgggca catgtgtgga 6360

cactgagagc cctcatatct gagtaggggc accaggaggg aggggctggc cctgtgcact 6420

gtccctgccc ctgtggtccc tggcctgcct ggccctgaca cctgagcctc tcctgggtca 6480

tttccaagac agaagacatt cctggggaca gccggagctg ggcgtcgctc atcctgcccg 6540

gccgtcctga gtcctgctca tttccagacc tcaccgggga agccaacaga ggactcgcct 6600

cccacattca gagacaaaga accttccaga aatccctgcc tctctcccca gtggacaccc 6660

tcttccagga cagtcctcag tggcatcaca gcggcctgag atccccagga cgcagcaccg 6720

ctgtcaatag gggccccaaa tgcctggacc agggcctgcg tgggaaaggc ctctggccac 6780

actcggggat tttgtgaagg gccctcccac tgtgccagct tcttgagcca tgccgatttc 6840

ggcgggcatg gcaccatttg gaagctcttc ctccggttcc agcagaacct gctaccacag 6900

tgatgaaccc agtgtcaaaa accggctgga aacccagggg ctgtgtgcac gcctcagctt 6960

ggagctctcc aggagcacaa gagccgggcc caaggatttg tgcccagacc ctcagcctct 7020

agggacacct gggtcatctc agcctgggct ggtgccctgc acaccatctt cctccaaata 7080

ggggcttcag agggctctga ggtgacctca ctcatgacca caggtgacct ggcccttccc 7140

tgccagctat accagaccct gtcttgacag atgccccgat tccaacagcc aattcctggg 7200

accctgaata gctgtagaca ccagcctcat tccagtacct cctgccaatt gcctggattc 7260

ccatcctggc tggaatcaag aaggcagcat ccgccaggct cccaacaggc aggactcccg 7320

cacaccctcc tctgagaggc cgctgtgttc cgcagggcca ggccctggac agttcccctc 7380

acctgccact agagaaacac ctgccattgt cgtccccacc tggaaaagac cactcgtgga 7440

gcccccagcc ccaggtacag ctgtagagac agtcctcgag gcccctaaga aggagccatg 7500

cccagttctg ccgggaccct cggccaggcc gacaggagtg gacgctggag ctgggcccac 7560

actgggccac ataggagctc accagtgagg gcaggagagc acatgccggg gagcacccag 7620

cctcctgctg accagaggcc cgtcccagag cccaggaggc tgcagaggcc tctccaggga 7680

gacactgtgc atgtctggta cctaagcagc cccccacgtc cccagtcctg ggggcccctg 7740

gctcagctgt ctgggccctc cctgctccct gggaagctcc tcctgacagc cccgcctcca 7800

gttccaggtg tggattttgt caggcgatgt cacactgtgc agcttcttga gcaagcacag 7860

tggtgccgcc catatcaaaa accaggccaa gtagacaggc ccctgctgcg cagccccagg 7920

catccacttc acctgcttct cctggggctc tcaaggctgc tgtctgtcct ctggccctct 7980

gtggggaggg ttccctcagt gggaggtctg tgctccaggg cagggatgat tgagatagaa 8040

atcaaaggct ggcagggaaa ggcagcttcc cgccctgaga ggtgcaggca gcaccacgga 8100

gccacggagt cacagagcca cggagccccc attgtgggca tttgagagtg ctgtgccccc 8160

ggcaggccca gccctgatgg ggaagcctgt cccatcccac agcccgggtc ccacgggcag 8220

cgggcacaga agctgccagg ttgtcctcta tgatcctcat ccctccagca gcatcccctc 8280

cacagtgggg aaactgaggc ttggagcacc acccggcccc ctggaaatga ggctgtgagc 8340

ccagacagtg ggcccagagc actgtgagta ccccggcagt acctggctgc agggatcagc 8400

cagagatgcc aaaccctgag tgaccagcct acaggaggat ccggccccac ccaggccact 8460

cgattaatgc tcaaccccct gccctggaga cctcttccag taccaccagc agctcagctt 8520

ctcagggcct catccctgca aggaaggtca agggctgggc ctgccagaaa cacagcaccc 8580

tccctagccc tggctaagac agggtgggca gacggctgtg gacgggacat attgctgggg 8640

catttctcac tgtcacttct gggtggtagc tctgacaaaa acgcagaccc tgccaaaatc 8700

cccactgcct cccgctaggg gctggcctgg aatcctgctg tcctaggagg ctgctgacct 8760

ccaggatggc tccgtcccca gttccagggc gagagcagat cccaggcagg ctgtaggctg 8820

ggaggccacc cctgcccttg ccggggttga atgcaggtgc ccaaggcagg aaatggcatg 8880

agcacaggga tgaccgggac atgccccacc agagtgcgcc ccttcctgct ctgcaccctg 8940

caccccccag gccagcccac gacgtccaac aactgggcct gggtggcagc cccacccaga 9000

caggacagac ccagcaccct gaggaggtcc tgccaggggg agctaagagc catgaaggag 9060

caagatatgg ggcccccgat acaggcacag atgtcagctc catccaggac cacccagccc 9120

acaccctgag aggaacgtct gtctccagcc tctgcaggtc gggaggcagc tgacccctga 9180

cttggacccc tattccagac accagacaga ggcgcaggcc ccccagaacc agggttgagg 9240

gacgccccgt caaagccaga caaaaccaag gggtgttgag cccagcaagg gaaggccccc 9300

aaacagacca ggaggatttt gtaggtgtct gtgtcactgt gcatggcagc tactgccagc 9360

ccgcagccac tggctactga ggatgccgat tctgagaata gcagcttcta ctactatgac 9420

tacctggatg aagtagcttt catgctcagc cggaaggatg ctgtggttag ctttggcaaa 9480

gttttcctgc cacccacagt gacactcacc cagtcaaaaa ccccattcca agtcagcgga 9540

agcagagaga gcagggagga cacgtttagg atctgagact gcacctgaca cccaggccag 9600

cagacgtctc ccctccaggg caccccaccc tgtcctgcat ttctgcaaga tcaggggcgg 9660

cctgaggggg ggtctagggt gaggagatgg gtcccctgta caccaaggag gagttaggca 9720

ggtcccgagc actcttaatt aaacgacgcc tcgaatggaa ctactacaac gaatggttgc 9780

tctacgtaat gcattcgcta ccttaggacc gttatagtta ggcgcgcc 9828

<210> 133

<211> 9894

<212> DNA

<213> 人工序列

<220>

<223> D6-DH114619

<400> 133

tacgtattaa ttaaacgacg cctcgaatgg aactactaca acgaatggtt gctctcccca 60

ttgaggctga cctgcccaga gagtcctggg cccaccccac acaccggggc ggaatgtgtg 120

caggcctcgg tctctgtggg tgttccgcta gctggggctc acagtgctca ccccacacct 180

aaaatgagcc acagcctccg gagcccccgc aggagacccc gcccacaagc ccagccccca 240

cccaggaggc cccagagctc agggcgcccc gtcggatttt gtacagcccc gagtcactgt 300

gcaaacccat gaaaacccca agggagtttg gaaccacagt gagaatagct acgtcaaaaa 360

ccgtccagtg gccactgccg gaggccccgc cagagagggc agcagccact ctgatcccat 420

gtcctgccgg ctcccatgac ccccagcacg cggagcccca cagtgtcccc actggatggg 480

aggacaagag ctggggattc cggcgggtcg gggcaggggc ttgatcgcat ccttctgccg 540

tggctccagt gcccctggct ggagttgacc cttctgacaa gtgtcctcag agagacaggc 600

atcaccggcg cctcccaaca tcaaccccag gcagcacagg cacaaacccc acatccagag 660

ccaactccag gagcagagac accccaatac cctgggggac cccgaccctg atgacttccc 720

actggaattc gccgtagagt ccaccaggac caaagaccct gcctctgcct ctgtccctca 780

ctcaggacct gctgccgggc gaggccttgg gagcagactt gggcttaggg gacaccagtg 840

tgaccccgac cttgaccagg acgcagacct ttccttcctt tcctggggca gcacagactt 900

tggggtctgg gccaggagga acttctggca ggtcgccaag cacagaggcc acaggctgag 960

gtggccctgg aaagacctcc aggaggtggc cactcccctt cctcccagct ggaccccatg 1020

tcctccccaa gataagggtg ccatccaagg caggtgctcc ttggagcccc attcagactc 1080

ctccctggac cccactgggc ctcagtccca gctctgggga tgaagccacc acaagcacac 1140

caggcagccc aggcccagcc accctgcagt gcccaagcac acactctgga gcagagcagg 1200

gtgcctctgg gaggggctga gctccccacc ccacccccac ctgcacaccc cacccacccc 1260

tgcccagcgg ctctgcagga gggtcagagc cccacatggg gtatggactt agggtctcac 1320

tcacgtggct cccatcatga gtgaaggggc ctcaagccca ggttcccaca gcagcgcctg 1380

tcgcaagtgg aggcagaggc ccgagggcca ccctgacctg gtccctgagg ttcctgcagc 1440

ccaggctgcc ctgctgtccc tgggaggcct gggctccacc agaccacagg tccagggcac 1500

cgggtgcagg agccacccac acacagctca caggaagaag ataagctcca gacccccagg 1560

gccagaacct gccttcctgc tactgcttcc tgccccagac ctgggcgccc tcccccgtcc 1620

acttacacac aggccaggaa gctgttccca cacagaacaa ccccaaacca ggaccgcctg 1680

gcactcaggt ggctgccatt tccttctcca tttgctccca gcgcctctgt cctccctggt 1740

tcctccttcg ggggaacagc ctgtgcagcc agtccctgca gcccacaccc tggggagacc 1800

caaccctgcc tggggccctt ccaaccctgc tgctcttact gcccacccag aaaactctgg 1860

ggtcctgtcc ctgcagtccc taccctggtc tccacccaga cccctgtgta tcactccaga 1920

cacccctccc aggcaaaccc tgcacctgca ggccctgtcc tcttctgtcg ctagagcctc 1980

agtttctccc ccctgtgccc acaccctacc tcctcctgcc cacaactcta actcttcttc 2040

tcctggagcc cctgagccat ggcattgacc ctgccctccc accacccaca gcccatgccc 2100

tcaccttcct cctggccact ccgaccccgc cccctctcag gccaagccct ggtatttcca 2160

ggacaaaggc tcacccaagt ctttcccagg caggcctggg ctcttgccct cacttcccgg 2220

ttacacggga gcctcctgtg cacagaagca gggagctcag cccttccaca ggcagaaggc 2280

actgaaagaa atcggcctcc agcaccttga cacacgtccg cccgtgtctc tcactgcccg 2340

cacctgcagg gaggctccgc actccctcta aagacaaggg atccaggcag cagcatcacg 2400

ggagaatgca gggctcccag acatcccagt cctctcacag gcctctcctg ggaagagacc 2460

tgcagccacc accaaacagc cacagaggct gctggatagt aactgagtca atgaccgacc 2520

tggagggcag gggagcagtg agccggagcc cataccatag ggacagagac cagccgctga 2580

catcccgagc tcctcaatgg tggccccata acacacctag gaaacataac acacccacag 2640

ccccacctgg aacagggcag agactgctga gcccccagca ccagccccaa gaaacaccag 2700

gcaacagtat cagagggggc tcccgagaaa gagaggaggg gagatctcct tcaccatcaa 2760

atgcttccct tgaccaaaaa cagggtccac gcaactcccc caggacaaag gaggagcccc 2820

ctatacagca ctgggctcag agtcctctct gagacaccct gagtttcaga caacaacccg 2880

ctggaatgca cagtctcagc aggagaacag accaaagcca gcaaaaggga cctcggtgac 2940

accagtaggg acaggaggat tttgtggggg ctcgtgtcac tgtgcaaacc catgaaaacc 3000

ccaagggagt ttggaactgc aagcacagtg acacagaccc attcaaaaac ccctactgca 3060

aacacaccca ctcctggggc tgaggggctg ggggagcgtc tgggaagtag ggtccagggg 3120

tgtctatcaa tgtccaaaat gcaccagact ccccgccaaa caccacccca ccagccagcg 3180

agcagggtaa acagaaaatg agaggctctg ggaagcttgc acaggcccca aggaaagagc 3240

tttggcgggt gtgcaagagg ggatgcaggc agagcctgag cagggccttt tgctgtttct 3300

gctttcctgt gcagagagtt ccataaactg gtgttcaaga tcagtggctg ggaatgagcc 3360

caggagggca gtctgtggga agagcacagg gaaggaggag cagccgctat cctacactgt 3420

catctttcaa aagtttgcct tgtgaccaca ctattgcatc atgggatgct taagagctga 3480

tgtagacaca gctaaagaga gaatcagtga gatgaatttg cagcatagat ctgaataaac 3540

tctccagaat gtggagcagt acagaagcaa acacacagaa agtgcctgat gcaaggacaa 3600

agttcagtgg gcaccttcag gcattgctgc tgggcacaga cactctgaaa agccttggca 3660

ggatctccct gcgacaaagc agaaccctca ggcaatgcca gccccagagc cctccctgag 3720

agcgtcatgg ggaaagatgt gcagaacagc tgattatcat agactcaaac tgagaacaga 3780

gcaaacgtcc atctgaagaa cagtcaaata agcaatggta ggttcatgca atgcaaaccc 3840

agacagccag gggacaacag tagagggcta caggcggctt tgcggttgag ttcatgacaa 3900

tgctgagtaa ttggagtaac agaggaaagc ccaaaaaata cttttaatgt gatttcttct 3960

aaataaaatt tacaccaggc aaaatgaact gtcttcttaa gggataaact ttcccctgga 4020

aaaactacaa ggaaaattaa gaaaacgatg atcacataaa cacagttgtg gttacttcta 4080

ctggggaagg aagagggtat gagctgagac acacagagtc ggcaagtctc caagcaagca 4140

cagaacgaat acattacagt accttgaata cagcagttaa acttctaaat cgcaagaaca 4200

ggaaaatgca cacagctgtg tttagaaaat tctcagtcca gcactattca taatagcaaa 4260

gacattaacc caggttggat aaataaatga tgacacaggc aattgcacaa tgatacagac 4320

atacatttag tacatgagac atcgatgatg tatccccaaa gaaatgactt taaagagaaa 4380

aggcctgatg tgtggtggca ctcacctccc tgggatcccc ggacaggttg caggcacact 4440

gtgtggcagg gcaggctggt acatgctggc agctcctggg gcctgatgtg gagcaagcgc 4500

agggctgtat acccccaagg atggcacagt cagtgaattc cagagagaag cagctcagcc 4560

acactgccca ggcagagccc gagagggacg cccacgtaca gggaggcaga gcccagctcc 4620

tccacagcca ccaccacctg tgcacgggcc accaccttgc aggcacagag tgggtgctga 4680

gaggaggggc agggacacca ggcagggtga gcacccagag aaaactgcag aagcctcaca 4740

catccacctc agcctcccct gacctggacc tcacctggtc tggacctcac ctggcctggg 4800

cctcacctga cctggacctc acctggcctg ggcttcacct gacctggacc tcacctggcc 4860

tccggcctca cctgcacctg ctccaggtct tgctggaacc tgagtagcac tgaggctgca 4920

gaagctcatc cagggttggg gaatgactct ggaactctcc cacatctgac ctttctgggt 4980

ggaggcatct ggtggccctg ggaatataaa aagccccaga atggtgcctg cgtgatttgg 5040

gggcaattta tgaacccgaa aggacatggc catggggtgg gtagggacat agggacagat 5100

gccagcctga ggtggagcct caggacacag ttggacgcgg acactatcca cataagcgag 5160

ggacagaccc gagtgttcct gcagtagacc tgagagcgct gggcccacag cctcccctcg 5220

gtgccctgct gcctcctcag gtcagccctg gacatcccgg gtttccccag gccagatggt 5280

aggattttgt tgaggtctgt gtcactgtgc atggcagcta ctgccagccc gcagccactg 5340

gctactgagg atgccgattc tgagaatagc agcttctact actatgacta cctggatgaa 5400

gtagctttca tgctctgcga ggttagccag catctagact atgcccacag tgtcacacgg 5460

tccatcaaaa acccatgcca cagccctccc cgcaggggac cgccgcgtgc catgttacga 5520

ttttgatcga ggacacagcg ccatgggtat ggtggctacc acagcagtgc agcccatgac 5580

ccaaacacac agggcagcag gcacaatgga caggcctgtg agtgaccatg ctgggctcca 5640

gcccgccagc cccggagacc atgaaacaga tggccaaggt caccccacag ttcagccaga 5700

catggctccg tggggtctgc atcgctgctg ccctctaaca ccagcccaga tggggacaag 5760

gccaacccca cattaccatc tcctgctgtc cacccagtgg tcccagaagc ccctccctca 5820

tggctgagcc acatgtgtga accctgagag caccccatgt cagagtaggg gcagcagaag 5880

ggcggggctg gccctgtgca ctgtccctgc acccatggtc cctcgcctgc ctggccctga 5940

cacctgagcc tcttctgagt catttctaag atagaagaca ttcccgggga cagccggagc 6000

tgggcgtcgc tcatcccgcc cggccgtcct gagtcctgct tgtttccaga cctcaccagg 6060

gaagccaaca gaggactcac ctcacacagt cagagacaaa gaaccttcca gaaatccctg 6120

tctcactccc cagtgggcac cttcttccag gacattcctc ggtcgcatca cagcaggcac 6180

ccacatctgg atcaggacgg cccccagaac acaagatggc ccatggggac agccccacaa 6240

cccaggcctt cccagacccc taaaaggcgt cccaccccct gcacctgccc cagggctaaa 6300

aatccaggag gcttgactcc cgcataccct ccagccagac atcacctcag ccccctcctg 6360

gaggggacag gagcccggga gggtgagtca gacccacctg ccctcgatgg caggcgggga 6420

agattcagaa aggcctgaga tccccaggac gcagcaccac tgtcaatggg ggccccagac 6480

gcctggacca gggcctgcgt gggaaaggcc gctgggcaca ctcaggggga ttttgtgaag 6540

gcccctccca ctgtgcagct tcttgtgcaa gcaaacccat gaaaacccca agggagtttg 6600

gaactgccat gccgatttcg gcgggcatgg caccatttgg aagctcttcc tccggttcca 6660

gcagaacctg ctaccacagt gatgaaacta gcatcaaaaa ccggccggac acccagggac 6720

catgcacact tctcagcttg gagctctcca ggaccagaag agtcaggtct gagggtttgt 6780

agccagaccc tcggcctcta gggacaccct ggccatcaca gcggatgggc tggtgcccca 6840

catgccatct gctccaaaca ggggcttcag agggctctga ggtgacttca ctcatgacca 6900

caggtgccct ggccccttcc ccgccagcta caccgaaccc tgtcccaaca gctgccccag 6960

ttccaacagc caattcctgg ggcccagaat tgctgtagac accagcctcg ttccagcacc 7020

tcctgccaat tgcctggatt cacatcctgg ctggaatcaa gagggcagca tccgccaggc 7080

tcccaacagg caggactccc gcacaccctc ctctgagagg ccgctgtgtt ccgcagggcc 7140

aggccctgga cagttcccct cacctgccac tagagaaaca cctgccattg tcgtccccac 7200

ctggaaaaga ccactcgtgg agcccccagc cccaggtaca gctgtagaga gactccccga 7260

gggatctaag aaggagccat gcgcagttct gccgggaccc tcggccaggc cgacaggagt 7320

ggacactgga gctgggccca cactgggcca cataggagct caccagtgag ggcaggagag 7380

cacatgccgg ggagcaccca gcctcctgct gaccagaggc ccgtcccaga gcccaggagg 7440

ctgcagaggc ctctccaggg ggacactgtg catgtctggt ccctgagcag ccccccacgt 7500

ccccagtcct gggggcccct ggcacagctg tctggaccct ccctgttccc tgggaagctc 7560

ctcctgacag ccccgcctcc agttccaggt gtggattttg tcagggggtg tcacactgtg 7620

ctgcataccc tgctggacct gcaagtattc ggcaactgtc ggaaggatgc tgtggttagc 7680

tttggcaaag ttttcctgcc accacagtgg tgctgcccat atcaaaaacc aggccaagta 7740

gacaggcccc tgctgtgcag ccccaggcct ccacttcacc tgcttctcct ggggctctca 7800

aggtcactgt tgtctgtact ctgccctctg tggggagggt tccctcagtg ggaggtctgt 7860

tctcaacatc ccagggcctc atgtctgcac ggaaggccaa tggatgggca acctcacatg 7920

ccgcggctaa gatagggtgg gcagcctggc gggggacagt acatactgct ggggtgtctg 7980

tcactgtgcc tagtggggca ctggctccca aacaacgcag tcctcgccaa aatccccaca 8040

gcctcccctg ctaggggctg gcctgatctc ctgcagtcct aggaggctgc tgacctccag 8100

aatgtctccg tccccagttc cagggcgaga gcagatccca ggccggctgc agactgggag 8160

gccaccccct ccttcccagg gttcactgga ggtgaccaag gtaggaaatg gccttaacac 8220

agggatgact gcgccatccc ccaacagagt cagccccctc ctgctctgta ccccgcaccc 8280

cccaggccag tccacgaaaa ccagggcccc acatcagagt cactgcctgg cccggccctg 8340

gggcggaccc ctcagccccc accctgtcta gaggacttgg ggggacagga cacaggccct 8400

ctccttatgg ttcccccacc tgcctccggc cgggaccctt ggggtgtgga cagaaaggac 8460

acctgcctaa ttggccccca ggaacccaga acttctctcc agggacccca gcccgagcac 8520

ccccttaccc aggacccagc cctgcccctc ctcccctctg ctctcctctc atcaccccat 8580

gggaatccgg tatccccagg aagccatcag gaagggctga aggaggaagc ggggccgtgc 8640

accaccgggc aggaggctcc gtcttcgtga acccagggaa gtgccagcct cctagagggt 8700

atggtccacc ctgcctgggg ctcccaccgt ggcaggctgc ggggaaggac cagggacggt 8760

gtgggggagg gctcagggcc ctgcgggtgc tcctccatct tcggtgagcc tcccccttca 8820

cccaccgtcc cgcccacctc ctctccaccc tggctgcacg tcttccacac catcctgagt 8880

cctacctaca ccagagccag caaagccagt gcagacaaag gctggggtgc aggggggctg 8940

ccagggcagc ttcggggagg gaaggatgga gggaggggag gtcagtgaag aggccccctt 9000

cccctgggtc caggatcctc ctctgggacc cccggatccc atcccctcct ggctctggga 9060

ggagaagcag gatgggagaa tctgtgcggg accctctcac agtggaatat ccccacagcg 9120

gctcaggcca gacccaaaag cccctcagtg agccctccac tgcagtcctg ggcctgggta 9180

gcagcccctc ccacagagga cagacccagc accccgaaga agtcctgcca gggggagctc 9240

agagccatga aagagcagga tatggggtcc ccgatacagg cacagacctc agctccatcc 9300

aggcccaccg ggacccacca tgggaggaac acctgtctcc gggttgtgag gtagctggcc 9360

tctgtctcgg accccactcc agacaccaga cagaggggca ggccccccaa aaccagggtt 9420

gagggatgat ccgtcaaggc agacaagacc aaggggcact gaccccagca agggaaggct 9480

cccaaacaga cgaggaggat tttgtagctg tctgtatcac tgtgcagctt cttgtgccat 9540

gccgatttcg gcgggcatgg caccatttgg aagctcttcc tccggttcca gcagaacctg 9600

ctaccacagt gacactcgcc aggtcaaaaa ccccgtccca agtcagcgga agcagagaga 9660

gcagggagga cacgtttagg atctgaggcc gcacctgaca cccagggcag cagacgtctc 9720

ccctccaggg caccctccac cgtcctgcgt ttcttcaaga ataggggcgg cctgaggggg 9780

tccagggcca ggcgataggt cccctctacc ccaaggagga gccaggcagg acccgagcac 9840

cgatgcatct aacgcagtca tgtaatgctg ggtgacagtc agttcgccta cgta 9894

<210> 134

<211> 11977

<212> DNA

<213> 人工序列

<220>

<223> D6-DH120126

<400> 134

tacgtaatgc atctaacgca gtcatgtaat gctgggtgac agtcagttcg cctccccatt 60

gaggctgacc tgcccagacg ggcctgggcc caccccacac accggggcgg aatgtgtgca 120

ggccccagtc tctgtgggtg ttccgctagc tggggccccc agtgctcacc ccacacctaa 180

agcgagcccc agcctccaga gccccctaag cattccccgc ccagcagccc agcccctgcc 240

cccacccagg aggccccaga gctcagggcg cctggtcgga ttttgtacag ccccgagtca 300

ctgtgcatgc cgatttcggc gggcatggca ccatttggaa gctcttcctc cggttccagc 360

agaacctgct accacagtga gaaaaactgt gtcaaaaacc gactcctggc agcagtcgga 420

ggccccgcca gagaggggag cagccggcct gaacccatgt cctgccggtt cccatgaccc 480

ccagcaccca gagccccacg gtgtccccgt tggataatga ggacaagggc tgggggctcc 540

ggtggtttgc ggcagggact tgatcacatc cttctgctgt ggccccattg cctctggctg 600

gagttgaccc ttctgacaag tgtcctcaga aagacaggga tcaccggcac ctcccaatat 660

caaccccagg cagcacagac acaaacccca catccagagc caactccagg agcagagaca 720

ccccaacact ctgggggacc ccaaccgtga taactcccca ctggaatccg ccccagagtc 780

taccaggacc aaaggccctg ccctgtctct gtccctcact cagggcctcc tgcagggcga 840

gcgcttggga gcagactcgg tcttagggga caccactgtg ggccccaact ttgatgaggc 900

cactgaccct tccttccttt cctggggcag cacagacttt ggggtctggg cagggaagaa 960

ctactggctg gtggccaatc acagagcccc caggccgagg tggccccaag aaggccctca 1020

ggaggtggcc actccacttc ctcccagctg gaccccaggt cctccccaag ataggggtgc 1080

catccaaggc aggtcctcca tggagccccc ttcagactcc tcccgggacc ccactggacc 1140

tcagtccctg ctctgggaat gcagccacca caagcacacc aggaagccca ggcccagcca 1200

ccctgcagtg ggcaagccca cactctggag cagagcaggg tgcgtctggg aggggctaac 1260

ctccccaccc cccacccccc atctgcacac agccacctac cactgcccag accctctgca 1320

ggagggccaa gccaccatgg ggtatggact tagggtctca ctcacgtgcc tcccctcctg 1380

ggagaagggg cctcatgccc agatccctgc agcactagac acagctggag gcagtggccc 1440

cagggccacc ctgacctggc atctaaggct gctccagccc agacagcact gccgttcctg 1500

ggaagcctgg gctccaccag accacaggtc cagggcacag cccacaggag ccacccacac 1560

acagctcaca ggaagaagat aagctccaga ccccagggcg ggacctgcct tcctgccacc 1620

acttacacac aggccaggga gctgttccca cacagatcaa ccccaaaccg ggactgcctg 1680

gcactagggt cactgccatt tccctctcca ttccctccca gtgcctctgt gctccctcct 1740

tctggggaac accctgtgca gcccctccct gcagcccaca cgctggggag accccaccct 1800

gcctcgggcc ttttctacct gctgcacttg ccgcccaccc aaacaaccct gggtacgtga 1860

ccctgcagtc ctcaccctga tctgcaacca gacccctgtc cctccctcta aacacccctc 1920

ccaggccaac tctgcacctg caggccctcc gctcttctgc cacaagagcc tcaggttttc 1980

ctacctgtgc ccacccccta acccctcctg cccacaactt gagttcttcc tctcctggag 2040

cccttgagcc atggcactga ccctacactc ccacccacac actgcccatg ccatcacctt 2100

cctcctggac actctgaccc cgctcccctc cctctcagac ccggccctgg tatttccagg 2160

acaaaggctc acccaagtct tccccatgca ggcccttgcc ctcactgcct ggttacacgg 2220

gagcctcctg tgcgcagaag cagggagctc agctcttcca caggcagaag gcactgaaag 2280

aaatcagcct ccagtgcctt gacacacgtc cgcctgtgtc tctcactgcc tgcacctgca 2340

gggaggctcc gcactccctc taaagatgag ggatccaggc agcaacatca cgggagaatg 2400

cagggctccc agacagccca gccctctcgc aggcctctcc tgggaagaga cctgcagcca 2460

ccactgaaca gccacggagg tcgctggata gtaaccgagt cagtgaccga cctggagggc 2520

aggggagcag tgaaccggag cccataccat agggacagag accagccgct aacatcccga 2580

gcccctcact ggcggcccca gaacaccccg tggaaagaga acagacccac agtcccacct 2640

ggaacagggc agacactgct gagcccccag caccagcccc aagaaacact aggcaacagc 2700

atcagagggg gctcctgaga aagagaggag gggaggtctc cttcaccatc aaatgcttcc 2760

cttgaccaaa aacagggtcc acgcaactcc cccaggacaa aggaggagcc ccctgtacag 2820

cactgggctc agagtcctct ctgagacagg ctcagtttca gacaacaacc cgctggaatg 2880

cacagtctca gcaggagagc caggccagag ccagcaagag gagactcggt gacaccagtc 2940

tcctgtaggg acaggaggat tttgtggggg ttcgtgtcac tgtgcaaacc catgaaaacc 3000

ccaagggagt ttggaacagc aagcacagtg acacaacccc attcaaaaac ccctactgca 3060

aacgcaccca ctcctgggac tgaggggctg ggggagcgtc tgggaagtat ggcctagggg 3120

tgtccatcaa tgcccaaaat gcaccagact ctccccaaga catcacccca ccagccagtg 3180

agcagagtaa acagaaaatg agaagcagct gggaagcttg cacaggcccc aaggaaagag 3240

ctttggcagg tgtgcaagag gggatgtggg cagagcctca gcagggcctt ttgctgtttc 3300

tgctttcctg tgcagagagt tccataaact ggtattcaag atcaatggct gggagtgagc 3360

ccaggaggac agtgtgggaa gagcacaggg aaggaggagc agccgctatc ctacactgtc 3420

atcttttgaa agtttgccct gtgcccacaa tgctgcatca tgggatgctt aacagctgat 3480

gtagacacag ctaaagagag aatcagtgaa atggatttgc agcacagatc tgaataaatc 3540

ctccagaatg tggagcagca cagaagcaag cacacagaaa gtgcctgatg ccaaggcaaa 3600

gttcagtggg caccttcagg cattgctgct gggcacagac actctgaaaa gcactggcag 3660

gaactgcctg tgacaaagca gaaccctcag gcaatgccag ccctagagcc cttcctgaga 3720

acctcatggg caaagatgtg cagaacagct gtttgtcata gccccaaact atggggctgg 3780

acaaagcaaa cgtccatctg aaggagaaca gacaaataaa cgatggcagg ttcatgaaat 3840

gcaaactagg acagccagag gacaacagta gagagctaca ggcggctttg cggttgagtt 3900

catgacaatg ctgagtaatt ggagtaacag aggaaagccc aaaaaatact tttaatgtga 3960

tttcttctaa ataaaattta cacccggcaa aatgaactat cttcttaagg gataaacttt 4020

cccctggaaa aactataagg aaaatcaaga aaacgatgat cacataaaca cagtggtggt 4080

tacttctact ggggaaggaa gagggtatga gctgagacac acagagtcgg caagtctcct 4140

aacaagaaca gaacaaatac attacagtac cttgaaaaca gcagttaaac ttctaaatcg 4200

caagaagagg aaaatgcaca cacctgtgtt tagaaaattc tcagtccagc actgttcata 4260

atagcaaaga cattaaccca ggttggataa ataagcgatg acacaggcaa ttgcacaatg 4320

atacagacat acattcagta tatgagacat cgatgatgta tccccaaaga aatgacttta 4380

aagagaaaag gcctgatgtg tggtggcaat cacctccctg ggcatccccg gacaggctgc 4440

aggctcactg tgtggcaggg caggcaggca cctgctggca gctcctgggg cctgatgtgg 4500

agcaggcaca gagctgtata tccccaagga aggtacagtc agtgcattcc agagagaagc 4560

aactcagcca cactccctgg ccagaaccca agatgcacac ccatgcacag ggaggcagag 4620

cccagcacct ccgcagccac caccacctgc gcacgggcca ccaccttgca ggcacagagt 4680

gggtgctgag aggaggggca gggacaccag gcagggtgag cacccagaga aaactgcaga 4740

agcctcacac atccctcacc tggcctgggc ttcacctgac ctggacctca cctggcctcg 4800

ggcctcacct gcacctgctc caggtcttgc tggagcctga gtagcactga ggctgtaggg 4860

actcatccag ggttggggaa tgactctgca actctcccac atctgacctt tctgggtgga 4920

ggcacctggt ggcccaggga atataaaaag ccccagaatg atgcctgtgt gatttggggg 4980

caatttatga acccgaaagg acatggccat ggggtgggta gggacagtag ggacagatgt 5040

cagcctgagg tgaagcctca ggacacaggt gggcatggac agtgtccacc taagcgaggg 5100

acagacccga gtgtccctgc agtagacctg agagcgctgg gcccacagcc tcccctcggg 5160

gccctgctgc ctcctcaggt cagccctgga catcccgggt ttccccaggc ctggcggtag 5220

gattttgttg aggtctgtgt cactgtgcat ggcagctact gccagcccgc agccactggc 5280

tactgaggat gccgattctg agaatagcag cttctactac tatgactacc tggatgaagt 5340

agctttcatg ctcagcgagg ttagccagca tctagactat gcccacagtg tcacagagtc 5400

catcaaaaac ccatgcctgg gagcctccca ccacagccct ccctgcgggg gaccgctgca 5460

tgccgtgtta ggattttgat cgaggacacg gcgccatggg tatggtggct accacagcag 5520

tgcagcccat gacccaaaca cacggggcag cagaaacaat ggacaggccc acaagtgacc 5580

atgatgggct ccagcccacc agccccagag accatgaaac agatggccaa ggtcacccta 5640

caggtcatcc agatctggct ccaaggggtc tgcatcgctg ctgccctccc aacgccaaac 5700

cagatggaga cagggccggc cccatagcac catctgctgc cgtccaccca gcagtcccgg 5760

aagcccctcc ctgaacgctg ggccacgtgt gtgaaccctg cgagcccccc atgtcagagt 5820

aggggcagca ggagggcggg gctggccctg tgcactgtca ctgcccctgt ggtccctggc 5880

ctgcctggcc ctgacacctg agcctctcct gggtcatttc caagacattc ccagggacag 5940

ccggagctgg gagtcgctca tcctgcctgg ctgtcctgag tcctgctcat ttccagacct 6000

caccagggaa gccaacagag gactcacctc acacagtcag agacaacgaa ccttccagaa 6060

atccctgttt ctctccccag tgagagaaac cctcttccag ggtttctctt ctctcccacc 6120

ctcttccagg acagtcctca gcagcatcac agcgggaacg cacatctgga tcaggacggc 6180

ccccagaaca cgcgatggcc catggggaca gcccagccct tcccagaccc ctaaaaggta 6240

tccccacctt gcacctgccc cagggctcaa actccaggag gcctgactcc tgcacaccct 6300

cctgccagat atcacctcag ccccctcctg gaggggacag gagcccggga gggtgagtca 6360

gacccacctg ccctcaatgg caggcgggga agattcagaa aggcctgaga tccccaggac 6420

gcagcaccac tgtcaatggg ggccccagac gcctggacca gggcctgtgt gggaaaggcc 6480

tctggccaca ctcaggggga ttttgtgaag ggccctccca ctgtggaggt tagccagcat 6540

ctagactatg cccacagtga tgaaaccagc atcaaaaacc gaccggactc gcagggttta 6600

tgcacacttc tcggctcgga gctctccagg agcacaagag ccaggcccga gggtttgtgc 6660

ccagaccctc ggcctctagg gacacccggg ccatcttagc cgatgggctg atgccctgca 6720

caccgtgtgc tgccaaacag gggcttcaga gggctctgag gtgacttcac tcatgaccac 6780

aggtgccctg gtcccttcac tgccagctgc accagaccct gttccgagag atgccccagt 6840

tccaaaagcc aattcctggg gccgggaatt actgtagaca ccagcctcat tccagtacct 6900

cctgccaatt gcctggattc ccatcctggc tggaatcaag agggcagcat ccgccaggct 6960

cccaacaggc aggactccca cacaccctcc tctgagaggc cgctgtgttc cgcagggcca 7020

ggccgcagac agttcccctc acctgcccat gtagaaacac ctgccattgt cgtccccacc 7080

tggcaaagac cacttgtgga gcccccagcc ccaggtacag ctgtagagag agtcctcgag 7140

gcccctaaga aggagccatg cccagttctg ccgggaccct cggccaggcc gacaggagtg 7200

gacgctggag ctgggcccac actgggccac ataggagctc accagtgagg gcaggagagc 7260

acatgccggg gagcacccag cctcctgctg accagagacc cgtcccagag cccaggaggc 7320

tgcagaggcc tctccagggg gacacagtgc atgtctggtc cctgagcagc ccccaggctc 7380

tctagcactg ggggcccctg gcacagctgt ctggaccctc cctgttccct gggaagctcc 7440

tcctgacagc cccgcctcca gttccaggtg tggattttgt cagggggtgc cacactgtgc 7500

tgcataccct gctggacctg caagtattcg gcaacagtcg gaaggatgct gtggttagct 7560

ttggcaaagt tttcctgcca ccacagtggt gccgcccata tcaaaaacca ggccaagtag 7620

acagacccct gccacgcagc cccaggcctc cagctcacct gcttctcctg gggctctcaa 7680

ggctgctgtc tgccctctgg ccctctgtgg ggagggttcc ctcagtggga ggtctgtgct 7740

ccagggcagg gatgactgag atagaaatca aaggctggca gggaaaggca gcttcccgcc 7800

ctgagaggtg caggcagcac cacagagcca tggagtcaca gagccacgga gcccccagtg 7860

tgggcgtgtg agggtgctgg gctcccggca ggcccagccc tgatggggaa gcctgccccg 7920

tcccacagcc caggtcccca ggggcagcag gcacagaagc tgccaagctg tgctctacga 7980

tcctcatccc tccagcagca tccactccac agtggggaaa ctgagccttg gagaaccacc 8040

cagccccctg gaaacaaggc ggggagccca gacagtgggc ccagagcact gtgtgtatcc 8100

tggcactagg tgcagggacc acccggagat ccccatcact gagtggccag cctgcagaag 8160

gacccaaccc caaccaggcc gcttgattaa gctccatccc cctgtcctgg gaacctcttc 8220

ccagcgccac caacagctcg gcttcccagg ccctcatccc tccaaggaag gccaaaggct 8280

gggcctgcca ggggcacagt accctccctt gccctggcta agacagggtg ggcagacggc 8340

tgcagatagg acatattgct ggggcatctt gctctgtgac tactgggtac tggctctcaa 8400

cgcagaccct accaaaatcc ccactgcctc ccctgctagg ggctggcctg gtctcctcct 8460

gctgtcctag gaggctgctg acctccagga tggcttctgt ccccagttct agggccagag 8520

cagatcccag gcaggctgta ggctgggagg ccacccctgt ccttgccgag gttcagtgca 8580

ggcacccagg acaggaaatg gcctgaacac agggatgact gtgccatgcc ctacctaagt 8640

ccgccccttt ctactctgca acccccactc cccaggtcag cccatgacga ccaacaaccc 8700

aacaccagag tcactgcctg gccctgccct ggggaggacc cctcagcccc caccctgtct 8760

agaggagttg gggggacagg acacaggctc tctccttatg gttcccccac ctggctcctg 8820

ccgggaccct tggggtgtgg acagaaagga cgcctgccta attggccccc aggaacccag 8880

aacttctctc cagggacccc agcccgagca cccccttacc caggacccag ccctgcccct 8940

cctcccctct gctctcctct catcactcca tgggaatcca gaatccccag gaagccatca 9000

ggaagggctg aaggaggaag cggggccgct gcaccaccgg gcaggaggct ccgtcttcgt 9060

gaacccaggg aagtgccagc ctcctagagg gtatggtcca ccctgcctgg ggctcccacc 9120

gtggcaggct gcggggaagg accagggacg gtgtggggga gggctcaggg ccctgcaggt 9180

gctccatctt ggatgagccc atccctctca cccaccgacc cgcccacctc ctctccaccc 9240

tggccacacg tcgtccacac catcctgagt cccacctaca ccagagccag cagagccagt 9300

gcagacagag gctggggtgc aggggggccg ccagggcagc tttggggagg gaggaatgga 9360

ggaaggggag gtcagtgaag aggcccccct cccctgggtc taggatccac ctttgggacc 9420

cccggatccc atcccctcca ggctctggga ggagaagcag gatgggagat tctgtgcagg 9480

accctctcac agtggaatac ctccacagcg gctcaggcca gatacaaaag cccctcagtg 9540

agccctccac tgcagtgcag ggcctggggg cagcccctcc cacagaggac agacccagca 9600

ccccgaagaa gtcctgccag ggggagctca gagccatgaa ggagcaagat atggggaccc 9660

caatactggc acagacctca gctccatcca ggcccaccag gacccaccat gggtggaaca 9720

cctgtctccg gcccctgctg gctgtgaggc agctggcctc tgtctcggac ccccattcca 9780

gacaccagac agagggacag gccccccaga accagtgttg agggacaccc ctgtccaggg 9840

cagccaagtc caagaggcgc gctgagccca gcaagggaag gcccccaaac aaaccaggag 9900

gtttctgaag ctgtctgtgt cacagtcggg catagccacg gctaccacaa tgacactggg 9960

caggacagaa accccatccc aagtcagccg aaggcagaga gagcaggcag gacacattta 10020

ggatctgagg ccacacctga cactcaagcc aacagatgtc tcccctccag ggcgccctgc 10080

cctgttcagt gttcctgaga aaacaggggc agcctgaggg gatccagggc caggagatgg 10140

gtcccctcta ccccgaggag gagccaggcg ggaatcccag ccccctcccc attgaggcca 10200

tcctgcccag aggggcccgg acccacccca cacacccagg cagaatgtgt gcaggcctca 10260

ggctctgtgg gtgccgctag ctggggctgc cagtcctcac cccacaccta aggtgagcca 10320

cagccgccag agcctccaca ggagacccca cccagcagcc cagcccctac ccaggaggcc 10380

ccagagctca gggcgcctgg gtggattttg tacagccccg agtcactgtg ctgcataccc 10440

tgctggacct gcaagtattc ggcaaccaca gtgagaaaag ctatgtcaaa aaccgtctcc 10500

cggccactgc tggaggccca gccagagaag ggaccagccg cccgaacata cgaccttccc 10560

agacctcatg acccccagca cttggagctc cacagtgtcc ccattggatg gtgaggatgg 10620

gggccggggc catctgcacc tcccaacatc acccccaggc agcacaggca caaaccccaa 10680

atccagagcc gacaccagga acacagacac cccaataccc tgggggaccc tggccctggt 10740

gacttcccac tgggatccac ccccgtgtcc acctggatca aagaccccac cgctgtctct 10800

gtccctcact cagggcctgc tgaggggcgg gtgctttgga gcagactcag gtttaggggc 10860

caccattgtg gggcccaacc tcgaccagga cacagatttt tctttcctgc cctggggcaa 10920

cacagacttt ggggtctgtg cagggaggac cttctggaaa gtcaccaagc acagagccct 10980

gactgaggtg gtctcaggaa gacccccagg agggggcttg tgccccttcc tctcatgtgg 11040

accccatgcc ccccaagata ggggcatcat gcagggcagg tcctccatgc agccaccact 11100

aggcaactcc ctggcgccgg tccccactgc gcctccatcc cggctctggg gatgcagcca 11160

ccatggccac accaggcagc ccgggtccag caaccctgca gtgcccaagc ccttggcagg 11220

attcccagag gctggagccc acccctcctc atccccccac acctgcacac acacacctac 11280

cccctgccca gtccccctcc aggagggttg gagccgccca tagggtgggg gctccaggtc 11340

tcactcactc gcttcccttc ctgggcaaag gagcctcgtg ccccggtccc ccctgacggc 11400

gctgggcaca ggtgtgggta ctgggcccca gggctcctcc agccccagct gccctgctct 11460

ccctgggagg cctgggcacc accagaccac cagtccaggg cacagcccca gggagccgcc 11520

cactgccagc tcacaggaag aagataagct tcagaccctc agggccggga gctgccttcc 11580

tgccacccct tcctgcccca gacctccatg ccctccccca accacttaca cacaagccag 11640

ggagctgttt ccacacagtt caaccccaaa ccaggacggc ctggcactcg ggtcactgcc 11700

atttctgtct gcattcgctc ccagcgcccc tgtgttccct ccctcctccc tccttccttt 11760

cttcctgcat tgggttcatg ccgcagagtg ccaggtgcag gtcagccctg agcttggggt 11820

cacctcctca ctgaaggcag cctcagggtg cccaggggca ggcagggtgg gggtgaggct 11880

tccagctcca accgcttcgc taccttagga ccgttatagt taggcgcgcc gtcgaccaat 11940

tctcatgttt gacagcttat catcgaattt ctacgta 11977

<210> 135

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 135

tgcggccgat cttagcc 17

<210> 136

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 136

acgagcgggt tcggcccatt c 21

<210> 137

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 137

ttgaccgatt ccttgcgg 18

<210> 138

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 138

cgggtcactg ccatttctg 19

<210> 139

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 139

tctgcattcg ctcccagcgc 20

<210> 140

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 140

tctgcggcat gaacccaat 19

<210> 141

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 141

tggccagaac tgaccctac 19

<210> 142

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 142

accgacaaga gtccctcagg 20

<210> 143

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 143

ggagtcggct ctggatgtg 19

<210> 144

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 144

ggagccaggc aggacaca 18

<210> 145

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 145

tgggctcgta gtttgacgt 19

<210> 146

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 146

gggactttct tacccacact tca 23

<210> 147

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 147

ggtcccgagc actcttaatt aaac 24

<210> 148

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 148

cctcgaatgg aactac 16

<210> 149

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 149

gggagagcaa ccattcgttg t 21

<210> 150

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 150

ccgagcaccg atgcatcta 19

<210> 151

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 151

cgcagtcatg taatgc 16

<210> 152

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 152

gggaggcgaa ctgactgtca 20

<210> 153

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 153

ggtggagagg ctattcggc 19

<210> 154

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 154

tgggcacaac agacaatcgg ctg 23

<210> 155

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 155

gaacacggcg gcatcag 17

<210> 156

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 156

cagtcccgtt gatccagcc 19

<210> 157

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 157

cccatcaggg attttgtatc tctgtggacg 30

<210> 158

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 158

ggatatgcag cactgtgcca c 21

<210> 159

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 159

tcctccaacg acaggtccc 19

<210> 160

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 160

tccctggaac tctgccccga caca 24

<210> 161

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 161

gatgaactga cgggcacagg 20

<210> 162

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 162

atcacactca tcccatcccc 20

<210> 163

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 163

cccttcccta agtaccacag agtgggctc 29

<210> 164

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 164

cacagggaag caggaactgc 20

<210> 165

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 165

gccatgcaag gccaagc 17

<210> 166

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 166

ccaggaaaat gctgccagag cctg 24

<210> 167

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 167

agttcttgag ccttagggtg ctag 24

<210> 168

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 168

ccccacagca aatcacaacc 20

<210> 169

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 169

atgcagttgt cacccttgag gccattc 27

<210> 170

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 170

tgtttcccag gcgtcactg 19

<210> 171

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 171

ctcagtgatt ctggccctgc 20

<210> 172

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 172

tgctccacag ctacaaaccc cttcctataa tg 32

<210> 173

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 173

ggatgatggc tcagcacaga g 21

<210> 174

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 174

tggtcacctc caggagcctc 20

<210> 175

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 175

agtctctgct tcccccttgt ggctatgagc 30

<210> 176

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 176

gctgcagggt gtatcaggtg c 21

<210> 177

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 177

gtgtcacagt cgggcata 18

<210> 178

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 178

ccacggctac cacaatgaca ctgg 24

<210> 179

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 179

ccttcggctg acttgggatg 20

<210> 180

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 180

gagagaagct gcaatggcag acgcggctgc agcagcagat ggagccgcga tcatagcagg 60

tgctgc 66

<210> 181

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 181

Glu Arg Ser Cys Asn Gly Arg Arg Gly Cys Ser Ser Arg Trp Ser Arg

1 5 10 15

Asp His Ser Arg Cys Cys

20

<210> 182

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 182

aggatattgt agcagcagat ggtgctatac c 31

<210> 183

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 183

Gly Tyr Cys Ser Ser Arg Trp Cys Tyr Thr

1 5 10

<210> 184

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 184

gtattacgat tgcaactgca gcagatggcg cgaccatagc aggtgctgct attatacc 58

<210> 185

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 185

Tyr Tyr Asp Cys Asn Cys Ser Arg Trp Arg Asp His Ser Arg Cys Cys

1 5 10 15

Tyr Tyr Thr

<210> 186

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 186

gagaggctta gctgtggctt ccctaagagc tgccgcagca ggcaaagcaa gcctcacaga 60

tgctgc 66

<210> 187

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 187

Glu Arg Leu Ser Cys Gly Phe Pro Lys Ser Cys Arg Ser Arg Gln Ser

1 5 10 15

Lys Pro His Arg Cys Cys

20

<210> 188

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 188

tacagccaga agtggatgtg gacttgcgat agtgagagga agtgcagtga gggtatggta 60

tgccggctgt ggtgtaagaa gaagctctgg 90

<210> 189

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 189

Tyr Ser Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Cys Ser

1 5 10 15

Glu Gly Met Val Cys Arg Leu Trp Cys Lys Lys Lys Leu Trp

20 25 30

<210> 190

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 190

agctgcaact gcagcagcaa atggagccgc gaccatagca ggtgctgc 48

<210> 191

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 191

Ser Cys Asn Cys Ser Ser Lys Trp Ser Arg Asp His Ser Arg Cys Cys

1 5 10 15

<210> 192

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 192

gagagatgca atggcagacg cggctgcagc agatggcgcg atcatagcag gtgctgc 57

<210> 193

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 193

Glu Arg Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Arg Asp His Ser

1 5 10 15

Arg Cys Cys

<210> 194

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 194

aggatattgt actaatcgga gcaggcaggg tgtatgctat acc 43

<210> 195

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 195

Gly Tyr Cys Thr Asn Arg Ser Arg Gln Gly Val Cys Tyr Thr

1 5 10

<210> 196

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 196

gtattacgat tgcaactgca gcagatgggc tcgcgaccat agcaggtgct gctattataa 60

c 61

<210> 197

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 197

Tyr Tyr Asp Cys Asn Cys Ser Arg Trp Ala Arg Asp His Ser Arg Cys

1 5 10 15

Cys Tyr Tyr Asn

20

<210> 198

<211> 76

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 198

gtattactat gagagatgca atggcagacg cggctgcagc agatggcgcg atcatagcag 60

gtgctgctat tataac 76

<210> 199

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 199

Tyr Tyr Tyr Glu Arg Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Arg

1 5 10 15

Asp His Ser Arg Cys Cys Tyr Tyr Asn

20 25

<210> 200

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 200

gagaggcttt gtggcttccc taagagctgc agcaggcaaa agcctcacag atgctgc 57

<210> 201

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 201

Glu Arg Leu Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln Lys Pro His

1 5 10 15

Arg Cys Cys

<210> 202

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 202

tactgccaga agtggatgtg gactagcgat agtgagagga agtgctgtga gggtatggta 60

agccggctgt ggtgtaagaa gaagctctgg 90

<210> 203

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 203

Tyr Cys Gln Lys Trp Met Trp Thr Ser Asp Ser Glu Arg Lys Cys Cys

1 5 10 15

Glu Gly Met Val Ser Arg Leu Trp Cys Lys Lys Lys Leu Trp

20 25 30

<210> 204

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 204

tgcaactgca gcagatggcg cgaccatagc aggtgctg 38

<210> 205

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 205

Cys Asn Cys Ser Arg Trp Arg Asp His Ser Arg Cys

1 5 10

<210> 206

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 206

gagagatgct gcaatggcag acgcggctgc agcagcagat ggtgccgcga tcatagcagg 60

tgctgc 66

<210> 207

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 207

Glu Arg Cys Cys Asn Gly Arg Arg Gly Cys Ser Ser Arg Trp Cys Arg

1 5 10 15

Asp His Ser Arg Cys Cys

20

<210> 208

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 208

aggatattgt agtggtagca gcagatgggg tagctgctac tcc 43

<210> 209

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 209

Gly Tyr Cys Ser Gly Ser Ser Arg Trp Gly Ser Cys Tyr Ser

1 5 10

<210> 210

<211> 88

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 210

gtattatgat tacgagagag cttgcaatgg cagacgcggc tgcagcagat gggctcgcga 60

tcatagcagg tgctgctatc gttatacc 88

<210> 211

<211> 29

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 211

Tyr Tyr Asp Tyr Glu Arg Ala Cys Asn Gly Arg Arg Gly Cys Ser Arg

1 5 10 15

Trp Ala Arg Asp His Ser Arg Cys Cys Tyr Arg Tyr Thr

20 25

<210> 212

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 212

gagaggcttg cttgtggctt ccctaagagc tgcagcaggc aagctaagcc tcacagatgc 60

tgc 63

<210> 213

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 213

Glu Arg Leu Ala Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln Ala Lys

1 5 10 15

Pro His Arg Cys Cys

20

<210> 214

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 214

tactgccaga agtggatgtg gacttgcgat agtgagagga agagctgtga gggtatggta 60

tgccggctgt ggagtaagaa gaagctctgg 90

<210> 215

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 215

Tyr Cys Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Ser Cys

1 5 10 15

Glu Gly Met Val Cys Arg Leu Trp Ser Lys Lys Lys Leu Trp

20 25 30

<210> 216

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 216

tgcaactgca gcagatgggc tcgcgaccat agcaggtgct g 41

<210> 217

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 217

Cys Asn Cys Ser Arg Trp Ala Arg Asp His Ser Arg Cys

1 5 10

<210> 218

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 218

gagagagctt gcaatggcag acgcggctgc agcagatggg ctcgcgatca tagcaggtgc 60

tgc 63

<210> 219

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 219

Glu Arg Ala Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Ala Arg Asp

1 5 10 15

His Ser Arg Cys Cys

20

<210> 220

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 220

agcatattgt cggagcaggc agtgctattc c 31

<210> 221

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 221

Ala Tyr Cys Arg Ser Arg Gln Cys Tyr Ser

1 5 10

<210> 222

<211> 82

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 222

gtattactat gagaggcttg cttgtggctt ccctaagagc tgcagcaggc aagctaagcc 60

tcacagatgc tgctattact ac 82

<210> 223

<211> 27

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 223

Tyr Tyr Tyr Glu Arg Leu Ala Cys Gly Phe Pro Lys Ser Cys Ser Arg

1 5 10 15

Gln Ala Lys Pro His Arg Cys Cys Tyr Tyr Tyr

20 25

<210> 224

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 224

gagaggcttt gctgtggctt ccctaagagc tgccgcagca ggcaatgcaa gcctcacaga 60

tgctgc 66

<210> 225

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 225

Glu Arg Leu Cys Cys Gly Phe Pro Lys Ser Cys Arg Ser Arg Gln Cys

1 5 10 15

Lys Pro His Arg Cys Cys

20

<210> 226

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 226

tactgccaga agtggatgtg gacttgcgat agtgagagga agtgctgtga gggtatggta 60

tgccggctgt ggtgtaagaa gaagctctgg 90

<210> 227

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 227

Tyr Cys Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Cys Cys

1 5 10 15

Glu Gly Met Val Cys Arg Leu Trp Cys Lys Lys Lys Leu Trp

20 25 30

<210> 228

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 228

tgctgcaact gcagcagcaa atggtgccgc gaccatagca ggtgctgc 48

<210> 229

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 229

Cys Cys Asn Cys Ser Ser Lys Trp Cys Arg Asp His Ser Arg Cys Cys

1 5 10 15

<210> 230

<211> 77

<212> DNA

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII核酸序列

<400> 230

ggtatagtgg ggagaggctt tgtggcttcc ctaagagctg cagcaggcaa aagcctcaca 60

gatgctgcag ctactac 77

<210> 231

<211> 25

<212> PRT

<213> 人工序列

<220>

<223> μ-芋螺毒素或狼蛛毒素ProTxII氨基酸序列

<400> 231

Tyr Ser Gly Glu Arg Leu Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln

1 5 10 15

Lys Pro His Arg Cys Cys Ser Tyr Tyr

20 25

<210> 232

<211> 9975

<212> DNA

<213> 人工序列

<220>

<223> Tx-DH1166

<400> 232

tacgtagccg tttcgatcct cccgaattga ctagtgggta ggcctggcgg ccgctgccat 60

ttcattacct ctttctccgc acccgacata gataccggtg gattcgaatt ctccccgttg 120

aagctgacct gcccagaggg gcctgggccc accccacaca ccggggcgga atgtgtacag 180

gccccggtct ctgtgggtgt tccgctaact ggggctccca gtgctcaccc cacaactaaa 240

gcgagcccca gcctccagag cccccgaagg agatgccgcc cacaagccca gcccccatcc 300

aggaggcccc agagctcagg gcgccggggc ggattttgta cagccccgag tcactgtgga 360

gagaagctgc aatggcagac gcggctgcag cagcagatgg agccgcgatc atagcaggtg 420

ctgccacagt gagaaaaact gtgtcaaaaa ccgtctcctg gcccctgctg gaggccgcgc 480

cagagagggg agcagccgcc ccgaacctag gtcctgctca gctcacacga cccccagcac 540

ccagagcaca acggagtccc cattgaatgg tgaggacggg gaccagggct ccagggggtc 600

atggaagggg ctggacccca tcctactgct atggtcccag tgctcctggc cagaactgac 660

cctaccaccg acaagagtcc ctcagggaaa cgggggtcac tggcacctcc cagcatcaac 720

cccaggcagc acaggcataa accccacatc cagagccgac tccaggagca gagacacccc 780

agtaccctgg gggacaccga ccctgatgac tccccactgg aatccacccc agagtccacc 840

aggaccaaag accccgcccc tgtctctgtc cctcactcag gacctgctgc ggggcgggcc 900

atgagaccag actcgggctt agggaacacc actgtggccc caacctcgac caggccacag 960

gcccttcctt cctgccctgc ggcagcacag actttggggt ctgtgcagag aggaatcaca 1020

gaggccccag gctgaggtgg tgggggtgga agacccccag gaggtggccc acttcccttc 1080

ctcccagctg gaacccacca tgaccttctt aagatagggg tgtcatccga ggcaggtcct 1140

ccatggagct cccttcaggc tcctccccgg tcctcactag gcctcagtcc cggctgcggg 1200

aatgcagcca ccacaggcac accaggcagc ccagacccag ccagcctgca gtgcccaagc 1260

ccacattctg gagcagagca ggctgtgtct gggagagtct gggctcccca ccgccccccc 1320

gcacacccca cccacccctg tccaggccct atgcaggagg gtcagagccc cccatggggt 1380

atggacttag ggtctcactc acgtggctcc cctcctgggt gaaggggtct catgcccaga 1440

tccccacagc agagctggtc aaaggtggag gcagtggccc cagggccacc ctgacctgga 1500

ccctcaggct cctctagccc tggctgccct gctgtccctg ggaggcctgg actccaccag 1560

accacaggtc cagggcaccg cccataggtg ctgcccacac tcagttcaca ggaagaagat 1620

aagctccaga cccccaagac tgggacctgc cttcctgcca ccgcttgtag ctccagacct 1680

ccgtgcctcc cccgaccact tacacacggg ccagggagct gttccacaaa gatcaacccc 1740

aaaccgggac cgcctggcac tcgggccgct gccacttccc tctccatttg ttcccagcac 1800

ctctgtgctc cctccctcct ccctccttca ggggaacagc ctgtgcagcc cctccctgca 1860

ccccacaccc tggggaggcc caaccctgcc tccagccctt tctcccccgc tgctcttcct 1920

gcccatccag acaaccctgg ggtcccatcc ctgcagccta caccctggtc tccacccaga 1980

cccctgtctc tccctccaga cacccctccc aggccaaccc tgcacatgca ggccctcccc 2040

ttttctgctg ccagagcctc agtttctacc ctctgtgcct accccctgcc tcctcctgcc 2100

cacaactcga gctcttcctc tcctggggcc cctgagccat ggcactgacc gtgcactccc 2160

acccccacac tgcccatgcc ctcaccttcc tcctggacac tctgaccccg ctcccctctt 2220

ggacccagcc ctggtatttc caggacaaag gctcacccaa gtcttcccca tgcaggccct 2280

tgccctcact gcccggttac acggcagcct cctgtgcaca gaagcaggga gctcagccct 2340

tccacaggca gaaggcactg aaagaaatcg gcctccagca ccctgatgca cgtccgcctg 2400

tgtctctcac tgcccgcacc tgcagggagg ctcggcactc cctgtaaaga cgagggatcc 2460

aggcagcaac atcatgggag aatgcagggc tcccagacag cccagccctc tcgcaggcct 2520

ctcctgggaa gagacctgca gccaccactg aacagccacg gagcccgctg gatagtaact 2580

gagtcagtga ccgacctgga gggcagggga gcagtgaacc ggagcccaga ccatagggac 2640

agagaccagc cgctgacatc ccgagcccct cactggcggc cccagaacac cgcgtggaaa 2700

cagaacagac ccacattccc acctggaaca gggcagacac tgctgagccc ccagcaccag 2760

ccctgagaaa caccaggcaa cggcatcaga gggggctcct gagaaagaaa ggaggggagg 2820

tctccttcac cagcaagtac ttcccttgac caaaaacagg gtccacgcaa ctcccccagg 2880

acaaaggagg agccccctgt acagcactgg gctcagagtc ctctcccaca caccctgagt 2940

ttcagacaaa aaccccctgg aaatcatagt atcagcagga gaactagcca gagacagcaa 3000

gaggggactc agtgactccc gcggggacag gaggattttg tgggggctcg tgtcactgtg 3060

aggatattgt agcagcagat ggtgctatac ccacagtgac acagccccat tcaaaaaccc 3120

ctgctgtaaa cgcttccact tctggagctg aggggctggg gggagcgtct gggaagtagg 3180

gcctaggggt ggccatcaat gcccaaaacg caccagactc ccccccagac atcaccccac 3240

tggccagtga gcagagtaaa cagaaaatga gaagcagctg ggaagcttgc acaggcccca 3300

aggaaagagc tttggcgggt gtgcaagagg ggatgcgggc agagcctgag cagggccttt 3360

tgctgtttct gctttcctgt gcagatagtt ccataaactg gtgttcaaga tcgatggctg 3420

ggagtgagcc caggaggaca gtgtgggaag ggcacaggga aggagaagca gccgctatcc 3480

tacactgtca tctttcaaga gtttgccctg tgcccacaat gctgcatcat gggatgctta 3540

acagctgatg tagacacagc taaagagaga atcagtgaaa tggatttgca gcacagatct 3600

gaataaattc tccagaatgt ggagccacac agaagcaagc acaaggaaag tgcctgatgc 3660

aagggcaaag tacagtgtgt accttcaggc tgggcacaga cactctgaaa agccttggca 3720

ggaactccct gcaacaaagc agagccctgc aggcaatgcc agctccagag ccctccctga 3780

gagcctcatg ggcaaagatg tgcacaacag gtgtttctca tagccccaaa ctgagaatga 3840

agcaaacagc catctgaagg aaaacaggca aataaacgat ggcaggttca tgaaatgcaa 3900

acccagacag ccagaaggac aacagtgagg gttacaggtg actctgtggt tgagttcatg 3960

acaatgctga gtaattggag taacaaagga aagtccaaaa aatactttca atgtgatttc 4020

ttctaaataa aatttacagc cggcaaaatg aactatcttc ttaagggata aactttccac 4080

taggaaaact ataaggaaaa tcaagaaaag gatgatcaca taaacacagt ggtcgttact 4140

tctactgggg aaggaagagg gtatgaactg agacacacag ggttggcaag tctcctaaca 4200

agaacagaac aaatacatta cagtaccttg aaaacagcag ttaaaattct aaattgcaag 4260

aagaggaaaa tgcacacagc tgtgtttaga aaattctcag tccagcactg ttcataatag 4320

caaagacatt aacccaggtt ggataaataa acgatgacac aggcaattgc acaatgatac 4380

agacatacat tcagtatatg agacattgat gatgtatccc caaagaaatg actttaaaga 4440

gaaaaggcct gatatgtggt ggcactcacc tccctgggca tccccggaca ggctgcaggc 4500

acactgtgtg gcagggcagg ctggtacctg ctggcagctc ctggggcctg atgtggagca 4560

ggcacagagc cgtatccccc cgaggacata tacccccaag gacggcacag ttggtacatt 4620

ccggagacaa gcaactcagc cacactccca ggccagagcc cgagagggac gcccatgcac 4680

agggaggcag agcccagctc ctccacagcc agcagcaccc gtgcaggggc cgccatctgg 4740

caggcacaga gcatgggctg ggaggagggg cagggacacc aggcagggtt ggcaccaact 4800

gaaaattaca gaagtctcat acatctacct cagccttgcc tgacctgggc ctcacctgac 4860

ctggacctca cctggcctgg acctcacctg gcctagacct cacctctggg cttcacctga 4920

gctcggcctc acctgacttg gaccttgcct gtcctgagct cacatgatct gggcctcacc 4980

tgacctgggt ttcacctgac ctgggcttca cctgacctgg gcctcatctg acctgggcct 5040

cactggcctg gacctcacct ggcctgggct tcacctggcc tcaggcctca tctgcacctg 5100

ctccaggtct tgctggaacc tcagtagcac tgaggctgca ggggctcatc cagggttgca 5160

gaatgactct agaacctccc acatctcagc tttctgggtg gaggcacctg gtggcccagg 5220

gaatataaaa agcctgaatg atgcctgcgt gatttggggg caatttataa acccaaaagg 5280

acatggccat gcagcgggta gggacaatac agacagatat cagcctgaaa tggagcctca 5340

gggcacaggt gggcacggac actgtccacc taagccaggg gcagacccga gtgtccccgc 5400

agtagacctg agagcgctgg gcccacagcc tcccctcggt gccctgctac ctcctcaggt 5460

cagccctgga catcccgggt ttccccaggc ctggcggtag gattttgttg aggtctgtgt 5520

cactgtggta ttacgattgc aactgcagca gatggcgcga ccatagcagg tgctgctatt 5580

atacccacag tgtcacagag tccatcaaaa acccatccct gggaaccttc tgccacagcc 5640

ctccctgtgg ggcaccgccg cgtgccatgt taggattttg actgaggaca cagcaccatg 5700

ggtatggtgg ctaccgcagc agtgcagccc gtgacccaaa cacacagggc agcaggcaca 5760

acagacaagc ccacaagtga ccaccctgag ctcctgcctg ccagccctgg agaccatgaa 5820

acagatggcc aggattatcc cataggtcag ccagacctca gtccaacagg tctgcatcgc 5880

tgctgccctc caataccagt ccggatgggg acagggctgg cccacattac catttgctgc 5940

catccggcca acagtcccag aagcccctcc ctcaaggctg ggccacatgt gtggaccctg 6000

agagcccccc atgtctgagt aggggcacca ggaaggtggg gctggccctg tgcactgtcc 6060

ctgcccctgt ggtccctggc ctgcctggcc ctgacacctg ggcctctcct gggtcatttc 6120

caagacagaa gacattccca ggacagctgg agctgggagt ccatcatcct gcctggccgt 6180

cctgagtcct gcgcctttcc aaacctcacc cgggaagcca acagaggaat cacctcccac 6240

aggcagagac aaagaccttc cagaaatctc tgtctctctc cccagtgggc accctcttcc 6300

agggcagtcc tcagtgatat cacagtggga acccacatct ggatcgggac tgcccccaga 6360

acacaagatg gcccacaggg acagccccac agcccagccc ttcccagacc cctaaaaggc 6420

gtcccacccc ctgcatctgc cccagggctc aaactccagg aggactgact cctgcacacc 6480

ctcctgccag acatcacctc agcccctcct ggaagggaca ggagcgcgca agggtgagtc 6540

agaccctcct gccctcgatg gcaggcggag aagattcaga aaggtctgag atccccagga 6600

cgcagcacca ctgtcaatgg gggccccaga cgcctggacc agggcctgcg tgggaaaggc 6660

ctctgggcac actcaggggg attttgtgaa gggtcctccc actgtggaga ggcttagctg 6720

tggcttccct aagagctgcc gcagcaggca aagcaagcct cacagatgct gccacagtga 6780

tgaacccagc atcaaaaacc gaccggactc ccaaggttta tgcacacttc tccgctcaga 6840

gctctccagg atcagaagag ccgggcccaa gggtttctgc ccagaccctc ggcctctagg 6900

gacatcttgg ccatgacagc ccatgggctg gtgccccaca catcgtctgc cttcaaacaa 6960

gggcttcaga gggctctgag gtgacctcac tgatgaccac aggtgccctg gccccttccc 7020

caccagctgc accagacccc gtcatgacag atgccccgat tccaacagcc aattcctggg 7080

gccaggaatc gctgtagaca ccagcctcct tccaacacct cctgccaatt gcctggattc 7140

ccatcccggt tggaatcaag aggacagcat cccccaggct cccaacaggc aggactccca 7200

caccctcctc tgagaggccg ctgtgttccg tagggccagg ctgcagacag tccccctcac 7260

ctgccactag acaaatgcct gctgtagatg tccccacctg gaaaatacca ctcatggagc 7320

ccccagcccc aggtacagct gtagagagag tctctgaggc ccctaagaag tagccatgcc 7380

cagttctgcc gggaccctcg gccaggctga caggagtgga cgctggagct gggcccatac 7440

tgggccacat aggagctcac cagtgagggc aggagagcac atgccgggga gcacccagcc 7500

tcctgctgac cagaggcccg tcccagagcc caggaggctg cagaggcctc tccaggggga 7560

cactgtgcat gtctggtccc tgagcagccc cccacgtccc cagtcctggg ggcccctggc 7620

acagctgtct ggaccctctc tattccctgg gaagctcctc ctgacagccc cgcctccagt 7680

tccaggtgtg gattttgtca gggggtgtca cactgtgtac agccagaagt ggatgtggac 7740

ttgcgatagt gagaggaagt gcagtgaggg tatggtatgc cggctgtggt gtaagaagaa 7800

gctctggcac agtggtgctg cccatatcaa aaaccaggcc aagtagacag gcccctgctg 7860

tgcagcccca ggcctccagc tcacctgctt ctcctggggc tctcaaggct gctgttttct 7920

gcactctccc ctctgtgggg agggttccct cagtgggaga tctgttctca acatcccacg 7980

gcctcattcc tgcaaggaag gccaatggat gggcaacctc acatgccgcg gctaagatag 8040

ggtgggcagc ctggcgggga caggacatcc tgctggggta tctgtcactg tgcctagtgg 8100

ggcactggct cccaaacaac gcagtccttg ccaaaatccc cacggcctcc cccgctaggg 8160

gctggcctga tctcctgcag tcctaggagg ctgctgacct ccagaatggc tccgtcccca 8220

gttccagggc gagagcagat cccaggccgg ctgcagactg ggaggccacc ccctccttcc 8280

cagggttcac tgcaggtgac cagggcagga aatggcctga acacagggat aaccgggcca 8340

tcccccaaca gagtccaccc cctcctgctc tgtaccccgc accccccagg ccagcccatg 8400

acatccgaca accccacacc agagtcactg cccggtgctg ccctagggag gacccctcag 8460

cccccaccct gtctagagga ctggggagga caggacacgc cctctcctta tggttccccc 8520

acctggctct ggctgggacc cttggggtgt ggacagaaag gacgcttgcc tgattggccc 8580

ccaggagccc agaacttctc tccagggacc ccagcccgag caccccctta cccaggaccc 8640

agccctgccc ctcctcccct ctgctctcct ctcatcaccc catgggaatc cagaatcccc 8700

aggaagccat caggaagggc tgagggagga agtggggcca ctgcaccacc aggcaggagg 8760

ctctgtcttt gtgaacccag ggaggtgcca gcctcctaga gggtatggtc caccctgcct 8820

atggctccca cagtggcagg ctgcagggaa ggaccaggga cggtgtgggg gagggctcag 8880

ggccccgcgg gtgctccatc ttggatgagc ctatctctct cacccacgga ctcgcccacc 8940

tcctcttcac cctggccaca cgtcgtccac accatcctaa gtcccaccta caccagagcc 9000

ggcacagcca gtgcagacag aggctggggt gcaggggggc cgactgggca gcttcgggga 9060

gggaggaatg gaggaagggg agttcagtga agaggccccc ctcccctggg tccaggatcc 9120

tcctctggga cccccggatc ccatcccctc caggctctgg gaggagaagc aggatgggag 9180

aatctgtgcg ggaccctctc acagtggaat acctccacag cggctcaggc cagatacaaa 9240

agcccctcag tgagccctcc actgcagtgc tgggcctggg ggcagccgct cccacacagg 9300

atgaacccag caccccgagg atgtcctgcc agggggagct cagagccatg aaggagcagg 9360

atatgggacc cccgatacag gcacagacct cagctccatt caggactgcc acgtcctgcc 9420

ctgggaggaa cccctttctc tagtccctgc aggccaggag gcagctgact cctgacttgg 9480

acgcctattc cagacaccag acagaggggc aggcccccca gaaccaggga tgaggacgcc 9540

ccgtcaaggc cagaaaagac caagttgcgc tgagcccagc aagggaaggt ccccaaacaa 9600

accaggagga ttttgtaggt gtctgtgtca ctgtgagctg caactgcagc agcaaatgga 9660

gccgcgacca tagcaggtgc tgccacagtg acactcgcca ggtcaaaaac cccatcccaa 9720

gtcagcggaa tgcagagaga gcagggagga catgtttagg atctgaggcc gcacctgaca 9780

cccaggccag cagacgtctc ctgtccacgg caccctgcca tgtcctgcat ttctggaaga 9840

acaagggcag gctgaagggg gtccaggacc aggagatggg tccgctctac ccagagaagg 9900

agccaggcag gacacaagcc cccacgcgtg ggctcgtagt ttgacgtgcg tgaagtgtgg 9960

gtaagaaagt acgta 9975

<210> 233

<211> 9714

<212> DNA

<213> 人工序列

<220>

<223> TxDH17613

<400> 233

gcggccgctg ccatttcatt acctctttct ccgcacccga catagattac gtaacgcgtg 60

ggctcgtagt ttgacgtgcg tgaagtgtgg gtaagaaagt ccccattgag gctgacctgc 120

ccagagggtc ctgggcccac ccaacacacc ggggcggaat gtgtgcaggc ctcggtctct 180

gtgggtgttc cgctagctgg ggctcacagt gctcacccca cacctaaaac gagccacagc 240

ctccggagcc cctgaaggag accccgccca caagcccagc ccccacccag gaggccccag 300

agcacagggc gccccgtcgg attttgtaca gccccgagtc actgtggaga gatgcaatgg 360

cagacgcggc tgcagcagat ggcgcgatca tagcaggtgc tgccacagtg agaaaagctt 420

cgtcaaaaac cgtctcctgg ccacagtcgg aggccccgcc agagagggga gcagccaccc 480

caaacccatg ttctgccggc tcccatgacc ccgtgcacct ggagccccac ggtgtcccca 540

ctggatggga ggacaagggc cgggggctcc ggcgggtcgg ggcaggggct tgatggcttc 600

cttctgccgt ggccccattg cccctggctg gagttgaccc ttctgacaag tgtcctcaga 660

gagtcaggga tcagtggcac ctcccaacat caaccccacg cagcccaggc acaaacccca 720

catccagggc caactccagg aacagagaca ccccaatacc ctgggggacc ccgaccctga 780

tgactcccgt cccatctctg tccctcactt ggggcctgct gcggggcgag cacttgggag 840

caaactcagg cttaggggac accactgtgg gcctgacctc gagcaggcca cagacccttc 900

cctcctgccc tggtgcagca cagactttgg ggtctgggca gggaggaact tctggcaggt 960

caccaagcac agagccccca ggctgaggtg gccccagggg gaaccccagc aggtggccca 1020

ctacccttcc tcccagctgg accccatgtc ttccccaaga taggggtgcc atccaaggca 1080

ggtcctccat ggagccccct tcaggctcct ctccagaccc cactgggcct cagtccccac 1140

tctaggaatg cagccaccac gggcacacca ggcagcccag gcccagccac cctgcagtgc 1200

ccaagcccac accctggagg agagcagggt gcgtctggga ggggctgggc tccccacccc 1260

cacccccacc tgcacacccc acccaccctt gcccgggccc cctgcaggag ggtcagagcc 1320

cccatgggat atggacttag ggtctcactc acgcacctcc cctcctggga gaaggggtct 1380

catgcccaga tccccccagc agcgctggtc acaggtagag gcagtggccc cagggccacc 1440

ctgacctggc ccctcaggct cctctagccc tggctgccct gctgtccctg ggaggcctgg 1500

gctccaccag accacaggtc tagggcaccg cccacactgg ggccgcccac acacagctca 1560

caggaagaag ataagctcca gacccccagg cccgggacct gccttgctgc tacgacttcc 1620

tgccccagac ctcgttgccc tcccccgtcc acttacacac aggccaggaa gctgttccca 1680

cacagaccaa ccccagacgg ggaccacctg gcactcaggt cactgccatt tccttctcca 1740

ttcacttcca atgcctctgt gcttcctccc tcctccttcc ttcgggggag caccctgtgc 1800

agctcctccc tgcagtccac accctgggga gacccgaccc tgcagcccac accctgggga 1860

gacctgaccc tcctccagcc ctttctcccc cgctgctctt gccacccacc aagacagccc 1920

tggggtcctg tccctacagc ccccacccag ttctctacct agacccgtct tcctccctct 1980

aaacacctct cccaggccaa ccctacacct gcaggccctc ccctccactg ccaaagaccc 2040

tcagtttctc ctgcctgtgc ccacccccgt gctcctcctg cccacagctc gagctcttcc 2100

tctcctaggg cccctgaggg atggcattga ccgtgccctc gcacccacac actgcccatg 2160

ccctcacatt cctcctggcc actccagccc cactcccctc tcaggcctgg ctctggtatt 2220

tctgggacaa agccttaccc aagtctttcc catgcaggcc tgggccctta ccctcactgc 2280

ccggttacag ggcagcctcc tgtgcacaga agcagggagc tcagcccttc cacaggcaga 2340

aggcactgaa agaaatcggc ctccagcgcc ttgacacacg tctgcctgtg tctctcactg 2400

cccgcacctg cagggaggct cggcactccc tctaaagacg agggatccag gcagcagcat 2460

cacaggagaa tgcagggcta ccagacatcc cagtcctctc acaggcctct cctgggaaga 2520

gacctgaaga cgcccagtca acggagtcta acaccaaacc tccctggagg ccgatgggta 2580

gtaacggagt cattgccaga cctggaggca ggggagcagt gagcccgagc ccacaccata 2640

gggccagagg acagccactg acatcccaag ccactcactg gtggtcccac aacaccccat 2700

ggaaagagga cagacccaca gtcccacctg gaccagggca gagactgctg agacccagca 2760

ccagaaccaa ccaagaaaca ccaggcaaca gcatcagagg gggctctggc agaacagagg 2820

aggggaggtc tccttcacca gcaggcgctt cccttgaccg aagacaggat ccatgcaact 2880

cccccaggac aaaggaggag ccccttgttc agcactgggc tcagagtcct ctccaagaca 2940

cccagagttt cagacaaaaa ccccctggaa tgcacagtct cagcaggaga gccagccaga 3000

gccagcaaga tggggctcag tgacacccgc agggacagga ggattttgtg ggggctcgtg 3060

tcactgtgag gatattgtac taatcggagc aggcagggtg tatgctatac ccacagtgac 3120

acagccccat tcaaaaaccc ctactgcaaa cgcattccac ttctggggct gaggggctgg 3180

gggagcgtct gggaaatagg gctcaggggt gtccatcaat gcccaaaacg caccagactc 3240

ccctccatac atcacaccca ccagccagcg agcagagtaa acagaaaatg agaagcaagc 3300

tggggaagct tgcacaggcc ccaaggaaag agctttggcg ggtgtgtaag aggggatgcg 3360

ggcagagcct gagcagggcc ttttgctgtt tctgctttcc tgtgcagaga gttccataaa 3420

ctggtgttcg agatcaatgg ctgggagtga gcccaggagg acagcgtggg aagagcacag 3480

ggaaggagga gcagccgcta tcctacactg tcatctttcg aaagtttgcc ttgtgcccac 3540

actgctgcat catgggatgc ttaacagctg atgtagacac agctaaagag agaatcagtg 3600

agatggattt gcagcacaga tctgaataaa ttctccagaa tgtggagcag cacagaagca 3660

agcacacaga aagtgcctga tgcaaggaca aagttcagtg ggcaccttca ggcattgctg 3720

ctgggcacag acactctgaa aagccctggc aggaactccc tgtgacaaag cagaaccctc 3780

aggcaatgcc agccccagag ccctccctga gagcctcatg ggcaaagatg tgcacaacag 3840

gtgtttctca tagccccaaa ctgagagcaa agcaaacgtc catctgaagg agaacaggca 3900

aataaacgat ggcaggttca tgaaatgcaa acccagacag ccacaagcac aaaagtacag 3960

ggttataagc gactctggtt gagttcatga caatgctgag taattggagt aacaaagtaa 4020

actccaaaaa atactttcaa tgtgatttct tctaaataaa atttacaccc tgcaaaatga 4080

actgtcttct taagggatac atttcccagt tagaaaacca taaagaaaac caagaaaagg 4140

atgatcacat aaacacagtg gtggttactt ctgctgggga aggaagaggg tatgaactga 4200

gatacacagg gtgggcaagt ctcctaacaa gaacagaacg aatacattac agtaccttga 4260

aaacagcagt taaacttcta aattgcaaga agaggaaaat gcacacagtt gtgtttagaa 4320

aattctcagt ccagcactgt tcataatagc aaagacatta acccaggtcg gataaataag 4380

cgatgacaca ggcaattgca caatgataca gacatatatt tagtatatga gacatcgatg 4440

atgtatcccc aaataaacga ctttaaagag ataaagggct gatgtgtggt ggcattcacc 4500

tccctgggat ccccggacag gttgcaggct cactgtgcag cagggcaggc gggtacctgc 4560

tggcagttcc tggggcctga tgtggagcaa gcgcagggcc atatatcccg gaggacggca 4620

cagtcagtga attccagaga gaagcaactc agccacactc cccaggcaga gcccgagagg 4680

gacgcccacg cacagggagg cagagcccag cacctccgca gccagcacca cctgcgcacg 4740

ggccaccacc ttgcaggcac agagtgggtg ctgagaggag gggcagggac accaggcagg 4800

gtgagcaccc agagaaaact gcagacgcct cacacatcca cctcagcctc ccctgacctg 4860

gacctcactg gcctgggcct cacttaacct gggcttcacc tgaccttggc ctcacctgac 4920

ttggacctcg cctgtcccaa gctttacctg acctgggcct caactcacct gaacgtctcc 4980

tgacctgggt ttaacctgtc ctggaactca cctggccttg gcttcccctg acctggacct 5040

catctggcct gggcttcacc tggcctgggc ctcacctgac ctggacctca tctggcctgg 5100

acctcacctg gcctggactt cacctggcct gggcttcacc tgacctggac ctcacctggc 5160

ctcgggcctc acctgcacct gctccaggtc ttgctggagc ctgagtagca ctgagggtgc 5220

agaagctcat ccagggttgg ggaatgactc tagaagtctc ccacatctga cctttctggg 5280

tggaggcagc tggtggccct gggaatataa aaatctccag aatgatgact ctgtgatttg 5340

tgggcaactt atgaacccga aaggacatgg ccatggggtg ggtagggaca tagggacaga 5400

tgccagcctg aggtggagcc tcaggacaca ggtgggcacg gacactatcc acataagcga 5460

gggatagacc cgagtgtccc cacagcagac ctgagagcgc tgggcccaca gcctcccctc 5520

agagccctgc tgcctcctcc ggtcagccct ggacatccca ggtttcccca ggcctggcgg 5580

taggattttg ttgaggtctg tgtcactgtg gtattacgat tgcaactgca gcagatgggc 5640

tcgcgaccat agcaggtgct gctattataa ccacagtgtc acagagtcca tcaaaaaccc 5700

atgcctggaa gcttcccgcc acagccctcc ccatggggcc ctgctgcctc ctcaggtcag 5760

ccccggacat cccgggtttc cccaggctgg gcggtaggat tttgttgagg tctgtgtcac 5820

tgtggtatta ctatgagaga tgcaatggca gacgcggctg cagcagatgg cgcgatcata 5880

gcaggtgctg ctattataac cacagtgtca cagagtccat caaaaaccca tccctgggag 5940

cctcccgcca cagccctccc tgcaggggac cggtacgtgc catgttagga ttttgatcga 6000

ggagacagca ccatgggtat ggtggctacc acagcagtgc agcctgtgac ccaaacccgc 6060

agggcagcag gcacgatgga caggcccgtg actgaccacg ctgggctcca gcctgccagc 6120

cctggagatc atgaaacaga tggccaaggt caccctacag gtcatccaga tctggctccg 6180

aggggtctgc atcgctgctg ccctcccaac gccagtccaa atgggacagg gacggcctca 6240

cagcaccatc tgctgccatc aggccagcga tcccagaagc ccctccctca aggctgggca 6300

catgtgtgga cactgagagc cctcatatct gagtaggggc accaggaggg aggggctggc 6360

cctgtgcact gtccctgccc ctgtggtccc tggcctgcct ggccctgaca cctgagcctc 6420

tcctgggtca tttccaagac agaagacatt cctggggaca gccggagctg ggcgtcgctc 6480

atcctgcccg gccgtcctga gtcctgctca tttccagacc tcaccgggga agccaacaga 6540

ggactcgcct cccacattca gagacaaaga accttccaga aatccctgcc tctctcccca 6600

gtggacaccc tcttccagga cagtcctcag tggcatcaca gcggcctgag atccccagga 6660

cgcagcaccg ctgtcaatag gggccccaaa tgcctggacc agggcctgcg tgggaaaggc 6720

ctctggccac actcggggat tttgtgaagg gccctcccac tgtggagagg ctttgtggct 6780

tccctaagag ctgcagcagg caaaagcctc acagatgctg ccacagtgat gaacccagtg 6840

tcaaaaaccg gctggaaacc caggggctgt gtgcacgcct cagcttggag ctctccagga 6900

gcacaagagc cgggcccaag gatttgtgcc cagaccctca gcctctaggg acacctgggt 6960

catctcagcc tgggctggtg ccctgcacac catcttcctc caaatagggg cttcagaggg 7020

ctctgaggtg acctcactca tgaccacagg tgacctggcc cttccctgcc agctatacca 7080

gaccctgtct tgacagatgc cccgattcca acagccaatt cctgggaccc tgaatagctg 7140

tagacaccag cctcattcca gtacctcctg ccaattgcct ggattcccat cctggctgga 7200

atcaagaagg cagcatccgc caggctccca acaggcagga ctcccgcaca ccctcctctg 7260

agaggccgct gtgttccgca gggccaggcc ctggacagtt cccctcacct gccactagag 7320

aaacacctgc cattgtcgtc cccacctgga aaagaccact cgtggagccc ccagccccag 7380

gtacagctgt agagacagtc ctcgaggccc ctaagaagga gccatgccca gttctgccgg 7440

gaccctcggc caggccgaca ggagtggacg ctggagctgg gcccacactg ggccacatag 7500

gagctcacca gtgagggcag gagagcacat gccggggagc acccagcctc ctgctgacca 7560

gaggcccgtc ccagagccca ggaggctgca gaggcctctc cagggagaca ctgtgcatgt 7620

ctggtaccta agcagccccc cacgtcccca gtcctggggg cccctggctc agctgtctgg 7680

gccctccctg ctccctggga agctcctcct gacagccccg cctccagttc caggtgtgga 7740

ttttgtcagg cgatgtcaca ctgtgtactg ccagaagtgg atgtggacta gcgatagtga 7800

gaggaagtgc tgtgagggta tggtaagccg gctgtggtgt aagaagaagc tctggcacag 7860

tggtgccgcc catatcaaaa accaggccaa gtagacaggc ccctgctgcg cagccccagg 7920

catccacttc acctgcttct cctggggctc tcaaggctgc tgtctgtcct ctggccctct 7980

gtggggaggg ttccctcagt gggaggtctg tgctccaggg cagggatgat tgagatagaa 8040

atcaaaggct ggcagggaaa ggcagcttcc cgccctgaga ggtgcaggca gcaccacgga 8100

gccacggagt cacagagcca cggagccccc attgtgggca tttgagagtg ctgtgccccc 8160

ggcaggccca gccctgatgg ggaagcctgt cccatcccac agcccgggtc ccacgggcag 8220

cgggcacaga agctgccagg ttgtcctcta tgatcctcat ccctccagca gcatcccctc 8280

cacagtgggg aaactgaggc ttggagcacc acccggcccc ctggaaatga ggctgtgagc 8340

ccagacagtg ggcccagagc actgtgagta ccccggcagt acctggctgc agggatcagc 8400

cagagatgcc aaaccctgag tgaccagcct acaggaggat ccggccccac ccaggccact 8460

cgattaatgc tcaaccccct gccctggaga cctcttccag taccaccagc agctcagctt 8520

ctcagggcct catccctgca aggaaggtca agggctgggc ctgccagaaa cacagcaccc 8580

tccctagccc tggctaagac agggtgggca gacggctgtg gacgggacat attgctgggg 8640

catttctcac tgtcacttct gggtggtagc tctgacaaaa acgcagaccc tgccaaaatc 8700

cccactgcct cccgctaggg gctggcctgg aatcctgctg tcctaggagg ctgctgacct 8760

ccaggatggc tccgtcccca gttccagggc gagagcagat cccaggcagg ctgtaggctg 8820

ggaggccacc cctgcccttg ccggggttga atgcaggtgc ccaaggcagg aaatggcatg 8880

agcacaggga tgaccgggac atgccccacc agagtgcgcc ccttcctgct ctgcaccctg 8940

caccccccag gccagcccac gacgtccaac aactgggcct gggtggcagc cccacccaga 9000

caggacagac ccagcaccct gaggaggtcc tgccaggggg agctaagagc catgaaggag 9060

caagatatgg ggcccccgat acaggcacag atgtcagctc catccaggac cacccagccc 9120

acaccctgag aggaacgtct gtctccagcc tctgcaggtc gggaggcagc tgacccctga 9180

cttggacccc tattccagac accagacaga ggcgcaggcc ccccagaacc agggttgagg 9240

gacgccccgt caaagccaga caaaaccaag gggtgttgag cccagcaagg gaaggccccc 9300

aaacagacca ggaggatttt gtaggtgtct gtgtcactgt gtgcaactgc agcagatggc 9360

gcgaccatag caggtgctgc cacagtgaca ctcacccagt caaaaacccc attccaagtc 9420

agcggaagca gagagagcag ggaggacacg tttaggatct gagactgcac ctgacaccca 9480

ggccagcaga cgtctcccct ccagggcacc ccaccctgtc ctgcatttct gcaagatcag 9540

gggcggcctg agggggggtc tagggtgagg agatgggtcc cctgtacacc aaggaggagt 9600

taggcaggtc ccgagcactc ttaattaaac gacgcctcga atggaactac tacaacgaat 9660

ggttgctcta cgtaatgcat tcgctacctt aggaccgtta tagttaggcg cgcc 9714

<210> 234

<211> 9797

<212> DNA

<213> 人工序列

<220>

<223> TxDH114619

<400> 234

tacgtattaa ttaaacgacg cctcgaatgg aactactaca acgaatggtt gctctcccca 60

ttgaggctga cctgcccaga gagtcctggg cccaccccac acaccggggc ggaatgtgtg 120

caggcctcgg tctctgtggg tgttccgcta gctggggctc acagtgctca ccccacacct 180

aaaatgagcc acagcctccg gagcccccgc aggagacccc gcccacaagc ccagccccca 240

cccaggaggc cccagagctc agggcgcccc gtcggatttt gtacagcccc gagtcactgt 300

ggagagatgc tgcaatggca gacgcggctg cagcagcaga tggtgccgcg atcatagcag 360

gtgctgccac agtgagaata gctacgtcaa aaaccgtcca gtggccactg ccggaggccc 420

cgccagagag ggcagcagcc actctgatcc catgtcctgc cggctcccat gacccccagc 480

acgcggagcc ccacagtgtc cccactggat gggaggacaa gagctgggga ttccggcggg 540

tcggggcagg ggcttgatcg catccttctg ccgtggctcc agtgcccctg gctggagttg 600

acccttctga caagtgtcct cagagagaca ggcatcaccg gcgcctccca acatcaaccc 660

caggcagcac aggcacaaac cccacatcca gagccaactc caggagcaga gacaccccaa 720

taccctgggg gaccccgacc ctgatgactt cccactggaa ttcgccgtag agtccaccag 780

gaccaaagac cctgcctctg cctctgtccc tcactcagga cctgctgccg ggcgaggcct 840

tgggagcaga cttgggctta ggggacacca gtgtgacccc gaccttgacc aggacgcaga 900

cctttccttc ctttcctggg gcagcacaga ctttggggtc tgggccagga ggaacttctg 960

gcaggtcgcc aagcacagag gccacaggct gaggtggccc tggaaagacc tccaggaggt 1020

ggccactccc cttcctccca gctggacccc atgtcctccc caagataagg gtgccatcca 1080

aggcaggtgc tccttggagc cccattcaga ctcctccctg gaccccactg ggcctcagtc 1140

ccagctctgg ggatgaagcc accacaagca caccaggcag cccaggccca gccaccctgc 1200

agtgcccaag cacacactct ggagcagagc agggtgcctc tgggaggggc tgagctcccc 1260

accccacccc cacctgcaca ccccacccac ccctgcccag cggctctgca ggagggtcag 1320

agccccacat ggggtatgga cttagggtct cactcacgtg gctcccatca tgagtgaagg 1380

ggcctcaagc ccaggttccc acagcagcgc ctgtcgcaag tggaggcaga ggcccgaggg 1440

ccaccctgac ctggtccctg aggttcctgc agcccaggct gccctgctgt ccctgggagg 1500

cctgggctcc accagaccac aggtccaggg caccgggtgc aggagccacc cacacacagc 1560

tcacaggaag aagataagct ccagaccccc agggccagaa cctgccttcc tgctactgct 1620

tcctgcccca gacctgggcg ccctcccccg tccacttaca cacaggccag gaagctgttc 1680

ccacacagaa caaccccaaa ccaggaccgc ctggcactca ggtggctgcc atttccttct 1740

ccatttgctc ccagcgcctc tgtcctccct ggttcctcct tcgggggaac agcctgtgca 1800

gccagtccct gcagcccaca ccctggggag acccaaccct gcctggggcc cttccaaccc 1860

tgctgctctt actgcccacc cagaaaactc tggggtcctg tccctgcagt ccctaccctg 1920

gtctccaccc agacccctgt gtatcactcc agacacccct cccaggcaaa ccctgcacct 1980

gcaggccctg tcctcttctg tcgctagagc ctcagtttct cccccctgtg cccacaccct 2040

acctcctcct gcccacaact ctaactcttc ttctcctgga gcccctgagc catggcattg 2100

accctgccct cccaccaccc acagcccatg ccctcacctt cctcctggcc actccgaccc 2160

cgccccctct caggccaagc cctggtattt ccaggacaaa ggctcaccca agtctttccc 2220

aggcaggcct gggctcttgc cctcacttcc cggttacacg ggagcctcct gtgcacagaa 2280

gcagggagct cagcccttcc acaggcagaa ggcactgaaa gaaatcggcc tccagcacct 2340

tgacacacgt ccgcccgtgt ctctcactgc ccgcacctgc agggaggctc cgcactccct 2400

ctaaagacaa gggatccagg cagcagcatc acgggagaat gcagggctcc cagacatccc 2460

agtcctctca caggcctctc ctgggaagag acctgcagcc accaccaaac agccacagag 2520

gctgctggat agtaactgag tcaatgaccg acctggaggg caggggagca gtgagccgga 2580

gcccatacca tagggacaga gaccagccgc tgacatcccg agctcctcaa tggtggcccc 2640

ataacacacc taggaaacat aacacaccca cagccccacc tggaacaggg cagagactgc 2700

tgagccccca gcaccagccc caagaaacac caggcaacag tatcagaggg ggctcccgag 2760

aaagagagga ggggagatct ccttcaccat caaatgcttc ccttgaccaa aaacagggtc 2820

cacgcaactc ccccaggaca aaggaggagc cccctataca gcactgggct cagagtcctc 2880

tctgagacac cctgagtttc agacaacaac ccgctggaat gcacagtctc agcaggagaa 2940

cagaccaaag ccagcaaaag ggacctcggt gacaccagta gggacaggag gattttgtgg 3000

gggctcgtgt cactgtgagg atattgtagt ggtagcagca gatggggtag ctgctactcc 3060

cacagtgaca cagacccatt caaaaacccc tactgcaaac acacccactc ctggggctga 3120

ggggctgggg gagcgtctgg gaagtagggt ccaggggtgt ctatcaatgt ccaaaatgca 3180

ccagactccc cgccaaacac caccccacca gccagcgagc agggtaaaca gaaaatgaga 3240

ggctctggga agcttgcaca ggccccaagg aaagagcttt ggcgggtgtg caagagggga 3300

tgcaggcaga gcctgagcag ggccttttgc tgtttctgct ttcctgtgca gagagttcca 3360

taaactggtg ttcaagatca gtggctggga atgagcccag gagggcagtc tgtgggaaga 3420

gcacagggaa ggaggagcag ccgctatcct acactgtcat ctttcaaaag tttgccttgt 3480

gaccacacta ttgcatcatg ggatgcttaa gagctgatgt agacacagct aaagagagaa 3540

tcagtgagat gaatttgcag catagatctg aataaactct ccagaatgtg gagcagtaca 3600

gaagcaaaca cacagaaagt gcctgatgca aggacaaagt tcagtgggca ccttcaggca 3660

ttgctgctgg gcacagacac tctgaaaagc cttggcagga tctccctgcg acaaagcaga 3720

accctcaggc aatgccagcc ccagagccct ccctgagagc gtcatgggga aagatgtgca 3780

gaacagctga ttatcataga ctcaaactga gaacagagca aacgtccatc tgaagaacag 3840

tcaaataagc aatggtaggt tcatgcaatg caaacccaga cagccagggg acaacagtag 3900

agggctacag gcggctttgc ggttgagttc atgacaatgc tgagtaattg gagtaacaga 3960

ggaaagccca aaaaatactt ttaatgtgat ttcttctaaa taaaatttac accaggcaaa 4020

atgaactgtc ttcttaaggg ataaactttc ccctggaaaa actacaagga aaattaagaa 4080

aacgatgatc acataaacac agttgtggtt acttctactg gggaaggaag agggtatgag 4140

ctgagacaca cagagtcggc aagtctccaa gcaagcacag aacgaataca ttacagtacc 4200

ttgaatacag cagttaaact tctaaatcgc aagaacagga aaatgcacac agctgtgttt 4260

agaaaattct cagtccagca ctattcataa tagcaaagac attaacccag gttggataaa 4320

taaatgatga cacaggcaat tgcacaatga tacagacata catttagtac atgagacatc 4380

gatgatgtat ccccaaagaa atgactttaa agagaaaagg cctgatgtgt ggtggcactc 4440

acctccctgg gatccccgga caggttgcag gcacactgtg tggcagggca ggctggtaca 4500

tgctggcagc tcctggggcc tgatgtggag caagcgcagg gctgtatacc cccaaggatg 4560

gcacagtcag tgaattccag agagaagcag ctcagccaca ctgcccaggc agagcccgag 4620

agggacgccc acgtacaggg aggcagagcc cagctcctcc acagccacca ccacctgtgc 4680

acgggccacc accttgcagg cacagagtgg gtgctgagag gaggggcagg gacaccaggc 4740

agggtgagca cccagagaaa actgcagaag cctcacacat ccacctcagc ctcccctgac 4800

ctggacctca cctggtctgg acctcacctg gcctgggcct cacctgacct ggacctcacc 4860

tggcctgggc ttcacctgac ctggacctca cctggcctcc ggcctcacct gcacctgctc 4920

caggtcttgc tggaacctga gtagcactga ggctgcagaa gctcatccag ggttggggaa 4980

tgactctgga actctcccac atctgacctt tctgggtgga ggcatctggt ggccctggga 5040

atataaaaag ccccagaatg gtgcctgcgt gatttggggg caatttatga acccgaaagg 5100

acatggccat ggggtgggta gggacatagg gacagatgcc agcctgaggt ggagcctcag 5160

gacacagttg gacgcggaca ctatccacat aagcgaggga cagacccgag tgttcctgca 5220

gtagacctga gagcgctggg cccacagcct cccctcggtg ccctgctgcc tcctcaggtc 5280

agccctggac atcccgggtt tccccaggcc agatggtagg attttgttga ggtctgtgtc 5340

actgtggtat tatgattacg agagagcttg caatggcaga cgcggctgca gcagatgggc 5400

tcgcgatcat agcaggtgct gctatcgtta tacccacagt gtcacacggt ccatcaaaaa 5460

cccatgccac agccctcccc gcaggggacc gccgcgtgcc atgttacgat tttgatcgag 5520

gacacagcgc catgggtatg gtggctacca cagcagtgca gcccatgacc caaacacaca 5580

gggcagcagg cacaatggac aggcctgtga gtgaccatgc tgggctccag cccgccagcc 5640

ccggagacca tgaaacagat ggccaaggtc accccacagt tcagccagac atggctccgt 5700

ggggtctgca tcgctgctgc cctctaacac cagcccagat ggggacaagg ccaaccccac 5760

attaccatct cctgctgtcc acccagtggt cccagaagcc cctccctcat ggctgagcca 5820

catgtgtgaa ccctgagagc accccatgtc agagtagggg cagcagaagg gcggggctgg 5880

ccctgtgcac tgtccctgca cccatggtcc ctcgcctgcc tggccctgac acctgagcct 5940

cttctgagtc atttctaaga tagaagacat tcccggggac agccggagct gggcgtcgct 6000

catcccgccc ggccgtcctg agtcctgctt gtttccagac ctcaccaggg aagccaacag 6060

aggactcacc tcacacagtc agagacaaag aaccttccag aaatccctgt ctcactcccc 6120

agtgggcacc ttcttccagg acattcctcg gtcgcatcac agcaggcacc cacatctgga 6180

tcaggacggc ccccagaaca caagatggcc catggggaca gccccacaac ccaggccttc 6240

ccagacccct aaaaggcgtc ccaccccctg cacctgcccc agggctaaaa atccaggagg 6300

cttgactccc gcataccctc cagccagaca tcacctcagc cccctcctgg aggggacagg 6360

agcccgggag ggtgagtcag acccacctgc cctcgatggc aggcggggaa gattcagaaa 6420

ggcctgagat ccccaggacg cagcaccact gtcaatgggg gccccagacg cctggaccag 6480

ggcctgcgtg ggaaaggccg ctgggcacac tcagggggat tttgtgaagg cccctcccac 6540

tgtggagagg cttgcttgtg gcttccctaa gagctgcagc aggcaagcta agcctcacag 6600

atgctgccac agtgatgaaa ctagcatcaa aaaccggccg gacacccagg gaccatgcac 6660

acttctcagc ttggagctct ccaggaccag aagagtcagg tctgagggtt tgtagccaga 6720

ccctcggcct ctagggacac cctggccatc acagcggatg ggctggtgcc ccacatgcca 6780

tctgctccaa acaggggctt cagagggctc tgaggtgact tcactcatga ccacaggtgc 6840

cctggcccct tccccgccag ctacaccgaa ccctgtccca acagctgccc cagttccaac 6900

agccaattcc tggggcccag aattgctgta gacaccagcc tcgttccagc acctcctgcc 6960

aattgcctgg attcacatcc tggctggaat caagagggca gcatccgcca ggctcccaac 7020

aggcaggact cccgcacacc ctcctctgag aggccgctgt gttccgcagg gccaggccct 7080

ggacagttcc cctcacctgc cactagagaa acacctgcca ttgtcgtccc cacctggaaa 7140

agaccactcg tggagccccc agccccaggt acagctgtag agagactccc cgagggatct 7200

aagaaggagc catgcgcagt tctgccggga ccctcggcca ggccgacagg agtggacact 7260

ggagctgggc ccacactggg ccacatagga gctcaccagt gagggcagga gagcacatgc 7320

cggggagcac ccagcctcct gctgaccaga ggcccgtccc agagcccagg aggctgcaga 7380

ggcctctcca gggggacact gtgcatgtct ggtccctgag cagcccccca cgtccccagt 7440

cctgggggcc cctggcacag ctgtctggac cctccctgtt ccctgggaag ctcctcctga 7500

cagccccgcc tccagttcca ggtgtggatt ttgtcagggg gtgtcacact gtgtactgcc 7560

agaagtggat gtggacttgc gatagtgaga ggaagagctg tgagggtatg gtatgccggc 7620

tgtggagtaa gaagaagctc tggcacagtg gtgctgccca tatcaaaaac caggccaagt 7680

agacaggccc ctgctgtgca gccccaggcc tccacttcac ctgcttctcc tggggctctc 7740

aaggtcactg ttgtctgtac tctgccctct gtggggaggg ttccctcagt gggaggtctg 7800

ttctcaacat cccagggcct catgtctgca cggaaggcca atggatgggc aacctcacat 7860

gccgcggcta agatagggtg ggcagcctgg cgggggacag tacatactgc tggggtgtct 7920

gtcactgtgc ctagtggggc actggctccc aaacaacgca gtcctcgcca aaatccccac 7980

agcctcccct gctaggggct ggcctgatct cctgcagtcc taggaggctg ctgacctcca 8040

gaatgtctcc gtccccagtt ccagggcgag agcagatccc aggccggctg cagactggga 8100

ggccaccccc tccttcccag ggttcactgg aggtgaccaa ggtaggaaat ggccttaaca 8160

cagggatgac tgcgccatcc cccaacagag tcagccccct cctgctctgt accccgcacc 8220

ccccaggcca gtccacgaaa accagggccc cacatcagag tcactgcctg gcccggccct 8280

ggggcggacc cctcagcccc caccctgtct agaggacttg gggggacagg acacaggccc 8340

tctccttatg gttcccccac ctgcctccgg ccgggaccct tggggtgtgg acagaaagga 8400

cacctgccta attggccccc aggaacccag aacttctctc cagggacccc agcccgagca 8460

cccccttacc caggacccag ccctgcccct cctcccctct gctctcctct catcacccca 8520

tgggaatccg gtatccccag gaagccatca ggaagggctg aaggaggaag cggggccgtg 8580

caccaccggg caggaggctc cgtcttcgtg aacccaggga agtgccagcc tcctagaggg 8640

tatggtccac cctgcctggg gctcccaccg tggcaggctg cggggaagga ccagggacgg 8700

tgtgggggag ggctcagggc cctgcgggtg ctcctccatc ttcggtgagc ctcccccttc 8760

acccaccgtc ccgcccacct cctctccacc ctggctgcac gtcttccaca ccatcctgag 8820

tcctacctac accagagcca gcaaagccag tgcagacaaa ggctggggtg caggggggct 8880

gccagggcag cttcggggag ggaaggatgg agggagggga ggtcagtgaa gaggccccct 8940

tcccctgggt ccaggatcct cctctgggac ccccggatcc catcccctcc tggctctggg 9000

aggagaagca ggatgggaga atctgtgcgg gaccctctca cagtggaata tccccacagc 9060

ggctcaggcc agacccaaaa gcccctcagt gagccctcca ctgcagtcct gggcctgggt 9120

agcagcccct cccacagagg acagacccag caccccgaag aagtcctgcc agggggagct 9180

cagagccatg aaagagcagg atatggggtc cccgatacag gcacagacct cagctccatc 9240

caggcccacc gggacccacc atgggaggaa cacctgtctc cgggttgtga ggtagctggc 9300

ctctgtctcg gaccccactc cagacaccag acagaggggc aggcccccca aaaccagggt 9360

tgagggatga tccgtcaagg cagacaagac caaggggcac tgaccccagc aagggaaggc 9420

tcccaaacag acgaggagga ttttgtagct gtctgtatca ctgtgtgcaa ctgcagcaga 9480

tgggctcgcg accatagcag gtgctgccac agtgacactc gccaggtcaa aaaccccgtc 9540

ccaagtcagc ggaagcagag agagcaggga ggacacgttt aggatctgag gccgcacctg 9600

acacccaggg cagcagacgt ctcccctcca gggcaccctc caccgtcctg cgtttcttca 9660

agaatagggg cggcctgagg gggtccaggg ccaggcgata ggtcccctct accccaagga 9720

ggagccaggc aggacccgag caccgatgca tctaacgcag tcatgtaatg ctgggtgaca 9780

gtcagttcgc ctacgta 9797

<210> 235

<211> 12029

<212> DNA

<213> 人工序列

<220>

<223> TxDH120126

<400> 235

tacgtaatgc atctaacgca gtcatgtaat gctgggtgac agtcagttcg cctccccatt 60

gaggctgacc tgcccagacg ggcctgggcc caccccacac accggggcgg aatgtgtgca 120

ggccccagtc tctgtgggtg ttccgctagc tggggccccc agtgctcacc ccacacctaa 180

agcgagcccc agcctccaga gccccctaag cattccccgc ccagcagccc agcccctgcc 240

cccacccagg aggccccaga gctcagggcg cctggtcgga ttttgtacag ccccgagtca 300

ctgtggagag agcttgcaat ggcagacgcg gctgcagcag atgggctcgc gatcatagca 360

ggtgctgcca cagtgagaaa aactgtgtca aaaaccgact cctggcagca gtcggaggcc 420

ccgccagaga ggggagcagc cggcctgaac ccatgtcctg ccggttccca tgacccccag 480

cacccagagc cccacggtgt ccccgttgga taatgaggac aagggctggg ggctccggtg 540

gtttgcggca gggacttgat cacatccttc tgctgtggcc ccattgcctc tggctggagt 600

tgacccttct gacaagtgtc ctcagaaaga cagggatcac cggcacctcc caatatcaac 660

cccaggcagc acagacacaa accccacatc cagagccaac tccaggagca gagacacccc 720

aacactctgg gggaccccaa ccgtgataac tccccactgg aatccgcccc agagtctacc 780

aggaccaaag gccctgccct gtctctgtcc ctcactcagg gcctcctgca gggcgagcgc 840

ttgggagcag actcggtctt aggggacacc actgtgggcc ccaactttga tgaggccact 900

gacccttcct tcctttcctg gggcagcaca gactttgggg tctgggcagg gaagaactac 960

tggctggtgg ccaatcacag agcccccagg ccgaggtggc cccaagaagg ccctcaggag 1020

gtggccactc cacttcctcc cagctggacc ccaggtcctc cccaagatag gggtgccatc 1080

caaggcaggt cctccatgga gcccccttca gactcctccc gggaccccac tggacctcag 1140

tccctgctct gggaatgcag ccaccacaag cacaccagga agcccaggcc cagccaccct 1200

gcagtgggca agcccacact ctggagcaga gcagggtgcg tctgggaggg gctaacctcc 1260

ccacccccca ccccccatct gcacacagcc acctaccact gcccagaccc tctgcaggag 1320

ggccaagcca ccatggggta tggacttagg gtctcactca cgtgcctccc ctcctgggag 1380

aaggggcctc atgcccagat ccctgcagca ctagacacag ctggaggcag tggccccagg 1440

gccaccctga cctggcatct aaggctgctc cagcccagac agcactgccg ttcctgggaa 1500

gcctgggctc caccagacca caggtccagg gcacagccca caggagccac ccacacacag 1560

ctcacaggaa gaagataagc tccagacccc agggcgggac ctgccttcct gccaccactt 1620

acacacaggc cagggagctg ttcccacaca gatcaacccc aaaccgggac tgcctggcac 1680

tagggtcact gccatttccc tctccattcc ctcccagtgc ctctgtgctc cctccttctg 1740

gggaacaccc tgtgcagccc ctccctgcag cccacacgct ggggagaccc caccctgcct 1800

cgggcctttt ctacctgctg cacttgccgc ccacccaaac aaccctgggt acgtgaccct 1860

gcagtcctca ccctgatctg caaccagacc cctgtccctc cctctaaaca cccctcccag 1920

gccaactctg cacctgcagg ccctccgctc ttctgccaca agagcctcag gttttcctac 1980

ctgtgcccac cccctaaccc ctcctgccca caacttgagt tcttcctctc ctggagccct 2040

tgagccatgg cactgaccct acactcccac ccacacactg cccatgccat caccttcctc 2100

ctggacactc tgaccccgct cccctccctc tcagacccgg ccctggtatt tccaggacaa 2160

aggctcaccc aagtcttccc catgcaggcc cttgccctca ctgcctggtt acacgggagc 2220

ctcctgtgcg cagaagcagg gagctcagct cttccacagg cagaaggcac tgaaagaaat 2280

cagcctccag tgccttgaca cacgtccgcc tgtgtctctc actgcctgca cctgcaggga 2340

ggctccgcac tccctctaaa gatgagggat ccaggcagca acatcacggg agaatgcagg 2400

gctcccagac agcccagccc tctcgcaggc ctctcctggg aagagacctg cagccaccac 2460

tgaacagcca cggaggtcgc tggatagtaa ccgagtcagt gaccgacctg gagggcaggg 2520

gagcagtgaa ccggagccca taccataggg acagagacca gccgctaaca tcccgagccc 2580

ctcactggcg gccccagaac accccgtgga aagagaacag acccacagtc ccacctggaa 2640

cagggcagac actgctgagc ccccagcacc agccccaaga aacactaggc aacagcatca 2700

gagggggctc ctgagaaaga gaggagggga ggtctccttc accatcaaat gcttcccttg 2760

accaaaaaca gggtccacgc aactccccca ggacaaagga ggagccccct gtacagcact 2820

gggctcagag tcctctctga gacaggctca gtttcagaca acaacccgct ggaatgcaca 2880

gtctcagcag gagagccagg ccagagccag caagaggaga ctcggtgaca ccagtctcct 2940

gtagggacag gaggattttg tgggggttcg tgtcactgtg agcatattgt cggagcaggc 3000

agtgctattc ccacagtgac acaaccccat tcaaaaaccc ctactgcaaa cgcacccact 3060

cctgggactg aggggctggg ggagcgtctg ggaagtatgg cctaggggtg tccatcaatg 3120

cccaaaatgc accagactct ccccaagaca tcaccccacc agccagtgag cagagtaaac 3180

agaaaatgag aagcagctgg gaagcttgca caggccccaa ggaaagagct ttggcaggtg 3240

tgcaagaggg gatgtgggca gagcctcagc agggcctttt gctgtttctg ctttcctgtg 3300

cagagagttc cataaactgg tattcaagat caatggctgg gagtgagccc aggaggacag 3360

tgtgggaaga gcacagggaa ggaggagcag ccgctatcct acactgtcat cttttgaaag 3420

tttgccctgt gcccacaatg ctgcatcatg ggatgcttaa cagctgatgt agacacagct 3480

aaagagagaa tcagtgaaat ggatttgcag cacagatctg aataaatcct ccagaatgtg 3540

gagcagcaca gaagcaagca cacagaaagt gcctgatgcc aaggcaaagt tcagtgggca 3600

ccttcaggca ttgctgctgg gcacagacac tctgaaaagc actggcagga actgcctgtg 3660

acaaagcaga accctcaggc aatgccagcc ctagagccct tcctgagaac ctcatgggca 3720

aagatgtgca gaacagctgt ttgtcatagc cccaaactat ggggctggac aaagcaaacg 3780

tccatctgaa ggagaacaga caaataaacg atggcaggtt catgaaatgc aaactaggac 3840

agccagagga caacagtaga gagctacagg cggctttgcg gttgagttca tgacaatgct 3900

gagtaattgg agtaacagag gaaagcccaa aaaatacttt taatgtgatt tcttctaaat 3960

aaaatttaca cccggcaaaa tgaactatct tcttaaggga taaactttcc cctggaaaaa 4020

ctataaggaa aatcaagaaa acgatgatca cataaacaca gtggtggtta cttctactgg 4080

ggaaggaaga gggtatgagc tgagacacac agagtcggca agtctcctaa caagaacaga 4140

acaaatacat tacagtacct tgaaaacagc agttaaactt ctaaatcgca agaagaggaa 4200

aatgcacaca cctgtgttta gaaaattctc agtccagcac tgttcataat agcaaagaca 4260

ttaacccagg ttggataaat aagcgatgac acaggcaatt gcacaatgat acagacatac 4320

attcagtata tgagacatcg atgatgtatc cccaaagaaa tgactttaaa gagaaaaggc 4380

ctgatgtgtg gtggcaatca cctccctggg catccccgga caggctgcag gctcactgtg 4440

tggcagggca ggcaggcacc tgctggcagc tcctggggcc tgatgtggag caggcacaga 4500

gctgtatatc cccaaggaag gtacagtcag tgcattccag agagaagcaa ctcagccaca 4560

ctccctggcc agaacccaag atgcacaccc atgcacaggg aggcagagcc cagcacctcc 4620

gcagccacca ccacctgcgc acgggccacc accttgcagg cacagagtgg gtgctgagag 4680

gaggggcagg gacaccaggc agggtgagca cccagagaaa actgcagaag cctcacacat 4740

ccctcacctg gcctgggctt cacctgacct ggacctcacc tggcctcggg cctcacctgc 4800

acctgctcca ggtcttgctg gagcctgagt agcactgagg ctgtagggac tcatccaggg 4860

ttggggaatg actctgcaac tctcccacat ctgacctttc tgggtggagg cacctggtgg 4920

cccagggaat ataaaaagcc ccagaatgat gcctgtgtga tttgggggca atttatgaac 4980

ccgaaaggac atggccatgg ggtgggtagg gacagtaggg acagatgtca gcctgaggtg 5040

aagcctcagg acacaggtgg gcatggacag tgtccaccta agcgagggac agacccgagt 5100

gtccctgcag tagacctgag agcgctgggc ccacagcctc ccctcggggc cctgctgcct 5160

cctcaggtca gccctggaca tcccgggttt ccccaggcct ggcggtagga ttttgttgag 5220

gtctgtgtca ctgtggtatt actatgagag gcttgcttgt ggcttcccta agagctgcag 5280

caggcaagct aagcctcaca gatgctgcta ttactaccac agtgtcacag agtccatcaa 5340

aaacccatgc ctgggagcct cccaccacag ccctccctgc gggggaccgc tgcatgccgt 5400

gttaggattt tgatcgagga cacggcgcca tgggtatggt ggctaccaca gcagtgcagc 5460

ccatgaccca aacacacggg gcagcagaaa caatggacag gcccacaagt gaccatgatg 5520

ggctccagcc caccagcccc agagaccatg aaacagatgg ccaaggtcac cctacaggtc 5580

atccagatct ggctccaagg ggtctgcatc gctgctgccc tcccaacgcc aaaccagatg 5640

gagacagggc cggccccata gcaccatctg ctgccgtcca cccagcagtc ccggaagccc 5700

ctccctgaac gctgggccac gtgtgtgaac cctgcgagcc ccccatgtca gagtaggggc 5760

agcaggaggg cggggctggc cctgtgcact gtcactgccc ctgtggtccc tggcctgcct 5820

ggccctgaca cctgagcctc tcctgggtca tttccaagac attcccaggg acagccggag 5880

ctgggagtcg ctcatcctgc ctggctgtcc tgagtcctgc tcatttccag acctcaccag 5940

ggaagccaac agaggactca cctcacacag tcagagacaa cgaaccttcc agaaatccct 6000

gtttctctcc ccagtgagag aaaccctctt ccagggtttc tcttctctcc caccctcttc 6060

caggacagtc ctcagcagca tcacagcggg aacgcacatc tggatcagga cggcccccag 6120

aacacgcgat ggcccatggg gacagcccag cccttcccag acccctaaaa ggtatcccca 6180

ccttgcacct gccccagggc tcaaactcca ggaggcctga ctcctgcaca ccctcctgcc 6240

agatatcacc tcagccccct cctggagggg acaggagccc gggagggtga gtcagaccca 6300

cctgccctca atggcaggcg gggaagattc agaaaggcct gagatcccca ggacgcagca 6360

ccactgtcaa tgggggcccc agacgcctgg accagggcct gtgtgggaaa ggcctctggc 6420

cacactcagg gggattttgt gaagggccct cccactgtgg agaggctttg ctgtggcttc 6480

cctaagagct gccgcagcag gcaatgcaag cctcacagat gctgccacag tgatgaaacc 6540

agcatcaaaa accgaccgga ctcgcagggt ttatgcacac ttctcggctc ggagctctcc 6600

aggagcacaa gagccaggcc cgagggtttg tgcccagacc ctcggcctct agggacaccc 6660

gggccatctt agccgatggg ctgatgccct gcacaccgtg tgctgccaaa caggggcttc 6720

agagggctct gaggtgactt cactcatgac cacaggtgcc ctggtccctt cactgccagc 6780

tgcaccagac cctgttccga gagatgcccc agttccaaaa gccaattcct ggggccggga 6840

attactgtag acaccagcct cattccagta cctcctgcca attgcctgga ttcccatcct 6900

ggctggaatc aagagggcag catccgccag gctcccaaca ggcaggactc ccacacaccc 6960

tcctctgaga ggccgctgtg ttccgcaggg ccaggccgca gacagttccc ctcacctgcc 7020

catgtagaaa cacctgccat tgtcgtcccc acctggcaaa gaccacttgt ggagccccca 7080

gccccaggta cagctgtaga gagagtcctc gaggccccta agaaggagcc atgcccagtt 7140

ctgccgggac cctcggccag gccgacagga gtggacgctg gagctgggcc cacactgggc 7200

cacataggag ctcaccagtg agggcaggag agcacatgcc ggggagcacc cagcctcctg 7260

ctgaccagag acccgtccca gagcccagga ggctgcagag gcctctccag ggggacacag 7320

tgcatgtctg gtccctgagc agcccccagg ctctctagca ctgggggccc ctggcacagc 7380

tgtctggacc ctccctgttc cctgggaagc tcctcctgac agccccgcct ccagttccag 7440

gtgtggattt tgtcaggggg tgccacactg tgtactgcca gaagtggatg tggacttgcg 7500

atagtgagag gaagtgctgt gagggtatgg tatgccggct gtggtgtaag aagaagctct 7560

ggcacagtgg tgccgcccat atcaaaaacc aggccaagta gacagacccc tgccacgcag 7620

ccccaggcct ccagctcacc tgcttctcct ggggctctca aggctgctgt ctgccctctg 7680

gccctctgtg gggagggttc cctcagtggg aggtctgtgc tccagggcag ggatgactga 7740

gatagaaatc aaaggctggc agggaaaggc agcttcccgc cctgagaggt gcaggcagca 7800

ccacagagcc atggagtcac agagccacgg agcccccagt gtgggcgtgt gagggtgctg 7860

ggctcccggc aggcccagcc ctgatgggga agcctgcccc gtcccacagc ccaggtcccc 7920

aggggcagca ggcacagaag ctgccaagct gtgctctacg atcctcatcc ctccagcagc 7980

atccactcca cagtggggaa actgagcctt ggagaaccac ccagccccct ggaaacaagg 8040

cggggagccc agacagtggg cccagagcac tgtgtgtatc ctggcactag gtgcagggac 8100

cacccggaga tccccatcac tgagtggcca gcctgcagaa ggacccaacc ccaaccaggc 8160

cgcttgatta agctccatcc ccctgtcctg ggaacctctt cccagcgcca ccaacagctc 8220

ggcttcccag gccctcatcc ctccaaggaa ggccaaaggc tgggcctgcc aggggcacag 8280

taccctccct tgccctggct aagacagggt gggcagacgg ctgcagatag gacatattgc 8340

tggggcatct tgctctgtga ctactgggta ctggctctca acgcagaccc taccaaaatc 8400

cccactgcct cccctgctag gggctggcct ggtctcctcc tgctgtccta ggaggctgct 8460

gacctccagg atggcttctg tccccagttc tagggccaga gcagatccca ggcaggctgt 8520

aggctgggag gccacccctg tccttgccga ggttcagtgc aggcacccag gacaggaaat 8580

ggcctgaaca cagggatgac tgtgccatgc cctacctaag tccgcccctt tctactctgc 8640

aacccccact ccccaggtca gcccatgacg accaacaacc caacaccaga gtcactgcct 8700

ggccctgccc tggggaggac ccctcagccc ccaccctgtc tagaggagtt ggggggacag 8760

gacacaggct ctctccttat ggttccccca cctggctcct gccgggaccc ttggggtgtg 8820

gacagaaagg acgcctgcct aattggcccc caggaaccca gaacttctct ccagggaccc 8880

cagcccgagc acccccttac ccaggaccca gccctgcccc tcctcccctc tgctctcctc 8940

tcatcactcc atgggaatcc agaatcccca ggaagccatc aggaagggct gaaggaggaa 9000

gcggggccgc tgcaccaccg ggcaggaggc tccgtcttcg tgaacccagg gaagtgccag 9060

cctcctagag ggtatggtcc accctgcctg gggctcccac cgtggcaggc tgcggggaag 9120

gaccagggac ggtgtggggg agggctcagg gccctgcagg tgctccatct tggatgagcc 9180

catccctctc acccaccgac ccgcccacct cctctccacc ctggccacac gtcgtccaca 9240

ccatcctgag tcccacctac accagagcca gcagagccag tgcagacaga ggctggggtg 9300

caggggggcc gccagggcag ctttggggag ggaggaatgg aggaagggga ggtcagtgaa 9360

gaggcccccc tcccctgggt ctaggatcca cctttgggac ccccggatcc catcccctcc 9420

aggctctggg aggagaagca ggatgggaga ttctgtgcag gaccctctca cagtggaata 9480

cctccacagc ggctcaggcc agatacaaaa gcccctcagt gagccctcca ctgcagtgca 9540

gggcctgggg gcagcccctc ccacagagga cagacccagc accccgaaga agtcctgcca 9600

gggggagctc agagccatga aggagcaaga tatggggacc ccaatactgg cacagacctc 9660

agctccatcc aggcccacca ggacccacca tgggtggaac acctgtctcc ggcccctgct 9720

ggctgtgagg cagctggcct ctgtctcgga cccccattcc agacaccaga cagagggaca 9780

ggccccccag aaccagtgtt gagggacacc cctgtccagg gcagccaagt ccaagaggcg 9840

cgctgagccc agcaagggaa ggcccccaaa caaaccagga ggtttctgaa gctgtctgtg 9900

tcacagtctg ctgcaactgc agcagcaaat ggtgccgcga ccatagcagg tgctgccaca 9960

atgacactgg gcaggacaga aaccccatcc caagtcagcc gaaggcagag agagcaggca 10020

ggacacattt aggatctgag gccacacctg acactcaagc caacagatgt ctcccctcca 10080

gggcgccctg ccctgttcag tgttcctgag aaaacagggg cagcctgagg ggatccaggg 10140

ccaggagatg ggtcccctct accccgagga ggagccaggc gggaatccca gccccctccc 10200

cattgaggcc atcctgccca gaggggcccg gacccacccc acacacccag gcagaatgtg 10260

tgcaggcctc aggctctgtg ggtgccgcta gctggggctg ccagtcctca ccccacacct 10320

aaggtgagcc acagccgcca gagcctccac aggagacccc acccagcagc ccagccccta 10380

cccaggaggc cccagagctc agggcgcctg ggtggatttt gtacagcccc gagtcactgt 10440

gggtatagtg gggagaggct ttgtggcttc cctaagagct gcagcaggca aaagcctcac 10500

agatgctgca gctactacca cagtgagaaa agctatgtca aaaaccgtct cccggccact 10560

gctggaggcc cagccagaga agggaccagc cgcccgaaca tacgaccttc ccagacctca 10620

tgacccccag cacttggagc tccacagtgt ccccattgga tggtgaggat gggggccggg 10680

gccatctgca cctcccaaca tcacccccag gcagcacagg cacaaacccc aaatccagag 10740

ccgacaccag gaacacagac accccaatac cctgggggac cctggccctg gtgacttccc 10800

actgggatcc acccccgtgt ccacctggat caaagacccc accgctgtct ctgtccctca 10860

ctcagggcct gctgaggggc gggtgctttg gagcagactc aggtttaggg gccaccattg 10920

tggggcccaa cctcgaccag gacacagatt tttctttcct gccctggggc aacacagact 10980

ttggggtctg tgcagggagg accttctgga aagtcaccaa gcacagagcc ctgactgagg 11040

tggtctcagg aagaccccca ggagggggct tgtgcccctt cctctcatgt ggaccccatg 11100

ccccccaaga taggggcatc atgcagggca ggtcctccat gcagccacca ctaggcaact 11160

ccctggcgcc ggtccccact gcgcctccat cccggctctg gggatgcagc caccatggcc 11220

acaccaggca gcccgggtcc agcaaccctg cagtgcccaa gcccttggca ggattcccag 11280

aggctggagc ccacccctcc tcatcccccc acacctgcac acacacacct accccctgcc 11340

cagtccccct ccaggagggt tggagccgcc catagggtgg gggctccagg tctcactcac 11400

tcgcttccct tcctgggcaa aggagcctcg tgccccggtc ccccctgacg gcgctgggca 11460

caggtgtggg tactgggccc cagggctcct ccagccccag ctgccctgct ctccctggga 11520

ggcctgggca ccaccagacc accagtccag ggcacagccc cagggagccg cccactgcca 11580

gctcacagga agaagataag cttcagaccc tcagggccgg gagctgcctt cctgccaccc 11640

cttcctgccc cagacctcca tgccctcccc caaccactta cacacaagcc agggagctgt 11700

ttccacacag ttcaacccca aaccaggacg gcctggcact cgggtcactg ccatttctgt 11760

ctgcattcgc tcccagcgcc cctgtgttcc ctccctcctc cctccttcct ttcttcctgc 11820

attgggttca tgccgcagag tgccaggtgc aggtcagccc tgagcttggg gtcacctcct 11880

cactgaaggc agcctcaggg tgcccagggg caggcagggt gggggtgagg cttccagctc 11940

caaccgcttc gctaccttag gaccgttata gttaggcgcg ccgtcgacca attctcatgt 12000

ttgacagctt atcatcgaat ttctacgta 12029

<210> 236

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 236

tcttatcaga cagggggctc tc 22

<210> 237

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 237

gtgactggag ttcagacgtg tgctcttccg atcttcacca tggactgsac ctgga 55

<210> 238

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 238

gtgactggag ttcagacgtg tgctcttccg atctccatgg acacactttg ytccac 56

<210> 239

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 239

gtgactggag ttcagacgtg tgctcttccg atcttcacca tggagtttgg gctgagc 57

<210> 240

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 240

gtgactggag ttcagacgtg tgctcttccg atctagaaca tgaaacayct gtggttctt 59

<210> 241

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 241

gtgactggag ttcagacgtg tgctcttccg atctatgggg tcaaccgcca tcct 54

<210> 242

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 242

gtgactggag ttcagacgtg tgctcttccg atctacaatg tctgtctcct tcctcat 57

<210> 243

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<400> 243

acactctttc cctacacgac gctcttccga tctgggaaga catttgggaa ggac 54

<210> 244

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<220>

<221> nnnnnn

<222> (25)..(30)

<223> 6核苷酸指数

<220>

<221> misc_feature

<222> (25)..(30)

<223> n是a、c、g或t

<400> 244

caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60

atct 64

<210> 245

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 引物和/或探针

<220>

<221> nnnnnn

<222> (29)..(35)

<223> 6核苷酸指数

<220>

<221> misc_feature

<222> (30)..(35)

<223> n是a、c、g或t

<400> 245

aatgatacgg cgaccaccga gatctacacn nnnnnacact ctttccctac acgacgctct 60

tccgatct 68