KR102482103B1

KR102482103B1 - 조작된 중쇄 다양성 영역을 갖는 설치류

Info

Publication number: KR102482103B1
Application number: KR1020187022714A
Authority: KR
Inventors: 린 맥도날드; 존 맥훠터; 앤드류 제이. 머피
Original assignee: 리제너론 파마슈티칼스 인코포레이티드
Priority date: 2016-01-13
Filing date: 2017-01-12
Publication date: 2022-12-28
Also published as: BR112018014250A2; JP2021101738A; JP2019501660A; EP4257599A2; AU2017206785C1; CA3011359A1; JP6979955B2; US20220174920A1; IL260526B1; IL302725A; MX2018008701A; KR20230006929A; JP2023024619A; RU2018129169A; IL260526B2; IL260526A; EP3402326A1; SG10201914034WA; WO2017123804A1; RU2018129169A3

Abstract

비-인간 동물 및 그 동물을 만들고 이용하기 위한 방법과 조성물이 제공되며, 여기서 비-인간 동물은 면역글로불린 중쇄 가변 영역 내에 조작된 또는 재조합 다양성 클러스터를 포함하는 게놈을 가지며, 이때 조작된 또는 재조합 다양성 클러스터는 관심있는 비-면역글로불린 폴리펩티드의 하나 이상의 코딩 서열의 삽입을 포함한다. 본원에 설명된 비-인간 동물은 상보성 결정 영역 (CDR), 특히 특정 항원에 대한 결합을 유도하는 다양성을 갖는 CDR3을 특징으로 하는 항체를 발현한다. 비-인간 동물로부터 항체를 생산하는 방법도 제공되며, 이때 항체는 인간 가변 영역과 마우스 불변 영역을 함유한다.

Description

조작된 중쇄 다양성 영역을 갖는 설치류

본 발명은 조작된 중쇄 다양성 영역을 갖는 설치류에 관한 것이다.

항체 기반의 치료법은 여러 질병의 치료에 중요한 가능성을 제공한다. 단일클론, 쥐, 키메라, 인간화, 인간, 전장, Fab, 페길화, 방사성 표지, 약물 공역, 다중특이적 등을 포함한, 다양한 포맷이 개발되고 있다 (예를 들어, Reichert, J.M., 2012, mAbs 4:3, 413-415; Nixon, A.E. 외, 2014, mAbs 6:1, 73-85 참조; 본원에 참조로 인용됨). 미국이나 유럽에서 마케팅 승인을 받은 40개 넘는 치료용 항체 제제 중에서, 전부 시험관 내 (예, 파지 디스플레이) 또는 생체 내 (예, 유전자 조작 동물)에 의해서 시스템 인간 및/또는 비-인간 (예를 들어, 마우스) 소스로부터의 기존의 항체 유전자의 조립에 의존하는 기술로 생성되었다. 여전히, 난치성 표적을 결합시키는 특히 효과적인 항체 제제의 개발은 도전과제로 남아 있다.

본원에 개시된 것은, 난치병 표적을 특징으로 하는 다양한 질환의 치료에 사용될 수 있는, 새로운 항체 기반 치료제, 일부 구현예에서, 항체 제제 (예를 들어, 단일클론 항체 및/또는 그 단편)를 동정하고 개발하기 위한 개선된 생체 내 시스템을 허용하도록 비-인간 동물을 조작하는 것이 바람직하다는 인식이다. 또한, 본원에 개시된 것은 면역글로불린 중쇄 가변 영역 (예를 들면, 이종 면역글로불린 중쇄 가변 영역) 내에 조작된 중쇄 다양성(D_H) 클러스터/영역, 특히, 자연적으로는 면역글로불린 중쇄 가변 영역 내에 존재하지 않는 뉴클레오티드 코딩 서열을 함유하고 그리고/또는 그렇지 않으면 특정 항원에 대한 결합을 유도하는 다양성을 특징으로 하는 상보성 결정 영역 (CDR)을 함유하는 항체를 발현하거나, 함유하거나 생산하는, 조작된 D_H 클러스터 (또는 D_H 영역)를 가지는 비-인간 동물이, 예를 들면, 막에 걸쳐진(membrane-spanning) 또는 세포질 폴리펩티드를 표적으로 할 수도 있는, 항체-기반 치료제를 식별하고 개발하는 데 사용하기에 바람직하다는 인식이다. 일부 구현예에서, 본원에 개시된 비-인간 동물은 인간에게 투여하기 위한 항체 및/또는 항체-기반 치료제의 개발을 위한 생체 내 시스템이다.

일부 구현예에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈, 예를 들어, 생식선 게놈을 갖는 비-인간 동물이 제공되고, 여기서 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드를 각각 암호화하는 하나 이상의 뉴클레오티드 서열, 또는 그의 부분을 포함하고 있다.

또 다른 측면에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하도록 변형되는 게놈, 예를 들어, 생식선 게놈을 갖는 비-인간 동물은, 하나의 재배열된 경쇄, 예를 들면, 공통 경쇄 (ULC)를 발현하도록 추가로 변형될 수도 있으며, 여기서 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드를 각각 암호화하는 하나 이상의 뉴클레오티드 서열, 또는 그의 부분을 포함하고 있다.

또한 공통 또는 범용 경쇄 (ULC)라고도 지칭되는, 경쇄 불변 영역에 작동가능하게 연결된 하나의 재배열된 경쇄 가변 유전자 서열은 하나의 재배열된 V_L:J_L 유전자 서열을 포함하는 경쇄 좌위에 의해 암호화될 수 있다. 일부 구현예에서, 경쇄 좌위는 V_L 서열이 Vκ 유전자 서열인 하나의 재배열된 V_L:J_L 유전자 서열을 포함한다. 일부 측면에서, Vκ 서열은 Vκ1-39 또는 Vκ3-20로부터 선택된다. 일부 측면에서, J_L 서열은 Jκ 유전자 서열, 예를 들면, Jκ1 서열, Jκ2 서열, Jκ3 서열, Jκ4 서열, 또는 Jκ5 서열 등이다. 일부 구현예에서, 경쇄 좌위는 Vκ1-39Jκ5 및 Vκ3-20Jκ1로 이루어진 군으로부터 선택된 하나의 재배열된 Vκ:Jκ 서열을 포함한다. 일 구현예에서, 경쇄 좌위는 Vκ1-39Jκ5의 하나의 재배열된 Vκ:Jκ 서열을 포함한다. 또 다른 구현예에서, 경쇄 좌위는 Vκ3-20Jκ1의 하나의 재배열된 Vκ:Jκ 서열을 포함한다. 일부 구현예에서, 하나의 재배열된 가변 유전자 서열은 비-인간 경쇄 불변 영역 유전자, 예를 들면, 내인성 비-인간 경 불변 영역 유전자에 작동가능하게 연결된다. 또 다른 구현예에서, 하나의 재배열된 가변 유전자 서열은 인간 경쇄 불변 영역 유전자에 작동가능하게 연결된다. 일부 측면에서, 하나의 재배열된 가변 유전자 서열은 내인성 면역글로불린 경쇄 좌위에 삽입된 인간 V:J 서열이어서, 생성된 비-인간 동물은 하나 이상의 경쇄 좌위에 기능성 비-재배열된 V 및/또는 J 유전자 분절을 포함하지 않는다.

일부 구현예에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 단리된 비-인간 세포 또는 조직이 제공되고, 여기서 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분, 및 선택적으로, 공통 또는 범용 경쇄를 각각 암호화하는, 하나 이상의 뉴클레오티드 서열을 포함하고 있다. 일부 구현예에서, 세포는 림프구성 또는 골수성 계통에서 유래한다. 일부 구현예에서, 세포는 림프구이다. 일부 구현예에서, 세포는 B 세포, 수지상 세포, 대식 세포, 단핵구 및 T 세포로부터 선택된다. 일부 구현예에서, 조직은 지방, 방광, 뇌, 가슴, 골수, 눈, 심장, 장, 신장, 간, 폐, 림프절, 근육, 췌장, 혈장, 혈청, 피부, 비장, 위, 흉선, 고환, 난자, 및 이의 조합으로부터 선택된다.

일부 구현예에서, 본원에서 기술된 바와 같은 단리된 비-인간 세포로부터 만들어진 불멸화 세포(immortalized cell)가 제공된다.

일부 구현예에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 비-인간 배아 줄기 (ES) 세포가 제공되고, 여기서 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분, 및 선택적으로, 공통 경쇄를 각각 암호화하는, 하나 이상의 뉴클레오티드 서열을 포함하고 있다. 일부 구현예에서, 비-인간 배아 줄기 세포는 설치류 배아 줄기 세포이다. 일부 구현예에서, 설치류 배아 줄기 세포는 마우스 배아 줄기 세포이고, 129 계통, C57BL 계통 또는 이의 혼합체로부터 유래한다. 일부 특정 구현예에서, 설치류 배아 줄기 세포는 마우스 배아 줄기 세포이고, 129 계통 및 C57BL 계통의 혼합체이다.

일부 구현예에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 비-인간 생식 세포가 제공되고, 여기서 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분, 및 선택적으로, 공통 경쇄를 각각 암호화하는, 하나 이상의 뉴클레오티드 서열을 포함하고 있다. 일부 구현예에서, 비-인간 생식 세포는 설치류 생식 세포이다. 일부 특정 구현예에서, 설치류 생식 세포는 마우스 생식 세포이고, 129 계통, C57BL 계통 또는 이의 혼합체로부터 유래한다. 일부 특정 구현예에서, 설치류 생식 세포는 마우스 생식 세포이고, 129 계통 및 C57BL 계통의 혼합체이다.

일부 구현예에서, 비-인간 동물을 제조하기 위한, 본원에 설명된 바와 같은 비-인간 배아 줄기 세포 또는 생식 세포의 용도가 제공된다. 일부 특정 구현예에서, 비-인간 배아 줄기 세포 또는 생식 세포는 마우스 배아 줄기 세포 또는 생식 세포이고 본원에 설명된 바와 같은, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역, 및 선택적으로, 공통 경쇄를 포함하는, 마우스를 제조하기 위해 사용된다. 일부 특정 구현예에서, 비-인간 배아 줄기 세포 또는 생식 세포는 랫트 배아 줄기 세포 또는 생식 세포이고 본원에 설명된 바와 같이, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역, 및 선택적으로, 공통 경쇄를 포함하는, 랫트를 제조하기 위해 사용된다.

일부 구현예에서, 본원에 설명된 바와 같은 비-인간 배아 줄기 세포를 포함하거나, 이로부터 제조되거나, 이로부터 수득되거나, 이로부터 생성된 비-인간 배아가 제공된다. 일부 특정 구현예에서, 비-인간 배아는 설치류 배아; 일부 구현예에서는, 마우스 배아; 일부 구현예에서는, 랫트 배아이다.

일부 구현예에서, 비-인간 동물을 제조하기 위한 본원에 설명된 비-인간 배아의 용도가 제공된다. 일부 특정 구현예에서, 비-인간 배아는 마우스 배아이고, 본원에 설명된 바와 같이, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역, 및 선택적으로, 공통 경쇄 좌위를 포함하는, 마우스를 제조하기 위해 사용된다. 일부 특정 구현예에서, 비-인간 배아는 랫트 배아이고, 본원에 설명된 바와 같이, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역, 및 선택적으로, 공통 경쇄 좌위를 포함하는, 랫트를 제조하기 위해 사용된다.

일부 구현예에서, 본원에 설명된 바와 같은 단리된 비-인간 세포 또는 조직, 본원에 설명된 바와 같은 불멸화 세포, 본원에 설명된 바와 같은 비-인간 배아 줄기 세포, 본원에 설명된 바와 같은 비-인간 배아, 또는 본원에 설명된 바와 같은 비-인간 동물을 포함하는 키트가 제공된다.

일부 구현예에서, 치료 또는 진단을 위한 약물(예, 항체 또는 그의 항원 결합 단편)의 제조 및/또는 개발에 사용하기 위한 본원에 설명된 바와 같은 키트가 제공된다.

일부 구현예에서, 질환, 장애 또는 병태의 치료, 예방 또는 완화를 위한 약물(예, 항체 또는 그의 항원 결합 단편)의 제조 및/또는 개발에 사용하기 위한 본원에 설명된 바와 같은 키트가 제공된다.

일부 구현예에서, 본원에 설명된 바와 같은 이식유전자, 핵산 구조체, DNA 구조체 또는 표적화 벡터가 제공된다. 일부 특정 구현예에서, 이식유전자, 핵산 구조체, DNA 구조체 또는 표적화 벡터는 본원에 설명된 바와 같은 조작된 D_H 영역을 포함한다. 일부 특정 구현예에서, 이식유전자, 핵산 구조체, DNA 구조체, 또는 표적화 벡터는 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열을 포함하는 DNA 단편을 포함한다. 일부 특정 구현예에서, 이식유전자, 핵산 구조체, DNA 구조체, 또는 표적화 벡터는 표 3 또는 표 4 중에서 선택된 하나 이상의 뉴클레오티드 코딩 서열을 포함하는 조작된 D_H 영역을 포함하며, 하나 이상의 뉴클레오티드 코딩 서열은 각각 도 2로부터 선택된 재조합 신호 서열이 측부에 위치한다. 일부 특정 구현예에서, 이식유전자, 핵산 구조체, DNA 구조체, 또는 표적화 벡터는 하나 이상의 선택 마커를 더 포함한다. 일부 특정 구현예에서, 이식유전자, 핵산 구조체, DNA 구조체, 또는 표적화 벡터는 하나 이상의 부위 특이적 재조합 부위(예, lox, Frt, 또는 이들의 조합)를 더 포함한다. 일부 특정 구현예에서, 이식유전자, 핵산 구조체, DNA 구조체 또는 표적화 벡터는 도 3a, 도 3b, 도 4a, 도 4b, 도 7a, 도 7b, 도 8a 및 도 8b 중 어느 하나에 예시된다.

일부 구현예에서, 비-인간 배아 줄기 세포, 비-인간 세포, 비-인간 배아 및/또는 비-인간 동물을 제조하기 위한 본원에 설명된 바와 같은 이식유전자, 핵산 구조체, DNA 구조체, 또는 표적화 벡터가 제공된다.

일부 구현예에서, 관심있는 비-면역글로불린 폴리펩티드는 케모카인(chemokine) 수용체이다. 일부 구현예에서, 케모카인 수용체는 CC-케모카인 수용체 (또는 β-케모카인 수용체), CXC-케모카인 수용체, CX3C-케모카인 수용체 및 XC-케모카인 수용체로 이루어진 군으로부터 선택된다. 일부 구현예에서, 케모카인 수용체는 비정형 케모카인 수용체 (ACKR)이다. 일부 구현예에서, ACKR는 ACKR1, ACKR2, ACKR3 및 ACKR4로 이루어진 군으로부터 선택된다. 일부 특정 구현예에서, ACKR는 ACKR2 또는 D6 케모카인 유인(decoy) 수용체이다.

일부 구현예에서, 관심있는 비-면역글로불린 폴리펩티드는 독소이다. 일부 구현예에서, 독소는 독거미(tarantula), 거미(spider), 전갈 또는 말미잘의 독에서 발견된 독소이다.

일부 구현예에서, 관심있는 비-면역글로불린 폴리펩티드는 코노독소 또는 독거미 독소이다. 일부 구현예에서, 코노독소는 α-코노독소, δ-코노독소, κ-코노독소, μ-코노독소, ω-코노독소 및 이들의 조합으로 이루어진 군으로부터 선택된다. 일부 특정 구현예에서, 코노독소는 μ-코노독소이다. 일부 특정 구현예에서, 독거미 독소는 ProTxI, ProTxII, Huwentoxin-IV (HWTX-IV) 또는 이들의 조합이다.

일부 구현예에서, 조작된 D_H 영역은 각각 D6 케모카인 유인 수용체의 세포외 부분을 암호화하거나, 각각 코노독소(예, μ-코노독소)의 일부분을 암호화하거나, 또는 각각 독거미 독소(예, ProTxI, ProTxII 등)의 일부분, 또는 이들의 조합을 암호화하는, 5, 10, 15, 20, 25개 이상의 뉴클레오티드 서열을 포함한다.

일부 구현예에서, 조작된 D_H 영역은 각각 D6 케모카인 유인 수용체의 세포외 부분을 암호화하는 25개의 뉴클레오티드 서열을 포함하거나 각각 코노독소(예, μ-코노독소) 및/또는 독거미 독소(예, ProTxI, ProTxII 등)의 일부분을 암호화하는 26개의 뉴클레오티드 서열을 포함한다.

일부 구현예에서, D6 케모카인 유인 수용체의 세포외 부분은 N-말단 영역, 세포외 루프, 및 이들의 조합으로 이루어진 군으로부터 선택된다.

일부 구현예에서, 본원에 설명된 코노독소의 일부분은 하나 이상의 이황화 결합을 포함하는 서열을 포함한다. 일부 구현예에서, 본원에 설명된 코노독소의 일부분은 자연에서 보이는 코노독소 서열(예를 들면, 기준 또는 모체 코노독소 서열)에 비해 하나 이상의 이황화 결합이 결여된 서열을 포함한다. 일부 구현예에서, 본원에 설명된 코노독소의 일부분은 자연에서 보이는 코노독소 서열(예를 들면, 기준 또는 모체 코노독소 서열)에 비해 동일하거나 상이한 이황화 결합의 개수 및/또는 패턴을 나타내는 서열을 포함한다.

일부 구현예에서, 본원에 설명된 독거미 독소의 일부분은 자연에서 발견되는 독거미 독소 서열에 보이는 시스테인 매듭 모티프를 포함하는 서열을 포함한다. 일부 구현예에서, 본원에 설명된 독거미 독소의 일부분은 시스테인 매듭 펩티드(들)이거나 이를 포함하는 서열을 포함한다. 일부 구현예에서, 본원에 설명된 독거미 독소의 일부분은 자연에서 보이는 독거미 독소 서열(예를 들면, 기준 또는 모체 독거미 서열)에 비해 하나 이상의 이황화 결합이 결여된 서열을 포함한다. 일부 구현예에서, 본원에 설명된 독거미 독소의 일부분은 자연에서 보이는 독거미 독소 서열(예를 들면, 기준 또는 모체 독거미 서열)에 비해 동일하거나 상이한 이황화 결합의 개수 및/또는 패턴을 나타내는 서열을 포함한다.

일부 구현예에서, 조작된 D_H 영역은 표 3 또는 표 4에 나타나는 뉴클레오티드 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 또는 적어도 98% 동일한 25 또는 26개 뉴클레오티드 서열을 포함하며 그리고/또는 표 3 또는 표 4에 나타나는 아미노산 서열을 암호화한다. 일부 구현예에서, 조작된 D_H 영역은 표 3 또는 표 4에 나타나는 아미노산 서열과 실질적으로 동일하거나 동일하거나, 표 3, 표 4에 나타나는 아미노산 서열과 동일한 기능을 갖는, 아미노산 서열을 각각 암호화하는 25 또는 26개 뉴클레오티드 서열을 포함한다.

일부 구현예에서, 하나 이상의 뉴클레오티드 서열은 하나 이상의 뉴클레오티드 서열의 체세포 과돌연변이(hypermutation)를 증가시키는 하나 이상의 뉴클레오티드 치환을 포함한다.

일부 구현예에서, 조작된 D_H 영역은 하나 이상의 뉴클레오티드 서열의 각각의 측부에 위치하고 있는 제1 및 제2 재조합 신호 서열을 포함한다. 일부 특정 구현예에서, 제1 재조합 신호 서열은 도 2에 나타나는 제1 재조합 신호 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 적어도 98% 동일한 서열을 포함한다. 일부 특정 구현예에서, 제1 재조합 신호 서열은 도 2에 나타나는 제1 재조합 신호 서열과 실질적으로 동일하거나 동일한 서열을 포함한다. 일부 특정 구현예에서, 제2 재조합 신호 서열은 도 2에 나타나는 제2 재조합 신호 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 적어도 98% 동일한 서열을 포함한다. 일부 특정 구현예에서, 제2 재조합 신호 서열은 도 2에 나타나는 제2 재조합 신호 서열과 실질적으로 동일하거나 동일한 서열을 포함한다. 일부 구현예에서, 제1 및 제2 재조합 신호 서열은 도 2에서 선택된다.

일부 구현예에서, 제공되는 비-인간 동물의 게놈은 하나 이상의 야생형 내인성 D_H 유전자 분절이 결여되어 있다. 일부 특정 구현예에서, 제공되는 비-인간 동물의 게놈은 모든 또는 실질적으로 모든 야생형 내인성 D_H 유전자 분절이 결여되어 있다. 일부 구현예에서, 제공되는 비-인간 동물의 게놈은 하나 이상의 야생형 내인성 재조합 신호 서열이 결여되어 있다.

일부 구현예에서, 조작된 D_H 영역은 하나 이상의 야생형 인간 D_H 유전자 분절을 포함한다. 일부 특정 구현예에서, 조작된 D_H 영역은 인간 D_H6-25 유전자 분절을 포함한다. 일부 특정 구현예에서, 조작된 D_H 영역은 인간 D_H6-25 유전자 분절이 결여되어 있다.

일부 구현예에서, 면역글로불린 중쇄 가변 영역은 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된다.

일부 구현예에서, 면역글로불린 중쇄 불변 영역은 내인성 면역글로불린 중쇄 불변 영역이다.

일부 구현예에서, 면역글로불린 중쇄 가변 영역은 예를 들어, 조작된 (e) D_H 영역 측부에 위치하는 적어도 하나의 인간 (h) 재배열되지 않은 V_H 유전자 분절 및/또는 적어도 하나의 인간 (h) 재배열되지 않은 J_H 유전자 분절을 포함하는, 재배열되지 않은 인간 면역글로불린 중쇄 가변 영역이다. 일부 구현예에서, 면역글로불린 중쇄 가변 영역은 조작된 (e) D_H 영역 측부에 위치하는 복수의 인간 (h) 재배열되지 않은 V_H 유전자 분절 및/또는 복수의 하나의 인간 (h) 재배열되지 않은 J_H 유전자 분절을 포함한다. 일부 구현예에서, 재배열되지 않은 인간 면역글로불린 중쇄 가변 영역은 예를 들어, 내인성 비-인간 중쇄 좌위에서, 면역글로불린 중쇄 불변 영역, 예를 들어, 비-인간 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된다.

일부 구현예에서, 인간 면역글로불린 중쇄 가변 영역은 재배열된 인간 면역글로불린 중쇄 가변 영역을 포함하고, 여기서 재배열된 인간 면역글로불린 중쇄는, 적어도 하나의 인간 (h) 재배열되지 않은 V_H 유전자 분절 및/또는 중쇄 불변 영역에 작동가능하게 연결될 수도 있는, 재배열된 (h)V_H/(e)D_H/(h)J_H 유전자 서열을 형성하도록, 조작된 (e) D_H-영역으로 재조합된 적어도 하나의 인간 (h) 재배열되지 않은 J_H 유전자 분절을 포함한다. 일부 구현예에서, 그러한 재조합은 B 세포 발생 동안 B 세포에서 일어난다.

따라서, 본원에 설명된 비-인간 동물은 하기를 포함할 수 있다

(i) 하기를 포함하는 재배열되지 않은 인간 중쇄 가변 영역을 포함하는 생식 세포

(a) 적어도 하나 또는 복수의 인간 (h) 재배열되지 않은 V_H 유전자 분절,

(b) 적어도 하나 또는 복수의 인간 (h) 재배열되지 않은 J_H 유전자 분절, 및

(c) (a) 및 (b)가 측부에 위치하는 조작된 (e) D_H 영역, 여기서 (a), (b) 및 (c)는 재조합되어서, 재배열된 인간 중쇄 가변 영역 hV_H/eD_H/hJ_H 서열을 형성함; 그리고

(ii) 재배열된 인간 hV_H/eD_H/hJ_H 서열을 포함하는, 체세포, 예를 들어, B 세포, 여기서 재배열된 hV_H/eD_H/hJ_H 유전자 서열은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 일부분, 또는 그의 체세포 과돌연변이된 변이체를 암호화하는 하나 이상의 뉴클레오티드 서열을 포함하는 CDR3 암호화 서열을 포함함. 일부 구현예에서, 인간 재배열되지 않은 또는 재배열된 인간 중쇄 가변 영역은, 예를 들어 비-인간 내인성 중쇄 좌위에서, 비-인간 중쇄 불변 영역일 수 있는, 중쇄 불변 영역에 작동가능하게 연결된다. 일부 구현예에서, 면역글로불린 중쇄 가변 영역은 인간 면역글로불린 중쇄 가변 영역이다. 일부 구현예에서, 상기 B 세포는 중쇄 불변 영역에 작동가능하게 연결된 재배열된 hV_H/eD_H/hJ_H 유전자 서열을 관심있는 비-면역글로불린 폴리펩티드, 그의 일부분, 또는 그의 체세포 과돌연변이된 변이체를 포함하는 CDR3을 포함하는 면역글로불린 중쇄-유사 폴리펩티드로 추가로 발현한다.

일부 구현예에서, 본원에 설명한 바와 같이 비-인간 동물은 인간화된 경쇄 좌위를 추가로 포함한다. 일부 구현예에서, 본원에 개시된 바와 같이 비-인간 동물은 하기를 포함한다

(i) 생식 세포 내:

(a) 재배열되지 않은 면역글로불린 중쇄 가변 영역 및 면역글로불린 중쇄 불변 영역을 포함하는 면역글로불린 중쇄 좌위, 여기서 재배열되지 않은 면역글로불린 중쇄 가변 영역은 적어도 하나의 재배열되지 않은 V_H 유전자 분절(인간 재배열되지 않은 V_H유전자 분절, 예를 들어, hV_H일 수 있음), 조작된 D_H 영역(인간 D_H 유전자 분절 및/또는 조작된 D_H 유전자 분절, 예를 들어, hD_H을 포함할 수 있음), 및 적어도 하나의 비재배열된, 선택적으로 인간, J_H 유전자 분절을 포함하고, 여기서 상기 V_H 유전자 분절, 조작된 D_H 영역, 및 J_H 유전자 분절(들)은 예를 들어, B 세포 발생 동안 B 세포에서, 재조합되어서, 면역글로불린 중쇄 불변 영역과 작동가능하게 연결되어 있는 재배열된 면역글로불린 중쇄 hV_H/eD_H-/hJ_H 가변 영역 유전자 서열을 형성할 수 있도록 작동가능하게 연결됨, 그리고

(b) 인간 V_L 및/또는 J_L 유전자 분절을 포함하며, (인간) 공통 경쇄를 암호화할 수 있는, 면역글로불린 경쇄 좌위; 그리고

(ii) 체세포, 예를 들어, B 세포 내,

(a) 면역글로불린 중쇄 불변 영역과 작동가능하게 연결되어 있는 재배열된 면역글로불린 중쇄 hV_H/eD_H-/hJ_H 가변 영역 유전자 서열, 여기서 조작된 D_H- 영역은 관심있는 비-면역글로불린 폴리펩티드, 그의 일부분을 암호화하는 서열을 포함하고, 여기서 재배열된 hV_H/eD_H/hJ_H 유전자 서열은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 일부분, 또는 그의 체세포 과돌연변이된 변이체를 암호화하는 하나 이상의 뉴클레오티드 서열을 포함하는 CDR3 암호화 서열을 포함함, 그리고

(b) 인간화 및/또는 공통 면역글로불린 경쇄 좌위 또는 그의 체세포 과돌연변이된 변이체. 일부 구현예에서, 인간 재배열되지 않은 또는 재배열된 인간 중쇄 가변 영역은, 예를 들어 비-인간 내인성 중쇄 좌위에서, 비-인간 중쇄 불변 영역일 수 있는, 중쇄 불변 영역에 작동가능하게 연결된다. 일부 구현예에서, 면역글로불린 중쇄 가변 영역은 인간 면역글로불린 중쇄 가변 영역이다. 일부 구현예에서, 상기 B 세포는 중쇄 불변 영역에 작동가능하게 연결된 재배열된 hV_H/eD_H/hJ_H 유전자 서열을 관심있는 비-면역글로불린 폴리펩티드, 그의 일부분, 또는 그의 체세포 과돌연변이된 변이체를 포함하는 CDR3을 포함하는 면역글로불린 중쇄-유사 폴리펩티드로, 그리고 인간(화) 및/또는 공통 경쇄를 사합체 면역글로불린-유사 항원 결합 단백질로 추가로 발현하고, 여기서 상기 사합체는 면역글로불린 중쇄-유사 폴리펩티드의 이합체를 포함하되, 각각은 인간(화) 및/또는 공통 경쇄에 공유 결합되어 있다.

일부 구현예에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 비-인간 동물을 제조하는 방법이 제공되고, 상기 방법은 (a) DNA 단편을 비-인간 배아 줄기 세포 내로 삽입하되, 상기 DNA 단편은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함하는, 단계; (b) (a)에서 생성된 비-인간 배아 줄기 세포를 얻는 단계; 그리고 (c) (b)의 배아 줄기 세포를 이용하여 비-인간을 생성하는 단계를 포함한다.

한 구현예에서, 본원에 개시된 비-인간 동물을 제조하는 방법은 (a) 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 제1 비-인간 동물을 얻는 단계, 그리고 (b) (a)의 제1 비-인간 동물을, 한 측면에서는, 상기 제1 비-인간 동물과 다른 계통일 수 있는, 제2 비-인간 동물과 교배하는 단계를 포함하고, 여기서 제2 비-인간 동물은 범용 경쇄를 발현하고, 여기서 상기 교배 결과, 예를 들어 CDR3에, 비-면역글로불린 단백질 (또는 그의 부분)의 아미노산 서열을 포함하는 유전자 조작된 중쇄, 및 유전자 조작된 재배열된 경쇄 (하나의 재배열된 경쇄; ULC)를 생산하며, 예를 들어 포함하는 자손을 생성시킨다.

일부 구현예에서, DNA 단편은 각각 D6 케모카인 유인 수용체의 세포외 부분을 암호화하거나 각각 코노독소의 일부분 (예를 들면, μ-코노독소), 독거미 독소, 또는 이들의 조합을 암호화하는 5, 10, 15, 20, 25개 이상의 뉴클레오티드 서열을 포함한다. 일부 특정 구현예에서, DNA 단편은 각각 D6 케모카인 유인 수용체의 세포외 부분을 암호화하는 25개의 뉴클레오티드 서열을 포함하거나 각각 코노독소의 일부분 (예를 들면, μ-코노독소) 및/또는 독거미 독소 (예를 들면, ProTxI, ProTxII 등)를 암호화하는 26개의 뉴클레오티드 서열을 포함한다. 일부 특정 구현예에서, DNA 단편은 상기 25개 또는 26개의 뉴클레오티드 서열의 각각의 측부에 위치하는, 제1 및 제2 재조합 신호 서열을 추가로 포함한다.

일부 구현예에서, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 비-인간 동물을 제조하는 방법이 제공되고, 상기 방법은 비-인간 동물의 게놈을 변형해서 그것이 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하게 되는 단계를 포함하며, 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함하며, 이에 따라 상기 비-인간 동물을 제조하게 된다.

일부 구현예에서, 비-인간 동물의 게놈은 변형되어 각각 D6 케모카인 유인 수용체의 세포외 부분을 암호화하거나 각각 코노독소의 일부분 (예를 들면, μ-코노독소), 독거미 독소, 또는 이들의 조합을 암호화하는 5, 10, 15, 20, 25개 이상의 뉴클레오티드 서열을 포함하게 된다. 일부 특정 구현예에서, 비-인간 동물의 게놈은 변형되어 각각 D6 케모카인 유인 수용체의 세포외 부분을 암호화하는 25개의 뉴클레오티드 서열을 포함하거나, 변형되어 각각 코노독소의 일부분 (예를 들면, μ-코노독소) 및/또는 독거미 독소 (예를 들면, ProTxI, ProTxII 등)를 암호화하는 26개의 뉴클레오티드 서열을 포함하게 된다. 일부 특정 구현예에서, 비-인간 동물의 게놈은 변형되어 상기 25개 또는 26개의 뉴클레오티드 서열의 각각의 측부에 위치하는, 제1 및 제2 재조합 신호 서열을 추가로 포함하게 된다.

일부 구현예에서, 비-인간 동물에서 항체를 생산하는 방법이 제공되며, 상기 방법은 (a) 비-인간 동물을 항원으로 면역화시키되, 비-인간 동물은 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 가지고, 여기서 조작된 D_H 영역은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함하는, 단계; (b) 상기 비-인간 동물이 상기 항원에 대한 면역 반응을 생성하는 충분한 조건 하에서 비-인간 동물을 유지하는 단계; 그리고 (c) 상기 항원을 결합하는, 항체를 비-인간 동물, 또는 비-인간 동물 세포로부터 회수하는 단계를 포함한다. 일부 특정 구현예에서, 비-인간 세포는 B 세포이다. 일부 특정 구현예에서, 비-인간 세포는 하이브리도마이다.

일부 구현예에서, (a) 하나 이상의 재배열되지 않은 인간 V_H 유전자 분절, 조작된 D_H 영역, 및 하나 이상의 재배열되지 않은 인간 J_H 유전자 분절을 포함하는 인간 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 비-인간 동물이 제공되며, 조작된 D_H 영역은 (i) 각각 비정형 케모카인 수용체 (ACKR)의 세포외 부분을 암호화하는 하나 이상의 뉴클레오티드 서열; 및 (ii) (i)의 하나 이상의 뉴클레오티드 서열의 각각의 측부에 위치하는, 제1 및 제2 재조합 신호 서열을 포함해서 하나 이상의 재배열되지 않은 인간 V_H 유전자 분절, 조작된 D_H 영역, 및 하나 이상의 재배열되지 않은 인간 J_H 유전자 분절이 예를 들면, B 세포에서, 재조합해서 비-인간 동물이 재배열된 hV_H/eD_H/hJ_H 유전자 서열을 포함하는 인간 면역글로불린 중쇄 가변 영역을 포함하는 B 세포 게놈을 포함하게 되고; 여기서 인간 면역글로불린 중쇄 가변 영역은 하나 이상의 내인성 면역글로불린 중쇄 불변 영역 유전자에 작동가능하게 연결되어서 비-인간 동물은 그것이 항원으로 면역화되었을 때, 면역글로불린 중쇄 불변 영역 유전자에 작동가능하게 연결된 재배열된 hV_H/eD_H/hJ_H 유전자 서열은 하나 이상의 인간 V_H 유전자 분절 (또는 그의 부분) 중 하나, 조작된 D_H 영역 (또는 그의 부분), 및 하나 이상의 내인성 면역글로불린 불변 영역 유전자에 의해 암호화된 비-인간 동물 중쇄 불변 도메인에 작동가능하게 연결된 인간 J_H 유전자 분절 (또는 그의 부분) 중 하나에 의해 암호화된 인간 중쇄 가변 도메인을 포함하는 항체를 암호화하는 것을 특징으로 하게 되고, 여기서 항체는 항원에 대한 특이적 결합을 보여준다. 일부 구현예에서, 비-인간 동물의 생식 세포와, 예를 들면, B 세포는 상기 항체가 공통 경쇄를 추가로 포함하도록 공통 경쇄를 암호화하는 면역글로불린 경쇄 좌위를 추가로 포함한다.

일부 구현예에서, 하나 이상의 재배열되지 않은 인간 (h) V_H 유전자 분절, 조작된 (e) D_H 영역, 및 하나 이상의 (h) 인간 J_H 유전자 분절을 포함하는 인간 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 비-인간 동물이 제공되며, 조작된 D_H 영역은 (i) 각각 독소의 일부분 (예를 들면, μ-코노독소, 독거미 독소, 또는 이들의 조합)을 암호화하는 하나 이상의 뉴클레오티드 서열; 및 (ii) (i)의 하나 이상의 뉴클레오티드 서열의 각각의 측부에 위치하는, 제1 및 제2 재조합 신호 서열을 포함해서 하나 이상의 재배열되지 않은 인간 V_H 유전자 분절, 조작된 D_H 영역, 및 하나 이상의 재배열되지 않은 인간 J_H 유전자 분절이 예를 들면, B 세포에서, 재조합해서 비-인간 동물이 재배열된 hV_H/eD_H/hJ_H 유전자 서열을 포함하는 인간 면역글로불린 중쇄 가변 영역을 포함하는 B 세포 게놈을 포함하게 되고; 여기서 인간 면역글로불린 중쇄 가변 영역은 하나 이상의 내인성 면역글로불린 중쇄 불변 영역 유전자에 작동가능하게 연결되어서 비-인간 동물은 그것이 항원으로 면역화되었을 때, 면역글로불린 중쇄 불변 영역 유전자에 작동가능하게 연결된 재배열된 hV_H/eD_H/hJ_H 유전자 서열은 하나 이상의 인간 V_H 유전자 분절 (또는 그의 부분) 중 하나, 조작된 D_H 영역 (또는 그의 부분), 및 하나 이상의 내인성 면역글로불린 불변 영역 유전자에 의해 암호화된 하나 이상의 중쇄 불변 도메인에 작동가능하게 연결된 인간 J_H 유전자 분절 (또는 그의 부분) 중 하나에 의해 암호화된 인간 중쇄 가변 도메인을 포함하는 항체를 암호화하는 것을 특징으로 하게 되고, 여기서 항체는 항원에 대한 특이적 결합을 보여준다. 일부 구현예에서, 비-인간 동물의 생식 세포와, 예를 들면, B 세포는 상기 항체가 공통 경쇄를 추가로 포함하도록 공통 경쇄를 암호화하는 면역글로불린 경쇄 좌위를 추가로 포함한다.

일부 구현예에서, 제공되는 비-인간 동물은 내인성 경쇄 좌위에 하나 이상의 인간 V_L 유전자 분절 및 하나 이상의 인간 J_L 유전자 분절의 삽입을 추가로 포함한다. 일부 구현예에서, 인간 V_L 및 J_L 분절은 Vκ 및 Jκ 유전자 분절이며 내인성 κ 경쇄 좌위에 삽입된다. 일부 구현예에서, 인간 Vκ 및 Jκ 유전자 분절은 설치류 Cκ 유전자(예를 들어 마우스 또는 랫트 Cκ 유전자)에 작동가능하게 연결된다. 일부 구현예에서, 인간 V_L 및 J_L 분절은 Vλ 및 Jλ 유전자 분절이며 내인성 λ 경쇄 좌위에 삽입된다. 일부 구현예에서, 인간 Vλ 및 Jλ 유전자 분절은 설치류 Cλ 유전자(예를 들어 마우스 또는 랫트 Cλ 유전자)에 작동가능하게 연결된다. 일부 구현예에서, 하나의 재배열된 인간 경쇄 가변 영역 유전자 서열은 내인성 비-인간 경쇄 불변 영역 유전자에 작동가능하게 연결된다. 일부 구현예에서, 하나의 재배열된 인간 Vκ/Jκ 유전자 서열은 내인성 Cκ 유전자 (예를 들어 마우스 또는 랫트 Cκ 유전자)에 작동가능하게 연결된다. 일부 구현예에서, 하나의 재배열된 Vλ/Jλ 유전자 서열은 내인성 Cλ 유전자에 작동가능하게 연결된다.

일부 구현예에서, 제공되는 비-인간 동물은 본원에 설명된 조작된 D_H 영역에 대해 동형접합체, 이형접합체 또는 반접합체이다. 일부 구현예에서, 제공되는 비-인간 동물은 본원에 설명된 조작된 D_H 영역에 대해 유전자이식형이다.

또한 본원에 개시된 것은 골수종 세포와 융합하여 그로부터 도출되는 세포, 예컨대 B 세포, 또는 하이브리도마이며, 각각은 하나 이상의 중쇄 불변 영역 유전자를 포함하는 인간 또는 비-인간 중쇄 불변 영역에 작동가능하게 연결될 수 있는, 재배열된 (h)V_H/eD_H/(h)J_H 서열을 포함한다. 이러한 세포, 예를 들면, B 세포는 본원에 설명된 바와 같은 비-인간 동물, 예를 들어, 설치류 (예컨대, 랫트, 마우스 등)로부터 단리될 수 있다.

또한 본원에 설명된 것은 하나 이상의 중쇄 불변 영역 유전자를 포함하는 인간 또는 비-인간 중쇄 불변 영역에 작동가능하게 연결될 수 있는, 재배열된 가변 (h)V_H/eD_H/(h)J_H 서열을 포함하는 뉴클레오티드 서열이다. 이러한 뉴클레오티드 서열은 본원에 설명된 바와 같은 비-인간 동물, 예를 들어, 설치류 (예컨대, 랫트, 마우스 등) 또는 비-인간 세포로부터 단리될 수 있다.

일부 구현예에서, 의료용으로 사용하기 위한 약물 또는 백신의 제조 및/또는 개발에 있어서 본원에서 기술된 바와 같은 비-인간 동물의 용도, 예컨대 약제로서의 용도가 제공된다.

일부 구현예에서, 질환, 장애 또는 병태의 치료를 위한 약제의 제조에 있어서 본원에서 기술된 바와 같은 비-인간 동물의 용도가 제공된다.

일부 구현예에서, 케모카인 또는 전압-관문 나트륨 (Na_V) 채널을 결합시키는 항체의 제조 및/또는 개발에 있어서 본원에서 기술된 바와 같은 비-인간 동물의 용도가 제공된다.

일부 구현예에서, 케모카인 또는 전압-관문 나트륨 (Na_V) 채널 발현 또는 기능을 특징으로 하는 질환의 치료 또는 검출을 위한 약제의 제조에 있어서 본원에서 기술된 바와 같은 비-인간 동물의 용도가 제공된다 (예를 들어, 비정상적인 발현 또는 기능).

일부 구현예에서, 치료 또는 진단을 위한 약물의 제조 및/또는 개발에 사용하기 위한, 본원에서 기술된 바와 같은 비-인간 동물이 제공한다.

일부 구현예에서, 질환, 장애 또는 병태의 치료, 예방 또는 완화를 위한 약제(medicament)의 제조에 사용하기 위한, 본원에서 기술된 바와 같은 비-인간 동물이 제공한다.

일부 구현예에서, 케모카인 또는 전압-관문 나트륨 (Na_V) 채널을 결합시키는 항체의 제조 및/또는 개발에 사용하기 위한 본원에서 기술된 바와 같은 비-인간 동물이 제공된다.

일부 구현예에서, 본원에서 기술된 바와 같은 질환, 장애 또는 병태는 감염성 질환, 장애 또는 병태이다. 일부 구현예에서, 질환, 장애 또는 병태는 케모카인 발현 또는 기능(예를 들어, 비정상적인 케모카인 발현 또는 기능)을 특징으로 한다.

일부 구현예에서, 질환, 장애 또는 병태는 통증 질환, 장애 또는 병태이다. 일부 구현예에서, 질환, 장애 또는 병태는 이온 채널 발현 또는 기능(예를 들어, 비정상적인 Na_V 채널 발현 또는 기능)을 특징으로 한다.

다양한 구현예에서, 본원에 제공된 비-인간 동물은 설치류; 일부 구현예에서, 마우스; 일부 구현예에서, 랫트이다.

본 출원에서 사용된 용어 "약" 및 "대략"은 동등하게 사용된다. 본 출원에서 사용된 임의의 수치는 약/대략을 사용하거나 사용하지 않더라도 당업자에 의해 이해되는 임의의 정상적인 변동을 포함하는 것을 의미한다.

본원에 개시된 비-인간 동물, 세포, 핵산 및 조성물의 다른 특징, 목적 및 이점은 하기 특정 구현예들의 상세한 설명에서 명백하다. 그러나, 본 발명의 특정한 구현예를 나타내지만, 상세한 설명은 단지 예시로서 제공될 뿐 제한하고자 함이 아닌 것으로 이해해야 한다.

다음의 도면들로 구성된 본원에 포함된 도면은 단지 예시를 위한 것이며 한정하기 위한 것이 아니다.
도 1a 내지 도 1d는 체세포 과돌연변이 핫스팟을 포함하도록 선택된 D6 케모카인 유인 수용체 코딩 서열의 예시적인 최적화를 보여준다. 도 1a: 천연 (파선 채움) 및 인공 (대각선 채움) RGYW 활성화-유도 시티딘 디아미나제 (activation-induced cytidine deaminase, AID) 핫스팟 지점을 갖는 D6 케모카인 유인 수용체의 최적화된 Nterm 도메인; 도 1b: 천연 (파선 채움) 및 인공 (대각선 채움) RGYW 활성화-유도 시티딘 디아미나제 (AID) 핫스팟 지점을 갖는 D6 케모카인 유인 수용체의 최적화된 EC1 도메인; 도 1c: 천연 (파선 채움) 및 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 D6 케모카인 유인 수용체의 최적화된 EC2 도메인; 도 1d: 천연 (파선 채움) 및 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 D6 케모카인 유인 수용체의 최적화된 EC3 도메인.
도 2는 각각의 뉴클레오티드 코딩 서열에 대해 V(D)J 재조합 중에 상기 뉴클레오티드 코딩 서열의 효율적인 재조합 빈도 및 동일한 사용을 허용하도록 설계된 예시적으로 최적화된 5' 및 3' 재조합 신호 서열 (RSS)의 표를 보여준다. 총체적 RSS 컨센서스 5' RSS (서열번호 51); 총체적 RSS 컨센서스 3' RSS (서열번호 52); 인간 D_H 컨센서스 5' RSS (서열번호 53); 인간 D_H 컨센서스 3' RSS (서열번호 54); 마우스 D_H 컨센서스 5' RSS (서열번호 55); 마우스 D_H 컨센서스 3' RSS (서열번호 56); 최적화된 RSS 5' RSS (서열번호 57); 최적화된 RSS 3' RSS (서열번호 58); 1-1 opt 5' RSS (서열번호 59); 1-1 opt 3' RSS (서열번호 60); 1-7 opt 5' RSS (서열번호 61); 1-7 opt 3' RSS (서열번호 62); 1-14 ORF opt 5' RSS (서열번호 63); 1-14 ORF opt 3' RSS (서열번호 64); 1-20 opt 5' RSS (서열번호 65); 1-20 opt 3' RSS (서열번호 66); 1-26 opt 5' RSS (서열번호 67); 1-26 opt 3' RSS (서열번호 68); 2-2*02 opt 5' RSS (서열번호 69); 2-2*02 opt 3' RSS (서열번호 70); 2-8*01 opt 5' RSS (서열번호 71); 2-8*01 opt 3' RSS (서열번호 72); 2-15 opt 5' RSS (서열번호 73); 2-15 opt 3' RSS (서열번호 74); 2-21*02 opt 5' RSS (서열번호 75); 2-21*02 opt 3' RSS (서열번호 76); 3-3*01 opt 5' RSS (서열번호 77); 3-3*01 opt 3' RSS (서열번호 78); 3-9 opt 5' RSS (서열번호 79); 3-9 opt 3' RSS (서열번호 80); 3-10*01 opt 5' RSS (서열번호 81); 3-10*01 opt 3' RSS (서열번호 82); 3-16*02 opt 5' RSS (서열번호 83); 3-16*02 opt 3' RSS (서열번호 84); 3-22 opt 5' RSS (서열번호 85); 3-22 opt 3' RSS (서열번호 86); 4-4 opt 5' RSS (서열번호 87); 4-4 opt 3' RSS (서열번호 88); 4-11 ORF opt 5' RSS (서열번호 89); 4-11 ORF opt 3' RSS (서열번호 90); 4-17 opt 5' RSS (서열번호 91); 4-17 opt 3' RSS (서열번호 92); 4-23 ORF opt 5' RSS (서열번호 93); 4-23 ORF opt 3' RSS (서열번호 94); 5-5 opt 5' RSS (서열번호 95); 5-5 opt 3' RSS (서열번호 96); 5-12 opt 5' RSS (서열번호 97); 5-12 opt 3' RSS (서열번호 98); 5-18 opt 5' RSS (서열번호 99); 5-18 opt 3' RSS (서열번호 100); 5-24 ORF opt 5' RSS (서열번호 101); 5-24 ORF opt 3' RSS (서열번호 102); 6-6 opt 5' RSS (서열번호 103); 6-6 opt 3' RSS (서열번호 104); 6-13 opt 5' RSS (서열번호 105); 6-13 opt 3' RSS (서열번호 106); 6-19 opt 5' RSS (서열번호 107); 6-19 opt 3' RSS (서열번호 108); 6-25 (최적화되지 않음) 5' RSS (서열번호 109); 6-25 (최적화되지 않음) 3' RSS (서열번호 110); 7-27 (최적화되지 않음) 5' RSS (서열번호 111); 7-27 (최적화되지 않음) 3' RSS (서열번호 112). 총체적 RSS 컨센서스 및 7-27에 대한 굵고 이탤릭체 글꼴은 면역글로불린 및 T 세포 수용체 V, D 및 J 유전자 분절의 설치류 및 인간 RSS에 기초한 총체적 RSS 컨센서스 서열과 일치함을 나타내며; 마우스 D_H 컨센서스에 대한 굵은 글꼴은 면역글로불린 D_H 컨센서스 서열과 일치함을 나타내며; 인간 D_H 컨센서스, 최적화된 RSS 및 나머지 모든 RSS (예, 1-1 opt, 1-7 opt, 1-20 opt 등)에 대한 굵은 글꼴은 인간 면역글로불린 D_H 컨센서스 서열과 일치함을 나타낸다.
도 3a 내지 도 3b는 설치류 배아 줄기 (ES) 세포 내로 통합시켜서 조작된 다양성 클러스터 (즉, D_H 영역)를 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 설치류를 형성하기 위한 표적화 벡터의 구축을 위한 예시적인 전략을 나타내며(실제 비율 아님), 이때 다양성 클러스터는 비-면역글로불린 폴리펩티드의 부분 (예, D6 케모카인 유인 수용체의 세포외 부분)을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 도 3a: 다음과 같이 강조하는 네 가지 초기 단계, (1) D6 코딩 서열의 드 노보 합성, (2) 선택 카세트 (예, 네오마이신) 및 D6 DNA 단편의 AgeI/EcoRI 절단 및 연결, (3) D6 DNA 단편의 SnaBI 절단 및 BAC 벡터 (pBacE3.6)의 NotI/AscI 절단, 및 (4) 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열의 인접하는 조작된 다양성 클러스터를 생성하기 위한, 절단된 DNA 단편들의 1단계 등온 조립; 도 3b: 설치류 ES 세포의 게놈 내로의 통합을 위한 표적화 벡터를 생성하기 위한 추가 단계, (5) 인간 면역글로불린 V_H DNA 및 J_H DNA을 각각 함유하는 5' 및 3' 상동성 암을 덧붙이기 위한, 25 합성 D6 케모카인 유인 수용체 코딩 서열의 BAC 클론 내로의 PI-SceI/I-CeuI 절단 및 연결. 도시된 DNA 단편들 각각에 대하여 다양한 제한 효소 인식 부위가 표시되어 있다. lp: loxP 부위; neo: 유비퀴틴 프로모터로 구동되는 네오마이신 선택 카세트; cm: 클로람페니콜 선택 카세트; frt: 플립파아제 인식 표적 서열(Flippase recognition target sequence); hyg: 하이그로마이신(hygromycin) 선택 카세트; Ei: 쥐 중쇄 인트론 인핸서; IgM: 쥐 면역글로불린 M 불변 영역 유전자; lox: pBACe3.6 벡터의 loxP 부위 서열.
도 4a 내지 도 4b는 설치류 배아 줄기 (ES) 세포 내로 통합시켜서 조작된 다양성 클러스터 (즉, D_H 영역)를 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 설치류를 형성하기 위한 표적화 벡터의 구축을 위한 순차적 연결에 의해 D6 케모카인 유인 수용체 코딩 서열을 조립하는 대안적인 예시적인 전략을 나타내며(실제 비율 아님), 이때 다양성 클러스터는 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 도 4a: 다음과 같이 강조하는 네 가지 초기 단계, (1) D6 코딩 서열의 드 노보 합성, (2) 선택 카세트 (예, 네오마이신) 및 D6 DNA 단편의 AgeI/EcoRI 절단 및 연결, (3) D6 DNA 단편의 BAC 벡터 (pBacE3.6) 내로의 NotI/AscI 절단 및 연결, 및 (4) D6 단편들의 BAC 벡터 골격 내로의 PacI/Nsi 절단 및 연결; 도 4b: 설치류 ES 세포의 게놈 내로의 통합을 위한 표적화 벡터를 생성하기 위한 두 가지 추가 단계, (5) 추가 D6 DNA 단편의 BAC 벡터 골격 내로의 PI-SceI/I-CeuI 절단 및 연결, 및 (6) BAC 벡터 골격 내로의 25 합성 D6 케모카인 유인 수용체 코딩 서열을 생성하기 위한 최종 D6 DNA 단편의 NsiI/I-CeuI 절단 및 연결. 도시된 DNA 단편들 각각에 대하여 다양한 제한 효소 인식 부위가 표시되어 있다. lp: loxP 부위 서열; neo: 유비퀴틴 프로모터로 구동되는 네오마이신 선택 카세트; cm: 클로람페니콜 선택 카세트.
도 5는 TAQMAN™에 의해 스크리닝하고 핵형분석하는, 전기천공 후 약물-내성 콜로니의 유전 물질을 사용하는 스크리닝 전략을 보여준다. 다양한 프라이머/프로브 세트 (표 7 참조)의, 명칭과 대략적인 위치가 (실제 비율 아님) 보여지는 아래 다양한 대립유전자로 (실제 비율 아님) 표시되어 있다. hyg: 유비퀴틴 프로모터로 구동되는 하이그로마이신 선택 카세트; neo: 유비퀴틴 프로모터로 구동되는 네오마이신 선택 카세트; L: loxP 부위 서열; Frt: 플립파아제 인식 표적 서열.
도 6a 내지 도 6l은 체세포 과돌연변이 핫스팟을 포함하기 위한 선택된 μ-코노독소 및 독거미 독소 코딩 서열의 예시적인 최적화를 보여준다. 도 6a: 인공 (대각선 채움) RGYW 활성화-유도 시티딘 디아미나제 (AID) 핫스팟 지점을 갖는 μ-코노독소의 최적화된 KIIIA fl; 도 6b: 인공 (대각선 채움) RGYW 활성화-유도 시티딘 디아미나제 (AID) 핫스팟 지점을 갖는 μ-코노독소의 최적화된 KIIIA 소형 (상단) 및 KIIIA 중형 (하단); 도 6c: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 μ-코노독소의 최적화된 PIIIA fl; 도 6d: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 μ-코노독소의 최적화된 PIIIA 소형 (상단) 및 PIIIA 중형 (하단); 도 6e: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 μ-코노독소의 최적화된 SMIIIA fl; 도 6f: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 μ-코노독소의 최적화된 SmIIIA 소형 (상단) 및 SmIIIA 중형 (하단); 도 6g: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 최적화된 ProTxII 독거미 독소; 도 6h: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 최적화된 독거미 독소 ProTxII C1SC4S (상단), ProTxII C2SC5S (중간) 및 ProTxII C3SC6S (하단); 도 6i: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 μ-코노독소의 최적화된 SmIIIA SSRW 루프 (좌측), SmIIIA SSKW 루프 (중간) 및 PIIIA RSRQ 루프 (우측); 도 6j: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 D_H3 분절 지점들 속 μ-코노독소의 최적화된 KIIIA 또는 SmIIIA 소형/중형; 도 6k: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 D_H3 또는 D_H1 분절 지점들 속 μ-코노독소의 최적화된 SmIIIA 또는 PIIIA 소형/중형; 도 6l: 인공 (대각선 채움) RGYW AID 핫스팟 지점을 갖는 D_H2 분절 지점들 속 μ-코노독소의 최적화된 SSRW 또는 RSRQ 루프.
도 7a 내지 도 7b는 설치류 배아 줄기 (ES) 세포 내로 통합시켜서 조작된 다양성 클러스터 (즉, D_H 영역)를 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 설치류를 형성하기 위한 표적화 벡터의 구축을 위한 예시적인 전략을 나타내며(실제 비율 아님), 이때 다양성 클러스터는 비-면역글로불린 폴리펩티드의 부분 (예, μ-코노독소 및/또는 독거미 독소의 부분)을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 도 7a: 다음과 같이 강조하는 네 가지 초기 단계, (1) 독소 코딩 서열의 드 노보 합성, (2) 선택 카세트 (예, 네오마이신) 및 독소 DNA 단편 (TX-DH1166)의 AgeI/EcoRI 절단 및 연결, (3) 독소 DNA 단편의 SnaBI 절단 및 BAC 벡터 (pBacE3.6)의 NotI/AscI 절단, 및 (4) 하나 이상, 및 임의적으로, 모든 기능적인 D_H 분절 대신 인접하는 독소 코딩 서열을 포함하는 조작된 다양성 클러스터를 생성하기 위한, 절단된 DNA 단편들의 1단계 등온 조립; 도 7b: 설치류 ES 세포의 게놈 내로의 통합을 위한 표적화 벡터를 생성하기 위한 추가 단계, (5) 인간 면역글로불린 V_H DNA 및 J_H DNA을 각각 함유하는 5' 및 3' 상동성 암을 덧붙이기 위한, 26 합성 독소 코딩 서열의 BAC 클론 내로의 PI-SceI/I-CeuI 절단 및 연결. 도시된 DNA 단편들 각각에 대하여 다양한 제한 효소 인식 부위가 표시되어 있다. lp: loxP 부위; neo: 유비퀴틴 프로모터로 구동되는 네오마이신 선택 카세트; cm: 클로람페니콜 선택 카세트; frt: 플립파아제 인식 표적 서열; hyg: 하이그로마이신 선택 카세트; Ei: 쥐 중쇄 인트론 인핸서; IgM: 쥐 면역글로불린 M 불변 영역 유전자; lox: pBACe3.6 벡터의 loxP.
도 8a 내지 도 8b는 설치류 배아 줄기 (ES) 세포 내로 통합시켜서 조작된 다양성 클러스터 (즉, D_H 영역)를 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 설치류를 형성하기 위한 표적화 벡터의 구축을 위한 순차적 연결에 의해 독소 (예, μ-코노독소 및 독거미 독소) 코딩 서열을 조립하는 대안적인 예시적인 전략을 나타내며(실제 비율 아님), 이때 다양성 클러스터는 독소 펩티드 (예, μ-코노독소 및 독거미 독소 ProTxII)의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 도 8a: 다음과 같이 강조하는 네 가지 초기 단계, (1) 독소 코딩 서열의 드 노보 합성, (2) 선택 카세트 (예, 네오마이신) 및 독소 DNA 단편 (TX-DH1166)의 AgeI/EcoRI 절단 및 연결, (3) 독소 DNA 단편의 BAC 벡터 (pBacE3.6) 내로의 NotI/AscI 절단 및 연결, 및 (4) 독소 DNA 단편들의 BAC 벡터 골격 내로의 PacI/Nsi 절단 및 연결; 도 8b: 설치류 ES 세포의 게놈 내로의 통합을 위한 표적화 벡터를 생성하기 위한 두 가지 추가 단계, (5) 추가 독소 DNA 단편의 BAC 벡터 골격 내로의 PI-SceI/I-CeuI 절단 및 연결, 및 (6) BAC 벡터 골격 내로의 26 합성 독소 코딩 서열을 생성하기 위한 최종 독소 DNA 단편의 NsiI/I-CeuI 절단 및 연결. 도시된 DNA 단편들 각각에 대하여 다양한 제한 효소 인식 부위가 표시되어 있다. lp: loxP 부위; neo: 유비퀴틴 프로모터로 구동되는 네오마이신 선택 카세트; cm: 클로람페니콜 선택 카세트.
도 9a 내지 도 9d는 VELOCIMMUNE® (VI) 및 독소 코딩 서열을 함유하는 조작된 D_H 영역에 대해 동형접합체인 마우스 (6579ho/1293ho, "TX-D_H ho"; 다수의 인간 V_H, 전통적인 D_H 분절 대신 독소 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 동형접합체 면역글로불린 중쇄 좌위; 및 설치류 κ 경쇄 인핸서를 포함하여 설치류 Cκ 영역 유전자에 작동가능하게 연결된 인간 Vκ 및 Jκ 유전자 분절을 함유하는 동형접합체 면역글로불린 κ 경쇄 좌위를 포함하는 게놈을 갖는 설치류 계통)로부터 수확되고, 다양한 세포 마커의 세포 표면 발현을 위해 염색시킨 비장 내 림프구의 개략적인 등고선도이다. 도 9a: CD19 (y-축) 및 CD3 (x-축)의 발현을 보여주는 단항(singlet)에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도. 도 9b: 면역글로불린 D (IgD, y-축) 및 면역글로불린 M (IgM, x-축)의 발현을 보여주는 CD19⁺에 대해 게이팅된 비장 단항으로부터의 림프구의 개략적인 등고선도; 성숙 (CD19⁺ IgD⁺ IgM^int) 및 이행 (CD19⁺ IgD^int IgM) B 세포들이 각 점도표에 표시된다. 도 9c: Igλ (y-축) 또는 Igκ (x-축) 경쇄의 발현을 보여주는 CD19⁺에 대해 게이팅된 비장 단항으로부터의 림프구의 개략적인 등고선도. 도 9d: CD19⁺에 대해 게이팅된 비장 단항으로부터의 림프구를 예시하며 [좌측에서 우측으로] 면역글로불린 CD93 (y-축) 및 B220 (x-축), IgM (y-축) 및 CD23 (x-축); CD21/35 (y-축) 및 IgM (x-축), B220 (y-축) 및 CD23 (x-축), 및 IgD (y-축) 및 IgM (x-축)의 발현을 보여주는 B 세포 성숙의 개략적인 등고선도를 보여준다. 상단 열: VELOCIMMUNE® 마우스; 하단 열: TX-D_H ho (6579ho/1293ho) 마우스. 특정 B 세포 집단이 각 점도표에 표시된다: 미성숙 (CD19⁺ CD93⁺ B220⁺), 성숙 (CD19⁺ CD93^- B220⁺), T1 (CD19⁺ CD93⁺ B220⁺ IgM⁺ CD23^-), T2 (CD19⁺ CD93⁺ B220⁺ IgM⁺ CD23⁺), T3 (CD19⁺ CD93⁺ B220⁺ IgM^int CD23⁺), MZ (CD19⁺ CD93^- B220⁺ CD21/35⁺ IgM⁺CD23^-), MZ 전구체 (CD19⁺ CD93^- B220⁺ CD21/35⁺IgM⁺CD23⁺), Fol I (CD19⁺ CD93^- B220⁺ CD21/35^int IgM^intIgD⁺), 및 Fol II (CD19⁺ CD93^- B220⁺ CD21/35^int IgM⁺IgD⁺).
도 10a 내지 도 10d는 VELOCIMMUNE® (VI) 및 독소 코딩 서열을 함유하는 조작된 D_H 영역에 대해 동형접합체인 마우스 (6579ho/1293ho, "TX-D_H ho"; 다수의 인간 V_H, 전통적인 D_H 분절 대신 독소 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 동형접합체 면역글로불린 중쇄 좌위; 및 설치류 κ 경쇄 인핸서를 포함하여 설치류 Cκ 영역 유전자에 작동가능하게 연결된 인간 Vκ 및 Jκ 유전자 분절을 함유하는 동형접합체 면역글로불린 κ 경쇄 좌위를 포함하는 게놈을 갖는 설치류 계통)로부터 수확되고, 다양한 세포 마커의 세포 표면 발현을 위해 염색시킨 골수 내 림프구의 개략적인 등고선도이다. 도 10a: CD19 (y-축) 및 CD3 (x-축)의 발현을 보여주는 단항(singlet)에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도. 도 10b: c-키트 (y-축) 및 CD43 (x-축)의 발현을 보여주는 CD19⁺IgM^{- /low}IgD^-에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도; pre- (c-키트^-CD43^-) 및 pro-B (c-키트⁺CD43⁺) 세포들이 각 점도표에 표시된다. 도 10c: IgM (y-축) 및 B220 (x-축)의 발현을 보여주는 단항에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도; 미성숙 (IgM^{int to +}B220^int) 및 성숙 (IgM^{int to +}B220⁺) B 세포들이 각 점도표에 표시된다. 도 10d: Igλ (y-축) 또는 Igκ (x-축) 경쇄의 발현을 보여주는 CD19⁺IgM^{int to +}B220^int (상단 열) 및 CD19⁺IgM^int/+B220⁺ (하단 열)에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도.
도 11a 내지 도 11d는 VELOCIMMUNE® (VI) 및 D6 코딩 서열을 함유하는 조작된 D_H 영역에 대해 이형접합체인 마우스 (6590het, "D6-D_H het"; 다수의 인간 V_H, 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 이형접합체 면역글로불린 중쇄 좌위를 포함하는 게놈을 갖는 설치류 계통)로부터 수확되고, 다양한 세포 마커의 세포 표면 발현을 위해 염색시킨 비장 내 림프구의 개략적인 등고선도이다. 도 11a: CD19 (y-축) 및 CD3 (x-축)의 발현을 보여주는 단항(singlet)에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도. 도 11b: IgD (y-축) 및 IgM (x-축)의 발현을 보여주는 CD19⁺ 단항에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도; 성숙 (CD19⁺ IgD⁺ IgM^int) 및 이행 (CD19⁺ IgD^int IgM⁺) B 세포들이 각 점도표에 표시된다. 도 11c: Igλ (y-축) 또는 Igκ (x-축) 경쇄의 발현을 보여주는 CD19⁺ 단항에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도. 도 11d: CD19⁺ 단항에 대해 게이팅된 비장으로부터의 림프구를 예시하며 [좌측에서 우측으로] CD93 (y-축) 및 B220 (x-축), IgM (y-축) 및 CD23 (x-축); CD21/35 (y-축) 및 IgM (x-축), B220 (y-축) 및 CD23 (x-축), 및 IgD (y-축) 및 IgM (x-축)의 발현을 보여주는 B 세포 성숙의 개략적인 등고선도를 보여준다. 상단 열: VELOCIMMUNE® 마우스; 하단 열: D6-D_H het (6590het) 마우스. 특정 B 세포 집단이 각 점도표에 표시된다: 미성숙 (CD19⁺ CD93⁺ B220⁺), 성숙 (CD19⁺ CD93^- B220⁺), T1 (CD19⁺ CD93⁺ B220⁺ IgM⁺ CD23^-), T2 (CD19⁺ CD93⁺ B220⁺ IgM⁺ CD23⁺), T3 (CD19⁺ CD93⁺ B220⁺ IgM^int CD23⁺), MZ (CD19⁺ CD93^- B220⁺ CD21/35⁺ IgM⁺CD23^-), MZ 전구체 (CD19⁺ CD93^- B220⁺ CD21/35⁺IgM⁺CD23⁺), Fol I (CD19⁺ CD93^- B220⁺ CD21/35^int IgM^intIgD⁺), 및 Fol II (CD19⁺ CD93^- B220⁺ CD21/35^int IgM⁺IgD⁺).
도 12a 내지 도 12d는 VELOCIMMUNE® (VI) 및 D6 코딩 서열을 함유하는 조작된 D_H 영역에 대해 이형접합체인 마우스 (6590het, "D6-D_H het"; 다수의 인간 V_H, 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 이형접합체 면역글로불린 중쇄 좌위를 포함하는 게놈을 갖는 설치류 계통)로부터 수확되고, 다양한 세포 마커의 세포 표면 발현을 위해 염색시킨 골수 내 림프구의 개략적인 등고선도이다. 도 12a: CD19 (y-축) 및 CD3 (x-축)의 발현을 보여주는 단항(singlet)에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도. 도 12b: c-키트 (y-축) 및 CD43 (x-축)의 발현을 보여주는 CD19⁺IgM^{- to} ^lowIgD^-에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도; pre- B (c-키트^- CD43^-) 및 pro-B (c-키트⁺ CD43⁺) 세포들이 각 점도표에 표시된다. 도 12c: IgM (y-축) 및 B220 (x-축)의 발현을 보여주는 CD19⁺에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도; 미성숙 (IgM^{int to +}B220^int) 및 성숙 (IgM^{int to +}B220⁺), pre- 및 pro-B 세포들 (IgM^{- to low}B220^int)이 각 점도표에 표시된다. 도 12d: Igλ (y-축) 또는 Igκ (x-축) 경쇄의 발현을 보여주는 CD19⁺IgM^{int to +}B220^int (상단 열) 및 CD19⁺IgM^{int to +}B220⁺ (하단 열)에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도.
도 13a 내지 도 13d는 VELOCIMMUNE® (VI) 및 D6 코딩 서열을 함유하는 조작된 D_H 영역에 대해 동형접합체인 마우스 (6590ho/1293ho, "D6-D_H ho"; 다수의 인간 V_H, 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 동형접합체 면역글로불린 중쇄 좌위; 및 설치류 κ 경쇄 인핸서를 포함하여 설치류 Cκ 영역 유전자에 작동가능하게 연결된 인간 Vκ 및 Jκ 유전자 분절을 함유하는 동형접합체 면역글로불린 κ 경쇄 좌위를 포함하는 게놈을 갖는 설치류 계통)로부터 수확되고, 다양한 세포 마커의 세포 표면 발현을 위해 염색시킨 비장 내 림프구의 개략적인 등고선도이다. 도 13a: CD19 (y-축) 및 CD3 (x-축)의 발현을 보여주는 단항(singlet)에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도. 도 13b: IgD (y-축) 및 IgM (x-축)의 발현을 보여주는 CD19⁺에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도; 성숙 (CD19⁺ IgD⁺ IgM^int) 및 이행 (CD19⁺ IgD^int IgM⁺) B 세포들이 각 점도표에 표시된다. 도 13c: Igλ (y-축) 또는 Igκ (x-축) 경쇄의 발현을 보여주는 CD19⁺에 대해 게이팅된 비장으로부터의 림프구의 개략적인 등고선도. 도 13d: CD19⁺ 단항에 대해 게이팅된 비장으로부터의 림프구를 예시하며 [좌측에서 우측으로] CD93 (y-축) 및 B220 (x-축), IgM (y-축) 및 CD23 (x-축); CD21/35 (y-축) 및 IgM (x-축), B220 (y-축) 및 CD23 (x-축), 및 IgD (y-축) 및 IgM (x-축)의 발현을 보여주는 B 세포 성숙의 개략적인 등고선도를 보여준다. 상단 열: VELOCIMMUNE® 마우스; 하단 열: D6-D_H ho (6590ho) 마우스. 특정 B 세포 집단이 각 점도표에 표시된다: 미성숙 (CD19⁺ CD93⁺ B220⁺), 성숙 (CD19⁺ CD93^- B220⁺), T1 (CD19⁺ CD93⁺ B220⁺ IgM⁺ CD23^-), T2 (CD19⁺ CD93⁺ B220⁺ IgM⁺ CD23⁺), T3 (CD19⁺ CD93⁺ B220⁺ IgM^int CD23⁺), MZ (CD19⁺ CD93^- B220⁺ CD21/35⁺ IgM⁺CD23^-), MZ 전구체 (CD19⁺ CD93^- B220⁺ CD21/35⁺IgM⁺CD23⁺), Fol I (CD19⁺ CD93^- B220⁺ CD21/35^int IgM^intIgD⁺), 및 Fol II (CD19⁺ CD93^- B220⁺ CD21/35^int IgM⁺IgD⁺).
도 14a 내지 도 14d는 VELOCIMMUNE® (VI) 및 D6 코딩 서열을 함유하는 조작된 D_H 영역에 대해 동형접합체인 마우스 (6590ho/1293ho, "D6-D_H ho"; 다수의 인간 V_H, 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 동형접합체 면역글로불린 중쇄 좌위; 및 설치류 κ 경쇄 인핸서를 포함하여 설치류 Cκ 영역 유전자에 작동가능하게 연결된 인간 Vκ 및 Jκ 유전자 분절을 함유하는 동형접합체 면역글로불린 κ 경쇄 좌위를 포함하는 게놈을 갖는 설치류 계통)로부터 수확되고, 다양한 세포 마커의 세포 표면 발현을 위해 염색시킨 골수 내 림프구의 개략적인 등고선도이다. 도 14a: CD19 (y-축) 및 CD3 (x-축)의 발현을 보여주는 단항(singlet)에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도. 도 14b: c-키트 (y-축) 및 CD43 (x-축)의 발현을 보여주는 CD19⁺IgM^{- to} ^lowIgD^-에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도; pre- B (c-키트^- CD43^-) 및 pro-B (c-키트⁺ CD43⁺) 세포들이 각 점도표에 표시된다. 도 14c: IgM (y-축) 및 B220 (x-축)의 발현을 보여주는 CD19⁺에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도; 미성숙 (IgM^{int to +}B220^int) 및 성숙 IgM^{int to +}B220⁺), pre- 및 pro-B 세포들 (IgM^{- to low}B220^int)이 각 점도표에 표시된다. 도 14d: Igλ (y-축) 또는 Igκ (x-축) 경쇄의 발현을 보여주는 CD19⁺IgM^{int to +}B220^int (상단 열) 및 CD19⁺IgM^{int to +}B220⁺ (하단 열)에 대해 게이팅된 골수로부터의 림프구의 개략적인 등고선도.
도 15는 3마리 6579ho/1293ho 마우스 ("TX-D_H ho", 상기)의 비장 및 골수로부터 증폭된 RNA에서 조작된 D_H 영역 내 독소 코딩 서열의 개략적인 사용 빈도를 보여준다 (모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음). y-축은 조작된 D_H 영역 내의 각 독소 코딩 서열의 명칭을 나타낸다. x-축은 분석된 서열 판독 중 각 독소 코딩 서열의 빈도 (서열의 퍼센트)를 나타낸다.
도 16은 3마리 6579ho/1293ho 마우스 ("TX-D_H ho", 상기)의 비장 및 골수로부터 증폭된 RNA에서 인간 V_H 유전자 분절의 개략적인 사용 퍼센트를 보여준다 (모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음). x-축은 인간화된 중쇄 가변 영역 내의 각 인간 V_H 유전자 분절의 명칭을 나타낸다.
도 17은 3마리 6579ho/1293ho 마우스 ("TX-D_H ho", 상기)의 비장 및 골수로부터 증폭된 RNA에서 인간 J_H 유전자 분절의 개략적인 사용 퍼센트를 보여준다 (모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음). x-축은 인간화된 중쇄 가변 영역 내의 각 인간 J_H 유전자 분절의 명칭을 나타낸다.
도 18은 3마리 6590het 마우스 ("D6-D_H het", 상기)의 비장 및 골수로부터 증폭된 RNA에서 조작된 D_H 영역 내 선택된 D6 코딩 서열의 개략적인 사용 빈도를 보여준다 (모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음). y-축은 조작된 D_H 영역 내의 선택된 D6 코딩 서열의 명칭을 나타낸다. x-축은 분석된 서열 판독 중 D6 코딩 서열의 빈도 (서열의 퍼센트)를 나타낸다. BM: 골수.
도 19는 3마리 6590het 마우스 ("D6-D_H het", 상기)의 비장 및 골수로부터 증폭된 RNA에서 인간 V_H 유전자 분절의 개략적인 사용 퍼센트를 보여준다 (모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음). x-축은 인간화된 중쇄 가변 영역 내의 각 인간 V_H 유전자 분절의 명칭을 나타낸다. BM: 골수.
도 20은 3마리 6590het 마우스 ("D6-D_H het", 상기)의 비장 및 골수로부터 증폭된 RNA에서 인간 J_H 유전자 분절의 개략적인 사용 퍼센트를 보여준다 (모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음). x-축은 인간화된 중쇄 가변 영역 내의 각 인간 J_H 유전자 분절의 명칭을 나타낸다. BM: 골수.
도 21은 세포 표면 단백질의 조작된 수용성 형태로 면역화 후 대조군 및 6579HO/1634 동물 (x-축)로부터 배경 (y-축) 위의 역가를 나타낸다.

정의

본 개시내용을 읽는 당업자라면, 상술한 구현예들과 균등하거나 또는 본 개시내용의 범위 내에서 다양한 변형을 알 수 있을 것이다. 일반적으로, 본원에서 사용된 용어는 달리 명시되지 않는 한, 당해 기술분야에서 이해되는 의미에 따른다. 특정 용어에 대한 명시적 정의가 여기에 그리고 아래에 제공된다; 본 명세서 전반에 걸친 특정 경우의 이들 및 다른 용어들의 의미는 문맥으로부터 당업자에게 명백할 것이다. 하기 용어들 및 기타 용어들에 대한 추가 정의는 본 명세서 전반에 걸쳐 제시된다. 본 명세서, 또는 이의 관련 부분에 인용된 참고문헌들은 본원에 참고로 포함된다.

투여 : 조성물을 대상 또는 시스템 (예를 들어, 세포, 기관, 조직, 유기체 또는 관련 성분 또는 그의 성분 세트)에 투여하는 것을 의미한다. 당업자라면 투여 경로가 예를 들어, 조성물이 투여되고 있는 대상 또는 시스템, 조성물의 성질, 투여 목적 등에 따라 달라질 수 있음을 이해해야 할 것이다. 예를 들어, 특정 구현예들에서, 동물 대상 (예를 들어, 사람 또는 설치류)에 대한 투여는 기관지 (기관지 점적을 포함함), 협측, 장내, 진피간, 동맥내, 진피내, 위내, 골수내, 근육내, 비강내, 복강내, 척수강내, 정맥내, 뇌실내, 점막, 비강, 경구, 직장, 피하, 설하, 국소, 기관 (기관내 점적을 포함함), 경피, 질 및/또는 유리체강내일 수도 있다. 일부 구현예에서, 투여는 간헐적 투약을 포함할 수 있다. 일부 구현예에서, 투여는 적어도 선택된 기간 동안 연속 투약 (예, 관류)을 포함할 수 있다.

용어 "항체"는 이황화결합에 의해 서로-연결된 4개의 폴리펩티드 사슬, 2개의 중(H)쇄 (이들 각각은 조작된 D_H 클러스터에 의해 암호화되는 아미노산 서열을 포함할 수 있음)와 2개의 경(L)쇄 (이들 각각은 공통 경쇄일 수 있음)를 포함하는 전형적인 면역글로불린 분자를 포함한다. 상기 용어는 또한 항원 또는 그의 단편에 반응성인 면역글로불린을 포함한다. 적합한 항체는 인간 항체, 영장류 항체, 키메라 항체, 단일클론 항체, 단일특이적 항체, 폴리클로날 항체, 폴리특이적 항체, 비특이적 항체, 이중특이적 항체, 다중특이적 항체, 인간화 항체, 합성 항체, 재조합 항체, 하이브리드 항체, 돌연변이된 항체, 이식 접합 항체 (즉, 다른 단백질, 방사성 표지, 세포 독소에 접합되거나 융합된 항체) 및 시험관 내에서 생성된 항체를 포함하지만, 이에만 한정되지는 않는다. 숙련된 기술자라면 공통 항체 동종형, 예를 들어 IgG, IgA, IgM, IgD 및 IgE로 이루어진 군으로부터 선택된 중쇄 불변 영역을 갖는 항체, 및 그의 임의의 서브클래스 (예를 들어, IgG1, IgG2, IgG3 및 IgG4)를 쉽게 인식할 것이다.

대략 : 관심있는 하나 이상의 값에 대하여 적용되는 바와 같이, 진술된 참조값과 유사한 값을 지칭한다. 특정한 구현예에서, "대략" 또는 "약" 이라는 용어는 다르게 진술되거나 문맥으로부터 명백하지 않는 한 진술된 참조 값의 양 방향(초과 또는 미만)으로 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%,6%, 5%, 4%, 3%, 2%, 1%, 이하 이내의 다양한 값을 지칭한다(이러한 수치가 가능한 값의 100%를 초과할 수 있는 경우는 제외).

생물학적 활성 : 생물학적 시스템, 시험관 내 또는 생체 내(예, 유기체 내)에서 활성을 갖는 임의의 제제의 특성을 지칭한다. 예를 들어, 유기체 내에 존재할 때, 유기체 내에서 생물학적 효과를 갖는 제제는 생물학적으로 활성인 것으로 간주된다. 단백질 또는 폴리펩티드가 생물학적으로 활성인 특정한 구현예에서, 단백질 또는 폴리펩티드의 적어도 하나의 생물학적 활성을 공유하는 단백질 또는 폴리펩티드의 부분은 통상적으로 "생물학적 활성" 부위로서 지칭된다.

필적할 만한 : 서로 동일하지 않을 수 있지만, 이들 사이의 비교가 가능할 만큼 충분히 유사하여, 관찰된 차이점 또는 유사점에 기초하여 합리적으로 결론을 도출할 수 있는 둘 이상의 제제, 개체, 상황, 조건의 집합 등을 지칭한다. 당업자는, 문맥 내에서 둘 이상의 이러한 제제, 개체, 상황, 조건의 집합 등에 대하여 임의의 주어진 상황에서 필적할 만한 것으로 간주되는데 어떠한 정도의 동일성이 필요한지를 이해할 것이다.

문구 "상보성 결정 영역", 또는 용어 "CDR"은 보통 (즉, 야생형 동물에서) 면역글로불린 분자 (예, 항체 또는 T 세포 수용체)의 경쇄 또는 중쇄의 가변 영역의 2개의 프레임워크 영역 사이에 나타나는, 유기체의 면역글로불린 유전자의 핵산 서열에 의해 암호화된 아미노산 서열을 포함한다. CDR은 예를 들어, 생식선 서열 또는 재배열되거나 재배열되지 않은 서열에 의해 암호화될 수 있으며, 예를 들어, 순수한 또는 성숙한 B 세포 또는 T 세포에 의해 암호화될 수 있다. CDR은 체세포 돌연변이 (예를 들어, 동물의 생식선에서 암호화되는 서열에 따라 달라짐), 인간화, 및/또는 아미노산 치환, 부가, 또는 결실로 변형될 수 있다.　 몇몇 경우에는 (예를 들어, CDR3의 경우), 예를 들어, 서열을 스플라이싱하거나 연결하는 결과로 (예를 들어, 중쇄 CDR3 형성을 위한 V-D-J 재조합), CDR은 (예를 들어, 재배열되지 않은 핵산 서열에서는) 연속하지 않지만 B 세포 핵산 서열에서는 연속하는 2개 이상의 서열(예를 들어, 생식선 서열)에 의해 암호화될 수 있다.

보존적 : 보존적 아미노산 치원을 참조하기 위해, 유사한 화학적 성질(예, 전하 또는 소수성)을 갖는 측쇄 R기를 갖는 다른 아미노산 잔기에 의한 아미노산 잔기의 치환을 지칭한다. 일반적으로, 보존적 아미노산 치환은 관심 단백질의 기능적 성질, 예를 들어, 리간드에 결합하는 수용체의 능력을 실질적으로 변화시키지 않을 것이다. 유사한 화학적 성질을 갖는 측쇄를 갖는 아미노산의 군의 예는 다음을 포함한다: 지방족 측쇄, 예를 들어, 글리신, 알라닌, 발린, 류신, 및 이소류신; 지방족-하이드록실 측쇄, 예를 들어 세린 및 트레오닌; 아미드 함유 측쇄, 예를 들어, 아스파라긴 및 글루타민; 방향족 측쇄, 예를 들어, 페닐알라닌, 티로신, 및 트립토판; 염기성 측쇄, 예를 들어, 라이신, 아르기닌, 및 히스티딘; 산성 측쇄, 예를 들어, 아스파르트산 및 글루탐산; 및, 황 함유 측쇄, 예를 들어, 시스테인 및 메티오닌. 보존적 아미노산 치환기는, 예를 들어, 발린/류신/이소류신, 페닐알라닌/티로신, 라이신/아르기닌, 알라닌/발린, 글루타메이트/아스파르테이트, 및 아스파라긴/글루타민을 포함한다. 일부 구현예에서, 보존적 아미노산 치환은, 예를 들어, 알라닌 스캐닝 돌연변이 유발에서 사용된 바와 같은 알라닌을 갖는 단백질 내 임의의 원래의 잔기의 치환일수 있다. 일부 구현예에서, 참조로서 본원에 통합된 Gonnet, G. H. 외, 1992, Science 256:1443-1445에 개시된 PAM250 log 우도 매트릭스에서 양성 값을 갖는 보존적 치환이 이루어진다. 일부 구현예에서, 치환은 적당한 보존적 치환인데, 이러한 치환은 PAM250 로그 우도 매트릭스에서 음이 아닌 값을 가진다.

대조군 : 결과가 비교되는 표준인, 당업계에서 이해되는 "대조군"의 의미를 지칭한다. 통상적으로, 대조군은 변수들에 대한 결론을 내리기 위해 변수들을 분리하여 실험의 완전성을 높이기 위해 사용된다. 일부 구현예에서, 대조군은 비교자를 제공하기 위해 시험 반응 또는 검정과 동시에 수행되는 반응 또는 검정이다. "대조군"은 "대조군 동물"을 나타낼 수 있다. "대조군 동물"은 본원에 설명된 변형, 본원에 설명된 것과는 다른 변형을 가지거나 변형을 가지지 않을 수 있다(즉, 야생형 동물). 하나의 실험에서, "시험"(즉, 시험 중인 변수)이 적용된다. 제2 실험에서, "대조군," 시험 중인 변수가 적용되지 않는다. 일부 구현예에서, 대조군은 과거의 대조군(즉, 이전에 수행된 시험 또는 분석의 대조군, 또는 이전에 알려진 양 또는 결과)이다. 일부 구현예에서, 대조군은 인쇄되거나 달리 저장된 기록이거나 이를 포함한다. 대조군은 양성 대조군 또는 음성 대조군일 수 있다.

파괴 : (예를 들어, 유전자 또는 유전자좌와 같은 내인성 상동성 서열을 갖는) DNA 분자를 이용한 상동성 재조합 이벤트의 결과를 지칭한다. 일부 구현예에서, 파괴는 DNA 서열(들)의 삽입, 결실, 치환, 대체, 과오 돌연변이 또는 틀 이동 또는 이들의 임의의 조합을 달성하거나 나타낼 수 있다. 삽입은 전체 유전자, 유전자의 단편, 예를 들어, 내인성 서열(예: 이종 서열) 이외의 기원일 수 있는, 엑손, 또는 관심있는 특정 유전자로부터 유도되거나 단리된 코딩 서열의 삽입을 포함할 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물(예를 들어, 유전자에 의해 암호화된 단백질)의 발현 및/또는 활성을 증가시킬수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 발현 및/또는 활성을 감소시킬 수 있다. 일부 구현예에서, 파괴는 유전자의 서열 또는 암호화된 유전자 산물(예를 들어, 암호화된 단백질)을 바꿀 수 있다. 일부 구현예에서, 파괴는 유전자 또는 암호화된 유전자 산물(예를 들어, 암호화된 단백질)을 절단하거나 단편화할 수 있다. 일부 구현예에서, 파괴는 유전자 또는 암호화된 유전자 산물을 확장할 수 있다. 일부 이러한 구현예에서, 파괴는 융합 단백질의 조립을 달성할 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 수준에 영향을 미칠 수 있지만 활성에는 영향을 미치지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 활성에는 영향을 미칠 수 있지만 수준에는 영향을 미치지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 수준에 유의한 효과를 가지지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 활성에 유의한 효과를 가지지 않을 수 있다. 일부 구현예에서, 파괴는 유전자 또는 유전자 산물의 수준 또는 활성 유의한 효과를 가지지 않을 수 있다.

결정 , 측정(measuring) , 평가(evaluating) , 평가(assessing) , 검증(assaying) 및 분석(analyzing) : 임의의 형태의 측정을 지칭하기 위해 상호교환적으로 사용되고, 요소가 존재하는지 여부를 결정하는 것을 포함한다. 이들 용어는 정량적 및/또는 정성적 결정을 포함한다. 검증은 상대적이거나 절대적일 수 있다. "존재에 대한 검증"은 존재하는 어떤 것의 양을 결정하는 것 및/또는 존재 여부를 결정하는 것일 수 있다.

내인성 좌위 또는 내인성 유전자 : 본원에 설명된 변경, 파괴, 결실, 삽입, 변형, 치환 또는 대체의 도입 전에 모 유기체 또는 기준 유기체에서 발견되는 유전자좌를 지칭한다. 일부 구현예에서, 내인성 좌위는 전체적으로 또는 부분적으로, 자연에서 발견되는 서열을 포함한다. 일부 구현예에서, 내인성 좌위는 야생형 좌위이다. 일부 구현예에서, 기준 유기체는 야생형 유기체이다. 일부 구현예에서, 기준 유기체는 조작된 유기체이다. 일부 구현예에서, 기준 유기체는 (야생형이든 조작된 것이든) 실험실에서 교배된 유기체이다.

내인성 프로모터 : 예를 들어, 야생형 유기체에서, 내인성 유전자와 자연적으로 연관된 프로모터를 지칭한다.

조작된 : 일반적으로, 사람의 손으로 조작된 측면을 지칭한다. 예를 들어, 일부 구현예에서, 자연에서 그러한 순서로 서로 연결되지 않은 둘 이상의 서열이 조작된 폴리뉴클레오티드에서 서로 직접 연결되도록 사람의 손에 의해 조작될 때, 폴리뉴클레오티드는 "조작된" 것으로 간주될 수 있다. 일부 특정한 이런 구현예에서, 조작된 폴리뉴클레오티드는 자연에서 발견되는 조절 서열로서 제1 암호화 서열과 작동적으로 연관되고, 제2 암호화 서열과는 작동적으로 연관되지 않는 조절 서열을 포함할 수 있는데, 상기 조절 서열은 제2 암호화 서열과 작동적으로 연관되도록 사람의 손에 의해 연결된다. 대안적으로 또는 추가적으로, 일부 구현예에서, 자연에서 서로 연결되어 있지 않은 폴리펩티드 요소 또는 도메인을 각각 암호화하는 제1 및 제2 핵산 서열은 하나의 조작된 폴리펩티드에서 서로 연결될 수 있다. 이에 비해, 일부 구현예에서, 세포 또는 유기체가 그의 유전 정보가 변경되도록(예: 이전에 존재하지 않았던 새로운 유전 물질이 도입되거나, 이전에 존재하던 유전 물질이 변경되거나 제거되도록) 조작된 경우, 세포 또는 유기체는 "조작된" 것으로 간주될 수 있다. 통상적인 관행이면서 당업자에 의해 이해되는 바와 같이, 조작된 폴리뉴클레오티드 또는 세포의 자손은 실제 조작이 이전 개체에 대해 수행되었더라도 일반적으로는 여전히 "조작된" 것으로서 지칭된다. 또한, 당업자에 의해 이해될 수 있는 바와 같이, 본원에서 기술된 바와 같은 "조작"이 달성될 수 있는 다양한 방법론이 이용 가능하다. 예를 들어, 일부 구현예에서, "조작"은 분석이나 비교를 수행하거나, 달리 서열, 변경 등을 분석, 권고 및/또는 선택하도록 프로그램된 컴퓨터 시스템의 사용을 통해 (예를 들어, 핵산 서열, 폴리펩티드 서열, 세포, 조직 및/또는 유기체를) 선택하거나 디자인하는 것을 포함할 수 있다. 대안적으로 또는 추가적으로, 일부 구현예에서, "조작"은 시험관 내 화학 합성 방법론 및/또는 예를 들어, (중합체 연쇄 반응을 통한) 핵산 증폭 하이브리드화, 돌연변이, 형질전환, 형질감염 등과 같은 재조합 핵산 기술, 및/또는 임의의 다양한 통제된 교배 방법론을 사용하는 것을 포함할 수 있다. 당업자에 의해 이해될 수 있는 바와 같이, (예, 재조합 DNA, 올리고뉴클레오티드 합성 및 조직 배양과 형질전환(예, 전기 천공, 리포펙션 등)을 위한 확립된 이러한 다양한 기술은 당업계에 주지되어 있고, 본 명세서 전반에 걸쳐 인용되고/되거나 논의되는 다양한 일반적이고 보다 구체적인 참조문헌에 기술되어 있다. 예를 들어, Sambrook 외, Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989) 참조.

유전자 : 생성물(예: RNA 생성물 및/또는 폴리펩티드 생성물)을 위해 코딩하는 염색체 내의 DNA 서열을 지칭한다. 일부 구현예에서, 유전자는 암호화 서열(즉, 특정 생성물을 암호화하는 서열)을 포함한다. 일부 구현예에서, 유전자는 비암호화 서열을 포함한다. 일부 특정 구현예에서, 유전자는 암호화(예: 엑손) 서열과 비암호화(인토론) 서열 모두를 포함할 수 있다. 일부 구현예에서, 유전자는 하나 이상의 조절 서열(예를 들어, 프로모터, 증강자 등) 및/또는, 예를 들어, 유전자 발현의 하나 이상의 측면(예: 세포 유형 특이적 발현, 유도 발현 등)를 조절하거나 영향을 줄 수 있는 인트론 서열을 포함할 수 있다. 명료성을 위해, 본원에 사용되는 바와 같이, 용어 "유전자"는 일반적으로 폴리펩티드를 암호화하는 핵산의 일부를 지칭하고; 문맥으로부터 당업자에게 명백해지는 바와 같이, 조절 서열을 선택적으로 포함할 수 있음을 주목한다. 이러한 정의는 비단백질 코딩 발현 단위에 대한 용어 "유전자"의 적용을 배제하고자 하는 것이 아니며, 오히려, 대부분의 경우에, 본 문서에서 사용된 바와 같이 상기 용어가 폴리펩티드 코딩 핵산을 지칭한다는 것을 명확히 하고자 하는 것이다.

구절 " 유전자 분절 " 또는 " 분절 "은 V (경쇄 또는 중쇄) 또는 D 또는 J (경쇄 또는 중쇄) 면역글로불린 유전자 분절에 대한 참조를 포함하며, 재배열된 V/J (경쇄) 또는 V/D/J (중쇄) 서열을 형성하기 위해 (예, 내인성 재조합 효소에 의해 중재되는) 재배열에 참여할 수 있는 면역글로불린 유전자좌 (예를 들어, 인간 및 마우스 내)에서 재배열되지 않은 서열을 포함한다. 달리 명시하지 않는 한, V, D 및 J 분절은 12/23 규칙에 따라 V/J 재조합 또는 V/D/J 재조합을 허용하는 재조합 신호 서열 (RSS)을 포함한다. 달리 명시하지 않는 한, 상기 분절들은 그것들이 자연에서 연관되는 서열 또는 그 기능적 등가물을 추가로 포함한다 (예를 들어, V 분절, 프로모터(들) 및 선도(들)).

면역글로불린 핵산 서열을 참조할 때 용어 " 생식선 "은 자손, 예를 들어 생식 세포에서 발견될 수 있는 생식선 게놈에 전해질 수 있는 핵산 서열을 포함한다.

" 중쇄 " 또는 " 면역글로불린 중쇄 "라는 문구는 임의의 유기체의 면역글로불린 중쇄 불변 영역 서열을 포함하여, 면역글로불린 중쇄 서열을 포함한다. 중쇄 가변 도메인은 달리 명시되지 않는 한, 3개의 중쇄 상보성 결정 영역 (CDR) 및 4개의 FR 영역을 포함한다. 중쇄의 단편에는 CDR, CDR 및 FR 및 이들의 조합이 포함된다. 전형적인 중쇄는, (N-말단에서 C-말단으로) 가변 도메인에 이어서, C_H1 도메인, 힌지, C_H2 도메인, C_H3 도메인 및 C_H-4 도메인 (IgM 또는 IgE의 맥락에서임)을 갖는다. 중쇄의 기능성 단편은 에피토프를 특이적으로 인식할 수 있고 (예, 마이크로몰, 나노몰 또는 피코몰 범위의 KD로 에피토프를 인식함), 세포로부터 발현 및 분비가 가능하고, 적어도 하나의 CDR을 포함하는, 단편을 포함한다. 중쇄 가변 도메인은, 생식선에 존재하는 V_H, D_H　및 J_H 분절의 레파토리로부터 유래한 V_H, D_H 및 J_H 분절을 일반적으로 포함하는, 가변 영역 유전자 서열에 의해 암호화된다. 다양한 유기체에 대한 V, D 및 J 중쇄 분절에 대한 서열, 위치 및 명명법은 www.imgt.org에서 발견되는 국제 면역유전학 정보 시스템 (IMGT) 웹사이트에서 볼 수 있다.

" 경쇄 "라는 문구는 임의의 유기체의 면역글로불린 경쇄 서열을 포함하며, 달리 명시되지 않는 한 인간 카파(kappa) 및 람다(lambda) 경쇄 및 VpreB, 및 대용(surrogate) 경쇄를 포함한다. 경쇄 가변 도메인은 달리 명시되지 않는 한, 일반적으로 3개의 경쇄 상보성 결정 영역 (CDR) 및 4개의 프레임워크(FR) 영역을 포함한다. 일반적으로, 전장 경쇄는 아미노 말단에서 카르복실 말단까지, FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4를 포함하는 가변 도메인, 및 경쇄 불변 영역을 포함한다. 경쇄 가변 도메인은, 생식선에 존재하는 V_L 및 J_L 유전자 분절의 레파토리로부터 유래한, V_L 및 J_L 유전자 분절을 일반적으로 포함하는, 경쇄 가변 영역 유전자 서열에 의해 암호화된다. 다양한 유기체에 대한 V 및 J 경쇄 분절에 대한 서열, 위치 및 명명법은 www.imgt.org에서 발견되는 국제 면역유전학 정보 시스템 (IMGT) 웹사이트에서 볼 수 있다. 경쇄는 예를 들어 이들이 나타나는 에피토프 결합 단백질에 의해 선택적으로 결합된 제1 에피토프 또는 제2 에피토프 중 어느 하나에 선택적으로 결합하지 않는 것을 포함한다. 경쇄는 또한 이들이 나타나는 에피토프 결합 단백질에 의해 선택적으로 결합된 1개 이상의 에피토프에 결합하고 인식하거나, 중쇄가 이것과 결합하고 인식하는 것을 돕는 것을 포함한다. 경쇄라는 문구는 " 범용 경쇄 " (ULC)라고도 칭해지는, " 공통 경쇄 "를 포함한다.

공통 또는 범용 경쇄(ULC)는 경쇄 불변 영역과 작동가능하게 연결된 하나의 재배열된 면역글로불린 경쇄 가변 영역 암호화 서열을 포함하는 면역글로불린 경쇄 좌위로부터 유래한 것을 포함하고, 여기서 면역글로불린 경쇄 좌위의 발현은 면역글로불린 경쇄 좌위 내에 다른 핵산 서열, 예를 들어, 다른 경쇄 유전자 분절을 포함하는 것에 관계없이 경쇄 불변 영역에 작동가능하게 연결된 하나의 재배열된 면역글로불린 경쇄 가변 영역으로부터 유래한 경쇄 만을 생산한다. 범용 경쇄는 인간 Vκ1-39Jκ 유전자 (예를 들어, Vκ1-39Jκ5 유전자) 또는 인간 Vκ3-20Jκ 유전자 (예를 들어, Vκ3-20Jκ1 유전자)를 포함하고, 이의 체세포 돌연변이된(예를 들어, 친화도 성숙된) 버전을 포함한다.

이종 : 상이한 근원으로부터의 제제 또는 엔티티를 지칭한다. 예를 들어, 특정 세포 또는 유기체 내에 존재하는 폴리펩티드, 유전자, 또는 유전자 산물을 참조하여 사용될 때, 상기 용어는 관련된 폴리펩티드 또는 그의 단편, 유전자 또는 그의 단편, 또는 유전자 산물 또는 그의 단편이: 1) 사람의 손에 의해 조작되었고; 2) 사람의 손에 의해(예를 들어, 유전자 조작에 의해) 세포 또는 유기체(또는 이의 전구체)에 도입되었고/도입되었거나; 3) 관련 세포 또는 유기체(예를 들어, 관련 세포 유형 또는 유기체 유형) 내에 존재하거나 이에 의해 자연적으로 생산되지 않는다는 것을 명확하게 한다. 본원에서 사용되는 바와 같이, 용어 "이종"은 또한 보통 특정 천연 세포 또는 유기체에 존재하지만, 비-자연적으로 연관된 및 일부 구현예에서는, 비-내인성 조절 요소 (예를 들어, 프로모터)의 조절 하에 돌연변이 또는 배치에 의해, 변형된, 폴리펩티드 또는 그의 단편, 유전자 또는 그의 단편, 또는 유전자 산물 또는 그의 단편을 포함한다.

숙주 세포 : 이종(예를 들어, 외인성) 핵산 또는 단백질이 도입된 세포를 지칭한다. 본 개시를 읽는 당업자는 이러한 용어가 특정한 대상 세포를 언급하는것 뿐 아니라 이러한 세포의 자손을 언급하기 위해 사용된다는 것을 이해할 것이다. 돌연변이 또는 환경적 영향에 의해 다음 세대에서 어떤 변형이 발생할 수 있기 때문에, 이러한 자손은, 사실, 모세포와 동일하지 않을 수 있지만, 본원에 사용된 "숙주 세포"라는 용어의 범주 내에 여전히 포함된다. 일부 구현예에서, 숙주 세포는 원핵 또는 진핵 세포이거나 이를 포함한다. 일반적으로, 숙주 세포는 세포가 지정된 계(Kingdom of life)에 관계없이 이종 핵산 또는 단백질을 수여받고/받거나 생산하기에 적합한 임의의 세포이다. 예시적인 세포는 원핵세포 및 진핵세포(단세포 또는 다세포), 박테리아 세포(예를 들어, 에스케리치아 콜리(Escherichia coli), 바실러스(Bacillus) 종, 스트렙토미세스(Streptomyces) 종 등), 마이코박테리아 세포, 진균 세포, 효모 세포(예를 들어, 사카로미세스 세레비시애(Saccharomyces cerevisiae), 쉬조사카로미세스 폼베(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris), 피치아 메타놀리카(Pichia methanolica) 등), 식물 세포, 곤충 세포(예를 들어, SF-9, SF-21, 배큘로바이러스에 감염된 곤충 세포, Trichoplusia ni 등), 비-인간 동물 세포, 인간 세포, 또는 세포 융합물, 예를 들어, 하이브리도마 또는 쿼드로마(quadroma)를 포함한다. 일부 구현예에서, 세포는 인간, 원숭이, 유인원, 햄스터, 랫트, 또는 마우스 세포이다. 일부 구현예에서, 세포는 진핵세포이고, 다음의 세포로부터 선택된다: CHO(예를 들어, CHO K1, DXB-11 CHO, Veggie-CHO), COS(예를 들어, COS-7), 망막 세포,Vero, CV1, 신장(예를 들어, HEK293, 293 EBNA, MSR 293, MDCK, HaK, BHK), HeLa, HepG2, WI38, MRC 5, Colo205, HB 8065, HL-60,(예를 들어, BHK21), Jurkat, Daudi, A431(상피), CV-1, U937, 3T3, L 세포, C127 세포, SP2/0, NS-0, MMT 060562, Sertoli 세포, BRL 3A 세포, HT1080 세포, 골수종 세포, 종양 세포, 및 전술된 세포로부터 유래한 세포주. 일부 구현예에서, 세포는 하나 이상의 바이러스 유전자, 예를 들어, 바이러스 유전자를 발현하는 망막 세포(예를 들어, PER.C6® 세포)를 포함한다. 일부 구현예에서, 숙주 세포는 단리된 세포이거나 이를 포함한다. 일부 구현예에서, 숙주 세포는 조직의 일부이다. 일부 구현예에서, 숙주 세포는 유기체의 일부이다.

동일성 : 서열의 비교와 관련하여 사용되는 바와 같이, 뉴클레오티드 및/또는 아미노산 서열 동일성을 측정하기 위해 사용될 수 있는 당해 분야에 알려진 다수의 상이한 알고리즘에 의해 결정되는 동일성을 지칭한다. 일부 구현예에서, 본원에 설명된 동일성은 10.0의 오픈 갭 패널티, 0.1의 연장갭 패널티를 채용한 ClustalW v. 1.83 (slow) 정렬 및 Gonnet 유사성 매트릭스(MACVECTOR™ 10.0.2, MacVECTOR Inc., 2008)를 사용하여 결정된다.

시험관 내 : 다세포 유기체 내에서가 아니라, 인공적인 환경, 예를 들어 시험관이나 반응 용기, 세포 배양기 등에서 발생하는 이벤트를 지칭한다.

생체 내 : 인간 및 비-인간 동물과 같은 다세포 유기체 내에서 발생하는 이벤트를 지칭한다. 세포 기반 시스템의 맥락에서, 상기 용어는 (예를 들어 시험관 내 시스템과 반대로) 활 세포 내에서 발생하는 이벤트를 지칭하도록 사용될 수 있다.

단리된 : (1) (자연에서 및/또는 실험실 세팅에서의 여부를 불문하고) 초기에 생성될 때 연관되었던 성분의 적어도 일부로부터 분리되었고/되었거나, (2) 사람의 손에 의해 설계, 생산, 제작 및/또는 제조된 물질 및/또는 개체를 지칭한다. 단리된 물질 및/또는 개체는 초기에 연관되었던 다른 성분의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99%보다 더 많은 부분으로부터 분리될 수 있다. 일부 구현예에서, 단리된 제제는 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99%보다 더 많이 순수하다. 본원에 사용된 바와 같이, 물질은 실질적으로 다른 성분이 없는 경우 "순수"하다. 일부 구현예에서, 당업자에게 이해되는 바와 같이, 물질은, 예를 들어, 하나 이상의 담체 또는 부형제(예를 들어, 완충액, 용매, 물 등)와 같은 어떤 다른 성분과 조합된 후에도 여전히 "단리"되거나 심지어"순수"한 것으로 간주될 수 있는데; 이러한 구현예에서, 물질의 단리 또는 순도 백분율은 이러한 담체 또는 부형제를 포함하지 않고 계산된다. 하나의 예로서, 일부 구현예에서, 자연에서 발생하는 폴리펩티드 또는 폴리뉴클레오티드와 같은 생물학적 폴리머는: a) 파생의 기원 또는 근원으로 인해 자연계에서의 원래의 상태에서 동반되는 일부 또는 전체 성분과 연관되어 있는 경우; b) 자연에서 이를 생산하는 종과 동일한 종의 다른 폴리펩티드 또는 핵산이 실질적으로 없는 경우; 또는 c) 자연에서 이를 생산하는 종의 것이 아닌 세포 또는 다른 발현 시스템의 성분에 의해 발현되거나 아니면 이와 연관되어 있는 경우에 "단리된" 것으로 간주된다. 따라서, 예를 들어, 일부 구현예에서, 화학적으로 합성되거나 자연에서 폴리펩티드를 생산하는 세포 시스템과 상이한 세포 시스템에서 합성된 폴리펩티드는 "단리된" 폴리펩티드로 간주된다. 대안적으로 또는 추가적으로, 일부 구현예에서, 하나 이상의 정제 기술을 거친 폴리펩티드는, a) 상기 폴리펩티드가 자연에서 연관되어 있는 성분; 및/또는 b) 상기 폴리펩티드가 초기에 생산될때 연관되었던 다른 성분으로부터 분리된 정도까지 "단리된" 폴리펩티드로 간주될 수 있다.

비-인간 동물 : 인간이 아닌 임의의 척추 동물 유기체를 지칭한다. 일부 구현예에서, 비-인간 동물은 원구류, 경골어, 연골 어류(예를 들어, 상어 또는 가오리), 양서류, 파충류, 포유동물, 및 새이다. 일부 구현예에서, 비-인간 포유류는 영장류, 염소, 양, 돼지, 개, 소, 또는 설치류이다. 일부 구현예에서, 비-인간 동물은 랫트 또는 마우스와 같은 설치류이다.

핵산 : 가장 넓은 의미에서, 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 구현예에서, "핵산"은 인산디에스테르 결합을 통해 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 화합물 및/또는 물질이다. 문맥으로부터 명백해지는 바와 같이, 일부 구현예에서, "핵산"은 개별적인 핵산 잔기(예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 의미하고; 일부 구현예에서, "핵산"은 개별적인 핵산 잔기를 포함하는 올리고뉴클레오티드 사슬을 의미한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, "핵산"은 하나 이상의 자연적인 핵산 잔기이거나 이를 포함하거나 이로 구성된다. 일부 구현예에서, "핵산"은 하나 이상의 핵산 유사체이거나 이를 포함하거나 이로 구성된다. 일부 구현예에서, 핵산 유사체는 인산디에스테르 골격을 활용하지 않는다는 점에서 "핵산"과 다르다. 예를 들어, 일부 구현예에서, "핵산"은 당해 분야에 알려지고 골격 내에 인산디에스테르 결합 대신 펩티드 결합을 갖는 하나 이상의 "펩티드 핵산"이거나, 이를 포함하거나 이로 구성된다. 대안적으로 또는 추가적으로, 일부 구현예에서, "핵산"은 인산디에스테르 결합보다는 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포라미디트 결합을 가진다. 일부 구현예에서, "핵산"은 하나 이상의 자연적인 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, "핵산"은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데자아데노신, 7-데자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입 염기, 및 이의 조합)이거나, 이를 포함하거나 이로 구성된다. 일부 구현예에서, "핵산"은 천연 핵산의 당에 비해 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, "핵산"은 RNA 또는 단백질과 같은 기능적 유전자 산물을 암호화하는 뉴클레오티드 서열을 가진다. 일부 구현예에서, "핵산"은 폴리펩티드 단편 (예를 들어, 펩티드)를 암호화하는 뉴클레오티드 서열을 가진다. 일부 구현예에서, "핵산"은 하나 이상의 인트론을 포함한다. 일부 구현예에서, "핵산"은 하나 이상의 엑손을 포함한다. 일부 구현예에서, "핵산"은 하나 이상의 코딩 서열을 포함한다. 일부 구현예에서, "핵산"은 자연적인 근원으로부터의 하나 이상의 단리체, 상보적인 주형에 기반한 중합에 의한 효소적 합성(생체 내 또는 시험관 내), 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성에 의해 제조된다. 일부 구현예에서, "핵산"은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 이상의 잔기 길이이다. 일부 구현예에서, "핵산"은 단일 가닥이고; 일부 구현예에서, "핵산"은 이중 가닥이다. 일부 구현예에서, "핵산"은 폴리펩티드 또는 그의 단편을 암호화하는 서열에 상보적이거나, 이를 암호화하는 적어도 하나의 요소를 포함하는 뉴클레오티드 서열을 가진다. 일부 구현예에서, "핵산"은 효소 활성을 가진다.

작동 가능하게 연결된 : 기술된 성분이 의도된 방식으로 기능하게 하는 관계에 있는 병치(juxtaposition)를 지칭한다. 코딩 서열에 "작동가능하게 연결된" 조절 서열은 코딩 서열의 발현이 조절 서열과 호환가능한 조건 하에 달성되도록 연결된다. "작동가능하게 연결된" 서열은 관심있는 유전자에 인접한 발현 조절 서열 및 관심있는 유전자를 조절하기 위해 일정한 거리에서 또는 트랜스로 작용하는 발현 조절 서열을 포함한다. 본원에 사용된 "발현 조절 서열" 이라는 용어는 연결되는 코딩 서열의 발현 및 가공에 영향을 미치는 데 필요한, 폴리뉴클레오티드 서열을 지칭한다. "발현 조절 서열"은 다음을 포함한다: 적절한 전사 개시, 종결, 프로모터 및 증강자 서열; 스플라이싱 및 폴리아데닌화 신호와 같은 효율적인 RNA 가공 신호; 세포질 mRNA를 안정화하는 서열; 번역 효율을 증진하는 서열; 단백질 안정성을 증진하는 서열(즉, 코작 공통(Kozak consensus) 서열); 및 원하는 경우, 단백질 분비를 증진하는 서열. 이러한 조절 서열의 성질은 숙주 유기체에 따라 다르다. 예를 들어, 원핵생물에서, 이러한 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위, 및 전사 종결 서열을 포함하는 반면, 진핵생물에서, 통상적으로, 이러한 조절 서열은 프로모터 및 전사 종결 서열을 포함한다. "조절 서열"이라는 용어는 존재하는 것이 발현 및 가공에 필수적인 성분을 포함하는 것으로 의도되고, 존재하는 것이 유리한 추가적인 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 포함할 수도 있다.

생리학적 조건 : 세포 또는 유기체가 살고 그리고/또는 재생하는 조건을 참조하는 그 분야에서 이해되는 의미를 포함한다. 일부 구현예에서, 상기 용어는 유기체 또는 세포 시스템을 위해 자연에서 발생할 수 있는 외부 또는 내부 환경의 조건을 지칭한다. 일부 구현예에서, 생리학적 조건은 인간 또는 비-인간 동물의 체내에 존재하는 이러한 조건, 특히 수술 부위 지점 및/또는 내부에 존재하는 조건이다. 생리학적 조건은 통상적으로, 예를 들어, 그것이 지상에서 마주치게 되는 20-40℃의 온도 범위, 1 대기압, pH 6-8, 1-20 mM의 포도당 농도, 대기 수준에서 산소 농도, 및 중력을 포함한다. 일부 구현예에서, 실험실에서의 조건은 생리학적 조건에서 조작되고 그리고/또는 유지된다 일부 구현예에서, 생리학적 조건은 유기체 (예를 들면, 비-인간 동물)에서 마주하게 된다.

폴리펩티드 : 아미노산의 임의의 고분자 사슬을 지칭한다. 일부 구현예에서, 폴리펩티드는 자연에서 발생하는 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는 자연에서 발생하지 않는 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는 서로 별개로 자연에서 발생하는 부분(즉, 2종 이상의 상이한 유기체로부터, 예를 들어, 인간 및 비-인간 부위)을 함유하는 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는 사람의 손의 작용을 통해 설계되고/되거나 생산된 조작된 아미노산 서열을 가진다. 일부 구현예에서, 폴리펩티드는, 이들 각각이 관심있는 폴리펩티드에서 발견되는 것보다 서로에 대해 다른 공간적 배열로 동일한 모체 폴리펩티드에서 발견되는, 복수의 단편을 포함하거나 이들로 구성될 수 있어서 (예를 들어, 모체에 직접 연결되는 단편은 관심있는 폴리펩티드에서 공간적으로 분리되거나 또는 그 반대일 수 있고, 그리고/또는 단편은 모체에서와 다른 관심있는 폴리펩티드 내에서의 순서로 존재할 수 있음), 관심있는 폴리펩티드는 그의 모체 폴리펩티드의 유도체가 된다

재조합 : 재조합 수단, 예컨대 숙주 세포에 형질 감염된 재조합 발현 벡터를 사용해 발현된 폴리펩티드, 재조합, 조합 인간 폴리펩티드 라이브러리로부터 단리된 폴리펩티드(Hoogenboom H. R., 1997 TIB Tech. 15:62-70; Hoogenboom H., and Chames P., 2000, Immunology Today 21:371-378; Azzazy H., and Highsmith W. E., 2002, Clin. Biochem. 35:425-445; Gavilondo J. V., and Larrick J. W., 2002, BioTechniques 29:128-145), 인간 면역글로불린 유전자에 대해 유전자이식된 동물(예: 마우스)로부터 단리된 항체(예: Taylor, L. D., 외, 1992, Nucl. Acids Res. 20:6287-6295; Little M. 외, 2000, Immunology Today 21:364-370; Kellermann S. A. and Green L. L., 2002, Current Opinion in Biotechnology 13:593-597; Murphy, A.J., 외, 2014, Proc. Natl. Acad. Sci. U. S. A. 111(14):5153-5158 참조)에 의해 설계, 조작, 제조, 발현, 생성 또는 단리된 폴리펩티드, 또는 선택된 서열 요소를 서로에게 스플라이싱시키는 것을 포함하는 임의의 다른 수단에 의해 제작, 발현, 생성 또는 단리된 폴리펩티드를 지칭한다. 일부 구현예에서, 하나 이상의 이러한 선택된 서열 요소는 자연에서 발견된다. 일부 구현예에서, 하나 이상의 이러한 선택된 서열 요소는 인 실리코(in silico) 설계된다. 일부 구현예에서, 하나 이상의 이러한 선택된 서열 요소는, 예를 들어, 자연 또는 합성 공급원으로부터의 알려진 서열 요소의 돌연변이 유발(예를 들어, 생체 내 또는 시험관 내)로부터 유래한다. 예를 들어, 일부 구현예에서, 재조합 폴리펩티드는 관심있는 근원 유기체(예를 들어, 인간, 마우스 등)의 게놈 (예를 들어, 폴리펩티드)에서 발견되는 서열을 포함한다. 일부 구현예에서, 재조합 폴리펩티드는 2가지의 상이한 유기체 (예, 인간 및 비-인간 유기체)에서 서로 (즉, 둘 이상의 상이한 유기체, 예를 들어, 인간 및 비-인간 부위로부터) 별개로 자연에서 발생하는 서열을 포함한다. 일부 구현예에서, 재조합 폴리펩티드는 (예를 들어, 비-인간 동물 내에서, 예를 들어, 시험관 내 또는 생체 내) 돌연변이 유발로부터 유래한 아미노산 서열을 가지므로, 재조합 폴리펩티드의 아미노산 서열은 폴리펩티드 서열로부터 기원하고 이와 관련되지만 비-인간 동물의 생체 내 게놈 내에서는 자연적으로 존재하지 않을 수 있는 서열이다.

기준 : 관심있는 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값에 대한 표준 또는 대조 제제, 코호트, 개체, 집단, 샘플, 서열 또는 값을 설명하도록 의도된다. 일부 구현예에서, 기준 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값은 관심있는 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값의 시험 또는 결정과 실질적으로 동시에 시험 및/또는 결정된다. 일부 구현예에서, 기준 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값은, 선택적으로 유형 매체로 구현된, 역사적 기준이다. 일부 구현예에서, 기준은 대조군을 지칭할 수 있다. 본원에서 사용된, "기준"은 "기준 동물"을 지칭할 수 있다. "기준 동물"은 본원에 설명된 변형, 본원에 설명된 것과는 다른 변형을 가지거나 변형을 가지지 않을 수 있다(즉, 야생형 동물). 통상적으로, 당업자에 의해 이해될 수 있는 바와 같이, 기준 제제, 동물, 코호트, 개체, 집단, 샘플, 서열 또는 값은 관심있는 제제, 동물(예를 들어, 포유동물), 코호트, 개체, 집단, 샘플, 서열 또는 값을 결정하거나 특성화하는 데 사용된 것에 필적할 만한 조건 하에 결정되거나 특성화된다.

면역글로불린은 체세포 과돌연변이라 불리는, 세포 기구에 관여하며, 표적에 대한 높은 친화도를 특징으로 하는 친화도-성숙 항체 변이체를 생산한다. 비록 체세포 과돌연변이가 대개 항체 가변 영역의 CDR 내에서 발생하지만, 돌연변이는 핫스팟, 예를 들어, RGYW 활성화-유도 시티딘 디아미나제 (AID) 핫스팟 (예를 들어, Li, Z. 외, 2004, Genes Dev. 18:1-11; Teng, G. and F.N. Papavasiliou, 2007, Annu. Rev. Genet. 41:107-20 참조; 본원에 참조로 포함됨)으로 지칭되는 특정 서열 모티프를 우선적으로 표적으로 한다. 조작된 D_H 영역의 생성에 유용한 본원에 개시된, 관심있는 비-면역글로불린 펩티드 또는 그 일부는 하나 이상의 천연 및/또는 인공적 핫스팟을 포함할 수 있다. 구절 "체세포 과돌연변이된"은 종류 변환(class-switching)을 겪는 B 세포로부터의 핵산 서열에 대한 참조를 포함하고, 종류 변환된 B 세포에서의 면역글로불린 가변 영역의 핵산 서열(예를 들어, 중쇄 가변 도메인을 암호화하거나 중쇄 CDR 또는 FR 서열을 포함하는 뉴클레오티드 서열)은, 예를 들어 종류 변환을 겪지 않은 B 세포와 종류 변환을 겪은 B 세포 사이의 CDR 또는 프레임워크 핵산 서열의 차이와 같이, 종류 변환 전의 B 세포에서의 핵산 서열과 동일하지 않다. "체세포 돌연변이된"은 친화도 성숙되지 않은 B 세포에서의 상응하는 면역글로불린 가변 영역 서열(즉, 생식선 세포의 게놈에서의 서열)에 동일하지 않은 친화도 성숙된 B 세포로부터의 핵산 서열에 대한 참조를 포함한다. 구절 "체세포 돌연변이된"은 또한 관심있는 에피토프에 대한 B 세포의 노출 후 B 세포로부터의 면역글로불린 가변 영역 핵산 서열에 대한 참조를 포함하고, 핵산 서열은 관심있는 에피토프에 대한 B 세포의 노출 전에 상응하는 핵산 서열과 다르다. 구절 "체세포 돌연변이된"은 면역원 공격에 대한 반응에서, 예를 들어 인간 면역글로불린 가변 영역 핵산 서열을 갖는 마우스와 같은 동물에서 생성되었고, 이러한 동물에서 선천적으로 작동적인 선택 과정으로부터 생기는 결합 단백질로부터의 서열을 지칭한다.

실질적으로 : 관심있는 특성 또는 성질의 전체 범위나 정도 또는 전체에 근사한 범위 또는 정도를 나타내는 정성적인 조건을 포함한다. 생물학 분야의 숙련자는 생물학적 및 화학적 현상이 완료되고/되거나 완료에 이르거나, 절대적인 결과를 달성하거나 피하는 경우는 거의 없다는 것을 이해할 것이다. 따라서, "실질적으로"라는 용어는 많은 생물학적 및 화학적 현상에 내재된 완전성의 잠재적인 결여를 포착하도록 본원에서 사용된다.

실질적 상동성 : 아미노산 또는 핵산 서열 간의 비교를 지칭한다. 당업자에 의해 이해되는 바와 같이, 2개의 서열이 상응하는 위치에 상동성 잔기를 함유하는 경우, 이들은 "실질적 상동성"인 것으로 일반적으로 간주된다. 상동성 잔기는 동일한 잔기일 수 있다. 대안적으로, 상동성 잔기는 적절하게 유사한 구조적 및/또는 기능적 특성을 갖는 동일하지 않은 잔기일 수 있다. 예를 들어, 당업자에게 공지된 바와 같이, 특정 아미노산은 일반적으로 "소수성" 또는 "친수성" 아미노산으로서, 및/또는 "극성" 또는 "비극성" 측쇄를 갖는 것으로서 분류된다. 하나의 아미노산이 동일한 유형의 다른 것으로 치환되는 것은 흔히 "상동성" 치환으로 간주될 수 있다. 일반적인 아미노산 분류가 아래에 요약되어 있다.

당업계에서 주지된 바와 같이, 아미노산 또는 핵산 서열은, 뉴클레오티드 서열에 대한 BLASTN 및 아미노산 서열에 대한 BLASTP, 갭 BLAST 및 PSI-BLAST와 같이 상업적 컴퓨터 프로그램에서 사용할 수 있는 것들을 포함하여, 임의의 다양한 알고리즘을 사용하여 비교될 수 있다. 예시적인 이러한 프로그램은 Altschul, S. F. 외, 1990, J. Mol. Biol., 215(3): 403-410; Altschul, S. F. 외, 1997, Methods in Enzymology; Altschul, S. F. 외, 1997, Nucleic Acids Res., 25:3389-3402; Baxevanis, A.D., 및 B. F. F. Ouellette (eds.) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 및 Misener 외 (eds.) Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1998에 기술되어 있다. 상동성 서열을 확인하는 것 외에도, 전술된 프로그램은 일반적으로 상동성의 정도에 대한 지표를 제공한다. 일부 구현예에서, 2개의 서열의 상응하는 잔기의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상이 잔기의 관련 구간에 걸쳐 상동성인 경우 이들은 실질적으로 상동성인 것으로 간주된다. 일부 구현예에서, 관련 구간은 완전한 서열이다. 일부 구현예에서, 관련 구간은 적어도 9, 10, 11, 12, 13, 14, 15, 16, 17개 이상의 잔기이다. 일부 구현예에서, 관련 구간은 완전한 서열을 따라 인접 잔기를 포함한다. 일부 구현예에서, 관련 구간은 전체 서열을 따라 불연속 잔기, 예를 들면, 폴리펩티드 또는 이의 부분의 접힌 형태에 의해 한데 모인 인접하지 않은 잔기를 포함한다. 일부 구현예에서, 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50개 이상의 잔기이다.

실질적 동일성 : 아미노산 또는 핵산 서열 간의 비교를 지칭한다. 당업자에 의해 이해되는 바와 같이, 2개의 서열이 상응하는 위치에 동일한 잔기를 함유하는 경우, 이들은 "실질적으로 동일한" 것으로 일반적으로 간주된다. 당업계에서 공지된 바와 같이, 아미노산 또는 핵산 서열은, 뉴클레오티드 서열에 대한 BLASTN 및 아미노산 서열에 대한 BLASTP, 갭 BLAST 및 PSI-BLAST와 같이 상업적 컴퓨터 프로그램에서 사용할 수 있는 것들을 포함하여, 임의의 다양한 알고리즘을 사용하여 비교될 수 있다. 예시적인 이러한 프로그램은 Altschul, S. F. 외, 1990, J. Mol. Biol., 215(3): 403-410; Altschul, S. F. 외, 1997, Methods in Enzymology; Altschul, S. F. 외, 1997, Nucleic Acids Res., 25:3389-3402; Baxevanis, A.D., 및 B. F. F. Ouellette (eds.) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; 및 Misener 외 (eds.) Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1998에 기술되어 있다. 동일한 서열을 확인하는 것 외에도, 전술된 프로그램은 일반적으로 동일성의 정도에 대한 지표를 제공한다. 일부 구현예에서, 2개의 서열의 상응하는 잔기의 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상이 잔기의 관련 구간에 걸쳐 동일한 경우 이들은 실질적으로 동일한 것으로 간주된다. 일부 구현예에서, 관련 구간은 완전한 서열이다. 일부 구현예에서, 관련 구간은 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50개 이상의 잔기이다.

형질전환 : 외인성 DNA를 숙주 세포 내로 도입하는 임의의 과정을 지칭한다. 형질전환은 당해 기술분야에 주지된 다양한 방법을 사용하여 자연 또는 인공 조건 하에서 발생할 수 있다. 형질전환은 외래 핵산 서열을 원핵 또는 진핵 숙주 세포 내로 삽입하기 위한 임의의 공지된 방법에 의존할 수 있다. 일부 구현예에서, 특정 형질전환 방법론은 형질전환되는 숙주 세포에 기초하여 선택되며, 바이러스 감염, 전기 천공, 교배, 리포펙션을 포함할 수 있지만, 이에 제한되지는 않는다. 일부 구현예에서, "형질전환된" 세포는 삽입된 DNA가 자가 복제하는 플라스미드로서 또는 숙주 염색체의 일부로서 복제될 수 있다는 점에서 안정적으로 형질전환된다. 일부 구현예에서, 형질전환된 세포는 제한된 기간 동안 도입된 핵산을 일시적으로 발현한다.

표적화 벡터 또는 표적화 구조체 : 표적화 영역을 포함하는 폴리뉴클레오티드 분자를 지칭한다. 표적화 영역은, 표적 세포, 조직 또는 동물 내 서열과 동일하거나 실질적으로 동일하고 상동성 재조합을 통해 세포, 조직 또는 동물의 게놈 내 위치에 표적화 구조체의 통합을 제공하는 서열을 포함한다. 부위 특이적 재조합효소 인식 부위(예를 들어, loxP 또는 Frt 부위)를 이용하여 표적화하는 표적화 영역도 포함된다. 일부 구현예에서, 본원에서 설명되는 표적화 구조체는 특정 관심 핵산 서열 또는 유전자, 선택 가능한 마커, 제어 및/또는 조절 서열, 및 이러한 서열을 포함하는 재조합을 돕거나 촉진하는 단백질의 외인성 첨가를 통해 매개되는 재조합을 가능하게 하는 다른 핵산 서열을 더 포함한다. 일부 구현예에서, 표적화 구조체는 관심 유전자를 전체적으로 또는 부분적으로 더 포함하되, 관심 유전자는 내인성 서열에 의해 암호화된 단백질과 유사한 기능을 갖는 폴리펩티드를 전체적으로 또는 부분적으로 암호화하는 이종 유전자이다. 일부 구현예에서, 표적화 구조체는 관심 인간화 유전자를 전체적 또는 부분적으로 더 포함하고, 관심 인간화 유전자는 내인성 서열에 의해 암호화된 단백질과 유사한 기능을 갖는 폴리펩티드를 전체적으로 또는 부분적으로 암호화한다. 일부 구현예에서, 표적화 구조체 (또는 표적화 벡터)는 사람의 손에 의해 조작되는 핵산 서열을 포함할 수 있다. 예를 들어, 일부 구현예에서, 표적화 구조체 (또는 표적화 벡터)는 자연에서는 그러한 순서로 함께 연결되지 않지만 조작되거나 재조합 폴리뉴클레오티드에서 서로 직접 연결되도록 사람의 손에 의해 조작되는 둘 이상의 서열을 함유하는 조작되거나 재조합 폴리뉴클레오티드를 함유하도록 구축될 수 있다.

이식유전자 또는 이식유전자 구조체 : 사람의 손에 의해, 예컨대 본원에 설명된 방법에 의해 세포 내로 도입된 핵산 서열 (예를 들어, 전체적으로 또는 부분적으로, 관심 폴리펩티드를 암호화함)을 지칭한다. 또한, 이식유전자는 이식유전자가 도입되는 유전자이식 동물 또는 세포에 대해 부분적으로 또는 전체적으로 이종, 즉 외래일 수 있다. 이식유전자는 하나 이상의 전사 조절 서열 및 선택된 핵산 서열의 발현에 필요할 수 있는 임의의 다른 핵산, 예컨대 인트론이나 프로모터를 포함할 수 있다.

유전자이식 동물 , 이식유전자 비-인간 동물 또는 Tg ⁺ : 비-인간 동물의 세포 중 하나 이상이 관심있는 폴리펩티드를 암호화하는 이종 핵산 및/또는 유전자를 전체적으로 또는 부분적으로 함유하는 임의의 비-자연발생 비-인간 동물과 상호교환적으로 사용되거나 이를 지칭할 수 있다. 일부 구현예에서, 이종 핵산 및/또는 유전자는 미세주입이나 재조합 바이러스 감염에 의한 것과 같은, 고의적인 유전자 조작에 의해, 전구체 세포에 도입됨으로써 세포 내에 직접 및/또는 간접적으로 도입된다. 용어 유전자 조작은 고전적인 교배 기술을 포함하지 않고, 오히려 재조합 DNA 분자(들)의 도입에 관한 것이다. 이러한 분자는 염색체 내에 통합되거나, 염색체 외에서 DNA를 복제할 수 있다. 용어 "Tg ⁺ "는 이종 핵산 및/또는 유전자에 대해 이형접합성 또는 동형접합성인 동물, 및/또는 이종 핵산 및/또는 유전자의 단일 또는 다중-사본을 갖는 동물을 포함한다.

변이체 : 기준 개체와 상당한 구조적 동일성을 나타내지만, 기준 개체와 비교하여, 하나 이상의 화학적 모이어티의 존재 또는 수준에서 기준 개체와 구조적으로 상이한 개체를 지칭한다. 많은 구현예에서, "변이체"는 또한 기준 개체와 기능적으로 상이하다. 일반적으로, 특정 개체가 기준 개체의 "변이체"로 간주되는 것이 적절한지는 기준 개체와의 구조적 동일성의 정도에 기초한다. 당업자에 의해 이해되는 바와 같이, 임의의 생물학적 또는 화학적 기준 개체는 특정 특징적인 구조적 요소를 가진다. 정의에 의하면, "변이체"는 하나 이상의 이러한 특징적인 구조적 요소를 공유하는 구분되는 화학적 개체이다. 몇 가지 예로서, 소분자는 특징적인 코어 구조적 요소(예를 들어, 거대고리 코어) 및/또는 하나 이상의 특징적인 팬던트 모이어티를 가질 수 있어서 소분자의 변이체는 코어 구조적 요소 및 특징적인 팬던트 모이어티를 공유하지만 다른 팬던트 모이어티 및/또는 코어 내 존재하는 결합의 유형(단일 대 이중, E 대 Z 등)이 다른 것이고, 폴리펩티드는 선형 또는 3차원 공간에서 서로에 대해 지정된 위치를 가지고/가지거나 특정한 생물학적 기능에 기여하는 복수의 아미노산으로 이루어진 특징적인 서열 요소를 가질 수 있고, 핵산은 선형 또는 3차원 공간에서 서로에 대해 지정된 위치를 갖는 복수의 뉴클레오티드 잔기로 이루어진 특징적인 서열 요소를 가질 수 있다. 예를 들어, "변이체 폴리펩티드"는 아미노산 서열에서의 하나 이상의 차이 및/또는 폴리펩티드 골격에 공유 결합된 화학적 모이어티(예를 들어, 탄수화물, 지질 등)에서의 하나 이상의 차이의 결과로서 기준 폴리펩티드와 상이할 수 있다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 또는 99%의 전체 서열 동일성을 보인다. 대안적으로 또는 추가적으로, 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드와 적어도 하나의 특징적인 서열 요소를 공유하지 않는다. 일부 구현예에서, 기준 폴리펩티드는 하나 이상의 생물학적 활성을 가진다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드의 하나 이상의 생물학적 활성을 공유한다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드의 하나 이상의 생물학적 활성이 결여되어 있다. 일부 구현예에서, "변이체 폴리펩티드"는 기준 폴리펩티드와 비교하여 하나 이상의 생물학적 활성의 수준의 감소를 나타낸다. 많은 구현예에서, 관심있는 폴리펩티드는 관심있는 폴리펩티드가 특정한 위치에서의 소수의 서열 변경을 제외하고 모체의 아미노산 서열과 동일한 아미노산 서열을 갖는 경우 모 폴리펩티드 또는 기준 폴리펩티드의 "변이체"인 것으로 간주된다. 통상적으로, 모체에 비해 변이체 내 잔기의 20%, 15%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 또는 2% 미만이 치환된다. 일부 구현예에서, "변이체"는 모체에 비해 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 치환된 잔기(들)를 가진다. 흔히, "변이체"는 매우 적은(예를 들어, 5, 4, 3, 2, 또는 1 미만)의 수의 치환된 기능적 잔기(즉, 특정 생물학적 활성에 참여하는 잔기)를 가진다. 또한, "변이체"는 모체에 비해 통상적으로 5, 4, 3, 2, 또는 1개 이하의 첨가 또는 결실을 가지며, 흔히 첨가 또는 결실을 갖지 않는다. 또한, 임의의 첨가 또는 결실은, 통상적으로 약 25, 약 20, 약 19, 약 18, 약 17, 약 16, 약 15, 약 14, 약 13, 약 10, 약 9, 약 8, 약 7, 약 6개 미만, 일반적으로는 약 5, 약 4, 약 3, 또는 약 2개 미만의 잔기이다. 일부 구현예에서, 모 폴리펩티드 또는 기준 폴리펩티드는 자연에서 발견되는 것이다. 당업자에 의해 이해되는 바와 같이, 특히 관심 폴리펩티드가 감염원 폴리펩티드인 경우, 관심 특정 폴리펩티드의 복수의 변이체는 자연에서 흔히 발견될 수 있다.

벡터 : 결합된 다른 핵산을 이송할 수 있는 핵산 분자를 지칭한다. 일부 구현예에서, 벡터는, 진핵 세포 및/또는 원핵 세포와 같은 숙주 세포에서 벡터가 연결된 핵산의 염색체외 복제 및/또는 발현을 할 수 있다. 작동가능하게 연결된 유전자의 발현을 유도할 수 있는 벡터를 본원에서 "발현 벡터"로 지칭한다.

야생형 : (돌연변이, 질환, 변경 등과 대조적으로) "정상" 상태 또는 맥락에서 자연에서 발견되는 구조 및/또는 활성을 갖는 개체를 지칭하는, 당업계에서 이해되는 의미를 포함한다. 당업자는 야생형 유전자 및 폴리펩티드가 흔히 다수의 상이한 형태(예: 대립유전자)로 존재한다는 것을 이해할 것이다.

특정 구현예의 상세한 설명

본원에 개시된 것은, 다른 것들 중에서, 관심있는 폴리펩티드의 하나 이상의 부분 (기능적 단편, 결합 부분 등)을 암호화하는 이종 유전 물질을 갖는 유전자이식 비-인간 동물이며, 이종 유전 물질은 면역글로불린 중쇄 가변 영역의 다양성 클러스터 (즉, D_H 영역) 내로 삽입되어서 이종 유전 물질이 중쇄 가변 (V_H) 및 결합 (J_H) 분절과 작동가능하게 연결되도록 한다. 이러한 비-인간 동물은 난치병 표적에 대한 항체를 생성하는 능력을 보여주는 것으로 고려된다. 또한 비-인간 동물은 기존의 면역글로불린 D_H 유전자 분절 (또는 자연에서 나타나는 면역글로불린 D_H 유전자 분절)에서 생성된 면역글로불린 중쇄 가변 CDR3 다양성을 갖는 항체 집단에 비해 CDR3 다양성 증가를 갖는 중쇄 가변 영역을 특징으로 하는 항체 집단을 보여주는 것으로 고려된다. 따라서, 본원에 설명된 비-인간 동물은 특정 항원, 특히, 낮은 및/또는 불량한 면역원성에 연관된 항원에 결합하는 항체-기반 치료제의 개발에 유용할 수 있다. 특히, 본원에 개시된 것은, 각각 관심있는 폴리펩티드의 부분 (예를 들어, 비정형 케모카인 수용체의 세포외 부분, 코노독소의 일부분, 또는 독거미 독소의 일부분)을 암호화하는 예시적인 뉴클레오티드 코딩 서열을 면역글로불린 중쇄 가변 영역의 D_H 영역 내로 도입함으로써, 중쇄 가변 영역, 및 특히, 삽입된 뉴클레오티드 코딩 서열을 포함하는 V(D)J 재조합으로부터 생성된, CDR3 영역을 갖는 항체의 발현을 초래하는 것이다. 일부 구현예에서, 관심있는 폴리펩티드 (예를 들어, 비정형 케모카인 수용체(ACKR), 코노독소, 독거미 독소, 또는 이들의 조합)의 삽입된 뉴클레오티드 코딩 서열은 본원에 설명된 면역글로불린 중쇄 다양성 클러스터 (즉, D_H 영역) 내의 모든 또는 실질적으로 모든 기존의 D_H 분절 (즉, 야생형 D_H 분절)을 대체한다. 일부 구현예에서, 관심있는 폴리펩티드 (예를 들어, 비정형 케모카인 수용체(ACKR), 코노독소, 독거미 독소, 또는 이들의 조합)의 삽입된 뉴클레오티드 코딩 서열은 본원에 설명된 면역글로불린 중쇄 다양성 클러스터 (즉, D_H 영역) 내의 하나 이상의 기존의 D_H 분절을 부분적으로 대체한다. 일부 구현예에서, 관심있는 폴리펩티드 (예를 들어, 비정형 케모카인 수용체(ACKR), 코노독소, 독거미 독소, 또는 이들의 조합)의 뉴클레오티드 코딩 서열은 본원에 설명된 면역글로불린 중쇄 다양성 클러스터 (즉, D_H 영역) 내의 하나 이상의 기존의 D_H 분절 내로 삽입되어서, 상기 뉴클레오티드 코딩 서열은 하나 이상의 기존의 D_H 분절에서 정상적으로 또는 자연적으로 발견되거나 이와 연관된 서열의 측부에 위치하게 된다. 일부 구현예에서, 하나 이상의 기존의 D_H 분절은 본원에 설명된 면역글로불린 중쇄 다양성 클러스터 내에서 온전하게 유지된다. 일부 구현예에서, 하나 이상의 기존의 D_H 분절은 결실되거나, 제거되거나 그렇지 않으면 본원에 설명된 면역글로불린 중쇄 다양성 클러스터로부터 비기능성으로 된다. 일부 구현예에서, 본원에 설명된 면역글로불린 중쇄 다양성 클러스터는 모든 또는 실질적으로 모든 기존의 D_H 분절이 결여되어 있다. 일부 특정 구현예에서, 본원에 설명된 면역글로불린 중쇄 다양성 클러스터는 본원에 설명된 뉴클레오티드 코딩 서열을 사용하여 제조되거나 생성된 합성 D_H 분절을 포함한다. 이러한 유전자이식 비-인간 동물은 확립된 약물 발견 기술의 표적화 능력을 넘어 질환 표적을 결합하는 항체 및/또는 항체 기반 치료제를 식별하고 개발하기 위한 생체 내 시스템을 제공한다. 또한, 이러한 유전자이식 비-인간 동물은 인간에 영향을 미치는 다양한 질환 및/또는 질환 병리학의 중심인 단백질-단백질 상호작용을 방해하기 위해 고안되거나 그것에 집중된 항체 및/또는 항체 기반 치료제 개발을 위한 유용한 동물 모델 시스템을 제공한다.

일부 구현예에서, 본원에 설명된 비-인간 동물은 예를 들어, ACKR (예를 들어, D6 케모카인 유인 수용체)의 세포외 도메인, 독소 (예를 들어, 코노독소, 거미 독소, 독거미 독소, 말미잘 독소, 또는 전갈 독소 같은 이온 채널 차단제), G-단백질-결합 수용체, 선택된 항체(예를 들어, HIV, HCV, HPV, 인플루엔자 등을 포함하는 바이러스에 결합하는 중화 항체)의 긴 중쇄 CDR, 글루카곤-유사 펩티드-1 수용체 작용제 (예를 들어, 엑세나티드(exenatide), 리라글루티드(liraglutide), 릭시세나티드(lixisenatide), 알비글루티드(albiglutide), 둘라글루티드(dulaglutide), 타스포글루티드(taspoglutide) 등), 비-인간 종 (예, 새, 닭, 소, 토끼, 돼지 등)의 중쇄 다양성 (D_H) 유전자 분절, 등과 같은, 관심있는 폴리펩티드의 부분(들)에 대응하는 하나 이상의 뉴클레오티드 코딩 서열의 존재를 특징으로 하는 조작된 다양성 클러스터 (즉, 조작된 D_H 영역)을 함유하는 면역글로불린 중쇄 가변 영역을 포함한다. 이러한 구현예들에서, 그러한 뉴클레오티드 코딩 서열을 포함하는 재조합으로부터 생성된 CDR3를 함유하는 항체는 특정 항원(예를 들어, 막에 걸쳐진 폴리펩티드)에 직접 결합하는 것에 증가된 다양성을 갖는 것으로 특징될 수 있다 일부 구현예에서, 본원에 설명된 비-인간 동물에 의해 생산되는 항체는 하나 이상의 뉴클레오티드 코딩 서열에 의해 암호화되는 펩티드에 대응하는 CDR3 영역을 함유하는 면역글로불린 중쇄 가변 영역 서열을 갖는다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 뉴클레오티드 코딩 서열과 작동가능하게 연결된 중쇄 가변 (V_H) 및 결합 (J_H) 유전자 분절을 포함하고 있어서 V(D)J 재조합이 상기 V_H, J_H 및 하나 이상의 뉴클레오티드 코딩 서열 사이에서 일어나 관심있는 항원에 결합하는 중쇄 가변 영역을 생성하게 된다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 비-인간 동물의 게놈 내 면역글로불린 중쇄 가변 영역에서 5, 10, 15, 20, 25 이상 (예, 복수)의 뉴클레오티드 코딩 서열에 작동가능하게 연결된 복수의 V_H 및 J_H 유전자 분절을 포함한다. 다수의 구현예에서, V_H 및 J_H 분절은 인간 V_H 및 인간 J_H 유전자 분절이다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 인간 또는 인간화된 면역글로불린 경쇄 좌위 (예, κ 및/또는 λ)을 추가로 포함하고 있어서 비-인간 동물이 인간 가변 영역 (즉, 중쇄 및 경쇄) 및 비-인간 불변 영역을 포함하는 항체를 생산하게 된다. 일부 특정 구현예에서, 상기 인간 또는 인간화된 면역글로불린 경쇄 좌위는 설치류 경쇄 불변 영역 (예, 설치류 Cκ 또는 Cλ)에 작동가능하게 연결된 V_L 및 J_L 유전자 분절을 포함한다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 미국 특허 출원 공개 번호 2011-0195454 A1, 2012-0021409 A1, 2012-0192300 A1, 2013-0045492 A1, 2013-0185821 A1, 2013-0198880 A1, 2013-0302836 A1, 2015-0059009 A1; 국제 특허 출원 공개 번호 WO 2011/097603, WO 2012/148873, WO 2013/134263, WO 2013/184761, WO 2014/160179, WO 2014/160202에 설명된 바와 같은 면역글로불린 경쇄 좌위를 추가로 포함하며; 이들 전부는 본원에 참조로 포함된다).

본 조성물 및 방법의 다양한 측면은 다음의 섹션에서 상세히 설명된다. 섹션의 사용은 임의의 구현예를 제한하는 것을 의미하지 않는다. 각 섹션은 구체적으로 설명된 임의의 구현예에 적용될 수 있다. 본 출원에서, "또는"의 사용은 달리 명시하지 않는 한 "및/또는"을 의미한다.

V(D)J 재조합

여러 유전적 성분을 포함하는 일련의 재조합 이벤트는 유전자 분절 (예를 들면, V, D 및 J)의 정렬된 배열로부터 면역글로불린을 조립하는 역할을 한다. 이러한 유전자 분절 조립은 부정확한 것으로 알려져 있으며, 따라서, 면역글로불린 다양성은 다른 유전자 분절들의 조합과 부정확한 결합을 통한 고유한 접합의 형성 모두에 의해 달성된다. 또한, 다양성은 면역글로불린의 가변 영역 서열이 항원에 대한 친화도 및 특이성을 증가시키기 위해 변경되는 체세포 과돌연변이로 알려진 프로세스를 통해 생성된다. 면역글로불린은 두 개의 동일한 중쇄 및 두개의 동일한 경쇄로 구성된 Y-자형 폴리펩티드이며, 이들 각각은 두 개의 구조적 성분: 하나의 가변 도메인과 하나의 불변 도메인을 가지고 있다. 유전자 분절의 조립에 의해 형성되는 것은 중쇄 및 경쇄의 가변 도메인이지만, 불변 도메인들은 RNA 스플라이싱을 통해 가변 도메인에 융합된다. 유전자 분절을 조립 (또는 결합)하는 메커니즘은 중쇄 및 경쇄에 대해 유사하지만, 경쇄의 경우에는 단 하나의 결합 이벤트가 요구되지만 (즉, V에서 J로) 중쇄의 경우에는 두 개가 요구된다 (즉 D에서 J 및 V에서 DJ로).

중쇄 및 경쇄 가변 영역에 대한 유전자 분절의 조립은, 재조합 신호 서열 (RSS)이라고 불리는, 각각의 유전자 분절 측부에 있는 보존된 논코딩 DNA 서열에 의해 가이드되며, 이는 V, D 및 J 코딩 서열에 대하여 정확한 위치에서의 DNA 재배열을 보장한다 (예를 들어, Ramsden, D.A. 외, 1994, Nuc. Acids Res. 22(10):1785-96 참조). 각각의 RSS는 코딩 서열 (예를 들어, V 분절)과 인접하는 7개 뉴클레오티드 (7량체)의 보존된 블록에 이어서, 보존된 스페이서 (12 또는 23bp) 및 9개 뉴클레오티드 (9량체)의 제2 보존된 블록으로 구성된다. 개체 간에 상당한 서열 다양성이 허용되지만, 일반적으로 이러한 서열들의 길이는 변하지 않는다. 면역글로불린 유전자 분절들 사이의 재조합은 일반적으로 12/23 규칙으로 지칭되는 규칙을 따르며, 12bp 스페이서가 있는 RSS 측부에 있는 유전자 분절이 일반적으로 23bp 스페이서 측부에 있는 유전자 분절에 결합된다 (예를 들어, Hiom, K. 및 M. Gellert, 1998, Mol. Cell. 1(7):1011-9 참조). RSS의 서열은 특정 유전자 분절과의 재조합의 효율 및/또는 빈도에 영향을 미치는 것으로 보고되었다 (예를 들어, Ramsden, D.A 및 G.E. Wu, 1991, Proc. Natl. Acad. Sci. U.S.A. 88:10721-5; Boubnov, N.V. 외, 1995, Nuc. Acids Res. 23:1060-7; Ezekiel, U.R. 외, 1995, Immunity 2:381-9; Sadofsky, M. 외, 1995, Genes Dev. 9:2193-9; Cuomo, C.A. 외, 1996, Mol. Cell Biol. 16:5683-90; Ramsden, D.A. 외, 1996, EMBO J 15:3197-3206 참조). 사실, 많은 보고는 개체들 사이에서, 유전자 분절, 특히 D_H 분절의 매우 편향되고 다양한 용법을 언급하고 있다.

일부 구현예에서, 본원에 설명된 비-인간 동물은 V 및/또는 J 유전자 분열로의 재조합 용이거나 이를 위해 최적화되는 코딩 서열의 측부에 있는 하나 이상의 RSS를 포함한다. 다양한 구현예에서, 코딩 서열은, 통상적인 D_H 유전자 분절 (또는 자연에서 나타나는 D_H 유전자 분절)의 자리 (또는 내부)에서 면역글로불린 중쇄 좌위에 삽입된다. RSS의 최적화는 예를 들어, 공지된 RSS 서열의 부위-특이적 돌연변이 또는 합성 RSS 서열의 인 실리코 생성 후 드 노보(de novo) 합성과 같은, 당 기술분야에 공지된 표준 기술을 사용하여 달성될 수 있다. 한 가지 예를 들자면, 낮은 또는 약한 재조합 효율 및/또는 빈도와 관련된 RSS는 높거나 최적의 재조합 효율 및/또는 빈도와 관련된 RSS와 비교하여 최적화될 수 있다. 재조합 효율 및/또는 빈도는, 일부 구현예에서, 항체 서열의 집단 (예를 들어, 개체 또는 개체군; 예를 들어 Arnaout, R. 외, 2011, PLoS One 6(8):e22365; Glanville, J. 외, 2011, Proc. Natl. Acad. Sci. U.S.A. 108(50):20066-71 참조)에서의 유전자 분절의 사용 빈도에 의해 결정될 수 있다. 따라서, 본원에 설명된 비-인간 동물은, 일부 구현예에서, 코딩 서열 (또는 유전자 분절)의 재조합이 동일하거나 거의 동일한 빈도로 발생하도록 코딩 서열 (또는 유전자 분절)의 측부에 있는 하나 이상의 최적화된 RSS를 포함할 수 있다. 예시적인 최적화된 RSS가 도 2에 제시되어 있다.

중쇄 및 경쇄 가변 영역을 형성하기 위한 유전자 분절의 조립은 면역글로불린의 항원-결합 영역 (또는 부위)의 형성을 초래한다. 이러한 항원-결합 영역은 부분적으로, 상보성 결정 영역 (CDR)으로 일반적으로 지칭되는, 초가변 영역의 존재를 특징으로 한다. 중쇄 및 경쇄 모두에 대해 (즉, 총 6개의 CDR에 대해) 3개의 CDR이 있으며, CDR1 및 CDR2 모두가 V 유전자 분절에 의해 완전히 암호화된다. 그러나, CDR3은 경쇄의 경우 V 및 J 분절, 그리고 중쇄의 경우 V, D 및 J 분절의 결합으로 인한 서열에 의해 암호화된다. 따라서, 중쇄 가변 영역 코딩 서열을 형성하기 위해 재조합 동안 사용되는 추가적인 유전자 분열은 중쇄의 항원-결합 부위의 다양성을 상당히 증가시킨다.

케모카인 및 케모카인 수용체

면역 및 염증 반응은 여러 유형의 면역 세포 및 분자 성분이 관여하는 복잡한 생물학적 과정이다. 백혈구의 마이그레이션은 면역 및 염증 반응의 개시, 유지 및 해결에 중요한 요인으로 보고되고 있으며, 이들 중 일부는 케모카인 및 그의 수용체의 작용을 통해 이루어진다. 실제로, 여러 케모카인 및 해당 수용체가 보고되었다. 케모카인 수용체는 세포내 구획의 신호 전달을 위해 G-단백질에 연결하는 7-막관통 도메인을 특징으로하는 구조를 가지고 있으며 이들이 결합하는 케모카인의 하위 세트에 대응하는 다수의 다양한 군으로 분류된다: CC-케모카인 수용체 (β-케모카인 수용체), CXC-케모카인, CX3C-케모카인 수용체 및 XC-케모카인 수용체. 이러한 전통적인 케모카인 수용체 이외에, 유사한 구조를 공유하지만 리간드 결합에 대한 반응으로 신호전달을 개시하는 능력이 결여된 다른 케모카인 수용체 (비정형 케모카인 수용체 또는 ACKR이라 함)가 보고되었다 (예를 들어, Bonecchi, R. 외, 2010, Curr. Top. Microbiol. Immunol. 341:15-36; Nibbs, R.J.B. 및 G.J. Graham, 2013, Nature Rev. 13:815-29 참조).

ACKR 중에서, ACKR2 (CCBP2와 D6 케모카인 유인 수용체라고도 함)는 다른 G 단백질-결합 수용체와 유사하며 CCBP2 유전자에 의해 암호화되는 7-막관통 단백질 수용체이다 (Nibbs, R.J.B. 외, 1997, J. Biol. Chem. 272(51):32078-83). 다른 케모카인 수용체와 달리, ACKR2는 표준 DRYLAIV 모티프 대신에 두 번째 세포내 루프에 DKYLEIV 모티프를 포함하고 Gα_i 단백질을 통한 신호전달이 불가능하다. ACKR2는 피부, 내장 및 폐의 림프 내피 세포 뿐만 아니라 B 세포 및 수지상 세포에서 발현된다. ACKR은 많은 전염증성 β-케모카인 (CC 케모카인)에 대한 무차별적인 수용체이지만, 구성적 CCL 케모카인에는 결합하지 않는다. ACKR2는 CC 케모카인을 내재화하고 리소좀 분해를 목표로 하여 CC 케모카인의 제거를 통해 염증 반응을 제한하는 스캐빈저 수용체로 제안되어 왔다 (Jamieson, T. 외, 2005, Nature Immunol. 6(4):403-11; Bonecchi, R. 외, 상기; Hansell, C.A.H. 외, 2011, Immunol. Cell Biol. 89(2):197-206; Nibbs, R.J.B. 및 G.J. Graham, 상기).

펩티드 독소

독소는 인체에 독성이 될 수 있는 식물과 동물에서 발견되는 자연적으로 발생하는 물질이다. 예를 들어, 콘 달팽이는 인간의 다양한 수용체의 활성을 조절하는 자신의 독에, 코노독소라고 불리는, 신경 독성 펩티드를 생산한다. 특히, 여러 코노독소가 이온 채널을 조절하는 것으로 나타났다 (예, Na_V 채널). 일반적으로, 코노독소는 하나 이상의 이황화 결합을 포함하는 길이가 10 내지 30개의 아미노산인 펩티드이며, 작용하는 표적에 기초하여 하기와 같이 특징지어진다: α-코노독소 (아세틸콜린 수용체), δ-코노독소 (전압-관문 나트륨 채널), κ-코노독소 (칼륨 채널), μ-코노독소 (전압-관문 나트륨 채널) 및 ω-코노독소 (전압-관문 칼슘 채널). 코노독소는 달팽이의 종 사이에서 매우 다형성인 것으로 알려져 있으며, 결과적으로 그것들을 암호화하는 유전자는 보존되지 않는다 (예를 들어, Terlau, H. 및 B.M. Olivera, 2004, Physiol. Rev. 84(1):41-68; Biggs, J.S. 외, 2010, Mol. Phylogenet. Evol. 56(1):1-12; Olivera, B.M. 외, 2012, Ann. N.Y. Acad. Sci. 1267(1):61-70; Wong, E.S. 및 K. Belov, 2012, Gene 496(1):1-7 참조).

코노독소 중에서, μ-코노독소는 두 종류의 시스테인 패턴을 가지고 있으며 근육 조직에서 전압-관문 나트륨 채널에 작용한다고 보고되었다 (Cruz, L.J. 외, 1985, J. Biol. Chem. 260(16):9280-8; Zeikus, R.D. 외, 1985, J. Biol. Chem. 260(16):9280-8; McIntosh, J.M. 및 R.M. Jones, 2001, Toxicon. 39(10):1447-51; Nielsen, K.J. 외, 2002, J. Biol. Chem. 277(30):27247-55; Floresca, C.Z., 2003, Toxicol. Appl. Pharmacol. 190(2):95-101; Priest, B.T. 외, 2007, Toxicon. 49(2):194-201; Schmalhofer, W.A. 외, 2008, Mol. Pharmacol. 74(5):1476-84; Ekberg, J. 외, 2008, Int. J. Biochem. Cell Biol. 40(11):2363-8). 사실, μ-코노독소는 잠재적인 약리학적 용도에 대한 조사 대상이 되어 왔다 (예를 들어, Olivera, B.M. 및 R.W. Teichert, 2007, Mol. Interv. 7(5):251-60; Stevens, M. 외, 2012, J. Biol. Chem. 287(37):31382-92 참조). 다양한 μ-코노독소의 작용 메커니즘을 밝히기 위해 여러 연구가 수행되었지만, 아직 많이 알려지지는 않았다.

독소의 다른 예로는 바다 말미잘, 전갈, 거미 및 독거미의 독을 포함하며, 이들은 활성화를 막고 뉴런 전달을 차단함으로써 이온 채널에 작용한다고 보고되었다. 사실, 여러 전갈 독소가 확인되었고 그 구조가 해결되었다 (예를 들어, Rochat, H. 및 J. Gregoire, 1983, Toxicon. 21(1):153-62; Zhou, X.H. 외, 1989, Biochem. J. 257(2):509-17; Granier, C. 외, 1990, FEBS Lett. 261(2):423-6 참조). 또한, 신경독소-기반 라이브러리가 전갈 독으로부터의 독소를 사용하여 칼륨 채널을 위해 개발되었다 (예를 들어, Takacs, Z. 외, 2009, Proc. Natl. Acad. Sci. U.S.A. 106(52):22211-6 참조). 또 다른 예를 들자면, 독거미 독으로부터의 펩티드가 Na_V1.5 및 Na_V1.7과 같은 전압-관문 나트륨 채널에 특이적으로 작용한다고 보고되었다 (예를 들어, Priest, B.T. 외, 2007, Toxicon. 49(2):194-201; Xiao, Y. 외, 2010, Mol. Pharmacol. 78(6):1124-34 참조). 본원에 설명된 것은 조작된 D_H 영역을 구축하기 위한 뉴클레오티드 코딩 서열의 특히 유용한 세트가 독거미 독소로부터의 뉴클레오티드 코딩 서열 및 μ-코노독소 서열이거나 이들을 포함한다는 발견이다 (예를 들어, 표 4 참조). 본원에 개시된 것은 조작된 D_H 영역의 구축을 위해 전압-관문 나트륨 채널 (예, Na_V1.7)에 작용하는 독소 코딩 서열의 사용이다. 본원에 설명된 방법은 임의의 원하는 독소 펩티드(들), 또는 원하는 다수의 (즉, 2개, 3개, 4개, 5개 등) 독소 펩티드로부터의 독소 펩티드들의 조합 (또는 독소 펩티드 서열 단편)에서 유래한 임의의 코딩 서열 세트를 이용하는 데 사용될 수 있다.

생체 내 시스템 제공

본원에 설명된 것은 특정 항원이 낮은 그리고/또는 약한 면역원성과 연관되어 있으며, 따라서 항체 기반 치료제의 약한 표적이라는 인식이다. 사실, 많은 질환 표적 (예를 들어, 막에 걸쳐진 단백질)은 난치성이거나 약물로 다룰 수 없는 것으로 특징지어져 왔다. 따라서, 본원에 개시된 것은 확립된 약물 발견 기술과 연관된 결함을 극복하는 항체 및 항체 기반 치료제의 개발을 위한 생체 내 시스템의 형성이다. 본 발명은 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 유전자이식 설치류의 구축을 구체적으로 설명하는데, 조작된 D_H 영역은 이종 폴리펩티드 또는 관심 펩티드의 부분 (예를 들어, 세포외 부분, 결합 부분, 기능적 단편 등)을 각각 암호화하는 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함한다. 본원에 설명된 방법은 조작된 D_H 영역을 생성하기 위해 임의의 관심있는 폴리펩티드 또는 펩티드 (예를 들어, 막에 걸쳐진 단백질, 독소, G-단백질-결합 수용체 등)의 부분을 각각 암호화하는 이종 뉴클레오티드 코딩 서열 세트를 사용하기에 적합할 수 있다. 조작된 D_H 영역은 일단 면역글로불린 중쇄 가변 영역에 통합되면 (즉, V 및 J 유전자 분절 및/또는 하나 이상의 불변 영역과 작동가능하게 연결된 상태로 배치됨), 하나 이상의 이종 뉴클레오티드 코딩 서열과 유전자 분절 (즉, V 및 J)의 재조합을 제공해서 특정 항원에 직접 결합하기 위해 다양성 (즉, CDR3 다양성)이 추가된 중쇄를 특징으로 하는 항체를 생성하게 된다.

본원에 설명된 것은 본원에 설명된 조작된 D_H 영역을 구축하기 위한 뉴클레오티드 코딩 서열 (또는 뉴클레오티드 코딩 서열의 조합)의 세트를 설계하는 관심있는 특히 유용한 이종 폴리펩티드가 케모카인 수용체, 코노독소, 독거미 독소 및/또는 이들의 조합을 포함한다는 인식이다.

일부 구현예에서, 케모카인 수용체는 CC-케모카인 수용체, CXC-케모카인 수용체, CX3C-케모카인 수용체, XC-케모카인 수용체 및 이들의 조합을 포함한다.

일부 구현예에서, CC-케모카인 수용체 (β-케모카인 수용체로도 알려짐)는 CCR1, CCR2, CCR3, CCR4, CCR5, CCR6, CCR7, CCR8, CCR9, CCR10 및 CCR11을 포함한다.

일부 구현예에서, CXC-케모카인 수용체는 CXCR1, CXCR2, CXCR3, CXCR4, CXCR5, CXCR6 및 CXCR7을 포함한다.

일부 구현예에서, CX3C-케모카인 수용체는 CX3CR1을 포함한다.

일부 구현예에서, XC-케모카인 수용체는 XCR1을 포함한다.

일부 구현예에서, 코노독소는 α-코노독소, δ-코노독소, κ-코노독소, μ-코노독소, ω-코노독소 및 이들의 조합을 포함한다.

일부 구현예에서, 코노독소는 μ-코노독소이거나 이를 포함한다.

일부 구현예에서, 독거미 독소는 ProTxI, ProTxII, Huwentoxin-IV (HWTX-IV), 및 이들의 조합을 포함한다.

특정 이론에 구속되기를 바라지 않고, 본원에 제공된 데이터는, 일부 구현예에서, 이종 비정형 케모카인 수용체(예, ACKR2, D6 케모카인 유인 수용체로도 알려짐)의 세포외 부분으로부터 유래된 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함하는 것을 특징으로 하는, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 좌위를 포함하는 게놈을 갖는 설치류는 이종 비정형 케모카인 수용체(예, 이종 D6 케모카인 유인 수용체)의 리간드에 결합하기 위해 다양성이 추가된 CDR3를 특징으로 하는 항체를 생산하는 면역글로불린 중쇄 가변 영역 좌위를 효과적으로 생성하는 것을 보여준다는 사실에 주목한다. 또한 본원에 제공된 데이터는, 일부 구현예에서, 하나 이상의 독소(예, μ-코노독소 및/또는 ProTxII)의 부분으로부터 유래된 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함하는 것을 특징으로 하는, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 좌위를 포함하는 게놈을 갖는 설치류는 이종 전압-관문 나트륨 채널 (예, 이종 Na_V 채널)에 결합하기 위해 다양성이 추가된 CDR3를 특징으로 하는 항체를 생산하는 면역글로불린 중쇄 가변 영역 좌위를 효과적으로 생성하는 것을 보여준다는 사실에 주목한다.

특히, 본 발명은, 다른 것들 중에서도, 예를 들어, V_H 및 J_H 분절과 뉴클레오티드 코딩 서열의 재조합으로 인한 다양성을 갖는 CDR3을 특징으로 하는 항체를 생성하기 위한 면역글로불린 중쇄 좌위의 D_H 영역으로의 통합에 특히 유용하며, 여러가지 염증성 사이토카인 (예, CCL2, CCL3, CCL4, CCL5, CCL7, CCL8, CCL11, CCL12, CCL13, CCL14, CCL17, CCL22 및 CCL3L1)을 차단하는, ACKR2 (즉, D6 케모카인 유인 수용체)과 같은, 인간 비정형 케모카인 수용체 (ACKR)로부터의 예시적인 뉴클레오티드 코딩 서열을 구체적으로 보여준다. 또한 본 발명은, V_H 및 J_H 분절과 뉴클레오티드 코딩 서열의 재조합으로 인한 다양성을 갖는 CDR3을 특징으로 하는 항체를 생성하기 위한 면역글로불린 중쇄 좌위의 D_H 영역으로의 통합에 특히 유용하며, 전압-관문 나트륨 채널(들) (예, Na_V1.7)의 활성화 및/또는 기능을 차단하고 그리고/또는 억제하는, 코노독소 (예, μ-코노독소) 및 독거미 독소 (예, ProTxII)로부터의 예시적인 뉴클레오티드 코딩 서열을 구체적으로 보여준다. 따라서, 적어도 일부 구현예에서, 본 발명은 난치성 질환 표적에 항체 및/또는 항체-기반 치료제를 생성하기 위한 생체 내 시스템의 개발을 포함한다.

예시적인 인간 ACKR (이들과 연관된 리간드와 함께)이 표 1에 제시되어 있다 (예를 들어, Nibbs, R.J.B. 및 G.J. Graham, 2013, Nature Reviews 13:815-29 참조). 예시적인 독소 (이들과 연관된 표적과 함께)가 표 2에 제시되어 있다 (예를 들어, Terlau, H. 및 B.M. Olivera, 2004, Physiol. Rev. 84(1):41-68 참조).

ACKR	리간드
ACKR1 (DARC라고도 알려짐)	CCL2, CCL5, CCL7, CCL11, CCL13, CCL14, CCL17, CXCL1, CXCL2, CXCL3, CXCL5, CXCL6, CXCL8, CXCL11
ACKR2 (D6라고도 알려짐)	CCL2, CCL3, CCL4, CCL5, CCL7, CCL8, CCL11, CCL12, CCL13, CCL14, CCL17, CCL22, CCL3L1
ACKR3 (CXCR7라고도 알려짐)	CXCL11, CXCL12
ACKR4 (CCRL1, CCX-CKR 또는 CCR11라고도 알려짐)	CCL19, CCL21, CCL25

독소	표적
α-코노독소	아세틸콜린 수용체
δ-코노독소	전압-관문 나트륨 채널
κ-코노독소	칼륨 채널
μ-코노독소	전압-관문 나트륨 채널
ω-코노독소	N-형 전압-의존형 칼슘 채널
ProTxI	선택적 Ca_V3.1 채널 차단제; Na_V1 서브타입 및 K_V2.1 채널 억제
ProTxII	선택적 Na_V1.7 억제제
Huwentoxin-IV	선택적 Na_V1.7 억제제

ACKR2 (D6 케모카인 유인 수용체) 코딩 서열

본원에 설명된 조작된 D_H 영역을 구축하기 위한 인간 ACKR2 (D6 케모카인 유인 수용체)의 예시적인 뉴클레오티드 코딩 서열 (DNA 및 아미노산 (AA))이 표 3에 제시되어 있다. 표 3에 제시된 인간 ACKR2 뉴클레오티드 코딩 서열 세트는 4개의 세포외 도메인, 이황화 결합을 제거하기 위해 Cys에서 Ser로 치환된 4개의 세포외 도메인, 4개의 Cys 교차 (Nterm-EC3, EC3-Nterm, EC1-EC2, EC2-EC1), 이황화 결합을 제거하기 위해 Cys에서 Ser로 치환된 4개의 Cys 교차, 2개의 루프 융합 (Cys 보유됨; Nterm+EC3, EC1+EC2), 및 7개의 부분 도메인을 특징으로 한다.

Nterm DNA

ATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCA (서열번호 1)

Nterm AA

MAATASPQPLATEDADSENSSFYYYDYLDEVAFMLCRKDAVVSFGKVFLP (서열번호 2)

EC1 DNA

AGCTTCTTGTGCAAG (서열번호 3)

EC1 AA

SFLCK (서열번호 4)

EC2 DNA

CAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTA (서열번호 5)

EC2 AA

QTHENPKGVWNCHADFGGHGTIWKLFLRFQQNLL (서열번호 6)

EC3 DNA

CTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCC (서열번호 7)

EC3 AA

LHTLLDLQVFGNCEVSQHLDYA (서열번호 8)

Nterm-S DNA

ATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCA (서열번호 9)

Nterm-S AA

MAATASPQPLATEDADSENSSFYYYDYLDEVAFMLSRKDAVVSFGKVFLP (서열번호 10)

EC1-S DNA

AGCTTCTTGAGCAAG (서열번호 11)

EC1-S AA

SFLSK (서열번호 12)

EC2-S DNA

CAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTA (서열번호 13)

EC2-S AA

QTHENPKGVWNSHADFGGHGTIWKLFLRFQQNLL (서열번호 14)

EC3-S DNA

CTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTGAGGTTAGCCAGCATCTAGACTATGCC (서열번호 15)

EC3-S AA

LHTLLDLQVFGNSEVSQHLDYA (서열번호 16)

Nterm-EC3 DNA

ATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCGAGGTTAGCCAGCATCTAGACTATGCC (서열번호 17)

Nterm-EC3 AA

MAATASPQPLATEDADSENSSFYYYDYLDEVAFMLCEVSQHLDYA (서열번호 18)

EC3-Nterm DNA

CTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCA (서열번호 19)

EC3-Nterm AA

LHTLLDLQVFGNCRKDAVVSFGKVFLP (서열번호 20)

EC1-EC2 DNA

AGCTTCTTGTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTA (서열번호 21)

EC1-EC2 AA

SFLCHADFGGHGTIWKLFLRFQQNLL (서열번호 22)

EC2-EC1 DNA

CAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCAAG (서열번호 23)

EC2-EC1 AA

QTHENPKGVWNCK (서열번호 24)

Nterm-EC3-S DNA

ATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCGAGGTTAGCCAGCATCTAGACTATGCC (서열번호 25)

Nterm-EC3-S AA

MAATASPQPLATEDADSENSSFYYYDYLDEVAFMLSEVSQHLDYA (서열번호 26)

EC3-Nterm-S DNA

CTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCA (서열번호 27)

EC3-Nterm-S AA

LHTLLDLQVFGNSRKDAVVSFGKVFLP (서열번호 28)

EC1-EC2-S DNA

AGCTTCTTGAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTA (서열번호 29)

EC1-EC2-S AA

SFLSHADFGGHGTIWKLFLRFQQNLL (서열번호 30)

EC2-EC1-S DNA

CAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCAAG (서열번호 31)

EC2-EC1-S AA

QTHENPKGVWNSK (서열번호 32)

Nterm+EC3 DNA

ATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCC (서열번호 33)

Nterm+EC3 AA

MAATASPQPLATEDADSENSSFYYYDYLDEVAFMLCRKDAVVSFGKVFLPLHTLLDLQVFGNCEVSQHLDYA (서열번호 34)

EC1+EC2 DNA

AGCTTCTTGTGCAAGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTA (서열번호 35)

EC1+EC2 AA

SFLCKQTHENPKGVWNCHADFGGHGTIWKLFLRFQQNLL (서열번호 36)

Nterm-N DNA

ATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTC (서열번호 37)

Nterm-N AA

MAATASPQPLATEDADSENSSFYYYDYLDEVAFML (서열번호 38)

Nterm-C DNA

CGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCA (서열번호 39)

Nterm-C AA

RKDAVVSFGKVFLP (서열번호 40)

EC1-N DNA

AGCTTCTTG (서열번호 41)

EC1-N AA

SFL (서열번호 42)

EC2-N DNA

CAAACCCATGAAAACCCCAAGGGAGTTTGGAAC (서열번호 43)

EC2-N AA

QTHENPKGVWN (서열번호 44)

EC2-C DNA

CATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTA (서열번호 45)

EC2-C AA

HADFGGHGTIWKLFLRFQQNLL (서열번호 46)

EC3-N DNA

CTGCATACCCTGCTGGACCTGCAAGTATTCGGCAAC (서열번호 47)

EC3-N AA

LHTLLDLQVFGN (서열번호 48)

EC3-C DNA

GAGGTTAGCCAGCATCTAGACTATGCC (서열번호 49)

EC3-C AA

EVSQHLDYA (서열번호 50)

조작된 D_H 영역을 구축하기 위한 인간 ACKR2 (D6 케모카인 유인 수용체) 뉴클레오티드 코딩 서열을 함유하는 예시적인 DNA 단편들이 아래에 제공되어 있다.

D6-DH1166 (서열번호 131)은 D_H1-1 내지 D_H6-6에 대응하는 위치에 삽입된 D6 코딩 서열을 포함한다:

TACGTAGCCGTTTCGATCCTCCCGAATTGACTAGTGGGTAGGCCTGGCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATACCGGTGGATTCGAATTCTCCCCGTTGAAGCTGACCTGCCCAGAGGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTACAGGCCCCGGTCTCTGTGGGTGTTCCGCTAACTGGGGCTCCCAGTGCTCACCCCACAACTAAAGCGAGCCCCAGCCTCCAGAGCCCCCGAAGGAGATGCCGCCCACAAGCCCAGCCCCCATCCAGGAGGCCCCAGAGCTCAGGGCGCCGGGGCGGATTTTGTACAGCCCCGAGTCACTGTGCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGAGAAAAACTGTGTCAAAAACCGTCTCCTGGCCCCTGCTGGAGGCCGCGCCAGAGAGGGGAGCAGCCGCCCCGAACCTAGGTCCTGCTCAGCTCACACGACCCCCAGCACCCAGAGCACAACGGAGTCCCCATTGAATGGTGAGGACGGGGACCAGGGCTCCAGGGGGTCATGGAAGGGGCTGGACCCCATCCTACTGCTATGGTCCCAGTGCTCCTGGCCAGAACTGACCCTACCACCGACAAGAGTCCCTCAGGGAAACGGGGGTCACTGGCACCTCCCAGCATCAACCCCAGGCAGCACAGGCATAAACCCCACATCCAGAGCCGACTCCAGGAGCAGAGACACCCCAGTACCCTGGGGGACACCGACCCTGATGACTCCCCACTGGAATCCACCCCAGAGTCCACCAGGACCAAAGACCCCGCCCCTGTCTCTGTCCCTCACTCAGGACCTGCTGCGGGGCGGGCCATGAGACCAGACTCGGGCTTAGGGAACACCACTGTGGCCCCAACCTCGACCAGGCCACAGGCCCTTCCTTCCTGCCCTGCGGCAGCACAGACTTTGGGGTCTGTGCAGAGAGGAATCACAGAGGCCCCAGGCTGAGGTGGTGGGGGTGGAAGACCCCCAGGAGGTGGCCCACTTCCCTTCCTCCCAGCTGGAACCCACCATGACCTTCTTAAGATAGGGGTGTCATCCGAGGCAGGTCCTCCATGGAGCTCCCTTCAGGCTCCTCCCCGGTCCTCACTAGGCCTCAGTCCCGGCTGCGGGAATGCAGCCACCACAGGCACACCAGGCAGCCCAGACCCAGCCAGCCTGCAGTGCCCAAGCCCACATTCTGGAGCAGAGCAGGCTGTGTCTGGGAGAGTCTGGGCTCCCCACCGCCCCCCCGCACACCCCACCCACCCCTGTCCAGGCCCTATGCAGGAGGGTCAGAGCCCCCCATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCCTCCTGGGTGAAGGGGTCTCATGCCCAGATCCCCACAGCAGAGCTGGTCAAAGGTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGACCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGACTCCACCAGACCACAGGTCCAGGGCACCGCCCATAGGTGCTGCCCACACTCAGTTCACAGGAAGAAGATAAGCTCCAGACCCCCAAGACTGGGACCTGCCTTCCTGCCACCGCTTGTAGCTCCAGACCTCCGTGCCTCCCCCGACCACTTACACACGGGCCAGGGAGCTGTTCCACAAAGATCAACCCCAAACCGGGACCGCCTGGCACTCGGGCCGCTGCCACTTCCCTCTCCATTTGTTCCCAGCACCTCTGTGCTCCCTCCCTCCTCCCTCCTTCAGGGGAACAGCCTGTGCAGCCCCTCCCTGCACCCCACACCCTGGGGAGGCCCAACCCTGCCTCCAGCCCTTTCTCCCCCGCTGCTCTTCCTGCCCATCCAGACAACCCTGGGGTCCCATCCCTGCAGCCTACACCCTGGTCTCCACCCAGACCCCTGTCTCTCCCTCCAGACACCCCTCCCAGGCCAACCCTGCACATGCAGGCCCTCCCCTTTTCTGCTGCCAGAGCCTCAGTTTCTACCCTCTGTGCCTACCCCCTGCCTCCTCCTGCCCACAACTCGAGCTCTTCCTCTCCTGGGGCCCCTGAGCCATGGCACTGACCGTGCACTCCCACCCCCACACTGCCCATGCCCTCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCTTGGACCCAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCCGGTTACACGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCCTGATGCACGTCCGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTGTAAAGACGAGGGATCCAGGCAGCAACATCATGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGCCCGCTGGATAGTAACTGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCAGACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCGCGTGGAAACAGAACAGACCCACATTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCTGAGAAACACCAGGCAACGGCATCAGAGGGGGCTCCTGAGAAAGAAAGGAGGGGAGGTCTCCTTCACCAGCAAGTACTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCCCACACACCCTGAGTTTCAGACAAAAACCCCCTGGAAATCATAGTATCAGCAGGAGAACTAGCCAGAGACAGCAAGAGGGGACTCAGTGACTCCCGCGGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGACACAGCCCCATTCAAAAACCCCTGCTGTAAACGCTTCCACTTCTGGAGCTGAGGGGCTGGGGGGAGCGTCTGGGAAGTAGGGCCTAGGGGTGGCCATCAATGCCCAAAACGCACCAGACTCCCCCCCAGACATCACCCCACTGGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGATAGTTCCATAAACTGGTGTTCAAGATCGATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGGGCACAGGGAAGGAGAAGCAGCCGCTATCCTACACTGTCATCTTTCAAGAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCCACACAGAAGCAAGCACAAGGAAAGTGCCTGATGCAAGGGCAAAGTACAGTGTGTACCTTCAGGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGAACTCCCTGCAACAAAGCAGAGCCCTGCAGGCAATGCCAGCTCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAATGAAGCAAACAGCCATCTGAAGGAAAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCAGAAGGACAACAGTGAGGGTTACAGGTGACTCTGTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGGAAAGTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACAGCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCACTAGGAAAACTATAAGGAAAATCAAGAAAAGGATGATCACATAAACACAGTGGTCGTTACTTCTACTGGGGAAGGAAGAGGGTATGAACTGAGACACACAGGGTTGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAAATTCTAAATTGCAAGAAGAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAACGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATTGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATATGTGGTGGCACTCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCCGTATCCCCCCGAGGACATATACCCCCAAGGACGGCACAGTTGGTACATTCCGGAGACAAGCAACTCAGCCACACTCCCAGGCCAGAGCCCGAGAGGGACGCCCATGCACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCAGCAGCACCCGTGCAGGGGCCGCCATCTGGCAGGCACAGAGCATGGGCTGGGAGGAGGGGCAGGGACACCAGGCAGGGTTGGCACCAACTGAAAATTACAGAAGTCTCATACATCTACCTCAGCCTTGCCTGACCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGACCTCACCTGGCCTAGACCTCACCTCTGGGCTTCACCTGAGCTCGGCCTCACCTGACTTGGACCTTGCCTGTCCTGAGCTCACATGATCTGGGCCTCACCTGACCTGGGTTTCACCTGACCTGGGCTTCACCTGACCTGGGCCTCATCTGACCTGGGCCTCACTGGCCTGGACCTCACCTGGCCTGGGCTTCACCTGGCCTCAGGCCTCATCTGCACCTGCTCCAGGTCTTGCTGGAACCTCAGTAGCACTGAGGCTGCAGGGGCTCATCCAGGGTTGCAGAATGACTCTAGAACCTCCCACATCTCAGCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCTGAATGATGCCTGCGTGATTTGGGGGCAATTTATAAACCCAAAAGGACATGGCCATGCAGCGGGTAGGGACAATACAGACAGATATCAGCCTGAAATGGAGCCTCAGGGCACAGGTGGGCACGGACACTGTCCACCTAAGCCAGGGGCAGACCCGAGTGTCCCCGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTACCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAACCTTCTGCCACAGCCCTCCCTGTGGGGCACCGCCGCGTGCCATGTTAGGATTTTGACTGAGGACACAGCACCATGGGTATGGTGGCTACCGCAGCAGTGCAGCCCGTGACCCAAACACACAGGGCAGCAGGCACAACAGACAAGCCCACAAGTGACCACCCTGAGCTCCTGCCTGCCAGCCCTGGAGACCATGAAACAGATGGCCAGGATTATCCCATAGGTCAGCCAGACCTCAGTCCAACAGGTCTGCATCGCTGCTGCCCTCCAATACCAGTCCGGATGGGGACAGGGCTGGCCCACATTACCATTTGCTGCCATCCGGCCAACAGTCCCAGAAGCCCCTCCCTCAAGGCTGGGCCACATGTGTGGACCCTGAGAGCCCCCCATGTCTGAGTAGGGGCACCAGGAAGGTGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGGGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCCAGGACAGCTGGAGCTGGGAGTCCATCATCCTGCCTGGCCGTCCTGAGTCCTGCGCCTTTCCAAACCTCACCCGGGAAGCCAACAGAGGAATCACCTCCCACAGGCAGAGACAAAGACCTTCCAGAAATCTCTGTCTCTCTCCCCAGTGGGCACCCTCTTCCAGGGCAGTCCTCAGTGATATCACAGTGGGAACCCACATCTGGATCGGGACTGCCCCCAGAACACAAGATGGCCCACAGGGACAGCCCCACAGCCCAGCCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCATCTGCCCCAGGGCTCAAACTCCAGGAGGACTGACTCCTGCACACCCTCCTGCCAGACATCACCTCAGCCCCTCCTGGAAGGGACAGGAGCGCGCAAGGGTGAGTCAGACCCTCCTGCCCTCGATGGCAGGCGGAGAAGATTCAGAAAGGTCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGGCACACTCAGGGGGATTTTGTGAAGGGTCCTCCCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGATGAACCCAGCATCAAAAACCGACCGGACTCCCAAGGTTTATGCACACTTCTCCGCTCAGAGCTCTCCAGGATCAGAAGAGCCGGGCCCAAGGGTTTCTGCCCAGACCCTCGGCCTCTAGGGACATCTTGGCCATGACAGCCCATGGGCTGGTGCCCCACACATCGTCTGCCTTCAAACAAGGGCTTCAGAGGGCTCTGAGGTGACCTCACTGATGACCACAGGTGCCCTGGCCCCTTCCCCACCAGCTGCACCAGACCCCGTCATGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGGCCAGGAATCGCTGTAGACACCAGCCTCCTTCCAACACCTCCTGCCAATTGCCTGGATTCCCATCCCGGTTGGAATCAAGAGGACAGCATCCCCCAGGCTCCCAACAGGCAGGACTCCCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGTAGGGCCAGGCTGCAGACAGTCCCCCTCACCTGCCACTAGACAAATGCCTGCTGTAGATGTCCCCACCTGGAAAATACCACTCATGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCTCTGAGGCCCCTAAGAAGTAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCTGACAGGAGTGGACGCTGGAGCTGGGCCCATACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCTCTATTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGCAGCTTCTTGTGCAAGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTTTTCTGCACTCTCCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGATCTGTTCTCAACATCCCACGGCCTCATTCCTGCAAGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGACAGGACATCCTGCTGGGGTATCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTTGCCAAAATCCCCACGGCCTCCCCCGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGCAGGTGACCAGGGCAGGAAATGGCCTGAACACAGGGATAACCGGGCCATCCCCCAACAGAGTCCACCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGCCCATGACATCCGACAACCCCACACCAGAGTCACTGCCCGGTGCTGCCCTAGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTGGGGAGGACAGGACACGCCCTCTCCTTATGGTTCCCCCACCTGGCTCTGGCTGGGACCCTTGGGGTGTGGACAGAAAGGACGCTTGCCTGATTGGCCCCCAGGAGCCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAGGGAGGAAGTGGGGCCACTGCACCACCAGGCAGGAGGCTCTGTCTTTGTGAACCCAGGGAGGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTATGGCTCCCACAGTGGCAGGCTGCAGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCCGCGGGTGCTCCATCTTGGATGAGCCTATCTCTCTCACCCACGGACTCGCCCACCTCCTCTTCACCCTGGCCACACGTCGTCCACACCATCCTAAGTCCCACCTACACCAGAGCCGGCACAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGACTGGGCAGCTTCGGGGAGGGAGGAATGGAGGAAGGGGAGTTCAGTGAAGAGGCCCCCCTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCTGGGCCTGGGGGCAGCCGCTCCCACACAGGATGAACCCAGCACCCCGAGGATGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAGGATATGGGACCCCCGATACAGGCACAGACCTCAGCTCCATTCAGGACTGCCACGTCCTGCCCTGGGAGGAACCCCTTTCTCTAGTCCCTGCAGGCCAGGAGGCAGCTGACTCCTGACTTGGACGCCTATTCCAGACACCAGACAGAGGGGCAGGCCCCCCAGAACCAGGGATGAGGACGCCCCGTCAAGGCCAGAAAAGACCAAGTTGCGCTGAGCCCAGCAAGGGAAGGTCCCCAAACAAACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGACACTCGCCAGGTCAAAAACCCCATCCCAAGTCAGCGGAATGCAGAGAGAGCAGGGAGGACATGTTTAGGATCTGAGGCCGCACCTGACACCCAGGCCAGCAGACGTCTCCTGTCCACGGCACCCTGCCATGTCCTGCATTTCTGGAAGAACAAGGGCAGGCTGAAGGGGGTCCAGGACCAGGAGATGGGTCCGCTCTACCCAGAGAAGGAGCCAGGCAGGACACAAGCCCCCACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTACGTA

D6-D17613 (서열번호 132)은 D_H1-7 내지 D_H6-13에 대응하는 위치에 삽입된 D6 코딩 서열을 포함한다:

GCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATTACGTAACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTCCCCATTGAGGCTGACCTGCCCAGAGGGTCCTGGGCCCACCCAACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAACGAGCCACAGCCTCCGGAGCCCCTGAAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCACAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGCAGCTTCTTGCACAGTGAGAAAAGCTTCGTCAAAAACCGTCTCCTGGCCACAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCACCCCAAACCCATGTTCTGCCGGCTCCCATGACCCCGTGCACCTGGAGCCCCACGGTGTCCCCACTGGATGGGAGGACAAGGGCCGGGGGCTCCGGCGGGTCGGGGCAGGGGCTTGATGGCTTCCTTCTGCCGTGGCCCCATTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGTCAGGGATCAGTGGCACCTCCCAACATCAACCCCACGCAGCCCAGGCACAAACCCCACATCCAGGGCCAACTCCAGGAACAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTCCCGTCCCATCTCTGTCCCTCACTTGGGGCCTGCTGCGGGGCGAGCACTTGGGAGCAAACTCAGGCTTAGGGGACACCACTGTGGGCCTGACCTCGAGCAGGCCACAGACCCTTCCCTCCTGCCCTGGTGCAGCACAGACTTTGGGGTCTGGGCAGGGAGGAACTTCTGGCAGGTCACCAAGCACAGAGCCCCCAGGCTGAGGTGGCCCCAGGGGGAACCCCAGCAGGTGGCCCACTACCCTTCCTCCCAGCTGGACCCCATGTCTTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGGCTCCTCTCCAGACCCCACTGGGCCTCAGTCCCCACTCTAGGAATGCAGCCACCACGGGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCCCACACCCTGGAGGAGAGCAGGGTGCGTCTGGGAGGGGCTGGGCTCCCCACCCCCACCCCCACCTGCACACCCCACCCACCCTTGCCCGGGCCCCCTGCAGGAGGGTCAGAGCCCCCATGGGATATGGACTTAGGGTCTCACTCACGCACCTCCCCTCCTGGGAGAAGGGGTCTCATGCCCAGATCCCCCCAGCAGCGCTGGTCACAGGTAGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCCCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCTAGGGCACCGCCCACACTGGGGCCGCCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGCCCGGGACCTGCCTTGCTGCTACGACTTCCTGCCCCAGACCTCGTTGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGACCAACCCCAGACGGGGACCACCTGGCACTCAGGTCACTGCCATTTCCTTCTCCATTCACTTCCAATGCCTCTGTGCTTCCTCCCTCCTCCTTCCTTCGGGGGAGCACCCTGTGCAGCTCCTCCCTGCAGTCCACACCCTGGGGAGACCCGACCCTGCAGCCCACACCCTGGGGAGACCTGACCCTCCTCCAGCCCTTTCTCCCCCGCTGCTCTTGCCACCCACCAAGACAGCCCTGGGGTCCTGTCCCTACAGCCCCCACCCAGTTCTCTACCTAGACCCGTCTTCCTCCCTCTAAACACCTCTCCCAGGCCAACCCTACACCTGCAGGCCCTCCCCTCCACTGCCAAAGACCCTCAGTTTCTCCTGCCTGTGCCCACCCCCGTGCTCCTCCTGCCCACAGCTCGAGCTCTTCCTCTCCTAGGGCCCCTGAGGGATGGCATTGACCGTGCCCTCGCACCCACACACTGCCCATGCCCTCACATTCCTCCTGGCCACTCCAGCCCCACTCCCCTCTCAGGCCTGGCTCTGGTATTTCTGGGACAAAGCCTTACCCAAGTCTTTCCCATGCAGGCCTGGGCCCTTACCCTCACTGCCCGGTTACAGGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCGCCTTGACACACGTCTGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTCTAAAGACGAGGGATCCAGGCAGCAGCATCACAGGAGAATGCAGGGCTACCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGAAGACGCCCAGTCAACGGAGTCTAACACCAAACCTCCCTGGAGGCCGATGGGTAGTAACGGAGTCATTGCCAGACCTGGAGGCAGGGGAGCAGTGAGCCCGAGCCCACACCATAGGGCCAGAGGACAGCCACTGACATCCCAAGCCACTCACTGGTGGTCCCACAACACCCCATGGAAAGAGGACAGACCCACAGTCCCACCTGGACCAGGGCAGAGACTGCTGAGACCCAGCACCAGAACCAACCAAGAAACACCAGGCAACAGCATCAGAGGGGGCTCTGGCAGAACAGAGGAGGGGAGGTCTCCTTCACCAGCAGGCGCTTCCCTTGACCGAAGACAGGATCCATGCAACTCCCCCAGGACAAAGGAGGAGCCCCTTGTTCAGCACTGGGCTCAGAGTCCTCTCCAAGACACCCAGAGTTTCAGACAAAAACCCCCTGGAATGCACAGTCTCAGCAGGAGAGCCAGCCAGAGCCAGCAAGATGGGGCTCAGTGACACCCGCAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGACACAGCCCCATTCAAAAACCCCTACTGCAAACGCATTCCACTTCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAATAGGGCTCAGGGGTGTCCATCAATGCCCAAAACGCACCAGACTCCCCTCCATACATCACACCCACCAGCCAGCGAGCAGAGTAAACAGAAAATGAGAAGCAAGCTGGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGTAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCGAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGCGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCGAAAGTTTGCCTTGTGCCCACACTGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCCTGGCAGGAACTCCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAGCAAAGCAAACGTCCATCTGAAGGAGAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCACAAGCACAAAAGTACAGGGTTATAAGCGACTCTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGTAAACTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACACCCTGCAAAATGAACTGTCTTCTTAAGGGATACATTTCCCAGTTAGAAAACCATAAAGAAAACCAAGAAAAGGATGATCACATAAACACAGTGGTGGTTACTTCTGCTGGGGAAGGAAGAGGGTATGAACTGAGATACACAGGGTGGGCAAGTCTCCTAACAAGAACAGAACGAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATTGCAAGAAGAGGAAAATGCACACAGTTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTCGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATATATTTAGTATATGAGACATCGATGATGTATCCCCAAATAAACGACTTTAAAGAGATAAAGGGCTGATGTGTGGTGGCATTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCTCACTGTGCAGCAGGGCAGGCGGGTACCTGCTGGCAGTTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCCATATATCCCGGAGGACGGCACAGTCAGTGAATTCCAGAGAGAAGCAACTCAGCCACACTCCCCAGGCAGAGCCCGAGAGGGACGCCCACGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCAGCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGACGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACTGGCCTGGGCCTCACTTAACCTGGGCTTCACCTGACCTTGGCCTCACCTGACTTGGACCTCGCCTGTCCCAAGCTTTACCTGACCTGGGCCTCAACTCACCTGAACGTCTCCTGACCTGGGTTTAACCTGTCCTGGAACTCACCTGGCCTTGGCTTCCCCTGACCTGGACCTCATCTGGCCTGGGCTTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCATCTGGCCTGGACCTCACCTGGCCTGGACTTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGGTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTAGAAGTCTCCCACATCTGACCTTTCTGGGTGGAGGCAGCTGGTGGCCCTGGGAATATAAAAATCTCCAGAATGATGACTCTGTGATTTGTGGGCAACTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGGTGGGCACGGACACTATCCACATAAGCGAGGGATAGACCCGAGTGTCCCCACAGCAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCAGAGCCCTGCTGCCTCCTCCGGTCAGCCCTGGACATCCCAGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGAAGCTTCCCGCCACAGCCCTCCCCATGGGGCCCTGCTGCCTCCTCAGGTCAGCCCCGGACATCCCGGGTTTCCCCAGGCTGGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCCAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAGCCTCCCGCCACAGCCCTCCCTGCAGGGGACCGGTACGTGCCATGTTAGGATTTTGATCGAGGAGACAGCACCATGGGTATGGTGGCTACCACAGCAGTGCAGCCTGTGACCCAAACCCGCAGGGCAGCAGGCACGATGGACAGGCCCGTGACTGACCACGCTGGGCTCCAGCCTGCCAGCCCTGGAGATCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCGAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAGTCCAAATGGGACAGGGACGGCCTCACAGCACCATCTGCTGCCATCAGGCCAGCGATCCCAGAAGCCCCTCCCTCAAGGCTGGGCACATGTGTGGACACTGAGAGCCCTCATATCTGAGTAGGGGCACCAGGAGGGAGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCTGGGGACAGCCGGAGCTGGGCGTCGCTCATCCTGCCCGGCCGTCCTGAGTCCTGCTCATTTCCAGACCTCACCGGGGAAGCCAACAGAGGACTCGCCTCCCACATTCAGAGACAAAGAACCTTCCAGAAATCCCTGCCTCTCTCCCCAGTGGACACCCTCTTCCAGGACAGTCCTCAGTGGCATCACAGCGGCCTGAGATCCCCAGGACGCAGCACCGCTGTCAATAGGGGCCCCAAATGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGCCACACTCGGGGATTTTGTGAAGGGCCCTCCCACTGTGCCAGCTTCTTGAGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGATGAACCCAGTGTCAAAAACCGGCTGGAAACCCAGGGGCTGTGTGCACGCCTCAGCTTGGAGCTCTCCAGGAGCACAAGAGCCGGGCCCAAGGATTTGTGCCCAGACCCTCAGCCTCTAGGGACACCTGGGTCATCTCAGCCTGGGCTGGTGCCCTGCACACCATCTTCCTCCAAATAGGGGCTTCAGAGGGCTCTGAGGTGACCTCACTCATGACCACAGGTGACCTGGCCCTTCCCTGCCAGCTATACCAGACCCTGTCTTGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGACCCTGAATAGCTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAAGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGACAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGAGACACTGTGCATGTCTGGTACCTAAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCTCAGCTGTCTGGGCCCTCCCTGCTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGCGATGTCACACTGTGCAGCTTCTTGAGCAAGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGCGCAGCCCCAGGCATCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGTCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGATTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACGGAGCCACGGAGTCACAGAGCCACGGAGCCCCCATTGTGGGCATTTGAGAGTGCTGTGCCCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGTCCCATCCCACAGCCCGGGTCCCACGGGCAGCGGGCACAGAAGCTGCCAGGTTGTCCTCTATGATCCTCATCCCTCCAGCAGCATCCCCTCCACAGTGGGGAAACTGAGGCTTGGAGCACCACCCGGCCCCCTGGAAATGAGGCTGTGAGCCCAGACAGTGGGCCCAGAGCACTGTGAGTACCCCGGCAGTACCTGGCTGCAGGGATCAGCCAGAGATGCCAAACCCTGAGTGACCAGCCTACAGGAGGATCCGGCCCCACCCAGGCCACTCGATTAATGCTCAACCCCCTGCCCTGGAGACCTCTTCCAGTACCACCAGCAGCTCAGCTTCTCAGGGCCTCATCCCTGCAAGGAAGGTCAAGGGCTGGGCCTGCCAGAAACACAGCACCCTCCCTAGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGTGGACGGGACATATTGCTGGGGCATTTCTCACTGTCACTTCTGGGTGGTAGCTCTGACAAAAACGCAGACCCTGCCAAAATCCCCACTGCCTCCCGCTAGGGGCTGGCCTGGAATCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGCCCTTGCCGGGGTTGAATGCAGGTGCCCAAGGCAGGAAATGGCATGAGCACAGGGATGACCGGGACATGCCCCACCAGAGTGCGCCCCTTCCTGCTCTGCACCCTGCACCCCCCAGGCCAGCCCACGACGTCCAACAACTGGGCCTGGGTGGCAGCCCCACCCAGACAGGACAGACCCAGCACCCTGAGGAGGTCCTGCCAGGGGGAGCTAAGAGCCATGAAGGAGCAAGATATGGGGCCCCCGATACAGGCACAGATGTCAGCTCCATCCAGGACCACCCAGCCCACACCCTGAGAGGAACGTCTGTCTCCAGCCTCTGCAGGTCGGGAGGCAGCTGACCCCTGACTTGGACCCCTATTCCAGACACCAGACAGAGGCGCAGGCCCCCCAGAACCAGGGTTGAGGGACGCCCCGTCAAAGCCAGACAAAACCAAGGGGTGTTGAGCCCAGCAAGGGAAGGCCCCCAAACAGACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCCACAGTGACACTCACCCAGTCAAAAACCCCATTCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGACTGCACCTGACACCCAGGCCAGCAGACGTCTCCCCTCCAGGGCACCCCACCCTGTCCTGCATTTCTGCAAGATCAGGGGCGGCCTGAGGGGGGGTCTAGGGTGAGGAGATGGGTCCCCTGTACACCAAGGAGGAGTTAGGCAGGTCCCGAGCACTCTTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTACGTAATGCATTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCC

D6-DH114619 (서열번호 133)은 D_H1-14 내지 D_H6-19에 대응하는 위치에 삽입된 D6 코딩 서열을 포함한다:

TACGTATTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTCCCCATTGAGGCTGACCTGCCCAGAGAGTCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAATGAGCCACAGCCTCCGGAGCCCCCGCAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACCACAGTGAGAATAGCTACGTCAAAAACCGTCCAGTGGCCACTGCCGGAGGCCCCGCCAGAGAGGGCAGCAGCCACTCTGATCCCATGTCCTGCCGGCTCCCATGACCCCCAGCACGCGGAGCCCCACAGTGTCCCCACTGGATGGGAGGACAAGAGCTGGGGATTCCGGCGGGTCGGGGCAGGGGCTTGATCGCATCCTTCTGCCGTGGCTCCAGTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGACAGGCATCACCGGCGCCTCCCAACATCAACCCCAGGCAGCACAGGCACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTTCCCACTGGAATTCGCCGTAGAGTCCACCAGGACCAAAGACCCTGCCTCTGCCTCTGTCCCTCACTCAGGACCTGCTGCCGGGCGAGGCCTTGGGAGCAGACTTGGGCTTAGGGGACACCAGTGTGACCCCGACCTTGACCAGGACGCAGACCTTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCCAGGAGGAACTTCTGGCAGGTCGCCAAGCACAGAGGCCACAGGCTGAGGTGGCCCTGGAAAGACCTCCAGGAGGTGGCCACTCCCCTTCCTCCCAGCTGGACCCCATGTCCTCCCCAAGATAAGGGTGCCATCCAAGGCAGGTGCTCCTTGGAGCCCCATTCAGACTCCTCCCTGGACCCCACTGGGCCTCAGTCCCAGCTCTGGGGATGAAGCCACCACAAGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCACACACTCTGGAGCAGAGCAGGGTGCCTCTGGGAGGGGCTGAGCTCCCCACCCCACCCCCACCTGCACACCCCACCCACCCCTGCCCAGCGGCTCTGCAGGAGGGTCAGAGCCCCACATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCATCATGAGTGAAGGGGCCTCAAGCCCAGGTTCCCACAGCAGCGCCTGTCGCAAGTGGAGGCAGAGGCCCGAGGGCCACCCTGACCTGGTCCCTGAGGTTCCTGCAGCCCAGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACCGGGTGCAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGGCCAGAACCTGCCTTCCTGCTACTGCTTCCTGCCCCAGACCTGGGCGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGAACAACCCCAAACCAGGACCGCCTGGCACTCAGGTGGCTGCCATTTCCTTCTCCATTTGCTCCCAGCGCCTCTGTCCTCCCTGGTTCCTCCTTCGGGGGAACAGCCTGTGCAGCCAGTCCCTGCAGCCCACACCCTGGGGAGACCCAACCCTGCCTGGGGCCCTTCCAACCCTGCTGCTCTTACTGCCCACCCAGAAAACTCTGGGGTCCTGTCCCTGCAGTCCCTACCCTGGTCTCCACCCAGACCCCTGTGTATCACTCCAGACACCCCTCCCAGGCAAACCCTGCACCTGCAGGCCCTGTCCTCTTCTGTCGCTAGAGCCTCAGTTTCTCCCCCCTGTGCCCACACCCTACCTCCTCCTGCCCACAACTCTAACTCTTCTTCTCCTGGAGCCCCTGAGCCATGGCATTGACCCTGCCCTCCCACCACCCACAGCCCATGCCCTCACCTTCCTCCTGGCCACTCCGACCCCGCCCCCTCTCAGGCCAAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTTCCCAGGCAGGCCTGGGCTCTTGCCCTCACTTCCCGGTTACACGGGAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCTTGACACACGTCCGCCCGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGACAAGGGATCCAGGCAGCAGCATCACGGGAGAATGCAGGGCTCCCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACCAAACAGCCACAGAGGCTGCTGGATAGTAACTGAGTCAATGACCGACCTGGAGGGCAGGGGAGCAGTGAGCCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCTCCTCAATGGTGGCCCCATAACACACCTAGGAAACATAACACACCCACAGCCCCACCTGGAACAGGGCAGAGACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACCAGGCAACAGTATCAGAGGGGGCTCCCGAGAAAGAGAGGAGGGGAGATCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTATACAGCACTGGGCTCAGAGTCCTCTCTGAGACACCCTGAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAACAGACCAAAGCCAGCAAAAGGGACCTCGGTGACACCAGTAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCAAGCACAGTGACACAGACCCATTCAAAAACCCCTACTGCAAACACACCCACTCCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAGTAGGGTCCAGGGGTGTCTATCAATGTCCAAAATGCACCAGACTCCCCGCCAAACACCACCCCACCAGCCAGCGAGCAGGGTAAACAGAAAATGAGAGGCTCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCAGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCAAGATCAGTGGCTGGGAATGAGCCCAGGAGGGCAGTCTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCAAAAGTTTGCCTTGTGACCACACTATTGCATCATGGGATGCTTAAGAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGAATTTGCAGCATAGATCTGAATAAACTCTCCAGAATGTGGAGCAGTACAGAAGCAAACACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGATCTCCCTGCGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCGTCATGGGGAAAGATGTGCAGAACAGCTGATTATCATAGACTCAAACTGAGAACAGAGCAAACGTCCATCTGAAGAACAGTCAAATAAGCAATGGTAGGTTCATGCAATGCAAACCCAGACAGCCAGGGGACAACAGTAGAGGGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCAGGCAAAATGAACTGTCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTACAAGGAAAATTAAGAAAACGATGATCACATAAACACAGTTGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCAAGCAAGCACAGAACGAATACATTACAGTACCTTGAATACAGCAGTTAAACTTCTAAATCGCAAGAACAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTATTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAATGATGACACAGGCAATTGCACAATGATACAGACATACATTTAGTACATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCACTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACATGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCTGTATACCCCCAAGGATGGCACAGTCAGTGAATTCCAGAGAGAAGCAGCTCAGCCACACTGCCCAGGCAGAGCCCGAGAGGGACGCCCACGTACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCACCACCACCTGTGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACCTGGTCTGGACCTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCCGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAACCTGAGTAGCACTGAGGCTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTGGAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCATCTGGTGGCCCTGGGAATATAAAAAGCCCCAGAATGGTGCCTGCGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGTTGGACGCGGACACTATCCACATAAGCGAGGGACAGACCCGAGTGTTCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCAGATGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCTGCGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGTCACACGGTCCATCAAAAACCCATGCCACAGCCCTCCCCGCAGGGGACCGCCGCGTGCCATGTTACGATTTTGATCGAGGACACAGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACAGGGCAGCAGGCACAATGGACAGGCCTGTGAGTGACCATGCTGGGCTCCAGCCCGCCAGCCCCGGAGACCATGAAACAGATGGCCAAGGTCACCCCACAGTTCAGCCAGACATGGCTCCGTGGGGTCTGCATCGCTGCTGCCCTCTAACACCAGCCCAGATGGGGACAAGGCCAACCCCACATTACCATCTCCTGCTGTCCACCCAGTGGTCCCAGAAGCCCCTCCCTCATGGCTGAGCCACATGTGTGAACCCTGAGAGCACCCCATGTCAGAGTAGGGGCAGCAGAAGGGCGGGGCTGGCCCTGTGCACTGTCCCTGCACCCATGGTCCCTCGCCTGCCTGGCCCTGACACCTGAGCCTCTTCTGAGTCATTTCTAAGATAGAAGACATTCCCGGGGACAGCCGGAGCTGGGCGTCGCTCATCCCGCCCGGCCGTCCTGAGTCCTGCTTGTTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAAAGAACCTTCCAGAAATCCCTGTCTCACTCCCCAGTGGGCACCTTCTTCCAGGACATTCCTCGGTCGCATCACAGCAGGCACCCACATCTGGATCAGGACGGCCCCCAGAACACAAGATGGCCCATGGGGACAGCCCCACAACCCAGGCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCACCTGCCCCAGGGCTAAAAATCCAGGAGGCTTGACTCCCGCATACCCTCCAGCCAGACATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCGATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCGCTGGGCACACTCAGGGGGATTTTGTGAAGGCCCCTCCCACTGTGCAGCTTCTTGTGCAAGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGATGAAACTAGCATCAAAAACCGGCCGGACACCCAGGGACCATGCACACTTCTCAGCTTGGAGCTCTCCAGGACCAGAAGAGTCAGGTCTGAGGGTTTGTAGCCAGACCCTCGGCCTCTAGGGACACCCTGGCCATCACAGCGGATGGGCTGGTGCCCCACATGCCATCTGCTCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGCCCCTTCCCCGCCAGCTACACCGAACCCTGTCCCAACAGCTGCCCCAGTTCCAACAGCCAATTCCTGGGGCCCAGAATTGCTGTAGACACCAGCCTCGTTCCAGCACCTCCTGCCAATTGCCTGGATTCACATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGACTCCCCGAGGGATCTAAGAAGGAGCCATGCGCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACACTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACTGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGTCACTGTTGTCTGTACTCTGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTTCTCAACATCCCAGGGCCTCATGTCTGCACGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGGACAGTACATACTGCTGGGGTGTCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTCGCCAAAATCCCCACAGCCTCCCCTGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGTCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGGAGGTGACCAAGGTAGGAAATGGCCTTAACACAGGGATGACTGCGCCATCCCCCAACAGAGTCAGCCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGTCCACGAAAACCAGGGCCCCACATCAGAGTCACTGCCTGGCCCGGCCCTGGGGCGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTTGGGGGGACAGGACACAGGCCCTCTCCTTATGGTTCCCCCACCTGCCTCCGGCCGGGACCCTTGGGGTGTGGACAGAAAGGACACCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCGGTATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCGGGTGCTCCTCCATCTTCGGTGAGCCTCCCCCTTCACCCACCGTCCCGCCCACCTCCTCTCCACCCTGGCTGCACGTCTTCCACACCATCCTGAGTCCTACCTACACCAGAGCCAGCAAAGCCAGTGCAGACAAAGGCTGGGGTGCAGGGGGGCTGCCAGGGCAGCTTCGGGGAGGGAAGGATGGAGGGAGGGGAGGTCAGTGAAGAGGCCCCCTTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCTGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATATCCCCACAGCGGCTCAGGCCAGACCCAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTCCTGGGCCTGGGTAGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAAGAGCAGGATATGGGGTCCCCGATACAGGCACAGACCTCAGCTCCATCCAGGCCCACCGGGACCCACCATGGGAGGAACACCTGTCTCCGGGTTGTGAGGTAGCTGGCCTCTGTCTCGGACCCCACTCCAGACACCAGACAGAGGGGCAGGCCCCCCAAAACCAGGGTTGAGGGATGATCCGTCAAGGCAGACAAGACCAAGGGGCACTGACCCCAGCAAGGGAAGGCTCCCAAACAGACGAGGAGGATTTTGTAGCTGTCTGTATCACTGTGCAGCTTCTTGTGCCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGACACTCGCCAGGTCAAAAACCCCGTCCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGGCCGCACCTGACACCCAGGGCAGCAGACGTCTCCCCTCCAGGGCACCCTCCACCGTCCTGCGTTTCTTCAAGAATAGGGGCGGCCTGAGGGGGTCCAGGGCCAGGCGATAGGTCCCCTCTACCCCAAGGAGGAGCCAGGCAGGACCCGAGCACCGATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTACGTA

D6-DH120126 (서열번호 134)은 D_H1-20 내지 D_H1-26에 대응하는 위치에 삽입된 D6 코딩 서열을 포함한다:

TACGTAATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTCCCCATTGAGGCTGACCTGCCCAGACGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCCCAGTCTCTGTGGGTGTTCCGCTAGCTGGGGCCCCCAGTGCTCACCCCACACCTAAAGCGAGCCCCAGCCTCCAGAGCCCCCTAAGCATTCCCCGCCCAGCAGCCCAGCCCCTGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGTCGGATTTTGTACAGCCCCGAGTCACTGTGCATGCCGATTTCGGCGGGCATGGCACCATTTGGAAGCTCTTCCTCCGGTTCCAGCAGAACCTGCTACCACAGTGAGAAAAACTGTGTCAAAAACCGACTCCTGGCAGCAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCGGCCTGAACCCATGTCCTGCCGGTTCCCATGACCCCCAGCACCCAGAGCCCCACGGTGTCCCCGTTGGATAATGAGGACAAGGGCTGGGGGCTCCGGTGGTTTGCGGCAGGGACTTGATCACATCCTTCTGCTGTGGCCCCATTGCCTCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAAAGACAGGGATCACCGGCACCTCCCAATATCAACCCCAGGCAGCACAGACACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAACACTCTGGGGGACCCCAACCGTGATAACTCCCCACTGGAATCCGCCCCAGAGTCTACCAGGACCAAAGGCCCTGCCCTGTCTCTGTCCCTCACTCAGGGCCTCCTGCAGGGCGAGCGCTTGGGAGCAGACTCGGTCTTAGGGGACACCACTGTGGGCCCCAACTTTGATGAGGCCACTGACCCTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCAGGGAAGAACTACTGGCTGGTGGCCAATCACAGAGCCCCCAGGCCGAGGTGGCCCCAAGAAGGCCCTCAGGAGGTGGCCACTCCACTTCCTCCCAGCTGGACCCCAGGTCCTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGACTCCTCCCGGGACCCCACTGGACCTCAGTCCCTGCTCTGGGAATGCAGCCACCACAAGCACACCAGGAAGCCCAGGCCCAGCCACCCTGCAGTGGGCAAGCCCACACTCTGGAGCAGAGCAGGGTGCGTCTGGGAGGGGCTAACCTCCCCACCCCCCACCCCCCATCTGCACACAGCCACCTACCACTGCCCAGACCCTCTGCAGGAGGGCCAAGCCACCATGGGGTATGGACTTAGGGTCTCACTCACGTGCCTCCCCTCCTGGGAGAAGGGGCCTCATGCCCAGATCCCTGCAGCACTAGACACAGCTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCATCTAAGGCTGCTCCAGCCCAGACAGCACTGCCGTTCCTGGGAAGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACAGCCCACAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCAGGGCGGGACCTGCCTTCCTGCCACCACTTACACACAGGCCAGGGAGCTGTTCCCACACAGATCAACCCCAAACCGGGACTGCCTGGCACTAGGGTCACTGCCATTTCCCTCTCCATTCCCTCCCAGTGCCTCTGTGCTCCCTCCTTCTGGGGAACACCCTGTGCAGCCCCTCCCTGCAGCCCACACGCTGGGGAGACCCCACCCTGCCTCGGGCCTTTTCTACCTGCTGCACTTGCCGCCCACCCAAACAACCCTGGGTACGTGACCCTGCAGTCCTCACCCTGATCTGCAACCAGACCCCTGTCCCTCCCTCTAAACACCCCTCCCAGGCCAACTCTGCACCTGCAGGCCCTCCGCTCTTCTGCCACAAGAGCCTCAGGTTTTCCTACCTGTGCCCACCCCCTAACCCCTCCTGCCCACAACTTGAGTTCTTCCTCTCCTGGAGCCCTTGAGCCATGGCACTGACCCTACACTCCCACCCACACACTGCCCATGCCATCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCCCTCTCAGACCCGGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCTGGTTACACGGGAGCCTCCTGTGCGCAGAAGCAGGGAGCTCAGCTCTTCCACAGGCAGAAGGCACTGAAAGAAATCAGCCTCCAGTGCCTTGACACACGTCCGCCTGTGTCTCTCACTGCCTGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGATGAGGGATCCAGGCAGCAACATCACGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGGTCGCTGGATAGTAACCGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTAACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCCCGTGGAAAGAGAACAGACCCACAGTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACTAGGCAACAGCATCAGAGGGGGCTCCTGAGAAAGAGAGGAGGGGAGGTCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCTGAGACAGGCTCAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAGCCAGGCCAGAGCCAGCAAGAGGAGACTCGGTGACACCAGTCTCCTGTAGGGACAGGAGGATTTTGTGGGGGTTCGTGTCACTGTGCAAACCCATGAAAACCCCAAGGGAGTTTGGAACAGCAAGCACAGTGACACAACCCCATTCAAAAACCCCTACTGCAAACGCACCCACTCCTGGGACTGAGGGGCTGGGGGAGCGTCTGGGAAGTATGGCCTAGGGGTGTCCATCAATGCCCAAAATGCACCAGACTCTCCCCAAGACATCACCCCACCAGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCAGGTGTGCAAGAGGGGATGTGGGCAGAGCCTCAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTATTCAAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTTGAAAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATCCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCCAAGGCAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCACTGGCAGGAACTGCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCTAGAGCCCTTCCTGAGAACCTCATGGGCAAAGATGTGCAGAACAGCTGTTTGTCATAGCCCCAAACTATGGGGCTGGACAAAGCAAACGTCCATCTGAAGGAGAACAGACAAATAAACGATGGCAGGTTCATGAAATGCAAACTAGGACAGCCAGAGGACAACAGTAGAGAGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTATAAGGAAAATCAAGAAAACGATGATCACATAAACACAGTGGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATCGCAAGAAGAGGAAAATGCACACACCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCAATCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCTCACTGTGTGGCAGGGCAGGCAGGCACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCTGTATATCCCCAAGGAAGGTACAGTCAGTGCATTCCAGAGAGAAGCAACTCAGCCACACTCCCTGGCCAGAACCCAAGATGCACACCCATGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCACCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGCTGTAGGGACTCATCCAGGGTTGGGGAATGACTCTGCAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCCCAGAATGATGCCTGTGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACAGTAGGGACAGATGTCAGCCTGAGGTGAAGCCTCAGGACACAGGTGGGCATGGACAGTGTCCACCTAAGCGAGGGACAGACCCGAGTGTCCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGGGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGCATGGCAGCTACTGCCAGCCCGCAGCCACTGGCTACTGAGGATGCCGATTCTGAGAATAGCAGCTTCTACTACTATGACTACCTGGATGAAGTAGCTTTCATGCTCAGCGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGGAGCCTCCCACCACAGCCCTCCCTGCGGGGGACCGCTGCATGCCGTGTTAGGATTTTGATCGAGGACACGGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACGGGGCAGCAGAAACAATGGACAGGCCCACAAGTGACCATGATGGGCTCCAGCCCACCAGCCCCAGAGACCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCAAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAAACCAGATGGAGACAGGGCCGGCCCCATAGCACCATCTGCTGCCGTCCACCCAGCAGTCCCGGAAGCCCCTCCCTGAACGCTGGGCCACGTGTGTGAACCCTGCGAGCCCCCCATGTCAGAGTAGGGGCAGCAGGAGGGCGGGGCTGGCCCTGTGCACTGTCACTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACATTCCCAGGGACAGCCGGAGCTGGGAGTCGCTCATCCTGCCTGGCTGTCCTGAGTCCTGCTCATTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAACGAACCTTCCAGAAATCCCTGTTTCTCTCCCCAGTGAGAGAAACCCTCTTCCAGGGTTTCTCTTCTCTCCCACCCTCTTCCAGGACAGTCCTCAGCAGCATCACAGCGGGAACGCACATCTGGATCAGGACGGCCCCCAGAACACGCGATGGCCCATGGGGACAGCCCAGCCCTTCCCAGACCCCTAAAAGGTATCCCCACCTTGCACCTGCCCCAGGGCTCAAACTCCAGGAGGCCTGACTCCTGCACACCCTCCTGCCAGATATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCAATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGTGTGGGAAAGGCCTCTGGCCACACTCAGGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGGTTAGCCAGCATCTAGACTATGCCCACAGTGATGAAACCAGCATCAAAAACCGACCGGACTCGCAGGGTTTATGCACACTTCTCGGCTCGGAGCTCTCCAGGAGCACAAGAGCCAGGCCCGAGGGTTTGTGCCCAGACCCTCGGCCTCTAGGGACACCCGGGCCATCTTAGCCGATGGGCTGATGCCCTGCACACCGTGTGCTGCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGTCCCTTCACTGCCAGCTGCACCAGACCCTGTTCCGAGAGATGCCCCAGTTCCAAAAGCCAATTCCTGGGGCCGGGAATTACTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCACACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCGCAGACAGTTCCCCTCACCTGCCCATGTAGAAACACCTGCCATTGTCGTCCCCACCTGGCAAAGACCACTTGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGACCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACAGTGCATGTCTGGTCCCTGAGCAGCCCCCAGGCTCTCTAGCACTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGCCACACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACAGTCGGAAGGATGCTGTGGTTAGCTTTGGCAAAGTTTTCCTGCCACCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGACCCCTGCCACGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGCCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGACTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACAGAGCCATGGAGTCACAGAGCCACGGAGCCCCCAGTGTGGGCGTGTGAGGGTGCTGGGCTCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGCCCCGTCCCACAGCCCAGGTCCCCAGGGGCAGCAGGCACAGAAGCTGCCAAGCTGTGCTCTACGATCCTCATCCCTCCAGCAGCATCCACTCCACAGTGGGGAAACTGAGCCTTGGAGAACCACCCAGCCCCCTGGAAACAAGGCGGGGAGCCCAGACAGTGGGCCCAGAGCACTGTGTGTATCCTGGCACTAGGTGCAGGGACCACCCGGAGATCCCCATCACTGAGTGGCCAGCCTGCAGAAGGACCCAACCCCAACCAGGCCGCTTGATTAAGCTCCATCCCCCTGTCCTGGGAACCTCTTCCCAGCGCCACCAACAGCTCGGCTTCCCAGGCCCTCATCCCTCCAAGGAAGGCCAAAGGCTGGGCCTGCCAGGGGCACAGTACCCTCCCTTGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGCAGATAGGACATATTGCTGGGGCATCTTGCTCTGTGACTACTGGGTACTGGCTCTCAACGCAGACCCTACCAAAATCCCCACTGCCTCCCCTGCTAGGGGCTGGCCTGGTCTCCTCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTTCTGTCCCCAGTTCTAGGGCCAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGTCCTTGCCGAGGTTCAGTGCAGGCACCCAGGACAGGAAATGGCCTGAACACAGGGATGACTGTGCCATGCCCTACCTAAGTCCGCCCCTTTCTACTCTGCAACCCCCACTCCCCAGGTCAGCCCATGACGACCAACAACCCAACACCAGAGTCACTGCCTGGCCCTGCCCTGGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGAGTTGGGGGGACAGGACACAGGCTCTCTCCTTATGGTTCCCCCACCTGGCTCCTGCCGGGACCCTTGGGGTGTGGACAGAAAGGACGCCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACTCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGCTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCAGGTGCTCCATCTTGGATGAGCCCATCCCTCTCACCCACCGACCCGCCCACCTCCTCTCCACCCTGGCCACACGTCGTCCACACCATCCTGAGTCCCACCTACACCAGAGCCAGCAGAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGCCAGGGCAGCTTTGGGGAGGGAGGAATGGAGGAAGGGGAGGTCAGTGAAGAGGCCCCCCTCCCCTGGGTCTAGGATCCACCTTTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGATTCTGTGCAGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCAGGGCCTGGGGGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAAGATATGGGGACCCCAATACTGGCACAGACCTCAGCTCCATCCAGGCCCACCAGGACCCACCATGGGTGGAACACCTGTCTCCGGCCCCTGCTGGCTGTGAGGCAGCTGGCCTCTGTCTCGGACCCCCATTCCAGACACCAGACAGAGGGACAGGCCCCCCAGAACCAGTGTTGAGGGACACCCCTGTCCAGGGCAGCCAAGTCCAAGAGGCGCGCTGAGCCCAGCAAGGGAAGGCCCCCAAACAAACCAGGAGGTTTCTGAAGCTGTCTGTGTCACAGTCGGGCATAGCCACGGCTACCACAATGACACTGGGCAGGACAGAAACCCCATCCCAAGTCAGCCGAAGGCAGAGAGAGCAGGCAGGACACATTTAGGATCTGAGGCCACACCTGACACTCAAGCCAACAGATGTCTCCCCTCCAGGGCGCCCTGCCCTGTTCAGTGTTCCTGAGAAAACAGGGGCAGCCTGAGGGGATCCAGGGCCAGGAGATGGGTCCCCTCTACCCCGAGGAGGAGCCAGGCGGGAATCCCAGCCCCCTCCCCATTGAGGCCATCCTGCCCAGAGGGGCCCGGACCCACCCCACACACCCAGGCAGAATGTGTGCAGGCCTCAGGCTCTGTGGGTGCCGCTAGCTGGGGCTGCCAGTCCTCACCCCACACCTAAGGTGAGCCACAGCCGCCAGAGCCTCCACAGGAGACCCCACCCAGCAGCCCAGCCCCTACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGGTGGATTTTGTACAGCCCCGAGTCACTGTGCTGCATACCCTGCTGGACCTGCAAGTATTCGGCAACCACAGTGAGAAAAGCTATGTCAAAAACCGTCTCCCGGCCACTGCTGGAGGCCCAGCCAGAGAAGGGACCAGCCGCCCGAACATACGACCTTCCCAGACCTCATGACCCCCAGCACTTGGAGCTCCACAGTGTCCCCATTGGATGGTGAGGATGGGGGCCGGGGCCATCTGCACCTCCCAACATCACCCCCAGGCAGCACAGGCACAAACCCCAAATCCAGAGCCGACACCAGGAACACAGACACCCCAATACCCTGGGGGACCCTGGCCCTGGTGACTTCCCACTGGGATCCACCCCCGTGTCCACCTGGATCAAAGACCCCACCGCTGTCTCTGTCCCTCACTCAGGGCCTGCTGAGGGGCGGGTGCTTTGGAGCAGACTCAGGTTTAGGGGCCACCATTGTGGGGCCCAACCTCGACCAGGACACAGATTTTTCTTTCCTGCCCTGGGGCAACACAGACTTTGGGGTCTGTGCAGGGAGGACCTTCTGGAAAGTCACCAAGCACAGAGCCCTGACTGAGGTGGTCTCAGGAAGACCCCCAGGAGGGGGCTTGTGCCCCTTCCTCTCATGTGGACCCCATGCCCCCCAAGATAGGGGCATCATGCAGGGCAGGTCCTCCATGCAGCCACCACTAGGCAACTCCCTGGCGCCGGTCCCCACTGCGCCTCCATCCCGGCTCTGGGGATGCAGCCACCATGGCCACACCAGGCAGCCCGGGTCCAGCAACCCTGCAGTGCCCAAGCCCTTGGCAGGATTCCCAGAGGCTGGAGCCCACCCCTCCTCATCCCCCCACACCTGCACACACACACCTACCCCCTGCCCAGTCCCCCTCCAGGAGGGTTGGAGCCGCCCATAGGGTGGGGGCTCCAGGTCTCACTCACTCGCTTCCCTTCCTGGGCAAAGGAGCCTCGTGCCCCGGTCCCCCCTGACGGCGCTGGGCACAGGTGTGGGTACTGGGCCCCAGGGCTCCTCCAGCCCCAGCTGCCCTGCTCTCCCTGGGAGGCCTGGGCACCACCAGACCACCAGTCCAGGGCACAGCCCCAGGGAGCCGCCCACTGCCAGCTCACAGGAAGAAGATAAGCTTCAGACCCTCAGGGCCGGGAGCTGCCTTCCTGCCACCCCTTCCTGCCCCAGACCTCCATGCCCTCCCCCAACCACTTACACACAAGCCAGGGAGCTGTTTCCACACAGTTCAACCCCAAACCAGGACGGCCTGGCACTCGGGTCACTGCCATTTCTGTCTGCATTCGCTCCCAGCGCCCCTGTGTTCCCTCCCTCCTCCCTCCTTCCTTTCTTCCTGCATTGGGTTCATGCCGCAGAGTGCCAGGTGCAGGTCAGCCCTGAGCTTGGGGTCACCTCCTCACTGAAGGCAGCCTCAGGGTGCCCAGGGGCAGGCAGGGTGGGGGTGAGGCTTCCAGCTCCAACCGCTTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCCGTCGACCAATTCTCATGTTTGACAGCTTATCATCGAATTTCTACGTA

독소 코딩 서열

본원에 설명된 조작된 D_H(engineered D_H, eD_H)영역을 구축하기 위한 독소 (예, μ-코노독소 및 독거미 독소 ProTxII)의 예시적인 뉴클레오티드 코딩 서열들 (DNA 및 아미노산 (AA))이 표 4에 제시되어 있다.

SmIIIA C1SC4S DNA

GAGAGAAGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGAGCCGCGATCATAGCAGGTGCTGC (서열번호 180)

SmIIIA C1SC4S AA

ERSCNGRRGCSSRWSRDHSRCC (서열번호 181)

CSSRWC DNA

AGGATATTGTAGCAGCAGATGGTGCTATACC (서열번호 182)

CSSRWC AA

GYCSSRWCYT (서열번호 183)

KIIIA mini DNA

GTATTACGATTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCTATTATACC (서열번호 184)

KIIIA mini AA

YYDCNCSRWRDHSRCCYYT (서열번호 185)

PIIIA C1SC4S DNA

GAGAGGCTTAGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAAAGCAAGCCTCACAGATGCTGC (서열번호 186)

PIIIA C1SC4S AA

ERLSCGFPKSCRSRQSKPHRCC (서열번호 187)

ProTxII C1SC4S DNA

TACAGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCAGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGG (서열번호 188)

ProTxII C1SC4S AA

YSQKWMWTCDSERKCSEGMVCRLWCKKKLW (서열번호 189)

KIIIA C1SC4S DNA

AGCTGCAACTGCAGCAGCAAATGGAGCCGCGACCATAGCAGGTGCTGC (서열번호 190)

KIIIA C1SC4S AA

SCNCSSKWSRDHSRCC (서열번호 191)

SmIIIA mini DNA

GAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGC (서열번호 192)

SmIIIA mini AA

ERCNGRRGCSRWRDHSRCC (서열번호 193)

RSRQ insertion DNA

AGGATATTGTACTAATCGGAGCAGGCAGGGTGTATGCTATACC (서열번호 194)

RSRQ insertion AA

GYCTNRSRQGVCYT (서열번호 195)

KIIIA midi DNA

GTATTACGATTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCTATTATAAC (서열번호 196)

KIIIA midi AA

YYDCNCSRWARDHSRCCYYN (서열번호 197)

SmIIIA mini DNA

GTATTACTATGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCTATTATAAC (서열번호 198)

SmIIIA mini AA

YYYERCNGRRGCSRWRDHSRCCYYN (서열번호 199)

PIIIA mini DNA

GAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGC (서열번호 200)

PIIIA mini AA

ERLCGFPKSCSRQKPHRCC (서열번호 201)

ProTxII C2SC5S DNA

TACTGCCAGAAGTGGATGTGGACTAGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTAAGCCGGCTGTGGTGTAAGAAGAAGCTCTGG (서열번호 202)

ProTxII C2SC5S AA

YCQKWMWTSDSERKCCEGMVSRLWCKKKLW (서열번호 203)

KIIIA mini DNA

TGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTG (서열번호 204)

KIIIA mini AA

CNCSRWRDHSRC (서열번호 205)

SmIIIA fl DNA

GAGAGATGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGTGCCGCGATCATAGCAGGTGCTGC (서열번호 206)

SmIIIA fl AA

ERCCNGRRGCSSRWCRDHSRCC (서열번호 207)

SSRW insertion DNA

AGGATATTGTAGTGGTAGCAGCAGATGGGGTAGCTGCTACTCC (서열번호 208)

SSRW insertion AA

GYCSGSSRWGSCYS (서열번호 209)

SmIIIA midi DNA

GTATTATGATTACGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCTATCGTTATACC (서열번호 210)

SmIIIA midi AA

YYDYERACNGRRGCSRWARDHSRCCYRYT (서열번호 211)

PIIIA midi DNA

GAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGC (서열번호 212)

PIIIA midi AA

ERLACGFPKSCSRQAKPHRCC (서열번호 213)

ProTxII C3SC6S DNA

TACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGAGCTGTGAGGGTATGGTATGCCGGCTGTGGAGTAAGAAGAAGCTCTGG (서열번호 214)

ProTxII C3SC6S AA

YCQKWMWTCDSERKSCEGMVCRLWSKKKLW (서열번호 215)

KIIIA midi DNA

TGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTG (서열번호 216)

KIIIA midi AA

CNCSRWARDHSRC (서열번호 217)

SmIIIA midi DNA

GAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGC (서열번호 218)

SmIIIA midi AA

ERACNGRRGCSRWARDHSRCC (서열번호 219)

CRSRQC DNA

AGCATATTGTCGGAGCAGGCAGTGCTATTCC (서열번호 220)

CRSRQC AA

AYCRSRQCYS (서열번호 221)

PIIIA midi DNA

GTATTACTATGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCTATTACTAC (서열번호 222)

PIIIA midi AA

YYYERLACGFPKSCSRQAKPHRCCYYY (서열번호 223)

PIIA fl DNA

GAGAGGCTTTGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAATGCAAGCCTCACAGATGCTGC (서열번호 224)

PIIA fl AA

ERLCCGFPKSCRSRQCKPHRCC (서열번호 225)

ProTxII fl DNA

TACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGG (서열번호 226)

ProTxII fl AA

YCQKWMWTCDSERKCCEGMVCRLWCKKKLW (서열번호 227)

KIIIA fl DNA

TGCTGCAACTGCAGCAGCAAATGGTGCCGCGACCATAGCAGGTGCTGC (서열번호 228)

KIIIA fl AA

CCNCSSKWCRDHSRCC (서열번호 229)

PIIIA mini DNA

GGTATAGTGGGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCAGCTACTAC (서열번호 230)

PIIIA mini AA

YSGERLCGFPKSCSRQKPHRCCSYY (서열번호 231)

조작된 D_H 영역을 구축하기 위한 독소 뉴클레오티드 코딩 서열을 함유하는 예시적인 DNA 단편들이 아래에 제공되어 있다.

TX-DH1166 (서열번호 232)은 D_H1-1 내지 D_H6-6에 대응하는 위치에 삽입된 독소 코딩 서열을 포함한다:

TACGTAGCCGTTTCGATCCTCCCGAATTGACTAGTGGGTAGGCCTGGCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATACCGGTGGATTCGAATTCTCCCCGTTGAAGCTGACCTGCCCAGAGGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTACAGGCCCCGGTCTCTGTGGGTGTTCCGCTAACTGGGGCTCCCAGTGCTCACCCCACAACTAAAGCGAGCCCCAGCCTCCAGAGCCCCCGAAGGAGATGCCGCCCACAAGCCCAGCCCCCATCCAGGAGGCCCCAGAGCTCAGGGCGCCGGGGCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGAAGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGAGCCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAACTGTGTCAAAAACCGTCTCCTGGCCCCTGCTGGAGGCCGCGCCAGAGAGGGGAGCAGCCGCCCCGAACCTAGGTCCTGCTCAGCTCACACGACCCCCAGCACCCAGAGCACAACGGAGTCCCCATTGAATGGTGAGGACGGGGACCAGGGCTCCAGGGGGTCATGGAAGGGGCTGGACCCCATCCTACTGCTATGGTCCCAGTGCTCCTGGCCAGAACTGACCCTACCACCGACAAGAGTCCCTCAGGGAAACGGGGGTCACTGGCACCTCCCAGCATCAACCCCAGGCAGCACAGGCATAAACCCCACATCCAGAGCCGACTCCAGGAGCAGAGACACCCCAGTACCCTGGGGGACACCGACCCTGATGACTCCCCACTGGAATCCACCCCAGAGTCCACCAGGACCAAAGACCCCGCCCCTGTCTCTGTCCCTCACTCAGGACCTGCTGCGGGGCGGGCCATGAGACCAGACTCGGGCTTAGGGAACACCACTGTGGCCCCAACCTCGACCAGGCCACAGGCCCTTCCTTCCTGCCCTGCGGCAGCACAGACTTTGGGGTCTGTGCAGAGAGGAATCACAGAGGCCCCAGGCTGAGGTGGTGGGGGTGGAAGACCCCCAGGAGGTGGCCCACTTCCCTTCCTCCCAGCTGGAACCCACCATGACCTTCTTAAGATAGGGGTGTCATCCGAGGCAGGTCCTCCATGGAGCTCCCTTCAGGCTCCTCCCCGGTCCTCACTAGGCCTCAGTCCCGGCTGCGGGAATGCAGCCACCACAGGCACACCAGGCAGCCCAGACCCAGCCAGCCTGCAGTGCCCAAGCCCACATTCTGGAGCAGAGCAGGCTGTGTCTGGGAGAGTCTGGGCTCCCCACCGCCCCCCCGCACACCCCACCCACCCCTGTCCAGGCCCTATGCAGGAGGGTCAGAGCCCCCCATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCCTCCTGGGTGAAGGGGTCTCATGCCCAGATCCCCACAGCAGAGCTGGTCAAAGGTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGACCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGACTCCACCAGACCACAGGTCCAGGGCACCGCCCATAGGTGCTGCCCACACTCAGTTCACAGGAAGAAGATAAGCTCCAGACCCCCAAGACTGGGACCTGCCTTCCTGCCACCGCTTGTAGCTCCAGACCTCCGTGCCTCCCCCGACCACTTACACACGGGCCAGGGAGCTGTTCCACAAAGATCAACCCCAAACCGGGACCGCCTGGCACTCGGGCCGCTGCCACTTCCCTCTCCATTTGTTCCCAGCACCTCTGTGCTCCCTCCCTCCTCCCTCCTTCAGGGGAACAGCCTGTGCAGCCCCTCCCTGCACCCCACACCCTGGGGAGGCCCAACCCTGCCTCCAGCCCTTTCTCCCCCGCTGCTCTTCCTGCCCATCCAGACAACCCTGGGGTCCCATCCCTGCAGCCTACACCCTGGTCTCCACCCAGACCCCTGTCTCTCCCTCCAGACACCCCTCCCAGGCCAACCCTGCACATGCAGGCCCTCCCCTTTTCTGCTGCCAGAGCCTCAGTTTCTACCCTCTGTGCCTACCCCCTGCCTCCTCCTGCCCACAACTCGAGCTCTTCCTCTCCTGGGGCCCCTGAGCCATGGCACTGACCGTGCACTCCCACCCCCACACTGCCCATGCCCTCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCTTGGACCCAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCCGGTTACACGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCCTGATGCACGTCCGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTGTAAAGACGAGGGATCCAGGCAGCAACATCATGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGCCCGCTGGATAGTAACTGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCAGACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCGCGTGGAAACAGAACAGACCCACATTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCTGAGAAACACCAGGCAACGGCATCAGAGGGGGCTCCTGAGAAAGAAAGGAGGGGAGGTCTCCTTCACCAGCAAGTACTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCCCACACACCCTGAGTTTCAGACAAAAACCCCCTGGAAATCATAGTATCAGCAGGAGAACTAGCCAGAGACAGCAAGAGGGGACTCAGTGACTCCCGCGGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTAGCAGCAGATGGTGCTATACCCACAGTGACACAGCCCCATTCAAAAACCCCTGCTGTAAACGCTTCCACTTCTGGAGCTGAGGGGCTGGGGGGAGCGTCTGGGAAGTAGGGCCTAGGGGTGGCCATCAATGCCCAAAACGCACCAGACTCCCCCCCAGACATCACCCCACTGGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGATAGTTCCATAAACTGGTGTTCAAGATCGATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGGGCACAGGGAAGGAGAAGCAGCCGCTATCCTACACTGTCATCTTTCAAGAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCCACACAGAAGCAAGCACAAGGAAAGTGCCTGATGCAAGGGCAAAGTACAGTGTGTACCTTCAGGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGAACTCCCTGCAACAAAGCAGAGCCCTGCAGGCAATGCCAGCTCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAATGAAGCAAACAGCCATCTGAAGGAAAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCAGAAGGACAACAGTGAGGGTTACAGGTGACTCTGTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGGAAAGTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACAGCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCACTAGGAAAACTATAAGGAAAATCAAGAAAAGGATGATCACATAAACACAGTGGTCGTTACTTCTACTGGGGAAGGAAGAGGGTATGAACTGAGACACACAGGGTTGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAAATTCTAAATTGCAAGAAGAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAACGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATTGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATATGTGGTGGCACTCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCCGTATCCCCCCGAGGACATATACCCCCAAGGACGGCACAGTTGGTACATTCCGGAGACAAGCAACTCAGCCACACTCCCAGGCCAGAGCCCGAGAGGGACGCCCATGCACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCAGCAGCACCCGTGCAGGGGCCGCCATCTGGCAGGCACAGAGCATGGGCTGGGAGGAGGGGCAGGGACACCAGGCAGGGTTGGCACCAACTGAAAATTACAGAAGTCTCATACATCTACCTCAGCCTTGCCTGACCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGACCTCACCTGGCCTAGACCTCACCTCTGGGCTTCACCTGAGCTCGGCCTCACCTGACTTGGACCTTGCCTGTCCTGAGCTCACATGATCTGGGCCTCACCTGACCTGGGTTTCACCTGACCTGGGCTTCACCTGACCTGGGCCTCATCTGACCTGGGCCTCACTGGCCTGGACCTCACCTGGCCTGGGCTTCACCTGGCCTCAGGCCTCATCTGCACCTGCTCCAGGTCTTGCTGGAACCTCAGTAGCACTGAGGCTGCAGGGGCTCATCCAGGGTTGCAGAATGACTCTAGAACCTCCCACATCTCAGCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCTGAATGATGCCTGCGTGATTTGGGGGCAATTTATAAACCCAAAAGGACATGGCCATGCAGCGGGTAGGGACAATACAGACAGATATCAGCCTGAAATGGAGCCTCAGGGCACAGGTGGGCACGGACACTGTCCACCTAAGCCAGGGGCAGACCCGAGTGTCCCCGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTACCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACGATTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCTATTATACCCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAACCTTCTGCCACAGCCCTCCCTGTGGGGCACCGCCGCGTGCCATGTTAGGATTTTGACTGAGGACACAGCACCATGGGTATGGTGGCTACCGCAGCAGTGCAGCCCGTGACCCAAACACACAGGGCAGCAGGCACAACAGACAAGCCCACAAGTGACCACCCTGAGCTCCTGCCTGCCAGCCCTGGAGACCATGAAACAGATGGCCAGGATTATCCCATAGGTCAGCCAGACCTCAGTCCAACAGGTCTGCATCGCTGCTGCCCTCCAATACCAGTCCGGATGGGGACAGGGCTGGCCCACATTACCATTTGCTGCCATCCGGCCAACAGTCCCAGAAGCCCCTCCCTCAAGGCTGGGCCACATGTGTGGACCCTGAGAGCCCCCCATGTCTGAGTAGGGGCACCAGGAAGGTGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGGGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCCAGGACAGCTGGAGCTGGGAGTCCATCATCCTGCCTGGCCGTCCTGAGTCCTGCGCCTTTCCAAACCTCACCCGGGAAGCCAACAGAGGAATCACCTCCCACAGGCAGAGACAAAGACCTTCCAGAAATCTCTGTCTCTCTCCCCAGTGGGCACCCTCTTCCAGGGCAGTCCTCAGTGATATCACAGTGGGAACCCACATCTGGATCGGGACTGCCCCCAGAACACAAGATGGCCCACAGGGACAGCCCCACAGCCCAGCCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCATCTGCCCCAGGGCTCAAACTCCAGGAGGACTGACTCCTGCACACCCTCCTGCCAGACATCACCTCAGCCCCTCCTGGAAGGGACAGGAGCGCGCAAGGGTGAGTCAGACCCTCCTGCCCTCGATGGCAGGCGGAGAAGATTCAGAAAGGTCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGGCACACTCAGGGGGATTTTGTGAAGGGTCCTCCCACTGTGGAGAGGCTTAGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAAAGCAAGCCTCACAGATGCTGCCACAGTGATGAACCCAGCATCAAAAACCGACCGGACTCCCAAGGTTTATGCACACTTCTCCGCTCAGAGCTCTCCAGGATCAGAAGAGCCGGGCCCAAGGGTTTCTGCCCAGACCCTCGGCCTCTAGGGACATCTTGGCCATGACAGCCCATGGGCTGGTGCCCCACACATCGTCTGCCTTCAAACAAGGGCTTCAGAGGGCTCTGAGGTGACCTCACTGATGACCACAGGTGCCCTGGCCCCTTCCCCACCAGCTGCACCAGACCCCGTCATGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGGCCAGGAATCGCTGTAGACACCAGCCTCCTTCCAACACCTCCTGCCAATTGCCTGGATTCCCATCCCGGTTGGAATCAAGAGGACAGCATCCCCCAGGCTCCCAACAGGCAGGACTCCCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGTAGGGCCAGGCTGCAGACAGTCCCCCTCACCTGCCACTAGACAAATGCCTGCTGTAGATGTCCCCACCTGGAAAATACCACTCATGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCTCTGAGGCCCCTAAGAAGTAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCTGACAGGAGTGGACGCTGGAGCTGGGCCCATACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCTCTATTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGTACAGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCAGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTTTTCTGCACTCTCCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGATCTGTTCTCAACATCCCACGGCCTCATTCCTGCAAGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGACAGGACATCCTGCTGGGGTATCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTTGCCAAAATCCCCACGGCCTCCCCCGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGCAGGTGACCAGGGCAGGAAATGGCCTGAACACAGGGATAACCGGGCCATCCCCCAACAGAGTCCACCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGCCCATGACATCCGACAACCCCACACCAGAGTCACTGCCCGGTGCTGCCCTAGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTGGGGAGGACAGGACACGCCCTCTCCTTATGGTTCCCCCACCTGGCTCTGGCTGGGACCCTTGGGGTGTGGACAGAAAGGACGCTTGCCTGATTGGCCCCCAGGAGCCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAGGGAGGAAGTGGGGCCACTGCACCACCAGGCAGGAGGCTCTGTCTTTGTGAACCCAGGGAGGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTATGGCTCCCACAGTGGCAGGCTGCAGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCCGCGGGTGCTCCATCTTGGATGAGCCTATCTCTCTCACCCACGGACTCGCCCACCTCCTCTTCACCCTGGCCACACGTCGTCCACACCATCCTAAGTCCCACCTACACCAGAGCCGGCACAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGACTGGGCAGCTTCGGGGAGGGAGGAATGGAGGAAGGGGAGTTCAGTGAAGAGGCCCCCCTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCTGGGCCTGGGGGCAGCCGCTCCCACACAGGATGAACCCAGCACCCCGAGGATGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAGGATATGGGACCCCCGATACAGGCACAGACCTCAGCTCCATTCAGGACTGCCACGTCCTGCCCTGGGAGGAACCCCTTTCTCTAGTCCCTGCAGGCCAGGAGGCAGCTGACTCCTGACTTGGACGCCTATTCCAGACACCAGACAGAGGGGCAGGCCCCCCAGAACCAGGGATGAGGACGCCCCGTCAAGGCCAGAAAAGACCAAGTTGCGCTGAGCCCAGCAAGGGAAGGTCCCCAAACAAACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGAGCTGCAACTGCAGCAGCAAATGGAGCCGCGACCATAGCAGGTGCTGCCACAGTGACACTCGCCAGGTCAAAAACCCCATCCCAAGTCAGCGGAATGCAGAGAGAGCAGGGAGGACATGTTTAGGATCTGAGGCCGCACCTGACACCCAGGCCAGCAGACGTCTCCTGTCCACGGCACCCTGCCATGTCCTGCATTTCTGGAAGAACAAGGGCAGGCTGAAGGGGGTCCAGGACCAGGAGATGGGTCCGCTCTACCCAGAGAAGGAGCCAGGCAGGACACAAGCCCCCACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTACGTA

TX-DH17613 (서열번호 233)은 D_H1-7 내지 D_H6-13에 대응하는 위치에 삽입된 독소 코딩 서열을 포함한다:

GCGGCCGCTGCCATTTCATTACCTCTTTCTCCGCACCCGACATAGATTACGTAACGCGTGGGCTCGTAGTTTGACGTGCGTGAAGTGTGGGTAAGAAAGTCCCCATTGAGGCTGACCTGCCCAGAGGGTCCTGGGCCCACCCAACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAACGAGCCACAGCCTCCGGAGCCCCTGAAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCACAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAGCTTCGTCAAAAACCGTCTCCTGGCCACAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCACCCCAAACCCATGTTCTGCCGGCTCCCATGACCCCGTGCACCTGGAGCCCCACGGTGTCCCCACTGGATGGGAGGACAAGGGCCGGGGGCTCCGGCGGGTCGGGGCAGGGGCTTGATGGCTTCCTTCTGCCGTGGCCCCATTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGTCAGGGATCAGTGGCACCTCCCAACATCAACCCCACGCAGCCCAGGCACAAACCCCACATCCAGGGCCAACTCCAGGAACAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTCCCGTCCCATCTCTGTCCCTCACTTGGGGCCTGCTGCGGGGCGAGCACTTGGGAGCAAACTCAGGCTTAGGGGACACCACTGTGGGCCTGACCTCGAGCAGGCCACAGACCCTTCCCTCCTGCCCTGGTGCAGCACAGACTTTGGGGTCTGGGCAGGGAGGAACTTCTGGCAGGTCACCAAGCACAGAGCCCCCAGGCTGAGGTGGCCCCAGGGGGAACCCCAGCAGGTGGCCCACTACCCTTCCTCCCAGCTGGACCCCATGTCTTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGGCTCCTCTCCAGACCCCACTGGGCCTCAGTCCCCACTCTAGGAATGCAGCCACCACGGGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCCCACACCCTGGAGGAGAGCAGGGTGCGTCTGGGAGGGGCTGGGCTCCCCACCCCCACCCCCACCTGCACACCCCACCCACCCTTGCCCGGGCCCCCTGCAGGAGGGTCAGAGCCCCCATGGGATATGGACTTAGGGTCTCACTCACGCACCTCCCCTCCTGGGAGAAGGGGTCTCATGCCCAGATCCCCCCAGCAGCGCTGGTCACAGGTAGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCCCCTCAGGCTCCTCTAGCCCTGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCTAGGGCACCGCCCACACTGGGGCCGCCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGCCCGGGACCTGCCTTGCTGCTACGACTTCCTGCCCCAGACCTCGTTGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGACCAACCCCAGACGGGGACCACCTGGCACTCAGGTCACTGCCATTTCCTTCTCCATTCACTTCCAATGCCTCTGTGCTTCCTCCCTCCTCCTTCCTTCGGGGGAGCACCCTGTGCAGCTCCTCCCTGCAGTCCACACCCTGGGGAGACCCGACCCTGCAGCCCACACCCTGGGGAGACCTGACCCTCCTCCAGCCCTTTCTCCCCCGCTGCTCTTGCCACCCACCAAGACAGCCCTGGGGTCCTGTCCCTACAGCCCCCACCCAGTTCTCTACCTAGACCCGTCTTCCTCCCTCTAAACACCTCTCCCAGGCCAACCCTACACCTGCAGGCCCTCCCCTCCACTGCCAAAGACCCTCAGTTTCTCCTGCCTGTGCCCACCCCCGTGCTCCTCCTGCCCACAGCTCGAGCTCTTCCTCTCCTAGGGCCCCTGAGGGATGGCATTGACCGTGCCCTCGCACCCACACACTGCCCATGCCCTCACATTCCTCCTGGCCACTCCAGCCCCACTCCCCTCTCAGGCCTGGCTCTGGTATTTCTGGGACAAAGCCTTACCCAAGTCTTTCCCATGCAGGCCTGGGCCCTTACCCTCACTGCCCGGTTACAGGGCAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCGCCTTGACACACGTCTGCCTGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCGGCACTCCCTCTAAAGACGAGGGATCCAGGCAGCAGCATCACAGGAGAATGCAGGGCTACCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGAAGACGCCCAGTCAACGGAGTCTAACACCAAACCTCCCTGGAGGCCGATGGGTAGTAACGGAGTCATTGCCAGACCTGGAGGCAGGGGAGCAGTGAGCCCGAGCCCACACCATAGGGCCAGAGGACAGCCACTGACATCCCAAGCCACTCACTGGTGGTCCCACAACACCCCATGGAAAGAGGACAGACCCACAGTCCCACCTGGACCAGGGCAGAGACTGCTGAGACCCAGCACCAGAACCAACCAAGAAACACCAGGCAACAGCATCAGAGGGGGCTCTGGCAGAACAGAGGAGGGGAGGTCTCCTTCACCAGCAGGCGCTTCCCTTGACCGAAGACAGGATCCATGCAACTCCCCCAGGACAAAGGAGGAGCCCCTTGTTCAGCACTGGGCTCAGAGTCCTCTCCAAGACACCCAGAGTTTCAGACAAAAACCCCCTGGAATGCACAGTCTCAGCAGGAGAGCCAGCCAGAGCCAGCAAGATGGGGCTCAGTGACACCCGCAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTACTAATCGGAGCAGGCAGGGTGTATGCTATACCCACAGTGACACAGCCCCATTCAAAAACCCCTACTGCAAACGCATTCCACTTCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAATAGGGCTCAGGGGTGTCCATCAATGCCCAAAACGCACCAGACTCCCCTCCATACATCACACCCACCAGCCAGCGAGCAGAGTAAACAGAAAATGAGAAGCAAGCTGGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGTAAGAGGGGATGCGGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCGAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGCGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCGAAAGTTTGCCTTGTGCCCACACTGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGGATTTGCAGCACAGATCTGAATAAATTCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCCTGGCAGGAACTCCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCCTCATGGGCAAAGATGTGCACAACAGGTGTTTCTCATAGCCCCAAACTGAGAGCAAAGCAAACGTCCATCTGAAGGAGAACAGGCAAATAAACGATGGCAGGTTCATGAAATGCAAACCCAGACAGCCACAAGCACAAAAGTACAGGGTTATAAGCGACTCTGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAAAGTAAACTCCAAAAAATACTTTCAATGTGATTTCTTCTAAATAAAATTTACACCCTGCAAAATGAACTGTCTTCTTAAGGGATACATTTCCCAGTTAGAAAACCATAAAGAAAACCAAGAAAAGGATGATCACATAAACACAGTGGTGGTTACTTCTGCTGGGGAAGGAAGAGGGTATGAACTGAGATACACAGGGTGGGCAAGTCTCCTAACAAGAACAGAACGAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATTGCAAGAAGAGGAAAATGCACACAGTTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTCGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATATATTTAGTATATGAGACATCGATGATGTATCCCCAAATAAACGACTTTAAAGAGATAAAGGGCTGATGTGTGGTGGCATTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCTCACTGTGCAGCAGGGCAGGCGGGTACCTGCTGGCAGTTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCCATATATCCCGGAGGACGGCACAGTCAGTGAATTCCAGAGAGAAGCAACTCAGCCACACTCCCCAGGCAGAGCCCGAGAGGGACGCCCACGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCAGCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGACGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACTGGCCTGGGCCTCACTTAACCTGGGCTTCACCTGACCTTGGCCTCACCTGACTTGGACCTCGCCTGTCCCAAGCTTTACCTGACCTGGGCCTCAACTCACCTGAACGTCTCCTGACCTGGGTTTAACCTGTCCTGGAACTCACCTGGCCTTGGCTTCCCCTGACCTGGACCTCATCTGGCCTGGGCTTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCATCTGGCCTGGACCTCACCTGGCCTGGACTTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGGTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTAGAAGTCTCCCACATCTGACCTTTCTGGGTGGAGGCAGCTGGTGGCCCTGGGAATATAAAAATCTCCAGAATGATGACTCTGTGATTTGTGGGCAACTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGGTGGGCACGGACACTATCCACATAAGCGAGGGATAGACCCGAGTGTCCCCACAGCAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCAGAGCCCTGCTGCCTCCTCCGGTCAGCCCTGGACATCCCAGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACGATTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCTATTATAACCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGAAGCTTCCCGCCACAGCCCTCCCCATGGGGCCCTGCTGCCTCCTCAGGTCAGCCCCGGACATCCCGGGTTTCCCCAGGCTGGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACTATGAGAGATGCAATGGCAGACGCGGCTGCAGCAGATGGCGCGATCATAGCAGGTGCTGCTATTATAACCACAGTGTCACAGAGTCCATCAAAAACCCATCCCTGGGAGCCTCCCGCCACAGCCCTCCCTGCAGGGGACCGGTACGTGCCATGTTAGGATTTTGATCGAGGAGACAGCACCATGGGTATGGTGGCTACCACAGCAGTGCAGCCTGTGACCCAAACCCGCAGGGCAGCAGGCACGATGGACAGGCCCGTGACTGACCACGCTGGGCTCCAGCCTGCCAGCCCTGGAGATCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCGAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAGTCCAAATGGGACAGGGACGGCCTCACAGCACCATCTGCTGCCATCAGGCCAGCGATCCCAGAAGCCCCTCCCTCAAGGCTGGGCACATGTGTGGACACTGAGAGCCCTCATATCTGAGTAGGGGCACCAGGAGGGAGGGGCTGGCCCTGTGCACTGTCCCTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACAGAAGACATTCCTGGGGACAGCCGGAGCTGGGCGTCGCTCATCCTGCCCGGCCGTCCTGAGTCCTGCTCATTTCCAGACCTCACCGGGGAAGCCAACAGAGGACTCGCCTCCCACATTCAGAGACAAAGAACCTTCCAGAAATCCCTGCCTCTCTCCCCAGTGGACACCCTCTTCCAGGACAGTCCTCAGTGGCATCACAGCGGCCTGAGATCCCCAGGACGCAGCACCGCTGTCAATAGGGGCCCCAAATGCCTGGACCAGGGCCTGCGTGGGAAAGGCCTCTGGCCACACTCGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCCACAGTGATGAACCCAGTGTCAAAAACCGGCTGGAAACCCAGGGGCTGTGTGCACGCCTCAGCTTGGAGCTCTCCAGGAGCACAAGAGCCGGGCCCAAGGATTTGTGCCCAGACCCTCAGCCTCTAGGGACACCTGGGTCATCTCAGCCTGGGCTGGTGCCCTGCACACCATCTTCCTCCAAATAGGGGCTTCAGAGGGCTCTGAGGTGACCTCACTCATGACCACAGGTGACCTGGCCCTTCCCTGCCAGCTATACCAGACCCTGTCTTGACAGATGCCCCGATTCCAACAGCCAATTCCTGGGACCCTGAATAGCTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAAGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGACAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGAGACACTGTGCATGTCTGGTACCTAAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCTCAGCTGTCTGGGCCCTCCCTGCTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGCGATGTCACACTGTGTACTGCCAGAAGTGGATGTGGACTAGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTAAGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGCGCAGCCCCAGGCATCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGTCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGATTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACGGAGCCACGGAGTCACAGAGCCACGGAGCCCCCATTGTGGGCATTTGAGAGTGCTGTGCCCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGTCCCATCCCACAGCCCGGGTCCCACGGGCAGCGGGCACAGAAGCTGCCAGGTTGTCCTCTATGATCCTCATCCCTCCAGCAGCATCCCCTCCACAGTGGGGAAACTGAGGCTTGGAGCACCACCCGGCCCCCTGGAAATGAGGCTGTGAGCCCAGACAGTGGGCCCAGAGCACTGTGAGTACCCCGGCAGTACCTGGCTGCAGGGATCAGCCAGAGATGCCAAACCCTGAGTGACCAGCCTACAGGAGGATCCGGCCCCACCCAGGCCACTCGATTAATGCTCAACCCCCTGCCCTGGAGACCTCTTCCAGTACCACCAGCAGCTCAGCTTCTCAGGGCCTCATCCCTGCAAGGAAGGTCAAGGGCTGGGCCTGCCAGAAACACAGCACCCTCCCTAGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGTGGACGGGACATATTGCTGGGGCATTTCTCACTGTCACTTCTGGGTGGTAGCTCTGACAAAAACGCAGACCCTGCCAAAATCCCCACTGCCTCCCGCTAGGGGCTGGCCTGGAATCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGCCCTTGCCGGGGTTGAATGCAGGTGCCCAAGGCAGGAAATGGCATGAGCACAGGGATGACCGGGACATGCCCCACCAGAGTGCGCCCCTTCCTGCTCTGCACCCTGCACCCCCCAGGCCAGCCCACGACGTCCAACAACTGGGCCTGGGTGGCAGCCCCACCCAGACAGGACAGACCCAGCACCCTGAGGAGGTCCTGCCAGGGGGAGCTAAGAGCCATGAAGGAGCAAGATATGGGGCCCCCGATACAGGCACAGATGTCAGCTCCATCCAGGACCACCCAGCCCACACCCTGAGAGGAACGTCTGTCTCCAGCCTCTGCAGGTCGGGAGGCAGCTGACCCCTGACTTGGACCCCTATTCCAGACACCAGACAGAGGCGCAGGCCCCCCAGAACCAGGGTTGAGGGACGCCCCGTCAAAGCCAGACAAAACCAAGGGGTGTTGAGCCCAGCAAGGGAAGGCCCCCAAACAGACCAGGAGGATTTTGTAGGTGTCTGTGTCACTGTGTGCAACTGCAGCAGATGGCGCGACCATAGCAGGTGCTGCCACAGTGACACTCACCCAGTCAAAAACCCCATTCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGACTGCACCTGACACCCAGGCCAGCAGACGTCTCCCCTCCAGGGCACCCCACCCTGTCCTGCATTTCTGCAAGATCAGGGGCGGCCTGAGGGGGGGTCTAGGGTGAGGAGATGGGTCCCCTGTACACCAAGGAGGAGTTAGGCAGGTCCCGAGCACTCTTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTACGTAATGCATTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCC

TX-DH114619 (서열번호 234)은 D_H1-14 내지 D_H6-19에 대응하는 위치에 삽입된 독소 코딩 서열을 포함한다:

TACGTATTAATTAAACGACGCCTCGAATGGAACTACTACAACGAATGGTTGCTCTCCCCATTGAGGCTGACCTGCCCAGAGAGTCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCTCGGTCTCTGTGGGTGTTCCGCTAGCTGGGGCTCACAGTGCTCACCCCACACCTAAAATGAGCCACAGCCTCCGGAGCCCCCGCAGGAGACCCCGCCCACAAGCCCAGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCCCGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGATGCTGCAATGGCAGACGCGGCTGCAGCAGCAGATGGTGCCGCGATCATAGCAGGTGCTGCCACAGTGAGAATAGCTACGTCAAAAACCGTCCAGTGGCCACTGCCGGAGGCCCCGCCAGAGAGGGCAGCAGCCACTCTGATCCCATGTCCTGCCGGCTCCCATGACCCCCAGCACGCGGAGCCCCACAGTGTCCCCACTGGATGGGAGGACAAGAGCTGGGGATTCCGGCGGGTCGGGGCAGGGGCTTGATCGCATCCTTCTGCCGTGGCTCCAGTGCCCCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAGAGACAGGCATCACCGGCGCCTCCCAACATCAACCCCAGGCAGCACAGGCACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAATACCCTGGGGGACCCCGACCCTGATGACTTCCCACTGGAATTCGCCGTAGAGTCCACCAGGACCAAAGACCCTGCCTCTGCCTCTGTCCCTCACTCAGGACCTGCTGCCGGGCGAGGCCTTGGGAGCAGACTTGGGCTTAGGGGACACCAGTGTGACCCCGACCTTGACCAGGACGCAGACCTTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCCAGGAGGAACTTCTGGCAGGTCGCCAAGCACAGAGGCCACAGGCTGAGGTGGCCCTGGAAAGACCTCCAGGAGGTGGCCACTCCCCTTCCTCCCAGCTGGACCCCATGTCCTCCCCAAGATAAGGGTGCCATCCAAGGCAGGTGCTCCTTGGAGCCCCATTCAGACTCCTCCCTGGACCCCACTGGGCCTCAGTCCCAGCTCTGGGGATGAAGCCACCACAAGCACACCAGGCAGCCCAGGCCCAGCCACCCTGCAGTGCCCAAGCACACACTCTGGAGCAGAGCAGGGTGCCTCTGGGAGGGGCTGAGCTCCCCACCCCACCCCCACCTGCACACCCCACCCACCCCTGCCCAGCGGCTCTGCAGGAGGGTCAGAGCCCCACATGGGGTATGGACTTAGGGTCTCACTCACGTGGCTCCCATCATGAGTGAAGGGGCCTCAAGCCCAGGTTCCCACAGCAGCGCCTGTCGCAAGTGGAGGCAGAGGCCCGAGGGCCACCCTGACCTGGTCCCTGAGGTTCCTGCAGCCCAGGCTGCCCTGCTGTCCCTGGGAGGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACCGGGTGCAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCCAGGGCCAGAACCTGCCTTCCTGCTACTGCTTCCTGCCCCAGACCTGGGCGCCCTCCCCCGTCCACTTACACACAGGCCAGGAAGCTGTTCCCACACAGAACAACCCCAAACCAGGACCGCCTGGCACTCAGGTGGCTGCCATTTCCTTCTCCATTTGCTCCCAGCGCCTCTGTCCTCCCTGGTTCCTCCTTCGGGGGAACAGCCTGTGCAGCCAGTCCCTGCAGCCCACACCCTGGGGAGACCCAACCCTGCCTGGGGCCCTTCCAACCCTGCTGCTCTTACTGCCCACCCAGAAAACTCTGGGGTCCTGTCCCTGCAGTCCCTACCCTGGTCTCCACCCAGACCCCTGTGTATCACTCCAGACACCCCTCCCAGGCAAACCCTGCACCTGCAGGCCCTGTCCTCTTCTGTCGCTAGAGCCTCAGTTTCTCCCCCCTGTGCCCACACCCTACCTCCTCCTGCCCACAACTCTAACTCTTCTTCTCCTGGAGCCCCTGAGCCATGGCATTGACCCTGCCCTCCCACCACCCACAGCCCATGCCCTCACCTTCCTCCTGGCCACTCCGACCCCGCCCCCTCTCAGGCCAAGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTTCCCAGGCAGGCCTGGGCTCTTGCCCTCACTTCCCGGTTACACGGGAGCCTCCTGTGCACAGAAGCAGGGAGCTCAGCCCTTCCACAGGCAGAAGGCACTGAAAGAAATCGGCCTCCAGCACCTTGACACACGTCCGCCCGTGTCTCTCACTGCCCGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGACAAGGGATCCAGGCAGCAGCATCACGGGAGAATGCAGGGCTCCCAGACATCCCAGTCCTCTCACAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACCAAACAGCCACAGAGGCTGCTGGATAGTAACTGAGTCAATGACCGACCTGGAGGGCAGGGGAGCAGTGAGCCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTGACATCCCGAGCTCCTCAATGGTGGCCCCATAACACACCTAGGAAACATAACACACCCACAGCCCCACCTGGAACAGGGCAGAGACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACCAGGCAACAGTATCAGAGGGGGCTCCCGAGAAAGAGAGGAGGGGAGATCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTATACAGCACTGGGCTCAGAGTCCTCTCTGAGACACCCTGAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAACAGACCAAAGCCAGCAAAAGGGACCTCGGTGACACCAGTAGGGACAGGAGGATTTTGTGGGGGCTCGTGTCACTGTGAGGATATTGTAGTGGTAGCAGCAGATGGGGTAGCTGCTACTCCCACAGTGACACAGACCCATTCAAAAACCCCTACTGCAAACACACCCACTCCTGGGGCTGAGGGGCTGGGGGAGCGTCTGGGAAGTAGGGTCCAGGGGTGTCTATCAATGTCCAAAATGCACCAGACTCCCCGCCAAACACCACCCCACCAGCCAGCGAGCAGGGTAAACAGAAAATGAGAGGCTCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCGGGTGTGCAAGAGGGGATGCAGGCAGAGCCTGAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTGTTCAAGATCAGTGGCTGGGAATGAGCCCAGGAGGGCAGTCTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTCAAAAGTTTGCCTTGTGACCACACTATTGCATCATGGGATGCTTAAGAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAGATGAATTTGCAGCATAGATCTGAATAAACTCTCCAGAATGTGGAGCAGTACAGAAGCAAACACACAGAAAGTGCCTGATGCAAGGACAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCCTTGGCAGGATCTCCCTGCGACAAAGCAGAACCCTCAGGCAATGCCAGCCCCAGAGCCCTCCCTGAGAGCGTCATGGGGAAAGATGTGCAGAACAGCTGATTATCATAGACTCAAACTGAGAACAGAGCAAACGTCCATCTGAAGAACAGTCAAATAAGCAATGGTAGGTTCATGCAATGCAAACCCAGACAGCCAGGGGACAACAGTAGAGGGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCAGGCAAAATGAACTGTCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTACAAGGAAAATTAAGAAAACGATGATCACATAAACACAGTTGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCAAGCAAGCACAGAACGAATACATTACAGTACCTTGAATACAGCAGTTAAACTTCTAAATCGCAAGAACAGGAAAATGCACACAGCTGTGTTTAGAAAATTCTCAGTCCAGCACTATTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAATGATGACACAGGCAATTGCACAATGATACAGACATACATTTAGTACATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCACTCACCTCCCTGGGATCCCCGGACAGGTTGCAGGCACACTGTGTGGCAGGGCAGGCTGGTACATGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAAGCGCAGGGCTGTATACCCCCAAGGATGGCACAGTCAGTGAATTCCAGAGAGAAGCAGCTCAGCCACACTGCCCAGGCAGAGCCCGAGAGGGACGCCCACGTACAGGGAGGCAGAGCCCAGCTCCTCCACAGCCACCACCACCTGTGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCACCTCAGCCTCCCCTGACCTGGACCTCACCTGGTCTGGACCTCACCTGGCCTGGGCCTCACCTGACCTGGACCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCCGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAACCTGAGTAGCACTGAGGCTGCAGAAGCTCATCCAGGGTTGGGGAATGACTCTGGAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCATCTGGTGGCCCTGGGAATATAAAAAGCCCCAGAATGGTGCCTGCGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACATAGGGACAGATGCCAGCCTGAGGTGGAGCCTCAGGACACAGTTGGACGCGGACACTATCCACATAAGCGAGGGACAGACCCGAGTGTTCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGTGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCAGATGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTATGATTACGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCTATCGTTATACCCACAGTGTCACACGGTCCATCAAAAACCCATGCCACAGCCCTCCCCGCAGGGGACCGCCGCGTGCCATGTTACGATTTTGATCGAGGACACAGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACAGGGCAGCAGGCACAATGGACAGGCCTGTGAGTGACCATGCTGGGCTCCAGCCCGCCAGCCCCGGAGACCATGAAACAGATGGCCAAGGTCACCCCACAGTTCAGCCAGACATGGCTCCGTGGGGTCTGCATCGCTGCTGCCCTCTAACACCAGCCCAGATGGGGACAAGGCCAACCCCACATTACCATCTCCTGCTGTCCACCCAGTGGTCCCAGAAGCCCCTCCCTCATGGCTGAGCCACATGTGTGAACCCTGAGAGCACCCCATGTCAGAGTAGGGGCAGCAGAAGGGCGGGGCTGGCCCTGTGCACTGTCCCTGCACCCATGGTCCCTCGCCTGCCTGGCCCTGACACCTGAGCCTCTTCTGAGTCATTTCTAAGATAGAAGACATTCCCGGGGACAGCCGGAGCTGGGCGTCGCTCATCCCGCCCGGCCGTCCTGAGTCCTGCTTGTTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAAAGAACCTTCCAGAAATCCCTGTCTCACTCCCCAGTGGGCACCTTCTTCCAGGACATTCCTCGGTCGCATCACAGCAGGCACCCACATCTGGATCAGGACGGCCCCCAGAACACAAGATGGCCCATGGGGACAGCCCCACAACCCAGGCCTTCCCAGACCCCTAAAAGGCGTCCCACCCCCTGCACCTGCCCCAGGGCTAAAAATCCAGGAGGCTTGACTCCCGCATACCCTCCAGCCAGACATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCGATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGCGTGGGAAAGGCCGCTGGGCACACTCAGGGGGATTTTGTGAAGGCCCCTCCCACTGTGGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCCACAGTGATGAAACTAGCATCAAAAACCGGCCGGACACCCAGGGACCATGCACACTTCTCAGCTTGGAGCTCTCCAGGACCAGAAGAGTCAGGTCTGAGGGTTTGTAGCCAGACCCTCGGCCTCTAGGGACACCCTGGCCATCACAGCGGATGGGCTGGTGCCCCACATGCCATCTGCTCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGCCCCTTCCCCGCCAGCTACACCGAACCCTGTCCCAACAGCTGCCCCAGTTCCAACAGCCAATTCCTGGGGCCCAGAATTGCTGTAGACACCAGCCTCGTTCCAGCACCTCCTGCCAATTGCCTGGATTCACATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCGCACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCCTGGACAGTTCCCCTCACCTGCCACTAGAGAAACACCTGCCATTGTCGTCCCCACCTGGAAAAGACCACTCGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGACTCCCCGAGGGATCTAAGAAGGAGCCATGCGCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACACTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGGCCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACTGTGCATGTCTGGTCCCTGAGCAGCCCCCCACGTCCCCAGTCCTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGTCACACTGTGTACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGAGCTGTGAGGGTATGGTATGCCGGCTGTGGAGTAAGAAGAAGCTCTGGCACAGTGGTGCTGCCCATATCAAAAACCAGGCCAAGTAGACAGGCCCCTGCTGTGCAGCCCCAGGCCTCCACTTCACCTGCTTCTCCTGGGGCTCTCAAGGTCACTGTTGTCTGTACTCTGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTTCTCAACATCCCAGGGCCTCATGTCTGCACGGAAGGCCAATGGATGGGCAACCTCACATGCCGCGGCTAAGATAGGGTGGGCAGCCTGGCGGGGGACAGTACATACTGCTGGGGTGTCTGTCACTGTGCCTAGTGGGGCACTGGCTCCCAAACAACGCAGTCCTCGCCAAAATCCCCACAGCCTCCCCTGCTAGGGGCTGGCCTGATCTCCTGCAGTCCTAGGAGGCTGCTGACCTCCAGAATGTCTCCGTCCCCAGTTCCAGGGCGAGAGCAGATCCCAGGCCGGCTGCAGACTGGGAGGCCACCCCCTCCTTCCCAGGGTTCACTGGAGGTGACCAAGGTAGGAAATGGCCTTAACACAGGGATGACTGCGCCATCCCCCAACAGAGTCAGCCCCCTCCTGCTCTGTACCCCGCACCCCCCAGGCCAGTCCACGAAAACCAGGGCCCCACATCAGAGTCACTGCCTGGCCCGGCCCTGGGGCGGACCCCTCAGCCCCCACCCTGTCTAGAGGACTTGGGGGGACAGGACACAGGCCCTCTCCTTATGGTTCCCCCACCTGCCTCCGGCCGGGACCCTTGGGGTGTGGACAGAAAGGACACCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACCCCATGGGAATCCGGTATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCGGGTGCTCCTCCATCTTCGGTGAGCCTCCCCCTTCACCCACCGTCCCGCCCACCTCCTCTCCACCCTGGCTGCACGTCTTCCACACCATCCTGAGTCCTACCTACACCAGAGCCAGCAAAGCCAGTGCAGACAAAGGCTGGGGTGCAGGGGGGCTGCCAGGGCAGCTTCGGGGAGGGAAGGATGGAGGGAGGGGAGGTCAGTGAAGAGGCCCCCTTCCCCTGGGTCCAGGATCCTCCTCTGGGACCCCCGGATCCCATCCCCTCCTGGCTCTGGGAGGAGAAGCAGGATGGGAGAATCTGTGCGGGACCCTCTCACAGTGGAATATCCCCACAGCGGCTCAGGCCAGACCCAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTCCTGGGCCTGGGTAGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAAGAGCAGGATATGGGGTCCCCGATACAGGCACAGACCTCAGCTCCATCCAGGCCCACCGGGACCCACCATGGGAGGAACACCTGTCTCCGGGTTGTGAGGTAGCTGGCCTCTGTCTCGGACCCCACTCCAGACACCAGACAGAGGGGCAGGCCCCCCAAAACCAGGGTTGAGGGATGATCCGTCAAGGCAGACAAGACCAAGGGGCACTGACCCCAGCAAGGGAAGGCTCCCAAACAGACGAGGAGGATTTTGTAGCTGTCTGTATCACTGTGTGCAACTGCAGCAGATGGGCTCGCGACCATAGCAGGTGCTGCCACAGTGACACTCGCCAGGTCAAAAACCCCGTCCCAAGTCAGCGGAAGCAGAGAGAGCAGGGAGGACACGTTTAGGATCTGAGGCCGCACCTGACACCCAGGGCAGCAGACGTCTCCCCTCCAGGGCACCCTCCACCGTCCTGCGTTTCTTCAAGAATAGGGGCGGCCTGAGGGGGTCCAGGGCCAGGCGATAGGTCCCCTCTACCCCAAGGAGGAGCCAGGCAGGACCCGAGCACCGATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTACGTA

TX-DH120126 (서열번호 235)은 D_H1-20 내지 D_H1-26에 대응하는 위치에 삽입된 독소 코딩 서열을 포함한다:

TACGTAATGCATCTAACGCAGTCATGTAATGCTGGGTGACAGTCAGTTCGCCTCCCCATTGAGGCTGACCTGCCCAGACGGGCCTGGGCCCACCCCACACACCGGGGCGGAATGTGTGCAGGCCCCAGTCTCTGTGGGTGTTCCGCTAGCTGGGGCCCCCAGTGCTCACCCCACACCTAAAGCGAGCCCCAGCCTCCAGAGCCCCCTAAGCATTCCCCGCCCAGCAGCCCAGCCCCTGCCCCCACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGTCGGATTTTGTACAGCCCCGAGTCACTGTGGAGAGAGCTTGCAATGGCAGACGCGGCTGCAGCAGATGGGCTCGCGATCATAGCAGGTGCTGCCACAGTGAGAAAAACTGTGTCAAAAACCGACTCCTGGCAGCAGTCGGAGGCCCCGCCAGAGAGGGGAGCAGCCGGCCTGAACCCATGTCCTGCCGGTTCCCATGACCCCCAGCACCCAGAGCCCCACGGTGTCCCCGTTGGATAATGAGGACAAGGGCTGGGGGCTCCGGTGGTTTGCGGCAGGGACTTGATCACATCCTTCTGCTGTGGCCCCATTGCCTCTGGCTGGAGTTGACCCTTCTGACAAGTGTCCTCAGAAAGACAGGGATCACCGGCACCTCCCAATATCAACCCCAGGCAGCACAGACACAAACCCCACATCCAGAGCCAACTCCAGGAGCAGAGACACCCCAACACTCTGGGGGACCCCAACCGTGATAACTCCCCACTGGAATCCGCCCCAGAGTCTACCAGGACCAAAGGCCCTGCCCTGTCTCTGTCCCTCACTCAGGGCCTCCTGCAGGGCGAGCGCTTGGGAGCAGACTCGGTCTTAGGGGACACCACTGTGGGCCCCAACTTTGATGAGGCCACTGACCCTTCCTTCCTTTCCTGGGGCAGCACAGACTTTGGGGTCTGGGCAGGGAAGAACTACTGGCTGGTGGCCAATCACAGAGCCCCCAGGCCGAGGTGGCCCCAAGAAGGCCCTCAGGAGGTGGCCACTCCACTTCCTCCCAGCTGGACCCCAGGTCCTCCCCAAGATAGGGGTGCCATCCAAGGCAGGTCCTCCATGGAGCCCCCTTCAGACTCCTCCCGGGACCCCACTGGACCTCAGTCCCTGCTCTGGGAATGCAGCCACCACAAGCACACCAGGAAGCCCAGGCCCAGCCACCCTGCAGTGGGCAAGCCCACACTCTGGAGCAGAGCAGGGTGCGTCTGGGAGGGGCTAACCTCCCCACCCCCCACCCCCCATCTGCACACAGCCACCTACCACTGCCCAGACCCTCTGCAGGAGGGCCAAGCCACCATGGGGTATGGACTTAGGGTCTCACTCACGTGCCTCCCCTCCTGGGAGAAGGGGCCTCATGCCCAGATCCCTGCAGCACTAGACACAGCTGGAGGCAGTGGCCCCAGGGCCACCCTGACCTGGCATCTAAGGCTGCTCCAGCCCAGACAGCACTGCCGTTCCTGGGAAGCCTGGGCTCCACCAGACCACAGGTCCAGGGCACAGCCCACAGGAGCCACCCACACACAGCTCACAGGAAGAAGATAAGCTCCAGACCCCAGGGCGGGACCTGCCTTCCTGCCACCACTTACACACAGGCCAGGGAGCTGTTCCCACACAGATCAACCCCAAACCGGGACTGCCTGGCACTAGGGTCACTGCCATTTCCCTCTCCATTCCCTCCCAGTGCCTCTGTGCTCCCTCCTTCTGGGGAACACCCTGTGCAGCCCCTCCCTGCAGCCCACACGCTGGGGAGACCCCACCCTGCCTCGGGCCTTTTCTACCTGCTGCACTTGCCGCCCACCCAAACAACCCTGGGTACGTGACCCTGCAGTCCTCACCCTGATCTGCAACCAGACCCCTGTCCCTCCCTCTAAACACCCCTCCCAGGCCAACTCTGCACCTGCAGGCCCTCCGCTCTTCTGCCACAAGAGCCTCAGGTTTTCCTACCTGTGCCCACCCCCTAACCCCTCCTGCCCACAACTTGAGTTCTTCCTCTCCTGGAGCCCTTGAGCCATGGCACTGACCCTACACTCCCACCCACACACTGCCCATGCCATCACCTTCCTCCTGGACACTCTGACCCCGCTCCCCTCCCTCTCAGACCCGGCCCTGGTATTTCCAGGACAAAGGCTCACCCAAGTCTTCCCCATGCAGGCCCTTGCCCTCACTGCCTGGTTACACGGGAGCCTCCTGTGCGCAGAAGCAGGGAGCTCAGCTCTTCCACAGGCAGAAGGCACTGAAAGAAATCAGCCTCCAGTGCCTTGACACACGTCCGCCTGTGTCTCTCACTGCCTGCACCTGCAGGGAGGCTCCGCACTCCCTCTAAAGATGAGGGATCCAGGCAGCAACATCACGGGAGAATGCAGGGCTCCCAGACAGCCCAGCCCTCTCGCAGGCCTCTCCTGGGAAGAGACCTGCAGCCACCACTGAACAGCCACGGAGGTCGCTGGATAGTAACCGAGTCAGTGACCGACCTGGAGGGCAGGGGAGCAGTGAACCGGAGCCCATACCATAGGGACAGAGACCAGCCGCTAACATCCCGAGCCCCTCACTGGCGGCCCCAGAACACCCCGTGGAAAGAGAACAGACCCACAGTCCCACCTGGAACAGGGCAGACACTGCTGAGCCCCCAGCACCAGCCCCAAGAAACACTAGGCAACAGCATCAGAGGGGGCTCCTGAGAAAGAGAGGAGGGGAGGTCTCCTTCACCATCAAATGCTTCCCTTGACCAAAAACAGGGTCCACGCAACTCCCCCAGGACAAAGGAGGAGCCCCCTGTACAGCACTGGGCTCAGAGTCCTCTCTGAGACAGGCTCAGTTTCAGACAACAACCCGCTGGAATGCACAGTCTCAGCAGGAGAGCCAGGCCAGAGCCAGCAAGAGGAGACTCGGTGACACCAGTCTCCTGTAGGGACAGGAGGATTTTGTGGGGGTTCGTGTCACTGTGAGCATATTGTCGGAGCAGGCAGTGCTATTCCCACAGTGACACAACCCCATTCAAAAACCCCTACTGCAAACGCACCCACTCCTGGGACTGAGGGGCTGGGGGAGCGTCTGGGAAGTATGGCCTAGGGGTGTCCATCAATGCCCAAAATGCACCAGACTCTCCCCAAGACATCACCCCACCAGCCAGTGAGCAGAGTAAACAGAAAATGAGAAGCAGCTGGGAAGCTTGCACAGGCCCCAAGGAAAGAGCTTTGGCAGGTGTGCAAGAGGGGATGTGGGCAGAGCCTCAGCAGGGCCTTTTGCTGTTTCTGCTTTCCTGTGCAGAGAGTTCCATAAACTGGTATTCAAGATCAATGGCTGGGAGTGAGCCCAGGAGGACAGTGTGGGAAGAGCACAGGGAAGGAGGAGCAGCCGCTATCCTACACTGTCATCTTTTGAAAGTTTGCCCTGTGCCCACAATGCTGCATCATGGGATGCTTAACAGCTGATGTAGACACAGCTAAAGAGAGAATCAGTGAAATGGATTTGCAGCACAGATCTGAATAAATCCTCCAGAATGTGGAGCAGCACAGAAGCAAGCACACAGAAAGTGCCTGATGCCAAGGCAAAGTTCAGTGGGCACCTTCAGGCATTGCTGCTGGGCACAGACACTCTGAAAAGCACTGGCAGGAACTGCCTGTGACAAAGCAGAACCCTCAGGCAATGCCAGCCCTAGAGCCCTTCCTGAGAACCTCATGGGCAAAGATGTGCAGAACAGCTGTTTGTCATAGCCCCAAACTATGGGGCTGGACAAAGCAAACGTCCATCTGAAGGAGAACAGACAAATAAACGATGGCAGGTTCATGAAATGCAAACTAGGACAGCCAGAGGACAACAGTAGAGAGCTACAGGCGGCTTTGCGGTTGAGTTCATGACAATGCTGAGTAATTGGAGTAACAGAGGAAAGCCCAAAAAATACTTTTAATGTGATTTCTTCTAAATAAAATTTACACCCGGCAAAATGAACTATCTTCTTAAGGGATAAACTTTCCCCTGGAAAAACTATAAGGAAAATCAAGAAAACGATGATCACATAAACACAGTGGTGGTTACTTCTACTGGGGAAGGAAGAGGGTATGAGCTGAGACACACAGAGTCGGCAAGTCTCCTAACAAGAACAGAACAAATACATTACAGTACCTTGAAAACAGCAGTTAAACTTCTAAATCGCAAGAAGAGGAAAATGCACACACCTGTGTTTAGAAAATTCTCAGTCCAGCACTGTTCATAATAGCAAAGACATTAACCCAGGTTGGATAAATAAGCGATGACACAGGCAATTGCACAATGATACAGACATACATTCAGTATATGAGACATCGATGATGTATCCCCAAAGAAATGACTTTAAAGAGAAAAGGCCTGATGTGTGGTGGCAATCACCTCCCTGGGCATCCCCGGACAGGCTGCAGGCTCACTGTGTGGCAGGGCAGGCAGGCACCTGCTGGCAGCTCCTGGGGCCTGATGTGGAGCAGGCACAGAGCTGTATATCCCCAAGGAAGGTACAGTCAGTGCATTCCAGAGAGAAGCAACTCAGCCACACTCCCTGGCCAGAACCCAAGATGCACACCCATGCACAGGGAGGCAGAGCCCAGCACCTCCGCAGCCACCACCACCTGCGCACGGGCCACCACCTTGCAGGCACAGAGTGGGTGCTGAGAGGAGGGGCAGGGACACCAGGCAGGGTGAGCACCCAGAGAAAACTGCAGAAGCCTCACACATCCCTCACCTGGCCTGGGCTTCACCTGACCTGGACCTCACCTGGCCTCGGGCCTCACCTGCACCTGCTCCAGGTCTTGCTGGAGCCTGAGTAGCACTGAGGCTGTAGGGACTCATCCAGGGTTGGGGAATGACTCTGCAACTCTCCCACATCTGACCTTTCTGGGTGGAGGCACCTGGTGGCCCAGGGAATATAAAAAGCCCCAGAATGATGCCTGTGTGATTTGGGGGCAATTTATGAACCCGAAAGGACATGGCCATGGGGTGGGTAGGGACAGTAGGGACAGATGTCAGCCTGAGGTGAAGCCTCAGGACACAGGTGGGCATGGACAGTGTCCACCTAAGCGAGGGACAGACCCGAGTGTCCCTGCAGTAGACCTGAGAGCGCTGGGCCCACAGCCTCCCCTCGGGGCCCTGCTGCCTCCTCAGGTCAGCCCTGGACATCCCGGGTTTCCCCAGGCCTGGCGGTAGGATTTTGTTGAGGTCTGTGTCACTGTGGTATTACTATGAGAGGCTTGCTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAGCTAAGCCTCACAGATGCTGCTATTACTACCACAGTGTCACAGAGTCCATCAAAAACCCATGCCTGGGAGCCTCCCACCACAGCCCTCCCTGCGGGGGACCGCTGCATGCCGTGTTAGGATTTTGATCGAGGACACGGCGCCATGGGTATGGTGGCTACCACAGCAGTGCAGCCCATGACCCAAACACACGGGGCAGCAGAAACAATGGACAGGCCCACAAGTGACCATGATGGGCTCCAGCCCACCAGCCCCAGAGACCATGAAACAGATGGCCAAGGTCACCCTACAGGTCATCCAGATCTGGCTCCAAGGGGTCTGCATCGCTGCTGCCCTCCCAACGCCAAACCAGATGGAGACAGGGCCGGCCCCATAGCACCATCTGCTGCCGTCCACCCAGCAGTCCCGGAAGCCCCTCCCTGAACGCTGGGCCACGTGTGTGAACCCTGCGAGCCCCCCATGTCAGAGTAGGGGCAGCAGGAGGGCGGGGCTGGCCCTGTGCACTGTCACTGCCCCTGTGGTCCCTGGCCTGCCTGGCCCTGACACCTGAGCCTCTCCTGGGTCATTTCCAAGACATTCCCAGGGACAGCCGGAGCTGGGAGTCGCTCATCCTGCCTGGCTGTCCTGAGTCCTGCTCATTTCCAGACCTCACCAGGGAAGCCAACAGAGGACTCACCTCACACAGTCAGAGACAACGAACCTTCCAGAAATCCCTGTTTCTCTCCCCAGTGAGAGAAACCCTCTTCCAGGGTTTCTCTTCTCTCCCACCCTCTTCCAGGACAGTCCTCAGCAGCATCACAGCGGGAACGCACATCTGGATCAGGACGGCCCCCAGAACACGCGATGGCCCATGGGGACAGCCCAGCCCTTCCCAGACCCCTAAAAGGTATCCCCACCTTGCACCTGCCCCAGGGCTCAAACTCCAGGAGGCCTGACTCCTGCACACCCTCCTGCCAGATATCACCTCAGCCCCCTCCTGGAGGGGACAGGAGCCCGGGAGGGTGAGTCAGACCCACCTGCCCTCAATGGCAGGCGGGGAAGATTCAGAAAGGCCTGAGATCCCCAGGACGCAGCACCACTGTCAATGGGGGCCCCAGACGCCTGGACCAGGGCCTGTGTGGGAAAGGCCTCTGGCCACACTCAGGGGGATTTTGTGAAGGGCCCTCCCACTGTGGAGAGGCTTTGCTGTGGCTTCCCTAAGAGCTGCCGCAGCAGGCAATGCAAGCCTCACAGATGCTGCCACAGTGATGAAACCAGCATCAAAAACCGACCGGACTCGCAGGGTTTATGCACACTTCTCGGCTCGGAGCTCTCCAGGAGCACAAGAGCCAGGCCCGAGGGTTTGTGCCCAGACCCTCGGCCTCTAGGGACACCCGGGCCATCTTAGCCGATGGGCTGATGCCCTGCACACCGTGTGCTGCCAAACAGGGGCTTCAGAGGGCTCTGAGGTGACTTCACTCATGACCACAGGTGCCCTGGTCCCTTCACTGCCAGCTGCACCAGACCCTGTTCCGAGAGATGCCCCAGTTCCAAAAGCCAATTCCTGGGGCCGGGAATTACTGTAGACACCAGCCTCATTCCAGTACCTCCTGCCAATTGCCTGGATTCCCATCCTGGCTGGAATCAAGAGGGCAGCATCCGCCAGGCTCCCAACAGGCAGGACTCCCACACACCCTCCTCTGAGAGGCCGCTGTGTTCCGCAGGGCCAGGCCGCAGACAGTTCCCCTCACCTGCCCATGTAGAAACACCTGCCATTGTCGTCCCCACCTGGCAAAGACCACTTGTGGAGCCCCCAGCCCCAGGTACAGCTGTAGAGAGAGTCCTCGAGGCCCCTAAGAAGGAGCCATGCCCAGTTCTGCCGGGACCCTCGGCCAGGCCGACAGGAGTGGACGCTGGAGCTGGGCCCACACTGGGCCACATAGGAGCTCACCAGTGAGGGCAGGAGAGCACATGCCGGGGAGCACCCAGCCTCCTGCTGACCAGAGACCCGTCCCAGAGCCCAGGAGGCTGCAGAGGCCTCTCCAGGGGGACACAGTGCATGTCTGGTCCCTGAGCAGCCCCCAGGCTCTCTAGCACTGGGGGCCCCTGGCACAGCTGTCTGGACCCTCCCTGTTCCCTGGGAAGCTCCTCCTGACAGCCCCGCCTCCAGTTCCAGGTGTGGATTTTGTCAGGGGGTGCCACACTGTGTACTGCCAGAAGTGGATGTGGACTTGCGATAGTGAGAGGAAGTGCTGTGAGGGTATGGTATGCCGGCTGTGGTGTAAGAAGAAGCTCTGGCACAGTGGTGCCGCCCATATCAAAAACCAGGCCAAGTAGACAGACCCCTGCCACGCAGCCCCAGGCCTCCAGCTCACCTGCTTCTCCTGGGGCTCTCAAGGCTGCTGTCTGCCCTCTGGCCCTCTGTGGGGAGGGTTCCCTCAGTGGGAGGTCTGTGCTCCAGGGCAGGGATGACTGAGATAGAAATCAAAGGCTGGCAGGGAAAGGCAGCTTCCCGCCCTGAGAGGTGCAGGCAGCACCACAGAGCCATGGAGTCACAGAGCCACGGAGCCCCCAGTGTGGGCGTGTGAGGGTGCTGGGCTCCCGGCAGGCCCAGCCCTGATGGGGAAGCCTGCCCCGTCCCACAGCCCAGGTCCCCAGGGGCAGCAGGCACAGAAGCTGCCAAGCTGTGCTCTACGATCCTCATCCCTCCAGCAGCATCCACTCCACAGTGGGGAAACTGAGCCTTGGAGAACCACCCAGCCCCCTGGAAACAAGGCGGGGAGCCCAGACAGTGGGCCCAGAGCACTGTGTGTATCCTGGCACTAGGTGCAGGGACCACCCGGAGATCCCCATCACTGAGTGGCCAGCCTGCAGAAGGACCCAACCCCAACCAGGCCGCTTGATTAAGCTCCATCCCCCTGTCCTGGGAACCTCTTCCCAGCGCCACCAACAGCTCGGCTTCCCAGGCCCTCATCCCTCCAAGGAAGGCCAAAGGCTGGGCCTGCCAGGGGCACAGTACCCTCCCTTGCCCTGGCTAAGACAGGGTGGGCAGACGGCTGCAGATAGGACATATTGCTGGGGCATCTTGCTCTGTGACTACTGGGTACTGGCTCTCAACGCAGACCCTACCAAAATCCCCACTGCCTCCCCTGCTAGGGGCTGGCCTGGTCTCCTCCTGCTGTCCTAGGAGGCTGCTGACCTCCAGGATGGCTTCTGTCCCCAGTTCTAGGGCCAGAGCAGATCCCAGGCAGGCTGTAGGCTGGGAGGCCACCCCTGTCCTTGCCGAGGTTCAGTGCAGGCACCCAGGACAGGAAATGGCCTGAACACAGGGATGACTGTGCCATGCCCTACCTAAGTCCGCCCCTTTCTACTCTGCAACCCCCACTCCCCAGGTCAGCCCATGACGACCAACAACCCAACACCAGAGTCACTGCCTGGCCCTGCCCTGGGGAGGACCCCTCAGCCCCCACCCTGTCTAGAGGAGTTGGGGGGACAGGACACAGGCTCTCTCCTTATGGTTCCCCCACCTGGCTCCTGCCGGGACCCTTGGGGTGTGGACAGAAAGGACGCCTGCCTAATTGGCCCCCAGGAACCCAGAACTTCTCTCCAGGGACCCCAGCCCGAGCACCCCCTTACCCAGGACCCAGCCCTGCCCCTCCTCCCCTCTGCTCTCCTCTCATCACTCCATGGGAATCCAGAATCCCCAGGAAGCCATCAGGAAGGGCTGAAGGAGGAAGCGGGGCCGCTGCACCACCGGGCAGGAGGCTCCGTCTTCGTGAACCCAGGGAAGTGCCAGCCTCCTAGAGGGTATGGTCCACCCTGCCTGGGGCTCCCACCGTGGCAGGCTGCGGGGAAGGACCAGGGACGGTGTGGGGGAGGGCTCAGGGCCCTGCAGGTGCTCCATCTTGGATGAGCCCATCCCTCTCACCCACCGACCCGCCCACCTCCTCTCCACCCTGGCCACACGTCGTCCACACCATCCTGAGTCCCACCTACACCAGAGCCAGCAGAGCCAGTGCAGACAGAGGCTGGGGTGCAGGGGGGCCGCCAGGGCAGCTTTGGGGAGGGAGGAATGGAGGAAGGGGAGGTCAGTGAAGAGGCCCCCCTCCCCTGGGTCTAGGATCCACCTTTGGGACCCCCGGATCCCATCCCCTCCAGGCTCTGGGAGGAGAAGCAGGATGGGAGATTCTGTGCAGGACCCTCTCACAGTGGAATACCTCCACAGCGGCTCAGGCCAGATACAAAAGCCCCTCAGTGAGCCCTCCACTGCAGTGCAGGGCCTGGGGGCAGCCCCTCCCACAGAGGACAGACCCAGCACCCCGAAGAAGTCCTGCCAGGGGGAGCTCAGAGCCATGAAGGAGCAAGATATGGGGACCCCAATACTGGCACAGACCTCAGCTCCATCCAGGCCCACCAGGACCCACCATGGGTGGAACACCTGTCTCCGGCCCCTGCTGGCTGTGAGGCAGCTGGCCTCTGTCTCGGACCCCCATTCCAGACACCAGACAGAGGGACAGGCCCCCCAGAACCAGTGTTGAGGGACACCCCTGTCCAGGGCAGCCAAGTCCAAGAGGCGCGCTGAGCCCAGCAAGGGAAGGCCCCCAAACAAACCAGGAGGTTTCTGAAGCTGTCTGTGTCACAGTCTGCTGCAACTGCAGCAGCAAATGGTGCCGCGACCATAGCAGGTGCTGCCACAATGACACTGGGCAGGACAGAAACCCCATCCCAAGTCAGCCGAAGGCAGAGAGAGCAGGCAGGACACATTTAGGATCTGAGGCCACACCTGACACTCAAGCCAACAGATGTCTCCCCTCCAGGGCGCCCTGCCCTGTTCAGTGTTCCTGAGAAAACAGGGGCAGCCTGAGGGGATCCAGGGCCAGGAGATGGGTCCCCTCTACCCCGAGGAGGAGCCAGGCGGGAATCCCAGCCCCCTCCCCATTGAGGCCATCCTGCCCAGAGGGGCCCGGACCCACCCCACACACCCAGGCAGAATGTGTGCAGGCCTCAGGCTCTGTGGGTGCCGCTAGCTGGGGCTGCCAGTCCTCACCCCACACCTAAGGTGAGCCACAGCCGCCAGAGCCTCCACAGGAGACCCCACCCAGCAGCCCAGCCCCTACCCAGGAGGCCCCAGAGCTCAGGGCGCCTGGGTGGATTTTGTACAGCCCCGAGTCACTGTGGGTATAGTGGGGAGAGGCTTTGTGGCTTCCCTAAGAGCTGCAGCAGGCAAAAGCCTCACAGATGCTGCAGCTACTACCACAGTGAGAAAAGCTATGTCAAAAACCGTCTCCCGGCCACTGCTGGAGGCCCAGCCAGAGAAGGGACCAGCCGCCCGAACATACGACCTTCCCAGACCTCATGACCCCCAGCACTTGGAGCTCCACAGTGTCCCCATTGGATGGTGAGGATGGGGGCCGGGGCCATCTGCACCTCCCAACATCACCCCCAGGCAGCACAGGCACAAACCCCAAATCCAGAGCCGACACCAGGAACACAGACACCCCAATACCCTGGGGGACCCTGGCCCTGGTGACTTCCCACTGGGATCCACCCCCGTGTCCACCTGGATCAAAGACCCCACCGCTGTCTCTGTCCCTCACTCAGGGCCTGCTGAGGGGCGGGTGCTTTGGAGCAGACTCAGGTTTAGGGGCCACCATTGTGGGGCCCAACCTCGACCAGGACACAGATTTTTCTTTCCTGCCCTGGGGCAACACAGACTTTGGGGTCTGTGCAGGGAGGACCTTCTGGAAAGTCACCAAGCACAGAGCCCTGACTGAGGTGGTCTCAGGAAGACCCCCAGGAGGGGGCTTGTGCCCCTTCCTCTCATGTGGACCCCATGCCCCCCAAGATAGGGGCATCATGCAGGGCAGGTCCTCCATGCAGCCACCACTAGGCAACTCCCTGGCGCCGGTCCCCACTGCGCCTCCATCCCGGCTCTGGGGATGCAGCCACCATGGCCACACCAGGCAGCCCGGGTCCAGCAACCCTGCAGTGCCCAAGCCCTTGGCAGGATTCCCAGAGGCTGGAGCCCACCCCTCCTCATCCCCCCACACCTGCACACACACACCTACCCCCTGCCCAGTCCCCCTCCAGGAGGGTTGGAGCCGCCCATAGGGTGGGGGCTCCAGGTCTCACTCACTCGCTTCCCTTCCTGGGCAAAGGAGCCTCGTGCCCCGGTCCCCCCTGACGGCGCTGGGCACAGGTGTGGGTACTGGGCCCCAGGGCTCCTCCAGCCCCAGCTGCCCTGCTCTCCCTGGGAGGCCTGGGCACCACCAGACCACCAGTCCAGGGCACAGCCCCAGGGAGCCGCCCACTGCCAGCTCACAGGAAGAAGATAAGCTTCAGACCCTCAGGGCCGGGAGCTGCCTTCCTGCCACCCCTTCCTGCCCCAGACCTCCATGCCCTCCCCCAACCACTTACACACAAGCCAGGGAGCTGTTTCCACACAGTTCAACCCCAAACCAGGACGGCCTGGCACTCGGGTCACTGCCATTTCTGTCTGCATTCGCTCCCAGCGCCCCTGTGTTCCCTCCCTCCTCCCTCCTTCCTTTCTTCCTGCATTGGGTTCATGCCGCAGAGTGCCAGGTGCAGGTCAGCCCTGAGCTTGGGGTCACCTCCTCACTGAAGGCAGCCTCAGGGTGCCCAGGGGCAGGCAGGGTGGGGGTGAGGCTTCCAGCTCCAACCGCTTCGCTACCTTAGGACCGTTATAGTTAGGCGCGCCGTCGACCAATTCTCATGTTTGACAGCTTATCATCGAATTTCTACGTA

DNA 구조체

통상적으로, 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분 (예, ACKR2 폴리펩티드의 세포외 부분 또는 독소 펩티드의 부분)을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열을 함유하는 폴리뉴클레오티드 분자는 적합한 숙주 세포에서 상기 폴리뉴클레오티드 분자를 복제하기 위해 벡터, 바람직하게는 DNA 벡터 내로 삽입된다.

그들의 크기로 인해, 하나 이상의 뉴클레오티드 코딩 서열은 상업적 공급자로부터 입수 가능한 cDNA 공급원으로부터 직접 클로닝되거나 GenBank로부터 이용 가능한 공개된 서열에 기초하여 인 실리코(in silico) 설계될 수 있다. 대안적으로, 박테리아 인공 염색체(BAC) 라이브러리에 의해 관심 유전자(예, 이종 ACKR2 유전자 또는 독소 암호화 서열)로부터 이종 뉴클레오티드 코딩 서열이 제공될 수 있다. BAC 라이브러리에는 100~150 kb의 평균 삽입체 크기가 포함되며, 300 kb 크기의 삽입체가 수용될 수 있다(Shizuya, 외, 1992, Proc. Natl. Acad. Sci., USA 89:8794-8797; Swiatek, 외, 1993, Genes and Development 7:2071-2084; Kim, 외, 1996, Genomics 34 213-218; 참조로서 본원에 통합됨). 예를 들어, 인간 및 마우스 유전자 BAC 라이브러리가 구축되었고 상업적으로 이용 가능하다(예: Invitrogen, Carlsbad Calif.) 게놈 BAC 라이브러리 또한 이종 코딩 서열뿐만 아니라 전사 조절 영역의 공급원의 역할을 할 수 있다.

대안적으로, 이종 뉴클레오티드 코딩 서열은 효모 인공 염색체(YAC)로부터 단리되고, 클로닝되고/되거나 전이될 수 있다. 전체 이종 유전자 또는 유전자좌가 하나 또는 여러 개의 YAC 내에 클로닝되어 포함될 수 있다. 다수의 YAC가 사용되고 중첩된 상동성의 영역을 포함하는 경우, 이들은 효모 숙주 계통 내에서 재조합되어 전체 유전자좌를 나타내는 단일 구조체를 생성할 수 있다. 당 업계에 공지된 방법 및/또는 본원에 설명된 방법에 의해 구조체를 배아 줄기 세포 또는 배아에 도입하는 것을 돕기 위해, 레트로피팅(retrofitting)에 의해 포유류 선택 카세트로 YAC 아암을 추가로 변형시킬 수 있다.

상술한 바와 같이, 면역글로불린 중쇄 좌위의 조작된 D_H 영역을 구축하는 데 사용하기 위한 예시적인 DNA 및 아미노산 서열들이 표 3과 표 4에 각각 제공되어 있다. 다른 이종 뉴클레오티드 코딩 서열은 GenBank 데이터베이스나 당업계에 공지된 기타 서열 데이터베이스에서도 발견될 수 있다. 예를 들어, 인간 ACKR2의 mRNA 및 아미노산 서열은 GenBank 수탁 번호 NM_001296.4 및 NP_001287.2에서 각각 발견될 수 있으며, 이들은 본원에 참고로 인용된다. 또한, 예를 들어, α-코노독소의 DNA 및 아미노산 서열은 각각 GenBank 수탁 번호 JX177132.1 및 AFR68318.1에서; δ-코노독소의 경우 각각 GenBank 수탁 번호 KR013220.1 및 AKD43185.1에서; κ-코노독소의 경우 각각 GenBank 수탁 번호 DQ311073.1 및 ABD33865.1에서; μ-코노독소의 경우 각각 GenBank 수탁 번호 AY207469.1 및 AAO48588.1에서; 그리고/또는 ω-코노독소의 경우 각각 GenBank 수탁 번호 M84612.1 및 AAA81590.1에서 발견될 수 있으며; 이들은 모두 본원에 참고로 인용된다. 또한, 예를 들어, 독거미 Grammostola Spatulata로부터의 독소의 서열은 GenBank 수탁 번호 1TYK_A 및 1LUP_A에서, SGTX-I의 경우 GenBank 수탁 번호 1LA4_A에서 발견될 수 있으며, Huwentoxin-IV (HWTX-IV)의 경우 GenBank 수탁 번호 P83303.2에서 발견될 수 있으며, Protoxin-I (ProTxI)의 경우 GenBank 수탁 번호 2M9L_A에서 발견될 수 있으며, Protoxin-2 (ProTxII)의 경우 GenBank 수탁 번호 P83476.1에서 발견될 수 있으며; 이들은 모두 본원에 참고로 인용된다.

본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열을 함유하는 DNA 구조체는, 일부 구현예에서, 유전자이식 비-인간 동물에서 면역글로불린 유전자 분절 (예, V_H 및 J_H)과의 재조합을 위해서 재조합 신호 서열 (RSS, 즉, 5' RSS 및 3' RSS이 측부에 위치함)에 작동가능하게 연결된 인간 ACKR2 폴리펩티드의 세포외 부분을 암호화하는 인간 ACKR2 DNA 서열을 포함한다. 일부 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열을 함유하는 DNA 구조체는 유전자이식 비-인간 동물에서 면역글로불린 유전자 분절 (예, V_H 및 J_H)과의 재조합을 위해서 재조합 신호 서열 (RSS, 즉, 5' RSS 및 3' RSS이 측부에 위치함)에 작동가능하게 연결된 μ-코노독소 및/또는 독거미 독소 펩티드의 부분을 암호화하는 독소 DNA 서열을 포함한다. 재조합 신호 서열은 자연 (예를 들어, 게놈)에서 발견되는 재조합 신호 서열과 동일하거나 실질적으로 동일할 수 있거나 인간의 손에 의해 조작될 수있다 (예를 들어, 최적화됨). 일부 구현예에서, RSS는 게놈이 출처이며 자연에서 발견되는 면역 글로불린 중쇄 좌위 (예, 인간 또는 설치류 면역글로불린 중쇄 좌위)에서 발견되는 서열 또는 서열들을 포함하고 있다. 예를 들어, DNA 구조체는, 뉴클레오티드 코딩 서열을 V_H 및/또는 J_H 유전자 분절과 재조합할 수 있는 방식으로 뉴클레오티드 코딩 서열에 작동가능하게 연결된, 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분 (예, 이종 ACKR2 폴리펩티드의 세포외 부분 또는 독소 펩티드의 부분)을 암호화하는 뉴클레오티드 코딩 서열의 5'-측부 및/또는 3'-측부 영역에 위치한 재조합 신호 서열을 포함할 수 있다. 일부 구현예에서, 재조합 신호 서열은 종래의 D_H 유전자 분절과 자연적으로 연관된 서열을 포함한다 (즉, 자연에서 발견되는 RSS). 일부 구현예에서, 재조합 신호 서열은 종래의 D_H 유전자 분절과 자연적으로 연관되지 않은 서열을 포함한다. 일부 구현예에서, 재조합 신호 서열은 V_H 및 J_H 유전자 분절과 재조합하기에 최적화된 서열을 포함한다. 일부 구현예에서, 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분 (예, ACKR2 폴리펩티드의 세포외 부분 또는 독소 펩티드의 부분)을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열에 작동가능하게 연결된 재조합 신호 서열은 서열이 얻어지는 동물에서의 재조합 수준과 유사하거나, 그보다 많거나 적은 수준에서 재조합을 제공한다. 추가의 측부 서열들이 하나 이상의 뉴클레오티드 코딩 서열의 재조합을 최적화하는데 유용하다면, 그러한 서열들은 프로브로서 기존의 서열을 사용하여 클로닝될 수 있다. 비-면역글로불린 폴리펩티드 (예, ACKR2 또는 독소)의 뉴클레오티드 코딩 서열을 함유하는 중쇄 가변 영역의 재조합 및/또는 발현을 최대화하는 데 필요하는 추가적인 서열들은 원하는 결과에 따라 게놈 서열 또는 다른 공급원으로부터 수득할 수 있다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 최적화된 RSS가 5' 및/또는 3'에서 각각 측부에 위치한다. 사용될 수 있는 예시적인 최적화된 RSS가 도 2에 제공되고 실시예 1에 설명되어 있다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 도 2에 나타난 5' RSS와 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는 최적화된 RSS가 5'에서 각각 측부에 위치한다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 도 2에 나타난 5' RSS와 실질적으로 동일하거나 동일한 서열을 갖는 최적화된 RSS가 5'에서 각각 측부에 위치한다.

다양한 구현예에서, 하나 이상의 뉴클레오티드 코딩 서열은 도 2에 나타난 3' RSS와 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는 최적화된 RSS가 3'에서 각각 측부에 위치한다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 도 2에 나타난 5' RSS와 실질적으로 동일하거나 동일한 서열을 갖는 최적화된 RSS가 3'에서 각각 측부에 위치한다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 최적화된 RSS가 5' 및 3'에서 각각 측부에 위치하며, 각각의 5' 및 3' RSS는 도 2에 나타난 5' 및 3' RSS와 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 최적화된 RSS가 5' 및 3'에서 각각 측부에 위치하며, 각각의 5' 및 3' RSS는 도 2에 나타난 5' 및 3' RSS와 실질적으로 동일하거나 동일한 서열을 갖는다.

다양한 구현예에서, 본원에 설명된 하나 이상의 뉴클레오티드 코딩 서열은 도 2에서 선택되는 5' 및 3' RSS가 각각 측부에 위치한다.

DNA 구조체는 당업계에 공지된 방법을 사용해 제작될 수 있다. 예를 들어, DNA 구조체는 더 큰 플라스미드의 일부로서 제작될 수 있다. 이러한 제작을 통해 당업계에 공지된 바와 같은 효율적인 방식으로 정확한 구조체의 클로닝 및 선택이 가능하다. 본원에 설명된 바와 같은 하나 이상의 뉴클레오티드 코딩 서열을 함유하는 DNA 단편은, 원하는 동물에 통합되기 위해 남은 플라스미드로부터 쉽게 단리될 수 있도록 플라스미드 상의 편리한 제한 부위(restriction sites) 사이에 위치될 수 있다.

플라스미드의 제작과 숙주 유기체의 형질전환에 사용된 다양한 방법은 당업계에 공지되어 있다. 원핵 세포 및 진핵 세포 모두를위한 다른 적절한 발현 시스템 및 일반적인 재조합 절차는 다음 문헌을 참조: A Laboratory Manual, 제2 판, 편집자 Sambrook, J. 외, Cold Spring Harbor Laboratory Press: 1989.

조작된 D _H 영역을 갖는 비-인간 동물의 생산

비-인간 동물의 게놈에서 면역글로불린 중쇄 가변 영역 내로, 하나 이상의 뉴클레오티드 코딩 서열 (관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분 (예, 비정형 케모카인 수용체, 예컨대 ACKR2의 세포외 부분, 또는 독소 펩티드의 부분)을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열)을 통합시키는 것에 기인한 특정 항원에 대한 직접적 결합에 중쇄 CDR3 다양성을 특징으로 하는 항체를 발현하는 비-인간 동물이 제공된다. 본원에 설명된 적절한 실시예들은 설치류, 특히, 마우스를 포함한다.

하나 이상의 이종 뉴클레오티드 코딩 서열은, 일부 구현예에서, 이종 종 (예, 인간, 거미, 전갈, 달팽이, 독거미, 말미잘 등)의 유전 물질을 포함하고, 여기서 이종 뉴클레오티드 코딩 서열은 이종 종의 유전 물질의 암호화된 부분을 포함하는 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분 (예, ACKR 폴리펩티드의 세포외 부분, 또는 독소 펩티드의 부분)을 각각 암호화한다. 일부 구현예에서, 본원에 설명된 이종 뉴클레오티드 코딩 서열은 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분 (예, 이종 ACKR 폴리펩티드의 세포외 부분, 또는 독소 펩티드의 부분)을 암호화하는 이종 종의 뉴클레오티드 코딩 서열을 포함하며, 관심있는 비-면역글로불린 폴리펩티드의 부분은 면역글로불린 중쇄, 특히 본원에 설명된 비-인간 동물의 B 세포에 의해 발현되는 중쇄 CDR3에서 나타난다. 상기 이종 뉴클레오티드 코딩 서열을 함유하는 비-인간 동물, 비-인간 배아, 및 세포를 제조하기 위한 비-인간 동물, 배아, 세포 및 표적화 구조체도 제공된다.

다양한 구현예에서, 하나 이상의 이종 뉴클레오티드 코딩 서열은 비-인간 동물 게놈 내에서 면역글로불린 중쇄 가변 영역의 D_H 영역 내로 삽입된다. 일부 구현예에서, 면역글로불린 중쇄 가변 영역의 D_H 영역 (또는 그의 부분)은 결실되지 않는다 (즉, 온전하다). 일부 구현예에서, 면역글로불린 중쇄 가변 영역의 D_H 영역 (또는 그의 부분)은 변경, 방해, 결실 또는 하나 이상의 이종 뉴클레오티드 코딩 서열 (예, 하나 이상의 이종 ACKR2 또는 하나 이상의 이종 독소 뉴클레오티드 코딩 서열)로 대체된다. 일부 구현예에서, 모든 또는 실질적으로 모든 D_H 영역은 하나 이상의 이종 독소 뉴클레오티드 코딩 서열로 대체되며; 일부 특정 구현예에서, 하나 또는 이상의 종래의 D_H 유전자 분절은 면역글로불린 중쇄 가변 영역의 D_H 영역에서 결실되거나 대체되지 않는다. 일부 구현예에서, 본원에 설명된 D_H 영역은 합성 D_H 영역이며, 합성 D_H 영역은 본원에 설명된 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함한다. 일부 구현예에서, D_H 영역은 인간 D_H 영역이다. 일부 구현예에서, D_H 영역은 쥐 D_H 영역이다. 일부 구현예에서, 본원에 설명된 조작된 D_H 영역 (또는 그의 부분)은 면역글로불린 중쇄 가변 영역 내로 삽입되어서 상기 조작된 D_H 영역 (또는 그의 부분)은 하나 이상의 V_H 유전자 분절 및/또는 하나 이상의 J_H 유전자 분절과 작동가능하게 연결된다. 일부 구현예에서, 하나 이상의 이종 뉴클레오티드 코딩 서열은 면역글로불린 중쇄 가변 영역의 2개의 카피 중 하나 내로 삽입됨으로써, 하나 이상의 이종 뉴클레오티드 코딩 서열 (즉, 조작된 D_H 영역)에 대하여 이형접합성인 비-인간 동물을 생산하게 된다. 일부 구현예에서, 하나 이상의 이종 뉴클레오티드 코딩 서열 (즉, 조작된 D_H 영역)에 대하여 동형접합성인 비-인간 동물이 제공된다. 일부 구현예에서, 하나 이상의 이종 뉴클레오티드 코딩 서열 (즉, 조작된 D_H 영역)에 대하여 이형접합성인 비-인간 동물이 제공된다.

일부 구현예에서, 본원에 설명된 비-인간 동물은 그것의 게놈 내에서 하나 이상의 이종 뉴클레오티드 코딩 서열을 함유하는 (예를 들어, 무작위로 통합된) D_H 영역을 포함하는 인간 면역글로불린 중쇄 가변 영역을 함유한다. 따라서, 그러한 비-인간 동물은 조작된 D_H 영역을 함유하는 인간 면역글로불린 중쇄 이식유전자(transgene)를 갖는 것으로 기술될 수 있다. 조작된 D_H 영역은, 예를 들어, PCR, 웨스턴 블랏, 서던 블랏, 제한 단편 길이 다형성(RFLP), 또는 대립형질의 획득 또는 소실 검정을 포함하는 다양한 방법을 사용하여 검출될 수 있다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 본원에 설명된 조작된 D_H 영역에 대하여 이형접합성이다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 본원에 설명된 조작된 D_H 영역에 대하여 동형접합성이다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 본원에 설명된 조작된 D_H 영역에 대하여 반접합성이다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 본원에 설명된 조작된 D_H 영역의 하나 이상의 카피를 함유한다.

일부 구현예에서, 본원에 개시된 하나 이상의 이종 ACKR 뉴클레오티드 코딩 서열은 이종 ACKR2 뉴클레오티드 코딩 서열이다. 일부 구현예에서, 하나 이상의 이종 ACKR2 뉴클레오티드 코딩 서열은 인간이다.

일부 구현예에서, 본원에 설명된 하나 이상의 이종 독소 뉴클레오티드 코딩 서열은 이종 μ-코노독소 뉴클레오티드 코딩 서열, 이종 독거미 독소 뉴클레오티드 코딩 서열 및/또는 이들의 조합이다.

다양한 구현예에서, 본원에 설명된 하나 이상의 이종 뉴클레오티드 코딩 서열은 각각 표 3 또는 표 4에 나타난 하나 이상의 뉴클레오티드 코딩 서열과 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는 하나 이상의 뉴클레오티드 코딩 서열을 포함한다.

다양한 구현예에서, 본원에 설명된 하나 이상의 이종 뉴클레오티드 코딩 서열은 각각 표 3 또는 표 4에 나타난 하나 이상의 뉴클레오티드 코딩 서열과 실질적으로 동일하거나 동일한 서열을 갖는 하나 이상의 뉴클레오티드 코딩 서열을 포함한다.

다양한 구현예에서, 본원에 설명된 하나 이상의 이종 뉴클레오티드 코딩 서열은 표 3 및/또는 표 4에서 선택된다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 표 3 또는 표 4에 나타난 하나 이상의 뉴클레오티드 코딩 서열과 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 표 3 또는 표 4에 나타난 하나 이상의 뉴클레오티드 코딩 서열과 실질적으로 동일하거나 동일한 서열을 갖는 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 표 3에 나타난 5, 10, 15, 20 또는 25개 ACKR2 뉴클레오티드 코딩 서열과 동일한 서열을 갖는 5, 10, 15, 20 또는 25개 이종 ACKR2 뉴클레오티드 코딩 서열을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 표 4에 나타난 5, 10, 15, 20, 25 또는 26개 독소 뉴클레오티드 코딩 서열과 동일한 서열을 갖는 5, 10, 15, 20, 25 또는 26개 이종 독소 뉴클레오티드 코딩 서열을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 5' 재조합 신호 서열 (5' RSS) 및 3' 재조합 신호 서열 (3' RSS)이 각각 측부에 위치하는 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함하며, 5' RSS 및 3' RSS는 각각 도 2에 나타난 5' RSS 및 3' RSS과 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 5' 재조합 신호 서열 (5' RSS) 및 3' 재조합 신호 서열 (3' RSS)이 각각 측부에 위치하는 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함하며, 5' RSS 및 3' RSS는 각각 도 2에 나타난 5' RSS 및 3' RSS과 실질적으로 동일하거나 동일한 서열을 갖는다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 5' 재조합 신호 서열 (5' RSS) 및 3' 재조합 신호 서열 (3' RSS)이 각각 측부에 위치하는 하나 이상의 이종 뉴클레오티드 코딩 서열을 포함하며, 5' RSS 및 3' RSS는 도 2에서 선택된다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 다음을 포함한다

(a) 서열번호 59가 5' 측부에 위치하고 서열번호 60이 3' 측부에 위치하는 서열번호 39;

(b) 서열번호 69가 5' 측부에 위치하고 서열번호 70이 3' 측부에 위치하는 서열번호 7;

(c) 서열번호 77가 5' 측부에 위치하고 서열번호 78이 3' 측부에 위치하는 서열번호 1;

(d) 서열번호 87가 5' 측부에 위치하고 서열번호 88이 3' 측부에 위치하는 서열번호 33;

(e) 서열번호 95가 5' 측부에 위치하고 서열번호 96이 3' 측부에 위치하는 서열번호 3; 및

(f) 서열번호 103가 5' 측부에 위치하고 서열번호 104이 3' 측부에 위치하는 서열번호 5.

(a) 서열번호 61가 5' 측부에 위치하고 서열번호 62이 3' 측부에 위치하는 서열번호 41;

(b) 서열번호 71가 5' 측부에 위치하고 서열번호 72이 3' 측부에 위치하는 서열번호 15;

(c) 서열번호 79가 5' 측부에 위치하고 서열번호 80이 3' 측부에 위치하는 서열번호 37;

(d) 서열번호 81가 5' 측부에 위치하고 서열번호 82이 3' 측부에 위치하는 서열번호 13;

(e) 서열번호 89가 5' 측부에 위치하고 서열번호 90이 3' 측부에 위치하는 서열번호 29;

(f) 서열번호 97가 5' 측부에 위치하고 서열번호 98이 3' 측부에 위치하는 서열번호 11; 및

(g) 서열번호 105가 5' 측부에 위치하고 서열번호 106이 3' 측부에 위치하는 서열번호 9.

(a) 서열번호 63가 5' 측부에 위치하고 서열번호 64이 3' 측부에 위치하는 서열번호 43;

(b) 서열번호 73가 5' 측부에 위치하고 서열번호 74이 3' 측부에 위치하는 서열번호 23;

(c) 서열번호 83가 5' 측부에 위치하고 서열번호 84이 3' 측부에 위치하는 서열번호 17;

(d) 서열번호 91가 5' 측부에 위치하고 서열번호 92이 3' 측부에 위치하는 서열번호 35;

(e) 서열번호 99가 5' 측부에 위치하고 서열번호 100이 3' 측부에 위치하는 서열번호 19; 및

(f) 서열번호 107가 5' 측부에 위치하고 서열번호 108이 3' 측부에 위치하는 서열번호 21.

(a) 서열번호 65가 5' 측부에 위치하고 서열번호 66이 3' 측부에 위치하는 서열번호 45;

(b) 서열번호 75가 5' 측부에 위치하고 서열번호 76이 3' 측부에 위치하는 서열번호 31;

(c) 서열번호 85가 5' 측부에 위치하고 서열번호 86이 3' 측부에 위치하는 서열번호 25;

(d) 서열번호 93가 5' 측부에 위치하고 서열번호 94이 3' 측부에 위치하는 서열번호 49;

(e) 서열번호 101가 5' 측부에 위치하고 서열번호 102이 3' 측부에 위치하는 서열번호 27; 및

(f) 서열번호 67가 5' 측부에 위치하고 서열번호 68이 3' 측부에 위치하는 서열번호 47.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 서열번호 131, 서열번호 132, 서열번호 133, 서열번호 134, 및 이들의 조합으로 이루어진 군으로부터 선택된 DNA 단편과 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는 하나 이상의 DNA 단편을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 서열번호 131, 서열번호 132, 서열번호 133, 서열번호 134, 및 이들의 조합으로 이루어진 군으로부터 선택된 DNA 단편과 실질적으로 동일하거나 동일한 서열을 갖는 하나 이상의 DNA 단편을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 서열번호 131, 서열번호 132, 서열번호 133 및 서열번호 134 중 어느 하나를 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 서열번호 131, 서열번호 132, 서열번호 133 및 서열번호 134를 포함한다. 일부 특정 구현예에서, 본원에 설명된 조작된 D_H 영역은 5'에서 3'로, 서열번호 131, 서열번호 132, 서열번호 133 및 서열번호 134를 포함한다.

(a) 서열번호 59가 5' 측부에 위치하고 서열번호 60이 3' 측부에 위치하는 서열번호 180;

(b) 서열번호 69가 5' 측부에 위치하고 서열번호 70이 3' 측부에 위치하는 서열번호 182;

(c) 서열번호 77가 5' 측부에 위치하고 서열번호 78이 3' 측부에 위치하는 서열번호 184;

(d) 서열번호 87가 5' 측부에 위치하고 서열번호 88이 3' 측부에 위치하는 서열번호 186;

(e) 서열번호 95가 5' 측부에 위치하고 서열번호 96이 3' 측부에 위치하는 서열번호 188; 및

(f) 서열번호 103가 5' 측부에 위치하고 서열번호 104이 3' 측부에 위치하는 서열번호 190.

(a) 서열번호 61가 5' 측부에 위치하고 서열번호 62이 3' 측부에 위치하는 서열번호 192;

(b) 서열번호 71가 5' 측부에 위치하고 서열번호 72이 3' 측부에 위치하는 서열번호 194;

(c) 서열번호 79가 5' 측부에 위치하고 서열번호 80이 3' 측부에 위치하는 서열번호 196;

(d) 서열번호 81가 5' 측부에 위치하고 서열번호 82이 3' 측부에 위치하는 서열번호 198;

(e) 서열번호 89가 5' 측부에 위치하고 서열번호 90이 3' 측부에 위치하는 서열번호 200;

(f) 서열번호 97가 5' 측부에 위치하고 서열번호 98이 3' 측부에 위치하는 서열번호 202; 및

(g) 서열번호 105가 5' 측부에 위치하고 서열번호 106이 3' 측부에 위치하는 서열번호 204.

(a) 서열번호 63가 5' 측부에 위치하고 서열번호 64이 3' 측부에 위치하는 서열번호 206;

(b) 서열번호 73가 5' 측부에 위치하고 서열번호 74이 3' 측부에 위치하는 서열번호 208;

(c) 서열번호 83가 5' 측부에 위치하고 서열번호 84이 3' 측부에 위치하는 서열번호 210;

(d) 서열번호 91가 5' 측부에 위치하고 서열번호 92이 3' 측부에 위치하는 서열번호 212;

(e) 서열번호 99가 5' 측부에 위치하고 서열번호 100이 3' 측부에 위치하는 서열번호 214; 및

(f) 서열번호 107가 5' 측부에 위치하고 서열번호 108이 3' 측부에 위치하는 서열번호 216.

(a) 서열번호 65가 5' 측부에 위치하고 서열번호 66이 3' 측부에 위치하는 서열번호 218;

(b) 서열번호 75가 5' 측부에 위치하고 서열번호 76이 3' 측부에 위치하는 서열번호 220;

(c) 서열번호 85가 5' 측부에 위치하고 서열번호 86이 3' 측부에 위치하는 서열번호 222;

(d) 서열번호 93가 5' 측부에 위치하고 서열번호 94이 3' 측부에 위치하는 서열번호 224;

(e) 서열번호 101가 5' 측부에 위치하고 서열번호 102이 3' 측부에 위치하는 서열번호 226;

(f) 서열번호 109가 5' 측부에 위치하고 서열번호 110이 3' 측부에 위치하는 서열번호 228; 및

(g) 서열번호 67가 5' 측부에 위치하고 서열번호 68이 3' 측부에 위치하는 서열번호 230.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 서열번호 232, 서열번호 233, 서열번호 234, 서열번호 235, 및 이들의 조합으로 이루어진 군으로부터 선택된 DNA 단편과 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 서열을 갖는 하나 이상의 DNA 단편을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 각각 서열번호 232, 서열번호 233, 서열번호 234, 서열번호 235, 및 이들의 조합으로 이루어진 군으로부터 선택된 DNA 단편과 실질적으로 동일하거나 동일한 서열을 갖는 하나 이상의 DNA 단편을 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 서열번호 232, 서열번호 233, 서열번호 234 및 서열번호 235 중 어느 하나를 포함한다.

다양한 구현예에서, 본원에 설명된 조작된 D_H 영역은 서열번호 232, 서열번호 233, 서열번호 234 및 서열번호 235를 포함한다. 일부 특정 구현예에서, 본원에 설명된 조작된 D_H 영역은 5'에서 3'로, 서열번호 232, 서열번호 233, 서열번호 234 및 서열번호 235를 포함한다.

다양한 구현예에서, 본원에 설명된 비-인간 동물에 의해 생산되는 항체는 표 3 또는 표 4에 나타난 아미노산 서열과 적어도 50% (예, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상) 동일한 아미노산 서열이거나 이를 포함하는 아미노산 서열을 갖는 CDR3을 포함하는 중쇄 가변 영역을 포함한다.

다양한 구현예에서, 본원에 설명된 비-인간 동물에 의해 생산되는 항체는 표 3 또는 표 4에 나타난 아미노산 서열과 실질적으로 동일하거나 동일한 아미노산 서열이거나 이를 포함하는 아미노산 서열을 갖는 CDR3을 포함하는 중쇄 가변 영역을 포함한다.

다양한 구현예에서, 본원에 설명된 비-인간 동물에 의해 생산되는 항체는 표 3 또는 표 4에 나타난 아미노산 서열이거나 이를 포함하는 아미노산 서열의 변이체 (즉, 그의 체세포 돌연변이된 변이체)인 아미노산 서열을 갖는 CDR3을 포함하는 중쇄 가변 영역을 포함한다.

조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 비-인간 동물을 제조하기 위한 조성물 및 방법이 제공되고, 여기서 조작된 D_H 영역은 관심있는 폴리펩티드의 특이적 다형성 형태의 뉴클레오티드 코딩 서열, 관심있는 폴리펩티드의 대립 형질 변이체 (예를 들어, 단일 아미노산 차이) 또는 관심있는 폴리펩티드의 대안적으로 스플라이싱된 아형을 비롯하여, 관심있는 폴리펩티드의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열을 포함하고 있으며, 하나 이상의 비-인간 중쇄 불변 영역 유전자에 작동가능하게 연결된 인간 V_H 및 J_H 유전자 분절을 함유하는 면역글로불린 중쇄 좌위로부터의 그러한 뉴클레오티드 코딩 서열에 의하 암호화되는 아미노산 서열을 갖는 CDR3을 포함하는 중쇄 가변 영역을 포함하는 항체를 발현하는 비-인간 동물을 제조하기 위한 조성물 및 방법을 포함한다. 일부 구현예에서, 내인성 인핸서(들) 및/또는 내인성 조절 서열(들)의 제어 하에 이러한 항체(들)를 발현하는 비-인간 동물을 제조하기 위한 조성물 및 방법이 또한 제공된다. 일부 구현예에서, 이종 인핸서(들) 및/또는 이종 조절 서열(들)의 제어 하에 이러한 항체(들)를 발현하는 비-인간 동물을 제조하기 위한 조성물 및 방법이 또한 제공된다. 방법은 관심있는 폴리펩티드의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열, 또는 관심있는 폴리펩티드의 부분을 각각 암호화하는 복수의 뉴클레오티드 코딩 서열을 각각 함유하는 하나 이상의 DNA 단편을, 비-인간 동물의 게놈에 삽입해서 상기 관심있는 폴리펩티드의 부분을 포함하는 항체가 발현되도록 하는 것을 포함한다.

일부 구현예에서, 방법은 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 6개의 뉴클레오티드 코딩 서열을 포함하는 약 10,050bp의 DNA, 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 7개의 뉴클레오티드 코딩 서열을 포함하는 약 9,768bp의 DNA, 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 6개의 뉴클레오티드 코딩 서열을 포함하는 약 9,788bp의 DNA, 및/또는 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 6개의 뉴클레오티드 코딩 서열을 포함하는 약 11,906bp의 DNA를 삽입하는 것을 포함한다. 함께, 그러한 DNA는 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 25개의 코딩 서열을 포함한다. 일부 구현예에서, 방법은 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 뉴클레오티드 코딩 서열의 각각의 측부에 위치하는 재조합 신호 서열을 더 포함하는 DNA를 삽입하는 것을 포함한다. 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 뉴클레오티드 코딩 서열 및 측부에 위치하는 상술한 재조합 신호 서열을 포함하는 유전 물질이 비-인간 동물의 게놈 내로 삽입됨으로써, 이종 ACKR2 폴리펩티드의 세포외 부분에 대응하는 뉴클레오티드 코딩 서열 및 필요한 재조합 신호 서열을 함유하는 조작된 D_H 영역을 갖는 비-인간 동물을 형성해서 인접한 V_H 및 J_H 유전자 분절과 재조합을 가능하게 할 수 있다.

일부 구현예에서, 방법은 하나 이상의 독소 (예, μ-코노독소 및/또는 독거미 독소)의 부분에 대응하는 6개의 뉴클레오티드 코딩 서열을 포함하는 약 9,812bp의 DNA, 하나 이상의 독소 (예, μ-코노독소 및/또는 독거미 독소)의 부분에 대응하는 7개의 뉴클레오티드 코딩 서열을 포함하는 약 9,512bp의 DNA, 하나 이상의 독소 (예, μ-코노독소 및/또는 독거미 독소)의 부분에 대응하는 6개의 뉴클레오티드 코딩 서열을 포함하는 약 9,691bp의 DNA, 및/또는 하나 이상의 독소 (예, μ-코노독소 및/또는 독거미 독소)의 부분에 대응하는 7개의 뉴클레오티드 코딩 서열을 포함하는 약 11,896bp의 DNA를 삽입하는 것을 포함한다. 함께, 그러한 DNA는 하나 이상의 독소 펩티드(들)의 부분에 대응하는 26개의 코딩 서열을 포함한다. 일부 구현예에서, 방법은 하나 이상의 독소 펩티드(들)의 부분에 대응하는 뉴클레오티드 코딩 서열의 각각의 측부에 위치하는 재조합 신호 서열을 더 포함하는 DNA를 삽입하는 것을 포함한다. 하나 이상의 독소 펩티드(들)의 부분에 대응하는 뉴클레오티드 코딩 서열 및 측부에 위치하는 상술한 재조합 신호 서열을 포함하는 유전 물질이 비-인간 동물의 게놈 내로 삽입됨으로써, 하나 이상의 독소 펩티드(들)의 부분에 대응하는 뉴클레오티드 코딩 서열 및 필요한 재조합 신호 서열을 함유하는 조작된 D_H 영역을 갖는 비-인간 동물을 형성해서 인접한 V_H 및 J_H 유전자 분절과 재조합을 가능하게 할 수 있다.

적절한 경우, 관심있는 이종 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열은 비-인간 동물에서의 발현을 위해 최적화되는 코돈을 포함하도록 변형될 수 있다 (예를 들면, 미국특허 제5,670,356호 및 제5,874,304호 참조). 코돈 최적화된 서열은 합성 서열이고, 바람직하게는 코돈 최적화되지 않은 모 폴리뉴클레오티드에 의해 암호화되는 동일한 폴리펩티드(또는 전장 폴리펩티드와 실질적으로 동일한 활성을 갖는 전장 폴리펩티드의 생물학적으로 활성인 단편)를 암호화한다. 일부 구현예에서, 관심있는 이종 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열은 특정 세포 유형 (예를 들어, 설치류 세포)에 대한 코돈 사용을 최적화하도록 변경된 서열을 포함할 수 있다 예를 들어, 비-인간 동물(예를 들어, 설치류)의 게놈에 삽입할 관심있는 이종 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열의 코돈은 비-인간 동물 의 세포에서의 발현을 위해 최적화될 수 있다. 이러한 서열은 코돈 최적화 서열로 기술될 수 있다.

관심있는 이종 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열을 D_H 영역 내로 삽입함으로써 상기 뉴클레오티드 코딩 서열이 V_H 및 J_H 유전자 분절(예를 들어, 복수의 V_H 및 J_H 유전자 분절)에 작동가능하게 연결되고 게놈의 상대적으로 최소한의 변형을 사용하고, 비-인간 동물에서 관심있는 이종 폴리펩티드의 부분에 대응하는 아미노산 서열을 갖는 CDR3을 특징으로 하는 중쇄를 포함하는 항체의 발현을 초래한다.

유전자이식 비-인간 동물을 생성하는 방법으로서, 넉아웃(knockouts)과 넉인(knock-ins)을 포함하는 방법은 당업계에 잘 알려져 있다(예를 들어, Gene Targeting: A Practical Approach, Joyner, ed., Oxford University Press, Inc. (2000) 참조). 예를 들어, 유전자이식 설치류를 생성하는 것은, 하나 이상의 내인성 설치류 유전자(또는 유전자 분절)의 유전자좌를 방해하고 설치류 게놈 내에 하나 이상의 이종 유전자(또는 유전자 분절 또는 뉴클레오티드 코딩 서열)를 (일부 구현예에서는, 내인성 설치류 유전자(또는 유전자 분절)와 동일한 위치에) 도입하는 것을 선택적으로 포함할 수 있다. 일부 구현예에서, 관심있는 이종 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열은 설치류의 게놈에 무작위로 삽입된 면역글로불린 중쇄 좌위의 D_H 영역 내로 도입된다. 일부 구현예에서, 관심있는 이종 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열은 설치류의 게놈 내의 내인성 면역글로불린 중쇄 좌위의 D_H 영역 내로 도입되고; 일부 특정 구현예에서, 내인성 면역글로불린 중쇄 좌위는, 하나 이상의 불변 영역 유전자 (예, 인간 또는 쥐)에 작동가능하게 연결된 인간 유전자 분절 (예를 들어, V 및/또는 J)을 함유하도록 변경, 변형 또는 조작된다.

조작된 다양성 클러스터 (즉, D_H 영역)을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는, 설치류를 형성하기 위해 설치류 배아 줄기 (ES) 세포 내로 통합하기 위한 표적화 벡터의 구축에 대한 예시적인 전략의 개략도가 (실제 비율 아님)가 제공되어 있는데, 이때 다양성 클러스터가 이종 ACKR2 폴리펩티드의 부분 (예, D6 케모카인 유인 수용체의 세포외 부분)을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열을 포함하고 있는 경우는 도 3a 및 도 3b에 제공되어 있으며, 또는 독소 펩티드의 부분 (예, μ-코노독소 및/또는 독거미 독소 펩티드의 부분)을 각각 암호화하는 경우는 도 7a 및 도 7b에 제공되어 있다. 도시된 바와 같이, 이종 ACKR2 폴리펩티드의 세포외 부분 (도 3a 및 도 3b)을 각각 암호화하는 다양한 수의 뉴클레오티드 코딩 서열 또는 독소 펩티드의 부분 (도 7a 및 도 7b)을 각각 암호화하는 다양한 수의 뉴클레오티드 코딩 서열을 각각 함유하고 있는 DNA 단편들은 부위-특이적 재조합 인식 부위 (예를 들어, loxP)가 측부에 위치하는 선별 카세트(예를 들어, 네오마이신)와 함께 등온 조립체를 이용하여 함께 조립된다. DNA 단편들의 순차적인 연결(ligation)을 이용하는 대안적인 전략은 도 4a 및 4b(ACKR2 뉴클레오티드 코딩 서열 경우) 및 도 8a 및 도 8b (독소 뉴클레오티드 코딩 서열 경우)에 각각 도시하고 있다. DNA 단편들은 뉴클레오티드 코딩 서열의 각각의 측부에 위치하는 (5' 및 3') 재조합 신호 서열을 포함해서 일단 면역글로불린 중쇄 좌위에 통합되면 V_H 및 J_H 유전자 분절과 재조합을 가능하게 한다. 재조합 신호 서열은 게놈 소스로부터 획득될 수 있거나, 대안적으로, 작동 가능하게 연결된 V_H 및 J_H 유전자 분절이 있는 뉴클레오티드 코딩 서열의 효율적인 재조합을 제공하기 위해 본원에 설명된 바와 같이 최적화될 수 있다. 뉴클레오티드 코딩 서열 자체가 최적화됨으로써 항체 서열의 친화도 성숙 중에 체세포 과돌연변이는, 전통적인 D_H 유전자 분절들을 포함하는 면역글로불린 중쇄 좌위를 포함하는 야생형 비-인간 동물 또는 전통적인 인간 D_H 유전자 분절들을 포함하는 인간 면역글로불린 중쇄(및/또는 경쇄) 유전자 좌위에 대한 유전자이식형인 비-인간 동물에서 관찰되는 체세포 과돌연변이의 수준, 그 부근 또는 그 보다 높게 발생하게 될 수도 있다. 일단 조립되면, 조립된 DNA 단편 (즉, 조작된 D_H 영역)은 면역글로불린 중쇄 좌위에 통합하기 위한 표적화 벡터를 생성하기 위해 게놈 중쇄 가변 영역 DNA (예, 인간)을 함유하는 BAC 벡터에 연결된다. 연결은 조작된 D_H 영역이 V_H 게놈 DNA가 5' 측부에, J_H 게놈 DNA 그리고 비-인간 (예를 들면, 설치류) 게놈 중쇄 불변 영역 DNA (예를 들면, 인트론 인핸서 및 IgM 불변 영역 유전자)가 3' 측부에 있도록 수행된다. 비-인간 세포(예를 들면, 설치류 배아 줄기 세포)의 게놈에 통합하기 위한 최종 표적화 벡터는 V_H 게놈 DNA (예를 들어, 하나 이상의 V_H 유전자 분절 함유), 조작된 D_H 영역, 3' J_H 게놈 DNA, 비-인간 (예 : 설치류) 게놈 중쇄 불변 영역 DNA를 함유하고 있으며, 이들 모두는 일단 비-인간 동물의 게놈에 통합되었다면 V_H 유전자 분절들, 조작된 D_H 영역 내의 뉴클레오티드 코딩 서열 및 J_H 유전자 분절 사이의 재조합을 허용하도록 작동가능하게 연결되어 있다.

표적화 벡터가 설치류 (예를 들어, 마우스) 배아 줄기 세포 내로 도입되어서 표적화 벡터에 포함된 서열(즉, 조작된 D_H 영역)은 비-인간 세포 또는 비-인간 동물(예를 들어, 마우스)로 하여금 삽입된 뉴클레오티드 코딩 서열에 의해 암호화되는 아미노산을 갖는 CDR3를 포함하는 항체를 발현하는 능력을 야기한다.

본원에 설명된 바와 같이, 조작된 D_H 영역이 설치류 게놈의 내인성 면역글로불린 중쇄 좌위(예를 들어, 인간 가변 영역 유전자 분절을 포함하도록 조작된 내인성 면역글로불린 중쇄 좌위)에 도입된, 유전자이식 설치류가 생성된다. 면역글로불린은 조작된 D_H 영역의 뉴클레오티드 코딩 서열에 의해 암호화되는 아미노산을 함유하는 CDR3를 갖는, 면역글로불린이 쥐 세포에서 발현된다. 면역글로불린은 또한 쥐 불변 영역을 포함하고, 따라서, 설치류의 면역 체계의 다양한 면역 세포에 필요한 이펙터 기능을 제공한다. 설치류 게놈의 내인성 면역글로불린 중쇄 좌위가 표적화 벡터에 의해 표적화되지 않는 경우, 조작된 D_H 영역은 바람직하게는 내인성 쥐 면역글로불린 중쇄 좌위의 위치 이외의 위치에서 면역글로불린 중쇄 좌위에 삽입된다 (예를 들면, 무작위로 삽입됨). 이 경우, 내인성 쥐 면역글로불린 중쇄 좌위가 결실되거나 그렇지 않으면 비-기능성으로 될 수 있어서 (예를 들어, 표적화된 결실, 삽입, 역전, 등에 의함) 비-인간 동물에 의해 생산된 항체는 삽입된 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 좌위로부터의 유전자 분절 및 서열을 이용하게 된다.

일부 구현예에서, 본원에 설명된 비-인간 동물의 게놈은 하나 이상의 인간 면역글로불린 중쇄 및/또는 경쇄 유전자 (예를 들면, 미국특허 번호 8,502,018; 미국특허 번호 8,642,835; 미국특허 번호 8,697,940; 미국특허 번호 8,791,323; 및 미국특허출원 공개 번호 2013/0096287 A1 참조; 본원에 참조로 인용됨). 대안적으로, 조작된 D_H 영역은 예를 들면, VELOCIMMUNE® 계통 같은 다른 변형 계통의 배아 줄기 세포에 도입될 수 있다 (예를 들면, 미국특허 번호 8,502,018 또는 미국특허 번호 8,642,835 참조; 본원에 참조로 인용됨). 일부 구현예에서, 조작된 D_H 영역은 미국특허 번호 8,697,940 및 미국특허 번호 8,642,835에 설명된 변형 계통의 배아 줄기 세포에 도입될 수 있다; 본원에 참조로 인용됨.

일부 구현예에서, 비-인간 동물의 게놈은 (예를 들면, 이종 교배 또는 다수 표적화 전략을 통해) 미국특허 출원공개 번호 2011-0195454 A1, 2012-0021409 A1, 2012-0192300 A1, 2013-0045492 A1, 2013-0185821 A1, 2013-0198880 A1, 2013-0302836 A1, 2015-0059009 A1; 국제특허 출원공개 번호 WO 2011/097603, WO 2012/148873, WO 2013/134263, WO 2013/184761, WO 2014/160179, WO 2014/160202에 설명된 하나 이상의 인간 면역글로불린 경쇄 유전자 또는 좌위 (예를 들어, 유전자이식, 내인성 등)를 더 포함하며; 이들 모두 본원에 참조로 인용된다.

하나의 재배열된 경쇄, 예를 들어, 재배열된 경쇄 가변 영역을 포함하느 경쇄의 유전자 조작이 설명되어 있다. 예를 들어, 하나의 재배열된 가변 유전자 서열 V_L:J_L을 포함하는 범용 경쇄 마우스 (ULC)의 생성 및 그러한 마우스에서 항원 특이적 항체의 생성이, 예를 들어, 미국특허 출원 번호 13/022,759, 13/093,156, 13/412,936, 13/488,628, 13/798,310, 및 13/948,818 (각각, 공개 번호 2011/0195454, 2012/0021409, 2012/0192300, 2013/0045492, US20130185821, 및 US20130302836 임)에 설명되어 있으며, 이들 각각은 그 전문이 본원에 참조로 인용된다. 미국특허 출원공개 번호 2011/0195454, 2012/0021409, 2012/0192300 및 2013/0045492에 설명된 조작된 공통 경쇄 마우스는 경쇄 옵션, 예를 들어, 두 개 이하의 VL 유전자 분절을 포함한 공통 또는 범용 경쇄 "ULC"의 제한된 레파토리를 암호화하는 핵산 서열 또는 하나의 재배열된 인간 면역글로불린 경쇄 가변 영역 서열을 포함하였다. 이러한 제한된 레파토리를 달성하기 위해, 마우스는 그것이 본래의(native) 마우스 경쇄 가변 도메인을 만들거나, 재배열할 수 있는 능력이 비기능적 또는 실질적으로 비기능적으로 되도록 조작되었다. 일 측면에서, 이는 예를 들어, 마우스의 경쇄 가변 영역 유전자 분절을 결실시켜서 달성될 수 있었다. 이전에 기술된 바와 같이, 내인성 마우스 좌위는 이어서 외인성 가변 영역 유전자 분절이 내인성 마우스 경쇄 불변 영역 유전자와 조합하고 재배열된 역 키메라 경쇄 유전자 (인간 가변, 마우스 불변)를 형성할 수 있는 방식으로, 내인성 마우스 경쇄 불변 도메인에 작동가능하게 연결된, 외인성 적합한 경쇄 가변 영역 유전자 분절, 바람직하게는 인간 경쇄 가변 영역 유전자 분절로 변형될 수 있다. 다양한 구현예에서, 경쇄 가변 영역은 체세포 돌연변이될 수 있다. 다양한 구현예에서, 경쇄 가변 영역이 체세포 돌연변이를 획득할 수 있는 능력을 극대화하기 위해, 적절한 인핸서(들)가 마우스에 보유된다. 일 측면에서, 내인성 마우스 κ 경쇄 유전자 분절을 인간 κ 경쇄 유전자 분절로 대체하기 위해 마우스 κ 경쇄 좌위를 변형함에 있어서, 마우스 κ 인트론 인핸서 및 마우스 κ 3' 인핸서는 기능적으로 유지되거나, 파손되지 않는다.

따라서, 본원에 설명된 유전자 조작된 D_H 영역 (또는 그의 부분)에 의해 암호화된 아미노산을 포함하는 다양한 역 키메라 (인간 가변, 마우스 불변) 중쇄와 연관된 역 키메라 (인간 가변, 마우스 불변) 경쇄의 제한된 레파토리를 발현하는 유전자 조작된 마우스가 제공되었다. 다양한 구현예에서, 내인성 마우스 κ 경쇄 유전자 분절은 결실되고 내인성 마우스 C κ 유전자에 작동가능하게 연결된, 단일 (또는 2개의) 재배열된 인간 경쇄 영역으로 대체된다. 재배열된 인간 경쇄 영역의 체세포 과돌연변이를 극대화하기 위한 구현예에서, 마우스 κ 인트론 인핸서 및 마우스 κ 3' 인핸서가 유지된다. 다양한 구현예에서, 마우스는 또한 비기능적 κ 경쇄 좌위, 또는 그것의 결실 또는 좌위가 κ 경쇄를 만들 수 없는 결실을 포함한다.

따라서, 한 구현예에서, 바람직하게는 인간 경쇄 가변 유전자 분절의 제한된 레파토리로부터, 바람직하게는 인간 경쇄 가변 영역들, 또는 하나의 재배열된 인간 경쇄 가변 영역의 제한된 레파토리를, 그의 게놈에, 예를 들어 그의 생식선에, 포함하는 비-인간 동물 (예를 들어, 설치류, 예를 들어, 마우스 또는 랫트)이 제공되고, 여기서 비-인간 동물은 또한 그의 게놈에, 예를 들어 그의 생식선에, 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하고, 여기서 조작된 D_H 영역은 비-면역글로불린 관심있는 폴리펩티드, 또는 그의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다.

인간 경쇄 가변 영역 유전자 서열의 제한된 레파토리로부터, 인간 경쇄 가변 영역들, 또는 하나의 재배열된 인간 경쇄 가변 영역의 제한된 레파토리를 발현하는 유전자 조작된 동물이 제공된다. 한 구현예에서, 하나의 재배열된 V/J 인간 경쇄 서열은 V1-39Jκ 및 Vκ3-20Jκ, 예를 들어, Vκ1-39Jκ5 및 Vκ3-20Jκ1로부터 선택된다. 일부 구현예에서, 본원에 개시된 비-인간 동물은 하나의 재배열된 V/J 경쇄 서열에 의한 모든 내인성 기능성 V_L 및 모든 내인성 기능성 J_L 유전자 분절의 대체를 포함하는 변형된 경쇄 좌위를 포함하고, 여기서 하나의 재배열된 V/J 경쇄 서열은 내인성 경쇄 불변 영역 유전자에 작동가능하게 연결된다. 일부 구현예에서, 변형된 경쇄 좌위는 비-인간 동물의 생식선 게놈 내에 있다. 한 구현예에서, 비-인간 동물은 경쇄 불변 영역 유전자 서열에 작동가능하게 연결된 하나의 재배열된 경쇄 가변 유전자 서열을 생식선 게놈 내에 포함하고, 여기서 하나의 재배열된 경쇄 가변 영역 유전자 서열은 인간 생식선 V_L 및 인간 생식선 J_L 유전자 분절, 예를 들어, 인간 생식선 Vκ1-39 및 인간 생식선 Jκ5 또는 인간 생식선 Vκ3-20 및 Jκ1을 포함한다. 일부 구현예에서, 본원에 개시된 비-인간 동물은 내인성 경쇄 불변 영역 유전자에 작동가능하게 연결된 하나의 재배열된 V/J 경쇄 서열을 그의 게놈 내에 포함하는, B 세포, 예를 들어 종류 전환(class switching)을 겪지 않는 B 세포를 포함하고, 여기서 하나의 재배열된 V/J 경쇄는 비-인간 동물의 생식선 게놈에서 발견되는 내인성 경쇄 불변 영역 유전자에 작동가능하게 연결된 하나의 재배열된 V/J 경쇄 서열에 비해서 체세포 돌연변이를 포함하지 않는다. 다른 구현예들에서, 본원에 개시된 비-인간 동물은 내인성 경쇄 불변 영역 유전자에 작동가능하게 연결된 하나의 재배열된 V/J 경쇄 서열을 그의 게놈 내에 포함하는, B 세포, 예를 들어 종류 전환을 겪는 B 세포를 포함하고, 여기서 하나의 재배열된 V/J 경쇄는 비-인간 동물의 생식선 게놈에서 발견되는 내인성 경쇄 불변 영역 유전자에 작동가능하게 연결된 하나의 재배열된 V/J 경쇄 서열에 비해서 체세포 돌연변이를 포함한다.

따라서 유전자 변형된 비-인간 동물이, 그 동물을 만들기 위한 방법과 조성물과 함께 제공되며, 여기서 유전자 변형은 조작된 D_H 영역과 하나의 재배열된 경쇄 좌위를 포함하며, 여기서 동물은 유전자 조작된 하나의 재배열된 경쇄, 예를 들어 조작된 공통 경쇄 (ULC)를 추가로 발현하는데, 상기 경쇄는 비-인간 동물의 조직 또는 세포에서 조작된 D_H 영역에 의해 암호화된 아미노산을 함유하는 중쇄와 연관될 수 있다.

유전자이식 파운더(transgenic founder) 비-인간 동물은 그의 게놈 내에 조작된 D_H 영역의 존재 및/또는 비-인간 동물의 조직이나 세포 내에서의 뉴클레오티드 코딩 서열에 의해 암호화된 아미노산을 함유하는 항체의 발현에 기초하여 식별될 수 있다. 이어서, 유전자이식 파운더 비-인간 동물은 조작된 D_H 영역을 가진 추가 비-인간 동물을 교배시켜, 조작된 D_H 영역의 하나 이상의 카피를 각각 갖는 일련의 비-인간 동물을 생성하는데 사용될 수 있다. 또한, 조작된 D_H 영역을 갖는 유전자이식 비-인간 동물은 원하는대로 다른 이식 유전자(예: 인간 면역글로불린 유전자)를 갖는 유전자이식 비-인간 동물과 추가로 교배시킬 수 있다.

유전자이식 비-인간 동물은 이식유전자의 발현을 조절하거나 유도할 수 있는 선택된 시스템을 함유하도록 생산될 수도 있다. 예시적인 시스템은 박테리오파지 P1의 Cre/loxP 재조합 효소 시스템(예를 들어, Lakso, M. 외, 1992, Proc. Natl. Acad. Sci. USA 89:6232-6236 참조) 및 S. 세레비시아(S. cerevisiae)의 FLT/Frt 재조합 효소 시스템(O'Gorman, S. 외, 1991, Science 251:1351-1355)을 포함한다. 이러한 동물은, 예를 들어, 두 마리의 유전자이식 동물, 즉 선택된 변형(예: 조작된 D_H 영역)을 포함하는 이식유전자를 함유하는 하나의 유전자이식 동물과 재조합 효소(예: Cre 재조합 효소)를 암호화하는 이식유전자를 함유하는 다른 하나의 유전자이식 동물의 교배에 의해 "이중" 유전자이식 동물을 구성함으로써 제공될 수 있다.

본원에 설명된 비-인간 동물은, 종종 비-인간 동물의 의도된 용도에 따라 추가적인 인간 또는 인간화 유전자를 포함하도록 전술한 바와 같이 또는 당업계에 공지된 방법을 사용해 제작될 수 있다. 이러한 추가적 인간 또는 인간화 유전자의 유전 물질은 전술한 바와 같이 유전자 변형된 세포(예를 들어, 배아 줄기 세포)의 게놈의 추가적 변경을 통해, 또는 원하는 대로 유전자 변형된 다른 계통을 이용한 당업계에 공지된 번식 기술을 통해 도입될 수 있다. 일부 구현예에서, 본원에 설명된 비-인간 동물은, 유전자이식 인간 면역글로불린 중쇄 및 경쇄 유전자를 추가로 포함하도록 제작된다 (예를 들어, Murphy, A.J. 외, (2014) Proc. Natl. Acad. Sci. U.S.A. 111(14):5153-5158; 미국특허 번호 8,502,018; 미국특허 번호 8,642,835; 미국특허 번호 8,697,940; 미국특허 번호 8,791,323; 및 미국특허 출원공개 번호 2013/0096287 A1 참조; 본원에 참조로 인용된다). 일부 구현예에서, 본원에 설명된 비-인간 동물은, 미국특허 출원공개 번호 2011-0195454 A1, 2012-0021409 A1, 2012-0192300 A1, 2013-0045492 A1, 2013-0185821 A1, 2013-0198880 A1, 2013-0302836 A1, 2015-0059009 A1; 국제특허 출원공개 번호 WO 2011/097603, WO 2012/148873, WO 2013/134263, WO 2013/184761, WO 2014/160179, WO 2014/160202 (이들 모두 본원에 참조로 인용된다)에 설명된 바와 같은 하나 이상의 인간 면역글로불린 경쇄 유전자 또는 좌위 (예를 들어, 유전자이식, 내인성, 등)를 추가로 포함하도록 제작된다.

일부 구현예에서, 본원에 설명된 비-인간 동물은, 본원에 설명된 바와 같은 표적화 벡터를 변형 계통으로부터의 세포에 도입하여 제작될 수 있다. 한 가지 예를 들자면, 상술한 바와 같은, 표적화 벡터가 벨로크이뮨(VELOCIMMUNE)® 마우스에 도입될 수 있다. VELOCIMMUNE® 마우스는 완전한 인간 가변 영역과 마우스 불변 영역을 갖는 항체를 발현한다. 일부 구현예에서, 본원에 설명된 비-인간 동물은, 인간 면역글로불린 유전자 (가변 및/또는 불변 영역 유전자)를 추가로 포함하도록 제작된다. 일부 구현예에서, 본원에 설명된 비-인간 동물은, 본원에 설명된 바와 같은, 조작된 D_H 영역, 및 이종 종 (예, 인간) 유래의 유전 물질을 포함하고, 여기서 유전 물질은 전체적으로 또는 부분적으로, 하나 이상의 인간 중쇄 및/또는 경쇄 가변 영역을 암호화한다.

예를 들어, 본원에 설명된 바와 같은, 조작된 D_H 영역을 포함하는 비-인간 동물은, (예를 들어, 이종 교배 또는 다수 표적화 전략을 통해) Murphy, A.J. 외, (2014) Proc. Natl. Acad. Sci. U.S.A. 111(14):5153-5158; 미국특허 번호 8,502,018; 미국특허 번호 8,642,835; 미국특허 번호 8,697,940; 미국특허 번호 8,791,323; 미국특허 출원공개 번호 2011-0195454 A1, 2012-0021409 A1, 2012-0192300 A1, 2013-0045492 A1, 2013-0096287 A1, 2013-0185821 A1, 2013-0198880 A1, 2013-0302836 A1, 2015-0059009 A1; 국제특허 출원공개 번호 WO 2011/097603, WO 2012/148873, WO 2013/134263, WO 2013/184761, WO 2014/160179 또는 WO 2014/160202; (이들 모두 본원에 참조로 인용된다)에 설명된 바와 같은 하나 이상의 변형을 추가로 포함할 수 있다. 일부 구현예에서, 본원에 설명된 바와 같은, 조작된 D_H 영역을 포함하는 설치류는 인간화 면역글로불린 중쇄 및/또는 경쇄 가변 영역 좌위를 포함하는 설치류와 교배된다 (예를 들어, 미국특허 번호 8,502,018 또는 미국특허 번호 8,642,835 참조; 본원에 참조로 인용된다). 일부 구현예에서, 본원에 설명된 바와 같은, 조작된 D_H 영역을 포함하는 설치류는 미국특허 출원공개 번호 2011-0195454 A1, 2012-0021409 A1, 2012-0192300 A1, 2013-0045492 A1, 2013-0185821 A1, 2013-0198880 A1, 2013-0302836 A1, 2015-0059009 A1; 국제특허 출원공개 번호 WO 2011/097603, WO 2012/148873, WO 2013/134263, WO 2013/184761, WO 2014/160179, WO 2014/160202(이들 모두 본원에 참조로 인용된다)에 설명된 바와 같은 인간화 면역글로불린 경쇄 유전자 또는 좌위를 포함하는 설치류와 교배된다.

마우스 (즉, 전부 하나 이상의 쥐 중쇄 불변 영역 유전자와 작동가능하게 연결되어 있는, 인간 V_H 및 J_H 유전자 분절과 작동가능하게 연결된 조작된 D_H 영역을 가진 마우스)에서 조작된 D_H 영역을 영역을 사용하는 구현예들이 본원에서 광범위하게 논의되었지만, 조작된 D_H 영역을 포함하는 다른 비-인간 동물 또한 제공된다. 일부 구현예에서, 이러한 비-인간 동물은 내인성 V_H 및 J_H 유전자 분절에 작동가능하게 연결된 조작된 D_H 영역을 포함한다. 일부 구현예에서, 이러한 비-인간 동물은 인간화 V_H 및 J_H 유전자 분절에 작동가능하게 연결된 조작된 D_H 영역을 포함한다. 이러한 비-인간 동물은 가령 포유동물, 예를 들어, 마우스, 랫트, 토끼, 돼지, 소(예: 젖소, 황소, 버팔로), 사슴, 양, 염소, 닭, 고양이, 개, 흰담비, 영장류(예: 마모셋, 붉은털 원숭이) 등을 포함하여, 본원에 개시된 관심있는 폴리펩티드의 부분에 대응하는 뉴클레오티드 코딩 서열에 의해 암호화된 아미노산을 포함하는 CDR3을 갖는 항체를 발현하도록 유전적으로 변형될 수 있는 임의의 동물을 포함한다. 예를 들어, 적합하게 유전자 변형가능한 ES 세포를 쉽게 구할 수 없는 비-인간 동물의 경우, 유전자 변형을 포함하여 비-인간 동물을 제조하기 위한 다른 방법이 채용된다. 이러한 방법은, 예를 들어, 비ES 세포 게놈(예를 들어, 섬유아세포 또는 유도 다능성 세포)을 변형하는 단계 및 적합한 세포, 예를 들어, 핵이 없는 난모세포에 유전자 변형된 게놈을 전달하기 위해 체세포 핵 전달(SCNT)을 채용하는 단계, 및 변형된 세포(예를 들어, 변형된 난모세포)를 배아를 형성하기에 적합한 조건 하에 비-인간 동물에 잉태시키는 단계를 포함한다.

비-인간 동물 게놈(예: 돼지, 젖소, 설치류, 닭 등)을 변형하는 방법은, 예를 들어, 징크 핑거 뉴클레아제(ZFN), 전사 활성인자 유사 작동자 뉴클레아제(TALEN), 또는 Cas 단백질(즉, CRISPR/Cas 시스템)을 채용하여 본원에 설명된 조작된 D_H 영역을 포함하도록 게놈을 변형시키는 단계를 포함한다. 비-인간 동물의 생식선 게놈을 변형하는 방법에 대한 안내는, 예를 들어, 미국특허 출원공개 번호 2015-0376628 A1, US 2016-0145646 A1 및 US 2016-0177339 A1(본원에 참조로 인용된다)에서 찾을 수 있다.

일부 구현예에서, 본원에서 설명된 비-인간 동물은 포유동물이다. 일부 구현예에서, 본원에 설명된 비-인간 동물은, 예를 들어, 뛰는 쥐상과(Dipodoidea) 또는 쥐상과(Muroidea) 아목의 작은 포유동물이다. 일부 구현예에서, 본원에 설명된 바와 같은 유전적으로 변형된 동물은 설치류이다. 일부 구현예에서, 본원에 설명된 바와 같은 설치류는 마우스, 랫트 및 햄스터로부터 선택된다. 일부 구현예에서, 본원에 설명된 바와 같은 설치류는 쥐상과 아목으로부터 선택된다. 일부 구현예에서, 본원에 설명된 바와 같은 유전적으로 변형된 동물은 칼로미스쿠스과(Calomyscidae)(예를 들어, 마우스 유사 햄스터), 비단털쥐과(Cricetidae)(예: 햄스터, 뉴월드 랫트 및 마우스, 들쥐), 쥐과(Muridae)(진짜 마우스 및 랫트, 사막쥐, 가시쥐, 갈기쥐), 네소미스과(Nesomyidae)(클라이밍 마우스, 락 마우스(rock mice), 흰꼬리 랫트, 말라가시 랫트 및 마우스), 가시겨울잠쥐과(Platacanthomyidae)(예: 가시겨울잠쥐), 및 소경쥐과(Spalacidae)(예: 두더쥐, 대나무쥐, 및 동북)로부터 선택된 과(family)로부터 유래한다. 일부 특정 구현예에서, 본원에서 설명된 바와 같은 유전적으로 변형된 설치류는 진짜 마우스 또는 랫트(쥐상과), 사막쥐(gerbil), 가시쥐(spiny 마우스), 갈기쥐(crested rat)로부터 선택된다. 일부 특정 구현예에서, 본원에서 설명된 바와 같은 유전적으로 변형된 마우스는 쥐상과의 구성원으로부터 선택된다. 일부 구현예에서, 본원에서 설명된 비-인간 동물은 설치류이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 설치류는 마우스와 랫트로부터 선택된다. 일부 구현예에서, 본원에서 설명된 비-인간 동물은 마우스이다.

일부 구현예에서, 본원에서 설명된 비-인간 동물은 C57BL/A, C57BL/An, C57BL/GrFa, C57BL/KaLwN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, 및 C57BL/Ola로부터 선택된 C57BL 계통의 마우스인 설치류이다. 일부 특정 구현예에서, 본원에서 설명된 바와 같은 마우스는 129P1, 129P2, 129P3, 129X1, 129S1 (예를 들어, 129S1/SV, 129S1/SvIm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129/SvJae, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1, 129T2인 계통으로 이루어지는 군으로부터 선택된 129 계통이다(예: Festing 외, 1999, Mammalian Genome 10:836; Auerbach, W. 외, 2000, Biotechniques 29(5):1024-1028, 1030, 1032 참조). 일부 특정 구현예에서, 본원에 설명된 바와 같은 유전적으로 변형된 마우스는 전술한 129 계통 및 전술한 C57BL/6 계통의 혼합체이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 마우스는 전술한 129 계통의 혼합체, 또는 전술한 BL/6 계통의 혼합체이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 혼합체의 129 계통은 129S6(129/SvEvTac) 계통이다. 일부 구현예에서, 본원에 설명된 바와 같은 마우스는 BALB 계통, 예를 들어 BALB/c 계통이다. 일부 구현예에서, 본원에 설명된 바와 같은 마우스는 BALB 계통 및 전술한 다른 계통의 혼합체이다.

일부 구현예에서, 본원에서 설명된 비-인간 동물은 랫트이다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 랫트는 위스타 랫트(Wistar rat), LEA 계통, 스프래그 다울리(Sprague Dawley) 계통, 피셔(Fischer) 계통, F344, F6, 및 다크 아구티(Dark Agouti)로부터 선택된다. 일부 특정 구현예에서, 본원에 설명된 바와 같은 랫트 계통은 위스타, LEA, 스프래그 다울리, 피셔, F344, F6, 및 아크 아구티로 이루어지는 군으로부터 선택된 2가지 이상 계통의 혼합체이다.

조작된 다양성 클러스터를 갖는 비-인간 동물을 이용하는 방법

항체-기반 치료제의 생산을 위한 여러가지 시험관 내 및 생체 내 기술이 개발되었다. 특히, 생체 내 기술은 동물의 게놈에 무작위로 포함시키거나 (미국특허 번호 5,569,825 참조) 동물의 내인성 면역글로불린 불변 영역과 작동가능하게 연결하여 내인성 면역글로불린 좌위에 정확히 위치시킨 (미국특허 번호 8,502,018; 8,642,835; 8,697,940; 및 8,791,323 참조) 인간 면역글로불린 유전자를 함유하는 유전자이식 동물 (즉, 설치류)의 생산을 특징으로 하고 있다. 두 가지 접근법 모두 인간에 사용하기 위한 유망한 항체 치료제 후보물질을 생산하는데 생산성이 있었다. 또한, 두 가지 접근법 모두 생체 내에서 생성된 항체 레파토리에서 항체 후보물질을 선택한다는 점에서 시험관 내 접근법에 비해 장점이 있으며, 숙주의 면역계의 내부 환경 내에서 항원에 대한 친화성 및 특이성을 선별하는 것을 포함한다. 이런 식으로, 항체는 시험관 내 기술을 동반할 수 있는 인공 환경 또는 인 실리코 예측보다는 (관련 생물학적 에피토프와 표면 내에서) 자연적으로 제시된 항원에 결합한다. 생체 내 기술로부터 생산된 강력한 항체 레파토리에도 불구하고, 복합체 (예, 막에 걸쳐진 폴리펩티드) 또는 세포질 항원에 대한 항체는 여전히 어려움이 있다. 또한, 종 (예, 인간 및 마우스) 간에 고도의 서열 동일성을 공유하는 폴리펩티드에 대한 항체를 생성하는 것은 면역 내성으로 인해 도전과제로 남아 있다.

따라서, 다른 것들 중에서, 비전통적 서열 (즉, 자연에서 나타타는 전통적이지 않은 D_H 유전자 분절 또는 D_H 유전자 분열)로부터 생성된 CDR, 특히 CDR3에서 부가된 다양성을 갖는 항체의 생산을 특징으로 하는 생체 내 시스템의 구축이, 관심있는 폴리펩티드의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열(즉, 합성 서열)을 사용하여 만들어질 수 있다는 인식이 본원에 기재되고 있다. 이와 같은 부가된 다양성은 특정 항원 (예를 들어, 막에 걸쳐진 폴리펩티드)에 대한 결합을 지시할 수 있다. 예를 들어, 본원에 설명된 바와 같이, 하나 이상의 염증성 사이토카인 (예, β-케모카인)을 차단하는 항체는 조작된 D_H 영역을 함유하는 면역글로불린 중쇄 좌위를 함유하도록 조작된 비-인간 동물에 의해 생성될 수 있으며, 이때 조작된 D_H 영역은 사이토카인 수용체 (예, β-케모카인 수용체)의 세포외 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열을 포함한다. 본원에 설명된 바와 같이, 이온 채널 (예, Na_V 채널)의 활성 및/또는 기능을 차단하거나 억제하는 항체는 조작된 D_H 영역을 함유하는 면역글로불린 중쇄 좌위를 함유하도록 조작된 비-인간 동물에 의해 생성될 수 있으며, 이때 조작된 D_H 영역은 독소 (예, μ-코노독소 및/또는 독거미 독소)의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 코딩 서열을 포함한다. V_H 유전자 분절, 뉴클레오티드 코딩 서열 및 J_H 유전자 분절의 재조합시, 부분적으로는 뉴클레오티드 코딩 서열에 의해, 암호화된 서열을 갖는 CDR3 영역을 함유하는 중쇄 가변 코딩 서열이 형성되고, 이에 따라 뉴클레오티드 코딩 서열과 연관된 특정 항원에 대한 결합을 지시한다.

본원에 설명된 비-인간 동물은 인간 항체를 제작하기 위해 사용될 수 있으며, 이때 인간 항체는 본원에 설명된 비-인간 동물의 세포의 유전 물질에 의해 암호화된 하나 이상의 가변 영역 핵산 서열로부터 유래된 가변 도메인을 포함한다. 예를 들어, 본원에 설명된 비-인간 동물은 비-인간 동물이 β-케모카인 (또는 Na_V 채널 폴리펩티드, 전체적 또는 부분적)에 대한 면역 반응을 일으키기에 충분한 시간과 조건 하에서 β-케모카인 (또는 Na_V 채널 폴리펩티드, 전체적 또는 부분적)으로 면역화된다. 항체는 비-인간 동물 (예를 들어, 하나 이상의 B 세포 같은, 하나 이상의 세포)로부터 단리되고, 예를 들어 친화성, 특이성, 에피토프 맵핑, 리간드-수용체 상호 작용을 차단하는 능력, 억제 수용체 활성화 등 같은, 다양한 분석 측정을 이용하여 특징지어진다. 다양한 구현예에서, 본원에 설명된 비-인간 동물에 의해 생산된 항체는 비-인간 동물로부터 단리된 하나 이상의 인간 가변 영역 뉴클레오티드 서열로부터 유래된 하나 이상의 인간 가변 도메인을 포함한다. 일부 구현예에서, 항-약물 항체 (예, 항-개별특이형(anti-idiotype) 항체)는 본원에 설명된 비-인간 동물에서 증가될 수있다.

본원에 설명된 비-인간 동물은 다양한 분석에 유용한 인간 항체를 생산하는 생물학적 물질(예, 세포)의 공급원 및 개선된 생체 내 시스템을 제공한다. 다양한 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 사이토카인을 표적화하고 그리고/또는 사이토카인 활성을 조절하고 그리고/또는 다른 결합 파트너 (예, 사이토카인 수용체)와의 사이토카인 상호작용을 조절하는 치료제를 개발하는데 사용된다. 다양한 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 이온 채널을 표적화하고 그리고/또는 이온 채널 활성을 조절하고 그리고/또는 다른 결합 파트너와의 이온 채널 상호작용을 조절하는 치료제를 개발하는데 사용된다. 다양한 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 인간 사이토카인 폴리펩티드 또는 이온 채널 (예, 칼륨 채널, 칼슘 채널 또는 나트륨 채널)을 결합하는 후보물질 치료제 (예, 항체, siRNA 등)를 동정, 스크리닝 및/또는 개발하는데 사용된다. 다양한 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 인간 β-케모카인 폴리펩티드 활성을 차단하거나 하나 이상의 인간 전압-관문 나트륨 (Na_V) 채널을 차단하는 후보물질 치료제 (예, 항체, siRNA 등)를 스크리닝하고 개발하는데 사용된다. 다양한 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 인간 β-케모카인 폴리펩티드의, 또는 하나 이상의 인간 Na_V 채널의 길항제 및/또는 작용제의 결합 프로파일을 결정하는데 사용된다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 하나 이상의 인간 β-케모카인 폴리펩티드를 결합하거나 하나 이상의 인간 Na_V 채널을 결합하는 하나 이상의 후보물질 치료제 항체의 에피토프 또는 에피토프들을 결정하는데 사용된다.

다양한 구현예에서, 본원에 설명된 비-인간 동물은 항-β-케모카인 또는 항-Na_V 항체의 약동학적 프로파일을 결정하는데 사용된다. 다양한 구현예에서, 본원에 설명된 바와 같은 하나 이상의 비-인간 동물 및 하나 이상의 대조 비-인간 동물 또는 기준 비-인간 동물은 각각 다양한 용량 (예를 들어, 0.1 mg/kg, 0.2 mg/kg, 0.3 mg/kg, 0.4 mg/kg, 0.5 mg/kg, 1 mg/kg, 2 mg/kg, 3 mg/kg, 4 mg/kg, 5 mg/mg, 7.5 mg/kg, 10 mg/kg, 15 mg/kg, 20 mg/kg, 25 mg/kg, 30 mg/kg, 40 mg/kg, 또는 50 mg/kg 이상)의 하나 이상의 후보물질 치료제 항-β-케모카인 또는 항-Na_V 항체에 노출된다. 후보 치료용 항체는 비경구 및 비경구가 아닌 투여 경로를 포함하여 임의의 원하는 투여 경로를 통해 투여될수 있다. 비경구 경로는, 예를 들어, 정맥내, 동맥내, 내문내, 근육내, 피하, 복강내, 척수내, 척추강내, 뇌심실내, 두개내, 흉막내 주입 경로 또는 다른 주입 경로를 포함한다. 비경구가 아닌 경로는, 예를 들어, 경구, 비강, 경피, 폐, 직장, 볼, 질내, 안내를 포함한다. 투여는 또한 연속적 주입, 국소 투여, 이식물(겔, 막 등)으로부터의 서방출, 및/또는 정맥내 주입일 수 있다. 혈액은 다양한 시점(예를 들어, 0시간, 6시간, 1일, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 또는 최대 30일 이상)에서 비-인간 동물(인간화 및 대조군)로부터 단리된다. 총 IgG, 항치료 항체 반응, 응집 등을 포함하나 이에 제한되지는 않는 다양한 검정이 본원에 설명된 비-인간 동물로부터 수득한 샘플을 사용하여 투여된 후보 치료용 항체의 약동학적 프로파일을 결정하기 위해 수행될 수 있다.

다양한 구현예에서, 본원에 설명된 비-인간 동물은 β-케모카인 활성 (또는 β-케모카인 신호전달, 또는 β-케모카인 매개 상호작용)의 차단 또는 조절에 대한 치료 효과 및 세포 변화의 결과로서의 유전자 발현 또는 본원에 설명된 비-인간 동물의 세포의 β-케모카인 수용체 밀도에 대한 효과를 측정하는데 사용된다. 다양한 구현예에서, 본원에 설명된 비-인간 동물 또는 그로부터 단리된 세포는 인간 β-케모카인 폴리펩티드 (또는 인간 β-케모카인 폴리펩티드의 부분)를 결합하는 후보물질 치료제에 노출되고, 후속 기간 후에, β-케모카인-의존적 과정 (또는 상호작용), 예를 들어, 리간드-수용체 상호작용 또는 β-케모카인 신호전달에 대한 효과에 대해 분석된다.

다양한 구현예에서, 본원에 설명된 비-인간 동물은 Na_V 채널 활성 (또는 Na_V 채널 신호전달, 또는 Na_V-매개 상호작용, 또는 Na_V 채널 활동 전위)의 차단 또는 조절에 대한 치료 효과 및 세포 변화의 결과로서의 유전자 발현 또는 본원에 설명된 비-인간 동물의 세포의 Na_V 채널 밀도에 대한 효과를 측정하는데 사용된다. 다양한 구현예에서, 본원에 설명된 비-인간 동물 또는 그로부터 단리된 세포는 인간 Na_V 채널 (또는 인간 Na_V 채널의 부분)를 결합하는 후보물질 치료제에 노출되고, 후속 기간 후에, Na_V 채널-의존적 과정 (또는 상호작용), 예를 들어, 리간드-수용체 상호작용 또는 Na_V 채널 활동 전위에 대한 효과에 대해 분석된다.

다양한 구현예에서, 본원에 설명된 비-인간 동물은 전압-관문 나트륨 채널 (예, Na_V1.7)에 작용하는 인간 항체를 만들기 위해 사용될 수 있다. 이러한 인간 항체는 예를 들어, 본원에 참고로 인용된, 미국특허 제8,871,996호 및 제8,486,647호에 설명된 바와 같은, 변형과 같은, 본원에 설명된 것과 상이한 변형을 갖는 비-인간 동물에서 시험 및/또는 개발될 수 있다.

본원에 설명된 비-인간 동물은 하나 이상의 β-케모카인 (또는 Na_V 채널)을 결합하는 항체를 발현하고, 이에 따라 결합 및 기능 분석, 예를 들어, 인간 β-케모카인 (또는 Na_V 채널) 길항제 또는 작용제의 결합 또는 기능 분석에, 사용하기 위한 항-β-케모카인 (또는 항-Na_V) 항체의 공급원으로 작용하도록 세포, 세포주 및 세포 배양물이 생성될 수 있으며, 특히 길항제 또는 작용제는 인간 β-케모카인 서열 (또는 인간 Na_V 채널 서열) 또는 에피토프에 특이적이거나 또는, 대안으로, 인간 β-케모카인 서열 (또는 인간 Na_V 채널 서열) 또는 리간드-수용체 상호작용 (결합)에서 작용하는 에피토프에 특이적이다. 다양한 구현예에서, 후보물질 치료제 항체 또는 siRNA에 결합된 β-케모카인 에피토프 (또는 Na_V 채널 에피토프)는 본원에 설명된 비-인간 동물로부터 단리된 세포를 사용해 결정될 수 있다.

본원에 설명된 비-인간 동물 유래의 세포는 단리되어 필요에 따라 사용되거나, 많은 세대 동안 배양물 내에 유지될 수 있다. 다양한 구현예에서, 본원에 설명된 비-인간 동물 유래의 세포는 (예를 들어, 바이러스의 사용을 통해) 불멸화되고, 배양물 내에서 (예를 들어, 계대 배양물 내에서) 무기한으로 유지된다.

본원에 설명된 비-인간 동물은 하나 이상의 β-케모카인 폴리펩티드 (또는 Na_V 채널)에 결합하는 항체의 변이체를 생성하기 위한 생체 내 시스템을 제공한다. 그러한 변이체는 2 개 이상의 β-케모카인 폴리펩티드 (또는 Na_V 채널)에 의해 공유되는 공통 에피토프에 대한 원하는 기능성, 특이성, 낮은 교차-반응성을 갖는 항체를 포함한다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 원하는 또는 개선된 기능성에 대해 스크리닝되는 일련의 변이체 항체를 생성하기 위해 항체 패널을 생성하는데 사용된다.

본원에 설명된 비-인간 동물은 항-β-케모카인 (또는 항-Na_V) 항체 라이브러리를 생성하기 위한 생체 내 시스템을 제공한다. 그러한 라이브러리는 원하는 작용기 기능에 기초하여 상이한 Fc 영역 상에 그래프트되고/되거나 당 기술분야에 공지된 기술 (예, 부위-특이적 돌연변이 유발, 에러 유발(error-prone) PCR 등)을 사용하여 가변 영역 서열의 친화도 성숙을 위한 소스로서 사용될 수 있는 중쇄 및 경쇄 가변 영역 서열에 대한 소스를 제공한다.

본원에 설명된 비-인간 동물은 약물 또는 백신의 분석 및 시험을 위한 생체 내 시스템을 제공한다. 다양한 구현예에서, 후보 약물 또는 백신이 본원에 설명된 하나 이상의 비-인간 동물에 전달된 다음, 약물 또는 백신에 대한 한 가지 이상의 면역 반응, 약물 또는 백신의 안전성 프로파일, 또는 질환 또는 병태에 대한 효과 및/또는 질환 또는 병태의 하나 이상의 증상을 알아내기 위해 비-인간 동물의 모니터링이 이어질 수 있다. 안전성 프로파일을 결정하기 위해 사용되는 예시적인 방법은 약물 또는 백신의 독성, 최적 용량 농도, 항체 (즉, 항-약물) 반응, 효능, 및 가능한 위험 인자의 측정을 포함한다. 이러한 약물 또는 백신은 이러한 비-인간 동물에서 개선되고/되거나 개발될 수 있다.

백신 효능은 여러 가지 방식으로 결정될 수 있다. 간단히 말하면, 본원에 설명된 비-인간 동물은 당 기술분야에 공지된 방법을 사용하여 백신 접종이 실시된 다음, 백신으로 시험 접종하거나 이미 감염된 비-인간 동물에게 백신을 투여한다. 백신에 대한 비-인간 동물(들)의 반응은 백신의 효능을 결정하기 위해 비-인간 동물(들) (또는 그로부터 단리된 세포)에 대해, 모니터링하고/또는 하나 이상의 분석을 수행함으로써 측정될 수 있다. 그리고 나서 백신에 대한 비-인간 동물(들)의 반응은 당 기술분야에 공지된 및/또는 본원에 설명된 하나 이상의 방법을 사용하여 대조군 동물과 비교된다.

백신 효능은 바이러스 중화 분석에 의해 추가로 결정될 수 있다. 간단히 말하면, 본원에 설명된 비-인간 동물을 면역화하고 면역화-후 여러 날에 혈청을 수집한다. 혈청의 순차 희석액을 바이러스와 함께 사전 배양하며, 그 동안 바이러스에 특이적인 혈청 내의 항체가 그것에 결합하게 될 것이다. 그리고 나서, 바이러스/혈청 혼합물을 허용 세포에 가하여 플라크 분석 또는 미세중화 분석에 의해 감염성을 측정한다. 혈청 내의 항체가 바이러스를 중화시킨다면, 대조군에 비해 플라크가 적거나 상대적으로 루시퍼라제 단위가 적다.

본원에 설명된 비-인간 동물은 암 및/또는 염증성 질환에 사용하기 위한 항체 기반 치료제의 개발 및 특징화를 위한 개선된 생체 내 시스템을 제공한다. 염증은 오랫동안 암과 관련되어 왔다 (예를 들어, Grivennikov, S.I. 외, 2010, Cell 140:883-99; Rakoff-Nahoum, S., 2006, Yale J. Biol. Med. 79:123-30에서 검토됨). 사실, 개발중인 종양 환경은 부분적으로는, 다양한 염증 매개체의 침윤을 특징으로 한다. 또한 지속적인 염증은 암 발병 확률을 높일 수 있다. 따라서, 일부 구현예에서, 본원에 설명된 비-인간 동물은 항암 및/또는 항염증 치료제의 개발 및/또는 동정을 위한 생체 내 시스템을 제공한다. 다양한 구현예에서, 본원에 설명된 비-인간 동물 또는 대조군 비-인간 동물 (예를 들어, 본원에 설명된 것과 다른 유전자 변형을 갖는 것, 또는 유전자 변형이 없는 것, 즉, 야생형)에 종양 (또는 종양 세포)을 이식한 다음, 하나 이상의 후보물질 치료제를 투여할 수 있다. 일부 구현예에서, 후보물질 치료제는 다중특이적 항체 (예, 이중특이적 항체) 또는 항체 칵테일을 포함할 수 있다. 일부 구현예에서, 후보물질 치료제는 예를 들어 순차적으로 또는 동시에 투약되는 2종 이상의 단일특이적 항체의 투여와 같은, 병용 요법을 포함한다. 종양은 하나 이상의 후보물질 치료제를 투여하기 전에 비-인간 동물 내에서 하나 이상의 위치에 확립되도록 충분한 시간이 허용될 수 있다. 종양 세포 증식, 생장, 생존 등은 후보 치료제(들)의 투여 전과 투여 후 모두 측정될 수 있다. 후보 치료제의 세포독성은 또한 원하는 대로 비-인간 동물에서도 측정될 수 있다.

본원에 설명된 비-인간 동물은 통증 (예, 신경병성 통증) 치료에 사용하거나 진통제로 사용하기 위한 항체 기반 치료제의 개발 및 특징화를 위한 개선된 생체 내 시스템을 제공한다. 일부 구현예에서, 본원에 설명된 비-인간 동물은 항-통증 치료제의 개발 및/또는 동정을 위한 생체 내 시스템을 제공한다. 다양한 구현예에서, 본원에 설명된 비-인간 동물 또는 대조군 비-인간 동물 (예를 들어, 본원에 설명된 것과 다른 유전자 변형을 갖는 것 [예를 들어, 미국특허 제8,871,996호 및 제8,486,647호에 설명된 변형; 본원에 참고로 인용됨], 또는 유전자 변형이 없는 것, 즉, 야생형)에 통증 자극을 받을 수 있게 한 다음 (예를 들어, 절개, 화학적으로 유도된 것 등; 예를 들어, Recognition and Alleviation of Pain in Laboratory Animals. Washington D.C.: National Academies Press, 2009. Print 참조), 하나 이상의 후보물질 치료제를 투여할 수 있다. 일부 구현예에서, 후보물질 치료제는 다중특이적 항체 (예, 이중특이적 항체) 또는 항체 칵테일을 포함할 수 있다. 일부 구현예에서, 후보물질 치료제는 예를 들어 순차적으로 또는 동시에 투약되는 2종 이상의 단일특이적 항체의 투여와 같은, 병용 요법을 포함한다. 하나 이상의 후보물질 치료제를 투여하기 전에 충분한 시간이 허용될 수 있다. 통증 관리 및/또는 통증 치료 효능의 평가와 일반적으로 관련된 다양한 측정 및/또는 시험이 후보물질 치료제 투여 전후 모두에 기록될 수 있다.

키트

또한 적어도 하나의 비-인간 동물, 비-인간 세포, DNA 단편, 및/또는 본원에 설명된 바와 같은 표적화 벡터로 채워진 하나 이상의 용기를 포함하는 팩 또는 키트가 본원에 설명된다. 키트는 임의의 적용 가능한 방법(예: 연구 방법)에서 사용될 수 있다. 이러한 용기(들)에는 의약품 또는 생물학적 제제의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해 규정된 양식으로 된 공지가 선택적으로 부착될 수 있으며, 공지는 (a) 인간 투여용으로 제조, 사용 및 판매에 대한 기관의 승인 사항, (b) 사용 지침, 또는 둘 모두, 또는 개체 간의 물질 및/또는 생물학적 제제의 이전을 규율하는 계약이 반영된다.

상기 설명된 실시예들의 다른 특징은 예시적인 구현예들에 대한 다음의 설명 과정에서 명백해질 것이며, 이들 실시예는 예시를 위해 제공되고 이를 제한하도록 의도되지 않는다.

실시예

다음의 실시예는 당업자에게 본 발명의 방법 및 조성물을 어떻게 제조하고 사용하는지를 설명하기 위해 제공되며, 발명자가 그들의 발명으로 간주한 것의 범위를 제한하고자 하는 것이 아니다. 다르게 명시되지 않는 한, 온도는 섭씨로 표시되고, 압력은 대기압이거나 대기압에 가깝다.

실시예 1. 면역글로불린 중쇄 가변 영역 내에 D6 케모카인 유인 수용체의 뉴클레오티드 코딩 서열을 포함하는 조작된 다양성 클러스터의 구축

본 실시예는 비-인간 동물 예컨대 설치류 (예컨대, 마우스)의 게놈 내로의 삽입을 위한 표적화 벡터의 예시적인 구축 방법을 설명한다. 특히, 본 실시예에 기술된 방법은 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 설치류 (예컨대 마우스)의 배아 줄기 (ES) 세포의 게놈에 삽입하기 위한 표적화 벡터의 생산을 보여주며, 여기서, 상기 조작된 D_H 영역은 비-면역글로불린 폴리펩티드 또는 그의 부분을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 본 실시예에서, 비정형 케모카인 수용체 (ACKR), 예컨대 D6 케모카인 유인 수용체의 세포외 도메인의 코딩 서열을 면역글로불린 중쇄 가변 영역 내로 삽입을 위한 표적화 벡터의 구축에 사용하였다. 후술되는 바와 같이, 상기 코딩 서열을 전통적인 D_H 유전자 분절 대신 중쇄 가변 (V_H) 및 중쇄 결합 (J_H) 분절과 작동가능하게 연결되도록 위치시켜 VDJ 재조합 시 상기 코딩 서열로부터 생산된 V_H CDR3을 갖는 항체를 발현시켰다.

면역글로불린 중쇄 가변 영역 내로의 삽입을 위한 D6 케모카인 유인 수용체의 세포외 도메인으로부터 유래된 코딩 서열을 함유하는 표적화 벡터를 VELOCIGENE® 기술 (예컨대, 미국특허 제6,586,251호 및 Valenzuela 외, 2003, Nature Biotech. 21(6):652-659 참조; 참조로서 본원에 통합됨) 및 당업계에 공지된 분자 생물학적 기법을 사용하여 생성하였다. 본 실시예에 기술된 방법은 원하는 폴리펩티드로부터 유래된 코딩 서열의 임의의 세트 또는 원하는 코딩 서열 (또는 코딩 서열 단편)의 조합을 이용하기 위해 사용할 수 있다. D6 케모카인 유인 수용체의 세포외 도메인으로부터의 코딩 서열을 사용하여 표적화 벡터를 구축하기 위한 대안적이고 비-제한적인 예시적인 전략이 도 3 및 도 4에 도시되어 있다.

요컨대, 수 개의 D6 코딩 서열을 각각 함유하는 일련의 4개의 DNA 단편 (D₆-DH1116, D₆-DH17613, D₆-DH114619, 및 D₆DH120126)을 드 노보 (de novo) DNA 합성으로 제작하였다 (표 5; Blue Heron Biotech, Bothell, WA). 다양한 제한 효소 부위 및/또는 중첩 영역 (약 40 bp, 다중 제한 효소 부위를 포함함)을 각각의 DNA 단편의 말단에 포함시켜 후속하여 일렬로 (in tandem) 클로닝이 가능하게 하였다 (하기 참조). 단일 인간 D_H 분절 (즉, D_H6-25)을 D6 유인 케모카인 수용체의 세포외 도메인의 부분에 해당하는 뉴클레오티드 코딩 서열을 함유하도록 조작된 D_H 영역에 온전하게 유지시켰다. 일부 구현예에서, 면역글로불린 유전자 분절 (예컨대, D_H 분절)은 준최적 또는 결손 재조합 신호 서열 (예컨대, 7량체 및/또는 9량체 서열)과 결합될 수 있으므로 이와 같은 D_H 분절의 사용은 야생형, 정상 및/또는 결손이 없는 것을 특징으로 하는 재조합 신호 서열과 결합된 D_H 분절의 사용에 비해 실질적으로 적다. 따라서, 이와 같은 D_H 분절 (예컨대 D_H6-25, 도 2에 도시되어 있는 RSS 서열)은 D_H 영역을 조작하여 관심있는 비-면역글로불린 폴리펩티드, 또는 이의 일부 (예컨대, a D6 케모카인 유인 수용체)를 각각 암호화하는 뉴클레오티드 코딩 서열을 함유하도록 조작할 때 손상되거나 삭제되지 않게 둘 수 있다.

면역글로불린은 체세포 과돌연변이라 불리는, 세포 기구에 관여하며, 표적에 대한 높은 친화도를 특징으로 하는 친화도-성숙 항체 변이체를 생산한다. 비록 체세포 과돌연변이가 대개 항체 가변 영역의 CDR 내에서 발생하지만, 돌연변이는 핫스팟, 예를 들어, RGYW 활성화-유도 시티딘 디아미나제 (AID) 핫스팟 (예를 들어, Li, Z. 외, 2004, Genes Dev. 18:1-11; Teng, G. and F.N. Papavasiliou, 2007, Annu. Rev. Genet. 41:107-20 참조; 본원에 참조로 포함됨)으로 지칭되는 특정 서열 모티프를 우선적으로 표적으로 한다. 각각의 D6 코딩 서열의 핵산 서열은 자연적으로 이와 같은 핫스팟 서열을 함유하지만, B 세포 수용체의 클론 선택 동안 체세포 과돌연변이의 가능성을 최적화하기 위해 인공적인 핫스팟을 선택된 D6 코딩 서열 내로 도입하였다. SHM을 위한 인공적인 핫스팟을 드 노보 합성 이전에 인 실리코에서 D6 코딩 서열 내로 도입하였다. 도 1은 본원에 기술된 D6 코딩 서열에 사용한 천연 및 인공적인 핫스팟의 예시적인 분석을 도시한다.

V(D)J 재조합은, V, D 및 J 코딩 서열에 비해 정확한 위치에서 DNA 재배열을 보장하는, 재조합 신호 서열 (RSS)이라 불리는 측부 DNA 서열에 의해 유도된다. 각각의 RSS는 코딩 서열과 인접하는 7개 뉴클레오티드 (7량체)의 보존된 블록에 이어서, 비보존된 스페이서 (12 또는 23bp) 및 9개 뉴클레오티드 (9량체)의 제2 보존된 블록으로 구성된다. 각각의 D6 코딩 서열을 보다 좋은 재조합 빈도 및 동등한 사용을 위해 최적화된 RSS로 설계하였다. 요컨대, D_H RSS 서열 내의 모든 7량체 및 9량체를 공통 (consensus) 서열로 대체하였다 (도 2). 비기능적인 "ORF 전용(only)" D_H 분절의 RSS 서열을 수리하여 D6 코딩 서열의 사용을 가능케 하였다. 본원에 기술된 바와 같이, "ORF 전용"은 적어도 하나의 개방형 해독 틀로 번역될 수 있지만, 적어도 하나의 비-기능적인 RSS 서열 (RAG 재조합효소에 의해 인식되지 않음)을 갖는 코딩 서열을 포함하는 D_H 분절이다. 본 발명자들은 7량체 및 9량체를 최적화시키는 것이 모든 D6 코딩 서열이 적어도 부분적으로 스페이서, 코딩 말단 서열, 인접 유전자 서열 등으로부터의 예측할 수 없는 영향으로 인해 동등한 빈도로 사용될 것임을 보장하지 않는다는 것을 인식하였다. 체세포 과돌연변이 핫스팟에 대해 전술한 바와 같이, 최적화된 RSS를 D6 DNA 단편의 드 노보 합성 이전에 인 실리코에서 설계하였다.

D6 DNA 단편을 제한 효소 부위 및 각각의 단편 내로 설계된 중첩 영역을 사용하여 일렬로 함께 조립하여 제조하였다. D6-DH1166 단편 및 네오마이신 카세트를 운반하는 플라스미드를 AgeI 및 EcoRI 제한 효소 절단을 사용하여 연결하여 제조하였다 (도 3a, 상단). AgeI/EcoRI 절단된 플라스미드 및 D6-DH1166 단편을 제조자의 설명서에 따라 DNA 리가아제를 사용하여 함께 연결하였다. 연결된 생성물 및 나머지 D6 DNA 단편을 SnaBI으로 절단하였다. D6 DNA 단편을 수용하기 위해 BAC 벡터 (pBACE3.6)를 NotI 및 AscI으로 별개로(separately) 절단하였다 (도 3a, 중앙). D6-DH1166/네오마이신 카세트 연결 생성물 및 나머지 D6 DNA 단편을 이전에 기술한 1단계 등온 조립 (one-step isothermal assembly)을 사용하여 조립하였다 (도 3a, 하단; Barnes, W.M., 1994, Proc. Natl. Acad. Sci. 91(6):2216-20; Gibson, D.G. 외, 2009, Nat. Methods 6(5):343-5; Gibson, D.G. 외, 2010, Nat. Methods 7(11):901-3). 이어서 조립된 D6 DNA 단편 (도 3b, 상단)을 PI-SceI 및 I-CeuI으로 절단하고 약 50 kb의 인간 가변 영역 게놈 DNA 및 인간 J_H 클러스터를 각각 함유하는 5' 및 3' 상동성 암(arm)을 함유하는 BAC 클론에 호환가능한 말단을 통해 연결시켰다 (도 3b, 중앙). 최종 표적화 벡터는 5'에서 3'으로 인간 가변 영역 DNA를 함유하는 약 50 kb 5' 상동성 암, 네오마이신 카세트, D6 케모카인 유인 수용체의 25개의 세포외 코딩 서열을 함유하는 약 41 kb DNA 단편, 인간 J_H 클러스터, 마우스 중쇄 인트론 인핸서 (Ei), 마우스 IgM 불변 영역 유전자 및 lox 부위를 함유하였다 (도 3b, 하단).

대안적으로, 전술된 D6 DNA 단편은 전술된 바와 상이하지만 당업계에 공지된 분자 기법을 사용하여 조립될 수 있다. 예컨대, D6 DNA 단편은 일렬로 배열되어 있으므로, 다양한 상이한 설계 (예컨대, 코딩 서열 순서)가 원하는 바와 같은 단편의 말단 내로 설계된 상이한 제한 부위/중첩 영역의 사용을 통해 달성될 수 있다. 순차적인 연결에 의한 전술된 D6 DNA 단편의 조립의 예시적인 대안적인 방법이 도 4a 및 도 4b에 도시되어 있다.

조작된 다양성 클러스터, 예컨대, 조작된 D_H 영역을 함유하는 면역글로불린 중쇄 좌위를 함유하는 변형된 ES 세포를 생산하기 위해, 전술된 D6-D_H 표적화 벡터를 마우스 배아 줄기 (ES) 세포 내로 도입하였다.

DNA 단편 (크기)	D6 코딩 서열 명칭 (서열번호)	D_H 위치
D6-DH1166 (~10,050 bp) 서열번호 131	D6 Nterm-C (39) D6 EC3 (7) D6 Nterm (1) D6 Nterm+EC3 (33) D6 EC1 (3) D6 EC2 (5)	D_H1-1 D_H2-2 D_H3-3 D_H4-4 D_H5-5 D_H6-6
D6-DH17613 (~9,768 bp) 서열번호 132	D6 EC1-N (41) D6 EC3-S (15) D6 Nterm-N (37) D6 EC2-S (13) D6 EC1-EC2-S (29) D6 EC1-S (11) D6 Nterm-S (9)	D_H1-7 D_H2-8 D_H3-9 D_H3-10 D_H4-11 D_H5-12 D_H6-13
D6-DH114619 (~9,788 bp) 서열번호 133	D6 EC2-N (43) D6 EC2-EC1 (23) D6 Nterm-EC3 (17) D6 EC1+EC2 (35) D6 EC3-Nterm (19) D6 EC1-EC2 (21)	D_H1-14 D_H2-15 D_H3-16 D_H4-17 D_H5-18 D_H6-19
D6-DH120126 (~11,906 bp) 서열번호 134	D6 EC2-C (45) D6 EC2-EC1-S (31) D6 Nterm-EC3-S (25) D6 EC3-C (49) D6 EC3-Nterm-S (27) D6 EC3-N (47)	D_H1-20 D_H2-21 D_H3-22 D_H4-23 D_H5-24 D_H1-26

실시예 2. 면역글로불린 중쇄 가변 영역 내에 D6 케모카인 유인 수용체의 뉴클레오티드 코딩 서열을 포함하는 조작된 다양성 클러스터를 갖는 설치류의 생산

본 실시예는 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 비-인간 동물 (예컨대, 설치류)의 생산을 보여주며, 여기서, 상기 조작된 D_H 영역은 각각이 비-면역글로불린 폴리펩티드의 일부분, 특히 비정형 케모카인 수용체 (ACKR), 예컨대 D6 케모카인 유인 수용체의 세포외 부분을 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다.

실시예 1에 기술된 D6-D_H 표적화 벡터의 올바른 조립 및 D6 DNA 단편의 BAC DNA의 당양성 클러스터 내로의 삽입을 시퀀싱 및 표 6에 기술된 프라이머를 사용하여 표적화 벡터의 구축을 통해 중합효소 연쇄 반응에 의해 확인하였다. 이어서, 중합효소 연쇄 반응에 의해 확인된 표적화된 BAC DNA를 전기천공을 통해 F1 하이브리드 (129S6SvEvTac/C57BL6NTac) 마우스 배아 줄기 (ES) 세포 내로 도입한 후 선택 배지에서 배양하였다. 전기천공을 위해 사용한 ES 세포는 설치류 면역글로불린 중쇄 불변 영역 (예컨대, IgM)과 작동가능하게 연결되어 있는 인간 V_H 및 J_H 유전자 분절을 포함하는 게놈을 가지고 있고, 인간 D_H 영역의 전부 또는 일부가 결여되어 있고 (즉, 결실됨), 하나 이상의 쥐 Adam6 유전자를 암호화하는 삽입된 서열을 함유하고 있다 (예컨대, 미국특허 제8,642,835호 및 제8,697,940호 참조). 전기천공 후 10일차에 약물-내성 콜로니를 피킹 (picking)하고 TAQMAN™에 의해 스크리닝 하고 이전에 기술된 바와 같이 (Valenzuela 외, 전술됨; Frendewey, D. 외, 2010, Methods Enzymol. 476:295-307), D6 코딩 서열의 면역글로불린 가변 영역의 다양성 클러스터 내로의 적절한 통합을 탐지하는 프라이머/프로브 세트를 사용하여 (표 7 [F: 정방향 프라이머, P: 프로브, R: 역방향 프라이머] 및 도 5) 정확한 표적화를 위한 핵형분석을 하였다.

VELOCIMOUSE® 방법 (DeChiara, T.M. 외, 2010, Methods Enzymol. 476:285-294; Dechiara, T.M., 2009, Methods Mol. Biol. 530:311-324; Poueymirou 외, 2007, Nat. Biotechnol. 25:91-99)을 사용하였으며, 여기서, 표적화된 ES 세포를 미압축된 8-세포 단계의 Swiss Webster 배아 내로 주입하여 조작된 D_H 영역을 위해 건강하고 완전한 ES 세포-유래 F0 세대 마우스 이형접합체를 생산하고 D6 코딩 서열의 재조합으로부터 생성된 CDR3 영역을 포함하는 중쇄 가변 영역을 함유하는 항체를 발현시켰다. F0 세대 이형접합체 수컷을 C57Bl6/Ntac 암컷과 교배시켜 F2 세대 동형접합체 생산을 위해 교배시킬 F1 이형접합체 및 표현형 분석을 위한 야생형 마우스를 생산하였다.

예컨대, ES 세포 단계 또는 배아 단계에서 제거되지 않은 표적화 구조체에 의해 도입된 임의의 lox 선택된 카세트를 제거하기 위해, 재조합 효소의 후속 첨가에 의해 (예컨대, Cre 처리에 의해) 또는 Cre deleter 마우스 계통 (예컨대, 국제 특허 출원 공개 제WO 2009/114400호 참조)과의 교배에 의해 약물 선택 카세트를 선택적으로 제거할 수 있다. 선택적으로, 선택 카세트를 마우스 내에 유지시킬 수 있다.

종합하면, 본 실시예는 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 설치류 (예컨대, 마우스)를 설명하며, 여기서, 조작된 D_H 영역은 각각이 비정형 케모카인 수용체 (ACKR) 예컨대 D6 케모카인 유인 수용체의 세포외 부분을 암호화하는 하나 이상의 뉴클레오티드 서열의 포함을 특징으로 한다. D6 코딩 서열을 전통적인 D_H 분절의 위치 내로 삽입하기 위한 본원에 기술된 전략은 다수의 항체를 발현하는 설치류의 구축을 가능케 하며, 상기 항체 각각은 D6 코딩 서열의 재조합으로부터 생산된 중쇄 CDR3을 포함한다. 인간 V_H 및 J_H 분절의 존재를 활용하여, 본원에 기술된 설치류는 하나 이상의 CCL에 결합하는 다양성을 특징으로 하는 인간 항체-기반 치료제의 생산을 위한 생체 내 시스템을 제공하고, 일부 구현예에서, 인간 용도의 항체-기반 항-염증 약물을 제공한다.

프라이머 명칭	서열 (5'-3')	크기 (bp)
DH1166/네오마이신 카세트 연결
M13 역방향	CACAGGAAACAGCTATGACC (서열번호 113)	412
3' ub pro- 200	CCAGTGCCCTAGAGTCACCCA (서열번호 114)	412
5' neo 탐지	CTCCCACTCATGATCTATAGA (서열번호 115)	409
3' 위 탐지 hD_H1-1-hD_H6-6	CTGGGGCTCGCTTTAGTTG (서열번호 116)	409

pBACe3.6 + DNA 단편 등온 조립
5' 위 탐지 SacB	TGATAGCCGTTGTATTCAGC (서열번호 117)	693
3' ub pro-200	CCAGTGCCCTAGAGTCACCCA (서열번호 118)	693
5' 아래 탐지 hD_H1-20- hD_H1-26	GCCATTTCTGTCTGCATTCG (서열번호 119)	444
5' cm 아래 탐지	GGTTCATCATGCCGTTTGTGA (서열번호 120)	444

DH120126 DNA 단편 시퀸싱용 프라이머
HD-1 seq 정방향	TGGGCTCGTAGTTTGACGTG (서열번호 121)	-
HD-1 seq 역방향	TTACCCACACTTCACGCACG (서열번호 122)	-
HD-2 seq 정방향	TTAAACGACGCCTCGAATG (서열번호 123)	-
HD-2 seq 역방향	GCAACCATTCGTTGTAGTAG (서열번호 124)	-
HD-3 seq 정방향	CTAACGCAGTCATGTAATGC (서열번호 125)	-
HD-3 seq 역방향	GACTGTCACCCAGCATTAC (서열번호 126)	-

표적화 벡터 post PI-SceI/I-CeuI 연결
hIgHD 위 탐지	CGTCGCCTCTACGGGAAATC (서열번호 127)	695
3' ub pro-200	CCAGTGCCCTAGAGTCACCCA (서열번호 128)	695
5' 아래 탐지 hD_H1-20- hD_H1-26	GCCATTTCTGTCTGCATTCG (서열번호 129)	553
hIgHD 아래 탐지	AAACACCACGTAGGATTTACGC (서열번호 130)	553

프라이머/프로브		서열 (5'-3')
Hyg	F	TGCGGCCGATCTTAGCC (서열번호135)
	P	ACGAGCGGGTTCGGCCCATTC (서열번호136)
	R	TTGACCGATTCCTTGCGG (서열번호137)
hIgH DH-1	F	CGGGTCACTGCCATTTCTG (서열번호138)
	P	TCTGCATTCGCTCCCAGCGC (서열번호139)
	R	TCTGCGGCATGAACCCAAT (서열번호140)
hIgH DH-4	F	TGGCCAGAACTGACCCTAC (서열번호141)
	P	ACCGACAAGAGTCCCTCAGG (서열번호142)
	R	GGAGTCGGCTCTGGATGTG (서열번호143)
HD jxn-1	F	GGAGCCAGGCAGGACACA (서열번호144)
	P	TGGGCTCGTAGTTTGACGT (서열번호145)
	R	GGGACTTTCTTACCCACACTTCA (서열번호146)
HDjxn-2	F	GGTCCCGAGCACTCTTAATTAAAC (서열번호147)
	P	CCTCGAATGGAACTAC (서열번호148)
	R	GGGAGAGCAACCATTCGTTGT (서열번호149)
HDjxn-3	F	CCGAGCACCGATGCATCTA (서열번호150)
	P	CGCAGTCATGTAATGC (서열번호151)
	R	GGGAGGCGAACTGACTGTCA (서열번호152)
Neo	F	GGTGGAGAGGCTATTCGGC (서열번호153)
	P	TGGGCACAACAGACAATCGGCTG (서열번호154)
	R	GAACACGGCGGCATCAG (서열번호155)
hIgH1	F	CAGTCCCGTTGATCCAGCC (서열번호156)
	P	CCCATCAGGGATTTTGTATCTCTGTGGACG (서열번호157)
	R	GGATATGCAGCACTGTGCCAC (서열번호158)
hIgH9	F	TCCTCCAACGACAGGTCCC (서열번호159)
	P	TCCCTGGAACTCTGCCCCGACACA (서열번호160)
	R	GATGAACTGACGGGCACAGG (서열번호161)
hIgH31	F	ATCACACTCATCCCATCCCC (서열번호162)
	P	CCCTTCCCTAAGTACCACAGAGTGGGCTC (서열번호163)
	R	CACAGGGAAGCAGGAACTGC (서열번호164)
mIgHp2	F	GCCATGCAAGGCCAAGC (서열번호165)
	P	CCAGGAAAATGCTGCCAGAGCCTG (서열번호166)
	R	AGTTCTTGAGCCTTAGGGTGCTAG (서열번호167)
mIgHA8	F	CCCCACAGCAAATCACAACC (서열번호168)
	P	ATGCAGTTGTCACCCTTGAGGCCATTC (서열번호169)
	R	TGTTTCCCAGGCGTCACTG (서열번호170)
mIgHA1	F	CTCAGTGATTCTGGCCCTGC (서열번호171)
	P	TGCTCCACAGCTACAAACCCCTTCCTATAATG (서열번호172)
	R	GGATGATGGCTCAGCACAGAG (서열번호173)
mIgHA7	F	TGGTCACCTCCAGGAGCCTC (서열번호174)
	P	AGTCTCTGCTTCCCCCTTGTGGCTATGAGC (서열번호175)
	R	GCTGCAGGGTGTATCAGGTGC (서열번호176)
D_H6-25	F	GTGTCACAGTCGGGCATA (서열번호177)
	P	CCACGGCTACCACAATGACACTGG (서열번호178)
	R	CCTTCGGCTGACTTGGGATG (서열번호179)

실시예 3. 면역글로불린 중쇄 가변 영역 내에 하나 이상의 독소 펩티드의 뉴클레오티드 코딩 서열을 포함하는 조작된 다양성 클러스터의 구축

본 실시예는 비-인간 동물 예컨대 설치류 (예컨대, 마우스)의 게놈 내로의 삽입을 위한 표적화 벡터의 예시적인 구축 방법을 설명한다. 특히, 본 실시예에 기술된 방법은 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 설치류를 생산하기 위해 설치류 (예컨대, 마우스) 배아 줄기 (ES) 세포의 게놈 내로의 삽입을 위한 표적화 벡터의 생산을 보여주며, 여기서, 조작된 D_H 영역은 각각이 비-면역글로불린 폴리펩티드의 일부를 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 본 실시예에서, 2개의 독소 (예컨대, 코노독소 예컨대 μ-코노독소, 및 독거미 독소 예컨대 ProTxII)의 코딩 서열을 면역글로불린 중쇄 가변 영역 내로의 삽입을 위한 표적화 벡터의 구축에 사용하였다. 후술되는 바와 같이, 상기 코딩 서열을 전통적인 D_H 유전자 분절 대신 중쇄 가변 (V_H) 및 중쇄 결합 (J_H) 분절과 작동가능하게 연결되도록 위치시켜, VDJ 재조합 시, 상기 코딩 서열로부터 생산된 CDR3를 갖는 항체가 발현되도록 하였다.

면역글로불린 중쇄 가변 영역 내로 삽입을 위한 μ-코노독소 및 독거미 독소 (예컨대, ProTxII)로부터의 코딩 서열을 함유하는 표적화 벡터를 상기 실시예 1에 기술된 바와 같이 생성하였다. 본원에 기술된 방법은 임의의 원하는 코노독소 (예컨대, α-코노독소, δ-코노독소, κ-코노독소, μ-코노독소 및/또는 ω-코노독소), 독거미 독소 (예컨대, ProTxI, ProTxII, Huwentoxin-IV [HWTX-IV], 등)로부터 유래된 임의의 코딩 서열 세트 또는 원하는 코딩 서열 (또는 코딩 서열 단편)의 조합을 활용하여 이용될 수 있다. μ-코노독소 및 독거미 독소로부터의 코딩 서열을 사용하여 표적화 벡터를 구축하기 위한 예시적인 전략이 도 7a 및 도 7b에 도시되어 있다.

요컨대, 몇몇개의 μ-코노독소 (μCTX) 및 독거미 독소 (ProTxII) 코딩 서열을 각각 함유하는 일련의 4개의 DNA 단편을 드 노보 DNA 합성 (표 8; Blue Heron Biotech, Bothell, WA)에 의해 제작하였다. 실시예 1에 기술된 바와 같이, 다양한 제한 효소 부위 및/또는 중첩 영역을 각각의 DNA 단편 말단에 포함시켜 후속 클로닝이 일렬로 되게 하였다. 총 26개의 독소 코딩 서열을, 조작된 D_H 영역을 구축하는데 사용하였으며, 이는 전체의 D_H 코딩 서열의 치환 및 D_H 코딩 서열 내로의 삽입을 포함하였다 (즉, D_H를 부분적으로만 치환함). 해당 독소 코딩 서열을 사용하여 D_H 위치 1-26, 2-2, 2-8, 2-15, 2-21, 3-3, 3-9, 3-10, 3-16, 및 3-22에서 독소 서열 코딩을 삽입한 반면, D_H 위치 1-1, 1-7, 1-14, 1-20, 4-4, 4-11, 4-17, 4-23, 5-5, 5-12, 5-18, 5-24, 6-6, 6-13, 6-19 및 6-25에서 D_H 서열을 독소 코딩 서열로 치환하였다 (표 8 참조). 삽입의 경우, 독소 서열을 개방형 해독 틀 2 (ORF2)에 삽입하고 D_H 공통 서열에 의해 측부에 위치 시켰다 (예컨대, 도 2 참조). 천연 측부 D_H 서열을 보유하는 것은 천연의 유연한 링커 서열 및/또는 코딩된 독소 펩티드를 환형화시키기 위한 D_H2 분절 내의 이황화 결합의 용도를 제공한다. 실시예 1에 기술된 D6 코딩 서열을 사용하여 구축된 조작된 D_H 영역과 대조적으로, 독소 코딩 서열을 포함하는 D_H 영역의 구축에서 D_H6-25를 전장 길이의 mCTX KIIIA (μCTX-KIIIA fl; 서열번호 228, 표 8 참조)로 치환하였다.

실시예 1에 기술된 바와 같이, 독소 코딩 서열 각각의 핵산 서열은 이러한 핫스팟 서열을 자연적으로 함유하지만, B 세포 수용체의 클론 선택 동안 체세포 과돌연변이에 대한 가능성을 최적화하기 위해 인공적인 핫스팟 서열을 드 노보 합성 전에 인 실리코에서 선택된 독소 코딩 서열 내로 도입하였다 (도 6a-6l 참조). 또한, 보다 우수한 재조합 빈도 및 동등한 사용을 가능케 하기 위해 드 노보 합성 전에 인 실리코에서 최적화된 RSS로 각각의 독소 코딩 서열을 설계하였다 (도 2). 독소 DNA 단편의 조립체를 실시예 1에 기술된 바와 같이 제조하였다 (도 7a 및 7b 참조).

대안적으로, 전술된 독소 DNA 단편은 전술된 바와 상이하지만 당업계에 공지된 분자 기법을 사용하여 조립될 수 있다. 예컨대, 독소 DNA 단편은 일렬로 배열되어 있으므로, 다양한 상이한 설계 (예컨대, 코딩 서열 순서)가 원하는 바와 같은 단편의 말단 내로 설계된 상이한 제한 부위/중첩 영역의 사용을 통해 달성될 수 있다. 순차적인 연결에 의해 전술된 독소 DNA 단편의 조립의 예시적인 대안적인 방법이 도 8a 및 8b에 도시되어 있다.

조작된 다양성 클러스터를 함유하는 면역글로불린 중쇄 좌위를 함유하는 변형된 ES 세포를 생산하기 위해, 전술된 TX-D_H 표적화 벡터를 마우스 배아 줄기 (ES) 세포 내로 도입하였다.

DNA 단편 (크기)	독소 코딩 서열 명칭 (서열번호)	D_H 위치
TX-DH1166 (~9,812 bp) 서열번호 232	μCTX-SmIIIA C1SC4S (180) μCTX-CSSRWC (182) μCTX-KIIIA 소형 (184) μCTX-PIIIA C1SC4S (186) ProTxII C1SC4S (188) μCTX-KIIIA C1SC4S (190)	D_H1-1 D_H2-2 D_H3-3 D_H4-4 D_H5-5 D_H6-6
TX-DH17613 (~9,512 bp) 서열번호 233	μCTX-SmIIIA 소형 (192) μCTX-RSRQ 삽입 (194) μCTX-KIIIA 중형 (196) μCTX-SmIIIA 소형 (198) μCTX-PIIIA 소형 (200) ProTxII C2SC5S (202) μCTX-KIIIA 소형 (204)	D_H1-7 D_H2-8 D_H3-9 D_H3-10 D_H4-11 D_H5-12 D_H6-13
TX-DH114619 (~9,691 bp) 서열번호 234	μCTX-SmIIIA fl (206) μCTX-SSRW 삽입 (208) μCTX-SmIIIA 중형 (210) μCTX-PIIIA 중형 (212) ProTxII C3SC6S (214) μCTX-KIIIA 중형 (216)	D_H1-14 D_H2-15 D_H3-16 D_H4-17 D_H5-18 D_H6-19
TX-DH120126 (~11,896 bp) 서열번호 235	μCTX-SmIIIA 중형 (218) μCTX-CRSRQC (220) μCTX-PIIIA 중형 (222) μCTX-PIIIA fl (224) ProTxII fl (226) μCTX-KIIIA fl (228) μCTX-PIIIA 소형 (230)	D_H1-20 D_H2-21 D_H3-22 D_H4-23 D_H5-24 D_H6-25 D_H1-26

실시예 4. 면역글로불린 중쇄 가변 영역 내에 하나 이상의 독소 펩티드의 뉴클레오티드 코딩 서열을 포함하는 조작된 다양성 클러스터를 갖는 설치류의 생산

본 실시예는 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 비-인간 동물 (예컨대, 설치류)의 생산을 보여주며, 여기서, 상기 조작된 D_H 영역은 비-면역글로불린 폴리펩티드의 일부분, 특히 독소 예컨대 코노독소 (예컨대, μ-코노독소), 독거미 독소 (예컨대, ProTxII) 또는 이들의 조합을 각각 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다.

실시예 3에 기술된 TX-D_H 표적화 벡터의 올바른 조립 및 독소 DNA 단편의 BAC DNA의 다양성 클러스터 내로의 표적화된 삽입을 시퀀싱 및 표 6에 기술된 프라이머를 사용하여 표적화 벡터의 구축을 통해 중합효소 연쇄 반응에 의해 확인하였다. 이어서, 중합효소 연쇄 반응에 의해 확인된 표적화된 BAC DNA를 전기천공을 통해 F1 하이브리드 (129S6SvEvTac/C57BL6NTac) 마우스 배아 줄기 (ES) 세포 내로 도입한 후 선택 배지에서 배양하였다. 전기천공을 위해 사용한 ES 세포는 설치류 면역글로불린 중쇄 불변 영역 (예컨대, IgM)과 작동가능하게 연결되어 있는 인간 V_H 및 J_H 유전자 분절을 포함하는 게놈을 가지고 있고, D_H 영역이 결여되어 있고 (즉, 결실됨), 하나 이상의 쥐 Adam6 유전자를 암호화하는 삽입된 서열을 함유하고 있다 (예컨대, 미국특허 제8,642,835호 및 제8,697,940호 참조). 전기천공 후 10일차에 약물-내성 콜로니를 피킹하고 TAQMAN™에 의해 스크리닝 하고 이전에 기술된 바와 같이 (Valenzuela 외, 전술됨; Frendewey, D. 외, 2010, Methods Enzymol. 476:295-307), 독소 코딩 서열의 면역글로불린 가변 영역의 다양성 클러스터 내로의 적절한 통합을 탐지하는 프라이머/프로브 세트를 사용하여 (표 7 및 도 5) 정확한 표적화를 위한 핵형분석을 하였다.

VELOCIMOUSE® 방법 (DeChiara, T.M. 외, 2010, Methods Enzymol. 476:285-294; Dechiara, T.M., 2009, Methods Mol. Biol. 530:311-324; Poueymirou 외, 2007, Nat. Biotechnol. 25:91-99)을 사용하였으며, 여기서, 표적화된 ES 세포를 미압축된 8-세포 단계의 Swiss Webster 배아 내로 주입하여 조작된 D_H 영역을 위해 건강하고 완전한 ES 세포-유래 F0 세대 마우스를 이형접합체를 생산하고 독소 코딩 서열의 재조합으로부터 생성된 CDR3 영역을 포함하는 중쇄 가변 영역을 함유하는 항체를 발현시켰다. F0 세대 이형접합체 수컷을 C57Bl6/Ntac 암컷과 교배시켜 F2 세대 동형접합체 생산을 위해 교배시킬 F1 이형접합체 및 표현형 분석을 위한 야생형 마우스를 생산하였다.

종합하면, 본 실시예는 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 설치류 (예컨대, 마우스)를 설명하며, 여기서, 조작된 D_H 영역은 독소 펩티드 예컨대 μ-코노독소, ProTxII의 일부 또는 이들의 조합을 각각 암호화하는 하나 이상의 뉴클레오티드 서열의 포함을 특징으로 한다. 독소 코딩 서열을 전통적인 D_H 분절의 위치 내로 삽입하기 위한 본원에 기술된 전략은 독소 코딩 서열의 재조합으로부터 생성된 중쇄 CDR3을 함유하도록 구성된 항체를 발현하는 설치류의 구축을 가능케 한다. 인간 V_H 및 J_H 분절의 존재를 활용하여, 본원에 기술된 설치류는 이온 채널 (예컨대, 전압-의존성 소듐 채널 예컨대, Na_V1.7)로의 결합을 지시하는 다양성을 특징으로 하는 인간 항체-기반 치료제의 생산을 위한 생체 내 시스템을 제공하며, 일부 구현예에서, 인간 용도의 항체-기반 항-통증 약물을 제공한다.

실시예 5. 조작된 다양성 클러스터를 갖는 설치류의 표현형 평가

본 실시예는 조작된 중쇄 다양성 (D_H) 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 설치류 (예컨대, 마우스)에서 다양한 면역 세포 집단의 특징을 보여주며, 여기서, 상기 조작된 D_H 영역은 각각이 비-면역글로불린 폴리펩티드의 일부를 암호화하는 하나 이상의 뉴클레오티드 서열을 포함한다. 본 실시예에서, 실시예 3에 기술된 바와 같이 독소 코딩 서열 (예컨대, μ-코노독소 및 독거미 독소)를 포함하는 조작된 D_H 영역에 대한 설치류 동형접합체를 수 개의 형광-표지 항체를 사용하여 수확된 비장 및 골수에서 면역 세포를 확인하기 위해 유동 세포 계측법으로 분석하였다. 본 실시예는 또한 실시예 1에 기술된 바와 같은 ACKR2 (D6 케모카인 유인 수용체로도 공지됨)의 세포외 부분의 코딩 서열을 포함하는 조작된 D_H 영역에 대한 마우스 이형접합체의 수확된 비장 및 골수에서의 면역 세포의 확인을 보여준다. 후술되는 바와 같이, 본원에 기술된 조작된 D_H 영역을 함유하는 마우스는 대조군의 조작된 마우스와 비교하여, 비장 및 골수 구획에서 유사한 수준의 B 세포를 보여준다. 중요하게도, 본 실시예는 또한 본원에 기술된 바와 같은 조작된 D_H 영역을 함유하는 마우스가 B-세포 면역 반응의 임의의 결함 또는 결핍이 없는 B 세포 발달 및 성숙을 보여주며, 삽입된 코딩 서열 및 인접한 면역글로불린 유전자 분절 (즉, 인간 V_H 및 J_H)의 재배열로부터 생성된 CDR3 영역을 함유하는 항체를 생산함을 보여준다.

요컨대, VELOCIMMUNE® 마우스 (n=3, 26% C57BL/6 22% 129S6/SvEvTac 50% Balb/cAnNTac; 예컨대, 미국특허 제8,502,018호 및 제8,642,835호 참조) 및 6579ho/1293ho 마우스 ("TX-D_H ho", n=3; 38% C57BL/6NTac 36% 129S6/SvEvTac 25% Balb/cAnNTac; 다수의 인간 V_H, 전통적인 D_H 분절 대신 독소 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자[예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 면역글로불린 중쇄 좌위; 및 설치류 κ 경쇄 인핸서를 포함하여 설치류 Cκ 영역 유전자에 작동가능하게 연결된 인간 Vκ 및 Jκ 유전자 분절을 함유하는 동형접합체 면역글로불린 κ 경쇄 좌위에 대한 마우스 동형접합체)로부터 비장 및 대퇴골을 수확하였다. 원심분리에 의해 대퇴골로부터 골수를 수확하였다. 비장 및 골수 준비로부터의 적혈구 세포를 ACK 세포용해 완충액 (Gibco)으로 세포용해하고 2% FBS를 포함하는 1xPBS로 세척하였다. 단리된 세포 (1x10⁶)를 선택된 항체 칵테일과 함께 +4℃에서 30분 동안 인큐베이션하였다: 염색 1: 랫트 항-마우스 CD43-FITC (Biolegend 121206, 클론 1B11), 랫트 항-마우스 c-kit-PE (Biolegend 105808, 클론 2B8), 랫트 항-마우스 IgM-PeCy (eBiosciences 25-5790-82, 클론 II/41), 랫트 항-마우스 IgD-PerCP-Cy5.5 (Biolegend 405710, 클론 11-26c.2a), 랫트 항-마우스 CD3-PB (Biolegend 100214, 클론 17-A2), 랫트 항-마우스 B220-APC (eBiosciences 17-0452-82, 클론 RA3-6B2), 및 랫트 항-마우스 CD19-APC-H7 (BD 560143 클론 1D3). 염색 2: 랫트 항-마우스 카파-FITC (BD 550003, 클론 187.1), 랫트 항-마우스 람다-PE (Biolegend 407308, 클론 RML-42), 랫트 항-마우스 IgM-PeCy (eBiosciences 25-5790-82, 클론 II/41), 랫트 항-마우스 IgD-PerCP-Cy5.5 (Biolegend 405710, 클론 11-26c.2a), 랫트 항-마우스 CD3-PB (Biolegend 100214, 클론 17-A2), 랫트 항-마우스 B220-APC (eBiosciences 17-0452-82, 클론 RA3-6B2), 및 랫트 항-마우스 CD19-APC-H7 (BD 560143 클론 1D3). 염색 3: 랫트 항-마우스 CD23-FITC (Biolegend 101606 클론 B3B4), 랫트 항-마우스 CD93 (Biolegend 136504, 클론 AA4.1), 랫트 항-마우스 IgM-PeCy (eBiosciences 25-5790-82, 클론 II/41), 랫트 항-마우스 IgD-PerCP-Cy5.5 (Biolegend 405710, 클론 11-26c.2a), 랫트 항-마우스 CD19-V450 (BD 560375, 클론 1D3), 랫트 항-마우스 CD21/35-APC (BD 558658, 클론 7G6), 및 랫트 항-마우스 B220-APC-eFl780 (eBioscences 47-0452-82, 클론 RA3-6B2). 염색한 후에, 세포를 세척하고 2% 포름알데히드로 고정시켰다. BD LSRFORTESSA™ 유동 세포 계측기 상에서 데이터 수집을 수행하고 FLOWJO

소프트웨어로 분석하였다. 대표적인 결과를 도 9a-9d 및 도 10a-10d에 도시하였다.

유사한 실험에서, VELOCIMMUNE® 마우스 (n=3, 26% C57BL/6 23% 129SvEvTac 51% Balb/cAnNTac; 예컨대, 미국특허 제8,502,018호 및 제8,642,835호 참조) 및 6590het마우스 ("D6-D_H het", n=3; 75% C57BL/6 25% 129SvEvTac; 다수의 인간 V_H, 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자 [예컨대, 미국특허 제8,642,835호 및 제8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 면역글로불린 중쇄 좌위에 대한 마우스 이형접합체)로부터 비장 및 대퇴골을 수확하고; 유동 세포 계측법으로 분석하였다 (전술된 바와 같음). 대표적인 결과를 도 11a-11d 및 도 12a-12d에 도시하였다.

또 다른 유사한 실험에서, VELOCIMMUNE® 마우스 (n=3, 38% C57BL/6 36% 129SvEvTac 25% Balb/cAnNTac; 예컨대, 미국특허 제8,502,018호 및 제8,642,835호 참조) 및 6590ho/1293ho 마우스 ("D6-D_H ho", n=3; 38% C57BL/6 36% 129SvEvTac 25% Balb/cAnNTac) 다수의 인간 V_H, 하나 이상의 전통적인 D_H 분절 대신 D6 케모카인 유인 수용체 코딩 서열을 포함하는 조작된 D_H 분절, 및 설치류 중쇄 인핸서 및 조절 영역을 포함하여 설치류 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절, 및 하나 이상의 쥐 Adam6 유전자 [예컨대, 미국특허 제8,642,835호 및8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 면역글로불린 중쇄 좌위에 대한 마우스 동형접합체; 및 설치류 κ 경쇄 인핸서를 포함하여 설치류 Cκ 영역 유전자에 작동가능하게 연결된 인간 Vκ 및 Jκ 유전자 분절을 함유하는 면역글로불린 κ 경쇄 좌위에 대한 동형접합체)로부터 비장 및 대퇴골을 수확하고 유동 세포 계측법으로 분석하였다 (전술된 바와 같음). 대표적인 결과를 도 13a-13d 및 도 14a-14d에 도시하였다.

결과는 TX-D_H ho 마우스가 대조군의 조작된 마우스와 비교하여 비장 및 골수 구획에서 유사한 퍼센트의 B 세포를 보여줌을 나타낸다. 일부 TX-D_H ho 마우스의 경우, 보다 높은 퍼센트의 Igλ 양성 세포가 관찰되었다 (예컨대, 도 9c 및 10d 참조). 전반적으로, 비장에서의 B 세포 성숙은 대조군의 조작된 마우스와 비교할 때 TX-D_H ho 마우스에서의 정상적인 진행을 입증하였다.

D6-D_H het 마우스는 또한 비장 및 골수 구획 둘 모두에서 유사한 B 세포 퍼센트를 나타냈다 (도 11a-12d). D6-D_H het 마우스는 또한 대조군 마우스에 비해 유사한 경쇄 비율을 갖는 것으로 나타났다 (도 11c 및 도 12d). D6-D_H het는 또한 B 세포의 전반적인 정상 발달 및 성숙을 나타냈다.

실시예 6. 조작된 D _H 영역에서 코딩 서열의 인간 유전자 사용 및 재배열

본 실시예는 차세대 시퀀싱 (NGS)-항체 레파토리 분석을 사용하여 본원에 기술된 바와 같이 조작된 D_H 영역을 함유하는 설치류에서의 인간 V(D)J 유전자 분절의 사용을 보여준다. 특히, 독소 코딩 서열을 함유하는 조작된 D_H 영역에 대한 마우스 동형접합체 및 ACKR2 코딩 서열을 함유하는 조작된 D_H 영역에 대한 마우스 이형접합체의 분류된 비장 및 미분류된 골수로부터 단리된 RNA 상에서 RT-PCR 시퀀싱을 수행하였다. 후술되는 바와 같이, 전통적인 D_H 분절 대신 독소 코딩 서열을 함유하는 조작된 D_H 영역을 포함하는 마우스로부터 분석된 서열에서 모든 조작된 D_H 분절이 관찰되었다. 또한 후술되는 바와 같이, ACKR2 (D6 케모카인 유인 수용체)의 세포외 부분의 코딩 서열을 함유하는 조작된 D_H 영역을 포함하는 마우스로부터 분석된 서열에서 대다수의 (즉, 25개 중 16개) 조작된 D_H 분절이 관찰되었다.

요컨대, 6579ho/1293ho 마우스 ("TX-D_H ho", n=3; 상기)로부터 비장 및 골수를 수확하였으며, B 세포는 마우스 항-CD19 자성 비드 및 MACS® 컬럼 (Miltenyi Biotech)을 사용하여 자성 세포 분류에 의해 총 비장 세포로부터 양성적으로 풍부하였다. RNeasy Plus RNA 단리 키트 (Qiagen)를 사용하여 제조사의 설명서에 따라 분류된 비장세포 및 미분류된 총 골수 중의 풍부한 B 세포로부터 총 RNA를 단리하였다. 이어서, SuperScript III 역전사 효소 (Thermo Fisher Scientific) 및 마우스 IgM 불변 영역 프라이머 (표 9, IgM RT)를 사용하여 제조사의 설명서에 따라 총 RNA로부터 면역글로불린 중쇄(μ 쇄, IgM) cDNA를 합성하였다. V_H 리더 서열과의 어닐링을 위해 설계된 V_H 패밀리-특이적 프라이머 (표 9, VH 멀티-1, 2, 3, 4, 5 & 6), 및 IgM 불변 영역과의 어닐링을 위해 설계된 프라이머 (표 9, IgM PCR1)의 혼합물을 사용하여 다중 (multiplex) PCR 전략을 사용하여 IgM cDNA를 증폭하였다. 약 450 내지 800bp 범위의 PCR 산물을 Pippin Prep (SAGE Science)을 사용하여 단리한 다음 PCR2 프라이머 (표 9, PCR2-F & PCR2-R, "XXXXXX"는 시퀀싱 라이브러리를 구별하고 동시에 시퀀싱 다중 라이브러리를 가능케 하기 위한 6nt 인덱스임)를 사용하여 2차 PCR을 수행하여 시퀀싱 어댑터 및 인덱스를 부착하였다. 약 490bp 내지 800bp 범위의 PCR 산물을 단리하고, 정제하고, 서열분석을 위해 MiSeq 시약 키트 v3 (2x300 회)을 사용하여 MiSeq 서열분석기 (Illumina) 상에 로딩하기 전에 KAPA 라이브러리 정량화 키트 (KAPA Biosystems)를 사용하여 qPCR로 정량화하였다. 레파토리 라이브러리 구축을 위해 사용한 선택된 프라이머 서열이 표 9에 기술되어 있다.

생물정보학적(bioinformatic) 분석을 위해, 미가공 (Raw) Illumina 서열을 품질, 길이 및 상응하는 불변 영역 유전자 프라이머와의 일치를 기준으로 하여 역-다중화하고 필터링하였다. 중첩된 쌍을 이룬 말단 판독값을 맞춤형 사내 파이프라인을 사용하여 병합하고 분석하였다. 상기 파이프라인은 재배열된 경쇄 서열을 인간 생식선 V_H 및 J_H 유전자 분절 데이터베이스에 정렬하기 위한 IgBLAST (NCBI, v2.2.25+)의 국지적 설치를 사용하였고, 정지 코돈의 존재와 함께 생산적 및 비생산적 결합을 나타냈다. CDR3 서열 및 예상되는 비-주형 뉴클레오티드를 국제 면역원성 정보 시스템 (Immunogenetics Information System, IMGT)에서 정의한 바운더리를 사용하여 추출하였다. 대표적인 결과를 표 10 (각각의 V_H 패밀리-특이적 프라이머 혼합물을 사용한 서열 판독 중 독소 코딩 서열에 대한 총 일치) 및 도 15-17에 나타냈다.

결과는 분석된 대다수의 서열이 V_H 영역 서열의 CDR3 영역 내에 독소 서열을 함유하고 있음을 보여준다. 특히, 전통적인 D_H 분절 대신에 다중 독소 코딩 서열을 함유하는 조작된 D_H 영역을 포함하는 마우스에서 생산적인 재배열에 해당하는 약 87%의 서열은 CDR3 영역 내에 독소 아미노산 서열을 함유하였다. 또한, 이러한 마우스에서 전통적인 D_H 분절의 자리 내에 위치한 모든 26개의 독소 코딩 서열이 다양한 빈도로 검출되었다. 관찰된 가장 많이 사용된 독소 코딩 서열은 짧은 μCTX 4 (4)-아미노산 루프 SmIIIa (D_H 위치 D_H2-15), μCTX-SmIIIA 중형 삽입 (D_H 위치 D_H3-16) 및 μCTX-PIIIA 중형 (D_H 위치 D_H3-22)였다.

유사한 실험에서, 인간 V_H, 조작된 D_H 및 인간 J_H 분절 사용을 전술된 바와 같은 차세대 시퀀싱 (NGS)-항체 레파토리 분석을 사용하여 6590het 마우스 ("D6-D_H het", n=3; 전술됨)에서 분석하였다. 분류된 비장 및 미분류된 골수로부터 단리된 RNA 상에서 전술된 바와 같이 다중 PCR 전략을 사용하여 RT-PCR 시퀀싱을 수행하였다. 대표적인 결과를 표 11 (골수 및 비장으로부터 증폭된 RNA에서 뉴클레오티드 (NT) 서열 중의 인-프레임 아미노산 (AA) 서열의 수), 표 12 (비장 및 골수로부터 증폭된 RNA에서 선택된 D6 코딩 서열의 퍼센트 [모든 V_H-패밀리를 합한 것, 정량적 V_H 사용은 반영되지 않음]) 및 도 18 내지 20에 나타냈다.

결과는 골수 및 비장으로부터 증폭된 RNA에서 사용된 대부분의 D6 코딩 서열의 길이가 약 30 내지 40 뉴클레오티드임을 보여준다. 특히, 가장 긴 (예컨대, Nterm+EC3 (216 nt)) 및 가장 짧은 (예컨대, EC1-N (9 nt)) D6 코딩 서열은 D6-D_H het 마우스로부터 분석된 서열에서 초기에 관찰되지 않았다. 본 발명자는 조작된 D_H 영역으로부터 D6 코딩 서열의 사용을 평가할 때 특정 한계를 관찰하였다. 예컨대, 본 발명자는 D6 코딩 서열보다 긴 전장 (또는 전장보다 긴 것) (예컨대, D6 Nterm+EC3, D_H 위치 D_H4-4; 서열번호 33)을 함유하는 IgM 서열이 겔 크기 선택 단계 (상기 참조)로 인해 서열로부터 배제될 가능성이 있고, 보다 짧은 D6 코딩 서열 (예컨대, D6 EC1, D_H 위치 D_H5-5; 서열번호 3)이 트리밍 선택 단계로 인해 배제될 가능성이 있음을 주목하였다. 그러나 보다 짧은 D6 코딩 서열의 경우, 서열의 수동 검사는, 실제로, 이러한 D6 코딩 서열이 증폭된 RNA로부터 수득된 서열 중에 존재한다는 것을 나타냈다. 또한, 본 발명자들은 선택된 J_H 분절 (예컨대, J_H1) 및 D6 코딩 서열 사이의 유사성으로 인해 데이터베이스와 비교할 때 서열의 부정확한 정렬을 관찰하였다. 이러한 서열 유사성은 보다 짧은 D_H 서열의 동정과 특정 데이터베이스에 의한 불분명한 주석의 가능성을 초래하였다. 그 결과, 몇몇 서열은 수동으로 수행되는 정렬을 사용하는 개별적인 분석을 필요로 하였다. D6-D_H het 마우스로부터 분석된 모든 서열 중에, 약 50 내지 60%의 아미노산 서열이 인-프레임이고, 증폭된 중쇄의 CDR3 영역 내의 D6 코딩 서열을 사용하였다. 또한, 25개의 D6 조작된 D_H 분절 중 16개는 RNA로부터 증폭된 서열에서 검출되었지만 (표 12), D6 Nterm (D_H3-3), D6 Nterm+EC3 (D_H4-4), D6 EC1 (D_H5-5), D6 EC1-N (D_H1-7), D6 EC1-S (D_H5-12), D6 Nterm-S (D_H6-13), D6 Nterm-EC3 (D_H3-16), D6 EC1+EC2 (D_H4-17) 및 D6 EC3-C (D_H4-23)는 분석된 서열에서 검출되지 않았다. 전술된 바와 같이, 이러한 D6 코딩 서열 중 일부, 특히 보다 긴 D6 코딩 서열의 사용은 분석된 서열 세트에서 확인할 수 없었다. 전반적으로, 골수 및 비장 추출 샘플 사이의 D6 코딩 서열의 주요한 차이는 관찰되지 않았다. 또한, 분석된 서열 사이에서 D6 코딩 서열의 재배열에 대한 음성 선택 편향(bias)은 나타나지 않았다.

종합하면, 본 실시예는, 전통적인 D_H 분절 대신에 비-면역글로불린 폴리펩티드 (예컨대, D6 케모카인 유인 수용체 또는 하나 이상의 독소)의 코딩 서열을 함유하는 조작된 D_H 영역의 존재를 특징으로 하는 조작된 면역글로불린 중쇄 좌위를 함유하는 마우스가 인접한 인간 V_H 및 J_H 분절을 사용하여 조작된 코딩 서열을 재배열하여 기능적인 중쇄를 형성할 수 있음을 보여준다. 또한, 제공된 조작된 마우스는 몇몇의 인간 V_H 및 J_H 분절 패밀리의 맥락에서 합성 D_H 영역 내로 조작된 다중 코딩 서열을 이용하는 강력한 항체 레파토리를 나타낸다.

프라이머 명칭	5'에서 3'으로의 서열 (서열번호:)
IgM RT	TCTTATCAGACAGGGGGCTCTC (서열번호 236)
VH 다중-1	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT TCACCATGGACTGSACCTGGA (서열번호 237)
VH 다중-2	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT CCATGGACACACTTTGYTCCAC (서열번호 238)
VH 다중-3	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT TCACCATGGAGTTTGGGCTGAGC (서열번호 239)
VH 다중-4	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT AGAACATGAAACAYCTGTGGTTCTT (서열번호 240)
VH 다중-5	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT ATGGGGTCAACCGCCATCCT (서열번호 241)
VH 다중-6	GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT ACAATGTCTGTCTCCTTCCTCAT (서열번호 242)
IgM PCR1	ACACTCTTTCCCTACACGACGCTCTTCCGATCT GGGAAGACATTTGGGAAGGAC (서열번호 243)
PCR2-F	CAAGCAGAAGACGGCATACGAGATXXXXXX GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (서열번호 244)
PCR2-R	AATGATACGGCGACCACCGAGATCTACACXXXXXX ACACTCTTTCCCTACACGACGCTCTTCCGATCT (서열번호 245)

V_H 패밀리	총 서열 판독값	TX 서열에 대한 총 일치 (총 %)
V_H1	35,784	34,175 (95.5%)
V_H2	12,651	12,149 (96.0%)
V_H3	497,715	463,839 (93.2%)
V_H4	19,576	16,715 (85.4%)
V_H5	29,102	27,201 (93.5%)
V_H6	3,405	2,743 (80.6%)

TX: 독소

	골수			비장
	M1	M2	M3	M1	M2	M3
NT	26,031	23,298	20,949	17,623	14,687	19,834
AA (인 프레임)	13,741	12,655	7,433	11,112	7,780	9,057
% AA (인 프레임)	52.8	54.3	35.5	63.1	53.0	45.7

D6-D_H (위치)	길이 (NT)	골수			비장
D6-D_H (위치)	길이 (NT)	M1	M2	M3	M1	M2	M3
D6 Nterm-C (D_H1-1)	42	30.19	34.29	13.50	19.46	20.19	14.53
D6 EC3 (D_H2-2)	66	3.42	2.70	1.37	1.56	2.85	1.41
D6 EC2 (D_H6-6)	102	0.00	0.00	0.00	0.00	0.01	0.00
D6 EC3-S (D_H2-8)	66	6.33	3.67	1.58	4.72	3.80	3.13
D6 Nterm-N (D_H3-9)	105	0.14	0.03	0.05	0.02	0.08	0.05
D6 EC2-S (D_H3-10)	102	0.00	0.00	0.00	0.00	0.01	0.00
D6 EC1-EC2-S (D_H4-11)	78	0.04	0.02	0.00	0.02	0.00	0.00
D6 EC2-N (D_H1-14)	33	11.23	9.65	5.48	9.83	15.71	11.68
D6 EC2-EC1 (D_H2-15)	39	1.02	1.25	0.19	1.82	1.05	0.82
D6 EC3-Nterm (D_H5-18)	81	0.03	0.01	0.00	0.00	0.00	0.00
D6 EC1-EC2 (D_H6-19)	78	1.89	0.82	0.57	0.70	1.21	0.73
D6 EC2-C (D_H1-20)	66	4.87	3.46	2.35	2.41	3.61	2.67
D6 EC2-EC1-S (D_H2-21)	39	2.63	2.44	2.20	7.29	3.41	2.64
D6 Nterm-EC3-S (D_H3-22)	135	0.02	0.00	0.00	0.00	0.02	0.00
D6 EC3-Nterm-S (D_H5-24)	81	0.02	0.01	0.00	0.01	0.03	0.00
D6 EC3-N (D_H1-26)	36	38.17	41.67	72.71	52.14	48.03	62.32

실시예 7. 조작된 D _H 영역을 함유하는 설치류에서 항체의 생산

본 실시예는 본원에 기술된 바와 같이 조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 설치류에서의 항체 생산을 보여준다. 본 실시예에 기술된 방법, 및/또는 당업계에 널리 공지된 면역화 방법이 폴리펩티드 또는 이의 단편(예컨대, 원하는 에피토프로부터 유도된 펩티드), 또는 원하는 폴리펩티드 또는 이의 단편의 조합을 사용하여 본원에 기술된 바와 같은 조작된 D_H 영역을 함유하는 설치류를 면역화하기 위해 사용될 수 있다.

요컨대, 본원에 기술된 바와 같은 조작된 D_H 영역을 포함하는 마우스의 코호트를 당업계에 공지된 면역화 방법을 사용하여 관심 항원으로 공격하였다. 항체 면역 반응을 ELISA 면역분석법 (즉, 혈청 역가)으로 모니터링하였다.

단일의 재배열된 가변 유전자 서열 V:J (예컨대, Vκ1-39Jκ5 또는 Vκ3-20Jκ1 공통 경쇄 마우스)를 포함하는 공통 경쇄 마우스 (보편적(universal) 경쇄 또는 ULC 마우스로도 지칭됨)의 생산 및 이러한 마우스에서 항원-특이적 항체의 생산이, 예컨대 미국 특허 출원 제13/022,759호, 제13/093,156호, 제13/412,936호, 제13/488,628호, 제 13/798,310호, 및 제13/948,818호 (각각, 공개번호 제2011/0195454호, 제2012/0021409호, 제2012/0192300호, 제2013/0045492호, 제US20130185821호, 및 제US20130302836호)에 기술되어 있으며, 이들 각각은 그 전체가 참조로서 본원에 포함되어 있다. 구체적으로, 유전적으로 조작된 Vκ1-39Jκ5 카파 경쇄 (1633 HO 또는 1634 HO) 또는 유전적으로 조작된 Vκ3-20Jκ1 카파 경쇄 (1635 HO 또는 1636 HO)를 이의 생식선에서 발현하는 마우스를 제작하였다.

단일의 재배열된 인간 생식선 경쇄 영역 (ULC Vκ1-39Jκ5; 1633 또는 1634) 또는 (ULC Vκ3-20Jκ1; 1635 또는 1636)을 함유하는 VELOCIMMUNE® 마우스를 교배하여 변형된 IgG 불변 영역을 지니는 마우스를 생산하였다. 구체적으로, 상기 ULC 마우스를, 다수의 인간 V_H, 전통적인 D_H 분절 대신 독소 코딩 서열을 포함하는 조작된 D_H 분절, 및 마우스 중쇄 인핸서 및 조절 영역을 포함하여 마우스 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 J_H 분절을 함유하고, 하나 이상의 쥐 Adam6 유전자 [예컨대, 미국특허 제8,642,835호 및8,697,940호]를 암호화하는 삽입된 뉴클레오티드 서열을 함유하는 동형접합체 면역글로불린 중쇄 좌위를 포함하는 게놈을 갖는 마우스 와 교배하여 독소 코딩 서열을 포함하는 중쇄 좌위에 대한 자손 마우스 이형접합체 또는 동형접합체 또는 보편적 경쇄에 대한 이형접합체 또는 동형접합체를 생산하였다. 도 21에 나타난 바와 같이, 독소 코딩 서열을 함유하는 조작된 D_H 영역에 대한 마우스 동형접합체 및 보편적 경쇄 (6579HO/1634HO)에 대한 동형접합체는 대조군 동물(1460/1634)에 필적하는 수용성 단백질로 면역화 후 항체 반응을 가졌다.

실시예 8. 조작된 D _H 영역을 함유하는 설치류에서 생산된 항체를 암호화하는 핵산 및/또는 발현하는 세포의 단리

원하는 면역 반응이 달성되면, 비장세포 (및/또는 다른 림프 조직)를 수확하고 마우스 골수종 세포와 융합하여 이의 생존력을 보존하고 불멸의 하이브리도마 세포주를 형성하였다. 상기 하이브리도마 세포주를 스크리닝 (예컨대, ELISA 분석으로) 및 선택하여 항원-특이적 항체를 생산하는 하이브리도마 세포주를 확인하였다. 하이브리도마를 원하는 상대적인 결합 친화도 및 이소형에 대해 추가로 특성분석할 수 있다. 이러한 기술을 사용하여, 몇몇 항원-특이적 키메라 항체 (즉, 인간 가변 도메인 및 설치류 불변 도메인을 포함하는 항체)가 수득된다.

중쇄 및 경쇄 가변 영역을 암호화하는 DNA를 단리하여 완전한 인간 항체의 제조를 위해 중쇄 및 경쇄의 원하는 이소형 (불변 영역)에 연결할 수 있다. 이러한 항체 단백질은 세포, 예컨대 CHO 세포에서 생산될 수 있다. 완전한 인간 항체는 이어서 관심 항원의 상대적인 결합 친화도 및/또는 중화 활성에 대해 특성분석된다.

항원-특이적 키메라 항체 또는 경쇄 및 중쇄의 가변 도메인을 암호화하는 DNA가 항원-특이적 림프구로부터 직접 단리될 수 있다. 초기에, 인간 가변 영역 및 설치류 불변 영역을 갖는 고친화성 키메라 항체가 단리되고 특성분석되고 친화도, 선택도, 에피토프 등을 포함하여 원하는 특성에 대해 선택된다. 설치류 불변 영역은 원하는 인간 불변 영역으로 치환되어 완전한 인간 항체가 생성된다. 선택된 불변 영역은 특정 용도에 따라 매우 다양할 수 있지만, 고친화성 항원-결합 및 표적 특이도 특성은 가변 영역에 존재한다. 예컨대, 구체적으로 그 내용이 본원에 참조로서 포함된 미국 특허 제7,582,298호에 기술된 바와 같이, 골수종 세포의 융합 없이 항원-양성 B 세포 (면역화된 마우스로부터 유래함)로부터 항원-특이적 항체가 또한 직접 단리된다. 이러한 방법을 사용하여, 몇몇 완전한 인간 항원-특이적 항체 (즉, 인간 가변 도메인 및 인간 불변 도메인)가 제조된다.

균등물

본 발명의 적어도 하나의 구현예의 몇몇 측면이 설명되었는데, 다양한 변경, 변형 및 개선이 당업자에 의해 용이하게 이루어질 것임을 당업자는 이해할 것이다. 이러한 변경, 변형 및 개선은 본 개시의 일부가 되도록 의도되고, 본 발명의 사상 및 범주 내에 있도록 의도된다. 따라서, 전술된 설명 및 도면은 단지 예시이며, 본 발명은 이어지는 청구범위에 의해 상세히 기술된다.

청구범위 요소를 변형하기 위한 청구범위 내 "제1", "제2", "제3" 등과 같은 서수 용어의 사용은 그 자체가 하나의 청구범위 요소가 다른 것을 앞서는 어떠한 우선순위, 선행, 또는 순서 또는 방법의 작용이 수행되는 일시적인 순서를 나타내지 않으며, 단지 청구범위 요소들을 구분하기 위해 일정한 이름을 갖는 하나의 청구범위 요소를 (서수 용어의 사용이 없었다면) 동일한 이름을 가진 다른 요소로부터 구분하기 위한 표지로서 사용된다.

본 명세서 및 청구범위 내에서 관사 "a" 및 "an"은 명확하게 달리 나타내지 않는 한 복수의 지시 대상물을 포함하는 것으로 이해되어야 한다. 하나의 군의 하나 이상의 구성원 사이에서 "또는"을 포함하는 청구범위 또는 상세한 설명은 반대로 지시되거나 그렇지 않으면 문맥으로부터 명백하지 않는 한 하나, 하나 초과 또는 전체의 군 구성원이 주어진 산물 또는 과정에 존재하거나 채용되거나 그렇지 않으면 관련되는 것을 만족하는 것으로 간주된다 본 발명은 군의 정확히 하나의 구성원이 주어진 산물 또는 과정에 존재하거나 채용되거나 그렇지 않으면 관련된 구현예를 포함한다. 본 발명은 또한 하나 초과, 또는 전체 군의 구성원이 주어진 산물 또는 과정에 존재하거나 채용되거나 그렇지 않으면 관련된 구현예를 포함한다. 나아가, 본 발명은 그렇지 않은 것으로 지시되거나 반대 또는 불일치가 일어날 수 있다는 것이 당업자에게 명백하지 않는 한 하나 이상의 열거된 청구범위로부터 하나 이상의 제한, 요소, 항목, 서술 용어 등이 동일한 기반의 청구범위에 의존하는 다른 청구범위에 도입된 모든 변형, 조합, 치환을 포함하는 것으로 이해된다. 요소가 (예를 들어, 마커시 군 또는 유사한 형식 내) 목록으로서 제시된 경우, 이러한 요소의 각각의 하위군도 또한 개시되고, 임의의 요소(들)가 이러한 군으로부터 제거될 수 있는 것으로 이해된다. 일반적으로, 본 발명, 또는 본 발명의 측면이 특정 요소, 특징 등을 포함하는 것으로 지칭되는 경우, 본 발명의 특정 구현예 또는 본 발명의 측면은 이러한 요소, 특징으로 이루어지거나 필수적으로 이루어지는 것으로 이해되어야 한다. 간결성을 위해, 이러한 구현예들은 본원에서 글자 그대로 모든 경우에서 구체적으로 기재되지 않는다. 또한 본 발명의 임의의 구현예 또는 측면은 특정한 배제가 본 명세서 내에 언급되었는지에 관계없이 청구범위로부터 명백하게 제외될 수 있는 것으로 이해되어야 한다.

당업자는 본원에 설명된 검정 또는 다른 과정들에서 얻어진 값에서 기인할 수 있는 통상적인 오차 또는 표준 편차를 이해할 것이다.

간행물, 웹사이트 및 다른 참조 물질들은 본 발명의 배경기술을 설명하고, 그의 시행이 참조로서 본원에 포함되는 것을 고려하여 추가적인 상세한 설명을 제공하기 위해 언급되었다.

SEQUENCE LISTING <110> Regeneron Pharmaceuticals, Inc. Macdonald, Lynn McWhirter, John Murphy, Andrew <120> NON-HUMAN ANIMALS HAVING AN IMMUNOGLOBULIN HEAVY CHAIN VARIABLE REGION THAT INCLUDES AN ENGINEERED DIVERSITY CLUSTER AND USES THEREOF <130> 017283.1066/10150WO01 <140> TBD <141> 2017-01-12 <150> US 62/278,127 <151> 2016-01-13 <160> 245 <170> PatentIn version 3.5 <210> 1 <211> 150 <212> DNA <213> Homo sapiens <400> 1 atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60 agcttctact actatgacta cctggatgaa gtagctttca tgctctgccg gaaggatgct 120 gtggttagct ttggcaaagt tttcctgcca 150 <210> 2 <211> 50 <212> PRT <213> Homo sapiens <400> 2 Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp 1 5 10 15 Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala 20 25 30 Phe Met Leu Cys Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe 35 40 45 Leu Pro 50 <210> 3 <211> 15 <212> DNA <213> Homo sapiens <400> 3 agcttcttgt gcaag 15 <210> 4 <211> 5 <212> PRT <213> Homo sapiens <400> 4 Ser Phe Leu Cys Lys 1 5 <210> 5 <211> 102 <212> DNA <213> Homo sapiens <400> 5 caaacccatg aaaaccccaa gggagtttgg aactgccatg ccgatttcgg cgggcatggc 60 accatttgga agctcttcct ccggttccag cagaacctgc ta 102 <210> 6 <211> 34 <212> PRT <213> Homo sapiens <400> 6 Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Cys His Ala Asp Phe 1 5 10 15 Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg Phe Gln Gln Asn 20 25 30 Leu Leu <210> 7 <211> 66 <212> DNA <213> Homo sapiens <400> 7 ctgcataccc tgctggacct gcaagtattc ggcaactgtg aggttagcca gcatctagac 60 tatgcc 66 <210> 8 <211> 22 <212> PRT <213> Homo sapiens <400> 8 Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Glu Val Ser 1 5 10 15 Gln His Leu Asp Tyr Ala 20 <210> 9 <211> 150 <212> DNA <213> Homo sapiens <400> 9 atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60 agcttctact actatgacta cctggatgaa gtagctttca tgctcagccg gaaggatgct 120 gtggttagct ttggcaaagt tttcctgcca 150 <210> 10 <211> 50 <212> PRT <213> Homo sapiens <400> 10 Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp 1 5 10 15 Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala 20 25 30 Phe Met Leu Ser Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe 35 40 45 Leu Pro 50 <210> 11 <211> 15 <212> DNA <213> Homo sapiens <400> 11 agcttcttga gcaag 15 <210> 12 <211> 5 <212> PRT <213> Homo sapiens <400> 12 Ser Phe Leu Ser Lys 1 5 <210> 13 <211> 102 <212> DNA <213> Homo sapiens <400> 13 caaacccatg aaaaccccaa gggagtttgg aacagccatg ccgatttcgg cgggcatggc 60 accatttgga agctcttcct ccggttccag cagaacctgc ta 102 <210> 14 <211> 34 <212> PRT <213> Homo sapiens <400> 14 Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Ser His Ala Asp Phe 1 5 10 15 Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg Phe Gln Gln Asn 20 25 30 Leu Leu <210> 15 <211> 66 <212> DNA <213> Homo sapiens <400> 15 ctgcataccc tgctggacct gcaagtattc ggcaacagtg aggttagcca gcatctagac 60 tatgcc 66 <210> 16 <211> 22 <212> PRT <213> Homo sapiens <400> 16 Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Ser Glu Val Ser 1 5 10 15 Gln His Leu Asp Tyr Ala 20 <210> 17 <211> 135 <212> DNA <213> Homo sapiens <400> 17 atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60 agcttctact actatgacta cctggatgaa gtagctttca tgctctgcga ggttagccag 120 catctagact atgcc 135 <210> 18 <211> 45 <212> PRT <213> Homo sapiens <400> 18 Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp 1 5 10 15 Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala 20 25 30 Phe Met Leu Cys Glu Val Ser Gln His Leu Asp Tyr Ala 35 40 45 <210> 19 <211> 81 <212> DNA <213> Homo sapiens <400> 19 ctgcataccc tgctggacct gcaagtattc ggcaactgtc ggaaggatgc tgtggttagc 60 tttggcaaag ttttcctgcc a 81 <210> 20 <211> 27 <212> PRT <213> Homo sapiens <400> 20 Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Arg Lys Asp 1 5 10 15 Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro 20 25 <210> 21 <211> 78 <212> DNA <213> Homo sapiens <400> 21 agcttcttgt gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg 60 ttccagcaga acctgcta 78 <210> 22 <211> 26 <212> PRT <213> Homo sapiens <400> 22 Ser Phe Leu Cys His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys 1 5 10 15 Leu Phe Leu Arg Phe Gln Gln Asn Leu Leu 20 25 <210> 23 <211> 39 <212> DNA <213> Homo sapiens <400> 23 caaacccatg aaaaccccaa gggagtttgg aactgcaag 39 <210> 24 <211> 13 <212> PRT <213> Homo sapiens <400> 24 Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Cys Lys 1 5 10 <210> 25 <211> 135 <212> DNA <213> Homo sapiens <400> 25 atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60 agcttctact actatgacta cctggatgaa gtagctttca tgctcagcga ggttagccag 120 catctagact atgcc 135 <210> 26 <211> 45 <212> PRT <213> Homo sapiens <400> 26 Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp 1 5 10 15 Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala 20 25 30 Phe Met Leu Ser Glu Val Ser Gln His Leu Asp Tyr Ala 35 40 45 <210> 27 <211> 81 <212> DNA <213> Homo sapiens <400> 27 ctgcataccc tgctggacct gcaagtattc ggcaacagtc ggaaggatgc tgtggttagc 60 tttggcaaag ttttcctgcc a 81 <210> 28 <211> 27 <212> PRT <213> Homo sapiens <400> 28 Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Ser Arg Lys Asp 1 5 10 15 Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro 20 25 <210> 29 <211> 78 <212> DNA <213> Homo sapiens <400> 29 agcttcttga gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg 60 ttccagcaga acctgcta 78 <210> 30 <211> 26 <212> PRT <213> Homo sapiens <400> 30 Ser Phe Leu Ser His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys 1 5 10 15 Leu Phe Leu Arg Phe Gln Gln Asn Leu Leu 20 25 <210> 31 <211> 39 <212> DNA <213> Homo sapiens <400> 31 caaacccatg aaaaccccaa gggagtttgg aacagcaag 39 <210> 32 <211> 13 <212> PRT <213> Homo sapiens <400> 32 Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn Ser Lys 1 5 10 <210> 33 <211> 216 <212> DNA <213> Homo sapiens <400> 33 atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60 agcttctact actatgacta cctggatgaa gtagctttca tgctctgccg gaaggatgct 120 gtggttagct ttggcaaagt tttcctgcca ctgcataccc tgctggacct gcaagtattc 180 ggcaactgtg aggttagcca gcatctagac tatgcc 216 <210> 34 <211> 72 <212> PRT <213> Homo sapiens <400> 34 Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp 1 5 10 15 Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala 20 25 30 Phe Met Leu Cys Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe 35 40 45 Leu Pro Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn Cys Glu 50 55 60 Val Ser Gln His Leu Asp Tyr Ala 65 70 <210> 35 <211> 117 <212> DNA <213> Homo sapiens <400> 35 agcttcttgt gcaagcaaac ccatgaaaac cccaagggag tttggaactg ccatgccgat 60 ttcggcgggc atggcaccat ttggaagctc ttcctccggt tccagcagaa cctgcta 117 <210> 36 <211> 39 <212> PRT <213> Homo sapiens <400> 36 Ser Phe Leu Cys Lys Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn 1 5 10 15 Cys His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu 20 25 30 Arg Phe Gln Gln Asn Leu Leu 35 <210> 37 <211> 105 <212> DNA <213> Homo sapiens <400> 37 atggcagcta ctgccagccc gcagccactg gctactgagg atgccgattc tgagaatagc 60 agcttctact actatgacta cctggatgaa gtagctttca tgctc 105 <210> 38 <211> 35 <212> PRT <213> Homo sapiens <400> 38 Met Ala Ala Thr Ala Ser Pro Gln Pro Leu Ala Thr Glu Asp Ala Asp 1 5 10 15 Ser Glu Asn Ser Ser Phe Tyr Tyr Tyr Asp Tyr Leu Asp Glu Val Ala 20 25 30 Phe Met Leu 35 <210> 39 <211> 42 <212> DNA <213> Homo sapiens <400> 39 cggaaggatg ctgtggttag ctttggcaaa gttttcctgc ca 42 <210> 40 <211> 14 <212> PRT <213> Homo sapiens <400> 40 Arg Lys Asp Ala Val Val Ser Phe Gly Lys Val Phe Leu Pro 1 5 10 <210> 41 <211> 9 <212> DNA <213> Homo sapiens <400> 41 agcttcttg 9 <210> 42 <211> 3 <212> PRT <213> Homo sapiens <400> 42 Ser Phe Leu 1 <210> 43 <211> 33 <212> DNA <213> Homo sapiens <400> 43 caaacccatg aaaaccccaa gggagtttgg aac 33 <210> 44 <211> 11 <212> PRT <213> Homo sapiens <400> 44 Gln Thr His Glu Asn Pro Lys Gly Val Trp Asn 1 5 10 <210> 45 <211> 66 <212> DNA <213> Homo sapiens <400> 45 catgccgatt tcggcgggca tggcaccatt tggaagctct tcctccggtt ccagcagaac 60 ctgcta 66 <210> 46 <211> 22 <212> PRT <213> Homo sapiens <400> 46 His Ala Asp Phe Gly Gly His Gly Thr Ile Trp Lys Leu Phe Leu Arg 1 5 10 15 Phe Gln Gln Asn Leu Leu 20 <210> 47 <211> 36 <212> DNA <213> Homo sapiens <400> 47 ctgcataccc tgctggacct gcaagtattc ggcaac 36 <210> 48 <211> 12 <212> PRT <213> Homo sapiens <400> 48 Leu His Thr Leu Leu Asp Leu Gln Val Phe Gly Asn 1 5 10 <210> 49 <211> 27 <212> DNA <213> Homo sapiens <400> 49 gaggttagcc agcatctaga ctatgcc 27 <210> 50 <211> 9 <212> PRT <213> Homo sapiens <400> 50 Glu Val Ser Gln His Leu Asp Tyr Ala 1 5 <210> 51 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (10)..(21) <223> n is a, c, g, or t <400> 51 acaaaaaccn nnnnnnnnnn ncacagtg 28 <210> 52 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (8)..(19) <223> n is a, c, g, or t <400> 52 cacagtgnnn nnnnnnnnna caaaaacc 28 <210> 53 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (10)..(21) <223> n is a, c, g, or t <400> 53 ggwtwytgwn nnnnnnnnnn ncactgtg 28 <210> 54 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (8)..(19) <223> n is a, c, g, or t <400> 54 cacagtgnnn nnnnnnnnnb cmrmaacy 28 <210> 55 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (10)..(21) <223> n is a, c, g, or t <400> 55 gatttttgtn nnnnnnnnnn ntactgtg 28 <210> 56 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (8)..(19) <223> n is a, c, g, or t <400> 56 cacagtgnnn nnnnnnnnna caaaaacc 28 <210> 57 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (10)..(21) <223> n is a, c, g, or t <400> 57 ggattttgtn nnnnnnnnnn ncactgtg 28 <210> 58 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <220> <221> misc_feature <222> (8)..(19) <223> n is a, c, g, or t <400> 58 cacagtgnnn nnnnnnnnnt caaaaacc 28 <210> 59 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 59 ggattttgta cagccccgag tcactgtg 28 <210> 60 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 60 cacagtgaga aaaactgtgt caaaaacc 28 <210> 61 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 61 ggattttgta cagccccgag tcactgtg 28 <210> 62 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 62 cacagtgaga aaagcttcgt caaaaacc 28 <210> 63 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 63 ggattttgta cagccccgag tcactgtg 28 <210> 64 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 64 cacagtgaga atagctacgt caaaaacc 28 <210> 65 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 65 ggattttgta cagccccgag tcactgtg 28 <210> 66 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 66 cacagtgaga aaaactgtgt caaaaacc 28 <210> 67 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 67 ggattttgta cagccccgag tcactgtg 28 <210> 68 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 68 cacagtgaga aaagctatgt caaaaacc 28 <210> 69 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 69 ggattttgtg ggggctcgtg tcactgtg 28 <210> 70 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 70 cacagtgaca cagccccatt caaaaacc 28 <210> 71 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 71 ggattttgtg ggggctcgtg tcactgtg 28 <210> 72 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> optimized RSS <400> 72 cacagtgaca cagccccatt caaaaacc 28 <210> 73 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 73 ggattttgtg ggggctcgtg tcactgtg 28 <210> 74 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 74 cacagtgaca cagacccatt caaaaacc 28 <210> 75 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 75 ggattttgtg ggggttcgtg tcactgtg 28 <210> 76 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 76 cacagtgaca caaccccatt caaaaacc 28 <210> 77 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 77 ggattttgtt gaggtctgtg tcactgtg 28 <210> 78 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 78 cacagtgtca cagagtccat caaaaacc 28 <210> 79 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 79 ggattttgtt gaggtctgtg tcactgtg 28 <210> 80 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 80 cacagtgtca cagagtccat caaaaacc 28 <210> 81 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 81 ggattttgtt gaggtctgtg tcactgtg 28 <210> 82 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 82 cacagtgtca cagagtccat caaaaacc 28 <210> 83 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 83 ggattttgtt gaggtctgtg tcactgtg 28 <210> 84 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 84 cacagtgtca cacggtccat caaaaacc 28 <210> 85 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 85 ggattttgtt gaggtctgtg tcactgtg 28 <210> 86 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 86 cacagtgtca cagagtccat caaaaacc 28 <210> 87 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 87 ggattttgtg aagggtcctc ccactgtg 28 <210> 88 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 88 cacagtgatg aacccagcat caaaaacc 28 <210> 89 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 89 ggattttgtg aagggccctc ccactgtg 28 <210> 90 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 90 cacagtgatg aacccagtgt caaaaacc 28 <210> 91 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 91 ggattttgtg aaggcccctc ccactgtg 28 <210> 92 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 92 cacagtgatg aaactagcat caaaaacc 28 <210> 93 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 93 ggattttgtg aagggccctc ccactgtg 28 <210> 94 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 94 cacagtgatg aaaccagcat caaaaacc 28 <210> 95 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 95 ggattttgtc agggggtgtc acactgtg 28 <210> 96 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 96 cacagtggtg ctgcccatat caaaaacc 28 <210> 97 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 97 ggattttgtc aggcgatgtc acactgtg 28 <210> 98 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 98 cacagtggtg ccgcccatat caaaaacc 28 <210> 99 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 99 ggattttgtc agggggtgtc acactgtg 28 <210> 100 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 100 cacagtggtg ctgcccatat caaaaacc 28 <210> 101 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 101 ggattttgtc agggggtgcc acactgtg 28 <210> 102 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 102 cacagtggtg ccgcccatat caaaaacc 28 <210> 103 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 103 ggattttgta ggtgtctgtg tcactgtg 28 <210> 104 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 104 cacagtgaca ctcgccaggt caaaaacc 28 <210> 105 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 105 ggattttgta ggtgtctgtg tcactgtg 28 <210> 106 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 106 cacagtgaca ctcacccagt caaaaacc 28 <210> 107 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 107 ggattttgta gctgtctgta tcactgtg 28 <210> 108 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 108 cacagtgaca ctcgccaggt caaaaacc 28 <210> 109 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 109 ggtttctgaa gctgtctgtg tcacagtc 28 <210> 110 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 110 cacaatgaca ctgggcagga cagaaacc 28 <210> 111 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 111 gggtttggct gagctgagaa ccactgtg 28 <210> 112 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Optimized RSS <400> 112 cacagtgatt ggcagctcta caaaaacc 28 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 113 cacaggaaac agctatgacc 20 <210> 114 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 114 ccagtgccct agagtcaccc a 21 <210> 115 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 115 ctcccactca tgatctatag a 21 <210> 116 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 116 ctggggctcg ctttagttg 19 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 117 tgatagccgt tgtattcagc 20 <210> 118 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 118 ccagtgccct agagtcaccc a 21 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 119 gccatttctg tctgcattcg 20 <210> 120 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 120 ggttcatcat gccgtttgtg a 21 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 121 tgggctcgta gtttgacgtg 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 122 ttacccacac ttcacgcacg 20 <210> 123 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 123 ttaaacgacg cctcgaatg 19 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 124 gcaaccattc gttgtagtag 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 125 ctaacgcagt catgtaatgc 20 <210> 126 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 126 gactgtcacc cagcattac 19 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 127 cgtcgcctct acgggaaatc 20 <210> 128 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 128 ccagtgccct agagtcaccc a 21 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 129 gccatttctg tctgcattcg 20 <210> 130 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 130 aaacaccacg taggatttac gc 22 <210> 131 <211> 10213 <212> DNA <213> Artificial Sequence <220> <223> D6-DH1166 <400> 131 tacgtagccg tttcgatcct cccgaattga ctagtgggta ggcctggcgg ccgctgccat 60 ttcattacct ctttctccgc acccgacata gataccggtg gattcgaatt ctccccgttg 120 aagctgacct gcccagaggg gcctgggccc accccacaca ccggggcgga atgtgtacag 180 gccccggtct ctgtgggtgt tccgctaact ggggctccca gtgctcaccc cacaactaaa 240 gcgagcccca gcctccagag cccccgaagg agatgccgcc cacaagccca gcccccatcc 300 aggaggcccc agagctcagg gcgccggggc ggattttgta cagccccgag tcactgtgcg 360 gaaggatgct gtggttagct ttggcaaagt tttcctgcca ccacagtgag aaaaactgtg 420 tcaaaaaccg tctcctggcc cctgctggag gccgcgccag agaggggagc agccgccccg 480 aacctaggtc ctgctcagct cacacgaccc ccagcaccca gagcacaacg gagtccccat 540 tgaatggtga ggacggggac cagggctcca gggggtcatg gaaggggctg gaccccatcc 600 tactgctatg gtcccagtgc tcctggccag aactgaccct accaccgaca agagtccctc 660 agggaaacgg gggtcactgg cacctcccag catcaacccc aggcagcaca ggcataaacc 720 ccacatccag agccgactcc aggagcagag acaccccagt accctggggg acaccgaccc 780 tgatgactcc ccactggaat ccaccccaga gtccaccagg accaaagacc ccgcccctgt 840 ctctgtccct cactcaggac ctgctgcggg gcgggccatg agaccagact cgggcttagg 900 gaacaccact gtggccccaa cctcgaccag gccacaggcc cttccttcct gccctgcggc 960 agcacagact ttggggtctg tgcagagagg aatcacagag gccccaggct gaggtggtgg 1020 gggtggaaga cccccaggag gtggcccact tcccttcctc ccagctggaa cccaccatga 1080 ccttcttaag ataggggtgt catccgaggc aggtcctcca tggagctccc ttcaggctcc 1140 tccccggtcc tcactaggcc tcagtcccgg ctgcgggaat gcagccacca caggcacacc 1200 aggcagccca gacccagcca gcctgcagtg cccaagccca cattctggag cagagcaggc 1260 tgtgtctggg agagtctggg ctccccaccg cccccccgca caccccaccc acccctgtcc 1320 aggccctatg caggagggtc agagcccccc atggggtatg gacttagggt ctcactcacg 1380 tggctcccct cctgggtgaa ggggtctcat gcccagatcc ccacagcaga gctggtcaaa 1440 ggtggaggca gtggccccag ggccaccctg acctggaccc tcaggctcct ctagccctgg 1500 ctgccctgct gtccctggga ggcctggact ccaccagacc acaggtccag ggcaccgccc 1560 ataggtgctg cccacactca gttcacagga agaagataag ctccagaccc ccaagactgg 1620 gacctgcctt cctgccaccg cttgtagctc cagacctccg tgcctccccc gaccacttac 1680 acacgggcca gggagctgtt ccacaaagat caaccccaaa ccgggaccgc ctggcactcg 1740 ggccgctgcc acttccctct ccatttgttc ccagcacctc tgtgctccct ccctcctccc 1800 tccttcaggg gaacagcctg tgcagcccct ccctgcaccc cacaccctgg ggaggcccaa 1860 ccctgcctcc agccctttct cccccgctgc tcttcctgcc catccagaca accctggggt 1920 cccatccctg cagcctacac cctggtctcc acccagaccc ctgtctctcc ctccagacac 1980 ccctcccagg ccaaccctgc acatgcaggc cctccccttt tctgctgcca gagcctcagt 2040 ttctaccctc tgtgcctacc ccctgcctcc tcctgcccac aactcgagct cttcctctcc 2100 tggggcccct gagccatggc actgaccgtg cactcccacc cccacactgc ccatgccctc 2160 accttcctcc tggacactct gaccccgctc ccctcttgga cccagccctg gtatttccag 2220 gacaaaggct cacccaagtc ttccccatgc aggcccttgc cctcactgcc cggttacacg 2280 gcagcctcct gtgcacagaa gcagggagct cagcccttcc acaggcagaa ggcactgaaa 2340 gaaatcggcc tccagcaccc tgatgcacgt ccgcctgtgt ctctcactgc ccgcacctgc 2400 agggaggctc ggcactccct gtaaagacga gggatccagg cagcaacatc atgggagaat 2460 gcagggctcc cagacagccc agccctctcg caggcctctc ctgggaagag acctgcagcc 2520 accactgaac agccacggag cccgctggat agtaactgag tcagtgaccg acctggaggg 2580 caggggagca gtgaaccgga gcccagacca tagggacaga gaccagccgc tgacatcccg 2640 agcccctcac tggcggcccc agaacaccgc gtggaaacag aacagaccca cattcccacc 2700 tggaacaggg cagacactgc tgagccccca gcaccagccc tgagaaacac caggcaacgg 2760 catcagaggg ggctcctgag aaagaaagga ggggaggtct ccttcaccag caagtacttc 2820 ccttgaccaa aaacagggtc cacgcaactc ccccaggaca aaggaggagc cccctgtaca 2880 gcactgggct cagagtcctc tcccacacac cctgagtttc agacaaaaac cccctggaaa 2940 tcatagtatc agcaggagaa ctagccagag acagcaagag gggactcagt gactcccgcg 3000 gggacaggag gattttgtgg gggctcgtgt cactgtgctg cataccctgc tggacctgca 3060 agtattcggc aactgtgagg ttagccagca tctagactat gcccacagtg acacagcccc 3120 attcaaaaac ccctgctgta aacgcttcca cttctggagc tgaggggctg gggggagcgt 3180 ctgggaagta gggcctaggg gtggccatca atgcccaaaa cgcaccagac tcccccccag 3240 acatcacccc actggccagt gagcagagta aacagaaaat gagaagcagc tgggaagctt 3300 gcacaggccc caaggaaaga gctttggcgg gtgtgcaaga ggggatgcgg gcagagcctg 3360 agcagggcct tttgctgttt ctgctttcct gtgcagatag ttccataaac tggtgttcaa 3420 gatcgatggc tgggagtgag cccaggagga cagtgtggga agggcacagg gaaggagaag 3480 cagccgctat cctacactgt catctttcaa gagtttgccc tgtgcccaca atgctgcatc 3540 atgggatgct taacagctga tgtagacaca gctaaagaga gaatcagtga aatggatttg 3600 cagcacagat ctgaataaat tctccagaat gtggagccac acagaagcaa gcacaaggaa 3660 agtgcctgat gcaagggcaa agtacagtgt gtaccttcag gctgggcaca gacactctga 3720 aaagccttgg caggaactcc ctgcaacaaa gcagagccct gcaggcaatg ccagctccag 3780 agccctccct gagagcctca tgggcaaaga tgtgcacaac aggtgtttct catagcccca 3840 aactgagaat gaagcaaaca gccatctgaa ggaaaacagg caaataaacg atggcaggtt 3900 catgaaatgc aaacccagac agccagaagg acaacagtga gggttacagg tgactctgtg 3960 gttgagttca tgacaatgct gagtaattgg agtaacaaag gaaagtccaa aaaatacttt 4020 caatgtgatt tcttctaaat aaaatttaca gccggcaaaa tgaactatct tcttaaggga 4080 taaactttcc actaggaaaa ctataaggaa aatcaagaaa aggatgatca cataaacaca 4140 gtggtcgtta cttctactgg ggaaggaaga gggtatgaac tgagacacac agggttggca 4200 agtctcctaa caagaacaga acaaatacat tacagtacct tgaaaacagc agttaaaatt 4260 ctaaattgca agaagaggaa aatgcacaca gctgtgttta gaaaattctc agtccagcac 4320 tgttcataat agcaaagaca ttaacccagg ttggataaat aaacgatgac acaggcaatt 4380 gcacaatgat acagacatac attcagtata tgagacattg atgatgtatc cccaaagaaa 4440 tgactttaaa gagaaaaggc ctgatatgtg gtggcactca cctccctggg catccccgga 4500 caggctgcag gcacactgtg tggcagggca ggctggtacc tgctggcagc tcctggggcc 4560 tgatgtggag caggcacaga gccgtatccc cccgaggaca tataccccca aggacggcac 4620 agttggtaca ttccggagac aagcaactca gccacactcc caggccagag cccgagaggg 4680 acgcccatgc acagggaggc agagcccagc tcctccacag ccagcagcac ccgtgcaggg 4740 gccgccatct ggcaggcaca gagcatgggc tgggaggagg ggcagggaca ccaggcaggg 4800 ttggcaccaa ctgaaaatta cagaagtctc atacatctac ctcagccttg cctgacctgg 4860 gcctcacctg acctggacct cacctggcct ggacctcacc tggcctagac ctcacctctg 4920 ggcttcacct gagctcggcc tcacctgact tggaccttgc ctgtcctgag ctcacatgat 4980 ctgggcctca cctgacctgg gtttcacctg acctgggctt cacctgacct gggcctcatc 5040 tgacctgggc ctcactggcc tggacctcac ctggcctggg cttcacctgg cctcaggcct 5100 catctgcacc tgctccaggt cttgctggaa cctcagtagc actgaggctg caggggctca 5160 tccagggttg cagaatgact ctagaacctc ccacatctca gctttctggg tggaggcacc 5220 tggtggccca gggaatataa aaagcctgaa tgatgcctgc gtgatttggg ggcaatttat 5280 aaacccaaaa ggacatggcc atgcagcggg tagggacaat acagacagat atcagcctga 5340 aatggagcct cagggcacag gtgggcacgg acactgtcca cctaagccag gggcagaccc 5400 gagtgtcccc gcagtagacc tgagagcgct gggcccacag cctcccctcg gtgccctgct 5460 acctcctcag gtcagccctg gacatcccgg gtttccccag gcctggcggt aggattttgt 5520 tgaggtctgt gtcactgtgc atggcagcta ctgccagccc gcagccactg gctactgagg 5580 atgccgattc tgagaatagc agcttctact actatgacta cctggatgaa gtagctttca 5640 tgctctgccg gaaggatgct gtggttagct ttggcaaagt tttcctgcca ccacagtgtc 5700 acagagtcca tcaaaaaccc atccctggga accttctgcc acagccctcc ctgtggggca 5760 ccgccgcgtg ccatgttagg attttgactg aggacacagc accatgggta tggtggctac 5820 cgcagcagtg cagcccgtga cccaaacaca cagggcagca ggcacaacag acaagcccac 5880 aagtgaccac cctgagctcc tgcctgccag ccctggagac catgaaacag atggccagga 5940 ttatcccata ggtcagccag acctcagtcc aacaggtctg catcgctgct gccctccaat 6000 accagtccgg atggggacag ggctggccca cattaccatt tgctgccatc cggccaacag 6060 tcccagaagc ccctccctca aggctgggcc acatgtgtgg accctgagag ccccccatgt 6120 ctgagtaggg gcaccaggaa ggtggggctg gccctgtgca ctgtccctgc ccctgtggtc 6180 cctggcctgc ctggccctga cacctgggcc tctcctgggt catttccaag acagaagaca 6240 ttcccaggac agctggagct gggagtccat catcctgcct ggccgtcctg agtcctgcgc 6300 ctttccaaac ctcacccggg aagccaacag aggaatcacc tcccacaggc agagacaaag 6360 accttccaga aatctctgtc tctctcccca gtgggcaccc tcttccaggg cagtcctcag 6420 tgatatcaca gtgggaaccc acatctggat cgggactgcc cccagaacac aagatggccc 6480 acagggacag ccccacagcc cagcccttcc cagaccccta aaaggcgtcc caccccctgc 6540 atctgcccca gggctcaaac tccaggagga ctgactcctg cacaccctcc tgccagacat 6600 cacctcagcc cctcctggaa gggacaggag cgcgcaaggg tgagtcagac cctcctgccc 6660 tcgatggcag gcggagaaga ttcagaaagg tctgagatcc ccaggacgca gcaccactgt 6720 caatgggggc cccagacgcc tggaccaggg cctgcgtggg aaaggcctct gggcacactc 6780 agggggattt tgtgaagggt cctcccactg tgcatggcag ctactgccag cccgcagcca 6840 ctggctactg aggatgccga ttctgagaat agcagcttct actactatga ctacctggat 6900 gaagtagctt tcatgctctg ccggaaggat gctgtggtta gctttggcaa agttttcctg 6960 ccactgcata ccctgctgga cctgcaagta ttcggcaact gtgaggttag ccagcatcta 7020 gactatgccc acagtgatga acccagcatc aaaaaccgac cggactccca aggtttatgc 7080 acacttctcc gctcagagct ctccaggatc agaagagccg ggcccaaggg tttctgccca 7140 gaccctcggc ctctagggac atcttggcca tgacagccca tgggctggtg ccccacacat 7200 cgtctgcctt caaacaaggg cttcagaggg ctctgaggtg acctcactga tgaccacagg 7260 tgccctggcc ccttccccac cagctgcacc agaccccgtc atgacagatg ccccgattcc 7320 aacagccaat tcctggggcc aggaatcgct gtagacacca gcctccttcc aacacctcct 7380 gccaattgcc tggattccca tcccggttgg aatcaagagg acagcatccc ccaggctccc 7440 aacaggcagg actcccacac cctcctctga gaggccgctg tgttccgtag ggccaggctg 7500 cagacagtcc ccctcacctg ccactagaca aatgcctgct gtagatgtcc ccacctggaa 7560 aataccactc atggagcccc cagccccagg tacagctgta gagagagtct ctgaggcccc 7620 taagaagtag ccatgcccag ttctgccggg accctcggcc aggctgacag gagtggacgc 7680 tggagctggg cccatactgg gccacatagg agctcaccag tgagggcagg agagcacatg 7740 ccggggagca cccagcctcc tgctgaccag aggcccgtcc cagagcccag gaggctgcag 7800 aggcctctcc agggggacac tgtgcatgtc tggtccctga gcagcccccc acgtccccag 7860 tcctgggggc ccctggcaca gctgtctgga ccctctctat tccctgggaa gctcctcctg 7920 acagccccgc ctccagttcc aggtgtggat tttgtcaggg ggtgtcacac tgtgcagctt 7980 cttgtgcaag cacagtggtg ctgcccatat caaaaaccag gccaagtaga caggcccctg 8040 ctgtgcagcc ccaggcctcc agctcacctg cttctcctgg ggctctcaag gctgctgttt 8100 tctgcactct cccctctgtg gggagggttc cctcagtggg agatctgttc tcaacatccc 8160 acggcctcat tcctgcaagg aaggccaatg gatgggcaac ctcacatgcc gcggctaaga 8220 tagggtgggc agcctggcgg ggacaggaca tcctgctggg gtatctgtca ctgtgcctag 8280 tggggcactg gctcccaaac aacgcagtcc ttgccaaaat ccccacggcc tcccccgcta 8340 ggggctggcc tgatctcctg cagtcctagg aggctgctga cctccagaat ggctccgtcc 8400 ccagttccag ggcgagagca gatcccaggc cggctgcaga ctgggaggcc accccctcct 8460 tcccagggtt cactgcaggt gaccagggca ggaaatggcc tgaacacagg gataaccggg 8520 ccatccccca acagagtcca ccccctcctg ctctgtaccc cgcacccccc aggccagccc 8580 atgacatccg acaaccccac accagagtca ctgcccggtg ctgccctagg gaggacccct 8640 cagcccccac cctgtctaga ggactgggga ggacaggaca cgccctctcc ttatggttcc 8700 cccacctggc tctggctggg acccttgggg tgtggacaga aaggacgctt gcctgattgg 8760 cccccaggag cccagaactt ctctccaggg accccagccc gagcaccccc ttacccagga 8820 cccagccctg cccctcctcc cctctgctct cctctcatca ccccatggga atccagaatc 8880 cccaggaagc catcaggaag ggctgaggga ggaagtgggg ccactgcacc accaggcagg 8940 aggctctgtc tttgtgaacc cagggaggtg ccagcctcct agagggtatg gtccaccctg 9000 cctatggctc ccacagtggc aggctgcagg gaaggaccag ggacggtgtg ggggagggct 9060 cagggccccg cgggtgctcc atcttggatg agcctatctc tctcacccac ggactcgccc 9120 acctcctctt caccctggcc acacgtcgtc cacaccatcc taagtcccac ctacaccaga 9180 gccggcacag ccagtgcaga cagaggctgg ggtgcagggg ggccgactgg gcagcttcgg 9240 ggagggagga atggaggaag gggagttcag tgaagaggcc cccctcccct gggtccagga 9300 tcctcctctg ggacccccgg atcccatccc ctccaggctc tgggaggaga agcaggatgg 9360 gagaatctgt gcgggaccct ctcacagtgg aatacctcca cagcggctca ggccagatac 9420 aaaagcccct cagtgagccc tccactgcag tgctgggcct gggggcagcc gctcccacac 9480 aggatgaacc cagcaccccg aggatgtcct gccaggggga gctcagagcc atgaaggagc 9540 aggatatggg acccccgata caggcacaga cctcagctcc attcaggact gccacgtcct 9600 gccctgggag gaaccccttt ctctagtccc tgcaggccag gaggcagctg actcctgact 9660 tggacgccta ttccagacac cagacagagg ggcaggcccc ccagaaccag ggatgaggac 9720 gccccgtcaa ggccagaaaa gaccaagttg cgctgagccc agcaagggaa ggtccccaaa 9780 caaaccagga ggattttgta ggtgtctgtg tcactgtgca aacccatgaa aaccccaagg 9840 gagtttggaa ctgccatgcc gatttcggcg ggcatggcac catttggaag ctcttcctcc 9900 ggttccagca gaacctgcta ccacagtgac actcgccagg tcaaaaaccc catcccaagt 9960 cagcggaatg cagagagagc agggaggaca tgtttaggat ctgaggccgc acctgacacc 10020 caggccagca gacgtctcct gtccacggca ccctgccatg tcctgcattt ctggaagaac 10080 aagggcaggc tgaagggggt ccaggaccag gagatgggtc cgctctaccc agagaaggag 10140 ccaggcagga cacaagcccc cacgcgtggg ctcgtagttt gacgtgcgtg aagtgtgggt 10200 aagaaagtac gta 10213 <210> 132 <211> 9828 <212> DNA <213> Artificial Sequence <220> <223> D6-D17613 <400> 132 gcggccgctg ccatttcatt acctctttct ccgcacccga catagattac gtaacgcgtg 60 ggctcgtagt ttgacgtgcg tgaagtgtgg gtaagaaagt ccccattgag gctgacctgc 120 ccagagggtc ctgggcccac ccaacacacc ggggcggaat gtgtgcaggc ctcggtctct 180 gtgggtgttc cgctagctgg ggctcacagt gctcacccca cacctaaaac gagccacagc 240 ctccggagcc cctgaaggag accccgccca caagcccagc ccccacccag gaggccccag 300 agcacagggc gccccgtcgg attttgtaca gccccgagtc actgtgcagc ttcttgcaca 360 gtgagaaaag cttcgtcaaa aaccgtctcc tggccacagt cggaggcccc gccagagagg 420 ggagcagcca ccccaaaccc atgttctgcc ggctcccatg accccgtgca cctggagccc 480 cacggtgtcc ccactggatg ggaggacaag ggccgggggc tccggcgggt cggggcaggg 540 gcttgatggc ttccttctgc cgtggcccca ttgcccctgg ctggagttga cccttctgac 600 aagtgtcctc agagagtcag ggatcagtgg cacctcccaa catcaacccc acgcagccca 660 ggcacaaacc ccacatccag ggccaactcc aggaacagag acaccccaat accctggggg 720 accccgaccc tgatgactcc cgtcccatct ctgtccctca cttggggcct gctgcggggc 780 gagcacttgg gagcaaactc aggcttaggg gacaccactg tgggcctgac ctcgagcagg 840 ccacagaccc ttccctcctg ccctggtgca gcacagactt tggggtctgg gcagggagga 900 acttctggca ggtcaccaag cacagagccc ccaggctgag gtggccccag ggggaacccc 960 agcaggtggc ccactaccct tcctcccagc tggaccccat gtcttcccca agataggggt 1020 gccatccaag gcaggtcctc catggagccc ccttcaggct cctctccaga ccccactggg 1080 cctcagtccc cactctagga atgcagccac cacgggcaca ccaggcagcc caggcccagc 1140 caccctgcag tgcccaagcc cacaccctgg aggagagcag ggtgcgtctg ggaggggctg 1200 ggctccccac ccccaccccc acctgcacac cccacccacc cttgcccggg ccccctgcag 1260 gagggtcaga gcccccatgg gatatggact tagggtctca ctcacgcacc tcccctcctg 1320 ggagaagggg tctcatgccc agatcccccc agcagcgctg gtcacaggta gaggcagtgg 1380 ccccagggcc accctgacct ggcccctcag gctcctctag ccctggctgc cctgctgtcc 1440 ctgggaggcc tgggctccac cagaccacag gtctagggca ccgcccacac tggggccgcc 1500 cacacacagc tcacaggaag aagataagct ccagaccccc aggcccggga cctgccttgc 1560 tgctacgact tcctgcccca gacctcgttg ccctcccccg tccacttaca cacaggccag 1620 gaagctgttc ccacacagac caaccccaga cggggaccac ctggcactca ggtcactgcc 1680 atttccttct ccattcactt ccaatgcctc tgtgcttcct ccctcctcct tccttcgggg 1740 gagcaccctg tgcagctcct ccctgcagtc cacaccctgg ggagacccga ccctgcagcc 1800 cacaccctgg ggagacctga ccctcctcca gccctttctc ccccgctgct cttgccaccc 1860 accaagacag ccctggggtc ctgtccctac agcccccacc cagttctcta cctagacccg 1920 tcttcctccc tctaaacacc tctcccaggc caaccctaca cctgcaggcc ctcccctcca 1980 ctgccaaaga ccctcagttt ctcctgcctg tgcccacccc cgtgctcctc ctgcccacag 2040 ctcgagctct tcctctccta gggcccctga gggatggcat tgaccgtgcc ctcgcaccca 2100 cacactgccc atgccctcac attcctcctg gccactccag ccccactccc ctctcaggcc 2160 tggctctggt atttctggga caaagcctta cccaagtctt tcccatgcag gcctgggccc 2220 ttaccctcac tgcccggtta cagggcagcc tcctgtgcac agaagcaggg agctcagccc 2280 ttccacaggc agaaggcact gaaagaaatc ggcctccagc gccttgacac acgtctgcct 2340 gtgtctctca ctgcccgcac ctgcagggag gctcggcact ccctctaaag acgagggatc 2400 caggcagcag catcacagga gaatgcaggg ctaccagaca tcccagtcct ctcacaggcc 2460 tctcctggga agagacctga agacgcccag tcaacggagt ctaacaccaa acctccctgg 2520 aggccgatgg gtagtaacgg agtcattgcc agacctggag gcaggggagc agtgagcccg 2580 agcccacacc atagggccag aggacagcca ctgacatccc aagccactca ctggtggtcc 2640 cacaacaccc catggaaaga ggacagaccc acagtcccac ctggaccagg gcagagactg 2700 ctgagaccca gcaccagaac caaccaagaa acaccaggca acagcatcag agggggctct 2760 ggcagaacag aggaggggag gtctccttca ccagcaggcg cttcccttga ccgaagacag 2820 gatccatgca actcccccag gacaaaggag gagccccttg ttcagcactg ggctcagagt 2880 cctctccaag acacccagag tttcagacaa aaaccccctg gaatgcacag tctcagcagg 2940 agagccagcc agagccagca agatggggct cagtgacacc cgcagggaca ggaggatttt 3000 gtgggggctc gtgtcactgt gctgcatacc ctgctggacc tgcaagtatt cggcaacagt 3060 gaggttagcc agcatctaga ctatgcccac agtgacacag ccccattcaa aaacccctac 3120 tgcaaacgca ttccacttct ggggctgagg ggctggggga gcgtctggga aatagggctc 3180 aggggtgtcc atcaatgccc aaaacgcacc agactcccct ccatacatca cacccaccag 3240 ccagcgagca gagtaaacag aaaatgagaa gcaagctggg gaagcttgca caggccccaa 3300 ggaaagagct ttggcgggtg tgtaagaggg gatgcgggca gagcctgagc agggcctttt 3360 gctgtttctg ctttcctgtg cagagagttc cataaactgg tgttcgagat caatggctgg 3420 gagtgagccc aggaggacag cgtgggaaga gcacagggaa ggaggagcag ccgctatcct 3480 acactgtcat ctttcgaaag tttgccttgt gcccacactg ctgcatcatg ggatgcttaa 3540 cagctgatgt agacacagct aaagagagaa tcagtgagat ggatttgcag cacagatctg 3600 aataaattct ccagaatgtg gagcagcaca gaagcaagca cacagaaagt gcctgatgca 3660 aggacaaagt tcagtgggca ccttcaggca ttgctgctgg gcacagacac tctgaaaagc 3720 cctggcagga actccctgtg acaaagcaga accctcaggc aatgccagcc ccagagccct 3780 ccctgagagc ctcatgggca aagatgtgca caacaggtgt ttctcatagc cccaaactga 3840 gagcaaagca aacgtccatc tgaaggagaa caggcaaata aacgatggca ggttcatgaa 3900 atgcaaaccc agacagccac aagcacaaaa gtacagggtt ataagcgact ctggttgagt 3960 tcatgacaat gctgagtaat tggagtaaca aagtaaactc caaaaaatac tttcaatgtg 4020 atttcttcta aataaaattt acaccctgca aaatgaactg tcttcttaag ggatacattt 4080 cccagttaga aaaccataaa gaaaaccaag aaaaggatga tcacataaac acagtggtgg 4140 ttacttctgc tggggaagga agagggtatg aactgagata cacagggtgg gcaagtctcc 4200 taacaagaac agaacgaata cattacagta ccttgaaaac agcagttaaa cttctaaatt 4260 gcaagaagag gaaaatgcac acagttgtgt ttagaaaatt ctcagtccag cactgttcat 4320 aatagcaaag acattaaccc aggtcggata aataagcgat gacacaggca attgcacaat 4380 gatacagaca tatatttagt atatgagaca tcgatgatgt atccccaaat aaacgacttt 4440 aaagagataa agggctgatg tgtggtggca ttcacctccc tgggatcccc ggacaggttg 4500 caggctcact gtgcagcagg gcaggcgggt acctgctggc agttcctggg gcctgatgtg 4560 gagcaagcgc agggccatat atcccggagg acggcacagt cagtgaattc cagagagaag 4620 caactcagcc acactcccca ggcagagccc gagagggacg cccacgcaca gggaggcaga 4680 gcccagcacc tccgcagcca gcaccacctg cgcacgggcc accaccttgc aggcacagag 4740 tgggtgctga gaggaggggc agggacacca ggcagggtga gcacccagag aaaactgcag 4800 acgcctcaca catccacctc agcctcccct gacctggacc tcactggcct gggcctcact 4860 taacctgggc ttcacctgac cttggcctca cctgacttgg acctcgcctg tcccaagctt 4920 tacctgacct gggcctcaac tcacctgaac gtctcctgac ctgggtttaa cctgtcctgg 4980 aactcacctg gccttggctt cccctgacct ggacctcatc tggcctgggc ttcacctggc 5040 ctgggcctca cctgacctgg acctcatctg gcctggacct cacctggcct ggacttcacc 5100 tggcctgggc ttcacctgac ctggacctca cctggcctcg ggcctcacct gcacctgctc 5160 caggtcttgc tggagcctga gtagcactga gggtgcagaa gctcatccag ggttggggaa 5220 tgactctaga agtctcccac atctgacctt tctgggtgga ggcagctggt ggccctggga 5280 atataaaaat ctccagaatg atgactctgt gatttgtggg caacttatga acccgaaagg 5340 acatggccat ggggtgggta gggacatagg gacagatgcc agcctgaggt ggagcctcag 5400 gacacaggtg ggcacggaca ctatccacat aagcgaggga tagacccgag tgtccccaca 5460 gcagacctga gagcgctggg cccacagcct cccctcagag ccctgctgcc tcctccggtc 5520 agccctggac atcccaggtt tccccaggcc tggcggtagg attttgttga ggtctgtgtc 5580 actgtgcatg gcagctactg ccagcccgca gccactggct actgaggatg ccgattctga 5640 gaatagcagc ttctactact atgactacct ggatgaagta gctttcatgc tccacagtgt 5700 cacagagtcc atcaaaaacc catgcctgga agcttcccgc cacagccctc cccatggggc 5760 cctgctgcct cctcaggtca gccccggaca tcccgggttt ccccaggctg ggcggtagga 5820 ttttgttgag gtctgtgtca ctgtgccaaa cccatgaaaa ccccaaggga gtttggaaca 5880 gccatgccga tttcggcggg catggcacca tttggaagct cttcctccgg ttccagcaga 5940 acctgctacc cacagtgtca cagagtccat caaaaaccca tccctgggag cctcccgcca 6000 cagccctccc tgcaggggac cggtacgtgc catgttagga ttttgatcga ggagacagca 6060 ccatgggtat ggtggctacc acagcagtgc agcctgtgac ccaaacccgc agggcagcag 6120 gcacgatgga caggcccgtg actgaccacg ctgggctcca gcctgccagc cctggagatc 6180 atgaaacaga tggccaaggt caccctacag gtcatccaga tctggctccg aggggtctgc 6240 atcgctgctg ccctcccaac gccagtccaa atgggacagg gacggcctca cagcaccatc 6300 tgctgccatc aggccagcga tcccagaagc ccctccctca aggctgggca catgtgtgga 6360 cactgagagc cctcatatct gagtaggggc accaggaggg aggggctggc cctgtgcact 6420 gtccctgccc ctgtggtccc tggcctgcct ggccctgaca cctgagcctc tcctgggtca 6480 tttccaagac agaagacatt cctggggaca gccggagctg ggcgtcgctc atcctgcccg 6540 gccgtcctga gtcctgctca tttccagacc tcaccgggga agccaacaga ggactcgcct 6600 cccacattca gagacaaaga accttccaga aatccctgcc tctctcccca gtggacaccc 6660 tcttccagga cagtcctcag tggcatcaca gcggcctgag atccccagga cgcagcaccg 6720 ctgtcaatag gggccccaaa tgcctggacc agggcctgcg tgggaaaggc ctctggccac 6780 actcggggat tttgtgaagg gccctcccac tgtgccagct tcttgagcca tgccgatttc 6840 ggcgggcatg gcaccatttg gaagctcttc ctccggttcc agcagaacct gctaccacag 6900 tgatgaaccc agtgtcaaaa accggctgga aacccagggg ctgtgtgcac gcctcagctt 6960 ggagctctcc aggagcacaa gagccgggcc caaggatttg tgcccagacc ctcagcctct 7020 agggacacct gggtcatctc agcctgggct ggtgccctgc acaccatctt cctccaaata 7080 ggggcttcag agggctctga ggtgacctca ctcatgacca caggtgacct ggcccttccc 7140 tgccagctat accagaccct gtcttgacag atgccccgat tccaacagcc aattcctggg 7200 accctgaata gctgtagaca ccagcctcat tccagtacct cctgccaatt gcctggattc 7260 ccatcctggc tggaatcaag aaggcagcat ccgccaggct cccaacaggc aggactcccg 7320 cacaccctcc tctgagaggc cgctgtgttc cgcagggcca ggccctggac agttcccctc 7380 acctgccact agagaaacac ctgccattgt cgtccccacc tggaaaagac cactcgtgga 7440 gcccccagcc ccaggtacag ctgtagagac agtcctcgag gcccctaaga aggagccatg 7500 cccagttctg ccgggaccct cggccaggcc gacaggagtg gacgctggag ctgggcccac 7560 actgggccac ataggagctc accagtgagg gcaggagagc acatgccggg gagcacccag 7620 cctcctgctg accagaggcc cgtcccagag cccaggaggc tgcagaggcc tctccaggga 7680 gacactgtgc atgtctggta cctaagcagc cccccacgtc cccagtcctg ggggcccctg 7740 gctcagctgt ctgggccctc cctgctccct gggaagctcc tcctgacagc cccgcctcca 7800 gttccaggtg tggattttgt caggcgatgt cacactgtgc agcttcttga gcaagcacag 7860 tggtgccgcc catatcaaaa accaggccaa gtagacaggc ccctgctgcg cagccccagg 7920 catccacttc acctgcttct cctggggctc tcaaggctgc tgtctgtcct ctggccctct 7980 gtggggaggg ttccctcagt gggaggtctg tgctccaggg cagggatgat tgagatagaa 8040 atcaaaggct ggcagggaaa ggcagcttcc cgccctgaga ggtgcaggca gcaccacgga 8100 gccacggagt cacagagcca cggagccccc attgtgggca tttgagagtg ctgtgccccc 8160 ggcaggccca gccctgatgg ggaagcctgt cccatcccac agcccgggtc ccacgggcag 8220 cgggcacaga agctgccagg ttgtcctcta tgatcctcat ccctccagca gcatcccctc 8280 cacagtgggg aaactgaggc ttggagcacc acccggcccc ctggaaatga ggctgtgagc 8340 ccagacagtg ggcccagagc actgtgagta ccccggcagt acctggctgc agggatcagc 8400 cagagatgcc aaaccctgag tgaccagcct acaggaggat ccggccccac ccaggccact 8460 cgattaatgc tcaaccccct gccctggaga cctcttccag taccaccagc agctcagctt 8520 ctcagggcct catccctgca aggaaggtca agggctgggc ctgccagaaa cacagcaccc 8580 tccctagccc tggctaagac agggtgggca gacggctgtg gacgggacat attgctgggg 8640 catttctcac tgtcacttct gggtggtagc tctgacaaaa acgcagaccc tgccaaaatc 8700 cccactgcct cccgctaggg gctggcctgg aatcctgctg tcctaggagg ctgctgacct 8760 ccaggatggc tccgtcccca gttccagggc gagagcagat cccaggcagg ctgtaggctg 8820 ggaggccacc cctgcccttg ccggggttga atgcaggtgc ccaaggcagg aaatggcatg 8880 agcacaggga tgaccgggac atgccccacc agagtgcgcc ccttcctgct ctgcaccctg 8940 caccccccag gccagcccac gacgtccaac aactgggcct gggtggcagc cccacccaga 9000 caggacagac ccagcaccct gaggaggtcc tgccaggggg agctaagagc catgaaggag 9060 caagatatgg ggcccccgat acaggcacag atgtcagctc catccaggac cacccagccc 9120 acaccctgag aggaacgtct gtctccagcc tctgcaggtc gggaggcagc tgacccctga 9180 cttggacccc tattccagac accagacaga ggcgcaggcc ccccagaacc agggttgagg 9240 gacgccccgt caaagccaga caaaaccaag gggtgttgag cccagcaagg gaaggccccc 9300 aaacagacca ggaggatttt gtaggtgtct gtgtcactgt gcatggcagc tactgccagc 9360 ccgcagccac tggctactga ggatgccgat tctgagaata gcagcttcta ctactatgac 9420 tacctggatg aagtagcttt catgctcagc cggaaggatg ctgtggttag ctttggcaaa 9480 gttttcctgc cacccacagt gacactcacc cagtcaaaaa ccccattcca agtcagcgga 9540 agcagagaga gcagggagga cacgtttagg atctgagact gcacctgaca cccaggccag 9600 cagacgtctc ccctccaggg caccccaccc tgtcctgcat ttctgcaaga tcaggggcgg 9660 cctgaggggg ggtctagggt gaggagatgg gtcccctgta caccaaggag gagttaggca 9720 ggtcccgagc actcttaatt aaacgacgcc tcgaatggaa ctactacaac gaatggttgc 9780 tctacgtaat gcattcgcta ccttaggacc gttatagtta ggcgcgcc 9828 <210> 133 <211> 9894 <212> DNA <213> Artificial Sequence <220> <223> D6-DH114619 <400> 133 tacgtattaa ttaaacgacg cctcgaatgg aactactaca acgaatggtt gctctcccca 60 ttgaggctga cctgcccaga gagtcctggg cccaccccac acaccggggc ggaatgtgtg 120 caggcctcgg tctctgtggg tgttccgcta gctggggctc acagtgctca ccccacacct 180 aaaatgagcc acagcctccg gagcccccgc aggagacccc gcccacaagc ccagccccca 240 cccaggaggc cccagagctc agggcgcccc gtcggatttt gtacagcccc gagtcactgt 300 gcaaacccat gaaaacccca agggagtttg gaaccacagt gagaatagct acgtcaaaaa 360 ccgtccagtg gccactgccg gaggccccgc cagagagggc agcagccact ctgatcccat 420 gtcctgccgg ctcccatgac ccccagcacg cggagcccca cagtgtcccc actggatggg 480 aggacaagag ctggggattc cggcgggtcg gggcaggggc ttgatcgcat ccttctgccg 540 tggctccagt gcccctggct ggagttgacc cttctgacaa gtgtcctcag agagacaggc 600 atcaccggcg cctcccaaca tcaaccccag gcagcacagg cacaaacccc acatccagag 660 ccaactccag gagcagagac accccaatac cctgggggac cccgaccctg atgacttccc 720 actggaattc gccgtagagt ccaccaggac caaagaccct gcctctgcct ctgtccctca 780 ctcaggacct gctgccgggc gaggccttgg gagcagactt gggcttaggg gacaccagtg 840 tgaccccgac cttgaccagg acgcagacct ttccttcctt tcctggggca gcacagactt 900 tggggtctgg gccaggagga acttctggca ggtcgccaag cacagaggcc acaggctgag 960 gtggccctgg aaagacctcc aggaggtggc cactcccctt cctcccagct ggaccccatg 1020 tcctccccaa gataagggtg ccatccaagg caggtgctcc ttggagcccc attcagactc 1080 ctccctggac cccactgggc ctcagtccca gctctgggga tgaagccacc acaagcacac 1140 caggcagccc aggcccagcc accctgcagt gcccaagcac acactctgga gcagagcagg 1200 gtgcctctgg gaggggctga gctccccacc ccacccccac ctgcacaccc cacccacccc 1260 tgcccagcgg ctctgcagga gggtcagagc cccacatggg gtatggactt agggtctcac 1320 tcacgtggct cccatcatga gtgaaggggc ctcaagccca ggttcccaca gcagcgcctg 1380 tcgcaagtgg aggcagaggc ccgagggcca ccctgacctg gtccctgagg ttcctgcagc 1440 ccaggctgcc ctgctgtccc tgggaggcct gggctccacc agaccacagg tccagggcac 1500 cgggtgcagg agccacccac acacagctca caggaagaag ataagctcca gacccccagg 1560 gccagaacct gccttcctgc tactgcttcc tgccccagac ctgggcgccc tcccccgtcc 1620 acttacacac aggccaggaa gctgttccca cacagaacaa ccccaaacca ggaccgcctg 1680 gcactcaggt ggctgccatt tccttctcca tttgctccca gcgcctctgt cctccctggt 1740 tcctccttcg ggggaacagc ctgtgcagcc agtccctgca gcccacaccc tggggagacc 1800 caaccctgcc tggggccctt ccaaccctgc tgctcttact gcccacccag aaaactctgg 1860 ggtcctgtcc ctgcagtccc taccctggtc tccacccaga cccctgtgta tcactccaga 1920 cacccctccc aggcaaaccc tgcacctgca ggccctgtcc tcttctgtcg ctagagcctc 1980 agtttctccc ccctgtgccc acaccctacc tcctcctgcc cacaactcta actcttcttc 2040 tcctggagcc cctgagccat ggcattgacc ctgccctccc accacccaca gcccatgccc 2100 tcaccttcct cctggccact ccgaccccgc cccctctcag gccaagccct ggtatttcca 2160 ggacaaaggc tcacccaagt ctttcccagg caggcctggg ctcttgccct cacttcccgg 2220 ttacacggga gcctcctgtg cacagaagca gggagctcag cccttccaca ggcagaaggc 2280 actgaaagaa atcggcctcc agcaccttga cacacgtccg cccgtgtctc tcactgcccg 2340 cacctgcagg gaggctccgc actccctcta aagacaaggg atccaggcag cagcatcacg 2400 ggagaatgca gggctcccag acatcccagt cctctcacag gcctctcctg ggaagagacc 2460 tgcagccacc accaaacagc cacagaggct gctggatagt aactgagtca atgaccgacc 2520 tggagggcag gggagcagtg agccggagcc cataccatag ggacagagac cagccgctga 2580 catcccgagc tcctcaatgg tggccccata acacacctag gaaacataac acacccacag 2640 ccccacctgg aacagggcag agactgctga gcccccagca ccagccccaa gaaacaccag 2700 gcaacagtat cagagggggc tcccgagaaa gagaggaggg gagatctcct tcaccatcaa 2760 atgcttccct tgaccaaaaa cagggtccac gcaactcccc caggacaaag gaggagcccc 2820 ctatacagca ctgggctcag agtcctctct gagacaccct gagtttcaga caacaacccg 2880 ctggaatgca cagtctcagc aggagaacag accaaagcca gcaaaaggga cctcggtgac 2940 accagtaggg acaggaggat tttgtggggg ctcgtgtcac tgtgcaaacc catgaaaacc 3000 ccaagggagt ttggaactgc aagcacagtg acacagaccc attcaaaaac ccctactgca 3060 aacacaccca ctcctggggc tgaggggctg ggggagcgtc tgggaagtag ggtccagggg 3120 tgtctatcaa tgtccaaaat gcaccagact ccccgccaaa caccacccca ccagccagcg 3180 agcagggtaa acagaaaatg agaggctctg ggaagcttgc acaggcccca aggaaagagc 3240 tttggcgggt gtgcaagagg ggatgcaggc agagcctgag cagggccttt tgctgtttct 3300 gctttcctgt gcagagagtt ccataaactg gtgttcaaga tcagtggctg ggaatgagcc 3360 caggagggca gtctgtggga agagcacagg gaaggaggag cagccgctat cctacactgt 3420 catctttcaa aagtttgcct tgtgaccaca ctattgcatc atgggatgct taagagctga 3480 tgtagacaca gctaaagaga gaatcagtga gatgaatttg cagcatagat ctgaataaac 3540 tctccagaat gtggagcagt acagaagcaa acacacagaa agtgcctgat gcaaggacaa 3600 agttcagtgg gcaccttcag gcattgctgc tgggcacaga cactctgaaa agccttggca 3660 ggatctccct gcgacaaagc agaaccctca ggcaatgcca gccccagagc cctccctgag 3720 agcgtcatgg ggaaagatgt gcagaacagc tgattatcat agactcaaac tgagaacaga 3780 gcaaacgtcc atctgaagaa cagtcaaata agcaatggta ggttcatgca atgcaaaccc 3840 agacagccag gggacaacag tagagggcta caggcggctt tgcggttgag ttcatgacaa 3900 tgctgagtaa ttggagtaac agaggaaagc ccaaaaaata cttttaatgt gatttcttct 3960 aaataaaatt tacaccaggc aaaatgaact gtcttcttaa gggataaact ttcccctgga 4020 aaaactacaa ggaaaattaa gaaaacgatg atcacataaa cacagttgtg gttacttcta 4080 ctggggaagg aagagggtat gagctgagac acacagagtc ggcaagtctc caagcaagca 4140 cagaacgaat acattacagt accttgaata cagcagttaa acttctaaat cgcaagaaca 4200 ggaaaatgca cacagctgtg tttagaaaat tctcagtcca gcactattca taatagcaaa 4260 gacattaacc caggttggat aaataaatga tgacacaggc aattgcacaa tgatacagac 4320 atacatttag tacatgagac atcgatgatg tatccccaaa gaaatgactt taaagagaaa 4380 aggcctgatg tgtggtggca ctcacctccc tgggatcccc ggacaggttg caggcacact 4440 gtgtggcagg gcaggctggt acatgctggc agctcctggg gcctgatgtg gagcaagcgc 4500 agggctgtat acccccaagg atggcacagt cagtgaattc cagagagaag cagctcagcc 4560 acactgccca ggcagagccc gagagggacg cccacgtaca gggaggcaga gcccagctcc 4620 tccacagcca ccaccacctg tgcacgggcc accaccttgc aggcacagag tgggtgctga 4680 gaggaggggc agggacacca ggcagggtga gcacccagag aaaactgcag aagcctcaca 4740 catccacctc agcctcccct gacctggacc tcacctggtc tggacctcac ctggcctggg 4800 cctcacctga cctggacctc acctggcctg ggcttcacct gacctggacc tcacctggcc 4860 tccggcctca cctgcacctg ctccaggtct tgctggaacc tgagtagcac tgaggctgca 4920 gaagctcatc cagggttggg gaatgactct ggaactctcc cacatctgac ctttctgggt 4980 ggaggcatct ggtggccctg ggaatataaa aagccccaga atggtgcctg cgtgatttgg 5040 gggcaattta tgaacccgaa aggacatggc catggggtgg gtagggacat agggacagat 5100 gccagcctga ggtggagcct caggacacag ttggacgcgg acactatcca cataagcgag 5160 ggacagaccc gagtgttcct gcagtagacc tgagagcgct gggcccacag cctcccctcg 5220 gtgccctgct gcctcctcag gtcagccctg gacatcccgg gtttccccag gccagatggt 5280 aggattttgt tgaggtctgt gtcactgtgc atggcagcta ctgccagccc gcagccactg 5340 gctactgagg atgccgattc tgagaatagc agcttctact actatgacta cctggatgaa 5400 gtagctttca tgctctgcga ggttagccag catctagact atgcccacag tgtcacacgg 5460 tccatcaaaa acccatgcca cagccctccc cgcaggggac cgccgcgtgc catgttacga 5520 ttttgatcga ggacacagcg ccatgggtat ggtggctacc acagcagtgc agcccatgac 5580 ccaaacacac agggcagcag gcacaatgga caggcctgtg agtgaccatg ctgggctcca 5640 gcccgccagc cccggagacc atgaaacaga tggccaaggt caccccacag ttcagccaga 5700 catggctccg tggggtctgc atcgctgctg ccctctaaca ccagcccaga tggggacaag 5760 gccaacccca cattaccatc tcctgctgtc cacccagtgg tcccagaagc ccctccctca 5820 tggctgagcc acatgtgtga accctgagag caccccatgt cagagtaggg gcagcagaag 5880 ggcggggctg gccctgtgca ctgtccctgc acccatggtc cctcgcctgc ctggccctga 5940 cacctgagcc tcttctgagt catttctaag atagaagaca ttcccgggga cagccggagc 6000 tgggcgtcgc tcatcccgcc cggccgtcct gagtcctgct tgtttccaga cctcaccagg 6060 gaagccaaca gaggactcac ctcacacagt cagagacaaa gaaccttcca gaaatccctg 6120 tctcactccc cagtgggcac cttcttccag gacattcctc ggtcgcatca cagcaggcac 6180 ccacatctgg atcaggacgg cccccagaac acaagatggc ccatggggac agccccacaa 6240 cccaggcctt cccagacccc taaaaggcgt cccaccccct gcacctgccc cagggctaaa 6300 aatccaggag gcttgactcc cgcataccct ccagccagac atcacctcag ccccctcctg 6360 gaggggacag gagcccggga gggtgagtca gacccacctg ccctcgatgg caggcgggga 6420 agattcagaa aggcctgaga tccccaggac gcagcaccac tgtcaatggg ggccccagac 6480 gcctggacca gggcctgcgt gggaaaggcc gctgggcaca ctcaggggga ttttgtgaag 6540 gcccctccca ctgtgcagct tcttgtgcaa gcaaacccat gaaaacccca agggagtttg 6600 gaactgccat gccgatttcg gcgggcatgg caccatttgg aagctcttcc tccggttcca 6660 gcagaacctg ctaccacagt gatgaaacta gcatcaaaaa ccggccggac acccagggac 6720 catgcacact tctcagcttg gagctctcca ggaccagaag agtcaggtct gagggtttgt 6780 agccagaccc tcggcctcta gggacaccct ggccatcaca gcggatgggc tggtgcccca 6840 catgccatct gctccaaaca ggggcttcag agggctctga ggtgacttca ctcatgacca 6900 caggtgccct ggccccttcc ccgccagcta caccgaaccc tgtcccaaca gctgccccag 6960 ttccaacagc caattcctgg ggcccagaat tgctgtagac accagcctcg ttccagcacc 7020 tcctgccaat tgcctggatt cacatcctgg ctggaatcaa gagggcagca tccgccaggc 7080 tcccaacagg caggactccc gcacaccctc ctctgagagg ccgctgtgtt ccgcagggcc 7140 aggccctgga cagttcccct cacctgccac tagagaaaca cctgccattg tcgtccccac 7200 ctggaaaaga ccactcgtgg agcccccagc cccaggtaca gctgtagaga gactccccga 7260 gggatctaag aaggagccat gcgcagttct gccgggaccc tcggccaggc cgacaggagt 7320 ggacactgga gctgggccca cactgggcca cataggagct caccagtgag ggcaggagag 7380 cacatgccgg ggagcaccca gcctcctgct gaccagaggc ccgtcccaga gcccaggagg 7440 ctgcagaggc ctctccaggg ggacactgtg catgtctggt ccctgagcag ccccccacgt 7500 ccccagtcct gggggcccct ggcacagctg tctggaccct ccctgttccc tgggaagctc 7560 ctcctgacag ccccgcctcc agttccaggt gtggattttg tcagggggtg tcacactgtg 7620 ctgcataccc tgctggacct gcaagtattc ggcaactgtc ggaaggatgc tgtggttagc 7680 tttggcaaag ttttcctgcc accacagtgg tgctgcccat atcaaaaacc aggccaagta 7740 gacaggcccc tgctgtgcag ccccaggcct ccacttcacc tgcttctcct ggggctctca 7800 aggtcactgt tgtctgtact ctgccctctg tggggagggt tccctcagtg ggaggtctgt 7860 tctcaacatc ccagggcctc atgtctgcac ggaaggccaa tggatgggca acctcacatg 7920 ccgcggctaa gatagggtgg gcagcctggc gggggacagt acatactgct ggggtgtctg 7980 tcactgtgcc tagtggggca ctggctccca aacaacgcag tcctcgccaa aatccccaca 8040 gcctcccctg ctaggggctg gcctgatctc ctgcagtcct aggaggctgc tgacctccag 8100 aatgtctccg tccccagttc cagggcgaga gcagatccca ggccggctgc agactgggag 8160 gccaccccct ccttcccagg gttcactgga ggtgaccaag gtaggaaatg gccttaacac 8220 agggatgact gcgccatccc ccaacagagt cagccccctc ctgctctgta ccccgcaccc 8280 cccaggccag tccacgaaaa ccagggcccc acatcagagt cactgcctgg cccggccctg 8340 gggcggaccc ctcagccccc accctgtcta gaggacttgg ggggacagga cacaggccct 8400 ctccttatgg ttcccccacc tgcctccggc cgggaccctt ggggtgtgga cagaaaggac 8460 acctgcctaa ttggccccca ggaacccaga acttctctcc agggacccca gcccgagcac 8520 ccccttaccc aggacccagc cctgcccctc ctcccctctg ctctcctctc atcaccccat 8580 gggaatccgg tatccccagg aagccatcag gaagggctga aggaggaagc ggggccgtgc 8640 accaccgggc aggaggctcc gtcttcgtga acccagggaa gtgccagcct cctagagggt 8700 atggtccacc ctgcctgggg ctcccaccgt ggcaggctgc ggggaaggac cagggacggt 8760 gtgggggagg gctcagggcc ctgcgggtgc tcctccatct tcggtgagcc tcccccttca 8820 cccaccgtcc cgcccacctc ctctccaccc tggctgcacg tcttccacac catcctgagt 8880 cctacctaca ccagagccag caaagccagt gcagacaaag gctggggtgc aggggggctg 8940 ccagggcagc ttcggggagg gaaggatgga gggaggggag gtcagtgaag aggccccctt 9000 cccctgggtc caggatcctc ctctgggacc cccggatccc atcccctcct ggctctggga 9060 ggagaagcag gatgggagaa tctgtgcggg accctctcac agtggaatat ccccacagcg 9120 gctcaggcca gacccaaaag cccctcagtg agccctccac tgcagtcctg ggcctgggta 9180 gcagcccctc ccacagagga cagacccagc accccgaaga agtcctgcca gggggagctc 9240 agagccatga aagagcagga tatggggtcc ccgatacagg cacagacctc agctccatcc 9300 aggcccaccg ggacccacca tgggaggaac acctgtctcc gggttgtgag gtagctggcc 9360 tctgtctcgg accccactcc agacaccaga cagaggggca ggccccccaa aaccagggtt 9420 gagggatgat ccgtcaaggc agacaagacc aaggggcact gaccccagca agggaaggct 9480 cccaaacaga cgaggaggat tttgtagctg tctgtatcac tgtgcagctt cttgtgccat 9540 gccgatttcg gcgggcatgg caccatttgg aagctcttcc tccggttcca gcagaacctg 9600 ctaccacagt gacactcgcc aggtcaaaaa ccccgtccca agtcagcgga agcagagaga 9660 gcagggagga cacgtttagg atctgaggcc gcacctgaca cccagggcag cagacgtctc 9720 ccctccaggg caccctccac cgtcctgcgt ttcttcaaga ataggggcgg cctgaggggg 9780 tccagggcca ggcgataggt cccctctacc ccaaggagga gccaggcagg acccgagcac 9840 cgatgcatct aacgcagtca tgtaatgctg ggtgacagtc agttcgccta cgta 9894 <210> 134 <211> 11977 <212> DNA <213> Artificial Sequence <220> <223> D6-DH120126 <400> 134 tacgtaatgc atctaacgca gtcatgtaat gctgggtgac agtcagttcg cctccccatt 60 gaggctgacc tgcccagacg ggcctgggcc caccccacac accggggcgg aatgtgtgca 120 ggccccagtc tctgtgggtg ttccgctagc tggggccccc agtgctcacc ccacacctaa 180 agcgagcccc agcctccaga gccccctaag cattccccgc ccagcagccc agcccctgcc 240 cccacccagg aggccccaga gctcagggcg cctggtcgga ttttgtacag ccccgagtca 300 ctgtgcatgc cgatttcggc gggcatggca ccatttggaa gctcttcctc cggttccagc 360 agaacctgct accacagtga gaaaaactgt gtcaaaaacc gactcctggc agcagtcgga 420 ggccccgcca gagaggggag cagccggcct gaacccatgt cctgccggtt cccatgaccc 480 ccagcaccca gagccccacg gtgtccccgt tggataatga ggacaagggc tgggggctcc 540 ggtggtttgc ggcagggact tgatcacatc cttctgctgt ggccccattg cctctggctg 600 gagttgaccc ttctgacaag tgtcctcaga aagacaggga tcaccggcac ctcccaatat 660 caaccccagg cagcacagac acaaacccca catccagagc caactccagg agcagagaca 720 ccccaacact ctgggggacc ccaaccgtga taactcccca ctggaatccg ccccagagtc 780 taccaggacc aaaggccctg ccctgtctct gtccctcact cagggcctcc tgcagggcga 840 gcgcttggga gcagactcgg tcttagggga caccactgtg ggccccaact ttgatgaggc 900 cactgaccct tccttccttt cctggggcag cacagacttt ggggtctggg cagggaagaa 960 ctactggctg gtggccaatc acagagcccc caggccgagg tggccccaag aaggccctca 1020 ggaggtggcc actccacttc ctcccagctg gaccccaggt cctccccaag ataggggtgc 1080 catccaaggc aggtcctcca tggagccccc ttcagactcc tcccgggacc ccactggacc 1140 tcagtccctg ctctgggaat gcagccacca caagcacacc aggaagccca ggcccagcca 1200 ccctgcagtg ggcaagccca cactctggag cagagcaggg tgcgtctggg aggggctaac 1260 ctccccaccc cccacccccc atctgcacac agccacctac cactgcccag accctctgca 1320 ggagggccaa gccaccatgg ggtatggact tagggtctca ctcacgtgcc tcccctcctg 1380 ggagaagggg cctcatgccc agatccctgc agcactagac acagctggag gcagtggccc 1440 cagggccacc ctgacctggc atctaaggct gctccagccc agacagcact gccgttcctg 1500 ggaagcctgg gctccaccag accacaggtc cagggcacag cccacaggag ccacccacac 1560 acagctcaca ggaagaagat aagctccaga ccccagggcg ggacctgcct tcctgccacc 1620 acttacacac aggccaggga gctgttccca cacagatcaa ccccaaaccg ggactgcctg 1680 gcactagggt cactgccatt tccctctcca ttccctccca gtgcctctgt gctccctcct 1740 tctggggaac accctgtgca gcccctccct gcagcccaca cgctggggag accccaccct 1800 gcctcgggcc ttttctacct gctgcacttg ccgcccaccc aaacaaccct gggtacgtga 1860 ccctgcagtc ctcaccctga tctgcaacca gacccctgtc cctccctcta aacacccctc 1920 ccaggccaac tctgcacctg caggccctcc gctcttctgc cacaagagcc tcaggttttc 1980 ctacctgtgc ccacccccta acccctcctg cccacaactt gagttcttcc tctcctggag 2040 cccttgagcc atggcactga ccctacactc ccacccacac actgcccatg ccatcacctt 2100 cctcctggac actctgaccc cgctcccctc cctctcagac ccggccctgg tatttccagg 2160 acaaaggctc acccaagtct tccccatgca ggcccttgcc ctcactgcct ggttacacgg 2220 gagcctcctg tgcgcagaag cagggagctc agctcttcca caggcagaag gcactgaaag 2280 aaatcagcct ccagtgcctt gacacacgtc cgcctgtgtc tctcactgcc tgcacctgca 2340 gggaggctcc gcactccctc taaagatgag ggatccaggc agcaacatca cgggagaatg 2400 cagggctccc agacagccca gccctctcgc aggcctctcc tgggaagaga cctgcagcca 2460 ccactgaaca gccacggagg tcgctggata gtaaccgagt cagtgaccga cctggagggc 2520 aggggagcag tgaaccggag cccataccat agggacagag accagccgct aacatcccga 2580 gcccctcact ggcggcccca gaacaccccg tggaaagaga acagacccac agtcccacct 2640 ggaacagggc agacactgct gagcccccag caccagcccc aagaaacact aggcaacagc 2700 atcagagggg gctcctgaga aagagaggag gggaggtctc cttcaccatc aaatgcttcc 2760 cttgaccaaa aacagggtcc acgcaactcc cccaggacaa aggaggagcc ccctgtacag 2820 cactgggctc agagtcctct ctgagacagg ctcagtttca gacaacaacc cgctggaatg 2880 cacagtctca gcaggagagc caggccagag ccagcaagag gagactcggt gacaccagtc 2940 tcctgtaggg acaggaggat tttgtggggg ttcgtgtcac tgtgcaaacc catgaaaacc 3000 ccaagggagt ttggaacagc aagcacagtg acacaacccc attcaaaaac ccctactgca 3060 aacgcaccca ctcctgggac tgaggggctg ggggagcgtc tgggaagtat ggcctagggg 3120 tgtccatcaa tgcccaaaat gcaccagact ctccccaaga catcacccca ccagccagtg 3180 agcagagtaa acagaaaatg agaagcagct gggaagcttg cacaggcccc aaggaaagag 3240 ctttggcagg tgtgcaagag gggatgtggg cagagcctca gcagggcctt ttgctgtttc 3300 tgctttcctg tgcagagagt tccataaact ggtattcaag atcaatggct gggagtgagc 3360 ccaggaggac agtgtgggaa gagcacaggg aaggaggagc agccgctatc ctacactgtc 3420 atcttttgaa agtttgccct gtgcccacaa tgctgcatca tgggatgctt aacagctgat 3480 gtagacacag ctaaagagag aatcagtgaa atggatttgc agcacagatc tgaataaatc 3540 ctccagaatg tggagcagca cagaagcaag cacacagaaa gtgcctgatg ccaaggcaaa 3600 gttcagtggg caccttcagg cattgctgct gggcacagac actctgaaaa gcactggcag 3660 gaactgcctg tgacaaagca gaaccctcag gcaatgccag ccctagagcc cttcctgaga 3720 acctcatggg caaagatgtg cagaacagct gtttgtcata gccccaaact atggggctgg 3780 acaaagcaaa cgtccatctg aaggagaaca gacaaataaa cgatggcagg ttcatgaaat 3840 gcaaactagg acagccagag gacaacagta gagagctaca ggcggctttg cggttgagtt 3900 catgacaatg ctgagtaatt ggagtaacag aggaaagccc aaaaaatact tttaatgtga 3960 tttcttctaa ataaaattta cacccggcaa aatgaactat cttcttaagg gataaacttt 4020 cccctggaaa aactataagg aaaatcaaga aaacgatgat cacataaaca cagtggtggt 4080 tacttctact ggggaaggaa gagggtatga gctgagacac acagagtcgg caagtctcct 4140 aacaagaaca gaacaaatac attacagtac cttgaaaaca gcagttaaac ttctaaatcg 4200 caagaagagg aaaatgcaca cacctgtgtt tagaaaattc tcagtccagc actgttcata 4260 atagcaaaga cattaaccca ggttggataa ataagcgatg acacaggcaa ttgcacaatg 4320 atacagacat acattcagta tatgagacat cgatgatgta tccccaaaga aatgacttta 4380 aagagaaaag gcctgatgtg tggtggcaat cacctccctg ggcatccccg gacaggctgc 4440 aggctcactg tgtggcaggg caggcaggca cctgctggca gctcctgggg cctgatgtgg 4500 agcaggcaca gagctgtata tccccaagga aggtacagtc agtgcattcc agagagaagc 4560 aactcagcca cactccctgg ccagaaccca agatgcacac ccatgcacag ggaggcagag 4620 cccagcacct ccgcagccac caccacctgc gcacgggcca ccaccttgca ggcacagagt 4680 gggtgctgag aggaggggca gggacaccag gcagggtgag cacccagaga aaactgcaga 4740 agcctcacac atccctcacc tggcctgggc ttcacctgac ctggacctca cctggcctcg 4800 ggcctcacct gcacctgctc caggtcttgc tggagcctga gtagcactga ggctgtaggg 4860 actcatccag ggttggggaa tgactctgca actctcccac atctgacctt tctgggtgga 4920 ggcacctggt ggcccaggga atataaaaag ccccagaatg atgcctgtgt gatttggggg 4980 caatttatga acccgaaagg acatggccat ggggtgggta gggacagtag ggacagatgt 5040 cagcctgagg tgaagcctca ggacacaggt gggcatggac agtgtccacc taagcgaggg 5100 acagacccga gtgtccctgc agtagacctg agagcgctgg gcccacagcc tcccctcggg 5160 gccctgctgc ctcctcaggt cagccctgga catcccgggt ttccccaggc ctggcggtag 5220 gattttgttg aggtctgtgt cactgtgcat ggcagctact gccagcccgc agccactggc 5280 tactgaggat gccgattctg agaatagcag cttctactac tatgactacc tggatgaagt 5340 agctttcatg ctcagcgagg ttagccagca tctagactat gcccacagtg tcacagagtc 5400 catcaaaaac ccatgcctgg gagcctccca ccacagccct ccctgcgggg gaccgctgca 5460 tgccgtgtta ggattttgat cgaggacacg gcgccatggg tatggtggct accacagcag 5520 tgcagcccat gacccaaaca cacggggcag cagaaacaat ggacaggccc acaagtgacc 5580 atgatgggct ccagcccacc agccccagag accatgaaac agatggccaa ggtcacccta 5640 caggtcatcc agatctggct ccaaggggtc tgcatcgctg ctgccctccc aacgccaaac 5700 cagatggaga cagggccggc cccatagcac catctgctgc cgtccaccca gcagtcccgg 5760 aagcccctcc ctgaacgctg ggccacgtgt gtgaaccctg cgagcccccc atgtcagagt 5820 aggggcagca ggagggcggg gctggccctg tgcactgtca ctgcccctgt ggtccctggc 5880 ctgcctggcc ctgacacctg agcctctcct gggtcatttc caagacattc ccagggacag 5940 ccggagctgg gagtcgctca tcctgcctgg ctgtcctgag tcctgctcat ttccagacct 6000 caccagggaa gccaacagag gactcacctc acacagtcag agacaacgaa ccttccagaa 6060 atccctgttt ctctccccag tgagagaaac cctcttccag ggtttctctt ctctcccacc 6120 ctcttccagg acagtcctca gcagcatcac agcgggaacg cacatctgga tcaggacggc 6180 ccccagaaca cgcgatggcc catggggaca gcccagccct tcccagaccc ctaaaaggta 6240 tccccacctt gcacctgccc cagggctcaa actccaggag gcctgactcc tgcacaccct 6300 cctgccagat atcacctcag ccccctcctg gaggggacag gagcccggga gggtgagtca 6360 gacccacctg ccctcaatgg caggcgggga agattcagaa aggcctgaga tccccaggac 6420 gcagcaccac tgtcaatggg ggccccagac gcctggacca gggcctgtgt gggaaaggcc 6480 tctggccaca ctcaggggga ttttgtgaag ggccctccca ctgtggaggt tagccagcat 6540 ctagactatg cccacagtga tgaaaccagc atcaaaaacc gaccggactc gcagggttta 6600 tgcacacttc tcggctcgga gctctccagg agcacaagag ccaggcccga gggtttgtgc 6660 ccagaccctc ggcctctagg gacacccggg ccatcttagc cgatgggctg atgccctgca 6720 caccgtgtgc tgccaaacag gggcttcaga gggctctgag gtgacttcac tcatgaccac 6780 aggtgccctg gtcccttcac tgccagctgc accagaccct gttccgagag atgccccagt 6840 tccaaaagcc aattcctggg gccgggaatt actgtagaca ccagcctcat tccagtacct 6900 cctgccaatt gcctggattc ccatcctggc tggaatcaag agggcagcat ccgccaggct 6960 cccaacaggc aggactccca cacaccctcc tctgagaggc cgctgtgttc cgcagggcca 7020 ggccgcagac agttcccctc acctgcccat gtagaaacac ctgccattgt cgtccccacc 7080 tggcaaagac cacttgtgga gcccccagcc ccaggtacag ctgtagagag agtcctcgag 7140 gcccctaaga aggagccatg cccagttctg ccgggaccct cggccaggcc gacaggagtg 7200 gacgctggag ctgggcccac actgggccac ataggagctc accagtgagg gcaggagagc 7260 acatgccggg gagcacccag cctcctgctg accagagacc cgtcccagag cccaggaggc 7320 tgcagaggcc tctccagggg gacacagtgc atgtctggtc cctgagcagc ccccaggctc 7380 tctagcactg ggggcccctg gcacagctgt ctggaccctc cctgttccct gggaagctcc 7440 tcctgacagc cccgcctcca gttccaggtg tggattttgt cagggggtgc cacactgtgc 7500 tgcataccct gctggacctg caagtattcg gcaacagtcg gaaggatgct gtggttagct 7560 ttggcaaagt tttcctgcca ccacagtggt gccgcccata tcaaaaacca ggccaagtag 7620 acagacccct gccacgcagc cccaggcctc cagctcacct gcttctcctg gggctctcaa 7680 ggctgctgtc tgccctctgg ccctctgtgg ggagggttcc ctcagtggga ggtctgtgct 7740 ccagggcagg gatgactgag atagaaatca aaggctggca gggaaaggca gcttcccgcc 7800 ctgagaggtg caggcagcac cacagagcca tggagtcaca gagccacgga gcccccagtg 7860 tgggcgtgtg agggtgctgg gctcccggca ggcccagccc tgatggggaa gcctgccccg 7920 tcccacagcc caggtcccca ggggcagcag gcacagaagc tgccaagctg tgctctacga 7980 tcctcatccc tccagcagca tccactccac agtggggaaa ctgagccttg gagaaccacc 8040 cagccccctg gaaacaaggc ggggagccca gacagtgggc ccagagcact gtgtgtatcc 8100 tggcactagg tgcagggacc acccggagat ccccatcact gagtggccag cctgcagaag 8160 gacccaaccc caaccaggcc gcttgattaa gctccatccc cctgtcctgg gaacctcttc 8220 ccagcgccac caacagctcg gcttcccagg ccctcatccc tccaaggaag gccaaaggct 8280 gggcctgcca ggggcacagt accctccctt gccctggcta agacagggtg ggcagacggc 8340 tgcagatagg acatattgct ggggcatctt gctctgtgac tactgggtac tggctctcaa 8400 cgcagaccct accaaaatcc ccactgcctc ccctgctagg ggctggcctg gtctcctcct 8460 gctgtcctag gaggctgctg acctccagga tggcttctgt ccccagttct agggccagag 8520 cagatcccag gcaggctgta ggctgggagg ccacccctgt ccttgccgag gttcagtgca 8580 ggcacccagg acaggaaatg gcctgaacac agggatgact gtgccatgcc ctacctaagt 8640 ccgccccttt ctactctgca acccccactc cccaggtcag cccatgacga ccaacaaccc 8700 aacaccagag tcactgcctg gccctgccct ggggaggacc cctcagcccc caccctgtct 8760 agaggagttg gggggacagg acacaggctc tctccttatg gttcccccac ctggctcctg 8820 ccgggaccct tggggtgtgg acagaaagga cgcctgccta attggccccc aggaacccag 8880 aacttctctc cagggacccc agcccgagca cccccttacc caggacccag ccctgcccct 8940 cctcccctct gctctcctct catcactcca tgggaatcca gaatccccag gaagccatca 9000 ggaagggctg aaggaggaag cggggccgct gcaccaccgg gcaggaggct ccgtcttcgt 9060 gaacccaggg aagtgccagc ctcctagagg gtatggtcca ccctgcctgg ggctcccacc 9120 gtggcaggct gcggggaagg accagggacg gtgtggggga gggctcaggg ccctgcaggt 9180 gctccatctt ggatgagccc atccctctca cccaccgacc cgcccacctc ctctccaccc 9240 tggccacacg tcgtccacac catcctgagt cccacctaca ccagagccag cagagccagt 9300 gcagacagag gctggggtgc aggggggccg ccagggcagc tttggggagg gaggaatgga 9360 ggaaggggag gtcagtgaag aggcccccct cccctgggtc taggatccac ctttgggacc 9420 cccggatccc atcccctcca ggctctggga ggagaagcag gatgggagat tctgtgcagg 9480 accctctcac agtggaatac ctccacagcg gctcaggcca gatacaaaag cccctcagtg 9540 agccctccac tgcagtgcag ggcctggggg cagcccctcc cacagaggac agacccagca 9600 ccccgaagaa gtcctgccag ggggagctca gagccatgaa ggagcaagat atggggaccc 9660 caatactggc acagacctca gctccatcca ggcccaccag gacccaccat gggtggaaca 9720 cctgtctccg gcccctgctg gctgtgaggc agctggcctc tgtctcggac ccccattcca 9780 gacaccagac agagggacag gccccccaga accagtgttg agggacaccc ctgtccaggg 9840 cagccaagtc caagaggcgc gctgagccca gcaagggaag gcccccaaac aaaccaggag 9900 gtttctgaag ctgtctgtgt cacagtcggg catagccacg gctaccacaa tgacactggg 9960 caggacagaa accccatccc aagtcagccg aaggcagaga gagcaggcag gacacattta 10020 ggatctgagg ccacacctga cactcaagcc aacagatgtc tcccctccag ggcgccctgc 10080 cctgttcagt gttcctgaga aaacaggggc agcctgaggg gatccagggc caggagatgg 10140 gtcccctcta ccccgaggag gagccaggcg ggaatcccag ccccctcccc attgaggcca 10200 tcctgcccag aggggcccgg acccacccca cacacccagg cagaatgtgt gcaggcctca 10260 ggctctgtgg gtgccgctag ctggggctgc cagtcctcac cccacaccta aggtgagcca 10320 cagccgccag agcctccaca ggagacccca cccagcagcc cagcccctac ccaggaggcc 10380 ccagagctca gggcgcctgg gtggattttg tacagccccg agtcactgtg ctgcataccc 10440 tgctggacct gcaagtattc ggcaaccaca gtgagaaaag ctatgtcaaa aaccgtctcc 10500 cggccactgc tggaggccca gccagagaag ggaccagccg cccgaacata cgaccttccc 10560 agacctcatg acccccagca cttggagctc cacagtgtcc ccattggatg gtgaggatgg 10620 gggccggggc catctgcacc tcccaacatc acccccaggc agcacaggca caaaccccaa 10680 atccagagcc gacaccagga acacagacac cccaataccc tgggggaccc tggccctggt 10740 gacttcccac tgggatccac ccccgtgtcc acctggatca aagaccccac cgctgtctct 10800 gtccctcact cagggcctgc tgaggggcgg gtgctttgga gcagactcag gtttaggggc 10860 caccattgtg gggcccaacc tcgaccagga cacagatttt tctttcctgc cctggggcaa 10920 cacagacttt ggggtctgtg cagggaggac cttctggaaa gtcaccaagc acagagccct 10980 gactgaggtg gtctcaggaa gacccccagg agggggcttg tgccccttcc tctcatgtgg 11040 accccatgcc ccccaagata ggggcatcat gcagggcagg tcctccatgc agccaccact 11100 aggcaactcc ctggcgccgg tccccactgc gcctccatcc cggctctggg gatgcagcca 11160 ccatggccac accaggcagc ccgggtccag caaccctgca gtgcccaagc ccttggcagg 11220 attcccagag gctggagccc acccctcctc atccccccac acctgcacac acacacctac 11280 cccctgccca gtccccctcc aggagggttg gagccgccca tagggtgggg gctccaggtc 11340 tcactcactc gcttcccttc ctgggcaaag gagcctcgtg ccccggtccc ccctgacggc 11400 gctgggcaca ggtgtgggta ctgggcccca gggctcctcc agccccagct gccctgctct 11460 ccctgggagg cctgggcacc accagaccac cagtccaggg cacagcccca gggagccgcc 11520 cactgccagc tcacaggaag aagataagct tcagaccctc agggccggga gctgccttcc 11580 tgccacccct tcctgcccca gacctccatg ccctccccca accacttaca cacaagccag 11640 ggagctgttt ccacacagtt caaccccaaa ccaggacggc ctggcactcg ggtcactgcc 11700 atttctgtct gcattcgctc ccagcgcccc tgtgttccct ccctcctccc tccttccttt 11760 cttcctgcat tgggttcatg ccgcagagtg ccaggtgcag gtcagccctg agcttggggt 11820 cacctcctca ctgaaggcag cctcagggtg cccaggggca ggcagggtgg gggtgaggct 11880 tccagctcca accgcttcgc taccttagga ccgttatagt taggcgcgcc gtcgaccaat 11940 tctcatgttt gacagcttat catcgaattt ctacgta 11977 <210> 135 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 135 tgcggccgat cttagcc 17 <210> 136 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 136 acgagcgggt tcggcccatt c 21 <210> 137 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 137 ttgaccgatt ccttgcgg 18 <210> 138 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 138 cgggtcactg ccatttctg 19 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 139 tctgcattcg ctcccagcgc 20 <210> 140 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 140 tctgcggcat gaacccaat 19 <210> 141 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 141 tggccagaac tgaccctac 19 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 142 accgacaaga gtccctcagg 20 <210> 143 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 143 ggagtcggct ctggatgtg 19 <210> 144 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 144 ggagccaggc aggacaca 18 <210> 145 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 145 tgggctcgta gtttgacgt 19 <210> 146 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 146 gggactttct tacccacact tca 23 <210> 147 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 147 ggtcccgagc actcttaatt aaac 24 <210> 148 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 148 cctcgaatgg aactac 16 <210> 149 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 149 gggagagcaa ccattcgttg t 21 <210> 150 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 150 ccgagcaccg atgcatcta 19 <210> 151 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 151 cgcagtcatg taatgc 16 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 152 gggaggcgaa ctgactgtca 20 <210> 153 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 153 ggtggagagg ctattcggc 19 <210> 154 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 154 tgggcacaac agacaatcgg ctg 23 <210> 155 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 155 gaacacggcg gcatcag 17 <210> 156 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 156 cagtcccgtt gatccagcc 19 <210> 157 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 157 cccatcaggg attttgtatc tctgtggacg 30 <210> 158 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 158 ggatatgcag cactgtgcca c 21 <210> 159 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 159 tcctccaacg acaggtccc 19 <210> 160 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 160 tccctggaac tctgccccga caca 24 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 161 gatgaactga cgggcacagg 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 162 atcacactca tcccatcccc 20 <210> 163 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 163 cccttcccta agtaccacag agtgggctc 29 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 164 cacagggaag caggaactgc 20 <210> 165 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 165 gccatgcaag gccaagc 17 <210> 166 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 166 ccaggaaaat gctgccagag cctg 24 <210> 167 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 167 agttcttgag ccttagggtg ctag 24 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 168 ccccacagca aatcacaacc 20 <210> 169 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 169 atgcagttgt cacccttgag gccattc 27 <210> 170 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 170 tgtttcccag gcgtcactg 19 <210> 171 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 171 ctcagtgatt ctggccctgc 20 <210> 172 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 172 tgctccacag ctacaaaccc cttcctataa tg 32 <210> 173 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 173 ggatgatggc tcagcacaga g 21 <210> 174 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 174 tggtcacctc caggagcctc 20 <210> 175 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 175 agtctctgct tcccccttgt ggctatgagc 30 <210> 176 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 176 gctgcagggt gtatcaggtg c 21 <210> 177 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 177 gtgtcacagt cgggcata 18 <210> 178 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 178 ccacggctac cacaatgaca ctgg 24 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 179 ccttcggctg acttgggatg 20 <210> 180 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 180 gagagaagct gcaatggcag acgcggctgc agcagcagat ggagccgcga tcatagcagg 60 tgctgc 66 <210> 181 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 181 Glu Arg Ser Cys Asn Gly Arg Arg Gly Cys Ser Ser Arg Trp Ser Arg 1 5 10 15 Asp His Ser Arg Cys Cys 20 <210> 182 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 182 aggatattgt agcagcagat ggtgctatac c 31 <210> 183 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 183 Gly Tyr Cys Ser Ser Arg Trp Cys Tyr Thr 1 5 10 <210> 184 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 184 gtattacgat tgcaactgca gcagatggcg cgaccatagc aggtgctgct attatacc 58 <210> 185 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 185 Tyr Tyr Asp Cys Asn Cys Ser Arg Trp Arg Asp His Ser Arg Cys Cys 1 5 10 15 Tyr Tyr Thr <210> 186 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 186 gagaggctta gctgtggctt ccctaagagc tgccgcagca ggcaaagcaa gcctcacaga 60 tgctgc 66 <210> 187 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 187 Glu Arg Leu Ser Cys Gly Phe Pro Lys Ser Cys Arg Ser Arg Gln Ser 1 5 10 15 Lys Pro His Arg Cys Cys 20 <210> 188 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 188 tacagccaga agtggatgtg gacttgcgat agtgagagga agtgcagtga gggtatggta 60 tgccggctgt ggtgtaagaa gaagctctgg 90 <210> 189 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 189 Tyr Ser Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Cys Ser 1 5 10 15 Glu Gly Met Val Cys Arg Leu Trp Cys Lys Lys Lys Leu Trp 20 25 30 <210> 190 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 190 agctgcaact gcagcagcaa atggagccgc gaccatagca ggtgctgc 48 <210> 191 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 191 Ser Cys Asn Cys Ser Ser Lys Trp Ser Arg Asp His Ser Arg Cys Cys 1 5 10 15 <210> 192 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 192 gagagatgca atggcagacg cggctgcagc agatggcgcg atcatagcag gtgctgc 57 <210> 193 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 193 Glu Arg Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Arg Asp His Ser 1 5 10 15 Arg Cys Cys <210> 194 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 194 aggatattgt actaatcgga gcaggcaggg tgtatgctat acc 43 <210> 195 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 195 Gly Tyr Cys Thr Asn Arg Ser Arg Gln Gly Val Cys Tyr Thr 1 5 10 <210> 196 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 196 gtattacgat tgcaactgca gcagatgggc tcgcgaccat agcaggtgct gctattataa 60 c 61 <210> 197 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 197 Tyr Tyr Asp Cys Asn Cys Ser Arg Trp Ala Arg Asp His Ser Arg Cys 1 5 10 15 Cys Tyr Tyr Asn 20 <210> 198 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 198 gtattactat gagagatgca atggcagacg cggctgcagc agatggcgcg atcatagcag 60 gtgctgctat tataac 76 <210> 199 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 199 Tyr Tyr Tyr Glu Arg Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Arg 1 5 10 15 Asp His Ser Arg Cys Cys Tyr Tyr Asn 20 25 <210> 200 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 200 gagaggcttt gtggcttccc taagagctgc agcaggcaaa agcctcacag atgctgc 57 <210> 201 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 201 Glu Arg Leu Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln Lys Pro His 1 5 10 15 Arg Cys Cys <210> 202 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 202 tactgccaga agtggatgtg gactagcgat agtgagagga agtgctgtga gggtatggta 60 agccggctgt ggtgtaagaa gaagctctgg 90 <210> 203 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 203 Tyr Cys Gln Lys Trp Met Trp Thr Ser Asp Ser Glu Arg Lys Cys Cys 1 5 10 15 Glu Gly Met Val Ser Arg Leu Trp Cys Lys Lys Lys Leu Trp 20 25 30 <210> 204 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 204 tgcaactgca gcagatggcg cgaccatagc aggtgctg 38 <210> 205 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 205 Cys Asn Cys Ser Arg Trp Arg Asp His Ser Arg Cys 1 5 10 <210> 206 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 206 gagagatgct gcaatggcag acgcggctgc agcagcagat ggtgccgcga tcatagcagg 60 tgctgc 66 <210> 207 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 207 Glu Arg Cys Cys Asn Gly Arg Arg Gly Cys Ser Ser Arg Trp Cys Arg 1 5 10 15 Asp His Ser Arg Cys Cys 20 <210> 208 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 208 aggatattgt agtggtagca gcagatgggg tagctgctac tcc 43 <210> 209 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 209 Gly Tyr Cys Ser Gly Ser Ser Arg Trp Gly Ser Cys Tyr Ser 1 5 10 <210> 210 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 210 gtattatgat tacgagagag cttgcaatgg cagacgcggc tgcagcagat gggctcgcga 60 tcatagcagg tgctgctatc gttatacc 88 <210> 211 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 211 Tyr Tyr Asp Tyr Glu Arg Ala Cys Asn Gly Arg Arg Gly Cys Ser Arg 1 5 10 15 Trp Ala Arg Asp His Ser Arg Cys Cys Tyr Arg Tyr Thr 20 25 <210> 212 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 212 gagaggcttg cttgtggctt ccctaagagc tgcagcaggc aagctaagcc tcacagatgc 60 tgc 63 <210> 213 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 213 Glu Arg Leu Ala Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln Ala Lys 1 5 10 15 Pro His Arg Cys Cys 20 <210> 214 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 214 tactgccaga agtggatgtg gacttgcgat agtgagagga agagctgtga gggtatggta 60 tgccggctgt ggagtaagaa gaagctctgg 90 <210> 215 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 215 Tyr Cys Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Ser Cys 1 5 10 15 Glu Gly Met Val Cys Arg Leu Trp Ser Lys Lys Lys Leu Trp 20 25 30 <210> 216 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 216 tgcaactgca gcagatgggc tcgcgaccat agcaggtgct g 41 <210> 217 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 217 Cys Asn Cys Ser Arg Trp Ala Arg Asp His Ser Arg Cys 1 5 10 <210> 218 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 218 gagagagctt gcaatggcag acgcggctgc agcagatggg ctcgcgatca tagcaggtgc 60 tgc 63 <210> 219 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 219 Glu Arg Ala Cys Asn Gly Arg Arg Gly Cys Ser Arg Trp Ala Arg Asp 1 5 10 15 His Ser Arg Cys Cys 20 <210> 220 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 220 agcatattgt cggagcaggc agtgctattc c 31 <210> 221 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 221 Ala Tyr Cys Arg Ser Arg Gln Cys Tyr Ser 1 5 10 <210> 222 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 222 gtattactat gagaggcttg cttgtggctt ccctaagagc tgcagcaggc aagctaagcc 60 tcacagatgc tgctattact ac 82 <210> 223 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 223 Tyr Tyr Tyr Glu Arg Leu Ala Cys Gly Phe Pro Lys Ser Cys Ser Arg 1 5 10 15 Gln Ala Lys Pro His Arg Cys Cys Tyr Tyr Tyr 20 25 <210> 224 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 224 gagaggcttt gctgtggctt ccctaagagc tgccgcagca ggcaatgcaa gcctcacaga 60 tgctgc 66 <210> 225 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 225 Glu Arg Leu Cys Cys Gly Phe Pro Lys Ser Cys Arg Ser Arg Gln Cys 1 5 10 15 Lys Pro His Arg Cys Cys 20 <210> 226 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 226 tactgccaga agtggatgtg gacttgcgat agtgagagga agtgctgtga gggtatggta 60 tgccggctgt ggtgtaagaa gaagctctgg 90 <210> 227 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 227 Tyr Cys Gln Lys Trp Met Trp Thr Cys Asp Ser Glu Arg Lys Cys Cys 1 5 10 15 Glu Gly Met Val Cys Arg Leu Trp Cys Lys Lys Lys Leu Trp 20 25 30 <210> 228 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 228 tgctgcaact gcagcagcaa atggtgccgc gaccatagca ggtgctgc 48 <210> 229 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 229 Cys Cys Asn Cys Ser Ser Lys Trp Cys Arg Asp His Ser Arg Cys Cys 1 5 10 15 <210> 230 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII nucleic acid sequence <400> 230 ggtatagtgg ggagaggctt tgtggcttcc ctaagagctg cagcaggcaa aagcctcaca 60 gatgctgcag ctactac 77 <210> 231 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> mu-conotoxin or tarantula toxin ProTxII amino acid sequence <400> 231 Tyr Ser Gly Glu Arg Leu Cys Gly Phe Pro Lys Ser Cys Ser Arg Gln 1 5 10 15 Lys Pro His Arg Cys Cys Ser Tyr Tyr 20 25 <210> 232 <211> 9975 <212> DNA <213> Artificial Sequence <220> <223> Tx-DH1166 <400> 232 tacgtagccg tttcgatcct cccgaattga ctagtgggta ggcctggcgg ccgctgccat 60 ttcattacct ctttctccgc acccgacata gataccggtg gattcgaatt ctccccgttg 120 aagctgacct gcccagaggg gcctgggccc accccacaca ccggggcgga atgtgtacag 180 gccccggtct ctgtgggtgt tccgctaact ggggctccca gtgctcaccc cacaactaaa 240 gcgagcccca gcctccagag cccccgaagg agatgccgcc cacaagccca gcccccatcc 300 aggaggcccc agagctcagg gcgccggggc ggattttgta cagccccgag tcactgtgga 360 gagaagctgc aatggcagac gcggctgcag cagcagatgg agccgcgatc atagcaggtg 420 ctgccacagt gagaaaaact gtgtcaaaaa ccgtctcctg gcccctgctg gaggccgcgc 480 cagagagggg agcagccgcc ccgaacctag gtcctgctca gctcacacga cccccagcac 540 ccagagcaca acggagtccc cattgaatgg tgaggacggg gaccagggct ccagggggtc 600 atggaagggg ctggacccca tcctactgct atggtcccag tgctcctggc cagaactgac 660 cctaccaccg acaagagtcc ctcagggaaa cgggggtcac tggcacctcc cagcatcaac 720 cccaggcagc acaggcataa accccacatc cagagccgac tccaggagca gagacacccc 780 agtaccctgg gggacaccga ccctgatgac tccccactgg aatccacccc agagtccacc 840 aggaccaaag accccgcccc tgtctctgtc cctcactcag gacctgctgc ggggcgggcc 900 atgagaccag actcgggctt agggaacacc actgtggccc caacctcgac caggccacag 960 gcccttcctt cctgccctgc ggcagcacag actttggggt ctgtgcagag aggaatcaca 1020 gaggccccag gctgaggtgg tgggggtgga agacccccag gaggtggccc acttcccttc 1080 ctcccagctg gaacccacca tgaccttctt aagatagggg tgtcatccga ggcaggtcct 1140 ccatggagct cccttcaggc tcctccccgg tcctcactag gcctcagtcc cggctgcggg 1200 aatgcagcca ccacaggcac accaggcagc ccagacccag ccagcctgca gtgcccaagc 1260 ccacattctg gagcagagca ggctgtgtct gggagagtct gggctcccca ccgccccccc 1320 gcacacccca cccacccctg tccaggccct atgcaggagg gtcagagccc cccatggggt 1380 atggacttag ggtctcactc acgtggctcc cctcctgggt gaaggggtct catgcccaga 1440 tccccacagc agagctggtc aaaggtggag gcagtggccc cagggccacc ctgacctgga 1500 ccctcaggct cctctagccc tggctgccct gctgtccctg ggaggcctgg actccaccag 1560 accacaggtc cagggcaccg cccataggtg ctgcccacac tcagttcaca ggaagaagat 1620 aagctccaga cccccaagac tgggacctgc cttcctgcca ccgcttgtag ctccagacct 1680 ccgtgcctcc cccgaccact tacacacggg ccagggagct gttccacaaa gatcaacccc 1740 aaaccgggac cgcctggcac tcgggccgct gccacttccc tctccatttg ttcccagcac 1800 ctctgtgctc cctccctcct ccctccttca ggggaacagc ctgtgcagcc cctccctgca 1860 ccccacaccc tggggaggcc caaccctgcc tccagccctt tctcccccgc tgctcttcct 1920 gcccatccag acaaccctgg ggtcccatcc ctgcagccta caccctggtc tccacccaga 1980 cccctgtctc tccctccaga cacccctccc aggccaaccc tgcacatgca ggccctcccc 2040 ttttctgctg ccagagcctc agtttctacc ctctgtgcct accccctgcc tcctcctgcc 2100 cacaactcga gctcttcctc tcctggggcc cctgagccat ggcactgacc gtgcactccc 2160 acccccacac tgcccatgcc ctcaccttcc tcctggacac tctgaccccg ctcccctctt 2220 ggacccagcc ctggtatttc caggacaaag gctcacccaa gtcttcccca tgcaggccct 2280 tgccctcact gcccggttac acggcagcct cctgtgcaca gaagcaggga gctcagccct 2340 tccacaggca gaaggcactg aaagaaatcg gcctccagca ccctgatgca cgtccgcctg 2400 tgtctctcac tgcccgcacc tgcagggagg ctcggcactc cctgtaaaga cgagggatcc 2460 aggcagcaac atcatgggag aatgcagggc tcccagacag cccagccctc tcgcaggcct 2520 ctcctgggaa gagacctgca gccaccactg aacagccacg gagcccgctg gatagtaact 2580 gagtcagtga ccgacctgga gggcagggga gcagtgaacc ggagcccaga ccatagggac 2640 agagaccagc cgctgacatc ccgagcccct cactggcggc cccagaacac cgcgtggaaa 2700 cagaacagac ccacattccc acctggaaca gggcagacac tgctgagccc ccagcaccag 2760 ccctgagaaa caccaggcaa cggcatcaga gggggctcct gagaaagaaa ggaggggagg 2820 tctccttcac cagcaagtac ttcccttgac caaaaacagg gtccacgcaa ctcccccagg 2880 acaaaggagg agccccctgt acagcactgg gctcagagtc ctctcccaca caccctgagt 2940 ttcagacaaa aaccccctgg aaatcatagt atcagcagga gaactagcca gagacagcaa 3000 gaggggactc agtgactccc gcggggacag gaggattttg tgggggctcg tgtcactgtg 3060 aggatattgt agcagcagat ggtgctatac ccacagtgac acagccccat tcaaaaaccc 3120 ctgctgtaaa cgcttccact tctggagctg aggggctggg gggagcgtct gggaagtagg 3180 gcctaggggt ggccatcaat gcccaaaacg caccagactc ccccccagac atcaccccac 3240 tggccagtga gcagagtaaa cagaaaatga gaagcagctg ggaagcttgc acaggcccca 3300 aggaaagagc tttggcgggt gtgcaagagg ggatgcgggc agagcctgag cagggccttt 3360 tgctgtttct gctttcctgt gcagatagtt ccataaactg gtgttcaaga tcgatggctg 3420 ggagtgagcc caggaggaca gtgtgggaag ggcacaggga aggagaagca gccgctatcc 3480 tacactgtca tctttcaaga gtttgccctg tgcccacaat gctgcatcat gggatgctta 3540 acagctgatg tagacacagc taaagagaga atcagtgaaa tggatttgca gcacagatct 3600 gaataaattc tccagaatgt ggagccacac agaagcaagc acaaggaaag tgcctgatgc 3660 aagggcaaag tacagtgtgt accttcaggc tgggcacaga cactctgaaa agccttggca 3720 ggaactccct gcaacaaagc agagccctgc aggcaatgcc agctccagag ccctccctga 3780 gagcctcatg ggcaaagatg tgcacaacag gtgtttctca tagccccaaa ctgagaatga 3840 agcaaacagc catctgaagg aaaacaggca aataaacgat ggcaggttca tgaaatgcaa 3900 acccagacag ccagaaggac aacagtgagg gttacaggtg actctgtggt tgagttcatg 3960 acaatgctga gtaattggag taacaaagga aagtccaaaa aatactttca atgtgatttc 4020 ttctaaataa aatttacagc cggcaaaatg aactatcttc ttaagggata aactttccac 4080 taggaaaact ataaggaaaa tcaagaaaag gatgatcaca taaacacagt ggtcgttact 4140 tctactgggg aaggaagagg gtatgaactg agacacacag ggttggcaag tctcctaaca 4200 agaacagaac aaatacatta cagtaccttg aaaacagcag ttaaaattct aaattgcaag 4260 aagaggaaaa tgcacacagc tgtgtttaga aaattctcag tccagcactg ttcataatag 4320 caaagacatt aacccaggtt ggataaataa acgatgacac aggcaattgc acaatgatac 4380 agacatacat tcagtatatg agacattgat gatgtatccc caaagaaatg actttaaaga 4440 gaaaaggcct gatatgtggt ggcactcacc tccctgggca tccccggaca ggctgcaggc 4500 acactgtgtg gcagggcagg ctggtacctg ctggcagctc ctggggcctg atgtggagca 4560 ggcacagagc cgtatccccc cgaggacata tacccccaag gacggcacag ttggtacatt 4620 ccggagacaa gcaactcagc cacactccca ggccagagcc cgagagggac gcccatgcac 4680 agggaggcag agcccagctc ctccacagcc agcagcaccc gtgcaggggc cgccatctgg 4740 caggcacaga gcatgggctg ggaggagggg cagggacacc aggcagggtt ggcaccaact 4800 gaaaattaca gaagtctcat acatctacct cagccttgcc tgacctgggc ctcacctgac 4860 ctggacctca cctggcctgg acctcacctg gcctagacct cacctctggg cttcacctga 4920 gctcggcctc acctgacttg gaccttgcct gtcctgagct cacatgatct gggcctcacc 4980 tgacctgggt ttcacctgac ctgggcttca cctgacctgg gcctcatctg acctgggcct 5040 cactggcctg gacctcacct ggcctgggct tcacctggcc tcaggcctca tctgcacctg 5100 ctccaggtct tgctggaacc tcagtagcac tgaggctgca ggggctcatc cagggttgca 5160 gaatgactct agaacctccc acatctcagc tttctgggtg gaggcacctg gtggcccagg 5220 gaatataaaa agcctgaatg atgcctgcgt gatttggggg caatttataa acccaaaagg 5280 acatggccat gcagcgggta gggacaatac agacagatat cagcctgaaa tggagcctca 5340 gggcacaggt gggcacggac actgtccacc taagccaggg gcagacccga gtgtccccgc 5400 agtagacctg agagcgctgg gcccacagcc tcccctcggt gccctgctac ctcctcaggt 5460 cagccctgga catcccgggt ttccccaggc ctggcggtag gattttgttg aggtctgtgt 5520 cactgtggta ttacgattgc aactgcagca gatggcgcga ccatagcagg tgctgctatt 5580 atacccacag tgtcacagag tccatcaaaa acccatccct gggaaccttc tgccacagcc 5640 ctccctgtgg ggcaccgccg cgtgccatgt taggattttg actgaggaca cagcaccatg 5700 ggtatggtgg ctaccgcagc agtgcagccc gtgacccaaa cacacagggc agcaggcaca 5760 acagacaagc ccacaagtga ccaccctgag ctcctgcctg ccagccctgg agaccatgaa 5820 acagatggcc aggattatcc cataggtcag ccagacctca gtccaacagg tctgcatcgc 5880 tgctgccctc caataccagt ccggatgggg acagggctgg cccacattac catttgctgc 5940 catccggcca acagtcccag aagcccctcc ctcaaggctg ggccacatgt gtggaccctg 6000 agagcccccc atgtctgagt aggggcacca ggaaggtggg gctggccctg tgcactgtcc 6060 ctgcccctgt ggtccctggc ctgcctggcc ctgacacctg ggcctctcct gggtcatttc 6120 caagacagaa gacattccca ggacagctgg agctgggagt ccatcatcct gcctggccgt 6180 cctgagtcct gcgcctttcc aaacctcacc cgggaagcca acagaggaat cacctcccac 6240 aggcagagac aaagaccttc cagaaatctc tgtctctctc cccagtgggc accctcttcc 6300 agggcagtcc tcagtgatat cacagtggga acccacatct ggatcgggac tgcccccaga 6360 acacaagatg gcccacaggg acagccccac agcccagccc ttcccagacc cctaaaaggc 6420 gtcccacccc ctgcatctgc cccagggctc aaactccagg aggactgact cctgcacacc 6480 ctcctgccag acatcacctc agcccctcct ggaagggaca ggagcgcgca agggtgagtc 6540 agaccctcct gccctcgatg gcaggcggag aagattcaga aaggtctgag atccccagga 6600 cgcagcacca ctgtcaatgg gggccccaga cgcctggacc agggcctgcg tgggaaaggc 6660 ctctgggcac actcaggggg attttgtgaa gggtcctccc actgtggaga ggcttagctg 6720 tggcttccct aagagctgcc gcagcaggca aagcaagcct cacagatgct gccacagtga 6780 tgaacccagc atcaaaaacc gaccggactc ccaaggttta tgcacacttc tccgctcaga 6840 gctctccagg atcagaagag ccgggcccaa gggtttctgc ccagaccctc ggcctctagg 6900 gacatcttgg ccatgacagc ccatgggctg gtgccccaca catcgtctgc cttcaaacaa 6960 gggcttcaga gggctctgag gtgacctcac tgatgaccac aggtgccctg gccccttccc 7020 caccagctgc accagacccc gtcatgacag atgccccgat tccaacagcc aattcctggg 7080 gccaggaatc gctgtagaca ccagcctcct tccaacacct cctgccaatt gcctggattc 7140 ccatcccggt tggaatcaag aggacagcat cccccaggct cccaacaggc aggactccca 7200 caccctcctc tgagaggccg ctgtgttccg tagggccagg ctgcagacag tccccctcac 7260 ctgccactag acaaatgcct gctgtagatg tccccacctg gaaaatacca ctcatggagc 7320 ccccagcccc aggtacagct gtagagagag tctctgaggc ccctaagaag tagccatgcc 7380 cagttctgcc gggaccctcg gccaggctga caggagtgga cgctggagct gggcccatac 7440 tgggccacat aggagctcac cagtgagggc aggagagcac atgccgggga gcacccagcc 7500 tcctgctgac cagaggcccg tcccagagcc caggaggctg cagaggcctc tccaggggga 7560 cactgtgcat gtctggtccc tgagcagccc cccacgtccc cagtcctggg ggcccctggc 7620 acagctgtct ggaccctctc tattccctgg gaagctcctc ctgacagccc cgcctccagt 7680 tccaggtgtg gattttgtca gggggtgtca cactgtgtac agccagaagt ggatgtggac 7740 ttgcgatagt gagaggaagt gcagtgaggg tatggtatgc cggctgtggt gtaagaagaa 7800 gctctggcac agtggtgctg cccatatcaa aaaccaggcc aagtagacag gcccctgctg 7860 tgcagcccca ggcctccagc tcacctgctt ctcctggggc tctcaaggct gctgttttct 7920 gcactctccc ctctgtgggg agggttccct cagtgggaga tctgttctca acatcccacg 7980 gcctcattcc tgcaaggaag gccaatggat gggcaacctc acatgccgcg gctaagatag 8040 ggtgggcagc ctggcgggga caggacatcc tgctggggta tctgtcactg tgcctagtgg 8100 ggcactggct cccaaacaac gcagtccttg ccaaaatccc cacggcctcc cccgctaggg 8160 gctggcctga tctcctgcag tcctaggagg ctgctgacct ccagaatggc tccgtcccca 8220 gttccagggc gagagcagat cccaggccgg ctgcagactg ggaggccacc ccctccttcc 8280 cagggttcac tgcaggtgac cagggcagga aatggcctga acacagggat aaccgggcca 8340 tcccccaaca gagtccaccc cctcctgctc tgtaccccgc accccccagg ccagcccatg 8400 acatccgaca accccacacc agagtcactg cccggtgctg ccctagggag gacccctcag 8460 cccccaccct gtctagagga ctggggagga caggacacgc cctctcctta tggttccccc 8520 acctggctct ggctgggacc cttggggtgt ggacagaaag gacgcttgcc tgattggccc 8580 ccaggagccc agaacttctc tccagggacc ccagcccgag caccccctta cccaggaccc 8640 agccctgccc ctcctcccct ctgctctcct ctcatcaccc catgggaatc cagaatcccc 8700 aggaagccat caggaagggc tgagggagga agtggggcca ctgcaccacc aggcaggagg 8760 ctctgtcttt gtgaacccag ggaggtgcca gcctcctaga gggtatggtc caccctgcct 8820 atggctccca cagtggcagg ctgcagggaa ggaccaggga cggtgtgggg gagggctcag 8880 ggccccgcgg gtgctccatc ttggatgagc ctatctctct cacccacgga ctcgcccacc 8940 tcctcttcac cctggccaca cgtcgtccac accatcctaa gtcccaccta caccagagcc 9000 ggcacagcca gtgcagacag aggctggggt gcaggggggc cgactgggca gcttcgggga 9060 gggaggaatg gaggaagggg agttcagtga agaggccccc ctcccctggg tccaggatcc 9120 tcctctggga cccccggatc ccatcccctc caggctctgg gaggagaagc aggatgggag 9180 aatctgtgcg ggaccctctc acagtggaat acctccacag cggctcaggc cagatacaaa 9240 agcccctcag tgagccctcc actgcagtgc tgggcctggg ggcagccgct cccacacagg 9300 atgaacccag caccccgagg atgtcctgcc agggggagct cagagccatg aaggagcagg 9360 atatgggacc cccgatacag gcacagacct cagctccatt caggactgcc acgtcctgcc 9420 ctgggaggaa cccctttctc tagtccctgc aggccaggag gcagctgact cctgacttgg 9480 acgcctattc cagacaccag acagaggggc aggcccccca gaaccaggga tgaggacgcc 9540 ccgtcaaggc cagaaaagac caagttgcgc tgagcccagc aagggaaggt ccccaaacaa 9600 accaggagga ttttgtaggt gtctgtgtca ctgtgagctg caactgcagc agcaaatgga 9660 gccgcgacca tagcaggtgc tgccacagtg acactcgcca ggtcaaaaac cccatcccaa 9720 gtcagcggaa tgcagagaga gcagggagga catgtttagg atctgaggcc gcacctgaca 9780 cccaggccag cagacgtctc ctgtccacgg caccctgcca tgtcctgcat ttctggaaga 9840 acaagggcag gctgaagggg gtccaggacc aggagatggg tccgctctac ccagagaagg 9900 agccaggcag gacacaagcc cccacgcgtg ggctcgtagt ttgacgtgcg tgaagtgtgg 9960 gtaagaaagt acgta 9975 <210> 233 <211> 9714 <212> DNA <213> Artificial Sequence <220> <223> TxDH17613 <400> 233 gcggccgctg ccatttcatt acctctttct ccgcacccga catagattac gtaacgcgtg 60 ggctcgtagt ttgacgtgcg tgaagtgtgg gtaagaaagt ccccattgag gctgacctgc 120 ccagagggtc ctgggcccac ccaacacacc ggggcggaat gtgtgcaggc ctcggtctct 180 gtgggtgttc cgctagctgg ggctcacagt gctcacccca cacctaaaac gagccacagc 240 ctccggagcc cctgaaggag accccgccca caagcccagc ccccacccag gaggccccag 300 agcacagggc gccccgtcgg attttgtaca gccccgagtc actgtggaga gatgcaatgg 360 cagacgcggc tgcagcagat ggcgcgatca tagcaggtgc tgccacagtg agaaaagctt 420 cgtcaaaaac cgtctcctgg ccacagtcgg aggccccgcc agagagggga gcagccaccc 480 caaacccatg ttctgccggc tcccatgacc ccgtgcacct ggagccccac ggtgtcccca 540 ctggatggga ggacaagggc cgggggctcc ggcgggtcgg ggcaggggct tgatggcttc 600 cttctgccgt ggccccattg cccctggctg gagttgaccc ttctgacaag tgtcctcaga 660 gagtcaggga tcagtggcac ctcccaacat caaccccacg cagcccaggc acaaacccca 720 catccagggc caactccagg aacagagaca ccccaatacc ctgggggacc ccgaccctga 780 tgactcccgt cccatctctg tccctcactt ggggcctgct gcggggcgag cacttgggag 840 caaactcagg cttaggggac accactgtgg gcctgacctc gagcaggcca cagacccttc 900 cctcctgccc tggtgcagca cagactttgg ggtctgggca gggaggaact tctggcaggt 960 caccaagcac agagccccca ggctgaggtg gccccagggg gaaccccagc aggtggccca 1020 ctacccttcc tcccagctgg accccatgtc ttccccaaga taggggtgcc atccaaggca 1080 ggtcctccat ggagccccct tcaggctcct ctccagaccc cactgggcct cagtccccac 1140 tctaggaatg cagccaccac gggcacacca ggcagcccag gcccagccac cctgcagtgc 1200 ccaagcccac accctggagg agagcagggt gcgtctggga ggggctgggc tccccacccc 1260 cacccccacc tgcacacccc acccaccctt gcccgggccc cctgcaggag ggtcagagcc 1320 cccatgggat atggacttag ggtctcactc acgcacctcc cctcctggga gaaggggtct 1380 catgcccaga tccccccagc agcgctggtc acaggtagag gcagtggccc cagggccacc 1440 ctgacctggc ccctcaggct cctctagccc tggctgccct gctgtccctg ggaggcctgg 1500 gctccaccag accacaggtc tagggcaccg cccacactgg ggccgcccac acacagctca 1560 caggaagaag ataagctcca gacccccagg cccgggacct gccttgctgc tacgacttcc 1620 tgccccagac ctcgttgccc tcccccgtcc acttacacac aggccaggaa gctgttccca 1680 cacagaccaa ccccagacgg ggaccacctg gcactcaggt cactgccatt tccttctcca 1740 ttcacttcca atgcctctgt gcttcctccc tcctccttcc ttcgggggag caccctgtgc 1800 agctcctccc tgcagtccac accctgggga gacccgaccc tgcagcccac accctgggga 1860 gacctgaccc tcctccagcc ctttctcccc cgctgctctt gccacccacc aagacagccc 1920 tggggtcctg tccctacagc ccccacccag ttctctacct agacccgtct tcctccctct 1980 aaacacctct cccaggccaa ccctacacct gcaggccctc ccctccactg ccaaagaccc 2040 tcagtttctc ctgcctgtgc ccacccccgt gctcctcctg cccacagctc gagctcttcc 2100 tctcctaggg cccctgaggg atggcattga ccgtgccctc gcacccacac actgcccatg 2160 ccctcacatt cctcctggcc actccagccc cactcccctc tcaggcctgg ctctggtatt 2220 tctgggacaa agccttaccc aagtctttcc catgcaggcc tgggccctta ccctcactgc 2280 ccggttacag ggcagcctcc tgtgcacaga agcagggagc tcagcccttc cacaggcaga 2340 aggcactgaa agaaatcggc ctccagcgcc ttgacacacg tctgcctgtg tctctcactg 2400 cccgcacctg cagggaggct cggcactccc tctaaagacg agggatccag gcagcagcat 2460 cacaggagaa tgcagggcta ccagacatcc cagtcctctc acaggcctct cctgggaaga 2520 gacctgaaga cgcccagtca acggagtcta acaccaaacc tccctggagg ccgatgggta 2580 gtaacggagt cattgccaga cctggaggca ggggagcagt gagcccgagc ccacaccata 2640 gggccagagg acagccactg acatcccaag ccactcactg gtggtcccac aacaccccat 2700 ggaaagagga cagacccaca gtcccacctg gaccagggca gagactgctg agacccagca 2760 ccagaaccaa ccaagaaaca ccaggcaaca gcatcagagg gggctctggc agaacagagg 2820 aggggaggtc tccttcacca gcaggcgctt cccttgaccg aagacaggat ccatgcaact 2880 cccccaggac aaaggaggag ccccttgttc agcactgggc tcagagtcct ctccaagaca 2940 cccagagttt cagacaaaaa ccccctggaa tgcacagtct cagcaggaga gccagccaga 3000 gccagcaaga tggggctcag tgacacccgc agggacagga ggattttgtg ggggctcgtg 3060 tcactgtgag gatattgtac taatcggagc aggcagggtg tatgctatac ccacagtgac 3120 acagccccat tcaaaaaccc ctactgcaaa cgcattccac ttctggggct gaggggctgg 3180 gggagcgtct gggaaatagg gctcaggggt gtccatcaat gcccaaaacg caccagactc 3240 ccctccatac atcacaccca ccagccagcg agcagagtaa acagaaaatg agaagcaagc 3300 tggggaagct tgcacaggcc ccaaggaaag agctttggcg ggtgtgtaag aggggatgcg 3360 ggcagagcct gagcagggcc ttttgctgtt tctgctttcc tgtgcagaga gttccataaa 3420 ctggtgttcg agatcaatgg ctgggagtga gcccaggagg acagcgtggg aagagcacag 3480 ggaaggagga gcagccgcta tcctacactg tcatctttcg aaagtttgcc ttgtgcccac 3540 actgctgcat catgggatgc ttaacagctg atgtagacac agctaaagag agaatcagtg 3600 agatggattt gcagcacaga tctgaataaa ttctccagaa tgtggagcag cacagaagca 3660 agcacacaga aagtgcctga tgcaaggaca aagttcagtg ggcaccttca ggcattgctg 3720 ctgggcacag acactctgaa aagccctggc aggaactccc tgtgacaaag cagaaccctc 3780 aggcaatgcc agccccagag ccctccctga gagcctcatg ggcaaagatg tgcacaacag 3840 gtgtttctca tagccccaaa ctgagagcaa agcaaacgtc catctgaagg agaacaggca 3900 aataaacgat ggcaggttca tgaaatgcaa acccagacag ccacaagcac aaaagtacag 3960 ggttataagc gactctggtt gagttcatga caatgctgag taattggagt aacaaagtaa 4020 actccaaaaa atactttcaa tgtgatttct tctaaataaa atttacaccc tgcaaaatga 4080 actgtcttct taagggatac atttcccagt tagaaaacca taaagaaaac caagaaaagg 4140 atgatcacat aaacacagtg gtggttactt ctgctgggga aggaagaggg tatgaactga 4200 gatacacagg gtgggcaagt ctcctaacaa gaacagaacg aatacattac agtaccttga 4260 aaacagcagt taaacttcta aattgcaaga agaggaaaat gcacacagtt gtgtttagaa 4320 aattctcagt ccagcactgt tcataatagc aaagacatta acccaggtcg gataaataag 4380 cgatgacaca ggcaattgca caatgataca gacatatatt tagtatatga gacatcgatg 4440 atgtatcccc aaataaacga ctttaaagag ataaagggct gatgtgtggt ggcattcacc 4500 tccctgggat ccccggacag gttgcaggct cactgtgcag cagggcaggc gggtacctgc 4560 tggcagttcc tggggcctga tgtggagcaa gcgcagggcc atatatcccg gaggacggca 4620 cagtcagtga attccagaga gaagcaactc agccacactc cccaggcaga gcccgagagg 4680 gacgcccacg cacagggagg cagagcccag cacctccgca gccagcacca cctgcgcacg 4740 ggccaccacc ttgcaggcac agagtgggtg ctgagaggag gggcagggac accaggcagg 4800 gtgagcaccc agagaaaact gcagacgcct cacacatcca cctcagcctc ccctgacctg 4860 gacctcactg gcctgggcct cacttaacct gggcttcacc tgaccttggc ctcacctgac 4920 ttggacctcg cctgtcccaa gctttacctg acctgggcct caactcacct gaacgtctcc 4980 tgacctgggt ttaacctgtc ctggaactca cctggccttg gcttcccctg acctggacct 5040 catctggcct gggcttcacc tggcctgggc ctcacctgac ctggacctca tctggcctgg 5100 acctcacctg gcctggactt cacctggcct gggcttcacc tgacctggac ctcacctggc 5160 ctcgggcctc acctgcacct gctccaggtc ttgctggagc ctgagtagca ctgagggtgc 5220 agaagctcat ccagggttgg ggaatgactc tagaagtctc ccacatctga cctttctggg 5280 tggaggcagc tggtggccct gggaatataa aaatctccag aatgatgact ctgtgatttg 5340 tgggcaactt atgaacccga aaggacatgg ccatggggtg ggtagggaca tagggacaga 5400 tgccagcctg aggtggagcc tcaggacaca ggtgggcacg gacactatcc acataagcga 5460 gggatagacc cgagtgtccc cacagcagac ctgagagcgc tgggcccaca gcctcccctc 5520 agagccctgc tgcctcctcc ggtcagccct ggacatccca ggtttcccca ggcctggcgg 5580 taggattttg ttgaggtctg tgtcactgtg gtattacgat tgcaactgca gcagatgggc 5640 tcgcgaccat agcaggtgct gctattataa ccacagtgtc acagagtcca tcaaaaaccc 5700 atgcctggaa gcttcccgcc acagccctcc ccatggggcc ctgctgcctc ctcaggtcag 5760 ccccggacat cccgggtttc cccaggctgg gcggtaggat tttgttgagg tctgtgtcac 5820 tgtggtatta ctatgagaga tgcaatggca gacgcggctg cagcagatgg cgcgatcata 5880 gcaggtgctg ctattataac cacagtgtca cagagtccat caaaaaccca tccctgggag 5940 cctcccgcca cagccctccc tgcaggggac cggtacgtgc catgttagga ttttgatcga 6000 ggagacagca ccatgggtat ggtggctacc acagcagtgc agcctgtgac ccaaacccgc 6060 agggcagcag gcacgatgga caggcccgtg actgaccacg ctgggctcca gcctgccagc 6120 cctggagatc atgaaacaga tggccaaggt caccctacag gtcatccaga tctggctccg 6180 aggggtctgc atcgctgctg ccctcccaac gccagtccaa atgggacagg gacggcctca 6240 cagcaccatc tgctgccatc aggccagcga tcccagaagc ccctccctca aggctgggca 6300 catgtgtgga cactgagagc cctcatatct gagtaggggc accaggaggg aggggctggc 6360 cctgtgcact gtccctgccc ctgtggtccc tggcctgcct ggccctgaca cctgagcctc 6420 tcctgggtca tttccaagac agaagacatt cctggggaca gccggagctg ggcgtcgctc 6480 atcctgcccg gccgtcctga gtcctgctca tttccagacc tcaccgggga agccaacaga 6540 ggactcgcct cccacattca gagacaaaga accttccaga aatccctgcc tctctcccca 6600 gtggacaccc tcttccagga cagtcctcag tggcatcaca gcggcctgag atccccagga 6660 cgcagcaccg ctgtcaatag gggccccaaa tgcctggacc agggcctgcg tgggaaaggc 6720 ctctggccac actcggggat tttgtgaagg gccctcccac tgtggagagg ctttgtggct 6780 tccctaagag ctgcagcagg caaaagcctc acagatgctg ccacagtgat gaacccagtg 6840 tcaaaaaccg gctggaaacc caggggctgt gtgcacgcct cagcttggag ctctccagga 6900 gcacaagagc cgggcccaag gatttgtgcc cagaccctca gcctctaggg acacctgggt 6960 catctcagcc tgggctggtg ccctgcacac catcttcctc caaatagggg cttcagaggg 7020 ctctgaggtg acctcactca tgaccacagg tgacctggcc cttccctgcc agctatacca 7080 gaccctgtct tgacagatgc cccgattcca acagccaatt cctgggaccc tgaatagctg 7140 tagacaccag cctcattcca gtacctcctg ccaattgcct ggattcccat cctggctgga 7200 atcaagaagg cagcatccgc caggctccca acaggcagga ctcccgcaca ccctcctctg 7260 agaggccgct gtgttccgca gggccaggcc ctggacagtt cccctcacct gccactagag 7320 aaacacctgc cattgtcgtc cccacctgga aaagaccact cgtggagccc ccagccccag 7380 gtacagctgt agagacagtc ctcgaggccc ctaagaagga gccatgccca gttctgccgg 7440 gaccctcggc caggccgaca ggagtggacg ctggagctgg gcccacactg ggccacatag 7500 gagctcacca gtgagggcag gagagcacat gccggggagc acccagcctc ctgctgacca 7560 gaggcccgtc ccagagccca ggaggctgca gaggcctctc cagggagaca ctgtgcatgt 7620 ctggtaccta agcagccccc cacgtcccca gtcctggggg cccctggctc agctgtctgg 7680 gccctccctg ctccctggga agctcctcct gacagccccg cctccagttc caggtgtgga 7740 ttttgtcagg cgatgtcaca ctgtgtactg ccagaagtgg atgtggacta gcgatagtga 7800 gaggaagtgc tgtgagggta tggtaagccg gctgtggtgt aagaagaagc tctggcacag 7860 tggtgccgcc catatcaaaa accaggccaa gtagacaggc ccctgctgcg cagccccagg 7920 catccacttc acctgcttct cctggggctc tcaaggctgc tgtctgtcct ctggccctct 7980 gtggggaggg ttccctcagt gggaggtctg tgctccaggg cagggatgat tgagatagaa 8040 atcaaaggct ggcagggaaa ggcagcttcc cgccctgaga ggtgcaggca gcaccacgga 8100 gccacggagt cacagagcca cggagccccc attgtgggca tttgagagtg ctgtgccccc 8160 ggcaggccca gccctgatgg ggaagcctgt cccatcccac agcccgggtc ccacgggcag 8220 cgggcacaga agctgccagg ttgtcctcta tgatcctcat ccctccagca gcatcccctc 8280 cacagtgggg aaactgaggc ttggagcacc acccggcccc ctggaaatga ggctgtgagc 8340 ccagacagtg ggcccagagc actgtgagta ccccggcagt acctggctgc agggatcagc 8400 cagagatgcc aaaccctgag tgaccagcct acaggaggat ccggccccac ccaggccact 8460 cgattaatgc tcaaccccct gccctggaga cctcttccag taccaccagc agctcagctt 8520 ctcagggcct catccctgca aggaaggtca agggctgggc ctgccagaaa cacagcaccc 8580 tccctagccc tggctaagac agggtgggca gacggctgtg gacgggacat attgctgggg 8640 catttctcac tgtcacttct gggtggtagc tctgacaaaa acgcagaccc tgccaaaatc 8700 cccactgcct cccgctaggg gctggcctgg aatcctgctg tcctaggagg ctgctgacct 8760 ccaggatggc tccgtcccca gttccagggc gagagcagat cccaggcagg ctgtaggctg 8820 ggaggccacc cctgcccttg ccggggttga atgcaggtgc ccaaggcagg aaatggcatg 8880 agcacaggga tgaccgggac atgccccacc agagtgcgcc ccttcctgct ctgcaccctg 8940 caccccccag gccagcccac gacgtccaac aactgggcct gggtggcagc cccacccaga 9000 caggacagac ccagcaccct gaggaggtcc tgccaggggg agctaagagc catgaaggag 9060 caagatatgg ggcccccgat acaggcacag atgtcagctc catccaggac cacccagccc 9120 acaccctgag aggaacgtct gtctccagcc tctgcaggtc gggaggcagc tgacccctga 9180 cttggacccc tattccagac accagacaga ggcgcaggcc ccccagaacc agggttgagg 9240 gacgccccgt caaagccaga caaaaccaag gggtgttgag cccagcaagg gaaggccccc 9300 aaacagacca ggaggatttt gtaggtgtct gtgtcactgt gtgcaactgc agcagatggc 9360 gcgaccatag caggtgctgc cacagtgaca ctcacccagt caaaaacccc attccaagtc 9420 agcggaagca gagagagcag ggaggacacg tttaggatct gagactgcac ctgacaccca 9480 ggccagcaga cgtctcccct ccagggcacc ccaccctgtc ctgcatttct gcaagatcag 9540 gggcggcctg agggggggtc tagggtgagg agatgggtcc cctgtacacc aaggaggagt 9600 taggcaggtc ccgagcactc ttaattaaac gacgcctcga atggaactac tacaacgaat 9660 ggttgctcta cgtaatgcat tcgctacctt aggaccgtta tagttaggcg cgcc 9714 <210> 234 <211> 9797 <212> DNA <213> Artificial Sequence <220> <223> TxDH114619 <400> 234 tacgtattaa ttaaacgacg cctcgaatgg aactactaca acgaatggtt gctctcccca 60 ttgaggctga cctgcccaga gagtcctggg cccaccccac acaccggggc ggaatgtgtg 120 caggcctcgg tctctgtggg tgttccgcta gctggggctc acagtgctca ccccacacct 180 aaaatgagcc acagcctccg gagcccccgc aggagacccc gcccacaagc ccagccccca 240 cccaggaggc cccagagctc agggcgcccc gtcggatttt gtacagcccc gagtcactgt 300 ggagagatgc tgcaatggca gacgcggctg cagcagcaga tggtgccgcg atcatagcag 360 gtgctgccac agtgagaata gctacgtcaa aaaccgtcca gtggccactg ccggaggccc 420 cgccagagag ggcagcagcc actctgatcc catgtcctgc cggctcccat gacccccagc 480 acgcggagcc ccacagtgtc cccactggat gggaggacaa gagctgggga ttccggcggg 540 tcggggcagg ggcttgatcg catccttctg ccgtggctcc agtgcccctg gctggagttg 600 acccttctga caagtgtcct cagagagaca ggcatcaccg gcgcctccca acatcaaccc 660 caggcagcac aggcacaaac cccacatcca gagccaactc caggagcaga gacaccccaa 720 taccctgggg gaccccgacc ctgatgactt cccactggaa ttcgccgtag agtccaccag 780 gaccaaagac cctgcctctg cctctgtccc tcactcagga cctgctgccg ggcgaggcct 840 tgggagcaga cttgggctta ggggacacca gtgtgacccc gaccttgacc aggacgcaga 900 cctttccttc ctttcctggg gcagcacaga ctttggggtc tgggccagga ggaacttctg 960 gcaggtcgcc aagcacagag gccacaggct gaggtggccc tggaaagacc tccaggaggt 1020 ggccactccc cttcctccca gctggacccc atgtcctccc caagataagg gtgccatcca 1080 aggcaggtgc tccttggagc cccattcaga ctcctccctg gaccccactg ggcctcagtc 1140 ccagctctgg ggatgaagcc accacaagca caccaggcag cccaggccca gccaccctgc 1200 agtgcccaag cacacactct ggagcagagc agggtgcctc tgggaggggc tgagctcccc 1260 accccacccc cacctgcaca ccccacccac ccctgcccag cggctctgca ggagggtcag 1320 agccccacat ggggtatgga cttagggtct cactcacgtg gctcccatca tgagtgaagg 1380 ggcctcaagc ccaggttccc acagcagcgc ctgtcgcaag tggaggcaga ggcccgaggg 1440 ccaccctgac ctggtccctg aggttcctgc agcccaggct gccctgctgt ccctgggagg 1500 cctgggctcc accagaccac aggtccaggg caccgggtgc aggagccacc cacacacagc 1560 tcacaggaag aagataagct ccagaccccc agggccagaa cctgccttcc tgctactgct 1620 tcctgcccca gacctgggcg ccctcccccg tccacttaca cacaggccag gaagctgttc 1680 ccacacagaa caaccccaaa ccaggaccgc ctggcactca ggtggctgcc atttccttct 1740 ccatttgctc ccagcgcctc tgtcctccct ggttcctcct tcgggggaac agcctgtgca 1800 gccagtccct gcagcccaca ccctggggag acccaaccct gcctggggcc cttccaaccc 1860 tgctgctctt actgcccacc cagaaaactc tggggtcctg tccctgcagt ccctaccctg 1920 gtctccaccc agacccctgt gtatcactcc agacacccct cccaggcaaa ccctgcacct 1980 gcaggccctg tcctcttctg tcgctagagc ctcagtttct cccccctgtg cccacaccct 2040 acctcctcct gcccacaact ctaactcttc ttctcctgga gcccctgagc catggcattg 2100 accctgccct cccaccaccc acagcccatg ccctcacctt cctcctggcc actccgaccc 2160 cgccccctct caggccaagc cctggtattt ccaggacaaa ggctcaccca agtctttccc 2220 aggcaggcct gggctcttgc cctcacttcc cggttacacg ggagcctcct gtgcacagaa 2280 gcagggagct cagcccttcc acaggcagaa ggcactgaaa gaaatcggcc tccagcacct 2340 tgacacacgt ccgcccgtgt ctctcactgc ccgcacctgc agggaggctc cgcactccct 2400 ctaaagacaa gggatccagg cagcagcatc acgggagaat gcagggctcc cagacatccc 2460 agtcctctca caggcctctc ctgggaagag acctgcagcc accaccaaac agccacagag 2520 gctgctggat agtaactgag tcaatgaccg acctggaggg caggggagca gtgagccgga 2580 gcccatacca tagggacaga gaccagccgc tgacatcccg agctcctcaa tggtggcccc 2640 ataacacacc taggaaacat aacacaccca cagccccacc tggaacaggg cagagactgc 2700 tgagccccca gcaccagccc caagaaacac caggcaacag tatcagaggg ggctcccgag 2760 aaagagagga ggggagatct ccttcaccat caaatgcttc ccttgaccaa aaacagggtc 2820 cacgcaactc ccccaggaca aaggaggagc cccctataca gcactgggct cagagtcctc 2880 tctgagacac cctgagtttc agacaacaac ccgctggaat gcacagtctc agcaggagaa 2940 cagaccaaag ccagcaaaag ggacctcggt gacaccagta gggacaggag gattttgtgg 3000 gggctcgtgt cactgtgagg atattgtagt ggtagcagca gatggggtag ctgctactcc 3060 cacagtgaca cagacccatt caaaaacccc tactgcaaac acacccactc ctggggctga 3120 ggggctgggg gagcgtctgg gaagtagggt ccaggggtgt ctatcaatgt ccaaaatgca 3180 ccagactccc cgccaaacac caccccacca gccagcgagc agggtaaaca gaaaatgaga 3240 ggctctggga agcttgcaca ggccccaagg aaagagcttt ggcgggtgtg caagagggga 3300 tgcaggcaga gcctgagcag ggccttttgc tgtttctgct ttcctgtgca gagagttcca 3360 taaactggtg ttcaagatca gtggctggga atgagcccag gagggcagtc tgtgggaaga 3420 gcacagggaa ggaggagcag ccgctatcct acactgtcat ctttcaaaag tttgccttgt 3480 gaccacacta ttgcatcatg ggatgcttaa gagctgatgt agacacagct aaagagagaa 3540 tcagtgagat gaatttgcag catagatctg aataaactct ccagaatgtg gagcagtaca 3600 gaagcaaaca cacagaaagt gcctgatgca aggacaaagt tcagtgggca ccttcaggca 3660 ttgctgctgg gcacagacac tctgaaaagc cttggcagga tctccctgcg acaaagcaga 3720 accctcaggc aatgccagcc ccagagccct ccctgagagc gtcatgggga aagatgtgca 3780 gaacagctga ttatcataga ctcaaactga gaacagagca aacgtccatc tgaagaacag 3840 tcaaataagc aatggtaggt tcatgcaatg caaacccaga cagccagggg acaacagtag 3900 agggctacag gcggctttgc ggttgagttc atgacaatgc tgagtaattg gagtaacaga 3960 ggaaagccca aaaaatactt ttaatgtgat ttcttctaaa taaaatttac accaggcaaa 4020 atgaactgtc ttcttaaggg ataaactttc ccctggaaaa actacaagga aaattaagaa 4080 aacgatgatc acataaacac agttgtggtt acttctactg gggaaggaag agggtatgag 4140 ctgagacaca cagagtcggc aagtctccaa gcaagcacag aacgaataca ttacagtacc 4200 ttgaatacag cagttaaact tctaaatcgc aagaacagga aaatgcacac agctgtgttt 4260 agaaaattct cagtccagca ctattcataa tagcaaagac attaacccag gttggataaa 4320 taaatgatga cacaggcaat tgcacaatga tacagacata catttagtac atgagacatc 4380 gatgatgtat ccccaaagaa atgactttaa agagaaaagg cctgatgtgt ggtggcactc 4440 acctccctgg gatccccgga caggttgcag gcacactgtg tggcagggca ggctggtaca 4500 tgctggcagc tcctggggcc tgatgtggag caagcgcagg gctgtatacc cccaaggatg 4560 gcacagtcag tgaattccag agagaagcag ctcagccaca ctgcccaggc agagcccgag 4620 agggacgccc acgtacaggg aggcagagcc cagctcctcc acagccacca ccacctgtgc 4680 acgggccacc accttgcagg cacagagtgg gtgctgagag gaggggcagg gacaccaggc 4740 agggtgagca cccagagaaa actgcagaag cctcacacat ccacctcagc ctcccctgac 4800 ctggacctca cctggtctgg acctcacctg gcctgggcct cacctgacct ggacctcacc 4860 tggcctgggc ttcacctgac ctggacctca cctggcctcc ggcctcacct gcacctgctc 4920 caggtcttgc tggaacctga gtagcactga ggctgcagaa gctcatccag ggttggggaa 4980 tgactctgga actctcccac atctgacctt tctgggtgga ggcatctggt ggccctggga 5040 atataaaaag ccccagaatg gtgcctgcgt gatttggggg caatttatga acccgaaagg 5100 acatggccat ggggtgggta gggacatagg gacagatgcc agcctgaggt ggagcctcag 5160 gacacagttg gacgcggaca ctatccacat aagcgaggga cagacccgag tgttcctgca 5220 gtagacctga gagcgctggg cccacagcct cccctcggtg ccctgctgcc tcctcaggtc 5280 agccctggac atcccgggtt tccccaggcc agatggtagg attttgttga ggtctgtgtc 5340 actgtggtat tatgattacg agagagcttg caatggcaga cgcggctgca gcagatgggc 5400 tcgcgatcat agcaggtgct gctatcgtta tacccacagt gtcacacggt ccatcaaaaa 5460 cccatgccac agccctcccc gcaggggacc gccgcgtgcc atgttacgat tttgatcgag 5520 gacacagcgc catgggtatg gtggctacca cagcagtgca gcccatgacc caaacacaca 5580 gggcagcagg cacaatggac aggcctgtga gtgaccatgc tgggctccag cccgccagcc 5640 ccggagacca tgaaacagat ggccaaggtc accccacagt tcagccagac atggctccgt 5700 ggggtctgca tcgctgctgc cctctaacac cagcccagat ggggacaagg ccaaccccac 5760 attaccatct cctgctgtcc acccagtggt cccagaagcc cctccctcat ggctgagcca 5820 catgtgtgaa ccctgagagc accccatgtc agagtagggg cagcagaagg gcggggctgg 5880 ccctgtgcac tgtccctgca cccatggtcc ctcgcctgcc tggccctgac acctgagcct 5940 cttctgagtc atttctaaga tagaagacat tcccggggac agccggagct gggcgtcgct 6000 catcccgccc ggccgtcctg agtcctgctt gtttccagac ctcaccaggg aagccaacag 6060 aggactcacc tcacacagtc agagacaaag aaccttccag aaatccctgt ctcactcccc 6120 agtgggcacc ttcttccagg acattcctcg gtcgcatcac agcaggcacc cacatctgga 6180 tcaggacggc ccccagaaca caagatggcc catggggaca gccccacaac ccaggccttc 6240 ccagacccct aaaaggcgtc ccaccccctg cacctgcccc agggctaaaa atccaggagg 6300 cttgactccc gcataccctc cagccagaca tcacctcagc cccctcctgg aggggacagg 6360 agcccgggag ggtgagtcag acccacctgc cctcgatggc aggcggggaa gattcagaaa 6420 ggcctgagat ccccaggacg cagcaccact gtcaatgggg gccccagacg cctggaccag 6480 ggcctgcgtg ggaaaggccg ctgggcacac tcagggggat tttgtgaagg cccctcccac 6540 tgtggagagg cttgcttgtg gcttccctaa gagctgcagc aggcaagcta agcctcacag 6600 atgctgccac agtgatgaaa ctagcatcaa aaaccggccg gacacccagg gaccatgcac 6660 acttctcagc ttggagctct ccaggaccag aagagtcagg tctgagggtt tgtagccaga 6720 ccctcggcct ctagggacac cctggccatc acagcggatg ggctggtgcc ccacatgcca 6780 tctgctccaa acaggggctt cagagggctc tgaggtgact tcactcatga ccacaggtgc 6840 cctggcccct tccccgccag ctacaccgaa ccctgtccca acagctgccc cagttccaac 6900 agccaattcc tggggcccag aattgctgta gacaccagcc tcgttccagc acctcctgcc 6960 aattgcctgg attcacatcc tggctggaat caagagggca gcatccgcca ggctcccaac 7020 aggcaggact cccgcacacc ctcctctgag aggccgctgt gttccgcagg gccaggccct 7080 ggacagttcc cctcacctgc cactagagaa acacctgcca ttgtcgtccc cacctggaaa 7140 agaccactcg tggagccccc agccccaggt acagctgtag agagactccc cgagggatct 7200 aagaaggagc catgcgcagt tctgccggga ccctcggcca ggccgacagg agtggacact 7260 ggagctgggc ccacactggg ccacatagga gctcaccagt gagggcagga gagcacatgc 7320 cggggagcac ccagcctcct gctgaccaga ggcccgtccc agagcccagg aggctgcaga 7380 ggcctctcca gggggacact gtgcatgtct ggtccctgag cagcccccca cgtccccagt 7440 cctgggggcc cctggcacag ctgtctggac cctccctgtt ccctgggaag ctcctcctga 7500 cagccccgcc tccagttcca ggtgtggatt ttgtcagggg gtgtcacact gtgtactgcc 7560 agaagtggat gtggacttgc gatagtgaga ggaagagctg tgagggtatg gtatgccggc 7620 tgtggagtaa gaagaagctc tggcacagtg gtgctgccca tatcaaaaac caggccaagt 7680 agacaggccc ctgctgtgca gccccaggcc tccacttcac ctgcttctcc tggggctctc 7740 aaggtcactg ttgtctgtac tctgccctct gtggggaggg ttccctcagt gggaggtctg 7800 ttctcaacat cccagggcct catgtctgca cggaaggcca atggatgggc aacctcacat 7860 gccgcggcta agatagggtg ggcagcctgg cgggggacag tacatactgc tggggtgtct 7920 gtcactgtgc ctagtggggc actggctccc aaacaacgca gtcctcgcca aaatccccac 7980 agcctcccct gctaggggct ggcctgatct cctgcagtcc taggaggctg ctgacctcca 8040 gaatgtctcc gtccccagtt ccagggcgag agcagatccc aggccggctg cagactggga 8100 ggccaccccc tccttcccag ggttcactgg aggtgaccaa ggtaggaaat ggccttaaca 8160 cagggatgac tgcgccatcc cccaacagag tcagccccct cctgctctgt accccgcacc 8220 ccccaggcca gtccacgaaa accagggccc cacatcagag tcactgcctg gcccggccct 8280 ggggcggacc cctcagcccc caccctgtct agaggacttg gggggacagg acacaggccc 8340 tctccttatg gttcccccac ctgcctccgg ccgggaccct tggggtgtgg acagaaagga 8400 cacctgccta attggccccc aggaacccag aacttctctc cagggacccc agcccgagca 8460 cccccttacc caggacccag ccctgcccct cctcccctct gctctcctct catcacccca 8520 tgggaatccg gtatccccag gaagccatca ggaagggctg aaggaggaag cggggccgtg 8580 caccaccggg caggaggctc cgtcttcgtg aacccaggga agtgccagcc tcctagaggg 8640 tatggtccac cctgcctggg gctcccaccg tggcaggctg cggggaagga ccagggacgg 8700 tgtgggggag ggctcagggc cctgcgggtg ctcctccatc ttcggtgagc ctcccccttc 8760 acccaccgtc ccgcccacct cctctccacc ctggctgcac gtcttccaca ccatcctgag 8820 tcctacctac accagagcca gcaaagccag tgcagacaaa ggctggggtg caggggggct 8880 gccagggcag cttcggggag ggaaggatgg agggagggga ggtcagtgaa gaggccccct 8940 tcccctgggt ccaggatcct cctctgggac ccccggatcc catcccctcc tggctctggg 9000 aggagaagca ggatgggaga atctgtgcgg gaccctctca cagtggaata tccccacagc 9060 ggctcaggcc agacccaaaa gcccctcagt gagccctcca ctgcagtcct gggcctgggt 9120 agcagcccct cccacagagg acagacccag caccccgaag aagtcctgcc agggggagct 9180 cagagccatg aaagagcagg atatggggtc cccgatacag gcacagacct cagctccatc 9240 caggcccacc gggacccacc atgggaggaa cacctgtctc cgggttgtga ggtagctggc 9300 ctctgtctcg gaccccactc cagacaccag acagaggggc aggcccccca aaaccagggt 9360 tgagggatga tccgtcaagg cagacaagac caaggggcac tgaccccagc aagggaaggc 9420 tcccaaacag acgaggagga ttttgtagct gtctgtatca ctgtgtgcaa ctgcagcaga 9480 tgggctcgcg accatagcag gtgctgccac agtgacactc gccaggtcaa aaaccccgtc 9540 ccaagtcagc ggaagcagag agagcaggga ggacacgttt aggatctgag gccgcacctg 9600 acacccaggg cagcagacgt ctcccctcca gggcaccctc caccgtcctg cgtttcttca 9660 agaatagggg cggcctgagg gggtccaggg ccaggcgata ggtcccctct accccaagga 9720 ggagccaggc aggacccgag caccgatgca tctaacgcag tcatgtaatg ctgggtgaca 9780 gtcagttcgc ctacgta 9797 <210> 235 <211> 12029 <212> DNA <213> Artificial Sequence <220> <223> TxDH120126 <400> 235 tacgtaatgc atctaacgca gtcatgtaat gctgggtgac agtcagttcg cctccccatt 60 gaggctgacc tgcccagacg ggcctgggcc caccccacac accggggcgg aatgtgtgca 120 ggccccagtc tctgtgggtg ttccgctagc tggggccccc agtgctcacc ccacacctaa 180 agcgagcccc agcctccaga gccccctaag cattccccgc ccagcagccc agcccctgcc 240 cccacccagg aggccccaga gctcagggcg cctggtcgga ttttgtacag ccccgagtca 300 ctgtggagag agcttgcaat ggcagacgcg gctgcagcag atgggctcgc gatcatagca 360 ggtgctgcca cagtgagaaa aactgtgtca aaaaccgact cctggcagca gtcggaggcc 420 ccgccagaga ggggagcagc cggcctgaac ccatgtcctg ccggttccca tgacccccag 480 cacccagagc cccacggtgt ccccgttgga taatgaggac aagggctggg ggctccggtg 540 gtttgcggca gggacttgat cacatccttc tgctgtggcc ccattgcctc tggctggagt 600 tgacccttct gacaagtgtc ctcagaaaga cagggatcac cggcacctcc caatatcaac 660 cccaggcagc acagacacaa accccacatc cagagccaac tccaggagca gagacacccc 720 aacactctgg gggaccccaa ccgtgataac tccccactgg aatccgcccc agagtctacc 780 aggaccaaag gccctgccct gtctctgtcc ctcactcagg gcctcctgca gggcgagcgc 840 ttgggagcag actcggtctt aggggacacc actgtgggcc ccaactttga tgaggccact 900 gacccttcct tcctttcctg gggcagcaca gactttgggg tctgggcagg gaagaactac 960 tggctggtgg ccaatcacag agcccccagg ccgaggtggc cccaagaagg ccctcaggag 1020 gtggccactc cacttcctcc cagctggacc ccaggtcctc cccaagatag gggtgccatc 1080 caaggcaggt cctccatgga gcccccttca gactcctccc gggaccccac tggacctcag 1140 tccctgctct gggaatgcag ccaccacaag cacaccagga agcccaggcc cagccaccct 1200 gcagtgggca agcccacact ctggagcaga gcagggtgcg tctgggaggg gctaacctcc 1260 ccacccccca ccccccatct gcacacagcc acctaccact gcccagaccc tctgcaggag 1320 ggccaagcca ccatggggta tggacttagg gtctcactca cgtgcctccc ctcctgggag 1380 aaggggcctc atgcccagat ccctgcagca ctagacacag ctggaggcag tggccccagg 1440 gccaccctga cctggcatct aaggctgctc cagcccagac agcactgccg ttcctgggaa 1500 gcctgggctc caccagacca caggtccagg gcacagccca caggagccac ccacacacag 1560 ctcacaggaa gaagataagc tccagacccc agggcgggac ctgccttcct gccaccactt 1620 acacacaggc cagggagctg ttcccacaca gatcaacccc aaaccgggac tgcctggcac 1680 tagggtcact gccatttccc tctccattcc ctcccagtgc ctctgtgctc cctccttctg 1740 gggaacaccc tgtgcagccc ctccctgcag cccacacgct ggggagaccc caccctgcct 1800 cgggcctttt ctacctgctg cacttgccgc ccacccaaac aaccctgggt acgtgaccct 1860 gcagtcctca ccctgatctg caaccagacc cctgtccctc cctctaaaca cccctcccag 1920 gccaactctg cacctgcagg ccctccgctc ttctgccaca agagcctcag gttttcctac 1980 ctgtgcccac cccctaaccc ctcctgccca caacttgagt tcttcctctc ctggagccct 2040 tgagccatgg cactgaccct acactcccac ccacacactg cccatgccat caccttcctc 2100 ctggacactc tgaccccgct cccctccctc tcagacccgg ccctggtatt tccaggacaa 2160 aggctcaccc aagtcttccc catgcaggcc cttgccctca ctgcctggtt acacgggagc 2220 ctcctgtgcg cagaagcagg gagctcagct cttccacagg cagaaggcac tgaaagaaat 2280 cagcctccag tgccttgaca cacgtccgcc tgtgtctctc actgcctgca cctgcaggga 2340 ggctccgcac tccctctaaa gatgagggat ccaggcagca acatcacggg agaatgcagg 2400 gctcccagac agcccagccc tctcgcaggc ctctcctggg aagagacctg cagccaccac 2460 tgaacagcca cggaggtcgc tggatagtaa ccgagtcagt gaccgacctg gagggcaggg 2520 gagcagtgaa ccggagccca taccataggg acagagacca gccgctaaca tcccgagccc 2580 ctcactggcg gccccagaac accccgtgga aagagaacag acccacagtc ccacctggaa 2640 cagggcagac actgctgagc ccccagcacc agccccaaga aacactaggc aacagcatca 2700 gagggggctc ctgagaaaga gaggagggga ggtctccttc accatcaaat gcttcccttg 2760 accaaaaaca gggtccacgc aactccccca ggacaaagga ggagccccct gtacagcact 2820 gggctcagag tcctctctga gacaggctca gtttcagaca acaacccgct ggaatgcaca 2880 gtctcagcag gagagccagg ccagagccag caagaggaga ctcggtgaca ccagtctcct 2940 gtagggacag gaggattttg tgggggttcg tgtcactgtg agcatattgt cggagcaggc 3000 agtgctattc ccacagtgac acaaccccat tcaaaaaccc ctactgcaaa cgcacccact 3060 cctgggactg aggggctggg ggagcgtctg ggaagtatgg cctaggggtg tccatcaatg 3120 cccaaaatgc accagactct ccccaagaca tcaccccacc agccagtgag cagagtaaac 3180 agaaaatgag aagcagctgg gaagcttgca caggccccaa ggaaagagct ttggcaggtg 3240 tgcaagaggg gatgtgggca gagcctcagc agggcctttt gctgtttctg ctttcctgtg 3300 cagagagttc cataaactgg tattcaagat caatggctgg gagtgagccc aggaggacag 3360 tgtgggaaga gcacagggaa ggaggagcag ccgctatcct acactgtcat cttttgaaag 3420 tttgccctgt gcccacaatg ctgcatcatg ggatgcttaa cagctgatgt agacacagct 3480 aaagagagaa tcagtgaaat ggatttgcag cacagatctg aataaatcct ccagaatgtg 3540 gagcagcaca gaagcaagca cacagaaagt gcctgatgcc aaggcaaagt tcagtgggca 3600 ccttcaggca ttgctgctgg gcacagacac tctgaaaagc actggcagga actgcctgtg 3660 acaaagcaga accctcaggc aatgccagcc ctagagccct tcctgagaac ctcatgggca 3720 aagatgtgca gaacagctgt ttgtcatagc cccaaactat ggggctggac aaagcaaacg 3780 tccatctgaa ggagaacaga caaataaacg atggcaggtt catgaaatgc aaactaggac 3840 agccagagga caacagtaga gagctacagg cggctttgcg gttgagttca tgacaatgct 3900 gagtaattgg agtaacagag gaaagcccaa aaaatacttt taatgtgatt tcttctaaat 3960 aaaatttaca cccggcaaaa tgaactatct tcttaaggga taaactttcc cctggaaaaa 4020 ctataaggaa aatcaagaaa acgatgatca cataaacaca gtggtggtta cttctactgg 4080 ggaaggaaga gggtatgagc tgagacacac agagtcggca agtctcctaa caagaacaga 4140 acaaatacat tacagtacct tgaaaacagc agttaaactt ctaaatcgca agaagaggaa 4200 aatgcacaca cctgtgttta gaaaattctc agtccagcac tgttcataat agcaaagaca 4260 ttaacccagg ttggataaat aagcgatgac acaggcaatt gcacaatgat acagacatac 4320 attcagtata tgagacatcg atgatgtatc cccaaagaaa tgactttaaa gagaaaaggc 4380 ctgatgtgtg gtggcaatca cctccctggg catccccgga caggctgcag gctcactgtg 4440 tggcagggca ggcaggcacc tgctggcagc tcctggggcc tgatgtggag caggcacaga 4500 gctgtatatc cccaaggaag gtacagtcag tgcattccag agagaagcaa ctcagccaca 4560 ctccctggcc agaacccaag atgcacaccc atgcacaggg aggcagagcc cagcacctcc 4620 gcagccacca ccacctgcgc acgggccacc accttgcagg cacagagtgg gtgctgagag 4680 gaggggcagg gacaccaggc agggtgagca cccagagaaa actgcagaag cctcacacat 4740 ccctcacctg gcctgggctt cacctgacct ggacctcacc tggcctcggg cctcacctgc 4800 acctgctcca ggtcttgctg gagcctgagt agcactgagg ctgtagggac tcatccaggg 4860 ttggggaatg actctgcaac tctcccacat ctgacctttc tgggtggagg cacctggtgg 4920 cccagggaat ataaaaagcc ccagaatgat gcctgtgtga tttgggggca atttatgaac 4980 ccgaaaggac atggccatgg ggtgggtagg gacagtaggg acagatgtca gcctgaggtg 5040 aagcctcagg acacaggtgg gcatggacag tgtccaccta agcgagggac agacccgagt 5100 gtccctgcag tagacctgag agcgctgggc ccacagcctc ccctcggggc cctgctgcct 5160 cctcaggtca gccctggaca tcccgggttt ccccaggcct ggcggtagga ttttgttgag 5220 gtctgtgtca ctgtggtatt actatgagag gcttgcttgt ggcttcccta agagctgcag 5280 caggcaagct aagcctcaca gatgctgcta ttactaccac agtgtcacag agtccatcaa 5340 aaacccatgc ctgggagcct cccaccacag ccctccctgc gggggaccgc tgcatgccgt 5400 gttaggattt tgatcgagga cacggcgcca tgggtatggt ggctaccaca gcagtgcagc 5460 ccatgaccca aacacacggg gcagcagaaa caatggacag gcccacaagt gaccatgatg 5520 ggctccagcc caccagcccc agagaccatg aaacagatgg ccaaggtcac cctacaggtc 5580 atccagatct ggctccaagg ggtctgcatc gctgctgccc tcccaacgcc aaaccagatg 5640 gagacagggc cggccccata gcaccatctg ctgccgtcca cccagcagtc ccggaagccc 5700 ctccctgaac gctgggccac gtgtgtgaac cctgcgagcc ccccatgtca gagtaggggc 5760 agcaggaggg cggggctggc cctgtgcact gtcactgccc ctgtggtccc tggcctgcct 5820 ggccctgaca cctgagcctc tcctgggtca tttccaagac attcccaggg acagccggag 5880 ctgggagtcg ctcatcctgc ctggctgtcc tgagtcctgc tcatttccag acctcaccag 5940 ggaagccaac agaggactca cctcacacag tcagagacaa cgaaccttcc agaaatccct 6000 gtttctctcc ccagtgagag aaaccctctt ccagggtttc tcttctctcc caccctcttc 6060 caggacagtc ctcagcagca tcacagcggg aacgcacatc tggatcagga cggcccccag 6120 aacacgcgat ggcccatggg gacagcccag cccttcccag acccctaaaa ggtatcccca 6180 ccttgcacct gccccagggc tcaaactcca ggaggcctga ctcctgcaca ccctcctgcc 6240 agatatcacc tcagccccct cctggagggg acaggagccc gggagggtga gtcagaccca 6300 cctgccctca atggcaggcg gggaagattc agaaaggcct gagatcccca ggacgcagca 6360 ccactgtcaa tgggggcccc agacgcctgg accagggcct gtgtgggaaa ggcctctggc 6420 cacactcagg gggattttgt gaagggccct cccactgtgg agaggctttg ctgtggcttc 6480 cctaagagct gccgcagcag gcaatgcaag cctcacagat gctgccacag tgatgaaacc 6540 agcatcaaaa accgaccgga ctcgcagggt ttatgcacac ttctcggctc ggagctctcc 6600 aggagcacaa gagccaggcc cgagggtttg tgcccagacc ctcggcctct agggacaccc 6660 gggccatctt agccgatggg ctgatgccct gcacaccgtg tgctgccaaa caggggcttc 6720 agagggctct gaggtgactt cactcatgac cacaggtgcc ctggtccctt cactgccagc 6780 tgcaccagac cctgttccga gagatgcccc agttccaaaa gccaattcct ggggccggga 6840 attactgtag acaccagcct cattccagta cctcctgcca attgcctgga ttcccatcct 6900 ggctggaatc aagagggcag catccgccag gctcccaaca ggcaggactc ccacacaccc 6960 tcctctgaga ggccgctgtg ttccgcaggg ccaggccgca gacagttccc ctcacctgcc 7020 catgtagaaa cacctgccat tgtcgtcccc acctggcaaa gaccacttgt ggagccccca 7080 gccccaggta cagctgtaga gagagtcctc gaggccccta agaaggagcc atgcccagtt 7140 ctgccgggac cctcggccag gccgacagga gtggacgctg gagctgggcc cacactgggc 7200 cacataggag ctcaccagtg agggcaggag agcacatgcc ggggagcacc cagcctcctg 7260 ctgaccagag acccgtccca gagcccagga ggctgcagag gcctctccag ggggacacag 7320 tgcatgtctg gtccctgagc agcccccagg ctctctagca ctgggggccc ctggcacagc 7380 tgtctggacc ctccctgttc cctgggaagc tcctcctgac agccccgcct ccagttccag 7440 gtgtggattt tgtcaggggg tgccacactg tgtactgcca gaagtggatg tggacttgcg 7500 atagtgagag gaagtgctgt gagggtatgg tatgccggct gtggtgtaag aagaagctct 7560 ggcacagtgg tgccgcccat atcaaaaacc aggccaagta gacagacccc tgccacgcag 7620 ccccaggcct ccagctcacc tgcttctcct ggggctctca aggctgctgt ctgccctctg 7680 gccctctgtg gggagggttc cctcagtggg aggtctgtgc tccagggcag ggatgactga 7740 gatagaaatc aaaggctggc agggaaaggc agcttcccgc cctgagaggt gcaggcagca 7800 ccacagagcc atggagtcac agagccacgg agcccccagt gtgggcgtgt gagggtgctg 7860 ggctcccggc aggcccagcc ctgatgggga agcctgcccc gtcccacagc ccaggtcccc 7920 aggggcagca ggcacagaag ctgccaagct gtgctctacg atcctcatcc ctccagcagc 7980 atccactcca cagtggggaa actgagcctt ggagaaccac ccagccccct ggaaacaagg 8040 cggggagccc agacagtggg cccagagcac tgtgtgtatc ctggcactag gtgcagggac 8100 cacccggaga tccccatcac tgagtggcca gcctgcagaa ggacccaacc ccaaccaggc 8160 cgcttgatta agctccatcc ccctgtcctg ggaacctctt cccagcgcca ccaacagctc 8220 ggcttcccag gccctcatcc ctccaaggaa ggccaaaggc tgggcctgcc aggggcacag 8280 taccctccct tgccctggct aagacagggt gggcagacgg ctgcagatag gacatattgc 8340 tggggcatct tgctctgtga ctactgggta ctggctctca acgcagaccc taccaaaatc 8400 cccactgcct cccctgctag gggctggcct ggtctcctcc tgctgtccta ggaggctgct 8460 gacctccagg atggcttctg tccccagttc tagggccaga gcagatccca ggcaggctgt 8520 aggctgggag gccacccctg tccttgccga ggttcagtgc aggcacccag gacaggaaat 8580 ggcctgaaca cagggatgac tgtgccatgc cctacctaag tccgcccctt tctactctgc 8640 aacccccact ccccaggtca gcccatgacg accaacaacc caacaccaga gtcactgcct 8700 ggccctgccc tggggaggac ccctcagccc ccaccctgtc tagaggagtt ggggggacag 8760 gacacaggct ctctccttat ggttccccca cctggctcct gccgggaccc ttggggtgtg 8820 gacagaaagg acgcctgcct aattggcccc caggaaccca gaacttctct ccagggaccc 8880 cagcccgagc acccccttac ccaggaccca gccctgcccc tcctcccctc tgctctcctc 8940 tcatcactcc atgggaatcc agaatcccca ggaagccatc aggaagggct gaaggaggaa 9000 gcggggccgc tgcaccaccg ggcaggaggc tccgtcttcg tgaacccagg gaagtgccag 9060 cctcctagag ggtatggtcc accctgcctg gggctcccac cgtggcaggc tgcggggaag 9120 gaccagggac ggtgtggggg agggctcagg gccctgcagg tgctccatct tggatgagcc 9180 catccctctc acccaccgac ccgcccacct cctctccacc ctggccacac gtcgtccaca 9240 ccatcctgag tcccacctac accagagcca gcagagccag tgcagacaga ggctggggtg 9300 caggggggcc gccagggcag ctttggggag ggaggaatgg aggaagggga ggtcagtgaa 9360 gaggcccccc tcccctgggt ctaggatcca cctttgggac ccccggatcc catcccctcc 9420 aggctctggg aggagaagca ggatgggaga ttctgtgcag gaccctctca cagtggaata 9480 cctccacagc ggctcaggcc agatacaaaa gcccctcagt gagccctcca ctgcagtgca 9540 gggcctgggg gcagcccctc ccacagagga cagacccagc accccgaaga agtcctgcca 9600 gggggagctc agagccatga aggagcaaga tatggggacc ccaatactgg cacagacctc 9660 agctccatcc aggcccacca ggacccacca tgggtggaac acctgtctcc ggcccctgct 9720 ggctgtgagg cagctggcct ctgtctcgga cccccattcc agacaccaga cagagggaca 9780 ggccccccag aaccagtgtt gagggacacc cctgtccagg gcagccaagt ccaagaggcg 9840 cgctgagccc agcaagggaa ggcccccaaa caaaccagga ggtttctgaa gctgtctgtg 9900 tcacagtctg ctgcaactgc agcagcaaat ggtgccgcga ccatagcagg tgctgccaca 9960 atgacactgg gcaggacaga aaccccatcc caagtcagcc gaaggcagag agagcaggca 10020 ggacacattt aggatctgag gccacacctg acactcaagc caacagatgt ctcccctcca 10080 gggcgccctg ccctgttcag tgttcctgag aaaacagggg cagcctgagg ggatccaggg 10140 ccaggagatg ggtcccctct accccgagga ggagccaggc gggaatccca gccccctccc 10200 cattgaggcc atcctgccca gaggggcccg gacccacccc acacacccag gcagaatgtg 10260 tgcaggcctc aggctctgtg ggtgccgcta gctggggctg ccagtcctca ccccacacct 10320 aaggtgagcc acagccgcca gagcctccac aggagacccc acccagcagc ccagccccta 10380 cccaggaggc cccagagctc agggcgcctg ggtggatttt gtacagcccc gagtcactgt 10440 gggtatagtg gggagaggct ttgtggcttc cctaagagct gcagcaggca aaagcctcac 10500 agatgctgca gctactacca cagtgagaaa agctatgtca aaaaccgtct cccggccact 10560 gctggaggcc cagccagaga agggaccagc cgcccgaaca tacgaccttc ccagacctca 10620 tgacccccag cacttggagc tccacagtgt ccccattgga tggtgaggat gggggccggg 10680 gccatctgca cctcccaaca tcacccccag gcagcacagg cacaaacccc aaatccagag 10740 ccgacaccag gaacacagac accccaatac cctgggggac cctggccctg gtgacttccc 10800 actgggatcc acccccgtgt ccacctggat caaagacccc accgctgtct ctgtccctca 10860 ctcagggcct gctgaggggc gggtgctttg gagcagactc aggtttaggg gccaccattg 10920 tggggcccaa cctcgaccag gacacagatt tttctttcct gccctggggc aacacagact 10980 ttggggtctg tgcagggagg accttctgga aagtcaccaa gcacagagcc ctgactgagg 11040 tggtctcagg aagaccccca ggagggggct tgtgcccctt cctctcatgt ggaccccatg 11100 ccccccaaga taggggcatc atgcagggca ggtcctccat gcagccacca ctaggcaact 11160 ccctggcgcc ggtccccact gcgcctccat cccggctctg gggatgcagc caccatggcc 11220 acaccaggca gcccgggtcc agcaaccctg cagtgcccaa gcccttggca ggattcccag 11280 aggctggagc ccacccctcc tcatcccccc acacctgcac acacacacct accccctgcc 11340 cagtccccct ccaggagggt tggagccgcc catagggtgg gggctccagg tctcactcac 11400 tcgcttccct tcctgggcaa aggagcctcg tgccccggtc ccccctgacg gcgctgggca 11460 caggtgtggg tactgggccc cagggctcct ccagccccag ctgccctgct ctccctggga 11520 ggcctgggca ccaccagacc accagtccag ggcacagccc cagggagccg cccactgcca 11580 gctcacagga agaagataag cttcagaccc tcagggccgg gagctgcctt cctgccaccc 11640 cttcctgccc cagacctcca tgccctcccc caaccactta cacacaagcc agggagctgt 11700 ttccacacag ttcaacccca aaccaggacg gcctggcact cgggtcactg ccatttctgt 11760 ctgcattcgc tcccagcgcc cctgtgttcc ctccctcctc cctccttcct ttcttcctgc 11820 attgggttca tgccgcagag tgccaggtgc aggtcagccc tgagcttggg gtcacctcct 11880 cactgaaggc agcctcaggg tgcccagggg caggcagggt gggggtgagg cttccagctc 11940 caaccgcttc gctaccttag gaccgttata gttaggcgcg ccgtcgacca attctcatgt 12000 ttgacagctt atcatcgaat ttctacgta 12029 <210> 236 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 236 tcttatcaga cagggggctc tc 22 <210> 237 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 237 gtgactggag ttcagacgtg tgctcttccg atcttcacca tggactgsac ctgga 55 <210> 238 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 238 gtgactggag ttcagacgtg tgctcttccg atctccatgg acacactttg ytccac 56 <210> 239 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 239 gtgactggag ttcagacgtg tgctcttccg atcttcacca tggagtttgg gctgagc 57 <210> 240 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 240 gtgactggag ttcagacgtg tgctcttccg atctagaaca tgaaacayct gtggttctt 59 <210> 241 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 241 gtgactggag ttcagacgtg tgctcttccg atctatgggg tcaaccgcca tcct 54 <210> 242 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 242 gtgactggag ttcagacgtg tgctcttccg atctacaatg tctgtctcct tcctcat 57 <210> 243 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <400> 243 acactctttc cctacacgac gctcttccga tctgggaaga catttgggaa ggac 54 <210> 244 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <220> <221> nnnnnn <222> (25)..(30) <223> 6 nucleotide index <220> <221> misc_feature <222> (25)..(30) <223> n is a, c, g, or t <400> 244 caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 245 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer and/or probe <220> <221> nnnnnn <222> (29)..(35) <223> 6 nucleotide index <220> <221> misc_feature <222> (30)..(35) <223> n is a, c, g, or t <400> 245 aatgatacgg cgaccaccga gatctacacn nnnnnacact ctttccctac acgacgctct 60 tccgatct 68

Claims

항체의 개발을 위한 랫트 또는 마우스로서,
(A) 내인성 중쇄 좌위에서 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열되지 않은 면역글로불린 중쇄 가변 영역을 포함하는 생식 세포로서,
재배열되지 않은 면역글로불린 중쇄 가변 영역은 작동가능하게 연결된
(i) 재배열되지 않은 인간 V_H (hV_H) 유전자 분절,
(ii) 하나 이상의 내인성 D_H 유전자 분절을 치환하는 조작된 D_H(engineered D_H, eD_H) 영역으로서, 조작된 D_H 영역은 각각
(a) 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 암호화하고,
(b) 제1 및 제2 재조합 신호 서열의 측부에 위치하는
하나 이상의 eDH 뉴클레오티드 서열을 포함하는, 조작된 D_H 영역, 및
(iii) 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절
을 포함하는, 생식 세포, 및
(B) B 세포
를 포함하며,
(i)의 재배열되지 않은 hV_H 유전자 분절, (ii)의 하나 이상의 eD_H 뉴클레오티드 서열 및 (iii)의 재배열되지 않은 hJ_H 유전자 분절은 B 세포에서 재조합되어서, 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열된 중쇄 가변 영역 hV_H/eD_H/hJ_H 서열을 형성하고,
B 세포는 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열된 V_H/eD_H/hJ_H 서열을 발현하는, 랫트 또는 마우스.
제1 항에 있어서, 관심있는 비-면역글로불린 폴리펩티드는 케모카인 수용체인 인 것을 특징으로 하는 랫트 또는 마우스.
제2 항에 있어서, 케모카인 수용체는 비정형 케모카인 수용체 (ACKR)인 것을 특징으로 하는 랫트 또는 마우스.
제3 항에 있어서, ACKR은 D6 케모카인 유인 수용체인 것을 특징으로 하는 랫트 또는 마우스.
제4 항에 있어서, 조작된 D_H 영역은 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 5, 10, 15, 20, 25개 이상의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제5 항에 있어서, 조작된 D_H 영역은 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 25개의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제5 항에 있어서, D6 케모카인 유인 수용체의 세포외 부분은 N-말단 영역, 세포외 루프, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 랫트 또는 마우스.
제6 항에 있어서, 25개의 eD_H 뉴클레오티드 서열은 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41, 서열번호 43, 서열번호 45, 서열번호 47, 또는 서열번호 49로서 제시된 서열과 적어도 95% 동일한 서열을 각각 암호화하는 것을 특징으로 하는 랫트 또는 마우스.
제6 항에 있어서, 25개의 eD_H뉴클레오티드 서열은 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41, 서열번호 43, 서열번호 45, 서열번호 47, 또는 서열번호 49로서 제시된 서열과 실질적으로 동일한 서열을 각각 암호화하는 것을 특징으로 하는 랫트 또는 마우스.
제6 항에 있어서, 25개의 eD_H뉴클레오티드 서열은 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41, 서열번호 43, 서열번호 45, 서열번호 47, 또는 서열번호 49로서 제시된 서열과 동일한 서열을 각각 암호화하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항에 있어서, 관심있는 비-면역글로불린 폴리펩티드는 코노독소 또는 독거미 독소인 것을 특징으로 하는 랫트 또는 마우스.
제11 항에 있어서, 코노독소는 α-코노독소, δ-코노독소, κ-코노독소, μ-코노독소, ω-코노독소 및 이들의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 랫트 또는 마우스.
제12 항에 있어서, 코노독소는 μ-코노독소인 것을 특징으로 하는 랫트 또는 마우스.
제13 항에 있어서, 조작된 D_H 영역은 μ-코노독소, 독거미 독소, 또는 이들의 조합의 부분을 각각 암호화하는 5, 10, 15, 20, 25개 이상의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제14 항에 있어서, 조작된 D_H 영역은 μ-코노독소 및/또는 독거미 독소의 부분을 각각 암호화하는 26개의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제15 항에 있어서, 26개의 eD_H뉴클레오티드 서열은 서열번호 180, 서열번호 182, 서열번호 184, 서열번호 186, 서열번호 188, 서열번호 190, 서열번호 192, 서열번호 194, 서열번호 196, 서열번호 198, 서열번호 200, 서열번호 202, 서열번호 204, 서열번호 206, 서열번호 208, 서열번호 210, 서열번호 212, 서열번호 214, 서열번호 216, 서열번호 218, 서열번호 220, 서열번호 222, 서열번호 224, 서열번호 226, 서열번호 228 또는 서열번호 230으로서 제시된 서열과 적어도 95% 동일한 서열을 각각 암호화하는 것을 특징으로 하는 랫트 또는 마우스.
제15 항에 있어서, 26개의 eD_H뉴클레오티드 서열은 서열번호 180, 서열번호 182, 서열번호 184, 서열번호 186, 서열번호 188, 서열번호 190, 서열번호 192, 서열번호 194, 서열번호 196, 서열번호 198, 서열번호 200, 서열번호 202, 서열번호 204, 서열번호 206, 서열번호 208, 서열번호 210, 서열번호 212, 서열번호 214, 서열번호 216, 서열번호 218, 서열번호 220, 서열번호 222, 서열번호 224, 서열번호 226, 서열번호 228 또는 서열번호 230으로서 제시된 서열과 실질적으로 동일한 서열을 각각 암호화하는 것을 특징으로 하는 랫트 또는 마우스.
제15 항에 있어서, 26개의 eD_H뉴클레오티드 서열은 서열번호 180, 서열번호 182, 서열번호 184, 서열번호 186, 서열번호 188, 서열번호 190, 서열번호 192, 서열번호 194, 서열번호 196, 서열번호 198, 서열번호 200, 서열번호 202, 서열번호 204, 서열번호 206, 서열번호 208, 서열번호 210, 서열번호 212, 서열번호 214, 서열번호 216, 서열번호 218, 서열번호 220, 서열번호 222, 서열번호 224, 서열번호 226, 서열번호 228 또는 서열번호 230으로서 제시된 서열과 동일한 서열을 각각 암호화하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 하나 이상의 eD_H뉴클레오티드 서열은 하나 이상의 eD_H뉴클레오티드 서열의 체세포 과돌연변이를 증가시키는 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제1 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 제1 재조합 신호 서열과 적어도 95% 동일한 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제1 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 제1 재조합 신호 서열과 실질적으로 동일한 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제1 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 제1 재조합 신호 서열과 동일한 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제2 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 제2 재조합 신호 서열과 적어도 95% 동일한 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제2 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 제2 재조합 신호 서열과 실질적으로 동일한 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제2 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 제2 재조합 신호 서열과 동일한 서열을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 제1 및 제2 재조합 신호 서열은 서열번호 51-112 중 어느 하나로서 제시된 서열로부터 선택되는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 랫트 또는 마우스는 하나 이상의 야생형 내인성 D_H 유전자 분절을 보유하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 재배열되지 않은 인간 V_H (hV_H) 유전자 분절은 복수의 hV_H 유전자 분절을 포함하고 및/또는 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절은 복수의 hJ_H 유전자 분절을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서,
(i) 재배열되지 않은 인간 V_H (hV_H) 유전자 분절은 내인성 V_H 유전자 분절을 치환하고,
(ii) 조작된 D_H 영역은 내인성 D_H 유전자 분절을 치환하고,
(iii) 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절은 내인성 J_H 유전자 분절을 치환하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 재배열되지 않은 면역글로불린 중쇄 가변 영역은 작동가능하게 연결된
(i) 내인성 V_H 유전자 분절을 치환하는 재배열되지 않은 인간 V_H (hV_H) 유전자 분절,
(ii) 내인성 D_H 유전자 분절을 치환하는 조작된 D_H 영역, 및
(iii) 모든 내인성 J_H 유전자 분절을 치환하는 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절
을 포함하는 것을 특징으로 하는 랫트 또는 마우스.
제1 항 내지 제18 항 중 어느 한 항에 있어서, 이것은 마우스인 것을 특징으로 하는 랫트 또는 마우스.
항체의 개발에 유용한 설치류의 생성을 위한 단리된 설치류 세포로서, 내인성 중쇄 좌위에서 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖고,
재배열되지 않은 면역글로불린 중쇄 가변 영역은 (i)의 재배열되지 않은 hV_H 유전자 분절, (ii)의 하나 이상의 eD_H 뉴클레오티드 서열 및 (iii)의 재배열되지 않은 hJ_H 유전자 분절이 B 세포에서 재조합되어서, 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열된 중쇄 가변 영역 hV_H/eD_H/hJ_H 서열을 형성하도록
(i) 재배열되지 않은 인간 V_H (hV_H) 유전자 분절,
(ii) 각각
(a) 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 암호화하고,
(b) 제1 및 제2 재조합 신호 서열의 측부에 위치하는
하나 이상의 eD_H 뉴클레오티드 서열을 포함하는 조작된 D_H 영역, 및
(iii) 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절을 포함하며,
설치류 세포는 랫트 세포 또는 마우스 세포인, 단리된 설치류 세포.
제32 항에 있어서, 세포는 배아 줄기 세포 또는 생식 세포인 것을 특징으로 하는 단리된 설치류 세포.
항체의 개발에 유용한 설치류의 생성을 위한 설치류 배아로서, 배아 줄기 세포를 포함하고,
각각의 배아 줄기 세포의 게놈은 내인성 중쇄 좌위에서 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 면역글로불린 중쇄 가변 영역을 포함하고,
재배열되지 않은 면역글로불린 중쇄 가변 영역은 (i)의 재배열되지 않은 hV_H 유전자 분절, (ii)의 하나 이상의 eD_H 뉴클레오티드 서열, 및 (iii)의 재배열되지 않은 hJ_H 유전자 분절이 B 세포에서 재조합되어서, 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열된 중쇄 가변 영역 hV_H/eD_H/hJ_H 서열을 형성하도록
(i) 재배열되지 않은 인간 V_H (hV_H) 유전자 분절,
(ii) 각각
(a) 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 암호화하고,
(b) 제1 및 제2 재조합 신호 서열의 측부에 위치하는
하나 이상의 eD_H 뉴클레오티드 서열을 포함하는 조작된 D_H 영역, 및
(iii) 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절을 포함하며,
설치류 배아는 랫트 배아 또는 마우스 배아인, 설치류 배아.
항체의 개발을 위한 단리된 설치류 조직으로서, 내인성 중쇄 좌위에서 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 면역글로불린 중쇄 가변 영역을 포함하는 게놈을 갖는 세포를 포함하고,
재배열되지 않은 면역글로불린 중쇄 가변 영역은 (i)의 재배열되지 않은 hV_H 유전자 분절, (ii)의 하나 이상의 eD_H 뉴클레오티드 서열, 및 (iii)의 재배열되지 않은 hJ_H 유전자 분절이 재조합되어서, 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열된 중쇄 가변 영역 hV_H/eD_H/hJ_H 서열을 형성하도록
(i) 재배열되지 않은 인간 V_H (hV_H) 유전자 분절,
(ii) 각각
(a) 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 암호화하고,
(b) 제1 및 제2 재조합 신호 서열의 측부에 위치하는
하나 이상의 eD_H 뉴클레오티드 서열을 포함하는 조작된 D_H 영역, 및
(iii) 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절을 포함하며,
설치류 조직은 랫트 조직 또는 마우스 조직인, 설치류 조직.
조작된 D_H 영역을 포함하는 면역글로불린 중쇄 가변 영역을 함유하는 게놈을 갖는 설치류를 제조하는 방법으로서, 상기 방법은
(a) 랫트 또는 마우스 배아 줄기 세포를 수득하는 단계로서, 랫트 또는 마우스 배아 줄기 세포는 내인성 면역글로불린 중쇄 좌위에서 재배열되지 않은 인간 V_H 유전자 분절, 재배열되지 않은 인간 면역글로불린 D_H 유전자 분절 및 재배열되지 않은 인간 면역글로불린 J_H 유전자 분절을 포함하는 인간 게놈 서열로의 내인성 면역글로불린 V_H 유전자 분절, 내인성 면역글로불린 D_H 유전자 분절 및 내인성 면역글로불린 J_H 유전자 분절을 포함하는 내인성 서열의 치환을 포함하는 단계,
(b) 조작된 D_H 유전자 분절이 재배열되지 않은 인간 V_H 유전자 분절 및 재배열되지 않은 인간 J_H 유전자 분절에 작동가능하게 연결되어 그 사이에 삽입되도록 재배열되지 않은 인간 면역글로불린 D_H 유전자 분절 중 하나 이상을 조작된 D_H 영역으로 치환하는 단계로서,
조작된 D_H 영역은 (i)의 재배열되지 않은 인간 V_H 유전자 분절, (ii)의 조작된 D_H 영역, 및 (iii)의 재배열되지 않은 인간 J_H 유전자 분절이 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결되고 B 세포에서 재조합되어서, 내인성 면역글로불린 중쇄 불변 영역에 또한 작동가능하게 연결된 재배열된 중쇄 가변 영역 hV_H/eD_H/hJ_H 서열을 형성할 수 있도록 각각
(i) 관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 암호화하고;
(ii) 제1 및 제2 재조합 신호 서열의 측부에 위치하는
하나 이상의 eD_H 뉴클레오티드 서열을 포함하는, 단계; 및
(c) (b)의 배아 줄기 세포를 사용해 랫트 또는 마우스를 생성하는 단계
를 포함하는, 방법.
제36 항에 있어서, 관심있는 비-면역글로불린 폴리펩티드는 케모카인 수용체인 것을 특징으로 하는 방법.
제37 항에 있어서, 케모카인 수용체는 비정형 케모카인 수용체 (ACKR)인 것을 특징으로 하는 방법.
제38 항에 있어서, ACKR은 D6 케모카인 유인 수용체인 것을 특징으로 하는 방법.
제39 항에 있어서, DNA 단편은 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 5, 10, 15, 20, 25개 이상의 eD_H 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제40 항에 있어서, DNA 단편은 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 25개의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제40 항에 있어서, D6 케모카인 유인 수용체의 세포외 부분은 N-말단 영역, 세포외 루프, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제36 항에 있어서, 관심있는 비-면역글로불린 폴리펩티드는 코노독소 또는 독거미 독소인 것을 특징으로 하는 방법.
제43 항에 있어서, 코노독소는 α-코노독소, δ-코노독소, κ-코노독소, μ-코노독소, ω-코노독소 및 이들의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제44 항에 있어서, 코노독소는 μ-코노독소인 것을 특징으로 하는 방법.
제45 항에 있어서, DNA 단편은 μ-코노독소, 독거미 독소, 또는 이들의 조합의 부분을 각각 암호화하는 5, 10, 15, 20, 25개 이상의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제46 항에 있어서, DNA 단편은 μ-코노독소 및/또는 독거미 독소의 부분을 각각 암호화하는 26개의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제36 항 내지 제47 항 중 어느 한 항에 있어서, 인간 게놈 서열은 인간 면역글로불린 중쇄 가변 영역을 포함하고, 인간 면역글로불린 중쇄 가변 영역은 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 것을 특징으로 하는 방법.
설치류에서 항체를 생산하는 방법으로서, 상기 방법은
(a) 설치류를 항원으로 면역화시키는 단계로서, 설치류는 랫트 또는 마우스이고, 설치류는 내인성 중쇄 좌위에서 내인성 면역글로불린 중쇄 불변 영역에 작동가능하게 연결된 재배열되지 않은 면역글로불린 중쇄 가변 영역을 포함하는 생식 세포를 포함하고, 면역글로불린 중쇄 가변 영역은 작동가능하게 연결된
(i) 재배열되지 않은 인간 V_H (hV_H) 유전자 분절,
(ii) 조작된 D_H 영역으로서, 하나 이상의 내인성 D_H 유전자 분절을 치환하고 각각
관심있는 비-면역글로불린 폴리펩티드, 또는 그의 부분을 암호화하고,
제1 및 제2 재조합 신호 서열의 측부에 위치하는
하나 이상의 eD_H뉴클레오티드 서열을 포함하는, 조작된 D_H 영역; 및
(iii) 재배열되지 않은 인간 J_H (hJ_H) 유전자 분절
을 포함하는, 단계;
(b) 설치류가 항원에 대한 면역 반응을 생성하는 충분한 조건 하에서 설치류를 유지하는 단계; 및
(c) 항원에 결합하는 항체를 설치류, 또는 설치류 세포로부터 회수하는 단계를 포함하는, 방법.
제49 항에 있어서, 설치류 세포는 B 세포인 것을 특징으로 하는 방법.
제50 항에 있어서, B 세포를 골수종 세포에 융합시켜 하이브리도마를 생성하는 단계를 더 포함하는 것을 특징으로 하는 방법.
제49 항에 있어서, 관심있는 비-면역글로불린 폴리펩티드는 케모카인 수용체인 것을 특징으로 하는 방법.
제52 항에 있어서, 케모카인 수용체는 비정형 케모카인 수용체 (ACKR)인 것을 특징으로 하는 방법.
제53 항에 있어서, ACKR은 D6 케모카인 유인 수용체인 것을 특징으로 하는 방법.
제54 항에 있어서, 조작된 D_H 영역은 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 5, 10, 15, 20, 25개 이상의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제55 항에 있어서, 조작된 D_H 영역은 D6 케모카인 유인 수용체의 세포외 부분을 각각 암호화하는 25개의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제55 항에 있어서, D6 케모카인 유인 수용체의 세포외 부분은 N-말단 영역, 세포외 루프, 및 이들의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제49 항에 있어서, 관심있는 비-면역글로불린 폴리펩티드는 코노독소 또는 독거미 독소인 것을 특징으로 하는 방법.
제58 항에 있어서, 코노독소는 α-코노독소, δ-코노독소, κ-코노독소, μ-코노독소, ω-코노독소 및 이들의 조합으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 방법.
제59 항에 있어서, 코노독소는 μ-코노독소인 것을 특징으로 하는 방법.
제60 항에 있어서, 조작된 D_H 영역은 μ-코노독소, 독거미 독소, 또는 이들의 조합의 부분을 각각 암호화하는 5, 10, 15, 20, 25개 이상의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제61 항에 있어서, 조작된 D_H 영역은 μ-코노독소 및/또는 독거미 독소의 부분을 각각 암호화하는 26개의 eD_H뉴클레오티드 서열을 포함하는 것을 특징으로 하는 방법.
제49 항 내지 제62 항 중 어느 한 항에 있어서, 면역글로불린 중쇄 가변 영역은 인간 면역글로불린 중쇄 가변 영역인 것을 특징으로 하는 방법.
제49 항 내지 제62 항 중 어느 한 항에 있어서, 면역글로불린 중쇄 가변 영역은 면역글로불린 중쇄 불변 영역에 작동가능하게 연결되는 것을 특징으로 하는 방법.
제64 항에 있어서, 면역글로불린 중쇄 불변 영역은 내인성 면역글로불린 중쇄 불변 영역인 것을 특징으로 하는 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제