KR20220125797A

KR20220125797A - 인간 또는 키메라 mhc 단백질 복합체를 갖는, 유전자 변형된 비-인간 동물

Info

Publication number: KR20220125797A
Application number: KR1020227025422A
Authority: KR
Inventors: 유에레이 쉔; 차오스 구오; 메이링 장; 루이 황; 야난 구오; 양 바이; 지아웨이 야오; 쳉장 샹
Original assignee: 바이오사이토젠 파마슈티컬스 (베이징) 컴퍼니 리미티드
Priority date: 2020-01-10
Filing date: 2021-01-08
Publication date: 2022-09-14
Also published as: EP4087392A1; CN113105555B; WO2021139799A1; IL294356A; EP4087392A4; US20230072216A1; JP2023509082A; CN113105555A

Abstract

인간 또는 키메라(예를 들어, 인간화) 주조직적합성 복합체(MHC) 단백질 복합체를 발현하는 유전자 변형된 비-인간 동물 및 이의 사용 방법이 제공된다.

Description

인간 또는 키메라 MHC 단백질 복합체를 갖는, 유전자 변형된 비-인간 동물

본 개시내용은 인간 또는 키메라(예를 들어, 인간화) 주조직적합성 복합체(MHC) 단백질 복합체를 발현하는 유전자 변형된 동물 및 이의 사용 방법에 관한 것이다.

주조직적합성 복합체(MHC) 클래스 I 및 클래스 II 단백질은 면역계의 적응성 분기에 중심 역할을 한다. 이 두 클래스의 단백질들은 모두 T 세포에 의한 인식을 위해 세포 표면 상에 펩티드를 제시하는 임무를 공유한다. 면역원성 펩티드-MHC 클래스 I(pMHCI) 복합체는 유핵 세포 상에서 제시되고, 세포독성 CD8+ T 세포에 의해 인식된다. 대조적으로, 항원 제시 세포(예를 들어, 수지상 세포(DC), 대식세포, 또는 B 세포)에 의한 pMHCII의 제시는 CD4+ T 세포를 활성화할 수 있어서, 이펙터 세포의 조절 및 제어를 유도한다.

인간 MHC 단백질 복합체는 고도로 다형성이며, 동물의 MHC와 상이하다. 이러한 차이는 약물 개발에서 더 높은 실패율을 초래할 수 있다. 특히, 생체 내 약학 시험을 위한 통상의 실험 동물의 사용으로부터 수득된 시험 결과는 인간에서 실제 질병 상태 및 세포 상호작용을 반영할 수 없을 것이며, 따라서 많은 임상 시험에서의 결과는 동물 실험 결과와 상당히 상이할 수 있다. 인간 면역계와 더 유사한 면역계를 생성할 수 있는 유전자 조작된 동물이 필요하다.

본 개시내용은 인간 또는 키메라(예를 들어, 인간화) 주조직적합성 복합체(MHC) 단백질 복합체를 발현하는 유전자 변형된 동물에 관한 것이다. 일부 구현예에서, 동물은 (예를 들어, CD132 유전자 녹아웃을 갖는) 면역-결핍 동물 모델로서 사용된다. MHC는 T 세포 발생과 관련되기 때문에, 인간 또는 인간화 MHC는 재구성화된 인간 면역계를 갖는 동물 모델에서 T 세포 발생에 더 양호한 환경을 제공할 수 있다.

일 양태에서, 본 개시내용은 β2 마이크로글로불린(B2M) 및 인간 또는 인간화 주조직적합성 복합체(MHC) 분자(예를 들어, MHC α 사슬)를 포함하는 융합 단백질을 발현하는 유전자 변형된 비-인간 동물에 관한 것이다.

일부 구현예에서, 동물의 유전체는 융합 단백질을 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 포함한다.

일부 구현예에서, 융합 단백질은 인간 또는 인간화 B2M 단백질을 포함한다.

일부 구현예에서, MHC 분자는 MHC 클래스 I 또는 MHC 클래스 IIα 사슬이다.

일부 구현예에서, MHC α 사슬은 인간 HLA-A 단백질이다.

일부 구현예에서, MHC α 사슬은 키메라 MHC α 사슬이다. 일부 구현예에서, MHC α 사슬은 인간 HLA-A/마우스 H2-D1 키메라 분자이다.

일부 구현예에서, 융합 단백질은 인간 B2M 단백질, 및 인간 HLA-A α1 및/또는 α2 도메인을 포함하는 키메라 MHC α 사슬을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 마우스 H2-D1 도메인(예를 들어, α1, α2 및/또는 α3 도메인)을 추가로 포함한다.

일부 구현예에서, 융합 단백질은 인간 B2M 단백질 및 인간 HLA-A 단백질을 포함한다.

일부 구현예에서, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 β2 마이크로글로불린(B2M) 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다.

일부 구현예에서, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 MHC 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다.

일부 구현예에서, 동물은 마우스이며, MHC 분자를 인코딩하는 서열은 적어도 하나의 염색체 내의 마우스 H2-D1 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된다.

일부 구현예에서, 인간 HLA-A는 인간 HLA-A2.1이다. 일부 구현예에서, 인간 HLA-A는 인간 HLA-A1*0101이다.

일부 구현예에서, 융합 단백질은 (a) 인간 B2M; 및 (b) 인간 HLA-A를 포함한다.

일부 구현예에서, 인간 B2M 및 인간 HLA-A는 링커 펩티드 서열을 통해 연결된다.

일부 구현예에서, 인간 B2M은 서열번호 4 또는 서열번호 4의 아미노산 21-119와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일부 구현예에서, 인간 HLA-A는 HLA-A2.1 또는 HLA- A1*0101이다.

일부 구현예에서, 인간 HLA-A는 서열번호 8, 서열번호 8의 아미노산 25-365, 서열번호 59, 또는 서열번호 59의 아미노산 22-362와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일부 구현예에서, 융합 단백질은 서열번호 62와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일부 구현예에서, 융합 단백질은 (a) 인간 B2M; 및 (b) 키메라 MHC α 사슬을 포함한다.

일부 구현예에서, 인간 B2M 및 키메라 MHC α 사슬은 링커 펩티드 서열을 통해 연결된다.

일부 구현예에서, 키메라 MHC α 사슬은 인간 HLA-A α1 및 α2 도메인을 포함한다.

일부 구현예에서, 키메라 MHC α 사슬은 인간 HLA-A α3 도메인을 추가로 포함한다.

일부 구현예에서, 키메라 MHC α 사슬은 내인성 MHC α3 도메인 및/또는 내인성 MHC 세포질 영역을 추가로 포함한다.

일부 구현예에서, 키메라 MHC α 사슬은 서열번호 8, 서열번호 8의 아미노산 25-206, 서열번호 59, 또는 서열번호 59의 아미노산 22-203과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.

일부 구현예에서, 키메라 MHC α 사슬은 α3 도메인, 연결 펩티드, 막관통 영역, 및 내인성 MHC의 세포질 영역을 포함한다.

일부 구현예에서, 동물은 마우스이며, 키메라 MHC는 α3 도메인, 연결 펩티드, 막관통 영역, 및 마우스 H2-D1의 세포질 영역을 포함한다.

일부 구현예에서, 키메라 MHC는 서열번호 6의 아미노산 207-362과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.

일부 구현예에서, 키메라 MHC는 서열번호 61 또는 서열번호 63과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.

일부 구현예에서, 융합 단백질은 (예를 들어, 융합 단백질의 N-말단에서) 인간 HLA-A2.1의 신호 펩티드를 추가로 포함한다.

일부 구현예에서, 신호 펩티드는 서열번호 59의 아미노산 1-21과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.

일부 구현예에서, 동물은 인간 또는 인간화 MHC α 사슬 또는 융합 단백질을 인코딩하는 서열에 대해 이형접합성이다. 일부 구현예에서, 동물은 인간 또는 인간화 MHC α 사슬 또는 융합 단백질을 인코딩하는 서열에 대해 동형접합성이다.

일 양태에서, 본 개시내용은 인간 HLA-A α1 도메인, 인간 HLA-A α2 도메인 및 내인성 MHC α3 도메인을 포함하는 키메라 MHC α 사슬을 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 유전체에 포함하는 유전자 변형된 비-인간 동물에 관한 것이다.

일부 구현예에서, 키메라 MHC α 사슬을 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 MHC 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된다.

일부 구현예에서, 동물의 유전체는 인간 B2M을 인코딩하는 서열을 추가로 포함한다. 일부 구현예에서, 인간 B2M 및 키메라 MHC α 사슬은 서로 결합하여 동물에서 기능성 MHC 단백질 복합체를 형성할 수 있다.

일부 구현예에서, 인간 B2M을 인코딩하는 서열은 내인성 B2M 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다.

일부 구현예에서, 동물은 마우스이며, 키메라 MHC α 사슬을 인코딩하는 서열은 마우스 H2-D1 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다.

일부 구현예에서, 인간 HLA-A는 인간 HLA-A2.1이다.

일 양태에서, 본 개시내용은 인간 HLA-A를 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 유전체에 포함하는 유전자 변형된 비-인간 동물에 관한 것이다.

일부 구현예에서, 인간 HLA-A를 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 MHC 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된다.

일부 구현예에서, 동물의 유전체는 인간 B2M을 인코딩하는 서열을 추가로 포함한다. 일부 구현예에서, 인간 B2M 및 인간 HLA-A는 서로 결합하여 동물에서 기능성 MHC 단백질 복합체를 형성할 수 있다.

일부 구현예에서, 동물은 마우스이며, 인간 HLA-A를 인코딩하는 서열은 마우스 H2-D1 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다.

일부 구현예에서, 인간 HLA-A는 인간 HLA-A2.1이다.

일부 구현예에서, 동물은 내인성 B2M을 발현하지 않는다.

일부 구현예에서, 동물은 내인성 MHC 분자(예를 들어, MHC α 사슬)를 발현하지 않는다.

일부 구현예에서, B2M 및 MHC α 사슬은 서로 결합하여 기능성 MHC 단백질 복합체를 형성할 수 있다. 일부 구현예에서, 단백질 복합체는 하나 이상의 세포의 표면에 비-자기(non-self) 항원을 제시할 수 있다.

일부 구현예에서, 인간 T 세포(예를 들어, 세포독성 T 세포)는 제시된 비-자기 항원을 인식하고 면역 반응을 개시할 수 있다. 일부 구현예에서, 내인성 T 세포(예를 들어, 세포독성 T 세포)는 제시된 비-자기 항원을 인식하고 면역 반응을 개시할 수 있다.

일부 구현예에서, 동물은 포유동물이며, 예를 들어, 원숭이, 설치류 또는 마우스이다. 일부 구현예에서, 동물은 마우스(예를 들어, C57BL/6 백그라운드를 가짐)이다.

일부 구현예에서, 동물의 유전체는 동물의 내인성 CD132 유전자에서의 파괴를 포함한다. 일부 구현예에서, 동물은 B-NDG 마우스, NOD/scid 마우스, NOD/scid 누드 마우스, 또는 B-NDG 마우스이다. 일부 구현예에서, 동물은 면역결핍 마우스이다.

일부 구현예에서, 동물은 추가의 인간 또는 키메라 단백질을 인코딩하는 서열을 추가로 포함한다. 일부 구현예에서, 추가의 인간 또는 키메라 단백질은 프로그램된 세포 사멸 단백질 1(PD-1), 세포독성 T-림프구-연관 단백질 4(CTLA-4), 림프구 활성화 3(LAG-3), B 및 T 림프구 연관(BTLA), 프로그램된 세포 사멸 1 리간드 1(PD-L1), CD27, CD28, SIRPα, CD47, THPO, CD137, CD154, Ig 및 ITIM 도메인을 갖는 T-세포 면역수용체(TIGIT), T-세포 면역글로불린 및 뮤신-도메인 함유-3(TIM-3), 글루코코르티코이드-유도된 TNFR-관련 단백질(GITR), 신호 조절 단백질 α(SIRPα) 또는 TNF 수용체 상과(superfamily) 구성원 4(OX40)이다.

일 양태에서, 본 개시내용은 동물의 적어도 하나의 세포 내 내인성 B2M 유전자 자리에서, 내인성 B2M 영역을 인코딩하는 서열을 인간 B2M을 인코딩하는 서열 또는 본 명세서에 설명된 바와 같은 융합 단백질을 인코딩하는 서열로 대체하는 단계를 포함하는 유전자 변형된 비-인간 동물을 제조하는 방법에 관한 것이다.

일부 구현예에서, 내인성 B2M 영역을 인코딩하는 서열은 내인성 B2M 유전자의 엑손 1, 엑손 2, 및 엑손 3의 전부 또는 일부를 포함한다.

일 양태에서, 본 개시내용은 동물의 적어도 하나의 세포 내 내인성 MHC 유전자 자리에서, 내인성 MHC 유전자 영역을 인코딩하는 서열을 인간 MHC 유전자를 인코딩하는 서열 또는 융합 단백질을 인코딩하는 서열로 대체하는 단계를 포함하는 유전자 변형된 비-인간 동물을 제조하는 방법에 관한 것이다.

일부 구현예에서, 내인성 MHC 영역을 인코딩하는 서열은 내인성 MHC 유전자의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8의 전부 또는 일부를 포함한다.

일부 구현예에서, 동물은 마우스이며, 내인성 MHC 영역을 인코딩하는 서열은 마우스 H2-D1 유전자의 엑손 1, 엑손 2, 엑손 3의 전부 또는 일부를 포함한다.

일부 구현예에서, 융합 단백질을 인코딩하는 서열은 다음 요소들: (a) 인간 B2M의 엑손 1, 엑손 2, 및/또는 엑손 3; (b) 링커 펩티드 서열을 인코딩하는 선택적인(optional) 서열; 및 (c) 인간 HLA-A2.1의 엑손 2 및/또는 엑손 3을 포함한다. 일부 구현예에서, 융합 단백질을 인코딩하는 서열은 요소 (c)의 하류인, 내인성 MHC의 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8을 추가로 포함한다.

일부 구현예에서, 동물은 마우스이며, 융합 단백질을 인코딩하는 서열은 마우스 H2-D1 유전자의 3' UTR을 추가로 포함한다.

일부 구현예에서, 융합 단백질은 서열번호 61, 서열번호 62, 서열번호 63, 또는 서열번호 64와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함한다.

일 양태에서, 본 개시내용은 암 치료를 위한 제제 또는 제제들의 조합의 유효성을 결정하는 방법에 관한 것으로, 이는 본 명세서에 설명된 바와 같은 동물에 종양 세포를 이식(engrafting)하여, 동물에서 하나 이상의 종양을 형성하는 단계; 제제 또는 제제들의 조합을 동물에게 투여하는 단계; 및 종양에 대한 억제 효과를 결정하는 단계를 포함한다.

일부 구현예에서, 동물에게 종양 세포를 이식하기 전에, 인간 말초 혈액 세포(hPBMC) 또는 인간 조혈모세포가 동물에게 주입된다.

일부 구현예에서, 종양 세포는 암 세포주로부터 유래한다. 일부 구현예에서, 종양 세포는 인간 환자로부터 수득된 종양 샘플로부터 유래한다.

일부 구현예에서, 억제 효과는 동물 내 종양 부피를 측정함으로써 결정된다.

일부 구현예에서, 종양 세포는 흑색종 세포, 폐암 세포, 원발성 폐 암종 세포, 비소세포 폐 암종(NSCLC) 세포, 소세포 폐암(SCLC) 세포, 원발성 위 암종 세포, 방광암 세포, 유방암 세포, 및/또는 전립선암 세포이다.

일 양태에서, 본 개시내용은 인간 혈액-림프계를 포함하는 동물을 제조하는 방법에 관한 것으로, 이 방법은 인간 조혈 세포 또는 인간 말초 혈액 세포를 포함하는 세포 개체군을 본 명세서에 설명된 바와 같은 동물 내로 이식하는 단계를 포함한다.

일부 구현예에서, 인간 혈액-림프계는 조혈모세포, 골수 전구 세포, 골수 세포, 수지상 세포, 단핵구, 과립구, 호중구, 비만 세포, 림프구, 및 혈소판으로 이루어진 군으로부터 선택된 인간 세포를 포함한다.

일부 구현예에서, 본 명세서에 설명된 방법은 이식 전에 동물을 방사선조사하는 단계를 추가로 포함한다.

일 양태에서, 본 개시내용은 β2 마이크로글로불린(B2M) 및 인간 또는 인간화 주조직적합성 복합체(MHC) 분자를 포함하는 융합 단백질에 관한 것이다.

일 양태에서, 본 개시내용은 본 명세서에 설명된 바와 같은 융합 단백질을 인코딩하는 핵산에 관한 것이다.

일 양태에서, 본 개시내용은 아미노산 서열을 포함하는 단백질에 관한 것이다. 일부 구현예에서, 아미노산 서열은 하기 중 하나이다:

(a) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열;

(b) 서열번호 4, 8, 59, 61, 62, 63, 또는 64와 적어도 90% 동일한 아미노산 서열;

(c) 서열번호 4, 8, 59, 61, 62, 63, 또는 64와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열;

(d) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 아미노산이 상이한 아미노산 서열; 및

(e) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열에 대한 1, 2, 3, 4, 5개 이상의 아미노산의 대체, 결실 및/또는 삽입을 포함하는 아미노산 서열.

일 양태에서, 본 개시내용은 뉴클레오티드 서열을 포함하는 핵산에 관한 것이다. 일부 구현예에서, 뉴클레오티드 서열은 하기 중 하나이다:

(a) 본 명세서에 설명된 바와 같은 단백질을 인코딩하는 서열;

(b) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65;

(c) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65와 적어도 90% 동일한 서열; 및

(d) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열.

일 양태에서, 본 개시내용은 본 명세서에 설명된 바와 같은 단백질 및/또는 핵산을 포함하는 세포에 관한 것이다. 일 양태에서, 본 개시내용은 본 명세서에 설명된 바와 같은 단백질 및/또는 핵산을 포함하는 동물에 관한 것이다.

일 양태에서, 융합 단백질(예를 들어, 키메라 폴리펩티드)을 발현하는 서열을 포함하는 적어도 하나의 염색체를 유전체에 포함하는 유전자 변형된 비-인간 동물이 본 명세서에 제공된다. 일부 구현예에서, 융합 단백질은 인간 B2M 단백질의 전체 또는 일부, 및/또는 인간 MHC 분자(예를 들어, MHC α 사슬)의 전체 또는 일부를 포함한다. 일부 구현예에서, 융합 단백질은 본 개시내용에 설명된 융합 단백질 중 어느 하나이다.

일부 구현예에서, 융합 단백질은 야생형 인간 MHC 분자(예를 들어, HLA-A)의 단백질 활성(예를 들어, 항원-제시)의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 100%를 포함한다.

일부 구현예에서, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 B2M 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다. 일부 구현예에서, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 MHC 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된다. 일부 구현예에서, 동물은 마우스이며, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 마우스 H2-D1 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된다.

또 다른 양태에서, 본 개시내용은 본 명세서에 설명된 바와 같은 파괴, 결실 또는 유전자 변형을 포함하는, 비-인간 포유동물 세포에 관한 것이다.

일부 구현예에서, 세포는 Cas9 mRNA 또는 이의 시험관 내 전사체를 포함한다.

일부 구현예에서, 비-인간 포유동물 세포는 마우스 세포이다. 일부 구현예에서, 세포는 수정란 세포이다. 일부 구현예에서, 세포는 생식 세포이다. 일부 구현예에서, 세포는 배반포이다.

또 다른 양태에서, 본 개시내용은 종양 보유 비-인간 포유동물 모델에 관한 것으로, 비-인간 포유동물 모델은 본 명세서에 설명된 바와 같은 방법을 통해 수득되는 것을 특징으로 한다.

본 개시내용은 또한 비-인간 포유동물 또는 그의 자손, 또는 종양 보유 비-인간 포유동물로부터 유래된 세포 또는 세포주, 또는 이의 일차 세포 배양물에 관한 것이다.

본 개시내용은 추가로 비-인간 포유동물 또는 그의 자손, 또는 종양 보유 비-인간 포유동물로부터 유래된 조직, 기관 또는 이의 배양물에 관한 것이다.

또 다른 양태에서, 본 개시내용은 비-인간 포유동물 또는 그의 자손이 종양을 보유하는 경우 그로부터, 또는 종양 보유 비-인간 포유동물로부터 유래된 종양 조직에 관한 것이다.

본 개시내용은 추가로 인간 세포의 면역화 과정에 관련된 제품의 개발, 인간 항체의 제조, 또는 약학, 면역학, 미생물학 및 의약에서의 연구를 위한 모델 시스템에서의 본 명세서에 설명된 바와 같은 방법을 통해 생성된 동물 모델인, 비-인간 포유동물 또는 그의 자손, 또는 종양 보유 비-인간 포유동물의 용도에 관한 것이다.

본 개시내용은 또한 인간 세포와 관련된 면역화 과정의 동물 실험 질병 모델의 제조 및 이용, 병원체에 대한 연구, 또는 새로운 진단 전략 및/또는 치료 전략의 개발에서의 본 명세서에 설명된 바와 같은 방법을 통해 생성된 동물 모델인, 비-인간 포유동물 또는 그의 자손, 또는 종양 보유 비-인간 포유동물의 용도에 관한 것이다.

달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 본 발명에서 사용하기 위한 방법 및 재료가 본 명세서에 설명되며; 당업계에 알려진 다른 적합한 방법 및 재료가 또한 사용될 수 있다. 재료, 방법 및 실시예는 단지 예시적인 것이며, 제한하려는 의도가 아니다. 본 명세서에서 언급된 모든 간행물, 특허 출원, 특허, 서열, 데이터베이스 항목, 및 기타 참고 문헌은 그 전체가 참조로 포함된다. 상충되는 경우, 정의를 포함한 본 명세서가 우선할 것이다.

본 발명의 기타 다른 특징 및 이점은 하기 상세한 설명 및 도면, 그리고 청구범위로부터 명백할 것이다.

발명의 상세한 설명

면역결핍 동물은 질병의 메커니즘, 및 그러한 질병의 치료 방법을 연구하는 데 없어서는 안 될 연구 도구이다. 이들은 면역결핍증으로 인해 이종 세포 또는 조직을 쉽게 수용할 수 있어, 연구에 널리 사용되어 왔다. 흔히 사용되는 면역결핍 동물에는 예를 들어, NOD-Prkdc^scid IL-2rγ^null 마우스, NOD-Rag 1^-/--IL2rg^-/-(NRG), Rag 2^-/- - IL2rg^-/-(RG), NOD/SCID(NOD-Prkdc^scid), 및 NOD/SCID 누드 마우스가 포함된다. 이 중, NOD-Prkdc^scid IL-2rγ^null 마우스가 이식에 최적인 수용자 마우스일 수 있다. 이러한 마우스 중 일부는 예를 들어, 문헌[Ito et al. "Current advances in humanized mouse models." Cellular & molecular immunology 9.3 (2012): 208]; 및 US20190320631 A1에 상세히 설명되어 있으며, 이들 각각은 그 전체가 본 명세서에 참조로 포함된다.

T 세포가 자기 MHC 단백질과 연관된 항원은 인식하지만, 외부 MHC 단백질과 관련된 것은 인식하지 않는다는 것, 즉, T 세포는 MHC 제한을 나타낸다는 것이 잘 확립되어 있다. 이러한 제한은 흉선에서 T 세포가 발달하는 동안 양성 선택 과정에서 발생한다. 이 과정에서, 자기 MHC 단백질에 의해 제시된 외부 펩티드를 인식할 수 있는 이러한 미성숙 T 세포는 생존하도록 선택되는 한편, 동물에게 쓸모가 없는 나머지는 세포사멸을 겪는다. 따라서, MHC 제한은 흉선에서 T 세포가 발달함에 따라 나타나는 면역계의 후천적 특성이다. 그러나, 이러한 면역결핍 동물(예를 들어, NOD-Prkdc^scidIL-2rγ^null)에서, 면역결핍 동물의 MHC는 여전히 내인성 MHC이다. 인간 세포 또는 조직의 이식 후, 인간-유래 면역 세포는 동물의 흉선에서 인간 HLA에 의해 매개되는 제한 과정을 거칠 수 없으며, 면역요법 또는 병원체의 감염 후 인간 MHC의 제한을 반영할 수 없다. 따라서, 일부 경우에, 이식된 인간 T 및 B 세포는 이러한 면역결핍 동물에서 완전히 기능적으로 성숙하지 않는다.

본 개시내용은 인간 또는 키메라(예를 들어, 인간화) 주조직적합성 복합체(MHC) 단백질 복합체를 발현하는 유전자 변형된 동물, 및 이의 사용 방법에 관한 것이다. 일부 구현예에서, 동물은 면역결핍 동물(예를 들어, NOD-Prkdc^scid IL-2rγ^null, NOD-Rag 1^-/--IL2rg^-/-(NRG), Rag 2^-/-- IL2rg^-/-(RG), 또는 NOD/SCID(NOD-Prkdc^scid) 백그라운드)이다. 인간 또는 인간화 MHC는 이식된 인간 면역 세포(예를 들어, T 세포 및 B 세포)가 성숙하기 위한 더 양호한 환경을 제공하며, 특히 이러한 동물은 인간에 대한 다양한 요법의 효능을 결정하기 위한 더 잘 작동되는 모델을 제공한다.

주조직적합성 복합체

주조직적합성 복합체(MHC)는, 암 유래 또는 바이러스 유래 항원 펩티드를 제시함으로써 T 세포 면역 반응에 의해 유도되는 신체의 방어 메커니즘에서 중요한 역할을 한다. MHC는 클래스 I 또는 클래스 II로서 분류된다. 클래스 I은 생식 세포 및 적혈구를 제외하고 모든 체세포에서 발현된다. MHC 클래스 I 단백질 복합체는 α 사슬(알파 사슬 또는 중쇄) 및 β2 마이크로글로불린(B2M)으로 알려진 더 작은 사슬로 구성된다. α 사슬은 항원 펩티드-유지 홈의 형성과 관련된 α1 및 α2 도메인, 및 세포독성 T 세포(CTL) 표면 상에서 발현되는 공동-수용체 CD8 분자와의 결합과 관련된 α3 도메인으로 구성된다. MHC 클래스 I 분자와 같이, 클래스 II 분자도 이종이량체이며, 2개의 펩티드, α 및 β 사슬을 갖는다.

인간과 마우스 모두는 MHC 클래스 I 및 클래스 II 유전자를 갖는다. 인간에서 고전적인 클래스 I 유전자는 HLA-A, HLA-B 및 HLA-C로 지칭되는 반면, 마우스에서는 H-2K, H-2D 및 H-2L이다. 클래스 I 분자에서, α-사슬(중쇄로도 알려짐)은 다형성이고, 더 작은 사슬 B2M(경쇄로도 알려짐)은 일반적으로 다형성이 아니다. α-사슬은 3개의 도메인(α1, α2 및 α3)을 함유한다. 일반적으로, α-사슬 유전자의 엑손 1은 리더 서열을 인코딩하고, 엑손 2 및 3은 α1 및 α2 도메인을 인코딩하고, 엑손 4는 α3 도메인을 인코딩하고, 엑손 5는 막관통 도메인을 인코딩하고, 엑손 6 및 7은 세포질 꼬리(tail)를 인코딩한다. α-사슬은, β2-마이크로글로불린과 유사한, α3 도메인에 뒤따르는, α1 및 α2 도메인(Ig-유사 도메인과 유사함)을 포함하는 펩티드-결합 틈(cleft)을 형성한다.

클래스 I MHC는 종양 세포를 포함하는 모든 유핵 세포 상에서 발현된다. 이들은 특히, T 및 B 림프구, 대식세포, 수지상 세포 및 호중구 상에서 특이적으로 발현되며, CD8+ 세포독성 T 림프구(CTL)에 표면 상에 펩티드 단편(통상적으로, 길이가 8~10개인 아미노산)을 표시하는 기능을 한다. CTL은 자체 막-결합 TCR에 의해 인식되는 MHC I-결합 펩티드를 보유하는 임의의 세포를 사멸시키는 데 특화되어 있다. 세포가 정상적으로 존재하지 않는 세포 단백질(예를 들어, 바이러스, 종양 또는 기타 비-자기 기원)로부터 유래된 펩티드를 표시하는 경우, 이러한 펩티드는 CTL에 의해 인식되어, 활성화되어 펩티드를 표시하는 세포를 사멸시킨다.

본 개시내용은, 인간 또는 키메라(예를 들어, 인간화) MHC 단백질 복합체, MHC 클래스 I 폴리펩티드, 또는 B2M을 발현하는, 유전자 변형된 동물에 관한 것이다. 본 명세서에 사용된 바와 같이, 용어 "MHC I 복합체" 또는 "MHC 클래스 I 복합체"는 MHC I α 사슬 폴리펩티드 및 B2M 폴리펩티드에 의해 형성된 복합체를 지칭한다. 일부 구현예에서, MHC I α 사슬 폴리펩티드 및 B2M 폴리펩티드는 서로 융합된다. 본 명세서에 사용된 바와 같이, 용어 "MHC I 폴리펩티드" 또는 "MHC 클래스 I 폴리펩티드"는 MHC I α 사슬 폴리펩티드 단독을 지칭한다.

β2 마이크로글로불린(B2M)

상기 논의된 바와 같이, 야생형 MHC 클래스 I 분자는 2개의 폴리펩티드 사슬, α 및 β2-마이크로글로불린(B2M)으로 이루어진 이종이량체이다(도 1). 두 사슬은 B2M과 α3 도메인의 상호작용을 통해 비공유적으로 연결된다. α 사슬만이 다형성이며, HLA 유전자에 의해 인코딩된다. B2M 서브유닛은 다형성이 아니며, B2M 유전자에 의해 인코딩된다. α3 도메인은 원형질막에 걸쳐 있으며, T-세포의 CD8 공동-수용체와 상호작용한다. α3-CD8 상호작용은 MHC I 분자를 제 위치에 유지시키는 한편, 세포독성 T 세포의 표면 상의 T 세포 수용체(TCR)는 α1-α2 이종이량체 리간드에 결합하고, 커플링된 펩티드의 항원성을 확인한다. α1 및 α2 도메인은 접혀서 펩티드가 결합되는 홈을 만든다. MHC 클래스 I 분자는 길이가 주로 8~10개의 아미노산인 펩티드에 결합한다.

B2M(β2M, β₂ 마이크로글로불린 또는 베타-2 마이크로글로불린으로도 알려짐)은 거의 모든 유핵 세포 및 혈청, 소변 및 활액을 포함하는 대부분의 생물학적 유체에 존재하는 소단백질(약 11,800 달톤)이다. 인간 β2M은 뮤린 단백질에 대해 70% 아미노산 서열 유사성을 나타내며, 이들 모두는 신테닉(syntenic) 염색체 상에 위치한다. B2M의 2차 구조는 단일 이황화 가교에 의해 연결된 2개의 β-시트로 조직화되는 7개의 β-스트랜드로 이루어지며, 이는 면역글로불린(Ig) 도메인의 통상적인 고전적인 β-샌드위치를 나타낸다. B2M은 막관통 영역을 갖지 않으며, 주조직적합성 복합체(MHC) 클래스 I 및 클래스 II를 포함하는 다른 적응성 면역 분자와 공유하는 불변-1 Ig 상과 도메인으로 지칭되는 독특한 분자 구조를 함유한다. 2개의 진화적으로 보존된 트립토판(Trp) 잔기는 B2M의 올바른 구조 접힘 및 기능에 중요하다. Trp60은 단백질 루프의 정점에서 용매에 노출되고, MHC I에서 B2M의 결합을 촉진하는 데 대단히 중요하다.

보통, B2M은 다른 폴리펩티드 사슬(α 사슬)과 비공유적으로 연결되어, MHC I, 신생아 Fc 수용체(FcRn), 분화 클러스터 1(CD1), 인간 혈색소증 단백질(HFE), Qa 등을 포함하는, MHC I 또는 유사 구조물을 형성한다. B2M은 α 사슬의 3개의 도메인 모두와 광범위하게 접촉한다. 따라서, α 사슬의 입체형태는 B2M의 존재에 크게 의존한다. α1 및 α2 도메인은 분자마다 상이하지만, α3 도메인 및 B2M은 분자간 상호작용이 일어나는 곳에서 상대적으로 보존된다. B2M과의 접촉 지점에 있는 다수의 잔기는 MHC I 또는 유사 분자 사이에 공유된다. 또한, α1 및 α2 도메인과의 상호작용은 천연 항원의 존재 하에 α3 도메인과 B2M의 짝지어진 결합에 중요하다. B2M은 이러한 분자로부터 분리되어 혈청 내로 흘러들어가, 신장으로 수송되어 분해 및 배설될 수 있다. 88-kD 단백질(칼넥신)은 소포체 내에서 새로 합성된 뮤린 MHC I 분자와 신속하게 정량적으로 결합된다. B2M 및 펩티드 모두는 효율적인 칼넥신 해리, 및 후속 MHC I 수송에 필요하다.

B2M은 MHC I 또는 유사한 분자의 3차 구조를 안정화할 수 있다. 이는 암세포에서 생존, 증식, 세포자멸사 및 심지어 전이의 기능적 제어에도 광범위하게 관여한다.

B2M 및 그의 기능의 상세한 설명은 예를 들어, 문헌[Li et al., "The implication and significance of beta 2 microglobulin: A conservative multifunctional regulator. "Chinese medical journal 129.4 (2016): 448; Wang et al., "Targeted Disruption of the β2-Microglobulin Gene Minimizes the Immunogenicity of Human Embryonic Stem cells," Stem cells translational medicine 4.10 (2015): 1234-1245]에서 찾을 수 있으며; 이들 각각은 그 전체가 본 명세서에 참조로 포함된다.

인간 유전체에서, B2M 유전자(Gene ID: 567)의 유전자 자리는 4개의 엑손인, 엑손 1, 엑손 2, 엑손 3, 및 엑손 4를 갖는다(도 2). B2M 단백질은 또한 신호 펩티드를 갖는다. 인간 B2M mRNA에 대한 뉴클레오티드 서열은 NM_004048.4(서열번호 3)이고, 인간 B2M에 대한 아미노산 서열은 NP_004039.1(서열번호 4)이다. 인간 B2M 뉴클레오티드 서열 및 아미노산 서열에서 각각의 엑손 및 각각의 영역에 대한 위치가 하기에 나열되어 있다.

인간 B2M (대략적인 위치)	NM_004048.3 1675 bp (서열번호 3)	NP_004039.1 119 aa (서열번호 4)
엑손 1	1-97	1-22
엑손 2	98-376	23-115
엑손 3	377-404	116-119
엑손 4	405-1675	비-코딩
신호 펩티드	31-90	1-20
실시예에서 공여자 영역	91-387	21-119

인간 B2M 유전자(Gene ID: 567)는 인간 유전체의 염색체 15에 위치하며, 이는 NC_000015.10 중 44,711,487부터 44,718,877에 위치한다(GRCh38.p13(GCF_000001405.39)). 전사물 NM_004048.3을 기준으로, 5'-UTR은 44,711,517부터 44,711,546까지, 엑손 1은 44,711,614부터 44,711,613까지, 제1 인트론은 44,711,614부터 44,715,422까지, 엑손 2는 44,715,423부터 44,715,701까지, 제2 인트론은 44,715,702부터 44,716,328까지, 엑손 3은 44,716,329부터 44,716,356까지, 제3 인트론은 44,716,357부터 44,717,606까지, 엑손 4는 44,717,607부터 44,718,145까지, 3'-UTR은 44,716,343부터 44,716,356까지 및 44,717,607부터 44,718,145까지이다. 인간 B2M 유전자 자리에 대한 모든 관련 정보는 그 전체가 본 명세서에 참조로 포함된 NCBI 웹사이트에서 Gene ID: 567로 찾을 수 있다.마우스에서, B2M 유전자 자리는 4개의 엑손인, 엑손 1, 엑손 2, 엑손 3, 및 엑손 4를 갖는다(도 2). 마우스 B2M 단백질은 또한 신호 펩티드를 갖는다. 마우스 B2M mRNA에 대한 뉴클레오티드 서열은 NM_009735.3(서열번호 1)이고, 마우스 B2M에 대한 아미노산 서열은 NP_033865.2(서열번호 2)이다. 마우스 B2M 뉴클레오티드 서열 및 아미노산 서열에서 각각의 엑손 및 각각의 영역에 대한 위치가 하기에 나열되어 있다:

마우스 B2M (대략적인 위치)	NM_009735.3 858 bp (서열번호 1)	NP_033865.2 119 aa (서열번호 2)
엑손 1	1-118	1-22
엑손 2	119-397	23-115
엑손 3	398-426	116-119
엑손 4	427-858	비-코딩
신호 펩티드	52-111	1-20
실시예에서 대체된 영역	52-426	1-119

마우스 B2m 유전자(Gene ID: 12010)는 NC_000068.7(GRCm38.p6(GCF_000001635.26))의 122,147,686부터 122,153,083에 위치한 마우스 유전체의 염색체 2에 위치한다. 전사물 NM_009735.3을 기준으로, 5'-UTR은 122,147,686부터 122,147,736까지, 엑손 1은 122,147,686부터 122,147,804까지, 제1 인트론은 122,147,805부터 122,150,872까지, 엑손 2는 122,150,873부터 122,151,151까지, 제2 인트론은 122,151,152부터 122,151,646까지, 엑손 3은 122,151,647부터 122,151,675까지, 제3 인트론은 122,151,676부터 122,152,650까지, 엑손 4는 122,152,651부터 122,153,083까지, 3'-UTR은 122,151,661부터 122,153,083까지이다. 마우스 B2m 유전자 자리에 대한 모든 관련 정보는 그 전체가 본 명세서에 참조로 포함된 NCBI 웹사이트에서 Gene ID: 12010로 찾을 수 있다.도 23은 마우스 B2M 아미노산 서열(NP_033865.2; 서열번호 2)과 인간 B2M 아미노산 서열(NP_004039.1; 서열번호 4) 사이의 배열을 보여준다. 따라서, 인간 및 마우스 B2M 사이의 상응하는 아미노산 잔기 또는 영역을 도 23에서 찾을 수 있다.

기타 다른 종들의 B2M 유전자, 단백질, 및 유전자 자리가 또한 당업계에 알려져 있다. 예를 들어, 라투스 노르베지쿠스(Rattus norvegicus)(쥐)에서 B2M에 대한 유전자 ID는 24223이고, 마카카 물라타(Macaca mulatta)(붉은털 원숭이)에서 B2M에 대한 유전자 ID는 712428이고, 에쿠우스 카발루스(Equus caballus)(말)에서 B2M에 대한 유전자 ID는 100034203이고, 서스 스크로파(Sus scrofa)(돼지)에서 B2M에 대한 유전자 ID는 397033이다. 이러한 유전자(예를 들어, 인트론 서열, 엑손 서열, 이들 단백질의 아미노산 잔기)에 대한 관련 정보는 예를 들어, 그 전체가 본 명세서에 참조로 포함된 NCBI 데이터베이스에서 찾을 수 있다. 도 24는 설치류 B2M 아미노산 서열(NP_036644.1; 서열번호 66)과 인간 B2M 아미노산 서열(NP_004039.1; 서열번호 4) 사이의 배열을 보여준다. 따라서, 인간과 설치류 B2M 사이의 상응하는 아미노산 잔기 또는 영역을 도 24에서 찾을 수 있다.

본 개시내용은 인간 또는 키메라(예를 들어, 인간화) B2M 뉴클레오티드 서열 및/또는 아미노산 서열을 제공한다. 일부 구현예에서, 마우스 엑손 1, 엑손 2, 엑손 3, 엑손 4, 및/또는 신호 펩티드의 전체 서열은 상응하는 인간 서열에 의해 대체된다. 일부 구현예에서, 마우스 엑손 1, 엑손 2, 엑손 3, 엑손 4, 및/또는 신호 펩티드의 "영역" 또는 "일부"는 상응하는 인간 서열에 의해 대체된다. 용어 "영역" 또는 "일부"는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 500, 또는 600개의 뉴클레오티드, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 또는 110개의 아미노산 잔기를 지칭할 수 있다. 일부 구현예에서, "영역" 또는 "일부"는 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 신호 펩티드와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일할 수 있다. 일부 구현예에서, 마우스 엑손 1, 엑손 2, 엑손 3, 및/또는 엑손 4의 영역, 일부, 또는 전체 서열(예를 들어, 엑손 1의 부분, 엑손 2, 및 엑손 3의 부분)은 인간 엑손 1, 엑손 2, 엑손 3, 및/또는 엑손 4의 서열의 영역, 일부, 또는 전체 서열(예를 들어, 엑손 1의 부분, 엑손 2, 및 엑손 3의 부분)에 의해 대체된다.

일부 구현예에서, 본 개시내용은 키메라(예를 들어, 인간화) B2M 뉴클레오티드 서열을 유전체에 포함하는 유전자 변형된 비-인간 동물에 관한 것이다. 일부 구현예에서, 키메라(예를 들어, 인간화) B2M 뉴클레오티드 서열은 신호 펩티드를 포함하는 B2M 단백질을 인코딩한다. 일부 구현예에서, 본 명세서에 설명된 신호 펩티드는 서열번호 2의 아미노산 1-22와 적어도 80%, 85%, 90%, 95%, 또는 100% 동일하다. 일부 구현예에서, 본 명세서에 설명된 신호 펩티드는 서열번호 4의 아미노산 1-22와 적어도 80%, 85%, 90%, 95%, 또는 100% 동일하다. 일부 구현예에서, 인간화 단백질은 서열번호 2의 아미노산 1-119 또는 23-119와 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 갖는다. 일부 구현예에서, 인간화 단백질은 서열번호 4의 아미노산 1-119, 23-119, 또는 21-119와 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 갖는다.

일부 구현예에서, 본 개시내용은 또한 키메라(예를 들어, 인간화) B2M 뉴클레오티드 서열 및/또는 아미노산 서열을 제공하며, 여기서 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%가 마우스 B2M mRNA 서열(예를 들어, 서열번호 1), 마우스 B2M 아미노산 서열(예를 들어, 서열번호 2), 또는 이의 일부(엑손 1의 일부, 엑손 2, 및 엑손 3의 일부)와 동일하거나, 이로부터 유래하고; 및 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%가 인간 B2M mRNA 서열(예를 들어, 서열번호 3), 인간 B2M 아미노산 서열(예를 들어, 서열번호 4), 또는 이의 일부(예를 들어, 엑손 1의 일부, 엑손 2, 및 엑손 3의 일부)와 동일하거나 이로부터 유래한다.

일부 구현예에서, 마우스 B2M의 영역을 인코딩하는 서열(예를 들어, 서열번호 2의 아미노산 1-119)이 대체된다. 일부 구현예에서, 서열은 인간 B2M의 상응하는 영역을 인코딩하는 서열에 의해 대체된다(예를 들어, 인간 B2M의 아미노산 1-119(서열번호 4)).

일부 구현예에서, 본 명세서에 설명된 바와 같은 핵산은 프로모터 또는 조절 요소, 예를 들어, 내인성 마우스 B2M 프로모터, 유도성 프로모터, 인핸서, 및/또는 마우스 또는 인간 조절 요소에 작동가능하게 연결된다.

일부 구현예에서, 핵산 서열은 전체 마우스 B2M 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_009735.3(서열번호 1)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 핵산 서열은 전체 마우스 B2M 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_009735.3(서열번호 1)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 핵산 서열은 전체 인간 B2M 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_004048.4(서열번호 3)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 핵산 서열은 전체 인간 B2M 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_004048.4(서열번호 3)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 마우스 B2M 아미노산 서열(예를 들어, NM_009735.3(서열번호 1)의 엑손 1, 엑손 2, 엑손 3, 및/또는 엑손 4에 의해 인코딩된 아미노산; 또는 NP_033865.2(서열번호 2)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 마우스 B2M 아미노산 서열(예를 들어, NM_009735.3(서열번호 1)의 엑손 1, 엑손 2, 엑손 3, 및/또는 엑손 4에 의해 인코딩된 아미노산; 또는 NP_033865.2(서열번호 2)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 인간 B2M 아미노산 서열(예를 들어, NM_004048.4(서열번호 3)의 엑손 1, 엑손 2, 엑손 3, 및/또는 엑손 4에 의해 인코딩된 아미노산; 또는 NP_004039.1(서열번호 4)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 인간 B2M 아미노산 서열(예를 들어, NM_004048.4(서열번호 3)의 엑손 1, 엑손 2, 엑손 3, 및/또는 엑손 4에 의해 인코딩된 아미노산; 또는 NP_004039.1(서열번호 4)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

인간 백혈구 항원(HLA)

MHC 클래스 I 분자에 상응하는 인간 백혈구 항원(HLA)은 예를 들어, HLA-A, HLA-B, 및 HLA-C를 포함한다. MHC 클래스 II 분자에 상응하는 인간 HLA는 예를 들어, HLA-DP, HLA-DM, HLA-DO, HLA-DQ, 및 HLA-DR을 포함한다.

인간 HLA-A는 많은 혈청형 군, 예를 들어, HLA-A1 및 HLA-A*02를 가질 수 있다. HLA-A1(A1)의 경우, 혈청형은 HLA-A α-사슬의 α1 하위세트의 항체 인식에 의해 결정된다. A1의 경우, α 사슬은 HLA-A*01 대립유전자 군에 의해 인코딩되고, β-사슬은 B2M 유전자 자리에 의해 인코딩된다. 이 군은 현재 A*0101(A*01:01:01:01)에 의해 지배된다. HLA-A*02(HLA-A2)의 경우, 혈청형은 HLA- A α-사슬의 α2 도메인의 항체 인식에 의해 결정된다. A*02의 경우, α 사슬은 HLA-A*02 유전자에 의해 인코딩되고, β 사슬은 B2M 유전자 자리에 의해 인코딩된다. HLA-A2의 하위유형은 HLA-A2.1이다. HLA 명명법의 상세 내용은 예를 들어, 문헌[Marsh, S. G. et al., "Nomenclature for factors of the HLA system, 2010." Tissue antigens 75.4 (2010): 291]에서 찾을 수 있으며, 이는 그 전체가 본 명세서에 참조로 포함된다.

인간 유전체에서, 통상적인 HLA-A 유전자 자리는 8개의 엑손인, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8을 갖는다(도 3). HLA-A 단백질은 또한 신호 펩티드, 세포외 영역, 막관통 영역, 및 세포질 영역을 갖는다. 또한, 세포외 영역은 α1 도메인, α2 도메인, α3 도메인, 및 연결 펩티드를 포함한다. 인간 HLA-A*0101 mRNA에 대한 뉴클레오티드 서열은 NM_001242758.1(서열번호 7)이고, 인간 HLA-A*0101에 대한 아미노산 서열은 NP_001229687.1(서열번호 8)이다. 추가적으로, 인간 HLA-A2.1에 대한 뉴클레오티드 서열은 AF055066.1의 핵산 95493-99436(서열번호 54)이고, 인간 HLA-A2.1에 대한 아미노산 서열은 AAC24825.1(서열번호 59)이다. 인간 HLA-A 뉴클레오티드 서열 및 아미노산 서열에서 각각의 엑손 및 각각의 영역에 대한 위치가 하기에 나열되어 있다.

인간 HLA-A (대략적인 위치)	NM_001242758.1 1611bp (서열번호 7)	NP_001229687.1 365 aa (서열번호 8)	AAC24825.1 362aa (서열번호 59)
엑손 1	1-157	1-24	1-21
엑손 2	158-427	25-114	22-111
엑손 3	428-703	115-206	112-203
엑손 4	704-979	207-298	204-295
엑손 5	980-1096	299-337	296-334
엑손 6	1097-1129	338-348	335-345
엑손 7	1130-1177	349-364	346-362
엑손 8	1178-1611	365	비-코딩
신호 펩티드	85-156	1-24	1-21
세포외	157-1008	25-308	22-305
막관통	1009-1080	309-332	306-329
세포질	1081-1611	333-365	330-362
알파-1	157-426	25-114	22-111
알파-2	427-702	115-206	112-203
알파-3	703-978	207-298	204-295
연결 펩티드	979-1008	299-308	296-305
실시예 1의 공여자 영역	해당 없음	해당 없음	1-203(C57BL/B6 백그라운드)
실시예 2의 공여자 영역	해당 없음	해당 없음	1-362(B-NDG 백그라운드)

인간 MHC 클래스 I 영역(GenBank ID: AF055066.1)은 인간 유전체의 염색체 6에 위치한다. 인간 HLA-A2.1 유전자는 AF055066.1의 95493부터 99436까지에 위치한다. AF055066.1을 기준으로, 엑손 1은 99566부터 99629까지, 제1 인트론은 99436부터 99565까지, 엑손 2는 99166부터 99435까지, 제2 인트론은 98925부터 99165까지, 엑손 3은 98649부터 98924까지, 제3 인트론은 98049부터 98648까지, 엑손 4는 97773부터 98048까지, 제4 인트론은 97674부터 97772까지, 엑손 5는 97557부터 97673까지, 제5 인트론은 97119부터 97556까지, 엑손 6은 97086부터 97118까지, 제6 인트론은 97085부터 96944까지, 엑손 7은 96896부터 96943까지, 제7 인트론은 96727부터 96895까지, 엑손 8은 96726부터 96322까지, 3'-UTR은 96721부터 96322까지이다. 인간 HLA-A2.1 유전자 자리에 대한 모든 관련 정보는 그 전체가 본 명세서에 참조로 포함된 NCBI 웹사이트에서 GenBank ID: AF055066.1로 찾을 수 있다.마우스에서, H-2K, H-2D 및 H-2L은 MHC 클래스 I 유전자이다. 특히, H2-D1 유전자 자리는 8개의 엑손인, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7 및 엑손 8을 갖는다(도 3). 마우스 H2-D1 단백질(MHC 클래스 I α 사슬을 인코딩함)은 또한 신호 펩티드, 세포외 영역, 막관통 영역, 및 세포질 영역을 갖는다. 구체적으로, 세포외 영역은 α1 도메인, α2 도메인, α3 도메인, 및 연결 펩티드를 포함한다. 마우스 H2-D1 mRNA에 대한 뉴클레오티드 서열은 NM_010380.3(서열번호 5)이고, 마우스 H2-D1에 대한 아미노산 서열은 NP_034510.3(서열번호 6)이다. 마우스 H2-D1 뉴클레오티드 서열 및 아미노산 서열에서 각각의 엑손 및 각각의 영역에 대한 위치가 하기에 나열되어 있다:

마우스 H2-D1 (대략적인 위치)	NM_010380.3 1736 bp (서열번호 5)	NP_034510.3 362aa (서열번호 6)
엑손 1	1-93	1-24
엑손 2	94-363	25-114
엑손 3	364-639	115-206
엑손 4	640-915	207-298
엑손 5	916-1032	299-337
엑손 6	1033-1065	338-348
엑손 7	1066-1104	349-361
엑손 8	1105-1736	362
신호 펩티드	21-92	1-24
세포외	93-947	25-309
막관통	948-1013	310-331
세포질	1014-1736	332-362
알파-1	93-362	25-114
알파-2	363-638	115-206
알파-3	639-914	207-298
연결 펩티드	915-947	299-309
실시예의 공여자 영역	640-1736	207-362

마우스 H2-D1 유전자(Gene ID: 14964; MGI: 95896)는 마우스 유전체의 염색체 17에 위치하며, 이는 NC_000083.7(GRCm39(GCF_000001635.27))의 35482070부터 35486473까지에 위치한다. 전사물 NM_010380.3을 기준으로, 5'-UTR은 35,262,730부터 35,263,113까지, 엑손 1은 35,262,730부터 35,263,186까지, 제1 인트론은 35,263,187부터 35,263,378까지, 엑손 2은 35,263,379부터 35,263,648까지, 제2 인트론은 35,263,649부터 35,263,838까지, 엑손 3은 35,263,839부터 35,264,114까지, 제3 인트론은 35,264,115부터 35,265,783까지, 엑손 4는 35,265,784부터 35,266,059까지, 제4 인트론은 35,266,060부터 35,266,186까지, 엑손 5는 35,266,187부터 35,266,303까지, 제5 인트론은 35,266,304부터 35,266,481까지, 엑손 6은 35,266,482부터 35,266,514까지, 제6 인트론은 35,266,515부터 35,266,687까지, 엑손 7은 35,266,688부터 35,266,726까지, 제7 인트론은 35,266,727부터 35,266,865까지, 엑손 8은 35,266,866부터 35,267,499까지, 3'-UTR은 35,266,871부터 35,267,499까지이다. 마우스 H2-D1 유전자 자리에 대한 모든 관련 정보는 그 전체가 본 명세서에 참조로 포함된 NCBI 웹사이트에서 Gene ID: 14964로 찾을 수 있다.도 25는 마우스 H2-D1 아미노산 서열(NP_034510.3; 서열번호 6)과 인간 HLA-A2.1 아미노산 서열(AAC24825.1; 서열번호 59) 사이의 배열을 보여준다. 따라서, 인간 HLA-A2.1과 마우스 H2-D1 사이의 상응하는 아미노산 잔기 또는 영역을 도 25에서 찾을 수 있다.

도 26은 마우스 H2-D1 아미노산 서열(NP_034510.3; 서열번호 6)과 인간 HLA-A*0101 아미노산 서열(NP_001229687.1; 서열번호 8) 사이의 배열을 보여준다. 따라서, 인간 HLA-A*0101과 마우스 H2-D1 사이의 상응하는 아미노산 잔기 또는 영역을 도 26에서 찾을 수 있다.

MHC 분자 유전자, 단백질, 및 기타 다른 종들의 유전자 자리는 또한 당업계에서 알려져 있다. 예를 들어, 유전자 ID 및 이들 유전자에 대한 관련 정보(예를 들어, 인트론 서열, 엑손 서열, 이들 단백질의 아미노산 잔기)는, 예를 들어 그 전체가 본 명세서에 참조로 포함된 NCBI 데이터베이스에서 찾을 수 있다.

본 개시내용은 인간 또는 키메라(예를 들어, 인간화) MHC 분자(예를 들어, MHC 클래스 I 알파 사슬) 뉴클레오티드 서열 및/또는 아미노산 서열을 제공한다. 이 개시내용은 또한 인간 또는 키메라(예를 들어, 인간화) HLA-A 단백질 복합체 및/또는 HLA-A 폴리펩티드를 발현하는 유전자 변형된 동물에 관한 것이다. 본 명세서에 사용된 바와 같이, 용어 "HLA-A 복합체" 또는 "HLA-A 단백질 복합체"는 HLA-A α 사슬 폴리펩티드 및 B2M 폴리펩티드에 의해 형성된 복합체를 지칭한다. 일부 구현예에서, HLA-A α 사슬 폴리펩티드 및 B2M 폴리펩티드는 함께 융합된다. 본 명세서에 사용된 바와 같은 용어 "HLA-A" 또는 "HLA-A 폴리펩티드"는 HLA-A α 사슬 폴리펩티드를 지칭한다.

일부 구현예에서, 마우스 H2-D1 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 신호 펩티드, 세포외 영역(예를 들어, α1 도메인, α2 도메인, α3 도메인, 및/또는 연결 펩티드), 막관통 영역, 및/또는 세포질 영역의 전체 서열은 상응하는 인간 서열에 의해 대체된다. 일부 구현예에서, 마우스 H2-D1 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 신호 펩티드, 세포외 영역(예를 들어, α1 도메인, α2 도메인, α3 도메인, 및/또는 연결 펩티드), 막관통 영역, 및/또는 세포질 영역의 "영역" 또는 "일부"는 상응하는 인간 서열에 의해 대체된다. 용어 "영역" 또는 "일부"는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 500, 또는 600개의 뉴클레오티드, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 또는 360개의 아미노산 잔기를 지칭할 수 있다. 일부 구현예에서, "영역" 또는 "일부"는 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 신호 펩티드, 세포외 영역(예를 들어, α1 도메인, α2 도메인, α3 도메인, 및/또는 연결 펩티드), 막관통 영역, 및/또는 세포질 영역과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% 동일할 수 있다. 일부 구현예에서, 마우스 H2-D1 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8(예를 들어, 엑손 1, 엑손 2, 및 엑손 3)의 영역, 일부, 또는 전체 서열은 인간 HLA-A 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8(예를 들어, 엑손 1, 엑손 2, 엑손 3) 서열의 영역, 일부 또는 전체 서열에 의해 대체된다.

일부 구현예에서, 본 개시내용은 키메라(예를 들어, 인간화) MHC 분자(예를 들어, 인간 HLA/마우스 H2-D1) 뉴클레오티드 서열을 유전체에 포함하는 유전자 변형된 비-인간 동물에 관한 것이다. 일부 구현예에서, 키메라(예를 들어, 인간화) MHC 분자 뉴클레오티드 서열은 세포외 영역, 막관통 영역, 세포질 영역, 및 신호 펩티드를 포함하는 MHC 분자 단백질을 인코딩한다. 일부 구현예에서, 세포외 영역은 인간 HLA-A(예를 들어, HLA-A*0101, 또는 HLA-A2.1) 세포외 영역의 전체 또는 부분을 포함한다. 예를 들어, 본 명세서에 설명된 세포외 영역은 인간 HLA-A 세포외 영역(예를 들어, 서열번호 8의 아미노산 25-308, 또는 서열번호 59의 아미노산 22-305)과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, 막관통 영역은 인간 HLA-A(예를 들어, HLA-A*0101, 또는 HLA-A2.1) 막관통 영역의 전체 또는 부분을 포함한다. 예를 들어, 막관통 영역은 인간 HLA 막관통 영역(예를 들어, 서열번호 8의 아미노산 309-332, 또는 서열번호 59의 아미노산 306-329)과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일하다. 일부 구현예에서, 세포질 영역은 인간 HLA-A(예를 들어, HLA-A*0101, 또는 HLA-A2.1) 세포질 영역의 전체 또는 부분을 포함한다. 예를 들어, 세포질 영역은 인간 HLA 세포외 영역(예를 들어, 서열번호 8의 아미노산 333-365, 또는 서열번호 59의 아미노산 330-362)과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일하다.

일부 구현예에서, 키메라(예를 들어, 인간화) MHC 분자 뉴클레오티드 서열은 신호 펩티드를 포함하는 MHC 분자 단백질을 인코딩한다. 일부 구현예에서, 본 명세서에 설명된 신호 펩티드는 서열번호 6의 아미노산 1-24와 적어도 80%, 85%, 90%, 95%, 또는 100% 동일하다. 일부 구현예에서, 본 명세서에 설명된 신호 펩티드는 서열번호 8의 아미노산 1-24, 또는 서열번호 59의 아미노산 1-21과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일하다.

일부 구현예에서, 본 개시내용은 또한 키메라(예를 들어, 인간화) MHC 분자 뉴클레오티드 서열 및/또는 아미노산 서열을 포함하며, 여기서 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%가 마우스 H2-D1 mRNA 서열(예를 들어, 서열번호 5), 마우스 H2-D1 아미노산 서열(예를 들어, 서열번호 6), 또는 이의 일부(예를 들어, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8의 일부)와 동일하거나 이로부터 유래하고; 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%가 인간 HLA-A 분자 mRNA 서열(예를 들어, 서열번호 7), 인간 HLA-A 아미노산 서열(예를 들어, 서열번호 8 또는 서열번호 59), 또는 이의 일부(예를 들어, 엑손 1의 일부, 엑손 2, 및 엑손 3)와 동일하거나 이로부터 유래한다.

일부 구현예에서, 마우스 H2-D1의 영역을 인코딩하는 서열(예를 들어, 서열번호 6의 아미노산 1-206 또는 25-206)은 대체된다. 일부 구현예에서, 서열은 인간 HLA-A의 상응하는 영역을 인코딩하는 서열(예를 들어, 인간 HLA-A*0101(서열번호 8)의 아미노산 1-206 또는 25-206; 또는 인간 HLA-A2.1(서열번호 59)의 아미노산 1-203 또는 22-203)에 의해 대체된다.

일부 구현예에서, 본 명세서에 설명된 바와 같은 핵산은 프로모터 또는 조절 요소, 예를 들어 내인성 마우스 H2-D1 프로모터, 유도성 프로모터, 인핸서, 및/또는 마우스 또는 인간 조절 요소에 작동가능하게 연결된다.

일부 구현예에서, 핵산 서열은 전체 마우스 H2-D1 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_010380.3(서열번호 5)) 또는 그의 부분과 상이한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 핵산 서열은 전체 마우스 H2-D1 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_010380.3(서열번호 5)) 또는 그의 부분과 동일한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 핵산 서열은 전체 인간 HLA-A 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_001242758.1(서열번호 7)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 핵산 서열은 전체 인간 HLA-A 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_001242758.1(서열번호 7)) 또는 그의 부분과 동일한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 마우스 H2-D1 아미노산 서열(예를 들어, NM_010380.3(서열번호 5)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8에 의해 인코딩된 아미노산; 또는 NP_034510.3(서열번호 6)) 또는 그의 부분과 상이한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 마우스 H2-D1 아미노산 서열(예를 들어, NM_010380.3(서열번호 5)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8에 의해 인코딩된 아미노산; 또는 NP_034510.3(서열번호 6)) 또는 그의 부분과 동일한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 인간 HLA-A 아미노산 서열(예를 들어, NM_001242758.1(서열번호 7)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8에 의해 인코딩된 아미노산; NP_001229687.1(서열번호 8); 또는 AAC24825.1(서열번호 59)) 또는 그의 부분과 상이한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

일부 구현예에서, 아미노산 서열은 전체 인간 HLA-A 아미노산 서열(예를 들어, NM_001242758.1(서열번호 7)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8에 의해 인코딩된 아미노산; NP_001229687.1(서열번호 8); 또는 AAC24825.1(서열번호 59)) 또는 그의 부분과 동일한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산 잔기, 예를 들어, 연속 또는 비연속 아미노산 잔기)를 갖는다.

본 발명의 개시내용은 추가로 인간화 마우스의 B2M 또는 MHC 분자 유전체 DNA 서열에 관한 것이다. DNA 서열은 그의 전사에 의해 수득된 mRNA의 역전사에 의해 수득되며, 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 서열과 상동성인 DNA 서열과 일치하거나 상보성이다.

본 개시내용은 또한 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 서열과 적어도 90%의 상동성을 갖거나, 적어도 90% 동일하며, 단백질 활성을 갖는 아미노산 서열을 제공한다. 일부 구현예에서, 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 서열과의 상동성은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%이다. 일부 구현예에서, 상기 상동성은 적어도 약 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 80%, 또는 85%이다.

일부 구현예에서, 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 서열과의 백분율 동일성은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%이다. 일부 구현예에서, 상기 백분율 동일성은 적어도 약 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 80%, 또는 85%이다.

본 개시내용은 또한 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 서열과 적어도 90%의 상동성을 갖거나 적어도 90% 동일하며, 단백질 활성을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 제공한다. 일부 구현예에서, 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 서열과의 상동성은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%이다. 일부 구현예에서, 상기 상동성은 적어도 약 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 80%, 또는 85%이다.

일부 구현예에서, 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 서열과의 백분율 동일성은 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 적어도 99%이다. 일부 구현예에서, 상기 백분율 동일성은 적어도 약 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 80%, 또는 85%이다.

본 개시내용은 또한 본 명세서에 설명된 바와 같은 임의의 뉴클레오티드 서열과 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 핵산 서열, 및 본 명세서에 설명된 바와 같은 임의의 아미노산 서열과 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 아미노산 서열을 제공한다. 일부 구현예에서, 본 개시내용은 본 명세서에 설명된 임의의 펩티드를 인코딩하는 뉴클레오티드 서열, 또는 본 명세서에 설명된 바와 같은 임의의 뉴클레오티드 서열에 의해 인코딩된 임의의 아미노산 서열에 관한 것이다. 일부 구현예에서, 핵산 서열은 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150, 200, 250, 300, 350, 400, 500, 또는 600개 미만의 뉴클레오티드이다. 일부 구현예에서, 아미노산 서열은 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200개 미만의 아미노산 잔기이다.

일부 구현예에서, 아미노산 서열은 (i) 아미노산 서열을 포함하거나; 또는 (ii) 아미노산 서열로 이루어지며, 여기서 아미노산 서열은 본 명세서에 설명된 바와 같은 서열들 중 임의의 하나이다.

일부 구현예에서, 핵산 서열은 (i) 핵산 서열을 포함하거나; 또는 (ii) 핵산 서열로 이루어지며, 여기서 핵산 서열은 본 명세서에 설명된 바와 같은 서열들 중 임의의 하나이다.

2개의 아미노산 서열, 또는 2개의 핵산 서열의 백분율 동일성을 결정하기 위해, 서열들은 최적의 비교 목적을 위해 배열된다(예를 들어, 갭이 최적의 배열을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 도입될 수 있고, 비-상동성 서열은 비교 목적을 위해 무시될 수 있음). 이어서 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서, 아미노산 잔기 또는 뉴클레오티드가 비교된다. 제1 서열에서의 위치가 제2 서열에서 상응하는 위치에서 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유된 경우, 분자는 그 위치에서 동일하다. 두 서열 사이의 백분율 동일성은, 두 서열의 최적의 배열을 위해 도입되어야 하는 각각의 갭의 수와 갭의 길이를 고려하여 서열이 공유하는 동일한 위치의 개수의 함수이다. 예를 들어, 서열의 비교 및 두 서열 사이의 백분율 동일성의 결정은, 12의 갭 페널티, 4의 갭 연장 페널티, 및 5의 프레임시프트 갭 페널티로, Blossum 62 스코어링 매트릭스를 사용하여 달성될 수 있다.

유사한 물리화학적 특성이 보존된 잔기, 예를 들어 류신 및 이소류신의 백분율(백분율 상동성)은 또한 서열 유사성을 측정하기 위해 사용될 수 있다. 유사한 물리화학적 특성을 갖는 아미노산 잔기의 패밀리가 당업계에 정의되어 있다. 이러한 패밀리는, 염기성 측쇄(예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄(예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지된 측쇄(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)가 있는 아미노산을 포함한다. 많은 경우에 상동성 백분율은 동일성 백분율보다 더 높다.

또한 본 명세서에 설명된 바와 같은 뉴클레오티드 서열을 포함하는 세포, 조직 및 동물(예를 들어, 마우스)뿐만 아니라, 내인성 비-인간 B2M 또는 MHC 유전자 자리로부터 인간 또는 키메라(예를 들어, 인간화) MHC를 발현하는 세포, 조직, 및 동물(예를 들어, 마우스)이 제공된다.

유전자 변형된 동물

본 명세서에 사용된 바와 같이, 용어 "유전자 변형된 비-인간 동물"은 동물의 유전체의 적어도 하나의 염색체에서 변형된 서열(예를 들어, 내인성 B2M 유전자를 본 명세서에 설명된 융합 단백질을 인코딩하는 서열 또는 본 명세서에 설명된 인간화 B2M을 인코딩하는 서열로 대체하는 것, 및/또는 내인성 MHC 유전자(예를 들어, MHC 클래스 I α 사슬)를 본 명세서에 설명된 융합 단백질을 인코딩하는 서열 또는 본 명세서에 설명된 인간화 MHC 유전자를 인코딩하는 서열로 대체하는 것)을 갖는 비-인간 동물을 지칭한다. 일부 구현예에서, 유전자 변형된 비-인간 동물의, 적어도 하나 이상의 세포, 예를 들어 적어도 1%, 2%, 3%, 4%, 5%, 10%, 20%, 30%, 40%, 50%의 세포는 그의 유전체 내에서 변형된 서열을 갖는다. 변형된 서열을 갖는 세포는 다양한 종류의 세포, 예를 들어 내인성 세포, 체세포, 면역 세포, T 세포, B 세포, 생식 세포, 배반포, 또는 내인성 종양 세포일 수 있다. 일부 구현예에서, 내인성 B2M 또는 MHC 유전자 자리에서 인간 또는 인간화 B2M 및/또는 인간 또는 인간화 MHC 분자 유전자(예를 들어, MHC 클래스 I α 사슬)를 포함하는, 유전자 변형된 비-인간 동물이 제공된다. 동물은 일반적으로, 예를 들어 생식세포계열 전달을 통해, 변형을 자손에게 전달할 수 있다.

본 명세서에 사용된 바와 같이, 용어 "인간화" 등은 기원이 비-인간인 분자(예를 들어 핵산, 단백질 등)이며, 이에 대한 일부가, 변형된(예를 들어, 인간화) 분자가 생물학적 기능을 보유하고/하거나 보유한 생물학적 기능을 수행하는 구조를 유지하는 방식으로, 상응하는 인간 분자의 상응하는 일부로 대체된 분자(예를 들어, 핵산, 단백질 등)를 지칭한다. 인간화 분자는, 인간 분자(또는 그의 일부)를 인코딩하는 핵산 서열을 포함하는 뉴클레오티드에 의해 인간화 분자가 인코딩되는 인간 분자로부터 유래된 것으로 간주될 수 있다.

일부 구현예에서, 유전자 변형된 비-인간 동물은 내인성 B2M(예를 들어, 마우스 B2M)을 발현하지 않는다. 일부 구현예에서, 유전자 변형된 비-인간 동물은 기능성 내인성 B2M(예를 들어, 마우스 B2M)을 발현하지 않는다. 일부 구현예에서, 유전자 변형된 비-인간 동물은 내인성 MHC 분자(예를 들어, 마우스 H2-D1)을 발현하지 않는다. 일부 구현예에서, 유전자 변형된 비-인간 동물은 기능성 내인성 MHC 분자(예를 들어, 마우스 H2-D1) 또는 기능성 내인성 MHC 단백질 복합체를 발현하지 않는다.

일부 구현예에서, 본 명세서에 설명된 유전자 변형된 비-인간 동물은 면역결핍이다. 일부 구현예에서, 동물은 NOD-Prkdc^scidIL-2rγ^null, NOD-Rag 1^-/- -IL2rg^-/-(NRG), Rag 2^-/-- IL2rg^-/-(RG), 또는 NOD/SCID(NOD-Prkdc^scid) 백그라운드를 갖는다.

일부 구현예에서, 본 명세서에 설명된 유전자 변형된 비-인간 동물(예를 들어, 마우스)은 파괴된 내인성 B2M 유전자를 갖는다. 일부 구현예에서, 본 명세서에 설명된 유전자 변형된 비-인간 동물(예를 들어, 마우스)은 기능이상 내인성 B2M 단백질(예를 들어, 마우스 B2M)을 발현한다. 일부 구현예에서, 본 명세서에 설명된 유전자 변형된 비-인간 동물(예를 들어, 마우스)은 파괴된 내인성 MHC 유전자를 갖는다. 일부 구현예에서, 본 명세서에 설명된 유전자 변형된 비-인간 동물(예를 들어, 마우스)은 기능이상 내인성 MHC 분자(예를 들어, 마우스 H2-D1) 또는 기능이상 내인성 MHC 단백질 복합체를 발현한다.

본 명세서에 사용된 바와 같이, 용어 "백혈구" 또는 "백혈구(white blood cell)"는 T 세포(CD3+), B 세포(CD19+), 골수 세포(CD33+), NK 세포(CD56+), 과립구(CD66b+), 및 단핵구(CD14+)를 포함한다. 모든 백혈구는 이들을 무핵 적혈구(RBC) 및 혈소판과 구별되도록 하는 핵을 가진다. 백혈구 공통 항원(LCA)으로도 알려진 CD45는 백혈구에 대한 세포 표면 마커이다. 림프구는 백혈구의 하위유형이다. 림프구는 자연 살해(NK) 세포(세포 매개된, 세포독성 선천성 면역에 작용함), T 세포, 및 B 세포를 포함한다. 골수 세포는 백혈구의 하위유형이다. 골수 세포는 단핵구 및 과립구를 포함한다.

일부 구현예에서, 유전자 변형된 비-인간 동물은 마우스이다. 일부 구현예에서, 유전자 변형된 비-인간 동물은 B-NDG 마우스이다. B-NDG 마우스의 상세한 내용은, 예를 들어 PCT/CN2018/079365;US 10820580B2에서 찾을 수 있으며, 이들 각각은 그 전체가 본 명세서에 참조로 포함된다. 일부 구현예에서, 유전자 변형된 동물은 NSG 마우스 또는 NOG 마우스이다. NSG 마우스 및 NOD 마우스의 상세한 설명은, 예를 들어 문헌[Ishikawa et al. "Development of functional human blood and immune systems in NOD/SCID/IL2 receptor γ chainnull mice." Blood 106.5 (2005): 1565-1573; Katano et al. "NOD-Rag2null IL-2Rγnull mice: an alternative to NOG mice for generation of humanized mice." Experimental animals 63.3 (2014): 321-330]에서 찾을 수 있으며, 이들 모두는 그 전체가 본 명세서에 참조로 포함된다.

일 양태에서, 유전자 변형된 비-인간 동물(예를 들어, 마우스)은 인간 조혈모세포와 이식되어 인간 면역계를 발달시킨다.

일 양태에서, 유전자 변형된 동물은 인간 조혈모세포와 이식되어 인간 면역계를 발달시킨다. 일부 구현예에서, 동물에서 인간 백혈구(또는 CD45+ 세포)의 평균 백분율은 동물에서 (예를 들어, 적혈구의 용해 후 혈액으로부터의) 총 생세포(live cell)의 적어도 또는 약 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 또는 50%이다. 일부 구현예에서, 동물에서 인간 백혈구(또는 CD45+ 세포)의 평균 백분율은 B-NDG 백그라운드를 갖는 동물(예를 들어, B-NDG 마우스)보다 적어도 또는 약 50%, 80%, 1배, 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 또는 20배 더 높으며, 여기서 B-NDG 백그라운드를 갖는 동물은 방사선조사되고, 이어서 인간 조혈모세포와 이식되어 인간 면역계를 발달시킨다. 일부 구현예에서, 인간 백혈구(또는 CD45+ 세포)의 평균 백분율은, 이식된 후 적어도 또는 약 12주, 적어도 또는 약 16주, 적어도 또는 약 20주, 적어도 또는 약 24주, 적어도 또는 약 26주, 적어도 또는 약 28주, 또는 적어도 또는 약 30주에 결정된다.

일부 구현예에서, 유전자 변형된 동물(예를 들어, 마우스)에서 재구성 성공률은 적어도 또는 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%이다. 일부 구현예에서, 유전자 변형된 동물(예를 들어, 마우스)에서 재구성의 성공률은, B-NDG 백그라운드를 갖는 동물(예를 들어, B-NDG 마우스)보다 적어도 또는 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 1배, 2배, 3배, 5배, 10배, 20배, 50배, 또는 100배 더 높다. 성공률은 성공적으로 재구성된 면역계를 갖는 마우스의 수(hCD45+ 세포 백분율 ≥ 적혈구의 분해 후 혈액으로부터의 총 생세포의 25%)를 생존한 마우스의 총 수로 나누어 계산한다. 일부 구현예에서, 성공률은, 인간 면역계를 발달시키기 위해 동물(예를 들어, 마우스)이 인간 세포(예를 들어, 조혈모세포)로 이식된 후 적어도 또는 약 16주차, 적어도 또는 약 20주차, 적어도 또는 약 24주차, 적어도 또는 약 26주차, 적어도 또는 약 28주차, 또는 적어도 또는 약 30주차에 결정된다. 일부 구현예에서, 이식 후 적어도 또는 약 16주차에, 동물에서 재구성 성공률은 적어도 또는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%(예를 들어, 80%)이다. 일부 구현예에서, 이식 후 적어도 또는 약 20주차에, 동물에서 재구성 성공률은 적어도 또는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%(예를 들어, 80%)이다.

일부 구현예에서, 이식 후 약 100일차, 약 120일차, 약 140일차, 약 160일차, 또는 약 180일차에, 유전자 변형된 동물(예를 들어, 마우스)의 생존률은 적어도 또는 약 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%이다. 일부 구현예에서, 이식 후 약 100일차, 약 120일차, 약 140일차, 약 160일차, 또는 약 180일차에, 유전자 변형된 동물(예를 들어, 마우스)의 생존률은 B-NDG 백그라운드를 갖는 동물(예를 들어, B-NDG 마우스)보다 적어도 또는 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 1배, 2배, 3배, 5배, 또는 10배 더 높다.

유전자 변형된 비-인간 동물은 또한 다양한 다른 동물들, 예를 들어 쥐, 토끼, 돼지, 소(예를 들어, 암소, 황소, 버팔로), 사슴, 양, 염소, 닭, 고양이, 개, 페럿(ferret), 영장류(예를 들어, 마모셋(marmoset), 붉은털 원숭이)일 수 있다. 적합한 유전자 변형가능한 ES 세포를 용이하게 입수할 수 없는 비-인간 동물의 경우, 기타 다른 방법들이 유전자 변형을 포함하는 비-인간 동물을 만들기 위해 사용된다. 그러한 방법은 예를 들어, 비-ES 세포 유전체(예를 들어, 섬유아세포 또는 유도된 만능세포)를 변형하는 단계, 변형된 유전체를 적합한 세포, 예를 들어 난모세포로 수송하기 위해 핵 이식을 사용하는 단계, 및 적당한 조건 하에서 변형된 세포(예를 들어, 변형된 난모세포)를 비-인간 동물에서 잉태시켜 배아를 형성하는 단계를 포함한다. 이러한 방법들은 당업계에 알려져 있고, 예를 들어 문헌[A. Nagy, et al., "Manipulating the Mouse Embryo: A Laboratory Manual (Third Edition)," Cold Spring Harbor Laboratory Press, 2003]에 설명되어 있으며, 이들은 그 전체가 본 명세서에 참조로 포함된다.

일 양태에서, 동물은 포유동물이고, 예를 들어 뛰는쥐상과(Dipodoidea) 또는 쥐상과(Muroidea)이다. 일부 구현예에서, 유전자 변형된 동물은 설치류이다. 설치류는 마우스, 쥐, 및 햄스터로부터 선택될 수 있다. 일부 구현예에서, 설치류는 쥐상과로부터 선택된다. 일부 구현예에서, 유전자 변형된 동물은 칼로미스쿠스과(Calomyscidae)(예를 들어, 마우스-유사 햄스터), 비단털쥐과(Cricetidae)(예를 들어, 햄스터, 신세계 쥐류 및 마우스류(New World rats and mice), 들쥐), 쥐과(참쥐 및 마우스, 게르빌루스쥐, 아프리카가시쥐(spiny mice), 크레스티드 쥐(crested rats)), 네소미스과(Nesomyidae)(클라이밍 마우스, 락 마우스, 위드-테일드(with-tailed) 쥐, 마다가스카르(Malagasy) 쥐 및 마우스), 가시겨울잠쥐과(Platacanthomyidae)(예를 들어, 가시겨울잠쥐), 및 소경쥐과(Spalacidae)(예를 들어, 뒤쥐, 대나무쥐, 및 조코(zokor))로부터 선택된 과 유래의 것이다. 일부 구현예에서, 유전자 변형된 설치류는 참쥐 또는 마우스(쥐과), 게르빌루스쥐, 아프리카가시쥐, 및 크레스티드 쥐로부터 선택된다. 일 구현예에서, 비-인간 동물은 마우스이다.

일부 구현예에서, 동물은 BALB/c,A, A/He, A/J, A/WySN, AKR, AKR/A, AKR/J, AKR/N, TA1, TA2, RF, SWR, C3H, C57BR, SJL, C57L, DBA/2, KM, NIH, ICR, CFW, FACA, C57BL/A, C57BL/An, C57BL/GrFa, C57BL/KaLwN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, C57BL/Ola, C57BL, C58, CBA/Br, CBA/Ca, CBA/J, CBA/st, 및 CBA/H로부터 선택된 계통(strain)의 마우스이다. 일부 구현예에서, 마우스는 129P1, 129P2, 129P3, 129X1, 129S1(예를 들어, 129S1/SV, 129S1/SvIm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1, 129T2인 계통으로 이루어진 군으로부터 선택된 129 계통이다. 이들 마우스는 예를 들어, 문헌[Festing et al., Revised nomenclature for strain 129 mice, Mammalian Genome 10:836 (1999); Auerbach et al., Establishment and Chimera Analysis of 129/SvEv- and C57BL/6- Derived Mouse Embryonic Stem Cell Lines (2000)]에 설명되어 있으며, 이들 모두는 그 전체가 본 명세서에 참조로 포함된다. 일부 구현예에서, 유전자 변형된 마우스는 129 계통 및 C57BL/6 계통의 혼합이다. 일부 구현예에서, 마우스는 129 계통의 혼합, 또는 BL/6 계통의 혼합이다. 일부 일부 구현예에서, 마우스는 BALB 계통, 예를 들어 BALB/c 계통이다. 일부 구현예에서, 마우스는 BALB 계통 및 또 다른 계통의 혼합이다. 일부 구현예에서, 마우스는 잡종주(예를 들어, 50% BALB/c-50% 12954/Sv; 또는 50% C57BL/6-50% 129) 유래이다.

일부 구현예에서, 동물은 쥐이다. 쥐는 위스타(Wistar) 쥐, LEA 계통, 스프라구 돌리(Sprague Dawley) 계통, 피셔(Fischer) 계통, F344, F6, 및 다크 아구티(Dark Agouti)로부터 선택될 수 있다. 일부 구현예에서, 쥐 계통은 위스타, LEA, 스프라구 돌리, 피셔, F344, F6, 및 다크 아구티로 이루어진 군으로부터 선택된 둘 이상의 계통의 혼합이다.

동물은, 인간 또는 인간화 B2M 및/또는 MHC 분자(예를 들어, MHC 클래스 I α 사슬)를 발현하는 동물을 만들기 위한 특정 목적에 적합한, 하나 이상의 다른 유전자 변형 및/또는 기타 다른 변형을 가질 수 있다. 예를 들어, 이종이식(예를 들어, 인간 암 또는 종양)의 유지에 적합한 마우스는, 전체적으로 또는 부분적으로 비-인간 동물의 면역계를 절충, 불활성화 또는 파괴하는 하나 이상의 변형을 가질 수 있다. 비-인간 동물의 면역계의 절충, 불활성화 또는 파괴는 예를 들어, 조혈 세포 및/또는 면역 세포를 화학적 수단(예를 들어, 독소를 투여하는 것), 물리적 수단(예를 들어, 동물에 방사선조사하는 것), 및/또는 유전자 변형(예를 들어, 하나 이상의 유전자를 녹아웃하는 것)에 의해 파괴하는 것을 포함할 수 있다.

이러한 마우스의 비제한적인 예는, 예를 들어 NOD 마우스, SCID 마우스, NOD/SCID 마우스, 누드 마우스, NOD/SCID 누드 마우스, NOD-Rag 1^-/--IL2rg^-/-(NRG) 마우스, Rag 2^-/--IL2rg^-/-(RG) 마우스, B-NDG(NOD-Prkdc^scid IL-2rγ^null) 마우스, 및 Rag1 및/또는 Rag2 녹아웃 마우스를 포함한다. 일부 구현예에서, 이러한 마우스는 선택적으로 방사선조사될 수 있거나, 다르게는 하나 이상의 면역 세포 유형을 파괴하도록 처리될 수 있다. 따라서 다양한 구현예에서, 내인성 비-인간 B2M 또는 MHC 유전자 자리에서 하나 이상의 돌연변이를 포함할 수 있고, 전체적으로 또는 부분적으로 비-인간 동물의 면역계(또는 면역계 중 하나 이상의 세포 유형)를 절충, 불활성화 또는 파괴하는 변형을 추가로 포함할 수 있는 유전자 변형된 마우스가 제공된다. 일부 구현예에서, 변형은 예를 들어 NOD 마우스, SCID 마우스, NOD/SCID 마우스, B-NDG(NOD- Prkdc^scid IL-2rγ^null) 마우스, 누드 마우스, Rag1 및/또는 Rag2 녹아웃 마우스 및 이들의 조합을 생성하는 변형으로 이루어진 군으로부터 선택된다. 이러한 유전자 변형된 동물은 예를 들어, US20150106961 및 CN2018/079365에 설명되어 있으며, 이들 각각은 그 전체가 본 명세서에 참조로 포함된다.

본 명세서에 설명된 변형(예를 들어, 파괴, 돌연변이)을 포함할 수 있는 유전자 변형된 세포(예를 들어, ES 세포, 체세포)가 또한 제공되지만, 많은 구현예에서, 유전자 변형된 비-인간 동물은 동물의 생식세포계열에서 내인성 B2M 및/또는 MHC 유전자 자리의 변형을 포함한다.

또한, 유전자 변형된 동물은 내인성 B2M 및/또는 MHC 유전자의 변형(예를 들어, 대체)에 대하여 동형접합성일 수 있다. 일부 구현예에서, 내인성 B2M 및/또는 MHC 유전자의 변형(예를 들어, 대체)에 대하여 동물은 이형접합성일 수 있다.

일 양태에서, 본 개시내용은 동물의 내인성 CD132 유전자의 파괴를 유전체에 포함하는 유전자 변형된 비-인간 동물에 관한 것이며, 여기서 내인성 CD132 유전자의 파괴는 내인성 CD132 유전자의 엑손 2의 결실을 포함한다.

일부 구현예에서, 내인성 CD132 유전자의 파괴는 내인성 CD132 유전자의 엑손 1의 결실을 추가로 포함한다. 일부 구현예에서, 내인성 CD132 유전자의 파괴는 내인성 CD132 유전자의 엑손 1의 부분의 결실을 포함한다.

일부 구현예에서, 내인성 CD132 유전자의 파괴는 내인성 CD132 유전자의 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8로 이루어진 군으로부터 선택된 하나 이상의 엑손 또는 엑손의 부분의 결실을 추가로 포함한다. 일부 구현예에서, 내인성 CD132 유전자의 파괴는 내인성 CD132 유전자의 엑손 1~8의 결실을 포함한다.

일부 구현예에서, 내인성 CD132 유전자의 파괴는 내인성 CD132 유전자의 인트론 1, 인트론 2, 인트론 3, 인트론 4, 인트론 5, 인트론 6, 및 인트론 7로 이루어진 군으로부터 선택된 하나 이상의 인트론 또는 인트론의 부분의 결실을 추가로 포함한다.

일부 구현예에서, 파괴는 엑손 1의 150개 초과의 뉴클레오티드의 결실; 인트론 1, 엑손 2, 인트론 2, 엑손 3, 인트론 3, 엑손 4, 인트론 4, 엑손 5, 인트론 5, 엑손 6, 인트론 6, 엑손 7, 인트론 7의 전체의 결실; 및 엑손 8의 250개 초과의 뉴클레오티드의 결실로 이루어진다.

일부 구현예에서, 동물은 내인성 CD132 유전자의 파괴에 대하여 동형접합성이다. 일부 구현예에서, 동물은 내인성 CD132 유전자의 파괴에 대하여 이형접합성이다.

일부 구현예에서, 파괴는 기능성 CD132 단백질의 발현을 방지한다.

일부 구현예에서, 내인성 CD132 유전자 자리에서 남아있는 엑손 서열의 길이는 내인성 CD132 유전자의 모든 엑손 서열의 총 길이의 30% 미만이다. 일부 구현예에서, 내인성 CD132 유전자 자리에서 남아있는 서열의 길이는 내인성 CD132 유전자의 전체 서열의 15% 미만이다.

또 다른 양태에서, 본 개시내용은 유전자 변형된 비-인간 동물에 관한 것으로, 여기서 동물의 유전체는 동물의 내인성 CD132 유전자 자리에서 CD132 유전자의 엑손 2를 갖지 않는다.

일부 구현예에서, 동물의 유전체는 엑손 1, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8으로 이루어진 군으로부터 선택된 하나 이상의 엑손 또는 엑손의 부분을 갖지 않는다. 일부 구현예에서, 동물의 유전체는 인트론 1, 인트론 2, 인트론 3, 인트론 4, 인트론 5, 인트론 6, 및 인트론 7로 이루어진 군으로부터 선택된 하나 이상의 인트론 또는 인트론의 부분을 갖지 않는다.

일 양태에서, 본 개시내용은 또한 CD132 녹아웃 비-인간 동물을 제공하며, 여기서 동물의 유전체는 내인성 CD132 유전자 자리에서 5'에서 3'까지: (a) 제1 DNA 서열; 선택적으로 (b) 외인성 서열을 포함하는 제2 DNA 서열; (c) 제3의 DNA 서열을 포함하며, 여기서 제1 DNA 서열, 선택적인 제2 DNA 서열, 및 제3 DNA 서열은 연결되며, 제1 DNA 서열은 인트론 1의 상류에 위치하는 내인성 CD132 유전자 서열을 포함하고, 제2 DNA 서열은 0개의 뉴클레오티드 내지 300개의 뉴클레오티드의 길이를 가질 수 있고, 제3 DNA 서열은 인트론 7의 하류에 위치하는 내인성 CD132 유전자 서열을 포함한다.

일부 구현예에서, 제1 DNA 서열은 10 내지 100개의 뉴클레오티드(예를 들어, 대략적으로 10, 20, 30, 40, 50, 60, 70, 80, 90, 100개의 뉴클레오티드) 길이(5'부터 3')를 갖는 서열을 포함하고, 여기서 서열의 길이는 CD132 유전자의 엑손 1의 제1 뉴클레오티드로부터 제1 DNA 서열의 최종 뉴클레오티드까지의 길이를 지칭한다.

일부 구현예에서, 제1 DNA 서열은 내인성 CD132 유전자의 엑손 1로부터 적어도 10개의 뉴클레오티드를 포함한다. 일부 구현예에서, 제1 DNA 서열은 내인성 CD132 유전자의 엑손 1로부터 최대 100개의 뉴클레오티드를 갖는다.

일부 구현예에서, 제3 DNA 서열은 200 내지 600개의 뉴클레오티드(예를 들어, 대략 200, 250, 300, 350, 400, 450, 500, 550, 600개 뉴클레오티드) 길이(5'부터 3')를 갖는 서열을 포함하고, 여기서 서열의 길이는 제3 DNA 서열의 제1 뉴클레오티드로부터 내인성 CD132 유전자의 엑손 8의 최종 뉴클레오티드까지의 길이를 지칭한다.

일부 구현예에서, 제3 DNA 서열은 내인성 CD132 유전자의 엑손 8로부터 적어도 300개의 뉴클레오티드를 포함한다. 일부 구현예에서, 제3 DNA 서열은 내인성 CD132 유전자의 엑손 8로부터 최대 400개의 뉴클레오티드를 갖는다.

일 양태에서, 본 개시내용은 또한 (1) 징크 핑거 단백질, TAL-이펙터 도메인, 또는 내인성 CD132 유전자의 엑손 1에서 또는 내인성 CD132 유전자의 엑손 1의 상류에서 표적 서열에 결합하는 단일 가이드 RNA(sgRNA) DNA-결합 도메인을 포함하는 제1 뉴클레아제, 및 (2) 징크 핑거 단백질, TAL-이펙터 도메인, 또는 내인성 CD132 유전자의 엑손 8에서 서열에 결합하는 단일 가이드 RNA(sgRNA) DNA-결합 도메인을 포함하는 제2 뉴클레아제를 사용함으로써, 내인성 CD132 유전자의 하나 이상의 엑손을 녹아웃하는 단계를 포함하는 방법에 의해 생성된 유전자 변형된 비-인간 동물에 관한 것이다. 일부 구현예에서, 뉴클레아제는 CRISPR 연관된 단백질 9(Cas9)이다. 일부 구현예에서, 동물은 기능성 CD132 단백질을 발현하지 않는다. 일부 구현예에서, 동물은 기능성 인터류킨-2 수용체를 발현하지 않는다.

일 양태에서, 본 개시내용은 유전자 변형된 마우스 또는 그의 자손에 관한 것으로, 이의 유전체는 마우스의 내인성 CD132 유전자 내에서의 파괴를 포함하고, 여기서 내인성 CD132 유전자의 파괴는 엑손 1 중 150개 초과의 뉴클레오티드의 결실; 인트론 1, 엑손 2, 인트론 2, 엑손 3, 인트론 3, 엑손 4, 인트론 4, 엑손 5, 인트론 5, 엑손 6, 인트론 6, 엑손 7, 인트론 7의 전체의 결실; 및 엑손 8 중 250개 초과의 뉴클레오티드의 결실을 포함한다. 일부 구현예에서, 동물은 NSG 마우스, NOG 마우스, 또는 NOD/scid 마우스에 비해 외인성 세포의 향상된 생착 능력을 갖는다.

본 개시내용은 추가로 본 명세서에 설명된 방법을 통해 생성된 비-인간 포유동물에 관한 것이다. 일부 구현예에서, 이의 유전체는 인간 유전자(들)를 함유한다.

추가적으로, 본 개시내용은 또한 비-인간 포유동물 모델이 본 명세서에 설명된 방법을 통해 수득되는 것을 특징으로 하는 종양 보유 비-인간 포유동물 모델에 관한 것이다. 일부 구현예에서, 비-인간 포유동물은 설치류(예를 들어, 마우스)이다.

본 개시내용은 추가로 비-인간 포유동물 또는 그의 자손, 또는 종양 보유 비-인간 포유동물로부터 유래된 세포 또는 세포주, 또는 그의 1차 세포 배양물; 비-인간 포유동물 또는 그의 자손, 또는 종양 보유 비-인간 포유동물로부터 유래된 조직, 기관 또는 그의 배양물; 및 비-인간 포유동물 또는 그의 자손이 종양을 보유하는 경우 그로부터, 또는 종양 보유 비-인간 포유동물로부터 유래된 종양 조직에 관한 것이다.

본 개시내용은 또한 본 명세서에 설명된 임의의 방법에 의해 생성된 비-인간 포유동물을 제공한다. 일부 구현예에서, 비-인간 포유동물이 제공되며; 유전자 변형된 동물은 동물의 유전체에 B2M 및/또는 MHC 유전자의 변형(예를 들어, 대체)을 함유한다.

상기 설명된 비-인간 포유동물에 대한 유전자, 분자 및 거동 분석이 수행될 수 있다. 본 개시내용은 또한 동일하거나 상이한 유전자형과 교배된 본 개시내용에 의해 제공되는 비-인간 포유동물에 의해 생산된 자손에 관한 것이다.

본 개시내용은 또한 비-인간 포유동물 또는 그의 자손으로부터 유래된 세포주 또는 1차 세포 배양물을 제공한다. 세포 배양에 기초한 모델은 예를 들어 다음 방법에 의해 제조될 수 있다. 세포 배양물은 비-인간 포유동물로부터 분리하여 수득할 수 있고, 대안적으로는 동일한 작제물 및 세포 형질감염 기술을 사용하여 확립된 세포 배양물로부터 세포를 수득할 수 있다. B2M 및/또는 MHC 유전자의 변형은 다양한 방법에 의해 검출될 수 있다.

RNA 수준의 방법(역전사 중합효소 연쇄반응(RT-PCR) 또는 서던 블롯팅을 사용하는 mRNA 정량화 접근법, 및 제자리 잡종형성 포함) 및 단백질 수준의 방법(조직화학, 면역블롯 분석 및 시험관 내 결합 연구 포함)을 포함하는 DNA 발현을 검출하는 데 사용될 수 있는 많은 분석 방법이 있다. 정량적인 측정을 완료하기 위해 분석 방법을 사용할 수 있다. 예를 들어, 야생형 유전자 및 변형된 서열의 전사 수준은 RT-PCR 및 RN아제 보호, 서던 블롯 분석, RNA 도트 분석(RNAdot) 분석을 포함하는 혼성화 방법을 사용하여 측정할 수 있다. 면역조직화학 염색, 유세포 분석, 웨스턴 블롯 분석도 인간 단백질의 존재를 평가하는 데 사용할 수 있다.

일부 구현예에서, 유전자 변형된 동물에서, 인간 또는 인간화 MHC 단백질 복합체, 인간 또는 인간화 B2M, 인간 또는 인간화 MHC 유전자(예를 들어, MHC 클래스 I α 사슬), 및/또는 융합 단백질의 발현은 특이적 유도자 또는 억제자 물질의 첨가에 의해 제어가능하다. 일부 구현예에서, 특이적 유도자는 Tet-Off 시스템/Tet-On 시스템, 또는 타목시펜(Tamoxifen) 시스템으로부터 선택된다.

융합 단백질

일 양태에서, 본 개시내용은 바람직하게는 N-말단에서 C-말단까지

(a) 인간 B2M(신호 펩티드가 있거나 없음);

(b) 선택적 링커 펩티드 서열; 및

(c) 인간 MHC α 사슬(신호 펩티드가 있거나 없음)

을 포함하는 융합 단백질을 발현하는 유전자 변형된 비-인간 동물에 관한 것이다.

일부 구현예에서, 인간 MHC α 사슬은 인간 HLA-A, HLA-B, 또는 HLA-Cα 사슬이다. 일부 구현예에서, 인간 B2M은 신호 펩티드(예를 들어, 서열번호 4의 아미노산 1-22)를 갖지 않는다. 일부 구현예에서, 인간 B2M은 서열번호 4의 아미노산 1-119, 23-119, 또는 21-119와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 인간 HLA-A는 신호 펩티드(예를 들어, 서열번호 8의 아미노산 1-24, 또는 서열번호 59의 아미노산 1-21)를 갖지 않는다. 일부 구현예에서, 인간 HLA-A는 신호 펩티드를 갖는다. 일부 구현예에서, 인간 HLA-A는 HLA-A*0101이다. 일부 구현예에서, 인간 HLA-A는 서열번호 8의 아미노산 1-365, 또는 25-365와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 인간 HLA-A는 HLA-A2.1이다. 일부 구현예에서, 인간 HLA-A는 서열번호 59의 아미노산 1-362, 또는 22-362와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일 양태에서, 본 개시내용은 바람직하게는, N-말단에서 C-말단까지

(a) 인간 B2M(신호 펩티드가 있거나 없음);

(b) 링커 펩티드 서열(선택적); 및

(c) 키메라 MHC α 사슬(신호 펩티드가 있거나 없음)

일부 구현예에서, 키메라 MHC α 사슬은 키메라 HLA-A, HLA-B, 또는 HLA-Cα 사슬이다. 일부 구현예에서, 인간 B2M은 신호 펩티드(예를 들어, 서열번호 4의 아미노산 1-22)를 갖지 않는다. 일부 구현예에서, 인간 B2M은 서열번호 4의 아미노산 1-119, 23-119, 또는 21-119와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일부 구현예에서, 키메라 MHCα 사슬은 키메라 세포외 영역, 내인성 막관통 영역, 및 내인성 세포질 영역을 포함한다. 일부 구현예에서, 키메라 세포외 영역은 인간 HLA-A α1 도메인(예를 들어, 인간 HLA-A*0101 α1 도메인, 또는 인간 HLA-A2.1 α1 도메인), 인간 HLA-A α2 도메인(예를 들어, 인간 HLA-A*0101 α2 도메인, 또는 인간 HLA-A2.1 α2 도메인), 및 내인성 MHCα 사슬 α3 도메인(예를 들어, 마우스 H2-D1 α3 도메인)을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 신호 펩티드(예를 들어, 서열번호 8의 아미노산 1-24, 또는 서열번호 59의 아미노산 1-21)를 포함하지 않는다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 8의 아미노산 25-114, 또는 서열번호 59의 아미노산 22-111과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 인간 HLA-Aα1 도메인을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 8의 아미노산 115-206, 또는 서열번호 59의 아미노산 112-203과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 인간 HLA-A α2 도메인을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 8의 아미노산 25-206 또는 1-206; 또는 서열번호 59의 아미노산 22-203 또는 1-203과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 인간 HLA-A α1 및 α2 도메인을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 6의 아미노산 207-298과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 내인성 MHC α 사슬 α3 도메인을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 6의 아미노산 299-309와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 내인성 MHC α 사슬 연결 펩티드를 추가로 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 6의 아미노산 310-331과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 내인성 MHC α 사슬 막관통 영역을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 6의 아미노산 332-362와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 내인성 MHC α 사슬 세포질 영역을 포함한다. 일부 구현예에서, 키메라 MHC α 사슬은 서열번호 6의 아미노산 207-362와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 내인성 MHC α 사슬 α3 도메인, 내인성 연결 펩티드, 내인성 막관통 영역, 및 내인성 세포질 영역을 포함한다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질은 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%는 인간 B2M mRNA 서열(예를 들어, NM_004048.3(서열번호 3)), 또는 그의 일부(예를 들어, 엑손 1의 일부, 엑손 2, 및 엑손 3의 일부)와 동일하거나 이로부터 유래한다. 일부 구현예에서, 본 명세서에 설명된 융합 단백질은 아미노산 서열을 포함한다. 일부 구현예에서, 아미노산 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%는 인간 B2M 아미노산 서열(예를 들어, NP_000563.1(서열번호 4)), 또는 이의 일부(예를 들어, 서열번호 4의 아미노산 1-119, 23-119, 또는 21-119)와 동일하거나 이로부터 유래한다. 일부 구현예에서, 뉴클레오티드 서열은 cDNA 서열이다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질은 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%는 인간 HLA-A DNA 또는 mRNA 서열(예를 들어, AF055066.1(서열번호 54)의 핵산 95493-99436; 또는 NM_001242758.1(서열번호 7)), 또는 이의 일부(예를 들어, 서열번호 7의 엑손 2 및 엑손 3)와 동일하거나 이로부터 유래한다. 일부 구현예에서, 본 명세서에 설명된 융합 단백질은 아미노산 서열을 포함한다. 일부 구현예에서, 아미노산 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%는 인간 HLA-A 아미노산 서열(예를 들어, AAC24825.1(서열번호 59) 또는 NP_001229687.1(서열번호 8)), 또는 이의 일부(예를 들어, 서열번호 8의 아미노산 1-206 또는 25-206; 또는 서열번호 59의 아미노산 1-203 또는 22-203)와 동일하거나 이로부터 유래한다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질은 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%는 내인성 MHC α 사슬 mRNA 서열(예를 들어, 마우스 H2-D1 mRNA 서열 NM_010380.3(서열번호 5)), 또는 이의 일부(예를 들어, 서열번호 5의 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8)와 동일하거나 이로부터 유래한다. 일부 구현예에서, 본 명세서에 설명된 융합 단백질은 아미노산 서열을 포함한다. 일부 구현예에서, 아미노산 서열의 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%는 내인성 MHC α 사슬 아미노산 서열(예를 들어, 마우스 H2-D1 아미노산 서열 NP_034510.3(서열번호 6)), 또는 이의 일부(예를 들어, 서열번호 6의 아미노산 207-362)와 동일하거나 이로부터 유래한다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질은 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 뉴클레오티드 서열은, 바람직하게는 뉴클레오티드 서열의 3' 말단에서, 내인성 MHC α 사슬 mRNA 서열의 3' UTR(예를 들어, 마우스 H2-D1 mRNA 서열 NM_010380.3(서열번호 5)의 3'UTR)을 추가로 포함한다.

일부 구현예에서, 동물의 유전체는 융합 단백질을 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 포함한다. 일부 구현예에서, 융합 단백질을 인코딩하는 서열은 프로모터 또는 조절 요소, 예를 들어 내인성 B2M(예를 들어, 마우스 B2M) 프로모터, 유도성 프로모터, 인핸서, 및/또는 마우스 또는 인간 조절 요소에 작동가능하게 연결된다. 일부 구현예에서, 융합 단백질을 인코딩하는 서열은 프로모터 또는 조절 요소, 예를 들어 내인성 마우스 H2-D1 프로모터, 유도성 프로모터, 인핸서, 및/또는 마우스 또는 인간 조절 요소에 작동가능하게 연결된다.

일부 구현예에서, 내인성 B2M 유전자 자리 전부 또는 부분(예를 들어, 마우스 B2M 유전자 자리의 엑손 1의 일부, 엑손 2, 및 엑손 3의 일부)은 융합 단백질을 인코딩하는 서열로 대체된다. 일부 구현예에서, 대체된 서열은 내인성 B2M 유전자의 전체 코딩 영역이다. 일부 구현예에서, 대체된 서열은 마우스 B2M의 영역(예를 들어, 서열번호 2의 아미노산 1-119 또는 23-119)을 인코딩한다. 일부 구현예에서, 내인성 MHC α 사슬 유전자 자리의 전부 또는 부분(예를 들어, 마우스 H2-D1 유전자 자리의 엑손 1의 일부, 엑손 2, 및 엑손 3)은 융합 단백질을 인코딩하는 서열로 대체된다. 일부 구현예에서, 대체된 영역은 내인성 MHC α 사슬 유전자(예를 들어, 마우스 H2-D1 유전자)의 전체 코딩 영역이다. 일부 구현예에서, 대체된 서열은 마우스 H2-D1 영역(예를 들어, 서열번호 6의 아미노산 1-206 또는 25-206)을 인코딩한다.

일부 구현예에서, 내인성 B2M 유전자의 전부 또는 부분은 녹아웃된다. 일부 구현예에서, 내인성 MHC α 사슬 유전자의 전부 또는 부분(예를 들어, 마우스 H2-D1 유전자)은 녹아웃된다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 재조합 서열은 내인성 B2M 또는 MHC α 사슬 유전자 자리 내에 삽입된다. 일부 구현예에서, 내인성 B2M 또는 MHCα 사슬 유전자 코딩 영역은, 삽입된 재조합 서열 후에 정지 코돈 및 폴리A 신호의 존재로 인해, 전사 또는 번역되지 않는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 뉴클레오티드 서열은, 전체 인간 B2M 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_004048.4(서열번호 3)) 또는 그의 부분과 상이한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 뉴클레오티드 서열은, 전체 인간 B2M 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_004048.4(서열번호 3)) 또는 그의 부분과 동일한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 뉴클레오티드 서열은, 전체 인간 HLA-A 뉴클레오티드 서열(예를 들어, NM_001242758.1(서열번호 7)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 AF055066.1(서열번호 54)의 핵산 95493-99436) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 뉴클레오티드 서열은, 전체 인간 HLA-A 뉴클레오티드 서열(예를 들어, NM_001242758.1(서열번호 7)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 AF055066.1(서열번호 54)의 핵산 95493-99436) 또는 그의 부분과 동일한, 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 뉴클레오티드 서열은, 전체 마우스 H2-D1 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_010380.3(서열번호 5)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 인코딩하는 뉴클레오티드 서열은, 전체 마우스 H2-D1 뉴클레오티드 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_010380.3(서열번호 5)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질의 아미노산 서열은, 전체 인간 B2M 아미노산 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_004048.4(서열번호 3)에 의해 인코딩된 아미노산; 또는 NP_004039.1(서열번호 4)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질의 아미노산 서열은, 전체 인간 B2M 아미노산 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 또는 NM_004048.4(서열번호 3)에 의해 인코딩된 아미노산; 또는 NP_004039.1(서열번호 4)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질의 아미노산 서열은, 전체 인간 HLA-A 아미노산 서열(예를 들어, NM_001242758.1(서열번호 7)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 AF055066.1(서열번호 54)의 핵산 95493-99436; NP_001229687.1(서열번호 8); 또는 AAC24825.1(서열번호 59)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질의 아미노산 서열은, 전체 인간 HLA-A 아미노산 서열(예를 들어, NM_001242758.1(서열번호 7)의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 AF055066.1(서열번호 54)의 핵산 95493-99436에 의해 인코딩된 아미노산; NP_001229687.1(서열번호 8)에; 또는 AAC24825.1(서열번호 59)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질의 아미노산 서열은, 전체 마우스 H2-D1 아미노산 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_010380.3(서열번호 5)에 의해 인코딩된 아미노산; 또는 NP_034510.3(서열번호 6)) 또는 그의 부분과 상이한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질의 아미노산 서열은, 전체 마우스 H2-D1 아미노산 서열(예를 들어, 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 엑손 8, 또는 NM_010380.3(서열번호 5)에 의해 인코딩된 아미노산; 또는 NP_034510.3(서열번호 6)) 또는 그의 부분과 동일한 적어도 일부(예를 들어, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 아미노산, 예를 들어, 연속 또는 비연속 뉴클레오티드)를 갖는다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질은 아미노산 서열을 포함하거나 이로 이루어지며, 여기서 아미노산 서열은 하기로 이루어진 군으로부터 선택된다:

a) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열;

b) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 적어도 90%의 상동성을 갖거나 적어도 90% 동일한 아미노산 서열;

c) 핵산 서열에 의해 인코딩된 아미노산 서열로서, 여기서 핵산 서열은 낮은 엄격성 조건 또는 강한 엄격성 조건 하에 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열을 인코딩하는 뉴클레오티드 서열에 혼성화할 수 있는 아미노산 서열;

d) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 상동성을 갖거나, 또는 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열;

e) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 아미노산이 상이한 아미노산 서열; 및

f) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열에 대해 하나 이상의 아미노산의 대체, 결실 및/또는 삽입을 포함하는 아미노산 서열.

본 개시내용은 또한 핵산(예를 들어, DNA 또는 RNA) 서열에 관한 것이며, 여기서 핵산 서열은 하기로 이루어진 군으로부터 선택될 수 있다:

a) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 바와 같은 핵산 서열, 또는 인간화 마우스 B2M 또는 MHC α 사슬의 상동성 B2M 또는 MHC α 사슬 아미노산 서열을 인코딩하는 핵산 서열;

b) 낮은 엄격성 조건 또는 강한 엄격성 조건 하에 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 바와 같은 뉴클레오티드 서열에 혼성화할 수 있는 핵산 서열;

c) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65에 나타낸 바와 같은 뉴클레오티드 서열과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 상동성을 갖거나, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 서열;

d) 아미노산 서열을 인코딩하는 핵산 서열로서, 여기서 아미노산 서열은 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 적어도 90%의 상동성을 갖거나, 적어도 90% 동일한 핵산 서열;

e) 아미노산 서열을 인코딩하는 핵산 서열로서, 여기서 아미노산 서열은 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 상동성을 갖거나, 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 서열;

f) 아미노산 서열을 인코딩하는 핵산 서열로서, 여기서 아미노산 서열은 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 아미노산이 상이한 아미노산 서열; 및/또는

g) 아미노산 서열을 인코딩하는 핵산 서열로서, 여기서 아미노산 서열은 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열에 대한 하나 이상의 아미노산의 대체, 결실 및/또는 삽입을 포함하는 아미노산 서열.

일부 구현예에서, 융합 단백질은, 융합 단백질의 N-말단에서 인간 MHC α 사슬 신호 펩티드를 포함한다. 일부 구현예에서, 인간 MHC α 사슬 신호 펩티드는 인간 HLA-A(예를 들어, HLA-A*0101, 또는 HLA-A2.1)의 신호 펩티드이다. 일부 구현예에서, 인간 HLA-A의 신호 펩티드는 서열번호 8의 아미노산 1-24, 또는 서열번호 59의 아미노산 1-21과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 인간 HLA-A의 신호 펩티드는 서열번호 13과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 서열에 의해 인코딩된다.

일부 구현예에서, 융합 단백질은 융합 단백질의 N-말단에서 내인성 MHC 분자(예를 들어, 마우스 H2-D1 유전자) 신호 펩티드를 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 6의 아미노산 1-24와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일부 구현예에서, 융합 단백질은 융합 단백질의 N-말단에서 인간 또는 내인성 B2M 신호 펩티드를 포함한다. 일부 구현예에서, 인간 또는 내인성 B2M 신호 펩티드는 서열번호 4의 아미노산 1-20 또는 서열번호 2의 아미노산 1-20과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진다.

일부 구현예에서, 인간 B2M은 링커 펩티드 서열이 있거나 없는 인간 MHC α 사슬에 융합된다. 일부 구현예에서, 링커 펩티드 서열은 선택적이며, 즉 서로 연결된 2개의 영역이 펩티드 결합에 의해 직접 연결될 수 있다. 일부 구현예에서, 링커 펩티드 서열은 적어도 또는 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 또는 50개의 아미노산 잔기를 포함한다. 일부 구현예에서, 링커 펩티드 서열은 적어도 또는 약 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 또는 40개의 글리신 잔기를 포함한다. 일부 구현예에서, 링커 펩티드 서열은 적어도 또는 약 1, 2, 3, 4, 5, 6, 7, 또는 8개의 세린 잔기를 포함한다. 일부 구현예에서, 링커 펩티드 서열은 글리신 및 세린 잔기 모두를 포함하거나 이로 이루어진다. 일부 구현예에서, 링커 펩티드 서열은 임의의 서열번호 67과 적어도 또는 약 70%, 적어도 또는 약 75%, 적어도 또는 약 80%, 적어도 또는 약 85%, 적어도 또는 약 90%, 적어도 또는 약 95%, 적어도 또는 약 99%, 또는 100% 동일한 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 링커 펩티드 서열은 GGGGS(서열번호 68)의 적어도 1, 2, 3, 4, 5, 6, 7, 또는 8개의 반복부를 포함한다. 일부 구현예에서, 링커 펩티드 서열은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 또는 50개 이하의 아미노산 잔기를 갖는다. 일부 구현예에서, 링커 펩티드 서열은 서열번호 51과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 서열에 의해 인코딩된다.

일부 구현예에서, 본 명세서에 설명된 인간화 MHC 단백질 복합체를 발현하는 유전자 변형된 비-인간 동물은 정상 수준의 내인성 B2M(예를 들어, 마우스 B2M)을 발현한다. 일부 구현예에서, 본 명세서에 설명된 인간화 MHC 단백질 복합체를 발현하는 유전자 변형된 비-인간 동물은 감소된 수준(예를 들어, 유전자 변형이 없는 동물과 비교하여 90% 미만, 80% 미만, 70% 미만, 60% 미만, 또는 50% 미만)의 내인성 B2M(예를 들어, 마우스 B2M)을 발현하였다. 일부 구현예에서, 본 명세서에 설명된 인간화 MHC 단백질 복합체를 발현하는 유전자 변형된 비-인간 동물은 내인성 B2M(예를 들어, 마우스 B2M)을 발현하지 않는다.

벡터

본 개시내용은 또한 인간화 MHC 단백질 복합체 동물 모델을 구축하기 위한 벡터를 제공한다. 일부 구현예에서, 벡터는 sgRNA 서열을 포함한다. 일부 구현예에서, sgRNA 서열은 (예를 들어, 본 명세서에 설명된 비-인간 동물의) B2M 유전자를 표적화하고, sgRNA는 변경될 B2M 유전자의 표적 서열 상에서 독특하며, 5'-NNN (20) -NGG3' 또는 5'-CCN-N (20)-3'의 서열 배열 규칙을 충족시킨다. 일부 구현예에서, 마우스 B2M 유전자에서 sgRNA의 표적화 부위는 마우스 B2M 유전자의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 인트론 1, 인트론 2, 인트론 3, 엑손 1의 상류, 또는 엑손 4의 하류에 위치한다. 일부 구현예에서, 마우스 B2M 유전자에서 sgRNA의 표적화 부위는 엑손 1 또는 인트론 1 상에 위치한다. 일부 구현예에서, 마우스 B2M 유전자에서 sgRNA의 표적화 부위는 엑손 3 또는 인트론 3 상에 위치한다.

일부 구현예에서, sgRNA 서열은 마우스 B2M 유전자의 엑손 1 또는 인트론 1 내의 표적화 부위를 인식한다. 일부 구현예에서, 엑손 1 또는 인트론 1 내의 표적화 부위는 서열번호 17~23에 제시되어 있다. 일부 구현예에서, 엑손 1 또는 인트론 1 내의 표적화 부위는 서열번호 19에 제시되어 있다. 일부 구현예에서, sgRNA 서열은 마우스 B2M 유전자의 엑손 3 또는 인트론 3 내의 표적화 부위를 인식한다. 일부 구현예에서, 엑손 3 또는 인트론 3 내의 표적화 부위는 서열번호 24~31에 제시되어 있다. 일부 구현예에서, 엑손 3 또는 인트론 3 내의 표적화 부위는 서열번호 30에 제시되어 있다. 일부 구현예에서, sgRNA 서열은 서열번호 32 및 서열번호 34; 서열번호 33 및 서열번호 35; 서열번호 36 및 서열번호 38; 또는 서열번호 37 및 서열번호 39에 제시된 서열을 갖는 이중 가닥 DNA 분자에 의해 인코딩된다.

일부 구현예에서, 본 개시내용은 sgRNA 서열을 포함하는 플라스미드 작제물(예를 들어, pT7-sgRNA), 및/또는 이 작제물을 포함하는 세포에 관한 것이다.

일부 구현예에서, 본 개시내용은 5' 상동 암(arm) 및 3' 상동 암을 포함하는 표적화 벡터에 관한 것이다. 일부 구현예에서, 5' 상동 암은 엑손 1, 및 엑손 1의 상류의 전체 또는 부분에 걸쳐 있는 서열을 포함한다. 일부 구현예에서, 3 ' 상동 암은 인트론 3, 엑손 4, 및 엑손 4의 하류의 전체 또는 부분에 걸쳐 있는 서열을 포함한다.

일부 구현예에서, 5' 상동 암은 서열번호 11과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 3' 상동 암은 서열번호 12와 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 5' 상동 암은 NCBI 참조 서열 NC_000068.7의 122146329-122147737과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 3' 상동 암은 NCBI 참조 서열 NC_000068.7의 122152171-122153513과 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일한 서열을 포함한다.

일부 구현예에서, 표적화 벡터는 5' 내지 3' 상동 암 사이에 뉴클레오티드 서열을 추가로 포함한다. 일부 구현예에서, 뉴클레오티드 서열은 본 명세서에 설명된 융합 단백질의 전체 또는 부분을 인코딩하는 서열(예를 들어, cDNA 서열)을 포함한다. 일부 구현예에서, 뉴클레오티드 서열은 바람직하게는 5' 말단에서 3' 말단까지: 인간 HLA-A2.1 신호 펩티드를 인코딩하는 서열, 인간 B2M을 인코딩하는 서열, 본 명세서에 설명된 링커 펩티드 서열을 인코딩하는 서열, 인간 HLA-A2.1의 일부를 인코딩하는 서열, 및 마우스 H2-D1의 일부를 인코딩하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 인간 HLA-A2.1 신호 펩티드를 인코딩하는 서열은 서열번호 13과 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 인간 B2M을 인코딩하는 서열은 서열번호 14와 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 링커 펩티드 서열을 인코딩하는 서열은 서열번호 51과 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 인간 HLA-A2.1의 일부를 인코딩하는 서열은 서열번호 15와 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 마우스 H2-D1의 일부를 인코딩하는 서열은 서열번호 16과 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다.

일부 구현예에서, 5' 상동 암은 서열번호 60과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 3' 상동 암은 서열번호 53과 적어도 80%, 85%, 90%, 95%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 5' 상동 암은 NCBI 참조 서열 NC_000068.7의 122146329-122147737과 적어도 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 5' 상동 암은 NCBI 참조 서열 NC_000068.7의 위치 122147015에서의 G에서 T로의 돌연변이, 위치 122147108 및 122147591에서의 C에서 T로의 돌연변이를 포함한다. 일부 구현예에서, 3' 상동 암은 NCBI 참조 서열 NC_000068.7의 122152171-122153513과 적어도 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, 3' 상동 암은 NCBI 참조 서열 NC_000068.7 내에 다음 돌연변이를 포함한다: 위치 122152258(G에서 A로), 위치 122152391(G에서 A로), 위치 122152771(A에서 G로), 위치 122153104(T에서 C로), 및 위치 122153148(A에서 C로)에서의 돌연변이; 및 위치 122152788에서의 결실(A의 결실).

일부 구현예에서, 표적화 벡터는 5' 내지 3' 상동 암 사이에 뉴클레오티드 서열을 추가로 포함한다. 일부 구현예에서, 뉴클레오티드 서열은 본 명세서에 설명된 융합 단백질의 전체 또는 부분을 인코딩하는 서열(예를 들어, cDNA 서열)을 포함한다. 일부 구현예에서, 뉴클레오티드 서열은 바람직하게는 5' 말단에서 3' 말단까지: 인간 HLA-A2.1 신호 펩티드를 인코딩하는 서열, 인간 B2M을 인코딩하는 서열, 본 명세서에 설명된 링커 펩티드 서열을 인코딩하는 서열, 및 인간 HLA-A2.1을 인코딩하는 서열을 포함하거나 이로 이루어진다. 일부 구현예에서, 인간 HLA-A2.1 신호 펩티드를 인코딩하는 서열은 서열번호 13과 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 인간 B2M을 인코딩하는 서열은 서열번호 14와 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 링커 펩티드 서열을 인코딩하는 서열은 서열번호 51과 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 인간 HLA- A2.1을 인코딩하는 서열은 서열번호 54와 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다. 일부 구현예에서, 5'에서 3'의 상동 암 사이의 뉴클레오티드 서열은 서열번호 65와 적어도 80%, 85%, 90%, 95%, 97.5%, 또는 100% 동일하다.

추가적으로, 본 발명의 개시내용은 또한 상기 표적화 벡터들 중 임의의 하나, 및 본 명세서에 설명된 바와 같은 sgRNA 작제물 중 하나 이상의 시험관 내 전사체를 갖는 비-인간 포유동물 세포에 관한 것이다. 일부 구현예에서, 세포는 Cas9 mRNA 또는 그의 시험관 내 전사체를 포함한다.

일부 구현예에서, 세포 내의 유전자는 이형접합성이다. 일부 구현예에서, 세포 내의 유전자는 동형접합성이다.

일부 구현예에서, 비-인간 포유동물 세포는 마우스 세포이다. 일부 구현예에서, 세포는 수정란 세포이다.

일부 구현예에서, sgRNA 서열을 포함하는 벡터의 제조 방법이 본 명세서에 제공되며, 상기 방법은 (a) 정방향 올리고뉴클레오티드 서열 및 역방향 올리고뉴클레오티드 서열을 사용하여 수득되는 sgRNA 서열을 제공하는 단계로서, 여기서 sgRNA 서열은 본 명세서에 설명된 비-인간 동물 B2M 유전자를 표적화하며, sgRNA는 변경될 표적 B2M 유전자 상에서 독특하고, 5'-NNN(20)-NGG3' 또는 5'-CCN-N(20)-3'의 서열 배열 규칙을 충족시키는 단계; (b) T7 프로모터 및 sgRNA 스캐폴드(예를 들어, 서열번호 40과 적어도 80% 동일함)를 함유하는 DNA 단편을 합성하고, 이어서 EcoRI 및 BamHI 분해 후 DNA 단편을 백본 벡터에 결찰하고, 시퀀싱에 의한 검증 후 pT7-sgRNA 벡터를 수득하는 단계; (c) 단계 (a)에서 수득된 정방향 올리고뉴클레오티드 및 역방향 올리고뉴클레오티드를 변성 및 어닐링하여, 단계 (b)에서 설명된 pT7-sgRNA 벡터에 결찰될 수 있는 이중 가닥을 형성하는 단계; (d) pT7-sgRNA 벡터를 사용하여 단계 (c)에서 어닐링된 이중 가닥 sgRNA 올리고뉴클레오티드를 결찰하고, 스크리닝하여 sgRNA 벡터를 수득하는 단계를 포함한다.

유전자 변형된 동물의 제조 방법

유전자 변형된 동물은 예를 들어, 비상동성 말단 접합(NHEJ), 상동성 재조합(HR), 징크 핑거 뉴클레아제(ZFN), 전사 활성화제-유사 이펙터-기반 뉴클레아제(TALEN), 및 규칙적인 간격을 갖는 짧은 회문 반복부(CRISPR)-Cas 시스템을 포함하는 당업계에 알려져 있는 여러 기술에 의해 제조될 수 있다. 일부 구현예에서, 상동성 재조합이 사용된다. 일부 구현예에서, CRISPR-Cas9 유전체 편집을 사용하여 유전자 변형된 동물을 생성한다. 이러한 많은 유전체 편집 기술은 당업계에 알려져 있고, 예를 들어, 문헌[Yin et al., "Delivery technologies for genome editing," Nature Reviews Drug Discovery 16.6 (2017): 387-399]에 설명되어 있으며, 이는 그 전체가 본 명세서에 참조로 포함된다. 많은 기타 다른 방법이 또한 제공되며, 예를 들어 유전자 변형된 핵을 제핵된 난모세포 내로 마이크로주입하는 단계, 및 제핵된 난모세포를 또 다른 유전자 변형된 세포와 융합하는 단계가 유전체 편집에 사용될 수 있다.

따라서, 일부 구현예에서, 본 개시내용은 동물의 적어도 하나의 세포 내에서, 내인성 B2M 또는 MHC 유전자 자리에서 내인성 B2M 또는 MHC α 사슬의 영역을 인코딩하는 서열을 본 명세서에 설명된 융합 단백질을 인코딩하는 서열로 대체하는 단계를 제공한다. 일부 구현예에서, 대체는 생식 세포, 체세포, 배반포, 또는 섬유아세포 등에서 일어난다. 체세포 또는 섬유아세포의 핵이 제핵된 난모세포 내로 삽입될 수 있다.

도 9 및 도 18은 마우스 B2M 유전자 자리에서 MHC 단백질 복합체 인간화 전략을 보여준다. 도 9 및 도 18에서, 상기 표적화 전략은 5' 상동 암, 융합 단백질을 인코딩하는 서열, 및 3' 상동 암을 포함하는 벡터를 포함한다. 과정은 내인성 B2M 유전자 서열을 상동성 재조합에 의해 융합 단백질을 인코딩하는 서열로 대체하는 단계를 포함할 수 있다. 일부 구현예에서, 표적 부위의 상류 및 하류에서의 (예를 들어, 징크 핑거 뉴클레아제, TALEN 또는 CRISPR에 의한) 절단은 DNA 이중 가닥 절단을 생성할 수 있으며, 상동성 재조합을 사용하여 내인성 B2M 유전자 서열을 융합 단백질을 인코딩하는 서열로 대체한다.

일부 구현예에서, 5' 말단 표적화 부위와 3' 말단 표적화 부위 사이의 서열은 녹아웃된다. 일부 구현예에서, 5' 말단 표적화 부위와 3' 말단 표적화 부위 사이의 서열은 대체된다. 일부 구현예에서, 대체된 서열은 마우스 B2M 유전자의 엑손 1 또는 인트론 1 내에서 시작된다. 일부 구현예에서, 대체된 서열은 마우스 B2M 유전자의 엑손 3 또는 인트론 3 내에서 종료된다.

따라서 일부 구현예에서, 유전자 변형된 인간화 동물의 제조 방법은 내인성 B2M 유전자 자리(또는 부위)에서, 내인성 B2M의 영역을 인코딩하는 서열을 인코딩하는 핵산을, 본 명세서에 설명된 융합 단백질을 인코딩하는 서열로 대체하는 단계를 포함할 수 있다. 서열은 내인성 B2M 유전자의 엑손 1, 엑손 2, 엑손 3, 엑손 4의 영역(예를 들어, 부분 또는 전체 영역)을 포함할 수 있다. 일부 구현예에서, 융합 단백질을 인코딩하는 서열은 인간 B2M 유전자의 엑손 1, 엑손 2, 엑손 3, 엑손 4의 영역(예를 들어, 부분 또는 전체 영역) 및 내인성 또는 인간 MHC α 사슬 유전자의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8의 영역(예를 들어, 부분 또는 전체 영역)을 포함한다. 일부 구현예에서, 내인성 B2M 유전자 자리는 마우스 B2M 유전자(예를 들어, 서열번호 2의 아미노산 1-119를 인코딩하는 서열)의 엑손 1의 일부, 엑손 2, 및 엑손 3의 일부이다.

일부 구현예에서, 본 명세서에 설명된 융합 단백질을 발현하도록 마우스의 B2M 유전자 자리를 변형하는 방법은 내인성 마우스 B2M 유전자 자리에서 마우스 B2M을 인코딩하는 뉴클레오티드 서열을 융합 단백질을 인코딩하는 뉴클레오티드 서열로 대체하고, 이에 의해 인간 B2M 및 인간 또는 키메라 MHC α 사슬을 포함하는 융합 단백질을 인코딩하는 서열을 생성하는 단계를 포함한다.

일부 구현예에서, 본 명세서에 설명된 바와 같은 뉴클레오티드 서열은 서로 중첩(overlap)되지 않는다(예를 들어, 5' 상동 암, A 단편(또는 BNDG-A 단편), 및/또는 3' 상동 암은 중첩되지 않는다). 일부 구현예에서, 본 명세서에 설명된 바와 같은 아미노산 서열은 서로 중첩되지 않는다.

징크 핑거 단백질, TAL-이펙터 도메인, 또는 단일 가이드 RNA(sgRNA) DNA-결합 도메인은 내인성(예를 들어, 마우스) B2M 유전자 자리의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 인트론 1, 인트론 2, 및/또는 인트론 3 내의 영역을 표적화하도록 설계될 수 있다. 예를 들어, 서열번호 17~23의 표적화 서열은 내인성(예를 들어, 마우스) B2M 유전자 자리의 엑손 1 또는 인트론 1에 위치하고; 서열번호 24~31의 표적화 서열은 내인성(예를 들어, 마우스) B2M 유전자 자리의 엑손 3 또는 인트론 3에 위치한다. 징크 핑거 단백질 후에, TAL-이펙터 도메인, 또는 단일 가이드 RNA(sgRNA) DNA-결합 도메인은 표적 서열에 결합하고, 뉴클레아제는 유전체 DNA를 분할한다. 일부 구현예에서, 뉴클레아제는 CRISPR 연관된 단백질 9(Cas9)이다.

따라서, 인간 또는 인간화 MHC 단백질 복합체, 인간 또는 인간화 B2M, 및/또는 인간 또는 인간화 MHC 분자를 발현하는 마우스의 생성 방법은 다음 단계들 중 하나 이상을 포함할 수 있다: 내인성 B2M 또는 MHC 유전자를 표적화하는 유전자 편집 시스템으로 마우스 배아줄기세포를 형질전환시켜, 형질전환된 배아줄기세포를 생성하는 단계; 형질전환된 배아줄기세포를 마우스 배반포 내로 도입하는 단계; 마우스 배반포를 가임신한 암컷 마우스 내로 이식하는 단계; 및 배반포가 만삭까지 태아 발달을 겪도록 하는 단계.

일부 구현예에서, 형질전환된 배아 세포는 대신 가임신한 암컷 마우스 내로 직접 이식되고, 배아 세포는 태아 발달을 겪는다.

일부 구현예에서, 유전자 편집 시스템은 징크 핑거 단백질, TAL-이펙터 도메인, 또는 단일 가이드 RNA(sgRNA) DNA-결합 도메인을 포함할 수 있다.

본 개시내용은 다음 단계들을 포함하는 인간 또는 인간화 MHC 단백질 복합체, 인간 또는 인간화 B2M, 및/또는 인간 또는 인간화 MHC 분자를 발현하는 동물 모델을 확립하는 방법을 추가로 제공한다:

(a) 본 명세서에 설명된 방법에 기초하여 유전자 변형을 갖는 세포(예를 들어, 수정란 세포)를 제공하는 단계;

(b) 세포를 액체 배양 배지 내에서 배양하는 단계;

(c) 배양된 세포를, 수용자 암컷 비-인간 포유동물의 난관 또는 자궁에 이식하여, 암컷 비-인간 포유동물의 자궁에서 세포가 발달되도록 하는 단계;

(d) 단계 (c)의 임신한 암컷의 유전자 변형된 인간화 비-인간 포유동물 자손에서 생식세포 계열 전달을 확인하는 단계.

일부 구현예에서, 상기 방법에서 비-인간 포유동물은 마우스(예를 들어, C57BL/6 마우스, NOD/scid 마우스, NOD/scid 누드 마우스, 또는 B-NDG 마우스)이다. 일부 구현예에서, 비-인간 포유동물은 B-NDG(NOD-Prkdc^scid IL-2rγ^null) 마우스이다. 일부 구현예에서, 비-인간 포유동물은 NOD/scid 마우스이다.

B-NDG 마우스에서, Prkdc^scid("SCID" 또는 "중증 복합면역결핍증"으로 흔히 알려짐) 돌연변이는 비-비만 당뇨병(NOD) 백그라운드 상에 전달되었다. SCID 돌연변이에 대한 동형접합 동물은 T 및 B 세포 림프구 발달을 손상시켰다. NOD 백그라운드는 추가적으로 자연 살해(NK) 세포 기능의 결함을 생성한다. IL-2rγ^null은 마우스 CD132 유전자에서의 특이적인 녹아웃 변형을 지칭한다. 상세한 내용은 예를 들어 PCT/CN2018/079365에서 찾을 수 있으며, 이들 그 전체가 본 명세서에 참조로 포함된다.

일부 구현예에서, 비-인간 포유동물은 B-NDG 마우스이다. B-NDG 마우스는 마우스 내에서 염색체 11 상에서 FOXN1 유전자의 파괴를 추가적으로 갖는다.

일부 구현예에서, 상기 설명된 방법을 위한 수정란은 NOD/scid 수정란, NOD/scid 누드 수정란, 또는 B-NDG 수정란이다. 본 명세서에 설명된 바와 같은 방법에 또한 사용될 수 있는 기타 수정란은 C57BL/6 수정란, FVB/N 수정란, BALB/c 수정란, DBA/1 수정란 및 DBA/2 수정란을 포함하지만 이에 제한되지 않는다.

수정란은 임의의 비-인간 동물, 예를 들어 본 명세서에 설명된 바와 같은 임의의 비-인간 동물로부터 유래할 수 있다. 일부 구현예에서, 수정란 세포는 설치류로부터 유래한다. 유전적 작제물은 DNA의 마이크로주입에 의해 수정란 내로 도입될 수 있다. 예를 들어, 마이크로주입 후 수정란을 배양함으로써, 배양된 수정란은 가임신 비-인간 동물에 전달되고, 이어서 비-인간 포유동물을 출산하여, 상기 설명된 방법에 언급된 비-인간 포유동물을 생성하도록 할 수 있다.

본 명세서에 설명된 바와 같은 유전자 변형된 동물(예를 들어, 마우스)은 여러 가지 이점을 가질 수 있다. 예를 들어, 유전자 변형된 마우스는 역교배가 필요하지 않으며, 따라서 당업계에 알려진 일부 다른 면역결핍 마우스와 비교하여 상대적으로 더 순수한 백그라운드(예를 들어, B-NDG)를 갖는다. 순수한 백그라운드는 일관된 실험 결과를 수득하는 데 유리하다.

유전자 변형된 동물의 사용 방법

인간 또는 인간화 MHC 단백질 복합체를 발현하는 유전자 변형된 동물은 인간 혈액-림프구 동물 모델의 확립, 인간 질병 및 장애에 대한 치료제 개발, 및 동물 모델에서 이러한 치료제의 효능 평가를 포함하지만 이에 제한되지는 않는 다양한 용도를 제공할 수 있다.

일부 구현예에서, 유전자 변형된 동물은 인간 혈액-림프계를 확립하는 데 사용될 수 있다. 본 방법은 인간 조혈 세포(CD34+ 세포) 또는 인간 말초 혈액 세포를 포함하는 세포의 개체군을 본 명세서에 설명된 유전자 변형된 동물 내로 이식하는 단계를 포함한다. 일부 구현예에서, 본 방법은 이식 전에 동물을 방사선조사하는 단계를 추가로 포함한다. 일부 구현예에서, 이식 전에 동물을 방사선조사하는 단계가 필요하지 않다. 유전자 변형된 동물의 인간 혈액-림프계는 다양한 인간 세포, 예를 들어 조혈모세포, 골수 전구 세포, 골수 세포, 수지상 세포, 단핵구, 과립구, 호중구, 비만 세포, 림프구, 및 혈소판을 포함할 수 있다.

본 명세서에 설명된 (예를 들어, 인간 또는 인간화 MHC 단백질 복합체를 발현하는) 유전자 변형된 동물은 또한 인간 혈액-림프계를 확립하는 데 뛰어난 동물 모델이다. 일부 구현예에서, 인간 면역계를 발달시키기 위해 인간 조혈모세포 또는 인간 모세혈관 세포로 이식된 후 동물은 하기 특징들 중 하나 이상을 갖는다:

(a) 인간 백혈구(또는 CD45+ 세포)의 백분율은 동물 내 혈액으로부터의 총 생세포의 적어도 또는 약 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 또는 50%임;

(b) 인간 T 세포(또는 CD3+ 세포)의 백분율은 동물 내 인간 백혈구(또는 CD45+ 세포)의 적어도 또는 약 1%, 2%, 3%, 4%, 5%, 8%, 10%, 15%, 20%, 30%, 40%, 또는 50%임;

(c) 인간 B 세포(또는 CD 19+ 세포)의 백분율은 동물 내 인간 백혈구(또는 CD45+ 세포)의 적어도 또는 약 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 또는 80%임;

(d) 인간 NK 세포(또는 CD56+ 세포)의 백분율은 동물 내 인간 백혈구(또는 CD45+ 세포)의 적어도 또는 약 1%, 2%, 3%, 4%, 5%, 8%, 또는 10%임;

(e) 인간 골수 세포(또는 CD33+ 세포)의 백분율은 동물 내 인간 백혈구(또는 CD45+ 세포)의 적어도 또는 약 2%, 5%, 8%, 10%, 15%, 또는 20%임;

(f) 인간 단핵구(또는 CD14+ 세포)의 백분율은 동물 내 인간 골수 세포(또는 CD33+ 세포)의 적어도 또는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%임; 및

(g) 인간 과립구(또는 CD66b+ 세포)의 백분율은 동물 내 인간 골수 세포(또는 CD33+ 세포)의 적어도 또는 약 1%, 2%, 3%, 4%, 5%, 8%, 10%, 15%, 20%, 25%, 또는 30%임.

일부 구현예에서, 상기 하나 이상의 특징은, 동물(마우스)이 인간 면역계를 발달시키도록 인간 조혈모세포로 이식된 후 적어도 또는 약 4주차, 적어도 또는 약 8주차, 적어도 또는 약 12주차, 적어도 또는 약 16주차, 적어도 또는 약 20주차, 적어도 또는 약 24주차, 적어도 또는 약 26주차, 적어도 또는 약 28주차, 적어도 또는 약 30주차에 결정된다.

일부 구현예에서, 동물은 NSG 마우스, NOG 마우스, NOD/scid 마우스, 또는 B-NDG 마우스에 대해 외인성 세포의 향상된 생착 능력을 갖는다. 일부 구현예에서, 본 명세서에 설명된 동물 모델은 인간 혈액-림프계를 확립하기 위한 더 양호한 동물 모델이다(예를 들어, 더 높은 생존률을 갖거나; 총 생세포 중 더 높은 백분율의 백혈구를 갖거나; 또는 더 높은 성공률의 재구성을 가짐). NSG 마우스, NOD 마우스, 및 B-NDG의 상세한 설명은 예를 들어, 문헌[Ishikawa et al. "Development of functional human blood and immune systems in NOD/SCID/IL2 receptor γ chainnull mice." Blood 106.5 (2005): 1565-1573; Katano et al. "NOD-Rag2null IL-2Rγnull mice: an alternative to NOG mice for generation of humanized mice." Experimental animals 63.3 (2014): 321-330; US 20190320631 A1]에서 찾을 수 있으며, 이들 각각은 그 전체가 본 명세서에 참조로 포함된다.

일부 구현예에서, 유전자 변형된 동물은 암 치료용 제제 또는 제제들의 조합의 효율성을 결정하기 위해 사용될 수 있다. 이 방법은 본 명세서에 설명된 동물에 종양 세포를 이식하고, 제제 또는 제제들의 조합을 동물에게 투여하는 단계; 및 종양에 대한 억제 효과를 결정하는 단계를 포함한다.

일부 구현예에서, 종양 세포는 인간 환자로부터 수득된 종양 샘플로부터 유래한다. 이러한 동물 모델은 환자 유래 이종이식(PDX) 모델로도 알려져 있다. PDX 모델은, 암 진행 및 치료 연구를 위해, 암의 자연적인 성장과 유사한 환경을 생성하기 위해 종종 사용된다. PDX 모델 내에서, 환자의 종양 샘플은 환자의 원발성 종양 부위에서 발견되는 산소, 영양소 및 호르몬 수준을 모방하는 생리학적으로 관련된 종양 미세환경에서 성장한다. 또한, 이식된 종양 조직은 환자에게서 발견되는 유전적 및 후천적 이상을 유지하며, 이종이식 조직은 주변 인간 기질을 포함하도록 환자로부터 절제될 수 있다. 그 결과, PDX 모델은 종종 종양 샘플을 제공하는 실제 환자에서 볼 수 있는 바와 같이 항암제에 대해 유사한 반응을 나타낼 수 있다.

유전자 변형된 면역결핍 동물(예를 들어, B-NDG 백그라운드를 갖는 마우스)은 기능성 T 세포 또는 B 세포를 갖지 않지만, 이러한 동물은 여전히 기능성 식세포성 세포들, 예를 들어 호중구, 호산구(애시도필러스(acidophilus)), 호염기구(basophils), 또는 단핵구를 갖는다. 대식세포는 단핵구로부터 유래할 수 있으며, 세포 파편, 외부 물질, 미생물, 암세포를 에워싸서 소화시킬 수 있다. 따라서, 본 명세서에 설명된 유전자 변형된 동물은 식세포 작용에 대한 제제(예를 들어, 항-CD47 항체, 항-IL6 항체, 항-IL15 항체, 또는 항-SIRPα항체)의 효과 및 종양 세포의 성장을 억제하는 제제의 효과를 결정하는 데 사용될 수 있다.

일부 구현예에서, 인간 조혈계를 발달시키기 위해, 인간 말초 혈액 세포(hPBMC) 또는 인간 조혈모세포가 동물에게 주입된다. 본 명세서에 설명된 유전자 변형된 동물은 인간 조혈계에서 제제의 효과, 및 종양 세포 성장 또는 종양 성장을 억제하는 제제의 효과를 결정하는 데 사용될 수 있다. 따라서, 일부 구현예에서, 본 명세서에 설명된 바와 같은 방법은 또한 인간 면역 세포(예를 들어, 인간 T 세포, B 세포, 또는 NK 세포)에 대한 제제의 효과, 예를 들어, 제제가 T 세포를 자극하거나 T 세포를 억제할 수 있는지의 여부, 제제가 면역 반응을 상향조절하거나 면역 반응을 하향조절할 수 있는지의 여부를 결정하도록 설계된다. 일부 구현예에서, 유전자 변형된 동물은 대상체의 질병, 예를 들어 암 또는 자가면역 질병을 치료하기 위한 치료제의 유효 투여량을 결정하는 데 사용될 수 있다.

일부 구현예에서, 시험되는 제제 또는 시험되는 제제들의 조합은 다양한 암을 치료하기 위해 설계된다. 본 명세서에 사용된 바와 같이, 용어 "암"은 자율적 성장 능력을 갖는 세포, 즉 빠르게 증식하는 세포 성장을 특징으로 하는 비정상적인 상태 또는 조건을 지칭한다. 이 용어는, 조직병리학적 유형 또는 침습성 단계에 관계없이, 모든 유형의 암성 성장 또는 발암성 과정, 전이성 조직 또는 악성 형질전환 세포, 조직 또는 기관을 포함하고자 한다. 본 명세서에 사용된 바와 같은 용어 "종양"은 암성 세포, 예를 들어 암성 세포의 덩어리를 지칭한다. 본 명세서에 설명된 방법을 사용하여 치료 또는 진단할 수 있는 암은, 폐, 유방, 갑상선, 림프구, 위장, 및 비뇨생식관에 영향을 미치는 것과 같은 다양한 기관계의 악성종양뿐만 아니라, 대부분의 결장암, 신장세포 암종, 전립선암 및/또는 고환 종양과 같은 악성종양, 폐의 비소세포 암종, 소장암 및 식도암을 포함하는 선암종을 포함한다. 일부 구현예에서, 본 명세서에 설명된 제제는 대상체에서 암종을 치료 또는 진단하기 위해 설계된다. "암종"이라는 용어는 당업계에 인식되고 있으며, 호흡기계 암종, 위장계 암종, 비뇨생식기계 암종, 고환 암종, 유방 암종, 전립선 암종, 내분비계 암종 및 흑색종을 포함하는 상피 또는 내분비 조직의 악성 종양을 지칭한다. 일부 구현예에서, 암은 신장 암종 또는 흑색종이다. 예시적인 암종은 자궁경부, 폐, 전립선, 유방, 두경부, 결장 및 난소의 조직으로부터 형성되는 것을 포함한다. 이 용어는 또한 예를 들어 암종 및 육종 조직으로 구성된 악성 종양을 포함하는 암육종을 포함한다. "선암종"은 선 조직에서 유래하거나 종양 세포가 인식가능한 선 구조를 형성하는 암종을 지칭한다. "육종"이라는 용어는 당업계에서 인식되며, 간엽 유래 악성 종양을 지칭한다.

일부 구현예에서, 시험되는 제제는 흑색종, 원발성 폐암종, 비소세포 폐 암종(NSCLC), 소세포 폐암(SCLC), 원발성 위 암종, 방광암, 유방암 및/또는 전립선암을 치료하기 위해 설계된다.

일부 구현예에서, 주입된 종양 세포는 인간 종양 세포이다. 일부 구현예에서, 주입된 종양 세포는 흑색종 세포, 원발성 폐 암종 세포, 비소세포 폐 암종(NSCLC) 세포, 소세포 폐암(SCLC) 세포, 원발성 위 암종 세포, 방광암 세포, 유방암 세포, 및/또는 전립선암 세포이다.

종양에 대한 억제 효과는 또한 당업계에 알려진 임의의 방법에 의해 결정될 수 있다. 일부 구현예에서, 종양 세포는 루시퍼라제 유전자에 의해 표지될 수 있다. 따라서, 동물의 종양 세포의 수 또는 종양의 크기는 생체 내 영상화 시스템(예를 들어, 형광 강도)에 의해 결정될 수 있다. 일부 구현예에서, 종양에 대한 억제 효과는 또한 동물의 종양 부피를 측정하고/하거나 종양(부피) 억제율(TGI_TV)을 결정함으로써 결정될 수 있다. 종양 성장 억제율은 식: TGI_TV(%) (1 - TVt/TVc) Х 100을 사용하여 계산될 수 있으며, 여기서 TVt 및 TVc는 처리군 및 대조군의 평균 종양 부피(또는 중량)이다.

일부 구현예에서, 시험되는 제제는 파클리탁셀, 시스플라틴, 카보플라틴, 페메트렉시드, 5-FU, 젬시타빈, 옥살리플라틴, 도세탁셀, 및 카페시타빈으로 이루어진 군으로부터 선택된 하나 이상의 제제일 수 있다.

일부 구현예에서, 시험되는 제제는 항체, 예를 들어 CSF2, IL3, CSF1, IL15, CD47, PD-1, CTLA-4, LAG-3, TIM-3, BTLA, PD-L1, 4-1BB, CD27, CD28, CD47, TIGIT, CD27, GITR, 또는 OX40에 결합하는 항체일 수 있다. 일부 구현예에서, 항체는 인간 항체이다.

본 개시내용은 또한 인간 세포의 면역화 과정과 관련된 생성물의 개발, 인간 항체의 제조, 또는 약리학, 면역학, 미생물학 및 의학 연구를 위한 모델 시스템에서 본 명세서에 설명된 바와 같은 방법을 통해 생성된 동물 모델의 용도에 관한 것이다.

일부 구현예에서, 본 개시내용은 인간 세포를 포함하는 면역화 과정의 동물 실험 질병 모델의 생성 및 이용, 병원체에 대한 연구, 또는 새로운 진단 전략 및/또는 치료 전략의 개발에서 본 명세서에 설명된 바와 같은 방법을 통해 생성된 동물 모델의 용도를 제공한다.

대부분의 면역결핍 마우스(예를 들어, B-NDG 마우스)에서, MHC 단백질 복합체는 마우스 내인성 MHC 단백질 복합체(예를 들어, 마우스 H2 분자 포함)이다. 인간 세포 또는 조직의 이식 후, 인간-유래 세포(예를 들어, 인간 조혈 세포 또는 인간 말초 혈액 세포)는 인간 MHC-제한 항원 인식을 수득할 수 없다. 추가적으로, 인간 MHC-제한 면역 반응은 면역결핍 마우스의 특정 병원체에 의한 면역요법 또는 감염 후에 평가할 수 없다. 또한, 이식된 인간 T 및 B 림프구는 면역결핍 마우스에서 완전히 기능적으로 성숙할 수 없다. 일부 구현예에서, 본 명세서에 설명된 인간화 MHC 단백질 복합체를 발현하는 유전자 변형된 비-인간 동물은 인간 세포(예를 들어, 인간 조혈 세포 또는 인간 말초 혈액 세포) 또는 조직으로 이식된 후 MHC 제한 효과를, 인간화 MHC 단백질 복합체를 발현하지 않는 대조군 마우스(동일한 백그라운드를 가짐)와 비교하여, 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 개선할 수 있다. 일부 구현예에서, 본 명세서에 설명된 인간화 MHC 단백질 복합체를 발현하는 유전자 변형된 비-인간 동물은, 인간 세포(예를 들어, 인간 조혈 세포 또는 인간 말초 혈액 세포) 또는 조직으로 이식된 후 인간 T 세포 및/또는 B 세포 성숙을, 인간화 MHC 단백질 복합체를 발현하지 않는 대조군 마우스(동일한 백그라운드를 가짐)와 비교하여, 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100% 개선할 수 있다.

따라서 일 양태에서, 본 명세서에 설명된 바와 같은 유전자 변형된 동물은 세포 요법(예를 들어, T 세포 기반 세포 요법)의 효능을 평가하는 데 특히 적합하다. 일부 구현예에서, 본 개시내용은 TCR-T, CAR-T, 및/또는 기타 면역요법(예를 들어, T-세포 입양 전달 요법)의 생체 내 효능을 검증하는 방법을 제공한다. 예를 들어, 이 방법은 인간 종양 세포를 본 명세서에 설명된 동물 내로 이식하는 단계, 및 면역요법(예를 들어, 인간 CAR-T 요법)을 그 인간 종양 세포를 갖는 동물에게 적용하는 단계를 포함한다. CAR-T 요법의 유효성이 결정 및 평가될 수 있다. 일부 구현예에서, 동물은 본 명세서에 설명된 방법에 의해 제조된 비-인간 동물, 본 명세서에 설명된 비-인간 동물, 본 명세서에 설명된 방법에 의해 생성된 이중- 또는 다중-인간화 비-인간 동물(또는 그의 자손), 인간화 MHC 단백질 복합체를 발현하는 비-인간 동물, 또는 본 명세서에 설명된 종양-보유 또는 염증성 동물 모델로부터 선택된다. 일부 구현예에서, TCR-T, CAR-T, 및/또는 기타 면역요법은 본 명세서에 설명된 질병을 치료할 수 있다. 일부 구현예에서, TCR-T, CAR-T, 및/또는 기타 면역요법은 본 명세서에 설명된 질병(예를 들어, 암)을 치료하기 위한 평가 방법을 제공한다.

추가의 유전자 변형을 갖는 동물 모델

본 개시내용은 추가로, 일부 추가의 변형(예를 들어, 인간 또는 키메라 유전자 또는 추가의 유전자 녹아웃)을 갖는 본 명세서에 설명된 유전자 변형된 동물 모델을 생성하는 방법에 관한 것이다.

일부 구현예에서, 동물은 인간 또는 인간화 MHC 단백질 복합체를 인코딩하는 서열 및 추가의 인간 또는 키메라 단백질을 인코딩하는 서열을 포함할 수 있다. 일부 구현예에서, 추가의 인간 또는 키메라 단백질은 콜로니 자극 인자 2(CSF2), IL3, 콜로니 자극 인자 1(CSF1), IL15, 프로그램된 세포 사멸 단백질 1(PD-1), TNF 수용체 상과 구성원 9(4-1BB 또는 CD137), 세포독성 T- 림프구-연관 단백질 4(CTLA-4), LAG-3, T-세포 면역글로불린 및 뮤신-도메인 함유-3(TIM-3), B 및 T 림프구 연관(BTLA), 프로그램된 세포 사멸 1 리간드 1(PD-L1), CD27, CD28, 신호-조절 단백질 알파(SIRPα), CD47, 트롬보포이에틴(THPO), Ig 및 ITIM 도메인이 있는 T-세포 면역수용체(TIGIT), 글루코코르티코이드-유도된 TNFR-관련 단백질(GITR), 또는 TNF 수용체 상과 구성원 4(TNFRSF4; 또는 OX40)일 수 있다.

일부 구현예에서, 동물은 인간 또는 인간화 MHC 단백질 복합체를 인코딩하는 서열 및 일부 다른 내인성 유전자(예를 들어, CD132, 베타-2-마이크로글로불린(B2m) 또는 포크헤드 박스(Forkhead Box) N1(Foxn1))에서의 파괴를 포함할 수 있다. 일부 구현예에서, 동물은 KIT 내 돌연변이를 가질 수 있다. KIT 내 돌연변이를 갖는 유전자 변형된 비-인간 동물은 예를 들어, PCT/CN2020/113608에 설명되어 있으며, 이는 그 전체가 본 명세서에 참조로 포함된다.

2개 이상의 인간 또는 키메라 유전자(예를 들어, 인간화 유전자)를 갖는 유전자 변형된 동물 모델을 생성하는 방법은

(a) 유전자 변형된 비-인간 동물을 수득하기 위해 본 명세서에 설명된 바와 같은 융합 단백질을 인코딩하는 서열을 도입하는 방법을 사용하는 단계;

(b) 유전자 변형된 비-인간 동물을 또 다른 유전자 변형된 비-인간 동물과 교배시키고, 이어서 2개 이상의 인간 또는 키메라 유전자를 갖는 유전자 변형된 비-인간 동물을 수득하기 위해 자손을 스크리닝하는 단계

를 포함할 수 있다.

일부 구현예에서, 상기 방법의 단계 (b)에서, 유전자 변형된 동물은 인간 또는 키메라 CSF2, IL3, CSF1, IL15, PD-1, CTLA-4, LAG-3, TIM-3, BTLA, PD-L1, 4-1BB, CD27, CD28, SIRPα, CD47, THPO, TIGIT, GITR, 또는 OX40을 갖는 유전자 변형된 비-인간 동물과 교배될 수 있다. 이러한 유전자 변형된 비-인간 동물 중 일부는 예를 들어, PCT/CN2017/090320, PCT/CN2017/099577, PCT/CN2017/099575, PCT/CN2017/099576, PCT/CN2017/099574, PCT/CN2017/106024, PCT/CN2020/125489, PCT/CN2020/142546, CN111172190A, CN111118019A, 및 CN 111073907 A에 설명되어 있으며; 이들 각각은 그 전체가 본 명세서에 참조로 포함된다.

일부 구현예에서, 본 명세서에 설명된 유전자 변형은 인간 또는 키메라 CSF2, IL3, CSF1, IL15, PD-1, CTLA-4, LAG-3, BTLA, TIM-3, PD-L1, 4-1BB, CD27, CD28, SIRPα, CD47, THPO, TIGIT, GITR, 또는 OX40 유전자를 갖는 유전자 변형된 동물에서 직접 수행될 수 있다.

일부 구현예에서, 본 명세서에 설명된 유전자 변형은 B2m 녹아웃 마우스 또는 Foxn1 녹아웃 마우스에서 직접 수행될 수 있다. 일부 구현예에서, 본 명세서에 설명된 유전자 변형은 B-NDG 마우스에서 직접 수행될 수 있다.

이러한 단백질은 상이한 메커니즘을 포함할 수 있기 때문에, 이러한 단백질 중 2개 이상을 표적화하는 병용 요법이 더 효과적인 치료일 수 있다. 실제로, 많은 관련 임상 시험들이 진행 중에 있으며, 좋은 효과를 보여주고 있다.

MHC 단백질 복합체 인간화 동물 모델, 및/또는 추가의 유전자 변형을 갖는 MHC 단백질 복합체 인간화 동물 모델은 병용 요법의 효과를 결정하는 데 사용될 수 있다.

일부 구현예에서, 제제들의 조합은 파클리탁셀, 시스플라틴, 카보플라틴, 페메트렉시드, 5-FU, 젬시타빈, 옥살리플라틴, 도세탁셀, 및 카페시타빈으로 이루어진 군으로부터 선택된 하나 이상의 제제를 포함할 수 있다.

일부 구현예에서, 제제들의 조합은 캄포테신, 독소루비신, 시스플라틴, 카보플라틴, 프로카르바진, 메클로레타민, 사이클로포스파미드, 아드리아마이신, 이포스파미드, 멜팔란, 클로람부실, 바이설판, 니트로스우레아, 닥티노마이신, 다우노루비신, 블레오마이신, 플리코마이신, 미토마이신, 에토포시드, 베람필, 포도필로톡신, 타목시펜, 탁솔, 트랜스플라티늄, 5-플루로우라실, 빈크리스틴, 빈블라스틴, 및 메토트렉세이트로 이루어진 군으로부터 선택된 하나 이상의 제제를 포함할 수 있다.

일부 구현예에서, 제제들의 조합은 CSF2, IL3, CSF1, IL15, PD-1, CTLA-4, LAG-3, BTLA, TIM-3, PD-L1, 4-1BB, CD27, CD28, SIRPα, CD47, THPO, TIGIT, GITR, 및/또는 OX40에 결합하는 하나 이상의 항체를 포함할 수 있다.

대안적으로 또는 추가적으로, 본 방법은 또한 대상체로부터 암의 적어도 일부를 제거하기 위해, 예를 들어 종양(들)의 일부 또는 전부를 제거하기 위해 대상체에서 수술을 수행하는 것을 포함할 수 있다.

도 1은 HLA-A의 3D 개략 구조이다.
도 2는 마우스 B2M 유전자 자리 및 인간 B2M 유전자 자리를 나타내는 개략도이다.
도 3은 마우스 H2-D1 유전자 자리 및 인간 HLA-A 유전자 자리를 나타내는 개략도이다.
도 4는 인간화 마우스 B2M 유전자 자리를 나타내는 개략도이다. 마우스 B2M 유전자 코딩 영역은 인간 B2M 단백질, 인간 HLA-A2.1 단백질의 일부, 및 마우스 H2-D1 단백질의 일부를 인코딩하는 핵산 서열로 대체된다.
도 5는 인간화 마우스 B2M 유전자 자리를 나타내는 개략도이다. 마우스 B2M 유전자 코딩 영역은 인간 B2M 유전자의 코딩 영역으로 대체된다.
도 6은 인간화 마우스 H2-D1 유전자 자리를 나타내는 개략도이다. 마우스 H2-D1 유전자의 일부는 인간 HLA-A2.1 단백질의 일부를 인코딩하는 핵산 서열로 대체된다.
도 7은 인간화 마우스 H2-D1 유전자 자리를 나타내는 개략도이다. 마우스 H2-D1 유전자의 일부는 인간 B2M 단백질 및 인간 HLA-A2.1 단백질의 일부를 인코딩하는 핵산 서열로 대체된다.
도 8은 인간화 마우스 B2M 유전자 자리를 나타내는 개략도이다. 마우스 B2M 유전자 코딩 영역은 인간 HLA-A2.1의 신호 펩티드, 인간 B2M 단백질, 인간 HLA-A2.1 단백질의 일부, 및 마우스 H2-D1 단백질의 일부를 인코딩하는 핵산 서열로 대체된다.
도 9는 마우스 B2M 유전자 자리에서 표적화 전략의 개략도를 나타낸다.
도 10A는 sgRNA1- sgRNA7(sg1-sg7)에 대한 활성 시험 결과를 나타낸다. PC는 양성 대조군이다. Con.은 음성 대조군이다. 블랭크는 블랭크 대조군이다.
도 10B는 sgRNA9-sgRNA15(sg9-sg15)에 대한 활성 시험 결과를 나타낸다. PC는 양성 대조군이다. Con.은 음성 대조군이다. 블랭크는 블랭크 대조군이다.
도 11A는 프라이머 L-GT-F 및 L-GT-R에 의한 F0 세대 마우스의 5' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. F0-01, F0-02, F0-03, F0-04, F0-05, F0-06, F0-07, F0-08, F0-09, 및 F0-10은 마우스 번호이다.
도 11B는 프라이머 R-GT-F 및 R-GT-R에 의한 F0 세대 마우스의 3' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. F0-01, F0-02, F0-03, F0-04, F0-05, F0-06, F0-07, F0-08, F0-09, 및 F0-10은 마우스 번호이다.
도 12A는 프라이머 L-GT-F 및 L-GT-R에 의한 F1 세대 마우스의 5' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. F1-01, F1-02, F1-03, F1-04, F1-05, F1-06 및 F1-07은 양성 마우스 번호이다.
도 12B는 프라이머 R-GT-F 및 R-GT-R에 의한 F1 세대 마우스의 3' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. F1-01, F1-02, F1-03, F1-04, F1-05, F1-06 및 F1-07은 양성 마우스 번호이다.
도 13은 P1 또는 P2 프로브에 의한 F1 세대 마우스의 서던 블롯 분석 결과를 나타낸다. M은 마커이다. WT는 야생형 대조군이다. F1-01, F1-02, F1-03, F1-04, F1-05, F1-06 및 F1-07은 마우스 번호이다.
도 14의 A는 자극되지 않은 야생형 C57BL/6 마우스로의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 B2M 항체 mβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 B는 자극되지 않은 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 B2M 항체 mβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 C는 항-마우스 CD3 항체에 의해 자극된 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 B2M 항체 mβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 D는 항-마우스 CD3 항체에 의해 자극된 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 B2M 항체 mβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 E는 자극되지 않은 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 B2M 항체 hβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 F는 자극되지 않은 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 B2M 항체 hβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 G는 항-마우스 CD3 항체에 의해 자극된 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 B2M 항체 hβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 H는 항-마우스 CD3 항체에 의해 자극된 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 B2M 항체 hβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 I는 자극되지 않은 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 H-2Kb/H-2Db 항체 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 J는 자극되지 않은 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 H-2Kb/H-2Db 항체 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 K는 항-마우스 CD3 항체에 의해 자극된 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 H-2Kb/H-2Db 항체 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 L은 항-마우스 CD3 항체에 의해 자극된 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 H-2Kb/H-2Db 항체 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 M은 자극되지 않은 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 HLA-A2 항체 hHLA-A2 PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 N은 자극되지 않은 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 HLA-A2 항체 hHLA-A2 PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 O는 항-마우스 CD3 항체에 의해 자극된 야생형 C57BL/6 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 HLA-A2 항체 hHLA-A2 PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 14의 P는 항-마우스 CD3 항체에 의해 자극된 MHC 인간화 동형접합 마우스(H/H)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 HLA-A2 항체 hHLA-A2 PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 15A는 야생형 C57BL/6 마우스 비장 세포 내 백혈구의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 CD45 항체 mCD45 APC로 염색되었다. 백혈구의 비는 88.6%였다.
도 15B는 MHC 인간화 동형접합 마우스(H/H) 비장 세포 내 백혈구의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 CD45 항체 mCD45 APC로 염색되었다. 백혈구의 비는 96.5%였다.
도 15C는 야생형 C57BL/6 마우스 백혈구 내 T 세포 및 B 세포의 유세포 분석 결과를 나타낸다. T 세포 및 B 세포는 각각 마우스 T 세포 표면 항체 mTCRB-APC-Cy7 및 항-마우스 CD19 항체 mCD19-PE로 염색되었다.
도 15D는 MHC 인간화 동형접합 마우스(H/H) 백혈구 내 T 세포 및 B 세포의 유세포 분석 결과를 나타낸다. T 세포 및 B 세포는 각각 마우스 T 세포 표면 항체 mTCRB-APC-Cy7 및 항-마우스 CD19 항체 mCD19-PE로 염색되었다.
도 15E는 야생형 C57BL/6 마우스 T 세포 내 CD4+ T 세포 및 CD8+ T 세포의 유세포 분석 결과를 나타낸다. CD4+ T 세포 및 CD8+ T 세포는 각각 항-마우스 CD4 항체 mCD4-BV421 및 항-마우스 mCD8a 항체 mCD8a-BV711로 염색되었다.
도 15F는 MHC 인간화 동형접합 마우스(H/H) T 세포 내 CD4+ T 세포 및 CD8+ T 세포의 유세포 분석 결과를 나타낸다. CD4+ T 세포 및 CD8+ T 세포는 각각 항-마우스 CD4 항체 mCD4-BV421 및 항-마우스 mCD8a 항체 mCD8a-BV711로 염색되었다.
도 16은 SIRPα 녹아웃 마우스로부터의 PCR 결과를 나타낸다. M은 마커이다. WT는 야생형 대조군이다. H₂O는 물 대조군이다. 번호 1~10은 양성 마우스 번호이다.
도 17은 인간화 마우스 B2M 유전자 자리를 나타내는 개략도이다. 마우스 B2M 유전자 코딩 영역은 인간 HLA-A2.1, 인간 B2M 단백질, 및 인간 HLA-A2.1 단백질의 신호 펩티드를 인코딩하는 핵산 서열로 대체되었다.
도 18은 마우스 B2M 유전자 자리의 표적화 전략의 개략도를 나타낸다.
도 19A는 프라이머 L-GT-F 및 BNDG-L-GT-R에 의한 F0 세대 마우스의 5' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. BNDG-F0-01, BNDG-F0-02, BNDG-F0-03, BNDG-F0-04, BNDG-F0-05, 및 BNDG-F0-06은 마우스 번호이다.
도 19B는 프라이머 BNDG-R GT-F 및 R-GT-R에 의한 F0 세대 마우스의 3' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. BNDG-F0-01, BNDG-F0-02, BNDG-F0-03, BNDG-F0-04, BNDG-F0-05, 및 BNDG-F0-06은 마우스 번호이다.
도 20A는 프라이머 L-GT-F 및 BNDG-L-GT-R에 의한 F1 세대 마우스의 5' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. BNDG-F0-01 및 BNDG-F0-02는 마우스 번호이다.
도 20B는 프라이머 BNDG-R-GT-F 및 R-GT-R에 의한 F1 세대 마우스의 3' 말단 PCR 검출 결과를 나타낸다. M은 마커이다. H₂O는 물 대조군이다. WT는 야생형 대조군이다. PC는 양성 대조군이다. BNDG-F0-01 및 BNDG-F0-02는 마우스 번호이다.
도 21은 BNDG-P1 또는 BNDG-P2 프로브에 의한 F1 세대 마우스의 서던 블롯 분석 결과를 나타낸다. M은 마커이다. WT는 야생형 대조군이다. BNDG-F0-01 및 BNDG-F0-02는 마우스 번호이다.
도 22의 A는 B-NDG 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 B2M 항체 mβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 B는 B-NDG 백그라운드 MHC 인간화 이형접합 마우스(H/+)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 B2M 항체 mβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 C는 B-NDG 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 B2M 항체 hβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 D는 B-NDG 백그라운드 MHC 인간화 이형접합 마우스(H/+)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 B2M 항체 hβ2M PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 E는 B-NDG 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 H-2Kb/H-2Db 항체 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 F는 B-NDG 백그라운드 MHC 인간화 이형접합 마우스(H/+)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-마우스 H-2Kb/H- 2Db 항체 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 G는 B-NDG 마우스의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 HLA-A2 항체 hHLA-A2 PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 22의 H는 B-NDG 백그라운드 MHC 인간화 이형접합 마우스(H/+)의 비장 세포의 유세포 분석 결과를 나타낸다. 비장 세포는 항-인간 HLA-A2 항체 hHLA-A2 PE 및 항-마우스 CD45 항체 mCD45 APC로 염색되었다.
도 23은 마우스 B2M 아미노산 서열(NP_033865.2; 서열번호 2)과 인간 B2M 아미노산 서열(NP_004039.1; 서열번호 4) 사이의 배열을 나타낸다.
도 24는 쥐 B2M 아미노산 서열(NP_036644.1; 서열번호 66)과 인간 B2M 아미노산 서열(NP_004039.1; 서열번호 4) 사이의 배열을 나타낸다.
도 25는 마우스 H2-D1 아미노산 서열(NP_034510.3; 서열번호 6)과 인간 HLA-A2.1 아미노산 서열(AAC24825.1; 서열번호 59) 사이의 배열을 나타낸다.
도 26은 마우스 H2-D1 아미노산 서열(NP_034510.3; 서열번호 6)과 인간 HLA-A*0101 아미노산 서열(NP_001229687.1; 서열번호 8) 사이의 배열을 나타낸다.

본 발명은 청구범위에 기재된 본 발명의 범위를 제한하지 않는 하기 실시예에서 추가로 설명된다

재료 및 방법

하기 실시예에서 하기 재료를 사용하였다.

NOD-Prkdc^scid IL-2rg^null(B-NDG) 마우스는 Beijing Biocytogen Co., Ltd.로부터 수득하였다. 카탈로그 번호는 B-CM-001 또는 B-CM-002이다.

UCA 키트를 Beijing Biocytogen Co., Ltd.로부터 수득하였다. 카탈로그 번호는 BCG-DX-001이다.

Ambion?? 시험관 내 전사 키트를 Ambion, Inc.로부터 구매하였다. 카탈로그 번호는 AM1354이다.

Cas9 mRNA를 SIGMA로부터 수득하였다. 카탈로그 번호는 CAS9MRNA-1EA이다.

PE 항-인간 β2-마이크로글로불린 항체(hβ2M PE)를 BioLegend로부터 구매하였다. 카탈로그 번호는 316305이다.

PE 항-마우스 β2-마이크로글로불린 항체(mβ2M PE)를 BioLegend로부터 구매하였다. 카탈로그 번호는 154503이다.

PE 항-인간 HLA-A2 항체(hHLA-A2 PE)를 BioLegend로부터 구매하였다. 카탈로그 번호는 343305이다.

PE 항-마우스 H-2K^b/H-2D^b 항체(H-2Kb/H-2Db PE)를 BioLegend로부터 구매하였다. 카탈로그 번호는 114607이다.

FITC 항-마우스 CD 19 항체(mCD19FITC)를 BioLegend로부터 구매하였다. 카탈로그 번호는 115506이다.

정제된 항-마우스 CD 16/32 항체를 BioLegend로부터 구매하였다. 카탈로그 번호는 101302이다.

APC 항-mCD45(mCD45APC)를 BioLegend로부터 구매하였다. 카탈로그 번호는 559864이다.

APC/Cy7 항-마우스 TCR β 사슬 항체(mTCRβ APC/Cy7)를 BioLegend로부터 구매하였다. 카탈로그 번호는 109220이다.

Alexa Fluor^® 488 항-마우스 CD3 항체(mCD3 Alexa Flour 488)를 Biolegend로부터 구매하였다. 카탈로그 번호는 100210이다.

PE 항-마우스 CD 19 항체(mCD19 PE)를 Biolegend로부터 구매하였다. 카탈로그 번호는 115508이다.

Brilliant Violet 421?? 항-마우스 CD4 항체(mCD4 BV421)를 BioLegend로부터 구매하였다. 카탈로그 번호는 100438이다.

Brilliant Violet 711?? 항-마우스 CD8a 항체(mCD8a BV711)를 BioLegend로부터 구매하였다. 카탈로그 번호는 100747이다.

BamHI, BglII, EcoNI, 및 SspI 제한 효소를 NEB로부터 구매하였다. 카탈로그 번호는 각각 R3136, R0144, R0521, 및 R3132이다.

실시예 1: MHC 인간화 마우스의 생성

비-인간 동물(예를 들어, 마우스)의 유전체를 인간 B2M 및 HLA-A2.1 단백질의 전부 또는 부분을 인코딩하는 핵산 서열을 포함하도록 변형할 수 있으며, 이로써 유전자 변형된 비-인간 동물이 인간 또는 인간화 B2M 및 HLA-A2.1 단백질을 발현할 수 있다. 마우스 B2M 유전자(NCBI Gene ID: 12010, 일차 공급원: MGI: 88127, UniProt ID: P01887)는 마우스 유전체의 염색체 2(NC_000068.7의 122,147,686부터 122,153,083까지)에 위치한다. 전사 서열 NM_009735.3은 서열번호 1에 제시되어 있고, 상응하는 단백질 서열 NP_033865.2는 서열번호 2에 제시되어 있다. 인간 B2M 유전자(NCBI Gene ID: 567, 일차 공급원: HGNC: 914, UniProt ID: P61769)는 인간 유전체의 염색체 15(NC_000015.10의 44,711,487부터 44,718,877)에 위치한다. 전사 서열 NM_004048.3은 서열번호 3에 제시되어 있고, 상응하는 단백질 서열 NP_004039.1은 서열번호 4에 제시되어 있다. 마우스 및 인간 B2M 유전자 자리는 도 2에 나타나 있다.

마우스 H2-D1 유전자(NCBI Gene ID: 14964, 일차 공급원: MGI: 95896, UniProt ID: P01899)는 마우스 유전체의 염색체 17에 위치한다. 전사 서열 NM_010380.3은 서열번호 5에 제시되어 있고, 상응하는 단백질 서열 NP_034510.3은 서열번호 6에 제시되어 있다. 인간 HLA-A 유전자(NCBI Gene ID: 3105, 일차 공급원: HGNC: 4931, UniProt ID: P04439)는 인간 유전체의 염색체 6에 위치한다. 전사 서열 NM_001242758.1은 서열번호 7에 제시되어 있고, 상응하는 단백질 서열 NP_001229687.1은 서열번호 8에서 제시되어 있다. 마우스 H2-D1 유전자 자리 및 인간 HLA-A 유전자 자리는 도 3에 나타나 있다.

인간 또는 인간화 MHC 분자를 발현하는 유전자이식 마우스를 수득하기 위해 다양한 전략이 사용될 수 있다. 예를 들어, 마우스 내인성 B2M 유전자 및 내인성 H2-D1 유전자는 불활성화될 수 있고, 다음을 포함하는 폴리펩티드 서열을 인코딩하는 핵산 서열: 인간 B2M; 인간 HLA-A2.1의 신호 펩티드 및 세포외 영역의 일부(예를 들어, 서열번호 59의 아미노산 1-203); 세포외 영역의 일부(알파-3 영역 및 연결 펩티드), 마우스 H2-D1의 막관통 영역 및 세포질 영역(예를 들어, 서열번호 6의 아미노산 207-362)은, 마우스 유전체로 녹인될 수 있다.

상이한 변형 및 조합이 또한 마우스 B2M 및/또는 마우스 H2-D1 유전자 자리 상에서 사용될 수 있다.

예를 들어, 마우스 내인성 B2M 유전자 자리는 다음과 같이 인간화될 수 있다. 도 4에 나타낸 바와 같이, 마우스 내인성 B2M 유전자의 엑손 1 내에서, 다음을 포함하는 폴리펩티드를 인코딩하는 핵산 서열: 인간 B2M; 인간 HLA-A2.1의 신호 펩티드, 알파-1, 및 알파-2 영역(예를 들어, 인간 HLA-A2.1 엑손 1~3에 의해 인코딩된 AAC24825.1(서열번호 59)의 아미노산 1-203); 알파-3 영역, 연결 펩티드, 막관통 영역, 및 마우스 H2-D1의 세포질 영역(예를 들어, 마우스 H2-D1 엑손 4~8에 의해 인코딩되는 NP_034510.3(서열번호 6)의 아미노산 207-362)은, 마우스 내인성 B2M 유전자의 엑손 1~3에 걸쳐 있는 서열을 대체하는 데 사용될 수 있다.

상이한 전략에 따르면, 마우스 내인성 B2M 유전자는 직접 인간화될 수 있다. 도 5에 나타낸 바와 같이, 마우스 B2M 유전자의 코딩 영역은 인간 B2M 유전자의 코딩 영역으로 대체될 수 있다. 한편, 다음을 포함하는 폴리펩티드(서열번호 64)를 인코딩하는 서열: 인간 HLA-A2.1의 신호 펩티드, 알파-1, 및 알파-2 영역; 마우스 H2-D1의 알파-3 영역, 연결 펩티드, 막관통 영역, 및 세포질 영역은, 유전자 이식 기술에 의해 마우스 유전체로 녹인될 수 있다. 대안적으로, 도 6에 나타낸 바와 같이, 마우스 내인성 H2-D1 유전자 자리에서, 인간 HLA-A2.1의 신호 펩티드, 알파-1, 및 알파-2 영역을 포함하는 폴리펩티드를 인코딩하는 서열은 신호 펩티드, 알파-1 및 알파-2 영역을 인코딩하는 마우스 H2-D1 유전자의 상응하는 서열을 대체하는 데 사용될 수 있다. 마우스 B2M 유전자 및 H2-D1 유전자가 각각 인간화되는 경우, 이중-유전자 인간화 마우스는 1단계 또는 다단계 표적화 전략에 의해 제조될 수 있다. 단일-유전자 인간화 마우스를 별도로 제조하고, 교배와 같은 방법을 통해 이중-유전자 마우스를 수득하는 것도 가능하다. 수득된 이중-유전자 인간화 마우스는 인간 B2M 단백질 및 인간화 MHC α 사슬 단백질을 생체 내에서 동시에 발현할 수 있다.

다른 전략으로서, 마우스 내인성 B2M 유전자는 녹아웃될 수 있다. 한편, 도 7에 나타낸 바와 같이, 마우스 내인성 H2-D1 유전자 자리에서, 인간 B2M; 인간 HLA-A2.1의 신호 펩티드, 알파-1, 및 알파-2 영역을 포함하는 폴리펩티드 폴리펩티드(서열번호 63)를 인코딩하는 서열은 마우스 H2-D1의 신호 펩티드, 알파-1 및 알파-2 영역을 인코딩하는 서열을 대체하는 데 사용될 수 있다.

다음 실험에서, 도 4에 나타낸 인간화 방법을 사용하여 인간화 MHC 분자를 갖는 유전자이식 마우스를 생성하였다. 유전자 편집 기술을 사용하여 마우스 세포를 변형할 수 있다. 내인성 마우스 B2M 유전자 자리는 인간 B2M 단백질, 인간 HLA-A2.1 단백질의 일부, 및 마우스 H2-D1 단백질의 일부를 인코딩하는 서열로 녹인될 수 있으며, 이는 또한 마우스 B2M 유전자 코딩 영역을 파괴할 수 있다. 생성된 인간화 마우스는 생체 내에서 인간화 MHC 분자를 발현할 수 있고, 이는 인간 B2M 단백질; 인간 HLA-A2.1 단백질(NCBI 참조 서열: AAC24825.1, 서열번호 59)의 알파-1 및 알파-2 영역; 마우스 H2-D1 단백질의 알파-3 영역, 연결 펩티드, 막관통 영역, 및 세포질 영역을 포함한다. 인간 HLA-A2.1 단백질 부분은 마우스 H2-D1 단백질 부분에 직접 연결되고, 인간화 마우스는 내인성 B2M 단백질을 발현하지 않는다. 또한, 인간 HLA-A2.1 단백질의 정확한 발현을 보장하기 위해, 인간 HLA-A2.1 단백질의 신호 펩티드를 인코딩하는 서열도 인간 B2M 코딩 영역 앞에 삽입될 수 있다. 인간화 마우스 B2M 유전자 자리의 개략도는 도 8에 나타나 있다. 인간화 B2M, HLA-A2.1 및 H2-D1 유전자로부터 전사된 mRNA 서열은 서열번호 9에 나타나 있고, 인간화 B2M 유전자 자리의 DNA 서열(변형된 부분만)은 서열번호 10에 나타나 있다.

인간 B2M이 다수의 동형 단백질 또는 전사체를 갖는 것을 고려할 때, 본 명세서에 설명된 방법은 다른 동형 단백질 또는 전사체에 적용될 수 있다.

유전자 편집을 위해 CRISPR/Cas 시스템을 적용하였으며, 표적화 전략은 도 9에 나타나 있다. 마우스 B2M 유전자의 상류 및 하류에 상동 암 서열, 및 인간 B2M 단백질, 인간 HLA-A2.1 단백질의 일부 및 마우스 H2-D1 단백질의 일부를 인코딩하는 "A 단편"을 함유하는 표적화 벡터가 설계되었다. 상류 상동 암 서열(5' 상동 암, 서열번호 11)은 NCBI 참조 서열 NC_000068.7의 핵산 122146329-122147737과 동일하다. 하류 상동 암 서열(3' 상동 암, 서열번호 12)은 NCBI 참조 서열 NC_000068.7의 핵산 122152171-122153513과 동일하다. "A 단편"은, 인간 HLA-A2.1의 신호 펩티드; 인간 B2M; 가요성 링커 폴리펩티드 서열; 인간 HLA-A2.1 단백질의 일부; 및 마우스 H2-D1 단백질의 일부를 인코딩하는, 5' 말단에서 3' 말단까지의 서열을 함유한다. 구체적으로, 인간 HLA-A2.1의 신호 펩티드를 인코딩하는 서열(서열번호 13)은 GenBank 참조 서열 AF055066.1의 핵산 99567-99638과 동일하다. 인간 B2M을 인코딩하는 서열(서열번호 14)은 NCBI 참조 서열 NM_004048.3의 핵산 91-387과 동일하다. 가요성 링커 폴리펩티드 서열은 45 bp 서열 5' -GGAGGTGGCGGATCCGGCGGAGGCGGCTCGGGTGGCGGCGGCTCT-3'(서열번호 51)에 의해 인코딩되는 (GGGGS)₃(서열번호 67) 링커이다. 인간 HLA-A2.1 단백질의 일부는 GenBank 참조 서열 AF055066.1의 핵산 98606-99435와 동일한 서열(서열번호 15)에 의해 인코딩된다. 마우스 H2-D1 단백질의 일부는 NCBI 참조 서열 NC_000083.6의 핵산 35266871-35267765와 동일한 서열(서열번호 16)에 의해 인코딩된다. 유전자이식 마우스에서 발현되는 단백질은 서열번호 61에 나타나 있다. 그러나, 가요성 링커 폴리펩티드 서열의 존재로 인해, 단백질은 인간 B2M 및 HLA-A2.1 단백질의 기능적 도메인을 가질 수 있다.

표적화 벡터는 예를 들어 제한 효소 분해/결찰, 또는 유전자 합성에 의해 작제되었다. 작제된 표적화 벡터 서열은 사전에 제한 효소 분해에 의해 검증하고, 이어서 시퀀싱에 의해 검증하였다. 검증된 표적화 벡터는 후속 실험에 사용되었다.

표적 서열은 sgRNA의 표적화 특이성 및 Cas9-유도 절단의 효휼성에 중요하다. 5' 말단 표적화 부위(sgRNA1-sgRNA7) 및 3' 말단 표적화 부위(sgRNA8- sgRNA15)를 인식하는 특이적 sgRNA 서열을 설계 및 합성하였다. 5' 말단 표적화 부위는 마우스 B2M 유전자의 제1 엑손 또는 제1 인트론 내에 위치한다. 3' 말단 표적화 부위는 마우스 B2M 유전자의 제3 엑손 또는 제3 인트론 상에 위치한다. B2M 유전자 자리 상에서 각각의 sgRNA의 표적화 부위 서열은 하기와 같다:

sgRNA1 표적화 부위(서열번호 17): 5'-CCTGGCCAATCCCGTCGGGAAGG-3'

sgRNA2 표적화 부위(서열번호 18): 5'-CCGTCAGCACACTCGCAAACAGG-3'

sgRNA3 표적화 부위(서열번호 19): 5'- GTTCTCCTTCCCGACGGGATTGG-3'

sgRNA4 표적화 부위(서열번호 20): 5'-ACTCTGGATAGCATACAGGCCGG-3'

sgRNA5 표적화 부위(서열번호 21): 5'-CTGGTGCTTGTCTCACTGACCGG-3'

sgRNA6 표적화 부위(서열번호 22): 5'-GGGGAAAGAGGCACTCACTCTGG-3'

sgRNA7 표적화 부위(서열번호 23): 5'-GACAAGCACCAGAAAGACCAGGG-3'

sgRNA8 표적화 부위(서열번호 24): 5'-CTGGAGGCTTCCGGACACTCAGG-3'

sgRNA9 표적화 부위(서열번호 25): 5'-TGATCAAGCATCATGATGGTAGG-3'

sgRNA10 표적화 부위(서열번호 26): 5'-AGGAGCGTGAGAGGGAACGTGGG-3'

sgRNA11 표적화 부위(서열번호 27): 5'-GAGGAACGTAGCCATGTCACTGG-3'

sgRNA12 표적화 부위(서열번호 28): 5'-CATGTCACTGGCCCTCTAAAGGG-3'

sgRNA13 표적화 부위(서열번호 29): 5'-CATGTGATCAAGCATCATGATGG-3'

sgRNA14 표적화 부위(서열번호 30): 5'-ACCCGCAGAGCTCTGTCACTCGG-3'

sgRNA15 표적화 부위(서열번호 31): 5'-CTCTGTCACTCGGCTCCTCTGGG-3'

UCA 키트를 사용하여 sgRNA의 활성을 검출하였다. 결과는 sgRNA가 상이한 활성을 가짐을 보여주었다. 결과는 표 5 및 도 10A 및 도 10B에 나타나 있다. 후속 실험을 위해 sgRNA3 및 sgRNA14를 선택하였다. 올리고뉴클레오티드를 5' 말단 및 상보성 가닥에 첨가하여 정방향 올리고뉴클레오티드 및 역방향 올리고뉴클레오티드를 수득하였다(서열은 표 6 참조). 어닐링 후, 생성물은 각각 pT7-sgRNA 플라스미드(플라스미드는 먼저 BbsI로 선형화됨)에 결찰되어 발현 벡터 PT7-B2M-HLA-A2.1-3 및 pT7-B2M-HLA-A2.1-14를 수득하였다.

sgRNA 활성을 보여주는 UCA 시험 결과

5' 말단 표적화 부위 검출 결과		3' 말단 표적화 부위 검출 결과
Con.	1.00±0.06	Con.	1.00±0.03
PC	73.04±1.51	PC	55.01±2.95
sgRNA1	99.08±5.37	sgRNA8	143.48±8.70
sgRNA2	18.89±9.70	sgRNA9	41.19±2.51
sgRNA3	118.85±5.15	sgRNA10	120.32±7.44
sgRNA4	64.87±5.75	sgRNA11	75.28±6.24
sgRNA5	49.91±3.03	sgRNA12	41.31±1.12
sgRNA6	53.58±3.78	sgRNA13	44.85±2.75
sgRNA7	71.85±2.74	sgRNA14	122.80±9.26
		sgRNA15	15.83±0.39

sgRNA3 및 sgRNA14 서열 목록

sgRNA3 서열
서열번호 32	상류: 5'-GTTCTCCTTCCCGACGGGAT-3'
서열번호 33(정방향 올리고뉴클레오티드)	상류: 5'-TAGGTTCTCCTTCCCGACGGGAT-3'
서열번호 34	하류: 5'-ATCCCGTCGGGAAGGAGAA-3'
서열번호 35(역방향 올리고뉴클레오티드)	하류: 5'-AAACATCCCGTCGGGAAGGAGAA-3'
sgRNA 14 서열
서열번호 36	상류: 5'-ACCCGCAGAGCTCTGTCACT-3'
서열번호 37(정방향 올리고뉴클레오티드)	상류: 5'-TAGGACCCGCAGAGCTCTGTCACT-3'
서열번호 38	하류: 5'-AGTGACAGACTCTGCGGGT-3'
서열번호 39(역방향 올리고뉴클레오티드)	하류: 5'-AAACAGTGACAGACTCTGCGGGT-3'

pT7-sgRNA 벡터가 합성되었으며, 이는 T7 프로모터 및 sgRNA 스캐폴드(서열번호 40)를 함유하는 DNA 단편을 포함하였고, 제한 효소 분해(EcoRI 및 BamHI) 후, 백본 벡터(Takara, 카탈로그 번호: 3299)에 결찰되었다. 생성된 플라스미드는 시퀀싱에 의해 확인되었다.

사전혼합된 Cas9 mRNA, 표적화 벡터, pT7-B2M-HLA-A2.1-3 및 pT7-B2M-HLA-A2.1-14 플라스미드의 시험관 내 전사 생성물(제품 설명에 제공된 방법에 따라 전사를 수행하기 위해 Ambion 시험관 내 전사 키트를 사용함)을, 마이크로주입 기기를 사용하여 C57BL/6 마우스 수정란의 세포질 또는 핵 내로 주입하였다. 배아 마이크로주입은, 예를 들어 문헌[A. Nagy, et al., "Manipulating the Mouse Embryo: A Laboratory Manual (Third Edition)," Cold Spring Harbor Laboratory Press, 2003]에 설명된 방법에 따라 수행하였다. 이어서 주입된 수정란을 배양 배지로 옮겨 단기간 배양하고, 이어서 수용자 마우스의 수란관 내로 이식하여 유전자 변형된 마우스(F0 세대)를 생성하였다. 마우스 개체군을 인간 또는 인간화 B2M 및 HLA-A2.1 유전자를 갖는 안정한 마우스 주를 확립하기 위해 이종교배 및 자가번식에 의해 추가로 확장시켰다.

F0 세대 마우스의 체세포 유전자형을 확인하기 위해 실험을 수행하였다. 예를 들어, F0 세대 마우스의 마우스 꼬리 유전체 DNA를 사용하여 PCR 분석을 수행하였다. 일부 F0 마우스에 대한 PCR 분석 결과가 도 11A 및 도 11B에 나타나 있다. 5' 말단 프라이머 검출 결과 및 3' 말단 프라이머 검출 결과를 보면, F0-01부터 F0-10까지 번호가 매겨진 10마리의 마우스가 모두 양성 마우스였다.

PCR에 사용된 프라이머는 하기와 같다:

5' 말단 프라이머:

L-GT-F(서열번호 41): 5'-GAATGTGTGCCTCCTCTCAGTTTCC-3'

L-GT-R(서열번호 42): 5'-TCCTTCCCGTTCTCCAGGTATCTGC-3'

3' 말단 프라이머:

R-GT-F(서열번호 43): 5'-GCGGCTACTACAACCAGAGCGAG-3'

R-GT-R(서열번호 44): 5'-TCCAGCAATAAGAACCAGTCCCTAGCT-3'

프라이머 L-GT-F는 5' 상동 암의 좌측에 위치한다. R-GT-R은 3' 상동 암의 우측에 위치한다. L-GT-R 및 R-GT-F 모두 인간 서열에 위치한다.

양성 F0 세대 MHC 인간화 마우스는 F1 세대 마우스를 생성하기 위해 야생형 마우스와 교배되었다. 동일한 방법(예를 들어, PCR)을 F1 세대 마우스의 유전자형 식별을 위해 사용하였다. 도 12A 및 도 12B에 나타낸 바와 같이, F1-01, F1-02, F1-03, F1-04, F1-05, F1-06, 및 F1-07로 번호가 매겨진 7마리의 마우스가 양성 마우스로서 식별되었다. 무작위 삽입이 도입되었는지의 여부를 확인하기 위해 7마리의 양성 F1 세대 마우스를 서던 블롯에 의해 추가로 분석하였다. 구체적으로, 마우스 꼬리 유전체 DNA를 추출하고, BamHI 또는 BglII 제한 효소로 분해하고, 막으로 옮기고, 이어서 프로브와 혼성화시켰다. 프로브 P1 및 P2는 각각 5' 상동 암의 상류 영역 및 3' 상동 암에 위치한다. 서던 블롯 분석에 사용된 프로브가 아래 표에 나열되어 있다.

제한 효소	프로브	WT 크기	목표 크기
BamHI	P1	9.7 kb	5.9 kb
BglII	P2	4.0 kb	2.9 kb

프로브는 하기 프라이머들을 사용하여 합성되었다:

P1-F(서열번호 45): 5'-ATGAGGTCTTTTTGTGGGCAGAGCA-3'

P1-R(서열번호 46): 5'-CTCCCTACGGCCACATCACCATTAC-3'

P2-F(서열번호 47): 5'-TAACTTCATGTAAGGCACCGTCAC-3'

P2-R(서열번호 48): 5'-TCCAGACCTCACCATCAAATGAG-3'

서던 블롯의 검출 결과가 도 13에 나타나 있다. P1 및 P2 프로브에 의한 혼성화 결과를 보면, 7마리의 F1 세대 마우스가 양성 이형접합체인 것으로 확인되었으며 무작위 삽입은 검출되지 않았다. 이는 상기 설명된 방법을 사용하여 무작위 삽입 없이 안정적으로 계대배양될 수 있는 유전자 변형된 MHC 유전자 인간화 마우스를 생성할 수 있음을 나타낸다.

F1 세대에서 양성으로 확인된 이형접합 마우스는 F2 세대 MHC 인간화 동형접합 마우스(H/H)를 수득하기 위해 서로 교배될 수 있다.

양성 마우스에서 인간 B2M 단백질 및 HLA-A2.1 단백질의 발현을 ELISA에 의해 확인하였다. 구체적으로, 본 명세서에 설명된 방법에 의해 제조된 야생형 C57BL/6 암컷 마우스(6주령) 1마리 및 MHC 인간화 암컷 동형접합 마우스(6주령) 1마리를 선택하고, 각각의 마우스에 7.5 ㎍(부피: 200 ㎕) 항-마우스 CD3 항체를 복강내 주입하였다. 24시간 후, 마우스를 희생시키고, 이어서 비장 세포를 수집하였다. 항-마우스 B2M 항체 mβ2M PE, 항-마우스 H-2Kb/H-2Db 항체, 항-인간 B2M 항체 hβ2M PE, 또는 항-인간 HLA-A2 항체 hHLA-A2 PE를 항-마우스 CD45 항체 mCD45 APC와 함께 비장 세포 염색에 사용하였다. 염색된 세포를 유세포 분석하여 결과를 도 14의 A 내지 도 14의 P에 나타내었다. 세포가 항-마우스 CD3 항체에 의해 자극되었는지의 여부에 관계없이, C57BL/6 마우스에서는 마우스 B2M-발현 세포만이 검출되었고(도 14의 A 및 도 14의 C), 인간 또는 인간화 B2M-발현 세포는 C57BL/6 마우스에서 검출되지 않았다(도 14의 E 및 도 14의 G). 인간 B2M을 발현하는 세포(도 14의 F 및 도 14의 H), 및 HLA-A2.1을 발현하는 세포(도 14의 N 및 도 14의 P)는 MHC 인간화 동형접합 마우스에서만 검출되었다. 그러나, 마우스 B2M을 발현하는 세포들은 MHC 인간화 동형접합 마우스에서 검출되지 않았다(도 14의 B 및 도 14의 D). 추가적으로, 마우스 H2-D1 코딩 서열은 녹아웃되지 않았기 때문에, MHC 인간화 동형접합 마우스에서 마우스 H2-D1을 발현하는 세포가 소수 검출되었다(도 14의 G 및 도 14의 L).

F2 세대 MHC 인간화 동형접합 마우스에서 B 세포 및 T 세포의 분화가 야생형 마우스의 분화와 일치하는지의 여부를 확인하기 위해, 마우스 림프구 하위세트를 유세포 분석에 의해 분석하였다. 구체적으로, 야생형 C57BL/6 수컷 마우스(16주령) 1마리 및 MHC 인간화 동형접합 수컷 마우스(13주령) 1마리를 각각 선택하였다. 비장 세포를 수집하고, 항-마우스 CD45 항체 mCD45 APC를 세포 염색 및 유세포 분석 검출에 사용하였다. 도 15A 및 도 15B에 나타낸 바와 같이, 야생형 C57BL/6 마우스 및 MHC 인간화 동형접합 마우스에서 백혈구의 비는 각각 88.6% 및 96.5%이었다. 이어서, 마우스 T 세포 표면 항체 mTCRB-APC-Cy7 및 항-마우스 CD 19 항체 mCD19-PE를 사용하여 유세포 분석을 위해 T 세포 및 B 세포를 각각 염색하였다. 결과는 야생형 C57BL/6 마우스에서 T 세포 및 B 세포가 각각 23.8% 및 61.4%인 것으로 나타났으며(도 15C); 한편 인간화 MHC 동형접합 마우스에서 T 세포 및 B 세포는 각각 27.7% 및 61.8%이었다(도 15D). 또한, 항-마우스 CD4 항체 mCD4-BV421 및 항-마우스 mCD8a 항체 mCD8a-BV711을 세포 염색을 위해 사용하였고, 염색된 세포를 유세포 분석하였다. 도 15E 및 도 15F에 나타낸 것과 같이, 야생형 C57BL/6 마우스 및 MHC 인간화 동형접합 마우스에서 CD4+ T 세포 및 CD8+ T 세포의 비는 비슷하였다.

요약하면, 상기 결과는 MHC 인간화 마우스에서 림프구 하위세트의 발현이 야생형 C57BL/6 마우스의 발현과 유사함을 보여주었다. 또한, 결과는 MHC 인간화 마우스에서 T 세포 및 B 세포의 분화가 B2M 및 HLA-A2.1 유전자의 인간화에 의해 영향을 받지 않음을 나타내었다.

Cas9의 절단은 DNA 이중 가닥 파손을 생성하고, 상동 재조합 수선은 삽입/결실 돌연변이를 생성할 수 있기 때문에, 본 명세서에 설명된 방법을 사용하여 B2M 유전자 녹아웃 마우스를 수득하는 것이 가능하다. 유전자 녹아웃 마우스를 검출하기 위해 한 쌍의 프라이머를 설계하였다. 야생형 마우스는 PCR 밴드를 가지지 않아야 하고, 녹아웃 마우스는 약 682 bp에 하나의 PCR 밴드를 가져야 한다. 도 16에 나타낸 바와 같이, 1~10으로 번호가 매겨진 마우스는 B2M 유전자 녹아웃 마우스로서 확인되었다. 하나의 PCR 프라이머는 5' 표적화 부위의 좌측에 위치하고, 다른 PCR 프라이머는 3' 표적화 부위의 우측에 위치하였다. 프라이머들은 하기에 나타나 있다:

서열번호 49: 5'-GAATAAATGAAGGCGGTCCCAGGCT-3'

서열번호 50: 5'-AGGTGAGTTCTGGCTCCACCATTTG-3'

실시예 2. 중증 면역결핍증을 갖는 MHC 인간화 마우스

실시예 1에 설명된 바와 같은 인간화 전략에 추가하여, MHC 분자의 인간화 수준이 더 높은 마우스를 또한 설계할 수 있다. 또한, 인간화 MHC 분자를 갖는 면역결핍 마우스는 당뇨병 및 이식 거부반응과 같은 면역계 질병의 발병 메커니즘 및 약물 개발의 연구를 위한 효과적인 실험 동물 모델을 제공하도록 설계할 수 있다. 이러한 예에서, B-NDG 백그라운드 마우스를 사용하여 MHC 분자의 더 높은 수준의 인간화를 수행하였다. 구체적으로, 유전자 편집 기술을 사용하여 B-NDG 마우스를 변형하였다. 내인성 마우스 B2M 유전자 자리는 인간 B2M 단백질 및 HLA-A2.1 단백질을 인코딩하는 서열로 녹인되었으며, 이는 또한 마우스 B2M 유전자 코딩 영역을 파괴하였다. 생성된 인간화 마우스는 인간 B2M 단백질 및 인간 HLA-A2.1 단백질을 함유하는 인간화 MHC 분자를 생체 내에서 발현할 수 있다. 인간화 마우스는 내인성 B2M 단백질을 발현하지 않았다. 또한, 인간 HLA-A2.1 단백질의 정확한 발현을 보장하기 위해, 인간 B2M 코딩 영역 앞에 인간 HLA-A2.1 단백질의 신호 펩티드를 인코딩하는 서열을 삽입하였다. 인간화 마우스 B2M 유전자 자리의 개략도가 도 17에 나타나 있다. 인간화 B2M 및 HLA-A2.1 유전자로부터 전사된 mRNA 서열은 서열번호 52에 나타나 있다. 유전자이식 마우스에 의해 발현되는 단백질은 서열번호 62에 나타나 있다. 그러나, 가요성 링커 폴리펩티드 서열의 존재로 인해, 단백질은 인간 B2M 단백질 및 인간 HLA-A2.1 단백질의 기능성 도메인들을 가질 수 있다.

인간 B2M 유전자가 다수의 동형 단백질 또는 전사체를 갖는 것을 고려할 때, 본 명세서에 설명된 방법은 기타 동형 단백질 또는 전사체에 적용될 수 있다.

또한, 표적화 전략의 개략도가 도 18에 나타나 있다. 표적화 벡터는, 5' 상동 암(서열번호 60)이 위치 122147015(G에서 T로), 위치 122147108(C에서 T로), 및 위치 122147591(C에서 T로)에 돌연변이를 갖고, NCBI 참조 번호 NC_000068.7의 핵산 122146329-122147737과 99%의 상동성을 가지는 점; 3' 상동 암(서열번호 53)이 위치 122152258(G에서 A로), 위치 122152391(G에서 A로), 위치 122152771(A에서 G로), 위치 122153104(T에서 C로), 및 위치 122153148(A에서 C로)에 돌연변이를 갖고, NCBI 참조 번호 NC_000068.7의 핵산 122152171-122153513과 99%의 상동성을 가지는 점; 및 위치 122152788에서의 결실(A의 결실)을 제외하고는 실시예 1에 사용된 표적화 벡터와 유사하다. BNDG-A 단편(서열번호 65)은 실시예 1의 "A 단편"과 유사하지만, 전장 인간 HLA-A2.1 단백질을 인코딩하는 서열을 함유한다. 전장 인간 HLA-A2.1 단백질을 인코딩하는 서열(서열번호 54)은 GenBank 참조 서열 AF055066.1의 핵산 95493-99436과 동일하다. BNDG-A 단편은 마우스 H2-D1 단백질을 인코딩하는 임의의 서열을 함유하지 않는다.

표적화 벡터는 예를 들어, 제한 효소 분해/결찰, 또는 유전자 합성에 의해 작제되었다. 작제된 표적화 벡터 서열은 제한 효소 분해에 의해 사전에 검증하고, 이어서 시퀀싱에 의해 검증하였다. 검증된 표적화 벡터를 후속 실험(예를 들어, 마이크로주입)에 사용하였다. 사용된 sgRNA는 실시예 1에 사용된 sgRNA와 동일하였다.

구체적으로, 사전혼합된 Cas9 mRNA, 표적화 벡터, pT7-B2M-HLA-A2.1-3 및 pT7-B2M-HLA-A2.1-14 플라스미드의 시험관 내 전사 생성물(제품 설명에 제공된 방법에 따라 전사를 수행하기 위해 Ambion 시험관 내 전사 키트를 사용함)을, 마이크로주입 기기를 사용하여 B-NDG 마우스 수정란의 세포질 또는 핵 내로 주입하였다. 배아 마이크로주입은, 예를 들어 문헌[A. Nagy, et al., "Manipulating the Mounse Embryo: A Laboratory Manual (Third Edition)," Cold Spring Harbor Laboratory Press, 2003]에 설명된 방법에 따라 수행하였다. 이어서 주입된 수정란을 배양 배지로 옮겨 단기간 배양하고, 이어서 수용자 마우스의 수란관 내로 이식하여 유전자 변형된 마우스(F0 세대)를 생산하였다. 마우스 개체군을 인간 B2M 및 HLA-A2.1 유전자를 갖는 안정적인 B-NDG 백그라운드 마우스 주를 확립하기 위해 이종교배 및 자가번식에 의해 추가로 확장시켰다.

B-NDG 백그라운드를 갖는 F0 세대 마우스의 체세포 유전자형을 확인하기 위한 실험을 수행하였다. 예를 들어, F0 세대 마우스의 마우스 꼬리 유전체 DNA를 사용하여 PCR 분석을 수행하였다. 일부 F0 마우스에 대한 PCR 분석 결과가 도 19A 및 도 19B에 나타나 있다. 5' 말단 프라이머 검출 결과 및 3' 말단 프라이머 검출 결과를 보면, BNDG-F0-01부터 BNDG-F0-06까지 번호가 매겨진 6마리의 마우스는 모두 양성 마우스였다.

PCR에 하기 프라이머들이 사용되었다:

5' 말단 프라이머:

L-GT-F(서열번호 41): 5'-GAATGTGTGCCTCCTCTCAGTTTCC-3'

BNDG-L-GT-R(서열번호 55): 5'-CAGCTCCAAAGAGAACCAGGCCAG-3'

3' 말단 프라이머:

BNDG-R-GT-F(서열번호 56): 5'-TACCCTGCGGAGATCACACTGACC-3'

R-GT-R(서열번호 44): 5'-TCCAGCAATAAGAACCAGTCCCTAGCT-3'

양성 F0 세대 MHC 인간화 마우스는 F1 세대 마우스를 생성하기 위해 야생형 마우스와 교배되었다. F1 세대 마우스의 유전자형 식별을 위해 동일한 방법(예를 들어, PCR)을 사용하였다. 도 20A 및 도 20B에 나타낸 바와 같이, BNDG-F1-01 및 BNDG-F1-02로 번호가 매겨진 2마리의 마우스가 양성 마우스로 확인되었다. 무작위 삽입이 도입되었는지의 여부를 확인하기 위해 2마리의 양성 F1 세대 마우스를 서던 블롯에 의해 추가로 분석하였다. 구체적으로, 마우스 꼬리 유전체 DNA를 추출하고, EcoNI 또는 SspI 제한 효소로 분해시키고, 막으로 옮기고, 이어서 프로브를 사용하여 혼성화하였다. 프로브 BNDG-P1 및 BNDG-P2는 각각 5' 상동 암의 상류 영역 및 3' 상동 암에 위치한다. 서던 블롯 분석에 사용된 프로브가 아래 표에 나열되어 있다.

제한 효소	프로브	WT 크기	목표 크기
EcoNI	BNDG-P1	8.8 kb	5.3 kb
SspI	BNDG-P2	12.1 kb	7.6 kb

프로브는 하기 프라이머들을 사용하여 합성되었다:

BNDG-P1-F(서열번호 57): 5'-TTCTGATGCTCCTTCCTTCCGTGC-3'

BNDG-P1-R(서열번호 58): 5'-TTCTCTGTGCTCAGTGTTCCCTGC-3'

BNDG-P2-F(서열번호 47): 5'-TAACTTCATGTAAGGCACCGTCAC-3'

BNDG-P2-R(서열번호 48): 5'-TCCAGACCTCACCATCAAATGAG-3'

서던 블롯 검출 결과는 도 21에 나타나 있다. BNDG-P1 및 BNDG-P2 프로브에 의한 혼성화 결과를 보면, BNDG-F1-01 및 BNDG-F1-02로 번호가 매겨진 2마리의 F1 세대 마우스가 양성 이형접합체인 것으로 확인되었고, 무작위 삽입은 검출되지 않았다. 이는 상기 설명된 방법을 사용하여 무작위 삽입물 없이 안정적으로 계대배양될 수 있는 B-NDG 백그라운드를 가진 유전자 변형된 MHC 유전자 인간화 마우스를 생성할 수 있음을 나타낸다.

(B-NDG 백그라운드를 갖는) 양성 마우스에서 인간 B2M 단백질 및 HLA-A2.1 단백질의 발현을 유세포 분석에 의해 확인하였다. 구체적으로, 본 명세서에 설명된 방법에 의해 제조된 B-NDG 암컷 마우스(6주령) 1마리 및 MHC 인간화 이형접합 암컷 마우스(6주령) 1마리를 희생시키고, 이어서 비장 세포를 수집하였다. 항-마우스 B2M 항체 mβ2M PE, 항-마우스 H-2Kb/H-2Db 항체, 항-인간 B2M 항체 hβ2M PE, 또는 항-인간 HLA-A2 항체 hHLA-A2 PE를, 항-마우스 CD45 항체 mCD45 APC와 함께 비장 세포 염색에 사용하였다. 염색된 세포들을 유세포 분석하여 결과를 도 22의 A 내지 도 22의 H에 나타내었다. 결과는 B-NDG 마우스 및 B-NDG 백그라운드 MHC 인간화 이형접합 마우스에서, 마우스 B2M을 발현하는 세포(도 22의 A 및 도 22의 B) 및 마우스 H2-D1을 발현하는 세포(도 22의 E 및 도 22의 F)가 검출되었음을 보여준다. 그러나, 인간 B2M 단백질을 발현하는 세포(도 22의 D) 및 인간 HLA-A2 단백질을 발현하는 세포(도 22의 H)는 B-NDG 백그라운드를 갖는 인간화 MHC 마우스에서만 발견되었다. 인간 B2M 단백질을 발현하는 세포(도 22의 C) 및 인간 HLA-A2 단백질을 발현하는 세포(도 22의 G)는 B-NDG 마우스에서 검출되지 않았다.

실시예 3. 배아줄기세포 기반 방법

비-인간 포유동물은 또한 배아줄기세포(ES)에 기반한 유전자 상동 재조합 기술, 징크 핑거 뉴클레아제(ZFN) 기술, 전사 활성화제-유사 이펙터 인자 뉴클레아제(TALEN) 기술, 호밍(homing) 엔도뉴클레아제(메가케이블 염기 리보자임) 또는 기타 분자 생물학 기술을 포함하지만 이에 제한되지 않는 기타 유전자 편집 시스템 및 접근법을 통해 제조될 수 있다. 이 실시예에서는 기타 다른 방법에 의해 MHC 인간화 마우스를 수득하는 방법을 설명하기 위한 예로서 통상의 ES 세포 유전자 상동 재조합 기술이 사용된다.

본 명세서에 설명된 방법의 유전자 편집 전략 및 MHC 인간화 마우스에서 변형된 B2M 유전자 자리(도 8 및 도 9)에 따라, 표적화 전략은 상이한 표적화 벡터로 설계될 수 있다. 목적 중 하나가 마우스 B2M 유전자 코딩 영역의 코딩 영역을 파괴하고, 인간 B2M 단백질을 인코딩하는 핵산 서열, 인간 HLA-A2.1 단백질의 일부 및 마우스 H2-D1 단백질의 일부를 마우스 B2M 유전자 자리에서 녹인하는 것이라는 점을 고려하여, 5' 상동 암, 3' 상동 암, 및 인간화 유전자 단편을 함유하는 표적화 벡터가 설계된다. 벡터는 또한 네오마이신 포스포트랜스퍼라제 코딩 서열 Neo와 같은 양성 클론 스크리닝을 위한 내성 유전자를 함유할 수 있다. 내성 유전자의 양쪽에, 동일 배향의 두 부위 특이적 재조합 시스템, 예컨대 Frt 또는 LoxP가 첨가될 수 있다. 또한, 디프테리아 독소 A 서브유닛 코딩 유전자(DTA)와 같은 음성 스크리닝 마커를 갖는 코딩 유전자가 재조합 벡터 3' 상동 암의 하류에 작제될 수 있다. 벡터 작제는 당업계에 알려진 방법, 예컨대 제한 효소 분해 및 결찰을 사용하여 수행될 수 있다. 이어서 올바른 서열을 갖는 재조합 벡터를 마우스 배아줄기세포 내로 형질감염시킬 수 있고, 이어서 재조합 벡터를 양성 클론 스크리닝 유전자에 의해 스크리닝할 수 있다. 다음으로 재조합 벡터로 형질감염된 세포는 양성 클론 마커 유전자를 사용하여 스크리닝되며, 서던 블롯을 DNA 재조합 식별에 사용할 수 있다. 선택된 올바른 양성 클론의 경우, 양성 클론 세포(흑색 마우스)를 도서[A. Nagy, et al., "Manipulating the Mouse Embryo: A Laboratory Manual (Third Edition)," Cold Spring Harbor Laboratory Press, 2003]에 설명된 방법에 따라 마이크로주입에 의해 분리된 배반포(백색 마우스) 내로 주입한다. 주입 후 형성된 결과의 키메라 배반포를 배양 배지로 옮겨 단기간 배양하고, 이어서 수용자 마우스(백색 마우스)의 나팔관 내로 이식하여 F0 세대 키메라 마우스(흑색 및 백색)를 생성한다. 이어서 올바른 유전자 재조합을 갖는 F0 세대 키메라 마우스는 후속 교배 및 식별을 위해 마우스 꼬리 유전체 DNA의 추출 및 PCR 분석에 의해 선택된다. F1 세대 마우스는, F0 세대 키메라 마우스를 야생형 마우스와 교배하여 수득한다. 꼬리 유전체 DNA 추출 및 PCR 분석에 의해, 안정적으로 전달될 수 있는 양성 F1 세대 이형접합 마우스가 선택된다. 다음으로, F1 이형접합 마우스를 서로 교배하여 유전자 재조합 양성 F2 세대 동형접합 마우스를 수득한다. 추가적으로, F1 이형접합 마우스를 Flp 또는 Cre 마우스와 교배하여 양성 클론 스크리닝 마커 유전자(Neo 등)를 제거할 수 있고, 이어서 이들 마우스를 서로 교배하여 인간화 동형접합 마우스를 수득할 수도 있다. 수득된 F1 이형접합 마우스 또는 F2 동형접합 마우스의 유전자형 및 표현형 검출 방법은 상기 설명된 실시예에서 사용한 것과 유사하다.

기타 구현예

본 발명은 발명의 상세한 설명과 함께 설명되었지만, 상기 설명은 첨부된 청구범위에 의해 정의되는 본 발명의 범위를 설명하기 위한 것이며 제한하지 않는 것으로 이해되어야 한다. 기타 양태, 이점, 및 변형은 하기 청구범위 내에 속한다.

SEQUENCE LISTING <110> Beijing Biocytogen Co., Ltd. <120> GENETICALLY MODIFIED NON-HUMAN ANIMAL WITH HUMAN OR CHIMERIC MHC PROTEIN COMPLEX <130> 1 <160> 68 <170> PatentIn version 3.5 <210> 1 <211> 858 <212> DNA <213> Mus musculus <400> 1 tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggctcgc 60 tcggtgaccc tggtctttct ggtgcttgtc tcactgaccg gcctgtatgc tatccagaaa 120 acccctcaaa ttcaagtata ctcacgccac ccaccggaga atgggaagcc gaacatactg 180 aactgctacg taacacagtt ccacccgcct cacattgaaa tccaaatgct gaagaacggg 240 aaaaaaattc ctaaagtaga gatgtcagat atgtccttca gcaaggactg gtctttctat 300 atcctggctc acactgaatt cacccccact gagactgata catacgcctg cagagttaag 360 catgccagta tggccgagcc caagaccgtc tactgggatc gagacatgtg atcaagcatc 420 atgatgctct gaagattcat ttgaacctgc ttaattacaa atccagtttc taatatgcta 480 tacaatttat gcacgcagaa agaaatagca atgtacacat caccttcttt atatcttact 540 ttaaatattt tatgcatgtt ttcaaaaaat tggaaatatc ctagatagct gagcaataaa 600 tcttcaataa gtattttgat cagaataata aatataattt taagaacaat agttgatcat 660 atgccaaacc ctctgtactt ctcattactt ggatgcagtt actcatcttt ggtctatcac 720 aacataagtg acatactttc cttttggtaa agcaaagagg cctaattgaa gtctgtcact 780 gtgcccaatg cttagcaatt ctcaccccca accctgtggc tacttctgct tttgttactt 840 ttactaaaaa taaaaaac 858 <210> 2 <211> 119 <212> PRT <213> Mus musculus <400> 2 Met Ala Arg Ser Val Thr Leu Val Phe Leu Val Leu Val Ser Leu Thr 1 5 10 15 Gly Leu Tyr Ala Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg 20 25 30 His Pro Pro Glu Asn Gly Lys Pro Asn Ile Leu Asn Cys Tyr Val Thr 35 40 45 Gln Phe His Pro Pro His Ile Glu Ile Gln Met Leu Lys Asn Gly Lys 50 55 60 Lys Ile Pro Lys Val Glu Met Ser Asp Met Ser Phe Ser Lys Asp Trp 65 70 75 80 Ser Phe Tyr Ile Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp 85 90 95 Thr Tyr Ala Cys Arg Val Lys His Ala Ser Met Ala Glu Pro Lys Thr 100 105 110 Val Tyr Trp Asp Arg Asp Met 115 <210> 3 <211> 1675 <212> DNA <213> Homo sapiens <400> 3 attcctgaag ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc 60 gcgctactct ctctttctgg cctggaggct atccagcgta ctccaaagat tcaggtttac 120 tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 180 catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 240 cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 300 acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 360 aagatagtta agtgggatcg agacatgtaa gcagcatcat ggaggtttga agatgccgca 420 tttggattgg atgaattcca aattctgctt gcttgctttt taatattgat atgcttatac 480 acttacactt tatgcacaaa atgtagggtt ataataatgt taacatggac atgatcttct 540 ttataattct actttgagtg ctgtctccat gtttgatgta tctgagcagg ttgctccaca 600 ggtagctcta ggagggctgg caacttagag gtggggagca gagaattctc ttatccaaca 660 tcaacatctt ggtcagattt gaactcttca atctcttgca ctcaaagctt gttaagatag 720 ttaagcgtgc ataagttaac ttccaattta catactctgc ttagaatttg ggggaaaatt 780 tagaaatata attgacagga ttattggaaa tttgttataa tgaatgaaac attttgtcat 840 ataagattca tatttacttc ttatacattt gataaagtaa ggcatggttg tggttaatct 900 ggtttatttt tgttccacaa gttaaataaa tcataaaact tgatgtgtta tctcttatat 960 ctcactccca ctattacccc tttattttca aacagggaaa cagtcttcaa gttccacttg 1020 gtaaaaaatg tgaacccctt gtatatagag tttggctcac agtgtaaagg gcctcagtga 1080 ttcacatttt ccagattagg aatctgatgc tcaaagaagt taaatggcat agttggggtg 1140 acacagctgt ctagtgggag gccagccttc tatattttag ccagcgttct ttcctgcggg 1200 ccaggtcatg aggagtatgc agactctaag agggagcaaa agtatctgaa ggatttaata 1260 ttttagcaag gaatagatat acaatcatcc cttggtctcc ctgggggatt ggtttcagga 1320 ccccttcttg gacaccaaat ctatggatat ttaagtccct tctataaaat ggtatagtat 1380 ttgcatataa cctatccaca tcctcctgta tactttaaat catttctaga ttacttgtaa 1440 tacctaatac aatgtaaatg ctatgcaaat agttgttatt gtttaaggaa taatgacaag 1500 aaaaaaaagt ctgtacatgc tcagtaaaga cacaaccatc cctttttttc cccagtgttt 1560 ttgatccatg gtttgctgaa tccacagatg tggagcccct ggatacggaa ggcccgctgt 1620 actttgaatg acaaataaca gatttaaaat tttcaaggca tagttttata cctga 1675 <210> 4 <211> 119 <212> PRT <213> Homo sapiens <400> 4 Met Ser Arg Ser Val Ala Leu Ala Val Leu Ala Leu Leu Ser Leu Ser 1 5 10 15 Gly Leu Glu Ala Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg 20 25 30 His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser 35 40 45 Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu 50 55 60 Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp 65 70 75 80 Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp 85 90 95 Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile 100 105 110 Val Lys Trp Asp Arg Asp Met 115 <210> 5 <211> 1736 <212> DNA <213> Mus musculus <400> 5 tcagacaccc gggatcccag atgggggcga tggctccgcg cacgctgctc ctgctgctgg 60 cggccgccct ggccccgact cagacccgcg cgggcccaca ctcgatgcgg tatttcgaga 120 ccgccgtgtc ccggcccggc ctcgaggagc cccggtacat ctctgtcggc tatgtggaca 180 acaaggagtt cgtgcgcttc gacagcgacg cggagaatcc gagatatgag ccgcgggcgc 240 cgtggatgga gcaggagggg ccggagtatt gggagcggga aacacagaaa gccaagggcc 300 aagagcagtg gttccgagtg agcctgagga acctgctcgg ctactacaac cagagcgcgg 360 gcggctctca cacactccag cagatgtctg gctgtgactt ggggtcggac tggcgcctcc 420 tccgcgggta cctgcagttc gcctatgaag gccgcgatta catcgccctg aacgaagacc 480 tgaaaacgtg gacggcggcg gacatggcgg cgcagatcac ccgacgcaag tgggagcaga 540 gtggtgctgc agagcattac aaggcctacc tggagggcga gtgcgtggag tggctccaca 600 gatacctgaa gaacgggaac gcgacgctgc tgcgcacaga ttccccaaag gcacatgtga 660 cccatcaccc cagatctaaa ggtgaagtca ccctgaggtg ctgggccctg ggcttctacc 720 ctgctgacat caccctgacc tggcagttga atggggagga gctgacccag gacatggagc 780 ttgtggagac caggcctgca ggggatggaa ccttccagaa gtgggcatct gtggtggtgc 840 ctcttgggaa ggagcagaat tacacatgcc gtgtgtacca tgaggggctg cctgagcccc 900 tcaccctgag atgggagcct cctccgtcca ctgactctta catggtgatc gttgctgttc 960 tgggtgtcct tggagctatg gccatcattg gagctgtggt ggcttttgtg atgaagagaa 1020 ggagaaacac aggtggaaaa ggaggggact atgctctggc tccaggctcc cagagctctg 1080 aaatgtctct ccgagattgt aaagcgtgaa gacagctgcc tggactgtac tgagtgacag 1140 acgatgtgtt caggtctctc ctgtgacatc cagagccctc agttctcttt acacaacatt 1200 gtctgatgtt ccctgtgagc ttgggttcag tgtgaagaac tgtggagccc agcctgccct 1260 gcacaccagg accctatccc tgcactgccc tgtgttccct tccatagcca accttgctgc 1320 tccagccaaa cactggggga catctgcatc ctgtaagctc catgctaccc tgagctgcag 1380 ctcctcactt ccacactgag aataataatt tgaatgtggg tggctggaga gatggctcag 1440 cgctgactgc tcttccaaag gtcctgagtt caaatcccag caaccacatg gtggctcaca 1500 accatctgta atgggatcta acaccctctt ctgcagtgtc tgaagacagc tacagtgtac 1560 ttacatataa taataaataa gtctttaaaa aataatttga aagtgacctt gattgttaac 1620 atcttgatct agggctgatt tcttgttaat ttcatggatt gagaatgctt agaggttttt 1680 ttgtttgttt gattgatttt tttgaagaaa taaatggcag atgaaggaac ttccag 1736 <210> 6 <211> 362 <212> PRT <213> Mus musculus <400> 6 Met Gly Ala Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ala Ala Ala 1 5 10 15 Leu Ala Pro Thr Gln Thr Arg Ala Gly Pro His Ser Met Arg Tyr Phe 20 25 30 Glu Thr Ala Val Ser Arg Pro Gly Leu Glu Glu Pro Arg Tyr Ile Ser 35 40 45 Val Gly Tyr Val Asp Asn Lys Glu Phe Val Arg Phe Asp Ser Asp Ala 50 55 60 Glu Asn Pro Arg Tyr Glu Pro Arg Ala Pro Trp Met Glu Gln Glu Gly 65 70 75 80 Pro Glu Tyr Trp Glu Arg Glu Thr Gln Lys Ala Lys Gly Gln Glu Gln 85 90 95 Trp Phe Arg Val Ser Leu Arg Asn Leu Leu Gly Tyr Tyr Asn Gln Ser 100 105 110 Ala Gly Gly Ser His Thr Leu Gln Gln Met Ser Gly Cys Asp Leu Gly 115 120 125 Ser Asp Trp Arg Leu Leu Arg Gly Tyr Leu Gln Phe Ala Tyr Glu Gly 130 135 140 Arg Asp Tyr Ile Ala Leu Asn Glu Asp Leu Lys Thr Trp Thr Ala Ala 145 150 155 160 Asp Met Ala Ala Gln Ile Thr Arg Arg Lys Trp Glu Gln Ser Gly Ala 165 170 175 Ala Glu His Tyr Lys Ala Tyr Leu Glu Gly Glu Cys Val Glu Trp Leu 180 185 190 His Arg Tyr Leu Lys Asn Gly Asn Ala Thr Leu Leu Arg Thr Asp Ser 195 200 205 Pro Lys Ala His Val Thr His His Pro Arg Ser Lys Gly Glu Val Thr 210 215 220 Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr Leu Thr 225 230 235 240 Trp Gln Leu Asn Gly Glu Glu Leu Thr Gln Asp Met Glu Leu Val Glu 245 250 255 Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser Val Val 260 265 270 Val Pro Leu Gly Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr His Glu 275 280 285 Gly Leu Pro Glu Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro Ser Thr 290 295 300 Asp Ser Tyr Met Val Ile Val Ala Val Leu Gly Val Leu Gly Ala Met 305 310 315 320 Ala Ile Ile Gly Ala Val Val Ala Phe Val Met Lys Arg Arg Arg Asn 325 330 335 Thr Gly Gly Lys Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser Gln Ser 340 345 350 Ser Glu Met Ser Leu Arg Asp Cys Lys Ala 355 360 <210> 7 <211> 1611 <212> DNA <213> Homo sapiens <400> 7 gagaagccaa tcagtgtcgt cgcggtcgct gttctaaagt ccgcacgcac ccaccgggac 60 tcagattctc cccagacgcc gaggatggcc gtcatggcgc cccgaaccct cctcctgcta 120 ctctcggggg ccctggccct gacccagacc tgggcgggct cccactccat gaggtatttc 180 ttcacatccg tgtcccggcc cggccgcggg gagccccgct tcatcgccgt gggctacgtg 240 gacgacacgc agttcgtgcg gttcgacagc gacgccgcga gccagaagat ggagccgcgg 300 gcgccgtgga tagagcagga ggggccggag tattgggacc aggagacacg gaatatgaag 360 gcccactcac agactgaccg agcgaacctg gggaccctgc gcggctacta caaccagagc 420 gaggacggtt ctcacaccat ccagataatg tatggctgcg acgtggggcc ggacgggcgc 480 ttcctccgcg ggtaccggca ggacgcctac gacggcaagg attacatcgc cctgaacgag 540 gacctgcgct cttggaccgc ggcggacatg gcagctcaga tcaccaagcg caagtgggag 600 gcggtccatg cggcggagca gcggagagtc tacctggagg gccggtgcgt ggacgggctc 660 cgcagatacc tggagaacgg gaaggagacg ctgcagcgca cggacccccc caagacacat 720 atgacccacc accccatctc tgaccatgag gccaccctga ggtgctgggc cctgggcttc 780 taccctgcgg agatcacact gacctggcag cgggatgggg aggaccagac ccaggacacg 840 gagctcgtgg agaccaggcc tgcaggggat ggaaccttcc agaagtgggc ggctgtggtg 900 gtgccttctg gagaggagca gagatacacc tgccatgtgc agcatgaggg tctgcccaag 960 cccctcaccc tgagatggga gctgtcttcc cagcccacca tccccatcgt gggcatcatt 1020 gctggcctgg ttctccttgg agctgtgatc actggagctg tggtcgctgc cgtgatgtgg 1080 aggaggaaga gctcagatag aaaaggaggg agttacactc aggctgcaag cagtgacagt 1140 gcccagggct ctgatgtgtc tctcacagct tgtaaagtgt gagacagctg ccttgtgtgg 1200 gactgagagg caagagttgt tcctgccctt ccctttgtga cttgaagaac cctgactttg 1260 tttctgcaaa ggcacctgca tgtgtctgtg ttcgtgtagg cataatgtga ggaggtgggg 1320 agagcacccc acccccatgt ccaccatgac cctcttccca cgctgacctg tgctccctct 1380 ccaatcatct ttcctgttcc agagaggtgg ggctgaggtg tctccatctc tgtctcaact 1440 tcatggtgca ctgagctgta acttcttcct tccctattaa aattagaacc tgagtataaa 1500 tttactttct caaattcttg ccatgagagg ttgatgagtt aattaaagga gaagattcct 1560 aaaatttgag agacaaaatt aatggaacgc atgagaacct tccagagtcc a 1611 <210> 8 <211> 365 <212> PRT <213> Homo sapiens <400> 8 Met Ala Val Met Ala Pro Arg Thr Leu Leu Leu Leu Leu Ser Gly Ala 1 5 10 15 Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe 20 25 30 Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala 35 40 45 Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala 50 55 60 Ala Ser Gln Lys Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly 65 70 75 80 Pro Glu Tyr Trp Asp Gln Glu Thr Arg Asn Met Lys Ala His Ser Gln 85 90 95 Thr Asp Arg Ala Asn Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser 100 105 110 Glu Asp Gly Ser His Thr Ile Gln Ile Met Tyr Gly Cys Asp Val Gly 115 120 125 Pro Asp Gly Arg Phe Leu Arg Gly Tyr Arg Gln Asp Ala Tyr Asp Gly 130 135 140 Lys Asp Tyr Ile Ala Leu Asn Glu Asp Leu Arg Ser Trp Thr Ala Ala 145 150 155 160 Asp Met Ala Ala Gln Ile Thr Lys Arg Lys Trp Glu Ala Val His Ala 165 170 175 Ala Glu Gln Arg Arg Val Tyr Leu Glu Gly Arg Cys Val Asp Gly Leu 180 185 190 Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Pro 195 200 205 Pro Lys Thr His Met Thr His His Pro Ile Ser Asp His Glu Ala Thr 210 215 220 Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Glu Ile Thr Leu Thr 225 230 235 240 Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu 245 250 255 Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val 260 265 270 Val Pro Ser Gly Glu Glu Gln Arg Tyr Thr Cys His Val Gln His Glu 275 280 285 Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Leu Ser Ser Gln Pro 290 295 300 Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Leu Gly Ala 305 310 315 320 Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser 325 330 335 Ser Asp Arg Lys Gly Gly Ser Tyr Thr Gln Ala Ala Ser Ser Asp Ser 340 345 350 Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val 355 360 365 <210> 9 <211> 2109 <212> DNA <213> Artificial Sequence <220> <223> The mRNA sequence of the engineered mouse B2M-HLA-A2.1 after humanization <400> 9 tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60 atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120 gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180 tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240 ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300 tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360 tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420 ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480 aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540 ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600 gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660 aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720 aaccagagcg aggccggttc tcacaccgtc cagaggatgt atggctgcga cgtggggtcg 780 gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga ttacatcgcc 840 ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac caccaagcac 900 aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg cacgtgcgtg 960 gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac ggattcccca 1020 aaggcacatg tgacccatca ccccagatct aaaggtgaag tcaccctgag gtgctgggcc 1080 ctgggcttct accctgctga catcaccctg acctggcagt tgaatgggga ggagctgacc 1140 caggacatgg agcttgtgga gaccaggcct gcaggggatg gaaccttcca gaagtgggca 1200 tctgtggtgg tgcctcttgg gaaggagcag aattacacat gccgtgtgta ccatgagggg 1260 ctgcctgagc ccctcaccct gagatgggag cctcctccgt ccactgactc ttacatggtg 1320 atcgttgctg ttctgggtgt ccttggagct atggccatca ttggagctgt ggtggctttt 1380 gtgatgaaga gaaggagaaa cacaggtgga aaaggagggg actatgctct ggctccaggc 1440 tcccagagct ctgaaatgtc tctccgagat tgtaaagcgt gaagacagct gcctggactg 1500 tactgagtga cagacgatgt gttcaggtct ctcctgtgac atccagagcc ctcagttctc 1560 tttacacaac attgtctgat gttccctgtg agcttgggtt cagtgtgaag aactgtggag 1620 cccagcctgc cctgcacacc aggaccctat ccctgcactg ccctgtgttc ccttccatag 1680 ccaaccttgc tgctccagcc aaacactggg ggacatctgc atcctgtaag ctccatgcta 1740 ccctgagctg cagctcctca cttccacact gagaataata atttgaatgt gggtggctgg 1800 agagatggct cagcgctgac tgctcttcca aaggtcctga gttcaaatcc cagcaaccac 1860 atggtggctc acaaccatct gtaatgggat ctaacaccct cttctgcagt gtctgaagac 1920 agctacagtg tacttacata taataataaa taagtcttta aaaaataatt tgaaagtgac 1980 cttgattgtt aacatcttga tctagggctg atttcttgtt aatttcatgg attgagaatg 2040 cttagaggtt tttttgtttg tttgattgat ttttttgaag aaataaatgg cagatgaagg 2100 aacttccag 2109 <210> 10 <211> 4694 <212> DNA <213> Artificial Sequence <220> <223> The DNA sequence of the engineered mouse B2M-HLA-A2.1 after humanization <400> 10 tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60 atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120 gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180 tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240 ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300 tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360 tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420 ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480 aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540 ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600 gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660 aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720 aaccagagcg aggccggtga gtgaccccgg cccggggcgc aggtcacgac ctctcatccc 780 ccacggacgg gccaggtcgc ccacagtctc cgggtccgag atccgccccg aagccgcggg 840 accccgagac ccttgccccg ggagaggccc aggcgccttt acccggtttc attttcagtt 900 taggccaaaa atccccccag gttggtcggg gcggggcggg gctcggggga ccgggctgac 960 cgcggggtcc gggccaggtt ctcacaccgt ccagaggatg tatggctgcg acgtggggtc 1020 ggactggcgc ttcctccgcg ggtaccacca gtacgcctac gacggcaagg attacatcgc 1080 cctgaaagag gacctgcgct cttggaccgc ggcggacatg gcagctcaga ccaccaagca 1140 caagtgggag gcggcccatg tggcggagca gttgagagcc tacctggagg gcacgtgcgt 1200 ggagtggctc cgcagatacc tggagaacgg gaaggagacg ctgcagcgca cgggtaccag 1260 gggccacggg gcgcctccct gatcgcctgt agatctggat cctgtgtgac atacctgtac 1320 cttgtcctcc agagtcaggg gctgggagtc attttctctg gctacagact ttgtgatggc 1380 tgttcactcg gactgacagt taacgttggt cagcaagatg accacagtgg ttgagtctca 1440 gtggtgggac ccttccagta gcatatgccc ctaattttga tatgaactca aacagatatt 1500 aaattactta ttttccattc cctattccat tctgtgacta tctctctcat gctattgaac 1560 atcacataag gatggccatg ttcacccact ggctcatgtg gattccctct tagcttcttt 1620 gtcccaaaag aaaatgtgca gtcctgtgct gaggggacca gctctgcttt tggtcactag 1680 tgcaatgaca gtgtagtgtc aaatagacac atagttcact ctcatcattg atttaactga 1740 gtcttgtgta gatttcagtt tgtcttgtta attgtggaat ttcttaaatc ttccacacag 1800 attccccaaa ggcacatgtg acccatcacc ccagatctaa aggtgaagtc accctgaggt 1860 gctgggccct gggcttctac cctgctgaca tcaccctgac ctggcagttg aatggggagg 1920 agctgaccca ggacatggag cttgtggaga ccaggcctgc aggggatgga accttccaga 1980 agtgggcatc tgtggtggtg cctcttggga aggagcagaa ttacacatgc cgtgtgtacc 2040 atgaggggct gcctgagccc ctcaccctga gatggggtaa ggagggtgtg ggtgcagagc 2100 tggggtcagg gaaagctgga gccttctgca gaccctgagc tggtcaggga tgagagctgg 2160 ggtcataacc ctcaccttca tttcctgtac ctgtccttcc cagagcctcc tccgtccact 2220 gactcttaca tggtgatcgt tgctgttctg ggtgtccttg gagctatggc catcattgga 2280 gctgtggtgg cttttgtgat gaagagaagg agaaacacag gtaagaaagg gcagggtctg 2340 agttttctct cagcctcctt tagaagtgtg ctctgctcat taatggggaa cacagccaca 2400 ccccacattg ctactgtctc taactgggtc tgctgtcagt tctgggaatt tccagtgtca 2460 agatcttcct tgaactctca cagcttttct tttcacaggt ggaaaaggag gggactatgc 2520 tctggctcca ggttagtgtg gggacaggat tgttctgggg gacattggag tgaagttgga 2580 gatgatggga gctctgggaa tccataatag ctcctccaga gaaatcttct aggggcctga 2640 gttgtgccat gaagtgaata cattcatgta catatgcata tacatttgtt ttgttttacc 2700 ctaggctccc agagctctga aatgtctctc cgagattgta aaggtgacac tctagggtct 2760 gattggggag gggcaatgtg gacatgattg ggtttcaggg actcccagaa tctcctgaga 2820 gtgagtggtg ggttgctgga atgttgtctt cacagtgatg gttcatgact ctcattctct 2880 agcgtgaaga cagctgcctg gactgtactg agtgacagac gatgtgttca ggtctctcct 2940 gtgacatcca gagccctcag ttctctttac acaacattgt ctgatgttcc ctgtgagctt 3000 gggttcagtg tgaagaactg tggagcccag cctgccctgc acaccaggac cctatccctg 3060 cactgccctg tgttcccttc catagccaac cttgctgctc cagccaaaca ctgggggaca 3120 tctgcatcct gtaagctcca tgctaccctg agctgcagct cctcacttcc acactgagaa 3180 taataatttg aatgtgggtg gctggagaga tggctcagcg ctgactgctc ttccaaaggt 3240 cctgagttca aatcccagca accacatggt ggctcacaac catctgtaat gggatctaac 3300 accctcttct gcagtgtctg aagacagcta cagtgtactt acatataata ataaataagt 3360 ctttaaaaaa taatttgaaa gtgaccttga ttgttaacat cttgatctag ggctgatttc 3420 ttgttaattt catggattga gaatgcttag aggttttttt gtttgtttga ttgatttttt 3480 tgaagaaata aatggcagat gaaggaactt ccagaatctg ggtcactatg ctgtgtgtat 3540 ctgttgggac aggatgaggc tgtggcagct gagtgtgaac agggctgtgc ccaggtgggc 3600 tcagtccatt ttgatctgtg atggggccac acctcggctg tgtcacctct gggctctgtt 3660 ctctccatca ctctgaggca catcctgaga gtttgtgatc acaaagacac agggagggcc 3720 tgagccttgc cctgtcccca ggattatgag cccctagggc taaagatcag agactcaact 3780 aggacagagc tctgcgggta catcttagcc ctttcagtct ctagttggta ggcactagat 3840 ttaccttctg gaggcttccg gacactcagg gaaagaaatg gacagggttg taacttcatg 3900 taaggcaccg tcactgatgt gtcagaagga agttgaggag cgtgagaggg aacgtgggtg 3960 tctctgtcag gtggagtcta gtggtagaaa atccagcttt tcggtgaaat ccagggccct 4020 tgaggccaaa agctcactca aatcttgtat tatatttatt tctaggaaag gggaattgat 4080 gaagggggtg gggatgggtg atctgcccag acaagcagtt accaaatggt ggagccagaa 4140 ctcacctcct ttaagaaggt gattgtccta caaactcatt tgatggtgag gtctggaatg 4200 taaataatgt aatgttcggc taaccttctc cttctctccc tcccttcccc ttttcttttc 4260 agctctgaag attcatttga acctgcttaa ttacaaatcc agtttctaat atgctataca 4320 atttatgcac gcagaaagaa atagcaatgt acacatcacc ttctttatat cttactttaa 4380 atattttatg catgttttca aaaaattgga aatatcctag atagctgagc aataaatctt 4440 caataagtat tttgatcaga ataataaata taattttaag aacaatagtt gatcatatgc 4500 caaaccctct gtacttctca ttacttggat gcagttactc atctttggtc tatcacaaca 4560 taagtgacat actttccttt tggtaaagca aagaggccta attgaagtct gtcactgtgc 4620 ccaatgctta gcaattctca cccccaaccc tgtggctact tctgcttttg ttacttttac 4680 taaaaataaa aaac 4694 <210> 11 <211> 1409 <212> DNA <213> Artificial Sequence <220> <223> 5' arm <400> 11 gcatttccta gtacagttca acacagtgtt tagtataatt taatattaac atttcaggtc 60 tttaatgtat taaatgagtt tttcttttta attagatgaa gtatcttaac tcacaccttt 120 atacataaaa attattctta tatttcagtt acaaaaaggg atagcaaaat aacataaatg 180 attatgattc ttaaacatta ctggatcaaa atactatatg ctgggtagac actgtaggat 240 tgggtctctg tttattatct cattaatgtc cgtggagact attttatttt tttctagttt 300 agacacagcc tccacactag agattgttaa aggtttttaa aaatatgttc aagaaatcca 360 gaagttatgt tgttctcctt ggggaagcca aggccaaagc cacttcaact gcaagcatgg 420 ccatttctcc atgtcctgat gccccatgcc ctcttcctac ccttcctcac tcgagctgct 480 tgcggtggtg tctccctgtg ctcacagcct gcctctgtcc tggcttttgg ccaggggttt 540 aacttctcta ctgggtccac cgctgatgta atatacattc tgagtaaaac tatggcagcc 600 tttgtcttcc gagccgataa gcagaaaccc caagggaatg catctcaagg tttatctcct 660 catccagaaa aaataattta ttcggggatt cacttcactt ggtcacttag tttaccaatg 720 gccctgttct aagaaagtac tactaagaga atggacagga aacccagcta agccattgtc 780 cttccccaaa acccatggac agaacaaaga aaattaccta aatttttcaa gggtacccga 840 ttaagttctc catccaaagc tctaaaagga gaaacctgct agaagcaagg tcagaaatcc 900 tctcagttgc ctttaggaca ggagggtctt tttacacacg gaatcctgaa actgcctttg 960 tatttctggg ctgagattat aaactaaggg ttgagttctg ccagttaatg ctcttaattg 1020 tcctggcttt agttttcaag aatgcaaact tcaggtccta agtccttttc tgagtgggat 1080 attgtcagca attgaataaa tgaaggcggt cccaggctga acgaccagat acaccaaact 1140 caagagcaca ccctagatag tagggcacca agggtccagc ccaggctgtt tgaaatatca 1200 cgggacttta taagaacatg aaactgaaaa tgggaaagtc cctttgtaac ctagttcagc 1260 atcaacagct aggagactgg tgacgacctc cggatctgag tccggattgg ctgtgagttc 1320 aggaactata taagagcgcg cgccctggct ggctctcatt tcagtggctg ctactcggcg 1380 cttcagtcgc ggtcgcttca gtcgtcagc 1409 <210> 12 <211> 1343 <212> DNA <213> Artificial Sequence <220> <223> 3' arm <400> 12 gacagagctc tgcgggtaca tcttagccct ttcagtctct agttggtagg cactagattt 60 accttctgga ggcttccgga cactcaggga aagaaatgga cagggttgta acttcatgta 120 aggcaccgtc actgatgtgt cagaaggaag ttgaggagcg tgagagggaa cgtgggtgtc 180 tctgtcaggt ggagtctagt ggtagaaaat ccagcttttc ggtgaaatcc agggcccttg 240 aggccaaaag ctcactcaaa tcttgtatta tatttatttc taggaaaggg gaattgatga 300 agggggtggg gatgggtgat ctgcccagac aagcagttac caaatggtgg agccagaact 360 cacctccttt aagaaggtga ttgtcctaca aactcatttg atggtgaggt ctggaatgta 420 aataatgtaa tgttcggcta accttctcct tctctccctc ccttcccctt ttcttttcag 480 ctctgaagat tcatttgaac ctgcttaatt acaaatccag tttctaatat gctatacaat 540 ttatgcacgc agaaagaaat agcaatgtac acatcacctt ctttatatct tactttaaat 600 attttatgca tgttttcaaa aaattggaaa tatcctagat agctgagcaa taaatcttca 660 ataagtattt tgatcagaat aataaatata attttaagaa caatagttga tcatatgcca 720 aaccctctgt acttctcatt acttggatgc agttactcat ctttggtcta tcacaacata 780 agtgacatac tttccttttg gtaaagcaaa gaggcctaat tgaagtctgt cactgtgccc 840 aatgcttagc aattctcacc cccaaccctg tggctacttc tgcttttgtt acttttacta 900 aaaataaaaa actaaaaaaa aaaaaaaaaa ttgttgccag acattgccag tgttacatga 960 agtggtttct aggtagcata aatgcctgca agcacgtgcg tatttttcat catctaaaga 1020 ggcagtgggt atcttagaag gttcttgcag aagcaggctc ctcaactaag ggtcgagagg 1080 aaagtgacta ggaaaggcct ccaaagcaga gcagtaggag gtggtgatga aggtcaggga 1140 ataataggaa gaaactgaga ggggagtgag gatctcagac gtgctggtcc cacagggagc 1200 tctagagcag agatcacatc ttacagtttg tcttggtgat gtgcacagct tgttgctggc 1260 tccacaggac tgtatgctag gatgaaagcc cagatacttt ggggtgcagg ttatggttat 1320 ggggtgcaag ttatggttat tgg 1343 <210> 13 <211> 72 <212> DNA <213> Homo sapiens <400> 13 atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60 cagacctggg cg 72 <210> 14 <211> 297 <212> DNA <213> Homo sapiens <400> 14 atccagcgta ctccaaagat tcaggtttac tcacgtcatc cagcagagaa tggaaagtca 60 aatttcctga attgctatgt gtctgggttt catccatccg acattgaagt tgacttactg 120 aagaatggag agagaattga aaaagtggag cattcagact tgtctttcag caaggactgg 180 tctttctatc tcttgtacta cactgaattc acccccactg aaaaagatga gtatgcctgc 240 cgtgtgaacc atgtgacttt gtcacagccc aagatagtta agtgggatcg agacatg 297 <210> 15 <211> 831 <212> DNA <213> Homo sapiens <400> 15 ggctctcact ccatgaggta tttcttcaca tccgtgtccc ggcccggccg cggggagccc 60 cgcttcatcg cagtgggcta cgtggacgac acgcagttcg tgcggttcga cagcgacgcc 120 gcgagccaga ggatggagcc gcgggcgccg tggatagagc aggagggtcc ggagtattgg 180 gacggggaga cacggaaagt gaaggcccac tcacagactc accgagtgga cctggggacc 240 ctgcgcggct actacaacca gagcgaggcc ggtgagtgac cccggcccgg ggcgcaggtc 300 acgacctctc atcccccacg gacgggccag gtcgcccaca gtctccgggt ccgagatccg 360 ccccgaagcc gcgggacccc gagacccttg ccccgggaga ggcccaggcg cctttacccg 420 gtttcatttt cagtttaggc caaaaatccc cccaggttgg tcggggcggg gcggggctcg 480 ggggaccggg ctgaccgcgg ggtccgggcc aggttctcac accgtccaga ggatgtatgg 540 ctgcgacgtg gggtcggact ggcgcttcct ccgcgggtac caccagtacg cctacgacgg 600 caaggattac atcgccctga aagaggacct gcgctcttgg accgcggcgg acatggcagc 660 tcagaccacc aagcacaagt gggaggcggc ccatgtggcg gagcagttga gagcctacct 720 ggagggcacg tgcgtggagt ggctccgcag atacctggag aacgggaagg agacgctgca 780 gcgcacgggt accaggggcc acggggcgcc tccctgatcg cctgtagatc t 831 <210> 16 <211> 2486 <212> DNA <213> Mus musculus <400> 16 ggatcctgtg tgacatacct gtaccttgtc ctccagagtc aggggctggg agtcattttc 60 tctggctaca gactttgtga tggctgttca ctcggactga cagttaacgt tggtcagcaa 120 gatgaccaca gtggttgagt ctcagtggtg ggacccttcc agtagcatat gcccctaatt 180 ttgatatgaa ctcaaacaga tattaaatta cttattttcc attccctatt ccattctgtg 240 actatctctc tcatgctatt gaacatcaca taaggatggc catgttcacc cactggctca 300 tgtggattcc ctcttagctt ctttgtccca aaagaaaatg tgcagtcctg tgctgagggg 360 accagctctg cttttggtca ctagtgcaat gacagtgtag tgtcaaatag acacatagtt 420 cactctcatc attgatttaa ctgagtcttg tgtagatttc agtttgtctt gttaattgtg 480 gaatttctta aatcttccac acagattccc caaaggcaca tgtgacccat caccccagat 540 ctaaaggtga agtcaccctg aggtgctggg ccctgggctt ctaccctgct gacatcaccc 600 tgacctggca gttgaatggg gaggagctga cccaggacat ggagcttgtg gagaccaggc 660 ctgcagggga tggaaccttc cagaagtggg catctgtggt ggtgcctctt gggaaggagc 720 agaattacac atgccgtgtg taccatgagg ggctgcctga gcccctcacc ctgagatggg 780 gtaaggaggg tgtgggtgca gagctggggt cagggaaagc tggagccttc tgcagaccct 840 gagctggtca gggatgagag ctggggtcat aaccctcacc ttcatttcct gtacctgtcc 900 ttcccagagc ctcctccgtc cactgactct tacatggtga tcgttgctgt tctgggtgtc 960 cttggagcta tggccatcat tggagctgtg gtggcttttg tgatgaagag aaggagaaac 1020 acaggtaaga aagggcaggg tctgagtttt ctctcagcct cctttagaag tgtgctctgc 1080 tcattaatgg ggaacacagc cacaccccac attgctactg tctctaactg ggtctgctgt 1140 cagttctggg aatttccagt gtcaagatct tccttgaact ctcacagctt ttcttttcac 1200 aggtggaaaa ggaggggact atgctctggc tccaggttag tgtggggaca ggattgttct 1260 gggggacatt ggagtgaagt tggagatgat gggagctctg ggaatccata atagctcctc 1320 cagagaaatc ttctaggggc ctgagttgtg ccatgaagtg aatacattca tgtacatatg 1380 catatacatt tgttttgttt taccctaggc tcccagagct ctgaaatgtc tctccgagat 1440 tgtaaaggtg acactctagg gtctgattgg ggaggggcaa tgtggacatg attgggtttc 1500 agggactccc agaatctcct gagagtgagt ggtgggttgc tggaatgttg tcttcacagt 1560 gatggttcat gactctcatt ctctagcgtg aagacagctg cctggactgt actgagtgac 1620 agacgatgtg ttcaggtctc tcctgtgaca tccagagccc tcagttctct ttacacaaca 1680 ttgtctgatg ttccctgtga gcttgggttc agtgtgaaga actgtggagc ccagcctgcc 1740 ctgcacacca ggaccctatc cctgcactgc cctgtgttcc cttccatagc caaccttgct 1800 gctccagcca aacactgggg gacatctgca tcctgtaagc tccatgctac cctgagctgc 1860 agctcctcac ttccacactg agaataataa tttgaatgtg ggtggctgga gagatggctc 1920 agcgctgact gctcttccaa aggtcctgag ttcaaatccc agcaaccaca tggtggctca 1980 caaccatctg taatgggatc taacaccctc ttctgcagtg tctgaagaca gctacagtgt 2040 acttacatat aataataaat aagtctttaa aaaataattt gaaagtgacc ttgattgtta 2100 acatcttgat ctagggctga tttcttgtta atttcatgga ttgagaatgc ttagaggttt 2160 ttttgtttgt ttgattgatt tttttgaaga aataaatggc agatgaagga acttccagaa 2220 tctgggtcac tatgctgtgt gtatctgttg ggacaggatg aggctgtggc agctgagtgt 2280 gaacagggct gtgcccaggt gggctcagtc cattttgatc tgtgatgggg ccacacctcg 2340 gctgtgtcac ctctgggctc tgttctctcc atcactctga ggcacatcct gagagtttgt 2400 gatcacaaag acacagggag ggcctgagcc ttgccctgtc cccaggatta tgagccccta 2460 gggctaaaga tcagagactc aactag 2486 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA1 targeting site sequence <400> 17 cctggccaat cccgtcggga agg 23 <210> 18 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA2 targeting site sequence <400> 18 ccgtcagcac actcgcaaac agg 23 <210> 19 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA3 targeting site sequence <400> 19 gttctccttc ccgacgggat tgg 23 <210> 20 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA4 targeting site sequence <400> 20 actctggata gcatacaggc cgg 23 <210> 21 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA5 targeting site sequence <400> 21 ctggtgcttg tctcactgac cgg 23 <210> 22 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA6 targeting site sequence <400> 22 ggggaaagag gcactcactc tgg 23 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA7 targeting site sequence <400> 23 gacaagcacc agaaagacca ggg 23 <210> 24 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA8 targeting site sequence <400> 24 ctggaggctt ccggacactc agg 23 <210> 25 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA9 targeting site sequence <400> 25 tgatcaagca tcatgatggt agg 23 <210> 26 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA10 targeting site sequence <400> 26 aggagcgtga gagggaacgt ggg 23 <210> 27 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA11 targeting site sequence <400> 27 gaggaacgta gccatgtcac tgg 23 <210> 28 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA12 targeting site sequence <400> 28 catgtcactg gccctctaaa ggg 23 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA13 targeting site sequence <400> 29 catgtgatca agcatcatga tgg 23 <210> 30 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA14 targeting site sequence <400> 30 acccgcagag ctctgtcact cgg 23 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA15 targeting site sequence <400> 31 ctctgtcact cggctcctct ggg 23 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-3 upstream sequence <400> 32 gttctccttc ccgacgggat 20 <210> 33 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-3 forward oligonucleotide <400> 33 taggttctcc ttcccgacgg gat 23 <210> 34 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-3 downstream sequence <400> 34 atcccgtcgg gaaggagaa 19 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-3 reverse oligonucleotide <400> 35 aaacatcccg tcgggaagga gaa 23 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-14 upstream sequence <400> 36 acccgcagag ctctgtcact 20 <210> 37 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-14 forward oligonucleotide <400> 37 taggacccgc agagctctgt cact 24 <210> 38 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-14 downstream sequence <400> 38 agtgacagac tctgcgggt 19 <210> 39 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-14 reverse oligonucleotide <400> 39 aaacagtgac agactctgcg ggt 23 <210> 40 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> DNA fragment containing the T7 promoter and sgRNA fragment <400> 40 gaattctaat acgactcact atagggggtc ttcgagaaga cctgttttag agctagaaat 60 agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120 tttaaaggat cc 132 <210> 41 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 5'end primer <400> 41 gaatgtgtgc ctcctctcag tttcc 25 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 5'end primer <400> 42 tccttcccgt tctccaggta tctgc 25 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 3'end primer <400> 43 gcggctacta caaccagagc gag 23 <210> 44 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> 3'end primer <400> 44 tccagcaata agaaccagtc cctagct 27 <210> 45 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Probe primer <400> 45 atgaggtctt tttgtgggca gagca 25 <210> 46 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Probe primer <400> 46 ctccctacgg ccacatcacc attac 25 <210> 47 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Probe primer <400> 47 taacttcatg taaggcaccg tcac 24 <210> 48 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Probe primer <400> 48 tccagacctc accatcaaat gag 23 <210> 49 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 5'end primer for KO mouse <400> 49 gaataaatga aggcggtccc aggct 25 <210> 50 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 3'end primer for KO mouse <400> 50 aggtgagttc tggctccacc atttg 25 <210> 51 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> The flexible linker nucleotide sequence <400> 51 ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctct 45 <210> 52 <211> 1891 <212> DNA <213> Artificial Sequence <220> <223> mRNA sequence of humanized B-NDG mouse <400> 52 tttcagtggc tgctactcgg cgcttcagtc gcggtcgctt cagtcgtcag catggccgtc 60 atggcgcccc gaaccctcgt cctgctactc tcgggggctc tggccctgac ccagacctgg 120 gcgatccagc gtactccaaa gattcaggtt tactcacgtc atccagcaga gaatggaaag 180 tcaaatttcc tgaattgcta tgtgtctggg tttcatccat ccgacattga agttgactta 240 ctgaagaatg gagagagaat tgaaaaagtg gagcattcag acttgtcttt cagcaaggac 300 tggtctttct atctcttgta ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc 360 tgccgtgtga accatgtgac tttgtcacag cccaagatag ttaagtggga tcgagacatg 420 ggaggtggcg gatccggcgg aggcggctcg ggtggcggcg gctctggctc tcactccatg 480 aggtatttct tcacatccgt gtcccggccc ggccgcgggg agccccgctt catcgcagtg 540 ggctacgtgg acgacacgca gttcgtgcgg ttcgacagcg acgccgcgag ccagaggatg 600 gagccgcggg cgccgtggat agagcaggag ggtccggagt attgggacgg ggagacacgg 660 aaagtgaagg cccactcaca gactcaccga gtggacctgg ggaccctgcg cggctactac 720 aaccagagcg aggccggttc tcacaccgtc cagaggatgt atggctgcga cgtggggtcg 780 gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga ttacatcgcc 840 ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac caccaagcac 900 aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg cacgtgcgtg 960 gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac ggacgccccc 1020 aaaacgcata tgactcacca cgctgtctct gaccatgaag ccaccctgag gtgctgggcc 1080 ctgagcttct accctgcgga gatcacactg acctggcagc gggatgggga ggaccagacc 1140 caggacacgg agctcgtgga gaccaggcct gcaggggatg gaaccttcca gaagtgggcg 1200 gctgtggtgg tgccttctgg acaggagcag agatacacct gccatgtgca gcatgagggt 1260 ttgcccaagc ccctcaccct gagatgggag ccgtcttccc agcccaccat ccccatcgtg 1320 ggcatcattg ctggcctggt tctctttgga gctgtgatca ctggagctgt ggtcgctgct 1380 gtgatgtgga ggaggaagag ctcagataga aaaggaggga gctactctca ggctgcaagc 1440 agtgacagtg cccagggctc tgatgtgtct ctcacagctt gtaaagtgtg agacagctgc 1500 cttgtgtggg actgagaggc aagagttgtt cctgcccttc cctttgtgac ttgaagaacc 1560 ctgactttgt ttctgcaaag gcacctgcat gtgtctgtgt tcgtgtaggc ataatgtgag 1620 gaggtgggga gaccacccca cccccatgtc caccatgacc ctcttcccac gctgacctgt 1680 gctccctccc caatcatctt tcctgttcca gagaggtggg gctgaggtgt ctccatctct 1740 gtctcaactt catggtgcac tgagctgtaa cttcttcctt ccctattaaa attagaacct 1800 gagtataaat ttactttctc aaattcttgc catgagaggt tgatgagtta attaaaggag 1860 aagattccta aaatttgaga gacaaaataa a 1891 <210> 53 <211> 1342 <212> DNA <213> Artificial Sequence <220> <223> 3' arm <400> 53 gacagagctc tgcgggtaca tcttagccct ttcagtctct agttggtagg cactagattt 60 accttctgga ggcttccgga cactcagaga aagaaatgga cagggttgta acttcatgta 120 aggcaccgtc actgatgtgt cagaaggaag ttgaggagcg tgagagggaa cgtgggtgtc 180 tctgtcaggt ggagtctagt ggtagaaaat ccagcttttc agtgaaatcc agggcccttg 240 aggccaaaag ctcactcaaa tcttgtatta tatttatttc taggaaaggg gaattgatga 300 agggggtggg gatgggtgat ctgcccagac aagcagttac caaatggtgg agccagaact 360 cacctccttt aagaaggtga ttgtcctaca aactcatttg atggtgaggt ctggaatgta 420 aataatgtaa tgttcggcta accttctcct tctctccctc ccttcccctt ttcttttcag 480 ctctgaagat tcatttgaac ctgcttaatt acaaatccag tttctaatat gctatacaat 540 ttatgcacgc agaaagaaat agcaatgtac acatcacctt ctttatatct tactttaaat 600 gttttatgca tgttttcaaa aattggaaat atcctagata gctgagcaat aaatcttcaa 660 taagtatttt gatcagaata ataaatataa ttttaagaac aatagttgat catatgccaa 720 accctctgta cttctcatta cttggatgca gttactcatc tttggtctat cacaacataa 780 gtgacatact ttccttttgg taaagcaaag aggcctaatt gaagtctgtc actgtgccca 840 atgcttagca attctcaccc ccaaccctgt ggctacttct gcttttgtta cttttactaa 900 aaataaaaaa ctaaaaaaaa aaaaaaaaat tgctgccaga cattgccagt gttacatgaa 960 gtggtttcta ggtagcctaa atgcctgcaa gcacgtgcgt atttttcatc atctaaagag 1020 gcagtgggta tcttagaagg ttcttgcaga agcaggctcc tcaactaagg gtcgagagga 1080 aagtgactag gaaaggcctc caaagcagag cagtaggagg tggtgatgaa ggtcagggaa 1140 taataggaag aaactgagag gggagtgagg atctcagacg tgctggtccc acagggagct 1200 ctagagcaga gatcacatct tacagtttgt cttggtgatg tgcacagctt gttgctggct 1260 ccacaggact gtatgctagg atgaaagccc agatactttg gggtgcaggt tatggttatg 1320 gggtgcaagt tatggttatt gg 1342 <210> 54 <211> 3944 <212> DNA <213> Homo sapiens <400> 54 ggctctcact ccatgaggta tttcttcaca tccgtgtccc ggcccggccg cggggagccc 60 cgcttcatcg cagtgggcta cgtggacgac acgcagttcg tgcggttcga cagcgacgcc 120 gcgagccaga ggatggagcc gcgggcgccg tggatagagc aggagggtcc ggagtattgg 180 gacggggaga cacggaaagt gaaggcccac tcacagactc accgagtgga cctggggacc 240 ctgcgcggct actacaacca gagcgaggcc ggtgagtgac cccggcccgg ggcgcaggtc 300 acgacctctc atcccccacg gacgggccag gtcgcccaca gtctccgggt ccgagatccg 360 ccccgaagcc gcgggacccc gagacccttg ccccgggaga ggcccaggcg cctttacccg 420 gtttcatttt cagtttaggc caaaaatccc cccaggttgg tcggggcggg gcggggctcg 480 ggggaccggg ctgaccgcgg ggtccgggcc aggttctcac accgtccaga ggatgtatgg 540 ctgcgacgtg gggtcggact ggcgcttcct ccgcgggtac caccagtacg cctacgacgg 600 caaggattac atcgccctga aagaggacct gcgctcttgg accgcggcgg acatggcagc 660 tcagaccacc aagcacaagt gggaggcggc ccatgtggcg gagcagttga gagcctacct 720 ggagggcacg tgcgtggagt ggctccgcag atacctggag aacgggaagg agacgctgca 780 gcgcacgggt accaggggcc acggggcgcc tccctgatcg cctgtagatc tcccgggctg 840 gcctcccaca aggaggggag acaattggga ccaacactag aatatcgccc tccctctggt 900 cctgagggag aggaatcctc ctgggtttcc agatcctgta ccagagagtg actctgaggt 960 tccgccctgc tctctgacac aattaaggga taaaatctct gaaggaatga cgggaagacg 1020 atccctcgaa tactgatgag tggttccctt tgacacacac aggcagcagc cttgggcccg 1080 tgacttttcc tctcaggcct tgttctctgc ttcacactca atgtgtgtgg gggtctgagt 1140 ccagcacttc tgagtccttc agcctccact caggtcagga ccagaagtcg ctgttccctc 1200 ttcagggact agaattttcc acggaatagg agattatccc aggtgcctgt gtccaggctg 1260 gtgtctgggt tctgtgctcc cttccccatc ccaggtgtcc tgtccattct caagatagcc 1320 acatgtgtgc tggaggagtg tcccatgaca gatgcaaaat gcctgaatga tctgactctt 1380 cctgacagac gcccccaaaa cgcatatgac tcaccacgct gtctctgacc atgaagccac 1440 cctgaggtgc tgggccctga gcttctaccc tgcggagatc acactgacct ggcagcggga 1500 tggggaggac cagacccagg acacggagct cgtggagacc aggcctgcag gggatggaac 1560 cttccagaag tgggcggctg tggtggtgcc ttctggacag gagcagagat acacctgcca 1620 tgtgcagcat gagggtttgc ccaagcccct caccctgaga tggggtaagg agggagacgg 1680 gggtgtcatg tcttttaggg aaagcaggag cctctctgac ctttagcagg gtcagggccc 1740 ctcaccttcc cctcttttcc cagagccgtc ttcccagccc accatcccca tcgtgggcat 1800 cattgctggc ctggttctct ttggagctgt gatcactgga gctgtggtcg ctgctgtgat 1860 gtggaggagg aagagctcag gtggggaagg ggtgaagggt gggtctgaga tttcttgtct 1920 cactgagggt tccaagaccc aggtagaagt gtgccctgcc tcgttactgg gaagcaccac 1980 ccacaattat gggcctaccc agcctgggcc ctgtgtgcca gcacttactc ttttgtaaag 2040 cacctgttaa aatgaaggac agatttatca ccttgattac agcggtgatg ggacctgatc 2100 ccagcagtca caagtcacag gggaaggtcc ctgaggacct tcaggagggc ggttggtcca 2160 ggacccacac ctgctttctt catgtttcct gatcccgccc tgggtctgca gtcacacatt 2220 tctggaaact tctctgaggt ccaagacttg gaggttcctc taggacctta aggccctgac 2280 tcctttctgg tatctcacag gacattttct tcccacagat agaaaaggag ggagctactc 2340 tcaggctgca agtaagtatg aaggaggctg atgcctgagg tccttgggat attgtgtttg 2400 ggagcccatg ggggagctca cccaccccac aattcctcct ctagccacat cttctgtggg 2460 atctgaccag gttctgtttt tgttctaccc caggcagtga cagtgcccag ggctctgatg 2520 tgtctctcac agcttgtaaa ggtgagagcc tggagggcct gatgtgtgtt gggtgttggg 2580 cggaacagtg gacacagctg tgctatgggg tttctttcca ttggatgtat tgagcatgcg 2640 atgggctgtt taaagtgtga cccctcactg tgacagatac gaatttgttc atgaatattt 2700 ttttctatag tgtgagacag ctgccttgtg tgggactgag aggcaagagt tgttcctgcc 2760 cttccctttg tgacttgaag aaccctgact ttgtttctgc aaaggcacct gcatgtgtct 2820 gtgttcgtgt aggcataatg tgaggaggtg gggagaccac cccaccccca tgtccaccat 2880 gaccctcttc ccacgctgac ctgtgctccc tccccaatca tctttcctgt tccagagagg 2940 tggggctgag gtgtctccat ctctgtctca acttcatggt gcactgagct gtaacttctt 3000 ccttccctat taaaattaga acctgagtat aaatttactt tctcaaattc ttgccatgag 3060 aggttgatga gttaattaaa ggagaagatt cctaaaattt gagagacaaa ataaatggaa 3120 cacatgagaa ccttccagag tccacgtgtt gcttatgctg atttgttgca ggggaggaga 3180 gtagatgggg ctgtgcccag tttctgttcc ggccactatg ggctttatgt ggtcactgct 3240 tggctgggtc atctttgctg ctccattgtc cttggccctt cagtagaacc ttgtcccact 3300 aagacctgtg atcacaggga gttggatgtc acctagggtg gtccctgcat acaaatctcc 3360 ttgcggtatc aagagacaaa ttttcagacc tgtctaggtc ttgccttcct cccagggctt 3420 tttcctcaat tgtattttca atttttctcc aatcttttta aaggaaccag attgtgacat 3480 ttgcagagag gagtggtccc atagtttctc atcatgatta actttctgtt ggaactcctg 3540 ttctgccctc ctactcttct tcctgctctg aattgtagta atcctagtgc tggctccaat 3600 ccaaactcat agatttataa agcagagtct aatttagatt catatgtggt tggaaaattg 3660 tacccataag gctagggtta ttgttcctga agagaaatat atggttttgt gctgaagtgt 3720 gcaggagggt tggtgtggga ggagggagga cacacaagca gccctggtga gaaaagcact 3780 ggcggcgtgg atgtccatgt gaacttatgt tctttagctg ccacaaaaca gcatttgccc 3840 tgtggctaca ttaataaagg tatgggcttt agaataggga gatgctctac agtggtcatt 3900 cattcaactg acatttgttg tctgctaggg atatgactgc tttt 3944 <210> 55 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 5' end primer <400> 55 cagctccaaa gagaaccagg ccag 24 <210> 56 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 3' end primer <400> 56 taccctgcgg agatcacact gacc 24 <210> 57 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Probe primer <400> 57 ttctgatgct ccttccttcc gtgc 24 <210> 58 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Probe primer <400> 58 ttctctgtgc tcagtgttcc ctgc 24 <210> 59 <211> 362 <212> PRT <213> Homo sapiens <400> 59 Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala Leu Ala Leu 1 5 10 15 Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe Phe Thr Ser 20 25 30 Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala Val Gly Tyr 35 40 45 Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala Ala Ser Gln 50 55 60 Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly Pro Glu Tyr 65 70 75 80 Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His Ser Gln Thr His Arg 85 90 95 Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser Glu Ala Gly 100 105 110 Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp Val Gly Ser Asp Trp 115 120 125 Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr Asp Gly Lys Asp Tyr 130 135 140 Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr Ala Ala Asp Met Ala 145 150 155 160 Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala His Val Ala Glu Gln 165 170 175 Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu Trp Leu Arg Arg Tyr 180 185 190 Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Asp Ala Pro Lys Thr 195 200 205 His Met Thr His His Ala Val Ser Asp His Glu Ala Thr Leu Arg Cys 210 215 220 Trp Ala Leu Ser Phe Tyr Pro Ala Glu Ile Thr Leu Thr Trp Gln Arg 225 230 235 240 Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu Val Glu Thr Arg Pro 245 250 255 Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala Val Val Val Pro Ser 260 265 270 Gly Gln Glu Gln Arg Tyr Thr Cys His Val Gln His Glu Gly Leu Pro 275 280 285 Lys Pro Leu Thr Leu Arg Trp Glu Pro Ser Ser Gln Pro Thr Ile Pro 290 295 300 Ile Val Gly Ile Ile Ala Gly Leu Val Leu Phe Gly Ala Val Ile Thr 305 310 315 320 Gly Ala Val Val Ala Ala Val Met Trp Arg Arg Lys Ser Ser Asp Arg 325 330 335 Lys Gly Gly Ser Tyr Ser Gln Ala Ala Ser Ser Asp Ser Ala Gln Gly 340 345 350 Ser Asp Val Ser Leu Thr Ala Cys Lys Val 355 360 <210> 60 <211> 1409 <212> DNA <213> Artificial Sequence <220> <223> 5' arm <400> 60 gcatttccta gtacagttca acacagtgtt tagtataatt taatattaac atttcaggtc 60 tttaatgtat taaatgagtt tttcttttta attagatgaa gtatcttaac tcacaccttt 120 atacataaaa attattctta tatttcagtt acaaaaaggg atagcaaaat aacataaatg 180 attatgattc ttaaacatta ctggatcaaa atactatatg ctgggtagac actgtaggat 240 tgggtctctg tttattatct cattaatgtc cgtggagact attttatttt tttctagttt 300 agacacagcc tccacactag agattgttaa aggtttttaa aaatatgttc aagaaatcca 360 gaagttatgt tgttctcctt ggggaagcca aggccaaagc cacttcaact gcaagcatgg 420 ccatttctcc atgtcctgat gccccatgcc ctcttcctac ccttcctcac tcgagctgct 480 tgcggtggtg tctccctgtg ctcacagcct gcctctgtcc tggcttttgg ccaggggttt 540 aacttctcta ctgggtccac cgctgatgta atatacattc tgagtaaaac tatggcagcc 600 tttgtcttcc gagccgataa gcagaaaccc caagggaatg catctcaagg tttatctcct 660 catccagaaa aaataattta ttcgggtatt cacttcactt ggtcacttag tttaccaatg 720 gccctgttct aagaaagtac tactaagaga atggacagga aacccagcta agccattgtt 780 cttccccaaa acccatggac agaacaaaga aaattaccta aatttttcaa gggtacccga 840 ttaagttctc catccaaagc tctaaaagga gaaacctgct agaagcaagg tcagaaatcc 900 tctcagttgc ctttaggaca ggagggtctt tttacacacg gaatcctgaa actgcctttg 960 tatttctggg ctgagattat aaactaaggg ttgagttctg ccagttaatg ctcttaattg 1020 tcctggcttt agttttcaag aatgcaaact tcaggtccta agtccttttc tgagtgggat 1080 attgtcagca attgaataaa tgaaggcggt cccaggctga acgaccagat acaccaaact 1140 caagagcaca ccctagatag tagggcacca agggtccagc ccaggctgtt tgaaatatca 1200 cgggacttta taagaacatg aaactgaaaa tgggaaagtc cctttgtaac ctagttcagc 1260 attaacagct aggagactgg tgacgacctc cggatctgag tccggattgg ctgtgagttc 1320 aggaactata taagagcgcg cgccctggct ggctctcatt tcagtggctg ctactcggcg 1380 cttcagtcgc ggtcgcttca gtcgtcagc 1409 <210> 61 <211> 476 <212> PRT <213> Artificial Sequence <220> <223> Protein sequence of humanized C57 <400> 61 Met Ala Val Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala 1 5 10 15 Leu Ala Leu Thr Gln Thr Trp Ala Ile Gln Arg Thr Pro Lys Ile Gln 20 25 30 Val Tyr Ser Arg His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn 35 40 45 Cys Tyr Val Ser Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu 50 55 60 Lys Asn Gly Glu Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe 65 70 75 80 Ser Lys Asp Trp Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro 85 90 95 Thr Glu Lys Asp Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser 100 105 110 Gln Pro Lys Ile Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser 115 120 125 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser His Ser Met Arg 130 135 140 Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe 145 150 155 160 Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser 165 170 175 Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln 180 185 190 Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His 195 200 205 Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn 210 215 220 Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp 225 230 235 240 Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr 245 250 255 Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr 260 265 270 Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala 275 280 285 His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu 290 295 300 Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr 305 310 315 320 Asp Ser Pro Lys Ala His Val Thr His His Pro Arg Ser Lys Gly Glu 325 330 335 Val Thr Leu Arg Cys Trp Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr 340 345 350 Leu Thr Trp Gln Leu Asn Gly Glu Glu Leu Thr Gln Asp Met Glu Leu 355 360 365 Val Glu Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser 370 375 380 Val Val Val Pro Leu Gly Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr 385 390 395 400 His Glu Gly Leu Pro Glu Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro 405 410 415 Ser Thr Asp Ser Tyr Met Val Ile Val Ala Val Leu Gly Val Leu Gly 420 425 430 Ala Met Ala Ile Ile Gly Ala Val Val Ala Phe Val Met Lys Arg Arg 435 440 445 Arg Asn Thr Gly Gly Lys Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser 450 455 460 Gln Ser Ser Glu Met Ser Leu Arg Asp Cys Lys Ala 465 470 475 <210> 62 <211> 479 <212> PRT <213> Artificial Sequence <220> <223> Protein sequence of humanized NDG <400> 62 Met Ala Val Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala 1 5 10 15 Leu Ala Leu Thr Gln Thr Trp Ala Ile Gln Arg Thr Pro Lys Ile Gln 20 25 30 Val Tyr Ser Arg His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn 35 40 45 Cys Tyr Val Ser Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu 50 55 60 Lys Asn Gly Glu Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe 65 70 75 80 Ser Lys Asp Trp Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro 85 90 95 Thr Glu Lys Asp Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser 100 105 110 Gln Pro Lys Ile Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser 115 120 125 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ser His Ser Met Arg 130 135 140 Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe 145 150 155 160 Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser 165 170 175 Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln 180 185 190 Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His 195 200 205 Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn 210 215 220 Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp 225 230 235 240 Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr 245 250 255 Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr 260 265 270 Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala 275 280 285 His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu 290 295 300 Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr 305 310 315 320 Asp Ala Pro Lys Thr His Met Thr His His Ala Val Ser Asp His Glu 325 330 335 Ala Thr Leu Arg Cys Trp Ala Leu Ser Phe Tyr Pro Ala Glu Ile Thr 340 345 350 Leu Thr Trp Gln Arg Asp Gly Glu Asp Gln Thr Gln Asp Thr Glu Leu 355 360 365 Val Glu Thr Arg Pro Ala Gly Asp Gly Thr Phe Gln Lys Trp Ala Ala 370 375 380 Val Val Val Pro Ser Gly Gln Glu Gln Arg Tyr Thr Cys His Val Gln 385 390 395 400 His Glu Gly Leu Pro Lys Pro Leu Thr Leu Arg Trp Glu Pro Ser Ser 405 410 415 Gln Pro Thr Ile Pro Ile Val Gly Ile Ile Ala Gly Leu Val Leu Phe 420 425 430 Gly Ala Val Ile Thr Gly Ala Val Val Ala Ala Val Met Trp Arg Arg 435 440 445 Lys Ser Ser Asp Arg Lys Gly Gly Ser Tyr Ser Gln Ala Ala Ser Ser 450 455 460 Asp Ser Ala Gln Gly Ser Asp Val Ser Leu Thr Ala Cys Lys Val 465 470 475 <210> 63 <211> 337 <212> PRT <213> Artificial Sequence <220> <223> Human B2M and HLA-A2.1 protein signal peptide, Alpha-1and Alpha-2 regions <400> 63 Met Ser Arg Ser Val Ala Leu Ala Val Leu Ala Leu Leu Ser Leu Ser 1 5 10 15 Gly Leu Glu Ala Ile Gln Arg Thr Pro Lys Ile Gln Val Tyr Ser Arg 20 25 30 His Pro Ala Glu Asn Gly Lys Ser Asn Phe Leu Asn Cys Tyr Val Ser 35 40 45 Gly Phe His Pro Ser Asp Ile Glu Val Asp Leu Leu Lys Asn Gly Glu 50 55 60 Arg Ile Glu Lys Val Glu His Ser Asp Leu Ser Phe Ser Lys Asp Trp 65 70 75 80 Ser Phe Tyr Leu Leu Tyr Tyr Thr Glu Phe Thr Pro Thr Glu Lys Asp 85 90 95 Glu Tyr Ala Cys Arg Val Asn His Val Thr Leu Ser Gln Pro Lys Ile 100 105 110 Val Lys Trp Asp Arg Asp Met Gly Gly Gly Gly Ser Gly Gly Gly Gly 115 120 125 Ser Gly Gly Gly Gly Ser Met Ala Pro Arg Thr Leu Val Leu Leu Leu 130 135 140 Ser Gly Ala Leu Ala Leu Thr Gln Thr Trp Ala Gly Ser His Ser Met 145 150 155 160 Arg Tyr Phe Phe Thr Ser Val Ser Arg Pro Gly Arg Gly Glu Pro Arg 165 170 175 Phe Ile Ala Val Gly Tyr Val Asp Asp Thr Gln Phe Val Arg Phe Asp 180 185 190 Ser Asp Ala Ala Ser Gln Arg Met Glu Pro Arg Ala Pro Trp Ile Glu 195 200 205 Gln Glu Gly Pro Glu Tyr Trp Asp Gly Glu Thr Arg Lys Val Lys Ala 210 215 220 His Ser Gln Thr His Arg Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr 225 230 235 240 Asn Gln Ser Glu Ala Gly Ser His Thr Val Gln Arg Met Tyr Gly Cys 245 250 255 Asp Val Gly Ser Asp Trp Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala 260 265 270 Tyr Asp Gly Lys Asp Tyr Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp 275 280 285 Thr Ala Ala Asp Met Ala Ala Gln Thr Thr Lys His Lys Trp Glu Ala 290 295 300 Ala His Val Ala Glu Gln Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val 305 310 315 320 Glu Trp Leu Arg Arg Tyr Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg 325 330 335 Thr <210> 64 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> The signal peptide, Alpha-1 and Alpha-2 regions of human HLA-A2.1 protein and Alpha-3, connecting peptide, transmembrane region and intracellular region of mouse H2-D1 <400> 64 Met Ala Pro Arg Thr Leu Val Leu Leu Leu Ser Gly Ala Leu Ala Leu 1 5 10 15 Thr Gln Thr Trp Ala Gly Ser His Ser Met Arg Tyr Phe Phe Thr Ser 20 25 30 Val Ser Arg Pro Gly Arg Gly Glu Pro Arg Phe Ile Ala Val Gly Tyr 35 40 45 Val Asp Asp Thr Gln Phe Val Arg Phe Asp Ser Asp Ala Ala Ser Gln 50 55 60 Arg Met Glu Pro Arg Ala Pro Trp Ile Glu Gln Glu Gly Pro Glu Tyr 65 70 75 80 Trp Asp Gly Glu Thr Arg Lys Val Lys Ala His Ser Gln Thr His Arg 85 90 95 Val Asp Leu Gly Thr Leu Arg Gly Tyr Tyr Asn Gln Ser Glu Ala Gly 100 105 110 Ser His Thr Val Gln Arg Met Tyr Gly Cys Asp Val Gly Ser Asp Trp 115 120 125 Arg Phe Leu Arg Gly Tyr His Gln Tyr Ala Tyr Asp Gly Lys Asp Tyr 130 135 140 Ile Ala Leu Lys Glu Asp Leu Arg Ser Trp Thr Ala Ala Asp Met Ala 145 150 155 160 Ala Gln Thr Thr Lys His Lys Trp Glu Ala Ala His Val Ala Glu Gln 165 170 175 Leu Arg Ala Tyr Leu Glu Gly Thr Cys Val Glu Trp Leu Arg Arg Tyr 180 185 190 Leu Glu Asn Gly Lys Glu Thr Leu Gln Arg Thr Ser Pro Lys Ala His 195 200 205 Val Thr His His Pro Arg Ser Lys Gly Glu Val Thr Leu Arg Cys Trp 210 215 220 Ala Leu Gly Phe Tyr Pro Ala Asp Ile Thr Leu Thr Trp Gln Leu Asn 225 230 235 240 Gly Glu Glu Leu Thr Gln Asp Met Glu Leu Val Glu Thr Arg Pro Ala 245 250 255 Gly Asp Gly Thr Phe Gln Lys Trp Ala Ser Val Val Val Pro Leu Gly 260 265 270 Lys Glu Gln Asn Tyr Thr Cys Arg Val Tyr His Glu Gly Leu Pro Glu 275 280 285 Pro Leu Thr Leu Arg Trp Glu Pro Pro Pro Ser Thr Asp Ser Tyr Met 290 295 300 Val Ile Val Ala Val Leu Gly Val Leu Gly Ala Met Ala Ile Ile Gly 305 310 315 320 Ala Val Val Ala Phe Val Met Lys Arg Arg Arg Asn Thr Gly Gly Lys 325 330 335 Gly Gly Asp Tyr Ala Leu Ala Pro Gly Ser Gln Ser Ser Glu Met Ser 340 345 350 Leu Arg Asp Cys Lys Ala 355 <210> 65 <211> 3690 <212> DNA <213> Artificial Sequence <220> <223> the BNDG-A fragment <400> 65 atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60 cagacctggg cgatccagcg tactccaaag attcaggttt actcacgtca tccagcagag 120 aatggaaagt caaatttcct gaattgctat gtgtctgggt ttcatccatc cgacattgaa 180 gttgacttac tgaagaatgg agagagaatt gaaaaagtgg agcattcaga cttgtctttc 240 agcaaggact ggtctttcta tctcttgtac tacactgaat tcacccccac tgaaaaagat 300 gagtatgcct gccgtgtgaa ccatgtgact ttgtcacagc ccaagatagt taagtgggat 360 cgagacatgg gaggtggcgg atccggcgga ggcggctcgg gtggcggcgg ctctggctct 420 cactccatga ggtatttctt cacatccgtg tcccggcccg gccgcgggga gccccgcttc 480 atcgcagtgg gctacgtgga cgacacgcag ttcgtgcggt tcgacagcga cgccgcgagc 540 cagaggatgg agccgcgggc gccgtggata gagcaggagg gtccggagta ttgggacggg 600 gagacacgga aagtgaaggc ccactcacag actcaccgag tggacctggg gaccctgcgc 660 ggctactaca accagagcga ggccggtgag tgaccccggc ccggggcgca ggtcacgacc 720 tctcatcccc cacggacggg ccaggtcgcc cacagtctcc gggtccgaga tccgccccga 780 agccgcggga ccccgagacc cttgccccgg gagaggccca ggcgccttta cccggtttca 840 ttttcagttt aggccaaaaa tccccccagg ttggtcgggg cggggcgggg ctcgggggac 900 cgggctgacc gcggggtccg ggccaggttc tcacaccgtc cagaggatgt atggctgcga 960 cgtggggtcg gactggcgct tcctccgcgg gtaccaccag tacgcctacg acggcaagga 1020 ttacatcgcc ctgaaagagg acctgcgctc ttggaccgcg gcggacatgg cagctcagac 1080 caccaagcac aagtgggagg cggcccatgt ggcggagcag ttgagagcct acctggaggg 1140 cacgtgcgtg gagtggctcc gcagatacct ggagaacggg aaggagacgc tgcagcgcac 1200 gggtaccagg ggccacgggg cgcctccctg atcgcctgta gatctcccgg gctggcctcc 1260 cacaaggagg ggagacaatt gggaccaaca ctagaatatc gccctccctc tggtcctgag 1320 ggagaggaat cctcctgggt ttccagatcc tgtaccagag agtgactctg aggttccgcc 1380 ctgctctctg acacaattaa gggataaaat ctctgaagga atgacgggaa gacgatccct 1440 cgaatactga tgagtggttc cctttgacac acacaggcag cagccttggg cccgtgactt 1500 ttcctctcag gccttgttct ctgcttcaca ctcaatgtgt gtgggggtct gagtccagca 1560 cttctgagtc cttcagcctc cactcaggtc aggaccagaa gtcgctgttc cctcttcagg 1620 gactagaatt ttccacggaa taggagatta tcccaggtgc ctgtgtccag gctggtgtct 1680 gggttctgtg ctcccttccc catcccaggt gtcctgtcca ttctcaagat agccacatgt 1740 gtgctggagg agtgtcccat gacagatgca aaatgcctga atgatctgac tcttcctgac 1800 agacgccccc aaaacgcata tgactcacca cgctgtctct gaccatgaag ccaccctgag 1860 gtgctgggcc ctgagcttct accctgcgga gatcacactg acctggcagc gggatgggga 1920 ggaccagacc caggacacgg agctcgtgga gaccaggcct gcaggggatg gaaccttcca 1980 gaagtgggcg gctgtggtgg tgccttctgg acaggagcag agatacacct gccatgtgca 2040 gcatgagggt ttgcccaagc ccctcaccct gagatggggt aaggagggag acgggggtgt 2100 catgtctttt agggaaagca ggagcctctc tgacctttag cagggtcagg gcccctcacc 2160 ttcccctctt ttcccagagc cgtcttccca gcccaccatc cccatcgtgg gcatcattgc 2220 tggcctggtt ctctttggag ctgtgatcac tggagctgtg gtcgctgctg tgatgtggag 2280 gaggaagagc tcaggtgggg aaggggtgaa gggtgggtct gagatttctt gtctcactga 2340 gggttccaag acccaggtag aagtgtgccc tgcctcgtta ctgggaagca ccacccacaa 2400 ttatgggcct acccagcctg ggccctgtgt gccagcactt actcttttgt aaagcacctg 2460 ttaaaatgaa ggacagattt atcaccttga ttacagcggt gatgggacct gatcccagca 2520 gtcacaagtc acaggggaag gtccctgagg accttcagga gggcggttgg tccaggaccc 2580 acacctgctt tcttcatgtt tcctgatccc gccctgggtc tgcagtcaca catttctgga 2640 aacttctctg aggtccaaga cttggaggtt cctctaggac cttaaggccc tgactccttt 2700 ctggtatctc acaggacatt ttcttcccac agatagaaaa ggagggagct actctcaggc 2760 tgcaagtaag tatgaaggag gctgatgcct gaggtccttg ggatattgtg tttgggagcc 2820 catgggggag ctcacccacc ccacaattcc tcctctagcc acatcttctg tgggatctga 2880 ccaggttctg tttttgttct accccaggca gtgacagtgc ccagggctct gatgtgtctc 2940 tcacagcttg taaaggtgag agcctggagg gcctgatgtg tgttgggtgt tgggcggaac 3000 agtggacaca gctgtgctat ggggtttctt tccattggat gtattgagca tgcgatgggc 3060 tgtttaaagt gtgacccctc actgtgacag atacgaattt gttcatgaat atttttttct 3120 atagtgtgag acagctgcct tgtgtgggac tgagaggcaa gagttgttcc tgcccttccc 3180 tttgtgactt gaagaaccct gactttgttt ctgcaaaggc acctgcatgt gtctgtgttc 3240 gtgtaggcat aatgtgagga ggtggggaga ccaccccacc cccatgtcca ccatgaccct 3300 cttcccacgc tgacctgtgc tccctcccca atcatctttc ctgttccaga gaggtggggc 3360 tgaggtgtct ccatctctgt ctcaacttca tggtgcactg agctgtaact tcttccttcc 3420 ctattaaaat tagaacctga gtataaattt actttctcaa attcttgcca tgagaggttg 3480 atgagttaat taaaggagaa gattcctaaa atttgagaga caaaataaat ggaacacatg 3540 agaaccttcc agagtccacg tgttgcttat gctgatttgt tgcaggggag gagagtagat 3600 ggggctgtgc ccagtttctg ttccggccac tatgggcttt atgtggtcac tgcttggctg 3660 ggtcatcttt gctgctccat tgtccttggc 3690 <210> 66 <211> 119 <212> PRT <213> Rattus norvegicus <400> 66 Met Ala Arg Ser Val Thr Val Ile Phe Leu Val Leu Val Ser Leu Ala 1 5 10 15 Val Val Leu Ala Ile Gln Lys Thr Pro Gln Ile Gln Val Tyr Ser Arg 20 25 30 His Pro Pro Glu Asn Gly Lys Pro Asn Phe Leu Asn Cys Tyr Val Ser 35 40 45 Gln Phe His Pro Pro Gln Ile Glu Ile Glu Leu Leu Lys Asn Gly Lys 50 55 60 Lys Ile Pro Asn Ile Glu Met Ser Asp Leu Ser Phe Ser Lys Asp Trp 65 70 75 80 Ser Phe Tyr Ile Leu Ala His Thr Glu Phe Thr Pro Thr Glu Thr Asp 85 90 95 Val Tyr Ala Cys Arg Val Lys His Val Thr Leu Lys Glu Pro Lys Thr 100 105 110 Val Thr Trp Asp Arg Asp Met 115 <210> 67 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> The linker polypeptide sequence <400> 67 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 68 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> The linker polypeptide sequence <400> 68 Gly Gly Gly Gly Ser 1 5

Claims

β2 마이크로글로불린(B2M) 및 인간 또는 인간화 주조직적합성 복합체(MHC) α 사슬을 포함하는 융합 단백질을 발현하는 유전자 변형된 비-인간 동물.
제1항에 있어서, 동물의 유전체는 융합 단백질을 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 포함하는, 동물.
제1항 또는 제2항에 있어서, 융합 단백질은 인간 또는 인간화 B2M 단백질을 포함하는, 동물.
제1항 또는 제3항 중 어느 한 항에 있어서, MHC α 사슬은 MHC 클래스 I α 사슬인, 동물.
제1항 내지 제4항 중 어느 한 항에 있어서, MHC α 사슬은 인간 HLA-A 단백질인, 동물.
제1항 내지 제4항 중 어느 한 항에 있어서, MHC α 사슬은 키메라 MHC α 사슬인, 동물.
제1항 내지 제4항 중 어느 한 항에 있어서, MHC α 사슬은 인간 HLA- A/마우스 H2-D1 키메라 분자인, 동물.
제1항에 있어서, 융합 단백질은 인간 B2M 단백질, 및 인간 HLA-A α1 및 α2 도메인을 포함하는 키메라 MHC α 사슬을 포함하는, 동물.
제8항에 있어서, 키메라 MHC α 사슬은 마우스 H2-D1α3 도메인을 추가로 포함하는, 동물.
제1항에 있어서, 융합 단백질은 인간 B2M 단백질 및 인간 HLA-A 단백질을 포함하는, 동물.
제2항 내지 제10항 중 어느 한 항에 있어서, 융합 단백질을 인코딩하는 서열은, 적어도 하나의 염색체 내의 내인성 β2 마이크로글로불린(B2M) 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된, 동물.
제2항 내지 제10항 중 어느 한 항에 있어서, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 MHC 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된, 동물.
제2항 내지 제10항 중 어느 한 항에 있어서, 동물은 마우스이며, 융합 단백질을 인코딩하는 서열은 적어도 하나의 염색체 내의 마우스 H2-D1 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된, 동물.
제5항 내지 제13항 중 어느 한 항에 있어서, 인간 HLA-A는 인간 HLA- A2.1인, 동물.
제5항 내지 제13항 중 어느 한 항에 있어서, 인간 HLA-A는 인간 HLA- A1*0101인, 동물.
제1항 내지 제4항 중 어느 한 항에 있어서, 융합 단백질은
(a) 인간 B2M; 및
(b) 인간 HLA-A
를 포함하는, 동물.
제16항에 있어서, 인간 B2M 및 인간 HLA-A는 링커 펩티드 서열을 통해 연결되는, 동물.
제16항 또는 제17항에 있어서, 인간 B2M은 서열번호 4 또는 서열번호 4의 아미노산 21-119와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진, 동물.
제16항 내지 제18항 중 어느 한 항에 있어서, 인간 HLA-A는 HLA-A2.1인, 동물.
제16항 내지 제19항 중 어느 한 항에 있어서, 인간 HLA-A는 서열번호 8, 서열번호 8의 아미노산 25-365, 서열번호 59, 또는 서열번호 59의 아미노산 22-362와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진, 동물.
제16항 내지 제20항 중 어느 한 항에 있어서, 융합 단백질은 서열번호 62와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진, 동물.
제1항 내지 제4항 중 어느 한 항에 있어서, 융합 단백질은
(a) 인간 B2M; 및
(b) 키메라 MHC α 사슬
을 포함하는, 동물.
제22항에 있어서, 인간 B2M 및 키메라 MHC α 사슬은 링커 펩티드 서열을 통해 연결된, 동물.
제22항 또는 제23항에 있어서, 인간 B2M은 서열번호 4 또는 서열번호 4의 아미노산 21-119와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하거나 이로 이루어진 동물.
제22항 내지 제24항 중 어느 한 항에 있어서, 키메라 MHC α 사슬은 인간 HLA-A α1 및 α2 도메인을 포함하는, 동물.
제25항에 있어서, 키메라 MHC α 사슬은 인간 HLA-A α3 도메인을 추가로 포함하는, 동물.
제25항에 있어서, 키메라 MHC α 사슬은 내인성 MHC α3 도메인 및/또는 내인성 MHC 세포질 영역을 추가로 포함하는, 동물.
제22항 내지 제27항 중 어느 한 항에 있어서, 키메라 MHC α 사슬은 서열번호 8, 서열번호 8의 아미노산 25-206, 서열번호 59, 또는 서열번호 59의 아미노산 22-203과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 동물.
제22항 내지 제28항 중 어느 한 항에 있어서, 키메라 MHC α 사슬은 α3 도메인, 연결 펩티드, 막관통 영역, 및 내인성 MHC의 세포질 영역을 포함하는, 동물.
제22항 내지 제28항 중 어느 한 항에 있어서, 동물은 마우스이며, 키메라 MHC α 사슬은 α3 도메인, 연결 펩티드, 막관통 영역, 및 마우스 H2-D1의 세포질 영역을 포함하는, 동물.
제22항 내지 제30항 중 어느 한 항에 있어서, 키메라 MHC α 사슬은 서열번호 6의 아미노산 207-362와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 동물.
제22항 내지 제31항 중 어느 한 항에 있어서, 키메라 MHC α 사슬은 서열번호 61 또는 서열번호 63과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 동물.
제1항 내지 제32항 중 어느 한 항에 있어서, 융합 단백질은 (예를 들어, 융합 단백질의 N-말단에서) 인간 HLA-A2.1의 신호 펩티드를 추가로 포함하는, 동물.
제33항에 있어서, 신호 펩티드는 서열번호 59의 아미노산 1-21과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 동물.
제1항 내지 제34항 중 어느 한 항에 있어서, 동물은 융합 단백질을 인코딩하는 서열에 대해 이형접합성인, 동물.
제1항 내지 제34항 중 어느 한 항에 있어서, 동물은 융합 단백질을 인코딩하는 서열에 대해 동형접합성인, 동물.
인간 HLA-A α1 도메인, 인간 HLA-A α2 도메인 및 내인성 MHC α3 도메인을 포함하는 키메라 MHC α 사슬을 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 유전체에 포함하는 유전자 변형된 비-인간 동물.
제37항에 있어서, 키메라 MHC α 사슬을 인코딩하는 서열이 적어도 하나의 염색체 내의 내인성 MHC α 사슬 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된, 동물.
제37항 또는 제38항에 있어서, 동물의 유전체는 인간 B2M을 인코딩하는 서열을 추가로 포함하며, 여기서 인간 B2M 및 키메라 MHC α 사슬은 서로 결합하여, 동물에서 기능성 MHC단백질 복합체를 형성할 수 있는, 동물.
제39항에 있어서, 인간 B2M을 인코딩하는 서열은 내인성 B2M 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된, 동물.
제37항 내지 제40항 중 어느 한 항에 있어서, 동물은 마우스이며, 키메라 MHC α 사슬을 인코딩하는 서열은 마우스 H2-D1 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된, 동물.
제37항 내지 제41항 중 어느 한 항에 있어서, 인간 HLA-A는 인간 HLA-A2.1인, 동물.
인간 HLA-A를 인코딩하는 서열을 포함하는 적어도 하나의 염색체를 유전체에 포함하는 유전자 변형된 비-인간 동물.
제43항에 있어서, 인간 HLA-A를 인코딩하는 서열은 적어도 하나의 염색체 내의 내인성 MHC α 사슬 유전자 자리에서 내인성 조절 요소에 작동가능하게 연결된, 동물.
제43항 또는 제44항에 있어서, 동물의 유전체는 인간 B2M을 인코딩하는 서열을 추가로 포함하고, 여기서 인간 B2M 및 인간 HLA-A는 서로 결합하여 동물에서 기능성 MHC 단백질 복합체를 형성할 수 있는, 동물.
제45항에 있어서, 인간 B2M을 인코딩하는 서열은 내인성 B2M 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된, 동물.
제43항 내지 제46항 중 어느 한 항에 있어서, 동물은 마우스이며, 인간 HLA-A를 인코딩하는 서열은 마우스 H2-D1 유전자 자리에서 내인성 조절 요소(예를 들어, 프로모터)에 작동가능하게 연결된, 동물.
제43항 내지 제47항 중 어느 한 항에 있어서, 인간 HLA-A는 인간 HLA-A2.1인, 동물.
제1항 내지 제48항 중 어느 한 항에 있어서, 동물은 내인성 B2M을 발현하지 않는, 동물.
제1항 내지 제49항 중 어느 한 항에 있어서, 동물은 내인성 MHC α 사슬을 발현하지 않는, 동물.
제1항 내지 제50항 중 어느 한 항에 있어서, B2M 및 MHC α 사슬은 서로 결합하여 기능성 MHC 단백질 복합체를 형성할 수 있고, 여기서 단백질 복합체는 하나 이상의 세포의 표면에 비-자기(non-self) 항원을 제시할 수 있는, 동물.
제51항에 있어서, 인간 T 세포(예를 들어, 세포독성 T 세포)는 제시된 비-자기 항원을 인식하고 면역 반응을 개시할 수 있는, 동물.
제51항에 있어서, 내인성 T 세포(예를 들어, 세포독성 T 세포)는 제시된 비-자기 항원을 인식하고 면역 반응을 개시할 수 있는, 동물.
제1항 내지 제53항 중 어느 한 항에 있어서, 동물은 포유동물, 예를 들어 원숭이, 설치류 또는 마우스인, 동물.
제54항에 있어서, 동물은 마우스(예를 들어, C57BL/6 백그라운드를 가짐)인, 동물.
제1항 내지 제55항 중 어느 한 항에 있어서, 동물은 면역결핍 마우스인, 동물.
제1항 내지 제56항 중 어느 한 항에 있어서, 동물의 유전체는 동물의 내인성 CD132 유전자에서의 파괴를 포함하는, 동물.
제1항 내지 제57항 중 어느 한 항에 있어서, 동물은 NOD/scid 마우스, NOD/scid 누드 마우스, 또는 B-NDG 마우스인, 동물.
제1항 내지 제58항 중 어느 한 항에 있어서, 동물은 추가의 인간 또는 키메라 단백질을 인코딩하는 서열을 추가로 포함하는, 동물.
제59항에 있어서, 추가의 인간 또는 키메라 단백질은 프로그램된 세포 사멸 단백질 1(PD-1), 세포독성 T-림프구-연관 단백질 4(CTLA-4), 림프구 활성화 3(LAG-3), B 및 T 림프구 연관(BTLA), 프로그램된 세포 사멸 1 리간드 1(PD-L1), CD27, CD28, SIRPα, CD47, THPO, CD137, CD154, Ig 및 ITIM 도메인을 갖는 T-세포 면역수용체(TIGIT), T-세포 면역글로불린 및 뮤신-도메인 함유-3(TIM-3), 글루코코르티코이드-유도된 TNFR-관련 단백질(GITR), 신호 조절 단백질 α(SIRPα) 또는 TNF 수용체 상과(superfamily) 구성원 4(OX40)인, 동물.
동물의 적어도 하나의 세포 내 내인성 B2M 유전자 자리에서, 내인성 B2M 영역을 인코딩하는 서열을 인간 B2M을 인코딩하는 서열, 또는 인간 B2M 및 인간 또는 인간화 MHC α 사슬을 포함하는 융합 단백질을 인코딩하는 서열로 대체하는 단계를 포함하는 유전자 변형된 비-인간 동물의 제조 방법.
제61항에 있어서, 내인성 B2M 영역을 인코딩하는 서열은 내인성 B2M 유전자의 엑손 1, 엑손 2, 및 엑손 3의 전부 또는 일부를 포함하는, 방법.
동물의 적어도 하나의 세포 내 내인성 MHC 유전자 자리에서, 내인성 MHC α 사슬의 영역을 인코딩하는 서열을 인간 MHC α 사슬을 인코딩하는 서열, 또는 인간 B2M 및 인간 또는 인간화 MHC α 사슬을 포함하는 융합 단백질을 인코딩하는 서열로 대체하는 단계를 포함하는 유전자 변형된 비-인간 동물의 제조 방법.
제63항에 있어서, 내인성 MHC 분자 영역을 인코딩하는 서열은 내인성 MHC 유전자의 엑손 1, 엑손 2, 엑손 3, 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및 엑손 8의 전부 또는 일부를 포함하는, 방법.
제63항에 있어서, 동물은 마우스이며, 내인성 MHC 영역을 인코딩하는 서열은 마우스 H2-D1 유전자의 엑손 1, 엑손 2, 엑손 3의 전부 또는 일부를 포함하는, 방법.
제61항 내지 제65항 중 어느 한 항에 있어서, 융합 단백질을 인코딩하는 서열은 하기 요소들:
(a) 인간 B2M의 엑손 1, 엑손 2, 및/또는 엑손 3;
(b) 링커 펩티드 서열을 인코딩하는 선택적인 서열; 및
(c) 인간 HLA-A2.1의 엑손 2 및/또는 엑손 3
을 포함하는, 방법.
제66항에 있어서, 융합 단백질을 인코딩하는 서열은 요소 (c)의 하류인 내인성 MHC 분자 유전자의 엑손 4, 엑손 5, 엑손 6, 엑손 7, 및/또는 엑손 8을 추가로 포함하는, 방법.
제66항 또는 제67항에 있어서, 동물은 마우스이며, 융합 단백질을 인코딩하는 서열은 마우스 H2-D1 유전자의 3' UTR을 추가로 포함하는, 방법.
제61항 내지 제68항 중 어느 한 항에 있어서, 융합 단백질은 서열번호 61, 서열번호 62, 서열번호 63, 또는 서열번호 64와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 동일한 아미노산 서열을 포함하는, 방법.
암 치료를 위한 제제 또는 제제들의 조합의 유효성을 결정하는 방법으로서,
제1항 내지 제60항 중 어느 한 항의 동물에 종양 세포를 이식하여 동물에서 하나 이상의 종양을 형성하는 단계;
제제 또는 제제들의 조합을 동물에게 투여하는 단계; 및
종양에 대한 억제 효과를 결정하는 단계
를 포함하는 방법.
제70항에 있어서, 종양 세포를 동물에게 이식하기 전에, 인간 말초 혈액 세포(hPBMC) 또는 인간 조혈모세포를 동물에게 주입하는, 방법.
제70항에 있어서, 종양 세포는 암 세포주로부터 유래하는 것인, 방법.
제70항에 있어서, 종양 세포는 인간 환자로부터 수득된 종양 샘플로부터 유래하는 것인, 방법.
제70항에 있어서, 억제 효과는 동물 내 종양 부피를 측정함으로써 결정되는, 방법.
제70항에 있어서, 종양 세포는 흑색종 세포, 폐암 세포, 원발성 폐 암종 세포, 비소세포 폐 암종(NSCLC) 세포, 소세포 폐암(SCLC) 세포, 원발성 위 암종 세포, 방광암 세포, 유방암 세포, 및/또는 전립선암 세포인, 방법.
인간 혈액-림프계를 포함하는 동물의 제조 방법으로서,
상기 방법은 인간 조혈 세포 또는 인간 말초 혈액 세포를 포함하는 세포 개체군을 제1항 내지 제60항 중 어느 한 항의 동물 내로 이식하는 단계를 포함하는 방법.
제76항에 있어서, 인간 혈액-림프계는 조혈모세포, 골수 전구 세포, 골수 세포, 수지상 세포, 단핵구, 과립구, 호중구, 비만 세포, 림프구, 및 혈소판으로 이루어진 군으로부터 선택된 인간 세포를 포함하는, 방법.
제76항 또는 77항에 있어서, 이식 전에 동물을 방사선조사하는 단계를 추가로 포함하는, 방법.
β2 마이크로글로불린(B2M) 및 인간 또는 인간화 MHC α 사슬을 포함하는 융합 단백질.
제79항의 융합 단백질을 인코딩하는 핵산.
아미노산 서열을 포함하는 단백질로서, 상기 아미노산 서열은
(a) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열;
(b) 서열번호 4, 8, 59, 61, 62, 63, 또는 64와 적어도 90% 동일한 아미노산 서열;
(c) 서열번호 4, 8, 59, 61, 62, 63, 또는 64와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열;
(d) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열과 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개 이하의 아미노산이 상이한 아미노산 서열; 및
(e) 서열번호 4, 8, 59, 61, 62, 63, 또는 64에 나타낸 아미노산 서열에 대한 1, 2, 3, 4, 5개 이상의 아미노산의 대체, 결실 및/또는 삽입을 포함하는 아미노산 서열
중 하나인 단백질.
뉴클레오티드 서열을 포함하는 핵산으로서, 상기 뉴클레오티드 서열은
(a) 제81항의 단백질을 인코딩하는 서열;
(b) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65;
(c) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65와 적어도 90% 동일한 서열; 및
(d) 서열번호 9, 10, 13, 14, 15, 16, 52, 54, 또는 65와 적어도 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열
중 하나인 핵산.
제81항의 단백질 및/또는 제82항의 핵산을 포함하는 세포.
제81항의 단백질 및/또는 제82항의 핵산을 포함하는 동물.