KR20240069672A

KR20240069672A - 대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체

Info

Publication number: KR20240069672A
Application number: KR1020237045065A
Authority: KR
Inventors: 지웨이 장; 유 웨이
Original assignee: 이뮤노칸 바이오테크 코포레이션 엘티디.
Priority date: 2021-09-24
Filing date: 2022-09-23
Publication date: 2024-05-20
Also published as: TW202332770A; CN117795078A; CA3222922A1; WO2023046038A9; WO2023046038A1; AU2022350732A1

Abstract

본 발명은 염색체 간에 큰 서열 단편을 전달하고, 이중가닥 절단 복구 경로 및 상동성 지시 복구를 사용하여 염색체 재배열을 생성하는 방법에 관한 것이다. 추가적으로, 본 발명은 이러한 방법에 의해 생성된 염색체, 및 이들 염색체를 포함하는 세포 및 형질전환 동물에 관한 것이다.

Description

대규모 염색체 전달 방법 및 이를 이용한 변형 염색체 및 유기체

본 출원에는 EFS-WEB를 통해 ASCII 형식으로 제출된 시퀀스 목록이 포함되어 있으며, 이에 따라 전체를 참조하여 통합된다.

유전자 또는 염색체의 큰 조각을 조작하는 것은 기초적이고 번역적인 연구뿐만 아니라 치료법의 개발을 위한 강력한 도구이다. 인간 유전자의 크기는 수백 개의 염기에서 최소 2,300 킬로베이스(KB)까지이고, 인간 염색체의 크기는 38 메가베이스 쌍(MB)에서 거의 250 MB까지이다. 따라서, 큰 유전자, 다수의 유전자에 걸쳐 있는 영역 및 염색체의 일부에 대한 효과적인 연구는 큰 서열 조각을 조작하는 것을 필요로 한다. 그러나, 큰 단편 조작은 유전자 편집 분야에서 가장 중요한 과제 중 하나로 남아 있다. 본 발명의 목적은 큰 서열을 조작하는 방법을 제공하는 것이다.

본 발명은 하기 단계를 포함하는 조작된 염색체의 제조방법을 제공한다: (a) 표적서열을 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 상기 세포를 하기 핵산분자와 접촉시키는 단계: (i) 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및 (ii) 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자; (c) 주형서열 및 상기 제1 및 제2 마커가 표적 염색체 내로 삽입되도록, 표적서열의 양 측면, 및 주형서열의 5' 말단 및 3' 말단에서 이중가닥 절단(double strand break)을 생성하는 단계; 및 (d) 상기 제1 및 제2 마커를 발현하는 세포 또는 세포들을 선별하는 단계.

일부 실시예들에서, 제1 마커는 주형서열의 5' 말단에 위치하고 제2 마커는 주형서열의 삽입 이후 주형서열의 3' 말단에 위치한다.

일부 실시예들에서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp이다. 일부 실시예들에서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp이다. 일부 실시예들에서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp이다.

일부 실시예들에서, 주형서열의 길이가 적어도 25 KB(kilobasepairs), 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB(megabasepair), 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 6 MB, 적어도 7 MB, 적어도 8 MB, 적어도 9 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 25 MB, 적어도 30 MB, 적어도 40 MB, 적어도 50 MB, 적어도 60 MB, 적어도 70 MB, 적어도 80 MB, 적어도 90 MB, 적어도 100 MB, 적어도 120 MB, 적어도 140 MB, 적어도 160 MB, 적어도 180 MB, 적어도 200 MB, 적어도 220 MB, 또는 적어도 250 MB이다. 일부 실시예들에서, 주형서열의 길이가 50 KB 내지 250 MB, 50 KB 내지 100 MB, 50 KB 내지 50 MB, 50 KB 내지 20 MB, 50 KB 내지 10 MB, 50 KB 내지 5 MB, 50 KB 내지 3 MB, 50 KB 내지 2 MB, 50 KB 내지 1 MB, 100 KB 내지 200 MB, 100 KB 내지 100 MB, 100 KB 내지 50 MB, 100 KB 내지 20 MB, 100 KB 내지 10 MB, 100 KB 내지 5 MB, 100 KB 내지 3 MB, 100 KB 내지 2 MB, 100 KB 내지 1 MB, 100 KB 내지 500 KB, 200 KB 내지 100 MB, 200 KB 내지 50 MB, 200 KB 내지 20 MB, 200 KB 내지 10 MB, 200 KB 내지 5 MB, 200 KB 내지 3 MB, 200 KB 내지 2 MB, 200 KB 내지 1 MB, 200 KB 내지 500 KB, 500 KB 내지 100 MB, 500 KB 내지 50 MB, 500 KB 내지 20 MB, 500 KB 내지 10 MB, 500 KB 내지 5 MB, 500 KB 내지 3 MB, 500 KB 내지 2 MB, 500 KB 내지 1 MB, 1 MB 내지 100 MB, 1 MB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 1 MB 내지 2 MB, 3 MB 내지 100 MB, 3 MB 내지 50 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 5 MB, 5 MB 내지 100 MB, 5 MB 내지 50 MB, 5 MB 내지 20 MB, 5 MB 내지 10 MB, 10 MB 내지 100 MB, 10 MB 내지 50 MB, 또는 10 MB 내지 20 MB이다. 일부 실시예들에서, 주형서열의 길이가 200 KB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 7 MB, 또는 3 MB 내지 5 MB이다.

일부 실시예들에서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(guide nucleic acids, gNAs), 하나 이상의 아연 핑거 뉴클레아제(zinc finger nucleases), 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(Transcription Activator-Like Effector Nucleases, TALEN), 또는 하나 이상의 CRE 재조합효소(CRE recombinase)를 사용하는 단계를 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체(homolog), 동원체(ortholog), 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함한다. 일부 실시예들에서, gNA는 단일 가이드 RNA(single guide RNA, sgRNA)를 포함한다.

일부 실시예들에서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함한다. 일부 실시예들에서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함한다.

일부 실시예들에서, 표적서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함한다. 일부 실시예들에서, 표적서열은 주형서열의 하나 이상의 유전자와 상동성(homologous)인 하나 이상의 유전자를 포함한다.

일부 실시예들에서, 주형서열은 자연적으로 발생하는 서열을 포함한다. 일부 실시예들에서, 주형서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함한다. 일부 실시예들에서, 주형서열은 인공 서열을 포함한다. 일부 실시예들에서, 인공 서열은 하나 이상의 항체 또는 이의 항원 결합 단편을 코딩하는 서열을 포함한다. 일부 실시예들에서, 하나 이상의 항체 또는 이의 항원 결합 단편은 scFv, 이중-특이적 항체, 또는 다중-특이적 항체를 포함한다.

일부 실시예들에서, 주형서열의 삽입에 의해 표적서열이 결실된다. 일부 실시예들에서, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 표적서열, 제2 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고; (b) 주형 염색체가 제3 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제4 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 실시예들에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 제3 및 제4 sgRNA와 접촉시키는 단계를 포함한다. 일부 실시예들에서, 제1, 제2, 제3 및 제4 sgRNA는 제1, 제2, 제3 및 제4 sgRNA 표적서열에 특이적인 표적서열을 포함한다.

일부 실시예들에서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함한다.

일부 실시예들에서, 주형서열의 삽입은 표적서열의 결실을 거의 또는 전혀 포함하지 않는다. 일부 실시예들에서, 주형서열의 삽입은 표적서열의 하나 이상의 기능을 파괴한다. 일부 실시예들에서, 주형서열의 삽입은 표적서열에서의 유전자를 파괴한다. 일부 실시예들에서, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고; (b) 주형 염색체가 제2 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제3 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 실시예들에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 및 제3 sgRNA와 접촉시키는 단계를 포함한다. 일부 실시예들에서, 제1, 제2, 및 제3 sgRNA는 제1, 제2, 및 제3 sgRNA 표적서열에 특이적인 표적서열을 포함한다. 일부 실시예들에서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함한다.

일부 실시예들에서, 제1 또는 제2 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함한다. 형광 단백질은 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), 청색 형광 단백질(BFP), dsRed, mCherry 또는 tdTomato를 포함한다. 일부 실시예들에서, 형광 단백질은 GFP를 포함한다. 일부 실시예들에서, 제1 마커는 선택가능한 마커를 추가로 포함한다. 일부 실시예들에서, 제2 마커는 선택가능한 마커를 추가로 포함한다. 일부 실시예들에서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(Dihydrofolate reductase, DHFR), 글루타민 합성효소(Glutamine synthase, GS), 푸로마이신 아세틸트랜스퍼라제(Puromycin acetyltransferase), 블라스티딘 탈아미노화효소(Blasticidin deaminase), 히스티디놀 탈수소효소(Histidinol dehydrogenase), 하이그로마이신 포스포트랜스퍼라제(Hygromycin phosphotransferase, hph), 블레오마이신 내성 유전자(Bleomycin resistance gene) 및 아미노글리코사이드 포스포트랜스퍼라제(Aminoglycoside phosphotransferase, 네오마이신 내성)으로 구성된 군에서 선택된다. 일부 실시예들에서, 제1 및 제2 마커는 동일한 선택가능한 마커가 아니다. 일부 실시예들에서, 제1 마커는 세포 내에서 GFP를 발현할 수 있는 프로모터에 작동 가능하게 연결된 GFP 및 푸로마이신 아세틸트랜스퍼라제를 포함하고, 제2 마커는 하이그로마이신 포스포트랜스퍼라제를 포함한다.

일부 실시예들에서, 상기 (d) 단계 이후에 추가로, (e) 제1 또는 제2 마커의 전부 또는 일부를 삭제하는 단계를 포함한다. 일부 실시예들에서, 제1 또는 제2 마커를 삭제하는 단계는 CRISPR/Cas 엔도뉴클레아제 및 마커를 코딩하는 서열에 특이적인 표적서열을 포함하는 gNA로 결실을 유도하는 단계를 포함한다.

일부 실시예들에서, 세포는 하이브리드 세포(hybrid cells), 배아 하이브리드 줄기(embryonic hybrid stem, EHS) 세포 또는 접합체(zygotes)를 포함한다. 일부 실시예들에서, EHS 세포는 마우스(mouse), 래트(rat), 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 두 종의 ES 세포를 융합하여 제조된다. 일부 실시예들에서, EHS 세포는 인간 배아 줄기세포를 인간이 아닌 종의 배아 줄기세포에 융합하여 제조된다. 일부 실시예들에서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이다. 일부 실시예들에서, EHS 세포는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 상이한 두 종의 ES 세포를 융합하여 제조된다. 일부 실시예들에서, 융합은 전기 융합(electrofusion), 바이러스 유도 융합(viral induced fusion), 또는 화학적 유도 융합(chemically induced fusion)을 포함한다.

일부 실시예들에서, 세포는 하이브리드 세포를 포함한다. 일부 실시예들에서, 하이브리드 세포를 제조하는 단계는 하기 단계를 포함한다: (a) 소핵(micronucleated) 인간 세포를 제조하는 단계; 및 (b) 하이브리드 세포를 제조하기 위해, 상기 소핵 인간 세포와 인간이 아닌 종의 세포를 융합하는 단계. 일부 실시예들에서, 소핵 인간 세포는 소핵을 유도하기에 충분한 조건하에서 인간 세포 콜세미드(colcemid)를 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계에 의해 제조된다. 일부 실시예들에서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이다. 일부 실시예들에서, 인간이 아닌 종의 세포는 ES 세포이고, 하이브리드 세포는 EHS 세포이다.

일부 실시예들에서, 표적서열은 면역글로불린 또는 T 세포 수용체 서브유닛(subunit)을 코딩하는 유전자를 포함한다. 일부 실시예들에서, 표적 염색체는 마우스 염색체 12(mouse chromosome 12)를 포함하고 주형 염색체는 인간 염색체 14(human chromosome 14)를 포함하거나, 표적 염색체는 마우스 염색체 6(mouse chromosome 6)을 포함하고 주형 염색체는 인간 염색체 2(human chromosome 2)를 포함한다. 일부 실시예들에서, 표적서열은 마우스 Igh 가변영역 서열을 포함한다. 일부 실시예들에서, 마우스 Igh 가변영역 서열은 마우스 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재(intervening) 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGH 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGH 가변영역 서열은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 표적서열은 마우스 Igl 가변영역 서열을 포함한다. 일부 실시예들에서, 표적서열은 마우스 Igk 가변영역 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGL 가변영역 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 마우스 Igk 가변영역 서열은 마우스 V_k, 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGK 가변영역 서열은 인간 V_k, 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다.

일부 실시예들에서, 방법은 상기 단계 (d)에서 선별된 세포로부터 조작된 염색체를 회수하는 단계를 추가적으로 포함한다. 일부 실시예들에서, 조작된 염색체를 회수하는 단계는 소핵을 유도하기에 충분한 조건하에서 세포를 콜세미드에 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계를 포함한다.

일부 실시예들에서, 제1 및 제2 핵산분자는 플라스미드이다.

본 발명은 본 발명의 방법에 의해 제조된 조작된 염색체를 제공한다.

일부 실시예들에서, 조작된 염색체는 마우스 Igh 가변영역을 대신하여 인간 IGH 가변영역의 서열을 포함하는 마우스 염색체 12이다. 일부 실시예들에서, 마우스 Igh 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 인간 IGH 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 조작된 염색체는 마우스 Igk 가변영역을 대신하여 인간 IGK 가변영역의 서열을 포함하는 마우스 염색체 6이다.

일부 실시예들에서, 마우스 Igk 가변영역 서열은 마우스 V_k, 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGK 가변영역 서열은 인간 V_k, 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다.

본 발명은 본 발명의 조작된 염색체를 포함하는 세포를 제공한다.

일부 실시예들에서, 세포는 마우스 ES 세포와 혼성화할 수 있는 세포이다. 일부 실시예들에서, 세포는 배아줄기(ES) 세포, 배아 하이브리드 줄기(EHS) 세포, 또는 접합체(zygote)인 세포이다. 일부 실시예들에서, EHS 세포는 인간 및 마우스 ES 세포의 하이브리드인 세포이다. 일부 실시예들에서, ES 세포는 마우스 ES 세포인 세포이다. 일부 실시예들에서, 세포는 소핵 세포인 세포이다.

본 발명은 하기 단계를 포함하는 마우스 배아줄기(ES) 세포의 제조방법을 제공한다: (a) 본 발명의 어느 방법 중 하나의 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 융합시키는 단계, 여기서: (i) 마우스 ES 세포는 조작된 염색체와 상동 염색체를 포함하고, 상동 염색체는 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결된 제1 형광 단백질을 포함함; 및 (ii) 소핵 세포의 적어도 하나의 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 제1 형광 단백질과 상이한 제2 형광 단백질을 포함하며, 제2 형광 단백질은 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 것임; (b) 제1 및 제2 형광 단백질을 모두 발현하는 ES 세포를 선별하는 단계; (c) 상동 염색체가 ES 세포의 적어도 하나의 서브세트에 의해 소실될 때까지 단계 (c)에서 선별된 ES 세포를 배양하는 단계; 및 (d) 제2 형광 단백질을 발현하고 제1 형광 단백질을 발현하지 않는 ES 세포를 선별하는 단계.

일부 실시예들에서, 상기 단계 (c)에서 세포를 배양하는 단계는 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일 동안 세포를 배양하는 단계를 포함한다. 일부 실시예들에서, 상기 단계 (b) 및 (d)에서 세포를 선별하는 단계는 형광 활성화 세포 분류(fluorescence activated cell sorting, FACS)를 포함한다.

본 발명은 본 발명의 방법에 의해 제조된 마우스 ES 세포를 제공한다.

본 발명은 본 발명의 마우스 ES 세포로부터 제조된 형질전환(transgenic) 마우스를 제공한다.

일부 실시예들에서, 형질전환 마우스를 생산하는 단계는 ES 세포를 이배체 배반포(diploid blastocyst)에 주입하는 단계, ES 세포에서 핵이 제거된(enucleated) 마우스 배아로의 핵 이식, 또는 4배체 배아 보완을 포함한다. 일부 실시예들에서, 마우스 염색체 12는 마우스 Igh 가변영역 대신 인간 IGH 가변영역의 서열을 포함한다. 일부 실시예들에서, 마우스 Igh 가변영역은 마우스 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 인간 IGH 가변영역은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 마우스 염색체 6은 마우스 Igk 가변영역 대신 인간 IGK 가변영역의 서열을 포함한다. 일부 실시예들에서, 마우스 Igk 가변영역 서열은 마우스 V_k, 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 실시예들에서, 주형서열은 인간 IGK 가변영역 서열을 포함한다. 일부 실시예들에서, 인간 IGK 가변영역 서열은 인간 V_k, 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다.

본 발명은 하기 단계를 포함하는 항체의 제조방법을 제공한다: (a) 형질전환 마우스가 인간 IGH 가변영역으로부터 인간 V, D 및 J 세그먼트를 포함하는 복수의 항체가 제조되도록, 본 발명의 형질전환 마우스에 항원을 자극하는(challenging) 단계; 및 (b) 항원에 특이적인 항체를 분리하는 단계.

본 발명은 하기 단계를 포함하는 항체의 제조방법을 제공한다: (a) 형질전환 마우스가 인간 IGK 또는 IGL 가변영역으로부터 인간 V, 및 J 세그먼트를 포함하는 복수의 항체가 제조되도록, 본 발명의 형질전환 마우스에 항원을 자극하는(challenging) 단계; 및 (b) 항원에 특이적인 항체를 분리하는 단계.

본 발명은 본 발명의 형질전환 마우스에 의해 제조된 항체로부터 유도된 항체를 제공한다. 일부 실시예들에서, 항체는 단일 사슬 가변 단편(scFv), 이중-특이적 항체 또는 다중-특이적 항체를 포함한다.

본 발명은 하기 단계를 포함하는 염색체 재배열(rearrangement)의 제조방법을 제공한다: (a) 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 표적 위치의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계; (c) 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되고 염색체 재배열이 제조되도록, 표적 위치, 및 주형서열의 5' 말단에서 이중가닥 절단을 제조하는 단계; 및 (d) 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계.

일부 실시예들에서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp이다. 일부 실시예들에서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp이다. 일부 실시예들에서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp이다.

일부 실시예들에서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 적어도 하나의 sgRNA, 하나 이상의 아연 핑거 뉴클레아제, 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(TALEN), 또는 하나 이상의 CRE 재조합효소를 사용하는 단계를 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체, 동원체, 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함한다. 일부 실시예들에서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함한다. 일부 실시예들에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 5' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함한다. 일부 실시예들에서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함한다.

일부 실시예들에서, 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함한다. 일부 실시예들에서, 형광 단백질은 GFP, YFP, RFP, CFP, BFP, dsRed, mCherry 또는 tdTomato를 포함한다. 일부 실시예들에서, 마커는 선택가능한 마커를 추가로 포함한다. 일부 실시예들에서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자 및 아미노글리코사이드 포스포트랜스퍼라제(네오마이신 내성)으로 구성된 군에서 선택된다.

일부 실시예들에서, 세포는 배아줄기(ES) 세포를 포함한다.

일부 실시예들에서, 핵산분자는 플라스미드이다.

본 발명은 본 발명의 방법에 의해 제조된 염색체 재배열을 포함하는 세포를 제공한다. 일부 실시예들에서, 세포는 마우스 ES 세포인 세포이다.

본 발명은 본 발명의 방법에 의해 제조된 마우스 ES 세포로부터의 형질전환 마우스를 제공한다.

본 개시내용의 특징들 및 이점들에 대한 더 나은 이해는 예시적인 실시예들을 규정하는 이하의 상세한 설명 및 그에 수반되는 도면들을 참조함으로써 얻어질 것이다:
도 1은 위에서 아래 순으로, 가변 도메인(V_H, D_H 및 J_H1-6)이 인간화된, 마우스 면역글로불린 중쇄 복합체(Igh), 인간 Igh 및 마우스 Igh를 나타낸 것이다. Chro: 염색체.
도 2는 전기 융합을 통한 조작된 마우스와 인간 배아줄기세포(ES)의 혼성화를 나타낸 것이다. 마우스 ES 세포는 마커 네오마이신을 발현하고, 인간 ES는 mCherry를 발현한다. 배아 하이브리드 줄기세포(하이브리드마 세포)는 G418에 내성이 있으며, mCherry에 양성이다.
도 3a는 인간 Igh 유전자 V_H, D_H 및 J_H1-6 영역에 3쌍의 PCR 프라이머(화살표로 표시)가 배치된 것을 보여주는 모식도로, 배아 하이브리드 줄기(EHS) 세포의 유전자형을 분석하는데 사용되었다.
도 3b는 도 3a에 도시된 프라이머를 이용하여 유전자형을 분석한 12개의 배아 하이브리드 줄기(EHS) 세포 클론에 대한 PCR 결과를 나타낸 예시적인 겔이다.
도 4a 내지 도 4b는 HDR-매개 염색체 재배열(HCMR) HDR: 상동성 지시 복구를 통해 EHS 세포(도 4a)에서 조작된 인간화 염색체를 확립하기 위한 파이프라인을 나타낸 도면이다. EHS 세포는 마우스 Igh 유전자의 5'에 상동성인 5' 암, 인간 Igh 유전자의 5'에 상동성인 3' 암 및 pCMV-EGFP-polyA-PGK-Puromycin-polyA 카세트를 포함하는 5' HMCR 플라스미드; 인간 Igh 가변 유전자좌의 3' 말단에 상동성인 5' 암, 마우스 Igh 가변 유전자좌의 3'에 상동성인 3' 암 및 PGK-하이그로마이신-polyA 카세트를 포함하는 3' HMCR 플라스미드 및 (*)에 나타난 바와 같이, 마우스 Igh 및 인간 Igh의 5' 및 3' 가변 도메인을 표적으로 하는 Cas9 및 sgRNA를 포함하는 4개의 플라스미드로 공동 형질감염되었다. 또는 (도 4b) CRE-Loxp 매개 염색체 재배열 (CMCR): CMCR 과정을 매개하기 위해 4개의 플라스미드가 설계되었다. 마우스 Igh 5' (pCMV-GFP-BGH PolyA-Loxp) 및 3' (BGH polyA-Loxp-511-Hygromycin-BGH polyA-PGK-BSD-BGH PolyA) 플라스미드는 마우스 Igh 변수 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. 동시에, 인간 IGH 5' (BGH polyA-Loxp-BGH PolyA-PGP-Neomycin-BGH PolyA) 및 3' (pCMV-BGP-BGH PolyA-PGK-Loxp-511) 플라스미드는 인간 IGH 변수 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. Cre는 CMCR을 위해 성공적으로 통합된 EHS 세포로 형질감염되었다.
도 5a는 조작된 인간 염색체의 검증에 사용되는 PCR 프라이머(화살표로 표시)의 배치를 나타낸 도면이다.
도 5b는 도 5a에 나열된 4쌍의 프라이머를 이용한 PCR 결과를 나타낸다. 192개의 단일 클론에 대한 결과를 나타낸다.
도 6은 마우스 ES 세포에서 마우스 염색체를 조작된 인간 염색체로 치환한 것을 보여주는 도면이다. GFP로 표지된 조작된 인간 염색체를 운반하는 EHS 세포를 콜세미드에 노출시켜 미세화하고, 원심분리에 의해 마이크로 세포를 수집하고, 상응하는 마우스 염색체가 mCherry로 표지된 마우스 ES 세포에 전기 융합하였다. GFP+ mCherry+ 세포를 형광 활성화 세포 분류(FACS)에 의해 분리하였다. 그 후 세포를 배양하고, 마우스 염색체를 상실한 GFP+ mCherry- 세포를 FACS에 의해 분리하였다.
도 7a는 Igh 인간화 마우스를 검증하기 위해 사용된 PCR 프라이머(화살표로 나타낸 것)의 배치를 나타낸다.
도 7b는 도 7a에 도시된 7쌍의 프라이머를 이용한 예시적인 Igh 인간화 마우스에 대한 PCR 결과를 나타낸다.
도 8a는 Igh 인간화 마우스에 대한 형광 제자리 혼성화(FISH) 결과를 나타낸다.
도 8b는 Igh 인간화 마우스에 대한 G-banding 핵형 분석을 나타낸다.
도 9a는 Igh 인간화 마우스의 IGH-V에 대한 전체 게놈 시퀀싱(WGS) 분석을 나타낸다. 인간 Igh의 VH 영역에 위치한 각 가변(V) 유전자 세그먼트에 대한 WGS 서열의 카피 수를 나타낸다.
도 9b는 Igh 인간화 마우스의 IGH-D 및 IGH-J에 대한 WGS 분석을 나타낸 것이다. 인간 Igh의 D_H 및 J_H1-6 영역에 위치한 다이버시티(D) 유전자 세그먼트 및 6개의 접합(J) 세그먼트에 대한 WGS 서열의 카피 수를 나타낸다.
도 10은 마우스 Igk 유전자의 가변 도메인의 인간화를 나타낸다.
도 11a 내지 도 11b는 Igk 인간화 마우스의 PCR 검증 결과를 나타낸다. 도 11a, PCR 실험에 사용된 디자인 프라이머의 위치. 도 11b, Igk 인간화 mcie에 대해 panel A에 나열된 프라이머 5쌍을 사용한 PCR 결과를 나타낸다.
도 12는 Igk 인간화 마우스의 WGS 분석 결과를 나타낸다. 인간 IGK 유전자의 V_K 및 J_k 세그먼트 상에 위치한 각각의 항체 유전자에 대한 WGS 서열로부터의 카피 번호를 나타낸다.

본 발명은 염색체들 사이에서 서열의 큰 단편들을 전달하는 단계를 포함하는 염색체 공학용 방법들을 제공한다. 본원에 개시된 방법들을 사용하여, 적어도 5 메가베이스 쌍들(MB)의 서열들은 염색체 주형으로부터 표적 염색체로 전달될 수 있다. 본원에 개시된 방법들은 또한 역전 및 전위와 같은 염색체 재배열들을 생성하기 위해 사용될 수 있다. 또한 본원에 제공된 것은 본 발명의 방법들에 의해 생성된 조작된 염색체들 뿐만 아니라, 이들 조작된 염색체들을 포함하는 세포 및 동물들, 및 이들을 사용하는 방법들이다.

유전자 또는 염색체의 큰 조각의 조작은 치료법의 개발뿐만 아니라 기초 및 번역 연구 모두에 큰 가능성을 가지고 있다. 유전자 인간화는 가장 인기 있는 응용 분야 중 하나로, 예를 들어, 마우스와 같은 모델 유기체의 유전자가 인간 대응물로 대체된다. 예를 들어, 인간화된 Ig 유전자를 운반하는 마우스는 마우스 배경에서 인간 항체 생산을 위한 강력한 플랫폼을 제공한다. 그러나, 최대 백만 염기쌍(MB)의 염색체의 큰 조각을 운반할 수 있는 전달 벡터를 이용할 수 없기 때문에, 큰 조각 조작은 유전자 편집 분야에서 가장 중요한 과제 중 하나로 남아 있다. 아데노-연관 바이러스 벡터 또는 다른 바이러스 벡터와 같은 종래의 전달 벡터의 페이로드는 벡터가 유래되는 바이러스 유전체의 크기에 의해 제한된다.

본 명세서에 개시된 방법들은 염색체 간에 큰 서열의 효율적인 in situ 치환을 가능하게 한다. MASIRT(Massive fragment Across Species In situ Replacement Technology)라고 하는 이러한 방법들은 단일 편집 단계, 경우에 따라 서열의 메가베이스 쌍(MB)까지 염색체의 많은 부분을 대체하는 데 사용될 수 있다. 이러한 방법들은 종 간 또는 단일 종 내의 염색체 간에 큰 서열을 효율적으로 전달하는 데 사용될 수 있다. 일 실시예에서, MASIRT를 사용하여 마우스 Igh 유전자의 가변 도메인에 대해 인간화된 마우스를 수득하였다. 인간과 마우스는 항체 유전자의 배열 및 발현에서 높은 유사성을 나타내고, 중쇄의 유전체 조직 또한 이들 종 간에 유사하다. 따라서, 모든 V_H, D_H 및 J_H 유전자 세그먼트를 포함하는 마우스 유전체 서열의 약 3MB를 동등한 인간 유전자 단편을 포함하는 연속 인간 유전체 서열의 약 1MB로 대체하기 위해 MASIRT를 사용하여 인간화된 마우스 Igh 유전자를 수득하였다.

배아 줄기세포에만 작용하는 다른 방법들과 달리, 본 발명의 방법들은 유리하게는 접합체의 큰 서열을 대체하는 데 사용될 수 있다. 배아 줄기세포주는 일반적으로 쥐 이외의 종에 대해서는 이용 가능하지 않다. 대조적으로, 접합체는 많은 포유동물에 이용 가능하므로, 본 발명의 방법들은 유전자 또는 유전자 단편에 대해 인간화된 토끼 또는 소와 같은 동물을 수득하는 데 사용될 수 있다. 추가로, 본 명세서에 개시된 방법들은 큰 서열 단편, 예를 들어, 당업계에 공지된 다른 방법에 의해 사용되는 방법보다 약 5배 큰 적어도 5MB까지의 서열을 한 번에 대체하는 데 사용될 수 있다. 이는 효율을 증가시키고, 인간화된 유전자를 갖는 동물을 생성하는 데 필요한 시간 및 비용을 감소시킨다. 예를 들어, Igh 인간화 마우스는 단 3회의 교체만으로 제조될 수 있다. 추가적인 이점은 마우스에서 사용될 때, 각 교체에 1-3개월만 소요되며, 이는 당업계에 공지된 다른 방법에 대해 필요한 시간의 1/2 또는 1/3에 불과하다는 것이다.

정의

염색체는 유기체의 유전물질 전부 또는 일부를 포함하는 긴 DNA 분자이다. 대부분의 진핵염색체는 샤페론 단백질의 도움을 받아 DNA 분자에 결합하고 응축하여 무결성을 유지하는 히스톤이라는 포장 단백질을 포함한다. 진핵염색체는 단백질과 연결된 긴 선형 DNA 분자로 구성되어 있으며, 염색질이라고 불리는 단백질과 DNA의 조밀한 복합체를 형성한다. 각 염색체에는 하나의 중심체가 있고, 하나 또는 두 개의 팔이 중심부에서 돌출되어 있다. 염색체의 팔은 텔로미어로 끝나는데, 텔로미어는 반복적인 뉴클레오타이드 서열로 특화된 단백질과 관련되어 있으며, DNA 복구 시스템이 DNA 가닥의 맨 끝 부분을 이중가닥 절단으로 오인하는 것을 방지하여 염색체 DNA의 말단 부위를 점진적인 분해로부터 보호하고 선형 염색체의 무결성을 보장한다.

"유전자"는 유전자 산물(예를 들어, 단백질, 또는 비-코딩 RNA)을 코딩하는 DNA 영역뿐만 아니라, 이러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지 여부에 관계없이 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 터미네이터, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 번역 조절 서열, 인핸서, 소음기, 절연체, 경계 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 조절 영역을 포함하지만 반드시 이에 제한되지는 않는 조절 요소 서열을 포함할 수 있다. 코딩 서열은 전사 또는 전사 및 번역 시에 유전자 산물을 코딩한다. 본 발명의 코딩 서열은 단편을 포함할 수 있으며, 전체 길이 오픈 리딩 프레임을 포함할 필요는 없다. 유전자는 안티코돈을 포함하는 상보적인 가닥뿐만 아니라 전사되는 가닥 모두를 포함할 수 있다. 유전자는 또한 단백질 코딩 서열 및 비-번역 영역을 포함할 수 있는 엑손뿐만 아니라, 최종 RNA 산물로부터 스플라이싱에 의해 제거된 인트론을 포함할 수 있다.

본 명세서에서 "프로모터"란 재조합 산물을 코딩하는 DNA 서열에 인접하여 위치하는 DNA 서열을 의미할 수 있다. 프로모터는 바람직하게는 인접한 DNA 서열에 작동적으로 연결된다. 프로모터는 전형적으로 프로모터가 존재하지 않을 때 발현되는 양에 비해 DNA 서열로부터 발현되는 단백질 또는 RNA 산물의 양을 증가시킨다. 한 유기체로부터의 프로모터는 다른 유기체로부터 유래된 DNA 서열로부터 단백질 발현을 향상시키는데 사용될 수 있다. 예컨대, 척추동물에서 해파리 GFP의 발현을 위해 척추동물 프로모터를 사용할 수 있다. 뿐만 아니라, 하나의 프로모터 요소는 나란히 부착된 다수의 DNA 서열에 대해 발현되는 재조합 산물의 양을 증가시킬 수 있다. 따라서, 하나의 프로모터 요소는 하나 이상의 재조합 산물의 발현을 향상시킬 수 있다. 다수의 프로모터 요소는 당업계의 통상의 기술자에게 공지되어 있다.

본 명세서에서 말하는 "인핸서"는 단백질 또는 RNA 생성물을 코딩하는 DNA 서열에 인접하여 위치하거나, 단백질 또는 RNA 생성물을 코딩하는 DNA 서열로부터 먼 쪽에 위치하는 DNA 서열을 지칭할 수 있다. 인핸서 요소는 전형적으로 프로모터 요소의 상류에 위치하지만, 코딩 DNA 서열의 하류 또는 인트론 내와 같이 그 내에 위치할 수 있다. 경우에 따라, 인핸서는 그 발현을 조절하는 유전자로부터 킬로베이스 또는 심지어 수십 킬로베이스에 위치할 수 있다. 인핸서 요소는 프로모터 요소에 의해 제공되는 상기 DNA 서열로부터 발현되는 단백질 또는 RNA 생성물의 양을 증가시킬 수 있다. 다수의 인핸서 요소는 당업계의 통상의 기술자에 의해 용이하게 이용가능하다.

본 명세서에서 말하는 '외인성 염색체' 또는 '외인성 서열'은 동물의 유전체에 대한 외래 염색체 또는 외래 서열을 의미한다. 예를 들어, 단일 인간 염색체를 제외한 모든 염색체가 마우스 염색체인 마우스 세포에서 인간 염색체는 외인성 염색체이다. 마찬가지로, 마우스 서열의 일부가 인간 서열로 대체된 마우스 염색체에서 인간 서열을 외인성 서열이라고 한다. 마찬가지로, '내인성'은 해당 유기체에서 유래한 염색체 또는 서열, 예컨대 마우스 염색체 또는 위에 기재된 서열을 의미한다.

본 명세서에서 사용되는 바와 같이, "상동 재조합"은 상동 서열 또는 상동 암으로 알려진 유사하거나 동일한 두 분자의 DNA 사이에서 뉴클레오티드 서열이 교환되는 유형의 유전자 재조합을 의미한다. 상동 재조합은 종종 다음과 같은 기본 단계를 포함한다: DNA의 양 가닥 상에서 이중가닥 절단(double-strand break; DSB)이 발생한 후, DSB의 5' 말단 주위의 DNA 부분이 절제(resection)라고 불리는 과정에서 절단된다. 이어서, 가닥 침입 단계에서, 절단된 DNA 분자의 돌출된 3' 말단이 절단되지 않은 유사하거나 동일한(또는 상동) DNA 분자, 예를 들어, 상동 암을 "침입"한다. 가닥 침입 후, 이벤트의 추가적인 순서는 DSBR(double-strand break repair; 이중가닥 절단 복구) 경로 또는 SDSA(synthesis-dependent strand annealing; 합성 의존적 가닥 어닐링) 경로 중 어느 하나의 경로를 따를 수 있다.

본 명세서에서 사용되는 "DNA 복구 경로"는 DNA의 단일 또는 이중가닥 절단과 같은 DNA 손상 검출에 반응하여 세포가 유전체 무결성 기능을 유지할 수 있도록 하는 세포 메커니즘을 의미한다. DNA 복구 경로는 DNA 손상의 유형 및 정도, 세포 주기 단계에 따라 절제, 표준 상동성 지시 복구(캐노니컬 HDR), 상동 재조합(HR), 대체 상동성 지시 복구(alt-HDR), 이중가닥 절단 복구(DSBR), 단일가닥 어닐링(SSA), 합성 의존성 가닥 어닐링(SDSA), 절단-유도 복제(BIR), 대체 엔드 접합(alt-EJ), 마이크로호몰로지 매개 엔드 접합(MMEJ), DNA 합성 의존성 마이크로호몰로지 매개 엔드 접합(SD-MMEJ), 표준 비상동성 엔드 접합(C-NHEJ)와 같은 비동종 말단 접합(NHEJ) 복구, 대체 비-호몰로지 엔드 접합(A-NHEJ) 경로, 트랜슬리온 DNA 합성(TLS) 복구, 염기 절제 복구(BER), 뉴클레오티드 절제 복구(NER), 불일치 복구(MMR), DNA 손상 반응성(DDR), 블런트 엔드 접합(Blunt End Jointing), 단일가닥 절단 복구(SSBR), 인터스트랜드 크로스링크 복구(ICL) 및 판코니 빈혈 경로(FA)를 포함할 수 있다.

본 명세서에서 사용된 바와 같이, 상동성 지시 복구(HDR)는 상동성 핵산(예를 들어, 자매 염색질 또는 외인성 핵산)을 이용하여 DNA 손상을 복구하는 과정을 의미한다. 정상 세포에서, HDR은 전형적으로 절단의 인식, 절단의 안정화, 절제, 단일가닥 DNA의 안정화, DNA 교차 중간체의 형성, 교차 중간체의 분해 및 결찰과 같은 일련의 단계를 포함한다.

본 명세서에서 "상동체"란 동일한 생물학적 기능을 수행하는 단백질 군의 단백질, 예를 들어, 동일한 단백질 군에 속하며 공통된 형질을 제공하거나 동일 또는 유사한 생물학적 기능을 수행하는 단백질을 의미한다. 상동체는 상동 유전자에 의해 발현된다. 상동 유전자는 제2 유전자에 의해 암호화된 단백질과 동일 또는 유사한 생물학적 기능을 갖는 단백질을 암호화하는 유전자이다. 상동 유전자는 종분화(ortholog)의 발생 또는 유전적 복제(paralogs)의 발생에 의해 생성될 수 있다. "동원체(ortholog)"란 종분화에 의해 공통의 조상 유전자로부터 진화된 상이한 종들의 상동 유전자들의 세트를 의미한다. 일반적으로, 동원체는 진화가 진행되는 동안 동일한 기능을 유지한다. "이원체(paralog)"는 유전적 복제의 결과로 서로 분기된 같은 종의 상동 유전자들의 집합을 가리킨다. 따라서 상동 유전자는 같은 생물체일 수도 있고 다른 생물체일 수도 있다. 상동 유전자는 자연적으로 발생하는 대립유전자와 인공적으로 만들어진 변이체를 포함한다. 상동 단백질 간의 동일성 백분율은 단백질의 출처와 단백질이 유래된 종이 분기된 정도에 따라 달라진다. 더 밀접하게 관련된 종의 상동 단백질은 일반적으로 더 멀리 관련된 종의 단백질보다 더 유사할 것이다. 최적으로 정렬된 경우, 상동 단백질은 전형적으로 단백질의 전체 길이에 걸쳐 적어도 약 40%의 동일성, 약 50%의 동일성, 약 60%의 동일성, 일부 경우에 적어도 약 70%, 예를 들어 약 80% 및 심지어 약 90%의 동일성을 갖는다. 다른 경우, 예를 들어 고도로 상이한 종으로부터의 단백질을 비교할 때, 상동 단백질은 DNA 결합 도메인과 같은 보존된 단백질 도메인의 길이에 걸쳐 적어도 약 40%의 동일성, 약 50%의 동일성, 약 60%의 동일성, 약 70%의 동일성 또는 약 90%의 동일성을 가질 것이다.

상동 유전자 또는 단백질은 DNA 또는 아미노산 서열의 비교, 예를 들어 수동으로 또는 BLAST, FASTA, Smith-Waterman 등으로 알려진 상동 기반 검색 알고리즘을 사용하여 컴퓨터 기반 도구를 사용하여 식별된다. 유사한 서열을 찾기 위한 서열 데이터베이스는 로컬 서열 정렬 프로그램, 예를 들어 BLAST를 사용하여 검색할 수 있으며, 서열 염기 유사성을 측정하는 데 사용되는 요약 기대 값(E-value)을 사용한다. 특정 유기체에 대해 가장 좋은 E-value를 갖는 히트 단백질이 반드시 동원체일 필요는 없기 때문에, 즉 동일한 기능을 갖거나 또는 유일한 동원체일 수 있으므로, 호혜적 쿼리(reciprocal query)를 사용하여 동원체 식별을 위해 중요한 E-value를 갖는 히트 서열을 필터링할 수 있다. 호혜적 쿼리는 쿼리 단백질의 서열과 유사한 기본 유기체의 아미노산 서열 데이터베이스에 대한 중요한 히트의 검색을 수반한다. 호혜적 쿼리의 최고 히트는 쿼리 단백질 자체 또는 사양화 후 복제된 유전자에 의해 암호화된 단백질일 때, 히트를 동원체로 식별할 수 있다.

본원에서 사용되는 바와 같이, "동일성 백분율"이란, 2개의 최적으로 정렬된 DNA 또는 단백질 세그먼트가 구성요소의 정렬 윈도우 전체에 걸쳐 불변인 정도, 예를 들어, 뉴클레오티드 서열 또는 아미노산 서열을 의미한다. 시험 서열 및 참조 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 2개의 정렬된 세그먼트의 서열에 의해 공유되는 동일한 구성요소의 수를 전체 시험 서열 또는 참조 서열 중 더 작은 정렬 윈도우 전체의 서열 구성요소의 수로 나눈 값이다. "동일성 백분율"("동일성 백분율")은 동일성 분율 100배이다. 이러한 최적 정렬은 DNA 서열의 국소 정렬로서 간주되는 것으로 이해된다. 단백질 정렬을 위해, 단백질 서열의 국소 정렬은 최적 정렬을 달성하기 위해 갭의 도입을 허용해야 한다. 동일성 백분율은 정렬 자체에 의해 도입된 갭을 포함하지 않는 정렬된 길이에 걸쳐 계산될 수 있다.

본 명세서에서 "특이적"이라 함은 가이드 RNA의 상동성 팔 또는 표적화 서열 등의 염기서열과 동일하거나 실질적으로 동일한 염기서열을 의미한다. 다른 염기서열에 "특이적"인 염기서열은 왓슨-크릭 염기쌍화를 통하여 다른 염기서열 또는 그 역보체에 혼성화할 수 있다. 따라서, 다른 염기서열에 특이적인 염기서열은 다른 염기서열 또는 그 역보체와 매우 유사하지만 완전히 동일할 필요는 없는 염기서열임을 당업자는 인식할 것이다. 예를 들어, 다른 염기서열에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97% 또는 99% 동일한 염기서열은 다른 염기서열에 혼성화할 수 있는 경우 여전히 해당 염기서열에 특이적이다. 추가적인 예로, 가이드 핵산 표적화 서열은 표적서열의 불일치 위치에 따라 표적서열에 1, 2, 3 이상의 불일치를 포함할 수 있지만, 표적서열에 대한 gNA 및 엔도뉴클레아제를 포함하는 리보뉴클레오단백질 복합체를 표적화할 수 있는 경우 여전히 표적서열에 특이적이다.

본 명세서에서 사용되는 "선별"은 당업계에 공지된 임의의 방법을 사용하여 별개의 생성물의 2개 집단을 분리하는 것을 의미한다. 세포, 염색체 또는 서열에 적용되는 바와 같이 선택은 선택가능한 마커와 같은 마커에 기초하여 수행될 수 있다. 선택가능한 마커를 발현하는 세포를 선별하는 것은 마커를 발현하는 세포 및 마커를 발현하지 않는 세포를 선택 배지에서 배양하는 것을 포함하여, 마커를 발현하지 않는 세포가 사멸되거나 그 성장이 억제된다. 마커를 포함하는 서열 또는 염색체는 유사하게 세포 내에 배치하고 선택적 요법을 적용함으로써 선별될 수 있다. 유사하게, 선별은 검출가능한 마커, 예컨대 형광 단백질에 기초하여 수행될 수 있다. 검출가능한 마커를 발현하는 세포는 당업계에 공지된 방법, 예컨대 형광 활성화 세포 분류(FACS)를 사용하여 검출가능한 마커에 기초하여 세포의 혼합 집단으로부터 물리적으로 제거될 수 있다. 대안적으로, 또는 대안적으로, 세포의 혼합 집단은 단일 세포가 분리하여 배양될 수 있도록 희석될 수 있고, 마커와 같은 하나 이상의 형질의 존재에 대해 분석된 단리된 세포 유래 클론이다.

본 명세서에서 사용되는 "유도된 (derived from)"는 분자 실체, 예를 들어 핵산 또는 단백질의 출처(source) 또는 출처(origin)를 나타낸다. 분자 실체의 출처는 자연 발생적, 재조합적, 비정제적, 또는 정제된 분자 실체일 수 있다. 예를 들어, 제2 폴리펩티드로부터 유도된 폴리펩티드는 예를 들어, 제2 단백질의 아미노산 서열과 동일하거나 실질적으로 유사한 아미노산 서열, 예를 들어, 50% 초과 상동인 아미노산 서열을 포함할 수 있다. 유도된 분자 실체, 예를 들어, 핵산 또는 단백질은 하나 이상의 변형, 예를 들어, 하나 이상의 아미노산 또는 뉴클레오티드 변화를 포함할 수 있다.

"단리된 (isolated from)"은 그 출처(source) 또는 출처(origin)로부터 정제, 제거 또는 분리된 분자 개체를 의미한다.

"자연적으로 발생하는 (naturally occurring)" 서열은 자연에서 발견되는 적어도 하나의 종에서 발견되는 것을 말한다.

"인공 서열"은 자연에서 발견되지 않는 서열을 의미한다. 인공 서열은 자연적으로 발생하는 서열과 유사할 수 있지만, 자연적으로 발생하는 서열에 비해 하나 이상의 변경을 포함한다. 대안적으로, 인공 서열은 임의의 자연적으로 발생하는 서열과 거의 또는 전혀 유사성을 갖지 않을 수 있다. 키메라, 또는 재조합 서열은 서로 인접하여 발견되지 않거나 상이한 출처의 두 서열이 작동 가능하게 함께 연결된 일종의 인공 서열이다.

"작동적으로 연결된" 또는 "작동 가능하게 연결된"은 유전적 요소의 병치로서, 그 요소들은 예상되는 방식으로 작동하는 것을 허용하는 관계에 있다. 예를 들어, 프로모터가 코딩 서열의 전사를 개시하는 것을 돕는 경우, 프로모터는 코딩 영역에 작동적으로 연결된다. 이러한 기능적 관계가 유지되는 한, 프로모터와 코딩 영역 사이에는 개재 잔기들이 존재할 수 있다.

본 명세서에서는 줄기세포를 지칭하는 용어로 다음과 같은 분류를 사용한다. 발달 단계로 볼 때, 가장 다능하고 빠른 것은 "배아줄기세포" 또는 "ES세포"이다. ES세포는 갓 유래된 1차 세포일 수도 있고, ES세포주로부터 유래된 세포일 수도 있다. 체세포 조직(배아세포 조직을 제외한 모든 조직)의 다른 모든 줄기세포는 일반적으로 "체세포"로 정의되지만 일반적으로 다음 중 일부 또는 전부로 알려져 있다: "성체줄기세포(adult stem cell)", "성숙줄기세포(mature stem cells)", "간세포(progenitor cells)", "간줄기세포(progenitor stem cells)", "전구세포(precursor cells)" 및 "전구줄기세포(precursor stem cells)". 비-ES세포의 다른 부류를 "생식줄기세포(germ line stem cells)"라고 정의한다. 마지막으로, 비-줄기세포를 "성체세포(mature cells)"라고 정의하지만, "분화세포(differentiated cells)", "성숙분화세포(mature differentiated cells)", "최종분화세포(terminally differentiated cells)", "체세포(somatic cells)"라고도 한다. 성숙세포는 또한 조직 또는 불멸의 세포주 또는 종양 유래 세포주로부터 유래된 1차 단리된 세포일 수 있다. 본 발명은 줄기세포 또는 성숙세포 중 어느 하나에 대해 일반적으로 사용되는 과학적 정의를 충족하지 못하는 모든 세포를 포함하는 "성숙세포의 전구체 형태"를 추가로 포함한다. ES 세포는 시험관 내에서 장기간 배양될 수 있으며, 정상 배반포의 공동에 삽입/주입되기 전에 생식세포를 포함한 성체 동물의 모든 세포 유형으로 분화하기 위해 정상적인 배아 발달 프로그램을 재개하도록 유도된다.

본 명세서에서 사용되는 "하이브리드 세포"는 두 개의 유전체에서 나온 원소들을 포함하는 세포를 의미한다. 숙련된 기술자는 하이브리드 세포가 서로 다른 소스에서 나온 두 개의 완전한 또는 거의 완전한 유전체를 포함할 수 있다는 것을 이해할 것이다. 또는 하이브리드 세포는 한 소스에서 나온 완전한 유전체와 두 번째 소스에서 나온 몇 개의 염색체, 하나의 염색체, 또는 하나의 염색체의 일부만을 포함할 수 있다. 여전히 하이브리드 세포는 상술한 양 극단의 상라 사이에 있는 두 개의 유전체에서 나온 임의의 원소 혼합물을 포함하는 세포로 간주된다. 하이브리드 세포는 서로 다른 개체, 동일한 종의 서로 다른 균주, 또는 서로 다른 종의 것일 수 있다. 하이브리드 세포는 당업계에 공지된 임의의 방법에 의해 생성될 수 있다. 이들은 세포 융합 및 한 세포에서 다른 세포로 적은 수의 염색체를 전달하는 미세세포 매개 염색체 전달(MMCT)을 포함하지만 이에 국한되지 않는다.

본 명세서에서 '하이브리드 배아줄기(Hybrid Embry Stem, EHS)' 세포란 배아줄기세포의 특성을 갖는 하이브리드 세포를 의미한다. EHS 세포는 서로 다른 두 종의 ES 세포가 융합되어 생성될 수도 있고, MMCT 매개 염색체가 한 종의 세포에서 다른 종의 줄기세포로 전달되어 생성될 수도 있다.

본원에서 사용되는 "암"은 당업계에 공지된 바와 같이 조절되지 않는 세포 성장 또는 복제를 특징으로 하는 질병, 상태, 형질, 유전자형 또는 표현형을 의미한다. 암은 고형 종양 및 액체 종양 모두를 포함한다. 예시적인 암은 백혈병, 유방암, 골암, 뇌암, 두경부암, 망막암, 식도암, 위암, 다발성 골수종, 난소암, 자궁암, 갑상선암, 고환암, 자궁내막암, 흑색종, 대장암, 폐암, 방광암, 전립선암(소세포 및 비소세포 폐암 둘 모두 포함), 췌장암, 육종, 암종, 자궁경부암, 두경부암, 피부암을 포함하지만 이에 제한되지 않는다.

본 명세서에서 언급된 모든 출판물, 특허 및 특허 출원은 각각의 개별 출판물, 특허 또는 특허 출원이 참조에 의해 구체적으로 그리고 개별적으로 통합될 것을 표시한 것과 동일한 범위 내에서 본 명세서에 언급된 모든 출판물, 특허 및 특허 출원이 참조에 의해 통합된다.

염색체 조작 방법

본 발명은 주형 염색체, 표적 염색체, 벡터 또는 플라스미드와 같은 하나 이상의 핵산분자 및 상동성 지시 복구를 사용하여 염색체를 조작하는 방법을 제공한다. 뉴클레아제는 주형 염색체에서 주형서열을 측면에 두고, 표적서열을 측면에 또는 표적 염색체의 표적 위치에서 이중가닥 절단을 생성하는 데 사용된다. 표적 및 주형 염색체의 서열을 포함하는 마커 및 상동성 암을 포함하는 하나 이상의 핵산분자는 표적서열을 주형서열로 대체하거나, 표적 위치에서 주형서열을 삽입하거나, 또는 이중가닥 절단 부위에서 표적 및 주형서열을 결합하여 염색체 재배열을 생성하는 데 사용된다.

일부 실시예들에서, 방법들은 표적서열을 주형서열로 대체하는 단계를 포함하며, 즉 표적서열은 주형서열의 삽입에 의해 삭제된다.

일부 실시형태에서, 방법들은 표적서열을 주형서열로 대체하는 단계를 포함한다. 임의의 적절한 주형서열, 및 임의의 적절한 표적서열이 본원에 기술된 방법에 사용될 수 있다. 예를 들어, 상기 방법들은 모델 유기체로부터의 염색체의 일부를 상동 인간 서열로 대체하는 데 사용될 수 있으며, 이에 의해 모델 유기체의 게놈의 그 부분을 인간화한다. 대안적으로, 큰 서열이 표적서열의 거의 또는 전혀 결실 없이 표적 위치에 삽입될 수 있다.

일부 실시형태에서, 본 발명은 하기 단계를 포함하는 조작된 염색체의 제조방법을 제공한다: (a) 표적서열을 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 상기 세포를 하기 핵산분자와 접촉시키는 단계 (i) 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및 (ii) 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자; (c) 주형서열 및 상기 제1 및 제2 마커가 표적 염색체 내로 삽입되어, 표적서열의 양 측면, 및 주형서열의 5' 말단 및 3' 말단에서 이중가닥 절단(double strand break)을 생성하는 단계; 및 (d) 상기 제1 및 제2 마커를 발현하는 세포 또는 세포들을 선별하는 단계. 일부 구현예에서, 제1 핵산분자 및/또는 제2 핵산분자는 플라스미드이다. 본 명세서에 기재된 방법의 일부 구현예에 대한 제1 핵산분자, 표적서열 및 제2 핵산분자의 상동성 암의 배열을 도 4a-4b에 나타내었다. 일부 구현예에서, 제1 마커는 주형서열의 5' 말단에 위치하고 제2 마커는 주형서열의 삽입 후 주형서열의 3' 말단에 위치한다. 예를 들어, 본 명세서에 기재된 방법으로 생산된 조작된 염색체는 주형서열의 삽입 및 표적서열의 결손 후, 표적서열의 상류에 있는 표적 염색체 서열, 제1 마커, 주형서열, 제2 마커, 및 표적서열의 하류에 있는 표적 염색체 서열을 포함한다.

숙련된 기술자는 많은 길이의 주형서열이 본 명세서에 기술된 방법에 적합하다는 것을 인식할 것이다. 적합한 주형서열은 수백 개의 염기쌍만큼 작을 수 있거나, 또는 염색체의 대부분을 포함할 수 있고, 따라서 최대 수백 메가베이스 쌍의 길이일 수 있다. 본 발명의 방법의 일부 구현예에서, 주형서열은 길이가 적어도 25 KB, 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB, 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 50 MB, 적어도 100 MB, 적어도 150 MB, 적어도 200 MB, 또는 적어도 250 MB이다. 일부 구현예에서, 주형서열의 길이가 50 KB 내지 250 MB, 10 KB 내지 200 MB, 200 KB 내지 50 MB, 500 KB 내지 50 MB, 1 MB 내지 100 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 5 MB 내지 50 MB, 5 MB 내지 10 MB, 3 MB 내지 10 MB, 또는 5 MB 내지 50 MB이다.

본 발명의 방법의 일부 구현예에서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 제3 엔도뉴클레아제 부위, 주형서열, 제4 엔도뉴클레아제 부위, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함한다.

숙련된 기술자는 많은 길이의 표적서열이 본원에 기술된 방법에 적합하다는 것을 인식할 것이다. 적합한 표적서열은 이중가닥 절단(표적 위치)을 생성하는데 사용되는 엔도뉴클레아제 부위만큼 작거나, 염색체의 대부분을 포함할 수 있고, 따라서 최대 수백 메가베이스 쌍의 길이일 수 있다. 본 발명의 방법의 일부 구현예에서, 표적서열은 길이가 적어도 25 KB, 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB, 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 50 MB, 적어도 100 MB, 적어도 150 MB, 적어도 200 MB, 또는 적어도 250 MB이다. 일부 구현예에서, 표적서열의 길이가 50 KB 내지 250 MB, 10 KB 내지 200 MB, 200 KB 내지 50 MB, 500 KB 내지 50 MB, 1 MB 내지 100 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 5 MB 내지 50 MB, 5 MB 내지 10 MB, 3 MB 내지 10 MB, 또는 5 MB 내지 50 MB이다.

본 발명의 방법의 일부 구현예에서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함한다. 일부 구현예에서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 제1 엔도뉴클레아제 부위, 표적서열, 제2 엔도뉴클레아제 부위 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함한다.

일부 구현예에서, 본 명세서에 기재된 방법에 사용된 핵산분자는 DNA 분자이다. 일부 구현예에서, 본 명세서에 기재된 방법에 사용된 핵산분자는 원형, 예를 들어 플라스미드이다. 대안적으로, 추가의 엔도뉴클레아제 부위를 사용하여 본 발명의 핵산분자를 선형화할 수 있다. 예시적인 엔도뉴클레아제 부위는 제한 엔도뉴클레아제 뿐만 아니라 본 명세서에 기재된 CRISPR/Cas 엔도뉴클레아제, ZFN 및 TALEN을 포함하지만 이에 제한되지는 않는다. 숙련된 기술자는 적합한 엔도뉴클레아제 부위를 핵산분자 내에, 예를 들어 핵산분자의 어느 하나 또는 양쪽 상동성 암에 인접하거나 그 근처에 통합할 수 있을 것이다. 숙련된 기술자는 적합한 CRE 재조합 부위를 핵산분자 내에 통합할 수 있을 것이다.

일부 구현예에서, 표적서열은 주형서열의 삽입에 의해 삭제되고, 주형 및 표적 염색체는 CRISPR/Cas 리보뉴클레오단백질에 의해 주형 및 표적서열의 어느 한쪽에서 절단된다. 일부 구현예에서, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 표적서열, 제2 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고, (b) 주형 염색체가 제3 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제4 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 제1, 제2, 제3 및 제4 sgRNA는 상이한 표적서열을 포함한다. 예를 들어, 제1 sgRNA는 표적 염색체 상의 제1 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제2 sgRNA는 표적 염색체 상의 제2 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제3 sgRNA는 주형 염색체 상의 제3 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제4 sgRNA는 표적 염색체 상의 제4 sgRNA 표적서열에 특이적인 표적서열을 포함한다. 대안적으로, sgRNA 표적서열, 및 대응하는 sgRNA 표적서열 중 하나 이상은 동일한 서열일 수 있다.

일부 실시형태에서, 주형서열을 삽입하는 것은 표적서열의 서열의 거의 또는 전혀 결실을 포함하지 않는다. 당업자는 이중가닥 절단 수리의 많은 메커니즘에서 절단의 말단의 절제를 수반하고, 따라서 본원에 기술된 엔도뉴클레아제 부위 주변에서 결손을 생성할 것임을 인식할 것이다. 예를 들어, 표적 위치 주변의 약 5bp, 10bp, 15bp, 20bp, 20bp, 25bp, 30bp, 35bp, 40bp, 45bp 또는 50bp의 결손 또는 표적서열의 측면에 있는 엔도뉴클레아제 부위는 본원에 기술된 방법에 의해 생성될 수 있다.

일부 실시예들에서, 예를 들어, 본 명세서에 기술된 방법들에 의해 표적서열이 거의 또는 전혀 삭제되지 않는 실시예들이고, (a) 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고; (b) 주형 염색체가 제2 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제3 sgRNA 표적서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 제1, 제2 및 제3 sgRNA는 상이한 표적서열을 포함한다. 예를 들어, 제1 sgRNA는 표적 염색체 상의 제1 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제2 sgRNA는 표적 염색체 상의 제2 sgRNA 표적서열에 특이적인 표적서열을 포함하고, 제3 sgRNA는 주형 염색체 상의 제3 sgRNA 표적서열에 특이적인 표적서열을 포함한다.

일부 구현예에서, 주형열을 삽입하는 것은 표적서열의 하나 이상의 기능을 방해한다. 예를 들어, 유전자의 코딩 서열에 주형서열을 삽입하는 것은 조기 정지 코돈의 생성, 단백질 코딩 서열의 돌연변이, 비정상 스플라이스 생성물 등을 통해 적절한 유전자 생성물의 발현을 방지할 수 있다. 유사하게, 인핸서 또는 프로모터와 같은 유전자의 조절 서열에 템플릿 서열을 삽입하는 것은 유전자가 발현되는 것을 방지할 수 있다.

일부 구현예에서, 본 발명의 방법은 표적서열의 삽입 후에 제1 및/또는 제2 마커를 삭제하는 단계를 포함한다. 마커는 당업계에 공지된 임의의 적합한 방법에 의해 삭제될 수 있다. 예를 들어, 조작된 염색체를 포함하는 세포는 마커를 코딩하는 서열에 특이성이 있는 gNA 표적서열을 포함하는 CRISPR/Cas 리보뉴클레오단백질과 접촉될 수 있으며, 이에 의해 마커 서열의 전부 또는 일부의 삭제를 유도한다.

본 발명의 방법은 염색체의 재배열, 예컨대 역전 및 전위를 생성하는 데 사용될 수 있다. 많은 염색체의 재배열은 인간의 질병 또는 질병, 예를 들어 암에 있어서 역할을 한다. 마우스와 같은 모델 유기체에서 이러한 재배열을 재창조하는 것은 이러한 질병 또는 질병에 대한 연구를 용이하게 할 수 있다. 관련된 염색체 이상은 당업자에게 공지될 것이고, mitelmandatabase.isb-cgc.org/ 에서 제공되는 미텔만 데이터베이스에 기재된다. 인간의 질병에 관련된 염색체 이상에 관한 추가 정보는 또한 rarediseases.info.nih.gov/diseases/diseases-by-category/36/chromosome-disorders 에서 이용 가능하다.

따라서, 본 발명은 하기 단계를 포함하는 염색체 재배열(rearrangement)의 제조방법을 제공한다: (a) 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 표적 위치의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계; (c) 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되고 염색체 재배열이 제조되도록, 표적 위치, 및 주형서열의 5' 말단에서 이중가닥 절단을 제조하는 단계; 및 (d) 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계. 대안적으로, 방법은 (a) 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계; (b) 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계; (c) 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되도록, 표적 위치, 및 주형서열의 3' 말단에서 이중가닥 절단을 제조하는 단계; 및 (c) 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계를 포함한다. 일부 실시형태에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단하도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 5' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함한다. 일부 실시형태에서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단하도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 3' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함한다. 일부 실시형태에서, 핵산분자는 DNA를 포함한다. 일부 실시형태에서, 핵산분자는 플라스미드를 포함한다.

당업계에 공지된 적절한 방법을 사용하여 표적 및 주형 염색체에서 이중가닥 절단을 생성할 수 있다. 이는 특히 표적 및 주형 염색체 상의 엔도뉴클레아제 부위에 중첩하거나 포함하는 사용된 핵산분자(예를 들어, 플라스미드)에 대한 상동성 암 서열의 선택을 통해 달성될 수 있다. 일부 실시형태에서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(gNAs), 하나 이상의 아연 핑거 뉴클레아제, 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(TALEN), 또는 하나 이상의 CRE 재조합효소를 사용하는 단계를 포함한다. 예를 들어, Cre 재조합효소는 두 LoxP 부위 사이의 염색체 영역의 역전을 유도하고, 이로써 주형서열과 제1 및 제2 마커가 표적 염색체에 삽입된다. 일부 실시형태에서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체, 동원체, 또는 변형된 버전을 포함한다. 일부 실시형태에서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cas12a (Cpf1), Cas13a, CasX, CasY, C2c1, 또는 C2c3을 포함한다. 일부 실시형태에서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함한다. 일부 실시형태에서,gNA는 단일 가이드 RNA(sgRNA)를 포함한다.

본 명세서에 기재된 엔도뉴클레아제와 세포를 접촉시키기 위해 당업계에 공지된 임의의 적절한 방법이 사용될 수 있다. 예를 들어, 엔도뉴클레아제를 포함하는 핵산분자(예를 들어, 플라스미드 등), 및 CRISPR/Cas 엔도뉴클레아제에 대한 gNA를 코딩하는 서열이 세포를 형질감염시키는데 사용될 수 있다. 대안적으로, 엔도뉴클레아제, 또는 엔도뉴클레아제를 코딩하는 핵산분자는 전기천공법(electroporation), 지방감염(lipofection), 형질도입(transduction) 등에 의해 세포 내로 도입될 수 있다.

본 명세서에 기재된 방법을 수행하기 위해 사용되는 세포는 당업계에 공지된 임의의 적합한 세포일 수 있다. 일부 구현예에서, 세포는 배아줄기(ES) 세포를 포함한다. 일부 구현예에서, 세포는 배아 하이브리드 줄기(EHS) 세포를 포함한다. EHS 세포는 인간과 쥐, 인간과 래트, 또는 쥐와 원숭이 등 서로 다른 두 종의 ES 세포를 융합하여 만들 수 있다. 당업계에 공지된 모든 융합 방법은 전기 융합, 바이러스 유도 융합 및 화학 유도 융합을 포함하지만 이에 제한되지 않는 본 발명의 범위 내에서 예상된다. 일부 구현예에서, 방법은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 EH 세포에 인간 EH 세포를 융합하는 단계를 포함한다. 일부 구현예에서, 방법은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 상이한 두 종의 ES 세포를 융합하는 단계를 포함한다.

일부 구현예에서, 상기 세포는 접합체(zygotes)를 포함한다. 본원에 사용되는 바와 같이, 용어 "접합체"는 포유동물의 난자와 정자와 같은 두 생식체 사이의 수정 사건에 의해 형성된 진핵세포를 의미한다. 단일 세포, 2 세포, 4 세포, 8 세포 또는 그 이상의 단계에서의 접합체는 본원에 기술된 방법에 적합할 수 있다.

본원에 기술된 바와 같이 조작된 염색체를 생성한 후, 조작된 염색체를 회수하기 위해 임의의 적합한 방법이 사용될 수 있다. 일부 실시형태에서, 본 발명의 조작된 염색체를 회수하는 것은 마이크로-세포 매개 염색체 전달(MMCT)을 포함한다. 조작된 염색체를 포함하는 소핵 세포를 ES 세포와 같은 표적 세포로 융합함으로써 다운스트림 적용을 위해 임의의 적합한 세포 유형으로 전달된 회수된 염색체. 이들 방법은 하기에 더 상세하게 기술되어 있다.

주형 염색체

본 발명은 본원에 기술된 방법들에 사용하기 위해, 주형서열들을 포함하는 주형 염색체들을 제공한다.

본원에서 사용되는 바와 같이, "주형 염색체"는 "주형서열"을 포함하는 염색체를 지칭한다. 주형서열은 본 발명의 방법을 사용하여 표적 염색체, 또는 표적 위치에 도입될 서열을 지칭한다.

주형 염색체는 임의의 적합한 공급원으로부터 분리되거나 유래될 수 있다. 일부 구현예에서, 주형 염색체는 진핵생물로부터 유래된다. 일부 구현예에서, 진핵생물은 척추동물, 예를 들어, 새, 파충류 또는 포유류이다. 일부 구현예에서, 주형 염색체는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭으로부터 유래된다. 일부 구현예에서, 주형 염색체는 인간으로부터 유래된다.

일부 실시형태에서, 주형 염색체는 외인성 염색체이고, 주형서열은 외인성 서열이다. 예를 들어, 표적 염색체는 마우스 염색체이고, 주형 염색체 및 상응하는 주형서열은 인간과 같은 비-마우스 종으로부터의 것이다.

일부 구현예에서, 주형 염색체는 내인성 염색체이고, 주형서열은 내인성 서열이다. 예컨대, 주형 염색체는 마우스 염색체이고, 표적 염색체는 제2의 상이한 마우스 염색체이다.

일부 구현예에서, 주형 염색체는 인공 염색체이다.

일부 구현예에서, 주형 염색체는 자연적으로 발생하는 염색체이다.

일부 구현예에서, 주형 염색체는 자연적으로 발생하는 염색체에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 서열의 삽입, 결손 및 재배열을 포함한다. 주형 염색체에 삽입된 서열의 예는 특히, 마커, 프로모터, cDNA 서열, 비코딩 등을 포함한다.

일부 구현예에서, 주형 염색체는 주형서열의 5'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 주형 염색체는 주형서열의 3'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 엔도뉴클레아제 부위는 주형서열에 바로 인접하게 위치한다. 일부 구현예에서, 엔도뉴클레아제 부위는 주형서열 근처에 위치한다.

일부 구현예에서, 주형 염색체는 주형서열의 양 측 상의 엔도뉴클레아제 부위를 포함한다. 예를 들어, 주형 염색체는 주형서열의 5'에 위치한 제1 엔도뉴클레아제 부위 및 주형서열의 3'에 위치한 제2 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 제1 및 제2 엔도뉴클레아제 부위 모두는 동일한 엔도뉴클레아제에 의해 인식되고 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위 모두는 동일한 엔도뉴클레아제에 의해 인식되는 동일한 DNA 서열을 포함한다. 일부 구현예에서, 제1 엔도뉴클레아제 부위는 제1 엔도뉴클레아제에 의해 절단되고, 제2 엔도뉴클레아제 부위는 제2 엔도뉴클레아제에 의해 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위는 상이한 표적서열을 포함하는 가이드 핵산(gNA)을 포함하는 CRISPR/Cas 리보뉴클레오단백질 복합체에 의해 인식되는 상이한 DNA 서열 또는 상이한 표적서열을 포함한다. 일부 구현예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 주형서열에 바로 인접하여 위치한다. 일부 구현예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 주형서열 근처에 위치한다.

주형서열의 5bp 내에, 10bp 내에, 15bp 내에, 20bp 내에, 30bp 내에, 40bp 내에, 50bp 내에, 70bp 내에, 80bp 내에, 100bp 내에, 120bp 내에, 140bp 내에, 180bp 내에, 200bp 내에, 300bp 내에, 400bp 내에, 또는 500bp 내에 있는 서열은 주형서열 근처에 있는 것으로 간주될 수 있다.

일부 구현예에서, 주형 염색체는 상동성 지시 복구를 용이하게 하기 위해 사용되는 핵산분자의 상동성 암의 하나 이상의 서열을 포함한다. 일부 구현예에서, 주형 염색체는 주형서열의 5' 말단 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 상동성 암은 주형서열의 상류, 즉 5'에 위치한다. 일부 구현예에서, 주형 염색체는 5' 내지 3', 엔도뉴클레아제 부위, 상동성 암 서열 및 주형서열을 포함한다. 일부 구현예에서, 주형 염색체는 주형서열의 3' 말단 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 상동성 암은 주형서열의 하류, 즉 3'에 위치한다. 일부 구현예에서, 주형 염색체는 5' 내지 3', 주형서열, 상동성 암 서열 및 엔도뉴클레아제 부위를 포함한다. 일부 구현예에서, 상동성 암 서열은 엔도뉴클레아제 부위와 주형서열 사이에 위치한다.

일부 구현예에서, 주형 염색체는 주형서열의 5'에 위치하거나 그 근처에 위치한 제1 상동성 암 서열 및 주형서열의 3'에 위치하거나 그 근처에 위치한 제2 상동성 암 서열을 포함한다. 즉, 주형 염색체는 주형서열의 상류 및 하류에 상동성 암을 포함한다. 일부 구현예에서, 제1 상동성 암은 5' 내지 3', 표적서열의 5' 말단의 상류에 뉴클레오티드 서열, 적어도 제1 마커의 서열 및 제1 상동성 암 서열을 포함하는 5' 상동성 암인 제1 핵산분자의 3' 상동성 암이다. 일부 구현예에서, 제2 상동성 암은 5' 내지 3', 제2 상동성 암 서열, 적어도 제2 마커의 서열, 및 표적서열의 3' 말단의 뉴클레오티드 서열을 포함하는 3' 상동성 암인 제2 핵산분자의 5' 상동성 암이다. 일부 구현예에서, 주형 염색체는 5' 내지 3', 제1 엔도뉴클레아제 부위, 제1 상동성 암 서열, 주형서열, 제2 상동성 암 서열, 및 제2 엔도뉴클레아제 부위를 포함한다.

일부 실시형태에서, 제1 및/또는 제2 상동성 암 서열은 제1 및/또는 제2 엔도뉴클레아제 부위에 바로 인접하여 위치한다. 일부 실시형태에서, 제1 상동성 암 서열은 제1 엔도뉴클레아제 부위에 바로 인접하여 위치하고, 제2 상동성 암 서열은 제2 엔도뉴클레아제 부위에 바로 인접하여 위치하며, 여기서 제1 상동성 암은 제1 엔도뉴클레아제 부위와 주형서열 사이에 있고, 제2 상동성 암은 주형서열과 제2 주형서열 사이에 있다. 일부 실시형태에서, 제1 상동성 암은 제1 엔도뉴클레아제 부위와 주형서열 사이에 있고, 제2 상동성 암은 주형서열과 제2 주형서열 사이에 있다.

일부 실시형태에서, 제1 및/또는 제2 상동성 암 서열은 주형서열 근처에 위치한다. 0bp 내, 5bp, 10bp 내, 15bp 내, 20bp 내, 30bp 내, 40bp 내, 50bp 내, 70bp 내, 80bp 내, 90bp 내, 120bp 내, 160bp 내, 200bp 내 또는 250bp 내에 있는 상동성 암은 주형서열 근처에 있는 것으로 간주될 수 있다.

일부 실시형태에서, 주형 염색체는, 5' 내지 3', 제1 엔도뉴클레아제 부위, 제1 상동성 암, 주형서열, 제2 상동성 암, 및 제2 엔도뉴클레아제 부위를 포함한다.

일부 실시형태에서, 주형 염색체의 제1 및/또는 제2 상동성 서열의 길이가 약 20 내지 2,000bp, 약 50 내지 1,500bp, 약 100 내지 1,400bp, 약 150 내지 1,300bp, 약 300 내지 1,200bp, 약 300 내지 1,100bp, 약 400 내지 1,000bp, 또는 약 500 내지 900bp, 또는 약 600bp 내지 약 800bp이다. 일부 실시양태에서, 주형 염색체의 상동성 서열은 길이가 약 400 내지 1,500bp이다. 일부 실시양태에서, 주형 염색체의 상동성 서열은 길이가 약 500 내지 1,300bp이다. 일부 실시양태에서, 주형 염색체의 상동성 서열은 길이가 약 600 내지 1,000bp이다.

주형서열

주형 염색체는 주형서열을 포함하고, 조작된 염색체 및 본 명세서에 기술된 방법에서 주형서열의 소스 역할을 한다. 주형서열은 주형 염색체 상의 임의의 적합한 위치에 위치될 수 있다. 예를 들어, 이론에 의해 결합되기를 원하지 않으면서 주형서열은 euchromatin을 특징으로 하는 주형 염색체의 영역에 위치될 수 있다.

주형서열은 임의의 적합한 소스로부터 분리되거나 유도될 수 있다. 일부 구현예에서, 주형서열은 내인성 서열, 예를 들어 주형 염색체에 내인성 서열, 또는 표적 염색체에 생성된 종에 내인성 서열을 포함한다. 일부 구현예에서, 주형서열은 외인성 서열이다. 예를 들어, 주형서열은 표적 염색체에 생성된 종에 외인성 서열로부터 유래한다. 일부 구현예에서, 주형서열은 자연적으로 발생하는 서열을 포함한다. 일부 실시형태에서, 주형서열은 자연적으로 발생하는 서열에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 인공 서열 또는 마커와 같은 서열의 삽입, 삭제, 재배열을 포함한다. 일부 실시형태에서, 주형서열은 인공 서열을 포함한다. 일부 실시형태에서, 주형서열은 자연적으로 발생하는 서열 및 인공 서열 모두를 포함한다. 예시적인 인공 서열은 특히, 마커, cDNA 서열, 프로모터, 재조합 서열을 포함한다. 예시적인 마커는 녹색 형광 단백질(GFP), mCherry 등과 같은 검출가능한 마커뿐만 아니라 하기 표 3에 개시된 선택가능한 마커를 포함하지만, 이에 제한되지는 않는다.

일부 구현예에서, 주형서열은 진핵생물로부터 유래한다. 일부 구현예에서, 진핵생물은 조류, 파충류 또는 포유류와 같은 척추동물이다. 일부 구현예에서, 주형서열은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 서열을 포함한다. 일부 구현예에서, 주형서열은 인간 서열을 포함한다.

일부 실시예들에서, 주형서열은 길이가 적어도 25KB, 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 400KB, 적어도 500KB, 적어도 600KB, 적어도 700KB, 적어도 800KB, 적어도 900KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 15MB, 적어도 20MB, 적어도 25MB, 적어도 60MB, 적어도 70MB, 적어도 80MB, 적어도 90MB, 적어도 100MB, 적어도 140MB, 적어도 160MB, 적어도 180MB, 적어도 200MB, 적어도 200MB, 적어도 220MB, 또는 적어도 250MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 500KB, 적어도 700KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 20MB, 적어도 30MB, 적어도 40MB, 또는 50MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 1MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 4MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 4MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 5MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 10MB이다. 일부 실시예들에서, 주형서열은 길이가 적어도 20MB이다.

일부 실시예들에서, 주형서열은 길이가 50KB 내지 250MB, 50KB 내지 100MB, 50KB 내지 100MB, 50KB 내지 50MB, 50KB 내지 20MB, 50KB 내지 10MB, 50KB 내지 10MB, 50KB 내지 5MB, 50KB 내지 3MB, 50KB 내지 2MB, 50KB 내지 1MB, 100KB 내지 1MB, 100KB 내지 200MB, 100KB 내지 100MB, 100KB 내지 20MB, 100KB 내지 10MB, 100KB 내지 10MB, 100KB 내지 5MB, 100KB 내지 3MB, 100KB 내지 2MB, 100KB 내지 2MB, 100KB 내지 1MB, 200KB 내지 100MB, 200KB 내지 100MB, 200KB 내지 100MB, 200KB 내지 50MB, 200KB 내지 20MB, 200KB 내지 10MB, 200KB 내지 5MB, 200KB 내지 3MB, 200KB 내지 2MB, 200KB 내지 2MB, 200KB 내지 1MB, 200KB 내지 1MB, 500KB 내지 100MB, 500KB 내지 50MB, 500KB 내지 50MB, 500KB 내지 50MB, 500KB 내지 10MB, 500KB 내지 5MB, 500KB 내지 3MB, 1MB 내지 100MB, 1MB 내지 50MB, 1MB 내지 50MB, 1MB 내지 10MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 5MB, 1MB 내지 2MB, 1MB 내지 2MB, 3MB 내지 10MB, 3MB 내지 10MB, 3MB 내지 10MB, 3MB 내지 10MB, 3MB 내지 5MB, 5MB 내지 50MB, 5MB 내지 50MB, 5MB 내지 50MB, 5MB 내지 10MB 내지 10MB, 10MB 내지 50MB, 또는 10MB 내지 20MB이다. 일부 실시예들에서, 주형서열은 길이가 50KB 내지 250MB이다. 일부 실시예들에서, 주형서열은 길이가 500KB 내지 200MB이다. 일부 실시예들에서, 주형서열은 200KB 내지 50MB, 1MB 내지 20MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 3MB, 3MB 내지 20MB, 3MB 내지 10MB, 3MB 내지 7MB, 또는 3MB 내지 5MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 10MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 10MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 5MB이다. 일부 실시예들에서, 주형서열은 길이가 1MB 내지 5MB이다. 일부 실시예들에서, 주형서열은 길이가 3MB 내지 5MB이다.

일부 구현예에서, 주형서열은 하나 이상의 유전자의 서열을 포함한다. 일부 구현예에서, 주형서열은 다수의 유전자의 서열을 포함한다. 일부 구현예에서, 주형서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 900, 1000, 1500 또는 2000 유전자의 서열을 포함한다.

일부 실시형태에서, 주형서열은 하나 이상의 인간 유전자의 서열과 같은 인간 서열을 포함한다. 일부 실시형태에서, 주형서열은 인간 유전자의 서브시퀀스를 포함한다. 일부 실시형태에서, 주형서열은 인간 유전자 및 마커 또는 융합 단백질과 같은 인공 서열의 서브시퀀스를 포함한다. 일부 실시형태에서, 주형서열은 하나 이상의 인간 유전자 및 인공 서열의 서열을 포함한다.

일부 구현예에서, 주형서열은 인간 유전자의 서열을 포함한다. 모든 인간 유전자는 본 명세서의 범위 내에서 예상된다. 이론에 의해 구속되기를 바라지 않고, 질병 발병에 관여하는, 또는 잠재적인 치료 표적인 인간 유전자를 마우스와 같은 모델 유기체로 옮기는 것은 질병에 대한 연구 및 적절한 치료법의 개발을 용이하게 할 수 있다.

주형서열에 포함하기 위한 예시적인 유전자는 면역글로불린 유전자, T 세포 수용체(TCR) 유전자, 면역 체크포인트 유전자, 사이토카인, 케모카인, 수용체, 전사 인자, 세포골격계 유전자, 세포주기 체크 유전자, 종양 유전자 및 발달, 면역학 또는 신경생물학에 관여하는 유전자를 포함하나 이에 제한되지는 않는다. 예시적인 면역 체크포인트 유전자는 BTLA, CTLA-4, TIM-3, PD-1 및 PD-L1을 포함한다. 예시적인 사이토카인은 인터루킨(CTNF, IL-16, IL-1B, IL-6, IL-12, IL-17F, IL-2, IL-3, IL-9, IL-12B, IL-18BP, IL-21, IL-33, 렙틴, IL-13, IL-1A, IL-23, IL-4), 인터페론(IFNA10, IFN-알파7, IFN 베타, IFN 감마, IFN 감마, IFN 오메가) 및 종양 괴사 인자(TNF, 예를 들어, BAFF, TNF 베타, CD30 리간드, TNF 알파, CD40 리간드, TNFSF10, CD27 리간드)를 포함한다. 예시적인 케모카인은 CXC, CC CX3C 및 C 계열 케모카인을 포함한다. 예시적인 수용체는 G 단백질 결합 수용체, 리간드-게이트 이온 채널(이온성 수용체), 키나제-연결된 수용체 및 관련 수용체, 및 핵 수용체를 포함한다. 예시적인 전사 인자는 나선-회전-나선 전사 인자(예를 들어, 10월-1), 나선-루프-나선 전사 인자(예를 들어, E2A), 징크 핑거 전사 인자(예를 들어, 글루코코르티코이드 수용체, GATA 단백질), 염기성 단백질-류신 지퍼 전사 인자(예를 들어, 순환 AMP 반응 요소 결합 인자(CREB) 및 활성화 단백질-1(AP-1)), 및 β-시트 모티프 전사 인자(예를 들어, 핵 인자-κB(NF-κB)를 포함한다. 예시적인 세포 주기 조절 유전자는 사이클린, 사이클린 의존성 키나제 및 세포 주기 체크포인트 유전자를 포함하나, 이에 제한되지 않는다.

일부 구현예에서, 주형서열은 종양 유전자 또는 종양 억제 유전자를 포함한다. 주형서열에 포함하기에 적합한 예시적인 종양 유전자 및 종양 억제 유전자는 하기 표 1에 제시되어 있다.

일부 구현예에서, 주형서열은 유전적 질병 또는 장애와 연관된 인간 유전자의 서열을 포함한다. 일부 구현예에서, 주형서열은 유전적 질병 또는 장애와 연관된 인간 염색체 영역의 서열을 포함한다. 질병 또는 장애와 연관된 유전자, 및 염색체 영역의 비제한적인 예를 하기 표 2에 제시한다.

일부 구현예에서, 주형서열은 면역글로불린 서열을 포함한다. 표면 및 분비된 면역글로불린 둘 모두가 본 발명의 범위 내에서 예상된다. 면역글로불린은 외래 항원을 인식하고 면역 반응을 개시한다. 인간에서, 각각의 면역글로불린 분자는 염색체 14 상의 IGH 유전자좌에 의해 암호화되는 2개의 동일한 중쇄 및 염색체 2 상의 면역글로불린 카파 유전자좌(IGK) 및 염색체 22 상의 면역글로불린 람다 유전자좌(IGL)에 의해 암호화되는 2개의 동일한 경쇄로 구성된다. 상기 IGH 유전자좌는 V(가변), D(다양성), J(접합), C(불변) 영역을 포함한다. 상기 V, D 및 J 영역은 각각 상이한 다수의 유전자 세그먼트를 포함하며, 본 명세서에서는 IGH 가변 영역으로 통칭한다. B 세포 발달 과정에서, DNA 수준에서의 재조합 이벤트는 단일 D 세그먼트와 J 세그먼트를 결합한다; 그리고 나서 이 부분적으로 재배열된 D-J 영역의 융합된 D-J 엑손은 V 세그먼트에 결합된다. 그리고 나서, 융합된 V-D-J 엑손을 포함하는 재배열된 V-D-J 영역은 전사되고 RNA 스플라이싱에 의해 불변 영역으로 융합된다. 이 전사체는 mu 중쇄를 암호화한다. 이후 발달 단계에서 B 세포는 V-D-J-Cmu-Cdelta pre-messenger RNA를 생성하며, 이는 대안적으로 mu 또는 delta 중쇄를 암호화하도록 스플라이싱된다. 림프절의 성숙 B 세포는 스위치 재조합을 거치므로 융합된 VDJ 유전자 세그먼트가 IGHG, IGHA 또는 IGHE 유전자 세그먼트 중 하나에 근접하게 되고 각 세포는 감마, 알파 또는 엡실론 중쇄를 발현한다. 여러 J 세그먼트와 여러 다른 V 세그먼트의 잠재적 재조합은 광범위한 항원 인식을 제공한다. 추가적인 다양성은 말단 데옥시뉴클레오티딜 전달효소에 의한 뉴클레오티드의 무작위 추가 및 체세포 과돌연변이에 의해 달성되는 접합 다양성에 의해 달성된다. 각각의 경쇄는 2개의 직렬 면역글로불린 도메인, 즉 불변 도메인(C_L) 및 가변 도메인(V_L)으로 구성된다. 경쇄의 경우, V 도메인은 2개의 별개의 DNA 세그먼트에 의해 암호화된다. 제1 세그먼트는 V 도메인의 대부분을 암호화하기 때문에 V 유전자 세그먼트라고 불린다. 제2 세그먼트는 V 도메인의 나머지를 암호화하고, 접합 또는 J 유전자 세그먼트라고 불린다. 중쇄와 마찬가지로, 경쇄는 재배열을 거쳐 V 세그먼트를 J 유전자 세그먼트에 결합하고, 이후 인트론에 의해서만 분리되는 불변 영역 서열에 근접시킨다. IGHV, IGHD, IGHJ, IGHG 또는 IGHA 중 임의의 것의 IGH 서열, 또는 이들의 임의의 조합이 본 발명의 주형서열의 범위 내에서 예상된다. IGK 또는 IGL 중 어느 하나의 경쇄 서열, 또는 이들의 조합이 본 발명의 주형서열의 범위 내에서 예상된다.

일부 구현예에서, 조작된 염색체는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있는 마우스 염색체를 포함한다. 예컨대, 항체 생성, 성숙 및/또는 다양화를 조절할 수 있는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 항체 다양화를 조절할 수 있는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 항체 그룹 전환을 조절할 수 있는 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 스위치 영역 내의 하나 이상의 비코딩 서열이 상기 염색체에 도입되었을 수 있다. 예를 들어, 상기 하나 이상의 비코딩 서열이 상기 염색체에 도입된 경우, 그룹 스위치 재조합, 체세포 과돌연변이 및/또는 활성화-유도된 시티딘 탈아미노화효소가 조절될 수 있다. 예를 들어, 상기 하나 이상의 비코딩 서열이 상기 염색체에 도입된 경우, Ig 서열의 레퍼토리의 다양성이 조절될 수 있다. 예를 들어, 중쇄, κ경쇄 및 λ 경쇄 유전자좌 상의 재배열된 유전자를 포함하는 약 2kb의 가변 영역 및/또는 중쇄 유전자좌 상의 광범위한 G:C rich DNA를 포함하는 약 4kb의 스위치 영역이 상기 염색체에 도입되었을 수 있다.

일부 구현예에서, 주형서열은 인간 IGH 서열을 포함한다. 인간 IGH는 인간 게놈의 GRCh38.p13 어셈블리의 뉴클레오티드 위치 105,586,437 내지 106,879,844 염색체 14에 걸쳐 있다. 당업자는 상기 기재된 것으로부터 예를 들어 적어도 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 10,000bp 이상 벗어난 5' 및 3' 경계를 갖는 인간 IGH 서열이 적합한 주형서열임을 인식할 것이다.

일부 구현예에서, 주형서열은 인간 IGH 가변 영역 서열을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 V_H, D_H 및 J_H1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028, 여기서 적어도 약 50bp, 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 50,000bp를 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028, 그리고 적어도 약 50bp, 100bp, 500bp, 1,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 50,000bp를 포함한다. 일부 구현예에서, 인간 IGH 가변 영역 서열은 인간 게놈의 GRCh38.p13 어셈블리의 염색체 14의 뉴클레오티드 위치 105,862,994 내지 106,811,028, 및 이에 대한 하나 이상의 변형을 포함한다. 예시적인 변형은 하나 이상의 V, D 또는 J 세그먼트의 결손과 같은 결손, 마커의 삽입, 재배열 또는 이들의 조합을 포함하지만 이에 제한되지 않는다.

일부 구현예에서, 주형서열은 T 세포 수용체 서브유닛(TCR)의 서열을 포함한다. T 세포 수용체(TCR)는 T 세포, 또는 T 림프구, [1]의 표면에서 발견되는 단백질 복합체로, 주요 조직적합성 복합체(MHC) 분자에 결합된 펩티드로서 항원 단편을 인식하는 역할을 한다. TCR은 이황화 결합 막 결합 이종이량체 단백질을 포함하며, 대부분의 경우 불변 CD3 사슬 분자(CD3 δ, CD3 ε, CD3 γ 및 CD3 ζ)와의 복합체의 일부로 발현되는 고도로 가변적인 α 및 β 사슬로 구성된다. 이 두 사슬을 발현하는 T 세포를 α:β(또는 αβ) T 세포라고 한다. 소수의 T 세포는 가변 γ 및 σ 사슬에 의해 형성되는 대체 수용체를 발현하며, 이는 흉선 T 세포라고 한다. TCR 발달은 림프구 특정 유전자 재조합 과정을 통해 발생하며, 이는 흉선의 T 세포에서 TCR 유전자 세그먼트의 재조합을 통해 발생하는 많은 수의 잠재적 세그먼트로부터 최종 서열을 조립한다. TCRα 유전자 좌위는 가변(V) 및 접합(J) 유전자 분절(Vβ 및 Jβ)을 포함하는 반면, TCRβ 좌위는 Vα 및 Jα 분절 외에 D 유전자 분절을 포함한다. 따라서, α 사슬은 VJ 재조합에서 생성되고 β 사슬은 VDJ 재조합에 관여한다. 이는 TCR γ 사슬이 VJ 재조합에 관여하고 TCR δ 유전자는 VDJ 재조합에서 생성되는 γδ TCR의 개발에서도 유사하다. TCRα 사슬 유전자 좌위는 46개의 가변 분절, 8개의 접합 분절 및 일정 영역으로 구성된다. TCRβ 사슬 유전자 좌위는 48개의 가변 분절, 그 다음 2개의 다양성 분절, 12개의 접합 분절 및 2개의 일정 영역으로 구성된다. 본원에 기술된 임의의 TCR 서브유닛들의 서열, 그 서브유닛들의 서열, 또는 그 서브유닛들의 조합을 포함하는 주형서열이 본 개시내용의 범위 내에서 고려된다. 일부 구현예에서, 주형서열은 TCR 알파 사슬 가변 영역 서열(T-cell receptor alpha locus 또는 TRA에 의해 인코딩됨), TCR 베타 사슬 가변 영역 서열(T-cell receptor beta locus 또는 TRB에 의해 인코딩됨), TCR 감마 가변 영역 서열(T-cell receptor gamma locus 또는 TRG에 의해 인코딩됨), 또는 TCR 델타 가변 영역 서열(T-cell receptor delta locus 또는 TRD에 의해 인코딩됨)을 포함한다.

일부 구현예에서, 주형서열은 항체, 또는 항원 결합 단편을 코딩하는 서열을 포함한다.

본원에서 사용되는 바와 같이, 용어 "항체"는 특정 항원에 특이적으로 결합하거나 그와 면역학적으로 반응하는 면역글로불린 분자를 의미하며, 키메라 항체, 인간화 항체, 이종접합체 항체(예를 들어, 바이-트리- 및 쿼드-특이적 항체, 디아바디, 트라이-바디 및 테트라바디)를 포함하지만 이에 제한되지 않는 항체의 항원 결합 단편 및 예를 들어 Fab', F(ab')2, Fab, Fv, rlgG 및 scFv 단편을 포함하는 항체의 항원 결합 단편을 포함한다. 달리 표시되지 않는 한, 용어 "단클론 항체"(mAb)는 온전한 분자뿐만 아니라 표적 단백질에 특이적으로 결합할 수 있는 항체 단편(예를 들어, Fab 및 F(ab')₂ 단편 포함)을 모두 포함하는 것을 의미한다. 본원에서 사용되는 바와 같이, Fab 및 F(ab')₂ 단편은 온전한 항체의 Fc 단편이 결여된 항체 단편을 의미한다. 이러한 항체 단편의 예를 본원에 기술한다.

본 명세서에서 사용되는 용어 "항원 결합 단편"은 표적 항원에 특이적으로 결합하는 능력을 보유하는 항체의 하나 이상의 단편을 의미한다. 항체의 항원 결합 기능은 전장 항체의 단편에 의해 수행될 수 있다. 항체 단편은 예를 들어 Fab, F(ab')2, scFv, 디아바디, 트라이바디, 어피바디, 나노바디, 압타머 또는 도메인 항체일 수 있다. 항체의 "항원 결합 단편"으로 포괄되는 결합 단편의 예는 (i) VL, VH, CL 및 CH1 도메인으로 구성된 1가 단편인 Fab 단편; (ii) F(ab')2 단편, (iii) 힌지 영역에서 이황화 브릿지에 의해 연결된 2개의 Fab 단편을 포함하는 2가 단편; (iii) VH 및 CH1 도메인으로 구성된 Fd 단편; (iv) 항체의 단일 아암의 VL 및 VH 도메인으로 구성된 Fv 단편, (v) VH 및 VL 도메인을 포함하는 dAb; (vi) VH 도메인으로 구성된 dAb 단편; (vi) VH 도메인 또는 VL 도메인으로 구성된 dAb 단편; (vi) VH 또는 VL 도메인으로 구성된 dAb; (viii) 분리된 상보성 결정 영역(CDR) 및 (ix) 선택적으로 합성 링커에 의해 결합될 수 있는 2종 이상의 분리된 CDR의 조합이 있다. 또한, Fv 단편의 2개의 도메인인 VL 및 VH는 별개의 유전자에 의해 코딩되지만, 이들은 재조합 방법을 사용하여 VL 및 VH 영역이 쌍을 이루어 1가 분자를 형성하는 단일 단백질 사슬로 만들어질 수 있게 하는 링커에 의해 결합될 수 있다(예를 들어, Bird et al., Science 242:423-426, 1988 및 Huston et al., Proc. Natl. Acad. Sci. USA 85:5879-5883, 1988). 이러한 항체 단편은 당업자에게 공지된 종래 기술을 사용하여 수득될 수 있으며, 온전한 항체와 동일한 방법으로 단편의 유용성을 스크리닝할 수 있다. 항원 결합 단편은 재조합 DNA 기술, 온전한 면역글로불린의 효소적 또는 화학적 절단, 또는 특정 경우 당업자에게 공지된 화학적 펩티드 합성 방법에 의해 생성될 수 있다.

본원에서 사용되는 바와 같이, 용어 "상보성 결정 영역"(CDR)은 항체의 경쇄 및 중쇄 가변 도메인 둘 모두에서 발견되는 초가변 영역을 지칭한다. 가변 도메인의 보다 고도로 보존된 부분을 프레임워크 영역(FR)이라고 지칭한다. 항체의 초가변 영역을 기술하는 아미노산 위치는 문맥 및 당업계에 공지된 다양한 정의에 따라 달라질 수 있다. 가변 도메인 내의 일부 위치는 이들 위치가 하나의 기준 하에서 초가변 영역 내에 있는 것으로 간주될 수 있고 다른 기준 세트 하에서 초가변 영역 외부에 있는 것으로 간주될 수 있다는 점에서 하이브리드 초가변 위치로 볼 수 있다. 이러한 위치 중 하나 이상은 확장된 초가변 영역에서도 발견될 수 있다. 본원에 기술된 항체는 이러한 하이브리드 초가변 위치의 변형을 포함할 수 있다. 천연 중쇄 및 경쇄의 가변 도메인은 각각 연결되는 루프를 형성하고, 경우에 따라서는 β-시트 구조의 일부를 형성하는 3개의 CDR에 의해 연결된 β-시트 구성을 주로 채택하는 4개의 프레임워크 영역을 포함한다. 각 사슬의 CDR은 FR1-CDR1-FR2-CDR2-FR3-FR4 순서의 프레임워크 영역에 의해 밀접하게 함께 유지되며, 다른 항체 사슬의 CDR과 함께 항체의 표적 결합 부위의 형성에 기여한다(Kabat et al., Sequences of Proteins of Immunological Interest, National Institute of Health, Bethesda, Md, 1987 참조). 본원에서 사용되는 바와 같이, 면역글로불린 아미노산 잔기의 넘버링은 달리 표시되지 않는 한, Kabat et al. 의 면역글로불린 아미노산 잔기 넘버링 시스템에 따라 수행된다.

일부 구현예에서, 항체, 또는 항원 결합 단편은 인간 항체 또는 항원 결합 단편을 포함한다. 일부 구현예에서, 항체 또는 항원 결합 단편은 인간화된다.

본원의 통상의 기술자는 주형서열이 특정 조직, 세포 유형 또는 유기체에서 유전자의 발현에 필요한 서열, 예를 들어 항체를 포함할 수도 있음을 이해할 것이다. 이러한 서열은 프로모터, 인핸서, 전령 RNA(mRNA)의 5' 및 3' 비번역 영역과 같은 비번역 서열, 폴리아데닐화(polyA) 서열, 인트론, 내부 리보솜 진입 부위(IRES) 등을 포함하나 이에 제한되지 않는다. 적절한 서열의 선택은 본원의 통상의 기술자에게 명백할 것이다.

일부 구현예에서, 주형서열은 프로모터를 포함한다. 일부 구현예에서, 프로모터는 내인성 프로모터, 즉 프로모터는 주형서열 내에 포함된 유전자와 정상적으로 연관된 프로모터이다. 일부 구현예에서, 프로모터는 내인성 프로모터, 예를 들어 프로모터가 작동 가능하게 연결된 주형서열의 유전자보다 다른 유전자 또는 유기체로부터 분리되거나 유래된 프로모터가 아니다. 예를 들어, 주형서열은 면역글로불린 프로모터가 아닌 프로모터와 작동 가능하게 연결된 항체 또는 항원 결합 단편을 코딩하는 서열을 포함한다. 일부 구현예에서, 프로모터는 구성적 프로모터, 유도성 프로모터, 또는 조직 특이적 프로모터이다. 일부 구현예에서, 프로모터는 포유동물 유전자, 예를 들어 림프구에서 발현된 유전자로부터 분리되거나 유래된다.

주형서열의 유전자를 발현하는데 사용될 수 있는 예시적인 프로모터는 SV40 초기 프로모터 영역, Rous 육종 바이러스의 3' 긴 말단 반복에 포함된 프로모터, 메탈로티오네인 유전자의 조절 서열, 테트라사이클린(Tet) 프로모터, 효모 또는 Gal4 프로모터, ADC(알코올 탈수소효소) 프로모터, PGK(포스포글리세롤 키나제) 프로모터, 알칼리성 포스파타제 프로모터 및 하기 동물 전사 조절 영역을 포함하지만 이에 제한되지는 않는다: 췌장 포상세포에서 활성화된 엘라스타제I 유전자 조절 영역 췌장 베타세포에서 활성화된 인슐린 유전자 조절 영역, 림프세포에서 활성화된 면역글로불린 유전자 조절 영역, 고환, 유방, 림프, 비만세포에서 활성화된 마우스 유방종양 바이러스 조절 영역, 간에서 활성화된 알부민 유전자 조절 영역, 간에서 활성화된 알파태아단백 유전자 조절 영역, 간에서 활성화된 알파1-항트립신 유전자 조절 영역, 골수세포에서 활성화된 베타글로빈 유전자 조절 영역, 뇌의 올리고당 세포에서 활성화된 미오신 경쇄-2 유전자 조절 영역, 골격근에서 활성화된 미오신 경쇄-2 유전자 조절 영역, 신경세포에서 활성화된 신경특이적 에놀라제(NSE) 유전자 조절 영역, 신경세포에서 활성화된 뇌유래신경영양인자(BDNF) 유전자 조절 영역, 성상세포에서 활성화된 신경섬유상산성단백질(GFAP) 프로모터, 시상하부에서 활성화된 성선자극방출호르몬 유전자 조절 영역 등.

표적 염색체

본 발명은 본 명세서에 기재된 방법에 사용하기 위해, 표적서열을 포함하는 표적 염색체를 제공한다.

본원에서 사용되는 바와 같이, "표적 염색체"는 "표적서열"을 포함하는 염색체를 의미하거나, 주형서열의 삽입에 의한 표적서열의 유의미한 결손이 없는 경우, "표적 위치"를 포함하는 염색체를 의미한다. 표적서열은 본원에 기술된 방법을 사용하여 주형서열의 삽입에 의해 결손된 표적 염색체의 서열을 의미한다. 표적 위치는 주형서열이 (삽입을 위해) 삽입되거나 그에 결합되는 (염색체 전위 또는 재배열을 위해) 표적 염색체 내의 위치를 의미한다.

표적 염색체는 임의의 적합한 공급원으로부터 분리되거나 유래될 수 있다. 일부 실시형태에서, 표적 염색체는 진핵생물로부터 유래된다. 일부 실시형태에서, 진핵생물은 척추동물, 예를 들어, 조류, 파충류 또는 포유류이다. 일부 실시형태에서, 표적 염색체는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭으로부터 유래된다. 일부 실시형태에서, 표적 염색체는 마우스로부터 유래된다. 일부 실시형태에서, 표적 염색체는 래트로부터 유래된다. 일부 실시형태에서, 표적 염색체는 원숭이로부터 유래된다.

일부 구현예에서, 주형 염색체 및 표적 염색체는 상이한 종으로부터 유래한다. 예를 들어, 주형 염색체는 인간으로부터 유래하고, 표적 염색체는 마우스로부터 유래한다. 일부 구현예에서, 주형 염색체 및 표적 염색체는 동일한 종으로부터 유래한다.

일부 실시형태에서, 표적 염색체는 인공 염색체이다.

일부 실시형태에서, 표적 염색체는 자연적으로 발생하는 염색체이다.

일부 구현예에서, 표적 염색체는 자연적으로 발생하는 염색체에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 서열의 삽입, 결실, 재배열 등을 포함한다. 표적 염색체에 삽입된 서열의 예는 특히, 마커, 프로모터, cDNA 서열, 비코딩 등을 포함한다. 적합한 마커는 표 3에 개시된 것과 같은 선택 가능한 마커뿐만 아니라, GFP, mCherry 등과 같은 검출 가능한 마커를 포함한다.

일부 구체예에서, 표적 염색체는 주형서열의 5'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구체예에서, 표적 염색체는 표적서열의 3'에 위치한 엔도뉴클레아제 부위를 포함한다. 일부 구체예에서, 엔도뉴클레아제 부위는 표적서열에 바로 인접하게 위치한다. 일부 구체예에서, 엔도뉴클레아제 부위는 표적서열의 근처에 위치한다.

일부 구체예에서, 표적 염색체는 표적서열의 양 측의 엔도뉴클레아제 부위를 포함한다. 예를 들어, 표적 염색체는 표적서열의 5'에 위치한 제1 엔도뉴클레아제 부위 및 표적서열의 3'에 위치한 제2 엔도뉴클레아제 부위를 포함한다. 일부 구체예에서, 제1 및 제2 엔도뉴클레아제 부위는 모두 동일한 엔도뉴클레아제에 의해 인식되고 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위는 모두 동일한 엔도뉴클레아제에 의해 인식되는 동일한 DNA 서열을 포함한다. 일부 구체예에서, 제1 엔도뉴클레아제 부위는 제1 엔도뉴클레아제에 의해 절단되고, 제2 엔도뉴클레아제 부위는 제2 엔도뉴클레아제에 의해 절단된다. 예를 들어, 제1 및 제2 엔도뉴클레아제 부위는 2개의 상이한 징크 핑거 뉴클레아제(ZFN)에 의해 인식되는 상이한 DNA 서열, 또는 상이한 표적서열을 포함하는 가이드 핵산(gNA)을 포함하는 CRISPR/Cas 리보뉴클레오단백질 복합체에 의해 인식되는 2개의 상이한 CRISPR/Cas 표적서열을 포함한다. 일부 구체예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 표적서열에 바로 인접하여 위치한다. 일부 구체예에서, 제1 및/또는 제2 엔도뉴클레아제 부위는 표적서열 근처에 위치한다.

주형서열로부터 5bp 내에, 10bp 내에, 15bp 내에, 20bp 내에, 30bp 내에, 40bp 내에, 50bp 내에, 70bp 내에, 80bp 내에, 100bp 내에, 120bp 내에, 140bp 내에, 180bp 내에, 250bp 내에, 300bp 내에, 또는 500bp 내에, 또는 500bp 내에 있는 엔도뉴클레아제 부위는 표적서열에 근접한 것으로 간주될 수 있다.

일부 구현예에서, 표적 염색체는 상동성 지시 복구를 용이하게 하기 위해 사용되는 핵산분자의 상동성 암의 하나 이상의 서열을 포함한다. 일부 구현예에서, 표적 염색체는 표적서열의 5'에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 표적 염색체는 5' 내지 3'의 상동성 암 서열, 엔도뉴클레아제 부위 및 표적서열을 포함한다. 일부 구현예에서, 표적 염색체는 표적서열의 3'에 위치한 상동성 암의 서열을 포함한다. 일부 구현예에서, 표적 염색체는 5' 내지 3'의 표적서열, 엔도뉴클레아제 부위 및 상동성 암 서열을 포함한다. 일부 구현예에서, 엔도뉴클레아제 부위는 상동성 암 서열과 표적서열 사이에 위치한다.

일부 구현예에서, 표적 염색체는 표적서열의 제1 상동성 암 서열 5', 및 표적서열의 제2 상동성 암 서열 3'을 포함한다. 즉, 표적 염색체는 표적서열의 상류 및 하류 모두 상동성 암을 포함한다. 일부 구현예에서, 제1 상동성 암은 5' 내지 3', 제1 상동성 암, 적어도 제1 마커의 서열 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암이다. 일부 구현예에서, 제2 상동성 암은 5' 내지 3', 주형서열의 3' 말단의 뉴클레오티드 서열, 적어도 제2 마커의 서열 및 제2 상동성 암을 포함하는 제2 핵산분자의 3' 상동성 암이다. 일부 구현예에서, 표적 염색체는 5' 내지 3', 제1 상동성 암 서열, 제1 엔도뉴클레아제 부위, 표적서열, 제2 엔도뉴클레아제 부위, 및 제2 상동성 암 서열을 포함한다.

일부 실시형태에서, 표적 염색체의 제1 및/또는 제2 상동성 암 서열은 제1 및/또는 제2 엔도뉴클레아제 부위에 바로 인접하여 위치한다. 일부 실시형태에서, 제1 상동성 암 서열은 제1 엔도뉴클레아제 부위에 바로 인접하여 위치하고, 제2 상동성 암 서열은 제2 엔도뉴클레아제 부위에 바로 인접하여 위치하며, 여기서 제1 엔도뉴클레아제 부위는 제1 상동성 암과 표적서열 사이에 있고, 제2 엔도뉴클레아제 부위는 표적서열과 제2 상동성 암 사이에 있다.

일부 실시형태에서, 제1 및/또는 제2 상동성 암 서열은 표적서열 근처에 위치한다. 표적서열의 5 bp 내, 10 bp 내, 15 bp 내, 20 bp 내, 30 bp 내, 40 bp 내, 50 bp 내, 70 bp 내, 80 bp 내, 90 bp 내, 120 bp 내, 140 bp 내, 180 bp 내, 200 bp 내 또는 250 bp 내인 엔도뉴클레아제 부위는 표적서열 근처에 있는 것으로 간주될 수 있다.

일부 실시양태에서, 표적 염색체는 제1 상동성 암, 제1 엔도뉴클레아제 부위, 표적서열, 제2 엔도뉴클레아제 부위, 및 제2 상동성 암을, 5' 에서 3'으로 포함한다.

일부 구현예에서, 주형서열이 삽입될 때 표적 염색체의 서열이 거의 또는 전혀 결실되지 않고, 표적서열은 본원에서 "표적 부위" 또는 "표적 위치"로서 상호 교환가능하게 지칭된다. 통상의 기술자는 이러한 경우 상동성 암 및 엔도뉴클레아제 부위의 배열이 상동성 암이 엔도뉴클레아제 부위에 의해 측면에 있는 표적서열 그 자체가 아니라 표적 위치의 엔도뉴클레아제 부위에 측면에 있다는 점을 제외하고는 상동성 암 및 엔도뉴클레아제 부위의 배열이 기재된 것과 유사하다는 것을 인식할 것이다. 일부 구현예에서, 표적 염색체는 제1 상동성 암의 서열, 엔도뉴클레아제 부위의 서열 및 제2 상동성 암의 서열을, 5'에서 3'으로 포함한다. 일부 구현예에서, 제1 상동성 암은, 제1 상동성 암, 적어도 제1 마커 서열 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제2 핵산분자의 5' 상동성 암이다. 일부 구현예에서, 제2 상동성 암은, 주형서열의 3' 말단의 하류 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제2 마커 서열 및 제2 상동성 암을, 5'에서 3'으로 포함하는 제2 핵산분자의 3' 상동성 암이다.

일부 구현예에서, 주형서열은 염색체 재배열 또는 전위를 생성하기 위해 표적서열에 결합된다. 일부 구현예에서, 표적 염색체는, 표적 염색체 상동성 암 서열 및 엔도뉴클레아제 부위를, 5'에서 3'으로 포함한다. 일부 구현예에서, 표적 염색체 상동성 암은, 표적서열 상동성 암, 적어도 하나의 마커 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5' 내지 3'으로 포함한다. 일부 구현예에서, 표적 염색체는, 엔도뉴클레아제 부위 및 표적 염색체 상동성 암 서열을, 5' 내지 3'으로 포함한다. 일부 구현예에서, 표적 염색체 상동성 암은, 주형서열의 3' 말단의 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제1 마커 및 표적서열 상동성 암을 포함하는 핵산분자의 3' 상동성 암을, 5' 내지 3'으로 포함한다.

일부 실시양태에서, 표적 염색체의 제1 및/또는 제2 상동성 암 서열은 길이가 약 20 내지 2,000bp, 약 50 내지 1,500bp, 약 100 내지 1,400bp, 약 150 내지 1,300bp, 약 300 내지 1,200bp, 약 300 내지 1,100bp, 약 400 내지 1,000bp, 또는 약 500 내지 900bp, 또는 약 600bp 내지 800bp이다. 일부 실시양태에서, 표적 염색체의 상동성 서열은 길이가 약 400 내지 1,500bp이다. 일부 실시양태에서, 표적 염색체의 상동성 서열은 길이가 약 500 내지 1,300bp이다. 일부 실시양태에서, 표적 염색체의 상동성 서열은 길이가 약 600 내지 1,000bp이다.

표적서열 및 표적 위치

표적 염색체는 주형서열이 삽입되는 표적서열 또는 위치, 또는 본원에 기술된 방법에 의해 주형서열이 결합되는 위치를 포함한다. 표적서열은 표적 염색체 상의 임의의 적합한 위치에 위치될 수 있다.

표적서열은 임의의 적합한 소스로부터 분리되거나 유도될 수 있다. 일부 실시형태에서, 표적서열 및 주형서열은 상이한 종으로부터 유래된다. 예컨대, 주형서열은 인간으로부터 유래되고, 표적서열은 마우스로부터 유래된다. 일부 실시형태에서, 표적서열 및 주형서열은 동일한 종으로부터 유래된다.

일부 실시형태에서, 표적서열은 자연적으로 발생하는 서열을 포함한다. 일부 실시형태에서, 표적서열은 자연적으로 발생하는 서열에 대한 하나 이상의 변형을 포함한다. 변형은 특히, 인공 서열 또는 마커와 같은 서열의 삽입, 삭제, 재배열을 포함한다. 일부 실시형태에서, 표적서열은 인공 서열을 포함한다. 일부 실시형태에서, 표적서열은 자연적으로 발생하는 서열 및 인공 서열 모두를 포함한다. 예시적인 인공 서열은 특히, 마커, cDNA 서열, 프로모터, 재조합 서열을 포함한다. 예시적인 마커는 녹색 형광 단백질(GFP), mCherry 등과 같은 검출가능한 마커뿐만 아니라 하기 표 3에 개시된 선택가능한 마커를 포함하지만, 이에 제한되지는 않는다.

일부 구현예에서, 표적서열은 진핵생물로부터 유래한다. 일부 구현예에서, 진핵생물은 척추동물, 예컨대, 조류, 파충류 또는 포유류이다. 일부 구현예에서, 주형서열은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 서열을 포함한다. 일부 구현예에서, 표적서열은 마우스 서열을 포함한다. 일부 구현예에서, 표적서열은 마우스 서열을 포함한다. 일부 구현예에서, 표적서열은 래트 서열을 포함한다. 일부 구현예에서, 표적서열은 원숭이 서열을 포함한다.

일부 실시예들에서, 표적서열은 길이가 적어도 25KB, 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 400KB, 적어도 500KB, 적어도 600KB, 적어도 700KB, 적어도 800KB, 적어도 900KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 15MB, 적어도 20MB, 적어도 25MB, 적어도 30MB, 적어도 70MB, 적어도 80MB, 적어도 90MB, 적어도 100MB, 적어도 120MB, 적어도 160MB, 적어도 160MB, 적어도 180MB, 적어도 200MB, 적어도 200MB, 적어도 220MB, 또는 적어도 250MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 50KB, 적어도 100KB, 적어도 200KB, 적어도 500KB, 적어도 700KB, 적어도 1MB, 적어도 2MB, 적어도 3MB, 적어도 4MB, 적어도 5MB, 적어도 6MB, 적어도 7MB, 적어도 8MB, 적어도 9MB, 적어도 10MB, 적어도 20MB, 적어도 30MB, 적어도 40MB, 또는 50MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 1MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 2MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 3MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 4MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 5MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 5MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 10MB이다. 일부 실시예들에서, 표적서열은 길이가 적어도 20MB이다.

일부 실시예들에서, 표적서열은 길이가 50KB 내지 250MB, 50KB 내지 100MB, 50KB 내지 50MB, 50KB 내지 20MB, 50KB 내지 10MB, 50KB 내지 5MB, 50KB 내지 3MB, 50KB 내지 2MB, 50KB 내지 1MB, 100KB 내지 200MB, 100KB 내지 100MB, 100KB 내지 50MB, 100KB 내지 20MB, 100KB 내지 10MB, 100KB 내지 5MB, 100KB 내지 3MB, 100KB 내지 2MB, 100KB 내지 1MB, 100KB 내지 500KB, 200KB 내지 100MB, 200KB 내지 50MB, 200KB 내지 20MB, 200KB 내지 10MB, 200KB 내지 5MB, 200KB 내지 3MB, 200KB 내지 2MB, 200KB 내지 1MB, 200KB 내지 500KB, 500KB 내지 100MB, 500KB 내지 50MB, 500KB 내지 20MB, 500KB 내지 10MB, 500KB 내지 5MB, 500KB 내지 3MB, 500KB 내지 2MB, 500KB 내지 1MB, 1MB 내지 100MB, 1MB 내지 50MB, 1MB 내지 20MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 3MB, 1MB 내지 2MB, 3MB 내지 100MB, 3MB 내지 50MB, 3MB 내지 20MB, 3MB 내지 10MB, 3MB 내지 5MB, 5MB 내지 100MB, 5MB 내지 50MB, 5MB 내지 20MB, 5MB 내지 10MB, 10MB 내지 100MB, 10MB 내지 50MB, 또는 10MB 내지 20MB이다. 일부 실시예들에서, 표적서열은 길이가 200KB 내지 50MB, 1MB 내지 20MB, 1MB 내지 10MB, 1MB 내지 5MB, 1MB 내지 3MB, 3MB 내지 20MB, 3MB 내지 10MB, 3MB 내지 7MB, 또는 3MB 내지 5MB이다. 일부 실시예들에서, 표적서열은 길이가 1MB 내지 10MB이다. 일부 실시예들에서, 표적서열은 길이가 1MB 내지 5MB이다. 일부 실시예들에서, 표적서열은 길이가 3MB 내지 5MB이다.

일부 구현예에서, 표적서열은 하나 이상의 유전자의 서열을 포함한다. 일부 구현예에서, 표적서열은 다수의 유전자의 서열을 포함한다. 일부 구현예에서, 표적서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 80, 90, 100, 150, 200, 300, 350, 400, 450, 500, 600, 700, 900, 1000, 1500 또는 2000 유전자의 서열을 포함한다.

일부 구현예에서, 표적서열은 주형서열과 상동인 서열을 포함한다. 예를 들어, 주형 염색체는 표 1 및 표 2에 기재된 유전자 중 하나 이상을 포함하는 인간 주형서열을 포함하는 인간 염색체인 반면, 표적 염색체는 마우스 표적서열을 포함하는 마우스 염색체이고, 마우스 표적서열은 인간 주형서열과 상동인 마우스 서열을 포함한다. 추가 예로서, 주형 염색체는 인간 IGH 서열을 포함하는 인간 염색체인 반면, 표적 염색체는 마우스 염색체이고, 표적서열은 상동 마우스 Igh 서열을 포함한다. 또 다른 예로서, 주형 염색체는 인간 TCR 서열을 포함하는 인간 염색체인 반면, 표적 염색체는 마우스 염색체이고, 표적서열은 상동 마우스 TCR 서열을 포함한다.

일부 실시형태에서, 표적 염색체는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭으로부터 유래하고, 표적서열은 주형서열의 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 동족체를 포함한다.

일부 구현예에서, 표적서열은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭 유전자의 서열을 포함한다. 모든 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 또는 닭 유전자가 본 명세서의 범위 내에서 예상된다. 이론에 의해 결합되기를 원하지 않고, 질병 발병에 관여하거나 잠재적인 치료 표적인 인간 유전자를 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 원숭이 또는 닭과 같은 모델 유기체로 전달하면 질병에 대한 연구 및 적절한 치료법의 개발을 용이하게 할 수 있다. 일부 구현예에서, 표적서열은 인간 주형서열과 상동인 마우스 서열을 포함한다. 일부 구현예에서, 표적서열은 인간 주형서열과 상동인 래트 서열을 포함한다. 일부 구현예에서, 표적서열은 인간 주형서열과 상동인 원숭이 서열을 포함한다.

일부 구체예에서, 표적서열은 마우스 면역글로불린 서열과 같은 면역글로빈 서열을 포함한다. 일부 구체예에서, 표적서열은 마우스 Igh 서열을 포함한다. 마우스 Igh는 마우스 게놈의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 1112,947,269 내지 116,248,693에 걸쳐 있다. 당업자는 상기 기재된 것으로부터 예를 들어 적어도 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 10,000bp 이상 벗어난 5' 및 3' 경계를 갖는 마우스 Igh 서열이 적합한 주형서열임을 인식할 것이다.

일부 구현예에서, 표적서열은 마우스 Igh 가변 영역 서열을 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역 서열은 V_H, D_H 및 J_H1-6 유전자 세그먼트의 마우스 상동체를 코딩하는 서열 및 개입하는 비코딩 서열을 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역 서열은 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952를 포함한다. 일부 구체예에서, 마우스 Igh 가변 영역 서열은 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952에서 적어도 약 50bp, 100bp, 500bp, 1,000bp, 1,000bp, 2,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 5,000bp의 말단, 또는 둘 모두를 포함한다. 일부 구체예에서, 인간 IGH 가변 영역 서열은 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952 및 5' 말단의 추가 측면 서열의 적어도 약 50bp, 100bp, 500bp, 1,000bp, 2,000bp, 5,000bp, 7,000bp, 10,000bp, 15,000bp, 20,000bp 또는 50,000bp의 말단, 또는 둘 모두를 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역 서열은 마우스 게놈의 GRCm39 어셈블리의 염색체 12의 뉴클레오티드 위치 113,391,842 내지 115,973,952, 및 이에 대한 하나 이상의 변형을 포함한다. 예시적인 변형은 하나 이상의 V, D 또는 J 세그먼트의 결손과 같은 삭제, 마커의 삽입, 재배열, 또는 이들의 조합을 포함하지만 이에 제한되지는 않는다. 일부 구체예에서, 표적서열은 마우스 Igl 가변 영역 서열을 포함한다. 일부 구체예에서, 표적서열은 마우스 Igk 가변 영역 서열을 포함한다. 일부 구체예에서, 주형서열은 인간 IGL 가변 영역 서열을 포함한다. 일부 구체예에서, 주형서열은 인간 IGK 가변 영역 서열을 포함한다.

일부 구현예에서, 예를 들어, 본 명세서에 기재된 방법에 의해 표적 염색체 서열이 거의 또는 전혀 삭제되지 않은 구현예에서, 표적 염색체는 표적 위치를 포함한다. 표적 위치는 주형서열이 삽입되는 위치, 또는 주형서열이 결합되는 위치이다. 표적 염색체 상의 임의의 위치가 적합한 위치일 수 있다. 일부 구현예에서, 표적 위치는 표적 위치에서 이중가닥 절단을 생성하기 위한 엔도뉴클레아제 부위를 포함한다.

조작된 염색체

본 발명은 본원에 기술된 방법에 의해 제조된 조작된 염색체를 제공한다.

일부 실시형태에서, 조작된 염색체는 하나 이상의 인간화된 서열을 포함하는 마우스 염색체를 포함한다. 일부 실시형태에서, 인간화된 서열은 인간의 질병 또는 장애와 연결된 하나 이상의 유전자, 예를 들어, 유전적 질병 또는 장애와 연결된 유전자, 또는 온콘젠을 포함한다. 일부 실시형태에서, 조작된 염색체는 하나 이상의 인간화된 서열을 포함하는 래트 염색체를 포함한다. 일부 실시형태에서, 조작된 염색체는 하나 이상의 인간화된 서열을 포함하는 원숭이 염색체를 포함한다.

일부 구현예에서, 조작된 염색체는 하나 이상의 면역글로불린 서열이 인간화된 마우스 염색체를 포함한다. 일부 구현예에서, 면역글로불린 서열은 IGH 가변 영역과 같은 IGH 서열을 포함한다. 일부 구현예에서, 조작된 염색체는 마우스 염색체 12를 포함하며, 여기서 마우스 Igh 가변 영역은 염색체 14로부터 인간 IGH 가변 영역으로 대체되었다. 일부 구현예에서, 마우스 Igh 가변 영역은 V_H, D_H 및 J_H1-6 유전자 세그먼트들 및 개재하는 비-코딩 서열들을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역은 V_H, D_H 및 J_H1-6 유전자 세그먼트들 및 개입하는 비-코딩 서열을 포함한다. 일부 구현예에서, 조작된 염색체는 마우스 염색체 12를 포함하며, 여기서 마우스 유전체의 GRCm39 어셈블리의 염색체 12의 대략 113,391,842 내지 115,973,952의 뉴클레오티드 서열을 포함하는 마우스 Igh 가변 영역은 인간 유전체의 GRCh38.p13 어셈블리의 염색체 14의 대략 105,862,994 내지 106,811,028의 뉴클레오티드 서열을 포함하는 인간 IGH 가변 영역으로 대체되었다. 일부 구현예에서, 조작된 염색체는 마우스 Igk 가변 영역을 대신하여 인간 IGK 가변 영역의 서열을 포함하는 마우스 염색체 6이다. 일부 구현예에서, 마우스 Igk 가변 영역 서열은 마우스 V_k 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재하는 비-코딩 서열을 포함한다. 일부 구현예에서, 주형서열은 인간 IGK 가변 영역 서열을 포함한다. 일부 구현예에서, 인간 IGK 가변 영역 서열은 인간 V_k 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재하는 비-코딩 서열을 포함한다.

핵산분자, 플라스미드 및 벡터

본 발명은 본 명세서에 기술된 방법에 사용하기 위한 핵산분자를 제공한다. 핵산분자는 때때로 폴리뉴클레오티드로 지칭되며, 단일 분자를 구성하는 연결된 뉴클레오티드의 사슬을 지칭한다. 본 발명의 핵산분자는 디옥시리보핵산(DNA), 또는 리보핵산(RNA)일 수 있다. 본 발명의 예시적인 핵산분자는 표적서열 내로 주형서열의 삽입, 또는 이중가닥 절단 복구에 의한 주형 및 표적서열의 결합을 용이하게 하기 위하여 표적 및 주형서열 둘 모두에 특이적이거나 인접한 상동성 암을 포함한다.

본 발명은 본 명세서에 기재된 HDR-매개 염색체 재배열을 용이하게 하는 표적 및 주형 염색체에 특이적인 상동성 암을 포함하는 핵산분자를 제공한다. 일부 구현예에서, 핵산분자는, 표적서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제1 마커, 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다. 일부 구체예에서, 핵산분자는, 주형서열의 3' 말단의 하류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제2 마커, 및 표적서열의 3' 말단의 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다.

본 발명은 본 명세서에 기재된 핵산분자를 포함하는 벡터를 제공한다. 본 발명에 따른 벡터는 이것이 연결된 다른 핵산을 운반할 수 있는 핵산분자이다. 플라스미드는 예를 들어 벡터의 한 종류이다. 벡터 서열은 그 중에서도 박테리아, 예를 들어 기원 또는 복제로부터 벡터의 생산에 필요한, 서열 및 선택가능한 마커를 포함한다.

일부 구현예에서, 벡터는 플라스미드(plasmid)이다. 일부 구현예에서, 플라스미드는, 표적서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제1 마커, 및 주형서열의 5' 말단의 상류에 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다. 일부 구현예에서, 플라스미드는, 주형서열의 3' 말단의 하류에 뉴클레오티드 서열을 포함하는 5' 상동성 암, 적어도 제2 마커, 및 표적서열의 3' 말단의 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함한다.

일부 실시형태에서, 벡터는 주형서열의 5' 말단에 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 실시형태에서, 상동성 암은 주형서열의 상류, 즉 5'에 위치한다. 일부 실시형태에서, 벡터는 주형서열의 3' 말단에 또는 그 근처에 위치한 상동성 암의 서열을 포함한다. 일부 실시형태에서, 상동성 암은 주형서열의 하류, 즉 3'에 위치한다. 일부 실시형태에서, 벡터에서의 주형 상동성 암의 서열은 주형서열에서의 상동성 암의 서열과 동일하거나, 실질적으로 동일하다.

일부 실시형태에서, 벡터는 표적서열 또는 위치의 5'에 위치된 상동성 암의 서열, 즉 표적서열 또는 위치의 상류를 포함한다. 일부 실시형태에서, 벡터는 표적서열 또는 위치의 3'에 위치된 상동성 암의 서열, 즉 표적서열 또는 위치의 하류를 포함한다.

본원의 기술자는 벡터 내의 상동성 암 서열과 주형 또는 표적 염색체 내의 동등한 서열 사이에 어느 정도 불일치가 있을 수 있음을 이해할 것이고, 벡터는 여전히 벡터로부터 주형 또는 표적 염색체 내의 이중가닥 절단의 복구를 용이하게 할 것이다. 예컨대, 주형 염색체 내의 동등한 서열과 95% 이상 동일, 96% 이상 동일, 97% 이상 동일, 98% 이상 동일 또는 99% 이상 동일한 벡터 상동성 암 서열이 본 발명의 방법에 적합할 것이다.

일부 구현예에서, 본 명세서에 기재된 핵산분자, 플라스미드 또는 벡터는 하나 이상의 엔도뉴클레아제 부위를 포함한다.

일부 구현예에서, 본 발명은 (i) 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및 (ii) 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자를 제공한다. 일부 구현예에서, 제1 및 제2 핵산분자는 플라스미드이다. 일부 구현예에서, 제1 핵산분자는, 표적서열의 5' 말단의 상류 뉴클레오티드 서열, 제1 엔도뉴클레아제 부위, 적어도 제1 마커, 제2 엔도뉴클레아제 부위, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 포함하는 3' 상동성 암을, 5'에서 3'으로 포함하고, 여기서, 제1 및 제2 엔도뉴클레아제 부위는 핵산분자 상의 제1 및 제2 엔도뉴클레아제 부위, 및 주형 및 표적 염색체 상의 상응하는 엔도뉴클레아제 부위가 동일한 엔도뉴클레아제에 의해 절단되도록 상동성 암에 중첩된다. 일부 실시형태에서, 제2 핵산분자는, 주형서열의 3' 말단의 뉴클레오티드 서열 하류를 포함하는 5' 상동성 암, 제3 엔도뉴클레아제 부위, 적어도 제2 마커, 제4 엔도뉴클레아제 부위, 및 표적서열의 3' 말단의 뉴클레오티드 서열 하류를 포함하는 3' 상동성 암을, 5'에서 3'으로 포함하고, 여기서, 제2 및 제3 엔도뉴클레아제 부위는 핵산분자 상의 제3 및 제4 엔도뉴클레아제 부위, 및 주형 및 표적 염색체 상의 상응하는 엔도뉴클레아제 부위가 동일한 엔도뉴클레아제에 의해 절단되도록 상동성 암에 중첩된다. 일부 실시양태에서, 제1 마커 및 제2 마커는 동일한 마커가 아니다. 일부 실시양태에서, 제1 핵산분자 상의 제1 마커는 선택가능한 마커 및 검출가능한 마커의 조합을 포함한다. 일부 실시양태에서, 제1 마커는 eGFP 및 푸로마이신 내성을 포함한다. 일부 실시양태에서, 제2 마커는 선택가능한 마커를 포함한다. 일부 실시양태에서, 제2 마커는 하이그로마이신 내성을 포함한다.

일부 실시형태에서, 핵산분자 상의 상동성 암 서열은 주형서열, 표적서열 또는 표적 위치 근처에 위치하는 서열에 대응한다. 0bp, 5bp, 10bp, 15bp, 20bp, 30bp, 40bp, 50bp, 70bp, 80bp, 90bp, 100bp, 140bp, 160bp, 200bp 또는 250bp 내에 위치하는 상동성 암은 상기 주형서열에 근접한 것으로 간주될 수 있다.

일부 실시양태에서, 주형 또는 표적 염색체 서열에 대응하는 핵산분자 상동성 서열은 길이가 약 20 내지 2,000bp, 약 50 내지 1,500bp, 약 100 내지 1,400bp, 약 150 내지 1,300bp, 약 300 내지 1,200bp, 약 300 내지 1,100bp, 약 400 내지 1,000bp, 또는 약 500 내지 900bp, 또는 약 600bp 내지 800bp이다. 일부 실시양태에서, 핵산분자 상동성 서열은 길이가 약 400 내지 1,500bp이다. 일부 실시양태에서, 핵산분자 상동성 서열은 길이가 약 500 내지 1,300bp이다. 일부 실시양태에서, 핵산분자 상동성 서열은 길이가 약 600 내지 1,000bp이다.

일부 구현예에서, 핵산분자는 포유동물 세포에서의 발현에 적합한 마커를 포함한다. 일부 구체예에서, 마커는 핵산분자 내 상동성 암 사이에 있으며, 이에 의해 마커가 표적서열에 삽입된다. 일부 구체예에서, 마커는 선택 가능한 마커이다. 적합한 선택된 마커는 디히드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자, 아미노글리코시다제 포스포트랜스퍼라제(네오마이신 내성 유전자) 및 하기 표 3에 추가로 기재되어 있다.

일부 실시형태에서, 마커는 검출가능한 마커(또는 리포터)를 포함한다. 검출가능한 마커는 발광 반응을 매개하는 효소(luxA, luxB, luxAB, luc, rue, nluc), 비색 반응을 매개하는 효소(lacZ, HRP) 및 녹색 형광 단백질(GFP), eGFP, 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), 청색 형광 단백질(BFP), dsRed, mCherry, tdTomato, 근적외선 형광 단백질 등과 같은 형광 단백질을 포함하지만 이에 제한되지 않는다. 적합한 검출가능한 마커의 선택은 당업계의 통상의 기술자에게 공지될 것이다.

마커는 CMV(cytomegalovirus early) 프로모터, PGK 프로모터 및 EF1a 프로모터를 포함하지만 이에 제한되지 않는 당업계에 공지된 임의의 적합한 프로모터를 사용하여 발현될 수 있다.

일부 구현예에서, 예를 들어, 제1 마커를 갖는 제1 핵산분자 및 제2 마커를 갖는 제2 핵산분자, 제1 또는 제2 마커는 세포에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함한다. 일부 구현예에서, 형광 단백질은 녹색 형광 단백질(GFP)을 포함한다. 일부 구현예에서, 제1 마커는 선택가능한 마커를 더 포함한다. 일부 구현예에서, 제2 마커는 선택가능한 마커를 더 포함한다. 일부 구현예에서, 선택가능한 마커는 디히드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자 및 아미노글리코사이드 포스포트랜스퍼라제로 구성된 군에서 선택된다. 일부 구현예에서, 제1 마커 및 제2 마커는 동일한 선택가능한 마커가 아니다. 일부 구현예에서, 제1 마커는 세포 내 GFP를 발현할 수 있는 프로모터에 작동 가능하게 연결된 GFP 및 푸로마이신 아세틸트랜스퍼라제를 포함하고, 제2 마커는 하이그로마이신 포스포트랜스퍼라제를 포함한다.

이중가닥 절단의 생성 방법

본원에 제공되는 것은 주형 및 표적 염색체에서 이중가닥 절단을 생성하는 방법이다. 본원에 제공되는 방법은 염색체 간의 큰 서열의 전달을 용이하게 하기 위해 세포 환경에서 이중가닥 절단 복구를 위한 복구 경로를 사용한다.

당업계에 공지된 DNA 서열에서 이중가닥 절단을 생성하는 임의의 방법 및 이들 이중가닥 절단을 복구하는 임의의 복구 경로가 본 발명의 범위 내에서 고려된다.

일부 구현예에서, 주형 및 표적 염색체 내의 이중가닥 절단은 하나 이상의 엔도뉴클레아제를 사용하여 생성된다. 일부 구현예에서, 엔도뉴클레아제는 또한 본원에 기술된 방법에 사용되는 상동성 암을 포함하는 하나 이상의 핵산분자를 절단한다. 일부 구현예에서, 하나 이상의 엔도뉴클레아제는 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(gNA), 하나 이상의 징크 핑거 뉴클레아제(ZFN), 또는 하나 이상의 전사 활성제-유사 이펙터 뉴클레아제(TALEN)로 구성된 군에서 선택된다. 일부 구현예에서, 주형 및 표적 염색체 내의 이중가닥 절단은 염색체 재배열을 생성하기 위해 하나 이상의 CRE 재조합효소를 사용하여 생성된다.

상이한 분자는 유전체 핵산에 이중 및/또는 단일가닥 분열을 도입할 수 있다. 본 발명의 뉴클레아제는 호밍 엔도뉴클레아제, 제한 효소, 아연-손가락 뉴클레아제 또는 아연-손가락 뉴클레아제, 메가뉴클레아제 또는 메가니카제, 전사 활성화제-유사 이펙터(TALE) 뉴클레아제, 특히 RNA-유도 뉴클레아제, DNA-유도 뉴클레아제, 메가TAL 뉴클레아제, BurH-뉴클레아제, 변형 또는 키메라 버전 또는 변이체, 및 이들의 조합을 포함하지만, 이에 제한되지는 않는다. 상기 RNA-유도 뉴클레아제 또는 RNA-유도 뉴클레아제는 선택적으로 CRISPR-기반 시스템의 일부이다.

뉴클레아제는 핵산의 단량체들 사이의 포스포디에스테르 결합을 절단할 수 있다. 많은 뉴클레아제는 손상 부위를 인식하고 주변 DNA로부터 절단함으로써 DNA 복구에 참여한다. 이들 효소는 복합체의 일부일 수도 있다. 엔도뉴클레아제는 표적분자의 중심 영역에 작용하는 뉴클레아제이다. 디옥시리보뉴클레아제는 DNA에 작용한다. DNA 복구에 관여하는 많은 뉴클레아제는 서열 특이적이지 않다. 그러나, 현재 맥락에서, 서열 특이적 뉴클레아제가 바람직하다. 일부 구체예에서, 서열 특이적 뉴클레아제(들)는 표적 유전체 내의 상당히 큰 스트링의 뉴클레오티드, 예컨대 10개 이상의 뉴클레오티드, 또는 15, 20, 25, 30, 35, 40, 45 또는 심지어 50개 이상의 뉴클레오티드에 대해 특이적이며, 표적 유전체 내의 표적서열로서 5-50, 10-50, 15-50, 15-40, 15-30의 범위가 바람직하다. 이러한 "인식 서열"이 클수록, 유전체 내의 표적 부위가 적고, 뉴클레아제가 유전체 내로 절단되는 것이 더 특이적일수록, 절단 부위는 부위 특이적이 된다. 부위 특이적 뉴클레아제는 일반적으로, 유전체 내의 표적 부위가 10, 5, 4, 3, 2 미만이거나 또는 단지 하나의 (1) 표적 부위를 갖는다. 본 명세서에서, 특정한 유전체 표적서열을 절단하는 것을 포함하여, 유전체 핵산(들)을 변경하기 위해 조작된 뉴클레아제를 조작된 뉴클레아제라고 한다. CRISPR 기반 시스템은 조작된 뉴클레아제(들)의 한 유형이다. 그러나, 이러한 조작된 뉴클레아제는 본 명세서에 기재된 임의의 뉴클레아제에 기초할 수 있다.

12개 이상의 염기쌍을 인식하는 엔도뉴클레아제를 메가뉴클레아제라 한다. 메가뉴클레아제/-니카제는 큰 인식 부위(예를 들어, 20-40개 또는 30-40개 염기쌍과 같은 12-40개 염기쌍의 이중가닥 DNA 서열)를 특징으로 하는 엔도데옥시리보뉴클레아제이며, 결과적으로 이 부위는 임의의 주어진 게놈에서 한 번만 발생할 수 있다.

"호밍 엔도뉴클레아제"는 메가뉴클레아제의 한 형태로서, 크고 비대칭적인 인식 부위 및 통상적으로 인트론 또는 인틴 중 어느 하나에 내장된 코딩 서열을 갖는 이중가닥 DNase이다. 호밍 엔도뉴클레아제 인식 부위는 유전체 내에서 극히 드물기 때문에 매우 소수의 위치, 때로는 유전체 내의 단일 위치에서 절단된다(WO2004067736, 미국 특허 제8,697,395 B2호 참조).

아연-핑거 뉴클레아제/-니카제 (ZFN)는 아연-핑거 DNA-결합 도메인을 DNA-절단 도메인에 융합함으로써 생성되는 인위적인 제한 효소이다. 아연-핑거 도메인은 특정 원하는 DNA 서열을 표적으로 하도록 조작될 수 있다.

RNA-유도 엔도뉴클레아제/-니카제, 특히 엔도뉴클레아제는, 예를 들어, Cas9 또는 Cpf1을 포함한다. 상기 CRISPR 시스템에 대해서는 상술한 바와 같다. 임의의 CRISPR 기반 시스템은 본 발명의 일 부분이다. 다른 RNA-유도 엔도뉴클레아제(들)가 사용/사용되는 경우, RNA-유도 엔도뉴클레아제와 상호작용하고 게놈 핵산의 게놈 표적 부위를 표적으로 하는 적절한 가이드-RNA, sgRNA 또는 crRNA 또는 다른 적절한 RNA 서열이 사용될 수 있다.

본원에서 사용되는 용어 "CRISPR 관련 단백질" 또는 "CRISPR/Cas" 단백질은 특정 박테리아, 예를 들어, 스트렙토코커스 피오게네스 및 기타 박테리아에서 발견되는 CRISPR(Clustered Regular Interspaced Short Palindromic Repeats) 유형 II 적응 면역 시스템과 관련된 핵산 유도 DNA 엔도뉴클레아제를 의미한다. Cas9과 같은 CRISPR/Cas 단백질은 박테리아에서 발견되는 야생형(wt) 단백질로 제한되지 않는다. 본 발명의 범위 내에서 야생형 CRISPR/Cas 서열로의 돌연변이 또는 유도체를 포함하는 CRISPR/Cas 단백질이 예상된다. 스트렙토코커스 피오게네스의 원래 타입 II CRISPR 시스템은 Cas9 단백질과 두 개의 RNA, 즉 성숙한 CRISPR RNA(crRNA) 및 부분적으로 상보적인 트랜스-액팅 RNA(tracrRNA)로 구성된 가이드 RNA로 구성된다. Cas9은 외부 DNA를 풀고 가이드 RNA의 20개 염기쌍 스페이서 영역에 상보적인 부위를 확인한다. Cas9 표적화가 단순화되었으며 대부분의 Cas 기반 시스템은 crRNA와 tracrRNA의 융합으로 인해 하나 또는 두 개의 키메라 가이드 RNA 또는 단일 가이드 RNA(chiRNA, 종종 가이드 RNA 또는 gRNA 또는 sgRNA라고도 함)만을 필요로 하도록 조작되었다. 스페이서 영역은 필요에 따라 조작될 수 있다.

본원에서 사용되는 용어 "Cas9 코딩 서열"은 숙주 세포/숙주 포유동물에서 기능하는 유전적 코드에 따라 전사 및/또는 번역되어 Cas9 단백질을 생성할 수 있는 폴리뉴클레오티드를 의미한다. 상기 Cas9 코딩 서열은 DNA(예를 들어, 플라스미드) 또는 RNA(예를 들어, mRNA)일 수 있다.

본원에서 사용되는 바와 같이, 용어 CRISPR/Cas 리보뉴클레오단백질은 CRISPR/Cas 단백질 및 관련 가이드 핵산으로 구성된 단백질/핵산 복합체를 의미한다. 예컨대, Cas9 리보뉴클레오단백질은 관련 가이드 RNA와 복합체를 이루는 Cas9를 의미한다.

일부 구현예에서, 상기 뉴클레아제는 RNA-유도 뉴클레아제이다. 본 발명에서 사용하기 위한 핵산-유도 뉴클레아제를 포함하는 RNA-유도 뉴클레아제의 비제한적인 예는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체(homolog), 동원체(ortholog), 또는 변형된 버전을 포함한다.

"메가TAL 뉴클레아제/-니카제"는 조작된 TAL DNA-결합 도메인과 조작된 메가뉴클레아제 또는 조작된 호밍 엔도뉴클레아제를 포함하는 조작된 뉴클레아제를 의미한다. TAL DNA-결합 도메인은 게놈 내 핵산서열의 거의 모든 유전자좌에서 DNA를 결합하도록 설계될 수 있으며, 이러한 DNA-결합 도메인이 조작된 메가뉴클레아제에 융합된 경우 표적서열을 절단한다. 메가TAL 뉴클레아제의 예시적인 예 및 TAL DNA-결합 도메인의 설계는 예를 들어 Boisel 등에 의해 본원에 개시되어 있다(MegaTALs: 치료용 게놈 공학을 위한 희귀-절단 뉴클레아제 아키텍처(2013), 핵산 연구 42(4):2591-2601) 및 여기에 인용된 문헌들, 이들 모두는 그 전체에 참조로 본 명세서에 통합된다. 메가TAL 뉴클레아제는 선택적으로 하나 이상의 링커 및/또는 추가적인 기능적 도메인, 예를 들어 C-말단 도메인(CTD) 폴리펩티드, N-말단 도메인(NTD) 폴리펩티드, 5-3' 엑소뉴클레아제 또는 3-5' 엑소뉴클레아제를 나타내는 말단 처리 효소 도메인, 또는 기타 비-뉴클레아제 도메인, 예를 들어 헬리케이스 도메인을 포함한다.

전사 활성화제-유사 이펙터(TALE) 뉴클레아제/-니카제는 DNA의 특정 서열을 절단하도록 조작될 수 있는 제한 효소이다. 전사 활성화제-유사 이펙터(TALE)는 실질적으로 원하는 DNA 서열에 결합하도록 조작될 수 있으므로, DNA-절단 도메인과 결합될 때, 특정 위치에서 DNA를 절단할 수 있다.

"TALE DNA 결합 도메인"은 식물 전사 활성화제를 모방하여 식물 전사체를 조작하는 전사 활성화제-유사 이펙터(TALE 또는 TAL-이펙터)의 DNA 결합 부분이다. 일부 구현예에서 고려되는 TALE DNA 결합 도메인은 신규 또는 자연 발생 TAL로부터 조작된 것으로, 잔토모나스 캄페스트리스 pv. 베시카토리아, 잔토모나스 가드니, 잔토모나스 트랜스루센스, 잔토모나스 아소노포디스, 잔토모나스 퍼포란스, 잔토모나스 알팔파, 잔토모나스 시트리, 잔토모나스 유베시카토리아, 랄스토니아 솔라나세움의 잔토모나스 오리자에 및 brg11 및 hpx17을 포함하지만, 이에 제한되지는 않는다. DNA 결합 도메인을 유도하고 설계하기 위한 TALE 단백질의 예시적인 예는 미국 특허 제9,017,967호 및 여기에 인용된 문헌에 개시되어 있으며, 이들 모두는 그 전체에 참조에 의해 본 명세서에 통합된다.

"BurrH-뉴클레아제"는 뉴클레아제 활성을 갖는 융합 단백질로서, 모듈화된 염기별 특이적 핵산 결합 도메인(MBBBD)을 포함한다. 이들 도메인은 박테리아 세포내 공생체 버크홀데리아 리족시니카(Burkholderia Rhizoxinica)로부터의 단백질 또는 해양 유기체로부터 동정된 다른 유사한 단백질로부터 유래된다. 이러한 결합 도메인의 상이한 모듈을 함께 조합함으로써, 모듈화된 염기별 결합 도메인은 DNA-결합 도메인과 같은 특정 핵산서열에 대한 결합 특성을 갖도록 조작될 수 있다. 이러한 조작된 MBBBD는 따라서 뉴클레아제 촉매 도메인에 융합되어, 게놈 내 핵산서열의 거의 모든 유전자좌에서 DNA를 절단할 수 있다. BurH-뉴클레아제의 예시적인 예 및 MBBBD의 설계는 WO 2014/018601 및 US2015225465 A1에 개시되어 있고, 여기에 인용된 참조문헌들은 모두 그 전체에 참조로 본원에 통합된다.

본 발명의 관련 양태는 세포 내에서 CRISPR/Cas-매개 이중-가닥 절단(DSB)을 생성하기에 적합한 벡터와 같은 핵산분자를 제공한다. 일부 구현예에서, 벡터는 CRISPR/Cas 단백질, 예를 들어, Cas9 및 가이드 핵산(Cas9 단일 가이드 RNA, 또는 sgRNA)을 코딩하는 서열을 포함하며, 이들의 세포 내 발현을 위해 적합한 프로모터뿐만 아니라 출처 또는 복제 및 선택가능한 표지자와 같은 다른 벡터 성분에 작동적으로 연결된다. 일부 구현예에서, 상기 세포는 본원에 기재된 바와 같은 배아 줄기세포 또는 배아 하이브리드 줄기세포이다.

본 발명에 따르면, 상동 재조합은 엔도뉴클레아제에 의해 생성된 이중가닥 절단(DSB)에 의해 촉진된다. 일부 구현예에서, 엔도뉴클레아제는 CRISPR/Cas9 및 하나 이상의 단일 가이드 RNA(들)("s" 또는 줄여서 sgRNA")를 포함한다. 당업자 또는 통상의 기술자는 상기 엔도뉴클레아제 부위에 대해 기술된 바와 같이, 주형서열 및 표적서열 측면에 있는 표적서열, 또는 표적 위치에 있는 표적서열을 갖는 가이드 RNA를 선택할 수 있을 것이다.

일부 구현예에서, 효소는 CRISPR/Cas 단백질을 코딩하는 벡터 또는 코딩 서열, 및 하나 이상의 sgRNA와 같은 핵산분자를 도입함으로써 도입될 수 있다. 일부 구현예에서, CRISPR/Cas 단백질을 코딩하는 벡터 또는 코딩 서열은 CRISPR/Cas mRNA이다. 일부 구현예에서, CRISPR/Cas 단백질을 코딩하는 벡터 또는 코딩 서열은 CRISPR/Cas 단백질 및 gRNA를 코딩하는 DNA 서열을 포함하는 플라스미드와 같은 벡터이다. 일부 구현예에서, CRISPR/Cas 단백질은 Cas9이다.

특정 구현예에서, 단리된 CRISPR/Cas 단백질은 마이크로인젝션 또는 전기천공을 통해 세포 내(예를 들어, 접합체 또는 ES 세포)로 직접 도입될 수 있다. 상기 CRISPR/Cas 단백질은 CRISPR/Cas 단백질/gNA(가이드 핵산) 복합체인 CRISPR/Cas 리보뉴클레오단백질의 형태일 수 있다. 또는 CRISPR/Cas 단백질 및 하나 이상의 gNA가 임의의 gNA 없이도 세포 내부의 제자리에서 CRISPR/Cas 단백질/gNA 복합체의 형성을 허용하도록 접합체 또는 ES 세포 내에 공동 도입될 수 있다. 일부 구체예에서, 상기 CRISPR/Cas 단백질 및 gNA는 형질감염, 전기천공 또는 형질도입에 의해 세포 내로 도입되는 벡터에 의해 암호화된다. 일부 구체예에서, CRISPR/Cas 단백질은 Cas9이다.

본 발명의 방법들에서 사용하기 위한 엔도뉴클레아제로서 기능하기 위해, CRISPR/Cas 단백질은 gRNA와 기능적 복합체를 형성하는 것이 요구된다.

일부 구현예에 따르면, 다수의 gNA가 사용되며, 각각은 특정 CRISPR/Cas 절단 부위를 표적으로 한다. 예를 들어, 4개의 gNA가 사용될 수 있는데, 2개는 주형서열의 양 측에 gNA 표적서열에 특이적인 표적서열을 갖는 것이고, 2개는 표적서열의 양 측에 gNA 표적서열에 특이적인 표적서열을 갖는 것이다. 대안적으로, 3개의 gNA가 사용될 수 있는데, 하나는 표적 위치에 gNA 표적서열에 특이적인 표적서열을 갖는 것이고, 2개는 주형서열의 양 측에 gNA 표적서열에 특이적인 표적서열을 갖는 것이다. 또 다른 예로서, 2개의 gNA가 사용될 수 있는데, 하나는 주형서열에 인접한 gNA 표적서열에 특이적인 표적서열을 갖는 것이고, 하나는 표적서열에 인접한 gNA 표적서열에 특이적인 표적서열을 갖는 것이다.

바람직하게, DSB를 생성하는데 사용되는 gNA의 수와 무관하게, 특정 실시예에서, 각각의 gNA는 주형 및 표적서열의 5' 및 3' 말단, 또는 표적 위치에 대한 이들의 근접성에 기초하여 독립적으로 선택된다.

gNA의 선택 및 설계는 표적 유전체 및 서열 유형과 같은 사용자 입력에 기초하여 잘 알려진 원리 또는 온라인 도구를 사용하여 수행될 수 있다. 일반적으로, Cas9의 경우, gRNA는 Cas9 결합에 필요한 "scaffold" 서열과 표적서열에 의해 결합 또는 변형될 유전체 표적을 정의하는 사용자 정의 ~20 뉴클레오티드 "spacer" 또는 "targeting" 서열로 구성된 짧은 합성 RNA이다. 단순화를 위해, "gRNA targeting a Cas9 cleavage site"는 gRNA의 스페이서 또는 표적서열이 유전체 표적서열에 결합하여 절단 부위에서 절단하도록 설계된 사실을 의미한다.

본 발명에 따른 gRNA 및 gDNA를 포함하는 가이드 핵산은 10-50 뉴클레오티드, 10-40, 10-30, 10-20, 15-25, 16-24, 17-23, 18-22, 19-21 및 20 뉴클레오티드를 포함하는 길이의 10 뉴클레오티드의 임의의 것일 수 있다.

바람직하게는, 표적서열은 이론적으로 독특한 (게놈의 나머지에 비해) 게놈 표적서열에 결합할 정도로 충분히 독특하다. 표적은 프로토스페이서 인접 모티프(또는 "PAM" 서열)의 바로 상류(또는 5')에 존재해야 한다. 상기 PAM 서열은 표적 결합에 절대적으로 필요하며, 정확한 서열은 Cas9의 종에 의존적이다. 가장 널리 사용되는 스트렙토코커스 피오게네스 Cas9에서, 상기 PAM 서열은 5'-NGG-3'이다("N"은 4개의 표준 뉴클레오티드 중 어느 하나를 나타낸다). 다른 종의 추가 Cas9에 대한 다른 PAM 서열은 당업계에 공지되어 있다. 하기 표 4에 기재된 예시적인 PAM 서열을 참조한다.

Cas9-gRNA 복합체는 임의의 표적 유전체 서열을 PAM과 결합시킬 것이지만, Cas9는 gRNA 스페이서와 표적 유전체 서열 사이에 충분한 상동성이 존재하는 경우에만 표적 유전체 서열을 절단한다. Cas9-매개 DNA 절단의 최종 결과는 PAM 서열의 약 3-4 뉴클레오티드 상류인 절단 부위에서 표적 유전체 서열 내의 이중가닥 절단(DSB)이다.

일부 구현예에서, 이중가닥 절단은 표적서열의 양 측에서 또는 양 측에서 생성된다. 예를 들어, 표적 염색체가 표적 위치, 예컨대 표적 염색체의 결손이 거의 또는 전혀 없이 주형서열이 삽입될 위치를 포함하는 그러한 구체예에서, 이중가닥 절단은 표적 위치에서 생성된다. 예시적인 표적 위치는 본원에 기재된 뉴클레아제 중 임의의 것에 대한 절단 부위를 포함한다. 추가적인 예로서, 표적 염색체가 표적서열, 예컨대 주형서열의 삽입에 의해 대체되거나 삭제될 서열을 포함하는 그러한 구체예에서, 표적서열의 어느 한 측(즉, 표적서열의 5' 및 3' 모두)에서 이중절단 가닥이 생성된다.

특정 실시형태에서, 임의의 선택된 엔도뉴클레아제, 예를 들면 gNA 표적서열의 절단 부위는 표적서열 또는 위치의 약 10 bp, 약 20 bp, 약 30 bp, 약 50 bp, 약 70 bp, 약 100 bp, 약 200 bp, 약 300 bp, 약 400 bp, 또는 약 500 내에 있다.

특정 실시형태에서, 임의의 선택된 엔도뉴클레아제, 예를 들면 gNA 표적서열의 절단 부위는 주형서열의 약 100 bp, 약 200 bp, 약 300 bp, 약 400 bp, 약 500 bp, 약 600 bp, 약 700 bp, 약 800 bp, 약 900 bp, 약 1,000 bp, 약 1,200 bp, 약 1,300 bp, 약 1,400 bp, 약 1,500 bp, 약 1,600 bp, 약 1,800 bp, 약 1,900 r, 약 2,000 이다.

일부 구현예에서, 이중가닥 절단은 절제, 불일치 복구(MMR), 뉴클레오티드 절제 복구(NER), 염기 절제 복구(BER), 표준 비동종 말단 접합부(캐노니컬 NHEJ), 대체 비동종 말단 접합부(ALT-NHEJ), 표준 비동종 말단 접합부(캐노니컬 HDR), 대체 상동성 지시 복구(ALT-HDR), 대체 상동성 지시 복구(ALT-HDR), 마이크로호몰로지 매개 말단 접합부(MmeJ), 블런트 엔드 접합부(Blunt End Jointing), 합성 의존성 마이크로호몰로지 매개 말단 접합부(Single Strand Annealing, SSA), 홀리데이 접합부 모델 또는 이중가닥 파손 복구(DSBR), 합성 의존성 스트랜드 어닐링(SDSA), 단일 가닥 파손 복구(SSBR), 트랜스레션 합성 복구(TLS) 및 스트랜드 간 가교 복구(ICL)로 구성된 군에서 선택된 적어도 하나의 DNA 복구 경로를 통해 복구된다.

조작된 염색체의 복구

본 명세서에 기재된 조작된 염색체를 회수하고, 상기 조작된 염색체를 다운스트림 애플리케이션에 적합한 세포 환경으로 전달하는 방법을 제공한다. 일부 실시형태에서, 본 명세서에 기재된 조작된 염색체를 회수하는 것은 마이크로-세포 매개 염색체 전달(MMCT)을 포함한다.

마이크로세포-매개 염색체 전달 (MMCT)은 공여 세포로부터 제조된 마이크로세포와 수용 세포를 융합하는 기술이다. 이 기술에 의해, 공여 세포 내의 특정 (외래) DNA (예를 들어, 염색체)가 수용 세포 내로 전달될 수 있다. 마이크로세포는 통상적으로, 다른 방법을 사용할 수도 있지만, 공여 세포를 콜세미드로 처리하여 제조되며, 본 발명의 범위 내에서 예상된다.

예시적인 MMCT 프로토콜은 조작된 염색체를 포함하는 세포를 소핵을 유도하기에 충분한 조건하에 세포 배양 배지에서 배양하여 소핵 세포를 생성하고, 소핵 세포를 수집하는 단계를 포함한다. 예시적인 소핵 유도제는 소소관 중합 억제제, 소소관 해중합 억제제 및 방추 체크포인트 억제제를 포함하나 이에 제한되지는 않는다. 당업계에 공지된 예시적인 소핵 유도제는 콜세미드, 콜히친, 빈크리스틴 또는 이들의 조합을 포함하나 이에 제한되지는 않는다. 예컨대, 세포를 0.05 μg/mL 내지 0.25 μg/mL로 처리하여 소핵을 유도할 수 있다.

소핵 세포는 원심분리 및 여과를 포함하여 당업계에 공지된 임의의 적합한 방법을 사용하여 회수될 수 있다.

따라서, 본 발명은 조작된 염색체를 회수하는 단계는 세포를 소핵화를 유도하기에 충분한 조건하에서 콜세미드에 노출시키는 단계, 및 원심분리를 이용하여 소핵화된 세포를 수집하는 단계를 포함하는 방법을 제공한다.

일부 실시형태에서, 조작된 염색체는 하나 이상의 마커, 예를 들어 주형서열로 염색체를 조작할 때 도입된 선택가능 또는 검출가능한 마커를 포함한다. 이들 마커는 조작된 염색체를 따르는데 사용될 수 있고, 상기 기재된 소핵 세포와의 융합 후 조작된 염색체를 포함하는 세포를 선택한다.

따라서, 본 발명은 (a) 본 발명의 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 상기 ES 세포에 융합하는 단계, 여기서 (i) 상기 ES 세포는 조작된 염색체와 상동인 염색체를 포함하고, 상기 상동 염색체는 상기 ES 세포에서 상기 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결된 제1 형광 단백질을 포함하며, (ii) 상기 소핵 세포의 적어도 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 상기 ES 세포에서 상기 형광 단백질을 발현할 수 있는 프로모터와 상이한 제2 형광 단백질을 포함하고, 제2 형광 단백질은 상기 ES 세포에서 상기 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결됨; (b) 상기 제1 및 제2 형광 단백질을 모두 발현하는 ES 세포를 선별하는 단계; (c) 상기 단계 (c)에서 선택된 ES 세포를 상기 상동 염색체의 적어도 서브세트에 의해 소실될 때까지 배양하는 단계; 및 (d) 상기 제2 형광 단백질을 발현하고 상기 제1 형광 단백질을 발현하지 않는 ES 세포를 선택하는 단계를 포함하는 배아 줄기 세포 생성 방법을 제공한다. 일부 구현예에서, 상기 ES 세포는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 말, 낙타, 닭 또는 원숭이 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 마우스 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 마우스 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 래트 ES 세포이다. 일부 구체예에서, 상기 ES 세포는 원숭이 ES 세포이다.

위에 기술된 배아줄기세포를 생성하는 방법은 두 개의 서로 다른 형광 단백질을 마커로 사용하는 반면, 조작된 염색체와 상동 염색체 상의 마커가 상이한 한, 통상의 기술자는 다른 마커가 적합할 수 있음을 인식할 것이다. 예를 들어, 본 명세서에 기재된 2개의 상이한 선택가능한 마커뿐만 아니라, 표지된 항체에 의해 인식될 수 있는 2개의 상이한 표면 분자, 또는 원심분리를 통해 선택을 허용하는 금 입자와 같은 선택적 마커에 접합된 2개의 상이한 표면 분자를 사용할 수 있다. 추가적인 예로서, 마커로서 형광 단백질 이외에, 이 단계에서 양성-음성 선택을 위해 퓨로마이신 및 하이그로마이신/티미딘 키나제(TK) 마커를 사용할 수 있다. 티미딘 키나제가 특정 티미딘 유사체의 존재 하에 발현되면, 이들 유사체는 독성 화합물로 전환되어 세포를 사멸시킨다. 예를 들어, 퓨로마이신 내성 마커와 하이그로마이신/TK 마커를 동일한 위치의 2개의 염색체에 녹인 후, 퓨로마이신 및 하이그로마이신에서 배양하여 이중 양성 단일 클론을 선택한다. 며칠 동안 배양한 후, 하이그로마이신/TK 마커를 보유하는 염색체인 염색체의 하나의 사본이 소실된 클론을 선택하기 위해 퓨로마이신 및 티미딘 키나제를 사용한다.

일부 구현예에서, 배아 줄기세포를 생성하는 방법은 (a) 본 발명에 개시된 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 ES 세포에 융합하는 단계, 여기서 (i) ES 세포는 조작된 염색체와 상동인 염색체를 포함하고, 상동 염색체는 제1 마커를 포함하고, (ii) 조작된 염색체의 적어도 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 제1 마커와 상이한 제2 마커를 포함함; (b) 제1 마커 및 제2 마커를 모두 발현하는 ES 세포를 선별하는 단계; (c) 단계 (c) 상동 염색체가 ES 세포의 적어도 서브세트에 의해 손실될 때까지 배양하는 단계; 및 (d) 제2 마커를 발현하고 제1 마커를 발현하지 않는 ES 세포를 선별하는 단계를 포함한다.

소핵 세포는 임의의 적합한 방법을 사용하여 ES 세포에 융합될 수 있다. 융합 방법에는, 특히, 전기 융합, 바이러스 유도 융합, 및 예를 들어, 세포에 PEG1000을 첨가하는 것을 통한 화학적 유도 융합이 포함된다.

상기 조작된 염색체를 회수하는 방법에 의해 생성된 삼배체의 고유한 불안정성을 감안할 때, 상기 조작된 염색체에 상응하는 상동 염색체를 상실한 세포를 유도하기에 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일의 기간 동안 소핵 세포에 융합되어 생성된 세포를 배양하면 충분할 수 있다. 대안적으로, 음성적으로 선택 가능한 마커, 예를 들어, 선택적 요법에 노출될 때 발현이 세포를 사멸시키는 상동 염색체 상에 위치한 마커를 사용한 선택 계획이 채용될 수 있다. 일부 구체예에서, 단계 (b) 및 (d)에서 세포를 선택하는 것은 형광 활성화 세포 분류(FACS)를 포함한다. 예를 들어, 세포는 조작된 염색체를 표지하는 데 사용되는 제2 형광 단백질을 발현하지만 상동 염색체를 표지하는 데 사용되는 제1 형광 단백질은 발현하지 않는 세포를 분류하는 FAC일 수 있다.

세포

본 발명은 본 발명의 방법에 사용하기 위한 세포를 제공한다. 일부 구체예에서, 상기 세포는 배아줄기(ES) 세포, 하이브리드 배아줄기(EHS) 세포, 또는 접합 세포를 포함한다. 본 발명은 또한 본 발명의 방법에 의해 제조된 조작된 염색체를 포함하는 세포를 제공한다. 본 발명은 본 명세서에 기재된 세포를 분리, 융합 및 배양하는 방법을 제공한다.

따라서, 본 발명은 본 명세서에 기재된 EHS 세포를 생성하기 위한 세포 융합 방법을 제공한다. 세포 융합은 화학적, 생물학적 및 물리적 수단을 통해 가능하게 되었다. 이러한 기술의 예는 각각 폴리에틸렌 글리콜(PEG) 융합, 푸사겐성 바이러스 융합 및 전기 융합을 포함한다.

본 발명의 방법에 사용하기 위한 ES 세포는 다양한 공급원으로부터 수득될 수 있으며, 1차 분리된 ES 세포 또는 인공적 또는 자연적으로 생성된 ES 세포주일 수 있다. 본 발명의 EHS 세포를 생성하기 위한 세포 융합 전 또는 후, 또는 본 명세서에 기재된 방법 전 또는 후에, 하나 이상의 표지자의 발현과 같은 유용한 형질을 도입하기 위해 먼저 유전자 변형될 수 있다

하나의 통상적으로 사용되는 기술은 예를 들어 PEG를 사용하는 화학적 융합이다. 이 기술은 하이브리도마를 발생시키는데 특히 성공적이었다. 융합 확률은 매우 짧은 기간 동안 강렬한 전기장에 세포를 노출시킴으로써 향상될 수 있다. 화학 작용제를 사용하여 전기장 노출 전에 현탁액에서 원하는 유형(즉, 2가지 유형의 EH 세포)의 세포 쌍의 연결 및 근접을 효과적으로 수행할 수 있다.

세포의 전기 융합은 세포들을 근접하게 모으고 이들을 교대 전기장에 노출시키는 것을 포함한다. 적절한 조건하에서, 세포들은 함께 밀리고, 세포막들의 융합 및 이어서 융합체 세포 또는 하이브리드 세포의 형성이 있다. 세포의 전기 융합 및 이를 수행하기 위한 장치는 예를 들어, 미국 특허 제4,441,972호, 4,578,168호 및 5,283,194호, 국제 특허 출원 제PCT/AU92/00473호에 기재되어 있다. 일반적으로, 본 방법은 세포를 선택하고, 세포 융합 챔버로서 사용하기 위해 채택된 유체-충전 챔버에 위치시키는 것을 포함한다. 세포들의 개별 쌍들이 융합 과정, 즉 단일 세포 융합에 관여할 수 있거나, 또는 벌크 융합이 각각 2개 이상의 세포들을 포함하는 2개의 집단으로 발생할 수 있다. 벌크 융합은 약 2 내지 약 1000개의 세포들이 관여하는 미니-벌크 융합 또는 약 1000개 초과의 세포들이 관여하는 매크로-벌크 융합일 수 있다. 융합은 PEG의 존재와 같은 화학적 수단, 예를 들어, 푸사겐성 바이러스의 존재 하에 또는 전기적 수단, 즉 전기적 수단에 의해 촉진될 수 있다. 융합은 또한 이러한 기술들의 조합을 포함할 수 있다. 상기 세포들은 융합을 촉진하기 위해 인터루킨 3 (IL-3)과 같은 사이토카인으로 처리될 수도 있다.

세포 융합 후, 융합된 세포(융합된 세포) 또는 하이브리드 세포로 공지된 융합된 세포는 융합에 관여하는 세포로부터 융합된 지질 이중층에 둘러싸인 적어도 2개의 세포의 핵을 포함한다. 세포의 핵은 4배체이거나 더 적은 수의 염색체를 포함할 수 있는 비정상적인 수의 염색체를 갖는 하이브리드 세포를 생성한다. 상기 하이브리드 세포는 적절한 배양 조건하에서 분열 및 증식하는 능력을 갖는다.

일부 구현예에서, EHS 세포는 전기 융합을 통해 생성된다. 예를 들어, 인간과 마우스, 인간과 래트, 또는 인간과 원숭이 ES 세포는 전기 융합을 통해 융합될 수 있다. 일부 구현예에서, 인간, 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 이루어진 군으로부터 선택된 2종으로부터 2개의 EHS 세포가 전기 융합을 통해 EHS 세포를 생성한다.

일반적으로, 일단 융합이 발생하면, 생성된 혼성 세포는 본 발명의 방법에 사용하기 위해 배양에서 확장되기 전에 적합한 풍부한 배지에서 회수된다. 회수 배지는 융합의 스트레스 후 세포 융합물의 회수를 허용하는 인자를 포함해야 한다. 그러한 보충제는 높은 비율의 태아 송아지 혈청, 예를 들어 20%를 포함할 수 있다.

세포 융합을 통해 생성된 하이브리드 세포는 이들 세포를 선택하고, 융합 이벤트를 모니터링하는 데 유용한 고유한 세포 표면 마커를 포함할 수 있다.

일부 구체예에서, 본 발명의 세포는 본 명세서에 기재된 마커의 도입과 같은 하나 이상의 유전적 변형을 포함한다. 유전적 변형은 당업계에 공지된 임의의 적합한 수단에 의해 수행될 수 있다. 예를 들어, 세포는 형질감염, 형질도입, 전기천공, 리포펙션 등에 의해 변형될 수 있다.

본원에서 사용되는 형질감염이란, 네이키드 또는 정제된 핵산 또는 특정 핵산을 운반하는 벡터를 포함하는 핵산을 세포, 특히 포유동물 세포를 포함한 진핵세포에 도입하는 것을 의미한다. 공지의 모든 형질감염 방법이 본 발명의 내용에서 채용될 수 있다. 이러한 방법 중 일부는 세포 내로 핵산을 가져오기 위한 생물학적 막의 투과성을 강화하는 것을 포함한다. 두드러진 예는 전기천공법, 미세천공법 및 리포펙션이다. 상기 방법은 숙주 세포 내로 핵산의 플럭스 레이트를 선택적으로 향상시키기 위해 단독으로 사용되거나 음파, 전자기 및 열 에너지, 화학적 투과 강화제, 압력 등에 의해 뒷받침될 수 있다. 다른 형질감염 방법, 예를 들면, 리포펙션 또는 바이러스(또한 형질도입이라고 함)를 포함하는 캐리어 기반 형질감염 및 화학적 기반 형질감염도 본 발명의 범위에 속한다. 한편, 핵산을 세포 내로 가져오는 어떠한 방법도 사용될 수 있다. 일시적으로 형질감염된 세포는 짧은 시간 동안 형질감염된 RNA/DNA를 운반/발현하고 이를 전달하지 않을 것이다. 안정적으로 형질감염된 세포는 지속적으로 형질감염된 DNA를 발현하고 이를 전달할 것이다: 외인성 핵산은 세포의 유전체 내로 통합되었다.

파포바이러스, 아데노바이러스, 백시니아 바이러스, 아데노 관련 바이러스, 렌티바이러스, 신드비스 및 셈리키 숲 바이러스 및 조류 및 인간 기원의 레트로바이러스를 포함한 많은 바이러스가 유전자 전달 벡터로서 또는 유전자 전달 벡터를 제조하기 위한 기초로 사용되었다.

인산칼슘 공침, 기계적 기술, 예를 들어, 마이크로인젝션, 리포솜을 통한 막 융합-매개 전달 및 직접 DNA 흡수 및 수용체-매개 DNA 전달을 포함하는 유전자 전달의 화학적 기술들이다. 바이러스-매개 유전자 전달은 리포솜 전달을 사용하는 직접적인 생체 내 유전자 전달과 결합될 수 있으며, 이는 특정 세포로 바이러스 벡터를 지시하도록 허용한다. 대안적으로, 레트로바이러스 벡터 생산자 세포주는 특정 조직에 주입될 수 있다. 그 후 생산자 세포의 주입은 벡터 입자의 연속적인 공급원을 제공할 것이다.

본 발명은 본 발명의 세포를 배양하는 방법을 제공한다. 많은 줄기세포 배지 배양 또는 성장 환경이 본 명세서에 기재된 구현예에서 구상되는데, 여기에는 정의 배지, 컨디셔닝 배지, 피더-프리 배지, 무혈청 배지 등이 포함된다. 본 명세서에 사용된 바와 같이, 이의 "성장 환경" 당량이란 미분화 또는 미분화 줄기세포(예를 들어, 배아 줄기세포)가 시험관 내에서 증식할 환경이다. 상기 환경의 특징은 세포가 배양되는 배지, 및 존재하는 경우 지지 구조체(예를 들어, 고체 표면 상의 기질)를 포함한다. 세포를 배양 또는 유지하기 위한 방법은 또한 PCT/US2007/062755; 미국 출원번호 11/993,399 및 미국 출원번호 11/875,057에 기재되어 있다.

기본 세포 배양 배지는 당업계에 공지되어 있고 상업적으로 이용가능하다. 예시적인 기본 세포 배양 배지는 DMEM, CMRL 또는 RPMI 기반 배지를 포함하지만, 이에 제한되지 않는다.

본 발명의 세포 배양 방법에 사용되는 세포 배양 배지는 혈청을 포함하거나, 무혈청일 수 있다. 세포 배양 배지는 또한 B27 보충제, 인슐린, 포도당, EGF 및 FGF와 같은 성장 인자, 사이토카인과 같은 당업계에 공지된 하나 이상의 보충제 또는 기타 배지 성분을 포함할 수 있다.

용어 "공급 세포(feeder cell)"는 시험관 내에서 성장하고 배양 배지 내로 적어도 하나의 인자를 분비하는 세포의 배양을 지칭하고, 이는 배양에서 관심 있는 다른 세포의 성장을 지원하기 위해 사용될 수 있다. 본 명세서에서 사용된 바와 같이, "공급 세포 층"은 "공급 세포" 용어와 상호교환적으로 사용될 수 있다. 공급 세포는 단분자층을 포함할 수 있고, 여기서 공급 세포는 서로 상부에서 성장하기 전에 완전한 층으로 배양 접시의 표면을 덮거나, 또는 세포의 클러스터를 포함할 수 있다. 바람직한 실시예에서, 공급 세포는 부착성 단분자층을 포함한다.

유사하게, ES 또는 EHS 세포 배양체 또는 응집체 현탁액 배양체가 피더 세포를 사용하지 않고 정의된 조건 또는 배양 시스템에서 성장되는 구현예는 "피더-프리(feeder-free)"이다. 피더-프리 방법은 또한 미국 특허 제6,800,480호에 기재되어 있다. 일부 구현예에서, ES 또는 ESH 세포는 2차원 또는 3차원 환경에서 배양될 수 있다. 미국 특허 제6,800,480호에서는 섬유아세포를 배양하고, 제자리에서 섬유아세포를 용해시킨 다음, 용해 후 남은 것을 세척하여 세포외 기질을 제조한다. 또는, 미국 특허 제6,800,480호에서는 세포외 기질을 콜라겐, 태반 기질, 섬유결합소, 라미닌, 메로신, 테나신, 헤파린 설페이트, 콘드로이틴 설페이트, 더마탄 설페이트, 아그레칸, 빅리칸, 트롬보손딘, 비트로넥틴 및 데코린으로부터 선택된 분리된 기질 성분 또는 이들의 조합으로부터 제조할 수 있다.

일부 실시형태에서, 배양 방법 또는 배양 시스템은 동물 유래 생성물이 없다. 다른 실시형태에서, 배양 방법은 이종(exeno)이 없다.

본 발명은 본 명세서에 기재된 조작된 염색체를 포함하는 ES 세포를 다양한 다운스트림 응용 분야에 사용하기 위해 상이한 세포 유형으로 분화하는 것을 고려한다. ES 세포는 일반적으로 내인성 발달 세포 신호 및 세포 특이적 분화를 직접 요약하는 외인성 생화학적 조성물로 세포 배양 배지를 보충하는 것을 포함하는 다양한 전략을 사용하여 시험관 내에서 다양한 세포 유형으로 분화하도록 유도될 수 있다. ES 세포를 분화하기 위한 전략은 Vazin 및 Freed, Restor Neurol Neurosci (2010) 28(4): 589-603에 개시되어 있으며, 이들의 내용은 본 명세서에 참고로 포함되어 있다.

예를 들어, ES 또는 EHS 세포의 개체군은 특정 보충 성장 인자의 존재 하에 추가로 배양되어 상이한 세포주로 발달하거나 또는 상이한 세포주로 발달할 수 있는 세포의 개체군을 수득할 수 있다. "보충 성장 인자"라는 용어는 가장 넓은 맥락에서 사용되며, ES 세포의 성장을 촉진하고, 세포의 생존을 유지하고, 세포의 분화를 자극하며, 및/또는 세포의 분화의 역전을 자극하는 데 효과적인 물질을 의미한다. 더욱이, 보충 성장 인자는 공급 세포에 의해 그 배지 내로 분비되는 물질일 수 있다. 이러한 물질은 사이토카인, 케모카인, 소분자, 중화 항체 및 단백질을 포함하나 이에 제한되지는 않는다. 성장 인자는 또한 세포의 형태 및 기능뿐만 아니라 세포의 발달 및 유지를 제어하는 세포간 신호 전달 폴리펩티드를 포함할 수 있다. 바람직한 구체예에서, 보충 성장 인자는 가용성 인터루킨-6 수용체(IL-6R), 섬유아세포 성장 인자(FGF), 뼈 형태유전 단백질(BMP), 종양 괴사 인자(TNF) 및 과립구 대식세포 집락 자극 인자(GM-CSF)와 조합하여 스틸 세포 인자(SCF), 온코스타틴 M(OSM), 섬모 신경영양 인자(CNTF), 인터루킨-6(IL-6)를 포함하는 군으로부터 선택된다.

다양한 다능성 및/또는 분화된 세포로의 줄기세포의 진행은 제2 또는 대조군 유전자, 예를 들어 하우스키핑 유전자의 발현과 비교하여 특정 세포 유형의 특징인 유전자, 또는 유전자 마커의 상대적인 발현을 결정함으로써 모니터링할 수 있다. 일부 공정에서, 특정 마커의 발현은 마커의 존재 여부를 검출함으로써 결정된다. 또는, 특정 마커의 발현은 세포 배양물 또는 세포 집단의 세포 내에서 마커가 존재하는 수준을 측정함으로써 결정될 수 있다. 이러한 공정에서, 마커 발현의 측정은 정성적일 수도 있고 정량적일 수도 있다. 마커 유전자에 의해 생성되는 마커의 발현을 정량하는 한 가지 방법은 정량적 PCR(Q-PCR)을 사용하는 것이다. Q-PCR을 수행하는 방법은 당업계에 잘 알려져 있다. 당업계에 공지된 다른 방법을 사용하여 마커 유전자 발현을 정량할 수도 있다. 예를 들어, 관심 마커 유전자 산물에 특이적인 항체를 사용하여 마커 유전자 산물의 발현을 검출할 수 있다.

형질전환 동물

본 발명은 본 발명의 조작된 염색체를 포함하는 형질전환 동물, 예를 들어 형질전환 마우스, 및 이의 제조방법을 제공한다.

본 명세서에 기재된 조작된 염색체를 포함하는 ES 세포 또는 접합 세포로부터 형질전환 동물을 제조하기 위한 적합한 방법의 선택은 동물에 의존할 것이고, 당업계의 숙련자에게 공지될 것이다.

예시적인 방법들에서, 조작된 염색체를 포함하는 ES 세포는 배반포 발달 단계에서 배아에 통합되고, 이는 임신한 또는 가임신한 여성에게 이식되어 임신 기간까지 운반된다. 그 결과 키메라 동물이 된다. 만약 ES 세포가 생식 세포를 생성한다면, 그 동물의 자손은 완전히 형질전환되어 조작된 염색체를 운반할 것이다.

일부 실시형태에서, 상기 형질전환 동물은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이이다.

일부 구체예에서, 상기 형질전환 동물은 마우스이다. 일부 구체예에서, 상기 형질전환 마우스를 생산하는 것은 ES 세포를 이배체 배반포에 주입하는 단계, ES 세포로부터 제핵 마우스 배아로의 핵 전달, 또는 4배체 배아 보완을 포함한다.

일부 구현예에서, 상기 방법은 ES 세포 또는 접합체를 유사-임신 암컷으로 이식하는 단계를 추가로 포함한다. 마우스에서, 유사-임신 암컷은 자연 발정 상태의 6-8주령 암컷 마우스와 혈관절제된 수컷을 교배시킴으로써 준비된다. 유사-임신 암컷으로의 당일 이식을 위해 처리된 접합체는 배양체로부터 제거되고, 예열된 적합한 배지(예를 들어, M2 배지)에 넣고, 난관을 통해 유사-임신 암컷(예를 들어, 9-11주령) 후 0.5일로 이식될 수 있다.

일단 본 발명의 방법을 사용하여 조작된 염색체가 숙주 포유동물에 삽입되면, 조작된 염색체의 존재는 생성된 형질전환 동물(예를 들어, 마우스) 또는 그 자손에서 확인될 수 있다. 이러한 확인은 전형적으로 조작된 염색체를 잠재적으로 보유하는 유전자형 동물, 접합 서열의 중합효소 연쇄반응 증폭, 특정 DNA 스트레치(예를 들어, 주형서열)의 직접 시퀀싱 및 유전자 매핑 중 하나 이상을 포함한다. 이러한 기술은 당업계에 잘 알려져 있다.

본 발명은 본 발명의 조작된 염색체를 포함하는 형질전환 마우스를 제공한다. 일부 구체예에서, 형질전환 마우스는 인간화된 하나 이상의 유전자, 예를 들어 표 1 및 표 2에 기재된 유전자 중 어느 하나를 포함한다. 일부 구체예에서, 동물 모델은 하나 이상의 인간화된 유전자(예를 들어, 1, 2, 5, 10, 20, 50, 100 이상의 유전자)를 포함한다. 일부 구체예에서, 형질전환 마우스는 인간화된 면역글로불린 유전자의 전부 또는 일부를 포함한다. 일부 구체예에서, 형질전환 마우스는 인간화된 TCR 서브유닛 유전자의 전부 또는 일부를 포함한다.

본 발명의 형질전환 마우스의 일부 구현예에서, 마우스 염색체 12는 마우스 Igh 가변 영역을 대신하여 인간 IGH 가변 영역의 서열을 포함한다. 일부 구현예에서, 마우스 Igh 가변 영역은 V_H, D_H 및 J_H1-6 유전자 세그먼트들 및 개재 비-코딩 서열들을 포함한다. 일부 구현예에서, 인간 IGH 가변 영역은 V_H, D_H 및 J_H1-6 유전자 세그먼트들 및 개재 비-코딩 서열들을 포함한다. 일부 구현예에서, 조작된 염색체는 마우스 Igk 가변 영역을 대신하여 인간 IGK 가변 영역의 서열을 포함하는 마우스 염색체 6이다. 일부 구현예에서, 마우스 Igk 가변 영역 서열은 마우스 V_k 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열들을 포함한다. 일부 구현예에서, 주형서열은 인간 IGK 가변 영역 서열을 포함한다. 일부 구현예에서, 인간 IGK 가변 영역 서열은 인간 V_k 및 J_k1-5 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열들을 포함한다.

응용

본 명세서에 기재된 조작된 염색체를 포함하는 세포 및 형질전환 동물의 다운스트림 응용이 본 명세서의 범위 내에서 고려된다.

예시적인 다운스트림 응용은 하나 이상의 인간 유전자에 대해 인간화된 동물 모델(예를 들어, 마우스, 래트 또는 원숭이)을 사용하여 인간 질병 및 장애의 동물 모델에 대한 기초 및 응용 연구를 포함한다. 예시적이지만 비제한적인, 모델 동물 상동체를 인간 상동체로 대체함으로써 인간화될 수 있는 유전자를 표 1 및 표 2에 기재한다. 염색체 수차(전좌, 역전 등)와 관련된 인간 질병에 대한 동물 모델도 본 명세서에 기재된 방법을 사용하여 제조될 수 있다. 예를 들어, DMD(Duchenne Music Disstrophy) 인간화 마우스 질병 모델과 같이 300kB보다 큰 단편에 대해 대규모 염색체 재배열이 필요한 모든 동물 모델 또는 최대 수백 개의 유전자 배열의 대규모 삽입 또는 교체가 필요한 모든 동물 모델이 본 발명의 범위 내에서 구상된다.

일부 구현예에서, 예를 들어, 동물의 Igh 가변 영역이 인간화된 구현예에서, 본 발명의 형질전환 동물은 인간화 항체를 생산하는데 사용될 수 있다. 예를 들어, 이러한 동물은 인간화된, 또는 인간화된, 항체로 특이적 B 세포를 생산할 수 있다. 일부 구체예에서, 예를 들어, 동물의 Igk 또는 Igl 가변 영역이 인간화된 구현예에서, 본 발명의 형질전환 동물은 인간화 항체를 생산하는데 사용될 수 있다.

일부 구현예에서, 예를 들어, 항체 또는 이의 항원 단편을 포함하는 주형서열이 표적 염색체 내에 삽입된 구현예에서, 본 발명의 형질전환 동물은 항체 또는 항원 결합 단편을 생성하기 위해 사용될 수 있다. 예를 들어, 형질전환 동물은 다른 것들 중에서도 단일 사슬 가변 단편(scFv), 나노바디, 이중-특이적 항체, 및 다중-특이적 항체를 생성하기 위해 사용될 수 있다. 이러한 항체는 연구 또는 치료 목적을 위해 사용될 수 있다.

예시적인 다운스트림 응용은 조작된 염색체가 형질전환 동물에 통합되지 않은 응용을 포함한다. 대신에, 일 예로서, 조작된 염색체를 포함하는 ES 세포는 연구 또는 치료 목적으로 사용될 수 있는 다른 세포 유형으로 분화된다.

키트

본 발명은 본 명세서에 기재된 핵산분자를 포함하는 키트를 제공한다. 일부 구체예에서, 핵산분자는 벡터, 예를 들어 플라스미드이다.

본 발명의 키트의 일부 구현예에서, 키트는 본원에 기술된 방법에 사용하기 위한 세포, 예를 들어, 동결보존된 EHS 세포를 포함한다. 일부 구현예에서, 키트는 핵산분자, 및 선택적으로 세포를 사용하기 위한 지침서를 포함한다.

실시예

실시예 1: 배아 하이브리드 줄기(EHS) 세포 구축

본 연구의 전체적인 목표는 Igh 및 Igk 유전자의 가변 도메인에 대해 인간화된 마우스를 얻는 것이었다. 인간과 마우스는 항체 유전자의 배열 및 발현에서 높은 유사성을 나타내고, 중쇄의 유전체 조직 또한 인간과 마우스에서 유사하다. 따라서, V_H, D_H 및 J_H 유전자 세그먼트를 모두 포함하는 ~3MB 마우스 유전체 서열을 동등한 인간 유전자 단편을 포함하는 연속 인간 유전체 서열 약 1MB로 대체함으로써 마우스 Igh 또는 Igk 유전자 가변 도메인의 인간화된 버전을 얻을 수 있었다(도 1).

인간화된 마우스 Igh 유전자를 개발하기 위한 첫 단계는 마우스 배아줄기(ES) 세포를 인간 ES 세포에 융합하여 마우스 배아 하이브리드 줄기(EHS) 세포를 만들고, 마우스와 인간 Igh 유전자를 모두 가진 세포를 만드는 것이었다.

PGK 프로모터의 제어 하에 네오마이신 내성 유전자를 발현하는 조작된 마우스 세포와 CAG 프로모터의 제어 하에 mCherry 마커를 발현하는 조작된 인간 ES 세포를 전기융합에 의해 융합시켰다. 하이브리드 EHS 세포를 G418을 포함하는 마우스 ES 세포배지에서 7일 동안 배양하고, 생존 세포를 mCherry의 발현 수준에 따라 형광 활성화 세포 분류(FACS)로 분류하였다(도 2). 양성 세포를 G418을 포함하는 마우스 ES 세포배지에서 지속적으로 배양하고, 단일 세포 클론을 성장을 위해 별도의 웰로 분리하였다. 다음으로, 유전자형 분석을 위해 각각의 단일 세포 클론에 대해 유전체 DNA를 추출하였다. 구체적으로, 인간 면역글로불린 헤비(IGH) 사슬의 V, D, J 영역(도 3a)에 대한 프라이머 3쌍을 사용하여 EHS 클론 내 표적서열(도 3b)의 존재를 확인하였다. 상기 3개의 원하는 영역을 모두 갖는 클론만을 추가 실험을 위해 보유하였다.

실시예 2: 인간화된 염색체 조작

2.1. HDR 매개 염색체 재배열(HMCR)에 의한 EHC 확립

Igh 유전자의 가변 도메인에 대해 인간화된 마우스 배아 하이브리드 줄기(EHS) 세포를 얻기 위해, 마우스 염색체 12 상의 Igh 유전자의 ~3MB 가변 도메인을 HDR-매개 염색체 재배열(HMR; 도 4a)에 의해 인간 염색체 14 상의 인간 IGH 유전자의 ~1MB 가변 도메인으로 대체하였다.

2개의 플라스미드는 HMCR 과정을 매개하도록 설계되었으며, 도 4A에 도시되어 있다. 5' HMCR 플라스미드는 마우스 Igh 유전자의 5' 말단을 인간 대응물로 대체하도록 설계되었으며, 3' HMCR 플라스미드는 마우스 Igh 유전자의 3' 말단을 인간 대응물로 대체하도록 매개하였다. 5' HMCR 플라스미드는 마우스 Igh 유전자의 5' 말단에 상동성인 5' 암, 인간 IGH 유전자의 5'에 상동성인 3' 암 및 두 상동성 암 사이에 삽입된 CMV-EGFP-polyA-PGK-Puromycin-poly의 카세트를 포함하였다. 유사하게, 3' HMCR 플라스미드는 인간 IGH 가변 암의 3'에 상동성인 5' 암, 마우스 Ig 가변 암의 3'에 상동성인 3' 암 및 두 상동성 암 사이에 삽입된 PGK-Hygromycin-polyA 카세트를 포함하였다(도 4A 참조). 상동성 암들의 길이는 600bp 내지 1000bp 사이였다. 동시에, 마우스 및 인간의 Igh 가변 도메인의 5' 및 3' 말단을 표적으로 하는 Cas9 및 sgRNA를 포함하는 4개의 플라스미드도 설계하였다(도 4a의 지그재그 마크, 표 7에 제공된 sgRNA 표적화 서열 참조). 이들 6개의 플라스미드를 표준 방법을 사용하여 실시예 1에서 얻은 EHS 세포에 원형 플라스미드로서 공동 형질감염시키고, 생성된 세포를 Puromycin 및 Hygromycin을 포함하는 마우스 ES 세포 배지에서 7일 동안 배양하였다. 생존한 GFP-양성 단일 클론을 추가 배양을 위해 선별하였다.

유전자형 분석을 수행하여, 성공적인 HMCR로 원하는 단일 클론을 확인하였다. 유전자형 분석을 위해, 도 5a와 같이 4쌍의 PCR 프라이머를 설계하였다. 제1 쌍의 프라이머에 대해, 정방향 프라이머는 마우스 Igh 5' HMCR 플라스미드의 5' 상동성 암의 상류에 설계하였고, 역방향 프라이머는 CMV 프로모터 영역 내에 있었다(도 5a). 제2 쌍의 프라이머에 대해, 정방향 프라이머는 5' HMCR 플라스미드의 Puromycin 유전자 내에 있었고, 역방향 프라이머는 인간 IGH 서열 내에서 인간 IGH의 5' 상동성 암의 하류에 있었다(도 5a). 제3 쌍의 프라이머에 대해, 정방향 프라이머는 인간 IGH 가변 영역의 3' 상동성 암의 상류에 있었고, 역방향 프라이머는 3' HMCR 플라스미드의 PGK 프로모터 영역에 있었다(도 5a). 마지막 쌍의 프라이머에 대해, 정방향 프라이머는 3' HMCR 플라스미드의 Hygromycin 유전자에 있었고, 역방향 프라이머는 마우스 Igh 가변 도메인 내에서 3' HMCR 플라스미드의 3' 상동성의 3' 다운스트림에 있었다(도 5a). 각 클론에 대해 각 프라이머 쌍으로 PCR 증폭을 수행하였고, 4개의 유전자형 분석 모두에 대해 양성인 클론만을 추가 실험을 위해 보유하였다. 이 단계에서 분리된 196개의 클론 중, 6개는 4개의 PCR 앰플리콘 모두에 대해 양성인 것으로 확인되었다(도 5b).

성공적인 HMCR로 EHS 세포에서 인간 IGH 유전자의 발현을 용이하게 하기 위해, 3' 선택 마커는 상동성 지시 복구(HDR)에 의해 양성 클론의 게놈에서 삭제되었지만(도 4a), 비-상동성 말단 접합(NHEJ), 미세상동성 매개 말단 접합(MMEJ) 및 상동성 매개 말단 접합(HMEJ) 방법도 사용될 수 있었다. 상기 과정은 성공적으로 마우스 염색체 12 상의 마우스 Igh 유전자의 V_H, D_H 및 J_H1-6 유전자 세그먼트를 포함하는 가변 도메인을 갖는 조작된 인간화 염색체(EHC)를 확립하였다.

HMCR 공정을 매개하기 위해 사용된 플라스미드의 서열은 하기 표 5 및 표 6에 제공된다.

표 7은 sgRNA 표적화 서열의 비표적 가닥 3'에 위치한 PAM 서열(NGG)을 갖는 sgRNA 서열을 제공한다. PAM이 없는 상응하는 sgRNA 표적화 서열은 서열번호 14-17과 같이 제공한다.

2.2. CRE-Loxp 매개 염색체 재배열(CMCR)에 의한 EHC 확립

Igh 유전자의 가변 도메인에 대해 인간화된 마우스 EHS 세포를 얻기 위해, 마우스 염색체 12번의 Igh 유전자의 ~3MB 가변 도메인은 CRE-Loxp 매개 염색체 재배열 (CMCR; 도 4B)에 의해 인간 염색체 14번의 ~1MB 가변 도메인으로 대체되었다. 4개의 플라스미드가 CMCR 과정을 매개하도록 설계되었다. 마우스 Igh 5' (pCMV-GFP-BGH PolyA-Loxp) 및 3' (BGH polyA-Loxp-511-Hygromycin-BGH PolyA-PGK-BSD-BGH PolyA) 플라스미드는 마우스 Igh 가변 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다. 동시에, 인간 IGH 5' (BGH polyA-Loxp-Puro-BGH PolyA-PGK-Neomycin-BGH PolyA) 및 3' (PCMV-BGP-BGH PolyA-PGK-Loxp-511) 플라스미드는 인간 IGH 가변 유전자좌의 5' 및 3' 말단에 각각 삽입되도록 설계되었다 (도 5). 형질감염 후의 EHS 세포를 BSD 및 Neomycin을 함유하는 마우스 ES 세포 배지에서 7일 동안 배양하였다. 생존된 GFP- 및 BFP- 이중 양성 세포를 추가 배양을 위해 선별하였다. 유전자형 분석은 상기 플라스미드들이 성공적으로 통합되어 원하는 단일 클론을 확인하기 위해 수행하였다. CMCR을 위해 성공적으로 통합된 EHS 세포에 Cre를 형질감염시켰고, 성공적으로 재배열된 세포는 Puromycin 및 Hygromycin을 함유하는 배지에서 생존할 수 있었다. 그 후 생존된 세포를 유전자형 분석을 위해 패킹하였다. 성공적인 CMCR을 갖는 EHS 세포에서 인간 IGH 유전자의 발현을 용이하게 하기 위해, 3' 선택 마커를 다음으로 게놈으로부터 삭제하였다(도 5). 상기 과정들에 따라, 조작된 인간화 염색체(EHC; 마우스 염색체 12의 Igh 유전자는 그들의 가변 도메인에 대해 인간화됨)를 EHS 세포에서 CMCR에 의해 성공적으로 확립하였다

실시예 3: 마이크로 세포 매개 염색체 전달을 통한 마우스 배아줄기세포의 염색체 대체

실시예 1 및 2에 기재된 바와 같이 조작된 인간화 염색체(EHC)로 EHS 세포를 수득한 후, EHC를 이어서 마이크로-세포 매개 염색체 전달(MMCT)에 의해 마우스 ES 세포로 전달하여 Igh 유전자의 가변 도메인에 대해 인간화된 마우스 ES 세포를 확립하였다.

EHC를 운반하는 EHS 세포에 0.2㎍/ml 콜세미드를 37℃에서 48시간 동안 처리하였다. 장기간의 유사분열 정지는 마이크로 세포의 형성을 유도하였고, 이를 원심분리에 의해 수집하였다(도 6). 동시에, 12번 염색체 상의 mCherry 형광 표지자 및 발현 마우스 ES 세포를 수득하였다(도 6). 이들 세포는 CMV-mCherry-polyA의 카세트를 마우스 12번 염색체의 하나의 카피에 삽입함으로써 수득하였다.

다음으로, 마이크로 세포를 전기 융합에 의해 마우스 ES 세포와 혼성화시키고, 생성된 세포를 FACS에 의해 GFP+ 및 mCherry+ 마커를 사용하여 분류하여 GFP+ 및 mCherry+인 마우스 ES 세포를 수득하였다. GFP+는 EHC가 마우스 ES 세포 내로 성공적으로 전달되었음을 나타낸 반면, mCherry+ 마커는 세포가 mCherry+ 염색체 12도 보유함을 나타내었다. 양성 세포는 마우스 ES 세포 배지에서 2주 동안 지속적으로 배양하였고, mCherry+ 및 GFP+ 마우스 ES 세포, 즉 mCherry+로 표시된 여분의 염색체 12를 상실한 세포를 FACS에 의해 분류하여 7일 동안 배양하였다. 단일 클론을 성장 및 핵형 분석을 위해 별도의 웰로 분리하고, 올바른 핵형을 갖는 클론을 유지하였다. 그 결과, 마우스 ES 세포는 Igh 유전자의 가변 영역에 대해 인간화되었다.

실시예 4: Igh 인간화 마우스 제조

실시예 3에서 얻은 Igh 유전자의 가변영역에 대해 인간화된 마우스 ES 세포를 표준 절차에 따라 B6D2F1 (C57BL/6 X DBA2) 마우스 균주로부터 배반포에 주입하였다. 대안적으로, 핵 전달 또는 4배체 배아 보완을 사용하여 인간화된 마우스를 생성할 수도 있었다.

주입된 배반포를 coitus (dpc) 후 2.5일에 가성임신 ICR 여성의 자궁으로 옮겼다. Igh 인간화 마우스를 형광 입체현미경 하에서 GFP의 발현 수준에 의해 확인하고, GFP+ 마우스를 추가로 분석하였다.

다음으로, 일련의 PCR 실험을 Igh 인간화 마우스를 검증하기 위해 설계하였다. 제1 세트의 PCR 실험은 인간 IGH 가변 영역의 완전성을 검증하기 위해 설계하였다. 인간 IGH 가변 영역의 상이한 영역에 대한 5쌍의 프라이머를 설계하였다(도 7a, PCR 프라이머 1-10을 나타내는 화살표 참조). Igh 인간화 마우스는 5개의 PCR 프라이머 쌍 모두에 대해 양성 PCR 생성물을 나타냈다(도 7B). 우리는 또한 인간 IGH 가변 영역의 업스트림 및 다운스트림에 프라이머를 설계하였으며(도 7A), 우리의 Igh 인간화 마우스에 대한 PCR 실험 중 어느 것에서도 생성물이 관찰되지 않은 반면, HEK293T는 PCR 생성물의 오른쪽 밴드를 나타냈다(도 7B).

섬유아세포를 Igh 인간화 마우스의 꼬리로부터 분리하여 FIX(Fluorence In Situ Hybridization)를 수행하는 데 사용하였다. FIX 결과는 Igh 인간화 마우스의 염색체 12가 인간 염색체 14의 단편을 포함하는 것으로 나타났으며(도 8a), 이는 인간 IGH 유전자의 가변 도메인이 쥐의 염색체 12에 성공적으로 삽입되었음을 나타낸다.

이상 염색체를 배제하기 위해 G-banding karyotype 분석을 또한 수행하였다(도 8b).

Igh 인간화 마우스의 게놈 DNA도 추출하여, 전체 게놈 시퀀싱(WGS) 분석을 수행하였다. WGS 서열은 마우스 및 인간 염색체 14번의 염색체를 모두 포함하는 참조 게놈에 매핑되었다. 인간 IGH 유전자의 모든 가변 도메인(V_H, D_H 및 J_H 유전자 세그먼트)은 전체 게놈 서열 판독에 의해 커버되었다. 또한, 다른 게놈 영역에서는 표적 외 편집이 발견되지 않았다(도 9a 내지 도 9b).

실시예 5: Igk 인간화 마우스 제조

MASIRT를 적용하여 Igk 유전자의 가변 도메인에 대해 인간화된 마우스를 수득하였다(도 10). 상기 기재된 Igh 유전자에 대한 접근법과 유사한 접근법을 사용하여, Igk 인간화 마우스도 수득하였다. Igk 인간화 마우스를 검증하기 위해, 우리는 먼저 인간 IGK 가변 영역의 완전성을 검증하기 위해 PCR 실험을 수행하였다. 인간 IGK 가변 영역의 상이한 유전자좌 상에서 5쌍의 프라이머를 설계하였고(도 11A), 수득한 Igk 인간화 마우스는 5개의 실험 모두에 대해 PCR 생성물이 양성이었다(도 11B). 인간 IGK 가변 영역의 업스트림 및 다운스트림 상의 프라이머도 설계하였고(도 11A), 수득한 Igk 인간화 마우스에 대한 PCR 실험 중 어느 것에서도 생성물이 관찰되지 않은 반면, HEK293T는 PCR 생성물의 오른쪽 밴드를 나타내었다(도 11B). 마지막으로, Igk 인간화 마우스의 게놈 DNA도 추출하여 전체 게놈 시퀀싱(WGS) 분석을 수행하였다.

표 10은 sgRNA 표적화 서인간의 2번 염색체를 포함하는 참조 게놈에 대한 전체 게놈 서열을 맵핑하였다. 이열의 비표적 가닥 3'에 위치한 PAM 서열(NGG)을 갖는 sgRNA 서열을 제공한다. PAM이 없는 상응하는 sgRNA 표적화 서열은 서열번호 28-31과 같이 제공한다.

마우스의 모든 염색체 및 는 인간 IGK 유전자의 모든 가변 도메인(V_H 및 J_H 유전자 세그먼트)이 전체 게놈 서열에 의해 커버되었음을 보여준다. 이외에도, 다른 게놈 영역에서 어떠한 목표 외 편집도 발견되지 않았다(도 12).

서열목록 전자파일 첨부

Claims

하기 단계를 포함하는 조작된 염색체의 제조방법:
a. 표적서열을 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계;
b. 상기 세포를 하기 핵산분자와 접촉시키는 단계
i. 표적서열의 5' 말단의 상류(upstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암(homology arm), 적어도 하나의 제1 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 제1 핵산분자; 및
ii. 주형서열의 3' 말단의 하류(downstream) 뉴클레오티드 서열을 함유하는 5' 상동성 암, 적어도 하나의 제2 마커, 및 표적서열의 3' 말단의 하류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5' 에서 3' 으로 포함하는 제2 핵산분자;
c. 주형서열 및 상기 제1 및 제2 마커가 표적 염색체 내로 삽입되어, 표적서열의 양 측면, 및 주형서열의 5' 말단 및 3' 말단에서 이중가닥 절단(double strand break)을 생성하는 단계; 및
d. 상기 제1 및 제2 마커를 발현하는 세포 또는 세포들을 선별하는 단계.
제1항에 있어서, 주형서열의 삽입 후에, 제1 마커는 주형서열의 5' 말단에 위치하고 제2 마커는 주형서열의 3' 말단에 위치하는 것인 방법.
제1항 또는 제2항에 있어서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp인 방법.
제1항 또는 제2항에 있어서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp인 방법.
제1항 또는 제2항에 있어서, 제1 및 제2 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 주형서열의 길이가 적어도 25 KB(kilobasepairs), 적어도 50 KB, 적어도 100 KB, 적어도 200 KB, 적어도 400 KB, 적어도 500 KB, 적어도 600 KB, 적어도 700 KB, 적어도 800 KB, 적어도 900 KB, 적어도 1 MB(megabasepair), 적어도 2 MB, 적어도 3 MB, 적어도 4 MB, 적어도 5 MB, 적어도 6 MB, 적어도 7 MB, 적어도 8 MB, 적어도 9 MB, 적어도 10 MB, 적어도 15 MB, 적어도 20 MB, 적어도 25 MB, 적어도 30 MB, 적어도 40 MB, 적어도 50 MB, 적어도 60 MB, 적어도 70 MB, 적어도 80 MB, 적어도 90 MB, 적어도 100 MB, 적어도 120 MB, 적어도 140 MB, 적어도 160 MB, 적어도 180 MB, 적어도 200 MB, 적어도 220 MB, 또는 적어도 250 MB인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 주형서열의 길이가 50 KB 내지 250 MB, 50 KB 내지 100 MB, 50 KB 내지 50 MB, 50 KB 내지 20 MB, 50 KB 내지 10 MB, 50 KB 내지 5 MB, 50 KB 내지 3 MB, 50 KB 내지 2 MB, 50 KB 내지 1 MB, 100 KB 내지 200 MB, 100 KB 내지 100 MB, 100 KB 내지 50 MB, 100 KB 내지 20 MB, 100 KB 내지 10 MB, 100 KB 내지 5 MB, 100 KB 내지 3 MB, 100 KB 내지 2 MB, 100 KB 내지 1 MB, 100 KB 내지 500 KB, 200 KB 내지 100 MB, 200 KB 내지 50 MB, 200 KB 내지 20 MB, 200 KB 내지 10 MB, 200 KB 내지 5 MB, 200 KB 내지 3 MB, 200 KB 내지 2 MB, 200 KB 내지 1 MB, 200 KB 내지 500 KB, 500 KB 내지 100 MB, 500 KB 내지 50 MB, 500 KB 내지 20 MB, 500 KB 내지 10 MB, 500 KB 내지 5 MB, 500 KB 내지 3 MB, 500 KB 내지 2 MB, 500 KB 내지 1 MB, 1 MB 내지 100 MB, 1 MB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 1 MB 내지 2 MB, 3 MB 내지 100 MB, 3 MB 내지 50 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 5 MB, 5 MB 내지 100 MB, 5 MB 내지 50 MB, 5 MB 내지 20 MB, 5 MB 내지 10 MB, 10 MB 내지 100 MB, 10 MB 내지 50 MB, 또는 10 MB 내지 20 MB인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 주형서열의 길이가 200 KB 내지 50 MB, 1 MB 내지 20 MB, 1 MB 내지 10 MB, 1 MB 내지 5 MB, 1 MB 내지 3 MB, 3 MB 내지 20 MB, 3 MB 내지 10 MB, 3 MB 내지 7 MB, 또는 3 MB 내지 5 MB인 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 하나 이상의 가이드 핵산(guide nucleic acids, gNAs), 하나 이상의 아연 핑거 뉴클레아제(zinc finger nucleases), 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(Transcription Activator-Like Effector Nucleases, TALEN), 또는 하나 이상의 CRE 재조합효소(CRE recombinase)를 사용하는 단계를 포함하는 방법.
제9항에 있어서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체(homolog), 동원체(ortholog), 또는 변형된 버전을 포함하는 방법.
제9항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함하는 방법.
제9항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함하는 방법.
제10항 내지 제12항 중 어느 한 항에 있어서, gNA는 단일 가이드 RNA(single guide RNA, sgRNA)를 포함하는 방법.
제1항 내지 제13항 중 어느 한 항에 있어서, 표적 염색체는 제1 핵산분자의 5' 상동성 암의 서열, 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5' 에서 3'으로 포함하는 방법.
제1항 내지 제14항 중 어느 한 항에 있어서, 주형 염색체는 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 및 제2 핵산분자의 5' 상동성 암의 서열을, 5'에서 3'으로 포함하는 방법.
제1항 내지 제15항 중 어느 한 항에 있어서, 표적서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함하는 방법.
제1항 내지 제16항 중 어느 한 항에 있어서, 표적서열은 주형서열의 하나 이상의 유전자와 상동성(homologous)인 하나 이상의 유전자를 포함하는 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 주형서열은 자연적으로 발생하는 서열을 포함하는 방법.
제18항에 있어서, 주형서열은 자연적으로 발생하는 서열에 대한 하나 이상의 변형을 포함하는 방법.
제18항에 있어서, 주형서열은 적어도 1개의 유전자, 적어도 2개의 유전자, 적어도 3개의 유전자, 적어도 5개의 유전자, 적어도 10개의 유전자, 적어도 20개의 유전자, 적어도 30개의 유전자, 적어도 40개의 유전자, 적어도 50개의 유전자, 적어도 100개의 유전자, 또는 적어도 200개의 유전자를 포함하는 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 주형서열은 인공 서열을 포함하는 방법.
제21항에 있어서, 인공 서열은 하나 이상의 항체 또는 이의 항원 결합 단편을 코딩하는 서열을 포함하는 방법.
제22항에 있어서, 하나 이상의 항체 또는 이의 항원 결합 단편은 scFv, 이중-특이적 항체, 또는 다중-특이적 항체를 포함하는 방법.
제1항 내지 제23항 중 어느 한 항에 있어서, 주형서열의 삽입에 의해 표적서열이 결실되는 방법.
제24항에 있어서,
a. 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 표적서열, 제2 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고;
b. 주형 염색체가 제3 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제4 sgRNA 표적서열을, 5'에서 3'으로 포함하는, 방법.
제25항에 있어서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 제3 및 제4 sgRNA와 접촉시키는 단계를 포함하는 방법.
제26항에 있어서, 제1, 제2, 제3 및 제4 sgRNA는 제1, 제2, 제3 및 제4 sgRNA 표적서열에 특이적인 표적서열을 포함하는 방법.
제26항에 있어서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함하는 방법.
제1항 내지 제23항 중 어느 한 항에 있어서, 주형서열의 삽입은 표적서열의 결실을 거의 또는 전혀 포함하지 않는 방법.
제29항에 있어서, 주형서열의 삽입은 표적서열의 하나 이상의 기능을 파괴하는 방법.
제29항 또는 제30항에 있어서, 주형서열의 삽입은 표적서열에서의 유전자를 파괴하는 방법.
제29항 내지 제31항 중 어느 한 항에 있어서,
a. 표적 염색체가 제1 핵산분자의 5' 상동성 암의 서열, 제1 sgRNA 표적서열, 및 제2 핵산분자의 3' 상동성 암의 서열을, 5'에서 3'으로 포함하고;
b. 주형 염색체가 제2 sgRNA 표적서열, 제1 핵산분자의 3' 상동성 암의 서열, 주형서열, 제2 핵산분자의 5' 상동성 암의 서열, 및 제3 sgRNA 표적서열을, 5'에서 3'으로 포함하는, 방법.
제32항에 있어서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, 및 제1, 제2, 및 제3 sgRNA와 접촉시키는 단계를 포함하는 방법.
제33항에 있어서, 제1, 제2, 및 제3 sgRNA는 제1, 제2, 및 제3 sgRNA 표적서열에 특이적인 표적서열을 포함하는 방법.
제34항 또는 제35항에 있어서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함하는 방법.
제1항 내지 제35항 중 어느 한 항에 있어서, 제1 또는 제2 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함하는 방법.
제36항에 있어서, 형광 단백질은 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), 청색 형광 단백질(BFP), dsRed, mCherry 또는 tdTomato를 포함하는 방법.
제36항에 있어서, 형광 단백질은 GFP를 포함하는 방법.
제1항 내지 제38항 중 어느 한 항에 있어서, 제1 마커는 선택가능한 마커를 추가로 포함하는 방법.
제1항 내지 제39항 중 어느 한 항에 있어서, 제2 마커는 선택가능한 마커를 추가로 포함하는 방법.
제39항 또는 제40항에 있어서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(Dihydrofolate reductase, DHFR), 글루타민 합성효소(Glutamine synthase, GS), 푸로마이신 아세틸트랜스퍼라제(Puromycin acetyltransferase), 블라스티딘 탈아미노화효소(Blasticidin deaminase), 히스티디놀 탈수소효소(Histidinol dehydrogenase), 하이그로마이신 포스포트랜스퍼라제(Hygromycin phosphotransferase, hph), 블레오마이신 내성 유전자(Bleomycin resistance gene) 및 아미노글리코사이드 포스포트랜스퍼라제(Aminoglycoside phosphotransferase, 네오마이신 내성)으로 구성된 군에서 선택되는 것인 방법.
제39항 내지 제41항 중 어느 한 항에 있어서, 제1 및 제2 마커는 동일한 선택가능한 마커가 아닌 방법.
제1항 내지 제42항 중 어느 한 항에 있어서, 제1 마커는 세포 내에서 GFP를 발현할 수 있는 프로모터에 작동 가능하게 연결된 GFP 및 푸로마이신 아세틸트랜스퍼라제를 포함하고, 제2 마커는 하이그로마이신 포스포트랜스퍼라제를 포함하는 방법.
제1항 내지 제43항 중 어느 한 항에 있어서, 상기 (d) 단계 이후에 추가로, (e) 제1 또는 제2 마커의 전부 또는 일부를 삭제하는 단계를 포함하는 방법.
제44항에 있어서, 제1 또는 제2 마커를 삭제하는 단계는 CRISPR/Cas 엔도뉴클레아제 및 마커를 코딩하는 서열에 특이적인 표적서열을 포함하는 gNA로 결실을 유도하는 단계를 포함하는 방법.
제1항 내지 제45항 중 어느 한 항에 있어서, 세포는 하이브리드 세포(hybrid cells), 배아 하이브리드 줄기(embryonic hybrid stem, EHS) 세포 또는 접합체(zygotes)를 포함하는 방법.
제46항에 있어서, EHS 세포는 마우스(mouse), 래트(rat), 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 두 종의 ES 세포를 융합하여 제조되는 방법.
제46항에 있어서, EHS 세포는 인간 배아 줄기세포를 인간이 아닌 종의 배아 줄기세포에 융합하여 제조되는 방법.
제48항에 있어서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이인 방법.
제46항에 있어서, EHS 세포는 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 및 원숭이로 구성된 군에서 선택된 임의의 상이한 두 종의 ES 세포를 융합하여 제조되는 방법.
제46항에 있어서, 하이브리드 세포를 제조하는 단계는 하기 단계를 포함하는 방법:
a. 소핵(micronucleated) 인간 세포를 제조하는 단계; 및
b. 하이브리드 세포를 제조하기 위해, 상기 소핵 인간 세포와 인간이 아닌 종의 세포를 융합하는 단계.
제51항에 있어서, 소핵 인간 세포는 소핵을 유도하기에 충분한 조건하에서 인간 세포 콜세미드(colcemid)를 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계에 의해 제조되는 방법.
제51항 또는 제52항에 있어서, 인간이 아닌 종은 마우스, 래트, 토끼, 기니피그, 햄스터, 양, 염소, 당나귀, 소, 말, 낙타, 닭 또는 원숭이인 방법.
제51항 내지 제53항 중 어느 한 항에 있어서, 인간이 아닌 종의 세포는 ES 세포이고, 하이브리드 세포는 EHS 세포인 방법.
제47항 내지 제50항 중 어느 한 항에 있어서, 융합은 전기 융합(electrofusion), 바이러스 유도 융합(viral induced fusion), 또는 화학적 유도 융합(chemically induced fusion)을 포함하는 방법.
제1항 내지 제55항 중 어느 한 항에 있어서, 표적서열은 면역글로불린 또는 T 세포 수용체 서브유닛(subunit)을 코딩하는 유전자를 포함하는 방법.
제1항 내지 제56항 중 어느 한 항에 있어서, 표적 염색체는 마우스 염색체 12(mouse chromosome 12)를 포함하고 주형 염색체는 인간 염색체 14(human chromosome 14)를 포함하거나, 표적 염색체는 마우스 염색체 6(mouse chromosome 6)을 포함하고 주형 염색체는 인간 염색체 2(human chromosome 2)를 포함하는 방법.
제57항에 있어서, 표적서열은 마우스 Igh 가변영역 서열, 마우스 Igk 가변영역 서열, 및/또는 마우스 Igl 가변영역 서열을 포함하는 방법.
제58항에 있어서, 마우스 Igh 가변영역 서열은 마우스 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재(intervening) 비-코딩 서열을 포함하는 방법.
제57항 내지 제59항 중 어느 한 항에 있어서, 주형서열은 인간 IGH 가변영역 서열, 인간 IGK 가변영역 서열, 및/또는 인간 IGL 가변영역 서열을 포함하는 방법.
제60항에 있어서, 인간 IGH 가변영역 서열은 인간 VH, DH 및 JH1-6 유전자 세그먼트들을 코딩하는 서열 및 개재 비-코딩 서열을 포함하는 방법.
제1항 내지 제61항 중 어느 한 항에 있어서, 상기 단계 (d)에서 선별된 세포로부터 조작된 염색체를 회수하는 단계를 추가적으로 포함하는 방법.
제62항에 있어서, 조작된 염색체를 회수하는 단계는 소핵을 유도하기에 충분한 조건하에서 세포를 콜세미드에 노출시키는 단계 및 원심분리를 이용하여 소핵 세포를 수집하는 단계를 포함하는 방법.
제1항 내지 제63항 중 어느 한 항에 있어서, 제1 및 제2 핵산분자는 플라스미드인 방법.
제1항 내지 제64항 중 어느 한 항의 방법에 의해 제조된 조작된 염색체.
제65항에 있어서, 마우스 Igh 가변영역을 대신하여 인간 IGH 가변영역의 서열을 포함하는 마우스 염색체 12이거나, 마우스 Igk 가변영역을 대신하여 인간 IGK 가변영역의 서열을 포함하는 마우스 염색체 6인 조작된 염색체.
제66항에 있어서, 마우스 Igh 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 조작된 염색체.
제66항 또는 제67항에 있어서, 인간 IGH 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 조작된 염색체.
제64항 내지 제68항 중 어느 한 항의 조작된 염색체를 포함하는 세포.
제69항에 있어서, 마우스 ES 세포와 혼성화할 수 있는 세포.
제69항에 있어서, 배아줄기(ES) 세포, 배아 하이브리드 줄기(EHS) 세포, 또는 접합체(zygote)인 세포.
제68항에 있어서, 소핵 세포인 세포.
제72항에 있어서, EHS 세포는 인간 및 마우스 ES 세포의 하이브리드인 세포.
제72항에 있어서, ES 세포는 마우스 ES 세포인 세포.
하기 단계를 포함하는 마우스 배아줄기(ES) 세포의 제조방법:
a. 제1항 내지 제64항 중 어느 한 항의 방법에 의해 제조된 조작된 염색체를 포함하는 소핵 세포를 융합시키는 단계, 여기서:
i. 마우스 ES 세포는 조작된 염색체와 상동 염색체를 포함하고, 상동 염색체는 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터와 작동 가능하게 연결된 제1 형광 단백질을 포함함; 및
ii. 소핵 세포의 적어도 하나의 서브세트는 조작된 염색체를 포함하고, 조작된 염색체는 제1 형광 단백질과 상이한 제2 형광 단백질을 포함하며, 제2 형광 단백질은 ES 세포에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 것임;
b. 제1 및 제2 형광 단백질을 모두 발현하는 ES 세포를 선별하는 단계;
c. 상동 염색체가 ES 세포의 적어도 하나의 서브세트에 의해 소실될 때까지 단계 (c)에서 선별된 ES 세포를 배양하는 단계; 및
d. 제2 형광 단백질을 발현하고 제1 형광 단백질을 발현하지 않는 ES 세포를 선별하는 단계.
제75항에 있어서, 상기 단계 (c)에서 세포를 배양하는 단계는 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일 동안 세포를 배양하는 단계를 포함하는 방법.
제75항 또는 제76항에 있어서, 상기 단계 (b) 및 (d)에서 세포를 선별하는 단계는 형광 활성화 세포 분류(fluorescence activated cell sorting, FACS)를 포함하는 방법.
제75항 내지 제77항 중 어느 한 항의 방법에 의해 제조된 마우스 ES 세포.
제75항 내지 제78항 중 어느 한 항의 방법에 의해 제조된 마우스 ES 세포로부터 제조된, 형질전환(transgenic) 마우스.
제79항에 있어서, 형질전환 마우스를 생산하는 단계는 ES 세포를 이배체 배반포(diploid blastocyst)에 주입하는 단계, ES 세포에서 핵이 제거된(enucleated) 마우스 배아로의 핵 이식, 또는 4배체 배아 보완을 포함하는 형질전환 마우스.
제79항 또는 제80항에 있어서, 마우스 염색체 12는 마우스 Igh 가변영역 대신 인간 IGH 가변영역의 서열을 포함하거나, 마우스 염색체 6은 마우스 Igk 가변영역 대신 인간 IGK 가변영역의 서열을 포함하는 형질전환 마우스.
제81항에 있어서, 마우스 Igh 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 형질전환 마우스.
제81항 또는 제82항에 있어서, 인간 IGH 가변영역은 VH, DH 및 JH1-6 유전자 세그먼트들 및 개재 비-코딩 서열을 포함하는 형질전환 마우스.
하기 단계를 포함하는 항체의 제조방법:
a. 형질전환 마우스가 인간 IGH 가변영역으로부터 인간 V, D 및 J 세그먼트를 포함하는 복수의 항체를 제조하여, 제80항 내지 제83항 중 어느 한 항의 형질전환 마우스에 항원을 자극하는(challenging) 단계; 및
b. 항원에 특이적인 항체를 분리하는 단계.
제84항의 방법에 의해 제조된 항체로부터 유도된 항체.
제85항에 있어서, 단일 사슬 가변 단편(scFv), 이중-특이적 항체 또는 다중-특이적 항체를 포함하는 항체.
하기 단계를 포함하는 염색체 재배열(rearrangement)의 제조방법:
a. 표적 위치를 함유하는 표적 염색체 및 주형서열을 함유하는 주형 염색체를 포함하는 세포를 제공하는 단계;
b. 표적 위치의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 5' 상동성 암, 마커, 및 주형서열의 5' 말단의 상류 뉴클레오티드 서열을 함유하는 3' 상동성 암을, 5'에서 3'으로 포함하는 핵산분자와 상기 세포를 접촉시키는 단계;
c. 상기 마커가 5' 상동성 암의 서열의 표적 염색체 3' 내로 삽입되고 염색체 재배열이 제조되어, 표적 위치, 및 주형서열의 5' 말단에서 이중가닥 절단을 제조하는 단계; 및
d. 상기 마커를 발현하는 세포 또는 세포들을 선별하는 단계.
제87항에 있어서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 20 내지 2,000 bp, 약 50 내지 1,500 bp, 약 100 내지 1,400 bp, 약 150 내지 1,300 bp, 약 200 내지 1,200 bp, 약 300 내지 1,100 bp, 약 400 내지 1,000 bp, 또는 약 500 내지 900 bp, 또는 약 600 bp 내지 약 800 bp인 방법.
제87항에 있어서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 400 내지 1,500 bp, 길이가 약 500 내지 1,300 bp, 또는 길이가 약 600 내지 1,000 bp인 방법.
제87항에 있어서, 핵산분자의 5' 및 3' 상동성 암은 길이가 약 600 내지 1,000 bp인 방법.
제87항 내지 제90항 중 어느 한 항에 있어서, 상기 단계 (c)에서 이중가닥 절단을 생성하는 단계는 이중가닥 절단을 유도하기 위해 CRISPR/Cas 엔도뉴클레아제 및 적어도 하나의 sgRNA, 하나 이상의 아연 핑거 뉴클레아제, 하나 이상의 전사 활성화제 유사 이펙터 뉴클레아제(TALEN), 또는 하나 이상의 CRE 재조합효소를 사용하는 단계를 포함하는 방법.
제91항에 있어서, CRISPR/Cas 엔도뉴클레아제는 CasI, CasIB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, CasX, CasY, Cas12a (Cpf1), Cas12b, Cas13a, CsyI, Csy2, Csy3, CseI, Cse2, CscI, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, CmrI, Cmr3, Cmr4, Cmr5, Cmr6, CsbI, Csb2, Csb3, Csx17, CsxI4, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, CsfI, Csf2, Csf3, Csf4, Cms1, C2c1, C2c2, 또는 C2c3, 또는 이의 동족체, 동원체, 또는 변형된 버전을 포함하는 방법.
제91항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9, Cpf1, CasX, CasY, C2c1, C2c3, 또는 이의 동족체, 동원체 또는 변형된 버전을 포함하는 방법.
제91항에 있어서, CRISPR/Cas 엔도뉴클레아제는 Cas9을 포함하는 방법.
제91항 내지 제93항 중 어느 한 항에 있어서, 이중가닥 절단을 제조하는 단계는 세포를 CRISPR/Cas 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제가 표적 위치를 절단하도록 표적 위치에 특이적인 표적서열을 포함하는 적어도 하나의 제1 gNA, 및 주형서열의 5' 말단에 특이적인 표적서열을 포함하는 제2 gNA와 접촉시키는 단계를 포함하는 방법.
제95항에 있어서, 세포를 CRISPR/Cas 엔도뉴클레아제 및 sgRNA와 접촉시키는 단계는 CRISPR/Cas 엔도뉴클레아제 및 sgRNA를 코딩하는 하나 이상의 핵산분자로 세포를 형질감염시키는 단계를 포함하는 방법.
제87항 내지 제96항 중 어느 한 항에 있어서, 마커는 세포 내에서 형광 단백질을 발현할 수 있는 프로모터에 작동 가능하게 연결된 형광 단백질을 포함하는 방법.
제97항에 있어서, 형광 단백질은 GFP, YFP, RFP, CFP, BFP, dsRed, mCherry 또는 tdTomato를 포함하는 방법.
제87항 내지 제98항 중 어느 한 항에 있어서, 마커는 선택가능한 마커를 추가로 포함하는 방법.
제99항에 있어서, 선택가능한 마커는 다이하이드로폴레이트 환원효소(DHFR), 글루타민 합성효소(GS), 푸로마이신 아세틸트랜스퍼라제, 블라스티딘 탈아미노화효소, 히스티디놀 탈수소효소, 하이그로마이신 포스포트랜스퍼라제(hph), 블레오마이신 내성 유전자 및 아미노글리코사이드 포스포트랜스퍼라제(네오마이신 내성)으로 구성된 군에서 선택되는 것인 방법.
제87항 내지 제100항 중 어느 한 항에 있어서, 세포는 배아줄기(ES) 세포를 포함하는 방법.
제87항 내지 제101항 중 어느 한 항에 있어서, 핵산분자는 플라스미드인 방법.
제87항 내지 제101항 중 어느 한 항의 염색체 재배열을 포함하는 세포.
제103항에 있어서, 마우스 ES 세포인 세포.
제103항 또는 제104항의 세포로부터 제조된 마우스 ES 세포의 형질전환 마우스.