KR20240049834A

KR20240049834A - 킬로베이스 규모의 rna 유도 게놈 리콤비니어링

Info

Publication number: KR20240049834A
Application number: KR1020247010521A
Authority: KR
Inventors: 리 콩
Original assignee: 더 보드 오브 트러스티스 오브 더 리랜드 스탠포드 주니어 유니버시티
Priority date: 2021-09-01
Filing date: 2022-09-01
Publication date: 2024-04-17
Also published as: AU2022339843A1; JP2024534207A; EP4396340A1; WO2023034925A1; IL311137A; CN118234855A; CA3230869A1

Abstract

본 개시내용은 CRISPR 및 재조합 효소를 사용하는 리콤비니어링-편집 시스템뿐만 아니라 이의 방법, 벡터, 핵산 조성물, 및 키트를 제공한다. 방법 및 시스템은 숙주 세포의 게놈 DNA를 포함하여 표적 DNA를 변경하기 위한 수단을 제공한다.

Description

킬로베이스 규모의 RNA 유도 게놈 리콤비니어링

관련 출원 및 참조에 의한 포함

본 출원은 2021년 9월 1일자로 출원된 미국 특허 출원 일련 번호 제63/239,732호에 대한 우선권의 이익을 주장하며, 이 출원의 내용은 그 전체가 본원에 참고로 포함된다.

2020년 3월 3일자로 출원된 미국 특허 출원 일련 번호 제62/984,618호, 2021년 2월 5일자로 출원된 미국 특허 출원 일련 번호 제63/146,447호, 및 2021년 3월 2일자로 출원된 PCT/US2021/020513을 참조한다.

전술한 출원, 여기에 인용되거나 또는 이의 실행 중에 인용된 모든 문서("출원 인용 문서"), 및 출원 인용 문서에 인용되거나 참조된 모든 문서, 및 본원에 인용되거나 참조된 모든 문서("본원에 인용된 문서"), 및 본원에 인용된 문서에 인용되거나 참조된 모든 문서는 임의의 제조업체의 지침, 설명, 제품 사양서, 및 본원에 언급되거나 또는 본원에 참고로 포함된 임의의 문서에 언급된 임의의 제품에 대한 제품 시트와 함께 본원에 참고로 포함되며, 본 발명의 실시에 이용될 수 있다. 보다 구체적으로, 모든 참조 문서는 각각의 개별 문서가 참조로 포함되도록 구체적이고 개별적으로 표시된 것과 동일한 정도로 참고로 포함된다.

발명의 분야

본 발명은 파지 재조합 효소를 사용하는 RNA 유도 리콤비니어링(recombineering) 편집 시스템뿐만 아니라 이의 방법, 벡터, 핵산 조성물, 및 키트에 관한 것이다.

침입하는 바이러스를 방어하기 위한 면역 시스템의 일부로서 원래 박테리아와 고세균에서 발견된 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 시스템은 정확한 위치에서 편집하기 위한 게놈 또는 기타 DNA의 특정 스트레치를 표적으로 삼도록 프로그램될 수 있는 게놈 편집 기술의 기반을 형성한다. 다양한 CRISPR 기반 도구가 이용 가능하지만, 대부분은 짧은 서열을 편집하기 위해 설계되어 있다. 긴 서열 편집은 모델 시스템 엔지니어링, 치료용 세포 생산 및 유전자 치료법에 높은 관심을 받고 있다. 이전 연구에서는 Cas9 매개 상동성-5 유도 복구(HDR)를 개선하는 기술(K. S. Pawelczak, et al., ACS Chem. Biol. 13, 389-396 (2018)), 및 Cas9를 이용한 핵산 변형 효소에 영향을 주는 도구, 예를 들어 최대 80개 염기쌍(bp) 길이의 편집을 입증한 프라임 편집(A. V. Anzalone, et al., Nature. 576, 149-157 (2019))이 개발되었다. 이러한 발전에도 불구하고 높은 효율성과 충실도를 갖춘 대규모 포유류 게놈 조작에 대한 요구는 계속되고 있다.

본원에는 높은 정확성 및 낮은 표적외(off-target) 오류에 의해 대규모 핵산 편집을 허용하는 방식으로 핵산 편집을 용이하게 하는 시스템 및 방법이 제공된다. 이러한 시스템 및 방법은 재조합 구성요소와 CRISPR 재조합 구성요소의 조합을 사용한다.

예를 들어, 본원에는 단백질, 표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자, 및 재조합 단백질을 포함하는 시스템이 개시된다. 재조합 단백질은 엑소뉴클레아제, 단일 가닥 DNA 결합 단백질(SSB), 단일 가닥 DNA 어닐링 단백질(SSAP), 또는 이의 기능성 단편 또는 활성을 포함할 수 있다. 재조합 단백질은 2가지 이상의 활성을 포함할 수 있거나, 또는 포함하도록 조작될 수 있다. 특정 실시양태에서, 재조합 단백질은 협력적이다. 특정 실시양태에서 재조합 단백질은 미생물 재조합 단백질, 예를 들어 RecE, RecT, 람다 엑소뉴클레아제(Exo), Bet 단백질(betA, redB), 엑소뉴클레아제 gp6, 단일 가닥 DNA 결합 단백질 gp2.5 또는 이의 유도체 또는 변이체를 포함하지만, 이에 제한되지 않는 박테리아 또는 박테리오파지 단백질을 포함한다. 특정 실시양태에서, 재조합 단백질은 진핵생물 또는 포유류 재조합 단백질을 포함한다. 특정한 비제한적 실시양태에서, 진핵 재조합 단백질 또는 시스템은 ssDNA에 결합하고 RPA-결합된 상보적 ssDNA를 포함한 상보적 ssDNA의 어닐링을 매개하는 RAD52 또는 이의 상동체(homolog)를 포함한다. 일부 실시양태에서, 시스템은 공여자 DNA를 추가로 포함한다. 일부 실시양태에서, 표적 DNA 서열은 숙주 세포의 게놈 DNA 서열이다.

특정 실시양태에서, 본 발명은 서열번호 166 내지 서열번호 491의 1개, 2개, 3개 또는 그 이상의 재조합 단백질 또는 이와 적어도 85%, 적어도 90%, 적어도 95% 이상 동일한 재조합 단백질을 포함하는 시스템을 제공한다. 특정 실시양태에서, 재조합 단백질은 표 9의 재조합 단백질과 적어도 85% 동일성을 갖는다. 특정 실시양태에서, 재조합 단백질은 서열번호 179, 서열번호 185, 서열번호 205, 서열번호 321, 서열번호 353, 서열번호 359, 서열번호 366, 서열번호 424, 또는 서열번호 479와 적어도 85% 동일성을 갖는다.

특정 실시양태에서, 재조합 단백질은 서열번호 166, 서열번호 168, 서열번호 169, 서열번호 170, 서열번호 171, 서열번호 241, 서열번호 253, 서열번호 290, 서열번호 408, 서열번호 411, 또는 서열번호 442와 적어도 95% 동일성을 갖는다.

일부 실시양태에서, 시스템은 적어도 하나의 앱타머 서열 및 융합 단백질의 일부로서 재조합 단백질에 기능적으로 연결된 앱타머 결합 단백질을 포함하는 동원(recruitment) 시스템을 추가로 포함한다. 일부 실시양태에서, 앱타머 서열은 RNA 앱타머 서열 또는 펩타이드 앱타머 서열이다. 일부 실시양태에서, RNA 앱타머 서열은 핵산 분자의 일부이다. 일부 실시양태에서, 핵산 분자는 2개의 RNA 앱타머 서열을 포함한다. 일부 실시양태에서, 재조합 단백질은 융합 단백질로서 앱타머 결합 단백질에 기능적으로 연결된다. 일부 실시양태에서, 결합 단백질은 MS2 외피 단백질, 람다 N22 펩타이드, 또는 이의 기능성 유도체, 단편 또는 변이체를 포함한다. 일부 실시양태에서, 융합 단백질은 링커 및/또는 핵 국재화 서열을 추가로 포함한다.

이론에 얽매이지 않고, 동원 시스템은 하나 이상의 재조합 단백질을 Cas 단백질/gRNA 복합체의 위치로 국재화하는 역할을 하고, 재조합효소와 주형 핵산 사이의 상호작용을 통해, 표적외 Cas 단백질 기능을 촉진하지는 않고 선택된 표적에서 HDR을 촉진한다.

동원 시스템은 재조합 단백질의 다수의 조합 및 구성으로 조정가능하다. 예를 들어, 다중 핵산 앱타머를 선택하고 혼입시킴으로써 시스템은 동일하거나 상이하고 다양한 비율일 수 있는 다수의 재조합 단백질을 포함할 수 있다. 특정 실시양태에서, 시스템은 엑소뉴클레아제를 포함한다. 특정 실시양태에서, 시스템은 SSAP를 포함한다. 특정 실시양태에서, 시스템은 SSB를 포함한다. 특정 실시양태에서, 시스템은 엑소뉴클레아제 및 SSAP를 포함한다. 특정 실시양태에서, 시스템은 엑소뉴클레아제 및 SSB를 포함한다. 특정 실시양태에서, 시스템은 SSAP 및 SSB를 포함한다. 특정 실시양태에서, 시스템은 엑소뉴클레아제 및 SSAP를 포함하고 SSB를 포함하지 않는다. 특정 실시양태에서, 시스템은 엑소뉴클레아제 및 SSB를 포함하고 SSAP를 포함하지 않는다. 특정 실시양태에서, 시스템은 SSAP 및 SSB를 포함하고 엑소뉴클레아제는 포함하지 않는다. 특정 실시양태에서, 시스템은 엑소뉴클레아제, SSAP 및 SSB를 포함한다.

본원에는 앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 조성물이 개시된다. 재조합 단백질은 RecE, RecT, 람다 엑소뉴클레아제(Exo), Bet 단백질(betA, redB), 엑소뉴클레아제 gp6, 단일 가닥 DNA 결합 단백질 gp2.5 또는 이의 유도체 또는 변이체를 포함하지만, 이에 제한되지는 않는 미생물 재조합 단백질일 수 있다. 조성물은 Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드 및 표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자 중 하나 또는 둘 다를 추가로 포함할 수 있다. 일부 실시양태에서, 핵산 분자는 적어도 하나의 RNA 앱타머 서열을 추가로 포함한다. 일부 실시양태에서, Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드는 적어도 하나의 펩타이드 앱타머 서열을 암호화하는 서열을 추가로 포함한다.

또한, 본원에는 앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 벡터가 개시된다. 미생물 재조합 단백질은 RecE, RecT, 람다 엑소뉴클레아제(Exo), Bet 단백질(betA, redB), 엑소뉴클레아제 gp6, 단일 가닥 DNA 결합 단백질 gp2.5, 또는 이의 유도체 또는 변이체를 포함할 수 있다. 벡터는 Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드 및 표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자 중 하나 또는 둘 다를 추가로 포함할 수 있다. 일부 실시양태에서, 핵산 분자는 적어도 하나의 RNA 앱타머 서열을 추가로 포함한다. 일부 실시양태에서 Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드는 적어도 하나의 펩타이드 앱타머 서열을 암호화하는 서열을 추가로 포함한다.

특정 실시양태에서, 융합 단백질은 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 75% 유사하거나 적어도 75% 동일한 아미노산 서열을 포함하는 재조합 단백질을 포함한다. 특정 실시양태에서 융합 단백질은 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 80%, 적어도 85%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 98.5%, 적어도 99%, 적어도 99.5%, 또는 100% 유사성 또는 동일성을 갖는 서열을 포함하는 재조합 단백질을 포함한다.

특정 실시양태에서, 본 발명의 재조합 단백질을 포함하는 시스템은 EcRecT를 포함하는 시스템과 동일하거나 초과인 큰 효율, 예를 들어 제한 없이 EcRecT에 비해 1.2x, 1.5x, 1.7x, 2x, 2.5x, 3x 이상의 효율로 편집할 수 있다.

특정 실시양태에서, 본 발명의 재조합 단백질을 포함하는 시스템은 EcRecT를 포함하는 시스템과 동일하거나 초과, 예를 들어 제한 없이 EcRecT에 비해 1.1x, 1.2x, 1.3x, 1.5x, 1.7x, 2x, 2.5x, 3x 이상의 세포 생존력을 제공한다.

일부 실시양태에서, Cas 단백질은 Cas9 또는 Cas12a이다. 일부 실시양태에서, Cas 단백질은 촉매적으로 죽은 것이다. 일부 실시양태에서, Cas9 단백질은 야생형 스트렙토코커스 피오게네스 Cas9 또는 야생형 스타필로코커스 아우레우스 Cas9이다. 일부 실시양태에서, Cas9 단백질은 Cas9 니카제(예를 들어, D10A인 위치 10에 아미노산 치환이 있는 야생형 스트렙토코커스 피오게네스 Cas9)이다.

또한, 본원에 개시된 시스템 또는 벡터를 포함하는 진핵 세포가 개시된다.

추가로, 본원에는 숙주 세포에서 표적 게놈 DNA 서열을 변경하는 방법이 개시된다. 방법은 본원에 기술된 시스템, 조성물 또는 벡터를 표적 DNA 서열과 접촉시키는 것(예를 들어, 본원에 기술된 시스템, 조성물 또는 벡터를 표적 게놈 DNA 서열을 포함하는 숙주 세포에 도입시키는 것)을 포함한다. 임의의 방법을 실시하는 데 유용하거나 필요하거나, 또는 충분한 하나 이상의 시약 또는 기타 구성요소를 함유하는 키트도 본원에 개시된다.

따라서, 본 발명의 목적은 출원인이 임의의 이전에 알려진 생성물, 공정 또는 방법에 대한 권리를 유보하여 권리불요구를 개시하도록 하기 위해, 이전에 알려진 생성물, 이 생성물을 제조하는 공정 또는 생성물을 사용하는 방법을 본 발명 내에 포괄하지 않는 것이다. 추가로, 본 발명은 출원인이 임의의 이전에 설명된 생성물, 생성물 제조 공정 또는 생성물 사용 방법에 대한 권리를 유보하여 권리불요구를 개시하도록 하기 위해, USPTO(35 U.S.C. §112, 첫 번째 문단) 또는 EPO(EPC 83조)의 서면 설명 및 실행 가능 요건을 충족하지 않는 임의의 생성물, 공정 또는 생성물의 제조 또는 생성물 사용 방법을 본 발명의 범위 내에 포괄하려는 의도가 없음을 유의한다. 이는 EPC 53(c)조 및 규칙 28(b) 및 (c) EPC에 따르는 본 발명의 실시에 유리할 수 있다. 본 출원의 계보, 또는 임의의 다른 계보에서 또는 제3자의 임의의 이전에 제출된 출원에서 출원인의 임의의 허여된 특허(들)의 주제인 임의의 실시양태를 명시적으로 권리불요구하는 모든 권리는 명시적으로 유보된다. 본원에서 전제로서 해석되어야 하는 것은 아무것도 없다.

본 개시내용, 특히 청구범위 및/또는 문단에서, "포함하다(comprises)", "포함된(comprised)", "포함하는(comprising)" 등과 같은 용어는 미국 특허법에서 부여된 의미를 가질 수 있고; 예를 들어, 이들은 "포함하다(includes)", "포함된(included)", "포함하는(including)" 등을 의미할 수 있으며; "본질적으로 이루어지는" 및 "본질적으로 이루어진다"와 같은 용어는 미국 특허법에서 부여된 의미를 갖고, 예를 들어 명시적으로 언급되지 않은 요소를 허용하지만, 선행 기술에서 발견되거나 본 발명의 기본 또는 신규 특징에 영향을 미치는 요소는 배제한다는 점에 유의한다.

이들 및 다른 실시양태는 다음의 상세한 설명에 개시되거나 이로부터 명백하고 이에 의해 포괄된다.

본 개시내용의 다른 측면 및 실시양태는 다음의 상세한 설명 및 첨부 도면에 비추어 명백해질 것이다.

도 1a 및 도 1b는 효모 및 인간으로부터의 진핵 재조합 효소를 사용하여 재구성된 RecE(도 1a) 및 RecT(도 1b) 계통발생수이다.
도 2a는 RecE/RecT 상동체의 계통발생수 및 길이 분포이다. 도 2b는 RecE/T의 메타게놈 분포이다. 도 2c는 본원에 개시된 중심 모델을 보여주는 개략도이다. 도 2d는 RecE/T 상동체의 게놈 녹-인(knock-in) 효율성에 대한 그래프이다.
도 3a 및 3b는 EMX1(도 3a) 유전자좌 및 VEGFA(도 3b) 유전자좌에서의 상동성 유도 복구(HDR)의 고처리량 시퀀싱(HTS) 판독 그래프이다. 도 3c-3d는 HEK293T 세포 중 HSP90AA1(도 3c), DYNLT1(도 3d) 및 AAVS1(도 3e) 유전자좌에서의 mKate 녹-인 효율성에 대한 그래프이다. 도 3f는 RecT를 이용한 HEK293T 세포에서의 mKate 녹-인 효율성에 대한 이미지이다. 도 3g는 RecT 녹-인 그룹의 예시적인 AAVS1 녹-인 전략 및 크로마토그램 추적의 개략도이다. 도 3h는 동원 대조 실험 및 상응하는 녹-인 효율성의 개략도 및 그래프이다. 모든 결과는 NR에 대해 정규화된다. (NC, 절단 없음; NR, 재조합인자 없음).
도 4a-4c는 HEK293T 세포 중 HSP90AA1(도 4a), DYNLT1(도 4b) 및 AAVS1(도 4c) 유전자좌에서 NE 그룹에 대한 상대적인 mKate 녹-인 효율성의 그래프이다. (NC, 절단 없음 대조군. NR, 재조합인자 없음 대조군). 도 4d는 AAVS1 유전자좌에서 mKate 녹-인을 검증하는 접합부 PCR의 예시적인 아가로스 겔의 이미지이다. 도 4e 및 4f는 AAVS1 유전자좌에서의 절대적(도 4e) 및 상대적(도 4f) LOV 녹-인 효율성에 대한 그래프이다. 도 4g는 AAVS1 유전자좌에서 예시적인 mKate 녹-인의 접합부 PCR 산물의 Sanger 시퀀싱 결과이다.
도 5a-5d는 세포주 A549(도 5a), HepG2(도 5b), HeLa(도 5c) 및 hESC(H9)(도 5d)에 걸쳐 서로 다른 유전자좌에서의 게놈 녹-인 효율성에 대한 그래프이다. 도 5e는 hESC에서의 mKate 녹-인 이미지이다. 도 5f 및 5g는 REDITv1 도구의 게놈 전체 표적외 부위(OTS) 수(도 5f) 및 OTS 염색체 분포(도 5g)이다.
도 6a-6d는 A549 세포주에서 AAVS1 유전자좌 및 DYNT1 유전자좌(도 6a), HepG2 세포주에서 DYNLT1 유전자좌 및 HSP90AA1 유전자좌(도 6b), Hela 세포주에서 DYNLT1 유전자좌 및 HSP90AA1 유전자좌(도 6c), 및 hES-H9 세포주에서 HSP90AA1 유전자좌 및 OCT4 유전자좌(도 6d)에서의 상대적인 mKate 녹-인 효율성에 대한 그래프이다.(NC, 절단 없음 대조군. NR, 재조합인자 없음 대조군. 모든 데이터는 NR 그룹에 대해 정규화됨). 도 6e는 hES-H9 세포에서 HSP90AA1 mKate 녹-인의 대표적인 FACS 결과이다.
도 7a-7d는 DYNLT1(도 7a) 및 HSP90AA1(도 7b) 유전자좌에서의 다양한 상동성 암(arm) 길이 및 DYNLT1(도 7c) 및 HSP90AA1(도 7d)에 대한 재조합인자 없음 대조군의 절대적 mKate 녹-인 효율성에 대한 그래프이다.
도 8a-8e는 REDITv1 시스템에서 sgEMX1(도 8a-8c) 또는 sgVEGFA(도 8d-8e)와 연관된 상위 3개의 예측된 표적외 유전자좌의 인델(indel) 비율에 대한 그래프이다.
도 9a는 HEK293T 세포에서 REDITv2N의 선택된 실시양태에 대한 개략도 및 상응하는 녹-인 효율성이다. 도 9b 및 9c는 REDITv1에 대비하여 REDITv2N을 비교한 게놈 전체의 표적외 부위(OTS) 수(도 9b) 및 OTS 염색체 분포(도 9c)의 그래프이다. 도 9d는 REDITv2D의 선택된 실시양태의 개략도 및 상응하는 녹-인 효율이다. 도 9e는 혈청 결핍 조건 하에서 REDITv1, REDITv2N 및 REDITv2D의 편집 효율성을 나타내는 그래프이다. 도 9f는 hESC에서 REDITv3의 녹-인 효율성이다. 도 9g는 hESC에서 REDITv3를 사용한 mKate 녹-인 이미지이다.
도 10a 및 10b는 DYNLT1 유전자좌 및 HSP90AA1 유전자좌에서 REDITv2N(도 10a) 및 REDITv2D(도 10b)의 선택된 실시양태의 상대적인 mKate 녹-인 효율의 개략도 및 그래프이다.
도 11a-11d는 선택된 REDITv2N 시스템에 대한 DYNLT1 유전자좌 및 HSP90AA1 유전자좌에서의 mKate 녹-인에 대한 접합(juction) PCR을 보여주는 아가로스 겔의 이미지이다. 도 11e는 DYNLT1 유전자좌에서의 접합부 PCR 산물의 크로마토그램 서열이다.
도 12a 및 12b는 REDITv2(도 12a) 및 REDITv2N(도 12b)의 선택된 실시양태에서 검출된 표적외 절단의 게놈 분포 그래프이다. 파일업은 2개 이상의 판독이 서로 중첩되는 정렬을 포함한다. 측면 쌍은 서로 200bp 상류 내에서 대향 가닥에 나타나는 정렬을 포함한다. 일치된 표적은 상류 서열에서 처리된 표적과 일치하는 정렬을 포함한다(표적 서열에는 PAM에서의 1개의 불일치를 포함하는 최대 6개의 불일치가 허용됨). 도 12c는 REDITv2N 시스템에 있어서 EMX1 유전자좌에서의 HTS HDR 및 인델 판독의 그래프이다.
도 13a는 REDITv2D 시스템에 있어서 DYNLT1 유전자좌에서의 mKate 녹-인에 대한 접합부 PCR을 보여주는 아가로스 겔의 이미지이다. 도 13B는 DYNLT1 유전자좌에서 접합부 PCR 산물의 크로마토그램 서열이다.
도 14a-14c는 다양한 FBS 농도로 처리한 경우, REDITv2(도 14a), REDITv2N(도 14b) 및 REVITv2D(도 14c)에서의 HSP90AA1 유전자좌의 mKate 녹-인 효율성에 대한 그래프이다. 도 14a-14c는 다양한 혈청 FBS 농도로 처리한 경우 REDITv2(도 14d), REDITv2N(도 14e) 및 REVITv2D(도 14f)에서의 HSP90AA1 유전자좌의 mKate 녹-인 효율성에 대한 그래프이다.
도 15는 REDITv1 시스템에 대한 EGFP 융합 후 RecE_587 및 RecT의 핵 국재화 이미지이다. 핵은 NucBlue Live Ready Probes 시약에 의해 염색되었다.
도 16a 및 16b는 RecT 및 RecE_587의 N- 또는 C-말단에 대한 다양한 핵 국재화 서열의 융합 후 HSP90AA1 및 DYNLT1 유전자좌에서의 상대적인 mKate 녹-인 효율성이다. 도 16c 및 16d는 DYNLT1 유전자좌(도 16c) 및 HSP90AA1 유전자좌(도 16d)에 대한 도 16a 및 16b 작제물의 절대적 mKate 녹-인 효율성의 그래프이다.
도 17a-17d는 새로운 NLS 서열 뿐만 아니라 REDITv2 및 REDITv3 변이체에 대한 최적의 링커의 융합 후, DYNLT1 유전자좌(도 17a 및 17c) 및 HSP90AA1 유전자좌(도 17b 및 17d)에 대한 상대적(도 17a 및 17b) 및 절대적(도 17c 및 17d) mKate 녹-인 효율성에 대한 그래프이다. REDITv2N(D10A 또는 H840A) 및 REDITv2D(dCas9)를 사용하는 REDITv2 버전은 사용된 가이드의 수와 함께 가로 축에 표시되어 있다. 다양한 색상은 다양한 대조군 및 REDIT 버전을 표현한다.
도 18은 hES-H9 세포 중 HSP90AA1 유전자좌에서 REDITv3N 시스템의 상대적인 편집 효율성에 대한 그래프이다.
도 19a는 예시적인 saCas9 발현 벡터의 다이어그램이다. 도 19b-19e는 saCas9 시스템 내 다양한 이펙터에 의한 AAVS1 유전자좌(도 19b) 및 HSP90AA1 유전자좌(도 19c)에서의 상대적 mKate 녹-인 효율성 및 각각의 절대적 효율성(각각 도 19d 및 19e)의 그래프이다. (NC, 절단 없음 대조군. NR, 재조합인자 없음 대조군.
도 20a는 RecT 절두의 개략도이다. 도 20b 및 20c는 야생형 스트렙토코커스 피오게네스 Cas9 및 단일 및 이중 닉형성(nicking)을 갖는 스트렙토코커스 피오게네스 Cas9n(D10A)에 대한 DYNLT1 유전자좌에서의 상대적 mKate 녹-인 효율성에 대한 그래프이다.
도 21a는 RecE_587 절두의 개략도이다. 도 21b 및 21c는 야생형 스트렙토코커스 피오게네스 Cas9 및 단일 및 이중 닉형성을 갖는 스트렙토코커스 피오게네스 Cas9n(D10A)에 대한 DYNLT1 유전자좌에서의 상대적 mKate 녹-인 효율성에 대한 그래프이다.
도 22a 및 22b는 음성 대조군으로서 NR(재조합인자 없음)을 포함하는 자연 발생의 리콤비니어링 시스템으로부터 다양한 엑소뉴클레아제(도 22a) 및 단일 가닥 DNA 어닐링 단백질(SSAP)(도 22b)을 사용하여 리콤비니어링 기반 편집을 수행하는 효율성을 비교한 그래프이다. 유전자 편집 활성은 게놈 유전자좌(DYNLT1 및 HSP90AA1)에서 mKate 녹-인 검정을 사용하여 측정했다. 표시된 데이터는 인간 HEK293 세포를 사용한 성공적인 mKate 녹-인의 백분율이며, 각 실험은 3회 반복으로 수행했다(n=3).
도 23a-23e는 boxB 및 N22를 사용하는 소형 동원 시스템을 보여준다. REDIT 재조합인자 단백질은 N22 펩타이드에 융합되었고 sgRNA 내에는 N22 펩타이드의 짧은 인식 서열인 boxB가 있었다(도 23a). 도 23b-23e는 MS2-MCP 동원 시스템과 나란히 비교되는, 야생형 SpCas와 함께, mKate 녹-인 검정을 사용한 유전자 편집 효율성의 그래프이다. 도 23b 및 23d는 DYNLT1, HSP90AA1 유전자좌에서의 절대적 mKate 녹-인 효율성이고, 도 23c 및 23e는 상대적 효율성이다. 제시된 데이터는 HEK293 인간 세포를 사용한 성공적인 mKate 녹-인 백분율이며, 각 실험은 3회 반복으로 수행했다(n=3).
도 24a-24c는 SunTag 동원 시스템을 보여준다. REDIT 재조합인자 단백질은 scFV 항체에 융합되었고 GCN4 펩타이드는 직렬 방식으로(GCN4 펩타이드의 10개 카피가 링커에 의해 분리됨) Cas9 단백질에 융합되었다(도 24a). DYNLT1 유전자좌를 이용한 mKate 녹-인 실험(도 24b)을 사용한 유전자 편집 녹-인 효율성을 측정했다(도 24c). 모든 데이터는 야생형 SpCas9와 함께 mKate 녹-인 검정을 사용하여 유전자 편집 효율성의 측정값이다. DYNLT1에서 절대적 mKate 녹-인 효율성은 각 유세포분석 플롯의 오른쪽 하단 모서리에 제시되며, 여기서 대조군은 재조합인자가 없는 것이고(NR), 이는 GFP 단백질에 융합된 scFV를 음성 대조군으로서 포함했으며, 모든 실험은 HEK293 인간 세포에서 수행되었다.
도 25a 및 25b는 Cas12A 시스템을 갖는 REDIT를 예시한다. SunTag 동원 설계를 통한 Cpf1/Cas12a 기반 REDIT 시스템이 2개의 상이한 Cpf1/Cas12a 단백질에 대해 생성되었다(도 25a). mKate 녹-인 검정을 사용하여 2개의 내인성 유전자좌(DYNLT1 및 AAS1)의 효율성을 측정했다. (도 25b). HEK293 인간 세포를 사용하여 mKate+ 세포 백분율에 의해 측정된 절대적 mKate 녹-인 효율성이 제시되며, 각 실험은 3회 반복으로 수행되었고(n=3), 여기서 음성 대조군은 재조합인자가 없는 것(NR)이다.
도 26a 및 26b는 DYNLT1 유전자좌(a) 및 HSP90AA1 유전자좌(b)에서 RecE 및 RecT 상동체를 사용한 mKate 녹-인 유전자 편집 검정을 통해 측정된 정밀 리콤비니어링 활성의 측정이다. HEK293 인간 세포를 사용하여 mKate+ 세포 백분율로 측정된 절대적 mKate 녹-인 효율성이 제시되며, 각 실험은 3회 반복으로 수행되었고(n=3), 여기서 음성 대조군은 재조합인자 없음(NR) 및 절단 없음(NC)이다. E. 콜라이의 원래 RecE 및 RecT도 양성 대조군으로서 포함되었다.
도 27a 및 27b는 유전자 편집에 있어서 Cas9-gRNA 복합체에 대한 SSAP RecT의 SunTag 기반 동원을 보여주는 개략도(도 27a) 및 MS2 기반 전략과 비교하여 SunTag의 편집 효율성을 정량한 그래프(도 27b)이다.
도 28a-28c는 REDIT와 대안적 HDR-강화 유전자 편집 접근법과의 비교를 보여준다. 도 28a는 기능성 도메인, CtIP 또는 Geminin(Gem)을 Cas9 단백질에 융합을 통해(왼쪽) 및 REDIT와 조합한 경우(오른쪽)인 대안적 HDR-강화 접근법을 보여주는 개략도이다. 도 28b는 세포 주기 제어를 통한 대안적 소분자 HDR 강화 접근법이다. 노코다졸은 제시된 시간표(오른쪽)에 따라 G2/M 경계(왼쪽)로 세포를 동기화하는 데 사용되었다. 도 28c는 REDIT 및 대안적 HDR-강화 도구인 Cas9-HE(CtIP 융합), Cas9-Gem(Geminin 융합) 및 노코다졸(noc)을 사용한 유전자 편집 효율성을, 이들 방법과 REDIT의 조합(Cas9-HE/Cas9-Gem/noc+REDIT)과 함께 사용한 유전자 편집 효율성을 비교한 것이다. 공여자 DNA는 200 + 400bp(DYNLT1) 또는 200 + 200bp(HSP90AA1)의 HA를 갖는다. 모든 검정은 공여자 없음, NTC 및 Cas9(증강 없음) 대조군과 함께 수행했다. REDIT와 비교 시, #P<0.05; REDIT와 비교 시, ##P < 0.01.
도 29a-29d는 주형 설계 지침, 접합부 정밀성, 및 REDIT 유전자 편집 방법의 역량을 보여준다. 도 29a는 REDIT 및 Cas9 기준을 사용하여 HDR 공여자(더 긴 HA) 또는 NHEJ/MMEJ 공여자(0/더 짧은 HA)의 상이한 주형 설계를 비교한 상동성 암(HA) 길이 테스트의 그래프이다. 상단 및 하단은 mKate 녹-인 검정을 사용하여 테스트된 2개의 게놈 유전자좌이다. 도 29b는 녹-인 클론의 단리에 이어 주형 증폭을 피하기 위해 공여자 외측에 결합하는 프라이머(fwd, rev)를 사용한 게놈 PCR을 통한 예시적인 접합부 프로파일링 검정의 설계이다. PCR 산물의 쌍을 이룬 Sanger 시퀀싱은 5'- 및 3'- 접합부에서 상동성 및 비상동성 편집을 나타낸다. 도 29c는 도 29b에서와 같은 녹-인 클론의 Sanger 시퀀싱으로부터 나타난 접합부 프로파일을 갖는 콜로니의 백분율 그래프이다. 편집 방법 및 공여자 DNA는 하단에 나열되어 있다(HA 길이는 괄호 안에 표시됨). 도 29d는 Cas9를 이용한 REDIT 방법을 검증하기 위해 이중 GFP/mKate 태그를 삽입하도록 2-kb 카세트를 사용하는 녹-인 효율성 그래프이다. 공여자 DNA의 HA 길이는 하단에 표시된다.
도 30a-30c는 REDIT가 더 적은 원치 않는 편집 이벤트로, 킬로베이스 길이 서열을 삽입하는 능력을 가진 효율적인 방법임을 나타내는 GISseq 결과(도 6c-e)를 보여준다. 도 30a는 녹-인 카세트의 게놈 전체 삽입 부위를 측정하기 위한 GIS-seq의 설계, 절차 및 분석 단계를 보여주는 개략도이다. 공여자 DNA로부터 잠재적인 오염을 제거하기 위해 고분자량(HMW) 게놈 DNA 정제가 필요했다. 공여자 DNA는 각 측면에 200bp HA를 가졌다. 도 30b는 표적 상의 유전자좌 DYNLT1에서 플러스/마이너스 판독을 보여주는 대표적인 GIS-seq 결과이다. 마지막 엑손의 정지 코돈 전에 예상되는 2A-mKate 녹-인 부위는 트리밍된 판독(2A-mKate 카세트를 제거하기 위해 클립된 판독)의 중심이다. gRNA 표적화를 피하고 게놈 및 편집된 판독을 구별하기 위해 도움을 주는 주형 돌연변이가 표지되어 있다. 도 30c는 Cas9dn 및 REDITdn 그룹을 비교한 상위 GIS-seq 삽입 부위를 요약한 것으로, 이는 REDITdn을 사용할 때 예상되는 표적 상의 삽입 부위(강조 표시됨) 및 식별된 표적외 삽입 부위의 감소된 수를 보여준다. (왼쪽) DYNLT1 및 (오른쪽) 필터링 및 트리밍된 GIS-seq 판독의 분포에서 MLE가 계산된 ACTB 유전자좌.
도 31a-31f는 내인성 DNA 복구에 대한 REDIT 유전자 편집의 의존성 및 인간 줄기 세포 조작을 위한 REDIT 방법 적용을 보여준다. 도 31a는 유전자 편집을 위해 REDIT 또는 Cas9를 사용할 때 수반되는 편집 과정 및 주요 복구 경로를 보여주는 모델이며, HDR 경로는 화학적 교란(RAD51의 억제)에 대해 강조되어 있다. 200 + 200bp HA를 포함하는 공여자 DNA가 모든 억제제 실험에 사용된다. 도 31b 및 31c는 wtCas9 기반 REDIT 및 Cas9의 경우(도 31b), 및 Cas9 니카제 기반 REDITdn 및 Cas9dn의 경우(도 31c)에 대해, RAD51 억제제 B02 및 RI-1로 처리되거나 비히클 처리된 Cas9 기준과 비교한 REDIT 도구의 상대적 녹-인 효율성을 보여주는 그래프이다. 모든 조건은 2개의 게놈 유전자좌(DYNLT1 및 HSP90AA1)에서 1-kb 녹-인 검정으로 측정했다. 도 31d는 상응하는 Cas9 및 Cas9dn 기준과 비교하여 3개의 게놈 유전자좌에 걸쳐 테스트된 REDIT 및 REDITdn을 사용한 hESC(H9)에서의 녹-인 효율성 그래프이다. 도 31e 및 31f는 Cas9, Cas9dn 및 NTC 대조군과 함께 REDIT, REDITdn을 사용한 hESC에서의 mKate 녹-인 결과의 유세포분석 플롯이다. hESC 실험에서 공여자 DNA는 테스트된 모든 유전자좌에 걸쳐 200 + 200bp HA를 갖는다.
도 32a-32b는 dCas9 REDIT에 대한 화학적 교란을 보여준다. 유전자 편집 효율성은 세포 주기 억제제(Thy, 이중 티미딘) 차단과 함께(도 32a), 그리고 차단 없이(도 32b) 포유류 DNA 복구 경로 억제제(Mirin, RI-1 및 B02)로 처리했을 때 결정되었다. 통계 분석은 2단계 스텝업 방법을 통해 1% FDR을 갖는 t-테스트 결과에서 유래된 것이다.
도 33a 및 33b는 각각 DNA 구성요소(유전자 편집 벡터 및 주형 DNA) 및 마우스의 꼬리 정맥 주사의 개략도이다.
도 34a-34c는 유전자 편집 벡터를 사용한 마우스의 꼬리 정맥 주사 결과이다. 도 34a는 주사된 마우스 간의 간세포에 대한 PCR 분석의 개략도 및 겔 전기영동이다. 도 34b는 PCR 앰플리콘의 Sanger 시퀀싱 결과이다. 도 34c는 차세대 시퀀싱의 개략도 및 녹-인 접합부 오류의 정량화 그래프이다.
도 35a 및 35b는 각각 DNA 구성요소(유전자 편집 및 대조 벡터) 및 아데노 연관 바이러스(AAV) 처리의 개략도이다. 도 35c는 AAV 처리된 마우스 폐의 형광 이미지 및 상응하는 종양 수 정량화 그래프이다.
도 36a-36c는 E. 콜라이 RecT(EcRecT) 단독(도 36a) 및 결합된 단일 가닥 DNA를 갖는 것(도 36b, 36c)의 예측된 구조를 보여준다.
도 37a-37b는 EcRecT SSAP 아미노산과 ssDNA의 예측된 상호작용을 보여준다.
도 38a-38f는 미생물 SSAP 마이닝을 통한 dCas9 유전자 편집기의 개발을 보여준다. (도 38a) 단일 가닥 어닐링 단백질(SSAP)을 갖는 dCas9 편집기의 개략적 모델. (도 38b) 유전자 편집 효율성을 측정하기 위한 게놈 녹-인 검정의 설계(왼쪽); SSAP 스크리닝 실험의 작업흐름(오른쪽). (도 38c) 800bp 전이유전자와 함께 2A-mKate 녹-인 검정을 사용한 SSAP의 유전자 편집 효율성을 스크리닝하기 위한 작제물 설계. (도 38d) 3가지 SSAP의 초기 스크린 결과: 람다 파지로부터의 Bet 단백질(LBet), Rac 프로파지로부터의 RecT 단백질(RacRecT) 및 T7 파지로부터의 gp2.5(T7gp2.5). (도 38e) 메타게놈 상동체 마이닝 및 녹-인 검정을 통한 RecT 유사 SSAP 후보의 스크리닝. 가장 활성인 후보는 dCas9-SSAP로 표지되어 있다. NTC: 표적외 대조군. 공여자 주형은 공여자 없음 대조군을 제외한 모든 그룹에 첨가되었고, 상동성 암(HA) 길이는 다음과 같다: DYNLT1, 200+200bp; HSP90AA1, 200+400bp; ACTB, 200+400bp. (도 38f) HEK293T 세포 중 DYNLT1(왼쪽) 및 HSP90AA1(오른쪽) 유전자좌의 서로 다른 HA 길이를 갖는 3가지 유형의 공여자 설계를 사용하여 유전자 편집 효율성을 측정한다. 이 도면 및 이하 도면에서의 모든 결과는 별도로 명시되지 않는 한, 평균의 표준 오류(S.E.M.)를 나타내는 오류 막대를 갖는 반복 실험에서 유래된 것이다, n = 3.
도 39a-39h는 dCas9-SSAP의 표적상 및 표적외 편집 오류를 보여준다. (도 39a) 내인성 표적에서 dCas9-SSAP 및 Cas9 기준을 사용할 때 인델(indel) 형성 수준을 측정하기 위한 딥 시퀀싱. 사용된 공여자 주형은 200bp-HA HDR 주형이다. 방법에 설명된 검정의 세부 사항. (도 39b) 상이한 HDR 및 MMEJ 공여자와 함께 dCas9-SSAP 및 Cas9 기준을 사용한 녹-인 편집의 정확성을 분석하기 위한 클론 Sanger 시퀀싱. 사용된 공여자 주형은 200bp-HA HDR 주형 및 25bp-HA MMEJ 주형(방법 및 보충 참고)이다. (도 39c-도 39e) 비편향 시퀀싱을 사용한 녹-인 카세트의 삽입 부위의 게놈 전체 검출, (도 39c) 작업흐름, (도 39d) 녹-인 게놈 부위에 정렬된 대표적인 판독, 및 (e) 검출된 표적상 및 표적외 삽입 부위의 요약. (도 39f-도 39g) 편집 후 살아있는 세포의 백분율(모의 대조군으로 정규화됨)로 정의된 세포 적합도(fitness) 효과의 측정에 대한 작업 흐름 및 결과. (도 39h) Cas9 HDR 및 Cas9 MMEJ 방법과 비교하여 dCas9-SSAP 편집기의 녹-인 정확성에 대한 분석 요약. 정확성은 모든 편집된 결과(정확한 녹-인, 인델을 갖는 녹-인 및 NHEJ 인델) 내에서 정확한 녹-인의 전체 수율(%)로서 정의된다.
도 40a-40g는 dCas9-SSAP 편집기의 검증 및 Cas9 기준 및 기타 HDR 강화 방법과의 비교를 보여준다. (도 40a) dCas9-SSAP 및 다른 대안적 Cas9, nCas9 및 HDR 강화 도구를 사용한 효율성 비교. Cas9-HE(CtIP-융합 Cas9), Cas9-Gem(Geminin-융합 Cas9), nCas9(Cas9-D10A 니카제 기준) 및 nCas9-hRAD51(am 개선된 Cas9 니카제 편집기). 공여자 주형은 도 1과 동일하다. (도 40b) dCas9-SSAP 편집기를 사용한 내인성 게놈 유전자좌에서의 mKate 녹-인의 검증 영상화. (도 40c) 다양한 길이의 전이유전자를 갖는 녹-인 공여자의 설계. (도 40d) dCas9-SSAP 편집기를 사용한 상이한 전이유전자 길이에 대한 녹-인 효율성. 공여자 HA 길이는 DYNLT1의 경우 200bp+200bp, HSP90AA1의 경우 200bp+400bp이다. (도 40e) HEK293T 세포내 7개 내인성 유전자좌에 걸쳐 Cas9 기준과 비교된 dCas9-SSAP 편집기의 성능. ND, 공여자 없음 대조군; NT, 비-표적 대조군. (도 40f - 도 40g) 정량화된 HDR 효율성(도 40f) 및 유세포분석(도 40g)에 의한 dCas9-SSAP 편집기를 사용한 인간 배아 줄기 세포(hESC, H9)에서의 녹-인 유전자 편집. 모든 통계 분석은 Benjamini, Krieger 및 Yekutieli의 2단계 스텝업 방법을 통해 1% FDR(false-discovery rate)로 모든 게놈 표적을 비교하기 위해 다중 t-테스트를 사용하여 수행한다.
도 41a-41d는 dCas9-SSAP 편집기의 편집 메커니즘을 탐색하기 위한 화학적 교란을 보여준다. 세포 주기 동조화(DTB, 이중 티미딘 차단) 부재(도 41a, 41b) 또는 존재(도 41c, 41d) 하에 DNA 복구 경로 억제제(Mirin, RI1 및 B02)로 처리된 경우, dCas9-SSAP 편집기의 유전자 편집 효율성. 모든 공여자 주형은 도 38과 동일하다. 통계 분석은 Benjamini, Krieger 및 Yekutieli의 2단계 스텝업 방법을 통해 1% FDR을 갖는 t-테스트 결과에서 유래된 것이다.
도 42a-42d는 편리한 전달을 위한 소형 CRISPR 녹-인 도구로서 dCas9-SSAP 편집기의 최소화를 보여준다. (도 42a) EcRecT 예측된 2차 구조 및 구조적 예측에 기초하여 절두된 EcRecT 단백질을 작제하기 위한 프라이밍 부위를 보여주는 개략도. (도 42b) 다양한 절두 설계의 상대적인 녹-인 효율성. 모든 그룹은 Cas9 기준에 대해 정규화되었다(각 표적에 대해 개별적으로). (도 42c) 소형 SaCas9(왼쪽, 요소의 크기는 비례대로 도시되지 않음)를 사용한 AAV 작제물에서의 dSaCas9-mSSAP 시스템의 개략도 및 (도 42d) HEK293T 세포 중 원래 및 최소화된 dSaCas9-SSAP 편집기를 운반하는 AAV2 벡터의 시험관내 전달을 통한 AAVS1 및 HSP90AA1 내인성 표적의 녹-인 효율성.
도 43a-43e는 dCas9-SSAP를 사용한 녹-인-특이적 PCR 산물의 겔 전기영동 및 시퀀싱 검증을 보여준다. (도 43a) DYNLT1 유전자좌에서의 녹-인-특이적 접합부 PCR의 아가로스 겔 결과. (도 43b - 도 43e) DYNLT1 유전자좌에서 녹-인 실험으로부터의 게놈 접합부의 Sanger 시퀀싱 크로마토그램. 모든 샘플에 대해, 본 발명자들은 공여자 DNA 외측의 접합부 스패닝 프라이머를 사용하여 게놈 DNA의 5'(도 43b, 도 43c) 및 3'(도 43d, 도 43e) 말단을 증폭시켜 녹-인을 확인했다.
도 44는 주석이 달린 단백질 보존 도메인과 함께 대표적인 RecT 상동체의 계통발생수 및 아미노산 정렬을 보여준다.
도 45a-45b는 dCas9-SSAP 및 Cas9 편집기를 비교한 짧은 서열 편집의 딥 시퀀싱을 보여준다. (도 45a) EMX1에서 16-bp 대체의 공여자 설계. (도 45b) EMX1 게놈 유전자좌에서 딥 시퀀싱을 사용한 정밀 HDR 및 인델 편집 결과 분석. 1차 PCR 라운드에는 공여자의 완전히 외측에 있는 시퀀싱 프라이머를 사용하여, 시퀀싱 결과에 비-표적 대조군(여기서 공여자 DNA는 세포 내로 전달됨)에 의해 검증되는 공여자 주형 오염이 없도록 했다.
도 46a-46b는 녹-인 생성물의 Sanger 시퀀싱에 사용된 작업흐름(도 46a) 및 딥 표적상 인델 검정에 사용된 시퀀싱 방법(도 46b)을 보여주는 개략도이다. 여기에 설명된 검정은 도 41에 상응한다. gPCR, 게놈 PCR. Seq-F/seq-R은 녹-인 주형의 상류/하류에 결합하는 Sanger 시퀀싱에 대한 프라이머이다.
도 47a-47b는 DYNLT1 유전자좌에서 dCas9-SSAP 실험으로부터의 게놈 접합부의 Sanger 시퀀싱 크로마토그램을 보여준다. 모든 샘플에 대해, 게놈 DNA의 5'(도 47A) 및 3'(도 47B) 말단을 접합부-스패닝 프라이머를 사용하여 증폭시켜 녹-인 정밀도를 확인했다. 사용된 게놈 결합 프라이머는 오염을 방지하기 위해 공여자 DNA의 완전히 외측에 있다.
도 48a-48b는 HSP90AA1 유전자좌에서 dCas9-SSAP 실험으로부터의 게놈 접합부의 Sanger 시퀀싱 크로마토그램을 보여준다. 모든 샘플에 대해, 게놈 DNA의 5'(도 48a) 및 3'(도 48b) 말단을 접합부 스패닝 프라이머를 사용하여 증폭시켜 녹-인 정밀도를 확인했다. 사용된 게놈 결합 프라이머는 오염을 방지하기 위해 공여자 DNA의 완전히 외측에 있다.
도 49a-49b는 게놈 전체의 삽입 부위 매핑 및 정량화를 보여준다. (도 49a) 비-편향 게놈 전체 삽입 부위 매핑 공정에 대한 전반적인 작업흐름. 표적상 및 표적외 삽입 부위는 기준 게놈(hg38)에 정렬된 판독으로부터 회수된다. 전체 프로토콜 및 데이터 분석 파이프라인은 방법에 자세히 설명되어 있다. (도 49b) 모든 정렬된 판독(유효 UMI 포함)을 계수하는 게놈 전체 삽입 부위의 정량화는 2개의 게놈 유전자좌(DYNLT1 및 HSP90AA1)에 걸쳐, Cas9 HDR과 비교하여 Cas9-SSAP를 사용할 때 감소된 삽입 부위 풍부도를 보여주었다. 삽입 부위의 풍부도는 RPKU 또는 천개 UMI당 판독(Read Per Thousand UMI)으로 측정된다.
도 50a-50b는 3개의 게놈 표적(상단에 도시됨)에 걸쳐 단일 가이드(도 50a) 및 이중 가이드(도 50b) 설계를 사용한 dCas9-SSAP 편집 도구의 테스트를 보여준다. 사용된 공여자 DNA는 800-bp 녹-인 설계를 갖는 도 3a에 도시된 것과 동일하다.
도 51a-51c는 HepG2(도 51a), HeLa(도 51b) 및 U2OS(도 51c) 세포주의 3가지 추가 세포주에서의 dCas9-SSAP 녹-인 효율성의 검증을 보여준다. 녹-인 실험에는 테스트된 모든 세포주에 대해 2A-mKate 전이유전자를 암호화하는 ~800bp 카세트를 갖는 유사한 공여자 DNA를 사용했다.
도 52a-52c는 인간 줄기 세포 조작을 위해 dCas9-SSAP 편집기를 사용한 유세포분석 데이터의 전체 세트를 보여준다. 비-표적 대조군 및 Cas9(Cas9 HDR) 기준과 비교되는, dCas9-SSAP를 사용한 인간 배아 줄기 세포(hESC, H9) 내 HSP90AA1(도 52a), ACTB(도 52b), OCT4(도 52c) 내인성 유전자좌의 녹-인 유전자 편집에 대한 유세포분석.
도 53은 온라인 도구(CFSSP, 방법 참조)를 사용하여 예측된 RecT 단백질 2차 구조를 보여주는 개략도이다. 예측 결과(상단에 가시화된 2차 구조, 하단에 정렬)는 절두된 기능적 RecT 변이체를 개발하기 위한 기초를 형성했다.
도 54는 ACTB 표적(a, b) 및 HSP90AA1 표적(c, d)에 대한 세포 생존력 대 편집 효율성(음성 대조군에 대한 배수(a, c) 또는 mKate 녹-인의 백분율(b, d))을 보여주는 SSAP 어레이 스크리닝을 묘사한다. 양성 대조군은 EcRecT이다.
도 55는 2개의 표적, HSP90AA 및 ACTB에서의 활성을 비교한, 정규화된(a) 및 절대적인(b) 편집 효율성을 묘사한다. 도 55c는 HSP90AA1 녹-인에 대한 SSAP 사용을 ACTB 녹-인과 비교한, 세포 생존력을 보여준다. 양성 대조군은 EcRecT이다.
도 56은 조합된 모든 표적에 대한 세포 생존력 대 정규화된(a) 또는 절대적인(b) 편집 효율성의 비교를 산점도로 묘사한 것이다. 막대 그래프는 각 후보에 대해 정규화된(c) 또는 절대적인(d) 두 표적, HSP90 및 QCTB에서의 편집 효율성을 비교한다. 양성 대조군은 EcRecT이다.
도 57은 EcRecT(서열번호 171)와 비교되는 SSAP_16(1, 서열번호 185), SSAP_10(2, 서열번호 179), SSAP_36(3, 서열번호 205), SSAP_152(4, 서열번호 321) 및 SSAP_184(5, 서열번호 353)에 대한 트리 및 서열 정렬을 묘사한다. 표 9 참조.
도 58은 EcRecT(서열번호 171)와 비교되는, SSAP_16(1, 서열번호 185), SSAP_10(2, 서열번호 179), SSAP_36(3, 서열번호 205), SSAP_152(4, 서열번호 321), SSAP_184(5, 서열번호 353), SSAP_197(6, 서열번호 366), SSAP_305(7, 서열번호 424), SSAP_210(8, 서열번호 379), 및 SSAP_190(9, 서열번호 359)에 대한 트리 및 서열 정렬을 묘사한다. 표 9 참조.
도 58은 EcRecT(서열번호 171)와 비교되는 SSAP_16(1, 서열번호 185), SSAP_10(2, 서열번호 179), SSAP_36(3, 서열번호 205), SSAP_197(6, 서열번호 366) 및 SSAP_210(8; 서열번호 379)에 대한 트리 및 서열 정렬을 묘사한다. 표 9 참조.

현재 게놈 편집 기술은 정밀 편집에 대한 낮은 효율성 및 정확성로 인해 제한되어 포유류 세포에 정확한 대체, 결실 또는 삽입을 도입하기 위한 CRISPR 시스템과 같은 현행 도구를 사용하는 데 있어서 매우 신뢰할 수 없는 능력을 초래한다. 일반적인 공정은 게놈 서열에 바람직한 변화를 도입하기 위한 유전자 편집 도구(예컨대, CRISPR) 및 DNA 복구 주형의 전달을 수반한다. 그러나, 세포 내로 전달된 DNA는 치료 목적을 위한 안전하고 정확한 유전자 편집을 보장하는 데 있어 주요 문제점인, 표적외 게놈 유전자좌 또는 의도하지 않은 표적 내로 비특이적으로 삽입될 수 있다.

본 개시내용은 DNA 편집을 위한 시스템 및 구성요소에 관한 것이다. 특히, 개시된 시스템은 CRISPR 표적화 및 파지 재조합 효소에 의한 상동성 유도 복구를 기반으로 한다. 이 시스템은 킬로베이스 규모로 탁월한 재조합 효율성 및 정확성을 초래한다.

본 발명은 유전자 편집을 매개하는 분자 실체로서 RNA를 특징으로 하며, RNA를 주형(공여자)으로 적용하여, SSAP(단일 가닥 어닐링 단백질로서, RecT, 람다 레드, T7gp2.5로 예시됨)와 같은 재조합 단백질의 활성을 통해 매개되는 게놈 DNA 서열을 삽입, 결실, 대체 또는 제어하기 위한 시스템 및 방법의 설계 및 검증된 구성요소를 포함한다.

특정 실시양태에서, 본 발명은 3가지 구성요소를 세포로 전달하는 과정을 통한 효율적인 유전자 편집을 제공한다: (1) CRISPR 효소(절단/닉/R-루프 형성을 위해 각각 Cas9/Cas9n/dCas9 또는 Cas12a/nCas12a/dCas12a를 포함하나, 이에 제한되지는 않음) 및 SSAP 단백질을 동원하기 위해 앱타머(예를 들어, MS2, PP7 또는 BoxB)를 함유하는 가이드 RNA를 포함하는 CRISPR 시스템을 사용한 국소 DNA 절단, 닉형성 또는 R-루프-형성; (2) (1)의 가이드 RNA에 융합/연결되거나, 또는 제2 가이드 RNA에 융합/연결되는 하나 이상의 상동성 암(HA) 영역(들)과 함께 바람직한 DNA 변화를 보유하는 RNA 서열. HA 영역은 적어도 20bp이며 SSAP 매개 편집을 위한 편집 부위 다음에 상동성 영역을 제공한다. 제2 가이드 RNA를 사용하는 경우 이 제2 가이드 RNA는 (1)의 가이드 RNA에서 0bp 내지 150bp 사이로 떨어져 위치한 근처 게놈 부위에 결합할 것이다. 이 제2 가이드 RNA는 CRISPR 효소(예컨대, Cas9/nCas9/dCas9 및 Cas12a/nCas12a/dCas12a)와 복합체를 형성하고 표적 게놈 유전자좌에 동원되고 편집을 위한 RNA 주형/공여자를 제공하는 역할을 한다. 효소는 표적 유전자좌에만 결합하는 완전 활성 CRISPR 효소, 니카제 또는 비활성화된 CRISPR 효소(dCas9, dCas12a 등)일 수 있다. 가이드는 효율적인 결합을 허용하지만 표적을 절단하지 않도록 하는 정규 가이드 RNA 또는 더 짧은 가이드 RNA(전형적으로 정규 가이드 RNA보다 2~6bp 짧으므로 14bp~18bp)일 수 있다. (3) 링커를 통해 RNA-앱타머 결합 단백질(RBP)에 융합된 SSAP 단백질. RBP는 제한 없이 MS2 외피 단백질(MCP), PP7 외피 단백질(PCP), 또는 람다 파지의 BoxB 결합 펩타이드(람다 N22 펩타이드)일 수 있다. 이 구성요소를 위해, 본 발명자들은 또한 이 RNA 주형화된 SSAP 유전자 편집을 향상시킬 수 있는 추가 인자를 식별했다; 즉, 본 발명자들이 역전사효소(RT)를 긴 펩타이드 링커를 통해 SSAP 단백질에 융합한다면, 이 제3 구성요소 RBP-SSAP-RT 또는 RBP-RT-SSAP(-는 링커를 나타냄)가 만들어지고, 이는 편집 효율성을 추가로 향상시킨다.

다른 실시양태에서, Cas9/nCas9/dCas9 또는 Cas12a/nCas12a/dCas12a 단백질은 링커를 통해 역전사효소(RT)에 융합되며, 이 설계는 프라임 편집과 비슷하다. 이 설계의 가이드 RNA는 적어도 14bp 이상의 프라이머 결합 부위(PBS)를 선택적으로 포함하며, 이는 편집 부위의 영역에 상보적이다. 이 PBS는 RT 활성의 개시를 촉진한다. 대안적으로, 또 다른 설계는 제1 실시양태에서와 동일한 가이드 RNA를 사용하고, 편집 부위의 영역에 상보적인 짧은 올리고 DNA(길이가 14bp 이상)를 세포에 공급하여 RT 활성을 개시하는 것이다. 이 올리고 DNA는 RT 활성을 개시하고 SSAP 매개 유전자 편집을 허용할 수 있다.

다른 실시양태에서, Cas9/nCas9/dCas9 또는 Cas12a/nCas12a/dCas12a 단백질은 레트론 시스템으로부터의 역전사효소(RT)에 링커를 통해 융합된다. 이 설계의 가이드 RNA는 레트론으로부터의 msr/msd 서열, 및 또한 편집 부위의 영역에 상보적인 하나 이상의 상동성 암(HA) 영역(들)을 갖는다. msr/msd 서열은 RT 활성을 개시하는 데 도움을 준다. 반면, HA 영역은 SSAP 유전자 편집을 매개하는 데 도움을 준다.

본 발명의 조성물 및 방법은 진핵/포유류 세포에서 신규 RNA 매개/RNA 주형 유전자 편집을 제공한다. 내인성 tRNA, 리보자임 또는 Cas12a 시스템으로부터의 직접 반복을 사용하여 절단 가능한 RNA 주형을 설계함으로써, 본 발명자들은 또한 RNA를 주형으로 사용하여 다중 표적 유전자 편집을 달성한다.

본 발명은 적어도 다음과 같은 본 발명자들의 RNA-주형의 SSAP 유전자 편집 시스템의 5가지 이점을 제공한다: (1) RNA가 기존 유전자 편집 과정에 사용되는 DNA에 비해 덜 면역원성이고, RNA가 의도하지 않은 게놈 DNA 부위 또는 표적외 DNA 부위에 직접 통합될 수 없음으로 인한 감소된 표적외 또는 독성; (2) 본 발명자들의 방법에서 절단 가능한 RNA 주형을 사용함으로써 정밀 유전자 편집 방법의 다중체화 용이성; (3) 세포 내로의 RNA 전달의 단순성, 제조하기가 더 쉽고, 임상 용도로 스케일업하기에 잠재적으로 더 저렴함; (4) RNA는 화학적 연결 또는 생화학적 커플링을 통해 다른 조절 또는 조합 페이로드/성분을 조합함으로써 다른 유형의 유전자 편집 또는 치료 양식과 함께 RNA 주형의 유전자 편집의 보다 효율적인 전달, 편집 또는 시너지 작용을 가능하게 하는, 많은 조작 잠재력을 가짐; 및 (5) RNA 주형의 유전자 편집의 효율성은 RNA 및 단백질 인자를 통해 향상될 수 있으며 표적 세포의 건강에 중요할 수 있는 정규 DNA-복구 경로에 독립적이다.

1. 정의

본 기술의 이해를 용이하게 하기 위해, 다수의 용어 및 문구가 아래에 정의된다. 추가적인 정의는 상세한 설명 전반에 걸쳐 제시된다.

본 명세서에 사용된 용어 "포함하다(comprise(s))", "포함하다(include(s))", "갖는", "갖는다", "할 수 있다", "함유하다(contain(s))" 및 이들의 변형은 추가적인 행위나 구조의 가능성을 배제하지 않는 개방형 전환 문구, 용어 또는 단어인 것으로 의도된다. 단수형 "a", "and" 및 "the"는 문맥에서 달리 명시하지 않는 한 복수의 지시대상을 포함한다. 본 개시내용은 또한 명시적으로 기재되었는지 여부에 관계없이 본 명세서에 제시된 실시양태 또는 요소를 "포함하는", "이루어지는" 및 "본질적으로 이루어지는" 다른 실시양태도 고려한다.

본원에서 수치 범위를 열거하는 경우, 동일한 정밀도를 갖는 그 사이의 각각의 중재 숫자는 명시적으로 고려된다. 예를 들어, 6-9 범위의 경우, 6과 9 외에 숫자 7 및 8이 고려되고, 6.0-7.0 범위의 경우 숫자 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9 및 7.0이 명시적으로 고려된다.

본원에서 달리 정의되지 않는 한, 본 개시내용과 관련하여 사용되는 과학 및 기술 용어는 관련 기술분야의 기술자가 일반적으로 이해하는 의미를 가질 것이다. 예를 들어, 본원에 기술된 세포 및 조직 배양, 분자 생물학, 면역학, 미생물학, 유전학 및 단백질, 핵산 화학 및 혼성화와 관련하여 사용된 임의의 명명법 및 기술은 관련 기술분야에 잘 알려져 있고 일반적으로 사용되는 것이다. 용어의 의미 및 범위는 명확해야 한다; 그러나 잠재적인 모호성이 있는 경우, 본원에 제공된 정의가 사전적 정의 또는 외부 정의보다 우선한다. 또한, 문맥상 달리 요구되지 않는 한, 단수 용어는 복수를 포함하고, 복수 용어는 단수를 포함할 것이다.

"상보적인" 및 "상보성"이라는 용어는 전통적인 왓슨-크릭 염기 쌍형성 또는 기타 비전통적인 유형의 쌍형성에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 2개의 핵산 서열 사이의 상보성 정도는 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기 쌍형성)을 형성할 수 있는 핵산 서열 내 뉴클레오타이드의 백분율(예를 들어, 50%, 60%, 70%, 80%, 90% 및 100% 상보적)로 표시될 수 있다. 2개의 핵산 서열은 한 핵산 서열의 모든 연속 뉴클레오타이드가 제2 핵산 서열의 동일한 수의 연속 뉴클레오타이드와 수소 결합한다면, "완전히 상보적"이다. 2개의 핵산 서열 사이의 상보성 정도가 적어도 8개 뉴클레오타이드 영역(예를 들어, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50개 이상의 뉴클레오타이드) 영역 상에서 적어도 60%(예를 들어, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%)라면, 또는 2개의 핵산 서열이 적어도 중간 엄중도 조건, 바람직하게는 높은 엄중도 조건 하에 혼성화한다면, "실질적으로 상보적"이다. 예시적인 중간 엄중도 조건으로는 20% 포름아미드, 5×SSC(150mM NaCl, 15mM 구연산 3나트륨), 50mM 인산나트륨(pH 7.6), 5×Denhardt 용액, 10% 덱스트란 황산염, 및 20 mg/ml 변성 전단된 연어 정자 DNA를 포함하는 용액에서 37℃에서 밤새 인큐베이션하고, 그 다음 필터를 약 37-50℃에서 1×SSC로 세척하는 것을 포함하거나, 또는 실질적으로 유사한 조건, 예를 들어 Sambrook et al., 하기 문헌에 기술된 중간 엄중도 조건을 포함한다. 높은 엄중도 조건은, 예를 들어 (1) 50℃에서 0.015M 염화나트륨/0.0015M 구연산나트륨/0.1% 도데실황산나트륨(SDS)과 같이 세척을 위한 낮은 이온 강도 및 고온을 사용하거나, (2) 혼성화 동안 변성제, 예를 들어 포름아미드, 예를 들어 0.1% 소 혈청 알부민(BSA)/0.1% Ficoll/0.1% 폴리비닐피롤리돈(PVP)/pH 6.5의 50mM 인산나트륨 완충액 및 50% (v/v) 포름아미드를 750mM 염화나트륨 및 75mM 구연산나트륨과 함께 42℃에서 사용하거나, 또는 (3) 50% 포름아미드, 5x SSC(0.75M NaCl, 0.075M 구연산나트륨), 50mM 인산나트륨(pH 6.8), 0.1% 피로인산나트륨, 5×Denhardt 용액, 초음파 처리된 연어 정자 DNA(50 μg/ml), 0.1% SDS 및 10% 덱스트란 황산염을 42℃에서 사용하고, (i) 42℃에서 0.2×SSC, (ii) 55℃에서 50% 포름아미드, 및 (iii) 55℃에서 0.1×SSC(바람직하게는 EDTA와 조합)로의 세척을 사용하는 조건이다. 혼성화 반응의 추가적인 세부사항 및 엄중도에 대한 설명은, 예를 들어 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Press, Cold Spring Harbor, N.Y. (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates and John Wiley & Sons, New York(1994)]에 제공되어 있다.

세포는 외인성 DNA, 예를 들어 재조합 발현 벡터에 의해, 이러한 DNA가 세포 내부에 도입되었다면, "유전자 변형", "형질전환" 또는 "형질감염"된 것이다. 외인성 DNA의 존재는 영구적이거나 일시적인 유전자 변화를 초래한다. 형질전환 DNA는 세포의 게놈에 통합(공유 결합)될 수도 있고 그렇지 않을 수도 있다. 예를 들어, 원핵생물, 효모 및 포유류 세포에서 형질전환 DNA는 플라스미드와 같은 에피솜 요소에서 유지될 수 있다. 진핵세포와 관련하여, 안정하게 형질전환된 세포는 형질전환 DNA가 염색체에 통합되어 염색체 복제를 통해 딸세포에 유전되도록 하는 것이다. 이러한 안정성은 형질전환 DNA를 함유하는 딸 세포 집단을 포함하는 세포주 또는 클론을 확립시키는 진핵 세포의 능력에 의해 입증된다. "클론"은 유사분열에 의해 단일 세포 또는 공통 조상으로부터 유래되는 세포 집단이다. "세포주"는 여러 세대에 걸쳐 시험관내에서 안정적으로 성장할 수 있는 1차 세포의 클론이다.

본원에 사용된 "핵산" 또는 "핵산 서열"은 피리미딘 및/또는 퓨린 염기, 바람직하게는 각각 시토신, 티민 및 우라실, 그리고 아데닌 및 구아닌의 중합체 또는 올리고머를 지칭한다. 본 기술은 임의의 데옥시리보뉴클레오타이드, 리보뉴클레오타이드 또는 펩타이드 핵산 성분, 및 이들 염기의 메틸화, 하이드록시메틸화 또는 글리코실화 형태 등과 같은 이들의 임의의 화학적 변이체를 고려한다. 중합체 또는 올리고머는 조성이 불균질하거나 균질할 수 있으며 자연 발생원으로부터 단리될 수 있거나 인공적으로 또는 합성적으로 생산될 수 있다. 또한, 핵산은 DNA, RNA 또는 이들의 혼합물일 수 있으며, 동종이합체, 이종이합체 및 혼성체 상태를 포함하여 단일 가닥 또는 이중 가닥 형태로 영구적으로 또는 일시적으로 존재할 수 있다. 일부 실시양태에서, 핵산 또는 핵산 서열은 다른 종류의 핵산 구조, 예를 들어 DNA/RNA 나선, 펩타이드 핵산(PNA), 모르폴리노 핵산(예를 들어, Braasch and Corey, Biochemistry, 41(14): 4503-4510 (2002) 참조) 및 미국 특허 제5,034,506호(본원에 참고로 포함됨), 잠긴 핵산(LNA; 본원에 참고로 포함되는 Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A., 97: 5633-5638(2000) 참조), 사이클로헥세닐 핵산 (본원에 참고로 포함되는 Wang, J. Am. Chem. Soc., 122: 8595-8602 (2000) 참조), 및/또는 리보자임을 포함한다. 여기서, 용어 "핵산" 또는 "핵산 서열"은 또한 비천연 뉴클레오타이드, 변형된 뉴클레오타이드, 및/또는 천연 뉴클레오타이드와 동일한 기능을 나타낼 수 있는 비-뉴클레오타이드 빌딩 블록(예를 들어, "뉴클레오타이드 유사체")을 포함하는 사슬을 포괄할 수도 있다; 추가로, 본원에 사용된 용어 "핵산 서열"은 올리고뉴클레오타이드, 뉴클레오타이드 또는 폴리뉴클레오타이드, 및 이의 단편 또는 부분, 그리고 단일 또는 이중 가닥일 수 있고 센스 또는 안티센스 가닥을 나타낼 수 있는 게놈 또는 합성 기원의 DNA 또는 RNA를 지칭한다. 용어 "핵산", "폴리뉴클레오타이드", "뉴클레오타이드 서열" 및 "올리고뉴클레오타이드"는 상호교환적으로 사용된다. 이는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드, 또는 이들의 유사체 중 임의의 길이의 뉴클레오타이드의 중합체 형태를 지칭한다.

"펩타이드" 또는 "폴리펩타이드"는 펩타이드 결합에 의해 연결된 2개 이상의 아미노산의 연결된 서열이다. 펩타이드 또는 폴리펩타이드는 천연, 합성, 또는 천연 및 합성의 변형 또는 조합일 수 있다. 폴리펩타이드는 결합 단백질, 수용체 및 항체와 같은 단백질을 포함한다. 단백질은 아미노산 사슬에 포함되지 않는 당, 지질 또는 다른 모이어티의 첨가에 의해 변형될 수 있다. 용어 "폴리펩타이드" 및 "단백질"은 본원에서 상호교환적으로 사용된다.

본원에 사용된 용어 "서열 동일성 백분율"은 최대 백분율의 동일성을 달성하기 위해 두 서열을 정렬하고 필요한 경우 갭을 도입한 후 기준 서열의 상응하는 뉴클레오타이드 또는 아미노산과 동일한, 핵산 서열 내 뉴클레오타이드 또는 뉴클레오타이드 유사체, 또는 아미노산 서열 내 아미노산의 백분율을 지칭한다. 따라서, 이 기술에 따른 핵산이 기준 서열보다 긴 경우에, 기준 서열과 정렬되지 않은 핵산의 추가적인 뉴클레오타이드는 서열 동일성을 결정하는 데 고려되지 않는다. 정렬을 위한 방법 및 컴퓨터 프로그램은 BLAST, Align 2 및 FASTA를 포함하여 관련 기술분야에 잘 알려져 있다.

"서열 유사성 퍼센트"라는 용어는 보존적 아미노산 치환을 고려한다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 관련 기술분야에 잘 알려져 있다. 다음 5개 그룹은 각각 서로 보존적 치환인 아미노산을 함유한다: 지방족: 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I); 방향족: 페닐알라닌(F), 티로신(Y), 트립토판(W); 황 함유: 메티오닌(M), 시스테인(C); 염기성: 아르기닌(R), 리신(K), 히스티딘(H); 산성: 아스파르트산(D), 글루탐산(E), 아스파라긴(N), 글루타민(Q). 또한, 암호화된 서열에서 단일 아미노산 또는 소량의 아미노산 백분율을 변경, 첨가 또는 결실시키는 개별 치환, 결실 또는 첨가도 "보존적으로 변형된 변이"이다. 이러한 조정을 만들기 위한 수단은 관련 기술분야의 기술자에게 잘 알려져 있다. 전형적으로, 이는 보존적 치환을 완전 불일치가 아닌 부분 불일치로 채점하여 서열 동일성 백분율을 높이는 것을 수반한다. 따라서, 예를 들어 동일한 아미노산에 1점을 부여하고 비보존적 치환에 0점을 부여하는 경우, 보존적 치환에는 0과 1 사이의 점수가 부여된다. 보존적 치환의 채점은 예를 들어 프로그램 PC/GENE(Intelligenetics, 캘리포니아주 마운틴 뷰)에서 구현된 바와 같이 계산된다.

기준 서열과 주어진 유사성 퍼센트 초과인 것으로서 식별된 서열은 기준 서열과 주어진 동일성 퍼센트 초과인 서열을 하위세트로서 포함하는 것으로 이해될 것이다. 따라서, 주어진 유사성 퍼센트 초과인 서열에 대한 본원에서의 나열은 주어진 동일성 퍼센트 초과인 서열의 하위세트를 포함한다.

"벡터" 또는 "발현 벡터"는 세포에서 부착된 분절의 복제를 일으키기 위해 또 다른 DNA 분절, 예를 들어, "삽입체"가 부착되거나 혼입될 수 있는 플라스미드, 파지, 바이러스 또는 코스미드와 같은 레플리콘이다.

"야생형"이라는 용어는 자연 발생 공급원으로부터 단리되었을 때 해당 유전자 또는 유전자 산물의 특징을 갖는 유전자 또는 유전자 산물을 지칭한다. 야생형 유전자는 집단에서 가장 빈번하게 관찰되는 것이고, 따라서 유전자의 "정상" 또는 "야생형" 형태로 임의로 지정된다. 대조적으로, 용어 "변형된", "돌연변이체" 또는 "다형성"은 야생형 유전자 또는 유전자 산물과 비교할 때 서열 및/또는 기능적 특성(예: 변경된 특징)의 변형을 나타내는 유전자 또는 유전자 산물을 지칭한다. 자연 발생의 돌연변이체가 단리될 수 있다는 점에 유의한다; 이는 야생형 유전자 또는 유전자 산물과 비교할 때 변경된 특징을 갖는다는 사실에 의해 식별된다.

2. RNA-가이드 CRISPR 리콤비니어링 시스템

박테리아 및 고세균에서 CRISPR/Cas 시스템은 침입한 파지, 바이러스 및 플라스미드 DNA의 단편을 CRISPR 유전자좌에 혼입시키고 상응하는 CRISPR RNA("crRNA")를 사용하여 상동성 서열의 분해를 가이드함으로써 면역성을 제공한다. 각 CRISPR 유전자좌는 반복 서열에 의해 분리되는 획득된 "스페이서"를 암호화한다. CRISPR 유전자좌의 전사는 "pre-crRNA"를 생성하며, 이는 프로세싱되어 스페이서에 상보적인 dsDNA 서열을 절단하도록 이펙터 뉴클레아제 복합체를 가이드하는 스페이서-반복 단편을 함유하는 crRNA를 생성한다. 유형 I, 유형 II 또는 유형 III의 3가지 상이한 유형의 CRISPR 시스템이 알려져 있으며, 이는 Cas 단백질 유형 및 침입하는 DNA에 프로토 스페이서를 선택하기 위한 프로토-스페이서 인접 모티프(PAM)의 사용에 기초하여 분류된다. 내인성 유형 II 시스템은 Cas9 단백질 및 2개의 비암호 crRNA, 즉 트랜스-활성화 crRNA(tracrRNA) 및 동일한 직접 반복체(DR)에 의해 이격된 뉴클레아제 가이드 서열("스페이서"라고도 지칭됨)을 함유하는 전구체 crRNA(pre-crRNA) 어레이를 포함한다. tracrRNA는 pre-crRNA의 프로세싱 및 Cas9 복합체의 형성에 중요하다. 첫째, tracrRNA는 pre-crRNA의 반복 영역에 혼성화한다. 둘째, 내인성 RNaseIII은 혼성화된 crRNA-tracrRNA를 절단하고, 두 번째 이벤트가 각 스페이서의 5' 말단을 제거하여 tracrRNA 및 Cas9 모두와 연관된 상태로 남아 있는 성숙한 crRNA를 생성한다. 셋째, 각각의 성숙한 복합체는 표적 이중 가닥 DNA(dsDNA) 서열을 찾아내어 Cas9의 뉴클레아제 활성을 사용하여 두 가닥을 모두 절단한다.

CRISPR/Cas 유전자 편집 시스템은 진핵 세포에서 관심 있는 특정 유전자에 대한 표적화된 변형을 가능하게 하도록 개발되었다. CRISPR/Cas 유전자 편집 시스템은 일반적으로 유형 II 원핵생물 클러스터링 규칙적인 간격의 짧은 회문 반복체(CRISPR) 적응 면역 시스템으로부터의 RNA-가이드 Cas9 뉴클레아제를 기반으로 한다. 진핵 세포에 사용하기 위한 CRISPR/Cas 시스템의 조작은 전형적으로 crRNA-tracrRNA-Cas9 복합체의 재구성을 수반한다. 예를 들어, 인간 세포에서 Cas9 아미노산 서열은 적절한 핵 국재화 신호를 포함하도록 코돈 최적화되고 변형될 수 있으며, crRNA 및 tracrRNA 서열은 개별적으로 또는 RNA 폴리머라제 II 프로모터를 통해 단일 키메라 분자로서 발현될 수 있다. 전형적으로, crRNA 및 tracrRNA 서열은 키메라로서 발현되며 집합적으로 "가이드 RNA"(gRNA) 또는 단일 가이드 RNA(sgRNA)라고 지칭된다. 따라서, 용어 "가이드 RNA", "단일 가이드 RNA" 및 "합성 가이드 RNA"는 본원에서 상호교환적으로 사용되며, tracrRNA를 포함하는 핵산 서열 및 가이드 서열을 함유하는 pre-crRNA 어레이를 지칭한다. 용어 "가이드 서열", "가이드" 및 "스페이서"는 본원에서 상호교환적으로 사용되며 표적 부위를 특정하는 가이드 RNA 내의 약 20개 뉴클레오타이드 서열을 지칭한다. CRISPR/Cas9 시스템에서 가이드 RNA는 약 20개 뉴클레오타이드 가이드 서열과 그 뒤에 왓슨-크릭 염기 쌍형성을 통해 Cas9를 표적 서열로 유도하는 프로토스페이서 인접 모티프(PAM)를 함유한다.

일부 실시양태에서, 본 개시내용은 CRISPR 유전자 편집 시스템의 도구를 활용하는 RNA 가이드 리콤비니어링을 위한 시스템을 제공한다. 시스템은 Cas 단백질, 표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자 및 재조합 단백질을 포함한다. 특정 실시양태에서, 재조합 단백질은 미생물 재조합 단백질을 포함한다. 특정 실시양태에서, 재조합 단백질은 바이러스 재조합 단백질을 포함한다. 특정 실시양태에서, 재조합 단백질은 진핵생물 재조합 단백질을 포함한다. 특정 실시양태에서, 재조합 단백질은 미토콘드리아 재조합 단백질을 포함한다.

Cas 단백질 계열은, 예를 들어, 본원에 참고로 포함되는 문헌[Haft et al., PLoS Comput. Biol., 1(6): e60 (2005)에 더 상세하게 기술되어 있다. Cas 단백질은 임의의 Cas 엔도뉴클레아제일 수 있다. 일부 실시양태에서, Cas 단백질은 Cas9 또는 Cas12a이며, 이는 달리 Cpf1이라고도 지칭된다. 한 실시양태에서, Cas9 단백질은 야생형 Cas9 단백질이다. Cas9 단백질은 임의의 적합한 미생물로부터 수득될 수 있으며, 다수의 박테리아가 Cas9 단백질 오솔로그 또는 변이체를 발현한다. 일부 실시양태에서, Cas9는 스트렙토코커스 피오게네스 또는 스타필로코커스 아우레우스로부터 유래된다. 다른 종의 Cas9 단백질은 관련 기술분야에 알려져 있고(예를 들어, 본원에 참고로 포함되는 미국 특허 출원 공개 2017/0051312 참조), 본 개시내용과 관련하여 사용될 수 있다. 다양한 종 유래의 Cas 단백질의 아미노산 서열은 GenBank 및 UniProt 데이터베이스를 통해 공개적으로 이용 가능하다.

일부 실시양태에서, Cas9 단백질은 Cas9 니카제(Cas9n)이다. 야생형 Cas9에는 이중 가닥 DNA 파손을 촉진하는 2개의 촉매성 뉴클레아제 도메인이 있다. Cas9 니카제 단백질은 전형적으로 촉매적 뉴클레아제 도메인 중 하나에 불활성화 점 돌연변이(들)를 통해 조작되어, 남아 있는 활성 뉴클레아제 도메인을 사용하여 Cas9로 하여금 2개의 DNA 가닥 중 하나만을 효소적으로 파손하거나 닉을 유발하도록 한다. Cas9 니카제는 관련 기술분야에 알려져 있으며(예를 들어, 본원에 참고로 포함된 미국 특허 출원 공개 제2017/0051312호 참조), 예를 들어 D10 또는 H840에 점 돌연변이가 있는 스트렙토코커스 피오게네스를 포함한다. 선택된 실시양태에서, Cas9 니카제는 스트렙토코커스 피오게네스 Cas9n(D10A)이다.

일부 실시양태에서, Cas 단백질은 촉매적으로 죽은 Cas이다. 예를 들어, 촉매적으로 죽은 Cas9는 이의 촉매적 뉴클레아제 도메인 내에 전형적으로 2개 이상의 돌연변이로 인해 단백질에 촉매적 뉴클레아제 활성이 거의 또는 전혀 없는 본질적으로 DNA 결합 단백질이다. 스트렙토코커스 피오게네스 Cas9는 D10의 돌연변이 및 E762, H840, N854, N863, 또는 D986 중 적어도 하나, 전형적으로 H840 및/또는 N863의 돌연변이에 의해 촉매적으로 죽은 것이 될 수 있다(예를 들어, 본원에 참고로 포함된 미국 특허 출원 공개 제2017/0051312호 참조). 스타필로코커스 아우레우스 Cas9에서의 N580과 같은 상응하는 오솔로그 내의 돌연변이는 알려져 있다. 종종, 이러한 돌연변이는 촉매적으로 죽은 Cas 단백질이 정상 뉴클레아제 활성의 3% 이하를 소유하도록 한다.

일부 실시양태에서, 시스템은 표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자를 포함한다. 상기에 기술된 바와 같은 가이드 RNA 서열은 대략 20개 뉴클레오타이드 가이드 서열에 이어, 왓슨-크릭 염기 쌍형성을 통해 Cas9를 표적 서열로 유도하는 프로토스페이서 인접 모티프(PAM)를 갖는 표적 부위를 특정짓는다.

용어 "표적 DNA 서열", "표적 핵산", "표적 서열", 및 "표적 부위"는 가이드 서열(예를 들어, 가이드 RNA)이 상보성을 갖도록 설계된 폴리뉴클레오타이드(핵산, 유전자, 염색체, 게놈 등)를 지칭하며, 여기서 결합에 충분한 조건이 존재한다면 표적 서열과 가이드 서열 사이의 혼성화는 Cas9/CRISPR 복합체의 형성을 촉진한다. 일부 실시양태에서, 표적 서열은 게놈 DNA 서열이다. 본원에 사용된 용어 "게놈"은 세포의 염색체에 위치하는 핵산 서열(예를 들어, 유전자 또는 유전자좌)을 지칭한다. 혼성화를 유발하고 CRISPR 복합체의 형성을 촉진하기에 충분한 상보성이 있다면, 표적 서열과 가이드 서열은 완전한 상보성을 나타낼 필요는 없다. 표적 서열은 DNA 또는 RNA와 같은 임의의 폴리뉴클레오타이드를 포함할 수 있다. 적합한 DNA/RNA 결합 조건에는 일반적으로 세포에 존재하는 생리학적 조건을 포함한다. 다른 적합한 DNA/RNA 결합 조건(예를 들어, 무세포 시스템의 조건)은 관련 기술분야에 알려져 있다; 예를 들어, 본원에서 참조되고 참고로 포함되는 Sambrook을 참조한다. DNA 표적화 RNA에 상보적이고 혼성화하는 표적 DNA의 가닥은 "상보적 가닥"이라고 지칭되고, "상보적 가닥"에 상보적인(따라서 DNA 표적화 RNA에 상보적이지 않음) 표적 DNA 가닥은 "비상보적 가닥" 또는 "비-상보적 가닥"이라고 지칭된다.

표적 게놈 DNA 서열은 유전자 산물을 암호화할 수 있다. 본원에 사용된 용어 "유전자 산물"은 유전자 발현으로부터 초래되는 임의의 생화학적 산물을 지칭한다. 유전자 산물은 RNA 또는 단백질일 수 있다. RNA 유전자 산물은 tRNA, rRNA, 마이크로 RNA(miRNA), 및 소형 간섭 RNA(siRNA)와 같은 비-암호 RNA, 및 메신저 RNA(mRNA)와 같은 암호 RNA를 포함한다. 일부 실시양태에서, 표적 게놈 DNA 서열은 단백질 또는 폴리펩타이드를 암호화한다.

일부 실시양태에서, 예를 들어, 시스템이 Cas9 니카제 또는 촉매적으로 죽은 Cas 9를 포함하는 경우, 가이드 RNA 서열을 포함하는 2개의 핵산 분자가 활용될 수 있다. 2개의 핵산 분자는 동일하거나 상이한 가이드 RNA 서열을 가질 수 있으며, 따라서 동일하거나 상이한 표적 DNA 서열에 상보적일 수 있다. 일부 실시양태에서, 2개의 핵산 분자의 가이드 RNA 서열은 반대쪽 말단(예를 들어, 3' 또는 5') 및/또는 삽입체 위치의 반대쪽 가닥에 있는 표적 DNA 서열에 상보적이다.

일부 실시양태에서, 시스템은 적어도 하나의 앱타머 서열 및 융합 단백질의 일부로서 재조합 단백질에 기능적으로 연결된 앱타머 결합 단백질을 포함하는 동원 시스템을 추가로 포함한다.

일부 실시양태에서, 앱타머 서열은 RNA 앱타머 서열이다. 일부 실시양태에서, 가이드 RNA를 포함하는 핵산 분자는 또한 하나 이상의 RNA 앱타머, 또는 또 다른 분자 종, 어댑터 분자, 예컨대 핵산 또는 단백질을 동원하고 결합할 수 있는 별개의 RNA 2차 구조 또는 서열을 포함한다. 몇몇 CRISPR 시스템은 SpCas9, SaCas9 및 LbCas12a(일명 Cpf1)를 포함하되 이에 제한되지 않는 가이드 RNA 삽입 및 확장과 화합성이다. RNA 앱타머는 특정 표적 분자 종에 결합하기 위해 반복적인 시험관내 선택 라운드 또는 SELEX(지수적 농축에 의한 리간드의 체계적 진화)를 통해 조작된 자연 발생 또는 합성 올리고뉴클레오타이드일 수 있다. 일부 실시양태에서, 핵산은 2개 이상의 앱타머 서열을 포함한다. 앱타머 서열은 동일하거나 상이할 수 있으며 동일하거나 상이한 어댑터 단백질을 표적으로 삼을 수 있다. 선택된 실시양태에서, 핵산은 2개의 앱타머 서열을 포함한다.

공지된 임의의 RNA 앱타머/앱타머 결합 단백질 쌍은 본 개시내용과 관련하여 선택되고 사용될 수 있다(예를 들어, Jayasena, S.D., Clinical Chemistry, 1999. 45(9): p. 1628-1650; Gelinas, et al., Current Opinion in Structural Biology, 2016. 36: p. 122-132; 및 Hasegawa, H., Molecules, 2016; 21(4): p. 421, 본원에 참고로 포함됨).

박테리오파지 외피 단백질의 다양한 어레이를 포함하는, 다수의 RNA 앱타머 결합 단백질 또는 어댑터 단백질이 존재한다. 이러한 외피 단백질의 예로는 다음을 포함하지만, 이에 제한되지는 않는다: MS2, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s 및 PRR1. 일부 실시양태에서, RNA 앱타머는 MS2 박테리오파지 외피 단백질 또는 이의 기능성 유도체, 단편 또는 변이체에 결합한다. MS2 결합 RNA 앱타머는 일반적으로 줄기의 5' 다리에 단일 돌출된 아데닌이 있는 19개 뉴클레오타이드 RNA 분자에 의해 고전적으로 정의되는 간단한 줄기-루프 구조를 갖는다(Witherall G.W., et al., (1991) Prog. Nucleic Acid Res. Mol. Biol., 40, 185-220, 본원에 참고로 포함됨). 그러나, 다수의 매우 상이한 1차 서열은 MS2 외피 단백질에 결합할 수 있는 것으로 밝혀졌다(Parrott AM, et al., Nucleic Acids Res. 2000;28(2):489-497, Buenrostro JD, et al. Natura Biotechnology 2014; 32, 562-568, 본원에 참조로 포함됨). MS2 박테리오파지 외피 단백질에 결합하는 것으로 알려진 임의의 RNA 앱타머 서열은 MS2를 포함하는 융합 단백질에 결합하기 위해 본 개시내용과 관련하여 활용될 수 있다. 선택된 실시양태에서, MS2 RNA 앱타머 서열은 AACAUGAGGAUCACCCAUGUCUGCAG(서열번호 145), AGCAUGAGGAUCACCCAUGUCUGCAG(서열번호 146), 또는 AGCGUGAGGAUCACCCAUGCCUGCAG(서열번호 147)을 포함한다.

박테리오파지의 N-단백질(Nut-활용 부위 단백질)은 N 펩타이드라고 지칭되는 약 20개 아미노산의 아르기닌-풍부 보존된 RNA 인식 모티프를 함유한다. RNA 앱타머는 파지 N 펩타이드 또는 이의 기능성 유도체, 단편 또는 변이체에 결합할 수 있다. 일부 실시양태에서, 파지 N 펩타이드는 람다 또는 P22 파지 N 펩타이드 또는 이의 기능성 유도체, 단편 또는 변이체이다.

선택된 실시양태에서, N 펩타이드는 람다 파지 N22 펩타이드, 또는 이의 기능성 유도체, 단편 또는 변이체이다. 일부 실시양태에서, N22 펩타이드는 아미노산 서열 GNARTRRRERRAEKQAQWKAAN(서열번호 149)과 적어도 70% 유사성을 갖는 아미노산 서열을 포함한다. λ 박테리오파지 항종결인자 단백질 N의 22개 아미노산 RNA-결합 도메인(λN-(1-22) 또는 λN 펩타이드)는 BoxB 줄기-루프를 포함하되 이에 제한되지 않는 특정 줄기 루프 구조에 특이적으로 결합할 수 있다. 예를 들어, 문헌[Cilley and Williamson, RNA 1997; 3(1):57-67, 본원에 참고로 포함됨] 참조. 다수의 상이한 BoxB 줄기-루프 1차 서열은 N22 펩타이드에 결합하는 것으로 알려져 있으며 이들 중 임의의 것이 본 개시내용과 관련하여 활용될 수 있다. 일부 실시양태에서, N22 펩타이드 RNA 앱타머 서열은 GCCCUGAAAAAGGGC (서열번호 150), GCCCUGAAGAAGGGC (서열번호 151), GCGCUGAAAAAGCGC (서열번호 152), GCCCUGACAAAGGGC (서열번호 153), 및 GCGCUGACAAAGCGC (서열번호 154)로 이루어지는 그룹으로부터 선택되는 RNA 서열과 적어도 70% 유사성을 갖는 뉴클레오타이드 서열을 포함한다. 일부 실시양태에서, N22 펩타이드 RNA 앱타머 서열은 서열번호 150-154로 이루어지는 그룹으로부터 선택된다.

선택된 실시양태에서, N 펩타이드는 P22 파지 N 펩타이드, 또는 이의 기능성 유도체, 단편 또는 변이체이다. 다수의 상이한 BoxB 줄기-루프 1차 서열은 P22 파지 N 펩타이드 및 이의 변이체에 결합하는 것으로 알려져 있으며, 이들 중 임의의 것은 본 개시내용과 관련하여 활용될 수 있다. 예를 들어, 문헌[Cocozaki, Ghattas, Smith, Journal of Bacteriology 2008; 190(23):7699-7708, 본원에 참고로 포함됨] 참조. 일부 실시양태에서, P22 파지 N 펩타이드는 아미노산 서열 GNAKTRRHERRRKLAIERDTI(서열번호 155)와 적어도 70% 유사성을 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, P22 파지 N 펩타이드 RNA 앱타머 서열은 GCGCUGACAAAGCGC(서열번호 156) 및 CCGCCGACAACGCGG(서열번호 157)로 이루어지는 그룹으로부터 선택되는 RNA 서열과 적어도 70% 유사성을 갖는 서열을 포함한다. 일부 실시양태에서, P22 파지 N 펩타이드 RNA 앱타머 서열은 서열번호 156-157, UGCGCUGACAAAGCGCG(서열번호 158) 또는 ACCGCCGACAACGCGGU(서열번호 159)로 이루어지는 그룹으로부터 선택된다.

특정 실시양태에서, 재조합 단백질과 기능의 조합을 함께 가져오기 위해 상이한 앱타머/앱타머 결합 단백질 쌍이 선택될 수 있다.

일부 실시양태에서, 앱타머 서열은 펩타이드 앱타머 서열이다. 펩타이드 앱타머는 친화성 제제에 의해 특이적으로 인식되는 자연 발생 또는 합성 펩타이드일 수 있다. 이러한 앱타머로는 c-Myc 친화성 태그, HA 친화성 태그, His 친화성 태그, S 친화성 태그, 메티오닌-His 친화성 태그, RGD-His 친화성 태그, 7x His 친화성 태그, FLAG 옥타펩타이드, strep 태그 또는 strep 태그 II, V5 태그 또는 VSV-G 에피토프를 포함하지만, 이에 제한되지는 않는다. 상응하는 앱타머 결합 단백질은 관련 기술분야에 잘 알려져 있으며, 예를 들어 1차 항체, 비오틴, 아피머, 단일 도메인 항체, 및 항체 모방체를 포함한다.

예시적인 펩타이드 앱타머는 GCN4 펩타이드를 포함한다(Tanenbaum et al., Cell 2014; 159(3):635-646, 본원에 참고로 포함됨). 항체 또는 GCN4 결합 단백질은 앱타머 결합 단백질로서 사용될 수 있다.

일부 실시양태에서, 펩타이드 앱타머 서열은 Cas 단백질에 접합된다. 펩타이드 앱타머 서열은 임의의 배향(예를 들어, N-말단에서 C-말단으로, C-말단에서 N-말단으로, N-말단에서 N-말단으로)으로 Cas에 융합될 수 있다. 선택된 실시양태에서, 펩타이드 앱타머는 Cas 단백질의 C-말단에 융합된다.

일부 실시양태에서, 1 내지 24개의 펩타이드 앱타머 서열이 Cas 단백질에 접합될 수 있다. 앱타머 서열은 동일하거나 상이할 수 있으며 동일하거나 상이한 앱타머 결합 단백질을 표적으로 삼을 수 있다. 선택된 실시양태에서, 동일한 펩타이드 앱타머 서열의 1 내지 24개의 직렬 반복체가 Cas 단백질에 접합된다. 바람직한 실시양태에서 4 내지 18개의 직렬 반복체가 Cas 단백질에 접합된다. 개별 앱타머는 링커 영역에 의해 분리될 수 있다. 적합한 링커 영역은 관련 기술분야에 알려져 있다. 링커는 입체 장애 없이 또는 감소된 입체 장애로 인접한 앱타머에 친화성 제제의 결합을 허용하도록 구성되거나 유연할 수 있다. 링커 서열은 예를 들어 하나 이상의 글리신 및/또는 세린 잔기의 포함에 의해, 폴리펩타이드의 비구조화 또는 선형 영역을 제공할 수 있다. 링커 서열은 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 아미노산 길이일 수 있다.

일부 실시양태에서, 융합 단백질은 앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함한다. 일부 실시양태에서, 재조합 단백질은 미생물 재조합 단백질을 포함한다. 일부 실시양태에서, 재조합 단백질은 재조합효소를 포함한다. 특정 실시양태에서, 재조합 단백질은 5'-3' 엑소뉴클레아제 활성을 포함한다. 특정 실시양태에서, 재조합 단백질은 3'-5' 엑소뉴클레아제 활성을 포함한다. 특정 실시양태에서, 재조합 단백질은 ssDNA 결합 활성을 포함한다. 특정 실시양태에서, 재조합 단백질은 ssDNA 어닐링 활성을 포함한다.

λ red 시스템으로 명명된 박테리오파지 λ-암호화된 유전자 재조합 기구는 gam 유전자에 의해 보조되는 exo 및 bet 유전자를 포함하며, 이는 함께 λ red 유전자라고 지명된다. Exo는 dsDNA를 표적으로 하는 5'-3' 엑소뉴클레아제이고 Bet는 ssDNA 결합 단백질이다. Bet 기능으로는 ssDNA가 분해되지 않도록 보호하고 상보적 ssDNA 가닥의 어닐링을 촉진하는 것을 포함한다. E.콜라이에서 발견되는 또 다른 박테리오파지 시스템은 Rac 프로파지 시스템으로, exo 및 bet와 기능적으로 유사한 recE 및 recT 유전자를 포함한다. 일부 실시양태에서, 미생물 재조합 단백질은 RecE, RecT, 람다 엑소뉴클레아제(Exo), Bet 단백질(betA, redB), 엑소뉴클레아제 gp6, 단일 가닥 DNA 결합 단백질 gp2.5, 또는 이의 유도체 또는 변이체일 수 있다.

본 발명에 유용한 재조합 단백질 및 이의 기능성 단편으로는 뉴클레아제, ssDNA 결합 단백질(SSB) 및 ssDNA 어닐링 단백질(SSAB)을 포함한다. 미생물 단백질 중에서, 이들은 제한 없이, E.콜라이 단백질, 예컨대 ExoI(xonA; sbcB), ExoIII (xthA), ExoIV (orn), ExoVII (xseA, xseB), ExoIX (ygdG), ExoX (exoX), DNA polI 5' Exo(ExoVI) (polA), DNA Pol I 3' Exo(ExoII) (polA), DNA Pol II 3' Exo (polB), DNA Pol III 3' Exo (dnaQ, mutD), RecBCD (recB, recC, recD), 및 RecJ (recJ) 및 이들의 기능성 단편을 포함한다.

이중 가닥 DNA는 유전자 정보를 함유하지만, 정보의 사용은 단일 가닥 중간체를 수반한다. 단일 가닥 중간체는 2차 구조를 형성하고 화학적 및 핵산분해적 분해에 민감한 반면, 세포는 ssDNA에 결합하고 안정화하는 ssDNA 결합 단백질(SSB)을 암호화한다. 유용한 SSB로는 원핵생물, 박테리오파지, 진핵생물, 포유류, 미토콘드리아 및 바이러스의 SSB를 포함하지만, 이에 제한되지는 않는다. SSB는 모든 유기체에서 발견되지만 단백질 자체는 놀랍게도 서열 유사성이 거의 없으며 하위단위 조성 및 올리고머화 상태가 다를 수 있다. SSB 단백질은 특정한 구조적 특징을 포함할 수 있다. 하나는 올리고뉴클레오타이드/올리고당 결합(OB) 도메인을 사용하여 포스포디에스테르 백본 및 뉴클레오타이드 염기와의 정전기적 및 염기-적층 상호작용의 조합을 통해 ssDNA를 결합하는 것이다. 또 다른 특징은 DNA 결합 OB 접힘을 하나로 묶는 올리고머화이다. 진핵생물 SSB는 세린 및 트레오닌 잔기의 인산화에 의해 조절된다. 미생물 SSB의 티로신 인산화는 분류학적으로 멀리 떨어진 박테리아에서 관찰되며 ssDNA에 대한 친화성을 실질적으로 증가시킨다. 인간 미토콘드리아 ssDNA 결합 단백질은 에세리키아 콜라이의 SSB(EcoSSB)와 구조적으로 유사하지만, C-말단의 무질서한 도메인이 없다. 진핵생물 복제 단백질 A(RPA)는 기능을 공유하지만 박테리아 SSB와 서열 상동성은 없다. 단순 포진 바이러스(HSV-1) SSB인 ICP8은 다른 복제 단백질과 함께 바이러스 DNA 복제에 필요한 핵 단백질이다.

이론에 얽매이지 않고, 본 발명의 재조합 단백질의 엑소뉴클레아제 활성 및 ssDNA 결합 활성은 주형 및 표적 DNA의 단일 가닥 영역을 드러내고 보호하여 재조합을 용이하게 하는 것으로 생각된다. 또한, 표적화는 협력적일 수 있으며, 이는 주형 DNA로 설계된 상동성 암에 의해 유도된 재조합과 조화를 이루는 염색체 DNA의 표적 유도된 CRISPR-매개의 닉형성을 수반한다. 본 발명의 특정 실시양태에서, 표적외 효과는 최소화된다. 예를 들어, 표적화된 재조합은 조화를 이룬 CRISPR 및 재조합 기능을 수반하지만, 표적외 부위에서는 HR 주형 DNA와 상동성이 없고 닉 복구가 유리해질 수 있다.

단일 가닥 DNA 어닐링 단백질(SSAP)은 또한 다양한 서열로 유기체 사이에 편재하며, 생물정보학 및 실험적 분석에 의해 과 및 상과로 분류되었다. 더욱이, 파지 암호화 SSAP는 DNA 대사를 제어하기 위해 숙주 단백질과 함께 기능하면서 고전적인 RecA 단백질을 대체하는 자체 SSAP 재조합효소를 암호화하는 것으로 인식되어 있다. Steczkiewiz는 SSAP를 원핵생물, 진핵생물 및 파지를 포함하는 3개 상과로 조직화되는 7개 과(RecA, Gp2.5, RecT/Redβ, Erf, Rad52/22, Sak3 및 Sak4)로 분류했다(Steczkiewicz et al., 2021, Front. Microbiol 12:644622). 본 발명에 따라 사용될 수 있는 SSAP의 비제한적인 예는 표 5에 제공된다. 임의의 하나 이상의 SSAP가 본 발명에 사용될 수 있다.

특정 실시양태에서, 미생물 재조합 단백질은 RecE 또는 RecT, 또는 이들의 유도체 또는 변이체이다. RecE 및 RecT의 유도체 또는 변이체는 야생형 RecE 및 RecT와 실질적으로 유사한 기능을 소유하는 기능적으로 동등한 단백질 또는 폴리펩타이드이다. RecE 및 RecT 유도체 또는 변이체는 야생형 서열과 유사하지만 아미노산 치환, 첨가, 결실, 절두, 해독 후 변형 또는 다른 변형으로 인해 차이가 있는 생물학적 활성 아미노산 서열을 포함한다. 일부 실시양태에서, 유도체는 해독, 정제, 생물학적 반감기, 활성을 개선하거나, 임의의 바람직하지 않은 부작용 또는 반응을 제거하거나 줄일 수 있다. 유도체 또는 변이체는 자연 발생 폴리펩타이드, 합성 또는 화학적으로 합성된 폴리펩타이드 또는 유전자 조작된 펩타이드 폴리펩타이드일 수 있다. RecE 및 RecT 생체활성은 관련 기술분야의 기술자에게 알려져 있고 쉽게 검정되며, 예를 들어 각각 엑소뉴클레아제 및 단일 가닥 핵산 결합을 포함한다.

RecE 또는 RecT는 에세리키아 콜라이(Escherichia coli), 판토에아 브리너리(Pantoea breeneri), 플라우티아 스탈리(Plautia stali)의 유형 F 공생자, 프로비덴시아(Providencia) 종 MGF014, 시겔라 손네이, 슈도박테리오보락스 안틸로고르기이콜라 등을 포함하는 다수의 미생물 유기체로부터 유래될 수 있다. 다른 비제한적인 공급원으로는 데설포탈레아 사이크로필라(Desulfotalea psychrophila), 락토코커스 락티스(Lactococcus lactis), 플라보박테리움 사이크로필룸(Flavobacterium psychrophilum), 마이코박테리움 스메그마티스(Mycobacterium smegmatis), 락토바실러스 람노수스(Lactobacillus rhamnosus), 사이크로박터 아크티쿠스(Psychrobacter arcticus), 사이크로박터 크라이오할로렌티스(Psychrobacter cryohalolentis), 사이크로모나스 잉그라미이(Psychromonas ingrahamii), 포토박테리움 프로펀덤(Photobacterium profundum), 사이크로플렉서스 토퀴스(Psychroflexus torquis) 및 쿨로박터 크레센투스(Caulobacter crescentus)를 포함한다. 특정 실시양태에서, RecE 및 RecT 단백질은 에세리키아 콜라이로부터 유래된다.

일부 실시양태에서, 융합 단백질은 RecE, 또는 이의 유도체 또는 변이체를 포함한다. RecE, 또는 이의 유도체 또는 변이체는 서열번호 1-8로 이루어지는 그룹으로부터 선택되는 아미노산 서열을 포함할 수 있다. RecE, 또는 이의 유도체 또는 변이체는 서열번호 1-8로 이루어지는 그룹으로부터 선택되는 아미노산 서열과 적어도 70%(예를 들어, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%) 유사성을 갖는 아미노산 서열을 포함할 수 있다. 선택된 실시양태에서, RecE, 또는 이의 유도체 또는 변이체는 서열번호 1-8로 이루어지는 그룹으로부터 선택되는 아미노산 서열과 적어도 90% 유사성을 갖는 아미노산 서열을 포함한다. 예시적인 실시양태에서, RecE, 또는 이의 유도체 또는 변이체는 서열번호 1-3으로 이루어지는 그룹으로부터 선택되는 아미노산 서열과 적어도 90% 유사성을 갖는 아미노산 서열을 포함한다.

일부 실시양태에서, 융합 단백질은 RecT, 또는 이의 유도체 또는 변이체를 포함한다. RecT, 또는 이의 유도체 또는 변이체는 서열번호 9-14로 이루어지는 그룹으로부터 선택되는 아미노산 서열을 포함할 수 있다. RecT, 또는 이의 유도체 또는 변이체는 서열번호 9-14로 이루어지는 그룹으로부터 선택되는 아미노산 서열과 적어도 70%(예를 들어, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%) 유사성을 갖는 아미노산 서열을 포함할 수 있다. 선택된 실시양태에서, RecT, 또는 이의 유도체 또는 변이체는 서열번호 9-14로 이루어지는 그룹으로부터 선택되는 아미노산 서열과 적어도 90% 유사성을 갖는 아미노산 서열을 포함한다. 예시적인 실시양태에서, RecT, 또는 이의 유도체 또는 변이체는 서열번호 9로 이루어지는 그룹으로부터 선택되는 아미노산 서열과 적어도 90% 유사성을 갖는 아미노산 서열을 포함한다.

특정 실시양태에서, 융합 단백질은 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 75% 유사하거나, 또는 적어도 75% 동일한 아미노산 서열을 포함하는 재조합 단백질, 표 9의 재조합 단백질, 서열번호 179, 서열번호 185, 서열번호 205, 서열번호 321, 서열번호 353, 서열번호 359, 서열번호 366, 서열번호 424, 또는 서열번호 479의 재조합 단백질, 또는 서열번호 166, 서열번호 168, 서열번호 169, 서열번호 170, 서열번호 171, 서열번호 241, 서열번호 253, 서열번호 290, 서열번호 408, 서열번호 411, 또는 서열번호 442의 재조합 단백질을 포함한다. 특정 실시양태에서, 융합 단백질은 상기 언급된 재조합 단백질과 적어도 80%, 적어도 85%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 98.5%, 적어도 99%, 적어도 99.5%, 또는 100% 유사성 또는 동일성을 갖는 서열을 포함하는 재조합 단백질을 포함한다.

특정 실시양태에서, 융합 단백질은 서열번호 166 내지 서열번호 491의 절두된 재조합 단백질을 포함한다. 절두는 C-말단 또는 N-말단 단부, 또는 둘 다에서 이루어질 수 있다. 예를 들어, 이하 실시예 6에서 입증되듯이 한쪽 단부 또는 양쪽 단부로부터의 다양한 절두 세트는 기능성 산물을 제공했다. 일부 실시양태에서, 하나 이상(2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120개 이상)의 아미노산은 야생형 서열과 비교하여 C-말단, N-말단 단부로부터 절두될 수 있다. 본 발명은 예를 들어 도 36, 37, 44를 참조하고 본원의 재조합 단백질 서열을 비교함으로써 절두, 치환, 결실 및 삽입의 적합성에 관한 지침을 포함한다.

본 발명은 유전자 편집 활성을 개선시킬 수 있는 재조합 단백질을 제공한다. 특정 실시양태에서, 본 발명의 재조합 단백질을 포함하는 시스템은 EcRecT를 포함하는 시스템과 동일하거나 초과인, 예를 들어 제한 없이 EcRecT에 비해 1.2x, 1.5x, 1.7x, 2x, 2.5x, 3x 이상인 편집 효율성을 가능하게 한다. 특정 실시양태에서, 본 발명의 재조합 단백질을 포함하는 시스템은 EcRecT를 포함하는 시스템과 동일하거나 초과인, 예를 들어 제한 없이 EcRecT에 비해 1.1x, 1.2x, 1.3x, 1.5x, 1.7x, 2x, 2.5x, 3x 이상인 세포 생존력을 제공한다.

일부 실시양태에서, 재조합 단백질은 티로신 재조합효소 또는 이의 기능성 단편을 포함한다. 일부 실시양태에서, 재조합 단백질은 세린 재조합효소 또는 이의 기능성 단편을 포함한다. 일부 실시양태에서, 재조합 단백질은 인테그라제, 리졸바제, 인버타제, 또는 이의 기능성 단편을 포함한다. 일부 실시양태에서, 재조합효소 단백질은 부위 특이적 재조합효소 단백질 또는 이의 기능성 단편을 포함한다. 일부 실시양태에서, 재조합 단백질은 엑소뉴클레아제 또는 이의 기능성 단편을 포함한다. 일부 실시양태에서, 재조합 단백질은 ssDNA 결합 단백질 또는 이의 기능성 단편을 포함한다. 특정 실시양태에서, 융합 단백질은 제한 없이 Hin, Gln, Tn3, β/six, CinH, Min, ParA, γδ, Bxb1, φC31, TP901-1, TGI, Wβ, φ370.1, φK38, φBT1, R4, φRVl, φFCl, MR11, A118, U153, Bxz2, gp29, Cre, Dre, Vika, Flp, Kw, SprA, HK022, P22, L1 또는 L5 또는 임의의 이러한 단백질 또는 이의 기능성 단편의 상동체를 포함한다. 관련 기술분야에서 인테그라제, 리졸바제 또는 인버타제로 분류될 수 있는 이러한 재조합효소는 엑소뉴클레아제 및 SSB와 하위구조 및 활성을 공유할 수 있으며 본 발명에 따라 사용될 수 있다.

융합 단백질에서, 미생물 재조합 단백질은 임의의 배향(예를 들어, N-말단에서 C-말단으로, C-말단에서 N-말단으로, N-말단에서 N-말단으로)으로 앱타머 결합 단백질의 어느 한쪽 말단에 연결될 수 있다. 선택된 실시양태에서, 미생물 재조합 단백질 N-말단은 앱타머 결합 단백질 C-말단에 연결된다. 따라서, N-말단에서 C-말단으로의 전체 융합 단백질은 미생물 재조합 단백질(N-말단에서 C-말단)에 연결된 앱타머 결합 단백질(N-말단에서 C-말단)을 포함한다.

일부 실시양태에서, 융합 단백질은 미생물 재조합 단백질과 앱타머 결합 단백질 사이에 링커를 추가로 포함한다. 링커는 임의의 길이의 임의의 아미노산 서열을 포함할 수 있다. 링커는 서로 연결되는 2가지 구성요소 중 어느 하나를 임의의 특정 방향으로 제한하지 않도록 유연성일 수 있다. 링커는 본질적으로 스페이서로서 작용할 수 있다. 선택된 실시양태에서, 링커는 미생물 재조합 단백질의 C-말단을 앱타머 결합 단백질의 N-말단에 연결한다. 선택된 실시양태에서, 링커는 16개 잔기 XTEN 링커의 아미노산 서열인, SGSETPGTSESATPES(서열번호 15) 또는 37개 잔기 EXTEN 링커인, SASGGSSGGSSGSETPGTSESATPESSGGSSGGSGGS(서열번호 148)를 포함한다.

일부 실시양태에서, 융합 단백질은 핵 국재화 서열(NLS)을 추가로 포함한다. 핵 국재화 서열은 융합 단백질 내의 임의의 위치에 있을 수 있다(예를 들어, 앱타머 결합 단백질의 C-말단, 앱타머 결합 단백질의 N-말단, 미생물 재조합 단백질의 C-말단). 선택된 실시양태에서, 핵 국재화 서열은 미생물 재조합 단백질의 C-말단에 연결된다. 다수의 핵 국재화 서열은 관련 기술분야에 공지되어 있으며(예를 들어, 본원에 참고로 포함된 Lange, A., et al., J Biol Chem. 2007; 282(8): 5101-5105 참조), 본 개시내용과 관련하여 사용될 수 있다. 핵 국재화 서열은 SV40 NLS, PKKKRKV(서열번호 16); Ty1 NLS, NSKKRSLEDNETEIKVSRDTWNTKNMRSLEPPRSKKRIH(서열번호 17); c-Myc NLS, PAAKRVKLD(서열번호 18); biSV40 NLS, KRTADGSEFESPKKKRKV(서열번호 19); 및 Mut NLS, PEKKRRRPSGSVPVLARPSPPKAGKSSCI(서열번호 20)일 수 있다. 선택된 실시양태에서, 핵 국재화 서열은 SV40 NLS, PKKKRKV(서열번호 16)이다.

Cas 단백질 및 융합 단백질은 바람직하게는 단일 조성물에 단독으로, 서로 조합으로, 및/또는 가이드 RNA 서열 및 앱타머 서열을 포함하는 폴리뉴클레오타이드(들)(예를 들어, 벡터)와 조합으로 포함된다. Cas 단백질 및/또는 융합 단백질은 폴리뉴클레오타이드에 물리적으로 또는 화학적으로 결합되거나 결합되지 않을 수 있다. Cas 단백질 및/또는 미생물 재조합 단백질은 관련 기술분야에 공지된 단백질-단백질 연결 또는 단백질-바이러스 연결에 적합한 임의의 방법을 사용하여 폴리뉴클레오타이드와 연관될 수 있다.

본 개시내용은 RNA 앱타머 결합 단백질에 기능적으로 연결된 미생물 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드를 포함하는 조성물 및 벡터를 추가로 제공한다.

조성물 또는 벡터는 Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드 및 표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자 중 적어도 하나 또는 둘 다를 추가로 포함할 수 있다. 일부 실시양태에서, 가이드 RNA 서열을 포함하는 핵산 분자는 적어도 하나의 RNA 앱타머 서열을 추가로 포함한다. 일부 실시양태에서, Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드는 적어도 하나의 펩타이드 앱타머 서열을 암호화하는 서열을 추가로 포함한다.

본 발명의 시스템과 관련하여 상기에 제시된 가이드 RNA 서열, 앱타머 서열, Cas 단백질, 미생물 재조합 단백질, 및 앱타머 결합 단백질을 포함하는 핵산 분자에 대한 설명은 또한 나열된 조성물 및 벡터의 폴리뉴클레오타이드에도 적용 가능하다.

Cas 단백질을 암호화하는 핵산 서열 및/또는 앱타머 결합 단백질에 기능적으로 연결된 미생물 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열은 가이드 RNA 서열 및/또는 RNA 앱타머 서열을 포함하는 핵산 분자와 동일한 벡터(예를 들어, cis로)에서 세포에 제공될 수 있다. 이러한 실시양태에서, 단방향 프로모터는 각 핵산 서열의 발현을 제어하는 데 사용될 수 있다. 다른 실시양태에서, 양방향 및 단방향 프로모터의 조합은 다중 핵산 서열의 발현을 제어하는 데 사용될 수 있다.

다른 실시양태에서, Cas 단백질을 암호화하는 핵산 서열, 앱타머 결합 단백질에 기능적으로 연결된 미생물 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열, 및 가이드 RNA 서열 및/또는 RNA 앱타머 서열을 포함하는 핵산 분자는 별도의 벡터(예를 들어, trans로)에서 세포에 제공될 수 있다. 각각의 개별 벡터 내의 핵산 서열 각각은 동일하거나 상이한 발현 제어 서열을 포함할 수 있다. 별도의 벡터는 동시에 또는 순차적으로 세포에 제공될 수 있다.

Cas 단백질을 암호화하고 앱타머 결합 단백질에 기능적으로 연결된 미생물 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 벡터(들)는 이에 의해 암호화된 폴리펩타이드를 발현할 수 있는 숙주 세포, 예를 들어 임의의 적합한 원핵 또는 진핵 세포 내로 도입될 수 있다. 이와 같이, 본 개시내용은 본원에 개시된 벡터 또는 핵산 서열을 포함하는 단리된 세포를 제공한다. 바람직한 숙주 세포는 쉽게 그리고 견실하게 성장할 수 있고, 성장 속도가 적당히 빠르고, 잘 특성화된 발현 시스템을 갖고, 쉽고 효율적으로 형질전환 또는 형질감염될 수 있는 세포이다. 적합한 원핵 세포의 예로는 바실러스(예컨대, 바실러스 서브틸리스 및 바실러스 브레비스), 에세리키아(예컨대, E. 콜라이), 슈도모나스, 스트렙토마이세스, 살모넬라 및 엔비니아 속의 세포를 포함하지만, 이에 제한되지는 않는다. 적합한 진핵 세포는 관련 기술분야에 공지되어 있으며, 예를 들어 효모 세포, 곤충 세포 및 포유류 세포를 포함한다. 적합한 효모 세포의 예로는 클루이베로마이세스(Kluyveromyces), 피치아(Pichia), 리노-스포리디움(Rhino-sporidium), 사카로마이세스(Saccharomyces) 및 쉬조사카로마이세스(Schizosaccharomyces) 속의 세포를 포함한다. 예시적인 곤충 세포로는 Sf-9 및 HIS(Invitrogen, 캘리포니아주 칼스배드)를 포함하며, 예를 들어 본원에 참고로 포함되는 문헌[Kitts et al., Biotechniques, 14: 810-817 (1993); Lucklow, Curr. Opin. Biotechnol., 4: 564-572 (1993); 및 Lucklow et al., J. Virol., 67: 4566-4579 (1993)]에 기술되어 있다. 바람직하게는, 숙주 세포는 포유류 세포이고, 일부 실시양태에서, 숙주 세포는 인간 세포이다. 다수의 적합한 포유류 및 인간 숙주 세포는 관련 기술분야에 공지되어 있고, 다수가 미국 모식균 배양 수집소(American Type Culture Collection)(ATCC, 버지니아주 마나사스)에서 입수 가능하다. 적합한 포유류 세포의 예로는 차이니즈 햄스터 난소 세포(CHO)(ATCC No. CCL61), CHO DHFR-세포(Urlaub et al., Proc. Natl. Acad. Sci. USA, 97:4216-4220(1980)), 인간 배아 신장(HEK) 293 또는 293T 세포(ATCC 번호 CRL1573) 및 3T3 세포(ATCC 번호 CCL92)를 포함하지만 이에 제한되지는 않는다. 다른 적합한 포유류 세포주는 원숭이 COS-1(ATCC No. CRL1650) 및 COS-7 세포주(ATCC No. CRL1651), 뿐만 아니라 CV-1 세포주(ATCC No. CCL70)이다. 추가의 예시적인 포유류 숙주 세포로는 형질전환된 세포주를 포함하는 영장류, 설치류 및 인간 세포주를 포함한다. 정상적인 이배체 세포, 1차 조직의 시험관내 배양물에서 유래된 세포 균주, 뿐만 아니라 1차 외식편도 적합하다. 다른 적합한 포유류 세포주는 마우스 신경모세포종 N2A 세포, HeLa, HEK, A549, HepG2, 마우스 L-929 세포 및 BHK 또는 HaK 햄스터 세포주를 포함하지만, 이에 제한되지는 않는다. 적합한 포유류 숙주 세포를 선택하는 방법 및 세포의 형질전환, 배양, 증폭, 스크리닝 및 정제를 위한 방법은 관련 기술분야에 공지되어 있다.

3. 표적 DNA를 변경하는 방법

본 개시내용은 또한 표적 DNA를 변경하는 방법을 제공한다. 일부 실시양태에서, 임의의 원하는 핵산이 변형될 수 있지만, 방법은 세포의 게놈 DNA 서열을 변경한다. 세포에 함유된 DNA에 적용될 때, 방법은 본원에 기술된 시스템, 조성물 또는 벡터를 표적 게놈 DNA 서열을 포함하는 세포 내로 도입하는 것을 포함한다. 본 발명의 시스템과 관련하여 상기에 기술된, 가이드 RNA 서열을 포함하는 핵산 분자, Cas 단백질, 미생물 재조합 단백질, 동원 시스템 및 이를 암호화하는 폴리뉴클레오타이드, 세포, 표적 게놈 DNA 서열 및 이들의 구성요소에 대한 설명은 또한 세포 내 표적 게놈 DNA 서열을 변경하는 방법에도 적용 가능하다. 시스템, 조성물 또는 벡터는 세포 유형에 따라 화학적 형질감염, 전기천공, 미세주사, 유전자 총을 통한 바이오리스틱 전달 또는 자기-보조 형질감염을 포함하지만, 이에 제한되지는 않는 관련 기술분야에 공지된 임의의 방식으로 도입될 수 있다.

표적 게놈 DNA 서열을 포함하는 세포 내로 본원에 기술된 시스템을 도입한 즉시, 가이드 RNA 서열은 세포 게놈의 표적 게놈 DNA 서열에 결합하고, Cas 단백질은 가이드 RNA와 연관되어 표적 게놈 DNA 서열에서 이중 가닥 파손 또는 단일 가닥 닉(nick)을 유도할 수 있고, 앱타머는 미생물 재조합 단백질을 융합 단백질의 앱타머 결합 단백질을 통해 표적 게놈 DNA 서열로 동원하여, 세포 내 표적 게놈 DNA 서열을 변경시킨다. 본원에 기술된 조성물, 또는 벡터를 세포 내로 도입시키는 경우, 가이드 RNA 서열을 포함하는 핵산 분자, Cas9 단백질, 및 융합 단백질은 세포 내에서 먼저 발현된다.

일부 실시양태에서, 세포는 유기체 또는 숙주 내에 존재하여, 개시된 시스템, 조성물, 벡터를 세포 내로 도입하는 것이 대상체에 투여하는 것을 포함하도록 한다. 방법은 생체내에서 또는 본 시스템의 생체외 처리된 세포, 시스템, 조성물, 벡터의 이식에 의해 대상체에게 제공하거나 투여하는 것을 포함할 수 있다.

"대상체"는 인간이거나 비인간일 수 있고, 예를 들어 본원에 기술된 바와 같은 마우스 모델과 같은 연구 목적을 위한 "모델 시스템"으로 사용되는 식물 또는 동물 계통 또는 종을 포함할 수 있다. 마찬가지로, 대상체는 성인 또는 청소년(예를 들어, 아동)을 포함할 수 있다. 더욱이, 대상체는 본원에서 고려되는 조성물의 투여로부터 이익을 얻을 수 있는 임의의 살아있는 유기체, 바람직하게는 포유류(예를 들어, 인간 또는 비인간)를 의미할 수 있다. 포유류의 예로는 포유류 강의 임의의 구성원을 포함하지만, 이에 제한되지는 않는다: 인간, 침팬지, 및 다른 유인원 및 원숭이 종과 같은 비인간 영장류; 소, 말, 양, 염소, 돼지와 같은 농장 동물; 토끼, 개, 및 고양이와 같은 가축; 래트, 마우스, 및 기니 피그 등과 같은 설치류를 포함하는 실험 동물. 비-포유류의 예로는 새, 어류 등을 포함하지만, 이에 제한되지는 않는다. 본원에 제공된 방법 및 조성물의 한 실시양태에서, 포유류는 인간이다. 식물은 제한 없이 사탕수수, 옥수수, 밀, 쌀, 기름 야자 열매, 감자, 대두, 채소, 카사바, 사탕무, 토마토, 보리, 바나나, 수박, 양파, 고구마, 오이, 사과, 실면, 오렌지 등을 포함한다.

본원에 사용된 바와 같이, 용어 "제공하는", "투여하는", "도입하는"은 본원에서 상호교환적으로 사용되며, 원하는 부위에 시스템의 적어도 부분적인 국재화를 초래하는 방법 또는 경로에 의한 대상체 내로 본 개시내용의 시스템의 배치를 지칭한다. 시스템은 대상체의 원하는 위치에 전달을 초래하는 임의의 적절한 경로에 의해 투여될 수 있다.

본원에 사용된 어구 "DNA 서열을 변경하는"은 관심 DNA 서열의 적어도 하나의 물리적 특징을 변형시키는 것을 지칭한다. DNA 변경으로는, 예를 들어 단일 또는 이중 가닥 DNA 파손, 하나 이상의 뉴클레오타이드의 결실 또는 삽입, 및 DNA 서열의 구조적 완전성 또는 뉴클레오타이드 서열에 영향을 미치는 기타 변형을 포함한다. 게놈 DNA 내 표적 서열의 변형은 예를 들어 유전자 교정, 유전자 대체, 유전자 태그화, 전이유전자 삽입, 뉴클레오타이드 결실, 유전자 파괴, 유전자 돌연변이, 유전자 녹다운 등을 초래할 수 있다.

일부 실시양태에서, 본원에 기술된 시스템 및 방법은 유전자의 하나 이상의 결함 또는 돌연변이를 교정("유전자 교정"으로 지칭됨)하는데 사용될 수 있다. 이러한 경우, 표적 게놈 DNA 서열은 유전자의 결함 버전을 암호화하고, 시스템은 유전자의 야생형 또는 수정된 버전을 암호화하는 공여자 핵산 분자를 추가로 포함한다. 즉, 환언하면, 표적 게놈 DNA 서열은 "질병 연관" 유전자이다. "질병 연관 유전자"라는 용어는 질병에 걸리지 않은 개인으로부터 얻은 조직 또는 세포와 비교하여, 질병에 걸린 개인으로부터 얻은 세포에서 유전자 산물이 비정상적인 수준 또는 비정상적인 형태로 발현되는 임의의 유전자 또는 폴리뉴클레오타이드를 지칭한다. 질병 연관 유전자는 비정상적으로 높은 수준 또는 비정상적으로 낮은 수준으로 발현될 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진행과 상관관계가 있다. 질병 연관 유전자는 또한 돌연변이 또는 이의 유전자 변이가 질병의 병인에 직접 책임이 있거나, 또는 책임이 있는 유전자(들)와 연쇄 불균형에 있는 유전자를 지칭한다. 이러한 "단일 유전자" 또는 "단일유전자성" 질병에 책임이 있는 유전자의 예로는 아데노신 데아미나제, α-1 항트립신, 낭포성 섬유증 막관통 전도도 조절인자(CFTR), β-헤모글로빈(HBB), 안구피부백색증 II(OCA2), 헌팅틴(HTT), 근육긴장이상증-단백질 키나제(DMPK), 저밀도 지단백질 수용체(LDLR), 아포지단백질 B(APOB), 신경피브로민 1(NF1), 다낭성 신장 질병 1(PKD1), 다낭성 신장 질병 2(PKD2), 응고 인자 VIII(F8), 디스트로핀(DMD), 인산염 조절 엔도펩티다제 상동체, X-연관(PHEX), 메틸-CpG 결합 단백질 2(MECP2) 및 유비퀴틴 특이적 펩티다제 9Y, Y-연관(USP9Y)을 포함하지만, 이에 제한되지는 않는다. 다른 단일 유전자 또는 단일유전자 질병은 관련 기술분야에 알려져 있고, 예를 들어 본원에 참고로 포함되는 문헌[Chial, H. Rare Genetic Disorders: Learning About Genetic Disease Through Gene Mapping, SNPs, and Microarray Data, Nature Education 1(1):192 (2008)]; 온라인 OMIM(Mendelian Inheritance in Man); 및 인간 유전자 돌연변이 데이터베이스(HGMD)에 기술되어 있다.

또 다른 실시양태에서, 표적 게놈 DNA 서열은 돌연변이가 다른 유전자의 돌연변이와 조합으로 특정 질병에 기여하는, 유전자를 포함할 수 있다. 단순(예를 들어 멘델식) 유전 패턴이 결여된 다중 유전자의 기여로 인해 발생하는 질병은 관련 기술분야에서 "다인자성" 또는 "다유전자성" 질병이라고 지칭된다. 다인자성 또는 다유전자성 질병의 예로는 천식, 당뇨병, 간질, 고혈압, 양극성 장애, 및 정신분열증을 포함하지만, 이에 제한되지는 않는다. 특정 발달 이상은 또한 다인자성 또는 다유전자성 패턴으로 유전될 수도 있으며, 예를 들어 구순구개열, 선천성 심장 결함 및 신경관 결함을 포함한다.

또 다른 실시양태에서, 표적 게놈 DNA 서열을 변경하는 방법은 표적 서열을 절단하고 외인적으로 제공된 공여자 핵산 서열의 부재 하에 세포가 절단된 서열을 복구하도록 함으로써 세포 내 표적 서열로부터 핵산을 결실시키는 데 사용될 수 있다. 이러한 방식의 핵산 서열의 결실은, 예를 들어 뉴런에서 질병을 유발하는 트리뉴클레오타이드 반복 서열을 제거하고, 유전자 녹아웃 또는 녹다운을 생성하고, 연구 중인 질병 모델에 대한 돌연변이를 생성하기 위한 것과 같은 다양한 적용예에 사용될 수 있다.

"공여자 핵산 분자"라는 용어는 표적 DNA(예를 들어, 게놈 DNA)에 삽입되는 뉴클레오타이드 서열을 지칭한다. 상기 기재된 바와 같이, 공여자 DNA는 예를 들어 유전자 또는 유전자의 일부, 태그 또는 국재화 서열을 암호화하는 서열, 또는 조절 요소를 포함할 수 있다. 공여자 핵산 분자는 임의의 길이일 수 있다. 일부 실시양태에서, 공여자 핵산 분자는 뉴클레오타이드 10개 내지 10,000개의 길이이다. 예를 들어, 길이는 약 100 내지 5,000개 뉴클레오타이드 사이, 약 200 내지 2,000개 뉴클레오타이드 길이, 약 500 내지 1,000개 뉴클레오타이드 길이, 약 500 내지 5,000개 뉴클레오타이드 길이, 약 1,000 내지 5,000개 뉴클레오타이드 길이, 또는 약 1,000 내지 10,000개 뉴클레오타이드 길이 사이이다.

개시된 시스템 및 방법은 특히 킬로베이스 규모의 핵산인 경우, 낮은 효율성 및 표적외 이벤트를 포함하는 기존의 유전자 편집 동안 직면한 문제를 극복해낸다. 일부 실시양태에서, 개시된 시스템 및 방법은 유전자 편집의 효율성을 개선시킨다. 예를 들어, 개시된 시스템 및 방법은 실시예 2, 3 및 5에 나타낸 바와 같이 기존의 CRISPR-Cas9 시스템 및 방법에 비해 효율성이 2 내지 10배 증가할 수 있다. 일부 실시양태에서, 효율성의 개선은 표적외 이벤트의 감소를 동반한다. 표적외 이벤트는 기존 CRISPR-Cas9 시스템 및 방법에 비해 50% 초과로 감소될 수 있고, 예를 들어 약 90%의 표적외 이벤트의 감소가 실시예 3에 제시되어 있다. 유전자 편집 시스템의 전체 정확성을 증가시키는 또 다른 측면은 HDR 편입의 부산물인 표적 상의 삽입-결실(인델)을 감소시키는 것이다. 일부 실시양태에서, 개시된 시스템 및 방법은 실시예 3에 나타낸 바와 같이 기존의 CRISPR-Cas9 시스템 및 방법에 비해 표적 상의 인델을 90% 초과로 감소시킨다.

본 개시내용은 본원에 기술된 임의의 방법을 실시하는데 유용하거나, 필요하거나, 충분한 하나 이상의 시약 또는 기타 구성요소를 함유하는 키트를 추가로 제공한다. 예를 들어, 키트는 CRISPR 시약(Cas 단백질, 가이드 RNA, 벡터, 조성물 등), 리콤비니어링 시약(재조합 단백질-앱타머 결합 단백질 융합 단백질, 앱타머 서열, 벡터, 조성물 등) 형질감염 또는 투여 시약, 음성 및 양성 대조군 샘플(예를 들어, 세포, 주형 DNA), 세포, 하나 이상의 구성요소를 수용하는 용기(예를 들어, 미세원심분리기 튜브, 상자), 검출 가능한 표지, 검출 및 분석 기기, 소프트웨어, 지침서 등을 포함할 수 있다.

RNA는 아데노 연관 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 기타 바이러스 벡터 유형, 또는 이들의 조합을 사용하여 전달될 수 있다. RNA는 하나 이상의 바이러스 벡터 내로 포장될 수 있다. 일부 실시양태에서, 바이러스 벡터는 관심 조직으로, 예를 들어 근육내 주사에 의해 전달되는 반면, 다른 경우에 바이러스 전달은 정맥내, 경피, 비강내, 경구, 점막 또는 다른 전달 방법을 통해 이루어진다. 이러한 전달은 단일 용량 또는 다중 용량을 통해 이루어질 수 있다. 관련 기술분야의 기술자는 본원에서 전달될 실제 투여량이 다양한 요인, 예컨대 선택된 벡터, 표적 세포, 유기체 또는 조직, 치료될 대상체의 일반적인 상태, 추구하는 형질전환/변형의 정도, 투여 경로, 투여 방식, 추구하는 형질전환/변형의 유형 등에 따라 크게 달라질 수 있음을 이해한다.

이러한 투여량은 예를 들어 운반체(물, 식염수, 에탄올, 글리세롤, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩기름, 참기름 등), 희석제, 약제학적으로 허용되는 운반체(예: 인산염 완충 식염수), 약제학적으로 허용되는 부형제, 및/또는 관련 기술분야에 공지된 다른 화합물을 추가로 함유할 수 있다. 이러한 투여량 제형은 관련 기술분야의 기술자에 의해 쉽게 확인될 수 있다. 투여량은 예를 들어 염산염, 브롬화수소산염, 인산염, 황산염 등과 같은 무기산염; 및 아세트산염, 프로피온산염, 말론산염, 벤조산염 등과 같은 유기산 염과 같은 하나 이상의 약제학적으로 허용되는 염을 추가로 함유할 수 있다. 또한, 습윤제 또는 유화제, pH 완충 물질, 겔 또는 겔화 물질, 향료, 착색제, 미세구, 중합체, 현탁화제 등과 같은 보조 물질이 본원에 존재할 수도 있다. 또한, 하나 이상의 다른 통상적인 약제학적 성분, 예컨대 보존제, 습윤제, 현탁화제, 계면활성제, 산화방지제, 고결방지제, 충전제, 킬레이트제, 코팅제, 화학적 안정제 등도, 특히 투여 형태가 재구성 가능한 형태라면 존재할 수 있다. 적합한 예시적인 성분으로는 미세결정성 셀룰로오스, 카르복시메틸셀룰로오스 나트륨, 폴리소르베이트 80, 페닐에틸 알코올, 클로로부탄올, 소르브산 칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 파라클로로페놀, 젤라틴, 알부민, 및 이들의 조합을 포함한다. 약제학적으로 허용되는 부형제에 대한 철저한 논의는 본원에 참고로 포함되는 REMINGTON'S PHARMACEUTICAL SCIENCES(Mack Pub. Co., N.J. 1991)에서 이용 가능하다.

본원의 실시양태에서 전달은 아데노바이러스를 통해 이루어지며, 이는 적어도 1x10⁵ 입자(입자 단위, pu라고도 함)의 아데노바이러스 벡터를 함유하는 단일 부스터 용량일 수 있다. 본원의 실시양태에서, 용량은 바람직하게는 적어도 약 1×10⁶개 입자(예를 들어, 약 1×10⁶-1×10¹²개 입자), 보다 바람직하게는 적어도 약 1×10¹⁰개 입자, 보다 바람직하게는 적어도 약 1×10⁸개 입자(예를 들어, 약 1×10⁸-1×10¹¹개 입자 또는 약 1×10⁸-1×10¹²개 입자), 가장 바람직하게는 적어도 약 1×10⁰개 입자(예를 들어, 약 1×10⁹-1×10¹⁰개 입자 또는 약 1×10⁹-1×10¹²개 입자), 또는 심지어 적어도 약 1×10¹⁰개 입자(예를 들어, 약 1×10¹⁰-1×10¹²개 입자)의 아데노바이러스 벡터이다. 대안적으로, 용량은 약 1×10¹⁴개 이하의 입자, 바람직하게는 약 1×10¹³개 이하의 입자, 훨씬 더 바람직하게는 약 1×10¹²개 이하의 입자, 더욱 바람직하게는 약 1×10¹¹개 이하의 입자를 포함하고, 가장 바람직하게는 약 1×10¹⁰개 이하의 입자(예를 들어, 약 1×10⁹개 이하의 물품)이다. 따라서, 용량은 예를 들어 약 1×10⁶ 입자 단위(pu), 약 2×10⁶ pu, 약 4×10⁶ pu, 약 1×10⁷ pu, 약 2×10⁷ pu, 약 4×10⁷ pu, 약 1×10⁸ pu, 약 2×10⁸ pu, 약 4×10⁸ pu, 약 1×10⁹ pu, 약 2×10⁹ pu, 약 4×10⁹ pu, 약 1×10¹⁰ pu, 약 2×10¹⁰ pu, 약 4×10¹⁰ pu, 약 1×10¹¹ pu, 약 2×10¹¹ pu, 약 4×10¹¹ pu, 약 1×10¹² pu, 약 2×10¹² pu, 또는 약 4×10¹² pu의 아데노바이러스 벡터를 갖는 아데노바이러스 벡터의 단일 용량을 함유할 수 있다. 예를 들어, 본원에 참고로 포함되는 Nabel 등에게 2013년 6월 4일자로 특허 허여된 미국 특허 제8,454,972호 B2의 아데노바이러스 벡터, 및 이의 컬럼 29, 36-58행에 기재된 투여량을 참조한다. 본원의 한 실시양태에서, 아데노바이러스는 다중 용량을 통해 전달된다.

본원의 실시양태에서, 전달은 AAV를 통해 이루어진다. 인간에게 AAV를 생체내 전달하는 데 있어서 치료적으로 효과적인 투여량은 약 1×10¹⁰ 내지 약 1×10¹⁰ 기능성 AAV/ml 용액을 함유하는 식염수 용액 약 20 내지 약 50ml 범위인 것으로 여겨진다. 투여량은 임의의 부작용에 대한 치료 이익의 균형을 맞추기 위해 조정될 수 있다. 본원의 실시양태에서, AAV 용량은 일반적으로 약 1×10⁵ 내지 1×10⁵⁰ 게놈 AAV, 약 1×10⁸ 내지 1×10²⁰ 게놈 AAV, 약 1×10¹⁰ 내지 약 1×10¹⁶ 게놈, 또는 약 1×10¹¹ 내지 약 1×10¹⁶ 게놈 AAV의 농도 범위이다. 인간 투여량은 약 1×10¹³ 게놈 AAV일 수 있다. 이러한 농도는 약 0.001ml 내지 약 100ml, 약 0.05 내지 약 50ml, 또는 약 10 내지 약 25ml의 운반체 용액에서 전달될 수 있다. 다른 유효 투여량은 용량 반응 곡선을 확립시키는 일상적인 시도를 통해 관련 기술분야의 기술자에 의해 쉽게 확립될 수 있다. 예를 들어, Hajjar 등에게 2013년 3월 26일자로 특허 허여된 미국 특허 제8,404,658호 B2의 컬럼 27, 45-60행을 참조한다.

본원의 실시양태에서, 전달은 플라스미드를 통해 이루어진다. 이러한 플라스미드 조성물에서, 투여량은 반응을 이끌어내기에 충분한 양의 플라스미드여야 한다. 예를 들어, 플라스미드 조성물 중 플라스미드 DNA의 적합한 양은 약 0.1 내지 약 2mg, 또는 약 1μg 내지 약 10μg일 수 있다.

본원의 용량은 평균 70kg의 개체를 기준으로 한다. 투여 빈도는 의료 또는 수의사(예를 들어, 의사, 수의사) 또는 관련 기술분야의 숙련된 과학자의 영역 내에 있다. 실험에 사용된 마우스는 약 20g이다. 20g의 마우스에게 투여된 것으로부터 70kg 개체에 대해 추정될 수 있다.

렌티바이러스는 유사분열 및 유사분열 후 세포 모두에서 유전자를 감염시키고 발현시키는 능력을 갖는 복합 레트로바이러스이다. 가장 일반적으로 알려진 렌티바이러스는 인간 면역결핍 바이러스(HIV)로서, 이는 광범위한 세포 유형을 표적으로 하기 위해 다른 바이러스의 엔벨로프 당단백질을 사용한다.

렌티바이러스는 다음과 같이 정제될 수 있다. pCasES10(렌티바이러스 전달 플라스미드 백본 함유)을 클로닝한 후, 낮은 계대(p=5)의 HEK293FT를 10% 소 태아 혈청을 포함하고 항생제가 없는 DMEM에서 형질감염 전날에 T-75 플라스크에서 50% 응집도로 파종했다. 20시간 후, 배지를 OptiMEM(무혈청) 배지로 교체하고 4시간 후에 형질감염을 수행했다. 세포를 10 μg의 렌티바이러스 전달 플라스미드(pCasES10) 및 다음과 같은 패키징 플라스미드로 형질감염시켰다: 5 μg의 pMD2. G(VSV-g 유사형) 및 7.5 ug의 psPAX2(gag/pol/rev/tat). 양이온성 지질 전달제(50uL Lipofectamine 2000 및 100 uL Plus 시약)가 포함된 4mL OptiMEM에서 형질감염을 수행했다. 6시간 후, 배지는 10% 소태아혈청이 포함된 무항생제 DMEM으로 교체했다.

렌티바이러스는 다음과 같이 정제될 수 있다. 바이러스 상청액을 48시간 후에 수집했다. 먼저 상청액에서 잔해를 제거하고 0.45 um 저단백질 결합(PVDF) 필터를 통해 여과했다. 그런 다음, 이를 초원심분리기에서 24,000rpm으로 2시간 동안 회전시켰다. 바이러스 펠릿은 50ul의 DMEM에서 4℃에서 하룻밤 동안 재현탁시켰다. 그런 다음 이를 분액하고 즉시 -80℃에 냉동시켰다.

또 다른 실시양태에서, 특히 안구 유전자 치료법의 경우 말 감염성 빈혈 바이러스(EIAV)에 기초한 최소 비영장류 렌티바이러스 벡터가 또한 고려된다(예를 들어, Balagaan, J Gene Med 2006; 8: 275-285, Wiley Interscience에서 2005년 11월 21일자로 온라인 공개함; 웹사이트: interscience.wiley.com, DOI: 10.1002/jgm.845에서 이용 가능). 또 다른 실시양태에서, 망형 연령 관련 황반변성의 치료를 위해 망막하 주사를 통해 전달되는 혈관신생억제 단백질인 엔도스테인 및 안지오스타틴을 발현하는 말 감염성 빈혈 바이러스-기반 렌티바이러스 유전자 치료 벡터인 RetinoStat®도 고려되며(예를 들어, Binley et al., HUMAN GENE THERAPY 23:980-991 (2012년 9월) 참조), 본 발명의 시스템을 위해 변형될 수 있다.

렌티바이러스 벡터는 파킨슨병의 치료에서처럼 개시되어 있고, 예를 들어, 미국 특허 공개 제20120295960호 및 미국 특허 제7,303,910호 및 제7,351,585호를 참조한다. 안구 질환의 치료에 있어서도 렌티바이러스 벡터가 개시되어 있다, 예를 들어, 미국 특허 공개 제20060281180호, 제20090007284호, US20110117189; US20090017543; US20070054961, US20100317109를 참조한다. 또한, 뇌로의 전달을 위한 렌티바이러스 벡터도 개시되어 있다(예를 들어, 미국 특허 공개 US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 및 미국 특허 제7,259,015호 참조.

몇몇 유형의 입자 전달 시스템 및/또는 제형은 다양한 스펙트럼의 생물의학적 적용예에 유용한 것으로 알려져 있다. 일반적으로, 입자는 이의 수송 및 특성과 관련하여 전체 단위처럼 행동하는 작은 물체로서 정의되어 있다. 입자는 직경에 따라 추가로 분류된다. 거친 입자는 2,500 내지 10,000 나노미터 사이의 범위이다. 미세 입자는 100 내지 2,500 나노미터 사이의 크기이다. 초미세 입자, 즉 나노입자는 일반적으로 크기가 1 내지 100 나노미터이다. 100nm 한계의 기준은 벌크 물질과 입자를 구별짓는 신규 특성이 전형적으로 100nm 미만의 임계 길이 규모로 발생한다는 사실이다.

본원에 사용된 입자 전달 시스템/제형은 본 발명에 따른 입자를 포함하는 임의의 생물학적 전달 시스템/제형으로 정의된다. 본 발명에 따른 입자는 100 마이크론(μm) 미만의 최대 치수(예를 들어, 직경)를 갖는 임의의 실체이다. 일부 실시양태에서, 본 발명의 입자는 10 미만의 최대 치수를 갖는다. 일부 실시양태에서, 본 발명의 입자는 2000 나노미터(nm) 미만의 최대 치수를 갖는다. 일부 실시양태에서, 본 발명의 입자는 1000 나노미터(nm) 미만의 최대 치수를 갖는다. 일부 실시양태에서, 본 발명의 입자는 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 200 nm, 또는 100 nm 미만의 최대 치수를 갖는다. 전형적으로, 본 발명의 입자는 500 nm 이하의 최대 치수(예를 들어, 직경)를 갖는다. 일부 실시양태에서, 본 발명의 입자는 250 nm 이하의 최대 치수(예를 들어, 직경)를 갖는다. 일부 실시양태에서, 본 발명의 입자는 200 nm 이하의 최대 치수(예를 들어, 직경)를 갖는다. 일부 실시양태에서, 본 발명의 입자는 150 nm 이하의 최대 치수(예를 들어, 직경)를 갖는다. 일부 실시양태에서, 본 발명의 입자는 100 nm 이하의 최대 치수(예를 들어, 직경)를 갖는다. 예를 들어, 50nm 이하의 최대 치수를 갖는 더 작은 입자는 본 발명의 일부 실시양태에 사용된다. 일부 실시양태에서, 본 발명의 입자는 25 nm 내지 200 nm 범위의 최대 치수를 갖는다.

입자 특성화(예를 들어, 형태, 치수 등의 특성화 포함)는 다양한 여러 기술을 사용하여 수행한다. 일반적인 기술로는 전자 현미경(TEM, SEM), 원자력 현미경(AFM), 동적 광산란(DLS), X선 광전자 분광법(XPS), 분말 X선 회절(XRD), 푸리에 변환 적외선 분광법(FTIR), 매트릭스-보조 레이저 탈착/이온화 비행 시간 질량 분석법(MALDI-TOF), 자외선-가시광선 분광법, 이중 편광 간섭계 및 핵자기 공명(NMR)이다. 특성화(치수 측정)는 순수 입자(즉, 로딩전)에 대해 또는 화물(여기서 화물은 하나 이상의 RNA 및/또는 이를 암호화하는 벡터를 지칭하며, 추가 구성요소, 운반체 및/또는 부형제를 포함할 수 있음) 로딩 후에 이루어져 본 발명의 임의의 시험관내, 생체외 및/또는 생체내 적용을 위한 전달에 최적 크기의 입자를 제공할 수 있다. 특정한 바람직한 실시양태에서, 입자 치수(예를 들어, 직경) 특성화는 동적 레이저 산란(DLS)을 사용한 측정에 기초한다.

본 발명의 범위 내의 입자 전달 시스템은 고체, 반고체, 에멀젼 또는 콜로이드성 입자를 포함하지만, 이에 제한되지 않는 임의의 형태로 제공될 수 있다. 예를 들어, 지질 기반 시스템, 리포솜, 미셀, 미세소포, 엑소솜 또는 유전자 총을 포함하지만 이에 제한되지 않는 본원에 기술된 임의의 전달 시스템은 본 발명의 범위 내에서 입자 전달 시스템으로서 제공될 수 있다.

본 발명의 측면에서, 시스템의 하나 이상의 구성요소는 나노입자 또는 지질 엔벨로프를 사용하여 전달되는 것이 바람직하다. CRISPR 효소 mRNA 및 가이드 RNA는 나노입자 또는 지질 엔벨로프를 사용하여 동시에 전달할 수 있다. 다른 전달 시스템 또는 벡터는 본 발명의 나노입자 측면과 함께 사용될 수 있다.

일반적으로, "나노입자"는 직경이 1000 nm 미만인 임의의 입자를 지칭한다. 특정한 바람직한 실시양태에서, 본 발명의 나노입자는 500 nm 이하의 최대 치수(예를 들어, 직경)를 갖는다. 다른 바람직한 실시양태에서, 본 발명의 나노입자는 25 nm 내지 200 nm 범위의 최대 치수를 갖는다. 다른 바람직한 실시양태에서, 본 발명의 나노입자는 100 nm 이하의 최대 치수를 갖는다. 다른 바람직한 실시양태에서, 본 발명의 나노입자는 35 nm 내지 60 nm 범위의 최대 치수를 갖는다.

본 발명에 포괄되는 나노입자는 다양한 형태, 예를 들어 고체 나노입자(예를 들어, 은, 금, 철, 티타늄과 같은 금속), 비금속, 지질 기반 고체, 중합체), 나노입자의 현탁액, 또는 이의 조합으로 제공될 수 있다. 금속, 유전체, 및 반도체 나노입자는 물론 혼성 구조(예를 들어, 코어-쉘 나노입자)가 제조될 수 있다. 반도체 물질로 만들어진 나노입자는 전자 에너지 준위의 양자화가 일어날 만큼 충분히 작은 경우(전형적으로 10 nm 이하), 양자점으로 표지될 수도 있다. 이러한 나노규모 입자는 약물 운반체 또는 영상화제로서 생체의학적 적용예에 사용되며 본 발명에 유사한 목적을 위해 조정될 수 있다.

반고체 및 연질 나노입자가 제조되었으며 이는 본 발명의 범위 내이다. 반고체 성질의 프로토타입 나노입자는 리포솜이다. 다양한 유형의 리포솜 나노입자는 현재 임상적으로 항암제 및 백신 전달 시스템으로 사용되고 있다. 절반은 친수성이고 나머지 절반은 소수성인 나노입자는 야누스 입자라고 하며 에멀젼 안정화에 특히 효과적이다. 이들은 물/기름 계면에서 자가 조립될 수 있으며 고체 계면활성제로서 작용한다.

예를 들어, 문헌[Su X, Fricke J, Kavanagh D G, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun. 6; 8(3):774-87. doi: 10.1021/mp100390w. Epub 2011 Apr. 1]은 폴리(β-아미노 에스테르)(PBAE) 코어가 인지질 이중층 쉘에 의해 둘러싸인 생분해성 코어-쉘 구조의 나노입자를 기술한다. 이는 생체내 mRNA 전달을 위해 개발되었다. pH-반응성 PBAE 구성요소는 엔도솜 파괴를 촉진하기 위해 선택되었으며, 반면 지질 표면층은 다가양이온 코어의 독성을 최소화하기 위해 선택되었다. 따라서, 이들은 본 발명의 RNA를 전달하는 데 바람직하다.

한 실시양태에서, 자가 조립 생체접착성 중합체에 기초한 나노입자가 고려되며, 이는 펩타이드의 경구 전달, 펩타이드의 정맥내 전달 및 펩타이드의 비강 전달로, 모두 뇌에 적용될 수 있다. 소수성 약물의 경구 흡수 및 안구 전달과 같은 다른 실시양태도 고려된다. 분자 엔벨로프 기술은 보호되어 질병 부위로 전달되는 조작된 중합체 엔벨로프를 수반한다(예를 들어, Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026; Siew, A., et al. Mol Pharm, 2012. 9(1):14-28; Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36; Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80; Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74; Garrett, N. L., et al. J Biophotonics, 2012. 5(5-6):458-68; Garrett, N. L., et al. J Raman Spect, 2012. 43(5):681-688; Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33; Uchegbu, I. F. Expert Opin Drug Deliv, 2006. 3(5):629-40; Qu, X., et al. Biomacromolecules, 2006. 7(12):3452-9 및 Uchegbu, I. F., et al. Int J Pharm, 2001. 224:185-199 참조). 표적 조직에 따라 약 5 mg/kg의 용량이 단일 또는 다중 용량으로 고려된다.

한 실시양태에서, MIT의 Dan Anderson 연구실에서 개발한 종양 성장을 막기 위해 RNA를 암 세포로 전달할 수 있는 나노입자는 본 발명의 CRISPR Cas 시스템에 사용될 수 있고/있거나 조정될 수 있다. 특히 Anderson 연구실은 새로운 생체재료와 나노제형의 합성, 정제, 특성화 및 제형화를 위한 완전 자동화된 조합 시스템을 개발했다. 예를 들어, 문헌[Alabi et al., Proc Natl Acad Sci USA. 2013 Aug. 6; 110(32):12881-6; Zhang et al., Adv Mater. 2013 Sep. 6; 25(33):4641-5; Jiang et al., Nano Lett. 2013 Mar. 13; 13(3):1059-64; Karagiannis et al., ACS Nano. 2012 Oct. 23; 6(10):8484-7; Whitehead et al., ACS Nano. 2012 Aug. 28; 6(8):6922-9 및 Lee et al., Nat Nanotechnol. 2012 Jun. 3; 7(6):389-93]을 참조한다.

미국 특허 출원 제20110293703호는 본 발명의 CRISPR Cas 시스템을 전달하기 위해 적용될 수 있는 폴리뉴클레오타이드의 투여에도 특히 유용한 지질유사체(lipidoid) 화합물에 관한 것이다. 한 측면에서, 아미노알코올 지질유사체 화합물은 세포 또는 대상체에게 전달될 제제와 조합되어 마이크로입자, 나노입자, 리포솜 또는 미셀을 형성한다. 입자, 리포솜 또는 미셀에 의해 전달되는 제제는 기체, 액체 또는 고체의 형태일 수 있고, 제제는 폴리뉴클레오타이드, 단백질, 펩타이드 또는 소분자일 수 있다. 아미노알코올 지질유사체 화합물은 다른 아미노알코올 지질유사체 화합물, 중합체(합성 또는 천연), 계면활성제, 콜레스테롤, 탄수화물, 단백질, 지질 등과 조합되어 입자를 형성할 수 있다. 이어서 이들 입자는 선택적으로 약제학적 부형제와 조합되어 약제학적 조성물을 형성할 수 있다.

미국 특허 공개 제0110293703호는 또한 아미노알코올 지질유사체 화합물을 제조하는 방법을 제공한다. 본 발명의 아미노알코올 지질유사체 화합물을 형성하기 위해 적합한 조건 하에 1당량 이상의 아민을 1당량 이상의 에폭사이드-종결 화합물과 반응시킨다. 특정 실시양태에서, 아민의 모든 아미노 기는 에폭사이드-종결 화합물과 완전히 반응하여 3차 아민을 형성한다. 다른 실시양태에서, 아민의 모든 아미노 기는 3차 아민을 형성하기 위해 에폭사이드-종결 화합물과 완전히 반응하지 않아 아미노알코올 지질유사체 화합물에 1차 또는 2차 아민을 초래한다. 이러한 1차 또는 2차 아민은 그대로 남아 있거나, 또는 상이한 에폭사이드 종결 화합물과 같은 또 다른 친전자체와 반응할 수 있다. 관련 기술분야의 기술자가 이해하는 바와 같이, 과량 미만의 에폭사이드-종결 화합물과 아민을 반응시키면 다양한 수의 꼬리를 갖는 복수의 상이한 아미노알코올 지질유사체 화합물이 초래될 것이다. 특정 아민은 2개의 에폭사이드 유래 화합물 꼬리에 의해 완전히 작용기화될 수 있는 반면, 다른 분자는 에폭사이드 유래 화합물 꼬리에 의해 완전히 작용기화되지 않을 수 있다. 예를 들어, 디아민 또는 폴리아민은 분자의 다양한 아미노 모이어티에서 떨어진 1, 2, 3 또는 4개의 에폭사이드 유래 화합물 꼬리를 포함하여 1차, 2차 및 3차 아민을 초래할 수 있다. 특정 실시양태에서, 모든 아미노 기는 완전히 작용기화되지 않는다. 특정 실시양태에서, 2개의 동일한 유형의 에폭사이드-종결 화합물이 사용된다. 다른 실시양태에서는 2개 이상의 상이한 에폭사이드-종결 화합물이 사용된다. 아미노알코올 지질유사체 화합물의 합성은 용매의 존재 또는 부재 하에 수행되며, 합성은 30 내지 100℃, 바람직하게는 약 50 내지 90℃ 범위의 더 높은 온도에서 수행될 수 있다. 제조된 아미노알코올 지질유사체 화합물은 선택적으로 정제될 수 있다. 예를 들어, 아미노알코올 지질유사체 화합물의 혼합물은 정제되어 특정한 수의 에폭사이드-유래 화합물 꼬리를 갖는 아미노알코올 지질유사체 화합물을 산출할 수 있다. 또는 혼합물은 정제되어 특정 입체이성질체 또는 위치이성질체를 산출할 수도 있다. 아미노알코올 지질유사체 화합물은 또한 알킬 할라이드(예를 들어, 요오드화 메틸) 또는 또 다른 알킬화제를 사용하여 알킬화될 수 있고/있거나 아실화될 수 있다.

미국 특허 공개 제0110293703호는 또한 본 발명의 방법에 의해 제조된 아미노알코올 지질유사체 화합물의 라이브러리를 제공한다. 이들 아미노알코올 지질유사체 화합물은 액체 취급기, 로봇, 미량역가 평판, 컴퓨터 등을 수반하는 고처리량 기술을 사용하여 제조 및/또는 스크리닝될 수 있다. 특정 실시양태에서, 아미노알코올 지질유사체 화합물은 폴리뉴클레오타이드 또는 다른 제제(예를 들어, 단백질, 펩타이드, 소분자)를 세포에 형질감염시키는 능력에 대해 스크리닝된다.

미국 특허 공개 제20130302401호는 조합 중합을 사용하여 제조된 폴리(베타-아미노 알코올)(PBAA) 부류에 관한 것이다. 본 발명의 PBAA는 코팅(예컨대, 의료 장치 또는 임플란트용 필름 또는 다층 필름의 코팅), 첨가제, 재료, 부형제, 비-생물오염제, 미세패턴화제 및 세포 캡슐화제로서 생명공학 및 생체의학 적용예에 사용될 수 있다. 표면 코팅으로 사용될 때 이러한 PBAA는 이들의 화학적 구조에 따라 시험관내 및 생체내 둘 모두에서 다양한 수준의 염증을 유도해 냈다. 이 부류의 재료의 큰 화학적 다양성은 본 발명자들로 하여금 시험관 내에서 대식세포 활성화를 억제하는 중합체 코팅을 식별할 수 있도록 했다. 더욱이, 이러한 코팅은 카르복실화 폴리스티렌 미세입자의 피하 이식 후 염증 세포의 동원을 감소시키고 섬유증을 감소시킨다. 이들 중합체는 세포 캡슐화를 위한 다가전해질 복합체 캡슐을 형성하는 데 사용될 수 있다. 본 발명은 또한 항미생물 코팅, DNA 또는 siRNA 전달 및 줄기 세포 조직 공학과 같은 많은 다른 생물학적 적용예를 가질 수 있다. 미국 특허 공개 제20130302401호의 교시는 본 발명의 시스템에 적용될 수 있다.

다른 실시양태에서, 지질 나노입자(LNP)가 고려된다. 특히, 지질 나노입자에 캡슐화된 항트랜스티레틴 소형 간섭 RNA(예를 들어 Coelho et al., N Engl J Med 2013; 369:819-29 참조)는 본 발명의 시스템에 적용될 수 있다. 정맥내로 투여되는 체중 1kg당 약 0.01 내지 약 1 mg의 용량이 고려된다. 주입 관련 반응의 위험을 감소시키는 약물, 예컨대 덱사메타손, 아세트암피노펜, 디펜히드라민 또는 세티리진, 및 라니티딘이 고려된다. 5회 용량에 대해 4주마다 킬로그램당 약 0.3 mg의 다중 용량도 고려된다. 지질로는 DLin-KC2-DMA4, C12-200을 포함하지만, 이에 제한되지 않고, 공동지질인 디스테로일포스파티딜 콜린, 콜레스테롤 및 PEG-DMG는 자발적인 소포 형성 절차를 사용하는 siRNA 대신 RNA를 제형화할 수 있다(예를 들어, Novobrantseva, Molecular Therapy ― Nucleic Acids(2012) 1, e4; doi:10.1038/mtna.2011.3). 구성요소의 몰 비는 약 50/10/38.5/1.5(DLin-KC2-DMA 또는 C12-200/디스테로일포스파티딜 콜린/콜레스테롤/PEG-DMG)일 수 있다. 최종 지질:siRNA 중량비는 각각 DLin-KC2-DMA 및 C12-200 지질 나노입자(LNP)의 경우에 약 12:1 및 9:1일 수 있다. 제형은 >90% 포착(entrapment) 효율을 갖는 약 80 nm의 평균 입자 직경을 가질 수 있다. 3 mg/kg 용량이 고려될 수 있다.

LNP는 siRNA를 간에 전달하는 데 매우 효과적인 것으로 밝혀져 있고(예를 들어, Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470 참조), 따라서 CRISPR Cas를 간에 전달하는 데 있어서 고려된다. 2주마다 6 mg/kg의 LNP(또는 CRISPR-Cas의 RNA)의 약 4회 용량의 투여량이 고려될 수 있다. Tabernero 등은 0.7 mg/kg으로 투여된 LNP의 처음 2주기 후에 종양 퇴행이 관찰되었으며, 6주기가 끝날 무렵에 환자는 림프절 전이의 완전한 퇴행 및 간 종양의 실질적인 수축과 함께 부분 반응을 달성했음을 입증했다. 완전한 반응은 이 환자에서 40회 투여 후 수득되었고, 이 환자는 26개월에 걸쳐 투여받은 후 관해를 유지했고 치료를 완료했다. VEGF 경로 억제제에 의한 이전 치료 후 진행성이었던 신장, 폐, 및 림프절을 포함하는 RCC 및 간외 질병 부위를 가진 2명의 환자는 약 8 내지 12개월 동안 모든 부위에서 안정적인 질병을 보였으며, PNET 및 간 전이가 있는 환자는 안정적인 질병을 가지면서 18개월 동안(36회 용량) 연장 연구를 계속했다.

그러나, LNP의 하전이 고려되어야 한다. 양이온성 지질은 음하전된 지질과 조합되어, 세포내 전달을 용이하게 하는 비이중층 구조를 유도한다. 하전된 LNP는 정맥 주사 후 순환으로부터 빠르게 제거되기 때문에 pKa 값이 7 미만인 이온화 가능한 양이온성 지질이 개발되었다(예를 들어 Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, 2011년 12월 참조). siRNA 올리고뉴클레오타이드와 같은 음하전된 중합체는 이온화 가능한 지질이 양전하를 나타내는 낮은 pH 값(예를 들어, pH 4)에서 LNP에 로딩될 수 있다. 그러나 생리학적 pH 값에서 LNP는 더 긴 순환 시간에 적합한 낮은 표면 전하를 나타낸다. 이온화 가능한 양이온성 지질의 4가지 종, 즉 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시-케토-N,N-디메틸-3-아미노프로판(DLinKDMA) 및 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA)에 초점이 맞춰졌다. 이러한 지질을 함유한 LNP siRNA 시스템은 생체내 간세포에서 현저하게 상이한 유전자 침묵 특성을 나타내어, 인자 VII 유전자 침묵 모델을 사용한 DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP 시리즈에 따라 효력이 달라진다는 것을 보여주었다(예를 들어, Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, 2011년 12월). 1μg/ml 수준의 투여량이 특히 DLinKC2-DMA를 함유하는 제형의 경우에 고려될 수 있다. LNP의 제조 및 CRISPR Cas 캡슐화의 제조는 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, 2011년 12월]으로부터 사용되고/되거나 조정될 수 있다. 양이온성 지질인 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시케토-N,N-디메틸-3-아미노프로판 (DLinK-DMA), 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA), (3-o-[2"-(메톡시폴리에틸렌글리콜 2000) 숙시노일]-1,2-디미리스토일-sn-글리콜(PEG-S-DMG) 및 R-3-[(w-메톡시-폴리(에틸렌 글리콜)2000) 카르바모일]-1,2-디미리스틸옥시프로필-3-아민(PEG-C-DOMG)은 Tekmira Pharmaceuticals(캐나다 밴쿠버)에서 제공되거나 합성될 수 있다. 콜레스테롤은 Sigma(미주리주 세인트루이스)에서 구입할 수 있다. 특정 CRISPR Cas RNA는 DLinDAP, DLinDMA, DLinK-DMA 및 DLinKC2-DMA(40:10:40:10 몰비의 양이온성 지질:DSPC:CHOL:PEGS-DMG 또는 PEG-C-DOMG)를 함유하는 LNP에서 캡슐화될 수 있다. 필요한 경우 0.2% SP-DiOC18(Invitrogen, 캐나다 버링턴)은 세포 흡수, 세포내 전달, 및 생체분포를 평가하기 위해 혼입될 수 있다. 캡슐화는 양이온성 지질:DSPC:콜레스테롤:PEG-c-DOMG(40:10:40:10 몰비)로 구성된 지질 혼합물을 에탄올에 10 mmol/l의 최종 지질 농도로 용해시켜 수행될 수 있다. 이러한 지질의 에탄올 용액은 50 mmol/l 구연산염, pH 4.0에 적가하여 30% 에탄올 vol/vol의 최종 농도를 생성하는 다중층 소포를 형성할 수 있다. 다중층 소포를 압출기(Northern Lipids, 캐나다 밴쿠버)를 사용하여 2개의 적층된 80nm Nuclepore 폴리카보네이트 필터를 통해 압출시킨 후에는 큰 단일층 소포가 형성될 수 있다. 캡슐화는 압출된 예비성형된 큰 단층 소포에, 30% 에탄올 vol/vol을 함유하는 50 mmol/1 구연산염, pH 4.0에 2 mg/ml로 용해된 RNA를 적가하고 0.06/1 wt/wt의 최종 RNA/지질 중량비로 일정하게 혼합하면서 31℃에서 30분간 인큐베이션하여 달성할 수 있다. 에탄올의 제거 및 제형 완충액의 중화는 Spectra/Por 2 재생 셀룰로오스 투석막을 사용하여 인산염 완충 식염수(PBS), pH 7.4에 대해 16시간 동안 투석하여 수행했다. 나노입자 크기 분포는 NICOMP 370 입자 크기 측정기, 소포/강도 모드 및 가우스 피팅(Nicomp Particle Sizing, 캘리포니아주 산타바바라)을 사용하여 동적 광산란에 의해 결정될 수 있다. 3개 LNP 시스템 모두에 대한 입자 크기는 직경이 약 70nm일 수 있다. siRNA 캡슐화 효율은 투석 전후에 수집된 샘플에서 VivaPureD MiniH 컬럼(Sartorius Stedim Biotech)을 사용하여 유리 siRNA를 제거하여 결정할 수 있다. 캡슐화된 RNA는 용출된 나노입자로부터 추출되어 260nm에서 정량화될 수 있다. siRNA 대 지질 비율은 Wako Chemicals USA(버지니아주 리치몬드)로부터의 콜레스테롤 E 효소 검정을 사용하여 소포내 콜레스테롤 함량을 측정함으로써 결정했다. PEG화된 리포솜(또는 LNP)도 전달에 사용될 수 있다.

큰 LNP의 제조는 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, 2011년 12월]으로부터 사용되고/되거나 조정될 수 있다. 지질 예비혼합 용액(20.4 mg/ml 총 지질 농도)은 50:10:38.5 몰비로 DLinKC2-DMA, DSPC 및 콜레스테롤을 함유하는 에탄올에서 제조될 수 있다. 아세트산나트륨은 0.75:1(아세트산나트륨:DLinKC2-DMA)의 몰비로 지질 예비혼합물에 첨가될 수 있다. 이어서 격렬하게 교반하면서 1.85 부피의 구연산염 완충액(10mmol/1, pH 3.0)과 혼합물을 조합함으로써 지질을 수화시켜 35% 에탄올을 함유하는 수성 완충액에서 자발적인 리포솜 형성을 초래할 수 있다. 리포솜 용액은 37℃에서 인큐베이션하여 입자 크기를 시간 의존적으로 증가시킬 수 있다. 동적 광산란(Zetasizer Nano ZS, Malvern Instruments, 영국 워세스터셔)에 의한 리포솜 크기의 변화를 조사하기 위해 인큐베이션 동안 다양한 시간에 분액을 제거할 수 있다. 원하는 입자 크기가 달성되면, 수성 PEG 지질 용액(스톡 = 35%(vol/vol) 에탄올 중 10 mg/ml PEG-DMG)을 리포솜 혼합물에 첨가하여 총 지질이 3.5%인 최종 PEG 몰 농도를 산출할 수 있다. PEG-지질을 첨가하는 즉시, 리포솜은 크기를 재서 추가 성장을 효과적으로 정지시킬 수 있다. 그 다음, RNA는 약 1:10(wt:wt)의 siRNA 대 총 지질 비율로 빈 리포솜에 첨가될 수 있고, 이어서 37℃에서 30분 동안 인큐베이션하여 로딩된 LNP를 형성할 수 있다. 이어서 혼합물은 PBS에서 밤새 투석하고 0.45 μm 주사기 필터로 여과할 수 있다.

구형 핵산(SNA™) 작제물 및 다른 나노입자(특히 금 나노입자)도 CRISPR/Cas 시스템을 의도된 표적에 전달하기 위한 수단으로 고려된다. 유의미한 데이터는 핵산 작용기화된 금 나노입자를 기반으로 하는 AuraSense Therapeutics의 구형 핵산(SNA™) 작제물이 다음과 같은 다수의 주요 성공 인자를 기반으로 한 대체 플랫폼보다 우수하다는 것을 보여준다:

높은 생체내 안정성. 조밀한 로딩으로 인해 대부분의 화물(DNA 또는 siRNA)이 세포 내에서 작제물에 결합된 상태를 유지하여 핵산 안정성 및 효소 분해에 대한 저항성을 부여한다.

전달성. 연구된 모든 세포 유형(예: 뉴런, 종양 세포주 등)에 대해, 작제물은 운반체 또는 형질감염 제제를 필요로 함이 없이 99%의 형질감염 효율을 입증한다.

치료 표적화. 작제물의 고유의 표적 결합 친화성 및 특이성은 일치된 표적 서열에 대한 강렬한 특이성을 허용한다(즉, 제한된 표적외 효과).

우수한 효능. 작제물은 주된 기존의 형질감염 시약(리포펙타민 2000 및 사이토펙틴)을 능가한다.

낮은 독성. 작제물은 다양한 배양된 세포, 1차 세포 및 조직에 명백한 독성 없이 유입될 수 있다.

유의미하지 않은 면역 반응. 작제물은 전체-게놈 마이크로어레이 연구 및 사이토카인-특이적 단백질 검정으로 측정했을 때 전반적인 유전자 발현의 최소 변화를 이끌어낸다.

화학적 맞춤가능성. 단일 또는 조합 제제(예를 들어, 단백질, 펩타이드, 소분자)의 임의의 수가 사용되어 작제물의 표면을 맞춤제작할 수 있다.

핵산 기반의 치료제에 대한 이러한 플랫폼은 염증 및 감염성 질병, 암, 피부 장애 및 심혈관 질병을 포함하는 다수의 질병 상태에 적용 가능할 수 있다.

인용할 수 있는 문헌으로는 다음을 포함한다: Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257, Hao et al., Small. 2011 7:3158-3162, Zhang et al., ACS Nano. 2011 5:6962-6970, Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391, Young et al., Nano Lett. 2012 12:3867-71, Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80, Mirkin, Nanomedicine 2012 7:635-638 Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691, Weintraub, Nature 2013 495:S14-S16, Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630, Jensen et al., Sci. Transl. Med. 5, 209ra152 (2013) 및 Mirkin, et al., Small, doi.org/10.1002/smll.201302143.

siRNA를 포함하는 자가-조립성 나노입자는, 예를 들어 인테그린을 발현하는 종양 신생혈관구조를 표적화하는 수단으로서, 폴리에틸렌 글리콜(PEG)의 원위 말단에 부착된 Arg-Gly-Asp(RGD) 펩타이드 리간드에 의해 PEG화된 폴리에틸렌이민(PEI)을 사용하여 작제되고, 혈관 내피 성장 인자 수용체-2(VEGF R2) 발현을 억제하여 종양 혈관신생을 억제하는 siRNA를 전달하는 데 사용될 수 있다(예를 들어, Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19 참조). 나노플렉스는 2 내지 6 범위 이상으로 인산염(핵산)에 대한 이온화 가능한 질소(중합체)의 순 몰 과량을 제공하도록 동일한 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조될 수 있다. 양이온성 중합체와 핵산 사이의 정전기적 상호작용은 평균 입자 크기 분포가 약 100 nm인 폴리플렉스의 형성을 초래했으며, 따라서 여기서는 나노플렉스라고 지칭된다. Schiffelers 등의 자가-조립성 나노입자로의 전달에서는 약 100 내지 200mg의 CRISPR Cas 투여량이 예상된다.

Bartlett 등(PNAS, 2007년 9월 25일, vol. 104, no. 39)의 나노플렉스도 본 발명에 적용될 수 있다. Bartlett 등의 나노플렉스는 2 내지 6 범위 이상으로 인산염(핵산)에 대한 이온화 가능한 질소(중합체)의 순 몰 과량을 제공하도록 동일한 부피의 양이온성 중합체 및 핵산의 수용액을 혼합하여 제조한다. 양이온성 중합체와 핵산 사이의 정전기적 상호작용은 평균 입자 크기 분포가 약 100 nm인 폴리플렉스의 형성을 초래했으며, 따라서 여기서는 나노플렉스라고 지칭된다. Bartlett 등의 DOTA-siRNA는 다음과 같이 합성했다: 1,4,7,10-테트라아자사이클로도데칸-1,4,7,10-테트라아세트산 모노(N-하이드록시숙신이미드 에스테르)(DOTA-NHS에스테르)는 Macrocyclics(텍사스 달라스)에서 주문했다. 탄산염 완충액(pH 9) 중 100배 몰 과량의 DOTA-NHS-에스테르와 함께 아민 변형된 RNA 센스 가닥을 미세원심분리 튜브에 첨가했다. 내용물을 실온에서 4시간 동안 교반하여 반응시켰다. DOTA-RNAsense 접합체를 에탄올 침전시키고, 물에 재현탁시키고, 변형되지 않은 안티센스 가닥에 어닐링하여 DOTA-siRNA를 산출했다. 모든 액체는 Chelex-100(Bio-Rad, 캘리노니아주 허큘레스)으로 전처리하여 미량 금속 오염물을 제거했다. Tf-표적화 및 비표적화된 siRNA 나노입자는 사이클로덱스트린 함유 다가양이온을 사용하여 형성시킬 수 있다. 전형적으로, 나노입자는 3(+/-)의 전하 비율의 물 및 0.5 g/리터의 siRNA 농도에서 형성되었다. 표적화된 나노입자 표면에 1 퍼센트의 아다만탄-PEG 분자는 Tf(아다만탄-PEG-Tf)를 이용하여 변형시켰다. 나노입자는 주사용 5%(wt/vol) 글루코스 운반체 용액에 현탁시켰다.

Davis 등(Nature, Vol 464, 2010년 4월 15일)은 표적화된 나노입자 전달 시스템을 사용하는 siRNA 임상 시험(임상 시험 등록 번호 NCT00689065)을 수행한다. 표준 치료법에 불응성인 고형암 환자에게 30분 정맥내 주입을 통해, 21일 주기 중 1일, 3일, 8일, 및 10일째에 표적화된 나노입자의 용량을 투여한다. 나노입자는 다음을 함유하는 합성 전달 시스템으로 이루어진다: (1) 선형, 사이클로덱스트린 기반 중합체(CDP), (2) 암 세포 표면 상의 TF 수용체(TFR)와 체결하기 위해 나노입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드, (3) 친수성 중합체(생물학적 유체에서 나노입자 안정성을 촉진하기 위해 사용된 폴리에틸렌 글리콜(PEG)), 및 (4) RRM2의 발현을 감소시키도록 설계된 siRNA(진료소에서 사용된 서열은 이전에는 siR2B+5로 표기된 것임). TFR은 악성 세포에서 상향조절되는 것으로 오랫동안 알려져 왔으며 RRM2는 확립된 항암 표적이다. 이러한 나노입자(CALAA-01로 표시되는 임상 버전)는 인간이 아닌 영장류를 대상으로 한 다중 투약 연구에서 내약성이 우수한 것으로 밝혀졌다. 만성 골수성 백혈병 환자 1명에게 리포솜 전달을 통해 siRNA가 투여되었지만, Davis 등의 임상 시험은 표적 전달 시스템을 사용하여 siRNA를 전신으로 전달하고 고형암 환자를 치료하기 위한 최초의 인간 시험이다. 표적 전달 시스템이 기능성 siRNA를 인간 종양에 효과적으로 전달할 수 있는지를 확인하기 위해 Davis 등은 3개의 상이한 투약 코호트에 속한 3명의 환자로부터 생검을 조사했다; 환자 A, B, 및 C는 모두 전이성 흑색종을 앓고 있었고, 각각 18, 24, 및 30 mg m^-2 siRNA의 CALAA-01 용량을 투여받았다. 본 발명의 CRISPR Cas 시스템에서도 유사한 용량이 고려될 수 있다. 본 발명의 전달은 선형의 사이클로덱스트린 기반 중합체(CDP), 암세포 표면 상의 TF 수용체(TFR)를 체결시키기 위해 나노입자의 표면에서 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드 및/또는 친수성 중합체(예를 들어, 생물학적 유체에서 나노입자 안정성을 촉진하기 위해 사용된 폴리에틸렌 글리콜(PEG))를 함유하는 나노입자에 의해 달성될 수 있다.

본 발명에 따른 전달 또는 투여는 리포솜을 사용하여 수행될 수 있다. 리포솜은 내부 수성 구획을 둘러싸는 단층 또는 다층 지질 이중층 및 상대적으로 불침투성인 외부 친유성 인지질 이중층으로 구성된 구형 소포 구조이다. 리포솜은 생체적합성, 비독성, 친수성이고, 친지성 약물 분자 모두를 전달할 수 있고, 혈장 효소에 의한 분해로부터 화물을 보호하고, 생물학적 막 및 혈액 뇌 장벽(BBB)에 걸쳐 부하량을 수송하기 때문에 약물 전달 운반체로서 상당한 주목을 받았다(예를 들어, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679를 검토용으로 참조함).

리포솜은 몇몇 다른 유형의 지질로부터 만들어질 수 있다; 그러나, 인지질은 약물 운반체로서 리포솜을 생성하는 데 가장 일반적으로 사용된다. 리포솜 형성은 지질 필름이 수용액과 혼합될 때 자발적이지만, 균질화기, 초음파 처리기 또는 압출 장치의 사용에 의해 진탕 형태로 힘을 가함으로써 촉진될 수도 있다(예를 들어 Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679를 검토용으로 참조함).

리포솜의 구조 및 특성을 변형시키기 위해 몇몇 다른 첨가제가 리포솜에 첨가될 수 있다. 예를 들어, 리포솜 구조를 안정화하고 리포솜 내부 화물의 누출을 방지하기 위해 콜레스테롤 또는 스핑고미엘린을 리포솜 혼합물에 첨가할 수 있다. 또한, 수소화된 계란 포스파티딜콜린 또는 계란 포스파티딜콜린, 콜레스테롤, 디세틸 포스페이트로부터 리포솜이 제조되며, 이들의 평균 소포 크기는 약 50 및 100 nm로 조정되었다. (예를 들어, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679를 검토용으로 참조함).

통상적인 리포솜 제형은 주로 천연 인지질 및 지질, 예컨대 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 계란 포스파티딜콜린 및 모노시알로강글리오사이드로 구성된다. 이 제형은 인지질로만 구성되기 때문에, 리포솜 제형은 많은 문제에 직면했고, 그 중 하나는 혈장에서의 불안정성이다. 이러한 문제를 극복하기 위해 몇몇 시도가 이루어졌고, 특히 지질막의 조작에서 이루어졌다. 이러한 시도 중 하나는 콜레스테롤 조작에 중점을 두었다. 통상적인 제형에 대한 콜레스테롤의 첨가는 혈장 내로 캡슐화된 생체활성 화합물의 빠른 방출을 감소시키거나, 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다(예를 들어, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679를 검토용으로 참조함).

특히 유리한 실시양태에서, 트로이 목마 리포솜(분자 트로이 목마로도 알려져 있음)이 바람직하며 프로토콜은 cshprotocols.cshlp.org/content/2010/4/pdb.prot 5407.long에서 찾아볼 수 있다. 이러한 입자는 혈관내 주사 후 뇌 전체로 전이유전자의 전달을 허용한다. 제한에 의해 얽매임이 없이, 특정 항체가 표면에 접합되어 있는 중성 지질 입자는 세포내이입을 통해 혈액 뇌 장벽을 통과할 수 있는 것으로 여겨진다. 출원인은 CRISPR 계열의 뉴클레아제를 혈관내 주사를 통해 뇌에 전달하기 위해 트로이 목마 리포솜을 활용할 것으로 가정하고, 이는 배아 조작의 필요 없이 전체 뇌 트랜스제닉 동물을 가능하게 할 것이다. 약 1-5 g의 핵산 분자, 예를 들어 DNA, RNA가 리포솜에서 생체내 투여를 위해 고려될 수 있다.

다른 실시양태에서, 시스템은 안정한 핵산-지질 입자(SNALP)와 같은 리포솜에서 투여될 수 있다(예를 들어, Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005 참조). SNALP에서 표적화된 특정 CRISPR Cas의 약 1, 3 또는 5mg/kg/일의 매일 정맥내 주사가 고려된다. 매일 치료는 약 3일 이상일 수 있고, 이후에는 약 5주 동안 매주 이루어질 수 있다. 또 다른 실시양태에서, abpit 1 또는 2.5 mg/kg의 용량으로 정맥 주사에 의해 투여되는 특정 CRISPR Cas 캡슐화된 SNALP도 고려된다(예를 들어, Zimmerman et al., Nature Letters, Vol. 441, 2006년 5월 4일 참조). SNALP 제형은 지질 3-N-[(메톡시폴리(에틸렌 글리콜) 2000) 카르바모일]-1,2-디미리스틸옥시-프로필아민(PEG-C-DMA), 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판(DLinDMA), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC) 및 콜레스테롤을 2:40:10:48 몰% 비율로 함유할 수 있다(예를 들어, Zimmerman et al., Nature Letters, Vol. 441, 2006년 5월 4일 참조).

또 다른 실시양태에서, 안정한 핵산 지질 입자(SNALP)는 고도로 혈관화된 HepG2 유래 간 종양에 대한 효과적인 전달 분자인 것으로 입증되었지만, 혈관화가 약한 HCT-116 유래 간 종양에는 그렇지 못한 것으로 입증되었다(예를 들어 Li, Gene Therapy(2012) 19, 775-780). SNALP 리포솜은 25:1 지질/siRNA 비율 및 48/40/10/2 몰 비율의 콜레스테롤/D-Lin-DMA/DSPC/PEG-C-DMA를 사용하여 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및 siRNA와 함께 D-Lin-DMA 및 PEG-C-DMA를 제형화함으로써 제조될 수 있다. 생성된 SNALP 리포솜은 크기가 약 80-100 nm이다.

또 다른 실시양태에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich, 미국 미주리주 세인트루이스), 디팔미토일포스파티딜콜린(Avanti Polar Lipids, 미국 앨라배마주 앨라배스터), 3-N-[(w-메톡시 폴리(에틸렌 글리콜)2000)카르바모일]-1,2-디미레스틸옥시프로필아민, 및 양이온성 1,2-디리놀레일옥시-3-N,N디메틸아미노프로판(예를 들어, Geisbert et al., Lancet 2010; 375: 1896-905 참조)을 포함할 수 있다. 예를 들어, 볼루스 정맥내 주입으로 투여되는 용량당 약 2 mg/kg 총 CRISPR Cas의 투여량이 고려될 수 있다.

또 다른 실시양태에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC; Avanti Polar Lipids Inc.), PEG-cDMA 및 1,2-디리놀레일옥시-3-(N,N-디메틸)아미노프로판(DLinDMA)(예를 들어, 문헌[Judge, J. Clin. Invest. 119:661-673 (2009)] 참조)을 포함할 수 있다. 생체내 연구에 사용되는 제형은 약 9:1의 최종 지질/RNA 질량비를 포함할 수 있다.

아미노 지질 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(DLin-KC2-DMA)과 같은 다른 양이온성 지질은 SiRNA와 유사한 CRISPR Cas를 캡슐화하는 데 활용될 수 있다(예를 들어, Jayaraman, Angew.Chem.Int.Ed.2012, 51, 8529-8533). 다음과 같은 지질 조성을 갖는 사전성형된 소포가 고려될 수 있다: 아미노 지질, 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및 (R)-2,3-비스(옥타데실옥시) 프로필-1-(메톡시 폴리(에틸렌 글리콜)2000)프로필카바메이트(PEG-지질) 각각 40/10/40/10의 몰 비율 및 약 0.05(w/w)의 FVII siRNA/총 지질 비율. 70-90 nm 범위의 좁은 입자 크기 분포 및 0.11_0.04(n=56)의 낮은 다분산 지수를 보장하기 위해, 입자는 CRISPR Cas RNA를 첨가하기 전에 80 nm 멤브레인을 통해 최대 3회 압출될 수 있다. 매우 강력한 아미노 지질 16을 함유하는 입자가 사용될 수 있으며, 여기서 4가지 지질 성분 16, DSPC, 콜레스테롤 및 PEG-지질(50/10/38.5/1.5)의 몰비는 생체내 활성을 향상시키기 위해 추가로 최적화될 수 있다.

관련 기술분야에 알려진 임의의 적합한 CRISPR/Cas 유전자 편집 시스템의 임의의 요소는 적절한 경우, 본원에 기술된 시스템 및 방법에 사용될 수 있다. CRISPR/Cas 유전자 편집 기술은, 예를 들어 미국 특허 출원 공개 제2014/0068797호; 미국 특허 제8,697,359호; 제8,771,945호; 및 제8,945,839호; US2010/0076057; US2011/0189776; US2011/0223638; US2013/0130248; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US20150050699; US20150045546; US20150031134; US20150024500; US20140377868; US20140357530; US20140349400; US20140335620; US20140335063; US20140315985; US20140310830; US20140310828; US20140309487; US20140304853; US20140298547; US20140295556; US20140294773; US20140287938; US20140273234; US20140273232; US20140273231; US20140273230; US20140271987; US20140256046; US20140248702; US20140242702; US20140242700; US20140242699; US20140242664; US20140234972; US20140227787; US20140212869; US20140201857; US20140199767; US20140189896; US20140186958; US20140186919; US20140186843; US20140179770; US20140179006; 및 US20140170753에 상세하게 기술되어 있고, 이들은 본원에 참고로 포함된다.

본 발명 및 이의 장점이 상세하게 기술되었지만, 첨부된 청구범위에 정의된 본 발명의 사상 및 범위를 벗어나지 않는 다양한 변화, 치환 및 변경이 본원에서 이루어질 수 있음이 이해되어야 한다.

본 발명은 단지 예시 목적으로만 주어지며 어떤 방식으로든 본 발명을 제한하려는 의도가 아닌 다음 실시예에 추가로 예시될 것이다.

실시예

실시예 1 - 재료 및 방법

RecE/T 상동체 스크리닝 RefSeq 비중복 단백질 데이터베이스는 2019년 10월 29일자로 NCBI에서 다운로드 받았다. 데이터베이스는 단백질 상동체를 검색하기 위해 위치별 반복(PSI)-BLAST¹을 사용하여 질의로서 E. 콜라이 Rac 프로파지 RecT(NP_415865.1) 및 RecE(NP_415866.1)로 검색했다. 적중(hit)은 CD-HIT2에 의해 클러스터링되었고, MUSCLE³과의 다중 정렬 동안 각 클러스터로부터 대표 서열이 선택되었다. 그런 다음, 디폴트 매개변수를 사용한 최대 우도 트리 재구성을 위해 FastTree4를 사용했다. 다양한 RecET 상동체 세트를 선택하고 GenScript로 합성한 후, 테스트를 위해 pMPH_MCP 벡터에 클로닝했다.

플라스미드 작제 pX330, pMPH 및 pU6-(BbsI)_CBh-Cas9-T2A-BFP 플라스미드는 Addgene에서 구입했다. 테스트된 이펙터 DNA 단편은 IDT, Genewiz 및 GenScript에서 주문했다. 단편은 NEBuilder HiFi DNA Assembly Master Mix(New England BioLabs)를 사용하여 백본에 Gibson 조립했다. 모든 sgRNA(표 1)는 Golden Gate 클로닝을 사용하여 백본에 삽입했다. 모든 작제물은 준비된 플라스미드의 Sanger 시퀀싱을 통해 서열 검증했다.

[표 1]

세포 배양 인간 배아 신장(HEK) 293T, HeLa 및 HepG2를 10% 태아 소 혈청(FBS, HyClone), 100 U/mL 페니실린 및 100 μg/mL 스트렙토마이신(Life Technologies)이 포함된 둘베코 변형 이글 배지(Dulbecco's Modified Eagle's Medium(DMEM), Life Technologies)에서 5% CO₂와 37℃에서 유지시켰다.

hES-H9 세포는 mTeSR1 배지(StemCell Technologies)에서 5% CO₂ 및 37℃에서 유지시켰다. 배양 플레이트를 사용 12시간 전에 Matrigel(Corning)로 사전 코팅하고, 계대 후 처음 24시간 동안 세포에 10 μM Y27632(Sigma)를 보충했다. 배양 배지는 24시간마다 교체했다.

형질감염 HEK293T 세포는 형질감염 12-24시간 전에 96-웰 플레이트(Corning)에 30,000개 세포/웰의 밀도로 파종하고, 웰당 250ng의 총 DNA를 형질감염시켰다. HeLa 및 HepG2 세포를 형질감염 하루 전에 48웰 플레이트(Corning)에 각각 50,000 및 30,000 세포/웰의 밀도로 파종하고, 웰당 총 DNA 400ng을 형질감염시켰다. 형질감염은 Lipofectamine 3000(Life Technologies)을 제조업체의 지침에 따라 사용하여 수행했다.

전기천공법 hES-H9 관련 형질감염 실험을 위해, P3 1차 세포 4D-NucleofectorTM X Kit S(Lonza)를 제조업체의 프로토콜에 따라 사용했다. 각 반응을 위해 DC100 Nucleofector 프로그램을 사용하여 300,000개의 세포를 총 4μg DNA로 핵감염시켰다.

형광 활성화 세포 분류(FACS) mKate 녹-인 효율성은 CytoFLEX 유세포 분석기(Beckman Coulter; Stanford Stem Cell FACS Core)에서 분석했다. 형질감염 72시간 후, 세포를 PBS로 1회 세척하고 TrypLE Express Enzyme(Thermo Fisher Scientific)으로 해리시켰다. 그런 다음 세포 현탁액을 96-웰 U-바닥 플레이트(Thermo Fisher Scientific)로 옮기고 300xG에서 5분 동안 원심분리했다. 상청액을 제거한 후, 펠릿화된 세포를 PBS 중 4% FBS 50 μl로 재현탁시키고, 세포를 제조 후 30분 이내에 분류했다.

RFLP HEK293T 세포를 플라스미드 DNA 및 PCR 주형으로 형질감염시키고 72시간 후에 QuickExtract DNA 추출 용액(Biosearch Technologies)을 제조업체의 프로토콜에 따라 사용하여 게놈 DNA를 수확했다. 표적 게놈 영역은 PCR 주형의 상동성 암 외부의 특정 프라이머를 사용하여 증폭시켰다. PCR 산물은 Monarch PCR & DNA Cleanup Kit(New England BioLabs)를 사용하여 정제했다. 정제된 산물 300ng은 BsrGI(EMX1, New England BioLabs) 또는 XbaI(VEGFA, NEB)로 분해하고, 분해된 산물은 5% Mini-PROTEAN TBE 겔(Bio-Rad)에서 분석했다.

차세대 시퀀싱 라이브러리 제조 형질감염 72시간 후, QuickExtract DNA 추출 용액(Biosearch Technologies)을 사용하여 게놈 DNA를 추출했다. NGS 라이브러리 제조에는 200ng 총 DNA를 사용했다. 관심 유전자는 제1 라운드 PCR 반응을 위해 특정 프라이머(표 2)를 사용하여 증폭시켰다. Illumina 어댑터 및 인덱스 바코드는 표 2에 나열된 프라이머를 사용하는 제2 라운드 PCR에서 단편에 첨가되었다. 라운드 2 PCR 산물은 Monarch DNA Gel Extraction Kit(NEB)를 사용하여 2% 아가로스 겔에서 겔 전기영동으로 정제했다. 정제된 산물은 Qubit dsDNA HS Assay Kit(Thermo Fisher)로 정량화하고 제조업체의 지침에 따라 Illumina MiSeq에서 시퀀싱했다.

[표 2]

고처리량 시퀀싱 데이터 분석 처리된(역다중화, 트리밍 및 병합) 시퀀싱 판독을 분석하여 시퀀싱된 앰플리콘을 기준 및 예상 HDR 앰플리콘에 정렬시켜 CRISPPresso2⁵를 사용하여 편집 결과를 결정했다. 다양한 편집 결과를 더 잘 포착하기 위해 예상 절단 부위 주변의 10bp까지 정량 창을 증가시켰지만, 시퀀싱 오류가 포함되지 않도록 하기 위해 치환은 무시했다. HDR 정량화에는 예상된 앰플리콘에 대한 불일치를 함유하지 않는 판독만을 고려했다; 예상된 앰플리콘과 부분적으로 일치하는 인델을 함유하는 판독은 보고된 전체 인델 빈도에 포함되었다.

통계 분석 달리 명시하지 않는 한, 모든 통계 분석 및 비교는 Benjamini, Krieger 및 Yekutieli(Benjamini, Y, et. al, Biometrika 93, 491-507(2006), 본원에 참고로 포함됨))의 2단계 스텝업 방법을 사용하여 1% FDR(false-discovery-rate)을 갖는 t-테스트를 사용하여 수행했다. 분석에서 충분한 통계적 검정력을 보장하기 위해 달리 명시되지 않는 한 모든 실험은 3회 반복으로 수행했다.

예측된 Cas9 표적외 부위에서의 편집 결정 알려진 Cas9 표적외 부위에서 RecT/RecE 표적외 편집 활성을 평가하기 위해, 표 2에 나열된 EMX1, VEGFA 가이드, 프라이머 서열에 대한 최고로 예측된 표적외 부위(웹 기반의 분석 도구인 예측된 CRISPOR로서 높은 득점을 가짐)를 PCR 증폭하기 위한 주형으로 사용했다.

iGUIDE 표적외 분석 게놈 전체의 비편향 표적외 분석은 이전에 발명된 Guide-seq(Tsai, S., et al. Nat Biotechnol 33, 187-197(2015), 본원에 참고로 포함됨)를 기반으로 한 iGUIDE 파이프라인(Nobles, C.L., et al. Genome Biol 20, 14 (2019), 본원에 참고로 포함됨)에 따라 수행했다. HEK293T 세포는 제조업체의 지침에 따라 프로그램 DS-150을 사용하여 Lonza Nucleofector 4-D에서 20uL Lonza SF 세포주 Nucleofector 용액에서 형질감염시켰다. 300ng의 gRNA-Cas9 플라스미드(또는 이중 니카제의 경우 각 gRNACas9n 플라스미드 150ng), 150ng의 이펙터 플라스미드 및 5pmol의 이중 가닥 올리고뉴클레오타이드(dsODN)를 형질감염시켰다. 게놈 DNA를 위해 Agencourt DNAdvance 시약 키트를 사용하여 72시간 후에 세포를 수확했다. 400ng의 정제된 gDNA는 그 다음 평균 500bp로 단편화하고 NEBNext Ultra II FS DNA Library Prep 키트를 제조업체의 지침에 따라 사용하여 어댑터와 결찰시켰다. 올리고 태그부터 결찰된 어댑터 서열까지 중첩 고정 PCR을 2 라운드 수행하여 표적 DNA를 증폭시켰고, 증폭된 라이브러리를 Illumina Miseq V2 PE300을 사용하여 정제하고, 크기-선택하고, 시퀀싱했다. 시퀀싱 데이터는 샘플에 걸쳐 비편향 비교를 보장하는 다운샘플링 단계를 추가하여 게시된 iGUIDE 파이프라인을 사용하여 분석했다.

실시예 2

포유류와 달리, 박테리아에는, 예를 들어 파지 람다 Red 및 RecE/T와 같은 편리한 리콤비니어링-편집 도구가 이용 가능하다. 미생물 리콤비니어링은 2가지 주요 단계를 갖는다: 주형 DNA는 엑소뉴클레아제(Exo)에 의해 역분해되고, 그 다음 단일 가닥 어닐링 단백질(SSAP)은 주형에 의한 상동성 유도 복구를 지원하며, 이는 선택적으로 뉴클레아제 억제제에 의해 촉진된다. RecE/T 리콤비니어링 활성의 RNA 유도 표적화를 위한 시스템이 개발되어 DNA 절단 없이 킬로베이스(kb) 인간 유전자 편집을 달성했다.

리콤비니어링 활성을 갖는 후보 미생물 시스템이 조사되었다. 2가지 추론 라인이 검색을 가이드했다: 1) 직교성: 포유류 복구 효소와 최소한의 유사성을 갖는 단백질을 우선시한다. 2) 절약성: 상호 의존적인 구성 요소가 가장 적은 시스템에 중점을 둔다. 3가지 단백질 계열이 식별되었다: 람다 레드, RecE/T, 파지 T7 gp6(Exo) 및 gp2.5(SSAP) 재조합 기구. 계통발생적 재구성에 기초하여, RecE/T 단백질은 진핵생물의 재조합 단백질과 가장 멀리 떨어져 있고 가장 소형인 것으로 결정되었다(도 1). 따라서, RecE/T 시스템은 하류 분석에 활용되었다.

NCBI 단백질 데이터베이스는 RecE/T 상동체에 대해 체계적으로 검색되었다. 휴대용 도구를 개발하기 위해 진화적 관계 및 길이를 조사했다(도 2a). 동시발생 분석은 대부분의 RecE/T 시스템이 두 단백질 중 하나만 가지고 있음을 보여주었다(도 2b). 프로파지 통합이 부정확할 수 있으므로 두 상동체를 모두 보유하는 종의 11%를 무손상 기능성에 대한 증거로서 우선시했다.

상위 12개 후보는 코돈 최적화했고 MS2 외피 단백질(MCP) 융합체는 이하 "재조합인자"라고 명명되는 이러한 RecE/T 상동체를 MS2 RNA 앱타머를 통해 야생형 스트렙토코커스 피오게네스 Cas9(wtCas9)로 동원하기 위해 작제했다. Exo 및 SSAP로서의 각각의 분자 효과를 이해하기 위해 각각을 독립적으로 테스트했다(도 2c). 초기 결과는 게놈 녹-인 검정에 의해 결정된 바와 같이, 에세리키아 콜라이 RecE/T 단백질(RecE 및 RecT로 약칭됨)이 유망한 후보임을 밝혀냈다(도 2d). RecT는 길이가 단지 269개인 아미노산(AA)이지만, RecE가 AA587(RecE_587) 및 기능적 연구를 기반으로 카르복시 말단 도메인(RecE_CTD)으로부터 절두되었다(Muyrers, J.P., Genes Dev. (2000); 14, 1971-1982, 본원에 참고로 포함됨).

인간 세포에서 RecE/T 리콤비니어링을 검증하기 위해, 상동성 유도 복구(HDR)가 2개의 주형에 의해 5개 게놈 부위에서 측정되었다. RecE 변이체(RecE_587, RecE_CTD)는 녹-인 효율성의 가변적인 증가를 보여준 반면, RecT는 EMX1 및 VEGFA에서 약 16bp 서열을 대체하고 HSP90AA1, DYNLT1, AAVS1에서 약 1kb 카세트를 녹-인시켜 모든 사례에서 HDR을 크게 향상시켰다(도 3a-e, 도 4). 이러한 결과는 영상화(도 3f)를 사용하여 검증되었고 정확한 삽입을 확인하기 위해 Sanger 시퀀싱을 사용하여 접합 부위를 시퀀싱했다(도 3g, 도 4g). 이러한 활성이 실제로 서열 특이적인지 테스트하기 위해 MS2 앱타머가 아닌 PP7 앱타머를 인식하는 PP7 외피 단백질(PCP)을 갖는 동원 없음 대조군이 사용되었다. RecE는 동원 없이 활성을 가진 반면, RecT는 동원-의존적 방식으로 효율성 증가를 나타냈다(도 3h). 이론에 얽매이지 않고, 이는 RecE 엑소뉴클레아제 활성이 불규칙하게 작용하는 것으로 설명될 수 있다(도 2c). RecE/T 리콤비니어링-편집(REDIT) 도구는 REDITv1로 명명되며, REDITv1_RecT가 바람직한 변이체이다.

실시예 3

REDITv1에 대한 3가지 테스트를 수행하여 1) 세포 유형에 따른 활성, 2) HDR 주형의 최적 설계, 및 3) 특이성을 탐색했다. REDITv1 활성은 HEK, A549, HepG2 및 HeLa 세포에서 여러 게놈 부위에 걸쳐 강력했다(도 5a-c, 도 6a-c). 주목할 만하게, 인간 배아 줄기 세포(hESC)에서 REDITv1은 HSP90AA1 및 OCT4에서 킬로베이스 녹-인 효율성의 일관된 증가를 나타냈으며 Cas9-HDR에 비해 최대 3.5배 개선되었다(도 5d-e, 도 6d-e). 다양한 주형 설계도 테스트되었다. REDITv1은 총 200bp만큼 짧은 HA 길이를 사용하여 효율적인 킬로베이스 편집을 수행했으며, HA가 길수록 더 높은 효율성을 지원한다. 이는 kb 규모 녹-인에 대해 최대 10% 효율성(선택 없이)을 달성했고, Cas9-HDR에 비해 5배 증가 및 1 내지 2% 전형적인 효율보다 훨씬 높은 것이었다(도 7). 마지막으로, 예측된 표적외 부위(OTS) 및 GUIDE-seq의 딥 시퀀싱을 사용하여 REDITv1 정확성의 정확성을 결정했다. REDITv1이 표적외 효과를 증가시키지는 않았지만, 검출 가능한 OTS는 EMX1 및 VEGFA에 대해 이전에 보고된 부위에 남아 있었다(도 5f-g, 도 8). 간단히 말해서, REDITv1은 킬로베이스 규모의 게놈 리콤비니어링을 선보였지만, 표적외 문제를 보유했고, REDITv1_RecT가 가장 높은 효율성을 나타냈다.

실시예 4

원하지 않는 편집을 경감시키기 위해, 비절단 Cas9 니카제(Cas9n)를 이용하는 REDIT 버전을 평가했다. 표적외 문제를 해결하기 위해 유사한 전략이 이전에 사용되었지만(Ran, F.A., et al., Cell (2013), 154: 1380-1389, 본원에 참고로 포함됨), 이는 낮은 HDR 효율성을 갖고 있었다. REDIT는 이 시스템이 내인성 복구의 한계를 극복할 수 있고 닉형성 매개 재조합을 촉진할 수 있는지를 결정하기 위해 테스트했다. 실제로, 니카제 버전은 단일 및 이중 닉형성에 의해 Cas9n(D10A)으로부터 최상의 결과를 갖는, 더 높은 효율성을 보여주었다. 이 Cas9n(D10A) 변이체는 REDITv2N으로 지정되었다(도 9a). 선택 없는 5% 내지 10% 녹-인은 REDITv2N 이중 닉형성을 사용하여 관찰했고, 이는 wtCas9를 사용하는 REDITv1과 비슷했다(도 9a, 도 10a). 접합부 시퀀싱을 통해 모든 표적에 대한 녹-인의 정밀도를 확인했다(도 11). 이 결과는 Cas9n-HDR에 비해 6 내지 10배 개선을 나타냈다. 단일 닉형성 REDITv2N에서도 1kb 녹-인에 대한 약 2% 효율성이 관찰되었고, 이는 정규의 단일 닉형성 Cas9n 및 덜 까다로운 12-bp 녹-인 주형을 사용하는 이전 보고서(Cong, L. et al., Science. 339, 819-823, 본원에 참고로 포함됨)의 0.46% HDR 효율성보다 상당히 높은 수준이다(도 9a).

REDITv2N의 표적외 활성은 GUIDE-seq를 사용하여 조사했다. 결과는 최소의 표적외 절단 및 REDITv1과 비교하여 ~90%로 OTS 감소를 보여주었다(도 9b). 구체적으로, DYNLT1-표적화 가이드의 경우, 가장 풍부한 KIF6 OTS는 REDITv1 그룹에서 유의미하게 농축되었지만, REDITv2N을 사용한 경우에는 사라졌다(도 9c). REDITv2N은 매우 정확했다(도 9b-c, 도 12).

HDR 편집의 또 다른 부산물은 표적상의 삽입-결실(인델)이다. 이는 특히 긴 서열의 경우, 유전자 편집 수율을 대폭 낮출 수 있다. 인델 형성은 딥 시퀀싱을 사용하는 EMX1 녹-인 실험에서 측정되었다. REDITv2N은 wtCas9를 사용한 대응물과 동일한 효율성으로 HDR을 증가시켰으며(도 12c, 상단), 원치 않는 표적상 인델을 92% 감소시켰다(도 12c, 하단).

GUIDE-seq, LAM-PCR 및 TLA의 개념은 게놈 전체 삽입 부위(GIS)를 식별하기 위한 NGS 기반 검정 또는 GIS-seq를 개발하기 위해 사용되었다(도 30a). GIS-seq를 사용하여 녹-인 삽입 부위를 나타내는 NGS 판독 클러스터/피크를 수득했고(도 30b), 이는 표적 상 부위로부터의 대표적인 판독을 보여준다. 녹-인 정확성을 측정하기 위해 GIS-seq를 DYNLT1 및 ACTB 유전자좌에 적용했다. 시퀀싱 결과는 최대 우도 추정을 기반으로 신뢰도가 높은 부위를 고려할 때 REDIT가 Cas9에 비해 식별된 표적외 삽입 부위가 더 적음을 나타내었다(도 30c). 종합해 보면, 녹-인 접합부의 클론성 Sanger 시퀀싱(도 9c 및 12), GUIDE-seq 분석(도 9b) 및 GIS seq 결과(도 30a-30c)는 REDIT가 원하지 않는 편집 이벤트가 더 적은 킬로베이스 길이 서열을 삽입하는 능력을 갖는 효율적인 방법일 수 있음을 나타냈다.

실시예 5

REDIT은 표적 DNA의 임의의 닉형성/절단의 부재 하에 긴 서열 편집 능력에 대해 검사했다. 놀랍게도, 촉매적으로 죽은 Cas9(dCas9)를 사용하여 REDITv2D를 작제할 때, 킬로베이스 카세트의 정확한 게놈 녹-인이 인간 세포에서 관찰되었다(도 9d, 상단, 도 13). REDITv2D는 REDITv2N보다 효율성이 더 낮았지만, 선택 없이, 1~2% 효율성으로 킬로베이스 규모의 프로그래밍 가능한 DNA 손상 없는 편집을 달성했다(도 9d, 도 10b). 두 과정이 REDITv2D 리콤비니어링에 기여할 수 있다는 가설을 세웠다. 1가지 가능성은 dCas9 풀림을 통한 것이었다. dCas9가 서열 특이적 루프 형성을 유도할 때 DNA를 풀 수 있다면 2개의 dCas9와의 이중 결합은 RecE/T에 대한 게놈 접근성을 촉진하는 것으로 예상될 수 있다. 그러나, 2개의 가이드 RNA 전달 시, 유의미한 증가는 관찰되지 않았다(도 9d, 하단). 또 다른 가능성은 세포 주기 동안 DNA의 풀림으로 인해 RecE/T가 dCas9 결합에 의해 매개되는 표적 영역에 접근할 수 있다는 것이었다. 다양한 혈청 수준(10% 정규, 2% 감소 및 무혈청)에서 여러 REDIT 도구를 사용하여 1kb 녹-인을 수행했다. 혈청 결핍이 세포 증식을 정지시킴에 따라, 결과는 세포 주기가 REDITv2D 리콤비니어링과 양의 상관관계가 있음을 나타냈다(도 9e). 무혈청 처리 시 HDR 효율성은 REDITv2D(dCas9) 그룹에서만 떨어진 반면, REDITv1(wtCas9) 및 REDITv2N(D10A)은 영향을 받지 않았고(도 9e, 도 14), 이는 DNA 풀림이 RecE/T가 표적 영역에 접근하도록 허용했음을 뒷받침한다.

실시예 6

현미경 분석은 REDITv1, 특히 REDITv1_RecT의 불완전한 핵 표적화를 드러냈다(도 15). 따라서, 단백질 링커 및 핵 국재화 신호(NLS)의 상이한 설계가 테스트되었다(도 15a). C-말단 SV40-NLS를 갖는 연장된 XTEN-링커는 REDITv3으로 불리는 바람직한 구성으로 식별되었다(도 16). REDITv3은 게놈 표적 및 Cas9 변이체(wtCas9, Cas9n, dCas9)에 걸쳐 REDITv2에 비해 HDR 효율성의 2~3배 증가를 추가로 달성했다(도 17).

마지막으로, REDITv3은 인간 줄기 세포에서 킬로베이스 녹-인 대립유전자를 조작하기 위해 hESC에서 활용되었다. REDITv3N 단일 및 이중 닉형성 설계는 재조합인자가 없는 대조군에 비해 각각 5배 및 20배 증가된 HDR 효율성을 초래했다(도 9f). 효능 및 충실도는 이전 REDIT 버전에 대해 설명된 검정의 조합을 통해 확인되었다(도 9f-g, 도 18). 또한, REDITv3은 생체내 전달에 적합한 소형 CRISPR 시스템인, 스타필로코커스 아우레우스 Cas9(SaCas9)와 함께 효과적으로 작동한다(도 19).

실시예 7

RecT 및 RecE_587 변이체를 추가로 조사하기 위해 RecT 및 RecE_587 둘 모두를 각각 도 20a 및 도 21a에 도시된 바와 같이 다양한 길이로 절두시켰다. 결과적인 효율성은 야생형 SpCas9 및 DYNLT1 유전자좌에 단일 및 이중 닉형성을 갖는 Cas9n(D10A)을 가지고 mKate 녹-인 검정을 사용하여 측정했다(각각 도 20b-c 및 도 21b-c). 재조합이 없는 그룹의 효율성은 대조군으로서 제시된다.

RecT 및 RecE_587 둘 모두의 절단된 버전은 서로 다른 Cas9와 함께 사용될 때 상당한 리콤비니어링 활성을 보유했다. 특히, 전체 길이 RecT(1-269aa)와 비교 시, RecT(93-264aa)와 같은 새로운 절두형 버전은 30% 이상 작지만, 진핵 세포에서 재조합을 자극하는 데 있어서 RecT의 전체 활성을 본질적으로 보존했다. 마찬가지로, 전체 길이 RecE(1-280aa)와 비교할 때 RecE_587(120-221aa) 및 RecE_587(120-209aa)과 같은 절두형 버전은 60% 이상 작지만, 인간 세포에서 여전히 높은 재조합 활성을 보유했다. 이러한 절두형 버전은 RecE 및 RecT 단백질 변이체를 사용하여 최소 기능성 리콤비니어링 효소를 추가로 조작할 수 있는 잠재성을 보여 주었을 뿐만 아니라 작은 크기를 고려해 볼 때 시험관내, 생체외 및 생체내 전달에 이상적인 인간 게놈 편집을 위한 귀중한 소형 리콤비니어링 도구도 제공한다.

전반적으로, REDIT는 RecE/RecT 리콤비니어링의 효율성을 통해 CRISPR 게놈 표적화의 특이성을 활용했다. 개시된 고효율성, 저오류 시스템은 기존 CRISPR 툴키트에 강력한 추가 기능을 제공한다. REDITv3N의 균형 잡힌 효율성 및 정확성은 면역 및 줄기 세포에서 대형 카세트의 녹-인에 대한 매력적인 치료 옵션을 만든다.

실시예 8

효모와 인간으로부터의 진핵생물 재조합 효소를 사용하여 재구성된 RecE 및 RecT 계통발생수(도 1a 및 1b)는 서열 상동성에 기초한 단백질의 진화 거리를 보여준다. 점선 상자는 전체 길이의 E. 콜라이 RecB 및 E. 콜라이 RecE 단백질을 나타낸다. E. 콜라이 RecB 및 E. 콜라이 RecE 단백질(실선 상자)의 촉매적 코어 도메인을 비교용으로 사용했다. 이러한 리콤비니어링 단백질 계열의 유전자 편집 활성은 MS2-MCP 동원 시스템을 사용하여 측정했으며, 여기서 MS2 줄기-루프를 보유하는 sgRNA는 펩타이드 링커를 통해 MCP 단백질에 융합된 리콤비니어링 단백질 및 핵 국재화 신호와 함께 사용했다.

3개의 엑소뉴클레아제 단백질이 사용되었다: 파지 람다로부터의 엑소뉴클레아제, E. 콜라이 RecE 단백질의 RecE587 코어 도메인, 및 파지 T7로부터의 엑소뉴클레아제(유전자명 gp6)(도 22a). 유전자 편집 활성은 게놈 유전자좌(DYNLT1 및 HSP90AA1)에서 mKate 녹-인 검정을 사용하여 측정했다.

엑소뉴클레아제와 동일한 3종의 미생물의 3가지 단일 가닥 DNA 어닐링 단백질(SSAP), 즉 파지 람다의 Bet 단백질, E. 콜라이의 RecT 단백질 및 파지 T7의 SSAP(유전자명 gp2.5)의 게놈 편집 효율성을 테스트하는 유사한 측정이 이루어졌다. (도 22b).

이러한 결과로부터, 3가지 주요 파지/미생물 재조합 시스템 계열 모두의 게놈 리콤비니어링 활성을 진핵 세포에서 체계적으로 측정하고 검증했다(람다 파지 엑소뉴클레아제 및 베타 단백질; E. 콜라이 전기 RecE 및 RecT 단백질, T7 파지 엑소뉴클레아제 gp6 및 단일 가닥 결합 gp2.5 단백질). 3가지 시스템으로부터의 6가지 단백질 모두는 2개의 게놈 유전자좌에 걸쳐 포유류 게놈 내로 킬로베이스 길이의 서열을 녹-인하는 데 효율적인 유전자 편집을 달성했다. 전반적으로, 엑소뉴클레아제는 재조합인자가 없는 대조군과 비교했을 때 약 3배 더 높은 재조합 효율(최대 4% mKate 게놈 녹-인)을 보여주었다. 단일 가닥 어닐링 단백질(SSAP)은 대조군에 비해 4배 내지 8배 더 높은 유전자 편집 활성을 갖는 더 높은 활성을 보여주었다. 이는 엑소뉴클레아제 및 SSAP 계열의 미생물 재조합 단백질이 Cas9 기반 융합 단백질 시스템을 통해 조작되어 포유류 세포에서 매우 효율적인 게놈 재조합을 달성할 수 있다는 일반적인 적용 가능성 및 유효성을 입증했다.

실시예 9

REDIT 단백질 설계의 일반화 가능성을 입증하기 위해, 대안적 동원 시스템을 개발하고 테스트했다. 더욱 소형 REDIT 시스템을 위해, REDIT 재조합인자 단백질을 N22 펩타이드에 융합시켰으며 동시에 sgRNA는 N22 펩타이드의 짧은 인식 서열인 boxB를 포함하여 sgRNA 내의 MCP를 대체했다(도 23a). 이 boxB-N22 시스템은 MS2-MCP 동원 시스템을 병렬 비교하여 도 23b-23e에 도시된 바와 같이 테스트된 2개의 게놈 부위에서 비슷한 편집 효율성을 입증했다.

단백질 기반 동원 시스템인 SunTag 동원을 사용하는 REDIT 시스템이 개발되었다(도 24a 및 27a). SunTag는 융합 단백질 설계를 기반으로 하기 때문에 sgRNA 또는 가이드RNA는 야생형 CRISPR 시스템과 동일하다. 구체적으로, REDIT 재조합인자 단백질은 scFV 항체 펩타이드(MCP 대체)에 융합시켰고, GCN4 펩타이드는 직렬 방식(링커에 의해 분리된 GCN4 펩타이드의 10개 카피)으로 Cas9 단백질에 융합시켰다. 따라서, scFV-REDIT는 scFV에 대한 GCN4의 친화성을 통해 Cas9 복합체에 동원될 수 있다.

mKate 녹-인 실험(도 24b 및 27b)을 사용하여 각각 DYNLT1 유전자좌 및 HSP90AA1 유전자좌에서의 편집 효율성을 측정했다. 이 SunTag 기반 REDIT 시스템은 테스트된 DYNLT1 게놈 부위에서 유전자 편집 녹-인 효율성의 유의미한 증가를 입증했다. 또한, SunTag 설계는 Cas9보다 약 2배 더 우수한 HRD 효율성을 유의미하게 증가시켰지만, MS2-어댑터만큼 높은 증가를 달성하지는 못했다.

실시예 10

REDIT 단백질 설계의 일반화 가능성을 입증하고 다양한 CRISPR 효소에 적용 가능한 다용도 REDIT 시스템을 개발하기 위해, SunTag 동원 설계를 사용하는 Cpf1/Cas12a 기반 REDIT 시스템을 개발했다(도 25a). 2개의 서로 다른 Cpf1/Cas12a 단백질은 이전에 보여준 바와 같은 mKate 녹-인 검정을 사용하여 테스트했다(라크노스피라시애 박테리움 ND2006, LbCpf1 및 아시다미노코커스 종 BV3L6)(도 25b).

이러한 결과는 미생물 재조합 단백질(엑소뉴클레아제 및 단일 가닥 어닐링 단백질)이 진핵 세포에서 게놈 편집을 수행하기 위해 SunTag 동원 시스템과 같은 대체 설계를 사용하여 조작될 수 있음을 보여주었다. 이러한 단백질 기반 동원 시스템은 RNA 앱타머나 RNA 결합 단백질의 사용을 필요로 하지 않고 대신 CRISPR 효소에 직접 연결되는 융합 단백질 도메인을 활용하여 REDIT 단백질을 동원한다.

동원 시스템 설계의 유연성 외에도, Cpf1/Cas12a 유형 CRISPR 효소를 사용한 이러한 결과는 또한 게놈 재조합을 위한 다양한 CRISPR 시스템에 대한 REDIT 단백질의 일반적인 조정 가능성을 입증했다. Cpf1/Cas12a 효소는 Cas9 효소와 다른 촉매 잔기 및 DNA 인식 메커니즘을 가지고 있다. 따라서, REDIT 재조합 단백질(엑소뉴클레아제 및 단일 가닥 어닐링 단백질)은 CRISPR 효소 구성요소(Cas9, Cpf1/Cas12a 및 기타)의 특정 선택과 무관하게 기능할 수 있다. 이는 REDIT 시스템의 일반화 가능성을 입증했으며 진핵 세포에서 정확한 게놈 편집을 달성하기 위해 REDIT 시스템의 구성요소로서 추가적인 CRISPR 효소(알려지거나 알려지지 않은)의 사용 가능성을 열어 둔다.

실시예 11

RecE/RecT 단백질을 갖는 15종의 서로 다른 미생물 종을 미생물계 전체에 걸쳐 다양한 RecE 및 RecT 단백질을 선별하기 위해 선택했다(표 3). 각 단백질은 코돈 최적화되어 합성되었다. E. 콜라이 RecE/RecT 기반 REDIT 시스템에 대해 앞서 기술된 바와 같이, 각 단백질은 E-XTEN 링커를 통해 추가적인 핵 국재화 신호가 있는 MCP 단백질에 융합되었다. mKate 녹-인 유전자 편집 검정을 사용하여 DYNLT1 유전자좌(도 26a, 표 4) 및 HSP90AA1 유전자좌(도 26b, 표 4)에서의 효율성을 측정했다. 상동체는 정밀한 유전자 편집을 가능하게 하고 향상시키는 능력을 입증했다.

[표 3]

[표 4]

실시예 12

다음으로, RecT 기반 REDIT 설계를 벤치마킹하기 위해, 기존 HDR 강화 도구의 3가지 범주와 비교했다(도 28a 및 28b): Cas9를 갖는 DNA 복구 효소 CtIP 융합체(Cas9-HE), Cas9와 인간 제미닌(Geminin) 단백질의 기능성 도메인(아미노산 1 내지 110)의 융합체(Cas9-Gem), 및 세포 주기 제어를 통한 HDR의 소분자 강화제인 노코다졸(Nocodazole). 테스트된 내인성 표적 전체에서 RecT 기반 REDIT 설계는 3가지 대체 전략에 비해 유리한 성능을 나타냈다(도 3c). 더욱이, 다른 접근 방식과 무관하게 활성을 통해 작용하는 것으로 추정되는 RecT 기반 REDIT 설계는 기존 방법과 상승작용할 수 있다. 이 가설을 테스트하기 위해 RecT 기반 REDIT 설계를 3가지 다른 접근 방식(편리하게는 MS2-앱타머를 통해)과 조합했다(도 28a, 오른쪽). RecT 기반 REDIT 설계는 실제로 테스트된 도구의 HDR 촉진 활동을 더욱 향상시킬 수 있었다(도 28c).

실시예 13

REDIT의 편집 효율성에 대한 주형 HA 길이의 효과는 각 측면에서 적어도 100bp의 HA를 보유하는 표준 HDR 공여자를 사용할 때 정량화되었다(도 29a, 왼쪽). HA 길이가 증가함에 따라 Cas9 및 RecT 그룹 모두에서 더 높은 HDR 비율이 관찰되었으며, REDIT는 각 측면에서 약 100bp만큼 짧은 HA 길이를 사용하여 Cas9 이상으로 HDR을 효과적으로 자극했다. 600-800bp 총 HA를 보유하는 더 긴 주형이 제공될 때 RecT는 선택 없이 kb 규모 녹-인에 대한 10% 이상의 HDR 효율성을 달성했고, 이는 Cas9만 사용할 때의 2 내지 3% 효율성보다 훨씬 높은 것이었다. 최근 보고서에 따르면 HA가 더 짧은(보통 10~50bp) 공여자 DNA를 사용하면 미세상동성 매개 말단 결합(MMEJ) 경로로부터의 높은 복구 활성 덕분에 녹-인 효율성을 유의미하게 자극할 수 있는 것으로 나타났다. REDIT 기반 방법의 녹-인 효율성은 0bp(NHEJ 기반), 10bp 또는 50bp(MMEJ 기반) HA를 갖는 공여자 DNA를 사용하여 Cas9와 비교했다. 결과는 MMEJ 메커니즘을 활용하는 짧은 HA 공여자가 HDR 공여자에 비해 더 높은 편집 효율성을 산출한다는 것을 입증했다(도 29a, 오른쪽). 동시에 REDIT는 HA가 존재하는 한 녹-인 효율성을 향상시킬 수 있었다(0bp NHEJ 공여자에서는 효과 없음). 이 효과는 HDR 공여자와의 추가 특성화 및 비교를 위해 상당한 효과가 있었던 10bp 공여자를 선택한 경우에 특히 유의미하다.

녹-인 세포를 클론적으로 단리하고 표적 게놈 영역을 콜로니 Sanger 시퀀싱을 위해 공여자 DNA의 완전히 외측에 결합하는 프라이머를 사용하여 증폭시켰다(도 29b. 접합부 시퀀싱 분석(조건당 유전자당 약 48개 콜로니)은 단일 또는 두 접합부를 포함한 5'- 및 3'- 녹-인 접합부에서 다양한 정도의 인델을 드러냈다(도 29c). 전반적으로 HDR 공여자는 MMEJ 공여자보다 더 우수한 정밀도를 가졌고 접합부 인델이 여전히 관찰될지라도, REDIT는 Cas9와 비교하여 녹-인 수율을 적당히 개선시켰다.

더욱이, 편집 길이를 다르게 한 경우, REDIT 및 Cas9의 효율성을 비교했다. 더 긴 편집을 위해, 2-kb 녹-인 카세트를 사용했고(도 29d), 더 짧은 편집을 위해서는 단일 가닥 올리고 공여자(ssODN)를 사용했다. 이중-mKate/GFP 주형을 사용하여 녹-인 서열 길이를 약 2-kb로 증가시켰을 때, REDIT는 테스트된 내인성 표적 전체에서 Cas9에 비해 HDR 촉진 활성을 유지했다(도 29d). ssODN 테스트의 경우, 잘 확립된 2개의 유전자좌 EMX1 및 VEGFA에서 REDIT 및 Cas9는 12-16bp 외인성 서열을 도입시키기 위해 사용했다. ssODN 주형은 짧기 때문에(각 측면에 <100bp HA), 편집 이벤트를 정량화하기 위해 차세대 시퀀싱(NGS)을 사용했다. REDIT를 사용하여 개선된 HDR 효율성을 갖는 Cas9와 REDIT 간에는 비슷한 수준의 인델이 관찰되었다.

실시예 14

RAD51의 2가지 별개의 약리학적 억제제인 B02 및 RI-1의 존재 또는 부재 하에 HDR을 촉진하는 REDIT 능력의 민감도(도 31a). 예상한 대로, Cas9 기반 편집의 경우 RAD51 억제는 HDR 효율성을 크게 저하시켰다(도 31b, 31c 및 32a). 흥미롭게도 RAD51 억제는 REDIT 및 REDITdn 효율성을 중간 정도만 감소시켰는데, 이는 두 REDIT/REDITdn 방법 모두가 RAD51 억제 하에서 Cas9/Cas9dn에 비해 상당히 더 높은 녹-인 효율성을 유지했기 때문이다.

또한 MRN 복합체 형성, MRN 의존적 ATM 활성화를 방지하고 Mre11 엑소뉴클레아제 활성을 억제하는 것으로 밝혀져 있는 DSB 복구의 강력한 화학적 억제제인 Mirin도 사용했다. 세포를 Mrining으로 처리한 경우, Cas9 기준 실험의 편집 효율성만이 Miring 처리에 의해 영향을 받은 반면, REDIT 버전은 모든 게놈 표적에 걸쳐 비히클 처리 그룹과 본질적으로 동일했다(도 32a).

세포 주기 억제가 재조합에 영향을 미치는지를 테스트하기 위해 이중 티미딘 차단(DTB)을 사용하여 세포를 G1/S 경계로 화학적으로 동기화했다. REDIT 버전은 DTB 처리 하에서 편집 효율성을 감소시켰지만, Miring RI-1 또는 B02가 DTB 처리와 조합된 경우에는, Cas9 기준 실험에 비해 DNA 복구 경로 억제 하에 더 높은 편집 효율성을 유지했다(도 32b).

다양한 정황에서 REDIT를 검증하기 위해, REDIT를 인간 배아 줄기 세포(hESC)에 적용하여 형질전환되지 않은 인간 세포에서의 긴 서열을 조작하는 능력을 테스트했다. REDIT 및 REDITdn을 사용하여 3개의 게놈 부위(HSP90AA1, ACTB, OCT4/POU5F1) 모두에서 HDR의 강력한 자극이 관찰되었다(도 31d 및 31e). 주목할 만한 점은 REDIT 및 REDITdn 편집이 각 측면에 200bp HA가 있는 공여자 DNA를 사용했고, 비 REDIT 방법의 사용 시의 약 1% 효율성과 비교하여 선택 없이 kb 규모 유전자 편집에 대해 최대 5% 이상의 효율성을 달성했다는 것이다. 또한 REDIT는 A549(폐 유래), HepG2(간 유래) 및 HeLa(자궁경부 유래) 세포의 녹-인 효율성을 개선시켰고, 이는 선택 없이 최대 약 15% kb 규모의 게놈 녹-인을 입증했다. 이러한 개선은 Cas9 그룹보다 최대 4배 더 높았으며, 이는 다양한 세포 유형에서 REDIT 방법의 사용 가능성을 뒷받침한다.

실시예 15

dCas9-EcRecT(SAFE-dCas9)의 생체내 사용은 유체역학적 꼬리 정맥 주사를 통해 절단 없는 dCas9 편집기를 사용하여 테스트했다. 사용된 유전자 편집 벡터 및 주형 DNA는 도 33a에 도시된다. 유전자 편집 벡터(60μg)와 주형 DNA(60μg)는 유체역학적 꼬리 정맥 주사를 통해 주입하여 구성요소를 마우스에 전달했다. 간의 간세포에 대한 성공적인 유전자 편집은 알부민 유전자좌로부터의 전이유전자-암호 단백질 발현에 의해 모니터링되었다. 실험 절차의 개략도는 도 33b에 도시된다.

주사 후 약 7일째에 관류된 마우스의 간을 절개했다. 간엽을 균질화하고 1차 간세포로부터 간 게놈 DNA를 추출하기 위해 처리했다. 추출된 게놈 DNA는 3가지 다른 하류 분석에 사용했다: 1) 녹-인-특이적 프라이머를 사용한 PCR 및 아가로스 겔 전기영동(도 34a); 2) 녹-인 PCR 산물의 Sanger 시퀀싱(도 34b); 3) 생체내 SAFE-dCas9를 사용한 유전자 편집의 정확성을 확인하고 정량화하기 위한 녹-인 접합부의 고처리량 딥 시퀀싱(도 34c). 각 하류 분석은 녹-인 성공을 확인시켜 주었다.

또한, LTC 마우스 폐로의 아데노 연관 바이러스(AAV) 전달을 사용하여 생체내 사용을 테스트했다. LTC 마우스는 3가지 게놈 대립 유전자를 포함한다: 1) Lkb1(flox/flox) 대립유전자는 Cre를 발현할 때 Lkb1-KO를 허용함; 2) R26(LSL-TdTom) 대립유전자는 TdTom 적색 형광 단백질을 통해 AAV 형질도입 세포의 검출을 허용함; 3) H11(LSL-Cas9) 대립유전자는 AAV 형질도입 세포에서 Cas9의 발현을 허용함. REDI 유전자 편집 벡터 및 Cas9 대조 벡터의 개략도는 도 35a에 도시되어 있다. 도 35b에 도시된 바와 같이, 유전자 편집 벡터를 사용한 성공적인 유전자 편집은 치료된 마우스의 폐에서 종양 성장을 유도하는 Kras 대립유전자를 초래한다.

AAV 주사 약 14주 후, 관류된 마우스 폐를 절개했다. 성공적인 유전자 편집으로 인한 종양 형성을 식별하기 위한 영상화 분석을 위해 고정된 폐 조직을 사용했다(도 35c). 영상화 분석을 통한 표면 종양 수의 정량화는 REDIT 처리된 마우스에서 증가된 유전자 편집 효율 및 총 종양 수를 보여주었다(도 35c).

실시예 16

E. 콜라이 RecT(EcRecT) 단독 구조(도 36a) 및 결합된 단일 가닥 DNA를 갖는 구조(도 36b 및 36c)가 예측되었다. 접촉 계면은 절두 데이터와 일치한다(실시예 7, 도 20a). EcRecT SSAP 아미노산과 DNA의 예측된 상호작용이 도 37a 및 37b에 도시되어 있다.

실시예 17

322개의 새로운 SSAP 단백질이 서열 데이터로부터 식별되고 합성되었으며 Cas9 및 dCas9와 함께 활성에 대해 스크리닝되었다. 유전자 편집 활성은 아래 표 5에 제시되어 있으며, 이어서 단백질의 아미노산 서열이 뒤따른다.

[표 5]

실시예 18

CRISPR-Cas9 시스템으로 예시된 유전자 편집은 인간 건강과 질병의 메커니즘을 탐침하기 위한 강력한 도구가 되었다. Cas9 편집은 표적상 및 표적외 부위에서 DNA 손상을 일으킬 수 있으며 오류가 발생하기 쉬운 내인성 DNA 복구 메커니즘에 의존한다. 이러한 특징은 원치 않는 돌연변이 및 안전성 문제를 야기하는 경우가 많으며, 이는 긴 서열을 변경할 때 악화될 수 있다. 포유류 게놈 DNA가 dCas9 DNA 풀림 및 R-루프 형성 시 일시적으로 접근 가능해진다는 이전 연구를 바탕으로, 본 발명자들은 미생물 단일 가닥 어닐링 단백질(SSAP)이 dCas9-가이드RNA 복합체와 커플링될 때 유전자 편집을 위한 DNA 가닥 교환을 자극할 수 있다는 가설을 세웠다. 따라서, 본 발명자들은 긴 서열을 녹-인하기 위해 촉매적으로 죽은 dCas9를 사용하여 절단 없는 유전자 편집 도구를 개발했다. 본 발명자들의 데이터는 이 dCas9 기반 편집기가 Cas9 편집기보다 표적 유전자좌에서 매우 낮은 편집 오류, 검출 가능한 최소의 표적외 효과, 및 더 높은 전반적인 정확성을 나타냈음을 입증했다. 한편, dCas9-SSAP 편집기는 인간 세포주 및 줄기 세포 전반에 걸쳐 강력한 성능을 가져, Cas9 편집기와 비슷한 효율성을 나타냈다. 이 dCas9-SSAP 편집기는 최대 킬로베이스 규모까지 다양한 길이의 서열을 삽입하는 데 효과적이었다. DNA 복구 효소를 화학적으로 억제한 실험에서 dCas9-SSAP 편집은 내인성 포유류 복구 경로로부터 주목할 만한 독립성을 입증했다. 까다로운 세포 유형에 대한 dCas9-SSAP 편집기의 편리한 바이러스 전달을 위해 본 발명자들은 절두 및 앱타머 조작을 수행하여 향후 적용예를 위해 단일 AAV 벡터에 맞도록 크기를 최소화했다. 전반적으로, 이 도구는 포유류 세포에서 더 안전한 게놈 조작에 대한 기회를 열어준다.

CRISPR-Cas9 유전자 편집의 초기 입증 이래로, 게놈 기능, 생물학적 과정 모델링, 및 유전자 치료법을 연구하기 위해 유전자 편집 기술을 개선하고 확장하기 위한 상당한 노력이 이루어졌다. 염기 편집 및 프라임 편집과 같은 차세대 유전자 편집 도구는 유전자 편집의 효율성과 충실도를 크게 개선시켰고, 상대적으로 짧은 서열을 변경하는 데 있어서 강력한 것이다. 대부분의 유전자 편집 도구는 게놈 DNA를 절단하여 표적 편집을 용이하게 하는 단일 가닥 닉(SSN) 또는 이중 가닥 파괴(DSB)를 유도하도록 작업한다. 이러한 DNA 변형은 종종 비상동 말단 결합(NHEJ)과 같은 오류가 발생하기 쉬운 내인성 경로에 의해 복구된다. 이 과정은 종종 원치 않는 돌연변이 및 표적외 효과로 이어지며, 이로 인해 독성이 초래되고 안전성 문제가 제기될 수 있다. 이러한 편집 오류 및 표적외 효과는 긴 게놈 서열(>=100bp)을 조작할 때 점점 더 심각해지고 때로는 엄청나게 심각해질 것이다. 이러한 원치 않는 효과는 대규모 게놈 녹-인 또는 생체내 유전자 편집을 조작하도록 하는 유전자 편집의 적용을 제한한다.

상동성 유도 복구(HDR) 또는 미세상동성 매개 말단 결합(MMEJ)과 같은 긴 서열 편집에 이용 가능한 CRISPR 기반 방법은 Cas9 절단에 의존하고 종종 게놈 내 무작위 인델 형성을 촉발한다. 최근의 많은 노력으로 화학적 강화제, 강화 도메인 융합, 및 변형된 공여자 DNA와 같은 정밀한 긴 서열 편집이 향상되었다. 닉형성 기반의 HDR은 편집 오류를 줄이는 것으로 나타났지만, 더 낮은 효율성을 야기할 수 있었다. 따라서, 긴 서열 변경에 효율적이고 더 안전한 CRISPR 편집 도구에 대한 필요성은 여전히 존재한다.

박테리오파지는 접근 가능한 복제 게놈 DNA를 활용하여 정밀한 재조합을 수행하는 효소를 진화시켰다. 본 발명자들은 미생물 재조합을 위한 주요 효소인 단일 가닥 어닐링 단백질(SSAP)이 포유류 세포의 유전자 편집에 유용할 수 있고 DNA 절단에 의존하지 않으며 Cas9 편집에 관여하는 오류가 발생하기 쉬운 경로를 촉발하지 않을 것이라고 추론했다. 이 가설 및 게놈 재조합을 자극하는 능력을 보여주는 본 발명자들의 이전 연구에 의해 동기화되어, 본 발명자들은 비활성화된 Cas9(dCas9 또는 촉매적으로 죽은 Cas9) 및 미생물 SSAP를 사용하는 유전자 편집 도구를 개발했다. 이 dCas9 편집기는 공여자 DNA와 함께 제공되는 경우 게놈 DNA 절단의 필요 없이 녹-인 편집을 위해 SSAP를 사용한다. 본 발명자들은 이를 dCas9-SSAP 편집기(dCas9-SSAP)라고 명명했다.

dCas9-SSAP를 최적화하기 위해 본 발명자들은 RecT 상동체에 초점을 맞춘 SSAP의 메타게놈 검색을 수행했고, EcRecT가 인간 게놈 녹-인에 가장 효율적인 것임을 식별했다. 검증을 위해, 본 발명자들은 일련의 게놈 조작 및 화학적 교란 실험을 수행했다. 본 발명자들의 데이터는 dCas9-SSAP가 야생형 Cas9 기준과 비슷한 녹-인 효율성을 가지며, Cas9 니카제 편집기보다 훨씬 더 높은 효율성임을 보여주었다. dCas9-SSAP는 킬로베이스 규모의 서열 편집을 위해 다중 게놈 표적과 세포주에 걸쳐 선택 없이 최대 12%의 녹-인 효율성을 달성했다. 더 중요하게도, 본 발명자들의 데이터는 이 새로운 도구가 거의 0의 표적상/표적외 오류를 발생시킨다는 것을 보여주었다. 1kb 서열 녹-인에 대한 검정에서 dCas9-SSAP는 모든 세포에 걸쳐 0.3% 미만의 편집 오류를 보인 반면, Cas9 편집기는 비슷한 수율을 보였지만 추가적인 10%-16%의 잘못 편집된 세포를 나타내었다. 테스트된 유전자좌 전체에서 dCas9-SSAP는 90%-99.6%의 편집 정확성을 가진 반면, Cas9 편집기의 정확성은 10% 내지 38% 범위이다(도 39f).

또한, 본 발명자들은 몇몇 DNA 복구 효소를 억제하고 세포 주기 동기화를 수행함을 통해 dCas9-SSAP 편집 메커니즘을 탐침했다. 이 실험에서 dCas9-SSAP는 Cas9 편집과 달리 내인성 DNA 복구 경로에 대한 더 낮은 의존도를 입증했다. 본 발명자들의 세포 주기 검정 결과는 dCas9 편집기에 대한 본 발명자들의 가상 메커니즘을 뒷받침했다; 이는 dCas9의 알려진 생체물리학적, 생화학적 특성과 일치한다.

마지막으로, 향후 적용예를 위한 dCas9-SSAP의 전달에 도움을 주기 위해, 본 발명자들은 구조 유도 절두를 사용하여 분자 설계를 최적화하고 최소화된 dSaCas9-mSSAP를 수득하여, 50% 이상 크기 감소를 달성하고 유사한 수준의 효율성을 보유한다. 이 최소한의 dCas9 편집기는 아데노 연관 바이러스(AAV)와 같은 바이러스 벡터를 사용하여 편리한 전달을 가능하게 하며, 이는 형질감염이 어려운 세포 유형 또는 생체내 적용예에 잠재적으로 유용하다. 전반적으로, dCas9-SSAP 편집기는 효율적이고 정확한 녹-인 게놈 조작을 할 수 있다. 추가 개선의 여지로 인해, 이는 포유류 세포를 위한 절단 없는 유전자 편집 도구로서 잠재적인 연구 및 치료 가치를 가지고 있다.

dCas9 녹-인 유전자 편집을 위한 파지 SSAP 사용

긴 서열 녹-인이 가능한 대부분의 CRISPR 기반 편집기는 SSN 또는 DSB를 필요로 하며, 이는 경쟁적이고 오류가 발생하기 쉬운 NHEJ 경로를 촉발하여 가변적인 효율성 및 정확성을 초래할 수 있다. 대조적으로, 박테리오파지는 서열 상동성을 통해 숙주 박테리아의 게놈에 자신을 통합하기 위해 DNA 변형 효소를 진화시켰고, 예를 들어 Lambda Red이다. 이러한 정밀한 파지 통합은 주요 상동성 유도 단계에 의존적이다: 게놈 DNA와 공여자 DNA 사이의 재조합은 SSAP, 예를 들어 Lambda Bet 또는 이의 기능성 상동체인 RecT에 의해 자극된다. 종전 연구에서 본 발명자들은 파지 SSAP가 이의 특이한 ATP 독립적 활성으로 인해, 인간 세포에서의 ATP 의존성 RAD51 단백질과 달리 DNA 절단에 의존적이지 않을 수 있다고 추론했다. 단일 및 이중 가닥 DNA에 대한 파지 SSAP의 높은 친화성은 다중 SSAP가 RNA 유도 dCas9를 통해 게놈 표적에 동원될 때 공여자 주형에 부착하도록 할 수 있다. 그러면 dCas9 매개 DNA 풀림 및 R-루프 형성 동안 표적 DNA 가닥이 일시적으로 접근 가능해지기 때문에 절단 없이 게놈-공여자 DNA 교환을 촉진할 수도 있다.

이 가설에 기초하여, 본 발명자들은 촉매적으로 죽은 Cas9(dCas9)에 SSAP를 동원하는 시스템을 설계했다(도 38a). dCas9 단백질은 DNA를 절단할 수 없지만 표적 부위를 풀고 R-루프를 형성하는 능력을 보유하여 비표적 가닥이 SSAP 자극된 상동성 재조합에 접근 가능해지는 것으로 추정된다. 이를 테스트하기 위해 본 발명자들은 3가지 주요 유형의 미생물 SSAP인 람다 Bet 단백질(람다 베트); E. 콜라이 Rac 프로파지 RecT(Rac RecT) 및 파지 T7 gp2.5(T7 gp2.5)를 조작하고 평가했다. 본 발명자들은 이러한 SSAP를 RNA 앱타머 MS2 줄기-루프를 통해 S. 피오게네스 Cas9의 비활성화된 버전(dSpCas9, 이하 간단히 dCas9)으로 동원시켰다(도 38a, 38c). 이 MS2-앱타머는 sgRNA 스캐폴드에 삽입되었고, 후보 SSAP는 MS2 앱타머에 특이적으로 결합하는 N-말단 MS2 외피 단백질(MCP)에 융합되고, 따라서 다중 SSAP가 dCas9-가이드RNA와 복합체를 형성하게 된다. 인간 세포에서 이들의 유전자 편집 활성을 측정하기 위해 본 발명자들은 상동성 암(HA)이 측면에 있는 800bp 전이유전자 암호화 형광 단백질(FP) 카세트를 사용하여 녹-인 공여자를 생성했고, 이는 FP가 하우스키핑 유전자, 예를 들어 DYNLT1, HSP90AA1, ACTB 내에 프레임내 삽입되도록 한다(도 38b, 왼쪽). 정밀한 녹-인 시, 본 발명자들은 FP 발현 세포의 백분율을 측정하여 유전자 편집 효율성을 정량화했다(도 38b-38d). 본 발명자들의 초기 테스트에서는 RecT가 인간 세포에서 다른 SSAP에 비해 더 높은 녹-인 편집 활성을 갖는 반면, dCas9 단독 또는 비표적 대조군에 의해서는 배경 이상의 어떠한 편집도 관찰되지 않았음을 식별했다(도 38c, 38d). 본 발명자들은 겔 전기영동 및 시퀀싱을 사용하여 이러한 녹-인 편집을 검증했다(도 44). 이는 RNA 앱타머를 통해 dCas9에 대한 SSAP의 커플링이 녹-인 유전자 편집을 가능하게 한다는 증거를 제공했다.

포유류 유전자 편집 도구로서 dCas9-SSAP의 개발

본 발명자들은 포유류 유전자 편집을 위한 최고의 SSAP를 식별하기 위해 메타게놈 마이닝을 수행했다. 본 발명자들은 RecT 상동체에 초점을 맞추고 계통발생 분석을 통해 진화적 다양성을 극대화하려고 노력했다. 본 발명자들은 RecT 상동체에 대한 NCBI 비중복 서열 데이터베이스를 체계적으로 검색하여 2,071개의 초기 후보를 식별했다. 그런 다음, 본 발명자들은 계통발생수를 구축하고 서열 상동성이 높은 단백질을 필터링하고 진화 가지를 하위 샘플링하여 16개의 매우 다양한 SSAP 후보를 수득했다(도 44).

본 발명자들은 녹-인 스크리닝을 통해 SSAP 후보를 검사하고 3개의 게놈 유전자좌인 HSP90AA1, DYNLT1 및 ACTB에 걸쳐 편집 효율성을 평가했다(도 38e). 모든 후보 중에서 EcRecT는 dCas9 편집에 대해 가장 높은 효율성을 보여준다 ― 이는 인간 세포에서 최대 6% 효율성으로 킬로베이스 카세트의 게놈 녹-인을 달성한다. 이는 공여자가 없는 대조군과 비교 가능한 SSAP가 없는 dCas9 대조군보다 유의미하게 높았으며, 이는 dCas9 단독으로는 게놈 녹-인을 수행할 수 없음을 시사한다(도 38e). 공여자 DNA의 가능한 배경 삽입을 측정하기 위해, 본 발명자들은 게놈 표적을 인식하지 못하는 가이드 RNA를 사용하는 비표적 대조군을 포함시켰고 공여자가 없는 음성 대조군과 비슷한 활성을 관찰했다(도 38e). 본 발명자들은 또한 비표적 대조군으로 SSAP를 테스트했고, 이는 SSAP 단독 발현이 녹-인에 충분하지 않음을 확인시켜 주었다(도 38e). 마지막으로, 본 발명자들은 상이한 공여자 DNA 설계를 사용하여 새로운 편집기를 테스트했다(도 38f). 본 발명자들의 결과는 MMEJ 공여자보다 HDR을 사용할 때 SSAP 매개 편집이 더 효율적이며, 더 긴 상동성 암이 일반적으로 편집 효율성을 더 높게 만든다는 것을 시사했다(도 38f). 이는 MMEJ가 dCas9 편집에서 누락되는 DNA 파손에 의존적이라는 이전 보고와 일치한다. 종합하면, 제안된 dCas9 편집기는 최고의 SSAP로서 EcRecT를 사용하여 인간 세포에서 효율적인 녹-인 편집을 가능하게 했다. 다음에서, 본 발명자들은 dCas9-SSAP라고 하는 최상의 설계에 중점을 맞춘다.

dCas9-SSAP 유전자 편집의 정확성 특성화

dCas9-SSAP를 개발하려는 동기는 SSAP의 도움으로 잠재적으로 더 안전하고 절단이 없는 dCas9 편집을 수행하는 것이다. 따라서, 본 발명자들은 표적 서열의 길이가 ~1kb인 녹-인 편집에 대해 dCas9-SSAP의 정확성을 실험적으로 평가했다. Cas9 기준과 비교하여 dCas9-SSAP의 표적상의 오류, 표적외 삽입, 세포 적합도 효과, 및 편집 수율을 측정했다.

표적상의 오류 분석. 표적상의 오류에는 2가지 유형이 있다: (1) 표적 상의 인델 형성, 이의 발생은 녹-인이 성공적이지 않음을 의미함; (2) 녹-인 오류, 이는 녹-인이 발생하지만 불완전하며, 접합부 인델이 발생함을 의미함.

유형 (1)을 평가하기 위해, 본 발명자들은 딥 시퀀싱을 사용하여 dCas9 편집기의 표적상의 인델 형성을 측정했다. 본 발명자들은 주형 오염을 피하기 위해 공여자 DNA 외측에 초기 프라이머 결합을 갖는 중첩 PCR 설계를 사용했다(도 39a, 도 46). 표적상 부위의 딥 시퀀싱은 dCas9 편집기의 표적상 오류 수준이 음성 대조군의 수준만큼 낮음을 보여주었고, 이는 Cas9 편집기에서 관찰되는 높은 인델 형성 수준과 대조적이었다(도 39a).

유형 (2)를 평가하기 위해, 본 발명자들은 dCas9-SSAP의 녹-인 오류를 벤치마킹하고 접합부 인델을 측정했다. 본 발명자들은 편집된 세포를 클론적으로 단리했고, 그 다음 오염을 피하기 위해 유사한 2단계 중첩 PCR 설계를 사용하여 녹-인 게놈 유전자좌를 증폭시켰고(도 39b, 도 46), 본 발명자들은 편집된 게놈 대립유전자를 Sanger 시퀀싱을 통해 평가했다. 긴-판독 Sanger 시퀀싱은 본 발명자들로 하여금 전체 녹-인 접합부를 철저하게 검사할 수 있도록 했다. 본 발명자들의 결과는 Cas9를 사용할 때 MMEJ 공여자가 HDR 공여자보다 더 효율적이지만, MMEJ 공여자는 또한 유의미하게 더 높은 편집 오류 백분율을 야기했음을 나타냈다(도 39b). 보다 중요하게, dCas9-SSAP는 녹-인 오류가 없는 클론의 백분율 측면에서 Cas9-HDR 및 Cas9-MMEJ를 능가했다(도 39b, 도 47-48). 한 유전자좌에서 dCas9-SSAP는 100% 녹-인 성공을 달성했다(검정 민감도의 한계 내에서, 방법 참조).

표적외 오류 분석. 본 발명자들은 게놈 전체 전이유전자 삽입 검정을 통해 dCas9-SSAP 편집의 표적외 녹-인 오류를 평가했다(도 39c-39e, 도 49). 간략하게, 본 발명자들은 고분자량 게놈 DNA를 단리했고, 그 다음 단편화 및 UMI-어댑터 결찰을 수행했고, 그 다음 게놈 내 삽입 부위의 비편향 식별을 위해 전이유전자 특이적 프라이머를 사용했다(도 39c). Cas9 게놈 전체의 표적외 작업(방법)에서 수정된 이전에 검증된 분석 파이프라인을 통해 본 발명자들은 고-풍부도(high-abundance) 전이유전자 삽입 부위를 나타내는 판독의 농축된 피크를 식별할 수 있었다(도 39d). 이 분석을 위해, 본 발명자들은 또한 모든 그룹이 동일한 시퀀싱 깊이/커버리지를 갖도록 하기 위해 다운샘플링을 수행했다. 총 정렬된 판독의 1%를 초과하는 삽입 부위를 고려하면, 본 발명자들의 결과는 dCas9-SSAP가 표적외 삽입 부위를 검출하지 못한 반면, Cas9 기준은 상당한 수의 표적외 오류 부위를 야기했음을 확인시켜 주었다(도 39e). 특히, 모든 dCas9-SSAP 샘플에서, 본 발명자들이 적어도 하나의 UMI가 정렬된 모든 부위를 고려한 경우, Cas9 편집기와 대조적으로 표적외 부위가 훨씬 적었다(도 49). 이 결과는 dCas9-SSAP가 긴 서열 녹-인에서 두드러진 표적외 문제를 해결하는 데 도움을 줄 수 있음을 시사한다.

세포 적합성 효과 및 편집 수율 분석. 본 발명자들은 또한 Cas9/dCas9 기반 편집을 거친 세포의 적합성을 비교했다. 본 발명자들은 2개의 표적 부위를 실험했고 본 발명자들의 데이터는 dCas9 편집이 일반적으로 Cas9 편집보다 더 높은 세포 적합성을 야기한다는 것을 시사한다(도 39f, 39g, 편집 후 살아있는 세포의 정규화된 백분율에 의해 한정됨).

완전한 이해를 위해, 본 발명자들은 Cas9 기준과 비교하여 dCas9-SSAP에 대한 편집 수율을 요약했다. 본 발명자들은 정확한 녹-인의 백분율, 오류가 있는 녹-인의 백분율, 그리고 녹-인이 없는 표적상의 인델의 백분율을 표로 작성했으며, 여기서 후자 2개의 합은 총 표적상의 오류이다(도 39h). 또한, 본 발명자들은 성공적인 녹-인 세포와 총 편집된 세포 사이의 비율에 의해 정의되는 전반적인 편집 정확성 비율을 측정했다(도 39h). 이 분석에서 본 발명자들은 Cas9 편집기가 긴 서열 편집에서 빈번한 오류를 겪는다는 것을 관찰했고, 여기서 잘못된 편집의 백분율은 수율보다 훨씬 높고, 이들의 정확성 비율은 10% 내지 38% 범위이다. dCas9-SSAP는 최고의 Cas9 기준과 유사한 수준의 녹-인 수율을 나타냈지만, 최소 오류를 나타내고 게놈 유전자좌 전체에서 90%-99%의 정확성 비율을 달성했다.

Cas9 편집을 통한 dCas9-SSAP 편집의 효율성 벤치마킹

dCas9-SSAP가 녹-인 편집에 대해 더 높은 정확성을 갖는다는 사실을 확립한 후, 본 발명자들은 그 효율성 및 용도를 추가로 검증했다. 본 발명자들은 다양한 세포주에 걸쳐 편집 효율성을 벤치마킹했다. 벤치마크를 위해, 본 발명자들은 3개의 HDR 강화 도구를 포함하는 닉형성 기반 Cas9(nCas9) 편집기 및 야생형 모두를 사용하여 실험했다. 본 발명자들은 인간 HEK293T 세포의 3개의 게놈 표적에 걸쳐 1kb 녹-인 활성을 조사했다. 이 비교의 결과는 dCas9-SSAP가 Cas9, nCas9 및 nCas9-hRAD51 니카제 편집기보다 더 높은 효율성을 달성했으며, 2개의 공개된 HDR 강화 편집기인 Cas9-HE 및 Cas9-GEM과 비슷한 효율성을 달성했음을 입증했다(도 40a). 추가적으로, 본 발명자들의 데이터는 단일 가이드 dCas9-SSAP 편집기가 효과적인 녹-인에 충분했으며, 2개의 가이드 RNA를 사용한 경우 작은 개선이 있었음을 보여주었다(도 50). 따라서 본 발명자들은 dCas9-SSAP가 Cas9 기반 편집기와 유사한 수준의 효율성을 가지고 있다는 결론을 내렸다.

다음으로, 본 발명자들은 상이한 공여자 DNA 설계를 사용하여 dCas9-SSAP의 편집 효율성을 평가했다(도 40c). 본 발명자들의 결과는 MMEJ 공여자보다 HDR을 사용할 때 SSAP-매개 편집이 더 효율적이며 더 긴 HA가 일반적으로 더 높은 편집 효율성을 초래한다는 것을 나타냈다. 본 발명자들은 녹-인을 위한 서열이 이중 FP 녹-인의 경우 최대 2kb로 길이가 가변적일 때, dCAS9-SSAP의 편집 효율성을 평가했다(도 40d). 본 발명자들의 데이터는 dCas9-SSAP가 테스트된 전이유전자 길이에 걸쳐 Cas9 기준과 비슷하고 종종 더 높은 효율성으로 일관된 성능을 갖는다는 것을 보여주었다(도 40d).

마지막으로, 본 발명자들은 dCas9-SSAP 편집기가 게놈 표적에 걸쳐 강력한 활성을 갖는지, 그리고 한 모델 세포주 이상으로 보다 어려운 사례에 적용 가능한지를 테스트했다. 본 발명자들은 3개의 이전에 테스트된 유전자좌(DYNLT1, HSP90AA1, ACTB) 외에 하우스 키핑 유전자(BCAP31, HIST1H2BK, CLTA, RAB11A)로부터 4개의 추가적인 내인성 유전자좌를 선택했다(도 40e). 모든 게놈 부위에 걸쳐 dCas9-SSAP 편집기는 선택 없이 최대 12%의 효율성을 입증했으며, 이는 동일한 공여자를 사용하는 Cas9 기준보다 비슷하고 종종 약간 더 높은 것이다(도 40e). 또한, 본 발명자들은 별개의 조직 기원을 갖는 3개의 세포주(자궁경부 유래 HeLa 세포, 간 유래 HepG2 세포, 및 뼈 유래 U-2OS 세포)에 dCas9-SSAP를 적용했다. 본 발명자들은 3개 세포주 모두에서 Cas9 기준과 비교 가능한 일관된 녹-인 효율성을 관찰했다(도 51). 마지막으로, 본 발명자들은 인간 배아 줄기 세포(hESC)에서 dCas9-SSAP 편집기를 사용하여 보다 치료적으로 적절한 환경으로 서열을 조작했다. 본 발명자들은 테스트된 3개의 게놈 부위 모두에 걸쳐 강력한 녹-인 편집 활성을 관찰했다(도 40f, 40g). 주목할 점은, dCas9-SSAP 편집에 짧은 약 200-bp HA를 사용했고 선택 없이 kb 규모 편집에 대해 최대 약 3%의 효율성을 달성했으며, 이는 인간 줄기 세포에서 Cas9 기준과 비슷하고 종종 더 높은 것이었다(도 40g, 도 52).

화학적 교란은 dCas9-SSAP 유전자 편집이 내인성 DNA 복구 경로에 의존성이 적다는 것을 시사한다

dCas9-SSAP가 DNA 절단이나 내인성 복구 경로에 대한 의존성 없이 유전자 편집을 수행하는 본 발명자들의 모델을 상기해 보자. dCas9-SSAP 편집의 본성을 더 잘 이해하기 위해, 본 발명자들은 3가지 직교성 화학적 교란을 사용하여 이의 메커니즘을 탐침했다(도 41).

먼저, 본 발명자들은 dCas9-SSAP 편집이 Cas9 편집처럼 DSB 복구 경로에 의존하는지 조사한다(도 41a). Cas9 매개 녹-인에서 Mre11-Rad50-Nbs1(MRN) 복합체에 의한 DSB 인식은 하류 HDR 복구에 필수적인 단계이다. 본 발명자들은 MRN 복합체 형성, ATM 활성화 및 Mre11 엑소뉴클레아제 활성을 방지하는 것으로 밝혀진 DSB 복구의 강력한 화학적 억제제인 Mirin을 활용했다. 본 발명자들은 세포를 Mirin으로 처리했고, 이들 세포에 대한 dCas9-SSAP 및 Cas9 기준의 편집 효율성을 테스트했다. 모든 게놈 표적에 걸쳐, 본 발명자들은 dCas9-SSAP 효율성이 Mirin 처리에 의해 거의 영향을 받지 않았으며 비히클 처리 그룹과 본질적으로 동일하다는 것을 관찰했다(도 41b, Mirin). 한편, Cas9 기준은 Mirin 처리 하에서 편집 효율성을 실질적으로 감소시킨 것으로 입증되었고, 이는 Cas9 편집이 DSB 복구에 의존적임을 시사한다(도 41b, Mirin).

둘째, 본 발명자들은 HDR 경로에 대한 dCas9-SSAP의 의존성을 조사했다. 본 발명자들은 이 속도 제한 단계를 차단하기 위해 HDR 효소 RAD51, RI-1 및 B02의 2가지 소분자 억제제를 사용했다. 본 발명자들의 데이터는 이들 두 억제제를 통한 RAD51 활성 차단이 모든 게놈 표적에서 Cas9 편집 효율성을 크게 감소시켰지만, dCas9-SSAP 편집에는 유의미한 영향을 미치지 않았음을 보여주었다(도 41b, RI1 및 B02). 이 2가지 복구 조정 실험은 일관된 결과를 생성했다: dCas9-SSAP는 Cas9 기준보다 내인성 DNA 복구 메커니즘에 대한 훨씬 적은 의존성을 보여주었다. 이들은 dCas9-SSAP가 dCas9-가이드RNA 복합체에 의해 동원된 경우 SSAP의 활성을 통해 작용하며 Cas9 편집과 차이가 있음을 시사한다.

셋째, 본 발명자들은 세포 주기가 dCas9-SSAP 편집기에 어떻게 영향을 미치는지 조사했다. 세포 주기는 포유류 게놈의 접근성을 촉진하는 것으로 나타났다. 보다 구체적으로, 게놈 복제(S기 동안)는 dCas9가 DNA를 풀고 SSAP 매개 재조합을 허용하는 데 유리한 환경을 제공할 수 있다(도 41c). 이 잠재적 효과를 테스트하기 위해 이중 티미딘 차단(DTB)을 사용하여 G1/S 경계로 세포를 동기화했다. DTB 처리는 실제로 dCas9-SSAP 편집 효율성을 감소시켰다(도 41d). 그럼에도 불구하고, 본 발명자들이 Mirin, RI-1 또는 B02를 DTB 처리와 조합한 경우, dCas9-SSAP는 테스트된 게놈 유전자좌에 걸쳐 Cas9 기준보다 더 높은 편집 효율성을 유지했다(도 41d). 이는 dCas9-SSAP 편집기가 내인성 복구 경로에 대한 의존도가 낮다는 것을 더욱 뒷받침했다.

종합해 보면, 본 발명자들의 데이터는 dCas9-SSAP 편집의 가설적 메커니즘을 뒷받침했다: RNA 가이드된 dCas9는 게놈 표적에 결합하여 SSAP가 접근할 수 있게 하므로, SSAP는 임의의 DNA 파손을 생성함이 없이 상동성 유도 재조합을 촉진할 것이다(도 38a). 이 과정에 대한 더 깊은 이해는 추가 조사, 예를 들어 포유류 게놈 접근성을 교란시키기 위해 유전자 편집 또는 추가 검정을 수행할 때, dCas9-SSAP 복합체의 생체물리학적 분석을 필요로 할 것이다.

편리한 전달을 위한 dCas9-SSAP 유전자 편집 도구의 최소화

마지막으로, 향후 잠재적인 적용예에 대해 dCas9-SSAP 편집기를 최적화하기 위해, 본 발명자들은 AAV와 같은 바이러스 벡터의 크기 제한에 적합한 최소 버전을 개발하고자 했다. 본 발명자들은 2차 구조 예측을 기반으로 14개의 서로 다른 절두형 EcRecT 변이체를 설계하고(도 42a, 도 53), 전체 길이 dCas9-SSAP 대조군과 함께 유전자 편집 활성에 대해 모든 작제물을 테스트했다. 최적화 결과로부터, 본 발명자들은 원래의 전체 길이 RecT 기반 설계와 비슷한 효율성을 갖는 짧은 RecT 변이체(약 200aa 길이)를 식별했다(도 42b).

다음으로, 본 발명자들은 이 짧은 RecT 변이체를 보다 소형의 SaCas9 시스템 및 더 작은 N22-BoxB 앱타머 설계와 통합시켜, 최소 기능성 dSaCas9-mSSAP 편집기를 구축했다(도 42c). 이는 본 발명자들로 하여금 단일 AAV에 dSaCas9-mSSAP를 맞추고 긴 서열 편집을 위해 >=4kb 공여자 AAV를 이용할 수 있도록 했다(도 42c). 본 발명자들은 AAV2 입자의 전달을 통해 dSaCas9-mSSAP 편집기를 테스트했고, 이것이 HEK293T 세포에서 전체 길이 버전과 비슷한 효율성을 갖고 있음을 확인시켜 주었다(도 42d). 이 설계는 추가 생체내 검증을 필요로 하지만, dCas9 녹-인 편집기의 전달에 편리한 옵션을 제공할 수 있다.

토론

전반적으로, dCas9-SSAP 편집기는 CRISPR 게놈 표적화의 RNA 가이드된 프로그래밍 가능성을 파지 효소 RecT의 SSAP 활성과 조화시킨다. 이는 DNA 손상을 최소화하면서 긴 서열 편집을 가능하게 하고, 질병을 일으키는 큰 변이체를 수반하는 현재 난치성 질병 중 일부를 해결하거나, 선택 방법이 제한된 생체내 치료 유전자를 전달하거나, 또는 유전자 편집 동안 바람직하지 않은 변형을 최소화하기 위한 연구 및 치료 가능성을 제공한다. DNA 절단 후 내인성 복구 경로에 의존하는 다른 긴 서열 편집 방법과 비교하여, dCas9-SSAP 및 이의 미니 버전은 비절단 dCas9를 통한 상동성 매개 유전자 편집을 용이하게 한다. 이 효율적이고 오류가 낮은 기술은 기존 CRISPR 편집 도구에 대한 새롭고 보완적인 접근 방식을 제공한다.

재료 및 방법

플라스미드 작제

인간 코돈 최적화된 DNA 단편은 Genescript, Genewiz 및 IDT DNA로부터 주문했다. 재조합 효소를 암호화하는 단편은 Q5® High-Fidelity 2X Master Mix(New England BioLabs)를 사용하여 백본(addgene 플라스미드 #61423)에 Gibson 조립했다. 이러한 SSAP의 아미노산 서열은 표 8에서 찾을 수 있다. Golden Gate 클로닝을 사용하여 모든 sgRNA를 백본(dCas9-SSAP 및 dSaCas9-SSAP 플라스미드)에 삽입했다. gRNA 백본으로서 BbsI(dSpCas9) 및 BsaI(dSaCas9) 부위를 보유하는 dCas9-SSAP 플라스미드는 서열 검증되었다(Eton 및 Genewiz). 본 연구에 사용된 sgRNA 서열은 표 6에서 찾을 수 있다. 모든 dCas9-SSAP 플라스미드는 공개 접근을 위해 Addgene에 기탁될 것이다.

세포 배양

인간 배아 신장(HEK) 293T, Hela, HepG2 및 U2OS 세포를 둘베코 변형 이글 배지(DMEM, Life Technologies)에서 10% 소 태아 혈청(FBS, BenchMark), 100 U/mL 페니실린 및 100 μg/mL 스트렙토마이신(Life Technologies)과 함께 37℃, 5% CO₂에서 유지시켰다. HEK 293T, Hela, HepG2 및 U2OS 세포는 미국 모식균 배양 수집소(ATCC)에서 입수했다. 세포주의 신원은 STR(Short Tandem Repeat) 검정을 통해 정기적으로 인증하고, qPCR 검정을 사용하여 마이코플라스마의 존재에 대해 정기적으로 테스트한다.

hES-H9 세포는 5% CO2 하에 37℃에서 mTeSR1 배지(StemCell Technologies)에서 유지시켰다. 배양 플레이트는 사용 12시간 전에 Matrigel(Corning)로 사전 코팅했다. 각 계대 후 처음 24시간 동안 10μM Rho 키나제 억제제 Y27632(Sigma)를 첨가했다. 배양 배지는 24시간마다 교체했다.

형질감염

HEK293T, Hela, HepG2 및 U2OS 세포를 형질감염 12-24시간 전에 96-웰 플레이트(Corning)에 30,000개 세포/웰의 밀도로 파종하고, 웰당 250ng의 총 DNA를 형질감염시켰다. 세포가 ~70% 융합성일 때 제조업체의 지시에 따라 세포를 Lipofectamine 3000(Life Technologies)으로 형질감염시켰다. 간단히 말하면, 본 발명자들은 총 DNA 250ng, Lip3000 시약 0.4ul을 웰당 Opti-MEM 10ul과 혼합하여 사용했다. 250ng DNA의 경우, 본 발명자들은 160ng의 dCas9-SSAP 가이드 RNA 플라스미드(이중 sgRNAd 설계의 경우 동일한 양의 2개의 가이드 RNA 플라스미드를, 예를 들어 각각 80ng씩 사용함), 60ng의 pMCP-RecT 또는 GFP 대조 플라스미드(addgene # 64539) 및 30ng의 PCR 주형 DNA(PCR 프라이머는 표 7에서 찾을 수 있으며 주형 서열은 보충 서열에서 찾을 수 있음)를 사용했다. 3일 후, 세포는 FACS를 사용하여 분석했다.

전기천공

hES-H9 형질감염을 위해, P3 Primary Cell 4D-NucleofectorTM X Kit S(Lonza)를 제조업체의 프로토콜에 따라 사용했다. 간단히 말하면, hES-H9 세포를 Accutase(Innovative Cell Technology)를 사용하여 재현탁시키고 전기천공 전에 PBS로 2회 세척했다. 각 반응에 대해 DC100 Nucleofector 프로그램을 사용하여 20ul 전기천공 완충액에 혼합된 4μg 총 DNA로 300,000개의 세포를 핵감염시켰다. 4ug DNA의 경우, 본 발명자들은 2.6ug의 dCas9-SSAP 가이드 RNA 플라스미드(이중 sgRNAd 설계의 경우, 2개의 가이드 RNA 플라스미드를 동일한 양으로, 예를 들어 각각 1.3ug씩 사용함), 1 ug의 pMCP-RecT 또는 GFP 대조 플라스미드 및 0.4 ug의 PCR 주형 DNA(PCR 프라이머는 표 7에서 찾을 수 있고, 주형 서열은 보충 서열에서 찾을 수 있음)를 사용했다. 전기천공 후, 세포를 10uM Y27632가 첨가된 1mL의 mTeSR1 배지와 함께 12-웰 플레이트에 파종했다. 배양 배지는 24시간마다 교체했다. 4일 후, 세포는 FACS를 사용하여 분석했다.

형광 활성화 세포 분석(FACS)

mKate 녹-인 효율성은 CytoFLEX 유세포 분석기(Beckman Coulter; Stanford Stem Cell FACS Core)에서 분석했다. 형질감염 72시간 후 또는 전기천공 96시간 후에 세포를 PBS로 2회 세척하고 TrypLE Express Enzyme(Thermo Fisher Scientific)으로 해리시켰다. 그런 다음, 세포 현탁액은 96웰 U-바닥 플레이트(Thermo Fisher Scientific)로 옮기고 300g에서 5분간 원심분리했다. 상청액을 제거한 후, 펠릿화된 세포를 PBS 중의 4% FBS 50μl에 재현탁시키고, 제조 후 30분 이내에 세포를 분석했다.

녹-인 접합부의 Sanger 시퀀싱 및 NGS

플라스미드 DNA 및 HDR 주형으로 형질감염된 HEK293T 세포는 형질감염 72시간 후에 수확했다. 이들 세포의 게놈 DNA는 제조업체의 프로토콜에 따라 QuickExtract DNA 추출 용액(Biosearch Technologies)을 사용하여 추출했다. HDR 주형의 상동성 암 외측에서 특정 프라이머를 사용하여 표적 게놈 영역을 증폭시켰다. Sanger 시퀀싱 또는 NGS 분석에 사용된 프라이머는 표 7에서 찾을 수 있다. PCR 산물은 Monarch PCR & DNA Cleanup Kit(New England BioLabs)를 사용하여 정제했다. 100ng의 정제된 산물은 표적 특이적 프라이머(EtonBio 또는 Genewiz)를 사용한 Sanger 시퀀싱을 위해 보냈다.

HR 및 세포 주기 억제제를 이용한 처리

모든 억제제는 Sigma-Aldrich에서 주문했다. 다양한 억제제 검정을 위해 세포를 Mirin(Sigma, M9948-5MG, 25uM), B02(Sigma, SML0364, 10uM) 또는 RI-1(Sigma, 553514-10MG-M, 1uM)로 16시간 동안 전처리했다. 세포 주기 테스트를 위해, 세포를 티미딘(Sigma, T9250-1G, 2mM)으로 18시간 동안 전처리한 후 티미딘을 제거하고 티미딘 없이 일반 D10을 사용하여 9시간 동안 세포를 배양한 후 제2 티미딘을 추가 18시간 동안 2mM의 최종 농도로 첨가한다. 억제제 및 티미딘 이후, 세포는 제조업체의 지시에 따라 Lipofectamine 3000을 사용하여 dCas9-SSAP로 형질감염시켰다. 3일 후, 세포는 CytoFLEX 유세포 분석기에서 분석하고, 게놈 DNA는 또한 상기와 같이 시퀀싱 검증을 위해 수확했다.

차세대 시퀀싱 라이브러리 제조

형질감염 72시간 후, QuickExtract DNA 추출 용액(Biosearch Technologies)을 사용하여 게놈 DNA를 추출했다. NGS 라이브러리 제조에는 총 200 ng DNA가 사용되었다. 제1 라운드 PCR 반응을 위해 관심 유전자를 특이적 프라이머(표 7)를 사용하여 증폭시켰다. 표 7에 나열된 프라이머를 사용하는 제2 PCR을 통해 Illumina 어댑터와 인덱스 바코드를 단편에 첨가했다. 제2 PCR 산물은 Monarch DNA Gel Extraction Kit(New England BioLab)을 사용하여 2% E-겔에서 겔 전기영동으로 정제했다. 정제된 산물은 Qubit dsDNA HS Assay Kit(Thermo Fisher)로 정량화하고 쌍을 이룬-말단 PE300 키트를 사용하여 Illumina MiSeq 시스템에서 시퀀싱했다. 모든 시퀀싱 데이터는 NCBI SRA 아카이브에 기탁될 것이다.

TOPO 클로닝 실험

TOPO 클로닝 실험에는 총 250 ng의 게놈 DNA가 사용되었다. Phusion Flash High-Fidelity PCR Master Mix(ThermoScientific, F-548L)를 사용하여 DYNLT1 또는 HSP90AA1 유전자좌(표 7)를 표적으로 하는 특이적 TA 콜로니 프라이머를 사용하여 녹-인 이벤트를 증폭시켰다. 표적화된 PCR 산물은 제조업체의 지침에 따라 겔 추출 키트(New England BioLabs, T1020L)를 사용하여 정제한다. 72C에서 30분 동안 인큐베이션을 통해 Taq 중합효소(New England BioLabs, M0273S)를 사용하여 PCR 산물에 a-꼬리를 첨가한다. TOPO 클로닝 반응 및 형질전환을 제조업체의 지침(Thermo Scientific, K457501)에 따라 설정한다. M13F(5'-GTAAAACGACGGCCAG-3') 및 M13R(5'-CAGGAAACAGCTATGAC-3') 프라이머를 사용한 RCA/콜로니 시퀀싱을 위해 콜로니 플레이트를 보낸다. 서열 결과는 SnapGene 소프트웨어를 사용하여 분석했다.

고처리량의 시퀀싱 데이터 분석

처리된(역다중화, 트리밍 및 병합) 시퀀싱 판독을 분석하여 시퀀싱된 앰플리콘을 기준 및 예상 HDR 앰플리콘에 정렬시켜 CRISPPresso2를 사용하여 편집 결과를 결정했다. 다양한 편집 결과를 더 잘 포착하기 위해 예상 절단 부위 주변의 10bp까지 정량 창을 증가시켰지만, 시퀀싱 오류가 포함되지 않도록 치환은 무시했다. HDR 정량화에는 예상된 앰플리콘에 대한 불일치를 함유하지 않는 판독만을 고려했다; 예상된 앰플리콘과 부분적으로 일치하는 인델을 함유하는 판독은 보고된 전체 인델 빈도에 포함되었다. 계산 작업은 스탠포드 유전학과의 GBSC(유전학 생물정보학 서비스 센터)가 주관한 SCG 클러스터에 의해 뒷받침되었다. 데이터 분석을 위한 모든 맞춤형 스크립트는 Cong Lab의 Github에 기탁될 것이며 다운로드할 수 있다.

삽입 부위 매핑 및 분석

본 발명자들은 이전에 개발되고(GIS-seq), 본 발명자들의 이전 연구에서의 유사한 프로토콜에 따라 mKate 녹-인의 게놈 전체, 비편향 표적외 분석을 위해 조정된 공정을 사용하고 있다. 간략하게, 본 발명자들은 형질감염 3일 후 HEK293T 세포를 수확한다. 게놈 DNA는 DNAdvance 게놈 DNA 키트(A48705, Beckman Coulter)를 통해 다음 단계에서 주형 오염을 피하기 위해 크기-선택했다. 400ng의 정제된 게놈 DNA를 NEB Fragmentase를 사용하여 평균 500bp로 단편화하고 어댑터로 결찰시킨 다음, NEBNext Ultra II FS DNA Library Prep 키트를 사용하여 제조업체의 지침에 따라 크기-선택했다. 2 라운드의 중첩 고정 PCR에 따라 표적화된 DNA(녹-인 서열의 말단부터 결찰된 어댑터 서열까지)를 증폭시키고 NEBNext Ultra II FS DNA 라이브러리 Prep 키트 프로토콜에 따라 크기-선택 정제를 수행한다. 라이브러리는 Illumina Miseq V3 PE600 키트를 사용하여 시퀀싱했다. 시퀀싱 데이터를 분석하여 표적외 삽입 이벤트를 결정했고, 모든 분석 코드는 Github(github.com/cong-lab)에 기탁했다.

통계 분석

달리 명시하지 않는 한, 모든 통계 분석 및 비교는 Benjamini, Krieger 및 Yekutieli의 2단계 스텝업 방법을 사용하여 1% FDR(false-discovery-rate)로 t-테스트를 사용하여 수행했다. 분석에서 충분한 통계적 검정력을 보장하기 위해 달리 명시되지 않는 한 모든 실험은 3회 반복으로 수행했다.

SSAP 마이닝 과정

초기 SSAP 스크리닝을 위해, 본 발명자들은 박테리오파지 람다, E. 콜라이 Rac 프로파지 및 박테리오파지 T7로부터 3가지 주요 파지 재조합 효소 계열을 식별하고 보충 서열에 나열된 바와 같은 1차 효소 서열을 추출했다.

RecT-유사 SSAP 마이닝의 경우. RefSeq 비중복 단백질 데이터베이스는 2019년 10월 29일자로 NCBI에서 다운로드되었다. 본 발명자들은 NCBI 비중복 서열 데이터베이스에서 RecT 상동체에 대해 체계적으로 검색했다. 본 발명자들의 검색은 2가지 지침을 따른다: 1) 밀접하게 관련된 후보는 차별적인 활성을 가질 가능성이 적음; 2) 진핵세포에서 이종 발현될 때 잘 기능하는 미생물 효소는 예측하기 어려워, RecT 상동체의 다양한 진화 분지를 샘플링하는 것이 이상적일 것임. 2,071개 후보의 큰 세트를 식별한 후, 본 발명자들은 계통발생수를 구축하고 서열 상동성이 높은 단백질을 필터링한 후 대표적인 후보를 선택했다. 그런 다음, 본 발명자들은 적어도 10% 서열 분기성 및 크기의 임계값을 최대 300-aa로 사용하여(합성하기 어렵고 휴대성이 떨어지는 극도로 큰 단백질을 피하기 위해) 적중률을 개선하고, 진화 분기를 무작위로 샘플링하여 16개 SSAP의 최종 목록을 수득했다(도 38e, 도 44). 전반적으로, SSAP 후보는 이들의 생화학적 활성에 중요하다고 이전에 시사되었던 보존된 영역을 보유하면서 상당한 진화 및 서열 이질성을 갖는다.

RecT 상동체 간의 다중 서열 정렬에는 온라인 도구(T-Coffee: tcoffee.crg.cat/apps/tcoffee/do:regular)를 사용했다.

Cas9 HDR, Cas9 MMEJ 및 dCas9-SSAP를 비교하는 공여자 설계 테스트

도 38f에 도시된 바와 같이, 본 발명자들은 상이한 공여자 DNA 설계를 이용하여 새로운 편집기를 테스트했다. 본 발명자들은 상동성 암(HA) 길이 설계가 상이한 3가지 주요 유형의 공여자 DNA를 고려했다. 구체적으로, 본 발명자들은 다음을 합성했다: 1) 긴 서열 조작 및 전이유전자 녹-인을 위한 표준 형식인, 긴 HA(>=100bp)를 보유하는 HDR 공여자; 2) DSB 매개 녹-인에 대한 편집 효율성을 개선하는 것으로 밝혀진, 전형적으로 짧은 HA(<= 50bp)를 갖는 MMEJ 공여자; 3) Cas9 유도 DSB로 인해 공여자 통합 수준을 측정하는 데 도움을 줄 수 있는 HA(0bp)가 없는 NHEJ 공여자. 이 테스트로부터 본 발명자들의 결과는 Cas9 유전자 편집과 구별되는 dCas9-SSAP의 2가지 특성을 드러냈다.

첫째, 임의의 HA(도 38f에서 강조 표시된 상자)가 없는 NHEJ 공여자의 경우, 본 발명자들은 Cas9 편집기를 사용할 때 녹-인 카세트 발현을 관찰했지만, dCas9-SSAP 편집기에서는 관찰되지 않았다(도 38f). 이는 Cas9 매개 DSB가 NHEJ 매개 공여자 DNA 삽입을 유도할 수 있다는 이전 보고와 일치하지만, 이러한 통합은 비절단 dCas9-SSAP를 사용할 때 최소화된다(도 38f, NHEJ 0bp 공여자를 갖는 dCas9-SSAP).

둘째, dCas9-SSAP는 MMEJ 공여자를 사용할 때 녹-인 효율성의 부스트를 보여준 Cas9 편집기와 달리, HA가 HDR 유형인지 MMEJ 유형인지 여부에 관계없이, 공여자 내의 연속적으로 더 긴 HA로부터 이익을 얻었다(도 38f, HDR 및 MMEJ 공여자). 이는 MMEJ 공여자를 사용할 때 강화 효과가 표적 게놈 부위의 Cas9 절단에 의존적이라는 가정과 일치한다.

또한, 이 작업의 초점은 긴 서열 조작이지만, 본 발명자들은 또한 더 짧은 서열 편집을 위해 dCas9-SSAP를 테스트했고(도 45), 인간 HEK293T 세포에서 EMX1 유전자좌에 16-bp 서열의 정확한 녹-인을 관찰했다. 이 실험을 통해 본 발명자들은 딥 시퀀싱을 사용하는 Cas9 기반 편집기와 비교하여 dCas9-SSAP를 사용할 때 최소한의 인델 형성을 검증할 수 있었다(도 45b).

요약하면, dCas9-SSAP 편집은 HDR 공여자를 사용할 때 가장 효율적이게 되고, 일반적으로 상동성 암이 길어지면 편집 효율성이 더 높아진다.

dCas9-SSAP 플라스미드를 사용한 단계별 유전자 편집 프로토콜

A. 표적 게놈 유전자좌에서 가이드 RNA 서열의 설계

이 단계는 표준 Cas9 실험과 동일하다. 간단히 말하면, 사용된 Cas9 효소에 기초하여, 녹-인 또는 편집 부위 근처의 표적 서열(보통 20bp)이 프로토스페이서 인접 모티프(PAM) 다음에 선택될 수 있다. SpCas9의 경우 "NGG"를 사용하고 SaCas9의 경우 "NNGRRT"를 사용한다. 본 발명자들은 가이드 서열의 첫 번째 염기가 "G"가 아닌 경우 U6/Pol-III 전사 개시를 용이하게 하기 위해 일반적으로 가이드 서열의 시작에 추가 "G" 염기를 첨부한다. 이하에 제시된 바와 같이, 골든 게이트 클로닝 오버행을 갖는 2개의 DNA 올리고가 선택된 가이드에 기초하여 주문될 수 있다.

N은 가이드 서열을 나타낸다. 이 클로닝에는 표준 탈염 올리고이면 충분하다. 상기 2개의 올리고는 어닐링되어 다음 단계에서 삽입 단편을 형성할 것이다.

B. 각 가이드 RNA 표적에 대한 2개 DNA 올리고의 어닐링. 아래 반응 설정을 통해 각 올리고 쌍의 인산화 및 어닐링을 수행한다.

다음 매개변수를 사용하여 열순환기에서 어닐링한다:

37C 30분

95C 5분 및 그 다음 5 C/min의 속도로 25C까지 감소

C1. 어닐링된 올리고의 sgRNA/dspCas9(dCas9-SSAP) 플라스미드로의 골든 게이트 클로닝

야생형 Cas9 테스트의 경우, 하나의 가이드 RNA가 필요하며 클로닝을 위한 백본 벡터는 단계 B의 어닐링된 올리고와 일치하는 BbsI 클로닝 부위를 보유할 것이다. 이 단계를 위한 야생형 Cas9 플라스미드는 다음과 같을 것이다: pCas9-MS2 -BB_BbsI(프로토콜 마지막에 있는 플라스미드 목록 참조)

이 프로토콜은 최소량의 효소를 사용하며 필요에 따라 스케일업될 수 있다. 골든 게이트 반응(얼음 상에서)을 설정한 후, 즉시 반응물을 Thermocycler로 옮기고, 다음 매개변수를 사용하여 골든 게이트 반응을 수행한다:

37C 5분

16C 5분

약 25회 사이클동안 순환, 효율성을 극대화하기 위해 최대 50회 추가적인 주기가 사용될 수 있음

65C 5분

4C 유지

반응 후, 실험실에서 사용된 컴피턴트 세포의 표준 프로토콜에 따라 박테리아 형질전환을 수행한다.

C2. 어닐링된 올리고의 sgRNA/dspCas9(dCas9-SSAP) 플라스미드로의 골든 게이트 클로닝

dSpCas9를 사용하는 dCas9-SSAP의 경우, 1개 또는 2개의 가이드 RNA가 사용될 수 있고, 이중 가이드 RNA가 약간 더 나은 편집 효율성을 제공한다. 클로닝을 위한 백본 벡터는 단계 B의 어닐링된 올리고와 일치하는 BbsI 클로닝 부위를 보유할 것이다. 이 단계의 dCas9-SSAP 플라스미드는 다음과 같을 것이다: pdCas9-SSAP-MS2-BB_BbsI(프로토콜 마지막에 플라스미드 목록 참조)

골든 게이트 반응 설정 및 형질전환 단계는 상기와 유사하다.

D. HDR 주형의 제조

연구에 사용된 주형에 대해서는 보충 서열을 참조하고 주형 설계의 예는 도 38에 예시되어 있다. 본 발명자들은 삽입/대체 서열의 각 말단(주형의 편집된 부분)에 적어도 200bp의 상동성 암이 있는 dsDNA 주형을 사용하는 것을 권장한다. 본 발명자들은 주형을 pUC19와 같은 간단한 플라스미드에 클로닝한 다음, 플라스미드의 제한 분해 또는 표준 PCR(표 7에 나열된 것과 같은 프라이머 사용)을 사용하여 대량의 dsDNA 주형을 생성할 수 있음을 시사한다.

E. dCas9-SSAP 플라스미드 및 주형 DNA의 전달을 통해 유전자 편집 수행

이전 단계를 통해 dCas9-SSAP 편집 방법의 3가지 구성요소를 실험에 준비한다: 가이드 RNA/Cas9 플라스미드(단계 A-C에서 클로닝됨), 주형 DNA(단계 D로부터) 및 SSAP 플라스미드(pMCP-RecT는 Addgene에서 구할 수 있음). 시험관 내에서 세포로 전달하기 위해, 일상적인 형질감염 또는 전기천공은 시약 또는 장비 제조업체가 권장하는 조건에 따라 수행하고 세포 유형에 기초하여 선택할 수 있다. 한 예로서, HEK293T 세포의 경우, 전형적인 형질감염 조건은 이하에 기술된다:

1. 형질감염 1일 전, 96-웰 플레이트의 각 웰에 3E4 HEK293T/Hela/HepG2/U2OS 세포를 파종하고, 형질감염 시 세포 밀도는 다음 날 약 70%여야 한다.

2. 형질감염 시약인 리포펙타민 3000의 경우, 총 250ng DNA + 0.4ul Lip3000 시약(ea.)을 사용하고 제조업체의 프로토콜에서와 같이 웰당 10ul의 Opti-MEM을 사용하여 시약 준비를 수행한다.

3. 형질감염 재료:

dCas9-SSAP 가이드 RNA 플라스미드, 160ng(이중 sgRNAd 설계의 경우, 동일한 양의 2개의 가이드 RNA 플라스미드 사용함, 예를 들어, 각각 80ng); pMCP-RecT 또는 GFP 대조 플라스미드, 60ng; 주형 DNA, 최대 30ng.

4. 플라스미드를 주형 DNA와 혼합하고 HEK293T/Hela/HepG2/U2OS 세포에 대해 제조업체의 프로토콜에 따라 형질감염을 수행한다.

5. 형질감염 12-24시간 후, 해당되는 경우 새로운 배지로 교환할 수 있음.

6. 형질감염 후 적어도 3일 후에, 세포를 수확하거나 필요에 따라 하류 실험 또는 분석을 진행할 수 있다.

gRNA에 대한 서열은 표 6에 제공된다. 가이드 RNA 명칭의 주석은 다음과 같다: sp로 시작하는 가이드는 SpCas9 가이드 RNA 표적을 나타내고, dsp로 시작하는 가이드는 dSpCas9 가이드 RNA 표적을 나타낸다.

[표 6]

표 7은 프라이머 서열을 제공한다.

DNA 주형 생성, 표적화된 시퀀싱 및 NGS 검정에 사용되는 프라이머의 서열은 이하에 나열된다. 모든 NGS 어댑터 서열은 밑줄이 그어진 색으로 표시된다.

[표 7]

표 8은 본 실시예에서 테스트된 특정 SSAP에 대한 서열을 제공한다.

[표 8]

주형 DNA 서열

대체된 또는 삽입체 편집 서열의 주석은 각 주형과 함께 이하에 자세히 설명된다. 달리 명시되지 않는 한, 실시예에서 상이한 상동성 암이 사용되는 경우, 본 발명자들은 표 7에 나열된 프라이머를 사용하여 상이한 상동성 암 길이를 갖는 주형을 수득했다.

실시예 19

mKate 녹-인 검정을 사용한 내인성 게놈 표적(ACTB, HSP90AA1)에 대한 어레이된 SSAP 라이브러리 스크리닝.

SSAP 암호 플라스미드를 정제하고 정량화했다.

음성 대조군(유전자 편집을 촉진할 것으로 예상되지 않는 Flag_HA를 암호화하는 동일한 플라스미드)을 포함하는 각 SSAP 암호화 플라스미드를 2회 반복으로 테스트했다. 형질감염은 96웰 플레이트에서 이루어졌으며 형질감염 효율은 50%로 추정되었다.

녹-인 주형:

1. HSP90AA1: PCR 주형으로서 gCK240+241, tm 66.1C, mKate/pCK1451/pCK1452

2. ACTB: PCR 주형LG로서 gCK115+116, tm 63.6C, mKate/pCK1453/pCK1454

형질감염 3일 후, mKate 양성 세포 및 세포 생존력은 양성(원래 RecT SSAP) 및 음성(Flag-HA 대조 단백질) 대조군과 함께 모든 반복물에 걸쳐 정량화했다. mKate+ 세포의 빈도가 높을수록 후보 SSAP가 더욱 활성임을 나타낸다(즉, 킬로베이스 규모 전이유전자의 정밀한 녹-인 편집을 중재하는 능력이 더 높음). 동시에, 포유류 세포에 대한 SSAP의 적합도 효과를 정량화하는 데 도움을 주기 위해, 유세포 분석을 통해 살아있는 세포 수로 세포 생존력을 측정했다.

도 55는 ACTB 표적 및 HSP90AA1 표적에 대한 음성 대조군 대비 배수, 또는 mKate 녹-인 및 세포 생존력의 퍼센트로서 편집 효율을 나타내는 SSAP 어레이 스크리닝 결과를 보여준다. 도 56은 ACTB에서의 편집 효율성과 비교하여 HSP90AA에서의 정규화된(56a) 및 절대(56b) 편집 효율성을 보여준다. 도 56c는 HSP90AA1 녹-인에 대한 SSAP 사용을 ACTB 녹-인과 비교하여 세포 생존력을 보여준다. 도 57은 모든 표적 및 (a, b)에 대비하여 정규화(a) 및 절대적(b) 세포 생존력 및 편집 효율성을 비교한 플롯을 제공하고, 각각의 SSAP 후보에 대해 ACTB 및 HSP90에서 정규화(c) 또는 절대적(d) 편집 효율성을 예시하는 막대 그래프를 제공한다.

몇몇 상위 표적에 대한 관련 단백질 및 서열 정렬을 묘사하는 정렬 및 계통발생수는 도 58, 59 및 60에 제공된다. 정렬은 예측된 3D 구조 영역과 일치하는 특정 보존 영역 및 모티프를 나타낸다(예를 들어, 도 36, 37, 44, 53). 적어도 3개 영역은 고도로 보존된다: (1) N 말단 부분에는 S/N/Y-R/K-F/L/I-풍부 영역이 있고, 이는 세린/티로신 재조합효소 모티프를 닮은 것이며; (2) 중간 부분에는 M-R/K-R/K-풍부 영역이 있고; (3) C-말단 부분에는 D/E-D/E-F/Y 영역이 포함되고, 이는 트랜스포사제 유사 모티프를 닮은 것이다. 일부 SSAP 후보에는 이러한 영역이 하나 이상 있을 수 있다. 이는 SSAP의 예측된 3D 구조 및 고하전된 아미노산을 통한 상동성 기반 재조합을 촉진하는 DNA와 SSAP의 상호작용과도 일치한다.

최고 점수의 SSAP 단백질은 표 9에 제시되어 있다. 이 표는 두 표적(HSP90 및 ACTB)의 정규화된 평균으로서의 편집 효율성, 절대적 편집 효율성 및 세포 생존력을 보여준다. SSAP 단백질은 Uniparc 기탁 번호 및 서열번호로 식별되어 있다. 정렬 번호는 도 58, 59, 및 60의 SSAP에 상응한다.

[표 9]

참고문헌

본 명세서에 인용된 간행물, 특허 출원 및 특허를 포함한 모든 참고문헌은 각각의 참고문헌이 참고로 포함되는 것으로 개별적 및 구체적으로 나타내고 그 전체가 본원에 제시된 것처럼 동일한 정도로 본원에 참고로 포함된다.

본 발명을 수행하기 위해 본 발명자들에게 알려진 최상의 모드를 포함한 본 발명의 바람직한 실시양태가 본원에 기술되어 있다. 이러한 바람직한 실시양태의 변형은 전술한 설명을 읽으면 관련 기술분야의 기술자에게 명백해질 수 있다. 본 발명자들은 숙련된 기술자라면 이러한 변형을 적절하게 이용할 것으로 예상하며, 본 발명자들은 본 발명이 본원에 구체적으로 기술된 것과 다르게 실시되기를 의도한다. 따라서, 본 발명은 해당 법률이 허용하는 한, 여기에 첨부되는 청구범위에 인용된 주제의 모든 수정 및 등가물을 포함한다. 더욱이, 이러한 모든 가능한 변형에서 전술한 요소의 임의의 조합은 본원에 달리 명시되지 않거나 또는 문맥상 달리 명확하게 모순되지 않는 한, 본 발명에 의해 포괄된다.

* * *

이와 같이 본 발명의 바람직한 실시양태를 상세하게 설명하였지만, 상기 문단에 의해 정의된 본 발명은 본 발명의 사상 또는 범위를 벗어남이 없이 많은 명백한 변형이 가능하기 때문에 상기 설명에 제시된 특정 세부사항에 제한되지 않는 것으로 이해되어야 한다.

Claims

Cas 단백질;
표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자; 및
재조합 단백질
을 포함하는 시스템으로서,
여기서, 상기 재조합 단백질은 엑소뉴클레아제, 단일 가닥 DNA 어닐링 단백질(SSAP), 또는 단일 가닥 DNA 결합 단백질(SSB), 또는 이들 중 2개 이상의 조합을 포함하는, 시스템.
제1항에 있어서, 상기 재조합 단백질이 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 시스템.
제1항에 있어서, 상기 재조합 단백질이 표 9의 재조합 단백질과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 시스템.
제1항에 있어서, 상기 재조합 단백질이 서열번호 179, 서열번호 185, 서열번호 205, 서열번호 321, 서열번호 353, 서열번호 359, 서열번호 366, 서열번호 424, 또는 서열번호 479와 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 시스템.
제1항에 있어서, 상기 재조합 단백질이 서열번호 166, 서열번호 168, 서열번호 169, 서열번호 170, 서열번호 171, 서열번호 241, 서열번호 253, 서열번호 290, 서열번호 408, 서열번호 411, 또는 서열번호 442와 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 시스템.
제1항 내지 제5항 중 어느 한 항에 있어서, 다음을 포함하는 동원 시스템을 추가로 포함하는, 시스템:
적어도 하나의 앱타머 서열; 및
융합 단백질의 일부로서 미생물 재조합 단백질에 기능적으로 연결된 앱타머 결합 단백질.
제6항에 있어서, 상기 적어도 하나의 앱타머 서열이 RNA 앱타머 서열 또는 펩타이드 앱타머 서열인, 시스템.
제7항에 있어서, 상기 핵산 분자가 상기 적어도 하나의 RNA 앱타머 서열을 포함하는, 시스템.
제8항에 있어서, 상기 핵산 분자가 2개의 RNA 앱타머 서열을 포함하는, 시스템.
제9항에 있어서, 상기 2개의 RNA 앱타머 서열이 동일한 서열을 포함하는, 시스템.
제7항 내지 제10항 중 어느 한 항에 있어서, 상기 앱타머 결합 단백질이 MS2 외피 단백질, 또는 이의 기능성 유도체 또는 변이체를 포함하는, 시스템.
제7항 내지 제10항 중 어느 한 항에 있어서, 상기 앱타머 결합 단백질이 파지 N 펩타이드, 또는 이의 기능성 유도체 또는 변이체를 포함하는, 시스템.
제7항에 있어서, 상기 적어도 하나의 펩타이드 앱타머 서열이 상기 Cas 단백질에 접합되어 있는, 시스템.
제13항에 있어서, 상기 적어도 하나의 펩타이드 앱타머 서열이 1 내지 24개의 펩타이드 앱타머 서열을 포함하는, 시스템.
제13항 또는 제14항에 있어서, 상기 앱타머 서열이 동일한 서열을 포함하는 시스템.
제6항 내지 제7항 또는 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 앱타머 서열이 GCN4 펩타이드 서열을 포함하는, 시스템.
제6항 내지 제16항 중 어느 한 항에 있어서, 상기 재조합 단백질 N-말단이 상기 앱타머 결합 단백질 C-말단에 연결되는, 시스템.
제6항 내지 제17항 중 어느 한 항에 있어서, 상기 융합 단백질이 상기 미생물 재조합 단백질과 상기 앱타머 결합 단백질 사이에 링커를 추가로 포함하는, 시스템.
제18항에 있어서, 상기 링커가 서열번호 15의 아미노산 서열을 포함하는, 시스템.
제6항 내지 제19항 중 어느 한 항에 있어서, 상기 융합 단백질이 핵 국재화 서열을 추가로 포함하는 시스템.
제20항에 있어서, 상기 핵 국재화 서열이 서열번호 16의 아미노산 서열을 포함하는, 시스템.
제20항 또는 제21항에 있어서, 상기 핵 국재화 서열이 상기 재조합 단백질 C-말단 상에 있는, 시스템.
제1항 내지 제22항 중 어느 한 항에 있어서, 상기 Cas 단백질이 촉매적으로 죽은, 시스템.
제1항 내지 제23항 중 어느 한 항에 있어서, 상기 Cas 단백질이 Cas9 또는 Cas12a를 포함하는, 시스템.
제1항 내지 제24항 중 어느 한 항에 있어서, 상기 Cas9 단백질이 야생형 스트렙토코커스 피오게네스 Cas9 또는 야생형 스타필로코커스 아우레우스 Cas9를 포함하는, 시스템.
제1항 내지 제25항 중 어느 한 항에 있어서, 상기 Cas 단백질이 니카제(nickase)를 포함하는, 시스템.
제26항에 있어서, 상기 니카제가 D10A인 위치 10에 아미노산 치환을 갖는 야생형 스트렙토코커스 피오게네스(Streptococcs pyogenes) Cas9를 포함하는, 시스템.
제1항 내지 제27항 중 어느 한 항에 있어서, 공여자 핵산을 추가로 포함하는, 시스템.
제1항 내지 제28항 중 어느 한 항에 있어서, 상기 표적 DNA 서열이 숙주 세포의 게놈 DNA 서열인, 시스템.
앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드로서, 여기서 상기 재조합 단백질은 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 폴리뉴클레오타이드;
Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드; 및
표적 DNA 서열에 상보적인 가이드 RNA 서열 및 상기 앱타머 결합 단백질에 결합하는 앱타머를 포함하는 핵산 분자
를 포함하는 조성물.
앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드로서, 여기서 상기 재조합 단백질이 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 폴리뉴클레오타이드;
Cas 단백질을 암호화하는 핵산 서열 및 상기 앱타머 결합 단백질에 결합하는 적어도 하나의 펩타이드 앱타머 서열을 포함하는 폴리뉴클레오타이드; 및
표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자
를 포함하는 조성물.
앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드;
Cas 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드; 및
표적 DNA 서열에 상보적인 가이드 RNA 서열 및 상기 앱타머 결합 단백질에 결합하는 앱타머를 포함하는 핵산 분자
를 포함하고,
여기서, 상기 재조합 단백질은 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 벡터.
앱타머 결합 단백질에 기능적으로 연결된 재조합 단백질을 포함하는 융합 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오타이드;
Cas 단백질을 암호화하는 핵산 서열 및 상기 앱타머 결합 단백질에 결합하는 적어도 하나의 펩타이드 앱타머 서열을 포함하는 폴리뉴클레오타이드; 및
표적 DNA 서열에 상보적인 가이드 RNA 서열을 포함하는 핵산 분자
를 포함하고,
여기서, 상기 재조합 단백질은 서열번호 166 내지 서열번호 491의 재조합 단백질과 적어도 95% 동일성을 갖는 아미노산 서열을 포함하는, 벡터.
제1항 내지 제29항 중 어느 한 항의 시스템, 또는 제32항 내지 제33항 중 어느 한 항의 벡터를 포함하는 진핵 세포.
제1항 내지 제29항 중 어느 한 항의 시스템, 제30항 내지 제31항 중 어느 한 항의 조성물, 또는 제32항 내지 제33항 중 어느 한 항의 벡터를 표적 게놈 DNA 서열을 포함하는 세포 내로 도입시키는 것을 포함하는, 세포 내 표적 게놈 DNA 서열을 변경시키는 방법.
제35항에 있어서, 상기 세포가 포유류 세포인, 방법.
제35항 또는 제36항에 있어서, 상기 세포가 인간 세포인, 방법.
제35항 내지 제37항 중 어느 한 항에 있어서, 상기 세포가 줄기 세포인, 방법.
제35항 내지 제38항 중 어느 한 항에 있어서, 상기 표적 게놈 DNA 서열이 유전자 산물을 암호화하는, 방법.
제35항 내지 제39항 중 어느 한 항에 있어서, 상기 세포 내로 도입시키는 것이 대상체에게 투여하는 것을 포함하는, 방법.
제40항에 있어서, 상기 대상체가 인간인, 방법.
제40항 또는 제41항에 있어서, 상기 투여하는 것이 생체내 투여를 포함하는, 방법.
제40항 또는 제41항에 있어서, 상기 투여하는 것이 상기 시스템, 조성물 또는 벡터를 포함하는 생체외 처리된 세포의 이식을 포함하는, 방법.
세포 내 표적 DNA 서열을 변경하기 위한, 제1항 내지 제29항 중 어느 한 항의 시스템, 제30항 내지 제31항 중 어느 한 항의 조성물, 또는 제32항 내지 제33항 중 어느 한 항의 벡터의 용도.