KR20240045127A

KR20240045127A - 효소 반응을 통한 총 mRNA 기반 무작위 sgRNA 라이브러리 생성 방법

Info

Publication number: KR20240045127A
Application number: KR1020230129381A
Authority: KR
Inventors: 이정욱; 이지선; 조병관; 전하현; 최동희
Original assignee: 포항공과대학교 산학협력단; 한국과학기술원
Priority date: 2022-09-28
Filing date: 2023-09-26
Publication date: 2024-04-05
Also published as: WO2024072006A1

Abstract

본 발명은 효소 반응을 통한 총 mRNA 기반 무작위 sgRNA 라이브러리 생성 방법에 관한 것이다. 본 발명에 따른 방법은, 원핵생물을 비롯한 모든 생명체에 대하여 유전체 서열 정보에 의존하지 않으면서도 유전체 전역을 표적으로 할 수 있는 sgRNA 라이브러리를 생성할 수 있으며, 생성된 sgRNA가 표적 유전자의 비주형가닥(non-template strand)에만 선택적으로 결합하기 때문에 원핵생물 대상 표현형 기반 선별을 진행할 수 있다.
또한, DNA와 더불어 또 다른 유용한 유전물질인 mRNA를 출발물질로 활용할 수 있어 실제 활발히 발현 중인 유전자를 표적으로 하는 sgRNA 라이브러리를 생성할 수 있다.

Description

효소 반응을 통한 총 mRNA 기반 무작위 sgRNA 라이브러리 생성 방법 {Random sgRNA Library Generation Using Total mRNA via Enzymatic Reactions}

본 발명은 효소 반응을 통한 총 mRNA 기반 무작위 sgRNA 라이브러리 생성 방법에 관한 것이다.

표현형 기반 선별은 대상 생명체의 유전자에 무작위로 삭제 혹은 억제 등의 조작을 가한 후 원하는 표현형 변화를 보이는 세포를 선별 및 조사하여 해당 표현형 변화를 유발한 유전자를 특정하는 연구방법으로, 가치 있는 특징을 발굴하기 위하여 박테리아를 비롯한 다양한 종류의 생명체를 대상으로 활발히 수행되고 있다.

대상 생명체의 표현형 변화를 유도하기 위해서는 유전체가 대규모 및 고효율로 조작되어야 하는데, 효과적인 유전자 조작 도구로써 CRISPR-Cas9(clustered regularly interspaced palindromic repeats-Cas9) 시스템이 널리 활용되어 왔다.

특히, 박테리아를 포함한 원핵생물을 대상으로 표현형 기반 선별을 진행할 경우 genomic DNA가 절단될 시 세포가 사멸하므로 핵산분해효소 활성이 제거된 dCas9을 활용하는 CRISPRi(GRISPR interference)로 유전자를 억제해야 한다. CRISPRi 시스템은 표적 DNA 결합을 위하여 해당 DNA와 상보적인 서열을 갖는 sgRNA(single guide RNA)를 필요로 하며, 이 서열을 변경하는 것만으로 다양한 영역을 표적으로 할 수 있다.

이때, 원활한 표현형 기반 선별을 위해서는 연구 대상 생명체의 유전체 전역을 표적으로 하는 sgRNA 라이브러리가 필수적이다. 이러한 sgRNA 라이브러리를 생성하는 전통적인 방법은 유전체 정보를 바탕으로 sgRNA를 직접 설계한 후 마이크로어레이(microarray) 기반으로 합성하는 것이나, 이는 긴 시간 및 많은 비용이 요구될 뿐만 아니라 고품질의 유전정보 없이는 설계 자체가 불가능하여 연구대상이 될 만한 특징을 지녔으나, 유전정보가 불완전한 많은 생명체에 있어 적합하지 않다.

이러한 단점을 극복하기 위해 연구대상 생명체의 유전물질을 재료로 하여 연쇄적인 효소 반응을 통해 sgRNA 라이브러리를 생성하고자 하는 시도들이 있어왔다. 이 방법은 유전체 서열 정보 자체에만 의존하는 것이 아니기 때문에 소요시간 및 비용이 대폭 감소될 뿐만 아니라, 생성 과정에 사용되는 효소반응이 표적 생물의 유전물질 서열과 무관하게 작동하므로 이론적으로는 모든 생명체에 대하여 적용이 가능하다.

그러나 이러한 선행 시도들은 여러 중대한 단점으로 인하여 박테리아를 비롯한 원핵생물에 대한 표현형 스크리닝에 활용하는 것이 불가능하였다. 첫째로, 기존의 방법들은 타겟 유전자의 비주형가닥(non-template strand)만을 표적으로 하는 가이드 RNA(guide RNA)를 생성할 수 없었다. 상술한 바와 같이 박테리아에 대해 CRISPR을 활용한 표현형 기반 선별을 진행할 경우 CRISPRi 시스템의 활용이 필수적이다.

이때, dCas9이 유전자의 CDS(coding sequence)를 표적으로 할 경우, sgRNA가 비주형가닥에 상보적으로 결합해야지만 RNA 폴리머레이즈(polymerase)의 진행을 막을 수 있어 유전자의 억제가 효과적으로 이루어질 수 있는 것이다. 이렇듯, 효소 기반 라이브러리 생성방법은 설계에 기반하지 않으므로, 확률적으로 대부분의 sgRNA가 CDS를 표적으로 하도록 제작될 수밖에 없기 때문에 가닥 선택성을 가지는 것이 매우 중요하다.

둘째로, 대부분의 효소 반응기반 sgRNA 생성방법은 유전물질로 RNA를 활용할 수 없었다. RNA는 각 유전자의 전사 수준에 따른 조정된 유전자 비율을 보이기 때문에 sgRNA 라이브러리 제작의 출발물질로서 충분한 가치를 지니고 있으나, 전체 RNA 중 85% 이상을 차지하는 rRNA로부터 다양한 유전자 정보를 담고 있는 mRNA만을 분리 및 정제하기 어려워 거의 활용되지 않았다.

특히, 원핵생물 mRNA의 경우 진핵생물 mRNA와 달리 폴리 A 꼬리(poly A tail)와 같은 구조적 특징이 존재하지 않아 분리 및 정제가 더욱 어려워 출발물질로 활용된 바가 없었다.

셋째로, 기존의 방법들을 사용하는 제한효소의 종류가 다소 많았고, 이에 따른 반응과정이 지나치게 길어 실제로 활용하는데 어려움이 있어왔다.

이에, 상술한 효소반응 기반 sgRNA 라이브러리 생성방법들의 단점을 해결하기 위하여, 비주형가닥만을 표적으로 할 수 있고, mRNA를 출발물질로 활용할 수 있으며, 원핵생물을 포함한 모든 생명체를 대상으로 하여 적용할 수 있고, 단순화된 효소 반응 과정을 가지는 sgRNA 라이브러리 생성방법을 개발할 필요가 있다.

본 발명의 하나의 목적은 sgRNA 라이브러리 생성용 프라이머 세트를 제공하는 것이다.

본 발명의 또 하나의 목적은 sgRNA 라이브러리 생성방법을 제공하는 것이다.

본 발명의 또 다른 목적은 상기한 방법으로 제작한 sgRNA 라이브러리의 용도를 제공하는 것이다.

하기에서는 중복되는 내용의 혼잡을 방지하기 위하여, 중복되는 내용의 기재를 생략하고자 한다. 즉, 하기의 내용만으로 발명의 내용이 한정되는 것은 아니고, 전체적인 발명의 내용에 따라 발명의 내용이 해석되어야 할 것이다.

또한, 본 명세서에서 사용한 용어는 단지 설명을 목적으로 사용된 것으로, 한정하려는 의도로 해석되어서는 아니된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, “포함하다” 또는 “가지다” 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 기능성을 미리 배제하지 않는 것으로 이해되어야 한다.

또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

본 발명은 다음을 포함하며, 표적 생물의 단편화된 mRNA를 주형으로 하는 역전사 프라이머로 작용하며 cDNA의 5' 말단에 제1 어댑터를 결합시키기 위한 제1 어댑터 결합용 프라이머; 및 역전사 산물의 주형가닥 연장용 프라이머로 작용하며 cDNA의 3' 말단에 제2 어댑터를 결합시키기 위한 제2 어댑터 결합용 프라이머;를 포함하는 sgRNA 라이브러리 생성용 프라이머 세트:

(1) 상기 제1 어댑터 결합용 프라이머는 하기 일반식 Ⅰ-1의 구조를 갖고;

5'-X-Y-Z-3' (Ⅰ-1)

상기 X는 9 내지 14개의 염기로 이루어져 제1 PCR 증폭시 프라이머로 기능하기 위한 부위이며; Y는 6개의 염기로 이루어진 타입 Ⅲ 제한효소 인식부위이고; Z는 7개의 염기로 이루어진 표적 생물의 단편화된 mRNA와 상보적인 혼성화 서열을 갖는 무작위 헵타머(random heptamer) 부위이며;

(2) 상기 제2 어댑터 결합용 프라이머는 DNA-RNA 키메라 프라이머로서, 하기 일반식 Ⅰ-2의 구조를 갖고;

5'-X'-Y'-Z'-3' (Ⅰ-2)

상기 X'는 16 내지 20개의 염기로 이루어져 제1 PCR 증폭시 프라이머가 결합하는 부위이며; Y'는 8개의 염기로 이루어진 부분적 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식부위이고; Z'는 역전사 산물의 3' 말단의 오버행과 상보적으로 혼성화되는 3개의 구아닌(G) 염기로 이루어진 RNA 서열로서, SMART(switching mechanism at 5' end of RNA template)를 통해 가닥(template)을 연장하는 부위이며;

상기 제2 어댑터 결합용 프라이머는, 상기 제1 어댑터 결합용 프라이머를 이용하여 역전사를 수행한 뒤 수득한 역전사 산물을 주형으로 하고;

상기 제1 어댑터는 타입 Ⅲ 제한효소 인식부위로 작용하는 어댑터이며;

상기 제2어댑터는 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 부분적 제한효소 인식부위로 작용하는 어댑터인, sgRNA 라이브러리 생성용 프라이머 세트를 제공한다.

이때, 상기 일반식 Ⅰ-1의 X는 Y와 함께 ~20mer 가량의 통상적인 프라이머 길이 및 Tm을 맞추는 역할을 하기 때문에, Tm에 맞는 프라이머 역할을 수행하기 위한 어떠한 서열의 조합도 무관하게 이용될 수 있다.

이때, 상기 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식 부위는 mRNA상의 PAM 서열의 선별을 위하여 적절히 선택될 수 있다. 즉, 본 발명에 따른 라이브러리 제작 과정 중 PAM 서열 선별을 위한 제한효소 인식부위가 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식 부위로 적절히 선택되고, 이렇게 선택된 특정 제한효소의 부분적 인식부위에 맞춰 제2 어댑터 서열이 변경되거나, 상기한 제한효소 모두의 부분적 인식부위를 포함할 수 있도록 범용적 서열을 갖는 제2 어댑터가 제작될 수 있다. 이로 인해, 이용되는 Cas9의 종류에 맞춰 적절한 sgRNA 라이브러리를 생성할 수 있다. 즉, 해당 설계를 통해 이용되는 Cas9의 종류를 꼭 한 종류에만 제한두지 않는 특이적 또는 범용적 sgRNA 라이브러리를 생성할 수 있다.

일 예로, 하기에 이어지는 'SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소'에 대한 설명은, 제한효소 인식 부위를 인식한 특정 제한효소(일 예로 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나)의 이용에 의해 효소 반응을 거친 후, 특정 Cas9을 위한 sgRNA 라이브러리를 생성하는 것으로, 각 sgRNA 라이브러리 생성을 위한 제한효소와 sgRNA 라이브러리에 적용하기 위한 Cas9의 조합은 다음과 같을 수 있다: SpCas9- SfiⅠ; SaCas9- BamHⅠ; CjCas9- KpnⅠ.

본 발명에 있어, 상기 제1어댑터 결합용 프라이머는, 필요에 따라 일반식 Ⅰ-1의 구조 중 Y와 Z 사이에 1 내지 6개의 염기로 이루어진 스페이서 서열을 추가로 더 포함할 수 있다. 이때, 상기 스페이서 서열은 타입 Ⅲ 제한효소 인식부위(Y)와 표적 생물의 단편화된 mRNA와 상보적인 혼성화 서열을 갖는 무작위 헵타머 부위(Z) 사이에 공간을 제공하기 위하여 포함될 수 있다.

본 발명에 있어서, 상기 제1 어댑터 결합용 DNA 프라이머는 타겟 생물의 mRNA 단편에 상보적으로 결합하여 역전사 프라이머로 작용하며, 타입 Ⅲ 제한효소 인식부위를 포함한다. 이때, 상기 타입 Ⅲ 제한효소 인식부위는 바람직하게는 EcoP15Ⅰ 제한효소 인식부위일 수 있다. 이러한 EcoP15Ⅰ 제한효소 인식부위는 CAGCAG의 서열을 가질 수 있다. 본 발명의 일실시양태에 따르면, CAGCAG의 제한효소 인식부위를 포함하여 서열번호 1(5'-AGGTATCTCGAGTCCCCAGCAGCNNNNNNN-3')를 사용하였다.

본 발명에 있어서, 상기 제2 어댑터 결합용 DNA-RNA 키메라 프라이머는 역전사 진행 중 2차 주형으로 작용하며 제한효소 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소의 부분적 인식부위를 포함한다. 본 발명의 일실시양태에 따르면, 일 예로 서열번호 2(5'- AGTGGTATCAACGCAGAGT GGCC AAGCG GG -3'; SfiⅠ), 서열번호 3(AGTGGTATCAACGCAGAGTGGCCAAGCG GG ; BamHⅠ) 및 서열번호 4(AGTGGTATCAACGCAGAGTGGCCAAGCGG G ; KpnⅠ)로 이루어질 수 있다(굵은 기울임체는 각 제한효소의 부분적 인식부위이고, 밑줄 친 G는 RNA임).

상기 제1 및 제2 어댑터에 의한 역전사 과정을 구체적으로 설명하면, 제1 어댑터 결합용 프라이머가 3' 말단의 무작위 헵타머 서열을 통해 mRNA 단편과 상보적으로 결합합으로써 역전사 프라이머로서 작용하여 역전사가 개시된다. 이때, 일 예시로 M-MLV(Moloney murine leukemia virus) 계열의 역전사효소를 이용하면 역전사가 끝까지 진행되었을 때 cDNA의 3' 말단에 CCC가 오버행으로써 생성된다.

이때, 제2 어댑터의 3' 말단에 존재하는 RNA 서열이 cDNA의 3' 말단의 오버행과 상보적으로 결합하면 M-MLV 계열의 역전사효소는 제2 어댑터가 결합된 cDNA를 새로운 주형으로 삼아 역전사를 계속 진행하게 된다.

이를 통해, mRNA 단편으로부터 cDNA가 생성됨과 동시에 mRNA 유래 서열 양 말단에 제1 및 제2 어댑터가 부착되어 이후의 PCR 증폭 및 효소 반응이 가능해진다.

본 발명은 다음을 포함하며, 상기 제1 및 제2 어댑터 결합용 프라이머 세트를 이용하여 생성한 제한효소 절단 산물과 혼성화된 후 라이게이션(ligation)되는 제3 어댑터 생성용 정방향 프라이머(A3F); 및 역방향 프라이머(A3R);를 포함하는 sgRNA 라이브러리 생성용 프라이머 세트:

(1) 상기 제3 어댑터 생성용 정방향 프라이머(A3F)는 하기 일반식 Ⅱ-1의 구조를 갖고;

5'-바이오틴(biotin)-X''-Y''-Z''-I-3' (Ⅱ-1)

상기 X''는 제2 PCR 증폭시 프라이머가 결합하는 부위이며; Y''는 6개의 염기로 이루어진 타입 ⅡS 제한효소 인식부위이고; Z''는 6개의 염기로 이루어진 타입 Ⅲ 제한효소 인식부위이며; I는 1 내지 4개의 염기로 이루어진 상기 제한효소 절단 산물과 상보적인 혼성화 서열을 갖는 부위이고;

(2) 상기 제3 어댑터 생성용 역방향 프라이머(A3R)는 하기 일반식 Ⅱ-2의 구조를 갖고;

5'-Z'''-Y'''-X'''-3' (Ⅱ-2)

상기 Z'''는 상기 제한효소 절단 산물과 결합하여 타입 Ⅲ 제한효소 인식부위가 생성되는 부위이며; Y'''는 6개의 염기로 이루어진 타입 ⅡS 제한효소 인식부위이고; X'''는 제2 PCR 증폭시 프라이머가 결합하는 부위이며;

상기 제3 어댑터는 하기 일반식 Ⅱ-3의 구조를 갖는 바이오틴이 부착된 이중가닥 DNA이고;

5'-바이오틴(biotin)-X*-Y*-Z*-3' (Ⅱ-3)

상기 X*는 제3 어댑터와 상기 제1 및 제2 어댑터 결합용 프라이머 세트를 이용하여 생성한 제한효소 절단 산물 사이의 절단을 위한 타입 ⅡS 제한효소 인식부위이며; 상기 Y*는 타입 Ⅲ 제한효소 인식부위이고; Z*는 상기 제1 및 제2 어댑터 결합용 프라이머 세트를 이용하여 생성한 제한효소 절단 산물과 라이게이션(ligation)하기 위한 부위이며;

상기 제3 어댑터는 PAM 인접서열의 분리를 위한 표지부위로 작용하는 어댑터인, sgRNA 라이브러리 생성용 프라이머 세트를 제공한다.

본 발명에 있어서, 상기 제3 어댑터 생성용 정방향 프라이머(A3F)는 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 절단 산물에 선택적으로 라이게이션되고 5' 말단에 바이오틴을 포함하며, 타입 ⅡS 제한효소 인식부위 및 타입 Ⅲ 제한효소 인식부위를 포함하고, 3' 말단에 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 절단 산물과 상보적인 혼성화 서열을 포함한다. 이때, 상기 타입 ⅡS 제한효소 인식부위 및 타입 Ⅲ 제한효소 인식부위는 바람직하게는 각각 AcuⅠ(제한효소 인식부위: 5'-CTGAAG-3') 및 EcoP15Ⅰ(제한효소 인식부위: 5'-CAGCAG-3') 제한효소 인식부위일 수 있다.

일 예로 서열번호 5(5'-Biotin-AGGCTCACTGCATATGCTGAAGTCAGCAGC-3': SfiⅠ 절단 산물에 라이게이션 되는 프라이머 서열임), 서열번호 6(5'-Biotin- AGGCTCACTGCATACTGAAGTGTCAGCA-3': BamHⅠ 절단 산물에 라이게이션 되는 프라이머 서열임) 및 서열번호 7(5'-Biotin-AGGCTCACTGCATATGCTGAAGTCAGCAGGTAC-3': KpnⅠ 절단 산물에 라이게이션 되는 프라이머 서열임) 중 선택되는 어느 하나로 이루어질 수 있다 (밑줄 친 서열은 AcuⅠ 인식부위이고, 굵은 서열은 EcoP15Ⅰ 인식부위임).

이때, 서열번호 6의 제3 어댑터 생성용 정방향 프라이머의 경우, 서열번호 5 및 서열번호 7과는 달리 타입 Ⅲ 제한효소 인식부위를 일부분만 포함한다. 이는, 상기 서열번호 6은 BamHⅠ에 의한 절단에 의하여 생성된 BamHⅠ 절단 산물의 5' 말단의 G의 앞쪽으로 라이게이션되어, 제3 어댑터 생성용 정방향 프라이머가 결합된 BamHⅠ 절단 산물은 예시적으로 5'-Biotin- AGGCTCACTGCATACTGAAGTGTCAGCAG~~~-3'의 서열을 가짐에 따라, 최종적으로 타입 Ⅲ 제한효소 인식부위를 완성하기 때문이다. 이와 같은, 서열번호 6의 특이적인 서열 배치는 SaCas9의 최적 스페이서 길이를 맞추기 위함이다.

본 발명에 있어서, 상기 제3 어댑터 생성용 역방향 프라이머(A3R)은 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 절단 산물에 선택적으로 라이게이션된 제3 어댑터 생성용 정방향 프라이머(A3F)와 상보적으로 혼성화되는 서열로써, 즉, 제3 어댑터 생성용 정방향 프라이머(A3F)의 제한효서 절단 산물과 상보적인 혼성화 서열을 갖는 부위를 제외한 나머지 서열과 혼성화되며, 바이오틴을 포함하지 않는 서열이다. 일 예로 서열번호 8(5'-GCTGACTTCAGCATATGCAGTGAGCCT-3'), 서열번호 9(5'-GATCTGCTGACACTTCAGTATGCAGTGAGCCT-3') 및 서열번호 10(5'-TGCTGACTTCAGCATATGCAGTGAGCCT-3') 중 선택되는 어느 하나로 이루어질 수 있다.

이때, 상기 서열번호 5 및 8, 서열번호 6 및 9, 서열번호 7 및 10은 하나의 세트로써 적용된다. 상기 서열번호 5 및 8은 SpCas9(Streptococcus pyogenes Cas9)을 적용하기 위한 sgRNA 라이브러리를 제작할 경우 적용되며, 상기 서열번호 6 및 9는 SaCas9(Staphylococcus aureus Cas9)을 적용하기 위한 sgRNA 라이브러리를 제작할 경우 적용되고, 서열번호 7 및 10은 CjCas9(Campylobacter jejuni Cas9)을 적용하기 위한 sgRNA 라이브러리를 제작할 경우 적용된다.

용어 “라이게이션”은 일반적인 용어이며, 본 발명에서는 DNA 산물과 프라이머를 공유결합으로 연결시키는 어떠한 방법도 포함한다는 것으로 이해된다.

본 발명의 라이게이션 반응은 매우 다양한 라이게이션 작용제를 이용하여 실시될 수 있으며, 효소성 라이게이션 작용제및 비-효소성 라이게이션 작용제(예컨대, 화학적 작용제 및 포토라이게이션 작용제)를 포함할 수 있으나, 본 발명의 바람직한 구현예에 따르면, 라이게이션 반응은 효소성 라이게이션 작용제에 의한 것일 수 있다.

이때, 상기 효소성 라이게이션은 SplintR 리가아제, 박테리오파지 T4 리가아제, E.coli 리가아제, Afu 리가아제, Taq 리가아제, Tfl 리가아제, Mth 리가아제, Tth 리가아제, Tth HB8 리가아제, Thermus species AK16D 리가아제, Ape 리가아제, LigTk 리가아제, Aae 리가아제, Rm 리가아제, Pfu 리가아제, 리보자임(ribozyme) 및 이의 변이체로 이루어진 군으로부터 선택된 1 종의 라이게이션 작용제에 의해 실시된다.

상기 제3 어댑터 생성용 프라이머를 이용하여 생성된, 제3 어댑터와 라이게이션된 DNA 산물은 5' 말단의 바이오틴을 통해 스트렙타비딘이 도입된 자성 비드와 결합하게 되고, 이 비드를 자성 스탠드 등의 장치를 통해 상층액으로부터 분리하면 결과적으로 PAM 인접서열만을 분리할 수 있다.

본 발명은 다음을 포함하며, 상기 제3 어댑터 생성용 프라이머 세트를 이용하여 생성된 제3 어댑터가 결합된 이중가닥 DNA 산물이 순차적으로 절단되어 생성된 DNA의 양 말단에 라이게이션(ligation)되는 제4 어댑터 생성용 정방향 프라이머(A4F); 역방향 프라이머(A4R); 및 제5 어댑터 생성용 정방향 프라이머(A5F); 및 역방향 프라이머(A5R);를 포함하는 sgRNA 라이브러리 생성용 프라이머 세트:

(1) 상기 제4 어댑터 생성용 정방향 프라이머(A4F)는 sgRNA 스페이서 전사를 위한 프로모터 서열을 포함하며, sgRNA 발현용 벡터와 깁슨 조립(Gibson assembly)을 진행하기 위한 15 내지 40개의 염기로 이루어진 부위이고;

(2) 상기 제4 어댑터 생성용 역방향 프라이머(A4R)는 하기 Ⅲ-1의 구조를 갖고;

5'-A-B-3' (Ⅲ-1)

상기 A는 20개의 염기로 이루어진 DNA 단일가닥의 5' 말단의 오버행과 2개 염기로 이루어진 상보적인 혼성화 서열을 갖는 부위이며; B는 상기 제4 어댑터 생성용 정방향 프라이머(A4F)와 상보적인 혼성화 서열을 갖는 부위이고;

(3) 상기 제5 어댑터 생성용 정방향 프라이머(A5F)는 sgRNA 스캐폴드(scaffold) 서열을 포함하며, sgRNA 발현용 벡터와 깁슨 조립(Gibson assembly)을 진행하기 위한 15 내지 40개의 염기로 이루어진 부위이고;

(4) 상기 제5 어댑터 생성용 역방향 프라이머(A5R)는 하기 Ⅲ-2의 구조를 갖고;

5'-A'-B'-3' (Ⅲ-2)

상기 A'는 상기 제5 어댑터 생성용 정방향 프라이머(A5F)와 상보적인 혼성화 서열을 갖는 부위이며; B'는 20개의 염기로 이루어진 DNA 단일가닥의 3' 말단의 오버행과 2개 염기로 이루어진 상보적인 혼성화 서열을 갖는 부위이고;

상기 제4 어댑터는 sgRNA 발현을 위한 프로모터 부위로 작용하는 어댑터이고;

상기 제5 어댑터는 sgRNA 스캐폴드(scaffold) 서열을 갖는 어댑터인, sgRNA 라이브러리 생성용 프라이머 세트를 제공한다.

제4 어댑터 및 제5 어댑터는 플라스미드에 깁슨 조립 기반 클로닝을 위한 영역으로써 활용된다.

구체적으로, 상기 '제3 어댑터 생성용 프라이머 세트를 이용하여 생성된 제3 어댑터가 결합된 이중가닥 DNA 산물이 순차적으로 절단되어 생성된 DNA'는 '16nt와 20nt DNA가 상보적으로 결합하여 양쪽에 오버행이 2nt씩 존재하는 20 bp 이중가닥 DNA 산물', 즉, '20 bp의 sgRNA 스페이서'이다.

이때, 상기 16nt 서열은 mRNA 서열과 동일한 서열(유전자의 비주형가닥과 동일한 서열)이며, 20nt 서열은 그의 상보적인 서열이다. 20nt 서열의 양 끝에만 존재하는 2nt 오버행을 이용하여, 제4 어댑터의 프로모터 서열과 제5 어댑터의 sgRNA 스캐폴드(scaffold)서열 사이에 20nt 서열이 놓이도록 라이게이션하면 상기 20nt 서열이 프로모터에 의해 sgRNA 스페이서로서 전사되며, 이는 표적 유전자의 비주형 가닥과 결합하게 된다.

일 예로, 상기 제4 어댑터 생성용 정방향 프라이머(A4F)는 서열번호 11로 이루어진 것이며, 제4 어댑터 생성용 역방향 프라이머(A4R)는 서열번호 12로 이루어질 수 있다.

일 예로, 상기 제5 어댑터 생성용 정방향 프라이머(A5F)는 서열번호 13으로 이루어진 것이며, 제5 어댑터 생성용 역방향 프라이머(A5R)는 서열번호 14로 이루어질 수 있다.

본 발명은 (a) 표적 생물의 mRNA를 단편화하는 단계; (b) 단편화된 mRNA를 주형으로 하여, 5' 말단에 역전사 PCR 프라이머 결합 부위로 작용하는 제1 어댑터 및 3' 말단에 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식부위로 작용하는 제2 어댑터가 결합된 cDNA를 합성하는 단계; (c) SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소를 처리하여 제한효소 처리 산물을 수득하는 단계; (d) 상기 단계 (c)의 제한효소 처리 산물의 3' 말단의 오버행과 상보적인 혼성화를 이루며 PAM 인접서열의 분리를 위한 표지부위로 작용하는 제3 어댑터를 라이게이션(ligation)시키는 단계; (e) 제3 어댑터가 결합된 cDNA만을 선별하는 단계; (f) 타입 Ⅲ 제한효소를 처리하는 단계; 및 (g) 타입 Ⅱ S 제한효소를 처리하여 sgRNA 스페이서 DNA를 제조하는 단계;를 포함하는 sgRNA 라이브러리 생성방법을 제공한다.

이때, 상기 단계 (a)의 mRNA 단편화를 통해 mRNA의 5' 말단에 PAM(Promoter adjacent motif) 상보서열을 노출할 수 있다. PAM 서열은 CRISPRi 시스템에서 Cas9이 절단하기 위한 표적 DNA를 인식하도록 돕는 일종의 알림판 역할을 한다.

또한, 상기 mRNA의 단편화는 본래 다양한 길이 분포를 가진 mRNA가 비교적 일정한 길이, 바람직하게는 100nt 가량의 단편으로 변환되어 이후에 이어질 효소 반응의 설계 및 검증을 용이하게 한다.

상기 단계 (a)의 mRNA 단편화는, i) 표적 생물의 총 RNA(tatal RNA)를 추출하는 단계; ii) rRNA에 상보적인 서열을 가지는 DNA 프로브의 처리에 의해 rRNA-DNA 이중가닥을 생성하는 단계; 및 iii) 상기 단계 ii)의 rRNA-DNA 이중가닥의 rRNA만을 선택적으로 분해하는 RNA 분해효소(RNase)를 처리하여 rRNA를 제거하는 단계;를 포함함으로써 수행된다.

이때, 상기 RNA 분해효소(RNase)는 열안정성 RNaseH이다.

본 발명에 있어, 상기 mRNA의 단편화는 기계적 단편화(physical fragmentation), 효소 기반 단편화 및 화학적 단편화로 이루어진 군으로부터 선택된 어느 하나에 의해 수행될 수 있다.

상기 기계적 단편화는 음향 전단(acoustic shearing) 및 초음파 처리(sonication)를 통해 수행될 수 있으며, 단파장, 고 주파수의 음향에너지를 샘플에 집중시켜 DNA 혹은 RNA를 단편화하는 방법이다. 150 bp~수kb 사이로 절단이 가능하며, 반응이 쉽고 빠르나 전용 장비를 사용하여야 한다.

상기 효소 기반 단편화는 장비의존도는 낮으나 제한효소 인식부위나 서열 선호도(preference) 문제로 인하여 절단부위 왜곡(bias)을 야기할 수 있다. DNA의 경우에는 다양한 제한효소 인식부위나 비특이적 핵산분해효소(DNaseⅠ) 등이 존재하여 효소 기반 단편화를 이용할 수 있다. 반면, RNA의 경우 RNaseⅢ 등을 이용할 수도 있으나, 이 경우 dsRNA만을 기질로 사용하므로 mRNA의 단편화에는 사용할 수 없어, RNA를 대상으로 할 경우 실질적 활용이 어려울 수 있다.

화학적 단편화는 DNA 혹은 RNA를 Mg²⁺, Zn²⁺를 비롯한 금속 양이온과 함께 반응시켜 인산다이에스터 결합(phosphodiester bond)를 절단함으로써 수행된다. 반응시간을 조절하여 수백 nt 사이에서 단편 크기 조절이 가능하며, 장비의존도가 낮으며 절단부위 왜곡 문제에서 보다 자유로운 장점이 있다.

본 발명에서는 보다 바람직하게는 화학적 단편화를 이용함으로써 mRNA 단편화를 수행할 수 있다.

보다 구체적으로 본 발명의 일 실시예에서는 고온에서 Mg²⁺와 함께 가열하는 방법을 사용함으로써 제한효소를 이용한 mRNA 단편화 대비 반응 시간 감소를 이룰 수 있었다.

이때, 상기 단계 (b)를 통해 단편화된 mRNA의 역전사를 수행할 수 있고, SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식부위를 포함하는 cDNA를 합성할 수 있다.

이때, 상기 단계 (c)에서와 같이 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소를 처리함에 따라, PAM 인접서열만을 선택적으로 절단할 수 있다. 즉, 상기 단계 (b)의 역전사 과정에서 주형으로 사용된 mRNA의 5' 말단에 PAM 상보적 서열이 존재하는 cDNA의 경우, 제2 어댑터에 존재하는 부분적 제한효소 인식부위와 PAM 상보적 서열이 이어져 완전한 제한효소 인식부위를 하기 일반식 Ⅰ-3, Ⅰ-4 및 Ⅰ-5와 같이 이루게 된다.

5'-X'-G GG CCN-(후략)-3' (Ⅰ-3; SpCas9 적용하기 위한 sgRNA 라이브러리 제작 시)

5'-X'-G GG AYYCN-(후략)-3' (Ⅰ-4; SaCas9 적용하기 위한 sgRNA 라이브러리 제작 시)

5'-X'-GG G GTRYNNNN-(후략)-3' (Ⅰ-4; cjCas9 적용하기 위한 sgRNA 라이브러리 제작 시)

따라서, 상기 일반식 Ⅰ-3 내지 Ⅰ-5와 같은 구조를 만족하는, 즉 PAM 인접서열만이 제한효소에 의해 절단되게 된다.

이때, 상기 단계 (d)를 통해 PAM 인접서열을 포함하는 cDNA에 바이오틴을 결합할 수 있으며, 상기 단계 (e)를 통해 PAM 인접서열을 포함하는 cDNA만을 특이적으로 선별할 수 있다. 이때, cDNA의 선별은 바이오틴-스트렙타비딘 결합을 이용하여 수행된다. 즉, 바이오틴이 결합된 PAM 인접서열을 포함하는 cDNA을 스트렙타비딘 자성 비드와 결합시켜 바이오틴-스트렙타비딘 결합을 통해 PAM 인접서열을 포함하는 cDNA만을 특이적으로 선별 및 농축할 수 있다.

이때, 상기 단계 (f) 및 (g)를 통한 연속적 효소 반응을 통해 sgRNA의 스페이서 영역에 해당하는 서열을 생성할 수 있다.

상기 단계 (d)로부터 수득된 cDNA 산물은 5' 말단에 제1 어댑터를, 3' 말단에 제3 어댑터를 포함하고 있는데, 제1 및 제3 어댑터에 존재하는 타입 Ⅲ 제한효소 인식부위를 타입 Ⅲ 제한효소가 인식함에 따라 어댑터로부터 일정거리만큼 떨어진 mRNA 유래 서열이 절단된다.

이후, 제3 어댑터에 존재하는 타입 Ⅱ S 제한효소 인식부위를 타입 Ⅱ S 제한효소가 인식함에 따라 제3 어댑터와 mRNA 유래 서열 사이의 부분이 절단되어, 최종적으로 16~18nt와 20~22nt DNA가 상보적으로 결합하여 양쪽에 오버행이 2nt씩 존재하는 20~22 bp 이중가닥 DNA 산물이 생성된다. 상기 과정을 통해 유전체 서열에서 무작위적으로 유래한 20~22 bp의 sgRNA 스페이서 서열이 생성된다. 구체적으로, SpCas9(Streptococcus pyogenes Cas9) 또는 CjCas9(Campylobacter jejuni Cas9)을 이용하여 sgRNA 라이브러리를 제작할 경우 16nt와 20nt DNA가 상보적으로 결합하여 양쪽에 오버행이 2nt씩 존재하는 20 bp 이중가닥 DNA 산물이 생성되며, SaCas9(Staphylococcus aureus Cas9)을 이용하여 sgRNA 라이브러리를 제작할 경우 18nt와 22nt DNA가 상보적으로 결합하여 양쪽에 오버행이 2nt씩 존재하는 22 bp 이중가닥 DNA 산물이 생성된다.

이때, 상기 16nt(18nt) 서열은 mRNA 서열과 동일한 서열(유전자의 비주형가닥과 동일한 서열)이며, 20nt(22nt) 서열은 그의 상보적인 서열이다.

즉, 본 발명에 따른 sgRNA 라이브러리 생성방법은 3회의 제한효소 반응만으로 PAM 인접부위를 표적으로 하면서 cas9의 최적 스페이서 길이인 20 bp(SpCas9 또는 CjCas9) 내지 22 bp(SaCas9)에 해당하는 DNA 서열을 제작할 수 있었다. 이때, 상기 sgRNA 스페이서 DNA는 20개(SpCas9 또는 CjCas9) 또는 22(SaCas9)개의 염기로 이루어진 DNA 단일가닥 및 16개(SpCas9 또는 CjCas9) 또는 18개(SaCas9)의 염기로 이루어진 DNA 단일가닥이 서로 상보적으로 결합된 것이다.

한편, 본 발명에 따른 sgRNA 라이브러리 생성방법에 있어서, 각 어댑터를 결합하는 공정 이후에는 해당 산물을 PCR을 통해 증폭하는 단계가 각각 추가적으로 수행된다. 즉, 상기 단계 (b)와 단계 (c) 사이에 제1 PCR을 수행함에 따라 제1 어댑터 및 제2 어댑터가 결합된 cDNA를 수득 및 증폭할 수 있고, 상기 단계 (e) 및 단계 (f) 사이에 제2 PCR을 수행함에 따라 제3 어댑터가 결합된 cDNA를 증폭할 수 있다.

한편, 본 발명의 sgRNA 라이브러리 생성방법은 (h) sgRNA 스페이서 DNA의 양 말단에 전사를 위한 프로모터로 작용하는 제4 어댑터 및 sgRNA 스캐폴드로 작용하는 제5 어댑터를 결합하는 단계; 및 (i) sgRNA 스페이서 서열을 제외한 DNA를 벡터(vector)로 구성하고 sgRNA 스페이서 서열을 포함하는 DNA를 인서트(insert)로 구성한 플라스미드 상태의 sgRNA 라이브러리를 제조하는 단계;를 더 포함할 수 있다.

상기한 과정은 sgRNA 스페이서 DNA 중 20개의 염기로 이루어진 DNA 단일가닥을 대상으로 수행된다. 본 과정은 해당 서열을 깁슨 조립용 어댑터와 라이게이션하는 과정에서 어댑터의 오버행 방향 설정을 통해 실제프로모터에 의해 전사되는 서열을 조절함으로써, 상기 sgRNA는 비주형가닥(non-template strand)에 결합할 수 있다.

구체적으로, 20개 염기로 이루어진 DNA 단일가닥의 양 끝에만 존재하는 2개 염기로 이루어진 오버행을 이용하여, 제4 어댑터의 프로모터 서열과 제5 어댑터의 sgRNA 스캐폴드(scaffold)서열 사이에 20개의 염기로 이루어진 DNA 단일가닥이 놓이도록 라이게이션하면 상기 20개의 염기로 이루어진 DNA 단일가닥이 프로모터에 의해 sgRNA 스페이서로서 전사되며, 이는 표적 유전자의 비주형 가닥과 결합하게 된다.

즉, 라이게이션 방향을 통제하여 비주형 가닥만을 표적으로 하는 CRISPRi용 sgRNA 라이브러리를 생성할 수 있게 된다.

이후 sgRNA를 전사하기 위한 플라스미드에 깁슨 조립(Gibson assembly)를 진행하면 플라스미드 상태의 sgRNA 라이브러리가 완성된다.

이에, 본 발명에 따른 sgRNA 라이브러리는 비주형 가닥(non-template strand)만을 표적으로 하여 타겟 생물의 유전체 서열 정보에만 의존하지 않으면서도 유전체 전역을 표적으로 할 수 있다.

본 발명에 따른 sgRNA 라이브러리를 생성하는 전체 과정을 도 1 (a 및 b)에 나타내었다.

이에 관하여 구체적으로 설명하지면, 본 발명에 따른 sgRNA 라이브러리 생성방법은 1) mRNA 단편화, 2) SMART cDNA 합성 (제1 및 2 어댑터 연결), 3) 제1 PCR 수행, 4) SfiⅠ(또는 BamHⅠ 또는 KpnⅠ) 제한효소 인식부위 절단, 5) 제3 어댑터 연결 및 PAM 상보서열 포함 DNA 선별 농축, 6) 제2 PCR 수행, 7) 제한효소 기반 sgRNA 스페이서 서열 생성 및 8) 클로닝 어댑터 연결 및 제3 PCR 수행, 깁슨 조립 단계로 이루어진다.

1) mRNA 단편화는 약 100nt 가량의 길이로 진행하며, 하기 합성되는 cDNA의 5' 말단에 PAM 상보서열을 노출시켜 선별 농축을 가능함과 동시에 이후의 라이브러리 제작과정을 진행하기 수월하도록 한다.

2) SMART cDNA 합성은 상기한 단편화된 mRNA에 타입 Ⅲ 제한효소 인식부위로 작용하는 제1 어댑터 및 SfiⅠ(또는 BamHⅠ 또는 KpnⅠ) 제한효소 인식부위로 작용하는 제2 어댑터가 결합된 주형가닥으로서의 cDNA를 합성하는 과정이다. 구체적으로, 제1 어댑터 결합용 프라이머의 3' 말단측 무작위 염기서열 7개가 상기 단편화된 mRNA에 결합하여 프라이머로 작용해 reverse transcriptase에 의한 역전사가 진행되고, 이의 활성에 의해 cDNA의 3' 말단에 3개의 시토신(CCC) 오버행이 추가되는데 이 오버행 부위에 제2 어댑터 결합용 프라이머의 3' 말단측 3개의 RNA 구아닌(GGG)이 결합하게 되면 역전사가 계속되면서 결과적으로 양 말단에 제1 및 제2 어댑터가 부착된 cDNA를 생성할 수 있다.

3) 제1 PCR은 상기 합성한 cDNA를 증폭하는 과정이다. 구체적으로, 상기 합성한 cDNA를 주형으로, 제1 및 제2 어댑터를 프라이머 영역으로 하여 PCR을 수행함으로써 제1 및 제2 어댑터가 결합된 cDNA를 효과적으로 증폭할 수 있다.

4) SfiⅠ(또는 BamHⅠ 또는 KpnⅠ) 제한효소 인식부위 절단은 상기 합성한 cDNA 5' 말단에 PAM 인접서열만을 선택적으로 절단하기 위한 과정이다. 이는 역전사 과정에서 주형으로 사용된 mRNA의 5' 말단에 PAM 상보적 서열이 존재하는 cDNA의 경우, 제2 어댑터에 존재하는 부분적 제한효소 인식부위와 PAM 상보적 서열이 이어져 완전한 제한효소 인식부위를 이루기 때문에 가능하다. 그 결과, 제2 어댑터는 절단된다. 이때, 이용하는 Cas9의 종류에 따라 상이한 제한효소 인식부위가 매칭되는데, 일 예로 SpCas9을 적용하기 위한 sgRNA 라이브러리 제작시에는 SfiⅠ 제한효소 인식부위가, SaCas9을 적용하기 위한 sgRNA 라이브러리 제작시에는 BamHⅠ 인식부위가, CjCas9을 적용하기 위한 sgRNA 라이브러리 제작시에는 KpnⅠ 인식부위가 위치할 수 있도록 제2어댑터의 부분적 제한효소 인식부위를 적절히 설계할 수 있다.

5) 제3 어댑터 연결 및 PAM 상보서열 포함 DNA 선별 농축은 상기 SfiⅠ(또는 BamHⅠ 또는 KpnⅠ) 제한효소에 의해 절단된 cDNA에 바이오틴을 결합하여 PAM 상보서열을 포함하는 DNA만을 선별 농축하는 과정이다. 구체적으로, 상기 제한효소에 의해 절단된 cDNA의 오버행에, 이의 상보적인 서열을 가지면서도 바이오틴이 부착된 제3 어댑터를 제3 어댑터 생성용 프라이머 세트를 이용하여 증폭함으로써 연결하면, PAM 상보서열을 포함한 cDNA에만 제3 어댑터가 연결되어, 바이오틴-스트렙타비딘의 항체-항원반응에 의해 PAM 상보서열을 포함한 cDNA만을 선별 및 농축할 수 있다. 그 결과 상기에서 절단된 제2 어댑터 위치에 제3 어댑터가 연결되어, 최종적으로 양 말단에 제1 및 제3 어댑터가 부착된 cDNA를 생성할 수 있다.

6) 제2 PCR은 상기 양 말단에 제1 및 제3 어댑터가 부착된 cDNA를 증폭하는 과정이다. 구체적으로, 상기 합성한 cDNA를 주형으로, 제1 및 제3 어댑터를 프라이머 영역으로 하여 PCR을 수행함으로써 제1 및 제3 어댑터가 결합된 cDNA를 효과적으로 증폭할 수 있다.

7) 제한효소 기반 sgRNA 스페이서 서열 생성은, sgRNA 라이브러리 생성을 위한 20개 또는 22개의 염기로 이루어진 DNA 단일가닥 및 16개 또는 18개 염기로 이루어진 DNA 단일가닥이 서로 상보적으로 결합된, sgRNA 스페이서 DNA를 생성하기 위한 과정이다. 구체적으로, 상기 제1 및 제3 어댑터가 결합된 cDNA는 제1 어댑터 및 제3 어댑터에 타입Ⅲ 제한효소 인식부위가 존재하고, 제3 어댑터는 타입ⅡS 제한효소 인식부위를 더 포함하고 있다. 이들 효소는 인식부위와 절단부위가 서로 멀리 떨어져 있어 어댑터 서열로부터 정해진 거리에 위치해 있는 mRNA 유래 무작위 서열을 절단할 수 있다. 이에, 우선 타입Ⅲ 제한효소 인식부위 절단을 수행한 뒤, 순차적으로 타입ⅡS 제한효소 인식부위 절단을 수행하면, 20개 또는 22개의 염기로 이루어진 DNA 단일가닥 및 16개 또는 18개 염기로 이루어진 DNA 단일가닥이 서로 상보적으로 결합되어 양쪽에 오버행이 2nt씩 존재하는 이중가닥의 sgRNA 스페이서 DNA를 생성할 수 있다. 이때, 20개 또는 22개의 염기로 이루어진 DNA 단일가닥이 sgRNA의 스페이서 서열로서 활용된다.

8) 클로닝 어댑터 연결 및 제3 PCR 수행, 깁슨 조립은 플라스미드 상태의 sgRNA 라이브러리를 획득하기 위한 과정이다. 구체적으로, 제4 및 제5 어댑터 생성용 프라이머 세트를 각각 이용하여 증폭함으로써 프로모터로 작용하는 제4 어댑터 및 sgRNA 스캐폴드로 작용하는 제5 어댑터를 연결하였다. 이때, 프로모터에 의해 전사되는 서열은 sgRNA의 스페이서 서열(20개 또는 22개의 염기로 이루어진 DNA 단일가닥)이며, 해당 서열은 mRNA의 상보서열 및 genomic DNA의 주형가닥과 동일한 서열이므로 전사된 sgRNA는 비주형 가닥과 결합하게 된다. 이후, 제3 PCR을 수행하여 제4 및 제5 어댑터가 결합된 sgRNA의 스페이서 서열을 증폭하고, 해당 증폭산물의 김슨 조립을 위하여 플라스미드의 sgRNA 스페이서 서열을 제외한 부분에 대한 PCR을 수행함으로써, 최종적으로 플라스미드 상태의 sgRNA 라이브러리를 획득할 수 있는 것이다.

본 발명에 따른 sgRNA 라이브러리는 생거(Sanger) 시퀀싱 및 차세대서열분석을 통해 그 구성 및 특성을 분석할 수 있으며, 실제로 표현형 기반 선별을 수행하고자 하는 세포에 형질전환하여 이용할 수 있다.

구체적으로, 본 발명에 따른 sgRNA 라이브러리를 CRISPRi 시스템에 적용하여 표현형 기반 선별을 수행하기 위해서는 게놈 통합(genome integration) 또는 플라스미드 형질전환(plasmid transformation)을 통해 Cas9를 발현하도록 형질전환된 세포에 sgRNA 전사를 위한 플라스미드를 추가적으로 형질전환함으로써 이루어질 수 있다.

또한, sgRNA 전사를 위한 플라스미드에 Cas9 발현을 위한 유전자를 도입해 한번의 형질전환으로 sgRNA와 Cas9을 동시 발현을 유도할 수도 있다.

이때, CRISPRi 시스템 수행을 위한 Cas9으로 SpCas9(Streptococcus pyogenes Cas9; 인식부위: 5’-GGCCNNNN/NGGCC-3’), SaCas9(Staphylococcus aureus Cas9; 인식부위: 5’-G/GATCC-3‘) 및 CjCas9(Campylobacter jejuni Cas9; 인식부위: 5’-GGTAC/C-3’)으로 이루어진 군으로부터 선택되는 어느 하나가 적용될 수 있다.

이에 따라, 본 발명은 본 명세서에서 상술한 방법에 의해 제작된 sgRNA 라이브러리를 포함하는 표현형 기반 선별용 키트를 제공한다.

본 발명의 키트는 추가적으로, 다양한 폴리뉴클레오타이드 분자, 효소, 다양한 버퍼 및 시약을 포함할 수 있다. 어떤 하나의 특정 반응에서 사용되는 시약의 최적량은, 본 명세서에 개시된 사항을 습득한 당업자에 의해서 용이하게 결정될 수 있다.

전형적으로, 본 발명의 키트는 앞서 언급된 구성성분들을 포함하는 별도의 포장 또는 구분으로 제작된다.

본 발명의 키트는 상술한 본 발명의 sgRNA 라이브러리에 의한 표현형 기반 선별을 실시하기 위하여 제작되기 때문에, 중복되는 내용은 본 명세서의 복잡성을 피하기 위하여 그 기재를 생략한다.

본 발명은 또한, 본 명세서에서 상술한 방법에 의해 제작된 sgRNA 라이브러리를 이용하는 표현형 기반 선별방법을 제공한다.

본 발명에 따른 표현형 기반 선별방법은, 본 발명에서 상술한 방법에 의해 제작된 sgRNA 라이브러리를 실제타겟 생물의 세포에 형질전환함으로써 수행될 수 있다.

본 발명에 따른 sgRNA 라이브러리는 원핵생물을 포함한 모든 생명체를 대상으로 적용할 수 있어, 본 발명에 따른 sgRNA 라이브러리가 적용되는 타겟 생물에는 그 제한이 없다.

또한, 본 발명에 따른 sgRNA 라이브러리는 비주형 가닥(non-template strand)만을 표적으로 하여 타겟 생물의 유전체 서열 정보에만 의존하지 않으면서도 유전체 전역을 표적으로 할 수 있으며, mRNA를 출발물질로 활용하여 실제 활발히 발현 중인 유전자를 표적으로 할 수 있고, 단순화된 효소 반응 과정을 거쳐, 종래 효소반응 기반 sgRNA 라이브러리를 이용하여 수행되는 표현형 기반 선별방법의 단점을 효과적으로 해소할 수 있다.

본 발명에 따른 방법은, 원핵생물을 비롯한 모든 생명체에 대하여 유전체 서열 정보에 의존하지 않으면서도 유전체 전역을 표적으로 할 수 있는 sgRNA 라이브러리를 생성할 수 있으며, 생성된 sgRNA가 표적 유전자의 비주형 가닥(non-template strand)에만 선택적으로 결합하기 때문에 원핵생물 대상 표현형 기반 선별을 진행할 수 있다.

또한, DNA와 더불어 또 다른 유용한 유전물질인 mRNA를 출발물질로 활용할 수 있어 실제 활발히 발현 중인 유전자를 표적으로 하는 sgRNA 라이브러리를 생성할 수 있다.

도 1a 및 도 1b는 총 RNA로부터 rRNA를 제거한 mRNA 시료를 바탕으로 연속적 효소반응을 진행하여 sgRNA 라이브러리를 생성하는 전체 과정을 나타낸 모식도이다.
도 2는 sgRNA 라이브러리를 생성하고자 하는 대상 생명체에서 추출한 총 RNA(total RNA) 및 총 RNA로부터 rRNA를 제거한 시료를 미세유체전기영동을 수행하여 길이 분포를 분석한 결과이다 (A: 총 RNA(total RNA), B: 총 RNA로부터 rRNA를 제거한 시료).
도 3은 mRNA 시료를 Mg²⁺와 고온에서 단시간 반응시켜 약 100 nt 가량의 단편을 생성한 후 미세유체전기영동을 수행하여 길이 분포를 분석한 결과이다.
도 4는 mRNA 단편을 바탕으로 역전사 및 제1 PCR을 진행한 후 전기영동을 수행한 결과이다.
도 5는 제1 PCR 산물을 바탕으로 SfiⅠ 반응, 제3 어댑터 부착 및 자성비드 기반 분리를 수행하여 PAM 인접 서열만을 선별한 후 제2 PCR을 진행하여 전기영동을 수행한 결과이다.
도 6은 제2 PCR 산물을 바탕으로 EcoP15Ⅰ 및 AcuⅠ에 의한 연속적 제한효소 반응을 진행하여 20 bp의 sgRNA 스페이서 서열을 생성한 후 전기영동을 수행한 결과이다.
도 7은 연속적 제한효소 반응을 통해 생성된 sgRNA 스페이서 서열에 클로닝을 위한 제4, 5 어댑터를 라이게이션(ligation)한 후 PCR을 통해 증폭하여 전기영동을 수행한 결과이다.
도 8은 생거(Sanger) 시퀀싱 (A 내지 D) 및 차세대서열 분석 (E)을 통해 라이브러리를 분석하여 수득한 결과이다 (A: 클로닝 어댑터와 라이게이션된 sgRNA 서열을 플라스미드에 깁슨 조립(Gicson assembly)한 후 E. coli K-12 MG1655에 형질전환한 산물의 스페이서 부분 길이 분포, B: sgRNA 표적 서열 종류 분포, C: sgRNA 표적 부위의 PAM 인접 여부, D: sgRNA 비주형가닥 표적 여부, E: 스페이서 길이, RNA 종류, PAM 인접 여부 및 가닥 선택성에 따른 비율을 나타낸 결과).
도 9는 플라스미드 상태의 sgRNA 라이브러리를 대상으로 차세대서열분석을 진행하여 삽입 및 참조유전체 정렬 비율, 유전체 범위(coverage) 및 서로 다른 sgRNA의 수를 조사한 결과이다.
도 10은 본 발명에 따른 방법으로 생성한 sgRNA 라이브러리를 표현형 기반 선별에 적용한 뒤, 차세대서열분석을 통해 각 유전자에 할당된 sgRNA 리드(read) 비율 변화를 관찰하여 필수유전자를 선별하는 과정을 나타내는 모식도이다.
도 11은 MG1655 전체 유전자를 대상으로 유전자별 sgRNA 리드(read) 수 비율 변화를 확인 및 -log₂(fold change) 순서대로 나열한 결과이다 (A: sgRNA 리드(read) 수 비율 변화를 확인(-log₂(fold change)가 클수록 dCas9에 의한 발현 억제시 성장 정체가 큰 폭으로 일어나는 유전자임), B: -log₂(fold change) 순서대로 나열).
도 12는 dCas9 발현 세포에서의 비율이 dCas9 미발현 세포에서의 비율에 비해 4배 이상 감소한 (-log₂(fold change)>2) 표적 유전자의 목록과 이를 Keio collection 내 필수유전자 목록한 비교한 결과이다.

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어 자명할 것이다.

실험재료

본 실험에서 사용되는 Total RNA를 추출하기 위한 키트는 New England Biolabs (NEB, Ipswich, MA, USA)에서 구매하였다. rRNA 제거 과정에 활용한 열안정성(thermostable) RNaseH는 Lucigen (Middleton, WI, USA)에서 구매하였고, 5S, 16S, 23S rRNA 상보 DNA 프로브는 Integrated DNA Technologies, Inc. (IDT, Coralville, IW, USA)에서 합성 및 구매하였다. RNA 정제용 키트와 Mg²⁺ fragmentation용 시약은 NEB (Ipswich, MA, USA)에서 구매하였다. Swithcing mechanism at the 5' end of the RNA transcript (SMART)를 통한 cDNA 합성에 활용한 SuperScript™ Ⅱ Reverse Transcriptase는 Thermo Fisher Scientific (Waltham, MA, USA)에서 구매하였고, 제1, 제2 어댑터는 IDT (Coralville, IW, USA)에서 합성하였으며, 베타인 용액(betaine solution)은 Sigma-Aldrich (Burlington, MA, USA)에서 구매하였다. RNase 억제된 마우스(RNase inhibitor murine)는 NEB (Ipswich, MA, USA)에서 구매하였다. SMART cDNA 합성 이후 RNA를 제거하기 위해 사용한 RNaseH, RNaseI는 NEB (Ipswich, MA, USA)에서 구매하였다. SMART cDNA 합성 산물의 정제를 위해 사용한 정제키트는 Promega (Madison, WI, USA)에서 구매하였다.

제1, 제2 및 제3 PCR에서 사용한 Q5 polymerase는 NEB (Ipswich, MA, USA)에서 구매하였고, dNTP는 Takara(Kyoto, Japan)에서 구매하였으며, 프라이머는 Cosmogenetech, Inc. (Seoul, Republic of Korea)을 통해 합성하였고, PCR 산물의 정제에 사용한 키트는 GeneAll Biotechonology (Seoul, Republic of Korea)에서 구매하였다. PAM(Promoter adjacent motif)을 포함한 서열을 선택적으로 절단하는 과정에서 사용된 sfiⅠ는 NEB (Ipswich, MA, USA)에서 구매하였다. sfiⅠ에 의해 절단된 산물에 결합시키는 제3 어댑터는 IDT (Coralville, IW, USA)에서 합성하였으며, 결합에 사용된 quick ligase는 SolGent (Daejeon, Republic of Korea)에서 구매하였다.

제3 어댑터에 부착된 바이오틴과 반응하여 PAM 포함 서열만을 선별하는데 사용된 스트렙타비딘 자성 비드는 Thermo Fisher Scientific (Waltham, MA, USA)에서 구매하였다. 제2 PCR 산물을 바람직한 스페이서(spacer) 길이로 절단하는 과정에서 활용된 EcoP15Ⅰ은 NEB (Ipswich, MA, USA)에서, AcuⅠ은 Enzynomics (Daejeon, Republic of Korea)에서 각각 구매하였다. 바람직한 스페이서 길이로의 절단 산물을 정제하는데 사용한 PAGE recovery kit는 Zymo research (Irvine, CA, USA)에서 구매하였다. 상기 절단 산물에 결합시킨 제4, 제5 어댑터는 IDT (Coralville, IW, USA)에서 합성하였고, 결합 과정에 사용한 T4 liagae는 NEB (Ipswich, MA, USA)에서 구매하였다.

제3 PCR 산물의 깁슨 조립(Gibson assembly)에 활용한 2X Hifi DNA assembly master mix는 NEB (Ipswich, MA, USA)에서 구매하였다. 깁슨 조립 산물 정제시 활용한 정제키트는 GeneAll Biotechonology (Seoul, Republic of Korea)에서 구매하였다. 생거(Sanger) 시퀀싱을 위한 sgRNA 플라스미드 추출을 위한 키트는 GeneAll Biotechonology (Seoul, Republic of Korea)에서 구매하였다. 표현형 기반 선별 전 후 sgRNA 플라스미드의 차세대서열분석을 위한 시약(reagent) 키트는 Illumina, Inc. (San Diego, CA, USA)에서 구매하였다.

실시예 1. 분석 대상 미생물의 total RNA 추출 및 mRNA 선별 및 농축

본 실시예에서는 sgRNA 라이브러리 제작을 위한 출발물질을 확보하기 위하여 분석 대상 미생물을 배양하여 total RNA를 추출하고, rRNA에 상보적인 서열을 가지는 DNA 프로브, 열안정성 RNaseH를 이용해 rRNA를 제거하여 mRNA만을 선별 농축하는 과정을 진행하였다.

1-1. 분석대상 미생물의 total RNA 추출

분석 대상 미생물로는 대표적인 박테리아 모델 생명체인 E. coli K-12 MG1655를 선정하여 진행하였다. 먼저, 진탕배양기에서 37℃, 200 rpm 조건으로 100㎖ LB 배지를 사용하여 지수생장기 (600㎚ 기준 광학밀도 0.4~0.5)에 달할 때까지 배양하였다. 그 후 배양액 20㎖를 취하여 각각 5㎖L씩 4개 튜브에 나누어 원심분리를 통해 세포를 모은 후 상층액을 버리고 RNA 추출용 용액 (18 mM EDTA, 0.025% SDS, 1% β-mercaptoethanol, and 95% formamide)을 100㎕씩 사용하여 세포를 재현탁한 후 95℃에서 7분간 가열하여 용해시켰다. 그 후 반응액을 16,000g에서 5분간 원심분리한 후 상층액을 취하여 total RNA 정제키트를 사용해 200nt보다 긴 RNA만을 선별 정제하였다. 정제된 total RNA의 농도는 Qubit BR RNA를 이용하여 측정하였다.

1-2. mRNA 선별 및 농축

본 발명에서 제시하는 sgRNA 라이브러리를 활용하여 표현형 기반 선별을 비롯한 다양한 실험을 효과적으로 진행하기 위해서는 라이브러리가 모델 생명체의 유전체 정보를 고루 포함하고 있어야 하는데, 이는 라이브러리 제작 출발물질의 조성에 따라 좌우된다. 박테리아를 비롯한 원핵생물 total RNA 질량 조성을 살펴보았을 때 rRNA가 약 80%, tRNA가 약 17%로 대부분을 차지하는 반면 유전체 전역의 정보를 담고 있는 mRNA는 약 3%에 불과하므로, total RNA로부터 mRNA만을 선별 및 농축하여야 고품질의 sgRNA 라이브러리를 제작할 수 있다.

진핵생물과 달리 박테리아 등의 원핵생물의 mRNA에는 폴리 A 꼬리(poly A tail)와 같은 구조적 특징이 없으므로 선별 농축에 어려움이 있으며, 이는 종전까지 sgRNA 라이브러리 생성 방법의 출발물질이 DNA에 국한되거나, 적용 대상이 진핵생물로 제한되는 원인이었다.

본 발명에서는 선행연구 (Choe, D.; et. al. PLOS Genet. 2021, 17 (9), e1009821.)에서 참고한 23S, 16S rRNA에 상보결합하는 DNA 71종, 37종의 서열 및 직접 설계한 5S rRNA 상보결합 DNA 3종을 하기 표 1에 개시한 서열을 활용하여 rRNA-DNA 이중가닥을 형성한 다음, DNA-RNA 이중가닥을 이루고 있는 RNA만을 선택적으로 분해하는 열안정성 RNaseH를 활용하여 rRNA을 분해하고, 200nt 이상의 RNA만을 선별하는 정제방법을 통해 rRNA 파편 및 tRNA를 제거하여 mRNA만을 선별 농축하였다.

서열번호	서열명	서열정보 (5'→3')	타겟
15	16S_1	CTTCTTCCTGTTACCGTTCGACTTGCATGTGT	16S rRNA
16	16S_1B	GCCTGCCGCCAGCGTTCAATCTGAGCCATGAT
17	16S_2	CGTTTCCAGTAGTTATCCCCCTCCATCAGGCA
18	16S_2B	ACATTACTCACCCGTCCGCCACTCGTCAGCAA
19	16S_3	TAATCCCATCTGGGCACATCCGATGGCAAGAG
20	16S_3B	TCCCCCTCTTTGGTCTTGCGACGTTATGCGGT
21	16S_4	GTCTCAGTTCCAGTGTGGCTGGTCATCCTCTC
22	16S_4B	AGGGATCGTCGCCTAGGTGAGCCGTTACCCCA
23	16S_5	CATACACGCGGCATGGCTGCATCAGGCTTGCG
24	16S_5B	CAATATTCCCCACTGCTGCCTCCCGTAGGAGT
25	16S_6	GCGGGTAACGTCAATGAGCAAAGGTATTAACT
26	16S_6B	TCCTCCCCGCTGAAAGTACTTTACAACCCGAA
27	16S_7	TTTACGCCCAGTAATTCCGATTAACGCTTGCA
28	16S_7B	TTACCGCGGCTGCTGGCACGGAGTTAGCCGGT
29	16S_8	CTCAAGCTTGCCAGTATCAGATGCAGTTCCCA
30	16S_8B	CGGGGATTTCACATCTGACTTAACAAACCGCC
31	16S_9	GGGGCCGCCTTCGCCACCGGTATTCCTCCAGA
32	16S_9B	ATTTCACCGCTACACCTGGAATTCTACCCCCC
33	16S_10	ATCGTTTACGGCGTGGACTACCAGGGTATCTA
34	16S_10B	GCTCCCCACGCTTTCGCACCTGAGCGTCAGTC
35	16S_11	CTTGCGGCCGTACTCCCCAGGCGGTCGACTTA
36	16S_11B	CTCCGGAAGCCACGCCTCAAGGGCACAACCTC
37	16S_12	GTAAGGTTCTTCGCGTTGCATCGAATTAAACC
38	16S_12B	ACCGCTTGTGCGGGCCCCCGTCAATTCATTTG
39	16S_13	GACGACAGCCATGCAGCACCTGTCTCACGGTT
40	16S_13B	ACATTCTCATCTCTGAAAACTTCCGTGGATGT
41	16S_14	AGTTCCCGGCCGGACCGCTGGCAACAAAGGAT
42	16S_14B	GCTCGTTGCGGGACTTAACCCAACATTTCACA
43	16S_15	GTGTGTAGCCCTGGTCGTAAGGGCCATGATGA
44	16S_15B	ATCCCCACCTTCCTCCAGTTTATCACTGGCAG
45	16S_16	CTCCAATCCGGACTACGACGCACTTTATGAGG
46	16S_16B	TCTCGCGAGGTCGCTTCTCTTTGTATGCGCCA
47	16S_17	TACAAGGCCCGGGAACGTATTCACCGTGGCAT
48	16S_17B	CGATTACTAGCGATTCCGACTTCATGGAGTCG
49	16S_18	TCACAAAGTGGTAAGCGCCCTCCCGAAGGTTA
50	16S_18B	CTTCTTTTGCAACCCACTCCCATGGTGTGACG
51	16S_19	CCGCAGGTTCCCCTACGGTTACCTTGTTACGA
52	23S_1	ACCGACGCTTATCGCAGATTAGCACGTCCTTC	23S rRNA
53	23S_1B	GACTGCCAGGGCATCCACCGTGTACGCTTAGT
54	23S_2	GGATTCAGTTAATGATAGTGTGTCGAAACACA
55	23S_2B	CCCATTCGGAAATCGCCGGTTATAACGGTTCA
56	23S_3	GCTACTGGGGGAATCTCGGTTGATTTCTTTTC
57	23S_3B	CTTAGATGTTTCAGTTCCCCCGGTTCGCCTCA
58	23S_4	ACCCTGTATCGCGCGCCTTTCCAGACGCTTCC
59	23S_4B	CACACTGATTCAGGCTCTGGGCTGCTCCCCGT
60	23S_5	CCCCCATATTCAGACAGGATACCACGTGTCCC
61	23S_5B	ATCGAGCTCACAGCATGTGCATTTTTGTGTAC
62	23S_6	TCGCCGGGGTTCTTTTCGCCTTTCCCTCACGG
63	23S_6B	ACTATCGGTCAGTCAGGAGTATTTAGCCTTGG
64	23S_7	TATACAAAAGGTACGCAGTCACACGCCTAAGC
65	23S_7B	CTGCTTGTACGTACACGGTTTCAGGTTCTTTT
66	23S_8	CTTAACGCCCAGTTAAGACTCGGTTTCCCTTC
67	23S_8B	ATTCGGTTAACCTTGCTACAGAATATAAGTCG
68	23S_9	CGGTTCGGTCCTCCAGTTAGTGTTACCCAACC
69	23S_9B	CCCATGGCTAGATCACCGGGTTTCGGGTCTAT
70	23S_10	TTCGGGGAGAACCAGCTATCTCCCGGTTTGAT
71	23S_10B	ACCCCCAGCCACAAGTCATCCGCTAATTTTTC
72	23S_11	GGTTGGTAAGTCGGGATGACCCCCTTGCCGAA
73	23S_11B	TACCCCCGGAGATGAATTCACGAGGCGCTACC
74	23S_12	TTGTTTCCCTCTTCACGACGGACGTTAGCACC
75	23S_12B	TCTCCCGTGATAACATTCTCCGGTATTCGCAG
76	23S_13	TAAGCCAACATCCTGGCTGTCTGGGCCTTCCC
77	23S_13B	CCACTTAACCATGACTTTGGGACCTTAGCTGG
78	23S_14	CATGGTTTAGCCCCGTTACATCTTCCGCGCAG
79	23S_14B	CCAGTGAGCTATTACGCTTTCTTTAAATGATG
80	23S_15	ATGCCTCACAGCACACCTTCGCAGGCTTACAG
81	23S_15B	TACCCAACAACGCATAAGCGTCGCTGCCGCAG
82	23S_16	AACCCTTGGTCTTCCGGCGAGCGGGCTTTTCA
83	23S_16B	CGTTACTTATGTCAGCATTCGCACTTCTGATA
84	23S_17	TATTAACCTGTTTCCCATCGACTACGCCTTTC
85	23S_17B	TAGGGGTCGACTCACCCTGCCCCGATTAACGT
86	23S_18	TACACGCTTAAACCGGGACAACCGTCGCCCGG
87	23S_18B	CTTCTCCGTCCCCCCTTCGCAGTAACACCAAG
88	23S_19	AGGGCATTTGTTGCTTCAGCACCGTAGTGCCT
89	23S_19B	CCTCAGCCTTGATTTTCCGGATTTGCCTGGAA
90	23S_20	TTGGTATTCTCTACCTGACCACCTGTGTCGGT
91	23S_20B	ATTTGATGTTACCTGATGCTTAGAGGCTTTTC
92	23S_21	CTCACCTACATATCAGCGTGCCTTCTCCCGAA
93	23S_21B	CATTTTGCCTAGTTCCTTCACCCGAGTTCTCT
94	23S_22	GTGTTTGCACAGTGCTGTGTTTTTAATAAACA
95	23S_22B	CTGGTATCTTCGACTGATTTCAGCTCCATCCG
96	23S_23	CGATCAAGAGCTTCGCTTGCGCTAACCCCATC
97	23S_23B	CGGCACCGGGCAGGCGTCACACCGTATACGTC
98	23S_24	TTCGTGCAGGTCGGAACTTACCCGACAAGGAA
99	23S_24B	TAGGACCGTTATAGTTACGGCCGCCGTTTACC
100	23S_25	TTGCCGCGGGTACACTGCATCTTCACAGCGAG
101	23S_25B	TGAGTCTCGGGTGGAGACAGCCTGGCCATCAT
102	23S_26	TCAAAGCCTCCCACCTATCCTACACATCAAGG
103	23S_26B	GTGTCAAGCTATAGTAAAGGTTCACGGGGTCT
104	23S_27	CGGATTACGGGTCAACGTTAGAACATCAAACA
105	23S_27B	TATTTCAAGGTCGGCTCCATGCAGACTGGCGT
106	23S_28	TTAGCCAACCTTCGTGCTCCTCCGTTACTCTT
107	23S_28B	CGCCCCAGTCAAACTACCCACCAGACACTGTC
108	23S_29	GCTTTCGCACCTGCTCGCGCCGTCACGCTCGC
109	23S_29B	CTTATGCCATTGCACTAACCTCCTGATGTCCG
110	23S_30	GTATCAGCCTGTTATCCCCGGAGTACCTTTTA
111	23S_30B	ATGGCCCTTCCATTCAGAACCACCGGATCACT
112	23S_31	CCTTGGGACCTACTTCAGCCCCAGGATGTGAT
113	23S_31B	GAGGTGCCAAACACCGCCGTCGATATGAACTC
114	23S_32	GCCCACGGCAGATAGGGACCGAACTGTCTCAC
115	23S_32B	CCCAGCTCGCGTACCACTTTAAATGGCGAACA
116	23S_33	CATTGGCATGACAACCCGAACACCAGTGATGC
117	23S_33B	TCCTCTCGTACTAGGAGCAGCCCCCCTCAGTT
118	23S_34	AGGGAGAACTCATCTCGGGGCAAGTTTCGTGC
119	23S_34B	CAGCACTTATCTCTTCCGCATTTAGCTACCGG
120	23S_35	TAGCTCAACGCATCGCTGCGCTTACACACCCG
121	23S_35B	TCGTCGTCTTCAACGTTCCTTCAGGACCCTTA
122	23S_36B	AAGGTTAAGCCTCACGGTTCATTAGTACCGGT
123	ArOP_5S_1	CGGCATGGGGTCAGGTGGGACCACCGCGCTAC	5S rRNA
124	ArOP_5S_2	CACACTACCATCGGCGCTACGGCGTTTCACTTC
125	ArOP_5S_3	ATGCCTGGCAGTTCCCTACTCTCGCATGGGGA

먼저, 상술한 과정을 거쳐 추출한 분석 대상 미생물의 total RNA를 시료로 하여 하기 표 2와 같은 조성으로 rRNA 제거 과정을 시작하였다.

구성 요소	양
Total RNA	2㎍ X 24 tubes
10X DNaseⅠbuffer	1.5㎕ X 24 tubes
DNaseⅠ	1㎍ (2 U) X 24 tubes
Nuclease-free water	15㎕까지 X 24 tubes
Total	15㎕ X 24 tubes

위 조성으로 반응액을 구성하여 thermocycler에서 37℃에서 10분간 DNaseⅠ에 의한 genomic DNA 제거반응을 진행하였다. 이후 반응액에 thermostable RNaseH complement buffer (90 mM Tris-HC, 200 mM KCl)을 각각 15㎕씩 가한 다음 75℃에서 10분간 반응하여 DNaseⅠ을 불활성화 하였다. 그 후 온도를 25℃로 낮춘 상태에서 2㎕의 23S, 16S rRNA 상보서열 (각각 10 pmol, 108종 총 1080 pmol), 0.5㎕의 5S rRNA 상보서열 (각각 12.5 pmol, 3종 총 37.5 pmol), 1㎕의 100 mM MgCl₂을 각각의 튜브에 가하였다.

그 다음 90℃로 온도를 올려 1초간 RNA 2차구조의 변성 과정을 거친 후 65℃로 온도를 낮춘 상태에서 2㎕ (10 U)의 thermostable RNaseH를 가하고 20분간 반응시켜 rRNA의 제거를 진행하였다. 그 후 다시 90℃에서 1초간 변성을 진행한 후 65℃에서 10분간 추가적인 rRNA 제거 반응을 진행하였다. 그 후 RNA 정제키트를 활용하여 4개 튜브의 반응물에 1개 컬럼씩 총 6개 컬럼으로 정제하였으며 각 컬럼에 대해 40㎕의 nuclease-free water를 사용하여 용출하였다. 이때 정제과정에서 메뉴얼 상에 제시된 에탄올 사용 비율 조절을 통해 200nt 이상의 RNA만을 선별 농축하여 정제함으로써 rRNA 파편 및 tRNA를 제거하였다.

rRNA 제거 이후 rRNA 상보 DNA를 제거하기 위한 DNaseⅠ반응을 하기 표 3과 같이 진행하였다.

구성 요소	양
rRNA-depleted RNA	10㎕ X 24 tubes
10X DNaseⅠbuffer	5㎕ X 24 tubes
DNaseⅠ	5㎕ (10 U) X 24 tubes
Nuclease-free water	30㎕ X 24 tubes
Total	50㎕ X 24 tubes

위 조성으로 반응액을 구성하여 25℃, 30℃, 35℃, 40℃, 45℃에서 각각 5분씩 반응시켰으며, 각 온도간 변화 시 온도 상승 속도를 0.1℃/초로 하여 rRNA 상보 DNA를 제거하였다. 반응 종료 후 RNA 정제키트를 활용하여 1개 컬럼을 24개 튜브 반응물을 모두 정제하여 20㎕의 nuclease-free water로 용출하였으며, 200nt 이상의 RNA만을 다시 선별 정제하여 미처 제거되지 못한 rRNA 파편, tRNA 및 rRNA 상보 DNA를 제거하였다. 정제된 mRNA의 농도는 Qubit BR RNA를 이용하여 측정하였다.

mRNA 제거 과정 전후 rRNA 제거 여부를 판단하기 위하여 Bioanalyzer RNA 6000 pico kit을 이용해 미세유체기반 전기영동을 수행하여 mRNA 시료의 크기 분포를 분석하였다.

도 2에 나타낸 바와 같이, total RNA 시료에서는 박테리아에서 특징적으로 나타나는 5S rRNA (약 120nt) 16S rRNA (약 1,500nt), 23S rRNA (약 2,900nt) 피크가 선명하게 드러난 반면 (도 2의 A), rRNA 제거 과정을 거친 시료에서는 특징적인 피크 없이 넓은 길이 영역에서 RNA가 검출되었다 (도 2의 B). 이는 total RNA에서 rRNA가 고효율로 제거되어, 유전체 전역을 표적으로 할 수 있는 라이브러리를 만들기 위한 고품질의 출발물질이 확보되었음을 의미한다.

실시예 2. total mRNA를 활용한 sgRNA 라이브러리 생성 과정

2-1. mRNA 단편화

앞선 실시예 1을 통하여 생성한 total mRNA를 출발물질로 하여 연속적인 효소 반응을 통하여 sgRNA library를 생성하였다.

먼저, total mRNA를 Mg²⁺와 함께 고온에서 단시간 반응시켜 약 100nt 가량의 길이로 단편화를 진행하여, 5' 말단에 PAM 상보서열을 노출시켜 선별 농축을 가능하게 함과 동시에 이후의 라이브러리 제작과정을 진행하기 수월하도록 하였다. 하기 표 4와 같은 구성으로 반응하였다.

구성 요소	양
Enriched mRNA	500 ng
10X RNase fragmentation buffer	2㎕
Nuclease-free water	20㎕까지
Total	20㎕L

위 조성으로 반응액을 구성하여 thermocycler를 이용, 94℃에서 4분 30초간 반응하여 단편화를 진행하였다. 반응 직후 얼음에서 3분간 냉각한 후 stop solution 2㎕를 가하고 1분간 상온에서 반응하여 단편화를 중지하였다. 그 후 RNA 정제키트로 정제하여 10㎕ nuclease-free water로 용출하였으며, Qubit BR RNA를 통해 정량하였다.

도 3에 나타낸 바와 같이, mRNA 단편화 진행 전후 시료에 대하여 Bioanalyzer RNA 6000 pico kit을 통하여 분석한 결과, 100nt 근처의 피크가 나타나 균일한 크기로 단편화되었음을 확인하였다.

2-2. SMART cDNA 합성

단편화 진행 후, Switching mechanism at the 5' end of the RNA transcript (SMART)를 통한 cDNA 합성을 진행하였다. 위 과정을 통해 시료를 DNA 형태로 전환함과 동시에 양 말단에 제1, 제2 어댑터를 부착하여 이후 과정에서 PCR 프라이머 및 제한효소 인식부위로써 기능하게 했다. 이 때 사용한 제1 어댑터 결합용 DNA 프라이머 (SMART_RT_R) 및 제2 어댑터 결합용 DNA-RNA 키메라 프라이머 (SMART_RT_F)의 서열은 하기 표 5에 나타내었으며, 하기 표 6과 같은 구성으로 반응을 시작하였다.

이름	서열정보 (5'→ 3')
SMART_RT_R(서열번호 1)	AGGTATCTCGAGTCCCCAGCAGCNNNNNNN (굵은 글씨 서열은 EcoP15Ⅰ인식부위)
SMART_RT_F(서열번호 2)	AGTGGTATCAACGCAGAGT GGCC AAGCrG rGrG (굵은 기울임 표시 서열은 부분적 SfiⅠ인식부위) (rG는 RNA G)

구성 요소	양
mRNA fragments	50~200 ng
100 μM SMART_RT_R	0.25㎕
25 μM dNTP (each)	0.4㎕
Total	8.13㎕

위 조성으로 반응액을 구성하여 72℃에서 10분간 RNA 2차 구조 변성을 진행한 후 얼음에서 3분간 냉각하였다. 그 후 하기 표 7과 같은 조성으로 추가 시약을 첨가한 후 25℃에서 10분간 반응시켰다.

구성 요소	양
Denatured RNA (표 6)	8.13㎕
5X Superscript Ⅱ Buffer	4㎕
100 mM DTT	2㎕
5M Betaine	4㎕
1M MgCl₂	0.12㎕
RNase inhibitor murine	0.5㎕
Superscript Ⅱ reverse transcriptase	1㎕
Total	19.75㎕

그 후 SMART_RT_F를 첨가한 후 42℃에서 90분간 역전사를 진행 후 75℃에서 10분간 효소를 불활성화 하였다. 이를 위하여 하기 표 8의 조성으로 반응하였다.

구성 요소	양
Denatured RNA (표 6)	19.75㎕
100 μM SMART_RT_F	0.25㎕
Total	20㎕

위 조성대로 42℃ 반응 시 제1 어댑터 결합용 프라이머인 SMART_RT_R의 3'쪽 무작위 염기서열 7개가 mRNA 단편에 결합하여 프라이머로 작용해 reverse transcriptase에 의한 역전사가 진행된다. 역전사 후 reverse transcriptase의 활성에 의해 cDNA의 3'말단에 CCC 오버행이 추가되는데 이 오버행 부위에 제2 어댑터 결합용 프라이머인 SMART_RT_F의 3'말단의 RNA GGG가 결합하게 되면 cDNA 합성의 주형이 SMART_RT_F로 교체되어 역전사가 계속되고, 결과적으로 cDNA의 양 말단에 제1, 제2 어댑터가 부착되도록 하였다.

Reverse transcriptase 불활성화를 진행한 이후, RNaseH, RNaseI를 가하여 37℃에서 30분간 반응시켜 역전사의 주형으로 쓰인 RNA를 분해하였다. 이를 위하여 하기 표 9의 조성으로 반응하였다.

구성 요소	양
cDNA (표 8)	20㎕
RNaseH	0.5㎕
RNaseI	0.5㎕
Total	21㎕

RNA 분해 이후 ProNex Size-selective purification 3X protocol을 이용하여 cDNA를 정제하였고, 25㎕의 elution buffer (10 mM Tris-HCl, pH 8.5)로 용출하였다.

2-3. 제1 PCR

실시예 2-2에서 합성한 cDNA를 주형으로, 제1, 제2 어댑터를 프라이머 영역으로 하여 제1 PCR을 실시하여 시료를 증폭하였다. 사용한 프라이머는 하기 표 10과 같으며, 하기 표 11과 같은 조성으로 반응을 실시하였다.

이름	서열정보 (5'→ 3')
SMART_PCR_F(서열번호 126)	AGTGGTATCAACGCAGAGTGGCC
SMART_PCR_R(서열번호 127)	AGGTATCTCGAGTCCCCAGCAGC

구성 요소	양
5X Q5 reaction buffer	20㎕ X 10 tubes
2.5 mM dNTP (each)	8㎕ X 10 tubes
10 μM SMART_PCR_F	5㎕ X 10 tubes
10 μM SMART_PCR_R	5㎕ X 10 tubes
cDNA	2㎕ X 10 tubes
Q5 polymerase	1㎕ X 10 tubes
Nuclease-free water	59㎕ X10 tubes
Total	100㎕ X 10 tubes

프라이머 결합 온도는 72℃, 신장 단계의 시간은 12초, 마지막 신장 단계를 12초로 하여 총 12 사이클 동안 PCR을 수행한 후, PCR 정제키트를 이용해 정제하였고, 51㎕의 elution buffer (10mM Tris-HCl, pH 8.5)로 용출하였다.

이후, 도 4에 나타낸 바와 같이, 전기영동 분석에서 100nt 가량의 PCR 산물의 밴드를 확인하여 cDNA 합성 및 제1, 제2 어댑터의 부착, 제1 PCR이 정상적으로 이루어진 것을 검증하였다.

2-4. SfiⅠ digestion

제1 PCR 산물에는 제2 어댑터가 부착되어 있는데, 제2 어댑터는 제한효소 SfiⅠ인식 부위

5'…GGCCNNNN/NGGCC…3'

3'…CCGGN/NNNNCCGG…5'

가운데 일부분을 아래와 같이 포함하도록 설계되었다

(표 5의 SMART_RT_F 굵은 글씨).

5'…GGCCAAGC/GG 3'

3'…CCGGT/TCGCC 5'

이 때 cDNA 합성 당시 주형으로 쓰인 mRNA의 5'말단에 spCas9 PAM 서열의 상보서열인 CC가 존재한다면 아래와 같이 온전한 SfiⅠ 인식부위가 완성되어 절단이 진행되며, 존재하지 않는다면 절단이 되지 않는다.

5'…GGCCAAGC/GGCC 3'

3'…CCGGT/TCGCCGG 5'

하기 표 12와 같은 조성으로 반응액을 구성하여 50℃에서 120분 동안 제한효소 반응을 진행하였다.

구성 요소	양
제1 PCR 산물	1㎍ X 4 tubes
10x CutSmart buffer	5㎕ X 4 tubes
SfiⅠ	1㎕ X 4 tubes
Nuclease-free water	50㎕까지 X 4 tubes
Total	50㎕ X 4 tubes

반응 산물의 정제에는 ProNex Size-selective purification 3X protocol을 활용하였고, 20 X 4 tubes의 elution buffer (10 mM Tris-HCl, pH 8.5)로 용출하여 총 80㎕의 정제산물을 확보하였다.

2-5. 제3 어댑터 ligation 및 PAM 상보서열 포함 DNA 선별 농축

SfiⅠ digestion 후 산물에는 cDNA 합성시 주형 mRNA 5'말단에 spCas9 PAM의 상보서열인 CC가 존재하여 절단된 DNA와 CC가 존재하지 않아 절단되지 않고 남아있는 DNA가 혼재되어 있다. 이때 SfiⅠ에 의해 절단된 DNA의 오버행에 결합할 수 있는 상보적인 오버행을 가진 이중가닥 DNA인 제3 어댑터를 투입해 라이게이션 반응을 진행하면 PAM 상보서열을 포함한 DNA만 라이게이션이 일어난다.

먼저 오버행을 가진 이중가닥 DNA인 제3 어댑터를 제조하기 위해 단일가닥 DNA 2개의 서열을 상보적으로 결합시켰다. 사용한 DNA의 서열은 하기 표 13과 같으며, 하기 표 14와 같은 조성으로 진행하였다.

이름	서열정보 (5'→ 3')
Adapter3_F(서열번호 5)	Biotin-AGGCTCACTGCATATGCTGAAGTCAGCAGC (밑줄 친 서열은 AcuⅠ인식 부위) (굵은 글씨 서열은 EcoP15Ⅰ인식 부위)
Adapter3_R(서열번호 8)	GCTGACTTCAGCATATGCAGTGAGCCT

구성 요소	양
10 μM Adapter3_F	10㎕
10 μM Adapter3_R	10㎕
Nuclease-free water	180㎕
Total	200㎕

위 조성대로 반응액을 구성하여 thermocycler를 이용, 95℃에서 5분간 가열하여 DNA 2차 구조를 변성시킨 후 25℃까지 0.1℃/sec의 속도로 냉각하여 이중가닥 상태의 제3 어댑터를 생성하였다.

그 후 제3 어댑터와 SfiⅠ 반응 산물 간의 라이게이션을 하기 표 15의 조성으로 진행하였다.

구성 요소	양
SfiⅠ digested product	150 ng X 6 tubes
500 nM 제3 어댑터	1㎕ X 6 tubes
2X Quick ligase buffer	10㎕ X 6 tubes
Quick ligase	1㎕ X 6 tubes
Total	20㎕ X 6 tubes

위 조성대로 반응액을 구성하여 25℃에서 15 분간 라이게이션을 진행하였다.

라이게이션 이후, PAM 상보서열 (CC)를 포함한 DNA만이 제3 어댑터와 결합한 상태이다. 이 때, 제3 어댑터에는 바이오틴이 부착되어 있는데, 바이오틴-스트렙타비딘 간의 강한 특이적 결합을 이용하여 PAM 상보서열 포함 DNA만을 선별 농축할 수 있다. 표면에 스트렙타비딘이 부착된 자성 비드를 이용해 PAM 상보서열 포함 DNA를 비드에 결합시키고 상층액을 제거해 PAM 상보서열 미포함 DNA를 제거하였으며, 자성비드를 72㎕의 nuclease-free water에 재현탁하였다.

2-6. 제2 PCR

실시예 2-5에서 자성비드에 결합시킨 PAM 상보서열 포함 DNA를 주형으로, 제1, 제3 어댑터를 프라이머 영역으로 하여 제2 PCR을 실시하여 시료를 증폭하였다. 사용한 프라이머는 하기 표 16과 같으며, 하기 표 17과 같은 조성으로 반응을 실시하였다.

이름	서열정보 (5'→ 3')
SMART_PCR_R(서열번호 127)	AGGTATCTCGAGTCCCCAGCAGC
Adapter3_PCR_F(서열번호 128)	AGGCTCACTGCATATGCTGAAGTCAGCAGCG

구성 요소	양
5X Q5 reaction buffer	20㎕ X 10 tubes
2.5 mM dNTP (each)	8㎕ X 10 tubes
10 μM Adapter3_PCR_F	5㎕ X 10 tubes
10 μM SMART_PCR_R	5㎕ X 10 tubes
DNA attached to streptavidin magnetic bead	7㎕ X 10 tubes
Q5 polymerase	1㎕ X 10 tubes
Nuclease-free water	54㎕ X 10 tubes
Total	100㎕ X 10 tubes

프라이머 결합 온도는 72℃, 신장 단계의 시간은 12초, 마지막 신장 단계를 12초로 하여 총 12 사이클 동안 PCR을 수행하였다. 이후 자석 스탠드를 이용하여 상층액을 취한 후 PCR 정제키트를 이용해 정제하였고, 51㎕의 elution buffer (10mM Tris-HCl, pH 8.5)로 용출하였다.

이후, 도 5에 나타낸 바와 같이, 전기영동 분석에서 100nt 가량의 PCR 산물의 밴드를 확인하여 sfiⅠ digestion 및 제3 어댑터의 부착, PAM 상보 서열 포함 DNA의 선별 농축이 정상적으로 이루어진 것을 검증하였다.

2-7. 제한효소 기반 sgRNA 스페이서 서열 생성

실시예 2-6을 통해 생성된 제2 PCR 산물에는 제1, 제3 어댑터가 부착되어 있다. 표 5 및 표 13에서 확인할 수 있는 바와 같이, 제1, 제3 어댑터는 typeⅢ 제한효소인 EcoP15Ⅰ의 인식 부위를 포함하며, 제3 어댑터는 typeⅡS 제한효소인 AcuⅠ인식부위를 포함하고 있다. 이들 효소는 인식 부위와 절단 부위가 서로 멀리 떨어져 있어 어댑터 서열로부터 정해진 거리에 위치해 있는 mRNA 유래 무작위 서열을 절단할 수 있다. 먼저 하기 표 18과 같이 EcoP15Ⅰ 반응을 수행하였다.

EcoP15Ⅰ의 인식 부위는

5'…CAGCAG(N)₂₅/… 3'

3'…GTCGTC(N)₂₇/… 5' 이므로, 절단이 진행되면

5'AGGCTCACTGCATATGCTGAAGTCAGCAGC(N)₂₄ 3'

3'TCCGAGTGACGTATACGACTTCAGTCGTCG(N)₂₆ 5'가 생성된다.

구성 요소	양
제2 PCR 산물	1㎕ X 4 tubes
10x CutSmart buffer	4㎕ X 4 tubes
EcoP15Ⅰ	1㎕ X 4 tubes
10X ATP	4㎕ X 4 tubes
Nuclease-free water	40㎕까지 X 4 tubes
Total	40㎕ X 4 tubes

위 조성대로 반응액을 구성하여 thermocycler를 이용, 37℃에서 120분간 반응시켰다. 이후 AcuⅠ반응을 하기 표 19와 같이 수행하였다.

AcuⅠ의 인식 부위는

5'…CTGAAG(N)₁₆/… 3'

3'…GACTTC(N)₁₄/… 5' 이므로, 절단이 진행되면

5'NNNNNNNNNNNNNNNN 3'

3'NNNNNNNNNNNNNNNNNNNN 5'

위와 같이 16nt 와 20nt DNA가 상보결합하여 양쪽에 오버행이 2nt씩 존재하는 20 bp 이중가닥 DNA 산물이 생성된다. 이중 20nt 가닥이 sgRNA의 스페이서 서열로서 활용된다.

구성 요소	양
EcoP15Ⅰ 반응물	40㎕ X 4 tubes
10x CutSmart buffer	1×4㎕ tubes
AcuⅠ	2×4㎕ tubes
4 mM S-adenosylmethionine	0.5㎕ X 4 tubes
Nuclease-free water	6.5㎕ X 4 tubes
Total	50㎕ X 4 tubes

위 조성대로 반응액을 구성하여 thermocycler를 이용, 37℃에서 120분간 반응시켰다. 이후 반응물을 20% (19:1 acrylamide:bis-acrylamide) polyacrylamide gel에서 전기영동하여, 도 5에 나타낸 바와 같이, 20 bp 가량의 밴드를 확인 및 절단한 후 PAGE 정제키트를 통해 DNA를 추출하였다. 정제된 20 bp 길이 sgRNA 스페이서 DNA의 농도는 Qubit 1x dsDNA HS를 통해 측정하였다.

2-8. 클로닝 어댑터 ligation 및 제3 PCR, Gibson assembly

실시예 2-7에서 생성한 20 bp 길이의 sgRNA 스페이서 DNA에 발현을 위한 프로모터 서열 어댑터 (제4 어댑터)와 sgRNA 스캐폴드 서열 어댑터 (제5 어댑터)를 각각 라이게이션하였다. 이때 프로모터에 의해 전사되는 서열은 20nt 가닥이며, 이 서열은 mRNA의 상보서열 및 genomic DNA의 주형 가닥과 동일한 서열이므로 전사된 sgRNA는 비주형 가닥과 결합하게 된다.

이에 앞서, 이중가닥 DNA인 제4, 5 어댑터를 제조하기 위해 단일가닥 DNA 서열을 각각 두 개씩 상보적으로 결합시켰다. 사용한 DNA의 서열은 하기 표 20과 같으며, 상기 표 14와 동일한 조성 및 반응조건으로 진행하였다.

이름	서열정보 (5'→ 3')
Adapter4_F(서열번호 11)	GATCTTTGACAGCTAGCTCAGTCCTAGGTATAATACTAGT
Adapter4_R(서열번호 12)	NNACTAGTATTATACCTAGGACTGAGCTAGCTGTCAAAGATC
Adapter5_F(서열번호 13)	GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTC
Adapter5_R(서열번호 14)	GACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAACNN

이후 제4, 제5 어댑터와 sgRNA 스페이서 DNA의 라이게이션을 하기 표 21의 조성으로 진행하였다.

구성 요소	양
sgRNA 스페이서 DNA	0.1 pmol 이상
500 nM 제4 어댑터	sgRNA 스페이서 DNA의 5 당량 몰 수
500 nM 제5 어댑터	sgRNA 스페이서 DNA의 5 당량 몰 수
10X T4 ligase buffer	2㎕
T4 ligase	1㎕
Nuclease-free water	20㎕ 까지
Total	20㎕

위 조성대로 반응액을 구성하여 25℃에서 120분간 반응시켰다. 이후 라이게이션 반응물을 주형으로 하여 제3 PCR을 수행하였다. 이 때 사용한 프라이머는 하기 표 22와 같으며, 하기 표 23과 같은 조성으로 반응을 실시하였다.

이름	서열정보 (5'→ 3')
Adapter4_PCR_F(서열번호 129)	GATCTTTGACAGCTAGCTCAGTCCTAGG
Adapter5_PCR_R(서열번호 130)	GACTAGCCTTATTTTAACTTGCTATTTCTAGCTC

구성 요소	양
5X Q5 reaction buffer	20㎕
2.5 mM dNTP (each)	8㎕
10 μM Adapter4_PCR_F	5㎕
10 μM Adapter5_PCR_R	5㎕
클로닝 어댑터 ligation 산물	20㎕
Q5 polymerase	1㎕
Nuclease-free water	41㎕
Total	100㎕

프라이머 결합 온도는 67℃, 신장 단계의 시간은 12초, 마지막 신장 단계를 12초로 하여 총 20 사이클 동안 PCR을 수행하였다. 이후 5% agarose gel에서 전기영동을 수행하여, 도 7에 나타낸 바와 같이, 라이게이션 및 제3 PCR이 성공적으로 진행되었음을 확인 후 gel extraction을 통해 100 bp의 산물을 분리하였다.

이후 제3 PCR 산물의 깁슨 조립(Gibson assembly)을 위하여 pgRNA-bacteria 플라스미드의 sgRNA 스페이서 서열을 제외한 부분에 대한 PCR을 진행하였다. 사용한 프라이머는 하기 표 24와 같으며, 하기 표 25와 같은 조성으로 반응을 실시하였다.

이름	서열정보 (5'→ 3')
pgRNA-bacteria_PCR_F(서열번호 131)	GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGC
pgRNA-bacteria_PCR_R(서열번호 132)	ACTAGTATTATACCTAGGACTGAGCTAGCTG

구성 요소	양
5X Q5 reaction buffer	20㎕
2.5 mM dNTP (each)	8㎕
10 μM pgRNA-bacteria_PCR_F	5㎕
10 μM pgRNA-bacteria_PCR_R	5㎕
pgRNA-bacteria (plasmid)	50ng
Q5 polymerase	1㎕
Nuclease-free water	100㎕까지
Total	100㎕

프라이머 결합 온도는 66℃, 신장 단계의 시간은 50초, 마지막 신장 단계를 120초로 하여 총 30 사이클 동안 PCR을 수행한 후 정제하였다.

위의 pgRNA-bacteria PCR 산물을 벡터로, 제3 PCR 산물을 인서트(insert)로 하여 1:5 몰 수 비율로, 하기 표 26의 조성으로 깁슨 조립을 진행하였다.

구성 요소	양
2X Hifi DNA assembly mix	10㎕
pgRNA-bacteria PCR 산물	0.033 pmol
제3 PCR 산물	0.166 pmol
Nuclease-free water	20㎕까지
Total	20㎕

위 조성대로 반응액을 구성하여 50℃에서 120분간 반응시켰다. 0.2 pmol fragments/20㎕ 비율로 반응시켰으며, 필요에 따라 반응 규모를 조절하였다. 위 과정을 통해 플라스미드 상태의 sgRNA 라이브러리를 획득하였다.

실시예 3. 생성된 sgRNA 라이브러리의 특성 분석

실시예 2를 통하여 생성된 sgRNA 라이브러리의 특성을 분석하기 위하여 대장균 DH5α를 위 라이브러리를 통해 형질전환하였다. 그 후 40개 콜로니의 pgRNA-bacteria 플라스미드를 각각 추출하여 생거(Sanger) 시퀀싱을 통해 sgRNA 스페이서 서열의 길이, 참조유전체 정렬 비율, PAM 인접 여부, 비주형 가닥 타겟팅 여부를 조사하였다.

3-1. sgRNA 스페이서 서열 길이 분석

생거 시퀀싱을 통해 얻은 서열로부터 전사를 위한 프로모터 및 sgRNA 스캐폴드 서열을 제거하여 표적 유전자와 결합하는 sgRNA 스페이서의 서열만을 분리하였다.

도 8의 A에 나타낸 바와 같이, 40개 서열 중 36개 서열(91%)이 스페이서 서열이 삽입되어 있었으며, 그 중 19 bp 미만의 스페이서는 2개 (5%), 19 bp는 14개 (35%), 20 bp는 17개 (43%), 21 bp는 2개 (5%), 21 bp 이상의 스페이서는 1개 (3%)였다. 이를 통해, 실시예 2를 통해 생성된 sgRNA 라이브러리 중 대부분 (91%)가 spCas9 sgRNA 스페이서의 최적 길이인 19-21 bp에 해당함을 검증하였다.

3-2. 참조유전체 정렬 분석

실시예 2-1에서 얻은 스페이서 서열 36개를 sgRNA library를 생성하는데 활용했던 E. coli K-12 MG1655의 참조유전체와 BLAST를 이용하여 정렬하였다.

도 8의 B에 나타낸 바와 같이, 전체 중 32개 (89%)가 참조유전체에 정렬되었으며, mRNA 및 기타 non-coding RNA 유전자에 정렬된 서열은 26개 (72%), rRNA 유전자에 정렬된 서열은 6개 (17%)였다. 이를 통해, 생성된 sgRNA 라이브러리 중 대부분이 참조유전체에 정렬되어 표현형 스크리닝에 효과적으로 활용될 수 있음을 검증하였다.

3-3. PAM 인접 여부 분석

실시예 2-2에서 얻은 참조유전체 정렬 서열 32개를 바탕으로, 정렬부위의 3'말단이 spCas9의 PAM 서열인 NGG와 인접해 있는지를 분석하였다.

도 8의 C에 나타낸 바와 같이, 전체 정렬 서열 중 30개 (94%)가 3'말단에 PAM과 인접하였으며, 2개 (6%)가 PAM과 인접하지 않았다. 이를 통해, 유전체에 정렬된 sgRNA 서열의 대부분이 Cas9의 작동에 필수적인 PAM에 인접한 부위를 표적으로 함을 검증하였다.

3-4. non-template strand targeting 여부 분석

실시예 2-2에서 얻은 참조유전체 정렬 서열 32개를 바탕으로, 비주형을 타켓팅하는지 (정렬부위가 주형 가닥인지)를 분석하였다.

도 8의 D에 나타낸 바와 같이, 전체 정렬 서열 중 32개 (100%)가 비주형 가닥을 타켓팅하였으며, 0개 (0%)가 주형 가닥을 타켓팅하였다. 이를 통해, 유전체에 정렬된 sgRNA 서열의 대부분이 비주형 가닥을 타켓팅하여, dCas9에 의한 유전자 억제가 효과적으로 일어날 수 있음을 검증하였다.

3-5. 차세대서열분석을 통한 라이브러리 특성 분석

실시예 3-1, 3-2, 3-3, 3-4에서 얻은 생거 시퀀싱 분석결과에 더불어, 생성된 sgRNA 라이브러리의 스페이서 길이, 참조유천체 정렬 유전자 종류, PAM 인접 여부, 비주형가 가닥 타겟팅 여부를 더욱 면밀히 분석하고자, 라이브러리에 대해 차세대서열분석을 실시하였다.

도8의 E에 나타낸 바와 같이, 스페이서 길이 분포의 경우 약 80%의 sgRNA가 spCas9 sgRNA 스페이서의 최적 길이인 19-21 bp에 해당함을 검증하였다. 참조유전체에 정렬되는 유전자의 종류의 경우, 약 90%가 mRNA 및 기타 non-coding RNA에 정렬됨을 확인하였다. PAM 인접 여부의 경우 약 98%의 sgRNA가 PAM과 인접한 부위를 표적으로 함을 검증하였다. 마지막으로, 약 99%의 sgRNA가 표적 유전자의 비주형가닥을 타겟팅하는 것을 확인하였다.

위 분석을 종합하여, 본 발명으로 생성한 sgRNA 라이브러리가 최적 스페이서 길이, 참조유전체 정렬 여부, PAM 인접 여부, 비주형 가닥 인접 여부와 같이 sgRNA에 요구되는 조건을 충족하여 표현형 스크리닝을 비롯한 다양한 연구에 활용될 수 있음을 보였다.

실시예 4. CRISPRi 이용 표현형 기반 선별: 성장 핵심 유전자 선별

본 발명으로 생성한 sgRNA의 활용 예로써, E. coli K-12 MG1655를 대상으로, 발현이 억제될 시 큰 폭의 성장 저해를 불러일으키는 성장 핵심 유전자 선별을 위한 표현형 기반 선별을 진행하였다.

4-1. 차세대서열분석 기반 라이브러리 특성 분석

표현형 기반 선별에 활용할 sgRNA 플라스미드 라이브러리를 대량으로 확보하기 위해, 실시예 2-8에서 진행한 Gibson assembly 반응을 1㎖ 규모로 수행 후 정제하였다.

성장 핵심 유전자 선별에 앞서, 라이브러리 내 독립적 서열의 수, 라이브러리의 유전체 타겟팅 정도와 같은 특성을 파악하기 위해 Illumina 사의 Miseq을 활용해 차세대서열분석을 진행하였다.

도 9에 나타낸 바와 같이, 라이브러리 내 서로 다른 독립적인 서열의 개수는 88,722개에 달하는 것으로 드러났다. 전체 리드(read) 중 참조유전체에 정렬된 서열의 리드는 65.5%였고, 정렬된 서열 중 mRNA 및 기타 non-coding RNA 유전자에 정렬된 서열의 비율은 84.2%였다. 유전체 내 유전자 중 적어도 1개 이상의 리드에 의해 정렬된 유전자의 비율은 72.0%였다. 이를 통해, 본 발명에 의해 생성된 sgRNA 라이브러리가 약 89,000개에 달하는 규모를 가지고 있으며, 유전체 내 유전자의 대부분을 표적으로 할 수 있음을 확인하였다.

4-2. 성장 핵심 유전자 선별

실시예 4-1에서 특성을 확인한 sgRNA 라이브러리를 바탕으로 표현형 기반 선별 실험을 진행하였다. 라이브러리 내 서로 다른 서열의 개수가 약 89,000개이므로, 이 서열이 모두 선별 실험에 참여할 수 있도록 하기 위해 1X 이상의 규모(89,000개 이상의 transformants)로 형질전환을 하고자하였다.

dCas9를 발현하는 플라스미드 pCD185를 가진 MG1655와 dCas9이 제거된 플라스미드 pCD185 NC를 가진 MG1655에 대하여 라이브러리 규모 대비 각각 1.17X, 2.35X로 전기천공 기반 형질전환을 수행하였다. 형질전환된 세포들에 S.O.C.를 넣어 (1:4, V/V) 1시간 동안 37℃에서 회복시킨 다음 신선한 LB로 씻어준 뒤 (1:1, V/V), 최종 부피 100㎖가 되도록 LB에 접종 후 살아있는 세포의 OD₆₀₀가 약 1.0에 도달할 때까지 배양하였다.

이때 LB에는 pCD185, pCD185 플라스미드의 항생제마커인 클로람페니콜과 pgRNA-bacteria 플라스미드의 항생제 마커인 카베니실린이 각각 34㎍/㎖, 100㎍/㎖ 농도로 포함되었다. 그 후 각각의 배양액을 5㎖씩 취해 플라스미드를 추출한 다음 도 10의 모식도와 같이 차세대서열분석을 진행하였다.

도 11의 A에 나타낸 바와 같이, 유전자 별 리드 수를 전체 리드 수로 나누어 정규화한 다음, dCas9을 발현하는 세포와 발현하지 않는 세포에서의 각 유전자에 할당된 리드의 비율을 서로 비교하였다.

도 11의 B 및 도 12에 나타낸 바와 같이, dCas9를 발현하지 않는 세포에서의 리드 비율과 대비하여 dCas9를 발현하는 세포에서의 존재 비율이 4배 이상 감소한 유전자 (-Log₂(fold change) 값이 2 이상인 유전자)에 대하여 조사한 결과 총 66개 유전자를 확보하였으며, 이 중 36개(55%) 유전자가 기존에 보고된 E. coli 필수유전자 목록 중 하나인 Keio collection과 일치하는 것이 확인되었다. 이를 통해, 본 발명에 의해 생성된 sgRNA 라이브러리를 활용하여 억제 시 성장이 저해되는 핵심 유전자 선별과 같은 표현형 기반 선별을 진행할 수 있음을 확인하였다.

Claims

다음을 포함하며, 표적 생물의 단편화된 mRNA를 주형으로 하는 역전사 프라이머로 작용하며 cDNA의 5' 말단에 제1 어댑터를 결합시키기 위한 제1 어댑터 결합용 프라이머; 및 역전사 산물의 주형가닥 연장용 프라이머로 작용하며 cDNA의 3' 말단에 제2 어댑터를 결합시키기 위한 제2 어댑터 결합용 프라이머;를 포함하는 sgRNA 라이브러리 생성용 프라이머 세트:
(1) 상기 제1 어댑터 결합용 프라이머는 하기 일반식 Ⅰ-1의 구조를 갖고;
5'-X-Y-Z-3' (Ⅰ-1)
상기 X는 9 내지 14개의 염기로 이루어져 제1 PCR 증폭시 프라이머로 기능하기 위한 부위이며; Y는 6개의 염기로 이루어진 타입 Ⅲ 제한효소 인식부위이고; Z는 7개의 염기로 이루어진 표적 생물의 단편화된 mRNA와 상보적인 혼성화 서열을 갖는 무작위 헵타머(random heptamer) 부위이며;
(2) 상기 제2 어댑터 결합용 프라이머는 DNA-RNA 키메라 프라이머로서, 하기 일반식 Ⅰ-2의 구조를 갖고;
5'-X'-Y'-Z'-3' (Ⅰ-2)
상기 X'는 16 내지 20개의 염기로 이루어져 제1 PCR 증폭시 프라이머가 결합하는 부위이며; Y'는 8개의 염기로 이루어진 부분적 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식부위이고; Z'는 역전사 산물의 3' 말단의 오버행과 상보적으로 혼성화되는 3개의 구아닌(G) 염기로 이루어진 RNA 서열로서, SMART(switching mechanism at 5' end of RNA template)를 통해 가닥(template)을 연장하는 부위이며;
상기 제2 어댑터 결합용 프라이머는, 상기 제1 어댑터 결합용 프라이머를 이용하여 역전사를 수행한 뒤 수득한 역전사 산물을 주형으로 하고;
상기 제1 어댑터는 타입 Ⅲ 제한효소 인식부위로 작용하는 어댑터이며;
상기 제2 어댑터는 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식부위로 작용하는 어댑터인, sgRNA 라이브러리 생성용 프라이머 세트.
다음을 포함하며, 상기 제1항의 프라이머 세트를 이용하여 생성한 제한효소 절단 산물과 혼성화된 후 라이게이션(ligation)되는 제3 어댑터 생성용 정방향 프라이머(A3F); 및 역방향 프라이머(A3R);를 포함하는 sgRNA 라이브러리 생성용 프라이머 세트:
(1) 상기 제3 어댑터 생성용 정방향 프라이머(A3F)는 하기 일반식 Ⅱ-1의 구조를 갖고;
5'-바이오틴(biotin)-X''-Y''-Z''-I-3' (Ⅱ-1)
상기 X''는 제2 PCR 증폭시 프라이머가 결합하는 부위이며; Y''는 6개의 염기로 이루어진 타입 ⅡS 제한효소 인식부위이고; Z''는 6개의 염기로 이루어진 타입 Ⅲ 제한효소 인식부위이며; I는 1 내지 4개의 염기로 이루어진 상기 제한효소 절단 산물과 상보적인 혼성화 서열을 갖는 부위이고;
(2) 상기 제3 어댑터 생성용 역방향 프라이머(A3R)는 하기 일반식 Ⅱ-2의 구조를 갖고;
5'-Z'''-Y'''-X'''-3' (Ⅱ-2)
상기 Z'''는 상기 제한효소 절단 산물과 결합하여 타입 Ⅲ 제한효소 인식부위가 생성되는 부위이며; Y'''는 6개의 염기로 이루어진 타입 ⅡS 제한효소 인식부위이고; X'''는 제2 PCR 증폭시 프라이머가 결합하는 부위이며;
상기 제3 어댑터는 하기 일반식 Ⅱ-3의 구조를 갖는 바이오틴이 부착된 이중가닥 DNA이고;
5'-바이오틴(biotin)-X*-Y*-Z*-3' (Ⅱ-3)
상기 X*는 제3 어댑터와 상기 제1항의 프라이머 세트를 이용하여 생성한 제한효소 절단 산물 사이의 절단을 위한 타입 ⅡS 제한효소 인식부위이며; 상기 Y*는 타입 Ⅲ 제한효소 인식부위이고; Z*는 상기 제1항의 프라이머 세트를 이용하여 생성한 제한효소 절단 산물과 라이게이션(ligation)하기 위한 부위이며;
상기 제3 어댑터는 PAM 인접서열의 분리를 위한 표지부위로 작용하는 어댑터인, sgRNA 라이브러리 생성용 프라이머 세트.
다음을 포함하며, 상기 제2항의 프라이머 세트를 이용하여 생성된 제3 어댑터가 결합된 이중가닥 DNA 산물이 순차적으로 절단되어 생성된 DNA의 양 말단에 라이게이션(ligation)되는 제4 어댑터 생성용 정방향 프라이머(A4F); 역방향 프라이머(A4R); 및 제5 어댑터 생성용 정방향 프라이머(A5F); 및 역방향 프라이머(A5R);를 포함하는 sgRNA 라이브러리 생성용 프라이머 세트:
(1) 상기 제4 어댑터 생성용 정방향 프라이머(A4F)는 sgRNA 스페이서 전사를 위한 프로모터 서열을 포함하며, sgRNA 발현용 벡터와 깁슨 조립(Gibson assembly)을 진행하기 위한 15 내지 40개의 염기로 이루어진 부위이고;
(2) 상기 제4 어댑터 생성용 역방향 프라이머(A4R)는 하기 Ⅲ-1의 구조를 갖고;
5'-A-B-3' (Ⅲ-1)
상기 A는 20개의 염기로 이루어진 DNA 단일가닥의 5' 말단의 오버행과 2개 염기로 이루어진 상보적인 혼성화 서열을 갖는 부위이며; B는 상기 제4 어댑터 생성용 정방향 프라이머(A4F)와 상보적인 혼성화 서열을 갖는 부위이고;
(3) 상기 제5 어댑터 생성용 정방향 프라이머(A5F)는 sgRNA 스캐폴드(scaffold) 서열을 포함하며, sgRNA 발현용 벡터와 깁슨 조립(Gibson assembly)을 진행하기 위한 15 내지 40개의 염기로 이루어진 부위이고;
(4) 상기 제5 어댑터 생성용 역방향 프라이머(A5R)는 하기 Ⅲ-2의 구조를 갖고;
5'-A'-B'-3' (Ⅲ-2)
상기 A'는 상기 제5 어댑터 생성용 정방향 프라이머(A5F)와 상보적인 혼성화 서열을 갖는 부위이며; B'는 20개의 염기로 이루어진 DNA 단일가닥의 3' 말단의 오버행과 2개 염기로 이루어진 상보적인 혼성화 서열을 갖는 부위이고;
상기 제4 어댑터는 sgRNA 발현을 위한 프로모터 부위로 작용하는 어댑터이고;
상기 제5 어댑터는 sgRNA 스캐폴드(scaffold) 서열을 갖는 어댑터인, sgRNA 라이브러리 생성용 프라이머 세트.
제2항 또는 제3항에 있어서,
상기 라이게이션(ligation)은 SplintR 리가아제, 박테리오파지 T4 리가아제, E.coli 리가아제, Afu 리가아제, Taq 리가아제, Tfl 리가아제, Mth 리가아제, Tth 리가아제, Tth HB8 리가아제, Thermus species AK16D 리가아제, Ape 리가아제, LigTk 리가아제, Aae 리가아제, Rm 리가아제, Pfu 리가아제, 리보자임(ribozyme) 및 이의 변이체로 이루어진 군으로부터 선택된 1 종의 라이게이션 작용제에 의해 실시되는 것을 특징으로 하는, sgRNA 라이브러리 생성용 프라이머 세트.
제1항에 있어서,
상기 제1 어댑터 결합용 프라이머는 서열번호 1로 이루어진 것인, sgRNA 라이브러리 생성용 프라이머 세트.
제1항에 있어서,
상기 제2 어댑터 결합용 프라이머는 서열번호 2, 3 및 4로 이루어진 것인, sgRNA 라이브러리 생성용 프라이머 세트.
제2항에 있어서,
상기 제3 어댑터 생성용 정방향 프라이머(A3F)는 서열번호 5, 6 및 7 중 선택되는 어느 하나로 이루어진 것이며, 제3 어댑터 생성용 역방향 프라이머(A3R)는 서열번호 8, 9 및 10 중 선택되는 어느 하나로 이루어진 것인, sgRNA 라이브러리 생성용 프라이머 세트.
제3항에 있어서,
상기 제4 어댑터 생성용 정방향 프라이머(A4F)는 서열번호 11로 이루어진 것이며, 제4 어댑터 생성용 역방향 프라이머(A4R)는 서열번호 12로 이루어진 것인, sgRNA 라이브러리 생성용 프라이머 세트.
제3항에 있어서,
상기 제5 어댑터 생성용 정방향 프라이머(A5F)는 서열번호 13으로 이루어진 것이며, 제5 어댑터 생성용 역방향 프라이머(A5R)는 서열번호 14로 이루어진 것인, sgRNA 라이브러리 생성용 프라이머 세트.
(a) 표적 생물의 mRNA를 단편화하는 단계;
(b) 단편화된 mRNA를 주형으로 하여, 5' 말단에 역전사 PCR 프라이머 결합 부위로 작용하는 제1항의 제1 어댑터 및 3' 말단에 SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소 인식부위로 작용하는 제1항의 제2 어댑터가 결합된 cDNA를 합성하는 단계;
(c) SfiⅠ, BamHⅠ 및 KpnⅠ 중 선택되는 어느 하나의 제한효소를 처리하여 제한효소 처리 산물을 수득하는 단계;
(d) 상기 단계 (c)의 제한효소 처리 산물의 3' 말단의 오버행과 상보적인 혼성화를 이루며 PAM 인접서열의 분리를 위한 표지부위로 작용하는 제2항의 제3 어댑터를 라이게이션(ligation)시키는 단계;
(e) 제3 어댑터가 결합된 cDNA만을 선별하는 단계;
(f) 타입 Ⅲ 제한효소를 처리하는 단계; 및
(g) 타입 Ⅱ S 제한효소를 처리하여 sgRNA 스페이서 DNA를 제조하는 단계;를 포함하는 sgRNA 라이브러리 생성방법.
제10항에 있어서,
상기 sgRNA 스페이서 DNA는 20개 또는 22개의 염기로 이루어진 DNA 단일가닥 및 16개 또는 18개의 염기로 이루어진 DNA 단일가닥이 서로 상보적으로 결합된 것인, sgRNA 라이브러리 생성방법.
제10항에 있어서,
상기 단계 (a)의 mRNA의 단편화는,
i) 표적 생물의 총 RNA(tatal RNA)를 추출하는 단계;
ii) rRNA에 상보적인 서열을 가지는 DNA 프로브의 처리에 의해 rRNA-DNA 이중가닥을 생성하는 단계; 및
iii) 상기 단계 ii)의 rRNA-DNA 이중가닥의 rRNA만을 선택적으로 분해하는 RNA 분해효소(RNase)를 처리하여 rRNA를 제거하는 단계;를 포함하는 것인, sgRNA 라이브러리 생성방법.
제12항에 있어서, 상기 RNA 분해효소(RNase)는 열안정성 RNaseH인, sgRNA 라이브러리 생성방법.
제10항에 있어서,
상기 mRNA의 단편화는 기계적 단편화(physical fragmentation), 효소 기반 단편화 및 화학적 단편화로 이루어진 군으로부터 선택된 어느 하나에 의해 수행되는 것인, sgRNA 라이브러리 생성방법.
제10항에 있어서,
상기 제3 어댑터가 결합된 cDNA의 선별은 바이오틴-스트렙타비딘 결합을 이용하여 수행되는 것인, sgRNA 라이브러리 생성방법.
제10항에 있어서,
(h) sgRNA 스페이서 DNA의 양말단에 PCR 프로모터로 작용하는 제3항의 제4 어댑터 및 sgRNA 스캐폴드로 작용하는 제3항의 제5 어댑터를 결합하는 단계; 및
(i) sgRNA 스페이서 서열을 제외한 DNA를 벡터(vector)로 구성하고 sgRNA 스페이서 서열을 포함하는 DNA를 인서트(insert)로 구성한 플라스미드 상태의 sgRNA 라이브러리를 제조하는 단계;를 더 포함하는 것인, sgRNA 라이브러리 생성방법.
제16항에 있어서,
상기 sgRNA는 비주형가닥(non-template strand)에 결합하는 것인, sgRNA 라이브러리 생성방법.
제16항의 방법으로 제작된 sgRNA 라이브러리를 포함하는 표현형 기반 선별용 키트.
제16항의 방법으로 제작된 sgRNA 라이브러리를 이용하는 표현형 기반 선별방법.