KR20210104779A

KR20210104779A - 세포 및 생체분자 상의 직접 올리고뉴클레오타이드 합성

Info

Publication number: KR20210104779A
Application number: KR1020217021817A
Authority: KR
Inventors: 자비에 고드론; 아드리안 호간; 실뱅 가리엘; 제프리 제델로; 로버트 니콜; 토마스 이버트
Original assignee: 디엔에이 스크립트
Priority date: 2018-12-13
Filing date: 2019-12-10
Publication date: 2021-08-25
Also published as: SG11202105441WA; EP3894593A2; US20220186213A1; US20210009994A1; AU2019398307A1; WO2020120442A2; CN113423841A; CA3122494A1; US11268091B2; IL283835A; JP2022511931A; WO2020120442A3; US20210198661A1

Abstract

본 발명은 생존 또는 고정된 생체분자 또는 세포 상에 직접 올리고뉴클레오타이드를 합성하는 방법에 관한 것이다. 일부 실시형태에서, 무주형 효소 합성은 (i) 3'-O-차단된 뉴클레오사이드 트리포스페이트의 효소적 첨가 및 (ii) 유리 3' 히드록실을 재생성하기 위해 혼입된 뉴클레오타이드의 효소적 탈차단의 연속 사이클로 생물학적 조건 하에서 수행된다. 본 발명은 단일 세포 cDNA 라이브러리 작제 및 분석에 적용된다.

Description

세포 및 생체분자 상의 직접 올리고뉴클레오타이드 합성

예를 들어, 문헌[Brenner et al, Proc. Natl. Acad. Sci., 97: 1665-1670 (2000); Brenner et al, 미국 특허 제 7537897; Brenner et al, 미국 특허 제 8476018호; McCloskey et al, 미국 특허 공보 제 2007/0020640호; Kinde et al, Proc. Natl. Acad. Sci., 108: 9530-9535 (2011); Fu et al, Proc. Natl. Acad. Sci., 108: 9026-9031 (2011); Nolan, 미국 특허 공보 제 2016/0251697호; Zheng et al, Nature Comm., 8:14049 (2017)]과 같이 생체분자 또는 세포의 대량 분석이 핵산 태그 또는 바코드(barcode)를 사용하여 촉진될 수 있는 많은 경우가 생물학 및 의학 분야에 있다.

통상적으로 이러한 올리고뉴클레오타이드 표지(label)는 (1) 예를 들어, 문헌[Brenner et al, 미국 특허 제 7,537,897호; 또는 Fu et al, Proc. Natl. Acad. Sci. (상기 인용)]과 같이, 다량의 올리고뉴클레오타이드 표지 세트가 사전 합성되고, 훨씬 더 작은 집단(population)의 표적 유기체 또는 생체분자와 접합체를 형성하기 위해 사용되어 고유한 표지를 갖는 유기체 또는 생체분자의 접합체 집단을 제공하는 "샘플링에 의한 표지" ("확률적 표지"라고도 함); 또는 (2) 예를 들어 문헌[Nolan (상기 인용); 또는 Seelig et al, 미국 특허 공보 제 2016/0138086호]과 같이, 모두 실질적으로 고유한 표지를 갖는 유기체 또는 생체분자 집단을 제공하기 위한 사전 합성된 다수의 올리고뉴클레오타이드 하위단위의 "분할 및 혼합(split and mix)" 혼성화에 의해 부착된다. 올리고뉴클레오타이드 합성이 생물학적 유기체 및 생체분자에 적합하지 않은 엄격한 비 수성 조건이 필요한 포스포라미다이트 화학과 같은 화학적 방법이 지배적이기 때문에 사전 합성된 태그 또는 태그 하위단위가 이러한 과정에 사용되었다.

추적 및 분류를 위해 고유하고 지속 가능한 바코드 또는 태그와 같은 올리고뉴클레오타이드 표지를 갖는 이러한 유기체 또는 생체분자를 제공하는 생물학적 유기체 또는 생체분자에 대한 직접 올리고뉴클레오타이드 합성 능력이 이용 가능하다면, 매우 바람직할 것이다. 이러한 표지는 특히 차세대 시퀀싱(sequencing) 기술과 연계될 때 다수의 생물학적 과정에 대한 대량 세포 기반 분석을 위한 유용한 도구가 될 것이다.

본 발명은 단일 세포 전사체 분석과 같은 단일 세포 분석을 위한 이러한 방법의 적용을 포함하여 생체분자 및 생물학적 세포 상에 직접 올리고뉴클레오타이드를 합성하는 방법에 관한 것이다.

일부 실시형태에서 본 발명은 생물학적 세포 또는 생체분자 상에 올리고뉴클레오타이드를 합성하는 방법으로서 (a) 유리(free) 3'-히드록실을 개시인자(initiator)로 갖는 생물학적 세포 또는 생체분자를 제공하는 단계; (b) (i) 연장 조건 하에서 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편(elongated fragment)을 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소(template-independent DNA polymerase)와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 개시인자 또는 연장된 단편을 연장시켜 3'-O-차단된 연장된 단편을 형성하는 단계, 및 (ii) 연장된 단편을 탈차단(deblocking)하여 유리 3'-히드록실을 갖는 연장된 단편을 형성하는 단계의 다수의 사이클을 반복함으로써 생물학적 세포 또는 생체분자 상에 소정의 서열의 올리고뉴클레오타이드를 합성하는 단계를 포함하는 방법에 관한 것이다. 일부 실시형태에서, 이러한 단계는 생물학적 세포, 특히 포유류 세포를 생존가능한 상태로 유지하는 조건 하에서 수행된다. 일부 실시형태에서, 탈차단 단계는 생물학적 세포, 특히 포유류 세포를 생존가능한 상태로 유지하는 조건 하에서 효소적으로 수행된다.

일부 실시형태에서, 본 발명은 세포 특이적 올리고뉴클레오타이드 바코드를 갖는 세포 특이적 cDNA 라이브러리를 생성하는 방법으로서, (a) 세포 집단에서 각 세포의 세포 표면 막 상에 고유한 올리고뉴클레오타이드 바코드를 합성하여 바코드화된 세포 집단을 형성하는 단계; (b) 반응기에서 각각의 바코드화된 세포를 단리하는 단계; (c) 각각의 반응기에서 바코드화된 세포를 용해하는 단계; (d) 각각의 반응기에서 역전사 효소 중합효소 연쇄 반응 (RT-PCR)을 수행하여 세포 특이적 올리고뉴클레오타이드 바코드가 있는 cDNA 라이브러리를 생성하는 단계를 포함하는 방법에 관한 것이다. 일부 실시형태에서, 합성 단계는 본 발명의 무주형(template-free) 효소 합성 방법에 의해 수행된다. 일부 실시형태에서, RT-PCR 반응은 중합효소 순환 증폭 반응에 의해 바코드를 cDNA에 부착하는 단계를 포함한다.

일부 실시형태에서, 본 발명은 세포 특이적 올리고뉴클레오타이드 바코드를 각각 갖는 세포 특이적 cDNA 라이브러리를 생성하는 방법으로서, (a) mRNA를 혼성화하여 단일 세포의 mRNA를 포획함으로써 비드(bead)에 부착된 올리고뉴클레오타이드를 포획하는 단계로서, 포획 올리고뉴클레오타이드는 mRNA의 절편에 상보적이고, 5 말단에 의해 포획 올리고뉴클레오타이드는 비드에 부착되고 유리 3'-히드록실을 갖는 단계; (b) 포획된 mRNA를 주형으로 사용하여 역전사 효소로 포획 올리고뉴클레오타이드의 3' 말단을 확장하여 세포 특이적 cDNA 라이브러리를 형성하는 단계; (c) 무주형 효소 합성에 의해 비드의 각각의 cDNA 상에 고유한 세포 특이적 올리고뉴클레오타이드 바코드를 합성하는 단계를 포함하는 방법에 관한 것이다. 일부 실시형태에서, 고유한 세포- 또는 비드 특이적 바코드는 무작위 서열 올리고뉴클레오타이드이고, 이러한 바코드를 합성하는 단계는 무주형 효소 합성에 의한 "분할 및 혼합" 절차에 의해 수행된다.

일부 실시형태에서, 본 발명은 소정의 뉴클레오타이드 서열로 하나 이상의 천연 폴리뉴클레오타이드를 확장하는 방법으로서, TdT 반응 조건 하에서 반응 혼합물에 하나 이상의 천연 폴리뉴클레오타이드를 제공하는 단계로서, 천연 폴리뉴클레오타이드는 유리 3'-히드록실을 갖는 단계; 및 (i) 유리 3'-O-히드록실을 갖는 천연 폴리뉴클레오타이드 또는 연장된 천연 폴리뉴클레오타이드를 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 TdT 변이체와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 천연 폴리뉴클레오타이드 또는 연장된 천연 폴리뉴클레오타이드를 연장시켜 3'-O-차단된 연장된 천연 폴리뉴클레오타이드를 형성하는 단계, 및 (ii) 연장된 천연 폴리뉴클레오타이드를 탈차단하여 유리 3'-히드록실을 갖는 연장된 천연 폴리뉴클레오타이드를 형성하는 단계의 사이클을 반복함으로써 하나 이상의 천연 폴리뉴클레오타이드를 소정의 서열의 뉴클레오타이드로 확장하여 천연 폴리뉴클레오타이드 상에 소정의 서열의 올리고뉴클레오타이드를 합성하는 단계를 포함하는 방법에 관한 것이다.

본 발명의 이러한 상기 특성화된 양상들 및 다른 양상들은 다수의 예시된 실시형태들 및 적용들에서 예시되며, 이들 중 일부는 도면에 도시되고 다음의 청구범위 부분에서 특성화된다. 그러나, 상기 요약은 각각의 예시된 실시형태 또는 본 발명의 모든 실시형태를 설명하기 위한 것이 아니다.

도 1a는 TdT를 사용하는 무주형 효소 핵산 합성 방법의 단계를 도식적으로 예시한다.
도 1b 및 도 1c는 cDNA 분자의 3' 말단에 올리고뉴클레오타이드를 직접 합성하기 위한 본 발명의 일 실시형태를 예시한다.
도 1d 내지 도 1f는 도 1b 및 도 1c에 예시된 방법을 적용함으로써, 고체 지지체(solid support), 예를 들어 비드 또는 평면 어레이(planar array)에 태깅(tagged)된 cDNA 라이브러리의 생성을 예시한다.
도 1g는 올리고뉴클레오타이드 표지된 항체를 사용하여 단백질의 공간 분포를 확인하기 위한 실시형태를 예시한다.
도 1h는 고정된 올리고뉴클레오타이드 및 DNA 표지가 있는 항체를 사용하여 유전자 발현 및 단백질 분포 모두를 확인하기 위한 실시형태를 예시한다.
도 1i는 다중 태깅 단계를 통해 특정 대상 표면 영역에 공간적 시퀀싱 분석을 집중하기 위한 실시형태를 예시한다.
도 2a 내지 도 2d는 생존 세포 또는 고정 및 투과성화된 세포(fixed and permeabilized cell)에서 올리고뉴클레오타이드 태그를 직접 합성하기 위한 본 발명의 실시형태를 예시한다.
도 3a는 친유성 고정인자(lipophilic anchor)에 의한 세포 표면 막상의 개시인자 올리고뉴클레오타이드의 부착을 예시한다.
도 3b는 세포의 세포 표면 막에 고정된 개시인자상의 고유한 분자 바코드의 "분할 및 혼합" 합성을 예시한다.
도 3c는 각 라이브러리가 세포 특이적 바코드를 포함하는 단일 세포 특이적 cDNA 라이브러리를 생성하기 위한 바코드화된 세포의 미세유체 처리를 예시한다.
도 4a는 단일 세포로부터 특정 유전자를 증폭하기 위한 절차를 예시한다.
도 4b는 단일 세포로부터 전체 cDNA 라이브러리를 증폭하기 위한 절차 (주형 전환)를 예시한다.
도 4c는 중합효소 순환 증폭 (PCA)에 의해 cDNA 서열에 세포 특이적 바코드를 부착하기 위한 절차를 예시한다.
도 5는 바코드화된 단일 세포 cDNA 라이브러리를 생성하기 위한 대안적인 방법을 예시한다.
도 6은 효소적/화학적으로 합성된 키메라 프로브를 예시한다.

본 발명의 일반적인 원리는 특히 도면에 도시되고 상세하게 설명된 것과 같은 예를 통해 본 명세서에서 보다 상세하게 개시된다. 그러나, 본 발명을 설명된 특정 실시형태로 제한하려는 의도가 아님을 이해해야 한다. 본 발명은 다양한 변형 및 대안적인 형태에 적용될 수 있으며, 그 세부 사항은 다수의 실시형태에 대해 제시된다. 본 발명의 원리 및 범위 내에 속하는 모든 변형, 균등물 및 대안을 포함하는 것으로 의도된다.

본 발명의 수행은 달리 지시되지 않는 한, 당 업계의 기술 내에 있는 유기 화학, 분자 생물학 (재조합 기술 포함), 세포 생물학 및 생화학의 통상적인 기술 및 설명을 사용할 수 있다. 이러한 통상적인 기술은 다음에 제한되는 것은 아니나, 합성 펩타이드, 합성 폴리뉴클레오타이드, 단일 클론 항체의 제조 및 사용, 핵산 클로닝(nucleic acid cloning), 증폭(amplification), 시퀀싱 및 분석(sequencing and analysis) 및 관련 기술을 포함할 수 있다. 이러한 통상의 기술에 대한 프로토콜은 문헌[Genome Analysis: A Laboratory Manual Series (Vols. I-IV); PCR Primer: A Laboratory Manual; and Molecular Cloning: A Laboratory Manual (all from Cold Spring Harbor Laboratory Press); Lutz and Bornscheuer, Editors, Protein Engineering Handbook (Wiley-VCH, 2009); Hermanson, Bioconjugate Techniques, Second Edition (Academic Press, 2008)] 및 유사 참조문헌과 같이 제조업체의 제품 문헌 및 표준 실험실 매뉴얼에서 찾을 수 있다.

본 발명은 무주형 효소 올리고뉴클레오타이드 합성 기술을 사용하여 세포 또는 생체분자상에 올리고뉴클레오타이드를 직접 합성하는 방법에 관한 것이다. 이러한 기술은 자연 환경으로부터 추출된 생체분자 (예를 들어, DNA 또는 RNA), 개시인자의 부착에 의해 변형된 생체분자 (예를 들어, 단백질) 또는 합성에 의해 생성된 생체분자 (예를 들어, 핵산, 다당류, 폴리펩타이드 등)에 직접 적용될 수 있다. 이러한 기술은 효소 반응의 온화한 조건이 필요하거나 유용한 임의의 상황에 적용될 수 있다. 특히, 무주형 효소 합성 기술은 전구체 폴리뉴클레오타이드가 화학적으로 합성되는 혼성체 화학적 효소적 폴리뉴클레오타이드 합성에 사용될 수 있으며, 이어서 전구체는 화학적 합성의 엄격한 조건 하에서 변형될 수 있거나 생존 불가능한 표지된 뉴클레오타이드와 같이 효소적 성분의 첨가에 의해 추가로 변형될 수 있다. 이러한 혼성체 합성 방법은 화학적 첨가에서 뉴클레오타이드 또는 이의 유사체의 효소적 첨가의 다수의 변형을 포함할 수 있다. 이러한 혼성체 합성 기술은 예를 들어 문헌[Narang, Editor, Synthesis and applications of DNA and RNA (Academic Press, Inc., 1987)]과 같이, 다음에 제한되는 것은 아니나, 포스포아미다이트, 포스포디에스테르, 포스포트리에스테르, 포스파이트 트리에스테르, H-포스포네이트 화학을 포함하여, 다양한 상이한 화학적 합성 접근법에 의해 효소 합성 쌍 형성을 수행할 수 있다.

일부 실시형태에서, 무주형 효소 합성 기술은 cDNA의 폴리뉴클레오타이드의 경우 생체분자의 일부일 수 있는 유리 3'-히드록실을 갖는 개시인자 올리고뉴클레오타이드의 존재가 필요하거나, 예를 들어 세포막 단백질, 항체 등의 경우 쉽게 이용 가능한 클릭 화학 반응(click chemistry reaction)을 사용하여 다양한 화학 기술에 의해 쉽게 첨가될 수 있다. 개시인자의 이용 가능성에 따라, 효소 올리고뉴클레오타이드 합성은 (i) 3'-O-차단된 뉴클레오사이드 트리포스페이트의 존재 하에 말단 데옥시뉴클레오타이드 전이효소 (TdT)와 같은 무주형 중합효소를 사용하여 단일 뉴클레오타이드에 의해 유리 3'-히드록실을 갖는 개시인자 (또는 이전에 확장된 가닥)를 확장하는 단계, 및 (ii) 최근에 혼입된 3'-O-차단된 뉴클레오타이드를 탈차단하여 새로운 확장 가능한 3'-히드록실을 재생성하는 단계의 사이클을 반복함으로써, 수행될 수 있다. 적절한 서열을 갖는 올리고뉴클레오타이드가 합성될 때까지 사이클을 지속한다. 일부 실시형태에서, 고유한 올리고뉴클레오타이드 바코드는 "분할 및 혼합" 합성 전략에 의해 집단의 생물학적 세포, 예컨대 포유류 세포상에 직접 합성될 수 있다. 일부 실시형태에서, 확장되지 않은 유리 히드록실이 캡핑 (capping)된 가닥의 임의의 추가 확장을 방지하는 화합물과 반응하는 캡핑 단계가 포함될 수 있다. 일부 실시형태에서, 이러한 화합물은 디데옥시뉴클레오사이드 트리포스페이트일 수 있다. 다른 실시형태에서, 유리 3'-히드록실을 갖는 확장되지 않은 가닥은 3'-엑소뉴클레아제 활성, 예를 들어 Exo I로 처리함으로써 분해될 수 있으며, 이는 문헌[Jensen et al, Biochemistry, 57: 1821-1832 (2018)]에 기재된 바와 같다.

일부 실시형태에서, 본 발명은 생물학적 세포 또는 생체분자 상에 올리고뉴클레오타이드를 합성하는 방법으로서 (a) 유리 3'-히드록실을 개시인자를 갖는 생물학적 세포 또는 생체분자를 제공하는 단계; (b) (i) 연장 조건 하에서 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편을 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 개시인자 또는 연장된 단편을 연장시켜 3'-O-차단된 연장된 단편을 형성하는 단계, 및 (ii) 연장된 단편을 탈차단하여 유리 3'-히드록실을 갖는 연장된 단편을 형성하는 단계의 다수의 사이클을 반복함으로써 생물학적 세포 또는 생체분자 상에 소정의 서열의 올리고뉴클레오타이드를 합성하는 단계를 포함하는 방법에 관한 것이다. 일부 실시형태에서, 생물학적 세포가 제공되고 탈차단은 효소적으로 수행된다. 일부 실시형태에서, 3'-O-차단된 뉴클레오사이드 트리포스페이트는 3'-포스페이트-뉴클레오사이드 트리포스페이트이고, 탈차단 단계는 상기 3'-O-차단된 연장된 단편을 3'-포스파타제 활성으로 처리함으로써 수행된다. 일부 실시형태에서, 3'-포스파타제 활성은 T4 폴리뉴클레오타이드 키나제, 재조합 새우 알칼리 포스파타제(recombinant shrimp alkaline phosphatase) 또는 송아지(calf) 장 알칼리 포스파타제에 의해 제공된다. 일부 실시형태에서, 3'-O-차단된 뉴클레오사이드 트리포스페이트는 3'-에스테르-뉴클레오사이드 트리포스페이트이고, 탈차단 단계는 상기 3'-O-차단된 연장된 단편을 에스테라제 활성으로 처리함으로써 수행된다. 일부 실시형태에서, 에스테라제 활성은 프로테이나제 K 활성과 같은 리파제 활성이다. 일부 실시형태에서, 3'-O-차단된 뉴클레오사이드 트리포스페이트는 3'-아세틸-뉴클레오사이드 트리포스페이트이고, 탈차단 단계는 상기 3'-O-차단된 연장된 단편을 아세틸에스테라제 활성으로 처리함으로써 수행된다. 일부 실시형태에서, 주형-비의존적 DNA 중합효소는 서열번호 2의 위치 207 또는 서열번호 3 내지 15의 아미노산 서열의 기능적으로 균등한 위치의 제1 아르기닌 및 서열번호 2의 325 또는 서열번호 3 내지 15의 아미노산 서열의 기능적으로 균등한 위치의 제2 아르기닌이 치환된 서열번호 2 내지 15의 아미노산 서열 중 어느 하나와 적어도 60 퍼센트 동일한 아미노산 서열을 갖는 말단 데옥시뉴클레오타이드 전이효소 (TdT) 변이체이고, 변이체 TdT (i)는 주형 부재 하에 핵산 단편을 합성할 수 있고, (ii)는 핵산 단편의 유리 3'-히드록실에 3'-O-변형된 뉴클레오타이드를 혼입할 수 있다.

일부 실시형태에서, 올리고뉴클레오타이드를 생존가능한 세포(viable cell)상에 합성하는 본 발명의 방법은 (a) 세포의 세포 표면 분자에 부착되거나 세포의 세포 표면 막에 고정된 유리 3'-히드록실을 개시인자에 제공하는 단계; (b) 생물학적 조건 하에서 (i) 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편을 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 개시인자 또는 연장된 단편을 연장시켜 3'-O-차단된 연장된 단편을 형성하는 단계, 및 (ii) 연장된 단편을 효소적으로 탈차단하여 유리 3'-히드록실을 갖는 연장된 단편을 형성하는 단계의 다수의 사이클을 반복함으로써 소정의 서열의 올리고뉴클레오타이드를 합성하는 단계에 의해 수행될 수 있다.

상기 과정은 cDNA가 3' 말단에 합성된 올리고뉴클레오타이드를 갖는 실시형태를 보여주는 도 1b 및 도 1c에 예시되어 있다. 이러한 cDNA는 예를 들어 반응 챔버에서 단리된 단일 세포로부터 획득될 수 있다. 세포 특이적 (또는 챔버-특이적(chamber-specific)) 올리고뉴클레오타이드는 이러한 cDNA에서 합성될 수 있다. 그 후, 이러한 반응 챔버의 내용물을 조합할 수 있으며, 예를 들어 동일한 조건에 노출된 동일한 반응기로부터의 세포 집단의 단일 세포 전사체 분석 또는 세포 군의 전사체 분석을 제공하기 위해 올리고뉴클레오타이드-cDNA 접합체를 대량 서열 분석으로 분석할 수 있다. 3'-폴리T 부분(portion) (104)을 갖는 프라이머 (102)는 메신저 RNA (mRNA) (100)의 폴리A 영역에 어닐링(annealing)되고, 통상적인 프로토콜을 사용하여 역전사 효소로 확장 (108)되어 cDNA (113) (서열번호 16)를 형성한다. 프라이머 (102)는 또한 생성된 확장 산물 (즉, cDNA)을 고체 지지체에 부착하기 위한 수단을 제공하는 부분 (106)을 갖는다. 다음에 제한되는 것은 아니나, 고체 지지체에 부착된 상보적 가닥에 어닐링될 수 있는 5' 올리고뉴클레오타이드 꼬리, 공유결합을 형성하기 위해 고체 지지체에 부착된 상보적 구성원과 반응할 수 있는 클릭 화학 반응 쌍의 구성원, 비공유 결합을 형성하기 위해 고체상 지지체에 부착된 상보적 구성원과 복합체를 형성할 수 있는 비 핵산 결합 쌍의 구성원 (후자의 예는 비오틴과 스트렙타비딘임)을 포함하여 매우 다양한 이러한 부착 수단이 이용 가능하다. 도 1b로 돌아가면, 상기 부착 모드 중 2개는 3' 말단에 부착된 상보적 올리고뉴클레오타이드 (112)를 갖고, 확장된 프라이머 (102)의 부분 (106)과 혼성체를 형성함으로써 cDNA (113)를 포획하는 고체 지지체 (120a) 및 결합 쌍 (114a) (예를 들어, 스트렙타비딘)의 구성원이 부착되어 있고 그 상보적 구성원 (예를 들어, 비오틴)을 포획하는 대체 지지체 (120b)에 의해 예시된다. cDNA에 부착된 결합 쌍의 구성원은 올리고뉴클레오타이드 꼬리 (106)의 존재가 필요하지 않으나, 일부 실시형태에서, 이러한 올리고뉴클레오타이드 (106)는 고체 지지체, 예를 들어, 닉카제(nickase)와 같은 제한 엔도뉴클레아제의 인식 서열 또는 USER 처리에 의한 절단을 위한 우라실의 존재 하에 고체 지지체로부터의 최종 산물을 절단하기 위해 사용될 수 있는 뉴클레오타이드 또는 뉴클레오타이드 서열을 포함할 수 있다.

cDNA가 3'-히드록실이 없는 상태로 고체 지지체에 절단 가능하거나 방출 가능하게 부착된 후, 효소 합성을 진행하여 유리 3' 말단에 소정의 서열의 올리고뉴클레오타이드를 생성할 수 있으며, 이는 도 1c에 도식적으로 예시되어 있다. 가닥 (123) (서열번호 16)이 고체 지지체 (예를 들어, 결합 쌍을 통해 120b)에 부착된 후, 이는 TdT가 유입 3'-O-차단된 뉴클레오타이드의 트리포스페이트 및 cDNA의 3'-히드록실로부터의 포스페이트 연결의 형성을 촉매하여 적절한 올리고뉴클레오타이드의 제1 뉴클레오타이드를 혼입시킬 수 있는 조건 하에 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 TdT와 같은 무주형 중합효소를 포함하는 반응 혼합물에 노출된다. 확장 반응의 3'-O-차단된 뉴클레오사이드 트리포스페이트는 도면에서 "3'-O-차단된 dYTP"로 표시된다. 생성된 산물의 3'-O-차단된 히드록실은 적절한 탈차단제를 사용하여 탈차단 (122)되어 유리 3'-히드록실을 갖는 확장된 cDNA (125)를 형성한다. 이하에서 더 자세히 논의되는 바와 같이, 차단 기의 선택 및 그 제거 방법은 다른 실시형태의 경우 광범위하게 달라질 수 있다. 특정 실시형태에 대한 이러한 선택은 적절한 합성 속도, 적절한 합성 수율, 표적 생체분자 또는 표지되는 세포의 손상성, 특히 생물학적으로 적합한 효소적 탈차단이 더 적절한지 또는 엄격한 화학적 탈차단이 허용 가능한지 등과 같은 인자의 평가에 의해 당업자의 기술 범위 내에 있다. 올리고뉴클레오타이드의 합성이 완료될 때까지 적절한 올리고뉴클레오타이드의 연속 뉴클레오타이드를 사용하여 사이클을 반복한다 (126). 일부 실시형태에서, 3'-O-차단-dYTP의 하나 이상의 세척 단계 또는 제거 단계와 같은 추가 단계가 포함된다. 합성 완료 후, 추가 분석 또는 사용을 위해 올리고뉴클레오타이드 표지된 cDNA를 고체 지지체로부터 제거할 수 있다. 일부 실시형태에서, cDNA는 추가 분석 또는 사용을 위해 고체 지지체 상에 유지될 수 있다.

일부 실시형태에서, 올리고뉴클레오타이드는 생체분자에 개시인자 서열이 부착된 경우, 도 1c와 유사한 과정에 의해 항체와 같은 다른 생체분자 상에 합성될 수 있다.

도 1d 내지 도 1e는 고체상 cDNA 라이브러리를 작제하기 위해 시판되는 폴리T 비드, 예를 들어 Dynabeads^TM 올리고(dT) 자기 비드 (문헌[Bosnes et al, ThermoFisher Application Note (2017)]와 함께 상기 방법을 사용하는 방법을 예시한다. 폴리T 비드 (150)는 비드의 폴리T 절편을 RNA의 폴리A 절편에 혼성화할 수 있는 조건 하에서 폴리A RNA (152)를 포함하는 세포 추출물 또는 용해물과 조합되며, 그 후 혼성화된 폴리T 절편이 역전사 반응으로 확장된다. RNA 주형 (156)의 제거 후, 고체상 cDNA 라이브러리 (158)가 생성되고, 바코드, 프라이머 결합 부위 등 (162)을 합성하기 위해 도 1b 및 도 1c의 방법 (160)에 따라 처리될 수 있으며, 이는 cDNA의 추가 분석을 가능하게 한다. 이러한 바코드는 환자 샘플과 같은 특정 샘플을 고유하게 지정할 수 있거나 아래에서 추가로 설명하는 바와 같이 이러한 바코드는 단일 세포를 고유하게 지정할 수 있다.

일부 실시형태에서, 본 발명은 각각 올리고뉴클레오타이드 표지를 갖는 cDNA 라이브러리를 생성하는 방법으로서, (a) mRNA를 혼성화하여 mRNA를 포획함으로써 하나 이상의 고체 지지체에 부착된 올리고뉴클레오타이드를 포획하는 단계로서, 포획 올리고뉴클레오타이드는 mRNA의 절편에 상보적이고 포획 올리고뉴클레오타이드는 5 말단에 의해 하나 이상의 고체 지지체에 부착되고 3' 말단에 유리 3'-히드록실을 갖는 단계; (b) 포획된 mRNA를 주형으로 사용하여 역전사 효소로 포획 올리고뉴클레오타이드의 3' 말단을 확장하여 하나 이상의 고체 지지체 상에 cDNA 라이브러리를 형성하는 단계; 및 (c) 무주형 효소 합성에 의해 하나 이상의 고체 지지체의 각각의 cDNA 상에 올리고뉴클레오타이드 표지를 합성하는 단계를 포함하는 방법에 관한 것이다. 일부 실시형태에서, 합성 단계는 (i) 연장 조건 하에서 상기 cDNA를 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 유리 3'-히드록실을 갖는 상기 cDNA 또는 연장된 cDNA를 연장시켜 3'-O-차단된 연장된 cDNA를 형성하는 단계, 및 (ii) 연장된 cDNA를 탈차단하여 유리 3'-히드록실을 갖는 연장된 cDNA를 형성하는 단계의 사이클을 반복하는 단계를 포함한다. 일부 실시형태에서, 각각의 상기 사이클은 개별 반응 혼합물 중 유리 3'-히드록실을 갖는 상기 cDNA 또는 연장된 cDNA를 분할하는 단계를 추가로 포함하고, 개별 반응 혼합물의 상기 연장된 cDNA가 조합된 후 유리 3'-히드록실을 갖는 상기 cDNA 또는 연장된 cDNA는 다른 종류의 뉴클레오사이드 트리포스페이트에 의해 연장되어, 상기 연장된 cDNA를 형성한다. 일부 실시형태에서, 포획 단계는 비드 상의 단일 세포의 mRNA를 포획하여 세포 특이적 cDNA 라이브러리인 cDNA 라이브러리를 형성하는 단계를 포함하고, 올리고뉴클레오타이드 표지는 고유한 세포 특이적 올리고뉴클레오타이드 바코드이다. 일부 실시형태에서, 고유한 세포 특이적 바코드의 합성 단계는 분할 및 혼합 합성 방법에 의해 수행된다.

올리고뉴클레오타이드의 무주형 효소 합성

일반적으로, 무주형 (또는 균등하게, "주형-비의존적") 효소 DNA 합성 방법은 도 1a에 도시된 바와 같이, 각 사이클에서 소정의 뉴클레오타이드가 개시인자 또는 성장 사슬에 연결되는 단계의 사이클을 반복하는 단계를 포함한다. 무주형 효소 합성의 일반적인 요소는 다음 참조문헌: 문헌[Ybert et al, 국제 특허 공개 WO/2015/159023; Ybert et al, 국제 특허 공개 WO/2017/216472; Hyman, 미국 특허 제 5436143호; Hiatt et al, 미국 특허 제 5763594호; Jensen et al, Biochemistry, 57: 1821-1832 (2018); Mathews et al, Organic & Biomolecular Chemistry, DOI: 0.1039/c6ob01371f (2016); Schmitz et al, Organic Lett., 1(11): 1729-1731 (1999)]에 기재되어 있다.

예를 들어, 유리 3'-히드록실 기 (1030)를 갖는 고체 지지체 (1020)에 부착된 개시인자 폴리뉴클레오타이드 (1000)가 제공된다. 개시 폴리뉴클레오타이드 (1000) (또는 연장된 개시인자 폴리뉴클레오타이드)의 3' 말단에 3'-O-보호된-dNTP의 효소적 혼입에 효과적인 조건 (1040) 하에서 개시인자 폴리뉴클레오타이드 (1000) (또는 후속 사이클에서 연장된 개시인자 폴리뉴클레오타이드)에 3'-O-보호된-dNTP 및 무주형 중합효소, 예를 들어 TdT 또는 이의 변이체 (예를 들어, 문헌[Ybert et al, WO/2017/216472; Champion et al, WO2019/135007])가 첨가된다. 이 반응은 3'-히드록실이 보호된 연장된 개시인자 폴리뉴클레오타이드를 생성한다 (1060). 연장된 서열이 완료되지 않으면 다른 첨가 사이클을 수행한다 (1080). 연장된 개시인자 폴리뉴클레오타이드가 경쟁 서열을 포함하는 경우, 그 후 3'-O-보호기가 제거되거나 탈보호될 수 있고, 적절한 서열이 원래 개시인자 폴리뉴클레오타이드로부터 절단될 수 있다 (1100). 이러한 절단은 다양한 단일 가닥 절단 기술 중 임의의 것을 사용하여, 예를 들어 원래의 개시인자 폴리뉴클레오타이드 내의 소정의 위치에 절단 가능한 뉴클레오타이드를 삽입함으로써 수행될 수 있다. 예시적인 절단 가능한 뉴클레오타이드는 우라실 DNA 글리코실라제에 의해 절단되는 우라실 뉴클레오타이드일 수 있다. 연장된 개시인자 폴리뉴클레오타이드가 완료된 서열을 포함하지 않는 경우, 그 후 3'-O-보호기가 제거되어 유리 3'-히드록실이 노출되고 (1030) 연장된 개시인자 폴리뉴클레오타이드가 뉴클레오타이드 첨가 및 탈보호의 또 다른 사이클에 적용된다.

본 명세서에 사용된 "개시인자" (또는 "개시 단편", "개시인자 핵산", "개시인자 올리고뉴클레오타이드"등과 같은 균등한 용어)는 일반적으로, TdT와 같은 무주형 중합효소에 의해 추가로 연장될 수 있는 유리 3' 말단을 갖는 짧은 올리고뉴클레오타이드 서열을 지칭한다. 일 실시형태에서, 개시 단편은 DNA 개시 단편이다. 대안적인 실시형태에서, 개시 단편은 RNA 개시 단편이다. 일부 실시형태에서, 개시 단편은 3 내지 100개 뉴클레오타이드, 특히 3 내지 20개 뉴클레오타이드를 보유한다. 일부 실시형태에서, 개시 단편은 단일 가닥이다. 대안적인 실시형태에서, 개시 단편은 이중 가닥이다. 일부 실시형태에서, 예를 들어 문헌[Baiga, 미국 특허 공보 US2019/0078065 및 US2019/0078126]과 같이, 개시인자는 TdT가 3'-O-보호된 dNTP를 연결할 수 있는 유리 히드록실을 갖는 비 핵산 화합물을 포함할 수 있다.

도 1a로 돌아가서, 일부 실시형태에서, 일련의 서열의 뉴클레오타이드는 각 합성 단계에서 3'-O-보호된 dNTP의 존재 하에 TdT와 같은 무주형 중합효소를 사용하여 개시인자 핵산에 연결된다. 일부 실시형태에서, 올리고뉴클레오타이드 합성 방법은 (a) 유리 3'-히드록실을 갖는 개시인자를 제공하는 단계; (b) 3'-O-보호된 뉴클레오사이드 트리포스페이트의 존재하에 유리 3'-히드록실을 갖는 개시인자 또는 확장 중간체를 확장 조건 하에서 반응시켜 3'-O-보호된 확장 중간체를 생성하는 단계; (c) 확장 중간체를 탈보호하여 유리 3'-히드록실을 갖는 확장 중간체를 생성하는 단계; 및 (d) 폴리뉴클레오타이드가 합성될 때까지 단계 (b) 및 (c)를 반복하는 단계를 포함한다. (때때로 "확장 중간체" 및 "연장 단편"이라는 용어는 상호 혼용됨). 일부 실시형태에서, 개시인자는 예를 들어 5' 말단에 고체 지지체에 부착된 올리고뉴클레오타이드로서 제공된다. 상기 방법은 또한 반응 또는 확장 단계 후뿐만 아니라, 탈보호 단계 후 세척 단계를 포함할 수 있다. 예를 들어, 반응 단계는, 예를 들어 소정의 인큐베이션(incubation) 기간 또는 반응 시간 후 세척에 의해 혼입되지 않은 뉴클레오사이드 트리포스페이트를 제거하는 하위 단계를 포함할 수 있다. 이러한 소정의 인큐베이션 기간 또는 반응 시간은 몇 초, 예를 들어 30초 내지 몇 분, 예를 들어, 30분일 수 있다.

합성 지지체상의 폴리뉴클레오타이드의 서열이 역 상보적 부분 서열을 포함하는 경우, 역 상보적 영역 사이의 수소 결합 형성에 의해 2차 분자 내 또는 교차 분자 구조가 생성될 수 있다. 일부 실시형태에서, 엑소사이클릭 (exocyclic) 아민에 대한 염기 보호 모이어티를 선택하여 보호된 질소의 수소가 수소 결합에 참여할 수 없도록 함으로써 이러한 2차 구조의 형성을 방지한다. 즉, 염기 보호 모이어티는 정상적인 염기 쌍, 예를 들어 뉴클레오사이드 A와 T 사이 및 G와 C 사이에 형성되는 것과 같은 수소 결합의 형성을 방지하기 위해 사용될 수 있다. 합성의 마지막에, 염기 보호는 모이어티는 제거될 수 있고 폴리뉴클레오타이드 산물은 예를 들어 개시인자로부터 절단함으로써 고체 지지체로부터 절단될 수 있다.

염기 비보호 3'-O-차단된 dNTP는 상용 공급업체로부터 구입하거나, 예를 들어 문헌[미국 특허 제 7057026호; Guo et al, Proc. Natl. Acad. Sci., 105(27): 9145-9150 (2008); Benner, 미국 특허 제 7544794호 및 제 8212020호; 국제 특허 공개 WO2004/005667, WO91/06678; Canard et al, Gene (본 명세서에 인용됨); Metzker et al, Nucleic Acids Research, 22: 4259-4267 (1994); Meng et al, J. Org. Chem., 14: 3248-3252 (3006); 미국 특허 공보 제 2005/037991호]와 같이 공개된 기술을 사용하여 합성될 수 있다. 염기 보호 3'-O 차단된 dNTP는 아래와 같이 합성될 수 있다.

염기 보호된 dNTP가 사용되는 경우, 도 1a의 상기 방법은 염기 보호 모이어티를 제거하는 단계 (e)를 추가로 포함할 수 있으며, 아실 또는 아미딘 보호기의 경우 (예를 들어) 농축 암모니아(concentrated ammonia)로 처리하는 단계를 포함할 수 있다.

상기 방법은 또한 반응 또는 확장 단계 후 및 탈보호 단계 후의 세척 단계뿐만 아니라 캡핑 단계(들)를 포함할 수 있다. 상기 언급된 바와 같이, 일부 실시형태에서, 확장되지 않은 유리 3'-히드록실이 캡핑된 가닥의 임의의 추가 확장을 방지하는 화합물과 반응하는 캡핑 단계가 포함될 수 있다. 일부 실시형태에서, 이러한 화합물은 디데옥시뉴클레오사이드 트리포스페이트일 수 있다. 다른 실시형태에서, 유리 3'-히드록실을 갖는 확장되지 않은 가닥은 3'-엑소뉴클레아제 활성, 예를 들어 Exo I으로 처리함으로써 분해될 수 있다. 예를 들어, 문헌[Hyman, 미국 특허 제 5436143호]을 참조한다. 마찬가지로, 일부 실시형태에서, 탈차단되지 않은 가닥은 가닥을 제거하거나 추가 확장에 대해 불활성이 되도록 하기 위해 처리될 수 있다.

일부 실시형태에서, 확장 또는 연장 단계를 위한 반응 조건은 2.0 μM 정제된 TdT; 125-600 μM 3'-O-차단된 dNTP (예를 들어 3'-O-NH₂-차단된 dNTP); 약 10 내지 약 500 mM 카코딜산칼륨 완충액 (pH 6.5 내지 7.5) 및 약 0.01 내지 약 10 mM의 2가 양이온 (예를 들어 CoC1₂또는 MnC1₂)을 포함할 수 있고, 연장 반응은 50 μL 반응 부피에서 RT 내지 45℃ 범위 내의 온도에서 3분 동안 수행될 수 있다. 3'-O-차단된 dNTP가 3'-O-NH₂-차단된 dNTP인 실시형태에서, 탈차단 단계를 위한 반응 조건은 700 mM NaNO₂; 1 M 아세트산나트륨 (아세트산으로 4.8 내지 6.5의 범위의 pH로 조정됨)을 포함할 수 있고, 탈차단 반응은 RT 내지 45℃ 범위의 온도에서 30초 내지 수 초 동안 50 μL 부피로 수행될 수 있다.

특정 적용에 따라, 탈차단 및/또는 절단 단계는 다양한 화학적 또는 물리적 조건 예를 들어, 빛, 열, pH, 특정 화학 결합을 절단할 수 있는 효소와 같은 특정 시약의 존재를 포함할 수 있다. 3'-O-차단 기 및 해당 탈차단 조건을 선택하는 지침은 참조로 포함되는 다음 참조문헌: 문헌[Benner, 미국 특허 제 7544794호 및 제 8212020호; 미국 특허 제 5808045호; 미국 특허 제 8808988호; 국제 특허 공개 WO91/06678]; 및 하기에 인용된 참조문헌에서 찾을 수 있다. 일부 실시형태에서, 절단제 (때때로 탈차단 시약 또는 제제라고도 함)는 예를 들어 디티오트레이톨 (DTT)과 같은 화학적 절단제이다. 대안적 실시형태에서, 절단제는 예를 들어 3'-포스페이트 차단기를 절단할 수 있는 포스파타제와 같은 효소 절단제일 수 있다. 탈차단제의 선택은 사용되는 3'-뉴클레오타이드 차단기의 유형, 하나 또는 다중 차단기가 사용되는지, 개시인자가 약한 처리가 필요한 생존 세포 또는 유기체 또는 고체 지지체 등에 부착되는지에 따라 달라진다는 것이 당업자에 의해 이해될 것이다. 예를 들어, 트리스(2-카복시에틸)포스핀 (TCEP)과 같은 포스핀을 사용하여 3'O-아지도메틸기를 절단할 수 있고, 팔라듐 착물(palladium complex)을 사용하여 3'O-알릴기를 절단하거나 아질산나트륨을 사용하여 3'O-아미노기를 절단할 수 있다. 특정 실시형태에서, 절단 반응은 TCEP, 팔라듐 착물 또는 아질산나트륨을 포함한다.

위에서 언급한 바와 같이, 일부 실시예에서 직교 탈차단 조건(orthogonal de-blocking)을 사용하여 제거될 수 있는 2개 이상의 차단기를 사용하는 것이 바람직하다. 다음 예시적인 차단기 쌍은 병렬 합성 실시형태에서 사용될 수 있다 (표 1). 다른 차단기 쌍, 또는 2개 초과를 포함하는 기가 본 발명의 이러한 실시형태에서 사용하기 위해 이용 가능할 수 있음이 이해된다.

차단기 쌍

3'-O-NH2	3'-O-아지도메틸
3'-O-NH2	3'-O-알릴
3'-O-NH2	3'-O-포스페이트
3'-O-아지도메틸	3'-O-알릴
3'-O-아지도메틸	3'-O-포스페이트
3'-O-알릴	3'-O-포스페이트

생존 세포에서 올리고뉴클레오타이드를 합성하는 단계는 약한 탈차단 또는 탈보호 조건, 즉 세포막을 파괴하거나 단백질을 변성시키거나 주요 세포 기능을 방해하지 않는 조건 등이 필요하다. 일부 실시형태에서, 탈보호 조건은 세포 생존에 적합한 생리적 조건의 범위 내이다. 이러한 실시형태에서, 효소적 탈보호는 생리적 조건 하에서 수행될 수 있기 때문에 바람직하다. 일부 실시형태에서 효소적으로 제거 가능한 특정 차단기는 제거를 위해 특정 효소와 결합된다. 예를 들어, 에스테르 또는 아실 기반 차단기는 아세틸 에스테라제와 같은 에스테라제 또는 유사한 효소로 제거될 수 있고, 포스페이트 차단기는 T4 폴리뉴클레오타이드 키나제와 같은 3'포스파타제로 제거될 수 있다. 예를 들어, 3'-O-포스페이트는 100 mM Tris-HCl (pH 6.5) 10 mM MgC1₂, 5 mM 2-머캅토에탄올 및 하나의 단위 T4 폴리뉴클레오타이드 키나제의 용액으로 처리하여 제거할 수 있다. 반응은 37℃에서 1분간 진행된다.

"3'-포스페이트 차단된" 또는 "3'-포스페이트 보호된" 뉴클레오타이드는 포스페이트 포함 모이어티의 존재에 의해 3'-위치의 히드록실기가 차단된 뉴클레오타이드를 지칭한다. 본 발명에 따른 3'-포스페이트-차단된 뉴클레오타이드의 예는 뉴클레오타이드-3'-포스페이트 모노에스테르/뉴클레오타이드-2',3'-사이클릭 포스페이트, 뉴클레오타이드-2'-포스페이트 모노에스테르 및 뉴클레오타이드-2' 또는 3'-알킬포스페이트 디에스테르, 및 뉴클레오타이드-2' 또는 3'-피로포스페이트이다. 단, 치환이 포스파타제에 의한 유리 3'-OH를 생성하는 탈인산화를 방지하지 않는 한 티오포스페이트 또는 이러한 화합물의 다른 유사체가 또한 사용될 수 있다.

3'-O-에스테르-보호된 dNTP 또는 3'-O-포스페이트-보호된 dNTP의 합성 및 효소적 탈보호의 추가 예는 다음 참조문헌: 문헌[Canard et al, Proc. Natl. Acad. Sci., 92:10859-10863 (1995); Canard et al, Gene, 148: 1-6 (1994); Cameron et al, Biochemistry, 16(23): 5120-5126 (1977); Rasolonjatovo et al, Nucleosides & Nucleotides, 18(4&5): 1021-1022 (1999); Ferrero et al, Monatshefte fur Chemie, 131: 585-616 (2000); Taunton-Rigby et al, J. Org. Chem., 38(5): 977-985 (1973); Uemura et al, Tetrahedron Lett., 30(29): 3819-3820 (1989); Becker et al, J. Biol. Chem., 242(5): 936-950 (1967); Tsien, 국제 특허 공개 WO1991/006678]에 기재되어 있다.

일부 실시형태에서, 변형된 뉴클레오타이드는 3' 탄소 원자가 구조의 기에 부착되도록 공유결합에 의해 부착된 제거 가능한 3'-OH 차단기를 갖는 퓨린 또는 피리미딘 염기 및 리보스 또는 데옥시리보스 당 모이어티를 포함하는 변형된 뉴클레오타이드 또는 뉴클레오사이드 분자를 포함한다:

-O-Z

상기 식에서, -Z는 -C(R')₂-O-R", -C(R')₂-N(R")₂, -C(R')₂-N(H)R", -C(R')₂-S-R" 및 -C(R')₂-F 중 임의의 것이고, 각각의 R"는 제거 가능한 보호기이거나 그 일부이고; 각각의 R'는 독립적으로 수소 원자, 알킬, 치환된 알킬, 아릴알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 헤테로사이클릭, 아실, 시아노, 알콕시, 아릴옥시, 헤테로아릴옥시 또는 아미도 기, 또는 연결기를 통해 부착된 검출 가능한 표지이고; 단 일부 실시형태에서 이러한 치환기는 최대 10개의 탄소 원자 및/또는 최대 5개의 산소 또는 질소 헤테로원자를 가지고; 또는 (R')₂는 화학식 =C(R"')₂의 기를 나타내고, 각각의 R"'는 동일하거나 상이할 수 있고 수소 및 할로겐 원자 및 알킬기를 포함하는 군으로부터 선택되고, 단 일부 실시형태에서 각각의 R'"의 알킬은 1 내지 3개의 탄소 원자를 갖고; 분자는 반응하여 다음과 같은 중간체를 생성할 수 있고, 각 R"는 H로 교환되고, Z는 -(R')₂-F인 경우 F는 OH, SH 또는 NH₂, 바람직하게는 OH로 교환되고, 수성 조건에서 해리되어 유리 3'-OH를 갖는 분자를 제공하고; 단, Z가 -C(R')₂-S-R"인 경우, 두 R' 기는 모두 H가 아니다. 특정 실시형태에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 R'는 알킬 또는 치환된 알킬이고, 단 이러한 알킬 또는 치환된 알킬은 1 내지 10개의 탄소 원자 및 0 내지 4개의 산소 또는 질소 헤테로원자를 갖는다. 특정 실시형태에서, 변형된 뉴클레오타이드 또는 뉴클레오사이드의 -Z는 화학식 -C(R')₂-N3이다. 특정 실시형태에서, Z는 아지도메틸기이다.

일부 실시형태에서, Z는 분자량이 200 이하인 헤테로원자를 갖거나 갖지 않는 절단 가능한 유기 모이어티(cleavable organic moiety)이다. 다른 실시형태에서, Z는 분자량이 100 이하인 헤테로원자를 갖거나 갖지 않는 절단 가능한 유기 모이어티이다. 다른 실시형태에서, Z는 분자량이 50 이하인 헤테로원자를 갖거나 갖지 않는 절단 가능한 유기 모이어티이다. 일부 실시형태에서, Z는 분자량이 200 이하인 헤테로원자를 갖거나 갖지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시형태에서, Z는 분자량이 100 이하인 헤테로원자를 갖거나 갖지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시형태에서, Z는 분자량이 50 이하인 헤테로 원자를 갖거나 갖지 않는 효소적으로 절단 가능한 유기 모이어티이다. 다른 실시형태에서, Z는 200 이하의 분자량을 갖는 효소적으로 절단 가능한 에스테르 기이다. 다른 실시형태에서, Z는 3'-포스파타제에 의해 제거 가능한 포스페이트기이다. 일부 실시형태에서, 다음 3'-포스파타제 중 하나 이상이 제조업체의 권장 프로토콜에 의해 사용될 수 있다: T4 폴리뉴클레오타이드 키나제, 송아지 장 알칼리 포스파타제, 재조합 새우 알칼리 포스파타제 (예를 들어, New England Biolabs, Beverly, MA로부터 구입 가능함)

추가 실시형태에서, 3'-차단된 뉴클레오타이드 트리포스페이트는 3'-O-아지도메틸, 3'-O-NH₂ 또는 3'-O-알릴기에 의해 차단된다.

또 다른 실시형태에서, 본 발명의 3'-O-차단기는 3'-O-메틸, 3'-O-(2-니트로벤질), 3'-O-알릴, 3'-O-아민, 3'-O-아지도메틸, 3'-O-tert-부톡시 에톡시, 3'-O-(2-시아노에틸) 및 3'-O-프로파길을 포함한다.

일부 실시형태에서, 3'-O-보호기는 전기화학적으로 불안정한 기이다. 즉, 보호 기의 탈보호 또는 절단은 절단을 초래하는 보호 기 주변의 전기화학적 조건을 변화시킴으로써 달성된다. 이러한 전기화학적 조건의 변화는 결과적으로 보호 기의 위치에서 전기화학적 조건의 변화, 예컨대 pH 증가 또는 감소를 야기하는 보조 종을 활성화는 전압 차 또는 빛과 같은 물리량을 변화시키거나 적용하여 야기될 수 있다. 일부 실시형태에서, 전기화학적으로 불안정한 기는 예를 들어 pH가 소정의 값으로 변화될 때마다 절단되는 pH 감응성 보호 기를 포함한다. 다른 실시형태에서, 전기화학적으로 불안정한 기는 환원 또는 산화 조건이 변화될 때마다, 예를 들어 보호 기의 위치에서 전압 차이를 증가 또는 감소시킴으로써 직접 절단되는 보호 기를 포함한다.

일부 실시형태에서, 효소 합성 방법은 3'-O-변형된 뉴클레오사이드 트리포스페이트에 대해 증가된 혼입 활성을 나타내는 TdT 변이체를 사용한다. 예를 들어, 이러한 TdT 변이체는 문헌[Champion et al, 미국 특허 제 10435676호]에 기재된 기술을 사용하여 생성될 수 있으며, 상기 문헌은 본 명세서에 참조로 포함된다. 일부 실시형태에서, 서열번호 2와 적어도 60 퍼센트 동일한 아미노산 서열 및 위치 207에서 제1 아르기닌의 치환 및 위치 325에서 제2 아르기닌의 치환 또는 기능적으로 균등한 잔기를 갖는 TdT 변이체가 사용된다. 일부 실시형태에서, 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15로부터 선택되는 아미노산 서열과 적어도 60 퍼센트 동일한 아미노산 서열을 갖고, 서열번호 2, 3, 4, 6, 7, 9, 12 및 13의 경우 위치 207, 서열번호 5의 경우 위치 206, 서열번호 8 및 10의 경우 위치 208, 서열번호 11의 경우 위치 205, 서열번호 14의 경우 위치 216 및 서열번호 15의 경우 위치 210의 아르기닌 ("제1 아르기닌")의 치환; 및 서열번호 2, 9 및 13의 경우 위치 325, 서열번호 3 및 4의 경우 위치 324, 서열번호 320의 경우 위치 320, 서열번호 6 및 8의 경우 위치 331, 서열번호 11의 경우 위치 323, 서열번호 12 및 15의 경우 위치 328, 및 서열번호 14의 경우 위치 338의 아르기닌 ("제2 아르기닌")의 치환또는 이의 기능적으로 균등한 잔기를 갖는 말단 데옥시뉴클레오타이드 트랜스퍼라제 (TdT) 변이체가 사용되고, TdT 변이체 (i)는 주형없이 핵산 단편을 합성할 수 있고 (ii)는 핵산 단편의 유리 3'-히드록실에 3'-O-변형된 뉴클레오타이드를 혼입할 수 있다. 일부 실시형태에서, 상기 동일성 퍼센트 값은 표시된 서열번호와 적어도 80 동일성 퍼센트이고; 일부 실시형태에서, 상기 동일성 퍼센트 값은 표시된 서열번호와 적어도 90 동일성 퍼센트이고; 일부 실시형태에서, 상기 동일성 퍼센트 값은 표시된 서열번호와 적어도 95 동일성 퍼센트이고; 일부 실시형태에서, 상기 동일성 퍼센트 값은 적어도 97 동일성 퍼센트이고; 일부 실시형태에서, 상기 동일성 퍼센트 값은 적어도 98 동일성 퍼센트이고; 일부 실시형태에서, 상기 동일성 퍼센트 값은 적어도 99 동일성 퍼센트이다. 본 명세서에 사용된 바와 같이, 참조 서열을 변이체 서열과 비교하는데 사용되는 동일성 퍼센트 값은 변이체 서열의 치환을 포함하는 명시적으로 지정된 아미노산 위치를 포함하지 않으며; 즉, 동일성 퍼센트 관계는 변이체에 치환을 포함하는 명시적으로 지정된 위치 외의 변이체 단백질의 서열 및 참조 단백질의 서열 사이의 관계이다. 따라서, 예를 들어, 참조 서열 및 변이체 서열이 각각 100개의 아미노산을 포함하고 변이체 서열이 위치 25 및 81에 돌연변이를 가졌다면, 상동성 퍼센트는 서열 1 내지 24, 26 내지 80 및 82 내지 100과 관련된 것이다.

(ii)와 관련하여, 이러한 3'-O-변형된 뉴클레오타이드는 3'-O-NH2-뉴클레오사이드 트리포스페이트, 3'-O-아지도메틸-뉴클레오사이드 트리포스페이트, 3'-O-알릴-뉴클레오사이드 트리포스페이트, 3'O―(2-니트로벤질)-뉴클레오사이드 트리포스페이트, 또는 3'-O-프로파길-뉴클레오사이드 트리포스페이트를 포함할 수 있다.

일부 실시형태에서, 상기 TdT 변이체는 표 2에 나타낸 바와 같이 제1 및 제2 아르기닌에서 치환된 것이다.

TdT 변이체

서열번호	치환
1	M192R/Q	C302G/R	R336L/N	R454P/N/A/V	E457N/L/T/S/K
2	M63R/Q	C173G/R	R207L/N	R325P/N/A/V	E328N/L/T/S/K
3	M63R/Q	C173G/R	R207L/N	R324P/N/A/V	E327N/L/T/S/K
4	M63R/Q	C173G/R	R207L/N	R324P/N/A/V	E327N/L/T/S/K
5	---	C172G/R	R206L/N	R320P/N/A/V	---
6	M63R/Q	C173G/R	R207L/N	R331P/N/A/V	E334N/L/T/S/K
7	M63R/Q	C173G/R	R207L/N	---	E328N/L/T/S/K
8	---	C174G/R	R208L/N	R331P/N/A/V	E334N/L/T/S/K
9	M73R/Q	C173G/R	R207L/N	R325P/N/A/V	E328N/L/T/S/K
10	M64R/Q	C174G/R	R208L/N	---	E329N/L/T/S/K
11	M61R/Q	C171G/R	R205L/N	R323P/N/A/V	E326N/L/T/S/K
12	M63R/Q	C173G/R	R207L/N	R328P/N/A/V	E331N/L/T/S/K
13	---	C173G/R	R207L/N	R325P/N/A/V	E328N/L/T/S/K
14	M63R/Q	C182G/R	R216L/N	R338P/N/A/V	E341N/L/T/S/K
15	M66R/Q	C176G/R	R210L/N	R328P/N/A/V	E331N/L/T/S/K

일부 실시형태에서, 본 발명의 방법과 함께 사용하기 위한 추가 TdT 변이체는 표 1에 나타낸 바와 같이 메티오닌, 시스테인 또는 글루탐산의 추가 치환 중 하나 이상을 포함한다.

본 발명의 방법에 사용될 수 있는 추가의 특정 TdT 변이체는 표 3에 제시되어 있다. 표 2의 TdT 변이체 DS1001 내지 DS1018 각각은 서열번호 2와 적어도 60퍼센트 동일한 아미노산 서열을 포함하고, 소정의 위치에서의 치환을 포함한다. 일부 실시형태에서, TdT 변이체 DS1001 내지 DS1018은 서열번호 2와 적어도 80퍼센트 동일한 아미노산 서열을 포함하고 소정의 위치에서의 치환을 포함하고; 일부 실시형태에서, TdT 변이체 DS1001 내지 DS1018은 서열번호 2와 적어도 90퍼센트 동일한 아미노산 서열을 포함하고 소정의 위치에서의 치환을 포함하고; 일부 실시형태에서, TdT 변이체 DS1001 내지 DS1018은 서열번호 2와 적어도 95퍼센트 동일한 아미노산 서열을 포함하고 소정의 위치에서의 치환을 포함하고; 일부 실시형태에서, TdT 변이체 DS1001 내지 DS1018은 서열번호 2와 적어도 97퍼센트 동일한 아미노산 서열을 포함하고 소정의 위치에서의 치환을 포함하고; 일부 실시형태에서, TdT 변이체 DS1001 내지 DS1018은 서열번호 2와 적어도 98퍼센트 동일한 아미노산 서열을 포함하고 소정의 위치에서의 치환을 포함하고; 일부 실시형태에서, TdT 변이체 DS1001 내지 DS1018은 서열번호 2와 적어도 99퍼센트 동일한 아미노산 서열을 포함하고 소정의 위치에서의 치환을 포함한다.

본 발명의 방법과 함께 사용하기 위한 특정 TdT 변이체

DS1001 (TH M27)	A17V + L52F + M63R + A108V + C173G + R207L + K265T + G284P + E289V + R325P + E328N + R351K
DS1002(M44)	A17V + Q37E + D41R + L52F + G57E + M63R + S94R + G98E + A108V + S119A + L131R + S146E + Q149R + C173G + R207L + K265T + G284P + E289V + R325P + Q326F + E328N + H337D + R351K + W377R
DS1003	A17V + Q37E + D41R + L52F + G57E + M63R + S94R + G98E + A108V + S146E + Q149R + C173G + F193Y + V199M + M201V + R207L + K265T + G284P + E289V + Q326F + E328N + R351K
DS1004(M45)	A17V + Q37E + D41R + L52F + G57E + M63R + S94R + G98E + A108V + S146E + Q149R + C173G + F193Y + V199M + M201V + R207L + K265T + G284P + E289V + R325A + Q326F + E328N + R351K
DS1005	A17V + Q37E + D41R + L52F + G57E + M63R + S94R + G98E + A108V + S146E + Q149R + C173G + F193Y + V199M + M201V + R207L + K265T + G284P + E289V + Q326F + E328N + R351K
DS1006(M46)	L52F + A108V + R351K + A17V + Q37E + D41R + G57E+ C59R + L60D + M63R + S94R + G98E + S119A + L131R + S146E + Q149R + C173G + R207L + K265T + G284P + E289V + R325A + Q326F + E328N
DS1007(M47)	L52F + A108V + R351K + A17V + Q37E + D41R + G57E + C59R + L60D + M63R + S94R + G98E + K118Q + S119A + L131R + S146E + Q149R + C173G + R207L + K265T + G284P + E289V + R325A + Q326F + E328N + W377R
DS1008	A17V + Q37E + D41R + L52F + G57E + C59R + L60D + M63R + S94R + G98E + A108V + S119A + L131R + S146E + Q149R + C173G + R207L + F259S + Q261L + G284P + E289V + R325A + Q326F + E328N + R351K + W377R
DS1009(MS 13-34)	A17V + D41R + L53F + G57E + C59R + L60D + M63R + S94R + G98E + K118Q + S119A + L131R + S146E + Q149R + C173G + R207L + K265T + G284P + E289V + R325A + Q326F + R351K + W377R
DS1010(MS 34-1)	A17V + D41R + L52F + G57E + C59R + L60D + M63R + S94R + G98E + A108V + S119A + L131R + S146E + Q149R + R207L + K265T + G284P + E289V + R325A + Q326F + R351K
DS1011	A17V + D41R + L53F + G57E + C59R + L60D + M63R + S94R + G98E + K118Q + S119A + L131R + S146E + Q149R + C173G + R207L + K265T + G284P + E289V + Q326F + R351K + W377R
DS1012(M48)	A17V + Q37E + D41R + L52F + G57E + C59R + L60D + M63R + S94R + G98E + A108V + S119A + L131R + S146E + Q149R + C173G + R207L + F259S + Q261L, G284P + E289V + R325A + Q326F + E328N + R351K + W377R
DS1013	A17V + Q37E + D41R + L52F + G57E + M63R + S94R + G98E + A108V + S146E + Q149R + C173G + R207L + K265T + G284P + E289V + R325A + Q326F + E328N + R351K
DS1014(M49)	A17V + Q37E + D41R + L52F + G57E + C59R + L60D + M63R + S94R + G98E + A108V + S119A + L131R + S146E + Q149R + C173G + R207L + E257D + F259S + K260R + Q261L + G284P + E289V + R325A + Q326F + E328N + R351K + W377R
DS1015	A17V + Q37E + D41R + L52F + G57E + C59R + L60D + M63R + S94R + G98E + A108V + S119A + L131R + S146E + Q149R + C173G + F193Y + V199M + M201V + R207L + E257D + F259S + K260R + Q261L + G284P + E289V + R325A + Q326F + E328N + R351K + W377R
DS1016TH c2_5	A17V + D41R + L52F + G57E + M63R + S94R + G98E + A108V + S146E + Q149R + C173G + M184T + R207L + K209H + G284L + E289A + R325V + E328K + R351K
DS1017(M27)	A17V + L52F + G57E + M63R + A108V + C173G + R207L + K265T + G284P + E289V + R325P + E328N + R351K
DS1018(M60)	A17V + L32T + Q37R + D41R + L52F + G57E + C59R + L60D + M63R + S67A + S94R + G98E + A108V + S119A +L131R + S146E + Q149R + V171A + S172E + C173R + V182I + S183E + R207L + K209H + M210K + T211I + E223G + A224P + E228D + Q261L + G284P + E289V + R325A + Q326F + E328N + R351K + D372E

전술한 바와 같은 본 발명의 TdT 변이체는 각각 소정의 치환의 존재에 따라 특정 서열번호와 서열 동일성 퍼센트를 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 이러한 방식으로 기재된 본 발명의 TdT 변이체와 특정 서열번호 사이의 서열 차이의 수 및 유형은 치환, 결실 및/또는 삽입에 기인할 수 있으며, 치환, 결실 및/또는 삽입된 아미노산은 임의의 아미노산을 포함할 수 있다. 일부 실시형태에서, 이러한 결실, 치환 및/또는 삽입은 천연 발생 아미노산만을 포함한다. 일부 실시형태에서, 치환은 문헌[Grantham, Science, 185: 862-864 (1974)]에 기재된 바와 같이 보존적 또는 균등한 아미노산 변화만을 포함한다. 즉, 아미노산의 치환은 균등한 아미노산 세트의 구성원 사이에서만 발생할 수 있다. 일부 실시형태에서, 사용될 수 있는 균등한 아미노산 세트는 표 4a에 제시되어 있다.

[표 4a]

균등한 아미노산 세트 I

일부 실시형태에서, 사용될 수 있는 균등한 아미노산 세트는 표 4b에 제시되어 있다.

[표 4b]

균등한 아미노산 세트 II

생체분자에서 올리고뉴클레오타이드 합성

본 발명에 따라 올리고뉴클레오타이드가 합성될 수 있는 생체분자는 다음에 제한되는 것은 아니나, 폴리뉴클레오타이드, 펩타이드, 단백질, 글리칸, 다당류 등을 포함한다. 개시인자가 부착될 수 있는 사실상 임의의 생체분자 또는 기타 물질은 본 발명의 방법에 의해 합성된 올리고뉴클레오타이드를 가질 수 있다. 위에서 언급한 바와 같이, cDNA, 게놈 단편 등과 같은 폴리뉴클레오타이드의 경우, 개시인자 및 생체분자 또는 표면 사이에 공유 결합을 야기하는 방식 및 표면 또는 생체분자에 부착된 개시인자 및 또 다른 상보적 올리고뉴클레오타이드 및 개시인자 사이의 이중체 형성 또는 비오틴 및 스트렙타비딘과 같은 포획 모이어티 및 이의 상보적 모이어티 사이의 복합체의 형성과 같은 개시인자 및 생체분자 또는 표면 사이에 비공유결합을 생성하는 방식을 포함하여 다양한 개시인자 부착 방식을 사용할 수 있다.

올리고뉴클레오타이드가 합성된 폴리뉴클레오타이드는 다양한 방법으로 고체 지지체로부터 분리될 수 있다. 포획 올리고뉴클레오타이드에 혼성화된 개시인자는 포획 올리고뉴클레오타이드로부터 간단하게 용융 또는 탈혼성화될 수 있거나, 이중체가 제한 엔도뉴클레아제 또는 닉카제 인식 부위를 포함하도록 설계될 수 있다. 개시인자가 표면에 공유 결합에 의해 부착되는 실시형태에서, 단일 가닥을 절단하기 위해 다수의 기술, 예를 들어 문헌[Delort et al, Nucleic Acids Research, 13: 319-335 (1985)]의 개시인자의 소정의 위치에의 우라실 삽입이 이용 가능하다.

올리고뉴클레오타이드 개시인자는 다음 참조문헌: 문헌[Hermanson (상기 인용); Baskin et al, Proc. Natl. Acad. Sci., 104(43): 16793-16797 (2007); Gong et al, Bioconjugate Chemistry, 27: 217-225 (2016); Horisawa, Frontiers in Physiology, 5: 1-6 (2014); Jewett et al, Chem. Soc. Rev., 39(4): 1272-1279 (2010); 미국 특허 제 5665539호]에 기재된 바와 같이 잘 알려진 기술을 사용하여 항체와 같은 단백질에 부착될 수 있다.

한 번 개시인자가 부착되면 그 후 효소 합성을 수행하여 개시인자를 확장할 수 있다. 일부 실시형태에서, 단백질은 합성 전에 고체 지지체에 가역적으로 부착된다. 폴리뉴클레오타이드와 마찬가지로, 이러한 부착은 공유 또는 비공유 결합에 의해 이루어질 수 있다. 단백질이 재조합 단백질인 경우, 폴리히스티딘 태그와 같은 펩타이드 태그 또는 유사한 방법에 의해 부착될 수 있다. 일부 실시형태에서, 단백질은 고체 지지체에 부착된 항체에 포획 및 결합함으로써 고체 지지체 상에 고정될 수 있다.

생물학적 세포에서 올리고뉴클레오타이드 합성

단일 세포 측정 값은 다르게는 합산 측정에서 검출할 수 없는 소수의 부분 집단을 평가하기 위해 장기간 평가되었고, 이는 많은 세포로부터 세포 매개변수의 평균만을 제공하며, 예를 들어 문헌[Di Carlo et al, Methods in Molecular Biology, 853: 1-9 (2012)]과 같다. 그 결과 고 처리량 단일 세포 분석을 위한 다양한 기술이 개발되었으며, 예를 들어 문헌[Shapiro et al, Nature Reviews Genetics, 14: 618-630 (2013)]을 검토한다. 이러한 많은 기술의 일반적인 접근 방식은 분석을 위해 세포 집단을 작은 반응 부피로 확률적으로 분포시켜 단일 세포 포함 반응기를 형성하는 단계를 포함한다. 예를 들어 문헌[Koster et al, LabChip, 8: 1110-1115 (2008)]과 같이, 이러한 확률적 방법은 "대량" 혼합물에서 세포를 처리할 수 있지만, 이 방법은 작은 부피로 완료되는 세포 수를 제한적으로만 제어할 수 있음으로써, 일반적으로 출발 집단의 세포 농도가 높을수록 2개 이상의 세포로 완료되는 작은 부피의 수가 많아진다. 성공적인 단일 세포 분석은 각 반응 부피에 단 하나의 세포만 존재해야 하기 때문에 세포 이중체의 발생을 방지하기 위해 매우 낮은 세포 농도의 출발 집단이 선택된다. 안타깝게도 이로 인해 이러한 확률적 단리 단계의 하류에서 수행되는 분석에서 상당한 비 효율성이 발생한다. 이 문제는 세포를 전달하는 소적(droplet)과 소적에 확률적으로 분포되어 있는 바코드화된 비드를 전달하는 소적을 결합시켜 세포 특이적 바코드가 세포에 전달될 때 악화된다. 따라서 세포에서 고유한 바코드를 직접 합성하는 기술을 사용할 수 있으므로 단일 비드를 단일 세포에 전달해야 할 필요가 없어진다.

본 발명의 방법은 다음에 제한되는 것은 아니나, 포유류 세포, 효모 세포, 박테리아 세포, 원생동물 세포, 진균 세포, 식물 세포 등을 포함하는 광범위한 생물학적 세포에 적용될 수 있다. 일부 실시형태에서, 본 발명의 방법은 포유류 세포에 적용된다. 이러한 포유류 세포에는 조직이 없을 수 있고, 예를 들어 백혈구 또는 이러한 세포는 분해된 조직 결합 세포일 수 있다. 생존 세포에서 올리고뉴클레오타이드 합성 동안 세포를 생존가능한 상태로 유지하기 위해 반응 조건이 선택된다. 이러한 조건 (본 명세서에서 "생물학적 조건" 또는 "생존가능한 조건" 또는 "세포-생존가능한 조건"이라고도 함)은 6.8 내지 7.8의 범위의 pH, 및 15℃ 내지 41℃의 범위의 온도의 세포막의 삼투압의 균형을 가능하게 하는 생리적 염 용액을 포함하는 반응 혼합물에 세포를 배치하고 유지하는 단계를 포함한다. 일부 실시형태에서, 25℃ 내지 38℃ 범위의 온도가 사용된다. 생리적 염 용액은 0.8 내지 1.0 퍼센트 (w/v) 범위의 농도로 수성 용매에 나트륨, 칼슘 및/또는 칼륨 이온을 포함할 수 있다. 예를 들어, 증류수에 포함된 0.9 퍼센트 (w/v)의 염화나트륨은 일반적인 생리적 염 용액이다. 이러한 생리적 조건은 평균이고, 특히 본 발명의 특정 실시형태에서, 예를 들어 탈보호 단계에서 세포 또는 생체분자에 유의하게 유해하지 않는 것으로서, 이러한 조건과 작은 차이가 있을 수 있음이 이해된다. 마찬가지로, 일부 생물학적 세포, 예를 들어 호 열성 유기체는 위에서 언급한 것 이외의 조건에서 생존할 수 있는 것으로 이해된다.

세포와 개시인자의 부착. 고유한 세포 표지를 생성하는 제1 단계는 표적 집단의 세포에 개시인자를 부착하는 단계이다. 이는 다음에 제한되는 것은 아니나, 개시인자를 세포 표면 마커에 특이적인 하나 이상의 항체에 부착하는 단계, 개시인자를 세포 표면 마커에 특이적인 앱타머에 혼입하는 단계, 개시인자를 세포 표면 단백질에 직접 부착하기 위해 클릭 화학 기술을 사용하는 단계, 5'-친유성 꼬리를 가진 개시인자를 생성하여 표적 세포의 막에 삽입하는 단계를 포함하는 다양한 통상적인 기술을 사용하여 수행된다. 이러한 표지 기술의 예는 다음 참조문헌: 문헌[Weber et al, Biomacromolecules, 15: 4621-4626 (2014); Borisenko et al, Nucleic Acids Research, 37(4): e28 (2009); Sano et al, Science, 258: 120-122 (1992); Kazane et al, Proc. Natl. Acad. Sci., 109(10): 3731-3736 (2012); Nikic et al, Nature Protocols, 10: 780-791 (2015); Baskin et al, Proc. Natl. Acad. Sci., 104(43): 16793-16797 (2007); Jewitt et al, Chem. Soc. Rev., 39(4): 1272-1279 (2010); Li et al, Chem. Sci., 8: 2107 (2017)]에 기재되어 있다.

세포의 "분할 및 혼합" 바코드화. 일부 실시형태에서, 본 발명은 생존 세포, 고정된 세포 또는 고정 및 투과성화된 세포 중 하나인 세포를 고유하게 바코드화하는 방법을 제공한다. 예를 들어, 유전자 발현의 변화와 같은 생물학적 효과에 대해 화합물을 시험하거나 스크리닝할 때 세포가 다른 제제 또는 화합물에 노출된 후 세포 집단. 이러한 세포의 샘플은 유전자 발현, 예를 들어 세포 표면 분자의 변화에 대해 생존할 수 있는 동안 시험될 수 있거나, 이러한 세포는 고정 및 투과성화되고 세포 단백질 및 mRNA의 발현의 변화에 대해 시험될 수 있다. 일부 실시형태에서, 단백질 발현은 본 발명의 효소 합성 방법을 사용하여 확장될 수 있는 별개의 개시인자에 각각 연결된 하나 이상의 단백질 특이적 항체를 사용하여 모니터링될 수 있다. 일부 실시형태에서, 도 1b 및 도 1c에 기재된 바와 같이 mRNA 발현을 mRNA 특이적 프라이머를 사용하여 모니터링하여, 확장될 수 있는 cDNA를 생성할 수 있다. 도 2b에 예시된 바와 같이 바코드가 합성된 후 (시험 전 또는 후), 예를 들어 항체에 의해 전달되는 바코드에 대해 증폭, 단리 및 시퀀싱에 의해 이를 수집하여 표로 만들 수 있다. 이러한 측정은 바코드 하위단위의 혼성화를 기반으로 하는 보다 번거로운 바코드화 체계와 유사하며, 이는 예를 들어 Nolan의 미국 특허 공보 제 2016/0251697호에 기재되어 있다. 따라서, 일부 실시형태에서, 본 발명은 대량 세포 집단의 단일 세포 상의 다중 에피토프의 분포를 측정하기 위해 사용될 수 있다.

상기에 기재된 비드의 경우 고유한 세포 태그를 첨가하는 것과 유사하게, 본 발명은 또한 도 1f에 예시된 바와 같이 평면 표면에 배치된 조직 절편에서 유전자 발현의 공간 패턴의 경우 고유한 위치 태그를 부착하는데 사용될 수 있다. 조직 절편을 올리고뉴클레오타이드의 평면 어레이에 배치하고, 조직 특징 (예를 들어, 세포 경계)을 확인 및 영상화하고, 조직의 세포를 투과성화(permeabilize)하고, 역전사 효소 반응을 수행하여 평면 어레이에 부착된 cDNA 라이브러리를 생성하는 절차는 문헌[Stahl et al, Science, 353: 78-82 (2016); 및 Frisen et al], 미국 특허 제 9593365호 및 제 10030261호 및 유사 참조문헌에 개시되어 있으며, 상기 문헌은 본 명세서에 참조로 포함된다. 간략하게, 도 1f를 참조하여, 평면 어레이 (164)는 5' 말단에 의해 부착된 제어된 밀도를 갖는 올리고뉴클레오타이드 (180)의 균일한 코팅이 제공되며, 올리고뉴클레오타이드 (확대도 (165)로 표시)는 나중에 cDNA의 증폭 및 조작을 위한 프라이머 결합 부위와 같은 절편 (166), 증폭 후에도 cDNA 분자의 정량화를 용이하게 하는 분자 태그 (때때로 "고유 분자 확인인자" 또는 UMI라고도 함)를 포함하는 선택적 절편 (167), 및 세포로부터 방출된 mRNA의 포획을 가능하게 하는 폴리T 절편과 같은 절편 (168)을 포함한다. UMI (167)는 무작위 뉴클레오타이드 절편을 포함할 수 있다. 올리고뉴클레오타이드 (180)는 통상적인 기술을 사용하여 대량으로 제조될 수 있고 단일 단계로 평면 어레이 (164)의 표면에 적용될 수 있다. 상이한 종류의 올리고뉴클레오타이드, 예를 들어 상이한 위치 태그를 갖는 올리고뉴클레오타이드는 필요하지 않다. 절편 (167)은 또한, 예를 들어 시퀀싱에 의해 분석을 위해 cDNA를 방출하기 위한 절단 가능한 링커 또는 절단 가능한 뉴클레오타이드를 포함할 수 있다. 어레이 (164) 상에 조직의 절편 또는 얇은 층 (181) (예를 들어, 100 내지 1000 μm 두께)을 배치한 다음 (i) 대상 세포 또는 하위 조직과 같은 특징을 확인하고 이러한 정보를 평면 어레이 (164)의 위치에 기록 및/또는 연관시키고, (ii) 조직에 세포를 투과성화하여, mRNA를 방출시키고 올리고뉴클레오타이드 (180)로 분포되고 포획되도록 하기 위해 처리한다 (169). 영상 정보는 공통 위치 태그가 cDNA에서 합성되는 어레이 (164)의 영역을 규정하는데 사용된다. 처리에는 조직 특이적 또는 생체분자 특이적 화합물 또는 염료로 염색하는 단계가 포함될 수 있다. 위치 태그를 사용하면 cDNA를 대량으로 수집하고 시퀀싱할 수 있지만 위치 태그를 통해 특정 영역과 연관시킬 수 있다. 위의 단계 (i) 및 (ii) 후, 공간 cDNA 라이브러리 어레이를 생성하기 위해 포획된 mRNA (170)를 주형으로 사용하여 cDNA (171)를 합성하기 위해 역전사 반응용 시약을 적용한다. 그 후 표면에 부착된 상이한 cDNA의 패턴을 갖는 어레이 (164)를 남기고 조직 절편 (181)을 제거한다. 다른 위치의 다른 cDNA는 태그에 대한 합성 시약의 잉크젯 전달(inkjet delivery)에 의해 다수의 위치에서 cDNA의 샘플에 위치 태그를 부착하여 확인 및 정량화될 수 있으며, 이는 cDNA 패턴 (175) 상의 합성 위치 (182)의 중첩에 의해 도 1e에 예시되어 있다. 일부 실시예에서, 이러한 다수의 위치는 적어도 100개의 위치, 또는 적어도 1000개의 위치, 또는 적어도 10,000개의 위치일 수 있고; 다른 실시형태에서, 이러한 다수의 위치는 10 내지 50,000개의 위치; 또는 10 내지 10,000개의 위치; 또는 10 내지 1000개의 위치의 범위일 수 있다. 잉크젯 전달 시스템의 설계 및 제어에 대한 지침은 당업자에게 잘 알려져 있으며 미국 특허 공보 US2003/0170698 및 미국 특허 제 6306599호; 제 6323043호; 제 7276336호; 제 7534561호; 및 유사한 참조문헌에서 찾을 수 있다. 대안적으로, 예를 들어 3'-O-아지도메틸과 같은 전기화학적으로 감응성인 보호기의 탈보호와 같은 합성 단계에서 어레이의 전극에서 전위를 변경함으로써 영향을 받을 수 있는 전극 어레이가 사용될 수 있으며, 예를 들어, 문헌[Montgomery, 미국 특허 제 6093302호, 제 6444111호 및 제 6280595호; Gindilis, 미국 특허 제 9339782호; Maurer et al, 미국 특허 제 9267213호; Maurer et al, PLosOne, December 2006, issue 1, e34; Fomina et al, LabChip, 16: 2236-2244 (2016); Kavusi et al, 미국 특허 제 9075041호; Johnson et al, 미국 특허 제 9874538호 및 제 9910008호; Gordon et al, 미국 특허 제 6251595호; Levine et al, 등 IEEE J. Solid State Circuits, 43: 1859-1871 (2008)] 등에 기재된 바와 같다.

위치 태그 (173)는 각각의 대상 위치 또는 영역을 고유하게 확인하기 위해 선택된다 (예를 들어 충분히 길다). cDNA (171)의 조작 및 시퀀싱을 용이하게 하기 위해 추가 절편 (174)이 첨가될 수 있다. 일부 실시형태에서, 본 발명의 이러한 적용은 다음 단계: (a) 각각 포획 절편을 포함하는 포획 프로브의 균일한 코팅을 포함하는 어레이를 제공하는 단계; (b) 조직 샘플을 어레이와 접촉시키고 조직 샘플의 핵산이 포획 프로브의 포획 도메인과 상호작용하여 핵산이 포획되도록 하는 단계; (c) 조직 샘플의 다른 영역을 확인하기 위해 조직 샘플을 처리하는 단계; (d) 포획 도메인과 상호작용하는 핵산으로부터 핵산 분자를 생성하는 단계; (e) 핵산 분자 상에 위치 태그를 효소적으로 합성하는 단계; (f) 포획 도메인과 상호작용하는 핵산과 연관된 영역을 결정하는 단계; 및 (e) 결정된 영역을 cDNA에 연관시키는 단계로 수행될 수 있다. 일부 실시형태에서, 조직 샘플의 핵산 분자는 RNA이다. 다른 실시형태에서, 조직 샘플의 핵산 분자는 게놈 DNA일 수 있다. 다른 실시형태에서, 조직 샘플의 핵산 분자는 mRNA일 수 있다.

유사하게, 도 1g에 예시된 바와 같이, 조직 샘플에서 단백질의 공간적 분포는 폴리A 영역 및 항체 확인 영역을 포함하는 방출 가능한 올리고뉴클레오타이드 바코드를 갖는 항체, 즉 항체가 특이적인 단백질을 확인하는 항체 바코드를 사용하여 확인될 수 있다. 일부 실시형태에서, 항체는 2개의 태그; 전술한 바와 같은 항체 바코드 및 조직의 광학 분석 및 나중에 대상 조직 구조 또는 단백질 분포와 항체 위치의 상관관계를 지원하는 형광 표지를 가질 수 있다. 상기와 같이, 평면 어레이 (1164)에는 5' 말단에 부착된 올리고뉴클레오타이드 (1180)의 균일한 코팅이 제공되며, 올리고뉴클레오타이드 (확대도 (1165)로 표시)는 선택적으로 나중에 항체 바코드의 증폭 및 조작을 위한 프라이머 결합 부위와 같은 절편 (1166), 증폭 후에도 항체 분자의 정량화를 용이하게 하는 분자 태그 (때때로 "고유 분자 확인인자" 또는 UMI라고 함)를 포함하는 선택적 절편 (1167) 및 결합된 항체로부터 방출된 항체 바코드 (1183) (서열번호 18)의 포획를 가능하게 하는 폴리T 절편과 같은 절편 (1168)을 포함한다. 방출은 이황화물 모이어티와 같은 항체 및 항체 바코드 사이의 링커에서 화학적으로 불안정한 결합에 의해 수행될 수 있다. UMI (1167)는 무작위 뉴클레오타이드 절편을 포함할 수 있다. 상이한 종류의 올리고뉴클레오타이드, 예를 들어 상이한 위치 태그를 갖는 올리고뉴클레오타이드는 본 발명의 방법을 사용하여 나중에 합성되기 때문에 필요하지 않다. 절편 (1164)은 또한, 예를 들어 시퀀싱에 의한 분석을 위해 항체 바코드를 방출하기 위한 절단 가능한 링커 또는 절단 가능한 뉴클레오타이드를 포함할 수 있다. 어레이 (1164)에 조직의 절편 또는 얇은 층 (1181) (예를 들어, 100 내지 1000 μm 두께)을 배치한 다음 (i) 대상 세포 또는 하위 조직과 같은 특징을 확인하고 이러한 정보를 평면 어레이 (1164)의 위치에 기록 및/또는 연관시키고, (ii) 조직에 세포를 투과성화하여, 항체를 표적 단백질에 접근시키고, 방출된 항체 바코드가 분포되고, 올리고뉴클레오타이드 (1180)에 의해 포획되도록 하기 위해 처리한다 (1169). 영상 정보는 공통 위치 태그가 항체 바코드에서 합성되는 어레이 (1164)의 영역을 규정하는데 사용된다. 상기와 같이, 위치 태그를 사용하면 항체 바코드를 대량으로 수집하고 시퀀싱할 수 있지만 위치 태그를 통해 특정 영역과 연관시킬 수 있다. 위의 단계 (i) 및 (ii) 후, 상기 mRNA와 같이 포획된 항체 바코드 (1170)를 주형으로 사용하여 항체 바코드의 보체 (1171)를 합성하기 위해 역전사 반응용 시약을 적용한다. 그 후 표면에 부착된 상이한 cDNA의 패턴을 갖는 어레이 (1164)를 남기고 조직 절편 (1181)을 제거한다. 다른 위치의 다른 cDNA는 위치 태그에 대한 합성 시약의 잉크젯 전달에 의해 정규 위치에서 항체 바코드의 샘플에 위치 태그를 부착하여 확인 및 정량화될 수 있다. cDNA와 마찬가지로 항체 바코드의 위치 태그 (1173)는 각각의 대상 위치 또는 영역을 고유하게 확인하기 위해 선택된다 (예를 들어 충분히 길다).

유사하게, 도 1h에 예시된 바와 같이 조직 절편에서 유전자 발현 및 단백질 분포의 공간 패턴은 확인인자를 갖는 올리고뉴클레오타이드 및 DNA 표지된 항체의 조합을 포함하는 평면 어레이, 즉 항체가 특이적인 단백질을 확인하는 항체 특이적 DNA 서열을 사용하여 확인될 수 있다. 간략히, 도 1h를 참조하면, 평면 어레이 (3164)에는 5' 말단에 부착된 올리고뉴클레오타이드 (3180)의 균일한 코팅과 항체 (3191)의 하나 이상의 아미노산에 부착될 수 있는 DNA 표지 (3190)을 포함하는 항체 (3191)의 균일한 코팅이 제공된다. 평면 어레이 (3164)에서 각 종류의 올리고뉴클레오타이드 (3180) 및 항체 (3191)의 밀도는 올리고뉴클레오타이드의 밀도가 일정하고 각 종류의 항체 (즉, 다른 특이성을 가진 항체)의 밀도가 일정하도록 제어된다. 상기와 같이, 올리고뉴클레오타이드 (3180) (확대보기 (3165)로 표시)는 나중에 cDNA의 증폭 및 조작을 위한 프라이머 결합 부위와 같은 절편 (3166), 증폭 후에도 cDNA 분자의 정량화를 용이하게 하는 분자 태그 (때때로 "고유 분자 확인인자" 또는 UMI라고 함)를 포함하는 선택적 절편 (3167) 및 세포에서 방출된 mRNA의 포획을 가능하게 하는 폴리T 절편과 같은 절편 (3168)을 포함한다. UMI (3167)는 무작위 뉴클레오타이드 절편을 포함할 수 있다. 항체 (3191) (확대도 (3165)로 표시)는 DNA 표지 (3190) (항체의 하나 이상의 아미노산에 부착됨) 및 항체가 특이적인 단백질을 확인하는 서열 확인인자를 포함하는 절편 (3192)을 포함한다. 어레이 (3164)에 조직의 절편 또는 얇은 층 (3181) (예를 들어, 100 내지 1000 μm 두께)을 배치한 다음 (i) 대상 세포 또는 하위 조직과 같은 특징을 확인하고 이러한 정보를 평면 어레이 (3164)의 위치에 기록 및/또는 연관시키고 (ii) 조직에 세포를 투과성화하여, mRNA와 단백질이 방출되고 분포되고 올리고뉴클레오타이드 및 항체 (각각 3180 및 3191)에 의해 포획되도록 처리한다 (3169). 영상 정보는 공통 위치 태그가 cDNA 또는 항체 DNA에서 합성되는 어레이 (3164)의 영역을 규정하는데 사용될 수 있다. 처리에는 조직 특이적 또는 생체분자 특이적 화합물 또는 염료로 염색하는 단계가 포함될 수 있다. 위치 태그를 사용하면 항체에 부착된 cDNA 및 DNA를 대량으로 수확하고 시퀀싱할 수 있지만 위치 태그에 의해 조직의 특정 영역과 연관될 수 있다. 위의 단계 (i) 및 (ii) 후, 포획된 mRNA (3170)를 주형으로 사용하여 cDNA (3171)를 합성하기 위해 역전사 효소 반응용 시약을 적용한다. 고정된 항체 (3192)와 동일한 분자 (3193)에 2차 항체 (3197)를 결합시켜 포획 샌드위치 (샌드위치 ELISA 분석에서와 같음)를 형성하기 위해 어레이에 적용한다. 2차 항체 (3197)는 하나 이상의 아미노산에 부착된 DNA 표지 (3194) 및 항체가 특이적인 단백질을 확인하는 서열 확인인자를 포함하는 절편 (3195)을 포함한다. 고정된 항체 (3191)의 확인인자 절편 (3192) 및 2차 항체의 확인인자 절편 (3195)은 동일하거나 상이할 수 있지만 동일한 단백질 (3193)을 인식하는 항체 쌍과 연관되어 확인된다. 또한, 중합효소 연장 단계에서 DNA 항체 가닥 (3196)을 합성하기 위해 고정된 항체의 DNA 표지 (3190)과 2차 항체의 DNA 표지 (3194)의 3' 영역은 상보적이다. 표면에 부착된 상이한 cDNA 및 항체 DNA의 패턴을 갖는 어레이 (3164)를 남기고 조직 절편 (3181)을 제한된다. 상이한 위치의 상이한 cDNA 및 항체 DNA는 합성 시약의 잉크젯 전달에 의해 정규 위치로부터 cDNA 및 항체 DNA의 샘플에 위치 태그 (3173) 및 조작 절편 (3174)을 부착함으로써 확인 및 정량화될 수 있다.

도 1i는 특정 대상 어레이 (164)의 특정 표면적 (즉, 하위영역)에 분석을 집중하기 위한 실시형태를 예시한다. 도 1f에 기재된 절차를 따른 후, 시퀀싱 분석 (4169)의 제1 통과는 대상 특정 표면적 (4172)이 더 나은 공간 시퀀싱 해상도가 필요하다는 것을 나타낼 수 있다. 동일한 어레이를 사용하지만 오프셋 피치 (offset pitch) (4170)를 사용하는 합성 시약의 잉크젯 전달의 제2 통과는 초기 합성 위치 (4182)로 태깅되지 않은 영역에 추가 합성 위치 (4183)를 생성하는데 사용된다. 이 추가 태깅 단계 동안 다른 위치 태그 (4175)가 초기 위치 태그 (4173)와 비교하여 합성된다. DNA의 조작 및 시퀀싱을 용이하게 하기 위해 추가 절편 (4174 및 4176)이 첨가될 수 있다. 흥미롭게도, 동일한 어레이 (4171)에서 합성 시약의 잉크젯 전달의 후속 통과는 시퀀싱의 공간 해상도를 증가시킴으로써 분석을 더욱 세분화하기 위해 그 이상으로 수행될 수 있다. 또한, 이 집중 분석 방법은 올리고뉴클레오타이드 어레이 (도 1f) 또는 올리고뉴클레오타이드 및 항체 어레이 (도 1h) 모두에 동일하게 적용할 수 있다.

도 1f 내지 도 1i가 고체 표면에 부착된 포획 올리고뉴클레오타이드 어레이의 사용이 필요할지라도, 본 발명의 방법은 필수적으로, 대상 분석물, 예를 들어 mRNA 또는 항체 바코드를 분포시키고, 어레이에 부착된 포획 프로브에 의해 포획할 필요 없이 조직에서의 직접적인 합성을 가능하게 한다. 일부 실시형태에서, 위치 태그의 합성은 사전 투과성화 여부에 관계없이 조직 절편에서 직접 이루어질 수 있다. 예로서, 이러한 실시형태는 다음 단계: (a) 결합 조건 하에서 조직 절편에 각각이 다수의 단백질 중 상이한 하나에 특이적으로 결합할 수 있는 다수의 항체를 배치하는 단계로서, 각각의 상이한 항체는 방출 가능하게 부착된 항체 바코드를 갖고, 항체 바코드는 유리 3'-히드록실을 갖는 개시인자를 포함하는 단계; (b) 조직 절편의 소정의 위치에서 다수의 사이클 동안 (i) 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편을 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소와 접촉시켜, 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 개시인자 또는 연장된 단편을 연장시켜 3'-O-차단된 연장된 단편을 형성하는 단계, 및 (ii) 연장된 단편을 효소적으로 탈차단하여 유리 3'-히드록실을 갖는 연장된 단편을 형성함으로써, 각각의 상이한 위치에서 방출 가능하게 부착된 항체 바코드 상에 상이한 위치 태그를 합성하여 위치 태그-항체 바코드 접합체를 형성하는 단계를 반복하는 단계; (c) 위치 태그-항체 바코드 접합체를 방출하는 단계; 및 (d) 방출된 위치 태그-항체 바코드 접합체를 시퀀싱하여 조직 절편에서 다수의 단백질의 공간 분포를 결정하는 단계에 의해 수행될 수 있다. 일부 실시형태에서, 조직 절편의 세포를 투과성화하는 단계는 세포내 단백질 표적을 노출시키거나 세포내 mRNA에 직접 위치 태그를 합성하기 위해 포함될 수 있다.

도 1f 내지 도 1i에 기재된 실시형태는 다음 단계: (a) 고체 표면에 배치된 조직 절편으로부터 생체분자를 포획하는 단계로서, 각 생체분자는 포획되고 유리 3'-히드록실을 갖는 생체분자를 확인하는 올리고뉴클레오타이드를 포함하거나 포함하도록 변형될 수 있는 단계; (b) 무주형 효소 합성에 의해 고체 표면상의 다수의 상이한 위치에서 올리고뉴클레오타이드의 유리 3'-히드록실상의 위치 태그를 합성하는 단계; 및 (c) 올리고뉴클레오타이드를 시퀀싱하여 조직 절편에서 생체분자의 공간 분포를 결정하는 단계에 의해 수행될 수 있다. 일부 실시형태에서, 예를 들어 상기 언급된 참조문헌에 기재된 통상적인 연결 화학 및 프로토콜을 사용하여 수행되는 올리고뉴클레오타이드를 방출하는 추가 단계. 일부 실시형태에서, 생체분자는 폴리뉴클레오타이드, 예를 들어 mRNA, RNA, 항체 바코드, 단백질 등이다. 생체분자는 고체 표면에 부착된 상보적 올리고뉴클레오타이드 또는 고체 표면에 부착된 항체에 의해 포획될 수 있다. 나중의 경우, 항체 결합 쌍 (예를 들어, ELISA에 사용됨)은 단백질 생체분자의 포획 후 고체 표면에 적용될 수 있다. 일부 실시형태에서, 결합 쌍의 항체 중 하나 또는 둘 모두는 위치 태그가 합성될 수 있는 올리고뉴클레오타이드 바코드를 가질 수 있다.

도 2a 내지 도 2d는 선택된 단백질 (또는 에피토프)의 발현이 특이적 항체 결합 화합물을 사용하여 측정되고 모든 또는 선택된 유전자의 발현이 모든 mRNA 또는 선택된 mRNA에 특이적인 프라이머를 사용하여 측정되는 실시형태에 대한 상기 개념을 예시한다. 두 부류의 프로브에서 부착된 올리고뉴클레오타이드 표지는 특이적으로 결합하는 화합물을 확인할 수 있을 뿐만 아니라 효소 합성을 위한 개시인자 역할을 할 수 있다. 도 2a는 "분할 및 혼합" 태그 합성 과정을 수행하기 위한 실시형태를 예시한다. 생존가능한 세포 집단 (200)은 항체 (및 그에 따른 표적 단백질)를 확인하고 개시인자 역할을 하는 올리고뉴클레오타이드 (202)로 각각 표지된 항체 세트 (204)와 조합된다. 세포 (200)를 공통 용기 (206)에서 조합한 다음 다중 웰 어레이 (212) 및 예를 들어, (210a)에서 하나의 A 확장, (210b)에서 하나의 G 확장, (210c)에서 하나의 C 확장 및 (210d)에서 하나의 T 확장과 같이 하나의 효소 연장 사이클이 수행되는 4개의 웰 (210a 내지 210d) 중 하나에 분포 (일반적으로 동일한 분량)시킨다. 추가된 뉴클레오타이드를 탈차단시킨 후, 세포 (200)를 수확하고 공통 용기 (206)에서 다시 조합한다. 길이가 증가하는 무작위 뉴클레오타이드 태그를 각 뉴클레오타이드 첨가에 의해 생성하여 n개가 첨가된 4ⁿ 태그를 생성한다. 세포 조작 및 손상 가능성을 최소화하기 위해 집단 (200)의 크기가 확인된 경우 고유한 태그를 갖는 세포의 가능성을 증가시키면서 세포 손상 또는 손실을 최소화하는 수로 사이클 수를 제한할 수 있다. 예를 들어, 집단 (200)이 10⁶개의 세포로 구성된 경우 10 내지 11 사이클에 의해 1-4 x 10⁶개의 고유한 태그가 생성된다. 일부 실시형태에서, 각 세포가 99 퍼센트 이상의 확률로 고유한 올리고뉴클레오타이드 태그를 전달하도록 보장하기 위해 다수의 사이클을 수행한다. 일부 실시형태에서, 실질적으로 모든 세포에 고유한 올리고뉴클레오타이드 태그 (218)를 제공하기 위해 다수의 사이클이 수행되면, 그 후 태그를 수확하고 대량 시퀀싱에 의해 분석할 수 있다 (예를 들어, 각 세포의 각 유전자 및 각 단백질의 발현은 표로 작성함). 도 2b에 예시된 바와 같이, 항체 또는 프라이머에 부착된 초기 올리고뉴클레오타이드는 분자 조작을 위한 다른 절편을 포함할 수 있다. 예를 들어, 항체 (230) 상의 올리고뉴클레오타이드 (232)는 항체 (230)의 특이성을 확인하기 위한 코드뿐만 아니라 PCR 증폭과 같은 추후 조작을 위한 추가 서열을 포함할 수 있는 절편 (234)을 포함할 수 있다. 올리고뉴클레오타이드 (232)는 또한 뉴클레오타이드 첨가의 초기 사이클을 위한 개시인자로 작용하는 유리 3'-히드록실을 갖는 절편 (236)을 포함한다. 부착된 태그 뉴클레오타이드 (238 및 239)에 대해 다수의 사이클이 수행된 후, 태그 및 단백질 또는 유전자 확인 서열의 조작 및 분석을 가능하게 하는 공통 절편 (235), 예를 들어 프라이머 서열을 부착하기 위해 분할 또는 혼합없이 추가 뉴클레오타이드를 추가할 수 있다. 일부 실시형태에서, 이는 부착된 올리고뉴클레오타이드를 증폭하여 앰플리콘 (amplicon; 233)을 형성함으로써 달성될 수 있으며, 그 후 고 처리량 DNA 시퀀싱에 의해 분석 (231)될 수 있다.

위에서 언급한 바와 같이, 세포는 무작위 뉴클레오타이드 서열로 구성되는 대신, 무작위 동종중합체 절편(homopolymeric segment)의 서열로 구성되는 유사한 무작위 바코드로 표지될 수 있으며, 각각의 동종중합체 절편은 가장 가까운 인접 동종중합체 절편 이외의 다른 종류의 뉴클레오타이드를 포함한다. 이러한 바코드화 체계의 장점은 3'-차단된 dNTP를 사용할 필요가 없고; 따라서 탈차단 단계가 필요하지 않으므로 합성 과정이 더 간단하고 잠재적으로 세포의 생존율에 대한 손상이 감소한다는 것이다. 이러한 바코드에 사용되는 동종중합체 절편의 길이는 매우 다양할 수 있다. 일부 실시형태에서, 반응 기간을 포함하는 조건은 동종중합체 절편의 평균 길이가 1 내지 100개의 뉴클레오타이드의 범위에 있도록 선택되고; 다른 실시형태에서, 동종중합체 절편의 평균 길이는 1 내지 25개 뉴클레오타이드 범위이고; 또 다른 실시형태에서, 동종중합체 절편의 평균 길이는 1 내지 10개 뉴클레오타이드 범위이다.

본 발명과 함께 사용되는 결합 화합물은 소정의 세포 성분에 특이적으로 결합하고 확인 올리고뉴클레오타이드를 생성하기 위해 개시인자가 부착될 수 있는 매우 다양한 조성물을 포함할 수 있다. 도 2c 및 도 2d는 생존가능한 세포 (도 2c) 및 세포내 성분에 대한 접근을 제공하기 위해 고정 및 투과성화된 세포 (도 2d)와 함께 사용될 수 있는 다양한 유형의 결합 화합물의 범위를 예시한다. 일반적으로 세포외 환경에 노출된 세포 항원 및/또는 성분만이 생존가능한 세포 (240)에서 접근할 수 있다. 따라서, 일부 실시형태에서, 결합 화합물은 상기 기재된 바와 같은 개시인자 올리고뉴클레오타이드 (242)로 표지된 항체 결합 화합물을 포함하고, 이 항체는 소정의 세포 표면 단백질 (예를 들어, 243a, 243b, 243c) 또는 막 프로브 (244)에 특이적이고, 친유성 모이어티와 같은 세포 표면 막 (245)에 삽입되는 막 특이적 성분 (248) 및 개시인자 올리고뉴클레오타이드 (246)를 포함한다. 도 2d에 예시된 바와 같이, 고정 및 투과성화된 세포 (280)는 투과성화 단계에서 생성된 기공 (281)을 통해 세포내 RNA (286) 및 세포내 단백질 (284)에 대한 접근을 제공하며, 혼성화 프로브를 포함하는 결합 화합물 (예를 들어, 285) 및 항체 결합 화합물 (287)이 각각 표적화될 수 있다. 일부 실시형태에서, 결합 화합물은 게놈 DNA의 혼성화 프로브를 포함할 수 있다.

일부 실시형태에서, 유리 3'-히드록실을 갖는 개시인자 올리고뉴클레오타이드는 예를 들어 다음 참조문헌: 문헌[Weber et al, Biomacromolecules, 15: 4621-4626 (2014); Bunge et al, Langmuir, 23(8): 4455-4464 (2007); Borjesson et al, J. Amer. Chem. Soc., 131(8): 2831-2839 (2009); Bunge et al, J. Phys. Chem. B, 113(51): 16425-16434 (2009)]; 및 유사 참조문헌에 개시된 바와 같은 통상적인 기술을 사용하여 개시인자 올리고뉴클레오타이드의 5' 말단을 친유성 모이어티로 유도체 화함으로써 표적 세포의 세포 표면 막으로 안정적으로 삽입된다. 특히 5' 말단에 한 쌍의 올리고뉴클레오타이드 (더 긴 개시인자 올리고뉴클레오타이드) 및 3' 말단에 다른 하나 (더 짧은 지지체 올리고뉴클레오타이드)의 친유성 모이어티로 각각 유도체화된 올리고뉴클레오타이드의 상보적 쌍의 삽입이 필요한 Weber (상기 인용)에 의해 개시된 기술이 주목된다. 혼성화된 쌍은 세포막에서 매우 안정하고 합성 중 손실이 최소화된다.

도 3a에 예시된 바와 같이, 일부 실시형태에서, 개시인자 올리고뉴클레오타이드 (300)는 유리 3'히드록실 및 5' 말단의 친유성 모이어티 (304)를 갖는 올리고뉴클레오타이드 (302)를 포함한다. 이러한 개시인자는 확장에 이용 가능한 유리 3'-히드록실에 의해 세포 표면 막의 지질 이중층에 안정적으로 삽입될 수 있다. 개시인자 올리고뉴클레오타이드 (300)는 개시인자 올리고뉴클레오타이드 (300)가 친유성 모이어티에 의해 세포 표면 막 (312)에 삽입 (310)되어 올리고뉴클레오타이드의 유리 3'-히드록실이 합성에 이용될 수 있도록 하는 조건 (308) 하에서 표적 세포 (306)와 조합된다. 이어서 세포 (314)는 본 발명의 방법에 의해 개시인자 (310)의 효소적 확장에 적용될 수 있다.

일부 실시형태에서, 개시인자 (310)의 효소적 확장은 도 3b에 예시된 바와 같이 "분할 및 혼합" 합성 전략에 의해 세포 (314) 상에 고유한 세포 특이적 바코드를 생성하기 위해 사용될 수 있다. 개시인자를 갖는 세포를 용기 (322)에 풀링 (pooling)하고 그 후 연속적인 뉴클레오타이드 첨가 사이클을 수행한다. 용기 (322)의 세포는 4개의 반응 챔버 (324a 내지 324d) 중에 분포 (323)되고, 부착된 개시인자 3'-O-차단된 dA, dG, dC 또는 dT의 유리 3'-히드록실에 각각 첨가된 후 이러한 첨가된 뉴클레오타이드는 다음 첨가 사이클을 위해 준비하기 위해 탈차단된다. 일부 실시예에서, 용기 (322)의 세포는 반응 챔버 중에 균등하게 분포되나, 대안적인 실시형태에서, 용기 (322)의 세포는 특정 위치에 뉴클레오타이드의 존재를 편중시키기 위해 반응 용기 (234a 내지 324d) 중에 균등하지 않게 분포될 수 있다. 다른 실시형태에서, 하나 초과의 첨가 사이클이 반응 챔버 (324a 내지 324d)에서 수행될 수 있으며, 이에 의해 예를 들어 2개 이상의 뉴클레오타이드가 첨가될 수 있다. 반응 챔버 (324a 내지 324d)는 고체 구조 (326)의 웰로 예시되어 있지만, 별도의 반응 튜브와 같은 별도의 반응 용기를 포함할 수 있다. 일부 실시형태에서, 반응 챔버 (324a 내지 324d)는 24-, 48-, 96-, 384- 또는 1536-웰의 통상적인 마이크로웰 플레이트의 웰을 포함할 수 있다. 예를 들어 96웰의 고용량 마이크로웰 플레이트에서, 예를 들어, 동시에 다수의 샘플을 바코드화하고 분석하기 위해 다중 합성을 병렬로 수행할 수 있다. 일부 실시형태에서, 뉴클레오타이드 첨가 및 탈보호의 사이클 후, 챔버 (324a 내지 324d)의 세포가 혼합 (328)되어 다음 뉴클레오타이드 첨가 단계에서 혼합물의 각 세포가 A, C, G 또는 T가 첨가될 확률이 동일하도록 한다. 이러한 실시형태에서, 이러한 "분할 및 혼합" 단계에 의해, 고유한 무작위 서열 올리고뉴클레오타이드가 세포막에 고정된 개시인자 상에 생성될 수 있다. 이러한 "분할 및 혼합" 단계는 첨가된 무작위 서열 올리고뉴클레오타이드가 용기 (322)의 집단의 각 세포가 고유한 서열과 연관될 수 있을만큼 충분히 길 때까지 계속될 수 있다 (330). 일부 실시형태에서, 고유 바코드가 형성된 후 (332), 공통 서열의 추가 뉴클레오타이드가 분할 및 혼합없이 합성될 수 있다. 이러한 공통 서열은 추후 분석을 위해 바코드를 조작하거나 증폭하기 위한 프라이머 결합 부위 등을 포함할 수 있다. 생성된 바코드화된 세포 (336)는 도 3c에 예시된 바와 같이 단일 세포 전사체 분석과 같은 적용에 사용될 수 있다. 비드 기반 바코드화(bead-based barcoding)를 사용한 대량 단일 세포 전사체 분석에 대한 지침은 다음 참조문헌: 문헌[Kolodziejczyk et al, Molecular Cell, 58: 610-620 (2015); Saliba et al, Nucleic Acids Research, 42(14): 8845-8860 (2014); Church et al, 미국 특허 공보 제 3013/0274117호; Macosko et al, Cell, 161: 1202-1214 (2015); Klein et al, Cell, 161: 1187-1201 (2015)] 등에 개시되어 있다. 일반적으로, 기술은 (i) 단일 세포를 포획 또는 단리하는 단계, (ii) 단일 세포를 용해시키는 단계, (iii) cDNA를 제조하기 위해 RNA를 역전사시키는 단계, (iv) cDNA를 증폭시키는 단계 및 (v) 시퀀싱하는 단계를 포함한다. 이러한 기술은 특히 단일 세포 및 단일 바코드 전달 비드를 포함하는 소적을 생성함으로써 cDNA에 세포 특이적 바코드를 부착하는 단계를 추가로 포함할 수 있다.

일부 실시형태에서, 고유한 올리고뉴클레오타이드 태그는 동종중합체 절편의 서열을 포함하는 태그를 부착함으로써 생존가능한 세포상에 합성될 수 있다. 일부 실시형태에서, 본 발명은 올리고뉴클레오타이드 바코드를 생존가능한 세포 상에 합성하는 방법으로서 다음 단계 (a) 세포의 세포 표면 분자에 부착되거나 세포의 세포 표면 막에 고정된 유리 3'-히드록실을 개시인자에 제공하는 단계; (b) 생물학적 조건 하에서 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편을 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소를 연장 조건 하에서 접촉시켜서, 동종중합체 절편에 의해 개시인자 또는 연장된 단편을 연장시킴으로써 유리 3'-O-히드록실을 갖는 연장된 단편을 형성하는 단계의 다수의 사이클을 반복하는 단계를 포함하고, 제1 단계 후 각 단계에서 첨가되는 뉴클레오사이드 트리포스페이트의 종류는 직전 단계의 종류와 상이한 방법에 관한 것이다. 일부 실시형태에서, 각각의 사이클은 비혼입 뉴클레오사이드 트리포스페이트를 제거하는 단계를 추가로 포함한다. 일부 실시형태에서, 연장 조건은 1 내지 100개 뉴클레오타이드 범위의 평균 길이를 갖는 동종중합체 절편을 생성하기 위한 온도, 반응 시간 및 상기 뉴클레오사이드 트리포스페이트의 농도를 포함한다. 일부 실시형태에서, 동종중합체 절편을 포함하는 고유한 올리고뉴클레오타이드 태그는 분할 및 혼합 절차를 사용하여 생성된다.

단일 세포 분석

본 발명의 일부 실시형태에서, 집단으로부터의 세포는 각각 단일 세포를 포함하는 반응기에 배치된다. 이는 당 업계, 예를 들어 문헌[Clarke et al, 미국 특허 공보 제 2010/0255471호; Mathies et al, 미국 특허 공보 제 2010/0285975호; Edd et al, 미국 특허 공보 제 2010/0021984호; Colston et al, 미국 특허 공보 제 2010/0173394호; Love et al, 국제 특허 공개 WO2009/145925; Muraguchi et al, 미국 특허 공보 제 2009/0181859호; Novak et al, Angew. Chem. Int. Ed., 50: 390-395 (2011); Chen et al, Biomed Microdevices, 11: 1223-1231 (2009)] 등에 공지된 다양한 대량 단일 세포 반응기 플랫폼에 의해 달성될 수 있으며, 상기 문헌은 본 명세서에 참조로 포함된다. 일 양상에서, 세포는 PCA 반응과 같은 반응이 일어나는 마이크로웰 어레이의 웰에 배치되고; 또 다른 양상에서, 세포는 유중수 에멀젼(water-in-oil emulsion)의 미셀(micelle)에 배치되며, 미셀은 반응기 역할을 한다. 예를 들어, 문헌[Mathies et al (상기 인용) 또는 Edd et al (상기 인용)]과 같이 미세유체 장치(microfluidics device)에 의해 생성된 미셀 반응기는 균일한 크기의 미셀이 대량 유화 공정보다 세포에 더 낮은 전단 및 응력으로 생성될 수 있기 때문에 특히 주목된다. 미셀에서 PCR과 같은 증폭 반응을 수행하는 단계를 포함하여 유화를 위한 조성물 및 기술은 다음 참조문헌: 문헌[Becher, "Emulsions: Theory and Practice," (Oxford University Press, 2001); Griffiths and Tawfik, 미국 특허 제 6,489,103호; Tawfik and Griffiths, Nature Biotechnology, 16: 652-656 (1998); Nakano et al, J. Biotechnology, 102: 117-124 (2003); Dressman et al, Proc. Natl. Acad. Sci., 100: 8817-8822 (2003); Dressman et al, 미국 특허 제 8,048,627호; Berka et al, 미국 특허 제 7,842,457호 및 제 8,012,690호; Diehl et al, Nature Method, 3: 551-559 (2006); Williams et al, Nature Method, 3: 545-550 (2006); Zeng et al, Analytical Chemistry, 82(8): 3183-3190 (2010); Micellula DNA Emulsion & Purification Kit instructions (EURx, Gdansk, Poland, 2011)] 등에서 찾을 수 있으며, 상기 문헌은 참조로 포함된다. 일 실시형태에서, 균일한 서열 태그 (예를 들어, 비드) 및 반응 혼합물의 혼합물을 생체 적합성 오일 (예를 들어, 경질 미네랄 오일, Sigma)의 방사 혼합물에 적가하고 유화되도록 한다. 다른 실시형태에서, 상동성 서열 태그 및 반응 혼합물은 생체 적합성 오일의 교차 흐름에 적가된다. 사용된 오일은 하나 이상의 생체 적합성 에멀젼 안정화제로 보충될 수 있다. 이러한 에멀젼 안정화제는 Atlox 4912, Span 80 및 기타 인정되고 상업적으로 입수 가능한 적합한 안정화제를 포함할 수 있다. 일부 실시형태에서, 에멀젼은 열 순환이 가능하도록 열에 안정하여 예를 들어, 적어도 94℃, 적어도 95℃, 또는 적어도 96℃까지의 열 순환을 가능하게 한다. 일부 실시형태에서, 형성된 소적은 약 5 마이크론 내지 약 500 마이크론의 크기 범위이다. 일부 실시형태에서, 소적은 약 10 마이크론 내지 약 350 마이크론, 또는 약 50 내지 250 마이크론, 또는 약 100 마이크론 내지 약 200 마이크론 범위로 형성된다. 유리하게는, 교차 흐름 유체 혼합에 의해 소적 형성 및 소적 크기의 균일성을 제어할 수 있다.

일부 실시형태에서, 이러한 반응기에서 이용 가능한 시약이 유사하게 증폭된 표적 핵산 및 서열 태그를 생성하도록 하는 부피의 균일한 분포를 갖는 미셀이 생성된다. 즉, 광범위하게 다양한 반응기 부피, 예를 들어 미셀 부피는 증폭 실패 및/또는 다양한 증폭 정도를 야기할 수 있다. 이러한 실패 및 변이는 집단의 개별 세포에서 예를 들어 유전자 발현 차이와 같이 표적 핵산의 정량적 비교의 수행 난점을 배제하거나 증가시킬 것이다. 일 양상에서, 변이 계수 (CV)가 30 퍼센트 이하인 부피 분포를 갖는 미셀이 생성된다. 일부 실시형태에서, 미셀은 CV가 20 퍼센트 미만인 부피 분포를 갖는다.

샘플 및 상동성 서열 태그의 세포는 반응기 배치 전에 반응 혼합물에 현탁될 수 있다. 일 양상에서, 반응 혼합물은 PCA 반응 혼합물이고, 적어도 한 쌍의 내부 (또는 연결) 프라이머 및 적어도 한 쌍의 외부 프라이머를 갖는 PCR 반응 혼합물과 실질적으로 동일하다. 예를 들어 문헌[Brown et al, Interface, 5: S131-S138 (2008)]과 같이, 반응 혼합물은 다음에 제한되는 것은 아니나, 열 안정성 제한 엔도뉴클레아제; 하나 이상의 프로테이나제 억제제; 단리된 세포의 표적 핵산의 방출을 촉진하기 위한 용해제를 포함하는 하나 이상의 선택적 성분을 포함할 수 있다. 일부 실시형태에서, 세포 용해 단계는 증폭 반응 수행 전에 일정한 기간 동안 비이온성 세제, 예를 들어 0.1% Tween X-100의 존재 하에 95℃ 이상의 온도로 세포를 가열함으로써 달성될 수 있다. 일 실시형태에서, 이러한 승온 기간은 10 내지 20분일 수 있다. 대안적으로, 세포 용해 단계는, 예를 들어 비이온성 세제, 예를 들어 0.1% Tween X-100의 존재 하에 15분 동안 96℃ 후 10분 동안 10℃의 가열 및 냉각의 하나 이상의 사이클에 의해 달성될 수 있다. 일부 실시형태에서, 미셀 반응기는 아래에서 보다 상세하게 기재되는 바와 같이 미세유체 장치에서 생성되고 분류된다.

단일 세포 전사체 분석

도 3c에서, 일부 실시형태에서, 바코드화된 단일 세포를 수성 미셀로 캡슐화하고 cDNA 라이브러리를 작제하기 위한 시약을 포함하는 일련의 미셀과 세포-포함 미셀을 결합하는 소적 기반 미세유체 장치 (345)를 사용하여 전사체 분석을 위해 바코드화된 세포 (340)를 제조할 수 있다. 대안적으로, 문헌[Abate et al, 국제 특허 공개 WO2019/139650]에 개시된 것과 같은 비-미세유체 방법을 사용하여 세포-포함 미셀을 생성하고 시약을 이러한 미셀에 전달할 수 있다. 개시인자-바코드 접합체 (344)가 세포 표면 막에 포매된 세포 (340)를 pH, 염 농도 및 세포의 완전성을 유지하기 위해 필요한 기타 성분을 가질 수 있는 수용액 (342)의 챔버 (343)에 배치한다. 챔버 (343)로부터 세포 (340) 및 수용액 (342)은 통로 (351)를 통해 접합부 (353)로 이동하여 합류 오일 흐름 (350)이 수성 미셀 (346)을 형성하며, 그중 일부는 단일 세포를 포함한다. 이러한 소적 기반 미세유체 장치는 잘 알려진 설계 및 기술을 사용하여 작제될 수 있다. 예를 들어, 다음 참조문헌은 이러한 미세유체 장치의 설계 및 구현에 대한 지침을 제공한다: 문헌[Zare et al, Ann. Rev. Biomed. Eng., 12: 187-201 (2010); Link, 미국 특허 공보 제 2012/0309002호; Shapiro et al, Nature Reviews Genetics, 14: 618-630 (2013); Kim et al, Anal. Chem., 90: 1273-1279 (2018); Abate et al, 미국 특허 공보 제 2017/0009274호; Zagnoni et al, chapter 2, Methods in Cell Biology, 102: 25-48 (2011); Zheng et al, Nature Comm., 8:14049 (2016); Link et al, 미국 특허 공보 제 2008/0014589호] 등.

세포 포함 미셀 (346)은 접합부 (352)에서 오일 흐름 (354) 중 시약 미셀 (348)과 결합하게 된다. 시약 미셀 (348)에는 세포 표면 막을 분해하여 mRNA를 전사 및 증폭을 위해 노출시키는 용해 시약이 포함되어 있다. 이러한 결합의 결과는 미셀 (356)이고, 통로 (360)를 통한 흐름 동안 인큐베이션되고, 이 길이는 미셀 (348)에 의해 전달되는 용해 시약이 세포의 용해를 완료하고 역전사 및 증폭을 위해 준비된 세포 용해물 (358)을 생성하기에 충분한 이동 시간을 제공하도록 설계되었다. 용해 시약은 다음 참조문헌: 문헌[Tang et al, Nature Protocol, 5(3): doi:10.1038/nprot.2009.236; Thronhill et al, Prenatal Diagnosis, 21: 490-497 (2001); Kim et al, Fertility and Sterility, 92: 814-818 (2009)] 등에 기재되어 있다. PCA 반응과 함께 사용하기 위한 예시적인 용해 조건은 다음과 같다: 1) 96℃에서 15분 후 10℃에서 15분 동안 H2O 중 세포; 2) 200 mM KOH, 50 mM 디티오테이톨, 10분 동안 65℃로 가열; 3) 4 μL 프로테아제 기반 용해 완충액: 1 μL의 17 μM SDS와 3 μL의 125 μg/mL 프로테이나아제 K를 조합한 다음 37℃에서 60분 후 95℃에서 15분 동안 인큐베이션 (프로테이나제 K의 불활성화); 4) 10 μL의 세제 기반 용해 완충액: 2 μL H2O, 2 μL 250 ng/μL 폴리A, 2 μL 10 mM EDTA, 2 μL 250 mM 디티오트레이톨, 2 μL 0.5% N-라우릴사르코신 염 용액. 단일 세포 분석 플랫폼, 인큐베이션 시간, 용해 완충액 및/또는 PCA 반응 기타 성분, 이의 농도, 반응 부피 등은 설계 선택 사항이며, 당업자는 특정 용도를 위해 이를 최적화한다. 일 실시형태에서, 문헌[Kim et al, Anal. Chem., 90: 1273-1279 (2018)]에 개시된 알칼리 용해 완충액이 사용된다. 이러한 완충액은 20 mM NaOH, 60% (v/v) PeG-200 및 2% (v/v) Triton X-100을 포함하며 RT-PCR 시약의 완충 용량에 의해 중화될 수 있다.

용해 후, 미셀 (358)의 세포 용해물은 오일 흐름 (364)으로부터의 시약 미셀 (362)과 접합부 (368)에서 결합된다. 시약 미셀에는 역전사 효소 및 PCR 반응 성분이 포함되어 있다. 일부 실시형태에서, 이러한 성분은 시판 RT-PCR 키트(kit), 예를 들어 ThermoFisher Invitrogen SuperScript IV One-Step RT-PCR 시스템의 성분을 포함할 수 있다. 일부 실시형태에서, 이러한 성분은 예를 들어 문헌[Trombetta et al, Curr. Protocol Mol. Biol., 107: 4.22.1-4.22.17 (2014)]의 주형-전환 전사 성분을 포함할 수 있다. 결합 후, 소적은 열 순환기와 같은 온도 제어 장치에 수집되어 역전사 효소의 열 변성 및 cDNA 및 바코드의 하위 서열 PCR을 가능하게 한다. 역전사 반응의 다른 실시형태가 도 4a 및 도 4b에 예시되어있다. 도 4a에서, 폴리T 프라이머 (402)는 mRNA (400)에 어닐링되고 확장 (406)되어 제1 DNA 가닥 (405) (서열번호 17)을 형성한다. mRNA 주형 (400) 제거 후 유전자 특이적 프라이머 (408)는 어닐링되고 확장되어 cDNA를 완료한다. 프라이머 (408)는 후속 조작 및 시퀀싱을 위한 준비를 위해 프라이머 결합 부위와 같은 공통 서열을 포함하는 5' 꼬리 (410)를 포함할 수 있다. 도 4b에서, 예를 들어 문헌[Zhu et al, Biotechniques, 30(4): 892-897 (2001)]의 단일 세포 cDNA 라이브러리를 생성하는데 사용될 수 있는 주형-전환 방식이 예시된다. 주형 (422)은 mRNA (420)에 어닐링되고 MMLV와 같은 역전사 효소로 확장 (424)되어 RNA 주형의 말단에 도달 후 선택된 뉴클레오타이드 (426)를 주형없이 제1 cDNA 가닥의 3' 말단에 첨가한다. 이에 의해 어댑터 (adaptor; 428)가 어닐링되고 무주형 첨가되고 확장 (432)되고 제2 가닥을 생성하여 cDNA (430)가 완료될 수 있다. 어댑터의 5' 절편 (428)은 나중에 증폭 및 고 처리량 시퀀싱을 위한 준비를 위한 공통 서열을 포함하도록 설계될 수 있다.

일부 실시형태에서, 주형-전환 역전사 후에, 중합효소 순환 조립 반응이 각 미셀에서 수행된다. 중합효소 순환 조립 (PCA) 반응에 의해 다수의 핵산 단편은 함께 융합되어 하나 이상의 단편 어닐링 및 중합효소 확장 사이클에서 단일 융합 산물을 형성할 수 있으며, 이는 예를 들어 문헌[Xiong et al, FEBS Micro biol. Rev., 32: 522-540 (2008)]과 같다. PCA 반응은 다양한 형식으로 이루어진다. 하나의 대상 형식에서, PCA는 공통 반응 부피에서 발생하는 다수의 중합효소 연쇄 반응 (PCR)에 따르며, 각 성분 PCR은 반응에서 생성된 앰플리콘의 가닥이 다른 앰플리콘의 가닥에 어닐링되고 확장되어 융합 산물 또는 융합 산물의 전구체가 형성될 수 있도록 하는 적어도 하나의 연결 프라이머를 포함한다. 다양한 형식 (및 다양한 대체 명칭 하)의 PCA는 단편 조립 및 유전자 합성을 위한 잘 알려진 방법이고, 다수의 형식이 다음 참조문헌: 문헌[Yon et al, Nucleic Acids Research, 17: 4895 (1989); Chen et al, J. Am. Chem. Soc., 116: 8799-8800 (1994); Stemmer et al, Gene, 164: 49-53 (1995); Hoover et al, Nucleic Acids Research, 30: c43 (2002); Xiong et al, Biotechnology Advances, 26: 121-134 (2008); Xiong et al, FEBS Microbiol. Rev., 32: 522-540 (2008)] 등에 기재되어 있다.

도 4c는 동일한 세포 특이적 바코드를 각 cDNA에 부착하기 위한 PCA의 사용을 예시한다. "X" DNA (462)는 프라이머 결합 부위에 측접한 효소적으로 합성된 바코드 서열일 수 있다. 프라이머 (470) 및 (471)은 각각 바코드 및 cDNA의 공통 서열에 어닐링되며 상보적인 5' 꼬리를 가지고 있다.

상이한 다중 표적 핵산, 예컨대 cDNA (460), g₁, g₂, . . . g_n은 동일한 바코드 핵산인 X (462)에 연결되어 (464) 다중 융합 산물 X-g₁, X-g₂, X-g_K(566)을 형성한다. 일부 실시형태에서, 이러한 다수는 2 내지 10000이고; 다른 실시형태에서, 이는 2 내지 1000이고; 또 다른 실시형태에서, 이는 2 내지 100이다. 이들 실시형태의 PCA 반응에서, 내부 프라이머 (468)의 농도는 다양한 g_i 핵산의 내부 프라이머 (예를 들어 471)의 농도보다 더 클 수 있어 적절한 많은 양의 X 앰플리콘이 g_i 앰플리콘의 많은 가닥과 어닐링된다. 본 발명의 방법에 따르면, 융합 산물 (466)은 결합된 미셀의 반응 혼합물로부터 추출되고 시퀀싱될 수 있다.

일부 실시형태에서, 세포 특이적 바코드를 갖는 cDNA 라이브러리를 생성하는 방법은 (a) 집단의 각 세포 상에 고유한 올리고뉴클레오타이드 바코드를 합성하여 바코드화된 세포 집단을 형성하는 단계; (b) 중합효소 순환 조립 (PCA) 반응 혼합물 중 각각 단일 바코드화된 세포를 포함하는 다중 반응기에 바코드화된 세포를 배치하는 단계로서, PCA 반응 혼합물은 바코드화된 세포에 다수의 표적 핵산에 특이적인 하나 이상의 연결 프라이머 쌍 및 한 쌍의 외부 프라이머 및 올리고뉴클레오타이드 바코드를 포함하는 단계; (c) 반응기에서 PCA 반응을 수행하여 표적 핵산과 올리고뉴클레오타이드 바코드의 융합 산물을 반응기에 형성시키는 단계; 및 (d) 반응기로부터의 융합 산물을 시퀀싱하여 집단에서 각 세포의 표적 핵산을 확인하는 단계를 포함할 수 있다.

단일 세포 전사체 분석을 위한 대안적인 적용은 도 5에 예시되어 있다. 이 실시형태에서, 세포 (바코드 없음) (502)는 폴리T 비드 (역시 바코드 없음) (504)와 혼합되고 미세유체 장치 (508)의 챔버 (500)에서 수성 혼합물에 배치된다. 위에서 언급했듯이 예를 들어 문헌[Abate et al, 국제 특허 공개 WO2019/139650]과 같이 미세유체 장치에 의존하지 않는 접근 방식이 또한 적용될 수 있다. 수성 혼합물은 통로 (506)를 통해 접합부 (510)에서 오일 흐름 (512)으로 강제 유입되어 수성 소적이 형성되고, 그중 일부 (516)는 하나의 세포 (517a) 및 하나의 비드 (517b)를 포함한다. 그런 다음 이러한 소적은 접합부 (520)에서 세포 용해 시약을 포함하는 소적 (518)과 결합하여 세포가 용해되어 폴리A RNA를 방출하는 소적 (522)을 형성하며, 이는 비드 (517b)에 부착된 폴리T 프라이머에 어닐링된다. mRNA와 같은 적절한 세포 성분을 방출하기 위한 적절한 인큐베이션 후, 용해물 포함 소적은 역전사 효소 시약, 예컨대 역전사 효소, 적절한 염 및 용해 반응에 의해 부여된 조건 (예를 들어, 높은 pH)에 대응하거나 이를 변경할 수 있는 완충 시스템을 포함하는 소적 (528)과 접합부 (530)에서 결합한다. 생성된 소적 (531)을 수집하고 (532) 인큐베이션하여 폴리A RNA가 비드 (517b)의 폴리T 프라이머에 어닐링되고 폴리T 절편의 역전사 효소 확장을 위한 주형 역할을 하여 비드 (517b)에 공유 결합에 의해 부착된 단일 세포 cDNA 라이브러리를 형성한다. 그런 다음 상기에 기재된 바와 같이 비드 (517b)를 소적으로부터 수집하고 조합하고 "분할 및 혼합" 합성을 거쳐 고 처리량 시퀀싱의 복제 및 준비와 같은 후속 조작을 위해 프라이머 결합 부위와 같은 추가 서열 및 고유한 바코드를 첨가할 수 있다.

명확하게 많은 다른 미세유체 장치 형태를 사용하여 전기 천공 법 등에 의해 미셀을 선택적으로 결합시킴으로써, 미셀에 시약을 선택적으로 첨가하거나, 단일 세포 및 소정의 수의 균일한 서열 태그, 예를 들어 하나의 균일한 서열 태그, 2개의 균일한 서열 태그를 포함하는 미셀을 생성할 수 있으며, 이는 문헌[Zagoni et al, chapter 2, Methods of Cell Biology, 102: 25-48 (2011); Brouzes, chapter 10, Methods of Cell Biology, 102: 105-139 (2011); Wiklund et al, chapter 14, Methods of Cell Biology, 102: 177-196 (2011); Le Gac et al, chapter 7, Methods of Molecular Biology, 853: 65-82 (2012)]과 같다.

세포 또는 조직 고정 및 투과성화

일부 실시형태에서, 핵산 혼성화 프로브 및/또는 단백질 특이적 결합 화합물을 포함하는 결합 화합물에 연결된 개시인자는 세포내 단백질, 메신저 RNA 및/또는 게놈 DNA와 같은 세포내 표적으로 유도될 수 있다. 일부 실시형태에서, 세포는 이러한 세포내 표적에 특이적인 결합 화합물의 적용을 위해 고정되고 투과성화된다. 세포의 고정 및 투과성화는 유세포 분석에 사용되는 것과 같은 통상의 프로토콜에 의해 수행될 수 있다. 통상적으로 이러한 프로토콜은 고정제로 세포를 처리하는 단계에 이어 투과성화제(permeabilizing agent)로 세포를 처리하는 단계를 포함한다. 고정 단계는 일반적으로 세포내 세포 표적을 고정시키고, 세포 및 세포 이하 구조를 유지하고 모든 세포 및 세포 이하 구획에 대한 항체 및/또는 혼성화 프로브의 방해받지 않는 접근을 가능하게 한다. 다양한 고정제가 시판되고 있으며 올바른 방법 선택은 검사 표적의 특성과 사용되는 항체 및/또는 혼성화 프로브의 특성에 따라 달라진다. 고정 방법은 일반적으로 유기 용매 및 교차연결 시약의 2개의 종류가 있다. 알코올 및 아세톤과 같은 유기 용매는 지질을 제거하고 세포를 탈수시키면서 세포 구조에 단백질을 침전시킨다. 교차연결 시약 (예를 들어, 파라포름알데하이드)은 일반적으로 유리 아미노기를 통해 분자간 가교를 형성하여 연결된 항원의 네트워크를 형성한다. 교차연결제는 유기 용매보다 세포 구조를 더 잘 보존하지만 일부 세포 성분의 항원성을 감소시킬 수 있으며 항체 및/또는 혼성화 프로브가 세포내 표적에 접근할 수 있도록 투과성화 단계를 추가해야 한다. 예시적인 고정 및 투과성화 단계는 다음에 제한되는 것은 아니나, 메탄올-아세톤 고정 (-20℃에서 10분 동안 냉각된 메탄올에 고정; -20℃에서 1분 동안 냉각된 아세톤으로 투과성화); 파라포름알데하이드-Triton 고정 (10 내지 20분 동안 3 내지 4% 파라포름알데하이드에 고정; 인산염 완충 식염수 (PBS)로 세정; 0.5% Triton X-100으로 2 내지 10분 동안 투과성화); 파라포름알데하이드-메탄올 고정 (10 내지 20분 동안 3 내지 4% 파라포름알데하이드에 고정, PBS로 세정, -20℃에서 5 내지 10분 동안 냉각된 메탄올로 투과성화)을 포함한다. 투과성화제는 다음에 제한되는 것은 아니나, 세제 사포닌(detergent saponin), Triton X-100, Tween-20, NP40을 포함한다. 투과성화제는 또한 프로테이나제 K, 스트렙톨리신 O 등과 같은 프로테이나제를 포함할 수 있다.

사용자 지정 적용을 위한 키메라 효소 및 화학적 합성 폴리뉴클레오타이드

의학 및 생물학에서 자주 사용되는 산물은 모든 상황에서 사용될 수 있는 성분와 특정 적용을 위해 새로 제공되어야 하는 성분을 포함하며, 후자의 성분은 때때로 "사용자 지정" 또는 "사용자 결정" 성분으로 지칭된다. 많은 핵산 시약이 이러한 특성을 가지고 있다. 특히, 표지된 혼성화 프로브의 공통 성분은 대량으로 제조될 수 있으며 작동 가능한 분석을 획득하기 위해 특정 성분, 예를 들어 대상 핵산 표적에 혼성화하는 프로브의 표적 특이적 성분을 제공해야 하는 사용자를 위한 키트로 제공될 수 있다. 상기 형식으로 제공되는 예시적인 기술은 다음에 제한되는 것은 아니나, Taqman 프로브, CRISPR 가이드 서열, 다양한 종류의 PCR 프로브 등을 포함하며, 이는 본 발명의 방법을 사용하여 통상의 화학적으로 합성된 올리고뉴클레오타이드 및 효소적 사용자 지정 올리고뉴클레오타이드의 조합으로 작제될 수 있다. 도 6은 taqman 프로브 또는 taqman 프로브에 대한 전구체를 포함하는 이러한 키메라 산물의 간단한 예이다. 5' 말단에 부착된 개시인자 올리고뉴클레오타이드 (604)를 갖는 고체 지지체 (602)를 포함하는 산물 (600)은 성분이 모든 특이적 프로브 설계에 사용되기 때문에 유기 화학 기술을 사용하여 중심부에 대량 생성될 수 있다. 이 실시형태에서, 개시인자 올리고뉴클레오타이드는 절단 가능한 뉴클레오타이드 "X" (605) 및 모이어티 "R₁" (603)을 포함하여 "X"에 멀리 존재하는 뉴클레오타이드를 포함하며, 이는 공여체 또는 수용체 표지를 부착하는데 사용할 수 있는 클릭 화학 쌍의 구성원과 같은 표지, 예를 들어 형광 공여체 또는 소광제(quencher) 또는 반응성 기일 수 있다. 일부 실시형태에서, R₁은 염기, 예를 들어 엑소사이클릭 아민에 부착된다. 산물 (600)은 사용자가 자신에게 특별한 대상 표적에 대한 taqman 프로브를 생성하기 위한 키트의 성분일 수 있다. 산물 (600)의 개시인자 올리고뉴클레오타이드의 3' 말단까지, 사용자는 R₁과 함께 작용하는 상보적 공여체 또는 소광제일 수 있거나, R₂는 이러한 표지의 용이한 부착을 가능하게 하는 R₁의 것과 직교하는 클릭 화학 쌍의 구성원과 같은 반응성 기일 수 있는 모이어티 "R₂" (607)를 갖는 뉴클레오타이드를 포함할 수 있는 서열 특이적 확장 (608)을 합성할 수 있다. 합성이 완료된 후, 확장된 올리고뉴클레오타이드는 지지체 (602)로부터 절단 (610)되어 taqman 프로브 (614)를 제공하고 폐기될 수 있는 지지체 (612)를 사용할 수 있다.

단일 가이드 RNA (sgRNA)를 제공하기 위해 유사한 키트를 제조할 수 있다: i) T7 프로모터가 포함된 개시인자 서열이 부착된 비드; ii) 사용자는 비드가 있는 키트를 구입하고, 선호하는 표적 특이적 서열 + 개시인자의 말단의 5' 스캐폴드 도메인의 20 내지 25 nt를 합성하고; iii) 합성이 완료되면 (a) 여전히 비드에 부착된 올리고뉴클레오타이드에 상보적인 3' 스캐폴드 도메인을 어닐링하고, (b) 프라이머 확장이 dsDNA를 생성할 수 있게 하고, (c) 역전사를 가능하게 하여 sgRNA 분자를 생성한다.

키트

본 발명은 본 발명의 방법을 수행하기 위한 키트를 포함한다. 일부 실시형태에서, "키트"는 본 발명의 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 임의의 전달 시스템을 지칭한다. 반응 분석과 관련하여, 이러한 전달 시스템은 반응 시약 (예를 들어, 적절한 용기 내의 프로브, 효소 등) 및/또는 지지 물질 (예를 들어, 분석 수행을 위한 완충액, 설명서 등)의 한 위치에서 다른 위치로의 저장, 수송 또는 전달을 가능하게 하는 시스템을 포함한다. 예를 들어, 키트에는 관련 반응 시약 및/또는 지지 물질이 포함된 하나 이상의 용기 (예를 들어, 상자)가 포함된다. 이러한 내용물은 의도된 수용체에게 함께 또는 개별적으로 전달될 수 있다. 예를 들어, 제1 용기에는 분석에 사용하기 위한 효소가 포함될 수 있으며, 제2 용기에는 프로브가 포함된다.

일부 실시형태에서, 본 발명의 키트는 무주형 중합효소를 포함한다. 일부 실시형태에서, 무주형 중합효소는 말단 데옥시뉴클레오타이드 전이 효소 (TdT) 또는 이의 변이체이다. 이러한 일부 키트에서 무주형 중합효소는 3'-O 차단된 뉴클레오타이드를 포함한다. 폴리뉴클레오타이드 또는 cDNA를 확장하기 위한 키트의 추가 실시형태에서, 키트는 개시인자가 있는 고체 지지체를 포함할 수 있다.

일부 실시형태에서, 무작위 올리고뉴클레오타이드 바코드를 합성하기 위한 본 발명의 키트는 TdT 또는 이의 변이체, 3'-O-차단된 뉴클레오사이드 트리포스페이트, 바코드의 분할 및 혼합 합성을 위한 확장 및 탈차단 반응을 수행하기 위한 마이크로웰 어레이를 포함한다.

일부 실시형태에서, 키트는 단일 세포를 처리하고 여기에 시약을 전달하기 위한 미세유체 장치를 포함할 수 있다.

일부 실시형태에서, 키트는 cDNA에서 고유한 올리고뉴클레오타이드 바코드를 합성하는 방법을 수행하기 위해 부착된 올리고뉴클레오타이드를 갖는 하나 이상의 고체 지지체를 포함할 수 있다. 일부 실시형태에서, 이러한 하나 이상의 고체 지지체는 비드를 포함하고; 다른 실시형태에서, 이러한 하나 이상의 고체 지지체는 포획 올리고뉴클레오타이드로 코팅된 표면을 갖는 평면 지지체를 포함한다.

정의

본 명세서에서 달리 구체적으로 규정되지 않는 한, 본 명세서에 사용된 핵산 화학, 생화학, 유전학 및 분자 생물학의 용어 및 기호는 예를 들어 Kornberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992); Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975); Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999)]과 같은 해당 분야의 표준 논문 및 텍스트에 따른다.

본 명세서에 사용된 "증폭하다", "증폭한다", "증폭된", "증폭"은 일반적으로 하나 이상의 카피가 표적 폴리뉴클레오타이드 또는 그의 일부로 제조되는 임의의 과정를 지칭한다. 폴리뉴클레오타이드 (예를 들어, DNA 및/또는 RNA)를 증폭하는 다양한 방법이 이용 가능하며, 그 일부 예가 본 명세서에 기재되어 있다. 증폭은 선형(linear), 지수적(exponential)일 수 있거나 다중 위상 증폭 과정에서 선형 및 지수 위상을 모두 포함할 수 있다. 증폭 방법은 열 변성 단계와 같은 온도 변화를 수반할 수 있거나 열 변성이 필요하지 않은 등온 과정일 수 있다. "앰플리콘"은 폴리뉴클레오타이드 증폭 반응의 산물을 의미하고; 즉, 하나 이상의 개시 서열로부터 복제되는 단일 가닥 또는 이중 가닥일 수 있는 폴리뉴클레오타이드의 클론 집단을 의미한다. "증폭"은 증폭 반응을 수행하여 앰플리콘을 생성하는 것을 의미한다. 하나 이상의 개시 서열은 동일한 서열의 하나 이상의 카피일 수 있거나, 상이한 서열의 혼합물일 수 있다. 바람직하게는, 앰플리콘은 단일 개시 서열의 증폭에 의해 형성된다. 앰플리콘은 다양한 증폭 반응에 의해 생성될 수 있으며, 그 산물은 하나 이상의 개시 또는 표적 핵산의 복제물을 포함한다. 일 양상에서, 앰플리콘을 생성하는 증폭 반응은 뉴클레오타이드 또는 올리고뉴클레오타이드인 반응물의 염기 쌍이 반응 산물의 생성에 필요한 주형 폴리뉴클레오타이드에 보체를 갖는다는 점에서 "주형 기반"이다. 일 양상에서, 주형 기반 반응은 핵산 중합효소를 사용한 프라이머 확장 또는 핵산 리가제와의 올리고뉴클레오타이드 결찰이다. 이러한 반응에는 다음에 제한되는 것은 아니나, 중합효소 연쇄 반응 (PCR), 선형 중합효소 반응, 핵산 서열 기반 증폭 (NASBA), 회전 환 증폭 등이 포함되고, 다음 참조문헌: 문헌[Mullis et al, 미국 특허 제 4,683,195호; 제 4,965,188호; 제 4,683,202호; 제 4,800,159호 (PCR); Gelfand et al, 미국 특허 제 5,210,015호 (real-time PCR with "taqman" probes); Wittwer et al, 미국 특허 제 6,174,670호; Kacian et al, 미국 특허 제 5,399,491호 ("NASBA"); Lizardi, 미국 특허 제 5,854,033호; Aono et al, 일본 특허 공개 JP 4-262799 (회전 환 증폭)] 등에 개시되어 있으며, 상기 문헌은 본 명세서에 참조로 포함된다. 일 양상에서, 본 발명의 앰플리콘은 PCR에 의해 생성된다. 증폭 반응이 진행됨에 따라 반응 산물이 측정될 수 있도록 하는 검출 화학이 이용 가능한 경우, 증폭 반응은 "실시간" 증폭, 예를 들어 하기에 기재된 "실시간 PCR" 또는 문헌[Leone et al, Nucleic Acids Research, 26: 2150-2155 (1998)] 및 유사 참조문헌에 기재된 바와 같은 "실시간 NASBA"일 수 있다. 본 명세서에 사용된 용어 "증폭"은 증폭 반응을 수행하는 것을 의미한다. "반응 혼합물"은 반응을 수행하는데 필요한 모든 반응물을 포함하는 용액을 의미하며, 다음에 제한되는 것은 아니나, 반응 중에 선택된 수준에서 pH를 유지하기 위한 완충제, 염, 보조 인자, 스캐빈저(scavenger) 등을 포함할 수 있다.

"결합 화합물"은 일부 실시형태에서, 비 핵산 리간드(non-nucleic acid ligand)에 특이적으로 결합할 수 있는 것으로, 확인을 위해 올리고뉴클레오타이드 태그가 부착될 수 있는 임의의 분자를 의미한다. 결합 화합물은 다음에 제한되는 것은 아니나, 항체 또는 항체로부터 유래된 화합물, 예를 들어, Fab 단편을 포함한다. 비 핵산 리간드는 다음에 제한되는 것은 아니나, 단백질을 포함한다. 일부 실시형태에서, 결합 화합물은 고체 지지체의 표면에 부착, 예를 들어 공유 결합에 의해 부착된다. 일부 실시형태에서, 올리고뉴클레오타이드 태그는 결합 화합물에 방출 가능하게 부착되고; 즉, 이는 소정의 조건, 예를 들어 빛, 높은 pH, 낮은 pH, 특정 산화 환원 조건, 특정 전위 등에 의해 선택적으로 절단될 수 있는 결합을 포함하는 연결에 의해 부착된다.

2개 이상의 상이한 TdT에서 아미노산 위치와 관련하여 "기능적으로 균등한"은 (i) 각 위치의 아미노산이 TdT의 활성에서 동일한 기능적 역할을 하고 (ii) 각각의 TdT의 아미노산 서열에서 상동성 아미노산 위치에 해당 아미노산이 존재하는 것을 의미한다. 서열 정렬 및/또는 분자 모델링을 기반으로 하여 2개 이상의 상이한 TdT의 아미노산 서열에서 위치적으로 균등하거나 상동성인 아미노산 잔기를 확인하는 것이 가능하다. 일부 실시형태에서, 기능적으로 균등한 아미노산 위치는 진화적으로 관련된 종, 예를 들어, 속, 과 등의 TdT의 아미노산 서열 사이에 보존되는 서열 모티프에 속한다. 이러한 보존된 서열 모티프의 예는 문헌[Motea et al, Biochim. Biophys. Acta. 1804(5): 1151-1166 (2010); Delarue et al, EMBO J., 21: 427-439 (2002)]; 및 유사 참조문헌에 기재되어 있다.

본 명세서에서 상호 혼용되는 "미세유체" 장치 또는 "나노유체" 장치는 각각 샘플 (이는 결과적으로 대상 세포 또는 분자 분석물을 포함할 수 있거나 포함함), 시약, 희석제, 완충액 등을 포함하는 소량의 유체를 포획, 이동, 혼합, 분포 또는 분석하기 위한 혼입 시스템을 의미한다. 일반적으로 "미세유체" 및 "나노유체"에 대한 언급은 장치의 크기와 처리되는 유체의 부피가 다른 척도를 나타낸다. 일부 실시형태에서, 미세유체 장치의 특징은 단면 치수가 수백 제곱 마이크로미터 미만이고 모세관 치수가, 예를 들어 약 500 ㎛ 내지 약 0.1 ㎛의 최대 단면 치수를 갖는 통로 또는 채널을 갖는다. 일부 실시형태에서, 미세유체 장치는 1 μL 내지 수(a few) nL, 예컨대 10 내지 100 nL 범위의 부피 용량(volume capacity)을 갖는다. 나노유체 장치에서 해당 기능 또는 구조의 치수는 일반적으로 미세유체 장치의 치수보다 1 내지 3배 더 작다. 당업자는 특정 적용의 상황으로부터 적절한 치수를 인식할 것이다. 일부 실시형태에서, 미세유체 또는 나노유체 장치는 지지 기능, 예컨대 샘플 도입, 유체 및/또는 시약 유도 수단, 예컨대 양압 또는 음압, 음향 에너지 등, 온도 제어, 검출 시스템, 데이터 수집 및/또는 혼입 시스템 등을 제공하는 기구 또는 기기와 함께 또는 단독의 상호 연결되고 유체 유통하며 하나 이상의 분석 반응 또는 과정을 수행하도록 설계된 하나 이상의 챔버, 포트 및 채널을 갖는다. 일부 실시형태에서, 미세유체 및 나노유체 장치는 밸브, 펌프, 필터 및 샘플 성분 또는 반응물의 흡착을 방지하고, 전기 삼투 등에 의한 시약 이동을 촉진하기 위한 내부 벽 상의 특수 기능성 코팅을 추가로 포함할 수 있다. 이러한 장치는 유리, 플라스틱 또는 기타 고체 중합체 물질일 수 있는 고체 기판에 혼입된 장치로 제조될 수 있으며, 특히 광학 또는 전기화학적 방법을 통해 샘플 및 시약 이동을 쉽게 검출하고 모니터링하기 위해 평면 형식을 가질 수 있다. 일부 실시형태에서, 이러한 장치는 1회 사용 후 일회용이다. 일부 실시형태에서, 미세유체 및 나노유체 장치는 경유와 같은 비혼화성 유체에 침지된 수성 소적과 같은 소적의 이동, 혼합, 분포 및 분석을 형성하고 제어하는 장치를 포함한다. 미세유체 및 나노유체 장치의 제조 및 작동은 다음 참조문헌: 문헌[Ramsey, 미국 특허 제 6,001,229호; 제 5,858,195호; 제 6,010,607호; 및 제 6,033,546호; Soane et al, 미국 특허 제 5,126,022호 및 제 6,054,034호; Nelson et al, 미국 특허 제 6,613,525호; Maher et al, 미국 특허 제 6,399,952호; Ricco et al, 국제 특허 공개 WO 02/24322; Bjornson et al, 국제 특허 공개 WO 99/19717; Wilding et al, 미국 특허 제 5,587,128호; 제 5,498,392호; Sia et al, Electrophoresis, 24: 3563-3576 (2003); Unger et al, Science, 288: 113-116 (2000); Enzelberger et al, 미국 특허 제 6,960,437호; Cao, "Nanostructures & Nanomaterials: Synthesis, Properties & Applications," (Imperial College Press, London, 2004); Haeberle et al, LabChip, 7: 1094-1110 (2007); Cheng et al, Biochip Technology (CRC Press, 2001)]; 등에 의해 예시된 바와 같이 당 업계에 잘 알려져 있으며, 상기 문헌은 참조로 포함된다.

상호 혼용되는 "돌연변이체" 또는 "변이체"는 본 명세서에 기재된 천연 또는 참조 TdT 폴리펩타이드로부터 유래되고, 하나 이상의 위치에 변형 또는 변이, 즉, 치환, 삽입 및/또는 결실을 포함하는 폴리펩타이드를 지칭한다. 변이체는 당 업계에 잘 알려진 다양한 기술에 의해 획득될 수 있다. 특히, 야생형 단백질을 인코딩하는 DNA 서열을 변이시키기 위한 기술의 예는 다음에 제한되는 것은 아니나, 부위 지정 돌연변이 유발, 무작위 돌연변이 유발, 서열 셔플링 및 합성 올리고뉴클레오타이드 작제를 포함한다. 돌연변이 유발 활성은 본 발명의 중합효소의 경우 또는 단백질 서열에 하나 또는 다수의 아미노산을 결실, 삽입 또는 치환하는 것으로 구성된다. 다음 용어는 치환을 지정하는데 사용된다: L238A는 참조 또는 야생형 서열의 위치 238의 아미노산 잔기 (류신, L)가 알라닌 (A)으로 변경됨을 나타낸다. A132V/I/M은 모 서열의 위치 132의 아미노산 잔기 (알라닌, A)가 다음 아미노산: 발린 (V), 이소류신 (I) 또는 메티오닌 (M) 중 하나로 치환됨을 나타낸다. 치환은 보존적 또는 비 보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산 (아르기닌, 리신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파르트산), 극성 아미노산 (글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산 (메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산 (페닐알라닌, 트립토판 및 티로신) 및 소형 아미노산 (글리신, 알라닌 및 세린) 기 내에 존재한다.

"중합효소 연쇄 반응" 또는 "PCR"은 DNA의 상보적 가닥의 동시 프라이머 확장에 의한 특이적 DNA 서열의 시험관내 증폭을 위한 반응을 의미한다. 다시 말해서, PCR은 프라이머 결합 부위에 측접하는 표적 핵산의 다중 카피 또는 복제물을 제조하기 위한 반응이고, 이러한 반응은 다음 단계: (i) 표적 핵산을 변성시키는 단계, (ii) 프라이머를 프라이머 결합 부위에 어닐링하는 단계, 및 (iii) 뉴클레오사이드 트리포스페이트의 존재 하에 핵산 중합효소에 의해 프라이머를 확장하는 단계 중 하나 이상을 반복하는 단계를 포함한다. 일반적으로 반응은 열 순환기 기기의 각 단계에 최적화된 다양한 온도를 통해 순환된다. 각 단계에서의 특정 온도, 기간 및 단계 간의 변화율은 다음 참조문헌: 문헌[McPherson et al, editors, PCR: A Practical Approach and PCR2: A Practical Approach (각각 IRL Press, Oxford, 1991 and 1995)]에 예시된 바와 같이 당업자에게 잘 알려진 많은 요인에 따라 달라진다. 예를 들어, Taq DNA 중합효소를 사용하는 통상 PCR에서 이중 가닥 표적 핵산은 90℃ 초과의 온도에서 변성될 수 있고, 프라이머는 50 내지 75℃ 범위의 온도에서 어닐링되고 프라이머는 72 내지 78℃ 범위의 온도에서 확장될 수 있다. 반응 부피는 일반적으로 수백 나노리터, 예를 들어 200 nL 내지 수백 μL의 범위, 예를 들어 200 μL이다.

"프라이머"는 폴리뉴클레오타이드 주형과 이중체를 형성할 때 핵산 합성의 개시점으로 작용하고 주형을 따라 3' 말단에서 확장되어 확장된 이중체를 형성할 수 있는 천연 또는 합성 올리고뉴클레오타이드를 의미한다. 확장 과정 동안 첨가된 뉴클레오타이드의 서열은 주형 폴리뉴클레오타이드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 중합효소에 의해 확장된다. 프라이머는 일반적으로 14 내지 36개 뉴클레오타이드 범위의 길이를 갖는다.

"폴리뉴클레오타이드" 및 "올리고뉴클레오타이드"는 상호 혼용되며 각각 뉴클레오타이드 단량체의 선형 중합체를 의미한다. 폴리뉴클레오타이드 및 올리고뉴클레오타이드를 구성하는 단량체는 왓슨-크릭 (Watson-Crick) 유형의 염기 쌍과 같은 단량체 대 단량체 상호작용의 규칙적인 패턴을 통해 천연 폴리뉴클레오타이드에 특이적으로 결합할 수 있다. 이러한 단량체 및 이들의 뉴클레오사이드 사이의 연결은 천연적으로 발생하거나 이의 유사체, 예를 들어, 천연 발생 또는 비 천연 발생 유사체일 수 있다. 비-천연 발생 유사체는 포스포로티오에이트 뉴클레오사이드 사이의 연결, 잠긴 핵산(locked nucleic acid), 표지의 부착을 가능하게 하는 연결기를 포함하는 염기, 예를 들어 형광단, 합텐, 또는 다른 올리고뉴클레오타이드 등을 포함할 수 있다. 올리고뉴클레오타이드 또는 폴리뉴클레오타이드의 사용이 중합효소에 의한 확장, 리가제에 의한 결찰 등과 같은 효소 처리가 필요한 경우, 당업자는 이러한 경우에 올리고뉴클레오타이드 또는 폴리뉴클레오타이드가 임의의 또는 일부 위치에서 뉴클레오사이드 사이의 연결, 당 모이어티 또는 염기의 특정 유사체를 포함하지 않을 것임을 이해할 것이다. 폴리뉴클레오타이드는 일반적으로 수 개의 단량체 단위, 예를 들어 이들이 일반적으로 "올리고뉴클레오타이드"로 지칭되는 경우, 5 내지 40개 내지 수천개의 단량체 단위의 범위의 크기이다. 폴리뉴클레오타이드 또는 올리고뉴클레오타이드가 "ATGCCTG"와 같은 문자의 서열 (대문자 또는 소문자)로 표시될 때, 문맥상 달리 언급되거나 명시되지 않는 한, 뉴클레오타이드는 좌측에서 우측으로 5'→ 3' 순이고 "A"는 데옥시아데노신을 나타내고, "C"는 데옥시시티딘을 나타내고, "G"는 데옥시구아노신을 나타내고, "T"는 티미딘을 나타내고, "I"는 데옥시이노신을 나타내며, "U"는 우리딘을 나타냄이 이해될 것이다. 달리 언급하지 않는 한, 용어 및 원자 번호 지정 규칙은 문헌[Strachan and Read, Human Molecular Genetics 2 (Wiley-Liss, New York, 1999)]에 개시된 규칙을 따른다. 일반적으로 폴리뉴클레오타이드는 포스포디에스테르 연결에 의해 연결된 4개의 천연 뉴클레오사이드 (예를 들어, DNA의 경우 데옥시아데노신, 데옥시시티딘, 데옥시구아노신, 데옥시티미딘 또는 RNA의 경우 리보스 대응물)를 포함하나; 이는 또한, 예를 들어 변형된 염기, 당, 또는 뉴클레오사이드 사이의 연결을 포함하는 비 천연 뉴클레오타이드 유사체를 포함할 수 있다. 당업자는 효소가 단일 가닥 DNA, RNA/DNA 이중체 등과 같이 활성을 위한 특이적 올리고뉴클레오타이드 또는 폴리뉴클레오타이드 기질 요건을 갖는 경우를 인식할 것이며, 특히 문헌[Sambrook et al, Molecular Cloning, Second Edition (Cold Spring Harbor Laboratory, New York, 1989)], 및 유사 참조문헌과 같은 논문의 지침에 따라 적절한 조성을 선택할 수 있다. 본 명세서에 사용된 "천연 폴리뉴클레오타이드"는 비 천연 포스페이트 연결, 당 또는 염기가 없는 리보뉴클레오타이드 또는 데옥시리보 뉴클레오타이드의 중합체를 의미한다. 일부 실시형태에서, 천연 폴리뉴클레오타이드는 보호 기 (예를 들어, 엑소사이클릭 아민 보호기), 링커 (표지를 염기에 부착하기 위한 기 포함), 또는 표지, 포획 모이어티 등을 갖는 폴리뉴클레오타이드를 제외한다. 일부 실시형태에서, 천연 폴리뉴클레오타이드는 자연으로부터 추출된 폴리뉴클레오타이드, 보호 기가 없는 화학적 또는 효소적으로 합성된 폴리뉴클레오타이드, 또는 지지체에 부착되거나 표지, 링커 또는 반응성 모이어티가 부착된 전술한 것 중 하나일 수 있다.

"서열 동일성"은 2개의 폴리펩타이드 서열 또는 2개의 폴리뉴클레오타이드 서열과 같은 2개의 서열 간의 매칭 (예를 들어, 동일한 아미노산 잔기)의 수 (또는 일반적으로 백분율로 표시됨)를 지칭한다. 서열 동일성은 서열 간격을 최소화하면서 중첩 및 동일성을 최대화하기 위해 정렬될 때 서열을 비교함으로써 결정된다. 특히, 서열 동일성은 2개의 서열의 길이에 따라 다수의 수학적 전체 또는 국소 정렬 알고리즘 중 임의의 것을 사용하여 결정될 수 있다. 유사한 길이의 서열은 바람직하게는 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전체 정렬 알고리즘 (예를 들어, Needleman 및 Wunsch 알고리즘; 문헌[Needleman and Wunsch, 1970])을 사용하여 정렬되며, 실질적으로 다른 길이의 서열은 바람직하게는 국소 정렬 알고리즘 (예를 들어, Smith 및 Waterman 알고리즘 (문헌[Smith 및 Waterman, 1981]) 또는 Altschul 알고리즘 (문헌[Altschul et al., 1997; Altschul et al., 2005)])을 사용하여 정렬된다. 아미노산 서열 동일성 퍼센트를 결정하기 위한 정렬은 예를 들어 http://blast.ncbi.nlm.nih.gov/ 또는 ttp://www.ebi.ac.uk/Tools/emboss/과 같은 인터넷 웹 사이트에서 이용 가능한 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당업계의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는데 필요한 임의의 알고리즘을 포함하여 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본 명세서의 목적을 위해, 아미노산 서열 동일성 % 값은 Needleman-Wunsch 알고리즘을 사용하여 2개의 서열의 최적 전체 정렬을 생성하는 양원 방식 서열 정렬 프로그램 EMBOSS Needle을 사용하여 생성된 값을 지칭하며, 모든 검색 매개변수는 디폴트 값으로 설정되고, 즉, 스코어링 매트릭스 = BLOSUM62, 갭 오픈 = 10, 갭 확장 = 0.5, 엔드 갭 페널티 = 거짓 값, 엔드 갭 오픈(end gap open) = 10 및 엔드 갭 확장(end gap extend) = 0.5.

"서열 태그" (또는 "태그") 또는 "바코드"는 폴리뉴클레오타이드 또는 주형 분자에 부착되고 반응 또는 일련의 반응에서 폴리뉴클레오타이드 또는 주형을 확인 및/또는 추적하는데 사용되는 올리고뉴클레오타이드를 의미한다. 서열 태그는 폴리뉴클레오타이드 또는 주형의 3' 또는 5' 말단에 부착될 수 있거나, 이러한 폴리뉴클레오타이드 또는 주형의 내부에 삽입되어 선형 접합체를 형성할 수 있으며, 이는 때때로 본 명세서에서 "태그된 폴리뉴클레오타이드" 또는 "태그된 주형" 또는 "태그-폴리뉴클레오타이드 접합체", "태그-분자 접합체" 등으로 지칭될 수 있다. 서열 태그는 크기와 조성이 크게 다를 수 있고; 본 명세서에 참조로 포함된 다음의 참조문헌은 특정 실시형태에 적합한 서열 태그 세트를 선택하기 위한 지침을 제공한다: 문헌[Brenner, 미국 특허 제 5,635,400호; Brenner and Macevicz, 미국 특허 제 7,537,897호; Brenner et al, Proc. Natl. Acad. Sci., 97: 1665-1670 (2000); Church et al, 유럽 특허 공보 0 303 459; Shoemaker et al, Nature Genetics, 14: 450-456 (1996); Morris et al, 유럽 특허 공보 0799897A1; Wallace, 미국 특허 제 5,981,179호] 등. 서열 태그의 길이 및 조성은 광범위하게 달라질 수 있으며 특정 길이 및/또는 조성의 선택은 제한 없이, 예를 들어 시퀀싱과 같이 혼성화 반응 또는 효소 반응을 통해 태그가 판독을 생성하는데 사용되는 방법; 이들이 예를 들어 형광 염료 등으로 표지되는지; 폴리뉴클레오타이드 세트 등을 명확하게 확인하는데 필요한 구별 가능한 올리고뉴클레오타이드 태그의 수, 및 신뢰할 수 있는 확인을 보장하기 위해 태그 세트가 얼마나 달라야 하는지, 예를 들어 교차 혼성화 또는 시퀀싱 오류로부터의 오확인(misidentification)으로부터의 자유를 포함하는 여러 요인에 따라 달라진다. 일 양상에서, 서열 태그는 각각 2 내지 36개 뉴클레오타이드, 또는 4 내지 30개 뉴클레오타이드, 또는 8 내지 20개 뉴클레오타이드, 또는 6 내지 10개 뉴클레오타이드 범위 내의 길이를 각각 가질 수 있다. 일 양상에서, 서열 태그 세트가 사용되며, 각각의 서열 태그 세트는 적어도 2개의 염기가 동일한 세트의 모든 다른 태그와 상이한 고유한 뉴클레오타이드 서열을 가지며; 또 다른 양상에서, 각각의 태그 세트의 서열이 동일한 세트의 모든 다른 태그의 서열과 적어도 3개의 염기가 상이한 서열 태그 세트가 사용된다.

"치환"은 아미노산 잔기가 다른 아미노산 잔기로 대체됨을 의미한다. 바람직하게는, 용어 "치환"은 20개의 천연 발생 표준 아미노산 잔기, 천연 발생 희귀 아미노산 잔기 (예를 들어, 히드록시프롤린, 히드록시리신, 알로히드록시리신, 6-N-메틸리신, N-에틸글리신, N-메틸글리신, N-에틸아스파라긴, 알로이소류신, N-메틸이소류신, N-메틸발린, 피로글루타민, 아미노부티르산, 오르니틴, 노르류신, 노르발린) 및 종종 합성 제조되는 비 천연 발생 아미노산 잔기 (예를 들어, 사이클로헥실-알라닌)로부터 선택된 다른 아미노산 잔기에 의한 아미노산 잔기의 대체를 지칭한다. 바람직하게는, 용어 "치환"은 20개의 천연 발생 표준 아미노산 잔기로부터 선택된 다른 아미노산 잔기에 의한 아미노산 잔기의 대체를 지칭한다. 기호 "+"는 치환 조합을 나타낸다. 본 명세서에서 아미노산은 다음 명명법에 따라 1 문자 또는 3 문자 코드로 표시된다: A: 알라닌 (Ala); C: 시스테인 (Cys); D: 아스파르트산 (Asp); E: 글루탐산 (Glu); F: 페닐알라닌 (Phe); G: 글리신 (Gly); H: 히스티딘 (His); I: 이소류신 (Ile); K: 리신 (Lys); L: 류신 (Leu); M: 메티오닌 (Met); N: 아스파라긴 (Asn); P: 프롤린 (Pro); Q: 글루타민 (Gln); R: 아르기닌 (Arg); S: 세린 (Ser); T: 트레오닌 (Thr); V: 발린 (Val); W: 트립토판 (Trp) 및 Y: 티로신 (Tyr). 본 문헌에서는 치환을 지정하기 위해 다음과 같은 용어를 사용한다: L238A는 모 서열의 위치 238의 아미노산 잔기 (류신, L)가 알라닌 (A)으로 변경되었음을 나타낸다. A132V/I/M은 모 서열의 위치 132의 아미노산 잔기 (알라닌, A)가 다음 아미노산: 발린 (V), 이소류신 (I) 또는 메티오닌 (M) 중 하나로 치환됨을 나타낸다. 치환은 보존적 또는 비 보존적 치환일 수 있다. 보존적 치환의 예는 염기성 아미노산 (아르기닌, 리신 및 히스티딘), 산성 아미노산 (글루탐산 및 아스파르트산), 극성 아미노산 (글루타민, 아스파라긴 및 트레오닌), 소수성 아미노산 (메티오닌, 류신, 이소류신, 시스테인 및 발린), 방향족 아미노산 (페닐알라닌, 트립토판 및 티로신) 및 소형 아미노산 (글리신, 알라닌 및 세린)의 기 내에 존재한다.

"전사체"는 특정 세포, 세포 집단, 샘플 또는 조직 유형에서 생성된 모든 (또는 거의 모든) 유전자 전사체의 집단을 의미한다. 일부 실시형태에서, 전사체는 세포, 세포 집단, 샘플 또는 조직 유형의 모든 또는 거의 모든 폴리A 메신저 RNA (mRNA)를 포함한다.

일부 실시형태에서, 세포, 조직 또는 유기체와 관련하여 "생존가능한"은 세포, 조직 또는 유기체가 성장, 배양 또는 추가로 증식될 수 있음을 의미한다. 일부 실시형태에서, 생존가능한 세포는 생존하고 유사 분열 또는 감수 분열할 수 있고 부착된 개시인자 올리고뉴클레오타이드의 무주형 효소 연장의 적어도 하나의 사이클에 적용된 후 추가 성장이 가능하다. 용어 "생존가능한 세포"는 생존가능한 진핵 세포, 원핵 세포 또는 바이러스를 포함할 수 있다. 일부 실시형태에서, "생존가능한 세포"는 생존가능한 진핵 세포를 의미하고; 다른 실시형태에서, "생존가능한 세포"는 생존가능한 포유류 세포를 의미한다. 본 명세서에서 사용된 용어 "생존가능한 조건"은 세포 생존율에 실질적인 유해한 영향을 미치지 않는 물리화학적 반응 조건 (예를 들어, 온도, 염 농도, 용매 등)이다. 일부 실시형태에서, 생존율을 위해, 예를 들어 비타민, 아미노산 등과 같이 특정 세포 유형에 대해 추가 반응 혼합물 성분이 필요하고; 즉, 본 명세서에서 사용되는 바와 같이, '생존가능한 조건'은 세포 생존율에 필요한 조건을 지칭하지만 모든 세포 유형의 생존율에 충분한 조건은 아님이 이해된다. 일부 실시형태에서, 생존가능한 조건은 0.8 내지 1.0 퍼센트 (w/v) 범위의 농도, 6.8 내지 7.8 범위의 pH 및 15°내지 41℃ 범위의 온도에서 생리적 염, 특히 나트륨, 칼슘 및/또는 칼륨과의 수성 반응 혼합물을 포함한다.

SEQUENCE LISTING <110> DNA SCRIPT <120> DIRECT OLIGONUCLEOTIDE SYNTHESIS ON CELLS AND BIOMOLECULES <130> B2906PC00 <160> 18 <170> PatentIn version 3.5 <210> 1 <211> 510 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TDT enzyme <400> 1 Met Asp Pro Leu Gln Ala Val His Leu Gly Pro Arg Lys Lys Arg Pro 1 5 10 15 Arg Gln Leu Gly Thr Pro Val Ala Ser Thr Pro Tyr Asp Ile Arg Phe 20 25 30 Arg Asp Leu Val Leu Phe Ile Leu Glu Lys Lys Met Gly Thr Thr Arg 35 40 45 Arg Ala Phe Leu Met Glu Leu Ala Arg Arg Lys Gly Phe Arg Val Glu 50 55 60 Asn Glu Leu Ser Asp Ser Val Thr His Ile Val Ala Glu Asn Asn Ser 65 70 75 80 Gly Ser Asp Val Leu Glu Trp Leu Gln Leu Gln Asn Ile Lys Ala Ser 85 90 95 Ser Glu Leu Glu Leu Leu Asp Ile Ser Trp Leu Ile Glu Cys Met Gly 100 105 110 Ala Gly Lys Pro Val Glu Met Met Gly Arg His Gln Leu Val Val Asn 115 120 125 Arg Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala 130 135 140 Pro Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 145 150 155 160 Leu Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala 165 170 175 Glu Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met 180 185 190 Arg Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met 195 200 205 Lys Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile 210 215 220 Ile Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val 225 230 235 240 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 245 250 255 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg 260 265 270 Thr Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met 275 280 285 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn 290 295 300 Arg Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val 305 310 315 320 Thr Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg 325 330 335 Gly Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 340 345 350 Ala Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe 355 360 365 Trp Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr 370 375 380 Phe Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His 385 390 395 400 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His 405 410 415 Ser Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg 420 425 430 Val Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu 435 440 445 Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 450 455 460 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg 465 470 475 480 Thr Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala 485 490 495 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 500 505 510 <210> 2 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated mouse sequence <400> 2 Asn Ser Ser Pro Ser Pro Val Pro Gly Ser Gln Asn Val Pro Ala Pro 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Gln Leu Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn Asp Glu Leu Arg Glu Asn Glu Gly Ser Cys Leu Ala Phe Met Arg 50 55 60 Ala Ser Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Thr Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Ser Ile Ile 85 90 95 Glu Gly Ile Ile Glu Asp Gly Glu Ser Ser Glu Ala Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Gln Ser Asp Lys Ser Leu Arg Phe Thr Gln Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Asn Arg 165 170 175 Pro Glu Ala Glu Ala Val Ser Met Leu Val Lys Glu Ala Val Val Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Met Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Asp Glu Glu Gln Gln Leu Leu His Lys Val Thr Asp Phe Trp 225 230 235 240 Lys Gln Gln Gly Leu Leu Leu Tyr Cys Asp Ile Leu Glu Ser Thr Phe 245 250 255 Glu Lys Phe Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Asp His Gly Arg Val His Ser 275 280 285 Glu Lys Ser Gly Gln Gln Glu Gly Lys Gly Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Asp Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Arg Thr 340 345 350 Lys Arg Val Phe Leu Glu Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 3 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Bovine truncated (catalytic domain): <400> 3 Asp Tyr Ser Ala Thr Pro Asn Pro Gly Phe Gln Lys Thr Pro Pro Leu 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Lys Thr Thr Leu 20 25 30 Asn Asn Tyr Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu 35 40 45 Asn Ser Glu Phe Lys Glu Asn Glu Val Ser Tyr Val Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Lys Val Lys Cys Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser 130 135 140 Leu Ser Lys Ile Met Ser Asp Lys Thr Leu Lys Phe Thr Lys Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Ala Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp Glu 225 230 235 240 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 245 250 255 Lys Phe Lys Leu Pro Ser Arg Gln Val Asp Thr Leu Asp His Phe Gln 260 265 270 Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Ser Ser 275 280 285 Lys Ser Asn Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Met Cys Pro Tyr Glu Asn Arg Ala Phe Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Ile Arg Arg Tyr Ala Thr His 325 330 335 Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 355 360 365 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 4 <211> 380 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Human truncated <400> 4 Asp Tyr Ser Asp Ser Thr Asn Pro Gly Pro Pro Lys Thr Pro Pro Ile 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Gln Ile Phe Thr Asp Ala Phe Asp Ile Leu Ala Glu 35 40 45 Asn Cys Glu Phe Arg Glu Asn Glu Asp Ser Cys Val Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Ser Lys Val Lys Gly Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Val Arg Ser Asp Lys Ser Leu Lys Phe Thr Arg Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Ser Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Glu Asp Glu Glu Gln Leu Leu Gln Lys Val Met Asn Leu Trp Glu 225 230 235 240 Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe Glu 245 250 255 Lys Leu Arg Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln 260 265 270 Lys Cys Phe Leu Ile Phe Lys Leu Pro Arg Gln Arg Val Asp Ser Asp 275 280 285 Gln Ser Ser Trp Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val Asp 290 295 300 Leu Val Leu Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly Trp 305 310 315 320 Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His 325 330 335 Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys 340 345 350 Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His Leu 355 360 365 Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 5 <211> 376 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Chicken 1 truncated <400> 5 Gln Tyr Pro Thr Leu Lys Thr Pro Glu Ser Glu Val Ser Ser Phe Thr 1 5 10 15 Ala Ser Lys Val Ser Gln Tyr Ser Cys Gln Arg Lys Thr Thr Leu Asn 20 25 30 Asn Cys Asn Lys Lys Phe Thr Asp Ala Phe Glu Ile Met Ala Glu Asn 35 40 45 Tyr Glu Phe Lys Glu Asn Glu Ile Phe Cys Leu Glu Phe Leu Arg Ala 50 55 60 Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Val Thr Arg Met Lys Asp 65 70 75 80 Ile Gln Gly Leu Pro Cys Met Gly Asp Arg Val Arg Asp Val Ile Glu 85 90 95 Glu Ile Ile Glu Glu Gly Glu Ser Ser Arg Ala Lys Asp Val Leu Asn 100 105 110 Asp Glu Arg Tyr Lys Ser Phe Lys Glu Phe Thr Ser Val Phe Gly Val 115 120 125 Gly Val Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Leu Arg Thr Val 130 135 140 Glu Glu Val Lys Ala Asp Lys Thr Leu Lys Leu Ser Lys Met Gln Arg 145 150 155 160 Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ser Lys Ala 165 170 175 Glu Ala Asp Ala Val Ser Ser Ile Val Lys Asn Thr Val Cys Thr Phe 180 185 190 Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly Lys 195 200 205 Lys Ile Gly His Asp Ile Asp Phe Leu Ile Thr Ser Pro Gly Gln Arg 210 215 220 Glu Asp Asp Glu Leu Leu His Lys Gly Leu Leu Leu Tyr Cys Asp Ile 225 230 235 240 Ile Glu Ser Thr Phe Val Lys Glu Gln Ile Pro Ser Arg His Val Asp 245 250 255 Ala Met Asp His Phe Gln Lys Cys Phe Ala Ile Leu Lys Leu Tyr Gln 260 265 270 Pro Arg Val Asp Asn Ser Ser Tyr Asn Met Ser Lys Lys Cys Asp Met 275 280 285 Ala Glu Val Lys Asp Trp Lys Ala Ile Arg Val Asp Leu Val Ile Thr 290 295 300 Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly Ser Arg 305 310 315 320 Gln Phe Gly Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Arg Lys Met 325 330 335 Met Leu Asp Asn His Ala Leu Tyr Asp Lys Arg Lys Arg Val Phe Leu 340 345 350 Lys Ala Gly Ser Glu Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr 355 360 365 Val Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 6 <211> 387 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Possum truncated <400> 6 Ser Ala Asn Pro Asp Pro Thr Ala Gly Thr Leu Asn Ile Leu Pro Pro 1 5 10 15 Thr Thr Lys Thr Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Ile 20 25 30 Asn Asn His Asn Gln Arg Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys 35 40 45 Asn Tyr Glu Phe Lys Glu Asn Asp Asp Thr Cys Leu Thr Phe Met Arg 50 55 60 Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Glu Val Val Ser Leu Lys 65 70 75 80 Asp Thr Glu Gly Leu Pro Trp Ile Gly Asp Glu Val Lys Gly Ile Met 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Leu Glu Val Gln Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Asp Lys Trp Tyr Arg Met Gly Phe Arg Thr 130 135 140 Leu Asn Lys Ile Arg Ser Asp Lys Thr Leu Lys Leu Thr Lys Met Gln 145 150 155 160 Lys Ala Gly Leu Cys Tyr Tyr Glu Asp Leu Ile Asp Cys Val Ser Lys 165 170 175 Ala Glu Ala Asp Ala Val Ser Leu Leu Val Gln Asp Ala Val Trp Thr 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Glu Phe Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala 210 215 220 Glu Lys Glu Gln Glu Asp Gln Leu Leu Gln Lys Val Thr Asn Leu Trp 225 230 235 240 Lys Lys Gln Gly Leu Leu Leu Tyr Cys Asp Leu Ile Glu Ser Thr Phe 245 250 255 Glu Asp Leu Lys Leu Pro Ser Arg Lys Ile Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr His His Lys Glu Asp Lys 275 280 285 Arg Lys Trp Glu Met Pro Thr Gly Ser Asn Glu Ser Glu Ala Lys Ser 290 295 300 Trp Lys Ala Ile Arg Val Asp Leu Val Val Cys Pro Tyr Asp Arg Tyr 305 310 315 320 Ala Phe Ala Leu Leu Gly Trp Ser Gly Ser Arg Gln Phe Glu Arg Asp 325 330 335 Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His 340 345 350 Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Lys Ala Lys Ser Glu 355 360 365 Glu Glu Ile Phe Ala His Leu Gly Leu Glu Tyr Ile Gln Pro Ser Glu 370 375 380 Arg Asn Ala 385 <210> 7 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> New truncated shrew <400> 7 Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser Ala 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu 35 40 45 Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg Thr 130 135 140 Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Ala 210 215 220 Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe Trp 225 230 235 240 Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp Asp 275 280 285 Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 8 <211> 387 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Python truncated <400> 8 Glu Lys Tyr Gln Leu Pro Glu Asp Glu Asp Arg Ser Val Thr Ser Asp 1 5 10 15 Leu Asp Arg Asp Ser Ile Ser Glu Tyr Ala Cys Gln Arg Arg Thr Thr 20 25 30 Leu Lys Asn Tyr Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala 35 40 45 Glu Asn Tyr Glu Phe Asn Glu Asn Lys Gly Phe Cys Thr Ala Phe Arg 50 55 60 Arg Ala Ala Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Gln Val 65 70 75 80 His Asp Ile Glu Gly Val Pro Trp Met Gly Lys Gln Val Lys Gly Ile 85 90 95 Ile Glu Asp Ile Ile Glu Glu Gly Glu Ser Ser Lys Val Lys Ala Val 100 105 110 Leu Asp Asn Glu Asn Tyr Arg Ser Val Lys Leu Phe Thr Ser Val Phe 115 120 125 Gly Val Gly Leu Lys Thr Ser Asp Lys Trp Tyr Arg Met Gly Leu Arg 130 135 140 Thr Leu Glu Glu Val Lys Arg Asp Lys Asn Leu Lys Leu Thr Arg Met 145 150 155 160 Gln Lys Ala Gly Phe Leu His Tyr Asp Asp Leu Thr Ser Cys Val Ser 165 170 175 Lys Ala Glu Ala Asp Ala Ala Ser Leu Ile Val Gln Asp Val Val Trp 180 185 190 Lys Ile Val Pro Asn Ala Ile Val Thr Ile Ala Gly Gly Phe Arg Arg 195 200 205 Gly Lys Gln Thr Gly His Asp Val Asp Phe Leu Ile Thr Val Pro Gly 210 215 220 Ser Lys Gln Glu Glu Glu Glu Leu Leu His Thr Val Ile Asp Ile Trp 225 230 235 240 Lys Lys Gln Glu Leu Leu Leu Tyr Tyr Asp Leu Ile Glu Ser Thr Phe 245 250 255 Glu Asp Thr Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Ala Ile Leu Lys Val His Lys Glu Arg Glu Asp Lys 275 280 285 Gly Asn Ser Ile Arg Ser Lys Ala Phe Ser Glu Glu Glu Ile Lys Asp 290 295 300 Trp Lys Ala Ile Arg Val Asp Leu Val Val Val Pro Phe Glu Gln Tyr 305 310 315 320 Ala Phe Ala Leu Leu Gly Trp Thr Gly Ser Thr Gln Phe Glu Arg Asp 325 330 335 Leu Arg Arg Tyr Ala Thr His Glu Lys Lys Met Met Leu Asp Asn His 340 345 350 Ala Leu Tyr Asp Lys Thr Lys Lys Ile Phe Leu Asn Ala Ala Ser Glu 355 360 365 Glu Glu Ile Phe Ala His Leu Gly Leu Asp Tyr Leu Glu Pro Trp Glu 370 375 380 Arg Asn Ala 385 <210> 9 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated dog <400> 9 Asp Tyr Thr Ala Ser Pro Asn Pro Glu Leu Gln Lys Thr Leu Pro Val 1 5 10 15 Ala Val Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Tyr Asn Asn Val Phe Thr Asp Ala Phe Glu Val Leu Ala Glu 35 40 45 Asn Tyr Glu Phe Arg Glu Asn Glu Val Phe Ser Leu Thr Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Glu Gly Ile Pro Cys Leu Gly Asp Gln Val Lys Cys Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Lys Ile Lys Ser Asp Lys Ser Leu Lys Phe Thr Pro Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala 180 185 190 Phe Leu Pro Asp Ala Phe Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Met Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Asp Glu Asp Glu Glu Gln Leu Leu Pro Lys Val Ile Asn Leu Trp 225 230 235 240 Glu Arg Lys Gly Leu Leu Leu Tyr Cys Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly 275 280 285 Gly Lys Cys Ser Gln Gln Glu Gly Lys Thr Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser 325 330 335 His Glu Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Lys Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 10 <211> 382 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNC MOLE <400> 10 Gly Asp Cys Pro Ala Ser His Asp Ser Ser Pro Gln Lys Thr Glu Ser 1 5 10 15 Ala Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr 20 25 30 Leu Asn Asn His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala 35 40 45 Glu Asn Cys Glu Phe Arg Glu Asn Glu Gly Ser Tyr Val Thr Tyr Met 50 55 60 Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Ser Ile Ile Ser Met 65 70 75 80 Lys Asp Thr Glu Gly Ile Pro Cys Leu Ala Asp Lys Val Lys Cys Val 85 90 95 Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Val 100 105 110 Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe 115 120 125 Gly Val Gly Leu Lys Thr Ala Glu Lys Trp Phe Arg Leu Gly Phe Arg 130 135 140 Thr Leu Ser Gly Ile Met Asn Asp Lys Thr Leu Lys Leu Thr His Met 145 150 155 160 Gln Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Thr 165 170 175 Arg Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Trp 180 185 190 Ala Phe Leu Pro Asp Ala Ile Val Thr Met Thr Gly Gly Phe Arg Arg 195 200 205 Gly Lys Lys Val Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu 210 215 220 Ala Thr Glu Glu Gln Glu Gln Gln Leu Leu His Lys Val Ile Thr Phe 225 230 235 240 Trp Glu Lys Glu Gly Leu Leu Leu Tyr Cys Asp Leu Tyr Glu Ser Thr 245 250 255 Phe Glu Lys Leu Lys Met Pro Ser Arg Lys Val Asp Ala Leu Asp His 260 265 270 Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu His Arg Glu Cys Val Asp 275 280 285 Asp Gly Thr Ser Ser Gln Leu Gln Gly Lys Thr Trp Lys Ala Ile Arg 290 295 300 Val Asp Leu Val Val Cys Pro Tyr Glu Cys Arg Ala Phe Ala Leu Leu 305 310 315 320 Gly Trp Thr Gly Ser Pro Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala 325 330 335 Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys 340 345 350 Thr Lys Arg Lys Phe Leu Ser Ala Asp Ser Glu Glu Asp Ile Phe Ala 355 360 365 His Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 11 <211> 379 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> Pika trunk <400> 11 Glu Tyr Ser Ala Asn Pro Ser Pro Gly Pro Gln Ala Thr Pro Ala Val 1 5 10 15 Tyr Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu Asn Asn 20 25 30 His Asn His Ile Phe Thr Asp Ala Phe Glu Ile Leu Ala Glu Asn Tyr 35 40 45 Glu Phe Lys Glu Asn Glu Gly Cys Tyr Val Thr Tyr Met Arg Ala Ala 50 55 60 Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Val Ser Met Lys Asp Thr 65 70 75 80 Glu Gly Ile Pro Cys Leu Glu Asp Lys Val Lys Ser Ile Met Glu Glu 85 90 95 Ile Ile Glu Glu Gly Glu Ser Ser Glu Val Lys Ala Val Leu Ser Asp 100 105 110 Glu Arg Tyr Gln Cys Phe Lys Leu Phe Thr Ser Val Phe Gly Val Gly 115 120 125 Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Ser Leu Ser 130 135 140 Asn Ile Arg Leu Asp Lys Ser Leu Lys Phe Thr Gln Met Gln Lys Ala 145 150 155 160 Gly Phe Arg Tyr Tyr Glu Asp Ile Val Ser Cys Val Thr Arg Ala Glu 165 170 175 Ala Glu Ala Val Asp Val Leu Val Asn Glu Ala Val Arg Ala Phe Leu 180 185 190 Pro Asp Ala Phe Ile Thr Met Thr Gly Gly Phe Arg Arg Gly Lys Lys 195 200 205 Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Glu Leu Thr Glu 210 215 220 Glu Asp Glu Gln Gln Leu Leu His Lys Val Met Asn Leu Trp Glu Lys 225 230 235 240 Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe Glu Lys 245 250 255 Leu Lys Gln Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe Gln Lys 260 265 270 Cys Phe Leu Ile Phe Lys Leu Tyr His Glu Arg Val Gly Gly Asp Arg 275 280 285 Cys Arg Gln Pro Glu Gly Lys Asp Trp Lys Ala Ile Arg Val Asp Leu 290 295 300 Val Met Cys Pro Tyr Glu Cys His Ala Phe Ala Leu Leu Gly Trp Thr 305 310 315 320 Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Ser His Glu 325 330 335 Arg Lys Met Ile Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Arg 340 345 350 Val Phe Leu Gln Ala Glu Asn Glu Glu Glu Ile Phe Ala His Leu Gly 355 360 365 Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 <210> 12 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNC HEDGEHOG <400> 12 Asp Ala Ser Phe Gly Ser Asn Pro Gly Ser Gln Asn Thr Pro Pro Leu 1 5 10 15 Ala Ile Lys Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Ser Leu 20 25 30 Asn Asn Cys Asn His Ile Phe Thr Asp Ala Leu Asp Ile Leu Ala Glu 35 40 45 Asn His Glu Phe Arg Glu Asn Glu Val Ser Cys Val Ala Phe Met Arg 50 55 60 Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Thr Ile Ile Ser Met Lys 65 70 75 80 Asp Thr Lys Gly Ile Pro Cys Leu Gly Asp Lys Ala Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys Ala Ile Leu 100 105 110 Asn Asp Glu Arg Tyr Gln Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Asn Lys Ile Met Ser Asp Lys Thr Leu Lys Leu Thr Arg Met Gln 145 150 155 160 Lys Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Val Ser Cys Val Ala Lys 165 170 175 Ala Glu Ala Asp Ala Val Ser Val Leu Val Gln Glu Ala Val Trp Ala 180 185 190 Phe Leu Pro Asp Ala Met Val Thr Met Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Leu Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ala 210 215 220 Thr Glu Glu Glu Glu Gln Gln Leu Leu Pro Lys Val Ile Asn Phe Trp 225 230 235 240 Glu Arg Lys Gly Leu Leu Leu Tyr His Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Leu Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Gln Lys Cys Phe Leu Ile Leu Lys Leu His Leu Gln His Val Asn Gly 275 280 285 Val Gly Asn Ser Lys Thr Gly Gln Gln Glu Gly Lys Asn Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Arg Arg Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg 325 330 335 Phe Ala Thr His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Arg Ile Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Asp Tyr Ile Asp Pro Trp Glu Arg Asn Ala 370 375 380 <210> 13 <211> 381 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> truncated tree shrew <400> 13 Asp His Ser Thr Ser Pro Ser Pro Gly Pro Gln Lys Thr Pro Ala Leu 1 5 10 15 Ala Val Gln Lys Ile Ser Gln Tyr Ala Cys Gln Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Arg Val Phe Thr Asp Ala Phe Glu Thr Leu Ala Glu 35 40 45 Asn Tyr Glu Phe Arg Glu Asn Glu Asp Ser Ser Val Ile Phe Leu Arg 50 55 60 Ala Ala Ser Val Leu Arg Ser Leu Pro Phe Thr Ile Thr Ser Met Arg 65 70 75 80 Asp Thr Glu Gly Leu Pro Cys Leu Gly Asp Lys Val Lys Cys Val Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Asn Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser Val Phe Gly 115 120 125 Val Gly Leu Lys Thr Ser Glu Lys Trp Phe Arg Met Gly Phe Arg Thr 130 135 140 Leu Ser Arg Val Arg Ser Asp Lys Ser Leu His Leu Thr Arg Met Gln 145 150 155 160 Gln Ala Gly Phe Leu Tyr Tyr Glu Asp Leu Ala Ser Cys Val Thr Arg 165 170 175 Ala Glu Ala Glu Ala Val Gly Val Leu Val Lys Glu Ala Val Gly Ala 180 185 190 Phe Leu Pro Asp Ala Leu Val Thr Ile Thr Gly Gly Phe Arg Arg Gly 195 200 205 Lys Lys Thr Gly His Asp Val Asp Phe Leu Ile Thr Ser Pro Gly Ser 210 215 220 Thr Glu Glu Lys Glu Glu Glu Leu Leu Gln Lys Val Leu Asn Leu Trp 225 230 235 240 Glu Lys Lys Gly Leu Leu Leu Tyr Tyr Asp Leu Val Glu Ser Thr Phe 245 250 255 Glu Lys Leu Lys Thr Pro Ser Arg Lys Val Asp Ala Leu Asp His Phe 260 265 270 Pro Lys Cys Phe Leu Ile Leu Lys Leu His His Gln Arg Val Asp Gly 275 280 285 Asp Lys Pro Ser Gln Gln Glu Gly Lys Ser Trp Lys Ala Ile Arg Val 290 295 300 Asp Leu Val Met Cys Pro Tyr Glu Arg His Ala Phe Ala Leu Leu Gly 305 310 315 320 Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr 325 330 335 His Glu Arg Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr 340 345 350 Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Ala His 355 360 365 Leu Gly Leu Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 370 375 380 <210> 14 <211> 394 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED PLATYPUS <400> 14 Leu Thr Asn Ser Ala Pro Ile Asn Cys Met Thr Glu Thr Pro Ser Leu 1 5 10 15 Ala Thr Lys Gln Val Ser Gln Tyr Ala Cys Glu Arg Arg Thr Thr Leu 20 25 30 Asn Asn Cys Asn Gln Lys Phe Thr Asp Ala Phe Glu Ile Leu Ala Lys 35 40 45 Asp Phe Glu Phe Arg Glu Asn Glu Gly Ile Cys Leu Ala Phe Met Arg 50 55 60 Ala Ile Ser Val Leu Lys Cys Leu Pro Phe Thr Ile Val Arg Met Lys 65 70 75 80 Asp Ile Glu Gly Val Pro Trp Leu Gly Asp Gln Val Lys Ser Ile Ile 85 90 95 Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Ser Val Lys Ala Val Leu 100 105 110 Asn Asp Glu Arg Tyr Arg Ser Phe Gln Leu Phe Asn Ser Val Phe Glu 115 120 125 Val Gly Leu Thr Asp Asn Gly Glu Asn Gly Ile Ala Arg Gly Phe Gln 130 135 140 Thr Leu Asn Glu Val Ile Thr Asp Glu Asn Ile Ser Leu Thr Lys Thr 145 150 155 160 Thr Leu Ser Thr Ser Leu Trp Asn Tyr Leu Pro Gly Phe Leu Tyr Tyr 165 170 175 Glu Asp Leu Val Ser Cys Val Ala Lys Glu Glu Ala Asp Ala Val Tyr 180 185 190 Leu Ile Val Lys Glu Ala Val Arg Ala Phe Leu Pro Glu Ala Leu Val 195 200 205 Thr Leu Thr Gly Gly Phe Arg Arg Gly Lys Lys Ile Gly His Asp Val 210 215 220 Asp Phe Leu Ile Ser Asp Pro Glu Ser Gly Gln Asp Glu Gln Leu Leu 225 230 235 240 Pro Asn Ile Ile Lys Leu Trp Glu Lys Gln Glu Leu Leu Leu Tyr Tyr 245 250 255 Asp Leu Val Glu Ser Thr Phe Glu Lys Thr Lys Ile Pro Ser Arg Lys 260 265 270 Val Asp Ala Met Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu 275 280 285 His His Gln Lys Val Asp Ser Gly Arg Tyr Lys Pro Pro Pro Glu Ser 290 295 300 Lys Asn His Glu Ala Lys Asn Trp Lys Ala Ile Arg Val Asp Leu Val 305 310 315 320 Met Cys Pro Phe Glu Gln Tyr Ala Tyr Ala Leu Leu Gly Trp Thr Gly 325 330 335 Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg Tyr Ala Thr His Glu Lys 340 345 350 Lys Met Met Leu Asp Asn His Ala Leu Tyr Asp Lys Thr Lys Lys Ile 355 360 365 Phe Leu Lys Ala Glu Ser Glu Glu Asp Ile Phe Thr His Leu Gly Leu 370 375 380 Asp Tyr Ile Glu Pro Trp Glu Arg Asn Ala 385 390 <210> 15 <211> 384 <212> PRT <213> ARTIFICIAL SEQUENCE <220> <223> TRUNCATED JERBOA <400> 15 Ser Ser Glu Leu Glu Leu Leu Asp Val Ser Trp Leu Ile Glu Cys Met 1 5 10 15 Gly Ala Gly Lys Pro Val Glu Met Thr Gly Arg His Gln Leu Val Lys 20 25 30 Gln Thr Phe Cys Leu Pro Gly Phe Ile Leu Gln Asp Ala Phe Asp Ile 35 40 45 Leu Ala Glu Asn Cys Glu Phe Arg Glu Asn Glu Ala Ser Cys Val Glu 50 55 60 Phe Met Arg Ala Ala Ser Val Leu Lys Ser Leu Pro Phe Pro Ile Ile 65 70 75 80 Ser Val Lys Asp Thr Glu Gly Ile Pro Trp Leu Gly Gly Lys Val Lys 85 90 95 Cys Val Ile Glu Glu Ile Ile Glu Asp Gly Glu Ser Ser Glu Val Lys 100 105 110 Ala Leu Leu Asn Asp Glu Arg Tyr Lys Ser Phe Lys Leu Phe Thr Ser 115 120 125 Val Phe Gly Val Gly Leu Lys Thr Ala Glu Arg Trp Phe Arg Met Gly 130 135 140 Phe Arg Thr Leu Ser Thr Val Lys Leu Asp Lys Ser Leu Thr Phe Thr 145 150 155 160 Arg Met Gln Lys Ala Gly Phe Leu His Tyr Glu Asp Leu Val Ser Cys 165 170 175 Val Thr Arg Ala Glu Ala Glu Ala Val Ser Val Leu Val Gln Gln Ala 180 185 190 Val Val Ala Phe Leu Pro Asp Ala Leu Val Ser Met Thr Gly Gly Phe 195 200 205 Arg Arg Gly Lys Lys Ile Gly His Asp Val Asp Phe Leu Ile Thr Ser 210 215 220 Pro Glu Ala Thr Glu Glu Glu Glu Gln Gln Leu Leu His Lys Val Thr 225 230 235 240 Asn Phe Trp Glu Gln Lys Gly Leu Leu Leu Tyr Cys Asp His Val Glu 245 250 255 Ser Thr Phe Glu Lys Cys Lys Leu Pro Ser Arg Lys Val Asp Ala Leu 260 265 270 Asp His Phe Gln Lys Cys Phe Leu Ile Leu Lys Leu Tyr Arg Glu Arg 275 280 285 Val Asp Ser Val Lys Ser Ser Gln Gln Glu Gly Lys Gly Trp Lys Ala 290 295 300 Ile Arg Val Asp Leu Val Met Cys Pro Tyr Glu Cys Arg Ala Phe Ala 305 310 315 320 Leu Leu Gly Trp Thr Gly Ser Arg Gln Phe Glu Arg Asp Leu Arg Arg 325 330 335 Tyr Ala Thr His Glu Arg Lys Met Arg Leu Asp Asn His Ala Leu Tyr 340 345 350 Asp Lys Thr Lys Arg Val Phe Leu Lys Ala Glu Ser Glu Glu Glu Ile 355 360 365 Phe Ala His Leu Gly Leu Glu Tyr Ile Glu Pro Leu Glu Arg Asn Ala 370 375 380 <210> 16 <211> 32 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> Exemplary cDNA produced in a method of the invention (Fig. 1B) <220> <221> misc_feature <222> (8)..(32) <223> n is a, c, g, t or u <400> 16 tttttttnnn nnnnnnnnnn nnnnnnnnnn nn 32 <210> 17 <211> 15 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> Exemplary cDNA produced in process of Fig. 4A <220> <221> misc_feature <222> (15)..(15) <223> n is a, c, g, t or u <400> 17 tttttttttt ttttn 15 <210> 18 <211> 13 <212> DNA <213> ARTIFICIAL SEQUENCE <220> <223> Antibody barcode <220> <221> misc_feature <222> (8)..(13) <223> n is a, c, g, t or u <400> 18 aaaaaaannn nnn 13

Claims

소정의 서열을 갖는 올리고뉴클레오타이드를 생존가능한 세포(viable cell) 상에 합성하는 방법으로서, 상기 방법은
a) 세포의 세포 표면 분자에 부착되거나 세포의 세포 표면 막에 고정된 유리 3'-히드록실을 개시인자(initiator)에 제공하는 단계;
b) 생물학적 조건 하에서 (i) 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편(elongated fragment)을 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소(template-independent DNA polymerase)와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 개시인자 또는 연장된 단편을 연장시켜 3'-O-차단된 연장된 단편을 형성하는 단계, 및 (ii) 연장된 단편을 탈차단(deblocking)하여 유리 3'-히드록실을 갖는 연장된 단편을 형성하는 단계의 다수의 사이클을 반복함으로써 소정의 서열의 올리고뉴클레오타이드를 합성하는 단계
를 포함하는, 방법.
제1항에 있어서, 상기 3'-O-차단된 뉴클레오사이드 트리포스페이트는 3'-포스페이트-뉴클레오사이드 트리포스페이트이고, 상기 탈차단 단계가 상기 3'-O-차단된 연장된 단편을 3'-포스파타제 활성으로 처리함으로써 수행되는, 방법.
제2항에 있어서, 상기 3'-포스파타제 활성은 T4 폴리뉴클레오타이드 키나제, 재조합 새우(shrimp) 알칼리 포스파타제, 또는 송아지(calf) 장 알칼리 포스파타제에 의해 제공되는, 방법.
제1항에 있어서, 상기 3'-O-차단된 뉴클레오사이드 트리포스페이트는 3'-에스테르-차단된 뉴클레오사이드 트리포스페이트이고, 상기 탈차단 단계는 상기 3'-O-에스테르-차단된 연장된 단편을 에스테라제 활성으로 처리함으로써 수행되는, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 생물학적 조건은 6.8 내지 7.8 범위의 pH 및 15℃ 내지 41℃ 범위의 온도에서 완충된 생리적 염을 포함하는 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 생존가능한 세포는 포유류 세포인, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 개시인자는 5' 말단에 공유 결합에 의해 부착된 친유성 고정인자(lipophilic anchor)를 갖는 올리고뉴클레오타이드를 포함하고, 친유성 고정인자는 상기 생존가능한 세포의 세포 표면 막 내로 안정적으로 삽입되는 방법.
세포 특이적 올리고뉴클레오타이드 바코드(barcode)를 사용하여 cDNA 라이브러리 (library)를 생성하는 방법으로서, 상기 방법은
(a) 생물학적 조건 하에서 세포 집단(population)에서 각 세포의 세포 표면 막 상에 고유한 올리고뉴클레오타이드 바코드를 합성하여 바코드화된 세포 집단을 형성하는 단계;
(b) 반응기에서 각각의 바코드화된 세포를 단리하는 단계;
(c) 각각의 반응기에서 바코드화된 세포를 용해하는 단계;
(d) 각각의 반응기에서 역전사 효소 중합효소 연쇄 반응 (RT-PCR)을 수행하여 세포 특이적 올리고뉴클레오타이드 바코드가 있는 cDNA 라이브러리를 생성하는 단계
를 포함하는, 방법.
제8항에 있어서, 상기 합성 단계는 (a) 상기 집단의 상기 세포 각각의 상기 세포 표면 막에 개시인자를 부착하는 단계, 및 (b) (i) 생물학적 조건 하에서 유리 3'-O-히드록실을 갖는 개시인자 또는 연장된 단편을 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 주형-비의존적 DNA 중합효소와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 개시인자 또는 연장된 단편을 연장시켜 3'-O-차단된 연장된 단편을 형성하는 단계, 및 (ii) 연장된 단편을 탈차단하여 유리 3'-히드록실을 갖는 연장된 단편을 형성하는 단계의 사이클을 반복하는 단계를 포함하는, 방법.
제9항에 있어서, 상기 각각의 사이클은 별개의 반응 혼합물 중 상기 세포의 집단을 분할하는 단계를 추가로 포함하고, 개별 반응 혼합물의 상기 세포가 조합된 후, 상기 개시인자 또는 연장된 단편은 상이한 종류의 뉴클레오사이드 트리포스페이트에 의해 연장되어 상기 연장된 단편을 형성하는, 방법.
제8항 내지 제10항 중 어느 한 항에 있어서, 상기 반응기는 유중수 에멀젼 (water-in-oil emulsion)의 미셀 (micelle)인, 방법.
제11항에 있어서, 상기 미셀은 미세유체 장치(microfluidics device)에 의해 생성되는, 방법.
제9항 내지 제12항 중 어느 한 항에 있어서, 상기 반응기로부터의 상기 cDNA는 고 처리량 DNA 시퀀싱(high throughput DNA sequencing)에 의해 조합되고 분석되는, 방법.
소정의 뉴클레오타이드 서열로 하나 이상의 천연 폴리뉴클레오타이드를 확장하는 방법으로서,
TdT 반응 조건 하에서 반응 혼합물에 하나 이상의 천연 폴리뉴클레오타이드를 제공하는 단계로서, 천연 폴리뉴클레오타이드는 유리 3'-히드록실을 갖는 단계; 및
(i) 유리 3'-O-히드록실을 갖는 천연 폴리뉴클레오타이드 또는 연장된 천연 폴리뉴클레오타이드를 3'-O-차단된 뉴클레오사이드 트리포스페이트 및 TdT 변이체와 접촉시켜 3'-O-차단된 뉴클레오사이드 트리포스페이트의 혼입에 의해 천연 폴리뉴클레오타이드 또는 연장된 천연 폴리뉴클레오타이드를 연장시켜 3'-O-차단된 연장된 천연 폴리뉴클레오타이드를 형성하는 단계, 및 (ii) 연장된 천연 폴리뉴클레오타이드를 탈차단하여 유리 3'-히드록실을 갖는 연장된 천연 폴리뉴클레오타이드를 형성하는 단계의 사이클을 반복함으로써 하나 이상의 천연 폴리뉴클레오타이드를 소정의 서열의 뉴클레오타이드로 확장하여 천연 폴리뉴클레오타이드 상에 소정의 서열의 올리고뉴클레오타이드를 합성하는 단계
를 포함하는, 방법.
제14항에 있어서, 상기 소정의 뉴클레오타이드 서열은 적어도 다수의 상이한 종류의 뉴클레오타이드를 포함하는 방법.
제15항에 있어서, 상기 소정의 뉴클레오타이드 서열은 각각의 천연 폴리뉴클레오타이드에 대해 고유한, 방법.
제14항 내지 제16항 중 어느 한 항에 있어서, 각각의 상기 사이클은 개별 반응 혼합물 중 상기 천연 폴리뉴클레오타이드 또는 연장된 천연 폴리뉴클레오타이드를 분할하는 단계를 추가로 포함하고, 개별 반응 혼합물의 상기 연장된 천연 폴리뉴클레오타이드가 조합된 후, 상기 천연 폴리뉴클레오타이드 또는 연장된 연장된 천연 폴리뉴클레오타이드는 상이한 종류의 뉴클레오사이드 트리포스페이트에 의해 연장되어 상기 연장된 천연 폴리뉴클레오타이드를 형성하는, 방법.
올리고뉴클레오타이드 표지(label)를 각각 갖는 cDNA 라이브러리를 생성하는 방법으로서, 상기 방법은
(a) mRNA를 혼성화하여 mRNA를 포획함으로써 하나 이상의 고체 지지체에 부착된 올리고뉴클레오타이드를 포획하는 단계로서, 포획 올리고뉴클레오타이드는 mRNA의 절편에 상보적이고 포획 올리고뉴클레오타이드는 5 말단에 의해 하나 이상의 고체 지지체에 부착되고 3' 말단에 유리 3'-히드록실을 갖는 단계;
(b) 포획된 mRNA를 주형으로 사용하여 역전사 효소로 포획 올리고뉴클레오타이드의 3' 말단을 확장하여 하나 이상의 고체 지지체 상에 cDNA 라이브러리를 형성하는 단계;
(c) 무주형 효소 합성에 의해 하나 이상의 고체 지지체의 cDNA 상에 올리고뉴클레오타이드 표지를 합성하는 단계
를 포함하는, 방법.
제18항에 있어서, 상기 포획 단계는 비드(bead) 상의 단일 세포의 mRNA를 포획하여 세포 특이적 cDNA 라이브러리인 상기 cDNA 라이브러리를 형성하는 단계를 포함하고, 상기 올리고뉴클레오타이드 표지는 고유한 세포 특이적 올리고뉴클레오타이드 바코드인 방법.
제18항 또는 제19항에 있어서, 상기 고유한 세포 특이적 바코드를 합성하는 상기 단계는 분할 및 혼합 합성 방법에 의해 수행되는 방법.
제18항 내지 제20항 중 어느 한 항에 있어서, 상기 하나 이상의 고체 지지체는 상기 포획 올리고뉴클레오타이드가 부착된 고체 표면이고, 상기 포획 단계는 고체 표면 상에 배치된 투과성화된 조직 절편(permeabilied tissue slice)의 mRNA를 포획하여 조직 절편의 cDNA의 공간 분포를 유지하는 공간 cDNA 라이브러리 어레이 (array)를 형성하는 단계를 포함하는 방법.
제18항 내지 제21항 중 어느 한 항에 있어서, 상기 합성 단계는 상기 공간 cDNA 라이브러리 어레이 상의 다수의 상이한 소정의 위치 각각에서 고유한 위치 태그 (tag)를 합성하여 위치 태그 -cDNA 접합체를 형성하는 단계를 포함하는 방법.
제22항에 있어서, 상기 방법은 상기 위치 태그 -cDNA 접합체를 방출하고 시퀀싱하여 상기 조직 절편에서 상기 mRNA의 공간 분포를 결정하는 단계를 추가로 포함하는 방법.
제21항 내지 제23항 중 어느 한 항에 있어서, 상기 고체 표면은 소정의 비 핵산 리간드(non-nucleic acid ligand)를 포획하기 위해 부착된 결합 화합물을 포함하는 방법.
제24항에 있어서, 상기 결합 화합물은 각각이 상기 소정의 비 핵산 리간드 중 하나에 대해 소정의 특이성을 갖는 하나 이상의 종류의 항체를 포함하고, 각각의 상이한 종류의 항체는 항체가 확인될 수 있는 방출 가능한 올리고뉴클레오타이드 바코드가 부착된 방법.