KR20230124636A - 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법 - Google Patents

멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법 Download PDF

Info

Publication number
KR20230124636A
KR20230124636A KR1020237024403A KR20237024403A KR20230124636A KR 20230124636 A KR20230124636 A KR 20230124636A KR 1020237024403 A KR1020237024403 A KR 1020237024403A KR 20237024403 A KR20237024403 A KR 20237024403A KR 20230124636 A KR20230124636 A KR 20230124636A
Authority
KR
South Korea
Prior art keywords
sequence
target
primer
dna
blocking
Prior art date
Application number
KR1020237024403A
Other languages
English (en)
Inventor
마이클 앨런
마크 앤더슨
Original Assignee
라이프 테크놀로지스 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 라이프 테크놀로지스 코포레이션 filed Critical 라이프 테크놀로지스 코포레이션
Publication of KR20230124636A publication Critical patent/KR20230124636A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Abstract

복잡한 샘플로부터 표적화 라이브러리를 효율적으로 생성하는 방법이, 다양한 핵산 분석을 위해서 바람직하다. 표적 핵산 서열의 라이브러리를 제조하기 위해서 샘플에 존재하는 풍부한 표적을 선택적으로 차단하여, 고도로 멀티플렉싱된 표적화 라이브러리를 신속하게 생성하고 서열결정 응용분야를 비롯하여 낮은 빈도의 서열의 분석을 가능하게 하는 방법이 제공된다. 방법은 선택적으로 고유한 태그 서열의 사용을 포함한다. 방법은 핵산 샘플을 표적 핵산(들)이 제1 증폭을 겪는 조건 하에서 하나 이상의 표적 핵산 서열의 증폭이 가능한 복수의 표적 특이적 프라이머 또는 어댑터와 접촉시키는 것; 생성된 제1 증폭 생성물을 소화시키는 것; 소화된 표적 앰플리콘을 결찰시키거나 소화된 표적 앰플리콘을 복구하는 것; 및 제2 증폭에서 결찰된 또는 복구된 생성물을 증폭시킴으로써 표적 핵산 서열의 라이브러리를 생성하는 것을 포함한다. 각각의 반응은 작업흐름에서 완전히 처리될 수 없는 표적 특이적 프라이머를 추가로 포함하여, 유용하지 않은 앰플리콘 생성을 초래하고, 이에 의해서, 선택된 표적 서열, 예를 들어, 샘플에 높은 존재비로 존재하는 표적 서열을 차단한다. 제공된 방법은 단일, 첨가 단독 작업흐름 반응으로 수행되어, 선택적으로 낮은 빈도의 표적 서열의 검출에 최적화된 고유한 태그 서열을 포함하는 고도로 멀티플렉싱된 표적화 라이브러리의 신속한 생성을 가능하게 할 수 있다.

Description

멀티플렉스 반응에서 표적 서열의 고 감응성 검출을 위한 조성물 및 방법
관련 출원의 교차 참조
본 출원은 2020년 12월 24일자로 출원된 미국 임시 출원 제63/199,421호, 2021년 4월 23일자로 출원된 미국 임시 출원 제63/201,338호 및 2021년 5월 28일자로 출원된 미국 임시 출원 제63/202,179호에 대한 우선권을 주장한다. 상기에 언급된 출원 각각의 전체 내용은 이들의 전문이 참조에 의해 포함된다.
서열 목록 참조
본 출원은 본 명세서와 동시에 제출된 전자 서열 목록의 자료를 참조에 의해 포함한다. 전자 서열 목록의 자료는 2021년 12월 23일에 작성된 파일명 "LT01594_ST25.txt"의 텍스트(.txt) 파일로 제출되며, 이것은 파일 크기가 114 KB이며, 전체 내용이 참조에 의해 본원에 포함된다.
기술분야
본 발명은 표적 핵산 서열의 라이브러리 및 조성물을 제조하는 방법 및 표적 서열의 고 감응성 검출을 위한 용도에 관한 것이다.
낮은 빈도로 존재하는 표적 핵산의 검출을 위해 샘플에 존재하는 하나 이상의 표적 핵산 서열의 라이브러리를 제조하는 방법뿐만 아니라 이를 위한 조성물 및 용도가 제공된다. 방법은 샘플의 적어도 일부를 표적 핵산(들)이 제1 증폭을 겪고 반응에 하나 이상의 표적 특이적 차단 프라이머를 포함하는 조건 하에서 하나 이상의 표적 핵산 서열의 증폭이 가능한 복수의 표적 특이적 프라이머 또는 어댑터와 접촉시키는 것; 생성된 제1 증폭 생성물을 소화시키고 생성된 소화된 앰플리콘을 범용 어댑터 서열에 결찰시키거나 생성된 소화된 앰플리콘을 복구하는 것; 및 제2 증폭에서 결찰된 또는 복구된 생성물을 증폭시킴으로써 표적 핵산 서열의 라이브러리를 생성하는 것을 포함한다. 특정 실시형태에서 제공된 방법은 절단 가능한 기를 포함하는 표적 특이적 프라이머 및 절단 가능한 기가 결여된 표적 특이적 차단 프라이머의 사용을 포함한다. 제공된 방법은 단일의 첨가만의 작업흐름 반응에서 수행될 수 있어서, 고도로 멀티플렉싱된 표적 라이브러리를 신속하게 생성할 수 있다. 생성된 라이브러리 조성물은 서열결정 응용분야를 비롯하여 샘플에서 표적 서열의 분석적 검출을 위한 최적화된 특징부를 제공한다.
본 발명의 일 양태는 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 방법을 포함한다. 특정 실시형태에서 방법은 단일 증폭 반응 혼합물 내에서 복수의 상이한 표적 서열을 포함하는 샘플로부터 상이한 표적 서열의 멀티플렉스를 증폭시켜 - 여기서 증폭은 샘플의 적어도 일부를 증폭 조건 하에서 복수의 표적 특이적 프라이머 및 폴리머라제와 접촉시키는 것을 포함함 -, 상이한 증폭된 표적 서열의 멀티플렉스를 생성하는 것을 포함한다. 제공된 방법은 절단 가능한 기를 갖는 복수의 표적 특이적 프라이머 중 적어도 2개를 포함하고, 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 기를 포함하지 않는다. 방법은 추가로 상이한 증폭된 표적 서열의 멀티플렉스의 절단 가능한 기를 절단하고, 절단된 단부를 형성하는 것 및 적어도 2개의 어댑터를 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나의 절단된 단부에 결찰시켜, 하나 이상의 어댑터 결찰된 증폭된 표적 서열을 생성하여 상이한 어댑터 결찰된 표적 서열의 라이브러리를 제조하는 것을 포함한다. 일부 실시형태에서, 제1 증폭으로부터의 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 양 단부에 절단 가능한 기를 포함하고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 절단 가능한 기를 포함한다. 일부 실시형태에서 절단 가능한 기가 결여된 차단 표적 특이적 프라이머로부터 생성된 앰플리콘은 어댑터를 결찰시킬 수 없다. 특정 실시형태에서 결찰 반응의 어댑터 중 어느 것도 높은 엄격성 조건 하에서 상이한 증폭된 표적 서열의 멀티플렉스 중 어느 하나에 혼성화하지 않는다.
본 발명의 또 다른 양태는 단일 증폭 반응 혼합물 내에서 복수의 상이한 표적 서열을 포함하는 샘플로부터 상이한 표적 서열의 멀티플렉스를 증폭시키는 것을 포함하는, 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 방법을 포함하고, 여기서 증폭은 핵산 샘플을 표적 핵산(들)이 제1 증폭을 겪는 조건 하에서 샘플 내의 하나 이상의 표적 핵산 서열을 증폭시킬 수 있는 복수의 어댑터와 접촉시키는 것을 포함한다. 제공된 방법은 범용 핸들 서열 및 선택적으로 하나 이상의 태그 서열 및 표적 핵산 서열 및 절단 가능한 모이어티를 포함하는 복수의 어댑터 중 적어도 2개를 포함하며, 여기서 어댑터의 표적 핵산 서열은 적어도 하나의 절단 가능한 모이어티를 포함하고, 범용 핸들 서열은 절단 가능한 모이어티를 포함하지 않으며; 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 기, 선택적인 태그 서열 또는 범용 핸들 서열을 포함하지 않는다. 이 방법은 추가로 생성된 제1 증폭 생성물을 소화시켜 생성된 프라이머 이합체를 감소시키거나 제거하고, 부분적으로 소화된 표적 앰플리콘을 제조하는 것, 갭이 있는(gapped) 이중 가닥 앰플리콘을 생성한 다음, 부분적으로 소화된 표적 앰플리콘을 복구하고, 그 다음 범용 프라이머를 사용하여 제2 증폭에서 복구된 표적 앰플리콘을 증폭시켜, 하나 이상의 어댑터 결찰된 증폭된 표적 서열을 생성하는 것을 포함한다. 일부 실시형태에서, 상이한 제1의 증폭된 표적 서열의 생성된 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 양 단부에 절단 가능한 기를 포함하고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 절단 가능한 기를 포함한다. 일부 실시형태에서 범용 핸들이 결여된 차단 표적 특이적 프라이머의 혼입으로부터 생성된 앰플리콘은 제2 증폭 라운드 처리가 가능하지 않으며 서열결정 분석을 위한 앰플리콘을 생성하지 않을 것이다.
추가 양태에서, 조성물이 제공된다. 일부 실시형태에서 본 명세서에 기재된 방법에 의해 생성된 핵산 라이브러리를 포함하는 조성물이 제공된다. 추가 실시형태에서, 복수의 표적 특이적 프라이머를 포함하는 조성물이 제공되며, 여기서 복수의 표적 특이적 프라이머 중 적어도 2개는 절단 가능한 기를 포함하고, 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 기를 포함하지 않는다. 특정 실시형태에서, 조성물은 적어도 2개 내지 최대 십만 개의 표적 특이적 프라이머 쌍 및 적어도 하나 내지 최대 십만 개의 표적 특이적 차단제 프라이머를 포함한다. 다른 실시형태에서, 복수의 핵산 어댑터를 포함하는 조성물이 제공되며, 여기서 복수의 어댑터 중 적어도 2개는 5' 범용 핸들 서열, 하나 이상의 고유한 태그 서열 및 3' 표적 핵산 서열을 포함하고, 여기서 각각의 어댑터는 절단 가능한 모이어티를 포함하고; 복수의 핵산 어댑터 중 적어도 하나는 절단 가능한 기, 범용 핸들 서열 또는 고유한 태그 서열을 포함하지 않는다. 특정 실시형태에서 어댑터의 표적 핵산 서열은 적어도 하나의 절단 가능한 모이어티를 포함하고, 절단 가능한 모이어티는 태그 서열의 두 단부에 플랭킹(flanking)되어 포함되고, 범용 핸들 서열은 절단 가능한 모이어티를 포함하지 않는다. 추가의 특정 실시형태에서, 조성물은 적어도 2개 내지 최대 십만 개의 표적 특이적 어댑터 쌍 및 적어도 하나 내지 최대 십만 개의 표적 특이적 차단제 프라이머를 포함한다.
또한, 핵산 라이브러리의 서열 분석을 위한 제공된 조성물 및 제공된 조성물을 포함하는 키트의 용도가 본 발명의 추가 양태이다. 특정 실시형태에서, 생성된 라이브러리의 서열의 분석은 관심 샘플에서 낮은 빈도의 대립유전자의 검출을 가능하게 한다.
당해 명세서에서 언급된 모든 문헌, 특허, 및 특허 출원은 각각의 개별적인 문헌, 특허, 또는 특허 출원이 참고로 인용되는 것으로 특정하게 개별적으로 지시되는 바와 동일한 정도로 본원에 참고로 인용된다.
본 발명의 특징은 특히 첨부된 청구범위에 기재되어 있다. 본 발명의 특징 및 이익의 더 양호한 이해는 본 발명의 원칙이 이용되는 예시적인 실시형태를 설명하는 상세한 설명, 및 동반된 도면에 참고하여 얻어질 것이고, 도면에서
도 1은 본 발명의 예시적인 실시형태의 개략도를 도시한다.
도 2는 예를 들어, DNA 차단제, RNA 차단제 및/또는 LNA 차단제와 같은 당업계에 알려진 대안적인 차단 기전의 개략도를 도시한다. 차단제 올리고는 야생형 유전자좌에서 프라이머 확장 및 앰플리콘 형성을 방지한다.
도 3a 내지 도 3d는 실시예 1에 기재된 예시적인 결과를 도시한다. 도 3a는 DNA 차단 올리고를 사용한 결과를 도시하고; 도 3b는 RNA 차단 올리고를 사용한 결과를 도시하고; 도 3c는 LNA 차단 올리고를 사용한 결과를 도시하고; 도 3d는 본 발명의 실시형태에 따른 차단 올리고를 사용한 실험 결과를 도시한다.
도 4a 및 도 4b는 실시예 2에 기재된 예시적인 결과를 도시한다. 생성된 122-플렉스 맞춤형 패널은 본 발명에 따른 차단 프라이머를 포함하였다. 도 4a는 기재된 방법을 사용하여 효율적으로 억제된 앰플리콘의 대표적인 결과를 나타낸다. 도 4b는 샘플에서의 실제 돌연변이 빈도를 차단 올리고를 포함하는 샘플에서 검출된 빈도와 비교한 결과를 도시한다.
도 5a 내지 도 5d는 실시예 3에 기재된 예시적인 결과를 도시한다. 도 5a 및 도 5b는 GEX 및/또는 차단 프라이머가 라이브러리 반응에 포함될 때 라이브러리 제제가 변화되지 않음을 입증하는 결과를 도시하고; 도 5c는 차단 프라이머가 존재할 때 낮은 빈도의 융합 검출의 증가를 도시하는데 이것은 농도 의존적 방식의 경향이 있고; 도 5d는 차단 프라이머가 존재할 때 검출된 융합에 대한 전체 매핑된 판독의 백분율이 어떻게 유사하게 증가하는지를 도시하는데 이것은 농도 의존적 방식의 경향이 있다.
도 6a 내지 도 6d는 실시예 4에 기재된 예시적인 결과를 도시한다. 도 5a 및 도 5b는 차단되지 않은 실험 및 차단된 실험에서 Ion AmpliSeq HD 실험으로부터 표적에 대해 식별된 생성된 패밀리를 나타낸 결과를 도시한다. 도 6c 및 도 6d는 패밀리의 수의 증가, 뿐만 아니라 진 양성 및 위 양성 결과에 대한 차단된 실험에서 패밀리의 크기뿐만 아니라 검출된 위 음성의 수 및 크기 둘 다의 감소를 더 자세히 도시한다.
도 7a 내지 도 7d는 실시예 5에 기재된 예시적인 결과를 도시한다. 도 7a는 인간 대조군 유전자를 표적으로 하는 차단 프라이머 세트가 존재할 때 라이브러리 수율의 감소를 도시하고; 도 7b는 증가된 차단 프라이머 쌍과 함께 인간 대조군 판독 서열의 감소를 도시하고; 도 7c는 증가된 차단 프라이머 쌍을 갖는 라이브러리에 존재하는 바이러스 판독의 증가뿐만 아니라 라이브러리 균일성의 결과를 도시하고; 도 7d는 4x 차단 프라이머 쌍에서 명백한 최적 증가와 함께, 차단 프라이머 쌍의 증가에 따른 바이러스 판독의 평균 깊이의 증가를 도시한다.
도 8a 내지 도 8d는 실시예 6에 기재된 예시적인 결과를 도시한다. 도 8a 내지 도 8d 각각은 인간 대조군 유전자, HMBS(8A), ITGB7(8B), TBP(8C), 및 LRP1(8D)이 표적으로 하는 차단 프라이머 세트가 검출된 각각의 대조군 유전자에 존재할 때 라이브러리 수율의 감소를 도시한다.
본 명세서에 사용된 표제 부문은 오직 체계적 목적을 위한 것이고, 어떠한 방식으로든 기재된 특허 대상을 제한하는 것으로 해석되지 않아야 한다. 특허, 특허 출원, 기사, 책, 논문 및 인터넷 웹 페이지를 포함하지만 이들로 제한되는 것은 아닌 본원에서 인용된 모든 문헌 및 유사한 자료는 임의의 목적을 위해 그 전문이 참조문헌으로 명확히 포함된다. 인용된 참조문헌에서의 용어의 정의가 본 교시내용에 제공된 정의와 다르게 보일 때, 본 교시내용에 제공된 정의가 우선한다. 본원의 본 교시내용에 기재된 온도, 농도, 시간 등의 앞에 암시적인 "약"이 존재할 수 있어서, 본 교시내용의 범위 내에 약간의 중요치 않은 편차가 있는 것으로 이해될 것이다. 본원에서, 단수의 사용은 구체적으로 달리 기재되지 않은 한 복수를 포함한다. 본 명세서에서 사용된 단수 형태 "a", "an" 및 "the" 및 단어의 임의의 단수 사용은 명백하고 명확하게 하나의 지시 대상으로 제한되지 않는 한 복수 지시 대상을 포함한다는 것을 주목해야 한다. 또한, "포함한다", "포함", "포함하는", "함유한다", "함유", "함유하는", "포괄한다", "포괄" 및 "포괄하는"의 사용은 제한하는 것을 의도하지 않는다. 일반적인 설명은 모두 예시적이고 설명을 위한 것이며 본 발명을 제한하는 것이 아님을 이해해야 한다.
달리 정의되지 않는 한, 본 명세서에 기재된 본 발명과 관련하여 사용되는 과학 및 기술적 용어는 당업자가 일반적으로 이해하는 의미를 가질 것이다. 또한, 문맥이 달리 요구되지 않는 한, 단수 용어는 복수를 포함하고 복수 용어는 단수를 포함한다. 일반적으로, 본원에서 사용되는 세포 및 조직 배양, 분자 생물학, 단백질 및 올리고- 또는 폴리뉴클레오티드 화학 및 혼성화와 관련하여 사용되는 명명법 및 기술은 잘 알려져 있고 일반적으로 사용되는 것이다. 예를 들어, 핵산 정제 및 제조, 화학 분석, 재조합 핵산 및 올리고뉴클레오티드 합성에 표준 기술이 사용된다. 효소 반응 및 정제 기술은 제조업체의 사양에 따라 또는 당업계에서 일반적으로 달성되거나 본원에 기재된 바와 같이 수행된다. 본 명세서에 기재된 기술 및 절차는 일반적으로 당업계에 잘 알려진 통상적인 방법에 따라 그리고 본 명세서 전반에 걸쳐 인용되고 논의되는 다양한 일반적이고 보다 구체적인 참조 문헌에 기술된 바와 같이 수행된다. 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual (Third ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. 2000)]을 참조한다. 구체적으로 제공되지 않는 한, 본원에 설명된 실험 절차 및 기술과 관련하여 사용되는 모든 명명법은 해당 기술 분야에서 잘 알려져 있고 일반적으로 사용되는 것이다. 본원에 제공된 실시형태에 따라 사용되는 바와 같이, 다음 용어는 달리 나타내지 않는 한 다음 의미를 갖는 것으로 이해되어야 한다:
본원에 사용된, "증폭시키다", "증폭시키는" 또는 "증폭 반응" 및 이들의 파생어는 일반적으로 핵산 분자(주형 핵산 분자라고 함)의 적어도 일부가 적어도 하나의 추가 핵산 분자로 복제 또는 복사된다. 추가 핵산 분자는 선택적으로 주형 핵산 분자의 적어도 일부 부분과 실질적으로 동일하거나 실질적으로 상보적인 서열을 포함한다. 주형 표적 핵산 분자는 단일 가닥 또는 이중 가닥일 수 있다. 추가적인 생성된 복제된 핵산 분자는 독립적으로 단일 가닥 또는 이중 가닥일 수 있다. 일부 실시형태에서, 증폭은 표적 핵산 분자의 적어도 일부 부분의 적어도 하나의 카피의 생산 또는 표적 핵산 분자의 적어도 일부 부분과 상보적인 표적 핵산 서열의 적어도 하나의 카피의 생산을 위한 주형 의존적 시험관내 효소 촉매 반응을 포함한다. 증폭은 선택적으로 핵산 분자의 선형 또는 지수 복제를 포함한다. 일부 실시형태에서, 이러한 증폭은 등온 조건을 사용하여 수행되고; 다른 실시형태에서, 이러한 증폭은 열순환을 포함할 수 있다. 일부 실시형태에서, 증폭은 단일 증폭 반응에서 복수의 표적 서열의 동시 증폭을 포함하는 멀티플렉스 증폭이다. 적어도 일부 표적 서열은 단일 증폭 반응에 포함된 동일한 핵산 분자 또는 상이한 표적 핵산 분자 상에 위치할 수 있다. 일부 실시형태에서, "증폭"은 단독이든 조합이든 DNA- 및/또는 RNA-기반 핵산의 적어도 일부의 증폭을 포함한다. 증폭 반응은 단일 또는 이중 가닥 핵산 기질을 포함할 수 있고, 당업자에게 알려진 임의의 증폭 과정을 추가로 포함할 수 있다. 일부 실시형태에서, 증폭 반응은 폴리머라제 연쇄 반응(PCR)을 포함한다. 일부 실시형태에서, 증폭 반응은 등온 증폭을 포함한다.
본원에서 사용된, "증폭 조건" 및 파생어(예를 들어, 증폭에 대한 조건 등)는 일반적으로 하나 이상의 핵산 서열을 증폭시키기에 적합한 조건을 지칭한다. 증폭은 선형이거나 지수적일 수 있다. 일부 실시형태에서, 증폭 조건은 등온 조건을 포함하거나 대안적으로 열순환 조건, 또는 등온 조건과 열순환 조건의 조합을 포함한다. 일부 실시형태에서, 하나 이상의 표적 핵산 서열을 증폭시키기에 적합한 조건은 폴리머라제 연쇄 반응(PCR) 조건을 포함한다. 전형적으로, 증폭 조건은 하나 이상의 표적 서열과 같은 핵산을 증폭시키거나 하나 이상의 어댑터에 결찰되거나 부착된 증폭된 표적 서열, 예를 들어 어댑터-부착된 증폭 표적 서열을 증폭시키기에 충분한 반응 혼합물을 지칭한다. 일반적으로, 증폭 조건은 증폭 또는 핵산 합성을 위한 촉매, 예를 들어 폴리머라제; 증폭될 핵산에 대해 어느 정도의 상보성을 갖는 프라이머; 및 일단 핵산에 혼성화되면 프라이머의 연장을 촉진하기 위한 데옥시리보뉴클레오시드 트리포스페이트(dNTP)와 같은 뉴클레오티드를 포함한다. 증폭 조건은 핵산에 대한 프라이머의 혼성화 또는 어닐링, 프라이머의 연장 및 연장된 프라이머가 증폭을 겪는 핵산 서열로부터 분리되는 변성 단계를 필요로 할 수 있다. 전형적으로, 반드시 그런 것은 아니지만 증폭 조건은 열순환을 포함할 수 있다. 일부 실시형태에서, 증폭 조건은 어닐링 단계, 연장 단계 및 분리 단계가 반복되는 복수의 주기를 포함한다. 전형적으로, 증폭 조건은 Mg++ 또는 Mn++(예를 들어, MgCl2등)와 같은 양이온을 포함하고 또한 선택적으로 이온 강도의 다양한 개질제를 포함할 수 있다.
본원에 사용된, "표적 서열", "표적 핵산 서열" 또는 "관심 표적 서열" 및 유도체는 일반적으로 본 샘플에 존재할 것으로 의심되거나 예상되는 모든 핵산 서열을 포함하여 개시내용에 따라 증폭 또는 합성될 수 있는 임의의 단일 또는 이중 가닥 핵산 서열을 지칭한다. 일부 실시형태에서, 표적 서열은 이중 가닥 형태로 존재하고, 증폭 또는 합성될 특정 뉴클레오티드 서열의 적어도 일부 또는 표적 특이적 프라이머 또는 부착된 어댑터의 첨가 이전에 이의 상보체를 포함한다. 표적 서열은 증폭 또는 합성 반응에 유용한 프라이머가 폴리머라제에 의한 연장 전에 혼성화할 수 있는 핵산을 포함할 수 있다. 일부 실시형태에서, 이 용어는 뉴클레오티드의 서열 동일성, 순서 또는 위치가 본 개시내용의 방법 중 하나 이상에 의해 결정되는 핵산 서열을 지칭한다.
본원에서 사용된, 용어 "일부" 및 이의 변형은 소정의 핵산 분자, 예를 들어, 프라이머 또는 주형 핵산 분자와 관련하여 사용될 때 핵산 분자의 부분 또는 전체 길이를 포함하여 핵산 분자의 길이 내의 임의의 수의 연속 뉴클레오티드를 포함한다.
본원에서 사용된, "접촉" 및 이의 파생어는 둘 이상의 구성요소와 관련하여 사용되는 경우 일반적으로 언급된 구성요소의 접근, 근접, 혼합 또는 섞임이 이러한 구성요소의 물리적 접촉을 반드시 요구하는 것은 아니면서 촉진되거나 달성되는 임의의 과정을 지칭하고, 언급된 구성요소 중 임의의 하나 이상을 함유하는 용액을 서로 혼합하는 것을 포함한다. 언급된 구성요소는 임의의 특정 순서 또는 조합으로 접촉될 수 있으며 구성요소의 특정 인용 순서는 제한되지 않는다. 예를 들어, "A를 B 및 C와 접촉시키는 것"은 A가 먼저 B와 접촉한 다음 C와 접촉하는 실시형태뿐만 아니라 C가 A와 접촉한 다음 B와 접촉하는 실시형태뿐만 아니라 A 및 C의 혼합물이 B와 접촉하는 등의 실시형태를 포함한다. 또한, 그러한 접촉은 접촉 과정 동안의 어떤 시점에서 모든 언급된 구성요소가 동시에 존재하거나 동일한 혼합물 또는 용액에 동시에 포함되는 한, 접촉 과정의 최종 결과가 참조된 구성요소 모두를 포함하는 혼합물일 것을 반드시 요구하는 것은 아니다. 예를 들어, "A를 B 및 C와 접촉시키는 것"은 C가 먼저 A와 접촉하여 제1 혼합물을 형성하고, 그 다음 제1 혼합물이 B와 접촉하여 제2 혼합물을 형성하고, 그 후 C가 제2 혼합물로부터 제거되는 실시형태를 포함할 수 있고; 선택적으로 그 다음 A가 또한 제거되어 B만 남을 수 있다. 접촉될 하나 이상의 언급된 구성요소가 복수를 포함하는 경우(예를 들어, "표적 서열을 복수의 표적 특이적 프라이머 및 폴리머라제와 접촉시키는 것"), 각각 복수의 구성원은 접촉 과정의 개별 구성요소로 볼 수 있으므로, 접촉은 복수의 임의의 하나 이상의 구성원을 복수의 임의의 다른 구성원 및/또는 임의의 다른 참조된 구성요소와 임의의 순서로 또는 조합으로 접촉시키는 것을 포함할 수 있다(예를 들어, 복수의 표적 특이적 프라이머의 전부는 아니지만 일부는 표적 서열, 그 다음 폴리머라제, 및 그 다음 복수의 표적 특이적 프라이머의 다른 구성원과 접촉될 수 있다).
본원에서 사용된, 용어 "프라이머" 및 이의 파생어는 일반적으로 관심 표적 서열에 혼성화할 수 있는 임의의 폴리뉴클레오티드를 지칭한다. 일부 실시형태에서, 프라이머는 또한 핵산 합성을 프라이밍하는 역할을 할 수 있다. 전형적으로, 프라이머는 폴리머라제에 의해 뉴클레오티드가 중합될 수 있는 기질로 기능하지만; 일부 실시형태에서 프라이머는 합성된 핵산 가닥에 혼입될 수 있고, 또 다른 프라이머가 혼성화할 수 있는 부위를 제공하여 합성된 핵산 분자에 상보적인 새로운 가닥의 합성을 프라이밍할 수 있다. 프라이머는 뉴클레오티드 또는 이의 유사체의 임의의 조합으로 구성될 수 있으며, 선택적으로 연결되어 임의의 적합한 길이의 선형 중합체를 형성할 수 있다. 일부 실시형태에서, 프라이머는 단일 가닥 올리고뉴클레오티드 또는 폴리뉴클레오티드이다. (본 개시내용의 목적을 위해, 용어 '폴리뉴클레오티드' 및 "올리고뉴클레오티드"는 본원에서 상호 교환적으로 사용되며 반드시 둘 사이의 길이 차이를 나타내는 것은 아니다). 일부 실시형태에서, 프라이머는 이중 가닥이다. 이중 가닥인 경우, 프라이머는 먼저, 연장 생성물을 제조하는 데 사용되기 전에 처리되어 그 가닥이 분리된다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오티드이다. 프라이머는 연장 생성물의 합성을 프라이밍하기에 충분히 길어야 한다. 프라이머의 길이는 온도, 프라이머의 공급원 및 방법 사용을 포함한 많은 인자에 따라 달라질 것이다. 일부 실시형태에서, 프라이머는 증폭 또는 합성 조건에 노출될 때 증폭 또는 합성을 위한 개시점으로 작용하고; 이러한 증폭 또는 합성은 주형 의존적 방식으로 발생할 수 있고, 선택적으로 표적 서열의 적어도 일부에 상보적인 프라이머 연장 생성물의 형성을 초래한다. 예시적인 증폭 또는 합성 조건은 프라이머를 폴리뉴클레오티드 주형(예를 들어, 표적 서열을 포함하는 주형), 뉴클레오티드 및 폴리머라제와 같은 유도제와 적합한 온도 및 pH에서 접촉시켜 표적 특이적 프라이머의 단부 상에 뉴클레오티드의 중합을 유도하는 것을 포함할 수 있다. 이중 가닥인 경우 프라이머는 선택적으로 프라이머 연장 생성물을 제조하는 데 사용되기 전에 가닥을 분리하도록 처리될 수 있다. 일부 실시형태에서, 프라이머는 올리고데옥시리보뉴클레오티드 또는 올리고리보뉴클레오티드이다. 일부 실시형태에서, 프라이머는 하나 이상의 뉴클레오티드 유사체를 포함할 수 있다. 표적 특이적 프라이머의 정확한 길이 및/또는 서열을 포함하는 조성은 용융 온도(Tm), GC 함량, 2차 구조의 형성, 반복 뉴클레오티드 모티프, 예측된 프라이머 연장 생성물의 길이, 관심 핵산 분자에 걸친 커버리지 범위, 단일 증폭 또는 합성 반응에 존재하는 프라이머의 수, 프라이머 내의 뉴클레오티드 유사체 또는 변형된 뉴클레오티드의 존재 등을 비롯한 다수의 특성에 영향을 미칠 수 있다. 일부 실시형태에서, 프라이머는 정방향 프라이머 및 역방향 프라이머로 이루어진 프라이머 쌍을 형성하기 위해 증폭 또는 합성 반응 내에서 상용성 프라이머와 쌍을 이룰 수 있다. 일부 실시형태에서, 프라이머 쌍의 정방향 프라이머는 핵산 분자의 가닥의 적어도 일부에 실질적으로 상보적인 서열을 포함하고, 프라이머 쌍의 프라이머의 역방향 프라이머는 가닥의 적어도 일부와 실질적으로 동일한 서열을 포함한다. 일부 실시형태에서, 정방향 프라이머 및 역방향 프라이머는 핵산 듀플렉스의 반대 가닥에 혼성화할 수 있다. 선택적으로, 정방향 프라이머는 제1 핵산 가닥의 합성을 프라이밍하고, 역방향 프라이머는 제2 핵산 가닥의 합성을 프라이밍하고, 여기서 제1 가닥 및 제2 가닥은 서로 실질적으로 상보적이거나, 혼성화하여 이중 가닥 핵산 분자를 형성할 수 있다. 일부 실시형태에서, 증폭 또는 합성 생성물의 한 단부는 정방향 프라이머에 의해 한정되고, 증폭 또는 합성 생성물의 다른 단부는 역방향 프라이머에 의해 한정된다. 일부 실시형태에서, 긴 프라이머 연장 생성물의 증폭 또는 합성이 필요한 경우, 예컨대, 엑손, 암호 영역 또는 유전자의 증폭이 필요한 경우, 영역의 충분한 증폭을 가능하게 하기 위해 원하는 길이에 걸쳐 있는 것보다 여러 프라이머 쌍이 생성될 수 있다. 일부 실시형태에서, 프라이머는 하나 이상의 절단 가능한 기를 포함할 수 있다. 일부 실시형태에서, 프라이머 길이는 길이가 약 10개 내지 약 60개 뉴클레오티드, 약 12개 내지 약 50개 뉴클레오티드 및 약 15개 내지 약 40개 뉴클레오티드의 범위이다. 전형적으로, 프라이머는 상응하는 표적 서열에 혼성화할 수 있고, dNTPS 및 폴리머라제의 존재 하에서 증폭 조건에 노출될 때 프라이머 연장을 겪을 수 있다. 일부 예에서, 특정 뉴클레오티드 서열 또는 프라이머의 일부는 증폭 반응의 초기에 알려져 있거나 본원에 개시된 방법 중 하나 이상에 의해 결정될 수 있다. 일부 실시형태에서, 프라이머는 프라이머 내의 하나 이상의 위치에 하나 이상의 절단 가능한 기를 포함한다.
본원에서 사용된, "표적 특이적 프라이머" 및 이의 유도체는 일반적으로 표적 서열을 포함하는 핵산 분자의 적어도 일부와 적어도 50% 상보적인, 전형적으로 적어도 75% 상보적인 또는 적어도 85% 상보적인, 보다 전형적으로 적어도 90% 상보적인, 보다 전형적으로 적어도 95% 상보적인, 보다 전형적으로 적어도 98% 또는 적어도 99% 상보적인, 또는 동일한 적어도 하나의 서열을 포함하는 단일 가닥 또는 이중 가닥 폴리뉴클레오티드, 전형적으로 올리고뉴클레오티드를 지칭한다. 이러한 예에서, 표적 특이적 프라이머 및 표적 서열은 서로 "상응하는" 것으로 기재된다. 일부 실시형태에서, 표적 특이적 프라이머는 상응하는 표적 서열의 적어도 일부(또는 표적 서열의 상보체)에 혼성화할 수 있고; 이러한 혼성화는 선택적으로 표준 혼성화 조건 또는 엄격한 혼성화 조건 하에서 수행될 수 있다. 일부 실시형태에서, 표적 특이적 프라이머는 표적 서열 또는 이의 상보체에 혼성화할 수 없지만, 표적 서열을 포함하는 핵산 가닥의 일부 또는 이의 상보체에 혼성화할 수 있다. 일부 실시형태에서, 표적 특이적 프라이머는 표적 서열 자체의 적어도 일부와 적어도 75% 상보적인, 전형적으로 적어도 85% 상보적인, 보다 전형적으로 적어도 90% 상보적인, 보다 전형적으로 적어도 95% 상보적인, 보다 전형적으로 적어도 98% 상보적인, 또는 보다 전형적으로 적어도 99% 상보적인 적어도 하나의 서열을 포함하고; 다른 실시형태에서, 표적 특이적 프라이머는 표적 서열 이외의 핵산 분자의 적어도 일부와 적어도 75% 상보적인, 전형적으로 적어도 85% 상보적인, 보다 전형적으로 적어도 90% 상보적인, 보다 전형적으로 적어도 95% 상보적인, 보다 전형적으로 적어도 98% 상보적인, 또는 보다 전형적으로 적어도 99% 상보적인 적어도 하나의 서열을 포함한다. 일부 실시형태에서, 표적 특이적 프라이머는 샘플에 존재하는 다른 표적 서열과 실질적으로 비상보적이고; 선택적으로, 표적 특이적 프라이머는 샘플에 존재하는 다른 핵산 분자와 실질적으로 비상보적이다. 일부 실시형태에서, 표적 서열(또는 표적 서열의 상보체)을 포함하지 않거나 이에 상응하지 않은 샘플에 존재하는 핵산 분자는 "비특이적" 서열 또는 "비특이적 핵산"으로서 지칭된다. 일부 실시형태에서, 표적 특이적 프라이머는 이의 상응하는 표적 서열의 적어도 일부에 실질적으로 상보적인 뉴클레오티드 서열을 포함하도록 설계된다. 일부 실시형태에서, 표적 특이적 프라이머는 이의 전체 길이에 걸쳐 이의 상응하는 표적 서열을 포함하는 핵산 분자의 적어도 일부와 적어도 95% 상보적이거나 적어도 99% 상보적이거나 동일하다. 일부 실시형태에서, 표적 특이적 프라이머는 이의 전체 길이에 걸쳐 이의 상응하는 표적 서열의 적어도 일부와 적어도 90%, 적어도 95% 상보적, 적어도 98% 상보적 또는 적어도 99% 상보적이거나 동일할 수 있다. 일부 실시형태에서, 정방향 표적 특이적 프라이머 및 역방향 표적 특이적 프라이머는 주형 의존적 프라이머 연장을 통해 표적 서열을 증폭시키는 데 사용될 수 있는 표적 특이적 프라이머 쌍을 정의한다. 전형적으로, 표적 특이적 프라이머 쌍의 각각의 프라이머는 상응하는 표적 서열을 포함하는 핵산 분자의 적어도 일부와 실질적으로 상보적이지만 샘플 내의 적어도 하나의 다른 표적 서열과 50% 미만 상보적인 적어도 하나의 서열을 포함한다. 일부 실시형태에서, 증폭은 단일 증폭 반응에서 다중 표적 특이적 프라이머 쌍을 사용하여 수행될 수 있으며, 여기서 각각의 프라이머 쌍은 정방향 표적 특이적 프라이머 및 역방향 표적 특이적 프라이머를 포함하며, 각각은 샘플 내의 상응하는 표적 서열과 실질적으로 상보적이거나 실질적으로 동일한 적어도 하나의 서열을 포함하고, 각각의 프라이머 쌍은 상이한 상응하는 표적 서열을 갖는다. 일부 실시형태에서, 표적 특이적 프라이머는 증폭 반응에 존재하는 임의의 다른 표적 특이적 프라이머에 대해 3' 단부 또는 5' 단부에서 실질적으로 비-상보적일 수 있다. 일부 실시형태에서, 표적 특이적 프라이머는 증폭 반응에서 다른 표적 특이적 프라이머에 대한 최소 교차 혼성화를 포함할 수 있다. 일부 실시형태에서, 표적 특이적 프라이머는 증폭 반응 혼합물에서 비특이적 서열에 대한 최소 교차 혼성화를 포함한다. 일부 실시형태에서, 표적 특이적 프라이머는 최소 자기-상보성을 포함한다. 일부 실시형태에서, 표적 특이적 프라이머는 3' 단부에 위치한 하나 이상의 절단 가능한 기를 포함할 수 있다. 일부 실시형태에서, 표적 특이적 프라이머는 표적 특이적 프라이머의 중심 뉴클레오티드 근처 또는 그 주위에 위치한 하나 이상의 절단 가능한 기를 포함할 수 있다. 일부 실시형태에서, 하나 이상의 표적 특이적 프라이머는 표적 특이적 프라이머의 5' 단부에서 절단 불가능한 뉴클레오티드만을 포함한다. 일부 실시형태에서, 표적 특이적 프라이머는 선택적으로 동일한 증폭 반응에서 하나 이상의 상이한 표적 특이적 프라이머와 비교할 때 프라이머의 3' 단부 또는 5' 단부에서 최소 뉴클레오티드 서열 중첩을 포함한다. 일부 실시형태에서, 단일 반응 혼합물 내의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 표적 특이적 프라이머는 상기 실시형태 중 하나 이상을 포함한다. 일부 실시형태에서, 단일 반응 혼합물 내의 복수의 표적 특이적 프라이머의 실질적으로 전부는 상기 실시형태 중 하나 이상을 포함한다.
본원에서 사용된, 용어 "어댑터"는 관심 폴리뉴클레오티드의 조작에 사용될 수 있는 핵산 분자를 나타낸다. 일부 실시형태에서, 어댑터는 하나 이상의 표적 핵산의 증폭을 위해 사용된다. 일부 실시형태에서, 어댑터는 서열결정을 위한 반응에 사용된다. 일부 실시형태에서, 어댑터는 5' 포스페이트 잔기가 결여된 하나 이상의 단부를 갖는다. 일부 실시형태에서, 어댑터는 적어도 하나의 프라이밍 부위를 포함하거나, 이것으로 이루어지거나, 이것으로 본질적으로 이루어진다. 어댑터를 함유하는 이러한 프라이밍 부위는 "프라이머" 어댑터로 지칭될 수 있다. 일부 실시형태에서, 어댑터 프라이밍 부위는 PCR 과정에서 유용할 수 있다. 일부 실시형태에서, 어댑터는 본원에서 유전자 특이적 표적 서열, 표적 특이적 서열 또는 표적 특이적 프라이머라고 지칭되는, 샘플 내의 적어도 하나의 표적 서열의 3' 단부 또는 5' 단부에 실질적으로 상보적인 핵산 서열을 포함한다. 일부 실시형태에서, 어댑터는 샘플에 존재하는 임의의 표적 서열의 3' 단부 또는 5' 단부와 실질적으로 비상보적인 핵산 서열을 포함한다. 일부 실시형태에서, 어댑터는 표적 핵산 서열과 실질적으로 상보적이지 않은 단일 가닥 또는 이중 가닥 선형 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 어댑터는 적어도 하나, 바람직하게는 샘플의 핵산 분자의 일부 또는 전부와 실질적으로 비상보적인 핵산 서열을 포함한다. 일부 실시형태에서, 적합한 어댑터 길이는 길이가 약 10개 내지 75개 뉴클레오티드, 약 12개 내지 50개 뉴클레오티드 및 약 15개 내지 40개 뉴클레오티드의 범위이다. 일반적으로, 어댑터는 뉴클레오티드 및/또는 핵산의 임의의 조합을 포함할 수 있다. 일부 양태에서, 어댑터는 하나 이상의 위치에서 하나 이상의 절단 가능한 기를 포함한다. 일부 실시형태에서, 어댑터는 프라이머, 예를 들어, 범용 프라이머의 적어도 일부와 실질적으로 동일하거나 실질적으로 상보적인 서열을 포함한다. 일부 실시형태에서, 어댑터는 목록화, 식별 또는 서열결정을 돕기 위한 태그 서열을 포함한다. 일부 실시형태에서, 어댑터는 특히 적합한 온도 및 pH 하에서 폴리머라제 및 dNTP의 존재 하에 표적 서열의 증폭을 위한 기질로서 작용한다.
본원에서 사용된, "폴리머라제" 및 이의 유도체는 일반적으로 뉴클레오티드(이의 유사체 포함)의 핵산 가닥으로의 중합을 촉매할 수 있는 임의의 효소를 지칭한다. 반드시 그런 것은 아니지만 전형적으로 이러한 뉴클레오티드 중합은 주형 의존적 방식으로 발생할 수 있다. 이러한 폴리머라제는 자연 발생 폴리머라제 및 이의 임의의 소단위 및 절단부, 돌연변이 폴리머라제, 변이 폴리머라제, 재조합, 융합 또는 달리 조작된 폴리머라제, 화학적으로 변형된 폴리머라제, 합성 분자 또는 어셈블리 및 그러한 중합을 촉매하는 능력을 보유하는 이의 임의의 유사체, 유도체 또는 단편을 포함할 수 있다. 선택적으로, 폴리머라제는 하나 이상의 아미노산을 다른 아미노산으로 대체하는 것, 폴리머라제로부터 하나 이상의 아미노산의 삽입 또는 결실시키는 것, 또는 2개 이상의 폴리머라제의 부분을 연결하는 것을 포함하는 하나 이상의 돌연변이를 포함하는 돌연변이 폴리머라제일 수 있다. 전형적으로, 폴리머라제는 뉴클레오티드 결합 및/또는 뉴클레오티드 중합 촉매작용이 일어날 수 있는 하나 이상의 활성 부위를 포함한다. 일부 예시적인 폴리머라제는 제한 없이 DNA 폴리머라제 및 RNA 폴리머라제를 포함한다. 본원에서 사용된, 용어 "폴리머라제" 및 이의 변이체는 또한 서로 연결된 적어도 2개의 부분을 포함하는 융합 단백질을 지칭하며, 여기서 제1 부분은 뉴클레오티드의 핵산 가닥으로의 중합을 촉매할 수 있는 펩티드를 포함하고 제2 폴리펩티드를 포함하는 제2 부분에 연결되어 있다. 일부 실시형태에서, 제2 폴리펩티드는 리포터 효소 또는 처리능력-향상 도메인을 포함할 수 있다. 선택적으로, 폴리머라제는 5' 엑소뉴클레아제 활성 또는 말단 트랜스퍼라제 활성을 가질 수 있다. 일부 실시형태에서, 폴리머라제는 예를 들어, 열, 화학물질의 사용 또는 새로운 양의 폴리머라제를 반응 혼합물에 재첨가함으로써 선택적으로 재활성화될 수 있다. 일부 실시형태에서, 폴리머라제는 핫-스타트 폴리머라제 및/또는 선택적으로 재활성화될 수 있는 어댑터 기반 폴리머라제를 포함할 수 있다.
본원에서 사용된, 용어 "동일성" 및 "동일한" 및 이들의 변형은 2개 이상의 핵산 서열과 관련하여 사용될 때 2개 이상의 서열(예를 들어, 뉴클레오티드 또는 폴리펩티드 서열)의 서열 유사성을 지칭한다. 2개 이상의 상동성 서열의 맥락에서, 서열 또는 이의 하위서열의 동일성 또는 상동성 퍼센트는 동일한(즉, 약 70% 동일성, 바람직하게는 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 동일성) 모든 단량체 단위(예를 들어, 뉴클레오티드 또는 아미노산)의 백분율을 나타낸다. 퍼센트 동일성은 비교 창에 걸쳐 최대 상응성을 위해 비교 및 정렬될 때 명시된 영역에 걸쳐 있을 수 있으며, 또는 하기에 기재된 기본 매개변수와 함께 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 사용하거나 수동 정렬 및 육안 검사에 의해 측정된 지정된 영역에 걸쳐 있을 수 있다. 서열은 아미노산 수준 또는 뉴클레오티드 수준에서 적어도 85%의 동일성이 있을 때 "실질적으로 동일"하다고 한다. 바람직하게는, 동일성은 길이가 적어도 약 25개, 50개 또는 100개 잔기인 영역에 걸쳐 존재하거나 적어도 하나의 비교 서열의 전체 길이에 걸쳐 존재한다. 퍼센트 서열 동일성 및 서열 유사성을 결정하기 위한 전형적인 알고리즘은 문헌[Altschul et al, Nuc. Acids Res. 25:3389-3402 (1977)]에 기재된 BLAST 및 BLAST 2.0 알고리즘이다. 다른 방법은 문헌[Smith & Waterman, Adv. Appl. Math. 2:482 (1981)] 및 문헌[Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)] 등의 알고리즘을 포함한다. 2개의 핵산 서열이 실질적으로 동일하다는 또 다른 징후는 2개의 분자 또는 이들의 상보체가 엄격한 혼성화 조건 하에서 서로 혼성화한다는 것이다.
본원에서 사용된, 용어 "상보적인" 및 "상보체" 및 이들의 변형은 혼성 듀플렉스에서와 같이 역평행 배향으로 2개 이상의 개별 상응하는 위치에서 누적 염기쌍 형성을 겪을 수 있는 임의의 2개 이상의 핵산 서열(예를 들어, 주형 핵산 분자, 표적 서열 및/또는 프라이머의 일부 또는 전체)을 지칭한다. 이러한 염기쌍 형성은 예를 들어, Watson-Crick 염기쌍 형성 규칙 또는 일부 다른 염기 쌍 형성 패러다임에 따라 설정된 규칙의 임의의 세트에 따라 진행될 수 있다. 선택적으로 제1 핵산 서열과 제2 핵산 서열 사이에 "완전한" 또는 "전체" 상보성이 존재할 수 있고, 여기서 제1 핵산 서열 내의 각각의 뉴클레오티드는 제2 핵산 서열 상의 상응하는 역평행 위치에서 뉴클레오티드와 안정화 염기쌍 형성 상호작용을 겪을 수 있다. "부분적" 상보성은 하나의 핵산 서열의 잔기의 적어도 20%, 단 100% 미만이 다른 핵산 서열 내의 잔기와 상보적인 핵산 서열을 설명한다. 일부 실시형태에서, 하나의 핵산 서열의 잔기의 적어도 50%, 단 100% 미만이 다른 핵산 서열 내의 잔기와 상보적이다. 일부 실시형태에서, 하나의 핵산 서열의 잔기의 적어도 70%, 80%, 90%, 95% 또는 98%, 단 100% 미만은 다른 핵산 서열의 잔기와 상보적이다. 서열은 하나의 핵산 서열의 잔기 중 적어도 85%가 다른 핵산 서열의 잔기와 상보적일 때 "실질적으로 상보적"이라고 한다. 일부 실시형태에서, 2개의 상보적이거나 실질적으로 상보적인 서열은 표준 또는 엄격한 혼성화 조건 하에 서로 혼성화할 수 있다. "비상보적"은 하나의 핵산 서열의 잔기의 20% 미만이 다른 핵산 서열의 잔기와 상보적인 핵산 서열을 설명한다. 서열은 하나의 핵산 서열의 잔기 중 15% 미만이 다른 핵산 서열의 잔기와 상보적일 때 "실질적으로 비상보적"이라고 한다. 일부 실시형태에서, 2개의 비상보적이거나 실질적으로 비상보적인 서열은 표준 또는 엄격한 혼성화 조건 하에 서로 혼성화할 수 없다. "불일치"는 상보적이지 않은 2개의 반대 뉴클레오티드의 임의의 위치에 존재한다. 상보적 뉴클레오티드는 생리학적 조건 하에서 DNA 복제 동안 서로 반대되는 DNA 폴리머라제에 의해 효율적으로 혼입되는 뉴클레오티드를 포함한다. 전형적인 실시형태에서, 상보적인 뉴클레오티드는 서로 역평행인 위치에 있는 뉴클레오티드 및/또는 폴리뉴클레오티드의 핵염기 사이에서, 특정 Watson-Crick 유형의 수소 결합을 통해 형성된 A-T/U 및 G-C 염기쌍 또는 염기쌍 형성 패러다임의 일부 다른 유형을 통해서 형성된 염기 쌍과 같이, 서로 염기쌍을 형성할 수 있다. 다른 인공 염기 쌍의 상보성은 다른 유형의 수소 결합 및/또는 염기의 소수성 및/또는 염기들 간의 형상 상보성에 기초할 수 있다.
본원에서 사용된, "증폭된 표적 서열" 및 이의 파생어는 일반적으로 표적 특이적 프라이머 및 본원에 제공된 방법을 사용하여 표적 서열을 증폭/증폭시킴으로써 생성된 핵산 서열을 지칭한다. 증폭된 표적 서열은 표적 서열에 대해 동일한 센스(제2 라운드 및 후속 짝수 번째 증폭 라운드에서 생산된 양성 가닥) 또는 안티센스(즉, 제1 라운드 및 후속 홀수 번째 증폭 라운드 동안 생성된 음성 가닥) 중 하나일 수 있다. 본 개시내용의 목적을 위해, 증폭된 표적 서열은 전형적으로 반응에서 또 다른 증폭된 표적 서열의 임의의 부분에 대해 50% 미만으로 상보적이다.
본원에서 사용된, 용어 "결찰시키는", "결찰" 및 이의 파생어는 일반적으로 2개 이상의 분자를 함께 공유적으로 연결시키는 행동 또는 과정, 예를 들어 2개 이상의 핵산 분자를 서로 공유적으로 연결하는 것을 지칭한다. 일부 실시형태에서, 결찰은 핵산의 인접한 뉴클레오티드들 사이에 닉(nick)을 연결하는 것을 포함한다. 일부 실시형태에서, 결찰은 제1 핵산 분자의 단부와 제2 핵산 분자의 단부 사이에 공유 결합을 형성하는 것을 포함한다. 일부 실시형태에서, 예를 들어, 결찰될 핵산 분자가 종래의 뉴클레오티드 잔기를 포함하는 실시형태에서, 결찰은 하나의 핵산의 5' 포스페이트 기와 제2 핵산의 3' 하이드록실 기 사이에 공유 결합을 형성하여 결찰된 핵산 분자를 형성하는 것을 포함할 수 있다. 일부 실시형태에서, 닉을 연결하거나 인접한 뉴클레오티드 사이에서 5'포스페이트를 3' 하이드록실에 결합시키기 위한 임의의 수단이 사용될 수 있다. 예시적인 실시형태에서, 리가제와 같은 효소가 사용될 수 있다.
본원에 사용된, "리가제" 및 이의 파생어는 일반적으로 2개의 기질 분자의 결찰을 촉매할 수 있는 임의의 작용제를 지칭한다. 일부 실시형태에서, 리가제는 핵산의 인접한 뉴클레오티드 사이에서 닉의 연결을 촉매할 수 있는 효소를 포함한다. 일부 실시형태에서, 리가제는 하나의 핵산 분자의 5' 포스페이트와 또 다른 핵산 분자의 3' 하이드록실 사이의 공유 결합의 형성을 촉매하여 결찰된 핵산 분자를 형성할 수 있는 효소를 포함한다. 적합한 리가제는 T4 DNA 리가제; T7 DNA 리가제; Taq DNA 리가제 및 이.콜라이 DNA 리가제를 포함할 수 있지만 이들로 제한되지 않는다.
본원에 정의된 바와 같이, "절단 가능한 기"는 일반적으로 일단 핵산에 혼입되면 적절한 조건 하에서 절단될 수 있는 임의의 모이어티를 지칭한다. 예를 들어, 절단 가능한 기는 샘플의 표적 특이적 프라이머, 증폭된 서열, 어댑터 또는 핵산 분자에 혼입될 수 있다. 예시적인 실시형태에서, 표적 특이적 프라이머는 증폭된 생성물에 혼입되고 증폭 후 후속적으로 절단되어, 증폭된 생성물로부터의 표적 특이적 프라이머의 일부 또는 전부를 제거하는 절단 가능한 기를 포함할 수 있다. 절단 가능한 기는 임의의 허용 가능한 수단에 의해 샘플의 표적-특이적 프라이머, 증폭된 서열, 어댑터 또는 핵산 분자로부터 절단되거나 달리 제거될 수 있다. 예를 들어, 효소적, 열적, 광산화적 또는 화학적 처리에 의해 샘플의 표적 특이적 프라이머, 증폭된 서열, 어댑터 또는 핵산 분자로부터 절단 가능한 기가 제거될 수 있다. 일 양태에서, 절단 가능한 기는 자연적으로 발생하지 않는 핵염기를 포함할 수 있다. 예를 들어, 올리고데옥시리보뉴클레오티드는 우라실 글리코실라제에 의해 제거될 수 있는 우라실과 같은 하나 이상의 RNA 핵염기를 포함할 수 있다. 일부 실시형태에서, 절단 가능한 기는 하나 이상의 변형된 핵염기(예를 들어, 7-메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실 또는 5-메틸시토신) 또는 하나 이상의 변형된 뉴클레오시드(즉, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘 또는 5-메틸시티딘)를 포함할 수 있다. 변형된 핵염기 또는 뉴클레오티드는 효소적, 화학적 또는 열적 수단에 의해 핵산에서 제거될 수 있다. 일 실시형태에서, 절단 가능한 기는 자외선에 대한 노출 시에 증폭(또는 합성) 후에 프라이머로부터 제거될 수 있는 모이어티(즉, 브로모데옥시우리딘)를 포함할 수 있다. 또 다른 실시형태에서, 절단 가능한 기는 메틸화된 시토신을 포함할 수 있다. 전형적으로, 메틸화된 시토신은 예를 들어, 아황산수소나트륨 처리 시 증폭(또는 합성) 유도 후에 프라이머로부터 절단될 수 있다. 일부 실시형태에서, 절단 가능한 모이어티는 제한 부위를 포함할 수 있다. 예를 들어, 프라이머 또는 표적 서열은 하나 이상의 제한 효소에 특이적인 핵산 서열을 포함할 수 있고, 증폭(또는 합성) 후, 프라이머 또는 표적 서열은 하나 이상의 제한 효소로 처리되어 절단 가능한 기가 제거될 수 있다. 전형적으로, 하나 이상의 절단 가능한 기는 샘플의 표적-특이적 프라이머, 증폭된 서열, 어댑터 또는 핵산 분자와 함께 하나 이상의 위치에 포함될 수 있다.
본원에서 사용된, "소화", "소화 단계" 및 이의 파생어는 일반적으로 절단 가능한 기가 절단되거나 또는 샘플의 표적 특이적 프라이머, 증폭된 서열, 어댑터 또는 핵산 분자로부터 달리 제거되는 임의의 과정을 지칭한다. 일부 실시형태에서, 소화 단계는 화학적, 열적, 광산화적 또는 소화 과정을 포함한다.
본원에서 사용된, 용어 "혼성화"는 당업계에서의 사용과 일치하며, 일반적으로 2개의 핵산 분자가 염기쌍 상호작용을 겪는 과정을 지칭한다. 2개의 핵산 분자는 하나의 핵산 분자의 임의의 부분이 다른 핵산 분자의 임의의 부분과 염기쌍을 형성 때 혼성화되었다고 하고; 2개의 핵산 분자가 각각의 전체 길이에 걸쳐 반드시 혼성화될 필요는 없고, 일부 실시형태에서, 핵산 분자 중 적어도 하나는 다른 핵산 분자에 혼성화되지 않는 부분을 포함할 수 있다. "엄격한 조건 하에서의 혼성화"라는 어구 및 이의 변형은 일반적으로 높은 혼성화 온도 및 낮은 이온 강도의 존재 하에서 표적 서열에 대한 표적 특이적 프라이머의 혼성화가 일어나는 조건을 지칭한다. 본원에서 사용된, "표준 혼성화 조건"이라는 어구 및 이의 변형은 일반적으로 올리고뉴클레오티드(즉, 표적 서열)에 대한 프라이머의 혼성화가 낮은 혼성화 온도 및 높은 이온 강도의 존재 하에 일어나는 조건을 지칭한다. 예시적인 일 실시형태에서, 표준 혼성화 조건은 약 50℃ 내지 55℃에서 약 100 mm 황산마그네슘, 약 500 mM Tris-황산염(pH 8.9), 및 약 200 mM 황산암모늄 또는 이들의 등가물을 함유하는 수성 환경을 포함한다.
본원에 사용된, 용어 "단부" 및 이의 변형은 핵산 분자, 예를 들어, 표적 서열 또는 증폭된 표적 서열과 관련하여 사용될 때 핵산 분자의 말단 30개 뉴클레오티드, 말단 20개 및 훨씬 더 전형적으로 말단 15개 뉴클레오티드를 포함할 수 있다. 연결된 일련의 연속 뉴클레오티드로 구성된 선형 핵산 분자는 전형적으로 적어도 2개의 단부를 포함한다. 일부 실시형태에서, 핵산 분자의 한 단부는 3' 하이드록실 기 또는 이의 등가물을 포함할 수 있고, "3' 단부" 및 이의 파생어로 지칭될 수 있다. 선택적으로, 3' 단부는 모노뉴클레오티드 펜토스 고리의 5' 포스페이트 기에 연결되지 않은 3' 하이드록실 기를 포함한다. 전형적으로, 3' 단부는 연결되지 않은 3' 하이드록실 기를 포함하는 뉴클레오티드에 인접하여 위치하는 하나 이상의 5' 연결된 뉴클레오티드를 포함하며, 전형적으로 3' 하이드록실에 인접하여 위치하는 30개의 뉴클레오티드, 전형적으로 말단 20개 및 훨씬 더 전형적으로 말단 15개 뉴클레오티드를 포함한다. 일반적으로, 하나 이상의 연결된 뉴클레오티드는 올리고뉴클레오티드에 존재하는 뉴클레오티드의 백분율로 표현될 수 있거나, 연결되지 않은 3' 하이드록실에 인접한 연결된 뉴클레오티드의 수로 제공될 수 있다. 예를 들어, 3' 단부는 올리고뉴클레오티드의 뉴클레오티드 길이의 50% 미만을 포함할 수 있다. 일부 실시형태에서, 3' 단부는 임의의 연결되지 않은 3' 하이드록실 기를 포함하지 않지만, 프라이머 연장 및/또는 뉴클레오티드 중합을 통해 뉴클레오티드의 부착을 위한 부위로 작용할 수 있는 임의의 모이어티를 포함할 수 있다. 일부 실시형태에서, 예를 들어 표적 특이적 프라이머를 언급할 때 "3' 단부"라는 용어는 3'단부에서 말단 10개 뉴클레오티드, 말단 5개 뉴클레오티드, 말단 4개, 3개, 2개 또는 그 보다 더 적은 수의 뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 표적 특이적 프라이머를 지칭할 때 용어 "3' 단부"는 3' 말단으로부터 10개 이하의 뉴클레오티드 위치에 위치한 뉴클레오티드를 포함할 수 있다. 본원에서 사용된, "5' 단부" 및 이의 파생어는 일반적으로 핵산 분자의 단부, 예를 들어, 유리 5' 포스페이트 기 또는 이의 등가물을 포함하는 표적 서열 또는 증폭된 표적 서열을 지칭한다. 일부 실시형태에서, 5' 단부는 이웃하는 모노뉴클레오티드 펜토스 고리의 3' 하이드록실에 연결되지 않은 5' 포스페이트 기를 포함한다. 전형적으로, 5' 단부는 5' 포스페이트에 인접하여 위치하는 하나 이상의 연결된 뉴클레오티드, 전형적으로 5' 포스페이트 기를 포함하는 뉴클레오티드에 인접하여 위치하는 30개의 뉴클레오티드, 전형적으로 말단 20개 및 보다 더 전형적으로는 말단 15개 뉴클레오티드를 포함한다. 일반적으로, 하나 이상의 연결된 뉴클레오티드는 올리고뉴클레오티드에 존재하는 뉴클레오티드의 백분율로 표현될 수 있거나, 5' 포스페이트에 인접한 연결된 뉴클레오티드의 수로 제공될 수 있다. 예를 들어, 5' 단부는 올리고뉴클레오티드의 뉴클레오티드 길이의 50% 미만일 수 있다. 또 다른 예시적인 실시형태에서, 5' 단부는 말단 5' 포스페이트를 포함하는 뉴클레오티드에 인접한 약 15개의 뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 5' 단부는 임의의 연결되지 않은 5' 포스페이트 기를 포함하지 않지만, 3' 하이드록실 기 또는 또 다른 핵산 분자의 3' 단부에 대한 부착 부위로 작용할 수 있는 임의의 모이어티를 포함할 수 있다. 일부 실시형태에서, 예를 들어 표적 특이적 프라이머를 언급할 때 "5' 단부"라는 용어는 5'단부에서 말단 10개 뉴클레오티드, 말단 5개 뉴클레오티드, 말단 4개, 3개, 2개 또는 그 보다 더 적은 수의 뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 표적 특이적 프라이머를 지칭할 때 용어 "5' 단부"는 5' 말단으로부터 10개 이하의 위치에 위치한 뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 표적 특이적 프라이머의 5' 단부는 절단 불가능한 뉴클레오티드, 예를 들어, 본원에 개시된 바와 같은 하나 이상의 절단 가능한 기를 함유하지 않는 뉴클레오티드 또는 당업자에 의해서 쉽게 결정되는 바와 같은 절단 가능한 뉴클레오티드만을 포함할 수 있다. 폴리뉴클레오티드의 "제1 단부" 및 "제2 단부"는 폴리뉴클레오티드의 5' 단부 또는 3' 단부를 지칭한다. 폴리뉴클레오티드의 제1 단부 또는 제2 단부는 폴리뉴클레오티드의 5' 단부 또는 3' 단부일 수 있고; 용어 "제1" 및 "제2"는 단부가 구체적으로 5' 단부 또는 3' 단부임을 나타내기 위한 것이 아니다.
본원에서 사용된, "태그", "바코드", "고유한 태그" 또는 "태그 서열" 및 이의 파생어는 일반적으로 샘플에서 복수의 증폭된 표적 서열을 구별하거나 분리하기 위한 '키'로 작용할 수 있는 어댑터 또는 프라이머 내의 고유한 짧은(6개 내지 14개 뉴클레오티드) 핵산 서열을 지칭한다. 본 개시내용의 목적을 위해, 바코드 또는 고유한 태그 서열은 어댑터 또는 프라이머의 뉴클레오티드 서열에 혼입된다. 본원에서 사용된, "바코드 서열"은 관심 핵산 서열의 샘플 또는 공급원의 식별을 가능 하게 하기에 충분한 핵산 고정 서열을 나타낸다. 바코드 서열은 식별의 기반이 되는 본래 핵산 서열의 작은 부분일 수 있지만 그럴 필요는 없다. 일부 실시형태에서 바코드는 5개 내지 20개의 핵산 길이이다. 일부 실시형태에서, 바코드는 L-DNA, LNA, PNA 등과 같은 아날로그 뉴클레오티드로 구성된다. 본원에서 사용된, "고유한 태그 서열"은 적어도 하나의 무작위 서열 및 적어도 하나의 고정 서열을 갖는 핵산 서열을 지칭한다. 고유한 태그 서열은 단독으로 또는 제2 고유한 태그 서열과 함께 샘플에서 단일 표적 핵산 분자의 식별을 허용하기에 충분하다. 고유한 태그 서열은 본래 표적 핵산 서열의 작은 부분을 포함할 수 있지만 그럴 필요는 없다. 일부 실시형태에서, 고유한 태그 서열은 길이가 2개 내지 50개의 뉴클레오티드 또는 염기쌍, 또는 2개 내지 25개의 뉴클레오티드 또는 염기쌍, 또는 2개 내지 10개의 뉴클레오티드 또는 염기쌍이다. 고유한 태그 서열은 고정된 서열이 산재된 적어도 하나의 무작위 서열을 포함할 수 있다.
본원에서 사용된, "비교 가능한 최대 최소 용융 온도(comparable maximal minimum melting temperature)" 및 이의 파생어는 일반적으로 절단 가능한 기의 소화 후 단일 어댑터 또는 표적 특이적 프라이머에 대한 각각의 핵산 단편의 용융 온도(Tm)를 지칭한다. 어댑터 또는 표적 특이적 프라이머에 의해 생성된 각각의 핵산 단편의 혼성화 온도는 표적 특이적 프라이머 또는 어댑터 또는 이의 단편 또는 부분으로부터 각각의 표적 서열으로의 핵산 서열의 혼성화를 방지하는 데 필요한 최대 최소 온도를 결정하기 위해 비교된다. 최대 혼성화 온도가 알려지면, 예를 들어, 프라이머의 길이를 따라 하나 이상의 절단 가능한 기(들)의 위치를 이동시킴으로써 어댑터 또는 표적 특이적 프라이머를 조작하여, 각각의 핵산 단편에 대한 비교 가능한 최대 최소 용융 온도를 달성하여 라이브러리 제제의 소화 및 복구 단계를 최적화할 수 있다.
본원에서 사용된, "첨가 단독" 및 이의 파생어는 일반적으로 시약 및 구성요소가 제1 또는 단일 반응 혼합물에 첨가되는 일련의 단계를 지칭한다. 전형적으로, 일련의 단계는 일련의 단계를 완료하기 위해 반응 혼합물을 제1 용기에서 제2 용기로 제거하는 것을 배제한다. 일반적으로, 첨가 단독 공정은 반응 혼합물을 함유하는 용기 외부에서의 반응 혼합물의 조작을 배제한다. 전형적으로, 첨가 단독 공정은 자동화 및 높은 처리량에 적합하다.
본원에서 사용된, "중합 조건" 및 이의 파생어는 일반적으로 뉴클레오티드 중합에 적합한 조건을 지칭한다. 전형적인 실시형태에서, 이러한 뉴클레오티드 중합은 폴리머라제에 의해 촉매된다. 일부 실시형태에서, 중합 조건은 프라이머 연장을 위한 조건을 포함하며, 선택적으로 주형 의존적 방식으로, 합성된 핵산 서열을 생성한다. 일부 실시형태에서, 중합 조건은 폴리머라제 연쇄 반응(PCR)을 포함한다. 전형적으로, 중합 조건은 핵산을 합성하기에 충분하고 폴리머라제 및 뉴클레오티드를 포함하는 반응 혼합물의 사용을 포함한다. 중합 조건은 표적 서열에 대한 표적 특이적 프라이머의 어닐링 및 폴리머라제의 존재 하에서 주형 의존적 방식으로 프라이머의 연장을 위한 조건을 포함할 수 있다. 일부 실시형태에서, 중합 조건은 열순환을 사용하여 실행될 수 있다. 추가로, 중합 조건은 2개의 핵산 가닥을 어닐링하는 단계, 연장시키는 단계 및 분리하는 단계가 반복되는 복수의 주기를 포함할 수 있다. 전형적으로, 중합 조건은 양이온, 예컨대, MgCl2를 포함한다. 일반적으로, 핵산 가닥을 형성하기 위한 하나 이상의 뉴클레오티드의 중합은 뉴클레오티드가 포스포디에스테르 결합을 통해 서로에 연결되는 것을 포함하지만, 대안적인 연결부가 특정 뉴클레오티드 유사체의 맥락에서 가능할 수 있다.
본원에서 사용된, 용어 "핵산"은 자연 핵산, 인공 핵산, 이들의 유사체 또는 폴리뉴클레오티드 및 올리고뉴클레오티드를 포함하는 이들의 조합을 지칭한다. 본원에서 사용된, 용어 "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며, 뉴클레오티드간 포스포디에스테르 결합 연결부, 예를 들어, 3'-5' 및 2'-5', 반전 연결부, 예를 들어, 3'-3' 및 5'-5' 분지형 구조 또는 유사체 핵산 의해서 연결된 2'-데옥시리보뉴클레오티드(핵산) 및 리보뉴클레오티드(RNA)를 포함하지만 이들로 제한되지 않은 뉴클레오티드의 단일 가닥 및 이중 가닥 중합체를 의미한다. 폴리뉴클레오티드는 회합된 반대 이온, 예컨대, H+, NH4 +, 트리알킬암모늄, Mg2+, Na+ 등을 갖는다. 올리고뉴클레오티드는 전체가 데옥시리보뉴클레오티드, 전체가 리보뉴클레오티드 또는 이들의 키메라 혼합물로 구성될 수 있다. 올리고뉴클레오티드는 핵염기 및 당 유사체로 구성될 수 있다. 폴리뉴클레오티드는 이들이 당업계에서 올리고뉴클레오티드로 보다 빈번하게 언급되는 경우 전형적으로 몇몇 단량체 단위, 예를 들어, 5개 내지 40개 크기의 범위이고, 이들이 당업계에서 폴리뉴클레오티드로 보다 일반적으로 지칭되는 경우에는 수천 개의 단량체 뉴클레오티드 단위의 크기 범위이지만; 그러나, 본 개시내용의 목적을 위해 올리고뉴클레오티드 및 폴리뉴클레오티드 모두 임의의 적합한 길이일 수 있다. 달리 표시되지 않는 한, 올리고뉴클레오티드 서열이 표시될 때마다, 뉴클레오티드는 왼쪽에서 오른쪽으로 5'에서 3' 순서이고 "A"는 데옥시아데노신을 나타내고, "C"는 데옥시시티딘을 나타내고, "G"는 데옥시구아노신을 나타내고, "T"는 티미딘을 나타내고, "U"는 데옥시우리딘을 나타낸다. 본원에서 논의되고 당업계에 알려진 바와 같이, 올리고뉴클레오티드 및 폴리뉴클레오티드는 "5' 단부" 및 "3' 단부"를 갖는다고 하는데, 그 이유는 모노뉴클레오티드가 전형적으로 반응하여 선택적으로 포스포디에스테르 또는 다른 적합한 연결부를 통해 5' 포스페이트 또는 하나의 뉴클레오티드의 등가 기를 3' 하이드록실 또는 이의 이웃한 뉴클레오티드의 등가 기에 부착시킴으로써 올리고뉴클레오티드를 형성하기 때문이다.
본원에서 사용된, 용어 "폴리머라제 연쇄 반응"("PCR")은 본원에 참조에 의해 포함된 K. B. Mulli의 미국 특허 제4,683,195호 및 제4,683,202호의 방법을 지칭하는데, 이것은 클로닝 또는 정제 없이 게놈 DNA의 혼합물에서 관심 폴리뉴클레오티드 분절의 농도를 증가시키는 방법을 설명한다. 관심 폴리뉴클레오티드를 증폭시키기 위한 이러한 과정은 목적하는 관심 폴리뉴클레오티드를 함유하는 DNA 혼합물에 2개의 올리고뉴클레오티드 프라이머를 과량으로 도입하는 것, 그 다음 DNA 폴리머라제의 존재 하에서 열 순환의 정확한 순서로 이루어진다. 2개의 프라이머는 관심 이중 가닥 폴리뉴클레오티드의 각각의 가닥에 대해 상보적이다. 증폭을 달성하기 위해, 혼합물이 변성되고, 그 다음 프라이머가 관심 분자의 폴리뉴클레오티드 내의 상보적 서열에 어닐링된다. 어닐링 후, 프라이머는 폴리머라제로 연장되어 새로운 상보성 가닥 쌍을 형성한다. 변성 단계, 프라이머 어닐링 단계 및 폴리머라제 연장 단계는 목적하는 관심 폴리뉴클레오티드의 증폭된 분절의 고농도를 얻기 위해 여러 번 반복될 수 있다(즉, 변성, 어닐링 및 연장이 하나의 "주기"를 구성하고; 다수의 "주기"가 존재할 수 있음). 목적하는 관심 폴리뉴클레오티드(앰플리콘)의 증폭된 분절의 길이는 서로에 대한 프라이머의 상대적인 위치에 의해 결정되며, 따라서 이 길이는 제어 가능한 매개변수이다. 이러한 과정을 반복함으로써, 이 방법은 "폴리머라제 연쇄 반응"(이하 "PCR")이라고 지칭된다. 관심 폴리뉴클레오티드의 목적하는 증폭 분절이 혼합물에서 우세한 핵산 서열(농도 측면에서)이 되기 때문에, 이것을 "PCR 증폭"이라고 한다. 본원에서 정의된 바와 같이, 복수의 표적 핵산 분자를 포함하는 샘플 내의 표적 핵산 분자는 PCR을 통해 증폭된다. 상기에 논의된 방법에 대한 변형에서, 표적 핵산 분자는 복수의 상이한 프라이머 쌍, 일부 경우, 관심 표적 핵산 분자당 하나 이상의 프라이머 쌍을 사용하여 PCR 증폭될 수 있고, 이로써 멀티플렉스 PCR 반응을 형성할 수 있다. 다중 PCR을 사용하면, 샘플로부터 다중 관심 핵산 분자를 동시에 증폭시켜 증폭된 표적 서열을 형성할 수 있다. 또한, 몇몇 상이한 방법론(예를 들어, 바이오분석기 또는 qPCR을 사용한 정량화, 표지된 프로브와의 혼성화; 비오티닐화된 프라이머의 혼입에 이어 아비딘-효소 접합체 검출; 32P 표지된 데옥시뉴클레오티드 트리포스페이트, 예컨대, dCTP 또는 dATP의 증폭된 표적 서열 내로의 혼입)에 의해서 증폭된 표적 서열을 검출할 수 있다. 임의의 올리고뉴클레오티드 서열은 적절한 프라이머 세트로 증폭될 수 있으므로 게놈 DNA, cDNA, 포르말린 고정 파라핀 포매 DNA, 미세 바늘 생검 및 다른 다양한 공급원으로부터 표적 핵산 분자를 증폭시킬 수 있다. 특히, 본원에 개시된 멀티플렉스 PCR 공정에 의해 생성된 증폭된 표적 서열은 그 자체로 후속 PCR 증폭 또는 다양한 하류 검정 또는 조작을 위한 효율적인 기질이다.
본원에서 정의된, "멀티플렉스 증폭"은 적어도 하나의 표적 특이적 프라이머를 사용하는 샘플 내의 2개 이상의 표적 서열의 선택적이고 비무작위적인 증폭을 지칭한다. 일부 실시형태에서, 표적 서열의 일부 또는 전부가 단일 반응 용기 내에서 증폭되도록 멀티플렉스 증폭이 수행된다. 소정의 멀티플렉스 증폭의 "플렉시(plexy)" 또는 "플렉스(plex)"는 일반적으로 단일 멀티플렉스 증폭 동안 증폭되는 상이한 표적 특이적 서열의 수를 지칭한다. 일부 실시형태에서, 플렉시는 약 12-플렉스, 24-플렉스, 48-플렉스, 96-플렉스, 192-플렉스, 384-플렉스, 768-플렉스, 1536-플렉스, 3072-플렉스, 6144-플렉스 또는 그 초과일 수 있다.
본원에서 사용된, "감도"라는 용어는 소정의 검정에 의해 검출될 수 있는 주형 핵산의 최소량(예를 들어, 카피 수, 질량, 존재 백분율)을 지칭한다. 본원에서 사용된, "특이성"이라는 용어는 일치하는 주형으로부터의 증폭과 일치하지 않는 주형으로부터의 증폭을 구별하는 검정의 능력을 지칭한다. "선택성"이라는 용어는 다수 또는 풍부한 서열로부터의 간섭 없이 혼합물에서 소수의 서열을 결정하기 위해 검정이 사용될 수 있는 정도를 지칭한다. 선택성은 종종 비율 또는 백분율로 표현된다.
본 발명은 표적화 멀티플렉스 핵산 라이브러리를 제조하기 위한 기술을 채택하고 이용한다. 표적화 멀티플렉스 라이브러리 제조를 위한 제품 및 기술이 개시되었으며 상업적으로 이용 가능하다. 예를 들어, 미국 특허 제9,957,558B2호 및 미국 특허출원공개 US2019/0002872A1호를 참조하며, 이들의 개시내용은 본원에 참조에 의해 포함된다. 또한 Ion AmpliSeq technology 및 Ion AmpliSeq HD technology, 및 ONCOMINE 제품(Thermo Fisher Scientific, Inc)을 참조한다. 표적화 멀티플렉스 핵산 라이브러리 제제는 관심 표적 서열을 단리시키는 데 사용되어 왔다. 그러나, 샘플에서 희귀하거나 낮은 빈도의 서열을 효과적으로 검출하거나 분석하는 능력을 감소시킬 수 있는 풍부한 표적 서열의 존재로 인해 절차가 압도될 수 있다. 당업계의 방법은 풍부한 서열을 감소시키기 위해 증폭 반응에서 차단 올리고뉴클레오티드를 활용하였지만, 이러한 방법은 전문적이고 값비싼 시약을 필요로 하고 종종 효과적인 구현을 위해 복잡한 작업흐름을 필요로 한다.
본 발명자들은 확립된 작업흐름에 대한 간단한 애드-인 차단 올리고의 구현이 풍부한 서열을 효과적으로 감소시키거나 제거하고, 표적 라이브러리에서 관심 대상인 희귀 또는 낮은 빈도의 서열의 효율적인 생성을 허용하도록 활용될 수 있음을 발견하였다. 제공된 방법은 현재의 증폭 억제 방법에 사용되는 확립된 차단 시약을 사용하는 것보다 개선된 결과를 나타내었다. 생성된 라이브러리 조성물은 희귀 또는 낮은 빈도의 대립유전자의 후속 분석에 유용하다.
멀티플렉스 반응에서 매우 풍부한 야생형, 대조군 및/또는 배경 서열을 포함하는 생물학적 샘플에 존재하는 희귀 서열의 핵산 라이브러리 제조 방법 및 분석 방법이 본원에 제공된다. 전형적으로, 샘플의 정상 구성요소의 높은 야생형, 대조군 및/또는 배경 서열은 관심 희귀 표적 서열의 효과적인 분석을 능가하고 차단하여, 분석을 어렵고 비효율적으로 만들 수 있다. 본 발명자들은 샘플에서 희귀 및/또는 낮은 빈도의 서열의 효과적인 식별 및 분석을 제공하는 후속 분석을 위한 라이브러리의 멀티플렉스 제제를 위한 방법을 개발하였다. 제공된 방법은 실험실 절차에 효율적으로 통합하기 위해 확립된 라이브러리 제조 절차 및 분석에 통합된 능률적이고 단순한 추가 단계만을 포함한다.
핵산 라이브러리의 제조 방법
일 양태에서, 단일 증폭 반응 혼합물 내에서 복수의 상이한 표적 서열을 포함하는 샘플로부터 상이한 표적 서열의 멀티플렉스를 증폭시키는 것을 포함하는, 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하기 위한 제1 방법이 제공되며, 여기서 증폭은 증폭 조건 하에서 샘플의 적어도 일부를 복수의 표적 특이적 프라이머 및 폴리머라제와 접촉시켜 상이한 증폭된 표적 서열의 멀티플렉스를 생성하는 것을 포함하고, 여기서 (i) 복수의 표적 특이적 프라이머 중 적어도 2개는 절단 가능한 기를 포함하고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 양 단부에 절단 가능한 기를 포함하고, (ii) 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 기를 포함하지 않고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에서 최대 1개의 절단 가능한 기를 포함한다. 방법은 추가로 상이한 증폭된 표적 서열의 멀티플렉스의 절단 가능한 기를 절단하고 절단된 단부를 형성하는 것; 및 적어도 2개의 어댑터를 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나의 절단된 단부에 결찰시켜 하나 이상의 어댑터-결찰된 증폭된 표적 서열을 생성함으로써, 상이한 어댑터-결찰된 표적 서열의 라이브러리를 제조하는 것을 포함하며, 여기서 차단 표적 특이적 프라이머로부터 생성된 앰플리콘은 어댑터를 결찰할 수 없고, 여기서 결찰 반응에서 어댑터 중 어느 것도 높은 엄격성 조건 하에서 상이한 증폭된 표적 서열의 멀티플렉스 중 어느 하나에 혼성화하지 않는다. 일부 실시형태에서 제공된 방법에 사용되는 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택된다. 특정 실시형태에서, 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택된다.
일부 실시형태에서 관심 표적 핵산 중 하나 이상은 서열 변이이다. 일부 실시형태에서, 하나 이상의 관심 서열 변이가 샘플에서 낮은 농도로 존재한다. 특정 실시형태에서, 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위 중 임의의 하나 이상이다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열에 지향된다. 특정 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향된다.
일부 실시형태에서, 하나 이상의 관심 서열이 샘플에 낮은 농도로 존재한다. 특정 실시형태에서 표적 핵산 중 하나 이상은 숙주 샘플에 대한 병원성 핵산이다. 특정 실시형태에서 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택된다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 숙주 샘플에 대해서 천연인 대립유전자 특이적 서열에 지향된다. 특정 실시형태에서 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 풍부한 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향된다.
특정 실시형태에서, 방법은 절단 가능한 기를 함유하는 프라이머의 사용을 포함하며, 여기서 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하고, 여기서 다수의 표적-특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는다: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
특정 실시형태에서, 라이브러리를 증폭시키는 단계, 절단하는 단계, 결찰하는 단계 및 제조하는 단계를 포함하는 제공된 방법은 단일 반응 용기에서 수행된다. 일부 실시형태에서 제공된 방법은 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리 및/또는 라이브러리의 풀을 조합함으로써 상이한 어댑터 결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함한다.
일부 실시형태에서, 어댑터는 바코드, 태그 및/또는 범용 프라이밍 서열을 포함한다. 특정 실시형태에서, 방법은 2개 이하의 상이한 어댑터의 사용을 포함한다.
일부 실시형태에서 어댑터는 블런트-단부 결찰(blunt-ended ligation)이 가능한 리가제를 사용하여 적어도 하나의 소화된 상이한 표적 특이적 앰플리콘의 단부에 결찰된 이중 가닥 어댑터이다. 특정 실시형태에서 리가제는 등온 리가제이다.
낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하기 위해 제공된 제1 방법에서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 여기서 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 한쪽 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않는다. 일부 실시형태에서 방법은 라이브러리 생산에서 억제를 위해 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함하며, 여기서 차단 프라이머는 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류(즉, 내부)에 표적 서열과 상보적인 DNA 서열을 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 완전히 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되지 않는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 차단 프라이머는 차단 프라이머가 라이브러리에서 야생형 서열의 생산을 억제하도록 적어도 하나의 관심 변이 위치에 상응하는 유전자좌를 포함하는 야생형 서열에 상보적이다.
일부 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 및 역방향 차단 프라이머를 포함하며, 여기서 차단 프라이머 각각은 표적 서열에 대해서 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 실질적으로 중첩되며, 생산성 역방향 표적 특이적 프라이머와 실질적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 완전히 중첩되며, 생산성 역방향 표적 특이적 프라이머와 완전히 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 또는 역방향 차단 프라이머 중 어느 것도 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 중첩되지 않는다.
일부 실시형태에서, 차단 프라이머는 하기 기준 중 하나 이상을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음. 특정 실시형태에서, 차단 프라이머는 하기 기준 각각을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 유사한 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적은 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머의 적어도 0.5배로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 동일한 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 높은 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 1.5배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 2배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 4배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 8배 또는 그 보다 더 높게 포함된다.
또 다른 양태에서, 단일 증폭 반응 혼합물 내에서 복수의 상이한 표적 서열을 포함하는 샘플로부터 상이한 표적 서열의 멀티플렉스를 증폭시키는 것을 포함하는, 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하기 위한 제2 방법이 제공되며, 여기서 증폭은 증폭 조건 하에서 샘플의 적어도 일부를 복수의 표적 특이적 프라이머 및 폴리머라제와 접촉시켜 상이한 증폭된 표적 서열의 멀티플렉스를 생성하는 것을 포함하고, 여기서 (i) 복수의 어댑터 중 적어도 2개는 범용 핸들 서열 및 표적 핵산 서열 및 절단 가능한 모이어티 및 선택적으로 하나 이상의 태그 서열을 포함하고, 여기서 어댑터의 표적 핵산 서열은 적어도 하나의 절단 가능한 모이어티를 포함하고, 범용 핸들 서열은 절단 가능한 모이어티를 포함하지 않고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 두 단부에 절단 가능한 기를 포함하고, (ii) 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 모이어티 또는 범용 핸들 서열을 포함하지 않고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 1개 이하의 단부에 절단 가능한 기 및 범용 핸들 서열을 포함한다. 방법은 추가로 상이한 증폭된 표적 서열의 멀티플렉스의 절단 가능한 기를 소화시켜 프라이머 이량체를 감소시키거나 제거하고 부분적으로 소화된 표적 앰플리콘을 형성하는 것; 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나의 부분적으로 소화된 앰플리콘을 복구하는 것; 및 범용 핸들 서열에 상응하는 2개의 범용 어댑터로 복구된 표적 앰플리콘을 증폭시킴으로써 하나 이상의 어댑터 증폭된 표적 서열을 생성함으로써 상이한 어댑터 증폭된 표적 서열의 라이브러리를 제조하는 것을 포함하며, 여기서 차단 표적 특이적 프라이머로부터 생성된 앰플리콘은 범용 어댑터를 사용하는 증폭과 상용성이지 않고, 여기서 증폭 반응에서 어댑터 중 어느 것도 높은 엄격성 조건 하에서 상이한 증폭된 표적 서열의 멀티플렉스 중 어느 하나에 혼성화하지 않는다. 일부 실시형태에서 제공된 방법에 사용되는 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택된다. 특정 실시형태에서, 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택된다.
일부 실시형태에서 제공된 방법에 사용되는 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택된다. 특정 실시형태에서, 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택된다.
일부 실시형태에서 관심 표적 핵산 중 하나 이상은 서열 변이이다. 일부 실시형태에서, 하나 이상의 관심 서열 변이가 샘플에서 낮은 농도로 존재한다. 특정 실시형태에서, 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위 중 임의의 하나 이상이다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열에 지향된다. 특정 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향된다.
일부 실시형태에서, 하나 이상의 관심 서열이 샘플에 낮은 농도로 존재한다. 특정 실시형태에서 표적 핵산 중 하나 이상은 숙주 샘플에 대한 병원성 핵산이다. 특정 실시형태에서 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택된다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 숙주 샘플에 대해서 천연인 대립유전자 특이적 서열에 지향된다. 특정 실시형태에서 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 풍부한 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향된다.
특정 실시형태에서, 방법은 절단 가능한 기를 함유하는 프라이머의 사용을 포함하며, 여기서 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하고, 여기서 다수의 표적-특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는다: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
특정 실시형태에서, 라이브러리를 증폭시키는 단계, 절단하는 단계, 복구하는 단계 및 제조하는 단계를 포함하는 제공된 방법은 단일 반응 용기에서 수행된다. 일부 실시형태에서 제공된 방법은 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리 및/또는 라이브러리의 풀을 조합함으로써 상이한 어댑터 결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함한다.
일부 실시형태에서, 어댑터는 바코드, 태그 및/또는 범용 프라이밍 서열을 포함한다. 일부 실시형태에서 제2 증폭은 범용 프라이밍 서열과 상보적인 범용 서열을 포함하는 범용 증폭 어댑터를 사용하여 수행된다. 일부 실시형태에서, 범용 어댑터는 관심 표적 서열의 하류 분석을 위한 서열을 추가로 포함한다. 특정 실시형태에서, 방법은 2개의 상이한 범용 서열과 2개의 상이한 어댑터 서열의 조합으로 구성된, 4개 이하의 상이한 범용 어댑터를 사용하는 것을 포함한다. 특정 실시형태에서, 방법은 2개 이하의 상이한 범용 어댑터의 사용을 포함한다.
낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하기 위해 제공된 제2 방법에서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 여기서 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 한쪽 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 증폭된 표적 앰플리콘을 생성하지 않는다. 일부 실시형태에서 방법은 라이브러리 생산에서 억제를 위해 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함하며, 여기서 차단 프라이머는 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류(즉, 내부)에 표적 서열과 상보적인 DNA 서열을 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 완전히 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되지 않는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 차단 프라이머는 차단 프라이머가 라이브러리에서 야생형 서열의 생산을 억제하도록 적어도 하나의 관심 변이 위치에 상응하는 유전자좌를 포함하는 야생형 서열에 상보적이다.
일부 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 차단 프라이머 각각은 표적 서열에 대해서 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 실질적으로 중첩되며, 생산성 역방향 표적 특이적 프라이머와 실질적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 완전히 중첩되며, 생산성 역방향 표적 특이적 프라이머와 완전히 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 또는 역방향 차단 프라이머 중 어느 것도 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 중첩되지 않는다.
일부 실시형태에서, 차단 프라이머는 하기 기준 중 하나 이상을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음. 특정 실시형태에서, 차단 프라이머는 하기 기준 각각을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 유사한 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적은 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머의 적어도 0.5배로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 동일한 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 높은 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 1.5배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 2배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 4배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 8배 또는 그 보다 더 높게 포함된다.
멀티플렉스 반응에서 낮은 빈도의 표적 폴리뉴클레오티드의 검출 방법.
또 다른 양태에서, 샘플로부터 관심 표적 폴리뉴클레오티드를 검출하는 방법이 제공되며, 여기서 표적 폴리뉴클레오티드는 낮은 빈도로 샘플에 존재하며, 이 방법은 본원에 제공된 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 제1 방법에 따라서 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 것; 및 제조된 라이브러리 앰플리콘을 분석하여 샘플에 존재하는 표적 서열을 결정함으로써 관심 표적 폴리뉴클레오티드를 검출하는 것을 포함한다.
일부 실시형태에서 제공된 검출 방법에 사용되는 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택된다. 특정 실시형태에서, 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택된다.
일부 실시형태에서 관심 표적 핵산 중 하나 이상은 서열 변이이다. 일부 실시형태에서, 하나 이상의 관심 서열 변이가 샘플에서 낮은 농도로 존재한다. 특정 실시형태에서, 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위 중 임의의 하나 이상이다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열에 지향된다. 특정 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향된다.
일부 실시형태에서, 하나 이상의 관심 서열이 샘플에 낮은 농도로 존재한다. 특정 실시형태에서 표적 핵산 중 하나 이상은 숙주 샘플에 대한 병원성 핵산이다. 특정 실시형태에서 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택된다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 숙주 샘플에 대해서 천연인 대립유전자 특이적 서열에 지향된다. 특정 실시형태에서 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 풍부한 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향된다.
특정 실시형태에서, 방법은 절단 가능한 기를 함유하는 프라이머의 사용을 포함하며, 여기서 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하고, 여기서 다수의 표적-특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는다: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
특정 실시형태에서, 제공된 방법은 단일 반응 용기에서 수행되는 라이브러리의 증폭시키는 단계, 절단하는 단계, 결찰하는 단계 및 제조하는 단계를 포함한다. 일부 실시형태에서 제공된 방법은 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리 및/또는 라이브러리의 풀을 조합함으로써 상이한 어댑터 결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함한다.
일부 실시형태에서, 어댑터는 바코드, 태그 및/또는 범용 프라이밍 서열을 포함한다. 특정 실시형태에서, 방법은 2개 이하의 상이한 어댑터의 사용을 포함한다.
일부 실시형태에서 어댑터는 블런트-단부 결찰이 가능한 리가제를 사용하여 적어도 하나의 소화된 상이한 표적 특이적 앰플리콘의 단부에 결찰된 이중 가닥 어댑터이다. 특정 실시형태에서 리가제는 등온 리가제이다.
낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하기 위해 제공된 제1 방법에서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 여기서 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 한쪽 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않는다. 일부 실시형태에서 방법은 라이브러리 생산에서 억제를 위해 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함하며, 여기서 차단 프라이머는 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류(즉, 내부)에 표적 서열과 상보적인 DNA 서열을 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 완전히 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되지 않는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 차단 프라이머는 차단 프라이머가 라이브러리에서 야생형 서열의 생산을 억제하도록 적어도 하나의 관심 변이 위치에 상응하는 유전자좌를 포함하는 야생형 서열에 상보적이다.
일부 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 차단 프라이머 각각은 표적 서열에 대해서 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 실질적으로 중첩되고, 생산성 역방향 표적 특이적 프라이머와 실질적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 완전히 중첩되고, 생산성 역방향 표적 특이적 프라이머와 완전히 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 또는 역방향 차단 프라이머 중 어느 것도 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 중첩되지 않는다.
일부 실시형태에서, 차단 프라이머는 하기 기준 중 하나 이상을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음. 특정 실시형태에서, 차단 프라이머는 하기 기준 각각을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 유사한 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적은 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머의 적어도 0.5배로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 동일한 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 높은 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 1.5배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 2배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 4배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 8배 또는 그 보다 더 높게 포함된다.
일부 실시형태에서, 제공된 방법은 적어도 하나의 어댑터-결찰된 표적 특이적 서열의 일부의 클론성 증폭을 추가로 포함한다. 특정 실시형태에서 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함한다.
일부 실시형태에서, 제공된 방법은 라이브러리를 서열결정함으로써 수행되는 분석을 포함한다. 특정 실시형태에서 서열결정은 합성에 의한 서열결정에 의해서 수행된 서열결정을 포함한다. 특정 실시형태에서, 제공된 방법은 라이브러리 제조를 포함하고/하거나 서열결정은 자동화 시스템에서 수행된다. 특정 실시형태에서, 제공된 방법은 서열결정 전에 적어도 하나의 어댑터-결찰된 표적 특이적 서열의 일부의 클론성 증폭을 포함한다. 특정 실시형태에서 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함한다. 특정 실시형태에서 제공된 방법은 클론성 증폭 전에 제조된 라이브러리의 정규화를 추가로 포함한다. 특정 실시형태에서 2개 이상의 제조된 라이브러리는 클론성 증폭 전에 조합된다.
또 다른 양태에서, 샘플로부터 관심 표적 폴리뉴클레오티드를 검출하는 방법이 제공되며, 여기서 표적 폴리뉴클레오티드는 낮은 빈도로 샘플에 존재하며, 이 방법은 본원에 제공된 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 제2 방법에 따라서 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 것; 및 제조된 라이브러리 앰플리콘을 분석하여 샘플에 존재하는 표적 서열을 결정함으로써 관심 표적 폴리뉴클레오티드를 검출하는 것을 포함한다.
일부 실시형태에서 제공된 방법에 사용되는 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택된다. 특정 실시형태에서, 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택된다.
일부 실시형태에서 관심 표적 핵산 중 하나 이상은 서열 변이이다. 일부 실시형태에서, 하나 이상의 관심 서열 변이가 샘플에서 낮은 농도로 존재한다. 특정 실시형태에서, 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위 중 임의의 하나 이상이다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열에 지향된다. 특정 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향된다.
일부 실시형태에서, 하나 이상의 관심 서열이 샘플에 낮은 농도로 존재한다. 특정 실시형태에서 표적 핵산 중 하나 이상은 숙주 샘플에 대한 병원성 핵산이다. 특정 실시형태에서 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택된다. 일부 실시형태에서, 하나 이상의 차단 표적 특이적 프라이머는 숙주 샘플에 대해서 천연인 대립유전자 특이적 서열에 지향된다. 특정 실시형태에서 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 풍부한 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향된다.
특정 실시형태에서, 방법은 절단 가능한 기를 함유하는 프라이머의 사용을 포함하며, 여기서 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하고, 여기서 다수의 표적-특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는다: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
특정 실시형태에서, 라이브러리를 증폭시키는 단계, 절단하는 단계, 복구하는 단계 및 제조하는 단계를 포함하는 제공된 방법은 단일 반응 용기에서 수행된다. 일부 실시형태에서 제공된 방법은 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리 및/또는 라이브러리의 풀을 조합함으로써 상이한 어댑터 결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함한다.
일부 실시형태에서, 어댑터는 바코드, 태그 및/또는 범용 프라이밍 서열을 포함한다. 일부 실시형태에서 제2 증폭은 범용 프라이밍 서열과 상보적인 범용 서열을 포함하는 범용 증폭 어댑터를 사용하여 수행된다. 일부 실시형태에서, 범용 어댑터는 관심 표적 서열의 하류 분석을 위한 서열을 추가로 포함한다. 특정 실시형태에서, 방법은 2개의 상이한 범용 서열과 2개의 상이한 어댑터 서열의 조합으로 구성된, 4개 이하의 상이한 범용 어댑터를 사용하는 것을 포함한다. 특정 실시형태에서, 방법은 2개 이하의 상이한 범용 어댑터의 사용을 포함한다.
낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하기 위해 제공된 제2 방법에서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 여기서 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 한쪽 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 증폭된 표적 앰플리콘을 생성하지 않는다. 일부 실시형태에서 방법은 라이브러리 생산에서 억제를 위해 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함하며, 여기서 차단 프라이머는 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류(즉, 내부)에 표적 서열과 상보적인 DNA 서열을 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 완전히 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 방법은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되지 않는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 차단 프라이머는 차단 프라이머가 라이브러리에서 야생형 서열의 생산을 억제하도록 적어도 하나의 관심 변이 위치에 상응하는 유전자좌를 포함하는 야생형 서열에 상보적이다.
일부 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 차단 프라이머 각각은 표적 서열에 대해서 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 실질적으로 중첩되고, 생산성 역방향 표적 특이적 프라이머와 실질적으로 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머와 완전히 중첩되고, 생산성 역방향 표적 특이적 프라이머와 완전히 중첩된다. 특정 실시형태에서 방법은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 또는 역방향 차단 프라이머 중 어느 것도 표적 서열에 대한 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머와 중첩되지 않는다.
일부 실시형태에서, 차단 프라이머는 하기 기준 중 하나 이상을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음. 특정 실시형태에서, 차단 프라이머는 하기 기준 각각을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 유사한 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적은 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머의 적어도 0.5배로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머와 동일한 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 높은 농도로 본 발명의 방법에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 1.5배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 2배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 4배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 및 역방향 생산성 프라이머보다 적어도 8배 또는 그 보다 더 높게 포함된다.
일부 실시형태에서, 제공된 방법은 적어도 하나의 어댑터-증폭된 표적 특이적 서열의 일부의 클론성 증폭을 추가로 포함한다. 특정 실시형태에서 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함한다.
일부 실시형태에서, 제공된 방법은 라이브러리를 서열결정함으로써 수행되는 분석을 포함한다. 특정 실시형태에서 서열결정은 합성에 의한 서열결정에 의해서 수행된 서열결정을 포함한다. 특정 실시형태에서, 제공된 방법은 라이브러리 제조를 포함하고/하거나 서열결정은 자동화 시스템에서 수행된다. 특정 실시형태에서, 제공된 방법은 서열결정 전에 적어도 하나의 어댑터-증폭된 표적 특이적 서열의 일부의 클론성 증폭을 포함한다. 특정 실시형태에서 적어도 하나의 어댑터-증폭된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함한다. 특정 실시형태에서 제공된 방법은 클론성 증폭 전에 제조된 라이브러리의 정규화를 추가로 포함한다. 특정 실시형태에서 2개 이상의 제조된 라이브러리는 클론성 증폭 전에 조합된다.
일부 실시형태에서, 라이브러리는 4시간 미만 동안 제조된다. 일부 실시형태에서, 라이브러리는 3시간 미만 동안 제조, 농축 및 서열결정된다. 일부 실시형태에서, 라이브러리는 2시간 내지 3시간 동안 제조, 농축 및 서열결정된다. 일부 실시형태에서, 라이브러리는 대략 2.5시간 동안 제조된다. 일부 실시형태에서, 라이브러리는 대략 2.75시간 동안 제조된다. 일부 실시형태에서, 라이브러리는 대략 3시간 동안 제조된다.
조성물
본 발명의 추가 양태는 본 발명의 방법에 따라 제조된 라이브러리 조성물뿐만 아니라 복수의 핵산 프라이머 또는 어댑터 및 차단 올리고를 포함하는 조성물을 포함한다. 따라서, 본 발명의 라이브러리를 제조하는 제1 방법에 따라 제조된 라이브러리 조성물뿐만 아니라 본 발명의 라이브러리를 제조하는 제2 방법에 따라 제조된 라이브러리 조성물이 본원에 제공된다. 제조된 라이브러리 조성물은 관심 대상의 낮은 빈도 서열의 검출 및/또는 분석을 위한 최적화된 조성물을 제공한다. 제공된 조성물은 본 명세서에 기재된 방법과 함께 유용할 뿐만 아니라 당업계에 알려진 추가적인 분석 및 적용을 위해 유용하다.
따라서 라이브러리에서 풍부한 표적 서열의 억제를 위한 적어도 하나의 차단 올리고를 포함하는 조성물이 제공된다. 조성물은 적어도 하나의 표적 특이적 차단 올리고를 포함하고, 최대 10만 개의 표적 특이적 차단 올리고 쌍이 제공된 조성물에 포함된다. 제공된 조성물은 샘플에서 낮은 빈도의 표적 서열의 효과적인 검출 및 분석을 가능하게 하기 위해 풍부한 표적 서열을 억제하면서 고도로 멀티플렉싱된 표적화 라이브러리의 신속하고 간단한 생성을 가능하게 한다.
조성물 중의 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 기를 포함하지 않으며, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나가 생성된 앰플리콘의 단지 하나의 단부에서 최대 하나의 절단 가능한 기를 포함하도록 하는 차단 프라이머이고, 따라서 나머지 라이브러리 제조 작업흐름의 나머지를 통해서 처리되지 않고 따라서 생산성 어댑터 결찰된 또는 어댑터 증폭된 표적 앰플리콘을 생성하지 않는다. 일부 실시형태에서 조성물은 라이브러리 생산에서 억제를 위해 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함하며, 여기서 차단 프라이머는 멀티플렉스 반응 조성물에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터 또는 생산성 역방향 표적 특이적 프라이머 또는 어댑터의 하류(즉, 내부)에 표적 서열과 상보적인 DNA 서열을 포함한다. 일부 실시형태에서 조성물은 표적 서열에 대한 멀티플렉스에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터 또는 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 부분적으로 또는 전체적으로 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 조성물은 표적 서열에 대한 멀티플렉스 조성물에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터 또는 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 완전히 중첩되는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 조성물은 표적 서열에 대한 멀티플렉스 조성물에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터 또는 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 부분적으로 또는 전체적으로 중첩되지 않는 표적 서열에 지향되는 적어도 하나의 차단 프라이머를 포함한다. 일부 실시형태에서 차단 프라이머는 차단 프라이머가 라이브러리에서 야생형 서열의 생산을 억제하도록 적어도 하나의 관심 변이 위치에 상응하는 유전자좌를 포함하는 야생형 서열에 상보적이다.
일부 실시형태에서 조성물은 표적 서열에 지향되는 정방향 차단 프라이머와 역방향 차단 프라이머의 적어도 하나의 쌍을 포함하고, 여기서 차단 프라이머 각각은 표적 서열에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 부분적으로 또는 전체적으로 중첩된다. 특정 실시형태에서 조성물은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터와 실질적으로 중첩되며, 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 실질적으로 중첩된다. 특정 실시형태에서 조성물은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 및 역방향 차단 프라이머 각각은 표적 서열에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터와 완전히 중첩되며, 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 완전히 중첩된다. 특정 실시형태에서 조성물은 표적 서열에 지향되는 적어도 한 쌍의 정방향 차단 프라이머 및 역방향 차단 프라이머를 포함하며, 여기서 정방향 차단 프라이머 또는 역방향 차단 프라이머 중 어느 것도 표적 서열에서 생산성 정방향 표적 특이적 프라이머 또는 어댑터 또는 생산성 역방향 표적 특이적 프라이머 또는 어댑터와 중첩되지 않는다.
일부 실시형태에서, 차단 프라이머는 하기 기준 중 하나 이상을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음. 특정 실시형태에서, 차단 프라이머는 하기 기준 각각을 포함한다: (1) 길이는 약 15개 내지 약 40개 염기 길이임; (2) Tm은 약 60℃ 내지 약 70℃임; (3) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (4) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (5) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터와 유사한 농도로 본 발명의 조성물에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터 보다 적은 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터의 적어도 0.5배로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터와 동일한 농도로 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터보다 높은 농도로 본 발명의 조성물에 포함된다. 일부 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터보다 적어도 1.5배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터보다 적어도 2배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터보다 적어도 4배 더 높게 포함된다. 특정 실시형태에서, 차단 프라이머(들)는 반응에서 정방향 생산성 프라이머 또는 어댑터 및 역방향 생산성 프라이머 또는 어댑터보다 적어도 8배 또는 적어도 10배 또는 그 보다 더 높게 포함된다.
라이브러리 제조 프로토콜에 따라 처리되는 절단 가능한 기를 함유하지 않는 본원의 조성물 및 방법에 사용하기 위해 제공된 차단 프라이머는 라이브러리 제조에서 생성되는 경쟁 표적 서열을 감소시키거나 제거하기 위해 임의의 바람직한 서열에 대해 설계될 수 있다. 일부 실시형태에서, 차단 프라이머는 라이브러리에서 생성된 야생형 서열을 감소시키거나 제거하여, 차단 프라이머에 의해서 포함된 영역 내에 존재하는 표적 돌연변이의 검출 및/또는 분석의 가용성을 증가시키기 위해 표적 앰플리콘의 표준 절단 가능한 프라이머 하류 또는 내부의 야생형 서열에 대해 설계된다. 그러나, 차단 프라이머는 야생형 서열을 증폭시키지만, 절단 부위 또는 범용 서열의 부족으로 인해서, 생성된 앰플리콘은 처리되지 않거나 분석을 위해 생성된 생산성 앰플리콘 라이브러리에 혼입되지 않을 것이다. 차단 프라이머는 야생형 서열을 효율적으로 증폭시키고 불일치 변이체는 증폭시키지 않기 때문에, 표준 절단 가능한 프라이머에 대한 가용성을 차단하면서, 낮은 빈도의 변이체 서열은 표준 절단 가능한 프라이머에 의한 효율적인 증폭 및 처리에 사용 가능하고 라이브러리 제조 작업흐름에서 완전히 처리된다.
라이브러리 제조 프로토콜에 따라 처리되는 절단 가능한 기를 함유하지 않는 본원의 조성물 및 방법에 사용하기 위해 제공된 차단 프라이머 쌍은 라이브러리 제조에서 생성되는 표적 서열을 감소시키거나 제거하기 위해 임의의 바람직한 표적 서열에 대해 설계될 수 있다. 일부 실시형태에서, 차단 프라이머 쌍은 라이브러리에서 생성된 서열을 감소시키거나 제거하여 낮은 빈도로 샘플에 존재하는 다른 서열의 검출 및/또는 분석의 가용성을 증가시키기 위해서 표적 앰플리콘에 지향되는 표적 특이적 표준 절단 가능한 프라이머 또는 어댑터와 동일한 서열에 대해 설계된다. 차단 프라이머 쌍은 표적 서열을 증폭시키고 표준 라이브러리 제제 표적 특이적 프라이머 또는 어댑터와 경쟁할 것이지만, 절단 부위 또는 범용 서열의 부족으로 인해서, 생성된 앰플리콘은 분석을 위해 생성된 생산성 앰플리콘 라이브러리를 처리되거나 이에 통합되지 않을 것이다. 차단 프라이머 쌍은 반응에서 표준 표적 특이적 프라이머 또는 어댑터와 직접적으로 경쟁하기 때문에, 표적 앰플리콘의 표현이 감소하면 최종 라이브러리 제제를 생성할 것이다. 일부 실시형태에서, 조성물은 표준 표적 특이적 프라이머 또는 어댑터보다 더 높은 농도로 존재하는 차단 프라이머 쌍을 포함하고, 생성된 생산성 앰플리콘은 추가로 감소되거나 제거될 수 있다. 낮은 빈도의 변이체 서열은 표준 절단 가능한 프라이머에 의한 효율적인 증폭 및 처리에 사용할 수 있고, 라이브러리 제조 작업흐름에서 완전히 처리되기 때문에 생성된 분석은 샘플에 존재하는 낮은 빈도 또는 희귀 서열의 검출을 위한 추가 감도가 가능하다.
제공된 차단 프라이머 및 프라이머 쌍 조성은 표준 라이브러리 제조 기술 작업흐름과 상용성이며, 변형된 프로토콜을 필요로 하지 않는다. 따라서, 차단 프라이머 및 프라이머 쌍 조성은 기존 라이브러리 제제 패널 작업흐름에 대한 기능 저하와 상용성이다. 특정 실시형태에서 하나 이상의 차단 프라이머를 포함하는 조성물은 라이브러리 제조 방법을 위해 기존 라이브러리 제조 패널에 첨가되거나 스파이킹된다. 일부 실시형태에서 하나 이상의 차단 프라이머 쌍을 포함하는 조성물은 라이브러리 제조 방법을 위해 기존 라이브러리 제조 패널에 첨가되거나 스파이킹된다.
제공된 차단 프라이머 및 프라이머 쌍 조성물은 복잡한 설계 요구 사항 또는 변형을 필요로 하지 않기 때문에, 다른 방법보다 간단하고 저비용이다. 억제를 위한 관심 표적에 지향되는 천연의 변형되지 않은 서열을 포함하는 올리고는 기존 패널 및 작업흐름에 첨가하기 위해 당업계에 잘 알려진 방법에 의해 쉽게 제조될 수 있다. 대안적으로, 맞춤형 라이브러리 제조 패널이 개발되는 경우, 차단 프라이머 및 프라이머 쌍은 선택적으로 동시에 설계되고, 제조된 맞춤형 패널에 포함되거나 맞춤형 합성 패널과 함께 사용되도록 합성될 수 있다. 본 발명자들은 절단 가능한 부위를 사용하는 표준 표적 특이적 멀티플렉스 라이브러리 제조와 함께 표준 비변형 차단 프라이머 및/또는 프라이머 쌍을 사용하면 표적 풍부 서열이 상당히 감소 또는 제거되어 표적의 낮은 빈도의 관심 서열의 분석을 상당히 강화할 수 있음을 발견하였다. 따라서 제공된 발명은 당업계의 복잡한 문제를 해결하기 위해 특정 앰플리콘을 억제하는 놀랍도록 간단하면서도 우아한 방법을 제공한다.
차단 프라이머 또는 프라이머 쌍은 라이브러리 제조에서 감소 또는 제거를 위해 관심 대상의 임의의 경쟁 표적 서열에 대해 설계될 수 있다. 특이적 표적 앰플리콘의 정상적인(또는 상승된) 표현이 서열 분석 프로젝트의 목적에 바람직하지 않거나 유해한 경우가 있을 수 있다. 표적 앰플리콘의 원하는 감소 또는 제거를 달성하기 위해 차단 프라이머의 설계 및 농도를 생성할 수 있다. 예를 들어, 야생형 서열은 라이브러리에서 생산을 위해 낮은 빈도의 돌연변이 서열과 경쟁할 수 있다. 라이브러리에서 야생형 서열 앰플리콘의 존재를 감소시키기 위해 제공된 방법은 돌연변이 서열의 가용성 및 분석을 증가시킬 것이다. 유사하게, 풍부한 인간 대조군 서열은 샘플에서 감염원의 희귀하거나 낮은 빈도의 서열의 존재를 압도할 수 있다. 생산성 라이브러리에서 인간 대조군 서열 앰플리콘의 존재를 감소시키기 위해 제공된 방법은 샘플에서 낮은 빈도의 감염원 서열의 가용성 및 분석을 증가시킬 것이다.
일부 실시형태에서, 제공된 조성물은 복수의 핵산 어댑터를 포함하고, 여기서 복수의 어댑터 각각은 5' 범용 핸들 서열, 선택적으로 하나 이상의 태그 서열 및 3' 표적 핵산 서열을 포함하고, 여기서 각각의 어댑터는 절단 가능한 모이어티를 포함하고; 여기서 어댑터의 표적 핵산 서열은 적어도 하나의 절단 가능한 모이어티를 포함하고, 절단 가능한 모이어티는 태그 서열의 양 단부의 플랭킹에 포함되며, 범용 핸들 서열은 절단 가능한 모이어티를 포함하지 않는다. 제공된 조성물에는 적어도 2개 내지 최대 10만 개의 표적 특이적 어댑터 쌍이 포함된다. 제공된 조성물은 고도로 멀티플렉싱되고, 선택적으로 태깅된, 표적화된 라이브러리를 신속하게 생성할 수 있다.
프라이머/어댑터 조성물은 단일 가닥 또는 이중 가닥일 수 있다. 일부 실시형태에서, 어댑터 조성물은 단일 가닥 어댑터를 포함한다. 일부 실시형태에서, 어댑터 조성물은 이중 가닥 어댑터를 포함한다. 일부 실시형태에서, 어댑터 조성물은 단일 가닥 어댑터와 이중 가닥 어댑터의 혼합물을 포함한다.
일부 실시형태에서, 조성물은 적어도 2개의 상이한 표적 핵산 서열을 증폭시킬 수 있는 어댑터 쌍의 멀티플렉스를 포함하는 하나 이상의 표적 핵산 서열을 증폭시킬 수 있는 복수의 표적 특이적 프라이머 또는 어댑터를 포함하며, 여기서 표적 특이적 프라이머 서열은 조성물 내의 다른 표적 특이적 프라이머 서열과 실질적으로 상보적이 아니다. 일부 실시형태에서, 조성물은 적어도 25개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 750개, 1000개, 1250개, 1500개, 1750개, 2000개, 2250개, 2500개, 2750개, 3000개, 3250개, 3500개, 3750개, 4000개, 4500개, 5000개, 5500개, 6000개, 7000개, 8000개, 9000개, 10000개, 11000개 또는 12000개 또는 그 초과의 표적 특이적 어댑터 쌍을 포함한다. 일부 실시형태에서, 표적 특이적 어댑터 쌍은 길이가 약 15개 뉴클레오티드 내지 약 40개 뉴클레오티드를 포함하며, 여기서 적어도 하나의 뉴클레오티드는 절단 가능한 기로 대체된다. 일부 실시형태에서 절단 가능한 기는 우리딘 뉴클레오티드이다. 일부 실시형태에서, 표적 특이적 프라이머 또는 어댑터 쌍은 임상 또는 병리학적 상태와 연관된 게놈의 엑손, 유전자, 엑솜 또는 영역을 증폭시키도록, 예를 들어, 암, 예를 들어, 폐암, 결장암, 유방암 등과 연관된 하나 이상의 돌연변이(예를 들어, 드라이버 돌연변이), 유전병, 예를 들어, 낭포성 섬유증, 근이영양증 등과 연관된 돌연변이 또는 감염원(예를 들어, 박테리아, 바이러스 또는 진균)과 연관된 서열을 증폭시키도록 설계된다. 일부 실시형태에서, 표적 서열에 혼성화되고 본 명세서에 제공된 바와 같이 증폭될 때 표적 특이적 프라이머 또는 어댑터 쌍은 길이가 약 100 염기쌍 내지 약 600 염기쌍인 어댑터 결찰된 증폭된 표적 서열의 라이브러리를 생성한다. 일부 실시형태에서, 어댑터 결찰된 증폭된 표적 서열 또는 어댑터 증폭된 표적 서열 중 어느 하나도 라이브러리 내의 다른 어댑터 결찰된 증폭된 표적 서열 또는 어댑터 증폭된 표적 서열의 나머지와 비교하여 라이브러리에서 30% 초과만큼 증폭되지 않는다.
일부 실시형태에서, 본 발명의 조성물에서 프라이머 쌍 또는 어댑터 쌍의 표적 특이적 프라이머 서열은 핵산 분자의 특이적 영역을 증폭시킬 수 있는 표적 특이적 서열이다. 일부 실시형태에서, 표적 특이적 프라이머 또는 어댑터는 게놈 DNA 또는 cDNA를 증폭시킬 수 있다. 일부 실시형태에서, 표적 특이적 프라이머 또는 어댑터는 인간 DNA 또는 RNA, 뮤린 DNA 또는 RNA, 소 DNA 또는 RNA, 개 DNA 또는 RNA, 말 DNA 또는 RNA 또는 임의의 다른 관심 포유동물을 포함하지만 이에 제한되지 않는 포유동물 핵산을 증폭시킬 수 있다. 다른 실시형태에서, 표적 특이적 프라이머 또는 어댑터는 관심 식물 핵산을 증폭시키도록 지시된 서열을 포함한다. 다른 실시형태에서, 표적 특이적 어댑터는 감염원, 예를 들어, 박테리아 및/또는 바이러스 핵산을 증폭시키도록 지시된 서열을 포함한다. 일부 실시형태에서, 선택적 증폭에 필요한 핵산의 양은 약 1 ng 내지 1 마이크로그램이다. 일부 실시형태에서, 하나 이상의 표적 서열의 선택적 증폭에 필요한 핵산의 양은 약 1 ng, 약 5 ng 또는 약 10 ng이다. 일부 실시형태에서, 표적 서열의 선택적 증폭에 필요한 핵산의 양은 약 10 ng 내지 약 200 ng이다.
본원에 기재된 바와 같이, 복수의 어댑터 각각은 5' 범용 핸들 서열을 포함한다. 일부 실시형태에서 범용 핸들 서열은 증폭 프라이머 결합 서열, 서열결정 프라이머 결합 서열 및/또는 포획 프라이머 결합 서열 중 임의의 하나 또는 임의의 조합을 포함한다. 일부 실시형태에서, 각각의 어댑터 범용 핸들 서열의 비교 가능한 최대 최소 용융 온도는 동일한 어댑터에 존재하는 각각의 표적 핵산 서열 및 각각의 태그 서열의 비교 가능한 최대 최소 융점보다 높다. 바람직하게는, 제공된 어댑터의 범용 핸들 서열은 고유한 태그 서열 및/또는 관심 표적 핵산 서열의 임의의 부분과 상당한 상보성 및/또는 혼성화를 나타내지 않는다. 일부 실시형태에서 제1 범용 핸들 서열은 증폭 프라이머 결합 서열, 서열결정 프라이머 결합 서열 및/또는 포획 프라이머 결합 서열 중 임의의 하나 또는 임의의 조합을 포함한다. 일부 실시형태에서 제2 범용 핸들 서열은 증폭 프라이머 결합 서열, 서열결정 프라이머 결합 서열 및/또는 포획 프라이머 결합 서열 중 임의의 하나 또는 임의의 조합을 포함한다. 특정 실시형태에서 제1 범용 핸들 서열 및 제2 범용 핸들 서열은 정방향 범용 핸들 서열 및 역방향 범용 핸들 서열에 상응하고, 특정 실시형태에서는 동일한 제1 범용 핸들 서열 및 제2 범용 핸들 서열이 복수의 표적 특이적 어댑터 쌍 각각에 대해 포함된다. 이러한 정방향 범용 핸들 서열 및 역방향 범용 핸들 서열은 범용 프라이머와 함께 본 발명의 방법에 따른 라이브러리 생산에서 복구된 앰플리콘의 제2 증폭을 수행하도록 표적화된다. 특정 실시형태에서, 제1 5' 범용 핸들 서열은 2개의 범용 핸들 서열(예를 들어, 증폭 프라이머 결합 서열, 서열결정 프라이머 결합 서열 및/또는 포획 프라이머 결합 서열의 조합)을 포함하고; 제2 5' 범용 서열은 2개의 범용 핸들 서열(예를 들어, 증폭 프라이머 결합 서열, 서열결정 프라이머 결합 서열 및/또는 포획 프라이머 결합 서열의 조합)을 포함하며, 여기서 5' 제1 범용 핸들 서열 및 제2 범용 핸들 서열은 관심 표적 핵산 서열의 임의의 부분과도 유의미한 혼성화를 나타내지 않는다.
범용 증폭 프라이머 또는 범용 프라이머의 구조 및 특성은 당업자에게 잘 알려져 있으며, 특이적 분석 플랫폼에 적용하기 위해 제공된 방법 및 조성물과 함께 활용하기 위해 구현될 수 있다. 본원에 제공된 어댑터의 범용 핸들 서열은 바람직한 범용 프라이머 서열을 수용하도록 적절하게 조정된다. 예를 들어, 예를 들어, 본 명세서에 기재된 바와 같이, 선택적인 바코드 서열을 갖는 범용 P1 및 A 프라이머는 당업계에 기술되어 있으며, Ion Torrent 서열결정 플랫폼(Ion Xpress™ 어댑터, Thermo Fisher Scientific)에서 서열결정을 위해 활용되어 왔다. 유사하게, 당업계에 기재되고 알려진 추가 및 다른 범용 어댑터/프라이머 서열(예를 들어, Illumina 범용 어댑터/프라이머 서열은 예를 들어, https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf에서 찾아볼 수 있고; PacBio 범용 어댑터/프라이머 서열은 예를 들어, https://s3.amazonaws.com/files.pacb.com/pdf/Guide_Pacific_Biosciences_Template_Preparation_and_Sequencing.pdf 등에서 찾아볼 수 있음)은 본원에 제공된 방법 및 조성물과 함께 사용될 수 있다. 본 발명의 어댑터와 함께 사용하기 위한 적절한 뉴클레오티드 서열의 적합한 범용 프라이머는 당업계에서 일상적으로 사용되는 표준 자동화 핵산 합성 장비 및 시약을 사용하여 쉽게 제조된다. 하나의 단일 유형의 범용 프라이머 또는 2개의 상이한 범용 프라이머의 개별 유형(또는 심지어 혼합물), 예를 들어, 제2 증폭에서 복구된 앰플리콘의 증폭에 적합한 한 쌍의 범용 증폭 프라이머가 본 발명의 방법에 사용하기 위해 포함된다. 범용 프라이머는 선택적으로 상이한 태그(바코드) 서열을 포함하며, 여기서 태그(바코드) 서열은 어댑터에 혼성화되지 않는다. 예를 들어, 샘플 공급원의 효과적인 식별을 위해 제2 범용 증폭에서 앰플리콘에 혼입된 바코드 서열이 활용될 수 있다.
일부 실시형태에서 어댑터는 5' 제1 범용 핸들 서열과 3' 표적 특이적 서열 사이에 위치한 고유한 태그 서열을 추가로 포함하고, 여기서 고유한 태그 서열은 고유한 태그 서열 및/또는 관심 표적 핵산 서열의 임의의 부분과 유의미한 상보성 및/또는 혼성화를 나타내지 않는다. 일부 실시형태에서 복수의 프라이머 어댑터 쌍은 104 내지 109개의 상이한 태그 서열 조합을 갖는다. 따라서 특정 실시형태에서 각각의 생성된 표적 특이적 어댑터 쌍은 104 내지 109개의 상이한 태그 서열을 포함한다. 일부 실시형태에서, 복수의 프라이머 어댑터는 적어도 1개의 상이한 고유한 태그 서열 및 최대 105개의 상이한 고유한 태그 서열을 포함하는 각각의 표적 특이적 어댑터를 포함한다. 일부 실시형태에서, 복수의 프라이머 어댑터는 적어도 1개의 상이한 고유한 태그 서열 및 최대 105개의 상이한 고유한 태그 서열을 포함하는 각각의 표적 특이적 어댑터를 포함한다. 특정 실시형태에서 각각의 생성된 표적 특이적 앰플리콘은 상이한 태그 서열을 포함하는 적어도 2개 내지 최대 109 개의 상이한 어댑터 조합을 포함하고, 각각은 2개의 상이한 고유한 태그 서열을 갖는다. 일부 실시형태에서 복수의 프라이머 어댑터는 4096개의 상이한 태그 서열을 포함하는 각각의 표적 특이적 어댑터를 포함한다. 특정 실시형태에서 각각의 생성된 표적 특이적 앰플리콘은 각각 2개의 상이한 고유한 태그 서열을 갖는, 상이한 태그 서열을 포함하는 최대 16,777,216개의 상이한 어댑터 조합을 포함한다.
일부 실시형태에서 복수의 어댑터 내의 개별 프라이머 어댑터는 고정된 태그 서열과 교번하는 상이한 무작위 태그 서열을 포함하는 고유한 태그 서열(예를 들어, 태그 어댑터에 함유됨)을 포함한다. 일부 실시형태에서, 적어도 하나의 고유한 태그 서열은 적어도 하나의 무작위 서열 및 적어도 하나의 고정된 서열을 포함하거나, 양 측면에 고정된 서열이 플랭킹된 무작위 서열을 포함하거나, 양 측면에 무작위 서열이 플랭킹된 고정된 서열을 포함한다. 일부 실시형태에서 고유한 태그 서열은 길이가 2개 내지 2000개 뉴클레오티드 또는 염기쌍인 고정 서열을 포함한다. 일부 실시형태에서 고유한 태그 서열은 길이가 2개 내지 2000개 뉴클레오티드 또는 염기쌍인 무작위 서열을 포함한다.
본원에서 제공되는 표적 특이적 프라이머 및 어댑터는 적어도 하나의 절단 가능한 모이어티를 포함한다. 일부 실시형태에서 절단 가능한 모이어티는 3' 표적 특이적 서열 내에 있다. 일부 실시형태에서 절단 가능한 모이어티는 5' 제1 범용 핸들 서열과 3' 표적 특이적 서열 사이의 접합부에 또는 그 근처에 존재한다. 일부 실시형태에서 절단 가능한 모이어티는 5' 제1 범용 핸들 서열과 고유한 태그 서열 사이의 접합부에 또는 그 근처에 그리고 고유한 태그 서열과 3' 표적 특이적 서열 사이의 접합부에 또는 그 근처에 존재한다. 절단 가능한 모이어티는 변형된 뉴클레오티드, 뉴클레오시드 또는 핵염기에 존재할 수 있다. 일부 실시형태에서, 절단 가능한 모이어티는 관심 표적 서열에서 자연적으로 발생하지 않는 핵염기를 포함할 수 있다.
일부 실시형태에서 복수의 어댑터에서 적어도 하나의 절단 가능한 모이어티는 우라실 염기, 우리딘 또는 데옥시우리딘 뉴클레오티드이다. 일부 실시형태에서 절단 가능한 모이어티는 3' 표적 특이적 서열 및 5' 범용 핸들 서열과 고유한 태그 서열 사이의 접합부 및/또는 3' 표적 특이적 서열 내에 존재하며, 여기서 복수의 어댑터 내의 적어도 하나의 절단 가능한 모이어티는 우라실 DNA 글리코실라제(uracil DNA glycosylase: UDG)로 절단 가능하다. 일부 실시형태에서, 절단 가능한 모이어티는 절단되어, 감수성 무염기(abasic) 부위를 생성하고, 여기서 무염기 부위 상에서 반응할 수 있는 적어도 하나의 효소는 연장 가능한 3' 단부를 포함하는 갭을 생성한다. 특정 실시형태에서, 생성된 갭은 5'-데옥시리보스 포스페이트 기를 포함한다. 특정 실시형태에서 생성된 갭은 연장 가능한 3' 단부 및 5' 결찰 가능한 포스페이트 기를 포함한다.
또 다른 실시형태에서, 이노신은 절단 가능한 기로서 DNA 기반 핵산에 혼입될 수 있다. 하나의 예시적인 실시형태에서, EndoV는 이노신 잔기 근처를 절단하는 데 사용될 수 있다. 또 다른 예시적인 실시형태에서, 효소 hAAG는 무염기성 부위를 생성하는 핵산으로부터 이노신 잔기를 절단하는 데 사용될 수 있다.
절단 가능한 모이어티가 존재하는 경우, 어댑터에서 적어도 하나의 절단 가능한 모이어티의 위치는 복수의 이중 가닥 어댑터에서 임의의 소정의 이중 가닥 어댑터의 용융 온도(Tm)를 크게 변경하지 않는다. 복수의 이중 가닥 어댑터로부터 임의의 2개의 소정의 이중 가닥 어댑터의 용융 온도(Tm)는 실질적으로 동일하며, 여기서 임의의 2개의 소정의 이중 가닥 어댑터의 용융 온도(Tm)는 서로 10℃를 초과하게 다르지 않다. 그러나, 복수의 어댑터 각각 내에서, 예를 들어, 범용 핸들 서열의 비교 가능한 최대 최소 용융 온도가 고유한 태그 서열 및/또는 임의의 어댑터의 표적 특이적 서열 중 어느 하나의 비교 가능한 최대 최소 용융 온도보다 높도록 서열 영역의 용융 온도가 다르다. 비교 가능한 최대 최소 용융 온도의 이러한 국부적 차이는 앰플리콘의 소화 및 복구를 최적화하고 궁극적으로 본원에 제공된 방법의 효율성을 개선하기 위해 조정될 수 있다.
본 발명의 방법에 의해 생성된 핵산 라이브러리를 포함하는 조성물이 추가로 제공된다. 제공된 조성물에는 적어도 2개 내지 최대 10만 개의 표적 특이적 앰플리콘이 포함된다. 제공된 조성물은 고도로 멀티플렉싱된 표적화 라이브러리를 포함한다. 제공된 조성물에는 적어도 2개 내지 최대 10만 개의 표적 특이적 태깅된 앰플리콘이 포함된다. 일부 실시형태에서, 라이브러리 조성물은 적어도 2개의 상이한 표적 핵산 서열의 멀티플렉스를 포함하는 복수의 표적 특이적 앰플리콘을 포함한다. 일부 실시형태에서, 조성물은 적어도 25개, 50개, 75개, 100개, 150개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 750개, 1000개, 1250개, 1500개, 1750개, 2000개, 2250개, 2500개, 2750개, 3000개, 3250개, 3500개, 3750개, 4000개, 4500개, 5000개, 5500개, 6000개, 7000개, 8000개, 9000개, 10000개, 11000개 또는 12000개 또는 그 초과의 표적 특이적 앰플리콘을 포함한다. 일부 실시형태에서, 표적 특이적 앰플리콘은 임상 또는 병리학적 상태와 연관된 게놈의 하나 이상의 엑손, 유전자, 엑솜 또는 영역, 예를 들어, 암, 예를 들어, 폐암, 결장암, 유방암 등과 연관된 하나 이상의 돌연변이(예를 들어, 드라이버 돌연변이)를 포함하는 하나 이상의 사이트를 포함하는 앰플리콘 또는 유전병, 예를 들어, 낭포성 섬유증, 근이영양증 등과 연관된 돌연변이를 포함하는 앰플리콘을 포함한다. 일부 실시형태에서, 표적 특이적 앰플리콘은 약 100개 내지 약 750개의 염기쌍 길이인 어댑터 결찰된 앰플리콘 표적 서열 또는 어댑터 증폭된 앰플리콘 표적 서열의 라이브러리를 포함한다.
범용 증폭 프라이머 또는 범용 프라이머의 구조 및 특성은 당업자에게 잘 알려져 있으며, 특이적 분석 플랫폼에 적용하기 위해 제공된 방법 및 조성물과 함께 활용하기 위해 구현될 수 있다. 본원에 제공된 어댑터 및 앰플리콘의 범용 핸들 서열은 바람직한 범용 프라이머 서열을 수용하도록 적절하게 조정된다. 예를 들어, 예를 들어, 본 명세서에 기재된 바와 같이, 선택적인 바코드 서열을 갖는 범용 P1 및 A 프라이머는 당업계에 기술되어 있으며, Ion Torrent 서열결정 플랫폼(Ion Xpress™ 어댑터, Thermo Fisher Scientific)에서 서열결정을 위해 활용되어 왔다. 유사하게, 당업계에 기재되고 알려진 추가 및 다른 범용 어댑터/프라이머 서열(예를 들어, Illumina 범용 어댑터/프라이머 서열은 예를 들어, https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf에서 찾아볼 수 있고; PacBio 범용 어댑터/프라이머 서열은 예를 들어, https://s3.amazonaws.com/files.pacb.com/pdf/Guide_Pacific_Biosciences_Template_Preparation_and_Sequencing.pdf 등에서 찾아볼 수 있음)은 본원에 제공된 방법 및 조성물과 함께 사용될 수 있다. 본 발명의 라이브러리와 함께 사용하기 위한 적절한 뉴클레오티드 서열의 적합한 범용 프라이머는 당업계에서 일상적으로 사용되는 표준 자동화 핵산 합성 장비 및 시약을 사용하여 쉽게 제조된다. 하나의 단일 유형 또는 2개의 상이한 범용 프라이머의 개별 유형(또는 심지어는 혼합물), 예를 들어, 예비 라이브러리의 증폭에 적합한 범용 증폭 프라이머의 쌍이 본 발명의 라이브러리의 생산에 사용될 수 있다. 범용 프라이머는 선택적으로 태그(바코드) 서열을 포함하고, 여기서 태그(바코드) 서열은 어댑터 서열 또는 표적 핵산 서열에 혼성화하지 않는다. 예를 들어, 샘플 공급원의 효과적인 식별을 위해 제2 범용 증폭에서 앰플리콘에 혼입된 바코드 서열을 활용함으로써 바코딩된 라이브러리를 생성할 수 있다. 따라서 제공된 조성물은 고도로 멀티플렉싱된 바코딩된 표적화된 라이브러리를 포함한다. 제공된 조성물은 또한 고도로 멀티플렉싱된 바코딩된 태그화된 표적화 라이브러리를 포함한다.
일부 실시형태에서 앰플리콘 라이브러리는 5' 제1 범용 핸들 서열과 3' 표적 특이적 서열 사이에 위치한 고유한 태그 서열을 포함하고, 여기서 고유한 태그 서열은 고유한 태그 서열 및/또는 표적 핵산 서열의 임의의 부분과 유의미한 상보성 및/또는 혼성화를 나타내지 않는다. 일부 실시형태에서 복수의 앰플리콘은 104개 내지 109개의 상이한 태그 서열 조합을 갖는다. 따라서 특정 실시형태에서 라이브러리에서 복수의 앰플리콘 각각은 104개 내지 109개의 상이한 태그 서열을 포함한다. 일부 실시형태에서 라이브러리에서 복수의 앰플리콘 각각은 적어도 1개의 상이한 고유한 태그 서열 및 최대 105개의 상이한 고유한 태그 서열을 포함한다. 특정 실시형태에서 라이브러리에서 각각의 표적 특이적 앰플리콘은 상이한 태그 서열을 포함하는 적어도 2개 내지 최대 109개의 상이한 조합을 포함하고, 각각은 2개의 상이한 고유한 태그 서열을 갖는다. 일부 실시형태에서 라이브러리에서 복수의 앰플리콘 각각은 4096개의 상이한 태그 서열을 포함하는 태그 서열을 포함한다. 특정 실시형태에서 라이브러리의 각각의 표적 특이적 앰플리콘은 각각 2개의 상이한 고유한 태그 서열을 갖는, 상이한 태그 서열을 포함하는 최대 16,777,216개의 상이한 조합을 포함한다.
키트, 시스템
본 발명의 제1 양태 또는 제2 양태의 방법을 사용하여 표적 핵산의 라이브러리를 제조하는 데 사용하기 위한 키트가 본원에 추가로 제공된다. 키트의 실시형태는 제1 증폭 생성물을 생산할 수 있는 적어도 한 쌍의 표적 특이적 프라이머 및/또는 본원에 정의된 바와 같은 어댑터의 공급물; 제1 증폭 생성물을 생산할 수 있지만 어댑터 결찰된 앰플리콘 또는 어댑터 증폭된 표적 앰플리콘을 생산하기 위한 작업흐름을 통해 처리되지 않는 본원에 정의된 바와 같은 하나 이상의 차단 표적 특이적 프라이머; 뿐만 아니라 i) 본 발명의 제1 양태의 소화된 앰플리콘에 대한 결찰이 가능하거나 ii) 어댑터의 범용 핸들(들)에 어닐링하고 본 발명의 제2 양태의 증폭 생성물의 프라이밍 합성이 가능한 증폭 어댑터의 적어도 하나의 범용 쌍의 공급원을 포함하며, 이 증폭 생성물은 범용 서열에 결찰된 관심 표적 서열을 포함할 것이다. 어댑터 및/또는 프라이머는 즉시 사용할 수 있는 키트로 공급될 수 있으며, 더 바람직하게는 사용 전에 희석이 필요한 농축액 또는 심지어 사용 전에 재구성이 필요한 동결건조 또는 건조 형태로 제공될 수 있다. 특정 실시형태에서 키트는 구성요소의 희석 또는 재구성을 위한 적합한 희석제의 공급원을 추가로 포함한다. 선택적으로, 키트는 본원에 제공된 바와 같은 라이브러리의 생성에서 증폭, 소화, 복구 및/또는 정제를 수행하는 데 사용하기 위한 시약, 완충제, 효소, dNTP 등의 공급원을 추가로 포함한다. 이러한 시약의 비제한적 예는 첨부된 예시의 재료 및 방법 섹션에 설명된 바와 같다. 키트에 선택적으로 공급되는 추가 구성요소는 제공된 방법을 사용하여 제조된 라이브러리의 정제에 적합한 구성요소를 포함한다. 일부 실시형태에서, 5' 범용 핸들 서열, 3' 표적 특이적 서열 및 절단 가능한 기를 갖는 복수의 표적 특이적 어댑터, DNA 폴리머라제, 어댑터, dATP, dCTP, dGTP, dTTP 및 소화 시약을 포함하는 표적 특이적 라이브러리의 생성을 위한 키트가 제공된다. 일부 실시형태에서, 키트는 하나 이상의 항체, 복구 시약, 선택적으로 핵산 바코드를 포함하는 범용 프라이머, 정제 용액 또는 컬럼을 추가로 포함한다.
키트에 포함하기 위한 어댑터의 특정 특징은 다른 곳에서 설명되어 있다. 미국 특허 제9,957,558B2호 및 미국 특허출원공개 US2019/0002872A1호를 참조하며, 이들의 개시내용은 본원에 참조에 의해 포함된다. 범용 증폭 프라이머의 구조 및 특성은 당업자에게 잘 알려져 있으며, 특정 분석 플랫폼에 적용하기 위해 제공된 방법 및 조성물과 함께 사용하기 위해 구현될 수 있다(예를 들어, 본원에 기재된 바와 같이 범용 P1 및 A 프라이머는 당업계에 기재되어 있고, Ion Torrent 서열결정 플랫폼에서 서열결정에 사용됨). 유사하게, 당업계에 기재되고 알려진 추가 및 다른 범용 어댑터/프라이머 서열(예를 들어, Illumina 범용 어댑터/프라이머 서열, PacBio 범용 어댑터/프라이머 서열 등)이 본원에 제공된 방법 및 조성물과 함께 사용될 수 있다. 키트에 포함된 어댑터와 함께 사용하기 위한 적절한 뉴클레오티드 서열의 적합한 프라이머는 당업계에서 일상적으로 사용되는 표준 자동화 핵산 합성 장비 및 시약을 사용하여 쉽게 제조된다. 키트는 단일 유형의 범용 프라이머 또는 2개의 상이한 범용 프라이머의 별개의 유형(또는 혼합물)의 공급원, 예를 들어, 제1 증폭에서 어댑터로 변형된 주형의 증폭에 적합한 증폭 프라이머 쌍을 포함할 수 있다. 키트는 본 발명의 방법에 따른 관심 샘플의 제1 증폭을 위한 적어도 한 쌍의 어댑터와, 선택적으로 상이한 태그(바코드) 서열을 보유하는 적어도 2개의 상이한 증폭 프라이머를 포함할 수 있으며, 여기서 태그(바코드) 서열은 어댑터에 혼성화되지 않는다. 키트는 적어도 2개의 상이한 샘플을 증폭시키기 위해서 사용될 수 있는데, 여기서 각각의 샘플은 본 발명의 방법에 따라 별도로 증폭되고, 제2 증폭은 바코드를 갖는 단일 범용 프라이머를 사용하는 것, 그 다음 라이브러리 제조 후 제조된 샘플 라이브러리를 풀링시키는 것을 포함한다. 일부 실시형태에서 키트는 본원에 기재된 제2 증폭 단계에서 사용하기 위한 상이한 범용 프라이머 쌍을 포함한다. 이와 관련하여 '범용' 프라이머 쌍은 실질적으로 동일한 뉴클레오티드 서열일 수 있지만 일부 다른 특징 또는 변형에 대해서는 상이할 수 있다.
시스템, 예를 들어, 본원에 제공된 방법을 실행하는 데 사용되는 시스템 및/또는 본원에 제공된 조성물을 포함하는 시스템이 추가로 제공된다. 일부 실시형태에서, 시스템은 자동화 모드에서 수행되는 방법을 용이하게 한다. 특정 실시형태에서, 시스템은 높은 처리량 모드를 가능하게 한다. 특정 실시형태에서, 시스템은 예를 들어, 유체 취급 요소, 유체 함유 요소, 원하는 반응 온도를 달성하고 유지하기 위한 열원 및/또는 열 싱크 및/또는 시스템의 구성요소를 필요에 따라서 장소에서 장소로 이동시킬 수 있는 로봇 요소(예를 들어, 멀티웰 플레이트 취급 요소)를 포함한다.
샘플
본원에서 정의된, "샘플" 및 이의 파생어는 가장 넓은 의미로 사용되며, 표적 핵산을 포함하는 것으로 의심되는 임의의 시편, 배양물 및/또는 이와 유사한 것을 포함한다. 일부 실시형태에서, 샘플은 DNA, RNA, 키메라 핵산, 하이브리드 핵산, 멀티플렉스 형태의 핵산 또는 상기 중 둘 이상의 임의의 조합물을 포함한다. 일부 실시형태에서 본 발명의 방법과 관련하여 유용한 샘플은 하나 이상의 관심 표적 핵산을 함유하는 임의의 생물학적, 임상적, 외과적, 농업적, 대기 또는 수생 기반 시편을 포함한다. 일부 실시형태에서, 샘플은 인간 또는 포유동물 공급원과 같은 동물로부터 얻은 핵산 분자를 포함한다. 또 다른 실시형태에서, 샘플은 식물, 박테리아, 바이러스 또는 진균과 같은 비포유동물 공급원으로부터 얻은 핵산 분자를 포함한다. 일부 실시형태에서, 핵산 분자의 공급원은 보관되거나 멸종된 샘플 또는 종일 수 있다. 일부 실시형태에서, 샘플은 예를 들어, 게놈 DNA, RNA와 같은 공급원으로부터 제조된 단리된 핵산 샘플 또는 예를 들어, 신선 냉동 또는 포르말린 고정 파라핀 포매(FFPE) 핵산 시편과 같은 제조된 샘플을 포함한다. 또한 샘플은 단일 개인, 유전적으로 관련된 구성원으로부터의 핵산 샘플의 모음, 유전적으로 관련되지 않은 구성원으로부터의 다중 핵산 샘플, 종양 샘플과 같은 단일 개인으로부터의 다중 핵산 샘플(일치) 및 정상 조직 샘플 또는 모체 대상체로부터 얻은 모체 및 태아 DNA와 같은 두 가지 구별되는 형태의 유전 물질을 함유하는 단일 공급원으로부터의 유전 물질 또는 식물 또는 동물 핵산을 함유하는 샘플 내의 오염 박테리아 또는 바이러스 핵산의 존재로부터 유래된다고 예상된다. 일부 실시형태에서, 핵산 물질의 공급원은 신생아(예를 들어, 신생아 스크리닝을 위한 혈액 샘플)로부터 얻은 핵산을 포함한다. 일부 실시형태에서, 제공된 방법은 단일 핵산 샘플로부터의 다중 표적 특이적 서열의 증폭을 포함한다. 일부 실시형태에서, 제공된 방법은 2개 이상의 핵산 샘플 또는 종으로부터의 2개 이상의 표적 서열의 표적 특이적 증폭을 포함한다. 특정 실시형태에서, 제공된 방법은 단일 샘플로부터의 고도로 멀티플렉싱된 표적 핵산 서열의 증폭을 포함한다. 특정 실시형태에서, 제공된 방법은 각각 동일한 공급원 유기체로부터의 하나 초과의 샘플로부터의 고도로 멀티플렉싱된 표적 핵산 서열의 증폭을 포함한다.
일부 실시형태에서 샘플은 표적 핵산과 비표적 핵산의 혼합물을 포함한다. 특정 실시형태에서 샘플은 하나 이상의 표적 핵산의 혼합물을 포함하고 하나 이상의 비-표적 핵산을 포함할 수 있는 복수의 초기 폴리뉴클레오티드를 포함한다. 일부 실시형태에서 복수의 폴리뉴클레오티드를 포함하는 샘플은 기원 샘플의 일부 또는 분취량을 포함하고; 일부 실시형태에서, 샘플은 전체 기원 샘플인 복수의 폴리뉴클레오티드를 포함한다. 일부 실시형태에서 샘플은 상이한 시점에서 동일한 공급원 또는 동일한 대상체로부터 단리된 복수의 초기 폴리뉴클레오티드를 포함한다.
일부 실시형태에서, 핵산 샘플은 생물학적 유체로부터의 세포 유리 핵산, 조직으로부터의 핵산, 생검 조직으로부터의 핵산, 바늘 생검으로부터의 핵산, 단일 세포로부터의 핵산 또는 2종 이상의 세포로부터의 핵산을 포함한다. 특정 실시형태에서, 단일 반응 혼합물은 1 ng 내지 100 ng의 복수의 초기 폴리뉴클레오티드를 함유한다. 일부 실시형태에서 복수의 초기 폴리뉴클레오티드는 포르말린 고정 파라핀 포매(FFPE) 샘플; 게놈 DNA; RNA; 세포 유리 DNA 또는 RNA; 순환 종양 DNA 또는 RNA; 신선한 냉동 샘플 또는 상기 중 둘 이상의 혼합물을 포함하고; 일부 실시형태에서 복수의 초기 폴리뉴클레오티드는 핵산 참조 표준을 포함한다. 일부 실시형태에서, 샘플은 생검, 종양, 스크래핑, 면봉, 혈액, 점액, 소변, 혈장, 정액, 모발, 레이저 포획 미세 절개, 외과적 절제 및 다른 임상 또는 실험실에서 얻은 샘플로부터 얻은 핵산 분자를 포함한다. 일부 실시형태에서, 샘플은 역학, 농업, 법의학 또는 병원성 샘플이다. 특정 실시형태에서, 샘플은 참조를 포함한다. 일부 실시형태에서 샘플은 정상 조직 또는 양호하게 문서화된 종양 샘플이다. 특정 실시형태에서 참조는 표준 핵산 서열(예를 들어, Hg19)이다.
표적 핵산 서열 분석
본 발명의 제공된 방법 및 조성물은 후속 분석을 위해서 표적 서열을 증폭시키고, 선택적으로 태깅하고, 제조하는 데 특히 적합하다. 따라서, 일부 실시형태에서, 본원에 제공된 방법은 생성된 라이브러리 제제를 분석하는 것을 포함한다. 예를 들어, 방법은 표적 핵산의 폴리뉴클레오티드 서열의 분석 및 적용 가능한 경우 표적 핵산에 첨가된 임의의 태그 서열(들)의 분석을 포함한다. 다중 표적 핵산 영역이 증폭되는 일부 실시형태에서, 제공된 방법은 다중 표적 핵산의 폴리뉴클레오티드 서열을 결정하는 것을 포함한다. 제공된 방법은 표적 서열의 공급원을 식별하기 위해(또는 샘플 공급원에 대한 다른 정보를 제공하기 위해) 제2 태그 서열(들), 예를 들어 바코드 서열을 사용하는 것을 선택적으로 추가로 포함한다. 특정 실시형태에서, 핵산 라이브러리의 서열의 분석을 위해 제조된 라이브러리 조성물의 사용이 제공된다.
특정 실시형태에서, 표적 핵산 라이브러리의 서열을 추가로 분석하기 위해 제조된 태깅된 라이브러리 조성물의 사용이 제공된다. 일부 실시형태에서 서열의 결정은 샘플 내에서 표적 서열 중 적어도 하나의 존재비(abundance)를 결정하는 것을 포함한다. 일부 실시형태에서, 샘플에서 낮은 빈도의 대립유전자의 결정은 핵산 라이브러리의 서열 결정에 포함된다. 특정 실시형태에서, 복수의 폴리뉴클레오티드에서 돌연변이 표적 핵산의 존재의 결정은 핵산 라이브러리의 서열 결정에 포함된다. 일부 실시형태에서, 돌연변이 표적 핵산의 존재 결정은 복수의 폴리뉴클레오티드에서 적어도 하나의 돌연변이 표적 핵산의 존재비 수준을 검출하는 것을 포함한다. 예를 들어, 이러한 결정은 적어도 하나의 돌연변이 표적 핵산이 샘플 내의 본래의 복수의 폴리뉴클레오티드의 0.05% 내지 1%로 존재하는 것을 검출하는 것, 적어도 하나의 돌연변이 표적 핵산이 샘플 내의 폴리뉴클레오티드의 약 1% 내지 약 5%로 존재하는 것을 검출하는 것 및/또는 샘플 내의 표적 핵산의 적어도 85% 내지 100%를 검출하는 것을 포함한다. 일부 실시형태에서, 돌연변이 표적 핵산의 존재 결정은 샘플에서 카피 수 변이 및/또는 유전적 융합 서열의 검출 및 식별을 포함한다.
일부 실시형태에서, 본 개시내용의 교시에 의해 생성된 증폭된 표적 서열의 핵산 서열결정은 드 노보 서열결정 또는 표적화 재서열결정을 포함한다. 일부 실시형태에서, 핵산 서열결정은 증폭된 표적 서열의 핵산 서열결정 결과를 참조 핵산 서열과 비교하는 것을 추가로 포함한다. 일부 실시형태에서, 표적 라이브러리 서열의 핵산 서열결정은 핵산 서열 내의 돌연변이의 존재 또는 부재를 결정하는 것을 추가로 포함한다. 일부 실시형태에서, 핵산 서열결정은 질병(예를 들어, 암 및/또는 유전병)과 관련된 유전적 마커의 식별을 포함한다.
일부 실시형태에서, 개시된 방법의 표적 서열의 제조된 라이브러리는 추가 정제 또는 조작이 있거나 없는 다양한 하류 분석 또는 검정에서 사용된다. 일부 실시형태에서 분석은 전통적인 서열결정 반응에 의한 서열결정, 고속 대량 처리(high throughput) 차세대 서열결정, 표적화된 멀티플렉스 어레이 서열 검출 또는 상기 중 둘 이상의 임의의 조합을 포함한다. 특정 실시형태에서 분석은 고속 대량 처리 차세대 서열결정에 의해 수행된다. 특정 실시형태에서, 서열결정은 양방향 방식으로 수행되며, 이로써 임의의 소정의 앰플리콘에 대한 정방향 및 역방향 가닥 모두에서 서열 판독을 생성한다.
일부 실시형태에서, 본원에 제공된 방법에 따라 제조된 라이브러리는 추가 분석을 위해 추가로 조작된다. 예를 들어, 제조된 라이브러리 서열은 이후에 차세대 서열결정에서 사용되는 주형 라이브러리를 생성하기 위한 브릿지 증폭 또는 emPCR과 같은 당업계에 알려진 하류 농축 기술에 사용된다. 일부 실시형태에서, 표적 핵산 라이브러리는 농축 응용분야 및 서열결정 응용분야에서 사용된다. 예를 들어, 제공된 표적 핵산 라이브러리의 서열결정은 임의의 적합한 DNA 서열결정 플랫폼을 사용하여 달성된다. 일부 실시형태에서, 개시된 방법의 라이브러리 서열 또는 후속적으로 제조된 주형 라이브러리는 단일 뉴클레오티드 다형성(SNP) 분석, 유전자형 분석 또는 후생유전학 분석, 카피 수 변이 분석, 유전자 발현 분석, 유전자 돌연변이 분석, 예컨대, 비제한적으로 검출, 예후 및/또는 진단, 희귀하거나 낮은 빈도의 대립유전자 돌연변이의 검출 및 분석, 핵산 서열결정, 예컨대, 비제한적으로 드 노보 서열결정, 표적화 재서열결정 및 합성 어셈블리 분석을 위해서 사용된다. 일 실시형태에서, 제조된 라이브러리 서열을 사용하여 5% 미만의 대립유전자 빈도에서 돌연변이를 검출한다. 일부 실시형태에서, 본원에 개시된 방법은 4%, 3%, 2% 미만 또는 약 1%의 대립유전자 빈도에서 핵산의 집단에서 돌연변이를 검출하는 데 사용된다. 또 다른 실시형태에서, 본원에 기재된 바와 같이 제조된 라이브러리는 핵산 분자의 집단으로부터 생식계열 또는 체세포 돌연변이를 검출 및/또는 식별하기 위해 서열결정된다. 특정 실시형태에서, 서열결정 어댑터는 제조된 라이브러리의 단부에 결찰되어 핵산 서열결정에 적합한 복수의 라이브러리를 생성한다.
일부 실시형태에서, 핵산 서열결정 또는 클론성 증폭과 같은 다양한 하류 프로세스 또는 검정에서 사용하기 위한 표적 특이적 앰플리콘 라이브러리를 제조하는 방법이 제공된다. 일부 실시형태에서, 라이브러리는 브릿지 증폭 또는 emPCR을 사용하여 증폭되어 핵산 서열결정에 적합한 복수의 클론성 주형을 생성한다. 예를 들어, 선택적으로 표적 특이적 증폭 후에 라이브러리 증폭 단계 및/또는 클론성 증폭 단계를 포함하지만 이에 제한되지 않는 2차 및/또는 3차 증폭 프로세스가 수행된다. "클론성 증폭"은 개별 분자의 많은 카피의 생성을 지칭한다. 당업계에 알려진 다양한 방법이 클론성 증폭에 사용된다. 예를 들어, 에멀젼 PCR이 하나의 방법이며, 이것은 오일 상 내의 수성 방울에서 프라이머 코팅된 비드와 함께 개별 DNA 분자를 단리하는 것을 포함한다. 그런 다음 폴리머라제 연쇄 반응(PCR)이 각각의 비드를 단리된 라이브러리 분자의 클론 카피로 코팅하고, 이후 이 비드는 후속 서열결정을 위해 고정된다. 에멀젼 PCR은 Marguilies 등 및 Shendure 및 Porreca 등에 의해서 공개된 방법(Agencourt가 상업화하고 Applied Biosystems가 최근 인수한 "폴로니 서열결정(polony sequencing)"이라고도 알려짐)에 사용된다. 문헌[Margulies, et al. (2005) Nature 437: 376-380]; 문헌 [Shendure et al., Science 309 (5741): 1728-1732]. 클론성 증폭을 위한 또 다른 방법은 단편이 고체 표면에 부착된 프라이머에서 증폭되는 "브릿지 PCR"이다. 클론성 증폭을 위한 또 다른 방법은 지지체, 예를 들어, 프라이머 코팅된 비드 상의 핵산 분자의 분리와 함께, PCR 대신 등온 증폭을 사용하고, 등온 증폭은 단리된 핵산 분자의 클론 카피로 각각의 지지체를 코팅한다. 클론성 증폭의 다른 방법뿐만 아니라 이러한 방법은 각각 단일 분자 폴리뉴클레오티드 단편으로부터 유래된 많은 카피를 함유하는 많은 물리적으로 단리된 위치를 생성한다. 따라서, 일부 실시형태에서, 하나 이상의 표적 특이적 앰플리콘은 예를 들어, 브릿지 증폭 또는 emPCR 또는 등온 증폭을 사용하여 증폭되어 핵산 서열결정에 적합한 복수의 클론성 주형을 생성한다.
일부 실시형태에서, 클론성으로 증폭될 라이브러리 서열 중 적어도 하나는 지지체 또는 입자에 부착된다. 지지체는 임의의 적합한 재료로 구성될 수 있고, 예를 들어, 평면형, 회전 타원체 또는 미립자를 포함하는 임의의 적합한 형상을 가질 수 있다. 일부 실시형태에서, 지지체는 전문이 참조에 의해 포함된 미국 특허공개 제20100304982호에 기재된 바와 같은 스캐폴딩된 중합체 입자이다. 특정 실시형태에서 방법은 라이브러리 서열의 풍부한 집단의 적어도 일부를 지지체(예를 들어, 서열결정 지지체) 상에 침착하는 것을 포함하며, 여기서 지지체는 서열결정 반응 부위의 어레이를 포함한다. 일부 실시형태에서, 라이브러리 서열의 풍부한 집단은 지지체 상의 서열결정 반응 부위에 부착된다. 여기서 지지체는 102개 내지 1010개의 서열결정 반응 부위의 어레이를 포함한다.
서열 결정은 핵산의 서열에 관한 정보의 결정을 의미하며, 핵산의 전체 서열 정보뿐만 아니라 부분적인 서열 정보의 식별 또는 결정을 포함할 수 있다. 서열 정보는 다양한 정도의 통계적 신뢰성(statistical reliability) 또는 신뢰도로 결정될 수 있다. 일부 실시형태에서 서열 분석은 당업계에 알려진 qPCR, rtPCR 및/또는 어레이 혼성화 검출 방법과 같은 높은 처리량, 낮은 깊이 검출을 포함한다. 일부 실시형태에서, 서열결정 분석은 Sanger 서열결정 또는 다른 고속 대량 처리 차세대 서열결정 방법과 같은 심층 서열 평가(depth sequence assessment)의 결정을 포함한다. 차세대 서열결정은 본질적으로 대규모 병렬 방식으로 많은(전형적으로 수천에서 수십억) 핵산 서열을 결정하는 방법을 사용하는 서열 결정을 의미하고, 예를 들어, 여기서 병렬로 또는 또는 대안적으로 그 자체가 병렬화될 수 있는 초고속 대량 연속 프로세스를 사용하여 다수의 서열이 판독된다. 따라서, 특정 실시형태에서, 본 발명의 방법은 대규모 병렬 서열결정을 포함하는 서열결정 분석을 포함한다. 이러한 방법은 파이로서열결정(예를 들어, 454 Life Sciences, Inc.(미국 코네티컷주 브랜포드 소재)에 의해 상업화됨); 결찰에 의한 서열결정(예를 들어, SOLiD™ 기술로 상업화됨, Life Technologies, Inc.(미국 캘리포니아주 칼스배드 소재)); 변형된 뉴클레오티드를 사용한 합성에 의한 서열결정(예컨대, Illumina, Inc.(미국 캘리포니아주 샌디에이고주 소재)의 TruSeq™ 및 HiSeg™ 기술로 상업화됨; Helicos Biosciences Corporation(미국 매사추세츠주 캠브릿지 소재)에 의한 HeliScope™; 및 Pacific Biosciences of California, Inc.(미국 캘리포니아주 멘로 파크 소재)에 의한 PacBio Sequel® 또는 RS 시스템, 이온 검출 기술에 의한 서열결정(예를 들어, Ion Torrent™ 반도체 서열결정 기술, Life Technologies(미국 캘리포니아주 칼스배드 소재); DNA 나노볼(nanoball)의 서열결정(Complete Genomics, Inc.(미국 캘리포니아주 마운틴 뷰 소재)); 나노포어 기반 서열결정 기술(예를 들어, Oxford Nanopore Technologies, LTD(영국 옥스포드 소재)에 의해 개발됨), 및 고도로 병렬화된 서열결정 방법을 포함하지만 이들로 제한되지 않는다.
예를 들어, 특정 실시형태에서, 본 개시내용의 교시에 의해 생성된 라이브러리는 Ion Torrent™ Genexus™ 서열결정 시스템(Life Technologies), Ion Chef 시스템을 사용한 수동 주형 제조 또는 자동 제조를 사용하는 Ion GeneStudio S5 Sequencing 시스템(Life Technologies); 및/또는 Ion Torrent™ PGM 시스템을 사용하는 Ion Xpress™ 주형 키트(예를 들어, Ion Sphere™ 입자 상의 핵산 단편 라이브러리의 PCR 매개 첨가)(Life Technologies, 파트 번호 4467389) 또는 Ion Torrent Proton™ 시스템)을 포함하는 다양한 통합 및/또는 하류 서열결정 응용분야에서 사용하기에 수율면에서 충분하다. 예를 들어, 앰플리콘 라이브러리로부터 주형 라이브러리를 제조하는 지침은 전문이 참조에 의해 포함된 Ion Xpress 주형 키트 사용자 가이드(Life Technologies, 파트 번호 4465884)에서 찾을 수 있다. 핵산 서열결정을 위해 후속 주형 라이브러리를 Ion Torrent™ 칩에 로딩하는 지침은 전문이 참조에 의해 포함된 Ion Sequencing 사용자 가이드(파트 번호 4467391)에 설명되어 있다. 유사하게, 다른 플랫폼(예를 들어, PacBio, Illumina, Helicos, Complete Genomics, Oxford Nanopore)을 사용한 서열결정은 각각의 플랫폼 각각과 함께 제공된 지침 및 가이던스에 따라 관련 주형 제조를 통합하기 위해 개작된 방법론을 사용하여 수행될 수 있다.
서열결정 반응의 개시점은 고체상 증폭 반응의 생성물에 서열결정 프라이머를 어닐링함으로써 제공될 수 있다. 이와 관련하여, 주형 라이브러리 형성 중에 첨가되는 어댑터 중 하나 또는 둘 모두는 전체 게놈 또는 주형 라이브러리의 고체상 증폭에 의해 유래된 증폭 생성물에 서열결정 프라이머의 어닐링을 허용하는 뉴클레오티드 서열을 포함할 수 있다. 본 발명의 실시형태의 구현에 따라, 태그 서열 및/또는 표적 핵산 서열은 단일 서열결정 프라이머로부터의 단일 판독에서, 또는 2개의 상이한 서열결정 프라이머로부터의 다중 판독에서 결정될 수 있다. 2개의 서열결정 프라이머로부터 2개의 판독의 경우, '태그 판독' 및 '표적 서열 판독'은 제1 서열결정 판독이 완료된 후 어닐링된 프라이머를 제거하기 위한 적합한 변성 단계와 함께 어느 순서로든 수행된다.
일부 실시형태에서, 서열결정기는 증폭된 표적 핵산 분자의 서열을 결정하기 위해 매개변수 또는 소프트웨어를 적용하는 서버에 커플링된다. 특정 실시형태에서, 서열결정기는 샘플에 존재하는 낮은 빈도의 돌연변이 대립유전자의 존재를 결정하기 위해 매개변수 또는 소프트웨어를 적용하는 서버에 커플링된다.
특정 실시형태는 하기 실시예에서 추가로 설명된다. 다음은 단지 예시로서 제공되며 어떤 식으로든 청구된 발명의 범주 또는 실시형태의 범주를 제한하려는 의도가 아니다.
실시예
실시예 1.
이전에 기재된 DNA, RNA 및 LNA 차단제를 사용하는 차단 프라이머 방법을 본 발명의 방법과 비교하였다. 약술하자면, 라이브러리를 열 순환 조건(99℃, 15초 변성, 60℃, 4분 어닐링/연장)을 포함하여 제조업체 지침에 따라 표준 Ion AmpliSeq 프로토콜을 사용하는 Ion Ampliseq Cancer Hotspot Panel v2를 사용하여 작제하였다. 일부 경우에, 순환 조건을 약간 변형시켰다(즉, 어닐링 동안 램프 속도를 72℃ 내지 60℃에서 최대의 10%(0.33℃/초)로 감소시켰다). 게놈 DNA HD701(Horizon Discovery, 영국 워터비치 소재)을 사용하여 실험을 수행하였다. DNA 차단 프라이머를 15 nM, 45 nM, 135 nM 또는 405 nM 최종 농도로 첨가하고, 표준 또는 변형된 순환 프로토콜을 사용하여 순환시켰다. 후속 라이브러리 제조 단계는 표준 Ion AmpliSeq 프로토콜을 따랐고, 그 다음 Ion Torrent Sequencing을 사용한 서열결정을 수행하였다. Ion AmpliSeq 라이브러리 키트 2.0 사용자 가이드 MAN0006735 Thermo Fisher Scientific을 참조한다. 결과를 도 3a에 도시한다. 효과적인 차단을 위해서는 변형된 조건이 필요한 것으로 보이며, 실질적이지는 않지만 더 긴 차단제가 더 효과적이다. 본 발명자들의 실험은 이전에 기재된 DNA 차단제 올리고를 Ion AmpliSeq 기술과 함께 사용하여 높은 특이성과 강력한 억제가 부족함을 나타낸다. 또한 변형된 순환 조건에 대한 요구 사항은 관심 표적을 유연하게 선택하기 위해 기존 패널에 단순히 추가할 수 없다.
[표 1]
RNA 차단제 실험을 위해, 차단 프라이머가 DNA가 아닌 RNA로 만들어진 것을 제외하고 DNA 차단에 대해 기재된 바와 같이 차단 올리고를 사용하여 라이브러리를 제조하였다. 결과를 도 3b에 도시한다. 동일한 설계이지만, RNA 차단제 올리고를 사용하면 차단을 위해 변형된 순환 조건이 필요하지 않으며 결과는 DNA 올리고 차단제 실험보다 더 효과적인 차단을 나타낸다. DNA 차단제와 마찬가지로, RNA 차단은 특이성을 생성하지 않는 것으로 보인다. 따라서, RNA 차단은 상당한 변형 및 최적화 요건이 없이는 표준 반응에 대한 멀티플렉스 표적화 또는 드롭 인에 적합하지 않을 수 있다.
LNA 차단제 실험을 위해, 차단 프라이머가 DNA 차단제에 비해 프라이머의 Tm을 증가시키기 위해 3-8 LNA 염기를 포함하는 것을 제외하고는 상기에 기재된 바와 같이 라이브러리를 제조하였다. 10개 대립유전자에 대한 차단제(1% 내지 24.5% 대립유전자 빈도)를 멀티플렉싱하고, 라이브러리 제제를 위한 표준 순환 반응에 첨가하였다. 상기 DNA 차단 실험에 대해 기재된 바와 같이 라이브러리의 주형화 및 서열결정을 수행하였다. 결과를 도 3c에 도시한다. 상기에 논의된 DNA 및 RNA 올리고와 달리, LNA 차단제는 표준 순환 조건과 상용성인 멀티플렉스 포맷을 포함하여 표적을 효과적이고 특이적으로 억제하였다. 그러나 LNA 차단제는 억제 효과를 위해 상당한 양의 올리고를 필요로 하는 것으로 보인다(적어도 135 nM, 데이터는 표시되지 않음). 또한, LNA 합성은 복잡하고 상대적으로 고비용이며, 억제에 필요한 높은 수준의 올리고를 고려할 때, 억제의 멀티플렉스 선택을 위해서는 고비용의 시도일 것이다.
[표 2]
본 발명에 따라, 차단 프라이머로서의 표준 DNA 올리고를 Ion AmpliSeq Cancer Hotspot Panel v2와 함께 사용하기 위해 제조하였다. 차단 프라이머를 차단 프라이머의 3' 단부로부터 0개, 1개, 2개, 3개 또는 4개 염기에 SNP가 배치된 NRAS Q61K에 대해 설계하였고, 프라이머를 표준 Ion AmpliSeq Cancer Hotspot Panel v2에서 25 nM, 50 nM, 100 nM 또는 200 nM 최종 농도로 포함시켰다. 차단 프라이머는 SNP 위치에 상응하는 WT 서열 전체의 위치뿐만 아니라 입력 농도 범위에 걸쳐 효과적이었다. 결과를 도 3d에 도시한다. 차단 올리고는 LNA와 유사하게 더 낮은 농도에서 더 양호한 특이성으로 강력한 억제를 나타냈다. 불일치 부위에 관련된 강한 경향은 보이지 않았다. 따라서 결과의 관점에서, Ion AmpliSeq 기술과 함께 사용되는 표준 DNA 올리고는 낮은 빈도의 표적 서열의 검출과 함께 사용하기에 가장 효율적이고 효과적인 억제를 나타낸다. 표준 억제 올리고 서열은 표적 야생형 대립유전자를 강력하고 특이적으로 억제하여, 0.2%까지 낮은 빈도의 대립유전자를 효과적으로 검출하였다. 올리고는 단순화된 최적화를 통해 표준 Ion AmpliSeq 멀티플렉스 기술 프로토콜에 간단하게 혼입될 수 있다.
[표 3]
실시예 2: 종양학 핫스팟 SNP 부위를 포함하는 표적 서열에 지향되는 Ion AmpliSeq 프라이머의 2개의 풀을 포함하고 표적화 변이체 SNP 부위를 포함하는 야생형 서열에 지향되는 차단 올리고를 포함하는 맞춤형 Ion AmpliSeq 122-plex 패널을 설계하였다. 다양한 위치에서 SNP의 위치를 포함하는 야생형 서열을 표적으로 하도록 차단 올리고를 설계하였다. 각각의 표적 부위는 패널에서 Ion AmpliSeq 프라이머의 3' 단부로부터 다양한 거리(예를 들어, 17 bp 내지 35 bp)에서 SNP의 위치를 나타낸다. 3' 단부로부터 0 bp 내지 7 bp에 위치하는 유사한 SNP를 갖는 야생형 서열로 차단제 올리고를 설계하였고, 다중 인접 SNP에 대해 단일 차단제를 설계할 수 있다. 차단체 각각은 효과적으로 수행되었고, 멀티플렉스 포맷에 대한 최고 성능의 후보를 선택하였다.
라이브러리를 122-플렉스 맞춤형 Ion Ampliseq 패널에 대한 표준 Ion AmpliSeq 라이브러리 제제 프로토콜 하에서 희귀 대립유전자를 나타내는 합성 주형으로 보충된 HD701 DNA를 사용하여 차단하거나 차단하지 않고 작제하였고, 서열결정하였다. 차단제 올리고를 각각 100 nM에서 라이브러리 증폭 반응에 첨가하였다. 대립유전자 빈도를 비교하였고, 차단제를 사용한 희귀 대립유전자의 10배 내지 1000배 농축을 나타내었다(전체 데이터 세트 평균 농축은 40X였음). 맞춤형 차단 패널을 사용한 10개의 앰플리콘으로부터의 대표적인 데이터를 도 4a에 도시한다. 앰플리콘은 설계 좌표(즉, 1.10023 또는 2.25456)로 표시하고, 대립유전자는 SNP로 표시한다. 전체 패널에 대한 중간 WT 억제는 91%였고, 돌연변이 억제는 0%였다. 차단된 샘플 또는 차단되지 않은 샘플에서 희귀 대립유전자 농축의 비교를 도 4b에 도시한다. 각각의 지점은 단일 SNP를 나타낸다.
[표 4]
.
실시예 3: 본 발명자들은 Ion AmpliSeq 라이브러리 제제를 사용하여 FFPE 샘플에서 융합 검출에 대한 차단 프라이머의 영향을 시험하였다. 상기와 같이, 차단 프라이머는 Ion AmpliSeq 라이브러리 제조 작업흐름 동안 처리되지 않으며, 서열결정이 가능한 앰플리콘을 생성하지 않는다. 본 발명자들은, 야생형 전사체를 억제하기 위해 차단 프라이머를 첨가하면 재현성이 더 양호해지고 융합 검출 감도가 증가할 것이라는 가설을 세웠다. 이를 시험하기 위해서, Oncomine Focus RNA 검정의 변형된 버전을 7개의 대조군 검출 프라이머 쌍으로 보충하여 제조하였다.
[표 5]
[표 6]
라이브러리 제조
FFPE RNA 샘플(BON1027, Fusion Negative 및 BON1020, CD74-ROS1; BioChain Institute)을 사용하여 Ion AmpliSeq Library Prep 사용자 매뉴얼에 따라 n=4로 라이브러리를 수동으로 제조하였다.
패널: GEX 프라이머 쌍이 보충된 표준 Oncomine Focus Assay v2 라이브러리 반응 또는 GEX 프라이머 쌍이 보충된 Oncomine Focus Assay v2 반응뿐만 아니라 반응당 표준 프라이머 양에 비해서 0%, 50%, 90% 또는 100%로 첨가된 차단 프라이머를 사용하여 각각의 표준 프라이머 50 nM과 함께 cDNA 10 ng의 존재 하에서 라이브러리를 작제하고, Ion AmpliSeq 사용자 가이드에 따라 31주기로 증폭시켰다. Chef 540 Templating 사용자 가이드에 따라 주형화를 수행하였고, 칩(2개의 칩)당 40개 샘플의 서열결정을 Ion Torrent S5 Sequencer 사용자 가이드에 따라 수행하였다. 결과를 도 5a 내지 도 5d에 도시한다.
경쟁자 프라이머는 표적화된 야생형 대립유전자를 효과적으로 차단하였다. 표준 Ion AmpliSeq ONCOMINE FOCUS ASSAY 절차의 경우, 7개의 표적 표준 프라이머 세트가 총 매핑 판독의 38.5%를 차지하였다. 7개의 GEX 프라이머 세트에 대한 90% 차단 프라이머를 사용하여, 7개의 표적 프라이머 세트는 전체 매핑된 판독의 0.7%를 차지하였다. 이러한 결과는 덜 풍부한 다른 표적에 대한 총 매핑된 판독에 대해 37%의 추가적인 대역폭을 나타낸다.
대부분의 돌연변이 앰플리콘에 대한 신호는 변형되지 않은 경쟁자 프라이머의 비율이 증가함에 따라 증가하였다. 예를 들어, CD74-ROS1.C6R35의 검출은 표준 프라이머 세트에 비해 90% 경쟁자 프라이머로 대략 2배 증가하였다. 경쟁자 프라이머를 함유하는 모든 라이브러리에 대한 평균 수율은 경쟁자 프라이머 없이 실행한 라이브러리와 유사하였고, 표적에 대한 % 판독은 전형적인 FFPE RNA 실행과 대등하였다.
[표 7]
실시예 4. Ion AmpliSeq HD 기술을 사용한 차단
Ion AmpliSeq HD 기술에 대한 차단 프라이머의 유용성을 추가로 탐색하기 위해, 본 발명자들은 Ion AmpliSeq HD 기술과 상용성이 되도록 실시예 2에 기재된 패널을 재설계하고, 동일한 차단 프라이머의 세트를 사용하여 야생형 앰플리콘을 억제하였다. 이 시나리오에서, 차단 프라이머는 유사하게 라이브러리 제조에서 하류 처리를 방지하여 서열결정에서 차단된 야생형 표적을 제거하였다. 표준 Ion AmpliSeq HD 패널 프라이머에 비해 2X 농도로 초기 표적 증폭 단계에 차단제를 첨가하여 차단된 라이브러리를 제조하고, Ion AmpliSeq HD 사용자 가이드(MAN0017392)에 따라 처리하고, 제조업체 지침에 따라 Ion 530 칩(MAN0010846)을 사용하여 서열결정하였다. Thermo Fisher Scientific, Inc. 비차단 라이브러리는 모든 앰플리콘에서 균일한 패밀리 표현을 생성한 반면; 돌연변이 대립유전자가 높은 존재비로 검출되었지만 차단제의 존재는 야생형 앰플리콘을 유의하게 억제하였다. 도 6a 및 도 6b를 참조한다. 표적이 차단되는 경우 패밀리 수 및 패밀리의 크기 둘 다가 증가된다. 도 6c 및 도 6d를 참조한다. 따라서, 제공된 차단 방법을 사용하여 야생형 앰플리콘을 억제하는 것이 더 균일한 커버리지를 가능하게 하므로 희귀한 대립유전자의 검출을 개선시켰다.
실시예 5: 경쟁자 프라이머의 SARS-CoV-2 패널에서의 적정(titration)
재료 및 방법
인간 대조군 서열 앰플리콘에 특이적인 경쟁자 차단 프라이머 스파이크-인 프라이머 세트를 제조하고, 표준 Ion AmpliSeq SARS-CoV-2 패널 제제에 스파이킹하였다. 상기에 기재된 방법과 유사하게, 경쟁자 프라이머 서열은 처리되지 않고, Ion AmpliSeq 작업흐름을 통해 서열결정을 위한 생성물 앰플리콘으로 진행할 수 없었다. 단일 경쟁자 차단 프라이머가 아니라, 인간 샘플에서 높은 수준의 대조군 서열을 감소시키기 위해 프라이머 쌍이 포함되었으며, 여기서 주요 관심 바이러스 서열은 상당히 낮은 역가 수준으로 존재할 수 있다.
[표 8]
각각 0X 1X, 2X, 4X, 6X, 8X, 10X의 최종 농도에서 0 nM, 50 nM, 100 nM, 200 nM, 400 nM, 600 nM, 800 nM 및 1000 nM에서 스파이킹된 경쟁 프라이머의 적정. 라이브러리 작제: Ion AmpliSeq 사용자 가이드(Thermo Fisher Scientific)에 따라 16개 라이브러리, 8가지의 상이한 조건을 준비하였다.
약술하자면, 샘플은 Twist SARS-CoV-2 RNA 대조군-2 및 Human Lung Total RNA(Thermo Fisher Scientific)로 구성되었다. 20개 카피의 바이러스 RNA 및 배경으로서 5 ng의 total lung RNA를 샘플 입력을 위해 사용하였다. 무바이러스 대조군(no viral control)으로서: 10X 스파이크-인만을 갖는 5 ng의 Human Lung Total RNA를 사용하였다. 반응을 2중으로 수행하였다. SSIII를 사용한 역전사 및 표적 증폭을 표적 증폭의 25주기를 사용하여 Ion Ampliseq Library Kit Plus 사용자 가이드로 제조업체 지침에 따라 수행하였다. 라이브러리 제조 후, qPCR로 라이브러리를 정량화하고, 제조업체 지침에 따라 Ion Chef에서 주형화를 수행하였고, 라이브러리를 530 칩에서 Ion Torrent S5를 사용하여 서열결정하였다.
결과를 도 7a 내지 도 7d에 도시한다. 경쟁자 프라이머 스파이크-인 프라이머는 라이브러리 수율을 크게 감소시켜, 매우 풍부한 인간 대조군 서열의 판독을 억제하였다. 베드(bed) 파일 결과를 변경하지 않고 서열결정 출력의 전반적인 균일성이 개선되었다. 예를 들어, 4X 경쟁자 스파이크-인에서, 균일성은 약 85%에 도달하였다.
주형화 및 서열결정을 위한 동일한 양의 입력으로, 경쟁자 프라이머 스파이크-인은 바이러스 판독 및 검출되는 평균 깊이를 증가시켰다. 약 4X 경쟁사 스파이크가 최적의 결과를 달성하였다. 이러한 낮은 바이러스 입력(예를 들어, 20개 카피)에 대한 바이러스 서열결정 데이터에서 유의미한 부정적인 영향은 관찰되지 않았다.
실시예 6. 경쟁자 프라이머의 SARS-CoV-2 패널에서의 적정
재료 및 방법
인간 대조군 서열 앰플리콘에 특이적인 경쟁자 차단 대조군 프라이머 세트를 2개의 패널 Ion AmpliSeq SARS-CoV-2 라이브러리 제제에 포함시켰다. 상기에 기재된 방법과 유사하게, 경쟁자 프라이머 서열은 처리되지 않고, Ion AmpliSeq 작업흐름을 통해 서열결정을 위한 생성물 앰플리콘으로 진행할 수 없었다. 이전 실시예에서와 같이, 인간 샘플에서 높은 수준의 대조군 서열을 감소시키기 위해 프라이머 쌍이 포함되었으며, 여기서 주요 관심 바이러스 서열은 상당히 낮은 역가 수준으로 존재할 수 있다. 작은 길이, 중간 길이 및 긴 길이를 포함하여 표적을 제어하기 위해 다양한 프라이머 쌍이 생성되었다:
[표 9]
실시예 5에서와 같이 라이브러리를 제조하였다. 샘플은 Twist SARS-CoV-2 RNA 대조군-2 및 Human Lung Total RNA(Thermo Fisher Scientific)로 구성되었다. 바이러스 RNA는 다양한 양 0개, 50개, 100개, 200개 카피로 적정하였고, 백그라운드로서 5 ng의 total lung RNA를 샘플 입력에 사용하였다. 각각의 패널과 대조군 프라이머 및 경쟁자 프라이머의 다양한 조합을 또한 평가하였다. 결과를 도 8a 내지 도 8d에 도시한다. 모든 경우에, 경쟁자 프라이머는 라이브러리 수율을 크게 감소시켜, 다양한 바이러스 입력에 걸쳐서 매우 풍부한 인간 대조군 서열의 판독을 억제하였다.
실시예 7. 경쟁자 프라이머의 SARS-CoV-2 패널에서의 적정
재료 및 방법
인간 대조군 서열 앰플리콘에 특이적인 경쟁자 차단 대조군 프라이머 세트를 2개의 패널 Ion AmpliSeq SARS-CoV-2 라이브러리 제제에 포함시켰다. 상기에 기재된 방법과 유사하게, 경쟁자 프라이머 서열은 처리되지 않고, Ion AmpliSeq 작업흐름을 통해 서열결정을 위한 생성물 앰플리콘으로 진행할 수 없었다. 이전 실시예에서와 같이, 인간 샘플에서 높은 수준의 대조군 서열을 감소시키기 위해 프라이머 쌍이 포함되었으며, 여기서 주요 관심 바이러스 서열은 상당히 낮은 역가 수준으로 존재할 수 있다. HMBS 및 ITGB7에 대한 짧은 길이 및 중간 길이 앰플리콘뿐만 아니라 표적 Ame를 제어하기 위해 다양한 프라이머 쌍을 생성시켰다:
[표 10]
경쟁자 프라이머 쌍을 Ame에 대한 Ion AmpliSeq 프라이머 검출 세트에 2x로 포함시켰고; 발현 대조군 HMBS 및 ITGB7용 Ion AmpliSeq 프라이머 검출 세트에 1x로 포함시켰다.
실시예 6에서와 같이 라이브러리를 제조하였다. 반응을 2중으로 수행하였다. 제조업체 지침에 따른 Ion Torrent NGS 역전사 키트를 사용한 역전사 및 표적 증폭을 하기 표 11에 따른 표적 증폭 주기를 사용한 Ion Ampliseq Library Kit Plus 사용자 가이드의 제조업체 지침에 따라 수행하였다:
[표 11]
샘플은 다양한 양 0개, 50개, 100개 카피로 적정된 Acrometrix 122010 또는 ATCC에서 추출한 MAR2021 또는 1000개 카피의 Twist SARS-CoV-2 RNA 1, 9, 12 및 14; 및 Human Lung Total RNA(Thermo Fisher Scientific). 배경으로서의 5 ng의 total lung RNA를 샘플 입력에 사용하였다. 모든 경우에, 경쟁자 프라이머는 라이브러리 수율을 크게 감소시켜, 다양한 바이러스 입력에 걸쳐서 매우 풍부한 인간 대조군 서열의 판독을 억제하였다. 라이브러리 제조 후, qPCR로 라이브러리를 정량화하고, 제조업체 지침에 따라 Ion Chef에서 주형화를 수행하였고, 라이브러리를 530 칩에서 Ion Torrent S5를 사용하여 서열결정하였다.
결과는 일관된 균일성, 높은 염기 커버리지, 매핑된 판독(모두 참조 게놈에 대한 매핑) 및 샘플 전체에 걸친 커버리지 깊이(예를 들어, 1000개 카피 초과)를 산출하였고; 생성된 대부분의 앰플리콘은 바이러스 앰플리콘에 상응하는 반면, 경쟁자 프라이머가 없고 병렬로 제조된 비교 패널(상기 실시예 5에 기재된 SARS-CoV2)은 병렬 라이브러리 제조에서 우세한 대조군 앰플리콘을 생성하였다. 3개의 대조군 및 경쟁자 프라이머가 존재하는 패널로부터 상당히 더 높은 판독 깊이 및 적어도 99%의 바이러스 염기 커버리지가 달성된 반면, 경쟁자 프라이머가 없는 비교 패널은 대조군 앰플리콘이 우세한 라이브러리를 산출하고, 샘플에서 낮은 빈도의 바이러스의 검출을 위한 덜 효율적인 서열결정 결과를 산출하였다.
일치하는 방법에 의해 이미 결정된 바와 같이 다양한 수준의 바이러스를 함유하는 임상 샘플과 함께 대조군과 함께 동일한 패널을 사용하여 상기에 기재된 바와 같이 라이브러리를 제조하였다. 결과는 중간 및 높은 입력 샘플(예를 들어, 1000개 카피 초과)에 걸쳐서 일관된 균일성, 높은 염기 커버리지, 매핑된 판독 및 커버리지 깊이를 산출한 반면; 매우 낮은 바이러스 수준을 포함하여 적은 바이러스(1000개 미만의 카피)를 갖는 샘플은 바이러스 및 매핑된 판독을 효율적으로 검출하였지만, 특히 바이러스가 거의 또는 전혀 없는 샘플 또는 매우 불량한 품질의 샘플의 경우 종종 일관되지 않은 염기 커버리지, 판독 깊이 및/또는 균일성을 생성하였다. 이러한 결과와 일치하게, 바이러스가 거의 또는 전혀 없는 샘플 또는 매우 불량한 품질의 샘플에서 라이브러리로부터의 서열결정 데이터에서 대조군 서열이 우세하였다(데이터 표시되지 않음).
본 발명의 바람직한 실시형태가 본 명세서에 도시되고 기재되어 있지만, 이러한 실시형태가 오직 예로서 제공된다는 것이 당업자에게 명확할 것이다. 당업자는 이제 본 발명으로부터 벗어나지 않으면서 많은 변형, 변화 및 치환을 생각해낼 것이다. 본 명세서에 기재된 본 발명의 실시형태에 대한 다양한 대안이 본 발명을 실행하는 데 이용될 수 있다고 이해되어야 한다. 하기 청구범위의 범위가 본 발명의 범위를 한정하지 않고, 이 청구범위의 범위 내의 방법 및 구조 및 이의 균등물이 이에 의해 다뤄지도록 의도된다.
SEQUENCE LISTING <110> LIFE TECHNOLOGIES CORPORATION <120> COMPOSITIONS AND METHODS FOR HIGHLY SENSITIVE DETECTION OF TARGET SEQUENCES IN MULTIPLEX REACTIONS <130> LT01594PCT <150> 63/199,421 <151> 2020-12-24 <150> 63/201,338 <151> 2021-04-23 <150> 63/202,179 <151> 2021-05-28 <160> 602 <170> KoPatentIn 3.0 <210> 1 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 1 tttgggctgg ccaaactgct gggtgc 26 <210> 2 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 2 tttgggctgg ccaaactgct gggtg 25 <210> 3 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 3 tttgggctgg ccaaactgct gggt 24 <210> 4 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 4 tttgggctgg ccaaactgct ggg 23 <210> 5 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 5 tttgggctgg ccaaactgct gg 22 <210> 6 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 6 tttgggctgg ccaaactgct g 21 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 7 tttgggctgg ccaaactgct 20 <210> 8 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 8 tttgggctgg ccaaactgc 19 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 9 tttgggctgg ccaaactg 18 <210> 10 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 10 ttgggctggc caaactgctg ggtgc 25 <210> 11 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 11 tgggctggcc aaactgctgg gtgc 24 <210> 12 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 12 gggctggcca aactgctggg tgc 23 <210> 13 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 13 ggctggccaa actgctgggt gc 22 <210> 14 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 14 gctggccaaa ctgctgggtg c 21 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 15 ctggccaaac tgctgggtgc 20 <210> 16 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 16 uuugggcugg ccaaacugcu gggugc 26 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 17 uuugggcugg ccaaacugcu gggug 25 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 18 uuugggcugg ccaaacugcu gggu 24 <210> 19 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 19 uuugggcugg ccaaacugcu ggg 23 <210> 20 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 20 uuugggcugg ccaaacugcu gg 22 <210> 21 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 21 uuugggcugg ccaaacugcu g 21 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 22 uuugggcugg ccaaacugcu 20 <210> 23 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 23 uuugggcugg ccaaacugc 19 <210> 24 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 24 uuugggcugg ccaaacug 18 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 25 uugggcuggc caaacugcug ggugc 25 <210> 26 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 26 ugggcuggcc aaacugcugg gugc 24 <210> 27 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 27 gggcuggcca aacugcuggg ugc 23 <210> 28 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 28 ggcuggccaa acugcugggu gc 22 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 29 gcuggccaaa cugcugggug c 21 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 30 cuggccaaac ugcugggugc 20 <210> 31 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 31 actcttcttg tccagctg 18 <210> 32 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 32 aaatcactga gcaggag 17 <210> 33 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 33 tgatgcacat catggtg 17 <210> 34 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 34 agccagagac atcaaga 17 <210> 35 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 35 aagtgctggg ctccggt 17 <210> 36 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 36 gctcatcacg cagctca 17 <210> 37 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 37 tttgggctgg ccaaac 16 <210> 38 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 38 cgagatttca ctgtagct 18 <210> 39 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 39 ggagctggtg gcgtaggc 18 <210> 40 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 40 tctcatggca ctgtactctt cttg 24 <210> 41 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 41 tctcatggca ctgtactctt cttgt 25 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 42 ctcatggcac tgtactcttc ttgtc 25 <210> 43 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 43 catggcactg tactcttctt gtcc 24 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 44 tggcactgta ctcttcttgt cca 23 <210> 45 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 45 ccaggcacut gatgatacuc act 23 <210> 46 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 46 ggaagaaaaa caaucccact ugcg 24 <210> 47 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 47 ccattaacau ggcctaccag agtug 25 <210> 48 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 48 agccacacau gccatcattc uag 23 <210> 49 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 49 tctggtttcu ggtgggacca tua 23 <210> 50 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 50 tggatcacat cuctaccaga gttaauca 28 <210> 51 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 51 gctattautg atggcaaaua cacagagg 28 <210> 52 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 52 catctacaaa gtggutctgg attagcug 28 <210> 53 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 53 aggaggtcau ggcatcgagu t 21 <210> 54 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 54 attaaagctg gcuatggcac cug 23 <210> 55 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 55 gugccaagcc ucacacca 18 <210> 56 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 56 atttttccuc acagctcgtt caucg 25 <210> 57 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 57 ctttacccct ccutcctaga gagtuag 27 <210> 58 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 58 tgcccacugt gttacugcca t 21 <210> 59 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 59 cattcggcac aggaugactg tua 23 <210> 60 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 60 acattccgaa tauagagaac ctcaatcuc 29 <210> 61 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 61 aggcattugc cggcaguc 18 <210> 62 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 62 cgccaggcuc acctctatag ug 22 <210> 63 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 63 tgcagaaaac agauctgtat ttatttcagu gt 32 <210> 64 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 64 cagtcctcau gtactggucc c 21 <210> 65 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 65 caagatttac ctcuattgtt ggatcatatu cg 32 <210> 66 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 66 cagacactgu acaagctcua cga 23 <210> 67 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 67 tcacagtgga utcgagaagu gac 23 <210> 68 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 68 cattggtagc uggtgatgtt ccuc 24 <210> 69 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 69 acacuctuga gggccacaaa g 21 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 70 gctccttgua gccaatgaag gug 23 <210> 71 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 71 ggaccaactu ggaggcctug 20 <210> 72 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 72 tctattttct ctuccctgca gatguca 27 <210> 73 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 73 cuaggcgagg agcuccagt 19 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 74 cattctgcug gtcgtgguct 20 <210> 75 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 75 tcttctcact cauatcctcc tctttcug 28 <210> 76 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 76 agcguaccct tgucccca 18 <210> 77 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 77 gcccucccag aaggtctaca ug 22 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 78 cagctaccug accgacgtug 20 <210> 79 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 79 tcctttcgaa gucatcgtct tuga 24 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 80 ccagggucac tcagctugat 20 <210> 81 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 81 tctgactcag cuggtattgg gaut 24 <210> 82 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 82 aatgtgagcc cutgagatcu gc 22 <210> 83 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 83 gagggcgggu ctcucgga 18 <210> 84 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 84 acgatttccc tuggagatat cgatcug 27 <210> 85 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 85 atacaagtug gaaatttcug ggccat 26 <210> 86 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 86 aatgtcaatt agcuggaaca tcugaaact 29 <210> 87 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 87 gacagaaaag cggcugttag uca 23 <210> 88 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 88 gaatcctagt agaaugttta ctaccaaaug ga 32 <210> 89 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 89 aaacaagacg acuttgtgac ctucg 25 <210> 90 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 90 tgaatggaga aacauctaca aaauccct 28 <210> 91 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 91 tgtgcatatg tgtaugttga gtgtatacat uag 33 <210> 92 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 92 gggaagaaaa gugttttgaa atgtgtut 28 <210> 93 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 93 tttattttac agaguaacag actagcuaga gac 33 <210> 94 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 94 gcctgctttu ggagtcctat ugt 23 <210> 95 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 95 agttggccug aatcactata ttuccat 27 <210> 96 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 96 ataaatcttt tctcaaugat gcttggcuct 30 <210> 97 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 97 ggtggccccu gagcguc 17 <210> 98 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 98 gcagacutcg ggcuggc 17 <210> 99 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 99 ccagttacct gucctggtca ttua 24 <210> 100 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 100 gcacaaggaa aaautgtgaa gatcugt 27 <210> 101 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 101 gacatatggc cauttctgtt ttcctgua 28 <210> 102 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 102 gtgctttttg cuaaaatgca tgttucc 27 <210> 103 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 103 gatctatutt tccctttcuc cccacag 27 <210> 104 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 104 aatgaattta aatggutttc ttttctccuc caa 33 <210> 105 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 105 agggcatttg cautatgaaa ccaauat 27 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 106 atggagcauc tgtacagcau ga 22 <210> 107 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 107 ggttatgtcc ucattgcccu caac 24 <210> 108 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 108 tcaggaaaca aaaauttgtg ctaugcaa 28 <210> 109 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 109 acacccagug gagaagcuc 19 <210> 110 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 110 cagttaacgt ctuccttctc tctcugt 27 <210> 111 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 111 cctccaggaa gccuacguga t 21 <210> 112 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 112 tgaaaacacc gcagcauguc a 21 <210> 113 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 113 gcttgtaagu gcccgaagtg uaa 23 <210> 114 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 114 gcagtgcuaa ccaagttctt tctut 25 <210> 115 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 115 aattcacagu caaggttgct gatttug 27 <210> 116 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 116 ggctacaaga acuaccgaua ccgt 24 <210> 117 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 117 catccctgac ugtgagatca agaauc 26 <210> 118 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 118 acaaaatgga uccagacaac tgtuc 25 <210> 119 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 119 gttgttaaac ataucctatt atgacttguc aca 33 <210> 120 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 120 acatgataga ggugacattt ucaaagc 27 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 121 ggatguacag ccagtgtguc 20 <210> 122 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 122 tgttgccatt ucagggtttc ugaat 25 <210> 123 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 123 ctgtgcucac acatgttctu cagaat 26 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 124 cttcttctca ucgcgggcut 20 <210> 125 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 125 ttgccuagac agcaccgtaa ug 22 <210> 126 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 126 gggaagagcc uccaccatcu c 21 <210> 127 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 127 cagttcgugg gcttgttttg tauc 24 <210> 128 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 128 gctattautg atggcaaaua cacagagg 28 <210> 129 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 129 catctacaaa gtggutctgg attagcug 28 <210> 130 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 130 attaaagctg gcuatggcac cug 23 <210> 131 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 131 gugccaagcc ucacacca 18 <210> 132 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 132 tccatccuga cctggtatgg uc 22 <210> 133 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 133 atttttccuc acagctcgtt caucg 25 <210> 134 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 134 cgaatgcagt utttcctcct acuca 25 <210> 135 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 135 cattcggcac aggaugactg tua 23 <210> 136 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 136 aggcattugc cggcaguc 18 <210> 137 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 137 cgccaggcuc acctctatag ug 22 <210> 138 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 138 cggtgcgcau gtactgguc 19 <210> 139 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 139 aataaaagga attccauaac ttcttgctaa guc 33 <210> 140 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 140 cagtcctcau gtactggucc c 21 <210> 141 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 141 caagatttac ctcuattgtt ggatcatatu cg 32 <210> 142 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 142 tcacagtgga utcgagaagu gac 23 <210> 143 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 143 ttccatagug accaagacca tcugt 25 <210> 144 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 144 auggtaagaa gttguaaaga gacagcct 28 <210> 145 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 145 acacuctuga gggccacaaa g 21 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 146 ggaccaactu ggaggcctug 20 <210> 147 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 147 cagctaatuc atctggagau caaaccc 27 <210> 148 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 148 gggatgtttu tgcagatgau ggg 23 <210> 149 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 149 gtatgtggcu acatgttcct gauct 25 <210> 150 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 150 ctgaggaagg ugaaggtgcu t 21 <210> 151 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 151 tgtugaggga aaacacaucc c 21 <210> 152 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 152 agcguaccct tgucccca 18 <210> 153 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 153 acaacacaca gutggaggac tuc 23 <210> 154 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 154 gggattgcag autgggcctu g 21 <210> 155 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 155 tcctttcgaa gucatcgtct tuga 24 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 156 atgacctuca gcagcaccuc 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 157 gcagccacac cccautctug 20 <210> 158 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 158 cucaccccaa ugcagcga 18 <210> 159 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 159 cacttcttac cutcacagcc actug 25 <210> 160 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 160 agggctucca tgaggaaauc ca 22 <210> 161 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 161 ttataaaccg tuccaaaagc accuga 26 <210> 162 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 162 caaggtgccc uattacctca atcauc 26 <210> 163 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 163 gacagaaaag cggcugttag uca 23 <210> 164 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 164 aagatgaatc ttctuacatt ttcgtaagtg tua 33 <210> 165 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 165 tgaatggaga aacauctaca aaauccct 28 <210> 166 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 166 gaacagguat ctaccaugga ggaga 25 <210> 167 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 167 aaacttgttt gatuacacag acactcua 28 <210> 168 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 168 tttattttac agaguaacag actagcuaga gac 33 <210> 169 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 169 gcctgctttu ggagtcctat ugt 23 <210> 170 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 170 ccttagataa aacugagcaa gaggcut 27 <210> 171 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 171 ggtggccccu gagcguc 17 <210> 172 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 172 gagctggugg aggcugac 18 <210> 173 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 173 caggacagcc ugaccucac 19 <210> 174 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 174 aagctctcat guctgaactg aagauaat 28 <210> 175 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 175 gcacaaggaa aaautgtgaa gatcugt 27 <210> 176 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 176 aatggcacgg utgaatguaa gg 22 <210> 177 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 177 aagccctcau gtctgaacuc aaag 24 <210> 178 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 178 aaggttgtug aggagataaa uggaaacaa 29 <210> 179 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 179 tccttactca uggtcggauc acaaa 25 <210> 180 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 180 ctcctaagat guccactgct gtuc 24 <210> 181 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 181 atggagcauc tgtacagcau ga 22 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 182 cccaccacgu accagaugga 20 <210> 183 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 183 ccagtgugcc cactacatug a 21 <210> 184 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 184 acacccagug gagaagcuc 19 <210> 185 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 185 cctccaggaa gccuacguga t 21 <210> 186 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 186 tgaaaacacc gcagcauguc a 21 <210> 187 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 187 gcttgtaagu gcccgaagtg uaa 23 <210> 188 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 188 agaauactat agtguacaca acaaaacagg t 31 <210> 189 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 189 cttctttgug ggcagcatug g 21 <210> 190 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 190 cctgtccucc acaggcattt ut 22 <210> 191 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 191 acaaaatgga uccagacaac tgtuc 25 <210> 192 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 192 gttgttaaac ataucctatt atgacttguc aca 33 <210> 193 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 193 tccutagtct ttcttugaag cagcaa 26 <210> 194 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 194 acctgaaaau gacactttgt aagucaaa 28 <210> 195 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 195 caaccctgtt tutctccctc ttatugt 27 <210> 196 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 196 aacuacagaa tcacaugcca cacag 25 <210> 197 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 197 ccaacaagat tcugaagaac atgtgug 27 <210> 198 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 198 ccaaaacccu cctgatguac acg 23 <210> 199 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 199 cccutgtggc ctaugacaag aaaat 25 <210> 200 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 200 ggauctcttc augcaccgga a 21 <210> 201 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 201 ctggccaaga gutacgggat uc 22 <210> 202 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 202 aacaagtggt tauagatggt gaaaccug 28 <210> 203 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 203 attaacccug attactggtt uccaaca 27 <210> 204 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 204 tatggtcttg gacauccagg atcug 25 <210> 205 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 205 gatgtgctgt ugagacctct gug 23 <210> 206 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 206 tgaggagaug ggtggctugt 20 <210> 207 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 207 cacctggcuc ctctucacg 19 <210> 208 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 208 acttacacau cactttgcgu ggt 23 <210> 209 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 209 tagcagccag aaaugttttg guaacag 27 <210> 210 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 210 gcaatcuagc gccuggaaga g 21 <210> 211 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 211 gtgcgacgcc utguggt 17 <210> 212 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 212 gtcacugaca gccctcugga 20 <210> 213 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 213 tgaggagcga ugacggaata uaag 24 <210> 214 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 214 ttgccutcta gaacaguaga cacaaaac 28 <210> 215 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 215 ctgtgttuct cccttcucag ga 22 <210> 216 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 216 attataaggc cugctgaaaa tgacuga 27 <210> 217 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 217 gaauaaagag gagcaggtug aggaa 25 <210> 218 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 218 tagttcaaca ugacgaagau ggcaa 25 <210> 219 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 219 agcccatttt tauctacttc catctugt 28 <210> 220 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 220 attgtagggt cucccttgat cugag 25 <210> 221 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 221 gagggtcuga cgggtagagu g 21 <210> 222 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 222 ctgatcttct caaagucgtc atcctuc 27 <210> 223 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 223 guaggacctt gugcccacga 20 <210> 224 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 224 aacaucccac gcctagucc 19 <210> 225 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 225 cgggcuggga ggactucac 19 <210> 226 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 226 gggcttacgu ctaagatttc ttugt 25 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 227 cauggtcuaa gaggcagcca 20 <210> 228 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 228 taattttgac atggutggga ctctuga 27 <210> 229 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 229 gatgatgtuc tccaggucga aagg 24 <210> 230 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 230 tcucugcagg gcaaacct 18 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 231 tcctgtgtcu ggccccctua 20 <210> 232 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 232 gacttttcac cuctgatttc tggtttut 28 <210> 233 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 233 cgtggcucgg gacatugc 18 <210> 234 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 234 ctctctgcuc tgcagcaaat uca 23 <210> 235 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 235 aacaggacga acuggattuc ct 22 <210> 236 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 236 aatauccccc ggcttgugag t 21 <210> 237 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 237 atgtgaacat uctgcttttc auggg 25 <210> 238 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 238 tatccacatc cucttcctca ggaut 25 <210> 239 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 239 ttcatctuga agaagttgau ggagg 25 <210> 240 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 240 tgcattttag aauaggatat tgtatcauac caa 33 <210> 241 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 241 aagcatcagc atutgacttt accttauc 28 <210> 242 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 242 ggattggaac aagguactct tugag 25 <210> 243 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 243 tttccagata cuagagtgtc tgtgtaauca 30 <210> 244 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 244 aagaaaaaga aacagagaau ctccatttua gc 32 <210> 245 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 245 tgcagugaaa agagtcucaa acacaa 26 <210> 246 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 246 tgacgatcuc caattcccaa aaugaag 27 <210> 247 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 247 tcatgaaata cuccaaagcc tctugc 26 <210> 248 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 248 gggctgugcg tcactgua 18 <210> 249 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 249 ggagggugug ggaaggcg 18 <210> 250 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 250 ggaaactccc aucttgagtc auaagg 26 <210> 251 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 251 ttagagatta aagugaagga ggaugagc 28 <210> 252 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 252 ctcagttccu ggacaaaaat accaauct 28 <210> 253 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 253 gcaggctcca aguagattca caaua 25 <210> 254 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 254 ggaaactccc auttgtgatc auaaggaa 28 <210> 255 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 255 atcattcttg augtctctgg cuagacc 27 <210> 256 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 256 ttgtctgctg aaugaacccc aauac 25 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 257 aagtggcttu ggtccgtcuc 20 <210> 258 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 258 atttgcatca tagutagata agactgcuaa gg 32 <210> 259 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 259 cagaaagcgg ugacttacug ca 22 <210> 260 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 260 tgugccaggg acctuacct 19 <210> 261 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 261 ctcacatcga ggauttcctt gtugg 25 <210> 262 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 262 gtgtucccgg acatagucca g 21 <210> 263 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 263 caggaaaatg cuggctgacc uaaa 24 <210> 264 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 264 cacaacccac ugaggtatat gtauagg 27 <210> 265 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 265 aaaatgccac tuactgttca aggatut 27 <210> 266 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 266 aguttgcaga cttuccaaag ccat 24 <210> 267 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 267 attttgtugc ccaactgguc ct 22 <210> 268 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 268 accagguacg cctccagaug 20 <210> 269 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 269 gttttccttt acttacuaca cctcagatat aut 33 <210> 270 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 270 gggagattcc ugatgggcag atua 24 <210> 271 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 271 aagtttgtaa gtagugctat atttatgtug act 33 <210> 272 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 272 gggcattccc ugcacttcua 20 <210> 273 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 273 ttccttcuaa aaggccatga agatcug 27 <210> 274 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 274 aacccacatt tccuttatag atgtttctuc 30 <210> 275 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 275 ctgttgguca cagctccagu g 21 <210> 276 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 276 aggataaaga ccuggtccau ggaaat 26 <210> 277 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 277 agacaggucu cccacaaaca c 21 <210> 278 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 278 atatattccc gttuttaggg agcagaut 28 <210> 279 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 279 aacaagtggt tauagatggt gaaaccug 28 <210> 280 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 280 attaacccug attactggtt uccaaca 27 <210> 281 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 281 gatgtgctgt ugagacctct gug 23 <210> 282 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 282 tgaggagaug ggtggctugt 20 <210> 283 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 283 ctgctucagg acgttgaacu ct 22 <210> 284 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 284 cacctggcuc ctctucacg 19 <210> 285 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 285 agaaagacct tuctgatctg gtguca 26 <210> 286 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 286 gcaatcuagc gccuggaaga g 21 <210> 287 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 287 gtcacugaca gccctcugga 20 <210> 288 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 288 tgaggagcga ugacggaata uaag 24 <210> 289 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 289 tgtcctccug caggattccu ac 22 <210> 290 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 290 ccagagaaca aatuaaaaga gttaaggacu c 31 <210> 291 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 291 ctgtgttuct cccttcucag ga 22 <210> 292 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 292 attataaggc cugctgaaaa tgacuga 27 <210> 293 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 293 tagttcaaca ugacgaagau ggcaa 25 <210> 294 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 294 aaagggtaca uacaaagcag tctgug 26 <210> 295 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 295 catcaatgtu gctcgagucc ac 22 <210> 296 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 296 attgtagggt cucccttgat cugag 25 <210> 297 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 297 ctgatcttct caaagucgtc atcctuc 27 <210> 298 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 298 agatactgau ctcgccaucg ct 22 <210> 299 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 299 gctgcagugg gaccactatt auc 23 <210> 300 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 300 cacttcucac accgctgtgu t 21 <210> 301 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 301 cttgccccuc ccaucagaac 20 <210> 302 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 302 cuccccaaac cccaaugaag a 21 <210> 303 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 303 cauggtcuaa gaggcagcca 20 <210> 304 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 304 catcacacac cauaacucca cacat 25 <210> 305 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 305 aacatgatgg augtcacgtt cucaaa 26 <210> 306 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 306 tcucugcagg gcaaacct 18 <210> 307 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 307 ctcacuggcc tcttcugct 19 <210> 308 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 308 cccuggaaga guggccaaga t 21 <210> 309 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 309 gctgctgaaa augtaacttt gtaucct 27 <210> 310 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 310 ttgactctgt cucctcttgt cttcuc 26 <210> 311 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 311 cggactctgu aggctgcagu t 21 <210> 312 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 312 tgcagttggu ggaaccatta acuc 24 <210> 313 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 313 ctttaacacc uccagtccct cauc 24 <210> 314 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 314 tatccacatc cucttcctca ggaut 25 <210> 315 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 315 cggttgccta cuggttcaat tacttut 27 <210> 316 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 316 aagcatcagc atutgacttt accttauc 28 <210> 317 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 317 actgctaaac actaauataa cctttggaaa uat 33 <210> 318 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 318 actttatttg gauttgatcc aguaacacc 29 <210> 319 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 319 aagaaaaaga aacagagaau ctccatttua gc 32 <210> 320 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 320 tgcagugaaa agagtcucaa acacaa 26 <210> 321 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 321 agttcaatgc augctgttta attgtgug 28 <210> 322 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 322 gggctgugcg tcactgua 18 <210> 323 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 323 gagcccaggc cuttctugg 19 <210> 324 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 324 catgcggugg cccucct 17 <210> 325 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 325 acaaccacau gtgtccagug aaaat 25 <210> 326 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 326 ttagagatta aagugaagga ggaugagc 28 <210> 327 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 327 gatatgguag acagagccta aacaucc 27 <210> 328 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 328 tgttttgata accugacaga caauaaaagg 30 <210> 329 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 329 acatggaaag ccccugtttc auac 24 <210> 330 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 330 cttugcagga ctgucaagca g 21 <210> 331 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 331 autttacagt actctuccaa cccaaga 27 <210> 332 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 332 aagtggcttu ggtccgtcuc 20 <210> 333 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 333 gcgggacaag gaugccugac 20 <210> 334 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 334 cgtaggugca gtttggaugg c 21 <210> 335 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 335 tgugccaggg acctuacct 19 <210> 336 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 336 gtgtucccgg acatagucca g 21 <210> 337 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 337 caggaaaatg cuggctgacc uaaa 24 <210> 338 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 338 cacaacccac ugaggtatat gtauagg 27 <210> 339 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 339 taaaagagga gaaacucaga gataaccaau ac 32 <210> 340 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 340 tccctgtacc utcacctcug g 21 <210> 341 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 341 tcacagcaca uagucccgga a 21 <210> 342 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 342 gttttccttt acttacuaca cctcagatat aut 33 <210> 343 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 343 gggagattcc ugatgggcag atua 24 <210> 344 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 344 cagatgctcu gagaaaggca tuagaaa 27 <210> 345 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 345 ctcctctagc uatcttaatg actuggac 28 <210> 346 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 346 atctcugcca tcattuccgg aaag 24 <210> 347 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 347 cagcctccag ttcagc 16 <210> 348 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 348 cacagcaaca ccctggt 17 <210> 349 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 349 cgtccagggc ttcttcc 17 <210> 350 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 350 gcctcgaggc agcg 14 <210> 351 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 351 tctcaccaag tagctcaggg 20 <210> 352 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 352 ccattcattg aaacctcagc c 21 <210> 353 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 353 catactggat acagctggac aaga 24 <210> 354 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 354 tgcgcttttc ccaacacca 19 <210> 355 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 355 ccatgtacaa gatcaattac agtcggg 27 <210> 356 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 356 ggaggagaag tgcttctgc 19 <210> 357 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 357 ccactgtgcg acgagct 17 <210> 358 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 358 ccagaaacat cctggtagct 20 <210> 359 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 359 gggattcaat tgccatccat 20 <210> 360 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 360 ccatcgactt acattggtgg tctt 24 <210> 361 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 361 gcgattaaga agacccctat gcagta 26 <210> 362 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 362 accggcggcc taga 14 <210> 363 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 363 ggccggtgag gcgatc 16 <210> 364 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 364 cgccggcggt gtg 13 <210> 365 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 365 cctgtcttgt ctttgctgat g 21 <210> 366 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 366 cactgtactc ctcttgacct 20 <210> 367 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 367 tagttggagc tggtggcg 18 <210> 368 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 368 tgaggtggtg atggggaa 18 <210> 369 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 369 tcctcgtggc catgaatga 19 <210> 370 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 370 tgacacagga tgtttgatcc acc 23 <210> 371 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 371 cgcacgtctg taggggagt 19 <210> 372 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 372 cttctgggta agaaaggcct 20 <210> 373 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 373 tcaactcccg tggggagat 19 <210> 374 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 374 cccatcacca ttggcaggc 19 <210> 375 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 375 ctcatcaagc gacggc 16 <210> 376 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 376 gggatgtgtt ttccctcaac a 21 <210> 377 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 377 gccaagtccc tgtgtacga 19 <210> 378 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 378 ggtgggcacg cgga 14 <210> 379 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 379 ccttggcttt ctgggtgag 19 <210> 380 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 380 gccccctccc gagc 14 <210> 381 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 381 gatgatgtgg gtgggctgt 19 <210> 382 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 382 aaaccacttc atccaccgg 19 <210> 383 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 383 ccgccatgag ctccagc 17 <210> 384 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 384 tggaagccct gatcatca 18 <210> 385 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 385 ctatcatcat aggtcgtcat gct 23 <210> 386 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 386 ctggcaattg tgacccagt 19 <210> 387 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 387 agcaacagtc ttacctggac 20 <210> 388 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 388 gtgactttag aatgcctccg 20 <210> 389 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 389 cataagggtt ctcctccatg 20 <210> 390 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 390 ccatgccaat ggacagtgt 19 <210> 391 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 391 ggatgtattt gaagcacctg a 21 <210> 392 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 392 ctacacagta tccagcacat ga 22 <210> 393 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 393 cagttttatc taaggctagg gtct 24 <210> 394 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 394 ccccacagag cgctccc 17 <210> 395 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 395 tgaaattcgc tggagggtca 20 <210> 396 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 396 ggcctggcca gagaca 16 <210> 397 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 397 ccagaaatcc tgacttacga ca 22 <210> 398 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 398 caaggtaact caggactttg ag 22 <210> 399 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 399 cccatgtatg aagtacagtg ga 22 <210> 400 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 400 agacttggca gccagaaa 18 <210> 401 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 401 tggaactgat ggagggagga 20 <210> 402 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 402 cgtggtgccc ctctat 16 <210> 403 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 403 gaattttcgt agtacatatt tcctctga 28 <210> 404 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 404 agctgttttc acctctgttg ctt 23 <210> 405 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 405 tcttgaggat cttgaaggaa actg 24 <210> 406 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 406 gagatgttgc ttctcttaat tccttg 26 <210> 407 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 407 tgatggccag cgtgg 15 <210> 408 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 408 acagattttg ggctggccaa 20 <210> 409 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 409 ggcattttgg ttgtgtatat catg 24 <210> 410 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 410 tcttgccaga gacatgtatg a 21 <210> 411 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 411 cccaatcggc ctggtgc 17 <210> 412 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 412 gccttggtcc agacccag 18 <210> 413 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 413 ccactccatc gagatttcac tg 22 <210> 414 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 414 ggacaaagaa ttggatctgg atcatttgga 30 <210> 415 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 415 attttcttct ctctgacctt tgg 23 <210> 416 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 416 ctaggcactt actaatgctg aaga 24 <210> 417 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 417 tgaggttttt ccgaagagat gt 22 <210> 418 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 418 ccctcatcta cccactgaca 20 <210> 419 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 419 tgtagtgtag cacagcttcg aagt 24 <210> 420 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 420 ctcctcctgg cccgtg 16 <210> 421 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 421 gtacctctat ggcgtctgtg tc 22 <210> 422 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 422 ccttgttggc aaatcacact tgtt 24 <210> 423 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 423 tgttggacat actggataca gc 22 <210> 424 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 424 cttttcccaa caccacctgc 20 <210> 425 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 425 cctgaggagg agaagtgc 18 <210> 426 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 426 cgagctgtgc cgca 14 <210> 427 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 427 cctcttcacg taggaatcct cttcataa 28 <210> 428 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 428 tgcaggctcc aagaagattt 20 <210> 429 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 429 agattacagc ttccccagac tac 23 <210> 430 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 430 gggccggtga ggcg 14 <210> 431 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 431 gtgggcgccg gc 12 <210> 432 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 432 tggcgctgta ctcctcctg 19 <210> 433 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 433 atgtacctat ggtcctagta ggaaataaat g 31 <210> 434 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 434 ctgtactcct cttgacctgc tgt 23 <210> 435 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 435 tggtagttgg agctggtg 18 <210> 436 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 436 ccctcgcacc acgc 14 <210> 437 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 437 gcagcccccg gcac 14 <210> 438 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 438 agcctgttcc ctcacagg 18 <210> 439 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 439 cagttctccc accttctgct t 21 <210> 440 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 440 gcccacgatg tacggagag 19 <210> 441 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 441 ccccaggatg ttccggata 19 <210> 442 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 442 ggacgtggga tcctgc 16 <210> 443 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 443 ggcgcttttg gcacagt 17 <210> 444 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 444 cccaaagcca acaaagaaat cttaga 26 <210> 445 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 445 ggtgtgggct ccccatatgt 20 <210> 446 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 446 ccgccggcgg agaa 14 <210> 447 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 447 gctccgaccg ctgg 14 <210> 448 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 448 ctgggtgaga aaggcttc 18 <210> 449 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 449 gcatgagaac ctgggcc 17 <210> 450 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 450 acttcgggat ggcccgag 18 <210> 451 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 451 cgaacaatgt tctggtggtt gaatt 25 <210> 452 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 452 gcgcctttgg ggagg 15 <210> 453 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 453 cacttcaggc agcgtct 17 <210> 454 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 454 cacccaatca agctcaactt cgta 24 <210> 455 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 455 ccagaggcag aggtcga 17 <210> 456 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 456 tgcctttacc actcagagaa g 21 <210> 457 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 457 tttaaaaagg gttgaaaaag ccgaa 25 <210> 458 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 458 taccttatca atgtctcgaa tatttacatt 30 <210> 459 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 459 cctgggattg gaacaaggta 20 <210> 460 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 460 ccaatagggt tcagcaaatc ttct 24 <210> 461 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 461 tccatagaaa atctttctcc tgc 23 <210> 462 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 462 gagtcacaca ccttttgtgt ttc 23 <210> 463 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 463 atttcatgaa acaaatgaat gatgcacatc 30 <210> 464 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 464 cccccacaga gcgctccc 18 <210> 465 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 465 ggcgggcagt gtgtatg 17 <210> 466 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 466 ccacagggat gccgggg 17 <210> 467 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 467 gggccacatt tgaacattgt aaac 24 <210> 468 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 468 gcctggccag agacatcat 19 <210> 469 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 469 tgggcaagac ttctgcctat tt 22 <210> 470 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 470 ccttggtaat cacatgaata ttgtgaat 28 <210> 471 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 471 agacccaaca caacttcct 19 <210> 472 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 472 attttggtct agccagagac a 21 <210> 473 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 473 ggctccactt cccagcaa 18 <210> 474 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 474 tgcccctcta tgacctgc 18 <210> 475 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 475 cagctttggt gccacct 17 <210> 476 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 476 tgcccggcag gagtc 15 <210> 477 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 477 cgcaccggag cccag 15 <210> 478 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 478 gcatgagctg cgtgat 16 <210> 479 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 479 ctggccaaac tgctggg 17 <210> 480 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 480 tctcagaaca ataaactgaa atataccttc 30 <210> 481 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 481 cagtgaagtg gatggct 17 <210> 482 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 482 atggtgcccg ccga 14 <210> 483 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 483 tcagcctggt tgaagaagtc gt 22 <210> 484 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 484 cctcacagta aaaataggtg atttt 25 <210> 485 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 485 gggacaaaga attggatctg gat 23 <210> 486 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 486 ttactctcgt ctccacagac aca 23 <210> 487 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 487 tggtggggac tcgaact 17 <210> 488 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 488 gagagctgca tcagttcact 20 <210> 489 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 489 agacautaag aagauggcca agcaa 25 <210> 490 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 490 attaatugga cacagugcca gagt 24 <210> 491 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 491 gcccattatu cagagcgagt augg 24 <210> 492 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 492 gagcuggagc gcctgauaat 20 <210> 493 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 493 ctatgttcut gtcgccuccg a 21 <210> 494 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 494 ggaagcucat ugaagcagag ga 22 <210> 495 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 495 gctcaccaug tggttuggg 19 <210> 496 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 496 agacattaag aagatggcca agcaa 25 <210> 497 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 497 attaattgga cacagtgcca gagt 24 <210> 498 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 498 gcccattatt cagagcgagt atgg 24 <210> 499 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 499 gagctggagc gcctgataat 20 <210> 500 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 500 ctatgttctt gtcgcctccg a 21 <210> 501 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 501 ggaagctcat tgaagcagag ga 22 <210> 502 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 502 gctcaccatg tggtttggg 19 <210> 503 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 503 tggcccgcau caauacaaac t 21 <210> 504 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 504 actgcccugt gctcacauc 19 <210> 505 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 505 gatggtactg cuctagcaga cttut 25 <210> 506 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 506 cgaagcccuc ctgctcauc 19 <210> 507 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 507 cctcuccaac acacaggagu aat 23 <210> 508 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 508 gcugccacgg atgtauacct 20 <210> 509 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 509 tggcaaucga atccagcuca t 21 <210> 510 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 510 tggcccgcat caatacaaac t 21 <210> 511 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 511 actgccctgt gctcacatc 19 <210> 512 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 512 gatggtactg ctctagcaga ctttt 25 <210> 513 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 513 cgaagccctc ctgctcatc 19 <210> 514 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 514 cctctccaac acacaggagt aat 23 <210> 515 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 515 gctgccacgg atgtatacct 20 <210> 516 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 516 tggcaatcga atccagctca t 21 <210> 517 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 517 ccagctccct gcgaagag 18 <210> 518 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 518 cctatcttgg atgatggctg gtgcaaag 28 <210> 519 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 519 gacgggtcca actacacgtt 20 <210> 520 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 520 cctggtgctc catgaggaga ca 22 <210> 521 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 521 gactcccatg acccccatc 19 <210> 522 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 522 aggatgatgg cactgaactc c 21 <210> 523 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 523 cgtgtggtct gctccctttt cttg 24 <210> 524 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 524 gcacattgct cccgttaagg 20 <210> 525 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 525 gtgatccaga ctctgacctt ttgcca 26 <210> 526 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 526 acgaagtgca atggtcttta ggt 23 <210> 527 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 527 caacttcagc tatgaggtaa tttttctc 28 <210> 528 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 528 caacttcagc taugaggtaa tttttcuc 28 <210> 529 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 529 agaccaggag tcagactgta gg 22 <210> 530 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 530 agaccaggag ucagactgua gg 22 <210> 531 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 531 tcatcctcag ggccatcttc at 22 <210> 532 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 532 tcatccucag ggccatctuc at 22 <210> 533 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 533 ccagctccct gcgaagag 18 <210> 534 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 534 ccagcucccu gcgaagag 18 <210> 535 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 535 gtccttgttt tgctgctggt 20 <210> 536 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 536 gtccttgutt tgctgcuggt 20 <210> 537 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 537 cacttcagac gacacattcc ataca 25 <210> 538 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 538 cactucagac gacacattcc auaca 25 <210> 539 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 539 cgtgtggtct gctccctttt cttg 24 <210> 540 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 540 cgtgtggtcu gctccctttt ctug 24 <210> 541 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 541 gcacagcgga actcactgg 19 <210> 542 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 542 gcacagcgga acucacugg 19 <210> 543 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 543 gaggcagcct ccatgagtg 19 <210> 544 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 544 gaggcagccu ccatgagug 19 <210> 545 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 545 atggtggatg tcgtgtagct t 21 <210> 546 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 546 atggtggatg ucgtgtagcu t 21 <210> 547 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 547 gtgatccaga ctctgacctt ttgcca 26 <210> 548 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 548 gtgatccaga cuctgacctt tugcca 26 <210> 549 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 549 aagggtacat gagagccatt acg 23 <210> 550 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 550 aagggtacau gagagccatu acg 23 <210> 551 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 551 gcggaagtga cattatcaac gc 22 <210> 552 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 552 gcggaaguga cattaucaac gc 22 <210> 553 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 553 gactcccatg acccccatc 19 <210> 554 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 554 gactcccaug acccccauc 19 <210> 555 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 555 atcagagctt aaactgggaa gctg 24 <210> 556 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 556 atcagagctu aaactgggaa gcug 24 <210> 557 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 557 aagaatcttg tcccctgtgg tg 22 <210> 558 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 558 aagaatcttg ucccctgtgg ug 22 <210> 559 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 559 acgatcccga gactctgctt 20 <210> 560 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 560 acgatcccga gacuctgcut 20 <210> 561 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 561 aggatgatgg cactgaactc c 21 <210> 562 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 562 aggatgaugg cactgaacuc c 21 <210> 563 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 563 ctgggtggca ccctctc 17 <210> 564 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 564 ctggguggca ccctcuc 17 <210> 565 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 565 actgcagact taggaatcag tttactc 27 <210> 566 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 566 actgcagact uaggaatcag tttacuc 27 <210> 567 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 567 cctatcttgg atgatggctg gtgcaaag 28 <210> 568 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 568 cctatcttgg augatggctg gugcaaag 28 <210> 569 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 569 ctgtgtgacg gcagcgat 18 <210> 570 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 570 cugtgugacg gcagcgat 18 <210> 571 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 571 ccagtcagtc cagtagacct c 21 <210> 572 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 572 ccagtcaguc cagtagaccu c 21 <210> 573 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 573 aatcgcatct tcttcagcga ca 22 <210> 574 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 574 aatcgcauct tctucagcga ca 22 <210> 575 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 575 cctggtgctc catgaggaga ca 22 <210> 576 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 576 cctggugctc caugaggaga ca 22 <210> 577 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 577 aaaatatgct agagttgtac agaagttgg 29 <210> 578 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 578 aaaatatgct agagutgtac agaagtugg 29 <210> 579 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 579 cgctggaact cgtctcact 19 <210> 580 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 580 cgctggaacu cgtcucact 19 <210> 581 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 581 acgaagtgca atggtcttta ggt 23 <210> 582 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 582 acgaagugca atggtcttua ggt 23 <210> 583 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 583 caacttcagc tatgaggtaa tttttctc 28 <210> 584 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 584 caacttcagc taugaggtaa tttttcuc 28 <210> 585 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 585 tcatcctcag ggccatcttc at 22 <210> 586 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 586 tcatccucag ggccatctuc at 22 <210> 587 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 587 ccagctccct gcgaagag 18 <210> 588 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 588 ccagcucccu gcgaagag 18 <210> 589 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 589 cacttcagac gacacattcc ataca 25 <210> 590 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 590 cactucagac gacacattcc auaca 25 <210> 591 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 591 cgtgtggtct gctccctttt cttg 24 <210> 592 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 592 cgtgtggtcu gctccctttt ctug 24 <210> 593 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 593 atcagagctt aaactgggaa gctg 24 <210> 594 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 594 atcagagctu aaactgggaa gcug 24 <210> 595 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 595 acgatcccga gactctgctt 20 <210> 596 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 596 acgatcccga gacuctgcut 20 <210> 597 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 597 aggatgatgg cactgaactc c 21 <210> 598 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 598 aggatgaugg cactgaacuc c 21 <210> 599 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 599 actgcagact taggaatcag tttactc 27 <210> 600 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 600 actgcagact uaggaatcag tttacuc 27 <210> 601 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 601 cctatcttgg atgatggctg gtgcaaag 28 <210> 602 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 602 cctatcttgg augatggctg gugcaaag 28

Claims (100)

  1. 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 방법으로서,
    단일 증폭 반응 혼합물 내에서 복수의 상이한 표적 서열을 포함하는 샘플로부터 상이한 표적 서열의 멀티플렉스를 증폭시키는 것
    - 상기 증폭은 증폭 조건 하에서 상기 샘플의 적어도 일부를 복수의 표적 특이적 프라이머 및 폴리머라제와 접촉시켜, 상이한 증폭된 표적 서열의 멀티플렉스를 생성하는 것을 포함하고,
    상기 복수의 표적 특이적 프라이머 중 적어도 2개는 절단 가능한 기를 포함하고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 두 단부에 절단 가능한 기를 포함하고, 상기 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 기를 포함하지 않고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 절단 가능한 기를 포함함 -;
    상기 상이한 증폭된 표적 서열의 멀티플렉스의 절단 가능한 기를 절단하여 절단된 단부를 형성하는 것; 및
    적어도 2개의 어댑터를 상기 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나의 절단된 단부에 결찰시켜, 하나 이상의 어댑터-결찰된 증폭된 표적 서열을 생성시키는 것;
    이에 의해서 상이한 어댑터-결찰된 표적 서열의 라이브러리를 제조하는 것을 포함하며,
    차단 표적 특이적 프라이머로부터 생성된 앰플리콘은 어댑터를 결찰할 수 없고, 상기 결찰 반응에서 상기 어댑터 중 어느 것도 높은 엄격성 조건 하에서 상기 상이한 증폭된 표적 서열의 멀티플렉스 중 어느 하나에 혼성화하지 않는, 방법.
  2. 제1항에 있어서, 상기 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택되는, 방법.
  3. 제2항에 있어서, 상기 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택되는, 방법.
  4. 제1항에 있어서, 상기 표적 핵산 중 하나 이상은 서열 변이인, 방법.
  5. 제4항에 있어서, 상기 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위인, 방법.
  6. 제1항에 있어서, 상기 표적 핵산 중 하나 이상은 상기 숙주 샘플에 대한 병원성 핵산인, 방법.
  7. 제6항에 있어서, 상기 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택되는, 방법.
  8. 제1항에 있어서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열, 또는 숙주 샘플에 대해서 천연인 대립유전자 특이적에 지향되는, 방법.
  9. 제8항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향되는, 방법.
  10. 제8항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 상기 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향되는, 방법.
  11. 제1항에 있어서, 상기 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하는, 방법.
  12. 제1항에 있어서, 상기 복수의 표적 특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는, 방법: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
  13. 제1항에 있어서, 증폭시키는 단계, 절단하는 단계, 결찰하는 단계 및 라이브러리를 제조하는 단계는 단일 반응 용기에서 수행되는, 방법.
  14. 제1항에 있어서, 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리를 조합하여, 상이한 어댑터-결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함하는, 방법.
  15. 제1항에 있어서, 상기 어댑터는 바코드, 태그 또는 범용 프라이밍 서열을 추가로 포함하는, 방법.
  16. 제1항에 있어서, 상기 어댑터는 블런트-단부 결찰(blunt-ended ligation)이 가능한 리가제를 사용하여 적어도 하나의 소화된 상이한 표적 특이적 앰플리콘의 단부에 결찰된 이중 가닥 어댑터인, 방법.
  17. 제16항에 있어서, 상기 리가제는 등온 리가제인, 방법.
  18. 제16항에 있어서, 상기 결찰 반응은 2개 이하의 상이한 어댑터를 포함하는, 방법.
  19. 제1항에 있어서, 상기 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 상기 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류에서 상기 표적 서열과 상보적인 DNA 서열을 포함하는, 방법.
  20. 제1항에 있어서, 상기 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 표적 서열에 지향되는 정방향 차단 프라이머와 역방향 차단 프라이머의 적어도 하나의 쌍을 포함하고, 상기 차단 프라이머 각각은 상기 멀티플렉스 반응에서 상기 표적 서열의 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는, 방법.
  21. 샘플로부터 관심 표적 폴리뉴클레오티드를 검출하는 방법으로서, 상기 표적 폴리뉴클레오티드는 낮은 빈도로 상기 샘플에 존재하고,
    a. 제1항의 방법에 따라서 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 것; 및
    b. 상기 제조된 라이브러리 앰플리콘을 분석하여 상기 샘플에 존재하는 상기 표적 서열을 결정하여 관심 표적 폴리뉴클레오티드를 검출하는 것을 포함하는, 방법.
  22. 제21항에 있어서, 상기 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택되는, 방법.
  23. 제22항에 있어서, 상기 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택되는, 방법.
  24. 제21항에 있어서, 상기 표적 핵산 중 하나 이상은 서열 변이인, 방법.
  25. 제24항에 있어서, 상기 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위인, 방법.
  26. 제21항에 있어서, 상기 표적 핵산 중 하나 이상은 상기 숙주 샘플에 대한 병원성 핵산인, 방법.
  27. 제26항에 있어서, 상기 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택되는, 방법.
  28. 제1항에 있어서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열, 또는 숙주 샘플에 대해서 천연인 대립유전자 특이적에 지향되는, 방법.
  29. 제28항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향되는, 방법.
  30. 제8항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 상기 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향되는, 방법.
  31. 제21항에 있어서, 상기 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하는, 방법.
  32. 제21항에 있어서, 상기 복수의 표적 특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는, 방법: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
  33. 제21항에 있어서, 증폭시키는 단계, 절단하는 단계, 결찰시키는 단계 및 라이브러리를 제조하는 단계는 단일 반응 용기에서 수행되는, 방법.
  34. 제21항에 있어서, 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리를 조합하여, 상이한 어댑터-결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함하는 방법.
  35. 제21항에 있어서, 상기 어댑터는 바코드, 태그 또는 범용 프라이밍 서열을 추가로 포함하는, 방법.
  36. 제21항에 있어서, 상기 어댑터는 블런트-단부 결찰이 가능한 리가제를 사용하여 적어도 하나의 소화된 상이한 표적 특이적 앰플리콘의 단부에 결찰된 이중 가닥 어댑터인, 방법.
  37. 제36항에 있어서, 상기 리가제는 등온 리가제인, 방법.
  38. 제36항에 있어서, 상기 결찰 반응은 2개 이하의 상이한 어댑터를 포함하는, 방법.
  39. 제21항에 있어서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 상기 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류에서 상기 표적 서열과 상보적인 DNA 서열을 포함하는, 방법.
  40. 제21항에 있어서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 표적 서열에 지향되는 정방향 차단 프라이머와 역방향 차단 프라이머의 적어도 하나의 쌍을 포함하고, 상기 차단 프라이머 각각은 상기 멀티플렉스 반응에서 상기 표적 서열의 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는, 방법.
  41. 제21항에 있어서, 적어도 하나의 어댑터-결찰된 표적 특이적 서열 중 일부의 클론성 증폭을 추가로 포함하는 방법.
  42. 제42항에 있어서, 상기 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함하는, 방법.
  43. 제21항에 있어서, 상기 분석은 상기 라이브러리를 서열결정함으로써 수행되는, 방법.
  44. 제43항에 있어서, 서열결정은 합성에 의한 서열결정에 의해서 수행되는, 방법.
  45. 제44항에 있어서, 라이브러리 제조 및 서열결정은 자동화 시스템에서 수행되는, 방법.
  46. 제45항에 있어서, 서열결정 이전에 적어도 하나의 어댑터-결찰된 표적 특이적 서열 중 일부의 클론성 증폭을 추가로 포함하는 방법.
  47. 제46항에 있어서, 상기 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함하는, 방법.
  48. 제47항에 있어서, 클론성 증폭 이전에 제조된 라이브러리의 정규화를 추가로 포함하는 방법.
  49. 제48항에 있어서, 2개 이상의 제조된 라이브러리가 클론성 증폭 전에 조합되는, 방법.
  50. 제1항의 방법에 따라서 제조된 라이브러리 조성물.
  51. 낮은 빈도로 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 방법으로서,
    단일 증폭 반응 혼합물 내에서 복수의 상이한 표적 서열을 포함하는 샘플로부터 상이한 표적 서열의 멀티플렉스를 증폭시키는 것
    - 상기 증폭은 표적 핵산(들)이 제1 증폭을 겪는 조건 하에서 핵산 샘플을 상기 샘플에서 하나 이상의 표적 핵산 서열의 증폭이 가능한 복수의 어댑터와 접촉시키는 것을 포함하고, 복수의 어댑터 중 적어도 2개는 범용 핸들 서열 및 표적 핵산 서열 및 절단 가능한 모이어티 및 선택적으로 하나 이상의 태그 서열을 포함하고, 여기서 어댑터의 표적 핵산 서열은 적어도 하나의 절단 가능한 모이어티를 포함하고, 범용 핸들 서열은 절단 가능한 모이어티를 포함하지 않고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 두 단부에 절단 가능한 기를 포함하고, 복수의 표적 특이적 프라이머 중 적어도 하나는 절단 가능한 모이어티 또는 범용 서열을 포함하지 않고, 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 1개 이하의 단부에 절단 가능한 기 및 범용 서열을 포함함 -;
    생성된 제1 증폭 생성물을 소화시켜, 생성된 프라이머 이량체를 감소시키거나 제거하고 부분적으로 소화된 표적 앰플리콘을 제조하여, 갭이 있는 이중 가닥 앰플리콘을 생성하고 그 다음 상기 부분적으로 소화된 표적 앰플리콘을 복구하는 것; 및
    상기 복구된 표적 앰플리콘을 범용 프라이머를 사용하여 제2 증폭에서 증폭시켜,
    하나 이상의 어댑터-결찰된 증폭된 표적 서열을 생성시키는 것;
    이에 의해서 상이한 어댑터-결찰된 표적 서열의 라이브러리를 제조하는 것을 포함하며, 차단 표적 특이적 프라이머로부터 생성된 앰플리콘은 제2 범용 증폭과 상용성이 아니고, 상기 증폭 반응에서 상기 어댑터 중 어느 것도 높은 엄격성 조건 하에서 상기 상이한 증폭된 표적 서열의 멀티플렉스 중 어느 하나에 혼성화하지 않는, 방법.
  52. 제51항에 있어서, 상기 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택되는, 방법.
  53. 제52항에 있어서, 상기 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택되는, 방법.
  54. 제51항에 있어서, 상기 표적 핵산 중 하나 이상은 서열 변이인, 방법.
  55. 제54항에 있어서, 상기 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위인, 방법.
  56. 제51항에 있어서, 상기 표적 핵산 중 하나 이상은 상기 숙주 샘플에 대한 병원성 핵산인, 방법.
  57. 제56항에 있어서, 상기 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택되는, 방법.
  58. 제51항에 있어서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열, 또는 숙주 샘플에 대해서 천연인 대립유전자 특이적에 지향되는, 방법.
  59. 제58항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향되는, 방법.
  60. 제58항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향되는, 방법.
  61. 제51항에 있어서, 상기 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하는, 방법.
  62. 제51항에 있어서, 상기 복수의 표적 특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는, 방법: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
  63. 제51항에 있어서, 증폭시키는 단계, 소화시키는 단계, 복구하는 단계 및 라이브러리를 제조하는 단계는 단일 반응 용기에서 수행되는, 방법.
  64. 제51항에 있어서, 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리를 조합하여, 상이한 어댑터-증폭된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함하는 방법.
  65. 제51항에 있어서, 상기 어댑터는 바코드, 태그 또는 범용 프라이밍 서열을 추가로 포함하는, 방법.
  66. 제51항에 있어서, 상기 제2 증폭은 상기 범용 프라이밍 서열과 상보적인 범용 서열을 포함하는 범용 증폭 어댑터를 사용하여 수행되고, 범용 어댑터는 관심 표적 서열의 하류 분석을 위한 서열을 추가로 포함하는, 방법.
  67. 제66항에 있어서, 2개의 상이한 범용 서열과 2개의 상이한 어댑터 서열의 조합으로 구성된, 4개 이하의 상이한 범용 어댑터를 사용하는 것을 포함하는 방법.
  68. 제66항에 있어서, 2개 이하의 상이한 범용 어댑터를 사용하는 것을 포함하는 방법.
  69. 제51항에 있어서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 상기 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류에서 상기 표적 서열과 상보적인 DNA 서열을 포함하는, 방법.
  70. 제51항에 있어서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 표적 서열에 지향되는 정방향 차단 프라이머와 역방향 차단 프라이머의 적어도 하나의 쌍을 포함하고, 상기 차단 프라이머 각각은 상기 멀티플렉스 반응에서 상기 표적 서열의 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는, 방법.
  71. 샘플로부터 관심 표적 폴리뉴클레오티드를 검출하는 방법으로서, 상기 표적 폴리뉴클레오티드는 낮은 빈도로 상기 샘플에 존재하고,
    제51항의 방법에 따라서 샘플에 존재하는 하나 이상의 표적 서열의 라이브러리를 제조하는 것; 및
    상기 제조된 라이브러리 앰플리콘을 분석하여 상기 샘플에 존재하는 상기 표적 서열을 결정하여 관심 표적 폴리뉴클레오티드를 검출하는 것을 포함하는 방법.
  72. 제71항에 있어서, 상기 표적 핵산 서열은 RNA, DNA, cDNA 또는 TNA 중 하나 이상으로부터 선택되는, 방법.
  73. 제72항에 있어서, 상기 표적 핵산 서열은 cfNA, ctNA, 및 세포로부터의 조직 핵산으로부터 선택되는, 방법.
  74. 제71항에 있어서, 상기 표적 핵산 중 하나 이상은 서열 변이인, 방법.
  75. 제74항에 있어서, 상기 서열 변이는 하나 이상의 뉴클레오티드의 결실, 삽입, 전좌 또는 역위인, 방법.
  76. 제71항에 있어서, 상기 표적 핵산 중 하나 이상은 상기 숙주 샘플에 대한 병원성 핵산인, 방법.
  77. 제76항에 있어서, 상기 표적 핵산 중 하나 이상은 바이러스, 박테리아 및 미생물 핵산으로부터 선택되는, 방법.
  78. 제71항에 있어서, 하나 이상의 차단 표적 특이적 프라이머는 야생형 서열, 또는 숙주 샘플에 대해서 천연인 대립유전자 특이적에 지향되는, 방법.
  79. 제78항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 관심 병원체 핵산 표적 서열을 검출하기 위해서, 생성된 라이브러리에서 숙주 표적 핵산 앰플리콘의 존재를 감소시키기 위해서 숙주 서열에 지향되는, 방법.
  80. 제78항에 있어서, 상기 하나 이상의 차단 표적 특이적 프라이머는 관심 서열의 변이 대립유전자 표적을 검출하기 위해서, 생성된 라이브러리에서 야생형 또는 대립유전자 특이적 앰플리콘의 존재를 감소시키기 위해서 야생형 또는 대립유전자 특이적 서열에 지향되는, 방법.
  81. 제71항에 있어서, 상기 절단 가능한 기는 메틸구아닌, 8-옥소-구아닌, 잔틴, 하이포잔틴, 5,6-디하이드로우라실, 우라실, 5-메틸시토신, 티민-이량체, 7-메틸구아노신, 8-옥소-데옥시구아노신, 잔토신, 이노신, 디하이드로우리딘, 브로모데옥시우리딘, 우리딘 또는 5-메틸시티딘을 포함하는, 방법.
  82. 제71항에 있어서, 상기 복수의 표적 특이적 프라이머 각각은 하기 기준 중 임의의 하나 이상을 갖는, 방법: (1) 프라이머 서열 내에 2개 이상의 변형된 뉴클레오티드를 포함하고, 이들 중 적어도 하나는 프라이머의 말단 근처 또는 말단에 포함되고 이들 중 적어도 하나는 프라이머 서열의 중심 뉴클레오티드 위치에 또는 그 근처에 포함됨; (2) 길이는 약 15개 내지 약 40개 염기 길이임; (3) Tm은 약 60℃ 내지 약 70℃임; (4) 샘플에 존재하는 비표적 서열과 낮은 교차 반응성을 가짐; (5) 적어도 처음 4개의 뉴클레오티드(3'에서 5' 방향으로)는 반응에 존재하는 임의의 다른 프라이머 내의 임의의 서열과 상보적이지 않음; 및 (6) 임의의 다른 생산된 증폭된 표적 서열 내의 적어도 5개의 뉴클레오티드의 임의의 연속 스트레치와 상보적이지 않음.
  83. 제71항에 있어서, 증폭시키는 단계, 절단하는 단계, 결찰시키는 단계 및 라이브러리를 제조하는 단계는 단일 반응 용기에서 수행되는, 방법.
  84. 제71항에 있어서, 각각 개별적으로 단일 반응으로 제조된 2개 이상의 라이브러리를 조합하여, 상이한 어댑터-결찰된 표적 서열의 라이브러리를 제조하는 것을 추가로 포함하는, 방법.
  85. 제71항에 있어서, 상기 어댑터는 바코드, 태그 또는 범용 프라이밍 서열을 추가로 포함하는, 방법.
  86. 제71항에 있어서, 상기 제2 증폭은 상기 범용 프라이밍 서열과 상보적인 범용 서열을 포함하는 범용 증폭 어댑터를 사용하여 수행되고, 범용 어댑터는 관심 표적 서열의 하류 분석을 위한 서열을 추가로 포함하는, 방법.
  87. 제86항에 있어서, 2개의 상이한 범용 서열과 2개의 상이한 어댑터 서열의 조합으로 구성된, 4개 이하의 상이한 범용 어댑터를 사용하는 것을 포함하는 방법.
  88. 제86항에 있어서, 2개 이하의 상이한 범용 어댑터를 사용하는 것을 포함하는 방법.
  89. 제71항에 있어서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 상기 멀티플렉스 반응에서 생산성 정방향 표적 특이적 프라이머 또는 생산성 역방향 표적 특이적 프라이머의 하류에서 상기 표적 서열과 상보적인 DNA 서열을 포함하는, 방법.
  90. 제71항에 있어서, 절단 가능한 기를 포함하지 않는 복수의 표적 특이적 프라이머 중 적어도 하나는 차단 프라이머이고, 상기 생성된 상이한 증폭된 표적 서열의 멀티플렉스 중 적어도 하나는 생성된 앰플리콘의 단지 하나의 단부에만 최대 1개의 절단 가능한 기를 포함하고 나머지 작업흐름을 통해 처리되지 않으며 생산성 어댑터 결찰된 앰플리콘을 생성하지 않고;
    상기 차단 프라이머는 표적 서열에 지향되는 정방향 차단 프라이머와 역방향 차단 프라이머의 적어도 하나의 쌍을 포함하고, 상기 차단 프라이머 각각은 상기 멀티플렉스 반응에서 상기 표적 서열의 생산성 정방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되고 생산성 역방향 표적 특이적 프라이머와 부분적으로 또는 전체적으로 중첩되는, 방법.
  91. 제71항에 있어서, 적어도 하나의 어댑터-결찰된 표적 특이적 서열 중 일부의 클론성 증폭을 추가로 포함하는 방법.
  92. 제91항에 있어서, 상기 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함하는, 방법.
  93. 제71항에 있어서, 상기 분석은 상기 라이브러리를 서열결정함으로써 수행되는, 방법.
  94. 제93항에 있어서, 서열결정은 합성에 의한 서열결정에 의해서 수행되는, 방법.
  95. 제94항에 있어서, 라이브러리 제조 및 서열결정은 자동화 시스템에서 수행되는, 방법.
  96. 제95항에 있어서, 서열결정 이전에 적어도 하나의 어댑터-결찰된 표적 특이적 서열 중 일부의 클론성 증폭을 추가로 포함하는 방법.
  97. 제96항에 있어서, 상기 적어도 하나의 어댑터-결찰된 표적 특이적 앰플리콘 중 일부의 클론성 증폭은 에멀젼 PCR, 브릿지 PCR 또는 등온 증폭을 포함하는, 방법.
  98. 제97항에 있어서, 클론성 증폭 이전에 제조된 라이브러리의 정규화를 추가로 포함하는 방법.
  99. 제98항에 있어서, 2개 이상의 제조된 라이브러리는 클론성 증폭 전에 조합되는, 방법.
  100. 제51항의 방법에 따라서 제조된 라이브러리 조성물.
KR1020237024403A 2020-12-24 2021-12-23 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법 KR20230124636A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063199421P 2020-12-24 2020-12-24
US63/199,421 2020-12-24
US202163201338P 2021-04-23 2021-04-23
US63/201,338 2021-04-23
US202163202179P 2021-05-28 2021-05-28
US63/202,179 2021-05-28
PCT/US2021/073095 WO2022140793A1 (en) 2020-12-24 2021-12-23 Compositions and methods for highly sensitive detection of target sequences in multiplex reactions

Publications (1)

Publication Number Publication Date
KR20230124636A true KR20230124636A (ko) 2023-08-25

Family

ID=79831389

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237024403A KR20230124636A (ko) 2020-12-24 2021-12-23 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법

Country Status (4)

Country Link
US (1) US20230374574A1 (ko)
EP (1) EP4267763A1 (ko)
KR (1) KR20230124636A (ko)
WO (1) WO2022140793A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201903333SA (en) 2017-12-29 2019-08-27 Clear Labs Inc Automated priming and library loading services

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9957A (en) 1853-08-23 Arrangement of gutters for turning
US558A (en) 1838-01-09 Improvement in locomotives and railroad-cars which are
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
WO2012149438A1 (en) * 2011-04-28 2012-11-01 Life Technologies Corporation Methods and compositions for multiplex pcr
WO2013081864A1 (en) * 2011-11-29 2013-06-06 Life Technologies Corporation Methods and compositions for multiplex pcr
WO2013158215A1 (en) * 2012-04-16 2013-10-24 Life Technologies Corporation Oligonucleotides and methods for the preparationof rna libraries
EP4282982A3 (en) * 2017-06-30 2024-01-10 Life Technologies Corporation Library preparation methods and compositions and uses therefor
SG11202112246UA (en) * 2019-05-03 2021-12-30 Univ Cornell Markers for identifying and quantifying of nucleic acid sequence mutation, expression, splice variant, translocation, copy number, or methylation changes

Also Published As

Publication number Publication date
EP4267763A1 (en) 2023-11-01
WO2022140793A1 (en) 2022-06-30
US20230374574A1 (en) 2023-11-23

Similar Documents

Publication Publication Date Title
US11214798B2 (en) Methods and compositions for rapid nucleic acid library preparation
EP2906715B1 (en) Compositions, methods, systems and kits for target nucleic acid enrichment
JP6847496B2 (ja) 単一プローブプライマー伸長による標的濃縮
JP5986572B2 (ja) 固定化プライマーを使用した標的dnaの直接的な捕捉、増幅、および配列決定
JP7240337B2 (ja) ライブラリー調製方法ならびにそのための組成物および使用
WO2018136397A1 (en) Method for making an asymmetrically-tagged sequencing library
US20230374574A1 (en) Compositions and methods for highly sensitive detection of target sequences in multiplex reactions
US11174511B2 (en) Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture
US20220325317A1 (en) Methods for generating a population of polynucleotide molecules
EP4022092A1 (en) Compositions and methods for oncology precision assays
WO2023225515A1 (en) Compositions and methods for oncology assays
WO2021180791A1 (en) Novel nucleic acid template structure for sequencing
JP2024060054A (ja) ヌクレアーゼ、リガーゼ、ポリメラーゼ、及び配列決定反応の組み合わせを用いた、核酸配列、発現、コピー、またはdnaのメチル化変化の識別及び計数方法