KR20210107618A - 뉴클레아제 기반 rna 고갈 - Google Patents

뉴클레아제 기반 rna 고갈 Download PDF

Info

Publication number
KR20210107618A
KR20210107618A KR1020217009649A KR20217009649A KR20210107618A KR 20210107618 A KR20210107618 A KR 20210107618A KR 1020217009649 A KR1020217009649 A KR 1020217009649A KR 20217009649 A KR20217009649 A KR 20217009649A KR 20210107618 A KR20210107618 A KR 20210107618A
Authority
KR
South Korea
Prior art keywords
dna
cys
rna
gly
probe
Prior art date
Application number
KR1020217009649A
Other languages
English (en)
Inventor
스캇 쿠에르스텐
프레드릭 더블유. 하이드
아사코 테츠바야시
Original Assignee
일루미나, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 일루미나, 인코포레이티드 filed Critical 일루미나, 인코포레이티드
Publication of KR20210107618A publication Critical patent/KR20210107618A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1024In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/327RNAse, e.g. RNAseH
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/113Denaturating agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2539/00Reactions characterised by analysis of gene expression or genome comparison
    • C12Q2539/10The purpose being sequence identification by analysis of gene expression or genome comparison characterised by
    • C12Q2539/101Subtraction analysis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 핵산 샘플로부터 원치 않는 RNA 종을 고갈시키는 방법 및 그 물질에 관한 것이다. 특히, 본 발명은 샘플 중의 표적 RNA 분자의 분석, 조작 및 연구를 방해할 수 있는 원치 않는 rRNA, tRNA, mRNA 또는 다른 RNA 종을 제거하는 방법을 기술한다.

Description

뉴클레아제 기반 RNA 고갈
관련 출원의 상호 참조
본 출원은 2018년 12 월 21일자로 출원된 미국 가출원 제62/783,869호 및 2019년 5월 14일자로 출원된 미국 가출원 제62/847,797호의 우선권의 이익을 주장하며, 이들 각각은 목적에 따라 전체적으로 본 명세서에 참고로 포함된다.
서열 목록
본 출원은 전자 포맷의 서열 목록과 함께 제출된다. 서열 목록은 크기가 94,208 바이트로서, 2019년 12월 9일자로 작성된 "2019-12-09_01243-0012-00PCT_Sequence_Listing_ST25.txt"란 명칭의 파일로서 제공되어 있다. 서열 목록의 전자 포맷의 정보는 전체적으로 본 명세서에 참고로 포함된다.
인간 세포 또는 조직에서 채취한 핵산 샘플과 같은 핵산 샘플의 원치 않는 RNA는 해당 샘플의 분석, 즉, 샘플의 유전자 발현 분석, 마이크로어레이 분석 및 시퀀싱과 같은 분석을 복잡하게 할 수 있다. 리보솜 RNA(rRNA)는 세포 내 RNA의 약 95%를 차지하므로, 그 존재는 샘플에서 표적 핵산의 결과를 방해하고 난독화할 수 있는 RNA 종의 일례이거나, 연구자나 진단자가 더 깊이 이해하고자 있는 핵산의 일례이다. 예를 들어, 원치 않는 rRNA 종은 tRNA 또는 mRNA와 같은 샘플에서 관심 RNA 분자를 분석하는 것을 특히 어렵게 만들 수 있다. 이는 특히 고정된 조직, 예를 들어 포르말린으로 고정되고, 이어서 생검의 포르말린 고정 파라핀 포매(FFPE; formalin fixed paraffin embedded) 조직과 같은 왁스에 포매된 조직의 경우에 항상 존재하는 문제이다. FFPE 조직으로부터 rRNA 종을 제거하지 않으면, 이들은 조직 내의 표적 RNA의 측정 및 특성화를 방해할 수 있으며, 이에 의해 질환 및 암 식별, 잠재적 치료 옵션, 및 질환 또는 암 진단 및 예후와 같은 표적 RNA에서 의학적으로 실행 가능한 정보를 도출하는 것을 매우 어렵게 만들 수 있다. FFPE 조직이 일례이지만, rRNA와 동일한 문제는 혈액, 세포 및 다른 유형의 핵산 함유 샘플과 같은 모든 종류의 샘플에 해당된다.
핵산 샘플로부터 원치 않는 RNA를 고갈시키기 위한 현재의 상업적으로 이용가능한 방법에는 미국 특허 제9,745,570호 및 제9,005,891호에 기재된 바와 같은 리보제로(RiboZero)®(에피센터(Epicentre)) 및 NEBNext® rRNA 고갈 키트(NEB) 및 RNA 고갈 방법이 포함된다. 그러나, 이러한 방법은 RNA를 고갈시키는데 유용하지만, 사용 용이성, 높은 샘플 투입 요건, 샘플로부터 원치 않는 RNA를 고갈시키는데 있어서의 기술자의 시간, 비용 및/또는 효율을 비롯한 그 자체의 단점을 갖고 있다. 샘플로부터 원치 않는 RNA 종을 더욱 용이하게 또는 비용 효과적으로 고갈시켜, 드물거나 식별하기 어려운 서열 변화와 같이 숨겨져 있을 수도 있는 표적 RNA의 정보를 밝힐 수 있는 물질 및 방법이 필요하다. 본 명세서에 기재된 바와 같은 간단하고 신뢰성이 높은 방법은 시험 목적을 위해 표적 RNA 분자의 이용가능성을 크게 증가시킬 수 있으므로, 샘플 및 이것이 유래된 유기체에 대해 보유되는 정보를 발견할 수 있다.
진핵생물 또는 원핵생물로부터의 것과 같은 핵산 샘플은 다수의 핵산을 함유하며, 이들 중 다수는 연구자의 흥미를 끌지 않는다. 연구자들은 종종 특정 유형의 핵산, 예컨대 DNA 또는 RNA를 연구하기를 원한다. RNA를 연구할 때, 관심 샘플은 연구 초점인 표적 RNA를 압도하고 숨길 수 있는 다양한 유형의 RNA 종을 포함할 수 있다. 이와 같이, RNA 고갈은 핵산 샘플로부터 원치 않는 RNA 및/또는 DNA 종을 제거하여, 연구용 원하는 RNA가 풍부한 핵산 샘플을 남기는 것을 말한다.
본 발명은 더욱 상세히 연구하기에 앞서, 원치 않는 RNA 종이 과다한 핵산 샘플을 고갈시키기 위한 해결책을 제공한다. 예를 들어, 관심 RNA 샘플은 연구할 표적 RNA를 포함할 뿐만 아니라, 샘플에서 우세하고 관심 표적을 무력하게 할 수 있는 rRNA, 글로빈 mRNA, 바이러스 오염물 또는 임의의 다른 원치 않는 핵산과 같은 풍부한 전사체를 포함하고 있어서, 트랜스크립톰(transcriptome)의 원하는 부분을 정확하게 분석하는 연구자의 능력을 크게 저하시킨다.
따라서, 발현 마이크로어레이 또는 시퀀싱과 같은 분석 전에 핵산 샘플에서 원치 않는 RNA를 고갈시키면, 원하는 RNA 표적에 대한 분석의 특이성 및 정확성을 증가시킨다. 본 발명에서, 특이적 DNA:RNA 하이브리드(hybrid)의 분해를 통한 비표적(off-target) RNA의 고갈은 라이브러리 제조 및 분석 전에 샘플로부터 원치 않는 RNA 종을 효율적으로 제거할 수 있게 한다. 샘플에서 원치 않는 RNA 종이 고갈되면, 잔류 표적 RNA가 cDNA로 전환될 수 있다. 안정한 샘플의 결과로 실행가능한 데이터를 얻으면, 암 예후 및 진단에 대한 잠재적 치료 옵션의 보다 나은 이해, 인간의 마이크로바이옴, 및 인간 및 다른 진핵세포계에서의 그 중요성에 대한 보다 나은 이해, 관심 유전자의 발현 분석에 대한 보다 철저한 이해 등으로 이어질 수 있다.
일 실시형태에서, 본 발명은,
a) 적어도 하나의 RNA 또는 DNA 표적 서열 및 적어도 하나의 비표적 RNA 분자를 포함하는 핵산 샘플을, 적어도 하나의 비표적 RNA 분자의 전장(full length)을 따라 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트와 접촉시켜, DNA 프로브를 비표적 RNA 분자에 하이브리디제이션(hybridization)하여 DNA:RNA 하이브리드를 형성하는 단계 - 여기서, 각각의 DNA:RNA 하이브리드는 임의의 다른 DNA:RNA 하이브리드로부터, 주어진 비표적 RNA 분자 서열을 따라 적어도 5개의 염기에 의해 떨어져 있거나 적어도 10개의 염기에 의해 떨어져 있음 -; 및
b) DNA:RNA 하이브리드를 DNA:RNA 하이브리드로부터 RNA를 분해시키는 리보뉴클레아제와 접촉시켜, 핵산 샘플의 비표적 RNA 분자를 분해하여 분해 혼합물을 형성하는 단계를 포함하는, 핵산 샘플로부터 비표적 RNA 분자를 고갈시키는 방법을 기술하고 있다.
일 실시형태에서, 본 발명은 핵산 샘플 중의 적어도 하나의 비표적 rRNA 분자의 전장을 따라 불연속 서열(예를 들어, 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 있음)에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트를 포함하는 조성물에 관한 것이다. 일부 실시형태에서, 상기 조성물은 또한 DNA:RNA 하이브리드 중의 RNA를 분해할 수 있는 리보뉴클레아제를 포함한다. 다른 실시형태에서, 본 발명은 적어도 하나의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는 프로브 세트를 포함하는 조성물 - 여기서, 각각의 DNA 프로브는 프로브 세트의 임의의 다른 DNA 프로브로부터 비표적 RNA 분자의 길이를 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 하이브리디제이션됨 - 에 관한 것이다.
일 실시형태에서, 본 발명은 핵산 샘플 중의 적어도 하나의 비표적 rRNA 분자의 전장을 따라 불연속 서열(예를 들어, 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 있음)에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트 및 DNA:RNA 하이브리드에서 RNA를 분해할 수 있는 리보뉴클레아제를 포함하는 키트를 설명한다.
일 실시형태에서, 본 발명은 a) 적어도 하나의 RNA 또는 DNA 표적 서열 및 제1 종 유래의 적어도 하나의 비표적 RNA 분자를 포함하는 핵산 샘플을, 제2 종 유래의 적어도 하나의 비표적 RNA 분자의 전장을 따라 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트와 접촉시켜, DNA 프로브를 비표적 RNA 분자에 하이브리디제이션하여 DNA:RNA 하이브리드를 형성하는 단계 - 여기서, 각각의 DNA:RNA 하이브리드는 임의의 다른 DNA:RNA 하이브리드로부터, 주어진 비표적 RNA 분자 서열을 따라 적어도 5개의 염기에 의해 떨어져 있거나 적어도 10개의 염기에 의해 떨어져 있음 -; b) DNA:RNA 하이브리드를 DNA:RNA 하이브리드로부터 RNA를 분해시키는 리보뉴클레아제와 접촉시켜, 핵산 샘플의 비표적 RNA 분자를 분해하여 분해 혼합물을 형성하는 단계; c) 분해 rRNA를 분해 혼합물로부터 분리하는 단계; d) 상기 샘플로부터 잔류 RNA를 시퀀싱하는 단계; e) 제1 종 유래의 비표적 RNA 분자의 존재에 대한 잔류 RNA 서열을 평가하여, 갭 서열 영역을 결정하는 단계; 및 f) 프로브 세트를 하나 이상의 갭 서열 영역에서 불연속 서열에 상보적인 추가의 DNA 프로브로 보충하는 단계를 포함하는, 핵산 샘플로부터 비표적 RNA 핵산 분자를 고갈시키는데 사용되는 프로브 세트를 보충하는 방법을 설명한다.
도 1은 샘플로부터 RNA 종의 고갈을 수행하기 위한 예시적인 워크플로우를 도시한다. 단계 1은 핵산 변성에 이어서, 고갈 DNA 프로브를 추가하고, 프로브를 원치 않는 RNA 종과 하이브리디제이션하여, DNA:RNA 하이브리드를 생성하는 것을 포함한다. 단계 2는 RNase H와 같은 리보뉴클레아제를 사용하여 DNA:RNA 하이브리드로부터 RNA를 분해하는 것을 포함한다. 단계 3은 DNase를 첨가하여 분해 혼합물로부터 잔류 DNA 프로브를 분해하는 것을 포함한다. 단계 4는 샘플 중의 잔류 표적 RNA를 포획하는 단계를 포함하며, 이는 임의로 추가의 조작이 뒤따르며, 결국 원치 않는 RNA 종이 고갈된 샘플이 생성되어, 시퀀싱되거나 마이크로어레이 발현 분석, qPCR 또는 다른 분석 기술에 노출될 수 있다.
도 2a 내지 도 2c는 포름아미드가 rRNA 고갈 워크플로우에 첨가되는 경우의 바실러스 서브틸리스(B. subtilis) 샘플로부터의 rRNA 고갈에 대한 예시적인 데이터를 나타낸다: (2a) 0% 포름아미드, (2b) 25% 포름아미드, (2c) 45% 포름아미드. 각각의 패널에서, X축은 검출된 rRNA 종을 열거하고, Y축은 % 서열 리드(sequence read)를 통한 % 고갈을 나타낸다.
도 3은 다양한 양의 시퀀싱된 샘플(100 ng, 10 ng, 또는 1 ng)을 비교하는 인간 뇌 RNA(HBR) 및 보편적인 인간 RNA(UHR)의 rRNA 고갈된 샘플에 대한 예시적인 차세대 시퀀싱(NGS)서열 데이터를 나타낸다.
도 4는 rRNA 고갈 워크플로우에 첨가된 다양한 농도의 포름아미드(0%, 25%, 45%)를 사용하여 마우스 RNA 및 래트 RNA로부터의 rRNA 고갈 샘플에 대한 예시적인 NGS 서열 데이터를 나타낸다.
도 5는 리보제로® 및 RNase H 효소적 제거 rRNA 고갈 방법을 비교한 저 샘플 입력을 사용하여 다양한 미생물 종으로부터 rRNA를 제거하는 예시적인 데이터를 나타낸다. 모든 샘플 리드-깊이를 정규화하였다. X축은 rRNA 고갈 방법(RZ = 리보제로 또는 ED= RNase H 효소적 고갈 방법)을 나타내며, Y축은 % rRNA 리드를 나타낸다.
도 6은 그래프의 우측에서 rRNA 고갈(없음)이 없는 것과 비교하여, 그래프의 좌측에서 RNase H rRNA 고갈(ED) 후에 바실러스 서브틸리스 및 대장균(E.coli)에 대한 다양한 리드 깊이에서의 예시적인 전사체 검출 데이터를 나타낸다. X축은 시퀀싱 리드(M)를 나타내고, Y축은 검출된 전사체의 수를 나타낸다.
도 7a 및 도 7b는 rRNA 고갈에 대한 개시된 방법의 재현성을 입증하는 유전자 발현 쌍별 선형 회귀 데이터에 대한 예시적인 그래프를 나타낸다. 패널 7a는 2개의 대장균 복제 유전자 발현 수준을 예시하고, 패널 7b는 2개의 바실러스 서브틸리스 복제 유전자 발현 수준을 예시한다. 두 세균형은 RNase H rRNA 고갈 후의 유전자 발현 수준 복제 간에 높은 상관성을 나타낸다.
도 8은 20개의 균주(MSA-2002, 좌측) 및 12개의 균주(MSA-2006, 우측) 혼합 샘플에 대한 예시적인 삼중체 rRNA 리드 데이터를 나타낸다. 혼합 샘플 삼중체는 본 명세서에 기재된 리보제로 방법(RZ) 또는 RNase H(ED) 고갈 방법에 의해 고갈된 rRNA이었다. MSA2002 샘플에 대한 RNA 입력은 10 ng인 반면에, MSA2006에 대한 것은 80 ng이었다. X축은 rRNA 고갈 방법을 나타내며, Y축은 % rRNA 리드를 나타낸다.
도 9는 보편적인 마우스 기준 RNA(UMR) 샘플로부터 마우스 16S rRNA를 고갈시킴에 있어서 마우스 미토콘드리아 12S (mt-Rnr1) 및 16S (mt-Rnr2) rRNA 유전자좌의 시퀀싱 리드 커버리지(도면의 하부) 및 333 DNA 프로브 세트(서열 번호 1 내지 333)의 효과를 보여준다. 정사각형은 333 DNA 프로브 세트와, 50개의 염기쌍 길이에 대하여 90% 매치(match)의 위치 또는 30개의 염기쌍 길이에 대하여 70% 매치의 위치를 나타낸다. 추가의 마우스 및 래트 프로브가 없는 경우, 프로브 커버리지가 없는 갭은 도면의 상부에 나타낸 2개의 복제물(Rep 1 및 Rep2)에 대한 잔류 또는 고갈되지 않은 rRNA의 피크에 상응한다.
시퀀싱을 위해 RNA로부터 핵산 라이브러리를 제작하는 것은 종종 샘플에서 우세하고 관심 RNA 서열을 무력하게 할 수 있는 리보솜 RNA, 글로빈 mRNA, 바이러스 오염물 등과 같은 원치 않는 전사체가 풍부하기 때문에 어렵다. 원치 않는 전사체가 제거되지 않으면, 예후적, 진단 또는 연구 효과가 있는 트랜스크립톰의 분석에 지장을 초래할 수 있다. 따라서, 시퀀싱 또는 다른 다운스트림 애플리케이션과 같은 분석 전에 핵산 샘플에서 원치 않는 RNA를 고갈시키면, 원하는 분석의 특이성과 정확성을 증가시킬 수 있다.
본 발명은 중요한 RNA가 연구될 수 있고, 수많은 원치 않는 RNA 전사체에서 손실되지 않도록 핵산 샘플로부터 원치 않는 RNA 종을 고갈시키는데 유용한 방법 및 물질을 설명한다.
RNA 고갈을 위한 기존의 방법과 비교하여, 개시된 방법은 동등한 성능 지표를 여전히 유지하면서 보다 적은 양의 입력 총 RNA를 이용할 수 있다. 따라서, 개시된 방법은 연구자가 다른 방법으로는 수용할 수 없는 소량의 출발 물질을 보유할 때 사용될 수 있다. 또한, 개시된 방법은 고갈 효율을 손상시키지 않으면서 다양한 상이한 유기체의 원치않는 RNA 종을 동시에 표적화하는 하나의 프로브 풀로 수행될 수 있다. 예를 들어, 본 발명은 원치 않는 RNA의 인간, 박테리아, 바이러스 및/또는 고세균 공급원을 포함하지만 이에 한정되지 않는 RNA 샘플로부터 원치 않는 진핵생물 및 원핵생물의 RNA 종을 동시에 고갈시킬 수 있다.
핵산 샘플 또는 혼합물은 바람직하지 않은(비표적 또는 원치 않는) 핵산과 바람직한(표적) 핵산을 모두 포함하는, RNA 또는 DNA 또는 둘 다를 포함하는 샘플을 지칭한다. 샘플의 DNA 또는 RNA는 변형되지 않거나 변형될 수 있으며, 단일 또는 이중 가닥 DNA 또는 RNA 또는 이의 유도체(예를 들어, DNA 또는 RNA의 일부 영역은 이중 가닥인 반면에, 동시에 DNA 또는 RNA의 다른 영역은 단일 가닥임) 등을 포함하지만 이에 한정되지 않는다. 일반적으로, 핵산 샘플은 모든 변형되지 않은 형태의 핵산뿐만 아니라, 모든 화학적, 효소적 및/또는 대사적으로 변형된 형태의 핵산, 또는 이들의 조합을 포함한다. 핵산 샘플은 원하거나 원치 않는 핵산, 예를 들어 게놈 DNA 또는 전체 세포 RNA 또는 둘 다의 조합을 포함할 수 있다. 원치 않는 핵산은 연구 대상이 아닌 진핵생물로부터의 핵산 및 박테리아, 바이러스, 고세균 종 등으로부터의 오염 핵산을 포함한다. 원하거나 바람직한 핵산은 표적 핵산인 연구의 기초 또는 초점이 되는 핵산이다. 예를 들어, 연구자는 mRNA 발현 분석을 연구하기를 원할 수 있으며, 여기서 rRNA, tRNA 및 DNA는 원치 않는 핵산으로 간주될 것이고, mRNA는 표적 핵산이다. 또한, 전체 RNA의 연구를 원할 수 있는 반면에, rRNA, mRNA 및 DNA는 원치 않거나 바라지 않는 핵산으로 간주될 것이고, 전체 RNA는 표적 핵산으로 간주될 것이다. 원치 않는 RNA는 리보솜 RNA(rRNA), 미토콘드리아 rRNA, 핵 rRNA, mRNA, 예컨대 글로빈 RNA, 또는 트랜스퍼 또는 tRNA, 또는 이들의 혼합물을 포함하지만 이에 한정되지 않는다. 일부 실시형태에서, 비표적 RNA는 rRNA이다. 일부 실시형태에서, 비표적 RNA는 글로빈 mRNA이다.
예를 들어, 핵산 샘플은 원하는 메신저 RNA(mRNA) 또는 전체 RNA를 포함할 수 있는 반면에, 또한 바람직하지 않은 리보솜 RNA(rRNA), 트랜스퍼 RNA(tRNA) 및 아마도 바람직하지 않은 DNA를 포함할 수 있다. 혈액, 조직, 세포, 고정 조직 등과 같은 총 샘플에서 RNA를 추출하기 위한 일반적인 방법은 문헌[Current Protocols for Molecular Biology(John Wiley & Sons)] 및 다수의 분자 생물학 방법 매뉴얼에서 발견되는 바와 같이, 본 기술 분야에 잘 알려져 있다. RNA 분리는 시판 중인 정제 키트, 예를 들어 퀴아젠 알엔이지 미니컬럼(Qiagen RNeasy mini-column), 마스터퓨어 컴플리트 DNA 및 RNA 정제 키트(MasterPure Complete DNA and RNA Purification Kit; 에피센터), 파라핀 블록 RNA 분리 키트(Parrafin Block RNA Isolation Kit)(앰비온(Ambion)), RNA-Stat-60(Tel-Test) 또는 염화세슘 밀도 구배 원심분리에 의해 수행될 수 있다. 현재의 방법은 RNA 고갈에 앞서 RNA가 샘플로부터 어떻게 분리되는지에 의해 제한되지 않는다.
박테리아 rRNA와 인간 rRNA를 표적으로 하는 프로브를 동일한 풀에 혼합하면, 바람직한 전사체의 광범위한 비표적 고갈을 일으킬 것이라는 불신감이 내재한다는 것이다(문헌[Mauro et al., Proc. Natl. Acad. Sci. USA 1997, 94:422-427; Mignone and Pesole, Appl. Bioinformatics 2002, 1:145-54]). 놀랍게도, 개시된 방법을 개발하는 동안 수행된 연구는 원치 않는 RNA 전사체와의 DNA 프로브 하이브리디제이션의 특이성으로 인해 원치 않는 RNA 종이 효율적으로 고갈된 샘플을 생성하기 때문에, 이것이 그러하지 않음을 입증한다. 또한, 포름아미드와 같은 불안정화제(destabilizer)의 첨가는 포름아미드가 존재하지 않는 경우 고갈시키는데 훨씬 더 문제가 있는 것으로 보이는 일부 원치 않는 RNA를 제거하는데 도움이 된다는 것도 밝혀졌다. 포름아미드가 이러한 RNA를 제거하는데 도움이 되는 방법을 이해할 필요는 없지만, 포름아미드는 원치 않는 RNA의 구조적 장벽을 완화시켜 DNA 프로브가 더욱 효율적으로 결합할 수 있는 것으로 여겨진다. 또한, 포름아미드의 첨가는 아마도 예를 들어, 매우 안정한 2차 또는 3차 구조를 갖고, 다른 라이브러리 제조 방법에서는 통상 잘 나타나지 않는 mRNA의 영역을 변성/완화시킴으로써 일부 비표적 전사체의 검출을 개선하는 추가적인 이점을 입증하였다.
핵산 샘플 또는 혼합물
본 발명은 핵산 샘플의 공급원으로 제한되지 않으며, 예를 들어 상기 공급원은 인간, 비인간 영장류, 포유류, 조류, 파충류, 식물, 박테리아, 바이러스를 포함하지만 이에 한정되지 않는 진핵생물 또는 원핵생물, 토양, 물 또는 다른 액체에서 발견되는 핵산 및 기타 환경 샘플에서 유래될 수 있다. 샘플은 세포, 조직, 기관, 환경, 용해물 등으로부터 얻어질 수 있고, 신선, 냉동, 동결건조 및 재구성과 같은 샘플의 모든 상태, 또는 포르말린 고정 파라핀 포매(FFPE) 또는 다른 세포학적 또는 조직학적 샘플 조작이었던 조직 또는 생검 표본으로부터의 고정 샘플에 유래할 수 있다.
RNA 고갈 방법으로부터 이익을 얻을 수 있는 핵산 샘플은 인간, 비인간, 마우스, 래트, 박테리아 등과 같은 모든 종, 진핵생물 또는 원핵생물로부터 유래될 수 있으며, 하나의 샘플에 단일 또는 다수의 종을 포함할 수 있다. 게다가, 본 발명의 고갈 방법은 포르말린을 사용하여 처리되고 파라핀에 포매된 샘플(예를 들어, 포르말린 고정 파라핀 포매, FFPE, 샘플)을 포함하는, 생검 또는 조직 샘플과 같은 신선한 또는 보존된 샘플에 사용될 수 있다. 일부 실시형태에서, 핵산 샘플은 인간 또는 비인간 공급원, 예를 들어 비인간 진핵생물, 박테리아, 바이러스, 식물, 토양 또는 이들의 혼합물로부터 유래된다. 샘플에서 원치 않는 RNA 종이 고갈되면, 나머지의 원하는 표적은 당업자에게 알려진 추가 처리를 위해 cDNA로 전환될 수 있다.
일부 실시형태에서, 핵산 샘플은 인간 또는 비인간 영장류로부터 유래된다. 일부 실시형태에서, 핵산 샘플은 래트 또는 마우스로부터 유래된다. 일부 실시형태에서, 핵산 샘플은 비인간 유래의 핵산을 포함한다. 일부 실시형태에서, 비인간 유래의 핵산은 비인간 진핵생물, 박테리아, 바이러스, 식물, 토양 또는 이들의 혼합물로부터 유래된다.
고갈 방법
이와 같이, 핵산 샘플 중의 원치 않는 또는 바람직하지 않은 RNA는 기술된 방법에 의해 고갈된다. 원치 않는 RNA는 부분적으로 또는 완전히 상보적인 DNA 프로브를 원치 않는 RNA 분자에 하이브리디제이션하여 DNA:RNA 하이브리드로 전환된다. 핵산 프로브를 핵산에 하이브리디제이션하는 방법은 과학 분야에 잘 확립되어 있으며, 프로브가 파트너 서열과 부분적으로 또는 완전히 상보적이든 아니든 간에, DNA 프로브가 샘플의 세척 및 다른 조작 후에 원치 않는 RNA 종에 하이브리디제이션된다는 사실은 본 발명의 방법에서 사용될 수 있는 DNA 프로브를 입증한다. 고갈을 위한 원치 않는 RNA 세트는 임의의 진핵생물, 예를 들어 인간, 마우스, 래트 등으로부터 유래될 수 있으며, 여기서 샘플로부터의 RNA의 고갈은 더 유리한 다운스트림 연구, 예를 들어 시퀀싱(예를 들어, 원치 않는 핵산 종으로부터 더 적은 결과)이 일어날 수 있다. 또한 연구 대상이 RNA인 경우, DNA는 원치 않는 핵산으로 간주될 수 있으며, 이때 DNA는 또한 고갈에 의해 제거될 수 있다.
일 실시형태에서, 본 발명은,
a) 적어도 하나의 RNA 또는 DNA 표적 서열 및 적어도 하나의 비표적 RNA 분자를 포함하는 핵산 샘플을, 적어도 하나의 비표적 RNA 분자의 전장을 따라 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트와 접촉시켜, DNA 프로브를 비표적 RNA 분자에 하이브리디제이션하여 DNA:RNA 하이브리드를 형성하는 단계 - 여기서, 각각의 DNA:RNA 하이브리드는 임의의 다른 DNA:RNA 하이브리드로부터, 주어진 비표적 RNA 분자 서열을 따라 적어도 5개의 염기에 의해 떨어져 있거나 적어도 10개의 염기에 의해 떨어져 있음 -; 및
b) DNA:RNA 하이브리드를 DNA:RNA 하이브리드로부터 RNA를 분해시키는 리보뉴클레아제와 접촉시켜, 핵산 샘플의 비표적 RNA 분자를 분해하여 분해 혼합물을 형성하는 단계를 포함하는, 핵산 샘플로부터 비표적 RNA 분자를 고갈시키는 방법을 기술한다.
일 실시형태에서, RNA 샘플은 DNA 프로브의 존재 하에 변성된다. 예시적인 워크플로우가 도 1에 설명되어 있다. 도 1의 예에서, DNA 프로브를 변성된 RNA 샘플(95℃에서 2분간 변성됨)에 첨가하고, 이에 반응물을 15 내지 30분간 37℃로 냉각시키면, DNA 프로브가 이들 각각의 표적 RNA 서열에 하이브리디제이션되어, DNA:RNA 하이브리드 분자가 생성된다.
일부 실시형태에서, 프로브 세트와 접촉시키는 단계는 핵산 샘플을 불안정화제로 처리하는 단계를 포함한다. 일부 실시형태에서, 불안정화제는 열 또는 핵산 불안정화 화학물질이다. 일부 실시형태에서, 핵산 불안정화 화학물질은 베타인, DMSO, 포름아미드, 글리세롤 또는 이들의 유도체, 또는 이들의 혼합물이다. 일부 실시형태에서, 핵산 불안정화 화학물질은 포름아미드 또는 이의 유도체이며, 임의로 포름아미드 또는 이의 유도체는 총 하이브리디제이션 반응 부피의 약 10 내지 45%의 농도로 존재한다. 일부 실시형태에서, 상기 샘플을 열로 처리하는 단계는 적어도 하나의 DNA:RNA 하이브리드의 용해 온도보다 높은 열을 가하는 단계를 포함한다.
일부 실시형태에서, 포름아미드는 RNA 샘플 공급원(예를 들어, 인간, 마우스, 래트 등)에 관계없이 하이브리디제이션 반응에 첨가된다. 예를 들어, 일부 실시형태에서, DNA 프로브에 하이브리디제이션하는 것은 포름아미드의 적어도 3 부피%, 5 부피%, 10 부피%, 20 부피%, 25 부피%, 30 부피%, 35 부피%, 40 부피% 또는 45 부피%의 존재 하에 수행된다. 일 실시형태에서, RNA 고갈을 위한 하이브리디제이션 반응은 약 25 부피% 내지 45 부피%의 포름아미드를 포함한다.
하이브리디제이션 반응 후에, DNA:RNA 하이브리드부터 RNA를 분해시키는 리보뉴클레아제가 반응물에 첨가된다. 일부 실시형태에서, 리보뉴클레아제는 RNase H 또는 하이브리다아제(Hybridase)이다. RNase H(NEB) 또는 하이브리다아제(루시젠(Lucigen))는 DNA:RNA 하이브리드로부터 RNA를 분해하는 효소의 예이다. RNase H 또는 하이브리다아제와 같은 리보뉴클레아제는 RNA를 소분자로 분해시켜, 제거시킬 수 있다. 예를 들어, RNase H는 약 7 내지 21개의 염기마다 DNA:RNA 하이브리드로부터 RNA를 분해하는 것으로 보고되어 있다(문헌[Schultz et al., J. Biol. Chem. 2006, 281:1943-1955; Champoux and Schultz, FEBS J. 2009, 276:1506-1516]). 일부 실시형태에서, DNA:RNA 하이브리드의 RNA 분해는 도 1, 단계 2 및 실시예 1에 기재된 바와 같이 37℃에서 약 30분간 일어날 수 있다.
일부 실시형태에서, DNA:RNA 하이브리드 분자 분해 후에, 나머지의 DNA 프로브와 핵산 샘플의 모든 비표적 DNA가 분해된다. 따라서, 일부 실시형태에서, 본 방법은 리보뉴클레아제-분해 혼합물을 DNA 분해 효소와 접촉시켜, 혼합물 중 DNA를 분해시키는 단계를 포함한다. 일부 실시형태에서, 분해된 샘플은 DNA 분해 효소, 예를 들어 DNase I에 노출되며, 이는 DNA 프로브를 분해시킨다. DNase DNA 분해 반응물은 예를 들어, 37℃에서 30분간 인큐베이션되며, 그 후 DNase 효소는 DNase를 변성시키는데 필요한 시간 동안, 예를 들어 최대 20분간 75℃에서 변성될 수 있다.
일부 실시형태에서, 고갈 방법은 분해 혼합물로부터 분해된 RNA를 분리하는 단계를 포함한다. 일부 실시형태에서, 분리하는 단계는 예를 들어, 핵산 정제 배지, 예컨대 RNAClean XP 비드(벡크만쿨터(Beckman Coulter))와 같은 RNA 포획 비드를 사용하여 분해된 RNA(및 존재하는 경우. 분해된 DNA)로부터 표적 RNA를 정제하는 단계를 포함한다. 따라서, 일부 실시형태에서, 효소 분해(들) 후에, 표적 RNA는 원하는 더 긴 RNA 표적을 남겨두면서 분해 생성물을 제거함으로써 농축될 수 있다. 적절한 농축 방법은 농축된 RNA 표적, 스핀 컬럼 등의 원하는 단편 크기에 결합하는 자기 비드로 분해 혼합물을 처리하는 단계를 포함한다. 일부 실시형태에서, AMPure XP 비드, SPRISelect 비드, RNAClean XP 비드(벡크만쿨터)와 같은 자기 비드는 상기 비드에 RNase가 없으면(예를 들어, RNase가 없도록 조절된 퀄리티) 사용될 수 있다. 이러한 비드는 핵산 결합에 대한 다양한 크기 선택 옵션을 제공하는데, 예를 들어 RNAClean XP 비드는 100 nt 이상의 핵산 단편을 표적으로 하고, SPRISelect 비드는 150 내지 800 nt 핵산 단편을 표적으로 하며, RNase H 및 DNase의 효소 분해로 인한 분해된 RNA 및 DNA와 같은 보다 짧은 핵산 서열을 표적으로 하지 않는다. mRNA가 연구할 표적 RNA이면, mRNA는 예를 들어, mRNA 아데닐화된 테일(adenylated tail)을 포획하기 위한 올리고 dT 서열을 포함하는 비드를 사용하여 포획에 의해 더욱 농축될 수 있다. mRNA 포획 방법은 당업자에게 잘 알려져 있다.
표적 RNA가 원치 않는 분해 핵산을 포함하는 반응 성분으로부터 정제되면, 추가의 샘플 조작이 일어날 수 있다. 본 발명에서, 실시예 2 및 3은 농축된 표적 총 RNA로부터 cDNA 합성을 위한 예시적인 워크플로우에 이어서, 예를 들어 일루미나(Illumina) 시퀀서 상에서 후속 시퀀싱에 전형적인 예시적인 라이브러리 제조 워크플로우를 제공한다. 그러나, 이러한 워크플로우는 단지 예시적인 것으로 이해되어야 하며, 당업자는 농축된 RNA가 PCR, qPCR, 마이크로어레이 분석 등과 같은 다수의 추가 응용에 직접 사용되거나, 확립되고 충분히 이해된 프로토콜을 사용하여 RNA를 cDNA로 전환시키는 것과 같은 추가 조작 후에 사용될 수 있음을 이해할 것이다.
RNA 고갈에 대해 본 명세서에 기재된 방법은 표적 RNA 분자가 풍부한 샘플을 생성할 것이다. 예를 들어, 본 명세서에 기재된 방법은 원치 않는 RNA 종을 15%, 13%, 11%, 9%, 7%, 5%, 3%, 2% 또는 1% 미만으로 포함하거나, 그 사이의 임의의 범위를 포함하는 고갈된 RNA 샘플을 생성한다. 이때, 농축된 RNA 샘플은 표적 총 RNA의 적어도 99%, 98%, 97%, 95%, 93%, 91%, 89% 또는 87%, 또는 그 사이의 임의의 범위를 포함한다. 샘플이 농축되면, 라이브러리 제조 또는 다른 다운스트림 조작에 사용될 수 있다.
DNA 프로브 세트/DNA 프로브
DNA 프로브는 원치 않는 RNA 종에 대한 서열 상보성을 갖는 단일 가닥 DNA 올리고뉴클레오타이드를 지칭한다. DNA 프로브 서열은 핵산 샘플에서 고갈을 위한 바람직하지 않은 RNA에 부분적으로 또는 완전히 상보적일 수 있다. 고갈을 위한 원치 않는 RNA는 rRNA, tRNA 및 mRNA, 및 이들의 혼합물을 포함하나 이에 한정되지 않는다. 일부 실시형태에서, 각각의 DNA 프로브는 길이가 약 10개 내지 100개의 뉴클레오타이드, 약 20개 내지 80개의 뉴클레오타이드, 약 40 내지 60개의 뉴클레오타이드, 또는 약 50개의 뉴클레오타이드로 되어 있다. DNA 프로브는 원치 않는 RNA 종에 하이브리디제이션될 수 있어서, DNA:RNA 하이브리드 분자를 생성한다. 일부 실시형태에서, 적어도 2개의 DNA 프로브가 특정 비표적 RNA 분자에 하이브리디제이션되지만, DNA 프로브는 원치 않는 RNA 분자 서열의 전장을 커버하지 않는다. 예를 들어, 일부 실시형태에서, 프로브 세트는 프로브 세트의 상보적 DNA 프로브 없이 원치 않는 RNA의 갭 또는 영역을 남긴다. DNA 프로브는 비중첩 방식으로 원치 않는 RNA에 완전히 또는 부분적으로 하이브리디제이션되어, 얻어진 DNA:RNA 하이브리드 사이에 적어도 5, 10, 15, 20, 30, 40, 50, 60, 70, 80개 또는 그 이상의 뉴클레오타이드로 된 갭을 남긴다. 따라서, 일부 실시형태에서, 각각의 DNA 프로브는 프로브 세트 중의 임의의 다른 DNA 프로브로부터, 적어도 하나의 비표적 RNA 분자의 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져서 하이브리디제이션된다. 이와 같이, 원치 않는 RNA는 전체적으로 DNA 프로브에 완전히 하이브리디제이션되지 않는다. 또한, 본 발명은 고갈을 위한 단일 RNA에 하이브리디제이션되는 복수의 DNA 프로브를 제공하는데, 이에 따라 "하나의 RNA에 대한 하나의 DNA 프로브"가 아니라, 대신에 주어진 원치 않는 RNA를 표적으로 하는 프로브 세트 중의 다수의 불연속 DNA 프로브가 존재한다. 예를 들어, 일부 실시형태에서, 고갈을 위한 주어진 RNA 세트의 경우, 각각의 프로브는 길이가 약 20 내지 80개의 뉴클레오타이드로 되어 있고, 각각의 프로브는 세트 중의 다른 DNA 프로브로부터 5 내지 15개의 뉴클레오타이드에 의해 떨어져서 어딘가의 원치 않는 RNA에 하이브리디제이션되는 DNA 프로브 세트가 사용된다. DNA 프로브는 고갈될 RNA 상의 특정 위치에 완전히 또는 부분적으로 상보적일 수 있으며, 예를 들어 DNA 프로브 서열은 고갈될 RNA 전사체 상의 표적 위치에 적어도 80%, 85%, 90%, 95% 또는 100% 상보적이거나, 그 사이의 임의의 범위로 상보적일 수 있다. 상보성에 대한 유일한 제한은 DNA 프로브가 본 명세서에 기재된 바와 같이 효소적으로 분해가능한 DNA:RNA 하이브리드가 생성되는 식으로 고갈되도록 표적 RNA에 하이브리디제이션되어야 한다는 것이다. 일부 경우에, mRNA는 관심 표적이고, 고갈 대상이 아니며, 이 경우에 DNA 프로브는 프로브가 mRNA 종에 하이브리디제이션되지 않도록 폴리T 서열을 포함하지 않는다. 일부 실시형태에서, DNA 프로브는 비오틴, 아비딘, 스트렙타비딘, 또는 물리적 수단으로 하이브리드를 고갈시킬 수있는 자기 비드와 같은 포획 부분을 갖는 태그를 포함하지 않는 반면에, 다른 실시형태에서 DNA 프로브는 비오틴, 아비딘, 스트렙타비딘, 또는 물리적 수단으로 하이브리드를 고갈시킬 수있는 자기 비드와 같은 포획 부분을 갖는 태그를 포함한다.
일부 실시형태에서, 프로브 세트는 인간 및 박테리아 유래의 비표적 RNA 분자에 하이브리디제이션되는 적어도 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 인간, 박테리아 및 고세균 유래의 비표적 RNA 분자에 하이브리디제이션되는 적어도 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 인간, 박테리아, 마우스 및 래트 유래의 비표적 RNA 분자에 하이브리디제이션되는 적어도 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 인간, 박테리아, 마우스, 래트 및 고세균 유래의 비표적 RNA 분자에 하이브리디제이션되는 적어도 DNA 프로브를 포함한다. 일부 실시형태에서, 박테리아 유래의 비표적 RNA 분자는 그람 양성균 또는 그람 음성균, 또는 이들의 혼합물로부터 유래된다. 일부 실시형태에서, 프로브 세트는 고세균 종 유래의 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 고세균 종 유래의 2개 이상의 rRNA 서열에 상보적인 적어도 2개의 DNA 프로브를 포함한다.
일부 실시형태에서, 프로브 세트는 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 및 HBG2로부터 선택되는 적어도 1개 또는 적어도 2개의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 및 HBG2로 이루어진 군으로부터 선택되는 2개 이상의 rRNA 서열에 상보적인 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 인간 유래의 28S, 18S, 5.8S, 5S, 16S 및 12S로부터 선택된 1개 이상 또는 2개 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 임의로 래트 16S, 래트 28S, 마우스 16S 및 마우스 28S, 및 이들의 조합으로부터 선택되는 래트 및/또는 마우스 유래의 하나 이상 또는 2개 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 헤모글로빈 유래의 HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 및 HBG2로부터 선택되는 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 그람 양성균 및/또는 그람 음성균 유래의 23S, 16S 및 5S로부터 선택되는 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함한다. 고갈을 위한 글로빈 mRNA는 HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2를 포함하여 마우스 또는 래트와 같은 설치류에서 발견되는 것과, HBA-A1, HBA-A2, HBB, HGB1 및 HGB2를 포함하여 인간에서 발견되는 것들을 포함할 수 있지만 이에 한정되지 않는다. 고갈에 적합한 미토콘드리아 rRNA는 18S 및 12S(인간 및 설치류)를 포함한다. 고갈에 적합한 핵 rRNA는 28S, 18S, 5.8S 및 5S(인간 및 설치류)와, 5S, 16S 및 23S를 비롯한 원핵생물 rRNA를 포함한다. 일부 샘플에서, rRNA 23S, 16S 또는 5S와 같은 고세균 종 유래의 rRNA의 고갈이 또한 요구될 수 있다. 추가의 실시형태에서, 프로브 세트는 그람 양성균 또는 그람 음성균 rRNA 5S, 16S 및 23S로 이루어진 군으로부터 선택되는 2개 이상의 rRNA 서열에 상보적인 적어도 2개의 DNA 프로브를 포함한다. 일부 실시형태에서, 프로브 세트는 인간 28S, 18S, 5.8S, 5S, 16S 및 12S, 글로빈 mRNA HBA-A1, HBA-A2, HBB, HBG1 및 HBG2, 및 그람 양성균 또는 그람 음성균 rRNA 5S, 16S 및 23S의 각각에 상보적인 적어도 2개(또는 적어도 5개, 적어도 10개 또는 적어도 20개)의 DNA 프로브를 포함한다. 일부 실시형태에서, 특정 비표적 RNA 분자에 대한 프로브는 상기 비표적 RNA 분자 서열의 약 80 내지 85%에 상보적이며, 각각의 프로브 하이브리디제이션 부위 사이에 적어도 5개 또는 적어도 10개의 염기로 된 갭이 존재한다.
일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 333(인간, 그람 양성균 및 그람 음성균)으로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상 또는 333개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 428(인간, 그람 양성균, 그람 음성균, 고세균, 마우스 및 래트)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상, 400개 이상 또는 428개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 377(인간, 그람 양성균, 그람 음성균 및 고세균)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 377개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 333(인간, 그람 양성균 및 그람 음성균) 및 서열 번호 378 내지 428(마우스 및 래트)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 384개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 334 내지 377(고세균)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상 또는 44개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 378 내지 428(마우스 및 래트)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상 또는 51개의 서열을 포함한다.
일부 실시형태에서, DNA 프로브는 부분적으로 또는 완전히 상보적이며, 인간 28S, 18S, 5.8S 및/또는 5S rRNA에 하이브리디제이션되는 서열, 예를 들어 표 1의 서열 번호 40 내지 서열 번호 150에 나타낸 DNA 프로브 서열을 포함한다. 또 하나의 실시형태에 있어서, DNA 프로브는 미토콘드리아 rRNA 16S 및/또는 12S에 하이브리디제이션되는 서열, 예를 들어 표 1의 서열 번호 1 내지 서열 번호 39에 나타낸 DNA 프로브 서열을 포함한다. 다른 실시형태에서, DNA 프로브는 HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 및/또는 HBG2를 포함한 헤모글로빈 mRNA에 하이브리디제이션되는 서열, 예를 들어 표 1의 서열 번호 151 내지 서열 번호 194에 나타낸 DNA 프로브 서열을 포함한다. 일부 실시형태에서, DNA 프로브는 그람 양성균 및/또는 그람 음성균 rRNA 23S, 16S 및/또는 5S와 같은 박테리아 rRNA에 하이브리디제이션되는 서열, 예를 들어 표 1의 서열 번호 195 내지 서열 번호 262(그람 음성균을 대표하는 대장균) 및 서열 번호 263 내지 서열 번호 333(그람 양성균을 대표하는 바실러스 서브틸리스)에 나타낸 DNA 프로브 서열을 포함한다. 다른 실시형태에서, DNA 프로브는 rRNA 23S, 16S 및/또는 5S와 같은 고세균 rRNA에 하이브리디제이션되는 서열, 예를 들어 고세균 종, 메타노브레비박테르 스미티이(Methanobrevibacter smithii) 유래의 rRNA에 하이브리디제이션되는 표 1의 서열 번호 334 내지 서열 번호 384에 나타낸 DNA 프로브 서열을 포함한다. 일부 실시형태에서, DNA 프로브는 마우스 16S 및/또는 28S와 같은 마우스 rRNA에 하이브리디제이션되는 서열, 예를 들어 표 1의 서열 번호 385 내지 서열 번호 393, 및 서열 번호 400 내지 서열 번호 419에 나타낸 DNA 프로브 서열을 포함한다. 일부 실시형태에서, DNA 프로브는 래트 16S 및/또는 28S와 같은 래트 rRNA에 하이브리디제이션되는 서열, 예를 들어 표 1의 서열 번호 394 내지 서열 번호 399, 및 서열 번호 420 내지 서열 번호 428에 나타낸 DNA 프로브 서열을 포함한다.
[표 1]
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
일 실시형태에서, RNA 샘플은 인간으로부터 유래하고, DNA 프로브 세트는 본 명세서에 기재된 바와 같은 인간의 원치 않는 RNA 종, 예컨대 rRNA 및 미토콘드리아 mRNA 전사체에 특이적인 프로브를 포함한다. 다른 실시형태에서, 인간 RNA 샘플로부터 원치 않는 RNA를 고갈시키기 위한 DNA 프로브 세트는 본 명세서에 기재된 바와 같은 인간 rRNA 및 미토콘드리아 mRNA 전사체에 특이적인 프로브, 및 그람 양성균 및 그람 음성균의 원치 않는 RNA 전사체에 특이적인 프로브를 포함한다. 추가의 실시형태에서, 인간 RNA 샘플로부터 원치 않는 RNA를 고갈시키기 위한 DNA 프로브 세트는 고세균 종에 특이적인 프로브를 포함하며, 고세균 종의 예로는 본 명세서에 기재된 바와 같은 메타노브레비박테르 스미티이이다. 이와 같이, 일부 실시형태에서, 인간 RNA 샘플로부터 rRNA를 고갈시키기 위한 DNA 프로브 세트는 인간의 원치 않는 RNA 종에 관한 프로브 만을 포함하거나, 비인간의 원치 않는 RNA 전사체를 표적으로 하는 혼합 DNA 프로브 세트를 포함한다. 당업자는 RNA 고갈에 사용되는 프로브 세트가 샘플에 대한 연구 의도, 샘플이 채취되었던 환경 및 RNA 샘플의 RNA 고갈을 위한 실험 계획으로 이어지는 임의의 다른 인자에 따라 달라진다는 것을 이해할 것이다.
일 실시형태에서, RNA 샘플은 비인간 진핵생물로부터 유래되며, DNA 프로브 세트는 진핵생물 공급원 샘플 중의 원치 않는 RNA에 특이적인 프로브를 포함한다. 예를 들어, RNA 샘플이 마우스 또는 래트로부터 유래되는 경우, DNA 프로브 세트는 마우스 또는 래트의 원치 않는 RNA 종에 특이적인 프로브를 포함할 것이며, 또한 원치 않는 그람 양성균 및 그람 음성균 RNA 종, 또는 다른 세균종, 예컨대 고세균 종에 특이적인 DNA 프로브도 포함할 수 있다.
일부 실시형태에서, DNA 프로 브는 고갈될 RNA 종의 전체 연속 길이에 하이브리디제이션되지 않는다. 놀랍게도, 고갈을 표적으로 하는 RNA 종의 전장 서열이 전장 DNA 프로브, 또는 전체 RNA 서열에 걸쳐 연속적으로 타일링(tiling)하는 프로브 세트로 표적화될 필요가 없다는 것이 실험 중에 밝혀졌으며; 실제로, 본 명세서에 기재된 DNA 프로브는 형성된 DNA:RNA 하이브리드가 연속적이지 않도록 갭을 남긴다. 놀랍게도, DNA:RNA 하이브리드 사이의 적어도 5 nt, 10 nt, 15 nt 또는 20 nt의 갭은 효율적인 RNA 고갈을 제공하였다. 또한, 갭을 포함하는 프로브 세트는 원치 않는 RNA에 보다 효율적으로 하이브리디제이션될 수 있는데, 그 이유는 DNA 프로브가 고갈을 위해 표적화된 전체 RNA 서열을 커버하는 프로브 또는 서로 중첩하는 프로브에 의해 잠재적으로 발생할 수 있는 인접한 프로브의 하이브리디제이션을 방해하지 않기 때문이다.
또한, 프로브 세트는 주어진 종에 대한 RNA 고갈 방법을 개선하도록 보충될 수 있다. 핵산 샘플로부터 비표적 RNA 핵산 분자를 고갈시키는데 사용되는 프로브 세트를 보충하는 방법은 a) 적어도 하나의 RNA 또는 DNA 표적 서열 및 제1 종 유래의 적어도 하나의 비표적 RNA 분자를 포함하는 핵산 샘플을, 제2 종 유래의 적어도 하나의 비표적 RNA 분자의 전장을 따라 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트와 접촉시켜, DNA 프로브를 비표적 RNA 분자에 하이브리디제이션하여 DNA:RNA 하이브리드를 형성하는 단계 - 여기서, 각각의 DNA:RNA 하이브리드는 임의의 다른 DNA:RNA 하이브리드로부터, 주어진 비표적 RNA 분자 서열을 따라 적어도 5개의 염기에 의해 떨어져 있거나 적어도 10개의 염기에 의해 떨어져 있음 -; b) DNA:RNA 하이브리드를 DNA:RNA 하이브리드로부터 RNA를 분해시키는 리보뉴클레아제와 접촉시켜, 핵산 샘플의 비표적 RNA 분자를 분해하여 분해 혼합물을 형성하는 단계; c) 분해된 RNA를 샘플로부터 분리하는 단계; d) 상기 샘플로부터 잔류 RNA를 시퀀싱하는 단계; e) 제1 종 유래의 비표적 RNA 분자의 존재에 대한 잔류 RNA 서열을 평가하여, 갭 서열 영역을 결정하는 단계; 및 f) 프로브 세트를 하나 이상의 갭 서열 영역에서 불연속 서열에 상보적인 적어도 하나의 DNA 프로브로 보충하는 단계를 포함할 수 있다. 일부 실시형태에서, 갭 서열 영역은 50개 이상, 60개 이상 또는 70개 이상의 염기쌍을 포함한다. 일부 실시형태에서, 제1 종은 비인간 종이고, 제2 종은 인간이다. 일부 실시형태에서, 제1 종은 래트 또는 마우스이다. 마우스 샘플에서 비표적 rRNA 핵산 분자의 고갈을 개선하기 위한 프로브 세트를 보충하는 예시적인 방법은 실시예 8 및 도 9에 요약되어 있다.
일부 실시형태에서, 제1 종은 비인간 종이고, 제2 종은 인간이다. 일부 실시형태에서, 제1 종은 래트 또는 마우스이다. 일부 실시형태에서, 제2 종은 인간, 그람 양성균, 그람 음성균, 또는 이들의 혼합물이다.
조성물 및 키트
일 실시형태에서, 본 발명은 본 명세서에 기재된 바와 같은 프로브 세트를 포함하는 조성물에 관한 것이다. 일부 실시형태에서, 상기 조성물은 프로브 세트, 및 DNA:RNA 하이브리드 중의 RNA를 분해할 수 있는 리보뉴클레아제, 예컨대 RNase H 또는 하이브리다아제를 포함한다. 일부 실시형태에서, 프로브 세트는 핵산 샘플 중의 적어도 하나의 비표적 rRNA 분자에 상보적인 적어도 2개의 DNA 프로브를 포함하며, 상기 프로브는 중첩되지 않고, 상기 비표적 rRNA 분자의 길이에 대해 불연속적이다(예를 들어, 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 있음). 일부 실시형태에서, 본 조성물은 적어도 하나의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는 프로브 세트를 포함하며, 각각의 DNA 프로브는 프로브 세트의 임의의 다른 DNA 프로브로부터 비표적 RNA 분자의 길이를 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 하이브리디제이션된다. 일부 실시형태에서, 본 조성물은 핵산 불안정화 화학물질, 예컨대 포름아미드, 베타인, DMSO, 글리세롤 또는 이들의 유도체, 또는 혼합물을 포함한다. 일 실시형태에서, 핵산 불안정화 화학물질은 하이브리디제이션 총 반응 부피의 10 내지 45%의 농도로 존재하는 포름아미드 또는 이의 유도체이다.
일 실시형태에서, 본 발명은 핵산 샘플 중의 적어도 하나의 비표적 rRNA 분자의 전장을 따라 불연속 서열(예를 들어, 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 있음)에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트 및 DNA:RNA 하이브리드에서 RNA를 분해할 수 있는 리보뉴클레아제를 포함하는 키트를 설명한다. 일부 실시형태에서, 프로브 세트는 본 명세서에 기재된 DNA 프로브 중 임의의 것 또는 이들의 임의의 조합을 포함한다.
일부 실시형태에서, 키트는 완충액 및 핵산 정제 배지를 포함한다. 일부 실시형태에서, 키트는 완충액, 핵산 정제 배지 및 본 명세서에 기재된 바와 같은 DNA 프로브 세트 중 하나 이상을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 333 중 2개 이상의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 428 중 2개 이상의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 377(인간, 그람 양성균, 그람 음성균 및 고세균)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 377개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 1 내지 333 및 서열 번호 378 내지 428(인간, 그람 양성균, 그람 음성균, 마우스 및 래트)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 384개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 334 내지 377(고세균)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상 또는 44개의 서열을 포함한다. 일부 실시형태에서, 프로브 세트는 서열 번호 378 내지 428(마우스 및 래트)로부터 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상 또는 51개의 서열을 포함한다.
일부 실시형태에서, 키트는 1) 본 명세서에 기재된 바와 같은 프로브 세트; 2) 리보뉴클레아제; 3) DNase; 및 4) RNA 정제 비드를 포함한다. 일부 실시형태에서, 키트는 RNA 고갈 완충액, 프로브 고갈 완충액 및 프로브 제거 완충액을 포함한다.
고갈된 샘플의 분석
개시된 방법은 또한 단일 또는 혼합 샘플로부터의 트랜스크립톰을 분석하는데 있어서의 유용성을 발견한다. 트랜스크립톰 분석은 리보솜 RNA의 높은 상대 존재도(relative abundance)에 의해 방해될 수 있으며, 예를 들어 샘플은 세균 세포로부터의 총 RNA에서 rRNA 분자의 85% 이상을 포함할 수 있다. 시퀀싱 또는 다른 분석 시약에 대해 경쟁하는 이러한 많은 양의 rRNA로 인해, 원치 않는 rRNA 분석의 배경에서 손실될 수 있는 트랜스크립톰의 보다 유익한 부분에 초점을 맞추는 것이 어려울 수 있다. 개시된 방법은 예를 들어, DNA의 저 투입량으로, 미생물 또는 진핵생물 분리주의 풍부한 트랜스크립톰 분석을 용이하게 할 수 있어서, rRNA 시퀀싱 리드를 감소시키고, 보다 낮은 시퀀싱 비용을 가능하게 하고, 낮은 바이오매스 샘플의 메타트랜스크립톰 분석(metatranscriptomic analysis)을 가능하게 한다. 이것은 실시예 4에 예시되며, 여기서 혼합 샘플로부터의 저 투입량(<80 ng)을 본 발명에 기재된 RNase H rRNA 고갈 방법을 사용하여 평가하였다. 본 명세서에 기재된 방법은 RT-PCR, 이어서 마이크로어레이 분석, PCR, qPCR 등에서 농축 샘플을 사용하여, 핵산 시퀀싱 기술용 라이브러리의 제작과 같은 다양한 다운스트림 애플리케이션과 함께 사용될 수 있다. 그러나, 본 명세서에 기재된 RNA 고갈 방법으로 생성되는 농축 RNA 샘플이 시퀀싱과 같은 임의의 특정 다운스트림 애플리케이션에 한정되지 않음을 이해해야 한다.
일례로서, RNA 고갈된 샘플을 사용하여 시퀀싱 라이브러리를 제작할 수 있어서, 제작된 라이브러리가 어레이 내의 고정 위치에 부착될 수 있으므로, 이들의 상대 위치가 변화하지 않고 어레이가 반복적으로 이미징된다. 예를 들어, 하나의 뉴클레오타이드 염기 유형을 다른 것과 식별하는데 사용되는 다른 라벨과 일치하는 다른 색상 채널에서 이미지가 획득되는 실시형태가 특히 적용가능하다. 일부 실시형태에서, 표적 핵산의 뉴클레오타이드 서열을 결정하는 방법은 자동화 방법일 수 있다. 바람직한 실시형태는 합성을 통한 시퀀싱(sequencing-by-synthesis, "SBS") 기술을 포함한다.
SBS 기술은 일반적으로 주형 가닥에 대한 뉴클레오타이드의 반복적 부가를 통한 초기 핵산 가닥의 효소적 연장을 수반한다. 기존의 SBS 방법에서, 단일 뉴클레오타이드 단량체가 각각의 전달에서 폴리머라제의 존재 하에 표적 뉴클레오타이드에 제공될 수 있다. SBS는 터미네이터 부분(terminator moiety)을 갖는 뉴클레오타이드 단량체 또는 임의의 터미네이터 부분이 없는 뉴클레오타이드 단량체를 이용할 수 있다. 터미네이터가 없는 뉴클레오타이드 단량체를 이용하는 방법은 예를 들어, γ-포스페이트 표지 뉴클레오타이드를 사용한 파이로시퀀싱(pyrosequencing) 및 시퀀싱을 포함한다. 터미네이터가 없는 뉴클레오타이드 단량체를 사용하는 방법에서, 각각의 사이클에서 첨가되는 뉴클레오타이드의 수는 일반적으로 가변적이며, 주형 서열 및 뉴클레오타이드 전달 방식에 따라 달라진다. 터미네이터 부분을 갖는 뉴클레오타이드 단량체를 이용하는 SBS 기술에서, 터미네이터는 디데옥시뉴클레오타이드를 이용하는 기존의 생어(Sanger) 시퀀싱의 경우와 같이, 사용된 시퀀싱 조건 하에서 실질적으로 비가역적일 수 있거나, 터미네이터는 솔렉사(Solexa)(현재, 일루미나 인코포레이타이드)에 의해 개발된 시퀀싱 방법의 경우와 같이 가역적일 수 있다.
RNA 고갈 워크플로우 및 RNA 농축 샘플을 이용할 수 있는 시퀀싱 방법은 예를 들어, 절단가능하거나 광표백가능한 염료를 함유하는 가역적 터미네이터 뉴클레오타이드의 단계적 부가에 의해 달성되는 사이클 시퀀싱을 포함하지만, 이에 한정되지 않는다. 본 명세서에 기재된 방법을 이용할 수 있는 일루미나 기기의 예로는 HiSeq™, MiSeq™, NextSe™, NovaSeq™, NextSeq™ 및 iSeq™ 시판용 기기를 포함한다.
추가의 시퀀싱 기술은 라이게이션을 통한 시퀀싱(sequencing by ligation)을 포함한다. 이러한 기술은 DNA 리가아제를 사용하여 올리고뉴클레오타이드를 혼입하고 이러한 올리고뉴클레오타이드의 혼입을 확인한다.
또한, 나노포어 시퀀싱은 또한 라이브러리 제조를 위해 개시된 RNA 고갈된 샘플을 사용할 수 있다. 나노포어 시퀀싱 방법은 포어를 통과하는 핵산 가닥을 시퀀싱하는데, 여기서 포어를 통한 전류 변화는 뉴클레오타이드가 포어를 통과하고 있다는 특징을 나타낸다.
또한, DNA 폴리머라제 활성의 실시간 모니터링을 이용한 시퀀싱은 RNA 고갈된 샘플을 이용할 수 있다.
본 명세서에 기재된 RNA 고갈된 샘플을 사용하여 시퀀싱을 위한 라이브러리를 제작할 수 있는 추가의 SBS 기술은 뉴클레오타이드를 연장 산물(extension product)에 혼입할 때에 방출되는 프로톤의 검출을 포함한다. 예를 들어, 방출된 프로톤의 검출에 기초한 시퀀싱은 전기적 검출기 및 아이온 토렌트(Ion Torrent; 미국 코네티컷주 길포드 소재, 라이프 테크놀로지스(Life Technologies)의 자회사)로부터 시판되고 있는 관련 기술을 사용할 수 있다.
본 명세서에 기재된 RNA 고갈 후의 농축 샘플을 이용할 수 있는 추가의 다운스트림 애플리케이션은 PCR, qPCR, 마이크로어레이 분석 등을 포함한다. 예를 들어, 마이크로어레이 분석은 유전자 발현을 연구하기 위한 유력한 기술이다. 농축 샘플은 당업자에게 공지된 방법(예를 들어, 역전사 효소 폴리머라제 연쇄반응(RT-PCR))을 따라 농축된 RNA를 cDNA로 전환시켜 마이크로어레이 분석에서 사용될 수 있다. 이어서, cDNA를 기질에 고정하고, 마이크로어레이 프로브를 적용하여, 발현 분석을 다수의 마이크로어레이 분석 방법(예를 들어, 애질런트(Agilent), 아피메트릭스(Affymetrix), 일루미나 등이 판매하는 시판용 마이크로어레이 분석 시스템)에 따라 결정할 수도 있다. 폴리머라제 연쇄반응(PCR) 또는 정량 PCR(qPCR)은 또한 확립된 기술(분자 생물학을 위한 현재의 프로토콜(Current Protocols for Molecular Biology))에 따라 농축 샘플을 기질로서 이용할 수도 있다.
이와 같이, 본 명세서에 기재된 방법에 의해 생성된 RNA 고갈된 샘플은 다운스트림 분석 방법에 이용될 수 있는 시퀀싱 라이브러리, 증폭 산물 등을 생성하는데 사용될 수 있다. 개시된 방법은 임의의 다운스트림 애플리케이션에 의해 제한되지 않는다.
실시예
하기 실시예는 단지 예시적이며, 본 출원의 범주를 제한하고자 하는 것은 아니다. 변형은 당업자에 의해 명백하고 이해될 것이며, 본 출원의 사상 및 개시내용에 포함된다.
실시예 1-샘플로부터의 원치 않는 RNA 종의 고갈
본 실시예에서, 총 RNA는 샘플의 표적 핵산이고, RNA 고갈은 4개의 주요 단계를 포함한다: 1) 하이브리디제이션, 2) RNase H 처리, 3) DNase 처리 및 4) 표적 RNA 클린업.
하이브리디제이션은 규정된 DNA 프로브 세트를 샘플의 변성 RNA에 어닐링하여 행해진다. 10 내지 100 ng의 RNA 샘플을 1 μL의 1 μM/올리고 DNA 올리고 프로브 세트(표 1에 열거된 바와 같이, 서열 번호 1 내지 333에 상응하는 프로브), 3 μL의 5X 하이브리디제이션 완충액(500 mM 트리스(Tris) HCl pH 7.5 및 1000 mM KCl), 2.5 μL의 100% 포름아미드 및 15 μL의 총 반응 부피를 위한 충분한 물을 포함하는 튜브에서 인큐베이션한다. 하이브리디제이션 반응물을 95℃에서 2분간 인큐베이션하여 핵산을 변성시키고, 온도를 0.1℃/sec로 감소시켜 37℃로 서서히 냉각시켜, 37℃에서 유지한다. 반응물이 37℃에 도달하면, 인큐베이션 시간은 필요하지 않았다. 변성을 위해 37℃에 도달하는데 걸리는 총 시간은 약 15분이다.
하이브리디제이션 후에, DNA:RNA 듀플렉스로부터 원치 않는 RNA 종의 RNase H 제거를 위해 하기 성분을 반응 튜브에 첨가한다; 4 μL 5X RNase H 완충액(100 mM 트리스 pH 7.5, 5 mM DTT, 4 0 mM MgCl2) 및 1 μL RNase H 효소. 효소 반응물을 37℃에서 30분간 인큐베이션한다. 반응 튜브를 얼음 상에 유지할 수 있다.
DNA: RNA 하이브리드에서 RNA를 제거한 후에, DNA 프로브가 분해된다. 20 μL 반응 튜브에, 하기 성분들을 첨가하여 30 μL의 총 부피가 되게 한다: 3 μL 10X 터보(Turbo) DNase 완충액(200 mM 트리스 pH 7.5, 50 mM CaCl2, 20 mM MgCl2), 1.5 μL 터보 DNase(서모 피셔 사이언티픽(Thermo Fisher Scientific)) 및 5.5 μL H2O. 효소 반응물을 37℃에서 30분간, 이어서 75℃에서 15분간 인큐베이션한다. 75℃ 인큐베이션은 다운스트림 처리에서 사용하기 위해 표적 총 RNA를 원하는 삽입물 크기로 단편화하는 역할을 할 수 있으며, 본 예에서 표적 삽입물 크기는 총 RNA의 약 200 nt이다. 이러한 인큐베이션 단계의 타이밍은 당업자에게 알려진 바와 같이 후속 반응에 필요한 삽입물 크기에 따라 조정될 수 있다. 인큐베이션 후에, 반응 튜브를 얼음 상에 유지할 수 있다.
프로브를 원치 않는 RNA에 하이브리디제이션하여, RNA를 제거하고, DNA를 제거한 후에, 샘플의 표적 총 RNA를 반응 조건에서 분리할 수 있다. 반응 튜브를 4℃에서 취해, 실온이 되게 하고, 60 μL의 RNAClean XP 비드(벡크만쿨터)를 첨가하여, 반응 튜브를 5분간 인큐베이션하였다. 인큐베이션 후에, 튜브를 5분간 자석 위에 놓은 후에, 상청액을 조심스럽게 제거하여 폐기한다. 여전히 자석 위에 있는 동안에, 총 RNA가 부착된 비드를 175 μL의 새로운 80% EtOH로 2회 세척한다. 두 번째 세척 후에, 비드를 마이크로원심분리기에서 스핀 다운하여, 튜브 바닥의 비드를 펠릿화하고, 튜브를 자석 위에 다시 놓고 EtOH를 제거하는데, 비드를 건드리지 않으면서 가능한 한 많은 잔류 EtOH를 제거하도록 조심한다. 비드를 몇 분간 공기 건조시키고, 9.5 μL의 ELB 완충액(일루미나)에 재현탁시켜, 실온에서 몇 분간 더 정치시키고, 자석 위에 다시 놓고 비드를 수집한다. 8.5 μL의 상청액을 새로운 튜브에 옮기고, 표적 총 RNA로부터 cDNA를 생성시키는 것과 같은 추가의 다운스트림 처리를 위해 얼음 위에 놓는다.
다른 예에서, 100 ng의 총 RNA를 96-웰 PCR 플레이트의 각각의 웰에서 11 μL의 뉴클레아제 비함유 초순수로 희석한다. 각각의 웰에 하이브리디제이션 완충액 중의 4 μL의 DNA 프로브(서열 번호 1 내지 333)를 첨가하고, 웰 내용물을 혼합하여, 임의로 원심분리한다. 플레이트를 2분간 95℃로 가열한 다음에, 온도가 37℃에 도달할 때까지 온도를 0.1℃/sec로 감소시키고, 이어서 37℃로 유지하여, 프로브를 하이브리디제이션한다. 플레이트를 10초간 280 × g로 원심분리한다. DNA:RNA 하이브리드를 분해하기 위해, 각각의 웰에 완충액 중의 5 μL의 RNase를 첨가하여, 웰 내용물을 혼합한다. 플레이트를 15분간 37℃로 가열한 다음에, 4℃로 유지한다. 각각의 웰에 완충액 중의 10 μL의 RNase를 첨가하여, 웰 내용물을 혼합한다. 플레이트를 15분간 37℃로 가열한 다음에, 4℃로 유지한다. 샘플 플레이트를 10초간 280 × g로 원심분리한다. 각각의 웰에 60 μL의 RNAClean XP 비드를 첨가하여, 웰 내용물을 혼합한다. 플레이트를 실온에서 5분간 인큐베이션한다. 상청액이 투명해질 때까지(약 5분) 플레이트를 자기 스탠드 상에 둔다. 각각 웰의 상청액을 제거하여 폐기한다. 비드를 80% 에탄올로 2회 세척한다. 잔류 에탄올을 각각의 웰로부터 제거하고, 플레이트를 자기 스탠드 상에서 1분간 공기 건조시킨다. 각각의 웰에 10.5 μL의 용출 완충액을 첨가하여, 웰 내용물을 혼합하고, 플레이트를 실온에서 2분간 인큐베이션한다. 플레이트를 밀봉하여, 10초간 280 × g로 원심분리한다. 상청액이 투명해질 때까지(약 2분), 플레이트를 자기 스탠드 상에 둔다. 각각의 웰로부터, 8.5 μL의 상청액을 새로운 플레이트의 해당 웰에 옮긴다.
실시예 2-cDNA 합성
실시예 1의 RNA의 추가 처리는 예를 들어, NGS에 의해 시퀀싱될 수 있는 RNA 표적 핵산으로부터 라이브러리 제제를 제조하는 것일 수 있다. 실시예 1의 최종 반응물 8.5 μL에, 8.5 μL의 엘루트, 프라임 하이 컨센트레이션 랜덤 헥사머 믹스 완충액(Elute, Prime High Concentration Random Hexamer Mix buffer; EPH 완충액, TruSeq Stranded Total RNA Kit, 일루미나)을 첨가하여 17 μL의 총 부피가 되게 한다. 샘플을 65℃에서 2분간 인큐베이션하여, 핵산을 변성시킨다. 변성 후에, 반응 튜브를 얼음 상에 유지할 수 있다. 제1 가닥 합성은 8 μL의 역전사 효소 혼합액(9 μL의 제1 스트랜드 합성 믹스(First Strand Synthesis Mix; FSA, TruSeq Stranded Total RNA Kit, 일루미나) 및 1 μL 프로토스크립트(Protoscript) II RT(NEB))을 변성된 샘플에 첨가하여 25 μL의 총 부피가 되도록 수행된다. 반응 믹스를 하기 조건 하에 가열 리드 서모사이클러(heated lid thermocycler)에서 인큐베이션한다: 25℃에서 5분간, 42℃에서 25분간, 70℃에서 15분간 인큐베이션한다. 일단 제1 가닥 합성 반응이 완료되면, 반응 튜브를 얼음 상에 유지할 수 있다.
제2 가닥 cDNA 합성은 5 μL의 재현탁 완충액(RSB, TruSeq Stranded Total RNA Kit, 일루미나) 및 20 μL 제2 스트랜드 마킹 믹스(Second Strand Marking Mix; SSM 완충액, TruSeq Stranded Total RNA Kit, 일루미나)를 얼음으로 냉각된 샘플에 첨가하여 수행할 수 있다. 반응 튜브를 16℃에서 60분간 인큐베이션하고, 이어서 샘플을 얼음 상에 유지할 수 있다.
cDNA 합성 단계 후에, cDNA를 클린업하고, 예를 들어 90 μL의 SPB(일루미나)를 반응 튜브에 첨가하여, 실온에서 5분간 인큐베이션함으로써 반응 성분으로부터 분리할 수 있다. 인큐베이션 후에, 튜브를 약 8분간 자석 위에 두어 상자성 비드를 수집하고, 상청액을 조심스럽게 제거하여 폐기한다. 여전히 자석 위에 있는 동안에, 비드를 175 μL의 새로운 80% EtOH로 2회 세척한다. 세척 후에, 비드를 튜브 바닥으로 원심분리하고, 튜브를 자석 위에 다시 놓고, EtOH를 조심스럽게 제거하여 폐기한다. 비드를 몇 분간 건조시켜, 18.5 μL RSB에 재현탁시키고, 잘 혼합하여, 실온에서 약 5분간 인큐베이션한 후에, 자석 위에 다시 두었다. 다운스트림 애플리케이션에 따라, 원하는 양의 정제된 cDNA를 새로운 튜브로 제거할 수 있다. 본 실시예에서, 다운스트림 시퀀싱을 위한 라이브러리 제제를 조제하여, 17.5 μL의 상청액을 얼음 위에 유지될 수 있는 새로운 튜브로 옮긴다.
실시예 3-차세대 시퀀싱을 위한 라이브러리 제조
시퀀싱 라이브러리를 제조하는 한 가지 방법은 시퀀싱 전에, cDNA 단편의 A-테일링(tailing), 어댑터(adaptor)의 라이게이팅(ligating), 표적 단편의 증폭 및 얻어진 단편의 정량화를 포함한다.
실시예 2의 17.5 μL의 정제된 cDNA를 포함하는 튜브를 처리에 사용한다. 단편을 A-테일링하기 위해 정제된 cDNA에 12.5 μL의 ATL(일루미나)을 첨가한다. 반응 튜브를 37℃에서 30분간 인큐베이션한 다음에, 70℃에서 5분간 인큐베이션하여, 튜브를 얼음 위에 다시 둔다. 2.5 μL RSB, 2.5 μL 인덱스 어댑터(Index Adaptor; TruSeq Stranded Total RNA Kit, 일루미나) 및 2.5 μL의 라이게이션 완충액(일루미나)의 순서로 첨가하여, 어댑터를 A-테일링된 샘플에 라이게이션한다. 반응 튜브를 30℃에서 10분간 인큐베이션한 후에, 5 μL의 정지 라이게이션(Stop Ligation) 완충액(일루미나)을 첨가하여, 반응물을 얼음 위에 유지한다.
어댑터 라이게이션 반응이 완료되면, 라이게이션된 단편을 반응 성분으로부터 분리한다. 어댑터 라이게이션된 단편을 정제하기 위해, 34 μL SPB를 반응 튜브에 첨가하여, 실온에서 약 5분간 인큐베이션한다. 이어서, 상자성 비드를 포획하기 위해 튜브를 자석 위에 놓고, 비드를 175 μL의 80% EtOH로 2회 세척하고, 두 번째 세척 후에 EtOH를 조심스럽게 제거한다. 비드의 3분간의 공기 건조 후에, 비드를 52 μL RSB에 재현탁시키고, 슬러리를 혼합하고, 실온에서 추가로 5분간 정치시키고, 자석 위에 다시 둔다. 상청액(50 μL)을 제2 라운드의 비드 클린업을 위해 새로운 튜브에 옮긴다.
상기 제2 라운드에서, 40 μL SPB를 50 μL 샘플에 첨가하고, 최종 정제 단편을 21 μL의 RSB에 재현탁시키는 것과, 20 μL의 최종 정제된 샘플을 후속 증폭을 위해 새로운 반응 튜브에 옮긴다는 것을 제외하고는, 상술한 프로세스를 반복하여, 최적화된 시퀀싱 결과를 위해 표적 서열의 양을 증가시킨다.
20 μL의 정제된 어댑터 라이게이션된 샘플에, 5 μL의 PCR 프라이머 칵테일(PPC, TruSeq Stranded Total RNA Kit, 일루미나) 및 25 μL PPM(TruSeq Stranded Total RNA Kit, 일루미나)을 첨가하여, 가열 리드 서모사이클러에서의 하기 증폭 프로그램, 즉, 98℃에서 30초간, 이어서 98℃에서 10초간, 60℃에서 30초간, 72℃에서 30초간 사이클링된 프로그램을 수행한다. 증폭 사이클 수는 전체 프로세스의 개시 시에 입력된 RNA의 양에 따라 다르다. 예를 들어, 100 ng RNA의 경우, 약 12 내지 13회의 사이클이 적절할 수 있으며, 10 ng의 경우 15 내지 16회의 사이클, 1 ng의 경우 17 내지 18회의 사이클이 필요할 수 있다. 증폭 사이클 수는 전형적으로 당업자에게 알려진 모든 제조에 대해 최적화된다.
50 μL SPB를 반응 튜브에 첨가하여, 실온에서 인큐베이션하고, 튜브를 원심분리하여 비드를 펠릿화하고, 비드를 자기적으로 포획함으로써 반응 조건을 벗어나서 앰플리콘(amplicon)을 정제할 수 있다. 상청액을 폐기할 수 있으며, 비드를 상술한 바와 같이 세척한 후에, 세척된 비드를 26 μL RSB에 재현탁시키고, 자기 비드를 포획하고, 시퀀싱을 위한 DNA 라이브러리를 포함하는 상청액을 새로운 튜브에 옮길 수 있다. 라이브러리는 전형적으로 시퀀싱 전에, 예를 들어 큐비트(Qubit)™ 하이 센서티버티(High Sensitivity) 키트(서모 피셔 사이언티픽)를 사용하여 분취량을 측정하고/하거나 바이오애널라이저(애질런트(Agilent)) 상에서 분취량을 실행시킴으로써 정량화하고 분석한다. 당업자는 샘플의 핵산을 정량화할 수 있는 많은 방법을 인식할 것이다.
이어서, 얻어진 라이브러리 제제를 차세대 시퀀싱, 마이크로어레이 분석 또는 다른 다운스트림 애플리케이션에 사용할 수 있다. 시퀀싱과 같은 애플리케이션의 경우, 라이브러리 제조 방법은 사용되는 시퀀싱 기기 및 해당 시퀀싱 기기에 대해 정의된 동반 라이브러리 제조 방법에 의해 결정된다. 본 실시예에서, 라이브러리 제조 방법은 일루미나 시퀀싱 기기에서 시퀀싱할 때 라이브러리가 제작되는 특징을 나타낸다. 당업자는 라이브러리 제조 방법이 시퀀싱 기기에 따라 달라질 수 있음을 이해할 것이며, 따라서 본 발명의 실시예는 단지 예시일 뿐이며, 본 발명의 RNA 고갈 방법은 특정 라이브러리 준비 워크플로우에 제한되지 않는다. 실제로, 본 발명의 방법은 원치 않는 RNA 종이 고갈된 RNA 샘플로부터 이익을 얻을 수 있는 임의의 다운스트림 애플리케이션에 입력될 수 있는 RNA 고갈된 샘플을 제공한다.
실시예 4-미생물 트랜스크립톰 분석
본 실시예에서, 미생물 분리주, 세균종의 혼합 샘플 및 표준 세포 혼합물을 테스트를 위해 ATCC로부터 입수하였다.
Figure pct00012
총 RNA를 제조업자의 프로토콜에 따라, 알엔이지 파워 마이크로바이옴 키트(RNeasy Power Microbiome Kit; 퀴아젠(Qiagen))를 사용하여 추출하여, 완전성에 대해 평가하고, 바이오애널라이저 RNA 전기영동(애질런트)으로 정량화할 수 있다. 각각의 샘플로부터의 10 내지 250 ng의 총 RNA를 리보제로(RiboZero) 방법(일루미나, 제조업자의 프로토콜에 따름) 또는 원치않는 rRNA의 RNase H 효소 분해를 사용한 본 명세서에 개시된 방법에 따라 rRNA 고갈을 위해 사용할 수 있다. 리보 고갈된 및 비리보(non-ribo) 고갈된 RNA(대조군) 샘플은 제조업자의 설명서에 따라 TruSeq Stranded Total RNA Sample prep kit(일루미나)를 사용하여 시퀀싱을 위해 제조할 수 있다. 라이브러리는 예를 들어, 2 × 76개의 쌍으로 된 말단 리드를 위한 MiSeq 또는 NextSeq 시퀀싱 기기(일루미나) 상에서 풀링되고 시퀀싱될 수 있다.
시퀀스 필터링, 정렬 및 전사체 커버리지는 온라인 베이스스페이스 시퀀싱 허브(online BaseSpace Sequencing Hub; BSSH) 및 하기의 예시적인 워크플로우, 예를 들어 1) 파티션(Partition) rRNA 시퀀스 앱 (분석에서 풍부한 시퀀스로 표시하기 위해 rRNA 시퀀스 분석), 2) RNA 커스텀 게놈 빌더 앱(RNA Custom Genome Builder App; STAR 호환성(STAR-compatible) 미생물 트랜스크립톰을 생성함) 및 3) RNA-Seq 정렬 앱(STAR-정렬 및 연어-전사체 정량화)을 사용하여 수행될 수 있다. 미생물 샘플 내의 다수의 균주로부터 rRNA를 정량화하기 위해, rRNA 서열을 NCBI 주석이 달린 게놈으로부터 회수하여, BSSH 워크플로우에 대한 입력으로서 사용할 수 있다.
미생물 분리주의 트랜스크립톰, 미생물 혼합물 및 대조군 샘플을 시퀀싱하여, % rRNA 리드를 비교하였다. 본 명세서에 개시된 RNase H 효소 방법은 시험된 종에서 원치 않는 rRNA를 고갈시키는데 매우 효과적이다(<5% rRNA 리드). 리보솜 RNA 고갈은 확립된 리보제로 방법과 비교하여, RNase H 방법을 사용한 대장균의 저 투입량 샘플(10 ng)에 대해 가장 현저하며; 각각, <0.5% 대 13% 평균 rRNA 리드(도 5)이다.
RNase H rRNA 고갈 방법을 사용하여, rRNA 고갈이 없는 것과 비교하였을 때, 생물학적으로 중요한 RNA 리드의 농축을 평가하는데 데이터를 사용하였다. 도 6은 일반적으로, 샘플이 RNase H 방법을 사용하여 라이브러리 제조 및 시퀀싱에 앞서 rRNA 고갈된 경우, rRNA 고갈이 없는 것과 비교하여, 리드 깊이의 20 내지 50배 감소가 바실러스 서브틸리스 또는 대장균 샘플에 대해 관찰된 평가 결과를 보여준다.
수집된 데이터를 평가하여, 실험적인 미생물 트랜스크립톰 시퀀싱 노력의 재현성을 결정하였다. 유전자 발현 수준의 쌍별 선형 회귀는 예시 시스템으로서 대장균 및 바실러스 서브틸리스에 대한 RNase H rRNA 고갈된 복제물 사이에서 결정되었다. 높은 상관관계(R2>0.99)는 RNase H rRNA 고갈 방법이 샘플로부터 rRNA를 재현가능하게 제거하는 능력을 나타내었다(도 7).
RNase H 효소 rRNA 고갈 방법이 혼합 샘플의 rRNA 고갈에 유용할 수 있는지 여부를 평가하기 위해, 도 8은 20개의 균주 MSA2002 및 인간 장내 세균 MSA2006의 혼합 샘플에 대한 예시적인 데이터를 3중으로 보여준다. MSA2002로부터의 10 mg 총 RNA 또는 MSA2006로부터의 80 ng 총 RNA의 저 투입량 샘플을 rRNA 고갈 방법에 사용하였다. 20개의 균주 MSA2002 샘플의 경우, RNase H rRNA 고갈 방법은 rRNA 리드를 시퀀스 리드의 83% 또는 <2%로 감소시킨 반면에, rRNA 고갈의 리보제로 방법은 고갈되지 않은 샘플에 비해 더욱 변동이 심하고, rRNA 존재량이 높았다. 12개의 균주 MSA2006 샘플의 경우, RNase H 방법은 고갈되지 않은 샘플에 비해 rRNA 리드를 시퀀스 리드의 약 95% 내지 <13%로 감소시킨 동일한 결과를 보였으며, 리보제로 방법은 더욱 변동이 심한 결과를 산출하였다.
이와 같이, 샘플을 평가하기 위한 실험에서, 혼합되거나 다른 방식으로, RNase H rRNA 고갈 방법은 질이 높은 미생물 전체 트랜스크립톰 연구를 위한 샘플에서 원치 않는 rRNA를 감소시키기 위해 안정되고 효과적인 워크플로우를 제공하는 것으로 결정되었다. RNase H rRNA 고갈 방법은 또한 저 투입량 샘플에 매우 효과적이며, 적합하였다.
실시예 5-RNA 고갈에 대한 포름아미드의 영향
도 2는 RNA 샘플에서 원치 않는 RNA 종이 고갈된 예시적인 데이터를 나타낸다. 본 명세서에 기재된 방법을 사용하여, RNA 샘플에서 원치 않는 RNA를 고갈시키면서, 원치 않는 RNA 고갈에 대한 포름아미드 농도의 효과를 평가하였다. 본 실시예에서, DNA 프로브는 그람 양성균(23S, 16S, 5S), 그람 음성균(23S, 16S, 5S 포함), 인간 미토콘드리아(16S, 12S), 인간 rRNA(28S, 18S, 5.8S, 5S), 인간 헤모글로빈 mRNA(HBA-A1, HBA-A2, HBB, HBG1, HBG2) 유래의 원치 않는 rRNA 종의 고갈을 표적으로 하고, 표적 RNA 종은 바실러스 서브틸리스 유래의 총 RNA이다. 포름아미드의 농도가 증가함에 따라, 원치 않는 RNA 종 리드의 비율은 유의하게 감소한다. 예를 들어, RNA 고갈 시에 포름아미드가 없으면, 대장균 특이적 서열을 포함하여, 그람 양성균 23S 및 16S와, 그람 음성균(대장균 포함) 23S 및 16S에 대해서는 비표적 RNA 리드가 발생되었다. 하이브리디제이션 반응물에 25% 포름아미드를 첨가하면, 그람 음성균 23S 및 16S에 대해서는 검출할 수 없는 비표적 리드가 발생되고(대장균에 특이적인 비표적 리드가 유의하게 감소됨), 그람 양성균 23S 및 16S에 대해서는 비표적 리드가 유의하게 감소되었다. 하이브리디제이션 반응물에 45% 포름아미드를 첨가하면, 그람 양성균의 바람직하지 않은 rRNA 23S 및 16S의 경우에 비표적 리드가 추가로 유의하게 감소할 뿐만 아니라, 비표적 대장균 리드가 더욱 감소된다. 이와 같이, RNA 고갈 하이브리디제이션 반응물에 포름아미드를 첨가하면, 이들 종에 대한 비표적 리드의 감소에 의해 입증되는 바와 같이, 고갈된 그람 양성균 및 그람 음성균의 바람직하지 않은 RNA의 양을 증가시키는 것으로 나타난다. 일반적으로, 포름아미드의 첨가는 원치 않는 rRNA 전사체의 고갈을 개선시키는 것으로 밝혀졌다. 분석을 위해 표적 RNA로서 바실러스 서브틸리스 RNA를 사용하는 경우, 예를 들어 대장균 및 인간 rRNA 서열에 대한 분석은 오염 가능성 척도를 제공할 수 있다.
실시예 6-출발 물질의 투입량 변화
도 3에 나타낸 바와 같이, RNA 고갈 및 후속 다운스트림 분석에 대한 투입된 출발 물질의 영향을 확인하기 위해 실험을 수행하였는데, 인간 뇌(HBR) 및 보편적인 인간 RNA(UHR)로부터의 RNA 고갈 및 농축된 RNA 샘플을 사용하여 일루미나 NextSeq™ 500 또는 550 시퀀싱 기기에서 시퀀싱을 위한 라이브러리를 제작하였다. 100 ng, 10 ng 또는 1 ng의 투입 샘플을 사용한 RNA 고갈 후에, 실시예 1 내지 실시예 3에 예시된 바와 같이 시퀀싱 라이브러리를 제조하였다. 2개의 베이스스페이스(일루미나) 애플리케이션, RNASeq 정렬 애플리케이션 및 RNAExpress 애플리케이션을 사용한 데이터 분석에 이어서, NextSeq™ 사용자 가이드에서 권장하는 대로 시퀀싱을 수행하였다. 바실러스 서브틸리스 및 대장균의 존재에 대한 데이터 분석을 또한 수정된 공구 Fastqscreen을 사용하여 수행하였다 (https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/). 데이터는 RNA 샘플의 투입량 및 표적 RNA에 대한 % 전체 정렬의 양에 관계없이, RNA 고갈이 HBR 및 UHR 둘 다에 대해 일정하게 유지되는 반면, 투입량 감소에 따라 감소하지만, 1 ng의 투입량 샘플을 사용하는 경우에도 여전히 실행가능하고 유용한 서열 데이터가 수집될 수 있음을 보여준다. 또한, 비교 실험에서, RNA 고갈을 위한 현재 방법은 RNA 고갈을 위한 리보제로 rRNA 고갈 키트(에피센터)를 사용하는 경우(100ng~3%, 25ng~5%, 10 ng~8% 및 1 ng~35%) 또는 NEBNext rRNA 고갈 방법(NEB)을 사용하는 경우(100ng~8%, 25ng~8%, 10ng~9% 및 1ng~30%)의 데이터와 비교하면, 모든 투입량 레벨에서 비표적 리드의 % 존재비가 더 낮아진다(100ng~3%, 25ng~4%, 10ng~3% 및 1ng~3%).
실시예 7-마우스 및 래트 RNA 샘플의 RNA 고갈
RNA 고갈 방법이 비인간 RNA 샘플에 유용할 수 있음을 입증하기 위해, 마우스 및 래트 RNA 샘플을 모두 RNA 고갈 방법에 사용하였다. 도 4의 경우, 마우스 또는 래트 RNA 샘플은 인간 RNA 샘플에 대해서와 동등한 방법 및 DNA 프로브를 사용하여 원치 않는 RNA가 고갈되었다. 하이브리디제이션 반응물에 포름아미드 없음, 25% 포름아미드 또는 45% 포름아미드를 포함하여 포름아미드를 각 설치류 종에 대하여 다시 변화시켰다. 총 % 정렬된 리드는 포름아미드의 증가에 영향을 받지 않지만, 포름아미드가 증가함에 따라 비표적 리드의 검출이 증가하는 경향이 있을 수 있다. 이와 같이, 하이브리디제이션 반응물에 포름아미드를 첨가하는 것은 일부 샘플 유형에서 유용할 수 있는데, 이는 일부 전사체의 검출을 개선할 수 있어서 그의 첨가가 최적화되어야 한다.
실시예 8-추가의 마우스 프로브의 제조
원치 않는 서열(서열 번호 1 내지 333)의 효소적 제거를 위해 상술한 333개의 DNA 프로브의 풀 내에서, 진핵생물 rRNA 고갈을 위한 DNA 올리고뉴클레오타이드를 주요 인간 rRNA 전사체, 즉, 5S, 5.8S, 18S 및 28S 뿐만 아니라 2개의 미토콘드리아 rRNA 서열, 12S 및 16S를 기반으로 설계하였다. 인간의 총 RNA에 대해 테스트한 경우, 이러한 333-DNA 프로브 풀은 rRNA 리드를 제거하는 데 매우 효과적이었다. 그러나, 마우스(무스 무스쿨루스(Mus musculus)) 또는 래트(라투스 노르베지쿠스(Rattus norvegicus))의 총 RNA 샘플로 테스트한 경우, 고갈은 덜 안정하였으며, 이는 프로브가 설치류 rRNA 서열의 일부 영역을 효율적으로 하이브리디제이션하여 제거하지 못했는데 이러한 마우스 및 래트 영역이 인간 서열과 불일치하기 때문임을 시사한다.
333-DNA 프로브 실험으로부터 얻은 총 시퀀싱 리드를 포함하는 fastq 파일을 마우스 및 래트 리보솜 RNA 서열에 그리고 333개의 DNA 프로브 서열에 정렬시켰다. 정렬 결과는 모든 리보솜 RNA 서열에 걸친 프로브 커버리지가 일반적으로 우수하였지만, 프로브 서열이 설치류 rRNA와 잘 정렬되지 않은 일부 영역이 존재함을 나타내었다. 더욱 구체적으로, 프로브 풀 맵에 정렬되지 않은 마우스 및 래트 rRNA 리드의 대부분은 28S 또는 16S 설치류 rRNA 전사체 중 어느 하나에 속하였다(표 2). 보우타이2(Bowtie2)(문헌[Langmead and Salzberg, Nature Methods 2012, 9:357-359] 참조), 버전 2.1.0으로 그의 디폴트 설정을 이용하여 정렬을 행하였다. 333 DNA 프로브 효소 방법으로 고갈되지 않은 대부분의 리보솜 RNA는 프로브 정렬이 결여된 동일한 영역으로부터 유래되었다(도 9).
[표 2]
Figure pct00013
이러한 영역을 더욱 효과적으로 고갈시키기 위해, 마우스 및 래트 리보솜 RNA 서열에 대해 상기에서 확인된 영역을 커버하도록 추가의 프로브를 설계하였다. 추가의 프로브 및 프로브 중복의 수를 최소화하기 위해, 마우스 rRNA 서열에서의 갭에 대해 추가적인 프로브를 설계하고, 이어서 래트 rRNA 전사체에 결합된 풀을 정렬시킴으로써 래트 rRNA 커버리지에서 임의의 남아있는 갭들을 확인하도록 333 DNA 프로브 세트와 함께 이들 데이터를 정보적으로 풀링하였다. 이러한 순차적 프로세스는 총 44개의 추가의 올리고뉴클레오타이드 프로브를 산출하여, 377개의 프로브의 보충 풀(supplemental pool)을 제공하였다. 상술한 시퀀싱 실험을 377 DNA 프로브 세트를 사용하여 반복하였다. 마우스 및 래트 샘플 모두에서, 44개의 새로운 프로브를 첨가하면, 333-DNA 프로브 세트에 비해, 라이브러리로부터의 rRNA 리드의 비율이 감소하므로, 고갈 효율이 증가되었음을 나타낸다(표 3).
[표 3]
Figure pct00014
특정 설치류 서열에 대해 추가의 프로브로 333 DNA 프로브 풀을 보충하면, 테스트된 설치류 샘플에서 rRNA 고갈이 개선되었다. 마우스 16S에 대한 예시적인 프로브는 서열 번호 385 내지 393을 포함한다. 마우스 28S에 대한 예시적인 프로브는 서열 번호 400 내지 419를 포함한다. 래트 16S에 대한 예시적인 프로브는 서열 번호 394 내지 399를 포함한다. 래트 28S에 대한 예시적인 프로브는 서열 번호 420 내지 428을 포함한다.
SEQUENCE LISTING <110> EPICENTRE TECHNOLOGIES CORPORATION <120> NUCLEASE-BASED RNA DEPLETION <130> WO2020/132304 <140> PCT/US2019/067582 <141> 2019-12-19 <150> US 62/783,869 <151> 2018-12-21 <150> US 62/847,797 <151> 2019-05-14 <160> 428 <170> PatentIn version 3.5 <210> 1 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 1 gttcgtccaa gtgcactttc cagtacactt accatgttac gacttgtctc 50 <210> 2 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 2 taggggtttt agttaaatgt cctttgaagt atacttgagg agggtgacgg 50 <210> 3 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 3 ttcagggccc tgttcaacta agcactctac tctcagttta ctgctaaatc 50 <210> 4 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 4 agtttcataa gggctatcgt agttttctgg ggtagaaaat gtagcccatt 50 <210> 5 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 5 ggctacacct tgacctaacg tctttacgtg ggtacttgcg cttactttgt 50 <210> 6 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 6 ttgctgaaga tggcggtata taggctgagc aagaggtggt gaggttgatc 50 <210> 7 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 7 cagaacaggc tcctctagag ggatatgaag caccgccagg tcctttgagt 50 <210> 8 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 8 gtagtgttct ggcgagcagt tttgttgatt taactgttga ggtttagggc 50 <210> 9 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 9 atctaatccc agtttgggtc ttagctattg tgtgttcaga tatgttaaag 50 <210> 10 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 10 attttgtgtc aactggagtt ttttacaact caggtgagtt ttagctttat 50 <210> 11 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 11 ctaaaacact ctttacgccg gcttctattg acttgggtta atcgtgtgac 50 <210> 12 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 12 gaaattgacc aaccctgggg ttagtatagc ttagttaaac tttcgtttat 50 <210> 13 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 13 actgctgttt cccgtggggg tgtggctagg ctaagcgttt tgagctgcat 50 <210> 14 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 14 gcttgtccct tttgatcgtg gtgatttaga gggtgaactc actggaacgg 50 <210> 15 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 15 taatcttact aagagctaat agaaaggcta ggaccaaacc tatttgttta 50 <210> 16 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 16 aaaccctgtt cttgggtggg tgtgggtata atactaagtt gagatgatat 50 <210> 17 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 17 gcgctttgtg aagtaggcct tatttctctt gtcctttcgt acagggagga 50 <210> 18 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 18 aaaccgacct ggattactcc ggtctgaact cagatcacgt aggactttaa 50 <210> 19 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 19 acctttaata gcggctgcac catcgggatg tcctgatcca acatcgaggt 50 <210> 20 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 20 tgatatggac tctagaatag gattgcgctg ttatccctag ggtaacttgt 50 <210> 21 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 21 attggatcaa ttgagtatag tagttcgctt tgactggtga agtcttagca 50 <210> 22 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 22 ttgggttctg ctccgaggtc gccccaaccg aaatttttaa tgcaggtttg 50 <210> 23 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 23 tgggtttgtt aggtactgtt tgcattaata aattaaagct ccatagggtc 50 <210> 24 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 24 gtcatgcccg cctcttcacg ggcaggtcaa tttcactggt taaaagtaag 50 <210> 25 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 25 cgtggagcca ttcatacagg tccctattta aggaacaagt gattatgcta 50 <210> 26 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 26 ggtaccgcgg ccgttaaaca tgtgtcactg ggcaggcggt gcctctaata 50 <210> 27 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 27 gtgatgtttt tggtaaacag gcggggtaag gtttgccgag ttccttttac 50 <210> 28 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 28 cttatgagca tgcctgtgtt gggttgacag tgagggtaat aatgacttgt 50 <210> 29 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 29 attgggctgt taattgtcag ttcagtgttt tgatctgacg caggcttatg 50 <210> 30 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 30 tcatgttact tatactaaca ttagttcttc tatagggtga tagattggtc 50 <210> 31 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 31 agttcagtta tatgtttggg attttttagg tagtgggtgt tgagcttgaa 50 <210> 32 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 32 tggctgcttt taggcctact atgggtgtta aattttttac tctctctaca 50 <210> 33 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 33 gtccaaagag ctgttcctct ttggactaac agttaaattt acaaggggat 50 <210> 34 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 34 ggcaaattta aagttgaact aagattctat cttggacaac cagctatcac 50 <210> 35 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 35 tgtcgcctct acctataaat cttcccacta ttttgctaca tagacgggtg 50 <210> 36 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 36 tcttaggtag ctcgtctggt ttcgggggtc ttagctttgg ctctccttgc 50 <210> 37 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 37 taattcatta tgcagaaggt ataggggtta gtccttgcta tattatgctt 50 <210> 38 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 38 tctttccctt gcggtactat atctattgcg ccaggtttca atttctatcg 50 <210> 39 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 39 ggtaaatggt ttggctaagg ttgtctggta gtaaggtgga gtgggtttgg 50 <210> 40 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 40 taatgatcct tccgcaggtt cacctacgga aaccttgtta cgacttttac 50 <210> 41 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 41 aagttcgacc gtcttctcag cgctccgcca gggccgtggg ccgaccccgg 50 <210> 42 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 42 ggcctcacta aaccatccaa tcggtagtag cgacgggcgg tgtgtacaaa 50 <210> 43 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 43 caacgcaagc ttatgacccg cacttactcg ggaattccct cgttcatggg 50 <210> 44 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 44 ccgatcccca tcacgaatgg ggttcaacgg gttacccgcg cctgccggcg 50 <210> 45 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 45 ctgagccagt cagtgtagcg cgcgtgcagc cccggacatc taagggcatc 50 <210> 46 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 46 ctcaatctcg ggtggctgaa cgccacttgt ccctctaaga agttggggga 50 <210> 47 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 47 ggtcgcgtaa ctagttagca tgccagagtc tcgttcgtta tcggaattaa 50 <210> 48 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 48 caccaactaa gaacggccat gcaccaccac ccacggaatc gagaaagagc 50 <210> 49 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 49 cctgtccgtg tccgggccgg gtgaggtttc ccgtgttgag tcaaattaag 50 <210> 50 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 50 ctggtggtgc ccttccgtca attcctttaa gtttcagctt tgcaaccata 50 <210> 51 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 51 aaagactttg gtttcccgga agctgcccgg cgggtcatgg gaataacgcc 50 <210> 52 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 52 ggcatcgttt atggtcggaa ctacgacggt atctgatcgt cttcgaacct 50 <210> 53 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 53 gattaatgaa aacattcttg gcaaatgctt tcgctctggt ccgtcttgcg 50 <210> 54 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 54 cacctctagc ggcgcaatac gaatgccccc ggccgtccct cttaatcatg 50 <210> 55 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 55 accaacaaaa tagaaccgcg gtcctattcc attattccta gctgcggtat 50 <210> 56 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 56 ctgctttgaa cactctaatt ttttcaaagt aaacgcttcg ggccccgcgg 50 <210> 57 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 57 gcatcgaggg ggcgccgaga ggcaaggggc ggggacgggc ggtggctcgc 50 <210> 58 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 58 ccgcccgctc ccaagatcca actacgagct ttttaactgc agcaacttta 50 <210> 59 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 59 gctggaatta ccgcggctgc tggcaccaga cttgccctcc aatggatcct 50 <210> 60 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 60 agtggactca ttccaattac agggcctcga aagagtcctg tattgttatt 50 <210> 61 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 61 cccgggtcgg gagtgggtaa tttgcgcgcc tgctgccttc cttggatgtg 50 <210> 62 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 62 gctccctctc cggaatcgaa ccctgattcc ccgtcacccg tggtcaccat 50 <210> 63 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 63 taccatcgaa agttgatagg gcagacgttc gaatgggtcg tcgccgccac 50 <210> 64 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 64 ggcccgaggt tatctagagt caccaaagcc gccggcgccc gccccccggc 50 <210> 65 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 65 gctgaccggg ttggttttga tctgataaat gcacgcatcc cccccgcgaa 50 <210> 66 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 66 tcggcatgta ttagctctag aattaccaca gttatccaag taggagagga 50 <210> 67 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 67 aaccataact gatttaatga gccattcgca gtttcactgt accggccgtg 50 <210> 68 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 68 atggcttaat ctttgagaca agcatatgct actggcagga tcaaccaggt 50 <210> 69 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 69 gacaaaccct tgtgtcgagg gctgactttc aatagatcgc agcgagggag 50 <210> 70 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 70 cgaaaccccg acccagaagc aggtcgtcta cgaatggttt agcgccaggt 50 <210> 71 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 71 ggtgcgtgac gggcgagggg gcggccgcct ttccggccgc gccccgtttc 50 <210> 72 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 72 ctccgcaccg gaccccggtc ccggcgcgcg gcggggcacg cgccctcccg 50 <210> 73 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 73 aggggggggc ggcccgccgg cggggacagg cgggggaccg gctatccgag 50 <210> 74 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 74 gcggcgctgc cgtatcgttc gcctgggcgg gattctgact tagaggcgtt 50 <210> 75 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 75 agatggtagc ttcgccccat tggctcctca gccaagcaca tacaccaaat 50 <210> 76 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 76 tcctctcgta ctgagcagga ttaccatggc aacaacacat catcagtagg 50 <210> 77 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 77 ctcacgacgg tctaaaccca gctcacgttc cctattagtg ggtgaacaat 50 <210> 78 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 78 ttctgcttca caatgatagg aagagccgac atcgaaggat caaaaagcga 50 <210> 79 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 79 ttggccgcca caagccagtt atccctgtgg taacttttct gacacctcct 50 <210> 80 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 80 ggtcagaagg atcgtgaggc cccgctttca cggtctgtat tcgtactgaa 50 <210> 81 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 81 agcttttgcc cttctgctcc acgggaggtt tctgtcctcc ctgagctcgc 50 <210> 82 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 82 ttaccgtttg acaggtgtac cgccccagtc aaactcccca cctggcactg 50 <210> 83 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 83 gcgcccggcc gggcgggcgc ttggcgccag aagcgagagc ccctcgggct 50 <210> 84 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 84 ccgggtcagt gaaaaaacga tcagagtagt ggtatttcac cggcggcccg 50 <210> 85 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 85 cgccccgggc ccctcgcggg gacaccgggg gggcgccggg ggcctcccac 50 <210> 86 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 86 catgtctctt caccgtgcca gactagagtc aagctcaaca gggtcttctt 50 <210> 87 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 87 ccaagcccgt tcccttggct gtggtttcgc tggatagtag gtagggacag 50 <210> 88 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 88 tccattcatg cgcgtcacta attagatgac gaggcatttg gctaccttaa 50 <210> 89 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 89 tcccgccgtt tacccgcgct tcattgaatt tcttcacttt gacattcaga 50 <210> 90 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 90 cacatcgcgt caacacccgc cgcgggcctt cgcgatgctt tgttttaatt 50 <210> 91 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 91 cctggtccgc accagttcta agtcggctgc taggcgccgg ccgaggcgag 50 <210> 92 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 92 cggccccggg ggcggacccg gcggggggga ccggcccgcg gcccctccgc 50 <210> 93 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 93 ccgccgcgcg ccgaggagga ggggggaacg gggggcggac ggggccgggg 50 <210> 94 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 94 acgaaccgcc ccgccccgcc gcccgccgac cgccgccgcc cgaccgctcc 50 <210> 95 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 95 cgcgcgcgac cgagacgtgg ggtgggggtg gggggcgcgc cgcgccgccg 50 <210> 96 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 96 gcggccgcga cgcccgccgc agctggggcg atccacggga agggcccggc 50 <210> 97 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 97 gcgccgccgc cggccccccg ggtccccggg gcccccctcg cggggacctg 50 <210> 98 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 98 ccggcggccg ccgcgcggcc cctgccgccc cgacccttct ccccccgccg 50 <210> 99 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 99 ctcccccggg gaggggggag gacggggagc gggggagaga gagagagaga 50 <210> 100 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 100 agggagcgag cggcgcgcgc gggtggggcg ggggagggcc gcgagggggg 50 <210> 101 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 101 gggggcgcgc gcctcgtcca gccgcggcgc gcgcccagcc ccgcttcgcg 50 <210> 102 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 102 cccagccctt agagccaatc cttatcccga agttacggat ccggcttgcc 50 <210> 103 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 103 cattgttcca acatgccaga ggctgttcac cttggagacc tgctgcggat 50 <210> 104 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 104 cgcgagattt acaccctctc ccccggattt tcaagggcca gcgagagctc 50 <210> 105 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 105 aaccgcgacg ctttccaagg cacgggcccc tctctcgggg cgaacccatt 50 <210> 106 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 106 cttcacaaag aaaagagaac tctccccggg gctcccgccg gcttctccgg 50 <210> 107 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 107 cgcactggac gcctcgcggc gcccatctcc gccactccgg attcggggat 50 <210> 108 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 108 tttcgatcgg ccgagggcaa cggaggccat cgcccgtccc ttcggaacgg 50 <210> 109 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 109 caggaccgac tgacccatgt tcaactgctg ttcacatgga acccttctcc 50 <210> 110 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 110 gttctcgttt gaatatttgc tactaccacc aagatctgca cctgcggcgg 50 <210> 111 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 111 cgccctaggc ttcaaggctc accgcagcgg ccctcctact cgtcgcggcg 50 <210> 112 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 112 tccgggggcg gggagcgggg cgtgggcggg aggaggggag gaggcgtggg 50 <210> 113 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 113 aggaccccac acccccgccg ccgccgccgc cgccgccctc cgacgcacac 50 <210> 114 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 114 gcgcgccgcc cccgccgctc ccgtccactc tcgactgccg gcgacggccg 50 <210> 115 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 115 ctccagcgcc atccattttc agggctagtt gattcggcag gtgagttgtt 50 <210> 116 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 116 gattccgact tccatggcca ccgtcctgct gtctatatca accaacacct 50 <210> 117 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 117 gagcgtcggc atcgggcgcc ttaacccggc gttcggttca tcccgcagcg 50 <210> 118 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 118 aaaagtggcc cactaggcac tcgcattcca cgcccggctc cacgccagcg 50 <210> 119 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 119 ccatttaaag tttgagaata ggttgagatc gtttcggccc caagacctct 50 <210> 120 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 120 cggataaaac tgcgtggcgg gggtgcgtcg ggtctgcgag agcgccagct 50 <210> 121 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 121 tcggagggaa ccagctacta gatggttcga ttagtctttc gcccctatac 50 <210> 122 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 122 gatttgcacg tcaggaccgc tacggacctc caccagagtt tcctctggct 50 <210> 123 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 123 atagttcacc atctttcggg tcctaacacg tgcgctcgtg ctccacctcc 50 <210> 124 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 124 agacgggccg gtggtgcgcc ctcggcggac tggagaggcc tcgggatccc 50 <210> 125 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 125 cgcgccggcc ttcaccttca ttgcgccacg gcggctttcg tgcgagcccc 50 <210> 126 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 126 ttagactcct tggtccgtgt ttcaagacgg gtcgggtggg tagccgacgt 50 <210> 127 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 127 gcgctcgctc cgccgtcccc ctcttcgggg gacgcgcgcg tggccccgag 50 <210> 128 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 128 cccgacggcg cgacccgccc ggggcgcact ggggacagtc cgccccgccc 50 <210> 129 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 129 gcaccccccc cgtcgccggg gcgggggcgc ggggaggagg ggtgggagag 50 <210> 130 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 130 aggggtggcc cggccccccc acgaggagac gccggcgcgc ccccgcgggg 50 <210> 131 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 131 ggggattccc cgcgggggtg ggcgccggga ggggggagag cgcggcgacg 50 <210> 132 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 132 gccccgggat tcggcgagtg ctgctgccgg gggggctgta acactcgggg 50 <210> 133 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 133 ccgcccccgc cgccgccgcc accgccgccg ccgccgccgc cccgacccgc 50 <210> 134 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 134 aggacgcggg gccggggggc ggagacgggg gaggaggagg acggacggac 50 <210> 135 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 135 agccaccttc cccgccgggc cttcccagcc gtcccggagc cggtcgcggc 50 <210> 136 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 136 aaatgcgccc ggcggcggcc ggtcgccggt cgggggacgg tcccccgccg 50 <210> 137 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 137 ccgcccgccc acccccgcac ccgccggagc ccgccccctc cggggaggag 50 <210> 138 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 138 gggaagggag ggcgggtgga ggggtcggga ggaacggggg gcgggaaaga 50 <210> 139 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 139 acacggccgg acccgccgcc gggttgaatc ctccgggcgg actgcgcgga 50 <210> 140 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 140 tcttaacggt ttcacgccct cttgaactct ctcttcaaag ttcttttcaa 50 <210> 141 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 141 cttgttgact atcggtctcg tgccggtatt tagccttaga tggagtttac 50 <210> 142 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 142 gcattcccaa gcaacccgac tccgggaaga cccgggcgcg cgccggccgc 50 <210> 143 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 143 gtccacgggc tgggcctcga tcagaaggac ttgggccccc cacgagcggc 50 <210> 144 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 144 ttccgtacgc cacatgtccc gcgccccgcg gggcggggat tcggcgctgg 50 <210> 145 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 145 ctcgccgtta ctgagggaat cctggttagt ttcttttcct ccgctgacta 50 <210> 146 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 146 gcgggtcgcc acgtctgatc tgaggtcgcg tctcggaggg ggacgggccg 50 <210> 147 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 147 aagcgacgct cagacaggcg tagccccggg aggaacccgg ggccgcaagt 50 <210> 148 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 148 gcagctagct gcgttcttca tcgacgcacg agccgagtga tccaccgcta 50 <210> 149 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 149 aaagcctaca gcacccggta ttcccaggcg gtctcccatc caagtactaa 50 <210> 150 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 150 ttccgagatc agacgagatc gggcgcgttc agggtggtat ggccgtagac 50 <210> 151 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 151 gccgcccact cagactttat tcaaagacca cgggggtacg ggtgcaggaa 50 <210> 152 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 152 gggggaggcc caaggggcaa gaagcatggc caccgaggct ccagcttaac 50 <210> 153 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 153 gcacggtgct cacagaagcc aggaacttgt ccagggaggc gtgcaccgca 50 <210> 154 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 154 gggaggtggg cggccagggt caccagcagg cagtggctta ggagcttgaa 50 <210> 155 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 155 ccgaagcttg tgcgcgtgca ggtcgctcag ggcggacagc gcgttgggca 50 <210> 156 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 156 ccacggcgtt ggtcagcgcg tcggccacct tcttgccgtg gcccttaacc 50 <210> 157 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 157 ctcaggtcga agtgcgggaa gtaggtcttg gtggtgggga aggacaggaa 50 <210> 158 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 158 ctccgcacca tactcgccag cgtgcgcgcc gaccttaccc caggcggcct 50 <210> 159 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 159 cggcaggaga cagcaccatg gtgggttctc tctgagtctg tggggaccag 50 <210> 160 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 160 gaggggagga gggcccgttg ggaggcccag cgggcaggag gaacggctac 50 <210> 161 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 161 acggtatttg gaggtcagca cggtgctcac agaagccagg aacttgtcca 50 <210> 162 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 162 caggggtgaa ctcggcgggg aggtgggcgg ccagggtcac cagcaggcag 50 <210> 163 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 163 aagttgaccg ggtccacccg aagcttgtgc gcgtgcaggt cgctcagggc 50 <210> 164 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 164 catgtcgtcc acgtgcgcca cggcgttggt cagcgcgtcg gccaccttct 50 <210> 165 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 165 cctgggcaga gccgtggctc aggtcgaagt gcgggaagta ggtcttggtg 50 <210> 166 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 166 aacatcctct ccagggcctc cgcaccatac tcgccagcgt gcgcgccgac 50 <210> 167 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 167 cttgacgttg gtcttgtcgg caggagacag caccatggtg ggttctctct 50 <210> 168 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 168 gcaatgaaaa taaatgtttt ttattaggca gaatccagat gctcaaggcc 50 <210> 169 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 169 cagtttagta gttggactta gggaacaaag gaacctttaa tagaaattgg 50 <210> 170 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 170 gcttagtgat acttgtgggc cagggcatta gccacaccag ccaccacttt 50 <210> 171 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 171 cactggtggg gtgaattctt tgccaaagtg atgggccagc acacagacca 50 <210> 172 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 172 gcctgaagtt ctcaggatcc acgtgcagct tgtcacagtg cagctcactc 50 <210> 173 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 173 cccttgaggt tgtccaggtg agccaggcca tcactaaagg caccgagcac 50 <210> 174 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 174 cttcacctta gggttgccca taacagcatc aggagtggac agatccccaa 50 <210> 175 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 175 tctgggtcca agggtagacc accagcagcc tgcccagggc ctcaccacca 50 <210> 176 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 176 accttgcccc acagggcagt aacggcagac ttctcctcag gagtcagatg 50 <210> 177 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 177 gtgatctctc agcagaatag atttattatt tgtattgctt gcagaataaa 50 <210> 178 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 178 ctctgaatca tgggcagtga gctcagtggt atctggagga cagggcactg 50 <210> 179 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 179 atcttctgcc aggaagcctg cacctcaggg gtgaattctt tgccgaaatg 50 <210> 180 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 180 caccagcaca tttcccagga gcttgaagtt ctcaggatcc acatgcagct 50 <210> 181 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 181 cactcagctg ggcaaaggtg cccttgagat catccaggtg ctttgtggca 50 <210> 182 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 182 agcaccttct tgccatgtgc cttgactttg gggttgccca tgatggcaga 50 <210> 183 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 183 gccaaagctg tcaaagaacc tctgggtcca tgggtagaca accaggagcc 50 <210> 184 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 184 ctccagcatc ttccacattc accttgcccc acaggcttgt gatagtagcc 50 <210> 185 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 185 aaatgaccca tggcgtctgg actaggagct tattgataac ctcagacgtt 50 <210> 186 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 186 gtgatctctt agcagaatag atttattatt tgattgcttg cagaataaag 50 <210> 187 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 187 tctgcatcat gggcagtgag ctcagtggta tctggaggac agggcactgg 50 <210> 188 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 188 tcttctgcca ggaagcctgc acctcagggg tgaattcttt gccgaaatgg 50 <210> 189 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 189 accagcacat ttcccaggag cttgaagttc tcaggatcca catgcagctt 50 <210> 190 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 190 actcagctgg gcaaaggtgc ccttgagatc atccaggtgc tttatggcat 50 <210> 191 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 191 gcaccttctt gccatgtgcc ttgactttgg ggttgcccat gatggcagag 50 <210> 192 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 192 ccaaagctgt caaagaacct ctgggtccat gggtagacaa ccaggagcct 50 <210> 193 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 193 tccagcatct tccacattca ccttgcccca caggcttgtg atagtagcct 50 <210> 194 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 194 aatgacccat ggcgtctgga ctaggagctt attgataacc tcagacgttc 50 <210> 195 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 195 atgcctggca gttccctact ctcgcatggg gagaccccac actaccatcg 50 <210> 196 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 196 acttctgagt tcggcatggg gtcaggtggg accaccgcgc tacggccgcc 50 <210> 197 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 197 ggttaccttg ttacgacttc accccagtca tgaatcacaa agtggtaagt 50 <210> 198 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 198 aagctaccta cttcttttgc aacccactcc catggtgtga cgggcggtgt 50 <210> 199 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 199 acgtattcac cgtggcattc tgatccacga ttactagcga ttccgacttc 50 <210> 200 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 200 agactccaat ccggactacg acgcacttta tgaggtccgc ttgctctcgc 50 <210> 201 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 201 tgtatgcgcc attgtagcac gtgtgtagcc ctggtcgtaa gggccatgat 50 <210> 202 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 202 ccaccttcct ccagtttatc actggcagtc tcctttgagt tcccggccgg 50 <210> 203 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 203 ggataagggt tgcgctcgtt gcgggactta acccaacatt tcacaacacg 50 <210> 204 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 204 tgcagcacct gtctcacggt tcccgaaggc acattctcat ctctgaaaac 50 <210> 205 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 205 gaccaggtaa ggttcttcgc gttgcatcga attaaaccac atgctccacc 50 <210> 206 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 206 cgtcaattca tttgagtttt aaccttgcgg ccgtactccc caggcggtcg 50 <210> 207 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 207 tccggaagcc acgcctcaag ggcacaacct ccaagtcgac atcgtttacg 50 <210> 208 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 208 gtatctaatc ctgtttgctc cccacgcttt cgcactgagc gtcagtcttc 50 <210> 209 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 209 ttcgccaccg gtattcctcc agatctctac gcatttcacc gctacacctg 50 <210> 210 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 210 ctacgagact caagcttgcc agtatcagat gcagttccca ggttgagccc 50 <210> 211 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 211 gacttaacaa accgcctgcg tgcgctttac gcccagtaat tccgattaac 50 <210> 212 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 212 attaccgcgg ctgctggcac ggagttagcc ggtgcttctt ctgcgggtaa 50 <210> 213 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 213 gtattaactt tactcccttc ctccccgctg aaagtacttt acaacccgaa 50 <210> 214 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 214 cgcggcatgg ctgcatcagg cttgcgccca ttgtgcagta ttccccactg 50 <210> 215 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 215 gtctggaccg tgtctcagtt ccagtgtggc tggtcatcct ctcagaccag 50 <210> 216 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 216 taggtgagcc gttaccccac ctactagcta atcccatctg ggcacatccg 50 <210> 217 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 217 aaggtccccc tctttggtct tgcgacgtta tgcggtatta gctaccgttt 50 <210> 218 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 218 ctccatcagg cagtttccca gacattactc acccgtccgc cactcgtcag 50 <210> 219 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 219 aaggttaagc ctcacggttc attagtaccg gttagctcaa cgcatcgctg 50 <210> 220 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 220 cctatcaacg tcgtcgtctt caacgttcct tcaggaccct taaagggtca 50 <210> 221 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 221 ggggcaagtt tcgtgcttag atgctttcag cacttatctc ttccgcattt 50 <210> 222 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 222 ccattggcat gacaacccga acaccagtga tgcgtccact ccggtcctct 50 <210> 223 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 223 ccccctcagt tctccagcgc ccacggcaga tagggaccga actgtctcac 50 <210> 224 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 224 gctcgcgtac cactttaaat ggcgaacagc catacccttg ggacctactt 50 <210> 225 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 225 atgagccgac atcgaggtgc caaacaccgc cgtcgatatg aactcttggg 50 <210> 226 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 226 atccccggag taccttttat ccgttgagcg atggcccttc cattcagaac 50 <210> 227 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 227 acctgctttc gcacctgctc gcgccgtcac gctcgcagtc aagctggctt 50 <210> 228 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 228 cctcctgatg tccgaccagg attagccaac cttcgtgctc ctccgttact 50 <210> 229 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 229 gccccagtca aactacccac cagacactgt ccgcaacccg gattacgggt 50 <210> 230 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 230 aaacattaaa gggtggtatt tcaaggtcgg ctccatgcag actggcgtcc 50 <210> 231 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 231 ccacctatcc tacacatcaa ggctcaatgt tcagtgtcaa gctatagtaa 50 <210> 232 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 232 ttccgtcttg ccgcgggtac actgcatctt cacagcgagt tcaatttcac 50 <210> 233 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 233 gacagcctgg ccatcattac gccattcgtg caggtcggaa cttacccgac 50 <210> 234 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 234 cttaggaccg ttatagttac ggccgccgtt taccggggct tcgatcaaga 50 <210> 235 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 235 accccatcaa ttaaccttcc ggcaccgggc aggcgtcaca ccgtatacgt 50 <210> 236 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 236 cacagtgctg tgtttttaat aaacagttgc agccagctgg tatcttcgac 50 <210> 237 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 237 ccgcgaggga cctcacctac atatcagcgt gccttctccc gaagttacgg 50 <210> 238 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 238 ttccttcacc cgagttctct caagcgcctt ggtattctct acctgaccac 50 <210> 239 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 239 gtacgatttg atgttacctg atgcttagag gcttttcctg gaagcagggc 50 <210> 240 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 240 accgtagtgc ctcgtcatca cgcctcagcc ttgattttcc ggatttgcct 50 <210> 241 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 241 acgcttaaac cgggacaacc gtcgcccggc caacatagcc ttctccgtcc 50 <210> 242 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 242 accaagtaca ggaatattaa cctgtttccc atcgactacg cctttcggcc 50 <210> 243 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 243 actcaccctg ccccgattaa cgttggacag gaacccttgg tcttccggcg 50 <210> 244 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 244 cgctttatcg ttacttatgt cagcattcgc acttctgata cctccagcat 50 <210> 245 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 245 ttcgcaggct tacagaacgc tcccctaccc aacaacgcat aagcgtcgct 50 <210> 246 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 246 catggtttag ccccgttaca tcttccgcgc aggccgactc gaccagtgag 50 <210> 247 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 247 taaatgatgg ctgcttctaa gccaacatcc tggctgtctg ggccttccca 50 <210> 248 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 248 aaccatgact ttgggacctt agctggcggt ctgggttgtt tccctcttca 50 <210> 249 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 249 cccgccgtgt gtctcccgtg ataacattct ccggtattcg cagtttgcat 50 <210> 250 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 250 ggatgacccc cttgccgaaa cagtgctcta cccccggaga tgaattcacg 50 <210> 251 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 251 agctttcggg gagaaccagc tatctcccgg tttgattggc ctttcacccc 50 <210> 252 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 252 cgctaatttt tcaacattag tcggttcggt cctccagtta gtgttaccca 50 <210> 253 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 253 atggctagat caccgggttt cgggtctata ccctgcaact taacgcccag 50 <210> 254 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 254 ccttcggctc ccctattcgg ttaaccttgc tacagaatat aagtcgctga 50 <210> 255 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 255 gtacgcagtc acacgcctaa gcgtgctccc actgcttgta cgtacacggt 50 <210> 256 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 256 actcccctcg ccggggttct tttcgccttt ccctcacggt actggttcac 50 <210> 257 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 257 agtatttagc cttggaggat ggtcccccca tattcagaca ggataccacg 50 <210> 258 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 258 atcgagctca cagcatgtgc atttttgtgt acggggctgt caccctgtat 50 <210> 259 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 259 acgcttccac taacacacac actgattcag gctctgggct gctccccgtt 50 <210> 260 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 260 ggggaatctc ggttgatttc ttttcctcgg ggtacttaga tgtttcagtt 50 <210> 261 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 261 attaacctat ggattcagtt aatgatagtg tgtcgaaaca cactgggttt 50 <210> 262 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 262 gccggttata acggttcata tcaccttacc gacgcttatc gcagattagc 50 <210> 263 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 263 gcttggcggc gtcctactct cacaggggga aacccccgac taccatcggc 50 <210> 264 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 264 ttccgtgttc ggtatgggaa cgggtgtgac ctcttcgcta tcgccaccaa 50 <210> 265 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 265 tagaaaggag gtgatccagc cgcaccttcc gatacggcta ccttgttacg 50 <210> 266 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 266 tctgtcccac cttcggcggc tggctcctaa aaggttacct caccgacttc 50 <210> 267 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 267 tcgtggtgtg acgggcggtg tgtacaaggc ccgggaacgt attcaccgcg 50 <210> 268 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 268 attactagcg attccagctt cacgcagtcg agttgcagac tgcgatccga 50 <210> 269 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 269 gtgggattgg cttaacctcg cggtttcgct gccctttgtt ctgtccattg 50 <210> 270 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 270 ccaggtcata aggggcatga tgatttgacg tcatccccac cttcctccgg 50 <210> 271 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 271 caccttagag tgcccaactg aatgctggca actaagatca agggttgcgc 50 <210> 272 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 272 acccaacatc tcacgacacg agctgacgac aaccatgcac cacctgtcac 50 <210> 273 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 273 gacgtcctat ctctaggatt gtcagaggat gtcaagacct ggtaaggttc 50 <210> 274 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 274 attaaaccac atgctccacc gcttgtgcgg gcccccgtca attcctttga 50 <210> 275 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 275 ccgtactccc caggcggagt gcttaatgcg ttagctgcag cactaagggg 50 <210> 276 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 276 acttagcact catcgtttac ggcgtggact accagggtat ctaatcctgt 50 <210> 277 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 277 tcgctcctca gcgtcagtta cagaccagag agtcgccttc gccactggtg 50 <210> 278 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 278 acgcatttca ccgctacacg tggaattcca ctctcctctt ctgcactcaa 50 <210> 279 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 279 atgaccctcc ccggttgagc cgggggcttt cacatcagac ttaagaaacc 50 <210> 280 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 280 acgcccaata attccggaca acgcttgcca cctacgtatt accgcggctg 50 <210> 281 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 281 ccgtggcttt ctggttaggt accgtcaagg taccgcccta ttcgaacggt 50 <210> 282 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 282 acaacagagc tttacgatcc gaaaaccttc atcactcacg cggcgttgct 50 <210> 283 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 283 ccattgcgga agattcccta ctgctgcctc ccgtaggagt ctgggccgtg 50 <210> 284 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 284 ggccgatcac cctctcaggt cggctacgca tcgtcgcctt ggtgagccgt 50 <210> 285 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 285 ctaatgcgcc gcgggtccat ctgtaagtgg tagccgaagc caccttttat 50 <210> 286 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 286 ttcaaacaac catccggtat tagccccggt ttcccggagt tatcccagtc 50 <210> 287 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 287 ccacgtgtta ctcacccgtc cgccgctaac atcagggagc aagctcccat 50 <210> 288 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 288 gcatgtatta ggcacgccgc cagcgttcgt cctgagccag gatcaaactc 50 <210> 289 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 289 tggttaagtc ctcgatcgat tagtatctgt cagctccatg tgtcgccaca 50 <210> 290 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 290 tatcaacctg atcatctttc agggatctta cttccttgcg gaatgggaaa 50 <210> 291 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 291 ggcttcatgc ttagatgctt tcagcactta tcccgtccgc acatagctac 50 <210> 292 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 292 gcagaacaac tggtacacca gcggtgcgtc catcccggtc ctctcgtact 50 <210> 293 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 293 caaatttcct gcgcccgcga cggataggga ccgaactgtc tcacgacgtt 50 <210> 294 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 294 gtaccgcttt aatgggcgaa cagcccaacc cttgggactg actacagccc 50 <210> 295 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 295 cgacatcgag gtgccaaacc tccccgtcga tgtggactct tgggggagat 50 <210> 296 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 296 ggggtagctt ttatccgttg agcgatggcc cttccatgcg gaaccaccgg 50 <210> 297 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 297 tttcgtccct gctcgacttg taggtctcgc agtcaagctc ccttgtgcct 50 <210> 298 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 298 gatttccaac cattctgagg gaacctttgg gcgcctccgt taccttttag 50 <210> 299 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 299 gtcaaactgc ccacctgaca ctgtctcccc gcccgataag ggcggcgggt 50 <210> 300 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 300 gccagggtag tatcccaccg atgcctccac cgaagctggc gctccggttt 50 <210> 301 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 301 atcctgtaca agctgtacca acattcaata tcaggctgca gtaaagctcc 50 <210> 302 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 302 cctgtcgcgg gtaacctgca tcttcacagg tactataatt tcaccgagtc 50 <210> 303 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 303 gcccagatcg ttgcgccttt cgtgcgggtc ggaacttacc cgacaaggaa 50 <210> 304 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 304 accgttatag ttacggccgc cgtttactgg ggcttcaatt cgcaccttcg 50 <210> 305 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 305 cctcttaacc ttccagcacc gggcaggcgt cagcccctat acttcgcctt 50 <210> 306 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 306 cctgtgtttt tgctaaacag tcgcctgggc ctattcactg cggctctctc 50 <210> 307 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 307 cagagcaccc cttctcccga agttacgggg tcattttgcc gagttcctta 50 <210> 308 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 308 atcaccttag gattctctcc tcgcctacct gtgtcggttt gcggtacggg 50 <210> 309 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 309 tagaggcttt tcttggcagt gtggaatcag gaacttcgct actatatttc 50 <210> 310 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 310 tcagccttat gggaaacgga tttgcctatt tcccagccta actgcttgga 50 <210> 311 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 311 ccgcgcttac cctatcctcc tgcgtccccc cattgctcaa atggtgagga 50 <210> 312 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 312 tcaacctgtt gtccatcgcc tacgcctttc ggcctcggct taggtcccga 50 <210> 313 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 313 cgagccttcc tcaggaaacc ttaggcattc ggtggagggg attctcaccc 50 <210> 314 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 314 taccggcatt ctcacttcta agcgctccac cagtccttcc ggtctggctt 50 <210> 315 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 315 gctctcctac cactgttcga agaacagtcc gcagcttcgg tgatacgttt 50 <210> 316 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 316 tcggcgcaga gtcactcgac cagtgagcta ttacgcactc tttaaatggt 50 <210> 317 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 317 aacatcctgg ttgtctaagc aactccacat ccttttccac ttaacgtata 50 <210> 318 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 318 tggcggtctg ggctgtttcc ctttcgacta cggatcttat cactcgcagt 50 <210> 319 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 319 aagtcattgg cattcggagt ttgactgaat tcggtaaccc ggtaggggcc 50 <210> 320 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 320 gctctacctc caagactctt accttgaggc tagccctaaa gctatttcgg 50 <210> 321 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 321 tccaggttcg attggcattt cacccctacc cacacctcat ccccgcactt 50 <210> 322 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 322 ttcgggcctc cattcagtgt tacctgaact tcaccctgga catgggtaga 50 <210> 323 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 323 tctacgacca cgtactcatg cgccctattc agactcgctt tcgctgcggc 50 <210> 324 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 324 taaccttgca cgggatcgta actcgccggt tcattctaca aaaggcacgc 50 <210> 325 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 325 ggctctgact acttgtaggc acacggtttc aggatctctt tcactcccct 50 <210> 326 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 326 acctttccct cacggtactg gttcactatc ggtcactagg gagtatttag 50 <210> 327 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 327 ctcccggatt ccgacggaat ttcacgtgtt ccgccgtact caggatccac 50 <210> 328 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 328 gttttgacta cagggctgtt acctcctatg gcgggccttt ccagacctct 50 <210> 329 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 329 ctttgtaact ccgtacagag tgtcctacaa ccccaagagg caagcctctt 50 <210> 330 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 330 cgtttcgctc gccgctactc agggaatcgc atttgctttc tcttcctccg 50 <210> 331 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 331 cagttccccg ggtctgcctt ctcatatcct atgaattcag atatggatac 50 <210> 332 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 332 ggtgggtttc cccattcgga aatctccgga tcaaagcttg cttacagctc 50 <210> 333 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 333 tgttcgtccc gtccttcatc ggctcctagt gccaaggcat ccaccgtgcg 50 <210> 334 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 334 aaactagatt cgaatataac aaaacattac atcctcatcc aatccctttt 50 <210> 335 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 335 gcggtgtgtg caaggagcag ggacgtattc accgcgcgat tgtgacacgc 50 <210> 336 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 336 gcctttcggc gtcggaaccc attgtctcag ccattgtagc ccgcgtgttg 50 <210> 337 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 337 gcatacggac ctaccgtcgt ccactccttc ctcctattta tcataggcgg 50 <210> 338 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 338 cggcatccaa aaaaggatcc gctggtaact aagagcgtgg gtctcgctcg 50 <210> 339 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 339 caacctggct atcatacagc tgtcgcctct ggtgagatgt ccggcgttga 50 <210> 340 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 340 aggctccacg cgttgtggtg ctcccccgcc aattccttta agtttcagtc 50 <210> 341 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 341 ccaggcggcg gacttaacag cttcccttcg gcactgggac agctcaaagc 50 <210> 342 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 342 tccgcatcgt ttacagctag gactacccgg gtatctaatc cggttcgcgc 50 <210> 343 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 343 ttcccacagt taagctgcag gatttcacca gagacttatt aaaccggcta 50 <210> 344 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 344 ctcttattcc aaaagctctt tacactaatg aaaagccatc ccgttaagaa 50 <210> 345 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 345 cccccgtcgc gatttctcac attgcggagg tttcgcgcct gctgcacccc 50 <210> 346 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 346 ttgtctcagg ttccatctcc gggctcttgc tctcacaacc cgtaccgatc 50 <210> 347 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 347 cattacctaa ccaactacct aatcggccgc agacccatcc ttaggcgaaa 50 <210> 348 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 348 aaaccattac aggaataatt gcctatccag tattatcccc agtttcccag 50 <210> 349 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 349 aagggtaggt tatccacgtg ttactgagcc gtacgccacg agcctaaact 50 <210> 350 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 350 acctagcgcg tagctgcccg gcactgcctt atcagacaac cggtcgacca 50 <210> 351 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 351 cgttcctctc gtactggagc caccttcccc tcagactact aacacatcca 50 <210> 352 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 352 cctgtctcac gacggtctaa acccagctca cgttcccctt taatgggcga 50 <210> 353 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 353 ggtgctgctg cacacccagg atggaaagaa ccgacatcga agtagcaagc 50 <210> 354 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 354 ggctcttgcc tgcgaccacc cagttatccc cgaggtagtt tttctgtcat 50 <210> 355 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 355 aggaggactc tgaggttcgc taggcccggc tttcgcctct ggatttcttg 50 <210> 356 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 356 caaagtaagt tagaaacaca gtcataagaa agtggtgtct caagaacgaa 50 <210> 357 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 357 gacttataat cgaattctcc cacttacact gcatacctat aaccaagctt 50 <210> 358 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 358 gtaaaactct acggggtctt cgcttcccaa tggaagactc tggcttgtgc 50 <210> 359 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 359 tcactaagtt ctagctaggg acagtgggga cctcgttcta ccattcatgc 50 <210> 360 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 360 cgacaaggca tttcgctacc ttaagagggt tatagttacc cccgccgttt 50 <210> 361 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 361 aactgaactc cagcttcacg tgccagcact gggcaggtgt cgccctctgt 50 <210> 362 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 362 ctagcagaga gctatgtttt tattaaacag tcgggccccc ctagtcactg 50 <210> 363 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 363 ttaaaacgcc ttagcctact cagctagggg cacctgtgac ggatctcggt 50 <210> 364 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 364 acaaaactaa ctcccttttc aaggactcca tgaatcagtt aaaccagtac 50 <210> 365 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 365 ataatgccta cacctggttc tcgctattac acctctcccc aggcttaaac 50 <210> 366 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 366 caatcctaca aaacatatct cgaagtgtca gaaattagcc ctcaacgtca 50 <210> 367 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 367 ctttgctgct actactacca ggatccacat acctgcaagg tccaaaggaa 50 <210> 368 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 368 caacccacac aggtcgccac tctacacaat caccaaaaaa aaggtgttcc 50 <210> 369 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 369 ggattaattc ccgtccattt taggtgcctc tgacctcgat gggtgatctg 50 <210> 370 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 370 agggtggctg cttctaagcc caccttccca ttgtcttggg ccaaagactc 50 <210> 371 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 371 gtatttaggg gccttaacca tagtctgagt tgtttctctt tcgggacaca 50 <210> 372 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 372 cctcactcca accttctacg acggtgacga gttcggagtt ttacagtacg 50 <210> 373 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 373 ccctaaacgt ccaattagtg ctctaccccg ccaccaacct ccagtcaggc 50 <210> 374 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 374 aatagatcga ccggcttcgg gtttcaatgc tgtgattcca ggccctatta 50 <210> 375 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 375 acaacgctgc gggcatatcg gtttccctac gactacaagg ataaaaacct 50 <210> 376 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 376 acaaagaact ccctggcccg tgtttcaaga cggacgatgc aacactagtc 50 <210> 377 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 377 acaatgttac cactgattct ttcggaagaa ttcattcctt acgcgccaca 50 <210> 378 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 378 ctggtttcag gtacttttca cccccctata ggggtacttt tcagcattcc 50 <210> 379 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 379 ctctatcggt cttgagacgt atttagaatt ggaagttgat gcctcccaca 50 <210> 380 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 380 atcaccctct acggttctaa aattccaaat aaaattcgat ttatcccacg 50 <210> 381 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 381 tctatacacc acatctccct aatattacta aaagggattc agtttgttct 50 <210> 382 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 382 gccgttacta acgacatcgc atattgcttt cttttcctcc gcctactaag 50 <210> 383 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 383 gggttcccaa tcctacacgg atcaacacaa aaaaaatgtg ctaggaagtc 50 <210> 384 <211> 50 <212> DNA <213> Artificial sequence <220> <223> DNA Probe <400> 384 actactggga tcgaaacgag accaggtata acccccatgc tatgaccgca 50 <210> 385 <211> 50 <212> PRT <213> Mus musculus <400> 385 Gly Cys Gly Thr Ala Thr Gly Cys Cys Thr Gly Gly Ala Gly Ala Ala 1 5 10 15 Thr Thr Gly Gly Ala Ala Thr Thr Cys Thr Thr Gly Thr Thr Ala Cys 20 25 30 Thr Cys Ala Thr Ala Cys Thr Ala Ala Cys Ala Gly Thr Gly Thr Thr 35 40 45 Gly Cys 50 <210> 386 <211> 50 <212> PRT <213> Mus musculus <400> 386 Gly Ala Thr Thr Ala Ala Cys Cys Cys Ala Ala Thr Thr Thr Thr Ala 1 5 10 15 Ala Gly Thr Thr Thr Ala Gly Gly Ala Ala Gly Thr Thr Gly Gly Thr 20 25 30 Gly Thr Ala Ala Ala Thr Thr Ala Thr Gly Gly Ala Ala Thr Thr Ala 35 40 45 Ala Thr 50 <210> 387 <211> 50 <212> PRT <213> Mus musculus <400> 387 Ala Gly Cys Thr Thr Gly Ala Ala Cys Gly Cys Thr Thr Thr Cys Thr 1 5 10 15 Thr Thr Ala Thr Thr Gly Gly Thr Gly Gly Cys Thr Gly Cys Thr Thr 20 25 30 Thr Thr Ala Gly Gly Cys Cys Thr Ala Cys Ala Ala Thr Gly Gly Thr 35 40 45 Thr Ala 50 <210> 388 <211> 50 <212> PRT <213> Mus musculus <400> 388 Ala Thr Thr Ala Thr Thr Cys Ala Cys Thr Ala Thr Thr Ala Ala Ala 1 5 10 15 Gly Gly Thr Thr Thr Thr Thr Thr Cys Cys Gly Thr Thr Cys Cys Ala 20 25 30 Gly Ala Ala Gly Ala Gly Cys Thr Gly Thr Cys Cys Cys Thr Cys Thr 35 40 45 Thr Thr 50 <210> 389 <211> 50 <212> PRT <213> Mus musculus <400> 389 Cys Thr Thr Ala Cys Thr Thr Thr Thr Thr Gly Ala Thr Thr Thr Thr 1 5 10 15 Gly Thr Thr Gly Thr Thr Thr Thr Thr Thr Thr Ala Gly Cys Ala Ala 20 25 30 Gly Thr Thr Thr Ala Ala Ala Ala Thr Thr Gly Ala Ala Cys Thr Thr 35 40 45 Ala Ala 50 <210> 390 <211> 50 <212> PRT <213> Mus musculus <400> 390 Ala Ala Cys Cys Ala Gly Cys Thr Ala Thr Cys Ala Cys Cys Ala Ala 1 5 10 15 Gly Cys Thr Cys Gly Thr Thr Ala Gly Gly Cys Thr Thr Thr Thr Cys 20 25 30 Ala Cys Cys Thr Cys Thr Ala Cys Cys Thr Ala Ala Ala Ala Ala Thr 35 40 45 Cys Thr 50 <210> 391 <211> 50 <212> PRT <213> Mus musculus <400> 391 Ala Ala Thr Ala Cys Thr Thr Gly Thr Ala Ala Thr Gly Cys Thr Ala 1 5 10 15 Gly Ala Gly Gly Thr Gly Ala Thr Gly Thr Thr Thr Thr Thr Gly Gly 20 25 30 Thr Ala Ala Ala Cys Ala Gly Gly Cys Gly Gly Gly Gly Thr Thr Cys 35 40 45 Thr Thr 50 <210> 392 <211> 50 <212> PRT <213> Mus musculus <400> 392 Thr Thr Thr Ala Thr Cys Thr Thr Thr Thr Thr Gly Gly Ala Thr Cys 1 5 10 15 Thr Thr Thr Cys Cys Thr Thr Thr Ala Gly Gly Cys Ala Thr Thr Cys 20 25 30 Cys Gly Gly Thr Gly Thr Thr Gly Gly Gly Thr Thr Ala Ala Cys Ala 35 40 45 Gly Ala 50 <210> 393 <211> 50 <212> PRT <213> Mus musculus <400> 393 Thr Thr Ala Thr Thr Thr Ala Thr Ala Gly Thr Gly Thr Gly Ala Thr 1 5 10 15 Thr Ala Thr Thr Gly Cys Cys Thr Ala Thr Ala Gly Thr Cys Thr Gly 20 25 30 Ala Thr Thr Ala Ala Cys Thr Ala Ala Cys Ala Ala Thr Gly Gly Thr 35 40 45 Thr Ala 50 <210> 394 <211> 50 <212> PRT <213> Rattus norvegicus <400> 394 Ala Gly Thr Gly Ala Thr Thr Gly Thr Ala Gly Thr Thr Gly Thr Thr 1 5 10 15 Thr Ala Thr Thr Cys Ala Cys Thr Ala Thr Thr Thr Ala Ala Gly Gly 20 25 30 Thr Thr Thr Thr Thr Thr Cys Cys Thr Thr Thr Thr Cys Cys Thr Ala 35 40 45 Ala Ala 50 <210> 395 <211> 50 <212> PRT <213> Rattus norvegicus <400> 395 Thr Gly Gly Cys Thr Ala Thr Ala Thr Thr Thr Thr Ala Ala Gly Thr 1 5 10 15 Thr Thr Ala Cys Ala Thr Thr Thr Thr Gly Ala Thr Thr Thr Gly Thr 20 25 30 Thr Gly Thr Thr Cys Thr Gly Ala Thr Gly Gly Thr Ala Ala Gly Cys 35 40 45 Thr Thr 50 <210> 396 <211> 50 <212> PRT <213> Rattus norvegicus <400> 396 Thr Thr Thr Thr Thr Thr Thr Ala Ala Thr Cys Thr Thr Thr Cys Cys 1 5 10 15 Thr Thr Ala Ala Ala Gly Cys Ala Cys Gly Cys Cys Thr Gly Thr Gly 20 25 30 Thr Thr Gly Gly Gly Cys Thr Ala Ala Cys Gly Ala Gly Thr Thr Ala 35 40 45 Gly Gly 50 <210> 397 <211> 50 <212> PRT <213> Rattus norvegicus <400> 397 Thr Gly Thr Thr Gly Gly Gly Thr Thr Ala Gly Thr Ala Cys Cys Thr 1 5 10 15 Ala Thr Gly Ala Thr Thr Cys Gly Ala Thr Ala Ala Thr Thr Gly Ala 20 25 30 Cys Ala Ala Thr Gly Gly Thr Thr Ala Thr Cys Cys Gly Gly Gly Thr 35 40 45 Thr Gly 50 <210> 398 <211> 50 <212> PRT <213> Rattus norvegicus <400> 398 Ala Gly Gly Ala Gly Ala Ala Thr Thr Gly Gly Thr Thr Cys Thr Thr 1 5 10 15 Gly Thr Thr Ala Cys Thr Cys Ala Thr Ala Thr Thr Ala Ala Cys Ala 20 25 30 Gly Thr Ala Thr Thr Thr Cys Ala Thr Cys Thr Ala Thr Gly Gly Ala 35 40 45 Thr Cys 50 <210> 399 <211> 50 <212> PRT <213> Rattus norvegicus <400> 399 Thr Thr Thr Gly Thr Gly Ala Thr Ala Thr Ala Gly Gly Ala Ala Thr 1 5 10 15 Thr Thr Ala Thr Thr Gly Ala Gly Gly Thr Thr Thr Gly Thr Gly Gly 20 25 30 Ala Ala Thr Thr Ala Gly Thr Gly Thr Gly Thr Gly Thr Ala Ala Gly 35 40 45 Thr Ala 50 <210> 400 <211> 50 <212> PRT <213> Mus musculus <400> 400 Gly Cys Cys Gly Gly Gly Gly Ala Gly Thr Gly Gly Gly Thr Cys Thr 1 5 10 15 Thr Cys Cys Gly Thr Ala Cys Gly Cys Cys Ala Cys Ala Thr Thr Thr 20 25 30 Cys Cys Cys Ala Cys Gly Cys Cys Gly Cys Gly Ala Cys Gly Cys Gly 35 40 45 Cys Gly 50 <210> 401 <211> 50 <212> PRT <213> Mus musculus <400> 401 Ala Cys Cys Thr Cys Gly Gly Gly Cys Cys Cys Cys Cys Gly Gly Gly 1 5 10 15 Cys Gly Gly Gly Gly Cys Cys Cys Thr Thr Cys Ala Cys Cys Thr Thr 20 25 30 Cys Ala Thr Thr Gly Cys Gly Cys Cys Ala Cys Gly Gly Cys Gly Gly 35 40 45 Cys Thr 50 <210> 402 <211> 50 <212> PRT <213> Mus musculus <400> 402 Thr Cys Gly Cys Gly Thr Cys Cys Ala Gly Ala Gly Thr Cys Gly Cys 1 5 10 15 Cys Gly Cys Cys Gly Cys Cys Gly Cys Cys Gly Gly Cys Cys Cys Cys 20 25 30 Cys Cys Gly Ala Gly Thr Gly Thr Cys Cys Gly Gly Gly Cys Cys Cys 35 40 45 Cys Cys 50 <210> 403 <211> 50 <212> PRT <213> Mus musculus <400> 403 Cys Gly Cys Thr Gly Gly Thr Thr Cys Cys Thr Cys Cys Cys Gly Cys 1 5 10 15 Thr Cys Cys Gly Gly Ala Ala Cys Cys Cys Cys Cys Gly Cys Gly Gly 20 25 30 Gly Gly Thr Thr Gly Gly Ala Cys Cys Cys Gly Cys Cys Gly Cys Cys 35 40 45 Cys Cys 50 <210> 404 <211> 50 <212> PRT <213> Mus musculus <400> 404 Cys Gly Cys Cys Gly Ala Cys Cys Cys Cys Cys Gly Ala Cys Cys Cys 1 5 10 15 Gly Cys Cys Cys Cys Cys Cys Gly Ala Cys Gly Gly Gly Ala Ala Gly 20 25 30 Ala Ala Gly Gly Ala Gly Gly Gly Gly Gly Gly Ala Ala Gly Ala Gly 35 40 45 Ala Gly 50 <210> 405 <211> 50 <212> PRT <213> Mus musculus <400> 405 Gly Gly Gly Ala Cys Gly Ala Cys Gly Gly Gly Gly Cys Cys Cys Cys 1 5 10 15 Gly Cys Gly Gly Gly Gly Ala Ala Gly Ala Gly Gly Gly Gly Ala Gly 20 25 30 Gly Gly Cys Gly Gly Gly Cys Cys Cys Gly Gly Gly Cys Gly Gly Ala 35 40 45 Ala Ala 50 <210> 406 <211> 50 <212> PRT <213> Mus musculus <400> 406 Gly Gly Cys Gly Cys Cys Gly Cys Gly Cys Gly Gly Ala Ala Ala Ala 1 5 10 15 Cys Cys Gly Cys Gly Gly Cys Cys Cys Gly Gly Gly Gly Gly Gly Cys 20 25 30 Gly Gly Ala Cys Cys Cys Gly Gly Cys Gly Gly Gly Gly Gly Ala Ala 35 40 45 Cys Ala 50 <210> 407 <211> 50 <212> PRT <213> Mus musculus <400> 407 Cys Cys Cys Cys Cys Ala Cys Ala Cys Gly Cys Gly Cys Gly Gly Gly 1 5 10 15 Ala Cys Ala Cys Gly Cys Cys Cys Gly Cys Cys Cys Gly Cys Cys Cys 20 25 30 Cys Cys Gly Cys Cys Ala Cys Gly Cys Ala Cys Cys Thr Cys Gly Gly 35 40 45 Gly Ala 50 <210> 408 <211> 50 <212> PRT <213> Mus musculus <400> 408 Cys Ala Cys Cys Cys Gly Cys Thr Thr Thr Gly Gly Gly Cys Thr Gly 1 5 10 15 Cys Ala Thr Thr Cys Cys Cys Ala Ala Gly Cys Ala Ala Cys Cys Cys 20 25 30 Gly Ala Cys Thr Cys Cys Gly Gly Gly Ala Ala Gly Ala Cys Cys Cys 35 40 45 Gly Ala 50 <210> 409 <211> 50 <212> PRT <213> Mus musculus <400> 409 Thr Gly Gly Ala Gly Cys Gly Ala Gly Gly Cys Cys Cys Cys Gly Cys 1 5 10 15 Gly Gly Gly Gly Ala Gly Gly Gly Gly Ala Cys Cys Cys Gly Cys Gly 20 25 30 Cys Cys Gly Gly Cys Ala Cys Cys Cys Gly Cys Cys Gly Gly Gly Cys 35 40 45 Thr Cys 50 <210> 410 <211> 50 <212> PRT <213> Mus musculus <400> 410 Cys Gly Ala Gly Gly Cys Cys Gly Gly Cys Gly Thr Gly Cys Cys Cys 1 5 10 15 Cys Gly Ala Cys Cys Cys Cys Gly Ala Cys Gly Cys Gly Ala Gly Gly 20 25 30 Ala Cys Gly Gly Gly Gly Cys Cys Gly Gly Gly Cys Gly Cys Cys Gly 35 40 45 Gly Gly 50 <210> 411 <211> 50 <212> PRT <213> Mus musculus <400> 411 Thr Cys Cys Cys Cys Gly Gly Ala Gly Cys Gly Gly Gly Thr Cys Gly 1 5 10 15 Cys Gly Cys Cys Cys Gly Cys Cys Cys Gly Cys Ala Cys Gly Cys Gly 20 25 30 Cys Gly Gly Gly Ala Cys Gly Gly Ala Cys Gly Cys Thr Thr Gly Gly 35 40 45 Cys Gly 50 <210> 412 <211> 50 <212> PRT <213> Mus musculus <400> 412 Thr Cys Cys Ala Cys Ala Cys Gly Ala Ala Cys Gly Thr Gly Cys Gly 1 5 10 15 Thr Thr Cys Ala Ala Cys Gly Thr Gly Ala Cys Gly Gly Gly Cys Gly 20 25 30 Ala Gly Ala Gly Gly Gly Cys Gly Gly Cys Cys Cys Cys Cys Thr Thr 35 40 45 Thr Cys 50 <210> 413 <211> 50 <212> PRT <213> Mus musculus <400> 413 Thr Cys Cys Cys Ala Ala Gly Ala Cys Gly Ala Ala Cys Gly Gly Cys 1 5 10 15 Thr Cys Thr Cys Cys Gly Cys Ala Cys Cys Gly Gly Ala Cys Cys Cys 20 25 30 Cys Gly Gly Thr Cys Cys Cys Gly Ala Cys Gly Cys Cys Cys Gly Gly 35 40 45 Cys Gly 50 <210> 414 <211> 50 <212> PRT <213> Mus musculus <400> 414 Cys Cys Gly Cys Cys Gly Cys Gly Gly Gly Gly Ala Cys Gly Ala Cys 1 5 10 15 Gly Cys Gly Gly Gly Gly Ala Cys Cys Cys Cys Gly Cys Cys Gly Ala 20 25 30 Gly Cys Gly Gly Gly Gly Ala Cys Gly Gly Ala Cys Gly Gly Gly Gly 35 40 45 Ala Cys 50 <210> 415 <211> 50 <212> PRT <213> Mus musculus <400> 415 Gly Cys Ala Cys Cys Gly Cys Cys Ala Cys Gly Gly Thr Gly Gly Ala 1 5 10 15 Ala Gly Thr Gly Cys Gly Cys Cys Cys Gly Gly Cys Gly Gly Cys Gly 20 25 30 Gly Cys Cys Gly Gly Thr Cys Gly Cys Cys Gly Gly Cys Cys Gly Gly 35 40 45 Gly Gly 50 <210> 416 <211> 50 <212> PRT <213> Mus musculus <400> 416 Cys Cys Cys Ala Cys Cys Gly Gly Gly Cys Cys Cys Cys Gly Ala Gly 1 5 10 15 Ala Gly Ala Gly Gly Cys Gly Ala Cys Gly Gly Ala Gly Gly Gly Gly 20 25 30 Gly Gly Thr Gly Gly Gly Ala Gly Ala Gly Cys Gly Gly Thr Cys Gly 35 40 45 Cys Gly 50 <210> 417 <211> 50 <212> PRT <213> Mus musculus <400> 417 Cys Cys Cys Gly Gly Cys Cys Cys Cys Cys Ala Cys Cys Cys Cys Cys 1 5 10 15 Ala Cys Gly Cys Cys Cys Gly Cys Cys Cys Gly Gly Gly Ala Gly Gly 20 25 30 Cys Gly Gly Ala Cys Gly Gly Gly Gly Gly Gly Ala Gly Ala Gly Gly 35 40 45 Gly Ala 50 <210> 418 <211> 50 <212> PRT <213> Mus musculus <400> 418 Thr Ala Thr Cys Thr Gly Gly Cys Thr Thr Cys Cys Thr Cys Gly Gly 1 5 10 15 Cys Cys Cys Cys Gly Gly Gly Ala Thr Thr Cys Gly Gly Cys Gly Ala 20 25 30 Ala Ala Gly Cys Gly Cys Gly Gly Cys Cys Gly Gly Ala Gly Gly Gly 35 40 45 Cys Thr 50 <210> 419 <211> 50 <212> PRT <213> Mus musculus <400> 419 Cys Gly Cys Cys Gly Cys Cys Gly Ala Cys Cys Cys Cys Gly Thr Gly 1 5 10 15 Cys Gly Cys Thr Cys Gly Gly Cys Thr Thr Cys Gly Thr Cys Gly Gly 20 25 30 Gly Ala Gly Ala Cys Gly Cys Gly Thr Gly Ala Cys Cys Gly Ala Cys 35 40 45 Gly Gly 50 <210> 420 <211> 50 <212> PRT <213> Mus musculus <400> 420 Gly Cys Gly Cys Cys Cys Cys Cys Cys Cys Gly Cys Ala Cys Cys Cys 1 5 10 15 Gly Cys Cys Cys Cys Gly Thr Cys Cys Cys Cys Cys Cys Cys Gly Cys 20 25 30 Gly Gly Ala Cys Gly Gly Gly Gly Ala Ala Gly Ala Ala Gly Gly Gly 35 40 45 Ala Gly 50 <210> 421 <211> 50 <212> PRT <213> Mus musculus <400> 421 Cys Gly Ala Ala Cys Cys Cys Cys Gly Gly Gly Ala Ala Cys Cys Cys 1 5 10 15 Cys Cys Gly Ala Cys Cys Cys Cys Gly Cys Gly Gly Ala Gly Gly Gly 20 25 30 Gly Gly Ala Ala Gly Gly Gly Gly Gly Ala Gly Gly Ala Cys Gly Ala 35 40 45 Gly Gly 50 <210> 422 <211> 50 <212> PRT <213> Mus musculus <400> 422 Cys Ala Cys Cys Cys Gly Gly Gly Gly Gly Gly Gly Cys Gly Ala Cys 1 5 10 15 Gly Ala Gly Gly Cys Gly Gly Gly Gly Ala Cys Cys Cys Gly Cys Cys 20 25 30 Gly Gly Ala Cys Gly Gly Gly Gly Ala Cys Gly Gly Ala Cys Gly Gly 35 40 45 Gly Gly 50 <210> 423 <211> 50 <212> PRT <213> Mus musculus <400> 423 Gly Cys Cys Ala Ala Cys Cys Gly Ala Gly Gly Cys Thr Cys Cys Thr 1 5 10 15 Thr Cys Gly Gly Cys Gly Cys Thr Gly Cys Cys Gly Thr Ala Thr Cys 20 25 30 Gly Thr Thr Cys Cys Gly Cys Thr Thr Gly Gly Gly Cys Gly Gly Ala 35 40 45 Thr Thr 50 <210> 424 <211> 50 <212> PRT <213> Mus musculus <400> 424 Cys Cys Cys Gly Gly Gly Cys Cys Cys Cys Cys Gly Gly Ala Cys Cys 1 5 10 15 Cys Cys Cys Gly Ala Gly Ala Gly Gly Gly Ala Cys Gly Ala Cys Gly 20 25 30 Gly Ala Gly Gly Cys Gly Ala Cys Gly Gly Gly Gly Gly Gly Thr Gly 35 40 45 Gly Gly 50 <210> 425 <211> 50 <212> PRT <213> Mus musculus <400> 425 Thr Gly Gly Gly Ala Gly Gly Gly Gly Cys Gly Gly Cys Cys Cys Gly 1 5 10 15 Gly Cys Cys Cys Cys Cys Gly Cys Gly Ala Cys Cys Gly Cys Cys Cys 20 25 30 Cys Cys Cys Thr Thr Thr Cys Cys Gly Cys Cys Ala Cys Cys Cys Cys 35 40 45 Ala Cys 50 <210> 426 <211> 50 <212> PRT <213> Mus musculus <400> 426 Gly Gly Gly Ala Gly Ala Gly Gly Cys Cys Gly Gly Gly Gly Gly Gly 1 5 10 15 Ala Gly Ala Gly Cys Gly Cys Gly Gly Cys Gly Ala Cys Gly Gly Gly 20 25 30 Thr Ala Thr Cys Cys Gly Gly Cys Thr Cys Cys Cys Thr Cys Gly Gly 35 40 45 Cys Cys 50 <210> 427 <211> 50 <212> PRT <213> Mus musculus <400> 427 Cys Gly Cys Thr Gly Cys Thr Gly Cys Cys Gly Gly Gly Gly Gly Gly 1 5 10 15 Cys Thr Gly Thr Ala Ala Cys Ala Cys Thr Cys Gly Gly Gly Gly Cys 20 25 30 Gly Gly Gly Gly Thr Gly Gly Thr Cys Cys Gly Gly Cys Gly Cys Cys 35 40 45 Cys Ala 50 <210> 428 <211> 50 <212> PRT <213> Mus musculus <400> 428 Cys Gly Cys Cys Gly Cys Cys Gly Ala Cys Cys Cys Cys Gly Thr Gly 1 5 10 15 Cys Gly Cys Thr Cys Gly Gly Cys Thr Thr Cys Gly Cys Thr Cys Cys 20 25 30 Cys Cys Cys Cys Cys Ala Cys Cys Cys Cys Gly Ala Gly Ala Ala Gly 35 40 45 Gly Gly 50

Claims (50)

  1. 핵산 샘플로부터 비표적 RNA 분자를 고갈시키는 방법으로서,
    a) 적어도 하나의 표적 RNA 또는 DNA 서열 및 적어도 하나의 비표적(off-target) RNA 분자를 포함하는 핵산 샘플을, 상기 적어도 하나의 비표적 RNA 분자의 전장(full length)을 따라 불연속 서열에 상보적인 적어도 2개의 DNA 프로브(probe)를 포함하는 프로브 세트와 접촉시켜, DNA 프로브를 비표적 RNA 분자에 하이브리디제이션(hybridization)하여 DNA:RNA 하이브리드(hybrid)를 형성하는 단계로서, 각각의 DNA:RNA 하이브리드는 임의의 다른 DNA:RNA 하이브리드로부터 주어진 비표적 RNA 분자 서열을 따라 적어도 5개의 염기에 의해 떨어져 있거나 적어도 10개의 염기에 의해 떨어져 있는, 상기 NA:RNA 하이브리드를 형성하는 단계; 및
    b) DNA:RNA 하이브리드를 DNA:RNA 하이브리드로부터 RNA를 분해시키는 리보뉴클레아제와 접촉시켜, 핵산 샘플의 비표적 RNA 분자를 분해하여 분해 혼합물을 형성하는 단계
    를 포함하는, 핵산 샘플로부터 비표적 RNA 분자를 고갈시키는 방법.
  2. 제1항에 있어서, c) 임의로 상기 분해 혼합물을 DNA 분해 효소와 접촉시킴으로써, 임의의 잔류 DNA 프로브를 분해시켜, DNA 분해 혼합물을 형성하는 단계로서, 임의로, 상기 DNA 분해 효소는 DNase I인, 상기 DNA 분해 혼합물을 형성하는 단계; 및 d) 분해된 RNA를 상기 분해 혼합물 또는 상기 DNA 분해 혼합물로부터 분리하는 단계를 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 프로브 세트와 접촉시키는 단계는 상기 핵산 샘플을 불안정화제(destabilizer)로 처리하는 단계를 포함하는, 방법.
  4. 제3항에 있어서, 상기 불안정화제는 열 또는 핵산 불안정화 화학물질이고, 임의로 상기 핵산 불안정화 화학물질은 베타인, DMSO, 포름아미드, 글리세롤 또는 이들의 유도체, 또는 이들의 혼합물인, 방법.
  5. 제4항에 있어서, 상기 핵산 불안정화 화학물질은 포름아미드이며, 임의로 상기 포름아미드는 상기 프로브 세트와 접촉하는 동안에 약 10 내지 45 부피%의 농도로 존재하는, 방법.
  6. 제4항에 있어서, 상기 샘플을 열로 처리하는 단계는 상기 적어도 하나의 DNA:RNA 하이브리드의 용해 온도보다 높은 열을 가하는 단계를 포함하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 리보뉴클레아제가 RNase H 또는 하이브리다아제(Hybridase)인, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 핵산 샘플은 인간 또는 비인간 영장류로부터 유래되는, 방법.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 핵산 샘플은 래트 또는 마우스로부터 유래되는, 방법.
  10. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 핵산 샘플은 비인간 유래의 핵산을 포함하는, 방법.
  11. 제10항에 있어서, 상기 비인간 유래의 핵산은 비인간 진핵생물, 박테리아, 바이러스, 식물, 토양 또는 이들의 혼합물로부터 유래되는, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 비표적 RNA는 rRNA, mRNA, tRNA 또는 이들의 혼합물인, 방법.
  13. 제12항에 있어서, 상기 비표적 RNA는 rRNA 및 글로빈 mRNA인, 방법.
  14. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 프로브 세트는 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 및 HBG2로부터 선택되는 적어도 하나의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 방법.
  15. 제14항에 있어서, 상기 프로브 세트는 인간 유래의 28S, 18S, 5.8S, 5S, 16S 및 12S로부터 선택되는 2개 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 프로브 세트는 헤모글로빈 유래의 HBA-A1, HBA-A2, HBB, HBG1 및 HBG2, 및 그람 양성균 또는 그람 음성균 유래의 23S, 16S 및 5S로부터 선택되는 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 프로브 세트는 고세균(Archaea) 종 유래의 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 프로브 세트는 임의로 래트 16S, 래트 28S, 마우스 16S 및 마우스 28S, 및 이들의 조합으로부터 선택되는 래트 및/또는 마우스 유래의 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 특정 비표적 RNA 분자에 대한 프로브는 상기 비표적 RNA 분자 서열의 약 80 내지 85%에 상보적이며, 각각의 프로브 하이브리디제이션 부위 사이에 적어도 5개 또는 적어도 10개의 염기로 된 갭이 존재하는, 방법.
  20. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 DNA 프로브는,
    (a) 서열 번호 1 내지 333으로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상 또는 333개의 서열;
    (b) 서열 번호 1 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상, 400개 이상 또는 428개의 서열;
    (c) 서열 번호 1 내지 377로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 377개의 서열;
    (d) 서열 번호 1 내지 333 및 서열 번호 378 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 384개의 서열;
    (e) 서열 번호 334 내지 377로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상 또는 44개의 서열; 또는
    (f) 서열 번호 378 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상 또는 51개의 서열; 또는
    이들의 조합을 포함하는, 방법.
  21. 핵산 샘플 중의 적어도 하나의 비표적 RNA 분자의 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 있는 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트 및 DNA:RNA 하이브리드 중의 RNA를 분해할 수 있는 리보뉴클레아제를 포함하는, 조성물.
  22. 제19항에 있어서, 상기 리보뉴클레아제가 RNase H인, 조성물.
  23. 제21항 또는 제22항에 있어서, 각각의 DNA 프로브는 상기 프로브 세트 중의 임의의 다른 DNA 프로브로부터, 상기 적어도 하나의 비표적 RNA 분자의 전장을 따라 적어도 10개의 염기에 의해 떨어져서 하이브리디제이션되는, 조성물.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, 불안정화 화학물질을 포함하는, 조성물.
  25. 제24 항에 있어서, 상기 불안정화 화학물질은 포름아미드인, 조성물.
  26. 제21항 내지 제25항 중 어느 한 항에 있어서, 상기 비표적 RNA는 rRNA, mRNA, tRNA 또는 이들의 혼합물인, 조성물.
  27. 제26항에 있어서, 상기 비표적 RNA는 rRNA 및 글로빈 mRNA인, 조성물.
  28. 제21항 내지 제27항 중 어느 한 항에 있어서, 상기 프로브 세트는 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBG1 및 HBG2로부터 선택되는 적어도 하나의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 조성물.
  29. 제28항에 있어서, 상기 프로브 세트는 인간 유래의 28S, 18S, 5.8S, 5S, 16S 및 12S로부터 선택되는 2개 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 조성물.
  30. 제21항 내지 제29항 중 어느 한 항에 있어서, 상기 프로브 세트는 헤모글로빈 유래의 HBA-A1, HBA-A2, HBB, HBG1 및 HBG2, 및 그람 양성균 또는 그람 음성균 유래의 23S, 16S 및 5S로부터 선택되는 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 조성물.
  31. 제21항 내지 제30항 중 어느 한 항에 있어서, 상기 프로브 세트는 고세균 종 유래의 하나 이상의 rRNA 분자에 상보적인 적어도 2개의 DNA 프로브를 포함하는, 조성물.
  32. 제21항 내지 제31항 중 어느 한 항에 있어서, 상기 프로브 세트는 임의로 래트 16S, 래트 28S, 마우스 16S 및 마우스 28S, 및 이들의 조합으로부터 선택되는 래트 및/또는 마우스 유래의 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 DNA 프로브를 포함하는, 조성물.
  33. 제21항 내지 제32항 중 어느 한 항에 있어서, 상기 DNA 프로브는,
    (a) 서열 번호 1 내지 333으로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상 또는 333개의 서열;
    (b) 서열 번호 1 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상, 400개 이상 또는 428개의 서열;
    (c) 서열 번호 1 내지 377로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 377개의 서열;
    (d) 서열 번호 1 내지 333 및 서열 번호 378 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 384개의 서열;
    (e) 서열 번호 334 내지 377로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상 또는 44개의 서열; 또는
    (f) 서열 번호 378 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상 또는 51개의 서열; 또는
    이들의 조합을 포함하는, 조성물.
  34. 핵산 샘플 중의 적어도 하나의 비표적 RNA 분자의 전장을 따라 적어도 5개 또는 적어도 10개의 염기에 의해 떨어져 있는 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트 및 DNA:RNA 하이브리드 중의 RNA를 분해할 수 있는 리보뉴클레아제를 포함하는, 키트.
  35. 제34항에 있어서, 완충액 및 핵산 정제 배지, 및 임의로 불안정화 화학물질을 포함하는, 키트.
  36. 제34항 또는 제35항에 있어서, 상기 비표적 RNA는 rRNA, mRNA, tRNA 또는 이들의 혼합물인, 키트.
  37. 제36항에 있어서, 상기 비표적 RNA는 rRNA 및 글로빈 mRNA인, 키트.
  38. 제34항 내지 제37항 중 어느 한 항에 있어서, 상기 프로브 세트는 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBG1 및 HBG2로부터 선택되는 적어도 하나의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 키트.
  39. 제38항에 있어서, 상기 프로브 세트는 인간 유래의 28S, 18S, 5.8S, 5S, 16S 및 12S로부터 선택되는 2개 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 키트.
  40. 제34항 내지 제39항 중 어느 한 항에 있어서, 상기 프로브 세트는 헤모글로빈 유래의 HBA-A1, HBA-A2, HBB, HBG1 및 HBG2, 및 그람 양성균 또는 그람 음성균 유래의 23S, 16S 및 5S로부터 선택되는 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 적어도 2개의 DNA 프로브를 포함하는, 키트.
  41. 제34항 내지 제40항 중 어느 한 항에 있어서, 상기 프로브 세트는 고세균 종 유래의 하나 이상의 rRNA 분자에 상보적인 적어도 2개의 DNA 프로브를 포함하는, 키트.
  42. 제34항 내지 제41항 중 어느 한 항에 있어서, 상기 프로브 세트는 임의로 래트 16S, 래트 28S, 마우스 16S 및 마우스 28S, 및 이들의 조합으로부터 선택되는 래트 및/또는 마우스 유래의 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 DNA 프로브를 포함하는, 키트.
  43. 제34항 내지 제42항 중 어느 한 항에 있어서, 상기 DNA 프로브는,
    (a) 서열 번호 1 내지 333으로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상 또는 333개의 서열;
    (b) 서열 번호 1 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상, 400개 이상 또는 428개의 서열;
    (c) 서열 번호 1 내지 377로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 377개의 서열;
    (d) 서열 번호 1 내지 333 및 서열 번호 378 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 350개 이상 또는 384개의 서열;
    (e) 서열 번호 334 내지 377로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상 또는 44개의 서열; 또는
    (f) 서열 번호 378 내지 428로부터 선택되는 2개 이상, 5개 이상, 10개 이상, 25개 이상, 50개 이상 또는 51개의 서열; 또는
    이들의 조합을 포함하는, 키트.
  44. 제34항에 있어서,
    (1) 서열 번호 1 내지 333을 포함하는 프로브 세트;
    (2) 임의로 RNase H인 리보뉴클레아제;
    (3) DNase; 및
    (4) RNA 정제 비드를 포함하며;
    임의로 RNA 고갈 완충액, 프로브 고갈 완충액 및 프로브 제거 완충액을 추가로 포함하는, 키트.
  45. 핵산 샘플로부터 비표적 RNA 핵산 분자를 고갈시키는데 사용되는 프로브 세트를 보충하는 방법으로서,
    a) 적어도 하나의 RNA 또는 DNA 표적 서열 및 제1 종 유래의 적어도 하나의 비표적 RNA 분자를 포함하는 핵산 샘플을, 제2 종 유래의 적어도 하나의 비표적 RNA 분자의 전장을 따라 불연속 서열에 상보적인 적어도 2개의 DNA 프로브를 포함하는 프로브 세트와 접촉시켜, DNA 프로브를 비표적 RNA 분자에 하이브리디제이션하여 DNA:RNA 하이브리드를 형성하는 단계로서, 각각의 DNA:RNA 하이브리드는 임의의 다른 DNA:RNA 하이브리드로부터, 주어진 비표적 RNA 분자 서열을 따라 적어도 5개의 염기에 의해 떨어져 있거나 적어도 10개의 염기에 의해 떨어져 있는, 상기 DNA:RNA 하이브리드를 형성하는 단계;
    b) DNA:RNA 하이브리드를 DNA:RNA 하이브리드로부터 RNA를 분해시키는 리보뉴클레아제와 접촉시켜, 핵산 샘플의 비표적 RNA 분자를 분해하여 분해 혼합물을 형성하는 단계;
    c) 분해된 RNA를 분해 혼합물로부터 분리하는 단계;
    d) 상기 샘플로부터 잔류 RNA를 시퀀싱하는 단계;
    e) 제1 종 유래의 비표적 RNA 분자의 존재에 대한 잔류 RNA 서열을 평가하여, 갭 서열 영역을 결정하는 단계; 및
    f) 프로브 세트를 하나 이상의 갭 서열 영역에서 불연속 서열에 상보적인 추가의 DNA 프로브로 보충하는 단계를 포함하는, 프로브 세트를 보충하는 방법.
  46. 제45항에 있어서, 상기 갭 서열 영역은 50개 이상의 염기쌍을 포함하는, 방법.
  47. 제45항 또는 제46항에 있어서, 상기 제1 종은 비인간 종이고, 상기 제2 종은 인간인, 방법.
  48. 제47항에 있어서, 상기 제1 종은 래트 또는 마우스인, 방법.
  49. 제47항 또는 제48항에 있어서, 제21항 내지 제33항 중 어느 한 항의 조성물은 리보뉴클레아제, 및 인간의 적어도 하나의 비표적 RNA 분자의 전장을 따라 불연속 서열에 상보적인 DNA 프로브를 포함하는 프로브 세트를 공급하는데 사용되는, 방법.
  50. 제48항 또는 제49항에 있어서, 임의로 래트 16S, 래트 28S, 마우스 16S 및 마우스 28S, 및 이들의 조합으로부터 선택되는 래트 및/또는 마우스 유래의 하나 이상의 비표적 RNA 분자에 하이브리디제이션되는 DNA 프로브를 식별하는데 사용되는, 방법.
KR1020217009649A 2018-12-21 2019-12-19 뉴클레아제 기반 rna 고갈 KR20210107618A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862783869P 2018-12-21 2018-12-21
US62/783,869 2018-12-21
US201962847797P 2019-05-14 2019-05-14
US62/847,797 2019-05-14
PCT/US2019/067582 WO2020132304A1 (en) 2018-12-21 2019-12-19 Nuclease-based rna depletion

Publications (1)

Publication Number Publication Date
KR20210107618A true KR20210107618A (ko) 2021-09-01

Family

ID=69173481

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217009649A KR20210107618A (ko) 2018-12-21 2019-12-19 뉴클레아제 기반 rna 고갈

Country Status (12)

Country Link
US (3) US11421216B2 (ko)
EP (1) EP3899029A1 (ko)
JP (1) JP2022512058A (ko)
KR (1) KR20210107618A (ko)
CN (2) CN113166797B (ko)
AU (1) AU2019405940A1 (ko)
BR (1) BR112021006044A2 (ko)
CA (1) CA3114754A1 (ko)
IL (1) IL281834A (ko)
MX (1) MX2021003712A (ko)
SG (1) SG11202102710SA (ko)
WO (1) WO2020132304A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023018031A1 (ko) 2021-08-13 2023-02-16 주식회사 엘지화학 고분자 복합체 및 이를 포함하는 성형품

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
US20220049294A1 (en) 2018-12-10 2022-02-17 10X Genomics, Inc. Imaging system hardware
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
WO2021092433A2 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Enhancing specificity of analyte binding
EP4077714A1 (en) * 2019-12-19 2022-10-26 Illumina Inc Designing probes for depleting abundant transcripts
ES2946357T3 (es) 2019-12-23 2023-07-17 10X Genomics Inc Métodos para el análisis espacial usando ligación con molde de ARN
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US12076701B2 (en) 2020-01-31 2024-09-03 10X Genomics, Inc. Capturing oligonucleotides in spatial transcriptomics
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
CN115916999A (zh) 2020-04-22 2023-04-04 10X基因组学有限公司 用于使用靶向rna耗竭进行空间分析的方法
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
EP4414459A3 (en) 2020-05-22 2024-09-18 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
US12031177B1 (en) 2020-06-04 2024-07-09 10X Genomics, Inc. Methods of enhancing spatial resolution of transcripts
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
EP4165207B1 (en) 2020-06-10 2024-09-25 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
EP4172362B1 (en) 2020-06-25 2024-09-18 10X Genomics, Inc. Spatial analysis of dna methylation
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
AU2022246579A1 (en) 2021-03-30 2023-09-21 Illumina, Inc. Improved methods of isothermal complementary dna and library preparation
WO2022256503A1 (en) 2021-06-03 2022-12-08 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
WO2023056328A2 (en) 2021-09-30 2023-04-06 Illumina, Inc. Solid supports and methods for depleting and/or enriching library fragments prepared from biosamples
WO2024077162A2 (en) 2022-10-06 2024-04-11 Illumina, Inc. Probes for improving coronavirus sample surveillance
WO2024077152A1 (en) 2022-10-06 2024-04-11 Illumina, Inc. Probes for depleting abundant small noncoding rna
WO2024077202A2 (en) 2022-10-06 2024-04-11 Illumina, Inc. Probes for improving environmental sample surveillance

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
AU7268691A (en) * 1990-03-07 1991-09-12 Molecular Diagnostics, Inc. Ribonuclease scission chain reaction
AU738261B2 (en) * 1990-12-31 2001-09-13 Promega Corporation Nucleic acid amplification with DNA-dependent RNA polymerase activity of RNA replicases
AU5298393A (en) * 1992-10-08 1994-05-09 Regents Of The University Of California, The Pcr assays to determine the presence and concentration of a target
US5871902A (en) * 1994-12-09 1999-02-16 The Gene Pool, Inc. Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids
US20040152084A1 (en) * 2003-01-31 2004-08-05 Slattum Paul M. Compounds and processes for single-pot attachment of a label to nucleic acid
US6962906B2 (en) * 2000-03-14 2005-11-08 Active Motif Oligonucleotide analogues, methods of synthesis and methods of use
US6824980B2 (en) 2000-06-08 2004-11-30 Xiao Bing Wang Isometric primer extension method and kit for detection and quantification of specific nucleic acid
US6900013B1 (en) * 2000-08-25 2005-05-31 Aviva Biosciences Corporation Methods and compositions for identifying nucleic acid molecules using nucleolytic activities and hybridization
EP1387894A4 (en) * 2000-08-24 2006-10-11 Aviva Biosciences Corp METHODS AND COMPOSITIONS FOR IDENTIFYING NUCLEIC ACID MOLECULES USING NUCLEOLYTIC ACTIVITIES AND HYBRIDIZATION
JP2002360256A (ja) * 2001-06-04 2002-12-17 Inst Of Physical & Chemical Res Rnaプローブ作成方法、標的核酸の検出方法及びrnaプローブ作成用キット
US20050003369A1 (en) 2002-10-10 2005-01-06 Affymetrix, Inc. Method for depleting specific nucleic acids from a mixture
CN101103122A (zh) * 2004-12-11 2008-01-09 西托吉尼克斯公司 高质量核酸的无细胞生物合成及其用途
US20080102454A1 (en) 2006-10-31 2008-05-01 Hui Wang Reducing size of analytes in RNA sample
DE212010000039U1 (de) 2009-04-03 2012-02-02 Helixis, Inc. Geräte zum erhitzen biologischer proben
ES2573277T3 (es) 2009-08-14 2016-06-07 Epicentre Technologies Corporation Métodos, composiciones y kits de generación de muestras empobrecidas en ARNr o de aislamiento del ARNr de las muestras
US9005891B2 (en) * 2009-11-10 2015-04-14 Genomic Health, Inc. Methods for depleting RNA from nucleic acid samples
CN101935697B (zh) * 2010-04-16 2015-11-25 中生方政生物技术有限公司 用于核酸序列检测的方法和试剂盒
GB201101621D0 (en) * 2011-01-31 2011-03-16 Olink Ab Method and product
GB201106254D0 (en) * 2011-04-13 2011-05-25 Frisen Jonas Method and product
JP2015500012A (ja) * 2011-12-02 2015-01-05 キアゲン ゲーエムベーハー 組成物中のrnaを特徴づける方法およびキット
GB201201547D0 (en) 2012-01-30 2012-03-14 Olink Ab Method and product
WO2014043133A1 (en) 2012-09-13 2014-03-20 Clontech Laboratories, Inc. Methods of depleting a target nucleic acid in a sample and kits for practicing the same
EP2898090B1 (en) * 2012-09-18 2017-11-08 Qiagen GmbH Method and kit for preparing a target rna depleted sample
US20160040218A1 (en) * 2013-03-14 2016-02-11 The Broad Institute, Inc. Selective Purification of RNA and RNA-Bound Molecular Complexes
WO2014152397A2 (en) * 2013-03-14 2014-09-25 The Broad Institute, Inc. Selective purification of rna and rna-bound molecular complexes
KR102266002B1 (ko) 2013-07-01 2021-06-16 일루미나, 인코포레이티드 촉매-무함유 표면 작용화 및 중합체 그라프팅
DK3083994T3 (da) 2013-12-20 2021-09-13 Illumina Inc Bevarelse af genomisk konnektivitetsinformation i fragmenterede genomiske DNA-prøver
CA2947426C (en) * 2014-04-29 2020-01-07 Illumina, Inc. Multiplexed single cell gene expression analysis using template switch and tagmentation
RU2558292C1 (ru) 2014-09-17 2015-07-27 Федеральное государственное бюджетное учреждение науки Институт химической биологии и фундаментальной медицины Сибирского отделения Российской академии наук (ИХБФМ СО РАН) Способ выделения коротких рнк из биологических жидкостей
EP4026914A1 (en) 2014-10-08 2022-07-13 Cornell University Method for identification and relative quantification of nucleic acid methylation changes using combined nuclease, ligation, and polymerase reactions with carryover prevention
CN115928221A (zh) * 2015-08-28 2023-04-07 Illumina公司 单细胞核酸序列分析
US9666263B2 (en) 2015-10-07 2017-05-30 Samsung Electronics Co., Ltd. DIMM SSD SoC DRAM byte lane skewing
AU2016354119C1 (en) * 2015-11-10 2019-10-03 Illumina, Inc. Inertial droplet generation and particle encapsulation
EP3417071B1 (en) 2016-02-15 2023-04-05 F. Hoffmann-La Roche AG System and method for targeted depletion of nucleic acids
US10400274B2 (en) * 2016-06-18 2019-09-03 Jan Biotech, Inc. Fluorogenic probes and their use in quantitative detection of target RNA sequences
CN106399533B (zh) * 2016-10-18 2019-11-12 承启医学(深圳)科技有限公司 一种去除总RNA样品中核糖体核酸rRNA的方法和组合物
CN107119043B (zh) * 2017-04-28 2020-04-10 北京全式金生物技术有限公司 一种去除rna样本中非目标rna的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023018031A1 (ko) 2021-08-13 2023-02-16 주식회사 엘지화학 고분자 복합체 및 이를 포함하는 성형품

Also Published As

Publication number Publication date
US20220403370A1 (en) 2022-12-22
CN118291584A (zh) 2024-07-05
BR112021006044A2 (pt) 2021-06-29
MX2021003712A (es) 2021-07-16
AU2019405940A1 (en) 2021-04-15
SG11202102710SA (en) 2021-04-29
US20240263164A1 (en) 2024-08-08
CN113166797A (zh) 2021-07-23
IL281834A (en) 2021-05-31
US11976271B2 (en) 2024-05-07
US11421216B2 (en) 2022-08-23
CN113166797B (zh) 2024-04-12
US20200199572A1 (en) 2020-06-25
CA3114754A1 (en) 2020-06-25
EP3899029A1 (en) 2021-10-27
WO2020132304A1 (en) 2020-06-25
JP2022512058A (ja) 2022-02-02

Similar Documents

Publication Publication Date Title
CN113166797B (zh) 基于核酸酶的rna耗尽
EP3377625B1 (en) Method for controlled dna fragmentation
CN111183145B (zh) 高灵敏度dna甲基化分析方法
WO2019126313A1 (en) Multiplex 5mc marker barcode counting for methylation detection in cell-free dna
AU2014362322B2 (en) Methods for labeling DNA fragments to recontruct physical linkage and phase
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
Matsumura et al. SuperSAGE: powerful serial analysis of gene expression
CN115176026A (zh) Rna寡核苷酸的测序方法
JP2023547394A (ja) オリゴハイブリダイゼーションおよびpcrベースの増幅による核酸検出方法
Thompson et al. Ribo-Pop: simple, cost-effective, and widely applicable ribosomal RNA depletion
Strom Fundamentals of RNA analysis on biobanked specimens
JP2016500276A5 (ko)
Matteau et al. Precise identification of genome-wide transcription start sites in bacteria by 5′-rapid amplification of cDNA ends (5′-RACE)
WO2012083845A1 (zh) 用于除去测序文库中载体片段的方法及其用途
RU2787079C1 (ru) Деплеция рнк на основе нуклеазы
Matsumura et al. SuperSAGE
WO2020237238A1 (en) Methods for detection of rare dna sequences in fecal samples
Stoute et al. CLIP-Seq to identify targets and interactions of RNA binding proteins and RNA modifying enzymes
EP4041913B1 (en) Novel method
Nong Mikkelsen et al. A short report on optimization of nucleic acid probes by DNA microarray synthesis and next generation sequencing
AU2023215324A1 (en) Methods selectively depleting nucleic acid using rnase h
Blattner Single cell transcriptome analysis using next generation sequencing.