BR112021006044A2 - depleção de rna baseada em nuclease - Google Patents

depleção de rna baseada em nuclease Download PDF

Info

Publication number
BR112021006044A2
BR112021006044A2 BR112021006044-8A BR112021006044A BR112021006044A2 BR 112021006044 A2 BR112021006044 A2 BR 112021006044A2 BR 112021006044 A BR112021006044 A BR 112021006044A BR 112021006044 A2 BR112021006044 A2 BR 112021006044A2
Authority
BR
Brazil
Prior art keywords
rna
dna
probe set
seq
target
Prior art date
Application number
BR112021006044-8A
Other languages
English (en)
Inventor
Scott Kuersten
Frederick W. Hyde
Asako Tetsubayashi
Original Assignee
Illumina, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina, Inc. filed Critical Illumina, Inc.
Publication of BR112021006044A2 publication Critical patent/BR112021006044A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1024In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/327RNAse, e.g. RNAseH
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/113Denaturating agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2539/00Reactions characterised by analysis of gene expression or genome comparison
    • C12Q2539/10The purpose being sequence identification by analysis of gene expression or genome comparison characterised by
    • C12Q2539/101Subtraction analysis

Abstract

DEPLEÇÃO DE RNA BASEADA EM NUCLEASE. A presente revelação está relacionada a métodos e materiais para depleção de espécies de RNA indesejado a partir de uma amostra de ácido nucleico. Em particular, a presente revelação descreve como remover rRNA, tRNA, mRNA ou outras espécies de RNA indesejado que poderiam interferir na análise, manipulação e estudo de moléculas de RNA alvo em uma amostra.

Description

Relatório descritivo da patente de invenção para "DEPLEÇÃO DE RNA BASEADA EM NUCLEASE"
REFERÊNCIA REMISSIVA A PEDIDOS DE DEPÓSITO CORRELATOS
[0001] O presente pedido reivindica o benefício de prioridade dos pedidos provisórios de patente No. 62/783.869, depositado em 21 de dezembro de 2018, e 62/847.797, depositado em 14 de maio de 2019, estando cada um incorporado a título de referência no presente documento em sua totalidade para qualquer propósito.
LISTAGEM DE SEQUÊNCIAS
[0002] O presente pedido é depositado com uma Listagem de Sequências em formato eletrônico. A Listagem de Sequências é fornecida como um arquivo intitulado "2019-12-09_01243-0012-00PCT_Sequence_Listing_ST25.txt" criado em 9 de dezembro de 2019, com tamanho de 94.208 bytes. As informações da listagem de sequências no formato eletrônico são incorporadas na presente invenção a título de referência em sua totalidade.
ANTECEDENTES
[0003] O RNA indesejado em uma amostra de ácido nucleico, assim como uma amostra de ácido nucleico retirada de células ou tecidos humanos, pode complicar a análise daquela amostra, a análise, por exemplo, a análise de expressão gênica, a análise de microarranjo e o sequenciamento de uma amostra. Uma vez que o RNA ribossômico (rRNA) compreende aproximadamente 95% do RNA em uma célula, sua presença é um exemplo de uma espécie de RNA que pode interferir e confundir os resultados de um ácido nucleico alvo em uma amostra, ou os ácidos nucleicos que um pesquisador ou especialista em diagnósticos possa querer compreender mais. Por exemplo, a espécie de rRNA indesejado pode dificultar especialmente a análise de moléculas de RNA de interesse em uma amostra, por exemplo, tRNA ou mRNA. Este é um problema sempre presente, em particular para tecidos que foram fixados, por exemplo, fixados por formalina e, então, inseridos em cera, por exemplo, tecidos fixados em formalina e embebidos em parafina (FFPE) provenientes de biópsias. Se não forem removidas dos tecidos FFPE, as espécies de rRNA podem interferir na medição e caracterização de RNA alvo no tecido, tornando assim extremamente difícil derivar informações clinicamente úteis dos RNAs alvo, por exemplo, identificação de doenças e câncer, opções de tratamento em potencial e diagnóstico e prognóstico de doenças ou câncer. Embora um tecido FFPE seja um exemplo, os mesmos problemas do rRNA ocorrem com amostras de todos os tipos, por exemplo, sangue, células e outros tipos de amostras contendo ácido nucleico.
[0004] Os atuais métodos comercialmente disponíveis para depleção de RNA indesejado a partir de uma amostra nucleica incluem os kits de depleção de rRNA RiboZero® (Epicentre) e NEBNext® (NEB) e os métodos de depleção de RNA conforme descritos nas Patentes US Nos. 9.745.570 e 9.005.891. Entretanto, estes métodos, embora úteis na depleção de RNA, possuem suas próprias desvantagens, incluindo a facilidade de uso, exigências de alta quantidade de insumo de amostra, necessidade de atuação de um técnico, custo e/ou eficiência na depleção de RNA indesejado de uma amostra. São necessários materiais e métodos que possam realizar, de forma mais fácil ou econômica, a depleção da espécie de RNA indesejado de uma amostra, revelando assim as informações no RNA alvo que podem ter permanecido ocultas, por exemplo, variantes de sequência raras ou de difícil identificação. Métodos descomplicados e confiáveis, conforme descrito na presente revelação, podem aumentar amplamente a disponibilidade de moléculas de RNA alvo para fins de teste, revelando assim as informações que elas contêm sobre a amostra e o organismo de onde são derivadas.
SUMÁRIO DA INVENÇÃO
[0005] As amostras de ácido nucleico, por exemplo aquelas de eucariotas ou procariotas, contêm diversos ácidos nucleicos, muitos dos quais não são de interesse de um pesquisador. Os pesquisadores frequentemente desejam estudar um tipo específico de um ácido nucleico, tanto DNA quanto RNA. Ao estudar o RNA, a amostra de interesse pode conter muitos tipos diferentes de espécies de RNA que podem dominar e ocultar o RNA alvo que é o foco do estudo. Assim, a depleção de RNA se refere à remoção do RNA indesejado e/ou da espécie de DNA de uma amostra de ácido nucleico, deixando assim uma amostra de ácido nucleico enriquecida com o RNA desejado para estudo.
[0006] A presente revelação fornece uma solução para a depleção de um excesso de espécie de RNA indesejado de uma amostra de ácido nucleico antes de estudo adicional. Por exemplo, uma amostra de RNA de interesse não somente inclui o RNA alvo a ser estudado, mas também inclui transcrições abundantes como rRNA, mRNA de globina, contaminantes virais, ou quaisquer outros ácidos nucleicos indesejados que podem dominar a amostra e sobrecarregar o alvo de interesse, reduzindo assim amplamente a capacidade de um pesquisador de analisar com precisão a porção desejada do transcriptoma.
[0007] Portanto, a depleção do RNA indesejado de uma amostra de ácido nucleico antes da análise, por exemplo, microarranjos de expressão ou sequenciamento, aumenta a especificidade e a exatidão da análise dos alvos de RNA desejados. Na presente revelação, a depleção de RNA não alvo através da degradação de híbridos específicos de DNA:RNA permite a remoção eficiente da espécie de RNA indesejado de uma amostra antes da preparação e análise da biblioteca. Quando uma amostra não contiver mais a espécie de RNA indesejado, o RNA alvo remanescente pode ser convertido em cDNA. A obtenção de dados úteis como resultado de uma amostra robusta pode levar a uma melhor compreensão e opções de tratamento em potencial para o prognóstico e diagnóstico de câncer, uma melhor compreensão de nosso microbioma e sua importância em nosso e em outros sistemas eucarióticos, uma compreensão mais completa da análise de expressão de genes de interesse e similares.
[0008] Em uma modalidade, a presente revelação descreve um método para depleção de moléculas de RNA não alvo a partir de uma amostra de ácido nucleico que compreende: a) colocar em contato uma amostra de ácido nucleico que compreende ao menos uma sequência alvo de RNA ou DNA e ao menos uma molécula de RNA não alvo com um conjunto de sonda que compreende ao menos duas sondas de
DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo, hibridizando assim as sondas de DNA às moléculas de RNA não alvo para formar híbridos de DNA:RNA, em que cada híbrido de DNA:RNA está com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de uma determinada sequência de moléculas de RNA não alvo de qualquer outro híbrido de DNA:RNA; e b) colocar em contato os híbridos de DNA:RNA com uma ribonuclease que degrada o RNA a partir dos híbridos de DNA:RNA, degradando assim as moléculas de RNA não alvo na amostra de ácido nucleico para formar uma mistura degradada.
[0009] Em uma modalidade, a presente revelação se refere a uma composição que compreende um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento de ao menos uma molécula de RNA não alvo (por exemplo, com ao menos 5 ou ao menos 10 bases de espaçamento ao longo de todo o comprimento) em uma amostra de ácido nucleico. Em algumas modalidades, a composição também compreende uma ribonuclease capaz de degradar o RNA em um híbrido de DNA:RNA. Em uma outra modalidade, a presente revelação se refere a uma composição que compreende um conjunto de sonda que compreende ao menos duas sondas de DNA hibridizadas a ao menos uma molécula de RNA não alvo, em que cada sonda de DNA é hibridizada com ao menos 5 ou ao menos 10 bases de espaçamento ao longo do comprimento da molécula de RNA não alvo de qualquer outra sonda de DNA no conjunto de sonda.
[0010] Em uma modalidade, a presente revelação descreve um kit que compreende um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento de ao menos uma molécula de rRNA não alvo (por exemplo, com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de todo o comprimento) em uma amostra de ácido nucleico e uma ribonuclease capaz de degradar o RNA em um híbrido de DNA:RNA.
[0011] Em uma modalidade, a presente revelação descreve um método de suplementação de um conjunto de sonda para uso na depleção de moléculas de ácido nucleico de RNA não alvo a partir de uma amostra de ácido nucleico que compreende: a) colocar em contato uma amostra de ácido nucleico que compreende ao menos uma sequência alvo de RNA ou DNA e ao menos uma molécula de RNA não alvo de uma primeira espécie com um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo de uma segunda espécie, hibridizando assim as sondas de DNA às moléculas de RNA não alvo para formar híbridos de DNA:RNA, em que cada híbrido de DNA:RNA está com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de uma determinada sequência de moléculas de RNA não alvo de qualquer outro híbrido de DNA:RNA; b) colocar em contato os híbridos de DNA:RNA com uma ribonuclease que degrada o RNA a partir dos híbridos de DNA:RNA, degradando assim as moléculas de RNA não alvo na amostra de ácido nucleico para formar uma mistura degradada; c) separar o rRNA degradado da mistura degradada; d) sequenciar o restante do RNA da amostra; e) avaliar as demais sequências de RNA quanto à presença de moléculas de RNA não alvo da primeira espécie, determinando assim regiões de sequência de lacuna; e f) suplementar o conjunto de sonda com sondas de DNA adicionais complementares a sequências não contíguas em uma ou mais das regiões de sequência de lacuna.
BREVE DESCRIÇÃO DAS FIGURAS
[0012] A Figura 1 mostra um fluxo de trabalho exemplificador para realizar a depleção da espécie de RNA de uma amostra. A Etapa 1 inclui a desnaturação do ácido nucleico seguida da adição de sondas de DNA de depleção e hibridização das sondas à espécie de RNA indesejado, criando assim híbridos de DNA:RNA. A Etapa 2 inclui a digestão do RNA a partir dos híbridos de DNA:RNA usando uma ribonuclease como RNase H. A Etapa 3 inclui a digestão de sondas de DNA residuais a partir da mistura degradada pela adição de DNase. A Etapa 4 inclui a captura do RNA alvo remanescente na amostra, o que é opcionalmente seguido de manipulações adicionais que por fim resultarão em uma amostra que não contém a espécie de RNA indesejado que pode ser sequenciado, exposta a análise de expressão de microarranjo, qPCR, ou outras técnicas de análise.
[0013] As Figuras 2A-2C mostram dados exemplificadores para depleção de rRNA de uma amostra de B. subtilis quando formamida for adicionada ao fluxo de trabalho de depleção de rRNA (2A) 0% de formamida, (2B) 25% de formamida, (2C) 45% de formamida). Em cada painel, o eixo geométrico X lista a espécie de rRNA detectada e o eixo geométrico Y mostra a porcentagem de depleção por meio de leituras da porcentagem de sequência.
[0014] A Figura 3 mostra dados de sequência exemplificadores de sequenciamento de próxima geração (NGS) para amostras não contendo rRNA de RNA de Cérebro Humano (HBR) e RNA Humano Universal (UHR) comparando diferentes quantidades de amostra sequenciada (100 ng, 10 ng ou 1 ng).
[0015] A Figura 4 mostra dados de sequência exemplificadores de NGS para amostras não contendo rRNA de RNA de camundongo e RNA de rato usando diferentes concentrações de formamida (0%, 25%, 45%) adicionada ao fluxo de trabalho de depleção de rRNA.
[0016] A Figura 5 mostra dados exemplificadores da remoção de rRNA de diferentes espécies microbianas usando baixas quantidades de insumo de amostra comparando as metodologias RiboZero® e RNase H de depleção de rRNA por remoção enzimática. Todas as profundidades de leitura da amostra foram normalizadas. O eixo geométrico X mostra o método de depleção de rRNA (método de depleção enzimática RZ = RiboZero ou ED = RNase H) e o eixo geométrico Y mostra as leituras da % de rRNA.
[0017] A Figura 6 mostra dados exemplificadores de detecção de transcrição em várias profundidades de leitura para B. subtilis e E. coli após a depleção de rRNA por RNase H (ED) no lado esquerdo do gráfico em comparação à ausência de depleção de rRNA (Ausente) no lado direito do gráfico. O eixo geométrico X mostra as leituras de sequenciamento (M) e o eixo geométrico Y mostra o número de transcrições detectadas.
[0018] As Figuras 7A-7B mostram gráficos exemplificadores para dados de regressão linear em pares para expressão gênica que demonstram a reprodutibilidade dos métodos revelados para depleção de rRNA. O Painel 7A exemplifica dois níveis de expressão gênica de E. coli em réplica e o Painel 7B exemplifica dois níveis de expressão gênica de B. subtilis em réplica. Ambos os tipos bacterianos demonstram alta correlação entre réplicas de nível de expressão gênica após a depleção de rRNA por RNase H.
[0019] A Figura 8 mostra dados de leitura exemplificadores de rRNA em triplicata para uma amostra misturada de 20 cepas (MSA-2002, lado esquerdo) e de 12 cepas (MSA-2006, lado direito). As triplicatas de amostra misturada foram submetidas à depleção de rRNA pelo método RiboZero (RZ) ou pelo método de depleção por RNase H (ED) descritos na presente invenção. A quantidade de insumo de RNA para as amostras de MSA2002 foi de 10 ng, ao passo que a quantidade de insumo para MSA2006 foi de 80 ng. O eixo geométrico X mostra o método de depleção de rRNA e o eixo geométrico Y mostra as leituras da % de rRNA.
[0020] A Figura 9 mostra a cobertura da leitura de sequenciamento do loci de rRNA mitocondrial 12S (mt-Rnr1) e 16S (mt-Rnr2) de camundongo (parte inferior da Figura) e o efeito do conjunto de 333 sondas de DNA (SEQ ID NOs: 1 a 333) sobre a depleção de rRNA de 16S de camundongo a partir de amostras de RNA de referência de camundongo universal (UMR). Os quadrados indicam a localização de 90% de correlação no comprimento de 50 bases ou 70% de correlação no comprimento de 30 pares de base com o conjunto de 333 sondas de DNA. Na ausência de sondas adicionais de camundongo e rato, lacunas sem cobertura de sonda correspondem a picos em rRNA residual ou não submetido à depleção para as duas réplicas (Rep 1 e Rep 2) mostradas na parte superior da Figura.
DESCRIÇÃO DETALHADA
[0021] A criação de bibliotecas de ácido nucleico a partir do RNA para sequenciamento é muitas vezes difícil devido a uma abundância de transcrições indesejadas, por exemplo, RNA ribossômico, mRNA de globina, contaminantes virais, e similares que podem dominar uma amostra e sobrecarregar as sequências de RNA de interesse. Se as transcrições indesejadas não forem removidas, a análise do transcriptoma, que teria benefício de prognóstico, diagnóstico ou pesquisa, poderia ser comprometida. Portanto, a depleção do RNA indesejado de uma amostra de ácido nucleico antes da análise, como sequenciamento ou outras aplicações subsequentes [downstream], pode aumentar a especificidade e a exatidão da análise desejada.
[0022] A presente revelação descreve métodos e materiais úteis na depleção da espécie de RNA indesejado de uma amostra de ácido nucleico, ou seja, o RNA de importância pode ser estudado e não é perdido no mar de transcrições de RNA indesejado.
[0023] Em comparação a métodos já existentes para depleção de RNA, o método revelado pode utilizar quantidades menores de insumo de RNA total, enquanto ainda mantém métricas de desempenho comparáveis. Portanto, o método revelado pode ser utilizado quando um pesquisador tem pequenas quantidades de material de partida que outros métodos não seriam capazes de acomodar. Adicionalmente, o método revelado pode ser realizado com um grupo de sondas que tem como alvo várias espécies diferentes de RNA indesejado do organismo simultaneamente sem comprometer a eficiência da depleção. Por exemplo, a presente revelação pode simultaneamente eliminar espécies eucarióticas e procarióticas de RNA indesejado de uma amostra de RNA, incluindo, mas não se limitando a, fontes humanas, bacterianas, virais e/ou de Archaea de RNA indesejado.
[0024] Uma amostra ou mistura de ácido nucleico se refere a uma amostra que contém RNA ou DNA ou ambos, incluindo ácidos nucleicos tanto indesejados (não alvo ou não desejados) quanto desejados (alvo). O DNA ou RNA na amostra pode ser tanto não modificado quanto modificado e inclui, mas não se limita a DNA ou
RNA de fita simples ou fita dupla ou derivados dos mesmos (por exemplo, algumas regiões do DNA ou RNA são de fita dupla, ao passo que, simultaneamente, outras regiões do DNA ou RNA são de fita simples) e similares. De modo geral, uma amostra de ácido nucleico inclui todas as formas quimicamente, enzimaticamente e/ou metabolicamente modificadas de ácidos nucleicos, bem como todas as formas não modificadas de ácidos nucleicos, ou combinações dos mesmos. Uma amostra de ácido nucleico pode conter ácidos nucleicos desejados e indesejados, por exemplo, DNA genômico ou RNA celular total ou uma combinação de ambos. Os ácidos nucleicos indesejados incluem os ácidos nucleicos de eucariotas que não são alvo para estudo, bem como ácidos nucleicos contaminantes de bactérias, vírus, espécie Archaea, e similares. Os ácidos nucleicos considerados ou desejados são os ácidos nucleicos que são a base ou o foco do estudo, ou seja, os ácidos nucleicos alvo. Por exemplo, um pesquisador pode desejar estudar a análise de expressão de mRNA, em que o rRNA, o tRNA e o DNA seriam considerados ácidos nucleicos indesejados e o mRNA é o ácido nucleico alvo. Também, o estudo de RNA total poderia ser desejado, ao passo que o rRNA, o mRNA e o DNA seriam considerados ácidos nucleicos desprezados ou indesejados e o RNA total seria o ácido nucleico alvo. O RNA indesejado inclui, mas não se limita a RNA ribossômico (rRNA), rRNA mitocondrial, rRNA nuclear, mRNA como RNAs de globina, ou de transferência ou tRNA, ou uma mistura dos mesmos. Em algumas modalidades, o RNA não alvo é rRNA. Em algumas modalidades, o RNA não alvo é mRNA de globina.
[0025] Por exemplo, uma amostra de ácido nucleico poderia conter o RNA mensageiro (mRNA) ou o RNA total desejado, mas também incluiria o RNA ribossômico (rRNA) indesejado, os RNAs de transferência (tRNA) e, talvez, o DNA indesejado. Métodos gerais de extração de RNA de uma amostra bruta, como sangue, tecido, células, tecidos fixos etc., são bem conhecidos na técnica, conforme encontrados em Current Protocols for Molecular Biology (John Wiley & Sons) e em diversos manuais de métodos de biologia molecular. O RNA pode ser isolado utilizando-se kits de purificação comercialmente disponíveis, por exemplo, minicolunas Qiagen RNeasy, Kits Completos de Purificação de DNA e RNA MasterPure (Epicentre), Kit de Isolamento de RNA em Bloco de Parafina (Ambion), RNA-Stat-60 (Tel-Test) ou centrifugação em gradiente de densidade de cloreto de césio. Os atuais métodos não são limitados pela forma que o RNA é isolado de uma amostra antes da depleção de RNA.
[0026] Há um ceticismo inerente de que as sondas de mistura que têm como alvo o rRNA bacteriano e o rRNA humano no mesmo grupo levariam a uma extensa depleção não alvo de transcrições desejáveis (Mauro et al., Proc. Natl. Acad. Sci. USA 1997, 94:422 a 427; Mignone and Pesole, Appl. Bioinformatics 2002, 1:145 a 154). Surpreendentemente, a pesquisa realizada durante o desenvolvimento dos métodos revelados demonstra que não é este o caso, uma vez que a especificidade da hibridização da sonda de DNA às transcrições de RNA indesejado resulta em uma amostra submetida à depleção eficiente da espécie de RNA indesejado. Também foi descoberto que a adição de um desestabilizador, por exemplo, formamida, ajuda a remover parte do RNA indesejado que demonstrou ser mais problemático para submeter à depleção caso a formamida não estivesse presente. Embora não seja necessário entender a forma que a formamida ajuda na remoção deste RNA, acredita-se que a formamida pode servir para relaxar barreiras estruturais no RNA indesejado, de modo que as sondas de DNA possam se ligar de maneira mais eficiente. Adicionalmente, a adição de formamida demonstrou o benefício adicionado de melhora na detecção de algumas transcrições não alvo possivelmente pela desnaturação/relaxamento de regiões dos mRNAs, por exemplo, que possuem estruturas secundárias ou terciárias muito estáveis e que não são normalmente bem representadas em outros métodos de preparação de biblioteca. Amostras ou misturas de ácido nucleico
[0027] A presente revelação não está limitada à fonte de uma amostra de ácido nucleico, ou seja, a fonte poderia ser de eucariotas ou procariotas que incluem, mas não se limitam a humanos, primatas não humanos, mamíferos, aves, répteis, plantas, bactérias, vírus, ácidos nucleicos encontrados em solos, água ou outros líquidos e outras amostras do meio ambiente. A amostra poderia ser obtida de células, tecidos, órgãos, meio ambiente, lisados etc. e poderia ser proveniente de qualquer estado de uma amostra, por exemplo, fresca, congelada, liofilizada e reconstituída, ou uma amostra fixada, por exemplo, proveniente de um tecido ou amostra para biópsia que foi fixada em formalina e embebida em parafina (FFPE) ou outra manipulação citológica ou histológica de amostra.
[0028] A amostra de ácido nucleico que poderia se beneficiar dos métodos de depleção de RNA poderia ser de qualquer espécie, eucariótica ou procariótica, como humanos, não humanos, camundongos, ratos, bactérias etc. e poderia incluir espécies únicas ou múltiplas em uma amostra. Adicionalmente, os presentes métodos de depleção poderiam ser utilizados em amostras frescas ou preservadas, por exemplo, amostras para biópsia ou de tecido, incluindo amostras que foram processadas usando formalina e embebidas em parafina (ou seja, amostras fixadas em formalina e embebidas em parafina, FFPE). Em algumas modalidades, uma amostra de ácido nucleico é de uma fonte humana ou não humana, por exemplo, eucariotas não humanos, bactérias, vírus, plantas, solo ou uma mistura dos mesmos. Depois que uma amostra é submetida à depleção da espécie de RNA indesejado, os alvos desejados remanescentes podem ser convertidos em cDNA para processamento adicional como é conhecido pelos versados na técnica.
[0029] Em algumas modalidades, uma amostra de ácido nucleico é de um humano ou de um primata não humano. Em algumas modalidades, uma amostra de ácido nucleico é de um rato ou um camundongo. Em algumas modalidades, uma amostra de ácido nucleico compreende ácidos nucleicos de origem não humana. Em algumas modalidades, os ácidos nucleicos de origem não humana são de eucariotas não humanos, bactérias, vírus, plantas, solo, ou uma mistura dos mesmos. Métodos de depleção
[0030] Dessa forma, o RNA desprezado ou indesejado em uma amostra de ácido nucleico é submetido à depleção pelos métodos descritos. O RNA indesejado é convertido em um híbrido de DNA:RNA pela hibridização parcial ou completa de sondas de DNA complementares às moléculas de RNA indesejado. Os métodos de hibridização de sondas de ácido nucleico em ácidos nucleicos são bem estabelecidos nas ciências, bem como se uma sonda é parcial ou totalmente complementar à sequência parceira, e o fato de que uma sonda de DNA se hibridiza à espécie de RNA indesejado após lavagens e outras manipulações da amostra, demonstra uma sonda de DNA que pode ser utilizada nos métodos da presente revelação. O conjunto de RNA indesejado para depleção pode ser de qualquer espécie eucariótica, por exemplo, humana, de camundongos, ratos etc., em que a depleção de RNA de uma amostra pode resultar em estudos subsequentes mais favoráveis, como o sequenciamento (ou seja, menos resultados da espécie de ácido nucleico indesejado). O DNA também pode ser considerado um ácido nucleico indesejado se o alvo do estudo for um RNA, ponto no qual o DNA também pode ser removido por depleção.
[0031] Em uma modalidade, a presente revelação descreve um método para depleção de moléculas de RNA não alvo a partir de uma amostra de ácido nucleico que compreende: a) colocar em contato uma amostra de ácido nucleico que compreende ao menos uma sequência alvo de RNA ou DNA e ao menos uma molécula de RNA não alvo com um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo, hibridizando assim as sondas de DNA às moléculas de RNA não alvo para formar híbridos de DNA:RNA, em que cada híbrido de DNA:RNA está com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de uma determinada sequência de moléculas de RNA não alvo de qualquer outro híbrido de DNA:RNA; e b) colocar em contato os híbridos de DNA:RNA com uma ribonuclease que degrada o RNA a partir dos híbridos de DNA:RNA, degradando assim as moléculas de RNA não alvo na amostra de ácido nucleico para formar uma mistura degradada.
[0032] Em uma modalidade, uma amostra de RNA é desnaturada na presença das sondas de DNA. Um fluxo de trabalho exemplificador é demonstrado na Figura 1. No exemplo na Figura 1, as sondas de DNA são adicionadas à amostra de RNA desnaturada (desnaturada a 95 °C durante 2 min), sendo que, mediante o resfriamento, a reação a 37 °C por 15 a 30 min resulta na hibridização das sondas de DNA às suas respectivas sequências de RNA alvo, criando assim moléculas híbridas de DNA:RNA.
[0033] Em algumas modalidades, o contato com o conjunto de sonda compreende o tratamento da amostra de ácido nucleico com um desestabilizador. Em algumas modalidades, um desestabilizador é calor ou um produto químico desestabilizador de ácido nucleico. Em algumas modalidades, um produto químico desestabilizador de ácido nucleico é betaína, DMSO, formamida, glicerol ou um derivado dos mesmos ou uma mistura dos mesmos. Em algumas modalidades, um produto químico desestabilizador de ácido nucleico é formamida ou um derivado dos mesmos, opcionalmente em que a formamida ou derivado da mesma está presente em uma concentração de cerca de 10 a 45% do volume total da reação de hibridização. Em algumas modalidades, o tratamento da amostra com calor compreender a aplicação de calor acima da temperatura de fusão do ao menos um híbrido de DNA:RNA.
[0034] Em algumas modalidades, a formamida é adicionada à reação de hibridização independentemente da fonte da amostra de RNA (por exemplo, humano, camundongo, rato etc.). Por exemplo, em algumas modalidades, a hibridização nas sondas de DNA é realizada na presença de ao menos 3%, 5%, 10%, 20%, 25%, 30%, 35%, 40% ou 45% em volume de formamida. Em uma modalidade, uma reação de hibridização para depleção de RNA inclui aproximadamente 25% a 45% em volume de formamida.
[0035] Após a reação de hibridização, uma ribonuclease que degrada o RNA de um híbrido de DNA:RNA é adicionada à reação. Em algumas modalidades, uma ribonuclease é RNase H ou Hybridase. RNase H (NEB) ou Hybridase (Lucigen) são exemplos de enzimas que degradarão o RNA de um híbrido de DNA:RNA. A degradação por uma ribonuclease, como RNase H ou Hybridase, degrada o RNA em pequenas moléculas que podem ser, então, removidas. Por exemplo, é relatado que a RNase H digere o RNA de um híbrido de DNA:RNA aproximadamente a cada
7-21 bases (Schultz et al., J. Biol. Chem. 2006, 281:1943 a 1955; Champoux and Schultz, FEBS J. 2009, 276:1506 a 1516). Em algumas modalidades, a digestão do RNA do híbrido de DNA:RNA pode ocorrer a 37 °C durante aproximadamente 30 min conforme descrito na Figura 1, Etapa 2, e no Exemplo 1.
[0036] Em algumas modalidades, após a digestão da molécula híbrida de DNA:RNA, as sondas de DNA remanescentes e qualquer DNA não alvo na amostra de ácido nucleico são degradados. Assim, em algumas modalidades, os métodos compreendem o contato da mistura degradada por ribonuclease com uma enzima de digestão de DNA, degradando assim o DNA na mistura. Em algumas modalidades, a amostra digerida é exposta a uma enzima de digestão de DNA, por exemplo, DNase I, que degrada as sondas de DNA. A reação de digestão do DNA por DNase é incubada, por exemplo, a 37 °C durante 30 min, período após o qual a enzima DNase pode ser desnaturada a 75 °C por um período de tempo conforme necessário para desnaturar a DNase, por exemplo, por até 20 min.
[0037] Em algumas modalidades, o método de depleção compreende separar o RNA degradado da mistura degradada. Em algumas modalidades, a separação compreende a purificação do RNA alvo a partir do RNA degradado (e do DNA degradado, se presente), por exemplo, usando um meio de purificação de ácido nucleico, como microesferas de captura de RNA, por exemplo, microesferas RNAClean XP (Beckman Coulter). Assim, em algumas modalidades, após a(s) digestão(ões) enzimática(s), o RNA alvo pode ser enriquecido pela remoção dos produtos degradados, deixando para trás os alvos de RNA desejados e mais longos. Os métodos adequados de enriquecimento incluem o tratamento da mistura degradada com microesferas magnéticas que se ligam ao tamanho de fragmento desejado dos alvos de RNA enriquecidos, colunas de rotação e similares. Em algumas modalidades, microesferas magnéticas, como microesferas AMPure XP, microesferas SPRISelect, microesferas RNAClean XP (Beckman Coulter), podem ser utilizadas, contanto que as microesferas sejam isentas de RNases (por exemplo, isentas de RNase por controle de qualidade). Estas microesferas fornecem diferentes opções de seleção de tamanho para ligação a ácido nucleico, por exemplo, as microesferas RNAClean XP têm como alvo fragmentos de ácido nucleico de 100 nt ou mais longos e as microesferas SPRISelect têm como alvo fragmentos de ácido nucleico de 150 a 800 nt e não têm como alvo sequências de ácido nucleico mais curtas, como o RNA e o DNA degradados que resultam das digestões enzimáticas de RNase H e DNase. Se o mRNA for o RNA alvo a ser estudado, então o mRNA pode ser adicionalmente enriquecido por captura usando, por exemplo, microesferas que compreendem sequências oligodT para captura das caudas adeniladas do mRNA. Os métodos de captura de mRNA são bem conhecidos pelos versados na técnica.
[0038] Depois que o RNA alvo tiver sido purificado dos componentes de reação incluindo os ácidos nucleicos degradados indesejados, a amostra pode ser adicionalmente manipulada. Na presente revelação, os Exemplos 2 e 3 fornecem fluxos de trabalho exemplificadores para a síntese de cDNA a partir do RNA total alvo enriquecido seguido de um fluxo de trabalho exemplificador para preparação de biblioteca que é típico para sequenciamento subsequente, por exemplo, um sequenciador da Illumina. Entretanto, deve ficar entendido que estes fluxos de trabalho são apenas exemplificadores e um versado na técnica entenderá que o RNA enriquecido pode ser utilizado em diversas aplicações adicionais como PCR, qPCR, análise de microarranjo e similares, tanto diretamente ou após a manipulação adicional, por exemplo, conversão do RNA em cDNA usando protocolos estabelecidos e bem compreendidos.
[0039] Os métodos para depleção de RNA descritos na presente invenção resultarão em uma amostra enriquecida com as moléculas de RNA alvo. Por exemplo, os métodos descritos na presente invenção resultam em uma amostra de RNA submetida à depleção que compreende menos que 15%, 13%, 11%, 9%, 7%, 5%, 3%, 2% ou 1% ou qualquer faixa intermediária da espécie de RNA indesejado. A amostra de RNA enriquecida compreende, então, ao menos 99%, 98%, 97%, 95%, 93%, 91%, 89% ou 87% ou qualquer faixa intermediária do RNA total alvo.
Depois que tiver sido enriquecida, a amostra pode ser utilizada para a preparação de biblioteca ou outras manipulações subsequentes. Conjuntos de sonda de DNA/sondas de DNA
[0040] Uma sonda de DNA se refere a um oligonucleotídeo de DNA de fita simples que tem complementaridade de sequência à espécie de RNA indesejado. A sequência de sonda de DNA pode ser parcial ou totalmente complementar ao RNA indesejado para depleção na amostra de ácido nucleico. O RNA indesejado para depleção inclui, mas não se limita a rRNA, tRNA e mRNA, bem como misturas dos mesmos. Em algumas modalidades, cada sonda de DNA tem de cerca de 10 a 100 nucleotídeos de comprimento, ou de cerca de 20 a 80 nucleotídeos de comprimento, ou de cerca de 40 a 60 nucleotídeos de comprimento, ou cerca de 50 nucleotídeos de comprimento. As sondas de DNA são capazes de se hibridizar à espécie de RNA indesejado, criando assim moléculas híbridas de DNA:RNA. Enquanto em algumas modalidades ao menos duas sondas de DNA se hibridizam a uma molécula de RNA não alvo em particular, as sondas de DNA não abrangem todo o comprimento de uma sequência de molécula de RNA indesejado. Por exemplo, em algumas modalidades, um conjunto de sonda deixa lacunas ou regiões do RNA indesejado sem uma sonda de DNA complementar no conjunto de sonda. As sondas de DNA se hibridizam, total ou parcialmente, ao RNA indesejado de uma maneira não sobreposta, deixando lacunas de ao menos 5, 10, 15, 20, 30, 40, 50, 60, 70, 80 ou mais nucleotídeos entre os híbridos de DNA:RNA resultantes. Assim, em algumas modalidades, cada sonda de DNA é hibridizada com ao menos 5 ou ao menos 10 bases de espaçamento ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo de qualquer outra sonda de DNA no conjunto de sonda. Dessa forma, o RNA indesejado em sua totalidade não é totalmente hibridizado a sondas de DNA. Adicionalmente, a presente revelação fornece uma pluralidade de sondas de DNA que se hibridizam a um único RNA para depleção, de modo que não há "uma sonda de DNA para um RNA", mas sim múltiplas sondas de DNA descontínuas em um conjunto de sonda que tem como alvo um determinado RNA indesejado. Por exemplo, em algumas modalidades, para um determinado conjunto de RNA para depleção, é utilizado um conjunto de sonda de DNA, em que cada sonda tem aproximadamente 20 a 80 nucleotídeos de comprimento e cada sonda se hibridiza ao RNA indesejado em qualquer ponto 5 a 15 nucleotídeos distantes de uma outra sonda de DNA no conjunto. Uma sonda de DNA pode ser total ou parcialmente complementar a um local em particular no RNA a ser submetido à depleção, por exemplo, a sequência de sonda de DNA pode ser ao menos 80%, 85%, 90%, 95% ou 100% complementar, ou qualquer faixa intermediária, ao local alvo em uma transcrição de RNA a ser submetida à depleção. A única limitação à complementaridade é que a sonda de DNA deve se hibridizar ao RNA alvo a ser submetido à depleção, de tal maneira que resulte em um híbrido de DNA:RNA que seja enzimaticamente digerível conforme descrito na presente invenção. Em alguns casos, o mRNA é o alvo de interesse e não o alvo para depleção, caso no qual as sondas de DNA não compreendem uma sequência polyT, de modo que as sondas não se hibridizarão à espécie de mRNA. Em algumas modalidades, as sondas de DNA não compreendem uma etiqueta com uma porção de captura como biotina, avidina, estreptavidina ou uma microesfera magnética que permitiria a depleção do híbrido por meios físicos, ao passo que em outras modalidades as sondas de DNA compreendem uma etiqueta com uma porção de captura como biotina, avidina, estreptavidina ou uma microesfera magnética que permitiria a depleção do híbrido por meios físicos.
[0041] Em algumas modalidades, um conjunto de sonda compreende ao menos sondas de DNA que se hibridizam a moléculas de RNA não alvo humanas e de bactérias. Em algumas modalidades, um conjunto de sonda compreende ao menos sondas de DNA que se hibridizam a moléculas de RNA não alvo humanas, de bactérias e Archaea. Em algumas modalidades, um conjunto de sonda compreende ao menos sondas de DNA que se hibridizam a moléculas de RNA não alvo humanas, de bactérias, camundongo e rato. Em algumas modalidades, um conjunto de sonda compreende ao menos sondas de DNA que se hibridizam a moléculas de RNA não alvo humanas, de bactérias, camundongo, rato e Archaea. Em algumas modalidades, as moléculas de RNA não alvo de bactérias são de bactérias Gram-positivas ou bactérias Gram-negativas, ou uma mistura das mesmas. Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo de uma espécie Archaea. Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA complementares a duas ou mais sequências de rRNA de uma espécie Archaea.
[0042] Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA que se hibridizam a ao menos uma, ou ao menos duas, moléculas de RNA não alvo selecionadas entre 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 e HBG2. Em algumas modalidades, o conjunto de sonda compreende ao menos duas sondas de DNA complementares a duas ou mais sequências de rRNA selecionadas do grupo que consiste em 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 e HBG2. Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA que se hibridizam a uma ou mais, ou duas ou mais, moléculas de RNA não alvo selecionadas entre 28S, 18S, 5.8S, 5S, 16S e 12S de humanos. Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA que se hibridizam a uma ou mais, ou duas ou mais, moléculas de RNA não alvo de rato e/ou camundongo, opcionalmente selecionadas de 16S de rato, 28S de rato, 16S de camundongo e 28S de camundongo, e combinações dos mesmos. Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo selecionadas entre HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1 e HBG2 de hemoglobina. Em algumas modalidades, um conjunto de sonda compreende ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo selecionadas entre 23S, 16S e 5S de bactérias Gram-positivas e/ou Gram-negativas. Os mRNAs de globina para depleção podem incluir, mas não se limitam àqueles encontrados em roedores, como camundongo ou rato, incluindo HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, e àqueles encontrados em humanos, incluindo HBA-A1, HBA-A2, HBB, HGB1 e HGB2. Os rRNAs mitocondriais adequados para depleção incluem 18S e 12S (humanos e roedores). Os rRNAs nucleares adequados para depleção incluem 28S, 18S, 5.8S e 5S (humanos e roedores) e rRNAs procarióticos que incluem 5S, 16S e 23S. Em algumas amostras, a depleção de rRNAs da espécie Archaea também pode ser desejada, por exemplo, 23S, 16S ou 5S de rRNAs. Em modalidades adicionais, o conjunto de sonda compreende ao menos duas sondas de DNA complementares a duas ou mais sequências de rRNA selecionadas do grupo que consiste em 5S, 16S e 23S de rRNA bacterianas Gram-positivas ou Gram-negativas. Em algumas modalidades, o conjunto de sonda compreende ao menos duas (ou ao menos cinco, ou ao menos 10, ou ao menos 20) sondas de DNA complementares a cada um de 28S, 18S, 5.8S, 5S, 16S e 12S, mRNA de globina HBA-A1, HBA-A2, HBB, HBG1 e HBG2 de humanos, e 5S, 16S e 23S de rRNA bacterianas Gram-positivas ou Gram-negativas. Em algumas modalidades, as sondas para uma molécula de RNA não alvo em particular são complementares a cerca de 80 a 85% da sequência da molécula de RNA não alvo, com lacunas de ao menos 5 ou ao menos 10 bases entre cada sítio de hibridização de sonda.
[0043] Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 333 sequências das SEQ ID NOs: 1 a 333 (bactérias Gram-positivas e bactérias Gram- negativas humanas). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 400 ou mais, ou 428 sequências das SEQ ID NOs: 1 a 428 (bactérias Gram-positivas e bactérias Gram-negativas humanas, de Archaea, camundongo e rato). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou
150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 377 sequências das SEQ ID NOs: 1 a 377 (bactérias Gram-positivas e bactérias Gram-negativas humanas e de Archaea). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 384 sequências das SEQ ID NOs: 1 a 333 (bactérias Gram-positivas e bactérias Gram-negativas humanas) e SEQ ID NOs: 378 a 428 (camundongo e rato). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 44 sequências das SEQ ID NOs: 334 a 377 (Archaea). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 51 sequências das SEQ ID NOs: 378 a 428 (camundongo e rato).
[0044] Em algumas modalidades, as sondas de DNA são parcial ou totalmente complementares e compreendem sequências que se hibridizam a rRNA de 28S, 18S,
5.8S e/ou 5S de humanos, por exemplo, as sequências de sonda de DNA conforme mostradas na Tabela 1, SEQ ID NO: 40 até SEQ ID NO: 150. Em uma segunda modalidade, as sondas de DNA incluem sequências que se hibridizam a 16S e/ou 12S de rRNAs mitocondriais, por exemplo, as sequências de sonda de DNA conforme mostradas na Tabela 1, SEQ ID NO: 1 até SEQ ID NO: 39. Em outras modalidades, as sondas de DNA incluem sequências que se hibridizam a mRNA de hemoglobina incluindo HBA-A1, HBA-A2, HBB, HBB-B1, HBB-B2, HBG1, e/ou HBG2, por exemplo, as sequências de sonda de DNA conforme mostradas na Tabela 1, SEQ ID NO: 151 até SEQ ID NO: 194. Em algumas modalidades, as sondas de DNA incluem sequências que se hibridizam a rRNAs bacterianos, por exemplo, 23S, 16S e/ou 5S de rRNAs bacterianas Gram-positivas e/ou Gram-negativas, por exemplo, as sequências de sonda de DNA conforme mostradas na Tabela 1, SEQ ID NO: 195 até SEQ ID NO: 262 (E. coli bacteriano Gram-negativo representativo) e SEQ ID NO: 263 até SEQ ID NO: 333 (Bacillus subtilis bacteriano Gram-positivo representativo). Em outras modalidades, as sondas de DNA incluem sequências que se hibridizam a rRNAs de Archaea, como 23S, 16S e/ou 5S de rRNAs, por exemplo, as sequências de sonda de DNA mostradas na Tabela 1, SEQ ID NO: 334 até SEQ ID NO: 384, que se hibridizam a rRNAs da espécie Archaea Methanobrevibacter smithii. Em algumas modalidades, as sondas de DNA incluem sequências que se hibridizam a rRNAs de camundongo, como 16S e/ou 28S de camundongo, por exemplo, as sequências de sonda de DNA mostradas na Tabela 1, SEQ ID NO: 385 até SEQ ID NO: 393 e SEQ ID NO:400 até SEQ ID NO: 419. Em algumas modalidades, as sondas de DNA incluem sequências que se hibridizam a rRNAs de rato, como 16S e/ou 28S de rato, por exemplo, as sequências de sonda de DNA mostradas na Tabela 1, SEQ ID NO: 394 até SEQ ID NO: 399 e SEQ ID NO: 420 até SEQ ID NO: 428.
Tabela 1. Sequências de sonda de DNA para depleção de RNA indesejado
SEQ ID Nome da sonda Sequência 5'-3' da sonda
NO
GTTCGTCCAAGTGCACTTTCCAGTACACTTACCA 1 12S_P1
TGTTACGACTTGTCTC
TAGGGGTTTTAGTTAAATGTCCTTTGAAGTATACT 2 12S_P2
TGAGGAGGGTGACGG
TTCAGGGCCCTGTTCAACTAAGCACTCTACTCTC 3 12S_P3
AGTTTACTGCTAAATC
AGTTTCATAAGGGCTATCGTAGTTTTCTGGGGTA 4 12S_P4
GAAAATGTAGCCCATT
GGCTACACCTTGACCTAACGTCTTTACGTGGGTA 5 12S_P5
CTTGCGCTTACTTTGT
TTGCTGAAGATGGCGGTATATAGGCTGAGCAAG 6 12S_P6
AGGTGGTGAGGTTGATC
CAGAACAGGCTCCTCTAGAGGGATATGAAGCAC 7 12S_P7
CGCCAGGTCCTTTGAGT
GTAGTGTTCTGGCGAGCAGTTTTGTTGATTTAAC 8 12S_P8
TGTTGAGGTTTAGGGC
ATCTAATCCCAGTTTGGGTCTTAGCTATTGTGTGT 9 12S_P9
TCAGATATGTTAAAG
ATTTTGTGTCAACTGGAGTTTTTTACAACTCAGGT 10 12S_P10
GAGTTTTAGCTTTAT
CTAAAACACTCTTTACGCCGGCTTCTATTGACTT 11 12S_P11
GGGTTAATCGTGTGAC
GAAATTGACCAACCCTGGGGTTAGTATAGCTTAG 12 12S_P12
TTAAACTTTCGTTTAT
ACTGCTGTTTCCCGTGGGGGTGTGGCTAGGCTA 13 12S_P13
AGCGTTTTGAGCTGCAT
GCTTGTCCCTTTTGATCGTGGTGATTTAGAGGGT 14 12S_P14
GAACTCACTGGAACGG
TAATCTTACTAAGAGCTAATAGAAAGGCTAGGAC 15 12S_P15
CAAACCTATTTGTTTA
AAACCCTGTTCTTGGGTGGGTGTGGGTATAATAC 16 16S_P1
TAAGTTGAGATGATAT
GCGCTTTGTGAAGTAGGCCTTATTTCTCTTGTCC 17 16S_P2
TTTCGTACAGGGAGGA
AAACCGACCTGGATTACTCCGGTCTGAACTCAGA 18 16S_P3
TCACGTAGGACTTTAA
ACCTTTAATAGCGGCTGCACCATCGGGATGTCCT 19 16S_P4
GATCCAACATCGAGGT
TGATATGGACTCTAGAATAGGATTGCGCTGTTAT 20 16S_P5
CCCTAGGGTAACTTGT
ATTGGATCAATTGAGTATAGTAGTTCGCTTTGACT 21 16S_P6
GGTGAAGTCTTAGCA
TTGGGTTCTGCTCCGAGGTCGCCCCAACCGAAA 22 16S_P7
TTTTTAATGCAGGTTTG
TGGGTTTGTTAGGTACTGTTTGCATTAATAAATTA 23 16S_P8
AAGCTCCATAGGGTC
GTCATGCCCGCCTCTTCACGGGCAGGTCAATTTC 24 16S_P9
ACTGGTTAAAAGTAAG
CGTGGAGCCATTCATACAGGTCCCTATTTAAGGA 25 16S_P10
ACAAGTGATTATGCTA
GGTACCGCGGCCGTTAAACATGTGTCACTGGGC 26 16S_P11
AGGCGGTGCCTCTAATA
GTGATGTTTTTGGTAAACAGGCGGGGTAAGGTTT 27 16S_P12
GCCGAGTTCCTTTTAC
CTTATGAGCATGCCTGTGTTGGGTTGACAGTGAG 28 16S_P13
GGTAATAATGACTTGT
ATTGGGCTGTTAATTGTCAGTTCAGTGTTTTGATC 29 16S_P14
TGACGCAGGCTTATG
TCATGTTACTTATACTAACATTAGTTCTTCTATAG 30 16S_P15
GGTGATAGATTGGTC
AGTTCAGTTATATGTTTGGGATTTTTTAGGTAGTG 31 16S_P16
GGTGTTGAGCTTGAA
TGGCTGCTTTTAGGCCTACTATGGGTGTTAAATT 32 16S_P17
TTTTACTCTCTCTACA
GTCCAAAGAGCTGTTCCTCTTTGGACTAACAGTT 33 16S_P18
AAATTTACAAGGGGAT
GGCAAATTTAAAGTTGAACTAAGATTCTATCTTGG 34 16S_P19
ACAACCAGCTATCAC
TGTCGCCTCTACCTATAAATCTTCCCACTATTTTG 35 16S_P20
CTACATAGACGGGTG
TCTTAGGTAGCTCGTCTGGTTTCGGGGGTCTTAG 36 16S_P21
CTTTGGCTCTCCTTGC
TAATTCATTATGCAGAAGGTATAGGGGTTAGTCC 37 16S_P22
TTGCTATATTATGCTT
TCTTTCCCTTGCGGTACTATATCTATTGCGCCAG 38 16S_P23
GTTTCAATTTCTATCG
GGTAAATGGTTTGGCTAAGGTTGTCTGGTAGTAA 39 16S_P24
GGTGGAGTGGGTTTGG
TAATGATCCTTCCGCAGGTTCACCTACGGAAACC 40 18S_P1
TTGTTACGACTTTTAC
AAGTTCGACCGTCTTCTCAGCGCTCCGCCAGGG 41 18S_P2
CCGTGGGCCGACCCCGG
GGCCTCACTAAACCATCCAATCGGTAGTAGCGAC 42 18S_P3
GGGCGGTGTGTACAAA
CAACGCAAGCTTATGACCCGCACTTACTCGGGAA 43 18S_P4
TTCCCTCGTTCATGGG
CCGATCCCCATCACGAATGGGGTTCAACGGGTT 44 18S_P5
ACCCGCGCCTGCCGGCG
CTGAGCCAGTCAGTGTAGCGCGCGTGCAGCCCC 45 18S_P6
GGACATCTAAGGGCATC
CTCAATCTCGGGTGGCTGAACGCCACTTGTCCCT 46 18S_P7
CTAAGAAGTTGGGGGA
GGTCGCGTAACTAGTTAGCATGCCAGAGTCTCGT 47 18S_P8
TCGTTATCGGAATTAA
CACCAACTAAGAACGGCCATGCACCACCACCCA 48 18S_P9
CGGAATCGAGAAAGAGC
CCTGTCCGTGTCCGGGCCGGGTGAGGTTTCCCG 49 18S_P10
TGTTGAGTCAAATTAAG
CTGGTGGTGCCCTTCCGTCAATTCCTTTAAGTTT 50 18S_P11
CAGCTTTGCAACCATA
AAAGACTTTGGTTTCCCGGAAGCTGCCCGGCGG 51 18S_P12
GTCATGGGAATAACGCC
GGCATCGTTTATGGTCGGAACTACGACGGTATCT 52 18S_P13
GATCGTCTTCGAACCT
GATTAATGAAAACATTCTTGGCAAATGCTTTCGCT 53 18S_P14
CTGGTCCGTCTTGCG
CACCTCTAGCGGCGCAATACGAATGCCCCCGGC 54 18S_P15
CGTCCCTCTTAATCATG
ACCAACAAAATAGAACCGCGGTCCTATTCCATTA 55 18S_P16
TTCCTAGCTGCGGTAT
CTGCTTTGAACACTCTAATTTTTTCAAAGTAAACG 56 18S_P17
CTTCGGGCCCCGCGG
GCATCGAGGGGGCGCCGAGAGGCAAGGGGCGG 57 18S_P18
GGACGGGCGGTGGCTCGC
CCGCCCGCTCCCAAGATCCAACTACGAGCTTTTT 58 18S_P19
AACTGCAGCAACTTTA
GCTGGAATTACCGCGGCTGCTGGCACCAGACTT 59 18S_P20
GCCCTCCAATGGATCCT
AGTGGACTCATTCCAATTACAGGGCCTCGAAAGA 60 18S_P21
GTCCTGTATTGTTATT
CCCGGGTCGGGAGTGGGTAATTTGCGCGCCTGC 61 18S_P22
TGCCTTCCTTGGATGTG
GCTCCCTCTCCGGAATCGAACCCTGATTCCCCGT 62 18S_P23
CACCCGTGGTCACCAT
TACCATCGAAAGTTGATAGGGCAGACGTTCGAAT 63 18S_P24
GGGTCGTCGCCGCCAC
GGCCCGAGGTTATCTAGAGTCACCAAAGCCGCC 64 18S_P25
GGCGCCCGCCCCCCGGC
GCTGACCGGGTTGGTTTTGATCTGATAAATGCAC 65 18S_P26
GCATCCCCCCCGCGAA
TCGGCATGTATTAGCTCTAGAATTACCACAGTTAT 66 18S_P27
CCAAGTAGGAGAGGA
AACCATAACTGATTTAATGAGCCATTCGCAGTTTC 67 18S_P28
ACTGTACCGGCCGTG
ATGGCTTAATCTTTGAGACAAGCATATGCTACTG 68 18S_P29
GCAGGATCAACCAGGT
GACAAACCCTTGTGTCGAGGGCTGACTTTCAATA 69 28S_P1
GATCGCAGCGAGGGAG
CGAAACCCCGACCCAGAAGCAGGTCGTCTACGA 70 28S_P2
ATGGTTTAGCGCCAGGT
GGTGCGTGACGGGCGAGGGGGCGGCCGCCTTT 71 28S_P3
CCGGCCGCGCCCCGTTTC
CTCCGCACCGGACCCCGGTCCCGGCGCGCGGC 72 28S_P4
GGGGCACGCGCCCTCCCG
AGGGGGGGGCGGCCCGCCGGCGGGGACAGGC 73 28S_P5
GGGGGACCGGCTATCCGAG
GCGGCGCTGCCGTATCGTTCGCCTGGGCGGGAT 74 28S_P6
TCTGACTTAGAGGCGTT
AGATGGTAGCTTCGCCCCATTGGCTCCTCAGCC 75 28S_P7
AAGCACATACACCAAAT
TCCTCTCGTACTGAGCAGGATTACCATGGCAACA 76 28S_P8
ACACATCATCAGTAGG
CTCACGACGGTCTAAACCCAGCTCACGTTCCCTA 77 28S_P9
TTAGTGGGTGAACAAT
TTCTGCTTCACAATGATAGGAAGAGCCGACATCG 78 28S_P10
AAGGATCAAAAAGCGA
TTGGCCGCCACAAGCCAGTTATCCCTGTGGTAAC 79 28S_P11
TTTTCTGACACCTCCT
GGTCAGAAGGATCGTGAGGCCCCGCTTTCACGG 80 28S_P12
TCTGTATTCGTACTGAA
AGCTTTTGCCCTTCTGCTCCACGGGAGGTTTCTG 81 28S_P13
TCCTCCCTGAGCTCGC
TTACCGTTTGACAGGTGTACCGCCCCAGTCAAAC 82 28S_P14
TCCCCACCTGGCACTG
GCGCCCGGCCGGGCGGGCGCTTGGCGCCAGAA 83 28S_P15
GCGAGAGCCCCTCGGGCT
CCGGGTCAGTGAAAAAACGATCAGAGTAGTGGT 84 28S_P16
ATTTCACCGGCGGCCCG
CGCCCCGGGCCCCTCGCGGGGACACCGGGGGG 85 28S_P17
GCGCCGGGGGCCTCCCAC
CATGTCTCTTCACCGTGCCAGACTAGAGTCAAGC 86 28S_P18
TCAACAGGGTCTTCTT
CCAAGCCCGTTCCCTTGGCTGTGGTTTCGCTGG 87 28S_P19
ATAGTAGGTAGGGACAG
TCCATTCATGCGCGTCACTAATTAGATGACGAGG 88 28S_P20
CATTTGGCTACCTTAA
TCCCGCCGTTTACCCGCGCTTCATTGAATTTCTT 89 28S_P21
CACTTTGACATTCAGA
CACATCGCGTCAACACCCGCCGCGGGCCTTCGC 90 28S_P22
GATGCTTTGTTTTAATT
CCTGGTCCGCACCAGTTCTAAGTCGGCTGCTAG 91 28S_P23
GCGCCGGCCGAGGCGAG
CGGCCCCGGGGGCGGACCCGGCGGGGGGGAC 92 28S_P24
CGGCCCGCGGCCCCTCCGC
CCGCCGCGCGCCGAGGAGGAGGGGGGAACGG 93 28S_P25
GGGGCGGACGGGGCCGGGG
ACGAACCGCCCCGCCCCGCCGCCCGCCGACCG 94 28S_P26
CCGCCGCCCGACCGCTCC
CGCGCGCGACCGAGACGTGGGGTGGGGGTGGG 95 28S_P27
GGGCGCGCCGCGCCGCCG
GCGGCCGCGACGCCCGCCGCAGCTGGGGCGAT 96 28S_P28
CCACGGGAAGGGCCCGGC
GCGCCGCCGCCGGCCCCCCGGGTCCCCGGGGC 97 28S_P29
CCCCCTCGCGGGGACCTG
CCGGCGGCCGCCGCGCGGCCCCTGCCGCCCCG 98 28S_P30
ACCCTTCTCCCCCCGCCG
CTCCCCCGGGGAGGGGGGAGGACGGGGAGCG 99 28S_P31
GGGGAGAGAGAGAGAGAGA
AGGGAGCGAGCGGCGCGCGCGGGTGGGGCGG 100 28S_P32
GGGAGGGCCGCGAGGGGGG
GGGGGCGCGCGCCTCGTCCAGCCGCGGCGCGC 101 28S_P33
GCCCAGCCCCGCTTCGCG
CCCAGCCCTTAGAGCCAATCCTTATCCCGAAGTT 102 28S_P34
ACGGATCCGGCTTGCC
CATTGTTCCAACATGCCAGAGGCTGTTCACCTTG 103 28S_P35
GAGACCTGCTGCGGAT
CGCGAGATTTACACCCTCTCCCCCGGATTTTCAA 104 28S_P36
GGGCCAGCGAGAGCTC
AACCGCGACGCTTTCCAAGGCACGGGCCCCTCT 105 28S_P37
CTCGGGGCGAACCCATT
CTTCACAAAGAAAAGAGAACTCTCCCCGGGGCT 106 28S_P38
CCCGCCGGCTTCTCCGG
CGCACTGGACGCCTCGCGGCGCCCATCTCCGCC 107 28S_P39
ACTCCGGATTCGGGGAT
TTTCGATCGGCCGAGGGCAACGGAGGCCATCGC 108 28S_P40
CCGTCCCTTCGGAACGG
CAGGACCGACTGACCCATGTTCAACTGCTGTTCA 109 28S_P41
CATGGAACCCTTCTCC
GTTCTCGTTTGAATATTTGCTACTACCACCAAGAT 110 28S_P42
CTGCACCTGCGGCGG
CGCCCTAGGCTTCAAGGCTCACCGCAGCGGCCC 111 28S_P43
TCCTACTCGTCGCGGCG
TCCGGGGGCGGGGAGCGGGGCGTGGGCGGGA 112 28S_P44
GGAGGGGAGGAGGCGTGGG
AGGACCCCACACCCCCGCCGCCGCCGCCGCCG 113 28S_P45
CCGCCCTCCGACGCACAC
GCGCGCCGCCCCCGCCGCTCCCGTCCACTCTC 114 28S_P46
GACTGCCGGCGACGGCCG
CTCCAGCGCCATCCATTTTCAGGGCTAGTTGATT 115 28S_P47
CGGCAGGTGAGTTGTT
GATTCCGACTTCCATGGCCACCGTCCTGCTGTCT 116 28S_P48
ATATCAACCAACACCT
GAGCGTCGGCATCGGGCGCCTTAACCCGGCGTT 117 28S_P49
CGGTTCATCCCGCAGCG
AAAAGTGGCCCACTAGGCACTCGCATTCCACGC 118 28S_P50
CCGGCTCCACGCCAGCG
CCATTTAAAGTTTGAGAATAGGTTGAGATCGTTTC 119 28S_P51
GGCCCCAAGACCTCT
CGGATAAAACTGCGTGGCGGGGGTGCGTCGGG 120 28S_P52
TCTGCGAGAGCGCCAGCT
TCGGAGGGAACCAGCTACTAGATGGTTCGATTA 121 28S_P53
GTCTTTCGCCCCTATAC
GATTTGCACGTCAGGACCGCTACGGACCTCCAC 122 28S_P54
CAGAGTTTCCTCTGGCT
ATAGTTCACCATCTTTCGGGTCCTAACACGTGCG 123 28S_P55
CTCGTGCTCCACCTCC
AGACGGGCCGGTGGTGCGCCCTCGGCGGACTG 124 28S_P56
GAGAGGCCTCGGGATCCC
CGCGCCGGCCTTCACCTTCATTGCGCCACGGCG 125 28S_P57
GCTTTCGTGCGAGCCCC
TTAGACTCCTTGGTCCGTGTTTCAAGACGGGTCG 126 28S_P58
GGTGGGTAGCCGACGT
GCGCTCGCTCCGCCGTCCCCCTCTTCGGGGGAC 127 28S_P59
GCGCGCGTGGCCCCGAG
CCCGACGGCGCGACCCGCCCGGGGCGCACTGG 128 28S_P60
GGACAGTCCGCCCCGCCC
GCACCCCCCCCGTCGCCGGGGCGGGGGCGCG 129 28S_P61
GGGAGGAGGGGTGGGAGAG
AGGGGTGGCCCGGCCCCCCCACGAGGAGACGC 130 28S_P62
CGGCGCGCCCCCGCGGGG
GGGGATTCCCCGCGGGGGTGGGCGCCGGGAGG 131 28S_P63
GGGGAGAGCGCGGCGACG
GCCCCGGGATTCGGCGAGTGCTGCTGCCGGGG 132 28S_P64
GGGCTGTAACACTCGGGG
CCGCCCCCGCCGCCGCCGCCACCGCCGCCGCC 133 28S_P65
GCCGCCGCCCCGACCCGC
AGGACGCGGGGCCGGGGGGCGGAGACGGGGG 134 28S_P66
AGGAGGAGGACGGACGGAC
AGCCACCTTCCCCGCCGGGCCTTCCCAGCCGTC 135 28S_P67
CCGGAGCCGGTCGCGGC
AAATGCGCCCGGCGGCGGCCGGTCGCCGGTCG 136 28S_P68
GGGGACGGTCCCCCGCCG
CCGCCCGCCCACCCCCGCACCCGCCGGAGCCC 137 28S_P69
GCCCCCTCCGGGGAGGAG
GGGAAGGGAGGGCGGGTGGAGGGGTCGGGAG 138 28S_P70
GAACGGGGGGCGGGAAAGA
ACACGGCCGGACCCGCCGCCGGGTTGAATCCTC 139 28S_P71
CGGGCGGACTGCGCGGA
TCTTAACGGTTTCACGCCCTCTTGAACTCTCTCTT 140 28S_P72
CAAAGTTCTTTTCAA
CTTGTTGACTATCGGTCTCGTGCCGGTATTTAGC 141 28S_P73
CTTAGATGGAGTTTAC
GCATTCCCAAGCAACCCGACTCCGGGAAGACCC 142 28S_P74
GGGCGCGCGCCGGCCGC
GTCCACGGGCTGGGCCTCGATCAGAAGGACTTG 143 28S_P75
GGCCCCCCACGAGCGGC
TTCCGTACGCCACATGTCCCGCGCCCCGCGGGG 144 28S_P76
CGGGGATTCGGCGCTGG
CTCGCCGTTACTGAGGGAATCCTGGTTAGTTTCT 145 28S_P77
TTTCCTCCGCTGACTA
GCGGGTCGCCACGTCTGATCTGAGGTCGCGTCT 146 28S_P78
CGGAGGGGGACGGGCCG
AAGCGACGCTCAGACAGGCGTAGCCCCGGGAG 147 5.8S_P1
GAACCCGGGGCCGCAAGT
GCAGCTAGCTGCGTTCTTCATCGACGCACGAGC 148 5.8S_P3
CGAGTGATCCACCGCTA
AAAGCCTACAGCACCCGGTATTCCCAGGCGGTC 149 5S_P1
TCCCATCCAAGTACTAA
TTCCGAGATCAGACGAGATCGGGCGCGTTCAGG 150 5S_P3
GTGGTATGGCCGTAGAC
GCCGCCCACTCAGACTTTATTCAAAGACCACGG 151 HBA1_P1
GGGTACGGGTGCAGGAA
GGGGGAGGCCCAAGGGGCAAGAAGCATGGCCA 152 HBA1_P2
CCGAGGCTCCAGCTTAAC
GCACGGTGCTCACAGAAGCCAGGAACTTGTCCA 153 HBA1_P3
GGGAGGCGTGCACCGCA
GGGAGGTGGGCGGCCAGGGTCACCAGCAGGCA 154 HBA1_P4
GTGGCTTAGGAGCTTGAA
CCGAAGCTTGTGCGCGTGCAGGTCGCTCAGGGC 155 HBA1_P5
GGACAGCGCGTTGGGCA
CCACGGCGTTGGTCAGCGCGTCGGCCACCTTCT 156 HBA1_P6
TGCCGTGGCCCTTAACC
CTCAGGTCGAAGTGCGGGAAGTAGGTCTTGGTG 157 HBA1_P7
GTGGGGAAGGACAGGAA
CTCCGCACCATACTCGCCAGCGTGCGCGCCGAC 158 HBA1_P8
CTTACCCCAGGCGGCCT
CGGCAGGAGACAGCACCATGGTGGGTTCTCTCT 159 HBA1_P9
GAGTCTGTGGGGACCAG
GAGGGGAGGAGGGCCCGTTGGGAGGCCCAGCG 160 HBA2_P1
GGCAGGAGGAACGGCTAC
ACGGTATTTGGAGGTCAGCACGGTGCTCACAGA 161 HBA2_P2
AGCCAGGAACTTGTCCA
CAGGGGTGAACTCGGCGGGGAGGTGGGCGGCC 162 HBA2_P3
AGGGTCACCAGCAGGCAG
AAGTTGACCGGGTCCACCCGAAGCTTGTGCGCG 163 HBA2_P4
TGCAGGTCGCTCAGGGC
CATGTCGTCCACGTGCGCCACGGCGTTGGTCAG 164 HBA2_P5
CGCGTCGGCCACCTTCT
CCTGGGCAGAGCCGTGGCTCAGGTCGAAGTGC 165 HBA2_P6
GGGAAGTAGGTCTTGGTG
AACATCCTCTCCAGGGCCTCCGCACCATACTCG 166 HBA2_P7
CCAGCGTGCGCGCCGAC
CTTGACGTTGGTCTTGTCGGCAGGAGACAGCAC 167 HBA2_P8
CATGGTGGGTTCTCTCT
GCAATGAAAATAAATGTTTTTTATTAGGCAGAATC 168 HBB_P1
CAGATGCTCAAGGCC
CAGTTTAGTAGTTGGACTTAGGGAACAAAGGAAC 169 HBB_P2
CTTTAATAGAAATTGG
GCTTAGTGATACTTGTGGGCCAGGGCATTAGCC 170 HBB_P3
ACACCAGCCACCACTTT
CACTGGTGGGGTGAATTCTTTGCCAAAGTGATGG 171 HBB_P4
GCCAGCACACAGACCA
GCCTGAAGTTCTCAGGATCCACGTGCAGCTTGTC 172 HBB_P5
ACAGTGCAGCTCACTC
CCCTTGAGGTTGTCCAGGTGAGCCAGGCCATCA 173 HBB_P6
CTAAAGGCACCGAGCAC
CTTCACCTTAGGGTTGCCCATAACAGCATCAGGA 174 HBB_P7
GTGGACAGATCCCCAA
TCTGGGTCCAAGGGTAGACCACCAGCAGCCTGC 175 HBB_P8
CCAGGGCCTCACCACCA
ACCTTGCCCCACAGGGCAGTAACGGCAGACTTC 176 HBB_P9
TCCTCAGGAGTCAGATG
GTGATCTCTCAGCAGAATAGATTTATTATTTGTAT 177 HBG1_P1
TGCTTGCAGAATAAA
CTCTGAATCATGGGCAGTGAGCTCAGTGGTATCT 178 HBG1_P2
GGAGGACAGGGCACTG
ATCTTCTGCCAGGAAGCCTGCACCTCAGGGGTG 179 HBG1_P3
AATTCTTTGCCGAAATG
CACCAGCACATTTCCCAGGAGCTTGAAGTTCTCA 180 HBG1_P4
GGATCCACATGCAGCT
CACTCAGCTGGGCAAAGGTGCCCTTGAGATCAT 181 HBG1_P5
CCAGGTGCTTTGTGGCA
AGCACCTTCTTGCCATGTGCCTTGACTTTGGGGT 182 HBG1_P6
TGCCCATGATGGCAGA
GCCAAAGCTGTCAAAGAACCTCTGGGTCCATGG 183 HBG1_P7
GTAGACAACCAGGAGCC
CTCCAGCATCTTCCACATTCACCTTGCCCCACAG 184 HBG1_P8
GCTTGTGATAGTAGCC
AAATGACCCATGGCGTCTGGACTAGGAGCTTATT 185 HBG1_P9
GATAACCTCAGACGTT
GTGATCTCTTAGCAGAATAGATTTATTATTTGATT 186 HBG2_P1
GCTTGCAGAATAAAG
TCTGCATCATGGGCAGTGAGCTCAGTGGTATCTG 187 HBG2_P2
GAGGACAGGGCACTGG
TCTTCTGCCAGGAAGCCTGCACCTCAGGGGTGA 188 HBG2_P3
ATTCTTTGCCGAAATGG
ACCAGCACATTTCCCAGGAGCTTGAAGTTCTCAG 189 HBG2_P4
GATCCACATGCAGCTT
ACTCAGCTGGGCAAAGGTGCCCTTGAGATCATC 190 HBG2_P5
CAGGTGCTTTATGGCAT
GCACCTTCTTGCCATGTGCCTTGACTTTGGGGTT 191 HBG2_P6
GCCCATGATGGCAGAG
CCAAAGCTGTCAAAGAACCTCTGGGTCCATGGG 192 HBG2_P7
TAGACAACCAGGAGCCT
TCCAGCATCTTCCACATTCACCTTGCCCCACAGG 193 HBG2_P8
CTTGTGATAGTAGCCT
AATGACCCATGGCGTCTGGACTAGGAGCTTATTG 194 HBG2_P9
ATAACCTCAGACGTTC
ATGCCTGGCAGTTCCCTACTCTCGCATGGGGAG 195 5S_GNbac_P1
ACCCCACACTACCATCG
ACTTCTGAGTTCGGCATGGGGTCAGGTGGGACC 196 5S_GNbac_P2
ACCGCGCTACGGCCGCC
GGTTACCTTGTTACGACTTCACCCCAGTCATGAA 197 16S_GNbac_P1
TCACAAAGTGGTAAGT
AAGCTACCTACTTCTTTTGCAACCCACTCCCATG 198 16S_GNbac_P2
GTGTGACGGGCGGTGT
ACGTATTCACCGTGGCATTCTGATCCACGATTAC 199 16S_GNbac_P3
TAGCGATTCCGACTTC
AGACTCCAATCCGGACTACGACGCACTTTATGAG 200 16S_GNbac_P4
GTCCGCTTGCTCTCGC
TGTATGCGCCATTGTAGCACGTGTGTAGCCCTG 201 16S_GNbac_P5
GTCGTAAGGGCCATGAT
CCACCTTCCTCCAGTTTATCACTGGCAGTCTCCT 202 16S_GNbac_P6
TTGAGTTCCCGGCCGG
GGATAAGGGTTGCGCTCGTTGCGGGACTTAACC 203 16S_GNbac_P7
CAACATTTCACAACACG
TGCAGCACCTGTCTCACGGTTCCCGAAGGCACA 204 16S_GNbac_P8
TTCTCATCTCTGAAAAC
GACCAGGTAAGGTTCTTCGCGTTGCATCGAATTA 205 16S_GNbac_P9
AACCACATGCTCCACC
CGTCAATTCATTTGAGTTTTAACCTTGCGGCCGT 206 16S_GNbac_P10
ACTCCCCAGGCGGTCG
TCCGGAAGCCACGCCTCAAGGGCACAACCTCCA 207 16S_GNbac_P11
AGTCGACATCGTTTACG
GTATCTAATCCTGTTTGCTCCCCACGCTTTCGCA 208 16S_GNbac_P12
CTGAGCGTCAGTCTTC
TTCGCCACCGGTATTCCTCCAGATCTCTACGCAT 209 16S_GNbac_P13
TTCACCGCTACACCTG
CTACGAGACTCAAGCTTGCCAGTATCAGATGCAG 210 16S_GNbac_P14
TTCCCAGGTTGAGCCC
GACTTAACAAACCGCCTGCGTGCGCTTTACGCC 211 16S_GNbac_P15
CAGTAATTCCGATTAAC
ATTACCGCGGCTGCTGGCACGGAGTTAGCCGGT 212 16S_GNbac_P16
GCTTCTTCTGCGGGTAA
GTATTAACTTTACTCCCTTCCTCCCCGCTGAAAG 213 16S_GNbac_P17
TACTTTACAACCCGAA
CGCGGCATGGCTGCATCAGGCTTGCGCCCATTG 214 16S_GNbac_P18
TGCAGTATTCCCCACTG
GTCTGGACCGTGTCTCAGTTCCAGTGTGGCTGG 215 16S_GNbac_P19
TCATCCTCTCAGACCAG
TAGGTGAGCCGTTACCCCACCTACTAGCTAATCC 216 16S_GNbac_P20
CATCTGGGCACATCCG
AAGGTCCCCCTCTTTGGTCTTGCGACGTTATGCG 217 16S_GNbac_P21
GTATTAGCTACCGTTT
CTCCATCAGGCAGTTTCCCAGACATTACTCACCC 218 16S_GNbac_P22
GTCCGCCACTCGTCAG
AAGGTTAAGCCTCACGGTTCATTAGTACCGGTTA 219 23S_GNbac_P1
GCTCAACGCATCGCTG
CCTATCAACGTCGTCGTCTTCAACGTTCCTTCAG 220 23S_GNbac_P2
GACCCTTAAAGGGTCA
GGGGCAAGTTTCGTGCTTAGATGCTTTCAGCACT 221 23S_GNbac_P3
TATCTCTTCCGCATTT
CCATTGGCATGACAACCCGAACACCAGTGATGC 222 23S_GNbac_P4
GTCCACTCCGGTCCTCT
CCCCCTCAGTTCTCCAGCGCCCACGGCAGATAG 223 23S_GNbac_P5
GGACCGAACTGTCTCAC
GCTCGCGTACCACTTTAAATGGCGAACAGCCATA 224 23S_GNbac_P6
CCCTTGGGACCTACTT
ATGAGCCGACATCGAGGTGCCAAACACCGCCGT 225 23S_GNbac_P7
CGATATGAACTCTTGGG
ATCCCCGGAGTACCTTTTATCCGTTGAGCGATGG 226 23S_GNbac_P8
CCCTTCCATTCAGAAC
ACCTGCTTTCGCACCTGCTCGCGCCGTCACGCT 227 23S_GNbac_P9
CGCAGTCAAGCTGGCTT
CCTCCTGATGTCCGACCAGGATTAGCCAACCTTC 228 23S_GNbac_P10
GTGCTCCTCCGTTACT
GCCCCAGTCAAACTACCCACCAGACACTGTCCG 229 23S_GNbac_P11
CAACCCGGATTACGGGT
AAACATTAAAGGGTGGTATTTCAAGGTCGGCTCC 230 23S_GNbac_P12
ATGCAGACTGGCGTCC
CCACCTATCCTACACATCAAGGCTCAATGTTCAG 231 23S_GNbac_P13
TGTCAAGCTATAGTAA
TTCCGTCTTGCCGCGGGTACACTGCATCTTCACA 232 23S_GNbac_P14
GCGAGTTCAATTTCAC
GACAGCCTGGCCATCATTACGCCATTCGTGCAG 233 23S_GNbac_P15
GTCGGAACTTACCCGAC
CTTAGGACCGTTATAGTTACGGCCGCCGTTTACC 234 23S_GNbac_P16
GGGGCTTCGATCAAGA
ACCCCATCAATTAACCTTCCGGCACCGGGCAGG 235 23S_GNbac_P17
CGTCACACCGTATACGT
CACAGTGCTGTGTTTTTAATAAACAGTTGCAGCC 236 23S_GNbac_P18
AGCTGGTATCTTCGAC
CCGCGAGGGACCTCACCTACATATCAGCGTGCC 237 23S_GNbac_P19
TTCTCCCGAAGTTACGG
TTCCTTCACCCGAGTTCTCTCAAGCGCCTTGGTA 238 23S_GNbac_P20
TTCTCTACCTGACCAC
GTACGATTTGATGTTACCTGATGCTTAGAGGCTT 239 23S_GNbac_P21
TTCCTGGAAGCAGGGC
ACCGTAGTGCCTCGTCATCACGCCTCAGCCTTGA 240 23S_GNbac_P22
TTTTCCGGATTTGCCT
ACGCTTAAACCGGGACAACCGTCGCCCGGCCAA 241 23S_GNbac_P23
CATAGCCTTCTCCGTCC
ACCAAGTACAGGAATATTAACCTGTTTCCCATCG 242 23S_GNbac_P24
ACTACGCCTTTCGGCC
ACTCACCCTGCCCCGATTAACGTTGGACAGGAA 243 23S_GNbac_P25
CCCTTGGTCTTCCGGCG
CGCTTTATCGTTACTTATGTCAGCATTCGCACTTC 244 23S_GNbac_P26
TGATACCTCCAGCAT
TTCGCAGGCTTACAGAACGCTCCCCTACCCAACA 245 23S_GNbac_P27
ACGCATAAGCGTCGCT
CATGGTTTAGCCCCGTTACATCTTCCGCGCAGGC 246 23S_GNbac_P28
CGACTCGACCAGTGAG
TAAATGATGGCTGCTTCTAAGCCAACATCCTGGC 247 23S_GNbac_P29
TGTCTGGGCCTTCCCA
AACCATGACTTTGGGACCTTAGCTGGCGGTCTG 248 23S_GNbac_P30
GGTTGTTTCCCTCTTCA
CCCGCCGTGTGTCTCCCGTGATAACATTCTCCG 249 23S_GNbac_P31
GTATTCGCAGTTTGCAT
GGATGACCCCCTTGCCGAAACAGTGCTCTACCC 250 23S_GNbac_P32
CCGGAGATGAATTCACG
AGCTTTCGGGGAGAACCAGCTATCTCCCGGTTT 251 23S_GNbac_P33
GATTGGCCTTTCACCCC
CGCTAATTTTTCAACATTAGTCGGTTCGGTCCTC 252 23S_GNbac_P34
CAGTTAGTGTTACCCA
ATGGCTAGATCACCGGGTTTCGGGTCTATACCCT 253 23S_GNbac_P35
GCAACTTAACGCCCAG
CCTTCGGCTCCCCTATTCGGTTAACCTTGCTACA 254 23S_GNbac_P36
GAATATAAGTCGCTGA
GTACGCAGTCACACGCCTAAGCGTGCTCCCACT 255 23S_GNbac_P37
GCTTGTACGTACACGGT
ACTCCCCTCGCCGGGGTTCTTTTCGCCTTTCCCT 256 23S_GNbac_P38
CACGGTACTGGTTCAC
AGTATTTAGCCTTGGAGGATGGTCCCCCCATATT 257 23S_GNbac_P39
CAGACAGGATACCACG
ATCGAGCTCACAGCATGTGCATTTTTGTGTACGG 258 23S_GNbac_P40
GGCTGTCACCCTGTAT
ACGCTTCCACTAACACACACACTGATTCAGGCTC 259 23S_GNbac_P41
TGGGCTGCTCCCCGTT
GGGGAATCTCGGTTGATTTCTTTTCCTCGGGGTA 260 23S_GNbac_P42
CTTAGATGTTTCAGTT
ATTAACCTATGGATTCAGTTAATGATAGTGTGTCG 261 23S_GNbac_P43
AAACACACTGGGTTT
GCCGGTTATAACGGTTCATATCACCTTACCGACG 262 23S_GNbac_P44
CTTATCGCAGATTAGC
GCTTGGCGGCGTCCTACTCTCACAGGGGGAAAC 263 5S_GPbac_P1
CCCCGACTACCATCGGC
TTCCGTGTTCGGTATGGGAACGGGTGTGACCTC 264 5S_GPbac_P2
TTCGCTATCGCCACCAA
TAGAAAGGAGGTGATCCAGCCGCACCTTCCGAT 265 16S_GPbac_P1
ACGGCTACCTTGTTACG
TCTGTCCCACCTTCGGCGGCTGGCTCCTAAAAG 266 16S_GPbac_P2
GTTACCTCACCGACTTC
TCGTGGTGTGACGGGCGGTGTGTACAAGGCCCG 267 16S_GPbac_P3
GGAACGTATTCACCGCG
ATTACTAGCGATTCCAGCTTCACGCAGTCGAGTT 268 16S_GPbac_P4
GCAGACTGCGATCCGA
GTGGGATTGGCTTAACCTCGCGGTTTCGCTGCC 269 16S_GPbac_P5
CTTTGTTCTGTCCATTG
CCAGGTCATAAGGGGCATGATGATTTGACGTCAT 270 16S_GPbac_P6
CCCCACCTTCCTCCGG
CACCTTAGAGTGCCCAACTGAATGCTGGCAACTA 271 16S_GPbac_P7
AGATCAAGGGTTGCGC
ACCCAACATCTCACGACACGAGCTGACGACAAC 272 16S_GPbac_P8
CATGCACCACCTGTCAC
GACGTCCTATCTCTAGGATTGTCAGAGGATGTCA 273 16S_GPbac_P9
AGACCTGGTAAGGTTC
ATTAAACCACATGCTCCACCGCTTGTGCGGGCC 274 16S_GPbac_P10
CCCGTCAATTCCTTTGA
CCGTACTCCCCAGGCGGAGTGCTTAATGCGTTA 275 16S_GPbac_P11
GCTGCAGCACTAAGGGG
ACTTAGCACTCATCGTTTACGGCGTGGACTACCA 276 16S_GPbac_P12
GGGTATCTAATCCTGT
TCGCTCCTCAGCGTCAGTTACAGACCAGAGAGT 277 16S_GPbac_P13
CGCCTTCGCCACTGGTG
ACGCATTTCACCGCTACACGTGGAATTCCACTCT 278 16S_GPbac_P14
CCTCTTCTGCACTCAA
ATGACCCTCCCCGGTTGAGCCGGGGGCTTTCAC 279 16S_GPbac_P15
ATCAGACTTAAGAAACC
ACGCCCAATAATTCCGGACAACGCTTGCCACCTA 280 16S_GPbac_P16
CGTATTACCGCGGCTG
CCGTGGCTTTCTGGTTAGGTACCGTCAAGGTACC 281 16S_GPbac_P17
GCCCTATTCGAACGGT
ACAACAGAGCTTTACGATCCGAAAACCTTCATCA 282 16S_GPbac_P18
CTCACGCGGCGTTGCT
CCATTGCGGAAGATTCCCTACTGCTGCCTCCCGT 283 16S_GPbac_P19
AGGAGTCTGGGCCGTG
GGCCGATCACCCTCTCAGGTCGGCTACGCATCG 284 16S_GPbac_P20
TCGCCTTGGTGAGCCGT
CTAATGCGCCGCGGGTCCATCTGTAAGTGGTAG 285 16S_GPbac_P21
CCGAAGCCACCTTTTAT
TTCAAACAACCATCCGGTATTAGCCCCGGTTTCC 286 16S_GPbac_P22
CGGAGTTATCCCAGTC
CCACGTGTTACTCACCCGTCCGCCGCTAACATCA 287 16S_GPbac_P23
GGGAGCAAGCTCCCAT
GCATGTATTAGGCACGCCGCCAGCGTTCGTCCT 288 16S_GPbac_P24
GAGCCAGGATCAAACTC
TGGTTAAGTCCTCGATCGATTAGTATCTGTCAGC 289 23S_GPbac_P1
TCCATGTGTCGCCACA
TATCAACCTGATCATCTTTCAGGGATCTTACTTCC 290 23S_GPbac_P2
TTGCGGAATGGGAAA
GGCTTCATGCTTAGATGCTTTCAGCACTTATCCC 291 23S_GPbac_P3
GTCCGCACATAGCTAC
GCAGAACAACTGGTACACCAGCGGTGCGTCCAT 292 23S_GPbac_P4
CCCGGTCCTCTCGTACT
CAAATTTCCTGCGCCCGCGACGGATAGGGACCG 293 23S_GPbac_P5
AACTGTCTCACGACGTT
GTACCGCTTTAATGGGCGAACAGCCCAACCCTT 294 23S_GPbac_P6
GGGACTGACTACAGCCC
CGACATCGAGGTGCCAAACCTCCCCGTCGATGT 295 23S_GPbac_P7
GGACTCTTGGGGGAGAT
GGGGTAGCTTTTATCCGTTGAGCGATGGCCCTTC 296 23S_GPbac_P8
CATGCGGAACCACCGG
TTTCGTCCCTGCTCGACTTGTAGGTCTCGCAGTC 297 23S_GPbac_P9
AAGCTCCCTTGTGCCT
GATTTCCAACCATTCTGAGGGAACCTTTGGGCGC 298 23S_GPbac_P10
CTCCGTTACCTTTTAG
GTCAAACTGCCCACCTGACACTGTCTCCCCGCC 299 23S_GPbac_P11
CGATAAGGGCGGCGGGT
GCCAGGGTAGTATCCCACCGATGCCTCCACCGA 300 23S_GPbac_P12
AGCTGGCGCTCCGGTTT
ATCCTGTACAAGCTGTACCAACATTCAATATCAG 301 23S_GPbac_P13
GCTGCAGTAAAGCTCC
CCTGTCGCGGGTAACCTGCATCTTCACAGGTACT 302 23S_GPbac_P14
ATAATTTCACCGAGTC
GCCCAGATCGTTGCGCCTTTCGTGCGGGTCGGA 303 23S_GPbac_P15
ACTTACCCGACAAGGAA
ACCGTTATAGTTACGGCCGCCGTTTACTGGGGCT 304 23S_GPbac_P16
TCAATTCGCACCTTCG
CCTCTTAACCTTCCAGCACCGGGCAGGCGTCAG 305 23S_GPbac_P17
CCCCTATACTTCGCCTT
CCTGTGTTTTTGCTAAACAGTCGCCTGGGCCTAT 306 23S_GPbac_P18
TCACTGCGGCTCTCTC
CAGAGCACCCCTTCTCCCGAAGTTACGGGGTCA 307 23S_GPbac_P19
TTTTGCCGAGTTCCTTA
ATCACCTTAGGATTCTCTCCTCGCCTACCTGTGT 308 23S_GPbac_P20
CGGTTTGCGGTACGGG
TAGAGGCTTTTCTTGGCAGTGTGGAATCAGGAAC 309 23S_GPbac_P21
TTCGCTACTATATTTC
TCAGCCTTATGGGAAACGGATTTGCCTATTTCCC 310 23S_GPbac_P22
AGCCTAACTGCTTGGA
CCGCGCTTACCCTATCCTCCTGCGTCCCCCCATT 311 23S_GPbac_P23
GCTCAAATGGTGAGGA
TCAACCTGTTGTCCATCGCCTACGCCTTTCGGCC 312 23S_GPbac_P24
TCGGCTTAGGTCCCGA
CGAGCCTTCCTCAGGAAACCTTAGGCATTCGGT 313 23S_GPbac_P25
GGAGGGGATTCTCACCC
TACCGGCATTCTCACTTCTAAGCGCTCCACCAGT 314 23S_GPbac_P26
CCTTCCGGTCTGGCTT
GCTCTCCTACCACTGTTCGAAGAACAGTCCGCAG 315 23S_GPbac_P27
CTTCGGTGATACGTTT
TCGGCGCAGAGTCACTCGACCAGTGAGCTATTA 316 23S_GPbac_P28
CGCACTCTTTAAATGGT
AACATCCTGGTTGTCTAAGCAACTCCACATCCTT 317 23S_GPbac_P29
TTCCACTTAACGTATA
TGGCGGTCTGGGCTGTTTCCCTTTCGACTACGG 318 23S_GPbac_P30
ATCTTATCACTCGCAGT
AAGTCATTGGCATTCGGAGTTTGACTGAATTCGG 319 23S_GPbac_P31
TAACCCGGTAGGGGCC
GCTCTACCTCCAAGACTCTTACCTTGAGGCTAGC 320 23S_GPbac_P32
CCTAAAGCTATTTCGG
TCCAGGTTCGATTGGCATTTCACCCCTACCCACA 321 23S_GPbac_P33
CCTCATCCCCGCACTT
TTCGGGCCTCCATTCAGTGTTACCTGAACTTCAC 322 23S_GPbac_P34
CCTGGACATGGGTAGA
TCTACGACCACGTACTCATGCGCCCTATTCAGAC 323 23S_GPbac_P35
TCGCTTTCGCTGCGGC
TAACCTTGCACGGGATCGTAACTCGCCGGTTCAT 324 23S_GPbac_P36
TCTACAAAAGGCACGC
GGCTCTGACTACTTGTAGGCACACGGTTTCAGGA 325 23S_GPbac_P37
TCTCTTTCACTCCCCT
ACCTTTCCCTCACGGTACTGGTTCACTATCGGTC 326 23S_GPbac_P38
ACTAGGGAGTATTTAG
CTCCCGGATTCCGACGGAATTTCACGTGTTCCGC 327 23S_GPbac_P39
CGTACTCAGGATCCAC
GTTTTGACTACAGGGCTGTTACCTCCTATGGCGG 328 23S_GPbac_P40
GCCTTTCCAGACCTCT
CTTTGTAACTCCGTACAGAGTGTCCTACAACCCC 329 23S_GPbac_P41
AAGAGGCAAGCCTCTT
CGTTTCGCTCGCCGCTACTCAGGGAATCGCATTT 330 23S_GPbac_P42
GCTTTCTCTTCCTCCG
CAGTTCCCCGGGTCTGCCTTCTCATATCCTATGA 331 23S_GPbac_P43
ATTCAGATATGGATAC
GGTGGGTTTCCCCATTCGGAAATCTCCGGATCAA 332 23S_GPbac_P44
AGCTTGCTTACAGCTC
TGTTCGTCCCGTCCTTCATCGGCTCCTAGTGCCA 333 23S_GPbac_P45
AGGCATCCACCGTGCG
AAACTAGATTCGAATATAACAAAACATTACATCCT 334 16S:A1
CATCCAATCCCTTTT
GCGGTGTGTGCAAGGAGCAGGGACGTATTCACC 335 16S:A2
GCGCGATTGTGACACGC
GCCTTTCGGCGTCGGAACCCATTGTCTCAGCCAT 336 16S:A3
TGTAGCCCGCGTGTTG
GCATACGGACCTACCGTCGTCCACTCCTTCCTCC 337 16S:A4
TATTTATCATAGGCGG
CGGCATCCAAAAAAGGATCCGCTGGTAACTAAGA 338 16S:A5
GCGTGGGTCTCGCTCG
CAACCTGGCTATCATACAGCTGTCGCCTCTGGTG 339 16S: A6
AGATGTCCGGCGTTGA
AGGCTCCACGCGTTGTGGTGCTCCCCCGCCAAT 340 16S:A7
TCCTTTAAGTTTCAGTC
CCAGGCGGCGGACTTAACAGCTTCCCTTCGGCA 341 16S:A8
CTGGGACAGCTCAAAGC
TCCGCATCGTTTACAGCTAGGACTACCCGGGTAT 342 16S:A9
CTAATCCGGTTCGCGC
TTCCCACAGTTAAGCTGCAGGATTTCACCAGAGA 343 16S:A10
CTTATTAAACCGGCTA
CTCTTATTCCAAAAGCTCTTTACACTAATGAAAAG 344 16S:A12
CCATCCCGTTAAGAA
CCCCCGTCGCGATTTCTCACATTGCGGAGGTTTC 345 16S:A13
GCGCCTGCTGCACCCC
TTGTCTCAGGTTCCATCTCCGGGCTCTTGCTCTC 346 16S:A14
ACAACCCGTACCGATC
CATTACCTAACCAACTACCTAATCGGCCGCAGAC 347 16S:A16
CCATCCTTAGGCGAAA
AAACCATTACAGGAATAATTGCCTATCCAGTATTA 348 16S:A17
TCCCCAGTTTCCCAG
AAGGGTAGGTTATCCACGTGTTACTGAGCCGTAC 349 16S:A18
GCCACGAGCCTAAACT
ACCTAGCGCGTAGCTGCCCGGCACTGCCTTATC 350 23S:A1
AGACAACCGGTCGACCA
CGTTCCTCTCGTACTGGAGCCACCTTCCCCTCAG 351 23S:A2
ACTACTAACACATCCA
CCTGTCTCACGACGGTCTAAACCCAGCTCACGTT 352 23S:A3
CCCCTTTAATGGGCGA
GGTGCTGCTGCACACCCAGGATGGAAAGAACCG 353 23S:A4
ACATCGAAGTAGCAAGC
GGCTCTTGCCTGCGACCACCCAGTTATCCCCGA 354 23S:A5
GGTAGTTTTTCTGTCAT
AGGAGGACTCTGAGGTTCGCTAGGCCCGGCTTT 355 23S:A6
CGCCTCTGGATTTCTTG
CAAAGTAAGTTAGAAACACAGTCATAAGAAAGTG 356 23S:A7
GTGTCTCAAGAACGAA
GACTTATAATCGAATTCTCCCACTTACACTGCATA 357 23S:A8
CCTATAACCAAGCTT
GTAAAACTCTACGGGGTCTTCGCTTCCCAATGGA 358 23S:A9
AGACTCTGGCTTGTGC
TCACTAAGTTCTAGCTAGGGACAGTGGGGACCT 359 23S:A10
CGTTCTACCATTCATGC
CGACAAGGCATTTCGCTACCTTAAGAGGGTTATA 360 23S:A11
GTTACCCCCGCCGTTT
AACTGAACTCCAGCTTCACGTGCCAGCACTGGG 361 23S:A12
CAGGTGTCGCCCTCTGT
CTAGCAGAGAGCTATGTTTTTATTAAACAGTCGG 362 23S:A13
GCCCCCCTAGTCACTG
TTAAAACGCCTTAGCCTACTCAGCTAGGGGCACC 363 23S:A14
TGTGACGGATCTCGGT
ACAAAACTAACTCCCTTTTCAAGGACTCCATGAAT 364 23S:A15
CAGTTAAACCAGTAC
ATAATGCCTACACCTGGTTCTCGCTATTACACCT 365 23S:A16
CTCCCCAGGCTTAAAC
CAATCCTACAAAACATATCTCGAAGTGTCAGAAA 366 23S:A17
TTAGCCCTCAACGTCA
CTTTGCTGCTACTACTACCAGGATCCACATACCT 367 23S:A18
GCAAGGTCCAAAGGAA
CAACCCACACAGGTCGCCACTCTACACAATCACC 368 23S:A19
AAAAAAAAGGTGTTCC
GGATTAATTCCCGTCCATTTTAGGTGCCTCTGAC 369 23S:A20
CTCGATGGGTGATCTG
AGGGTGGCTGCTTCTAAGCCCACCTTCCCATTGT 370 23S:A21
CTTGGGCCAAAGACTC
GTATTTAGGGGCCTTAACCATAGTCTGAGTTGTT 371 23S:A22
TCTCTTTCGGGACACA
CCTCACTCCAACCTTCTACGACGGTGACGAGTTC 372 23S:A23
GGAGTTTTACAGTACG
CCCTAAACGTCCAATTAGTGCTCTACCCCGCCAC 373 23S:A24
CAACCTCCAGTCAGGC
AATAGATCGACCGGCTTCGGGTTTCAATGCTGTG 374 23S:A25
ATTCCAGGCCCTATTA
ACAACGCTGCGGGCATATCGGTTTCCCTACGACT 375 23S:A26
ACAAGGATAAAAACCT
ACAAAGAACTCCCTGGCCCGTGTTTCAAGACGG 376 23S:A27
ACGATGCAACACTAGTC
ACAATGTTACCACTGATTCTTTCGGAAGAATTCAT 377 23S:A28
TCCTTACGCGCCACA
CTGGTTTCAGGTACTTTTCACCCCCCTATAGGGG 378 23S:A29
TACTTTTCAGCATTCC
CTCTATCGGTCTTGAGACGTATTTAGAATTGGAA 379 23S:A30
GTTGATGCCTCCCACA
ATCACCCTCTACGGTTCTAAAATTCCAAATAAAAT 380 23S:A31
TCGATTTATCCCACG
TCTATACACCACATCTCCCTAATATTACTAAAAGG 381 23S:A32
GATTCAGTTTGTTCT
GCCGTTACTAACGACATCGCATATTGCTTTCTTTT 382 23S:A33
CCTCCGCCTACTAAG
GGGTTCCCAATCCTACACGGATCAACACAAAAAA 383 23S:A34
AATGTGCTAGGAAGTC
ACTACTGGGATCGAAACGAGACCAGGTATAACC 384 5S:A1
CCCATGCTATGACCGCA
GCGTATGCCTGGAGAATTGGAATTCTTGTTACTC 385 MM_16S_P10
ATACTAACAGTGTTGC
GATTAACCCAATTTTAAGTTTAGGAAGTTGGTGTA 386 MM_16S_P11
AATTATGGAATTAAT
AGCTTGAACGCTTTCTTTATTGGTGGCTGCTTTTA 387 MM_16S_P12
GGCCTACAATGGTTA
ATTATTCACTATTAAAGGTTTTTTCCGTTCCAGAA 388 MM_16S_P13
GAGCTGTCCCTCTTT
CTTACTTTTTGATTTTGTTGTTTTTTTAGCAAGTTT 389 MM_16S_P14
AAAATTGAACTTAA
AACCAGCTATCACCAAGCTCGTTAGGCTTTTCAC 390 MM_16S_P15
CTCTACCTAAAAATCT
AATACTTGTAATGCTAGAGGTGATGTTTTTGGTAA 391 MM_16S_P7
ACAGGCGGGGTTCTT
TTTATCTTTTTGGATCTTTCCTTTAGGCATTCCGG 392 MM_16S_P8
TGTTGGGTTAACAGA
TTATTTATAGTGTGATTATTGCCTATAGTCTGATT 393 MM_16S_P9
AACTAACAATGGTTA
AGTGATTGTAGTTGTTTATTCACTATTTAAGGTTT 394 RN_16S_P4
TTTCCTTTTCCTAAA
TGGCTATATTTTAAGTTTACATTTTGATTTGTTGTT 395 RN_16S_P5
CTGATGGTAAGCTT
TTTTTTTAATCTTTCCTTAAAGCACGCCTGTGTTG 396 RN_16S_P6
GGCTAACGAGTTAGG
TGTTGGGTTAGTACCTATGATTCGATAATTGACAA 397 RN_16S_P7
TGGTTATCCGGGTTG
AGGAGAATTGGTTCTTGTTACTCATATTAACAGTA 398 RN_16S_P8
TTTCATCTATGGATC
TTTGTGATATAGGAATTTATTGAGGTTTGTGGAAT 399 RN_16S_P9
TAGTGTGTGTAAGTA
GCCGGGGAGTGGGTCTTCCGTACGCCACATTTC 400 MM_28S_P1
CCACGCCGCGACGCGCG
ACCTCGGGCCCCCGGGCGGGGCCCTTCACCTTC 401 MM_28S_P10
ATTGCGCCACGGCGGCT
TCGCGTCCAGAGTCGCCGCCGCCGCCGGCCCC 402 MM_28S_P14
CCGAGTGTCCGGGCCCCC
CGCTGGTTCCTCCCGCTCCGGAACCCCCGCGGG 403 MM_28S_P15
GTTGGACCCGCCGCCCC
CGCCGACCCCCGACCCGCCCCCCGACGGGAAG 404 MM_28S_P16
AAGGAGGGGGGAAGAGAG
GGGACGACGGGGCCCCGCGGGGAAGAGGGGA 405 MM_28S_P17
GGGCGGGCCCGGGCGGAAA
GGCGCCGCGCGGAAAACCGCGGCCCGGGGGG 406 MM_28S_P18
CGGACCCGGCGGGGGAACA
CCCCCACACGCGCGGGACACGCCCGCCCGCCC 407 MM_28S_P19
CCGCCACGCACCTCGGGA
CACCCGCTTTGGGCTGCATTCCCAAGCAACCCG 408 MM_28S_P2
ACTCCGGGAAGACCCGA
TGGAGCGAGGCCCCGCGGGGAGGGGACCCGCG 409 MM_28S_P20
CCGGCACCCGCCGGGCTC
CGAGGCCGGCGTGCCCCGACCCCGACGCGAGG 410 MM_28S_P21
ACGGGGCCGGGCGCCGGG
TCCCCGGAGCGGGTCGCGCCCGCCCGCACGCG 411 MM_28S_P22
CGGGACGGACGCTTGGCG
TCCACACGAACGTGCGTTCAACGTGACGGGCGA 412 MM_28S_P23
GAGGGCGGCCCCCTTTC
TCCCAAGACGAACGGCTCTCCGCACCGGACCCC 413 MM_28S_P24
GGTCCCGACGCCCGGCG
CCGCCGCGGGGACGACGCGGGGACCCCGCCGA 414 MM_28S_P25
GCGGGGACGGACGGGGAC
GCACCGCCACGGTGGAAGTGCGCCCGGCGGCG 415 MM_28S_P3
GCCGGTCGCCGGCCGGGG
CCCACCGGGCCCCGAGAGAGGCGACGGAGGGG 416 MM_28S_P6
GGTGGGAGAGCGGTCGCG
CCCGGCCCCCACCCCCACGCCCGCCCGGGAGG 417 MM_28S_P7
CGGACGGGGGGAGAGGGA
TATCTGGCTTCCTCGGCCCCGGGATTCGGCGAA 418 MM_28S_P8
AGCGCGGCCGGAGGGCT
CGCCGCCGACCCCGTGCGCTCGGCTTCGTCGG 419 MM_28S_P9
GAGACGCGTGACCGACGG
GCGCCCCCCCGCACCCGCCCCGTCCCCCCCGC 420 RN_28S_P12
GGACGGGGAAGAAGGGAG
CGAACCCCGGGAACCCCCGACCCCGCGGAGGG 421 RN_28S_P14
GGAAGGGGGAGGACGAGG
CACCCGGGGGGGCGACGAGGCGGGGACCCGC 422 RN_28S_P16
CGGACGGGGACGGACGGGG
GCCAACCGAGGCTCCTTCGGCGCTGCCGTATCG 423 RN_28S_P17
TTCCGCTTGGGCGGATT
CCCGGGCCCCCGGACCCCCGAGAGGGACGACG 424 RN_28S_P4
GAGGCGACGGGGGGTGGG
TGGGAGGGGCGGCCCGGCCCCCGCGACCGCCC 425 RN_28S_P5
CCCTTTCCGCCACCCCAC
GGGAGAGGCCGGGGGGAGAGCGCGGCGACGG 426 RN_28S_P6
GTATCCGGCTCCCTCGGCC
CGCTGCTGCCGGGGGGCTGTAACACTCGGGGC 427 RN_28S_P7
GGGGTGGTCCGGCGCCCA
CGCCGCCGACCCCGTGCGCTCGGCTTCGCTCCC 428 RN_28S_P8
CCCCACCCCGAGAAGGG
[0045] Em uma modalidade, a amostra de RNA é de um humano e o conjunto de sonda de DNA inclui sondas específicas para espécies de RNA indesejado humanas, por exemplo, transcrições de rRNA e de mRNA mitocondrial conforme descrito na presente revelação. Em uma outra modalidade, um conjunto de sonda de DNA para depleção de RNA indesejado de uma amostra de RNA humano inclui sondas específicas para transcrições de rRNA humano e mRNA mitocondrial, e sondas específicas para transcrições de RNA indesejado Gram-positivas e Gram- negativas conforme descrito na presente revelação. Em uma modalidade adicional, um conjunto de sonda de DNA para depleção de RNA indesejado de uma amostra de RNA humano inclui sondas específicas para uma espécie de Archaea bacteriana, sendo um exemplo M. smithii conforme descrito na presente revelação. Assim, em algumas modalidades, um conjunto de sonda de DNA para depleção de rRNA de uma amostra de RNA humano compreende somente sondas direcionadas a espécies de RNA indesejado humanas ou compreende um conjunto de sonda de DNA misto que tem como alvo também transcrições de RNA indesejado não humano. Os versados na técnica compreenderão que o conjunto de sonda a ser utilizado para depleção de RNA dependerá das intenções de pesquisa da amostra, o ambiente do qual a amostra foi extraída e quaisquer outros fatores que levam a um desenho experimental para depleção de RNA de uma amostra de RNA.
[0046] Em uma modalidade, a amostra de RNA é de um eucariota não humano e o conjunto de sonda de DNA inclui sondas específicas para RNA indesejado na amostra eucariótica fornecida. Por exemplo, se a amostra de RNA for de um camundongo ou rato, o conjunto de sonda de DNA incluiria sondas específicas para espécies de RNA indesejado de camundongo ou rato, o que também pode incluir sondas de DNA específicas para espécies de RNA indesejado bacteriano Gram-positivo e Gram- negativo, ou outras espécies bacterianas, por exemplo, a espécie Archaea.
[0047] Em algumas modalidades, as sondas de DNA não se hibridizam a todo o comprimento contíguo de uma espécie de RNA a ser deletada. Surpreendentemente, descobriu-se durante a experimentação que a sequência de comprimento total de uma espécie de RNA alvo para depleção não precisa ser alvo de uma sonda de DNA de comprimento total, ou de um conjunto de sonda que se conecta contiguamente sobre toda a sequência de RNA; na verdade, as sondas de DNA descritas na presente invenção deixam lacunas, de modo que os híbridos de DNA:RNA formados não sejam contíguos. Surpreendentemente, lacunas de ao menos 5 nt, 10 nt, 15 nt ou 20 nt entre híbridos de DNA:RNA permitiram uma eficiente depleção de RNA. Adicionalmente, os conjuntos de sonda que incluem lacunas podem se hibridizar de forma mais eficiente ao RNA indesejado, uma vez que as sondas de DNA não impedem a hibridização de sondas adjacentes como poderia potencialmente ocorrer com sondas que abrangem toda a sequência de RNA alvo para depleção, ou com sondas que se sobrepõem.
[0048] Além disso, os conjuntos de sonda podem ser complementados para melhorar os métodos de depleção de RNA para uma determinada espécie. Um método de suplementação de um conjunto de sonda para uso na depleção de moléculas de ácido nucleico de RNA não alvo de uma amostra de ácido nucleico pode compreender: a) colocar em contato uma amostra de ácido nucleico que compreende ao menos uma sequência alvo de RNA ou DNA e ao menos uma molécula de RNA não alvo de uma primeira espécie com um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo de uma segunda espécie, hibridizando assim as sondas de DNA às moléculas de RNA não alvo para formar híbridos de DNA:RNA, em que cada híbrido de DNA:RNA está com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de uma determinada sequência de moléculas de RNA não alvo de qualquer outro híbrido de DNA:RNA; b) colocar em contato os híbridos de DNA:RNA com uma ribonuclease que degrada o RNA a partir dos híbridos de DNA:RNA, degradando assim as moléculas de RNA não alvo na amostra de ácido nucleico para formar uma mistura degradada; c) separar o RNA degradado da amostra; d) sequenciar o restante do RNA da amostra; e) avaliar as demais sequências de RNA quanto à presença de moléculas de RNA não alvo da primeira espécie, determinando assim regiões de sequência de lacuna; e f) suplementar o conjunto de sonda com ao menos uma sonda de DNA complementar a sequências não contíguas em uma ou mais das regiões de sequência de lacuna. Em algumas modalidades, as regiões de sequência de lacuna compreendem ao menos 50, ou ao menos 60, ou ao menos 70 pares de base. Em algumas modalidades, a primeira espécie é uma espécie não humana e a segunda espécie é humana. Em algumas modalidades, a primeira espécie é rato ou camundongo. Métodos exemplificadores para suplementar um conjunto de sonda para depleção melhorada de moléculas de ácido nucleico de rRNA não alvo em amostras de camundongo são descritos no Exemplo 8 e na Figura 9.
[0049] Em algumas modalidades, uma primeira espécie é uma espécie não humana e uma segunda espécie é humana. Em algumas modalidades, uma primeira espécie é rato ou camundongo. Em algumas modalidades, a segunda espécie consiste em bactérias Gram-positivas e bactérias Gram-negativas humanas, ou uma mistura das mesmas. Composições e kits
[0050] Em uma modalidade, a presente revelação se refere a composições que compreendem um conjunto de sonda conforme descrito na presente invenção. Em algumas modalidades, a composição compreende o conjunto de sonda e uma ribonuclease capaz de degradar o RNA em um híbrido de DNA:RNA, como RNase H ou Hybridase. Em algumas modalidades, o conjunto de sonda compreende ao menos duas sondas de DNA complementares a ao menos uma molécula de rRNA não alvo na amostra de ácido nucleico, em que as sondas não se sobrepõem e são não contíguas em relação ao comprimento da molécula de rRNA não alvo (por exemplo, com ao menos 5 ou ao menos 10 bases de espaçamento ao longo de todo o comprimento). Em algumas modalidades, a composição compreende o conjunto de sonda que compreende ao menos duas sondas de DNA hibridizadas a ao menos uma molécula de RNA não alvo, em que cada sonda de DNA é hibridizada com ao menos 5 ou ao menos 10 bases de espaçamento ao longo do comprimento da molécula de RNA não alvo de qualquer outra sonda de DNA no conjunto de sonda. Em algumas modalidades, a composição compreende um produto químico desestabilizador de ácido nucleico, por exemplo, formamida, betaína, DMSO, glicerol, ou derivados ou misturas dos mesmos. Em uma modalidade, o produto químico desestabilizador é formamida ou um derivado dos mesmos que está presente em uma concentração entre 10 a 45% do volume total da reação de hibridização.
[0051] Em uma modalidade, a presente revelação descreve um kit que compreende um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento de ao menos uma molécula de rRNA não alvo (por exemplo, com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de todo o comprimento) em uma amostra de ácido nucleico, uma ribonuclease capaz de degradar o RNA em um híbrido de DNA:RNA. Em algumas modalidades, o conjunto de sonda compreende quaisquer das sondas de DNA descritas na presente invenção ou qualquer combinação das mesmas.
[0052] Em algumas modalidades, um kit compreende um tampão e meio de purificação de ácido nucleico. Em algumas modalidades, o kit compreende um ou mais entre um tampão, um meio de purificação de ácido nucleico e um conjunto de sonda de DNA conforme descrito na presente invenção. Em algumas modalidades, o conjunto de sonda compreende duas ou mais sequências das SEQ ID NOs: 1 a
333. Em algumas modalidades, o conjunto de sonda compreende duas ou mais sequências das SEQ ID NOs: 1 a 428. Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 377 sequências das SEQ ID NOs: 1 a 377 (bactérias Gram-positivas e bactérias Gram-negativas humanas e de Archaea). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 384 sequências das SEQ ID NOs: 1 a 333 e das SEQ ID NOs: 378-428 (bactérias Gram-positivas e bactérias Gram-negativas humanas, de camundongo e rato). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais,
ou 10 ou mais, ou 25 ou mais, ou 44 sequências das SEQ ID NOs: 334 a 377 (Archaea). Em algumas modalidades, um conjunto de sonda compreende duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 51 sequências das SEQ ID NOs: 378 a 428 (camundongo e rato).
[0053] Em algumas modalidades, o kit compreende: 1) conjunto de sonda conforme descrito na presente invenção; 2) uma ribonuclease; 3) uma DNase; e 4) microesferas de purificação de RNA. Em algumas modalidades, o kit compreende um tampão de depleção de RNA, um tampão de depleção de sonda e um tampão de remoção de sonda. Análise de amostras submetidas à depleção
[0054] Os métodos revelados também são úteis na análise de transcriptomas de amostras simples ou misturadas. A análise transcriptômica pode ser impedida pela alta abundância relativa de RNA ribossômico, por exemplo, uma amostra pode compreender ≥85% de moléculas de rRNA em RNA total de células bacterianas. Com estas altas quantidades de rRNA competindo pelo sequenciamento ou outros reagentes de análise, pode ser difícil focar em partes mais informativas de um transcriptoma que pode se perder no plano de fundo da análise do rRNA indesejado. Os métodos revelados podem facilitar a análise de transcriptoma rico de isolados microbianos ou eucarióticos, por exemplo, em baixas quantidades de insumo de DNA, levando a menores leituras de sequenciamento de rRNA, permitindo menores custos de sequenciamento e permitindo a análise metatranscriptômica de amostras com baixa biomassa. Isto é exemplificado no Exemplo 4, em que baixas quantidades de insumo (<80 ng) de amostras misturadas foram avaliadas usando os métodos de depleção de rRNA por RNase H descritos nesta revelação. Os métodos descritos na presente invenção podem ser utilizados em conjunto com várias aplicações subsequentes, como criação de bibliotecas para técnicas de sequenciamento de ácido nucleico, usando as amostras enriquecidas em RT-PCR, seguida de análise de microarranjo, PCR, qPCR etc. Entretanto, deve ficar entendido que as amostras de RNA enriquecidas resultantes dos métodos de depleção de RNA aqui descritos não estão limitadas a qualquer aplicação subsequente em particular, por exemplo, o sequenciamento.
[0055] Como exemplo, as amostras de RNA submetido à depleção podem ser utilizadas para criar bibliotecas de sequenciamento, de maneira que as bibliotecas criadas possam ser fixadas em locais fixos em uma matriz de modo que suas posições relativas não mudem e em que a matriz é repetidamente imageada. São particularmente aplicáveis as modalidades nas quais as imagens são obtidas em diferentes canais de cor, por exemplo, coincidindo com diferentes rótulos utilizados para distinguir um tipo de base de nucleotídeo de outro. Em algumas modalidades, o processo para determinar a sequência de nucleotídeos de um ácido nucleico alvo pode ser um processo automatizado. Modalidades preferenciais incluem técnicas de sequenciamento por síntese ("SBS").
[0056] As técnicas de SBS, de modo geral, envolvem a extensão enzimática de uma fita de ácido nucleico nascente por meio da adição iterativa de nucleotídeos contra uma fita modelo. Em métodos tradicionais de SBS, um monômero de nucleotídeo simples pode ser fornecido a um nucleotídeo alvo na presença de uma polimerase em cada aplicação. O SBS pode utilizar monômeros de nucleotídeo que possuem uma porção terminadora ou aqueles que não possuem quaisquer porções terminadoras. Os métodos que utilizam monômeros de nucleotídeo que não possuem terminadores incluem, por exemplo, pirossequenciamento e sequenciamento usando nucleotídeos marcados com γ-fosfato. Em métodos que usam monômeros de nucleotídeo sem terminadores, o número de nucleotídeos adicionados em cada ciclo é, de modo geral, variável e dependente da sequência modelo e o modo de aplicação do nucleotídeo. Para as técnicas de SBS que utilizam monômeros de nucleotídeo tendo uma porção terminadora, o terminador pode ser eficazmente irreversível sob as condições de sequenciamento utilizadas como é o caso do sequenciamento tradicional Sanger que utiliza dideoxinucleotídeos, ou o terminador pode ser reversível como é o caso dos métodos de sequenciamento desenvolvidos por Solexa (agora Illumina, Inc.).
[0057] As metodologias de sequenciamento que podem potencializar os fluxos de trabalho de depleção de RNA e as amostras enriquecidas de RNA incluem, mas não se limitam ao sequenciamento de ciclo que é realizado pela adição gradual de nucleotídeos terminadores reversíveis contendo, por exemplo, um corante clivável ou fotobranqueável. Exemplos de equipamentos da Illumina que podem potencializar os métodos descritos na presente invenção incluem os equipamentos comerciais HiSeq™, MiSeq™, NextSeq™, NovaSeq™, NextSeq™ e iSeq™.
[0058] Técnicas adicionais de sequenciamento incluem o sequenciamento por ligação. Estas técnicas utilizam DNA ligase para incorporar oligonucleotídeos e identificar a incorporação destes oligonucleotídeos.
[0059] Adicionalmente, o sequenciamento por nanoporos também pode usar as amostras de RNA submetidas à depleção reveladas para a preparação de biblioteca. Os métodos de sequenciamento por nanoporos sequenciam uma fita de ácidos nucleicos que passam através de um poro, em que uma alteração na corrente através do poro é característica de qual nucleotídeo está passando através do poro.
[0060] Adicionalmente, o sequenciamento usando monitoramento em tempo real da atividade de DNA polimerase pode utilizar as amostras de RNA submetido à depleção.
[0061] As tecnologias de SBS adicionais que podem criar bibliotecas para sequenciamento usando as amostras de RNA submetido à depleção descritas na presente invenção incluem a detecção de um próton liberado mediante a incorporação de um nucleotídeo em um produto de extensão. Por exemplo, o sequenciamento com base na detecção de prótons liberados pode usar um detector elétrico e técnicas associadas que estão comercialmente disponíveis junto à Ion Torrent (Guilford, CT, EUA, uma subsidiária da Life Technologies).
[0062] A aplicação subsequente adicional que pode potencializar as amostras enriquecidas após a depleção de RNA conforme descrito na presente invenção inclui PCR, qPCR, análise de microarranjo etc. Por exemplo, a análise de microarranjo é uma poderosa técnica para estudar a expressão gênica. As amostras enriquecidas podem ser utilizadas na análise de microarranjo pela conversão do RNA enriquecido em cDNA seguindo-se métodos conhecidos pelos versados na técnica (por exemplo, reação de transcriptase reversa seguida de reação em cadeia de polimerase, RT-PCR). O cDNA poderia ser, então, imobilizado em substratos, sondas de microarranjo aplicadas e análise de expressão determinadas seguindo-se qualquer número de metodologias de análise de microarranjo (por exemplo, Agilent, Affymetrix e Illumina para citar alguns sistemas de análise de microarranjo comercialmente disponíveis). A reação em cadeia de polimerase (PCR) ou PCR quantitativa (qPCR) também poderia utilizar a amostra enriquecida como um substrato seguindo-se técnicas estabelecidas (Protocolos Atuais para Biologia Molecular).
[0063] Desta forma, as amostras de RNA submetido à depleção resultantes dos métodos descritos na presente invenção podem ser utilizadas para criar bibliotecas de sequenciamento, produtos de amplificação e similares que podem ser utilizados para metodologias de análise subsequente. Os métodos revelados não são limitados por qualquer aplicação subsequente. Exemplos
[0064] Os exemplos a seguir são somente ilustrativos e não se destinam a limitar o escopo do pedido. Modificações ficarão evidentes e serão compreendidas pelos versados na técnica e estão incluídas no espírito e na revelação do presente pedido. Exemplo 1 – Depleção de espécie de RNA indesejado de uma amostra
[0065] Neste exemplo, o RNA total é o ácido nucleico alvo na amostra e a depleção de RNA envolve quatro etapas principais: 1) hibridização, 2) tratamento com RNase H, 3) tratamento com DNase, e 4) limpeza do RNA alvo.
[0066] A hibridização é realizada pelo anelamento de um conjunto definido de sonda de DNA ao RNA desnaturado em uma amostra. Uma amostra de RNA, de 10 a 100 ng, é incubada em um tubo com 1 µl de um conjunto de sonda oligo de 1 µM/oligo DNA (sondas correspondentes às SEQ ID NOs: 1-333, conforme listado na Tabela 1), 3 µl de tampão de hibridização 5X (Tris HCl 500 mM, pH 7,5 e KCl
1.000 mM), 2,5 µl de formamida 100% e água suficiente para completar um volume total de reação de 15 µl. A reação de hibridização é incubada a 95 °C durante 2 min para desnaturar os ácidos nucleicos, lentamente resfriada até 37 °C por redução da temperatura de 0,1 °C/s e mantida a 37 °C. Nenhum tempo de incubação foi necessário quando a reação atinge 37 °C. O tempo total necessário para que a desnaturação atinja 37 °C é de cerca de 15 min.
[0067] Após a hibridização, os seguintes componentes são adicionados ao tubo de reação para a remoção de RNase H da espécie de RNA indesejado do dúplex de DNA:RNA; 4 µl de tampão de RNase H 5X (Tris 100 mM, pH 7,5, DTT 5 mM, MgCl2 4 0 mM) e 1 µl de enzima RNase H. A reação enzimática é incubada a 37 °C durante 30 min. O tubo de reação pode ser mantido em gelo.
[0068] Após a remoção do RNA do híbrido de DNA:RNA, as sondas de DNA são degradadas. Ao tubo de reação de 20 µl, os seguintes componentes são adicionados: 3 µl de tampão Turbo DNase 10X (Tris 200 mM, pH 7,5, CaCl2 50 mM, MgCl2 20 mM), 1,5 µl de Turbo DNase (Thermo Fisher Scientific) e 5,5 µl de H2O até um volume total de 30 µl. A reação enzimática é incubada a 37 °C durante 30 min, seguida de 75 °C durante 15 min. A incubação a 75 °C pode servir para fragmentar o RNA total alvo nos tamanhos de inserto desejados para uso em processamento subsequente; neste exemplo, o tamanho de inserto alvo é de aproximadamente 200 nt do RNA total. O tempo desta etapa de incubação pode ser ajustado dependendo do tamanho do inserto necessário para reações subsequentes, como é conhecido de um versado na técnica. Após a incubação, o tubo de reação pode ser mantido em gelo.
[0069] Após a hibridização das sondas ao RNA indesejado, a remoção do RNA e a remoção do DNA, o RNA total alvo na amostra pode ser isolado das condições de reação. O tubo de reação é retirado de 4 °C e deixado atingir a temperatura ambiente e 60 µl de microesferas RNAClean XP (Beckman Coulter) são adicionados, e o tubo de reação é incubado durante 5 min. Após a incubação, o tubo é colocado sobre um ímã durante 5 min, período após o qual o sobrenadante é cuidadosamente removido e descartado. Enquanto ainda estiver sobre o ímã, as microesferas com o
RNA total fixado são lavadas duas vezes em 175 µl de EtOH 80% fresco. Após a segunda lavagem, as microesferas são centrifugadas em uma microcentrífuga para peletizar as microesferas no fundo do tubo, o tubo é colocado de volta sobre o imã e o EtOH é removido, tomando-se cuidado para remover o máximo possível de EtOH residual sem perturbar as microesferas. As microesferas são secas ao ar por alguns minutos, ressuspensas em 9,5 µl de tampão ELB (Illumina), deixadas em repouso durante mais alguns minutos em temperatura ambiente e colocadas de volta sobre o ímã para coletar as microesferas. 8,5 µl do sobrenadante são transferidos para um tubo novo e colocados em gelo para processamento subsequente adicional, por exemplo, cDNA criado a partir do RNA total alvo.
[0070] Em um outro exemplo, 100 ng de RNA total são diluídos em 11 µl de água ultrapura isenta de nuclease em cada poço de uma placa de PCR de 96 poços. A cada poço são adicionados 4 µl de sondas de DNA (SEQ ID NOs: 1 a 333) em tampão de hibridização e os conteúdos do poço são misturados e opcionalmente centrifugados. A placa é aquecida a 95 °C durante 2 min e, então, a temperatura é reduzida a 0,1 °C por segundo até que atinja 37 °C e, então, é mantida a 37 °C para hibridizar as sondas. A placa é centrifugada a 280 x g por 10 segundos. Para degradar os híbridos de DNA:RNA, 5 µl de RNase em tampão são adicionados a cada poço e os conteúdos do poço são misturados. A placa é aquecida a 37 °C durante 15 min e, então, mantida a 4 °C. A cada poço são adicionados 10 µl de DNase em tampão e os conteúdos do poço são misturados. A placa é aquecida a 37 °C durante 15 min e, então, mantida a 4 °C. A placa de amostra é centrifugada a 280 x g por 10 segundos. A cada poço são adicionados 60 µl de microesferas RNAClean XP e os conteúdos do poço são misturados. A placa é incubada em temperatura ambiente durante 5 min. A placa é colocada em um suporte magnético até que o sobrenadante fique transparente (cerca de 5 min). O sobrenadante em cada poço é removido e descartado. As microesferas são lavadas duas vezes com etanol 80%. O etanol residual é removido de cada poço e a placa é seca ao ar sobre o suporte magnético durante 1 min. A cada poço são adicionados 10,5 µl de tampão de eluição, os conteúdos do poço são misturados e a placa é incubada em temperatura ambiente durante 2 min. A placa é selada e centrifugada a 280 x g por 10 segundos. A placa é colocada sobre um suporte magnético até que o sobrenadante fique transparente (cerca de 2 min). De cada poço, 8,5 µl de sobrenadante são transferidos ao poço correspondente de uma nova placa. Exemplo 2 – Síntese de cDNA
[0071] O processamento adicional do RNA a partir do Exemplo 1 poderia resultar em uma preparação de biblioteca a partir dos ácidos nucleicos alvo do RNA que podem ser sequenciados, por exemplo, por NGS. Aos 8,5 µl da reação final do Exemplo 1, 8,5 µl de tampão de mistura de hexâmetros aleatórios em alta concentração de prime para eluição (tampão EPH, Kit de RNA total em fita TruSeq, Illumina) são adicionados até um volume total de 17 µl. A amostra é incubada a 65 °C durante 2 min para desnaturar os ácidos nucleicos. Após a desnaturação, o tubo de reação pode ser mantido em gelo. A síntese de primeira fita é realizada adicionando- se 8 µl de uma mistura de enzima de transcrição reversa (9 µl de mistura para síntese de primeira fita (FSA, Kit de RNA total em fita TruSeq, Illumina) e 1 µl de Protoscript II RT, (NEB)) à amostra desnaturada até um volume total de 25 µl. A mistura de reação é incubada em um termociclo com tampa aquecido sob as seguintes condições: 25 °C durante 5 min, 42 °C durante 25 min, 70 °C durante 15 min. Depois que a reação de síntese de primeira fita estiver concluída, o tubo de reação pode ser mantido em gelo.
[0072] A síntese de cDNA de segunda fita pode ser realizada adicionando-se 5 µl de tampão de ressuspensão (RSB, Kit de RNA total em fita TruSeq, Illumina) e 20 µl de mistura de marcação de segunda fita (tampão SSM, Kit de RNA total em fita TruSeq, Illumina) à amostra gelada. O tubo de reação é incubado a 16 °C durante 60 min e a amostra pode ser, então, mantida em gelo.
[0073] Após as etapas de síntese de cDNA, o cDNA pode ser limpo e separado dos componentes de reação, por exemplo, adicionando-se 90 µl de SPB (Illumina) ao tubo de reação e incubando-se durante 5 min em temperatura ambiente. Após a incubação, o tubo é colocado sobre um ímã durante aproximadamente 8 min para a coleta das microesferas paramagnéticas e o sobrenadante é cuidadosamente removido e descartado. Ainda sobre o imã, as microesferas são lavadas duas vezes com 175 µl de EtOH 80% fresco. Após as lavagens, as microesferas são centrifugadas até o fundo do tubo, o tubo é colocado de volta sobre o ímã e o EtOH é cuidadosamente removido e descartado. As microesferas são secas por alguns minutos e ressuspensas em 18,5 µl de RSB, bem misturadas e deixadas incubar em temperatura ambiente durante aproximadamente 5 min antes de serem colocadas de volta sobre o ímã. Dependendo da aplicação subsequente, a quantidade desejada de cDNA purificado pode ser removida para um novo tubo. Neste exemplo, uma preparação de biblioteca para sequenciamento subsequente está sendo formada, então 17,5 µl do sobrenadante são transferidos para um novo tubo que pode ser mantido em gelo. Exemplo 3 – Preparação de biblioteca para sequenciamento de próxima geração
[0074] Um método de preparação de uma biblioteca para sequenciamento inclui fragmentos de cDNA por adição de cauda A [A-tailing], adaptadores de ligação, amplificação de fragmentos alvo e quantificação de fragmentos resultantes antes do sequenciamento.
[0075] O tubo com 17,5 µl de cDNA purificado do Exemplo 2 é utilizado para processamento. Ao cDNA purificado, adiciona-se 12,5 µl de ATL (Illumina) para os fragmentos de adição de cauda A. O tubo de reação é incubado a 37 °C durante 30 min, seguido de incubação a 70 °C durante 5 min e o tubo é colocado de volta no gelo. Os adaptadores são ligados à amostra com cauda A por adição em ordem: 2,5 µl de RSB, 2,5 µl de Adaptadores de Índice (Kit de RNA total em fita TruSeq, Illumina) e 2,5 µl de tampão de ligação (Illumina). O tubo de reação é incubado a 30 °C durante 10 min, período após o qual 5 µl de tampão de interrupção de ligação (Illumina) é adicionado e a reação é mantida em gelo.
[0076] Depois que a reação de ligação do adaptador estiver concluída, os fragmentos ligados são separados dos componentes de reação. Para purificar os fragmentos ligados do adaptador, 34 µl de SPB são adicionados ao tubo de reação que é incubado em temperatura ambiente durante aproximadamente 5 min. O tubo é, então, colocado sobre um ímã para capturar as microesferas paramagnéticas e as microesferas são lavadas duas vezes com 175 µl de EtOH 80%, sendo o EtOH cuidadosamente removido após a segunda lavagem. Após a secagem ao ar por 3 min, as microesferas são ressuspensas em 52 µl de RSB, a pasta fluida é misturada, deixada em repouso em temperatura ambiente durante mais 5 min e colocada de volta ao ímã. O sobrenadante (50 µl) é transferido para um tubo novo para um segundo ciclo de limpeza de microesfera.
[0077] Para o segundo ciclo, 40 µl de SPB são adicionados aos 50 µl de amostra e o processo descrito acima é repetido, exceto pelo fato de que os fragmentos purificados finais são ressuspensos em 21 µl de RSB e 20 µl da amostra purificada final são transferidos para um novo tubo de reação para subsequente amplificação que aumenta a quantidade de sequência alvo para que se tenha resultados de sequenciamento otimizados.
[0078] Aos 20 µl de amostra purificada ligada por adaptador, 5 µl de coquetel de primer de PCR (PPC, Kit de RNA total em fita TruSeq, Illumina) e 25 µl de PPM (Kit de RNA total em fita TruSeq, Illumina) são adicionados e o seguinte programa de amplificação em um termociclo com tampa aquecido é realizado: 98 °C durante 30 segundos, seguido do programa em ciclos de 98 °C aos 10 s, 60 °C aos 30 s, 72 °C aos 30 s. O número de ciclos de amplificação depende da quantidade de insumo de RNA no início de todo o processo. Por exemplo, para 100 ng de RNA, aproximadamente 12 a 13 ciclos podem ser adequados, para 10 ng 15 a 16 ciclos e para 1 ng 17 a 18 ciclos podem ser necessários. O número de ciclos de amplificação é tipicamente otimizado para qualquer preparação como é conhecido pelos versados na técnica.
[0079] Os amplicons podem ser purificados das condições de reação pela adição de 50 µl de SPB ao tubo de reação, incubação em temperatura ambiente, centrifugação do tubo para peletizar as microesferas e capturar as microesferas magneticamente. O sobrenadante pode ser descartado e as microesferas lavadas como definido anteriormente, seguido pela ressuspensão das microesferas lavadas em 26 µl de RSB, captura de microesfera magnética e transferência do sobrenadante contendo a biblioteca de DNA para sequenciamento para um tubo novo. A biblioteca é tipicamente quantificada e analisada antes do sequenciamento, por exemplo, medindo-se uma alíquota usando o kit de alta sensibilidade Qubit™ (Thermo Fisher Scientific) e/ou processando uma alíquota em um Bioanalisador (Agilent). Um versado na técnica entenderá as várias maneiras pelas quais os ácidos nucleicos em uma amostra podem ser quantificados.
[0080] A preparação de biblioteca resultante pode ser, então, utilizada para sequenciamento de próxima geração, análise de microarranjo ou outras aplicações subsequentes. Para aplicações como o sequenciamento, a metodologia de preparação de biblioteca é determinada pelo equipamento de sequenciamento utilizado e o método de preparação de biblioteca complementar definido para aquele equipamento de sequenciamento. Neste exemplo, o método de preparação de biblioteca é característico da criação de biblioteca ao realizar o sequenciamento em equipamentos de sequenciamento da Illumina. Um versado na técnica entenderá que os métodos de preparação de biblioteca podem variar dependendo dos equipamentos de sequenciamento, assim os presentes exemplos são apenas exemplificadores e os presentes métodos de depleção de RNA não são limitados a qualquer fluxo de trabalho em particular para a preparação de biblioteca. De fato, os presentes métodos fornecem uma amostra de RNA submetido à depleção que pode servir como insumo para quaisquer aplicações subsequentes que se beneficiariam de uma amostra de RNA submetido à depleção de espécie de RNA indesejado. Exemplo 4 – Análise de transcriptoma microbiano
[0081] Neste exemplo, os isolados microbianos, uma amostra misturada de espécie bacteriana e uma mistura de células padrão foram obtidos junto à ATCC para fins de teste.
Tipo de amostra Espécie microbiana testada Isolados E. coli, B. subtilis, S. Epidermidis, E. cloacae e B. cereus microbianos
ATCC-MSA2002 A. baumannii, A. odontolyhticus, B. cereus, B. vulgatus, B. Mistura de 20 adolescentis, C. beijerinckii, C. acnes, D. radiodurans, E. cepas faecalis, E. coli, H. pylori, L. gasseri., N. meningitidis, P. gingivalis, P. aeruginosa, R. sphaeroides, S. aureus, S. epidermidis, S. agalactiae, S. mutans ATCC MSA2006 B. tragilis, B. vulgatus, B. adolescentis, C. difficile, E. Mistura do trato faecalis, L. plantarum, E. cloacae, E. coli, H. pylori, S. gastrointestinal enterica, y. enterococolitica, F. nucleatum humano
[0082] O RNA total pode ser extraído usando o kit de microbioma RNeasy Power (Qiagen) de acordo com o protocolo do fabricante e avaliado quanto à integridade e quantificado por eletroforese de RNA em bioanalisador (Agilent). Podem ser utilizados 10 a 250 ng de RNA total de cada amostra para depleção de rRNA após o uso tanto da metodologia RiboZero (Illumina, de acordo com o protocolo do fabricante) quanto dos métodos revelados na presente invenção usando degradação enzimática com RNase H do rRNA indesejado. As amostras de RNA submetidas à ribo-depleção e não submetidas à ribo-depleção (controle) podem ser preparadas para sequenciamento usando o kit de preparação de amostra de RNA total em fita TruSeq (Illumina) de acordo com as instruções do fabricante. As bibliotecas podem ser agrupadas e sequenciadas, por exemplo, em um equipamento de sequenciamento MiSeq ou NextSeq (Illumina) por leituras finais em pares de 2 x 76.
[0083] A filtragem de sequência, o alinhamento e a cobertura de transcrição podem ser realizadas usando o Hub de Sequenciamento BaseSpace (BSSH) online e os seguintes fluxos de trabalho exemplificadores, por exemplo: 1) Aplicativo de Sequências de rRNA de Partição (análise das sequências de rRNA para denotar como sequências abundantes em análise), 2) Aplicativo Construtor Customizado de Genoma de RNA (criação de transcriptoma microbiano compatível com STAR) e 3) Aplicativo de Alinhamento de RNA-Sequência (alinhamento STAR e quantificação de transcrição Salmon). Para quantificar o rRNA a partir de múltiplas cepas dentro das amostras microbianas, as sequências de rRNA podem ser recuperadas de genomas registrados no NCBI e utilizadas como insumos para o fluxo de trabalho BSSH.
[0084] Os transcriptomas dos isolados microbianos, das misturas microbianas e das amostras de controle foram sequenciados e as leituras da % de rRNA foram comparadas. O método enzimático por RNase H revelado na presente invenção é altamente eficaz na depleção rRNA indesejado na espécie testada (leituras <5% de rRNA). A depleção de RNA ribossômico é a mais significativa para a amostra de E. coli com baixa quantidade de insumo (10 ng) usando o método RNase H em comparação ao método estabelecido RiboZero; leituras médias de rRNA <0,5% versus 13%, respectivamente (Figura 5).
[0085] Os dados foram utilizados para acessar o enriquecimento de leituras de RNA biologicamente importantes quando o método de depleção de rRNA por RNase H foi utilizado e comparado com a ausência de depleção de rRNA. A Figura 6 apresenta os resultados de uma avaliação onde, de modo geral, uma redução de 20 a 50 vezes na profundidade de leitura foi observada para uma amostra de B. subtilis ou E. coli caso a amostra fosse submetida à depleção de rRNA antes da preparação da biblioteca e do sequenciamento usando os métodos por RNase H em comparação à ausência de depleção de rRNA.
[0086] Os dados coletados foram avaliados para determinar a reprodutibilidade dos esforços de sequenciamento experimental de transcriptoma microbiano. A regressão linear em pares de níveis de expressão gênica foi determinada entre as réplicas submetidas à depleção de rRNA por RNase H para E. coli e B. subtilis como sistemas exemplificadores. A alta correlação (R2>0,99) indicou a capacidade do método de depleção de rRNA por RNase H de remove, de modo reprodutível, o rRNA das amostras (Figura 7).
[0087] Para avaliar se o método enzimático de depleção de rRNA por RNase H pode ser útil para a depleção de rRNA de amostras misturadas, a Figura 8 apresenta dados exemplificadores das amostras misturadas de 20 cepas de MSA2002 e de trato gastrointestinal humano MSA2006 em triplicata. As amostras com baixa quantidade de insumo de 10 mg de RNA total proveniente de MSA2002 ou de 80 ng de RNA total de MSA2006 foram utilizadas para métodos de depleção de rRNA. Para as amostras de 20 cepas de MSA2002, o método de depleção de rRNA por RNase H reduziu as leituras de rRNA em 83% ou <2% de leituras de sequência, ao passo que o método RiboZero de depleção de rRNA resultou em uma abundância maior e mais variável de rRNA em comparação às amostras não submetidas à depleção. Para as amostras de 12 cepas de MSA2006, o mesmo resultado foi observado quando o método por RNase H reduziu as leituras de rRNA em aproximadamente 95% para <13% das leituras de sequenciamento em comparação às amostras não submetidas à depleção, e o método RiboZero teve resultados mais variáveis.
[0088] Desta forma, foi determinado que, em experimentos para a avaliação de amostras, sejam misturadas ou de outra maneira, o método de depleção de rRNA por RNase H fornece um fluxo de trabalho robusto e eficaz para reduzir o rRNA indesejado em amostras para pesquisa de transcriptoma microbiano total de alta qualidade. O método de depleção de rRNA por RNase H também foi muito eficaz e compatível com amostras com baixa quantidade de insumo. Exemplo 5 – Efeito da formamida sobre a depleção de RNA
[0089] A Figura 2 mostra dados exemplificadores em que uma amostra de RNA foi submetida à depleção de espécies de RNA indesejado. A amostra de RNA foi submetida à depleção de RNA indesejado usando os métodos descritos na presente invenção, ao passo que avalia os efeitos da concentração de formamida sobre a depleção de RNA indesejado. Neste exemplo, a depleção que tem como alvo as sondas de DNA de espécies de rRNA indesejado de bactérias Gram-positivas (23S, 16S, 5S), bactérias Gram-negativas (23S, 16S, 5S inclusive), mitocôndria humana (16S, 12S), rRNAs humanos (28S, 18S, 5.8S, 5S), mRNAs de hemoglobina humana (HBA-A1, HBA-A2, HBB, HBG1, HBG2), ao passo que a espécie de RNA alvo é RNA total de B. subtilis. Conforme a concentração de formamida aumenta, a porcentagem de leituras da espécie de RNA indesejado diminuiu significativamente. Por exemplo, durante a depleção de RNA, nenhuma formamida surgiu em leituras de RNA não alvo para bactérias Gram-positivas de 23S e 16S e Gram-negativas (incluindo E. coli) de 23S e 16S, incluindo sequências específicas de E. coli. A adição de 25% de formamida à reação de hibridização resultou em leituras de não alvo indetectável de 23S e 16S Gram-negativas (com significativa redução em leituras de não alvos específicos ao E. coli) e reduziu significativamente as leituras de não alvo de 23S e 16S Gram-positivas. A adição de formamida a 45% da reação de hibridização demonstrou reduções significativas adicionais em leituras de não alvo de 23S e 16S de rRNA indesejado Gram-positivas, bem como uma redução adicional em leituras de E. coli não alvo. Desta forma, demonstra-se que a adição de formamida à reação de hibridização para depleção de RNA aumenta a quantidade de RNAs indesejados Gram-positivos e Gram- negativos submetidos à depleção conforme evidenciado pela redução em leituras de não alvo daquelas espécies. De modo geral, descobriu-se que a adição de formamida melhora a depleção das transcrições de rRNA indesejado. O uso de RNA de B. subtilis como o RNA alvo para análise, por exemplo, em ensaio para sequências de rRNA de E. coli e humanas, pode fornecer uma medida da contaminação em potencial. Exemplo 6 – Variação do material de partida como insumo
[0090] Os experimentos foram realizados para identificar o impacto do material de partida como insumo sobre a depleção de RNA e a análise downstream subsequente, como mostrado na Figura 3 em que as amostras de RNA submetido à depleção e as amostras enriquecidas de RNA de cérebro humano (HBR) e um RNA humano universal (UHR) foram utilizadas para criar bibliotecas para sequenciamento no equipamento de sequenciamento NextSeq™ 500 ou 550 da Illumina. Após a depleção de RNA usando 100 ng, 10 ng ou 1 ng como insumo de amostra, as bibliotecas de sequenciamento foram preparadas como exemplificado nos Exemplos 1-3. O sequenciamento foi realizado conforme recomendado pelo guia do usuário do NextSeq™ seguido da análise de dados usando dois aplicativos BaseSpace (Illumina), a saber, o aplicativo de alinhamento RNASeq e o aplicativo RNAExpress. A análise de dados quanto à presença de B. subtilis e E. coli também foi realizada usando uma ferramenta modificada Fastqscreen (https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/). Os dados demonstram que a depleção de RNA permanece constante tanto para HBR quanto para UHR independentemente da quantidade de insumo da amostra de RNA e da % de alinhamento total do RNA alvo, ao passo que diminuiu com quantidades decrescentes de insumo, mostrando ainda que dados de sequência realizáveis e úteis podem ser coletados mesmo ao se utilizar 1 ng como insumo de amostra. Adicionalmente, em um experimento comparativo, o atual método para depleção de RNA leva a uma menor abundância % de leituras de não alvo em todos os níveis de insumo (100 ng ~ 3%, 25 ng ~ 4%, 10 ng ~ 3% e 1 ng ~ 3%) em comparação com dados ao se utilizar o kit de depleção de rRNA RiboZero (Epicentre) para depleção de RNA (100 ng ~ 3%; 25 ng ~ 5%, 10 ng ~ 8% e 1 ng ~ 35%) ou os métodos de depleção de rRNA NEBNext (NEB) (100 ng ~ 8%, 25 ng ~ 8%, 10 ng ~ 9% e 1 ng ~ 30%). Exemplo 7 –Depleção de RNA de amostras de RNA de camundongo e rato
[0091] Para demonstrar que os métodos de depleção de RNA podem ser úteis para amostras de RNA não humano, amostras de RNA tanto de camundongo quanto de rato foram utilizadas para métodos de depleção de RNA. Para a Figura 4, amostras de RNA tanto de camundongo quanto de rato foram submetidas à depleção de RNA indesejado usando métodos e sondas de DNA equivalentes às de amostras de RNA humano. A formamida foi novamente variada para cada espécie de roedor, incluindo a ausência de formamida, 25% de formamida ou 45% de formamida na reação de hibridização. Embora a % total de leituras alinhadas não seja afetada pelo aumento na formamida, pode haver uma tendência a um aumento na detecção de leituras de não alvo conforme a formamida aumenta. Desta maneira, a adição de formamida à reação de hibridização pode ser útil em alguns tipos de amostra, pois pode melhorar a detecção de algumas transcrições, assim sua adição deve ser otimizada. Exemplo 8 – Preparação de sondas suplementares de camundongo
[0092] Dentro do grupo de 333 sondas de DNA descrito acima para remoção enzimática de sequências indesejadas (SEQ ID NOs: 1 a 333), os oligonucleotídeos de DNA para depleção de rRNA eucariótico foram projetados com base nas principais transcrições de rRNA humano, a saber, 5S, 5.8S, 18S, e 28S, bem como as duas sequências de rRNA mitocondrial, a saber, 12S e 16S. Quando testada em
RNA total humano, este grupo de DNA de 333 sondas foi muito eficaz na remoção de leituras de rRNA. Entretanto, quando testada com amostras de RNA total de camundongo (Mus musculus) ou de rato (Rattus norvegicus), a depleção foi menos robusta, sugerindo que as sondas não se hibridizaram e removem eficazmente algumas regiões de sequências de rRNA de roedor, uma vez que estas regiões de camundongo e de rato eram diferentes das sequências humanas.
[0093] Os arquivos Fastq contendo as leituras de sequenciamento total obtidas do experimento com 333 sondas de DNA foram alinhadas às sequências de RNA ribossômico de camundongo e rato e às 333 sequências de sonda de DNA. Os resultados do alinhamento mostraram que a cobertura de sonda ao longo de todas as sequências de RNA ribossômico foi, de modo geral, satisfatória, porém há algumas regiões onde as sequências de sonda não se alinharam tão bem aos rRNAs de roedor. Mais especificamente, a maioria das leituras rRNA de camundongo e rato que não se alinhou ao mapa do grupo de sonda pertencia às transcrições 28S ou 16S de rRNA de roedor (Tabela 2). Os alinhamentos foram realizados com Bowtie2 (vide Langmead and Salzberg, Nature Methods 2012, 9:357 a 359), versão 2.1.0 com suas configurações padrão. A maior parte do RNA ribossômico que não foi submetida à depleção com o método enzimático de 333 sondas de DNA era das mesmas regiões que não tinham alinhamento de sonda (Figura 9).
Tabela 2. Sequências Genbank de camundongo/rato utilizadas para o estudo Genoma 16S 28S Mus musculus NC_005089.1:1094-2675 NR_003279.1 Rattus norvegicus NC_001665.2:1094-2664 NR_046246.1
[0094] Para realizar a depleção destas regiões mais eficazmente, sondas adicionais foram projetadas para abranger as regiões identificadas acima quanto às sequências de RNA ribossômico de camundongo e rato. Para minimizar o número de sondas adicionais e redundâncias de sonda, sondas adicionais foram projetadas contra as lacunas nas sequências de rRNA de camundongo, então estes dados foram agrupados por computação com o conjunto de 333 sondas de DNA para identificar quaisquer lacunas remanescentes na cobertura de rRNA de rato pelo alinhamento do grupo combinado com as transcrições de rRNA de rato. Este processo sequencial resultou em um total de 44 sondas adicionais de oligonucleotídeo para fornecer um grupo suplementar de 377 sondas. Os experimentos de sequenciamento conforme descritos acima foram repetidos com o conjunto de 377 sondas de DNA. Tanto nas amostras de camundongo quanto nas de rato, a adição das 44 novas sondas resultou em uma redução na porcentagem de leituras de rRNA a partir das bibliotecas em comparação ao conjunto de 333 sondas de DNA, demonstrando maior eficiência de depleção (Tabela 3).
Tabela 3. Porcentagem de RNA ribossômico em leituras de sequenciamento com os conjuntos de 333 e 377 sondas Conjunto de sonda RNase H Amostra de camundongo Amostra de rato Conjunto de 333 sondas de DNA 9,5% 5,3% Conjunto de 377 sondas de DNA 7,0% 3,7%
[0095] A suplementação do grupo de 333 sondas de DNA com sondas adicionais contra determinadas sequências de roedor melhorou a depleção de rRNA nas amostras testadas de roedor. As sondas exemplificadoras contra 16S de camundongo incluem as SEQ ID NOs: 385 a 393. As sondas exemplificadoras contra 28S de camundongo incluem as SEQ ID NOs: 400 a 419. As sondas exemplificadoras contra 16S de rato incluem as SEQ ID NOs: 394 a 399. As sondas exemplificadoras contra 28S de rato incluem as SEQ ID NOs: 420 a 428.

Claims (50)

REIVINDICAÇÕES
1. Método para depleção de moléculas de RNA não alvo a partir de uma amostra de ácido nucleico, caracterizado por compreender: a) colocar em contato uma amostra de ácido nucleico, que compreende ao menos uma sequência de RNA ou DNA alvo e ao menos uma molécula de RNA não alvo, com um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo, hibridizando assim as sondas de DNA às moléculas de RNA não alvo para formar híbridos de DNA:RNA, em que cada híbrido de DNA:RNA está com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de uma determinada sequência de moléculas de RNA não alvo de qualquer outro híbrido de DNA:RNA; e b) colocar em contato os híbridos de DNA:RNA com uma ribonuclease que degrada o RNA a partir dos híbridos de DNA:RNA, degradando assim as moléculas de RNA não alvo na amostra de ácido nucleico para formar uma mistura degradada.
2. Método, de acordo com a reivindicação 1, caracterizado por compreender: c) opcionalmente degradar quaisquer sondas de DNA remanescentes pelo contato da mistura degradada com uma enzima de digestão de DNA, opcionalmente em que a enzima de digestão de DNA é DNase I, para formar uma mistura degradada de DNA; e d) separar o RNA degradado da mistura degradada ou da mistura degradada de DNA.
3. Método, de acordo com a reivindicação 1 ou com a reivindicação 2, caracterizado por o contato com o conjunto de sonda compreender o tratamento da amostra de ácido nucleico com um desestabilizador.
4. Método, de acordo com a reivindicação 3, caracterizado por o desestabilizador ser calor ou um produto químico desestabilizador de ácido nucleico, opcionalmente em que o produto químico desestabilizador de ácido nucleico é betaína, DMSO, formamida, glicerol ou um derivado dos mesmos ou uma mistura dos mesmos.
5. Método, de acordo com a reivindicação 4, caracterizado por o produto químico desestabilizador de ácido nucleico ser formamida, opcionalmente em que a formamida está presente durante o contato com o conjunto de sonda em uma concentração de cerca de 10 a 45% em volume.
6. Método, de acordo com a reivindicação 4, caracterizado por o tratamento da amostra com calor compreender a aplicação de calor acima da temperatura de fusão do ao menos um híbrido de DNA:RNA.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado por a ribonuclease ser RNase H ou Hybridase.
8. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por a amostra de ácido nucleico ser de um humano ou de um primata não humano.
9. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por a amostra de ácido nucleico ser de um rato ou um camundongo.
10. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado por a amostra de ácido nucleico compreender ácidos nucleicos de origem não humana.
11. Método, de acordo com a reivindicação 10, caracterizado por os ácidos nucleicos de origem não humana serem de eucariotas não humanos, bactérias, vírus, plantas, solo ou uma mistura dos mesmos.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado por o RNA não alvo ser rRNA, mRNA, tRNA ou uma mistura dos mesmos.
13. Método, de acordo com a reivindicação 12, caracterizado por o RNA não alvo ser rRNA e mRNA de globina.
14. Método, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a ao menos uma molécula de RNA não alvo selecionada entre 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBB-B1, HBB- B2, HBG1 e HBG2.
15. Método, de acordo com a reivindicação 14, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a duas ou mais moléculas de RNA não alvo selecionadas entre 28S, 18S, 5.8S, 5S, 16S e 12S de humanos.
16. Método, de acordo com qualquer uma das reivindicações 1 a 15, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo selecionadas entre HBA-A1, HBA-A2, HBB, HBG1 e HBG2 de hemoglobina, e 23S, 16S e 5S de bactérias Gram-positivas ou Gram-negativas.
17. Método, de acordo com qualquer uma das reivindicações 1 a 16, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo de uma espécie Archaea.
18. Método, de acordo com qualquer uma das reivindicações 1 a 17, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo de rato e/ou camundongo, opcionalmente selecionadas de 16S de rato, 28S de rato, 16S de camundongo e 28S de camundongo e combinações dos mesmos.
19. Método, de acordo com qualquer uma das reivindicações 1 a 18, caracterizado por as sondas para uma molécula de RNA não alvo em particular serem complementares a cerca de 80 a 85% da sequência da molécula de RNA não alvo, com lacunas de ao menos 5 ou ao menos 10 bases entre cada sítio de hibridização de sonda.
20. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado por as sondas de DNA compreenderem: (a) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 333 sequências selecionadas das SEQ ID NOs: 1 a 333; ou
(b) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 400 ou mais, ou 428 sequências selecionadas das SEQ ID NOs: 1 a 428; ou (c) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 377 sequências selecionadas das SEQ ID NOs: 1 a 377; ou (d) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 384 sequências selecionadas das SEQ ID NOs: 1 a 333 e das SEQ ID NOs: 378 a 428; ou (e) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 44 sequências selecionadas das SEQ ID NOs: 334 a 377; ou (f) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 51 sequências selecionadas das SEQ ID NOs: 378 a 428; ou uma combinação das mesmas.
21. Composição caracterizada por compreender um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas com ao menos 5 ou ao menos 10 bases de espaçamento ao longo de todo o comprimento de ao menos uma molécula de RNA não alvo em uma amostra de ácido nucleico e uma ribonuclease capaz de degradar o RNA em um híbrido de DNA:RNA.
22. Composição, conforme definido na reivindicação 19, caracterizada por a ribonuclease ser RNase H.
23. Composição, de acordo com a reivindicação 21 ou com a reivindicação 22, caracterizada por cada sonda de DNA ser hibridizada com ao menos 10 bases de espaçamento ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo de qualquer outra sonda de DNA no conjunto de sonda.
24. Composição, de acordo com qualquer uma das reivindicações 21 a 23, em que a composição é caracterizada por compreender um produto químico desestabilizador.
25. Composição, de acordo com a reivindicação 24, caracterizada por o produto químico desestabilizador ser formamida.
26. Composição, de acordo com qualquer uma das reivindicações 21 a 25, caracterizada por o RNA não alvo ser rRNA, mRNA, tRNA, ou uma mistura dos mesmos.
27. Composição, de acordo com a reivindicação 26, caracterizada por o RNA não alvo ser rRNA e mRNA de globina.
28. Composição, de acordo com qualquer uma das reivindicações 21 a 27, caracterizada por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a ao menos uma molécula de RNA não alvo selecionada entre 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBG1 e HBG2.
29. Composição, de acordo com a reivindicação 28, caracterizada por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a duas ou mais moléculas de RNA não alvo selecionadas entre 28S, 18S, 5.8S, 5S, 16S e 12S de humanos.
30. Composição, de acordo com qualquer uma das reivindicações 21 a 29, caracterizada por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo selecionadas entre HBA-A1, HBA-A2, HBB, HBG1 e HBG2 de hemoglobina, e 23S, 16S e 5S de bactérias Gram-positivas ou Gram-negativas.
31. Composição, de acordo com qualquer uma das reivindicações 21 a 30, caracterizada por o conjunto de sonda compreender ao menos duas sondas de DNA complementares a uma ou mais moléculas de rRNA de uma espécie Archaea.
32. Composição, de acordo com a reivindicação 21 a 31, caracterizada por o conjunto de sonda compreender sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo de rato e/ou camundongo, opcionalmente selecionadas de 16S de rato, 28S de rato, 16S de camundongo e 28S de camundongo e combinações dos mesmos.
33. Composição, de acordo com qualquer uma das reivindicações 21 a 32, caracterizada por as sondas de DNA compreenderem: (a) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 333 sequências selecionadas das SEQ ID NOs: 1 a 333; ou (b) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 400 ou mais, ou 428 sequências selecionadas das SEQ ID NOs: 1 a 428; ou (c) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 377 sequências selecionadas das SEQ ID NOs: 1 a 377; ou (d) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 384 sequências selecionadas das SEQ ID NOs: 1 a 333 e das SEQ ID NOs: 378 a 428; ou (e) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 44 sequências selecionadas das SEQ ID NOs: 334 a 377; ou (f) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 51 sequências selecionadas das SEQ ID NOs: 378 a 428; ou uma combinação das mesmas.
34. Kit caracterizado por compreender um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas com ao menos 5 ou ao menos 10 bases de espaçamento ao longo de todo o comprimento de ao menos uma molécula de RNA não alvo em uma amostra de ácido nucleico e uma ribonuclease capaz de degradar o RNA em um híbrido de DNA:RNA.
35. Kit, de acordo com a reivindicação 34, caracterizado por compreender um tampão e meio de purificação de ácido nucleico e, opcionalmente, compreender um produto químico desestabilizador.
36. Kit, de acordo com qualquer uma das reivindicações 34 a 35, caracterizado por o RNA não alvo ser rRNA, mRNA, tRNA, ou uma mistura dos mesmos.
37. Kit, de acordo com a reivindicação 36, caracterizado por o RNA não alvo ser rRNA e mRNA de globina.
38. Kit, de acordo com qualquer uma das reivindicações 34 a 37, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a ao menos uma molécula de RNA não alvo selecionada entre 28S, 23S, 18S, 5.8S, 5S, 16S, 12S, HBA-A1, HBA-A2, HBB, HBG1 e HBG2.
39. Kit, de acordo com a reivindicação 38, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a duas ou mais moléculas de RNA não alvo selecionadas entre 28S, 18S, 5.8S, 5S, 16S e 12S de humanos.
40. Kit, de acordo com qualquer uma das reivindicações 34 a 39, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo selecionadas entre HBA-A1, HBA-A2, HBB, HBG1 e HBG2 de hemoglobina, e 23S, 16S e 5S de bactérias Gram-positivas ou Gram-negativas.
41. Kit, de acordo com qualquer uma das reivindicações 34 a 40, caracterizado por o conjunto de sonda compreender ao menos duas sondas de DNA complementares a uma ou mais moléculas de rRNA de uma espécie Archaea.
42. Kit, de acordo com a reivindicação 34 a 41, caracterizado por o conjunto de sonda compreender sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo de rato e/ou camundongo, opcionalmente selecionadas de 16S de rato, 28S de rato, 16S de camundongo e 28S de camundongo e combinações dos mesmos.
43. Kit, de acordo com qualquer uma das reivindicações 34 a 42, caracterizado por as sondas de DNA compreenderem: (a) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 333 sequências selecionadas das SEQ ID NOs: 1 a 333; ou (b) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 400 ou mais, ou 428 sequências selecionadas das SEQ ID NOs: 1 a 428; ou (c) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 377 sequências selecionadas das SEQ ID NOs: 1 a 377; ou (d) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 100 ou mais, ou 150 ou mais, ou 200 ou mais, ou 250 ou mais, ou 300 ou mais, ou 350 ou mais, ou 384 sequências selecionadas das SEQ ID NOs: 1 a 333 e das SEQ ID NOs: 378 a 428; ou (e) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 44 sequências selecionadas das SEQ ID NOs: 334 a 377; ou (f) duas ou mais, ou cinco ou mais, ou 10 ou mais, ou 25 ou mais, ou 50 ou mais, ou 51 sequências selecionadas das SEQ ID NOs: 378 a 428; ou uma combinação das mesmas.
44. Kit, de acordo com a reivindicação 34, caracterizado por compreender: (1) um conjunto de sonda que compreende as SEQ ID NOs: 1 a 333; (2) uma ribonuclease, opcionalmente em que a ribonuclease é RNase H; (3) uma DNase; e (4) microesferas de purificação de RNA; e, opcionalmente, compreende adicionalmente um tampão de depleção de RNA, um tampão de depleção de sonda e um tampão de remoção de sonda.
45. Método de suplementação de um conjunto de sonda para uso na depleção de moléculas de ácido nucleico de RNA não alvo a partir de uma amostra de ácido nucleico, caracterizado por compreender: a) colocar em contato uma amostra de ácido nucleico que compreende ao menos uma sequência alvo de RNA ou DNA e ao menos uma molécula de RNA não alvo de uma primeira espécie com um conjunto de sonda que compreende ao menos duas sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo de uma segunda espécie, hibridizando assim as sondas de DNA às moléculas de RNA não alvo para formar híbridos de DNA:RNA, em que cada híbrido de DNA:RNA está com ao menos 5 bases de espaçamento ou ao menos 10 bases de espaçamento ao longo de uma determinada sequência de moléculas de RNA não alvo de qualquer outro híbrido de DNA:RNA; b) colocar em contato os híbridos de DNA:RNA com uma ribonuclease que degrada o RNA a partir dos híbridos de DNA:RNA, degradando assim as moléculas de RNA não alvo na amostra de ácido nucleico para formar uma mistura degradada; c) separar o RNA degradado da mistura degradada; d) sequenciar o restante do RNA da amostra; e) avaliar as demais sequências de RNA quanto à presença de moléculas de RNA não alvo da primeira espécie, determinando assim regiões de sequência de lacuna; e f) suplementar o conjunto de sonda com sondas de DNA adicionais complementares a sequências não contíguas em uma ou mais das regiões de sequência de lacuna.
46. Método, de acordo com a reivindicação 45, caracterizado por as regiões de sequência de lacuna compreenderem 50 ou mais pares de base.
47. Método, de acordo com a reivindicação 45 ou com a reivindicação 46, caracterizado por a primeira espécie ser uma espécie não humana e por a segunda espécie ser humana.
48. Método, de acordo com a reivindicação 47, caracterizado por a primeira espécie ser rato ou camundongo.
49. Método, de acordo com a reivindicação 47 ou com a reivindicação 48, caracterizado por a composição, conforme definido em qualquer uma das reivindicações 21 a 33, ser utilizada para fornecer a ribonuclease e o conjunto de sonda que compreende sondas de DNA complementares a sequências não contíguas ao longo de todo o comprimento da ao menos uma molécula de RNA não alvo de um humano.
50. Método, de acordo com a reivindicação 48 ou com a reivindicação 49, caracterizado por o método ser utilizado para identificar sondas de DNA que se hibridizam a uma ou mais moléculas de RNA não alvo de rato e/ou camundongo, opcionalmente selecionadas de 16S de rato, 28S de rato, 16S de camundongo e 28S de camundongo e combinações dos mesmos.
BR112021006044-8A 2018-12-21 2019-12-19 depleção de rna baseada em nuclease BR112021006044A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862783869P 2018-12-21 2018-12-21
US62/783,869 2018-12-21
US201962847797P 2019-05-14 2019-05-14
US62/847,797 2019-05-14
PCT/US2019/067582 WO2020132304A1 (en) 2018-12-21 2019-12-19 Nuclease-based rna depletion

Publications (1)

Publication Number Publication Date
BR112021006044A2 true BR112021006044A2 (pt) 2021-06-29

Family

ID=69173481

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021006044-8A BR112021006044A2 (pt) 2018-12-21 2019-12-19 depleção de rna baseada em nuclease

Country Status (12)

Country Link
US (2) US11421216B2 (pt)
EP (1) EP3899029A1 (pt)
JP (1) JP2022512058A (pt)
KR (1) KR20210107618A (pt)
CN (1) CN113166797B (pt)
AU (1) AU2019405940A1 (pt)
BR (1) BR112021006044A2 (pt)
CA (1) CA3114754A1 (pt)
IL (1) IL281834A (pt)
MX (1) MX2021003712A (pt)
SG (1) SG11202102710SA (pt)
WO (1) WO2020132304A1 (pt)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
WO2020123320A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Imaging system hardware
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
US20210193263A1 (en) * 2019-12-19 2021-06-24 Illumina, Inc. Designing probes for depleting abundant transcripts
DK3891300T3 (da) 2019-12-23 2023-05-22 10X Genomics Inc Fremgangsmåder til rumlig analyse ved anvendelse af rna-template-ligering
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
WO2021216708A1 (en) 2020-04-22 2021-10-28 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
WO2021252591A1 (en) 2020-06-10 2021-12-16 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
AU2021294334A1 (en) 2020-06-25 2023-02-02 10X Genomics, Inc. Spatial analysis of DNA methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
AU2021409136A1 (en) 2020-12-21 2023-06-29 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
IL307172A (en) 2021-03-30 2023-11-01 Illumina Inc Improved methods of isothermal complementary DNA and library preparation
JP2024510599A (ja) 2021-08-13 2024-03-08 エルジー・ケム・リミテッド 高分子複合体およびそれを含む成形品
EP4196605A1 (en) 2021-09-01 2023-06-21 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
WO2023056328A2 (en) 2021-09-30 2023-04-06 Illumina, Inc. Solid supports and methods for depleting and/or enriching library fragments prepared from biosamples
WO2024077202A2 (en) 2022-10-06 2024-04-11 Illumina, Inc. Probes for improving environmental sample surveillance
WO2024077152A1 (en) 2022-10-06 2024-04-11 Illumina, Inc. Probes for depleting abundant small noncoding rna
WO2024077162A2 (en) 2022-10-06 2024-04-11 Illumina, Inc. Probes for improving coronavirus sample surveillance

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
AU7268691A (en) * 1990-03-07 1991-09-12 Molecular Diagnostics, Inc. Ribonuclease scission chain reaction
AU738261B2 (en) * 1990-12-31 2001-09-13 Promega Corporation Nucleic acid amplification with DNA-dependent RNA polymerase activity of RNA replicases
AU5298393A (en) * 1992-10-08 1994-05-09 Regents Of The University Of California, The Pcr assays to determine the presence and concentration of a target
US5871902A (en) * 1994-12-09 1999-02-16 The Gene Pool, Inc. Sequence-specific detection of nucleic acid hybrids using a DNA-binding molecule or assembly capable of discriminating perfect hybrids from non-perfect hybrids
US20040152084A1 (en) * 2003-01-31 2004-08-05 Slattum Paul M. Compounds and processes for single-pot attachment of a label to nucleic acid
US6962906B2 (en) * 2000-03-14 2005-11-08 Active Motif Oligonucleotide analogues, methods of synthesis and methods of use
US6824980B2 (en) * 2000-06-08 2004-11-30 Xiao Bing Wang Isometric primer extension method and kit for detection and quantification of specific nucleic acid
EP1387894A4 (en) * 2000-08-24 2006-10-11 Aviva Biosciences Corp METHODS AND COMPOSITIONS FOR IDENTIFYING NUCLEIC ACID MOLECULES USING NUCLEOLYTIC ACTIVITIES AND HYBRIDIZATION
US6900013B1 (en) * 2000-08-25 2005-05-31 Aviva Biosciences Corporation Methods and compositions for identifying nucleic acid molecules using nucleolytic activities and hybridization
JP2002360256A (ja) * 2001-06-04 2002-12-17 Inst Of Physical & Chemical Res Rnaプローブ作成方法、標的核酸の検出方法及びrnaプローブ作成用キット
US20050003369A1 (en) 2002-10-10 2005-01-06 Affymetrix, Inc. Method for depleting specific nucleic acids from a mixture
CN101103122A (zh) * 2004-12-11 2008-01-09 西托吉尼克斯公司 高质量核酸的无细胞生物合成及其用途
US20080102454A1 (en) 2006-10-31 2008-05-01 Hui Wang Reducing size of analytes in RNA sample
CN202830041U (zh) * 2009-04-03 2013-03-27 Illumina公司 用于加热生物样本的设备
ES2573277T3 (es) 2009-08-14 2016-06-07 Epicentre Technologies Corporation Métodos, composiciones y kits de generación de muestras empobrecidas en ARNr o de aislamiento del ARNr de las muestras
US9005891B2 (en) * 2009-11-10 2015-04-14 Genomic Health, Inc. Methods for depleting RNA from nucleic acid samples
CN101935697B (zh) * 2010-04-16 2015-11-25 中生方政生物技术有限公司 用于核酸序列检测的方法和试剂盒
GB201101621D0 (en) * 2011-01-31 2011-03-16 Olink Ab Method and product
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
CN104093854A (zh) * 2011-12-02 2014-10-08 凯杰有限公司 表征组合物中的rna的方法和试剂盒
GB201201547D0 (en) * 2012-01-30 2012-03-14 Olink Ab Method and product
US9428794B2 (en) * 2012-09-13 2016-08-30 Takara Bio Usa, Inc. Methods of depleting a target nucleic acid in a sample and kits for practicing the same
CN104685071A (zh) * 2012-09-18 2015-06-03 凯杰有限公司 制备靶rna消除组合物的方法和试剂盒
US20160040218A1 (en) * 2013-03-14 2016-02-11 The Broad Institute, Inc. Selective Purification of RNA and RNA-Bound Molecular Complexes
WO2014152397A2 (en) * 2013-03-14 2014-09-25 The Broad Institute, Inc. Selective purification of rna and rna-bound molecular complexes
PL3431614T3 (pl) 2013-07-01 2022-03-07 Illumina, Inc. Funkcjonalizacja powierzchni i szczepienie polimeru bez użycia katalizatora
JP6366719B2 (ja) * 2013-12-20 2018-08-01 イルミナ インコーポレイテッド 断片化したゲノムdna試料におけるゲノム連結性情報の保存
US20170044525A1 (en) * 2014-04-29 2017-02-16 Illumina, Inc. Multiplexed single cell gene expression analysis using template switch and tagmentation
RU2558292C1 (ru) 2014-09-17 2015-07-27 Федеральное государственное бюджетное учреждение науки Институт химической биологии и фундаментальной медицины Сибирского отделения Российской академии наук (ИХБФМ СО РАН) Способ выделения коротких рнк из биологических жидкостей
AU2015330844B2 (en) * 2014-10-08 2022-02-03 Cornell University Method for identification and quantification of nucleic acid expression, splice variant, translocation, copy number, or methylation changes
SG10201912283RA (en) 2015-08-28 2020-02-27 Illumina Inc Nucleic acid sequence analysis from single cells
US9666263B2 (en) 2015-10-07 2017-05-30 Samsung Electronics Co., Ltd. DIMM SSD SoC DRAM byte lane skewing
KR20200103895A (ko) * 2015-11-10 2020-09-02 일루미나, 인코포레이티드 관성 소적 생성 및 입자 캡슐화
WO2017140659A1 (en) 2016-02-15 2017-08-24 F. Hoffmann-La Roche Ag System and method for targeted depletion of nucleic acids
US10400274B2 (en) * 2016-06-18 2019-09-03 Jan Biotech, Inc. Fluorogenic probes and their use in quantitative detection of target RNA sequences
CN106399533B (zh) * 2016-10-18 2019-11-12 承启医学(深圳)科技有限公司 一种去除总RNA样品中核糖体核酸rRNA的方法和组合物
CN107119043B (zh) * 2017-04-28 2020-04-10 北京全式金生物技术有限公司 一种去除rna样本中非目标rna的方法

Also Published As

Publication number Publication date
IL281834A (en) 2021-05-31
KR20210107618A (ko) 2021-09-01
JP2022512058A (ja) 2022-02-02
EP3899029A1 (en) 2021-10-27
MX2021003712A (es) 2021-07-16
US20220403370A1 (en) 2022-12-22
CA3114754A1 (en) 2020-06-25
US11976271B2 (en) 2024-05-07
SG11202102710SA (en) 2021-04-29
AU2019405940A1 (en) 2021-04-15
CN113166797B (zh) 2024-04-12
CN113166797A (zh) 2021-07-23
WO2020132304A1 (en) 2020-06-25
US20200199572A1 (en) 2020-06-25
US11421216B2 (en) 2022-08-23

Similar Documents

Publication Publication Date Title
US11976271B2 (en) Nuclease-based RNA depletion
CN108368542B (zh) 用于基因组组装、单元型定相以及独立于靶标的核酸检测的方法
AU2014212152B2 (en) Methods for genome assembly and haplotype phasing
EP2513341B1 (en) Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
Lee et al. Analyzing the cancer methylome through targeted bisulfite sequencing
US20210147935A1 (en) Methods and probes for identifying gene alleles
AU2014362322B2 (en) Methods for labeling DNA fragments to recontruct physical linkage and phase
AU2015296029A1 (en) Tagging nucleic acids for sequence assembly
JP2021176302A (ja) 腫瘍のディープシークエンシングプロファイリング
CN114341638A (zh) 用于邻近连接的方法和组合物
CN113166809A (zh) 一种dna甲基化检测的方法、试剂盒、装置和应用
CN112430675B (zh) 利用snp标记kz288474.1_322717鉴别蜂群抗囊状幼虫病性状的方法
WO2020237238A1 (en) Methods for detection of rare dna sequences in fecal samples
RU2787079C1 (ru) Деплеция рнк на основе нуклеазы
Chen et al. Capture hybridization of long-range DNA fragments for high-throughput sequencing
Plongthongkum Probing Interaction of Genome and Methylome by Targeted Bisulfite Sequencing
Langan The molecular charaterisation of the tylosis with oesophageal cancer (TOC) minimal region sequence