BRPI0808704A2 - Culturas com resistência ao fago melhorada - Google Patents

Culturas com resistência ao fago melhorada Download PDF

Info

Publication number
BRPI0808704A2
BRPI0808704A2 BRPI0808704-0A BRPI0808704A BRPI0808704A2 BR PI0808704 A2 BRPI0808704 A2 BR PI0808704A2 BR PI0808704 A BRPI0808704 A BR PI0808704A BR PI0808704 A2 BRPI0808704 A2 BR PI0808704A2
Authority
BR
Brazil
Prior art keywords
crispr
approximately
seq
bacteriophage
ocux
Prior art date
Application number
BRPI0808704-0A
Other languages
English (en)
Inventor
Rodolphe Barrangou
Christophe Fremaux
Philippe Horvath
Dennis Romero
Patrick Boyaval
Original Assignee
Danisco A/S
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco A/S filed Critical Danisco A/S
Publication of BRPI0808704A2 publication Critical patent/BRPI0808704A2/pt
Publication of BRPI0808704B1 publication Critical patent/BRPI0808704B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/746Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for lactic acid bacteria (Streptococcus; Lactococcus; Lactobacillus; Pediococcus; Enterococcus; Leuconostoc; Propionibacterium; Bifidobacterium; Sporolactobacillus)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23CDAIRY PRODUCTS, e.g. MILK, BUTTER OR CHEESE; MILK OR CHEESE SUBSTITUTES; MAKING THEREOF
    • A23C9/00Milk preparations; Milk powder or milk powder preparations
    • A23C9/12Fermented milk preparations; Treatment using microorganisms or enzymes
    • A23C9/123Fermented milk preparations; Treatment using microorganisms or enzymes using only microorganisms of the genus lactobacteriaceae; Yoghurt
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23CDAIRY PRODUCTS, e.g. MILK, BUTTER OR CHEESE; MILK OR CHEESE SUBSTITUTES; MAKING THEREOF
    • A23C9/00Milk preparations; Milk powder or milk powder preparations
    • A23C9/12Fermented milk preparations; Treatment using microorganisms or enzymes
    • A23C9/123Fermented milk preparations; Treatment using microorganisms or enzymes using only microorganisms of the genus lactobacteriaceae; Yoghurt
    • A23C9/1238Fermented milk preparations; Treatment using microorganisms or enzymes using only microorganisms of the genus lactobacteriaceae; Yoghurt using specific L. bulgaricus or S. thermophilus microorganisms; using entrapped or encapsulated yoghurt bacteria; Physical or chemical treatment of L. bulgaricus or S. thermophilus cultures; Fermentation only with L. bulgaricus or only with S. thermophilus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23CDAIRY PRODUCTS, e.g. MILK, BUTTER OR CHEESE; MILK OR CHEESE SUBSTITUTES; MAKING THEREOF
    • A23C2220/00Biochemical treatment
    • A23C2220/20Treatment with microorganisms
    • A23C2220/202Genetic engineering of microorganisms used in dairy technology
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2400/00Lactic or propionic acid bacteria
    • A23V2400/21Streptococcus, lactococcus
    • A23V2400/249Thermophilus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Fodder In General (AREA)
  • Food Preservation Except Freezing, Refrigeration, And Drying (AREA)

Abstract

"culturas com resistência ao fago melhorado". a presente invenção refere-se a métodos e composições relacionadas à modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. em algumas modalidades, a presente invenção fornece composições e métodos para o uso de um ou mais genes ou proteínas cas para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. em algumas modalidades , a presente invenção fornece métodos e composições que encontram uso no desenvolvimento e uso de combinações de cepa e rotações de cultura iniciadora. em modalidades adicionais, a presente invenção fornece métodos para marcação e/ou identificação de bactérias. em algumas modalidades preferenciais, a presente invenção fornece métodos para uso de loci de crispr para determinar a potencial virulência de um fago contra uma célula e o uso de crispr-cas para modular a sequência genética de um fago de nível de virulência aumentada. ainda em modalidades adicionais, a presente invenção fornece meios e composições para o desenvolvimento e uso de fagos como agentes de biocontrole.

Description

Relatório Descritivo da Patente de Invenção para "CULTURAS COM RESISTÊNCIA AO FAGO MELHORADA",
CAMPO DA INVENÇÃO À A presente invenção refere-se a métodos e composições rela- cionadasà modulação de resistência de uma célula contra um ácido nuclei- Co-alvo ou um produto de transcrição do mesmo. Em algumas modalidades preferenciais, a presente invenção fornece composições e métodos para o Uso de um ou mais genes ou proteínas cas para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição domesmo. Em algumas modalidades, a presente invenção fornece métodos e composições que encontram Uso no desenvolvimento e uso de combina- ções de cepas e rotações de culturas iniciadoras. Em modalidades adicio- nais, a presente invenção fornece métodos para marcação e/ou identificação de bactérias. Em algumas modalidades preferenciais, a presente invenção fornece métodos Para o uso dos /ocide CRISPR para determinar a virulência potencial de um fago contra uma célula e o uso de CRISPR-cas para modu- lar a sequência gênica de um fago de nível de virulência aumentado. Ainda em modalidades adicionais, a presente invenção fornece meios e composi- ções para o desenvolvimento e uso de fagos como agentes de biocontrole. "ANTECEDENTES DA INVENÇÃO À Culturas, e culturas iniciadoras, em particular, são usadas exten- sivamente na indústria alimentícia na produção de produtos fermentados incluindo produtos lácteos (por exemplo, iogurte, leitelho e queijo), embuti- dos, produtos de padaria, vinho e produtos vegetais. A preparação de cultu- E 25 ras é trabalho intensivo, ocupando muito espaço e equipamento, e há um risco considerável de contaminação com bactérias e/ou fagos deteriorantes bu i | durante as etapas de propagação. A falha de culturas bacterianas devido à - infecção e multiplicação de bacteriófago (fago) é um grande problema no uso industrial de culturas bacterianas. Há muitos tipos diferentes de fagos e novas cepas continuam a emergir. Além disso, há uma necessidade de mé- todos e composições para rastrear bactérias usadas em tais culturas. De fato, apesar de avanços no desenvolvimento de culturas, há uma necessida-
de contínua de melhorar culturas para uso na indústria.
SUMÁRIO DA INVENÇÃO . A presente invenção fornece métodos e composições relaciona- das à modulação da resistência de uma célula contra um ácido nucleico-alvo ouum produto de transcrição do mesmo. Em algumas modalidades prefe- renciais, a presente invenção fornece composições e métodos para o uso de um ou mais genes ou proteínas cas para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mes- mo. Em algumas modalidades, a presente invenção fornece métodos e composições que encontram uso no desenvolvimento e uso de combinações de cepas e rotações de culturas iniciadoras. Em modalidades adicionais, a presente invenção fornece métodos para marcação e/ou identificação de bactérias. Em algumas modalidades preferenciais, a presente invenção for- nece métodos para o uso de /oci de CRISPR para determinar a virulência potencial de um fago contra uma célula e o uso de CRISPR-cas para modu- lar a sequência genética de um fago de nível de virulência aumentado. Ainda em modalidades adicionais, a presente invenção fornece meios e composi- ções para o desenvolvimento e uso de fagos como agentes de biocontrole. A presente invenção fornece métodos para geração de pelo me- nosuma cepa variante resistente a bacteriófago, compreendendo as etapas Í de: (a) exposição de uma cepa bacteriana parental compreendendo pelo menos uma porção de um locux de CRISPR a pelo menos uma sequência de ácido nucleico para produzir uma mistura de bactérias compreendendo pelo menos uma cepa variante resistente a bacteriófago compreendendo um . 25 locuxde CRISPR modificado; (b) seleção de uma cepa variante resistente a bacteriófago a partir da mistura de bactérias; (c) seleção de cepas variantes - i resistentes a bacteriófago compreendendo um fragmento de ácido nucleico - adicional no locux de CRISPR modificado a partir das cepas resistentes a bacteriófago selecionadas na etapa (b); e (d) isolamento de pelo menos uma cepa variante resistente a bacteriófago, em que a cepa compreende um fragmento de ácido nucleico adicional no locux de CRISPR modificado. Em algumas modalidades preferenciais, os métodos compreendem ainda a eta-
. pa de comparação do locux de CRISPR ou uma porção do mesmo da cepa fr bacteriana parental e o locux de CRISPR modificado da cepa variante resis- : tente a bacteriófago para identificar cepas variantes resistentes a bacteriófa- i go compreendendo pelo menos um fragmento de ácido nucleico adicional no 85 —locuxde CRISPR modificado que está ausente do locux de CRISPR da cepa bacteriana parental.
Em algumas modalidades particularmente preferenciais, os métodos compreendem ainda a etapa de seleção de cepas variantes re- sistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no locux de CRISPR modificado.
Em algumas modalidades, a cepa bacteriana parental é exposta a duas ou mais sequências de ácidos nuclei- cos.
Em algumas modalidades preferenciais, a cepa bacteriana parental é simultaneamente exposta a duas ou mais sequências de ácidos nucleicos, enquanto em algumas modalidades alternativas, a cepa bacteriana parental é sequencialmente exposta a duas ou mais sequências de ácidos nucleicos.
Em algumas modalidades particularmente preferenciais, a cepa bacteriana parental é exposta à sequência de ácido nucleico através da infecção por pelo menos um bacteriófago compreendendo a sequência de ácido nucleico.
Em algumas modalidades adicionais preferenciais, pelo menos um bacterió- fago é selecionado a partir do grupo de famílias de vírus compostas de: Cor- ticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae.
Em algumas modalidades preferen- ciais adicionais, pelo menos um bacteriófago é um bacteriófago que ocorre naturalmente, enquanto em outras modalidades preferenciais, pelo menos um bacteriófago é um bacteriófago transformado obtido através de pressão " 25 seletiva usando uma cepa bacteriana resistente a bacteriófago.
Ainda em modalidades adicionais preferenciais, a cepa bacteriana parental é exposta . y ao ácido nucleico através de um mecanismo natural de absorção de ácido " nucleico.
Em algumas modalidades, o mecanismo natural de absorção de ácido nucleico compreende competência natural.
Em algumas modalidades — adicionais, o mecanismo natural de absorção de ácido nucleico da cepa bac- teriana por conjugação ou transformação.
Ainda em outras modalidades, a cepa resistente a bacteriófago é um mutante insensível a bacteriófago.
Ainda e em modalidades adicionais, a cepa bacteriana parental é um mutante insen- : Sível a bacteriófago.
Em algumas modalidades adicionais, a extremidade 5' : e/ou a extremidade 3' do locux de CRISPR da cepa bacteriana parental é À comparada ao locux de CRISPR modificado da cepa variante resistente a —bacteriófago.
Ainda em algumas modalidades adicionais, as extremidades 5 e/ou 3' de pelo menos da primeira repetição de CRISPR ou pelo menos do primeiro CRISPR espaçadora do locux de CRISPR da cepa bacteriana pa- rental é comparado ao locux de CRISPR modificado da cepa variante resis- tente a bacteriófago.
Ainda em modalidades adicionais, a cepa variante re- j 10 —sistente a bacteriófago compreende pelo menos um fragmento de ácido nu- cleico adicional no /ocux de CRISPR modificado.
Em algumas modalidades adicionais, pelo menos uma porção do locux de CRISPR da cepa bacteriana parental e pelo menos uma porção do locux de CRISPR modificado da cepa variante resistente a bacteriófago são comparadas pela amplificação de pelo menos uma porção do /ocux de CRISPR e pelo menos uma porção do locux de CRISPR modificado, para produzir uma sequência do /ocux de CRISPR amplificada e uma sequência modificada amplificada do /locux de CRISPR.
Ainda em modalidades adicionais, a amplificação é conduzida usando a rea- ção em cadeia da polimerase.
Em algumas modalidades preferenciais, pelo . 20 menosuma porção do locux de CRISPR da cepa bacteriana parental e pelo $ menos uma porção do locux de CRISPR modificado da cepa variante resis- tente a bacteriófago são comparadas por sequenciamento de pelo menos uma porção do locux de CRISPR e pelo menos uma porção do locux de CRISPR modificado.
Em algumas modalidades particularmente preferenci- : 25 ais, os métodos compreendem ainda a etapa de sequenciamento da se- quência do /ocux de CRISPR amplificada e da sequência do locux de CRIS- ER PR modificada amplificada.
Em algumas modalidades adicionais, o fragmen- > to de ácido nucleico adicional no /ocux de CRISPR modificado é uma unida- de espaçadora de repetição adicional.
Em algumas modalidades preferenci- ais, a unidade espaçadora de repetição adicional compreende pelo menos aproximadamente 44 nucleotídeos.
Em algumas modalidades alternativas preferenciais, unidade espaçadora de repetição adicional está compreendida
- entre aproximadamente 44 e aproximadamente 119 nucleotídeos.
Entretan- - to, não se destina que a presente invenção seja limitada a estas faixas de : tamanho específicas, já que outros tamanhos encontram uso na presente invenção, como descrito neste pedido.
Em algumas modalidades, a unidade 5 espaçadora de repetição adicional compreende pelo menos uma sequência nucleotídica que tem identidade de pelo menos aproximadamente 95% a uma repetição de CRISPR no /ocux de CRISPR da cepa bacteriana parental.
Em algumas modalidades adicionais, a unidade espaçadora de repetição B adicional compreende pelo menos uma sequência nucleotídica que tem i- f 10 dentidade de pelo menos aproximadamente 95% a uma sequência nucleotí- dica no genoma de pelo menos um bacteriófago.
Em algumas modalidades particularmente preferenciais, a cepa bacteriana parental é uma cepa indus- trialmente útil.
Em algumas modalidades adicionais, a cepa bacteriana pa- rental é suscetível à infecção por pelo menos um bacteriófago.
Em algumas modalidades ainda preferenciais, a cepa bacteriana parental compreende uma cultura selecionada a partir de culturas iniciadoras, culturas probióticas e culturas de suplemento dietético.
Em algumas modalidades preferenciais, a cepa bacteriana parental compreende uma cepa obtida a partir de uma cultura.
Em algumas modalidades particularmente preferenciais, a cultura é uma cultura iniciadora, uma cultura probiótica e/ou uma cultura de suplemen- to dietético.
Ainda em modalidades adicionais, a cepa bacteriana parental é selecionada a partir de Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobac- ter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, i 25 — Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Franci- sella, Brucella, Campylobacter, Klebsiella, Frankia, Bartonella, Rickettsia, - Shewanella, Serratia, Enterobacter, Proteus, Providencia, Brochothrix, Bifi- " dobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus,
Pediococcus, Leuconostoc e Oenococcus.
A presente invenção também fornece pelo menos uma cepa va- riante resistente a bacteriófago obtida usando os métodos apresentados neste pedido.
Em algumas modalidades preferenciais, a presente invenção í fornece cepas variantes resistentes a bacteriófago, em que a cepa variante . resistente a bacteriófago é uma cepa industrialmente útil.
Em algumas mo- E dalidades preferenciais, a cepa variante resistente a bacteriófago compreen- de uma cepa industrialmente útil que é pelo menos um componente de uma cultura iniciadora, cultura probiótica, cultura de suplemento dietético e/ou outras culturas úteis.
A presente invenção também fornece composições compreen- dendo uma cepa variante resistente a bacteriófago produzida usando os mé- : todos apresentados neste pedido.
Em algumas modalidades, a presente in- Í 10 venção fornece composições compreendendo pelo menos duas cepas vari- antes resistentes a bacteriófago produzidas usando os métodos apresenta- dos neste pedido.
A presente invenção também fornece alimentos e/ou ra- ções compreendendo pelo menos uma destas composições.
A presente in- venção também fornece métodos para preparação de alimento e/ou ração compreendendo adição de pelo menos uma destas composições a alimento ou ração.
A presente invenção também fornece culturas iniciadoras, culturas probióticas, culturas de suplemento dietético e outras culturas úteis compre- endendo pelo menos uma destas composições.
A presente invenção tam- bém fornece métodos de fermentação compreendendo adição de pelo me- nos uma destas composições a uma cultura iniciadora.
Em algumas modali- dades, a presente invenção fornece métodos de fermentação compreenden- do adição de pelo menos uma destas composições a um meio de fermenta- ção, sob condições tais que a fermentação dos componentes do meio de fermentação ocorra.
Em algumas modalidades, a fermentação não é afetada ". 25 pela presença de bacteriófagos.
Em algumas modalidades, o meio de fer- mentação é um produto alimentício.
Em algumas modalidades preferenciais, Fo o produto alimentício é um produto lácteo.
Em algumas modalidades particu- - larmente preferenciais, o produto lácteo é leite.
Em algumas modalidades adicionais, pelo menos duas composições diferentes compreendendo duas ou mais cepas variantes resistentes a bacteriófago são sequencialmente expostas ao meio de fermentação.
A presente invenção também fornece métodos para redução da f população de bacteriófago prejudicial em um meio de fermentação compre- f endendo exposição de um meio de fermentação a pelo menos uma cepa : variante resistente a bacteriófago produzida usando os métodos apresenta- dos neste pedido, sob condições tais que a população de bacteriófago seja reduzida.
A presente invenção também fornece métodos para geração de pelo menos uma cepa variante resistente a bacteriófago, compreendendo as etapas de: (a) exposição de uma cepa bacteriana parental compreendendo pelo menos uma porção de um /ocux de CRISPR a pelo menos uma se- —quência de ácido nucleico para produzir uma mistura de bactérias compre- endendo pelo menos uma cepa variante resistente a bacteriófago compre- endendo um /ocux de CRISPR modificado; (b) seleção de uma cepa variante resistente a bacteriófago a partir da mistura de bactérias; (c) comparação do locux de CRISPR ou uma porção do mesmo da cepa bacteriana parental e o locuxde CRISPR modificado da cepa variante resistente a bacteriófago para identificar cepas variantes resistentes a bacteriófago compreendendo pelo menos um fragmento de ácido nucleico adicional no /ocux de CRISPR modi- ficado que está ausente no /ocux de CRISPR da cepa bacteriana parental; (d) seleção de linhagens variantes resistentes a bacteriófago compreenden- ; 20 doum fragmento de ácido nucleico adicional no locux de CRISPR modifica- b do; (e) análise de pelo menos um fragmento de ácido nucleico adicional no locux de CRISPR modificado para identificar pelo menos uma cepa variante resistente a bacteriófago; e (f) isolamento de pelo menos uma cepa variante resistente a bacteriófago. . 25 A presente invenção também fornece métodos para geração de mutantes de CRISPR para escape de fago compreendendo: (a) obtenção: - pelo menos um fago parental e uma cepa bacteriana resistente ao fago - compreendendo pelo menos um locux de CRISPR, em que o locux de CRISPR compreende uma sequência de ácido nucleico que é pelo menos aproximadamente 95% idêntica a pelo menos uma sequência protoespaça- dora no genoma de pelo menos um fago parental; (b) exposição de pelo me- nos um fago parental à cepa bacteriana resistente ao fago, sob condições tais que pelo menos uma variante de fago seja produzida; e (c) seleção de - pelo menos uma variante de fago, em que pelo menos uma variante de fago : exibe a capacidade de infectar a cepa bacteriana resistente ao fago e é um mutante de CRISPR para escape de fago.
Em algumas modalidades, a cepa — bacteriana resistente ao fago é uma linhagem variante resistente a bacterió- fago obtida usando os métodos apresentados neste pedido.
Em algumas modalidades, os métodos compreendem ainda a etapa de comparação de pelo menos uma porção de pelo menos uma sequência protoespaçadora e b um motivo de CRISPR posicionado próximo a pelo menos uma sequência —protoespaçadora no fago variante com pelo menos uma sequência protoes- paçadora e motivo de CRISPR do fago parental.
Ainda em modalidades adi- cionais, os métodos compreendem ainda a etapa de seleção de fagos vari- antes que infectam a cepa bacteriana resistente ao fago, em que os fagos variantes compreendem os mutantes de CRISPR para escape de fago, e em queaCRISPR para escape de fagos compreende pelo menos uma mutação em pelo menos uma sequência protoespaçadora e/ou no motivo dos mutan- tes de CRISPR para escape de fago.
Ainda em modalidades adicionais, os métodos são iterativamente repetidos uma ou mais vezes usando os mutan- tes de CRISPR para escape de fago e cepa bacteriana de CRISPR resisten- te ao fago diferente compreendendo pelo menos um locux de CRISPR, em Í que o locux de CRISPR compreende uma sequência de ácido nucleico que é pelo menos aproximadamente 95% idêntica a pelo menos uma sequência protoespaçadora no genoma dos mutantes de CRISPR para escape de fago.
Ainda em modalidades adicionais, pelo menos um bacteriófago é seleciona- E 25 doa partirdo grupo de famílias de vírus compostas de: Corticoviridae, Cys- toviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Si- ee phoviridae e Tectiviidae.
Em algumas modalidades preferenciais, a cepa -: bacteriana resistente ao fago é selecionada a partir de Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Enterococcus, Clostridium, Campylobacter, Corynebacterium, Mycobacteri- um, Treponema, Borrelia, Francisella, Brucella, Klebsiella, Frankia, Bartonel-
" la, Ricketisia, Shewanella, Serratia, Enterobacter, Proteus, Providencia, Bro- chothrix, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Pediococeus, Leuconostoc, Streptococcus e Oenococcus.
A presente invenção também fornece mutantes de CRISPR para — escape de fago obtidos usando os métodos apresentados neste pedido.
Em algumas modalidades, os mutantes de CRISPR para escape de fago com- preendem duas ou mais mutações presentes em pelo menos duas sequên- cias protoespaçadoras e/ou no motivo de CRISPR. : A presente invenção também fornece mutantes de CRISPR para : 10 escape de fago , em que o genoma dos mutantes de CRISPR para escape de fago é construído geneticamente para compreender mutações em pelo menos um protoespaçador e/ou no motivo de CRISPR.
Em algumas modali- dades, pelo menos um motivo de CRISPR é transformado nos mutantes de CRISPR para escape de fago, enquanto em algumas modalidades alternati- vas, pelo menos um motivo de CRISPR é deletado nos mutantes de CRIS- PR para escape de fago.
A presente invenção também fornece composições compreendendo pelo menos um mutante de CRISPR para escape de fago.
A presente invenção também fornece métodos para controle de populações bacterianas em um produto compreendendo exposição de com- posições compreendendo pelo menos um mutante de CRISPR para escape f de fago em um meio de fermentação, em que o meio de fermentação con- tém pelo menos uma população de bactérias indesejáveis, sob condições tais que a população das bactérias indesejáveis seja reduzida, e o meio de fermentação seja usado para gerar o produto.
Em algumas modalidades, o E 25 produto é selecionado a partir de alimentos, rações, cosméticos, produtos de cuidado pessoal, produtos de cuidado da saúde, produtos veterinários e su- HA plementos dietéticos.
Em algumas modalidades adicionais, os métodos são - repetidos pelo menos uma vez e as composições diferentes e/ou composi- ções compreendendo mutantes de CRISPR para escape de fago diferentes são usadas em rotação.
Em algumas modalidades, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas para mo-
. dulação da resistência em uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades adicionais, a presente invenção fornece composições e métodos para o uso de uma se- quência de ácido nucleico recombinante compreendendo pelo menos um gene case pelomenos duas repetições de CRISPR em conjunto com pelo menos uma CRISPR espaçadora, em que pelo menos uma CRISPR espa- çadora é heteróloga a pelo menos um gene cas e/ou pelo menos duas repe- tições de CRISPR para modular a resistência contra um ácido nucleico-alvo . ou produto de transcrição do mesmo. Ainda em modalidades adicionais, a presente invenção fornece pelo menos uma sequência de ácido nucleico compreendendo pelo menos um gene cas.
Ainda em modalidades adicionais, a presente invenção fornece pelo menos uma sequência de ácido nucleico compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR. Em algumas moda- lidades, a presente invenção fornece uma sequência de ácido nucleico com- preendendo pelo menos um gene cas e pelo menos uma CRISPR espaça- dora. Ainda em modalidades adicionais, a presente invenção fornece uma sequência de ácido nucleico compreendendo pelo menos um gene cas, pelo menos uma CRISPR espaçadora e pelo menos duas repetições de CRISPR.
Em modalidades adicionais, a presente invenção fornece uma sequência de ácido nucleico recombinante compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com pelo menos uma CRISPR espaçadora, em que a CRISPR espaçadora é heteróloga a pelo menos um gene cas e/ou a pelo menos duas repetições de CRISPR. - 25 A presente invenção também fornece construtos compreenden- do uma ou mais das sequências de ácidos nucleicos descritas neste pedido. E Ainda em modalidades adicionais, a presente invenção fornece vetores compreendendo uma ou mais das sequências de ácidos nucleicos ou um ou mais dos construtos descritos neste pedido. Ainda em modalidades adicio- nais, a presente invenção fornece células compreendendo a sequência de ácido nucleico ou o construto ou o vetor descrito neste pedido.
A presente invenção também fornece métodos para modulação
- (por exemplo, conferindo ou aumentando) da resistência de uma célula con- tra um ácido nucleico-alvo ou um produto de transcrição do mesmo compre- endendo as etapas de: (i) identificação de uma sequência (por exemplo, uma sequência conservada) em um organismo (em algumas modalidades, esta é uma sequência que é essencial para a função ou sobrevivência do organis- mo); (ii) preparação de uma CRISPR espaçadora que é homóloga à sequên- cia identificada; (ili) preparação de um ácido nucleico (por exemplo, um ácido nucleico recombinante) compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com a CRISPR espaçado- É 10 ra;e(iv)introdução do ácido nucleico em uma célula, portanto, para produzir a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mes- mo.
A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula con- tra um ácido nucleico-alvo ou um produto de transcrição do mesmo compre- endendo as etapas de: (i) identificação de uma ou mais CRISPR espaçado- ras ou pseudo CRISPR espaçadoras em um organismo resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; (ii) preparação de um ácido nucleico recombinante compreendendo pelo menos um gene ou prote- ínacase pelomenos duas repetições de CRISPR em conjunto com um ou mais espaçadores identificados; e (iii) introdução do ácido nucleico recombi- nante em uma célula, portanto, para produzir a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
A presente invenção também fornece métodos para modulação : 25 (por exemplo, conferindo ou aumentando) da resistência de uma célula compreendendo pelo menos um ou mais genes ou proteínas cas e duas ou sas mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de : transcrição do mesmo compreendendo as etapas de: (i) identificação de uma ou mais CRISPR espaçadoras em um organismo resistente ao ácido nuclei- —co-alvo ou produto de transcrição do mesmo; e (ii) modificação da sequência de uma ou mais CRISPR espaçadora(s) na célula tal que a CRISPR espa- çadora(s) tenha homologia a CRISPR espaçadora(s) no organismo.
" A presente invenção também fornece métodos para modulação (por exemplo, reduzindo ou diminuindo) da resistência de uma célula com- preendendo pelo menos um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) identificação de uma ou mais CRISPR espaçadoras em um organismo que é substancialmente resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo; e (ii) modificação da sequência de pelo menos uma ou mais CRISPR espaçado- ra(s) na célula tal que a CRISPR espaçadora(s) tenha um grau reduzido de : 10 homologia ao espaçador(es) no organismo.
A presente invenção também fornece métodos para modulação (por exemplo, reduzindo ou diminuindo) da resistência de uma célula com- preendendo pelo menos um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo modificação de um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR na célula.
A presente invenção também fornece métodos para identificação de uma CRISPR espaçadora ou pseudo CRISPR espaçadora para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: (i) pre- Í paração de uma célula compreendendo pelo menos duas repetições CRIS- PR e pelo menos um gene ou proteína cas; (ii) identificação de pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadoras em um organis- mo que é substancialmente resistente ao ácido nucleico-alvo ou produto de E 25 transcrição do mesmo; (iii) modificação da sequência da CRISPR espaçado- ra na célula, tal que a CRISPR espaçadora tenha homologia ao espaçador ea do organismo; e (iv) determinação se a célula modula a resistência contra o e ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modula- ção da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que a CRISPR espaçadora modula a re- sistência da célula.
A presente invenção também fornece métodos para identificação í de um gene cas para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos duas repetições de CRISPR; (ii) enge- —nhariada célula tal que compreenda pelo menos um gene cas; e (iii) deter- minação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que o gene cas pode ser usado para modular a resistência da cé- : 10 lula.
A presente invenção também fornece métodos para identificação de uma repetição de CRISPR para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelomenos uma CRISPR espaçadora e pelo menos um gene cas; (ii) enge- nharia da célula tal que contenha a repetição de CRISPR; e (iii) determina- ção se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula con- tra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa quearepetiçãode CRISPR pode ser usada para modular a resistência.
É A presente invenção também fornece métodos para identificação de uma combinação funcional de um gene cas e uma repetição de CRISPR compreendendo as etapas de: (a) determinação das sequências do gene cas e a repetição de CRISPR; (b) identificação de um ou mais grupos de 3 25 genes cas como determinado por análise de comparação de sequência; (c) identificação de um ou mais grupos de repetições de CRISPR; e (d) combi- e nação daqueles genes cas e sequências de repetição de CRISPR que estão E incluídos no mesmo grupo, em que a combinação do gene cas e sequências de repetição de CRISPR no mesmo grupo é indicativa que a combinação é uma combinação funcional.
A presente invenção também fornece métodos para modulação do lisotipo de uma célula bacteriana compreendendo um ou mais genes ou
. proteínas cas e duas ou mais repetições de CRISPR compreendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras na sequência genômica de um bacteriófago contra o qual a resistência deve ser modulada; e (ii) modificação da sequência de uma ou mais CRISPR espaça- —dorasda célula bacteriana tal que a CRISPR espaçadora(s) da célula bacte- riana tenha homologia ao pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula bac- teriana contra um bacteriófago compreendendo as etapas de: (i) identifica- ção de uma sequência (por exemplo, uma sequência conservada) em um bacteriófago (preferencialmente, uma sequência essencial para a função ou sobrevivência do bacteriófago); (ii) preparação de uma CRISPR espaçadora que é homóloga à sequência identificada; (iii) preparação de um ácido nucle- ico compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com a CRISPR espaçadora; e (iv) introdução do ácido nucleico na célula bacteriana, portanto, para produzir a célula bacteri- ana resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
A presente invenção também fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula bac- teriana contra um ácido nucleico-alvo ou produto de transcrição em um bac- teriófago da mesma compreendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras em um genoma de bacteriófago que é capaz de fornecer resistência no ácido nucleico-alvo ou produto de trans- À 25 criçãodo mesmo; (ii) preparação de um ácido nucleico recombinante com- preendendo pelo menos um gene cas e pelo menos duas repetições de asa CRISPR em conjunto com uma ou mais pseudo CRISPR espaçadoras iden- - tificadas; e (ii) introdução do ácido nucleico recombinante na célula bacteri- ana, portanto, para produzir a célula bacteriana resistente ao ácido nucleico- — alvo ou produto de transcrição do mesmo.
A presente invenção também fornece métodos para modulação da resistência de uma célula bacteriana compreendendo um ou mais genes
. ou proteínas cas e duas ou mais repetições de CRISPR contra um ácido nu- cleico-alvo ou produto de transcrição do mesmo em um bacteriófago com- preendendo as etapas de: (i) identificação de uma ou mais pseudo CRISPR espaçadoras em um bacteriófago que é capaz de fornecer resistência em um ácido nucleico-alvo ou produto de transcrição do mesmo; (ii) identificação de uma ou mais CRISPR espaçadoras em uma célula bacteriana na qual a resistência deve ser modulada; e (iii) modificação da sequência da CRISPR espaçadora(s) na célula bacteriana na qual a resistência deve ser modulada , tal que a CRISPR espaçadora(s) tenha um grau mais alto de homologia à pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
A presente invenção também fornece métodos para determina- ção da resistência de uma célula contra um ácido nucleico-alvo ou um pro- duto de transcrição do mesmo compreendendo identificação de uma ou mais combinações de repetição cas CRISPR funcionais e uma ou mais CRISPR espaçadoras na célula.
A presente invenção também fornece células usando obtidas ou obtidas usando o método(s) fornecido neste pedido. Em algumas modalida- des, a presente invenção fornece CRISPR espaçadoras ou pseudo CRISPR espaçadoras obtidas ou obteníveis pelo método(s) descrito neste pedido.
Em algumas modalidades, a presente invenção fornece genes cas obtidos ou obteníveis pelo método(s) descrito neste pedido. Em algumas modalidades adicionais, a presente invenção fornece repetições de CRISPR obtidas ou obteníveis pelo método(s) descrito neste pedido. Ainda em moda- " 25 lidades adicionais, a presente invenção fornece combinações funcionais ob- tidas ou obteníveis pelo método(s) descrito neste pedido. Ainda em modali- Sa dades adicionais, a presente invenção fornece loci de CRISPR recombinan- " tes compreendendo pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadora, e/ou pelo menos um gene cas, e/ou pelo menos uma repetição de CRISPR e/ou uma combinação funcional.
Em algumas modalidades, a presente invenção fornece métodos para o uso de células, pelo menos uma CRISPR espaçadora ou pseudo
CRISPR espaçadora, pelo menos um gene cas, pelo menos uma repetição de CRISPR, ou uma combinação funcional dos mesmos para modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
Em algumas modalidades adicionais, a presente invenção forne- ce culturas celulares compreendendo pelo menos uma célula, pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçadora, pelo menos um gene cas, pelo menos uma repetição de CRISPR ou uma combinação fun- cional para modulação da resistência de uma célula contra um ácido nuclei- ! 10 —co-alvo ou um produto de transcrição do mesmo. Ainda em modalidades a- dicionais, a presente invenção fornece produtos alimentícios e/ou ração compreendendo culturas fornecidas neste pedido. Em algumas modalidades adicionais, a presente invenção fornece processos para preparação de um produto alimentício e/ou ração compreendendo culturas fornecidas neste pedido. Ainda em modalidades adicionais, a presente invenção fornece pro- dutos alimentícios e/ou ração obtidos ou obteníveis pelos métodos forneci- dos neste pedido. Em algumas modalidades preferenciais, a presente inven- ção fornece métodos para o uso das culturas fornecidas neste pedido para preparação de produtos alimentícios e/ou ração.
A presente invenção fornece ainda sequências nucleotídicas compreendendo ou consistindo das sequências apresentadas em quaisquer das SEQ ID NOS:7 a 10 e SEQ ID NOS:359 a 405, bem como variantes, fragmentos, homólogos e derivados dos mesmos. A presente invenção tam- bém fornece aminoácidos codificados pelas sequências nucleotídicas apre- ! 25 sentadas neste pedido. Ainda em modalidades adicionais, a presente inven- ção fornece construtos e/ou vetores compreendendo uma ou mais das se- o quências nucleotídicas fornecidas neste pedido. A presente invenção tam- E bém fornece células hospedeiras compreendendo pelo menos um dos cons- trutos e/ou sequências nucleotídicas pedido.
Em algumas modalidades, um ou mais genes ou proteínas cas são usados em combinação com duas ou mais repetições de CRISPR. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas e/ou
' duas ou mais repetições de CRISPR são derivados da mesma célula. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR naturalmente coocorrem na mesma célula. Ainda em algumas modalidades adicionais, um ou mais genes ou proteínas cassão usados em combinação com uma ou mais CRISPR espaçadoras.
Em algumas modalidades, a CRISPR espaçadora(s) é derivada de um organismo diferente daquela célula a partir da qual um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR são derivadas.
; Em algumas modalidades, o espaçador é obtido a partir de uma célula que é : 10 resistente a um ácido nucleico-alvo. Em algumas modalidades, a CRISPR espaçadora é uma sequência de ácido nucleico sintética. Em algumas mo- dalidades adicionais, a CRISPR espaçadora(s) tem homologia ao ácido nu- cleico-alvo. Em algumas modalidades, a CRISPR espaçadora(s) tem identi- dade de 100% ao ácido nucleico-alvo durante pelo menos o tamanho do nú- cleoda CRISPR espaçadora.
Em algumas modalidades, um ou mais genes ou proteínas cas são usados em combinação com pelo menos uma ou mais CRISPR espaça- doras e pelo menos duas ou mais repetições de CRISPR. Em algumas mo- dalidades, ácido nucleico-alvo ou produto de transcrição do mesmo é deri- vado a partir do DNA do bacteriófago. Ainda em modalidades adicionais, ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de pelo menos um plasmídeo. Em algumas modalidades adicionais, ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de pe- lo menos um elemento genético móvel de DNA. Em algumas modalidades, o : 25 ácido nucleico-alvo ou produto de transcrição do mesmo é derivado a partir de um elemento transponível e/ou uma sequência de inserção. Em algumas o modalidades alternativas, ácido nucleico-alvo ou produto de transcrição do " mesmo é derivado a partir de um gene de resistência antibióti- co/antimicrobiano. Em algumas modalidades adicionais, o ácido nucleico- alvo ou produto de transcrição do mesmo é derivado a partir de um ácido nucleico que codifica pelo menos um fator de virulência. Em algumas moda- lidades preferenciais, o fator de virulência compreende toxinas, internalinas,
hemolisinas e/ou outros fatores de virulência.
Em algumas modalidades da presente invenção, um ou mais genes cas e duas ou mais repetições de CRISPR são derivadas da mesma célula. Em algumas modalidades alternativas, um ou mais genes cas e duas ou maisrepetições de CRISPR naturalmente coocorrem na mesma célula. Ainda em modalidades adicionais, as CRISPR espaçadoras são derivadas de um organismo diferente daquela célula da qual um ou mais genes cas e/ou duas ou mais repetições de CRISPR são derivados. Em algumas moda- , lidades, a célula é uma célula-recipiente ou uma célula-hospedeira.
Ê 10 Em algumas modalidades, um ou mais genes ou proteínas cas e/ou duas ou mais repetições de CRISPR são derivados da mesma célula. Em algumas modalidades, os espaçadores são derivados de um organismo diferente daquela célula compreendendo um ou mais genes ou proteínas cas €/ou duas ou mais repetições de CRISPR.
Em algumas modalidades, um ou mais genes ou proteínas cas e duas ou mais repetições de CRISPR naturalmente coocorrem na mesma célula.
Em algumas modalidades, a modificação compreende a inser- ção de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçado- ; 20 rasna célula. Em algumas modalidades, a modificação compreende cons- À trução genética da CRISPR espaçadora da célula. Em algumas modalida- des, o espaçador da célula tem homologia de 100% à CRISPR espaçadora ou pseudo CRISPR espaçadora do organismo. Em algumas modalidades, todo ou parte do espaçador na célula é modificado. Em algumas modalida- " 25 des, a modificação compreende a modificação de um espaçador recombi- nante. Em algumas modalidades, a modificação ocorre através de mutação o espontânea ou mutagênese. Em algumas modalidades, pelo menos uma ou e: mais CRISPR espaçadora(s) na célula são deletadas. Em algumas modali- dades, pelo menos uma ou mais repetição(ões) de CRISPR na célula são deletadas. Em algumas modalidades, um ou mais genes cas são deletados. Em algumas modalidades, CRISPR e/ou um ou mais genes cas são deleta- dos. Em algumas modalidades, um ou mais genes ou proteínas cas e/ou i duas ou mais repetições de CRISPR na célula são deletados. Em algumas modalidades, as sequências nucleotídicas do gene cas e repetição de CRISPR são derivadas das mesmas ou diferentes cepas. Em algumas mo- dalidades, as sequências nucleotídicas do gene cas e a repetição de CRIS- —PRsãoderivadasda mesmas ou diferentes espécies.
Em algumas modalidades, as sequências nucleotídicas do gene cas e a repetição de CRISPR são derivadas dos mesmos ou diferentes gê- neros. Em algumas modalidades, as sequências nucleotídicas do gene cas e t a repetição de CRISPR são derivadas dos mesmos ou diferentes organis- mos.
Em algumas modalidades da presente invenção, o ácido nuclei- co-alvo no bacteriófago é uma sequência de ácido nucleico altamente con- servada. Em algumas modalidades, o ácido nucleico-alvo no bacteriófago codifica uma proteína de especificidade para o hospedeiro. Em algumas mo- —dalidades adicionais, o ácido nucleico-alvo no bacteriófago codifica uma pro- teína que é essencial para sobrevivência, replicação ou crescimento do bac- teriófago. Em algumas modalidades, o ácido nucleico-alvo no bacteriófago codifica uma helicase, uma primase, uma cabeça ou cauda estrutural protei- ca, uma proteína com um domínio conservado (por exemplo, holina, lisina, etc) ou pelo menos uma sequência conservada entre genes de fago impor- i tantes.
Em algumas modalidades, o método para determinação da re- sistência de uma célula a um ácido nucleico-alvo ou um produto de transcri- ção do mesmo compreende a etapa adicional de comparação da sequência E 25 deumaoumaisCRISPR espaçadoras na célula com a sequência do ácido nucleico-alvo. Em algumas modalidades alternativas, o método para deter- o minação da resistência de uma célula a um ácido nucleico-alvo ou um produ- - to de transcrição do mesmo compreende a etapa adicional de determinação do perfil de resistência da célula.
Em algumas modalidades, a cultura é uma cultura iniciadora ou uma cultura probiótica.
A presente invenção também fornece "bactérias marcadas" que f são resistentes ao fago (isto é, "mutantes insensíveis a bacteriófago"; "BIMs"). Em algumas modalidades, a presente invenção fornece bactérias compreendendo uma ou mais sequências que se originam de pelo menos um genoma de bacteriófago que está/estão integrado no /ocux de CRISPR das bactérias. Esta sequência derivada do fago fornece uma marcação, que é identificável pela sua posição e/ou sequência e/ou sequência adjacente. Em algumas modalidades alternativas, a presente invenção for- nece sequências duplicadas (por exemplo, repetições duplicadas de CRIS- PR) que se originam de uma bactéria parental e também estão integradas : 10 iterativamente, sequencialmente, simultaneamente ou substancialmente si- multaneamente junto com a sequência que se origina a partir do genoma de bacteriófago. Além disso, a presente invenção fornece métodos que facilitam a integração de uma ou mais sequências de bacteriófago diferentes no locux de CRISPR da cepa bacteriana. Em algumas modalidades, a integração de sequências de bacteriófago diferentes no /locux de CRISPR da cepa bacteri- ana é um evento randômico. Em algumas modalidades alternativas, a inte- gração de sequências de bacteriófago diferentes no locux de CRISPR da cepa bacteriana não é um evento randômico. Dessa forma, não é sempre o mesmo locux do genoma do bacteriófago que é integrado no locux de É CRISPR da bactéria. Entretanto, uma vez que é integrado é mantido e dessa forma torna-se uma marcação robusta para marcar e/ou rastrear a bactéria. Consequentemente, uma ou mais sequências que se originam do genoma de bacteriófago não são somente novas para o locux de CRISPR da bactéria . 25 parental, mas são também uma marcação que é única para cada bactéria. Por isso, é fornecido neste pedido métodos para marcação (por exemplo, a marcação) e/ou identificação de bactérias.
Em algumas modalidades, os métodos da presente invenção são "naturais" e não resultam na produção de organismos geneticamente modificados. Em algumas modalidades preferenciais, a presente invenção fornece métodos para marcação de bactérias compreendendo as etapas de: (a) exposição de uma bactéria parental a um bacteriófago; (b) seleção de um
É mutante insensível a bacteriófago; (c) comparação de um /ocux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insensível a bac- teriófago; e (d) seleção de uma bactéria marcada compreendendo um frag- mento de DNA adicional no /ocux de CRISPR que não está presente na bac- tériaparental.
A presente invenção também fornece bactérias marcadas obti- das usando os métodos da presente invenção.
Em algumas modalidades, a presente invenção fornece culturas celulares compreendendo pelo menos . uma cepa bacteriana marcada.
Ainda em modalidades adicionais, a presente | 10 invenção fornece alimento e/ou ração compreendendo bactérias marcadas, incluindo, mas não limitadas a culturas celulares compreendendo tais bacté- rias marcadas.
A presente invenção também fornece métodos para preparação de alimento e/ou ração compreendendo pelo menos uma cepa bacteriana marcada.
Em algumas modalidades, os métodos compreendem adição de pelo menos uma cepa bacteriana ou cultura celular marcada a alimento e/ou ração.
A presente invenção também fornece métodos para geração de variantes de CRISPR compreendendo as etapas de: (a) exposição de uma bactéria parental a um bacteriófago; (b) seleção de uma bactéria resistente a ' bacteriófago (isto é, "um mutante insensível a bacteriófago"); (c) comparação do locux de CRISPR ou uma porção do mesmo da bactéria parental e o mu- tante insensível a bacteriófago; (d) seleção de uma bactéria marcada com- preendendo um fragmento de DNA adicional no /ocux de CRISPR que não E 25 está presente na bactéria parental; e (e) isolamento e/ou clonagem e/ou se- quenciamento do fragmento de DNA adicional.
A presente invenção também SEE. fornece as variantes de CRISPR produzidas usando os métodos apresenta- . dos neste pedido.
Em algumas modalidades particularmente preferenciais, as variantes de CRISPR são cepas mutantes resistentes ao fago que têm uml/ocuxdeCRISPR modificado com um espaçador adicional.
Em algumas modalidades adicionais, a presente invenção tam- bém fornece métodos para o uso de pelo menos uma sequência nucleotídica
' obtida ou obtenível a partir de um bacteriófago para marcação e/ou identifi- cação de bactérias, em que a sequência nucleotídica está integrada no locux de CRISPR da bactéria parental.
Ainda em modalidades adicionais, a presente invenção fornece — métodos para o uso de pelo menos uma sequência nucleotídica para marca- ção e/ou identificação de uma bactéria, em que a sequência nucleotídica é obtida ou obtenível por: (a) exposição de uma bactéria parental a um bacte- riófago; (b) seleção de um mutante insensível a bacteriófago; (c) compara- ção de um l/ocux de CRISPR ou uma porção do mesmo da bactéria parental É 10 edo mutante insensível a bacteriófago; e (d) seleção de uma bactéria mar- cada compreendendo um fragmento de DNA adicional no locux de CRISPR que não está presente na bactéria parental. Ainda em modalidades adicio- nais, a presente invenção fornece métodos para identificação de uma bacté- ria marcada compreendendo a etapa de seleção da bactéria para um frag- mento de DNA adicional em um locux de CRISPR da bactéria também é for- necido em um aspecto adicional da presente invenção.
Ainda em modalidades adicionais, a presente invenção fornece métodos para identificação de bactérias marcadas compreendendo as eta- pas de: (a) seleção das bactérias para um fragmento de DNA adicional em um /ocuxde CRISPR; (b) determinação da sequência nucleotídica do frag- mento de DNA adicional; (c) comparação da sequência nucleotídica do fragmento de DNA adicional a um banco de dados de bactérias marcadas obtidas ou obteníveis pelo método da presente invenção; e (d) identificação de uma sequência nucleotídica no banco de dados de bactérias marcadas : 25 que combina com o fragmento de DNA adicional. Em algumas modalidades preferenciais, a extremidade 5' e/ou a o extremidade 3' do /ocux de CRISPR da bactéria parental é comparado às : bactérias marcadas. Em algumas modalidades preferenciais alternativas, pelo menos a primeira repetição de CRISPR ou a primeira CRISPR espaça- — dora (por exemplo, o primeiro núcleo de CRISPR espaçadora) na extremida- de 5' do locux de CRISPR é comparada. Ainda em modalidades adicionais, pelo menos a última repetição de CRISPR ou a última CRISPR espaçadora
(por exemplo, o último núcleo da CRISPR espaçadora) na extremidade 3' do locux de CRISPR é/são comparada(s). Em algumas modalidades preferenciais, os métodos da presente invenção compreendem a etapa de seleção de uma bactéria marcada com- preendendo um fragmento de DNA adicional na extremidade 5' e/ou na ex- tremidade 3' do locux de CRISPR que não está presente na bactéria paren- tal.
Em algumas modalidades alternativas, os métodos compreendem ainda a exposição da bactéria parental a dois ou mais bacteriófagos simultanea- mente ou sequencialmente.
Ainda em modalidades adicionais, o /ocux de CRISPR ou uma porção do mesmo da bactéria parental e o mutante insen- sível a bacteriófago são comparados pela amplificação do /ocux de CRISPR ou uma porção do mesmo da bactéria parental e/ou do mutante insensível a bacteriófago.
Em algumas modalidades particularmente preferenciais, a am- plificação é realizada usando PCR.
Em algumas modalidades alternativas, o locuxde CRISPR ou uma porção do mesmo da bactéria parental e o mutan- te insensível a bacteriófago são comparados pelo sequenciamento do locux de CRISPR ou uma porção do mesmo da bactéria parental e/ou do mutante insensível a bacteriófago.
Em algumas modalidades preferenciais, o locux de CRISPR ou uma porção do mesmo da bactéria parental e do mutante insen- BF 20 sível a bacteriófago são comparados pela amplificação e então sequencia- À mento do locux de CRISPR ou uma porção do mesmo da bactéria parental e/ou do mutante insensível a bacteriófago.
Em algumas modalidades prefe- renciais alternativas, o fragmento de DNA adicional é de pelo menos 44 nu- cleotídeos em tamanho.
Em algumas modalidades preferenciais adicionais, e 25 as bactérias marcadas compreendem dois ou três ou mais fragmentos de DNA adicionais são selecionadas.
Ainda em modalidades adicionais, o frag- FE mento de DNA adicional compreende pelo menos uma sequência nucleotídi- e ca que tem a identidade de pelo menos aproximadamente 95%, ou preferen- cialmente, identidade de 100% a uma repetição de CRISPR no /ocux de —CRISPR da bactéria parental.
Ainda em modalidades adicionais, o fragmento de DNA adicional compreende pelo menos uma sequência nucleotídica que tem identidade de pelo menos aproximadamente 95%, e em algumas moda-
lidades, identidade preferencialmente de aproximadamente 100% a uma se- quência nucleotídica no genoma do bacteriófago usado para a seleção da bactéria marcada. Em algumas modalidades, a presente invenção também fornece pelo menos um fragmento de DNA adicional que compreende uma primeira sequência nucleotídica e uma segunda sequência nucleotídica em que pelo menos uma das sequências nucleotídicas tem identidade de pelo menos aproximadamente 95%, ou em algumas modalidades preferenciais, identidade de aproximadamente 100% a uma sequência nucleotídica no ge- : noma do bacteriófago usado para a seleção das bactérias marcadas.
: 10 Em algumas modalidades, a presente invenção fornece bacté- rias parentais que são adequadas para uso como culturas iniciadoras, cultu- ras probióticas e/ou suplementos dietéticos. Em algumas modalidades, as bactérias parentais são selecionadas de qualquer gênero adequado, incluin- do, mas não limitado a Escherichia, Shigella, Salmonella, Enwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobac- ter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Franci- sella, Brucella, Bifidobacterium, Brevibacterium, Propionibacterium, Lacto- coccus, Lactobacillus, Pediococeus, Leuconostoc e Oenococcus. Em algu- mas modalidades, o bacteriófago é selecionado a partir de uma família de ! vírus adequada, incluindo, mas não limitado a Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviridae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae. Em algumas modalidades, a presente invenção fornece culturas celulares que são selecionadas a partir de culturas iniciadoras, culturas pro- bióticas e/ou suplementos dietéticos. Em algumas modalidades particular- mente preferenciais, a presente invenção fornece métodos para identificação e de bactérias marcadas, compreendendo a etapa de comparação de pelo - menos um fragmento de DNA adicional a um banco de dados de sequência de bacteriófago e/ou um banco de dados de sequência bacteriana.
A presente invenção também fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacterió- fago, em que a sequência compreende a CRISPR espaçadora da cepa de
Streptococcus thermophilus DGCC7778, mencionada neste pedido como SEQ ID NO:680 (caacacattcaacagattaatgaagaatac; SEQ ID NO:680).
Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtení- vela partirdeum bacteriófago, em que a sequência compreende SEQ ID NO:680 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um /ocux de CRISPR.
Em modalidades adicionais, a presente invenção fornece cepas ' de S. thermophilus compreendendo uma sequência obtida ou obtenível a partirde um bacteriófago, em que a sequência compreende CRISPR espa- çadora (5'-3') da cepa de Streptococcus thermophilus DGCC7778 (tecact- cacgtacaaatagtgagtgtactc; SEQ ID NO:681). Ainda em modalidades adicio- nais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:681 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um locux de CRISPR.
Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtení- vela partir de um bacteriófago, em que a sequência compreende SEQ ID i NO:683: Sequência de CRISPRI (5'-3') da cepa de Streptococcus ther- mophilus DGCC7710-RH1. caaggacagttattgattttataatcactatgtgggtataamaacgtcaaaatttoatttgag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtcaacaattgcaacatcttataacccactt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgtttgacagcaaatcaagattcegaattgt - GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatgacgaggagctattggcacaacttaca GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcgatttgacaatcetgctgaccactottato E GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacacttggcaggcttattactcaaçagega - GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcCtgttccttgttettttgttgtaterttto GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACttcattcttcogtrttrigtttigogaatect - GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgctggcgaggaaacgaacaaggcctoaaça GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACCatagagrtggaaaactagaaacagattcaa GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataatgcegregaattacacggcaaggtca GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgagegagetegaaataatcttaattaçaag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgttegetagegtcatgtggtaacgtattta GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACggcgteccaatectgattaatacttactoeg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaacacagcaagacaagaggatgatogctatg
GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcCgacacaagaacgtatgcaagagttcaag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacaattcttoatecagtaactgctcaagtg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaattaagggcatagaaagggagacaacato GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcgatatttaamatcattttcataacttecat GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgcagtatcagçaagcaagetgttagttact GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataaactatgaaattttataattttraaga GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaataatttatggtatagctrtaatatcatto GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgcatcgagcacgttegagttrtacegttte GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtctatategaggteaactaacaattatogct GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatecgttcaaattctattrraggtacatet GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatcaatacgacaagagttaaaatogectrt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgcttagetgrecaatecacgaacgrggato GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACCaaccaacggraacagetactrtetacage GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataactgaaggataggagcttgtaaagtct GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtaatgctacatctcaaaggatgatcccaga GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaagtagttgatgacctetacaatagrttat GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacctagaageatttgagegratattgatto GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaattttgececttetttgeccettgactag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaccattagcaatcatttgtgcccattgagt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAGTTtgattcaacataaaaagecagttoaatto aacttggcttt (SEQ ID NO:683) Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtení- vela partirdeum bacteriófago, em que a sequência compreende SEQ ID NO:683 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um /ocux de CRISPR. Cepas de 8. thermophilus compreendendo uma sequência obtida ou obtenível a partir de um bacterió- fago, em que a sequência compreende SEQ ID NO:685 (isto é, 5- TACGTTTGAAAAGAATATCAAATCAATGA-3').
Ainda em modalidades adicionais, a presente invenção fornece cepas de S. thermophilus compreendendo uma sequência obtida ou obtení- vel a partir de um bacteriófago, em que a sequência compreende SEQ ID NO:685 a jusante (por exemplo, diretamente a jusante) da primeira repetição de CRISPR em pelo menos um /ocux de CRISPR. E Em algumas modalidades, a presente invenção fornece métodos - e composições que encontram uso no desenvolvimento e uso de combina- ções de cepa e rotações de culturas iniciadoras. Em algumas modalidades i adicionais, o uso de uma ou mais CRISPR de BIMs simultaneamente em uma cultura iniciadora (isto é, uma combinação de BIMs) é fornecida. Em algumas modalidades adicionais, o uso de uma ou mais CRISPR de BIMs em um esquema de rotação é fornecido. Em algumas modalidades adicio- nais, o uso de uma ou mais combinações de CRISPR de BIMs em um es-
quema de rotação é fornecido.
A presente invenção também fornece meios para analisar CRISPRs do organismo-alvo, a fim de permitir comparações entre sequên- cias espaçadoras contra o genoma de fago de biocontrole.
Em algumas mo- —dalidades, a presente invenção fornece meios de predizer a virulência de fago e a seleção de pelo menos um fago de biocontrole contra pelo menos um micro-organismo-alvo.
A presente invenção também fornece métodos e composições : para utilizar CRISPR-cas (isto é, mutagênese natural, em algumas modali- dades preferenciais) para construir pelo menos uma CRISPR variante resis- tente ao fago de pelo menos um micro-organismo-alvo que então será usado para gerar o fago mutante que dribla a resistência CRISPR-cas através da mutação no fago correspondente a uma sequência selecionada a partir de sequências espaçadoras, sequências pseudoespaçadoras, sequência pro- ximal, motivos de reconhecimento, etc., para aumentar a virulência do fago.
Em algumas modalidades preferenciais, fagos com virulência aumentada encontram uso como agentes de biocontrole.
Em algumas modalidades, a presente invenção fornece compo- sições e métodos adequados para a produção de fago tendo virulência au- mentada, quando comparada ao fago parental.
Em algumas modalidades, Á pelo menos um espaçador clonado é introduzido em um /ocux de CRISPR- cas ativo, para produzir uma variante de célula resistente ao fago para uso na geração do fago mutante.
Em algumas modalidades preferenciais, os mé- todos compreendem a introdução de uma sequência que serve como um . 25 alvo específico de uma sequência genômica de fago (por exemplo, uma re- gião que é altamente suscetível como um espaçador-alvo ou sequência de te reconhecimento para incorporação no hospedeiro do espaçador). Em algu- " mas modalidades adicionais, a presente invenção fornece métodos e com- posições para construção direta do fago, tal que a sequência genômica cor- respondente ao espaçador é consequentemente mutada.
A presente invenção também fornece métodos para dirigir a evo- lução de um dado fago usando a CRISPR de resistência ao fago adquirida
: 28 de uma cepa hospedeira correspondente para criar um mais virulento, por isso eficaz, agente de biocontrole.
DESCRIÇÃO DOS DESENHOS A figura 1 fornece uma apresentação esquemática que a inte- — graçãode uma CRISPR espaçadora no /ocux de CRISPR de S. thermophi- lus fornece resistência contra um bacteriófago ao qual a CRISPR espaçado- ra mostra identidade. A DGCC7710 parental é sensível ao fago, e o BIM DGCC7710RH1 é resistente ao fago. O BIM DGCC7710RH1 tem um novo h espaçador (Sn) no locux de CRISPR, que mostra identidade de 100% à se- quência do fago. Como mostrado na etapa (B), a cepa é desafiada com o fago 858 e um mutante resistente ao fago é selecionado. Como mostrado na etapa (C), o locux de CRISPR | do mutante tem um espaçador adicional que compartilha identidade de 100% com a região 31.921 a 31.950 bp do fago. A figura 2 fornece uma apresentação esquemática que a inte- —graçãode uma CRISPR espaçadora no locux de CRISPR de S. thermophi- lus fornece resistência contra um bacteriófago ao qual a CRISPR espaçado- ra mostra identidade. A DGCC7710 parental! é sensível ao fago, e o BIM DGCC7710RH2 é resistente ao fago. O BIM DGCC7710RH2 tem um novo espaçador (Sn) no locux de CRISPR, que mostra identidade de 100% à se- quência do fago. Como mostrado na etapa (B), a cepa é desafiada com o É fago 858 e um mutante resistente ao fago é selecionado. Como mostrado na etapa (C), o experimento foi independentemente repetido e outro mutante foi selecionado. O locux de CRISPR | do mutante tem um espaçador adicional (diferente daquele em RH1) que compartilha identidade de 100% com a re- " 25 gião17.125a17.244 bp do fago. A figura 3 fornece uma representação gráfica ilustrando a prepa- FE ração do construto CAS1KO no qual o gene cas1 é interrompido por recom- . binação homóloga. A figura 4 fornece uma representação gráfica da preparação do — construto RT usando uma enzima de restrição para gerar o construto RT a partir do construto S1S2. Há sítios de restrição Bgll nas repetições que per- mitem à porção "média" do construto ser cortada. Seguinte a digestão enzi-
mática, uma ligase foi usada para juntar as duas porções das extremidades, dessa forma gerando um novo construto que tem RT, mas sem espaçado- res.
A figura 5 fornece uma representação gráfica da integração do construto RT.
A figura 6 fornece uma representação gráfica ilustrando a cons- trução do construto S1S2 usando iniciadores específicos e reações PCR iterativas. O primeiro painel ilustra todos os iniciadores usados e a configu- ração das duas primeiras reações de PCR (reação t1 com iniciadores P1 e : 10 P2e reação ti2 com iniciadores P2 e P3). O segundo painel mostra os pro- dutos de PCR obtidos a partir das duas primeiras reações de PCR, com o produto da reação 1 à esquerda e o produto da reação t2 à direita. O ter- ceiro painel mostra a terceira reação de PCR, usando uma combinação dos produtos dos dois primeiros PCRs como o molde para a terceira reação de PCR,eoiniciador Pi da primeira reação junto com iniciador P4 da segunda reação. O quarto painel mostra o produto de PCR3, que tecnicamente gera o construto S1S2, A figura 7 fornece uma representação gráfica dos detalhes do desenho do iniciador dos iniciadores 2 e 3, que contêm sequências-chave parao experimento, derivado de espaçadores idênticos às sequências do fago (os produtos de PCR derivados a partir destes iniciadores de PCR gera- rão os espaçadores que fornecerão essencialmente resistência aos fagos).
A figura 8 fornece uma representação gráfica da integração do construto S1S2.
' 25 A figura 9 fornece uma representação gráfica mostrando um re- sumo do locux de CRISPR1 de S. thermophilus, os espaçadores recente- oo mente adquiridos em mutantes resistentes ao fago, e sensibilidade ao fago : correspondente. O locux de CRISPR1 de DGCC7710 (WT/tipo selvagem) está acima. A região de repetição/espaçadora de WT está no meio: repeti- ções (losangos pretos), espaçadores (caixas numeradas cinzas), líder (L, caixa branca) e repetição terminal (T, losango preto). Abaixo, o conteúdo do espaçador no lado líder do /ocux nos mutantes resistentes ao fago é deta-
lhado à esquerda, com espaçadores recentemente adquiridos (caixas bran- cas, S1-S14). À direita, a sensibilidade de cada cepa aos fagos 858 e 2972 é representada como um histograma da eficiência de plaqueamento (EOP), que é a taxa de contagem de placa de uma cepa mutante para aquelas de tipo selvagem.
A figura 10 fornece a construção da CRISPR espaçadora, inati- vação do gene cas e sensibilidade ao fago correspondente. |, mutante WTosss***; 11, mutante WTogss****PACRISPR1 onde CRISPR1 foi deletada; UI, mutante WTeosss***2::pR onde CRISPR1 foi deslocada e substituída com Í 10 uma única repetição; IV, WTeo2972ºÉ::pS 182, mutante da cepa WTo2o72"* onde CRISPRI foi deslocada e substituída com uma versão contendo S1 e S2; V, WToass*$*::pcas5- com cas5 inativado; VI, WTosss****::poas7- com cas7 inativado. pORI indica o plasmídeo integrado (712). A sensibilidade ao fago de cada cepa aos fagos 858 e 2972 é representada abaixo como um histograma da eficiência de plaqueamento (EOP).
A figura 11 fornece uma apresentação esquemática da constru- ção do construto de S1S2.
A figura 12 fornece uma apresentação esquemática da constru- ção de WTesse”**2ACRISPR1.
; 20 A figura 13 fornece um alinhamento da CRISPR espaçadora SI h com a região genômica correspondente do fago 858 e os dois fagos mutan- tes que driblaram a resistência de CRISPR da cepa WT esse" **.
A figura 14 fornece uma representação esquemática da constru- ção de um primeiro nível de variante resistente ao fago. Cada variante tem ' 25 um espaçador adicional único na sua CRISPR. Espaçadores adicionais não são relacionados com cada um dos outros (por exemplo, cada um tem uma o sequência diferente). Todos os espaçadores originam-se do fago P. - A figura 15 fornece uma representação esquemática do segundo nível de variantes resistentes ao fago apresentando resistência aumentada aos fagos. Variantes finais (At.n e A2.n) originam-se da cepa A e têm uma integração sequencial de espaçadores adicionais em sua CRISPR, com to- dos os espaçadores que são diferentes de cada um dos outros e originam-se do fago P.
A figura 16 fornece uma representação esquemática do segundo nível de variantes resistentes ao fago apresentando resistência aumentada aos fagos. A variante final (A1º*) origina-se da cepa A e tem uma integração sequencial de espaçadores adicionais em sua CRISPR originando-se de 3 fagos diferentes (por exemplo, de fago P, Qe R).
A figura 17 fornece uma representação esquemática do /ocux de CRISPR1 (painel A) e do locux de CRISPR3 (painel B) de cepas de S. ther- mophilus descritas nos Exemplos 7 ao Exemplo 16. Os nomes das cepas f 10 são dados no lado esquerdo da Figura. As flechas pretas representam repe- tições de CRISPR, "R" representa Repetição e "RT" representa Repetição Terminal. As flechas cinzas numeradas de 1 a 32 na parte A e de 1a 12 na parte B representam CRISPRI espaçadoras e CRISPRS3 espaçadoras, res- pectivamente, como estão em DGCC7710. As flechas brancas numeradas deS4aS35 representam espaçadores adicionais CRISPR específicos para as cepas descritas.
A figura 18 fornece uma apresentação esquemática de uma mo- dalidade da presente invenção, na qual uma sequência de direcionamento e uma repetição de CRISPR estão integradas em uma extremidade do locux de CRISPR. No painel A, o locux de CRISPR e elementos, incluindo repeti- h ções (R), espaçadores (S), líder a montante e reboque a jusante, com a re- petição terminal (RT) adjacente ao reboque, e genes cas na vizinhança (4 genes cas denominados cas1 a cas4 neste pedido, não-desenhado na esca- la) são indicados. Os genes cas podem estar na extremidade, ou divididos e BR 25 presentes em ambas as extremidades. Além disso, genes cas podem ser localizados em quaisquer das duas fitas de DNA. O Painel B mostra a se- Sea quência de fago, com um fragmento da sequência (Sn) que é usado como " um espaçador adicional (por exemplo, sequência de direcionamento). O Pai- nel C mostra a inserção de um novo espaçador (Sn) (por exemplo, sequên- cia de direcionamento) em uma extremidade do /ocux de CRISPR (perto do líder neste exemplo na extremidade 5' do locux de CRISPR), entre duas re- petições. O Painel D fornece uma comparação do conteúdo de locux de
CRISPR entre a parental e a bactéria mutante (por exemplo, bactéria mar- cada), com um novo espaçador (Sn) (por exemplo, sequência de direciona- mento) integrado em uma extremidade do /ocux de CRISPR (perto do líder neste exemplo), entre repetições.
O novo espaçador (Sn) constitui a se- —quência de direcionamento que é específica para a bactéria mutante (por exemplo, bactéria marcada). Em algumas modalidades, o uso deste método resulta na adição de um ou mais espaçadores da sequência de fago.
A figura 19 fornece uma apresentação esquemática de uma mo- dalidade da presente invenção, na qual duas sequências de marcação e du- asrepetições de CRISPR estão integradas em uma extremidade do locux de CRISPR.
No Painel A, (A) locux e elementos de CRISPR, incluindo repeti- ções (R), espaçadores (S), líder a montante e reboque a jusante, com a re- petição terminal (RT) adjacente ao reboque, e genes cas na vizinhança (4 genes cas denominados cas1 a cas4 neste pedido, não desenhado na esca- la) são indicados.
Os genes cas podem estar na extremidade, ou divididos e presentes em ambas as extremidades.
Genes cas podem estar localizados em quaisquer das duas fitas de DNA.
O Painel B mostra a sequência de fago em preto, com dois fragmentos da sequência (Sn e Sn') sendo usados como espaçadores adicionais (por exemplo, sequências de marcação). O Painel O . 20 mostraa inserção dos novos espaçadores (por exemplo, sequências de É marcação) (Sn e Sn') na mesma extremidade do locux de CRISPR (perto do líder neste exemplo na extremidade 5'), cada um dos quais está entre duas repetições.
O Painel B fornece uma comparação do conteúdo de /ocux de CRISPR entre a parental e a bactéria mutante (por exemplo, bactéria mar- E 25 — cada), com dois novos espaçadores (Sn e Sn') integrados na mesma extre- midade do locux de CRISPR (perto do líder neste exemplo na extremidade o 5), com cada um localizado entre repetições.
Os novos espaçadores Sn e : Sn' constituem a sequência de direcionamento que é específica para o mu- tante.
Em algumas modalidades, este método resulta na adição de um ou maisespaçadoresda sequência de fago.
A figura 20 fornece um gráfico mostrando a evolução da conta- gem de fago em leite contendo 107 pfu/ml de D2972 durante a fermentação com DGCC7710 (losangos pretos) ou com DGCC9836 (quadrados abertos). O leite foi 10% de leite em pó (p/v) em água. A temperatura de incubação foi 42ºC.
A figura 21 fornece um gráfico mostrando a evolução da conta- gem de fago acumulada em WTpnissr2"* 2º e WI pnizo72* o! em leite contendo 107 pfu/ml de D2972 durante a fermentação inoculada com WTpnizeza*** (tra- cejado) ou com WTpniaa72* 2 (cinza claro) ou com ambos WTpnizez2" "e WT- phiaer2" 2! (cinza escuro). O leite foi 10% de leite em pó (p/v) em água. A temperatura de incubação foi 42C. d 10 A figura 22 fornece um símbolo ("Web Logo") para o motivo de CRISPR1 NNAGAAW (SEQ ID NO:696).
A figura 23 fornece um alinhamento de CRISPR protoespaçado- ras selecionadas e regiões flanqueadoras e web logo para o motivo de CRISPR3 NGGNG (SEQ |D NO:723) Nesta Figuray S42 DGCC7710prizo7a” pnizges SR (SEQ ID NO:724), Sa41 DGCC77 1Ophizo7e priager SP, (SEQ ID NO:699) s41 DGCC771Opriass* SS PANaCAISPRI /2,5*S* (SEQ ID NO:700), e S78 LMD- 9phiaza1 É (SEQ ID NO: 701) são fornecidos.
DESCRIÇÃO DA INVENÇÃO A presente invenção fornece métodos e composições relaciona- das à modulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Em algumas modalidades prefe- renciais, a presente invenção fornece composições e métodos para o uso de um ou mais genes ou proteínas cas para modulação da resistência de uma h 25 célula contra um ácido nucleico-alvo ou um produto de transcrição do mes- mo. Em algumas modalidades, a presente invenção fornece métodos e o composições que encontram uso no desenvolvimento e uso de combinações : de cepa e rotações de culturas iniciadoras. Em modalidades adicionais, a presente invenção fornece métodos para marcação e/ou identificação de — bactérias. Em algumas modalidades preferenciais, a presente invenção for- nece métodos para o uso de loci de CRISPR para determinar a virulência potencial de um fago contra uma célula e o uso de CRISPR-cas para modu-
lar a sequência genética de um fago de nível de virulência aumentado. Ainda em modalidades adicionais, a presente invenção fornece meios e composi- ções para o desenvolvimento e o uso de fagos como agentes de biocontrole. Streptococcus thermophilus é uma espécie bacteriana Gram- positiva G+C baixo que é uma espécie-chave explorada na formulação de sistemas de cultura láctea para a produção de iogurte e queijo. Análises ge- nômicas comparativas de cepas de S. thermophilus estreitamente relaciona- das revelaram anteriormente que polimorfismo genético ocorre principalmen- > te em loci hipervariáveis, tais como operons eps e rps, bem como dois loci de repetições palindrômicas curtas agrupadas regularmente espaçadas (CRISPR) (Vide, por exemplo, Jansen et al., Mol. Microbiol., 483: 1565 [2002]; Bolotin et al., Microbiol., 151:2551 [2005]; e Bolotin et a/., Nat. Biotechnol., 22:1554 [2004]). Como descrito neste pedido em maiores detalhes, loci de CRISPR tipicamente consistem de várias repetições diretas não-contíguas separadas por intervalos de sequências variáveis chamadas espaçadores, e são muitas vezes adjacentes a genes cas (associados a CRISPR). Embora a função de loci de CRISPR não tenha sido estabelecida biologicamente, aná- lises in sílico dos espaçadores revelaram homologia de sequência com ele- mentos estranhos, incluindo bacteriófagos e sequências plasmídicas (Vide, ; 20 por exemplo, Bolotin et al., Microbiol., supra; Mojica et al., supra; e Pourcel ú et al., supra). Com base exclusivamente em análises in silico, várias hipóte- ses foram apresentadas propondo papéis para CRISPR e genes cas, que incluem o fornecimento de imunidade contra elementos genéticos estranhos através de um mecanismo com base em RNA de interferência (Vide, Maka- E 25 rovaetal, Biol. Direct., 1:7 [2006]). Entretanto, não é destinado que a pre- Ú sente invenção seja limitada a qualquer mecanismo e/ou meios de ação par- O ticulares.
: Estratégias atuais usadas na indústria para minimizar a infecção por bacteriófagos e a falha resultante de culturas bacterianas, inclui o uso de: (i) culturas iniciadoras mistas; e (ii) uso de alternância de cepas tendo diferentes perfis de suscetibilidade ao fago (isto é, rotação de cepa). Tradi- cionalmente, culturas iniciadoras usadas na indústria láctea são misturas de cepas bacterianas de ácidos lácticos. A composição complexa das culturas iniciadoras variadas assegura que certo nível de resistência ao ataque de fago é fornecido. Entretanto, subcultura repetida de culturas de cepas mistas leva a modificações imprevisíveis na distribuição das cepas individuais e e- ventualmente muitas vezes à dominância da cepa indesejada. Isto por sua vez pode levar à suscetibilidade aumentada a ataque de fago e risco de fa- lhas de fermentação. A rotação de cepas bacterianas selecionadas que são sensíveis ; aos fagos diferentes é outra abordagem atualmente usada para limitar o de- : 10 senvolvimento de fago. Entretanto, é difícil e complicado identificar e sele- cionar um número suficiente de cepas que tenham perfis de tipo de fago di- ferentes para fornecer um programa de rotação eficiente e fiável. Além disso, o uso contínuo de cepas necessita de monitorização cuidadosa para novos fagos contagiosos e a necessidade de substituir rapidamente uma cepa in- fectadacom uma cepa bacteriana resistente. Em centros de produção onde as grandes quantidades de volume de culturas iniciadoras são preparadas muito antes do uso, uma resposta tão rápida não é normalmente possível. Dessa forma, são feitas várias tentativas para melhorar a resistência de cul- turas para uso na indústria.
Além disso, embora fosse útil ter culturas iniciadoras que são : marcadas tal que a sua origem possa ser determinada, isto não foi feito. De fato, embora seja factível inserir um oligonucleotídeo sintético em uma cepa para marcá-la ou etiquetá-la, usando tecnologias de DNA recombinante, a cepa marcada seria considerada um organismo geneticamente modificado e ; 25 — pode ficarem oposição a questões reguladoras em aplicações comerciais. Dessa forma, há uma necessidade na técnica por métodos naturais e com- o posições adequadas para introdução de uma sequência única em bactérias E que possam ser usadas para identificar e/ou rastrear bactérias.
Bacteriófagos são indiscutivelmente a entidade biológica mais — abundante no planeta (Vide, Breitbart and Rohwer, Trends Microbiol., 13:278
[2005]). Sua distribuição ubíqua e abundância têm um impacto importante na ecologia microbiana e evolução de genomas bacterianos (Vide, Chibani-
Chennouti et al., J.
Bacterid., 186:3677 [2004]). Consequentemente, as bac- térias desenvolveram vários mecanismos de defesa natural que visam eta- pas diversas do ciclo de vida do fago, notavelmente bloqueando adsorção, prevenindo injeção de DNA, restringindo a entrada de DNA e sistemas de infecção abortivos.
Estas barreiras antivirais também podem ser construídas e manipuladas para controlar melhor populações de fago (Vide, por exemplo, Chibani-Chennoutfi et al., supra; e Sturino and Klaenhammer, Nat.
Rev.
Mi- crobiol., 4:395 [2006]). S Bactérias numerosas foram selecionadas por seres humanos e Í 10 usadas extensivamente para processos de biotecnologia e fermentação.
In- felizmente, as bactérias domesticadas usadas em aplicações industriais são muitas vezes suscetíveis a ataque de fago, incluindo aqueles gêneros e es- pécies largamente usados como culturas lácteas (Vide, Brussow, Ann.
Rev.
Microbiol., 55:283 [2001]). Consequentemente, a indústria desenvolveu vá- rias estratégias para combater o fago com base na diversidade de cepa, mu- tantes insensíveis a bacteriófago, e plasmídeos que carregam mecanismos de resistência ao fago.
Definições A menos que definido de outra maneira neste pedido, todos os 2 20 termos técnicos e científicos usados neste pedido têm a mesma significação ú que comumente entendido por um versado ordinário na técnica à qual esta invenção pertence.
Embora quaisquer métodos e materiais similares ou e- quivalentes àqueles descritos neste pedido encontrem uso na prática do que é descrito neste pedido, métodos e materiais exemplares são descritos neste " 25 pedido.
Como usado neste pedido, os termos singulares "um", "uma", "o" e "q" incluem a referência plural a menos que o contexto claramente indique O de outra maneira.
A menos que de outra maneira indicada, ácidos nucleicos . são escritos da esquerda para direita em orientação 5' a 3'; sequências de aminoácidos são escritas da esquerda para direita em orientação amino a — carbóxi, respectivamente.
Deve ser entendido que esta invenção não é limi- tada à determinada metodologia, protocolos e reagentes descritos, como estes podem variar, dependendo do contexto são usados por aqueles versa-
dos na técnica.
É destinado que toda limitação numérica máxima dada em todas as partes deste Pedido de Patente inclui toda limitação numérica menor, como se tais limitações numéricas menores fossem expressamente escritas neste pedido. Toda limitação numérica mínima dada em todas as partes des- te Pedido de Patente incluirá toda limitação numérica maior, como se tais limitações numéricas maiores fossem expressamente escritas neste pedido. Toda faixa numérica dada em todas as partes deste Pedido de Patente inclu- E irá toda faixa numérica mais estreita que está incluída em tal faixa numérica mais larga, como se tais faixas numéricas mais estreitas fossem todas ex- pressamente escritas neste pedido.
Como usado neste pedido, o termo "que ocorre naturalmente" refere-se a elementos e/ou processos que ocorrem na natureza.
Como usado neste pedido, os termos "construto", "conjugado", "cassete" e "híbrido", incluem uma sequência nucleotídica diretamente ou indiretamente ligada a outra sequência (por exemplo, uma sequência regula- tória, tal como um promotor). Em algumas modalidades, a presente invenção fornece construtos compreendendo uma sequência nucleotídica operacio- nalmente ligada a tal sequência regulatória. O termo "operacionalmente liga- do" refere-se a uma justaposição em que os componentes descritos estão em uma relação que os permite funcionar em sua maneira desejada. Uma sequência regulatória "operacionalmente ligada" a uma sequência de codifi- cação é ligada de tal modo que a expressão da sequência de codificação é realizada sob condição compatível com às sequências controle. Como usado neste pedido, o termo "sequências regulatórias" inclui promotores e poten- cializadores e outros sinais de regulação de expressão. Como usado neste FA pedido, o termo "promotor" é usado no sentido normal da técnica, por exem- p plo, um sítio de ligação de RNA polimerase. Em algumas modalidades, os construtos compreendem ou expressam um marcador, que permite a sele- ção do construto de sequência nucleotídica em, por exemplo, uma bactéria. Vários marcadores existem que podem ser usados, por exemplo, aqueles marcadores que fornecem a resistência antibiótica/antimicrobiana.
Em algumas modalidades, o construto compreende um vetor (por exemplo, um plasmídeo). Em algumas modalidades adicionais, a pre- sente invenção fornece vetores compreendendo um ou mais dos construtos ou sequências descritas neste pedido. Como usado neste pedido, o termo "vetor" inclui vetores de expressão, vetores de transformação e vetores de transporte. O termo "vetor de transformação" significa um construto capaz de ser transferido de uma entidade a outra entidade, que pode ser da mesma espécie ou pode ser de uma espécie diferente. Os construtos que são capa- : zes de ser transferidos de uma espécie a outra são às vezes tratados como : 10 "vetores de transporte". Em algumas modalidades, os vetores são transfor- mados em uma célula-hospedeira adequada como descrito neste pedido.
Em algumas modalidades, os vetores são plasmídeos ou vetores de fago fornecidos com uma origem de replicação, opcionalmente um promotor para a expressão do polinucleotídeo, e opcionalmente um regulador do promotor.
Em algumas modalidades, os vetores contêm uma ou mais sequências nu- cleotídicas de marcador selecionável. Os sistemas de seleção mais adequa- dos para micro-organismos industriais são aqueles formados pelo grupo de marcadores de seleção que não necessitam de uma mutação no organismo hospedeiro. Em algumas modalidades, os vetores são usados in vitro (por exemplo, para a produção de RNA ou usados para transfectar ou transfor- Í mar uma célula-hospedeira). Em algumas modalidades, polinucleotídeos são incorporados em um vetor recombinante (tipicamente um vetor replicável), tal como um vetor de clonagem ou expressão. O vetor encontra uso na repli- cação do ácido nucleico em uma célula-hospedeira compatível.
E 25 A introdução de um ácido nucleico (por exemplo, um fago, cons- truto ou vetor) em uma célula pode ser efetuada por vários métodos. Por O exemplo, em algumas modalidades, transdução, transformação, transfecção : por fosfato de cálcio, transfecção mediada por DEAE-dextrana, transfecção mediada por lipídio catiônico, eletroporação, transdução ou infecção podem — encontrar uso. De fato, qualquer método adequado conhecido na técnica encontra uso na presente invenção. Em algumas modalidades, células con- tendo ácido nucleico exógeno (introduzido por meio de fago, construto, ou um vetor) são selecionadas para usar qualquer método adequado conhecido na técnica. Ensinamentos na transformação de células são bem documen- tados na técnica, por exemplo, vide Sambrook et al. (Molecular Cloning: À Laboratory Manual, 2º edição, 1989, Cold Spring Harbor Laboratory Press) e Ausubel et al., Current Protocols in Molecular Biology (1995), John Wiley & Sons, Inc.
No contexto de introdução de um ácido nucleico em uma célula, . em algumas modalidades, é preferencial que o termo "introdução" signifique j 10 uma ou mais de transformação, transfecção, conjugação ou transdução. Em algumas modalidades particularmente preferenciais, cepas bacterianas (por exemplo, cepas bacterianas parentais, cepas bacterianas variantes, etc.) são "expostas" a pelo menos um fago, tal que o ácido nucleico de fago seja in- troduzido nas células da cepa bacteriana.
Como usado neste pedido, os termos "sequência de ácido nucle- ico", "sequência nucleotídica" e "ácido nucleico" se referem a qualquer se- quência de ácido nucleico, incluindo DNA, RNA, genômica, sintética, recom- binante (por exemplo, cDNA). É destinado que os termos englobem sequên- cias de dupla fita e/ou fita simples, se representando a fita de senso ou an- tissenso ou combinações das mesmas. As sequências de ácidos nucleicos h recombinantes são preparadas pelo uso de quaisquer técnicas de DNA re- combinante adequadas. Em algumas modalidades, como descrito neste pe- dido, as sequências de ácidos nucleicos fornecidas incluem sequências gê- nicas que codificam CRISPR, Cas, e outras sequências. De fato, como usa- : 25 dono contexto, a presente invenção engloba sequências de ácidos nuclei- cos que codificam várias sequências CRISPR, incluindo, mas não limitadas Cass a espaçadores, pseudoespaçadores, líderes, etc., bem como sequências h cas, e outras sequências de ácidos nucleicos bacterianas e de fago ("bacte- riófago").
Os termos "codificação de molécula de ácido nucleico", "codifi- cação de sequência de ácido nucleico", "codificação de sequência de DNA" e "codificação de DNA," se referem à ordem ou sequência de desoxirribonu-
cleotídeos ao longo de uma fita de ácido desoxirribonucleico.
A ordem des- tes desoxirribonucleotídeos determina a ordem de aminoácidos ao longo da cadeia polipeptídica (proteína). A sequência de DNA codifica dessa forma para a sequência de aminoácido.
Como usado neste pedido no contexto de introdução de uma sequência de ácido nucleico em uma célula, o termo "introduzido" refere-se a qualquer método adequado para transferir a sequência de ácido nucleico para a célula.
Tais métodos para introdução incluem, mas não são limitados D a fusão de protoplasto, transfecção, transformação, conjugação e transdu- ! 10 ção.
Em algumas modalidades particularmente preferenciais, o ácido nuclei- co é introduzido em células-recipientes na infecção das células pelo bacte- riófago(s). Em algumas modalidades, as sequências de ácidos nucleicos e ácidos nucleicos fornecidos neste pedido são isolados ou substancialmente —purificados.
Por "isolado" ou "substancialmente purificado" é destinado que as moléculas de ácidos nucleicos, ou fragmentos biologicamente ativos ou variantes, homólogos, ou derivados dos mesmos são substancialmente ou essencialmente livres de componentes normalmente encontrados em asso- ciação com o ácido nucleico em seu estado natural.
Tais componentes in- —cluem,mas não são limitados a outro material celular, meios de cultura, ma- ú teriais de produção recombinante, e vários produtos químicos usados para sintetizar quimicamente os ácidos nucleicos.
Em algumas modalidades, uma sequência de ácido nucleico "i- solada" ou ácido nucleico é tipicamente livres de sequências de ácidos nu- i 25 —cleicos que flanqueiam o ácido nucleico de interesse no DNA genômico do organismo do qual o ácido nucleico foi derivado (por exemplo, sequências de SS codificação presentes nas extremidades 5' ou 3'). Entretanto, a molécula po- . de incluir algumas bases adicionais ou porções que não afetam deleteria- mente as características básicas da composição.
Como usado neste pedido, o termo "modificação" refere-se a modificações feitas no ácido nucleico e/ou sequências de aminoácidos.
Em algumas modalidades, modificações são realizadas usando métodos de en-
genharia genética (por exemplo, recombinante), enquanto em outras modali- dades, as modificações são feitas usando mecanismos genéticos que ocor- rem naturalmente.
É destinado que toda ou parte de uma sequência será modificada usando os métodos da presente invenção.
Em algumas modali- dades preferenciais, os ácidos nucleicos modificados incluem uma ou mais CRISPR espaçadoras que ocorrem naturalmente ou produzidos recombinan- temente, genes ou proteínas cas, repetições de CRISPR, /oci de CRISPR, bem como ácidos nucleicos de bacteriófago.
Qualquer método adequado conhecido na técnica encontra uso na presente invenção, incluindo mas não f 10 limitado a uso de PCR, clonagem, mutagênese sítio dirigida, etc.
De fato, os conjuntos comercialmente disponíveis encontram uso na presente invenção.
Em algumas modalidades, oligonucleotídeos sintéticos são usados.
Em al- gumas modalidades, métodos, tais como recombinação homóloga, encon- tram uso (por exemplo, para inserção ou deleção de CRISPR espaçadoras). Em algumas modalidades, a engenharia genética inclui ativação de uma ou mais sequências de ácidos nucleicos (por exemplo, loci de CRISPR, repeti- ções de CRISPR, espaçadores de CRISPR, genes ou proteínas cas, combi- nações funcionais de genes ou proteínas cas e repetições de CRISPR, ou combinações dos mesmos). Em algumas modalidades, uma ou mais CRISPR espaçadoras Ê ou pseudo CRISPR espaçadoras são inseridas em pelo menos um /ocux de CRISPR.
Em algumas modalidades adicionais, a modificação não interrom- pe um ou mais genes cas de pelo menos um l/ocux de CRISPR.
Em outras modalidades, um ou mais genes cas permanecem intactos.
Em algumas E 25 modalidades adicionais, a modificação não interrompe uma ou mais repeti- ções de CRISPR de pelo menos um /ocux de CRISPR.
Em algumas modali- re dades, uma ou mais repetições de CRISPR permanecem intactas.
Em algu- y mas modalidades adicionais, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras são inseridas em ou dentro de pelo menos um /ocux de CRISPR.
Em algumas modalidades adicionais, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras são inseridas na extremidade 5' de pelo menos um /ocux de CRISPR.
Em algumas modalidades, a modificação compreende a inser- ção de pelo menos uma CRISPR espaçadora ou pseudo CRISPR espaçado- ras em uma célula (por exemplo, uma célula-recipiente). Em algumas outras modalidades, a modificação compreende a inserção de uma ou mais CRIS- PR espaçadoras ou pseudo CRISPR espaçadoras (em, por exemplo, para modificar ou substituir) um aou mais CRISPR espaçadoras de uma célula- recipiente. Em algumas modalidades, as CRISPR espaçadoras da célula são as mesmas, enquanto em outras modalidades, são diferentes. Em algumas i modalidades, a modificação compreende a inserção de pelo menos uma í 10 CRISPR espaçadora ou pseudo CRISPR espaçadora de um organismo do- ador em uma célula-recipiente. Em algumas modalidades adicionais, a modi- ficação compreende a inserção de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador em uma célula- recipiente sob condições adequadas para modificar ou substituir uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras da célula- recipiente. Em algumas modalidades, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador são inseridas em uma ou mais, preferencialmente, duas ou mais repetições de CRISPR da célula. Em algumas modalidades preferenciais, pelo menos uma combina- . 20 ção de repetição-casde CRISPR funcional permanece intacta na célula.
: Em algumas modalidades adicionais, a inserção ocorre adjacen- te a uma ou mais (preferencialmente duas ou mais) CRISPR espaçadoras ou pseudo espaçadoras. Como usado neste pedido, o termo "adjacente" sig- nifica "próximo a" em seu sentido mais amplo e inclui "diretamente adjacen- b 25 te". Dessa maneira, em algumas modalidades, uma ou mais CRISPR espa- çadoras ou pseudo CRISPR espaçadoras de um organismo são inseridas ra "diretamente adjacentes" a uma ou mais CRISPR espaçadoras ou pseudo : CRISPR espaçadoras da célula-recipiente, (isto é, CRISPR espaçadora(s) ou pseudo CRISPR espaçadora(s) são inseridas tal que não haja nenhum —nucleotídeo interveniente entre os espaçadores).
Em algumas modalidades adicionais, CRISPR espaçadora(s) ou pseudo CRISPR espaçadora(s) são inseridas tal que haja pelo menos apro-
ximadamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproxima- damente 9, aproximadamente 10, aproximadamente 15, aproximadamente 20, aproximadamente 25, aproximadamente 30, aproxi- —madamente 35, aproximadamente 40, aproximadamente 45, aproximada- mente 50, aproximadamente 55, aproximadamente 60, aproximadamente 65, aproximadamente 70, aproximadamente 75, aproximadamente 80, apro- ximadamente 85, aproximadamente 90, aproximadamente 95, aproximada- mente 100, aproximadamente 200, aproximadamente 300, aproximadamen- ! 10 te 400, aproximadamente SOO, aproximadamente 600, aproximadamente 700, aproximadamente 800, aproximadamente 900, aproximadamente 1000, aproximadamente 10.000, aproximadamente 100.000, ou aproximadamente
1.000.000 ou mais nucleotídeos intervenientes entre os espaçadores. Em algumas modalidades adicionais, o nucleotídeo interveniente —menciona-se como uma "sequência líder". Estes termos são usados inter- cambiavelmente neste pedido. A sequência líder pode ser de um tamanho diferente em bactérias diferentes. Em algumas modalidades, a sequência líder é pelo menos aproximadamente 20, aproximadamente 25, aproxima- damente 30, aproximadamente 35, aproximadamente 40, aproximadamente 45,aproximadamente 50, aproximadamente 55, aproximadamente 60, apro- ' ximadamente 65, aproximadamente 70, aproximadamente 75, aproximada- mente 80, aproximadamente 85, aproximadamente 90, aproximadamente 95, aproximadamente 100, aproximadamente 200, aproximadamente 300, aproximadamente 400, ou aproximadamente 500 ou mais nucleotídeos em : 25 tamanho. Em algumas modalidades preferenciais, a sequência líder está entre o último gene cas (na extremidade 3') e a primeira repetição de CRIS- o PR (na extremidade 5') do locux de CRISPR. Em algumas modalidades, a r sequência líder está entre aproximadamente 20 a 500 nucleotídeos em ta- manho. Em algumas modalidades, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador são inseridas adjacentes a um ou mais genes cas de uma célula-recipiente, em que os genes cas são os mesmos ou diferentes. Em algumas modalidades adicio- nais, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador são inseridas adjacentes aos mesmos espaçado- res ou diferentes da célula-recipiente.
Em outra modalidade, uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras - tais como uma ou mais CRISPR espaçado- ras ou pseudo CRISPR espaçadoras de um organismo doador - são cada uma inseridas adjacentes às mesmas ou diferentes repetições de CRISPR da célula. Em outra modalidade, uma ou mais CRISPR espaçadoras ou f 10 pseudo CRISPR espaçadoras - tais como uma ou mais CRISPR espaçado- ras ou pseudo CRISPR espaçadoras de um organismo doador - são cada uma inseridas adjacentes aos mesmos ou diferentes genes cas da célula- recipiente.
Em algumas modalidades adicionais, a sequência de uma ou mais CRISPR espaçadora(s) de um organismo doador é fornecida sob con- dições que a célula-recipiente é modificada tal que a CRISPR espaçadora tenha a homologia à CRISPR espaçadora ou pseudo CRISPR espaçadora do organismo doador. Em algumas modalidades, a CRISPR espaçadora tem homologia de 100% ao CRISPR espaçadora do organismo doador.
Em algumas modalidades, a CRISPR espaçadora(s) ou pseudo t CRISPR espaçadoras compreendem DNA ou RNA de origem genômica, sintética ou recombinante. Em algumas modalidades, a CRISPR espaçado- ra(s) ou pseudo CRISPR espaçadoras são dupla fita, enquanto em outras modalidades, são de fita simples, se representando a fita de senso ou antis- À 25 senso ou combinações das mesmas. É contemplado que a CRISPR espa- çadora(s) ou pseudo CRISPR espaçadoras são preparadas pelo uso de téc- SS nicas de DNA recombinante (por exemplo, DNA recombinante), como descri- N to neste pedido.
Em algumas modalidades, a modificação compreende a inser- çãodeuma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de um organismo doador que é substancialmente resistente a um ácido nu- cleico-alvo ou um produto de transcrição do mesmo em um ou mais /loci de
CRISPR de uma célula substancialmente sensível. Em algumas modalida- des, a inserção ocorre em ou entre uma combinação funcional de pelo me- nos duas repetições de CRISPR e pelo menos um gene cas em uma célula substancialmente sensível. Em algumas modalidades, a modificação com- preende a modificação (por exemplo, mutação) do DNA de uma célula- recipiente (por exemplo, DNA plasmidial ou DNA genômico), tal que um ou mais genes cas são criados no DNA da célula. Em algumas modalidades, os genes cas são clonados em um construto, um plasmídeo ou um vetor, etc., : que é então transformado na célula, usando qualquer método adequado.
i 10 Em algumas modalidades, a modificação compreende modifica- ção (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, tal como DNA plasmidial ou DNA genômico), tal que uma ou mais, preferen- cialmente, duas ou mais repetições de CRISPR são criadas no DNA da célu- la. Em algumas modalidades, as repetições de CRISPR são clonadas em um construto, um plasmídeo ou um vetor, etc., que é então transformado na célula, usando qualquer método adequado. Em algumas modalidades adicionais, a modificação compreende a modificação (por exemplo, mutação) do DNA de uma célula-recipiente (por exemplo, DNA plasmidial ou DNA genômico), tal que uma ou mais combina- ções funcionais de repetições de cas-CRISPR são criadas no DNA da célula. Em algumas modalidades, combinações funcionais de repetição cas- CRISPR podem ser clonadas em um construto, um plasmídeo ou um vetor, que é então transformado na célula, usando qualquer método adequado. Em algumas modalidades, a modificação compreende a modifi- : 25 cação (por exemplo, mutação) do DNA de uma célula-recipiente (por exem- plo, DNA plasmidial ou DNA genômico), tal que uma ou mais CRISPR espa- o çadoras são criadas no DNA da célula. Em algumas modalidades, as CRIS- . PR espaçadoras podem ser clonadas em um construto, um plasmídeo ou um vetor, que então é transformado na célula, usando qualquer método a- dequado. Em algumas modalidades preferenciais, uma CRISPR espaçadora é flanqueada por duas repetições de CRISPR (isto é, uma CRISPR espaça- dora tem pelo menos uma repetição de CRISPR em cada lado).
Em algumas modalidades, a modificação compreende a inser- ção de uma ou mais CRISPR espaçadoras (por exemplo, CRISPR espaça- doras heterólogas) na vizinhança de (por exemplo, adjacente/diretamente adjacente) um ou mais genes cas e/ou a sequência líder. Dessa maneira, em algumas modalidades, a organização do locux de CRISPR que ocorre naturalmente é mantida após inserção de uma ou mais CRISPR espaçado- ras. Como usado neste pedido, o termo "ácido nucleico-alvo" refere- h se a qualquer sequência de ácido nucleico ou produto de transcrição do í 10. mesmo, contra o qual a resistência em uma célula (por exemplo, uma célula- recipiente) é modulada. Em algumas modalidades, a resistência é dirigida contra sequência de ácido nucleico-alvo per se. Vantajosamente, isto confe- re resistência a uma célula contra um organismo doador do qual o ácido(s) nucleico alvo é derivável. Dessa maneira, em algumas modalidades, a inser- ção de uma pseudo CRISPR espaçadora derivada de um bacteriófago ou uma CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) em uma célula-recipiente confere resistência ao bacteriófago. Dessa maneira, em algumas modalidades prefe- renciais, a inserção entre duas repetições de CRISPR de uma pseudo . 20 CRISPR espaçadora derivada de um bacteriófago ou CRISPR espaçado- ô ra(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) em uma célula-recipiente conferem resistência ao bacteriófa- go. Em um aspecto adicional, é fornecido um método para modular a resis- tência de uma célula-recipiente contra um ácido nucleico-alvo ou um produto detranscriçãodo mesmo.
A presente invenção também fornece métodos para determina- í ção do perfil de resistência de uma célula contra um ácido nucleico-alvo. " Como usado neste pedido, o termo "perfil de resistência" significa uma ou mais entidades contra as quais a célula é sensível ou resistente. Conse- quentemente, em algumas modalidades, o perfil de resistência de uma célu- la reflete que a célula é resistente a um primeiro bacteriófago, sensível a um segundo bacteriófago, resistente a um primeiro elemento genético móvel, e sensível a um primeiro gene de resistência antibiótico, etc.
Em algumas modalidades, um ou mais genes ou proteínas cas, uma ou mais repetições de CRISPR, um ou mais genes cas, uma ou mais combinações funcionais de repetição de cas-CRISPR, uma ou mais CRISPR —espaçadoras e/ou uma ou mais CRISPR espaçadoras etc., em uma célula são detectados e/ou sequenciados para predizer/determinar o perfil de resis- tência provável de uma determinada célula. Em algumas outras modalida- des, uma ou mais CRISPR espaçadoras em uma célula são detectadas ou : sequenciadas para predizer/determinar o perfil de resistência provável de É 10 uma determinada célula. Métodos de detecção adequados incluem, mas não são limitados a PCR, hibridização DNA-DNA, hibridização DNA-RNA, micro- arranjos de DNA, etc. De fato, é destinado que qualquer método adequado encontrará uso na presente invenção. Em modalidades adicionais, o perfil de resistência provável de uma determinada célula bacteriana a um ou mais —bacteriófagos é usado como um preditor lisotípico para seleção microbiana. Em algumas modalidades adicionais, um ou mais genes Cas e/ou uma ou mais repetições de CRISPR são sequenciadas além de uma ou mais CRIS- PR espaçadoras, a fim de verificar a compatibilidade da combinação de re- petição do gene cas CRISPR ou identificar novos pares de combinações cas/repetição compatíveis.
F Como usado neste pedido, o termo "modulação da resistência" refere-se a supressão, redução, diminuição, indução, conferência, restaura- ção, elevação, aumento ou de outra maneira afetar a resistência de uma cé- lula a um ácido nucleico-alvo, como tomado no contexto.
E 25 Como usado neste pedido, o termo "resistência" não se significa implicar que uma célula é 100% resistente a um ácido nucleico-alvo ou um "ea produto de transcrição do mesmo, mas inclui células que são tolerantes ao isss ácido nucleico-alvo ou um produto de transcrição do mesmo.
Como usado neste pedido o termo "resistência ao ácido nuclei- — co-alvo ou produto de transcrição do mesmo" significa que a resistência é conferida contra uma célula ou um organismo (por exemplo, fago) que com- preende ou produz o ácido nucleico-alvo ou produto de transcrição do mes-
mo. Em algumas modalidades, o componente mínimo necessário para con- ferir imunidade ou resistência contra um ácido nucleico-alvo ou produto de expressão do mesmo é pelo menos um gene cas (ou uma proteína Cas) e pelo menos duas repetições de CRISPR flanqueando um espaçador.
Em algumas modalidades, a presente invenção fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: identificação de uma sequência (por exemplo, uma sequência conservada) em um organismo (preferencialmente, uma sequência essencial para a função ou sobrevivência do organismo); preparação de uma CRISPR espaçadora que compreende uma sequência homóloga (por exemplo, 100% idêntica), à sequência identificada; prepara- ção de um ácido nucleico compreendendo pelo menos um gene cas e pelo menos duas repetições de CRISPR em conjunto com a CRISPR espaçado- ra;e (iv) transformação de uma célula com o ácido nucleico, portanto, para produzir a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo.
Como usado neste pedido, o termo "sequência conservada" no contexto de identificação de uma sequência conservada em um organismo não necessariamente tem que ser conservada no seu sentido mais estrito, como conhecimento de uma sequência de um dado organismo é suficiente. Além disso, a sequência não precisa ser parte de uma entidade essencial. Entretanto, em algumas modalidades, a sequência conservada é uma se- quência que é essencial para função e/ou sobrevivência e/ou replicação e/ou infectividade e similares de um organismo ou uma célula. Em algumas mo- dalidades, a sequência conservada compreende uma helicase, uma prima- o se, uma cabeça ou cauda estrutural proteica, uma proteína com um domínio - conservado (por exemplo, holina, lisina e outros), ou sequências conserva- das entre genes de fago importantes.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo compreendendo as etapas de: identificação de uma ou mais CRISPR espaçadoras em um organismo resistente ao ácido nuclei- co-alvo ou produto de transcrição do mesmo; preparação de um ácido nucle- ico recombinante compreendendo pelo menos um gene ou proteína cas e — pelomenos duas repetições de CRISPR em conjunto com um ou mais espa- çadores identificados; e transformação de uma célula com o ácido nucleico recombinante, portanto, para produzir a célula-recipiente resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo. Em algumas modalidades, a presente invenção fornece métodos para modulação (por exemplo, conferindo ou aumentando) da resistência de uma célula compreendendo pelo menos um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR con- tra um ácido nucleico-alvo ou um produto de transcrição do mesmo compre- endendo as etapas de: identificação de uma ou mais CRISPR espaçadoras em um organismo resistente ao ácido nucleico-alvo ou produto de transcri- ção do mesmo; e modificação da sequência de uma ou mais CRISPR espa- çadora(s) na célula tal que CRISPR espaçadora(s) tenha homologia à CRISPR espaçadora(s) no organismo. Em algumas modalidades, uma ou mais CRISPR espaçadoras em uma célula-recipiente são modificadas (por exemplo, construídas geneticamente) tal que CRISPR espaçadora(s) tem homologia a uma ou mais CRISPR espaçadora(s) em um organismo doador que é substancialmente resistente a um ácido nucleico-alvo ou um produto de transcrição do mesmo, a fim de produzir a célula resistente ao ácido nu- cleico-alvo. Em algumas modalidades preferenciais, um ou mais genes ou : 25 proteínas case uma ou mais, preferencialmente, duas ou mais repetições de CRISPR na célula são uma combinação funcional como descrito neste pedi- FE do.
EE Os métodos de engenharia genética incluem quaisquer métodos adequados conhecidos na técnica, incluindo, mas não limitados a, adição (por exemplo, inserção), deleção (por exemplo, remoção) ou modificação (por exemplo, mutação) da sequência de uma ou mais CRISPR espaçadoras e/ou uma ou mais pseudo CRISPR espaçadoras em uma célula, tal que a
CRISPR espaçadora tem homologia (por exemplo, homologia aumentada após engenharia genética) a uma ou mais CRISPR espaçadoras de um or- ganismo doador.
Esta etapa de engenharia resulta em uma célula que foi substancialmente sensível a um ácido nucleico-alvo ou um produto de trans- —crição do mesmo que é substancialmente resistente ao ácido nucleico-alvo ou um produto de transcrição do mesmo.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos para diminuição ou redução da resistência de uma célula- recipiente compreendendo pelo menos um ou mais genes ou proteínas cas e t 10 umaoumais, preferencialmente, duas ou mais repetições de CRISPR contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
Em algumas modalidades, os métodos compreendem etapas de: identificação de uma ou mais CRISPR espaçadoras em um organismo que é substancialmente resistente ao ácido nucleico-alvo ou um produto de trans- criçãodo mesmo; e modificação da sequência de uma ou mais CRISPR es- paçadora(s) na célula tal que CRISPR espaçadora(s) tenha um grau reduzi- do de homologia à CRISPR espaçadora(s) no organismo.
Em outras modalidades, os métodos para modulação (por e- xemplo, diminuição) da resistência de uma célula compreendendo um ou ' 20 mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou kh mais repetições de CRISPR contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendem etapas de: identificação de uma CRIS- PR espaçadora ou uma pseudo CRISPR espaçadora em um organismo compreendendo um ácido nucleico-alvo ou produto de transcrição do mesmo ; 25 contra o qual a resistência deve ser modulada; e identificação da CRISPR espaçadora no organismo no qual a resistência deve ser modulada; e (iii) O adaptação da sequência do CRISPR espaçadora no organismo no qual a de resistência deve ser modulada tal que a CRISPR espaçadora tenha um grau menor de homologia à CRISPR espaçadora ou pseudo CRISPR espaçadora do organismo compreendendo o ácido nucleico-alvo ou produto de transcri- ção do mesmo contra o qual a resistência deve ser modulada.
Uma ou mais CRISPR espaçadoras em uma célula substancial-
mente resistente são construídas a fim de produzir a célula sensível a um ácido nucleico-alvo. Os métodos de engenharia genética que encontram uso incluem, mas não são limitados a, adição (por exemplo, inserção), deleção (por exemplo, remoção) ou modificação de uma ou mais combinações de —repetição-cas de CRISPR funcionais ou porções ou fragmentos dos mesmos na célula substancialmente resistente e/ou adição (por exemplo, inserção), deleção (por exemplo, remoção) ou modificação de uma ou mais CRISPR espaçadoras ou porções ou fragmentos das mesmas na célula substancial- y mente resistente. Esta etapa de engenharia resulta em uma célula que foi i 10 — substancialmente resistente a um ácido nucleico-alvo ou um produto de transcrição do mesmo que fica substancialmente sensível a um ácido nuclei- Cco-alvo ou um produto de transcrição do mesmo.
Em algumas modalidades, a fim de conferir sensibilidade a uma célula, é contemplado que uma ou mais CRISPR espaçadoras, um ou mais genes ou proteínas cas, uma ou mais, preferencialmente, duas ou mais re- petições de CRISPR, e/ou um ou mais combinações funcionais de repeti- ções-cas CRISPR a partir de uma célula Substancialmente resistente será removida, deletada ou modificada tal que a resistência não seja mais confe- rida. Em algumas modalidades, as células que são sensíveis a um ácido nu- —cleico-alvo ou um produto de transcrição do mesmo são preparadas tal que seus níveis em uma dada cultura (por exemplo, uma cultura iniciadora) pos- sam ser modulados (por exemplo, reduzidos) como desejado. Dessa manei- ra, em algumas modalidades, culturas iniciadoras compreendendo duas ou mais cepas bacterianas são desenvolvidas tal que todos os membros da cul- : 25 tura sejam sensíveis ao mesmo agente (por exemplo, o mesmo bacteriófa- go). Dessa maneira, quando chega a hora que já não seja mais desejado rea que a cultura esteja viva, a cultura é contatada com o mesmo agente único a : fim de matar todos os membros da cultura. Em algumas modalidades, as sensibilidades de células são moduladas por um ou mais agentes (por e- —xemplo, fagos), tal que o agente mata somente uma certa proporção das células em uma dada cultura (por exemplo, aproximadamente 10, aproxima- damente 20, aproximadamente 30, aproximadamente 40, aproximadamente
50, aproximadamente 60, aproximadamente 70, aproximadamente 80, apro- ximadamente 90, ou aproximadamente 95% das células na cultura). Em algumas modalidades, uma célula-recipiente é construída tal que compreenda uma CRISPR espaçadora ou uma sequência correspon- denteauma pseudo CRISPR espaçadora, por meio disso produzindo a célu- la resistente a um ácido nucleico-alvo ou produto de transcrição do mesmo.
Apropriadamente, a célula é construída tal que a CRISPR espaçadora ou sequência correspondente à pseudo CRISPR espaçadora seja usada em i conjunto com uma combinação de repetição de gene-CRISPR cas funcional, Í 10 como descrito neste pedido. ' Em algumas modalidades, uma célula que é resistente a um áci- do nucleico-alvo ou produto de transcrição do mesmo é projetada tal que a CRISPR espaçadora conferindo imunidade contra o ácido nucleico-alvo ou produto de transcrição do mesmo é inserido em uma célula compreendendo uma combinação de repetição de gene-CRISPR cas funcional, por meio dis- so produzindo a célula resistente ao ácido nucleico-alvo ou produto de trans- crição do mesmo.
Em algumas modalidades adicionais, a sequência de uma ou mais CRISPR espaçadoras ou pseudo CRISPR espaçadoras de uma célula que é resistente a um ácido nucleico-alvo ou produto de transcrição do É mesmo é determinado.
Uma célula-recipiente então é construída tal que compreenda a sequência da CRISPR espaçadora e uma combinação de repetição de gene-CRISPR cas funcional, por meio disso produzindo a célula resistente ao ácido nucleico-alvo ou produto de transcrição do mesmo. . 25 Em algumas modalidades adicionais, uma CRISPR espaçadora de uma célula-recipiente e uma combinação de repetição de gene-CRISPR Fes cas funcional da mesma ou diferente célula (por exemplo, a mesma ou dife- : - rente célula-recipiente) são preparados.
Uma célula-recipiente adicional en- tão é construída tal que compreende a sequência de CRISPR espaçadora e —combinação de repetição de gene-CRISPR cas funcional que por meio disso produzindo a célula resistente ao ácido nucleico-alvo ou produto de transcri- ção do mesmo.
Em algumas modalidades, a resistência é dirigida contra um produto de transcrição da sequência de ácido nucleico-alvo (por exemplo, um transcrito da sequência-alvo de ácido nucleico, especialmente um RNA ou mRNA), um transcrito (por exemplo, um transcrito de RNA de senso ou antissenso), ou um produto de transcrição polipeptídico.
Em algumas modalidades, isto confere resistência a uma célula contra um organismo doador a partir do qual o produto de transcrição é deri- vado.
Em algumas modalidades, a sequência nucleotídica alvo com- —preende DNA ou RNA de origem genômica, sintética ou recombinante. Em algumas modalidades adicionais, a sequência nucleotídica é dupla fita, en- quanto em outra modalidade é de fita simples, se representar a fita de senso ou antissenso ou combinações das mesmas. Ainda em modalidades adicio- nais, a sequência nucleotídica é preparada pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante). Ainda em modalidades adicionais, a sequência nucleotídica é a mesma como uma forma que ocorre naturalmente, enquanto em outras modalidades é derivada da mesma. Ainda em modalidades adicionais, a sequência-alvo de ácido nucleico é derivada de um gene. Em algumas outras modalidades, a sequência-alvo de ácido —nucleico é derivada de um variante, homólogo, fragmento ou derivado de um ' gene. Em algumas modalidades preferenciais, a sequência nucleica-alvo é ou é derivada de bacteriófago. Em algumas modalidades, a sequência nucle- ica-alvo é derivada do DNA plasmidial. Em algumas modalidades, a sequên- cia nucleica-alvo é derivada de um elemento genético móvel. Em algumas . 25 modalidades adicionais, a sequência nucleica-alvo é derivada de um ele- mento transponível ou uma sequência de inserção. Ainda em modalidades MESES adicionais, a sequência nucleica-alvo é derivada de um gene que confere E " resistência. Em algumas modalidades adicionais, a sequência nucleica-alvo é derivada de um gene que confere resistência a um antibiótico ou antimi- —crobiano. Em algumas modalidades, a sequência nucleica-alvo é derivada de um fator de virulência. Em algumas modalidades adicionais, a sequência nucleica-alvo é derivada de uma toxina, uma internalina ou uma hemolisina.
Em algumas modalidades, a sequência nucleica-alvo ou um pro- duto de transcrição da mesma é derivada de uma ou mais bactérias. Dessa maneira, em algumas modalidades preferenciais, a resistência de células bacterianas é modulada usando os métodos e composições da presente in- venção. Em algumas modalidades preferenciais, a sequência nucleotídica alvo é derivada de um gene associado à resistência à transferência de plas- mídeo em bactérias. Em algumas modalidades, uma ou mais CRISPR espa- çadoras na célula são modificadas tal que a CRISPR espaçadora da célula tenha homologia ao CRISPR espaçadora e/ou pseudo CRISPR espaçadora — contida no DNA plasmidial da célula bacteriana, por meio disso fornecendo resistência contra o plasmídeo(s) particular. Dessa maneira, a transferência de DNA estranho na célula é prevenida. Em algumas modalidades preferen- ciais, determinadas regiões no DNA plasmidial são direcionadas, para forne- cer a imunidade contra o DNA plasmidial. Por exemplo, em algumas modali- dades, as sequências na origem de replicação do plasmídeo ou sequências nos genes de codificação das proteínas de codificação são direcionados.
Em algumas modalidades, a presente invenção fornece métodos compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada do DNA Flasmidial de uma célula bac- teriana contra a qual a resistência deve ser modulada; e modificação da se- quência de uma CRISPR espaçadora na célula na qual a resistência deve ser modulada, tal que a CRISPR espaçadora da célula tem homologia à CRISPR espaçadora e/ou pseudo CRISPR espaçadora contida no DNA plasmidial da célula bacteriana. : 25 Ainda em modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula contra a transferência de "E plasmídeo, compreendendo etapas de: identificação de uma CRISPR espa- o çadora e/ou pseudo CRISPR espaçadora derivada de DNA plasmidial; iden- tificação de uma ou mais combinações genéticas cas-repetição de CRISPR funcionais em uma célula que é substancialmente sensível ao plasmídeo; e a engenharia de um ou mais /oci de CRISPR na célula substancialmente sensível tal que compreenda uma ou mais CRISPR espaçadoras e/ou pseu-
do CRISPR espaçadoras a partir do plasmídeo, por meio disso produzindo a célula resistente.
Em algumas modalidades, a sequência nucleotídica alvo é deri- vada de um gene associado com resistência a um ou mais elementos gené- ticosmóveis. Em algumas modalidades, determinadas CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de um ou mais elementos ge- néticos móveis são adicionados em um locux de CRISPR de uma célula pa- ra fornecer resistência contra elementos genéticos móveis (por exemplo, elementos transponíveis e sequências de inserção), dessa forma prevenindo transferência de DNA estranho e deriva genética. Em algumas modalidades, determinadas regiões nos transposons e sequências de inserção são dire- cionadas para fornecer imunidade contra elementos genéticos móveis. Por exemplo, em algumas modalidades-alvo incluem, mas não são limitados a transposons conjugados (Tn976), transposons de classe Il (Tn501), sequên- ciasdeinserção (IS26) e genes de transposase.
Em algumas modalidades, a presente invenção fornece métodos compreendendo etapas de: identificação de uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de um ou mais elementos genéticos móveis de uma célula contra a qual a resistência deve ser modulada; e mo- ' 20 —dificação da sequência de uma CRISPR espaçadora em uma célula na qual a resistência deve ser modulada tal que a CRISPR espaçadora e/ou pseudo CRISPR espaçadora da célula tenham homologia ao CRISPR espaçadora contido no elemento(s) genético móvel da célula.
Ainda em algumas modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula contra um ou mais elementos genéticos móveis compreendendo etapas de: identificação de Fa uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de um F ou mais elementos genéticos móveis; identificação de uma ou mais combi- nações funcionais de repetição-cas CRISPR em uma célula que é substan- cialmente sensível a um ou mais elementos genéticos móveis; e engenharia de um ou mais /oci de CRISPR na célula substancialmente sensível tal que compreendam ou tenham homologia a uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras de um ou mais elementos genéticos mó- veis para produzir a célula resistente.
Em algumas modalidades, a sequência nucleotídica alvo é deri- vada de um gene associado com a resistência a antibióticos e/ou antimicro- bianos.
Como usado neste pedido, o termo "antimicrobiano" refere-se a qualquer composição que mata ou inibe o crescimento ou reprodução de micro-organismos.
É destinado que o termo englobe antibióticos (isto é, composições produzidas por outros mMicro-organismos), bem como composi- ções sinteticamente produzidas.
Genes de resistência antimicrobiana inclu- em, mas não são limitados a Pl&tem, blaror, blâshv, aadB, aacCl, aacC2, a- acC3, aacA4, mecA, vanA, vanH, vanX, satA, aacA-aphH, vat, vga, msrA sul e/ou int.
Genes de resistência antimicrobiana incluem aqueles que são obti- dos a partir de espécies bacterianas que incluem mas não são limitadas aos gêneros Escherichia, Klebsiella, Pseudomonas, Proteus, Streptococcus, Staphylococcus, Enterococcus, Haemophilus e Moraxella.
Os genes de re- sistência antimicrobiana também incluem aqueles que são obtidos a partir de espécies bacterianas que incluem mas não são limitadas a Escherichia coli, Klebsiella pneumoniae, Pseudomonas aeruginosa, Proteus mirabilis, Strep- tococcus pneumoniae, Staphylococcus aureus, Staphylococcus epidermidis, —Enterococcus faecalis, Staphylococcus saprophyticus, Streptococcus pyoge- nes, Haemophilus influenzae e Moraxella catarrhalis.
Em algumas modalida- des, determinadas CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de genes de codificação de resistência antimicrobiana são adicio- nadas em um focux de CRISPR de uma célula-recipiente, sob condições tais : 25 quea transferência de genes de resistência seja prevenida.
Dessa maneira, O risco de aquisição de genes de resistência antimicrobiana (isto é, marcado- e res) é reduzido.
Em algumas modalidades, alvos também incluem vanR, (is- À ; to é, resistência à vancomicina), tetR (isto é, resistência à tetraciclina) e/ou fatores de resistência que fornecem resistência à beta-lactamase.
Em algumas modalidades, a presente invenção fornece métodos compreendendo etapas de: identificação de uma ou mais CRISPR espaça- doras e/ou pseudo CRISPR espaçadoras derivadas de uma célula que com-
preende um ou mais genes ou marcadores de resistência antimicrobiana; e modificação da sequência de CRISPR espaçadora em uma célula que não compreende ou não expressa os genes de resistência antimicrobiana ou marcadores tais que a CRISPR espaçadora da célula tenha homologia a umaoumaisCRISPR espaçadoras e/ou pseudo CRISPR espaçadoras con- tidas na célula que compreende um ou mais genes ou marcadores de resis- tência antimicrobiana.
Ainda em algumas modalidades adicionais, a presente invenção : fornece métodos para modulação da aquisição de marcadores de resistência —antimicrobiana em uma céluia compreendendo etapas de: identificação de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras deri- vadas de uma célula que compreende um ou mais genes ou marcadores de resistência antimicrobiana; identificação de um ou mais loci de CRISPR em uma célula que não compreende ou não expressa genes ou marcadores de resistência antimicrobiana; e modificação da sequência da CRISPR espaça- dora na célula que não compreende ou não expressa genes ou marcadores de resistência antimicrobiana tal que a CRISPR espaçadora e/ou pseudo CRISPR espaçadoras tenham homologia a CRISPR espaçadora contida na célula resistente à transferência de genes conferindo resistência a um ou mais antimicrobianos.
Em algumas modalidades, a sequência nucleotídica alvo é deri- vada de pelo menos um gene associado com fator(es) de virulência. Em al- gumas modalidades, determinadas CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de genes que codificam fatores de virulên- ; 25 ciasão adicionadas em um /ocux de CRISPR bacteriano para fornecer a re- sistência contra transferência de genes conferindo virulência às bactérias.
E Em algumas modalidades, fatores que comumente contribuem para a viru- o lência microbiana (por exemplo, em agentes patogênicos) são direcionados, tais como toxinas, internalinas, hemolisinas e outros fatores de virulência.
A presente invenção também fornece métodos compreendendo etapas de: identificação de uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçadoras derivadas de uma célula que compreende um ou mais fatores de virulência; e modificação da sequência do CRISPR espaçadora em uma célula que não compreende ou não expressa fator(es) ou marca- dor(es) de virulência tais que a CRISPR espaçadora da célula tenha homo- logia a uma ou mais CRISPR espaçadoras e/ou pseudo CRISPR espaçado- rascontidas na célula que compreende um ou mais fatores de virulência.
Ainda em modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula contra um ou mais fator(es) ou marcador(es) de virulência compreendendo etapas de: identificação de : uma CRISPR espaçadora e/ou pseudo CRISPR espaçadora derivada de um ou mais faior(es) ou marcador(es) de virulência; identificação de uma ou mais combinações funcionais de repetição CRISPR-cas em uma célula que é substancialmente sensível a um ou mais fator(es) ou marcador(es) de viru- lência; e a engenharia de um ou mais loci de CRISPR na célula substanci- almente sensível tal que compreendam uma ou mais CRISPR espaçadoras e/oupseudo CRISPR espaçadoras de um ou mais fator(es) ou marcador(es) de virulência para produzir a célula resistente.
A presente invenção engloba o uso de variantes, homólogos, derivados e fragmentos dos mesmos, incluindo variantes, homólogos, deri- vados e fragmentos de /oci de CRISPR, CRISPR espaçadoras, pseudo CRISPR espaçadoras, genes ou proteínas cas, repetições de CRISPR, combinações gênicas de repetição de CRISPR-cas funcionais e sequências alvo de ácidos nucleicos ou produtos de transcrição dos mesmos.
O termo "variante" é usado para significar um polipeptídeo que ocorre naturalmente ou sequências nucleotídicas que se diferenciam de uma . 25 — sequência de tipo selvagem. O termo "fragmento" indica que a sequência nucleotídica ou po- Feed lipeptídeo compreende uma fração de uma sequência de tipo selvagem. Po- N-- de compreender uma ou mais seções grandes contíguas da sequência ou uma pluralidade de pequenas seções. A sequência também pode compre- —ender outros elementos da sequência, por exemplo, pode ser uma proteína de fusão com outra proteína. Preferencialmente a sequência compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferenci-
almente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferen- —cialmente pelo menos 99% da sequência de tipo selvagem.
Preferencialmente, o fragmento conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferenci- almente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferenci- ú 10 almente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
Preferencialmente, uma CRISPR espaçadora ou pseudo CRIS- PR espaçadora compreendem pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferenci- almente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem.
Preferencialmente, uma CRISPR espaçadora conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais prefe- “ — rencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica detipo selvagem.
Preferencialmente, um gene cas compreende pelo menos 50%, ' mais preferencialmente pelo menos 65%, mais preferencialmente pelo me- - nos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferenci- —almente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo me- nos 99% da sequência de tipo selvagem.
Preferencialmente, um gene cas conserva atividade de 50%, mais preferencialmente 60%, mais preferencial- mente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmen- te 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% sequência polipeptídica ou nucleotídica de tipo selvagem. Preferencialmente, uma proteína Cas compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencial- À 10 mente pelo menos 90%, mais preferencialmente pelo menos 95%, mais pre- ferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, uma proteí- na Cas conserva atividade de 50%, mais preferencialmente 60%, mais prefe- rencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais prefe- rencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
Preferencialmente, uma repetição de CRISPR compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencial- mente pelo menos 80%, mais preferencialmente pelo menos 85%, mais pre- ferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo me- . 25 nos 97%, mais preferencialmente pelo menos 98%, ainda mais preferenci- almente pelo menos 99% da sequência de tipo selvagem. Preferencialmen- aaa te, uma repetição de CRISPR conserva atividade de 50%, mais preferenci- : " almente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmente 90%, mais preferenci- almente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
Preferencialmente, uma combinação funcional de repetição CRISPR-cas compreende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencial mente pelo menos 85%, mais preferencialmente pelo menos 90%, mais pre- ferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencialmente pelo menos 97%, mais preferencialmente pelo me- nos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, a combinação funcional de repetição de CRISPR-cas conserva atividade de 50%, mais preferencialmente 60%, mais t 10 —preferencialmente 70%, mais preferencialmente 80%, mais preferencialmen- te 85%, mais preferencialmente 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmen- te 98%, ou ainda mais preferencialmente de 99% da sequência polipeptídica ou nucleotídica de tipo selvagem.
Preferencialmente, uma sequência-alvo de ácido nucleico com- preende pelo menos 50%, mais preferencialmente pelo menos 65%, mais preferencialmente pelo menos 80%, mais preferencialmente pelo menos 85%, mais preferencialmente pelo menos 90%, mais preferencialmente pelo menos 95%, mais preferencialmente pelo menos 96%, mais preferencial- mente pelo menos 97%, mais preferencialmente pelo menos 98%, ainda mais preferencialmente pelo menos 99% da sequência de tipo selvagem. Preferencialmente, uma sequência-alvo de ácido nucleico conserva atividade de 50%, mais preferencialmente 60%, mais preferencialmente 70%, mais preferencialmente 80%, mais preferencialmente 85%, mais preferencialmen- E 25 te 90%, mais preferencialmente 95%, mais preferencialmente 96%, mais preferencialmente 97%, mais preferencialmente 98%, ou ainda mais prefe- iaaaa rencialmente 99% da sequência polipeptídica ou nucleotídica de tipo selva- E gem.
Em algumas modalidades, o fragmento é um fragmento funcio- nal. Por um "fragmento funcional" de uma molécula é entendido um fragmen- to conservando ou possuindo substancialmente a mesma atividade biológica que a molécula intacta. Em todos os exemplos, um fragmento funcional de uma molécula conserva pelo menos 10% e pelo menos aproximadamente 25%, aproximadamente 50%, aproximadamente 75%, aproximadamente 80%, aproximadamente 85%, aproximadamente 90%, aproximadamente 95%, aproximadamente 96%, aproximadamente 97%, aproximadamente 98%, ouaproximadamente 99% da atividade biológica da molécula intacta.
O termo "homólogo" significa uma entidade que tem certa homo- logia com as sequências objeto de aminoácido e as sequências objeto nu- cleotídicas.
Aqui, o termo "homologia" pode ser igualado com "identidade". No presente contexto, uma sequência homóloga é tomada para f 10 incluir uma sequência de aminoácido, que pode ser pelo menos 75, 85 ou 90% idênticas, preferencialmente pelo menos 95%, 96%, 97%, 98% ou 99% idênticas à sequência objeto.
Embora a homologia também possa ser consi- derada em termos de similaridade (isto é, resíduos de aminoácidos que têm propriedades/funções químicas similares), no contexto da presente invenção é preferencial para expressar homologia em termos de identidade de se- quência.
No presente contexto, uma sequência homóloga é tomada para incluir uma sequência nucleotídica, que pode ser pelo menos 75, 85 ou 90% idêntica, preferencialmente pelo menos 95%, 96%, 97%, 98% ou 99% idênti- casà sequência objeto.
Embora a homologia também possa ser considerada em termos de similaridade (isto é, resíduos de aminoácidos tendo proprieda- des/funções químicas similares), no contexto da presente invenção é prefe- rencial para expressar homologia em termos de identidade de sequência.
Comparações de homologia podem ser conduzidas pelos olhos, i 25 oumais normalmente, com a ajuda de programas de comparação de se- quência prontamente disponíveis.
Estes programas de computador comerci- oo almente disponíveis podem calcular a % de homologia entre duas ou mais hp sequências.
Porcentagem (%) de homologia pode ser calculada nas sequên- cias contíguas (isto é, uma sequência é alinhada com outra sequência e ca- da aminoácido em uma sequência é diretamente comparado com o aminoá- cido correspondente na outra sequência, um resíduo de cada vez). Isto é chamado um alinhamento "sem lacunas”, Tipicamente, tais alinhamentos sem lacunas são realizados somente em um número relativamente pequeno de resíduos.
Embora isto seja um método muito simples e consistente, não leva em consideração que, por exemplo, em um par de sequências de outra maneira idêntico, uma inserção ou deleção causará que os seguintes resí- duos de aminoácido sejam postos fora do alinhamento, dessa forma poten- cialmente resultando em uma grande redução na % de homologia quando um alinhamento global é realizado.
Consequentemente, a maioria dos méto- : 10 dos de comparação de sequência são desenhados para produzir alinhamen- tos ótimos que levam em consideração possíveis inserções e deleções sem impor penalidade indevidamente ao escore de homologia total.
Isto é alcan- çado pela inserção de "lacunas" no alinhamento da sequência para tentar maximizar a homologia local.
Entretanto, estes métodos mais complexos denominados "pena- lidades de lacuna" a cada lacuna que ocorre no alinhamento para que, para o mesmo número de aminoácidos idênticos, um alinhamento de sequência com tantas lacunas quanto possível - refletindo maior relação entre duas sequências comparadas — alcançarão um maior escore do que uma com muitas lacunas. "Atribuição de custos de lacuna" são tipicamente usados nessa carga um custo relativamente alto da existência de uma lacuna e uma penalidade menor por cada resíduo subsequente na lacuna.
Este é o siste- ma de pontuação de lacuna ainda mais comumente usado.
As penalidades maiores de lacuna produzirão naturalmente alinhamentos otimizados com " 25 menos lacunas.
A maioria dos programas de alinhamento permitem às pena- lidades de lacuna serem modificadas.
Entretanto, é preferencial para usar os 2 RNA valores padrão quando usando tal programa para comparações de sequên- " cia.
Por exemplo, usando pacote de GCG Wisconsin Bestfit, a penalidade de lacuna padrão para sequências de aminoácido é -12 para uma lacuna e -4 —paracada extensão.
O cálculo da % de homologia máxima, por isso, primeiramente necessita de produção de um alinhamento ótimo, levando em consideração penalidades de lacuna.
Um programa de computador adequado para execu- tar tal alinhamento é pacote GCG Wisconsin Bestfit (University of Wisconsin, U.S.A.; Devereux et al., 1984, Nucleic Acids Research 12:387). Exemplos de outros programas que podem realizar comparações de sequência incluem, mas não são limitados ao pacote BLAST (vide Ausubel et a/., 1999 ibid - Chapter 18), FASTA (Atschul et a/., 1990, J.
Mol.
Biol., 403-410), a suíte GENEWORKS de instrumentos de comparação e CLUSTAL.
Ambos BLAST e FASTA estão disponíveis para busca offline e online (vide Ausubel et a/., 1999 ibid, pages 7-58 a 7-60). Entretanto, para algumas aplicações, é prefe- Í 10 —rencial usar o programa GCG Bestfit.
Um nova ferramenta, chamada BLAST 2 Sequences também está disponível para comparação de sequência protei- ca e nucleotídica (vide FEMS Microbiol Lett 1999 174 (2): 247-50; FEMS Mi- crobiol Lett 1999 177 (1):187-8). Embora a % de homologia final possa ser medida em termos de identidade, o próprio processo de alinhamento não é tipicamente baseado em uma comparação de par tudo ou nada.
Em vez disso, uma matriz de es- core de similaridade escalada é geralmente usada que destina o grande nú- mero a cada comparação aos pares baseada em semelhança química ou distância evolutiva.
Um exemplo de tal matriz comumente usada é a matriz "BLOSUMG6?2 - a matriz padrão do pacote de programas BLAST.
Programas de GCG Wisconsin geralmente usam os valores padrão públicos ou uma tabela de comparação de símbolo adaptado se fornecida (vide manual de usuário para detalhes adicionais). Para algumas aplicações, é preferencial para usar os valores adaptados públicos para o pacote GCG, ou em caso de . 25 —outroprograma, a matriz adaptada - tais como BLOSUMG6?2. Uma vez que o programa produziu um alinhamento ótimo, é E possível calcular a % de homologia, preferencialmente % de identidade de : - sequência.
O programa tipicamente faz isto como parte da comparação de sequência e gera um resultado numérico.
Penalidades de Lacuna deveriam ser usadas quanto a determi- nação de identidade de sequência, então apropriadamente os seguintes pa- râmetros são usados:
| ABERTURADALACENA o [o | LO ENENSÃODALACOENA [6 [ PARACISTA —T DNE [rPROTENA| [IAMANHODAPALAVRA | 2 | 1 [TBoK | | PENALIDADE DA LACUNA | to [o 1 | eTENSÃoDATACUNA [or [or Para comparação de sequência polipeptídica, as seguintes con- figurações podem ser usadas: penalidade de criação de LACUNA de 3,0 e penalidade de extensão de LACUNA de 0,1. Apropriadamente, o grau da — identidade com respeito a uma sequência de aminoácidos é determinado em pelo menos 5 aminoácidos contíguos, determinados em pelo menos 10 ami- noácidos contíguos, em pelo menos 15 aminoácidos contíguos, em pelo me- nos 20 aminoácidos contíguos, em pelo menos 30 aminoácidos contíguos, em pelo menos 40 aminoácidos contíguos, em pelo menos 50 aminoácidos — contíguos, ou em pelo menos 60 aminoácidos contíguos.
As sequências também podem ter deleções, inserções ou substi- tuições de resíduos de aminoácido, que produzem uma modificação silen- Ciosa e resultam em uma substância funcionalmente equivalente. As substi- tuições de aminoácido deliberadas podem ser feitas com base na semelhan- çaem polaridade, carga, solubilidade, hidrofobicidade, hidrofilicidade, e/ou a natureza anfipática dos resíduos enquanto a atividade de ligação secundária da substância é conservada. Por exemplo, aminoácidos negativamente car- regados incluem ácido aspártico e ácido glutâmico; aminoácidos positiva- mente carregados incluem lisina e arginina; e aminoácidos com grupos dian- : 20 teiros polares não carregados que têm valores de hidrofilicidade similares À incluem leucina, isoleucina, valina, glicina, alanina, asparagina, glutamina, : serina, treonina, fenilalanina e tirosina.
Substituições conservativas podem ser feitas, por exemplo, de acordo com a tabela abaixo. Aminoácidos no mesmo bloco na segunda co- luna e preferencialmente na mesma linha na terceira coluna podem ser substituídos um pelo outro:
ALIFÁTICO Não-polar | GAP o e ERC Polar sem carga
E ITR Polar com carga | "pg
A Aro [O A EWÇY A presente invenção também engloba a substituição homóloga (substituição e reposição são ambas usadas neste pedido para significar o é intercâmbio de um resíduo de aminoácido existente, com um resíduo alter- nativo) pode ocorrer, isto é substituição similar para similar - tal como básico para básico, acídico para acídico, polar para polar etc. Substituição não- homóloga também pode ocorrer, isto é de uma classe de resíduo para outra ou alternativamente envolvendo a inclusão de aminoácidos não-naturais - tais como ornitina (a seguir mencionado como Z), ornitina de ácido diamino- butírico (a seguir mencionado como B), ornitina norleucina (a seguir mencio- nadocomooO), pirilalanina, tienilalanina, naftilalanina e fenilglicina.
As substituições que também podem ser feitas por aminoácidos não-naturais incluem; aminoácidos alfa* e alfa-dissubstituídos*, N-alquil ami- noácidos*, ácido láctico”, derivados de haleto de aminoácidos naturais - tais como trifluorotirosina”, p-Cl-fenilalanina”, p-Br-fenilalanina*, p-I-fenilalanina”*, L-alil-glicina*, B-alanina*, ácido L-a-amino butírico”, ácido L-D-amino butíri- co”, ácido L-a-amino isobutírico*, ácido L-e-amino caproicot, ácido 7-amino heptanoico*, L-metionina sulfonatt*, L-norleucina”, L-norvalina*, p-nitro-L- fenilalanina”, L-hidroxiprolinat, L-tioprolina”, derivados metila de fenilalanina . (Phe) - tais como 4-metil-Phe*, pentametil-Phe*, L-Phe(4-amino)t, L-Tyr (metil)', L-Phe (4-isopropil)*, L-Tic(ácido 1,2,3,4-tetra-hidroisoquinolina-3- Ê ; carboxil)”, ácido L-diaminopropiônicot! e L-Phe (4-benzil)*. A notação * foi - utilizada com o objetivo da discussão acima (relacionando-se com substitui- ção homóloga ou não-homóloga), para indicar a natureza hidrofóbica do de- rivado ao passo que t foi utilizada para indicar que a natureza hidrofílica do derivado, it" indica características anfipáticas. As sequências de aminoácidos variantes incluem grupos espa-
çadores adequados que são adequados para a inserção inserida entre quaisquer dois resíduos de aminoácido da sequência incluindo grupos alqui- la - tais como grupos metila, etila ou propila - além de espaçadores de ami- noácido - tais como glicina ou resíduos de B-alanina. Uma forma adicional da variação envolve a presença de um ou mais resíduos de aminoácidos na forma de peptoide será bem entendido por aqueles versados na técnica. Pa- ra evitar dúvida, "a forma peptoide" é usada para referir-se a resíduos de aminoácido de variantes em que o grupo a-carbono substituinte está no á- tomo de nitrogênio do resíduo em vez do a-carbono. Processos para prepa- "ração de peptídeos na forma de peptoide são bem conhecidos na técnica.
As sequências nucleotídicas para uso na presente invenção po- dem incluir dentro delas nucleotídeos sintéticos ou modificados. Diversos tipos diferentes da modificação de oligonucleotídeos são conhecidas na téc- nica. Estes incluem estruturas principais de metifosfonato e fosforoticoato e/oua adição de cadeias acridina ou polilisina nas extremidades 3' e/ou 5' da molécula. Para os objetivos da presente invenção, deve ser entendido que as sequências nucleotídicas podem ser modificadas por qualquer método disponível na técnica. Tais modificações podem ser realizadas para aumen- tar atividade in vivo ou tempo de vida das sequências nucleotídicas úteis na presente invenção.
CRISPRs CRISPRs (Repetições Palindrômicas Curtas Agrupadas Regu- larmente Intercaladas); também conhecidas como SPIDRs (Repetições Dire- tas Intercaladas por Espaçadores) constituem uma família de /oci de DNA " 25 recentemente descrita que são normalmente específicas para uma determi- nada espécie bacteriana. O locux de CRISPR é uma classe distinta de repe- " tições de sequência curtas intercaladas (SSRs) que foram primeiro reconhe- : cidas em E. coli (Ishino et a/, J. Bacteriol., 169:5429-5433 [1987]; e Nakata et al., J. Bacteriol., 171:3553-3556 [1989]). SSRs similares intercaladas foram identificadas em Haloferax mediterranei, Streptococcus pyogenes, Anabaena i e Mycobacterium tuberculosis (Vide, Groenen et al, Mol. Microbiol., 10: 1057-1065 [1993]; Hoe et al, Emerg. Infect. Dis., 5:254-263 [1999]; Masepohi et al, Biochim. Biophys. Acta 1307:26-30 [1996]; e Mojica et a/, Mol. Microbi- Ol., 17:85-98 [1995]). O /oci de CRISPR diferencia-se de outras SSRs pela estrutura das repetições, que foram denominadas repetições curtas regular- mente intercaladas (SRSRs) (Janssen et al, OMICS J. Integ. Biol., 6:23-33
[2002]; e Mojica et al, Mol. Microbiol., 36:244-246 [2000]). As repetições são elementos curtos que ocorrem em grupos que são sempre regularmente es- paçados por sequências intervenientes únicas com um tamanho constante (Mojica et al, [2000], supra). Embora as sequências repetidas sejam alta- mente conservadas entre cepas, o número de repetições intercaladas e se- | 10 —quências das regiões espaçadoras diferenciam-se de cepa para cepa (van Embden et al, J. Bacteriol., 182:2393-2401 [2000]).
Loci de CRISPR consistem de repetições curtas e altamente conservadas parcialmente palindrômicas de DNA tipicamente de 24 a 40 bp, contendo repetições inversas internas e terminais de até 11 bp. Estas repeti- ções foram relatadas ocorrendo de 1 a 140 vezes. Embora os elementos isolados tenham sido detectados, são geralmente arranjados em grupos (até aproximadamente 20 ou mais por genoma) de unidades repetidas espaça- das pela intervenção única de sequências de 20 a 58 bp. Até agora, até 20 loci de CRISPR distintos foram encontrados dentro de um cromossomo úni- co * CRISPRs são geralmente homogêneas em um dado genoma com a maioria delas sendo idênticas. Entretanto, há exemplos de heteroge- neidade em, por exemplo, Archaea (Mojica et al, [2000], supra).
Como usado neste pedido, o termo "Jocux de CRISPR" refere-se ; 25 —aosegmento de DNA que inclui todas as repetições de CRISPR, começando com o primeiro nucleotídeo da primeira repetição de CRISPR e terminam - com o último nucleotídeo da última repetição de CRISPR (terminal). : Embora a função biológica do loci de CRISPR Seja desconheci- da, algumas hipóteses foram propostas. Por exemplo, foi proposto que pos- sam estar envolvidas na ligação do cromossomo a uma estrutura celular, ou na replicação de cromossomo e na partição de réplicon (Jansen et a/., O- MICS 6:23-33 [2002]; Jansen et a/, Mol. Microbiol., 43: 1565-1575 [2002]; e
Pourcel et al., Microbiol., 151:653-663 [2005]). Mojica et al., (Mojica et al., J.
Mol.
Evol., 60: 174-182 [2005]) hipotetizam que CRISPR pode estar envolvi- da na conferência de imunidade específica contra DNA estranho e Pourcel et al. (supra) hipotetizam que CRISPRs são estruturas que são capazes de tomar partes de DNA estranho como parte de um mecanismo de defesa.
Bolotin et al. (supra) sugerem que elementos CRISPR espaçadoras sejam traços de invasões passadas por elementos extracromossomais, e hipoteti- zam que fornecem uma célula imune contra a infecção de fago, e mais ge- ralmente expressão de DNA estranho, pela codificação de um RNA de antis- senso.
Bolotin et al. (supra) também sugerem que genes cas sejam neces- sários para a formação de CRISPR.
Entretanto, não é destinado que a pre- sente invenção seja limitada a qualquer determinado mecanismo, função, teoria, nem meios da ação.
O genoma do Streptococcus thermophilus LMGI 8311 contém 3 focide CRISPR; as sequências repetidas 36-bp são diferentes em CRISPR1 (34 repetições), CRISPR2 (5 repetições), e CRISPR3 (uma sequência úni- ca). No entanto, são perfeitamente conservadas dentro de cada locux.
Repe- tições de CRISPR1 e CRISPR2 são respectivamente intercaladas por 33 e 4 sequências de 30 bp em tamanho.
Todas estas sequências intercalantes são diferentes uma da outra.
São também diferentes das encontradas na cepa CNRZ1066 (41 sequências intercalantes no CRISPR1) e na cepa LMD-9 (16 no CRISPR1 e 8 no CRISPR3), as quais ambas são de S. thermophilus.
Vários métodos para identificação de f/oci de CRISPR são co- nhecidos na técnica.
Por exemplo, Jensen et al. (Jensen et al., [2002], supra) E: 25 descrevem uma abordagem baseada em computador na qual sequências nucleotídicas são buscadas em motivos CRISPR usando o programa r PATSCAN no servidor de Divisão de Matemática e Ciências da Computação " no Laboratório Nacional de Argonne, Argonne, IL, USA.
O algoritmo que foi usado para identificar motivos de CRISPR foi P1 = a...bc... dplc...dpic...dp1, ondeae bforam o limite de tamanho inferior e superior da repetição e pt e c - e d foram o limite de tamanho inferior e superior das sequências espaçado- ras.
Os valores de a, bp ced podem ser variados de aproximadamente 15 a aproximadamente 70 bp em incrementos de aproximadamente 5 bp. Em al- gumas modalidades preferenciais, /oci de CRISPR são identificados usando "dotplots" (por exemplo, usando o programa de computador Dotter). Qualquer método adequado conhecido na técnica encontra uso na análise de semelhança de sequência. Por exemplo, a análise pode ser realizada usando NCBI BLAST com um banco de dados de genomas micro- bianos e GenBank, como conhecido na técnica. Além disso, as sequências nucleotídicas, incluindo aquelas fornecidas neste pedido, estão incluídas em bancos de dados (por exemplo, GenBank ou sítio na internet de genoma : 10 JGI). Como usado neste pedido, "a inontante" significa na direção 5' e "a jusante" significa na direção 3º. Em modalidades adicionais, os métodos da presente invenção utilizam procedimentos de amplificação (Vide, por exemplo, Mojica et al,
[2005], supra; e Pourcel et al., [2005], supra). À amplificação da região de DNA desejada pode ser realizada por qualquer método conhecido na técni- Ca, incluindo a reação em cadeia da polimerase (PCR). "Amplificação" refe- re-se à produção de cópias adicionais de uma sequência de ácido nucleico. Isto é geralmente realizado usando tecnologias de PCR bem conhecidas na técnica. A "reação em cadeia da polimerase" ("PCR") é bem conhecida por aqueles na técnica. Na presente invenção, os iniciadores oligonucleotídicos É são desenhados para uso em reações PCR para amplificação de todo ou parte de um /ocux de CRISPR,. O termo "iniciador" refere-se a um oligonucleotídeo, ocorrendo naturalmente como em uma digestão por restrição purificada ou produzida E 25 sinteticamente, que é capaz de atuação como um ponto de iniciação de sín- tese quando colocado sob condições nas quais a síntese de um produto de - extensão de iniciador que é complementar a um filamento de ácido nucleico á é induzida (isto é, na presença de nucleotídeos e um agente de indução - tal como DNA polimerase e a uma temperatura e pH adequados). Em algumas modalidades, o iniciador é de filamento Simples para a eficiência máxima na é amplificação, embora em outras modalidades, o iniciador seja filamento du- plo. Em algumas modalidades, o iniciador é um oligodesoxirribonucleotídeo.
Ti O iniciador deve ser suficientemente longo para iniciar a síntese de produtos de extensão na presença do agente de indução.
O tamanho exato dos inici- adores depende de muitos fatores, incluindo temperatura, fonte de iniciador, e o uso do método.
Iniciadores de PCR são tipicamente pelo menos aproxi- —madamente 10 nucleotídeos no tamanho, e ainda mais tipicamente pelo me- nos aproximadamente 20 nucleotídeos no tamanho.
Métodos para desenho e condução da PCR são bem conhecidos na técnica, e incluem, mas não são limitados a métodos usando iniciadores pareados, iniciadores aninhados ("nested primers"), iniciadores específicos únicos, iniciadores degenerados, iniciadores específicos para o gene, iniciadores específicos para o vetor, ini- ciadores parcialmente mal combinados, etc.
Em algumas modalidades preferenciais da presente invenção, um locux de CRISPR ou uma porção do mesmo de uma bactéria parental e uma bactéria marcada são comparados usando qualquer método adequado conhecido na técnica.
Em algumas modalidades preferenciais da presente invenção, o locux de CRISPR ou uma porção do mesmo da bactéria parental e a bactéria marcada são comparados pela amplificação do locux de CRIS- PR ou uma porção do mesmo.
Além de métodos de amplificação por cicla- gem bem conhecidos (por exemplo, PCR, reação em cadeia da ligase, etc.) Outros métodos, incluindo, mas não limitados a métodos de amplificação É isotérmicos encontram uso na presente invenção.
Métodos de amplificação isotérmicos bem conhecidos que encontram uso na presente invenção inclu- em, mas não são limitados a amplificação de deslocamento de fita (SDA), Q- beta-replicase, amplificação de sequência com base no ácido nucleico E 25 —(NASBA), e replicação de sequência autossustentada.
Em algumas outras modalidades preferenciais da presente in- - venção, o focux de CRISPR ou uma porção do mesmo da bactéria parental e . bactéria marcada são comparados sequenciando o da presente invenção, locux de CRISPR ou uma porção do mesmo a partir da bactéria parental e a bactéria marcada são comparados pela amplificação e então sequenciamen- A to dos /oci de CRISPR ou uma porção dos mesmos.
Em algumas modalida- des, extremidades dos /oci de CRISPR são comparadas, enquanto em ou-
tras modalidades, ambas as extremidades 5' e 3' dos /oci são comparadas.
Em algumas modalidades preferenciais, extremidades (por exemplo, extre- midade 5') dos Joci de CRISPR são comparadas.
Ainda em outras modalida- des, pelo menos as últimas repetições de CRISPR na extremidade 3 do /o- —cuxde CRISPR e/ou pelo menos a última CRISPR espaçadora (por exem- plo, o núcleo da última CRISPR espaçadora) na extremidade 3' do locux de CRISPR e/ou pelo menos a primeira repetição de CRISPR na extremidade 5' do locux de CRISPR e/ou pelo menos o primeiro CRISPR espaçadora (por exemplo, o primeiro núcleo da CRISPR espaçadora) na extremidade 5' do locuxde CRISPR são comparados.
Em algumas modalidades preferenciais, pelo menos a primeira repetição de CRISPR na extremidade 5' do locux de CRISPR e/ou pelo menos a primeira CRISPR espaçadora (por exemplo, o primeiro núcleo da CRISPR espaçadora) na extremidade 5' do l/ocux de CRISPR são comparados.
Em algumas modalidades preferenciais adicio- nais, pelo menos a última CRISPR espaçadora (por exemplo, o núcleo da última CRISPR espaçadora) na extremidade 3' do locux de CRISPR e/ou pelo menos a primeira CRISPR espaçadora (por exemplo, o primeiro núcleo de CRISPR espaçadora) na extremidade 5' do locux de CRISPR são compa- rados.
Em algumas modalidades adicionais preferenciais, pelo menos a pri- meira CRISPR espaçadora (por exemplo, o primeiro núcleo de CRISPR es- paçadora) nas extremidades 5' do locide CRISPR são comparados.
Em algumas modalidades, os /oci de CRISPR compreendem DNA, enquanto em outras modalidades, os /oci de CRISPR compreendem RNA.
Em algumas modalidades, o ácido nucleico é de origem genômica, : 25 enquanto em outras modalidades, é de origem sintética ou recombinante.
Em algumas modalidades, os /oci de CRISPR são de filamentos duplos, en- f quanto em outras modalidades, são de filamentos simples, se representar o : " filamento de senso ou antissenso ou combinações das mesmas.
Em algu- mas modalidades, /oci de CRISPR são preparados pelo uso de técnicas de SO — DNA recombinante (por exemplo, DNA recombinante), como descrito neste . pedido.
A presente invenção também fornece métodos para geração de variantes de CRISPR. Estas variantes são expressas, isoladas, clonadas, e/ou sequenciadas usando qualquer método adequado conhecido na técni- ca. Em algumas modalidades particularmente preferenciais, as variantes CRISPR são cepas mutantes resistentes ao fago que têm um Jocux de —CRISPR modificado com um espaçador adicional. Em algumas modalidades adicionais, estas variantes encontram uso para objetivos com detec- ção/identificação de alvos, ou para resistência construída contra moléculas de ácidos nucleicos. Ainda em modalidades adicionais, estas variantes en- contram uso no desenvolvimento de agentes de biocontrole.
No contexto da presente invenção, o locux de CRISPR é orien- tado como descrito abaixo. O líder de CRISPR é um segmento de DNA con- servado de tamanho definido. A orientação do /ocux de CRISPRI de S. ther- mophilus é estabelecida usando as seguintes características: A posição relativa de CRISPR aos genes cas vizinhos (sequências associadas a CRISPR); CRISPR1 é localizada a jusante de 4 genes cas (genes str0657, sStr0O658, strO659, e stro660 na sequência cromossomal! CNRZ1066); Esta sequência repetida tem o potencial para formar um grampo de estrutura secundária, embora não seja totalmente palindrômica, e a se- quência complementar reversa; (S-GTTGTACAGTTACTTAAATCTTGAGAGTACAAAAAC-3; SEQ ID NO:695) é diferente da sequência direta (5- GTTTITGTACTCTCAAGATTTAAGTAACTGTACAAC-3'; SEQ !D NO:1). Geralmente a extremidade 5' da sequência direta é mais rica em nucleotí- deos G e T do que a extremidade 5' da sequência complementar reversa.
; 25 — Além disso, como o pareamento de base de G-T é melhor do que o parea- mento de base de A-C, a estrutura de grampo é geralmente mais forte no - filamneto; e ass Como usado neste pedido, a posição da repetição terminal é a repetição da extremidade que mostra que a variação de sequência na sua extremidade 3' é geralmente a repetição terminal.
" O líder de CRISPR é um segmento de DNA conservado de ta- manho definido que é localizado imediatamente a montante da primeira re-
petição. Por exemplo, a sequência líder de CRISPR1 de S. thermophilus é o segmento de DNA que começa imediatamente após o códon de parada do gene str066O, e termina logo antes da primeira repetição. O líder de CRISPR está localizado na extremidade 5' do locux de CRISPR. O líder de CRISPR está localizado imediatamente a montante da primeira repetição de CRISPR do locux de CRISPR.
O reboque de CRISPR é um segmento de DNA conservado de tamanho definido, que está localizado imediatamente a jusante da repetição terminal. Por exemplo, a sequência de reboque de CRISPR1 de S. thermo- philus é o segmento de DNA que começa imediatamente após repetição terminal, e termina logo antes do códon de parada do gene str0661 (locali- zado no filamento de DNA oposta). O reboque de CRISPR é localizado na extremidade 3' do locux de CRISPR. O reboque de CRISPR está localizado imediatamente a jusante da repetição terminal.
Por exemplo, sequências líder de CRISPR e reboque de CRIS- PR no locux de CRISPR1 da cepa Streptococcus thermophilus CNRZIO66 são: Líder de CRISPR: 5-
CAAGGACAGTTATTGATTTTATAATCACTATGTGGGTATAAAAACGTCAA : AATTTCATTTGAG-3' (SEQ ID NO:688) Reboque de CRISPR: 5- TTGATTCAACATAAAAAGCCAGTTCAATTGAACTTGGCTIT-3' (SEQ ID NO:691) O líder de CRISPR corresponde a posições 625038 a 625100, e " o reboque de CRISPR equivale a posições 627845 a 627885 no genoma E completo (CPO00024) de S. thermophilus. Como usado neste pedido, o termo "a montante" significa na di- reção5'e'ajusante" significa na direção 3. Como usado neste pedido o T termo "porção do mesmo no contexto de um locux de CRISPR" significa pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotí-
deos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, a- proximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, apro- ximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproxi- —madamente 90 nucleotídeos, aproximadamente 98 nucleotídeos ou até a- proximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos apro- ximadamente 44 a 98 nucleotídeos) de um locux de CRISPR. Em algumas modalidades preferenciais, o termo "porção do mesmo" significa pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotídeos, a- — proximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, apro- ximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproxi- madamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproxima- damente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximada- mente 90 nucleotídeos, aproximadamente 98 nucleotídeos ou aproximada- —mente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamen- te 44 a 98 nucleotídeos) a partir de uma ou ambas as extremidades (isto é, extremidades 5' e/ou 3') de um locux de CRISPR. Em algumas modalidades preferenciais, o termo "porção do mesmo" refere-se a pelo menos aproxima- damente os primeiros 44 nucleotídeos na extremidade 5' de um locux de —CRISPR ou aproximadamente os últimos 44 nucleotídeos na extremidade 3' de um locux de CRISPR.
Em algumas modalidades adicionais, o termo "porção do mesmo no contexto de um /ocux de CRISPR" significa pelo menos aproximadamen- te os primeiros 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproxi- : 25 —madamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproxima- damente 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximada- * mente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamen- É de te 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 - nucleotídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 ii nucleotídeos) a jusante do primeiro nucleotídeo da primeira repetição de CRISPR na extremidade 5' de um focux de CRISPR ou a montante do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR. Em algumas modalidades preferenciais, o termo "porção do mesmo" refere-se a pelo menos aproximadamente os primeiros 44 nucleotí- deos a jusante a partir do primeiro nucleotídeo da primeira repetição de —CRISPR na extremidade 5' de um locux de CRISPR ou pelo menos aproxi- madamente 44 nucleotídeos a montante a partir do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR.
Em algumas modalidades, o tamanho mínimo da sequência du- plicada é aproximadamente 24 nucleotídeos e o tamanho mínimo da se- —quência de direcionamento é aproximadamente 20 nucleotídeos. Dessa ma- neira, em algumas modalidades preferenciais, o termo "porção do mesmo" no contexto de um locux de CRISPR, significa pelo menos 44 nucleotídeos.
Em algumas modalidades, o tamanho máximo da sequência du- plicada é aproximadamente 40 nucleotídeos e o tamanho máximo da se- —quência de direcionamento é aproximadamente 58 nucleotídeos. Dessa ma- neira, em algumas modalidades, o termo "porção do mesmo" quando usado no contexto de um /ocux de CRISPR significa pelo menos aproximadamente 98 nucleotídeos. Em algumas modalidades preferenciais, o termo "porção do mesmo" no contexto de um locux de CRISPR significa pelo menos aproxi- —“madamente 44 a 98 nucleotídeos.
Quando comparado o locux de CRISPR ou uma porção do mesmo da bactéria parental e uma bactéria marcada, pelo menos aproxima- damente 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximada- mente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamen- : 25 te40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nu- cleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleo- E y tídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 nucleo- - tídeos (por exemplo, pelo menos aproximadamente 44 a 98 nucleotídeos) de um /ocuxde CRISPR são comparados. Em algumas modalidades preferen- " ciais, pelo menos aproximadamente 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nu-
cleotídeos, aproximadamente 40 nucleotídeos, aproximadamente 44 nucleo- tídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotí- deos, aproximadamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleotídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 ou mais nucleotídeos (por exemplo, pelo menos a- proximadamente 44 a 98 nucleotídeos) em uma ou ambas as extremidades de um locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos aproxima- damente os primeiros 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximadamente 24 nucleotídeos, aproximadamente 30 nucleotídeos, a- proximadamente 40 nucleotídeos, aproximadamente 44 nucleotídeos, apro- ximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproxi- madamente 70 nucleotídeos, aproximadamente 80 nucleotídeos, aproxima- damente 90 nucleotídeos, aproximadamente 98 nucleotídeos ou aproxima- damente 100 ou mais nucleotídeos (por exemplo, pelo menos aproximada- mente 44 a 98 nucleotídeos) na extremidade 5' de um locux de CRISPR ou na extremidade 3' de um locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos aproximadamente os primeiros 44 nucleotídeos na extremidade 5' de um locux de CRISPR ou aproximadamen- teos últimos 44 nucleotídeos na extremidade 3' de um locux de CRISPR são comparados.
Em algumas modalidades, pelo menos aproximadamente os primeiros 10 nucleotídeos, aproximadamente 20 nucleotídeos, aproximada- mente 24 nucleotídeos, aproximadamente 30 nucleotídeos, aproximadamen- : 25 te 40 nucleotídeos, aproximadamente 44 nucleotídeos, aproximadamente 50 nucleotídeos, aproximadamente 60 nucleotídeos, aproximadamente 70 nu- - cleotídeos, aproximadamente 80 nucleotídeos, aproximadamente 90 nucleo- : " tídeos, aproximadamente 98 nucleotídeos, ou aproximadamente 100 ou - mais nucleotídeos (por exemplo, pelo menos aproximadamente 44 a 98 nu- —cleotídeos) a jusante a partir do primeiro nucleotídeo da primeira repetição ia de CRISPR na extremidade 5' de um /ocux de CRISPR ou a montante do último nucleotídeo da última repetição de CRISPR na extremidade 3' de um locux de CRISPR são comparados. Em algumas modalidades preferenciais, pelo menos aproximadamente os primeiros 44 nucleotídeos a jusante a partir do primeiro nucleotídeo da primeira repetição de CRISPR na extremidade 5' de um /ocux de CRISPR ou aproximadamente pelo menos 44 nucleotídeos a montante do último nucleotídeo da última repetição de CRISPR na extremi- dade 3' de um /ocux de CRISPR são comparados.
Em algumas modalidades, o tamanho mínimo da sequência du- plicada é aproximadamente 24 nucleotídeos e o tamanho mínimo da se- quência de direcionamento é aproximadamente 20 nucleotídeos. Em algu- mas modalidades preferenciais, pelo menos 44 nucleotídeos são compara- dos. Em algumas modalidades alternativas, o tamanho máximo da sequên- cia duplicada é aproximadamente 40 nucleotídeos e o tamanho máximo da sequência de direcionamento é aproximadamente 58 nucleotídeos. Em al- gumas modalidades preferenciais, pelo menos 98 nucleotídeos são compa- rados. Em algumas modalidades preferenciais alternativas, pelo menos a- proximadamente 44 a 98 nucleotídeos são comparados.
Como usado neste pedido, o termo "repetição de CRISPR" tem significação convencional como usado na técnica (isto é, múltiplas repeti- ções diretas curtas, que mostram nenhuma ou muito pouca variação de se- —quência dentro de um dado locux de CRISPR). Como usado neste pedido, no contexto, "repetição de CRISPR" é sinônima ao termo "CRISPR".
Um locux de CRISPR compreende uma ou mais repetições de CRISPR do que há nas CRISPR espaçadoras. Dessa maneira, a repetição de CRISPR equivale à sequência repetida em um locux de CRISPR. Por E 25 exemplo, exceto a repetição terminal, a sequência repetida típica CRISPR1 da sequência do Ss. thermophilus é: 5" , GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC-3'(SEQ ID NO: 1) E Variações pontuais desta sequência de repetição foram obser- + vadas mas são muito raras. Em comparação com esta sequência de repeti- ção típica, a sequência de repetição terminal sempre mostra a mesma varia- hn ção na sua extremidade 3'. Variações pontuais desta sequência de repetição terminal também foram observadas mas são raras. As repetições de CRIS-
PR podem ocorrer naturalmente na bactéria parental.
Os números de acesso de Genbank de sequências CRISPR1 incluem: CPO000023, CPO000024, DQO072985, DQ072986, DQ072987, DQO072988, DQ072989, DQ072990, DQ072991, DQ072992, DQ072993, DQ072994, DQ072995, DQO072996, S —DQ072997, DQ072998, DQ072999, DQ073000, DQ073001, DQO073002, DQO073003, DQ073004, DQO073005, DQ073006, DQO073007, DQO073008 e AAGSO01000003. Como descrito em detalhes adicionais neste pedido, uma se- quência duplicada é derivada, derivável, obtida ou obtenível a partir de uma bactéria parental.
Em algumas modalidades preferenciais, a sequência com- preende o DNA genômico de uma bactéria parental.
Em algumas modalida- des particularmente preferenciais, a repetição de CRISPR duplicada (por exemplo, no mesmo /ocux de CRISPR) está integrada iterativamente, se- quencialmente, simultaneamente ou substancialmente simultaneamente jun- to coma sequência de direcionamento na bactéria parental! para dar origem a uma bactéria marcada.
O número de nucleotídeos em uma repetição é geralmente a- proximadamente 20 a aproximadamente 40 pares de base (por exemplo, 36 pares de base), mas em outras modalidades é aproximadamente 20 a apro- ximadamente 39 pares de base, aproximadamente 20 a aproximadamente 37 pares de base, aproximadamente 20 a aproximadamente 35 pares de base, aproximadamente 20 a aproximadamente 33 pares de base, aproxi- madamente 20 a aproximadamente 30 pares de base, aproximadamente 21 a aproximadamente 40 pares de base, aproximadamente 21 a aproximada- : 25 mente 39 pares de base, aproximadamente 21 a aproximadamente 37 pares de base, aproximadamente 23 a aproximadamente 40 pares de base, apro- . ximadamente 23 a aproximadamente 39 pares de base, aproximadamente É " 23 a aproximadamente 37 pares de base, aproximadamente 25 a aproxima- - damente 40 pares de base, aproximadamente 25 a aproximadamente 39 pares de base, aproximadamente 25 a aproximadamente 37 pares de base, : aproximadamente 25 a aproximadamente 35 pares de base, ou aproxima- damente 28 ou 29 pares de base.
O número de nucleotídeos em uma repetição é geralmente a- proximadamente 20 a aproximadamente 40 pares de base, mas pode ser aproximadamente 20 a aproximadamente 39 pares de base, aproximada- mente 20 a aproximadamente 37 pares de base, aproximadamente 20 a a- —proximadamente 35 pares de base, aproximadamente 20 a aproximadamen- te 33 pares de base, aproximadamente 20 a aproximadamente 30 pares de base, aproximadamente 21 a aproximadamente 40 pares de base, aproxi- madamente 21 a aproximadamente 39 pares de base, aproximadamente 21 a aproximadamente 37 pares de base, aproximadamente 23 a aproximada- mente 40 pares de base, aproximadamente 23 a aproximadamente 39 pares de base, aproximadamente 23 a aproximadamente 37 pares de base, apro- ximadamente 25 a aproximadamente 40 pares de base, aproximadamente 25 a aproximadamente 39 pares de base, aproximadamente 25 a aproxima- damente 37 pares de base, aproximadamente 25 a aproximadamente 35 pares de base, ou aproximadamente 28 ou 29 pares de base.
O número de repetições pode variar de aproximadamente 1 a aproximadamente 140, de aproximadamente 1 a aproximadamente 100, de aproximadamente 2 a a- proximadamente 100, de aproximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproximadamente 100, de aproximadamente 15 a aproximadamente 100, de aproximadamente 20 a aproximadamente 100, de aproximadamente 25 a aproximadamente 100, de aproximadamente 30 a aproximadamente 100, de aproximadamente 35 a aproximadamente 100, de aproximadamente 40 a aproximadamente 100, de aproximadamente 45 a aproximadamente 100, de aproximadamente 50 a aproximadamente 100, de E 25 aproximadamente 1 a aproximadamente 135, de aproximadamente 1 a a- proximadamente 130, de aproximadamente 1 a aproximadamente 125, de f aproximadamente 1 a aproximadamente 120, de aproximadamente 1 a a- E : proximadamente 115, de aproximadamente 1 a aproximadamente 110, de * aproximadamente | a aproximadamente 105, de aproximadamente 1 a a- —proximadamente 100, de aproximadamente 1 a aproximadamente 95, de É aproximadamente 1 a aproximadamente 90, de aproximadamente 1 a apro- ximadamente 80, de aproximadamente 1 a aproximadamente 70, de aproxi-
madamente 1 a aproximadamente 60, de aproximadamente 1 a aproxima- damente 50, de aproximadamente 10 a aproximadamente 140, de aproxi- madamente 10 a aproximadamente 130, de aproximadamente 10 a aproxi- madamente 120, de aproximadamente 10 a aproximadamente 110, de 10 a aproximadamente 95, de aproximadamente 10 a aproximadamente 90, de aproximadamente 20 a aproximadamente 80, de aproximadamente 30 a a- proximadamente 70, de aproximadamente 30 a aproximadamente 60, de aproximadamente 30 a aproximadamente 50, de aproximadamente 30 a a- : proximadamente 40, ou aproximadamente 32.
Em algumas outras modalidades, o número de nucleotídeos em uma repetição é aproximadamente 20 a aproximadamente 39 pares de base, aproximadamente 20 a aproximadamente 37 pares de base, aproximada- mente 20 a aproximadamente 35 pares de base, aproximadamente 20 a a- proximadamente 33 pares de base, aproximadamente 20 a aproximadamen- te 30 pares de base, aproximadamente 21 a aproximadamente 40 pares de base, aproximadamente 21 a aproximadamente 39 pares de base, aproxi- madamente 21 a aproximadamente 37 pares de base, aproximadamente 23 a aproximadamente 40 pares de base, aproximadamente 23 a aproximada- mente 39 pares de base, aproximadamente 23 a aproximadamente 37 pares de base, aproximadamente 25 a aproximadamente 40 pares de base, apro- ximadamente 25 a aproximadamente 39 pares de base, aproximadamente a aproximadamente 37 pares de base, aproximadamente 25 a aproxima- damente 35 pares de base, ou aproximadamente 28 ou 29 pares de base. Em algumas modalidades, o número de repetições varia de a- : 25 proximadamente 1 a aproximadamente 144, de aproximadamente 1 a apro- ximadamente 100, de aproximadamente 2 a aproximadamente 100, de apro- ã ximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproxi- É : madamente 100, de aproximadamente 15 a aproximadamente 100, de apro- - ximadamente 20 a aproximadamente 100, de aproximadamente 25 a apro- —ximadamente 100, de aproximadamente 30 a aproximadamente 100, de a- E proximadamente 35 a aproximadamente 100, de aproximadamente 40 a a- proximadamente 100, de aproximadamente 45 a aproximadamente 100, de aproximadamente 50 a aproximadamente 100, de aproximadamente 1 a a- proximadamente 135, de aproximadamente 1 a aproximadamente 130, de aproximadamente 1 a aproximadamente 125, de aproximadamente 1 a a- proximadamente 120, de aproximadamente 1 a aproximadamente 1 15, de aproximadamente 1 a aproximadamente 110, de aproximadamente 1 a a- proximadamente 105, de aproximadamente 1 a aproximadamente 100, de aproximadamente 1 a aproximadamente 95, de aproximadamente 1 a apro- ximadamente 90, de aproximadamente 1 a aproximadamente 80, de aproxi- madamente 1 a aproximadamente 70, de aproximadamente | a aproxima- damente 60, de aproximadamente 1 a aproximadamente 50, de aproxima- damente 10 a aproximadamente 140, de aproximadamente 10 a aproxima- damente 130, de aproximadamente 10 a aproximadamente 120, de aproxi- madamente 10 a aproximadamente 110, de aproximadamente 10 a aproxi- madamente 95, de aproximadamente 10 a aproximadamente 90, de aproxi- —madamente 20 a aproximadamente 80, de aproximadamente 30 a aproxi- madamente 70, de aproximadamente 30 a aproximadamente 60, de aproxi- madamente 30 a aproximadamente 50, de aproximadamente 30 a aproxi- madamente 40, ou aproximadamente 30, 31, 32, 33, 34 ou 35 repetições.
Em algumas modalidades, o número de repetições varia de a- — proximadamente 2 a aproximadamente 140, de aproximadamente 2 a apro- ximadamente 100, de aproximadamente 2 a aproximadamente 100, de apro- ximadamente 5 a aproximadamente 100, de aproximadamente 10 a aproxi- madamente 100, de aproximadamente 15 a aproximadamente 100, de apro- ximadamente 20 a aproximadamente 100, de aproximadamente 25 a apro- : 25 ximadamente 100, de aproximadamente 30 a aproximadamente 100, de a- proximadamente 35 a aproximadamente 100, de aproximadamente 40 a a- e proximadamente 100, de aproximadamente 45 a aproximadamente 100, de ; aproximadamente 50 a aproximadamente 100. - Em algumas modalidades adicionais, o número de repetições —variade aproximadamente 2 a aproximadamente 135, de aproximadamente ói 2 a aproximadamente 130, de aproximadamente 2 a aproximadamente 125, de aproximadamente 2 a aproximadamente 120, de aproximadamente 2 a aproximadamente 115, de aproximadamente 2 a aproximadamente 110, de aproximadamente 2 a aproximadamente 105, de aproximadamente 2 a a- proximadamente 100, de aproximadamente 2 a aproximadamente 95, de aproximadamente 2 a aproximadamente 90, de aproximadamente 2 a apro- ximadamente 80, de aproximadamente 2 a aproximadamente 70, de aproxi- madamente 2 a aproximadamente 60, de aproximadamente 2 a aproxima- damente 50, de aproximadamente 2 a aproximadamente 40, de aproxima- damente 2 a aproximadamente 30, de aproximadamente 2 a aproximada- mente 20, de aproximadamente 2 a aproximadamente 10, de aproximada- mente2a aproximadamente 9, de aproximadarnente 2 a aproximadamente 8, de aproximadamente 2 a aproximadamente 7, de aproximadamente 2 a aproximadamente 6, de aproximadamente 2 a aproximadamente 5, de apro- ximadamente 2 a aproximadamente 4, ou de aproximadamente 2 a aproxi- madamente 3.
Em algumas modalidades, as repetições de CRISPR compreen- dem DNA, enquanto em outras modalidades, repetições de CRISPR com- preendem RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras modalidades, é de origem sintética ou re- combinante. Em algumas modalidades, os genes de repetição de CRISPR são de filamentos simples e de filamentos simples, se representam o fila- mento de senso ou antissenso ou combinações das mesmas. Em algumas modalidades, os genes de repetição de CRISPR são preparados pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido.
: 25 Em algumas modalidades, uma ou mais das repetições de CRISPR são usadas para construir uma célula (por exemplo, uma célula- recipiente). Em algumas modalidades preferenciais, uma ou mais, preferen- : . cialmente, duas ou mais repetições de CRISPR são usadas para construir .- uma célula (por exemplo, uma célula-recipiente), que em combinação com um ou mais genes ou proteínas cas e uma ou mais CRISPR espaçadoras E modulam a resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. Por exemplo, em algumas modalidades, a repetição(ões) de CRISPR são inseridas no DNA de uma célula (por exem- plo, DNA plasmidial e/ou genômico de uma célula-recipiente), usando qual- quer método adequado conhecido na técnica. Em modalidades adicionais, as repetição(ões) de CRISPR encontram uso como um molde na qual modi- ficação (por exemplo, mutação) do DNA de uma célula (por exemplo, DNA plasmidial e/ou genômico de uma célula-recipiente), tal que as repeti- ção(ões) de CRISPR são criadas ou construídas no DNA da célula. Em mo- dalidades adicionais, as repetição(ões) de CRISPR estão presentes em pelo menos um construto, pelo menos um plasmídeo, e/ou pelo menos um vetor, etc. Em modalidades adicionais, as repetições de CRISPR são introduzidas na célula usando qualquer método adequado conhecido na técnica.
Em modalidades adicionais, a presente invenção fornece méto- dos para identificação de uma repetição de CRISPR para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: (i) preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos um gene cas; (ii) planejamento da célula tal que contenha uma repetição de CRISPR; e (iii) determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de transcrição do mesmo, em que a modulação da resistência da célula contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indicativa que a repetição de CRISPR pode ser usada para mo- dular a resistência.
Em algumas modalidades adicionais, um ou mais genes ou pro- teínas cas são usados em conjunto com ou em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e opcional- mente uma ou mais CRISPR espaçadoras. Em algumas modalidades parti- f cularmente preferenciais, o gene(s) ou proteína(s) cas e repetição(ões) de : CRISPR formam uma combinação funcional como descrito abaixo. Em al- - gumas modalidades, as repetições de CRISPR compreendem quaisquer dos — nucleotídeos apresentados nas SEQ ID NOS: | a 22. As SEQ ID NOS: 1 a 12 i são de S. thermophilus, enquanto as SEQ ID NOS: 13 a 16 são de Strepto- coccus agalactiae, SEQ NO: 17 é de S. mutans, e SEQ ID NOS: 18 a 22 são de S. pyogenes.
GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC (SEQ ID NO:1) GTTTTTGTATTCTCAAGATTTAAGTAACTGTACAGT (SEQ ID N0:2) GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAGT (SEQ ID NO:3)
—GTTTITGTACTCTCAAGATTTAAGTAACCGTACAAC (SEQ ID NO:4) GTTITTGTACTCTCAAGATTTAAGTAACTGTGCAAC (SEQ ID N0:5) GTTTTTGTACTCTCAAGATTTAAGTAGCTGTACAGT (SEQ ID N0:6) GTTTTTGTACTCTCAAGATATAAGTAACTGTACAAC (SEQ ID NO:7) GTTTTTGTACTCTCAAGATCTAAGTAACTGTACAAC (SEQ ID NO:8)
GTTTTTGTACTCTCAAGATGTAAGTAACTGTACAAC (SEQ ID N0:9) GTCTTTGTACTCTCAAGATTTAAGTAACTGTACAAC (SEQ ID NO:10) AAAAAAGTCCCCTCTCGAGGTAATTAGGTTTATATC (SEQ ID NO:11) GTTTCCGTCCCCTCTCGAGGTAATTAGGTTTATATC (SEQ ID NO:12) GTTTTAGAGCTGTGTTGTTTCGAATGGTTCCAAAAC (SEQ ID NO:13)
GTTTTAMAGCTGTGCTGTTATTATGCTAGGGCACCA (SEQ ID NO: 14) GTTITAGAGCTGTGCTGTTTCGAATGGTTCCAAAAC (SEQ ID NO:15) GTTTTAGAGCTGTGCTGTTATTATGCTAGGACATCA (SEQ ID NO: 16) GTTTTAGAGCCATGTTAGTTACTGATTTACTAAAAT (SEQ ID NO:17) GTTTTAGAGCTATGCTGTTTTGAATGGTCCCAAAAC (SEQ ID NO:18)
— GTTTTAGAGCTATGCTGTTTTGAATGGTCTCCATTC (SEQ ID NO:19) CTTTCAATCCACTCACCCATGAAGGGTGAGACG (SEQ ID NO:20) ATTTCAATCCACTCACCCATGAAGGGTGAGACT (SEQ ID N0:21) ATTTCAATCCACTCACCCATGAAGGGTGAGACC (SEQ ID NO:22) CRISPR Espaçadora
E 25 Como usado neste pedido, "CRISPR espaçadora" engloba se- quências espaçadoras não-repetitivas que são encontradas entre múltiplas
. repetições diretas curtas (isto é, repetições de CRISPR) dos locide CRISPR. : . Em algumas modalidades da presente invenção, uma "CRISPR espaçadora" E refere-se ao segmento de ácido nucleico que é flanqueado por duas repeti- ções de CRISPR.
Foi encontrado que sequências espaçadoras CRISPR
É muitas vezes têm similaridades significantes a uma variedade de moléculas de DNA móveis (por exemplo, bacteriófagos e plasmídeos). Em algumas modalidades preferenciais, CRISPR espaçadoras são localizadas entre duas repetições de CRISPR idênticas. Em algumas modalidades, CRISPR espa- çadoras são identificadas por análise de sequência nos intervalos de DNA localizados entre duas repetições de CRISPR. Em algumas modalidades preferenciais, a CRISPR espaçadora está naturalmente presente entre duas repetições diretas curtas idênticas múltiplas que são palindrômicas.
De maneira interessante, as células que carregam estas CRIS- PR espaçadoras são incapazes de ser infectadas por moléculas de DNA que contêm sequências homólogas aos espaçadores (Mojica et al. 2005). Em algumas modalidades preferenciais, a CRISPR espaçadora é homóloga ao ácido nucleico-alvo ou um produto de transcrição do mesmo ou uma se- quência identificada. Embora a homologia também possa ser considerada em termos de similaridade, no contexto da presente invenção é preferencial para expressar a homologia em termo de identidade de sequência. Uma se- —quência homóloga é tomada para incluir uma CRISPR espaçadora, que po- de ser pelo menos aproximadamente 70, aproximadamente 75, aproxima- damente 80, sobre 85, ou aproximadamente 90% idênticos, ou pelo menos aproximadamente 91, aproximadamente 92, aproximadamente 93, aproxi- madamente 94, aproximadamente 95, aproximadamente 96, aproximada- mente 97, aproximadamente 98, ou aproximadamente 99% idêntica à se- ã quência-alvo de ácido nucleico ou um produto de transcrição do mesmo ou uma sequência identificada. Em algumas modalidades preferenciais, a CRISPR espaçadora é aproximadamente 100% idêntica à sequência-alvo de ácido nucleico. É também observado que o número de CRISPR espaçado- rasem um dado loci ou locux de CRISPR pode variar entre espécies. Além E disso, o número de espaçadores varia de aproximadamente 1 a aproxima- . damente 140, de aproximadamente 1 a aproximadamente 100, de aproxi- j madamente 2 a aproximadamente 100, de aproximadamente 5 a aproxima- S damente 100, de aproximadamente 10 a aproximadamente 100, de aproxi- madamente 15 a aproximadamente 100, de aproximadamente 20 a aproxi- E madamente 100, de aproximadamente 25 a aproximadamente 100, de apro- ximadamente 30 a aproximadamente 100, de aproximadamente 35 a apro-
ximadamente 100, de aproximadamente 40 a aproximadamente 100, de a- proximadamente 45 a aproximadamente 100, ou de aproximadamente 50 a aproximadamente 100. Em algumas modalidades preferenciais, o número de espaçadores varia de aproximadamente 1 a aproximadamente 135, de apro- ximadamente 1 a aproximadamente 130, de aproximadamente 1 a aproxi- madamente 125, de aproximadamente | a aproximadamente 120, de apro- ximadamente 1 a aproximadamente 115, de aproximadamente 1 a aproxi- madamente 110, de aproximadamente 1 a aproximadamente 105, de apro- ximadamente 1 a aproximadamente 100, de aproximadamente 1 a aproxi- madamente 95, de aproximadamente 1 a aproximadamente 90, de aproxi- madamente 1 a aproximadamente 80, de aproximadamente 1 a aproxima- damente 70, de aproximadamente 1 a aproximadamente 60, de aproxima- damente 1 a aproximadamente 50, de aproximadamente 1 a aproximada- mente 40, de aproximadamente 1 a aproximadamente 30, de aproximada- mente1a aproximadamente 20, de aproximadamente 1 a aproximadamente 10, de aproximadamente 1 a aproximadamente 9, de aproximadamente 1 à aproximadamente 8, de aproximadamente 1 a aproximadamente 7, de apro- ximadamente 1 a aproximadamente 6, de aproximadamente 1 a aproxima- damente 5, de aproximadamente 1 a aproximadamente 4, de aproximada- mente 1a aproximadamente 3, ou de aproximadamente 1 a aproximada- mente 2. Em algumas modalidades preferenciais, os CRISPR espaçadoras são identificadas pela análise de sequência como os intervalos de DNA loca- lizadas entre duas repetições.
Como descrito neste pedido, a presente invenção fornece méto- dose composições que facilitam o uso de um ou mais genes ou proteínas cas em combinação com uma ou mais, preferencialmente, duas ou mais re- f petições de CRISPR adequadas para conferir especificidade de imunidade a pelo menos uma CRISPR espaçadora em uma célula-recipiente.
Em algu- " mas modalidades preferenciais, pelo menos genes ou proteínas cas e pelo menos uma repetição de CRISPR são usados em combinações funcionais para conferir especificidade de imunidade a pelo menos uma CRISPR espa- çadora em uma célula.
Como usado aqui, o termo "especificidade de imunidade" signifi- ca que a imunidade é conferida contra uma sequência de ácido nucleico es- pecífica ou produto de transcrição do mesmo, usando uma CRISPR espaça- dora específica ou sequência de pseudo CRISPR espaçadora. Como indica- do neste pedido, uma dada CRISPR espaçadora não confere resistência contra qualquer sequência de ácido nucleico ou produto de transcrição do mesmo mas somente àquelas sequências contra as quais a CRISPR espa- çadora ou pseudo CRISPR espaçadora é homóloga (por exemplo, aquelas : que são aproximadamente 100% idênticas).
Em algumas modalidades, as CRISPR espaçadora(s) são obti- das a partir de um organismo doador que é diferente da célula-recipiente.
Em algumas modalidades preferenciais, células doadoras e recipientes são diferentes cepas bacterianas, espécies e/ou gêneros. Em algumas modali- dades preferenciais, pelo menos um gene ou proteína cas e/ou pelo menos uma repetiçãode CRISPR são obtidos a partir de um organismo diferente do que o organismo recipiente. Em algumas modalidades preferenciais, pelo menos duas repetições de CRISPR são transferidas. Em algumas modalida- des preferenciais adicionais, CRISPR espaçadoras são obtidas a partir de um organismo que é heterólogo ao recipiente ou uma célula doadora adicio- nala partir da qual pelo menos genes e/ou proteína cas, e/ou pelo menos À uma repetição de CRISPR são obtidos. Em algumas modalidades alternati- vas preferenciais, as CRISPR espaçadoras são obtidas a partir de um orga- nismo que é homólogo ao recipiente ou uma célula doadora adicional a partir da qual pelo menos genes e/ou proteínas cas, e/ou pelo menos uma repeti- ' 25 ção de CRISPR são obtidas. Em algumas modalidades preferenciais, a CRISPR espaçadora(s) é/são desenhada e produzida usando métodos re- . combinantes conhecidos na técnica. De fato, é destinado que as CRISPR É y espaçadoras sejam produzidas usando qualquer método adequado conheci- - do na técnica.
Em algumas modalidades, as CRISPR espaçadoras são heteró- i logas à célula-recipiente a partir da qual pelo menos genes ou proteínas cas e/ou pelo menos uma, e em algumas modalidades, preferencialmente, duas ou mais repetições de CRISPR são obtidas. Em algumas modalidades alter- nativas, as CRISPR espaçadoras são homólogas à célula-recipiente a partir da qual pelo menos genes ou proteínas cas e/ou pelo menos uma, e em al- gumas modalidades, preferencialmente, duas ou mais repetições de CRIS- PR são obtidas. De fato, é destinado que alguns dos elementos usados nos métodos sejam heterólogos ou homólogos. Em algumas modalidades, onde múltiplos elementos são usados (por exemplo, qualquer combinação de CRISPR espaçadora(s), repetição(ões) de CRISPR, gene(s) cas, e proteí- na(s) Cas, alguns elementos são homólogos um com outro e alguns elemen- tos são heterólogos um ao outro (por exemplo, em algumas modalidades, a CRISPR espaçadora(s) e genes cas são homólogos, mas a repetição(ões) de CRISPR é/são heteróloga). Dessa maneira, em algumas modalidades, a CRISPR espaçadora está associada não-naturalmente com a repetição de CRISPR e/ou genes cas e/ou combinação gênica de repetição de CRISPR- —casfuncional. De fato, é destinado que qualquer combinação de elementos heterólogos e homólogos encontra uso na presente invenção. Ainda em mo- dalidades adicionais, as células doadoras e recipientes são heterólogas, en- quanto em modalidades adicionais, são homólogas. É também destinado que os elementos contidos nas células doadoras e recipientes sejam homó- logos e/ou heterólogos. Os elementos (por exemplo, CRISPR espaçadoras) são introduzidos no DNA plasmidial e/ou genômico da célula-recipiente utili- zando qualquer método adequado conhecido na técnica.
Em algumas modalidades preferenciais, pelo menos uma CRIS- PR espaçadora é usada para construir uma célula (por exemplo, uma célula- recipiente). Em algumas modalidades adicionais, uma ou mais CRISPR es- É paçadoras são usadas em combinação com um ou mais genes ou proteínas - cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de Á : CRISPR (em algumas modalidades preferenciais, uma ou mais combinações & funcionais das mesmas são usadas) para modular a resistência de uma cé- lula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo, para produzir uma célula construída. Em algumas modalidades adicionais, as CRISPR espaçadoras são usadas como um molde sobre o qual modifica-
ção (por exemplo, mutação) do DNA plasmidia! e/ou genômico de uma célu- la (por exemplo, uma célula-recipiente), tal que as CRISPR espaçadoras são criadas no DNA da célula. Em algumas modalidades, a CRISPR espaçado- ra(s) é clonado em pelo menos um construto, ptasmídeo ou outro vetor, com oquala célula-recipiente então é transformada, usando qualquer método adequado conhecido na técnica.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos para identificação de uma CRISPR espaçadora para uso na mo- dulação da resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo, compreendendo as etapas de: prepara- ção de uma célula compreendendo pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas; identificação de pelo menos uma CRISPR espaçadora em um organismo (por exemplo, um organismo doa- dor); modificação da sequência da CRISPR espaçadora da célula tal que tenha homologia à CRISPR espaçadora do organismo doador compreen- dendo o ácido nucleico-alvo; e determinação se a célula modula a resistên- cia contra o ácido nucleico-alvo, em que a modulação da resistência da célu- la contra o ácido nucleico-alvo ou produto de transcrição do mesmo é indica- tiva que a CRISPR espaçadora modula a resistência da célula contra o ácido nucleico-alvo.
Em algumas modalidades preferenciais, as CRISPR espaçado- ras compreendem ou consistem na sequência nucleotídica apresentada a qualquer uma ou mais em qualquer um das SEQ ID NO:238 a 460 e/ou SEQ ID NOS:522 a 665. As SEQ ID NOS:23 a 339, 359 a 408, 522 a 665 são de S. thermophilus, enquanto SEQ ID NOS:340 a 358 são de S. vestibularis, SEQ ID NOS:409 a 446 são de S. agalactiae, SEQ ID NOS:447 a 452 são e. de S. mutans, e SEQ ID NOS:453 a 460 são de S. pyogenes. aaa AGAACGTATTCCAAAACCTCTTTACGATTA (SEQ ID NO:23) . TTAACTGTTATCAAAATGATAAGATAGTCT (SEQ ID NO:24) —“CGTTGATGTTTATTCAAGTAAAATAATTAA (SEQ ID NO:25) * TCCTTTCACGGGTAGCACACTAACATACAC (SEQ ID NO:26) GTTGGCAATGCAAACAACCTTTATGAACCG (SEQ ID NO:27)
TTTATTTCCTTGCGATAACGTTCCACCTTT (SEQ ID NO:28) AGATTATAAGGAACACAACCAACTATATAG (SEQ ID NO:29) ACGACATCAAGCTGATTGTCTTCTACATAA (SEQ ID NO:30) TTTGGAATACTGAATGTTTTACTGAAAATC (SEQ ID NO:31)
—ACACCACTATCTTTTCCTCCTGAAAATGAA (SEQ ID NO:32) GTAATTCCACGAAATTATCAACCTTATGCA (SEQ ID NO:33) TTGGAGGATTGCCCCATATTCCCAAGAGT (SEQ ID NO:34) GAGAGGCGTTAAATATAGAAATGCAAGATT (SEQ ID NO:35) TTTTAACGTCATCAGTCCACCGCCTTAAAT (SEQ ID NO:36)
CACCTCTTTCGATGGAAAGGTATCCTTCTA (SEQ ID NO:37) GACCAAAGTTTGATTATAGAGCTATACACC (SEQ ID NO:38) ACCATCATTCTTACCATTACAACTGTAATG (SEQ ID NO:39 ATACGAATTCGGTTCGCACAATTACAATTC (SEQ ID NO:40) TATCAACGCAATCATTACAACAACTTCAAACA (SEQ ID NO:41)
ATCTACGTGTCAATACATATCACAAAACAG (SEQ ID NO:42) ATTTTTAGAAATTTCTGATATAATAATGA (SEQ ID NO:43) TTGTTGGAACAAGGACGACTTGGTAAACTA (SEQ ID NO:44) CATATTAAGCTGACTGGGCCTAATGCTTTT (SEQ ID NO:45) TTCATAGCATACCGTAGTTGTAAAATCTAT (SEQ ID NO:46)
—AACATTTAGGGAATGAAATTGATAAGACTG (SEQ ID NO:47) AACATGAGAAACTGTAGAAAACAAGCAATA (SEQ ID NO:48) TGGTGAAGATGGCAGTCATAAATGGCACATT (SEQ ID NO:49) AAGGGTTGAAAAATGTTGGTATATCAAACG (SEQ ID NO: 50) TTCTGGTAGTGGATTTAGTCAAACAGATGT (SEQ ID NO:51)
TCCATAGAGCGTCTTAAACAAAGAATAGTOC (SEQ ID NO:52)
TTATGATTGAATGACATGGTTGTATAAGTA (SEQ ID NO:53)
- TTTCTTTAGGAATACCAGGGAGTTCAGCTT (SEQ ID NO:54) as TGGCAGAGATTACACAGCAACGGAAACAGC (SEQ ID NO:55) - GGGTATCATTGTATCTAGTGATGGACCTGA (SEQ ID NO:56)
—ATTTGAAAAATGCACAACAGCGTTTGATAG (SEQ ID NO:57)
É GAGCTACCAGCTACCCCGTATGTCAGAGAG (SEQ ID NO:58) CGTTCCTTTTTTCAAGGTAATCTTTGAAAG (SEQ ID NO: 59)
AAGTCCGTAAGCACCAGTTCCAATCGTCAT (SEQ ID NO:60) TTGAATACCAATGCCAGCTTCTTTTAAGGC (SEQ ID NO:61) AACCTCATACATGGGGAAAATTGGTAAGTA (SEQ ID NO:62) TAACTTCATTAGTGTAGTTGTAATTAGCAT (SEQ ID NO:63)
—TTAGCTACCCAAATATCTTCTGTTTTCCAA (SEQ ID NO:64) GAGTTTTCAATATTGGCACAGGAGACAATT (SEQ ID NO:65) TGATACTATTTTAGTCAGATATGAAATATC (SEQ ID NO:66) TCATCAATGTTTAAAGCCCAACAATACATGA (SEQ ID NO:67) TAGATTTAATCAGTAATGAGTTAGGCATAA (SEQ ID NO:68)
AGGAAAATAGCATGAGCGTACAACAATCTA (SEQ ID NO:69) TGTCTATCACGCTTCCTAAGTGCATGAAAA (SEQ ID N. 70) ATGTCACCAATCACTAAAGAACCTACGCTG (SEQ ID NO:71) AACATCTTCCTCTCCGATTGCAAATAGTGC (SEQ ID NO: 72) CATATTTGGTGCCCGTTCGATAAAGAGTA (SEQ ID NO:73)
CATTAAATCGCTTGAAGCAGACATTGAAGC (SEQ ID NO:74) GACTTATCTTGGAAGGTAGTGAAGGCACTT (SEQ ID NO: 75) TCCTTGCCATCTGCACTGTAAGCCCAAGCA (SEQ ID NO:76) TAGTACGCATAATCAATTCATCAAGCTTGA (SEQ ID NO:77) GTAGTGACCCAAAATTCTATGACCTTGAAA (SEQ ID NO:78)
AGATTGTGGTGCTTACGGAAAATTCCTTGT (SEQ ID NO:79) TGGCAAGAAGTGTAAGAGATGCAATGGATA (SEQ ID NO:80) TTTATTATCATTATTCTTCTTCCCAAGCGT (SEQ ID NO:81) TTTTATAGAATTTGGTGGTGAACTTTTTCA (SEQ ID NO: 82) AATGGGTCACAGATTGCCATAATAAGGAG (SEQ ID NO: 83)
—CCGAGGTCACTTTAGAACCCACAAAATAAG (SEQ ID NO: 84)
ATGAGAGAACACAGTATAGACCCTGATACA (SEQ ID NO: 85) - CAGTATTAATGAGGTTTGGGTGGTCATTCC (SEQ ID NO: 86) Ee CCATACTCTCTATCAGTTCATTTAATTCTTC (SEQ ID NO:87) * TAATATGTCGCTCTACTGATTCCAAAACGG (SEQ ID NO:88) —ATGAATTACATTCATGATTTTATCGAGTTT (SEQ ID NO:89) ft CGTGCCATTGTTTCGGTCEGACGTGGGCA (SEQ ID NO:90) CTTTCTAAGTTGAATTAAATTCAAGTTTTG (SEQ ID NO:91)
TCGCTACTATGGTTAACGATGAGGAACTCT (SEQ ID NO:92) AGCAACTTTAAAACTAAAAGAGCTACTTGA (SEQ ID NO:93) AAAACCCTACACAGTGTGTGAGATGTGTCA (SEQ ID NO:94) AATGGGTCACAGATTGCCATAATAAGGAGG (SEQ ID NO:95)
—TTTTTTAMAATCCGTCATGCTATACTATAT (SEQ ID NO:96) AATTCAAACTTTCTCCAATAATACCCTCCA (SEQ ID NO:97) CATGCTTTCAGTTAATAAGACGTGGGACTA (SEQ ID NO:98) TGGAAGGGGTGTCTAGTGAAGAAATTGTCG (SEQ ID NO:99) CTCGAAGCGCTTCATTGCCCTATTCCTTTC (SEQ ID NO: 100)
ATGTCTAAGGTATCCACTCGTGAAATCAT (SEQ ID NO: 101) ATATTAATGGAAATTTCATTCAAACGCAGT (SEQ ID NO: 102) TAGAGAGTTTATATCCTGATGGAATCGATG (SEQ ID NO: 103) TGGCGAATTAGAGAGCCAATGGCAAGCAAG (SEQ ID NO: 104) AGAAGACCAATAAACTTGAGAAAAAGCAAG (SEQ ID NO: 105)
AAATGGTCGTTTAATTGTTAATGTCAAAGC (SEQ ID NO: 106) CAATTGATTCTAAAATGCTTGGTACACGTA (SEQ ID NO: 107) TCTTCGTGTTATCACAGCTTCTACACGTTG (SEQ ID NO: 108) GAAATCTCATTGAAACCAACTTCAAGACCA (SEQ ID NO: 109) TGCTTGGTAGTTGATGCACTGCATTAGTAA (SEQ ID NO: 110)
—AATGTACCGGAATAGCGTTACATTGCACAT (SEQ ID NO: 111) TTCATAAATTCTCACTTTTCCTTGCTATTC (SEQ ID NO: 112) TGTCGAAAAAATTACCTAGTCACGACAGAC (SEQ ID NO: 113)
CAACAATTACTTATGCATTAGGAACATCTG (SEQ ID NO: 114) AATTCGTGAAAAACAATAAAAACAAAAAAA (SEQ ID NO: 115) TAACATTTCTGTCCATITCTTCCTTGATGC (SEQ ID NO: 116) i CAAGGCAACTCAACCAACCAAATTGACC (SEQ ID NO: 117) CTAAAATCGTAAATGGTAAGTTGCACGATG (SEQ ID NO: 118) ó . AACGTAAGGAGTTTTTITATTTCTTITGTTA (SEQ ID NO: 119) : GTGGAAAATTTCACACCCTACATATATCAA (SEQ ID NO: 120)
—“CCTCTGCTAATGACTTAAACGGCTCGTTTT (SEQ ID NO: 121)
é AAAATCAAAGTTTTGGGTTTGTCTACGTTG (SEQ ID NO: 122) ATATGTACATACCTAAAGAAAACACGGGCA (SEQ ID NO: 123)
CGTTGTCAAAATATGTGATTACTTTGTATT (SEQ ID NO: 124) CCATAGCTGTAATGTTGTTTGTGACTGCTT (SEQ ID NO: 125) CGCTAAGTTTGGCTTTAAGTATAACAAGCT (SEQ ID NO: 126) AAAGTACGCTTCAAGGCACGTTGAAGACAT (SEQ ID NO: 127) CTTTTTAACGTGTTAGCGTCTTTAGCTTTG (SEQ ID NO: 128) TTGGCTTCGTGAATAATTTTTAAAACGCAT (SEQ ID NO: 129) TGTTGAATCAATACGCTGAAACACACTCCC (SEQ ID NO: 130) CGTTATCAGTTGAAAGTTTCAACTCGTAAG (SEQ ID NO: 131) TAAACTAGTTGGCATCTATGCTCCAGGAAG (SEQ ID NO: 132) TAGACCACCATAGCCGAGTTGTCTTTTTCG (SEQ ID NO: 133) ACATCCCACTTTCTGGGTTTTTTAGCCATG (SEQ ID NO: 134) AGTATGGCTATTGTCCTGATACTCATCCAC (SEQ ID NO: 135) CGCTCTTGACGTGGCTGGTGACATCTACGC (SEQ ID NO: 136) GAGTACATGGAGTTTCTGCTAGATACACTA (SEQ ID NO: 137) TAAGTTATGAAATATAAAGTTATTGTCTA (SEQ ID NO: 138) AACGTTATGACATTTAGGAGCTTCCAAATT (SEQ ID NO: 139) AACACAGCAAGACAAAAGGATGACACTTT (SEQ ID NO: 140) CAACCATAACTTACGCATCAGGTACATCTG (SEQ ID NO: 141) ACACGCGCTTACCTCGTATATCAAATTCA (SEQ ID NO: 142) TGCCCGCAAACTAGCGATACACAACAGCAT (SEQ ID NO: 143) CTCAAGCTCTTCATCTGTGATAGGTGTTTTG (SEQ ID NO: 144) ATCACTCTTTGATAGTATCTCAAACGCTGG (SEQ ID NO: 145) GAAACAGTCAGACCAGCTAATTCGCCAATT (SEQ ID NO: 146) ATATTTCGAAAGATACAAGGACACTTACAC (SEQ ID NO: 147) —GCGGATGAAACACAACTTCAATTGTATTCA (SEQ ID NO: 148) | TAATGCTACATCTCAAAGGATGATCCCAGA (SEQ ID NO: 149) - ACGTCTGTCTAACTGGAAAGTACCTGCTAAT (SEQ ID NO: 150) ; CTGTTCTCTAATCGAGAGGCGCGTGATTGA (SEQ ID NO: 151) õ AAACCTCACTAGTCACTTAGTGCGGTTAGG (SEQ ID NO: 152) —“TATTAAGTTTAGTCCCAGGTTTCTTATCGT (SEQ ID NO: 153) " AAACCAATAAACATACCGATTGCTGCCAAT (SEQ ID NO: 154) GCAAACGTTAGCCCAGGAAAGCATCATGAA (SEQ ID NO: 155)
AAGAGCAAAAAATAACTCTAGCTCTCGTCC (SEQ ID NO: 156) AAGAAACCTCTAAGTTGAGCATTTAATGAT (SEQ ID NO: 157) ATATAGTTTTAAACTITCTTGACCTTCTG (SEQ ID NO: 158) ACGTTGATGAATATTGTTGATAAACTITA (SEQ ID NO: 159)
—“CAAGAAGTGAACAAAGTACACGCTGGAAGT (SEQ ID NO: 160) GACAGCAAGATACACGTAGTTGATGAATTG (SEQ ID NO: 161) TAAGAAATCAACGCAGATTTTTAGCCAACA (SEQ ID NO: 162) TAACCCAATAATTACAGTGAAGCACAATAG (SEQ ID NO: 163) CAGGCGTAAGGTATGCTAATTATAACGAT (SEQ ID NO: 164)
GCTATCGAACTAATAGCTTAGAGGAACTCA (SEQ ID NO: 165) GTGGAATATTAAGCCCGAATTGTTGCAGCA (SEQ ID NO: 166) TATTGCAATATTTGCGTTTGGGAAACCTTC (SEQ ID NO: 167) CGTCTGTCTAACTGGAAAGTACCGGCTAAT (SEQ ID NO: 168) AAAGAGATGTACCCATCCATTCTAACAGGT (SEQ ID NO: 169)
GGGGAGTTGATTTCTTACATCAAAACAATG (SEQ ID NO: 170) CATCAAAGTTGAAAAGGACTACAACAGCCC (SEQ ID NO: 171) CTTAAATTTAGAGCGTGGGATCTTGAATAT (SEQ ID NO: 172) ATATACCGATGGCACATCTGAAACTGGCTG (SEQ ID NO: 173) TAACTCATATGTATCTTGACCAACTATTTT (SEQ ID NO: 174)
—AAMATAGCACCTCTAAGCGTTAATGGTATTO (SEQ ID NO: 175)
AATATCTACAGGTCACTACAAAGCTACGCT (SEQ ID NO: 176) GTTGGGGTGTGTTTGTAACGGCGTATGCTA (SEQ ID NO: 177) TCAATCAGGTGACGGTGATGCTTATATTAA (SEQ ID NO: 178) CATACATGATAGTTTGTCAACACTTTTGAT (SEQ ID NO: 179)
—TCAGCATTTGGTTTACATGACCCACGTCTG (SEQ ID NO: 180)
É CAATCAACAGGTTTGACTGATTATAACGGT (SEQ ID NO: 181) : TAGCTACACATGAATTTTATTACAATGGTG (SEQ ID NO: 182) Ho CTTACGTTTGAAAAGAATATCAAATCAATG (SEQ ID NO: 183) TTAAAAAAGGGCCTTTCTCTAAATCAAGTA (SEQ ID NO: 184) —“TGCTGAACGTATCTGTCCACTGTGTGGCCA (SEQ ID NO: 185) - CCGTTCTTCAAACGTTAAATTCCAAGGTGT (SEQ ID NO: 186) GCTGCGATTATGACAATGCTGTCTGTAAGG (SEQ ID NO: 187)
GAAGAATTTATTAATAAAGATGGTTCTGCT (SEQ ID NO: 188) AGGCAGAAAAGAAGTATTTTGGTAAGTATG (SEQ ID NO: 189) AAATGGTTTATCGACAAGAAAATGAAGCT (SEQ ID NO: 190) CCAAATTTGCATTATACAAAACGCTCCTTC (SEQ ID NO: 191) —ATCCTAACTGCTTTGCTAACTACATCATGG (SEQ ID NO: 192) TAACAAGATAAGATTAGCGTCTTCAACAT (SEQ ID NO: 193) AAAAGCCTATGTTTGCCCACTTTGTGGAAG (SEQ ID NO: 194) TGTCACTTTCTCTTTCTGGGTTGTGCCAAT (SEQ ID NO: 195) CATACTTTTCCATCTGTTTGTTGTTTGAAAA (SEQ ID NO: 196) TGAGAGTGTCTGATGGATTTATTGGCAGCC (SEQ ID NO: 197) GGGGTTATTTTCCATTTTACCGTCTATCTA (SEQ ID NO: 198) TATCACGCCCATTTTCATTTCGCCATCTGT (SEQ ID NO: 199) AACATTTTAATATAATTTCTAAATCTATTG (SEQ ID NO:200) TACAAAATTCCTTCAAACGCTATTTATTGA (SEQ ID NO:201) AGAGTTTGAAAATTATTTTTCAGTTTCTA (SEQ ID NO:202) TTCCTCATCTITCTCCOGCTTTTGCTAGCTT (SEQ ID NO:203) TTGAGCGTTCTAGTGTGTGGCTTGTAATGAA (SEQ ID NO:204) TGAAAGAAATACAATACAACGATAATGACC (SEQ ID NO:205) CTAGTTTTAAGAGATAGCTCTCTAAGTAGG (SEQ ID NO:206) —AAATTCGACATAAGCACTACAGTTATATT (SEQ ID NO:207) CTATTTTCGAGAGAACGTCAGTCATTTTAA (SEQ ID NO:208) GTGCTAACTATATCAGTCGCATCAATAACA (SEQ ID NO:209) TTAGCGGTGATTGGAATAGAATAAGCGAAT (SEQ ID NO: 210) CTTCTACAGCAGTTTAAGACACATTATCAT (SEQ ID NO:211) —CGTATCGAAAACGGCGATAATCCAACAGT (SEQ ID NO:212) E CAATACCTTTTTITAATTCATCTTGATAAGT (SEQ ID NO:213) E TTAAGAACAATATCATCAATACGACTTTCA (SEQ ID NO:214) : CATCTATCAAATTCAAATTCGGATAAACTA (SEQ ID NO:215) TGAGAGTGTCTGATGGATTTATTGGTAACC (SEQ ID NO:216) i 30 —“ACCTCATACATGGGGAAAACTTGTAAGTA (SEQ ID NO:217) f TATTTCACGAATTTCTACACTTTTCAACOT (SEQ ID NO:218) CTGAAACCTTGTTITGAAGCGCTTGGAAGT (SEQ ID NO:219)
GTCAATTGATACTGCAATCTCTTTAACATT (SEQ ID NO:220) ACTTCAATATGGTCAACATCTTGATCACCGA (SEQ ID NO:221) TAAACTCGACAAAAGCACTACATGAATATT (SEQ ID NO:222) ATTTTTTAAGGAAAGGAGGAAAATAATATA (SEQ ID NO:223) CGTTCAAAACAGCGAAAACTTAACCCTAAC (SEQ ID NO:224) CATTAAGTCGCTTGAGGCAGACATTGAAGC (SEQ ID NO:225) CCAAACTCAAATTGTCTATAATAATAACCG (SEQ ID NO:226) TATCTCTATTTCAGGTGGTTTAAAACATTC (SEQ ID NO:227) AAACGAAGATGGAAGCGTTGATGTTTATTC (SEQ ID NO:228) ê 10 GATTGCATTTGCCAGTATTTCTTTTGATTA (SEQ ID NO:229) TGAAGACAACGGAAACAATCAACCTATTA (SEQ ID NO:230) ACTTCTTTTTTAATGTCATCTAAGACAATA (SEQ ID NO:231) GCCAATGATGTTCAATTCGTTAATGGAATT (SEQ ID NO: 232) TCAACATGGGATATTTCGTTGGTCAGGATG (SEQ ID NO:233) TATGGCTCTCTTGTTGGAATAAAGATGATT (SEQ ID NO:234) ATAACATAGCAGTCTATTTCTITTGCTGATG (SEQ ID NO:235) GTTACCACGCGCCCTACTGTATTAGTGGAG (SEQ ID NO:236) TACATACCCAAGGTTGTAAGTCGTTAAATT (SEQ ID NO:237) TGTAAGTAGTCAATATTCACTTCTGATAAC (SEQ ID NO:238) GATAGCAATAGCTTTCTTGACCTAAAAGAC (SEQ ID NO:239) GAGGTCTGTAATTTCATTCCCTCGTAATCT (SEQ ID NO:240) AAAGGTTTCTCTAAACACATGCGGAATAT (SEQ ID NO:241) GTCATAGTACCAAGCACAAATAACGTTAGT (SEQ ID NO:242) GTGTATTTAGTAATGGTGATTTTTTAAATT (SEQ ID NO:243) —CATTCATTTTTTATATATCAATAAAACTTT (SEQ ID N..244) GGGGATTCTTATITCACTGTAGTTACGATG (SEQ ID NO:245) - CAAAAATTGATGTCACAATTAATAAAGGTG (SEQ ID NO:246) É E CTATTTCTGACAATGGTTGAAATTGTGTTC (SEQ ID NO:247) E.
CTTTTTTTAAATTAATTTATCGTAAGCAA (SEQ ID NO:248) —“AACAAACTTATGAGAACGGTTGAACGGCTT (SEQ ID NO:249) f AGCCCGCTTATTGCTTCAGTTGGTTTATAT (SEQ ID NO:250) TGGAGCAACAAGAATGATTAACTCTAATGC (SEQ ID NO:251)
TTTGATGGATATCATTGATAAACTATACGA (SEQ ID N. 252) TAACGAAAGCAATACCAATCGTGCTAAAGC (SEQ ID NO:253) TATTCCTATGGTCGATATTCGAACAGTCAA (SEQ ID NO:254) CAGGGGACAAGGACTTTGACCCAACAGAAG (SEQ ID NO:255)
—AGAAACACCTAATGGTCTCTTAGAACCCGA (SEQ ID NO:256) AAGAAGTTAAAGACAACTTTGTTAAAGACT (SEQ ID NO:257) GAAAAAGCATCCATGATAGTGCTTAGACCT (SEQ ID NO:258) CGGAATGGTATAAAGAATACAAAGAAAACG (SEQ ID NO:259) CCAAGTATCACGCAAAGAAATCAACGAGA (SEQ ID NO:260)
Í 10 TTGACCTGTTITATCCTTGTTAACTAGAATAG (SEQ ID NO:261) AGAGCACTAGCATACTGTTTAGTCCGAACG (SEQ ID NO:262) AGGCAAGGTATTTGATCCAACAGAAGCCAA (SEQ ID NO:263) CATGATTTACAACCACGCGCTAGACCAAG (SEQ ID NO:264) ACCTAGAAGCATTTGAGCGTATATTGATTG (SEQ ID NO:265)
AATTTTGCCCCTTCTITGCCCCTTGACTAG (SEQ ID NO:266) TAATAGTTTACCAAATCGTCCTTGTTCCAA (SEQ ID NO:267) ACCATTAGCAATCATTTGTGCCCATTGAGT (SEQ ID NO:268) ACGTCTGTCTAACTGGAAAGTACCTGTTAAT (SEQ ID NO:269) TTTTTATACTTTGGGTAATTACAAAATAG (SEQ ID NO:270)
—AAGAAAGAAATATTCTAGATATAGATATAA (SEQ ID NO:271) CAACGACCAACACAACAACTAAAGTTACTG (SEQ ID N. 272) TGATTATGGGTGTTAAACAAGGAGCTTATG (SEQ ID NO:273) TGAGTGGTAAGTACAAATACGCAGGACTGA (SEQ ID NO:274) TTATTTCCTCCTTTCCTTAAAAAAATTAGA (SEQ ID NO:275)
GGATGTATCTGTTGAAAGAGGTGTGTATAT (SEQ ID NO:276)
: AATAGGTGAAAAATATGCAAGTCACACAAA (SEQ ID NO:277) - AAAATGGCATTAAAAATTAACATAGGAATA (SEQ ID NO:278) . TATCAGCTCGTAAATGTTCGATAGACTCTT (SEQ ID NO:279) p ATTCCATTAACGTATTTGACTTCACTAGCT (SEQ ID NO:280) —“CTGTTACCGATCCAAGAGCAGACATCATAC (SEQ ID NO:281) E AAGAAGCGGTTAAATGCTTCAACTGAATAG (SEQ ID NO:282) AATTGCTAAACATCTAAAAGACTTAACGGG (SEQ ID NO:283)
GATGAAGATTTGACTGATGATAAAGAGAAA (SEQ ID NO:284) GACATCAGAAAGCAGTTTATAAATATTTTA (SEQ ID NO:285) TTTGAATTTAACAACCTTGATTTTGATATC (SEQ ID NO:286) TGATACGGTCAAAGTTTTTCCACTAATAGCG (SEQ ID NO:287) ATGGTTTTCATITCCTGAACCCCTAAGAGG (SEQ ID NO:288) AAGTTATTGAAAAACGCCAACATGATGAGT (SEQ ID NO:289) ATATAAGTCCTCCTATTAATATCCACAATA (SEQ ID NO:290) TTGCCTCAAGAGATCCTGCTTGTTGCCAAG (SEQ ID NO:291) TCCCATAGTTTTAATGAGTCGGTTAACTTA (SEQ ID NO:292) GTGTACTAAAAGTGTGCTAAGTTCATAAGG (SEQ ID NO:293) ATATAGTGATTGTATCCAGCTGCGGCGTAG (SEQ ID NO:294) AAAAGCAAATCGCGAGTATAAAGGATATA (SEQ ID NO:295) TTTTAATTGATCTAGACACCCTATGAAATA (SEQ ID NO:296) ACAGAGGAGAGAAACCATGGCTATTTTAGA (SEQ ID NO:297) TGGCAGCAGTGAATTCGATGCCGAGCAAT (SEQ ID NO:298) CCAAGGAATACCAGGTCCTAAAGGTGCCGA (SEQ ID NO:299) CTAAATGAACTACAACAACAGCTTGATGA (SEQ ID NO:300) TACCTTAACATTTTCGATATTTTTCAAATT (SEQ ID NO:301) TTTGACTGCTTTTIT ATCTGAATTGTAATT (SEQ ID NO:302) —“CAGTAACCTAAAGCTCTATCAAGCCTATTT (SEQ ID NO:303) CGTCAAGCTGACAGACCTTGACAACAAATC (SEQ ID NO:304) AGGCATAAATAACATTGATAACCCTAACA (SEQ ID NO:305) GCCAACGAGGTCAAATATGTCAACGGCATT (SEQ ID NO:306) GAAATAGGAACTTCAAAGGTAATTTCTTTA (SEQ ID NO:307) ATTTAGAGCAAGGAAAGCAGTACATCATTA (SEQ ID NO:308) É CTGTAATCATTTTTAAATCAGGATTATCAA (SEQ ID NO:309) - TTAAATGTATCCTAGTATTTTTGTACTATA (SEQ ID NO:310) : CCATCAGCCAACTGTATCGGCTACTTTCTA (SEQ ID NO:311) - ATGCTCTTGGCGACTATCTCATGGAGCGTG (SEQ ID NO: 312) —AGGAAAAAACCCAAACAACCCAAAATGTTA (SEQ ID NO:313) as TCTAATTCTGTCACCACGACTATATCGCCA (SEQ ID NO:314) AATCTGTGTGGGAAGTAAAGATTGAAGATG (SEQ ID NO:315)
ATAGTTTGTTAAGTCATACCCATTAAATTG (SEQ ID NO:316) TCCACATGATTACAAAGCCACGCAAGACCT (SEQ ID NO:317) GAAGACCAAAATTTGACAATGAGTCCTGC (SEQ ID NO:318) ATTATATTTAAGTTGTAAATGTTGCTTTTC (SEQ ID NO:319)
— GCAGACATTGGCTCAACAAGTGATTATGAA (SEQ ID NO:320) TGTTCTCATAAATTGCCTTTCCTITTTATG (SEQ ID NO:321) CTTATCAAACATCAAGGATTGTAGATGAGG (SEQ ID NO:322) ATTTCATTAGTAGCTTGATAAATGTTTCTA (SEQ ID NO:323) GAAAATACTATACTTTAAAAGAAATTTTAA (SEQ ID NO:324)
40 TCTCCTCCGACATAATCTITITGTCTITCCG (SEQ ID NO:325) ACAAAAGCACTGCCACCTATAGAAGCATTT (SEQ ID NO:326) AAAAACTTTATGCTATCCGTGTCAGTATAT (SEQ ID NO:327) TTTTCAATGATTGAAAGCCCATAACTAACA (SEQ ID NO:328) CTTTCATAGTTGTTACGAAATGTTTGGCAT (SEQ ID NO:329)
CGATTTGCAATATGATGATATTGATGAATT (SEQ ID NO:330) TTTAGATGCTAGTCCTAAGACTGTAGAGAC (SEQ ID NO:331) GTAATCAAGCGTATATAAGTCAGGACTATC (SEQ ID NO:332) ATAACAGAAGGAGTAGGGGACGTAGGCGCG (SEQ ID NO:333) TTATTTGATAGGAATGTCAGTAATTTTTGA (SEQ ID NO:334) —AACATTTCAGCGCTTACTTATCAATCTAAT (SEQ ID NO:335) GTATTAGTAGGCATACGATTATGGAAGTA (SEQ ID NO:336) CATATATATATATATATTTATTTTAAATAT (SEQ ID NO:337) TTGTCATAATAATTAAATCCAATAGGACTT (SEQ ID NO:338) GAAAATTTCTGTTGTGTTCTTAATATTAGC (SEQ ID NO:339) GTACTTCAAAGGTTCTAACTACATAACACA (SEQ ID NO:340) É TAAAACCAGATGGTGGTTCTTCTGATACTA (SEQ ID NO:341) . CATTTTCTTCAGTCAATTCGTTCTCAAGCG (SEQ ID NO:342) : E AAAGGACGGGGGCAATGAACAAACGACAAC (SEQ ID NO:343) À TAATATCATTGATAGCTTCATCAAAGGCT (SEQ ID NO:344) —TAAATTGTTCCTTGACTCCGAACTGCCCT (SEQ ID NO:345) E.
AAACAATCGTTTATCTATCCTCAAAGGATG (SEQ ID NO:346) ATAAAAAAACGCCTCAAAAACCGAGACAAC (SEQ ID NO:347)
TGGAAATCCCTTATATCGACAAATACGTTA (SEQ ID NO:348) TTCCCAGTCGTTGATTTITTATTGAATACCC (SEQ ID NO:349) GGACATCGAACAAGTCAATGCCGTAAGCTT (SEQ ID NO:350) AATCTTTAACCGGATTGTAGAACCGTTCGG (SEQ ID NO:351) —TGCCTTTAAAATAACTAGATTTTACCATCA (SEQ ID NO:352) GAGCAAGCACAAGCAAGCTTTACTATCCT (SEQ ID NO:353) CAGATTGGTTTATCGAACAAGGTCGCAAGT (SEQ ID NO:354) CAAAAGCTGTTGGTTAACGGTGCTTTGGGCA (SEQ ID NO:355) CTTGTTTTTCCTCTGGGGTCTCTGCGACTT (SEQ ID NO:356) GAAATAAACTGCCCAAACATTTITATTTTC (SEQ ID NO:357) TGAGTAAGCGACAAGCTAGAAATCAAGTCA (SEQ ID NO:358) ATAGCTAAGATGGAAGAAGCATCAAGCACC (SEQ ID NO: 359) CAGTATCTCAAACGCTGGATACAACAAGAT (SEQ ID NO:360) CCTACTCAGTGGACACCTGCAATTGAAGAC (SEQ ID NO:361) CGATTGGAACGGGTGCTTATGGCCTTAAC (SEQ ID NO:362) GCGAACAATTGAATTTGTTAGAAAATGTCG (SEQ ID NO:363) GAAGCATTTATTAATATAGATGGTTCTGCT (SEQ ID NO:364) TGCTGACGTATCTGTCCACTGTGTGCCA (SEQ ID NO:365) TTTTTATACTTTGGGTAAATTACAAAATAG (SEQ ID NO:366) TCAAGGTGTCGCCTTATGGAAAAGATGCTTG (SEQ ID NO:367) TGTAAAAATTTCTAGACGTTTAGACACTTTA (SEQ ID NO:368) AAATGATGATTGAATGCTTGAGATAGCAGT (SEQ ID NO:369) AATAAGAAGTTCTTGACGACCAACCGACAT (SEQ ID NO:370) TCGTCAACGTCGATACAGAACAACGTGCTT (SEQ ID NO:371) —TGATTAGCAAATITTAAAACAGGATATTTGG (SEQ ID NO:372) i AAAGACAAGCCCAAGGGATTGAACTAGCAA (SEQ ID NO:373) - CGAACAGTTGGCGAGAAATCCGTCTGGCGT (SEQ ID NO:374) É : CTACATTATTGATCATGTTTTITTCTCCTGT (SEQ ID NO:375) " TAGAAGGCTCTGGAAATACAAAGCAATTCT (SEQ ID NO:376) | 30 —“TAGAAGGCTCTGGTAAATACAAAGCAATTCT (SEQ ID NO:377) E TCTGATGGCTCTTGGTAGGGAACTGGATAT (SEQ ID NO:378) TTTGATGGCTCTTGGTAGGGAACTGGATAT (SEQ ID NO:379)
TTTTGATGGCTCTTGGTAGGGAACTGGATAT (SEQ ID NO:380) ACAGAACAAAATGGTAGAATATATCATCT (SEQ ID NO:381) CCCTEGACAAGCTATCAGCACATATCCTTG (SEQ ID NO:382) CGCTGTTGATGTAACCCGCTTTATATATAT (SEQ ID NO: 383)
—GAATGAATGTATTAGAGCAAGCACTTGACC (SEQ ID NO:384) TAGACGAAAAGGAAGGAAAATAGCATGAGC (SEQ ID NO:385) ATAACTCGATTGCTAACTTAAGCAAGCAGT (SEQ ID NO:386) CTGCATGTGTAACCATGACTTCTTCGTCGT (SEQ ID NO:387) CTTCGCTGGAAACTTCGTAGTCATACATAC (SEQ ID NO:388)
é 10 AAGACCGCTGTACTGGTTGGTATTCGTACC (SEQ ID NO:389) CAACCAAGCGAACACAGCAGTAGCACCGCA (SEQ ID NO:390) ATGATGATGAAGTATCGTCATCTACTAAC (SEQ ID NO:391) CTTCACCTCAAATCTTAGAGATGGACTAAA (SEQ ID NO:392) AAAAGGTGCGTATGAAACTCATCCCAGCGG (SEQ ID NO:393)
AAGGGTTTAAGTCCTTCATAGAGTGGAAAA (SEQ ID NO:394) CCTCAAAGCTTAAAATTGGGCTGAAGTAGA (SEQ ID NO:395) GCAATTTATTCGCTTGATGTACTCACGTTT (SEQ ID NO:396) TATTTATTGCAAATGGTTACCATATTTTTA (SEQ ID NO:397) TATTTTAGCACTACGGTATCAGCGTATCTC (SEQ ID NO:398)
TGCTACGTGCTCTGGACGGGCGCTATCAGC (SEQ ID NO:399) AAATGAACAGACAAGAAGCAACAGAAATTG (SEQ ID NO:400) AAGTTGATCGTATCTATTTAGAATATCGCA (SEQ ID NO:401) ATTCACTTTGACAGATACTAATGCTACATO (SEQ ID NO:402) CAAGCAGTGTAAAGGTGGTTTATATGTTAA (SEQ ID NO:403)
—CATAGTATAGCCGTCTTCTTTGATTGATTG (SEQ ID NO:404)
CCATGGGTGCTAAAGGTGATGACTACCGCT (SEQ ID NO:405) b TTTCTAGGAATGGGTAATTATAGCGAGCTAGAAAGC (SEQ ID NO:406) ' õ AGTTGGGAAGGTCTTGGAAAATCTATGGCAAAAAACCOT (SEQ ID NO:407) Nasssa 30 —“TATATGGTTCAAATGCGATTCAAAGACTATTCAAA (SEQ ID NO:408) FE TAATTGCCAATGCTTACAATATCTTCGTCA (SEQ ID NO:409) ATGTTCTGAATTACCTTTCTCGACACTCCG (SEQ ID NO:410)
ACCATCAAGGCTCTTATCTGCAGATTGTTA (SEQ ID NO:411) AAATGGTTGCCAATGACTTTCTAGAGTGAT (SEQ ID NO:412) ACAAAATCTTTTGTTGCTCCTGGACGTATT (SEQ ID NO:413) ATGTAAGGTATTGTAAAACTTCTTCTTGCG (SEQ ID NO:414)
—ACTGTTCCTATAATTAAAATAAAAGAGGTA (SEQ ID NO:415) TGTTCCAGTAAAAAGTAATTTTAAAGCATT (SEQ ID NO:416) CGCTCGATTGATGCTATCAACTATATTGAA (SEQ ID NO:417) TTCTTCAAGAGAACTTGTAGAACAGCTTCA (SEQ ID NO:418) AAGGTACTTTTAGCTTGTTCTTGTGGTGTT (SEQ ID NO:419)
t 10 ACAGCTACTGTAAATTCTGCTTTTACGGTT (SEQ ID NO:420) TAGTGCAGTTGTCAAGGAGATTGTGAGCGA (SEQ ID NO:421) TTTAACCTTTGAAAATGTGAAAGGCTCGTA (SEQ ID NO:422) GCGATGATGGTAAGTCATCATGGACAGCGT (SEQ ID NO:423) TTTTACACACGATGTCAGATATAATGTCAA (SEQ ID NO:424)
AGTACTGCACTAGGAATTGTAGAGATCAAA (SEQ ID NO:425) CGTACCATCTATCAATTTACCGCAAGCTGT (SEQ ID NO:426) TTAAAAGATTTAAACTATCAAGCGTCAATT (SEQ ID NO:427) TTCTAAATGCTGGTGACTGCTTTGCATAAA (SEQ ID NO:428) TTGCTGCTAGACCCAAACAGTTTATTTTTAG (SEQ ID NO:429)
TCCTTTTTTAGATAATGTGCGATCACGGAC (SEQ ID NO:430) TTTTACCAATGCTTCCATATCGCTTATAT (SEQ ID NO:431) TGGTTATACATTTACTAATCCATCAGCATT (SEQ ID NO:432) AAGCTAATTCTCATCTCACCGAGATGGATA (SEQ ID NO:433) AAAAACTCTTACCACTTACATACATGTATG (SEQ ID NO:434)
GCTGGAGATTTTACAAGCAGTTTGAATTTC (SEQ ID NO:435)
: ATCACACCAGTCGTTATGATGGATGACTAT (SEQ ID NO:436) - TGTCAACAGTACGTGAGACGAGTGTGTAGG (SEQ ID NO:437) í TGAAGTTGATGGATATGTTGATTTAGAGCT (SEQ ID NO:438) TAATCATTTTATGAGAGATACCGCCTCAAG (SEQ ID NO:439) Fa 30 —TTTAAAGAGATATCTGTITTCATCTTGCGGA (SEQ ID NO:440) ia AATCACTTCTGCATAAATATCTTTTACTTC (SEQ ID NO:441) AAACATCCGCAACGGGATAAATAAAGCTAG (SEQ ID NO:442)
AGTTTCTTGTGGGTTAGCTTGTCCACCGTA (SEQ ID NO:443) GAACATGAAAGATTTTAAAAAAGAACATTT (SEQ ID NO:444) AGAGGGGAAAATATCAATGCCGAATGCTGA (SEQ ID NO:445) GATGGTACAAAATCATTTGTTGGTACTGAT (SEQ ID NO:446)
—AAAAGGAAACGCCATTAATTAATATGGTGA (SEQ ID NO:447) GATTGAACCAGCTAGCGCAGTTAGTGCTCT (SEQ ID NO:448) CGCTAAAAGCTGTTGTGTCATCATAGTTAG (SEQ ID NO:449) TAAATATTTTCAATTAGACAATAGACAAAC (SEQ ID NO:450) TGCCTATGTATTCGGACATGACTTGCCACA (SEQ ID NO:451)
ATGTGAAAAGAAAGTAACTACTACATTTGA (SEQ ID NO:452) TGCGCTGGTTGATTTCTTCTTGCGCTTTTT (SEQ ID NO:453) TTATATGAACATAACTCAATTTGTAAAAAA (SEQ ID NO. 454) AGGAATATCCGCAATAATTAATTGCGCTCT (SEQ ID NO:455) TAAATTTGTTTAGCAGGTAAACCGTGCTTT (SEQ ID NO:456)
TTCAGCACACTGAGACTTGTTGAGTTCCAT (SEQ ID NO:457) CTGTGACATTGCGGGATGTAATCAAAGTAAAAA (SEQ ID NO:458) AAAGCAAACCTAGCAGAAGCAGAAAATGACTT (SEQ ID NO:459) TGATGTAATTGGTGATTTTCGTGATATGCTTTTT (SEQ ID NO:460) CAACACATTCAACAGATTAATGAAGAATAC (SEQ ID NO: 522)
TCCACTCACGTACAAATAGTGAGTGTACTC (SEQ ID NO:523) GCCCTTCTAATTGGATTACCTTCCGAGGTG (SEQ ID NO: 524) CTCAGTCGTTACTGGTGAACCAGTTTCAAT (SEQ ID NO:525) ATTGTCTATTACGACAACATGGAAGATGAT (SEQ ID NO: 526) GAGTTTCTTTGTCAGACTCTAACACAGCCGC (SEQ ID NO: 527)
TTACTAGAGCGTGTCGTTAACCACTTTAAA (SEQ ID NO:528)
i TTCGTTAAAGTCACCTCGTGCTAGCGTTGC (SEQ ID NO:529) . ATAACGGTAGCAAATATAAACCTGTTACTG (SEQ ID NO:530) : e GAAGTAGCCATACAAGAAGATGGATCAGCA (SEQ ID NO:531) ATGTCACTGAGTGTCTAAGCATTGCGTAC (SEQ ID NO:532) ea 30 —“TGAATAAGCAGTTCTTGACGACCAACCGAC (SEQ ID NO:533) Ni TTACGTTTGAAAAGAATATCAAATCAATGA (SEQ ID NO:535) GCTCTACGACTTCTTCCACGAGTTCCTGCC (SEQ ID NO:536)
AACACAGCAAGACAAGAGGATGATGCTATG (SEQ ID NO: (SEQ ID NO:537)
AAGTAGTTGATGACCTCTACAATGGTTTAT (SEQ ID NO: 538) AATAATTTATGGTATAGCTTAATATCATTG (SEQ ID NO: 539)
—AATCAATACGACAAGAGTTAAAATGGTCTT (SEQ ID NO: 540) AATCGTTCAAATTCTGTTTTAGGTACATTT (SEQ ID NO:541) AATGACGAGGAGCTATTGGCACAACTTACA (SEQ ID NO: 542) AATTAAGGGCATAGAAAGGGAGACAACATG (SEQ ID NO:543) ACAATTCTTCATCCGGTAACTGCTCAAGTG (SEQ ID NO: 544)
ACACTTGGCAGGCTTATTACTCAACAGCGA (SEQ ID NO: 545) ATAAACTATGAAATTTTATAATTTTTAAGA (SEQ ID NO: 546) ATAACTGAAGGATAGGAGCTTGTAAAGTCT (SEQ ID NO: 547) ATAATGCCGTTGAATTACACGGCAAGTCA (SEQ ID NO:548) CAACCAACGGTAACAGCTACTTTTTACAGT (SEQ ID NO: 549)
CATAGAGTGGAAAACTAGAAACAGATTCAA (SEQ ID NO:550) CGACACAAGAACGTATGCAAGAGTTCAAG (SEQ ID NO:551) CGATATTTAAAATCATTTTCATAACTTCAT (SEQ ID NO: 552) CGATTTGACAATCTGCTGACCACTGTTATC (SEQ ID NO:553) CTGTTCCTTGTTCTIITGITGTATCTTTITC (SEQ ID NO: 554)
GAGCGAGCTCGAAATAATCTTAATTACAAG (SEQ ID NO:555) GCAGTATCAGCAAGCAAGCTGTTAGTTACT (SEQ ID NO: 556) GCTGGCGAGGAAACGAACAAGGCCTCAACA (SEQ ID NO:557) GCTTAGCTGTCCAATCCACGAACGTGGATG (SEQ ID NO:558) GGCGTCCCAATCCTGATTAATACTTACTCG (SEQ ID NO: 559)
—GTTCGCTAGCGTCATGTGGTAACGTATTTA (SEQ ID NO:560)
É TCTATATCGAGGTCAACTAACAATTATGCT (SEQ ID NO:561) TGCATCGAGCACGTTCGAGTTTACCGTTTC (SEQ ID NO:562) iss.
TGTTTGACAGCAAATCAAGATTCGAATTGT (SEQ ID NO:563) | TTCATTCTTCCGTTTTTGTITGCGAATCCT (SEQ ID NO:564) “= 80 TGACTTAGCGAATITAATCGCTAAGATATC (SEQ ID NO:565) s TTTATACTTTATCTTTTTAAAGAATGTATT (SEQ ID NO:566) CCTAAAATCATTTTCAACGAGTTGCGATAC (SEQ ID NO:567)
AATAAATTGCTATGATACAGCGTACCGATA (SEQ ID NO:568) TGCTCTCTATGCGATTGGACGTCTGTCTAA (SEQ ID NO:569) AAGAAAGATAAGAAAAAAGTAACACTACTT (SEQ ID NO:570) TCTCTTTCCATCGGTACTGGTATATCTCAT (SEQ ID NO:571)
—ATTGGTAGCCAAGTAAATATCACCATTGAT (SEQ ID NO:572) TTCTTCAAATTCACCGACTGCAAAATTAÇCA (SEQ ID NO:573) GCTTCCTAAGTGCATGAAAATCGCAAACGG (SEQ ID NO:574) TATACCTGTCTATGTAAGGGAATTTAACTC (SEQ ID NO:575) GGTGTAGGTGCTGTTGGTAAGTTGTTTAAT (SEQ ID NO:576)
GTGAAACAGGTTATCAAAAAACGTATATTG (SEQ ID NO:577) TTATTCTTGGAATTATTACAGACCCTACTA (SEQ ID NO:578) GCTTTCATTATATCACTTACTCATAAATOT (SEQ ID NO:579) TAATCACCCCTTTTTCTAGCTCTTGATTGA (SEQ ID NO:580) CAAGCAGTGTAAAGGTGGTTTAAATGTTAA (SEQ ID NO:581)
AACCCGCGTGGTTATGGGCTTGAGGAGTGT (SEQ ID NO:582) ATATTAATAGCGATTCTATGCTACAACGTG (SEQ ID NO:583) TCATCTTCTAAGTAAATACCACTGTCAGGG (SEQ ID NO:584) TTTTCGCAAAGTAAGCGAAGCTCTACGTG (SEQ ID NO:585) TTCTGTAGCCACTCCGTGGATGCCTTCAGC (SEQ ID NO: 586)
TTCTTTAGTTOGGACACCCTCAACACCTAT (SEQ ID NO: 587) GCTTTGATTGGACGGAAAATGGTATCCCTG (SEQ ID NO:588) TTCCTCATCTTTCTCCGCTTTTGCTAGACTT (SEQ ID NO:589) TTAGACCAGATGGACAGATATTCTTCATCG (SEQ ID NO:590) TCATCAGAGTCAACAATCACGGGAAAGACCT (SEQ ID NO:591)
ACACTCATCCTTATCCTGTAGTTCAAAACA (SEQ ID NO:592)
CAGCACTAGCCGCAAGCCCTTGTATATTAA (SEQ ID NO:593) h TAGAAATCAAGGAACTTGGATGAAAAGTAA (SEQ ID NO:594) i - ATATGAAAGGGAAATGATATGAAGAATGAA (SEQ ID NO:595) TTTTGGGATACAACACGCAGTCGTTGACTTG (SEQ ID NO:596) oa 30 —“GTTTGAGATGCCAATGTTTTTCAATCCTTG (SEQ ID NO:597) "A GTATCAAAAGACGCATTCATGAAGCGAGCT (SEQ ID NO:598) AAAAACAATTGAAATTCATAATCAGCGCTT (SEQ ID NO:599)
GCTTTTAACGTTTTAAGAGAATACCCTCT (SEQ ID NO:660) GTGACGCTGCAATGACTTGCCATAGTAATT (SEQ ID NO:601) ATACTGGTATATAGTAATTCATACTTCATC (SEQ ID NO:602) TTGGTTTCATATTTACTCCTTTGTGTTTTG (SEQ ID NO:603)
CTGATTTGGTCTTGTTCTTTTGTCCCTTTT (SEQ ID NO:604) GCAGCAGTTGAGAACTTTAGCGTCCAGTGG (SEQ ID NO:605) TGCTACTATGAAGGACGCTGTTGATACTTT (SEQ ID NO:606) TCTTCTTTAATCTTTTTTAACGTCAACGTT (SEQ ID NO:607) GTATCCATTAATATAGTAGCATTTCTATCA (SEQ ID NO:608)
ATTCATTAATATCTGCAAGGATGTCTTGTT (SEQ ID NO:609) GAGAAAGTAGCCCATTCGGCCCATTCGGGG (SEQ ID NO:610) TACTTGAGTTAGCTCTGGAAGTCATTTATC (SEQ ID NO:611) CTGCATTTGTAACCATGACTTCTTCGTCGT (SEQ ID NO:612) AATTTGTCATCGACATCTACCAACGCCCAG (SEQ ID NO:613)
ATAAAATTATGCCACGTTTTGGCACTAGAT (SEQ ID NO:614) ATGTCTCTGAGGCTGTAGTAATTTACTTGT (SEQ ID NO:615) CTTTAAAGAGTTGATTAAGTGCGTTACTGT (SEQ ID NO:616) AAATGGGTTATGCTGTTCAATATGCGTCCC (SEQ ID NO:617) AAACTGAAAACAACACAGACAATTCAACAA (SEQ ID NO:618)
—GCCCAAAATGCTAGACGTTTGAATGACGGC (SEQ ID NO:619) ATGAAGAACGTGATTCACCTACGGTATGCT (SEQ ID NO:620) GCTTTTGCAGAATTGTCTCCAGTGCCGATTT (SEQ ID NO:621) TGTACTCTATTGATTGCTTCATCTTTATTA (SEQ ID NO:622) CTTTCAAGATACTCATCAACCATTGATGTCA (SEQ ID NO:623)
CTATGTCTTTACTGTTCTTCCAAAACCACC (SEQ ID NO:624)
É TGCTACGTGCTCTGTACGGGCGCTATCAGC (SEQ ID NO:625) : CGTEGCAGCETEGTCEGGTTTAATAGCCCG (SEQ ID NO: 626) ; AAGCCCAAGTCAGAGCATCCGTCCAAGCC (SEQ ID NO:627)
ATTGGGTTTCGGTAAGAACTAAACATACCA (SEQ ID NO:628) Mesas. 30 — CACAAAATAATTCGGTAGTTTTTACTAACT (SEQ ID NO:629) ro TTTGACCGTTTATTTAGACGTGCTAAAGT (SEQ ID NO:630) CTTCACCTCAAATCTTAGAGCTGGACTAAA (SEQ ID NO:631)
ATGTCTGAAAAATAACCGACCATCATTACT (SEQ ID NO:632) GAAGCTCATCATGTTAAGGCTAAAACCTAT (SEQ ID NO:633) TAGTCTAAATAGATTTCTTGCACCATTGTA (SEQ ID NO:634) ATTCGTGAAAAAATATCGTGAAATAGGCAA (SEQ ID NO:635)
TCTAGGCTCATCTAAAGATAAATCAGTAGC (SEQ ID NO:636) TAAAAACATGGGGCGGCGGTAATAGTGTAAG (SEQ ID NO:637) ACAACCAGCAAAGAGAGCGCCGACAACATT (SEQ ID NO:638) TATAACACAGGTTTAGAGGATGTTATACTT (SEQ ID NO:639) CTAGAAGCTCAAGCGGTAAAAGTTGATGGCG (SEQ ID NO:640)
CTTTGAGGGCAAGCCCTCGCCGTTCCATTT (SEQ ID NO:641) AACTACCAAGCAAATCAGCAATCAATAAGT (SEQ ID NO:642) CTATAAGTGACAATCAGCGTAGGGAATACG (SEQ ID NO:643) ATCAGTGCGGTATATTTACCCTAGACGCTA (SEQ ID NO:644) AACAGTTACTATTAATCACGATTCCAACGG (SEQ ID NO:645)
AATTAGGGCGTCTTCCTITTATTCCGTGGTT (SEQ ID NO:646) ATAGCTTCATTGCGCTTTTTAATTTGACOCT (SEQ ID NO:647) AACAACAAAGCAAATACAACAGTAACAACC (SEQ ID NO:648) CTAAACTACGTTTGAAGGTCTCAACTCCGT (SEQ ID NO:649) GAGGTTGAATAGTGAGTGCACCATGTTTGT (SEQ ID NO:650)
—AGTAGAGAGACCAGCACACTACTGTACTAC (SEQ ID NO:651)
. CTTCGCACGAAAGTTTATTAGACAACTCGC (SEQ ID NO:652) TGATAGAGCTAGAATTGTCTTTTTTACCGA (SEQ ID NO:653) AGATACTCTTGCTCGCCTCTGAACAACCAG (SEQ ID NO:654) GGTGAAAAAGGTTCACTGTACGAGTACTTA (SEQ ID NO:655)
TCAATGAGTGGTATCCAAGACGAAAACTTA (SEQ ID NO:656)
À CCTTETCGTGECTCTCCATACGCCCATATA (SEQ ID NO:657) E: TGTTTGGGAAACCGCAGTAGCCATGATTAA (SEQ ID NO:658) É h ACAGAGTACAATATTGTCCTCATTGGAGACAC (SEQ ID NO:659) CTCATATTCGTTAGTTGCTTTTGTCATAAA (SEQ ID NO:660) SANNEe. 30 — AGAACTTTATCAAGATAAAACTACTTTAAA (SEQ ID NO:661) + ATAGTATTAATTTCATTGAAAAATAATTGT (SEQ ID NO:662) GCTTTCTAGCTCGCTATAATTACCCATTCCOTAGAAA (SEQ ID NO:663)
TCAAAATATGTTATTACCTTGTATTTCATAATTCAATTAA (SEQ ID NO:664) CCACTTGCTGTGTACATCCTACCAGTTCCGCCTATGATG (SEQ ID NO:665) Em modalidades particularmente preferenciais, os espaçadores de CRISPR são flanqueados por duas repetições de CRISPR (isto é, uma —CRISPR espaçadora que tem pelo menos uma repetição de CRISPR em cada lado). Embora não seja destinado que a presente invenção seja limita- da a qualquer determinado mecanismo, teoria, ou hipótese, é contemplado ainda que uma dada CRISPR espaçadora é da extremidade 5' do /ocux de CRISPR compreendendo gene(s) cas e/ou sequência líder, é a menor resis- tência conferida por aquela CRISPR espaçadora. Dessa maneira, em algu- mas modalidades da presente invenção, uma ou mais das primeiras 100 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modifica- das, enquanto em outras modalidades, uma ou mais das primeiras 50 CRISPR espaçadoras da extremidade 5' do /ocux de CRISPR são modifica- das. Em algumas modalidades adicionais, uma ou mais das primeiras 40 CRISPR espaçadoras da extremidade 5' do /locux de CRISPR são modifica- das, enquanto em algumas modalidades ainda adicionais, uma ou mais das primeiras 30 CRISPR espaçadoras da extremidade 5' do /ocux de CRISPR são modificadas, e ainda em modalidades adicionais, uma ou mais das pri- —meiras20 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modificadas, e ainda em mais modalidades, uma ou mais das primeiras 15 CRISPR espaçadoras da extremidade 5' do /locux de CRISPR são modifica- das. Em algumas modalidades preferenciais, uma ou mais das primeiras 10 CRISPR espaçadoras da extremidade 5' do locux de CRISPR são modifica- das. Como indicado neste pedido, bactérias diferentes têm números diferen- í tes de CRISPR espaçadoras, dessa forma em algumas modalidades, vários : espaçadores são modificados.
ias Núcleo de CRISPR Espaçadora Para um tipo de CRISPR específica em uma espécie microbia- R 30 —na,aCRISPR espaçadora é tipicamente representada por um tamanho pre- — dominante definido, embora o tamanho possa variar. Tipos de CRISPR des- critas até agora foram encontradas contendo um tamanho de espaçador predominante de entre aproximadamente 20 bp e aproximadamente 58 bp.
Como usado neste pedido, o termo "núcleo de CRISPR espaça- dora" refere-se ao tamanho do espaçador observado mais curto dentro de um tipo de CRISPR.
Dessa maneira, por exemplo, dentro de S. thermophilus 85 —CRISPR Tipo 1 (CRISPR1), o tamanho de espaçador dominante é 30 bp, com uma minoria de espaçadores entre 28 bp e 32 bp em tamanho.
Dessa maneira, em S. thermophilus CRISPR Tipo 1, o núcleo de CRISPR espaça- dora é definido como um intervalo contínuo de 28 bp.
Em algumas modalidades preferenciais da presente invenção, o núcleo de CRISPR espaçadora é homólogo ao ácido nucleico-alvo, um pro- duto de transcrição do mesmo, ou uma sequência identificada além do ta- manho da sequência núcleo.
Como indicado acima, embora a homologia : também possa ser considerada em termos de similaridade, em algumas mo- dalidades preferenciais da presente invenção, a homologia é expressa em termos de identidade de sequência.
Dessa maneira, em algumas modalida- des, uma sequência homóloga engloba um núcleo de CRISPR espaçadora, que pode ser pelo menos aproximadamente 90% idêntico, ou pelo menos aproximadamente 91, aproximadamente 92, aproximadamente 93, aproxi- madamente 94, aproximadamente 95, aproximadamente 96, aproximada- mente 97, aproximadamente 98 ou aproximadamente 99% idêntico à se- i quência-alvo de ácido nucleico, um produto de transcrição do mesmo, ou uma sequência identificada além do tamanho da sequência núcleo.
Em al- gumas modalidades particularmente preferenciais, o núcleo de CRISPR es- paçadora é aproximadamente 100% idêntica a sequência-alvo de ácido nu- cleico, produto de transcrição do mesmo, ou sequência identificada além do E tamanho da sequência núcleo.
F Durante o desenvolvimento da presente invenção, as sequên- f cias de CRISPR de várias cepas de S. thermophilus, incluindo cepas indus- | triais estreitamente relacionadas e variantes resistentes ao fago foram anali- ao 30 — sadas.
As diferenças no número e tipo de espaçadores foram observadas -- principalmente no /ocux de CRISPR1. Notavelmente, a sensibilidade ao fago pareceu ser correlacionada com o conteúdo de CRISPR1 espaçadora.
Es-
pecificamente, o conteúdo de espaçador foi quase idêntico entre cepas pa- rentais e derivadas resistentes ao fago, exceto por espaçadores adicional presentes no último.
Estes achados sugeriram uma relação potencial entre a presença de espaçadores adicionais e diferenças observadas na sensibili- — dade aofagode uma dada cepa.
Esta observação incitou a investigação da origem e função de espaçadores adicionais presentes em mutantes resisten- tes ao fago.
Espaçador de Pseudo-CRISPR .: Como usado neste pedido, o termo "pseudo CRISPR espaçado- ra" refere-se a uma sequência de ácido nucleico presente em um organismo (por exemplo, um organismo doador, incluindo, mas não limitado ao bacte- riófago), que é preferencialmente essencial para função e/ou sobrevivência €/ou replicação e/ou infectividade, etc., e que compreende uma sequência de CRISPR espaçadora.
Em algumas modalidades, as pseudo CRISPR es- paçadoras encontram uso na produção de sequências CRISPR espaçadoras que são complementares a ou homólogas à pseudo CRISPR espaçadora.
Em algumas modalidades particularmente preferenciais, estas sequências encontram uso na modulação de resistência.
Em algumas modalidades, pelo menos uma pseudo CRISPR —espaçadora e CRISPR espaçadora(s) que é/são complementar ou homóloga a pelo menos uma pseudo CRISPR espaçadora(s) são usadas para constru- ir uma célula-recipiente.
Em algumas modalidades preferenciais, pelo menos pseudo CRISPR espaçadoras ou CRISPR espaçadora(s) que é/são com- plementar ou homóloga a pelo menos uma pseudo CRISPR espaçadora(s) são usadas em combinação com um ou mais genes ou proteínas cas e/ou á uma ou mais repetições de CRISPR (por exemplo, uma ou mais combina- : ções funcionais das mesmas), para construir uma célula-recipiente, tal que a Á E resistência da célula-recipiente é modulada contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
SAENSE 30 Em algumas modalidades, as pseudo CRISPR espaçadoras ou mo CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) são inseridas no plasmídeo e/ou DNA genômico de uma célula-recipiente usando qualquer método adequado co- nhecido na técnica.
Em algumas modalidades adicionais, as pseudo CRISPR espa- çadoras são usadas como um molde sobre o qual a modificação (por exem- — plo, mutação) do DNA plasmidial e/ou genômico de uma célula-recipiente, tal que as CRISPR espaçadoras são criadas no DNA plasmidial e/ou genômico da célula.
Em algumas modalidades adicionais, as pseudo CRISPR espaça- doras ou CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) são clonadas em um construto, plasmídeo e/ou vetor, etc. é/são introduzida na célula-hospedeira usando qualquer método adequado conhecido na técnica.
CAS e Genes cas Como usado neste pedido, o termo "gene cas" tem a significa- ção convencional como usado na técnica e refere-se a um ou mais genes cas que são geralmente ligados, associados ou próximos ou na vizinhança dos locide CRISPR flanqueadores.
Uma revisão compreensiva da família de proteína Cas é apresentada por Haft et a/. (Haft et al, PLOS.
Comput.
Biol., 1(6): e60 [2005]), em que 41 famílias do gene (cas) associadas a CRISPR recentemente são descritas, além das quatro famílias gênicas anteriormente conhecidas.
Como indicado neste pedido, os sistemas de CRISPR perten- É cem a classes diferentes, com padrões de repetição diferentes, conjuntos de genes e variadas espécies.
Como indicado neste pedido, o número de genes cas em um dado locux de CRISPR pode variar entre as espécies.
Em algumas modalidades, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas, sozinhos : ou em qualquer combinação com uma ou mais CRISPR espaçadoras para . modulação da resistência em uma célula (por exemplo, uma célula- é " recipiente) contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
Fes 30 Em algumas modalidades, um ou mais dos genes e/ou proteínas -r cas ocorrem naturalmente em uma célula-recipiente e um ou mais espaça- dores heterólogos é/são integrados ou inseridos adjacentes a um ou mais dos genes ou proteínas cas. Em algumas modalidades, um ou mais dos ge- nes e/ou proteínas cas é/são heterólogos à célula-recipiente e um ou mais dos espaçadores é/são homólogos ou heterólogos. Em algumas modalida- des preferenciais, os espaçadores estão integrados ou inseridos adjacentes aumoumaisdos genes ou proteínas cas.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos e composições para o uso de um ou mais genes ou proteínas cas e pelo menos duas repetições de CRISPR para modulação da resistên- cia em uma célula (por exemplo, uma célula-recipiente) contra um ácido nu- ( 10 — cleico-alvo ou um produto de transcrição do mesmo.
Ainda em modalidades adicionais, a presente invenção fornece métodos e composições para o uso de um ou mais genes ou proteínas cas, pelo menos duas repetições de CRISPR e pelo menos uma CRISPR espa- çadora para modulação da resistência em uma célula (por exemplo, uma — célula-recipiente) contra um ácido nucleico-alvo ou um produto de transcri- ção do mesmo.
Estruturas de CRISPR são tipicamente encontradas na vizinhan- ça de 4 genes denominados cas1 a cas4. O arranjo mais comum destes ge- nes é cas3-cas4-cas1-cas2. A proteína Cas3 parece ser uma helicase, ao passo que Cas4 se parece com a família RecB de exonucleases e contém Ê um motivo rico em cisteína, sugestivo de ligação de DNA. Cas! é geralmente altamente básica e é a única proteína Cas encontrada sistematicamente em todas as espécies que contêm loci de CRISPR. Cas2 continua sendo carac- terizada. cas1 a 4 são tipicamente caracterizadas pela sua maior proximida- —dedolocide CRISPR e sua ampla distribuição através das espécies bacte- É rianas e arqueanas, Embora não todos os genes cas1 a 4 se associem com F todos os locide CRISPR, são todos encontrados em múltiplos subtipos.
 . Além disso, há outro grupo de três genes associados a estrutu- ras CRISPR em muitas espécies bacterianas, mencionadas neste pedido Sc 80 comocas B, cas5 e cas6 (Vide, Bolotin et al., [2005], supra). É observado = que a nomenclatura dos genes cas é em fluxo. Dessa maneira, o texto neste pedido deve ser tomado no contexto. Em algumas modalidades, o gene cas é selecionado a partir de cas1, cas2, Ccas3, cas4, cas1B, cas5 e/ou cas6. Em algumas modalidades preferenciais, o gene cas é casf. Ainda em outras modalidades, o gene cas é selecionado a partir de fragmentos, variantes, homólogos de cas1, cas2, cas3, cas4, cas1B, cas5 e/ou cas6 e/ou derivados —dosmesmos.Em algumas modalidades adicionais, uma combinação de dois Ou mais genes cas encontra uso, incluindo quaisquer combinações adequa- das, incluindo aquelas fornecidos em WO 07/025097, incorporado neste pe- dido por referência. Em algumas modalidades, uma pluralidade de genes cas é fornecida. Em algumas modalidades, há uma pluralidade de diferentes e/oumesmos genes cas, ou qualquer combinação dos mesmos, conforme WO 07/025097.
Em algumas modalidades, os genes cas compreendem DNA, enquanto em outras modalidades, cas compreendem RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras — modalidades, é de origem sintética ou recombinante. Em algumas modalida- des, os genes cas são dupla fita ou de fita simples se representando a fita de Senso ou antissenso ou combinações das mesmas. Em algumas modalida- des, genes cas são preparados pelo uso de técnicas de DNA recombinante (por exemplo, DNA recombinante), como descrito neste pedido. Como descrito neste pedido, em algumas modalidades, o gene É cas compreende um fragmento de um gene cas (isto é, este fragmento do gene cas compreende uma porção de uma sequência de tipo selvagem). Em algumas modalidades, a sequência compreende pelo menos aproximada- mente 30%, pelo menos aproximadamente 40%, pelo menos aproximada- mente 50%, pelo menos aproximadamente 60%, pelo menos aproximada- mente 65%, pelo menos aproximadamente 70%, pelo menos aproximada- bp mente 75%, pelo menos aproximadamente 80%, pelo menos aproximada- E : mente 85%, pelo menos aproximadamente 90%, pelo menos aproximada- mente 95%, pelo menos aproximadamente 96%, pelo menos aproximada- aa 30 mente 97%, pelo menos aproximadamente 98%, ou pelo menos aproxima- re damente 99% da sequência de tipo selvagem. Em algumas modalidades é preferencial que o gene cas seja o gene cas que está muito próximo à sequência líder ou primeira repetição de CRISPR na extremidade 5' do locux de CRISPR - tal como cas4 ou cas6. Em algumas modalidades, a proteína Cas é selecionada a partir de Casl, Cas2, Cas3, Cas4, CaslB, Cas5 e/ou Cas6, bem como fragmentos, variantes, homólogos e/ou derivados dos mesmos. Em algumas modalida- des adicionais, a proteína Cas é selecionada a partir de Casl, Cas2, Cass, Cas4, CaslB, Cas5 e/ou Cas6, e combinações das mesmas, como descrito em WO 07/025097. Ainda em modalidades adicionais, a proteína Cas é se- lecionada a partir de um ou mais de Casl, Cas2, Cas3, Cas4, Cas1B, Cas5 e/ou Cas6 ou uma pluralidade das mesmas e/ou diferentes proteínas Cas, em qualquer número e/ou combinação adequada.
O termo "proteína Cas" também engloba uma pluralidade de pro- teínas Cas (por exemplo, entre aproximadamente 2 e aproximadamente 12 proteínas Cas, mais preferencialmente, entre aproximadamente 3 e aproxi- —madamente 11 proteínas Cas, mais preferencialmente, entre aproximada- mente 4 e aproximadamente 10 proteínas Cas, mais preferencialmente, en- tre aproximadamente 4 e aproximadamente 9 proteínas Cas, mais preferen- cialmente, entre aproximadamente 4 e aproximadamente 8 proteínas Cas, e mais preferencialmente, entre aproximadamente 4 e aproximadamente 7 genes de proteína; tal como 4, 5,6, ou 7 proteínas Cas).
Em algumas modalidades, as proteínas Cas são codificadas por genes cas compreendendo DNA, enquanto em outras modalidades, cas compreende RNA. Em algumas modalidades, o ácido nucleico é de origem genômica, enquanto em outras modalidades, é de origem sintética ou re- —combinante. Em algumas modalidades, genes cas que codificam a proteína Í Cas são dupla fita ou de fita simples se representando a fita de senso ou antissenso ou combinações das mesmas. Em algumas modalidades, genes cas são preparados pelo uso de técnicas de DNA recombinante (por exem- ! plo, DNA recombinante), como descrito neste pedido. iásana- 30 A presente invenção também fornece métodos para identificação qe de um gene cas para uso na modulação da resistência de uma célula contra um ácido nucleico-alvo ou produto de transcrição do mesmo compreendendo as etapas de: preparação de uma célula compreendendo pelo menos uma CRISPR espaçadora e pelo menos duas repetições de CRISPR; engenharia da célula tal que compreenda pelo menos um gene cas; e determinação se a célula modula a resistência contra o ácido nucleico-alvo ou produto de trans- criçãodo mesmo, em que a modulação da resistência da célula contra o áci- do nucleico-alvo ou produto de transcrição do mesmo é indicativa que o ge- ne cas é útil na modulação da resistência da célula.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos e um ou mais dos genes cas úteis na construção de células (por exemplo, células-recipientes). Em algumas modalidades preferenciais, um ou mais genes cas são usados para construir uma célula (por exemplo, uma célula-recipiente), que em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e uma ou mais CRISPR espaçadoras encontram uso na modulação da resistência de uma célula contra um ácido —nucleico-alvo ou um produto de transcrição do mesmo. Por exemplo, em al- gumas modalidades o gene(s) cas é/estão inserido no DNA de uma célula (por exemplo, DNA plasmidial e/ou genômico de uma célula-recipiente) u- sando qualquer método adequado conhecido na técnica. Em algumas moda- lidades adicionais, os genes cas são usados como um padrão sobre a qual a modificação (por exemplo, mutação) do DNA de uma célula (por exemplo, DNA plasmíidial e/ou genômico de uma célula-recipiente), tal que os genes cas são criados ou formados no DNA da célula. Em algumas modalidades, Os genes cas estão presentes em pelo menos um construto, pelo menos um plasmídeo, e/ou pelo menos um vetor que então é introduzido na célula, u- —sando qualquer método adequado conhecido na técnica. É Em algumas modalidades, os genes cas compreendem pelo ! menos um grupo cas selecionado a partir de uma ou mais das SEQ ID á NOS:461, 466, 473, 478, 488, 493, 498, 504, 509 e 517. Em modalidades adicionais, os genes cas compreendem qualquer uma ou mais das SEQ ID eee 30 —NOS:462 a 465,467 a 472,474a477,479 a 487, 489 a 492, 494 a 497, 499 Ee a 503, 505 a 508, 510 a 517, usadas sozinhas ou em conjunto em qualquer combinação adequada. Em algumas modalidades preferenciais, o grupo(s)
é/são usado em combinação com uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e opcionalmente uma ou mais CRISPR espaça- doras. Em algumas modalidades adicionais, um ou mais genes ou proteínas cas é/são usado em combinações adequadas.
Como indicado neste pedido, um dado conjunto de genes ou proteínas cas está sempre associado com uma dada sequência repetida em um determinado /ocux de CRISPR. Dessa maneira, genes ou proteínas cas parecem ser específicos para uma dada repetição de DNA (isto é, genes ou proteínas cas e a sequência repetida formam um par funcional).
Consequentemente, combinações particulares de um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são usadas a fim de uma CRISPR espaçadora para conferir resistência contra um ácido nucleico-alvo ou produto de transcrição do mesmo em uma célula (por exemplo, uma célula-recipiente). Consequen- temente, foi surpreendentemente encontrado que não é possível usar sim- plesmente qualquer gene ou proteína cas ou qualquer repetição de CRISPR. Em vez disso é uma característica da presente invenção que a combinação seja funcional.
No contexto do gene de repetição CRISPR-cas ou combinação proteica descrita neste pedido, o termo "funcional" significa que a combina- ção é capaz de conferir resistência a um ácido nucleico-alvo ou um produto de transcrição do mesmo quando usado em conjunto com uma CRISPR es- paçadora que se alinha com ou é homóloga a um ácido nucleico-alvo ou produto de transcrição do mesmo. Como usado neste pedido, os termos “combinação de repetição CRISPR-cas funcional" e "combinação gênica de repetição CRISPR-cas funcional" incluem uma combinação funcional na qual : cas é um gene cas ou uma proteína Cas. À o Apropriadamente, um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são deri- iâsaar 30 vadasda mesma célula (por exemplo, a mesma célula-recipiente). Em algu- UT mas modalidades, o termo "derivável" é sinônimo do termo "obtenível", como usado no contexto. Em algumas modalidades preferenciais, o termo "derivá-
vel" é também sinônimo de "derivado", como usado no contexto, já que não é destinado que a presente invenção seja especificamente limitada a ele- mentos que são "derivados". Em algumas modalidades, o termo "derivado" é sinônimo do termo "obtido", como usado no contexto.
Em algumas modalidades, um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são derivadas do mesmo locux de CRISPR em um genoma ou plasmídeo, preferencialmente um genoma ou plasmídeo da mesma cepa, espécies ou gêneros. Em algumas modalidades adicionais, um ou mais genes ou proteí- nas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são derivadas do mesmo flocux de CRISPR em um genoma ou plasmídeo único, preferencialmente um genoma ou plasmídeo único da mesma cepa, espécies ou gêneros. Em algumas modalidades, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR coocorrem naturalmente. Ainda em modalidades adi- cionais, um ou mais genes ou proteínas cas e uma ou mais, preferencial- mente, duas ou mais repetições de CRISPR coocorrem naturalmente na mesma célula (por exemplo, célula-recipiente). Em modalidades adicionais, um ou mais genes ou proteínas cas e uma ou mais, preferencialmente, duas —oumais repetições de CRISPR coocorrem naturalmente no mesmo genoma de uma célula (por exemplo, célula-recipiente). Ainda em modalidades adi- cionais, um ou mais genes ou proteínas cas e uma ou mais, preferencial- mente, duas ou mais repetições de CRISPR coocorrem naturalmente no mesmo genoma de uma cepa, espécies ou gêneros. Em algumas modalida- des adicionais preferenciais, a presente invenção fornece qualquer combina- i ção adequada de ácidos nucleicos que consistem essencialmente em pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas. Em algumas modalidades, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repetições de CRIS- ea 30 PRepelomenosum gene ou proteína cas e excluindo pelo menos um com- E. ponente adicional de um locux de CRISPR (por exemplo, a ausência de uma ou mais CRISPR espaçadora(s) e/ou a ausência de uma ou mais sequên-
cia(s) líder comum de um lJocux de CRISPR). Em algumas modalidades al- ternativas, o termo "consiste essencialmente em" refere-se a uma combina- ção de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas somente e excluindo todos os outros componentes de um locux de CRISPR (por exemplo, um /ocux de CRISPR que ocorre naturalmente). Em algumas modalidades adicionais, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas somente e excluindo pelo menos um componente adicional de um /ocux de CRISPR, preferencialmente excluindo pelo menos um componente adicional de um locux de CRISPR que ocorre naturalmente.
Em algumas modalidades ainda adicionais, o termo "consiste essencialmente em" refere-se a uma combinação de pelo menos duas repe- tições de CRISPR e pelo menos um gene ou proteína cas, com a condição de que pelo menos um componente adicional do locux de CRISPR natural esteja ausente (por exemplo, substancialmente ausente). Dessa maneira, é destinado que o termo encontre uso no contexto.
Em algumas modalidades, a presente invenção fornece qualquer combinação adequada de pelo menos duas repetições de CRISPR e pelo menos um gene ou proteína cas, com a condição de que todos outros componentes do /ocux de CRISPR estejam ausentes (por exemplo, substancialmente ausente), preferencialmente que Ô todos os outros componentes do /ocux de CRISPR da combinação natural de repetição(ões) de CRISPR e gene(s) cas estão ausentes.
Em algumas modalidades adicionais, um ou mais genes ou proteínas cas são usados em combinação ou em conjunto com uma ou mais CRISPR espaçadoras.
Em algumas modalidades adicionais, um ou mais genes ou proteínas cas são usados em combinação ou em conjunto com pelo menos uma ou mais CRISPR espaçadoras e pelo menos uma ou mais, preferencialmente, duas Ô ou mais repetições de CRISPR.
Em algumas modalidades, CRISPR espa- Ô çadora(s) são ou são derivadas de um organismo (por exemplo, um orga- fed 30 nismo doador) que é diferente daquela célula (por exemplo, célula- e recipiente) a partir da qual um ou mais genes ou proteínas cas e/ou uma ou mais, preferencialmente, duas ou mais repetições de CRISPR são deriva-
das.
Vários arranjos de repetição(ões) de CRISPR e gene(s) ou pro- teína(s) cas, combinações de repetição de CRISPR-cas particularmente fun- cionais, são fornecidas. Em algumas modalidades, a combinação compre- ende, consiste ou consiste essencialmente em pelo menos qualquer de a- proximadamente 9, aproximadamente 10, aproximadamente 11, aproxima- damente 12, aproximadamente 13, aproximadamente 14, aproximadamente 15, aproximadamente 16, aproximadamente 17, aproximadamente 18, apro- ximadamente 19, ou aproximadamente 20 repetição(ões) de CRISPR em combinação com qualquer uma de aproximadamente 1, aproximadamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximada- mente 6, aproximadamente 7, aproximadamente 8, aproximadamente 9, a- proximadamente 10, aproximadamente 11, aproximadamente 12, aproxima- damente 13, aproximadamente 14, aproximadamente 15, aproximadamente 16, aproximadamente 17, aproximadamente 18, aproximadamente 19, ou aproximadamente 20 genes ou proteínas cas (por exemplo, 16 repetições de CRISPR e 12 genes ou proteínas cas ou 18 repetições de CRISPR e 20 ge- nes ou proteínas cas ou quaisquer outras combinações dos mesmos). À presente invenção fornece a repetição(ões) de CRISPR e gene(s) cas arran- jados de várias maneiras, como fornecido em WO 07/025097. Em algumas modalidades nas quais a combinação de um gene cas e uma repetição de CRISPR compreende mais de um gene cas, será entendido que a repetição de CRISPR é inserida na extremidade 3' dos genes cas, a extremidade 5' dos genes cas, ou entre os genes cas, contanto que pelo menos um dos ge- —nescaspermaneça funcional. Em algumas modalidades, um primeiro gene de repetição de CRISPR-cas ou combinação proteica (compreendendo pelo menos um gene B ou proteína cas e pelo menos duas repetições de CRISPR, em que ambos Í são derivados do mesmo /ocux de CRISPR em um genoma) são usados em ESSE 30 “combinação com um segundo gene de repetição de CRISPR-cas ou combi- s.NL nação proteica (compreendendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR, em que ambos são derivados do mes-
mo ou um /ocux de CRISPR diferente dentro de um genoma). Consequen- temente, nestas modalidades da invenção, as primeiras e segundas combi- nações são derivadas dos mesmos ou diferentes /oci de CRISPR dentro de um genoma.
Dessa maneira, em algumas modalidades, o primeiro e segun- do gene de repetição de CRISPR-cas ou combinações proteicas são de ge- nomas diferentes (por exemplo, de genomas diferentes dentro do mesmo grupo), como descrito em detalhes adicionais neste pedido.
Ainda em modalidades adicionais da presente invenção, um pri- meiro e/ou um segundo gene de repetição de CRISPR-cas ou a combinação proteica (cormpreendendo pelo menos um gene cas e pelo menos duas repe- tições de CRISPR derivadas do mesmo locux de CRISPR em um genoma) são usados em combinação com aproximadamente 3, aproximadamente 4, . . aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximada- : mente 8, aproximadamente 9, ou aproximadamente 10 ou mais genes de - AB repetição de CRISPR-cas ou combinações proteicas (cada um compreen- asas) dendo pelo menos um gene ou proteína cas e pelo menos duas repetições de CRISPR derivadas a partir do mesmo ou diferentes /oci de CRISPR den- ij tro de um genoma). Consequentemente, nestas modalidades da invenção, as combinações são derivadas dos mesmos ou diferentes loci de CRISPR dentrode um genoma.
Em algumas modalidades adicionais da invenção, as combinações são de genomas diferentes (por exemplo, genomas diferentes dentro do mesmo grupo), como descrito em detalhes adicionais neste pedi- do.
Dessa maneira, em algumas modalidades, para o gene de repe- tição de CRISPR-cas ou combinação proteica para conferir resistência, a : repetição(ões) de CRISPR e gene(s) ou proteína(s) cas coocorrem natural- : mente em um dado /ocux de CRISPR de um genoma.
Em algumas modali- . dades, a repetição(ões) de CRISPR e gene(s) ou proteína(s) cas coocorrem naturalmente no mesmo /ocux de CRISPR de um genoma.
Em algumas mo- " 30 dalidades, estas combinações funcionais tomadas em conjunto, conferem ao resistência contra um ácido nucleico-alvo ou um produto de transcrição do mesmo.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos para identificação de uma combinação funcional de um gene ou proteína cas e uma repetição de CRISPR compreendendo as etapas de: a- nálise das sequências (por exemplo, sequências de ácido nucleico ou protei- cas)dogeneou proteína cas e repetição de CRISPR; identificação de um ou mais grupos de genes ou proteínas cas; identificação de um ou mais grupos de repetições de CRISPR; e combinação daquelas sequências gênicas ou protéicas de cas e de repetição CRISPR que estão incluídas no mesmo gru- po.
: 10 Em algumas modalidades adicionais, a presente invenção forne- ce métodos para identificação de uma combinação funcional de um gene ou proteína cas e uma repetição de CRISPR para uso na modulação da resis- E ' tência de uma célula contra um ácido nucleico-alvo ou um produto de trans- crição do mesmo compreendendo as etapas de: preparação de uma célula eo 15 compreendendo uma combinação de um ou mais genes ou proteínas cas e - uma ou mais, preferencialmente, duas ou mais repetições de CRISPR; en- genharia da célula tal que contenha uma ou mais CRISPR espaçadoras; e determinação se a célula modula a resistência contra um ácido nucleico- alvo, em que a modulação da resistência da célula contra o ácido nucleico- alvo ou um produto de transcrição do mesmo é indicativa que a combinação . pode ser usada para modular a resistência da célula contra o ácido nucleico- alvo. Em algumas modalidades, as sequências do gene cas e/ou da proteína e/ou da repetição de CRISPR são ou derivadas das mesmas ou diferentes cepas, espécies, gêneros e/ou organismos. Em algumas modali- dades, a combinação compreende DNA e/ou RNA de origem genômica, re- - combinante e/ou sintética. Em algumas modalidades, a repetição(ões) de Y CRISPR compreende(m) DNA e/ou RNA de origem genômica, recombinante É e/ou sintética. Em algumas modalidades, o gene(s) cas compreende(m) E 30 — DNA e/ou RNA de origem genômica, recombinante e/ou sintética. De fato, é =” destinado que a presente invenção englobe qualquer combinação de DNA e/ou RNA de cada um dos elementos (por exemplo, gene cas e/ou repetição de CRISPR). Em algumas modalidades, os elementos são analisados usan- do qualquer método adequado conhecido na técnica. Em algumas modali- dades preferenciais, a análise é conduzida usando análise de dotplot. Em algumas modalidades, a repetição de CRISPR e/ou gene cas são dupla fita, enquanto em outras modalidades, são fita única, se representando a fita de senso ou antissenso ou combinações das mesmas.
Em algumas modalidades, uma ou mais das combinações fun- cionais descritas neste pedido são usadas para construir uma célula (por exemplo, uma célula-recipiente). Em algumas modalidades preferenciais, uma ou mais combinações funcionais são usadas para construir uma célula (por exemplo, uma célula-recipiente), o que em combinação com uma ou mais CRISPR espaçadoras encontra uso na modulação da resistência de E E uma célula contra um ácido nucleico-alvo ou um produto de transcrição do i mesmo. Em algumas modalidades, as combinações funcionais são inseridas fi * 15 em DNA de uma célula-recipiente (por exemplo, como DNA plasmidial ou - genômico de uma célula) usando qualquer método adequado conhecido na técnica. Em algumas modalidades adicionais, as combinações funcionais ij são usadas como um molde sobre o qual a modificação (por exemplo, muta- ção) do DNA de uma célula-recipiente (por exemplo, DNA plasmidial ou DNA —genômico), tal que as combinações funcionais são criadas no DNA da célula.
Ainda em modalidades adicionais, as combinações funcionais são clonadas em um construto, plasmídeo, ou vetor, etc., que então é transformado na célula, usando métodos, tais como aqueles descritos neste pedido e conhe- cidos na técnica.
Em algumas modalidades, a combinação funcional é obtida ou É obtenível por um método compreendendo as etapas de: análise das sequên- cias de um gene cas e uma repetição de CRISPR; identificação de um ou : : mais grupos de genes cas; identificação de um ou mais grupos de repetições - de CRISPR; e combinação daquelas sequências de genes cas e de repeti- É -. 30 ção CRISPR que estão incluídas no mesmo grupo, em que a combinação de =” sequências do gene cas e de repetição de CRISPR no mesmo grupo é indi- - cativa que a combinação é uma combinação funcional.
Como indicado acima, foi surpreendentemente encontrado que não é possível simplesmente trocar combinações de repetição de CRISPR- cas entre quaisquer células (por exemplo, quaisquer cepas, espécies ou gê- neros de células), como isto não necessariamente resulta em combinações derepetiçãode CRISPR-cas funcionais. De fato, para a combinação(ões) de repetição de CRISPR-cas ser funcional, tem que ser compatível. Dessa ma- neira, é contemplado que não é possível trocar genes cas ou repetições de CRISPR entre diferentes loci de CRISPR a menos que sejam do mesmo grupo. Ainda mais surpreendente é que os grupos não seguem a filogenia do "organismo". Especificamente, dentro de um organismo, pode haver mais de uma CRISPR. Estas CRISPR(s) podem pertencer a grupos diferentes, em- bora estejam presentes no mesmo organismo. Por conseguinte, acredita-se . - que uma combinação de repetição de CRISPR-cas funcional requer que a combinação seja trocada dentro de um grupo quando oposto em um orga- o 15. nismo.
” Para evitar dúvida, o termo "grupo" como usado neste pedido não se refere a um grupo de genes localizados no mesmo locux (tipicamente formando um operon), mas à produção da análise de comparação de se- quência (por exemplo, múltipla análise de comparação de sequência e/ou múltiplos alinhamentos de sequência e/ou análise por dotplot). Consequen- temente, em algumas modalidades, a análise de grupo de /oci de CRISPR é realizada usando vários métodos que são conhecidos na técnica (por exem- plo, tais como análise por dotplot como descrito neste pedido) ou múltiplo alinhamento seguido pelo cálculo de dendrograma. Em algumas modalida- des,ogrupoé uma classe, uma família ou um grupo de sequências. Vantajosamente, o uso de combinação(ões) que coocorrem na- h turalmente de repetição de CRISPR-cas fornece para o intercâmbio da com- Í - binação dentro e entre uma dada espécie, por meio disso permitindo cons- truir a resistência de uma cepa usando a combinação a partir de uma cepa . 30 diferente. =” Bacteriófago - Como usado neste pedido, o termo "bacteriófago" (ou "fago")
tem a sua significação convencional como entendido na técnica (isto é, um vírus que seletivamente infecta uma ou mais espécies bacterianas). Muitos bacteriófagos são específicos para um determinado gênero ou espécie ou cepa de bactérias. Em algumas modalidades preferenciais, os fagos são ca- pazes de infectar bactérias parentais e/ou células hospedeiras. Em algumas modalidades, os bacteriófagos são virulentos à bactéria parental. Em algu- mas modalidades, os fagos são líticos, enquanto em outras modalidades, os fagos são lisogênicos. Um bacteriófago lítico é aquele que segue a via lítica através da realização do ciclo lítico, em vez de entrar na via lisogênica. Um bacteriófago lítico sofre replicação vira! levando à lise da membrana celular, destruição da célula e liberação da progênie de partículas de bacteriófago capazes de in- i fectar outras células. Um bacteriófago lisogênico é capaz de entrar na lisogênica, na FE 15 qualo bacteriófago torna-se uma parte latente, passiva do genoma da célula P por meio anterior à realização do seu ciclo lítico. Bacteriófagos que encontram uso na presente invenção incluem, mas não são limitados a bacteriófagos que pertencem a alguma das seguin- tes famílias de vírus: Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Mi- croviridae, Myoviridae, Podoviridae, Siphoviridae ou Tectiviridae. Em algu- mas modalidades, bacteriófagos que infectam bactérias que são patogênicas a plantas e/ou animais (incluindo sere humanos) encontram uso particular. Em algumas modalidades particularmente preferenciais, a resistência de uma célula contra um bacteriófago é modulada.
Em algumas modalidades particularmente preferenciais, o bacte- riófago da presente invenção inclui, mas não é limitado a, aqueles bacterió- S fagos capazes de infectar uma bactéria que naturalmente compreende um Ê : ou mais locide CRISPR. Locide CRISPR foram identificados em mais de 40 procariontes (Vide, por exemplo, Jansen et al., Mol. Microbiol., 43: 1565- e 30 1575 [2002]; e Mojica et al., [2005]) incluindo, mas não limitado a Aerop- = yrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacte- e rium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picro-
Dhilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylo- coceus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, A- Zarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobac- ter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Enwinia, Escheri- chia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthamonas, Yersinia, Treponema e Thermotoga.
Em algumas modalidades, o bacteriófago inclui, mas não são limitados aqueles bacteriófagos capazes de infectar bactérias que pertencem aãos seguintes gêneros: Escherichia, Shigella, Salmonella, Emrwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseria, Bordetella, Helicobac- ter, Listeria, Agrobacterium, Staphylococcus, Streptococcus, Enterococcus, E: Clostridium, Corynebacterium, Mycobacterium, Treponema, Borrelia, Franci- sella, Brucella e Xanthomonas. - 5 Ainda em modalidades adicionais, o bacteriófago inclui, mas não + são limitados aqueles bacteriófagos capazes de infectar (ou transduzir) bac- térias de ácido láctico, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Streptococcus, Lactobacillus (por exemplo, L. acidophilus), En- terococcus, Pediococeus, Leuconostoc e Oenococcus.
Ainda em modalidades adicionais, o bacteriófago inclui, mas não são limitados aqueles bacteriófagos capazes de infectar Lactococeus lacti (por exemplo, L. lactis subsp. /actis e L. lactis subsp. cremoris, e L. lactis subsp. /actis biovar diacetylactis), Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgaricus, Lactobacillus helveticus, Bifidobacterium lactis, —Lactobacillus acidophilus, Lactobacillus casei, Bifidobacterium infantis, Lac- ; tobacíllus paracasei, Lactobacillus salivarius, Lactobacillus plantarum, Lacto- : bacillus reuteri, Lactobacillus gasseri, Lactobacillus johnsonii ou Bifidobacte- Á rium longum.
É Ainda em modalidades adicionais, bacteriófagos incluem, mas Fed 30 não são limitados aqueles bacteriófagos capazes de infectar qualquer bacté- ee ria fermentativa suscetível à perturbação por infecção por bacteriófago, inclu- E indo mas não limitados a processos de produção de antibióticos, aminoáci-
dos e solventes.
Os produtos produzidos pela fermentação que eram conhe- cidos por experimentar infecção por bacteriófago, e as bactérias de fermen- tação infectadas correspondentes, incluem o queijo cheddar e cottage (Lac- tococcus lactis subsp. lactis, Lactococeous lactis subsp. cremoris), iogurte —(Lactobacillus delbrueckii subsp. bulgaricus, Streptococcus thermophilus), queijo suíço (S. thermophilus, Lactobacillus lactis, Lactobacillus helveticus), queijo azul (Leuconostoc cremoris), queijo italiano (L. bulgaricus, S. thermo- PDhilus), viili (Lactococcus lactis subsp. cremoris, Lactococcus lactis subsp. lactis biovar diacetylactis, Leuconostoc cremoris), yakult (Lactobacillus ca- sei), caseína (Lactococcus lactis subsp. cremoris), natto (Bacillus subtilis var. natto), vinho (Leuconostoc oenos), saquê (Leuconostoc mesenteroides), po- limixina (Bacillus polymyxa), colistina (Bacillus colistrium), bacitracina (Bacil- : lus licheniformis), ácido L-glutâmico (Brevibacterium lactofermentum, Micro- bacterium ammoniaphilum), e acetona e butano!l (Clostridium acetobutylicum, - - 15 Clostridium Saccharoperbutylacetonicum). E Em algumas modalidades preferenciais, as bactérias que encon- tram uso na presente invenção incluem, mas não são limitadas a S. thermo- Philus, L. delbrueckii subsp. bulgaricus e/ou L. acidophilus.
Em algumas modalidades particularmente preferenciais, os bac- f teriófagos incluem, mas não são limitados aqueles bacteriófagos capazes de infectar bactérias que compreendem um ou mais /oci de CRISPR heterólo- gos.
Em algumas modalidades, as bactérias compreendem um ou mais /loci de CRISPR heterólogos, e/ou um ou mais genes cas heterólogos, e/ou uma oumaisrepetições de CRISPR heterólogas, e/ou uma ou mais CRISPR es- É paçadoras heterólogas.
E A infecção de bactérias por fago resulta da injeção ou transfe- ' rência do DNA de fago em células.
Em algumas modalidades, a infecção Í leva à expressão (isto é, transcrição e tradução) do ácido nucleico do bacte- Fe 30 —riófago na célula e continuação do ciclo de vida do bacteriófago.
Em algu- = mas modalidades envolvendo bacteriófago recombinante, sequências re- . combinantes no genoma de fago (por exemplo, ácidos nucleicos repórteres),
também são expressos. Foi encontrado que sequências espaçadoras CRISPR em proca- riontes muitas vezes têm similaridades significantes com várias moléculas de DNA, incluindo tais elementos genéticos como cromossomos, bacteriófagos e plasmídeos conjugativos. Foi relatado que células carregando estas CRISPR espaçadoras são incapazes de ser infectadas por moléculas de DNA contendo sequências homólogas aos espaçadores (Vide, Mojica et a/.,
[2005]). Em algumas modalidades da presente invenção, uma ou mais í 10 pseudo espaçadores particulares derivados do DNA de bacteriófago ou CRISPR espaçadora(s) que é/são complementar ou homóloga a um ou mais pseudo CRISPR espaçadora(s) são adicionados em um locux de CRISPR . ; de uma célula (por exemplo, célula-recipiente), a fim de modular (por exem- plo, fornecer) resistência contra um determinado bacteriófago, dessa forma - - 15 substancialmente prevenindo o ataque de fago.
a Em algumas modalidades preferenciais, determinadas regiões no genoma de fago são direcionadas para preparar os pseudo espaçadores, incluindo mas não limitadas a genes de codificação de proteínas de especifi- cidade para o hospedeiro, incluindo aquelas que fornecem determinado re- conhecimento de fago-hospedeiro, tais como helicases, primase, cabeça ou cauda estruturais proteicas, proteínas com um domínio conservado (por e- xemplo, holina, lisina e outras) ou sequências conservadas entre genes de fago importantes.
Qualquer ácido nucleico que se origina do genoma de fago pode conferir imunidade contra o fago quando inserido, por exemplo, entre duas í repetições em um /ocux de CRISPR ativo. Em algumas modalidades, a imu- H nidade é mais "eficiente" quando a CRISPR espaçadora corresponde a uma À sequência interna de um gene de fago. Em algumas modalidades particu- É larmente preferenciais, a imunidade é feita ainda mais "eficiente" quando o ee 30 gene codifica uma proteína "essencial" (por exemplo, o antirreceptor). ” Em algumas modalidades preferenciais, a presente invenção À fornece métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR espaçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR-cas funcionais em pelo menos uma célula que é substancial- mente sensível ao bacteriófago; e (c) engenharia de um ou mais loci de CRISPR na célula substancialmente sensível tal que compreendam uma ou mais pseudo CRISPR espaçadoras de um bacteriófago ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou y mais pseudo CRISPR espaçadora(s) para produzir a célula resistente.
Ainda em modalidades adicionais, a presente invenção fornece métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (a) forne- - - cimento de uma ou mais pseudo CRISPR espaçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de NT: CRISPR-cas funcionais em pelo menos uma célula que é substancialmente " sensível ao bacteriófago; e (c) inserção de uma ou mais pseudo CRISPR espaçadoras do bacteriófago ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaça- dora(s) na célula substancialmente sensível tal que a célula seja produzida substancialmente resistente ao bacteriófago.
: Ainda em modalidades adicionais, a presente invenção fornece métodos para modulação do lisotipo de uma célula bacteriana compreen- dendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR es- paçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR-cas funcionais em pelo menos uma i célula que é substancialmente sensível ao bacteriófago; e (c) engenharia de e um ou mais /oci de CRISPR na célula substancialmente sensível tal que i E compreendam um ou mais pseudo CRISPR espaçadoras de um bacteriófa- DM go ou uma ou mais CRISPR espaçadora(s) que é complementar ou homólo- To 30 gaaumaoumaispseudo CRISPR espaçadora(s).
=” Ainda em modalidades adicionais, a presente invenção fornece À métodos para modulação do lisotipo de uma célula bacteriana compreen-
dendo as etapas de: (a) fornecimento de uma ou mais pseudo CRISPR es- paçadoras de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR-cas funcionais em pelo menos uma célula que é substancialmente sensível ao bacteriófago; e (c) inserção de umaoumaispseudoCRISPR espaçadoras do bacteriófago ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homóloga a uma ou mais pseudo CRISPR espaçadora(s) na célula substancialmente sensível.
Em algumas modalidades preferenciais adicionais, a presente invenção fornece métodos para conferir resistência a uma célula (por exem- e 10 plo, uma célula bacteriana) contra um bacteriófago compreendendo as eta- pas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteri- ófago compreendendo um ácido nucleico-alvo ou um produto de transcrição ; p do mesmo contra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaça- - —- 15 doradacélulatenha homologia à pseudo CRISPR espaçadora do bacterió- ” fago compreendendo o ácido nucleico-alvo.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos para conferir resistência a uma célula (por exemplo, uma célula bacteriana) contra um bacteriófago compreendendo as etapas de: (i) identifi- cação de uma pseudo CRISPR espaçadora em um bacteriófago compreen- t dendo um ácido nucleico-alvo ou um produto de transcrição do mesmo con- tra o qual a resistência deve ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha homologia ou identidade de 100% à pseudo CRISPR espaçadora do —bacteriófago compreendendo o ácido nucleico-alvo. f Ainda em modalidades adicionais, a presente invenção fornece : métodos para modulação do lisotipo de uma célula bacteriana compreen- f dendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora " em um bacteriófago compreendendo um ácido nucleico-alvo ou um produto To 30 de transcrição do mesmo contra o qual a resistência deve ser modulada; e = (ii) modificação da sequência da CRISPR espaçadora da célula tal que a . CRISPR espaçadora da célula tenha homologia à pseudo CRISPR espaça-
dora do bacteriófago compreendendo o ácido nucleico-alvo.
Em algumas modalidades adicionais, a presente invenção forne- ce métodos para modulação do lisotipo de uma célula bacteriana compreen- dendo as etapas de: (i) identificação de uma pseudo CRISPR espaçadora em um bacteriófago compreendendo um ácido nucleico-alvo ou um produto de transcrição do mesmo contra o qual a resistência deve ser modulada; e (li) modificação da sequência da CRISPR espaçadora da célula tal que a CRISPR espaçadora da célula tenha homologia ou identidade de 100% à pseudo CRISPR espaçadora do bacteriótago compreendendo o ácido nucle- ico-alvo.
Em algumas modalidades, a CRISPR espaçadora da célula bac- teriana tem homologia ou identidade de 100% a uma sequência (por exem- : ' plo, como uma pseudo CRISPR espaçadora) no bacteriófago compreenden- do o ácido nucleico-alvo. iNaNCEaR Em algumas modalidades alternativas, a CRISPR espaçadora E da célula bacteriana forma uma porção componente de um /ocux de CRISPR compreendendo uma combinação de repetição de CRISPR-cas funcional como descrito neste pedido.
Em algumas modalidades particularmente preferenciais, o ácido —nucleico-alvo ou um produto de transcrição do mesmo no bacteriófago é uma sequência de ácido nucleico altamente conservada. Em algumas moda- lidades adicionais, o ácido nucleico-alvo ou produto de transcrição do mes- mo no bacteriófago é um gene de codificação para uma proteína de especifi- cidade ao hospedeiro. Em algumas modalidades adicionais, ácido nucleico- alvoouum produto de transcrição do mesmo no bacteriófago codifica uma f enzima que é essencial para sobrevivência, replicação e/ou crescimento do k bacteriófago. Ainda em modalidades adicionais, o ácido nucleico-alvo ou f produto de transcrição do mesmo no bacteriófago codifica uma helicase, É uma primase, uma cabeça ou cauda proteica estrutural, ou proteína com um “2 830 domínioconservado (por exemplo, holina, lisina, etc.). = Em algumas modalidades preferenciais, células bacterianas que são preparadas têm "reduzida suscetibilidade a multiplicação ou infecção de bacteriófago". Como usado neste pedido, este termo refere-se às bactérias como tendo uma baixa ou nenhuma suscetibilidade à multiplicação ou infec- ção de bacteriófago quando comparada às bactérias de tipo selvagem quan- do cultivadas (por exemplo, em um meio lácteo). Em algumas modalidades, algumas células bacterianas exibem "baixa suscetibilidade a multiplicação de bacteriófago". Este termo refere-se ao nível de multiplicação de bacteriófago em uma bactéria estando abaixo de um nível, que causaria um efeito deletério em uma cultura em um dado período de tempo. Tais efeitos deletérios em uma cultura incluem, mas não são limitados a, nenhuma coagulação de leite durante a produção de produ- tos lácteos fermentados (por exemplo, iogurte ou queijo), redução inadequa- da ou lenta do pH durante a produção de produtos lácteos fermentados (por : : exemplo, iogurte ou queijo), maturação lenta de queijo e/ou deterioração de uma textura de alimento ao ponto onde é não apetitoso ou impróprio para o Fa 15 consumo.
" Para um conjunto equivalente de condições de cultura a susceti- bilidade bacteriana em relação a um bacteriófago da presente invenção é geralmente expressa em comparação com as bactérias de tipo selvagem. Em algumas modalidades, as bactérias têm aproximadamente 100 vezes menor (eficiência de plaqueamento [EOP] = 10?), preferencialmente aproxi- madamente 1000 vezes menor (EOP = 10), mais preferencialmente 10.000 vezes menor (EOP = 10), e ainda mais preferencialmente aproximadamen- te 100.000 vezes menor (EOP=10$). Em algumas modalidades preferenci- ais, o nível de multiplicação de bacteriófago em uma cultura é medido após incubação de aproximadamente 14 horas da cultura, mais preferencialmente i após aproximadamente 12 horas, ainda mais preferencialmente após apro- : ximadamente 7 horas, ainda mais preferencialmente após aproximadamente Ô 6 horas, ainda mais preferencialmente após aproximadamente 5 horas, e , ainda mais preferencialmente após aproximadamente 4 horas.
EO Em modalidades adicionais, a presente invenção fornece méto- e dos para conferir sensibilidade a uma célula (por exemplo, uma célula bacte- riana) contra um bacteriófago compreendendo etapas de: (a) fornecimento de uma pseudo CRISPR espaçadora de pelo menos um bacteriófago; (b) identificação de uma ou mais combinações de repetição de CRISPR-cas funcionais em uma célula que é substancialmente resistente ao bacteriófago; e (c) engenharia de um ou mais /oci de CRISPR na célula substancialmente sensível tal que compreendam uma ou mais pseudo CRISPR espaçadoras ou uma ou mais CRISPR espaçadora(s) que é/são complementar ou homó- loga a uma ou mais pseudo CRISPR espaçadora(s) que têm um grau redu- zido de homologia quando comparada com um ou mais loci de CRISPR na célula substancialmente resistente.
Em modalidades adicionais, a presente invenção fornece méto- dos para modulação (por exemplo, redução) do lisotipo de uma célula (por exemplo, uma célula bacteriana), compreendendo um ou mais genes ou pro- : teínas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR compreendendo as etapas de: (i) identificação de uma pseudo .” - 15 CRISPR espaçadora em um bacteriófago contra o qual a resistência deve " ser modulada; e (ii) modificação da sequência da CRISPR espaçadora da célula ta! que a CRISPR espaçadora da célula tenha um grau reduzido de homologia à pseudo CRISPR espaçadora do bacteriófago compreendendo o ácido nucleico-alvo.
Ainda em modalidades adicionais, a presente invenção fornece métodos para modulação (por exemplo, redução ou diminuição) da resistên- cia de uma célula bacteriana compreendendo um ou mais genes ou proteí- nas cas e uma ou mais, preferencialmente, duas ou mais repetições de CRISPR contra um bacteriófago compreendendo as etapas de: (i) identifica- çãode uma ou mais pseudo CRISPR espaçadoras em um bacteriófago con- E tra o qual a resistência deve ser modulada; (ii) identificação de uma CRISPR E espaçadora na célula bacteriana na qual a resistência deve ser modulada f que é homóloga à pseudo CRISPR espaçadora(s); e (iii) modificação da se- RN quência da CRISPR espaçadora na célula bacteriana na qual a resistência “ . 830 deve sermoduladatalquea CRISPR espaçadora tem um grau mais baixo Te de homologia à pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada.
Em algumas modalidades, a CRISPR espaçadora da célula tem um grau reduzido de homologia (por exemplo, aproximadamente 1, aproxi- madamente 2, aproximadamente 3, aproximadamente 4, aproximadamente 5, aproximadamente 6, aproximadamente 7, aproximadamente 8, aproxima- damente 9, aproximadamente 10, aproximadamente 15, aproximadamente 20, aproximadamente 25, aproximadamente 30, aproximadamente 35, apro- ximadamente 40, aproximadamente 45, aproximadamente 50, aproximada- mente 55, aproximadamente 60, aproximadamente 65, aproximadamente 70, aproximadamente 75, aproximadamente 80, aproximadamente 90, ou redução de aproximadamente 95% na homologia) quando comparado com a pseudo CRISPR espaçadora(s) do bacteriófago contra o qual a resistência deve ser modulada. Em algumas modalidades, as células bacterianas são prepara- É das usando os métodos da presente invenção tais que as células tenham “” . 15 uma suscetibilidade aumentada à multiplicação de bacteriófago". Como u- - sado neste pedido, este termo refere-se a bactérias que têm uma susceltibili- dade aumentada ou mais alta à multiplicação de bacteriófago quando com- parada com as bactérias de tipo selvagem quando cultivadas (por exemplo, em um meio lácteo).
Em algumas modalidades, o termo "alta suscetibilidade à multi- plicação de bacteriófago" refere-se ao nível da multiplicação de bacteriófago em uma bactéria que está acima de um nível, que causaria um efeito deleté- rio a uma cultura em um dado período de tempo. Tais efeitos deletérios em uma cultura incluem, mas não são limitados a, nenhuma coagulação de leite durante a produção de produtos lácteos fermentados (por exemplo, iogurte e ou queijo), inadequada ou lenta redução do pH durante a produção de pro- E dutos lácteos fermentados (por exemplo, iogurte ou queijo), maturação lenta f de queijo e/ou deterioração de uma textura do alimento ao ponto onde é não Mm apetitoso ou impróprio para o consumo, aa, 30 Para um conjunto equivalente de condições de cultura a susceti- 2 bilidade bacteriana em relação a um bacteriófago da presente invenção é Ê geralmente expressa em comparação com as bactérias de tipo selvagem.
Em algumas modalidades, as bactérias têm aproximadamente 100 vezes menor (eficiência de plaqueamento [EOP] = 102%), preferencialmente aproxi- madamente 1000 vezes menor (EOP = 10), mais preferencialmente 10.000 vezes menor (EOP = 10%), e ainda mais preferencialmente aproximadamen- te 100.000 vezes menor (EOP=10*). Em algumas modalidades preferenci- ais, o nível de multiplicação de bacteriófago em uma cultura é medido após incubação de aproximadamente 14 horas da cultura, mais preferencialmente após aproximadamente 12 horas, mesmo mais preferencialmente após a- proximadamente 7 horas, ainda mais preferencialmente após aproximada- : 10 mente 6 horas, ainda mais preferencialmente após aproximadamente 5 ho- ras, e ainda mais preferencialmente após aproximadamente 4 horas.
Em algumas modalidades preferenciais, uma CRISPR espaça- : ; dora é flanqueada por duas repetições de CRISPR (isto é, uma CRISPR es- paçadora tem pelo menos uma repetição de CRISPR em cada lado). = 15 Em algumas modalidades da presente invenção, a bactéria pa- E rental (por exemplo, "cepa bacteriana parental") é exposta (por exemplo, ite- rativamente, sequencialmente, simultaneamente ou substancialmente simul- taneamente) a mais de um bacteriófago (por exemplo, uma mistura de um ou mais fagos). Em algumas modalidades, a cepa bacteriana parental é sen- sível a cada um dos bacteriófagos que é exposto na mistura, enquanto em outras modalidades, a cepa bacteriana é sensível a alguns bacteriófagos, mas resistente a outros.
Como usado neste pedido, o termo "sequência de direcionamen- to" refere-se à porção de um fragmento de DNA adicional que é derivado do genoma de um ou mais bacteriófagos (por exemplo, uma fita a mais do ge- noma de um ou mais bacteriófagos) que a bactéria parental é exposta con- y forme os métodos da presente invenção e é usada como uma etiqueta ou f uma marca (por exemplo, fornecendo uma etiqueta única ou uma marca úni- O ca). To 80 A sequência de direcionamento é tipicamente uma sequência ez que é uma sequência que ocorre naturalmente no bacteriófago.
Preferenci- almente, a sequência de direcionamento tem pelo menos aproximadamente
90%, aproximadamente 95%, aproximadamente 96%, aproximadamente 97%, aproximadamente 98% ou de aproximadamente 99% de identidade à sequência que ocorre naturalmente no bacteriófago (por exemplo, o genoma do bacteriófago do qual é derivado). Em algumas modalidades mais prefe- renciais, a sequência de direcionamento tem identidade de aproximadamen- te 100% à sequência que ocorre naturalmente no bacteriófago (por exemplo, o genoma do bacteriófago do qual é derivado). Em algumas modalidades, a sequência de direcionamento tem menos de aproximadamente 40%, aproximadamente 30%, aproximadamen- | 10 te 20%, aproximadamente 10%, aproximadamente 5%, aproximadamente 4%, aproximadamente 3%, aproximadamente 2%, aproximadamente 1%, ou identidade de aproximadamente 0% a qualquer outra CRISPR espaçadora ou núcleos de CRISPR espaçadora em um ou mais /oci de CRISPR da bac- É téria marcada. "To. 15 Em algumas modalidades, a sequência de direcionamento tem * menos de aproximadamente 40%, aproximadamente 30%, aproximadamen- te 20%, aproximadamente 10%, aproximadamente 5%, aproximadamente 4%, aproximadamente 3%, aproximadamente 2%, aproximadamente 1%, ou identidade de aproximadamente 0% a qualquer outra sequência em um ou mais/ocide CRISPR da bactéria marcada.
É Em algumas modalidades adicionais, a sequência de direciona- mento tem uma sequência que é idêntica a uma sequência (por exemplo, como uma CRISPR espaçadora) no locux de CRISPR da bactéria. Em al- gumas modalidades adicionais, a sequência de direcionamento tem uma sequência que é idêntica a uma sequência (por exemplo, uma CRISPR es- paçadora) no locux de CRISPR da bactéria além de um ou mais polimorfis- ; mos de nucleotídeo único (por exemplo, um ou dois polimorfismos de nucle- ii otídeo único).
aaa Em algumas modalidades preferenciais, a sequência de direcio- = 80 namentoé pelomenos de aproximadamente 20 nucleotídeos em tamanho, -* enquanto em algumas modalidades particularmente preferenciais é de apro- á ximadamente 20 a aproximadamente 58 nucleotídeos em tamanho.
Em algumas modalidades particularmente preferenciais, pelo menos uma sequência de direcionamento está integrada na bactéria paren- tal. Em algumas modalidades adicionais, pelo menos uma sequência dupli- cada (por exemplo, uma sequência de repetição de CRISPR duplicada) deri- vada do genoma da bactéria parental ou um ou mais dos plasmídeos da bactéria parental (por exemplo, megaplasmídeos) também está integrada.
Não é destinado que a presente invenção seja limitada a qualquer mecanis- mo ou teoria particular. Entretanto, acredita-se que pelo menos uma se- quência duplicada é copiada ou replicada a partir do genoma da bactéria parental. Em particular, acredita-se tipicamente que a sequência de repeti- ção de CRISPR em um locux de CRISPR é duplicada e a sequência de dire- cionamento é integrada no genoma da bactéria imediatamente após (isto é, ; E a jusante) da nova repetição de CRISPR duplicada.
Em algumas modalidades particularmente preferenciais, pelo -” - 15 menosuma sequência duplicada é uma sequência de repetição de CRISPR Y que tem pelo menos aproximadamente 90%, aproximadamente 95%, apro- ximadamente 96%, aproximadamente 97%, aproximadamente 98%, ou iden- tidade de aproximadamente 99% às repetições de CRISPR em um ou mais loci de CRISPR da bactéria parental e/ou bactéria marcada. Ainda mais pre- ferencialmente, pelo menos uma sequência duplicada é uma sequência de repetição de CRISPR que tem identidade de pelo menos aproximadamente 100% às repetições de CRISPR em um ou mais loci de CRISPR da bactéria parental e/ou bactéria marcada. Em algumas modalidades preferenciais, a sequência duplicada é de pelo menos aproximadamente 24 nucleotídeos em tamanho, enquanto em algumas modalidades particularmente preferenciais ' é de aproximadamente 24 a aproximadamente 40 nucleotídeos em tamanho. Er Em algumas modalidades preferenciais, pelo menos uma se- ã quência de direcionamento e pelo menos uma sequência duplicada estão EE integradas na bactéria parental. Não é destinado que a presente invenção “ . 80 sejalimitadaaqualquermecanismo ou teoria particular. Entretanto, acredita- E. se que cada vez que uma sequência de direcionamento é integrada ao ge- É noma da bactéria parental, isto é acompanhado pela integração iterativa,
sequencial, simultânea ou substancialmente simultânea de pelo menos uma sequência duplicada. Consequentemente, pelo menos um par de sequências compreendendo a sequência de direcionamento e a sequência duplicada são integradas na bactéria parental, por meio disso resultando em uma bac- tériamarcada.
Em algumas modalidades preferenciais, pelo menos uma se- quência de direcionamento e pelo menos uma sequência duplicada inte- gram-se adjacente uma a outra. Mais preferencialmente, pelo menos uma sequência de direcionamento e pelo menos uma sequência duplicada são diretamente integradas adjacentes uma a outra tal que não haja nucleotí- deos intervenientes entre as sequências.
Em algumas modalidades, a sequência duplicada é anexada, ; : ligada ou fusionada a uma extremidade (por exemplo, a extremidade 5' ou 3') da sequência de direcionamento. Preferencialmente, a sequência dupli- .” - 15 cadaé anexada, ligada ou fusionada à extremidade 5' da sequência de dire- " cionamento. Consequentemente, após integração de um par único de se- quências, a sequência duplicada é a primeira sequência na extremidade 5 do locux de CRISPR e a sequência de direcionamento será a segunda (por exemplo, a próxima) sequência no locux de CRISPR, a jusante da sequência duplicada. Em algumas modalidades preferenciais, as sequências são dire- tamente anexadas, diretamente ligadas ou diretamente fusionadas tal que não haja nucleotídeos intervenientes entre a sequência duplicada e a se- quência de direcionamento.
Dessa maneira, em algumas modalidades, uma sequência dupli- cadae um par de sequência de direcionamento são integrados no genoma í da bactéria parental para dar origem a uma bactéria marcada. A sequência õ duplicada é derivada, derivável, obtida ou obtenível a partir do genoma da " bactéria parental e a sequência de direcionamento é derivada, derivável, Naa obtida ou obtenível a partir do genoma do bacteriófago que é usado para “* . 80 infectarabactéria parental. = Surpreendentemente, tem sido encontrado que em algumas mo- É dalidades, múltiplos pares de sequências são integrados no genoma da bac-
téria parental.
De acordo com estas modalidades, os múltiplos pares com- preendem um primeiro par compreendendo uma sequência duplicada e uma sequência de direcionamento, e um segundo par compreendendo uma se- gunda sequência duplicada e uma segunda sequência de direcionamento.
A — segunda sequência duplicada tipicamente compreende a mesma sequência (por exemplo, maior do que aproximadamente 95%, aproximadamente 96,%, aproximadamente 97%, aproximadamente 98%, aproximadamente 99%, ou identidade de aproximadamente 100%) como a primeira sequência duplica- da.
A sequência de direcionamento tipicamente compreende uma sequência diferente (por exemplo, menos de aproximadamente 40%, aproximadamente 30%, aproximadamente 20%, aproximadamente 10%, aproximadamente 5%, aproximadamente 4%, aproximadamente 3%, aproximadamente 2%, apro- À ximadamente 1%, ou identidade de aproximadamente 0%) à primeira se- i quência de direcionamento.
Este é também o caso em modalidades nas 7 - 15 quaisospares adicionais de sequências estão integrados. & Consequentemente, a configuração dos múltiplos pares tipica- mente compreende: [sequência duplicada-sequência de direcionamento], em que n = 2, 3, 4, 5, 6, ou mais.
Preferencialmente, a configuração dos múltiplos pares tipicamente compreende: [repetição de CRISPR-sequência de direcionamento], em que n = 2, 3, 4, 5, 6, ou mais.
Em algumas modalidades, a configuração dos múltiplos pares é: 5'-[sequência duplicada-sequência de direcionamento]l--3' — em quenz=2,3,4,5,6,ou mais.
Preferencialmente, a configuração dos múlti- - plos pares é: 5'-[repetição de CRISPR-sequência de direcionamento],-3' " em que n = 2,3,4,5,6, ou mais.
Eee Consequentemente, em algumas modalidades, múltiplos pares aaa 30 de sequências estão integrados na bactéria parental.
Em algumas modalida- Lo des, a sequência de direcionamento integra-se adjacente a: (i) uma sequên- Ã cia duplicada que é homóloga (por exemplo, idêntica) a uma sequência que ocorre naturalmente na bactéria parental; (ii) uma sequência duplicada que é homóloga (por exemplo, idêntica) a uma sequência que ocorre naturalmente no locux de CRISPR da bactéria parental; ou (iii) ainda mais preferencial mente, uma sequência duplicada que é homóloga (por exemplo, idêntica) a uma repetiçãode CRISPR que ocorre naturalmente no /ocux de CRISPR da bactéria parental.
Após cada exposição de uma bactéria parental a um dado bacte- riófago em experimentos independentes, a sequência de direcionamento em cada uma das bactérias marcadas apresenta uma sequência nucleotídica diferente, por meio disso criando uma sequência que é única para cada bac- téria. Dessa maneira, sem estar ligado por qualquer teoria particular, acredi- ta-se que na exposição de uma bactéria parental a um dado bacteriófago, a : : sequência de direcionamento que está integrada em uma bactéria parental é aparentemente selecionada randomicamente a partir do genoma do bacte- -” - 15 riófago. Entretanto, não é destinado que a presente invenção seja limitada a a" eventos de integração randômicos.
Vantajosamente, este achado surpreendente é utilizado no con- texto da presente invenção em virtude do fato que a sequência de direcio- namento selecionada randomicamente fornece uma marca ou etiqueta única na bactéria marcada. Surpreendentemente, também foi encontrado que quando a mesma bactéria parental é exposta ao mesmo bacteriófago a se- quência de direcionamento que está integrada em experimentos indepen- dentes/distintos é de uma sequência diferente, por meio disso resultando em uma marcação única na bactéria marcada após cada exposição.
Em algumas modalidades, a sequência de direcionamento ran- ; domicamente selecionada é identificada na bactéria marcada em virtude de uma ou mais das seguintes propriedades da sequência de direcionamento: ie. (1) A posição da sequência de direcionamento em um ou mais E loci de CRISPR do mutante insensível a bacteriófago. Como descrito neste “ . 30 pedido, a sequência de direcionamento é tipicamente localizada em uma = e/ou ambas as extremidades (por exemplo, extremidade 5' e/ou 3', mais pre- É ferencialmente, extremidade 5') do /ocux de CRISPR da bactéria marcada.
(2) A sequência de direcionamento tem um alto grau de homolo- gia ou identidade (por exemplo, identidade de 100%) a uma sequência no genoma de bacteriófago a qual a bactéria parental foi exposta; e/ou (3) A sequência de direcionamento é fusionada, ligada ou ane- xadaaí(por exemplo, diretamente fusionada, ligada ou anexada) pelo menos uma sequência (por exemplo, uma repetição de CRISPR) que é duplicada a partir do genoma da bactéria parental.
Tipicamente, como descrito neste pe- dido, este par adicional de sequências é localizado em uma e/ou ambas ex- tremidades (por exemplo, extremidade 5' e/ou 3', preferencialmente, extre- Í 10 —“midade 5º) do locux de CRISPR da bactéria marcada.
Em algumas modalidades de marcação/etiquetagem fornecidas neste pedido, uma ou mais sequências de marcação e/ou uma ou mais se- E quências duplicadas (por exemplo, a repetição de CRISPR duplicada a partir É da bactéria parental) integradas no /ocux de CRISPR da bactéria parental.
O co 15 Em algumas modalidades preferenciais, um ou mais pares de sequência ' duplicada-sequência de direcionamento como descrito neste pedido integra- se no locux de CRISPR da bactéria parental.
Em algumas modalidades, a sequência(s) de marcação e/ou sequência(s) duplicadas integram-se no fo- cux de CRISPR da bactéria parental.
Em algumas outras modalidades, a —sequência(s) de marcação e/ou sequência(s) duplicada integram-se em uma ou ambas as extremidades do Jocux de CRISPR da bactéria parental.
Ainda em modalidades adicionais, a sequência(s) de marcação e/ou sequência(s) duplicada integram-se em ambas as extremidades do /ocux de CRISPR da bactéria parental tal que as sequências estejam na extremidade 5' e na ex tremidade 3' do locux de CRISPR.
Uma das sequências duplicadas será tipi- . camente a primeira sequência na extremidade 5' do locux de CRISPRe a sequência de direcionamento estará imediatamente a jusante da sequência * duplicada.
A outra sequência duplicada será a última sequência na extremi- E dade 3' do locux de CRISPR e a sequência de direcionamento estará imedi- * . 80 atamenteamontanteda sequência duplicada.
Ls Em algumas modalidades, a sequência(s) de marcação e/ou se- quência(s) duplicada integra-se em um ou mais loci de CRISPR.
Ainda em modalidades adicionais, a sequência(s) de marcação e/ou sequência(s) du- plicada integram-se em uma extremidade do locux de CRISPR da bactéria parental tal que a sequência(s) esteja na extremidade 3' do /ocux de CRIS- PR.
A sequência duplicada será a última sequência na extremidade 3' do —locuxde CRISPR e a sequência de direcionamento estará imediatamente a montante da sequência duplicada.
Preferencialmente, a sequência(s) de marcação e/ou sequência(s) duplicada integram-se em uma extremidade do locux de CRISPR da bactéria parental tal que as sequências estejam na ex- tremidade 5' do locux de CRISPR.
A sequência duplicada é a primeira se- —quência na extremidade 5' do /ocux de CRISPR e a sequência de direciona- mento está imediatamente a jusante da sequência duplicada.
Como descrito neste pedido, a sequência(s) de marcação é uma i E cepa de marca específica no sentido em que a sequência de direcionamento que é integrada ou inserida a partir do bacteriófago na bactéria parental é -” * 15 diferente cada vez que a bactéria parental (por exemplo, a mesma bactéria h parental) é exposta ao bacteriófago (por exemplo, o mesmo bacteriófago). Consequentemente, a sequência de direcionamento encontra uso como uma marca única para uma dada cepa bacteriana.
A sequência(s) de marcação e/ou a sequência(s) duplicada inte- gra-seem um ou mais /ocide CRISPR diferente, enquanto em outras moda- lidades, duas ou mais sequência(s) de marcação diferentes e/ou sequên- cia(s) duplicada integram-se em um locux de CRISPR, e são ainda modali- dades adicionais, duas ou mais sequência(s) de marcação diferentes e/ou sequência(s) duplicada cada uma integra-se em dois ou mais loci de CRIS- PR diferentes.
Cada uma das sequências de marcação de cada bacteriófago E €/ou cada uma das sequências duplicadas (por exemplo, a repetição de CRISPR duplicada) da bactéria parental podem integrar-se no mesmo locux ae. de CRISPR. aa Em algumas modalidades, cada uma das sequências de marca- To 30 ção e/oucada uma das sequências duplicadas integram-se em uma ou am- - bas as extremidades do mesmo /ocux de CRISPR.
Em algumas modalida- Ê des adicionais, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas integram-se nas extremidade 5' e/ou 3' do mesmo locux de CRISPR.
Preferencialmente, cada uma das sequências de marca- ção e/ou cada uma das sequências duplicadas integram-se na extremidade 8' do mesmo locux de CRISPR.
Em algumas modalidades adicionais, cada uma das sequências de marcação e/ou cada uma das sequências duplica- das da bactéria parental integram-se iterativamente, simultaneamente ou substancialmente simultaneamente.
Em algumas modalidades, cada uma das sequências de marcação e/ou cada uma das sequências duplicadas in- tegram-se sequencialmente, pelo qual a primeira sequência de direciona- mento e/ou à primeira sequência duplicada estão integradas na bactéria pa- rental.
Uma segunda sequência de direcionamento a partir de um segundo bacteriófago e/ou outra sequência duplicada então se integra na bactéria . parental.
Apropriadamente, a sequência de direcionamento e/ou a sequência duplicada integram-se no DNA cromossômico da bactéria parental. ar ereHAS Em algumas modalidades, cada uma das sequências de marca- ção e/ou cada uma das sequências duplicadas integram-se em uma extre- midade (por exemplo, a extremidade 5") do mesmo locux de CRISPR adja- cente (por exemplo, próximo a) uma a outra.
Dessa maneira, em algumas modalidades, cada uma das sequências de marcação e/ou sequências du- plicadas integra-se sequencialmente, de acordo com as quais as primeiras sequências estão integradas na bactéria parental em uma extremidade (por exemplo, dentro de ou na extremidade 5' e/ou 3') do locux de CRISPR.
Uma segunda sequência de direcionamento e/ou sequência duplicada podem en- tão integrar-se na bactéria parental adjacente (por exemplo, diretamente ad- jacente) ao primeiro par de sequências.
Em algumas modalidades, as se- gundas sequências integram-se na bactéria parental adjacente (por exem- plo, diretamente adjacente) a extremidade 5' ou 3' das primeiras sequências. ” Preferencialmente, as segundas sequências integram-se na bactéria paren- : sa tal adjacente (por exemplo, diretamente adjacente) a extremidade 3' das “* — 80 primeiras sequências e similares.
Em algumas modalidades, cada uma das k sequências integra-se adjacente (por exemplo, próximo a) uma a outra den- = tro de ou na extremidade 3' e/ou na extremidade 5' do mesmo /ocux de
CRISPR da bactéria parental. Em algumas modalidades preferenciais, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra na extremidade 5' do mesmo /ocux de CRISPR da bactéria parental. Mais preferencialmente, cada uma das sequências integra-se adjacente (por exemplo, próximo a) uma a outra a montante da extremidade 5' do locux de CRISPR da bactéria parental. Mais preferencialmente, cada uma das se- quências integra-se adjacente (por exemplo, próximo a) uma a outra a mon- tante da repetição de CRISPR em 5' do locux de CRISPR da bactéria paren- tal. Ainda mais preferencialmente, cada uma das sequências integra-se ad- jacente (por exemplo, próximo a) uma a outra a montante da primeira repeti- ção de CRISPR em 5' do /ocux de CRISPR da bactéria parental. Bactérias Marcadas Como usado neste pedido, o termo "bactérias marcadas" e "bac- à téria marcada" refere-se a uma bactéria parental, bactérias parentais, ou ce- - “7 15 pa bacteriana parental na qual um ou mais /ocide CRISPR ou uma porção y do mesmo foram modificados (por exemplo, mutados) de tal modo que é insensível a um ou mais bacteriófagos a que foram expostas. Como descrito em detalhes adicionais neste pedido, em algumas modalidades, a bactéria marcada é exposta a mais de um bacteriófago (por exemplo, iterativamente, sequencialmente ou simultaneamente), tal que acumula uma ou mais modifi- cações genômicas dentro de um ou mais /oci de CRISPR de tal modo que fica insensível a cada um dos bacteriófagos aos quais foi exposta. Para infectar células, um bacteriófago injeta ou transfere seu ácido nucleico para a célula com o ácido nucleico de fago existente indepen- —dentemente do genoma da célula. Em algumas modalidades, a infecção re- sulta na expressão (isto é, transcrição e tradução) do ácido nucleico do bac- teriófago dentro da célula e continuação do ciclo de vida do bacteriófago.
—. Em algumas modalidades da presente invenção, após exposição EE ao bacteriófago, a bactéria marcada tem uma reduzida ou nenhuma susceti- “ - 80 bíilidadede infecção e/ou multiplicação de bacteriófago quando comparada - com a bactéria parental. Como usado neste pedido, o termo "reduzida sus- ai cetibilidade à infecção e/ou multiplicação de bacteriófago" significa que o nível de infecção e/ou multiplicação de bacteriófago na bactéria marcada não causa um efeito deletério à bactéria marcada.
Dessa maneira, em algumas modalidades da presente invenção, uma bactéria parental não é morta após exposição ao bacteriófago, devido à —mutação da bactéria parental de tal modo que fica insensível ao bacteriófa- go.
Em algumas modalidades, a bactéria marcada é insensível ou substancialmente insensível a infecção e/ou multiplicação adicional por bac- teriófago. Em modalidades adicionais, a bactéria marcada é insensível ou — substancialmente insensível a um ou mais dos mecanismos usados pelo bacteriófago para infectar e/ou multiplicar-se em uma bactéria. Ainda em modalidades adicionais, a bactéria marcada é insensível ou substancialmen- - te insensível a todos os mecanismos usados pelo bacteriófago para infectar e/ou multiplicar-se em uma bactéria. Ainda em modalidades adicionais, a - 7" 15 bactéria marcada desenvolve um ou mais mecanismos que atenuam, inati- E vam ou destroem o bacteriófago durante o ciclo de infecção. Em algumas modalidades adicionais, a presente invenção fornece cepas marcadas sele- cionadas por procedimentos de seleção padrão que são conhecidos na téc- nica para isolar mutantes insensíveis a bacteriófago. : 20 Em algumas modalidades da presente invenção, uma bactéria É marcada compreendendo uma sequência de direcionamento no locux de CRISPR que não está presente na bactéria parental é selecionada a partir da comparação do locux de CRISPR ou uma porção do mesmo da bactéria parental e da bactéria marcada.
Em algumas modalidades preferenciais, uma bactéria marcada compreendendo um fragmento de DNA adicional dentro de ou na extremida- de 5' e/ou 3' do /ocux de CRISPR que não está presente na bactéria parental a. é selecionado. Mais preferencialmente, uma bactéria marcada compreen- ' : dendo uma sequência de direcionamento adjacente (por exemplo, direta- Ae 30 mente adjacente) à extremidade 3' de uma sequência recentemente duplica- E da no locux de CRISPR da bactéria marcada que não está presente na bac- i téria parental é selecionada. Ainda mais preferencialmente, uma bactéria marcada compreendendo uma sequência de direcionamento adjacente (por exemplo, diretamente adjacente) à extremidade 3' da primeira repetição de CRISPR do locux de CRISPR na bactéria marcada que não está presente na bactéria parental! é selecionada.
Em algumas modalidades, a sequência de direcionamento (por exemplo, uma ou mais sequências de marcação) são isoladas e/ou clona- das. Em algumas modalidades adicionais, a sequência de direcionamento (por exemplo, uma ou mais sequências de marcação) é sequenciada. Estas modalidades fornecem vantagens, como não somente fornecem informação É 10 sobre a posição da sequência de direcionamerito dentro do /locux de CRIS- PR, mas também a sequência específica do mesmo, também. Em algumas modalidades, esta informação é guardada em um banco de dados, por meio ; h disso fornecendo uma marca única para a dada bactéria e também um meio para posteriormente rastrear e/ou identificar a bactéria. 7 165 Uma vez que a sequência da sequência de direcionamento na + bactéria marcada é conhecida, a sequência de direcionamento sozinha en- contra uso na identificação de bactérias. Usando vários métodos que são conhecidos na técnica e descritos neste pedido, a sequência e/ou posição da sequência de direcionamento são determinadas. Esta sequência então é combinada contra, por exemplo, um banco de dados de sequência bacteria- na e/ou um banco de dados de sequência de bacteriófago e/ou um banco de dados ou etiquetas/marcas a fim de identificar a bactéria. Organismo Doador Como usado em algumas modalidades neste pedido, o termo “organismo doador" refere-se a um organismo ou célula a partir da qual a repetição de CRISPR e/ou o gene cas e/ou a combinação(ões) dos mesmos e/ou CRISPR espaçadoras são derivados. Estes podem ser os mesmos ou =. diferentes. Em algumas modalidades, o termo "organismo doador" refere-se Es. a um organismo ou célula a partir da qual uma ou mais, preferencialmente, “ 30 duasourmaisrepetiçõesdeCRISPR e/ou um ou mais gene cas e/ou combi- é nação(ões) dos mesmos e/ou CRISPR espaçadoras são derivados. Estes E podem ser os mesmos ou diferentes. Em algumas modalidades, a CRISPR espaçadora e/ou pseudo CRISPR espaçadora é sinteticamente derivada.
Ainda em modalidades adicionais, o organismo ou célula doadora compre- ende uma ou mais CRISPR espaçadoras, que confere a especificidade da imunidade contra um ácido nucleico-alvo ou produto de transcrição do mes- mo.
Em modalidades adicionais, o organismo ou célula doadora a partir da qual a repetição de CRISPR e/ou gene cas e/ou combinação dos mesmos é derivado é também a célula/organismo recipiente do /ocux de CRISPR re- combinante.
Estes podem ser os mesmos ou diferentes.
Em outras modali- dades, o organismo ou célula doadora a partir do qual a CRISPR espaçado- raé derivada é também a céiula/organismo recipiente do /ocux de CRISPR recombinante.
Estes podem ser os mesmos ou diferentes.
Em modalidades nas quais o organismo doador é uma célula bacteriana então o organismo P : doador tipicamente compreende uma CRISPR espaçadora que confere a imunidade específica contra o ácido nucleico-alvo ou produto de transcrição o 15 do mesmo.
Em algumas modalidades, o organismo é uma célula bacteriana enquanto em outras modalidades é um bacteriófago.
Célula-hospedeira Como usado neste pedido, o termo "célula-hospedeira" refere-se a qualquer célula que compreende a combinação, o construto ou o vetor e similares de acordo com a presente invenção.
Em algumas modalidades, as células hospedeiras são transformadas ou transfectadas com uma sequên- cia nucleotídica contida em um vetor (por exemplo, um vetor de clonagem). Em algumas modalidades, uma sequência nucleotídica pode ser transporta- da em um vetor para a replicação e/ou expressão da sequência nucleotídica.
As células são escolhidas para serem compatíveis com o vetor e em algu- mas modalidades, células procarióticas (por exemplo, bacterianas). õ Célula-recipiente , " Como usado neste pedido, o termo "célula-recipiente" refere-se E a qualquer célula em que a resistência contra um ácido nNucleico-alvo ou um T - 80 produtode transcrição do mesmo seja modulada ou deva ser modulada.
Em e algumas modalidades, a célula-recipiente refere-se a qualquer célula com- preendendo o ácido nucleico recombinante de acordo com a presente inven-
ção.
Em algumas modalidades, a célula-recipiente compreende uma ou mais, preferencialmente, duas ou mais repetições de CRISPR e um ou mais genes ou proteínas cas.
Apropriadamente, as repetições de CRISPR e os genes ou proteínas cas formam uma combinação funcional na célula- recipiente, como descrito neste pedido.
Em algumas modalidades adicionais, a célula-recipiente compreende uma ou mais repetições de CRISPR modifi- cadas e/ou um ou mais genes ou proteínas cas modificados.
Apropriada- mente, as repetições de CRISPR modificadas e/ou os genes ou proteínas cas modificados formam uma combinação funcional na célula-recipiente, como descrito neste pedido.
Em algumas modalidades, a célula-recipiente compreende uma ou mais repetições de CRISPR geneticamente construídas e/ou um ou mais genes ou proteínas cas construídos geneticamente.
Apro- " priadamente, as repetições de CRISPR geneticamente construídas e/ou ge- nes ou proteínas cas geneticamente construídos formam uma combinação casas 15 funcional na célula-recipiente, como descrito neste pedido.
Em algumas mo- - dalidades alternativas, a célula-recipiente compreende uma ou mais repeti- ções de CRISPR recombinante e/ou um ou mais genes ou proteínas cas recombinantes.
Apropriadamente, as repetições de CRISPR recombinantes e/ou genes ou proteínas cas recombirantes formam uma combinação fun- cional na célula-recipiente, como descrito neste pedido.
Ainda em modalida- des adicionais, a célula-recipiente compreende uma ou mais repetições de CRISPR que ocorrem naturalmente e um ou mais genes ou proteínas cas que ocorrem naturalmente.
Apropriadamente, a repetição(ões) de CRISPR e o gene(s) ou proteínas cas formam uma combinação funcional.
Em algumas modalidades, a célula-recipiente compreende com- binações de uma ou mais repetições modificadas de CRISPR geneticamente : construídas, recombinantes ou que occrrem naturalmente e um ou mais ge- f E nes ou proteínas cas modificados geneticamente construídos, recombinan- tes ou que ocorrem naturalmente.
Apropriadamente, uma ou mais CRISPR to 30 —espaçadora(s) modificada, geneticamente construída, recombinante ou que er ocorre naturalmente ou um ou mais cene(s) ou proteína cas modificados, geneticamente construídos, recombin:ntes ou que ocorrem naturalmente formam uma combinação funcional.
Em algumas modalidades, a célula-recipiente é uma célula pro- cariótica. Em algumas modalidades preferenciais, a célula-recipiente é uma célula bacteriana. Células bacterianas adequadas são descritas neste pedi- do. Em algumas modalidades, a célula bacteriana é selecionada a partir de espécies de bactérias de ácido láctico, uma espécie Bifidobacterium, uma espécie Brevibacterium, uma espécie Propionibacterium, uma espécie Lac- tococcus, uma espécie Streptococcus, uma espécie Lactobacíllus incluindo a espécie Enterococcus, espécie Pediococcus, uma espécie Leuconostoc e É 10 espécie Oenococcus. Espécies adequadas incluem, mas não são limitadas a Lactococcus lactis, incluindo Lactococeus lactis subsp. lactis e Lactococcus lactis subsp. cremoris, Lactococcus lactis subsp. cremoris, Leuconostoc Sp., i . Lactococcus lactis subsp. lactis biovar, Streptococcus thermophilus, Lacto- bacillus delbrueckii subsp. bulgaricus e Lactobacillus helveticus, Bifidobacte- á “15 riumlactis, Lactobacillus acidophilus, Lactobacillus casei. " Em algumas modalidades, nas quais a resistência da célula de- ve ser modulada, a célula bacteriana é usada para fermentação de carne (incluindo carne bovina, carne suína e carne de aves) incluindo, mas não limitadas a, bactérias de ácido láctico, Pediococcus cerevisiae, Lactobacillus plantarum, Lactobacillus brevis, Micrococcus species, Lactobacillus sakei, % Lactobacillus curvatus, Pediococcus pentosaceus, Staphylococeus xylosus e Staphylococcus vitulinus e misturas das mesmas, como conhecido na técni- ca. Em algumas modalidades alternativas, a célula bacteriana é usada para a fermentação de vegetais (por exemplo, cenouras, pepinos, tomates, pi- mentão e repolho) incluindo, mas não limitadas a Lactobacillus plantatum, Lactobacillus brevis, Leuconostoc mesenteroides, Pediococcecus pentosaceus E e misturas das mesmas, como conhecido na técnica. Em algumas modalida- : des alternativas, a célula bacteriana é usada para a fermentação da massa de farinha formada por cereais (por exemplo, trigo, centeio, arroz, aveia, ce- é 1 30 vada e milho). Em algumas modalidades adicionais, a célula bacteriana é É usada para a produção de vinho. Tipicamente, isto é alcançado pela fermen- : tação do suco de fruta, tipicamente suco de uva. Ainda em modalidades adi-
cionais, a célula bacteriana é usada para a fermentação de leite para produ- zir queijo (por exemplo, Lactobacillus delbrueckii subsp. bulgaricus, Lactoba- cillus helveticus, Streptococcus thermophilus, Lactococcus lactis subsp. lac- tis, Lactococcus lactis subsp. cremoris, Lactococeus lactis subsp. lactis bio- vardiacetylactis, Lactococeus, Bifidobacterium e Enterococcus, etc. e mistu- ras das mesmas), como conhecido na técnica. Ainda em modalidades adi- Cionais, a célula bacteriana é usada para a fermentação de ovo (por exem- plo, Pediococcus pentosaceus, Lactobacillus plantarum e misturas das mesmas), como conhecido na técnica. Em algumas modalidades adicionais, : 10 —acélula bacteriana é usada em composições cosméticas ou farmacêuticas.
Em algumas modalidades, a célula na qual a resistência deve ser modulada é uma bactéria que naturalmente compreende um ou mais loci : de CRISPR. Loci de CRISPR foi identificado em mais de 40 procariontes (Vide, Haft et al., 2005, supra) incluindo, mas não limitado a Aeropyrum, P- “15 yrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, " Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacierium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium. Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, — Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, My- Á xococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xan- thamonas, Yersinia, Treponema e Thermotoga.
Cepa Bacteriana Parental Como usado neste pedido, os termos "bactéria parental" "bacté- rias parentais" e "cepa parental" referem-se a qualquer bacté- À ria/bactérias/cepas que é/são exposta a um ou mais bacteriófago(s). Em al- P : gumas modalidades, os bacteriófagos são virulentos para a cepa bacteriana E parental, enquanto em outras modalidades, são não virulentos. Em algumas Da 30 —modalidades particularmente preferenciais, as bactérias parentais são sensí- a veis ao fago virulento. Em algumas modalidades preferenciais, a cepa paren- À tal é infectada pelo bacteriófago. Em algumas modalidades particularmente preferenciais, a infecção pelo fago produz a bactéria/bactérias/cepa parental ou uma subpopulação das mesmas insensível à infecção adicional pelo bac- teriófago. Em algumas modalidades preferenciais, a infecção de uma "bacté- ria parental" por um ou mais bacteriófago resulta na criação de uma cepa marcada que pode ser selecionada com base na sua insensibilidade ao bac- teriófago. Em algumas modalidades preferenciais, "mutante resistente a bac- teriófago" são bactérias que são marcadas ou etiquetadas de acordo com os métodos da presente invenção. Em algumas modalidades, as bactérias pa- rentais são de cepas bacterianas de tipo selvagem. Em algumas modalida- des preferenciais, as bactérias parentais são cepas de tipo selvagem de bac- térias que não foram anteriormente infectadas com nenhum bacteriófago. Em algumas modalidades preferenciais, as bactérias parentais são cepas de . tipo selvagem de bactérias que não foram anteriormente marcadas ou eti- quetadas, enquanto em algumas modalidades alternativas, as bactérias da - “15 patente são mutantes resistentes a bacteriófago que foram anteriormente marcados ou etiquetados.
Em algumas modalidades particularmente preferenciais, a bacté- ria parental é selecionada a partir de qualquer bactéria que naturalmente compreende um ou mais loci de CRISPR. Como indicado acima, loci de —CRISPR foram identificados em mais de 40 procariontes (Vide, Haít et al.
[2005], supra) incluindo, mas não limitados a Aeropyrum, Pyrobaculum, Sur folobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, —Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Ther- moanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylo- bacter, Wolinella, Acinetobacter, Envinia, Escherichia, Legionella, Methylo- coccus, Pasteurella, Photobacterium, Salmonella, Xanthamonas, Yersinia, Treponema,e Thermotoga.
Em algumas modalidades, a bactéria parental compreende uma ou mais CRISPR espaçadoras heterólogas, uma ou mais repetições de
CRISPR heterólogas, e/ou um ou mais genes cas heterólogos.
Em algumas modalidades alternativas, a bactéria parental compreende um ou mais foci de CRISPR heterólogo, preferencialmente, um ou mais loci de CRISPR completos.
Em algumas modalidades adicionais, a bactéria parental natu- ralmente compreende um ou mais /oci de CRISPR e também compreende uma ou mais CRISPR espaçadoras heterólogas, uma ou mais repetições de CRISPR heterólogas, e/ou um ou mais genes cas heterólogos.
Em algumas modalidades adicionais, a bactéria parental naturalmente compreende um ou mais loci de CRISPR e também compreende um ou mais /oci de CRISPR heterólogo, preferencialmente, um ou mais loci de CRISPR completos.
Em algumas modalidades preferenciais, a subpopulação resis- tente ao fago criada pela exposição das bactérias parentais a pelo menos j . um fago é uma cultura pura.
Entretanto, não é destinado que a presente in- , venção seja limitada a culturas puras de cepas bacterianas, variantes ou A 15 fago.
De fato, é destinado que a presente invenção englobe culturas mistas de células e fago.
Em algumas modalidades, a cultura variada é uma mistura de mutantes diferentes correspondendo a diferentes eventos de integração no mesmo e/ou diferente /oci de CRISPR.
Embora não seja destinado que a presente invenção seja tão limitada, os gêneros bacterianos parentais preferenciais são Streptococcus e . Lactobacillus.
De fato, é destinado que qualquer espécie bacteriana encon- trará uso na presente invenção, incluindo mas não limitadas a Escherichia, Shigella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legioneila, Pseudo- monas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staph- —ylococcus, Streptococcus, Enterococcus, Clostridium, Corynebacterium, My- cobacterium, Treponema, Borrelia, Francisella, Brucella, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Enterococ- cus, Pediococcus, Leuconostoc, Oenococcus e/ou Xanthomonas.
Em algu- mas modalidades, as bactérias parentais são ou são derivadas de bactérias de ácido láctico, incluindo mas não limitadas a Bifidobacterium, Brevibacteri- um, Propionibacterium, Lactococeus, Streptococcus, Lactobacillus (por e- xemplo, L. acidophilus), Enterococeus, Pediococeus, Leuconostoc e/ou Oe-
nococcus. Em modalidades adicionais, as bactérias parentais são ou são derivadas de Lactococcus lactis (por exemplo, L. lactis subsp. lactis e L. lac- tis subsp. cremoris, e L. lactis subsp. lactis biovar diacetylactis), L. delbruec- kii subsp. bulgaricus, L. helveticus, L. acidophilus, L. casei, L. paracasei, L.
salivarius, L. plantarum, L. reuteri, L. gasseri, L. johnsonii, Bifidobacterium lactis, B. infantis, B. longum e/ou Streptococcus thermophilus.
Em algumas modalidades da presente invenção, a bactéria pa- rental é uma "bactéria de grau alimentício" (isto é, uma bactéria que é usada e geralmente encontrada como segura para uso na preparação e/ou produ- ção de alimento e/ou ração). Em algumas modalidades preferenciais, a bac- téria parental é adequada para o uso como uma cultura iniciadora, uma cul- tura probiótica e/ou um suplemento dietético. Em modalidades adicionais, a . " bactéria parental encontra uso na fermentação de carne (por exemplo, carne : bovina, carne suína, carne de cordeiro, e carne de aves) incluindo, mas não . 15 limitadas a bactérias de ácido lático, Pediococcus cerevisiae, Lactobacillus e plantarum, L. brevis, L. sakei, L. curvatus, Micrococeus species, Pediococcecus pentosaceus, Staphylococcus xylosus, S. vitulinus e misturas das mesmas (Vide, por exemplo, Knorr (ed.), Food Biotechnology, em 538-39 [1987], e Pederson, Microbiology of Fermented Foods, em 210-34, 2d ed., [1979]; e Patente norte-americana Nº 2.225.783, neste pedido incorporado por refe- rência em sua totalidade). Ainda em modalidades adicionais, a bactéria pa- rental encontra uso na fermentação de vegetais (por exemplo, cenouras, pepinos, tomates, pimentão e repolho) incluindo, mas não limitadas a L. plantatum, L. brevis, Leuconostoc mesenteroides, Pediococcus pentosaceus e misturasdasmesmas (Vide, por exemplo, Knorr, supra; Pederson, supra; e Patentes norte-americanas Nºs 3.024.116, 3.403.032, 3.932.674 e
3.897.307). Ainda em modalidades adicionais, a bactéria parental encontra uso na fermentação de massa de farinha formada por cereais (por exemplo, trigo, centeio, arroz, aveia, cevada e milho). Ainda em modalidades adicio- nais, a bactéria parental encontra uso na produção de vinho através da fer- mentação de suco de fruta (por exemplo, suco de uva). Em algumas modali- dades adicionais, a bactéria parental encontra uso na fermentação de leite
(por exemplo, L. delbrueckii subsp. bulgaricus, L. acidophilus, S. thermophi- lus e misturas das mesmas (Vide, Knorr, supra; e Pederson supra, nas pági- nas 105-35). Em algumas modalidades preferenciais, a bactéria parental encontra uso na produção de queijo, incluindo mas não limitadas a L. del- —brueckii subsp. bulgaricus, L. helveticus, L. lactis subsp. lactis, L lactis subsp. cremoris, L. lactis subsp. lactis biovar diacetylactis, S. thermophilus, Bifido- bacterium Enterococcus, etc. e misturas das mesmas (Vide, por exemplo, Knorr, supra, e Pederson, supra, em 135-51). Ainda em modalidades adicio- nais, a bactéria parental encontra uso na fermentação de ovos, incluindo mas não limitadas a Pediococcus pentosaceus, Lactobacillus plantarum, e misturas das mesmas (Vide, Knorr, supra). Em algumas modalidades, a bac- téria parental encontra uso na fermentação para produzir vários produtos, " - incluindo mas não limitados a queijo cheddar e cottage (por exemplo, L. lac- ; tis subsp. lactis, L. lactis subsp. cremoris), iogurte (L. delbrueckii subsp. bul- ani 15 garicuse S. thermophilus), queijo suíço (por exemplo, S. thermophilus, L. E lactis, e L. helveticus), queijo azul (Leuconostoc cremoris), queijo italiano (L. bulgaricus e S. thermophilus), viili (L. lactis subsp. cremoris, L. lactis subsp. lactis biovar diacetylactis, Leuconostoc cremoris), yakult (L. casei), caseína (L. lactis subsp. cremoris), natto (Bacillus subtilis var. natto), vinho (Leuco- nostoc oenos), saquê (Leuconostoc mesenteroides), polimixina (Bacillus polymyxa), colistina (Bacillus colistrium), bacitracina (Bacillus licheniformis), ácido L-Glutâmico (Brevibacterium lactofermentum e Microbacterium ammo- niaphilum), e acetona e butanol (Clostridium acetobutyricum e Clostridium saccharoperbutylacetonicum). Em algumas modalidades preferenciais, as espécies bacterianas parentais são selecionadas a partir de S. thermophilus, L. delbrueckii subsp. bulgaricus e/ou L. acidophilus.
Ainda em modalidades adicionais, as bactérias parentais encon- tram uso em métodos incluindo mas não limitados a produção de antibiótico, produção de aminoácido, produção de solvente e a produção de outros ma- teriais economicamente úteis. Ainda em outras modalidades, as bactérias parentais encontram uso em composições cosméticas, terapêuticas e/ou farmacêuticas. Em algumas modalidades, as composições têm atividades particulares, incluindo, mas não limitadas à regeneração da pele, incluindo mas não limitadas para propriedades antirrugas, apagamento de velhas cica- trizes, reparação de tecidos danificados por queimadura, promoção de cura de pele, eliminação de manchas pigmentadas, etc. Em algumas modalida- des,ascomposições promovem ou inibem o crescimento de unhas, cabelo ou pelos. Em algumas modalidades adicionais, as composições compreen- dem pelo menos uma cultura microbiana e/ou bactéria marcada e/ou uma cultura celular produzida usando os métodos e composições da presente invenção.
Em modalidades adicionais, as bactérias parentais são mutantes insensíveis a bacteriófago. Dessa maneira, em algumas modalidades, as bactérias parentais são insensíveis a um ou mais bacteriófagos. Em algumas modalidades preferenciais, a bactéria parental não é um mutante insensível E a Lacteriófago para o bacteriófago que deve ser exposto durante o uso da E 15 presente invenção. : Culturas Iniciadoras Culturas iniciadoras são usadas extensivamente na indústria a- limentícia na produção de produtos fermentados incluindo produtos lácteos (por exemplo, iogurte e queijo), bem como embutidos, produtos de padaria, vinhoe produtos vegetais.
Culturas iniciadoras usadas na produção de muitos produtos de leite fermentado, queijo e manteiga incluem culturas de bactérias, geralmen- te classificadas como bactérias de ácido lático. Tais culturas iniciadoras bac- terianas transmitem características específicas a vários produtos lácteos pe- larealização de diversas funções.
Culturas não concentradas comerciais de bactérias são referidas na indústria como “culturas mãe," e são propagadas no sítio de produção, por exemplo, uma leiteria, antes de serem adicionadas a um material inicial comestível, tal como leite, para fermentação. A cultura iniciadora propagada no sítio de produção de inoculação em um material inicial comestível é men- cionada como "iniciador de volume".
Culturas iniciadoras adequadas para uso na presente invenção incluem qualquer organismo que seja de uso indústria alimentícia, cosmética ou farmacêutica (isto é, "culturas industrialmente úteis" ou "cepas industrial- mente úteis").
Culturas iniciadoras são preparadas por técnicas bem conheci- das na técnica (Vide, por exemplo, Patente norte-americana Nº 4.621.058, incorporada neste pedido por referência). Em algumas modalidades, culturas iniciadoras são preparadas pela introdução de um inóculo, por exemplo, uma bactéria, a um meio de crescimento (por exemplo, um meio ou produto de fermentação) para produzir um meio inoculado e incubando o meio inocula- f 10 do para produzir uma cultura iniciadora.
Culturas iniciadoras secas são preparadas por técnicas bem co- nhecidas na técnica (Vide, por exemplo, Patentes norte-americanas Nºs ' 4.423.079 e 4.140.800). Qualquer forma adequada de culturas iniciadoras " secas encontra uso na presente invenção, incluindo preparações sólidas a. 15 (por exemplo, comprimidos, péletes, cápsulas, pós, grânulos e pó) que são - umidificáveis, secas por pulverização, congeladas secas ou liofilizadas. Em algumas modalidades, as culturas iniciadoras secas para uso na presente invenção estão em uma forma de precipitado profundamente congelado ou em forma de pó congelado seco. Culturas iniciadoras secas em uma precipi- tado profundamente congelado ou pó seco congelado são preparadas de acordo com qualquer método adequado conhecido na técnica.
Em algumas modalidades, as culturas iniciadoras usadas na presente invenção estão na forma de concentrados que compreendem uma concentração substancialmente alta de uma ou mais cepas bacterianas. Em algumas modalidades, os concentrados são diluídos com água ou ressus- pensos em água ou outros diluentes adequados, (por exemplo, um meio de crescimento apropriado, óleo mineral ou óleo vegetal). As culturas iniciado- ras secas da presente invenção na forma de concentrados são preparadas de acordo com os métodos conhecidos na técnica (por exemplo, centrifuga- ção, filtração ou uma combinação de tais técnicas).
Em algumas modalidades, a cultura iniciadora é adequada para uso na indústria láctea. Quando usada na indústria láctea, a cultura iniciado-
ra muitas vezes é selecionada a partir de uma espécie de bactérias de ácido láctico, uma espécie Bifidobacterium, uma espécie Brevibacterium, uma es- pécie Propionibacterium. Culturas iniciadoras adequadas do grupo de bacté- rias de ácido láctico incluem cepas comumente usadas de uma espécie Lac- tococcus, uma espécie Streptococcus, uma espécie Lactobacillus incluindo o Lactobacillus acidophilus, espécies Enterococcus, espécies Pediococcus, uma espécie Leuconostoc e espécies Oenococcus.
Culturas de bactérias de ácido láctico são comumente usadas na produção de lácteos fermentados (por exemplo, leitelho, iogurte ou creme de i 10 leite) e na fabricação de manteiga e queijo (por exemplo, brie ou havarii). Espécies de Lactococcus incluem os largamente usados Lactococcus lactis, incluindo Lactococcus lactis subsp. lactis e Lactococcus lactis subsp. cremo- . ris. : Outras espécies de bactérias de ácido lático incluem Leuconos- á 15 tocsp., Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgari- - cus e Lactobacillus helveticus. Além disso, cepas probióticas (por exemplo, espécies Lactococcus), incluem os largamente usados Lactococcus lactis, incluindo Lactococeus lactis subsp. lactis e Lactococcus lactis subsp. cremo- ris.
Culturas mesofílicas de bactérias de ácido lático comumente u- sadas na produção de produtos lácteos termentados, tais como leitelho, io- gurte ou creme de leite e na produção de manteiga e queijo (por exemplo, brie ou havarti). Outras espécies Lactococcus incluem Lactococcus lactis subsp. cremoris, Lactococcus lactis, Leuconostoc Sp., Lactococcus lactis subsp. lactis biovar, Streptococcus thermophilus, Lactobacillus delbrueckii subsp. bulgaricus e Lactobacillus helveticus. Além disso, em algumas moda- lidades, cepas probióticas, tais como Bifidobacterium lactis, Lactobacillus acidophilus, Lactobacillus casei são adicionadas durante a produção para aumentar o sabor ou promover saúde.
Culturas de bactérias de ácido lático comumente usadas na pro- dução de queijo cheddar e queijos monterey jack incluem Streptococcus thermophilus, Lactococcus lactis subsp. lactis e Lactococcus lactis subsp.
cremoris ou combinações das mesmas.
Culturas termofílicas de bactérias de ácido lático comumente usadas na produção de queijos italianos, tais como pasta filata ou parmesão, inclui Streptococcus thermophilus e Lactobacillus delbrueckii subsp bulgari- cus Outras espécies Lactobacillus (por exemplo, Lactobacillus helveticus) são adicionadas durante a produção para obter um sabor desejado.
Em algumas modalidades preferenciais, o organismo de culturas iniciadoras compreende ou consiste em uma cepa geneticamente modificada preparada de acordo com os métodos fornecidos neste pedido, de uma das cepas de bactérias de ácido lático acima ou qualquer ouira cepa de cultura iniciadora.
A seleção de organismos para a cultura iniciadora da invenção dependerá do tipo particular de produtos a serem preparados e tratados. Dessa maneira, por exemplo, para fabricação de manteiga e queijo, culturas Ô 15 —mesofílicas das espécies Lactococcus, espécies Leuconostoc e espécies : Lactobacillus são largamente usadas, ao passo que para iogurte e outros produtos lácteos fermentados, cepas termofílicas das espécies Streptococ- cus e de espécies Lactobacillus são tipicamente usadas.
Em algumas modalidades, a cultura iniciadora é uma cultura ini- ciadora seca, uma cultura iniciadora desidratada, uma cultura iniciadora congelada ou uma cultura iniciadora concentrada. Em algumas modalidades, a cultura iniciadora é usada na inoculação direta do meio ou produto de fer- mentação.
Em algumas modalidades, a cultura iniciadora compreende uma cultura pura (isto é, compreendendo somente uma cepa bacteriana). Em al- gumas modalidades alternativas, a cultura iniciadora é uma cultura mista (isto é, compreendendo pelo menos duas cepas bacterianas diferentes). Bactérias de Ácido Lático Culturas iniciadoras particularmente adequadas, em particular culturas iniciadoras secas, para uso na presente invenção compreendem bactérias de ácido lático. Como usado neste pedido, o termo "bactérias de ácido lático"
refere-se a bactérias Gram-positivas, microaerofílicas ou anaeróbicas que fermentam açúcar com a produção de ácidos incluindo o ácido láctico como o ácido predominantemente produzido, ácido acético, ácido fórmico e ácido propiônico.
As bactérias de ácido lático industrialmente mais úteis são en- —contradas entre espécies Lactococcus, tais como Lactococcus lactis, espé- cies Lactobacillus, espécies Bifidobacterium, espécies Streptococcus, espé- cies Leuconostoc, espécies Pediococcus e espécies Propionibacterium.
As culturas iniciadoras da presente invenção podem compreen- der uma ou mais espécies de bactérias de ácido lático tais como, Lactococ- cus lactis, Lactobacillus delbrueckii subsp. bulgaricus e Streptococcus ther- mophilus ou combinações das mesmas.
Culturas iniciadoras de bactérias de ácido lático são comumente usadas na indústria alimentícia como cultura de cepa mista compreendendo ' uma ou mais espécies.
Para diversas culturas de cepas mistas, tais como f 15 culturas iniciadoras de iogurte compreendendo cepas de Lactobacillus del- E brueckii subsp. bulgaricus e Streptococcus thermophilus, uma relação simbi- ótica existe entre as espécies em que a produção de ácido láctico é maior em comparação com culturas de cepa única de bactérias de ácido lático (Vi- de, por exemplo, Rajagopal et a/l., J.
Dairy Sci., 73:894-899 [1990]). Produtos * Produtos adequados para uso na presente invenção incluem, mas não são limitados a gêneros alimentícios, produtos cosméticos ou pro- dutos farmacêuticos.
Qualquer produto, que é preparado a partir de, ou compreende uma cultura, é contemplado conforme a presente invenção.
Es- tes incluem, mas não são limitados a, frutas, legumes, plantações de forra- gem e vegetais incluindo produtos derivados, grão e produtos derivados do grão, alimentos lácteos e produtos derivados de alimentos lácteos, carne, carne de aves, frutos do mar, produtos cosméticos e farmacêuticos.
O termo "alimento" é usado em um sentido amplo e inclui ali- mentos, gêneros alimentícios, ingredientes alimentícios, suplementos ali- mentares e alimentos funcionais.
Como usado aqui, o termo "ingrediente alimentício" inclui uma formulação, que é ou pode ser adicionada a alimentos e inclui formulações que podem ser usadas em baixos níveis em uma larga variedade de produ- tos que necessitam, por exemplo, de acidificação ou emulsificação.
Como usado neste pedido, o termo "alimento funcional" significa um alimento que é capaz de fornecer não somente um efeito nutricional e/ou uma satisfação de paladar, mas é também capaz de entregar um efeito be- néfico adicional ao consumidor. Embora não haja nenhuma definição legal de um alimento funcional, a maioria das partes com um interesse nesta área aceitam que há alimentos vendidos como tendo efeitos de saúde especiífi- cos. O termo "alimento" cobre o alimento para humanos bem como alimento para animais (isto é, uma ração). Em um aspecto preferencial, o . alimento é para consumo humano. E Em algumas modalidades, as células descritas neste pedido 3 15 compreendem ou são adicionadas a um ingrediente alimentício, um suple- mento alimentar, ou um alimento funcional. Em algumas modalidades, o ali- mento está em uma forma líquida (por exemplo, uma solução), gel, emulsão ou sólido, como solicitado pelo modo de aplicação e/ou administração.
As células descritas neste pedido encontram uso na preparação de produtos alimentícios, tais como um ou mais dos: produtos de confeitaria, produtos lácteos, embutidos, embutidos de aves, produtos de pesca e produ- tos de padaria. Em algumas modalidades, as bactérias encontram uso como ingredientes de refrigerantes, sucos de fruta, bebidas compreendendo prote- ína de soro de leite, chás saudáveis, bebidas de cacau, bebidas lácteas, be- —bidasde bactérias de ácido lático, iogurte, bebida láctea e vinho, etc.
É também fornecido um método para preparação de um alimen- to, o método compreendendo mistura das células de acordo com a presente invenção com um ingrediente alimentar (tal como um material inicial de um alimento). O método para preparação de um alimento é também outro as- pectoda presente invenção.
Apropriadamente um alimento como descrito neste pedido é um produto lácteo. Em algumas modalidades preferenciais, o produto lácteo é iogurte, queijo (por exemplo, queijo de coalho ácido, queijo duro, queijo se- miduro, queijo cottage, etc), leitelho, quark, creme de leite, Kefir, creme frai- che, bebida fermentada baseada no soro de leite, kumis, bebida láctea ou bebida de iogurte.
Como usado neste pedido, o termo "alimento" é termo de senti- do muito amplo, como é destinado para cobrir o alimento para humanos bem como alimento para animais não-humanos (isto é, ração). Em algumas mo- dalidades preferenciais, o alimento é para o consumo humano. O termo "ra- ção", como usado neste pedido, inclui material vegetal cru e processado e material não vegetal. O termo engloba qualquer ração adequada para con- sumo por um animal, incluindo, mas não limitado a gado, aves domésticas, peixe, crustáceos e/ou animais domésticos.
. Desenvolvimento de Cepas e Culturas Iniciadoras Resistentes ao Fago Y Durante o desenvolvimento da presente invenção, a resistência Á 15 ao fago envolvendo os genes CRISPR-cas, bem como seu papel na resis- - tência na entrada de DNA alheio e no papel dos espaçadores inseridos den- tro do CRISPR na especificidade desta resistência foram elucidados. Impor- tantemente, a presente invenção fornece métodos e composições para de- senvolvimento de cepas resistentes ao fago e culturas iniciadoras. Em algu- mas modalidades, uma cepa parental "A" é exposta ao fago "P" e um fago variante resistente (Variante "A1.0") é selecionado. Variante A1.0 é analisa- da (por exemplo, por PCR e/ou sequenciamento de DNA) para confirmar a presença de um espaçador inserido adicional em um locux de CRISPR. À sequência nucleotídica do espaçador adicional (Espaçador Sp1.0) então é determinada. Tipicamente, o espaçador Sp1.0 é um fragmento de aproxima- damente 30 nucleotídeos em tamanho a partir do fago P, e fornece resistên- cia ao fago P e fagos relacionados ("fagos relacionados" são aqueles con- tendo a sequência espaçadora em seus genomas e definem uma família de fagos).
Independentemente da primeira exposição ao fago, a mesma cepa parental A é exposta ao mesmo fago P e uma segunda variante resis- tente ao fago (Variante A2.0) é selecionada. A variante A2.0 é selecionada a fim de ter também um espaçador adicional inserido (Espaçador Sp2.0) den- tro de um locux de CRISPR mas com a sequência do espaçador Sp2.0 sen- do diferente daquela do espaçador Sp1.0. Tipicamente, o espaçador Sp2.0 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fagoP, e fornece resistência ao fago P e fagos relacionados. Similarmente, em algumas modalidades, variante A3.0 a variante Ax.O são geradas através da exposição da mesma cepa A ao mesmo fago P. Todas as variantes "A" são selecionadas a fim de ter também um espaçador adicional inserido (Es- paçador Sp3.0 a Spx.0) dentro de um /ocux de CRISPR mas com a sequên- ciade todos os espaçadores "Sp" sendo diferentes cada um dos outros. Ti- picamente, os espaçadores "Sp" são fragmentos de aproximadamente 30 nucleotídeos em tamanho a partir do fago P, e todos fornecem resistência ao . fago P e fagos relacionados.
Embora estas variantes sejam úteis, são limitadas em termos do E: 15 escopo da sua resistência. Dessa maneira, em algumas modalidades, é van- - tajoso desenvolver o segundo nível de cepas resistentes ao fago. De fato, é vantajoso desenvolver, além disso, estas variantes resistentes aos fagos pelo aumento e expansão de sua resistência aos fagos. Tipicamente, pode ser estimado que o nível de resistência será aproximadamente aquele de uma mutação única que ocorre dentro do genoma de fago dentro da se- quência correspondente ao espaçador (isto é, aproximadamente 10º a 10º). Consequentemente, cepas resistentes ao fago que acumulam espaçadores diferentes dentro do locux de CRISPR tem um nível aumentado de resistên- cia ao fago contendo a sequência destes espaçadores dentro de seu geno- ma (isto é, uma vez que múltiplas mutações únicas precisam ocorrer dentro do genoma de fago).
Em algumas modalidades, as variantes de segundo nível são produzidas pelo isolamento de um fago mutado através da exposição da va- riante A1.0 ao fago P. Tipicamente, este fago mutado (fago P1.0) tem uma mutação (deleção, mutação pontual, etc.) em seu genoma na região conten- do a sequência do espaçador Sp1.0. A variante A1.0 é sensível ao fago P1.0. Então, a variante A1.0 é exposta ao fago P1.0 e uma variante resisten-
te ao fago (Variante A1.1) selecionada (Vide, Figura 15). A variante A1.1 também é selecionada tal que tenha um espaçador adicional inserido (Espa- çador Sp1.1) dentro de um /ocux de CRISPR mas com a sequência de es- paçador Sp1.1 sendo diferente daquela de espaçadores Sp1.0, Sp2.0 a Spx.O. Tipicamente, espaçador Sp1.1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago P1.0, e fornecerá resistência ao fago P1.0 e fagos relacionados. A variante A1.1 é resistente ao fago P1.0 e preferencialmente, tem uma resistência aumentada ao fago P por causa da acúmulo do espaçador Sp1.0 e Sp1.1.
É 10 Em modalidades adicionais, um fago recentemente mutado (fago P1.1) é gerado através da exposição da variante A1.1 ao fago P1.0. Então, na exposição da variante A1.1 ao fago P1.1 uma nova variante A1.2 é obtida contendo um novo espaçador adicional (Sp1.2). Este espaçador fornece re- : sistência ao fago P1.1 e preferencialmente aumenta a resistência ao fago il 15 P1.0eP (isto é, devido ao acúmulo de espaçadores Sp1.0, Sp1.1, Sp1.2). - Ainda em modalidades adicionais, espaçadores diferentes (por exemplo, 2, 3 ou 4) são iterativamente acumulados dentro da cepa A através da variante A1, então variante A1.1, então variante A1.2, etc, para obter uma variante altamente resistente aos fagos (variante A1.n). Ainda em modalidades adi- cionais, os espaçadores diferentes adicionais podem ser acumulados na É mesma cepa através de variantes A2, então variantes A2.1, então variantes A2.2, etc. para gerar outra variante da cepa A altamente resistente aos fagos (variantes A2.n) em paralelo. A mesma estratégia encontra uso com varian- tes A3.0 a Ax.O.
Em algumas modalidades, cepas que são resistentes a mais de uma família de fagos são fornecidas. Como uma cepa dada pode ser sensí- vel a mais de uma família de fagos, em algumas modalidades, é desejado para alargar a resistência da cepa a múltiplas famílias de fago pela introdu- ção de espaçador(es) adicional em um locux de CRISPR que se origina de — outras famílias de fagos (Vide, Figura 16). Por exemplo, os fagos P, Q e R são fagos representativos de três famílias de fagos capazes de infectar a cepa A. Usando o método delineado acima e neste pedido, variantes resis-
tentes às três famílias de fago são produzidas. Em algumas modalidades, o fago P é usado para gerar a variante A1º (contendo o espaçador Sp1) que é resistente ao fago P. Então, a variante A1º é exposta ao fago Q e uma vari- ante resistente ao fago (Variante A1Pº) é selecionada. A variante A1ºº* tem um espaçador adicional (Sq1) inserido em um Jocux de CRISPR. Tipicamen- te, o espaçador Sq1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago Q, e fornede resistência ao fago Q e fagos rela- cionados. A variante A1ºº é resistente a ambos fagos P e Q. Após, a variante APº é exposta ao fago R e uma variante resistente ao fago (Variante A1º*) é : 10 selecionada. A variante A1º*iem um terceiro espaçador adicional (Sr1) inse- rido em um locux de CRISPR. Tipicamente, Sri é um fragmento de aproxi- madamente 30 nucleotídeos em tamanho a partir do fago R, e também for- nece resistência ao fago R e fagos relacionados. A variante A1ºP* é resistente aos três fagos. Em algumas modalidades particularmente preferenciais, a À — 15 variante é também resistente aos fagos relacionados.
. Em modalidades adicionais, os métodos acima mencionados são usados em combinação para produzir resistência aumentada e expandi- da aos fagos. Em algumas modalidades particularmente preferenciais, estas variantes têm altas resistências a múltiplas famílias de fago. Ainda em moda- lidades adicionais, cepas que são produzidas são resistentes a fagos ou fa- mílias de fagos particulares que são problemáticos em determinadas fábri- cas e/ou fermentadores.
Imunidade mediada por CRISPR e Aplicações de Cepas resistentes ao Fago Em contraste com os ensinamentos da técnica anterior que hipo- tetiza que CRISPR ou CRISPR espaçadoras possam estar envolvidas na conferência de imunidade específica, a presente invenção é baseada, em parte, no achado surpreendente que genes ou proteínas cas são necessá- rios para imunidade contra um ácido nucleico-alvo ou um produto de trans- crição do mesmo. Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo, função, nem meios de ação particulares. Ainda mais surpreendentemente, durante o desenvolvimento da presente invenção, foi encontrado que um ou mais genes ou proteínas cas estão associadas com duas ou mais repetições de CRISPR dentro dos loci de CRISPR.
Em outras palavras, os genes ou proteínas cas parecem ser específicos para um dado DNA de repetição de CRISPR, significando que os genes ou proteínas cas e a sequência de repetição formam um par funcio- nal.
Consequentemente, uma ou mais CRISPR espaçadoras encontram uso em conjunto com um ou mais destes pares funcionais (isto é, repetições de CRISPR e genes cas) a fim de modular a resistência de uma célula contra um ácido nucleico-alvo ou um produto de transcrição do mesmo. ' Em uma modalidade, para uma ou mais CRISPR espaçadoras : 10 para conferir imunidade à célula, a repetição(ões) de CRISPR e o gene(s) ou proteínas cas formam uma combinação funcional (isto é, a repetição(ões) de CRISPR e o gene(s) ou proteínas cas é compatível). . Em modalidades preferenciais adicionais, a presente invenção . fornece genes/proteínas cas que influenciam na resistência de bactérias aos Á 15 fagos.
Ainda em modalidades adicionais preferenciais, a presente invenção - fornece pelo menos duas repetições de CRISPR e pelo menos um ge- ne/proteína cas útil em predição, determinação e/ou modificação de resis- tência bacteriana aos fagos.
De fato, a presente invenção fornece métodos para modificação do lisotipo (isto é, a resistência/sensibilidade a vários fa- gos) de bactérias.
Consequentemente, a identificação e detecção de loci de É CRISPR em células e fagos fornecem meios para determinar, predizer e modificar o perfil de resistência das células, bem como interações de fago- hospedeiro.
Vantajosamente, a aplicação de um ou mais /oci de CRISPR, duas ou mais repetições de CRISPR, um ou mais genes ou proteínas cas e/ou uma ou mais CRISPR espaçadoras na engenharia genética fornece meios para produzir variantes resistentes ou sensíveis de células para uso dentro de uma larga variedade de aplicações na indústria de biotecnologia.
Como discutido em maiores detalhes abaixos, os fagos são pa- rasitas naturais de bactérias que podem desenvolver-se durante a fermenta- ção.
Na infecção por fagos, as bactérias são mortas, que prejudica o proces- so de fermentação.
Na fermentação láctea, estas infecções por fago muitas vezes têm grandes impactos econômicos, variando de uma qualidade redu- zida do produto fermentado até a perda completa do produto.
Para superar problemas de fago, as companhias de culturas ini- ciadoras desenvolveram várias estratégias. Programas tradicionais de cultu- ras iniciadoras têm dependido de estratégias de rotação para defesa contra fago (PDRS) para minimizar falhas devido ao ataque de fago (Vide, por e- xemplo, Klaenhammer, Adv. Appl. Microbiol., 30: 1 [1984]; Lawrence et al., J. Dairy Res. 43: 141 [1976); e Whitehead and Hunter, J. Dairy Res., 15:112
[1947]). Estas estratégias confiam em cepas múltiplas geneticamente não | 10 relacionadas que provavelmente apresentarão espectro diferente de sensibi- lidade ao fago (isto é, lisotipos diferentes). Quando um fago aparece durante um processo de fermentação usando uma cepa definida, uma cepa que é : idealmente de um lisotipo diferente (isto é, com um padrão de sensibilidade . diferente ao fagos) é usada em substituição para a fermentação. A história Í 15 provou, entretanto, que é difícil identificar números suficientes de lisotipos : diferentes para utilizar com sucesso estas estratégias. De fato, muitas cepas de interesse industrial apresentam traços funcionais raros (por exemplo, tex- turização rápida acidificadora S. thermophilus). Além disso, nem todas cepas apresentam traços apropriados para serem produzidas como culturas inicia- doras. Além disso, por causa da sua raridade e o aumento do tamanho das i fábricas de leite, estas cepas são intensivamente usadas.
Há problemas adicionais com estratégias tradicionais de rotação de culturas iniciadoras. Embora algumas cepas não sejam atacadas por fa- gos existentes quando introduzidos, fago muitas vezes consequentemente aparecem devido a mutação de fago, modificação, e aumento que atacam a cepa recentemente introduzida (Vide, por exemplo, Heap and Lawrence, N.Z.J. Dairy Sci. Technol., 11:16 [1976]; Limsowtin and Terzaghi, N.Z.J. Da- iry Sci. Technol., 11:251 [1976]; Pearce, N.Z.J. Dairy Sci. Technol., 13:166
[1978]; e Sanders and Klaenhammer, Appl. Environ. Microbiol., 40:500 — [1980]). Além disso, em muitos casos, a longevidade e atividade de rotações iniciadoras de cepas complexas é imprevisível e muitas vezes leva a falhas precoces (Vide, por exemplo, Limsowtin et al., N.Z.J. Dairy Sci. Technol., 13:
1 [1977]; e Thunell et al, J. Dairy Sci., 64, 2270 [1981]). Além disso, rota- ções prolongadas que envolvem cepas numerosas aumentam o nível e di- versidade do fago que contamina a fábrica (Vide, por exemplo, Heap and Lawrence, N.Z.J. Dairy Sci. Technol., 12:213 [1981]; Lawrence et al., J. Dairy Sci,61:1181[1978]; e Thunell et al, J. Dairy Sci. 64, 2270 [1981]).
A fim de combater a proliferação de fago, os programas tradicio- nais de culturas iniciadoras dependeram do uso de cepas que apresentam as mesmas funcionalidades tecnológicas ou similares, mas sensibilidades ao fago diferentes. As cepas são usadas em rotação para realizar a fermenta- ção sucessiva. Estes programas tradicionalmente confiam em cepas múlti- plas geneticamente não-relacionadas o que consequentemente apresenta o espectro diferente de sensibilidade ao fago (lisotipo). Abordagens alternati- : vas (Vide, por exemplo, Patente Americana 5.593.885) utilizam programas ! de cultura iniciadora com base no uso de conjuntos de cepas isogênicas que ii 15 apresentam sensibilidade ao fago diferente, em vez de cepas geneticamente não-relacionadas apresentando lisotipos diferentes. O termo "conjunto de cepas isogênicas" como usado neste pedido define cepas que são idênticas de um ponto de vista cromossomal mas cada uma se diferencia pela pre- sença de um ou mais mecanismos de resistência ao fago que são carrega- dos pelo plasmídeo. Em tal programa de rotação de culturas iniciadoras, quando um fago aparece durante um processo de fermentação usando uma cepa definida, uma cepa que é idealmente de um lisotipo diferente (isto é, com um espectro diferente de sensibilidade aos fagos) é usada em substitui- ção para fermentação. Devido a este lisotipo diferente, a segunda cepa não é afetada pelos fagos que permanecem latentes no ambiente. A maioria da população de fagos latentes são então lavados por fermentação sucessiva e sanitização, e erradicados na altura da primeira cepa é usada novamente para a fermentação, se o sistema trabalhar como destinado.
A presente invenção fornece métodos melhorados e composi- ções adequadas para dirigir estes problemas na indústria de fermentação. De fato, a presente invenção fornece métodos e composições para indústria de fermentação, e especialmente a indústria do leite com uma seleção de cepas adequadas para cumprir as necessidades de estratégias de rotação para defesa contra fago.
Além disso, a presente invenção fornece métodos e composições adequadas para personalizar cepas que têm lisotipos que são adaptados a um determinado ambiente de fago.
Especialmente, a presente invenção fornece métodos e composições adequadas para dirigir a evolução de uma dada cepa a vários lisotipos, a fim de produzir cepas que se diferen-
ciam de cada uma das outras somente por seu espectro de sensibilidade ao fago (lisotipo). Esta diferença de lisotipo é uma função do sistema CRISPR-
cas, como descrito neste pedido.
Em algumas modalidades preferenciais,
lisotipos diferentes são obtidos através da "modulação" da resistência ao fago.
Em algumas modalidades particularmente preferenciais, embora os lisotipos sejam diferentes, as cepas deste tipo têm metabolismo idêntico (por
". exemplo, de carbono, nitrogênio, etc) e então funcionalidades idênticas (por Ú exemplo, acidificação, sabor, textura, etc). Isto fornece meios para amplifica- ã À 15 ção da construção de rotação iniciadora.
Além disso, processabilidades in- -. dustriais da cepa resistente ao fago são idênticas (por exemplo, necessida- des nutricionais, resistência à operação de processamento, etc). Dessa for-
ma reduzindo a necessidade de desenvolvimento de processos de produção específicos.
De fato, a presente invenção fornece métodos e composições
: 20 adequadas para minimizar falhas na fermentação devido ao ataque de fago.
À Em algumas modalidades, métodos e composições são fornecidos para a produção de culturas iniciadoras altamente resistentes ao fago, pela associ-
ação de múltiplas cepas resistentes ao fago que se diferenciam pelo seu lisotipo.
Em algumas modalidades alternativas, métodos e composições são fornecidos para produzir culturas iniciadoras com funcionalidades industriais estritamente idênticas para serem usadas na rotação da fermentação do lei-
te.
Em modalidades adicionais, métodos e composições são contanto que sejam adequados para substituir iniciadoras existentes pela prevenção de ataques de fago frequentes em fábricas de leite, pela introdução de uma no-
vacepa bacteriana que é resistente aos fagos envolvidos nestes ataques de fago.
Em algumas modalidades, estes métodos e composições são usados iterativamente, a fim de combater ataques de fago sequenciais.
Em algumas modalidades adicionais, a cultura iniciadora é uma cultura bacteriana variada. Em algumas modalidades particularmente prefe- renciais, a iniciadora compreende quantidades iguais de múltiplas (isto é, pelo menos 2) variantes resistentes ao fago que somente se diferenciam em seus CRISPRs e sua sensibilidade aos fagos. Em algumas modalidades, estas variantes estão no primeiro nível de variantes resistentes ao fago (por exemplo, variantes A1.0 mais A2.0, como descrito acima). Em algumas mo- dalidades preferenciais, as variantes são selecionadas a partir daquelas no segundo nível de variantes resistentes ao fago (por exemplo, variantes A1lA Í 10 mais A24, como descrito acima). Em algumas modalidades particularmente preferenciais, as variantes são selecionadas entre o terceiro nível de varian- tes resistentes ao fago. Em tais culturas bacterianas variadas, quando uma : das variantes é atacada por um dado fago as outras variantes não serão a- : tacadas pelo fago, devido às suas sensibilidades ao fago diferentes e a fer- i — 15 mentaçãonãoé afetada adversamente.
- Em algumas modalidades adicionais, uma iniciadora principal e uma iniciadora de reserva são usadas. A iniciadora principal é composta de uma cepa única. Em algumas modalidades, esta cepa é do primeiro nível de variantes resistentes ao fago, enquanto em outras modalidades preferenciais acepa6é do segundo nível, e ainda em outras modalidades mais preferenci- ais, a cepa é do terceiro nível. Em algumas modalidades preferenciais, a iniciadora de reserva é baseada em uma variante resistente ao fago obtida independentemente a partir da mesma cepa parental. Esta segunda variante resistente ao fago diferencia-se de outra variante pelas suas CRISPRs e é do primeiro nível de variantes resistentes ao fago, enquanto em outras mo- dalidades preferenciais a cepa é do segundo nível, e ainda em outras moda- lidades mais preferenciais, a cepa é do terceiro nível. Por exemplo, em al- gumas modalidades, a iniciadora principal é feito da variante Al. 4 e a inicia- dora reserva é feita da cepa A2.4. Na primeira aparição de um fago durante a fermentação com a iniciadora principal, esta iniciadora é descartada e substituída pela iniciadora reserva. Em algumas modalidades mais preferen- ciais, uma terceira iniciadora também é preparada como uma iniciadora re-
serva que servirá de reserva para a reserva.
Em algumas modalidades pre- ferenciais, as iniciadoras são cada uma feitas de variantes resistentes a múl- tiplos fagos.
Ainda em modalidades adicionais, a presente invenção fornece métodose composições adequadas em estratégias de rotação.
Em algumas modalidades, em vez de descartar a iniciadora muitas vezes atacada por fagos, as iniciadoras são usadas de um modo cíclico mesmo se o ataque de fago for observado.
Esta estratégia limita o número de iniciadoras a serem desenvolvidas.
Em algumas modalidades particularmente preferenciais, as iniciadoras são cada uma feitas de cepas resistentes a múltiplos fagos em vez de um único.
Isto fornece a robustez aumentada ao fago emergente.
Ainda em modalidades adicionais, as iniciadoras construídas são fornecidas. : Em algumas modalidades preferenciais, as variantes resistentes ao fago são : produzidas para combater especificamente fagos que estão presentes em . — 15 umadadafábrica ou instalação de fermentação. : TIPAGEM Em um aspecto adicional da presente invenção, é fornecido um método para identificação (por exemplo, tipagem) de uma bactéria marcada.
Em uma modalidade, a etapa de identificação é realizada por amplificação (por exemplo, amplificação por POR) do locux de CRISPR ou uma porção do mesmo.
Uma primeiro iniciador pode ser desenhado para hibridizar em uma sequência que está localizada a montante da primeira repetição de CRISPR de um /ocux de CRISPR.
Por meio do exemplo, o primeiro iniciador pode hibridizar-se na porção da sequência líder comum do locux de CRIS- PR.
Por meio do exemplo adicional, o primeiro iniciador pode hibridizar em um gene vizinho que é localizado a montante do /ocux de CRISPR.
O segundo iniciador pode hibridizar a jusante pelo menos na primeira CRISPR espaçadora ou pelo menos no primeiro núcleo da CRISPR — espaçadora.
O segundo iniciador pode hibridizar tão longe quanto no rebo- que ou até em um gene vizinho a jusante.
Preferencialmente, o segundo ini- ciador hibridiza com o locux de CRISPR.
Preferencialmente, o segundo inici-
ador hibridiza pelo menos parcialmente em uma CRISPR espaçadora a ju- sante ou núcleo de CRISPR espaçadora. Seguinte à amplificação, a sequência de direcionamento pode ser identificada usando vários métodos que são conhecidos na técnica.
Por meio do exemplo, a sequência de direcionamento pode ser identificada pela determinação do padrão de restrição do produto de amplifi- cação. Consequentemente, uma vez que o DNA compreendendo o locux de CRISPR ou uma porção do mesmo foi amplificado, pode ser digerido (por exemplo, corte) com uma ou mais enzimas de restrição.
: 10 Como usado neste pedido, o termo "enzimas de restrição" refe- re-se a enzimas (por exemplo, enzimas bacterianas), cada uma das quais corta o DNA de filamento duplo em ou perto de uma sequência nucleotídica . específica. Enzimas de restrição são bem conhecidas na técnica e podem : ser prontamente obtidas, por exemplo, de uma variedade de fontes comerci- f 15 ais (por exemplo, New England Biolabs Inc., Beverly, Massachusetts). Simi- larmente, métodos para uso de enzimas de restrição também são geralmen- te bem conhecidos e rotineiro na técnica. Enzimas de restrição que produ- zem entre 10 e 24 fragmentos de DNA quando cortam o locux de CRISPR ou uma porção do mesmo podem ser usadas. Exemplos de tais enzimas incluem, mas não são limitados a, Alul, Mset e Tsp5091. Fragmentos de DNA obtidos usando enzimas de restrição podem ser detectados, por exem- plo, como bandas por eletroforese em gel. Enzimas de restrição podem ser usadas para criar Polimorfismos de Tamanho de Fragmento de Restrição (RFLPs).
RFLPs são gerados pelo corte ("restrição") de uma molécula de DNA com uma endonuclease de restrição. Muitas centenas de tais enzimas foram isoladas, como naturalmente feito por bactérias. Em essência, bacté- rias usam tais enzimas como um sistema defensivo, para reconhecer e en- tão clivar (restringir) qualquer molécula de DNA estranho que poderia entrar na célula bacteriana (por exemplo, uma infecção viral). Foi encontrado que cada uma de muitas centenas de enzimas de restrição diferentes cortam (isto é, "clivam" ou "restringem") DNA em uma sequência diferente de 4 nu-
cleotídeos básicos (A, T, G, C) que compõem todas as moléculas de DNA, por exemplo, uma enzima e somente poderia reconhecer especificamente a sequência A-A-T-G-A-C, enquanto outra poderia especificamente e somente reconhecer a sequência G-T-A-C-T-A, etc. Dependendo da enzima única envolvida, tais sequências de reconhecimento podem variar em tamanho, de alguns como 4 nucleotídeos para tanto como 21 nucleotídeos. Sequências maiores de reconhecimento, fragmentos de restrição menores resultarão, já que maior o sítio de reconhecimento, menor a probabilidade que será repeti- damente encontrada em todas as partes do DNA.
Í 10 Por meio de exemplo adicional, a sequência de direcionamento pode ser identificada pela determinação ou também determinação de dife- rença no tamanho do produto de amplificação.
; A separação pode ser realizada por qualquer método adequado . para separação de DNA, incluindo, mas não limitado a, eletroforese em gel, f — 15 cromatografia líquida de alta performance (HPLC), espectroscopia de massa . e uso de um dispositivo microfluídico. Em uma modalidade, os produtos de amplificação ou fragmentos de DNA são separados por eletroforese em gel de agarose. Eletroforese em gel separa diferentes moléculas carregadas classificadas por sua velocidade de movimento através de um gel estacioná- riosoba influência de uma corrente elétrica. Estes produtos de amplificação separados ou fragmentos de DNA podem ser facilmente visualizados, por exemplo, por marcação com brometo de etídeo e pela visualização do gel sob iluminação UV. O padrão de bandeamento reflete os tamanhos da res- trição do DNA digerido ou os produtos de amplificação. Por meio de exemplo adicional, a sequência de direcionamento pode ser identificada por sequenciamento dos produtos de amplificação. A sequência dos produtos amplificados pode ser obtida por qualquer método conhecido na técnica, incluindo métodos de sequencia- mento automáticos e manuais. Vide, por exemplo, Sambrook et al. (1989) — Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Labora- tory Press, Plainview, New York; Roe et a/. (1996) DNA Isolation and Se- quencing (Essential Techniques Series, John Wiley & Sons).
Métodos de hibridização estão também dentro do escopo da presente invenção, usando uma molécula de ácido nucleico como uma son- da, ou uma molécula de ácido nucleico capaz de hibridizar-se a uma se- quência nucleotídica particular. Vide, por exemplo, Sambrook et al. (1989) — Molecular Cloning: Laboratory Manual (2d ed., Cold Spring Harbor Labora- tory Press, Plainview, New York).
Em técnicas de hibridização, a sonda(s) de hibridização pode ser fragmentos de DNA genômico, produtos amplificados por PCR, ou outros oligonucleotídeos, e pode compreender toda ou parte de uma sequência nu- —cleotídica conhecida. Além disso, pode ser marcado com um grupo detectá- vel tal como *P, ou qualquer outro marcador detectável, tal como outros ra- dioisótopos, um composto fluorescente, uma enzima, ou um cofator enzimá- h tico. O termo "marcado", com relação à sonda, é destinado a englobar a : marcação direta da sonda pela ligação (isto é, ligação fisicamente) de uma f — 15 substância detectável à sonda, bem como marcação indireta da sonda pela . reatividade com outro reagente que é diretamente marcado. Exemplos de marcação indireta incluem a marcação da extremidade de uma sonda de DNA com biotina tal que possa ser detectada com estreptavidina fluorescen- temente marcada.
Métodos que englobam técnicas de hibridização para detectar ou diferenciar cepas bacterianas também são englobadas. Estes incluem, mas não são limitados a, Southern blotting (Vide, por exemplo, Van Embden et al. (1993) J. Clin. Microbiol. 31:406-409), ensaios de alteração de (Vide, por exemplo, Pedido de Patente Americana No. 20030219778), ensaios de —sequenciamento usando arranjos de oligonucleotídeo (Vide, por exemplo, Pease et al. (1994) Proc. Natl. Acad. Sci. USA 91 :5022-5026), espoligotipa- gem (Vide, por exemplo, Kamerbeek et al. (1997) J. Clin. Microbiol. 35:907- 914), Hibridização Fluorescente In Situ (FISH) (Vide, por exemplo, Amann et al. (1990) J. Bacteriol. 172:762-770) e ensaios de rastreamento heteroduplex ou análise de mobilidade heteroduplex (Vide, por exemplo, White et al. (2000) J. Clin. Micro. 38:477-482).
A sequência de direcionamento que é identificada pode ser comparada com um banco de dados de sequência de fago e/ou um banco de dados de sequência bacteriana. Tipicamente, a sequência de direciona- mento combinará com uma ou mais sequências no banco de dados de se- quência de fago, mas não com o banco de dados de sequência bacteriana.
Como novas bactérias marcadas são preparadas usando os mé- todos descritos neste pedido, um banco de dados de marcações pode ser criado levando em conta a identificação específica de bactérias que foram marcadas.
Em um aspecto é fornecido uso de uma sequência obtida ou ob- tenível a partir de um bacteriófago (por exemplo, na produção de uma bacté- ria marcada) para marcar e/ou identificar uma bactéria, em que a dita se- quência está integrada em uma extremidade do locux de CRISPR da bacté- Y ria parental. : Em um aspecto adicional é fornecido o uso de uma sequência — 15 obtida ou obtenívela partir de um bacteriófago (por exemplo, na produção " de uma bactéria marcada) para marcação e/ou identificação de uma bacté- ria, em que a dita sequência compreende: (i) pelo menos uma sequência que é homóloga (por exemplo, idêntica) a uma repetição de CRISPR no lo- cux de CRISPR da dita bactéria; e (ii) uma sequência de direcionamento.
Em um aspecto adicional, é fornecido o uso de uma sequência para marcação e/ou identificação de uma bactéria (por exemplo, na fabrica- ção de uma bactéria marcada), em que a dita sequência é obtida ou obtení- vel por: (a) exposição de uma bactéria parental a um bacteriófago; (b) sele- ção de um mutante insensível a bacteriófago; (c) comparação do locux de —CRISPR ou uma porção do mesmo da bactéria parental e o mutante insen- sível a bacteriófago; e (d) seleção de uma sequência no /ocux de CRISPR ou uma porção do mesmo do mutante insensível a bacteriófago que não es- tá presente na bactéria parental.
CRISPR e Eucariontes Como detalhado neste pedido, mostrou-se que CRISPR fornece resistência contra a entrada de ácido nucleico em procariontes. Especifica- mente, mostrou-se que as CRISPR espaçadoras mostrando homologia ao
DNA viral (por exemplo, ácido nucleico de bacteriófago) fornecem resistência contra o vírus que compartilha identidade de sequência com pelo menos uma sequência espaçadora.
Entretanto, também é contemplado que o sis- tema CRISPR, incluindo genes e/ou proteínas cas junto com espaçadores, repetições, líder e reboque a células que atualmente não contêm /oci de CRISPR encontrará uso no fornecimento de resistência contra o ácido nucle- ico de novo.
De fato vem algumas modalidades, tais manipulações encon- tram uso com vários eucariontes, incluindo mas não limitados a humanos, outros animais, fungos, etc.
É contemplado que o sistema CRISPR seja transferido para células eucarióticas utilizando qualquer método adequado conhecido na técnica, incluindo, mas não limitados à transformação através de plasmídeos.
Nestas modalidades, o locide CRISPR, bem como sinais de r transcrição/tradução necessários são incluídos no DNA plasmidial, todos : para expressão e função das sequências em células eucarióticas. h 15 Em algumas modalidades adicionais, as sequências espaçado- . ras são contruídas tais que tenham identidade com sequências virais de inte- resse infectando o hospedeiro envolvido.
Em algumas modalidades prefe- renciais, estes métodos e composições fornecem resistência à célula- hospedeira contra vírus que compartilham identidade de sequência com a —CRISPR espaçadora introduzida na célula.
Em algumas modalidades parti- cularmente preferenciais, os vírus incluem, mas não são limitados a HIV, ortomixovírus, paramixovírus, pseudomixovírus, RSV, influenza, rubeóla, varicela, rubéola, coronavírus, vírus de hepatite, calicivírus, poxvírus, her- pesvírus, adenovírus, papovavírus, papilomavírus, enterovírus, arbovírus, —rabdovírus, arenavírus, arbovírus, rinovírus, reovírus, coronavírus, reovírus, rotavírus, retrovírus, etc.
Em modalidades adicionais, o direcionamente es- pecífico de sequências de ácidos nucleicos altamente conservadas em CRISPR espaçadoras fornece resistência aumentada contra tais vírus em células eucarióticas.
Em algumas modalidades particularmente preferenciais, ascélulaseucarióticas são células humanas.
CRISPR e Geração de Mutantes Resistentes ao Fago Durante o desenvolvimento da presente invenção, experimentos foram conduzidos para determinar se loci de CRISPR são alterados durante a geração natural de mutantes resistentes ao fago. Um sistema modelo de fago-hospedeiro foi selecionado, composto de uma cepa de S. thermophilus de tipo selvagem sensível ao fago largamente usada na indústria do leite, DGCC7710 (WT) e dois bacteriófagos virulentos isolados distintos, mas es- treitamente relacionados a partir de amostras de iogurte industriais, ou seja, fago 858 e fago 2972 (Levesque et al., Appl. Environ. Microbiol., 71:4057
[2005]). Nove mutantes resistentes ao fago foram independentemente gera- dos pelo desafio da cepa de WT com o fago 858, fago 2972 ou simultanea- mente com ambos, e seus locide CRISPR foram analisados. Diferenças fo- ram constantemente observadas no locux de CRISPR1, onde 1 a 4 espaça- dores adicionais foram inseridos próximos aos 32 espaçadores presentes na y cepa de WT (Vide, Figura 9). A adição de novos espaçadores em resposta à : infecção de fago pareceu ser polarizada em direção a uma extremidade do ii — 15 locuxdeCRISPR1. Istoé compatível com a observação anterior da hiperva- riabilidade do espaçador na extremidade líder do locux de CRISPR em vá- rias cepas (Vide, por exemplo, Pourcel et al., Microbiol., 151:653 [2005]; e Lillestol et a/, Archaea 2:59 [2006]). Análise de sequência dos espaçadores adicionais inseridos no /ocux de CRISPR1 de vários mutantes resistentes ao fago revelaram a similaridade a sequências encontradas nos genomas dos : fagos usados no desafio. Similaridades foram observadas em todas as par- tes dos genomas de fago, na maioria de módulos funcionais, ambas nos fi- lamentos codificantes e não codificantes. Nenhuma sequência, gene ou gru- po funcional particular pareceu ser direcionados especificamente. Estes re- —sultados indicam que para tornar-se resistente a bacteriófagos, o locux de CRISPR1 foi modificado pela integração de novos espaçadores aparente- mente derivados do DNA do fago. Entretanto, não é destinado que a presen- te invenção seja limitada a qualquer mecanismo específico.
Surpreendentemente, observou-se que algumas cepas foram resistentes a ambos os fagos enquanto outras foram resistentes somente ao fago usado no desafio (Vide, Figura 9). O perfil de resistência ao fago pare- ceu ser correlacionado ao conteúdo do espaçador pelo qual as cepas com espaçadores mostrando identidade de 100% a sequências conservadas em ambos os fagos foram resistentes a ambos os fagos, tais como espaçadores S3, S6 e S7. Ao contrário, quando polimorfismos nucleotídicos foram obser- vados entre o espaçador e sequência de fago (de 1 a 15 SNPs em 29 ou 30 nucleotídeos), o espaçador não pareceu fornecer resistência, tal como espa- çadores SI, S2, S4, S5 e S8 (Vide, Figura 9).
Adicionalmente, quando vários espaçadores foram inseridos (S9 a S14), os níveis de resistência ao fago foram mais altos. Estes achados indicam que o locux de CRISPR1 é sujeito a modificações evolucionárias : 10 dinâmicas e rápidas dirigidas pela exposição ao fago. Estes resultados indi- cam que loci de CRISPR de fato podem ser alterados durante a geração de mutantes resistentes ao fago e estabelecer uma conexão entre o conteúdo : de CRISPR e sensibilidade ao fago. Dessa maneira, é contemplado que a . presença de uma CRISPR espaçadora idêntica a uma sequência de fago á — 15 fornecearesistência contra fagos contendo esta sequência particular.
- Para determinar se o conteúdo de CRISPR espaçadora define a resistência ao fago, o locux de CRISPR1 foi alterado pela adição e deleção de espaçadores, e sensibilidade da cepa ao fagos foi testada. Todos os construtos foram gerados e integrados no cromossomo de S. thermophilus : 20 —usandométodos conhecidos na técnica (Vide, por exemplo, Russell and Kla- Í enhammer, Appl. Environ. Microbiol., 67:4361 [2001]). Os espaçadores e repetições no /ocux de CRISPR1 da cepa WTesss***** foram removidos e substituídos com uma repetição única sem qualquer espaçador. A cepa re- sultante WTogss** 2ACRISPR1 foi sensível ao fago 858, indicando que a resistência ao fago do mutante resistente ao fago original (WTosss**1*?) foi provavelmente ligada à presença de SI! e S2 (Vide, Figura 10).
Além disso, para determinar se a adição de espaçadores fornece nova resistência ao fago, o locux de CRISPR1 da cepa WTo2972** foi substi- tuído com uma versão contendo somente espaçadores SI e S2. A sensibili- dade ao fago do construto resultante então foi testada. A cepa resultante WTp2972***:: pSl S2 ganhou resistência ao fago 858, sugerindo que estes dois espaçadores tenham capacidade de fornecer resistência ao fago de novo (Vide, Figura 10). Estas modificações observadas estabelecem uma conexão entre o conteúdo da CRISPR espaçadora e resistência ao fago.
No processo de geração da cepa WrTeosss** *?ACRISPRI1, WITpes8**2::pR, uma variante que contém o vetor de integração com uma repetição única inserida entre os genes cas e o locux de CRISPR!1 nativo foi criada (Vide, Figura 10). Inesperadamente, a cepa WT pass" 2::pR foi sensí- vel ao fago 858, embora os espaçadores S| e S2 permaneceram presentes no cromossomo (Vide, Figura 10) Similarmente, construto de : WTç2972"É::pSIS2 perdeu resistência ao fago 2972, embora o espaçador Ss4 $ 10 esteja presente no cromossomo (Vide, Figura 10). Estes resultados indica- ram que espaçadores sozinhos não forneceram resistência, e possivelmente têm que estar em um determinado contexto genético para serem eficazes. h Embora experimentos iniciais sugeriram envolvimento no reparo : de DNA (Makarova et al., Nucl.
Acids Res., 30:482 [2002]), a hipótese atual í — 15 é quegenes cas (Jansen etal., Mol.
Microbiol., 43: 1565 [2002]; e Haft et al, - PloS Comput.
Biol., 1:e60 [2005]) estão envolvidos na imunidade mediada por CRISP- (Makarova et al., Biol.
Direct. 1:7 [2006]). Em experimentos adi- cionais, dois genes cas na cepa WTp858" foram inativados, ou seja, cas5 (COG3513) e cas7, que são equivalentes a stro657/stu0657 e s- tro660Ilstu0660, respectivamente (Vide, Bolotin et a/., Nat.
Biotechnol., 22: Í 1554 [2004]; e Bolotin et a/., Microbiol., 151:2551 [2005]). A inativação de cas5 resultou na perda de resistência ao fago (Vide, Figura 10). Além disso, é possível que Cas5 atue como uma nuclease, uma vez que contém um mo- tivo de nuclease tipo HNH.
Ao contrário, a inativação de cas7 não alterou a resistência ao fago 858 (Vide, Figura 10). Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanismo particular.
Além dis- so, experimentos para gerar mutantes resistentes ao fago CRISPR1 a partir da ausência de expressão de cas 7 não participaram.
Embora não seja des- tinado que a presente invenção seja limitada a qualquer mecanismo particu- lar, isto pode ser porque Cas7 está envolvida na síntese e/ou inserção de novos espaçadores e repetições adicionais.
Em testes de a sensibilidade dos mutantes resistentes ao fago,
foi encontrado que a formação de placa foi dramaticamente reduzida, mas que uma população relativamente pequena de bacteriófago conservou a ca- pacidade de infectar os mutantes. As variantes de fago derivadas do fago 858 que conservaram a capacidade de infectar WToess**'*? foram ainda ana- lisadas. Em particular, as sequências da região genômica correspondente aos espaçadores adicionais SI e S2 em duas variantes de fago virulentas foram investigadas. Em ambos os casos, a sequência genômica da variante de fago foi mutata e dois polimortismos de nucleotídeo únicos distintos foram identificados na sequência correspondente ao espaçador SI (Vide, Figura 13).
Além de tudo, os procariontes parecem ter desenvolvido um sis- tema de "imunidade" com base em ácido nucleico pelo qual a especificidade : é ditada pelo conteúdo de CRISPR espaçadora, enquanto a resistência é E fornecida pela maquinaria enzimática Cas. Adicionalmente, foi especulado á — 15 que alguns dos genes cas que não fornecem diretamente resistência estão de fato envolvidos na inserção de CRISPR espaçadoras adicionais e repeti- ções, como parte de uma resposta "imune" adaptativa. Este sistema com base em ácido nucleico contrasta com equivalentes com base em aminoáci- do em eucariontes pelos quais a imunidade adaptativa não é herdável. À natureza herdável das CRISPR espaçadoras suporta o uso dos loci de CRISPR como alvos para estudos evolucionários, tipagem e de genômica comparativa (Vide, Pourcel et al, supra; Groenen et al., Mol. Microbiol., 10: 1057 [1993]; Mongodin et a/, J. Bacterid., 187:4935 [2005]; e DeBoy et al, J. Bacteriol., 188:2364 [2006]). Como este sistema é reativo ao ambiente de fago, provavelmente desempenha um papel significante em evolução e eco- logia procariótica e fornece uma perspectiva histórica da exposição ao fago, bem como uma ferramenta preditiva de sensibilidade ao fago. Entretanto, não é destinado que a presente invenção seja limitada a qualquer mecanis- mo particular. Todavia, a presente invenção fornece métodos e composições para utilização do sistema CRISPR/cas como um meio de defesa de vírus, e também potencialmente reduzir a disseminação de elementos genéticos mó- veis e a aquisição de traços indesejáveis, tais como genes de resistência antimicrobianos e marcadores de virulência. Em algumas modalidades, é ainda contemplado de uma perspectiva de evolução do fago, as sequências do fago integradas dentro dos loci de CRISPR também fornecem pontos de ancoragem adicionais para facilitar a recombinação durante as infecções de fago subsequentes, dessa forma aumentando o conjunto de genes aos quais fagos têm acesso (Vide, Hendrix et al., Proc. Natl. Acad. Sci. USA 96:2192
[1999]). Uma vez que locide CRISPR são encontrados na maioria dos gêne- ros bacterianos e está ubíquo em arqueana (Vide, Jansen et al, supra; Lilles- tol et al., supra; e Goode and Bickerton J. Mol. Evol. 62:718 [2006]), forne- : 10 cem novos percepções na relação e evolução codirigida entre procariontes e seus predadores. Fagos de Biocontrole " A presente invenção também fornece métodos e composições : para desenvolvimento de fagos como agentes de biocontrole. Como indicado i — 15 neste pedido, bactérias podem tornar-se resistentes ao ataque de fago pela incorporação de sequências derivadas de fago (espaçadores) em um /oci de CRISPR ativo. O fago pode escapar desta resistência pela mutação dentro da sequência genômica correspondente ao espaçador ou sequência de re- conhecimento de motivo de CRISPR que corresponde a um dado sistema ; 20 CasCRISPR. Através de ciclos iterativos de desafio por fago para criar cepa hospedeira derivada resistente ao fago mediado por CRISPR e isolamento de mutantes de escape fago, a presente invenção fornece fagos que foram alterados dentro de sequências alvos de CRISPR e/ou sítios de reconheci- mento CRISPR putativos que direciona a inserção de espaçador. Além dis- so,a presente invenção fornece fagos que foram sinteticamente desenhados tal que a sequência de motivo de CRISPR de um dado sistema Cas CRISPR tenha sido eliminada. Estes fagos "alterados", aplicados como um coquetel ou em um "esquema de rotação sequencial" reduzem a capacidade de bac- térias alvo para adaptar resistência através do sistema CRISPR. De fato, a presente invenção fornece um conjunto diverso de fago virulento para uso como agentes de biocontrole. Em modalidades particularmente preferenci- ais, esta diversidade é direcionada ao mecanismo dirigido à CRISPR de re-
sistência ao fago, tal que a capacidade do organismo hospedeiro de desen- volver-se rapidamente contra o ataque de fago (através de CRISPR) é seve- ramente reduzida ou eliminada.
A administração do fago diverso, como um coquetel ou em uma rotação sequencial adicional reduz a possibilidade do organismo de hospedeiro de adaptar ou desenvolver a resistência ao fago dirigida por CRISPR.
Fagos são agentes antimicrobianos naturais que foram extensi- vamente estudados como um agente terapêutico alternativo a antibióticos.
Este interesse foi recentemente renovado, devido à proliferação de agentes patogênicos resistentes a múltiplos antibióticos.
Como com antibióticos, as bactérias desenvolveram múltiplos mecanismos para superar o ataque de fago.
A presente invenção fornece métodos e composições envolvendo o - uso de Cas-CRISPR mediando a resistência ao fago para gerar uma popula- : ção de fago diversa, criando fagos sintéticos destituídos de sequências de é — 15 motivodeCRISPR, bem como métodos para administrar ta! fago que reduzi- - rá a capacidade de um organismo-alvo de desenvolver a resistência contra o fago.
Como detalhado neste pedido, os sistemas de Cas-CRISPR fo- ram descritos em uma larga faixa de organismos que incluem exemplos de gêneros patogênicos.
Na infecção por fago, bactérias que escapam da lise podem ser encontradas contendo nova sequência(s) espaçadora dentro de um locux de CRISPR.
O novo espaçador é tipicamente de um tamanho defi- nido que é característico para um dado /ocux de CRISPR e derivado do ge- noma de fago de ataque ao qual confere resistência.
Como o nível de resis- —tência conferida por um espaçador único não é muitas vezes completo, o fago pode escapar do mecanismo.
A análise do "fagos de escape"" indicou que os genomas foram mutados em ou proximal à sequência espaçadora correspondente encontrada na variante hospedeira resistente.
Além disso, os "fagos de escape" são totalmente virulentos para a variante hospedeira — mediada por CRISPR a partir da qual foram derivados.
Um aspecto único do fago terapêutico, distinguindo-o de antibió- ticos tradicionais, é a capacidade de propagar exponencialmente em conjun-
to com as bactérias infectadas. Enquanto isto pode ser vantajoso de uma perspectiva farmacológica, também fornece oportunidades únicas para o fago para desenvolver em relação à resposta adaptativa das bactérias dire- cionadas pelo ataque de fago.
Bactérias têm desenvolvido vários mecanismos de defesa contra fagos virulentos. Como indicado neste pedido, os loci Cas-CRISPR desem- penha um papel na conferência de resistência bacteriana ao fago. Seguinte infecção por fago, a análise da sobrevivência bacteriana encontrou que al- guns isolados tinham inserido um novo elemento espaçador dentro do seu locuxde CRISPR residente, a sequência da qual foi idêntica a que foi encon- trada no genoma do fago correspondente. Quando desafiada com fago, esta primeira geração de variantes resistentes ao fago mediada por CRISPR dão - origem a placas; o fago dos quais foram encontrados para serem totalmente E infectivos em ambas parental e derivada. Análise destes fagos de "escape í — 15 de CRISPR" indicou que seus genomas foram mutados na sequência cor- - respondente à CRISPR espaçadora abrigado pelo variante resistente ao fa- go ou em uma sequência proximal acreditada para direcionar a inserção do espaçador e identificada como o motivo específico de CRISPR para um da- do sistema Cas-CRISPR. Por isso, o fago de "escape de CRISPR" é poten- cialmente mais virulento do que as variantes parental e de primeira geração, já que este fago é capaz de infectar ambas as cepas parental e primeira ge- ração de CRISPR variante.
Como indicado acima, loci de CRISPR foram identificados em vários gêneros/espécies de bactérias que incluem exemplos de agentes pa- —togênicos conhecidos e micro-organismos prejudiciais. Também como des- crito neste pedido, a presente invenção fornece métodos e composições pa- ra utilização de /oci de CRISPR em combinação com proteínas Cas para conferir "imunidade" à invasão de DNA estranho, em particular, bacteriófa- gos. Também como descrito neste pedido, as cepas bacterianas que abri- gam /ocide CRISPR-cas "ativo" contendo um espaçador que é idêntico a uma sequência correspondente dentro de um genoma de fago (isto é, um "protoespaçador"), confere àquela cepa bacteriana, resistência ao fago. Em algumas modalidades preferenciais, as sequências genômicas do fago de biocontrole são conhecidas. Em alguns métodos particularmente preferenci- ais, o micro-organismo-alvo isolado é examinado para a presença de loci de CRISPR. Em algumas modalidades preferenciais, PCR usando iniciadores específicos para sequências conservadas que flanqueiam os locide CRISPR do micro-organismo-alvo encontram uso. Em algumas modalidades prefe- renciais, produto(s) de amplificação é sequenciado comparado com a se- quência genômica do fago de biocontrole. Em algumas modalidades prefe- renciais, a geração de variantes resistentes ao fago de CRISPR e análise do espaçador/protoespaçador fornece meios para identificar o motivo de CRIS- PR específico. Uma vez identificado, a informação sobre a sequência é usa- da para desenhar e sintetizar um fago destituído do motivo de CRISPR.
. Dessa maneira, o fago resultante é insensível à resistência mediada por " CRISPR-cas. Nestas avaliações, a ausência de espaçadores com similari- ii — 15 dadeaogenoma de fago indica suscetibilidade do micro-organismo-alvo ao . fago de biocontrole. Dessa maneira, o fago de biocontrole tem um maior grau de virulência e eficácia como um agente de biocontrole.
A presente invenção fornece métodos e composições adequa- das para o uso em indústrias alimentícias, de ração, médica e veterinária para gerar fago com maior faixa de hospedeiro e método de aplicação do Ú biocontrole mais eficaz de bactérias. A presente invenção fornece meios pa- ra produzir um número suficiente de fagos alterados (em resposta a CRIS- PR) para reduzir significativamente a capacidade das bactérias nativas de desenvolver uma resistência mediada por CRISPR eficaz.
A presente invenção também fornece métodos da aplica- ção/administração desenhados tais que a taxa da evolução pelas bactérias nativas seja significativamente reduzida.
EXPERIMENTAL Os seguintes exemplos são fornecidos a fim de demonstrar e ainda ilustrar certas modalidades preferenciais e aspectos da presente in- venção e não devem ser interpretados como limitação do escopo da mesma. Na descrição experimental que segue, as seguintes abreviaturas aplicam-se: ºC (graus Centígrados); rom (rotações por minuto); H2O (água); HCI (ácido clorídrico); aa (aminoácido); bp (par de base); Kb (par de quiloba- se); kD (quilodaltons); 9 (gramas); ug e ug (microgramas); mg (miligramas); ng (nanogramas); ul e ul (microlitros); ml (mililitros); mm (milímetros); nm (nanômetros); um e um (micrômetro); M (molar); MM (milimolar); UM e UM (micromolar); U (unidades); V (volts); MW (peso molecular); seg (segundos); min (minuto/minutos); h (hora/horas); MOI (multiplicidade de infecção); EOP (eficiência de plaqueamento); PFU (unidades formadoras de placa); MgCl (cloreto de magnésio); NaCl (cloreto de sódio); DO42o (densidade ótica em 420 nm); PAGE (eletroforese em gel de poliacrilamida); EtOH (etanol); PBS (salina tamponada de fosfato [NaC] a 150 mM, tampão de fosfato de sódio a 10 MM, pH 7,21); SDS (sódio dodecil sulfato); Tris (tris (hidroximetil) amino- . metano); p/v (peso por volume); v/v (volume por volume); Amicon (Amicon, y Inc, Beverly, MA); ATCC (American Type Culture Collection, Manassas, VA); " ô 15 Amersham (Amersham Biosciences, Inc., Piscataway, NJ); NEB (New En- gland Biolabs, Beverly, MA); Becton Dickinson (Becton Dickinson Labware, Lincoln Park, NJ); BioRad (BioRad, Richmond, CA); Clontech (CLONTECH Laboratories, Palo Alto, CA); Difco (Difco Laboratories, Detroit, MI); GIBCO BRL ou Gibco BRL (Life Technologies, Inc., Gaithersburg, MD); Sigma (Sig- À 20 ma Chemical Co., Saint Louis, MO); e Sorvall (Sorvall Instruments, uma filial t da DuPont Co., Biotechnology Systems, Wilmington, DE). A presente invenção utiliza, a menos que de outra maneira indi- cada, técnicas convencionais de química, biologia molecular, microbiologia, DNA recombinante e imunologia, que estão dentro das capacidades de uma pessoa versada na técnica. Tais técnicas são bem conhecidas para aqueles versado na técnica.
Como usado neste pedido, DGCC7710 é também mencionado como "WT"; DGCC771 ORH 1 também é mencionado como "DGCC7710- RH1" e "RHI", DGCC7710RH2 também é mencionado como "DGCC7710- RH2"' e "RH2",; DGCC7778casl também é mencionado como "DGCC7778casl KO," "CASI KO," e "cast? KO"; DGCC7778cas4 também é mencionado como "DGCC7778cas4KO0"; DGCC7778 também é mencionado como "WTO858+S1S2"; DGCC7778RT também é mencionado como "WTO8S8S+SIS2::pDR"; DGCC7778RT é também mencionado como "WT;O858+S1S2ACRISPR1"; DGCC7710-R2 também é mencionado como "WT$O2972+8S4"; e DGCC7710-R281S2 também é mencionado como "WTç2672"*::pSIS2." EXEMPLO 1 - Manipulação de Espaçadores específicos para o Fago Neste Exemplo, experimentos conduzidos para manipular espa- çadores específicos para o fago são descritos. Em alguns experimentos, um : espaçador específico para fago foi inserido em uma CRISPR existente, fun- cional para fornecer resistência ao fago correspondente é descrito. A cepa bacteriana usada foi Streptococcus thermophilus STOO89 e o fago foi fago
2972. S. thermophilus STOO89 é uma cepa industrialmente importante usada - na produção de iogurte. É geneticamente acessível à manipulação, e susce- : tível ao bem conhecido fago virulento 2972. f 15 Os /oci de CRISPR foram determinados na cepa STO089. Este - foi determinado preferencialmente pelo sequenciamento do genoma inteiro de STOOB89. Alternativamente, os lJoci de CRISPR são identificados através de PCR usando conjuntos de iniciadores com sequências idênticas a ele- mentos anteriormente identificados de CRISPR de S. thermophilus.
Uma vez identificadas, as sequências de /oci de CRISPR foram determinadas bem como as regiões proximais que contêm genes cas rele- vantes.
Pelo menos um /ocux particular de CRISPR-cas foi selecionado para manipulação adicional. A funcionalidade deste /ocux foi apurada por análiseinsíilicodas regiões de espaçador e sua homologia a sequências de DNA do fago (isto é, ausência e/ou presença de sequências espaçadoras e correlação de infectividade do fago com a cepa STOO89). A ausência desta correlação, a funcionalidade foi assumida, baseada na presença de todos os elementos documentados (isto é, repetições, espaçadores, sequências líder, egenes cas que putativamente codificam proteínas de tamanho total).
Uma sequência(s) espaçadora adequada foi escolhida a partir do genoma do fago 2972. Os critérios usados para selecionar o espaçador foram geralmente baseados no tamanho dos espaçadores dentro do locux de CRISPR selecionado e a identidade (preferencialmente aproximadamente 100%) à sequência do fago. De fato, qualquer sequência do fago adequada encontra uso em várias modalidades da presente invenção.
Em algumas modalidades, uma unidade CRISPR composta de uma sequência espaçadora de fago 2972, flanqueada por dois elementos de repetição (idêntico ao locux de CRISPR selecionado) foi quimicamente sinte- tizada. Por definição, esta "unidade de CRISPR sintética" é aproximadamen- , te 100 bp em tamanho e é muito curta para assegurar a integração no locux deCRISPR. Por isso, DNA adicional que flanqueia foi construído junto com à unidade CRISPR. Um mínimo de 500 bp de DNA homólogo, idêntico ao lo- . cux de CRISPR direcionado que flanqueia a unidade CRISPR sintética, foi " produzido para facilitar a integração.
' 15 Em modalidades adicionais, há múltiplas abordagens. Em uma - modalidade, um construto emula a adição de um novo espaçador no CRIS- PR existente. Em algumas modalidades alternativas, o /ocux de CRISPR inteiro é substituído com a unidade CRISPR sintética.
A CRISPR integrante resultante foi verificada através do se- —quenciamento de DNA do locux de CRISPR antes do teste biológico. Além disso, padrões de sensibilidade ao fago da CRISPR integrante contra o fago 2972 foram testados e comparados com a cepa parental.
A CRISPR integrante construída com sucesso demonstrou cor- relação direta entre a presença de um espaçador específico dentro do con- texto próprio de CRISPR-cas.
Em experimentos adicionais, inserção de um espaçador homó- logo a um DNA de fago em uma célula-recipiente foi realizada. Nestes expe- rimentos, uma novo CRISPR espaçadora foi desenhada a partir do DNA de fago (com a identidade de 100% ao DNA de fago) dentro do gene antirrecep- toreinserido na célula em um locux de CRISPR. O gene de antirreceptor foi direcionado porque CRISPR espaçadoras a partir de outras cepas foram encontradas mostrando similaridade aos genes antirreceptores de fago.
Quatro cepas que carregam espaçadores mostrando identidade aos genes antirreceptor de fago foram resistentes ao fago particular. O mutante foi ex- posto ao fago e considerado ser resistente.
Em experimentos adicionais, um espaçador foi inserido em um — hospedeiro original, mas não em um locux de CRISPR. O mutante resultante conservou sua sensibilidade ao fago. Dessa maneira, estes experimentos mostraram que o espaçador tem que estar em um determinado ambiente dentro do contexto de uma CRISPR e genes cas.
EF Em outros experimentos, uma determinada CRISPR espaçadora : 10 foideletada a partir de /ocux de CRISPR que ocorre naturalmente. Esta de- leção removeu a imunidade contra um dado fago e o hospedeiro tornou-se sensível (isto é, perdeu a resistência) ao fago ao qual o espaçador foi homó- - logo. Resultados destes experimentos são fornecidos na Figura 10. - Em experimentos ainda adicionais, as combinações de repetição À — 15 de CRISPR-cas inteiras foram inseridas em uma célula-recipiente a fim de . fornecer imunidade contra a entrada de ácido nucleico.
Em experimentos adicionais, um plasmídeo compreendendo uma CRISPR espaçadora foi preparada usando os métodos apresentados neste pedido. As tentativas de transferir este plasmídeo para células que contêmo mesmo espaçador foram mal sucedidas. Entretanto, plasmídeos que não contêm o espaçador podem ser transformados em células. As figu- ras 11 e 12 ilustram estes resultados.
Em experimentos adicionais, as combinações de CRISPR-cas presentes em duas cepas diferentes foram trocadas. Mostrou-se que esta trocade espaçadores modificava seus fenótipos (sensibilidade/resistência ao fago). Como indicado neste pedido quando S1S2 é introduzido em uma cepa com SA, a sensibilidade ao fago foi trocada (Vide, Figura 10).
Em experimentos adicionais, diferentes combinações de repeti- ção CRISPR-cas são preparadas. Não somente os genes ou proteínas cas são necessários, mas os pares de repetição cas-CRISPR específicos são necessários para funcionalidade. Quando os genes ou proteínas cas são fornecidos de outro /ocux de CRISPR, a cepa permanece sensível ao fago.
Em experimentos ainda adicionais, um ou mais genes cas (de uma unidade CRISPR-cas funcional) foram deletados. Genes Cas são ne- cessários para a imunidade ser fornecida. Cas mutantes são ainda sensíveis ao fago, apesar da presença do espaçador idêntico ao DNA do fago. Nestes experimentos, cas 5 (outrora conhecido como cas1) e cas7 (outrora conhe- cido como cas4) foram deletados. Mostrou-se que Cas5 era necessário para a resistência. Além disso, foi mostrado que cas7 é necessário para integra- ção de novos espaçadores. : Em experimentos adicionais, genes cas são fornecidos em trans Í 10 ac hospedeiro. Onde o gene cas é apagado, a imunidade é restaurada. EXEMPLO 2 - Integração de CRISPR Espaçadora(s) Nestes experimentos, foi mostrado que a integração de uma - CRISPR espaçadora no locux de CRISPR fornece resistência contra um bacteriófago ao qual CRISPR espaçadora mostra identidade. Nestes expe- i 15 rimentos, a cepa de S. thermophilus DGCC7710RH1 foi produzida.
. A cepa de Streptococcus thermophilus DGCC7710 (depositado na "Coleção Nacional de Culturas de Micro-organismos" francesa sob o nú- mero CNCM 1-2423) possui pelo menos 3 /oci de CRISPR: CRISPRI1, CRISPR2, e CRISPR3. Em cepas de S. thermophilus CNRZIO66 e LMGI18311 das quais a sequência genômica completa é conhecida (Bolotin et al., Microbiol., 151:2551-1561 [2005], CRISPR1 está localizado no mesmo locux cromossômico: entre str0660 (ou Stu0660) e str0661 (ou stuo661).
Na cepa DGCC7710, CRISPR1 também está localizado no mesmo locux cromossômico, entre genes altamente similares. CRISPR1 da cepa DGCC7710 contém 33 repetições (incluindo a repetição terminal), e dessa forma 32 espaçadores.
Todos estes espaçadores são diferentes um do outro. A maioria destes espaçadores são novos (isto é, não anteriormente descritos em loci de CRISPR), mas quatro espaçadores próximos ao reboque de CRISPR1 — são idênticos a CRISPR1 espaçadoras já conhecidas: - o 28º espaçador de DGCC7710 é 100% idêntico a 31º CRIS- PR1 espaçadora da cepa CNRZ1575 (número de acesso de Genbank
DQO072991); - 0 30º espaçador de DGCC7710 é 100% idêntico a 27º CRIS- PR1 espaçadora da cepa CNRZ703 (Número de acesso de Genbank DQ072990); - 0 31º espaçador de DGCC7710 é 100% idêntico a 28º CRIS- PR1 espaçadora da cepa CNRZ703 (número de acesso de Genbank DQ072990); - o 32º espaçador de DGCC7710 é 100% idêntico a 30º CRIS- ; PR1 espaçadora da cepa CNRZ703 (número de acesso de Genbank DQ072990). Durante o desenvolvimento da presente invenção, a cepa de S. thermophilus DGCC7710RH1 foi isolado como um mutante resistente ao . fago natural usando DGCC7710 como cepa parental, e fago D858 como o - fago virulento. D858, um bacteriófago pertencente à família Siphoviridae de i 15 vírusfoi usado.
- CRISPR1 da cepa DGCC7710-RH1 contém 34 repetições (inclu- indo a repetição terminal), e dessa maneira 33 espaçadores. Quando com- parada com a sequência CRISPR1 da cepa de S. thermophilus DGCC7710, a sequência CRISPR1 da cepa de S. thermophilus DGCC7710-RH1 possui um novo espaçador adicional (e uma repetição adicional que flanqueia o no- vo espaçador) em uma extremidade do /ocux de CRISPR (isto é, próximo ao líder, na extremidade 5' do locux de CRISPR). Todos os outros espaçadores de locux de CRISPR1 permaneceram inalterados.
A sequência CRISPR1 (5-3) da cepa DGCC7710-RH1 é forne- cida abaixo:
Ccaaggacagttattgatrrtatasteacratatoggtataaamecgtcanaatttoatrtgag GTTTTIGTACTCICAAGATTTAAGTAACTGIACAACtcaacaattgcaacatettatamcccactt EEE ES ão ES SIEttgacageaaatcaagattogaattor (RS Era A N Itgacgaggagetattggcaçaacttaca TTTTISTACT: TORADATET Peti cgatttgacaatetgetgaccactgttato CS REIS o Á Elfos, ICacttggcaggettattactcaacagega TTITTITA e N t ACT ttgttecttgetetrtregetgtatetreto ENS) No CR [ USE tcattcttocgtttttgtttgogaatoct To D TA = bpctggogaggaaacgaacaaggcctoaaca . Sr) tagagtggasaactagaaacagattcas E si Itastoccgttgaattacacggcaaggtoa TTT 7 - Elas te fagogagetogaamataatcttaattacaag TTITIGTA DRRISTT Fis pttegctagegtcatgtçgtamcgtattta ERES fa anTTC pogcgtcccaatectgattaatactrtacteg - T TUA é ST gacacaagascgtatgcaagagetcaaç [ E CE ISEL caattcttcatocggtaactgctoaagto Est rntecs bed T fitas se Ittaagggcatagaaagggagacaacato à Ml os n A 1 o Egatatttaasatcattttcataactteat 1TTT E v . EE pcagtatcageaageaagetgtragttact sT E 1 [ tes Itasactatoamatrtrataatrertaaça ST E. fi ó FEITO É Itaatttatogtatagettaatatcatto E - FA . o gcategageaegrtogagtttacegteto DEV Fe EN tes) etatategaggtcaactaacaattatgcr LM Rae teoa A A Eae x. Itegtteaaattoctgttrtaggtacater TITTSTACO LORAGATT Autos 1E tcaatacgacaagagttaaaatogterr 345 TA eo Pi potragetgtecaatecacgaacgtagato TTIIVGITAS à T ES aaccaacggtaacagetacttrttacage SEN NEN RENT 1 BOTE tasctgaaggataggagettgtasagect P eU Ea irre A TAi [ TNAOTC Ratgctacatetcaseggatgatecoaga TITTTSTAOOS TOAAROLTE TRACTC TALO iagtagttgatgacctotacastogtttat ITTITIGTA TOARGNTT 'ARCTETSA cctagaageatttgagegtatattgatto .Á TTTITTSTAL [e Sides Vas s AROTC é attttgecocttctttgoccartgactrags - EUA EMITE [9 TST Ate TS Iccattageaateatttgtacocattgagr
GTTTTTGTACTCTCAAGATTTAAGTAACTGTAÇAGT Ttgattcaacataaaaagecagttoaattgamettggortt (SEO ID NO:682) Na sequência acima, o líder tem sequência: s CANggAaCAgItatigattitataatcactatgige gtatanaascgicanaatticattigag 3' (SEQ 1D NO:688) A sequência integrada (GTTITTGTACTCTCAAGA' TTAAGTAACTGTACAACtcaacaatigcaacatottat í aacccactt; SEQ ID NO:689) compreendendo uma repetição de CRISPR é mostrada em caixa alta e uma CRISPR espaçadora (isto é, sequência de direcionamento) em caixa baixa; ambos são mostrados acima em cinza. As sequências de repetição terminal e reboque da repetição de CRISPR são mostradas abaixo: Repetição terminal: S'gtttttatacteteaagatttaagtaactgtacagt3(SEQ ID NO:3) Sequência reboque: BS'ttgattcaacataaaaagccagttcaatigaacttggettt 3' (SEQ ID NO:691) A sequência do novo espaçador 5- TCAACAATTGCAACATCTTATAACCCACTT (SEQ ID NO:534) existe dentro do genoma do fago D858.
A sequência espaçadora é encontrada entre posições 31921 e
31950 bp (isto é, no filamento adicional) do genoma de D858 (e tem identi- dade de 100% à sequência genômica D858 mais 30 nucleotídeos): Espaçador 1 teaacaattocaacatcttataacccactt 30 (SEQ ID NO:534)
LUH HE Desa 31921 tcaacaattogcaacatottataacecactt 31950 (SEQ ID NO:534) O novo espaçador que está integrado no /ocux de CRISPR1 da cepadeS.thermophilus DGCC7710-RHI confere resistência ao fago D858 a esta cepa, como mostrado na Figura 1 e Tabela 2-1.
o ne o bo Er S S Ps) o O A E | E SR. & 1. “ E 8 o gs . õ Ss eo & ONA & 8/18 Ê & | < o a. os um o e E| E Se FEIO gs E/S sc & 3 2 s SC E T Z * 2 + o SS 8 ss So es 3 So o 8 3º 8 8 3 oO o no o 8 E cs o O o E o no 3 o jo E : ss õ S FE f É = o 8 fezes EE é E E 8 Í BS ES 6 [6/6 |& D E < ã | SOS o olo o 5 ES [=] = = ml — E. 2 8 O a aio A A AJA A E Ss o 3/2 ” 7 eoõ NS : E ÉS o/a E o 8 'o sc e Ses uu Ss E Ss o SE 2 ss Es & o o 8 mm *- o 2 [A o o o e! o ss e E o o — S 2 835 o o E Ss df o 8 85 E o x E vB Na nã So co | co | co | o o Se 2 Ss o Dio o = = 8 8/88 co | co o aIR sas m 3 0 0 b sa? o = O Ss SS oêô 8 88: =I= Tv F fo II els a | = Soo RIR E E Xô |S [3 Q |5 8 2 & Sj oie NS [co o 2 /€ ss à [GISIRIKIR RIR E [Eó [8% | o RIR R R Ni= vs a jó [SISISISI8 [8/5 13 [SIR 3 E lo so lo õ a 7 eleleisig [86 é [8/8 & 2 E a S/6/º à ló Õ CS Oo o) o uu oO XX as r ao
Fagos conservaram a capacidade de adsorver aos mutantes. Além disso, durante o desenvolvimento da presente invenção, a | cepa de S. thermophilus DGCC7710-RH2 foi isolada como um mutante re- sistente ao fago natural usando a cepa de S. thermophilus DGCC7710 como acepa parental, e o fago D858 como o fago virulento. CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 contém 34 repetições (incluindo a repetição terminal), e dessa forma 33 espaçado- res. Quando comparado com a sequência CRISPR1 da cepa de S. thermo- philus DGCC7710, a sequência de CRISPR1 da cepa de S. thermophilus — DGCC7710-RH2 possui um novo espaçador adicional (e uma repetição adi- cional que flanqueia o novo espaçador) em uma extremidade do locux de CRISPR (por exemplo, próximo ao líder, na extremidade 5' do locux de CRISPR). Todos os outros espaçadores de locux de CRISPR1 permanece- À ram inalterados. ' A sequência CRISPR1 (5'-3') da cepa DGCC7710-RH2 é mos- trada abaixo: caaggacagttattgattrtataatoactatorgggratasaaacgtoaaaatetoatttgag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACttacgttrgamaagaatatcamatocaatoa VET: STE PERTO RN ottrgacagcamatcaagattogaattot TTTTT piserstar a Mer Atas Seria ta Fila a toacgaggagctattggcacaacttaca Es) EST ARANTATA ESTAS Eca tttgacaatotgctgaccactgtrate EvEN Y EI NESSS AE VA IRINA cacttggcaggottattactcaaçagega sTTT DISPENSA MESCTRIV AA MABctgtecettgteteretegeêgratereteo 3 ENSINA) AT DANNI EEIBAANt CCAtECrrcogrtetegectgogaatecr Eb: Eineretitde! E Saes Mdaey SS dean; dito. Fifa o togogaggaaacgaacaaggcctoaaca í É) EXMPSSTARAA E CESSANTES E Iitagagtggamaactagaaacagettosa ES ESELIcaD A DES USE Ea ereta ERA taa tgccgttgaattacacggcaaggtoca TTTIT x CEENTAS AT vagcgagetogaaataatettaateacaas 7 SEND Nro Aces aoscoerdts SN t togctagegtoatgtograacgtatitca Évuos: ssa ttds Core SAS AA ccgreceaatectgattastacttactoo dUNLIERES ERRA! Sp SEARA: E RANA ENO EAR N MEN AN cacagcaagacaagaggatgatgctato TESS ó R : 'gacacaagaacotátocaagagrtocaag Er " "o acaattcttooatecgatamctgctoaaçãos Mer SEER 1 Ictaagygcatageaagggagacaacoto e [SE EEE catatttanaaccatrotcataacttoat pu—— DiSMicCcagtatcageaageaagetgtitagtract . ; á tasactatgaaattrrtataattrttaagao " " ; ESSNaa taatrtatggratagettaatatoatro e. o. SAMI ocatooágocacatregagrttacogttto ETR 7 ERRA ccacatonagorcaactaacaatcatocr E. A Ss & É. togttoamattctgtrttageracatrt E ASS ENA at cas tacgacaagagttasaataogtert RSS o "É Hs ETENgCtragetgrocaatccacgaacgregato Es : i x lcaacoaacggraacagetactttetracage E ( U & [x taactogaaggartaggagoertotaaagect x. STA Ac aacgcracatotcasaggatgatcccaga TOS FSNSSA à fá grtagttgatgacctreracaatogtetat a TATA P fcctagaageattroagegratattgatto qOTT e. TTTALGIAROI00 OA Itettgecectrettigeocatrgacteg asa ” , EMANA CCAttagcaartcatrrgrgoceattgage
TTTTTGTACTOTCAAGATTTAMGTAACTGTACAGT Crgatreaacatamanagcoagttcantroaactegaente (56Q 1D NO:ITT)
Na sequência acima, a sequência líder é: S'canggacagtta!gatittataatcaciatgtaggtataaamacgicanaatttcameas-3' (SEQ ID NO:688) A sequência integrada compreendendo uma repetição de CRIS- PR é mostrada em caixa alta e uma CRISPR espaçadora (isto é, sequência — dedirecionamento) em caixa baixa ambas são mostradas acima em cinza Repetição terminal: (IGTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtiacgttigasnaganinicasateaaiga; - SEQ 1D NO:694). As sequência de repetição terminal e reboque da repetição de CRISPR são mostradas abaixo: É Sequência reboque: 5'-gttttigtactctcaagatitaagtaac:gtacagt-3' (SEQ ID NO:3) Sequência reboque: S'-ttgattcaacatanaaagecagttcaatigaacttggetit-3' (SEQ ID NO:691) Foi mostrado que a sequência dos novos espaçadores existe no E genoma do fago D858. . A sequência do espaçador (SEQ ID NO:535) é encontrada entre as posições 17215 e 17244 bp (isto é, na fita mais) no genoma do D858 (e tem 100% de identidade à sequência genômica de D858 em 30 nucleotí- deos): Espaçador 1 ttacgtttgaaaagaatatcaaatcaatga 30 (SEQ ID NO:535) nose — 17215 LiddgLiigaadeadteLcddatsatga 17244 (SEQ TD NO:690) Í O novo espaçador que é integrado no locux de CRISPR1 da ce- pa de S.thermophilus DGCC7710-RH2 confere resitência contra o fago D858 àcepade S.thermophilus DGCC7710-RH2, como mostrado na Figura 2 e na Tabela 2-1 (Vide também, Figura 10). EXEMPLO 3 - Integração de Construto e Apagamento Neste Exemplo, os métodos usados para integração de constru- to e apagamento são descritos.
As cepas usadas nestes experimentos fo- ram: cepa parental de S. thermophilus DGCC7710, sensível aos fa- gos 858 e 2972 S. thermophilus DGCC7778 CRISPR mutante resistente a 858 S. thermophilus DGCC7778casl KO S. thermophilus DGCC7778cas4KO
S. thermophilus DGCC7778RT S. thermophilus DGCC7778RT' S. thermophilus DGCC7710R2 CRISPR mutante resistente a 2972 S. thermophilus DGCC7710R281S2 E. coli EC1000 forneceu pORI28 (Vide, Russell amd Klaenham- mer, Appl.
Environ.
Microbiol., 67:43691-4364 [2001]) Escherichia coli pCR2.1TOPO forneceu pTOPO (Vide, catálogo de Invitrogen Nº K4500-01) Os seguintes plasmídeos íoram usados nestes experimentos: PTOPO, um plasmídeo usado para subclonagem de vários cons- trutos - PTOPOcas1ko contém um fragmento integra! de cas1 ' pTOPOcas4 contém um fragmento integrante de cas4 : 15 PTOPOS1S2 contém o construto de espaçador S1S2 . pTOPO RT contém o construto de repetição terminal RT PORI28 é um plasmídeo usado para integração dos vários cons- i trutos no cromossomo de cepas de S. thermophilus.
PORIcas 1ko contém um fragmento integral de cas1 PORIcas4ko contém um fragmento integral de cas4 : PORIS1S2 contém o construto de espaçador S1S2 purista contém o construto da repetição terminal de RT.
Os seguintes iniciadores foram usados nestes experimentos: O enanpeena (SEQ ID NO:670) and 5”-ctgataaggigitegtigice-3" (SEQ ID NO:671) logue (SEQ ID NO:672) and 5'-gagagactaggttatoteages-3* (SEQ ID NO-673) SIS? and RT PI S'-acanncancagagangiatctcatig-3* (SEQ ID NO:666) P2 5*-ascgagtacactcactattigtaçe-3* (SEQ ID NO:667) P3 S'-tccacicncgiacanatagigagretactegremgiancicangaritaagtancigtacagutgaticascatannang-3' (SEQ ID NO:668) P4 S*-ctticencatcetogerttggtt-3” (SEQ ID NO:669) As cepas e os fagos foram obtidos da Coleção de Cultura de Danisco, ou do material referido (Russell and Klaenhammer, Appl.
Environ.
Microbiol., 67:43691-4364 [2001]; e Levesque et al., Appl.
Environ.
Microbi- ol., 71:4057-4068 [2005]). A preparação, purificação e testes de fago foram realizados u- sando métodos conhecidos na técnica (Vide, por exemplo, Duplessis et al, Virol, 340: 192-208 [2005]; e Levesque et al, Appl.
Environ.
Microbiol., 71:4057-4068 [2005]). Cepas de S. thermophilus foram cultivadas a 37ºC ou 42ºC em M17 (Difco) suplementado com 0,5% de lactose ou sacarose.
Para a infec- Ç ção do fago, CaClz 10mM foram adicionados ao meio antes da infecção por fago, como conhecido na técnica (Vide, por exemplo, Duplessis et al., supra; e Levesque et al., supra). Enzimas usadas para realizar a digestão de restrição e PCR fo- p ram adquiridas de Invitrogen e usadas de acordo com instruções do fabri- . cante.
PCRs foram realizadas em um termociclador Eppendorf Mastercycler r 15 —Gradient como conhecido na técnica (Vide, por exemplo, Barrangou et al, Nasa Appl.
Environ.
Microbiol., 68:2877-2884 [2002]). A inativação gênica e a inserção do plasmídeo sítio-específica através de recombinação homóloga no cromossomo de S. thermophilus fo- ram realizadas por subclonagem no sistema da Invitrogen pCR2.1 TOPO, a clonagem subsequente no sistema de Pori usando E. coli como um hospe- deiro e os construtos foram enfim purificados e transformados em S. ther- mophilus como anteriormente descrito (Russell and Klaenhammer, supra). Integração do Construto de RT Usando o construto de RT construído como mostrado na Figura 4,0 construto foi inserido logo após cas4, como mostrado na Figura 5. À DGCC7778 parental é resistente ao fago 858. À parental tem dois espaçado- res (Sl e D2) que são idênticos ao DNA do fago 858. A cepa resultante (RT) perdeu a resistência ao fago 858. Este resultado indica que genes cas preci- sam estar na vizinhança imediata do espaçador(es) para conferir resistência. —Como mostrado na Figura 3, a DGCC7778 parental! foi construída tal que o gene cas1 seja interrompido, resultando em uma perda de resistência, signi- ficando que cas? é necessário para conferir resistência.
Como mostrado na
Figura 3, a DGCC7778 parental foi construída tal que o gene cas4 seja inter- rompido. Além disso, o construto S1S2 foi integrado na DGCC7710 parental, como mostrado nas Figuras 6 a 8. EXEMPLO 4 - Isolamento de Mutantes Resistentes ao Fago e Confirmação das Sequênciasde CRISPR Neste Exemplo, métodos usados no isolamento de mutantes resistentes ao fago e confirmação das sequências de CRISPR são descritos. Mutantes de S. thermophilus resistentes ao fago foram obtidos a partir de : desafio da cepa hospedeira de tipo selvagem DGCC7710 (também chamada "RDS534") com fago 2972 e/ou fago 858 (Levesque et al., Appl. Environ. Mi- crobiol., 71:4057 [2005]). A cepa hospedeira foi cultivada a 42ºC em 10 ml do caldo M17 suplementado com lactose 0,5% (LM17). Quando a densidade . ótica (600 nm) alcançou 0,3, fagos e cloreto de cálcio 10mM foram adiciona- . dos a uma concentração final de 10” pfu/ml e 50 mM, respectivamente. A E 15 cultura contendo o fago foi incubada a 42ºC por 24 horas e monitorada para E lise. Então, 100 ul do lisado foram inoculados em 10 m! de LM17 fresco. O lisado restante foi centritugado e o pélete foi inoculado em outro tubo con- tendo 10 ml! de LM17 fresco. Estas duas culturas foram incubadas a 42ºC por 16 horas. Finalmente, estas culturas foram diluídas e plaqueadas em LMI17. Colônias isoladas foram testadas para a sensibilidade ao fago como i conhecido na técnica (Vide, Moineau et al, Can. J. Microbiol., 38:875
[1992]). Os loci de CRISPR dos isolados resistentes foram verificados pelo sequenciamento dos produtos de PCR, e usando relevante informação sobre genoma de fago conhecida na técnica (Vide, Levesque et al., Appl. Environ. Microbiol. 71:4057 [2005]). EXEMPLO 5 - Engenharia de CRISPR Espaçadora Neste Exemplo, métodos usados em algumas modalidades para engenharia de CRISPR espaçadora são descritos. Enzimas usadas para realizar digestão de restrição e PCR foram adquiridas de Invitrogen e usadas — de acordo com instruções do fabricante. PCRs foram realizadas em termoci- clador Eppendorf Mastercycler Gradient, usando métodos conhecidos na técnica.
A inativação genética e inserção de plasmídeo síitio-específica através de recombinação homóloga no cromossomo de S. thermophilus to- ram realizadas por subclonagem no sistema pCR2.1-TOPO (Invitrogen), pela clonagem subsequente no sistema Pori usando E. coli como uma hospedei- ra,eosconstrutos foram enfim purificados e transformados em S. thermo- philus como conhecido na técnica (Vide, Russell and Klaenhammer, Appl.
Environ. Microbiol., 67:4361 [2001]). DNA a partir do mutante WT5a58*$*? foi usada como um molde : para amplificar dois fragmentos de PCR distintos usando PI (5"- À 10 —acaaacaacagagaagtatetcatig-3y —SEQ ID NO:666) e P2 (5- aacgagtacactcactatttgtacg-3; SEQ ID NO:667) em uma reação, e P3(5"- tccactcacgtacaaatagigagtoatactcgttittgtaticicaagatitaagtaactgtacagtttgattcaaca taaaaag-3, SEQ ID NO:668) e P4 (5'-crttccttcatectegetitagtt-3 SEQ ID t NO:669) em outra reação. Ambos os produtos de PCR foram posteriormente : 15 usados como moldes em outras reações de PCR usando PI e P4 para gerar - o construto de S1S2 segundo a Figura 11.
O construto S1S2 foi subclonado no sistema Invitrogen pCR2.1- TOPO. Este construto foi digerido com Notl e Hindlll e posteriormente clona- do em Pori nos sítios Notl e Hindlll, fornecendo o construto pS1S2. A inte- gração de pS1S2 no /ocux de CRISPR1 de WTço2972** ocorreu através de recombinação homóloga na extremidade 3' de cas7, para gerar WTo2972**É::pS1S2.
O construto pR foi gerado usando o construto pS18S2 como um molde. Especificamente, o construto S1S2 subclonado em pCR2.1-TOPO foi —digerido usando BsrG1, que corta dentro da repetição de CRISPR.
Então, a digestão foi religada e um plasmídeo contendo uma repetição única e nenhum espaçador foi usado posteriormente para clona- gem em pORI usando Notfl e Hindlll, gerando pR. A integração de pR no cromossomo de WTesss**** na extremidade 3' de cas7 através de recombi- nação homóloga gerou WTrsss"*Ó2::pR, um mutante onde o /ocux de CRIS- PR1 é deslocado e uma repetição única é inserida em seu lugar. O mutante WTr8s8**2::pR foi posteriormente cultivado na au-
sência de eritromicina, e variantes sensíveis ao antibiótico foram analisadas para encontrar um mutante que tinha uma deleção completa do locux de CRISPR1. A deleção foi derivada da recombinação homóloga ocorrendo na extremidade 3' da ORF (ao contrário de um evento de recombinação ocor- —rendona extremidade 3' de cas7, que teria resultado na restauração da cepa de WTogss****?), gerando WTosss** PACRISPR1 (Vide, Figura 12), um mu- tante onde o locux de CRISPR1 é deletado (Vide também, Figura 10). EXEMPLO 6 - Inativação de Genes cas e Para inativação de cas5, uma porção interna de 801 bp de cas5 foi amplificada por PCR usando iniciadores 5'-caaatggatagagaaacge-3(SEQ ID NO:670) e 5'-ctgataaggtgttegttatec-3' (SEQ ID NO:671) e subclonada em pCR2.1-TOPO de E. coli (Invitrogen). Este construto foi digerido com EcoRV ' e Hindlll e posteriormente clonado no pORI nos sítios ECcoRV e Hindlll.
À ' integração deste construto no gene cas5 de WTogss**S? ocorreu através de ' 15 recombinação homóloga da porção interna do gene, resultando em y WT 658": pcas5-. Similarmente, uma porção interna de 672 bp de cas7 foi amplifi- cada por PCR usando iniciadores 5'-ggagcagatggaatacaagaaago-3(SEQ ID NO:672) e 5"-gagagactaggtigtctcagca-3' (SEQ ID NO:673) e subclonado em —pCR2.1-TOPO de E. coli (Invitrogen). Este construto foi digerido com EcoAV À e Hindlll e posteriormente clonados em pORI nos sítios ECoRV e Hindlll.
À integração destes construtos no gene cas7 de WTr656"***º ocorreu através de recombinação homóloga da porção interna do gene, resultando em WToss8"**:: pcas7- (Vide, Figuras 10 a 12). EXEMPLO 7 - Métodos Naturais para Inserção de uma Sequência Adicional em um Locux de CRISPR Neste Exemplo, métodos usados para provocar naturalmente a inserção de uma sequência adicional dentro de um /ocux de CRISPR de uma cepa bacteriana são descritos. "Sequência adicional" como usada neste pedido é definida como uma sequência espaçadora associada com a se- quência de repetição de CRISPR.
Mais particularmente, a "sequência adi- cional" origina-se em parte de um fago doador capaz de infectar a bactéria alvo e parcialmente da duplicação da sequência de repetição de CRISPR. A introdução do DNA do fago doador na célula bacteriana resulta na infecção da célula pelo fago doador. A seleção de células que contém sequência adi- cional é feito através da pressão de seleção com o fago doador tal que as S —célulasmodificadas selecionadas sejam resistentes ao fago.
Nestes experimentos, uma cepa parental foi exposta a um fago doador e uma variante resistente ao fago da cepa parental (isto é, uma cepa variante) selecionada. A cepa variante foi analisada (por exemplo, por PCR e/ou sequenciamento de DNA) para confirmar a presença de uma sequência — adicional dentro de um locux de CRISPR. A sequência nucleotídica da se- quência adicional foi determinada. Tipicamente, a sequência adicional é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fa- ' go doador associado (fusionado) a uma sequência de repetição de CRISPR, " e confere resistência ao fago doador.
Em alguns experimentos, a cepa parental foi pré-cultivada du- : rante a noite em um meio baseado em leite a 42ºC. Um meio baseado em leite foi então inoculado em 0,1% (v/v) com uma pré-cultura da cepa parental e com uma suspensão do fago doador em um MOI de 10. Após 6 h de incu- bação a 42 ºC, diluições da cultura foram plaqueadas em um meio nutricio- nal, para obter colônias isoladas. Isolados foram então testados para sua É resistência ao fago doador (qualquer método adequado conhecido na técni- ca encontram uso nestes experimentos). As cepas variantes foram então analisadas para presença de uma sequência adicional dentro de um dos seus /ocide CRISPR.
Loci de CRISPR foram amplificados por PCR e as sequências nucleotídicas dos produtos PCR resultantes foram determinadas sequenci- amento de DNA padrão usando métodos de PCR de sequenciamento co- nhecidos na técnica. Estas sequência foram então comparadas com aquela da cepa parental usando métodos padrão conhecidos na técnica.
Em alguns experimentos, DGCC7710 foi usada como a cepa parental e D2972 foi usado como um fago doador. A cepa parental de S. thermophilus DGCC7710 foi exposta ao fago doador D2972 como descrito acima.
Uma cepa variante denominada WTpnize72* foi obtida (Vide, Tabela 7-1). A Tabela 7-1 também inclui resultados de cepas de variantes descritas em outros Exemplos.
Na Tabela 7-1, a EOP é expressa relativamente ao fago D2972. O posicionamento da sequência adicional no genoma do fago é — dado relativamente ao fago D2972, a menos que especificado de outra ma- neira.
Tabela 7.1 Descrição das Cepas Variantes Modificadas em CRISPR de DGCC7710 Variante Parental Doado Adicional . EQ peer Rg meadd [aa ERIRNORA co o à IGAGGTG (SEQ ID NO:524) sda ETR bo
TGCACGG a ixpoass SEQ ID NO:70 (CTCAGTCGTTACTGOTOAACÕAG
TITCAAT x (SEQ ID NO:5:
TCTAATCCCACTAGOAATAGTGO
IGTAGTAA (SEQ ID NO:703; a 27560-27589 [TOGATAAATCAGCCAAAGTATTA ' AGTGGTT A (SEQ ID NO: 704 “ [DGO CAGCTTGAAATGTITATTGAAGC | 10 'AGCAGTG (SEQ ID NO:705) Wipe a TTATATCGAAGAACGACTGAAAG| <10 a AGCTTGA (SEQ ID NQ:706) Tapa pia 33968-33997 |TOCAAGTTATITGAGGAGTTATTA
E AGACAT EQ ID NO:70: i Wigem pa S 30803-30832 |TACCGAAACGACTOR AAA | <10
F E ATTCAAG e SEQ ID NO:708) Wigan pia 29923-29894 |AGTTGATIGOGTAATCAACCATO f ma TCCATAA ana o SEQ ID NO-709) dedo ERRA o alo o AGACAT B - (SEQ ID NO: 707 doa [E CA An oo) so (relatively to AAMAAGTA Ds EQ ID NO:710 Wigan a 33886-33915 |ATTIGTCTATTACGACAACATGGA | <I0 s (relatively to |AGATGAT DBS8, (SEQ ID NO:526, Wigan [DGOCT710 [D2972 3 7874-7503 — |TTACTAGAGCGTGTCGTTAACCA | <I0 s DE5E CTITAAA 20650-20621 |(SEQ ID NO:528)
TTCGTTAAAGTCACCTCGTGCTAG 8360-8389 — |CGTTGC ((SEQ ID NO:529) 18998-19027 |ATAACGGTAGCAAATATAAACCT|
IGTTACTG (GSEQ ID NO:530)
IGAAGTAGCCATACAAGAAGATGG | ATCAGCA SEQ ID NO:531. WTassiaãon [DGCC7710 |D2972 3 33602-3363) |GATGTICAÇTGAGTGICTAAGCAT | 10 s13S14 D858 TGOGTAC 4830-4801 — Í(SEQ ID NO:776)
TGAATAAGCAGTTCTTGACGACC
IAACCGAC N (SEQ ID NO-533 Wi jam o [DGCC7710 [D2972 | 29647-29-618 |TTTTCCOTCTT 'AGCTAÃA | <I0 ” IGATACG 16681-16652 [(SEQ ID NO-711)
TOTTTCAAGGTTTCGGGTCCAAG
IATCATT (SEQ D NO:712)
T6TTCT 18079-18108 |(SEQ1ID NO:713)
TAGAGGTAATGACGGCTTACCOGG
GTAAAGA SEQ ID NO:714,
TGATATT (SEQ ID NO-715; oc pda LR nem (relatively to TGAACA 7201 EQ ID NO:716; DGCCI836 — |DGCCS7TII 15562-15590 |[AACCCAATAATTACAGTGAAGCA| <10 (elatively to |CAATAG D85&) (SEQ ID NO:717)
TTTTACC 24083-24112 |(SEQID NO:718) (relatively to |CTOGTTAATTGCAAGTTTGGTCGA $ D8S8) CACGTT 30059-20088 [(SEQ ID NO:719) (relativeily to |TTGTGGCACAAACAAAATGAATT D$58) AAAGATT EQ ID NO:720) Esta variante exibiu resistência a D2972, quando a eficiência de ' plaqueamento (EOP) de D2972 em WTpniza72** foi reduzida por 4 logs. DNA E : foi extraído de WT pnizsr2"** e o locux de CRISPR1 foi analisado por PCR — como conhecido na técnica (Vide, por exemplo, Bolotin et al. [2005], supra) Í usando combinação de um iniciador de senso (YC70 e/ou SPIDR a montan- te (5S"gTCTTTAgAAACTgTgACACC-3'; SEQ ID NO:674) e um iniciador de antissenso (YCS1 e/ou SPIDR a jusante (5-TAAACAgAgCCTCCCTATCC; SEQ ID NO:675). A sequência do produto PCR foi determinada e comparada com aquela do l/ocux de CRISPR1I de DGCC7710. Comparado com DGCC7710, WTpnize72"** fooi encontrada difererir pela adição de uma se- quência espaçadora única de 30 bp na extremidade 5' da sua região CRIS- PR1 e pela duplicação da sequência de repetição, como mostrado na Figura
14. A comparação da sequência adicional com a sequência do genoma — D2972 mostra que à nova sequência espaçadora é 100% idêntica àquela do genoma D2972 do nucleotídeo 34521 ao nucleotídeo 34492.
Em alguns experimentos adicionais, WTpnisss****2::pcas5 foi usa- da como a cepa parental e D858 foi usado como um fago doador. À cepa resultante variante denominada WTpnisss”***2:: pcasSpnisss”** (Vide, Tabela 7- 1)foiresistente a D858, com uma EOP reduzida por 5 logs. DNA foi extraído de WTpnissa****:: poasspnisss”** e seu locux de CRISPR3 foi analisado por PCR usando um iniciador de senso (CR3 cabeçaFl, 5-
CTGAGATTAATAGTGCGATTACG; SEQ ID NO:676) e um iniciador de an- tissenso (CR3 caudaR2, 5-GCTGGATATTCGTATAACATGTC; SEQ ID NO:677). A sequência do produto de PCR foi determinado e comparada com aquela do locux de CRISPR3 de WTpniass"**2::pcas5. Comparada a WT- phiess"*ipoas5, WTphiess SS e::pcasSphiass”** diferencia-se pela adição de uma sequência espaçadora única de 30 bp na extremidade 5' da sua região de CRISPR3 e pela duplicação da sequência de repetição. A comparação da sequência adicional com a sequência do genoma D858 mostrou que a nova ; sequência espaçadora é 100% idêntica àquela do genoma D858 do nucleo- tídeo 33824 ao nucleotídeo 33853.
Em outros experimentos adicionais, DGCC7809 foi usada como a cepa parental e D3743 foi usado como fago doador. A cepa variante resul- . tante denominada DGCC7809,niva7a3” ** (Vide, Tabela 7-2) foi resistente ao . D3743 com uma EOP reduzida por 8 logs. DNA foi extraído de DGCC7809pniva7as” *º e seu locux de CRISPR3 foi analisado por PCR usan- a do um iniciador de senso (CR3 leadFl|, 5 - CTGAGATTAATAGTGCGATTACG; SEQ ID NO:676) e um iniciador de an- tissenso (CR3. caudaR2, 5"-GCTGGATATTCGTATAACATGTC; SEQ ID NO:677). A sequência do produto de PCR foi determinada e comparada à- —quela do /ocux de CRISPR3 de STOI89. Em comparação ao DGCC7809, DGCC7809pniva743"*** diferencia-se pela adição de uma sequência espaça- dora única de 29 bp na extremidade 5' da sua região CRISPR3 e pela dupli- cação da sequência de repetição. A sequência do fago D3743 é desconhe- cida; entretanto a comparação da sequência adicional com a sequência de outro genoma de fago estreptocócico mostra que a nova sequência espaça- dora é 100% idêntica àquela do genoma do fago DT1 do nucleotídeo 6967 ao nucleotídeo 6996. Em outros experimentos adicionais, DGCC3198 foi usada como a cepa parental e D4241 foi usado como o fago doador. A cepa variante re- —sultante denominada DGCC3198pnis241 *** (Vide, Tabela 7-2) foi resistente a D4241 com uma EOP reduzida por 8 logs. DNA foi extraído de DGCC3198pnis241 ** e seu locux de CRISPR1 foi analisado por PCR usando um iniciador de senso (YC70 e/ou SPIDR-a montante (5"- gTCTTTAgAAACTgTgACACC-3'; SEQ ID NO:674) e de um iniciador de an- tissenso (YC31 e/ou SPIDR a jusante (5-)-TAAACAgAgCCTCCCTATCC; SEQ ID NO:675). A sequência do produto de PCR foi determinada e compa- rada com aquela do /ocux de CRISPR1 de DGCC3198. Em comparação com DGCC3198, DGCC3198pris241*** diferencia-se pela adição de uma se- quência espaçadora única de 30 bp na extremidade 5' de sua região CRIS- PR1 e pela duplicação da sequência de repetição.
A sequência do fago Fr D4241 é desconhecida; entretanto a comparação da sequência adicional coma sequência de outro genoma de fago estreptocócico mostra que a no- va sequência espaçadora é 100% idêntica àquela do genoma do fago DT1 do nucleotídeo 3484 ao nucleotídeo 3455. E A Tabela 7-2 abaixo fornece uma descrição de cepas de varian- ! tes CRISPR-modificadas de DGCC7809 e de DGCC3198. Nesta Tabela, f 15 EOP é expressa relativamente aos fagos doadores.
O posicionamento da . sequência adicional no genoma do fago é dado relativamente ao fago DT1. [cm [E [EEE Jess eo] Fo ese [E OO OOOO OO (5 saDT) KSEQ ID NO:721 E Jose O OOOU( US icon foco [oc EE EEE Tr aDTN SEQ ID NO:722 EXEMPLO 8 - Seleção do grupo de Cepas de Variantes de CRISPR modifi- cadas a partir da Mesma Cepa Parental Neste Exemplo, métodos usados para a seleção do grupo de cepas de variantes a partir da mesma cepa parental que se diferencia pela sua sequência adicional que se origina do mesmo fago são descritos.
Como várias porções de um fago doador encontram uso como fontes de sequên- cias adicionais, múltiplas cepas variantes diferentes podem ser geradas a partir do dado fago doador.
Além disso, cada cepa variante tem uma se- quência adicional diferente.
Consequentemente, múltiplas cepas são desen- volvidas a partir da mesma cepa parental além da cepa variante descrita no
Exemplo 7. Em alguns experimentos, estas cepas adicionais foram geradas pela exposição da cepa recipiente ao mesmo fago doador. As várias cepas variantes resultantes foram contempladas para apresentar diferente espectro de sensibilidade ao fago.
Em culturas independentes, a cepa parental foi submetida ao mesmo fago doador. Para cada cultura, uma variante resistente a um único fago foi isolada como descrito no Exemplo 7 e então analisada. Sequências adicionais em cada uma das cepas variantes foram comparadas uma com a : outra. O espectro de sensibilidade das cepas variantes ao fago doador e ou- Í 10 tros fagos foi determinado usando métodos microbiológicos clássicos conhe- cidos na técnica. Os espectros de sensibilidade das várias cepas foram en- tão comparados. As cepas variantes selecionadas foram aquelas apresen- . tando sequência(s) adicional diferente e espectros diferentes de sensibilida- de ao fago. i 15 Em alguns experimentos, a seleção de várias cepas variantes de - DGCC7710 usando D2972 como um fago doador único foi conduzida. A ce- pa parental DGCC7710 foi exposta ao fago doador D2972 em quatro cultu- ras independentes como descrito no Exemplo 7. Para cada uma das cultu- ras, uma cepa variante foi isolada e foi respectivamente denominada WT- phicsza”**, WI phiagza* O, WI pnizo7a PC! e WITpnizo72* 22 (Vide, Tabela 7-1).
Estas cepas variantes exibiram resistência a D2972, como a efi- ciência de plaqueamento (EOP) de D2972 nas quatro variantes resistentes ao fago foi reduzido por 3 a 5 logs. DNA foi extraído de WTpniao72*, WwT- phiegra**º, WITpnizaz2" 2! e WITphizar2"*2 e foi analisado por PCR usando méto- dos conhecidos na técnica (Vide, por exemplo, Bolotin em al. [2005], supra), usando combinação de um iniciador de senso (YC70 e/ou SPIDR a montan- te (S-gTCTTTAgAAACTÊgTgACACC; SEQ ID NO:674) e de um iniciador de antissenso (YC381 e/ou SPIDR a jusante (5-TAMACAgAgCCTCCCTATCC; SEQ ID NO:675). As sequências dos produtos de PCR foram determinadas e comparadas com aquelas do /ocux de CRISPR1 de DGCC7710. Compa- rada a DGCC7710, WTpnizez2 **, WTpniegra “oo, WITphizaz2" 2! e WTpnicoro 2 diferenciam-se pela adição de uma sequência espaçadora de 30 bp na ex-
tremidade 5' da sua região de CRISPR1 e pela duplicação da sequência de repetição, como mostrado na Figura 17). A comparação destas novas se- quências espaçadoras com a sequência do genoma D2972 mostra que as novas sequências espaçadoras são 100% idênticas àquelas do genoma —D2972 do nucleotídeo 31582 ao nucleotídeo 31611, do nucleotídeo 25693 ao nucleotídeo 25722, do nucleotídeo 27560 ao nucleotídeo 27589 e do nu- cleotídeo 24624 ao nucleotídeo 24653, respectivamente. Todos os quatro espaçadores adicionais foram encontrados sendo cada uma diferente da : outra e diferentes dos espaçadores descritos no Exemplo 7.
EXEMPLO 9 - Métodos Naturais Usados para Inserção de uma Segunda Sequência Adicional em um locux de CRISPR Neste Exemplo, métodos naturais usados para provocar a inser- ' ção de uma segunda sequência adicional em /ocux de CRISPR são descri- . tos. Na inserção de uma sequência adicional de um dado fago doador em Ê 15 um locuxde CRISPR bacteriano, a cepa variante torna-se resistente ou pelo eae menos menos sensível a este fago. Por isso, o método descrito no Exemplo 7 não é mais eficiente para a inserção de sequências adicionais no /ocux de CRISPR desta cepa variante. Por exemplo, o método não pode ser aplicado à cepa variante WTpnize72*** (como uma cepa parental) usando D2972 como um fago doador, porque WITpnize72* O tem sensibilidade significativamente reduzida a D2972 (Vide, Exemplo 7).
Em alguns experimentos, este problema foi superado pelo uso de um fago doador mutado derivado de D2972 que inclui pelo menos uma modificação específica dentro do seu genoma (isto é, um "fago mutado").
—Estefagomutado foi selecionado pela exposição do fago doador à cepa va- riante, tal que a modificação (isto é, mutação) do fago parental! produziu viru- lência para a cepa variante.
Em alguns experimentos, o fago mutado tinha uma mutação no seu genoma dentro da região contendo à sequência espaçadora adicional que é parte da sequência adicional na cepa variante. A cepa variante foi sensível a este fago mutado. A cepa variante foi exposta ao fago mutado e a variante resistente a um novo fago (variante de 2º geração) da cepa variante foi selecionada.
A variante de 2º geração foi analisada usando métodos a- dequados conhecidos na técnica (por exemplo, PCR e sequenciamento), para confirmar a presença de uma sequência adicional dentro de um locux de CRISPR.
A sequência nucleotídica da sequência adicional foi determina- da Em alguns experimentos, a sequência adicional foi encontrada contendo um fragmento de aproximadamente 30 nucleotídeos em tamanho do fago mutado que fornece resistência ao fago mutado.
Em alguns experimentos, a cepa variante foi pré-cultivada duran- Y te a noite em um meio apropriado baseado em leite a 42ºC.
Um meio base- adoemleite adequado então foi inoculado com a pré-cultura da cepa varian- te a uma concentração de aproximadamente 10º cfu/ml e com uma suspen- são do fago doador em uma maior MOI do que 100. A cultura foi incubada . durante a noite a 42ºC, e então centrifugada.
O sobrenadante foi colhido e ' filtrado usando um filtro de 0,45 um.
Diluições do sobrenadante filtrado foram é 15 usadas para inocular um meios de ágar nutritivos semeados com a cepa va- B riante a fim de obter placas de fago isoladas, usando qualquer método ade- quado conhecido na técnica.
Placas isoladas foram cultivadas na cepa vari- ante em meios nutritivos líquidos, usando qualquer método adequado co- nhecido na técnica.
Uma suspensão do fago mutado foi obtida pela filtração da cultura através de um filtro de 0,45 um.
O fago mutado então foi usado como descrito acima (Vide, Exemplo 7) para provocar a inserção de uma segunda sequência espaçadora adicional no locux de CRISPR da cepa vari- ante.
Em alguns experimentos, WTphizo72* (Vide, Exemplo 7 e Tabela 7-1)foiusado como a cepa parental e D4724 foi usado como o fago doador.
A cepa variante WTpnizg72** foi cultivada na presença da alta concentração do fago D2972. Um fago mutado chamado D4724 foi isolado pelo plaquea- mento do sobrenadante a partir desta cultura na cepa WTTpnizaz2* usando os métodos descritos acima.
A virulência do fago mutado D4724 na WTpnice72* O foiverificada.
A cepa variante WTpniza72*** foi exposta ao fago mutado D4724 em uma cultura como descrito no Exemplo 7. Uma cepa variante resistente ao fago denominada WTphize72** phiazas**** (Vide, Tabela 7-1) foi obtido.
Em comparação com WTphizoza* esta cepa variante exibiu uma resistência aumentada a D2972, quando a eficiência de plaqueamento (E- OP) de D2972 em WTpnizo72*S pniaz24 É foi reduzida por mais que 8 logs (em vez de 4 logs); além disso, sua resistência também foi aumentada emm comparação a WTpnizor2** como mostra alguma resistência a D4724 (Vide, Tabela 9-1). DNA foi extraído de WTpniza72”* phiazaa *** e seu locux de CRIS- PR1 foi analisado por PCR como descrito acima usando as mesmas combi- nações de iniciadores como descrito acima. A sequência do produto de PCR r foi determinada e comparada àquela do locux de CRISPR1 de WTpnizo72"** . Comparado a WTpnieeza”**, WT pniegza O phiazoa ** cliferencia-se pela adição de uma sequência espaçadora de 30 bp na extremidade 5' da sua região de CRISPR1 e pela duplicação da sequência de repetição, como mostrado na - Figura 17. Uma comparação desta sequência espaçadora adicional com a E sequência do genoma D2972 mostrou que a segunda sequência espaçadora é 15 adicional é 100% idêntica àquela do genoma D2972 do nucleotídeo 1113 ao h nucleotídeo 1142.
A partir de culturas independentes usando condições experimen- tais idênticas, as cepas variantes WT pnicg7a SS pniazas Se WIT phicoza SS phiazas o foram isoladas e analisadas (Vide, Tabela 7-1). Quando comparado com WTpnizg72* estas cepas variantes exibiram uma resistência aumentada a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WT- pries7a ohiazea *” e WI phizara phiazaa 2 foi reduzida por mais que 8 logs de ambas as cepas variantes; e sua resistência também foi aumentada, quando comparada com WTpniagr2* quando apresentou alguma resistência a D4724 (Vide Tabela 9-1). Além disso, estas cepas variantes exibem sequencias espaçadoras adicionais em CRISPR1 que são 100% idênticas àquelas do genoma de D2972 do nucleotídeo 33968 a nucleotídeo 33997 e nucleotídeo 308083 ao nucleotídeo 30832, respectivamente. Em experimentos adicionais, WTpnizo72* Spniazas**** foi usada co- moa cepa parental e D4733 foi usado como fago doador. Os métodos des- critos acima foram usados para gerar o fago mutado D4733 a partir do fago DA4724. Então, o fago D4733 foi usado para obter uma cepa variante resis-
tente ao fago a partir de WTpnize2 phiazaa****. A cepa variante resultante foi denominada WTpnieo7a* phiaras* phiaras” o (Vide, Tabela 7-1). Esta cepa va- riante contém uma sequência adicional incluindo uma sequência espaçadora que é 100% idêntica a uma sequência do genoma de D2972, nucleotídeo 29923 ao nucleotídeo 29894. Exibiu uma resistência aumentada a D2972, quando a eficiência de plaqueamento (EOP) de D2972 em WT- phiegta O pnazea * Ppniazas”*** foi reduzida por mais que 8 logs e sua resistência foi expandida ao fago D4733 (Vide Tabela 9-1). A tabela 9-1 fornece uma " descrição da resistência ao fago de algumas cepas variantes CRISPR- i 10 modificadas de DGCC7710. Nesta Tabela, "nd" indica que os resultados não foram determinados. mens pa ssa] Bim [Bm] [ot [55 : D4733 ! ita o EE 1 17 Ir INTO iam [Does Dam e CI [1 OC Tec i | Tear onte | WTram | Davaa FETO er o ng na [iriam saT Mans [pm] am Tera ss o WTmoem pauta WT pera À 0 <1o 0 fu am CN [rare [Wai [Di 1 Toa Te e Era [rea fer fa afetar Em ainda experimentos adicionais, WTpnize72"* foi usada como a cepa parental e D4720 foi usado como o fago doador.
Usando os mesmos métodos como descrito acima, fago mutado D4720 foi gerado a partir do fa- go D2972. O fago D4720 foi usado para obter uma variante resistente ao fago de WTprises2"*. A cepa variante resultante foi denominado WT- phiegr2a*phiar20**? (Vide Tabela 7-1). Esta cepa variante contém uma sequên- cia adicional incluindo uma sequência espaçadora que é 100% idêntica a uma sequência do genoma de D2972 do nucleotídeo 33968 ao 33997. Ela exibe resistência aumentada a D2972, quando a eficiência de plaqueamento
(EOP) de D2972 em WTphizo72** pniaz20*** foi reduzida por 6 logs (comparada com 5 logs); e sua resistência foi aumentada ao fago D4720 (Vide, Tabela 9- 1). EXEMPLO 10 - Métodos Naturais Alternativos para Inseção da Segunda Se- quência(s) Adicionalem Locide CRISPR Neste Exemplo, métodos naturais alternativos úteis para inser- ção de uma segunda sequência adicional em um locux de CRISPR são des- critos. É conhecido que uma dada cepa parental pode ser sensível a mais de uma família de fagos. Esta diversidade de sensibilidade foi vantajosamente usada para inserir sequências adicionais em um /ocux de CRISPR de uma cepa variante, como descrito neste pedido. Nestes experimentos, o segundo fago doador foi selecionado pelo teste de virulência de uma seleção de fagos : na cepa parental e na cepa(s) variante. Os segundos fagos doadores de in- f " teresse foram aqueles que foram virulentos para ambas as cepas. Foi con- í 15 templado que estes fagos poderiam provavelmente representar uma família : diferente de fagos que aquelas representadas pelo fago doador inicial. Após sua seleção, o segundo fago doador foi usado para infectar a cepa variante. Como descrito nos métodos acima, uma segunda geração de cepa variante resistente ao fago foi isolada e testada para uma sequência adicional dentro — dolocuxde CRISPR.
Nestes experimentos, uma coleção de fagos (ou amostras con- tendo fago) foi testada contra a cepa parental usando métodos microbiológi- cos clássicos conhecidos na técnica. Fagos (ou amostras) que são virulentos à cepa parental então foram testados contra a cepa variante usando os mesmos métodos. Um fago (ou amostra) que foi virulento para a cepa vari- ante foi selecionado como um segundo fago doador. No caso do fago con- tendo amostras, um fago virulento foi purificado para homogeneizar na cepa variante usando métodos microbiológicos clássicos conhecidos na técnica. Em alguns experimentos, a sequência do segundo fago doador foi determi- nada. Em alguns experimentos, o segundo fago doador foi então usado co- mo descrito acima (Vide, Exemplo 7) para provocar a inserção de uma se- gunda sequência adicional no /ocux de CRISPR da cepa variante.
Em alguns experimentos, WTpnicg7a"* (Vide, Exemplo 8 e Tabela 7-1) foi usada como a cepa parental e D858 foi usado como o fago doador. Em testes de vários fagos, a cepa DGCC7710 foi encontrada sendo sensível a ambos fago D2972 e fago D858. Além disso, D858 foi encontrado sendo virulento contra a cepa variante WTTpnizoro* É. O fago D858, por isso, foi esco- lhido como um segundo fago doador em alguns experimentos. A cepa variante WTpnizo72** foi exposta ao segundo fago doador D858, como descrito no Exemplo 7. A cepa variante resistente a um fago : denominada WTphiza72”* pniess**º (Vide, Tabela 7-1) foi obtida que é resisten- tea bD858 (Vide Tabela 9-1). Esta cepa exibe uma resistência aumentada a D2972, quando a eficiência de plaqueamento de D2972 em WT- phiag72 * phiess***º foi reduzida por mais que 8 logs (comparada com 5 logs de ; WTpnizg72"*; Vide Tabela 9-1). DNA foi extraído de WTptizo72”* pniass**** e seu E. locux de CRISPR1 foi analisado por PCR usando os mesmos métodos e ] 15 iniciadores como descrito acima. A sequência do produto PCR foi determi- " nada e comparada com aquela do /ocux de CRISPR de WTpnizor2**. Compa- rada a WTpnisez2"**, WI phico7a** pniass”* * diferencia-se pela adição de uma sequência espaçadora de 30 bp na extremidade 5' da sua região de CRIS- PR1 e pela duplicação da sequência de repetição, como mostrado na Figura
17.A comparação desta sequência espaçadora adicional com a sequência Í do genoma D858 mostrou que a segunda sequência adicional espaçadora é 100% idêntica àquela do genoma D858 do nucleotídeo 30338 ao nucleotídeo
30367. Outra cepa variante denominada WTpnizera** pniazao =" (Vide, Tabela7-1)também foi obtida usando este método em trabalho experimental independente. Esta cepa variante contém uma sequência adicional incluindo uma sequência espaçadora que é 100% idêntica a uma sequência do geno- ma D858 do nucleotídeo 33886 ao 33915. Ela exibe resistência aumentada a D2972, quando a eficiência de plaqueamento de D2972 em WT- phiegva phiazaa PS foi reduzida por mais que 7 logs (Vide, Tabela 9-1). EXEMPLO 11 - Gênese de uma Cepa Variante CRISPR-modificada Resis- tente a Múltiplos Fagos por Inserções Múltiplas de Sequências Adicionais nos Loci de CRISPR Neste Exemplo, o desenvolvimento de uma cepa resistente a multifago é descrita através da adição iterativa de sequências de fago nos loci de CRISPR, quando a adição de 2 sequências de fago nos loci de CRISPR não é suficiente para conferir resistência a todos os fagos a uma dada cepa.
Por exemplo, cepa WTphiza2"* phiass”º (descrito no Exemplo 10) foi encontrada sendo sensível a múltiplos outros fagos.
No processo de de- senvolvimento de uma cepa resistente a multifagos, a cepa parental foi sub- D metida a um primeiro fago para selecionar uma cepa variante, então a cepa variante foi submetida a um segundo íago para selecionar uma segunda ge- ração da cepa variante que é resistente a ambos os fagos.
Então, a última cepa variante foi submetida iterativamente aos fagos aos quais foi ainda E sensível, até que uma cepa variante final fosse obtida que foi resistente a !
y todos os fagos disponíveis.
Í 15 Usando métodos conhecidos na técnica, um grupo de 10 fagos E de referência foi identificado que são representativos da diversidade de fa- gos que são capazes de se desenvolver na cepa DGCC7710, ou seja, fagos D858, D1126, D2766, D2972, D3288, D3821, D4083, D4752, D4753, e N1495. Como descrito no Exemplo 7, DGCC7710 foi exposta ao fago D2972 para gerar a cepa variante DGCC9705. DGCC9705 foi encontrada sendo Í resistente ao fago D2766 e D4752 em adição ao fago D2972, mas foi ainda sensível a outros fagos como mostrado na Tabela 11-1. DGCC9705 é des- crita na Tabela 11 - 1 e na Figura 17. DGCC9705 apresenta 1 sequência adicional em CRISPR1 e 1 sequência adicional em CRISPR3. Análise da sequência do locux de CRISPR1 e do locux de CRISPRS3 foi feita de acordo com métodos descritos no Exemplo 7. A sequência dos produtos de PCR foi determinada e comparada com aquela dos /oci da CRISPR1 e 3 de DGCC7710. DGCC9705 apresenta 1 espaçador adicional em seu locux de CRISPR1 e um espaçador adicional no seu /ocux de CRISPR3. As sequên- cias espaçadoras são idênticas a sequências do fago D2972. Usando os mesmos métodos, DGCC9705 então foi exposta ao fago D3821 e a cepa variante estira DGCC9726 então foi isolada.
Além de ser resistente a D2972,
DGCC9726 tem resistência aos fagos D858, D3821, D40838 e N1495 (Vide, Tabela 11-1). DGCC9726 tem 1 sequência espaçadora adicional em seu locux de CRISPR1 quando comparada com DGCC9705 (Vide, Tabela 7-1 e Figura 17). A sequência espaçadora adicional é idêntica a uma sequência de D2972. Através da exposição da cepa DGCC9726 ao fago D3288, DGCCS9733 foi isolado.
A cepa DGCC9733 é adicionalmente resistente ao fago D3288 e DI126 (Vide, Tabela 11-1). DGCC9733 tem 1 sequência espa- çadora adicional em seu /locux de CRISPR1 comparativamente a DGCC9726 y (Vide, Tabela 7-1 e Figura 17). Esta sequência espaçadora tem alguma iden- | 10 tidade (identidade de 25/30 pares de base) a uma sequência do fago estrep- tocócico 7201. Finalmente, por uma última exposição iterativa ao fago D4753, DGCC9836 foi isolada que é resistente a todos os fagos (Vide, Tabe- h la 11-1). DGCC9836 tem 2 sequências espaçadoras adicionais em seu locux ! de CRISPR1 e 2 sequências espaçadoras adicionais em seu /ocux de f 15 CRISPR3 (Vide, Tabela 7-1 e Figura 17). Uma sequência espaçadora é i- : Í dêntica a uma sequência no fago D2972 e 3 outras sequências espaçadoras são idênticas a sequências no fago D858. A Tabela 11-1 fornece dados quanto à sensibilidade ao fago da cepa variante CRISPR-modificada DGCC9836 e cepas variantes CRISPR- modificadas intermediárias.
Nesta Tabela, "S" indica sensibilidade e "R" indi- ca resistência. e Cepas Variantes Modificadas em CRISPR intermediárias Cepa Cepa Fago = PERES ER ppocemio os Ds ps ds Ds ds Ds | s | ss) | PECAS | pacerio maia | R | Rr TR | os [os ss | os ss) | Doria | Bacesios [Ben E *)'R) tr) xa 213 >) pec ooo ae E o x | E | EE ER x) [Pocos | Doceto [pass] Rr | RR (OR [RR | R | RR JR) EXEMPLO 12 - Método Natural para Inserir Múltipla Sequência(s) Adicional em um Locux de CRISPR Neste Exemplo, métodos são descritos para inserir múltiplas se-
quências adicionais nos /oci de CRISPR.
Nestes métodos, antes de usar vários fagos iterativamente, a cepa parental foi exposta a uma mistura contendo múltiplos fagos. Uma co- leção de fagos foi testada contra múltiplas cepas usando métodos microbio- lógicos clássicos, a fim de determinar seu espectro de hospedeiro. Fagos que foram virulentos para a cepa parental mas que tiveram diferente espec- tro de hospedeiro foram selecionados. Os fagos selecionados foram mistu- rados e usados nos métodos fornecidos acima (Vide, Exemplo 7) para pro- . vocar a inserção de sequências adicionais nos /oci de CRISPR da cepa vari- ante. Em alguns experimentos, DGCC7710 foi usado como a cepa parental e D858 e D2972 foram usados como fagos doadores. Em testes de y vários fagos, a cepa DGCC7710 foi encontrada sendo sensível a ambos fa- : go D2972 e fago D858. Entretanto, D2972 e D858 apresentaram diferentes espectros de hospedeiro quando testados na cepa DGCC7778, sugerindo À que os dois fagos foram diferentes.
A cepa parental DGCC7710 foi exposta a uma mistura de fago D858 e D2972 como descrito no Exemplo 7. Uma cepa variante resistente ao fago denominada WTpnissspnizeza” 10811812 (Vide, Tabela 7-1) foi obtido.
Elaexibe resistência a D858, quando a eficiência de plaqueamento de D858 em WTpnisssphiza72” 181181? foj reduzida por mais de 7 logs, bem como a resistência a D2972, quando a eficiência de plaqueamento de D2972 em WI phisssphiza7a “19811812 foi reduzida por mais de 7 logs. DNA foi extraído de WI pniesspnica72* 1811812 e seus loci de CRISPR foram analisados por PCR usandoosmesmos métodos e iniciadores como descrito acima. A sequência dos produtos de PCR foram determinados e comparada com aquela do lo- cux de CRISPR1 e do /ocux de CRIPR3 de DGCC7710. Comparada com DGCC7710, WT prissspniza72a* 1511812 diferencia-se pela adição de 4 sequên- cias espaçadoras de 30 bp na extremidade 5' da sua região de CRISPR1 e pela duplicação das sequências de repetição, como mostrado na Figura 17. A comparação das sequências espaçadoras adicionais com a sequência do genoma D2972 mostrou que as sequências espaçadoras adicionais são
100% idênticas àquelas dos D2972 do nucleotídeo 7874 ao nucleotídeo 7903, do nucleotídeo 20650 ao nucleotídeo 20621, do nucleotídeo 8360 ao nucleotídeo 8389 e do nucleotídeo 18998 ao nucleotídeo 19027. Em experimentos adicionais, a cepa WTpniesepnizata* (Vide, —Tabela7-1)foitambém obtido após estes métodos.
Ela exibe resistência a D858, quando a eficiência de plaqueamento de D858 em WT- pniessphizo7a* ***S** foi reduzida por 7 logs, e resistência a D2972, quando a efi- ciência de plaqueamento de D2972 em WTpnissspnizora* **º foi reduzida por ” 8 logs.
A comparação das sequências espaçadoras adicionais com a se- —quênciado genoma de D2972 mostrou que as sequências espaçadoras adi- cionais são 100% idênticas àquelas da D2972 do nucleotídeo 33602 ao nu- cleotídeo 33631 e do nucleotídeo 4830 ao nucleotídeo 4801. EXEMPLO 13 - Combate a Fagos na Fermentação Usando uma Cepa vari- : ante CRISPR-modificada ii 15 Neste Exemplo, métodos de combate aos fagos na fermentação - i pelo uso de uma cepa variante em vez de uma cepa parental (isto é, de tipo selvagem, recipiente) são descritos.
Dessa maneira, este Exemplo fornece ainda outra descrição dos benefícios fornecidos pelas cepas variantes.
Em alguns experimentos, comparação da cepa DGCC7710 para — 20 WToniesro"*? e a cepa WTpnizor2" e?” na fermentação de leite na presença do fago D2972 foi realizada.
DGCC7710 é uma cepa industrial usada na fermentação de leite.
A cepa WTpnize72*** é descrito na Tabela 7-1 e no E- xemplo 8 e exibe em seu /ocux de CRISPR1 um espaçador adicional, quan- do comparada a cepa DGCC7710. A cepa WTprizgz2" exibe resistência melhorada a D2972, quando comparada com DGCC7710. WI pnizera o é outra variante exibindo a mesma resistência a D2972 (descrita na Tabela 7- 1) e exibe 2 espaçadores adicionais em seu locux de CRISPR1. As fermentações seriadas foram realizadas com cada cepa.
Em primeiro lugar, meio de leite em pó 10% (p/v) foi semeado com 1% (v/v) de uma pré-cultura da cepa testada e com 10º pfu/m! de fago D2972. A cultura foi incubada a 42ºC por 6 h.
Após a primeira fermentação, uma segunda fermentação foi configurada.
As mesmas condições exatas de fermentação foram usados exceto que 0,1% do volume do fermentado da fermentação precedente foi adicionado (antes da adição, o fermentado foi filtrado usando um filtro de 0,45 um). Então, sucessivas fermentações foram realizadas com as mesmas condições experimentais como aquelas usadas para a segunda fermentação.
Todas as fermentações foram registradas por impedimetria.
No fim da cada uma das fermentações, a coagulação do leite foi testada e a titu- lação de fagos foi realizada usando métodos conhecidos na técnica.
No caso de fermentação láctea na ausência de fago, variação de impedância com Y DGCC7710 foi acima de 2500 yS em 6 horas.
Na presença de D2972, (DGCC7710 sendo mais sensível aos fagos), os fagos de D2972 alcançaram alto nível de população durante a primeira cultura e a fermentação falhou em coagular o leite.
A variação da impedância em 6 horas esteve sempre abaixo : de 500 uS.
Ao contrário, a fermentação de leite com WTpnizo72* O na presen- ; ça de D2972 permitiu coagulação do leite pelo menos até a 3º subcultura e í 15 evolução lenta do nível de fago foi observada.
Variação da impedância au- : mentou para mais de 2500 yuS também até a 3º subcultura.
Isto demonstra que a cepa variante WI pnizor2* O é mais apropriada que a cepa parental DGCC7710 para acidificação láctea na presença de fagos.
Além disso, a fermentação de leite com WTpnizer2"****" na presença de D2972 permitiu : 20 coagulação do leite até a última subcultura sem desenvolvimento de fago.
Além disso, a variação da impedância aumentou para mais de 2500 yS tam- bém até a última subcultura.
Isto demonstra que a cepa variante WT- phiag7a" SS? é mais apropriado do que a cepa parental DGCC7710 e mesmo mais apropriada do que WTpniza72* para acidificação láctea na presença de fagos.
Os experimentos foram duplicados; os resultados são apresentados na Tabela 13-1.
No 3) 8 R No
OS E 3 SE S| E co = o sssSSsRSes Rss ESSSSTSSSS ZIQNl= = 6 O go o NT | Ss ea | qu SI 6 6 | co 6 | | | O v o Wo No
SE E 8158 n'> o = : 25 E & 2 7128 Ú| wo
FERREIRA 0 85 < <<< ZSs<sse< Eu É : ss So s Zl— oo ; ol=2 sê . oleo os
OS ae o se 2d fg E E E EEE E EEE 39 ojo 7 D/ 6/0 O NO 0 O De
EE ol Ss = 32 Elo
SO oO 8 |o E 2 CV o o 3 |Eral-la|-/lajo «+ TF -laloig la w/3 6 3 lo So 8 O o o ss Ns O . oc o Boss & gos 2 S 2% = << em 2º o 2 o o o Se RR 2IR SE so 2 r Te Oo 2o63 88 E Fo 3 DO OO DO 5) EO ES so SS à jaseges |E2 EE ER = rr [Ss o an Ó E E8
Em um segundo conjunto de experimentos, a comparação da cepa DGCC7710 a cepa WI pnics72"* e cepa WI prizo72" 2” na fermentação láctea na presença do fago D2972 foi reproduzida.
Além disso, a cepa DGCC9836 foi estudada.
A cepa DGCC9836 é até mais desenvolvida cepa variante de DGCC7710 que é o resultado de desafio com múltiplos fagos.
Esta cepa apresenta 5 espaçadores adicionais em seu /ocux de CRISPR1 e 3 espaçadores adicionais em seu locux de CRISPR3 (Vide, Exemplo 11 e Figura 17). DGCC9836 é resistente a todos os fagos testados. , Os experimentos foram conduzidos como descrito acima.
Os resultados são mostrados na Tabela 13-2. Como para o primeiro conjunto de experimentos, a fermentação de leite com WTTpnizaza" O na presença de D2972 permitiu a coagulação do leite até a 5º subcultura e evolução lenta do E nível de fago foi medida.
A variação da impedância aumentou a mais de : 2500 yS durante as 5 primeiras subculturas, demonstrando que acidificação f 15 láctea não é afetada pelos fagos.
Na 6º subcultura, o nível de fago aumentou o significativamente e a fermentação láctea foi prejudicada.
Para 2 outras ce- pas variantes, a fermentação láctea não foi afetada ao longo das 6 subcultu- ras, fagos nunca desenvolvidos e a variação registrada da impedância foi sempre acima de 2500 yuS.
Estes experimentos demonstram que cepas contendo pelo me- nos uma sequência espaçadora adicional em seu /ocux de CRISPR1 permite a fermentação láctea até na presença de fagos.
A fermentação láctea é mesmo mais segura quando as cepas têm mais de uma sequência espaça- dora adicional em seus locide CRISPR.
Ss
NE RF E
OS ao o <a = o = o No SESI SS SS TINI8/8 R2/8/TIgI2 Ro | SD O O OS go om O) O —/ MN co o o o Sm Na] O a a ei ei ai eu 6 | 6) qi q e 8/o gs E gs
EE S 3/8O
F & =
SL
DO ' El
E Sô s e) AEÉS 2/8/:8/ o o o EE) < 7 SS as =
SIX E Elo . S18 . so > 2 E “E o : dz : 8
E Es ol 2 ES a o HSlo [E EE EE E E EE EE 8/2 [9]K) DO DN OO DO OO o % CS ss as Eló oO
X
S o o E aj oo ) qa S$
E fd
O ai Ss 2 ã e 8
Q | S a <, s —=| O a o) o ã 5 O 80 |& ã o - E E 8
EXEMPLO 14 - Combate de Fagos na Fermentação Usando uma Combina- ção de Cepas Variantes CRISPR modificadas Neste Exemplo, métodos para combater fagos na fermentação através do uso de uma combinação de cepas variantes em vez de usar uma cepa única são descritos. Dessa maneira, este Exemplo ilustra o uso simul- tâneo de mais de uma cepa variante (isto é, uma combinação de cepas vari- antes). De fato, misturas de cepas exibinido as mesmas funcionalidades, ainda padrões de sensibilidade ao fago diferentes encontram uso em tais + aplicações. Por exemplo, 2 ou 3 ou até mais cepas variantes como descrito neste pedido encontram uso em tais aplicações. Usando uma combinação de cepas variantes com sequências espaçadoras adicionadas diferentes em seus /oci de CRISPR permite que a fermentação resista mais facilmente a quaisquer fagos mutantes emergentes.
Em alguns experimentos, comparações foram feitas entre a cepa F “15 WTpniegre* sozinha e uma combinação de 3 cepas (ou seja, WTpnize72"%%, WTpnizo72*! e WTpnize72*?) usada na fermentação láctea na presença do ã fago D2972. As cepas WTpnizs7a”*º, WI phieg7a**?! e WI phiaara” 22 são descri- tas na Tabela 7-1 e no Exemplo 8. Elas são cepas variantes independentes de DGCC7710. Cada cepa variante exibe em seu locux de CRISPR1 uma sequência espaçadora adicional distinta (as quais originadas do fago D2972) quando comparada à cepa DGCC7710.
Fermentações seriadas foram realizadas com a cepa WT- pnieg72**** sozinha ou na combinação das três cepas. Em primeiro lugar, meio de leite em pó 10% (p/v) foi semeado com 1% (v/v) de uma pré-cultura da cepa sozinha ou a combinação de cepas e com 10º pfu/ml do fago D2972. À cultura foi incubada a 42ºC por 6 h. Seguinte a primeira fermentação, uma segunda fermentação foi configurada. As mesmas condições exatas de fer- mentação foram usadas exceto que o volume de 0,1% do fermentado da fermentação precedente foi adicionado (antes da adição, o fermentado foi filtrado usando um filtro de 0,45 um). Então fermentações sucessivas foram realizadas usando as mesmas condições experimentais como aquelas usa- das para a segunda fermentação. Todas as fermentações foram registradas por impedimetria.
No fim da cada uma das fermentações a coagulação do leite foi testada e a titulação de fagos foi realizada usando métodos conheci- dos na técnica.
Os experimentos foram duplicados; os resultados foram for- necidos na Tabela 14-1.
So Ts w Ss 3 82
Ó VE o OS & lê Es E Ro 2 a 62 o ooo 2 hgo o & E O |E5 7 E 3 O o >
E fo vv . o | o *% X E ls = o o oO o o E [O =X Éo õ So o ES g& & 82 az s lo8 8 o 2 E |$5]2 - 3º 3º? 3 | EE = = E o E 8 Ss : 3 | E = Zz
ES aa o ' OE 298
S =>
FEET e |8S o 3 |sº = O e | o Vs > & 8 s O cs
Ê nn o IS jo 4X 3 o -” $ |3 |E-lajo ano o 8 |S o = o & O ã= | Sãão o 2 2 = - Fx - oo 8 ol & as E 3a 2228 o = 8 2.2 + a 2 aaa” = le RÍs?2 so FE EO INNNHO 3 |& ils 3 SEE RRRE = |ô |60/£S 5 8,8 828 | EEE z Et dó lggi ss; = 3 | |ãsé ê & [ES
C Ê
A fermentação láctea feita com WTpnizor2***! na presença de fa- gos falhou na terceira subcultura em ambas os testes. Isto foi mostrado por uma ausência de coagulação do leite e por uma variação altamente reduzida da impedância após 6 horas de fermentação. Ao contrário, apesar de algum — desenvolvimento do fago D2972, as fermentações foram conduzidas com sucesso até a quinta subcultura quando a mistura das três cepas foi usada. A coagulação do leite foi registrada em todas as culturas e a variação da impedância em 6 horas de incubação nunca esteve abaixo de 3000 JS.
Estes experimentos demonstram que o uso da combinação das cepas variantes tendo pelo menos uma sequência espaçadora distinta adi- cional em seu locux de CRISPR1 permite a fermentação láctea na presença de fagos, quando comparado ao uso da cepa variante única.
EXEMPLO 15 - Combate a Fagos em Fermentação Usando uma Rotação de 1 Cepas Variantes CRISPR-modificadas E “A5 Em experimentos adicionais, as cepas variantes foram usadas : em rotação. Em alguns experimentos, as cepas tiveram as mesmas funcio- ó nalidades, mas diferentes padrões de sensibilidade ao fago. Dessa maneira, neste Exemplo, os experimentos conduzidos no uso iterativo/subsequente de várias cepas diferentes (isto é, cepas variantes CRISPR-modificadas) sequencialmente em um esquema de rotação são descritos.
Em alguns experimentos, comparações foram feitas entre as cepas WTpnizor2"**' sozinha e as cepas WI prizor2" 2, WTpniagra “e WT- pricora usadas sucessivamente (em rotação) na fermentação láctea na presença do fago D2972. A primeira fermentação de leite foi conduzida com a cepa WTpnissz2"**. Então, a cepa WTTpnizs72"*? foi usada para a segunda fermentação, e a cepa WTpniee72***' foi usada para a terceira fermentação. À quarta fermentação foi então novamente feita usando a cepa WTprizgra 5 seguido por uma fermentação com a cepa WI piora, então com a cepa WI pnizo72**!, e similares. As cepas WTTpnicoza O, WTpnizor2" E! e WITpnizata — são descritas acima na Tabela 7-1. Elas são cepas variantes independentes da cepa DGCC7710. Cada cepa variante exibe uma sequência espaçadora adicional distinta em seu /ocux de CRISPR1, quando comparada com a cepa
DGCC7710, que originou-se a partir do fago D2972.
Fermentações seriadas foram realizadas usando os mesmos métodos experimentais descritos no Exemplo 14. Experimentos foram feitos em triplicata; resultados são mostrados na Tabela 15-1. As fermentações seriadas inoculadas com WTTpnizaz72* SO sozinha foram bem sucedidos até a 3º subcultura, como mostrado pelos valores de variação da impedância acima de 3000 4S e pela coagulação do leite. As próximas subculturas falharam em coagular o leite e os altos valores de fago foram registrados. Ao contrá- rio, as fermentações seriadas feitas pela inoculação do leite pela rotação com 3 diferentes cepas variantes (WTpni2o72"*?%, WTpniega* 2! e WTprizg72* 2) foram bem sucedidas até a décima subcultura. Sob estas condições experi- mentais, os fagos falharam em propagar e permanecer em baixos níveis. Os resultados indicam que usar uma rotação de cepas variantes fornece a resis- E tência ao fago melhorada durante a fermentação, quando comparada ao uso E 15 deuma cepa variante única.
S Fa) s s
E À e: 8 e lg 3 88885 258 88 à ls 8 | 8 5 8 Ss IÇSE | S&S à les 518 SO Om |O 8 ass & E ass o ke) o o
E sos Ss 3 o 8 FA = : av 8 > al Ss 2 los g 2 lg E ê SS E = | & gu E m do E S/2& o o)
NH á o Em ss Á e O : Co
ES E . .. : : 8º 5 |5 8 o o 233 3 5 1 2
FE 3/5
SE 215 7 7 3º F 7 ' [| ' E E É É É + : EE E 8% E EE EG & Cv. /o - S o o 8 8 lg 8 s 8. o 2º lo 8 |8 : 8.18 SS as o ss 38 |.98 |.98 DEE ES, EE 82 1,87 S Eta EA E a E a a 8 S| E Sds sera ds sarado: Ss SISQES: E SE 5| É 5 ds 4545 As ds dos Ê Ê Ê Ê = 5 ze |5 5 ss 8 | 8 5 5 8 S|S 1" $ |ó |$ |$ |2 |S 2 | kb Ss : = é lã |s & IE jà |& |& ? = jà |& | Ss 3 - o Fr gs £ : 3 |: E $ o E ê Pô s se
SE o an E: E ls 8 3 IR 3 268 8 3 8 8 8|8 a oo E 38 8 SS SS qN Ie, One Oo
TE E so o "o o ns 218 ss ek s 8. 2 2 x |X E SE 8 [2 2 eg â 8 DES E le E js gu ú à má So E DO o | ol 8 2H | SE À Es | & ro : e cn e 8 3& E le sk SI 8o2E |E |E |Ee EE 2/07 6 lo 2 o $/'&E
O o 33 218 : 3º ' + , , 1 É E E E | À = E lg E E |E S z ã ã ho o o o o 8 Ss o 8 18 |8sSI8 8,/8 |8 a 18x So 8 8/8 S = a 185 S8 | Sã SESEEEEAE EIA 8/8988, £ o & SÁ e Ss SE SS SS Sds SNS NS SS
SE FSESSENSEA E SE SST SS SA E Ss 335 ds de a de SE ds ass SE $ 513 ASÇ5 Sds 5 : ê DJ = O AO o Ê ê Ê Ê Ê EE É |É j2= 8 [É E JE É g :& [E [E [E & [E (8 |8S à le la a PE Ea 2 le els = s o < E Fa E 2 & = o & à É ã o o ts : : o) E : : as lo é |s 2 |S E | S&S | r = ow Es so ge s ass SS o L> o o : : | SS se 81º S ds 2 88, 2 8 $ 2 E Z Ê E 5 ã 2| É ss 24 É ds E 8/7, Se si > 7 = | E WO : é õ o jo | elo : ; sº E 8 - sê. : : s8o|E p ed.
: Ss 38 . À : E E |E à 2 EEE : o : 28 e E E EEE ê 8/8. 89 | 80 O a S : E 28 8 8 sã FERE à xo S o E 8 8 os 93 SE SS ko 8/8. S 88 SEE o 2 ESTES sUTgiasdo: : o 8 : É PE E 5 $/ o o & SS E o EÇç Ê E | FE E Sds: E 2 |£ s o els 5454545 Ê Ê : si) E 2 3 ão ê 2 FE SS É JêÊ E dê É - 3 |: ó o ? KR s : ; 3 : o : ; À o Pr 2 8
É
Ss 2o
SE go alESE 12 |8 = Oo S/S So 8 Õ a ago
IES
DA EJ$o o o
E Is E) O DIO q DO = = Oo SS So o lo EgE RX [21 ale sã e CX em jo |m 2 o=-
SP E o DD) >
TZ Á o
EN : ss . 215 < : . | e o 3 o o Ss 8sE E = 5 O 6 6,8 o $1'&E 8|s = o as 218 oJO E Te Te o a = E E ke) SE 8 8/8 3 f&S [o%/ odio &
FESSICADIADIA SS ls I&NSSSSS? E E dE IS SE SIS 344 45SE ELE [É TE TES - Ss Fr = o 2 [2 2 |O = le | = Nn jo & s o Pr 2 o
Ê
EXEMPLO 16 - Redução e Controle de População de Fago Usando Cepas Variantes CRISPR-modificadas Neste Exemplo, experimentos conduzidos para determinar a ca- pacidade de uma cepa CRISPR-modificada para destruir fagos que foram S resistentes são descritos.
Em particular, experimentos foram desenhados determinar se uma população de fago será reduzida a um nível indetectável durante a fermentação de uma cepa CRISPR-modificada.
Em alguns experimentos, DGCC9836 (descrito no Exemplo 11 e na Figura 17) foi usada para realizar fermentação láctea na presença do fa- $ 10 go D2972, em comparação as fermentações feitas com a sua cepa parental DGCC7710 na presença de D2972. Meio de leite em pó dez por cento (p/v) foi semeado com aproximadamente 10º cfuml de uma pré-cultura da cepa testada e com 10” pfu/ml do fago D2972. A cultura foi incubada a 42ºC por : 24 h.
Em vários pontos de tempo, uma alíquota foi tomada e população de ii 15 fagofoimedida usando placa semeada de ágar em dupla camada semeada : com DGCC7710 usando métodos padrão conhecidos na técnica.
Os resulta- á dos são apresentados na Figura 20. Na fermentação de leite por DGCC7710, fago D2972 desenvolvido para alcançar uma população acima de 10º pfu/ml.
Ao contrário, durante a fermentação com DGCC9836, a popu- lação de fago D2972 gradualmente diminuiu a um nível muito baixo (120 Pfu/ml) após 6 horas da incubação, e foi quase inetectável após 24 horas de incubação.
Este último resultado sugere que fagos foram destruídos durante O processo de fermentação com a cepa variante DGCC9836. A propriedade de uma cepa variante de destruir fagos, bem co- mo não ser sensível aos fagos representa um benefício adicional, quando comparado com o programa de rotação de cultura iniciadora tradicional pelo qual as cepas não são sensíveis, mas são inofensivas aos fagos.
De fato, pelo uso de cepas variantes, a erradicação de fagos latentes ocorrerá pela combinação da lavagem dos fagos (quanto à rotação usando cultura inicia- — dora tradicional) e de destruição dos fagos.
Em outros experimentos, cepas variantes apresentando alguma mas incompleta resistência ao fago D2972 foram associadas na fermentação láctea na presença de D2972. Cepas de variantes selecionadas incluíram WTpriagr2 ** e WI pnieg72" 2, como descrito no Exemplo 8 e na Tabela 7-1. Estas cepas exibem reduções de EOP do fago D2972 de aproximadamente 8 logs. Fermentações lácteas foram realizadas como descrita acima (taxa de inoculação bacteriana de 10º cfu/ml; taxa de inoculação de fago de 107 pfu/ml). As fermentações lácteas foram feitas com WTpnizgr2* 2º ou com WT- pnico7a* PE! ou uma mistura das duas cepas. Em vários pontos de tempo, a população de fagos foi registrada. Com esta finalidade, uma alíquota foi to- mada e a população de fago foi medida usando placa semeada de ágar de dupla camada com WTpnizez2"*?º ou com WTpnize72"*2!, usando métodos pa- drão conhecidos na técnica. Os resultados são apresentados na Figura 21, que indica a adição de fagos detectados em WTpnize72** e em WI pnica72* 2! para cada uma das fermentações lácteas. Quando uma cepa única foi usada ã para a fermentação (WTpnizer2"*?º ou WTphniaa72**), o número de fagos detec- “15 tadosnotempo de inoculação foi aproximadamente 100 pfu/ml (devido aos 5 : logs da redução de EOP). Sobre o cultivo, este número de fagos aumentou a ó 10º ou 107 (respectivamente), correspondente a uma multiplicação dos fagos de 4 a 5 logs. O fator de multiplicação dos fagos foi muito mais baixo (2 logs) para a fermentação de leite inoculada com 2 cepas. De fato, o número de fagos aumentou de 100 píuíml a um máximo de aproximadamente 10º Pfu/ml. Estes resultados conclusivamente mostram que durante uma cocultu- ra de 2 cepas variantes a taxa de propagação dos fagos é significativamente reduzida comparada com a taxa de propagação dos fagos em uma cultura feita com cepas variantes únicas.
EXEMPLO 17- Inserção de Espaçadores Neste Exemplo, métodos e composições usadas para inserir dois espaçadores em S. thermophilus DGC7710 são descritos. A cepa de S. thermophilus DGCC7710 (depositado na "Coleção Naciona de Micro- organismo" francesa sob o número CNCM 1-2423) possui pelo menos 3 loci de CRISPR: CRISPR1I, CRISPR2 e CRISPR3. Em cepas CNRZ1066 e LMG18311, das quais a sequência genômica completa é conhecida (Vide, Bolotin et al., [2004], supra), CRISPR1 está localizada no mesmo locux cro-
mossômico: entre str0660 (ou stu0660) e stro661 (ou stuo661) (Vide, Figura 18). Na cepa DGCC7710, CRISPR1 também está localizada no mesmo /o- Cux cromossômico, entre genes altamente similares.
CRISPR1 da cepa DGCC7710 contém 33 repetições (incluindo a repetição terminal), e dessa forma 32 espaçadores (Vide, Figura 19). Todos estes espaçadores são dife- rentes um do outro.
A maioria destes espaçadores não foi anteriormente descrito como sendo dentro dos loci de CRISPR, mas quatro espaçadores perto do reboque de CRISPR1 são idênticos as CRISPRI espaçadoras co- nhecidas.
Por exemplo, o 28º espaçador de DGCC7710 é 100% idêntico ao — 31º CRISPRI espaçadora da cepa CNRZ1575 (número de acesso no Gen- bank DQ072991); O 30º espaçador de DGCC7710 é 100% idêntico ao 27º CRISPRI espaçadora da cepa CNRZ703 (número de acesso no Genbank DQO072990); o 31º espaçador de DGCC7710 é 100% idêntico ao 28º CRIS- ' PRI espaçadora da cepa CNRZ703 (número de acesso no Genbank ; 15 —DQ072990); e o 32º espaçador de DGCC7710 é 100% idêntico ao 30º CRISPRI espaçadora da cepa CNRZ703 (número de acesso no Genbank ] DQ072990). A sequência de CRISPR1 (5-3) da cepa DGCC7710 é mostra- da em SEQ ID NO:678, abaixo: caaggacagttattgattttataatoactatgtgggtatasaaacgtcasaatttoatergas GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgtttgacagesasteaagattegaategt STTTTTGTACTCTCANGATTTAAGTAACTGTACAACAatgacgaggagetatragoacaactraca GTTTTIGTACTCTCAAGATITAAGTARCTGTACAACcgatttgacaatetgctgaccactgtrate GTTTTIGTACTCTCAAGATTTAAGTAACTGTACAACaCacttggoaggcrrattacteaacagega GSTTTTTGTACTCTCAAGATITAAGTAACTGTACAACCEgrtectegttotttegregratetetro GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACrtcattcttocogttttegtttgogaáteot GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgctggogaggaaacgaa caaggcctcaaça GTTTTTGTACTCTCAMGATTTANGTAACTGTACAACCAtagagtggaaaactagaaacagattoas GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACatantgccgttganattacacggcaaggtoa GTTTTTGTACTCTCANGATTTANGTAACTGTACAACgagegagetoganatastettaattacaao STTTTTGTACTCTCAAGATTTAAGTAACTGTACAACgttegctagegtcatgrggraacgrattta GTTITTGTACTCTCAAGATTTAAGTAACTGTACAACggegtcccaatectgattaatacttactog GTTTTTGTACTCTCAAGATTTAAGTAACIGTACAACaacacageaagacaagaggatgatgctato GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcgacacaaganogtatgcaagagttoaas GTTTTTGTACTCTCANGATTTANGTAACTGTACAACacaattcttcatcoggtaactgctcaagto GTTTTTGTACTCTCAMGATTTAMGTAACTGTACAACaattaagogcatagenagegagacaacato GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACCgatatrraamatoatrttoataactecat GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACJCagtatcagcangeaagetgttagttact GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACAtaaactatgaaattrratamtetetaaça GTTTTTGTACTCTCANGATTTAAGTAACTGTACAACaataatttatggtatagcttaatatoatrg GTTTTTOTACTCTCAAGATTTAMGTAACTGTACAACtgcategageaegttogagttrtacegerto GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtctatategaggtcaactascaattatoct GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatcgttcamattctgrrttaggtacatet GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatcaatacgacaagagrtamaatagrert GTTTTTGTACTCTCANGATTTANGTAACTGTACAACgcttagctgtecaatecacgascegtagaro GTTTTTGTACTCTCAAGATTTAMGTAACTGTACAACcaaccaacggtaacagetactttitacage GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACatanctgaaggataggagettgtamagtet GTTTTTGTACTCTCANGATTTAAGTAACTGTACAACtaatgctacatotcaaaggatgatcccage
GTTTTTGTACTCTCAAGATTTAMGTAACTGTACAACaagtagttgatgacototacaatggtttar GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacctagaageatttgagegratattgatro STTTTTGTACTCTCAAGATTTAMGTAACTGTACAACaattttgcccrtetttgcocottgacrag GTTTTTGTACTCTCAAGATTTAMGTAACTGTACAACaccattageaatostrtggeceatigagt
GTTTTTGTACTCTCAAGATTTAAGTANCTGTACAGT Tegattcaacataaamegccagttonatrgaacteggorot (SEQ TD NO:678) D858, o fago usado nestes experimentos é um bacteriófago que pertence à família de vírus Siphoviridae. Sua sequência genômica foi com- pletamente determinada, aparentemente continua a ser publicada. Este fago é virulento para a cepa de S. thermophilus DGCC7710. A cepa de S. ther- mophilus DGCC7778 foi isolada como um mutante natural resistente ao fago usando DGCC7710 como a cepa parental, e o fago D858 como fago virulen- to. A CRISPR1 da cepa DGCC7778 contém 35 repetições (incluindo a repe- tição terminal), e dessa forma 34 espaçadores. Quando comparada à se- —quência CRISPRI de DGCC7710, a sequência CRISPR1 de DGCC7778 possui dois novos espaçadores adicionais, adjacentes (e naturalmente duas : repetições adicionais que flanqueiam os novos espaçadores) em uma ex- tremidade do /ocux de CRISPR (isto é, próximo ao líder). Todos os outros Á espaçadores do locux de CRISPR1 estão inalterados. A sequência de . 15 —CRISPR1 (5-3) da cepa DGCC7778 é mostrada em SEQ ID NO:679, abai- xo: Caaggacagttattgatttrataatcactatgtgggrataaaaacgtcaaaatttoattegag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACANCCaacacattcascagattaatgaagantao GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtCcactcacgtacaaatagrgagtatacte SGTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgtttgacagenaatoaagattegaategt GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatgacgaggagetattagcacaactraca GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACCgatttgacaatetgetgacescrgttate GTTTTIGTACTCTCAAGATTTAAGTAACTGTACAACacacttggcaggottattactcaaçagega GTTTTTGTACTCTCANGATTTAAGTAACTGTACAACCtgttccregrtertetgetatatetttto GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAMCttcattetteegtetttgttegegaatectr GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACGCtggcgagganacgaacaaggectoaaca GTTITTGTACTCTCAAGATITAAGTAACTGTACAACCatagagtggamaactagaaacagattcas GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACataatgcogttgaattacacggcaaggtoca GTTITTGTACTCTCAAGATTTAAGTAACTGTACAACgagogagetogaaatastcttaatracaas GTTITTGTACTCTCAAGATTTAAGTARCTOTACAACgttcgctagegteatatagtamegtatrta GTTTTIGIACTCTCAMGATTTAAGTAACTGTACAACggogtcccaatectgattaatacttactog GTTTTTGTACTCTCANGATTTAAGTAACTGTACAACa&CcACAgCca Agnosagaggatgatoctato GTTTTTGTACTCTCANMGATTTAAGTAACTGTACANCCgacacaagaacgtatoacaagagttoaag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACacaattottcatecggraactgetcaages GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaattaagggcatagaaagggagacaacato GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACcgatatttaamatcattttcataacttcat GTTTTTGTACTCTCAAGATTTAAGTANACTOTACAACgcagtatcageaagoaagetgttagttact GTTTTTGTACTCTCAMGATTTAAGTANCTGTACAACAtaaactatganatrtrtatastetttaaga GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaataatttatggtatagcttaatatoattg GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtgcatogagencgtregagrttacegttte STTTTTGTACTCTCAAGATTTAAGTAACTGTACAACtctatategaggtcaaçtaacaattatgor GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaatcgttoamattcrgtrotaggracatet GTTTTIGTIACTICTCAAGATTTAAGTAACTOTACAACaatcaatacgacaagagttamaatogtett GTTTTTGTACTCTCAMGATTTAAGTAACTOTACAACgcttagetgtecastecacgaacgtoagato GTTTTIGTACTCTCAMGATTTAAGTAACTOTACAACCAACCaMCggTaacagetactretracage STTTTTGTACTCTCAAGATTTAAGTAACTGTACAACatanctgaaggataggagcttgtaaageot SGTITTIGTACTCTCAAGATTTAAGTAACTOTACAACtaa tgctacatctcanaggatgatoccaga GTTTTTGTACTCTCAAGATTTAAGTAACTGTACANCaagtagttgatgacctotacaatogettat GTTTTTGTACTCTCAAGATTTAAGTANCTGTACAACacctagaagoatttgagogratatrgates GTTTTTGTACTCTCAAGATTTAAGTAACTGTACANMCa&t ttegececttctrtgecatigactag GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACaccattageaateatttgtgeccattgagt
GTTTTTGTACTICTCANGATITAAGTAACTGTACAGT Ttgatteascatamamagecagtteaattgaacttggoettt (SEQ ID NO:679)
No caso de DGCC7778 o primeiro espaçador (5"- caacacattcaacagattaatgaagaatac-3'; SEQ ID NO:680) e o segundo espaça- dor (S'-tecactcacgtacaaatagigagtgtacto-3; SEQ ID NO:681) constituem a E marcação específica para a cepa que identifica esta cepa marcada. Foi de- terminado que a sequência de ambos os novos espaçadores existe dentro do genoma do fago D858. Sequência do segundo novo espaçador é encon- trada entre posições 25471 e 25442 bp (isto é, na fita menos) do genoma de D858, com uma incompatibilidade (96,7% de nucleotídeos idênticos em mais de 30 nucleotídeos): Espaçador 2 1 tecactcacgtacaaatagtgagtotacte 30 (SEO ID NO:681) VEEULEEEEErEEEErE rr Dese 25471 tecactcacgtacaaatagtgagegtacte 25442 (SEQ ID NO:686) A sequência do primeiro espaçador é encontrada entre as posi- ções 31481 e 31410 bp (isto é, na fita mais) do genoma de D858 (100% de . nucleotídeos idênticos em mais de 30 nucleotídeos): - Espaçador 1 1 cancacattcaacagattaatgaagaatac 30 (SEQ 1D NO:3)
E VEN P DESE 3148] caacacattcaacagattaatgaagaatac 31410 (SEQ ID NO:687) Embora não seja destinado que a presente invenção seja limita- da a qualquer mecanismo nem teoria particular, é contemplado que dois no- vos espaçadores presentes no locux de CRISPR1 de DGCC7778 foram ne- cessários para conferir à cepa DGCC7778 uma nova resistência ao fago D858. O espaçador "2" (como encontrado em DGCC7778) foi primeiro inse- —ridono/ocuxde CRISPR1 de DGCC7710 (33 repetições e 32 espaçadores), em uma extremidade deste Jfocux de CRISPR, em conjunto com uma repeti- ção. Esta inserção deu origem a um mutante insensível a bacteriófago (cepa intermediária), marcada por este novo espaçador adicional (dessa forma car- regando 34 repetições e 33 espaçadores). Este espaçador foi derivado do genoma de D858, mas um erro de replicação ou erro de transcrição reversa provavelmente ocorreu durante o processo de inserção, levando a uma mu- tação pontual. Devido à combinação imperfeita (isto é, a incompatibilidade 1) entre este espaçador recentemente adquirido e a sequência direcionada pe- lo fago, a eficiência da resistência desta cepa intermediária ao fago D858 foi baixa.
Um segundo evento de inserção de espaçador ocorreu nesta cepa intermediária (mais resistente ao fago D858 do que a cepa parental DGCC7710, mas não totalmente resistente por causa da incompatibilidade), levando à inserção de um segundo novo espaçador (isto é, espaçador "1" como encontrado em DGCC7778) na mesma extremidade de locux de CRISPR1, em conjunto com uma repetição.
Esta segunda inserção deu ori- gem a um novo mutante insensível a bacteriófago , que foi isolado e deno- minado DGCC7778. DGCC7778 é mais resistente ao D858 do que a cepa intermediária, e naturalmente muito mais resistente que a cepa parental : 10 — DGCC7710, devido à presença do espaçador "1", que é 100% idêntico à sequência direcionada pelo fago.
EXEMPLO 18 - Método para Marcação de DGCC7710 e Seleção da Cepa Marcada DGCC7778 ' Neste Exemplo, métodos usados para marcação de DGCC7710 E * 15 e seleção da cepa de DGCC7778 marcada são descritos.
A cepa : DGCC7710 foi infectada/desafiada pelo fago D858 pela inoculação em leite i pasteurizado com a cepa DGCC7710 em aproximadamente 2.10º cfu/ml e com fago D858 a aproximadamente 1.105 pfu/ml.
O leite inoculado foi culti- vado por 12 horas a 35ºC.
Após incubação, as bactérias viáveis (isto é, a- —quelas que são provavelmente mutantes insensíveis a bacteriófago) foram isoladas em meio não-seletivo (placas de ágar leite) a 35ºC, usando uma diluição apropriada da cultura infectada.
Um isolado denominado DGCC7778 foi propagado em meio de líquido M17-glicose a 35ºC e seu DNA foi extraído usando um protocolo de extração de DNA Clássico, como conhecido na téc- nica.
O extrato de DNA foi amplificado usando PCR como conhecido na técnica (Vide, por exemplo, Bolotin et al. [2005], supra) usando combina- ção de um iniciador de senso (yc70 e/ou SPIDR-a montante [5'- g9TCTTTAgAAACTRgACACC]; SEQ ID NO:674) e de um iniciador de antis- senso (yc31 e/ou SPIDR-a jusante [5 TAMACAgAgCC TCCCTATCC]; SEQ ID NO:675). A sequência dos produtos PCR foi determinada e comparada com aquela do /ocux de CRISPR de DGCC7710.
EXEMPLO 19 - Produção de uma Segunda Cepa Marcada Neste Exemplo, métodos usados para produzir uma segunda cepa marcada são descritos. A cepa de S. thermophilus DGCC7710-RH1 foi isolada como um mutante natura! resistente ao fago usando DGCC7710 co- moacepa parental e fago D858 como o fago virulento.
A CRISPR1 da cepa DGCC7710-RH1 contém 34 repetições (in- cluindo a repetição terminal), e dessa forma 33 espaçadores. Quando com- parada com a sequência de CRISPR1 da cepa de S. thermophilus DGCC7710, a sequência de CRISPR1 da cepa de S. thermophilus — DGCC7710-RH1 possui um novo espaçador adicional (isto é, sequência de direcionamento) (e naturalmente uma repetição adicional que flanqueia o novo espaçador) em uma extremidade do locux de CRISPR (isto é, próximo ao líder, na extremidade 5' do /ocux de CRISPR). Todos os outros espaça- : dores do /ocux de CRISPR1 são inalterados. A sequência CRISPR1 (5-3) . 7 15 dacepaDGCC7710-RH1 é: Caaggacagttattgattttataatcactatgrogorataaaaacgroaaaatttoatttgas GTTTTIGTACTCTCAAGATTTAAGTAACTGTACAACtcaacaattgcaacatettatascocactt EE AEE " Ergtttgacagcaaatoaagattogaatege - TTITTOTA CTA vv ” é Itgacgaggagetateggcacaacttaca ENGESA ESSILBAISA gatttgacaatetgoctgaccactgrrato PITITTGTA A 1 cacttogcaggcttattacteaacagega , A tgttectegrecrrtegengratcritoo p [ASS ENT toatectrcogrttrtgtetgogaatect 7 7 EAETCtggcgaggaaacgaacaaggoctoaaca 7 TTI T catagagtggaaaactagenacagattocas õ .. ERA taatgccgttgaattacacggcaaggtca 1 " ATA E gagogagetegaaataatettaatracaag 1 A ARDA gttegetagegteatgtagtascgtattta es A ggcgrecoantectgatraatacttactog TTGT ja icacagcaagacaagaggatgatgctato ESSA A a E NAN 2d gacacaagaacgtatocaagagttcaso ca ' Sos caattcttcateeggtaactgcteaages y pI " Attaagggcatagamagggagacaacçato DELES DIC gatatttamaatcatteteatamerteat " | Iocagtatcagcaagoaagetgtrtagtrtaçt 1 E taRactatgaasattttataatttttaaça NES i caarATaS ataatttatggtatagettaatateatts SEN T gecategageacgttegagtttacegsttto LISOS EESEAAS pó ctatategsggreaactaacaattatgct AR Seero . Fo Iatcgttcasatectgectrtaggeacatrt ES iatcaatacgacaagagetaaeatógtert . " R . Mssccttagctgtccaatocacgaacgtggato 2 ' 1 aaccascggtaacagctactttttacagt Rn SELITTOIHOTOTOAATATETE aatgctacatcteaaaggatgatoccaga e TTRACRTT - Es agragttgatgacetotacaatogettat ES RCA EE 1 icctagaagcattrgagegratattgatto SUS SEIA TS ó 7 x tttegecccttattigeecottgactag E Ú (AN p fé 'ccattagcaatcatttgtgcccattgagt
GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAGT Ttgattoaacatamaaagecagttoaatregaacrtggotrtt (SEO ID NO:682) A sequência líder é Ss caaggacagttatigatittataatcactatgtaggtataaaaacgtcaaaatiteatttgag 3(SEQ
ID NO: 688). A sequência integrada (GTTTTTGTACTCTCAAGATTT AAGTAACTGTACAACtcaacaattgcaacatecttataacecactt; SEQ ID NO:689) é mostrada em cinza, compreendendo a Repetição de CRISPR (caixa alta) e uma CRISPR espaçadora (isto é, sequência de narcação), que é mostrada em caixa baixa.
A repetição terminal (5' gtttttatactctcaagatttaagtaactgtacagt 3 (SEQ ID NO0:3)) sequência reboque: S'ttgatticaacataaaaagccagttcaatigaacttggcttta' (SEQ ID NO:691) são mostra- das. f 10 Consequentemente, em caso da cepa de S. thermophilus DGCC7710-RH1. o espaçador (5'-teaacaattgcaacatcttataacccactt-3, SEQ ID NO:534) constitui a sequência de direcionamento específica para a cepa que identifica esta cepa mutante (isto é, a bactéria marcada). A sequência do ' novo espaçador (isto é, sequência de direcionamento) existe dentro do ge- : * 15 noma de fago D858.A sequência espaçadora é encontrada entre posições . 31921 e 31950 bp (isto é, na fita mais) do genoma de D858 (e tem a identi- f dade de 100% à sequência genômica de D858 em mais de 30 nucleotídeos): Espaçador 1 tcaacaattgcaacatcttatamcccactt 30 (SEQ ID NO:534) DESSES 731921 ILMILISUMLILLALIZIE 31950 (SEQ ID NO:534) O novo espaçador (isto é, sequência de direcionamento) que estáintegrado no locux de CRISPR1 da cepa de Streptococcus thermophilus DGCC7710-RH1 confere a esta cepa uma nova resistência ao fago D858. EXEMPLO 20 - Produção de uma Terceira Cepa Marcada Neste Exemplo, métodos usados para produzir uma terceira ce- pa marcada são descritos.
A cepa de S. thermophilus DGCC7710-RH2 foi isolada como um mutante natural resistente ao fago usando a cepa de S. thermophilus DGCC7710 como a cepa parental, e fago D858 como o fago virulento.
A CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 contém 34 repetições (incluindo a repetição terminal), e dessa forma 33 espaçado- res.
Quando comparada à sequência de CRISPR1 da cepa de S. thermophi- us DGCC7710, a sequência de CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 possui um novo espaçador adicional (isto é, sequência de direcionamento) (e naturalmente uma repetição adicional que flanqueia o novo espaçador) em uma extremidade do /ocux de CRISPR (isto é, próximo ao líder, na extremidade 5' do /ocux de CRISPR). Todos os outros espaça- dores de locux de CRISPR1 são inalterados.
A sequência CRISPR1 (5'-3') de cepa DGCC7710-RH2 é: caaggacagttattgattttataatcactatgtoggtatamaaacgtcaasatrtoattigag STTTTTGTACTCTCANGATTTAAGTAACTGTACAACttacgrtegamaagaatatcamatcaatga ETA Nº o A gtttgacagcaaatcaagattogaatege x TEN TTTRASO ELES IAtgacgaggagertatreggoacaacrtaca EM eta pao Cestas ves 'gatttgacaatotgctgacoacrgtrate Ei EE NAS END CNAE SA ESA TA Wit Ú tgtteceregetotetegregeatetttto [Se Buss EAAS ESTAS tcatrettecegrreragretgogaatoct ao TRA Ebert HESEANDANS Ctogogaggaaacgaacaaggoctoanca >) TAB E catagagtggasaactagaaacagattcas : rs OE. TAC Itaatgcogttgaattaçacageaaggtoa E A ELA : PeNlcagegagctogaaataatottaattacaag ara NES rt pttogctagcegrcatgtggtaacgtattta iu EX TEN Igcgtccoaatoctgattastacrtactog 7 TAR icacagcaagacasgaggatgetgctato . p Ta s GACACAMGAMCAtatgcamgagrtoaag Eis | s px. attcttcatcoggtaactgctoaageg fo “E o ttaagggcatagaaagggagacaacato 17 à E. S cgatatttaaaatcattttcataacttcat = Sã , A Iacagtatcageaageaagetgttagttact ' D . o Iitaaactatgaaattttataatttttaaça - ES) à ETA 3. taatttatggratagcttaatatcatto " TT EA tgcategageacgt togagtttacegrete TT Dara ator ARENAS v VA + atatogagatoaactaacaattatgot ' bu J às TAI Â Itegttcaaattetgtetraggtacattt EE) essa ET GS Itcaatacgacangagttaanatogectt R A ea: . à TA : MCcttagetgrocaatocacgaacgtogato TTI pv Ê PV EST - ICEARACggtamcagetacrttrracage ie ó E E t Itaactgaaggataggagettgtaaageot Eu) sã NA ó Itgctacatctcaaaggatgatcocaga 2a igtagttgatgacctctacaatógtttat T « A 1 icctagaageatttgagegtatattgatto TI Ness 2 TARA . tttegeeectretttigececttgactag pes TOTONKO TTAR T iccattagcaateatttgtgecoattgagt
GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAGT Ttgattcaaçatamaaagccagrtoaategaacttogettt (SEQ ID NO:684) A sequência líder é 5' caaggacagttattgattttataatcactatgtgggtataaaaacgitcaaaatiteatttgag 3' (SEQ IDNO:688).
A sequência integrada (GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACttacgtttgaaaagaatatca aatcaatgat SEQ ID NO:694) é mostrada em cinza, compreendendo uma Re- petição de CRISPR (caixa alta) e uma CRISPR espaçadora (isto é, sequên- —ciade direcionamento), que é mostrado em caixa baixa.
A repetição terminal (5' gtttttgtactctcaagatttaagtaactgtacagt (SEQ ID NO:3)) sequência reboque: 5'ttgattrcaacataaaaagecagttcaatigaacttagettta' (SEQ ID NO:691) são mostradas.
Dessa maneira, no caso da cepa de Streptococcus thermophilus DGCC7710-RH2, o espaçador (5-ttacgtttgaaaagaatatcaaatcaatga-3'; SEQ ID NO:697) constitui uma marcação específica para a cepa que identifica esta cepa mutante (isto é, bactéria marcada). A sequência do novo espaçador foi mostrada existindo dentro do genoma de fago D858. A sequência espaçado- ra é encontrada entre posições 17215 e 17244 bp (isto é, na fita mais) do genoma de D858 (e tem identidade de 100% à sequência genômica D858 em mais de 30 nucleotídeos): Espaçador 1 ttacgtttgaaaagaatatcaaatcaatoa 30 (SEO ID NO:697) Desa 27215 CLACSUCEgaNDAGaATACCANALOAACIA 17244 (SEQ ID NO:698) O novo espaçador integrado ao locux de CRISPR1 da cepa de S. thermophilus DGCC7710-RH2 confere uma nova resistência ao fago D858 à cepa de S. thermophilus DGCC7710-RH2. f EXEMPLO 21 - Construção do Fago "de escape de CRISPR" a partir de Va- E ã riantes Bacterianas Resistentes ao Fago Neste Exemplo, métodos da construção de fagos de escape de F CRISPR são descritos.
As variantes hospedeiras resistentes ao fago são primeiro construídas como descrito nos Exemplos acima.
Nestes experimen- tos, uma cepa parental "A" é exposta ao fago "P" e uma variante resistente ao fago (Variante "A1.0") selecionado.
A variante A1.0 é analisada (por e- xemplo por PCR, e/ou sequenciamento de DNA) para confirmar a presença de um espaçador inserido adicional dentro de um locux de CRISPR.
A se- quência nucleotídica do espaçador adicional (Espaçador Sp1.0) então é de- terminada.
Tipicamente, espaçador Sp1.0 é um fragmento de aproximada- mente 30 nucleotídeos em tamanho a partir do fago P, e fornece resistência aofagoP e fagos relacionados ("fagos relacionados" são aqueles contendo a sequência espaçadora em seus genomas e define uma família de fagos). Independentemente da primeira exposição ao fago, a mesma cepa parental A é exposta ao mesmo fago P e uma segunda variante resis- tente ao fago (Variante A2.0) é selecionada.
A variante A2.0 é selecionado a fim de também ter um espaçador adicional inserido (Espaçador Sp2.0) den- tro de um /ocux de CRISPR mas com a sequência espaçadora Sp2.0 sendo diferente daquela do espaçador Sp1.0. Tipicamente, espaçador Sp2.0 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fa- go P, e fornece a resistência ao fago P e fagos relacionados. Similarmente em algumas modalidades, variantes A3.0 a variantes Ax.O. são geradas pela — exposiçãoda mesma cepa À ao mesmo fago P. Todas as variantes "A" são selecionadas a fim de também ter um espaçador adicional inserido (Espaça- dor Sp3.0 a Spx.0) dentro de um /ocux de CRISPR mas com a sequência de todos os espaçadores "Sp" sendo diferentes de cada um dos outros. Tipica- mente, espaçadores de "Sp" são fragmentos de aproximadamente 30 nucle- —otídeos em tamanho a partir do fago P, e todos fornecem resistência ao fago P e fagos relacionados.
Tipicamente, pode ser estimado que o nível de resistência será aproximadamente aquele de uma mutação única que ocorre dentro do ge- noma do fago na sequência correspondente ao espaçador (isto é, aproxima- : * 15 damente10*a10). Dessa forma, fago que escapa da resistência mediada por CRISPR são fáceis de isolar. Os fago mutados são gerados através da f exposição da variante A1.0 ao fago P. Tipicamente, o fago "de escape de CRISPR" mutado (P1.0) abriga pelo menos uma mutação dentro do seu ge- noma correspondente à sequência do espaçador Sp1.0 (por exemplo, dele- ção(ões), mutação(ões) pontual(ais), etc.) Ou em algumas modalidades pre- ; ferenciais, a região flanqueadora Sp1.0, mais ou menos 20 bp correspon- dente ao motivo de CRISPR. A variante A1.0 seria sensível ao fago P1.0. Similarmente, variantes resistentes ao fago P independentemente geradas (Variante A2.0, A3.0 a Ax.O0) que abriga espaçadores únicos (Sp2.0, Sp3.0 a Spx.O, respectivamente) são do mesmo modo desafiados com o fago P para gerar os fagos mutantes correspondentes (P2.0, P3.0 a Px.0, respectiva- mente). Subsequentemente, um grupo de fagos mutantes virulentos, cujos genomas foram especificamente mutados em uma sequência esperada para ser uma CRISPR espaçadora, pode ser gerado. De fato, o fago D2792 representa um fago de biocontrole total- mente virulento contra a cepa de S. thermophilus DGCC7710 (WT). Ao con- trário, a análise do /ocux de CRISPR de cepas relacionadas WITpnizo72*,
WTpnizo72**, WTpnizo72*S, WTpnize72"! e WITpniza72**, indicam a presença de uma sequência espaçadora que é similar as sequências encontradas no fago D2972 que indicam que o fago D2972 virulência reduzida sobre estas cepas. Dados de plaqueamento (Vide, Tabela 7-1) confirmam a virulência reduzida do fago D2972 nestas cepas. Com relação à cepa WTpnizaz2*, que foi caracterizada por ser resistente ao fago D2972 devido à presença de uma CRISPR espaçadora correspondente, a seleção de fagos relacionados a D2972 para total virulência aumentada identifica fagos D4724 e D4733 como agentes candidatos como agentes de biocontrole (Vide, Tabela 7-1 ).
Em experimentos adicionais, a cepa DGCC7710 foi exposta ao fago D2972 para gerar a variante resistente WTpniza72* Quando a cepa WT- pnizaz2a** foi exposta ao fago D2972, foi possível isolar o fago mutante, tal como D4724. Foi encontrado que este fago D4724 era totalmente virulento - sobre DGCC7710 e WTpnizez2"** em uma segunda iteração, WTpniza72" foi . 15 exposto ao fago D4724, para gerar a variante resistente WITphicg72 SS oniazes SS sobre a exposição desta cepa a D4724, os fagos mutantes foram identifica- Fr dos, tais como D4733, que são totalmente virulentos em relação à DGCC7710 e WTphizer2"**. Em algumas modalidades, as iterações sucessi- vas são usadas para gerar o fago com o nível desejado de virulência.
Exemplos de mutantes de fago adicionais são fornecidos na Fi- gura 13. Nesta Figura, o fago mutante 858-A e 858-B derivado do fago pa- rental D858 são mostrados. As mutações correspondem ao espaçador SI de WTO8S58+S1S2 desafiado com o fago D858.
Ainda em exemplos adicionais, mutantes de fago totalmente vi- —rulentos onde a mutação é identificada no motivo de CRISPR são mostrados na Tabela 20-1. Nesta Tabela, as sequências nucleotídicas de fagos de tipo selvagem e mutantes que correspondem aos espaçadores recentemente adquiridos pelas cepas de S. thermophilus são mostradas. O motivo AGAAW está destacado em cinza. Cada mutação está em negrito e sublinhada. *, indica uma deleção. Esta Tabela fornece sequências das variantes de CRISPR resistentes ao fago e pares de mutantes de fago virulentos: DGCC7710ress**Nago 2972.83C, DGCC77 102972" É/fago 2972.84A ou fa-
go 2972.S4C, DGCC77 1012972" /Nfago 2972.S6A, e DGCC77 1052672 ness"**/fago 858.S32A ou fago 858.S32D. Nesta Tabela, O novo espaçador corresponde a SEQ ID NO:535 (DGCC77 101856”) Tabela 20-1. Sequências Nuciectídicas de Fagos de Tipo Selvagem e Mutante que Correspondem a Espaçadores recentemente Adquiridos pelas Ce-pas de S. thermophilus Fonte. Segura uso use e TSEQIDNO: | [a mA E NO: NO:7126 NO" NO:730
AEE E AEE TTACGTTTGAAAAGAATATCAAATTAATGG GRGARAG NO:731 836 | TTACGTTTGAAAÃG: ITCAAATTAATGACOAGA) SEQ E soar aaa ae er an ir [oem mea asred Sa A ao aa pa o CEE 52 o f 2972,54D | CTCAG ACTGGTGAACOGGTTTCAATTGAAAA A, EQ [o o eo | ErereorrAcreoTeANceSOTTTAATTCAMAAAAA qNESa pr rele rn ti ata ar ana Ee a Err Ea Tar a ae forr peer a SS RN Ana ra E [ETTA NO: [Ca IO NO: a o fo e nen ana e OR re eo fere reter bo, gomes ra oa na NaN, E ae ae A MENTOOAADATOATOTANAAATT — [5EO lo o [o ea Ja pa ea fãs Ee ar AS cara aaa eae ee Eee E [REI aa TaaAAAT TA o fee mano NO:706 5 .
EXEMPLO 22 - Fago de Segundo Nível "de escape de CRISPR" Neste Exemplo, experimentos para construção de fagos de es- cape de CRISPR de segundo nível (isto é, com múltiplas mutações dirigidas a múltiplos espaçadores) são descritos.
Por um processo iterativo de criação das variantes resistentes ao fago CRISPR-mediada seguidas pelo isolamento dos fagos mutados ("escape de CRISPR") capazes de superar o mecanismo cas-CRISPR, é possível para criar fagos que têm "pré-adaptados" com múltiplas mutações contra a resistência CRISPR-mediada potencial.
Em algumas modalidades, as variantes de segundo nível são produzidas pelo isolamento de um fago mutado através da exposição da va- riante A1.0 ao fago P. Tipicamente, este fago mutado (fago P1.0) tem uma mutação (deleção, mutação pontual, etc.) no seu genoma dentro da região . contendo a sequência espaçadora Sp 1.0 ou dentro da região flanqueadora de Sp1.0, mais ou menos 20 bp correspondente ao motivo de CRISPR. A E variante A1.0 é sensível ao fago P1.0. Dessa forma, a variante A1.0 é expos- : ta ao fago P1.0 e um variante resistente ao fago (Variante A1.1) selecionada (Vide, Figura 15). A variante A1.1 é também selecionada tal que tenha um espaçador adicional inserido (Espaçador Sp 1.1) dentro de um /ocux de —CRISPR mas com a sequência espaçadora Sp1.1 sendo diferente daquela ' dos espaçadores Sp1.0, Sp2.0 a Spx.0. Tipicamente, espaçador Sp1.1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho do fago P1.0, e fornecerá a resistência ao fago P1.0 e fagos relacionados. Variante Al.1 é resistente ao fago P1.0 e preferencialmente, tem uma resistência aumentada aofagoP por causa do acúmulo de espaçador Sp 1.0 e Sp 1.1. Em modalidades adicionais, um fago recentemente mutado (fago P1.1) é gerado através da exposição da variante A1.1 ao fago P1.0. Dessa maneira, sobre a exposição da variante A1.1 ao fago P 1.1 uma nova varian- te A1.2 é obtida que contém um novo espaçador adicional (Sp1.2). Este es- —paçador fornece resistência ao fago P 1.1 e preferencialmente aumenta a resistência ao fago P1.0 e P (isto é, devido ao acúmulo de espaçadores Sp1.0, Sp1.1, Sp1.2). O fago P1.1 é totalmente infectante em relação à cepa parental A, bem como as variantes A1.0e A1.1.
Ainda em modalidades adicionais, diferentes espaçadores (por exemplo, 2, 3 ou 4) são iterativamente acumulados dentro da cepa A através da variante A1, então variante A1.1, então variante A1 .2, etc. para obter uma variante altamente resistente ao fagos (variante Al.n). Ainda em modalidades adicionais, diferentes espaçadores adicionais podem ser acumulados na mesma cepa através da variante A2, então variante A2.1, então variante A2.2, etc. para gerar outra variante da cepa A altamente resistente aos fagos : (variante A2.n) em paralelo. A nesma estratégia encontra uso com variantes A3.0aAxo.
Após um processo iterativo de criação de variantes de CRISPR resistentes ao fago e isolamento do fago mutante "de escape de CRISPR" (por exemplo, a exposição da variante A1.1 ao fago Pl.1 cria nova variante i A1.2 que contém um novo espaçador adicional (Sp1.2) a partir do qual um bi 15 fago mutante é isolado (P1.2) que é totalmente virulento na variante A1.2, ee A1.1, A1l.0 e cepa parental A.
Em algumas modalidades, mutações combinatórias são acumu- ladas por construção iterativa de variantes bacterianas combinando diferen- tes espaçadores (por exemplo, Sp2.0. Sp3.0 a Spx.0), exposição ao fago mutante de primeiro nível correspondente (P2.0, P3.0 a Px.O), e isolamento Í de fagos mutantes de segundos nível.
Um exemplo de mutações combinatórias iterativas que criam variantes de CRISPR resistentes ao fago e fago mutante "de escape de CRISPR" é mostrado na Tabela 22-1. Esta tabela fornece uma lista de novos —espaçadores encontrados em CRISPR1 e a região correspondente em fagos 2972, 858, ou DT1. Nesta Tabela, o "a" indica regiões de DNA que são 100% idênticas entre os fagos 858 e 2972. A "Posição 5" refere-se à posi- ção protoespaçadora 5' no genoma de fago. Nucleotídeos sublinhados e sombreados na sequência do protoespaçador indicam incompatibilidades entreofagoeoespaçador. Um asterisco (*) indica uma deleção. Na "Região 3' Flanqueadora" indica a sequência 3' flanqueadora no genoma de fago. Incompatibilidades no motivo AGAAW são sublinhadas e sombreadas em cinza.
Na coluna denominada "Fita/Módulo", os módulos de transcrição são "E" (genes precocemente expressos); "M" (genes expressos medialmente); e "L" (genes tardiamente expressos).
& ? - 2 g ai |
ELE EE c E EE Elos. EE ERG: ER : gs z : SEE NECÉGN ileEE É SRINERAEHEE dC ERRRREGRR Mphshhkshh:SkEREREEE iz E jm + S > K je j ir TITI TT, NE TRSSIEEAGES Ae CEEE ER GEE ÁgEME RE AE À HÁ 1 Eb EEAEEFE SERRAS A SSSAA 1 des : MERCEARIA A A OE . É id E PE a NS RE RL HW : Í :ESPRRECEERPERENEEE : RR RBESGBNEREGSPRERGENÃE
ESRSRKENERGNESERES é 6 E ”» - | 8 E
É É EEBNBENEREFE
SE GR SRERERBESB A EERREEE lis ERG BEREPSENEENSS : i o Es RN Rs dis & EE NS SIS É TE 3h Blu É eo IS 4 SOSESIO RE RD EIS RM EIS ela MRSÍS Ed BE Sis 9 E SE Gio do 2 | Nafgageio ESirosoE ol paia oba õ Haia ale i RRESERE AESA RS No EENSR RS RARA AE RE Ra (OE Elebhehhhhbhhhhhkhhahhk Hs Ud bERAEREEERARRS BEER bEEEFEREREREER RR ek h db, LL LLLLLELEbLEbSbh
TE $ EE) E LL] E ls! fes Bei ei:
PRRRAEERRERERR — BkEEkEEBERESEL| lo Se E Bee ; lts No Eclda said Gle Ale ada SHdls alo eoso/ tools a < fc E m ". ERGERSSEERSEE > GBEEEAESERSEA EE EE ESERELC| sao ee): Rd BAtseaes 1 E (E ejo És aos e <S/5 2/8 2/2 2/5 2 é e ERRERERERERERL| Bhbbbbhhbkbkebh]
DGCC7710 foi exposta ao fago 2972 para criar variante de CRISPR resistente ao fago DGCC7710r52672** da qual o fago mutante de escape de CRISPR 2972.S6B foi gerado. Exposição de DGCC7710r2972* ao fago 2972.S6B criou a variante de CRISPR resistente ao fago S —DGCC7710n2972 52972566 “e da qual o fago mutante de escape de CRISPR
2972.S20A foi isolado. Em algumas modalidades, cepas que são resistentes a mais de uma família de fagos são fornecidas. Como uma dada cepa pode ser sensível a mais de uma família de fagos, em algumas modalidades, se é desejado aumentar a resistência de cepa a múltiplas famílias de fago pela introdução de espaçador(es) adi- cional(is) dentro de um locux de CRISPR que se origina de outras famílias de fagos (Vide, Figura 16). Por exemplo, fagos P, Q, e R são fagos repre- É E sentativos das três famílias de fagos capazes de infectar a cepa A. Usando o e 15 método delineado acima e neste pedido, as variantes resistentes às três fa- f mílias de fago são produzidas. Em algumas modalidades, o fago P é usado Á para gerar a variante A1º (contendo espaçador Sp1) que é resistente ao fago P. Então, a variante A1º é exposta ao fago Q e uma variante resistente ao fago (variante A1ºº) é selecionada. A variante A1ºº tem um espaçador adi- cional (Sq1) inserido dentro de um /ocux de CRISPR. Tipicamente, espaça- dor Sq1 é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago Q, e fornece resistência ao fago Q e fagos relacionados. A variantes A1º”º é resistente a ambos os fagos P e Q. A seguir, a variante A1Pº é exposta ao fago R e uma variante resistente ao fago (Variantes A1º*) é selecionada. A variante A1º* tem um terceiro espaçador adicional (Sr1) inse- rido dentro de um /ocux de CRISPR. Tipicamente, Srt é um fragmento de aproximadamente 30 nucleotídeos em tamanho a partir do fago R, e também fornece resistência ao fago R e fagos relacionados. A variante A1º“ é resis- tente a todos os três fagos. Em algumas modalidades particularmente prefe- renciais, a variante é também resistente aos fagos relacionados. Estes fagos de escape de CRISPR encontram uso como fagos de biocontrole/terapêuticos. Como descrito acima, pelo processo de criação de variantes resistentes ao fago CRISPR-mediada, exposição ao fago e o isolamento do fago de "escape de CRISPR" virulento, uma mistura de espé- cies de fago que abrigam mutações simples e/ou múltiplas dirigidas contra sequências genômicas de fago simples e/ou múltiplas que são alvos das —CRISPR espaçadoras potenciais é gerada.
Como bactérias hospedeiras alvo podem ficar resistentes ao fago pela incorporação de espaçadores únicos ou múltiplos e aquele mecanismo Cas-CRISPR pode ser superado por uma mu- tação dentro do genoma do fago correspondente a tais espaçadores, o uso de uma mistura de fago abrigando várias mutações reduz a taxa de uma bactéria individual para adquirir novos espaçadores e proliterar com suces- so.
Em uma modalidade adicional, análises das regiões protoespa- gadoras e flanqueadoras, como determinados para os espaçadores nas va- É riantes de CRISPR resistentes ao fago correspondentes, facilita a identifica- . É 15 ção do motivo de CRISPR para uma CRISPR específica.
No exemplo de fr variantes CRISPR1 resistentes ao fago DGCC7710 contendo espaçadores Á SI a S33, foram gerados após desafio com o fago 2972 ou 858. Alinhamento das regiões protoespaçadoras e flanqueadoras, a partir do genoma de fagos 2972 ou 858 que correspondem aos espaçadores S1 a S33, usando o pro- grama de computador Clustal X, identificou-se o motivo de CRISPR1 como NNAGAAW (SEQ ID NO:696), e é visualizado usando WebLogo (Figura 22). Em um exemplo adicional, variantes de CRISPR 3 resistentes ao fago foram derivadas de DGCC7710 após desafio com os fagos 858 e 3821, e LMD-9 após desafio com o fago 4241. Alinhamento da região protoespa- —çadoras e flanqueadoras dos respectivos genomas dos fago com os espa- çadores correspondentes das respectivas variantes de CRISPR3 resistentes ao fago, identificou o motivo CRISPR3 como NGGNG (SEQ ID NO:723) (Fi- gura 23). A análise para presença de um motivo de CRISPR específico fornece meios para identificar a posição de protoespaçadores putativos den- tro de um genoma ou outra sequência especificada (por exemplo, um plas- mídeo ou outro elemento genético móvel). No exemplo de fagos sequencia-
dos 858, 2972 e DT1, a análise da distribuição do motivo de CRISPR1 A- GAAW identificou a posição de protoespaçadores potenciais dentro dos res- pectivos genomas. Utilizando a degeneração do código genético e/ou o uso de substituições de aminoácido cConservativas, cada motivo AGAAW foi eli- minado no processo de sintetizar quimicamente um genoma como descrito para o fago DX174, como conhecido na técnica. Dessa maneira, o fago tor- na-se insensível ao sistema Cas-CRISPR1 de resistência. Dessa maneira, uma molécula de DNA, destituída de motivos CRISPR específicos é insensí- vel ao sistema Cas-CRISPR correspondente.
Estes fagos e "coquetéis" de múltiplos tipos de fago encontram uso em estratégias de rotação (por exemplo, definida a administração se- quencial de fago). Como uma extensão do uso de um coquetel simples, composto de um fago abrigando diferentes mutações espaçadoras, em al- À gumas modalidades, múltiplos fagos virulentos, cada um abrigando uma mu- . À 15 taçãono espaçador diferente de uma maneira sequencial definida são usa- Er dos. Por exemplo, usando conjunto de fagos "de escape de CRISPR" (P1.0, E P2.0 e P3.0, ou P1.0, PI.1, PIl.2 ou alguma combinação dos mesmos), cada fago é aplicado individualmente e em uma sequência e rotação definida (P.10> P2.0> P3.0> P1.0, P2.0> etc.) para minimizar a probabilidade das bactérias alvo desenvolverem resistência ao fago CRISPR-mediada. Do mesmo modo, um conjunto de coquetéis de fago (isto é, cada fago dentro do coquetel bem como cada coquetel possui uma combinação única de muta- ções) encontra uso na sequência e rotação. Em algumas modalidades, o fago e/ou coquetel é compreendido de uma família única de fago, enquanto em outras modalidades, o fago e/ou coquetel é compreendido de múltiplas famílias de fago. EXEMPLO 23 - Combinações Funcionais Este Exemplo fornece várias combinações funcionais que en- contram uso na presente invenção. Por meio de exemplo somente, as se- — guintes combinações funcionais podem ser usadas conforme a presente in- venção. Combinação Funcional Nº 1:
Sequências de cas: SEQ ID NO:461 a SEQ ID NO:465 e SEQ ID NO:473 a SEQ ID NO:477 (todas as quais são sequências de S. thermophi- lus), como apresentadas abaixo: SEQ ID NO:461:
ATGAGTGACTTAGTTTTAGGACTTGATATCGGTATAGGTTCTGTTGGTGTAGGTATCCTTAAC AAAGTGACAGGAGAAATTATCCATAAAAACTCACGCATCTTCCCAGCAGCTCAAGCAGAAA ATAACCTAGTACGTAGAACGAATCGTCAAGGAAGACGCTTGACACGACGTAAAAAACATCG TATAGTTCOGTTTAAATCGTCTATTTGAGGAAAGTGGATTAATCACCGATTITACGAAGATTT CAATTAATCTTAACCCATATCAATTACGAGTTAAGGGCTTGACCGATGAATTGTCTAATGAA GAACTGTTTATCGCTCTTAAAAATATGGTGAAACACCGTGGGATTAGTTACCTCGATGATGC TAGTGATGACGGAAATTCATCAGTAGGAGACTATGCACAAATTGTTAAGGAAAATAGTAAA CAATTAGAAACTAAGACACCGGGACAGATACAGTTGGAACGCTACCAAACATATGGTCAAT TACGTGGTGATTTTACTGTTGAGAAAGATGGCAAA AA ACATCGCTTGATTAATGTCTTTCCA ACATCAGCTTATCGTTCAGAAGCCTTAAGGATACTGCAAACTCAACAAGAATTTAATCCACA GATTACAGATGAATITATTAATCGTTATCTCGAAATTITAACTGGAAAACGGAAATATTATC ATGGACCCGGAAATGAAAAGTCACGGACTGATTATGGTCGTTACAGAACGAGTGGAGAAACT TITAGACAATATTITTGGAA TTCTAATTGGGAAA TGTACATTTTATCCAGAAGAGTTTAGAG CAGCAAAAGCTTCCTACACGGCTCAAGAATTCAATTTGCTAAATGATTTGAACAATCTAACA GTTCCTACTGAAACCAAAAAGTTGAGCAAAGAACAGAAGAATCAAATCATTAATTATGTCA AAAATGAAAAGGCAA TGGGGCCAGOGAAACTTITTTAAATATATOGCTAAGTTACTTTCITGT GATGTTGCAGATATCAAGGGATACCGTATCGACAAATCAGGTAAGGCTGAGATTCATACTIT CGAAGCCTATCGAAAAATGAAAACGCTTGAAACCTTAGATATTGAACAAATGGATAGAGAA ACGCTTGATAAATTAGCCTATGTCTTAACATTAAACACTGAGAGGGAAGGTATICAAGAAG ' CCTTAGAACATGAATTTGCTGATGGTAGCTTTAGCCAGAAGCAAGTTGACGAATTGGTTCAA TTCCGCAAAGCAAATAGTTCCATTTTTOGAAAAGGATGGCATAATTTTTCTGTCAAACTGAT L GATGGAGTTAATTCCAGAATTGTATGAGACGTCAGAAGAGCAAATGACTATCCTGACACGA : CTTGGAAAACAAAAACGACTTCGTCTTCAAATAAAACAAAATATITCAAATAAAACAAAAT
ATATAGATGAGAAACTATTAACTGAAGAAATCTATAATCCTGTTIGTTGCTAAGTCTGTTCGC h CAGGCTATAAAAATCGTAAATGCGGCGATTAAAGAATACGGAGACTTTGACAATATTGTCA
TCGAAATGGCTOGTGAAACAAATGAAGATGATGAAAAGAAAGCTATTCAAAAGATTCAAAA . AGCCAACAAAGATGAAAAAGATGCAGCAATGCTTAAGGCTOCTAACCAATATAATGGAAA GGCTGAATTACCACATAGTGTTTTCCACGGTCATAAGCAATTAGOGACTAAAATCCGOCTTT GGCATCAGCAAGGAGAACGTTGCCTTTATACTGGTAAGACAATCTCAATCCATGATTTGATA AATAATCCTAATCAGTTTGAAGTAGATCATATTITACCTCTTTCTATCACATTCGATGATAGC CTTGCAAATAAGGTTTTGGTTTATGCAACTGCTAACCAAGAAAAAGGACAACGAAÇACCTT ATCAGGCTTTAGATAGTATGGA TGATGCGTGGTCTTTCCGTGAATTAAAAGCTTTTGTACGT GAGTCAAAAACACTTTCAAACAAGAAAAAAGAATACCTCCTTACAGAAGAAGATATITCAA AGTTTGATGTTCGAAAGAAATTTATTGAACGAAATCTTGTAGATACAAGATACGCTTCAAGA GTTGTCCTCAATGCCCTICAAGAACACTTTAGAGCTCACAAGATTGATAÇAAAAGTTTCCOGT GGTTCGTGGCCAATTTACATCTCAATTGAGACGCCATTGGGGAA TTGAGAAGACTCGTGATA CTTATCATCACCATGCTGTOGATGCATTGATTATTGCCGCCTCAAGTCAGTTGAATTTGTGGA AAAAACAAAAGAATACCCTTGTAAGITATTCAGAAGAACAACTCCTTGATATTGAAACAGG TGAACTTATTAGTGATGATGAGTACÇAAGGAATCTGTGTTCAAAGCCCCTTATCAACATTTTG TTGATACATTGAAGAGTAAAGAATTTGAAGACAGTATCITTATTCTCATATCAAGTGGATTCT AAGTTTAATCOGTAAAATATCAGATGCCACTATTTATGCGACAAGACAGGCTAAAGTGGGAA AAGATAAGAAGGATGAAACTTATGTCTTAGGGAAAATCAAAGATATCTATACTCAGGATGG TTATGATGCCTTTATGAAGATTTATAAGAAGGATAAGTCAAAATTCCTCATGTATCGTCACO ACCCACAAACCTTTGAGAAAGTTATCGAGCCAATTTTAGAGAACTATCCTAATAAGCAAAT GAATOGAAAAAGGAAAAGAGGTACCATGTAATCCTTTCCTAAAATATAAAGAAGAACATGGC TATATTCGTAAATATAGTAAAAAAGGCAATGGTCOCTGAAATCAAGAGTCTTAAATACTATO ATAGTAAGCTTTTAGGTAATCOCTATTGATATTACTCCAGAGAATAGTAAAAATAAAGTTGTC TTACAGTCATTAAAACCTTGGAGAACAGATGTCTATTTCAATAAGGCTACTGGAAAATACGA AATCCTTGGATTAAAATATGCTGATCTACAATTTGAGAAAGGGACAGGAACATATAAGATT TCCCAGGAAAAATACAATGACATTAAGAAAAAAGAGGGTGTAGATTCTGATTCAGAATTCA AGTTTACACTTTATAAAAA TGATTTGTTACTCGTTAAAGATACAGAAACAAAAGAACAAÇA GCTTITCCGTTTTCTTTCTCGAACTITACCTAAACAAAAGCATTATGTTGAATTAAAACCTTA TGATAAACAGAAATTTGAAGGAGGTGAGGCGTTAATTAAAGTGTTGGGTAACGTTGCTAAT GGTGGTCAATGCATAAAAGGACTAGCAAAATCAAATATTTCTATTTATAAAGTAAGAACAG ATGTCCTAGGAAATCAGCATATCATCAAAAATGAGGGTGATAAGOCTAAGCTAGATITITA ATATTAATTGTTAGAAAGTGTTGCAATTATAGTTATCATATGCTATAATAATCGTGTAAGGG ACGCCTTACACAGTTACITAAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGOOGAAATC AACACCCTGTCATTITATGGCAGGGTGTTTTCGTTATTTAAAGAGGAGAAGAAATGACTTGG AGAGTTGTACATGTCAGTCAAAGTGAGAAGATGCGCTTAAAGCTTGATAACTTATTAGTGCA AAAAATGGGACAAGAGTTTACGGTGCCACTAAGTGATATTTOGATAATCGTTGCAGAAGGT GGGGATACAGTTGTTACCCTTCGTCTATTAAGTGCCTTAAGTAAATATAATATTGCCTTGGTC GTTTGTGATAACGAACATTTACCAACAGGAATTTATCACTCACAAAATGGGCACTTTAGAGC GTACAAGCGCTTGAAAGAACAGCTGGATTGGTCTCAGAAACAAAAGGACAAGGCATGGÇA GATTGTAACTTATTATAAAATCAATAACCAAGAGGATGTTCTAGCCATGTTTGAAAAAAGTC TGGACAACATTAGATTACTTTCAGACTATAAAGAGCAGATAGAACCTGGTGATAGAACGAA TAGAGAGGGACATGCTGOCAAGGTCTACTITAATGAGCTCTITGGTAAACÇAATITGTCAGAG TAACTCAGCAAGAAGCTGATGTCATCAATOCTGGTTTAAACTATGGCTATGCTATCATGAGG GCTCAGATGGCTAGAATAGTGGOGGGTTATGGTTTAAATGGCCTATTAGGAATCTTCCATAA AAATGAATACAATCAGTTTAATTTGGTTGACGATTTGATGGAGCCATTTAGACAGATTGTAG ATGTTTGGGTATATGATAATCTACGAGATCAGGAATTOCTTAAGTATGAGTATAGGTTGGGA TTGACAGATITTACTCAATGCTAAAATCAAATATGGCAAAGAGACTTGCTCAGTGACAGTTGC TATGGACAAATATGTCAAAGGCTTTATCAAATATATTTCGGAAAAAGATAGTAGTAAATITC ACTGCCCAGTGGTATCAAGTTTAGAGTGGAGAAAATAAGATGAGGTATGAAGCATTGAGAT TATTATGTTTTTTTGATTTACCAATGGAATCCAAGGATGAAAAAAGAA TATATCGTAATTIT CGTAAAGAATTAATTICAAATGGGTTTGAAATGTTACAATTTTCGGTCTACTATOGCACTTGT CCTAATAGAAGCTTTGCAAATAAATTTTATAAGAAGTTAAAGATTAGCAATCTTCCTGCTGG GAATGTGAGACTTTTGGCAGTTACTGAAAAACAATTTTCAGAGATGACATTAATTATAGGTG GTAAAACTAAGCAAGAAGAAATCGTCAGTGATAATAAGTTGGTGGTTATATGAAATATTTT GTACAACATCCTTACAAAGAACGTATTGAATTAAATATTGGTGCAATCACACAAATTGTTGG TCAGAATAAAGAACTCAAATATTATATTTGGCAAATTTTGAGCTGGTATTTTGGCGGAAA AA ' AATACTCAAGTGAGGACTTAAGTATTTTTGATTATGAGGAACCTACTATACTTGATGAGTCT " GGAGAAATAGTGAAGCGAAGTAGCTATCACTATATCOGACATTTCAAGTTITAAGGATTTACT GGAGCAGATGGAATACAAGAAAGGAACACTTGCTCAGGGTTACCTTAGTAAAATTCTCAAT - CAGGTTGATATTGTAGGCCATTTGGAGAAAATTAATGAACAAGTAGAGCTTATAGAAGGAG - CAATGAATCAGCATATAAACTTAAACTGTGGTCAGGTGGAGTACCATTTGGAGAATCACOCT
CTAACACTAGACCAATTACTTTCAAAAAATTTTAGTCCCTTTTTTGCTATCGAGAATAAGAA | TTTATCTTTTGAA TGGGTTTCAAATACTGATAAACTTTCTCTCTTTCTAGAAATGTTAGACOG - CCTTCTGTCACAAACAACAGAGAAGTATCTCATTGTGCTAAAAAATATTGATGGCTITATCT
CAGAAGAATCTTATACTATTTTTTATAGGCAAATCTGTCATCTGGTCAAGAAGTATCÇAAAT CTAACCTTTATTTTGTTTCCTAGTGACCAAGGCTATTTAAAAATTGATGAAGAAAATAGTAG GTTCGTCAATATTTTATCTGACCAGGTGGAGCATTTGTATGATGTTGAGTTTATGTATGAAA GAGTAATGAAATATTATCCAAGTAATGATTTTCCGACGAGAGAAGGTTTTAGGATGTCTTTA GAAACTGTGACACCTTATTTATTGACAAAAATGCTGAGACAACCTAGTCTCTCACTTGTTGA
TTCÇAGTAATATTGAATATCCTAAATCAGTTGTTTCATTTTAGTTACCGTATAAGATATTCTCA GACACCTGATAAGGAACTATTACATAAATTTTTAGAAAGTAAGGATTGA (SEQ ID NO:461) SEQ ID NO:462:
ATGAGTGACTTAGTTTTAGGACTTGATATCGGTATAGGTTCTGTTGGTGTAGGTATCCTTAAC AAAGTGACAGGAGAAATTATCCATAAAAACTCACGCATCTTCCCAGCAGCTCAAGCAGAAA ATAACCTAGTACGTAGAACGAA TOGTCAAGGAAGACGCTTGACACGACGTAAAAAACATCG TATAGTTCGTTTAAATCOGTCTATTTGAGGAAAGTGGATTAATCACOGATTTTACGAAGATTT CAATTAATCTTAACCCATATCAATTACGAGTTAAGGGCTTGACCGATGAATTGTCTAATGAA GAACTGTTTATCGCTCTTAAAAATATGGTGAAACACCGTGGGATTAGTTACCTCGATGATGC TAGTGATGACGGAAATTCATCAGTAGGAGACTATGCACAAATTGTTAAGGAAAATAGTAAA CAATTAGAAACTAAGACACCGGGACAGATACAGTTGGAACGCTACCAAACATATGGTCAAT TACGTGGTGATTTTACTGTTGAGAAAGATGGCAAAAAACATCGCTTGATTAATGTCTTTCCA ACATCAGCTTATCGTTCAGAAGCCTTAAGGATACTGCAAACTCAACÇAAGAATTTAATCCACA GATTACAGATGAATTTATTAATOGTTATCTOGAAATTTTAACTGGAAAACGGAAATATTATO ATGGACECGGAAATGAAAAGTCACGGACTGATTATGGTCGTTACAGAACGAGTGGAGAA AC TTTAGACAATATTTTTGGAATTCTAATTGGGAAA TGTACATTTTATCCAGAAGAGTTTAGAG CAGCAAAAGCTTCCTACACGGCTCAAGAATTCAATTTGCTAAATGATTTGAACAATCTAAÇA GTTCCTACTGAAACCAAAAAGTTGAGCAAAGAACAGAAGAATCAAATCATTAATTATGTCA AAAATGAAAAGGCAA TGGGGCCAGCGAAACTTTTTAAATATATCGCTAAGTTACTITCTTGT GATGTTGCAGATATCAAGGGATACCGTATCGACAAATCAGGTAAGGCTGAGATTCATACTIT CGAAGCCTATCGAAAAATGAAAACGCTTGAAACCTTAGATATTGAACAAATGGATAGAGAA ACGCTTGATAAATTAGCCTATGTCTTAACATTAAACACTGAGAGGGAAGGTATTCAAGAAG CCTTAGAACATGAATTTGCTGATGGTAGCTTTAGCCAGAAGCAAGTTGACGAATTGGTTCAA TTCCGCAAAGCAAATAGTTCCATTTTTGGAAAAGGATGGCATAATTTTTCTGTCAAACTGAT GATGGAGTTAATTCCAGAA TTGTATGAGACGTCAGAAGAGCAAATGACTATCCTGACACGA CTTGGAAAACAAAAACGACTTCGTCTTCAAATAAAACAAAATATTTCAAATAAAAÇAAAAT ATATAGATGAGAAACTATTAACTGAAGAAATCTATAATCCTGTTGTTGCTAAGTCTGTTCGC CAGGCTATAAAAATOGTAAATGCGGCGATTAAAGAATACGGAGACTTTGACAATATTGTCA TCGAAATGGCTCGTGAAACAAATGAAGATGATGAAAAGAAAGCTATTCAAAAGATTCAAAA AGCCAACAAAGATGAAAAAGATGCAGCAATGCTTAAGGCTGCTAACCAATATAATGGAAA GGCTGAATTACCACATAGTGTTITCCACGGTCATAAGCAATTAGCGACTAAAATCCGCCTTT GGCATCAGCAAGGAGAACGTTGCCTTTATACTGGTAAGACAATCTCAATCCATGATTTGATA AATAATCCTAATCAGTTTGAAGTAGATCATATTTTACCTCTTTCTATCACATTCGATGATAGC CTTGCAAATAAGGTTTTGGTTTATGCAACTGCTAACCAAGAAAAAGGACAACGAACACÇOTT ATCAGGCTTITAGATAGTATGGATGATGOGTGGTCTTTOCGTGAATTAAAAGCTTITGTACGT GAGTCAAAAACACTTTCAAACAAGAAAAAAGAATACCTCCTTACAGAAGAAGATATTICAA AGTTTGATGTTCGAAAGAAATTTATTGAACGAAATCTTGTAGATACAAGATACGCTTCAAGA GTTGTCCTCAATGCCCTTCAAGAACACTTTAGAGCTCACAAGATTGATACAAAAGTTTCCGT GGTTCGTGGCCAATITACATCTCAATTGAGACGCCATTGGGGAATTGAGAAGACTCGOTGATA CTTATCATCACCATGCTGTCGATGCATTGATTATTGCCGOCTCAAGTCAGTTGAATTTGTGGA AAAAACAAAAGAATACOCTTGTAAGTTATTCAGAAGAACAACTCCTTGATATTGAAACAGG TGAACTTATTAGTGATGATGAGTACAAGGAATCTGTGTTCAAAGCCCCTTATCAAÇATTITG . TTGATACATTGAAGAGTAAAGAATTTGAAGACAGTATCTTATTCTCATATCAAGTGGATTCT AAGTTTAATCGTAAAATATCAGATGCCACTATTTATGCGACAAGACAGGCTAAAGTGGGAA " AAGATAAGAAGGATGAAACTTATGTCTTAGGGAAAATÇAAAGATATCTATACTCAGGATGG . TTATGATGCCTTTATGAAGATTTATAAGAAGGATAAGTCAAAATTCCTCATGTATCGTCACG ACCCACAAACCTTTGAGAA AGTTATCGAGOCAATTTTAGAGAACTATOCTAATAAGCAAAT GAATGAAAAAGGAAAAGAGGTACCATGTAATCCTITOCTAAAATATAAAGAAGAACATGGC TATATTOGTAAATATAGTAAAAAAGGCAA TGGTCCTGAAATCAAGAGTCTTAAATACTATG E ATAGTAAGCTTTTAGGTAATCCTATTGATATTACTCCAGAGAATAGTAAAAATAAAGTTGTC TTACAGTCATTAAAACCTTGGAGAACAGATGTCTATTTCAATAAGGCTACTGGAAAATACGA AATCCTTGGATTAAAATATGCTGATCTACAATTTGAGAAAGGGACAGGAACATATAAGATT TCCCAGGAAAAATACAATGACATTAAGAAAAAAGAGGGTGTAGATTCTGATTCAGAATTCA AGTTTACACTTTATAAAAATGATTTGITACTCGTTAAAGATACAGAAACAAAAGAACAACA GCTTITCOGTTTTCTTTCTCGAACTTTACCTAAACAAAAGCATTATGTTGAATTAAAACCTTA TGATAAACAGAAATTTGAAGGAGGTGAGGCGTTAATTAAAGTGTTGGGTAACGTTGCTAAT GGTGGTCAATGCATAAAAGGACTAGCAAAATCAAATATTTCTATITATAAAGTAAGAACAG
ATGTCCTAGGAAATCAGCATATCATCAAAAA TGAGGGTGATAAGCCTAAGCTAGATTTITA A(SEQ1ID NO:462) SEQ ID NO:463:
ATGACTTGGAGAGTTGTACATGTCAGTCAA AGTGAGAAGATGOGCTTAA AGCTTGATAACTT ATTAGTGCAAAAAATGGGACAAGAGTTTACGGTGCCACTAAGTGATATTTCGATAATOGCTTG CAGAAGGTGGGGATACAGTTGTTACCCTTOGTCTATTAAGTGCCTTAAGTAAATATAATATT GCCTTGGTCOGTTTGTGATAACGAACATTTACCAACAGGAATTTATCACTCACAAAATGGGACA CTITAGAGCGTACAAGCGCTTGAAAGAACAGCTGGATTGGTCTCAGAAACAAAAGGACAAG GCATGGCAGATTGTAACTTATTATAAAATCAATAACCAAGAGGATGTTCTAGCCATGTTTGA AAAAAGTCTGGACAACATTAGATTACTTTCAGACTATAAAGAGCAGATAGAACCTGGTGAT AGAACGAATAGAGAGGGACATGCTGCCAAGGTCTACTTTAATGAGCTCTTTGGTAAACAAT TTYGTCAGAGTAACTCAGCAAGAAGCTGATGTCATCAATGCTGGTTTAAACTATGGCTATGCT ATCATGAGGGCTCAGATGGCTAGAATAGTGGCGGGTTATGGTITAAATGGCCTATTAGOGAA TCTTCCATAAAAATGAATACAATCAGTIT, AATTTGGTTGACGATTTGATGGAGCCATTTAGA CAGATTGTAGATGTTTGGGTATATGATAATCTACGAGATCAGGAATTCCTTAAGT, 'ATGAGTA TAGGTTGGGATTGACAGATTTACTCAATGCTAAAA' ITCAAATATGGCAAAGAGACTTGCTCA
SGTGACAGTTGCTATGGACAAATATGTCAAAGGCTTTATCAAATATATITCGGAAAAAGATA GTAGTAAATTTCACTGOCCAGTGGTATCAAGTTT: 'AGAGTGGAGAAAATAA (SEQ ID NO:463) SEQ 1D NO:464: ATGAGGT; ATGAAGCATTGAGATTATTATGTTTTTTIGATITACCAATGGAATCCAAGGATGA
AAAAAGAATATATCGTAA TTTTCGTAAAGAATTAATITCAAATGGGTTTGAAATGTTACAAT
TTTCGGTCTACTATOGÇACTTGTCCTAATAGAAGCTTTGCAAATAAATTTTATAAGAAGITA AAGATTAGCAATCTTCCTGCTGGGAA TGTGAGACTTTTGGCAGTT, ACTGAAAAACAATTTTC AGAGATGACATTAATTATAGGTGGT, 'AAAACTAAGCAAGAAGAAA TCGTCAGTGATAATAAG TTGGTGGTTATATGA (SEQ TD NO:464) SEQ 1D NO:465: ATGAAATATTTTIGT, ACAACATCCTTACAAAGAACGTATTGAATTAAATATTGGTGCAATCAC ACAAATTGTTGGTCAGAATAAAGAACTCAAATATTATATTTGGCAAATTTT]GAGCTGGTATT $ TTGGCGGAAAAAAATACTCAAGTGAGGACTTAAGTATTTTTGATTATGAGGAACCT; ACTATA
CTTGATGAGTCTGGAGAAATAGTGAAGCGAAGTAGCTATCACTATATCOGACATTTCAAGTTT TAAGGATITACTGGAGCAGATGGAATACAAGAAAGGAACACTTGCTCAGGGTTACCIT, AGT AAAATTCTCAATCAGGTTGATATTGTAGGCCATTTGGAGAAAATTAATGAACAAGTAGAGC TTATAGAAGGAGCAATGAATCAGCATATAAACTT, AAACTGTGGTCAGGTGGAGTACCATTT GGAGAATCACCCTCT, AACACTAGACCAATTACTTTCAAAAAATTTTAGTCCCTTTTTTGCTAT CGAGAATAAGAATTTATCTTTTGAATGGGTTTCAAATACTGATAAACTTTCTCTCITICTAGA AATGTTAGACCGCCTTCTGTCACAAACAACAGAGAAGTATCTCATTGTGCTAAAAAATATTO ATGGCTTTATCTCAGAAGAATCTTATACTATTTTTTATAGGCAAATCTGTCATCTGGTCAAGA
AGTATCCAAATCTAACCTITATTTTGTTTCCTAGTGACCAAGGCTATTTAAAAATTGATGAA . GAAAATAGTAGGTTCGTCAATATTITATCTGACCAGGTGGAGCATTTGTATGATGTTGAGTT TATGTATGAAAGAGTAATGA, IAATATTATCCAAGTAATGATTTTCCGACGAGAGAAGGTTTTA SGGATGTCTITAGAAACTGTGACACCTTATTTATTGACAAAAATGCTGAGACAACCTAGTCT Cc - TCACTIGTTGATTCAGTAATATTGAATATCCTAAATCAGTTGTTTCATTITAGTTACCGT, ATA
AGATATTCTCAGACACCTGATAAGGAACTATTACATAAATTTITAGAAAGTAAGGATTGA il (SEQ ID NO:465) SEQ ID NO:473: ATGAGTGACTTAGTTTTAGGACTTGATATCGGT, ATAGGTTCTGTTGGTGTAGGTATCOCTTAAC
AAAGTGACAGGAGAAATTATCCATAAAAACTCACGCATCTTOCCAGCAGCTCAAGCAGAAA ATAACCTAGT, ACGTAGAACGAA TOGTCAAGGAAGACGCTTGACACGACGTAAAAAACATCOS TATAGTTCGTTTAAATCGTCT, ATTTGAGGAAAGTGGATTAATCACCGATTITACGAAGATITT CAATTAATCTTAACCCATATCAATTACGAGTTAAGOGCTTIGACCGATGAA' TTGTCTAATGAA GAACTGTITATCGCTCTTAAAA, ATATGGTGAAACACCGTGGGATTAGTTACCTOGATGATGC TAGTGATGACGGAAATTCATCAGTAGGAGACTATGCACAAATTGTTAAGGAAAATAGTAAA CAATTAGAAACT, AAGACACCGGGACAGATACAGTTGGAACGCTACCAAACATATGGTCAAT TACGTGGTGATTTITACTGTTGAGAAAGATGGCAAAAAACATCGCTTGATTAATGTCTTTCCA ACATCAGCTTATCGTTCAGAAGCCTT, AAGGATACTGCAAACTCAAÇAAGAATTTAATTCACA GATTACAGATGAATTTATTAATCGTTATCTCGAAATTTTAACTGGAAAACGGAAATATTATC ATGGACCCGGAAATGAAAAGTCACGGACTGATTATGGTCGTTACAGAACGAATGGAGAA AC TTTAGACAATATTTITGGAATTCTAATTGGGAAATGTACATTTTATCCAGACGAGTTTAGAG CAGCAAAAGCTTCCTACACGGCTCAAGAATTCAATTTGCTAAATGATITGAACAATCTAACA GTTCCTACTGAAACCAAAAAGTTGAGCAAAGAACAGAAGAATCAAATCATTAATTATGTCA AAAATGAAAAGGT;, AATGGGGCCAGCGAAACTTTTTAAATATATOGCTAA ATTACTTTCTTOT SGATGTTGCAGATATCAAGGGACACCGTATCGACAAA TCAGGTAAGGCTGAGATTCATACIT TCGAAGCCTATCGAAAAATGAAAACGCTTGAAACCTT, 'AGATATTGAGCAAATGGATAGAGA AACGCTTGATAAATTAGCCTATGTCITAACATTAAACACTGAGAGGGAAGGTATTCAAGAA GCTTTAGAACATGAATITTGCTGATGGTAGCTTTAGCCAGAAGCAAGTTGACGAATTGGTTCA ATTCCGCAAAGCAAATAGTTCCATTTTTGGAAAAGGATGGCATAATTTTTCTGTCAAACTGA TGATGGAGTTAATTCCAGAATTGTATGAGACGTCAGAAGAGCAAATGACTATCCTGACACG ACTTGGAAAACAAAAAACAACTTCGTCTTCAAATAAAACAAAATATATAGATGAGAAÁCTA TTAACTGAAGAAATCTATAATCCTGTTGTTGCTAAGTCTGTTOGCCAGGCTATAAAAATCGT AAATGCGGCGATTAAAGAATACGGAGACTTTGACAATATTGTCATCGAA ATGGCTOGTGAA ACAAATGAAGATGATGAAAAGAAAGCTATTCAAAAGATTCAAAAAGCCAACAAAGATGAA AAAGATGCAGCAATGCITAAGGCTGCTAACCAATATAATGGAAAGGCTUGAATTACCACATA SGTOTTTTCCACGGTCATAAGCAA TTAGOGACTAA AATCCGOCTTTGGCATCAGCAAGGAGAA CSTTGCCTTTATACTGGTAAGACAATCTCAATCCATGATTTGATAAATAATCCTAATCAGTIT GAAGTAGATCATATITTACCTCTTTCTATCACATTCGATGATAGCCTTGCAAATAAGGTTTTG STTTATGCAACTGCTAACCAAGAAAAAGGACAACGAACACCTTATCAGOCTTTAGATAGTA TGGATGATGCGTGGTCTTTCCGTGAATTAAAAGCTTTTGTACGTGAGTICAAAAACACTTTCA AACAAGAAAAAAGAATACCTCCTTACAGAAGAAGATATITCAAAGTTTGATGTTOGAA AGA AATTTATTGAACGAAATCTTGTAGATACAAGATACGCTTCAAGAGTTGTCCTCAATGCOCCTT CAAGAACACTITAGAGCTCACAAGATTGATACAAAAGTTTCCGOTGGTTCGTGGCCAATITAC ATCTCAATTGAGACGCCATTGGGGAATTGAGAAGACTCGTGATACTTATCATCACCATGCTG TCGATGCATTGATTATTGCOCGCCTCAAGTCAGTTGAATTTGTGGAAAAAACAAAAGAATACC CTTGTAAGTTATTCAGAAGAACAACTCCTTGATATTGAAAÇAGGTGAACTTATTAGTGATGA TGAGTACAAGGAATCTGTGTTCAAAGCOUCCTTATCAACATTITGTTGATACATTGAAGAGTA AAGAATTTGAAGACAGTATCTTATTCTCATATCAAGTGGATTCTAAGITTAATOGTAAAATA TCAGATGCCACTATTTATGCGACAAGACAGGCTAAAGTGGGAAAAGATAAGAAGGATGAA ACTTATGTCTTAGGGAAAATCAAAGATATCTATACTCAGGATGGTTATGATGCCTTTATGAA GATTYATAAGAAGGATAAGTCAAAATTCCTCATGTATCGTCACGACCCACAAACCTTTGAGA AAGTTATCGAGCCAATTITAGAGAACTATCCTAATAAGGAAATOGAATGAAAAAGGGAAAGA AGTACCATGTAATCCTTTCCTAAAATATAAAGAAGAACATGGCTATATTCGTAAATATAGTA AAAAAGGCAATGGTCCTGAAATCAAGAGTCTT, AAATACTATGATAGTAAGCTTITAGGTAA
TCCTATTGATATTACTCCAGAGAATAGTAAAAATAAAGTTGTCTTACAGTCATTAAAACCIT p GGAGAACAGATGTCTATTTCAATAAA AATACTGGTAAATATGAAATTTTAGGACTGAAATA
TGCTGATITACAATTTGAAAAGAAGACAGGAACATATAAGATTTCOCAGGAAAAATACAAT GGCATTATGAAAGAAGAGGGTGTAGATTCTGATTCAGAATTCAAGTTTACACTTTATAAA AA " TGATITGTTACTCGTTAAAGATACAGAAACAAAAGAACAACAGCTTITCCOGTTITCTITCIC
GAACTATGCCTAATGTGAAATATTATGTAGAGTTAAAGCCTTATTCAAAAGATAAATTTGAG 3 AAGAATGAGTCACTTATTGAAATTITAGGTTCTGCAGATAAGTCAGGACGATGTATAAAAG
GGCTAGGAAAATCAAATATITCTATITATAAGGTAAGAACAGATGTCCTAGGAAATCAGCA TATCATCAAAAATGAGGGTGATAAGOCTAAGCTAGATTTITAATATTAATTIGTTAAAAAAGT GTTGCAATTATAGTTATCATATGCTATAATAATCGTGTAAGGGACGCCTTACACAGTTACTT AAATCTTGCAGAAGCTACAAAGATAAGGCTTCATGCCGAAATCAACACCCTGTCATTTTATO GCAGGGTGTTTTCGTTATITAAAGAGGAGAAGAAATGACTTGGAGAGTTGTACATGTCAGTC AAAGTGAGAAGATGCGCTTAAAGCTTGATAACTTATTAGTGCAAAAGATGGGACAAGAGTT TACGGTGCCACTAAGTGATATTTCGATAATCGTTGCAGAAGGTGGGGATACAGTTGTTACCOC TTOGTCTATTAAGTGCCTTAAGTAAATATAATATTGOCTTGGTCGTTTGTGATAACGAACATT TACCAACAGGAATTITATCACTCACAAAATGGGCACTTTAGAGCGTACAAGCGCTTGAA AGA ACAGCTGGATTGGTCTCAGAAACAAAAGGAAAAGGCATGGCAGATTGTAACTTATTATAAA ATCAATAACCAAGAGGATGTCCTAGCCATGTTTGAAAAAAGTCTGGACAACATTAGATTAC TTTCAGACTATAAAGAGCAGATAGAACCTGGTGATAGAACGAATAGAGAGGGACATGCTGC CAAGGTCTACTTTAATGAGCTCTTTGGTAAACAATTTGTCAGAGTAACTCAGCAAGAAGCTG ATGTCATCAATGCTGGTTITAAACTATGGCTATGCTATCATGAGGGCTCAGATGGCTAGAATA GTGGCGGGTTATGGTTTAAATGGCCTATTAGGAATCTTCCATAAAAATGAATACAATCAGTT TAATTTGGTTGACGATTTGATGGAGCCATTTAGACAGATTGTAGATGTTTGGGTATATGATA ATCTACGAGATCAGGAATTCCTTAAGTATGAGTATAGGTTGGGA TIGACAGATTTACTCAAT GCTAAAATCAAATATOGCAAAGAGACTTGCTCAGTGACAGTTGCTATGGACAAATATGTCA AAGGCTITATCAAATATATTTCGGAAAAAGATAGTAGTAAATTTCACTGCCCAGTGGTATCA AGTTTAGAGTGGAGAAAATAAGATGAGGTATGAAGCATTGAGATTATTATGTTTTTTTGATT TACCAATGGAATCCAAGGATGAAAAAAGAATATATCGTAATTTICGTAAAGAATTAATITC AAATGGGTTTGAAATGTTACAATTTTCGGTCTACT, 'ATOGCACTTGTCCTAATAGAAGCTITGC AAATAAATTITATAAGAAGTTAAAGATGAGCAA TCTTCCTGCTGGGA ATGTGAGACTTITOG CAGTTACTGAAAMACAATTTTCAGAGATGACATTAATTATAGGTGGTAAAACTAAGCAAGA AGAAATCGTCAGTGATAATAAGTTGGTGATCATATGAAATTTTITGTACAACATCCTTACAA AGAACGTATTGAATTAAATATTGGTGCAATCACACAAATTGTTGGTCAGAATAATGAACTCA AATATTATACTTGGCAGATTTTGAGCTGGTATTTTGGTGGAAAAAAATACTCAAGTGAGGAC TTAAGTATTITIGATTATGAGGAGCCTACCATACTTGATGAGGCCAGAGAAATAGTGAAACG AAGTAGCTATCACT, ATATCGACATTTCAAGTTTTAAGGATTTACTGGAGCAGATGGAATACA AGAAAGGAACACTTGCTCAGGGTTACCTICGTAAAATTGTCAATCAAGTTGATATTGTAGGC CATITGGAGAAAATTAATGAACAAGTAGAGCTT, ATTGAAGAAGCTATGAATOGGCATATAA ACTTAAACTGTGGACAGGTAGAATACCATITGGAGAATCTCCCTCTAACACTAGACCAAÇTA CTCACAAAAAATTTTAGCCCATTTTTTGCCATTGAGAACAAGAATCTATCTITIGAATGGOTT TCTAATATTGATAAACT, ATOCCTCTITITAGAAA TGITTAGACCATCTTCTTTCACAAACAACA GAGAAGTATCTCATTGTGCTAAAAAATATTGATGGCTTITATCTCAGAAGAATCITATACTAT TTTITATAGGCAAATCTGTCATCTGGTCAAGAAGTATCCAAATCTAA CCTITATTITGTTTCC TAGTGACCAAGGCTATTTAAAAATTGATGAAGA, AAATAGTAGGTTCGTCAATATTTTATCTG ACCAGGTGGAACATTTGTATGATGTTGAGTTTATGTATGAAAGGGTAATOGAAATATTATCCA AGTAATGATTTTCCGACGAGAGAAGGTITTAGGATGTCTTTAGAAACTGTGACACCTTATTT
ATTGACAAAAATGCTGAGACAACCTAGTCTCTCACTTGTTGATTICAGTAATATTGAATATCC TAAATCAGCTGTTTCATITTAGTT, 'ACCGTATAAGATGTTCTCAGACACCTGATAAGGAACTA TTACAGAAATTTTTAGAAAGTAAGGATTGA (SEQ ID NO:473) SEQ ID NO-474:
ATGAGTGACTTAGTTTTAGGACTTGATATCGGTATAGGTTCTGTTGGTGTAGGTATOCTTAAÇ
AAAGTGACAGGAGAAATTATCCATAAAAACTCACGCATCTTCOCAGCAGCTCAAGCAGAAA ATAACCTAGT, ACGTAGAACGAATCGTCAAGGAAGACGCTTGAÇACGACGT: AAAAAACATCG fi TATAGTTCGTITAAATCGTCTATTTGAGGAAAGTGGATTAATCACCGATTTTACGAAGATTT CAATTAATCTTAACCCATATCAATTACGAGTT, 'AAGGGCTTGACCGATGAATTGTCTAATGAA Í GAACTGTTTATOGCTCTT, 'AAAAATATGGTGAAACACCGTGGGATTAGTT, ACCTOGATGATGC f TAGTGATGACGGAAA TTCATCAGTAGGAGACT, ATGCACAAATTGTTAAGGAAAATAGTAAA CAATTAGAAACT, AAGAÇACCGGGACAGATACAGTTGGAACGCTACCAAACATATGGTCAAT f TACGTGGTGATTITACTGTTGAGAAAGATGGCAAAAAACATCGCTTGATTAATGTCTTTCCA - ACATCAGCTTATCGTTCAGAAGCCTTAAGGA' TACTGÇAAACTCAACAAGAATITAATTCACA
GATTACAGATGAATTTATTAATCGTTATCTCGAA ATTTTAACTGGAAAACGGAAATATTATOC ATGGACOCGGAAATGAAAAGTCACGGACTGATTATGGTCGTTACAGAACGAATGGAGAAAC TTTAGACAATATTTITGGAATTCTAATTGGGAAA TGTACATTTTATCCAGACGAGTTTAGAG CAGCAAAAGCTTCCTACACGGCTCAAGAATTCAATITGCTAAATGATTTGAACAATCTAACA GTTCCTACTGAAACCAAAAAGTTGAGCAAAGAACAGAAGAATCAAATCATTAATTATGTCA AAAATGAAAAGGTAATGGGGCCAGCGAAACTTTTTAAATATATCGCTAAATTACTTTCITGE SGATGTTGCAGATATCAAGGGACACCGTATCGACAAATCAGGTAAGGCTGAGATTCATACTT TCGAAGCCTATCGAAAAATGAAAACGCTTGAAACCTTAGATATTGAGCAAATGGATAGAGA * AACGCTTGATAAATTAGCCTATGTCITAACATTAA, ACACTGAGAGGGAAGGTATTCAAGAA GCTTTAGAACATGAA TTTGCTGATGGTAGCTTTAGCCAGAAGCAAGTTGACGAATTGGTTCA ATTCCGCAAAGCAAATAGTTCCATTITTGGAAAAGGATGGCATAATTTTTCTGICAAACTGA TGATGGAGTTAATTCCAGAATTGTATGAGACGTCAGAAGAGCAAATGACTATOCTGACACG ACTTGGAAAACAAAAAACAACTTCGTCTICAAATAAAACAAAATATATAGATGAGAAACT, A TTAACTGAAGAAATCTATAATCCTGTTGTTGCTAAGTCTGTTCGCCAGGCTATAAAAATCGT AAATGCGGCGATTAA AGAATACGGAGACTTTGACAATATTGTCATOGAAATGGCTCGTGAA ACAAATGAAGATGATGAAAAGAAAGCTATTICAAAAGATICAAAAAGOCAACAAAGATGAA AAAGATGCAGCAATGCTTAAGGCTGCTAACCAATATAATGGAAAGGCTGAATTACCACATA GTGTTTTCCACGGTCATAAGCAATTAGCGACTAAAATCOGOCTTTGGCATCAGCAAGGAGAA EGTTGCCTITATACTGGTAAGACAATCTCAATOCATGATTTGATAAATAATCCTAATCAGTTT GAAGTAGATCATATTTTACCTCTTTCTATCACATTCGATGATAGCCTTGCAAATAAGGTTTTG GTTTATGCAACTGCTAACCAAGAAAAAGGACAACGAACACCTTATCAGGCTTTAGATAGTA TGGATGATGCGTGGTCTTTCCGTGAATTAAAAGCTTTITGTACGTGAGTCAAAAACACTTTCA AACAAGAAAAAAGAATACCTCCTTACAGAAGAAGATATTTCAAAGTTTGATGTICGAAAGA AATTTATTGAACGAAATCTIGTAGATAÇAAGATACGCTTCAAGAGTTGTCCTCAATOCCCTT CAAGAACACTITAGAGCTCACAAGATTGATACAAA AGTTTCOGTOGTTCGTGGCCAATITAC ATCTCAATTGAGACGCCATTGGGGAATTGAGAAGACTCGTGATACTTATCATCACCATGCTO TOGATGCATTGATTATTGCCGCCTCAAGTCAGTTGAATITGTGGAAAAAACAAAAGAATACC STTGTAAGTTATTCAGAAGAACAACTCOCTTGATATTGAAACAGGTGAACTTATTAGTGATGA TGAGTACAAGGAATCTGTGTTCAAAGOCCCTTATCAACATTITGTTGATACATIGAAGAGTA AAGAATTTGAAGACAGTATCTTATTCTCATATCAAGTGGATTCTAAGTTTAATOGTAAAATA TCAGATGCCACTATITATGCGACAAGACAGGCTAAAGTGGGAAAAGATAAGAAGGATGAA ACTTATGTCTTAGGGAAAA TCAAAGATATCTATACTCAGGATGGTTATGATGCCTITATGAA GATTTATAAGAAGGATAAGTCAAAATTCCTCATGTATCGTCACGACCCACAAACCTTTGAGA AAGTTATCGAGCCAATTTTAGAGAACTATCCTAATAAGGAAATGAATGAAAAAGGGAA AGA AGTACCATGTAATCCTTTCCTAAAATATAAAGAAGAACATOGCTATATTCGTAAATATAGTA AAAAAGGCAATGGTCCTGAAATCAAGAGTCTTAAATACTATGATAGTAAGCITITAGGTAA TCCTATTGATATTACTCCAGAGAATAGTAAAAATAAAGTTGTCTTACAGTCATTAAAACCTT GGAGAACAGATGTCTATTTCAATAAAAATACTGGTAAATATGAAATTITTAGGACTGAAATA TGCTGATITACAATITGAAAAGAAGACAGGAACATATAAGATTTCCCAGGAAAAATACAAT
SGGCATTATGAAAGAAGAGGGTGTAGATTCTGATICAGAATTCAAGTITACACTITATAAAAA f TGATTTGITACTCGTITAAAGATACAGAA ACAAAAGAACAACAGCTTTTCCGTITTCTTTCTC
GAACTATGCCTAATGTGAAATATTATGTAGAGTTAAAGCCTTATTCAAAAGATAAATTTGAG AAGAATGAGTCACTTATTGAAATTITAGGTTCTGCAGATAAGTCAGGACGATGTATAAAAG
SGCTAGGAAAATCAAATATTTCTATTTATAAGGTAAGAACAGATGTCCTAGGAAATCAGCA TATCATCAAAAATGAGGGTGATAAGCCTAAGCTAGATTTITAA (SEQ ID NO:474) SEQ ID NO:475:
ATGACTTGGAGAGTTGTACATGTCAGTCAAAGTGAGAAGATGOGCTTAAAGCTTGATAACTT - ATTAGTGCAAAAGATGGGACAAGAGTTTACGGTGCCACTAAGTGATATTTCGATAATCGTTG CAGAAGGTGGGGATACAGTTGTTACCCTTCGTCTATTAAGTGCCTTAAGTAAATATAATATT , GCCTTGGTOGTTTGTGATAACGAACATITACCAACAGGAATTTATCACTCACAAAATGGGCA E CTTTAGAGCGTACAAGCGCTTGAAAGAACAGCTGGATTGGTCTCAGAAACAAAAGGAAAAÃG
GCATGGCAGATTGTAACTTATTATAAAATCAATAACCAAGAGGATGTCOCTAGCCATGTTTGA h AAAAAGTCTGGACAACATTAGATTACTTTCAGACTATAAAGAGCAGATAGAACCTGGTGAT : AGAACGAATAGAGAGGGACATGCTGCCAAGGTCTACTITAATGAGCTCTITGGTAAACAAT
TTGTCAGAGTAACTCAGCAAGAAGCTGATGTCATCAATGCTGGTTTAAACTATGGCTATGCT ATCATGAGGGCTCAGATGGCTAGAATAGTGGCGGGTTATGGTTTAAATGGCCTATTAGGAA TCTTCCATAAAAATGAATACAATCAGTITAATTTGGTTGACGATTTGATGGAGCOCATITAGA CAGATTGTAGATGTITGGGTATATGATAATCTACGAGATCAGGAATTOCTTAAGTATGAGTA TAGGTTGGGATTGACAGATTTACTCAATGCTAAAATCAAA TATGGCAAAGAGACTTGCTCA
GTGACAGTTGCTATGGACAAATATGTCAAAGGCTTTATCAAATATATTTCGGAAAAAGATA GTAGT, 'AAATTTCACTGCCCAGTGGTATCAAGTTTAGAGTGGAGAAAATAA (SEQ ID NO:475) SEQ ID NO:476:
ATGAGGTATGAAGCATTGAGATTATTATGTTTTTTTGATITACCAATGGAATCCAAGGATGA AAAAAGAATATATCOGTAATTTTCGTAAAGAATTAATTTCAAATGGGTTTGAAATGITACAAT TTTCOGTCTACTATCGCACTTGTCCTAATAGAAGCTTTGCAAATAAATTITATAAGAAGTTA AAGATGAGCAATCTTCCTGCTAGGAATGTGAGACTTTTGGCAGTTACTGAAAAACAATTTTC
AGAGATGACATTAATTATAGGTGGTAAAACTAAGCAAGAAGAAATCGTCAGTGATAATAAG TTGGTGATCATATGA (SEQ ID NO:476) SEQ ID NO:4717:
ATGAAATTTTTTGTACAACATCCTTACAAAGAACGTATTGAATTAAATATTGGTGCAATCAC ACAAATTGTTGGTCAGAATAATGAACTCAAATATTATACTTGGCAGATITTGAGCTGGTATT TTGGTGGAAAAAAATACTCAAGTGAGGACTTAAGTATTITTGATTATGAGGAGCCTACCATA CTTGATGAGGCCAGAGAAATAGTGAAACGAAGTAGCTATCACTATATCGACATTTCAAGTTT TAAGGATTTACTGGAGCAGATGGAATACAAGAAAGGAACACTTGCTCAGGGTTACCTTCGT AAAATTGTCAATCAAGTTGATATTGTAGGCCATTTGGAGAAAATTAATGAACAAGTAGAGC TTATTGAAGAAGCTATGAA TCGGCATATAAACTTAAACTGTGGACAGGTAGAATACCATTTG GAGAATCTCCCTCTAACACTAGACCAACTACTCACAAAAAATTTTAGOCCATTTTTTGCCAT TGAGAACAAGAATCTATCTTTTGAATGGGTTTCTAATATTGATAAACTATCCOCTCTTITITAGA AATGTTAGACCATCTTCITTCACAAACAACAGAGAAGTATCTCATTGTGCTAAAAAATATTG ATGGCTITATCTCAGAAGAATCTTATACTATTITITATAGGCAAATCTGTCATCTGGTCAAGA, AGTATCCAAATCTAACCTTTATITTGTTTCCTAGTGACCAAGGCTATITAAAAATTGATGAA GAAAATAGTAGGTTCGTCAATATTITATCTGACCAGGTGGAACATTTGTATGATGTTGAGTT TATGTATGAAAGGGTAATGAAATATTATCCAAGTAATGATTTTCCGACGAGAGAAGGTTITA GGATGTCTITAGAAACTGTGACACCITATITATTGACAAAAATGCTGAGACAACCTAGTCTC TCACTTGTTGATTCAGTAATATTGAATATOCTAAATCAGCTGTTTCATITTAGTITACCGTATA
AGATGTTCTCAGACACCTGATAAGGAACTATTACAGAAATTTTTAGAAAGTAAGGATTGA (SEQ ID NO:477) com as sequências de repetição: SEQ ID NO: 1 a SEQ ID NO: 10. Combinação Funcional Nº 2 Sequências de cas SEQ ID NO: 466 a SEQ ID NO: 472; e SEQ 1IDNO:478aSEQID NO: 487 (todas as quais são sequências de S. ther- mophilus), como mostrado abaixo: : SEQ ID NO:466:
ATGAGCGATTTATATAGTCAAAGGTCCAATTATTACCTGTCCTTATCTGAACAAAGAATTAT í CATTAAAAATGATAATAAAGAGATTGTCAAAGAAGTGTCCATTTCACTCGTTGATAATGTAT , TACTTTTTGGTAATGCACAACTGACCACCCAACTCATCAAAGCCTTGTCAAAGAACAAGGTG
AATGTTTACTATTTCTCAAA TGTTGGTCAATITATITCTAGTATTGAAACCCACAGGCAGGAC : GAATTCCAAAAGCAAGAGTTGCAAGCAAAGGCTTATITTGAAGAGGATITOCGTTTAGAGO : TTGCGAGGAGTATTGCTACGACCAAGGTGAGGCACCCAATTGCCTTACTTAGAGAGTTTGAT ACGGATGGTCTACTAGATACCTCAGATTATTCTAGGTTTGAAGATAGTGTCAATGATATTCA GAAAGCTTATTCCATTACAGAAATTATGGGTTACGAAGGTCGCCTTGCGAAATOCTATTTIT ACTATCTGAATTTACTCGTTCCTAATGACTTTCATTTTAATGGTAGGAGTAGACGGCCTGGG GAGGATTGTTTTAACAGTGCCCTCAATTTTGGCTATAGTATCTTATATTCTTGCTTAATGGGC TGATTAAGAAAAACGGGCTAAGCTTGGGATITGGGGTAATTCACAAGCATCATCAGCATCA TGCGACCTTGGOCAGTGATTTAATGGAAGAA TGGAGACCTATCATOGTOGATAATACGCTTA TGGAGTTGGTACGAAATGGTAAACTTCTTTTAAGTCATTTTGAAAATAAGGATCAAGACTTC ATACTCACCCATGAAGGCAGAGAAATCTTTGCACGGGCTTTACOTTCAAGAATATTAGAAGT COCATCAGTATATTGAGTTAGATAAAAAACGCTATTCITTTCITTATACAGCAGATAGGCAAA TCAAGAGTTTGATTAGGGCTTTTAGAGAACTTGACCCTAGTCTCTATGAGACAAGTTACACA GGAGGGCATTAATGGGACTTTACTTTAACCTCAGCOGAAGA AGAGCGTGAGTTTGOCAAACA AAAAAACCATGTTITGTICTGATTATITATGATATTCGAAGTAACAAACGTAGACTTAAACTC TCGAAATTACTTGAGGGTTATGGCGTGAGGGTGCAAAAA TCCTGTTTCGAAGTCGACCTGTC AAGAAATGATTATCAGTCTCTCCTTAAGGATATOGAGGGCTTCTOCAAGGCTGATGAAGAA GACAGCATAATAGTGTATGTGOCAACCAAAGAAGAGGTGACTAGTTTTAGOCCCTACCATA GTGCTGAAAAATTAGATGACATTCTCTTCCCCTAAGCCTTTATAGACCTTTAATCATATGGTA CACTATAGATAGTGTTTCCAGAGGCTCTTAAGGAAATCAAAGATAGAGAGACACTICAAAG ATTTTGTAGATATATGGAAGCATTAGTAGCCTATTTCAAGTTTTATGGAGGTAAAGATTAAT GACATTCGCTAAGATTAAATTTTCAGCTCAAATTCGTTTAGAGACAGGCCTCCATATTGGTG GAAGCGATGCTITTGCAGCCATTGGTGCAATCGATTCGCCTGTTATTAAAGATCCTATTAÇO AACCTACCGATCATTCCTGGTTCAAGTCTCAAAGGAAAAA TGAGAACGCTTCTTGCCAAGGT TTATAATGAAAAGGTAGCTGAGAAACCAAGCGATGACAGTGATATTCTTAGOCOTTTATTTG GGAATAGTAAAGATAAACGATTCAA AA TGGGACGCTTGATTTTTCGTGATGCOCTICTTGTCA AACGCTGATGAGCT;, 'AGACTCTCTTGGGGTAAGAAGTTATACAGAAGTAAAATTTGAAAATA CAATTGACCGTATCACTGCCGAAGCTAATCCAAGACAAATTGAACGTGCTATTCGTACCAGT ACTTTTGATTTCGAGTTGATITATGAAATTACAGATGAGAATGAAAATCAAGTCGAAGAAG ATTCCAAAGTGATTCGAGATGGTTTAAAACTGCTTGAACTTGATTATCTTGGTGGTTCIGGA TCTCGAGGTTACGGTAAGGTTGCTTTTGAAAACCTCAAAGCTACTACCGTATTTGGTAATTA TGATGTTAAAACATTAAATGAACTTITAACTGCGGAGGTCTAATATGACCTA TAAACTGTAT ATTATGACCTTTCAGAATGCTCATTTTGGTTCGGGCACTCTTGATAGCTCAAAATTAACATTC TCAGCAGACCGT, 'ATCITCTICAGCACTAGTGCTAGAATCCCTAAAAATGGGAAAACTCGATGC ATTTCTTGCGGAAGCTAACCAAGACAAGTTCACGCTCACAGATGCCTTTCCATITCAATITO GTCCCTTTTTGCCGAAACCTATTGGTTATCCCAAACATGACCAAATAGATCAATCAGTTGAT STCAAAGAGGTTCGCCGTCAAGCAAAATTGTCTAAGAAACTGCAATTTCTTGCICTAGAAAA TGTTGACGATTATATCAATGGAGAGTTATTTGAAAATGAAGAGCATGCAGTCATCGATACTO TGACAAAAAATCAACCACATAAGGACGGCAATCTITATCAGGTAGCTACAACCAGATTITC AAATGATACGTCGCTITACGTCATCGCAA ACGAATCTGATITGCTTAATGAGTTGATGTCT, E) GT 'CTTCAGTATTCAGGTCTTGGTGGAAAGCGTTCAAGTGGTTTTGGTCGTTTTGAGTT, 'AGATA TTCAAAATATCCCACTAGAATTGTCAGATAGACTGACTAAGAATCATTCAGATAAAGTGATG AGTCTTACGACAGCACTTCCTGTAGATGCTGACCTTGAAGAAGCAATGGAAGATGGACATT ACTTATTAACTAAATCAAGTGGTTTTGCATTTAGTCATGCCACCAATGAGAATTATCGTAAG CAGGATCTTTACAAATTTGCTTCTGGTTCAACTITTAGTAAAACATTTGAAGGTCAGATIGTT SATOTGAGACCACTTGATTTCCCTCATGCTGTTTTAAATTATGCTAAACCACTCTTCETTAAA TTGGAGGTATAAAAATGAAAAATGACT ATAGAACATTTAAATTAAGCCTCCTGACACTTGCT CCAATTCATATTGGTAATGGAGAGAAGTATACCTCTAGAGAATTTATCTATGAAAATAAAA AGTTITACTTTCCTGACATGGGGAAATTCTATAATAAAATGGTGGAGAAGAGGCTTGCTGAA AAGTTTGAAGCATTTCTAATTCAAACTCGTCCAAATGCACGTAATAATCGTCTTATITCCITC TTAAATGATAACCGAATTGCAGAGCGTTCTTITGGAGGTTATAGTATCTCTGAAACAGGTTT AGAATCGGACAAAAATCCTGATTCAACCGGAGCTATTAACGAAGTTAATAAATTTATTCGA Y GATGCTTTTGGAAATCCCTACATTCCTGGTAGCT 'ICACTAAAAGGTGCTATTCGTACCATTITA
ATGAATACTACCCCTAAGTGGAATAATGAAAATGCTGTAAATGACTTTGGAAGATTTCCGA - AAGAGAATAAGAACCTTATCCCTTGGGGACCAAAAAAGGGAA AAGAATACGATGATTTGIT e TAACGCAATTCGTGTGAGTGATAGTAAGCCTITIGATAATAAGAGTCTTATCTTAGTOCAGA
AATGGGATTATTCAGCGAAAACAAATAAAGCTAAACCACTTCCOCTTGTATAGAGAATCAAT e CTCTCCATTAACAAAAATTGAATITGAGATTACAACAACCACTGATGAAGCTGGAAGATTO
ATTGAAGAATTAGGTAAGAGAGCACAAGCGTTTTATAAAGACTATAAGGCATTTTTCCTATC : TGAATTTCCTGATGATAAGATTCAAGCCAATCTACAATACCCAATTTATITAGGTGCGGGGA GCGGTGCTTGGACAAAGACTCTATITAAGCAAGCTGATGGTATTTTACAAAGACGATACAGT CGAATGAAAACTAAAATGGTTAAAAAAGGAGTTCTITAAGCTCACAAAAGCACCTCTTAAAA
CAGTTAAGATTOCATCTGGTAATCATTCATTAGTCAAGAACCACGAGTCCTTTTATGAAATO GGAAAAGCTAATTTCATGATTAAGGAGATTGATAAATGA (SEQ ID NO:466) SEQ ID NO:467:
ATGAGCGATTTATATAGTCAAAGGTCCAATTATTACCTGTCCTTATCTGAACAAAGAATTAT CATTAAAAATGATAATAAAGAGATTGTCAAAGAAGTGTCCATTTCACTCGTTGATAATGTAT TACTTTITGGTAATGCACAACTGACCACCCAACTCATCAAAGCCTTGTCAAAGAACAAGGTG AATGTTTACTATITCTCAAATGTTGGTCAATTTATTTCTAGTATTGAAACCCACAGGCAGGAC GAATTCCAAAAGCAAGAGTTGCAAGCAAAGGCTTATTTTGAAGAGGATTTCCGTTTAGAGO TTGCGAGGAGTATTGCTACGACCAAGGTGAGGCACCCAATTGCCTTACTT; 'AGAGAGTTTGAT ACGGATGGTCTACTAGATACCTCAGATTATTCTAGGTTTGAAGATAGTGTCAATGATATTCA GAAAGCTTATTCCATTACAGAAATTATGGGTTACGAAGGTCGCCTTGOGAAATOCTATTTTT ACTATCTGAATTTACTCGTTCCTAATGACTTTCATTTTAATGGTAGGAGTAGACOGCCTGGG
GAGGATTGTTTTAACAGTGCCCTCAATITTTGGCTATAGTATCTTATATTCTTGCTTAATGGGC TGA (SEQ ID NO:467)
SEQ ID NO:468:
TTGCTTAATGGGCTGATTAAGAAAAACGGGCTAAGCTTGGGATTTGGGGTAATTCACAAGC ATCATCAGCATCATGCGACCTTGGCCAGTGATTTAATGGAAGAA TGGAGACCTATCATCGTC GATAATACGCTTATGGAGTTGGTACGAAATGOTAAACTTCTTTTAAGTCATTITGAAAATAA GGATCAAGACTTCATACTCACCCATGAAGGCAGAGAAATCTITGCACGGGCTTTACGTTCAA GAATATTAGAAGTCCATCAGTATATTGAGTTAGATAAAAAACGCTATTCTTITCTTTATAÇA
GCAGATAGGCAAATCAAGAGTTTGATTAGGGCTTTTAGAGAACTTGACOCTAGTCTCTATGA GACAAGTTACACAGGAGGGCATTAA (SEQ ID NO:468) SEQ ID NO:469:
ATGTTTITGTCTGATTATITATGATATTCGAAGTAACAAACGTAGACTTAAACTCTCGAAATT ACTTGAGGGTTATGGOGTGAGGGTGCAAAAATCCTGTTTCGAAGTCGACCTGTCAAGAAAT GATTATCAGTCTCTCCTTAAGGATATCGAGGGCTTCTCCAAGGCTGATGAAGAAGACAGCAT
AATAGTGTATGTGCCAACCAAAGAAGAGGTGACTAGTTTTAGCCCCTACCATAGTGCTGAA AAATTAGATGACATTCTCTTCCCOCTAA (SEQ ID NO:469) SEQ 1D NO-470:
ATGACATTCGCTAAGATTAAATTTTCAGCTCAAATTCGTTTAGAGACAGGCCTCCATATTGG TGGAAGCGATGCTTTTGC;AGCCATTGGTGCAATOGATTCGCCTGTTATTAAAGATOCTATTA CCAACCTACCGATCATTCCTGGTTCAAGTCTCAAAGGAA AA ATGAGAACGCTTCTTGCCAAG GTITATAATGAAAAGGTAGCTGAGAAACCAAGCOGATGACAGTGATATTCTTAGCCOTTTATT TGGGAATAGTAAAGATAAACGATTCAAAATGGGACGCTTGATTTTTCGTGATGCCTTCITGT CAAACGCTGATGAGCTAGACTCTCTTGGGGTAAGAAGTTATACAGAAGTAAAATTTGAAAA TACAATTGACCGTATCACTGOCGAAGCTAATCCAAGACAAATTGAACGTGCTATTCGTACCA GTACTTTTGATTTCGAGTTGATTTATGAAATTACAGATGAGAATGAAAATCAAGTCGAAGAA
GATTCCAAAGTGATTCGAGATGGTITAAAACTGCTTGAACTTGATTATCTTGGTGGTTCTGG : ATCTCGAGGTTACGGTAAGGTTGCTTTTGAAAACCTCAAAGCTACTACOGTATTTGGTAATT ATGATGTTAAAACATTAAATGAACTTTTAACTGCGGAGGTCTAA (SEQ ID NO:470) - SEQ ID NO:471: : ATGACCTATAAACTGTATATTATGACCTTTCAGAATGCTCATTTTGGTTCGGGCACTCTTGAT
AGCTCAAAATTAACATTCTCAGCAGACCGTATCTTCTCAGCACTAGTGCTAGAATOCCTAAA f AATGGGAAAACTCGATGCATTTCTTGCGGAAGCTAACCAAGACAAGTTCACGCTCACAGAT
GCCTTTCCATTTCAATITGGTCCCTITTTGCCGAAACCTATTGGTTATCOCAAACATGACCAA ATAGATCAATCAGTTGATGTCAAAGAGGTTCGCCGTCAAGCAAAATTGTCTAAGAAACTGC AATTTCTTGCTCTAGAAAATGTTGACGATTATATCAATGGAGAGTTATTTOGAAAATGAAGAG CATGCAGTCATCGATACTGTGACAAAAAATCAACCACATAAGGACGGCAATCTTTATCAGG TAGCTACAACCAGATITTTCAAATGATACGTCGCTITACGTCATCGCAAACGAATCTGATTTO CTTAATGAGTTGATGTCTAGTCTTCAGTATTCAGGTCTTGOTGGAAAGCGTTCAAGTGGTTTT GGTCGTTTTGAGTTAGATATTCAAAATATCCCACTAGAATTGTCAGATAGACTGACTAAGAA TCATTCAGATAAAGTGATGAGTCTTACGACAGCACTTCCTGTAGATGCTGACCTTGAAGAAG CAATGGAAGATGGACATTACTTATTAACTAAATCAAGTGGTTITGCATTTAGTCATGCCACCO AATGAGAATTATOGTAAGCAGGATCTTTACAAATTTGCTTCTGGTTCAACTTTTAGTAAAAC
ATTTGAAGGTCAGATTGTTGATGTGAGACCACTTGATTTCCCTCATGCTGTTITAAATTATGO TAAACCACTCTTCTTTAAATTGGAGGTATAA (SEQ ID NO:471) SEQ ID NO:472:
ATGAAAAATGACTATAGAACATTTAAATTAAGCCTCCTGACACTTGCTOCAATTCATATTGG TAATGGAGAGAAGTATACCTCTAGAGAATTTATCTATGAAAATAAAAAGTTITACTTTCCTG ACATGGGGAAATTCTATAATAAAATGGTGGAGAAGAGGCTTGCTGAAAAGTTTGAAGCATT TCTAATTCAAACTOGTCCAAATGCACGTAATAA TOGTCITATTTCCTTCTITAAATOATAACCG AATTGCAGAGCGTTCTTTTGGAGGTTATAGTATCTCTGAAACAGGTTTAGAATCGGACAAAA ATCCTGATTCAACCGGAGCTATTAACGAAGTTAATAAATTTATTCGAGATGCTITTGGAAAT CCOCTACATTCCTGGTAGCTCACTAAAAGGTGCTATTCGTACCATTTTAATGAATACTACCOCCT AAGTGGAATAATGAAAATGCTGTAAATGACTTTGGAAGATTTCCGAAAGAGAATAAGAACC TTATCCCTTGGGGACCAAAAAAGGGAAAAGAATACGATGATITGTTTAACGCAATTCGTGT GAGTGATAGTAAGCCTITTGATAATAAGAGTCTTATCTTAGTGCAGAAATGGGATTATICAG CGAAAACAAATAAAGCT, 'AAACCACTTCCCTTGTATAGAGAATCAATCTCTCCATTAACAAA AATTGAATTTGAGATTACAACAACCACTGATGAAGCTGGAAGATTGATTGAAGAATTAGGT AAGAGAGCACAAGOGTTTTATAAAGACTATAAGGCATTTTTCCTATCTGAATTTCCTGATGA TAAGATTCAAGCCAATCTACAATACCCAATTTATTTAGGTGCGGGGAGCGGTGCTYGGACAA AGACTCTATTTAAGCAAGCTGATGGTATITTACAAAGACGATACAGTCGAATGAAAACTAA AATGGTTAAAAAAGGAGTTCTTAAGCTCACAAAAGCACCTCTTAAAACAGTTAAGATTCCA
TCTGGTAATCATTCATTAGTCAAGAACCACGAGTCCTTTTATGAAATGGGAAAAGCTAATIT CATGATTAAGGAGATTGATAAATGA (SEQ ID NO:472) SEQ ID NO:478:
ATGAGCGATITATATAGTCAAAGGTCCAATTATTACCTOTCCTTATCTGAACAAAGAATTAT CATTAAAAATGATAATAAAGAGATTGTCAAAGAAGTGTCCATTTCACTCGTTGATAATGTAT TACTTTITGGTAATGCACAACTGACCACOCAACTCATCAAAGCCTTGICAAAGAACAAGGTG AATGTITACTATITCTCAAATGTTGGTCAATITATTTCTAGTATTGAAACCCACAGGCAGOGAC GAATTCCAAAAGCAAGAGTTGCAAGCAAAGGCTTATTTTGAAGAGGATITCCGTTTAGAGG TTGCGAGGAGTATTGCTACGACCAAGGTGAGGCACCCAATTGCCTTACTTAGAGAGTTTGAT ACGGATGGTCTACTAGATACCTCAGATTATTCTAGGTTTGAAGATAGTGTCAATGATATTCA GAAAGCTTATTCCATTACAGAAATTATGGGTTACGAAGGTCGCCTTGOGAAATCCOTATTTITT ACTATCTGAATITACTCGTTCCTAATGACTTTCATTITAATGGTAGGAGTAGACGGOCTGGOG GAGGATTGTTTTAACAGTGCCCTCAATTTTGGCTATAGTATCTTATATTCTIGCITAATGGGC TGATTAAGAAAAACGGGCTAAGCTTGGGATTTGGGGTAATTCACAAGCATCATCAGCATCA TGCGACCTTGGCCAGTGATTTAATGGAAGAATGGAGACCTATCATCOGTCGATAATACGCTTA TGGAGTTGGTACGAAATGGTAAACTTCTTITAAGTCATITTGAAAATAAGGATCAAGACTTC - ATACTCACCCATGAAGGCAGAGAAATCTTTGCACGGGCTTTACGTTCAAGAATATTAGAAGT
CCATCAGTATATTGAGTTAGATAAAA AACGCTATTCTTTTICTTTATACAGCAGATAGGCAAA 1 TCAAGAGTTTGATTAGGGCTTITAGAGAACTTGACCCTAGTCTCTATGAGACAAGTTACACA 2 GGAGGGCATTAATGGGACTTTACTTTAACCTCAGCGAAGAAGAGCGTGAGTTTGCCAAACA
AAAAACCATGTTTTGTCTGATTATITATGATATTOGAAGTAACAAACGTAGACTTAAACTCT CGAAATTACTTGAGGGTTATGGCGTGAGGGTGCAAAAATCCTGTTTCGAAGTCAACCTGTCA - AGAAATGATTATCAGTCTCTOCTTAAGGATATOGAGGGCTTCTACAAGGCTGATGAAGAAG ACAGCATAATAGTGTATGTGACAACCAAAGAAGAGGTGACTAGTTTTAGOCCCTACCATAG TGCTGAAAAATTAGATGACATTCTCTTCTICTAAGCCTTTATAGACCTITAATCATATGGTAC ACTATAGATAGTGTTTCCAGTAGGTCCTACATCTTGTGOCTCTAGCAACTGCCTAGAGCACA AGATATGGGGATATAAACCTAATTACCTCGAGAGGGGACGGAAACGCTTTCTAGCTOGCTA TAATTACCCATTCCTAGAAAGATATAAACCTAATTACCTCGAGAGGGGACGUAAACTTTGA ATAGTCTTTGAATOGCATTTGAACCATATAGATATAAACCTAATTACCTCGAGAGGGGACGG AAACAGGTTTTTTGCCATAGATTTTCCAAGACCTTCCOCAACTGATATAAACCTAATTACCTC GAGAGGGGACGGAAACGCTTTCTAGCTOGCTATAATTACCCATTCCTAGAAAGATATAAAC CTAATTACCTOGAGAGGGGACTTITTTGAAAATTTTGAAAACAGTATTGATACCOGCTTOCAG AAAGTGTTAGACTAAAAGCACATTAAGGGCGCCCCAATGAGTTGAAAAGTACTTTCAGCTT TTGGGGTTTTTTCATACAAAGATGAAGGAGTCGAATGAAAAAATTAGTATITACTTITAAAA GGATCGACCATCCTGCAÇAAGATTTGGCTGTTAAATTTCATOGCTTCTTGATGGAGCAGTTO GATAGTGACTATGTTGATTATCTGCATCAGCAGCAAACAAATCCCTATGOGACCAAGOTAAT CCAAGGGAAAGAAAACACGCAGTGGGTTGTACATCTGCTCACAGACGACATCGAGGATAAG GTTTTTATGACCTTATTACAGATTAAAGAGGTGTCCTTAAACGATCTGCCTAAACTCAGTGT CGAAAAAGTTGAGATTCAGGAGTTGGGGGCAGATAA ACTGTTAGAGATTTTCAATAGTGAG GAAAATCAAACCTATTITTÇAATTATITITGAGACTCCAACAGGTTTTAAATCTCAAGGTTCC TACGTCATCTTCCCGTCTATGCGTTTGATITTTCAAAGTTTGATGCAAAAGTATGGAAGGTTG GTTGAAAATCAACCTGAAATTGAAGAGGATACCTTAGATTACCTATCTGAACACAGCACTAT CACGAATTATCGCTTGGAGACGAGTTATTTCAGGOTGCACAGGCAACGAATTCCTGCCTTTA GAGGAAAGTTAACCTTTAAAGTACAAGGCGCCCAAACTCTAAAAGCTTATGTCAAAATGOT TCTAACATTCGGTGAATATTCAGGTCTTGGCATGAAAACGAGTCTCGGTATGGGAGOGATA AAGCTTGAAGAAAGAAAAGATTGATTTATTTTACGGAGCTCTTTTGCA TGATATCGGTAAGO TCATTCAAAGGGCGACAGGAGAACGAAAAAAACACGCCTTGGTAGGCGCGGATTGGTTTGA TGAGATTGCTGATAATCAAGTTATITCCGATCAAATTAGATATCACATGGCTAACTACCAGA GTGATAAACTTGGAAATGACCATCTTGCTTACATAACTTATATCGCTGATAACATTGCCTCT GGTGTCGACAGAAGACAGTCAAATGAGGAGAGTGACGAGGATACATCAGCTAAGATTTGG GATACCTATACAAACCAGGCTGATATTITTAACGTTTTTGGGGCACAAACGGATAAACGCT, À CTTTAAACCGACGGTTCTAAACTTGAAATCTAAACCTAACTTTGCGTOGGCAACATATGAAC CTTTCTCAAAAGGTGATTATGCOGCAATTGCGACTCGTATCAAAAATGAATTGGCAGAATTT GAGTTTAATCAAGTACAAATTGACTCTTTGTTAAATCTGTTCGAAGCAACCCTCTCTITTGTO COTTCTTCGACTAATACTAAAGAAATCGCTGATATTITCACTTGCTGATCATAGTCGTCTGACA GCAGCTTTTGCTCTAGOCATCTATGATTACTIGGAAGACAAAGGT OGTCATAACTATAAGGA GGACTTGTTTACTAAAGCATCAGCCTTTTATGAGGAAGAAGCTTITCTOCTAGCTAGCTTTG ACTTATCAGGGATTCAAGACTTTATCTATAATATTAATATTGCGACGAATGGTGCTGCTAAA CAATTGAAGGCTAGATCTITATATCTTGACTTTATGAGCGAGTATATAGCAGACAGTTTACT TGATAAACTAGGOCTCAATOGGGCTAATATGCTCTATGTCGGTGGGGGACATGCTTACTTTG TCOCTAGCCAATACTGAAAA AACGGTAGAAACACTCGTTCAATTTGAAAAAGATTTCAATCA ATTTITATTGGCAAATTTCCAAACCAGATTATATGTTGCCTTTGGTTGGAGAAGCTTTGOGGCO TAAGGATATCATGAGCGAACTGAACTCACCTGAAAGCTATAGACAGGTCTATCAAAAGGCT AGTCGCATGATTTCTGAGAAAAAAATCTCAAGGTATGATTATCAAACCCTTATGTTGTTGAA CAGGGGOGGTAAATCTTCTGAAAGAGAGTOGCGAGATTTGTCATTCCGTTGAGAATTTAGTTG CTTATCATGACCAAAAAGTGTGTGACATTTGTCGAGGCTTGTATCAATTTTCTAAAGAGATT GCCCATGACCATITCATTATCACTGAAAATGAAGGGCTTCCTATTGGTCCOGAACGCATGTCT TAAGGGTGTTGCATITGAAAAGCTGAGCCAAGAAGCTTITTCCCGTGTCTATGTCAAAAATO ACTATAAGGCTGGTACAGTTAAGGCAACCCATOTTTTTGTTGGAGATTACCAGTATGATGAA ATATACAATTATGCTGCCTTATCTAAAAACGAAAATGGGTTAGGTATTAAACGTTTAGCTGT TGTACGTCTTGACGTGGATGATTTGGGAGCAGCCTTTATGGCTGGCTTCTCCCAACAAGOAA " ATGGGCAATATAGTACTCTATCACGCTCAGCOCACTTTCTCTCGAAGCATGAGTCITTTCITCA AGGTTTATATTAACCAGTTTGCTAGTGATAAGAAGCTCTCTATCATCTATGCCGOTOGOGAT - GATGTTTTTGCTATTGGCTCTTGGCAAGATATTATIGCCTTITACTGTTGAACTTOGTGAGAAC - TTCATTAAATGGACAAATGGAAAACTAACACTATCAGCTGGTATCGGTCIGTTIGCIGATAA GACCCCTATTAGCTTAATGGCACATCAA ACAGGGGAGCTAGAAGAAACAGCTAAAGGCAAT - GAGAAAGATAGTATTTCACTCTITAGTTOCGACTATACCTTTAAATTTGATCGGTTTATCACT AATGTTTACGACGATAAGTTAGAGCAGATTCGCTATTTCITIAATCACCAAGATGAACGAGO Ú CAAGAATTTCATITATAAATTGATTGAATTGCTTCGAAATTATGATCGTATGAATATGGCAC GTTTAGCTTATTATITAACACGACTTGAAGAATTGACGCGTGAAACAGACAGGGATAAATTT AAAACATTTAAAAATITATTCTATTCTTGGTACACAAA TAAGGATGATAAGGATAGAAAAG AAGCAGAGTTAGCCTTGCTTCTCTATATCTATGAGATTAGAAAGGATTAGGATATGACAATO TTGACTGATGAGAATTACGTTGATATTGCAGAAAAAGCAATTCTAAAACTAGAAAGAAATA CTAGGAACAGAAAGAATCCTGATGCCTTCTTICTTACAACAAGTAAGCTCAGAAACTTGCTG AGCTTAACTAGTACACTTTTTGATGAGAGTAAGGTCAAAGAATA TGATGCTCTCCTTGATCO TATTGCTTATTTAAGAGTACAATTTGTCTACCAAGCAGGTAGAGAGATTGCAGTAAAAGATC TGATAGAAAAGGCTCAAATTCTTGAGGCTCTTAAGGAAATCAAAGATAGAGAGACACTICA AAGATTTTGTAGATATATGGAAGCATTAGTAGOCTATTTCAAGTTTTATGGAGGTAAAGATT AATGACATTCGCTAAGATTAAATITTCAGCTCAAATTCGTTTAGAGACAGGOCTCCATATTG GTGGAAGCGATGCTTTTGCAGCCATTGGTGCAA TCGATTCGCCTGTTATTAAAGATCCTATT ACCAACCTACCGATCATTCCTGGTTCAAGTCTCAAAGGAAAAATGAGAACGCTTICTTGOCAA GGTTTATAATGAAAAGGTAGCTGAGAAACCAAGCGATGACAGTGATATTCTTAGCCGTTTAT TTGGGAATAGTAAAGATAAACGATTCAAAATGGGACGCTTGATITITOGTGATGCCTTCITO TCAAACGCTGATGAGCTAGACTCTCTTGGGGTAAGAAGTTATACAGAAGT; AAAATTTGAAA ATACAATTGACCGTATCACTGCCGAAGCTAATCCAAGACAAATTGAACGTGCTATTCGTACC AGTACTTITGATITCGAGTTGATTTATGAAATTACAGATGAGAA TGAAAATCAAGTCGAAGA AGATTTCAAAGTGATTCGAGATGGTTTAAAACTGCTTGAACTTGATTATCTTOGTGGTTCTG GATCTCGAGGTTACOGTAAGGTTGCTTITGAAAAACTCAAAGCTACTACCGTATTTGGTAAT TATGATGTTAAAACATTAAATGAACTTTITAACTGCGGAGGTCTAATATGACCTATAAACTGT ATATTATGACCTTTCAGAATGCTCATTTTGGTTCGGGCACTCTTGATAGCTCAAAATTAACAT TCTCAGCAGACCGTATCTTCTCAGCACTAGTGCTAGAATCCCTAAAAATGGGAAAACTCGAT GCATTTCTTGOGGAAGCTAACCAAGACAAGTTCACGCTCACAGATGCCTITCCATTTCAATT TGGTCCCTTTTTGCCGAAACCGATTGGTTATCCCAAACATGACCAAATAGATCAATCAGTTG ATGTCAAAGAGGITCGCCGTCAAGCAAAATTGTCTAAGAAACTGCAATTTCTTGCTCTAGAA AATGTTGACGATTATCTCAATGGAGAGTTATTTGAAAATGAAGAGCATGCAGTCATOGATAC TGTGACAAAAAATCAACCACATAAGGACGGCAATCTTTATCAGGTAGCTACAACCAGATIT TCAAATGATACGTCGCTTTACGTCATCGCAAACGAATCTGATTTGCTTAATGAGTTGATGTC TAGTCTTCAGTATTCAGGTCTIGGTGGA A AGCGTTCAAGTGGTTTITGGTCGTTTTIGAGTTAGA TATTCAAAATATCCCACTAGAATTGTCAGATAGACTGACTAAGAATCATTCAGATAAAGTGA TGAGTCTTACGACAGCACTTCCTGTAGATGCTGACCTTGAAGAAGCAATOGAAGATGGACA TTACTTATTAACTAAA TCAAGTGGTTTTGCATTTAGTCATGCTACCAATGAGAATTATCGTAA GCAGGATCTTTACAAATTTGCTTCTGGTTCAACTITTAGTAAAACATTTGAAGGTCAGATTGT TGATGTGAGACCACTTGATTTCCCTCATGCTGTTTTAAATTATGCTAAACCACTCTTCITTAA ATTGGAGGT, ATAAAAATGAAAAATGACTATAGAACATTTAAATTAAGCCTCCTGACACTTG CTCOCAATTCATATTIGGTAATGGAGAGAAGTATACCTCT, AGAGAATTTATCTATGAAAATAAG AAGTITTACTTITCCTGACATGGGGAAATTCTATAATAAAATGGTGGAGAAGAGGCTTGCTGA AAAGTTTGAAGCATTTCTAATTCAAACTCGTCCAAATGCACGTAATAATCGTCTTATTTCCIT CTTAAATGATAACCGAATTGCAGAGCGTTCTITIGGAGGTTATAGTATCTCTGAAACAGGTT TAGAATCGGACAAAAATCCTGATTCAGCCGGAGCT, ATTAACGAAGTTAATAAATTTATTCGA GATGCTTTTGGAAATCCCTACATTCCTGGTAGCTCACTAAAAGGTGCTATTOGTACCATTITA ATGAATACTACCCCTAAGTGGAATAATGAAAA TGCTGTAAATGACTTTGGAAGATTTCCGA AAGAGAATAAGAACCTTATCCCTTGGGGACCAAAAAAGGGAAA AGAATACGATGATTTGTT TAACGCAATTCGTGTGAGTGATAGTAAGCCTTTTGATAATAAGAGTCTTATCTTAGTOCAGA AATGGGATTATTCAGOGAAAACAAATAAAGCTAAACCACTTCCCTTGTATAGAGAATCAAT CTCTCCATTAACAAAAATTGAATTTGAGATTACAACAACCACTGATGAAGCTGGAAGATTO
ATTGAAGAATTAGGTAAGAGAGCACAAGOGTTTTATAAAGACTATAAGGCATTTTTCCTATC : TGAATTTCCTGATGATAAGATTCAAGCCAATCTACAATACCCAA TTTATTTAGGTGCGGGGA GCOGGTGCTTGGACAA AGACTCTATTITAAGCAAGCTGATGGT: ATTTTACAAAGACGATACAGT : CGAATGAAAACTAAAATGGTTAAAAAAGGAGTTCTTAAGCTCACAAAAGCACCTCITAAAA : CAGTTAAGATTCCATCTGGTAATCATTCATTAGTCAAGAACCACGAGTCCTTTTATGAAATG GGAAAAGCTAATTTCATGATTAAGGAGATTGATAAATGA (SEQ ID NO:478) SEQ ID NO:479:
ATGAGCGATTTATATAGTCAAAGGTCCAATTATTACCTGTCCTTATCTGAACAAAGAATTAT CATTAAAAATGATAATAAAGAGATTGTCAAAGAAGTGTCCATTTCACTCGTTGATAATGTAT TACTITITGGTAATGCACAACTGACCACCCAACTCATCAAAGCCTTGICAAAGAACAAGGTG AATGTTTACTATITCTCAAATGTTGGTCAATITATTTCTAGTATTGAAACCCACAGGCAGGAC GAATTCCAAAAGCAAGAGTTGCAAGCAAAGGCTTATTTTGAAGAGGATITCCGTITAGAGG TTGOGAGGAGTATTGCTACGACCAAGGTGAGGCACOCAATTGCCTTACTTAGAGAGTTTGAT ACGGATGGTCTACTAGATACCTCAGATTATTCTAGGTTTGAAGATAGTGTCAATGATATTCA GAAAGCTTATTCCATTACAGAAATTATGGGTTACGAAGGTCGCCTTGCGAAATCCTATTITT ACTATCTGAATTTACTCGTTCCTAATGACTTTCATTTTAATGGTAGGAGTAGACGGCCTGGG
GAGGATTGTTTTAACAGTGCCOCTCAATTTTGGCTATAGTATCTTATATTCTTGCTTAATGGGC TGA (SEQ ID NO:479) SEQ ID NO:480;
TTGCTTAATGGGCTGATTAAGAAAAACGGGCTAAGCTTGGGATTTGGGGTAATTCACAAGC ATCATCAGCATCATGCGACCTTGGCCAGTGATTTAATGGAAGAA TGGAGACCTATCATCGTC GATAATACGCTTATGGAGTTGGTACGAAATGGTAAACTTCTTITAAGTCATTITGAAAATAA GGATCAAGACTTCATACTCACOCATGAAGGCAGAGAA ATCTTTGCACGGGCTTTACGTTCAA
GAATATTAGAAGTCCATCAGTATATIGAGTTAGATAAAAAACGCTATICTTTTCTTTATACA GCAGATAGGCAAATCAAGAGTTTGATTAGGGCTTTTAGAGAACTTGACCCT; 'AGTCTCTATGA GACAAGTTACACAGGAGGGCATTAA (SEQ ID NO:480)
SEQ ID NO-481:
ATGGGACTTTACTTTAACCTCAGCGAAGAAGAGCGTGAGTTTGCCAAACAAAAAACCATGT TTTGTCTGATTATITATGATATTCGAAGTAACAAACGTAGACTTAAACTCTCGAAATTACTTO AGGGTTATGGCGTGAGGGTGCAAAAATCCTGITTCGAAGTCAACCTGTCAAGAAATGATTA TCAGTCTCTCCTTAAGGATATCGAGGGCTICTACAAGGCTGATGAAGAAGACAGCATAATA
STGTATGTGACAACCAAAGAAGAGGTGACTAGTTTTAGCOCCTACCATAGTGCTGAAAAAT TAGATGACATTCTCTTCITCTAA (SEQ ID NO:481) SEQ ID NO:482: ATGAAAAAATTAGTATITACITTT, AAAAGGATCGACCATCCTGCACAAGATTTGGCTGTTAA
ATTTCATGGCTTCTTGATGGAGCAGTTGGATAGTGACTATGTTGATTATCTGCATCAGCAGC AAACAAATCCCTATGCGACCAAGGTAATCCAAGGGAAAGAAAACACGCAGTGGGTTGTACA TCTGCTCACAGACGACATCGAGGATAAGGTTTITATGACCTTATTACAGATTAAAGAGGTGT CCOTTAAACGATCTGCCTAAACTCAGTGTCGAAAAAGTTGAGATTCAGGAGTTGGGGACAGA TAAACTGTTAGAGATTTTCAATAGTGAGGAMAATCAAACCTATTTITCAATTATTTITGAGA CTCCAACAGGTTTTAAATCTCAAGGTTCCTACGTCATCTTCCCOTCTATGCGTTTGATTTITC AAAGTTTGATGCAAAAGT, ATOGAAGGTTGGTTGAAAATCAACCTGAAATTGAAGAGGATAC CTTAGATTACCTATCTGAACACAGCACTATCACGAATTATCGCTTGGAGACGAGTTATITCA GGGTGCACAGGCAACGAATTCCTGCCTITAGAGGAAAGTTAACCTTTAAAGTACAAGGCGC
CCAAMACTCTAAAAGCTTATGTCAAAATGCTTCTAACATTCGGTGAATATICAGGTCTTGGCA CSAAAADOAG: TCTOGGTATGGGAGGGATAAAGCTTGAAGAAAGAAAAGATTGA (SEQID 482) SEQ ID NO:483:
TTGAAGAAAGAAAAGATTGATTTATTTTACGGAGCTCTITTGCATGATATCAGTAAGGTCAT TCAAAGGGCGACAGGAGAACGAAAAAA ACACGCCTTGGTAGGCGCGGATTGGTTTGATGA : GATTGCTGATAATCAAGITATITCCOGATCAAATTAGATATCACATGGCTAACTACCAGAGTG
ATAAACTTGGAAATGACCATCTTGCTTACATAACTTATATCGCTGATAACATTGCCTCTGGT f STCGACAGAAGACAGTCAAATGAGGAGAGTGACGAGGATACATCAGCTAAGATTTGGGAT - ACCTATACAAACCAGGCTGATATTTTTAACGTTTTTGGGGCACAAACGGATAAACGCTACTT
TAMACCGACGGTTCTAAACTTIGAAATCTAAACCTAACTTTGCGTCGGCAACATATGAACCOTT íi TCTCAAAAGGTGATTATGCGGCAATTGCGACTCOGTATCAAAAATGAATIGGCAGAATTTGA : GTTTAATCAAGTACAAATTGACTCTTTGTTAAATCTGTTCGAAGCAACCCTCTCTTTTGTGCC
TTCTTCGACTAATACTAA AGAAATCGCTGATATTTCACTTGCTGATCATAGTCGTCTGACAG CAGCTTTTGCTCTAGCCATCTATGATTACTTGGAAGACAAAGGTCGTCATAACTATAAGGAG GACTTGTITACTAAAGCATCAGCCTTTTATGAGGAAGAAGCTTTTCTCCTAGCTAGCTTTGAC TTATCAGGGATTCAAGACTTTATCTATAATATTAATATTGCGACGAATGGTGCTGCTAAAÇA ATTGAAGGCTAGATCTITATATCTTGACTTITATGAGCGAGTATATAGCAGACAGTTTACTTO ATAAACTAGGCCTCAATCGGGCTAATATGCTCTATGTCGGTGGGGGACATGCTTACTTTGTC CT AGCCAATACTGAAAAAACGGTAGAAACACTCGTTCAATTTGAAAAAGATTTCAATCAAT TTITATTGGCAAATTTOCAAACCAGATTATATGTTGCCTTTGGTTAGGGAAGCTTTGCAGCTA AGGATATCATGAGCGAACTGAACTCACCTGAAAGCTATAGACAGGTCTATCAAAAGGCTAG TCGCATGATTTCTGAGAAAAAAATCTCAAGGTATGATTATCAAACCCTTATOTTGTTGAACA GGGGCGGTAAATCTTCTGAAAGAGAGTGCGAGATTTGTCATTCOGTTGAGAATTTAGITGCT TATCATGACCAAAAAGTGTGTGACATTTGTCGAGGCTTGTATCAATTTTCTAAAGAGATTGC CCATGACCATTTCATTATCACTGAAAATGAAGGGCTTOCTATTGGTCCGAACGCATGTCTTA AGGGTGTTGCATTTGAAAAGCTGAGCCAAGAAGCTTTTTCCCGTGTCTATGTCAAAAATOAC TATAAGGCTGGTACAGTTAAGGCAACCCATGTTTITGTTGGAGATTACCAGTATGATGAAAT ATACAATTATGCTGCCTTATCTAAAAACGAAAA TGGGTTAGGTATTAAACGTTTAGCTATTG TACGTCTTGACGTGGATGATTTGGGAGCAGCCTITATGGCTGUCTTCTCCCAACAAGGAAAT GGGCAATATAGTACTCTATCACGCTCAGCCACTTTCTCTCGAAGCATGAGTCTTITTCTICAAG SGTTTATATTAACCAGTTTGCTAGTGATAAGAAGCTCTCTATCATCTATGCCGGTGGGGATGA TGTTTITGCTATTGGCTCTTGGCAAGATATTATTGCCTITACTGTTGAACTTCGTGAGAACTT CATTAAATGGACAAATGGAAAACTAACACTATCAGCTGGTATCGGTCTGTTTGCTGATAAGA CCCCTATTAGCTTAATGGCACATCAAACAGGGGAGCTAGAAGAAACAGCTAAAGGCAATGA GAAAGATAGTATITCACTCTTTAGTTCCGACTATACCTTTAAATTTGATCGGTTTATCACTAA TGTTTACGACGATAAGTTAGAGCAGATICGCTATITCTTTAATCACCAAGATGAACGAGACÇA AGAATTTCATITATAAATTGATTGAATTGCTTCGAAATTATGATCGTATGAATATGGCACGT TTAGCTTATTATTTAACACGACTTGAAGAA TTGACGOGTGAAACAGACAGUGATAAATTTAA
AACATTTAAAAATITATICTATTCTTGGTACACAAATAAGGATGATAAGGATAGAAAAGAA GCAGAGTTAGCCTTGCTICTCTATATCTATGAGATTAGAAAGGATTAG (SEQ ID NO:483) SEQ ID NO:484:
ATGACAATCTTGACTGATGAGAATTACGTTGATATIGCAGAAAAAGCAATTCTAAAACTAG AAAGAAATACTAGGAACAGAAAGAA TCCTGATGOCTTCTTTCTTACAACAAGTAAGCTCAG AAACTTIGCTGAGCTTAACTAGTACACTTTITGATGAGAGTAAGGTCAAAGAATATGATGCTC TCCTTGATCGTATTGCTTATTTAAGAGTACAATTTGTCTACCAAGCAGGTAGAGAGATTGCA GTAAAAGATCTGATAGAAAAGGCTCAAATTCTTIGAGOGCTCTTAAGGAAATCAAAGATAGAG
AGACACTTCAAAGATTTTGTAGATATATGGAAGCATTAGTAGCCTATTTCAAGTITIATGGA GGTAAAGATTAA (SEQ ID NO:484) SEQ ID NO:485:
ATGACATTCGCTAAGATTAAATTTTCAGCTCAAATTCGTTTAGAGACAGGCCTCCATATTGG TGGAAGCGATGCTTTTGCAGCCATTGGTGCAA TCGATTOGCCTGTTATTAAAGATOCTATTA CCAACCTACCGATCATTCCTGGTTCAAGTCTCAAAGGAAAAATGAGAACGCTTCTTGCCAAG GTTTATAATGAAAAGGTAGCTGAGAAACCAAGCGATGACAGTGATATTCTTAGCCGTTTATT TGGGAATAGTAAAGATAAACGATTCAAAA TGGGACGCTTGATTTTTCGTGATGCCTTCITOT CAAACGCTGATGAGCTAGACTCTCTTGGGGTAAGAAGTTATACAGAAGTAAAATTTGAAAA TACAATTGACCGTATCACTGCOCOGAAGCTAATCCAAGACAAATTGAACGTGCTATTCGTACCA
GTACTTTTGATTTOGAGTTGATITATGAAATTACAGATGAGAATGAAAATCAAGTCGAAGAA i GATTTCAAAGTGATTCGAGATGGTITAAAACTGCTTGAACTTGATTATCTTGGTGGTTCTGG " ATCTCGAGGTTACGGTAAGGTTGCTTTTGAAAAACTCAAAGCTACTACCGTATITGGTAATT . ATGATGTTAAAACATTAAATGAACTTTTAACTGCGGAGGTCTAA (SEQ ID NO:485) : SEQ ID NO:486: : ATGACCTATAAACTGTATATTATGACCTTTCAGAATGCTCATTTTGGTTCGGGCACTCTTGAT
AGCTCAAAATTAACATTCTCAGCAGACCGTATCTTCTCAGCACTAGTGCTAGAATCOCCTAAA AATGGGAAAACTCGATGCATTTCTTGCGGAAGCTAACCAAGACAAGTTCACGCTCACAGAT GCCTITCCATTTCAATTTGGTCCCTITTTGCCGAAACCGATTGGTTATCCCAAACATGACCAA ATAGATCAATCAGTTGATGTCAAAGAGGTTOGCOGTCAAGCAAAATTGTCTAAGAAACTGC AATTTCTTGCTCTAGAAAATGTTGACGATTATCTCAATGGAGAGTTATTTGAAAATGAAGAG CATGCAGTCATCGATACTGTGACAAAAAATCAACCACATAAGGACGGCAATCTTTATCAGG TAGCTACAACCAGATTTTCAAATGATACGTCGCTTTACGTCATCGCAAACGAATCTGATTITG CTTAATGAGTTGATGTCTAGTCTTCAGTATTCAGGTCTTGGTGGAAAGCGTTCAAGTGGTTTT GGTCGTTITGAGITAGATATTCAAAATATCCCACTAGAATTGTCAGATAGACTGACTAAGAA TCATTCAGATAAAGTGATGAGTCTTACGACAGCACTTCCTGTAGATGCTGACCTTGAAGAAG CAATGGAAGATGGACATTACTTATTAACTAAATCAAGTGGTTITGCATTTAGTCATGCTACC AATGAGAATTATCGTAAGCAGGATCTITACAAATITGCTTCTGGTTCAACTITTAGTAAAAC
ATTTGAAGGTCAGATTGTTGATGTGAGACCACTTGATTTCCCTCATGCTGTTTTAAATTATGC TAAACCACTCTTCTTTAAATTGGAGGTATAA (SEQ ID NO:486) SEQ ID NO-487
ATGAAAAATGACTATAGAACATTTAAATTAAGCCTCCTGACACTTGCTCCAATICATATTGG TAATGGAGAGAAGTATACCTCTAGAGAATITATCTATGAAAATAAGAAGTTTTACTTTCCTO ACATGGGGAAATTCTATAATAAAATGGTGGAGAAGAGGCTTGCTGAAAAGTTTGAAGCATT TCTAATTCAAACTOGTCCAAATGCACGTAATAATCGTCTTATTITOCTTICITAAATGATAACCG AATTGCAGAGCGTTCTTTTGGAGGTTATAGTATCTCTGAAACAGGTTTAGAATCGGACAA AA ATCCTGATTCAGCCGGAGCTATTAACGAAGTTAATAAATITATTCGAGATGCTTTTGGAAAT CCCTACATTCCTGGTAGCTCACTAAAAGGTGCTATTCGTACCATTTTAATGAATACTACOCCT AAGTGGAATAATGAAAATGCTGTAAATGACTTTGGAAGATTTCCGAAAGAGAATAAGAACC TTATCCCTTGGGGACCAAAAAAGGGAAAAGAATACGATGATTTGTTTAACGCAATTCGTGT GAGTGATAGT:, 'AAGOCTTTTGATAATAAGAGTCTTATCTTAGTGCAGAA ATGGGATTATTCAG CGAAAACAAATAAAGCTAAACCACTTCCCTTGTATAGAGAATCAATCICTCCATTAACAAA AATTGAATTTGAGATTACAACAACCACTGATGAAGCTGGAAGATTGATTGAAGAATTAGGT AAGAGAGCACAAGCGTITTATAAAGACTATAAGGCATTTTTCCTATCTGAATTTCCTGATGA TAAGATTCAAGCCAATCTACAATACCCAATITTATTTAGGTGCGGGGAGCGGTGCTTGGACAA AGACTCTATTTAAGCAAGCTGATGGTATTTTACAAAGACGATACAGTCGAATGAAAACTAA AATGGTTAAAAAAGGAGTTCTTAAGCTCACAAAAGCACCTCTTAAAACAGTTAAGATTCCA
TCTGGTAATCATTCATTAGTCAAGAACCACGAGTCCTTTTATGAAATGGGAAAAGCTAATTT CATGATTAAGGAGATTGATAAATGA (SEQ ID NO:487) com as sequências de repetição: SEQ ID NO: 11 e/ou SEQ ID NO: 12. Combinação Funcional Nº 3 Sequências de cas SEQ ID NO:488 a SEQ ID NO:508; e SEQ ID NO:517aSEQID NO: 521 como mostrado abaixo. As SEQ ID NOS:488 a 497 são de S. agalactiae, enquanto as SEQ ID NOS: 498 a 503 são de S. mutants, e as SEQ ID NOS: 504 a 508, 517 a 521 são de S. pyogenes. . SEQ ID NO:488: : ATGAATAAGCCATATTCAATAGGCCTTGACATCGGTACTAATTCCGTCGGATGGAGCATTAT i TACAGATGATTATAAAGTACCTGCTAAGAAGATGAGAGTTTTAGGGAACACTGATAAAGAA
TATATTAAGAAGAATCTCATAGGTGCTCTGCTTTTTGATGGCGGGAATACTGCTGCAGATAG . ACGCTTGAAGCGAACTGCTCOGTOGTCGTTATACACGTCGTAGAAATCGTATTCTATATITAC AAGAAATTTTTGCAGAGGAAATGAGTAAAGTTGATGATAGTTITCTITCATOGATTAGAGGAT TCTTTTCTAGTTGAGGAAGATAAGAGAGGGAGCAAGTATCCTATCTITGCAACATTGCAGGA AGAGAAAGATTATCATGAAAAATTTTCGACAATCTATCATITGAGAAAAGAATTAGCTGAC AAGAAAGAAAAAGCAGACCTTCGTCTTATTITATATTGCTCTAGCTCATATCATTAAATITAG AGGGCATTTCCTAATTGAGGATGATAGCTTTGATGTCAGGAATACAGACATTTCAAAACAAT ATCAAGATTTTTTAGAAATCTTITAATACAACTITTGAAAATAATGATITGITATCTCAAAACG TTGACGTAGAGGCAATACTAACAGATAAGATTAGCAAGTCTOCGAAGAAAGATCGTATTIT AGCOGCAGTATCCTAACCAA AAA TCTACTGGCATTTTTGCAGAATTTTTGAAATTGATTGTCG GAAATCAAGCTGACTTCAAGAAATATTTCAATTTGGAGGATAAAACGCCGCTTCAATTCGCT AAGGATAGCTACGATGAAGATTTAGAAAATCTTCTTGGACAGATTGGTGATGAATTTGCAG ACTTATTCTCAGCAGCGAAAAAGTTATATGATAGTGTCCTTTTGTCTGGCATTCTTACAGTAA TCGACCTCAGTACCAAGGCGCCACTTTCAGCTTCTATGATTICAGCGTTATGATGAACATAGA GAGGACTTGAAACAGTTAAAACAATTCGTAAAAGCTTCATTGCCGGAAAAATATCAAGAAA TATTTGCTGATTCATCAAAAGATGGCTACGCTGGTTATATTGAAGGTAAAACTAATCAAGAA GCTTITTATAAATACCTGTCAAAATTGTTGACCAAGCAAGAAGATAGCGAGAATTTTCTTGA AAAAATCAAGAATGAAGATTTCTTGAGAAAACAAAGGACCTTTGATAATGGCTCAATTCCA CACCAAGTCCATTTGACAG, IAGCTGAAAGCTATTATOCGCOGTCAATCAGAATACTATOCCTT CTTGAAAGAGAATCAAGATAGGATTGAAAAAA TCCTTACCTITAGAATTCCITATTATATCG GGCCACTAGCACGTGAGAAGAGTGATTTTGCATGGATGACTCGCAAAACAGATGACAGTAT TCGACCTTGGAATTTTGAAGACTTGGTTGATAAAGAAAAATCTGCGGAAGCTTTTATCCATC GTATGACCAACAATGATITITATCTTCCTGAAGAAAAAGTTTTACCAAAGCATAGTCITATT TATGAAAAATITACGGTCTATAATGAGTTIGACTAAGGTTAGATATAAAAATGAGCAAGGTG AGACTTATTTTTTTGATAGCAATATTAAACAAGAAATCTTTGATGGAGTATTCAAGGAACAT CGTAAGGTATCCAAGAAGAAGTTGCTAGATTTTCTGGCTAAAGAATATGAGGAGTTTAGOA TAGTAGATGTITATTGGTCTAGATAAAGAAAATAAAGCTTTCAACGCCTCATTGGGAACTTAC CACGATCTCGAAAAAATACTAGACAAAGATTTTCTAGATAATCCAGATAATGAGTCTATTCT GGAAGATATOGTCCAAACTCTAACATTATITGAAGACAGAGAAATGATTAAGAAGCGTCTT GAAAACTATAAAGATCTTTTTACAGAGTCACAACTAAAAAAACTCTATOGTCGTCACTATAC TGGCTGGGGACGATTGTCTGCTAAGTTAATCAATGGTATTCGAGATAAAGAGAGTCAA AAA ACAATCTTGGACTATCTTATTGATGATGGTAGATCTAATOGCAACTITATGCAGTTGATAAA TGATGATGGTCTATCTTTCAAATCAATTATCAGTAAGGCACAGGCTOGTAGTCATTCAGATA ATCTAAAAGAAGTTGTAGGTGAGCTTGCAGGTAGCCCTGCTATTAAAAAGGGAATTCTACA AAGTTTGAAAATTGTTGATGAGCTTGTTAAAGTCATGGGATACGAACCTGAACAAATTGTGG TTGAGATGGCGCGTGAGAATCAAACAACAAATCAAGGTCGTCGTAACTCTCGACAACGCTA TAAACTTCTTGATGATGGCGTTAAGAATCTAGCTAGTGACTTGAATGGCAATATTTTGAAAG AATATCCTACGGATAATCAAGOGTTGCAAAATGAAAGACTTTTCCTITACTACITACAAMAC GGAAGAGATATGTATACAGGGGAAGCTCTAGATATTGACAATTTAAGTCAATATGATATTG ACCACATTATTCCTCAAGCTTICATAAAAGATGATTCTATTGATAATOGTGTTITGGTATCAT CTGCTAAAAATCGTGGAAAGTCAGATGATGTTCCTAGCCTTGAAATTGTAAAAGATTGTAAA GTTITCTGGAAAAAATTACTTGATGCTAAGTTAATGAGTCAGCGTAAGTATGATAATITGAC TAAGGCAGAGCGCGGAGGCCTAACTTOCGATGATAAGGCAAGATITATCCAACGTCAGTTG GTTGAGACACGACAAATTACCAAGCATGTTGCCCGTATCTTGGATGAACGCTITAATAATGA GCTTGATAGTAAAGGTAGAAGGATCCGCAAAGTTAAAATTGTAACCTTGAAGTCAAATTTG GTTTCAAATTTCCGAAAAGAATTTGGATTCTATAAAATTCGTGAAGTTAACAATTATCACCA TGCACATGATGCCTATCTTAATGCAGTAGTTGCTAAAGCTATTCTAACÇAAATATCCTCAGT TAGAGCCAGAATTTGTCTACGGOGACTATCCAAAATATAATAGTTACAAAACGCGTAA ATC COCTACAGAAAAGCTATITITCTATICAAATATTATGAACTTCTTTAAAACTAAGGTAACTTT AGCGGATGGAACCGTTGTTGTAAAAGATGATATTGAAGTTAATAATGATACGGGTGAAATT GTTTGGGATAAAAAGAAACACTTTGCGACAGTTAGAAAAGTCTTGTCATACOCTCAGAACA ATATCGTGAAGAAGACAGAGATTCAGACAGGTGGTITCTCTAAGGAATCAATCTTGGCGCA TGGTAACTCAGATAAGTTGATTCCAAGAAAAACGAAGGATATTTATTTAGATCOCTAAGAAA TATGGAGGTTTTGATAGTCCOGATAGTAGCTTACTCTGTTTTAGTTGTAGCTGATATCAAAAA GGGTAAAGCACAAAAACTAAAAACAGTTACGGAACTTTTAGGAATTACCATCATGGAGAGG TCCAGATTTGAGAAAAATCCATCAGCTTTCCTTGAATCAAAAGGCTATITAAATATTAGGGC TGATAAACTAATTATTTTGCCCAAGTATAGTCTGTTCGAATTAGAAAA TGGGCGTCGTCGAT ' TACTTGCTAGTGCTGGTGAATTACAAAAAGGTAATGAGCTAGCCTTACCAACACAATTTATG " AAGTTCTTATACCTTGCAAGTCGTTATAATGAGTCAAAAGGTAAACCAGAGGAGATTGAGA
AGAAACAAGAATTTGTAAATCAACATGTCTCTTATTITTGATGACATCCTTCAATTAATTAAT á GATTTTTCAAAACGAGTTATTCTAGÇAGATGCTAATTTAGAGAAAATCAATAAGCTITACCA
AGATAATAAGGAAAATATATCAGTAGATGAACTTGCTAATAATATTATCAATCTATITACIT
TTACCAGTCTAGGAGCTCCAGCAGCTTTTAAATITITTGATAAAATAGTTGATAGAAAACGC ba TATACATCAACTAAAGAAGTACTTAATTCTACCOCTAATTCÇATÇAATCTATTACTGGACTTTAT
GAAACACGTATTGATTTGGGTAAGTTAGGAGAAGATTGATATGGCAGGTTGGCGAACCGTT GTTGTAAATACACATTCTAAGCTCTCTTATAAAAATAATCATCTGATTTTTAAAGATICITAT CAGACGGAAATGATTCATCTATCAGAGATTGACATTCTAATCATGGAAACAACAGATATCG TTTTGTCGACCATGCTGATTAAACGTTTGGTTGATGAAAATATTTTAGTTATATTTTGTGACG ATAAACGCTTGCCAACAGCTATGTTAATGCOGTACTATGCCAGACATGATTCGAGTTTACAA TTATCTAGGCAGATGTCATGGATTGAAGATGTCAAAGCAGATGTTTGGACATCAATTATTGC ACAAAAAATTTTGAATCAGTCTTTTTATCTCGGTGAGTGTTCTITCTTTGAAA AATCOCAGTO TATTATGAATCTCTACCATGACTTAGAACCTTTTGATCCTTCTAATCGTGAGGGGCATGCTGC TAGGATTTATTTCAATACACTTTITGGAAATGATTTTTCAAGAGAGCAGGATAATCCAATAA ATGCTGGTTTAGACTACGGATATTICATTGCTTTTGAGTATGTTTGCGCGTGAAGTTGTTAAGT GTGGTTGCATGACACAATTTGGCTTGAAGCATGCTAATCAATTTAATCAGTTCAACCTAGCA AGCGATATTATGGAACCATTTCGCOCAATCGTTGATAGGATTATITATGAAAATAGGCAGAG TGATTTTGTCAAAATGAAAAGAGAACTCTTTTCTATGTITTCAGAGACATACAGCTACAATG GTAAAGAAATGTATCTCTCAAATATTGTCAGCGACTATACCAAAAAAGTTATTAAGTCGCTA AATAGTGATGGGAATGGAATTCCGGAGTTTAGGATATGAGTTATOGGTATATGCGAATGATT TTAATGTTTGATATGCCTACTGAAACAGCAGAAGAACGGAAGGCGTATCGTAAGTITAGAA AGTTTCTCTTGAGCGAAGGCTTTATCATGCATCAGTTTTCTGTTTATAGTAAATTATTACTCA. ATAATACAGCTAATAATGCTATGATAGGTCGGCTTAAAGTGAATAATCCTAAAAAGOGTAA TATCACACTCITAACAGTTACGGAAAAACAATTTGCGAGAATGGTTTACCTCCATGGAGAAC GCAACACAAGTGTTGCCAACTCTGATAGTCGCTTGGTTTTCCTAGGAGATTCTTATGATCAA GATTAATTITCCAATTITAGATGAACCATTAGTGTTAAGTAATGCTACGATTTTAACGATAG AAGATGTTTCAGTITATTCTTCATTGGTGAAACATTTTTATCAATATGACGTAGATGAACATT TGAAATTATTTGATGATAAGCAGAAAAGTCTGAAGOCAACAGAGTTAATGCTGGTTACAGA TATCTTAGGATACGATGTCAACTCAGCACCTATTCTAAAGTTGATACATGGTGACTTAGAAA ATCAATTCAACGAAAAGCCAGAAGTGAAATCAATGGTAGAAAAATTAGCAGCTACTATTAC AGAACTTATCOGCATTTGAGTGTCTAGAGAATGAGCTTGATTTAGAATACGATGAAATTAAGA TTTTAGAACTCATTAAGGCACTGGGAGTCAAAATTGAGACACAGAGOGACACTATCTTTGA AAAATGTITTGAAATTATACAAGTTTACCATTATITAACGAAAAAGAATCTCTTGGTTTITGT TAATAGCGGAGCTTATCTTACCAAAGATGAAGTTATAAAATTATOTOAATACATCAATITAA
TGCAAAAGTCAGTACTCTITCTAGAACCTAGAAGACTCTATGATTTACCGCAATATGITATT GATAAGGATTATITCTTGATAGGCGAAAATATGGTATAA (SEQ ID NO:488) SEQ ID NO:489:
ATGAATAAGCCATATTCAATAGGCOCTTGACATOGGTACTAATTCCGTCGGATGGAGCATTAT TACAGATGATTATAAAGTACCTGCTAAGAAGATGAGAGTTTTAGGGAACACTGATAAAGAA TATATTAAGAAGAATCTCATAGGTGCTCTGCTTTTTGATGGCGGGAATACTGCTGCAGATAG ACGCTTGAAGCGAACTGCTCGTCGTCGTTATACACGTCGTAGAAATCGTATTCTATATTTAC AAGAAATTTTTGCAGAGGAAA TGAGTAAAGTTGATGATAGTTTCTTTCATCGATTAGAGGAT , TCTTTTCTAGTTGAGGAAGATAAGAGAGGGAGCAAGTATCCTATCTTITGCAACATTGÇAGGA AGAGAAAGATTATCATGAAAAATTTTCGACAATCTATCATTTGAGAAAAGAATTAGCTGAC AAGAAAGAAAAAGCAGACCTTCGTCTTATTTATATTGCTCTAGCTCATATCATTAAATTTAG AGGGCATTTCCTAATTGAGGATGATAGCTTTGATGTCAGGAATACAGACATTICAAAACAAT ATCAAGATITTITAGAAATCTTTAATACAACTTTTGAAAATAATGATTTGTTATCTCAAAACG TTGACGTAGAGGCAATACTAACÇAGATAAGATTAGCAAGTCTGCGAAGAAAGATOGTATTTT AGCGCAGTATOCTAACCAAAAATCTACTGGCATTTITGCAGAATTTTTGAAATTGATTGTCG GAAATCAAGCTGACTTCAAGAAATATTTCAATTTGGAGGATAAAACGCOGCTTCAATTOGCT AAGGATAGCTACGATGAAGATTTAGAAAATCTTCTTGGACAGATTGGTGATGAATTTGCAG ACTTATTCTCAGCAGCGAAAAAGTTATATGATAGTGTCCTTTTGTCTGGCATTCTTACAGTAA
TCGACCTCAGTACCAAGGCOGCCACTTTCAGCTTCTATGATTCAGCGTTATGATGAACATAGA e GAGGACTTGAAACAGTTAAAACAATTCGTAAAAGCTTCATTGCCGGAAAAATATCAAGAAA - TATTTGCTGATTCATCAAAAGATGGCTACGCTGGTTATATTGAAGGTAAAACTAATCAAGAA
GCTTTITATAAATACCTGTCAAAATTGTTGACCAAGCAAGAAGATAGCGAGAATTTTCITGA , AAAAATCAAGAATGAAGATTTCTTGAGAAAAÇAAAGGACCTTTGATAATGGCTCAATTCCA Y CACCAAGTCCATTTGACAGAGCTGAAAGCTATTATCCGCCGTCAATCAGAATACTATOCCTT CTTGAAAGAGAATCAAGATAGGATTGAAAAAATOCTTACCTITAGAATTCCTTATTATATCG GGCCACTAGCACGTGAGAAGAGTGA TTITGCATGGATGACTOGCAAAACAGATGACAGTAT TCGACCTTGGAATTTTGAAGACTTGGTTGATAAAGAAAAATCTGCGGAAGCTITTATCCATC GTATGACCAACAATGATTTTTATCTTCCTGAAGAAAAAGTTTTACCAAAGCATAGTCITATT TATGAAAAATTTACGGTCTATAATGAGTTGACTAAGGTTAGATATAAAAATGAGCAAGGTG AGACTTATTTTTTTGATAGCAATATTAAACAAGAAATCTTTGATGGAGTATTCAAGGAACAT CGTAAGGTATCCAAGAAGAAGTTGCTAGATTTTCTGGCTAAAGAATATOGAGGAGTTTAGGA TAGTAGATGTTATTGGTCTAGATAAAGAAAATAAAGCTTTCAACGCCTCATTGGGAACTTAÇ CACGATCTCGAAAAAATACTAGACAAAGATTTITCTAGATAATCCAGATAATGAGTCTATICT GGAAGATATCGTCÇCAAACTCTAAÇATTATTTGAAGACAGAGAAATGATTAAGAAGCGTCTT GAAAACTATAAAGATCTITITAÇAGAGTCACAACTAAAAAAACTCTATCGTCGTCACTATAC TGOCTGGGGACGATTGTCTGCTAAGTTAATCAATGGTATTCGAGATAAAGAGAGTCAAAAA ACAATCTTGGACTATCTTATTGATGATGGTAGATCTAATCGCAACTTTATGCAGTTGATAAA TGATGATGGTCTATCTITCAAATCAATTATCAGTAAGGCACAGGCTGGTAGTCATTCAGATA ATCTAAAAGAAGTTGTAGGTGAGCTTGCAGGTAGCCCTGCTATTAAAAAGGGAATTCTACA AAGTTTGAAAATTGTTGATGAGCTTGTTAAAGTCATGGGATACGAACCTGAACAAATTGTGG TTGAGATGGCGOGTGAGAATCAAACAACAAATCAAGGTCGTCGTAACTCTOGACAACGCTA TAAACTTCTTGATGATGGCGTTAAGAATCTAGCTAGTGACTTGAATOGGCAATATTTTGAAAG AATATCCTACGGATAATCAAGCGTTGCAAAATGAAAGACTTTTCCTTTACTACTTACAAAAC GGAAGAGATATGTATACAGGGGAAGCTCTAGATATTGACAATTTAAGICAATATGATATTG ACCACATTATTCCTCAAGCTTTCATAAAAGATGATTCTATTGATAATCGTGTTTTGGTATCAT CTGCTAAAAATCGTGGAAAGTCAGATGATGTTCCTAGCCTTGAAATTGTAAMAAGATTGTAAA STTTTCTIGGAAAAAATTACTTGATGCTAAGTTAA TGAGTCAGCGTAAGTATGATAATTTGAC TAAGGCAGAGCGCGGAGGCCTAACTTCCGATGATAAGGCAAGATTTATCCAACGTCAGTTG GTTGAGACACGACAA ATTACCAAGCATGTTGCCCGTATCTTGGATGAACGCTITAATAATGA GCTTGATAGTAAAGGTAGAAGGATCCGCAAAGTTAAAATTGTAACCTTGAAGTCAAATITG GTTYTTCAAATTTCCGAAAAGAATTTGGATTCTATAAAATTCGTGAAGTTAACAATTATCACCA TGCACATGATGCCTATCTTAATGCAGTAGTTGCTAAAGCTATTCTAACCAAATATCCTCAGT TAGAGCCAGAATTIGTCTACGGCGACTATCCAAAATATAATAGTTACAAAACGCGTAAATC CGCTACAGAAAAGCTATTTTTCTATTCAAATATTATGAACTTCTTTAAAACTAAGGTAACTTT AGOGGATGGAACCGTTGTTGTAAAAGATGATATTGAAGTTAATAATGATACGGGTGAAATT GTTTGGGATAAAAAGAAACACTTTGCGACAGTTAGAAAAGTCTTGTCATACCCTCAGAAÇA ATATCGTGAAGAAGACAGAGATTCAGACAGGTGGTTTCTCTAAGGAATCAATCTTGGCGCA TGGTAACTCAGATAAGTTGATTCCAAGAAAAACGAAGGATATTTATTTAGATCCTAAGAAA TATGGAGGTTTTGATAGTCCGATAGTAGCTTACTCTGTTTTAGITGTAGCTGATATCAAAAA GGGTAAAGCACAAAAACTAAAAACAGTTACGGAACTTTTAGGAATTACCATCATGGAGAGG TCCAGATTTGAGAAAAATCCATCAGCTITCCTTIGAATCAAAAGGCTATTTAAATATTAGGGC TGATAAACTAATTATTITGCCCAAGTATAGTCTGTTCGAATTAGAAAATGGGCGTCGTCGAT TACTTGCTAGTGCTGGTGAATTACAAAAAGGTAATGAGCTAGOCTTACCAACACAATITATG AAGTTCTTATACCTTGCAAGTCGTTATAATGAGTCAAAAGGTAAACCAGAGGAGATTGAGA AGAAACAAGAATTTGTAAATCAACATGTCTCITATTTTGATGACATCCTTCAATTAATTAAT GATTTTTCAAAACGAGTTATTCTAGCAGATGCTAATITAGAGAAAATCAATAAGCTTTACCA AGATAATAAGGAAAATATATCAGTAGATGAACTTGCTAATAATATTATCAATCTATITACIT TFTACCAGTCTAGGAGCTCCAGCAGCTTTTAAATTTITTGATAAAATAGTTGATAGAAAACGC
TATACATCAACTAAAGAAGTACTIAATTICTACCCTAATTCATCAATCTATTACTGGACTITAT GAAACACGTATTGATTTGGGTAAGTTAGGAGAAGATTGA (SEQ ID NO:489) SEQ ID NO:490:
ATGGCAGGTTGGCOGAACCGTTGTTGTAAATACACATTCTAAGCTCTCTTATAAAAATAATCA TCTGATTTITAAAGATTCTTATCAGACGGAAATGATTCATCTATCAGAGATTGACATTCTAAT E CATGGAAACAACAGATATCOGTTTTGTCGACCATGCTGATTAAACGTITGGTTGATGAAAATA - TTTTAGTTATATTTTGTGACGATAAACGCTTGCCAACAGCTATGTTAATGOCGTACTATGCCA GACATGATTCGAGTTTACAATTATCTAGGCAGATGTCATGGATTGAAGATGTCAAAGCAGAT . GTTTGGACATCAATTATIGCACAAAAAATTTTGAATCAGTCTTTITATCTCGGTGAGTGTTCT : TTCTTTGAAAAATCCCAGTCTATTATGAATCTCTACCATGACTTAGAACCTTTTGATCCITCT AATCGTGAGGGGCATGCTGCTAGGATTTATITCAATACACTITTTGGAAATGATITTICAAG AGAGCAGGATAATCCAATAAATGCTGGTTTAGACTACGGATATTCATTGCTITIGAGTATGT TTGCGCGTGAAGTTGTTAAGTGTGGTTGCATGACACAATTTGGCTTGAAGCATGCTAATCAA TTTAATCAGTTCAACCTAGCAAGCGATATTATGGAACCATTTCGCCCAATCGTTGATAGGAT TATTTATGAAAA TAGGCAGAGTGATTITGTCAAAATGAAAAGAGAACTCTTTTCTATGTTIT CAGAGACATACAGCTACAATGGTAAAGAAATGTATCTCTCAAATATIGTCAGCGACTATAC
CAAAAAAGTTATTAAGTCGCTAAATAGTGATGGGAATGGAATTCOGGAGTTTAGGATATGA (SEQ ID NO:490) í SEQ ID NO:491:
ATGCOGAATGATTTTAATGTTTGATATGCCTACTGAAACAGCAGAAGAACGGAAGGCGTATC GTAAGTTTAGAAAGTTTCTCTTGAGCGAAGGCTTTATCATGCATCAGTTITCTGTTTATAGTA AATTATTACTCAATAATACAGCTAATAATGCTATGATAGGTCGGCTTAAAGTGAATAATCCOT AAAAAGGGTAATATCACACTCTTAACAGTTACGGAAAAACAATTTGOGAGAATGGTITTACC
TCCATGGAGAACGCAACACAAGTGTTGCCAACTCTGATAGTCGCTTGGTTITCCTAGGAGAT TCTTATGATCAAGATTAA (SEQ ID NO:491) SEQ ID NO:492:
ATGATCAAGATTAATTTTCCAATTTTAGATGAACCATTAGTGTTAAGTAATGCTACGATTITA ACGATAGAAGATGTTTCAGTITATTCTTICATTGGTGAAACATTTTTATCAATATGACGTAGAT GAACATTTGAAATTATTTGATGATAAGCAGAAAAGTCTGAAGGCAACAGAGTTAATGCTGG TTACAGATATCTTAGGATACGATGTCAACTCAGCACCTATTCTAAAGTTGATACATGGTGAC TTAGAAAATCAATTCAACGAAAAGCCAGAAGTGAAATCAATGGTAGAAAAATTAGCAGCTA CTATTACAGAACTTATOGCATTTGAGTGTCTAGAGAATGAGCTTGATTTAGAATACGATGAA ATTAAGATTTTAGAACTCATTAAGGCACTGGGAGTCAAAATTGAGACACAGAGCGACACTA TCTITGAAAAATGTTTTGAAATTATACAAGTTTACCATTATTTAACGAAAAAGAATCTCTTG GTTTITOTTAATAGCGGAGCTTATCTTACCAAAGATGAAGTTATAAAA TTATGTGAATACAT
CAATTTAATGCAAAAGTCAGTACTCTTTCTAGAACCTAGAAGACTCTATGATITACCGCAAT ATGTTATTGATAAGGATTATTTCTTGATAGGCGAAAATATGGTATAA (SEQ ID NO:492) SEQ ID NO:493:
ATGAATAAGCCATATTCAA TAGGOCTTGACATCGGTACTAATTCCGTCGGATGGAGCATTAT TACAGATGATTATAAAGTACCTGCTAAGAAGATGAGAGTTTTAGGGAACACTGATAAAGAA TATATTAAGAAGAATCTCATAGGTGCTCTGCTTTTTGATGGCGGGAATACTGCTGCAGATAG ACGCTTGAAGCGAACTGCTCGTCGTCGITATACACGTOGTAGAAATCGTATTCTATATITAC AAGAAATTTTTGCAGAGGAAATGAGTAAAGTTGATGATAGTTTCTITCATCGATTAGAGGAT TCTTTITCTAGTTGAGGAAGATAAGAGAGGTAGCAAGTATCOCTATCTTTGCAACAATGCAGGA GGAGAAATATTATCATGAAAAA TITCCGACAATCTATCATTTGAGAAAAGAATTGGCTGAC AAGAAAGAAAAAGCAGACCTTOGTCTTGTTTATCTGGCTCTAGCTCATATCATTAAATTCAG ACGGGCATTTCCTAATTGAGGATGATAGATTTGATGTGAGGAATACCGATATTCAAAAACAA TATCAAGCCTTTTTAGAAATTTITGATACTACCTTTGAAAATAATCATTTGTTATCTCAAAAT GTAGATGTAGAAGCAATTCTAACAGATAAGATTAGCAAGTCTGCGAAGAAGGATOGCATCT TAGCOGCAGTATCCTAACCAAAAATCTACTGGTATTTTTGCAGAATTTTTGAAATTGATTGTC GGAAATCAAGCTGACTTCAAGAAACATTICAATITGGAGGATAAAACACCGCTTCAATTCG CTAAGGATAGCTACGATGAAGATTTAGAAAATCTTCTTGGACAGATTGGTGATGAATTTGCA GACTTATICTCAGTAGCGAAAAAGCTATATGATAGTGTTCTITTATCTGGCATTCTTACAGTA ACTGATCTCAGTACCAAGGCGCCACTTTCTGCCTCTATGATTCAGOGTTATGATGAACATCA TGAGGACTTAAAGCATCTAAAACAATTCGTAAA AGCTTCATTACCTGAAAATTATCGGGAA GTATTTIGCTGATTCATCAAAAGATGGCTACGCTGGCTATATTGAAGGCAAAACTAATCAAGA - AGCTTTTTATAAATATCTGTTAAAATTGTTGACCAAACAAGAAGGTAGCGAGTATITTCTIG AGAAAATTAAGAATGAAGATTTTITGAGAAAACAGAGAACCTTTGATAATGGCTCAATCOCC GCATCAAGTCCATTTGACAGAA TTGAGGGCTATTATTCGACGTCAATCAGAATACTATCCAT . TCTTGAAAGAGAATCAAGATAGGATTGAAAAAATCCTTACCTITAGAATTCCTTATTATGTC GGGCCACTAGÇACGTGAGAAGAGTGATTTTGCATGGATGACTCGCAAAACAGATGACAGTA TTCGACCTTGGAATTITGAAGACTTGGTTGATAAAGAAAAATCTGCGGAAGCTTITTATCCAT CGCATGACCAACAATGACCTCTATCTTCCAGAAGAAAAAGTITTACCAAAGCATAGICITAT TTATGAAAAATTTACTGTTTACAATGAATTAACGAAGGTTAGATTTTTGGCAGAAGGCTTTA AAGATTTTCAATITTTTAAATAGGAAGCAAAAAGAAACTATCTTTAACAGCTTGTTTAAGGAA AAACGTAAAGTAACTGAAAAGGATATTATTAGTTTTITTGAATAAAGTTGATGGATATGAAG GAATTGCAATCAAAGGAATTGAGAA ACAGTTTAACGCTAGCCTTTCAACCTATCATGATCTT AAAAAAATACTTGGCAAGGATTTCCTTGATAATACAGATAACGAGCTTATTTTGGAAGATAT CGTCCAAACTCTAACCTTATTTGAAGATAGAGAAATGATTAAGAAGTGTCTTGACATCTATA AAGATTTITITACAGAGTCACAGCTTAAAAAGCTCTATOGCCGTCACTATACTGGCTGGGGA OGATTGTCTGCTAAGCTAATAAATGGCATCCGAAATAAAGAGAATCAAAAAACAATCTTGG ACTATCTTATTGATGATGGAAGTOGCAAACCGAAACTTCATGCAGTTGATAAATGATGATGAT CTATCATTTAAACCAATTATTGACAAGGCACGAACTGGTAGTCATTCGGATAATCTGAAAGA AGTTGTAGGTGAACTTGCTGGTAGOCCTGCTATTAAAAAAGGGATTCTACAAAGTTTGAAAA TAGTTGATGAGCTGGTTAAAGTCATGGGCTATGAACCTGAACAAATOGTGGTTGAAATGGC ACGTGAGAACCAAACGACÇAGCAAAAGGATTAAGTOGTTCACGACAACGCTTGACAACCTTG AGAGAATCTCTTGCTAATTTGAAGAGTAATATTTTGGAAGAGAAAAAGCCTAAGTATGTGA AAGATCAAGTTGAAAATCATCATTTATCTGATGACOGTCTTITCCTITACTACTTACAAAACG GAAGAGATATGTATACAAAAAAGGCTCTGGATATTGATAATTTAAGTCAATATGATATTGA CCACATTATTCCTCAAGCTTTCATAAAAGATGATTCTATTGATAATCGTGTTTTGGTATCATC TGCTAAAAATCGTGGAAAATCAGATGATGTTOCTAGCATTGAAATTGTAAAAGCTCGCAAA ATGTTCTGGAAAAATTTACTGGATGCTAAGTTAATGAGTCAGCGTAAGTATGATAATTTGAC TAAGGCAGAGCGCGGAGGCCTAACTTCOGATGATAAGGCAAGATTTATCCAACGTCAGTTG GTTGAGACTCGACAAATTACCAAGÇATGTAGCTCGTATCTTGGATGAACGCTTCAATAATOGA AGTTGATAATGGTAAAAAGATTTGCAAGGTTAAAATTGTAACCTTGAAGTCAAATTTGGTTT CAAATTTCCGAAAAGAATTTGGATTCTATAAAATTCGTGAAGTTAATGATTATCACCATGCA CACGATGCTTATCTTAATGCAGTAGTTGCCAAAGCTATTCTAACCAAATATCCACAGTTAGA GCCAGAGTTTGTCTACGGAATGTATAGACAGAAAAAACTTTCOGAAAATCGTTCATGAGGAT AAGGAAGAAAAATATAGTGAAGCAACCAGGAAAATGTTIITCTACTCCAACTTGATGAATA TGTTCAAAAGAGTTGTGAGGTTAGCAGATGGTTCTATTGTTGTAAGACCAGTAATAGAAACT GGTAGATATATGAGAAAAACTGCATGGGATAAAAAGAAACACTITGCGACAGTTAGAAAA GTCTTGTCATACCCTCAGAACAATATCGTGAAGAAGAÇAGAGATTCAGACAGGTGGTTTCTC TAAGGAATCAATCTTGGCGCATGGTAACTCAGATAAGTTGATTCOCAAGAAAAACGAAGGAT ATITATTITAGATCCTAAGAAATATOGGAGGTTTTGATAGTCCGATAGTAGCTTACTCTGTTITTA GTTGTAGCTGATATCAAAAAAGGTAAAGCACAAAAACTAAAAACAGTTACGGAACTTTTAG GAATTACCATCATGGAGAGGTCCAGATTTGAGAAAAA TCCATCAGCTITCCTTGAATCAAAA GGTTATTTAAATATTAGGGACGATAAATTAATGATTTTACOGAAGTATAGTCTGTTCOGAATT AGAAAATGGGCGTOGTCGATTACTTGCTAGTGCTGGTGAATTACAAAAAGGTAACGAGCTA GCCTTACCAACACAATTTATGAAGTTCTTATACCTTGCAAGTOGTTATAA TGAGTCAAAAGG TAAACCAGAGGAGATTGAGAAGAAACAAGAATTTGTAAATCAACATGTCTCTTATTTTGAT GACATCCTTCAATTAATTAATGATITTTCAAAACGAGTTATTCTAGCAGATGCTAATTTAGA GAAAATCAATAAGCTTTACCAGGATAATAAGGAAAATATACCAGTAGATGAACTTGCTAAT AATATTATCAATCTATTTACTTTTACCAGTCTAGGAGCTCCAGCAGCTTITAAATTITITGAT AAAATAGTTGATAGAAAACGCTATACATCAACTAAAGAAGTACTTAATTCTACTCTAATCOCA TCAATCTATTACTGGACTTTATGAAACACGTATTGATTTGGGTAAATTAGGAGAAGATTGAT ATGGCAGGTTGGCGAACTGTTIGTTGTAAATACACATTCTAAGCTCTCTTATAAAAATAATCA TCTGATTTTTAAAGATTCTTATCAGACGGAAATGATTCATCTTTCAGAGATTGATATTCTAAT CATGGAAACGACAGATATTGTTITGTCGACTATGCTGATTAAACGTITGGTTGATGAAAATA TTTTAGTCATATTTTGTGATGATAAACGCTTGCÇAACAGCTATGTTAATGCCOGTACTATGCTA GACATGATTCGAGTTTACAATTATCTAGGCAGATGTCATGGATTGAGGATGTCAAAGCGGAT GTTTGGACATCAATTATTGCACAAAAAATTTTGAATCAGTCCTITTATCTCOGGTGAGTGTTCT - TTCTTTGAAAAATCCCAGTCTATTATGAATCTCTATCATGATTTAGAATCTTTTGACCCTTCC AATCGTGAAGGTCATGCAGCTAGGATITATITCAATAÇACTTTITGGAAATGATTTTTCAAG AGAGCAGGATAATCCAATAAATGCTGGTTTAGACTATGGATATTCTCTGATTTTGAGTATGT E TTGCGCGTGAAGTTGTTAAGTGTGGTTGCATGACACAATTTGGCTTAAAGCATGCTAATCAA
TTTAATCAGTTCAACCTAGÇAAGOGATATTATGGAACCATTTOGCCCAA TOGTTGATAGGAT q TATTTATGAAAATAGGCAGAGTGATTTTGTCAAAATGAAAAGAGAACTCTTTTCTATGTTIT
CAGAGACATACAGCTACAACGGTAAAGAAATGTATCTTTCAAATATTGTCAGCGATTACAC CAAAAAAGTTATTAAGTCGCTAAATAGTGATGGGAATGGAATTCCGGAGTTTAGGATATGA GTTATCGGTATATGAGAATGATITTTAATGTTTGATATGCCTACTGAAACAGTAGAAGAACGT AAGGCGTATCGTAAGTTTAGAAAGTTTCTGTTGAGCGAAGGTTTTATTATGCATCAGTTCTC TGTTTATAGTAAATTATTGCTCAATAATACAGCTAATAATGCCATGATAGGTCGGCTTAAAG TGAATAATCCTAAGAAAGGGAGTATAACTCTTTTGACAGTTACCGAGAAGCAGTTTGCAAG GATGGTTTATCTACATGGTGAACATAATATGAGTGTTGCCAACTCTGATAGTCGCTTYGGTTTT CCTAGGAGATTCTTATGATCAAGATTAATTTTCCAATITTAGATGAACCATTAGTGTTAAGT AATGCTACGATTTTAACGATAGAAGATGTTTCAGTTTATTCTTCATTGGTGAAACATTTITAT CAATATGACGTAGATGAACATTTGAAATTATTTGATGATAAGCAGAAAAGTCTGAAGGCAA CGGAGTTAATGTTAGTTACAGATATCTTAGGATACGATGTCAACTCAGCACCTATTCTAAAG TTGATACATGGTGACTTAGAAAATCAATTCAACGAAAAGCCAGAAGTGAAATCAATGGTAG AAAAATTAGCAGCTACTATTACAGAACTTATOGCATTTGAGTGTCTAGAGAATGAGCTTGAT TTAGAATACGATGAAATTACGATTTTAGAACTCATTAAGGCACTGGGAGTCAAAATTGAGA CACAGAGOGACACTATCTTTGAAAAATGTITTIGAAATTATACAAGTTTACCATTATITAACG AAAAAGAATCTCTTAGTTTTTGTITAATAGCGGAGCTTATCTTACCAAAGATGAAGTTATAAA
ATTATGTGAATACATCAATITAATGCAAAAGTCAGTACTCTTTCTAGAACCTAGAAGACTCT IS NO CASO AATATOTTATTGA TANGOATTATITOTTOA TAGOOSAAAATATOSTATAS, (SEQID >
SEQ ID NO:494:
ATGAATAAGCCATATTCAATAGGCCTTGACATCGGTACTAATTCCGTCGGATGGAGCATTAT TACAGATGATTATAAAGTACCTGCTAAGAAGATGAGAGTTTTAGGGAACACTGATAAAGAA TATATTAAGAAGAATCTCATAGGTGCTCTGCTTTTTGATGGCGGGAATACTGCTOCAGATAG ACGCTTGAAGCGAACTGCTOGTCGTCGTTATACACGTCGTAGAAATCGTATTCTATATTTAC AAGAAATTTTTGCAGAGGAAATGAGTAAAGTTGATGATAGTTTCTTTCATOGATTAGAGGAT TCTTTTCTAGTTGAGGAAGATAAGAGAGGTAGCAAGTATCCTATCTITGCAACAATGCAGGA GGAGAAATATTATCATGAAAAATTTCCGACAATCTATCATTTGAGAAAAGAATTGGCTGAC AAGAAAGAAAAAGCAGACCTTCGTCTTGTTTATCTGGCTCTAGCTCATATCATTAAATTCAG AGGGCATTTCCTAATTGAGGATGATAGATTTGATGTGAGGAATACCGATATTCAAAAAÇAA TATCAAGCCTTTTTAGAAATTTTTGATACTACCTTTGAAAATAATCATTTGTTATCTCAAAAT GTAGATGTAGAAGCAATTCTAACAGATAAGATTAGCAAGTCTGCGAAGAAGGATCGCATCT TAGCGCAGTATCCTAACCAAAAATCTACTGGTATTTTTGCAGAATTTTTGAAATTGATTGTC GGAAATCAAGCTGACTTCAAGAAACATTTCAATTTGGAGGATAAAACACCGCTTCAATTCOG CTAAGGATAGCTACGATGAAGATITAGAAAATCTTCTTGGACAGATTGGTGATGAATTTGCA GACTTATTCTCAGTAGCGAAAAAGCTATATGATAGTGTTCTTITATCTGGCATTCTTACAGTA ACTGATCTCAGTACCAAGGCGCCACTTTCTGCCTCTATGATTCAGCGTTATGATGAACATCA TGAGGACTTAAAGCATCTAAAACAATTOGTAAAAGCTTCATTACCTGAAAA TTATCGGGAA GTATTTGCTGATTCATCAAAAGATGGCTACGCTGGCTATATTGAAGGCAAAACTAATÇAAGA AGCTTTITATAAATATCTGTTAAAATTGTTGACCAAACAAGAAGGTAGOGAGTATTTICITG AGAAAATTAAGAATGAAGATTTTTTGAGAAAACAGAGAACCTTTGATAATGGCTCAATCOC GCATCAAGTCOCATTTGACAGAATTGAGGGCTATTATTOGACGTCAATCAGAATACTATOCAT TCTTGAAAGAGAATCAAGATAGGATTGAAAAAATCCTTACCTITTAGAATTCCTTATTATGTC GGGCCACTAGCACGTGAGAAGAGTGATTTTGCATGGATGACTCGCAAAACAGATGACAGTA TTCGACCTTGGAATTTTGAAGACTTGGTTGATAAAGAAAAATCTGCGGAAGCTTTTATCCAT CGCATGACCAACAATGACCTCTATCTTCCAGAAGAAA AAGTTTTACCAAAGCATAGTCTTAT TTATGAAAAATTTACTGTTTACAATGAATTAACGAAGGTTAGATTTTTGGCAGAAGGCTTTA AAGATTTTCAATTTITAAA TAGGAAGCAAAAAGAAACTATCTTTAACAGCTTGTTTAAGGAA
AAACGTAAAGTAACTGAAAAGGATATTATTAGTTTITIGAATAAAGTTGATGGATATGAAG Tr GAATTGCAATCAAAGGAATTGAGAAACAGTTTAACGCTAGCCTTTCAACCTATCATGATCIT
AAAAAAATACTTGOCAAGGATTTCCTTGATAATACAGATAACGAGCTTATTTTGGAAGATAT CCTCCAAACTCTAACCTTATTTGAAGATAGAGAAATGATTAAGAAGTGTCTTGACATCTATA ' AAGATTTTTTITACAGAGTCACAGCTTAAAAAGCTCTATCGOCGTCACTATACTGGCTGGGGA CGATTGTCTGCTAAGCTAATAAATGGCATCCGAAATAAAGAGAATCAAAAAACAATCTTGG ACTATCTTATTGATGATGGAAGTGCA AACCGAAACTTCATGCAGTTGATAAATGATGATGAT CTATCATTTAAACCAATTATTGACAAGGCACGAACTGGTAGTCATTCGGATAATCTGAAAGA AGTTGTAGGTGAACTTGCTGGTAGCCCTGCTATTAAAAAAGGGATTCTACAAAGTTTGAAAA TAGTTGATGAGCTGGTTAAAGTCATGGGCTATGAACCTGAACAAATCGTGGTTGAAATGGC ACGTGAGAACCAAACGACAGCAAAAGGATTAAGTCGTTCACGACAACGCTTGACAACCTTG AGAGAATCTCTTGCTAATTTGAAGAGTAATATTTTGGAAGAGAAAAAGCCTAAGTATGTGA AAGATCAAGTTGAAAATCATCATTTATCTGATGACCGTCTTTTCCTITACTACTTACAAAACG GAAGAGATATGTATACAAAAAAGGCTCTGGATATTGATAATITAAGTCAATATGATATTGA CCACATTATTCCTCAAGCTTTCATAAAAGATGATTCTATTGATAATCGTGTTTTGGTATCATC TGCTAAAAATCGTGGAAAATCAGATGATGTTCCTAGCATTGAAATTGTAAAAGCTCGCAAA ATGTTCTGGAAAAATTTACTGGATGCTAAGTTAATGAGTCAGCGTAAGTATGATAATTTGAC TAAGGCAGAGCGCGGAGGCCTAACTTCCGATGATAAGGCAAGATITATOCAACGTCAGTTG GTTGAGACTCGACAAATTACCAAGCATGTAGCTCGTATCTTGGATGAAOGCTTCAATAATGA AGTTGATAATGGTAAAAAGATTTGCAAGGTTAAAATTGTAACCTTGAAGTCAAATTTGGTTT CAAATTTCOGAAAAGAATTTGGATTCTATAAAATTCGTGAAGTTAATGATTATCACCATGCA CACGATGCTTATCTTAATGCAGTAGTTGCCAAAGCTATTCTAACCAAATATCCACAGTTAGA GCCAGAGTTTGTCTACGGAATGTATAGACAGAAAAAACTTTCGAAAATCGTTCATGAGGAT AAGGAAGAAAAATATAGTGAAGCAA CCAGGAAAATGTTTTTCTACTCCAACTTGATGAATA TGTTCAAAAGAGTTGTGAGGTTAGCAGATGGTTCTATTGTTGTAAGACCAGTAATAGAAACT GGTAGATATATGAGAAAAACTGCATGGGATAAAAAGAAACACTTTGCGACAGTTAGAAAA GTCTTGTCATACCCTCAGAACAATATCGTGAAGAAGACAGAGATTCAGACAGGTGGTTTCTC TAAGGAATCAATCTTGGCGCATGGTAACTCAGATAAGTTGATTCCAAGAAAAACGAAGGAT ATTTATITTAGATCCTAAGAAATATGGAGGTTTTGATAGTOCGATAGTAGCTTACTCTGTTITA GTTGTAGCTGATATCAAAAAAGGTAAAGCACAAAAACTAAAAACAGTTACGGAACTTTTAG GAATTACCATCATGGAGAGGTCCAGATTTGAGAAAAATCCATCAGCTTTCCTTGAATCAAAA GGTTATTTAAATATTAGGGACGATAAATTAATGATTTTACCGAAGTATAGTCTGTTCGAATT AGAAAATGGGCGTCGTCGATTACTTGCTAGTGCTGGTGAATTACAAAAAGGTAACGAGCTA GCCTTACCAACACAATITATGAAGTTCTTATACCTTGCAAGTCGTTATAA TGAGTCAAAAGG TAAACCAGAGGAGATTGAGAAGAAACAAGAATTTGTAAATCAACATGTCTCITATTTTGAT GACATCCTTCAATTAATTAATGATITTTCAAAACGAGTTATTCTAGCAGATGCTAATITAGA GAAAATCAATAAGCTTTACCAGGATAATAAGGAAAATATACCAGTAGATGAACTTGCTAAT AATATTATCAATCTATITACTTITACCAGTCTAGGAGCTCCAGCAGCTTTTAAATITTITGAT AAAATAGTTGATAGAAAACGCTATACATCAACTAA AGAAGTACTTAATTCTACTCTAATOCA
TCAATCTATTACTGGACTTTATGAAACACGTATTGATTTGGGTAAATTAGGAGAAGATTGA (SEQ ID NO:494) SEQ ID NO:495:
ATGGCAGGTTGGCGAACTGTTGTTGTAAATACACATTCTAAGCTCTCTTATAAAAATAATCA TCTGATTTITAAAGATTCTTATCAGACGGAAATGATTCATCTTTCAGAGATTGATATTCTAAT CATGGAAACGACAGATATTGTTITGTCGACTATGCTGATTAAACGTTTGGTTGATGAAAATA TTTTAGTCATATTTTGTGATGATAAACGCTTGCÇAACAGCTATGTTAATGCOGTACTATGCTA GACATGATTCGAGTTTACAATTATCTAGGCAGATOTCATGGATTGAGGATGTCAAAGCGGAT GTTTGGACATCAATTATTGCACAAAAAATTTTGAATCAGTCCTTTTATCTCGGTGAGTGTTCT TTCTTTGAAAAATCOCAGTCTATTATGAA TCTCTATCATGATTTAGAATCTTTTGACOCTTOC AATCGTGAAGGTCATGCAGCTAGGATITTATITCAATACACTTTTTGGAAATGATTITTCAAG AGAGCAGGATAATCCAATAAATGCTGGTTTAGACTATGGATATTCTICTGATTTTIGAGTATGT TTGCGCGTGAAGTTGTTAAGTGTGGTTGCATGACACAATTTGGCTTAAAGCATGCTAATCAA TTTAATCAGTTCAACCTAGCAAGCGATATTATGGAACCATTTCOGCCCAATOGTTGATAGGAT TATTTATGAAAATAGGCAGAGTGATTTTGTCAAAATGAAAAGAGAACTCTTITCTATGTTTT
CAGAGACATACAGCTACAACGGTAAAGAAATGTATCTTTCAAATATTGTCAGCGATTACAC e. CAAAAAAGTTATTAAGTOGCTAAATAGTGATGGGAATGGAATTCCGGAGTTTAGGATATGA (SEQ ID NO:495) - SEQ1D NO:496: ii ATGAGTTATCGGTATATGAGAATGATTITAATGTITGATATGCCTACTGAAACAGTAGAAGA
ACGTAAGGCGTATCGTAAGTTTAGAAAGTTTCTGTTGAGCGAAGGTTTTATTATGCATCAGT TCTCTGTTTATAGTAAATTATTGCTCAATAATACAGCTAATAATGCCATGATAGGTCGGCTT AAAGTGAATAATCCTAAGAAAGGGAGTATAACTCTTITTGACAGTTACCGAGAAGCAGTTTG
CAAGGATGGTTTATCTACATGGTGAACATAATATGAGTGTTGCCAACTCTGATAGTCOGCTTG GTTTTCCTAGGAGATTCTTATGATCAAGATTAA (SEQ ID NO:496) SEQ TD NO:497:
ATGATCAAGATTAATTTTCCAATTTITAGATGAACCATTAGTGTTAAGTAATGCTACGATTTTA ACGATAGAAGATGTTICAGTITATICTTCATIGGTGAAACATTTITATCAATATGACGTAGAT GAACATTTGAAATTATTTGATGATAAGCAGAAAAGTCTGAAGGCAACGGAGTTAATGTTAG TTACAGATATCTTAGGATACGATGTCAACTCAGCACCTATTCTAAAGTTGATACATGGTGAC TTAGAAAATCAATTCAACGAAAAGCCAGAAGTGAAATCAATGGTAGAAAAATTAGCAGCTA CTATTACAGAACTTATCGCATTTGAGTGTCTAGAGAATGAGCTTGATTTAGAATACGATGAA ATTACGATTTTAGAACTCATTAAGGCACTGGGAGTCAAAATTGAGACACAGAGCGACACTA TCTTTGAAAAATGTTTTGAAATTATACAAGTTTACCATTATTTAACGAAAAAGAATCTCITA GTTTTTGTTAATAGCGGAGCTTATCTTACCAAAGATGAAGTTATAAAATTATGTGAATACAT
CAATTTAATGCAAAAGTCAGTACTCTTTCTAGAACCTAGAAGACTCTATGATTTACOGCAAT ATGTTATTGATAAGGATTATTTCTTGATAGGCGAAAATATGGTATAA (SEQ ID NO:497)
SEQ ID NO:498:
ATGAAAAAACCTTACTCTATTGGACTTGATATTGGAACCAATTCTGTTGGTTGGGCTOTTGT GACAGATGACTACAAAGTTCCTGCTAAGAAGATGAAGGTTCTGGGAAATACAGATAAAAGT CATATCGAGAAAAATTTGCTTIGGCGCTITATTATTTGATAGCGGGAATACTGCAGAAGACAG ACGGTTAAAGAGAACTGCTOGCOGTCGTTACACACGTCGCAGAAATCGTATTITATATITGC AAGAGATTTTTTCAGAAGAAATGGGCAAGGTAGATGATAGTTTCTTTCATCGTTTAGAGGAT TCTTTTCTTGITACTGAGGATAAACGAGGAGAGCGCCATCCCATTITTGGGAATCTTGAAGA AGAAGTTAAGTATCATGAAAATTTTCCAACCATTTATCATTTGOGGCAA TATCTTGCGGATA ATCCAGAAAAAGTTGATTTGCGTTTAGTTTATITGGCTTTGGCACATATAATTAAGTITAGA GGTCATTTTTTAATTGAAGGAAAGTTTGATACACGCAATAATGATGTACAAAGACTGTTTCA AGAATTTTTAGCAGTCTATGATAATACTTTTGAGAATAGTTCGCTTCAGGAGCAAAATGTTC AAGTTGAAGAAATTCTGACTGATAAAATCAGTAAATCTGCTAAGAAAGATAGAGTTTTGAA ACTTTITCCTAATGAAAAGTCTAATGGCCGCTTTGCAGAATTTCTAAAACTAATTGTTGGTA ATCAAGCTGATTTTAAAAAGCATTITTGAATTAGAAGAGAAAGCACCATTGCAATTITCTAAA GATACTTATGAAGAAGAGTTAGAAGTACTATTAGCTCAAA TIGGAGATAATTACGCAGAGC TCTITTTATCAGCAAAGAAACTGTATGATAGTATOCTTTTATCAGGGATTTTAACAGTTACTG ATGTTGGTACCAAAGOGCCTTTATCTGCTTCGATGATTCAGCGATATAATGAACATCAGATO GATTTAGCTCAGCTTAAACAATTCATTCGTCAGAAATTATCAGATAAATATAACGAAGTTTT TTCTGATGTTTCAAAAGACGGCTATGCGGGTTATATTGATGGGAAAACAAATCAAGAAGCOTT TTTATAAATACCTTAAAGGTCTATTAAATAAGATTGAGGGAAGTGGCTATTTCCTTGATAAA ATTGAGCGTGAAGATTTTCTAAGAAAGCAACGTACCTTTGAÇAATGGCTCTATTCCACATCA GATTCATCTTCAAGAAATGCOGTGCTATCATTCGTAGACAGGCTGAATTTTATCCGTTTTTAGC AGACAATCAAGATAGGATTGAGAAATTATTGACTTTCCGTATTCOCTACTATGTTGGTCOCAT TAGCGCGCGGAAAAAGTGATTTTGCTTGGTTAAGTCGGAAATCGGCTGATAAAATTACACC ATGGAATTTTGATGAAATCGTTGATAAAGAATCCTCTGCAGAAGCTTTTATCAATCGTATGA CAAATTATGATTTGTACTTGCCAAATCAAAAAGTTCTTCCTAAACATAGTTTATTATACGAA AAATTTACTGTTTACAATGAATTAACAAAGGTTAAATATAAAACAGAGCAAGGAAAAACAG CATTTTITGATGCCAATATGAAGCAAGAAATCTTTGATGGOGTATITAAGGTTTATCGAAAA GTAACTAAAGATAAATTAATGGATTTCCTTGAAAAAGAATTTGATGAATTTCGTATTGTTGA TTTAACAGGTCTGGATAAAGAAAATAAAGTATTTAACGCTTCTTATGGAACTTATCATGATT TGTGTAAAATTTTAGATAAAGATTITTCTCGATAATTCAAAGAATGAAAAGATTTTAGAAGAT
ATTGTGTTGACCTTAACGTTATTTGAAGATAGAGAAA TGATTAGAAAACGTCTAGAAAATTA - CAGTGATITATTGACCAAAGAACAAGTGAAA AAGCTGGAAAGACGTCATTATACTGGTTGG x GGAAGATTATCAGCTGAGTTAATTCATOGTATTCGCAATAAAGAAAGCAGAAAAACAATTC
TTGATTATCTCATTGATGATGGCAATAGCAATCGGAACTTTATGCAACTGATTAACGATGAT GCTCTTTCTITCAAAGAAGAGATTGCTAAGGCACAAGTTATTGGAGAAACAGACAATCTAA ATCAAGTTGTTAGTGATATTGCTGGCAGCCCTGCTATTAAAAAAGGAATTTTACAAAGCTTG AAGATTGTTGATGAGCTTOTCAAAATTATGGGACATCAACCTGAAAATATCGTCGTGGAGAT GGCGCGTGAAAACCAGTTTACCAATCAGGGACGACGAAATTCACAGCAACÇGTITGAAAGGT TTGACAGATTCTATTAAAGAATTTGGAAGTCAAATTCTTAAAGAACATCCGGTTGAGAATTC ACAGTTACAAAATGATAGATTGTITCTATATTATTTACAAAACGGCAGAGATATGTATACTG GAGAAGAATTGGATATTGATTATCTAAGCCAGTATGATATAGACCATATTATCOCGCAAGCT TYTATAAAGGATAATTCTATIGATAATAGAGTATTGACTAGCTCAAAGGAAAATCGTGGAA AATCGGATGATGTACCAAGTAAAGATGTTGTTCGTAAAATGAAATCCTATTGGAGTAAGCT ACTTTCGGCAAAGCTTATTACACAACGTAAATTTGATAATTTGACAAAAGCTGAACGAGGTG GATTGACCGACGATGATAAAGCTGGATTCATCAAGCGTCAATTAGTAGAAACACGACAAAT TACCAAACATGTAGCACGTATTCTGGACGAACGATTITAATAÇCAGAAACAGATGAAAACAAÇ AAGAAAATTOGTCAAGTAAAAATTGTGACCTTGAAATCAAATCTTGTTTCCAATTTOCGTAA AGAGTTTGAACTCTACAAAGTGCGTGAAATTAATGACTATCATCATGCACATGATGCCTATC TCAATGCTGTAATTGGAAAGGCTTTACTAGGTGTTTACCCACAATTGGAACCTGAATTTGTT TATGGTGATTATCCTCATTTTCATGGACATAAAGAAAATAAAGCAACTGCTAAGAAATTITT CTATTCAAATATTATGAACTTCTTTAAAAAAGATGATGTCCGTACTGATAAAAATOGGTGAAA TTATCTGGAAAAAAGATGAGCATATTTCTAATATTAAAAAAGTGCTTTCTTATCCACAAGTT AATATTGTTAAGAAAGTAGAGGAGCAAACGGGAGGATTTTCTAAAGAATCTATCTTGCCGA AAGGTAATTCTGACAAGCTTATTCCTCGAAAAACGAAGAAATTTTATTGGGATACCAAGAA ATATGGAGGATTTGATAGCCCGATTGTTGCTTATTCTATTITAGTTATTGCTGATATTGAAAA AGGTAAATCTAAAAAATTGAAAACAGTCAAAGOCTTAGTTGGTGTCACTATTATGGAAAAG ATGACTTITGAAAGGGATCCAGTTGCTITTCTIGAGOGAAAAGGCTATCOGAAATGTICAAGA AGAAAATATTATAAAGTTACCAAAATATAGTTTATITAAACTAGAAAACGGACGAAAAAGG CTATTGGCAAGTGCTAGGGAACTTCAAAAGGGAAATGAAA TOGTITIGCCAAATCATITAG GAACCTTGCTTTATCACGCTAAAAATATTCATAAAGTTGATGAACCAAAGCATTTGGACTAT GTTGATAAACATAAAGATGAATTTAAGGAGTTGCTAGATGTTGTGTCAAACTTITCTAAAAMA ATATACTTTAGCAGAAGGAAATTTAGAAAAAATCAAAGAATTATATGCACAAAATAATGGT GAAGATCTTAAAGAATTAGCAAGTTCATITATCAACTTATTAACATTTACTGCTATAGGAGC ACCGGCTACTTITAAATTCTTTGATAAAAATATTGATOGAAAACGATATACTTCAACTACTG AAATTCTCAACGCTACOCTCATCCACCAATCCATCACCGGTCTITATGAAACGCGGATTGAT CTCAATAAGTTAGGAGGAGACTAATGGGCTGGCGGACAGTGGTTGTTAATACGCATTCCAA GTTGTCTTATAAGAACAACCACTTGATTTTTAAAGATGCTTATCAGACAGAGATGATTCATC TGTCTGAGATTIGACATCTTATTACTTGAGACAACAGATATTGTTTTGTCAAÇTATGCTAATCA AACGCTTGGTTGATGAGAATATTTTGGTCATITTITGTGATGAÇAAACGTCTGCCAACAGCC ATGCTCATGCCTTACTATGOGCGTCACGATTCOCAGCTTGCAGCTGAGTCATCAGATTICITOGG ACAGAAGAAGTGAAA TGCGATGTCTGGACAACAATCATCGCTCAAAAGATTTTGAATCAGT CATGTTATITGGGAGAATGTTTTTATTTTIGAAAAATCTCAGTCAATTATGGATITATATCATO ACTTAGAGCCTTTIGACCCTAGTAATCGAGAAGGACATTCTGCGCGGATTTATTTCAATACC TTATTTGGAAATGTTTTTTCCAGAGAACAAGATAATGATATTAATGCAGGTCTTGACTATGG TTATACGCTGCTGTTAAGTATGTTTGCGCOGTGAAGTGGTTGTATCTGGCTGTATGACACAATT TGGTCTCAAGCATGCCAACCAATTCAATCAGTTTAACTTTGCCAGTGATATTATGGAGCCTT TTCGTCCAATTGTTGACCGTATIGTTITATGAAAATCGAAATAACTCTTITATTAAAATAAMAÇ GTGAGCTATTCAGCATGTTTTCAGACACCTATCTTTATAATAATAAGGAGATGTATITGACA AATATTGTCAGCGATTATACCAAAAAGGTAATCAAGGCGCTGAATAA TGATGGGAAAGGAG TTCCTGAGTTTAGGATATGAGTTACCGATATATGCGAATGATTTTAATGTTTGATATGCCAA CAGATACTGCTGAGGAACGCAAAGCTTATCGTAAATTTCGGAAATITTTACTGAGCGAAGGT TTÇCATCATGCATCAGTTTTCAGTATACAGCAAGCTGCTTTTIGAATAACTCTGCCAATACAGC CATGATTGCCCGCTTGAAGGAGAATAATCCAAAGAAGOGCAATATCACCTTGTTGACOGTG . ACTGAAAAGCAGTTTGCCCGTATGATTTACCTGAATGGTGAGOGTGATACTAGCATTGCTAA TTCGGATTCACGACTGGTCTTTCTAGGGGAGGCTTTTCCTGATGAAACTTAATITTOCTATAT TOGATGAACCAATAACTCTTGAAAAATCTACGATTTTGGTATTAGAAGATGTGCAAGTTTIT GCTCAAATGGTGAGAAATCTTTATCAATATGATGAAGATAGTGAACTTAAATTTTTTAATAG É AAAATTTAAGAGTCTGAAACCATCTGAGTTAATGCTTGTGACAGATATTTTAGGOTTATGATG TCAATGCCOCGTCCTTGCTGAAGTTGGTTCACGCTGATTTAGAAAATCAGTTTAATGAAAAA CCAGAGGTTAAGTCTATGGTTGAAAAACTGGCAAATACCATTACGGAATTAATTGCTTATGA ATGTTTAGAAAATGAATTGGACTTAGAATATGATGAGATTACTATTTTAGAGTTAATCAAAG CTTTAGGCGTCAAAATTGAAACACAAAGTGATAOCATTTTTGAA AAA ATGTTTGAAGTCCTT CAAGTTTATAAGTATCTAAATAAAAAGAAGCTTCTOGTTTITATCAATACTITATCCTATTTT AAAAGAGAAGAAATCGCGCAAATTCTAGAATATATTCACTTATOCGATATGGTTGTTTTATT TCTTGAACCCOGTAAAATTGATGGTTTTGCTCAATATATTTTAGATGAAGATTATITCTTGAT AACAGAAAGCAACAACTAAATACGAATAATAAGATAGTTTCTAAATCAGGGGCTGTCITTT ATTATGGATTGACAAATGCGTATAATGCGTATAAAATAAAAAGAGAAATGTTATTTGOCATT AACAGGGAAAGAATTAGCTAAATTAGOGATAAACAATGGATGGGAAGAAGTTCGGGTGAG AGGAAGTCATCATCATTTCAAGAAAGATGGAGTATCTTATATTGTGACGATTCCTATTCATG GAAATAAAGTGCTTAAAATTGGTCTTGAAAAGAAACTCTTAAGGGATTTAAATTTATTATGA TAGAGGAGGAAGTCGTCATGTTAAAATCATATCCTGTAATTTTTCATAAGGAAGAGGAAGG GTATTGGGTTGAATITTCCTGAATTTGGCGGTGGTACGCAAGGGGAAGATTTGGAAGAAGOC ATGAAGAACGCTCGTCAGATGTTAGAAAGTGTGTTGGCATCTITATCTTGATGAAGGGTTGGT TCTACCCATTTCAAGCGATATTCAGAAAATATCTGTTGAAGATGGTTTTGCGACCATGATTC AAGCTGATCCTAGTCCTTATCTCAAAAATAACAAAGCTATTCGGAAAAATGTTACCOGTGCCT
GAGTGGTTGATACGATTAGCAGACCGTGACCGAGTAAATTATTCTGAAGTATTAACAAAGG CTTTGGAAAAGAAACTACAATTATAA (SEQ ID NO;498)
SEQ ID NO:499:
ATGAAAAAACCTTACTCTATTGGACTTGATATTGGAACCAATTCTGTTGGTTGGGCTGTTGT GACAGATGACTACAAAGTTCCTGCTAAGAAGATGAAGGTTCTGGGAAATACAGATAAAAGT CATATCGAGAAAAATTTGCTTGGOGCTTTATTATITGATAGCGGGAATACTGCAGAAGAÇAG ACGGTTAAAGAGAACTGCTOGCCGTCATTACACACGTCGCAGAAATCGTATTTTATATTTGC AAGAGATITTITCAGAAGAAATGGGCAAGGTAGATGATAGTTTCTTTCATCGTTTAGAGGAT TCTTTTCTTGTTACTGAGGATAA ACGAGGAGAGCGOCATCCCATTTTTGGGAATCTTGAAGA AGAAGTTAAGTATCATGAAAATTTTCCAACCATITATCATTTGCGGCAATATCTTGCGGATA ATCCAGAAAAAGTTGATITGCGTTTAGTITATITGGCTTTGGCACATATAATTAAGTITAGA GGTCATITTTTAATTGAAGGAAAGTTTGATACACGCAATAATGATGTAÇAAAGACTGTTTCA AGAATTTITAGCAGTCTATGATAATACTTTTGAGAATAGTTCGCTTCAGGAGCAAAATGTTC AAGTTGAAGAAATTCTGACTGATAAAATCAGTAAATCTGCTAAGAAAGATAGAGTTTTGAA ACTTTTTCCTAATGAAAAGTCTAATGGCCGCTTTGCAGAATTTCTAAAACTAATTOTTGGTA ATCAAGCTGATTTTAAAAAGCATTTIGAATTAGAAGAGAAAGCACCATTGCAATTITCTAAA GATACTTATGAAGAAGAGTTAGAAGTACTATTAGCTCAAATIGGAGATAATTACGCAGAGC TCTTTITATCAGCAAAGAAACTGTATGATAGTATCCTTITATCAGGGA TTTTAACAGTTACTG ATGTTGGTACCAAAGOGOCTTTATCTGCTTCGATGATTCAGCGATATAATGAACATCAGATGO GATTTAGCTCAGCTTAAACAATTCATTCGTCAGAAATTATCAGATAAATATAACGAAGTTIT TTCTGATGTTTCAAAAGACGGCTATGOGGGTTATATTGATGGGAAAACAAATCAAGAAGCTT : TTTATAAATACCTTAAAGGTCTATTAAATAAGATTGAGGGAAGTGGCTATTTCCTITGATAAA ATTGAGCGTGAAGATTITCTAAGAAAGCAACGTACCTITTGACAA TGGCTCTATTCCACATCA GATTCATCTTCAAGAAATGCGTGCTATCATTOGTAGACAGGCTGAATTTTATCCGTTTTTAGC AGACAATCAAGATAGGATTGAGAAATTATTGACTTTCCGTATTOCCTACTATGTTGGTCCAT TAGCGCGCGGAAAAAGTGATTTTGCTTGGTTAAGTCGGAAATCGGCTGATAAAATTACACC ATGGAATTTTGATGAAATCGTTGATAAAGAATCCTCTGCAGAAGCTTTTATCAATCGTATGA CAAATTATGATTTGTACTTGCCAAATCAAAAAGTTCTTCCTAAACATAGTITATTATACGAA AAATTTACTGTTTACAATGAATTAACAAAGGTTAAATATAAAACAGAGCAAGGAAAAACAG CATTTTTIGATGCCAATATGAAGCAAGAAATCTTTGATOGCGTATITAAGOTTTATCGAAMAA GTAACTAAAGATAAATTAATGGATTTCCTIGAAAAAGAATTTGATGAATTTCGTATTGTTGA - TTTAACAGGTCTGGATAAAGAAAATAAAGTATTTAACGCTTCTTATGGAACTTATCATGATT TGTGTAAAATTTTAGATAAAGATTTTCTCGATAATTCAAAGAATGAAAAGATTTTAGAAGAT ATTGTGTTGACCTTAACGTTATTTGAAGATAGAGAAA TGATTAGAAAACGTCTAGAAAATTA , CAGTGATTTATTGACCAAAGAACAAGTGAAAAAGCTGGAAAGACGTCATTATACTGGTTGG
GGAAGATTATCAGCTGAGTTAATTCATGGTATTOGCAATAAAGAAAGCAGAAAAACAATTC r TTGATTATCTCATTGATGATGGCAATAGCAATCGGAACTTTATGCAACTGATTAACGATGAT
GCTCTITCTITCAAAGAAGAGATTGCTAAGGCACAAGTTATTGGAGAAACAGACAATCTAA ATCAAGTTGTTAGTGATATTGCTGGCAGCCCTGCTATTAAAAAAGGAATTTTACAAAGCTTG AAGATTGTTGATGAGCTTGTCAAAATTATGGGACATCAACCTGAAAATATOGTCGTGGAGAT GGCGCGTGAAAACCAGTTTACCAATCAGGGACGACGAAATTCACAGCAACGTTTGAAAGOT TTGACAGATTCTATTAAAGAATTTGGAAGTCAAATTCTTAAAGAACATCCGGTTGAGAATTC ACAGTTACAAAATGATAGATTGTITCTATATTATITACAAA ACGGCAGAGATATGTATACTG
GAGAAGAATTGGATATTGATTATCTAAGCCAGTATGATATAGACCATATTATOCCOGCAAGCT í TTTATAAAGGATAATTCTATTGATAATAGAGTATTGACTAGCTCAAAGGAAAATCGTGGAA
AATCOGATGATGTACCAAGTAAAGATGTTGTTOGTAAAATGAAATCCTATTGGAGTAAGCT ACTTTCGGCAAAGCTTATTACACAACGTAAATTTGATAATTTGACAA A AGCTGAACGAGGTG GATTGACCGACGATGATAAAGCTGGATTCATCAAGCGTCAATTAGTAGAAACACGACAAAT TACCAAACATGTAGCACGTATTCTGGACGAACGATTTAATACAGAAACAGATGAAAACAAC AAGAAAATTCGTCAAGTAAAAATTGTGACCTTGAAATCAAATCITGITTCCAATTTCCGTAA AGAGTTTGAACTCTACAAAGTGOGTGAAATTAATGACTATCATCATGCACATGATGCCTATC TCAATGCTGTAATTGGAAAGGCTTTACTAGGTGTTTACCÇACAATTGGAACCTGAATTTGIT TATGGTGATTATCCTCATTTTICATGGACATAAAGAAAATAAAGCAACTGCTAAGAAATITIT CTATTCAAATATTATGAACTTCTTTAAAAAAGATGATGTCCGTACTGATAAAAATGGTGAAA TTATCTGGAAAAAAGATGAGCATATTTCTAATATTAAAAAAGTGCTTTCTTATCCACAAGTT AATATTGTTAAGAAAGTAGAGGAGCAAACGGGAGGATTTTCTAAAGAATCTATCTTGCCGA AAGOTAATTCTGACAAGCTTATTOCTCGAAAAACGAAGAAATTTTATTGGGATACCAAGAA ATATGGAGGATTTGATAGCCCGATTGTTGCTTATTCTATTTTAGTITATTGCTGATATTGAAAA AGGTAAATCTAAAAAATTGAAAACAGTCAAAGCCTTAGTTGGTGTCACTATTATGGAAAAG ATGACTTITGAAAGGGATCCAGTTGCTTITCTIGAGCGAAAAGGCTATCGAAATGTTCAAGA AGAAAATATTATAAAGTTACCAAAATATAGTTTATTTAAACTAGAAAACGGACGAAAAAGG CTATTGGCAAGTGCTAGGGAACTTCAAAAGGGAAATGAAA TOGTTTTGOCAAATCATITAG GAACCTTGCTITATCACGCTAAAAATATTCATAAAGTTGATGAACCAAAGCATTTGGACTAT GTTGATAAACATAAAGATGAATTTAAGGAGTTGCTAGATGTTGTGTCAAACTTITCTAAAAA ATATACTITAGCAGAAGGAAATITAGAAAAAATCAAAGAATTATATGCACAAAATAATGGT GAAGATCTTAAAGAATTAGCAAGTTCATITATCAACTTATTAACATTTACTGCTATAGGAGC ACCGGCTACTTTTAAATTCTTTGATAAAAATATTGATCGAAAACGATATACTTCAACTACTG
AAATTCTCAACGCTACÇOTCATCCACCAATOCATCACCGGTCTTTATGAAACGCGGATTGAT CTCAATAAGTTAGGAGGAGACTAA (SEQ ID NO:499) SEQ ID NO:500:
ATGGGCTGGCGGACAGTGGTTGTTAATACGCATTCCAAGTTGTCTTATAAGAACAACCACTT GATTTTTAAAGATGCTTATCAGACAGAGATGATTCATCTGTCTGAGATTGACATCTTATTACT TGAGACAACAGATATTGTTTTGTCAACTATGCTAATCAA ACGCTTGGTTGATGAGAATATTT TGGTCATTTTTTGTGATGACAAACGTCTGCCAACAGCCATGCTCATGCCTTACTATGCGCGTC ACGATTCCAGCTTGCAGCTGAGTCATCAGATTTCTTGGACAGAAGAAGTGAAATGCGATGTC TGGACAACAATCATCGCTCAAAAGATTTTGAATCAGTCATGTTATTTGGGAGAATGTTTTTA TTTTGAAAAATCTCAGTCAATTATGGATTTATATCATGACTTAGAGCCTTTTGACCCTAGTAA TCOGAGAAGGACATTCTGCGCOGGATITATITCAATACCTTATTTGGAAATGTTTTTTCCAGAG AACAAGATAATGATATTAATGCAGGTCTTGACTATGGTTATACGCTGCTGTTAAGTATGTTT GCGCGTGAAGTGGTTGTATCTGGCTGTATGACACAATTTGGTCTCAAGCATGCCAACCAATT CAATCAGTTTAACTTITGCCAGTGATATTATGGAGCCTTTTCGTCCAATTGTTGACCGTATTGT TTATGAAAATCGAAATAACTCTTITATIAAAATAAAACGTGAGCTATTCAGCATGTTTTCAG
ACACCTATCTITATAATAATAAGGAGATGTATTTGACAAATATTGTCAGCGATTATACCAAA AAGGTAATCAAGGCGCTGAATAATGATGGGAAAGOGAGTTCCTGAGTTTAGGATATGA (SEQ | 1D NO:500) i | SEQ ID NO:501:
ATGCGAATGATTITAATGTTTGATATGCCA ACAGATACTGCTGAGGAACGCAAAGCTTATCG TAAATITCGGAAATTTTTACTGAGCGAAGGTTTCATCATGCATCAGTTTTCAGTATACAGCA " AGCTGCTTTTGAATAACTCTGCCAATACAGCCATGATTIGCCCGCTTGAAGGAGAATAATCCA AAGAAGGGCAATATCACCTTGTTGACOGTGACTGAA AAGCAGTTTGOCCGTATGATTTACCOT
GAATGGTGAGOGTGATACTAGCATTGCTAATTCGGATTCACGACTGGTCTITCTAGGGGAGG CTTTTCCTGATGAAACTTAA (SEQ ID NO:501) SEQ ID NO:502:
ATGGTGAGAAATCTTTATCAATATGATGAAGATAGTGAACTTAAATTTTITAATAGAAAATT TAAGAGTCTGAAACCATCTGAGTTAATGCTTGTGACAGATATTTTAGGTTATGATGTCAATG CCCOGTCCTTGCTGAAGTTGGTTCACGCTGATTTAGAAAATCAGTTTAATGAAAAACCAGAG GTTAAGTCTATGGTTGAAAAACTGGCAAATACCATTACGGAATTAATTGCTTATGAATGTITT AGAAAATGAATTGGACTTAGAATATGATGAGATTACTATTTTAGAGTTAATCAAAGCTITAG GOGTCAAAATTGAAACACAAAGTGATACCATTTTITGAAAAAATGTTTGAAGTCCTTCAAGTT TATAAGTATCTAAATAAAAAGAAGCTTCTCGTTTITATCAATACTITATCCTATTITAAAAGA GAAGAAATCGOGCAAATTCTAGAATATATTCACTTATCCGATATGGTTGTTTTATITCTTGAA
CCOCGTAAAATTGATGGTTTTGCTCAATATATITTAGATGAAGATTATTTCTTGATAACAGA AAGCAACAACTAA (SEQ ID NO:502) SEQ ID NO:503:
ATGTTAAAATCATATCCTGTAATTTTTCATAAGGAAGAGGAAGGGTATTGGGTTGAATTTCC TGAATTTGGCGGTGGTACGCA AGGGGAAGATTTGGAAGAAGCCATGA AGAACGCTCGTCAG ATGTTAGAAAGTGTGTTGGCATCITATCTTGATGAAGGGTTGGTTCTACCCATTTCAAGCGA TATTCAGAAAATATCTGTTGAAGATGGTTTTGCGACCATGATTCAAGCTGATOCT, AGTOCTT ATCTCAAAAATAACAAAGCTATTCGGAAAAATGTTACCOTGCCTGAGTGGTTGATACGATTA
GCAGACCGTGACCGAGTAAATTATTCTGAAGTATTAACAAAGGCTTIGGAAAAGAAACTAC AATTATAA (SEQ ID NO:503) SEQ ID NO:504;
ATOGATAAGAAATACTCAATAGGCTTAGATATCGGCACAA ATAGOGTCGGATGGGCGGTGA TCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCOGCCA CAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGOAAGCO ACTOGTCTCAAACGGACAGCTOGTAGAAGGTATACACGTCGGAAGAATCGTATITGTITATOT ACAGGAGATITITTCAAATGAGATGGCGAAAGTAGATGATAGTTTCITTCATCGACTTGAAG AGTCTTTITTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGT, A SATGAAGTTGCITATCATGAGAAATATOCAACTATCTATCATCTGOGAAAA, AAATTGGTAGA TTCTACTGATAAAGCGGATTTGOGCTTAA TCTATTTGGCCTTAGOGCATATGATIAAGTTTCG TGGTCATITITTGATTGAGGGAGATITAAATCCTGATAATAGTGATGTGGACAAACTATTTA TCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGOGAGTA SATGCTAAAGCGATTCTITCTGCACGATTGAGTAAATCAAGACGATTAGAA AATCTCATTGC TCAGCTCCOCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTT TGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCT, AAATTACAGCTTTCAAAA GATACTT, ACGATGATGATITAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATIT STTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTITCAGATATCCTAAGAGTAAATAC TGAAATAACT; AAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACUATGAACATCATCAAG ACTTGACTCTTTTAAAAGCTITAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTIT TTITGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCT, AGOCAAGAAGAAT
TITATAAATITATCAAACCAATTITAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAA CTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCA |
AATTCACTTGGGTGAGCTOCATGCTATITTGAGAAGACAAGAAGACTTTTATCCATTTITAA AAGACAATCOGTGAGAAGATTGAAAAAATCTTGACTTTFTCG, IAATTCCTTATTATGTTGGTCCA i TTGGCGCGTGGCAATAGTCGTTTTGCATOGATGACTCGGAAGTCTGAAGAAACAATTACCCOO
ATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATITATTGAACGCATGA
CAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTITATGAG £ TATTITACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGOAATGCGAAAACC - AGCATITCTITCAGGTGAACAGAAGAAAGCCATTGTTGATITACTCTTICAAAACAAATCGAA AAGT; AACOGTTAAGCAATTAAAAGAAGATTATITCAAAAA AATAGAATOTTTTGATAGTGTT
GAAATTTCAGGAGTTGAAGATAGATTTAATGCITCATTAGGTACCTACCATGATTIGCTAAA AATTATTAAAGATAAAGATTITTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATT STTITAACATTGACCITATTTIGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGO TCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGOAC STTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGAT TTTTTGAAATCAGATGGTTTTGCCAATCGCAATITTATGCAGCTGATCCATGATGATAGTTTO ACATTTAAAGAAGACA' TTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAAC ATATTGCAAATTTAGCTGGTAGOCCTGCTATTAAAAAAGGTATITIACAGACTGTAAAAGTT GTIGATGAATTGGTCAAAGTAA TGGGGCGGCATAAGCOCAGAAAATATCGTTATTGAAATOO CACGTGAAAATCAGACAACTCAAAAGOGCCAGAA AAA TTCGCGAGAGCOGTATGAAACGAA TCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATAC TCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTOCAAA ATGGAAGAGACATGTATOTGO ACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGT TTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAA ATCGGATAAOGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGUGAGACAACTT CTAAAOGCCAAGTTAATCACT CAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAG SGTTTGAGTGAACTTGATAAAGCTGGTTITATCAAACGCCAATTGGTTGAAACTCGCCAAATC ACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATA AACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAA GATTTCCAATTCTATAAAGT: 'ACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCT ARATOCCGTCGTTGGAACTGCITIGATTAAGAAATATOCAAAACTTGAATCGGAGTTTGTCT ATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGA AATAGGC AAAGCAACCGCAAAATATTTCITITACICTAATATCATGAACTTCTICAAAACAGAAATTAC ACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATOGOGAA ACTGOAGAA ATTGTCTGGGATAAAGGGOGAGATTTTGCCACAGTOCGCAAAGTATTGTCCATGCCOCAAGT CAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACÕA AAAAGAAATTCGGACAAGCTTATTGCTOGTAAAAAAGACTGGGATCCAAAAAAATATOGTO STTITGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTA AGGTGOA AAAAGGGAAA TOGAAGAAGTTAAAATCOGTTAAAGAGTTACT, 'AGGGATCACAATTATGGAAAGAAGTTCCT TTGAAAAAAATCCGATIGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTA, AAAAAGACTT AATCATTAAACTACCTAAATATAGTCITITTGAGTITAGAAA ACGGTCGTAAACGGATGCTGO CT AGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAA TATOTGAATTT TITATATITAGCTAGTCATTATGAAAAGTTGAAGGGT, AGTCCAGAAGATAACGAACAA AAA CAATIGTTTGTGGAGCAGCATAAGCATTATITAGATGAGATTATTGAGCAAATCAGTGAATT TTCTAAGCGTGTTATTTTAGCAGATGCCAATITAGATAAAGTTCITAGTGCATATAACAAAC ATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATITATTTACGTTGACGAA TCTTGGAGCTCCOGCTGCTITTAAATATITIGATACAACAATTGATCGTAAAGGATATACGTC TACAAAAGAAGTITTAGATGCCACTCTTATCCATCAATCCATCACTGGTCITTATGAAACAC GCATTGATTTGAGTCAGCTAGGAGGTGACTGATGGCTGGTTGOCGTACTGTTGTGGIAAATA COPACTCGAAA ITTATCCTATAAGAATAATCATCTGATTTTTAAGGATGCCTATAAAACGGAG CTGATCCATITATCAGAAATTGATATTTTGITATTAGAAACGACCGATATTGTCTTGTCCACT ATGCTGGTAAAACGGCTAGTGGATGAGAA TGTCCTTGTCATATICIGTCA TGATAAACGATT ACCAACAGCTATGCTGATGCCTTTITATGGTCGTCATGATTCGAGTTTACAGCTTGGGAAAC AAATGTCCTGGTCAGAAACAGTCAAATCGCAGGTTTGGACGACOATTATTGCTCAAAAGAT TTTGAATCAATCTTGCTATCTAGGAGCATGCTCCTATTTTGAAAAATCCCAATCTATTATOGA TTTATATCATGGTTTGGAAAATTTTGATCOGAGTAATCGAGAAGGOCA TGCAGOGAGAATTT ATTITAATACACTTTTTGGGAACGATTTCTCAAGAGATITGGAGCATCCAATCAATGCAGGT CTGGATTATGGTTATACTTTATTATTGAGTATGTTTGCGCGTGAAGTGOTTGTGTCTGGATOT ATGACTCAGTTTGGGCTTAAACACGCTAATCAGTTTAATCAGTICAATITTGCTAGCGATATT - ATGGAACCATITAGGCCTITAGTGGATAAGATTGTITATGAAAATOGAAATCAGCCTITICC CAAAATAAAGAGAGAGTT, ATITACTTTGTTITCAGATACATTTTICATATAATGGTAAAGAGA TGTATCTCACGAATATTATTAGCGATTATACT, AAAAAAGTTGTCAAAGCTCTGAATAATGAA GGGAAAGGAGTTCCTGAATTTAGGATATGAGTTATAGATATATGAGAATGATACTTATGTIT E. GATATGCCGACGGACACOGCTGAGGAACGAAAAGCCTATCGAAAA TTTCGGAAATITTTAC -. TTAGTGAAGGGTTTATCATGCATCAATITTCTATITATAGTAAGTTGCTGTITGAATAATACAG CTAACAATGCCATGATTGGTOGGCTGAGGGAGCATAATCCTAATAAAGOAAATATTACATT ACT! AACGGTCACGGAAAAACAGTTTGCACGAATGATITATITACATGGTGAAAGAAATAAT TGTATTGCAAACTCCGATGAAAGACTTGTATTTCTTGGGGAGGCTTTTGATGAATCTT, AATIT TTCCTTACTAGATGAACCGATTCCATTAAGAGGOGGTACAATTCTTGTGCTICGAAGATGTCT GTGTATTTTCAAAAATAGTGCAATATTGTT, 'ACCAATATGAGGAAGATTCTGAACITAAATIT TTTGATCACAAGATGAAAACAATCAAAGA ATCAGAAATCATGCTTGTAACAGATATITTAG GATTTGATGTTAACTCCTCAACCATTTTAAAATTGATICATGCAGATITAGAATCTCAATITA ATGAGAAACCCGAAGTGAAATCGATGATTGACAAATTGGTTGCTACGATTACAGAACTGAT FTGTETITGAATGCTTAGAAAATGAATTAGATITAGAGTATGATGAAATCACAATCCTGGAAT TGATTAAGTCCTTAGGAGTAAAAGT, AGAAACGCAAAGTGATACTATTTTITGAAAAATOTCTA GAGATACTTCAAATTITCAAATATCICACTAAGAAAA AGTTGCTTATTTTTGTCAATAGCGGO AGCTTTTCTAACAAAGGATGAAGTGGCTAGTTTACAAGAGTATATATCATTGACAAATTTAA
CASGTTCTCTTTTTAGAACCACGTGAACTATATGATTTTCCGCAGTATATTTTAGATGAAGATT ATTTCTTAATAACTAAAAATATGGTATAA (SEQ ID NO:504) SEQ ID NO:505:
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAA ATAGCGTOGGATGGGCGGTGA TCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACOGOCA GCAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATITGACAGTGGAGAGACAGCGGAA GOO ACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATITGTTATOT ACAGGAGATTTTTTCAAATGAGATGGOGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAG AGTCTTTTITGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTA GATGAAGTTGCTTATCATGAGAAATATOCAACTATCTATCATCTGOGAAAAAAATTGGTAGA TTCTACTGATAA AGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTITCG TGGTCATITITTGATTGAGGGAGATTTAMATCCTGATAATAGTGATGTGGACAAACTATITA TCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTA GATGCTAAAGCOGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTOGC TCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTITGTCATTGGGTT TGACCCCTAATTITAAATCAAATITTGATITGOGCAGAAGATGCTAAATTACAGCTTTCAAAA GATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTT GTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAC TGAAATAACTAAGGCTOCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCÇAAG ACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTT TTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAAT TTTATAAATTTATCAAACCAATTTTAGAAAAAA TGGATGGTACTGAGGAATTATTGGTGAAA CTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTIGACAACGGCTCTATTOCCCATCA AATTCACTTGGGTGAGCTGCATGCTATTTTIGAGAAGACAAGAAGACTTTTATOCATTTITAA AAGACAATOGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTOCA
E TTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCC t ATGGAATITTGAAGAAGTTGTOGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGA
CAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAAÇATAGTTTGCTTTATGAG TATTTTACGGTITATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACC AGCATITCTTTCAGGTGAACAGAAGAAAGCCATTGITGATITACTCTTCAAAACAAATCGAA AAGTAACCGTTAAGCAATTAAAAGAAGATTATTITCAAAAAAATAGAATGTTTTGATAGTGTT GAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAA AATTATTAAAGATAAAGATTTTTTGGATAA TGAAGAAAATGAAGATATCTTAGAGGATATT GTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGC TCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGOCGTTATACTGGTTGGGGAC GTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCÇAATCTGGCAAAACAATATTAGAT ' TTTTTGAAATCAGATGGTTTTGCCAATCGCAATITTATGCAGCTGATOCATGATGATAGTITG ACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTITACATGAAC ATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTT GTTGATGAATTGGTCAAAGTAA TGGGGCGGCATAAGCCAGAAAATATOGTTATTGAAATGG
CACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAA hi TCGAAGAAGGTATCAAAGAATTAGGAAGTCAGA TICTTAAAGAGCATCCTGTTGAAAATAC
TCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGO ACCAAGAATTAGATATTAATCGTITAAGTGATTATGATGTCGATCACATTGTTCCACAAAGT TTCCTTAAAGACGATTCAA TAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAA ATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTOGAGACAACTT CTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATITAACGAAAGCTGAACGTGGAG GTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATO ACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATA AACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTOCGAAAA GATITCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCT AAATGCCGTCOGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCT ATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGC AAAGCAACOGCAAAATATITCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTAC ACTTGCAAATGGAGAGATTCGCAA ACGCCUTCTAATOGAAACTAATGOGAAAACTGGAGAA ATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGT CAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTITACCA AAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTG GTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAA TCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCT TTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTT AATCATTAAACTACCTAAATATAGTCTITTTGAGTITAGAAAACGGTCGTAAACGGATGCTGG CTAGTGCCGGAGAATTACAA AAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATIT TITATATITAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAA AAA CAATTGTTTGTGGAGCAGCATAAGCATTATITAGATGAGATTATTGAGCAAATCAGTGAATT TTCTAAGCGTGTTATTTTAGCAGATGOCAATTTAGATAAAGTTCTTAGTGCATATAACAAAC ATAGAGACAAACCAATACGTGAACAAGÇAGAAAATATTATICATTTATTTACGOTTGACGAA TCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAA TTGATCGTAAACGATATACGTC
TACAAAAGAAGTTITAGATGCCACTCTTATOCATCAA TCCATCACTGGTCTTTATGAAACAC GCATTGATTTGAGTCAGCTAGGAGGTGACTGA (SEQ ID NO:505) SEQ ID NO:506:
ATGGCTGGTTGGCGTACTGITGTGGTAAATAOCCACTOGAAATTATOCTATAAGAATAATCA TCTGATTTTTAAGGATGCCTATAAAACGGAGCTGATCCA TTTATCAGAAATTGATATTTTGIT ATTAGAAACGACCGATATTGTCTTGTCCACTATGCTGGTAA AACGGCTAGTGGATGAGAATG TCCTTGTCATATTCTGTGATGATAAACGATTACCAACAGCTATGCTGATGCCTTTTTATGGTC GTCATGATTOGAGTTTACAGCTTGGGAAACAAATGTCCTGGTCAGAAACAGTCAAATCGCA GGTTTGGACGACGATTATTGCTCAAAAGATTTTGAATCAATCTTGCTATCTAGGAGCATGCT CCTATTTTGAAAAATCCCAATCTATTATGGATTTATATCATGGTTTOGAAAATTTTGATCCGA GTAATCGAGAAGGGCATGCAGCGAGAATTTATITTAATACACTITITGGGAACGATTTCTCA AGAGATITGGAGCATCCAATCAATACAGGTCTGGATTATGGTTATACTITATTATIGAGTAT GTTTGCGCGTGAAGTGGTTGTGTCTGGATGTATGACTCAGTTTGGGCTTAAACACGCTAATC AGTITAATCAGTTCAATTTTGCTAGCGATATTATGGAACCATTTAGGCCTTTAGTGGATAAG ATTGTITATGAAAATCGAAATCAGCCTITTCCCAAAATAAAGAGAGAGTTATTTACTITGIT TTCAGATACATTTTCATATAATGGTAAAGAGATGTATCTCACGAATATTATTAGCGATTATA
CTAAAAAAGTTGTCAAAGCTCTGAATAATGAAGGGAA AGGAGTTCCTGAATTTAGGATATG A(SEQ ID NO:506) SEQ ID NO:507:
ATGAGTTATAGATATATGAGAATGATACTTATGTTTGATATGCCGACGGACACCGCTGAGGA ACGAAAAGOCTATCGAAAATTTCGGAAATTTTTACTTAGTGAAGGGTTTATCATGCATCAAT TTTCTATITATAGTAAGTTGCTGTTGAATAATACAGCTAACAATGCCATGATTGGTCGGCTOG AGGGAGCATAATCCTAATAAAGGAAATATTACATTACTAACGGTCACGGAAAAACAGTTTG
CACGAATGATTTATITACATGGTGAAAGAAATAATTGTATTGCAAACTCCGATGAAAGACTT . GTATTTCTTGGGGAGGCTTTIGATGAATCTTAA (SEQ ID NO:507) SEQ ID NO:508:
ATGAATCITAATITITCCTTACTAGATGAACOGATTOCATTAAGAGGCGGTACAATTCTTGTG CTCOGAAGATGTCTGTGTATTTICAAAAATAGTGCAATATTGTTACCAATATGAGGAAGATTC TGAACTTAAATTITITGATCAÇAAGATGAAAACAATCAAAGAATCAGAAATCATGCTTGTAA CAGATATTITAGGATTTGATGTTAACTCCTCAACCATTTTAAAATTGATTCATGCAGATITAG AATCTCAATTTAATGAGAAACCCGAAGTGAAATCGATGATTGACAAATTGGTTGCTACGATT : ACAGAACTGATTGTCTTTGAATGCTTAGAAAATGAATTAGATTTAGAGTATGATGAAATCAC AATCCTGGAATTGATTAAGTCCTTAGGAGTAAAAGTAGAAACGCAAAGTGATACTATITITG AAAAATGTCTAGAGATACTTCAAATTTTCAAATATCTCACTAAGAAAAAGTTGCTTATTTIT GTCAATAGCGGAGCTTTTCTAACAAAGGATGAAGTGGCTAGTTTACAAGAGTATATATCATT
GACAAATTTAACAGTTCTCTTTTTAGAACCACGTGAACTATATGATTTTCOGCAGTATATTTT AGATGAAGATTATITCTTAATAACTAAAAATATGGTATAA (SEQ ID NO:508) SEQ ID NO:S517;
ATGGATAAGAAATACTCAATAGGCTTAGATATOGGCACAA ATAGCGTCGGATGGGCGGTGA TCACTGATGATTATAAGGTTCCGTCTAAAAAGCTCAAGGGTCTGGGAAATAÇAGACCOGOCA CGGTATCAAAAAAAATCTTATAGGGGCTCTITTATITGACAGTGGAGAGACAGCGGAAGCG ACTCGTCTCAAACGGACAGCTOGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCT ACAGGAGATTTTTTCAAATGAGATGGCGAAA: IGTAGATGATAGTTTCTITCATCGACTTGAAG AGTCTITTTTGGTGGAAGAAGA! ICAAGAAGCATGAACGTCATCCTATITITGGAAATATAGTA SATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGOCAGA TTCTACIGATAAAGTGGATTTGCOCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCO TGSTCATTITTTGATTGAGGGAGATITAAATCCTGATAATAGTGATGTGGACAAACTATITA TCCAGTTGGOTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTA SATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGE TCAGCTCOCCGGTGAGAAGAAA AATGGATTGTTTGGGAATCTCATTGCTTTOTCATICGGAT TGACCOCTAATTITAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTICAAAA GATACTT, ACGATGATGATITAGATAATITATTGGCGCAAATTGGAGATCAATATGCTGATIT GTTTTTGGCAGCTAAGAATITATCAGATGCTACTITACITICAGATATCCTAAGAGTAAATA GTGAAATAACT, AAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAA SGACTTGACTCITITAAAAGCTITAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATOTT TITTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAA TTITATAAATITATCAAACCAATTITAGAAAAAATGGATGGTACTGAGGAATTATTGGOCGAA ACTAMATOGTGAAGATTTGCTGOGCAAGCAACGGACCTITGACAACGGCTCTATTCCCTATE AAATTCACTTGOGTGAGCTGCATGCTATITTGAGAAGACAAGAAGACTTTTATCCATITITA AAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTITTTOGAATTCCTTATTATGTTGGTCC
ATTGGCGOGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCC a CATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTICAGCTCAATCATTTATTGAACGCATO
ACAAACTTTGATAAAAATCTTCCAAA TGAAAAAGTACTACCAAAACATAGTTTGCTITATGA ST ATTITACGOTTTATAACGAATTGACAAAAGTCAAATATGTTACTGAGGGAATGOGAA, AA CCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATITACICTTCAAAACAAATCG AAAAGTAACCGTTAAGCAATTAAAAGAAGATIATTTCAAAAAAATAGAATGTTTTGATAGT GTTGAAATTTCAGGAGTTGAAGATAGATITAATGCTTCATTAGGTACCTACCATGATTTGCT AAAAATTATTAAAGATAAAGATTITTTGGATAATGAAGAAAACGAAGATATCTTAGAGGAT ATTGTTITAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATA TGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACT: GGTTGÇEG GACGTTTGTCTCGA, AAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTA . GATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTT TATGCAGCTGATCCATGATGATAGT TTGACATTTAAAGAAGACATTCAAAA AGCACAAGTGTCTOGACAAGGCGATAGTITACATO AACATATTGCAAATITAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAA
STTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAA TGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGTGAGCOT, ATGAAAC hi GTATTGAAGAAGGAATAAAAGAACTAGGAAGTGATATTCTAAAGGAGTATCCTGTTGAAAA CACTCAATTACAAAATGAAAAGCTCT, ATCTCTATTATCTCCAAAATGGAAGAGACATGTATG
TGGACCAAGAATTAGATATTAATCGTTITAAGTGATIATGATGTCGATCACATTGTTCCACAA AGTTTCCITAAAGACGATTCAATAGACAATAAGGTCTTAACGOGTTCTGATAAAAATCGTGO TAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAA CTTCTAAACGOCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACAAAAGCTGAACGTGG AGGTTTGAGTGAACTTGATAAAGTTGGTTITATCAAACGCCAATTGGTTGAAACTCOCCAAA TCACTAAGCATGTGGCACAAATITTGGATAGTCGCATGAATACTAAATACGATGAAAATGA TAAACTTATTCGAGAGGTTAGAGTGATIACCITAAAA TCTAAATTAGTTTCTGACTTCCGAA AAGATTTCCAATICTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTAT CTTAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGT CTATGGTGATTATAAAGTTT, 'ATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAGGAAATAG GEAAAGCAACCGCAAAATATITCITITACTCTAATATÇATGAACTTCTTCAAAACAGAAATT ACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATOGAAACTAATGGGGAAACTGGAG AAATTGTCTGGGATAAAGGGCGAGATTTTGOCACAGTGCGCAAAGTATTGTCCATGCCCCA AGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGA TTCTCCAAGGAGTCAATTTTA CCAAAAAGAAATTCGGACAAGCTTATTGCTOGTAAAAAAGACTGGGATOCAAAAAAATATG GTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTA GTOGTTGCTAAGGTGGAAAAAGGG AAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACA, ATAATGGAAAGAAGCT CTTTTGAAAAAGATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAGAAA AGA CTTAATCATTAAACTACCT;, TAMATATAGTCTTTITGAGTTAGAAAACGGTCGTAAACGGATGC TGGCTAGTGOCGGAGAA TTGCAAAAAGGAAATGAGCTAGCTCTGCCAAGCAAATATOTGAA TTTTITATATITAGCTAGTCATTATGAAA AGTTGAAGGGTAGTCCAGAAGATAACOGAACAAA AACAATTGTITGTGGAGCAGCATAAGCATTATITAGATGAGATTATIGAGCAAATCAGTGAA TTTTCTAAGCGTGITATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAA ACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATICATITATTTACGTTGACG AATCTTGGAGCTCCOGCTGCTTITAMATATITTGATACAACAATTGATCGTAAACGATATAC GTCTACAAAAGAAGTTTTAGATGOCACT CTTATCCATCAATCCATCACTGGTCTITATGAAA CACGCATTGATTTGAGTCAGCTAGGAGGTGACTGATGGCTGGTTGGCGTACTGTTGTGGTAA ATACCCACTCGAAATTATCCTATAAGAA TAATCATCTGATTTTTAAGGATGCCTATAAAACG GAGCTGATCCATTTATCAGAAATTGATATITTGTTATTAGAAACGACCGATATTGTCTTGTCOO ACT, ATGCTGGTAAAACGGCTAGTGGATGAGAATGTCCTTGTCATATICTGTGATGATAAACG ATTACCAACAGCT, ATGCTGATGCCTITITATGGTCGTCATGATTCGAGTTTACAGCTTGGGA AACAMAATGTCCTGGTCAGAAACAGTCAAA TCGCAGGTTTGGACGACGATTATTGCTCAAAA SGATTTTGAATCAATCTTGCTATCTAGGAGCATGCTCCTATTTTGAAAAATCCCAATCTATTAT GGATTTATATCATGGTTTGGAAAATTITGA TCCGAGTAATOGAGAAGGGCATGCAGOGAGA ATITATTTTAATACACTITITGGGAACGATTTCTCAAGAGATTTGGAGCATCCAATCAATGC AGGTCTGGATTATGGTTATACTITATTATTGAGTATGTTTGCGCGTGAAGTGGTTGTGTCTGO ATGTATGACTCAATTTGGACTCAAACACGCCAATCAGTTTAATCAGTICAATTTTGCTAGCG ATATTATGGAACCATTTAGGCCTTTGGTGGATAAGATTGTITATGAAAA' TCGAAATCAGCCT TTTCCCAAAATAAAGAGAGAGTTATTTACTITGTTTTCAGATACATITTCATATAATGGT, AAA GAGATGTATCTCACGAATATTATTAGCGATTATACTAAAAAAGTTGTCAAAGCTCTGAATAA TGAAGGGAAAGGAGTTCCTGAATTTAGGATATGAGTT; 'ATAGATATATGAGAATGATACTTA TGTTTGATATGCCGACGGACACTGCTGAGGAACGAAAAGCTTATCGAAAATTTCGGAAATTT TTACTTAGTGAAGGGTTTATCATGCATCAATITTCTA TTTATAGTAAGTTACTGTTGAATAAT ACAGCTAACAACGCOCATGATTGGTCGGCT 'GAGGGAGCATAATCCTCATAAAGGAAATATTA CATTACTAACAGTCACAGAAAAACAGTTTGCACGAATGATITATITACATGGTGAAAGAAA TAATTGTATTIGCAAACTCCGATGAGAGACTTGTATTTCTTGGGGAGGCTTTTGATGAATCIT AATTTTCCCTTATTAGATGAACCGATTCCATTAAGAGGCGGTACAATTCTTGTGCTCGAAGA TGTCTOTGTATTTTCAAAAATAGTGCAATATTGTTACAAATATGAGGAAGATTCTGAACTTA F AATTTITITGATCACAAGATGAAAACCATCAAAGAATCAGAAATCATGCTTGTAACAGATATT TTAGGATTTGATGTTAACTCCTCAACCATTTTAAAATTGATTCATGCAGATTTAGAATCTCAA TTTAATGAGAAACOOGAAGTGAAATCGATGATTGACAAATTGGTTGCT, ACGATTACAGAAC
TGATTGTCTITGAATGCTTAGAAAATGAA TTAGATITAGAGTATGATGAAATCACAATCCTO GAATTGATTAAGTCCTTAGGAGTAAAAGT, AGAAACGCAAAGTGATACTATTTTTGAAAAAT há GTCTAGAGATACTTCAAATTTICAAATATCTCACT, AAGAAAAAGTTGCTTATTTTTGTCAATA
GOGGAGCTTTTCTAACAAAGGATGAAGTGGCTAGTTTACAAGAGTATATATCATTGACAAAT TTAACAGTTCTCITTITAGAACCACGTGAACT, 'ATATGATTTTCCGCAGTATATTTTAGATGAA GATTATTTCITAATAACTAAAAATATGGTATAA (SEQ ID NO:517) SEQ ID NO:S1&:
ATGGATAAGAAATACTCAATAGGCTTAGATATOGGCACAAATAGCGTCGGATGGGCOGTGA TCACTGATGATTATAAGGTTCCGTCTAAAA, AGCTCAAGGGTCTGGGAAATACAGACCGCCA COGTATCAAAAAAAATCTTATAGGGGCTCTTTITATTTGACAGTGGAGAGACAGCGGAAGCGO ACTCGTCTCAAACGGACAGCTOGTAGAAGGTATACACGTCGGAAGAATCGTATITGITATCT ACAGGAGATTTITITCAAATGAGATGGCGAAAGT: AGATGATAGTTTCTTTCATCGACTTGAAG AGTCTTTITTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATITITGGAAATATAGTA SGATGAAGTTGCTTATCATGAGAAATA TOCAACTATCTATCATCTGCGAAAAAAATTGGCAGA TTCTACTGATAAAGTGGATITGCGCTTAATCTATTTGGCCTTAGOGCATATGATTAAGTTTCG TGGTCATTTTTTGATTGAGGGAGATITAAA TOCTGATAATAGTGATGTGGACAAACTATITA TCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTA GATGCT: AAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGC TCAGCTCCCCGGTGAGAAGAAA AATGGATTGTTTGGGAATCTCATTGCTTTGTCATTOGGAT TGACCCCTAATTITAAATCAAATTTTGATTITGGCAGAAGATGCTAAATTACAGCTTTCAAAA GATACTTACGATGATGATTTAGATAATTTATTIGGCGCAAATTGGAGATCAATATGCTGATIT GTTITTGGCAGCTAAGAATTTATCAGATGCT, 'ACTTTACTTTCAGATATCCTAAGAGTAAATA GTGAAATAACTAAGGCTCCCCT, ATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAA SACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTT TITTGATCAATCAAAAAACGGATATGCAGGTTATATTGA TGGGGGAGCT, AGCCAAGAAGAA TTITATAAATITATCAAACCAATTITAGAAAAAATGGATGGTACTGAGGAATTATTGGCOAA ACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCOCTATC AAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTITA AAAGACAATOGTGAGAAGATTGAAAAAATCTTGACTITTCGAATTCCTTATTATGTTGGTCCO ATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCOO CATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTICAGCTCAATCATTTATTGAACGCATO ACAAACTTTGATAAAAATCITCCAAATGAAAAAGT: 'ACTACCAAAACATAGTTTGCTTTATGA GTATTITACGGTTTATAACGAATTGACAAAAGTCAAATATGTTACTGAGGGAATGCGAAAA CCAGCATITCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATITACTCITCAAAACAAATOG AAAAGTAACCGTTAAGCAA TTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGT GTTGAAATTTICAGGAGTTGAAGATAGATTTAATGCTTCATTAGGT: ACCTACCATGATTTGCT AAAAATTATTAAAGATAAAGATTITTTGGATAATOGAAGAAAACGAAGATATCTTAGAGGAT ATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGA: TTGAGGAAAGACTTAAAACATA TGCTCACCT 'CTTTGATGATAAGGTGATGAAACAGCTTAA ACGTCGOCGTTATACTGGTTGGG GACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGA' TAAGCAATCTGGCAAAACAATATTA GATTTTTTGAAA TCAGATGGTTTTGCCAATOGCA, ATTTTATGCAGCTGATCCATGATGATAGT TTGACATITAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATG AACATATTGCAAATITAGCTGGTAGCCCTGCTATTAAAAAAGGTATITTACAGACTGTAAAA STTGTTGATGAATTGGTCAAAGTAATGGGOCGGCATAAGCCAGAAAATATCGTTATTGAAA TGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGTGAGCGTATGAAAC GTATTGAAGAAGGAATAAAAGAACTAGGAAGTGATATTCTAAAGGAGTATCCTGTTGAAAA CACTCAATTACAAAA TGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATO TGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTOGATCACATTGTTCCACAA AGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGG TAAATCGGATAACGTTCCA AGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAA
CTTCTAAACGCCAAGTTAATCACTCAACGTAAGTITGATAATTTAACAAAAGCTGAACGTGG r AGGTTTGAGTGAACTTGATAAAGTTGGTITTATCAAACGCCAATTGGTTGAAACTCOGOCAAA TCACT; AAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGA
TAAACTTATTCGAGAGGTTAGAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCOGAA AAGATITCCAATTCTATAA AGTACGTGAGATTAACAATTACCATCATGCOCCATGATGOGTAT CTTAATGCCGTCGTTGGAACTGCTTTIGATTAAGAAATATOCAAAACTTGAA TCGGAGTTTGT . CTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAGGAAATAG GCAAAGCAACCGCAA, IAATATTTCITITACTCTAATATCATGAACTTCTTCAAAACÇAGAAATT ACACTTGCAAATGGAGAGATTCGCAAACGOCCTCTAATOGAAACTAATGGGGAAACTGGAG AAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGOOCCA AGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTITTA CCAAAAAGAAATTCGGACAAGCTTATTGCTOGTAAAAAAGACTGGGATCCAAAAAAATATO GTGGTTTTGATAGTCCAA! ICGOGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGG AAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACT: AGGGATCACAATAATGGAAAGAAGCT À CTTTTGAAAAAGATCCGATTGACTTTITTIAGAAGCTAAAGGATATAAGGAAGTTAGAAA AGA CTTAATCATTAAACTACCTAAATA TAGTCTTTTTGAGTTAGAA AACGGTCGTAAACGGATGC TGGCTAGTGCCGGAGAA TIGCAAAAAGGA AA TGAGCTAGCTCTGCCAAGCAAATATGTGAA TTTTITATATITAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAA AACAATTGTTTGTGGAGCAGCATAAGCATTATITAGA TGAGATTATIGAGCAAATCAGTGAA TTITCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAA ACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATITATITACOTTGACG AATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATAC
GTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGOTCTITATGAAA CACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA (SEQ ID NO:518)
SEQ ID NO:519:;
ATGGCTGGTTGGCGTACTGTTGTGGTAAATACCCACTCGAAATTATCCTATAAGAATAATCA TCTGATTTTTAAGGATGCCTATAAAACGGAGCTGATCCATTTATCAGAAATTGATATTTTGTT ATTAGAAACGACCGATATTGTCITGTCCACTATGCTGGTAAAACGGCTAGTGGATGAGAATG TCCTTGTCATATTCTGTGATGATAAACGATTACCAACAGCTATGCTGA TGCCTTTITATGGTO GTCATGATTCGAGTITACAGCTTGGGAAACAAA TGTCCTGGTCAGAAACAGTCAAATOGCA GGTTTGGACGACGATTATTGCTCAAAAGATTTTGAATCAATCTTGCTATCTAGGAGCATGCT CCTATTTTGAAAAATCCCAATCTATTATGGATTTATATCATGGTTTGGAAAATTTTGATCOGA GTAATCGAGAAGGGCATGCAGCGAGAATITATIITAATACACTTTTTGGGAACGATTTCTCA AGAGATTTGGAGCATCCAATCAATGCAGGTCTGGATTATGGTTATACTITATTATTGAGTAT GTTTGCOGCGTGAAGTGGTTGTGTCTGGATGTATGACTCAATTTGGACTCAAACAOGCCAATOC AGTTTAATCAGTTCAATITTGCTAGCGATATTATOGAACCATTTAGGCCTTTGGTGGATAAG ATTGTITATGAAAATCGAAATCAGCCTTTTOCCAAAA TAAAGAGAGAGTTATTTACTTTGTT TTCAGATACATTTTCATATAATGGTAAAGAGATGTATCTCACGAATATTATTAGCGATTATA
CTAAAAAAGTTGTCAAAGCTCTGAATAATGAAGGGAAAGGAGTTCCTGAATTTAGGATATG A(SEQID NO:519) SEQ ID NO:520; f ATGAGAATGATACTTATGTTTGATATGOOGACGGACACTGCTGAGGAACGAAAAGCTTATC
GAAAATTTCGGAAATTTT TACTTAGTGAAGGGTTTATCATGCATCAATTITCTATITATAGTA AGTTACTGTTGAATAATACAGCTAACAACGCCATGATTGGTCGGCTGAGGGAGCATAATOCT CATAAAGGAAATATTACATTACTAACAGTCACAGAAAAACAGTTTGCACGAATGATTTATTT
ACATGGTGAAAGAAATAATTGTATTGCAAACTCCGATGAGAGACTTGTATTTCTTGGGGAG GCTTTTGATGAATCTTAA (SEQID 'NO:520) SEQ ID NO:521: ' À
ATGAATCTTAATITTICCCTTATTAGATGAACCGATTCCATTAAGAGGCGGTACAATTCTTGTG CTCGAAGATGTCTGTGTATTTTCAAAAATAGTGCAATATTGTTACAAATATGAGGAAGATTC TGAACTTAAATTTITIGATCACAAGATGAAAACCATCAAAGAATCAGAAATCATGCTTGTAA CAGATATTITAGGATTTGATGTTAACTCCTCAACCATTITAAAATTGATTCATGCAGATTTAG AATCTCAATTTAATGAGAAACCCGAAGTGAAATCGATGATTGACAAATTGGTTGCTACGATT ACAGAACTGATTGTCTITGAATGCTTAGAAAATGAATTAGATTTAGAGTATGATGAAATCAC . AATCCTGGAATTGATTAAGTCCTTAGGAGTAAAAGTAGAAACGCAAAGTGATACTATTTITO AAAAATGTCTAGAGATACTTCAAATTTTCAAATATCICACT, AAGAAAAAGTTGCOTTATTTIT GTCAATAGOGGAGCTTTTCTAACAA AGGATGAAGTGGCTAGTTTACAAGAGTATATATCATT
GACAAATTTAACAGTTCTCTTTITAGAACCACGTGAACTATATGATTTTCCGCAGTATATTIT AGATGAAGATTATTTCTTAATAACTAAAAATATGGTATAA (SEQ ID NO:521) com as sequências de repetição: SEQ ID NO: 13 a SEQ ID NO: 19. Combinação Funcional Nº 4 Sequências de cas SEQ ID NO:509 a SEQ ID NO:516 (todas as quaissãodeS.pyogenes), como mostrado abaixo: SEQ ID NO:509:
ATGAGAATGATTTTAGCACACTATGACTGTAAAAAAGATAAAAAGCAATCTTTAGATGAGC ATITATGGCATGTGGCCTGTTCTAGTCGACAGGAAGCATCTATAATTGGTCAAGGAGATGTO CTTTTITITAATTGGTCTITACCACGACCTGGGCAAAGCTGATCGAACCTITCAAGATAAATTA TTAAATAATCCAAATCGGCATGTTGATCACTCTTATGCAGGGGCAAAATACTTATOTTCTAT TATTGGGCCTCATCTAAAA AACCGAGGGGTTGATAAAAATGAGAGAA TGACATTCAACGAA ATGGTGGGGTATGTCATCTCTGCTCATCATGGGATGTATGATTTATGCTACTATTTTGACGAT GCTGAATATTATGGCTTTAATAAGTTTAAAAATCGTATCAATAGAGACTT, AGATGGTTATCA CTATCATGAAGATATTAAAGGGT, AOGCTCTAAAATTAGAAAAAAAATTATGTGATTATGGCT ACAAAGATTTAAGGGAGCTTATTGATAAAGCTTTTGATAATTACCAACAAGCCATOTCITTCC TTAAACTGGCAAGATAAGAGTGAGTGOGATTATTATCAGTCTTGTATOGTGAGACTIT, ACTT GTCACTCTTAAAAAACGCTGATATITTGGACACAGT, 'AAATGCCTATGGOCTTAAGATAAGTC CTATGGATAAAACAGAGCGATCCTTTCTAAAACACTCCTATTTAGCGGCCATTGAACAAA AA TATGCTAGCTTTGGACAGCCAAACAATCAGTTIGAACACTATTCGGACAGAA ATCGCTGAGC GTGTTAAAGA, AAGAGGTAAACGAGATTCCAAGGOGATTTATCGCTTAGATTTACCGACAGO AGCTGGCAAGACTAATCTTAGTATGCGTTATGCGTTTCACCAATTAGTTCATCACGACAAAT CAAGGTTTTTITACATAACTCCCTTTCTTTCGGTTCTTGAGCAAAATGCITCCGAAATTAGAA AAGTTACAGGTGACCTTGGCGTICTAGAACACCATTCCAA! TGTGGTGAAACAGGCTAATGA AGATGATGATGATAAGGACAGTTTATTGTCAGCTTATCTTAGTGATAGCTGGGACAGTCAAG TAGTCTTGACTTCTATGGTTCAATTTTTCCAAACACTITTICAAAACAAAATCAGCTAATCTGA GACGTTTTICAAGTTTGATTAATAGTGTTGTGATTCTAGATGAAGTTCAATCCCTGCCTATTG AAGTCACCACTITGTTTAATTTAACGATGA, ATITTTITAAATAAAGTTATGGATACAACCATC GTTCTTTGCACAGCGACACAACCTGCTTATGATTCTTCAGAGATTGACCATCGTATCTGTTAT GGAGGGAACTTGGGAGAATTAGCTGAAATAGTTGAGTT, 'AACGATTGAAGAAAAACAGATTT
TTTCAAGGACAGAGCTTAGAAAATTTGATGATAGTGATCAGAAAGTTCACTTGACTGATGTT y ATTAACCTTATTCTAGGTGAGGAAAACTCAGTTCTTGCTATTTTTAATACGAAAAAAACGGOT í TCATAACTGCTATACTATGCTAAAAGACATGACTGATAGACCGGTCTATCAGCTTTCGACAA
ATATGTGTGCGCAGCATAGACTTGACTIGATTGCTAAGATCAAAACGGAGTTACAAAATAA TATCCCTATTATTTGTATTAGCACGCAATTAATTIGAAGCAGGTGTAGATGTTGATITTCATCG CGTCATTOGTTCCTACTCAGGGATTGATTCTATTGTTCAGGCTGCTGGACGGTGTAACCGAG AAGOCAAACGAGATAAAGGGCAAGTCACTCTTGTCAATCTGACCAATGAAGAGGAAAATAT TTCTAGGCTGACAGAAATAAAAACTAAAAAAGAAGCCACAGAATCTATTCTTCATAAGATT , GGGTCTCCAATTGATATCTCAACTTTAAACCGTGACTITITTGAGTATTATTATGCCAATAAT CAGGGACTGATGGATTATCCTTTGGAAGACAACCT, TATCAATCTACGACTATITTAAGCCTTAA TATTTATCAGACGGCAAATAAAAAGTTCAAAGGTAAGTTAAAACAAGCTTTTAAAACAGCA GGAGCCAAAATGAACCTCATCAATAATGATATGATAGGAATTCTCGTACCTTATGGCGAAG : CTGAGAAAAAATTGGCTTATITAGAAGAATTAGGTGTGTCACATITITTATCAGCAAAAGAT TATCAAACGATAAAATCATTACT, 'AAAAGAGTTACAACCTTTTACOGGTTAA TGTCCGCGAGAA CGATCCTCTCTTTGAGACAACAAAATCTTATCTAAA TGGTCAGATTCTOGTTTTGACGTCGG AGTATTATGACACGGAAA! IGAGGAGTTAAATACGATTCAGCTAGCTTTTACTTCTAACTCAAA : ACGAAAGAAGATTAACAAAAGGTTGTTAGAGGACCTTGTTAACCTGCCAATCATCATTAGT ' AATTATTATCAATITAGACTATTTAATAAAATTAGATTACAAAAA AACAGAAGGAGGAAAG TAGCTIGTACAGATCTAGAGACTTCTACGTGAGAGTAAGTGGTCAGCGAGCTCTTTITACAA ATCCAGCCACAAAAGGGGGATOGGAACGCTCATCCTATTOGGTTCCGACTAGACAGGCACT GAATGGTATCGTTGATGOCATCTATTATAAGCOGACCTITACTAATATOGTCACAGAGGOTTA AGGTTATTAACCAGATTCAAACCGAATTACAGGGTGTCAGGGCTCTGTTACATGATTATAGT GCAGATTTAAGTTATGTATCCTATTTGAGTGATGTTGTITATCTGATCAAGTTTCATTTTGTIT GGAATGAAGATAGAAAAGATTTGAACTCAGATAGACTTOCAGCTAAACATGAAGOCATTAT GGAGCGTTCTATTCGTAAAGGGGGACGTCGAGATGTGTTITTGGGTACAAGAGAATGTTTAG Ê GGCTTGTAGATGATATCAGCCAAGAAGAGTATGAGACTACTGTGTCGTATTATAATGGTGTC AATATCGACTTGGGAATCATGTTCCATICCTTTGCCTATCCGAAGGACAAAAAGACACCATT AAAATCATACTTTACAAAGACTGTGATGAAAAA TGGAGTCATTACGTTTAA AGCACAGTCT GAATGCGATATTGYTAACACGCTTTCTAGTTATGCTTTTAAAGCACCAGAGGAGATAAAATC GGTTAACGATGAATGCATGGAGT, ATGATGCCATGGAGAAAGGAGAAAACTGATGGATTTIT TTACTTCTCTCITGAAGACTT; ATGAAAAAGCAGAGCTAGCAGACTTGGTTGATCATCAAAAA AGAAATAATGAGCCGGTTTTACTGOOGATTTATCATACGAGTTTAAAGTCAAATGGTAAAAA TATCATTTCAGTGAAACTTGACAAAGATGOCCAGTTTCACAAGGCAGAATTTATGGCAGATA AGCAAATGATTATITITCCTGTAACGGCTGATTCTGTTGCTAGGTCAGGTAGTCATCCTGCAC COCATCCCCTAGTCGATAAATTTGCTTATTATAGTGCTGAAATGGGGCAGATTCAGT, ATOAT TCTTITCATAAGCAACTGAATAACTGGATTGATTATTGTGAGGAGGGTGATGTCAAGAAATT TTTAACCTTTGTTCAGCAGTTCATTTTGAAGOCAGAATTTCTAACATTGATTCTTGATTCTTT AATTGGTCCTGATTATCAACATAATCAATTAAAAGTCACATTTTGTGATGCCACTGGAAAAG AAAAATTAATTGATITATCAGCTTGCTITTTAGAATTTTCAATTGATCAGTTCCAGGGCTTTA AAAATGAATCGGTTTCGACATTTAAAGCCTTACACCAATCCTATATTICITTTGITGAAGCCA ATCGTGAAAATCTCGGTATTTGTAATATTAGTGGACGAGAGGAACAGCTT: ACCGATAAGCA TAGAGGTTTGATGGGGAATGCTAAAATCATCTCTGITAGTAATAAAAGAGAAGCTTATAAA GGACGTTTTAGAGAACGCGAAGACGTITTTAGTGTTGGCTATGAAACTTCOGAAAAGATTCA TTTAATGCTCAAGTACCTTITAGAAAATAA AAA TACCAGTACTTGGTTAGGGTCTTCTCAAT ATTTAATCAACTGGTTCAGCGATGATTTAACAAATGATAGTCGGTTGGATATTGTATCACCA ATCTTTGATGATGGACTTGAAGAAGATGATGATGACGATACGCCTCCTGTTATAACATTAGC AACTGAAGACAATAAAAGAATTGGTAAATCATTCATCAAGGGACAAAAATTATTTGCTAAT GATGCCACTTACTACGTTGCTATTITGAATAAAACCAGCAA TGGGCGGATTGCTTTAAAATA TTITCGTCAGCTTCAAGOGTCCCAATTACTCACCAATCTTAACAAGTGGCAGGAA ACATACA GTTGGGAGTCGCGATCTAAGTTTGGGAAA AGTCGCTTAAGAACCCCT, ACTTTTCATGACATC CTT; AATGTGTCCTACGGGGTTGATAGGGATCGCTICCTIGAATTAGATAATGATAACTTCAA AAGTGATCAAATTCAAAAGTTAGTGGCAAGTTTGATTGATGGTAAACOGATGCCACAGTCC ATTGTCAAAAAGTTAGGTAACAATGTTAAAGAACGACATCGTTACCGTAAGCACTGGTATO AAGTTGAGCAGGTCTGCTTAGCAATTTITACACAAACAAA A TGGGGAGGAATTTTCACCGAT GCTAGATCATACCAATCAAAATCGTTCCTATCTITITGGACGATTATTAGCAATTTITGAATT AATOGAGACCTTGCGTTATGGCTTGGATGGAAACAATAACGACCGTATTACCAATGÓCTOGAA CGTTATTGGACAGCCTATACTOGACAACCAACAAAATTGATGATGITATTIGGAAAATAAAA TTAAGCCTTACGAAGAACCATTGAAATTAAATCGTCGTGGCAGTTGGATGAAATTAGAAAA AGAAAAAGAAGAGATTTTAGAACTGTTAAATCCTCTGTTAGAAACAGAAACAATGGAAAAA COCTTAGATTACCGCTITATTTTTGGGTATTATGCTGAGAAAAACTATTACTATACAAAACA AAACACGGAAGTAACAGAAAGTGAGGAGTAAAAAGATGTTGGAACACAAAATTGATTTTAT GGTAACTCTTGAAGTGAAAGAAGCAAATGCAAATGGTGATCCCTTAAATGGAAACATGCCT CGTACAGATGCCAAAGGATATGGTGTGATGAGTGATGTCTCCATTAAACGTAAGATTCGTA ATCGTTTGCAAGATATGGGGAAGTCTATTTTTGTGCAAGCTAA TGAGCGTATTGAAGATGAT ' TTTCGTTCACTGGAAAAACGCTTTTOGCAACATTTTACAGCTAAGACACCTGACAAAGAAAT TGAAGAAAAAGCAAATGCATTATGGTTTGATGTTCGTGCTTTIGGACAAGTTTITACTTATCT
GAAAAAATCAATTGGGGTGCGTGGACCAGTTTCCATCAGTATGGCTAAGTCCTTGGAGCCA + ATTGTCATTTCCAGCCTTCAAATTACGOGTAGT, 'ACCAATGGTATGGAAGCTAAGAATAATAG
TGGCCGCTCTTCTGATACGATGGGGACAAAACATTTTGTAGATTATGGTGTGTATGTACTTA AAGGTTCTATCAATGCTTATTTTGCTGAAA AGACTGGTTTTTCTCAGGAAGATGCTGAGGCT
ATTAAAGAAGTTITGGTTAGCTTGTTTGAA AATGATGCGTCGTCTGCACGTOCGGAAGGCTC 1 TATGCGAGTTTGTGAAGTCTTITGGTITACGCATTCAAGCAAATTGGGAAATGTTTCAAGIG ba CGCGTGTCTTIGACTTGTTAGAGTATCATCAATCAATAGAAGAAAAAAGCACTTATGACGCT
TATCAGATTCATCTAAATCAAGAAAAATTGGCTAAATATGAAGCGAAAGGGTTAAÇGCTTG AAATCCTAGAAGGACTCTAGTATGGTCTATGCCOGAAGATGATTATTTAATGCTGTCAGGTAT TCAGCATTTCCAATTITGTAAACGTCAATGGGCGTTGATCCATATTGAGCAACAATGGCTTG ATAATGAAGCGACAGCGCATGGACAGGTTITACATACTAAAGCAGATAACCCTITACATTAA AGAAAAACGAAAAGAGCTTTTGGTCTCACGTGCTATOGCCCATTTCTICTGCAGAACTTGAGAC TTTCAGGAATTATGGATGTTGTGGAATTITATAAAGATGATCAAGGTGTGTCTTTGAGGGGA AAACGTGOGAAATGGTTACCAAAAGTTGTGGAATACAAGCGCGGAAAACCTAAAAAAGAT ACCAGAGATATTGTCCAGTTGGTGGCTCAGACCATGTGTTTAGAAGAAACGCTAGACTGCG ACATTAACGAAGGTTGTCTTTATTACCATAGTGTCAATCAAAGAGTGATTGTTCCTATGACA TCAGCTTTGOGTCAAGAAGTGAAGGAATTAGCCGCAGAGA TGCATGAGGTTTATCAGAGTO AAATGCTACCTAAAGCAGCTTATTTTAAAAACTGTCAGCTTTGTTCTTTAGTOGATATITGTA AGCCOCAGGTTGAGTAAAAAAACAAGGAGTGTGTCGCGTTAÇATCAATGAGGCTATGACCAG TGAGGAGATGGACCTATGAAGAAGTTGCTAAATACCTTGTATTTGACGCAAGAAGATTTITA TGTCACTAAAGAGGGCGATAACATTGTTATCAAGCAAGAAGGTAAGGTICTCAAACGGTTT CEGTTTOGGATTATTGACGGTATTGTCTGTTTTTCTTATTTGGGTGTGTCGTCTGCTTTGGTGA AGTTATGTACGGAGAATCAGATTAATITATCGTTICATACACCAÇAAGGGCGTTTTTGTGOT CGCTATATTGGTTCAACCAATGGGAATGTGTTGTIGCGTAGAGAACATTATCGTTTATCTGA TCGTGAGGAATCTTTGGAATACGCAAAGCGGTITATTTTGGCTAAAATTTCCAACTCAAGOA AATACTTGCTACGCTTTAAACGAGATCATCGTCAACAGATTGATACCAAGCTTTTTGAGOCT GTTAATGACGAATTGATATGGGCTTTAGAGATGGTTCAGGCAGCAGATAATAAAGACTCTIT AAGAGGGATTGAAGGCCAAGCTGCTAATCAGTATTTTCGCATATTTAATGACCTGGTGTTGA CGGACAAAAAAACGTTTT: ACTTCCAAGGTCGGAGTAAACGACCACCCTTAGATTGTGTTAAT GCCCTCTTGTCITITGGTTACAGTTTACTGACCTTTGAATGTCAATCTGOCTTGGAAGCTGTC GGATTAGACAGTTACGTTGGTTTCTTTCACACGGATCGTCCTGGGCGTGCTAGTTTAGCGCTT SGATTTAGTTGAAGAGTTCCGCTCATATATTGTAGATOGTTTTGTCITITCATTAATTAATAÃA GGACAACTTCAGAAAAAACACTTTGAGGTTAAAGAAAATGGTAGTATTITATTGACGGAAA ATGGCAGAGCTATTTITATTGATTTGTGGCAGAAGCGTAAGCATACTGAGGTAGAACATCCT TITACAAAAGAGAAAGTAAAACTTATGTTATTACCCTATGTACAAGCGCAGCTTTTAGCTAA GGCTATACGAGGAGATITAGAAAGCTATCCACCTTITATGGTTTAGGAGATOGTTATATGATG GTTTTAGTCACTTATGATGTAAA TACGGAAACACCTGCTGGTAGAAAAAGATTGCOGTCATGT TOCCAAACTCTGTGTGGACTATGGGCAACGTGTTCAAAATTCTGTTTTTGAA TGTTCTGTGAC ACCCGCAGAATTTGTGGATATAAAGCACCGCTTAACACAAATCATTGATGAGAAAACTGAT
AGTATTCGCTTITATITATTGGGGAA AAA TTGGCAGAGGCGTGTGGAAACACTTGGTOGCTC AGACAGCTATGACCCAGATAAAGGTGTCTTATTATTGTAA (SEQ ID NO:509) SEQ ID NO:510:
ATGAGAATGATITTAGCACACTATGACTGTAAAAAAGATAAAAAGCAATCTTTAGATGAGC ATTTATGGCATGTGGCCTGTICTAGTCGACAGGAAGCATCTATAATTGGTCAAGGAGATGTO CTTTITITAATTGGTCTTTACCACGACCTGGGCA AAGCTGATCGAACCTTITCAAGATAAATTA TTAAATAATCCAAATOGGCATGTTGATCACTCTTATGCAGOGGCAAAATACTTATGTTCTAT TATTGGGCCTCATCTAAAAAACCGAGGGGTTGATAAAAATGAGAGAATGACATTCAACGAA ATGGTGGGGTATATCATCTCTGCTCATCATGGGATGTATGA TTTATGCTACTATTTTGACGAT GCTGAATATTATGGCTTTAATAAGTTTAAAAATCGTATCAATAGAGACTTAGATGGTTATCA CTATCATGAAGATATTAAAGGGTACGCTCTAAAA TTAGAAAAAAAATTATGTGATTATOGCT ACAAAGATTTAAGGGAGCTTATTGATAAAGCTTTTIGATAATTACCAACAAGOCATGOTCTTCC TTAAACTGGCAAGATAAGAGTGAGTGGGATTATTATCAGTCTTGTATGGTGAGACTTTACITT GTCACTCTTAAAAAACGCTGATATITIGGACACAGTAAA TGCCTATGGCCTTAAGATAAGTC
CTATGGATAAAACAGAGCGATCCTTTCTAAAACACTCCTATTTAGCGGCCATTGAACAAA AA TATGCTAGCTTTGGACAGCCAAACAA' TCAGTTGAACACTATTCGGACAGAAATCGCTGAGC f GTGTTAAAGAAAGAGGTAAACGAGATTCÇCAAGGGGATTTATCGCTTAGATTTACOGACAGG
AGCTGGCAAGACTAATCTTAGTATGCGTTATGCGTTTCACCAATTAGTTCATCACGACAAAT CAAGGTTTTTTTACATAACTCCCTTTCTITOGGTTCTTGAGCAAAATGCTTCCGAAATTAGAA
AAGTTACAGGTGACCTTGGCGTYCTAGAACACCATTCCAATGTGGTGAAACAGGCTAATGA n AGATGATGATGATAAGGACAGTTTATTGTCAGCTT, ATCTTAGTGATAGCTGGGACAGTCAAG
TAGTCITGACTTICTATGGTTCAATTITTCCAAACACTTITCAAAACÇAAAATCAGCTAATCTGA GACGTTTTTCAAGTTTGATTAATAGTGTTGTGATTCTAGATGAAGTTCAATCOCCTGCCTATTG AAGTCACCACTTTGTTTAATTTAACGATGAATTTTTTAAATAAAGTTATGGATACAACCATC GTTCTTTGCACAGCEGACACAACCTGCTT, 'ATGATTCTICAGAGATTGACCATOGTATCTGTTAT GGAGGGAACTTGGGAGAATTAGCTGAAATAGTTGAGTT, 'AACGATTGAAGAAAAACAGATTT TITCAAGGACAGAGCTTAGAAAATTTGATGATAGTGATCAGAAAGTTCACTTGACTGATGTT ATTAACCTTATTCTAGGTGAGGAAAACTCAGTTCTTGCTATTTTTAATACGAAAAAAACGGT TCATAACTGCTATACTATGCTAAAAGACATGACTGATAGACCGGTCTATCAGCTTTCGAÇAA ATATGTGTGCGCAGCATAGACTTGACTTGATTGCTAAGATCAAAAOGGAGTTACAAAATAA TATCCCTATTATITTGTATTAGCACGCAATTAATTGAAGCAGGTGTAGATGTIGATTTTCATCG CGTCATTCGTTCCTACTCAGGGATTGATTCTATTGTTCAGGCTGCTGGACGGTGTAACCGAG AAGGCAAACGAGATAA AGGGCAAGTCACTCTTGTCAATCTGACCAATGAAGAGGAAAATAT TTCTAGGCTGACAGAAATAAAAACTAAAAAAGAAGCCACAGAATCTATTCTTCATAAGATT GGGTCTCCAATTGATATCTCAACTTTAAACCGTGACTTTTTIGAGTATTATTATGCCAATAAT CAGGGACTGATGGATTATCCTTTGGAAGACAACCTATCAATCTACGACTATTTAAGCCTTAA TATTTATCAGACGGCAAATAAAAAGTTCAAAGGTAAGTTAAAACAAGCTTITAAAAÇAGCA GGAGOCAAAATGAACCTCATCAATAATGATATGATAGGAA TICTCGTACCTTATGGOGAAG CTGAGAAAAAATTGGCTTATITAGAAGAATTAGGTGTGICACATTTITITATCAGCAAAAGAT TATCAAACGATAAAATCATTACTAAAAGAGTTACAACCTTTTACGGTTAATGTOCGCGAGAA CGATCOCTCTCTTTGAGACAACAAAATCTTATCTAAATGGTCAGATTCTGGTTITGACGTOGG
AGTATTATGACACGGAAA IGAGGAGTTAAATACGATTCAGCTAGCTTTITACTTCTAA (SEQ ID SEQ ID NO:511
TTGTACAGATCTAGAGACTTCTACGTGAGAGTAAGTGGTCAGCGAGCTCTTTTTACAAATCC AGCCACAAAAGGGGGATOGGAACGCTCATCCTATTCGGTTCCGACTAGACAGGCACTGAAT GGTATCGTTGATGCCATCTATTATAAGCOGACCTTTACTAATATCGTCACAGAGGTTAAGGT TATTAACCAGATTCAAACCGAATTACAGOGTGTCAGGGCTCTGTTACATGATTATAGTGCAG ATTTAAGTTATGTATCCTATTTGAGTGATGTTGTITATCTGATCAAGTITCATTITGOTITTIGGA ATGAAGATAGAAAAGATTTGAACTCAGATAGACTTCCAGCTAAACATGAAGOCATTATGGA GCGTTCTATTCGTAAAGGGGGACGTCGAGATGTGTTITTGGGTACAAGAGAATGTITAGGGC TTGTAGATGATATCAGCCAAGAAGAGTATGAGACTACTGTGTCGTATTATAATGGTGTCAAT ATCGACTTGGGAATCATGTTCCATTCCTTTGCCTATCCGAAGGACAAAAAGACACCATTAAA ATCATACTTTACAAAGACTGTGATGAAAAATGGAGTCATTACGTTTAAAGCACAGTCTGAAT
GCGATATTGTTAACACGCTITCTAGTTATGCTTTTAAAGCACCAGAGGAGATAAAATCGGTT AACGATGAATGCATGGAGTATGATGCCATGGAGAA AGGAGAAAACTGA (SEQ ID NO:511) SEQ ID NO:512:
ATGGATTTITITACTTCTCTCTIGAAGACTTATGAAAAAGCAGAGCTAGCAGACTTGGTTGA TCATCAAAAAAGAA ATAATGAGCCGGTTTTACTGCOGATITATCATACGAGTTTAAAGTCAA ATGGTAAAAATATCATTTCAGTGAAACTTGACAAAGATGGOCAGTTTCACAAGGCAGAATT TATGGCAGATAAGCAAA TGATTATTTTTCCTGTAACGGCTGATTCTGTTGCTAGGTCAGGOTA GTCATCCTGCACCGCATCOCCTAGTCGATAAATTTGCTTATTATAGTGCTGAAATGGGGCAG ATTCAGTATGATTCTTTTCATAAGCAACTGAATAACTGGATTGATTATTGTGAGGAGGGTAA TGTCAAGAAATTTITAACCTTTGTTCAGCAGTTCATTTTGAAGCCAGAATTTCTAACATTGAT TCTIGATTCTTTAATTGGTCCTGATTATCAACATAATCAATTAAAAGTCACATTTTGTGATGC CACTGGAAAAGAAAAATTAATTGATITATCAGCTTGCTTTTTAGAATTITCAATTGATCAGTT CCAGGGCTTTAAAAATGAATCGGTTTCGACATTTAAAGCCTTACACCAATCCTATATTTCTIT . TGTTGAAGCCAATCGTGAAAATCTCGGTATITGTAATATTAGTGGACGAGAGGAACAGCTTA CCGATAAGCATAGAGGTTTGATGGGGAATGCTAAAATCATCTCTGTTAGTAATAAAAGAGA AGCTTATAAAGGACGTTTTAGAGAACGCGAAGACGTTTTTAGTGTTGGCTATGAAACTTCCG AAAAGATTCATITAATGCTCAAGTACCTTITAGAAAATAAAAATACCAGTACTTGGTTAGGG TCTTCTCAATATTTAATCAACTGGTTCAGCGATGATITAACAAATGATAGTCGGTTGGATATT ' GTATCACCAATCTTTGATGATGGACTTGAAGAAGATGATGATGACGATACGCCTCCTOTTAT AACATTAGCAACTGAAGACAATAAAAGAATTGGTAAATCATTCATCAAGGGACAAAAATTA TTTGCTAATGATGCCACTTACTACGTTGCTATTTTGAATAAA ACCAGCAATGGGCGGATTGC TTTAAAATATTITCOGTCAGCTTCAAGCGTCCCAATTACTCACCAATCTTAACAAGTGICAGG AAACATACAGTTGGGAGTCGCGATCTAAGTTTGGGAAAAGTCGCTTAAGAACCCCTACTTIT CATGACATCCTTAATGTGTCCTACGGGGTTGATAGGGATCGCTTCCTIGAATTAGATAATGA
TAACTTCAAAAGTGATCAAATTCAAAAGTTAGTGGCAAGTTTGATTGATGGTAAACCGATGC ' CACAGTCCATTGTCAAAAAGTTAGGTAACAATGTTAAAGAACGACATCGTTACOGTAAGCA ú CTGGTATCAAGTTGAGCAGGTCTGCTTAGCAATTITACACAAACAAAATGGGGAGGAATITT
CACCGATGCTAGATCATACCAATCAAAATOGTTCCTATCTTTTTGGACGATTATTAGCAATTT TTGAATTAATCGAGACCTTGCGTTATGGCTTGGATGGAAACAATAACGACCGTATTACCAAT GCTGAACGTTATTGGACAGCCTATACTGGACAACCAACAAAATTGATGATGTTATTGGAAA ATAAAATTAAGOCTTACGAAGAACCATTGAAATTAAA TCGTCGTOGCAGTTGGATGAAATT AGAAAAAGAAAAAGAAGAGATTTTAGAACTGTTAAATCCTCTGTTAGAAACAGAAACAATO
GAAAAACCCTTAGATTACCGCTTTATITTEGGGTATTATGCTGAGAAAAACTATTACTATAC AAAACAAAACACGGAAGTAACAGAAAGTGAGGAGTAA (SEQ ID NO:512) SEQ ID NO:513:
ATGTTGGAACACAAAATTGATTTTATGGTAACTCTTGAAGTGAAAGAAGCAAATGCAAATG GTGATCCCTTAAATGGAAACATGCCTCGTACAGATGCOCAAAGGATATGGTGTGATGAGTOGA TGTCTCCATTAAACGTAAGATTCGTAATCGTTTGCAAGATATGGGGAAGTCTATITITOTGC AAGCTAATGAGCGTATTGAAGATGATTTTOGTTCACTGGAAAAACGCTTTTCGCAACATTTT ACAGCTAAGACACCTGACAAAGAAA TTGAAGAAAAAGCAAATGCATTATGGTTTGATGTTC GTGCTTTTGGACAAGTITITACTTATCTGAAAAAATCAATTGGGGTGCGTGGACCAGTTTCC ATCAGTATGGCTAAGTCCTTGGAGCCAATTGTCATITCCAGCCTTCAAATTACGCGTAGTAC CAATGGTATGGAAGCTAAGAATAATAGTGGCCGCTCTTCTGATACGATGGGGACAAAACAT TTTGTAGATTATGGTGTGTATGTACTTAAAGGTTCTATCAATGCTTATTTTGCTGAAAAGACT GGTTTITCTCAGGAAGATGCTGAGGCTATTAAAGAAGTTTTGGTITAGCTTGTTTGAAAATGA TGCGTCGTCTGCACGTCCGGAAGGCTCTATGCOGAGTTTGTGAAGTCTTTTGGTTTACGCATTC AAGCAAATTGGGAAATGTTTCAAGTGCGCGTGTCTTTGACTTGITAGAGTATCATCAATCAA
TAGAAGAAAAAAGCACTTATGACGCTTATCAGATTCATCTAAATCAAGAAAAATTGGCTAA ATATGAAGCGAAAGGGTTAACGCTTGAAATCCTAGAAGGACTCTAG (SEQ ID NO:513) SEQ ID NO:S14:
ATGGTCTATGCCGAAGATGATTATITAATGCTGTCAGGTATTCAGCATTTCCAATITTGTAMA CGTCAATGGGCGTTGATCCATATTGAGCAACAATGGCTTGATAATGAAGCOGACAGCOCATG GACAGGTTTTACATACTAAAGCAGATAACCCTTACATTAAAGAA AAACGAAAAGAGCTTTT GGTCTCACGTGCTATGCCCATTTCTTCTGCAGAACTTGGACTTTCAGGAATTATGGATGTTGT GGAATTITATAAAGATGATCAAGGTGTGTCTTTGAGGGGAAAACGTGGGAAATGGTTACCA AAAGTTGTGGAATACAAGCGCGGAA AACCTAAAAAAGATACCAGAGATATTGTCCAGTTGG TGGCTCAGACCATGTGTTTAGAAGAAACGCTAGACTGCGACATTAACGAAGGTTGTCTITAT TACCATAGTGTCAATCAAAGAGTGATTGTTCCTATGACATCAGCTTTGCGTCAAGAAGTGAA GGAATTAGOCGCAGAGATGCATGAGGTTTATCAGAGTCAAATGCTACCTAAAGCAGCTTAT TITAAAAACTGTCAGCTITGTTCTITAGTCGATATITGTAAGCCCAGGTTGAGTAAAAAAAC
AAGGAGTGTGTCGCGTTACATCAATGAGGCTATGACCAGTGAGGAGATGGACCTATGA (SEQ ID NO:S514) SEQID NO:515: - ATGAAGAAGTTGCTAAATACCTTGTATTITGACGCAAGAAGATTITTATGTCACTAAAGAGGG
CGATAACATTGTTATCAAGCAAGAAGGTAAGGTTCTCAAACGGTTTCCGTTTCGGATTATTG ACGGTATTGTCTGTTITTCTTATTTGGGTGTGTCGTCTGCTTTGGTGAAGTTATGTACGGAGA ATCAGATTAATITATCGTTTCATACACCACAAGGGCGTTTTTGTGOTCGCTATATTGGTTCAA CCAATGGGAATGTGTTGTTGCGTAGAGAACATTATOGTTTATCTGATCGTGAGGAATCTITO . GAATACGCAAAGOGGTTTATTTTGGCTAAAATTTCCAACTCAAGGAAATACTTGCTACGCTT TAAACGAGATCATCGTCAACAGATTGATACCAAGCTTITTGAGGCTGTTAATGACGAATTGA TATGGGCTTTAGAGATGGTTCAGGCAGCAGATAATAAAGACTCTTTAAGAGGGATTGAAGOG CCAAGCTGCTAATCAGTATITTCGCATATITAATGACCTGGTGTTGACGGACAAAAAAACGT TTTACTTCCAAGGTCGGAGTAAACGACCACCCTTAGATTGTGTTAATGCCCTCTTGTCTTTTG GTTACAGTITACTGACCTTTGAATGTCAATCTGCCTTGGAAGCTGTCGGATTAGACAGTTAC GTTGGTTTCTTTCACACGGATCGTCCTGGGCEGTGCTAGTTTAGCGCTIGATTTAGTTGAAGAG TTCCGCTCATATATTGTAGATCGTTTTGTCTITICATIAATTAATAAAGGACAACTTCAGAAA AAACACTTTGAGGTTAAAGAAAATGGTAGTATTTTATTGACGGAAAATGGCAGAGCTATTIT TATTGATTTGTGGCAGAAGCGTAAGCATACTGAGGTAGAACATCCTTTTACAAAAGAGAAA
GTAAAACTTATGTTATTACCCTATGTACAAGCGCAGCTTTTAGCTAAGGCTATACGAGGAGA TTTAGAAAGCTATCCACCTTITATGGTITAG (SEQ ID NO-515) SEQ ID NO:S16:
ATGATGGTTTTAGTCACTTATGATGTAAATACGGAAACACCTGCTGGTAGAAAAAGATTGCG TCATGTTGCCAAACTCTGTGTGGACTATGGGCAACGTGTTCAAAATTCTGTTITTGAATGTTC TGTGACACCCGCAGAATTTGTGGATATAAAGCACCOGCTTAACACAAATCATTGATGAGAAA
ACTGATAGTATTCGCTTTTATTTATTGGGGAAAAATTGGCAGAGGCGTGTGGAAACACTTGG TCGCTCAGACAGCTATGACCCAGATAAAGGTGTCTTATTATTGTAA (SEQ ID NO:516) com as sequências de repetição: SEQ ID NO: 20 e SEQ ID NO:22. Todas as patentes e publicações mencionadas no pedido de pa- tente são indicativas dos níveis daqueles versados na técnica à qual a in- venção pertence. Todas as patentes e publicações são neste pedido incor- poradas por referência quanto ao mesmo ponto como se cada publicação individual fosse especificamente e individualmente indicada para ser incorpo- rada por referência.
Aqueles versados na técnica prontamente apreciam que a pre- sente invenção é bem adaptada para alcançar os objetivos e obter os fins e vantagens mencionados, bem como aqueles inerentes a este pedido. As composições e métodos descritos neste pedido são representativos de mo- —dalidades preferenciais, são exemplares, e não são destinados como limita- ções no escopo da invenção. É prontamente evidente para um versado na técnica que variação de substituições e modificações pode ser feita na in- venção revelada neste pedido sem afastamento do escopo e espírito da in- venção.
A invenção descrita ilustrativamente neste pedido adequada- mente pode ser praticada na ausência de qualquer elemento ou elementos, limitação ou limitações que não é especificamente revelada neste pedido. Os termos e expressões que foram empregados são usados como termos de descrição e não de limitação e não há nenhuma intenção que no uso de tais “15 termose expressões de exclusão de quaisquer equivalentes das caracterís- 3 ticas mostradas e descritas ou porções das mesmas, mas é reconhecido que várias modificações são possíveis dentro do escopo da invenção. Dessa forma, deveria ser entendido que embora a presente invenção tenha sido especificamente revelada por modalidades preferenciais e características opcionais, modificação e variação dos conceitos neste pedido revelados po- Á dem ser utilizadas por aqueles versados na técnica, e que tais modificações e variações são consideradas dentro dos limites desta invenção. A invenção foi amplamente e genericamente descrita neste pe- dido. Cada uma das espécies mais limitadas e agrupamentos subgenéricos que estão incluídos na revelação genérica também tomam parte da inven- ção. Isto inclui o relatório descritivo genérico da invenção com uma condição ou limitação negativa removendo qualquer assunto do gênero, independen- temente ou não material ser cortado é especificamente declarado neste pe- dido.

Claims (1)

  1. REIVINDICAÇÕES
    1. Método para geração de pelo menos uma cepa variante resis- tente a bacteriófago, compreendendo as etapas de: (a) exposição de uma cepa bacteriana parental compreendendo pelomenos uma porção de um locux de CRISPR a pelo menos uma se- quência de ácido nucleico para produzir uma mistura de bactérias compre- endendo pelo menos uma cepa variante resistente a bacteriótago compre- endendo um /ocux de CRISPR modificado; (b) seleção da dita linhagem variante resistente a bacteriófago a partirda dita mistura de bactérias; (c) seleção das ditas cepas variantes resistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no dito /ocux de CRISPR modificado das ditas cepas resistentes a bacteriófago selecionadas na etapa (b); e 5 (d) dito isolamento de pelo menos uma cepa variante resistente a bacteriófago, em que a dita cepa compreende um fragmento de ácido nu- cleico adicional no dito locux de CRISPR modificado.
    2. Método de acordo com a reivindicação 1, em que o dito méto- do compreende ainda a etapa de comparação do dito /ocux de CRISPR ou uma porção do mesmo da dita cepa bacteriana parental e do dito /ocux de CRISPR modificado da dita cepa variante resistente a bacteriófago para i- dentificar cepas variantes resistentes a bacteriófago compreendendo pelo menos um fragmento de ácido nucleico adicional no dito /ocux de CRISPR modificado que está ausente no dito /ocux de CRISPR da dita cepa bacteria- naparental.
    3. Método de acordo com a reivindicação 2, compreendendo a- inda a etapa de seleção das ditas cepas variantes resistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no dito locux de CRISPR modificado.
    4. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é exposta a duas ou mais sequências de ácidos nuclei- cos.
    5. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é simultaneamente exposta a duas ou mais sequências de ácidos nucleicos.
    6. Método de acordo com a reivindicação 1, em que a dita cepa — bacteriana parental é sequencialmente exposta a duas ou mais sequências de ácidos nucleicos.
    7. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é exposta à dita sequência de ácido nucleico através da infecção por pelo menos um bacteriófago compreendendo a dita sequência de ácido nucleico.
    8. Método de acordo com a reivindicação 7, em que pelo menos um dito bacteriófago é selecionado a partir do grupo de famílias de vírus consistindo de: Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviri- dae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae.
    5 9. Método de acordo com a reivindicação 7, em que pelo menos um dito bacteriófago é um bacteriófago que ocorre naturalmente.
    10. Método de acordo com a reivindicação 7, em que pelo me- nos um dito bacteriófago é um bacteriófago mutado obtido através de pres- são seletiva usando uma bactéria resistente a bacteriófago.
    11. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é exposta ao dito ácido nucleico através de um meca- nismo natural de entrada de ácido nucleico.
    12. Método de acordo com a reivindicação 11, em que o dito mecanismo natural de entrada de ácido nucleico compreende competência natural.
    13. Método de acordo com a reivindicação 11, em que o dito mecanismo natural parental de entrada de ácido nucleico na cepa bacteriana por conjugação ou transformação.
    14. Método de acordo com a reivindicação 1, em que a dita cepa resistente a bacteriófago é um mutante insensível a bacteriófago.
    15. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é um mutante insensível a bacteriófago
    16. Método de acordo com a reivindicação 1, em que a extremi- dade 5' e/ou a extremidade 3' do dito /ocux de CRISPR da cepa bacteriana parental é comparado com o dito /ocux de CRISPR modificado da dita cepa variante resistente a bacteriófago.
    17. Método de acordo com a reivindicação 1, em que a extremi- dade 5' e/ou 3' de pelo menos a primeira repetição de CRISPR ou pelo me- nos a primeira CRISPR espaçadora do dito locux de CRISPR da dita cepa bacteriana parental é comparada com o dito /ocux de CRISPR modificado da dita cepa variante resistente a bacteriófago.
    18. Método de acordo com a reivindicação 1, em que a dita cepa variante resistente a bacteriófago compreende pelo menos um fragmento adicional de ácido nucleico no dito locux de CRISPR modificado.
    19. Método de acordo com a reivindicação 1, em que pelo me- nos uma dita porção do dito /ocux de CRISPR da dita cepa bacteriana paren- tale pelo menos uma porção do dito /ocux de CRISPR modificados da dita h cepa variante resistente a bacteriófago são comparados pela amplificação de pelo menos uma porção do dito /ocux de CRISPR e pelo menos uma por- ção do dito /ocux de CRISPR modificado, para produzir uma sequência de locux de CRISPR amplificada e uma sequência de /ocux de CRISPR modifi- cadaamplificada.
    20. Método de acordo com a reivindicação 19, em que a dita amplificação é conduzida usando a reação em cadeia da polimerase.
    21. Método de acordo com a reivindicação 1, em que pelo me- nos uma dita porção do dito /ocux de CRISPR da dita cepa bacteriana paren- tale pelo menos uma porção do dito /ocux de CRISPR modificado da dita cepa variante resistente a bacteriófago são comparados por sequenciamento de pelo menos uma porção do dito /ocux de CRISPR e pelo menos uma por- ção do dito /ocux de CRISPR modificado.
    22. Método de acordo com a reivindicação 19, compreendendo aindaa etapa do sequenciamento da dita sequência de /ocux de CRISPR amplificada e da dita sequência de /ocux de CRISPR modificada amplificada.
    23. Método de acordo com a reivindicação 1, em que o dito fragmento de ácido nucleico adicional no dito /ocux de CRISPR modificado é uma unidade de repetição-espaçadora adicional.
    24, Método de acordo com a reivindicação 1, em que a dita uni- dade de repetição-espaçadora adicional compreende pelo menos aproxima- damente 44 nucleotídeos.
    25. Método de acordo com a reivindicação 1, em que a dita uni- dade unidade de repetição-espaçadora compreende entre aproximadamente 44 e aproximadamente 119 nucleotídeos.
    26. Método de acordo com a reivindicação 1, em que a dita uni- dade de repetição-espaçadora compreende pelo menos uma sequência nu- cleotídica que tem pelo menos aproximadamente 95% de identidade a uma repetição de CRISPR no dito locux de CRISPR da dita cepa bacteriana pa- rental.
    27. Método de acordo com a reivindicação 1, em que a dita uni- É 15 dade de repetição-espaçadora compreende pelo menos uma sequência nu- . cleotídica que tem pelo menos aproximadamente 95% a uma sequência nu- cleotídica no genoma de pelo menos um bacteriófago.
    28. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é uma cepa útil industrialmente.
    29. Método de acordo com a reivindicação 28, em que a dita ce- pa bacteriana parental é suscetível à infecção por pelo menos um bacterió- fago.
    30. Método de acordo com a reivindicação 28, em que a dita ce- pa bacteriana parental compreende uma cepa obtida a partir da cultura sele- cionada a partir de culturas iniciadoras, culturas probióticas e culturas de suplemento dietético.
    31. Método de acordo com a reivindicação 1, em que a dita cepa bacteriana parental é selecionada a partir de Escherichia, Shigella, Salmo- nella, Enwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomonas, Neisseri- a Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylococcus, Strep- tococcus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Tre- ponema, Borrelia, Francisella, Brucella, Campylobacter, Klebsiella, Frankia,
    Bartonella, Rickettsia, Shewanella, Serratia, Enterobacter, Proteus, Provi- dencia, Brochothrix, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lactobacillus, Pediococcus, Leuconostoc e Oenococeus.
    32. Pelo menos uma cepa variante resistente a bacteriófago ob- 5 tida usando o método da reivindicação 1.
    33. Cepa variante resistente a bacteriófago como definido na reivindicação 1, em que a dita cepa variante resistente a bacteriófago é uma cepa útil industrialmente.
    : 34. Cepa variante resistente a bacteriófago como definido na reivindicação 1, em que a dita linhagem variante resistente a bacteriófago é selecionada a partir de culturas iniciadoras, culturas probióticas e culturas de suplemento dietético.
    35. Composição compreendendo uma cepa variante resistente a bacteriófago produzida usando o método apresentado na reivindicação 1.
    5 36. Composição compreendendo pelo menos duas cepas varian- tes resistentes a bacteriófago produzidas usando o método apresentado na reivindicação 1.
    37. Alimento ou ração compreendendo a composição como defi- nida na reivindicação 35 ou 36.
    38. Método para preparação de um alimento ou ração compre- endendo adição da dita composição como definida na reivindicação 35 ou 36 ao dito alimento ou ração.
    39. Cultura iniciadora, cultura probiótica, ou cultura de suplemen- to dietético compreendendo a composição como definida na reivindicação 35 ou36.
    40. Método de fermentação compreendendo adição da composi- ção como definida na reivindicação 35 ou 36 a uma cultura iniciadora.
    41. Método de fermentação compreendendo adição da composi- ção como definida na reivindicação 35 ou 36 a um meio de fermentação, sob condições tais que a fermentação dos componentes do dito meio de fermen- tação ocorra.
    42. Método de acordo com a reivindicação 41, em que a dita fermentação não é afetada pela presença de bacteriófagos.
    43. Método de acordo com a reivindicação 41, em que o dito meio de fermentação é um produto alimentício.
    44. Método de acordo com a reivindicação 43, em que o dito produto alimentício é um produto lácteo.
    45. Método de acordo com a reivindicação 44, em que o dito produto lácteo é leite.
    46. Método de acordo com a reivindicação 41, em que pelo me- nos duas diferentes composições compreendendo duas ou mais cepas vari- i 10 antesresistentes a bacteriófago são sequencialmente expostas ao dito meio de fermentação.
    47. Método para redução da população de bacteriófagos prejudi- ciais em um meio de fermentação compreendendo exposição de um meio de fermentação a pelo menos uma cepa variante resistente a bacteriófago pro- “45 duzida usando o método como definido na reivindicação 1, sob condições 3 tais que a população de bacteriófago seja reduzida.
    48. Método para geração de pelo menos uma cepa variante re- sistente a bacteriófago, compreendendo as etapas de: (a) exposição de uma cepa bacteriana parental compreendendo pelomenos uma porção de um /ocux de CRISPR a pelo menos uma se- quência de ácido nucleico para produzir uma mistura de bactérias compre- endendo pelo menos uma cepa variante resistente a bacteriófago compre- endendo um /ocux de CRISPR modificado; (b) seleção da dita cepa variante resistente a bacteriófago a par- tirdadita mistura de bactérias; (c) comparação do dito /ocux de CRISPR ou de uma porção do mesmo da dita cepa bacteriana parental e do dito locux de CRISPR modifi- cado da dita cepa variante resistente a bacteriófago para identificar as cepas variantes resistentes a bacteriófago compreendendo pelo menos um frag- mento de ácido nucleico adicional no dito /ocux de CRISPR modificado que está ausente do dito /ocux de CRISPR da dita cepa bacteriana parental; (d) seleção das ditas cepas variantes resistentes a bacteriófago compreendendo um fragmento de ácido nucleico adicional no dito /ocux de CRISPR modificado; (e) análise de pelo menos um dito fragmento de ácido nucleico adicional no dito /ocux de CRISPR modificado para identificar pelo menos umaditacepa variante resistente a bacteriófago; e (f) isolamento de pelo menos uma dita cepa variante resistente a bacteriófago.
    49. Método para geração de fagos mutantes de escape de CRISPR compreendendo: f 10 (a) obtenção: pelo menos um fago parental e uma cepa bacteri- ana resistente ao fago compreendendo pelo menos um /ocux de CRISPR, em que o dito /ocux de CRISPR compreende uma sequência de ácido nucle- ico que é pelo menos aproximadamente 95% idêntica a pelo menos uma sequência protoespaçadora no genoma de pelo menos um dito fago paren- tal DL (b) exposição de pelo menos um fago parental à dita cepa bacte- riana resistente ao fago, sob condições tais que pelo menos uma variante de fago seja produzida; e (c) seleção de pelo menos uma dita variante de fago, em que pelomenos uma dita variante de fago exibe a capacidade de infectar a dita cepa bacteriana resistente ao fago e é um mutante de CRISPR para escape de fago.
    50. Método de acordo com a reivindicação 49, em que a cepa bacteriana resistente ao fago é uma cepa variante resistente a bacteriófago —obtidausando o método apresentado na reivindicação 48.
    51. Método de acordo com a reivindicação 49, compreendendo ainda a etapa comparação de pelo menos uma porção de pelo menos uma dita sequência protoespaçadora e um dito motivo de CRISPR posicionado perto de pelo menos uma sequência protoespaçadora na dita variante de fagocom pelo menos uma sequência protoespaçadora e motivo de CRISPR do dito fago parental.
    52. Método de acordo com a reivindicação 51, compreendendo ainda a etapa da seleção das ditas variantes de fagos que infectam a dita cepa bacteriana resistente ao fago, em que as ditas variantes de fagos com- preendem os ditos fagos mutantes de escape de CRISPR, e em que os ditos fagos de escape de CRISPR compreendem pelo menos uma mutação em pelomenos uma dita sequência protoespaçadora e/ou no motivo de CRISPR dos ditos fagos mutantes de escape de CRISPR.
    53. Método de acordo com a reivindicação 49, em que o dito mé- todo é iterativamente repetido um ou mais vezes usando os ditos fagos mu- tantes de escape de CRISPR e diferentes CRISPR de cepa bacteriana resis- tente ao fago compreendendo pelo menos um /ocux de CRISPR, em que o dito /ocux de CRISPR compreende uma sequência de ácido nucleico que é pelo menos aproximadamente 95% idêntica a pelo menos uma sequência protoespaçadora no genoma dos ditos fagos mutantes de escape de CRIS- PR.
    É 15 54. Método de acordo com a reivindicação 49, em que pelo me- . nos um dito bacteriófago é selecionado a partir do grupo de famílias de vírus consistindo de: Corticoviridae, Cystoviridae, Inoviridae, Leviviridae, Microviri- dae, Myoviridae, Podoviridae, Siphoviridae e Tectiviridae.
    55. Método de acordo com a reivindicação 49, em que a dita ce- pa bacteriana resistente ao fago é selecionada a partir de Escherichia, Shi- É gella, Salmonella, Erwinia, Yersinia, Bacillus, Vibrio, Legionella, Pseudomo- nas, Neisseria, Bordetella, Helicobacter, Listeria, Agrobacterium, Staphylo- coccus, Enterococcus, Clostridium, Corynebacterium, Mycobacterium, Tre- ponema, Borrelia, Francisella, Brucella, Campylobacter, Klebsiella, Frankia, Bartonella, Rickettsia, Shewanella, Serratia, Enterobacter, Proteus, Provi- dencia, Brochothrix, Bifidobacterium, Brevibacterium, Propionibacterium, Lactococcus, Lacitobacillus, Pediococcus, Leuconostoc, Streptococcus e Oe- NOCcoccus.
    56. Mutante de fago de escape de CRISPR obtido usando o mé- todo da reivindicação 49.
    57. Mutante de fago de escape de CRISPR de acordo com a reivindicação 56, em que duas ou mais mutações estão presentes em pelo menos duas sequências protoespaçadora e/ou no dito motivo de CRISPR.
    58. Mutante de fago de escape de CRISPR, em que o genoma do dito mutante de fago de escape de CRISPR é geneticamente construído para compreender mutações em pelo menos um protoespaçador e/ou dito —motivodeCRISPR.
    59. Mutante de fago de escape de CRISPR, em que pelo menos um dito motivo CRISPR é mutado.
    60. Mutante de fago de escape de CRISPR, em que pelo menos um dito motivo CRISPR é deletado.
    Á 10 61. Composição compreendendo pelo menos um mutante de fago de escape de CRISPR como definida na reivindicação 56.
    62. Método para controlar populações bacterianas em um produ- to compreendendo exposição da dita composição como definida na reivindi- cação 61 a um meio de fermentação, em que o dito meio de fermentação f 15 contém pelo menos uma população de bactérias indesejáveis, sob condi- p ções tais que a dita população de bactérias indesejáveis seja reduzida, e o dito meio de fermentação seja usado para gerar o dito produto.
    63. Método de acordo com a reivindicação 62, em que o dito produto é selecionado a partir de alimentos, rações, cosméticos, produtos de cuidado pessoal, produtos de cuidado de saúde, produtos veterinários, e suplementos dietéticos.
    64. Método de acordo com a reivindicação 62, em que o dito mé- todo é repetido pelo menos uma vez e as ditas composições diferentes da reivindicação 61 são usadas em rotação.
BRPI0808704-0A 2007-03-02 2008-02-29 Método para gerar uma cultura inicial compreendendo pelo menos duas cepas variantes resistentes a bacteriófagos, cultura iniciadora e método de fermentação BRPI0808704B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US90472107P 2007-03-02 2007-03-02
US60/904,721 2007-03-02
PCT/US2008/002714 WO2008108989A2 (en) 2007-03-02 2008-02-29 Cultures with improved phage resistance

Publications (2)

Publication Number Publication Date
BRPI0808704A2 true BRPI0808704A2 (pt) 2021-04-13
BRPI0808704B1 BRPI0808704B1 (pt) 2022-01-18

Family

ID=39736496

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0808704-0A BRPI0808704B1 (pt) 2007-03-02 2008-02-29 Método para gerar uma cultura inicial compreendendo pelo menos duas cepas variantes resistentes a bacteriófagos, cultura iniciadora e método de fermentação

Country Status (20)

Country Link
US (2) US20110002889A1 (pt)
EP (3) EP2126130B1 (pt)
JP (2) JP5932207B2 (pt)
CN (2) CN104531672B (pt)
AU (1) AU2008223544B2 (pt)
BR (1) BRPI0808704B1 (pt)
CY (1) CY1116417T1 (pt)
DK (2) DK2860267T3 (pt)
ES (2) ES2541693T3 (pt)
HK (1) HK1142930A1 (pt)
HR (1) HRP20150676T1 (pt)
HU (1) HUE025412T2 (pt)
MX (1) MX2009009071A (pt)
NZ (2) NZ579002A (pt)
PL (1) PL2126130T3 (pt)
PT (1) PT2126130E (pt)
RU (2) RU2531343C2 (pt)
SI (1) SI2126130T1 (pt)
TR (1) TR201905633T4 (pt)
WO (1) WO2008108989A2 (pt)

Families Citing this family (185)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
US8771766B2 (en) * 2008-12-12 2014-07-08 Dupont Nutrition Biosciences Aps Genetic cluster of strains of Streptococcus thermophilus having unique rheological properties for dairy fermentation
US9951341B2 (en) 2010-10-20 2018-04-24 Dupont Nutrition Biosciences Aps Lactococcus CRISPR-Cas sequences
US10548761B2 (en) 2011-02-04 2020-02-04 Joseph E. Kovarik Method and system for reducing the likelihood of colorectal cancer in a human being
US11523934B2 (en) 2011-02-04 2022-12-13 Seed Health, Inc. Method and system to facilitate the growth of desired bacteria in a human's mouth
US10835560B2 (en) 2013-12-20 2020-11-17 Joseph E. Kovarik Reducing the likelihood of skin cancer in an individual human being
US10245288B2 (en) 2011-02-04 2019-04-02 Joseph E. Kovarik Method and system for reducing the likelihood of developing NASH in an individual diagnosed with non-alcoholic fatty liver disease
US10010568B2 (en) 2011-02-04 2018-07-03 Katherine Rose Kovarik Method and system for reducing the likelihood of a spirochetes infection in a human being
US11273187B2 (en) 2015-11-30 2022-03-15 Joseph E. Kovarik Method and system for reducing the likelihood of developing depression in an individual
US10842834B2 (en) 2016-01-06 2020-11-24 Joseph E. Kovarik Method and system for reducing the likelihood of developing liver cancer in an individual diagnosed with non-alcoholic fatty liver disease
US11844720B2 (en) 2011-02-04 2023-12-19 Seed Health, Inc. Method and system to reduce the likelihood of dental caries and halitosis
US11357722B2 (en) 2011-02-04 2022-06-14 Seed Health, Inc. Method and system for preventing sore throat in humans
US11951140B2 (en) 2011-02-04 2024-04-09 Seed Health, Inc. Modulation of an individual's gut microbiome to address osteoporosis and bone disease
US10086018B2 (en) 2011-02-04 2018-10-02 Joseph E. Kovarik Method and system for reducing the likelihood of colorectal cancer in a human being
US11951139B2 (en) 2015-11-30 2024-04-09 Seed Health, Inc. Method and system for reducing the likelihood of osteoporosis
US11998479B2 (en) 2011-02-04 2024-06-04 Seed Health, Inc. Method and system for addressing adverse effects on the oral microbiome and restoring gingival health caused by sodium lauryl sulphate exposure
US9987224B2 (en) 2011-02-04 2018-06-05 Joseph E. Kovarik Method and system for preventing migraine headaches, cluster headaches and dizziness
US10085938B2 (en) 2011-02-04 2018-10-02 Joseph E. Kovarik Method and system for preventing sore throat in humans
US10687975B2 (en) 2011-02-04 2020-06-23 Joseph E. Kovarik Method and system to facilitate the growth of desired bacteria in a human's mouth
US10512661B2 (en) 2011-02-04 2019-12-24 Joseph E. Kovarik Method and system for reducing the likelihood of developing liver cancer in an individual diagnosed with non-alcoholic fatty liver disease
US10583033B2 (en) 2011-02-04 2020-03-10 Katherine Rose Kovarik Method and system for reducing the likelihood of a porphyromonas gingivalis infection in a human being
US11191665B2 (en) 2011-02-04 2021-12-07 Joseph E. Kovarik Method and system for reducing the likelihood of a porphyromonas gingivalis infection in a human being
US10111913B2 (en) 2011-02-04 2018-10-30 Joseph E. Kovarik Method of reducing the likelihood of skin cancer in an individual human being
US11419903B2 (en) 2015-11-30 2022-08-23 Seed Health, Inc. Method and system for reducing the likelihood of osteoporosis
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
AU2012333134B2 (en) 2011-07-22 2017-05-25 John Paul Guilinger Evaluation and improvement of nuclease cleavage specificity
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9637739B2 (en) * 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) * 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
DK2800811T3 (en) 2012-05-25 2017-07-17 Univ Vienna METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION
DE202013012610U1 (de) 2012-10-23 2017-11-24 Toolgen, Inc. Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung
WO2014089290A1 (en) 2012-12-06 2014-06-12 Sigma-Aldrich Co. Llc Crispr-based genome modification and regulation
ES2658401T3 (es) 2012-12-12 2018-03-09 The Broad Institute, Inc. Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
ES2598115T3 (es) * 2012-12-12 2017-01-25 The Broad Institute, Inc. Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
EP2931892B1 (en) 2012-12-12 2018-09-12 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP3825401A1 (en) 2012-12-12 2021-05-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
AU2013359212B2 (en) 2012-12-12 2017-01-19 Massachusetts Institute Of Technology Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
MY170059A (en) 2012-12-17 2019-07-02 Harvard College Rna-guided human genome engineering
WO2014113493A1 (en) * 2013-01-16 2014-07-24 Emory University Cas9-nucleic acid complexes and uses related thereto
WO2014124226A1 (en) 2013-02-07 2014-08-14 The Rockefeller University Sequence specific antimicrobials
US11135273B2 (en) 2013-02-07 2021-10-05 The Rockefeller University Sequence specific antimicrobials
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
NZ712727A (en) 2013-03-14 2017-05-26 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
KR102271292B1 (ko) 2013-03-15 2021-07-02 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US9902973B2 (en) 2013-04-11 2018-02-27 Caribou Biosciences, Inc. Methods of modifying a target nucleic acid with an argonaute
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
KR102512979B1 (ko) 2013-06-04 2023-03-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 전사 조절
WO2014204729A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
CN106062197A (zh) 2013-06-17 2016-10-26 布罗德研究所有限公司 用于序列操纵的串联指导系统、方法和组合物的递送、工程化和优化
RU2716420C2 (ru) 2013-06-17 2020-03-11 Те Брод Инститьют Инк. Доставка и применение систем crispr-cas, векторов и композиций для целенаправленного воздействия и терапии в печени
AU2014281027A1 (en) 2013-06-17 2016-01-28 Massachusetts Institute Of Technology Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
SG11201600060VA (en) 2013-07-10 2016-02-26 Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
EP2826379A1 (en) 2013-07-17 2015-01-21 Dupont Nutrition Biosciences ApS Streptococcus thermophilus strains
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
CN103388006B (zh) * 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
ES2681622T3 (es) 2013-09-18 2018-09-14 Kymab Limited Métodos, células y organismos
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
WO2015066119A1 (en) 2013-10-30 2015-05-07 North Carolina State University Compositions and methods related to a type-ii crispr-cas system in lactobacillus buchneri
WO2015070083A1 (en) 2013-11-07 2015-05-14 Editas Medicine,Inc. CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
NL2011912C2 (en) * 2013-12-06 2015-06-09 Univ Delft Tech Novel genome alteration system for microorganisms.
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
BR112016013547A2 (pt) 2013-12-12 2017-10-03 Broad Inst Inc Composições e métodos de uso de sistemas crispr-cas em distúrbios de repetições de nucleotídeos
JP7103750B2 (ja) 2013-12-12 2022-07-20 ザ・ブロード・インスティテュート・インコーポレイテッド ゲノム編集のためのCRISPR-Cas系及び組成物の送達、使用及び治療適用
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
US11839632B2 (en) 2013-12-20 2023-12-12 Seed Health, Inc. Topical application of CRISPR-modified bacteria to treat acne vulgaris
US11998574B2 (en) 2013-12-20 2024-06-04 Seed Health, Inc. Method and system for modulating an individual's skin microbiome
US11826388B2 (en) 2013-12-20 2023-11-28 Seed Health, Inc. Topical application of Lactobacillus crispatus to ameliorate barrier damage and inflammation
US11969445B2 (en) 2013-12-20 2024-04-30 Seed Health, Inc. Probiotic composition and method for controlling excess weight, obesity, NAFLD and NASH
US11980643B2 (en) 2013-12-20 2024-05-14 Seed Health, Inc. Method and system to modify an individual's gut-brain axis to provide neurocognitive protection
US11833177B2 (en) 2013-12-20 2023-12-05 Seed Health, Inc. Probiotic to enhance an individual's skin microbiome
US12005085B2 (en) 2013-12-20 2024-06-11 Seed Health, Inc. Probiotic method and composition for maintaining a healthy vaginal microbiome
US10787654B2 (en) 2014-01-24 2020-09-29 North Carolina State University Methods and compositions for sequence guiding Cas9 targeting
WO2015124718A1 (en) * 2014-02-20 2015-08-27 Dsm Ip Assets B.V. Phage insensitive streptococcus thermophilus
EP3114227B1 (en) 2014-03-05 2021-07-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
CA2947941C (en) 2014-03-05 2021-02-23 National University Corporation Kobe University Genome sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
DK3116997T3 (da) 2014-03-10 2019-08-19 Editas Medicine Inc Crispr/cas-relaterede fremgangsmåder og sammensætninger til behandling af lebers kongenitale amaurose 10 (lca10)
EP3981876A1 (en) 2014-03-26 2022-04-13 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
US11439712B2 (en) 2014-04-08 2022-09-13 North Carolina State University Methods and compositions for RNA-directed repression of transcription using CRISPR-associated genes
AU2015280069B2 (en) 2014-06-23 2021-08-12 The General Hospital Corporation Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US10450584B2 (en) 2014-08-28 2019-10-22 North Carolina State University Cas9 proteins and guiding features for DNA targeting and genome editing
ES2800168T3 (es) 2014-11-04 2020-12-28 Univ Kobe Nat Univ Corp Procedimiento de modificación de una secuencia genómica para introducir una mutación específica en una secuencia de ADN diana por reacción de eliminación de base, y complejo molecular usado en el mismo
CN107208070B (zh) * 2014-11-26 2021-09-07 技术创新动力基金(以色列)有限合伙公司 细菌基因的靶向消除
WO2016094867A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Protected guide rnas (pgrnas)
KR101761581B1 (ko) 2014-12-30 2017-07-26 주식회사 인트론바이오테크놀로지 신규한 장침입성 대장균 박테리오파지 Esc-COP-4 및 이의 장침입성 대장균 증식 억제 용도
KR101649851B1 (ko) * 2014-12-30 2016-08-30 주식회사 인트론바이오테크놀로지 신규한 시가독소생산 F18형 대장균 박테리오파지 Esc-COP-1 및 이의 시가독소생산 F18형 대장균 증식 억제 용도
KR20190112855A (ko) 2015-01-28 2019-10-07 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 Crispr 하이브리드 dna/rna 폴리뉴클레오티드 및 사용 방법
CA2978314A1 (en) 2015-03-03 2016-09-09 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
CN107690480B (zh) 2015-04-24 2022-03-22 爱迪塔斯医药公司 Cas9分子/指导rna分子复合物的评价
EP4005386A1 (en) 2015-05-06 2022-06-01 SNIPR Technologies Limited Altering microbial populations & modifying microbiota
CN108026536A (zh) * 2015-05-29 2018-05-11 北卡罗来纳州立大学 使用crispr核酸筛选细菌、古细菌、藻类和酵母的方法
EP4299754A3 (en) * 2015-06-15 2024-03-20 North Carolina State University Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
MX2017016289A (es) 2015-06-18 2018-08-15 Broad Inst Inc Mutaciones de la enzima crispr que reducen los efectos fuera del blanco.
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
KR20240090567A (ko) 2015-08-28 2024-06-21 더 제너럴 하스피탈 코포레이션 조작된 crispr-cas9 뉴클레아제
ES2938623T3 (es) 2015-09-09 2023-04-13 Univ Kobe Nat Univ Corp Método para convertir una secuencia del genoma de una bacteria gram-positiva mediante una conversión específica de una base de ácido nucleico de una secuencia de ADN seleccionada como diana y el complejo molecular utilizado en el mismo
WO2017044843A1 (en) 2015-09-11 2017-03-16 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
EP3356533A1 (en) 2015-09-28 2018-08-08 North Carolina State University Methods and compositions for sequence specific antimicrobials
EP3356526B1 (en) 2015-09-30 2021-08-25 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq)
WO2017070632A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
MX2018005611A (es) 2015-11-03 2018-11-09 Harvard College Metodo y aparato para la formacion de imagenes volumetricas de una matriz tridimensional que contiene acido nucleico.
EP3382019B1 (en) 2015-11-27 2022-05-04 National University Corporation Kobe University Method for converting monocot plant genome sequence in which nucleic acid base in targeted dna sequence is specifically converted, and molecular complex used therein
US10933128B2 (en) 2015-11-30 2021-03-02 Joseph E. Kovarik Method and system for protecting honey bees from pesticides
US10086024B2 (en) 2015-11-30 2018-10-02 Joseph E. Kovarik Method and system for protecting honey bees, bats and butterflies from neonicotinoid pesticides
US10675347B2 (en) 2015-11-30 2020-06-09 Joseph E. Kovarik Method and system for protecting honey bees from fipronil pesticides
US11529412B2 (en) 2015-11-30 2022-12-20 Seed Health, Inc. Method and system for protecting honey bees from pesticides
US10568916B2 (en) 2015-11-30 2020-02-25 Joseph E. Kovarik Method and system for protecting honey bees, bats and butterflies from neonicotinoid pesticides
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
CN105567218A (zh) * 2015-12-25 2016-05-11 哈尔滨工业大学 红色发光材料铕配位聚合物、其制备方法及基于该聚合物的复合光能转换薄膜的制备方法
GB201600075D0 (en) * 2016-01-03 2016-02-17 Glaxosmithkline Biolog Sa Immunogenci composition
WO2017165862A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
CN116200465A (zh) 2016-04-25 2023-06-02 哈佛学院董事及会员团体 用于原位分子检测的杂交链反应方法
KR20190039473A (ko) * 2016-05-15 2019-04-12 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 여드름 치료를 위한 조성물 및 방법
DK3604527T3 (da) 2016-06-02 2021-05-31 Sigma Aldrich Co Llc Anvendelse af programmerbare dna-bindingsproteiner til at forbedre målrettet genommodifikation
GB201609811D0 (en) 2016-06-05 2016-07-20 Snipr Technologies Ltd Methods, cells, systems, arrays, RNA and kits
CA3032822A1 (en) 2016-08-02 2018-02-08 Editas Medicine, Inc. Compositions and methods for treating cep290 associated disease
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
WO2018031683A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
EP3525832A4 (en) 2016-10-14 2020-04-29 The General Hospital Corp. SITE SPECIFIC NUCLEASES WITH EPIGENETIC REGULATION
EP3526320A1 (en) 2016-10-14 2019-08-21 President and Fellows of Harvard College Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US10806490B2 (en) 2017-03-08 2020-10-20 Conmed Corporation Single lumen gas sealed access port for use during endoscopic surgical procedures
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
WO2018170184A1 (en) 2017-03-14 2018-09-20 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
CA3057432C (en) 2017-03-22 2023-08-08 National University Corporation Kobe University Method for converting nucleic acid sequence of cell specifically converting nucleic acid base of targeted dna using cell endogenous dna modifying enzyme, and molecular complex used therein
KR102687373B1 (ko) 2017-03-23 2024-07-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
CN116555353A (zh) 2017-04-20 2023-08-08 E开创生物技术股份有限公司 产生基因修改的动物的方法
EP3612551B1 (en) 2017-04-21 2024-09-04 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
US11732251B2 (en) * 2017-04-24 2023-08-22 Dupont Nutrition Biosciences Aps Anti-CRISPR polynucleotides and polypeptides and methods of use
WO2018209158A2 (en) 2017-05-10 2018-11-15 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US20200172895A1 (en) 2017-05-25 2020-06-04 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
CA3073448A1 (en) 2017-08-23 2019-02-28 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019075197A1 (en) 2017-10-11 2019-04-18 The General Hospital Corporation METHODS OF DETECTION OF INDIVIDUAL SITE-SPECIFIC PARASITE GENOMIC DEAMINATION BY BASE EDITING TECHNOLOGIES
CN111757937A (zh) 2017-10-16 2020-10-09 布罗德研究所股份有限公司 腺苷碱基编辑器的用途
CN107723280B (zh) * 2017-11-10 2019-09-17 扬州大学 波罗的海希瓦氏菌噬菌体SppYZU01及其用途
AU2019236209A1 (en) 2018-03-14 2020-10-01 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
US10760075B2 (en) 2018-04-30 2020-09-01 Snipr Biome Aps Treating and preventing microbial infections
CA3097044A1 (en) 2018-04-17 2019-10-24 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
CN108588245A (zh) * 2018-04-19 2018-09-28 上海市质量监督检验技术研究院 乳酸菌饮料中嗜酸乳杆菌成分的荧光定量pcr检测方法、检测试剂盒及应用
JP2021522857A (ja) * 2018-05-04 2021-09-02 ローカス バイオサイエンシーズ,インク. 標的細菌を死滅させるための方法および組成物
WO2020072248A1 (en) 2018-10-01 2020-04-09 North Carolina State University Recombinant type i crispr-cas system
US11851663B2 (en) 2018-10-14 2023-12-26 Snipr Biome Aps Single-vector type I vectors
US20220099672A1 (en) * 2019-01-31 2022-03-31 Locus IP Company,LLC Method for Treating and/or Preventing Bacteriophage Lysis During Fermentation
EP3921417A4 (en) 2019-02-04 2022-11-09 The General Hospital Corporation ADENINE DNA BASE EDITOR VARIANTS WITH REDUCED OFF-TARGET RNA EDITING
SG11202109550TA (en) * 2019-03-07 2021-09-29 Univ Columbia Rna-guided dna integration using tn7-like transposons
WO2020191249A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN110129279B (zh) * 2019-04-24 2022-02-18 昆明理工大学 一种粪肠球菌噬菌体及其分离、纯化、富集和应用
AU2020350767A1 (en) * 2019-09-18 2022-04-14 Ancilia, Inc. Compositions and methods for microbiome modulation
CN110904054A (zh) * 2019-09-29 2020-03-24 中国科学院大学 一种沙门氏菌噬菌体see-1及其应用
WO2021151972A1 (en) * 2020-01-30 2021-08-05 Dsm Ip Assets B.V. Rotation scheme for bacterial cultures in food product fermentation
WO2021156863A1 (en) * 2020-02-03 2021-08-12 Technion Research & Development Foundation Limited Method for isolating a microorganism
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
CN112063593B (zh) * 2020-09-17 2021-08-31 扬州大学 一种致病性弧菌噬菌体VmYZU10474及其应用
US20240067935A1 (en) * 2020-12-23 2024-02-29 Locus Biosciences, Inc. Altering the normal balance of microbial populations
WO2023006885A1 (en) 2021-07-29 2023-02-02 Dupont Nutrition Biosciences Aps Compositions and methods for producing fermented plant-based compositions having cream flavor
WO2023006883A1 (en) 2021-07-29 2023-02-02 Dupont Nutrition Biosciences Aps Compositions and methods for producing fermented dairy compositions having cream flavor
WO2023082047A1 (en) 2021-11-09 2023-05-19 Dupont Nutrition Biosciences Aps Compositions and methods for producing fermented dairy prod-ucts for storage at ambient temperature
US20230279442A1 (en) 2021-12-15 2023-09-07 Versitech Limited Engineered cas9-nucleases and method of use thereof
GB202209518D0 (en) 2022-06-29 2022-08-10 Snipr Biome Aps Treating & preventing E coli infections

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2225783A (en) 1939-04-07 1940-12-24 Lloyd B Jensen Sausage treatment
US3024116A (en) * 1959-02-24 1962-03-06 Libby Mcneill And Libby Food processing
US3403032A (en) * 1967-10-04 1968-09-24 Agriculture Usa Pure culture fermentation process for pickled cucumbers
US3897307A (en) 1974-10-23 1975-07-29 Hansens Lab Inc Stabilized dry cultures of lactic acid-producing bacteria
US3932674A (en) 1974-11-29 1976-01-13 The United States Of America Controlled bulk vegetable fermentation
US4140800A (en) * 1977-06-13 1979-02-20 Leo Kline Freeze-dried natural sour dough starter
SU823423A1 (ru) * 1979-06-18 1981-04-23 Алтайский Филиал Всесоюзного Научно- Исследовательского Института Масло-Дельной И Сыродельной Промышленности Штамм 122-АНТАгОНиСТ пОСТОРОННЕй МиКРОфлОРыСыРА
US4423079A (en) 1980-07-14 1983-12-27 Leo Kline Growth promoting compositions for Lactobacillus sanfrancisco and method of preparation
US4621058A (en) 1983-04-11 1986-11-04 Mid-America Dairymen, Inc. Method of preparing cheese starter media
NZ239639A (en) * 1990-09-05 1993-05-26 Univ North Carolina State Phage resistant fermentations using a bacterial culture of isogenic strains carrying different phage defense mechanisms
US20030219778A1 (en) 2000-08-29 2003-11-27 Universidade Federal De Minas Gerais - Ufmg Method for the diagnosis, identification and characterization of M. tuberculosis and other mycobacteria by shift mobility assay
US20060153811A1 (en) * 2005-01-10 2006-07-13 Jackson Lee E Use of viruses and virus-resistant microorganisms for controlling microorganism populations
CA2961849C (en) 2005-08-26 2022-08-02 Dupont Nutrition Biosciences Aps Use of crispr associated genes (cas)
ES2373586T3 (es) * 2006-05-19 2012-02-06 Danisco A/S Microorganismos marcados y métodos para marcar.

Also Published As

Publication number Publication date
EP2860267B1 (en) 2019-01-16
WO2008108989A3 (en) 2009-03-05
TR201905633T4 (tr) 2019-05-21
EP2126130B1 (en) 2015-03-25
US9951342B2 (en) 2018-04-24
AU2008223544A1 (en) 2008-09-12
HK1142930A1 (en) 2010-12-17
MX2009009071A (es) 2009-09-24
CN104531672A (zh) 2015-04-22
US20150093473A1 (en) 2015-04-02
WO2008108989A2 (en) 2008-09-12
DK2126130T3 (en) 2015-06-29
RU2531343C2 (ru) 2014-10-20
AU2008223544B2 (en) 2014-06-05
CN104531672B (zh) 2020-01-10
BRPI0808704B1 (pt) 2022-01-18
PT2126130E (pt) 2015-08-03
DK2860267T3 (en) 2019-04-23
RU2009136452A (ru) 2011-04-10
RU2687148C1 (ru) 2019-05-07
NZ592231A (en) 2012-07-27
CN101688241A (zh) 2010-03-31
ES2541693T3 (es) 2015-07-23
EP2489275A1 (en) 2012-08-22
HUE025412T2 (en) 2016-02-29
EP2489275B1 (en) 2016-09-21
EP2126130A2 (en) 2009-12-02
CY1116417T1 (el) 2017-02-08
EP2860267A1 (en) 2015-04-15
SI2126130T1 (sl) 2015-10-30
AU2008223544A2 (en) 2009-09-17
JP5932207B2 (ja) 2016-06-08
CN101688241B (zh) 2015-01-21
ES2719789T3 (es) 2019-07-16
US20110002889A1 (en) 2011-01-06
HRP20150676T1 (hr) 2015-09-25
JP2010519929A (ja) 2010-06-10
NZ579002A (en) 2012-03-30
PL2126130T3 (pl) 2015-10-30
JP2013027395A (ja) 2013-02-07

Similar Documents

Publication Publication Date Title
BRPI0808704A2 (pt) Culturas com resistência ao fago melhorada
US10640778B2 (en) Method of modulating cell resistance
AU2017224999A1 (en) Use
AU2012244264A1 (en) Use
AU2014216054B2 (en) Cultures with improved phage resistance
ES2348069T3 (es) Utilización de genes asociados a crispr (cas).

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B25D Requested change of name of applicant approved

Owner name: DUPONT NUTRITION BIOSCIENCE APS (DK)

B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B25D Requested change of name of applicant approved

Owner name: DUPONT NUTRITION BIOSCIENCES APS (DK)

B25G Requested change of headquarter approved

Owner name: DUPONT NUTRITION BIOSCIENCES APS (DK)

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 29/02/2008, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 16A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2764 DE 26-12-2023 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.