BR112020023602A2 - alelo marcador artificial - Google Patents

alelo marcador artificial Download PDF

Info

Publication number
BR112020023602A2
BR112020023602A2 BR112020023602-0A BR112020023602A BR112020023602A2 BR 112020023602 A2 BR112020023602 A2 BR 112020023602A2 BR 112020023602 A BR112020023602 A BR 112020023602A BR 112020023602 A2 BR112020023602 A2 BR 112020023602A2
Authority
BR
Brazil
Prior art keywords
interest
nucleic acid
indel
organism
genomic locus
Prior art date
Application number
BR112020023602-0A
Other languages
English (en)
Inventor
Dietrich Borchardt
Original Assignee
KWS SAAT SE & Co. KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE & Co. KGaA filed Critical KWS SAAT SE & Co. KGaA
Publication of BR112020023602A2 publication Critical patent/BR112020023602A2/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • A01H1/045Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Botany (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

"ALELO MARCADOR ARTIFICIAL". A presente invenção refere-se um método para a preparação de um alelo marcador artificial para a identificação de um ácido nucleico de interesse em um organismo. A invenção também se refere à determinação da presença de um ácido nucleico de interesse em uma população mista e um método para introgressão de um ácido nucleico de interesse em uma população. A invenção também se refere aos organimos, particularmente plantas e sementes, compreendendo tal alelo marcador e aos vários usos para o alelo marcador artificial.

Description

Relatório Descritivo da Patente de Invenção para "ALELO MARCADOR ARTIFICIAL".
CAMPO TÉCNICO
[001] A presente invenção refere-se ao campo da biotecnologia. Mais especificamente, a invenção refere-se a um método para fazer um alelo marcador artificial para a identificação de um ácido nucleico de interesse em um organismo. A invenção também se refere à determinação da presença de um ácido nucleico de interesse em uma população mista e a um método para introgressão de um ácido nucleico de interesse em uma população. A invenção também se refere a organismos, particularmente plantas e sementes, compreendendo um alelo marcador artificial e a vários usos para o alelo marcador artificial.
ANTECEDENTES
[002] A reprodução de planta fez um progresso notável no aumento da produtividade das lavouras por mais de um século. No entanto, os produtores de planta enfrentam constantemente novos desafios. Mudanças nas práticas agrícolas criam a necessidade de desenvolver genótipos com novos traços agronômicos. Novas pragas de fungos e insetos evoluem continuamente e superam a resistência existente da planta hospedeira. Novas áreas de terra estão sendo regularmente usadas para agricultura, expondo as plantas às condições de cultivo alteradas. Finalmente, o aumento da população global exigirá maior cultura para a produção de alimentos. Desse modo, a tarefa de aumentar a produtividade das culturas representa um desafio sem precedentes para os produtores de planta e cientistas agrícolas.
[003] A reprodução de planta desempenhará um papel fundamental no esforço coordenado para fornecer soluções para os problemas acima. Dado o contexto das tendências de produção atuais,
crescimento populacional previsto e pressão sobre o meio ambiente, traços relacionados à estabilidade e sustentabilidade da produção são o foco principal dos esforços de reprodução de planta. Estes traços incluem resistência durável às doenças, tolerância ao estresse abiótico e eficiência no uso de nutrientes e água.
[004] Apesar do otimismo sobre a melhora contínua do rendimento da reprodução convencional, novas soluções biotecnológicas serão necessárias para maximizar a probabilidade de sucesso. Uma área da biotecnologia, a saber a tecnologia de marcadores de DNA, derivada da investigação em genética molecular e genômica, oferece uma grande promessa para a reprodução de plantas. Devido à ligação genética, os marcadores de DNA podem ser usados para detectar a presença de variação alélica nos genes subjacentes a um traço desejado. Usando marcadores de DNA para auxiliar na produção de planta, a eficiência e a precisão poderiam ser bastante aumentadas. O uso de marcadores de DNA em uma reprodução de planta é chamado de seleção assistida por marcador (MAS) e é um componente da nova disciplina de "reprodução molecular".
[005] Durante as duas últimas décadas, o uso de tecnologia de marcador de DNA na reprodução de planta aumentou dramaticamente. Entretanto, o uso de reprodução assistida por marcador e a identificação de marcadores adequados é um processo trabalhoso e demorado. Além disso, a reprodução assistida por marcador é limitada porque os genomas de planta são ricamente dispersos com sequências repetitivas que obstruem significantemente a possibilidade do desenvolvimento e uso de marcadores diagnósticos. Especialmente para culturas com grandes tamanhos de genoma, a identificação de segmentos de DNA de baixo número de cópias pode ser altamente desafiador. Além disso, em muitos casos, apenas polimorfismos de
DNA com ligação extremamente estreita ao gene de traço ou mesmo o próprio polimorfismo causal podem ser explorados para serem convertidos em marcadores de DNA úteis.
[006] EP 2 342 337 B1 descreve um método de introduzir marcadores únicos, artificiais e selecionáveis em regiões alvo em vez de identificar e explorar polimorfismos de ocorrência natural. A estratégia descrita é baseada na identificação e seleção de uma seção de DNA que está intimamente ligada ao(s) traço(s) de interesse e na conversão desta seção em um marcador selecionável pela inserção de um único polimorfismo de nucleotídeo (SNP) em uma composição de nucleotídeo substancialmente conservada desta seção de DNA. O método descrito em EP 2 342 337 B1, no entanto, sofre das desvantagens de ser demorado e trabalhoso e gerar um marcador de baixa sensibilidade e confiabilidade, tornando os marcadores resultantes inadequados para os propósitos de controle de qualidade, por exemplo.
[007] Seria, portanto, vantajoso ser capaz de fornecer alelos de marcadores artificiais e métodos para a produção dos mesmos que superem os problemas acima mencionados.
SUMÁRIO DA INVENÇÃO
[008] A presente invenção supera esses problemas ao fornecer alelos de marcadores InDel artificiais com maior sensibilidade e confiabilidade que podem ser usados em particular para aplicações de controle de qualidade.
[009] De acordo com um primeiro aspecto da presente invenção, é fornecido um método para fazer um alelo de marcador artificial para a identificação de um ácido nucleico de interesse, de preferência codificando um polipeptídeo que confere um traço de interesse, em um organismo, o método compreendendo: (a) identificar pelo menos um lócus genômico no gemona do organismo, que é geneticamente ligado ao ácido nucleico de interesse, e (b) introduzir pelo menos um InDel no pelo menos um lócus genômico, desse modo criando um alelo marcador que é hereditária às gerações subsequentes do organismo junto com o ácido nucleico de interesse.
[0010] De acordo com um segundo aspecto da presente invenção, é fornecido um método para determinar a presença de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, em uma população mista de indivíduos compreendendo o ácido nucleico de interesse e indivíduos que não compreendem o ácido nucleico de interesse, o referido método compreendendo a detecção de um alelo marcador artificial como definido no primeiro aspecto da invenção usando pelo menos um marcador molecular específico para o alelo marcador artificial e/ou pelo menos um marcador molecular específico para o lócus genômico do tipo selvagem.
[0011] De acordo com um terceiro aspecto da presente invenção, é fornecido um método para avaliar a homogeneidade de uma população de indivíduos compreendendo um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, o referido método compreendendo a detecção de um alelo marcador artificial como definido no primeiro aspecto da invenção e determinar a homogeneidade na população usando pelo menos um marcador molecular específico para o alelo marcador artificial e/ou pelo menos um marcador molecular específico para o lócus genômico do tipo selvagem, em que a detecção do lócus genômico do tipo selvagem indica a distribuição heterogênea de indivíduos compreendendo o ácido nucleico de interesse na população.
[0012] De acordo com um quarto aspecto da presente invenção, é fornecido um método para introgressão de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, para uma população de indivíduos, compreendendo as etapas de: (i) preparar um alelo marcador artificial de acordo com o primeiro aspecto da invenção em um organismo doador que compreende o ácido nucleico de interesse; (ii) cruzar o referido organismo doador com um organismo receptor da mesma espécie não compreendendo o ácido nucleico de interesse para gerar progênie de composição genética heterogênea; (iii) retrocruzamento/autofecundação e seleção para presença do alelo marcador artificial para obtenção de descendência de composição genética homozigótica, que compreende o ácido nucleico de interesse no fundo do organismo receptor, (iv) opcionalmente, repetir a etapa (iii) pelo menos uma vez, preferivelmente diversas vezes.
[0013] A etapa (iii) do método é baseada na detecção usando pelo menos um marcador molecular específico para detecção da presença do alelo marcador artificial na progênie e/ou pelo menos um marcador molecular específico para detecção da ausência do alelo marcador artificial na progênie.
[0014] O organismo receptor pode ser uma planta, um animal, um micro-organismo ou um fungo, preferivelmente uma planta, mais preferivelmente uma planta de uma linhagem de elite, uma planta do tipo selvagem, uma planta mutante, uma planta editada por gene ou editada por base ou uma planta transgênica.
[0015] De acordo com um quinto aspecto da presente invenção, é fornecido um método para preparar um alelo marcador artificial compreendendo criar um ou mais InDels específicos de genótipo e introduzir os referidos InDels em um lócus genômico no genoma de um organismo, em que o lócus genômico é genicamente ligado a um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse. É também fornecido um alelo marcador artificial compreendendo pelo menos um InDel específico de genótipo obtenível por tal método.
[0016] De acordo com um sexto aspecto da presente invenção, é fornecido o uso de um alelo marcador artificial de acordo com o quinto aspecto ou uso de um alelo marcador artificial obtenível por um método de acordo com o primeiro aspecto da presente invençãona reprodução assistida por marcador.
[0017] É também fornecido o uso de uma nuclease programável para a geração de um alelo marcador artificial de acordo com o primeiro aspecto da presente invenção para a identificação de um ácido nucleico de interesse no genoma de um organismo. A nuclease programável pode ser selecionada de sistemas de nuclease CRISPR, nucleases de dedo de zinco, TALENs, meganucleases, ou editores de base.
[0018] De acordo com um sétimo aspecto da presente invenção, é fornecido um organismo, preferivelmente uma planta ou uma semente do mesmo, compreendendo um alelo marcador artificial obtenível por um método de acordo com o primeiro aspecto ou compreendendo um alelo marcador artificial de acordo com o quinto aspecto.
DESCRIÇÃO DETALHADA
[0019] O primeiro aspecto da presente invenção fornece um método para a preparação de um alelo marcador artificial para a identificação de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, em um organismo, o método compreendendo: (a) identificar pelo menos um lócus genômico no gemona do organismo, que é geneticamente ligado ao ácido nucleico de interesse, e (b) introduzir pelo menos um InDel no pelo menos um lócus genômico, desse modo criando um alelo marcador que é hereditária às gerações subsequentes do organismo junto com o ácido nucleico de interesse.
[0020] O ácido nucleico de interesse preferivelmente codifica um polipeptídeo que codifica um traço de interesse. O traço pode ser um traço fenotípico e pode ser fenotipicamente observável, por exemplo, a olho nu ou por outros meios, tais como microscopia, através de análises bioquímicas, análises genômicas, perfilagem transcricional, etc. O fenótipo pode ser atribuído a um único gene ou lócus genético ou pode resultar da ação de vários genes. Traços típicos no genoma de uma planta de importância econômica incluem traços relacionados à produção, incluindo resistência ao acamamento, tempo de floração, resistência à fragmentação, cor da semente, composição do endosperma, conteúdo nutricional, resistência ao herbicida, incluindo resistência ao glifosato, glufosinato/fosfinotricina, higromicina (hyg), inibidores de protoporfirinogênio oxidase (PPO), inibidores de ALS, e Dicamba, resistência à doenças, incluindo resistência viral, resistência aos fungos, resistência bacteriana, ou resistência a insetos, resistência ou tolerância ao estresse abiótico, incluindo estresse hídrico, estresse osmótico, estresse por calor, estresse por frio, estresse oxidativo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou encharcamento e nutrientes - e eficiência do uso de água, esterilidade masculina. Em uma modalidade preferida da invenção, um traço de interesse pode ser artificialmente introduzido em um ácido nucleico de interesse por meio de modificação de gene com base em edição de gene (GE) ou com base em editor de base baseada em edição de gene (GE) por meio de uma nuclease programável ou nickase, com base em edição de base por meio de um editor de base ou com base em uma combinação dos meios.
[0021] Um "alelo" como usado aqui refere-se a uma forma variante de uma sequência de ácido nucleico ou gene em um lócus genômico particular e o termo "alelo marcador artificial" como usado aqui é considerado significar um alelo único artificialmente criado geralmente não encontrado na natureza em um organismo em questão. O "alelo marcador artificial" no contexto da presente invenção é geneticamente ligado a um ácido nucleico de interesse que está associado com um traço desejado. O "alelo marcador artificial" como usado aqui, portanto, refere-se a um polimorfismo de nucleotídeo que pode ser usado para a identificação de um ácido nucleico de interesse associado com um traço de interesse no genoma de um organismo.
[0022] A primeira etapa do método para preparação de um alelo marcador artificial compreende identificar pelo menos um lócus genômico no gemona do organismo que é geneticamente ligado ao ácido nucleico de interesse. Tal lócus genômico é aquele que é único no genoma de um organismo e altamente conservado entre os diferentes genótipos do organismo. Uma pessoa versada no campo de reprodução animal ou de planta apreciará o que é pretendido pelo termo "altamente conservado" no contexto da presente invenção. Em particular, o termo "altamente conservado" como usado aqui, refere-se a uma sequência genômica, preferivelmente entre 100 e 200 bp de comprimento, que compartilha pelo menos 90%, 90,5%, 91%, 91,5%, 92%, 92,5%, 93%, 93,5%, 94%, 94,5% 95%, 95,5%, 96%, 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,5% ou 100% de identidade de sequência através de diferentes genótipos do organismo. Como usado aqui, "genótipo" refere-se à constituição genética de um indivíduo ou grupo de indivíduos em um ou mais loci genéticos. O genótipo de um indivíduo ou a grupo de indivíduos é a soma de todos os genes e determina seu fenótipo. Quando referindo-se à conservação em diferentes genótipos de um organismo, isto pode ser a conservação em diferentes indivíduos de uma população de uma determinada espécie, cultivar ou raça do organismo. "Cultivar" e "variedade" são usados alternativamente aqui para significar um grupo de plantas dentro de uma espécie, por exemplo, B. vulgaris, que compartilha certos traços genéticos, resultando no mesmo fenótipo que os separa de outras variedades possíveis dentro de tal espécie. Os cultivares podem ser endogâmicos ou híbridos, como aplicável para a cultura em questão.
[0023] Para identificar um lócus genômico altamente conservado em diferentes genótipos, análise de sequência detalhada em um grupo de indivíduos é realizada para identificar uma região de aproximadamente 100 a 200 pares de base (bp). A região identificada deve ser única dentro do genoma alvo para permitir a inserção específica do InDel por edição de genoma ou edição de base. O lócus genômico altamente conservado então permite o uso geral do marcador na faixa mais ampla possível de genótipos e fundo genético.
[0024] O lócus genômico está idealmente posicionado fora de qualquer região codificadora (excepcionalmente, pode haver razão para selecionar uma região codificadora), sinal de ligação ou elemento regulador de ácido nucleico de interesse, 3'UTRs, 5'UTRs, íntrons, miRNAs, RNAs não codificantes e quaisquer outras características possíveis. Estas precauções são consideradas porque a interação genômica não pode ser excluída. A região promotora de um gene geralmente não é muito bem caracterizada, portanto, uma localização na direção 3' do gene alvo é preferida. No entanto, onde a localização está na região 5' de um gene é favorecida, um comprimento de promotor de 1000 bp é assumido e não será selecionado para introdução do pelo menos um InDel.
[0025] Além disso, o lócus genômico deve estar preferivelmente na vizinhança física e desequilíbrio de ligação total (LD) ao ácido nucleico de interesse para evitar a separação do alelo marcador artificial do ácido nucleico de interesse no decurso da recombinação. O termo "desequilíbrio de ligação" (LD) refere-se à segregação não randômica de traços ou loci genéticos (ou ambos) e implica no fato de que os loci relevantes estão dentro de proximidade física e/ou genética suficiente ao longo de um comprimento de um cromossomo para que eles segreguem junto com frequência maior do que randômica (ou seja, não randômica).
[0026] O lócus genômico é intimamente ligado ao ácido nucleico de interesse, de modo que quando um InDel é introduzido no lócus genômico, a fim de criar um alelo marcador artificial, o alelo marcador seja hereditário às gerações subsequentes do organismo junto com o ácido nucleico de interesse. O lócus genômico é idealmente posicionado em uma região que flanqueia o ácido nucleico de interesse e está preferivelmente localizado na extremidade 3’ do ácido nucleico de interesse. A região que flanqueia o ácido nucleico de interesse está preferivelmente em uma distância de pelo menos 2 cM, 1 cM, 0,5 cM, 0,1 cM, 0,09 cM, 0,08 cM, 0,07 cM, 0,06 cM, 0,05 cM, 0,04 cM, 0,03 cM, 0,02 cM 0,01 cM, 0,009 cM, 0,008 cM, 0,007 cM, 0,006 cM, 0,005 cM, 0,004 cM, 0,003 cM, 0,002 cM 0,001 cM, 0,0009 cM, 0,0008 cM, 0,0007 cM, 0,0006 cM, 0,0005 cM, 0,0004 cM, 0,0003 cM, 0,0002 cM ou 0,0001 cM do ácido nucleico de interesse ou a uma distância em qualquer lugar entre os valores acima. "cM" como usado aqui define a distância entre dois loci em um cromossomo e é uma medida de frequência de recombinação bem conhecida na técnica.
[0027] Os termos "região de flaqueamento …" ou "região que flanqueia …" são usados alternadamente aqui e referem-se a uma sequência de ácido nucleico de um lócus genômico predeterminado que está geneticamente ligado a um ácido nucleico de interesse no qual o pelo menos um InDel é inserido para gerar um alelo marcador InDel artificial.
[0028] Alternativamente, o lócus genômico pode estar dentro do próprio ácido nucleico de interesse. Quando o lócus genômico esta localizado dentro do ácido nucleico de interesse, o lócus genômico deve preferivelmente estar posicionado fora de qualquer região de codificação, sinal de ligação ou elemento regulatório do ácido nucleico de interesse, 3’UTRs, 5’UTRs, íntrons, miRNAs, RNAs não codificantes e similares, de modo quando o pelo menos um InDel é introduzido no lócus genômico ele não cause uma perda de função.
[0029] A sequência de nucleotídeo do lócus genômico obtido após inserção do pelo menos um InDel, isto é, o alelo marcador artificial, é única no gemona do organismo, na medida em que se possa determinar, significando que não ocorre ou ocorre apenas muito raramente no germoplasma do organismo em questão. O organismo resultante contém assim uma alteração introduzida especificamente na sua sequência genética que está intimamente ligada ao ácido nucleico de interesse, que preferivelmente codifica um polipeptídeo que confere um traço de interesse. Este InDel especificamente introduzido (que cria um alelo marcador artificial) pode agora ser usado e testado de qualquer forma convencional em criação assistida por marcador, e como também descrito aqui.
[0030] O termo "germplasma", como usado aqui, refere-se ao material genético com uma composição molecular específica que fornece algumas ou todas as qualidades hereditárias de um organismo ou cultura celular e coleções de tal material. Os criadores usam o termo "germoplasma" para indicar sua coleção de material genético de, por exemplo, espécies de tipo selvagem, linhagens de criação de elite ou domésticas, das quais eles podem extrair para criar variedades ou raças. Como usado aqui, "germplasma" pode ser qualquer recurso genético vivo, incluindo, porém não limitado às células, sementes ou tecidos a partir dos quais novas plantas podem ser cultivadas, ou partes de plantas, tais como folhas, caules, pólen, óvulos ou células que podem ser cultivadas em uma planta inteira.
[0031] O "organismo" é preferivelmente uma planta, porém pode também ser um animal, fungo ou micro-organismo. O termo "planta" como usado aqui refere-se às plantas inteiras, ancestrais e progênie das mesmas e às partes de planta. As partes das plantas podem incluir sementes, tecidos, células, órgãos, folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pólen, tubos polínicos, filamentos de anteras, óvulos, sacos embrionários, células-ovo, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, gametófitos, esporos e estacas. O termo "planta" como usado aqui também compreende germplasma de uma planta que pode ser cultivado em plantas inteiras ou partes de planta. Plantas ancestrais e progênie podem ser de qualquer geração filial, por exemplo, P, F1, F2, F3 e assim por diante e qualquer planta resultante do retrocruzamento das mesmas.
[0032] A planta pode ser qualquer planta e pode, por exemplo, ser selecionada de Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea,
Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, e Allium tuberosum.
[0033] A segunda etapa no método para preparar um alelo marcador artificial compreende introduzir pelo menos um InDel no pelo menos um lócus genômico.
[0034] Um "InDel" ou "marcador InDel" como definido aqui é considerado significar pelo menos uma inserção de nucleotídeo e/ou pelo menos uma deleção de nucleotídeo no lócus genômico dentro do genoma de um organismo. A pelo menos uma inserção de nucleotídeo é também referida aqui como um "marcador de inserção" e a pelo menos uma deleção de nucleotídeo é também referida aqui como um "marcador de deleção".
[0035] Um "InDel" no contexto da presente invenção refere-se a uma inserção e/ou deleção de pelo menos um nucleotídeo na sequência de nucleotídeo de um lócus genômico predeterminado, desse modo alterando o comprimento da sequência de nucleotídeo do lócus genômico por pelo menos um nucleotídeo. Um "InDel" no contexto da presente invenção, portanto, refere-se à incorporação de pelo menos um nucleotídeo adicional em uma sequência de nucleotídeo endógena ou à remoção de pelo menos um nucleotídeo uma sequência de nucleotídeo endógena. Ao contrário de InDel, um
"polimorfismo de único nucleotídeo" (SNP) significa uma variação de sequência que ocorre quando um único nucleotídeo (A, C, T ou G) na sequência genômica é alterado. Um SNP é uma substituição ou reposição de um único nucleotídeo dentro de uma determinada sequência de nucleotídeo, que deixa o comprimento da sequência de nucleotídeo inalterado.
[0036] Em uma modalidade preferida da invenção, o pelo menos um InDel compreende mais do que uma inserção de nucleotídeo e/ou mais do que uma deleção de nucleotídeo. O pelo menos um InDel pode compreender uma inserção dentre 1 e 60 pares de base de uma sequência que é não homóloga ao genoma do organism, no qual o pelo menos um InDel deve ser introduzido. Opcionalmente, o InDel pode compreender uma inserção de mais do que 60 pares de base de uma sequência que é não homóloga ao genoma do organismo no qual o pelo menos um InDel deve ser introduzido. A inserção pode opcionalmente compreender ou consistir em 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 ou 60 de uma sequência que é não homóloga ao genoma do organism, no qual o referido pelo menos um InDel é introduzido. Preferivelmente, a inserção compreende ou consiste em uma sequência de nucleotídeo de pelo menos 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de base de uma sequência que é não homóloga ao genoma do organismo, no qual o referido pelo menos um InDel é introduzido. O termo "não homólogo" neste contexto significa que a inserção é única e não compartilha homologia com uma sequência de ácido nucleico no gemona do organismo que pode resultar potencialmente na incorporação da inserção emu ma localização genômica indesejada devido ao reparo direcionado por homologia. O termo "não homólogo"
no presente contexto também significa que a inserção quando introduzida no lócus genômico resulta em um alelo marcador artificial que é único no gemona do organismo em questão.
[0037] No contexto do método de preparação de um alelo marcador artificial, a inserção e sua região de flanqueamento no lócus genômico predeterminado precisam ser avaliadas e selecionadas para o projeto de ensaio ideal, o que significa que devem ser únicos e não repetitivos no genoma de um determinado organismo. Além disso, a inserção e sua região de flanqueamento deve apresentar uma ou mais das seguintes características: aproximadamente 50% de teor de GC, distribuição equilibrada entre as bases G/C e A/T, chance reduzida de estruturas secundárias. A inserção de pelo menos um nucleotídeo na região de flanqueamento de um lócus genômico predeterminado deve resultar em um alelo marcador de inserção que é monomórfico, isto é, único, em diferentes genótipos do organismo. Esta análise é realizada através de análise iterativa e repetitiva de curtas sequências usando métodos de sequenciamento e ferramentas de bioinformática padrão. Além disso, a região de flanqueamento deve ser monomórfica no pool gênico do organismo significando que ela é altamente conservada entre diferentes genótipos do organismo.
[0038] Em uma outra modalidade da presente invenção, o pelo menos um InDel pode adicional ou alternativamente compreender ou consistir na deleção dentre 1 e 60 pares de base de uma sequência no lócus genômico no gemona do organismo. Opcionalmente, a deleção é de mais do que 60 pares de base de uma sequência no lócus genômico no gemona do organismo. A deleção pode ser de pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 ou 60 pares de base. Preferivelmente, a deleção compreende ou consiste em uma sequência de nucleotídeo de pelo menos 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de base.
[0039] A deleção selecionada é aquela que não resulta em uma perda de função no gene ou região genômica. Por exemplo, o marcador de deleção está preferivelmente localizado fora de um gene associado com o traço desejado de interesse e/ou está localizado em uma região não codificante, a fim de evitar qualquer perda de função. Alguém versado na técnica facilmente apreciaria quais regiões genômicas evitar ao projetar um marcador de deleção adequado.
[0040] Além disso, a deleção e sua região de flanqueamento no lócus genômico predeterminado necessitam ser selecionadas para projeto de ensaio ideal, significando que elas devem ser únicas e não repetitivas no genoma de um determinado organismo e exibem uma ou mais das seguintes características: aproximadamente 50% de teor de GC, distribuição equilibrada entre bases G/C e A/T, chance reduzida de estruturas secundárias de DNA. A deleção de pelo menos um nucleotídeo na região de flanqueamento no lócus genômico predeterminado deve resultar em um alelo marcador de deleção que é monomórfixo em diferentes genótipos do organismo. Esta análise é realizada através de análise iterativa e repetitiva de curtas sequências usando ferramentas de bioinformática padrão.
[0041] A "distribuição equilibrada entre as bases G/C e A/T" refere- se a um teor de 40% a 55% de GC e respectivos A/T, isto é, 60% a 45% dependendo do teor de Gc real. A distribuição pode ser de 40% de G/C e 60% de A/T, 41% de G/C e 59% de A/T, 42% de G/C e 58% de A/T, 43% de G/C e 57% de A/T, 44% de G/C e 56% de A/T, 45% de G/C e 55% de A/T, 46% de G/C e 54% de A/T, 47% de G/C e 53% de A/T, 48% de G/C e 52% de A/T, 49% de G/C e 51% de A/T, 50% de G/C e 50% de A/T, 51% de G/C e 49% de A/T, 52% de G/C e 48% de A/T, 53% de G/C e 47% de A/T, 54% de G/C e 46% de A/T, e/ou 55%
de G/C e 45% de A/T. A distribuição equilibrada entre as bases G/C e A/T realiza a criação de estruturas secundárias no DNA em ou adjacente ao lócus predeterminado, pelo que tais estruturas secundárias influenciam o anelamento de marcadores moleculares. Alguém versado na técnica é bem ciente desse fato e é capaz de prever computacionalmente a adequabilidade de uma determinada sequência para um projeto de ensaio ideal.
[0042] Além disso, a região de flanqueamento deve ser monomórfica, isto é, altamente conservado no pool gênico do organismo significando que ela é altamente conservada entre diferentes genótipos do organismo.
[0043] A inserção e/ou deleção de tamanho pode variar dependendo dos ensaios de marcador a serem desenvolvidos.
[0044] "Introdução" no significado da presente invenção inclui integração estável ou transitória por meio de transformação, incluindo transformação mediada por Agrobacterium, transfecção, microinjeção, bombardeio biolístico, inserção usando tecnologia de edição de genes como sistemas CRISPR (por exemplo, CRISPR/Cas, em particular CRISPR/Cas9 ou CRISPR/Cpf1), CRISPR/CasX ou CRISPR/CasY), TALENs, nucleases de dedo de zinco ou meganucleases, recombinação homóloga opcionalmente por meio de uma das tecnologias de edição de genes mencionadas abaixo, incluindo preferencialmente um modelo de reparo, modificação de um lócus genômico usando mutagênese aleatória ou direcionada como TILLING ou tecnologia de edição de genes mencionada, etc.
[0045] Preferivelmente, o pelo menos um InDel pode ser introduzido no lócus genômico usando quaisquer métodos de mutagênese adequados conhecidos para a introdução de inserção(ões) e/ou deleção(ões) de nucleotídeo.
[0046] Por exemplo, o pelo menos um InDel pode ser introduzido usando uma nuclease ou nickase programável. A nuclease ou nickase programável pode ser selecionada a partir de quaisquer ferramentas de edição de genes (GE) conhecidas, tais como nucleases direcionadas ao sítio (SDNs), incluindo sistema de nuclease CRISPR, incluindo um sistema CRISPR/Cas9, um sistema CRISPR/Cfp1, um CRISPR/CasX sistema, um sistema CRISPR/CasY, nucleases de dedo de zinco, TALENs, meganucleases e/ou qualquer combinação, variante ou fragmento cataliticamente ativo dos mesmos.
[0047] As nucleases direcionadas ao sítio (SDNs) ou nickases usam uma enzima de corte de DNA (nuclease) para a geração da quebra de DNA direcionada (ou direcionada ao sítio). Variantes de aplicações SDN são frequentemente categorizadas como SDN-1 (ausência de um modelo de reparo), SDN-2 (edição de gene usando modelo de reparo de DNA) e SDN-3 (introdução de inserções/deleções maiores usando modelo de reparo de DNA), dependendo do resultado do reparo de quebra de fita dupla de DNA ou do reparo de quebra de fita simples de DNA.
[0048] Qualquer nuclease programável ou nickase pode ser usada para a introdução de mutações pontuais, inserções ou deleções no genoma de um organismo. O especialista seria facilmente capaz de selecionar uma técnica adequada com base na sequência genômica e na eficiência desejada.
[0049] Por exemplo, as mutações pontuais podem ser geradas por uma abordagem SDN-1 clássica (isto é, junção de extremidade não homóloga (NHEJ) para inserir/deletar randomicamente uma ou mais bases para causar uma mutação pontual). Na posição onde a mutação pontual deve ser gerada (ou em estreita proximidade com ela), a fita dupla é clivada. A via de NHEJ então repara a quebra da fita dupla, gerando randomicamente a mutação pontual desejada. A seleção de uma mutação pontual particular seria difícil, pois um grande número de plantas precisaria ser rastreado, portanto, uma abordagem SDN-2 (como detalhado abaixo) é preferida para a introdução de mutações pontuais específicas em um sítio genômico predeterminado (isto é, direcionado à homologia reparo (HDR) com modelo de reparo).
[0050] Para a abordagem SDN-2, a fita dupla de DNA é clivada em uma localização genômica predeterminada (ou em estreita proximidade com ela) onde a mutação pontual deve ser introduzida. Ao adicionar um "modelo de reparo" com regiões flanqueadoras homólogas a montante e a jusante do sítio de clivagem, a mutação pontual desejada pode ser introduzida por HDR. Isso aumenta a probabilidade de obter a mutação desejada.
[0051] Em geral, as abordagens descritas para a geração de mutações pontuais também funcionam para a geração de deleções. Além das abordagens acima, é possível excluir uma sequência desejada gerando duas quebras de fita dupla a montante e a jusante da sequência a ser excluída. Na etapa de seleção, é importante garantir que ocorreu uma clivagem precisa.
[0052] As abordagens descritas para a geração de mutações pontuais também funcionam para a geração de inserções. A abordagem SDN-2 é preferida para a geração de inserções, embora a abordagem SDN-1 também possa ser útil em certas circunstâncias.
[0053] Um sistema de nuclease CRISPR neste contexto descreve um complexo molecular compreendendo pelo menos um RNA guia pequeno e individual em combinação com uma nuclease Cas ou outra nuclease CRISPR como uma nuclease Cpf1 (Zetsche et al. (2015); "Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system". Cell 163 (3): 759-771) que pode produzir uma quebra de fita dupla de DNA específica. Os termos "polipeptídeo CRISPR", "endonuclease CRISPR", "nuclease CRISPR", "proteína CRISPR", " efetor CRISPR " ou "enzima CRISPR" são usados alternadamente aqui e referem-se a qualquer sequência de aminoácidos de ocorrência natural ou artificial, ou a sequência de ácido nucleico que codifica o mesmo, agindo como DNA específico do sítio nuclease ou nickase, em que o ʺpolipeptídeo CRISPRʺ é derivado de um sistema CRISPR de qualquer organismo, que pode ser clonado e usado para engenharia de genoma direcionado. Os termos ʺnuclease CRISPRʺ ou ʺpolipeptídeo CRISPRʺ também compreendem mutantes ou fragmentos cataliticamente ativos ou fusões de uma sequência efetora CRISPR de ocorrência natural, ou as respectivas sequências que codificam a mesma. Uma ʺnuclease CRISPRʺ ou ʺpolipeptídeo CRISPRʺ pode, desse modo, por exemplo, também referir-se a uma nickase CRISPR ou mesmo uma variante deficiente em nuclease de um polipeptídeo CRISPR com função endonucleolítica em seu ambiente natural.
[0054] Os termos ʺRNA guiaʺ, ʺgRNAʺ, ʺsgRNA ou ʺsgRNAʺ são usados alternadamente aqui e referem-se a uma fusão sintética de um RNA CRISPR (crRNA) e um crRNA transativador (tracrRNA), ou o termo refere-se a uma única molécula de RNA consistindo apenas em um crRNA e/ou um tracrRNA, ou o termo refere-se a um gRNA compreendendo individualmente um crRNA ou uma porção tracrRNA. Uma fração tracr e crRNA, se presentes como exigido pelo respectivo polipeptídeo CRISPR, portanto, não necessariamente têm que estar presentes em uma molécula de RNA ligada covalentemente, porém também podem ser compreendidas por duas moléculas de RNA individuais, que podem se associar ou podem ser associadas por interação não covalente ou covalente para fornecer um gRNA de acordo com a presente invenção. No caso de endonucleases guiadas por RNA único como Cpf1 (veja, Zetsche et al., 2015, supra), por exemplo, um crRNA como uma sequência de ácido nucleico guia única pode ser suficiente para mediar o direcionamento de DNA.
[0055] O termo "nuclease de dedo de zinco", tal como usado aqui, refere-se a uma nuclease que compreende um domínio de clivagem de ácido nucleico conjugado a um domínio de ligação que compreende uma matriz de dedo de zinco. O domínio de clivagem pode ser o domínio de clivagem da endonuclease de restrição de tipo II Fokl. As nucleases de dedo de zinco podem ser projetadas para atingir virtualmente qualquer sequência desejada em uma determinada molécula de ácido nucleico para clivagem, e a possibilidade de projetar domínios de ligação de dedo de zinco para ligar sítios únicos no contexto de genomas complexos permite a clivagem direcionada de um único sítio genômico em células vivas. O direcionamento de uma quebra de fita dupla para um lócus genômico desejado pode ser usado para introduzir InDels na sequência de nucleotídeos de um lócus genômico desejado. Nucleases de dedo de zinco podem ser geradas para direcionar um sítio de interesse por métodos bem conhecidos pelos versados na técnica. Por exemplo, domínios de ligação de dedo de zinco com uma especificidade desejada podem ser projetados combinando motifs de dedo de zinco individuais de especificidade conhecida. A estrutura da proteína de dedo de zinco Zif268 ligada ao DNA informou muito do trabalho neste campo e o conceito de obtenção de dedos de zinco para cada um dos 64 tripletos de pares de bases possíveis e, em seguida, misturar e combinar estes dedos modulares de zinco para criar proteínas a especificidade da sequência desejada foi descrita (Pavletich NP, Pabo CO (1991); "Zinc finger-DNA Recognition: crystal structure of a Zif268-DNA complex at 2.1 A". Science 252 (5007): 809-17).
[0056] O termo "nucleases efetoras de TAL" (TALENs), tal como usado aqui, refere-se às nucleases específicas de sequência ou ácidos nucleicos que os codificam. Os efetores TAL são proteínas de bactérias patogênicas de plantas que são injetadas pelo patógeno na célula da planta, onde viajam para o núcleo e funcionam como fatores de transcrição para ativar genes vegetais específicos.
A sequência de aminoácidos primária de um efetor TAL dita a sequência de nucleotídeos à qual ele se liga.
Desse modo, os sítios alvo podem ser previstos para efetores TAL e os efetores de TAL também podem ser projetados e gerados com o propósito de ligação a sequências de nucleotídeos particulares.
A especificidade depende de um número variável efetor de repetições imperfeitas, tipicamente 34 aminoácidos (Schornack et al. (2006) J.
Plant Physiol. 163: 256). Os polimorfismos estão principalmente nas posições de repetição 12 e 13, que são referidas aqui como o resíduo de variável de repetição (RVD). Os RVDs dos efetores TAL correspondem aos nucleotídeos em seus sítios alvo de forma direta e linear, um RVD para um nucleotídeo, com alguma degenerescência e sem dependência aparente do contexto.
Esta descoberta representa um mecanismo valioso para o reconhecimento de proteína-DNA que permite a previsão do sítio alvo para um novo efetor TAL específico de alvo.
Os efetores TAL per se não compreendem um domínio de nuclease.
Nucleases efetoras de TAL ou TALENs representam a construção de fusão na qual as sequências de ácido nucleico que codificam o efetor TAL são fundidas a uma sequência que codifica uma nuclease ou uma porção de uma nuclease, tipicamente um domínio de clivagem não específico de uma endonuclease de restrição tipo II, como FokI (Kim et al., (1996) Proc.
Natl.
Acad.
Sei.
USA 93: 1156-1160). Outras endonucleases úteis que podem ser fundidas com o domínio efetor podem incluir, por exemplo, HhaI, HindIII, Nod, BbvCI, EcoRI, BglI e AlwI.
O fato de que algumas endonucleases (por exemplo, FokI) funcionam apenas como dímeros pode ser capitalizado para aumentar a especificidade do alvo do efetor TAL.
Por exemplo, em alguns casos, cada monômero FokI pode ser fundido a uma sequência efetora TAL que reconhece uma sequência alvo de DNA diferente, e apenas quando os dois sítios de reconhecimento estão em estreita proximidade, os monômeros inativos se unem para criar uma enzima funcional. Ao requerer a ligação do DNA para ativar a nuclease, uma enzima de restrição altamente específica do sítio pode ser criada.
[0057] Como usado aqui, o termo "meganuclease" refere-se a uma endonuclease que se liga ao DNA de fita dupla em uma sequência de reconhecimento que é maior do que 12 pares de bases. As meganucleases de ocorrência natural podem ser monoméricas (por exemplo, I-SceI) ou diméricas (por exemplo, I-CreI). O termo meganuclease, como usado aqui, pode ser usado para referir-se às meganucleases monoméricas, meganucleases diméricas ou aos monômeros que se associam para formar uma meganuclease dimérica. O termo "endonuclease de homing" é sinônimo do termo "meganuclease. Devido ao grande sítio de reconhecimento das meganucleases, este sítio geralmente ocorre apenas uma vez em qualquer genoma. As meganucleases podem, portanto, ser usadas para atingir níveis muito elevados de eficiências de direcionamento de genes em células e plantas de mamíferos (Rouet et al., MoI. Cell. Biol., 1994, 14, 8096-106; Choulika et al., MoI. Cell. Biol., 1995, 15, 1968- 73). Entre as meganucleases, a família LAGLIDADG de endonucleases de homing tornou-se uma ferramenta valiosa para o estudo de genomas e durante os últimos anos. O termo "LAGLIDADG meganuclease" refere-se à meganucleases incluindo um único motif LAGLIDADG, que são naturalmente diméricos, ou a meganucleases incluindo dois motifs LAGLIDADG, que são naturalmente monoméricos.
[0058] Por exemplo, o pelo menos um InDel também pode ser introduzido usando um editor de base programável, opcionalmente em combinação com uma nuclease programável. O "editor de base"
programável, tal como usado aqui, refere-se a uma proteína ou um fragmento da mesma com a mesma atividade catalítica que a proteína da qual é derivada, cuja proteína ou fragmento da mesma, sozinha ou quando fornecida como complexo molecular, referido como complexo de edição de base aqui, tem a capacidade de mediar uma modificação de base direcionada, isto é, a conversão de uma base de interesse resultando em uma mutação pontual de interesse.
Preferivelmente, o pelo menos um editor de base, no contexto da presente invenção, está temporária ou permanentemente ligado a pelo menos um efetor programável específico de sítio ou opcionalmente a um componente de pelo menos um complexo efetor programável específico de sítio.
A ligação pode ser covalente e/ou não covalente.
Múltiplas publicações têm mostrado a conversão de base direcionada, principalmente citidina (C) em timina (T), usando uma CRISPR/Cas9 nickase ou nuclease não funcional ligada a um domínio de citidina desaminase, polipeptídeo catalítico de edição de mRNA de Apolipoproteína B (APOBEC1), por exemplo, APOBEC derivado de rato.
A desaminação da citosina (C) é catalisada pelas citidina desaminases e resulta em uracila (U), que tem as propriedades de pareamento de bases da timina (T). A maioria das citidina desaminases conhecidas opera em RNA, e os poucos exemplos que são conhecidos por aceitar DNA requerem DNA de fita simples (ss). Estudos sobre o complexo dCas9-DNA alvo revelam que pelo menos nove nucleotídeos (nt) da fita de DNA deslocada são desemparelhados após a formação do complexo Cas9-guia RNA-DNA 'R-loop' (Jore et al., Nat.
Struct.
Mol.
Biol., 18, 529-536 (2011)). De fato, na estrutura do complexo Cas9 R-loop, o primeiro 11 nt do protoespaçador na fita de DNA deslocada está desordenado, sugerindo que seu movimento não é altamente restrito.
Também foi especulado que as mutações induzidas por cas9 nickase em citosinas na fita não padrão podem surgir de sua acessibilidade por enzimas celulares citosina desaminase. Foi argumentado que um subconjunto deste trecho de ssDNA no R-loop pode servir como um substrato eficiente para uma citidina desaminase ligada a dCas9 para efetuar a conversão programável direta de C em U no DNA (Komor et al., Supra). Recentemente, Goudelli et al. ((2017). Programmable base editing of A• T to G• C in genomic DNA without DNA cleavage. Nature, 551(7681), 464.) descreveram os editores de base de adenina (ABEs) que mediam a conversão de A • T em G • C no DNA genômico.
[0059] Qualquer complexo de edição de base de acordo com a presente invenção pode, portanto, compreender pelo menos uma citidina desaminase, ou um fragmento cataliticamente ativo da mesma. O pelo menos um complexo de edição de base pode compreender a citidina desaminase, ou um domínio da mesma na forma de um fragmento cataliticamente ativo, como editor de base.
[0060] Em uma modalidade da presente invenção, uma planta doadora compreendendo uma característica desejada pode ser modificada, por exemplo, usando uma nuclease programável para introduzir um InDel em um lócus genômico adequado, como descrito aqui, para gerar um alelo marcador InDel artificial. No caso em que o alelo do marcador InDel artificial compreende uma deleção, iniciadores específicos para a sequência deletada são projetados. Uma pessoa versada na técnica será facilmente capaz de projetar iniciadores adequados.
[0061] Um "iniciador", tal como usado aqui, refere-se a um oligonucleotídeo (sintético ou de ocorrência natural), que é capaz de agir como um ponto de iniciação da síntese de ácido nucleico ou replicação ao longo de uma fita complementar quando colocado sob condições em que a síntese de uma fita complementar é catalisada por uma polimerase. Normalmente, os iniciadores têm cerca de 10 a 30 nucleotídeos de comprimento, porém podem ser mais longos ou mais curtos. Os iniciadores podem ser fornecidos na forma de fita dupla, embora a forma de fita simples seja mais comumente usada. Um iniciador pode conter ainda um marcador detectável, por exemplo, um marcador de extremidade 5'.
[0062] Depois de cruzar a planta doadora com uma planta do tipo selvagem, as amostras de progênie são analisadas quanto à presença ou ausência do alelo do marcador de deleção, por exemplo, por (q) PCR ou outras técnicas adequadas. Planta/organismo do "tipo selvagem", como definido aqui, significa uma planta não modificada da mesma espécie ou variedade que a planta doadora na qual o pelo menos um InDel foi introduzido.
[0063] Os sinais obtidos para os iniciadores específicos para a sequência deletada indicam que a progênie vegetal possui o genótipo do tipo selvagem, sem o traço doador de interesse ou pelo menos que o traço de interesse não foi herdado de forma homozigótica pela planta descendente. Por outro lado, nenhum sinal para os iniciadores 1+2 (veja, Figura 1A) poderia sugerir a multiplicação homogênea do traço do doador. No entanto, permanece incerto se nenhum sinal é definitivamente devido à ausência da característica do doador ou se outros fatores são responsáveis (por exemplo, anelamento de iniciador insuficiente, etc.). A fim de aumentar a especificidade do iniciador, a deleção tem, preferivelmente, pelo menos aproximadamente 10 pb de comprimento, preferivelmente aproximadamente 20 pb de comprimento.
[0064] Quando o alelo do marcador InDel artificial compreende uma combinação de inserções e deleções, as inserções e deleções ligadas ao traço desejado podem ser inseridas usando uma nuclease programável, como definido aqui, em um lócus genômico predeterminado dentro de uma região de flanqueamento do ácido nucleico de interesse, que preferencialmente codifica um polipeptídeo que confere uma característica de interesse. Iniciadores específicos para a inserção (veja, iniciadores 3+4 na ilustração abaixo) podem ser usados para a detecção da característica do doador. Visto que a inserção está ausente no tipo selvagem, um sinal positivo indica de forma confiável a presença do traço doador na progênie vegetal, tornando a avaliação da presença ou ausência de um traço desejado altamente específica e mais precisa. Além disso, os iniciadores específicos para o marcador de deleção podem ser usados para a identificação de plantas descendentes que contêm o traço desejado (nenhum sinal para os iniciadores 1+2).
[0065] A combinação de uma inserção com uma deleção é, portanto, mais confiável para determinar a presença ou ausência de um traço desejado, visto que a presença/ausência é determinada por um sinal de PCR positivo. Esta abordagem permite avaliar se um traço desejado está presente no genoma de amostras de progênie obtidas a partir do cruzamento de uma planta doadora e uma planta selvagem e se o traço doador foi multiplicado de maneira homozigótica ou heterozigótica.
[0066] De acordo com uma modalidade preferida, o método da invenção compreende, portanto, a introdução de um InDel que compreende uma inserção e uma deleção. A inserção e/ou deleção é preferivelmente de pelo menos 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de bases.
[0067] Como ilustrado na Figura 1B, em tal modalidade preferida, os iniciadores 1+2 podem estar localizados completamente na região de deleção, de modo que apenas o genótipo de tipo selvagem seja detectado. Mesmo se um dos iniciadores estiver localizado fora da deleção (ou ambos os iniciadores parcialmente), o sistema de marcadores permanece específico, visto que os produtos de PCR serão obtidos apenas para o genótipo do tipo selvagem. A especificidade do sistema de marcadores é desse modo assegurada, desde que a maioria do(s) iniciador(es) (por exemplo, 10 pb) esteja localizada na região de deleção.
[0068] Além dos iniciadores 1+2 específicos para a deleção, podem ser usados iniciadores adicionais que são específicos para a inserção. Por exemplo, os iniciadores 3+4 podem estar localizados completamente na região da inserção, de modo que apenas o genótipo doador seja detectado. Mesmo que um dos iniciadores esteja localizado fora da inserção (ou ambos os iniciadores parcialmente), o sistema de marcadores permanece específico, visto que os produtos de PCR só serão obtidos para o genótipo do doador desde que pelo menos um iniciador esteja localizado na região de inserção.
[0069] A combinação de uma inserção e uma deleção nos métodos da invenção descritos aqui e o uso de iniciadores específicos para os InDels inseridos fornecem, desse modo, uma estratégia confiável para determinar a presença ou ausência de um traço desejado, visto que a presença/ausência é determinada por um sinal de PCR positivo que reduz significativamente a chance de "falso positivo" ou "falso negativo".
[0070] Em uma outra modalidade dos métodos da invenção descritos aqui, o pelo menos um InDel pode ser vantajosamente introduzido no lócus genômico no genoma de uma planta doadora (compreendendo o ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere o traço de interesse) no início do processo de reprodução, isto é, antes que o doador seja cruzado com uma linhagem de elite desejada. Uma "linhagem de elite" significa qualquer linhagem que resultou da reprodução e seleção para desempenho agronômico superior. Numerosas linhagens de elite estão disponíveis e são conhecidas das pessoas versadas na técnica.
[0071] A abordagem acima mencionada garante que todas as linhagens de elite que são cruzadas com o doador possam ser facilmente rastreadas para o alelo do marcador InDel. Ao projetar um ensaio de análise com base no alelo do marcador InDel gerado no fundo genômico de um determinado doador, é possível usar um sistema de análise estabelecido para diferentes linhagens de elite para avaliar se o traço desejado foi herdado por tal linhagem editada. Esta abordagem evita o desenvolvimento trabalhoso e demorado de ensaios de marcadores projetados para o fundo genético de uma determinada linhagem de elite na qual o alelo do marcador InDel foi inserido cruzando a linhagem de elite com a linhagem do doador. Com o método descrito acima é, portanto, possível avaliar se diferentes linhagens de elite contêm o traço desejado do doador, aplicando um método de análise estabelecido que foi projetado para o fundo genômico do doador de traço. Além disso, os efeitos colaterais (por exemplo, efeitos pleiotrópicos) no fenótipo devido à edição do genoma podem ser testados em paralelo.
[0072] Além disso, se os alelos do marcador InDel já forem usados em um processo de reprodução, um ou vários doadores de elite podem ser editados para gerar uma segunda geração de doador adequada para o conceito de reprodução assistida por marcador e controle de qualidade (veja, Figura 1C).
[0073] A Figura 2 ilustra o processo de reprodução mencionado acima. Um doador homozigoto compreendendo um traço desejado (asterisco) está ligado a um alelo marcador InDel artificial (preenchido em cinza). O polimorfismo InDel foi introduzido em um lócus genômico de uma região de flanqueamento adequada de um ácido nucleico de interesse associado a um traço desejado (preenchido em preto) por meio de uma nuclease programável. Em um processo de reprodução comum, o doador homozigoto é cruzado com várias linhagens de elite para obter (após retrocruzamento/autofecundação e seleção)
linhagens de elite homozigotas compreendendo o ácido nucleico de interesse associado ao traço desejado. Devido ao desenvolvimento de um alelo do marcador InDel específico para o fundo genômico da linhagem do doador, as linhagens de elite podem ser analisadas quanto ao alelo do marcador InDel associado com o traço desejado usando um único ensaio de análise projetado especificamente para a região de flanqueamento do InDel alelo marcador do genótipo do doador. Com base nesta abordagem, não há, portanto, necessidade de desenvolver ensaios de análise específicos para as diferentes regiões flanqueadoras genotípicas das diferentes linhagens de elite. A inserção de pelo menos um InDel em um lócus genômico geneticamente ligado ao traço do doador no início do processo de reprodução (processo de introgressão) na linhagem de elite, portanto, fornece um método para analisar diferentes linhagens de elite para a inserção de um traço desejado independentemente de seus respectivos fundos genômicos.
[0074] O termo "retrocruzamento", como referido aqui, é um processo no qual uma planta descendente é repetidamente cruzada de volta para um de seus progenitores. O "doador" compreende a sequência de ácido nucleico de interesse associada ao traço desejado ligado ao alelo do marcador InDel e que deve ser introgredido na linhagem receptora. O "receptor" pode ser uma linhagem de elite ou qualquer outra planta na qual o ácido nucleico de interesse será introgressado. "Introgressão", como definido aqui, refere-se à transmissão de um alelo desejado de um lócus genético de um fundo genético para outro. O cruzamento inicial dá origem à geração F1. Como mostrado na Figura 2, um retrocruzamento é realizado repetidamente ao longo de várias gerações (com um indivíduo progênie de cada geração sucessiva de retrocruzamento sendo ele próprio retrocruzado com o mesmo genótipo parental) até que uma linhagem de elite homozigótica compreendendo o traço de interesse ligada ao alelo marcador InDel seja obtida.
[0075] Tal como usado aqui, "selecionar" ou "seleção" no contexto da seleção ou reprodução assistida por marcador refere-se ao ato de escolher ou selecionar os indivíduos desejados, normalmente de uma população, com base em certos critérios predeterminados. As técnicas de seleção adequadas são comumente conhecidas e são uma parte da rotina de uma configuração experimental para qualquer pessoa versada na área de reprodução de plantas.
[0076] A introdução do InDel no lócus genômico resulta na reprodução de um alelo marcador artificial que é herdado pelas gerações subsequentes do organismo junto com o ácido nucleico de interesse. O alelo do marcador artificial (o InDel, uma vez introduzido na região genômica) pode ser detectável e distinguível com base em seu comprimento e/ou sequência de polinucleotídeo.
[0077] O alelo marcador artificial pode, portanto, ser detectado usando qualquer método disponível para a detecção de polimorfismos em amostras de DNA genômico, tais ferramentas e métodos de detecção são referidos aqui como "marcadores moleculares". A amostra de DNA genômico pode ser DNA genômico isolado diretamente de uma planta, DNA genômico clonado ou DNA genômico amplificado.
[0078] Métodos baseados em PCR são preferidos para a detecção do alelo marcador artificial, no entanto, qualquer uma das várias técnicas de hibridização com sondas específicas, incluindo Southern blotting, hibridização in situ e hibridização genômica comparativa podem ser alternativamente usadas. Além disso, a digestão do DNA e a eletroforese capilar de alta solução podem ser usadas para detectar alelos marcadores artificiais. Outros métodos de detecção adequados incluem microarranjos, métodos baseados em espectrometria de massa e/ou métodos de sequenciamento de ácido nucleico.
[0079] Em uma modalidade preferida da invenção, o marcador molecular é definido como um par de iniciadores específicos para o alelo marcador artificial, isto é, o lócus genômico predeterminado compreendendo pelo menos um InDel, ou o lócus genômico do tipo selvagem. Os iniciadores têm, preferivelmente, pelo menos 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de bases de comprimento.
[0080] Os ensaios de marcadores para genes-alvo também estão principalmente disponíveis. No entanto, estes ensaios nem sempre são totalmente diagnósticos/exclusivos. O alelo marcador totalmente diagnóstico é, em todos os casos, o polimorfismo funcional. No entanto, devido às características das regiões flanqueadoras do ácido nucleico/traço de interesse, nem sempre é possível projetar ensaios de marcador adequados para seleção assistida por marcador. Além disso, no caso de um alelo marcador SNP funcional, não é possível desenvolver ensaios altamente sensíveis que seriam adequados para ensaios de controle de qualidade confiáveis para novos traços no processo de reprodução. Um alelo marcador InDel, como o descrito aqui, pode ser aplicado na seleção assistida por marcador do traço alvo e seria aplicável em ensaios de controle de qualidade altamente sensíveis. Por exemplo, os alelos marcadores inventivos podem ser usados para garantir a pureza das multiplicações de sementes em relação ao respectivo traço alvo e para evitar contaminações de sementes contendo um traço indesejado ou que não possuem o traço de interesse desejado. Embora, ensaios sensíveis possam, em princípio, ser desenvolvidos com base em polimorfismos de SNP, a sensibilidade da detecção de SNP é tecnicamente limitada e significativamente mais baixa em comparação com os alelos do marcador InDel artificial descrito aquis, visto que a detecção do polimorfismo é baseada em apenas um único par de base incompatível, que pode facilmente resultar na detecção de falsos positivos ou falsos negativos. No caso dos polimorfismos InDel descritos aqui, é possível detectar um alelo (indesejado) entre vários milhares de amostras, enquanto um polimorfismo SNP permitiria a detecção de um alelo (indesejado) apenas dentro de algumas dezenas de amostras.
[0081] De acordo com um segundo aspecto da presente invenção, é fornecido um método para determinar a presença de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, em uma população mista de indivíduos compreendendo o ácido nucleico de interesse e indivíduos não compreendendo o ácido nucleico de interesse, o referido método compreendendo a detecção de um alelo marcador artificial como definido no primeiro aspecto da invenção usando pelo menos um marcador molecular específico para o alelo marcador artificial e/ou pelo menos um marcador molecular específico para o lócus genômico do tipo selvagem.
[0082] O pelo menos um marcador molecular é como definido aqui no primeiro aspecto da invenção e é preferivelmente um par de iniciadores em hibridação com o lócus genômico do tipo selvagem ou o alelo marcador artificial. Preferivelmente, os iniciadores permitem a detecção do alelo marcador artificial compreendendo um marcador de inserção e deleção. Os iniciadores podem ser específicos para as sequências inseridas ou deletadas no lócus genômico. Os iniciadores têm, preferivelmente, pelo menos 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de bases de comprimento.
[0083] Uma "população" de plantas significa um conjunto compreendendo qualquer número de indivíduos físicos ou amostras ou dados retirados dos mesmos para avaliação.
[0084] De acordo com um terceiro aspecto da presente invenção,
é fornecido um método para avaliar a homogeneidade de uma população de indivíduos compreendendo um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, o referido método compreendendo a detecção de um alelo marcador artificial como definido no primeiro aspecto da invenção e determinação da homogeneidade na população usando pelo menos um marcador molecular específico para o alelo marcador artificial e/ou pelo menos um marcador molecular específico para o lócus genômico de tipo selvagem, em que a detecção do lócus genômico do tipo selvagem indica a distribuição heterogênea de indivíduos que compreendem o ácido nucleico de interesse na população.
[0085] Preferivelmente, o pelo menos um marcador molecular é um par de iniciadores que se emparelham com o lócus genômico do tipo selvagem ou com o alelo marcador artificial. Preferivelmente, os iniciadores permitem a detecção do alelo marcador artificial compreendendo um marcador de inserção e deleção. Os iniciadores podem ser específicos para as sequências inseridas ou deletadas no lócus genômico. Os iniciadores têm, preferivelmente, pelo menos 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de bases de comprimento.
[0086] De acordo com um quarto aspecto da presente invenção, é fornecido um método para introgressão de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse a uma população de indivíduos compreendendo as etapas de: (i) preparar um alelo marcador artificial de acordo com o primeiro aspecto da invenção em um organismo doador que compreende o ácido nucleico de interesse; (ii) cruzar o referido organismo doador com um organismo receptor da mesma espécie que não compreende o ácido nucleico de interesse para gerar progênie de composição genética heterogênea; (iii) retrocruzar/autofecundar e selecionar quanto à presença do alelo marcador artificial para obter a progênie da composição genética homozigótica que compreende o ácido nucleico de interesse no fundo do organismo receptor, (iv) opcionalmente, repetir a etapa (iii) pelo menos uma vez, preferivelmente várias vezes.
[0087] A etapa (iii) do método é baseada na detecção usando pelo menos um marcador molecular específico para a detecção da presença do alelo marcador artificial na progênie e/ou pelo menos um marcador molecular específico para a detecção da ausência do alelo marcador artificial na progênie. Preferivelmente, o pelo menos um marcador molecular é um par de iniciadores que se emparelham com o lócus genômico do tipo selvagem ou com o alelo marcador artificial. Preferivelmente, os iniciadores permitem a detecção do alelo marcador artificial compreendendo um marcador de inserção e deleção. Os iniciadores podem ser específicos para as sequências inseridas ou deletadas no lócus genômico. Os iniciadores têm, preferivelmente, pelo menos 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 pares de bases de comprimento.
[0088] O organismo receptor pode ser uma linhagem de elite, um organismo de tipo selvagem ou um organismo transgênico. Os termos "tipo selvagem" e "elite" são como definidos aqui. O termo "transgênico" refere-se aos organismos para os quais um gene ou material genético foi transferido (normalmente por qualquer uma de várias técnicas de engenharia genética) de um organismo para outro ou do mesmo organismo, porém onde o material genético não está em seu lócus natural no genoma.
[0089] De acordo com um quinto aspecto da presente invenção, é fornecido um método para fazer um alelo marcador artificial específico para um ácido nucleico de interesse que compreende projetar um ou mais InDels específicos do genótipo e introduzir os referidos InDels em um lócus genômico no genoma do organismo, em que o lócus genômico está ligado ao ácido nucleico de interesse. O organismo pode compreender pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais InDels separados, que criam uma espécie de impressão digital para propósitos de detecção e rastreamento.
[0090] É também fornecido um alelo marcador artificial compreendendo pelo menos um InDel específico do genótipo que pode ser obtido pelo método acima mencionado.
[0091] De acordo com um sexto aspecto da presente invenção, é fornecido o uso de um alelo marcador artificial de acordo com o quinto aspecto ou o uso de um alelo marcador artificial obtido por um método de acordo com o primeiro aspecto da presente invenção em reprodução assistida por marcador.
[0092] Um outro aspecto da invenção refere-se ao uso do alelo marcador InDel em combinação com a modificação de um gene endógeno de interesse. A modificação de um gene de interesse pode ser obtida por abordagens de edição de genes comumente conhecidas (por exemplo, nucleases direcionadas ao sítio, incluindo sistemas de nuclease CRISPR, nucleases de dedo de zinco, TALENs, meganucleases e similares) para gerar um "traço artificial" de interesse. O uso combinado de modificação genética com base em GE e os alelos marcadores artificiais InDel descritos aqui permitem facilmente a detecção direta e confiável de plantas modificadas regeneradas (a partir do material vegetal editado por gene) ou progênies modificadas das mesmas.
[0093] A referência aqui a um gene "endógeno" não se refere apenas ao gene em questão como encontrado em uma planta em sua forma natural (isto é, sem haver qualquer intervenção humana), porém também se refere a este mesmo gene (ou um ácido nucleico substancialmente homólogo/gene) em uma forma isolada subsequentemente (re)introduzida em uma planta (um transgene). Por exemplo, uma planta transgênica contendo tal transgene pode encontrar um aumento ou redução substancial da expressão do transgene e/ou aumento ou redução substancial da expressão do gene endógeno. O gene isolado pode ser isolado de um organismo ou pode ser feito pelo homem, por exemplo, por síntese química.
[0094] É também fornecido aqui o uso de uma nuclease programável para a geração de um alelo marcador artificial para a identificação de um ácido nucleico de interesse no genoma de um organismo. A nuclease programável pode ser selecionada a partir de sistemas de nuclease CRISPR, nucleases de dedo de zinco, TALENs ou meganucleases, como descrito aqui.
[0095] De acordo com um sétimo aspecto da presente invenção, é fornecida uma planta ou semente compreendendo um alelo marcador artificial obtenível por um método de acordo com o primeiro aspecto ou compreendendo um alelo marcador artificial de acordo com o quinto aspecto da presente invenção. A planta pode ser qualquer planta e pode ser, por exemplo, uma planta selecionada de Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, e Allium tuberosum.
[0096] Ao longo da descrição e das reivindicações deste relatório descritivo, as palavras "compreende" e "contém" e variações das palavras, por exemplo "compreendendo" e "compreende", significam "incluindo, porém não limitado a", e não excluem outros componentes, números inteiros ou etapas. Além disso, o singular abrange o plural, a menos que o contexto requeira de outra forma: em particular, onde o artigo indefinido é usado, o relatório descritivo deve ser entendido como contemplando a pluralidade, bem como a singularidade, a menos que o contexto requeira de outro modo.
[0097] O termo "cerca de" ou "aproximadamente", como usado aqui, quando refere-se a um valor mensurável, tal como um parâmetro, uma quantidade, uma duração temporal e similares, destina-se a abranger variações de +/- 20% ou menos, preferivelmente +/-10% ou menos, mais preferencialmente +/- 5% ou menos, e ainda mais preferencialmente +/- 1% ou menos de e a partir do valor especificado, na medida em que tais variações são apropriadas para realizar na invenção descrita. Deve ser entendido que o valor ao qual o modificador "cerca de" ou "aproximadamente" refere-se também é por si só específica e preferivelmente descrito.
[0098] Considerando que os termos "um ou mais" ou "pelo menos um", tal como um ou mais ou pelo menos um membro(s) de um grupo de membros, são claros per se, por meio de exemplificação adicional, o termo abrange, inter alia, uma referência a qualquer um dos referidos membros, ou a quaisquer dois ou mais dos referidos membros, como, por exemplo, qualquer ≥3, ≥4, ≥5, ≥6 ou ≥7 etc. dos referidos membros, e até todos os referidos membros.
[0099] As características preferidas de cada aspecto da invenção podem ser como descritas em conexão com qualquer um dos outros aspectos. Dentro do escopo deste pedido, pretende-se expressamente que os vários aspectos, modalidades, exemplos e alternativas estabelecidos nos parágrafos anteriores, nas reivindicações e/ou na seguinte descrição e desenhos, e em particular as características individuais dos mesmos, podem ser consideradas independentemente ou em qualquer combinação. Isto é, todas as modalidades e/ou características de qualquer modalidade podem ser combinadas de qualquer forma e/ou combinação, a menos que tais características sejam incompatíveis.
BREVE DESCRIÇÃO DOS DESENHOS
[00100] Uma ou mais modalidades da invenção serão agora descritas, por meio de exemplo apenas, com referência ao desenho acompanhante, no qual: A Figura 1A-C mostra uma representação esquemática de análises auxiliadas por marcadores e um ensaio de controle de qualidade, no qual a pureza de sementes multiplicadas com um traço desejado pode ser assegurada, usando a abordagem InDel da presente invenção. A Figura 2 mostra uma representação esquemática de um processo de reprodução, em que um InDel é introduzido no lócus genômico de uma planta doadora (compreendendo o ácido nucleico de interesse,
preferivelmente codificando um polipeptídeo que confere o traço de interesse) no início do processo de reprodução, isto é, antes que o doador seja cruzado com uma linhagem de elite desejada. A Figura 3 mostra a seleção assistida por marcador InDel de um gene que codifica uma oxidase do citocromo P450 mutado que confere esterilidade masculina. A Figura 4 mostra a seleção assistida por marcador InDel de um gene que codifica uma acetolactato sintase com mutação pontual que confere resistência a herbicida.
EXEMPLOS Exemplo 1: Alelo Marcador de Exclusão Introdução de uma exclusão por edição de genoma para seleção assistida por marcador
[00101] Este exemplo demonstra o uso de um marcador de deleção para a detecção de um traço desejado, que de outra forma seria difícil de identificar devido às características das regiões genômicas que flanqueiam o polimorfismo causador.
[00102] O mutante Beta vulgaris BvCYP703A2_gst como descrito em DE 10 2016 106 656.7 compreende uma deleção no gene que codifica para uma oxidase do citocromo P450 que confere ao mutante um fenótipo estéril masculino (tipo selvagem (WT) BvCYP703 = BvCYP703_WT (SEQ ID NO: 75). Este fenótipo pode ser usado, por exemplo, para melhorar os programas de reprodução e para a produção de sementes híbridas.
[00103] O mutante BvCYP703A2_gst (SEQ ID NO: 76) compreende uma grande deleção entre as posições 1560 e 2100 (veja, Figura 3). No entanto, devido às características das regiões genômicas que flanqueiam a deleção (isto é, altamente repetitivo e alto teor de AT), é difícil (se não impossível) projetar iniciadores e ensaios adequados que permitiriam a detecção direta do próprio polimorfismo causador.
Portanto, não seria possível rastrear plantas descendentes, que foram obtidas cruzando uma planta de tipo selvagem com o doador, para o genótipo desejado por detecção direta da deleção devido à falta de ensaios de detecção adequados.
[00104] Os inventores identificaram, portanto, uma região na região de flanqueamento do gene que codifica uma oxidase do citocromo P450 que é adequada para a seleção assistida por marcador InDel do genótipo desejado. A deleção de ocorrência natural que causa o traço (esterilidade masculina) está localizada entre as posições -200 e +333 do gene BvCYP703A2 (a numeração começa no sítio de iniciação da tradução). Visto que a deleção causa uma interrupção do gene, não há dúvida de que as características remanescentes do gene (por exemplo, éxons) não são funcionais e a manipulação adicional dentro dos éxons restantes não causa efeitos pleiotrópicos. Portanto, partes do éxon 1 remanescente, região abrangendo +334 a +500 foram escolhidas como sítio alvo para um alelo marcador InDel artificial. A distância máxima da posição de exclusão +334 até o final da região de interesse (+500) é de 166 bp correspondendo a uma distância genética de 0,00096 cM. A análise de explosão do fragmento de 166 bp não revelou acertos inespecíficos no genoma da beterraba açucareira. Uma análise de sequência adicional (repetitividade, conteúdo de GC, distribuição de base) levou à definição da região +434 a +443 como sítio alvo para uma deleção artificial, com um iniciador específico InDel definido entre as posições +420 a +449.
[00105] Uma deleção é inserida neste sítio alvo por meio de edição genômica, como descrito aqui (SEQ ID NO: 77). Os iniciadores adequados são projetados especificamente para a região de flanqueamento do marcador de deleção (veja, acima). Devido à sua forte ligação ao genótipo desejado, esta exclusão pode então ser usada para identificar plantas descendentes que conferem esterilidade masculina. Para detecção homo/heterogênea da deleção, devem ser realizadas duas reações de PCR.
[00106] Os possíveis iniciadores que podem ser usados para a detecção do doador e/ou cepa de tipo selvagem podem ser: BvCYP703A2_WT_fwd: 5’-TAGACGACTTGAACTATTTGTGAG-3’ (SEQ ID NO: 45) BvCYP703A2_gst_fwd: 5’-TAGACGACTTGAACTTCATAGGGC-3’ (SEQ ID NO: 46) BvCYP703A2_rev: 5’-AAAGTATTGCTTCCCTAGCAACA-3’ (SEQ ID NO: 47) Exemplo 2: Alelo Marcador de Inserção Introdução de uma inserção por edição de genoma para seleção assistida por marcador
[00107] Este exemplo demonstra que um traço desejado, que é difícil de detectar porque sua ligação causal é um polimorfismo de nucleotídeo único (SNP), pode ser identificada de forma confiável usando a abordagem de marcador InDel descrita aqui.
[00108] Neste exemplo, uma mutação de ponto único na posição +1706 no gene que codifica para a enzima acetolactato sintase confere resistência a herbicidas de sulfonilureia em uma planta Beta vulgaris (como descrito no WO 2012/049268; tipo selvagem (WT) BvALS = BvALS_WT (SEQ ID NO: 78; BvALS com mutação pontual = BvALS_SU_res (SEQ ID NO: 79)). Este polimorfismo de nucleotídeo único é difícil de detectar porque os iniciadores projetados especificamente para a análise de plantas com o traço de doador diferem em apenas um único nucleotídeo em comparação com o sequência do tipo selvagem, aumentando desse modo a probabilidade de falsos positivos e/ou falsos negativos, que limita a qualidade da análise.
[00109] Esta desvantagem pode ser superada pela introdução de um marcador InDel na região de flanqueamento do gene mutado que codifica para a acetolactato sintase (veja, Figura 4).
[00110] Os inventores identificaram uma região de flanqueamento morfogênica do gene mutado adequada para o projeto de um alelo marcador artificial. O SNP que causa o traço (resistência SU, W569L) está localizado na posição +1706 do gene BvALS (a numeração começa no sítio de iniciação da tradução). A região 3’UTR anotada do gene termina na posição +2252. Os inventores não conseguiram localizar um traço genômico começando da posição +2253 a +4000. A distância máxima da posição SNP +1706 até a extremidade da região de interesse (+4000) é 2294 bp correspondendo a uma distância genética de 0,00036 cM. A análise de explosão do fragmento de 2294 bp não revelou acertos inespecíficos no genoma da beterraba açucareira. A análise de sequência iterativa (explosão, alinhamentos) levou à seleção da região +2274 a +2445 adequada para colocação de InDel artificial. A análise de sequência adicional (repetidamente, conteúdo de GC, distribuição de base) levou à definição da região +2285 a +2293 como sítio alvo artificial, com um iniciador específico InDel definido entre as posições +2274 a +2303 (veja, Figura 4).
[00111] Neste sítio alvo pode ser inserida uma inserção de 9 pb de comprimento que não é homóloga e única para o conjunto genômico da linhagem do doador (SEQ ID NO: 80). Iniciadores adequados são projetados para as regiões de flanqueamento da inserção, como descrito aqui. Para detecção homo/heterogênea do marcador de inserção, são necessárias duas reações de PCR.
[00112] Com base nesta abordagem, é então possível rastrear plantas descendentes, obtidas a partir do cruzamento do doador com a planta do tipo selvagem, para a inserção da mutação desejada conferindo resistência ao herbicida sem a necessidade de confiar no próprio polimorfismo causador.
[00113] Os possíveis iniciadores que podem ser usados para a detecção do doador e/ou cepa de tipo selvagem podem ser: BvALS_WT_fwd: 5’-ACTAGTTGGCTTGGTGCATCT-3’ (SEQ ID NO: 48)
BvALS_SU_res_fwd: 5’-ACTAGTTGGCTGCACTATCGTGC-3’ (SEQ ID NO: 49) BvALS_rev: 5’-CCAATGCTCCCATGTCAGGT-3’ (SEQ ID NO: 50) Exemplo 3: Ensaio de controle de qualidade para garantir a pureza das multiplicações de sementes para um respectivo traço
[00114] Este exemplo ilustra como a pureza de sementes multiplicadas com um traço desejado pode ser assegurada usando a abordagem InDel descrita aqui.
[00115] Neste exemplo, a linhagem do doador compreendendo um traço desejado é modificada pela introdução de uma sequência de nucleotídeos (GCACTATCG) em seu genoma para gerar um alelo marcador de inserção artificial que está fortemente ligado ao traço desejado.
[00116] Após cruzar o doador que compreende o alelo marcador de inserção com uma planta de tipo selvagem, que não contém o alelo marcador artificial, plantas descendentes de F1 são obtidas, que são heterogêneas em sua composição genética. O retrocruzamento e a seleção subsequente resultam em plantas que contêm o traço de interesse dentro da base genética da planta do tipo selvagem. A fim de garantir a homogeneidade e pureza da multiplicação de sementes de plantas que compreendem o traço desejado, as amostras de sementes são analisadas usando pares de iniciadores específicos para o tipo selvagem (iniciadores 1+3) e/ou doador (iniciador 2+3). Análise das amostras de sementes, por exemplo, por (q)PCR então permite facilmente a avaliação do grau de pureza (veja, Figura 1C).
[00117] Com base neste ensaio de controle de qualidade, é possível avaliar com segurança se as amostras de sementes testadas são homozigóticas para o traço desejado ou se as sementes estão "contaminadas" com o gene/traço do tipo selvagem correspondente ao traço doador desejado. Tal controle de qualidade não seria possível, se o polimorfismo ligado ao traço desejado fosse um polimorfismo de nucleotídeo único, visto que uma incompatibilidade de um único nucleotídeo não oferece resolução e especificidade suficientes para garantir uma avaliação de qualidade confiável por (q) PCR. Exemplo 4: tecnologia baseada em GE para a geração de alelos de marcadores InDel artificiais que estão ligados a um traço desejado.
[00118] Este exemplo fornece uma descrição técnica sobre como (a) gerar um alelo marcador de deleção por meio de modificação genética com base em GE em um genoma de doador tendo uma grande deleção no gene que codifica uma oxidase do citocromo P450 causando esterilidade masculina (Exemplo 1), (b) gerar um alelo marcador de inserção por meio de modificação genética com base em GE em um genoma de doador tendo uma mutação pontual no gene que codifica para a enzima acetato de lactato sintase que confere resistência ao herbicida em uma planta Beta vulgaris (Exemplo 2), e (c) modificar um gene endógeno que codifica a enzima acetato lactato sintase através da introdução de uma mutação pontual específica (G→T) por meio de GE, conferindo, desse modo, resistência a herbicida em uma planta Beta vulgaris e gerando um alelo marcador de inserção ligado ao traço de interesse gerado artificialmente. Projeto e seleção de crRNA:
[00119] Os crRNAs adequados para indução induzida por Cpf1 de quebras de fita dupla foram projetados usando as ferramentas CRISPR RGEN (http://www.rgenome.net/cas-designer/ [Park J., Bae S., and Kim J.-S. Cas-Designer: A web-based tool for choice of CRISPR-Cas9 target sites. Bioinformatics 31, 4014-4016 (2015). E Bae S., Park J. and Kim J.-S. Cas-OFFinder: A fast and versatile algorithm that searches for potential off-target sites of Cas9 RNA- guided endonucleases. Bioinformatics 30, 1473-1475 (2014).).
Portanto, protoespaçadores adequados dentro da sequência de DNA genômico foram identificados e selecionados. Para garantir a funcionalidade da endonuclease Cpf1 da bactéria Lachnospiraceae ND2006 (Lb) (SEQ ID NO: 51), foram selecionados protoespaçadores com um comprimento de 24 nucleotídeos, em que sua sequência de ligação genômica na extremidade 5' foi flanqueada com um motif adjacente de protoespaçador estencial (PAM) tendo a sequência 5'- TTTV-3 '(V é G, C ou A). Os protoespaçadores adequados foram selecionados com base nos critérios de qualidade prescritos da ferramenta e analisados para potenciais fora de alvos com um genoma de referência interno de B. vulgaris.
[00120] Para outros experimentos foram selecionados crRNAs, que além da sequência alvo real tinham no máximo 15 bases idênticas com um PAM funcional. Visto que os primeiros 18 nucleotídeos do protoespaçador são estenciais para reconhecer e clivar a sequência alvo, foi possível evitar a clivagem indesejada dentro de outras sequências genômicas [Tang, X., LG Lowder, T. Zhang, AA Malzahn, X. Zheng, DF Voytas, Z. Zhong, Y. Chen, Q. Ren, Q. Li, ER Kirkland, Y. Zhang e Y. Qi (2017). "A CRISPR-Cpf1 system for efficient genome editing and transcriptional repression in plants." Nat Plants 3:17018.]. Com base nesta abordagem, os seguintes crRNAs potenciais específicos para várias posições foram identificados (veja, Tabela A). Tabela A: Sequências alvo selecionadas. As sequências PAM estão sublinhadas. Nome de crRNA Sequência genômica alvo com Ligação Função PAM flanqueando 5‘ em +/- (sublinhado) padrão crRNA_ALS_G/T TTTAggtatggttgtccaatgggaagat - Geração de ponto (SEQ ID NO: 1) de mutação G→T em ALS crRNA_ALS_In1 TTTCggctatggatgttgtgttgcatca - candidato 1 para
(SEQ ID NO: 2) geração de um marcador de inserção para MAS em ALS crRNA_ALS_In2 TTTCtacgtggttcggttgatcatatag + Candidato 2 para (SEQ ID NO: 3) a geração de uma inserção em MAS em ALS crRNA_CYP_Del TTTGtacgtggttcggttgatcatatag + Geração de um (SEQ ID NO: 4) marcador de deleção para MAS em CYP Clonagem de elementos genéticos:
[00121] Para a clonagem de cassetes de expressão de Cpf1 e crRNA, uma sequência de reconhecimento dificultadora da enzima de restrição BbsI foi removida do vetor alvo pZFNnptII pela introdução de uma mutação pontual (T→G). A mutagênese foi realizada com um kit de mutagênese comercialmente disponível de acordo com as instruções do fabricante usando dois iniciadores de mutagênese (veja, Tabela B). Tabela B: Iniciadores de mutagênese usados para a introdução da mutação pontual (G→T, sublinhado) para a remoção da sequência de reconhecimento BbsI Nome Sequência 5‘3‘ Iniciador de CAGTGCAGCCGTCGTCTGAAAACGACA (SEQ ID NO: 5) mutagênese 1 Iniciador de AACGTCAGAAGCCGACTGCACTATAG (SEQ ID NO: 6) mutagênese 2
[00122] Para a expressão do gene Lbcpf1 em B. vulgaris, um fragmento de DNA compreendendo uma sequência de DNA, códon otimizado para A. thaliana, foi sintetizado em que a sequência de DNA tinha uma sequência promotora de PcUbi flanqueando 5' de Petroselinum crispum e sequência terminadora 3A flanqueando 3' de
Pea sp. (SEQ ID NO: 52). Os sítios de clivagem de restrição dentro da sequência de codificação de Lbcpf1, que são relevantes para a clonagem, foram removidos pela introdução de mutações silenciosas (isto é, troca de nucleotídeos sem afetar a sequência de aminoácidos). A otimização de códons foi realizada com base no algoritmo GeneArt da ThermoScientific. Para permitir o transporte de cpf1 para o núcleo da célula, a sequência de codificação de cpf1 foi ligada a um sinal de localização nuclear (NLS) de SV40 na extremidade 5' e um NLS de Nucleoplasmina na extremidade 3'. Para a ligação com o vetor alvo binário pZFNnptII, o cassete de expressão foi flanqueado por dois sítios de clivagem de restrição HindIII. Para a clonagem do cassete de expressão de crRNA, um sítio de clivagem PstI adicional foi inserido entre o sítio de clivagem HindIII de flanco 5 'e a sequência do promotor PcUbi. A ligação de pZFNnptII_LbCpf1 foi feita seguindo um protocolo padrão. A inserção bem sucedida do cassete de expressão PcUbi::Cpf1::TPea (SEQ ID NO: 52) foi confirmada por meio de sequenciamento, em que os iniciadores usados foram projetados para se ligarem especificamente a uma região que abrange a região de flanqueamento do vetor, bem como partes do cassete de expressão (veja, Tabela C). Tabela C: Iniciadores usados para sequenciamento do cassete de expressão PcUbi::Cpf1::TPea integrado no vetor pZFNnptII Nome Sequência 5‘3‘ pSeq_LbCpf1_F1 AGCGCAACGCAATTAATGTG (SEQ ID NO: 7) pSeq_LbCpf1_R1 GATGAAGCTGAGGTAGTACC (SEQ ID NO:8) pSeq_LbCpf1_F2 AGGAAGGTTAGCAAGCTCGAG (SEQ ID NO: 9) pSeq_LbCpf1_R2 TCTCGTCGACCTTCTGGATG (SEQ ID NO: 10) pSeq_LbCpf1_F3 ATGCTGAGTACGATGACATCC (SEQ ID NO: 11) pSeq_LbCpf1_R3 TAGACCTGCTTCTCAACCTTCA (SEQ ID NO: 12) pSeq_LbCpf1_F4 ACCACTCACTCCTCGATAAG (SEQ ID NO: 13) pSeq_LbCpf1_R4 AACGACAATCTGATCGGGTAC (SEQ ID NO: 14)
[00123] Após a transcrição em uma célula de planta, os crRNAs deveriam ser clivados por duas ribozimas flanqueadoras. Portanto, os crRNAs precursores foram flanqueados pelas sequências de codificação de uma ribozima Hammerhead (SEQ ID NO: 53) e uma ribozima HDV (SEQ ID NO: 54) [Tang, X., LG Lowder, T. Zhang, AA Malzahn, X. Zheng, DF Voytas, Z. Zhong, Y. Chen, Q. Ren, Q. Li, ER Kirkland, Y. Zhang and Y. Qi (2017). "A CRISPR-Cpf1 system for efficient genome editing and transcriptional repression in plants." Nat Plants 3: 17018.]. Existem outras abordagens para a transcrição de crRNA, por exemplo, através de promotores PolII, clivagem de Cpf1 a partir de mRNA, outras ribozimas, etc. Para uma ligação contínua do protoespaçador único à sequência das repetições de crRNA, duas sequências de reconhecimento de BbsI foram integradas entre a repetição de crRNA e a ribozima de HDV, em que as saliências usadas para clonagem foram consequentemente ajustadas.
[00124] Para garantir uma força de expressão idêntica de cpf1 e crRNAs, o cassete de ribozima de crRNA foi flanqueado por uma sequência promotora PcUbi na extremidade 5' e uma sequência terminadora 3A na extremidade 3'. O cassete de expressão de crRNA foi flanqueado por dois sítios de clivagem PstI para a ligação posterior no vetor alvo pZFNnptII_Cpf1 (SEQ ID NO: 55). O cassete de expressão de crRNA (SEQ ID NO: 56) foi obtido comercialmente como um fragmento de DNA sintético. A ligação foi realizada seguindo um protocolo padrão. A inserção correta do cassete de expressão foi confirmada por múltiplos ciclos de sequenciamento. Os protoespaçadores foram solicitados como oligonucleotídeos complementares e anelados de acordo com protocolos padrão. Os fragmentos de DNA de 24 pb de comprimento gerados desta forma foram flanqueados por saliências de 4nt relevantes para a etapa de ligação (veja, Tabela D). Tabela D: Sequências de oligonucleotídeos usados para a geração de protoespaçador curto de 24 pb. As saliências de 4nt usadas para a ligação estão sublinhadas Nome crRNA Sequência 5‘3‘ crRNA_ALS_G/T AGATGGTATGGTTGTCCAATGGGAAGAT (SEQ ID NO: 15) GGCCATCTTCCCATTGGACAACCATACC (SEQ ID NO: 16) crRNA_ALS_In1 AGATGGCTATGGATGTTGTGTTGCATCA (SEQ ID NO: 17) GGCCTGATGCAACACAACATCCATAGCC (SEQ ID NO: 18) crRNA_ALS_In2 AGATTACGTGGTTCGGTTGATCATATAG (SEQ ID NO: 19) GGCCCTATATGATCAACCGAACCACGTA (SEQ ID NO: 20) crRNA_CYP_Del AGATTACGTGGTTCGGTTGATCATATAG (SEQ ID NO: 21) GGCCCTATATGATCAACCGAACCACGTA (SEQ ID NO: 22)
[00125] A eficiência dos 4 crRNAs foi testada por meio de transferência gênica induzida por Agrobacterium em folhas de B. vulgaris. O plasmídeo pZFNtDTnptII (SEQ ID NO: 57) foi cotransformado para verificar a eficiência da transformação. A transformação dos explantes de folhas foi feita por infiltração a vácuo seguindo um protocolo padrão. A fluorescência do tDT foi medida após seis dias por microscopia de fluorescência. Explantes com fluorescência heterogênea foram descartados. Os explantes das folhas foram congelados por choque em nitrogênio líquido dez dias após a infiltração, o DNA triturado e genômico foi isolado por meio do protocolo CTAB. A eficiência dos crRNAs únicos foi validada por meio de NGS (provedor de serviço externo) com base no número de edições inseridas (por exemplo, número de inserções, deleções ou trocas de nucleotídeos) em relação às sequências não editadas no DNA genômico.
[00126] Visto que todos os crRNAs testados mostraram atividade, crRNAs crRNA_ALS_G/T (SEQ ID NO: 58), crRNA_CYP_Del (SEQ ID NO: 59), crRNA_ALS_In1 (SEQ ID NO: 60) (mais eficiente) e crRNA_ALS_In2 (SEQ ID NO: 61), com a ribozima descrita acima, as sequências de promotor e terminador como cassetes de expressão de orientação reversa foram ordenadas como construções de DNA sintético (no total 4 construções; para cada crRNAs uma construção (SEQ ID NO: 62, 63, 64, 65)). As construções de DNA foram cada uma flanqueadas por dois sítios de clivagem de restrição PstI para clonagem no vetor alvo pZFNnptII_LbCpf1 (SEQ ID NO: 55). Após a inserção de crRNAs, os cassetes de expressão LbCpf1 e crRNA foram ligados por meio de HindIII a partir do vetor pZFNnptII_LbCpf1_crRNA (SEQ ID NO: 23, 71, 72, 73, 74) no vetor pUbitDTnptII (SEQ ID NO: 66, 67, 68, 69, 70). Geração e uso de modelos de reparo para reparo de HD Mutação de ALS G→T
[00127] A fim de gerar a mutação pontual G→T, o modelo de reparo foi projetado para compreender 1000 bp a montante e a jusante da mutação pontual. Todo o modelo de DNA foi ordenado como um fragmento de DNA sintético de 2001 bp (SEQ ID NO: 24) e usado diretamente para a transformação na estrutura do vetor do provedor. O plasmídeo modelo de reparo e o plasmídeo pUbitDTnptII_LbCpf1_crRNA (SEQ ID NO: 67) foram introduzidos na cultura de calos de B. vulgaris por meio de cobombardeio biolístico usando uma arma de gene de acordo com um protocolo de liberação otimizado. A eficiência de transformação foi validada com base na fluorescência tDT transitória por meio de microscopia de fluorescência um dia após a transformação. A cultura de calos foi cultivada em meio de indução de rebentos na ausência de pressão seletiva (isto é, sem canamicina). Os rebentos regenerados foram subsequentemente testados quanto à mutação direcionada ao sítio (em princípio, se a mutação pontual resultar no aumento da resistência de ALS, este aumento pode ser usado para a seleção do evento desejado). Portanto, o DNA genômico foi isolado por meio de CTAB. As mutações pontuais foram amplificadas por meio de dois PCRs e o uso dos iniciadores 5’ALS_G/T e ALS_G/T_Rv, bem como ALS_G/T_Fw e
3’ALS_G/T. Posteriormente, os produtos de PCR foram sequenciados em cada caso com ambos os iniciadores. Aqui, é importante que a ligação do primeiro iniciador ocorra dentro da região de homologia do modelo de reparo e a ligação do segundo iniciador fora das regiões de homologia flanqueadoras 5 'e 3' do modelo de reparo (veja, Tabela E). Tabela E: Iniciadores usados para a detecção de mutações pontuais Nome Sequência 5‘3‘ Tamanho Ligação de produto de PCR 5’ALS_G/T GTT TTG GAT GTA GAG GAT ATT 1138 bp 5‘ fora do CCT AGA modelo de (SEQ ID NO: 25) reparo ALS_G/T_Rv CAG GGA AGA TAT CAG CAG ATT Dentro do TG modelo de (SEQ ID NO: 26) reparo ALS_G/T_Fw CTA CAA TTA GGG TGG AAA ATC 1127 bp Dentro do TC modelo de (SEQ ID NO: 27) reparo 3’ALS_G/T CTC TAG TGG TCA CCT GGC ATC 3‘ fora do (SEQ ID NO: 28) modelo de reparo
[00128] Além da detecção da mutação pontual bem sucedida no genoma de B. vulgaris, a integração indesejada de DNA de plasmídeo também foi analisada. Portanto, o DNA genômico, para o qual a integração bem sucedida de uma mutação pontual no lócus desejado foi confirmada, foi analisado quanto à presença de DNA de plasmídeo por meio de PCR. As regiões de sequência dentro do cpf1, o cassete de ribozima crRNA e o tDT foram amplificados usando os iniciadores listados na Tabela F abaixo. Tabela F: Iniciadores usados para a detecção de sequências específicas de plasmídeo integradas estáveis no genoma de brotos de B. vulgaris Nome Sequência 5‘3‘ Tamanho Ligação de produto de PCR ACCACTCACTCCTCGATAAG 214 Cpf1 pSeq_LbCpf1_F4 (SEQ ID NO: 29)
TAGACCTGCTTCTCAACCTTCA pSeq_LbCpf1_R3 (SEQ ID NO: 30) pSeq_Ribozima_F TGCAGCGGATCCAAATTACTG 172 Cassete (SEQ ID NO: 31) de crRNA de pSeq_Ribozma_R CCTGGTCCCATTCGCCAT ribozima (SEQ ID NO: 32) pSeq_tDT_F TTACAAGAAGCTGTCCTTCC 400 tDT (SEQ ID NO: 33) pSeq_tDT_R GTACTGTTCCACGATGGTGT (SEQ ID NO: 34) Inserção de ALS 9bp:
[00129] Para a inserção de ALS 9bp, uma abordagem análoga foi usada como descrito para as mutações de ALS GT acima. A inserção de GCACTATCG 9pb foi flanqueada a montante e a jusante com uma sequência homóloga de 1000 pb (SEQ ID NO: 35). Tabela G: Iniciadores usados para a detecção da inserção Nome sequência 5‘3‘ Tamanho Ligação do produto de PCR 5’ALS_Inserção GTG CTG ATG TTA AAT 1148 +9 5‘ fora do modelo TGG CAT TGC bp de reparo (SEQ ID NO: 36) ALS_Inserção_Rv CTA GTG GCA GAC TAA Dentro do modelo GAA TTA TG de reparo (SEQ ID NO: 37) ALS_Inserção_Fw GAA TGC TCT TCC TGT 1165 + 9 Dentro do modelo ATT GCT TG bp de reparo (SEQ ID NO: 38) 3’ALS_Inserção CAG TTC AAC ACA AAA 3‘ fora do modelo GAA GTT GTC de reparo (SEQ ID NO: 39)
[00130] Inserção combinada da mutação pontual G→T e a inserção de 9 pb em ALS:
[00131] Em geral, um procedimento análogo é aplicado para ambas as abordagens descritas acima. Neste caso, no entanto, o modelo de reparo é apenas flanqueado por sequências homólogas de 250 pb a montante e a jusante, visto que as sequências de flanqueamento homólogo com 1000 pb a montante e a jusante dos respectivos modelos de reparo se sobrepõem. Nesta configuração, os plasmídeos para crRNA_ALS_G/T e crRNA_ALS_In1, bem como ambos os modelos de reparo, foram transformados usando cobombardeio biolístico. A detecção da mutação pontual e a inserção de 9 pb foi feita como descrito acima. Marcador de deleção CYP:
[00132] A exclusão também pode ser gerada e detectada usando uma das abordagens descritas acima. Para a geração de um marcador de exclusão, é importante que o modelo de reparo contenha a exclusão de 9 pb (ATTTGTGAG). Este é então também flanqueado sequências homólogas de 1000 pb a montante e a jusante do modelo de reparo e usado para a construção (SEQ ID NO: 40). Tabela H: Iniciadores usados para a detecção da deleção Nome Sequências 5‘3‘ Tamanho Ligação do produto de PCR 5’CYP_Deleção GTC TTT ACA TAG CAA 1167 - 9 bp 5‘ fora do modelo AAC AAT ATT GAA G de reparo (SEQ ID NO: 41) CYP_Deleção_Rv CTA ACA CTT CCC TCA Dentro do modelo AAT TAA CAA C (SEQ ID de reparo NO: 42) CYP_Deleção_Fw CAA TAG TGG TGA TGT 1198 - 9 bp Dentro do modelo GGC CTT GG (SEQ ID de reparo NO: 43) 3’CYP_Deleção GGT AAC TAG TAA AAG 3‘ fora do modelo TAT ACT CAT C (SEQ ID de reparo NO: 44)

Claims (15)

REIVINDICAÇÕES
1. Método para a preparação de um alelo marcador artificial para a identificação de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, em um organismo, caracterizado pelo fato de que o método compreende: (a) identificar pelo menos um lócus genômico no genoma do referido organismo, que é geneticamente ligado ao referido ácido nucleico de interesse, e (b) introduzir pelo menos um InDel no referido pelo menos um lócus genômico, desse modo criando um alelo marcador que é hereditário para gerações subsequentes do referido organismo juntamente com o referido ácido nucleico de interesse.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que pelo menos um InDel compreende pelo menos uma inserção de nucleotídeo e/ou pelo menos uma deleção de nucleotídeo.
3. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o lócus genômico é único no genoma do referido organismo e altamente conservado em diferentes genótipos do referido organismo e/ou em que a sequência de nucleotídeo do lócus genômico obtido após a inserção do pelo menos um artificial InDel é única no genoma do referido organismo.
4. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido lócus genômico é posicionado fora de qualquer região codificante, sinal de ligação ou elemento regulatório do ácido nucleico de interesse e/ou é posicionado em uma região que flanqueia o ácido nucleico de interesse ou dentro do ácido nucleico de interesse.
5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que a região que flanqueia o ácido nucleico de interesse está localizada na extremidade 3’ do ácido nucleico de interesse.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que a região que flanqueia o ácido nucleico de interesse tem uma distância de pelo menos 2 cM ou 1 cM ou 0,5 cM ou 0,1 cM do referido ácido nucleico de interesse.
7. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido pelo menos um InDel compreende uma inserção e em que a referida inserção compreende uma sequência de nucleotídeo na faixa dentre 1 e 60 pares de base contíguos e cuja sequência é não homóloga ao genoma do organismo no qual o referido pelo menos um InDel é introduzido, preferivelmente a referida inserção compreende uma sequência de nucleotídeo de pelo menos 10 ou pelo menos 20 pares de base contíguos.
8. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido pelo menos um InDel compreende uma deleção e em que a referida deleção está na faixa dentre 1 e 60 pares de base contíguos, preferivelmente pelo menos 10 ou pelo menos 20 pares de base contíguos, com relação à sequência do tipo selvagem correspondente do lócus genômico no qual o referido pelo menos um InDel é introduzido.
9. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido pelo menos um InDel é introduzido por uma nuclease programável, preferivelmente a referida nuclease programável é selecionada de sistemas de CRISPR nuclease e RNA guia, nucleases de dedo de zinco, TALENs, ou meganucleases.
10. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o referido ácido nucleico de interesse pode ser um gene endógeno, um gene heterólogo, um gene mutado, um gene transgênico ou um gene modificado introduzido ou gerado por edição de gene ou edição de base.
11. Método para determinação da presença de um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, em uma população mista de indivíduos compreendendo o ácido nucleico de interesse e indivíduos que não compreendem o ácido nucleico de interesse, caracterizado pelo fato de que o referido método compreende a detecção de um alelo marcador artificial como definido em qualquer uma das reivindicações 1 a 10, usando pelo menos um marcador molecular específico para o alelo marcador artificial e/ou pelo menos um marcador molecular específico para o lócus genômico do tipo selvagem.
12. Método para avaliar a homogeneidade de uma população de indivíduos, caracterizado pelo fato de que compreende um ácido nucleico de interesse, preferivelmente codificando um polipeptídeo que confere um traço de interesse, o referido método compreendendo a detecção de um alelo marcador artificial como definido em qualquer uma das reivindicações 1 a 10 e determinação da homogeneidade na população usando pelo menos um marcador molecular específico para o alelo marcador artificial e/ou pelo menos um marcador molecular específico para o lócus genômico do tipo selvagem, em que a detecção do lócus genômico do tipo selvagem indica distribuição heterogênea de indivíduos compreendendo o ácido nucleico de interesse na população.
13. Método para a preparação de um alelo marcador artificial para a detecção de um ácido nucleico de interesse, caracterizado pelo fato de que compreende criar um ou mais InDels específicos de genótipo e introduzir os referidos InDels em um lócus genômico no genoma de um organismo, em que o lócus genômico é genicamente ligado ao ácido nucleico de interesse.
14. Uso de um alelo marcador artificial obtenível como definido em qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que é em seleção assistida por marcador.
15. Planta ou semente, caracterizada pelo fato de que compreende um alelo marcador artificial obtenível por um método como definido em qualquer uma das reivindicações 1 a 10.
BR112020023602-0A 2018-05-24 2019-05-23 alelo marcador artificial BR112020023602A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18174057.2 2018-05-24
EP18174057.2A EP3571925A1 (en) 2018-05-24 2018-05-24 Artificial marker allele
PCT/EP2019/063404 WO2019224336A1 (en) 2018-05-24 2019-05-23 Artificial marker allele

Publications (1)

Publication Number Publication Date
BR112020023602A2 true BR112020023602A2 (pt) 2021-02-17

Family

ID=62244409

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020023602-0A BR112020023602A2 (pt) 2018-05-24 2019-05-23 alelo marcador artificial

Country Status (6)

Country Link
US (1) US20210198681A1 (pt)
EP (2) EP3571925A1 (pt)
CN (1) CN112566492A (pt)
BR (1) BR112020023602A2 (pt)
CA (1) CA3105188A1 (pt)
WO (1) WO2019224336A1 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3918910A1 (en) * 2020-06-05 2021-12-08 KWS SAAT SE & Co. KGaA Marker generation by random mutagenesis in plants
CN113637794B (zh) * 2021-10-13 2021-12-21 广东省农业科学院蚕业与农产品加工研究所 一种果桑新品种‘粤椹201’的ssr分子标记及其核心引物组、试剂盒和应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011002617A (es) 2008-09-11 2011-04-11 Keygene Nv Metodo para el desarrollo de marcadores de diagnostico.
ES2954135T3 (es) 2010-10-15 2023-11-20 Bayer Cropscience Lp Mutantes de Beta vulgaris tolerantes a herbicidas inhibidores de ALS
UY33856A (es) * 2011-01-03 2012-08-31 Agrigenetics Inc ?gen y variaciones asociadas con el fenotipo bm1, marcadores moleculares y su uso?.
MA37428B1 (fr) * 2012-04-19 2019-09-30 Vilmorin & Cie Plants de tomate à rendement élevé
MX2017015148A (es) * 2015-06-03 2018-08-01 Dow Agrosciences Llc Locus genetico asociado con la podredumbre de raices y tallos por phytophthora en la soya.
DE102016106656A1 (de) 2016-04-12 2017-10-12 Kws Saat Se Kernkodierte männliche Sterilität durch Mutation in Cytochrom P450 Oxidase

Also Published As

Publication number Publication date
EP3571925A1 (en) 2019-11-27
WO2019224336A1 (en) 2019-11-28
EP3800997A1 (en) 2021-04-14
CN112566492A (zh) 2021-03-26
CA3105188A1 (en) 2019-11-28
US20210198681A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
Zhou et al. Efficient genome editing of wild strawberry genes, vector development and validation
Macovei et al. Novel alleles of rice eIF4G generated by CRISPR/Cas9‐targeted mutagenesis confer resistance to Rice tungro spherical virus
Schmidt et al. Efficient induction of heritable inversions in plant genomes using the CRISPR/Cas system
Cai et al. CRISPR/Cas9‐mediated targeted mutagenesis of GmFT2a delays flowering time in soya bean
Djukanovic et al. Male‐sterile maize plants produced by targeted mutagenesis of the cytochrome P 450‐like gene (MS 26) using a re‐designed I–C reI homing endonuclease
RU2745987C2 (ru) Способы и композиции для получения укороченных растений кукурузы
US10781455B2 (en) Methodologies and compositions for creating targeted recombination and breaking linkage between traits
BR112019004850A2 (pt) métodos e composições para edição de genoma por meio de indução de haploides
BRPI0813409B1 (pt) Método para identificar planta ou plasma germinativo de Cucumis Melo e composição compreendendo par de iniciadores de amplificação
US20230144998A1 (en) Pepper plants with improved pest resistance
BR112021011502A2 (pt) Plantas de milho com resistência melhorada à doença
BR112020023853A2 (pt) Sistemas e métodos para melhoramento aprimorado por modulação das taxas de recombinação
BR112020023602A2 (pt) alelo marcador artificial
KR20210023827A (ko) 고추의 바카툼 세포질 웅성 불임 시스템에 대한 복원 유전자좌
EP3849999A1 (en) Beet necrotic yellow vein virus (bnyvv)-resistance modifying gene
El-Soda et al. From gene mapping to gene editing, a guide from the Arabidopsis research
BR112020006195A2 (pt) plantas de maís com melhor resistência a doenças
CN108513583A (zh) 重组玉米b染色体序列及其用途
BR112019022737A2 (pt) métodos para isolar células sem o uso de sequências marcadoras transgênicas
Tran Genetic variation in cultivated coffee (Coffea arabica L.) accessions in Northern New South Wales, Australia
US20220282339A1 (en) Genetic purity estimate method by sequencing
US10294489B2 (en) Soybean resistant to cyst nematodes
CN114574608B (zh) 一种与黄瓜抗靶斑病相关的snp标记及其应用
WO2024124509A1 (en) Maize plants comprising resistance to southern leaf blight and compositions and methods for selecting and producing the same
US20210071192A1 (en) Methods to evaluate traits

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]